DE10159886B4

DE10159886B4 - Verfahren zur Ausführung von mathematischen Operationen mittels eines DNA-Computers und DNA-Computer hierzu

Info

Publication number: DE10159886B4
Application number: DE2001159886
Authority: DE
Inventors: Monika Dr.-Ing. Sturm; Thomas Dipl.-Inform. Hinze
Original assignee: Technische Universitaet Dresden
Current assignee: Technische Universitaet Dresden
Priority date: 2001-12-05
Filing date: 2001-12-05
Publication date: 2010-06-17
Anticipated expiration: 2021-12-06
Also published as: DE10159886A1

Abstract

DNA-Computer,
bestehend aus einer Mehrzahl von Bioreaktoren (T1–T5), die über jeweils einen Zulauf und einen Ablauf in ein Leitungssystem eingebunden sind,
wobei
a) in den Bioreaktoren (T1–T5) molekularbiologische Operationen ausführbar und DNA-Sequenzen bestimmter Länge und Basenfolge und Enzyme und ggf. weitere Hilfsstoffe einfüllbar sind,
b) wenigstens ein Bioreaktor (T6) vorgesehen ist, der über einen Zulauf an das Leitungssystem angeschlossen ist,
c) jedem der Bioreaktoren (T1–T5) eine der Gesamtzahl der Bioreaktoren (T1–T6) entsprechende Anzahl von Filtern (F1–F6) in Parallelschaltung nachgeschaltet ist,
wobei
d) spezifische Gruppen von DNA-Sequenzen unterschieden werden, die separaten Bioreaktoren zuordenbar sind und mittels der Enzyme in den Bioreaktoren (T1–T5) spleissbar sind,
e) die Filtereigenschaften der einzelnen in einer Parallelschaltung vorgesehenen Filter zur einer abgestimmten Selektion eingestellt sind und an jede Filterung eine Duplikation der gefilterten DNA-Sequenzen angeschlossen ist,
f) die Ausgänge der Filter so mit den Eingängen der Bioreaktoren...

Description

Die Erfindung betrifft einen universellen DNA-Computer, bestehend aus einer Mehrzahl von Bioreaktoren und Filterstufen, die zu einer statischen Anordnung fest verbunden sind und mit der beliebige mathematische Operationen ausführbar sind. Die Erfindung betrifft weiterhin ein Verfahren zur Abarbeitung von mathematischen Operationen auf Basis von molekularbiologischen Techniken mittels eines solchen DNA-Computers.
Aus der Druckschrift G. Paun. Splicing – a challenge for formal language theorists. Journal of Automata, Languages and Combinatorics, vol. 4, no. 1, p. 3–16, 1999 ist ein Verfahren zur Ausführung von mathematischen Operationen mittels DNA-Sequenzen bekannt. Bei dieser Lösung wird zum Erreichen universeller Berechnungsstärke unendlich viel DNA-Material benötigt. Die Beschreibung erfolgt auf einem sehr hohem Abstraktionsniveau. Die Lösung ist nicht laborpraktisch implementierbar.
In der Druckschrift E. Csuhaj-Varju, R. Freund, L. Kari, G. Paun. DNA computation based an splicing: universality results. Technical report 185-2/FR-2/95, TU Wien, Institute for Computer Languages, Wien, Austria, 1995 wird eine Methode beschrieben, die zum Erreichen universeller Berechnungsstärke eine molekularbiologische Operation benötigt, die die Anzahl von Strangduplikaten in einem Bioreaktor exakt bestimmt. Eine solche Methode ist derzeit nicht bekannt. Die Beschreibung der Lösung erfolgt auf sehr hohem Abstraktionsniveau und ist nicht laborpraktisch implementierbar.
Die in der Druckschrift T. Yokomori, S. Kobayashi, C. Ferretti. On the power of circular splicing systems and DNA computability. IEEE International Conference an Evolutionary Computation, Indiana University, Purdue University, Indianapolis, Illinois, 1997 beschriebene Lösung benötigt zum Erreichen universeller Berechnungsstärke speziell konstruierte DNA-Ringe. Die in einem Bioreaktor vorliegende finale Mischung aus unterschiedlichen DNA-Ringen kann mit dem Stand der Technik in der Molekularbiologie nicht hinreichend genau ausgelesen werden. Die Beschreibung der Lösung erfolgt auf sehr hohem Abstraktionsniveau und ist nicht laborpraktisch implementierbar.
Bei der in E. Csuhaj-Varju, L. Kari, G. Paun. Test tube distributed systems based an splicing. Computers and AI, vol. 15(2–3), p. 211–232, 1996 beschriebenen Lösung kann die Anzahl benötigter Bioreaktoren in Abhängigkeit des zu lösenden Problems beliebig groß werden. Einer Verringerung der DNA-Konzentration in den einzelnen Bioreaktoren infolge von Verteilschritten wird nicht entgegengewirkt. Dadurch kann die DNA-Konzentration unter die Erkennbarkeitsschwelle absinken. Die Lösung ist nicht laborpraktisch implementierbar.
Aus der Druckschrift E. Laun, K. J. Reddy. Wet splicing systems. Proceedings of 3rd DIMACS Workshop an DNA Based Computers, University of Pennsylvania, p. 115–126, 1997 ist eine Lösung bekannt geworden, die sich auf die laborpraktische Implementierung des Spleissens für genau einen Spezialfall beschränkt. Die Druckschrift enthält keinen Hinweis darauf, dass das Spleissen als ein Baustein für einen universellen DNA-Computer herangezogen werden kann.
Aus der WO 97/07440 A1 ist ein Molekular Computer bekannt geworden, der sich auf die sogenannte brute-force-Strategie für NP-Probleme beschränkt. Mit dieser Lösung ist kein universell verwendbarer Computer realisierbar.
Aus der US 5.804.373 ist ein Molekular Computer bekannt, der auf der Nutzung von Einzel- oder Doppelstrang-DNA basiert. Der Vorrat an oberflächenfixierten informationstragenden DNA-Einheiten (Speicherkapazität) kann bei Algorithmenabarbeitung sehr schnell erschöpft sein, wenn die nichtdeterministische Turingmaschine von einer Konfiguration fortlaufend in sehr viele mögliche Folgekonfigurationen übergeht, die alle weiterverfolgt werden müssen. Das Auslesen des Ergebnisses, d. h. die Auswertung der oberflächenfixierten DNA-Einheiten ist nicht beschrieben und wegen der speziellen zur Fixierung eingesetzten Methode auch nicht mittels Standardtechniken zu erreichen.
Aus der US 5.843.661 ist eine Methode zur Konstruktion einer universellen DNA-basierten molekularen Turing-Maschine bekannt. Die Abarbeitung der mathematischen Operationen bzw. molekularbiologischen Techniken erfolgt vollständig sequentiell. Es ist weder Datenparallelität noch Befehlsparallelität gegeben. Die Lösung erfordert eine Vielzahl sehr spezieller Restriktionsenzyme (sogenannte nichtpalindromische Restriktionsendonucleasen, die die DNA außerhalb ihrer Erkennungssequenz schneiden). Enzyme mit diesen Eigenschaften sind in der benötigten Anzahl unterscheidbarer Erkennungssequenzen und Schnittpositionen nicht oder nur schwer verfügbar, deshalb ist eine laborpraktische Implementierbarkeit nur in Spezialfällen gegeben. Es besteht eine relativ große Gefahr der Ergebnisverfälschung durch Seiteneffekte und deren Aufsummierung in jedem Turingtakt. Ein korrektes Auslesen der finalen Bandinschrift (Ergebnis) ist deshalb sehr schwierig.
Aus der WO 00/12752 A1 ist eine mechanische Turing-Maschine für die Verarbeitung von DNA-Sequenzen bekannt. Beschrieben ist eine vollständig sequentielle Arbeitsweise, weder Datenparallelität noch Befehlsparallelität sind gegeben. Es besteht auch hier eine Gefahr der Ergebnisverfälschung durch Seiteneffekte und Aufsummierung der Seiteneffekte in jedem Turingtakt. Ein korrektes Auslesen der finalen Bandinschrift (Ergebnis) ist deshalb sehr schwierig. Bei dieser Lösung werden außerdem mechanische (verschleißbehaftete) Komponenten verwendet.
In der WO 00/44094 A1 wird ein Molekular Computer beschrieben, der ebenfalls nicht universell einsetzbar ist. Die Lösung beschränkt sich auf ausgewählte Computerkomponenten (arithmetisch-logische Einheit und Speicher), repräsentiert jedoch keinen vollständigen Computer. Die Übertragung von Informationen findet mittels elektrischer Signale statt. Ebenso finden elektrische/elektronische Bauteile Verwendung. Der Datenträger besteht aus nichtbiologischen Materialien. Das Grundprinzip (Funktionsweise) basiert auf neuronalen Netzen, d. h. die Verarbeitungseinheit zwischen Eingabe und Ausgabe muss für erstmalig bearbeitete Aufgabenstellungen neu trainiert werden. Ergebnisse sind Näherungslösungen.
In der Druckschrift J. S. McCaskill: „Optically programming DNA computing in microflow reactors”, BioSystems 59 (2001), S. 125–138 & Bib., available online: 20 March 2001; eHB wird eine Anordnung von Mikroflussreaktoren gezeigt. Mit dieser Anordnung wird nur eine DNA-basierte molekularbiologische Operation ausgeführt. Die Lösung einer bestimmten Aufgabe mit einer molekularbiologische Operation erfordert eine aufgabenbezogene Zusammenschaltung der Mikroflussreaktoren. Damit weist die D1 an sich keine Ähnlichkeit mit einer universellen Rechnerarchitektur oder einem universellen DNA-Computer auf.
Die Aufgabe der Erfindung besteht darin, eine Anordnung für einen DNA-Computer sowie ein Verfahren zur Abarbeitung von mathematischen Operationen mittels eingeführter molekularbiologischer Techniken anzugeben, um universell ein breites Spektrum von mathematischen Operationen ausführen zu können, die insbesondere mittels elektronisch basierter Rechentechnik nicht in beherrschbaren Zeitläufen ausführbar sind.
Erfindungsgemäß wird die Aufgabe durch einen DNA-Computer mit den im Anspruch 1 genannten Merkmalen gelöst. Vorteilhafte Varianten der Anordnung sind Gegenstand von Unteransprüchen.
Weiterhin wird die Aufgabe in Verbindung mit den im Oberbegriff des Anspruchs 6 genannten Merkmalen dadurch gelöst, dass als Eingangsgrößen in Bioreaktoren DNA-Sequenzen bestimmter Längen und Basenfolge eingegeben werden, zur Ausführung molekularbiologischer Operationen in den Bioreaktoren Enzyme in die Bioreaktoren zugegeben werden, wodurch eine Veränderung der DNA-Sequenzen mit anschließender Filterung in den dazu vorgesehenen Filterstufen zur Abarbeitung der mathematischen Operationen erfolgt, und eine Ausgabe des Ergebnisses in einen dafür vorgesehenen Bioreaktor durch eine spezifische Länge und/oder Basenfolge zumindestens einer DNA-Sequenz erfolgt.
Der DNA-Computer arbeitet ausschliesslich mittels definierter Abfolgen wohluntersuchter molekularbiologischer Prozesse, die als einzigen Datentraeger lineare DNA (Desoxyribonucleinsaeure) verwenden. Die zu verarbeitenden Daten werden in Form von DNA-Strängen gemäß Spezifikation kodiert und durch die die Berechnung tragenden molekularbiologischen Prozesse modifiziert. Die am Ende eines Berechnungsprozesses vorliegende, zur Sequenzierung geeignete DNA repräsentiert das Berechnungsergebnis. Der abzuarbeitende Algorithmus ist durch spezifizierte Prozessparameter und genutzte Reagenzien eindeutig beschrieben. Der DNA-Computer ist derart konstruiert, dass sich damit alle algorithmisch lösbaren (turing-berechenbaren) Aufgabenstellungen auch tatsächlich bearbeiten lassen.
Gegenüber elektronischen Rechnern wie PCs besitzt der DNA-Computer den Vorteil, dass DNA eine deutlich höhere Speicherkapazität und Speicherdichte ermöglicht, als sie elektronische Speicherbausteine gestatten. Zudem lässt sich DNA-Material beliebiger Herkunft (z. B. Genomsequenzen verschiedener Organismen) unmittelbar verarbeiten und muss nicht erst aufwendig in eine für elektronische Computer nutzbare Form transformiert werden. Der DNA-Computer benötigt keine elektronischen oder elektromechanischen Komponenten und unterliegt deshalb keinerlei mechanischem Verschleiß wie beispielsweise Festplatten. Da der DNA-Computer ausschließlich DNA in natürlich vorkommender Form benutzt und die DNA auch durch die verwendeten molekularbiologischen Prozesse nicht von ihrer natürlichen chemischen Form und Struktur abweicht, ist das DNA-Material wiederverwendbar und recyclingfähig. Umweltbelastende und schwer entsorgbare Abprodukte, wie sie beispielsweise durch Elektronikschrott entstehen, treten beim DNA-Computer nicht auf.
Der universelle DNA-Computer besteht aus einer Anordnung von mehreren Bioreaktoren und Filterstufen. Zu Beginn wird eine Befüllung mit DNA sowie mit spezifischen die DNA verändernden biologischen Substanzen vorgenommen. Dabei werden unter diesen biologischen Substanzen Reagenzien verstanden, die bei spezifizierten Umgebungsbedingungen (z. B. Temperatur, pH-Wert) eine reproduzierbar nutzbare die DNA verändernde Wirkung entfalten. Unter DNA-verändernden Wirkungen wird verstanden:

– gezielter Umbau chemischer Bindungen,
– innerhalb von DNA-Strängen (z. B. beim Zerschneiden eines DNA-Stranges),
– zwischen verschiedenen DNA-Strängen (z. B. beim Zusammenfügen zweier DNA-Stränge),
– zwischen DNA-Strängen und Molekülen oder chemischen Gruppen, die an Strangenden angelagert oder von Strangenden entfernt werden (z. B. beim Phosphatgruppen-Abbau von Strangenden),
– Konvertierungen zwischen DNA-Einzelsträngen und DNA-Doppelsträngen,
– Strangseparationen nach verschiedenen physikalischen oder chemischen Merkmalen.

Die DNA-verändernden Wirkungen werden durch Einsatz spezifischer Enzyme, durch Schaffung spezieller Umgebungsbedingungen (z. B. Temperatur-Zeit-Verläufe, pH-Milieus) sowie durch Ausnutzung der elektrischen Ladung von DNA erzielt. Mittels gesteuerter Verkettung solcher Wirkungen realisiert man die dem DNA-Computer zugrundeliegenden Elementaroperationen Spleissen und Filtern.
Die Erfindung wird nachfolgend an Hand von Ausführungsbeispielen näher erläutert. In den Zeichnungen zeigen:
1 eine schematische Darstellung eines erfindungsgemäßen DNA-Computers
2 eine formale Beschreibung des erfindungsgemäßen DNA-Computers gemäß 1
3 eine formale Beschreibung des erfindungsgemäßen DNA-Computers gemäß 1 für die konkrete Anwendung eines zu lösenden Rucksackproblems
4 eine Darstellung der Abarbeitung des Rucksackproblems auf der Ebene DNA-kodierender ergebnisrelevanter Zeichenketten
1 zeigt eine schematische Darstellung eines erfindungsgemäßen DNA-Computers sowie die prinzipielle Arbeitsweise des DNA-Computers. Der DNA-Computer besteht aus 6 Bioreaktoren T1–T6, die über jeweils einen Zulauf an ein Leitungssystem angeschlossen sind. In den Bioreaktoren T1–T5 sind molekularbiologische Operationen ausführbar, wozu DNA-Sequenzen und Enzyme und ggf. weitere Hilfsstoffe einfüllbar sind. Der Bioreaktor T6 ist nur über einen Zulauf an das Leitungssystem angeschlossen ist. An jeden Ablauf der Bioreaktoren T1–T5 ist eine der Gesamtzahl der Bioreaktoren T1–T6 entsprechende Anzahl von Filtern F1–F6 in Parallelschaltung angeschlossen. Die Ausgänge der Filter F1–F6 sind so mit den Zuläufen der Bioreaktoren T1–T6 verbunden, dass Filter mit gleichen Filtereigenschaften an den selben Bioreaktor T1; T2; T3; T4; T5; T6 angeschlossen sind. Der Bioreaktor T6 dient zur Aufnahme der DNA-Sequenz, die das gesuchte Ergebnis repräsentiert.
Die verarbeiteten DNA-Stränge lassen sich entsprechend des Enthaltenseins bestimmter DNA-Subsequenzen zu spezifischen Gruppen zusammenfassen. Jeder dieser Gruppen ist in 1 ein entsprechendes Platzhaltersymbol zugeordnet. Insgesamt werden gemäß der Darstellung in 1 sechs spezifische Gruppen von DNA-Sequenzen unterschieden, die in separate Bioreaktoren eingehen und dort jeweils gespleisst werden. Durch die in den Bioreaktoren T1 bis T5 parallel ablaufenden Spleiss-Operationen werden DNA-Stränge gezielt rekombiniert, d. h. an bestimmten Stellen zerschnitten und die Schnittfragmente werden anschliessend neu zusammengesetzt. Dabei kann eine Vielzahl bisher nicht vorhandener DNA-Sequenzen entstehen, die sich jedoch immer eindeutig jeweils einer Gruppe zuordnen lassen. In 1 ist dieser Prozess vereinfacht durch die Entstehung einer Mischung aus allen Platzhaltersymbolen in den Bioreaktoren T1 bis T5 dargestellt. Der initial leere Bioreaktor T6 dient zum Auffangen genau der Gruppe von DNA-Sequenzen, die das Berechnungsergebnis verkörpert. Im Bioreaktor T6 findet folglich keine Spleiss-Operation statt. Ebenso ist an den Bioreaktor T6 keine Filterstufe an einen Ablauf angeschlossen.
Die nach dem Spleissen in den Bioreaktoren T1 bis T5 jeweils vorliegende Menge von DNA-Strängen gelangt über Pipelines zu einer Filteranordnung die den Bioreaktoren parallel nachgeschaltet ist. Jeder Filter Fi (i = 1, ..., 6) extrahiert genau jene Gruppe von DNA-Strängen, die wiederum in den zugeordneten Bioreaktor Ti eingeht. Dabei werden alle separierten Stränge der jeweiligen Filter Fi vereinigt und hinreichend dupliziert. Die Duplizierung findet unmittelbar nach der Filterung statt. Die durch die Spleiss-Operation in einem bestimmten Bioreaktor entstandene DNA wird somit nachfolgend auf alle Bioreaktoren entsprechend der Gruppenzugehörigkeit verteilt. Die Schrittfolge ”Spleissen”, ”Filtern” und ”Verteilen” wird fortlaufend wiederholt und solange angewendet, bis im Bioreaktor T6 hinreichend viele Ergebnis-DNA-Stränge mit gewünschten Eigenschaften (Länge, Enthaltensein bestimmter Subsequenzen) auswertbar vorliegen.
Die Darstellung aus 1 sowie die Techniken des Spleissens, Filterns und Verteilens wird nachfolgend schrittweise verfeinert und dabei detaillierter beschrieben, um einerseits den DNA-Computer zu spezifizieren und andererseits seine universelle Einsatzfähigkeit zu erläutern.
Im mathematischen Sinne lassen sich DNA-Stränge als endliche Wörter bzw. Wortbestandteile formaler Sprachen auffassen. Wörter entstehen durch Verkettung (Aneinanderreihung) von Zeichen aus einem Zeichenvorrat (Alphabet), wobei jedes Zeichen eineindeutig einem DNA-Doppelstrangabschnitt (DNA-Fragment) entspricht. Eine (endliche oder unendliche) Menge von Wörtern wird als formale Sprache bezeichnet. Formale Sprachen werden hinsichtlich ihrer Ausdruckskraft (Mächtigkeit) in Klassen eingeteilt. Als allgemeinste Klasse gilt die Klasse der rekursiv aufzählbaren Sprachen.
Sogenannte Chomsky-Grammatiken dienen als generatives Beschreibungsmittel für formale Sprachen und verkörpern ein anerkanntes Berechnungsmodell. Sie sind in der Lage, genau die zu einer Sprache gehörenden Wörter zu erzeugen. Chomsky-Grammatiken vom Typ 0 besitzen eine universelle Berechnungsstärke. Dies bedeutet, dass sie in der Lage sind, die Klasse der rekursiv aufzählbaren Sprachen zu beschreiben.
Beliebige Berechnungsaufgaben und algorithmisch lösbare Probleme können konstruktiv auf Chomsky Typ0-Grammatiken abgebildet werden. Die Ableitung von Wörtern der zugrundeliegenden formalen Sprache stellt einen Berechnungsprozess dar, und die generierten Wörter der Sprache repräsentieren das Berechnungsergebnis. Die Arbeitsweise des DNA-Computers simuliert beliebige derartige Berechnungsprozesse, wobei der abzuarbeitende Algorithmus (das Programm) einschließlich der Eingabedaten entweder unmittelbar als Chomsky Typ0-Grammatik gegeben oder gleichwertig als beliebige deterministische Turingmaschine notiert ist, die im Vorfeld der Berechnung konstruktiv in eine ergebnisäquivalente Chomsky Typ0-Grammatik transformiert wird.
Das Modell der deterministischen Turingmaschine ist ebenfalls ein anerkanntes und etabliertes universelles Berechnungsmodell, das beliebige Berechnungen auszuführen vermag. Der DNA-Computer generiert durch wiederholte Anwendung der Operationsfolge ”Spleissen”, ”Filtern” und ”Verteilen” in den Bioreaktoren schrittweise die Wörter der durch die Chomsky Typ0-Grammatik gegebenen Sprache, die letztendlich im Bioreaktor T6 als Berechnungsergebnis zur Verfügung stehen.
Die in dieser Erfindung beschriebene Anordnung kann wie folgt formal beschrieben werden:
Der erfindungsgemäße DNA-Computer, nachfolgend verkürzt als TT6 bezeichnet, ist ein formales System TT6 = (V, Σ, T₁, T₂, T₃, T₄, T₅, T₆) mit folgender Bedeutung der Komponenten: V bezeichnet den Zeichenvorrat von Symbolen, die vom TT6 verarbeitet werden können. Jedes Symbol aus V ist eindeutig repräsentiert durch einen spezifischen DNA-Doppelstrang, charakterisiert durch seine Basenabfolge und Stranglänge. Σ bezeichnet den Zeichenvorrat von Symbolen, aus denen sich die vom TT6 ausgegebenen Verarbeitungsergebnisse zusammensetzen. Jedes Symbol aus Σ ist eindeutig repräsentiert durch einen spezifischen DNA-Doppelstrang, charakterisiert durch seine Basenabfolge und Stranglänge. Alle Symbole aus Σ sind auch in V enthalten.
Weiterhin besteht die Biohardware TT6 aus 6 Reagenzgläsern, nachfolgend T₁ bis T₆ genannt. Jedes Reagenzglas T_i mit i = 1, ..., 6 wird durch drei Komponenten beschrieben: T_i = (A_i, R_i, F_i).
A_i bezeichnet eine endliche Menge von Axiomen, mit denen vor Beginn einer Verarbeitung das Reagenzglas T_i initialisiert wird. Jedes Axiom aus A_i besteht aus einer endlichen Abfolge von Symbolen aus V. Die konkreten Mengen A_i werden in Abhängigkeit von der zu lösenden Problemklasse spezifiziert.
Die Menge R_i bezeichnet eine endliche Menge von Spleiss-Regeln, die im Reagenzglas T_i anwendbar sind und dort eine gezielte Rekombination der enthaltenen DNA-Doppelstränge vornehmen, welche durch Zeichenketten kodiert sind, die sich aus einer Abfolge von Symbolen aus Σ ergeben. Jede Spleiss-Regel setzt sich aus vier entsprechenden Zeichenketten zusammen, die durch die Symbole # und $ voneinander getrennt sind. Eine Spleiss-Regel der Form u₁#u₂$u₃#u₄ besagt, dass zwei geeignet aus dem Reagenzglasinhalt von T_i ausgewählte Zeichenketten nach folgender Vorschrift rekombiniert werden: Eine der beiden Zeichenketten enthalte die Subsequenz u₁u₂, die andere u₃u₄. Die Zeichenketten werden zwischen u₁ und u₂ sowie zwischen u₃ und u₄ aufgespaltet, so dass vier Einzelfragmente entstehen. Diese vier Einzelfragmente werden anschließend derart durch Ligation miteinander verkettet, dass die ursprünglichen zwei Zeichenketten wieder entstehen sowie zusätzlich zwei Zeichenketten, die als Subsequenz u₁u₄ und u₃u₂ enthalten. Die Subsequenzen u₁u₂ sowie u₃u₄ lassen sich den Erkennungssequenzen und Spaltstellen konkreter Restriktionsenzyme zuordnen. Die konkreten Mengen R_i werden in Abhängigkeit von der zu lösenden Problemklasse spezifiziert.
F_i bezeichnet die endliche Menge von Filtermustern für das Reagenzglas T_i. Durch die Filtermuster in F_i ist der dem Reagenzglas T_i nachgeschaltete Filter spezifiziert. Genau diejenigen DNA-Stränge können den Filter nach T_i passieren, die als Anfangs- und Endstück exakt die in einem Filtermuster aus F_i angegebenen beiden Zeichenketten besitzen. Jedes Filtermuster ist beschrieben durch ein Paar von Zeichenketten, die jeweils aus Abfolgen von Symbolen aus V zusammengesetzt sind. Jedes Filtermuster kodiert ein Primerpaar für eine Polymerase-Kettenreaktion (PCR). Der Filterprozess besteht aus einer Abfolge von PCR und stellt zusätzlich hinreichend viele Strangduplikate für nachfolgende Verarbeitungsschritte im TT6 zur Verfügung. Die konkreten Mengen F_i werden in Abhängigkeit von der zu lösenden Problemklasse spezifiziert.
Die Abarbeitung von Algorithmen auf TT6 erfolgt durch fortlaufend hintereinander ausgeführte Verarbeitungsschritte, die zeitparallel und synchron in den Reagenzgläsern des TT6 ablaufen. Jeder Verarbeitungsschritt des TT6 gliedert sich in drei aufeinanderfolgende Teilschritte, die als Spleissen, Filtern und Verteilen bezeichnet werden.
Im ersten Teilschritt, dem Spleissen, wird in jedem Reagenzglas T_i auf den dort jeweils vorliegenden Zeichenketten eine Spleiss-Regel aus R_i angewandt, sofern mindestens eine solche existiert. Gibt es mehrere anwendbare Spleiss-Regeln, so wird eine davon willkürlich ausgewählt. Ist keine Spleiss-Regel anwendbar, so bleibt der Inhalt des Reagenzglases T_i während dieses Teilschrittes unverändert. Eine Spleiss-Regel aus R_i ist genau dann anwendbar, wenn im Reagenzglas T_i mindestens zwei Zeichenketten vorliegen, wobei eine Zeichenkette davon die Subsequenz u₁u₂ und die andere die Subsequenz u₃u₄ enthält.
Im zweiten Teilschritt, dem Filtern, stellt jedes Reagenzglas T_j Kopien ausschließlich derjenigen Zeichenketten bereit, die in andere Reagenzgläser, d. h. in die T_i mit i ≠ j, verteilt werden. Zu diesem Zweck wird für jedes Filtermuster aus F_i eine PCR durchgeführt, wobei die jeweiligen, durch das Filtermuster bestimmten Primerpaare zum Einsatz kommen. Durch dieses Filterprinzip wird sichergestellt, dass nur diejenigen Zeichenketten dupliziert werden, die im Zielreagenzglas in die Weiterverarbeitung einbezogen sind. Auf diese Weise wird eine Ressourcenminimierung erreicht.
Der dritte Teilschritt realisiert das eigentliche Verteilen: alle zur Übertragung in das Reagenzglas T_i, i = 1, ..., 6 vorbereiteten Zeichenkettenduplikate aus anderen Reagenzgläsern werden zusammengeführt und dem Reagenzglas T_i hinzugefügt.
Mit der Hintereinanderausführung aller drei Teilschritte ist ein Verarbeitungsschritt des TT6 abgeschlossen. T₆ ist durch die Spezifik der Mengen A₆, R₆ und F₆ als gesondertes Ergebnisreagenzglas ausgewiesen, in das ausschließlich Verarbeitungsergebnisse eingebracht werden und in welchem keine Spleiss-Regeln zur Anwendung kommen.
Die Algorithmen, die auf dem erfindungsgemäßen DNA-Computer TT6 abgearbeitet werden können, werden in Form einer Chomsky-Grammatik vom Typ 0 in Kuroda-Normalform notiert. Der Stand der Technik gestattet es, beliebige Algorithmen konstruktiv in eine solche Form zu transformieren, so dass die Biohardware TT6 dem Anspruch an einen universellen Computer gerecht wird.
Aus der gegebenen Chomsky-Grammatik vom Typ 0 in Kuroda-Normalform wird entsprechend der in 2 dargestellten Vorschrift eine konkrete Belegung aller Parameter des TT6 definiert. Alle Bestandteile der Grammatik werden in korrespondierende Parameter des TT6 aufgenommen. Solche Parameter sind beispielsweise die Initialbelegungen A_i der einzelnen Reagenzgläser T_i sowie die Zeichenketten, welche Erkennungssequenzen und Spaltstellen für die Anwendung von Spleiss-Regeln beinhalten. Die durch die Filtermuster in F₁ bis F₅ bestimmten PCR-Primerpaare sind unabhängig vom abzuarbeitenden Algorithmus und somit von der gegebenen Chomsky-Grammatik. Sie lassen sich durch systemeigene feste Zeichenketten beschreiben und können aus diesem Grund durch einen konstanten, immer wieder verwendungsfähigen DNA-Pool kodiert und eingesetzt werden.
Die in den einzelnen Reagenzgläsern spezifizierten Spleiss-Regeln r_ij ∊ R_i erfüllen die nachstehend beschriebenen Aufgaben:
Ausführungsbeispiel
Als Ausführungsbeispiel für die Biohardware TT6 wird ein entsprechender DNA-Computer spezifiziert, der das als NP-vollständig bekannte Rucksackproblem aus der Klasse kombinatorischer Suchprobleme löst.
Das Rucksackproblem auf natürlichen Zahlen ist wie folgt definiert: Gegeben seien n natürliche Zahlen a₁, ..., a_n mit n ∊ IN\{0} sowie eine natürliche Zahl b. Gibt es eine Teilmenge I ⊆ (1, 2, n} mit Σ i<1a_i = b?
Die Zahlen a₁ bis a_n lassen sich als Gewichte der Gegenstände 1 bis n auffassen. Das Rucksackproblem kann durch die Fragestellung veranschaulicht werden, ob es eine Packmöglichkeit eines Rucksacks mit einer Auswahl aus diesen Gegenständen gibt, so dass der Rucksackinhalt exakt dem Referenzgewicht b beträgt. Die Anzahl n der Gegenstände stellt die Problemgröße dar. Mit n Gegenständen existieren 2ⁿ Packmöglichkeiten des Rucksacks.
Die nachstehend angegebene Chomsky-Grammatik vom Typ 0 beschreibt einen Lösungsalgorithmus für beliebige Rucksackprobleme:
G = (V_G, Σ, P_G, S_G)
V_G = {H, C, D} ∪ {A_i|i = 1, ..., n} ∪ {S_G}
Σ = {yes}
P_G = {(S_G → CA₁A₂ ... A_nD)} ∪
{(A_i → H^a_i)|i = 1, ..., n} ∪
{(A_i → ε)|i = 1, ..., n} ∪
{(CH^bD → yes)}
Im Falle der Lösung ”ja” wird die Ergebniszeichenkette ”yes” erzeugt und ausgegeben.
Weiterführend wird das konkrete Rucksackproblem mit drei Gegenständen und ihren Gewichten a₁ = 3, a₂ = 1, a₃ = 2 sowie dem Referenzgewicht b = 3 betrachtet, für welches sich folgende Chomsky-Grammatik des Typs 0 ergibt:
G = (V_G, Σ, P_G, S_G)
V_G = {H, C, D, A₁, A₂, A₃, S_G}
Σ = {yes}
P_G = {(S_G → CA₁A₂A₃D),
(A₁ → HHH), (A₁ → ε),
(A₂ → H), (A₂ → ε),
(A₃ → HH), (A₃ → ε),
(CHHHD → yes)}
Nach Überführung dieser Grammatik in Kuroda-Normalform entsteht:
G_KN = (V_G, Σ, P_G, S_G)
V_G = {H, C, D, A₁, A₂, A₃, S_G, E₁, E₂, E₃, F₁, G₁, G₂, G₃, G₄}
Σ = {yes}
P_G = {(S_G → CE₁), (E₁ → A₁E₂), (E₂ → A₂E₃), (E₃ → A₃D),
(A₁ → HF₁), (F₁ → HH), (A₁ → ε),
(A₂ → H), (A₂ → ε),
(A₃ → HH), (A₃ → ε),
(CH → G₁), (G₁H → G₂), (G₂H → G₃), (G₃D → G₄), (G₄ → yes)}
Aus der Chomsky-Grammatik G_KNF wird unter Nutzung der Vorgaben für die Systembeschreibung aus 2 eine konkrete Biohardware TT6, wie in 3 dargestellt, spezifiziert. Die 4 zeigt die schrittweise Verarbeitung der aus G_KNF resultierenden Zeichenketten. Die in jedem Schritt neu entstehenden, ergebnisrelevanten Zeichenketten sind in 4 dargestellt.

Claims

DNA-Computer, bestehend aus einer Mehrzahl von Bioreaktoren (T1–T5), die über jeweils einen Zulauf und einen Ablauf in ein Leitungssystem eingebunden sind, wobei a) in den Bioreaktoren (T1–T5) molekularbiologische Operationen ausführbar und DNA-Sequenzen bestimmter Länge und Basenfolge und Enzyme und ggf. weitere Hilfsstoffe einfüllbar sind, b) wenigstens ein Bioreaktor (T6) vorgesehen ist, der über einen Zulauf an das Leitungssystem angeschlossen ist, c) jedem der Bioreaktoren (T1–T5) eine der Gesamtzahl der Bioreaktoren (T1–T6) entsprechende Anzahl von Filtern (F1–F6) in Parallelschaltung nachgeschaltet ist, wobei d) spezifische Gruppen von DNA-Sequenzen unterschieden werden, die separaten Bioreaktoren zuordenbar sind und mittels der Enzyme in den Bioreaktoren (T1–T5) spleissbar sind, e) die Filtereigenschaften der einzelnen in einer Parallelschaltung vorgesehenen Filter zur einer abgestimmten Selektion eingestellt sind und an jede Filterung eine Duplikation der gefilterten DNA-Sequenzen angeschlossen ist, f) die Ausgänge der Filter so mit den Eingängen der Bioreaktoren (T1–T6) verbunden sind, dass Filter mit gleichen Filtereigenschaften an den selben Bioreaktor (T1; T2; T3; T4; T5; T6) angeschlossen sind, und g) der nur mit einem Zulauf an das Leitungssystem angeschlossene Bioreaktor (T6) zum Aufnehmen der DNA-Sequenz vorgesehen ist, die das gesuchte Ergebnis repräsentiert, wobei das Ergebnis in einer spezifischen Länge und/oder Basenfolge der DNA-Sequenz kodiert vorliegt.
DNA-Computer nach Anspruch 1, aufweisend eine Anzahl von fünf Bioreaktoren (T1–T5), die zur Ausführung von molekularbiologischen Operationen steuerbar sind, einen Bioreaktor (T6) zur Aufnahme der das Ergebnis repräsentierenden DNA-Sequenzen, und den Bioreaktoren (T1–T5) nachgeschalteten Parallelschaltungen von jeweils 6 selektiv wirkenden Filtern, die mit ihren Ausgängen an die Zuläufe der Bioreaktoren (T1–T6) angeschlossen sind.
DNA-Computer nach Anspruch 1 oder 2, bei dem die Bioreaktoren (T1–T5) zum Ausführen der molekularbiologischen Operation Spleissen steuerbar sind, und ein Filtern in den dafür vorgesehenen Filterstufen erfolgt und ein Verteilen mittels der gewählten festen Anordnung erfolgt.
DNA-Computer nach einem der Ansprüche 1 bis 3, bei dem zur Zugabe von DNA-Sequenzen, Enzymen und ggf. Hilfsstoffen steuerbare Zuläufe an den Bioreaktoren (T1–T5) vorgesehen sind.
DNA-Computer nach einem der Ansprüche 1 bis 4, bei dem an den Bioreaktoren (T1–T5) steuerbare Abläufe vorgesehen sind.
Verfahren zur Ausführung von mathematischen Operationen mittels eines DNA-Computers nach einem der Ansprüche 1 bis 5, der aus einer Mehrzahl von Bioreaktoren besteht, deren Zuläufe und Abläufe über Filter miteinander verbunden sind, wobei jeweils ein Ablauf eines Bioreaktors mit einer Parallelschaltung einer gleichen Anzahl von Filtern verbunden ist, die Ausgänge der Filter mit gleichen Filtereigenschaften aus unterschiedlichen Filterstufen mit dem Zulauf des gleichen Bioreaktors verbunden sind, wobei wenigstens ein Bioreaktor nur mit seinem Zulauf an den Kreislauf zur Ausgabe des Ergebnisses angeschlossen ist, dadurch gekennzeichnet, dass als Eingangsgrößen in die Bioreaktoren (T1–T5) DNA-Sequenzen bestimmter Längen und Basenfolge eingegeben werden, zur Abarbeitung der mathematischen Operationen mittels molekularbiologischer Prozesse in die Bioreaktoren (T1–T5) Enzyme und ggf. Hilfsstoffe zugegeben werden, wodurch eine Veränderung der DNA-Sequenzen durch Spleissen erfolgt, anschließend eine Filterung in den dazu vorgesehenen Filterstufen vorgenommen wird, und eine Ausgabe des Ergebnisses in einen dafür vorgesehenen Bioreaktor in der Weise erfolgt, dass eine spezifische Länge und/oder Basenfolge zumindestens einer DNA-Sequenz analysierbar vorliegt, wenn eine Lösung für das zu bearbeitende Problem rekursiv aufzählbar existiert.
Verfahren nach Anspruch 6, dadurch gekennzeichnet, dass durch die molekularbiologischen Prozesse Spleissen, Filtern und Verteilen die Abarbeitung der mathematischen Operationen erfolgt.
Verfahren nach Anspruch 6 oder 7, dadurch gekennzeichnet, dass die DNA-Sequenzen als Eingangsgrößen mittels Enzymen, Hilfsstoffen und Reaktionsparameter wie pH-Wert, Temperatur, Temperatur-Zeit-Verläufe verändert und zur Abarbeitung der molekularbiologischen Prozesse angeregt werden.
Verfahren nach einem der Ansprüche 6 bis 8, dadurch gekennzeichnet, dass die molekularbiologischen Prozesse zur Ausführung der mathematischen Operationen verteilt über die Bioreaktoren parallel, synchron getaktet und determiniert ausgeführt werden.
Verfahren nach einem der Ansprüche 6 bis 9, dadurch gekennzeichnet, dass das Spleissen mittels der Digestion und nachgeschalteter Ligation erfolgt, wobei durch zusätzliche gezielte Strangendenmarkierungen und Strangseparationen nach Subsequenz unerwünschte DNA-Stränge eliminiert werden.
Verfahren nach einem der Ansprüche 6 bis 10, dadurch gekennzeichnet, dass das Filtern mittels Polymerase-Kettenreaktion erfolgt, wobei sich die verwendeten Primer unmittelbar aus den darauf geeignet abgestimmten Filtermustern ergeben und zugleich einer Verringerung der DNA-Konzentration in den Bioreaktoren entgegengewirkt wird.