WO1998047077A1

WO1998047077A1 - Frei programmierbares, universelles parallel-rechnersystem zur durchführung von allgemeinen berechnungen

Info

Publication number: WO1998047077A1
Application number: PCT/EP1998/002208
Authority: WO
Inventors: Ralf Zimmer
Original assignee: Gmd - Forschungszentrum Informationstechnik Gmbh
Priority date: 1997-04-15
Filing date: 1998-04-15
Publication date: 1998-10-22
Also published as: EP0976060B1; DE59802537D1; EP0976060A1

Abstract

Das frei programmierbare, universelle Parallel-Rechnersystem zur Durchführung von allgemeinen Berechnungen weist einen elektronischen Vorrechner auf, der die Eingabe beliebiger und damit zur Spezifikation allgemeiner Berechnungen fähiger Programme erlaubt, deren Umsetzung in Ausdrücke einer Reduktionssprache realisiert und deren Kodierung in eine DNS-Sequenz vornimmt. Eine Synthesevorrichtung empfängt die DNS-Sequenz und synthetisiert sie in ein entsprechendes DNS-Molekül mit einer spezifizierten Nukleotidabfolge. Mittels einer Vervielfältigungsvorrichtung wird das Synthetisierte DNS-Molekül durch eine Amplifikationsreaktion vervielfältigt. Ferner weist das Rechnersystem eine Reaktionsvorrichtung zum gleichzeitigen Ausführen von Transformationen der DNS-Moleküle mittels molekularbiologischer Techniken gemäß den Reduktionsregeln einer Reduktionssprache auf, wobei das Ergebnismolekül in der Lösung identifiziert, extrahiert und ggf. vervielfältigt wird. Außerdem ist eine Sequenziervorrichtung zum Bestimmen der Sequenz des Ergebnismoleküls vorgesehen, wobei diese Sequenz an den Vorrechner weitergegeben wird und der Vorrechner die Sequenz dekodiert sowie die dekodierte Sequenz ausgibt.

Description

Frei programmierbares, universelles

Parallel-Rechnersvstem zur Durchführung von allgemeinen Berechnungen

Die Erfindung betrifft ein frei programmierbares, universelles Parallel-Rechnersystem zur Durchführung von allgemeinen Berechnungen, wobei neben einem elektronischen Rechner ein DNS- bzw. DNA-Rechner eingesetzt wird.

Die Erfindung wird nachstehend anhand der Verwendung eines DNA- bzw. DNS-Subsystems beschrieben, ist aber über die DNA hinaus grundsätzlich bei sämtlichen Biopolymeren anwendbar. Ganz allgemein ausgedrückt handelt es sich bei einem Biopolymer um eine durch definierte Methoden aus Monomeren polymerisierbare Struktur. Bei den definierten Methoden handelt es sich beispielsweise um enzymatische Polymerisation von Nukleotiden, Peptiden oder Zuckereinheiten. Das nach der Erfindung vorgesehene Biopolymer- -Subsystem kann also insbesondere ein DNA-, RNA- oder PNA- Subsystem sein. Die Verarbeitung im Biopolymer-Subsystem kann auf Peptid- oder Nukleotid-Ebene erfolgen.

Stand der Technik: Biologie und Biotechnologie

Durch die großen Fortschritte in der modernen Molekularbiologie [8] und der molekularen Bio- und Gentechnologie sind gewisse Operationen auf DNS-Molekülen bzw. Ensembles von DNS-Molekülen routinemäßig, zum Teil mit automatisierten Apparaten durchführbar geworden.

Die biologischen Prinzipien der DNS-Replikation und Transkription sind durch die Arbeiten von A. Kornberg und anderen seit den fünfziger Jahren mittlerweile sehr gut verstanden [18] . Auch die Funktionsweise und die Handhabung der entsprechenden Enzyme, die diese Operationen durchführen, sind aufgeklärt und werden in der Bio- und Gentechnologie technisch genutzt.

Zu diesen Standardoperationen gehören: das Schneiden von DNS-Molekülen an sehr spezifischen durch die Sequenz definierten Stellen durch Restriktionsenzyme, das Verbinden (Ligieren) zweiter solcher Ketten durch das Enzym Ligase, das gezielte Einsetzen von DNS-Stücken an definierte Stellen in einem anderen DNS-Molekül (Klonierung) , das schnelle und vielfache Kopien von DNS- Molekülen durch einen automatisierten Prozeß (die sog. PCR = Polymerase chain reaction, Polymerasekettenreaktion) , die gezielte Generierung (Synthese) von DNS-Molekülen vorgegebener Sequenz und ähnliche Operationen werden heutzutage in vielen Labors, aber auch großtechnisch eingesetzt und perfektioniert, z. B. im Rahmen der Genomprojekte .

Da ein Liter einer in solchen Experimenten verwendeten DNS-Lösung (von etwa 6 g DNS pro Liter) ca. 6 * 10^1S Moleküle mit jeweils ca. 200 Basenpaaren (bp) enthält, entspricht eine solche Lösung einer theoretischen Informationsspeicherkapazität von 3 * 10⁹ TeraByte/1. Diese Speicherkapazität übertrifft damit heutige elektronische bzw. magnetooptische Speicher um mehr als das Millionenfache.

Bei einem realistischen Zeitansatz für eine biotechnologische Basisoperation von einer Minute (z. B. für eine PCR (= Polymerase chain reaction, Polymerasekettenreaktion) ergeben sich, bei einer simultanen Anwendung auf alle Moleküle in einer solchen Lösung theoretisch etwa 6 * 10" Operationen pro Minute, d. h. etwa 1 Million Tera Operationen/sec . Die leistungs- fähigsten derzeitigen Supercomputer erreichen kaum Geschwindigkeiten von Tera Operationen/sec bei kaum 1 Tera Byte verfügbarem Speicher.

Insgesamt schätzt man, daß die biologischen Operationen auf DNS gegenüber elektronischen Basisoperationen etwa um den Faktor 10⁹ energieeffizienter sind, um den Faktor 10¹² mehr Speicher erlauben (bei der heute technisch erreichbaren Speicherdichte elektronischer und magnetooptischer Systeme) , und um den Faktor 10 ¹⁵ mehr Prozessoren realisierbar machen.

Wenn man die Leistungsfähigkeit eines Rechnersystems als das Produkt der Zahl der Prozessoren und der von jedem Prozessor ausführbaren Operationen pro Zeiteinheit definiert, ergibt sich bei herkömmlichen Rechnern etwa 100 * 10¹⁰ = 1 Tera Operation/sec, wohingegen bei DNS- basierten Systemen (Standard-DNS-Konzentration) 60 _* 10¹⁷ = 6 Millionen Tera Operationen möglich sind.

Stand der Technik: Informatik

Die Entwicklung der Informatik hat zwei alternative, gleich mächtige Berechnungsmodelle hervorgebracht, das zustandsorientierte Modell der Turingmaschine [30] und das funktionale Modell des λ-Kalküls [9,10,11] . Beide Modelle sind bis heute intensiv theoretisch untersucht worden [2,12,15], das funktionale vor allem im Zusammenhang mit der Verifikation von Programmen [21] und der formalen (denotationellen) Semantik [13,29] von Programmier- sprachen. Praktisch basieren jedoch alle heutigen Rechnerarchitekturen auf dem zustandsorientierten Modell [19] . Die elektronische Technologie und Chipentwicklung ist jahrzehntelang auf dieses Modell hin optimiert worden [26] . Das alternative Berechnungsmodell des λ-Kalküls basiert auf der geordneten Transformation von Ausdrücken (Replikation und Substitution) mittels Reduktionssprachen [6,7,16,17,33,34,35] . Obwohl dieses Modell aufgrund seiner mathematischen Eleganz- und Einfachheit viele praktische Vorteile für die Organisation, Programmierung, Fehlersuche und Verifikation bzw. Validierung von Berechnungen gegenüber der Zustandstransformation aufweist [28,35,36,37] (siehe auch DE-C-25 06 454 und DE-C-25 25 795) , konnte es sich gegenüber der vorherrschenden Technologie, auf die es abgebildet werden mußte, bis jetzt nicht durchsetzen. Dies erscheint aus heutiger Sicht auch verständlich, wenn man beachtet, wie disparat die heutige Siliziumtechnologie und das Berechnungsmodell des λ-Kalküls sind.

Durch die Arbeiten von Adleman [1] und Lipton [20] sowie die PCT-Publikation WO-A-97/07440 ist eine Möglichkeit aufgezeigt worden, DNS-Technologie zur Grundlage einer neuen Art von Berechnungen zu machen. Sowohl Adleman als auch Lipton wenden die Technologie auf das zustands- orientierte Berechnungsmodell an. Es gibt sogar Arbeiten, die explizit darauf zielen, Turingmaschinen in DNS abzubilden [4,5] . Dies bereitet allerdings erhebliche Schwierigkeiten und führt dazu, daß bis heute keine universellen DNS-Rechner konzipiert werden, sondern daß vielmehr DNS-Rechner nur für Spezialaufgaben, etwa in der Kryptographie, vorgeschlagen werden. Diese Spezial- ausrichtung begrenzt den Einsatz der Rechner und damit die Effektivität der DNS-Technologie.

Kurze Beschreibung der Erfindung

Überraschenderweise ist es möglich, die Vorzüge der Effizienz biologischer Operationen auf DNS-Moleküle durch

Kombination eines DNS-Rechners mit einem elektronischen Vorrechner zu nutzen, bei dem die Umsetzung des Programms durch eine Reduktionssprache, insbesondere nach dem λ-Kalkül erfolgt. Das Wesen und die Vorteile derart organisierter Rechner mit Reduktionssprachen, also funktional organisierten und arbeitenden Rechners ist z. B. in [35] beschrieben.

Nach der Erfindung ist also ein frei programmierbares, universelles Parallel-Rechnersystem zur Durchführung von allgemeinen Berechnungen vorgesehen, das versehen ist mit: einem elektronischen Vorrechner, der die Eingabe beliebiger und damit zur Spezifikation allgemeiner Berechnungen fähiger Programme erlaubt, deren Umsetzung in Ausdrücke einer Reduktionssprache realisiert und deren Kodierung in eine DNS-Sequenz vornimmt , einer Synthesevorrichtung, die die kodierte DNS- Sequenz von dem Vorrechner empfängt und die die DNS- Sequenz in ein entsprechendes DNS-Molekül mit einer spezifizierten Nukleotidabfolge synthetisiert, einer Ve rvie 1 f äl t igungsvorr i cht ung zum Vervielf ltigen des synthetisierten DNS-Moleküls mittels einer Ampliflkationsreaktion, einer Reaktionsvorrichtung zum gleichzeitigen Ausführen von Transformationen der DNS-Moleküle mittels molekularbiologischer Techniken gemäß den Reduktionsregeln einer Reduktionssprache, wobei das Ergebnismolekül in der Lösung identifiziert, extrahiert und ggf. vervielfältigt wird, und - einer Sequenziervorrichtung zum Bestimmen der Sequenz des Ergebnismoleküls, wobei diese Sequenz an den Vorrechner weitergegeben wird und der Vorrechner die Sequenz dekodiert sowie die dekodierte Sequenz ausgibt. Bei dem erfindungsgemäßen frei programmierbaren, universellen Parallel-Rechnersystem handelt es sich um eine Kombination aus einem elektronischen Vorrechner und einem DNS-Subsystem. Der elektronische Rechner läßt die Eingabe beliebiger und damit zur Spezifikation allgemeiner Berechnungen fähiger Programme zu, wobei er auf der Basis einer funktionalen Programmiersprache, also auf der Basis einer Reduktionssprache arbeitet. Unter einer "Reduktionssprache" versteht man also insbesondere eine funktionale Programmiersprache, deren Semantik durch bedeutungs- erhaltende Transformationen der Programme definiert sind. Als Beispiel für derartige funktionale Sprachen seien hier beispielsweise LISP, Miranda und ML genannt. Ferner wird in diesem Zusammenhang auf die Literaturstelle [35] verwiesen. Eine Implementierung einer Reduktionssprache in konventioneller Hardware ist beispielsweise in DE-C-25 06 454 und DE-C-25 25 795 beschrieben.

In dem elektronischen Vorrechner des erfindungsgemäßen Parallel -Rechnersystems wird also das Programm in Ausdrücke einer Reduktionssprache umgesetzt so wie deren Kodierung in eine DNS-Sequenz vorgenommen. Da Reduktions- sprachen string-orientiert sind, lassen sie sich vorteilhaft in eine DNS-Sequenz umsetzen. Die kodierte DNS- Sequenz ist nun das Eingangssignal für das DNS-Subsystem, das auf einer Synthesevorrichtung, einer Vervielfältigungsvorrichtung, einer Reaktionsvorrichtung sowie einer Sequenziervorrichtung besteht. Um mit dem DNS- Subsystem parallel arbeiten zu können, wird die kodierte DNS-Sequenz in ein entsprechenden DNS-Molekül synthetisiert und vervielfältigt . Bei der Vervielfältigung bedient man sich einer Ampliflkationsreaktion, wie beispielsweise der PCR bzw. LCR. Mittels molekularbiologischer Techniken, wie insbesondere den Insert-, Delete- und Substitute-Operationen werden die kopierten DNS-Moleküle transformiert. Bei dieser Transformation wird wiederum von einer Reduktionssprache Gebrauch gemacht; die Transformation erfolgt also entsprechend den Reduktions- regeln dieser Reduktionssprache . Wenn keine Reduktionen mehr möglich sind, liegt das Ergebnismolekül in der aus den transformierten DNS-Molekülen bestehenden Lösung vor. Daß das Ergebnismolekül vorliegt, kann daran erkannt werden, daß die Ausführung weiterer molekularbiologischer Prozesse keine Veränderungen der Moleküle mit sich bringt, die Moleküle also nicht mehr kloniert werden können. Die Reduktionsregeln der Reduktionssprache werden also, was das DNS-Subsystem betrifft, durch den biotechnologischen Prozeß in der Reaktionsvorrichtung ausgeführt. Der Vorteil ist, daß die Transformation der Moleküle massiv parallel durchgeführt werden kann, da die Transformationen gleich- zeitig auf eine Vielzahl von DNS-Molekülen ausgeführt werden können .

Durch ebenfalls molekularbiologische Techniken kann das gesuchte Ergebnismolekül bzw. allgemein ausgedrückt ein Molekül in der Lösung identifiziert, extrahiert und ggf. vervielfältigt werden. Sollte man dabei feststellen, daß sich auf das Ergebnismolekül noch Reduktionsoperationen anwenden lassen, so kann man das Ergebnismolekül nach Synthetisierung und Vervielfältigung erneut der Reaktions- Vorrichtung zuführen, um weitere Reduktionsschritte durchzuführen.

Jedes aus der Reaktionsvorrichtung extrahierte Ergebnismolekül wird einer Sequenziervorrichtung zugeführt, die die Sequenz des Ergebnismoleküls bestimmt. Diese Sequenz wird an den Vorrechner weitergegeben, der die Sequenz dekodiert sowie das Ergebnis der Dekodierung anzeigt oder ausgibt .

Als Reduktionssprache eignet sich insbesondere der λ-Kalkül (siehe Literaturstelle [2] ) . Zu insbesondere dieser Reduktionssprache, aber auch allgemein zu Reduktionssprachen ist weiter hinten unter "Der Aufbau eines DNS-Rechners" Näheres ausgeführt. Der Vorteil des λ-Kalküls besteht in seiner außerordentlichen Eignung zur Parallelverarbeitung. Grundsätzlich ist aber die Erfindung für sämtliche Reduktionssprachen anwendbar.

Das erfindungsgemäße, frei programmierbare, universelle Rechnersystem zur Durchführung von allgemeinen Berechnungen zeichnet sich also insbesondere dadurch aus, daß die Berechnungen durch molekularbiologische Transformation von DNS-Molekülen realisiert wird, daß die Berechnungen durch Kombinatorausdrücke einer Reduktionssprache (z. B. dem λ-Kalkül) spezifiziert, durch entsprechende Nukleotidsequenzen kodiert und durch ein dadurch bestimmtes DNS-Molekül realisiert sind, daß die Berechnungen durch spezielle Transformationen der DNS-Moleküle mittels molekularbiologischer Techniken gemäß den Reduktionsregeln des unterliegenden Kalküls vorgenommen werden, daß die Reihenfolge der Elementaroperationen (Reduktionen) nicht, bzw. nur durch die kausalen Datenabhängigkeiten des Programms, festgelegt ist, wobei die Church-Rosser-Eigenschaft garantiert, daß das Endergebnis unabhängig von der konkreten Ausführungsreihenfolge eindeutig ist, daß die Organisation der Berechnungen durch die kausalen Datenabhängigkeiten geregelt wird, - daß die unabhängige Ausführung von Basisoperationen auf mehreren DNS-Molekülen oder mehreren Abschnitten desselben DNS-Moleküls ohne explizite zeitliche Synchronisation durchgeführt werden kann, daß die oben beschriebenen Eigenschaften die effiziente Nutzung der großen Zahl der in einer

Lösung vorhandenen DNS-Moleküle ermöglicht, ohne einen aufwendigen, schwer realisierbaren und das Berechnungspotential erheblich reduzierenden Sequentialisierungsmechanismus in dem DNS-Lösung- System etablieren zu müssen, - daß Berechnungen im Prinzip (bis auf die Datenabhängigkeiten) auf allen DNS-Molekülen in der verfügbaren Lösung unabhängig (parallel, simultan, nebenläufig) ausgeführt werden.

Das erfindungsgemäße Rechnersystem besteht aus einem herkömmlichen elektronischen Vorrechner, einer "Gen- maschine", einem DNS-Rechner wie oben beschrieben und einer Sequenziervorrichtung, wobei der Vorrechner eine Programmierumgebung zur Verfügung stellt, die die Eingabe beliebiger und damit zur

Spezifikation allgemeiner Berechnungen fähiger Programme erlaubt, die Umsetzung in Ausdrücke einer Reduktionssprache realisiert, und eine Kodierung in eine DNS-Sequenz vornimmt und diese DNS-Sequenz an eine Synthesevorrichtung weitergibt, die Synthesevorrichtung ("Genmaschine") eine beliebige DNS-Sequenz in ein entsprechendes DNS- Molekül mit der spezifischen Nukleotidabfolge synthetisiert , - das synthetisierte Molekül (das Programm) durch beispielsweise eine Ampliflkationsreaktion wie LCR- und/oder PCR-Prozeß geeignet vervielfältigt wird, die so erzeugten DNS-Moleküle zur Ausführung von Berechnungen wie oben beschrieben benutzt werden, - das Ergebnismolekül in der Lösung identifiziert, extrahiert und ggf. vervielfältigt wird, ein Sequenzierprozeß z. B. mittels einer herkömmlichen Sequenziervorrichtung, die Sequenz des Ergebnismoleküls bestimmt und die Sequenz an den Vorrechner weitergegeben wird, der Vorrechner die berechnete Sequenz dekodiert und dem Benutzer das Ergebnis der Berechnung geeignet präsentiert.

Eine Realisierung des DNS-Rechnersystem wie oben beschrieben sieht insbesondere vor, daß die Reduktionssprachenausdrücke in geschlossene λ-Ausdrücke, sog. Superkombinatoren, umgesetzt werden, - daß spezifische Inkarnationen dieser Superkombinator- ausdrücke durch eine spezielle PCR-/LCR-Prozedur erzeugt werden, so daß die Variablen der einzelnen Superkombinatorinkarnationen eindeutig numeriert und damit eindeutig identifizierbar sind, - daß Superkombinatorreduktionen durch molekularbiologische Techniken auf den so erzeugten Inkarnationen ausgeführt werden, solange noch Reduktionen möglich sind, wobei die Programmapplikation ebenfalls eindeutig markiert wird, so daß nach Interaktion mit den Superkombinatoren und der dadurch spezifizierten Transformation das Ergebnis eindeutig identifiziert und extrahiert werden kann.

Eine Realisierung für die Basisoperation der Substitution kann durch Restriktionsenzyme erfolgen wie in [35] theoretisch beschrieben (siehe hierzu auch Fig. 2) .

Die Realisierung für die Basisoperation der Substitution kann auch durch Hybridisierung (Stickermodell) wie in [35] theoretisch beschrieben erfolgen.

Mit der Erfindung wird also ein Computer vorgeschlagen, der frei programmierbar und in der Lage ist, allgemeine Berechnungen durchzuführen, und sich von herkömmlichen elektronischen Rechnern dadurch unterscheidet, daß die Informationsspeicherung durch Biopolymere, insbesondere DNS-Moleküle (DNS = Desoxyribonukleinsäure, auch DNA = Desoxyribo-Nuclein-Acid) vorgenommen wird, - daß die Basisoperationen durch biologische bzw. biotechnologische Techniken auf den kodierenden Biopolymeren, insbesondere den DNS-Molekülen durchgeführt werden, und daß die Berechnung durch Kombinationsausdrücke einer Reduktionssprache, wie z. B. dem λ-Kalkül organisiert wird.

Letzteres hat den Vorteil, daß im wesentlichen nur eine einzige Operation, die Substitution von freien Variablen durch Ausdrücke, realisiert -werden muß, um ein universelles Berechnungssystem zu implementieren. Außerdem garantiert eine inhärente Eigenschaft des λ-Kalküls, die sog. Church-Rosser-Eigenschaft , daß das Endergebnis von Berechnungen, unabhängig von der konkreten Reihenfolge der Basisoperationen eindeutig ist. Das unterscheidet λ-Kalkül-basierte (funktionale) Systeme wesentlich von allen herkömmlichen Rechnern, die auf dem Prinzip der Turingmaschine (Zustandstransformation) aufgebaut sind, und erlaubt erst die effiziente Nutzung des in der DNS- Technologie liegenden Vorteils der unabhängigen Ausführung von Berechnungen auf 10¹⁷ oder mehr Molekülen innerhalb eines Rechenapparates. Bei herkömmlichen Rechnern entsteht das bereits von Parallelrechnern mit nur wenigen (hundert) Prozessoren bekannte Problem, die Berechnung so zu kontrollieren und zu programmieren, daß unerwünschte Seiteneffekte nicht zu indeterministischen Ergebnissen führen. Für viele kooperierende Prozesse in herkömmlichen Systemen ist das entstehende organisatorische Problem sehr schwierig, mit großem Programmieraufwand verbunden, notorisch unsicher, und durch die notwendigen Synchronisationen der einzelnen Berechnungen auch ineffizient. Für Größenordnungen, wie sie bei molekularen Systemen entstehen, sind die Probleme praktisch unlösbar. Durch das hier vorgeschlagene System werden diese Probleme vermieden und DNS-Operationen effizient für praktische Berechnungen nutzbar.

Die Nutzung von DNS-Molekülen ist kürzlich zur Lösung kombinatorischer, einschließlich sog. NP-schwerer Probleme vorgeschlagen worden (DNA Computing [1,3,20] und WO-A-97/07440) . Die enorme Anzahl von Molekülen wird dabei dazu eingesetzt, simultan alle Kodierungen möglicher Lösungen mittels einiger weniger biotechnologischer Operationen durchzuprobieren. Der Ansatz hat das Potential, die Grenzen konventioneller Computer in dieser Hinsicht um mehrere Größenordnungen hinauszuschieben. Andererseits ist dieser Ansatz zu einfach, um allgemeine, beliebige Rechnungen auszuführen und zudem wird das Potential der großen Zahl von DNS-Molekülen in relativ kleinen Volumina durch das exponentielle Anwachsen der benötigten Operationen bei einem solchen einfachen

Durchprobierungs (Enumerat ions ) -Verfahren schnell aufgezehrt .

Demgegenüber wird ein universelles, frei programmierbares System vorgeschlagen, das nicht nur diese Nachteile vermeidet und ein konzises Konzept zur Nutzung massiver Nebenläufigkeit (Parallelität) , zur effizienten Arbeitslastverteilung auf viele Prozessoren ohne unnötige Synchronisation und Kommunikation einschließt, sondern auch einfach mit DNS realisiert werden kann. Es ist sogar so, daß die oben erwähnte Basisoperation des λ-Kalküls, d. h. eine Transformation eines durch eine Zeichensequenz kodierten Ausdrucks des λ-Kalkül in einen anderen ebenfalls durch eine Zeichensequenz kodierten Ausdruck, sich geradezu für eine Implementierung durch Zeichenketten, wie sie in DNS-Molekülen zur Speicherung und Verarbeitung in allen biologischen Organismen verwendet werden, anbietet.

Das verkehrt die bisherigen Nachteile funktionaler Systeme, die auf herkömmlichen elektronischen Systemen emuliert werden mußten, ins Gegenteil, da die zustands- transformierenden Systeme praktisch unlösbare Probleme mit der massiven Parallelverarbeitung implizieren.

Nachfolgend wird anhand der Zeichnung ein Ausführungs- beispiel der Erfindung näher erläutert . Im einzelnen zeigen:

Fig. 1 eine schematische Darstellung als Blockschalt- bild eines funktionalen DNS-Rechners, und

Fig. 2 eine graphische Darstellung der im DNA-Subsystem des DNS-Rechners verwendeten Basisoperationen (molekularbiologische Techniken) .

Systemkonze t

Bei dem Ausführungsbeispiel wird die DNS-Technologie für universelle Berechnungen auf der Basis des λ-Kalküls eingesetzt. Damit werden die Stärken der DNS-Technologie, nämlich ein hoher Grad an Parallelität ohne Kommunikationsbedarf, voll ausgenutzt. Außerdem kann das funktionale Berechnungsmodell zum ersten Mal durch eine dem Modell entsprechende Implementierung realisiert und mit angemessenen Prozessorzahlen versehen werden. Bei der Erfindung handelt es sich also um ein hybrides System aus vorgeschalteter Elektronik und DNS-Technologie stehen, das einen universellen funktionalen Rechner darstellt. Es existieren langjährige Erfahrungen sowohl im Bereich der konzeptuellen Grundlagen des λ-Kalküls und der Reduktionssysteme als auch in Beziehung auf die Implementierung solcher Systeme mittels spezieller Hard- wäre - sog. Reduktionsmaschinen - [6,7,16] und als Emulator/Simulator auf konventionellen Rechnern [17,34,35]. Außerdem steht ein Programmiersystem zur Programmspezifikation mittels mathematischer Funktions- gleichungen [22,23,24,32,33,35] zur Verfügung. Da die Programmausführung auf der bedeutungserhaltenden Transformation von Ausdrücken beruht, kann jeder Zwischen- schritt von Berechnungen wieder vollständig in einen Ausdruck der Programmiersprache zurückübersetzt und damit vom Benutzer analysiert werden.

Die effiziente Ausführung solcher Programme auf herkömmlichen Parallelrechnern kann mittels einer vollständig systemgesteuerten Arbeitslastverteilung [34,35] durchgeführt werden. Dabei unterscheiden sich "parallele" nicht von "sequentiellen" Programmen; das Problem der "Parallelisierung" und der zugehörige Korrektheitsnachweis entfällt daher für den Programmierer.

Der Aufbau eines DNS-Rechners

Der DNS-Rechner ist wie in Fig. 1 aufgebaut. Ein Vor- oder Host-Rechner (links) konventioneller Technologie spezifiziert und organisiert die funktionale Berechnung. Er führt ggf. Analysen hinsichtlich der benötigten Ressourcen an DNS-Volumen und Zeit durch. Die DNS- Komponente (rechts) besteht aus einer Apparatur, die DNS- Segmente nach Vorgabe synthetisiert, einem Reaktionsapparat und einer Apparatur, die das Reaktionsergebnis analysiert (ausliest) . Letztere Apparatur hat eine Verbindung zurück zum Host -Rechner . Für den DNS-Rechner sind insbesondere die folgenden Dinge von Vorteil :

Das funktionale Programm kann in einer hohen funktionalen Programmiersprache [31,25,27] spezifiziert werden. Das vorhandene Entwicklungssystem kann als Programmiersystem und Schnittstelle zum DNS-Rechnersystem eingesetzt werden. Dabei können Programme entwickelt, durch schrittweise Ausführung getestet und interaktiv an kleinen Probleminstanzen validiert werden [22,23,27,35], um sie schließlich für aufwendige Produktionsläufe an das DNS-Subsystem zu übergeben. Die Schnittstellen des Host-Systems zu Standard-Betriebssystemen ermöglichen die Nutzung der DNS-Komponente als "Computer Server" für herkömmliche Programmsysteme.

Der Vorrechner kompiliert zunächst das funktionale Programm. Transli teration bedeutet hier die Berechnung der geeigneten Kodierungen von Programmteilen in DNS-Strings und die Generierung der Anweisung für die DNS-Synthese -Apparatur . Die DNS-

Synthese-Apparatur erzeugt die Strings nach den Vorgaben des Host -Rechners .

Dann wird dafür gesorgt (automatisch oder von Hand) , daß die DNS miteinander reagiert. Die Randbedingungen für die Reaktion (Zeit, Temperatur etc.) könnten auch vom Host -Rechner berechnet werden.

Nach der Reaktion wird das Ergebnis analysiert und die DNS-Strings, die die Ausgabe kodieren, werden selektiert. Auch hier können als Teil der Kompilation im Host-Rechner Steuerungsinformationen generiert werden.

Schließlich wird die Ausgabeinformation an den Vorrechner zurückgegeben und dekodiert (De- Trans - li tera tion) . Wie diesem Bild einer DNS-Rechnung entnommen werden kann, sind informatische und molekularbiologische Aspekte stark miteinander verzahnt. Auf der Informatikseite sind DNS- Kodierungen für funktionale Programme erforderlich und der Kompilation anzupassen [35] . Ferner sollten Modelle entwickelt werden, die die molekularbiologischen Reaktionen in der DNS zu analysieren gestatten, weil die Güte von DNS-Kodierungen nur auf der Basis von Wissen darüber geschätzt werden kann, was in der DNS-Lösung tatsächlich passiert.

Auf der molekularbiologischen Seite ist eine neue Art von Labortechnik basierend auf DNS-Replikation (PCR) und Selektion zu entwickeln. Ansätze hierfür gibt es bereits in den Konzepten von DNA Computing, wie es bis heute untersucht wird. Für ein (schon universelles) Basis- reduktionssystem ist nur eine einzige Operation notwendig: die Anwendung von Funktions- auf Argumentationsausdrücke. In Stringreduktionssystemen wird diese Basisoperation durch die sog. 3-Reduktion realisiert. Dabei wird der

Argumentausdruck einer Applikation für alle freien

Vorkommen einer Variablen im Rumpf der Abstraktion

(Funktion) eingesetzt. Der Argumentausdruck muß entsprechend oft repliziert werden.

Die Syntax des λ-Kalkül ist durch folgende Grammatik definiert :

E → v Variable

| c Konstante

| λv. E Funktionsdefinition

| @EE Funktionsanwendung Für die vollständige Beschreibung und praktische Durchführung von Berechnungen in einem funktionalen Basissystem ist nur eine Basisoperation, die Substitution F [v <= A] des Ausdrucks A für freie Vorkommen der Variablen v im Funktionsausdruck F notwendig [35] .

Formal ist die Semantik (Bedeutung) , d. h. auch die Berechnungen oder Reduktionen, von λ-Ausdrücken E durch die folgende Funktion m (E) spezifiziert:

wenn E = c I v I λv. F unverändert

F [v <- A] wenn E = @ λv. F A Funktions anwendung

Eine Realisierung dieser Basisoperation mittels DNS- Operationen ist graphisch in Fig. 2 dargestellt:

Die gesamte Programmausführung eines applikativen Programms ist nun eine (beliebige) Folge solcher ß-Reduktionen bis auf eine Normalform erreicht ist. Eine Normalform eines Programmausdrucks (kodiert als DNS- String) ist ein bedeutungsäquivalenter Ausdruck (ebenfalls ein DNS-String) , der keine anwendbare Reduktion mehr enthält. Man kann sagen, daß eine funktionale Programmspezifikation zu seiner Bedeutung (dem Programmergebnis) reduziert wird. Dieses Programmergebnis muß identifiziert, zur Rückgabe an den Host selektiert und zurückübersetzt werden. Die Mechanismen für die eindeutige Rückübersetzung (Transliterierung) [24,35] von Reduktionssprachen- ausdrücken in abstrakten Maschinencode für herkömmliche Rechenarchitekturen sind in den vorgenannten Reduktions- maschinenprojekten entwickelt und erprobt worden. Für eine DNS-Realisierung muß eine gezielte Duplizierung des Arguments, das Auffinden von Variablen im Funktionsrumpf durch Matching und das geordnete Ersetzen der Variablen durch den Argumentausdruck implementiert werden.

Bisherigen Konzepten von DNA Computing liegt das SIMD- Modell zugrunde. Das heißt, daß die Operationen synchronisiert ablaufen. Jede Reaktion dauert dabei etwa eine Stunde . Funktionale Programme erlauben aufgrund der Church-Rosser-Eigenschaft [2,17,15,35] den asynchronen Ablauf sich gegenseitig nicht störender Operationen. Das bedeutet, daß bei geeigneter Kodierung keine explizite Synchronisation stattfinden muß. Das würde die notwendige Berechnungszeit erheblich herabsetzen, z. B. auf eine Stunde für eine ganze Rechnung anstatt auf eine Stunde pro Rechenschritt. Daß sich die einzelnen Berechnungsschritte nicht stören, wäre wieder durch eine geeignete Kodierung zu sichern.

Das vorgeschlagene Konzept für eine neue Basis von Berechnungen und das neue hybride Rechnersystem stellt zum ersten Mal eine dem mathematisch eleganten Berechnungs- modell angepaßte "Hardwareplattform" zur Verfügung, die auch in natürlicher Weise die inhärente Nebenläufigkeit funktionaler Berechnungen unterstützt. Damit wird auch ein neues und erfolgversprechendes Konzept für die Nutzung "massiver Parallelität" vorgeschlagen.

Die bisher bestehenden Nachteile des DNA Computing, die vor allem daher rühren, daß man vollständige Enumeration auf der Basis des zustandsorientierten Modells vorschlägt, also Berechnungen durchführen will, die man nach der klassischen Technologie nie umsetzen würde, fallen hier weg. Bei einer funktionalen DNS-Berechnung wird tatsäch- lieh nur das berechnet, was das funktionale Programm auch in anderen Implementierungen ausführen würde. Das sollte die Anforderungen an das DNS-Volumen erheblich herabsetzen. Darüber hinaus würde durch eine asynchrone DNS- Berechnung die berechnungszeit , aber auch die Notwendigkeit expliziter externer Steuerung der Berechnung drastisch reduziert.

Der Inhalt der im Literaturverzeichnis aufgeführten Literaturstellen sowie der anderweitig zitierten Literatur wird hiermit durch Bezugnahme auch zum Inhalt der Erfindung gemacht.

1 Weiteres Ausführungsbeispiel 1.1 Vorbemerkung Nachfolgend wird ein weiteres Ausführungsbeispiel der Erfindung beschrieben, wobei die Umsetzung der Reduktions- sprache des Vorrechners in DNS-Systemen sowie deren Weiterverarbeitung zur Ausführung des Programms näher beschrieben sind. Dieses Ausführungsbeispiel bezieht sich auf eine

Implementierung eines universellen Berechnungskonzeptes

(λ-Kalkül) mittels DNA und insbesondere auf die Nutzung der spezifischen Eigenschaften des λ-Kalküls für ein massiv paralleles asynchron arbeitendes und dezentral organisiertes Rechensystem durch eine kombinierte elektronische/biologische Maschinerie und biotechnologische Basisoperationen zur Implementierung der massiv parallelen Schritte. Das vorgeschlagene biologische Subsystem der Speicherung der Information (Programm und Daten) als Strings in DNA-Molekülen und ihre nebenläufige Bearbeitung durch Operationen auf einer Unzahl unabhängiger Sequenzen/Moleküle, die in einem Reaktor gelöst in einer Pufferlösung enthalten sind, verbietet die Annahme einer zentralen Kontrollinstanz oder detaillierten Steuerung der einzelnen Berechnungsschritte. Im Gegenteil muß ein Berechnungskonzept der Selbstorganisation in solchen Anordnungen Rechnung tragen und durch entsprechende organisatorische Konzepte die erwünschten Berechnungen realisieren.

Die genaue Ausführung der Komponente ist deshalb für die erfindungsgemäße Implementierung des DNA-Rechners von untergeordneter Bedeutung und stark abhängig vom weiteren Fortschritt der biotechnologischen Verfahren und deren Fehlerrate. Der vorgeschlagene Rechner kann direkt an sich wandelnde Technologien und neue Verfahren angepaßt werden, indem die Umsetzung der Programmiersprachenausdrücke in DNA-Strings (d. h. konkret die Codegenerierungs-Komponente des Compilers) für die Synthesevorrichtung entsprechend angepaßt wird. Das vorgeschlagene Konzept ist also auch in der Hinsicht universell, daß neue Basistechnologien einfach für neue Generationen des vorgeschlagenen Hybridrechners genutzt werden können.

1.2 Systemkomponenten

Zur Illustration werden diese Vorteile des vorgeschlagenen Hybridrechners an einem konkreten Beispiel ausgeführt . Dabei werden die beiden wesentlichen Komponenten des Systems exemplarisch implementiert:

1. ein Ausführungsbeispiel für die Bearbeitung eines konkreten Programmausdrucks, der eine schon recht komplizierte zweifach rekursive Funktion spezifiziert, bestehend aus (a) der Spezifikation und Eingabe der Problemlösung als funktionales Programm mittels der syntaxgesteuerten Benutzerschnittstelle des herkömmlichen Computers, (b) die flexible und anpassungsfähige Umsetzung des Programms als String-Sequenz von Nukleotiden durch einen entsprechenden Compiler, der auf dem herkömmlichen Computer ausgeführt wird, als

Eingabe für die DNA-Synthesevorrichtung,

(c) die Synthese und Vervielfältigung der spezifizierten DNA-Moleküle in einer geeigneten Pufferlösung zur Durchführung der biotechnologischen Basisoperationen, die die nebenläufige, verteilte Aufteilung der Berechnung und die Ausführung der Berechnungen realisieren, (d) die Zusammensetzung der parallel berechneten

Teilergebnisse zu Gesamtlösungen,

(e) die Extraktion des DNA-Moleküls, das die Gesamt- lösung repräsentiert, aus dem Reaktor mit der Pufferlösung, mittels einer geeigneten Anker- sequenz,

(f) die Sequenzierung des extrahierten DNA-Moleküls und die Rückgabe der entsprechenden Sequenz an die elektronische Komponente, und

(g) die Dekodierung der Sequenz und ihre Umsetzung (Dekompilation) und Visualisierung mit Hilfe der

Benutzerschnittstelle .

2. die Erzeugung und Behandlung massiv paralleler Ausführungsstränge im DNA-Subsystem, bestehend aus (a) der Vorbereitung der nebenläufig ausführbaren

Programmteile durch entsprechende Identifizierung und Abstraktion der Ausdrücke während der Übersetzung (Compiler) auf dem herkömmlichen Rechner. Das kann sowohl durch systemgesteuerte Analyse des spezifizierten

Programmausdrucks als auch durch explizite Benutzerannotationen durchgeführt werden, (b) der Ausführung der entsprechenden Aufteilungs- Funktionen (dis) . Das führt im Bio-Subsystem zur Aufteilung des jeweiligen Gesamtmoleküls in mehrere DNA-Moleküle, dem Haupttemplate und zwei (oder mehr) DNA-Molekülen, die völlig unabhängig voneinander in der Pufferlösung bearbeitet werden können,

(c) der rekursiven Anwendung des Aufteilungsschemas nebenläufig mit den zugehörigen sequentiellen

Berechnungen. Das führt theoretisch zu einer riesigen Zahl unabhängiger Prozesse, die nur durch die kausalen Abhängigkeiten der Problemstellung und die in der Pufferlösung zur Verfügung gestellten Ressourcen praktisch begrenzt ist . Diese Ressourcen können in der Programmvervielfältigungsphase (PCR-Schritt nach der Synthese der Programmsequenz) abhängig von der Anwendung und der Verfügbarkeit der übrigen Materialien spezifisch eingestellt werden, und

(d) der Synchronisation (λ*) der unabhängigen Programmteile mit dem zugehörigen Haupttemplate durch die vorbereitete -Reduktion und der dadurch realisierte Zusammenbau der Gesamt - lösung.

1.3 Beispiel

Es werden die zwei genannten Ausführungsbeispiele anhand des folgenden Programmbeispiels diskutiert, das als Standardbenchmark für funktionale Systeme und zugehörige Rechnerarchitekturen gut untersucht ist .

Folgende mathematische Zahlenreihe (Fibonacci- Zahlen) , die für die Modellierung diverser Wachstumsprozesse von Bedeutung ist, soll durch eine zweifach rekursive Funktion berechnet werden:

1,1, 2, 3, 5, 8, 13, 21, 34, 55, 89, Die Zahlenfolge ergibt sich dadurch, daß ein Element der Folge sich aus der Summe der beiden vorangegangenen Zahlen berechnet. Die zugehörige zweifach rekursive Funktion zur Berechnung der Folge in unserer funktionalen Notation ist wie folgt :

f (n) = if (π≤l) then 1 eise f (π-1) +f (n-2)

Dabei ist f in) die π-te Zahl der Folge. Beginnend mit 1 für n=0 oder n=l (t en-Teil) ergeben sich die anderen Elemente als Summe der beiden vorhergehenden (else-Teil) , also z. B. die zehnte Fibonacci-Zahl durch f(10) = 89.

Die Anzahl der notwendigen Operationen zur zweifach rekursiven Berechnung dieser Folge wächst exponentiell mit n, so daß zur Bestimmung von f(20) = 10.946 schon eine große (21.891), für f(50) = 20.365.011.074 eine astronomische (40.730.022.147) Zahl von Funktions- aufrufen/Rechenoperationen durchgeführt werden muß.

1.4 Kodierungsbeispiel für die Berechnung der Fibonacci- Funktion Die interne Konstruktorsyntaxdarstellung obiger Fibonacci- Funktion f ist wie folgt:

AP REC VAR f SUB VAR n AP AP <= VAR n INT 1 IF INT 1

AP + AP VAR f AP - VAR n INT 1 AP VAR f AP - VAR n INT 2 INT 20 Um die Struktur für die weiter unten angegebene Kompilation etwas besser hervorzuheben, läßt sich das Programm äquivalent wie folgt darstellen:

AP REC VAR f

SUB VAR n AP AP

VAR n

INT 1 IF INT 1 AP +

AP VAR f AP -

VAR n INT 1 AP VAR f AP -

VAR n INT 2

INT 20

Dabei bindet der zweistellige Konstruktor REC die folgende Variable rekursiv, SUB nicht rekursiv im Funktionsrumpf . Der Applikator AP spezifiziert die Anwendung der genannten Funktion auf die folgenden Argumente. Die einstelligen Konstruktoren VAR und INT geben den Typ des nachfolgenden Konstrukts an.

Tabelle 1 listet die DNA-Kodierung der hier verwendeten zweistelligen Konstruktoren:

DNA-Code Konstruktorsyntax

AAA.AAA REC <variable> <expr>

AAA.AAG SUB <variable> <expr>

AAA.AGA IF <expr> <expr>

AAA.AGG AP <expr> <expr>

AAA.GGG SUB* <variable> <expr>

Tabelle 1 : DNA-Kodierung zweistelliger Konstruktoren Die Codes der hier verwendeten einstelligen Konstruktoren sind in Tabelle 2 angegeben:

Tabelle 2 : DNA-Kodierung einstelliger Konstruktoren

Variablennamen <string> und Funktionsidentifikatoren <func-id> können durchnumeriert und wie Zahlen <number> und Zeichen <string> kodiert werden. Dabei werden einzelne Ziffern des Dualsystems durch drei Nukleotide (als Codon) kodiert, '0' als -'CCC und '1' als 'TTT', natürlich würde ^"auch ein Nukleotid ausreichen, allerdings wird die Redundanz durch die Verwendung von mehr Nukleotiden erhöht; je nach Fehleranfälligkeit der biotechnologischen Operationen kann die Redundanz durch Verwendung längerer Kodierungen (erweiterte Codone oder Verwendung von mehr Codonen pro Ziffer) oder durch größeren Hammigabstand der Kodierung noch verbessert oder an spezielle Gegebenheiten der eingesetzten biotechnologischen Operationen angepaßt werden.

Um eine kompakte Kodierung beliebig vieler Zeichen und Zahlen zu erlauben, werden sie durch eine Binärdarstellung mit einem Anfangs- (CAC) und einem Endmarker (ACA) kodiert. Die Technik der Anfangs- und Endmarker kann auch für die Konstruktoren verwendet werden, um einerseits eine kompaktere Kodierung zu erhalten oder andererseits den Einbau von Restriktionsschnittstellen zur Aufteilung der Ausdrücke in ihre Syntaxkomponenten zu ermöglichen. Die folgende Tabelle 3 zeigt die hier verwendeten Codes.

Der Punkt dient nur der besseren Lesbarkeit (die

Aufteilung in die Codone) und ist nicht Teil der Codierung.

Tabelle 3: DNA-Kodierung von Basis-Konstrukten

Zur Identifizierung und Extraktion der Gesamtlδsung aus dem Puffer für das nachfolgende Auslesen (Sequenzierung) des Ergebnisses wird die folgende Sequenz als Kodierung des MAIN-Konstruktors verwendet:

Man erhält also aus der Übersetzung des Ausdrucks in Konstruktorsyntax folgende Nukleotid-Sequenz : ACGTACGT AAA.AGG

AAA.AAA GGG.AAA CAC . TTT . CCC . TTT .ACA AAA.AAG GGG.AAA CAC . TTT . CCC . CCC . TTT . TTT .ACA

AAA.AGG

AAA.AGG GGG.AGA CAC . TTT . CCC .ACA

GGG .AAA CAC .TTT . CCC . CCC . TTT . TT .ACA GGG.AAG CAC. TTT.ACA AAA.AGA GGG.AAG CAC. TTT.ACA

AAA.AGG

GGG.AGA CAC. CCC.ACA AAA.AGG

GGG.AAA CAC.TTT. CCC. TT.ACA AAA.AGG

GGG.AGA CAC. TT.ACA

GGG .AAA CAC . TTT . CCC . CCC . TTT . TTT .ACA GGG.AAG CAC. TTT.ACA AAA.AGG GGG.AAA CAC. TT. CCC. TTT.ACA

AAA.AGG

GGG.AGA CAC. TTT.ACA

GGG .AAA CAC . TTT . CCC . CCC . TTT . TT .ACA GGG.AAG CAC. TT. CCC.ACA GGG.AAG CAC. TTT. CCC. TT. CCC. CCC.ACA

d. h., die Synthesevorrichtung wird instruiert, folgendes DNA-Molekül (bestehend aus 398 Nukleotiden) zu produzieren:

ACGTACGTAAAAGGAAAAAAGGGAAACACTTTCCCTTTACAAAAAAGGGGAAACACTTTCCCCCC TTTTTTACAAAAAGGAAAAGGGGGAGACACTTTCCCACAGGGAAACACTTTCCCCCCTTTTTTAC AGGGAAGCACTTTACAAAAAGAGGGAAGCACTTTACAAAAAGGGGGAGACACCCCACAAAAAGGG GGAAACACTTTCCCTTTACAAAAAGGGGGAGACACTTTACAGGGAAACACTTTCCCCCCTTTTTT ACAGGGAAGCACTTTACAAAAAGGGGGAAACACTTTCCCTTTACAAAAAGGGGGAGACACTTTAC

AGGGAAACACTTTCCCCCCTTTTTTACAGGGAAGCACTTTCCCACAGGGAAGCACTTTCCCTTTC CCCCCACA

Nach Durchführung aller Operationen ist das Ergebnis der Bio-Transformation des Hauptprogramms MAIN, d. h. der Berechnung von f(20), das folgende DNA-Molekül:

ACGTACGTGGGAAGCACTTTCCCTTTCCCTTTCCCTTTTTTCCCCCCCCCCCCTTTCCCACA Das Ergebnis kann mittels des MAIN Labels (ACGTACGT) aus der Pufferlösung extrahiert werden, so daß man als Ergebnis der Berechnung eine Zahl (GGG.AAG) in Binärkodierung (10101011000010) erhält.

Die Übersetzung der Binärkodierung ergibt als Ergebnis der Gesamtberechnung die Zahl 10946.

1.5 Kodierungsbeispiel für die verteilte Berechnung der Fibonacci-Funktion

Zunächst wird das Funktionsbeispiel :

£ {n) - if (nsl) then 1 eise f [n- l ) +f (n- 2 )

transformiert in

f {n) =ap dis X *t_t λ*t₂ if (n≤l) then 1 eise t_+t₂ [f (n- 1) , £ {n- 2 ) ]

Dabei hat der Compiler zwei unabhängig voneinander ausführbare Ausdrücke f (n- l ) und f (n-2 ) identifiziert und mittels einer speziellen λ-Abstraktion (λ* oder SUB*) abstrahiert und für die Verteilung markiert.

Die Übersetzung ist nun analog zum Beispiel oben, wobei lediglich weitere Kodierungen für die Funktion dis und den Konstruktor λ* notwendig werden, die in Tabelle 1 schon eingeführt wurden.

Die Ausführung der Funktion dis führt zur Aufspaltung des Programmausdrucks in 3 Moleküle: den λ*-Ausdruck (das o. g. Haupttemplate) , und die beiden Fibonacci-Funktions- berechnungen. Für das Beispiel ergibt sich:

ap sub n ap dis X^* t_\ λ^* t₂ if (n < 1) then 1 eise t_\ + t₂ [f(n - 1), f(n — 2)] 20

und nach einem Schritt

ap dis λ*t, λ*t₂ if (20sl) then l eise t_α+t₂ [f (20-1) , f (20-2) ]

Dadurch entstehen im nächsten Schritt drei unabhängige Ausdrücke :

1. λ*d λ*t₂ if (20≤1) then l eise t₂+t₂

2. F(19)

3. F(18)

Im weiteren Verlauf der Berechnung entstehen viele weitere unabhängig berechenbare DNA-Moleküle. Im folgenden Schritt in diesem Beispiel sieben Moleküle, von denen vier (Nr. 3,4,6,7) direkt weiter prozessiert werden können.

1. λ*tj λ*t₂ if (20≤l) then l eise t+t₂

2. λ*t₂ λ*t₂ if (I9si) then l eise t_j+t₂

3. F(18)

4. F(17) 5. λ*t, λ*t₂ if (18≤1) then 1 eise t₂+t₂

6. F(17)

7. F(16)

und dann fünfzehn Moleküle/Ausdrücken, von denen acht (Nr. 4,5,7,8,11,12,14,15) ausführbar sind: 1. λ*t₂ λ*t₂ if (20≤1) then 1 eise t₂+t₂

2. λ*t₂ λ*t₂ if (19≤1) then 1 eise t₂+t₂

3. λ*t₂ λ*t₂ if (18≤1) then 1 eise t₂+t₂

4. F(17) 5. F(16)

6. λ* _j λ*t₂ if (17≤1) then 1 eise t₂+t₂

7. F(16)

8. F(15)

9. λ*t₂ λ*t₂ if (18≤1) then 1 eise t₂+t₂ 10. λ*t₂ λ*t₂ if (17≤1) then 1 eise t₂+t₂

11. F(16)

12. F(15)

13. λ*tj λ*t₂ if (16≤1) then 1 eise t₂+t₂

14. F(15) 15. F(14)

und so weiter. Im allgemeinen können von den jeweils vorhandenen 2K - 1 Molekülen K (also immer mehr als die Hälfte) direkt weiterverarbeitet werden. In diesem Beispiel können bis zu 21891 (genau (2*f(20)-l) Funktionsaufrufe) unabhängig ausführbare Programmausdrücke entstehen. Letztlich sind jedoch alle Unterausdrücke berechnet und das Gesamtergebnis wird (wie analog auch schon vorher die entsprechenden Teilergebnisse) zusammen- gesetzt. Im vorletzten Schritt der Berechnung erhält man also drei Ausdrücke, von denen nur noch einer ausführbar ist (Nr. 1) und der die beiden anderen zum Gesamtergebnis zusammenfaßt :

1. λ*t₂ λ*t₂ if (20≤1) then 1 eise t₂+t₂

2. 6765

3. 4181

Man erhält so den Ausdruck:

if (20≤1) then 1 eise 6765+4181 schließlich:

6765+4181

und damit das Endergebnis :

10946

Damit ergibt sich bei diesem Beispiel zur nebenläufigen Berechnung unabhängiger Programmausdrücke das gleiche Ergebnis wie in Abschnitt 1.4 bei der strikt sequentiellen Ausführung.

1.6 Bemerkung zur sequentiellen und nebenläufigen Berechnung des Ausführungsbeispiels

Bei genügend Ressourcen bei der nebenläufigen Ausführung kann das gleiche Ergebnis mit erheblich weniger Schritten berechnet werden als bei der sequentiellen Ausführung:

Während für die vollständig verteilte Berechnung nur

20 Großschritte erforderlich sind, benötigt die sequentielle Ausführung 21891 Schritte/Funktionsaufrufe

(also etwa 1000 mal soviele) .

Da der Berechnungsaufwand - wie oben erwähnt - exponentiell ansteigt, wächst auch die Leistungssteigerung durch die nebenläufige Ausführung mit Vergrößerung des Arguments drastisch an, für n = 30 beträgt der Faktor beispielsweise schon 30 zu 2.7 Millionen (2.692.537).

Wie in [35] erläutert, wird es bei endlicher Zahl von Prozessoren (allgemein von für Rechnungen zur Verfügung stehender Ressourcen), hier DNA und Puffermaterial, notwendig, die im Übermaß vorliegende probleminhärente Nebenläufigkeit durch geeignete Einschränkung an die verfügbaren Ressourcen anzupassen, um so eine effiziente Nutzung und eine schnelle Ausführung der notwendigen Berechnungen zu gewährleisten.

L I T E R A T U R

[1] Adleman, L.M: Molecular Compu tation of Solutions to Combinatorial Problems, Science, Vol. 266, 1021-1024, 1994

[2] Barendregt, H.P. : The Lambda Calculus , Its Syntax and Semantics, North Holland, 1981, Studies in Logic and the Foundations of Mathematics, Vol. 103

[3] Baum, E . : Building and associative memory vastly larger than the brain, Science, 1995, Vol. 268, 583-585

[4] Beaver, D.: A Universal Molecular Computer, Penn State University, Tech Report CSE-95-001

[5] Beaver, D. : Computing wi th DNA, Journal on Computational Biology, Vol. 2, No. 1, 1995

[6] Berkling, K.J.: Reduction Languages for Reduction Machines, 2nd Annual Symposium on Computer Architecture, January 1975, ACM/IEEE, pp . 133-140

[7] Berkling, K. J. : A Symmetrie Complement to the Lambda Calculus , Interner Bericht GMD ISF-76-7, D-5205 Sankt Augustin 1, September 14, 1976

[8] Brown, T.A.: Gentechnologie für Einsteiger, Spektrum Akademischer Verlag, 1995

[9] Church, A. : A note on the Entscheidungsproble , Journal of Symbolic Logic, Vol. 1, 40-41, Correction, 101-102 [10] Church A. ; Rosser, J.B.: Some properties of conversion, Trans. Amer. Math. Soc . , 39, 1936, 472-482

[11] Church, A. : The calculi of lambda conversion, Princeton University Press, 1941

[12] Curry, H.B.; Feys, R. : Combinatory Logic Vol . I, North-Holland, 1958, Studies in Logic and the Foundations of Mathematics

[13] Gordon, M. : The denotational description of Programming languages , Springer, 1979

[14] Gordon, M. ; Milner, R. ; Wadsworth, C.P.: Edinburgh LCF, LNCS 78, 1979

[15] Hindley, J.R. ; Sedlin, J.P.: Introduction to Combinators and λ -calculus, Cambridge University Press, 1986, London Mathematical Society Student Texts 1

[16] Kluge, W.E. : The Archi tecture of the Reduction Machine Hardware Model , GMD ISF-79-3, D-5205 Sankt Augustin 1, August 1979

[17] Kluge, W.E.: Cooperating Reduction Machines , IEEE Transactions on Computers, Vol. C-32, No . 11, 1983, pp. 1002-1012

[18] Kornberg, A. ; Baker, T.A.: DNA Replica tion , W.H. Freeman and Co., 1992.

[19] Kluge, W.E. : The Organiza tion of Reduction, Da ta Flow and Control Flow Systems , MIT Press, 1992 [20] Lipton, R. J. : DNA Solution of Hard Computational Problems, Science, Vol. 268, 542-545, 1995

[21] Loeckx, J. ; Sieber, K. : The foundations of program verification, Teubner-Wiley, 1984

[22] Mevissen, H. ; Pless, E.: OREL/C - eine Kommandosprache als Ergänzung zur Reduktionssprache OREL/1 , GMD Arbeitspapier 239, 1998

[23] Mevissen, H. : ERWIN - Reduction- System Window - oriented Edi tor. User ' s Guide, GMD Arbeitspapier 502, 1991

[24] Mevissen, H. : Tabellengesteuerte Transli teration von kontext- freien Sprachen . Die Sprachbeschreibungs - spräche OREL/SYN, GMD Arbeitspapier 529, 1991

[25] Milner, R. : A proposal for Standard ML, LFP, Austin, Texas, August 1984

[26] Patterson, J.L . ;Hennessey, D.A.: Compu ter Archi tecture : A quantiative approach, Kaufmann, 1990

[27] Pless, E.; Schlütter, H. : The reduction language OREL/2 , Arbeitspapiere der GMD, 1990

[28] Smith, E.; Zimmer, R.: Leistungssprünge durch Massive Paralleli tät ? , GMD Jahresbericht 1990

[29] Stoy, J.E. : Denotational Semantics - The Scott Strachey Approach to Programming Language Theory, MIT Press, 1977 [30] Turing, A.M. : On computable numbers , wi th an application to the Entscheidungsproblem, London Mathematical Society, 2s. 42, 1936, 230-265

[31] Turner, D.A.: Miranda : A non-strict functional language wi th polymorphic types , FPCA, September 1985, Nancy, LNCS 201

[32] Zimmer, R. : Cooperating Reduction Machines wi th Heap- Support, 4. Workshop Al ternative Konzepte für Sprachen und Rechner, Bad Honnef , März 1987, Bericht Nr. 2/87-1, Universität Münster

[33] Zimmer, R. : A Heap-Supported Mul tiprocessor Reduction System, GI-Workshop Sprachen, Algori thmen und Archi tekturen für Parallelrechner, Bad Honnef, Mai 1988, Universität Münster

[34] Zimmer, R. : Concurrent Execution of Reduction Language Expressions on a Mul tiprocessor - Archi tecture, ACM-Workshop on Archi tectural Support for Declarative Language s , Mai 1989, Eilat, Israel

[35] Zimmer, R.M. : Zur Pragmatik eines operationalisierten λ -Kalküls als Basis für interaktive Reduktions - systeme, Oldenbourg Verlag, 1990

[36] Zimmer, R. : Why Functional Programming does not (yet) matter, In W. Lippe (Editor), GI -Workshop AI ternative Konzepte für Sprachen und Rechner, Bad Honnef, April 1991, 149-168, Universität Münster Bericht 8/91-1.

[37] Zimmer, R.: Reflections, the Church-Rosser property and "real " applica tions in functional Sys tems , In Hugh Glaser; Pieter Hartel (Editoren) , Proceedings of the 3rd international Workshop on Parallel Impl emen tations of Functional Languages, Southampton, UK, 5-7.06.1991.

[38] Zimmer, R.M. : A universal Computer based on DNA : a new imple entation of λ -calculus based reduction Systems, 1995, in Vorbereitung.

Claims

P A T E N T A N S P R U C H E

Frei programmierbares , universelles Parallel-Rechnersystem zur Durchführung von allgemeinen Berechnungen, mit einem elektronischen Vorrechner, der die Eingabe beliebiger und damit zur Spezifikation allgemeiner Berechnungen fähiger Programme erlaubt, deren Umsetzung in Ausdrücke einer Reduktionsspräche realisiert und deren Kodierung in eine DNS-Sequenz vornimmt, einer Synthesevorrichtung, die die kodierte DNS- Sequenz von dem Vorrechner empfängt und die die DNS-Sequenz in ein entsprechendes DNS-Molekül mit einer spezifizierten Nukleotidabfolge synthetisiert , einer Vervielfältigungsvorrichtung zum Vervielfältigen des synthetisierten DNS-Moleküls mittels einer Ampliflkationsreaktion, einer Reaktionsvorrichtung zum gleichzeitigen Ausführen von Transformationen der DNS-Moleküle mittels molekularbiologischer Techniken gemäß den Reduktionsregeln einer Reduktionsspräche, wobei das Ergebnismolekül in der Lösung identifiziert, extrahiert und ggf. vervielfältigt wird, und einer Sequenziervorrichtung zum Bestimmen der Sequenz des Ergebnismoleküls, wobei diese Sequenz an den Vorrechner weitergegeben wird und der Vorrechner die Sequenz dekodiert sowie die dekodierte Sequenz ausgibt.

Rechnersystem nach Anspruch 1, dadurch gekennzeichnet, daß es sich bei der Reduktionssprache um den λ-Kalkül handelt. Rechnersystem nach Anspruch 1 oder 2, dadurch gekennzeichnet, daß die im Reduktionsapparat umgesetzten molekularbiologischen Techniken Basisoperationen wie Insert-, Delete- und Substitute-Operationen umfassen.

Rechnersystem nach einem der Ansprüche 1 bis 3 , dadurch gekennzeichnet, daß die Ampliflkationsreaktion einen PCR- und/oder LCR-Prozeß aufweist.