WO1998047077A1 - Frei programmierbares, universelles parallel-rechnersystem zur durchführung von allgemeinen berechnungen - Google Patents

Frei programmierbares, universelles parallel-rechnersystem zur durchführung von allgemeinen berechnungen Download PDF

Info

Publication number
WO1998047077A1
WO1998047077A1 PCT/EP1998/002208 EP9802208W WO9847077A1 WO 1998047077 A1 WO1998047077 A1 WO 1998047077A1 EP 9802208 W EP9802208 W EP 9802208W WO 9847077 A1 WO9847077 A1 WO 9847077A1
Authority
WO
WIPO (PCT)
Prior art keywords
dna
sequence
reduction
computer
molecule
Prior art date
Application number
PCT/EP1998/002208
Other languages
English (en)
French (fr)
Inventor
Ralf Zimmer
Original Assignee
Gmd - Forschungszentrum Informationstechnik Gmbh
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Gmd - Forschungszentrum Informationstechnik Gmbh filed Critical Gmd - Forschungszentrum Informationstechnik Gmbh
Priority to DE59802537T priority Critical patent/DE59802537D1/de
Priority to EP98920526A priority patent/EP0976060B1/de
Publication of WO1998047077A1 publication Critical patent/WO1998047077A1/de

Links

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B82NANOTECHNOLOGY
    • B82YSPECIFIC USES OR APPLICATIONS OF NANOSTRUCTURES; MEASUREMENT OR ANALYSIS OF NANOSTRUCTURES; MANUFACTURE OR TREATMENT OF NANOSTRUCTURES
    • B82Y10/00Nanotechnology for information processing, storage or transmission, e.g. quantum computing or single electron logic
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/12Computing arrangements based on biological models using genetic models
    • G06N3/123DNA computing

Definitions

  • the invention relates to a freely programmable, universal parallel computer system for carrying out general calculations, a DNS or DNA computer being used in addition to an electronic computer.
  • a biopolymer is a structure polymerizable from monomers by defined methods.
  • the methods defined are, for example, enzymatic polymerization of nucleotides, peptides or sugar units.
  • the biopolymer subsystem provided according to the invention can therefore in particular be a DNA, RNA or PNA subsystem. Processing in the biopolymer subsystem can take place at the peptide or nucleotide level.
  • a freely programmable, universal parallel computer system for carrying out general calculations, which is provided with: an electronic front-end computer which allows the input of any programs which are therefore capable of specifying general calculations and which are implemented in terms of a reduction language and which is coded into a DNA sequence, a synthesis device which receives the encoded DNA sequence from the front-end computer and which synthesizes the DNA sequence into a corresponding DNA molecule with a specified nucleotide sequence, a promise 1 Not necessary to replicate the synthesized DNA molecule by means of an amplification reaction, a reaction device for simultaneously carrying out transformations of the DNA molecules by means of molecular biological techniques in accordance with the reduction rules of a reduction language, the resultant molecule being in the solution is identified, extracted and possibly reproduced, and - a sequencing device for determining the sequence of the result molecule, this sequence being passed on to the upstream computer and the upstream computer decoding the sequence and outputting the decoded sequence.
  • the freely programmable, universal parallel computer system is a combination of an electronic front-end computer and a DNS subsystem.
  • the electronic computer permits the input of any programs that are capable of specifying general calculations, and works on the basis of a functional programming language, that is, on the basis of a reduction language.
  • a "reduction language” is understood to mean, in particular, a functional programming language, the semantics of which are defined by meaningful transformations of the programs. LISP, Miranda and ML are examples of such functional languages. In this context, reference is also made to the literature reference [35].
  • An implementation of a reduction language in conventional hardware is described for example in DE-C-25 06 454 and DE-C-25 25 795.
  • the program is thus implemented in terms of a reduction language, and the coding thereof is carried out in a DNA sequence. Since reduction languages are string-oriented, they can advantageously be converted into a DNA sequence.
  • the encoded DNS sequence is now the input signal for the DNA subsystem, which consists of a synthesis device, a duplication device, a reaction device and a sequencing device.
  • the encoded DNA sequence is synthesized into a corresponding DNA molecule and duplicated.
  • the amplification reaction such as PCR or LCR, is used for the amplification.
  • the copied DNA molecules are transformed by means of molecular biological techniques, such as in particular the insert, delete and substitute operations.
  • the transformation again made use of a reduction language; the transformation therefore takes place in accordance with the reduction rules of this reduction language.
  • the result molecule is in the solution consisting of the transformed DNA molecules.
  • the fact that the result molecule is present can be recognized from the fact that the execution of further molecular biological processes does not bring about any changes in the molecules, that is to say the molecules can no longer be cloned.
  • the reduction rules of the reduction language are thus carried out, as far as the DNA subsystem is concerned, by the biotechnological process in the reaction device.
  • the advantage is that the transformation of the molecules can be carried out massively in parallel, since the transformations can be carried out simultaneously on a large number of DNA molecules.
  • the result molecule or, in general terms, a molecule in the solution can also be identified, extracted and, if necessary, reproduced using molecular biological techniques. If it is found that reduction operations can still be applied to the result molecule, the result molecule can be fed to the reaction device again after synthesis and duplication in order to carry out further reduction steps.
  • Each resultant molecule extracted from the reaction device is fed to a sequencing device which determines the sequence of the resultant molecule.
  • This sequence is passed on to the upstream computer, which decodes the sequence and displays or outputs the result of the decoding.
  • the ⁇ calculus is particularly suitable as a reduction language (see literature reference [2]). To particular This reduction language, but also in general to reduction languages, is explained further below under "The structure of a DNS computer”. The advantage of the ⁇ calculus is its extraordinary suitability for parallel processing. In principle, however, the invention can be used for all reduction languages.
  • the freely programmable, universal computer system according to the invention for carrying out general calculations is characterized in particular in that the calculations are carried out by molecular-biological transformation of DNA molecules, in that the calculations are carried out using combinator expressions of a reduction language (e.g.
  • the ⁇ calculus specified, coded by appropriate nucleotide sequences and realized by a DNA molecule determined in such a way that the calculations are carried out by special transformations of the DNA molecules by means of molecular biological techniques in accordance with the reduction rules of the underlying calculus, that the order of the elementary operations (reductions) is not, or is determined only by the causal data dependencies of the program, whereby the Church-Rosser property guarantees that the end result is clear, regardless of the specific order of execution, that the organization of the calculations du
  • the causal data dependencies are regulated, - that the independent execution of basic operations on several DNA molecules or several sections of the same DNA molecule can be carried out without explicit time synchronization, that the properties described above allow the efficient use of the large number of DNA molecules in one
  • the computer system consists of a conventional electronic front-end computer, a "gene machine”, a DNS computer as described above and a sequencing device, the front-end computer providing a programming environment which allows the input of any and thus
  • a realization of the DNA computer system as described above provides in particular that the reduction language expressions are converted into closed ⁇ expressions, so-called super combiners, - that specific incarnations of these super combiner expressions are generated by a special PCR / LCR procedure, so that the variables of the individual super combinator incarnations are clearly numbered and thus clearly identifiable, - that super combinator reductions are carried out by molecular biological techniques on the incarnations thus generated, as long as reductions are still possible, the program application also being clearly marked so that after interaction with the super combiners and the result of the specified transformation, the result can be clearly identified and extracted.
  • biopolymers in particular DNA molecules
  • DNA deoxyribonucleic acid
  • DNA deoxyribonucleic acid
  • DNA molecules has recently been proposed for solving combinatorial problems, including so-called NP-severe problems (DNA computing [1,3,20] and WO-A-97/07440).
  • NP-severe problems DNA computing [1,3,20] and WO-A-97/07440.
  • the enormous number of molecules is used to simultaneously try out all the coding of possible solutions using a few biotechnological operations.
  • the approach has the potential to push the boundaries of conventional computers by several orders of magnitude in this regard.
  • this approach is too simple to carry out general, arbitrary calculations and, in addition, the potential of the large number of DNA molecules in relatively small volumes is increased by the exponential growth of the operations required in such a simple one
  • FIG. 1 shows a schematic illustration as a block diagram of a functional DNS computer
  • Fig. 2 is a graphical representation of the basic operations used in the DNA subsystem of the DNA calculator (molecular biological techniques).
  • the DNS technology is used for universal calculations based on the ⁇ calculus. This fully exploits the strengths of DNS technology, namely a high degree of parallelism without the need for communication.
  • the functional calculation model can be implemented for the first time by an implementation corresponding to the model and can be provided with appropriate processor numbers.
  • the invention is therefore a hybrid system consisting of upstream electronics and DNS technology, which represents a universal functional computer. Many years of experience exist both in the area of the conceptual foundations of the ⁇ calculus and the reduction systems and in relation to the implementation of such systems using special hardware - so-called reduction machines - [6,7,16] and as an emulator / simulator on conventional ones Computers [17,34,35].
  • a programming system for program specification using mathematical function equations [22,23,24,32,33,35] is also available. Since the program execution is based on the meaning-preserving transformation of expressions, every intermediate step of calculations can be completely translated back into an expression of the programming language and thus analyzed by the user.
  • the DNS computer is constructed as in Fig. 1.
  • a pre- or host computer (left) of conventional technology specifies and organizes the functional calculation. If necessary, he carries out analyzes regarding the required resources in terms of DNS volume and time.
  • the DNA component (right) consists of an apparatus that synthesizes DNA segments as specified, a reaction apparatus and an apparatus that analyzes (reads out) the reaction result. The latter device has a connection back to the host computer. The following things are particularly advantageous for the DNS computer:
  • the functional program can be specified in a high functional programming language [31,25,27].
  • the existing development system can be used as a programming system and interface to the DNS computer system. Programs can be developed, tested through step-by-step execution, and interactively validated on small problem instances [22, 23, 27, 35], before finally being passed on to the DNS subsystem for complex production runs.
  • the interfaces of the host system to standard operating systems enable the use of the DNS component as a "computer server" for conventional program systems.
  • the upstream computer first compiles the functional program.
  • transliteration means the calculation of the appropriate coding of program parts in DNS strings and the generation of the instructions for the DNA synthesis apparatus.
  • the DNS
  • Synthesis equipment generates the strings according to the specifications of the host computer.
  • the boundary conditions for the reaction could also be calculated by the host computer.
  • Control information can also be generated here as part of the compilation in the host computer.
  • the output information is returned to the front-end computer and decoded (de-translation).
  • IT and molecular biological aspects are closely interlinked.
  • DNS coding for functional programs is required and must be adapted to the compilation [35].
  • models should be developed which allow the molecular biological reactions in the DNA to be analyzed, because the quality of DNA coding can only be estimated on the basis of knowledge of what actually happens in the DNA solution.
  • FIG. 2 A realization of this basic operation by means of DNS operations is shown graphically in FIG. 2:
  • a normal form of a program expression (encoded as a DNS string) is a meaning-equivalent expression (also a DNS string) that no longer contains an applicable reduction.
  • a functional program specification is reduced to its importance (the program result).
  • This program result must be identified, selected for return to the host and translated back.
  • the mechanisms for the clear back-translation (transliteration) [24,35] of reduction language expressions in abstract machine code for conventional computing architectures have been developed and tested in the above-mentioned reduction machine projects.
  • a targeted duplication of the argument, the finding of variables in the body of the function by matching and the orderly replacement of the variables by the argument expression must be implemented.
  • ⁇ calculus using DNA and in particular the use of the specific properties of the ⁇ calculus for a massively parallel, asynchronously working and decentrally organized computing system through a combined electronic / biological machinery and basic biotechnological operations to implement the massively parallel steps.
  • the proposed biological subsystem of storing the information (program and data) as strings in DNA molecules and their concurrent processing by operations on a myriad of independent sequences / molecules contained in a buffer solution in a reactor prohibits the assumption of a central control body or detailed control of the individual calculation steps.
  • a calculation concept of self-organization in take such arrangements into account and implement the desired calculations using appropriate organizational concepts.
  • the exact design of the component is therefore of minor importance for the implementation of the DNA calculator according to the invention and is strongly dependent on the further progress of the biotechnological processes and their error rate.
  • the proposed computer can be adapted directly to changing technologies and new methods by adapting the implementation of the programming language expressions in DNA strings (i.e. specifically the code generation component of the compiler) for the synthesis device accordingly.
  • the proposed concept is therefore also universal in the respect that new basic technologies can easily be used for new generations of the proposed hybrid computer.
  • f (n) if ( ⁇ l) then 1 else f ( ⁇ -1) + f (n-2)
  • f in is the ⁇ th number of the sequence.
  • the two-digit constructor REC binds the following variable recursively, SUB not recursively in the function body.
  • the applicator AP specifies the application of the function mentioned to the following arguments.
  • the single-digit constructors VAR and INT indicate the type of the following construct.
  • Table 1 lists the DNA coding of the two-digit constructors used here:
  • AAA.AAA REC ⁇ variable> ⁇ expr>
  • AAA.AGG AP ⁇ expr> ⁇ expr>
  • Table 1 DNA coding of two-digit constructors
  • Table 2 The codes of the single-digit constructors used here are given in Table 2:
  • Variable names ⁇ string> and function identifiers ⁇ func-id> can be numbered and coded like numbers ⁇ number> and characters ⁇ string>.
  • Individual digits of the dual system are encoded by three nucleotides (as codon), '0' as -'CCC and '1' as 'TTT', of course a " nucleotide would suffice, but the redundancy is increased by using more nucleotides Depending on the susceptibility to errors of the biotechnological operations, the redundancy can be improved by using longer codings (extended codons or using more codons per digit) or by a larger Hammig spacing of the coding or adapted to the special circumstances of the biotechnological operations used.
  • start and end markers In order to allow compact encoding of any number of characters and numbers, they are encoded by a binary representation with a start (CAC) and an end marker (ACA).
  • CAC start
  • ACA end marker
  • the technology of the start and end markers can also be used for the constructors, on the one hand to obtain a more compact coding or on the other hand to enable the installation of restriction interfaces to split the expressions into their syntax components.
  • the following table 3 shows the codes used here.
  • the result can be extracted from the buffer solution using the MAIN label (ACGTACGT) so that the result of the calculation is a number (GGG.AAG) in binary coding (10101011000010).
  • the translation of the binary coding results in the number 10946 as a result of the overall calculation.
  • the compiler has identified two expressions f (n-1) and f (n-2) that can be executed independently of one another and has abstracted them using a special ⁇ abstraction ( ⁇ * or SUB *) and marked them for distribution.

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Nanotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Chemical & Material Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

Das frei programmierbare, universelle Parallel-Rechnersystem zur Durchführung von allgemeinen Berechnungen weist einen elektronischen Vorrechner auf, der die Eingabe beliebiger und damit zur Spezifikation allgemeiner Berechnungen fähiger Programme erlaubt, deren Umsetzung in Ausdrücke einer Reduktionssprache realisiert und deren Kodierung in eine DNS-Sequenz vornimmt. Eine Synthesevorrichtung empfängt die DNS-Sequenz und synthetisiert sie in ein entsprechendes DNS-Molekül mit einer spezifizierten Nukleotidabfolge. Mittels einer Vervielfältigungsvorrichtung wird das Synthetisierte DNS-Molekül durch eine Amplifikationsreaktion vervielfältigt. Ferner weist das Rechnersystem eine Reaktionsvorrichtung zum gleichzeitigen Ausführen von Transformationen der DNS-Moleküle mittels molekularbiologischer Techniken gemäß den Reduktionsregeln einer Reduktionssprache auf, wobei das Ergebnismolekül in der Lösung identifiziert, extrahiert und ggf. vervielfältigt wird. Außerdem ist eine Sequenziervorrichtung zum Bestimmen der Sequenz des Ergebnismoleküls vorgesehen, wobei diese Sequenz an den Vorrechner weitergegeben wird und der Vorrechner die Sequenz dekodiert sowie die dekodierte Sequenz ausgibt.

Description

Frei programmierbares, universelles
Parallel-Rechnersvstem zur Durchführung von allgemeinen Berechnungen
Die Erfindung betrifft ein frei programmierbares, universelles Parallel-Rechnersystem zur Durchführung von allgemeinen Berechnungen, wobei neben einem elektronischen Rechner ein DNS- bzw. DNA-Rechner eingesetzt wird.
Die Erfindung wird nachstehend anhand der Verwendung eines DNA- bzw. DNS-Subsystems beschrieben, ist aber über die DNA hinaus grundsätzlich bei sämtlichen Biopolymeren anwendbar. Ganz allgemein ausgedrückt handelt es sich bei einem Biopolymer um eine durch definierte Methoden aus Monomeren polymerisierbare Struktur. Bei den definierten Methoden handelt es sich beispielsweise um enzymatische Polymerisation von Nukleotiden, Peptiden oder Zuckereinheiten. Das nach der Erfindung vorgesehene Biopolymer- -Subsystem kann also insbesondere ein DNA-, RNA- oder PNA- Subsystem sein. Die Verarbeitung im Biopolymer-Subsystem kann auf Peptid- oder Nukleotid-Ebene erfolgen.
Stand der Technik: Biologie und Biotechnologie
Durch die großen Fortschritte in der modernen Molekularbiologie [8] und der molekularen Bio- und Gentechnologie sind gewisse Operationen auf DNS-Molekülen bzw. Ensembles von DNS-Molekülen routinemäßig, zum Teil mit automatisierten Apparaten durchführbar geworden.
Die biologischen Prinzipien der DNS-Replikation und Transkription sind durch die Arbeiten von A. Kornberg und anderen seit den fünfziger Jahren mittlerweile sehr gut verstanden [18] . Auch die Funktionsweise und die Handhabung der entsprechenden Enzyme, die diese Operationen durchführen, sind aufgeklärt und werden in der Bio- und Gentechnologie technisch genutzt.
Zu diesen Standardoperationen gehören: das Schneiden von DNS-Molekülen an sehr spezifischen durch die Sequenz definierten Stellen durch Restriktionsenzyme, das Verbinden (Ligieren) zweiter solcher Ketten durch das Enzym Ligase, das gezielte Einsetzen von DNS-Stücken an definierte Stellen in einem anderen DNS-Molekül (Klonierung) , das schnelle und vielfache Kopien von DNS- Molekülen durch einen automatisierten Prozeß (die sog. PCR = Polymerase chain reaction, Polymerasekettenreaktion) , die gezielte Generierung (Synthese) von DNS-Molekülen vorgegebener Sequenz und ähnliche Operationen werden heutzutage in vielen Labors, aber auch großtechnisch eingesetzt und perfektioniert, z. B. im Rahmen der Genomprojekte .
Da ein Liter einer in solchen Experimenten verwendeten DNS-Lösung (von etwa 6 g DNS pro Liter) ca. 6 * 101S Moleküle mit jeweils ca. 200 Basenpaaren (bp) enthält, entspricht eine solche Lösung einer theoretischen Informationsspeicherkapazität von 3 * 109 TeraByte/1. Diese Speicherkapazität übertrifft damit heutige elektronische bzw. magnetooptische Speicher um mehr als das Millionenfache.
Bei einem realistischen Zeitansatz für eine biotechnologische Basisoperation von einer Minute (z. B. für eine PCR (= Polymerase chain reaction, Polymerasekettenreaktion) ergeben sich, bei einer simultanen Anwendung auf alle Moleküle in einer solchen Lösung theoretisch etwa 6 * 10" Operationen pro Minute, d. h. etwa 1 Million Tera Operationen/sec . Die leistungs- fähigsten derzeitigen Supercomputer erreichen kaum Geschwindigkeiten von Tera Operationen/sec bei kaum 1 Tera Byte verfügbarem Speicher.
Insgesamt schätzt man, daß die biologischen Operationen auf DNS gegenüber elektronischen Basisoperationen etwa um den Faktor 109 energieeffizienter sind, um den Faktor 1012 mehr Speicher erlauben (bei der heute technisch erreichbaren Speicherdichte elektronischer und magnetooptischer Systeme) , und um den Faktor 10 15 mehr Prozessoren realisierbar machen.
Wenn man die Leistungsfähigkeit eines Rechnersystems als das Produkt der Zahl der Prozessoren und der von jedem Prozessor ausführbaren Operationen pro Zeiteinheit definiert, ergibt sich bei herkömmlichen Rechnern etwa 100 * 1010 = 1 Tera Operation/sec, wohingegen bei DNS- basierten Systemen (Standard-DNS-Konzentration) 60 * 1017 = 6 Millionen Tera Operationen möglich sind.
Stand der Technik: Informatik
Die Entwicklung der Informatik hat zwei alternative, gleich mächtige Berechnungsmodelle hervorgebracht, das zustandsorientierte Modell der Turingmaschine [30] und das funktionale Modell des λ-Kalküls [9,10,11] . Beide Modelle sind bis heute intensiv theoretisch untersucht worden [2,12,15], das funktionale vor allem im Zusammenhang mit der Verifikation von Programmen [21] und der formalen (denotationellen) Semantik [13,29] von Programmier- sprachen. Praktisch basieren jedoch alle heutigen Rechnerarchitekturen auf dem zustandsorientierten Modell [19] . Die elektronische Technologie und Chipentwicklung ist jahrzehntelang auf dieses Modell hin optimiert worden [26] . Das alternative Berechnungsmodell des λ-Kalküls basiert auf der geordneten Transformation von Ausdrücken (Replikation und Substitution) mittels Reduktionssprachen [6,7,16,17,33,34,35] . Obwohl dieses Modell aufgrund seiner mathematischen Eleganz- und Einfachheit viele praktische Vorteile für die Organisation, Programmierung, Fehlersuche und Verifikation bzw. Validierung von Berechnungen gegenüber der Zustandstransformation aufweist [28,35,36,37] (siehe auch DE-C-25 06 454 und DE-C-25 25 795) , konnte es sich gegenüber der vorherrschenden Technologie, auf die es abgebildet werden mußte, bis jetzt nicht durchsetzen. Dies erscheint aus heutiger Sicht auch verständlich, wenn man beachtet, wie disparat die heutige Siliziumtechnologie und das Berechnungsmodell des λ-Kalküls sind.
Durch die Arbeiten von Adleman [1] und Lipton [20] sowie die PCT-Publikation WO-A-97/07440 ist eine Möglichkeit aufgezeigt worden, DNS-Technologie zur Grundlage einer neuen Art von Berechnungen zu machen. Sowohl Adleman als auch Lipton wenden die Technologie auf das zustands- orientierte Berechnungsmodell an. Es gibt sogar Arbeiten, die explizit darauf zielen, Turingmaschinen in DNS abzubilden [4,5] . Dies bereitet allerdings erhebliche Schwierigkeiten und führt dazu, daß bis heute keine universellen DNS-Rechner konzipiert werden, sondern daß vielmehr DNS-Rechner nur für Spezialaufgaben, etwa in der Kryptographie, vorgeschlagen werden. Diese Spezial- ausrichtung begrenzt den Einsatz der Rechner und damit die Effektivität der DNS-Technologie.
Kurze Beschreibung der Erfindung
Überraschenderweise ist es möglich, die Vorzüge der Effizienz biologischer Operationen auf DNS-Moleküle durch
Kombination eines DNS-Rechners mit einem elektronischen Vorrechner zu nutzen, bei dem die Umsetzung des Programms durch eine Reduktionssprache, insbesondere nach dem λ-Kalkül erfolgt. Das Wesen und die Vorteile derart organisierter Rechner mit Reduktionssprachen, also funktional organisierten und arbeitenden Rechners ist z. B. in [35] beschrieben.
Nach der Erfindung ist also ein frei programmierbares, universelles Parallel-Rechnersystem zur Durchführung von allgemeinen Berechnungen vorgesehen, das versehen ist mit: einem elektronischen Vorrechner, der die Eingabe beliebiger und damit zur Spezifikation allgemeiner Berechnungen fähiger Programme erlaubt, deren Umsetzung in Ausdrücke einer Reduktionssprache realisiert und deren Kodierung in eine DNS-Sequenz vornimmt , einer Synthesevorrichtung, die die kodierte DNS- Sequenz von dem Vorrechner empfängt und die die DNS- Sequenz in ein entsprechendes DNS-Molekül mit einer spezifizierten Nukleotidabfolge synthetisiert, einer Ve rvie 1 f äl t igungsvorr i cht ung zum Vervielf ltigen des synthetisierten DNS-Moleküls mittels einer Ampliflkationsreaktion, einer Reaktionsvorrichtung zum gleichzeitigen Ausführen von Transformationen der DNS-Moleküle mittels molekularbiologischer Techniken gemäß den Reduktionsregeln einer Reduktionssprache, wobei das Ergebnismolekül in der Lösung identifiziert, extrahiert und ggf. vervielfältigt wird, und - einer Sequenziervorrichtung zum Bestimmen der Sequenz des Ergebnismoleküls, wobei diese Sequenz an den Vorrechner weitergegeben wird und der Vorrechner die Sequenz dekodiert sowie die dekodierte Sequenz ausgibt. Bei dem erfindungsgemäßen frei programmierbaren, universellen Parallel-Rechnersystem handelt es sich um eine Kombination aus einem elektronischen Vorrechner und einem DNS-Subsystem. Der elektronische Rechner läßt die Eingabe beliebiger und damit zur Spezifikation allgemeiner Berechnungen fähiger Programme zu, wobei er auf der Basis einer funktionalen Programmiersprache, also auf der Basis einer Reduktionssprache arbeitet. Unter einer "Reduktionssprache" versteht man also insbesondere eine funktionale Programmiersprache, deren Semantik durch bedeutungs- erhaltende Transformationen der Programme definiert sind. Als Beispiel für derartige funktionale Sprachen seien hier beispielsweise LISP, Miranda und ML genannt. Ferner wird in diesem Zusammenhang auf die Literaturstelle [35] verwiesen. Eine Implementierung einer Reduktionssprache in konventioneller Hardware ist beispielsweise in DE-C-25 06 454 und DE-C-25 25 795 beschrieben.
In dem elektronischen Vorrechner des erfindungsgemäßen Parallel -Rechnersystems wird also das Programm in Ausdrücke einer Reduktionssprache umgesetzt so wie deren Kodierung in eine DNS-Sequenz vorgenommen. Da Reduktions- sprachen string-orientiert sind, lassen sie sich vorteilhaft in eine DNS-Sequenz umsetzen. Die kodierte DNS- Sequenz ist nun das Eingangssignal für das DNS-Subsystem, das auf einer Synthesevorrichtung, einer Vervielfältigungsvorrichtung, einer Reaktionsvorrichtung sowie einer Sequenziervorrichtung besteht. Um mit dem DNS- Subsystem parallel arbeiten zu können, wird die kodierte DNS-Sequenz in ein entsprechenden DNS-Molekül synthetisiert und vervielfältigt . Bei der Vervielfältigung bedient man sich einer Ampliflkationsreaktion, wie beispielsweise der PCR bzw. LCR. Mittels molekularbiologischer Techniken, wie insbesondere den Insert-, Delete- und Substitute-Operationen werden die kopierten DNS-Moleküle transformiert. Bei dieser Transformation wird wiederum von einer Reduktionssprache Gebrauch gemacht; die Transformation erfolgt also entsprechend den Reduktions- regeln dieser Reduktionssprache . Wenn keine Reduktionen mehr möglich sind, liegt das Ergebnismolekül in der aus den transformierten DNS-Molekülen bestehenden Lösung vor. Daß das Ergebnismolekül vorliegt, kann daran erkannt werden, daß die Ausführung weiterer molekularbiologischer Prozesse keine Veränderungen der Moleküle mit sich bringt, die Moleküle also nicht mehr kloniert werden können. Die Reduktionsregeln der Reduktionssprache werden also, was das DNS-Subsystem betrifft, durch den biotechnologischen Prozeß in der Reaktionsvorrichtung ausgeführt. Der Vorteil ist, daß die Transformation der Moleküle massiv parallel durchgeführt werden kann, da die Transformationen gleich- zeitig auf eine Vielzahl von DNS-Molekülen ausgeführt werden können .
Durch ebenfalls molekularbiologische Techniken kann das gesuchte Ergebnismolekül bzw. allgemein ausgedrückt ein Molekül in der Lösung identifiziert, extrahiert und ggf. vervielfältigt werden. Sollte man dabei feststellen, daß sich auf das Ergebnismolekül noch Reduktionsoperationen anwenden lassen, so kann man das Ergebnismolekül nach Synthetisierung und Vervielfältigung erneut der Reaktions- Vorrichtung zuführen, um weitere Reduktionsschritte durchzuführen.
Jedes aus der Reaktionsvorrichtung extrahierte Ergebnismolekül wird einer Sequenziervorrichtung zugeführt, die die Sequenz des Ergebnismoleküls bestimmt. Diese Sequenz wird an den Vorrechner weitergegeben, der die Sequenz dekodiert sowie das Ergebnis der Dekodierung anzeigt oder ausgibt .
Als Reduktionssprache eignet sich insbesondere der λ-Kalkül (siehe Literaturstelle [2] ) . Zu insbesondere dieser Reduktionssprache, aber auch allgemein zu Reduktionssprachen ist weiter hinten unter "Der Aufbau eines DNS-Rechners" Näheres ausgeführt. Der Vorteil des λ-Kalküls besteht in seiner außerordentlichen Eignung zur Parallelverarbeitung. Grundsätzlich ist aber die Erfindung für sämtliche Reduktionssprachen anwendbar.
Das erfindungsgemäße, frei programmierbare, universelle Rechnersystem zur Durchführung von allgemeinen Berechnungen zeichnet sich also insbesondere dadurch aus, daß die Berechnungen durch molekularbiologische Transformation von DNS-Molekülen realisiert wird, daß die Berechnungen durch Kombinatorausdrücke einer Reduktionssprache (z. B. dem λ-Kalkül) spezifiziert, durch entsprechende Nukleotidsequenzen kodiert und durch ein dadurch bestimmtes DNS-Molekül realisiert sind, daß die Berechnungen durch spezielle Transformationen der DNS-Moleküle mittels molekularbiologischer Techniken gemäß den Reduktionsregeln des unterliegenden Kalküls vorgenommen werden, daß die Reihenfolge der Elementaroperationen (Reduktionen) nicht, bzw. nur durch die kausalen Datenabhängigkeiten des Programms, festgelegt ist, wobei die Church-Rosser-Eigenschaft garantiert, daß das Endergebnis unabhängig von der konkreten Ausführungsreihenfolge eindeutig ist, daß die Organisation der Berechnungen durch die kausalen Datenabhängigkeiten geregelt wird, - daß die unabhängige Ausführung von Basisoperationen auf mehreren DNS-Molekülen oder mehreren Abschnitten desselben DNS-Moleküls ohne explizite zeitliche Synchronisation durchgeführt werden kann, daß die oben beschriebenen Eigenschaften die effiziente Nutzung der großen Zahl der in einer
Lösung vorhandenen DNS-Moleküle ermöglicht, ohne einen aufwendigen, schwer realisierbaren und das Berechnungspotential erheblich reduzierenden Sequentialisierungsmechanismus in dem DNS-Lösung- System etablieren zu müssen, - daß Berechnungen im Prinzip (bis auf die Datenabhängigkeiten) auf allen DNS-Molekülen in der verfügbaren Lösung unabhängig (parallel, simultan, nebenläufig) ausgeführt werden.
Das erfindungsgemäße Rechnersystem besteht aus einem herkömmlichen elektronischen Vorrechner, einer "Gen- maschine", einem DNS-Rechner wie oben beschrieben und einer Sequenziervorrichtung, wobei der Vorrechner eine Programmierumgebung zur Verfügung stellt, die die Eingabe beliebiger und damit zur
Spezifikation allgemeiner Berechnungen fähiger Programme erlaubt, die Umsetzung in Ausdrücke einer Reduktionssprache realisiert, und eine Kodierung in eine DNS-Sequenz vornimmt und diese DNS-Sequenz an eine Synthesevorrichtung weitergibt, die Synthesevorrichtung ("Genmaschine") eine beliebige DNS-Sequenz in ein entsprechendes DNS- Molekül mit der spezifischen Nukleotidabfolge synthetisiert , - das synthetisierte Molekül (das Programm) durch beispielsweise eine Ampliflkationsreaktion wie LCR- und/oder PCR-Prozeß geeignet vervielfältigt wird, die so erzeugten DNS-Moleküle zur Ausführung von Berechnungen wie oben beschrieben benutzt werden, - das Ergebnismolekül in der Lösung identifiziert, extrahiert und ggf. vervielfältigt wird, ein Sequenzierprozeß z. B. mittels einer herkömmlichen Sequenziervorrichtung, die Sequenz des Ergebnismoleküls bestimmt und die Sequenz an den Vorrechner weitergegeben wird, der Vorrechner die berechnete Sequenz dekodiert und dem Benutzer das Ergebnis der Berechnung geeignet präsentiert.
Eine Realisierung des DNS-Rechnersystem wie oben beschrieben sieht insbesondere vor, daß die Reduktionssprachenausdrücke in geschlossene λ-Ausdrücke, sog. Superkombinatoren, umgesetzt werden, - daß spezifische Inkarnationen dieser Superkombinator- ausdrücke durch eine spezielle PCR-/LCR-Prozedur erzeugt werden, so daß die Variablen der einzelnen Superkombinatorinkarnationen eindeutig numeriert und damit eindeutig identifizierbar sind, - daß Superkombinatorreduktionen durch molekularbiologische Techniken auf den so erzeugten Inkarnationen ausgeführt werden, solange noch Reduktionen möglich sind, wobei die Programmapplikation ebenfalls eindeutig markiert wird, so daß nach Interaktion mit den Superkombinatoren und der dadurch spezifizierten Transformation das Ergebnis eindeutig identifiziert und extrahiert werden kann.
Eine Realisierung für die Basisoperation der Substitution kann durch Restriktionsenzyme erfolgen wie in [35] theoretisch beschrieben (siehe hierzu auch Fig. 2) .
Die Realisierung für die Basisoperation der Substitution kann auch durch Hybridisierung (Stickermodell) wie in [35] theoretisch beschrieben erfolgen.
Mit der Erfindung wird also ein Computer vorgeschlagen, der frei programmierbar und in der Lage ist, allgemeine Berechnungen durchzuführen, und sich von herkömmlichen elektronischen Rechnern dadurch unterscheidet, daß die Informationsspeicherung durch Biopolymere, insbesondere DNS-Moleküle (DNS = Desoxyribonukleinsäure, auch DNA = Desoxyribo-Nuclein-Acid) vorgenommen wird, - daß die Basisoperationen durch biologische bzw. biotechnologische Techniken auf den kodierenden Biopolymeren, insbesondere den DNS-Molekülen durchgeführt werden, und daß die Berechnung durch Kombinationsausdrücke einer Reduktionssprache, wie z. B. dem λ-Kalkül organisiert wird.
Letzteres hat den Vorteil, daß im wesentlichen nur eine einzige Operation, die Substitution von freien Variablen durch Ausdrücke, realisiert -werden muß, um ein universelles Berechnungssystem zu implementieren. Außerdem garantiert eine inhärente Eigenschaft des λ-Kalküls, die sog. Church-Rosser-Eigenschaft , daß das Endergebnis von Berechnungen, unabhängig von der konkreten Reihenfolge der Basisoperationen eindeutig ist. Das unterscheidet λ-Kalkül-basierte (funktionale) Systeme wesentlich von allen herkömmlichen Rechnern, die auf dem Prinzip der Turingmaschine (Zustandstransformation) aufgebaut sind, und erlaubt erst die effiziente Nutzung des in der DNS- Technologie liegenden Vorteils der unabhängigen Ausführung von Berechnungen auf 1017 oder mehr Molekülen innerhalb eines Rechenapparates. Bei herkömmlichen Rechnern entsteht das bereits von Parallelrechnern mit nur wenigen (hundert) Prozessoren bekannte Problem, die Berechnung so zu kontrollieren und zu programmieren, daß unerwünschte Seiteneffekte nicht zu indeterministischen Ergebnissen führen. Für viele kooperierende Prozesse in herkömmlichen Systemen ist das entstehende organisatorische Problem sehr schwierig, mit großem Programmieraufwand verbunden, notorisch unsicher, und durch die notwendigen Synchronisationen der einzelnen Berechnungen auch ineffizient. Für Größenordnungen, wie sie bei molekularen Systemen entstehen, sind die Probleme praktisch unlösbar. Durch das hier vorgeschlagene System werden diese Probleme vermieden und DNS-Operationen effizient für praktische Berechnungen nutzbar.
Die Nutzung von DNS-Molekülen ist kürzlich zur Lösung kombinatorischer, einschließlich sog. NP-schwerer Probleme vorgeschlagen worden (DNA Computing [1,3,20] und WO-A-97/07440) . Die enorme Anzahl von Molekülen wird dabei dazu eingesetzt, simultan alle Kodierungen möglicher Lösungen mittels einiger weniger biotechnologischer Operationen durchzuprobieren. Der Ansatz hat das Potential, die Grenzen konventioneller Computer in dieser Hinsicht um mehrere Größenordnungen hinauszuschieben. Andererseits ist dieser Ansatz zu einfach, um allgemeine, beliebige Rechnungen auszuführen und zudem wird das Potential der großen Zahl von DNS-Molekülen in relativ kleinen Volumina durch das exponentielle Anwachsen der benötigten Operationen bei einem solchen einfachen
Durchprobierungs (Enumerat ions ) -Verfahren schnell aufgezehrt .
Demgegenüber wird ein universelles, frei programmierbares System vorgeschlagen, das nicht nur diese Nachteile vermeidet und ein konzises Konzept zur Nutzung massiver Nebenläufigkeit (Parallelität) , zur effizienten Arbeitslastverteilung auf viele Prozessoren ohne unnötige Synchronisation und Kommunikation einschließt, sondern auch einfach mit DNS realisiert werden kann. Es ist sogar so, daß die oben erwähnte Basisoperation des λ-Kalküls, d. h. eine Transformation eines durch eine Zeichensequenz kodierten Ausdrucks des λ-Kalkül in einen anderen ebenfalls durch eine Zeichensequenz kodierten Ausdruck, sich geradezu für eine Implementierung durch Zeichenketten, wie sie in DNS-Molekülen zur Speicherung und Verarbeitung in allen biologischen Organismen verwendet werden, anbietet.
Das verkehrt die bisherigen Nachteile funktionaler Systeme, die auf herkömmlichen elektronischen Systemen emuliert werden mußten, ins Gegenteil, da die zustands- transformierenden Systeme praktisch unlösbare Probleme mit der massiven Parallelverarbeitung implizieren.
Nachfolgend wird anhand der Zeichnung ein Ausführungs- beispiel der Erfindung näher erläutert . Im einzelnen zeigen:
Fig. 1 eine schematische Darstellung als Blockschalt- bild eines funktionalen DNS-Rechners, und
Fig. 2 eine graphische Darstellung der im DNA-Subsystem des DNS-Rechners verwendeten Basisoperationen (molekularbiologische Techniken) .
Systemkonze t
Bei dem Ausführungsbeispiel wird die DNS-Technologie für universelle Berechnungen auf der Basis des λ-Kalküls eingesetzt. Damit werden die Stärken der DNS-Technologie, nämlich ein hoher Grad an Parallelität ohne Kommunikationsbedarf, voll ausgenutzt. Außerdem kann das funktionale Berechnungsmodell zum ersten Mal durch eine dem Modell entsprechende Implementierung realisiert und mit angemessenen Prozessorzahlen versehen werden. Bei der Erfindung handelt es sich also um ein hybrides System aus vorgeschalteter Elektronik und DNS-Technologie stehen, das einen universellen funktionalen Rechner darstellt. Es existieren langjährige Erfahrungen sowohl im Bereich der konzeptuellen Grundlagen des λ-Kalküls und der Reduktionssysteme als auch in Beziehung auf die Implementierung solcher Systeme mittels spezieller Hard- wäre - sog. Reduktionsmaschinen - [6,7,16] und als Emulator/Simulator auf konventionellen Rechnern [17,34,35]. Außerdem steht ein Programmiersystem zur Programmspezifikation mittels mathematischer Funktions- gleichungen [22,23,24,32,33,35] zur Verfügung. Da die Programmausführung auf der bedeutungserhaltenden Transformation von Ausdrücken beruht, kann jeder Zwischen- schritt von Berechnungen wieder vollständig in einen Ausdruck der Programmiersprache zurückübersetzt und damit vom Benutzer analysiert werden.
Die effiziente Ausführung solcher Programme auf herkömmlichen Parallelrechnern kann mittels einer vollständig systemgesteuerten Arbeitslastverteilung [34,35] durchgeführt werden. Dabei unterscheiden sich "parallele" nicht von "sequentiellen" Programmen; das Problem der "Parallelisierung" und der zugehörige Korrektheitsnachweis entfällt daher für den Programmierer.
Der Aufbau eines DNS-Rechners
Der DNS-Rechner ist wie in Fig. 1 aufgebaut. Ein Vor- oder Host-Rechner (links) konventioneller Technologie spezifiziert und organisiert die funktionale Berechnung. Er führt ggf. Analysen hinsichtlich der benötigten Ressourcen an DNS-Volumen und Zeit durch. Die DNS- Komponente (rechts) besteht aus einer Apparatur, die DNS- Segmente nach Vorgabe synthetisiert, einem Reaktionsapparat und einer Apparatur, die das Reaktionsergebnis analysiert (ausliest) . Letztere Apparatur hat eine Verbindung zurück zum Host -Rechner . Für den DNS-Rechner sind insbesondere die folgenden Dinge von Vorteil :
Das funktionale Programm kann in einer hohen funktionalen Programmiersprache [31,25,27] spezifiziert werden. Das vorhandene Entwicklungssystem kann als Programmiersystem und Schnittstelle zum DNS-Rechnersystem eingesetzt werden. Dabei können Programme entwickelt, durch schrittweise Ausführung getestet und interaktiv an kleinen Probleminstanzen validiert werden [22,23,27,35], um sie schließlich für aufwendige Produktionsläufe an das DNS-Subsystem zu übergeben. Die Schnittstellen des Host-Systems zu Standard-Betriebssystemen ermöglichen die Nutzung der DNS-Komponente als "Computer Server" für herkömmliche Programmsysteme.
Der Vorrechner kompiliert zunächst das funktionale Programm. Transli teration bedeutet hier die Berechnung der geeigneten Kodierungen von Programmteilen in DNS-Strings und die Generierung der Anweisung für die DNS-Synthese -Apparatur . Die DNS-
Synthese-Apparatur erzeugt die Strings nach den Vorgaben des Host -Rechners .
Dann wird dafür gesorgt (automatisch oder von Hand) , daß die DNS miteinander reagiert. Die Randbedingungen für die Reaktion (Zeit, Temperatur etc.) könnten auch vom Host -Rechner berechnet werden.
Nach der Reaktion wird das Ergebnis analysiert und die DNS-Strings, die die Ausgabe kodieren, werden selektiert. Auch hier können als Teil der Kompilation im Host-Rechner Steuerungsinformationen generiert werden.
Schließlich wird die Ausgabeinformation an den Vorrechner zurückgegeben und dekodiert (De- Trans - li tera tion) . Wie diesem Bild einer DNS-Rechnung entnommen werden kann, sind informatische und molekularbiologische Aspekte stark miteinander verzahnt. Auf der Informatikseite sind DNS- Kodierungen für funktionale Programme erforderlich und der Kompilation anzupassen [35] . Ferner sollten Modelle entwickelt werden, die die molekularbiologischen Reaktionen in der DNS zu analysieren gestatten, weil die Güte von DNS-Kodierungen nur auf der Basis von Wissen darüber geschätzt werden kann, was in der DNS-Lösung tatsächlich passiert.
Auf der molekularbiologischen Seite ist eine neue Art von Labortechnik basierend auf DNS-Replikation (PCR) und Selektion zu entwickeln. Ansätze hierfür gibt es bereits in den Konzepten von DNA Computing, wie es bis heute untersucht wird. Für ein (schon universelles) Basis- reduktionssystem ist nur eine einzige Operation notwendig: die Anwendung von Funktions- auf Argumentationsausdrücke. In Stringreduktionssystemen wird diese Basisoperation durch die sog. 3-Reduktion realisiert. Dabei wird der
Argumentausdruck einer Applikation für alle freien
Vorkommen einer Variablen im Rumpf der Abstraktion
(Funktion) eingesetzt. Der Argumentausdruck muß entsprechend oft repliziert werden.
Die Syntax des λ-Kalkül ist durch folgende Grammatik definiert :
E → v Variable
| c Konstante
| λv. E Funktionsdefinition
| @EE Funktionsanwendung Für die vollständige Beschreibung und praktische Durchführung von Berechnungen in einem funktionalen Basissystem ist nur eine Basisoperation, die Substitution F [v <= A] des Ausdrucks A für freie Vorkommen der Variablen v im Funktionsausdruck F notwendig [35] .
Formal ist die Semantik (Bedeutung) , d. h. auch die Berechnungen oder Reduktionen, von λ-Ausdrücken E durch die folgende Funktion m (E) spezifiziert:
wenn E = c I v I λv. F unverändert
Figure imgf000019_0001
F [v <- A] wenn E = @ λv. F A Funktions anwendung
Eine Realisierung dieser Basisoperation mittels DNS- Operationen ist graphisch in Fig. 2 dargestellt:
Die gesamte Programmausführung eines applikativen Programms ist nun eine (beliebige) Folge solcher ß-Reduktionen bis auf eine Normalform erreicht ist. Eine Normalform eines Programmausdrucks (kodiert als DNS- String) ist ein bedeutungsäquivalenter Ausdruck (ebenfalls ein DNS-String) , der keine anwendbare Reduktion mehr enthält. Man kann sagen, daß eine funktionale Programmspezifikation zu seiner Bedeutung (dem Programmergebnis) reduziert wird. Dieses Programmergebnis muß identifiziert, zur Rückgabe an den Host selektiert und zurückübersetzt werden. Die Mechanismen für die eindeutige Rückübersetzung (Transliterierung) [24,35] von Reduktionssprachen- ausdrücken in abstrakten Maschinencode für herkömmliche Rechenarchitekturen sind in den vorgenannten Reduktions- maschinenprojekten entwickelt und erprobt worden. Für eine DNS-Realisierung muß eine gezielte Duplizierung des Arguments, das Auffinden von Variablen im Funktionsrumpf durch Matching und das geordnete Ersetzen der Variablen durch den Argumentausdruck implementiert werden.
Bisherigen Konzepten von DNA Computing liegt das SIMD- Modell zugrunde. Das heißt, daß die Operationen synchronisiert ablaufen. Jede Reaktion dauert dabei etwa eine Stunde . Funktionale Programme erlauben aufgrund der Church-Rosser-Eigenschaft [2,17,15,35] den asynchronen Ablauf sich gegenseitig nicht störender Operationen. Das bedeutet, daß bei geeigneter Kodierung keine explizite Synchronisation stattfinden muß. Das würde die notwendige Berechnungszeit erheblich herabsetzen, z. B. auf eine Stunde für eine ganze Rechnung anstatt auf eine Stunde pro Rechenschritt. Daß sich die einzelnen Berechnungsschritte nicht stören, wäre wieder durch eine geeignete Kodierung zu sichern.
Das vorgeschlagene Konzept für eine neue Basis von Berechnungen und das neue hybride Rechnersystem stellt zum ersten Mal eine dem mathematisch eleganten Berechnungs- modell angepaßte "Hardwareplattform" zur Verfügung, die auch in natürlicher Weise die inhärente Nebenläufigkeit funktionaler Berechnungen unterstützt. Damit wird auch ein neues und erfolgversprechendes Konzept für die Nutzung "massiver Parallelität" vorgeschlagen.
Die bisher bestehenden Nachteile des DNA Computing, die vor allem daher rühren, daß man vollständige Enumeration auf der Basis des zustandsorientierten Modells vorschlägt, also Berechnungen durchführen will, die man nach der klassischen Technologie nie umsetzen würde, fallen hier weg. Bei einer funktionalen DNS-Berechnung wird tatsäch- lieh nur das berechnet, was das funktionale Programm auch in anderen Implementierungen ausführen würde. Das sollte die Anforderungen an das DNS-Volumen erheblich herabsetzen. Darüber hinaus würde durch eine asynchrone DNS- Berechnung die berechnungszeit , aber auch die Notwendigkeit expliziter externer Steuerung der Berechnung drastisch reduziert.
Der Inhalt der im Literaturverzeichnis aufgeführten Literaturstellen sowie der anderweitig zitierten Literatur wird hiermit durch Bezugnahme auch zum Inhalt der Erfindung gemacht.
1 Weiteres Ausführungsbeispiel 1.1 Vorbemerkung Nachfolgend wird ein weiteres Ausführungsbeispiel der Erfindung beschrieben, wobei die Umsetzung der Reduktions- sprache des Vorrechners in DNS-Systemen sowie deren Weiterverarbeitung zur Ausführung des Programms näher beschrieben sind. Dieses Ausführungsbeispiel bezieht sich auf eine
Implementierung eines universellen Berechnungskonzeptes
(λ-Kalkül) mittels DNA und insbesondere auf die Nutzung der spezifischen Eigenschaften des λ-Kalküls für ein massiv paralleles asynchron arbeitendes und dezentral organisiertes Rechensystem durch eine kombinierte elektronische/biologische Maschinerie und biotechnologische Basisoperationen zur Implementierung der massiv parallelen Schritte. Das vorgeschlagene biologische Subsystem der Speicherung der Information (Programm und Daten) als Strings in DNA-Molekülen und ihre nebenläufige Bearbeitung durch Operationen auf einer Unzahl unabhängiger Sequenzen/Moleküle, die in einem Reaktor gelöst in einer Pufferlösung enthalten sind, verbietet die Annahme einer zentralen Kontrollinstanz oder detaillierten Steuerung der einzelnen Berechnungsschritte. Im Gegenteil muß ein Berechnungskonzept der Selbstorganisation in solchen Anordnungen Rechnung tragen und durch entsprechende organisatorische Konzepte die erwünschten Berechnungen realisieren.
Die genaue Ausführung der Komponente ist deshalb für die erfindungsgemäße Implementierung des DNA-Rechners von untergeordneter Bedeutung und stark abhängig vom weiteren Fortschritt der biotechnologischen Verfahren und deren Fehlerrate. Der vorgeschlagene Rechner kann direkt an sich wandelnde Technologien und neue Verfahren angepaßt werden, indem die Umsetzung der Programmiersprachenausdrücke in DNA-Strings (d. h. konkret die Codegenerierungs-Komponente des Compilers) für die Synthesevorrichtung entsprechend angepaßt wird. Das vorgeschlagene Konzept ist also auch in der Hinsicht universell, daß neue Basistechnologien einfach für neue Generationen des vorgeschlagenen Hybridrechners genutzt werden können.
1.2 Systemkomponenten
Zur Illustration werden diese Vorteile des vorgeschlagenen Hybridrechners an einem konkreten Beispiel ausgeführt . Dabei werden die beiden wesentlichen Komponenten des Systems exemplarisch implementiert:
1. ein Ausführungsbeispiel für die Bearbeitung eines konkreten Programmausdrucks, der eine schon recht komplizierte zweifach rekursive Funktion spezifiziert, bestehend aus (a) der Spezifikation und Eingabe der Problemlösung als funktionales Programm mittels der syntaxgesteuerten Benutzerschnittstelle des herkömmlichen Computers, (b) die flexible und anpassungsfähige Umsetzung des Programms als String-Sequenz von Nukleotiden durch einen entsprechenden Compiler, der auf dem herkömmlichen Computer ausgeführt wird, als
Eingabe für die DNA-Synthesevorrichtung,
(c) die Synthese und Vervielfältigung der spezifizierten DNA-Moleküle in einer geeigneten Pufferlösung zur Durchführung der biotechnologischen Basisoperationen, die die nebenläufige, verteilte Aufteilung der Berechnung und die Ausführung der Berechnungen realisieren, (d) die Zusammensetzung der parallel berechneten
Teilergebnisse zu Gesamtlösungen,
(e) die Extraktion des DNA-Moleküls, das die Gesamt- lösung repräsentiert, aus dem Reaktor mit der Pufferlösung, mittels einer geeigneten Anker- sequenz,
(f) die Sequenzierung des extrahierten DNA-Moleküls und die Rückgabe der entsprechenden Sequenz an die elektronische Komponente, und
(g) die Dekodierung der Sequenz und ihre Umsetzung (Dekompilation) und Visualisierung mit Hilfe der
Benutzerschnittstelle .
2. die Erzeugung und Behandlung massiv paralleler Ausführungsstränge im DNA-Subsystem, bestehend aus (a) der Vorbereitung der nebenläufig ausführbaren
Programmteile durch entsprechende Identifizierung und Abstraktion der Ausdrücke während der Übersetzung (Compiler) auf dem herkömmlichen Rechner. Das kann sowohl durch systemgesteuerte Analyse des spezifizierten
Programmausdrucks als auch durch explizite Benutzerannotationen durchgeführt werden, (b) der Ausführung der entsprechenden Aufteilungs- Funktionen (dis) . Das führt im Bio-Subsystem zur Aufteilung des jeweiligen Gesamtmoleküls in mehrere DNA-Moleküle, dem Haupttemplate und zwei (oder mehr) DNA-Molekülen, die völlig unabhängig voneinander in der Pufferlösung bearbeitet werden können,
(c) der rekursiven Anwendung des Aufteilungsschemas nebenläufig mit den zugehörigen sequentiellen
Berechnungen. Das führt theoretisch zu einer riesigen Zahl unabhängiger Prozesse, die nur durch die kausalen Abhängigkeiten der Problemstellung und die in der Pufferlösung zur Verfügung gestellten Ressourcen praktisch begrenzt ist . Diese Ressourcen können in der Programmvervielfältigungsphase (PCR-Schritt nach der Synthese der Programmsequenz) abhängig von der Anwendung und der Verfügbarkeit der übrigen Materialien spezifisch eingestellt werden, und
(d) der Synchronisation (λ*) der unabhängigen Programmteile mit dem zugehörigen Haupttemplate durch die vorbereitete -Reduktion und der dadurch realisierte Zusammenbau der Gesamt - lösung.
1.3 Beispiel
Es werden die zwei genannten Ausführungsbeispiele anhand des folgenden Programmbeispiels diskutiert, das als Standardbenchmark für funktionale Systeme und zugehörige Rechnerarchitekturen gut untersucht ist .
Folgende mathematische Zahlenreihe (Fibonacci- Zahlen) , die für die Modellierung diverser Wachstumsprozesse von Bedeutung ist, soll durch eine zweifach rekursive Funktion berechnet werden:
1,1, 2, 3, 5, 8, 13, 21, 34, 55, 89, Die Zahlenfolge ergibt sich dadurch, daß ein Element der Folge sich aus der Summe der beiden vorangegangenen Zahlen berechnet. Die zugehörige zweifach rekursive Funktion zur Berechnung der Folge in unserer funktionalen Notation ist wie folgt :
f (n) = if (π≤l) then 1 eise f (π-1) +f (n-2)
Dabei ist f in) die π-te Zahl der Folge. Beginnend mit 1 für n=0 oder n=l (t en-Teil) ergeben sich die anderen Elemente als Summe der beiden vorhergehenden (else-Teil) , also z. B. die zehnte Fibonacci-Zahl durch f(10) = 89.
Die Anzahl der notwendigen Operationen zur zweifach rekursiven Berechnung dieser Folge wächst exponentiell mit n, so daß zur Bestimmung von f(20) = 10.946 schon eine große (21.891), für f(50) = 20.365.011.074 eine astronomische (40.730.022.147) Zahl von Funktions- aufrufen/Rechenoperationen durchgeführt werden muß.
1.4 Kodierungsbeispiel für die Berechnung der Fibonacci- Funktion Die interne Konstruktorsyntaxdarstellung obiger Fibonacci- Funktion f ist wie folgt:
AP REC VAR f SUB VAR n AP AP <= VAR n INT 1 IF INT 1
AP + AP VAR f AP - VAR n INT 1 AP VAR f AP - VAR n INT 2 INT 20 Um die Struktur für die weiter unten angegebene Kompilation etwas besser hervorzuheben, läßt sich das Programm äquivalent wie folgt darstellen:
AP REC VAR f
SUB VAR n AP AP
VAR n
INT 1 IF INT 1 AP +
AP VAR f AP -
VAR n INT 1 AP VAR f AP -
VAR n INT 2
INT 20
Dabei bindet der zweistellige Konstruktor REC die folgende Variable rekursiv, SUB nicht rekursiv im Funktionsrumpf . Der Applikator AP spezifiziert die Anwendung der genannten Funktion auf die folgenden Argumente. Die einstelligen Konstruktoren VAR und INT geben den Typ des nachfolgenden Konstrukts an.
Tabelle 1 listet die DNA-Kodierung der hier verwendeten zweistelligen Konstruktoren:
DNA-Code Konstruktorsyntax
AAA.AAA REC <variable> <expr>
AAA.AAG SUB <variable> <expr>
AAA.AGA IF <expr> <expr>
AAA.AGG AP <expr> <expr>
AAA.GGG SUB* <variable> <expr>
Tabelle 1 : DNA-Kodierung zweistelliger Konstruktoren Die Codes der hier verwendeten einstelligen Konstruktoren sind in Tabelle 2 angegeben:
Figure imgf000027_0001
Tabelle 2 : DNA-Kodierung einstelliger Konstruktoren
Variablennamen <string> und Funktionsidentifikatoren <func-id> können durchnumeriert und wie Zahlen <number> und Zeichen <string> kodiert werden. Dabei werden einzelne Ziffern des Dualsystems durch drei Nukleotide (als Codon) kodiert, '0' als -'CCC und '1' als 'TTT', natürlich würde "auch ein Nukleotid ausreichen, allerdings wird die Redundanz durch die Verwendung von mehr Nukleotiden erhöht; je nach Fehleranfälligkeit der biotechnologischen Operationen kann die Redundanz durch Verwendung längerer Kodierungen (erweiterte Codone oder Verwendung von mehr Codonen pro Ziffer) oder durch größeren Hammigabstand der Kodierung noch verbessert oder an spezielle Gegebenheiten der eingesetzten biotechnologischen Operationen angepaßt werden.
Um eine kompakte Kodierung beliebig vieler Zeichen und Zahlen zu erlauben, werden sie durch eine Binärdarstellung mit einem Anfangs- (CAC) und einem Endmarker (ACA) kodiert. Die Technik der Anfangs- und Endmarker kann auch für die Konstruktoren verwendet werden, um einerseits eine kompaktere Kodierung zu erhalten oder andererseits den Einbau von Restriktionsschnittstellen zur Aufteilung der Ausdrücke in ihre Syntaxkomponenten zu ermöglichen. Die folgende Tabelle 3 zeigt die hier verwendeten Codes.
Der Punkt dient nur der besseren Lesbarkeit (die
Aufteilung in die Codone) und ist nicht Teil der Codierung.
Figure imgf000028_0001
Tabelle 3: DNA-Kodierung von Basis-Konstrukten
Zur Identifizierung und Extraktion der Gesamtlδsung aus dem Puffer für das nachfolgende Auslesen (Sequenzierung) des Ergebnisses wird die folgende Sequenz als Kodierung des MAIN-Konstruktors verwendet:
Figure imgf000028_0002
Man erhält also aus der Übersetzung des Ausdrucks in Konstruktorsyntax folgende Nukleotid-Sequenz : ACGTACGT AAA.AGG
AAA.AAA GGG.AAA CAC . TTT . CCC . TTT .ACA AAA.AAG GGG.AAA CAC . TTT . CCC . CCC . TTT . TTT .ACA
AAA.AGG
AAA.AGG GGG.AGA CAC . TTT . CCC .ACA
GGG .AAA CAC .TTT . CCC . CCC . TTT . TT .ACA GGG.AAG CAC. TTT.ACA AAA.AGA GGG.AAG CAC. TTT.ACA
AAA.AGG
GGG.AGA CAC. CCC.ACA AAA.AGG
GGG.AAA CAC.TTT. CCC. TT.ACA AAA.AGG
GGG.AGA CAC. TT.ACA
GGG .AAA CAC . TTT . CCC . CCC . TTT . TTT .ACA GGG.AAG CAC. TTT.ACA AAA.AGG GGG.AAA CAC. TT. CCC. TTT.ACA
AAA.AGG
GGG.AGA CAC. TTT.ACA
GGG .AAA CAC . TTT . CCC . CCC . TTT . TT .ACA GGG.AAG CAC. TT. CCC.ACA GGG.AAG CAC. TTT. CCC. TT. CCC. CCC.ACA
d. h., die Synthesevorrichtung wird instruiert, folgendes DNA-Molekül (bestehend aus 398 Nukleotiden) zu produzieren:
ACGTACGTAAAAGGAAAAAAGGGAAACACTTTCCCTTTACAAAAAAGGGGAAACACTTTCCCCCC TTTTTTACAAAAAGGAAAAGGGGGAGACACTTTCCCACAGGGAAACACTTTCCCCCCTTTTTTAC AGGGAAGCACTTTACAAAAAGAGGGAAGCACTTTACAAAAAGGGGGAGACACCCCACAAAAAGGG GGAAACACTTTCCCTTTACAAAAAGGGGGAGACACTTTACAGGGAAACACTTTCCCCCCTTTTTT ACAGGGAAGCACTTTACAAAAAGGGGGAAACACTTTCCCTTTACAAAAAGGGGGAGACACTTTAC
AGGGAAACACTTTCCCCCCTTTTTTACAGGGAAGCACTTTCCCACAGGGAAGCACTTTCCCTTTC CCCCCACA
Nach Durchführung aller Operationen ist das Ergebnis der Bio-Transformation des Hauptprogramms MAIN, d. h. der Berechnung von f(20), das folgende DNA-Molekül:
ACGTACGTGGGAAGCACTTTCCCTTTCCCTTTCCCTTTTTTCCCCCCCCCCCCTTTCCCACA Das Ergebnis kann mittels des MAIN Labels (ACGTACGT) aus der Pufferlösung extrahiert werden, so daß man als Ergebnis der Berechnung eine Zahl (GGG.AAG) in Binärkodierung (10101011000010) erhält.
Die Übersetzung der Binärkodierung ergibt als Ergebnis der Gesamtberechnung die Zahl 10946.
1.5 Kodierungsbeispiel für die verteilte Berechnung der Fibonacci-Funktion
Zunächst wird das Funktionsbeispiel :
£ {n) - if (nsl) then 1 eise f [n- l ) +f (n- 2 )
transformiert in
f {n) =ap dis X *tt λ*t2 if (n≤l) then 1 eise t_+t2 [f (n- 1) , £ {n- 2 ) ]
Dabei hat der Compiler zwei unabhängig voneinander ausführbare Ausdrücke f (n- l ) und f (n-2 ) identifiziert und mittels einer speziellen λ-Abstraktion (λ* oder SUB*) abstrahiert und für die Verteilung markiert.
Die Übersetzung ist nun analog zum Beispiel oben, wobei lediglich weitere Kodierungen für die Funktion dis und den Konstruktor λ* notwendig werden, die in Tabelle 1 schon eingeführt wurden.
Die Ausführung der Funktion dis führt zur Aufspaltung des Programmausdrucks in 3 Moleküle: den λ*-Ausdruck (das o. g. Haupttemplate) , und die beiden Fibonacci-Funktions- berechnungen. Für das Beispiel ergibt sich:
ap sub n ap dis X* t\ λ* t2 if (n < 1) then 1 eise t\ + t2 [f(n - 1), f(n — 2)] 20
und nach einem Schritt
ap dis λ*t, λ*t2 if (20sl) then l eise tα+t2 [f (20-1) , f (20-2) ]
Dadurch entstehen im nächsten Schritt drei unabhängige Ausdrücke :
1. λ*d λ*t2 if (20≤1) then l eise t2+t2
2. F(19)
3. F(18)
Im weiteren Verlauf der Berechnung entstehen viele weitere unabhängig berechenbare DNA-Moleküle. Im folgenden Schritt in diesem Beispiel sieben Moleküle, von denen vier (Nr. 3,4,6,7) direkt weiter prozessiert werden können.
1. λ*tj λ*t2 if (20≤l) then l eise t+t2
2. λ*t2 λ*t2 if (I9si) then l eise tj+t2
3. F(18)
4. F(17) 5. λ*t, λ*t2 if (18≤1) then 1 eise t2+t2
6. F(17)
7. F(16)
und dann fünfzehn Moleküle/Ausdrücken, von denen acht (Nr. 4,5,7,8,11,12,14,15) ausführbar sind: 1. λ*t2 λ*t2 if (20≤1) then 1 eise t2+t2
2. λ*t2 λ*t2 if (19≤1) then 1 eise t2+t2
3. λ*t2 λ*t2 if (18≤1) then 1 eise t2+t2
4. F(17) 5. F(16)
6. λ* j λ*t2 if (17≤1) then 1 eise t2+t2
7. F(16)
8. F(15)
9. λ*t2 λ*t2 if (18≤1) then 1 eise t2+t2 10. λ*t2 λ*t2 if (17≤1) then 1 eise t2+t2
11. F(16)
12. F(15)
13. λ*tj λ*t2 if (16≤1) then 1 eise t2+t2
14. F(15) 15. F(14)
und so weiter. Im allgemeinen können von den jeweils vorhandenen 2K - 1 Molekülen K (also immer mehr als die Hälfte) direkt weiterverarbeitet werden. In diesem Beispiel können bis zu 21891 (genau (2*f(20)-l) Funktionsaufrufe) unabhängig ausführbare Programmausdrücke entstehen. Letztlich sind jedoch alle Unterausdrücke berechnet und das Gesamtergebnis wird (wie analog auch schon vorher die entsprechenden Teilergebnisse) zusammen- gesetzt. Im vorletzten Schritt der Berechnung erhält man also drei Ausdrücke, von denen nur noch einer ausführbar ist (Nr. 1) und der die beiden anderen zum Gesamtergebnis zusammenfaßt :
1. λ*t2 λ*t2 if (20≤1) then 1 eise t2+t2
2. 6765
3. 4181
Man erhält so den Ausdruck:
if (20≤1) then 1 eise 6765+4181 schließlich:
6765+4181
und damit das Endergebnis :
10946
Damit ergibt sich bei diesem Beispiel zur nebenläufigen Berechnung unabhängiger Programmausdrücke das gleiche Ergebnis wie in Abschnitt 1.4 bei der strikt sequentiellen Ausführung.
1.6 Bemerkung zur sequentiellen und nebenläufigen Berechnung des Ausführungsbeispiels
Bei genügend Ressourcen bei der nebenläufigen Ausführung kann das gleiche Ergebnis mit erheblich weniger Schritten berechnet werden als bei der sequentiellen Ausführung:
Während für die vollständig verteilte Berechnung nur
20 Großschritte erforderlich sind, benötigt die sequentielle Ausführung 21891 Schritte/Funktionsaufrufe
(also etwa 1000 mal soviele) .
Da der Berechnungsaufwand - wie oben erwähnt - exponentiell ansteigt, wächst auch die Leistungssteigerung durch die nebenläufige Ausführung mit Vergrößerung des Arguments drastisch an, für n = 30 beträgt der Faktor beispielsweise schon 30 zu 2.7 Millionen (2.692.537).
Wie in [35] erläutert, wird es bei endlicher Zahl von Prozessoren (allgemein von für Rechnungen zur Verfügung stehender Ressourcen), hier DNA und Puffermaterial, notwendig, die im Übermaß vorliegende probleminhärente Nebenläufigkeit durch geeignete Einschränkung an die verfügbaren Ressourcen anzupassen, um so eine effiziente Nutzung und eine schnelle Ausführung der notwendigen Berechnungen zu gewährleisten.
L I T E R A T U R
[1] Adleman, L.M: Molecular Compu tation of Solutions to Combinatorial Problems, Science, Vol. 266, 1021-1024, 1994
[2] Barendregt, H.P. : The Lambda Calculus , Its Syntax and Semantics, North Holland, 1981, Studies in Logic and the Foundations of Mathematics, Vol. 103
[3] Baum, E . : Building and associative memory vastly larger than the brain, Science, 1995, Vol. 268, 583-585
[4] Beaver, D.: A Universal Molecular Computer, Penn State University, Tech Report CSE-95-001
[5] Beaver, D. : Computing wi th DNA, Journal on Computational Biology, Vol. 2, No. 1, 1995
[6] Berkling, K.J.: Reduction Languages for Reduction Machines, 2nd Annual Symposium on Computer Architecture, January 1975, ACM/IEEE, pp . 133-140
[7] Berkling, K. J. : A Symmetrie Complement to the Lambda Calculus , Interner Bericht GMD ISF-76-7, D-5205 Sankt Augustin 1, September 14, 1976
[8] Brown, T.A.: Gentechnologie für Einsteiger, Spektrum Akademischer Verlag, 1995
[9] Church, A. : A note on the Entscheidungsproble , Journal of Symbolic Logic, Vol. 1, 40-41, Correction, 101-102 [10] Church A. ; Rosser, J.B.: Some properties of conversion, Trans. Amer. Math. Soc . , 39, 1936, 472-482
[11] Church, A. : The calculi of lambda conversion, Princeton University Press, 1941
[12] Curry, H.B.; Feys, R. : Combinatory Logic Vol . I, North-Holland, 1958, Studies in Logic and the Foundations of Mathematics
[13] Gordon, M. : The denotational description of Programming languages , Springer, 1979
[14] Gordon, M. ; Milner, R. ; Wadsworth, C.P.: Edinburgh LCF, LNCS 78, 1979
[15] Hindley, J.R. ; Sedlin, J.P.: Introduction to Combinators and λ -calculus, Cambridge University Press, 1986, London Mathematical Society Student Texts 1
[16] Kluge, W.E. : The Archi tecture of the Reduction Machine Hardware Model , GMD ISF-79-3, D-5205 Sankt Augustin 1, August 1979
[17] Kluge, W.E.: Cooperating Reduction Machines , IEEE Transactions on Computers, Vol. C-32, No . 11, 1983, pp. 1002-1012
[18] Kornberg, A. ; Baker, T.A.: DNA Replica tion , W.H. Freeman and Co., 1992.
[19] Kluge, W.E. : The Organiza tion of Reduction, Da ta Flow and Control Flow Systems , MIT Press, 1992 [20] Lipton, R. J. : DNA Solution of Hard Computational Problems, Science, Vol. 268, 542-545, 1995
[21] Loeckx, J. ; Sieber, K. : The foundations of program verification, Teubner-Wiley, 1984
[22] Mevissen, H. ; Pless, E.: OREL/C - eine Kommandosprache als Ergänzung zur Reduktionssprache OREL/1 , GMD Arbeitspapier 239, 1998
[23] Mevissen, H. : ERWIN - Reduction- System Window - oriented Edi tor. User ' s Guide, GMD Arbeitspapier 502, 1991
[24] Mevissen, H. : Tabellengesteuerte Transli teration von kontext- freien Sprachen . Die Sprachbeschreibungs - spräche OREL/SYN, GMD Arbeitspapier 529, 1991
[25] Milner, R. : A proposal for Standard ML, LFP, Austin, Texas, August 1984
[26] Patterson, J.L . ;Hennessey, D.A.: Compu ter Archi tecture : A quantiative approach, Kaufmann, 1990
[27] Pless, E.; Schlütter, H. : The reduction language OREL/2 , Arbeitspapiere der GMD, 1990
[28] Smith, E.; Zimmer, R.: Leistungssprünge durch Massive Paralleli tät ? , GMD Jahresbericht 1990
[29] Stoy, J.E. : Denotational Semantics - The Scott Strachey Approach to Programming Language Theory, MIT Press, 1977 [30] Turing, A.M. : On computable numbers , wi th an application to the Entscheidungsproblem, London Mathematical Society, 2s. 42, 1936, 230-265
[31] Turner, D.A.: Miranda : A non-strict functional language wi th polymorphic types , FPCA, September 1985, Nancy, LNCS 201
[32] Zimmer, R. : Cooperating Reduction Machines wi th Heap- Support, 4. Workshop Al ternative Konzepte für Sprachen und Rechner, Bad Honnef , März 1987, Bericht Nr. 2/87-1, Universität Münster
[33] Zimmer, R. : A Heap-Supported Mul tiprocessor Reduction System, GI-Workshop Sprachen, Algori thmen und Archi tekturen für Parallelrechner, Bad Honnef, Mai 1988, Universität Münster
[34] Zimmer, R. : Concurrent Execution of Reduction Language Expressions on a Mul tiprocessor - Archi tecture, ACM-Workshop on Archi tectural Support for Declarative Language s , Mai 1989, Eilat, Israel
[35] Zimmer, R.M. : Zur Pragmatik eines operationalisierten λ -Kalküls als Basis für interaktive Reduktions - systeme, Oldenbourg Verlag, 1990
[36] Zimmer, R. : Why Functional Programming does not (yet) matter, In W. Lippe (Editor), GI -Workshop AI ternative Konzepte für Sprachen und Rechner, Bad Honnef, April 1991, 149-168, Universität Münster Bericht 8/91-1.
[37] Zimmer, R.: Reflections, the Church-Rosser property and "real " applica tions in functional Sys tems , In Hugh Glaser; Pieter Hartel (Editoren) , Proceedings of the 3rd international Workshop on Parallel Impl emen tations of Functional Languages, Southampton, UK, 5-7.06.1991.
[38] Zimmer, R.M. : A universal Computer based on DNA : a new imple entation of λ -calculus based reduction Systems, 1995, in Vorbereitung.

Claims

P A T E N T A N S P R U C H E
Frei programmierbares , universelles Parallel-Rechnersystem zur Durchführung von allgemeinen Berechnungen, mit einem elektronischen Vorrechner, der die Eingabe beliebiger und damit zur Spezifikation allgemeiner Berechnungen fähiger Programme erlaubt, deren Umsetzung in Ausdrücke einer Reduktionsspräche realisiert und deren Kodierung in eine DNS-Sequenz vornimmt, einer Synthesevorrichtung, die die kodierte DNS- Sequenz von dem Vorrechner empfängt und die die DNS-Sequenz in ein entsprechendes DNS-Molekül mit einer spezifizierten Nukleotidabfolge synthetisiert , einer Vervielfältigungsvorrichtung zum Vervielfältigen des synthetisierten DNS-Moleküls mittels einer Ampliflkationsreaktion, einer Reaktionsvorrichtung zum gleichzeitigen Ausführen von Transformationen der DNS-Moleküle mittels molekularbiologischer Techniken gemäß den Reduktionsregeln einer Reduktionsspräche, wobei das Ergebnismolekül in der Lösung identifiziert, extrahiert und ggf. vervielfältigt wird, und einer Sequenziervorrichtung zum Bestimmen der Sequenz des Ergebnismoleküls, wobei diese Sequenz an den Vorrechner weitergegeben wird und der Vorrechner die Sequenz dekodiert sowie die dekodierte Sequenz ausgibt.
Rechnersystem nach Anspruch 1, dadurch gekennzeichnet, daß es sich bei der Reduktionssprache um den λ-Kalkül handelt. Rechnersystem nach Anspruch 1 oder 2, dadurch gekennzeichnet, daß die im Reduktionsapparat umgesetzten molekularbiologischen Techniken Basisoperationen wie Insert-, Delete- und Substitute-Operationen umfassen.
Rechnersystem nach einem der Ansprüche 1 bis 3 , dadurch gekennzeichnet, daß die Ampliflkationsreaktion einen PCR- und/oder LCR-Prozeß aufweist.
PCT/EP1998/002208 1997-04-15 1998-04-15 Frei programmierbares, universelles parallel-rechnersystem zur durchführung von allgemeinen berechnungen WO1998047077A1 (de)

Priority Applications (2)

Application Number Priority Date Filing Date Title
DE59802537T DE59802537D1 (de) 1997-04-15 1998-04-15 Frei programmierbares, universelles parallel-rechnersystem zur durchführung von allgemeinen berechnungen
EP98920526A EP0976060B1 (de) 1997-04-15 1998-04-15 Frei programmierbares, universelles parallel-rechnersystem zur durchführung von allgemeinen berechnungen

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE19715629.0 1997-04-15
DE19715629 1997-04-15

Publications (1)

Publication Number Publication Date
WO1998047077A1 true WO1998047077A1 (de) 1998-10-22

Family

ID=7826527

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/EP1998/002208 WO1998047077A1 (de) 1997-04-15 1998-04-15 Frei programmierbares, universelles parallel-rechnersystem zur durchführung von allgemeinen berechnungen

Country Status (3)

Country Link
EP (1) EP0976060B1 (de)
DE (1) DE59802537D1 (de)
WO (1) WO1998047077A1 (de)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000059917A2 (de) * 1999-03-31 2000-10-12 Hilmar Rauhe Informationstragende und informationsverarbeitende polymere
WO2003056036A2 (en) * 2001-12-21 2003-07-10 The Wellcome Trust Genes

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0726530A1 (de) * 1995-02-07 1996-08-14 Nec Corporation DNS-basierter enthaltadressierbarer Speicher
US5555434A (en) * 1990-08-02 1996-09-10 Carlstedt Elektronik Ab Computing device employing a reduction processor and implementing a declarative language

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5555434A (en) * 1990-08-02 1996-09-10 Carlstedt Elektronik Ab Computing device employing a reduction processor and implementing a declarative language
EP0726530A1 (de) * 1995-02-07 1996-08-14 Nec Corporation DNS-basierter enthaltadressierbarer Speicher

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
BACH E ET AL: "DNA MODELS AND ALGORITHMS FOR NP-COMPLETE PROBLEMS", PROCEEDINGS OF THE 11TH. ANNUAL IEEE CONFERENCE ON COMPUTATIONAL COMPLEXITY, PHILADELPHIA, MAY 24 - 27, 1996, no. CONF. 11, 24 May 1996 (1996-05-24), HOMER S;JIN-YI CAI (EDS ), pages 290 - 300, XP000607961 *
CSUHAJ-VARJU E ET AL: "DNA computing based on splicing: universality results", PACIFIC SYMPOSIUM ON BIOCOMPUTING '96, PROCEEDINGS OF BIOCOMPUTING '96, HI, USA, 3-6 JAN. 1996, ISBN 981-02-2578-4, 1995, Singapore, World Scientific, Singapore, pages 179 - 190, XP002077367 *
PAUN G ET AL: "From DNA recombination to DNA computing via formal languages", BIOINFORMATICS. GERMAN CONFERENCE ON BIOINFORMATICS, GCB'96. SELECTED PAPERS, LEIPZIG, GERMANY, 30 SEPT.-2 OCT. 1996, 1997, Berlin, Germany, Springer-Verlag, Germany, pages 210 - 220, XP002077366 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000059917A2 (de) * 1999-03-31 2000-10-12 Hilmar Rauhe Informationstragende und informationsverarbeitende polymere
WO2000059917A3 (de) * 1999-03-31 2001-02-01 Hilmar Rauhe Informationstragende und informationsverarbeitende polymere
WO2003056036A2 (en) * 2001-12-21 2003-07-10 The Wellcome Trust Genes
WO2003056036A3 (en) * 2001-12-21 2003-12-31 Wellcome Trust Genes
US7947819B2 (en) 2001-12-21 2011-05-24 The Wellcome Trust B-raf polynucleotides
US8580497B2 (en) 2001-12-21 2013-11-12 The Wellcome Trust Methods for detection of the oncogenic T1796A B-Raf mutation

Also Published As

Publication number Publication date
EP0976060B1 (de) 2001-12-19
DE59802537D1 (de) 2002-01-31
EP0976060A1 (de) 2000-02-02

Similar Documents

Publication Publication Date Title
DE69730276T2 (de) Vorrichtung und Verfahren zur Erleichterung der Vermeidung von exzeptionellen bestimmten Zuständen während des Ablaufs eines Programmes
DE19735350B4 (de) Vektorprozessor zum Ausführen paralleler Operationen und Verfahren hierfür
DE19735348B4 (de) Vektorprozessor zur Einzelbefehl-Mehrdaten-Verarbeitung unter Verwendung von mehreren Bänken von Vektorregistern und zugehöriges Verfahren zum Betreiben desselben
DE69833008T2 (de) Prozessor mit instruktionskodierung mittels eines schablonenfeldes
DE69724322T2 (de) Verfahren und Anordnung zum frühzeitigen Einfügen von Assemblercode zwecks Optimierung
DE2748991A1 (de) Einrichtung zur umsetzung von datenformaten
DE102008005515A1 (de) Virtuelle Architektur und virtueller Befehlssatz für die Berechnung paralleler Befehlsfolgen
DE2505843A1 (de) Datenverarbeitungsanlage mit datenstromgesteuerter simultanverarbeitung
DE102005021749A1 (de) Verfahren und Vorrichtung zur programmgesteuerten Informationsverarbeitung
Lemoine et al. Goulphar: rapid access and expertise for standard two-color microarray normalization methods
EP0825540B1 (de) Prozessor mit Pipelining-Aufbau
DE4430195A1 (de) Computersystem und Verfahren zur Auswertung von Vorhersagen und Booleschen Ausdrücken
EP0976060B1 (de) Frei programmierbares, universelles parallel-rechnersystem zur durchführung von allgemeinen berechnungen
DE19735349B4 (de) Vektorprozessor und Verfahren zu dessen Betrieb
DE2312193A1 (de) Uebersetzer und quellencode-erzeuger fuer eine problemorientierte sprache fuer rechenanlagen
Thisted Computing environments for data analysis
Unruh Quantum programming languages
Médigue et al. Cooperative Computer System For Genome Sequence Analysis.
Peter et al. ON THE APPLICATION OF MULTISET TO DETERMINISTIC COOPERATIVE SPECIALIZATION P SYSTEM UNDER CATALYSIS
EP2217999A2 (de) Compiler für rekonfigurierbare architekturen mit besonderem zwischenformat
Sosík et al. Tissue P systems with cell separation: upper bound by PSPACE
Hatteberg Defining an Object-Oriented Architecture for Operations on Genomic Data
Walter The Importance of the Programming Language ALGOL for Automation in Astronomical Research
DE102019126715A1 (de) Systeme und Verfahren zur energieeffizienten Datenverarbeitung
Raja et al. Combinatory formulations of concurrent languages

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): DE JP US

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LU MC NL PT SE

DFPE Request for preliminary examination filed prior to expiration of 19th month from priority date (pct application filed before 20040101)
121 Ep: the epo has been informed by wipo that ep was designated in this application
WWE Wipo information: entry into national phase

Ref document number: 1998920526

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 09403231

Country of ref document: US

WWP Wipo information: published in national office

Ref document number: 1998920526

Country of ref document: EP

NENP Non-entry into the national phase

Ref country code: JP

Ref document number: 1998543503

Format of ref document f/p: F

REG Reference to national code

Ref country code: DE

Ref legal event code: 8642

WWG Wipo information: grant in national office

Ref document number: 1998920526

Country of ref document: EP