DE69829200T2

DE69829200T2 - Synthese von polynukleotiden mit zufalls-sequenzen

Info

Publication number: DE69829200T2
Application number: DE69829200T
Authority: DE
Inventors: Philippe Neuner
Original assignee: Istituto di Ricerche di Biologia Molecolare P Angeletti SpA
Current assignee: Istituto di Ricerche di Biologia Molecolare P Angeletti SpA
Priority date: 1997-10-28
Filing date: 1998-10-28
Publication date: 2006-01-12
Anticipated expiration: 2018-10-29
Also published as: WO1999021873A2; EP1027366B1; CA2306762A1; AU9760698A; AU744592B2; ATE290011T1; US6350595B1; ES2236952T3; JP3986255B2; JP2001521040A; DE69829200D1; CA2306762C; ITRM970651A1; EP1027366A2; IT1295830B1; WO1999021873A3

Description

Der Gegenstand der vorliegenden Erfindung ist ein Verfahren zur Synthese von Polynukleotiden, welches die Einführung statistischer Sequenzen ("random sequences") entlang mehr oder weniger ausgedehnter Abschnitte des Moleküls ermöglicht, auf solche Weise, dass sich die statistische Verteilung auf Einheiten von drei benachbarten Nukleotiden bezieht und dass jede dieser Einheiten ausgewählt ist, um einer begrenzten Anzahl von Codons, mit vorgegebener Anzahl und Sequenz, zu entsprechen und um die Wirkungen der Degeneration des genetischen Codes zu eliminieren.
Die Anwendungsmöglichkeiten eines Polynukleotidsyntheseverfahrens mit den obigen Merkmalen sind zweifellos beträchtlich. In der Tat gewannen in den letzten Jahren Anwendungen, die deren Einsatz erfordern, zunehmende Bedeutung auf vielen Gebieten der wissenschaftlichen Forschung. Es ist beispielsweise von Nutzen bei der stellenspezifischen Mutagenese bei einem Gen, das für ein bekanntes Protein kodiert, an mutmaßlichen Schlüsselpositionen, um deren tatsächliche Rolle in der Molekülstruktur oder -funktion zu verifizieren. Ein weiteres Beispiel sind Banken, enthaltend "Boxen" von synthetischen Oligonukleotiden mit statistischer Sequenz, welche erstellt sind, um Moleküle auszuwählen, welche zur Erfüllung neuer biologischer Funktionen in der Lage sind.
In all diesen Fällen ist es von äußerster Bedeutung, dass die statistische Verteilung der Sequenz in einem gewissen Grad kontrolliert wird, so dass nur die gewünschten Codons insertiert werden, neben der Eliminierung der Wirkungen der Degeneration des genetischen Codes. Von gleicher Bedeutung ist offensichtlich die Tatsache, dass diese Polynukleotidsynthese mit einem einfachen, kosteneffizienten und wirksamen Verfahren durchgeführt wird.
Terminologie
Es ist von Nutzen, hier im folgenden die Begriffe zu spezifizieren:
Träger.
Der Begriff Träger bezieht sich auf ein Material in fester Phase, an das Monomere gebunden sind, um eine chemische Synthese zu realisieren; dieser Träger besteht gewöhnlich aus Harz oder porösen Glaskörnern, kann jedoch auch aus irgendeinem anderen Material bestehen, das dem Fachmann bekannt ist. Der Begriff soll ein oder mehrere Monomere einschließen, das/die für die weiteren Reaktionen der Polynukleotidsynthese an den Träger gekoppelt ist/sind.
Konjugieren oder kondensieren:
Diese Begriffe beziehen sich auf die chemischen Reaktionen, welche durchgeführt werden, um ein Monomer an ein zweites Monomer oder an einen festen Träger zu binden. Diese Reaktionen sind dem Fachmann auf dem Gebiet bekannt und werden gewöhnlich in einem automatischen DNA-Synthesizer nach den vom Hersteller zur Verfügung gestellten Instruktionen durchgeführt.
Monomere oder Mononukleotide:
Die Begriffe Monomer oder Mononukleotid beziehen sich auf individuelle Nukleotide, die bei der chemischen Synthese von Oligonukleotiden eingesetzt werden. Monomere, welche eingesetzt werden können, umfassen sowohl die Ribo- als auch die Desoxyribo-Formen eines jeden der fünf Standardnukleotide (abgeleitet von den Basen Adenin (A bzw. dA), Guanin (G oder dG), Cytosin (C oder dC), Thymin (T) und Uracil (U)). Basen-Derivate oder -Vorläufer wie Inosin werden ebenfalls von den Monomeren umfasst, sowie chemisch modifizierte Nukleotide, wie z.B. solche mit einer reversiblen Blockierungsgruppe an irgendeiner Position auf den Purin- oder Pyrimidin-Basen, auf Ribose oder Desoxyribose oder auf Hydroxyl- oder Phosphatgruppen des Monomers. Diese Blockierungsgruppen umfassen beispielsweise Dimethoxytrityl-, Benzoyl-, Isobutyryl-, β-Cyanoethyl- und Diisopropylamingruppen und werden zum Schutz von Hydroxylgruppen, Phosphaten und hexacyclischen Aminen verwendet. Jedoch können andere Blockierungsmittel, die dem Fachmann bekannt sind, verwendet werden.
Dimere oder Dinukleotide:
Die Begriffe Dimere oder Dinukleotide beziehen sich auf molekulare Einheiten, die aus der Kondensation von zwei Monomeren oder Mononukleotiden wie oben definiert erhalten werden.
Synthese monomerer Einheiten:
Dieser Begriff bezeichnet Einheiten, welche als essentielle Elemente in dem Syntheseverfahren verwendet werden. In dem Verfahren, welches Gegenstand der vorliegenden Erfindung ist, können sie aus Monomeren oder Dimeren bestehen; sie können auch aus Trinukleotideinheiten in anderen im Stand der Technik bekannten Verfahren bestehen.
Codon oder Triplett:
Der Begriff Codon oder Triplett bezieht sich auf eine Sequenz von drei aufeinander folgenden Desoxyribonukleotid-Monomeren, welche eine der 20 natürlichen Aminosäuren spezifizieren, die bei einer Polypeptid-Biosynthese verwendet werden. Der Begriff umfasst auch Nonsense-Codons, Codons, die nicht für irgendeine Aminosäure kodieren.
Codon oder randomisiertes Triplett:
Diese Begriffe beziehen sich auf den Fall, in dem die gleiche Sequenzposition mehr als einem Codon in einem Satz von Polynukleotiden entspricht. Die Anzahl verschiedener Codons kann von zwei bis 64 für jede spezielle Position variieren.
Anticodon:
Der Begriff Anticodon bezieht sich auf eine Sequenz von drei aufeinander folgenden Ribonukleotid-Monomeren, welche ein entsprechendes Codon nach der bekannten Regel der Purin- und Pyrimidinbasen-Kopplung spezifizieren.
Polynukleotide oder randomisierte Oligonukleotide:
Dieser Begriff bezieht sich auf einen Satz von Oligonukleotiden, die randomisierte Codons an einer oder mehreren Positionen aufweisen. Falls beispielsweise die randomisierten Oligonukleotide 6 Nukleotide Länge aufweisen (d.h. zwei Codons) und sowohl die erste als auch die zweite Position der Sequenz randomisiert sind, um für alle der 20 Aminosäuren zu kodieren, dann soll die Population von randomisierten Oligonukleotiden einen Oligonukleotidsatz mit jeder möglichen Kombination der 20 Tripletts in der ersten und zweiten Position umfassen. In diesem Fall ist die Anzahl der möglichen Codonkombinationen daher 400. Analog werden, falls randomisierte Oligonukleotide von 15 Nukleotiden Länge so synthetisiert werden, dass sie in jeder Position randomisiert sind, dann alle Tripletts, die für jede der 20 Aminosäuren kodieren, an jeder Position gefunden werden. In diesem Fall wird die Population randomisierter Oligonukleotide 20⁵ verschiedene mögliche Oligonukleotidspezies enthalten.
Falls nicht eindeutig definiert, sind andere Begriffe, die in der vorliegenden Beschreibung verwendet werden, so zu verstehen, wie sie von Fachleuten auf dem Gebiet, das die Erfindung betrifft, verstanden werden.
Hinsichtlich einiger Begriffe bezüglich molekularbiologischer Techniken vergleiche man das Handbuch von Sambrook et al. (Sambrook et al., 1989). Andere Begriffe, die sich auf Substanzen chemischer Natur beziehen, die nicht klar definiert sind, sind so zu verstehen, wie sie von Fachleuten auf dem Gebiet der Erfindung verstanden werden und deren Definitionen sind jedenfalls in Handbüchern wie Gait, M.J., et al., 1984, zu finden.
Stand der Technik
Im Allgemeinen sind Anwendungen, bei denen synthetische Oligonukleotide verwendet werden, von zweierlei Art: diejenigen, welche die Verwendung von Oligonukleotiden bekannter Sequenz erfordern, und diejenigen, welche die Verwendung von Oligonukleotiden mit einer mindestens teilweise degenerierten oder statistischen Sequenz erfordern.
Bezüglich der ersten Gruppe von Anwendungen basieren die üblichen Syntheseverfahren auf dem Prinzip des Einbaus der zum Polynukleotid kondensierenden Mononukleotide, jeweils eines zu einem gegebenen Zeitpunkt, beginnend bei dem ersten am 3'-Terminus, und Auswahl eines jeden Mononukleotids für jeden Reaktionszyklus, um so ein Polynukleotid mit einer gewünschten und eindeutigen Sequenz zu synthetisieren.
Bezüglich der zweiten Gruppe von Anwendungen folgt die Synthese denselben Modalitäten, jedoch findet in den Positionen entlang der Sequenz, an denen es erforderlich ist, eine Variabilität einzubauen, der Synthesezyklus unter Verwendung von Mischungen zwei oder mehr verschiedener Monomere statt. In jedem Zyklus werden somit Oligonukleotidmischungen erzeugt, die sich in dem zum 5'-Terminus hinzufügten Monomer unterscheiden. Wenn beispielsweise in einem Zyklus vier verschiedene Mononukleotide als Monomere eingesetzt werden, wird eine Mischung erhalten, die vier verschiedene Polynukleotide enthält, die sich voneinander nur in dem letzten eingebauten Nukleotid unterscheiden. Falls ein Synthesezyklus derselben Art wiederholt wird, wird eine Mischung von 16 Polynukleotiden erhalten, die sich in den letzten beiden eingebauten Nukleotiden unterscheiden, usw.
Im Allgemeinen ermöglichen Anwendungen, die synthetische Polynukleotide verwenden, einen direkten oder indirekten Einbau der Polynukleotide in genetisches Material, welches in einem bestimmten lebenden Organismus in Polypeptide translatiert werden wird (eine in vitro-Translation findet selten statt). Bekanntermaßen ist der genetische Code der DNA-Translation teilweise degeneriert, d.h. nachdem 64 mögliche Codons, gebildet von Gruppen von drei Nukleotiden, für nur 20 Aminosäuren kodieren (plus drei Terminations- oder Stoppsignale), kodiert mehr als ein Codon für jede Aminosäure.
Oligonukleotide mit einer mindestens teilweise statistischen Sequenz ("random sequence") wie zuvor beschrieben (wobei ein Polynukleotid mit einer statistischen Sequenz eine mehr oder weniger komplexe Mischung von Polynukleotiden mit unterschiedlichen Sequenzen bedeutet) kodieren für Peptide mit statistischer Sequenz (d.h. für eine Mischung von Peptiden, wobei jedes Peptid von einem oder mehreren Polynukleotiden kodiert wird).
In der Tat hat die Degeneration des genetischen Codes drei wichtige Konsequenzen hinsichtlich der Oligonukleotide mit statistischer Sequenz, welche für die Ableitung der statistischen Polypeptide zu verwenden sind:

a) Jede Mischung von Oligonukleotiden mit einer mindestens teilweise statistischen Sequenz kodiert für eine viel einfachere Polypeptidmischung. Beispielsweise besteht eine Mischung von Oligonukleotiden, bei denen 6 Positionen statistisch von einem der vier natürlichen Nukleotide besetzt werden, aus 4096 verschiedenen Molekülen (4⁶, falls Einzelnukleotide betrachtet werden, oder 64², falls Codons betrachtet werden), gerade aufgrund der Degeneration des Codes kodieren diese jedoch nur für 400 verschiedene Polypeptide (d.h. 20²). Dieses Phänomen würde für sich genommen irrelevant sein, vorausgesetzt, dass die verschiedenen Polynukleotide, die für das Polypeptid kodieren, die gleichen physikalischen und chemischen Merkmale haben, jedoch können verschiedene Sequenzen verschiedene Eigenschaften bezüglich beispielsweise Löslichkeit, Stabilität und elektrostatischer Ladung unter verschiedenen Bedingungen, Adsorption an Filtermittel usw. verleihen.
b) In der Mischung von Polypeptiden, welche durch Translation von Polynukleotiden mit statistischer Sequenz erzeugt wurden, wird ein Prozentsatz von Peptiden mit verkürzter Sequenz vorliegen. In der Tat werden während der statistischen Inkorporation der Codons auch notwendigerweise solche eingebaut, die ein Stoppsignal bedeuten, und die Bildung von Polypeptiden mit verkürzter Sequenz ist daher unvermeidlich. In dem vorhergehenden Beispiel werden von 4096 Oligonukleotiden 375 (9 %) für Polypeptide kodieren, die an der ersten oder zweiten Position verkürzt sind (d.h. 3 mögliche Terminationscodons an der ersten Position für jedes der 64 möglichen Codons an der zweiten Position und 3 mögliche Stoppcodons an der zweiten Position für jedes der 61 möglichen Codons an der ersten Position). Somit werden zusammen mit 400 möglichen Polypeptiden 21 verkürzte Polypeptide gefunden (eines an der ersten Position und 20 an der zweiten Position). Dieses Phänomen gewinnt besondere Bedeutung, wenn Banken von Polynukleotiden, die eine lange statistische Sequenz besitzen, erzeugt werden. Beispielsweise werden in einer 27-Nukleotide-Bank (kodierend für Nonapeptid-Banken, wie in vielen Anmeldungen beschrieben) bis zu 35 % der Polynukleotide ein Stoppcodon enthalten (oder [64⁹ – 61⁹]/64⁹). Längere Sequenzen werden einen höheren Prozentsatz an Molekülen enthalten, die für ein vorzeitiges Ende der Polypeptidkette kodieren.
c) Das Vorhandensein einer unterschiedlichen Translationseffizienz der verschiedenen Codons, die für dieselbe Aminosäure kodieren, in verschiedenen Organismen wird ersichtlich bei der Ableitung von Polypeptidmischungen mit Komplexitäten, die sich von denjenigen der Ausgangspolynukleotidmischungen unterscheiden. Obwohl der genetische Code einmalig in der Natur ist, gibt es tatsächlich einen Unterschied in den verschiedenen lebenden Organismen bezüglich der Effizienz, mit der verschiedene Codons, kodierend für dieselbe Aminosäure, translatiert werden. Beispielsweise wird in E. coli Serin 18 mal häufiger durch das Codon UCU als durch das Codon UCA kodiert. Daraus folgt, dass zwei verschiedene Polynukleotide bei äquimolarer Konzentration in der Anfangsmischung mit unterschiedlichen Effizienzen translatiert werden und die resultierende Polypeptidmischung ein unterschiedliches Molverhältnis der beiden Molekülspezies enthalten wird. Es ist deshalb zur Maximierung der Effizienz des ausgewählten zellulären Systems von äußerster Bedeutung, dass die kodierenden Sequenzen genau die Codons enthalten, die von dem zellulären System selbst in erster Linie verwendet werden.

Alle drei dieser Faktoren üben einen starken Einfluss auf die Effizienz von Systemen aus, welche Polynukleotide mit statistischer Sequenz verwenden, sowohl in Anwendungen, welche die Randomisierung in nur einer Position vorsehen, als auch in Anwendungen, bei denen die Randomisierung längere Sequenzen betrifft. Dieser Einfluss ist jedoch direkt proportional zur Länge und Komplexität der verwendeten statistischen Sequenz.
Diese Tatsache beeinträchtigt insbesondere die Herstellung vollständig homogener Mischungen (d.h. solcher, welche dieselbe Konzentration jeder möglichen Molekülspezies enthalten) von Polynukleotiden mit statistischer Sequenz, hergestellt für die Bildung gleichermaßen komplexer und homogener Polypeptidmischungen. Tatsächlich wird jeder Versuch in dieser Richtung bei der Translation von Polynukleotiden in Polypeptidmoleküle gerade durch die Kombination dieser drei Faktoren teilweise vereitelt und dies kann eine beträchtliche Reihe von Anwendungen nicht unbeeinflusst lassen.
Dies ist beispielsweise der Fall bei der Effizienz von Expressionsbanken, die aus einer solchen homogenen Mischung von Polynukleotiden erzeugt wurden.
In Zusammenhang mit all diesen Problemen wurden mit der Zeit Syntheseverfahren entwickelt, welche die Überwindung dieser Probleme und die Verbesserung der Effizienz der verschiedenen Systeme, welche Polypeptide mit statistischer Sequenz einsetzen, zum Ziel haben.
Eine erste Lösung (vielleicht die offensichtlichste unter theoretischen Gesichtspunkten) ist eine Polynukleotidsynthese, welche für die Verwendung als monomere Einheiten vorgebildete Trinukleotide (entsprechend Codons) statt der individuellen Mononukleotide vorsieht (Virkenas, B., et al., 1994; Lyttle, M.U., et al., 1995; Ono, A., et al., 1994). So können zuerst die 20 Trimere, entsprechend den gewünschten Codons, synthetisiert werden und die Polynukleotidsynthese wird erst später durchgeführt, indem bei jedem Synthesezyklus die aus Trimeren anstatt Monomeren bestehenden monomeren Einheiten kondensiert werden. Diese Lösung ist anscheinend einfach und wirksam, erfordert jedoch tatsächlich ein komplexes, teures und ineffizientes Verfahren, aus den folgenden Gründen:

1. Obwohl die Synthese der Anfangstrinukleotide leicht durch die Kondensation von drei blockierten Nukleotiden, ausgeführt gemäß dem regulären Polynukleotidsyntheseverfahren, (deshalb mit einem relativ einfachen und effizienten Verfahren) erzielbar ist, gibt es eine Reihe von Probleme, die der Ablösungsphase des neu gebildeten Trinukleotids von der Synthesematrix unvermeidlich innewohnen.

Tatsächlich findet bei normalen Verfahren dieser Vorgang gleichzeitig mit der Lyse aller Schutzgruppen der verschiedenen Basen statt; in diesem Fall muss jedoch in Anbetracht der nachfolgenden Schritte der Polynukleotidsynthese die Bindung zwischen den Nukleotiden und seitlichen Schutzgruppen intakt bleiben, so wurden Versuche unternommen, um eine Lyse der 3'-5'-Bindung mit der Trägermatrix zu ermöglichen, ohne Bindungen mit seitlichen Schutzgruppen zu beeinflussen.
Daraus ergibt sich die Notwendigkeit der Verwendung ungewöhnlicher Schutzgruppen und man muss mit Produktausbeuten rechnen, die von einem Codon zum anderen variieren. Die Ausbeuten sind kaum reproduzierbar und in jedem Fall niedrig.
Ganz analoge Schwierigkeiten entstehen, wenn die Synthese in Lösung statt auf einem Harz durchgeführt wird. In diesem Fall müssen die individuellen Trinukleotide ebenfalls vor der Verwendung selektiv, ausschließlich an der 3'-Position (um sie reaktiv zu machen), entblockiert werden, während alle anderen Funktionen blockiert bleiben müssen.

2. Bei der normalen Synthese von Polynukleotiden statistischer Sequenz, die auf der Verwendung von Mononukleotiden basiert, wird in jedem Synthesezyklus eine Mischung, bestehend aus mindestens zwei Nukleotiden, verwendet. Unter den komplexesten chemischen Bedingungen werden alle vier möglichen Nukleotide verwendet, aber selbst wenn jedes davon eine von den anderen leicht unterschiedliche Reaktivität besitzt, wären die optimalen Molverhältnis-Bedingungen, welche die äquimolare Inkorporation eines jeden Nukleotids in die sich bildende Polynukleotidkette fördern, nicht schwer zu finden, da es nur vier Komponenten gibt.

Von wesentlich größerer Bedeutung sind die Schwierigkeiten, auf die man stößt, wenn so viele wie 20 verschiedene Trinukleotide in äquimolarer Menge inkorporiert werden müssen. Erstens muss man die Tatsache berücksichtigen, dass bei allen möglichen Trinukleotiden ein Unterschied in der relativen chemischen Reaktivität besteht, der wesentlich größer ist als bei den vier einfachen Mononukleotiden.
Darüber hinaus werden Trinukleotide aufgrund der vorgenannten Schwierigkeiten in Lösungen erhältlich sein, deren qualitativer und quantitativer Gehalt nicht leicht verifizierbar ist, während Nukleotide in reiner Form und mit einer kontrollierten und reproduzierbaren Reaktivität leicht erhältlich sind. Zuletzt wird es offensichtlich schwierig sein, die richtigen Molverhältnisse der 20 Komponenten, welche die Synthesemischung bilden, ausreichend, um eine äquimolare Inkorporation sicherzustellen, zu finden. Natürlich werden alle diese Schwierigkeiten durch die Verwendung weniger komplexer Mischungen minimiert.
Ein zweiter Ansatz, viel einfacher unter dem Gesichtspunkt der chemischen Synthese, basiert auf der Tatsache, dass wenn mehrere Codons für nur eine Aminosäure kodieren, die ersten beiden Codonbasen oft konstant sind und sich nur in der dritten Base des Codons unterscheiden.
Die Unterschiede bei Codons, welche von dem Polynukleotid repräsentiert werden, können deshalb verringert werden, wenn während der Synthese einer jeden Trinukleotideinheit bei dem ersten Zyklus (welcher das 3'-terminale Nukleotid ergeben wird, d.h. das dritte im Codon) eine Mischung von Guanin- und Thymin- (oder Uracil)-abgeleiteten Nukleotiden verwendet wird, während bei den beiden nachfolgenden Kondensierungszyklen Mischungen der vier Mononukleotide verwendet werden. Somit werden Polynukleotide synthetisiert, welche nicht 64 mögliche Codons enthalten können, sondern nur die degenerierten 32 der Art NNK, wobei N jedes der vier Nukleotide ist und K Guanosin oder Thymidin ist. Daraus folgt, dass von den 20 kodierten Aminosäuren 12 von nur einem Codon kodiert werden, 5 von zwei möglichen Codons kodiert werden und 3 von drei möglichen Codons kodiert werden. Schließlich kodiert nur ein Codon von 32 für ein Stoppsignal.
Dieses Verfahren bietet im Vergleich zu den üblichen Syntheseverfahren den bemerkenswerten Vorteil, keinerlei Veränderung zu erfordern, löst aber nicht oder nur teilweise die vorgenannten Probleme. Insbesondere löst es, obwohl es im Vergleich zu den herkömmlichen Verfahren eine teilweise Lösung bietet, nicht das Problem der Einführung von Stoppcodons und der resultierenden Bildung von verkürzten Polypeptiden (Huang, W., und Santi, D.V., 1994).
Ein weiteres im Stand der Technik beschriebenes Verfahren basiert auf dem Prinzip der Unterteilung des Syntheseträgers in so viele Synthesebehälter (gewöhnlich Säulen) wie die verschiedenen Codons, welche in einer vorgegebenen Position in dem Oligonukleotid inseriert werden. Einzelcodons werden dann auf jedem Träger synthetisiert und die verschiedenen Träger werden dann gemischt, um eine randomisierte Polynukleotidmischung zu erhalten (US-A-05523388). Falls beispielsweise vier Codons, kodierend für vier Aminosäuren, an einer vorgegebenen Position eingebaut werden müssen, wird das Syntheseharz in vier Teile unterteilt, wobei das erste Codon auf dem ersten synthetisiert wird, das zweite Codon auf dem zweiten usw. Sobald die Synthese beendet ist, werden die vier Träger gemischt und somit ein Trägerharz erhalten, welches ein konjugiertes Polynukleotid trägt, dessen 5'-terminales Codon hinsichtlich der vier Codons randomisiert (statistisch bestimmt) ist.
Dieses Verfahren hat den Vorteil, eine exakte Auswahl der Codons zu erlauben, welche an einer vorgegebenen Position zu inserieren sind. Seine Hauptbeschränkung ergibt sich aus der Notwendigkeit, das Syntheseharz erneut in so viele Teile wie die gewünschten Codons aufzuteilen. Die Synthese wird dann relativ einfach, wenn die Anzahl der Codons klein ist, jedoch extrem komplex, falls sie hoch ist, wenn bis zu 20 verschiedene Syntheseträger für jede zur Randomisierung vorgesehene Position präpariert werden müssen. Nachdem es erforderlich ist, mit relativ kleine Harzmengen zu arbeiten, um die Produktionskosten niedrig zu halten, wird es extrem mühsam, das Harz in 10 oder mehr verschiedene Mengen zu unterteilen, und bei den komplizierten Vorgängen der chemischen Reaktionen und Waschschritte, die in jedem Synthesezyklus erforderlich sind, schwierig zu handhaben. Darüber hinaus ist anzumerken, dass der Maßstab der Synthese nicht um mehr als einige wenige Mikromol erhöht werden kann (etwa 10-15 Mikromol), ohne beträchtliche Effizienzverluste in den Kopplungsreaktionen zu ergeben.
Zusammenfassung der Erfindung
Die vorliegende Erfindung hat die Überwindung der vorgenannten Probleme durch ein Verfahren, welches gleichzeitig eine bemerkenswerte Einfachheit und Kosteneffizienz bei der Synthese gewährleistet, zum Ziel. Die Erfindung basiert auf der Beobachtung, dass jedes Trinukleotid, das ein Codon ausmacht, als aus einem Mononukleotid und einem Dinukleotid, welches diesem in der Sequenz folgt oder zuvor kommt, gebildet betrachtet werden kann.
Die speziellen Merkmale dieses Ansatzes sind ersichtlich durch einen einfachen Vergleich der auf die übliche Weise dargestellten Codons (Tabelle I) mit denselben Codons, welche dargestellt sind, um die Kombinationen von Mononukleotid-Dinukleotid (Tabelle II) und Dinukleotid-Mononukleotid (Tabelle III) hervorzuheben. TABELLE I: Genetischer Code
TABELLE II: B+D-Kombination
TABELLE III: D+B-Kombination
Speziell in Tabelle II ist jedes Codon dargestellt als Resultat der Kombination des ersten Nukleotids mit einem Dinukleotid (hier im folgenden auch als B+D bezeichnet, wobei B das einzelne Nukleotid bedeutet und D das Dinukleotid), während Tabelle III (ebenfalls von I abgeleitet) die Codons als von Dinukleotiden, welche dieses Mal der ersten und zweiten Base des Codons entsprechen, plus einem Einzelnukleotid, das der dritten Base entspricht (hier im folgenden auch als D+B bezeichnet, gemäß der früher verwendeten Terminologie), abgeleitet darstellt.
Eine sorgfältige Prüfung dieser beiden alternativen Darstellungen des genetischen Codes ermöglichte dem Erfinder die Feststellung, dass im Vergleich zu anderen Ansätzen die minimale Anzahl monomerer Einheiten (bestehend aus Dinukleotiden), die für die Kodierung aller Aminosäuren erforderlich sind, durchwegs verringert werden kann. Tatsächlich entspricht sie gemäß der Darstellung D+B den 13 Dinukleotiden (hervorgehoben durch die Schattierung in Tabelle III), einer sehr geringen Anzahl, die sogar auf noch weniger, auf 7, sinkt (ebenfalls durch eine Schattierung in Tabelle II hervorgehoben), falls der B+D-Code-Darstellung gefolgt wird. Die B+D-Kombination muss deshalb als die günstigste betrachtet werden.
Ferner können andere Kombinationen aus den Tabellen II und III erhalten werden, welche, obwohl insgesamt weniger günstig als die D+B-Kombination, aufgrund ihrer niedrigen Anzahl der erforderlichen Dinukleotide immer noch den Vorteil der Einführung von Codons, welche bei der genetischen Expression in verschiedenen Organismen bevorzugt sind, in die Sequenz bieten. Auf Grundlage des derzeitigen Kenntnisstandes der unterschiedlichen Verwendung verschiedener Codons in E. coli, Hefen und eukaryotischen Zellen ist es, wenn die Anzahl der erforderlichen Dimere für die Bildung jeder Synthesemischung (hinsichtlich der detaillierten Beschreibung der Erfindung siehe unten) immer minimal gehalten wird, möglich, von der Tabelle II, den Tabellen IV, V bzw. VI auszugehen, worin die Codonhäufigkeiten der einzelnen Codons gezeigt sind, während die günstigsten Auswahlen durch Schattierung hervorgehoben sind. TABELLE IV: Kombination B+D, angewandt auf E. coli
TABELLE V: Kombination B+D, angewandt auf Hefe
TABELLLE VI: Genetischer Code, Base + Dimer gemäß den häufigsten Codons bei Eukaryoten
Das chemische Syntheseverfahren wird entsprechend der gewählten Kombination organisiert. Gemäß den Merkmalen des gewählten Ansatzes ist das bevorzugte vorgeschlagene Verfahren dasjenige, welches auf der Nukleotid-Dinukleotid-Kombination basiert, welche in Tabelle II gezeigt (d.h. die B+D-Kombination) und hier im folgenden beschrieben ist.
Das Verfahren sieht die Herstellung vier identischer Synthesesäulen vor, enthaltend das übliche Harz, das für diesen Zweck verwendet wird, gekennzeichnet mit den Bezeichnungen der vier Nukleotide, d.h. T (oder U, wenn ein Polyribonukleotid zu synthetisieren ist), C, A, G. Dann wird eine Mischung geeignet ausgewählter Dinukleotide auf dem Harz in einem automatischen Synthesizer kondensiert. In der ersten Säule (T) besteht die Mischung aus den Dinukleotiden, welche in Tabelle II entsprechend schattiert sind (TT; CT; AT; GT; GG). In der zweiten Säule (C) besteht die Mischung aus den Dinukleotiden, die in Tabelle II entsprechend schattiert sind (TT; CT; AT; AA; GT). In der dritten Säule (A) besteht die Mischung aus den Dinukleotiden, welche in Tabelle II entsprechend schattiert sind (TT; TG; CT; AT; AA). In der vierten (G) besteht die Mischung aus den Dinukleotiden, welche in Tabelle II entsprechend schattiert sind (TT; CT; AT; AA; GT). Auf diesen Synthesezyklus folgt dann ein zweiter Zyklus, wobei ein einzelnes Nukleotid (und speziell dasjenige, das mit dem Symbol der Säule gezeigt ist, d.h. T in der ersten, C in der zweiten, A in der dritten und G in der vierten) jeder Säule zugegeben wird. Am Ende des zweiten Zyklus werden alle 20 der vorgewählten Codons in das Harz der vier Säulen eingebaut worden sein, jedoch werden in jeder Säule nur die in Tabelle II schattierten Codons anwesend sein. Zur weiteren Randomisierung der Sequenz werden die Säulen nun geöffnet, das Syntheseharz wird gewonnen und die vier Harze werden sorgfältig gemischt.
Das gemischte Harz wird erneut auf vier Säulen verteilt, die Säulen werden erneut mit der Synthesevorrichtung verbunden und die beiden Synthesezyklen werden wie zuvor beschrieben wiederholt. In der Praxis werden in jedem doppelten Synthesezyklus drei neue Einheiten der sich bildenden Polynukleotidkette hinzugefügt, um nur die vorgewählten Codons zu bilden, jedoch in völlig statistischer Weise, d.h. unabhängig von den ausgewählten Codons.
Dieses Syntheseverfahren bietet beträchtliche Vorteile gegenüber den im Stand der Techniken beschriebenen, welche hier im folgenden zusammengefasst werden.

• Die Dinukleotidsynthese wird nach Verfahren durchgeführt, die in der Literatur gut beschrieben sind, und daher unter Verwendung von kostengünstigen, im Handel erhältlichen Reagenzien, in Lösung und mit Produktausbeuten von 85-90 % (Kumar, G., 1984).
• In den meisten Fällen steht zu erwarten, dass der Unterschied in der Reaktivität verschiedener Dinukleotide geringer ist als Reaktivitätsunterschiede bei insbesondere Trinukleotiden. Die Hauptfolge ist, dass homogene Inkorporationen von allen Molekülspezies, die in der Synthesemischung vorliegen, in der sich bildenden Polynukleotidkette leichter zu erhalten sind. Die Reinheit der Reagenzien ist ein bestimmender Faktor für diesen Aspekt der Reaktion.
• Die Gesamtanzahl der Dinukleotide, welche zur Abdeckung aller möglichen Kombinationen erforderlich ist, ist äußerst niedrig. Tatsächlich variiert sie von einem Minimum von 7 bis zu einem Maximum von 20 und in den üblicheren Fällen, wie den hier beschriebenen, sind 11 Dimere ausreichend.
• Die Auswahl der zu verwendenden Dinukleotide kann so erfolgen, dass die Anzahl der Molekülspezies, welche die Synthesemischung bilden, minimiert wird. Ein Beispiel ist das in Tabelle II gezeigte, wobei die Dimere so gewählt sind, dass jede Synthesemischung nur 5 Dinukleotide enthält. Dies macht die Suche nach geeigneten Reaktionsbedingungen und relativen molaren Konzentrationen der Reagenzien viel einfacher, um die homogene Inkorporation aller Komponenten zu optimieren.
• Eine Synthese, die gemäß diesem Ansatz durchgeführt wird, ermöglicht die Inkorporation vollständiger Codons in der sich bildenden Kette. In der Tat ermöglicht eine sorgfältige Auswahl von Dinukleotiden und Mononukleosiden eine Steuerung der Synthese, um unerwünschte Codons, wie z.B. Stoppcodons, auszuschließen. Eine Kombination, welche speziell nur Stoppcodons ausschließt, ist beispielsweise die in Tabelle II gezeigte, es ist jedoch auch möglich, die Kombination zu modifizieren, um in einer oder mehreren Positionen) der endgültigen Sequenz ein beliebiges unerwünschtes Codon auszuschließen. Falls beispielsweise irgendwelche Aminosäuren von einer bestimmten Position der Polypeptidkette ausgeschlossen werden sollen, beispielsweise die sauren (Glutaminsäure, Glu oder E, und Asparaginsäure, Asp oder D), würde das Weglassen der Dimere AT und AA in der der Säule G zugegebenen Mischung in dem Synthesezyklus, der der gewünschten Position entspricht, ausreichen. Jedoch sind entsprechend demselben Prinzip zahlreiche andere Kombinationen möglich.
• Bezüglich der Synthese einer jeden Aminosäure erlaubt die Möglichkeit der Auswahl eines geeigneten Codons unter den vielen möglichen Codons den Einbau nur derjenigen Codons, welche vorwiegend bei der Proteinsynthese des ausgewählten Mikroorganismus verwendet werden. Deshalb ist es durch Weglassen aus der Mischung von Oligonukleotiden mit statistischer Sequenz derjenigen Oligonukleotide, welche in dem System mit einer geringeren Effizienz translatiert werden, möglich, die genetische Expression zu maximieren und somit eine bessere Entsprechung zwischen den Homogenitäten des Oligonukleotids und der resultierenden Oligopeptidmischung zu erhalten.

Alle diese Erwägungen unterstreichen die bemerkenswerten Vorteile, die sich aus einem solchen Ansatz ergeben. In der Tat betreffen sie nicht ausschließlich das Verfahren, das auf einer B+D-Kombination basiert, sondern gelten im Gegenteil für jede Art von Verfahren, das sich aus dem allgemeinen Ansatz ergibt und deshalb aus dem vorgenannten ableitbar ist.
In der Tat ist es beispielsweise auf Grundlage der in Tabelle III gezeigten Kombination möglich, ein Syntheseverfahren abzuleiten, welches sich von dem vorhergehenden nur hinsichtlich des Aspekts unterscheidet, dass die Reihenfolge der beiden synthetischen Zyklen umgekehrt werden muss: zuerst werden alle einzelnen Mononukleotide auf synthetischen Harzen kondensiert und Dinukleotidmischungen nur in der zweiten Runde.
Dieses zweite Verfahren, ebenso wie die anderen, die sich von weiteren möglichen Kombinationen ableiten, sollen, obwohl von der Zielsetzung der Erfinder umfasst, nicht weiter spezifiziert werden, da sie im wesentlichen von dem zuvor beschriebenen ersten Verfahren ableitbar sind.
Beschreibung der Figuren
Die Erfindung wird mit Hilfe der beigefügten 1 besser verständlich werden.
1 zeigt die chemische Struktur der Dimere, welche als monomere Einheiten bei der Synthese der Codons der endgültigen Sequenz verwendet werden. Jedes Dimer wird erhalten durch Substitution von Gruppen in B2- und dann in B1-Position, wie für jedes Dimer angegeben.
Detaillierte Beschreibung der Erfindung
Ein Verfahren wird beschrieben zur Synthese von Oligonukleotidmischungen, welche vollständig oder teilweise randomisierte Nukleotidsequenzen enthalten und welche die folgenden Merkmale aufweisen:

• jede Mischungskomponente kodiert für ein unterschiedliches Polypeptid. Verschiedene Oligonukleotide, die für das gleiche Polypeptid kodieren, liegen in der Mischung nicht vor;
• der statistische Sequenzanteil, der in jeder Mischungskomponente inkorporiert ist, ist so aufgebaut, dass sich die Zufallsbestimmtheit der Sequenz auf eine Einheit von drei benachbarten Nukleotiden (gewöhnlich einem Codon entsprechend) anstelle von einzelnen Nukleotiden bezieht.

Der statistische Sequenzanteil, der in jeder Mischungskomponente inkorporiert ist, ist in der Tat so aufgebaut, dass, wenn man drei benachbarte Nukleotideinheiten betrachtet, jede Einheit die Sequenz einer begrenzten Anzahl von Trinukleotiden, definiert in einer vorgegebenen Liste und 2 bis 64 der möglichen Trinukleotide, gebildet durch die Kombination der vier natürlichen Mononukleotide, enthaltend, aufweisen kann.
Diese Merkmale sind eine direkte Folge des Syntheseverfahrens. In seiner bevorzugten Form basiert dieses auf den folgenden Vorgängen:

a) Vorselektion von Dinukleotiden in Gruppen, wobei jede Gruppe aus denjenigen Dinukleotiden besteht, welche die zweite und dritte Base mindestens eines der Codons bilden, die in der Sequenz gewünscht werden und die erste Base gemeinsam haben.
b) Herstellung von Mischungen, welche aktivierte Dinukleotide enthalten, wobei die Dinukleotide in den Mischungen durch den Vorgang unter a) gruppiert und in einer geeigneten Konzentration neu verteilt sind, um eine Homogenität in der entsprechenden Repräsentation von Tripletts zu erhalten;
c) eine Synthese, welche parallel oder nicht durchgeführt werden kann, in einem oder mehreren Reaktionsbehältern, die einen Träger für die Festphasensynthese einer bekannten Sequenz enthalten, die am 3'-Terminus der endgültigen Sequenz entstehen wird;
d) Zugabe der Mischungen aktivierter Dinukleotide unter b) zu den Synthesebehältern, eine für jeden Behälter, und Durchführung einer Bindungsreaktion der darin enthaltenen aktivierten Dinukleotide mit dem 5'-Terminus der synthetisierten Sequenzen unter c);
e) Zugabe von mindestens einem Mononukleotid zu mindestens einem der Synthesebehälter, ein Mononukleotid für jeden Behälter, und Durchführung einer Bindungsreaktion am 5'-Terminus der Dinukleotide;
f) Öffnen des Behälters und Mischen der Träger, um eine homogene Reaktionsmischung zu erhalten;
g) Rekonstitution der Synthesebehälter mit einer Menge der homogenen Mischung unter Punkt g), welche einem Bruchteil von 1/n für jeden Behälter entspricht, wobei n die Anzahl der verwendeten Behälter ist;
h) Wiederholung der Arbeitssequenz unter d), e), f) und g) so oft wie von der Anwendungsgestaltung gefordert;
i) parallele oder nicht parallele Synthese einer bekannten Sequenz, welche am 5'-Terminus des endgültigen Polynukleotidprodukts vorliegen wird, in den Behältern.

Zur beispielhaften Erläuterung der Wege zur Durchführung der verschiedenen vorstehenden Vorgänge wird das Verfahren hier im folgenden zusammengefasst, deshalb kann auf der Grundlage von Ausführungskriterien, die häufiger in der Laborpraxis angewandt werden, jeder Schritt nachgearbeitet werden (oder in Teilschritte unterteilt).
Das Verfahren kann somit wie folgt realisiert werden:

α. Eine Tabelle der 64 Trinukleotide, erhältlich unter Berücksichtigung der Kombination jedes der 4 möglichen Nukleotide mit jedem der 16 möglichen Dinukleotide (wie z.B. in Tabelle II).
β. Neben jedem in der Tabelle aufgeführten Trinukleotid sind die Merkmale notiert, welche bei der Verwendung des zu synthetisierenden Polynukleotids zu berücksichtigen sind. In der üblichsten (jedoch nicht einzigen) Form sind diese Merkmale die Aminosäuren, welche entsprechend dem natürlichen genetischen Code kodierf werden, und die relative Häufigkeit des Trinukleotids in natürlichen Polynukleotidsequenzen von Organismen, worin das zu synthetisierende Polynukleotid schließlich exprimiert werden soll (wie in den Tabellen IV, V und VI). Sollte es sich als möglich erweisen, andere spezielle Merkmale zu etablieren, die Trinukleotiden inhärent sind, könnten diese für die Wahl einer Synthesestrategie berücksichtigt werden.
γ. Dann wird eine Selektion gewünschter Trinukleotide durchgeführt, wobei versucht wird, die Anzahl von Dinukleotiden, die für deren Synthese erforderlich sind, auf einem absoluten Minimum zu halten und sie so gleichförmig wie möglich in den vier Säulen der Tabelle verteilt zu haben (wie beispielhaft dargestellt durch die Schattierungen in den Tabellen II, III, IV, V und VI).
δ. Herstellung der ausgewählten Dimere in einer aktivierten und geschützten Form. In einer bevorzugten Ausführungsform sieht die vorliegende Erfindung die Herstellung der erforderlichen Dinukleotide wie von Kumar, G., und Poonian, M.S., J. Org. Chem. (1984), Bd. 49, S. 4905-4912, beschrieben vor. Die so erhaltenen Dimere werden an ihrem 5'-Terminus mit einer Dimethoxytritylgruppe geschützt, während der 3'-Terminus des Dimers mit Cyanoethylphosphoramidit derivatisiert wird. Basen werden mit den im Stand der Technik beschriebenen und bei der Oligonukleotidsynthese nach dem Phosphoramidit-Verfahren verwendeten Schutzgruppen geschützt (wie beispielsweise, nicht beschränkend, in 1 dargestellt). Die Dimer-Reinheit beträgt 85-90 %, wie mittels Dünnschichtchromatographie (DC) und magnetischer Kernresonanz, durchgeführt mit Phosphor³¹(³¹P-NMR), bestimmt. Zur Festlegung des Umfangs dieser Erfindung sind die Syntheseverfahren der verschiedenen Dimere nicht von Bedeutung, so lange sie mit dem Kondensierungsverfahren auf einer festen Matrix, das für die Polynukleotidsynthese verwendet wird, kompatibel sind.
ε. In der bevorzugten Ausführungsform wird die Polynukleotidsynthese parallel durchgeführt, wobei als Synthesebehälter vier Chromatographiesäulen für die Festphasensynthese, enthaltend Harz als Träger, eingesetzt werden, wobei übliche Protokolle, welche vom Hersteller der verwendeten Apparatur beschrieben sind, eingesetzt werden. Auf jeden Fall werden in dem vorliegenden Patent Verfahren unter Bezugnahme auf beispielsweise die Firma Perkin Elmer beschrieben, es ist jedoch gleichermaßen möglich, irgendeinen anderen Satz oder irgendein anderes Festphasensyntheseverfahren, basierend auf den gleichen oder ausreichend ähnlichen chemischen Reaktionen, einzusetzen. Vier Synthesesäulen werden dann mit dem Satz verbunden und gewöhnlich (jedoch nicht notwendigerweise) für die parallele Synthese eines 3'-terminalen Abschnitts mit einer einzigen und definierten Sequenz eingesetzt. Diese enthält oft Spaltstellen für die Restriktionsenzyme oder irgendeine andere Sequenz, welche für die Klonierung oder für irgendeine andere wünschenswerte Anwendung des Polynukleotids von Nutzen ist.
ζ. Dann werden auf den Säulen 1, 2, 3 bzw. 4 (auch als T, C, A und G bezeichnet, gemäß dem Mononukleotid, das später hinzugefügt werden soll) die Dinukleotid-Mischungen, welche T, C, A und G entsprechen, gemäß der Definition der Codons wie in der ausgewählten Referenztabelle (z.B. eine der Tabellen II, IV, V, VI oder sogar andere, erstellt wie vorstehend unter α, β und γ des vorliegenden Abschnitts beschrieben) angegeben hinzugefügt. Die Mischung, welche Dinukleotide entsprechend T enthält, soll als Mischung T bezeichnet werden, diejenige, die A entspricht, als Mischung A usw.

Die molare Zusammensetzung der verschiedenen Mischungen sowie die Kopplungszeiten müssen gemäß den Umständen optimiert werden.
Bei der üblichen Praxis werden Kopplungszeiten im Bereich von 20 Sekunden bis 8 Minuten gewählt, während die relativen molaren Konzentrationen einzelner Dinukleotide, die in den Mischungen vorliegen, von der Äquimolarität abweichen können, um sowohl die Reinheit der einzelnen Dinukleotide als auch deren Reaktivität zu berücksichtigen. Angaben für die Reaktivität einzelner Dinukleotide können von der Reaktivität der Trinukleotide mit demselben 3'-terminalen Dinukleotid abgeleitet werden, wie erörtert in Virnekas et al., 1994, Ono et al., 1994, Kagushin et al., 1994.
Die Kondensierungsreaktion für die Dimere geschieht gewöhnlich mit einer 90-95%igen Ausbeute, gemessen mittels Freisetzung von Trityl.

η. Der nächste Syntheseschritt besteht in der Kopplung eines jeden Monomers an die entsprechende Säule und Mischung wie im folgenden beschrieben: Säule 1 (Mischung T) 5'-O-Dimethoxytrityl, Thymidin-3'-O-cyanoethylphosphoramidit Säule 2 (Mischung C) 5'-O-dimethoxytrityl, Desoxycytidin-N4-benzoyl-3'-O-cyanoethylphosphoramidit Säule 3 (Mischung A) 5'-O-Dimethoxytrityl, Desoxyadenosin-N6-Benzoyl-3'-O-cyanoethylphosphoramidit Säule 4 (Mischung G) 5'-O-Dimethoxytrityl-Monomer, Desoxyguanosin-N2-isobutyryl-3'-O-cyanoethylphosphoramidit. Nach der üblichen Acetylierung der Sequenzen, welche nicht reagierten, und der Oxidation der Internukleotidphosphorbrücke (gemäß klassischen Syntheseschritten) wird die Synthese beendet.
θ. Die vier Synthesesäulen werden geöffnet und deren Harze gemischt, um eine homogene Mischung zu erhalten.
ι. Die vier Synthesesäulen werden mit einer äquivalenten Menge an Harz pro Säule rekonstituiert und die Säulen wieder mit dem Synthesizer verbunden.
κ. Der Prozess von ζ bis ι wird so oft widerholt wie von der Anzahl der statistischen Trinukleotide gefordert, welche in das Polynukleosid inseriert werden.
λ. Die Synthese wird gewöhnlich terminiert durch parallele Synthese auf den vier Säulen eines 5'-terminalen Polynukleotid-Endes bestimmter Sequenz, welche analoge Funktionen zu der in ε erörterten 3'-terminalen Sequenz besitzt.

Deshalb ist unter Berücksichtigung aller Erläuterungen der Gegenstand der vorliegenden Erfindung ein Verfahren zur chemischen Synthese von Polynukleotiden mit einer vollständig oder teilweise statistischen Sequenz, so dass für den statistischen Sequenzanteil jede Trinukleotideinheit, die einem Codon entspricht, eine begrenzte Anzahl vorgegebener Sequenzen aufweisen kann. Das Verfahren ist gekennzeichnet durch die Tatsache, dass als monomere Einheiten zur Synthese des statistischen Sequenzanteils vorsynthetisierte Mononukleotide und Dinukleotide eingesetzt werden, und die Tatsache, dass die Synthese auf einer Mehrzahl von Trägern durchgeführt wird, so dass auf jedem der Träger mindestens ein Reaktionszyklus, in dem eine Mischung dieser Dinukleotide gebunden wird, alternierend mit mindestens einem Reaktionszyklus, in dem ein Mononukleotid gebunden wird, durchgeführt wird. In einer bevorzugten Ausführungsform werden am Ende der Reaktionszyklen, welche für die Synthese eines Codons erforderlich sind, die Träger gemischt und dann erneut in zwei oder mehr Reaktionsbehälter aufgeteilt.
Insbesondere wird der Fall betrachtet, dass die Dinukleotide die zweite und dritte Base oder die erste und zweite Base derjenigen Codons bilden, welche die erste bzw. dritte Base gemeinsam haben.
Ferner sind die betrachteten Fälle diejenigen, in denen solche Polynukleotide aus Desoxyribonukleotiden aufgebaut sind, sowie derjenige, in dem sie aus Ribonukleotiden aufgebaut sind.
Wenn Dinukleotide, welche der zweiten und dritten Base derjenigen Codons entsprechen, welche die erste Base gemeinsam haben (entsprechend der B+D-Struktur, wie in der bevorzugten Ausführungsform zu sehen), eingesetzt werden, ist das Verfahren dasjenige, das oben ausführlich in den Vorgängen a) bis i) erläutert wurde.
In dem analogen Fall, in dem die Dinukleotide verwendet werden, welche der ersten und zweiten Base derjenigen Codons entsprechen, welche die dritte Base gemeinsam haben (entsprechend dem D+B-Schema), ist das Verfahren fast vollständig identisch, abgesehen von einer Umkehrung der Vorgänge d) und e).
Spezielle Fälle treten auf, wenn die Synthese parallel durchgeführt wird und wenn vier Mischungen vorliegen, die Träger aus einem Harz bestehen und die Behälter aus Säulen bestehen.
Gegenstand der vorliegenden Erfindung ist auch das Verfahren unter Verwendung von Dinukleotiden, welche die Bildung von Trinukleotideinheiten bestimmen, die den häufigsten Codons in E. coli, Eukaryoten und Hefegenomen entsprechen, und speziell den Dinukleotiden TT, TC, TG, CT, CC, CG, AC, AA, AG, GT, GG, den Dinukleotiden TC, TG, CC, AG, AG, GC, GG, bzw. den Dinukleotiden TT, TC, TG, CT, CA, AC, AA, AG, GT, GA, GG.

Bezüglich der ersten Folge von Dinukleotiden wird insbesondere der Fall betrachtet, in dem sie in vier Mischungen wie folgt gemischt werden: W = TC; TG; CC; AC; AA; X = TG; CG; AC; AG; GT; Y = TT; CT; AC; AA; GT; Z = TC; CT; AC; GT; GG, und der Fall, in dem Codons auf den vier Harzsäulen nach der folgenden Gruppierung erhalten werden:

AW₁ =	Isoleucin, Methionin, Threonin, Asparagin, Lysin;
CX₁ =	Leucin, Prolin, Histidin, Glutamin, Arginin;
GY₁ =	Valin, Alanin, Asparaginsäure, Glutaminsäure, Glycin;
TZ₁ =	Phenylalanin, Serin, Tyrosin, Cystein, Tryptophan.

Schließlich wird als genauso wichtig der Fall betrachtet, in dem Dinukleotide in den folgenden molaren Anteilen gemischt werden: W₂: [AA] = [CC] = (TG] = [AC] = 1 M, [TC] = 1,5 M; X₂: [TG] = [AG] = [GT] = [CG] = 1 M, [AG] = 1,5 mM; Y₂: [GT] = [AC] = [CT] = [AA] = 1 M, und [TT] = 1,5 M; Z₂: [GG] = 2 M, [AC] = [CT] = [GT] = 1 M und [TC] = 1,5 M.
Soweit wurde nur eine allgemeine Beschreibung der vorliegenden Erfindung gegeben. Mit Hilfe der hier folgenden Beispiele wird nunmehr eine detailliertere Beschreibung ihrer spezifischen Ausführungsformen gegeben, mit dem Ziel, ein besseres Verständnis der Ziele, Merkmale, Vorteile und Durchführungsmodalitäten der Erfindung zu vermitteln. Diese Beispiele dienen nur zur Erläuterung und nicht zur Beschränkung des Umfangs der vorliegenden Erfindung, welcher durch die beigefügten Ansprüche definiert ist.
BEISPIEL 1
Synthese von 11 geschützten Dinukleotiden nach den in 1 beschriebenen Formeln.
Zur Herstellung der erforderlichen Dimere für die Synthese eines Polynukleotids mit einer teilweise randomisierten (aber hinsichtlich einer besseren Transkription in E. coli kontrollierten) Sequenz wurde anhand der Untersuchung der Tabelle IV die Entscheidung getroffen, 11 Dinukleotide, die schattiert in der Tabelle gezeigt sind, nach dem von Kumar, G., und Poonian beschriebenen Verfahren (Kumar, G., und Poonian, M.S., J. Org. Chem. (1984), Bd. 49, S. 4905-4912) herzustellen. Die so erhaltenen Dimere werden an ihrem 5'-Terminus mit einer Dimethoxytritylgruppe geschützt, während der 3'-Teil des Dimers mit Cyanoethylphosphoramidit derivatisiert wird. Die Basen werden mit den Schutzgruppen geschützt, welche zur Synthese der Oligonukleotide nach dem Phosphoramiditverfahren verwendet werden, wie in Kumar und Poonian berichtet und in 1 angegeben.
Die Reinheit der Dimere, bestimmt mittels DC und ³¹P-NMR, wurde aus der folgenden Aufstellung analytischer Daten abgeleitet:
1H-NMR (CDCl₃), gemeinsam für alle Dimere:
δ 1,15-1,25 (12H, m, Isopropyl), 2,15-2,50 (4 × 2'-H), 2,80-2,90 (2H, m, -CH₂CN und 2H, m, OCH₂ Cyanoethyl), 3,70-3,90 (13H, m, 2 × 5'-H von 5'-Nukleosid, 2 × OCH₃ von DMTr, POCH₃ und 2H, m, -CH-Isopropyl), 4,00-4,50 (4H, 2 × 5'-H von 3'-Nukleosid und 2 × 4'-H), 5,00-5,35 (2H, m, 3'-H), 6,20-6,50 (2H, m, 1'-H), 6,80-6,95 (4H, d, J = 8,8 Hz, 3,3', 5,5'-H von DMTr), 7,15-7,30 (9H von DMTr)
DMTr T/T Phos
¹H (CDCl₃): δ 1,90-1,95 (6H, m, CH₃ von Tim.), 7,20-7,25 (2H, m, 6-H of Tim.). ³¹P (CDCl₃): δ –1,41, –2,26 (2 × P (V) Diast.); 147,00, 148,60 (2 × P (III) Diast.). ESI-MS: m/z 1085,03 (M + Na⁺); Rf: 0,44 (5 % MeOH/DCM)
DMTr A/A Phos
¹H (CDCl₃): δ 7,20-8,05 (10H, m, Bz), 8,10-8,80 (4H, m, 2-H und 8-H von Ade). ³¹P (CDCl₃): δ –1,69, –1,91 (2 × P (V) Diast.); 148,10, 148,60 (2 × P (III) Diast.). ESI-MS: m/z 1289,5 (M + Na⁺); Rf: 0,47 (5 % MeOH/DCM)
DMTr C/C Phos
¹H (CDCl₃): δ 7,25-7,40 (4H, m, 2 × 5,6-H von Cit.), 7,50-8,20 (10H, m, Bz). ³¹P (CDCl₃)_: δ –1,19, –1,94 (2 × P (V) Diast.); 147,88, 149,07 (2 × P (III) Diast.). ESI-MS: m/z 1242,5 (M + H⁺); Rf: 0,48 (5 % MeOH/DCM)
DMTr G/G Phos
¹H (CDCl₃): δ 1,20-1,40 (12H, m, CH₃ von Isobut.), 2,40-2,55 (2H, m, CH von Isobut.), 7,50-7,60 (2H, m, 8-H von Gua.).³¹P (CDCl₃):δ –2,19, –1,51 (2 × P (V) Diast.); 147,69, 148,19 (2 × P (III) Diast.). ESI-MS: m/z 1253,2 (M + H⁺); Rf: 0,37 (5 % MeOH/DCM) ³¹P (CDCl₃): δ –2,20, –3,00 (2 × P (V) Diast.); 147,20, 148,20 (2 × P (III) Diast.). ESI-MS: m/z 1158,4 (M + H⁺); Rf: 0,37 (5 % MeOH/DCM)
DMTr T/C Phos
¹H (CDCl₃): δ 1,20-1,40 (3H, m, CH₃ von Tim.), 7,30-7,40 (3H, m, 5, 6 von Cit. und 6-H von Tim.), 7,45-8,20 (5H, m, Bz). ³¹P (CDCl₃): δ 1,00, –1,98 (2 × P (V) Diast.); 147,8, 148,4 (2 × P (III) Diast.). ESI-MS: m/z 1152,4 (M + H⁺); Rf: 0,41 (5 % MeOH/DCM)
DMTr T/G Phos
¹H (CDCl₃): δ 1,05-1,15 (6H, m, CH₃ von Isobut.), 1,20-1,30 (3H, m, CH₃ von Tim.), 2,30-2,45 (1H, m, CH von Isobut.), 7,20-7,25 (1H, m, 6-H von Tim.), 7,40-7,70 (1H, m, 8-H von Gua.).
DMTr A/G Phos
¹H (CDCl₃): δ 1,05-1,15 (6H, m, CH₃ von Isobut.), 2,30-2,50 (1H, m, CH von Isobut.), 7,45-8,70 (8H, m, 2, 3, 4, 5, 6-H Di-Bz, 8-H von Gua. und 2,8-H von Ade.). ³¹P (CDCl₃): δ –1,63, –2,20 (2 × P (V) Diast.); 147,06, 148,54 (2 × P (III) Diast.). ESI-MS: m/z 1271,4 (M + H⁺); Rf: 0,38 (5 % MeOH/DCM)
DMTr A/C Phos
¹H (CDCl₃): δ 7,05-7,15 (2H, m, 5, 6-H von Cit.), 7,50-8,70 (12H, m, 2 × (2, 3, 4, 5, 6-H) von Bz und 2, 8-H von Ade.). ³¹P (CDCl₃): δ –0,19, 0,29 (2 × P (V) Diast.); 147,66, 148,66, 148,85 (2 × P (III) Diast.). ESI-MS: m/z 1266,1 (M + H⁺); Rf: 0,44 (5 % MeOH/DCM)
DMTr C/T Phos
¹H (CDCl₃): δ 1,40 (3H, s, 3H von Tim.), 7,20-7,40 (3H, m, 5, 6-H von Cit. und 6-H von Tim.), 7,50-8,05 (5H, m, Bz). ³¹P (CDCl₃): δ –1,53, –1,98 (2 × P (V) Diast.); 148,20, 148,45 (2 × P (III) Diast.). ESI-MS: m/z 1175 (M + Na⁺); 1191 (M + K⁺); Rf: 0,42 (5 % MeOH/DCM)
DMTr G/T Phos
¹H (CDCl₃): δ 1,1-1,25 (6H, m, CH₃ von Isobut.), 1,30-1,35 (3H, m, CH₃ von Tim.), 2,25-2,50 (1H, m, CH von Isobut.), 7,15-7,20 (1H, m, 6-H von Tim.), 7,70-7,75 (1H, m, 8-H von Gua.). ³¹P (CDCl₃): δ –0,40, –1,00 (2 × P (V) Diast.); 148,00, 148,80 (2 × P (III) Diast.). ESI-MS: m/z 1158,5 (M + H⁺), 1181 (M + Na⁺), 1196,4 (M + K⁺); 0,41 (5 % MeOH/DCM)
DMTr C/G Phos
¹H (CDCl₃): δ 1,30 (6H, m, CH₃ von Isobut.), 2,20-2,25 (1H, m, CH von Isobut.), 7,15-7,25 (2H, m, 5, 6-H von Cit.), 7,45-8,30 (6H, m, 5-H Bz und 8-H von Gua.).³¹P (CDCl₃): δ –2,47, –2,69 (2 × P (V) Diast.); 147,75, 148,16 (2 × P (III) Diast.). ESI-MS: m/z 1246 (M + H⁺); 0,44 (5 % MeOH/DCM)
Aus diesen Daten kann abgeleitet werden, dass die Reinheit der synthetisierten Dimere zwischen 85 und 90 % liegt.
BEISPIEL 2
Synthese eines Oligonukleotids, bestehend aus 20 Nukleotiden gemäß der Formel:
5'-AGTCGCG[P'P]TCGACCT-3'
wobei P' und P Trinukleotide bedeuten, welche für irgendwelche der 20 natürlichen Aminosäuren kodieren können, ausgewählt, um die bekannte Verwendungshäufigkeit für den Mikroorganismus E. coli zu reflektieren.
Die Mischung, welche sich aus dieser Synthese ergibt, wird tatsächlich aus insgesamt 400 verschiedenen Polynukleotiden bestehen.
Mit den 11 Dinukleotiden, die wie in Beispiel 1 hergestellt wurden, werden dann vier Mischungen auf folgende Weise vorbereitet: Mischung Z

Dimer TC 0,0225 mmol

CT 0,015 mmol

AG 0,015 mmol

GT 0,015 mmol

GG 0,03 mmol
Die ausgewogenen Mengen werden dann in 1 ml Acetonitril gelöst, um eine Endkonzentration von 0,0975 mmol/ml (d.h. 0,0975 M) zu ergeben. Mischung X

Dimer TG 0,015 mmol

CG 0,015 mmol

AC 0,015 mmol

AG 0,0225 mmol

GT 0,015 mmol
Die ausgewogenen Mengen werden in 1 ml Acetonitril gelöst, um eine Endkonzentration von 0,0825 mmol/ml (d.h. 0,0825 M) zu ergeben. Mischung W

Dimer TC 0,0225 mmol

TG 0,015 mmol

CC 0,015 mmol

AC 0,015 mmol

AA 0,015 mmol
Die ausgewogenen Mengen werden in 1 ml Acetonitril gelöst, um eine Endkonzentration von 0,0825 mmol/ml (d.h. 0,0825 M) zu ergeben. Mischung Y

Dimere TT 0,0225 mmol

CT 0,015 mmol

AC 0,015 mmol

AA 0,015 mmol

GT 0,015 mmol
Die ausgewogenen Mengen werden in 1 ml Acetonitril gelöst, um eine Endkonzentration von 0,0825 mmol/ml (d.h. 0,0825 M) zu ergeben.
Die vier Mischungen (W, X, Y, Z) werden in Acetonitril, das weniger als 30 ppm Wasser enthält, und unter Argon gelöst, auf den DNA APPLIED BIOSYSTEM 394 DNA/RNA-Synthesizer in den Positionen 5, 6, 7 bzw. 8 der Apparatur aufgetragen. Alle Reagenzien (Lösungsmittel, Aktivatoren und Synthesesäulen im Maßstab 40 nmol) wurden von Perkin Elmer erworben und gemäß den Instruktionen des Herstellers verwendet.
Die Synthese beginnt mit der parallelen Synthese des 3'-Abschnitts des Oligonukleotids auf den vier Säulen:
Dann wird der degenerierte Abschnitt des Oligonukleotids wie zuvor beschrieben synthetisiert:
Auf den Säulen 1, 2, 3 und 4 werden die Dimer-Mischungen W, X, Y und Z in den vorgenannten Konzentrationen zugegeben und die Reaktion wird durchgeführt, wobei eine dreiminütige Kopplungszeit gestattet wird. Die Kondensationsreaktion der Dimere wird gewöhnlich mit einer Ausbeute von 90-95 % durchgeführt, gemessen mittels Freisetzung von Trityl. Auf den Säulen werden die folgenden Oligonukleotide synthetisiert:
Dann folgt die Addition der Basen A, C, G und T auf den Reaktionssäulen 1, 2, 3 bzw. 4:
Nach den üblichen Acetylierung- und Oxidationsreaktionen (gemäß den klassischen Syntheseverfahren) wird die Synthese beendet. Die Säulen werden getrennt, geöffnet und das Harz der vier Synthesesäulen wird vereinigt (für insgesamt 40 mg) und homogen gemischt.
Die Mischung wird dann erneut in vier gleiche Teile ( 4 × 10 mg) aufgeteilt und dann erneut auf vier neue Synthesesäulen aufgeteilt:
wobei P = (AW + CX + GY + TZ).
Das Verfahren wird für die zweite degenerierte Position wiederholt: P'
Die Mischungen W, X, Y bzw. Z werden jeweils den Säulen 1, 2, 3 und 4 zugegeben:
dann folgt die Zugabe der dritten Base des Codons auf die jeweiligen Säulen:
Dann wird das Harz der vier Säulen homogen gemischt und auf vier neue Synthesesäulen aufgeteilt. Zu diesem Zeitpunkt wurde das zweite degenerierte Codon P' synthetisiert, deshalb enthalten die Säulen:
wobei P' = P = (AW, CX, GY, TZ)
Nach der Synthese des zweiten Trinukleotids P' (Base + Dimer-Mischung) wird die 5'-Region, welche das Oligonukleotid flankiert [AGT CGC G], auf den vier Säulen parallel synthetisiert, und hat daher die Oligonukleotid-Sequenz:
5'-AGTCGCGP'PTCGACCT-3'
wobei P' = P = (AW, CX, GY, TZ), entsprechend den Codons: ATC, ATG, ACC, AAC, AAA, CTG, CCG, CAC, CAG, CGT, GTT, GCT, GAC, GAA, GGT, TTC, TCT, TAC, TGT und TGG.
Wenn die Synthese vollständig ist, wird das an dem zur Synthese verwendeten Harz haftende Oligomer entfernt und gemäß den klassischen Verfahren, welche für die Konstruktion synthetischer Oligonukleotide unter Verwendung der Chemie von O-Methylphosphoramiditen verwendet werden (7), von der Schutzgruppe befreit.
BEISPIEL 3
Funktionelle und genetische Analyse des in Beispiel 2 synthetisierten Polynukleotids mit der Sequenz:
5'-AGTCGCG[P'P]TCGACCT-3'
wobei P' = P = (AW, CX, GY, TZ), entsprechend den Codons: ATC, ATG, ACC, AAC, AAA, CTG, CCG, CAC, CAG, CGT, GTT, GCT, GAC, GAA, GGT, TTC, TCT, TAC, TGT und TGG.
Das in Beispiel 2 synthetisierte degenerierte Polynukleotid besteht aus einer Mischung von 400 Polynukleotiden. Im vorliegenden Beispiel wurde die Mischung der Bequemlichkeit halber als "Polynukleotid B" bezeichnet. Zur Analyse seiner tatsächlichen Zusammensetzung, um in der Praxis zu verifizieren, dass alle 400 Molekülspezies, die von der Synthese erwartet werden, in der Mischung vorliegen, wurden die folgenden Schritte durchgeführt:
=> das folgende Oligonukleotid wurde mit einem herkömmlichen Verfahren synthetisiert:
Oligonukleotid A
14 Nukleotide
Sequenz: 5'CGCGACTAGGTCGA3'.
Die Sequenz dieses Oligonukleotids wurde so konzipiert, um sowohl in ihrem 3'-terminalen Teil (7 Nukleotide) zu dem 3'-terminalen Teil des Oligonukleotids B als auch in ihrem 5'-terminalen Teil (7 Nukleotide) zu dem 5'-terminalen Teil des Oligonukleotids B komplementär zu sein.

=> Beide Oligonukleotide wurden enzymatisch am 5'-Terminus phosphoryliert, in äquimolaren Mengen gemischt, bei 95° C denaturiert und dann verschmelzen und polymerisieren gelassen, indem die Temperatur langsam auf 15° C gebracht wurde.
=> Die Mischung wurde dann einer enzymatischen Ligierung und dann einer Komplettierungsreaktion durch Inkubation mit Klenow-Polymerase unterzogen. Die Ligierungsreaktion beinhaltet die Bildung eines Doppelhelix-DNA-Fragments, enthaltend aufeinanderfolgende "Kopf-Schwanz"-Wiederholungen einer DNA-Einheit, die aus den beiden gekoppelten Oligonukleotiden A und B besteht.
=> Die gebildeten Fragmente, welche mit glatten Enden entstanden, wurden dann in die EcoRV-Stelle des Plasmids pBSks+ kloniert. Die Ligierungsmischung wurde anschließend hinsichtlich der rekombinanten Klone mit EcoRV-Verdauung angereichert und zur Transkription von kompetenten XL-1-Blue-Bakterienzellen verwendet.
=> Rekombinante Klone wurden mittels colorimetrischer Selektion auf LB+Amp+Xgal/-IPTG-Platten identifiziert.
=> 20 zufällig ausgewählte Klone wurden expandiert und die darin enthaltene gesamte rekombinante Sequenz wurde amplifiziert und mittels PCR (Polymerasekettenreaktion) kloniert.
=> Die Analyse mittels Elektrophorese auf einem Agarosegel erlaubte die Feststellung der Länge einer jeden Klon-Insertion.
=> Inserts von 20 Klonen wurden sequenziert, was so die Bestimmung von 170 variablen Abschnitten, enthaltend im Oligonukleotid B, erlaubte.

Tabelle VIII zeigt die Häufigkeiten, die für jedes der 20 Trinukleotide, welche der Versuchsaufbau bereitstellte, beobachtet wurden. Aus Tabelle VIII ergibt sich, dass alle Trinukleotide, die bei dem Versuchsaufbau (gemäß Tabelle IV) erwartet wurden, vorliegen und dass deren Häufigkeit sich nicht signifikant von einer gleichmäßigen Verteilung unterscheidet.

TABELLE VII: Häufigkeiten der Tripletts, die bei der Sequenzierung von 170 Codons beobachtet wurden, welche in dem degenerierten Abschnitt der DNA von 20 Klonen vorliegen, zufällig in einer Bank degenerierter Oligonukleotide ausgewählt, die nach dem Verfahren der Erfindung synthetisiert wurden.

CODONS	HÄUFIGKEIT
AAA	11
ACC	7
ATC	11
ATG	7
AAC	7
CTG	12
CAG	13
CAC	11
CGT	7
CCG	5
GTT	14
GAA	11
GAC	11
GCT	5
GGT	3
TGG	6
TTC	6
TAC	10
TCT	10
TGT	3
	170

BIBLIOGRAPHISCHE REFERENZEN

• Gait, M.J., Oligonucleotides Synthesis " A Practical Approach Series"; (1984) IRL Press Oxford, Washington D.C.
• Huang, W., und Santi, D.V. (1994), Anal. Biochem. 218, S. 454-457
• Kayushin, A.L., Korosteleva, M.D., Miroshnikov, A.I., Kosch, W., Zubov, D., und Piel, N. (1998), Nucleic Acid Research, Bd. 24, Nr. 19.
• Kumar, G., und Poonian, M.S., J. Org. Chem. (1984), Bd. 49, S. 4905-4912.
• Lyttle, M.H., Napolitano, E.W., Calio, B.L., und Kauvar, L.M., Biotechniques (1995), Bd. 19, N2, S. 274-280.
• Ono, A., Matsuda, A., Zhao, J., und Santi, D.V., Nucleic Acids Research (1994), Bd. 22; N25, S. 5600-5607
• Sambrook, J., Fritsch, E.F., und Maniatis, T. (1989), in "Molecular Cloning, a Laboratory Manual", Cold Spring Harbour Laboratory, 2. Auflage, Cold Spring Harbour, NY
• Virnekas, B., Ge I., Plucksthun A., Schneider, K. C., Wellnhofer, G., und Moroney, S.E., Nucleic Acids Research (1994), Bd. 22; N25, S. 5600-5607

Claims

Verfahren zur chemischen Synthese eines Polynukleotids mit einer vollständig oder partiell statistischen Sequenz, wobei die Herstellung des statistischen Sequenzanteils Reaktionszyklen umfaßt, bei denen alternierend ein Mononukleotid und ein Dinukleotid kombiniert werden, um ein Trinukleotid zu bilden, welches Verfahren umfaßt: (a) einen Reaktionszyklus auf mindestens einem Träger, bei dem mindestens ein Dinukleotid jedem Träger hinzugefügt wird; (b) einen weiteren Reaktionszyklus, bei dem ein Mononukleotid jedem Träger hinzugefügt wird; (c) gegebenenfalls Randomisierung des erhaltenen Produkts bzw. der erhaltenen Produkte durch Mischen der Träger und Aufteilen des Produkts bzw. der Produkte auf mindestens zwei Träger; und (d) gegebenenfalls Wiederholung der Schritte (a) bis (c) so oft wie erforderlich, bis dieser statistische Sequenzanteil hergestellt ist; wobei die Kombination von Mononukleotiden und Dinukleotiden so gewählt wird, dass für den statistischen Sequenzanteil jede Trinukleotideinheit ein Codon darstellt, das aus einer begrenzten Anzahl der verfügbaren Codons ausgewählt ist, wie in Tabelle II gezeigt: TABELLE II: B+D-Kombination
wodurch die Degeneration des genetischen Codes verringert wird.
Verfahren zur chemischen Synthese eines Polynukleotids mit einer vollständig oder partiell statistischen Sequenz, wobei die Herstellung des statistischen Sequenzanteils Reaktionszyklen umfaßt, bei denen alternierend ein Mononukleotid und ein Dinukleotid kombiniert werden, um ein Trinukleotid zu bilden, welches Verfahren umfaßt: (a) einen Reaktionszyklus auf mindestens einem Träger, bei dem ein Mononukleotid jedem Träger hinzugefügt wird; (b) einen weiteren Reaktionszyklus, bei dem mindestens ein Dinukleotid jedem Träger hinzugefügt wird; (c) gegebenenfalls Randomisierung des erhaltenen Produkts bzw. der erhaltenen Produkte durch Mischen der Träger und Aufteilen des Produkts bzw. der Produkte auf mindestens zwei Träger; und (d) gegebenenfalls Wiederholung der Schritte (a) bis (c) so oft wie erforderlich, bis dieser statistische Sequenzanteil hergestellt ist; wobei die Kombination von Mononukleotiden und Dinukleotiden so gewählt wird, dass für den statistischen Sequenzanteil jede Trinukleotideinheit ein Codon darstellt, das aus einer begrenzten Anzahl der verfügbaren Codons ausgewählt ist, wie in Tabelle III gezeigt: TABELLE III: D+B-Kombination
wodurch die Degeneration des genetischen Codes verringert wird.
Verfahren nach Anspruch 2, wobei jedes Trinukleotid synthetisiert wird, indem zuerst ein Mononukleotid und dann ein Dinukleotid hinzugefügt wird.
Verfahren nach Anspruch 1, wobei jedes Trinukleotid synthetisiert wird, indem zuerst ein Dinukleotid und dann ein Mononukleotid hinzugefügt wird.
Verfahren nach irgendeinem der vorhergehenden Ansprüche, wobei die Synthese auf mindestens zwei Trägern durchgeführt wird.
Verfahren nach irgendeinem der vorhergehenden Ansprüche, wobei die Synthese parallel durchgeführt wird.
Verfahren nach irgendeinem der vorhergehenden Ansprüche, bei dem es vier Dinukleotid-Mischungen und Syntheseträger gibt, einen Träger für jedes der Standard-Mononukleotide.
Verfahren nach irgendeinem der vorhergehenden Ansprüche, wobei die Träger Harzträger sind.
Verfahren nach irgendeinem der vorhergehenden Ansprüche, welches in Säulen durchgeführt wird.
Verfahren nach irgendeinem der vorhergehenden Ansprüche, bei dem die gebildeten Polynukleotide Stopcodons ausschließen.
Verfahren nach irgendeinem der vorhergehenden Ansprüche, bei dem jede Aminosäure, welche von den gebildeten Codons codiert wird, von nur einem Codon codiert wird und somit die Degeneration des genetischen Codes eliminiert wird.
Verfahren nach irgendeinem der vorhergehenden Ansprüche, wobei die gebildeten Codons so gewählt sind, dass die genetische Expression in dem Organismus, in dem das Polynukleotid translatiert wird, maximiert wird.
Verfahren nach irgendeinem der vorhergehenden Ansprüche, bei dem die gebildeten Codons für alle 20 Aminosäuren codieren.
Verfahren nach irgendeinem anderen vorhergehenden Anspruch als Anspruch 2 oder 3, umfassend die folgenden Schritte: a) Vorselektion der Dinukleotide in Gruppen, wobei jede Gruppe aus mindestens einem derjenigen Dinukleotide besteht, die die zweite und dritte Base von mindestens einer der Trinukleotideinheiten bilden, welche in der Sequenz vorliegen sollen und welche die erste Base gemeinsam haben; b) Herstellung von Mischungen, welche aktivierte und geschützte Dinukleotide enthalten, wobei die aktivierten und geschützten Dinukleotide in den Mischungen wie durch Schritt a) vorselektioniert in einer geeigneten Konzentration verteilt sind, um Homogenität in den entsprechenden Trinukleotideinheiten zu erzielen; c) Synthese eines Polynukleotids mit einer bekannten Sequenz auf Trägern für die Festphasensynthese, die in Behältern eingeschlossen sind; d) Zugabe der Mischungen aus Schritt b), die aktivierte und geschützte Dinukleotide enthalten, zu den Syntheseträgern, eine für jeden Träger, und Durchführung einer Bindungsreaktion zwischen den aktivierten und geschützten Dinukleotiden und dem 5'-Terminus des synthetisierten Polynukleotids von Schritt c); e) Zugabe von mindestens einem aktivierten und geschützten Mononukleotid zu mindestens einem der Syntheseträger, ein Mononukleotid für jeden Träger, und Durchführung einer Bindungsreaktion zwischen dem aktivierten und geschützten Mononukleotid und dem 5'-Terminus der Dinukleotide, welche gemäß Schritt d) an das synthetisierte Polynukleotid von Schritt c) gebunden sind; f) Öffnen der Behälter und Mischen der Träger, um eine homogene Reaktionsmischung zu erhalten; g) Rekonstitution der Syntheseträger mit einer Menge der homogenen Reaktionsmischung, die einem Bruchteil von 1/n für jeden Träger entspricht, wobei n die Anzahl der verwendeten Träger ist; h) Wiederholung der Schritte d), e), f) und g) so oft wie von der Versuchsgestaltung gefordert; und i) Synthese eines Polynukleotids mit einer bekannten Sequenz am 5'-Terminus des so erhaltenen Polynukleotids.
Verfahren nach irgendeinem anderen vorhergehenden Anspruch als den Ansprüchen 1, 4 und 14, umfassend die folgenden Schritte: a₁) Vorselektion der Dinukleotide in Gruppen, wobei jede Gruppe aus mindestens einem derjenigen Dinukleotide besteht, die die erste und zweite Base von mindestens einer der Trinukleotideinheiten bilden, welche in der Sequenz vorliegen sollen und welche die dritte Base gemeinsam haben; b₁) Herstellung von Mischungen, die aktivierte und geschützte Dinukleotide enthalten, wobei die aktivierten und geschützten Dinukleotide in den Mischungen wie durch Schritt a₁) vorselektioniert in einer geeigneten Konzentration verteilt sind, um Homogenität in den entsprechenden Trinukleotideinheiten zu erzielen; c₁) Synthese eines Polynukleotids mit einer bekannten Sequenz auf Syntheseträgern für die Festphasensynthese, die in Behältern eingeschlossen sind; d₁) Zugabe von mindestens einem aktivierten und geschützten Mononukleotid zu mindestens einem der Syntheseträger, ein Mononukleotid für jeden Träger, und Durchführung einer Bindungsreaktion zwischen dem aktivierten und geschützten Mononukleotid und dem 5'-Terminus des synthetisierten Polynukleotids aus Schritt c₁); e₁) Zugabe der Mischungen aus Schritt b₁), die aktivierte und geschützte Dinukleotide enthalten, zu den Syntheseträgern, eine für jeden Träger, und Durchführung einer Bindungsreaktion zwischen den aktivierten und geschützten Dinukleotiden und dem 5'-Terminus der Mononukleotide, die gemäß Schritt d₁) an das synthetisierte Polynukleotid aus Schritt c₁) gebunden sind; f₁) Öffnen der Behälter und Mischen der Träger, um eine homogene Reaktionsmischung zu erhalten; g₁) Rekonstitution der Syntheseträger mit einer Menge der homogenen Reaktionsmischung, die einem Bruchteil 1/n für jeden Träger entspricht, wobei n die Anzahl der verwendeten Träger ist; h₁) Wiederholung der Schritte d₁), e₁), f₁) und g₁) so oft wie von der Versuchsgestaltung gefordert; und i₁) Synthese eines Polynukleotids mit einer bekannten Sequenz am 5'-Terminus des so erhaltenen Polynukleotids.
Verfahren nach irgendeinem der vorhergehenden Ansprüche, wobei die Mononukleotide und Dinukleotide Desoxyribonukleotide sind.
Verfahren nach irgendeinem der vorhergehenden Ansprüche, wobei die Dinukleotide vorselektioniert sind, um Trinukleotideinheiten zu bilden, welche den häufigsten Codons im Genom von Escherichia coli entsprechen.
Verfahren nach Anspruch 17, wobei die Dinukleotide TT, TC, TG, CT, CC, CG, AC, AA, AG, GT, GG sind.
Verfahren nach Anspruch 18, wobei die Dinukleotide in vier Mischungen wie folgt gemischt sind: W = TC; TG; CC; AC; AA; X = TG; CG; AC; AG; GT; Y = AA; AC; CT; GT; TT; Z = GG; AC; CT; GT; TC.
Verfahren nach irgendeinem der vorhergehenden Ansprüche, jedoch nicht nach Anspruch 15, wobei Codons auf Syntheseträgern erhalten werden, um für Aminosäuren nach der folgenden Gruppierung zu codieren: AW = Isoleucin, Methionin, Threonin, Asparagin, Lysin; CX = Leucin, Prolin, Histidin, Glutamin, Arginin; GY = Valin, Alanin, Asparaginsäure, Glutaminsäure, Glycin; TZ = Phenylalanin, Serin, Tyrosin, Cystein, Tryptophan.
Verfahren nach Anspruch 20, wobei die Dinukleotide in den folgenden Verhältnissen emischt werden: W: [AA] = [CC] = [TC] = [AC] = 1 M, und [TG] = 1,5 M; X: [TG] = [AC] = [GT] = [CG] = 1 M, und [AG] = 1,5 M; Y: [GT] = [AC] = [CT] = [AA] = 1 M, und [TT] = 1,5 M; Z: [GG] = 2 M, [AC] = [CT] = [GT] = 1 M und [TC] = 1,5 M.
Verfahren nach irgendeinem der Ansprüche 1 bis 16, wobei die Dinukleotide vorselektioniert sind, um Trinukleotideinheiten zu bilden, welche den häufigsten Codons in den Genomen eukaryotischer Organismen entsprechen.
Verfahren nach Anspruch 22, wobei die Dinukleotide TC, TG, CC, AC, AG, GC, GG sind (vgl. die hier vorliegende Tabelle VI).
Verfahren nach Anspruch 22, wobei die eukaryotischen Organismen Hefen sind.
Verfahren nach Anspruch 24 bei Abhängigkeit von Anspruch 14, wobei die Dinukleotide TT, TC, TG, CT, CA, AC, AA, AG, GT, GA, GG sind.
Verfahren nach irgendeinem der Ansprüche 1 bis 12, wobei die gebildeten Codons so gewählt sind, um eine oder mehrere Aminosäure(n) auszuschließen.
Verfahren nach Anspruch 26, wobei die gebildeten Codons so gewählt sind, um Glutaminsäure und Asparaginsäure auszuschließen.
Verfahren nach irgendeinem der Ansprüche 1 bis 17 und 22, wobei die Mononukleotide und Dinukleotide Ribonukleotide sind.
Verfahren nach irgendeinem der Ansprüche 1 und 4 bis 14, wobei die Mononukleotid:Dinukleotid-Kombinationen: T: TT, CT, AT, GT, GG; C: TT, CT, AT, AA, GT; A: TT, TG, CT, AT, AA; und G: TT, CT, AT, AA, GT sind.
Verfahren nach irgendeinem der Ansprüche 2, 3, 5 bis 13 und 15, wobei die Dinukleotid:Mononukleotid-Kombinationen: TT, CA, AC, AA, GA: T; TA, TG, CC, AG, GT: C; TT, AT, AA, GC, GA: A; und TG, CA, AT, AG, GG: G sind.