-
Der
Gegenstand der vorliegenden Erfindung ist ein Verfahren zur Synthese
von Polynukleotiden, welches die Einführung statistischer Sequenzen
("random sequences") entlang mehr oder
weniger ausgedehnter Abschnitte des Moleküls ermöglicht, auf solche Weise, dass
sich die statistische Verteilung auf Einheiten von drei benachbarten
Nukleotiden bezieht und dass jede dieser Einheiten ausgewählt ist,
um einer begrenzten Anzahl von Codons, mit vorgegebener Anzahl und
Sequenz, zu entsprechen und um die Wirkungen der Degeneration des
genetischen Codes zu eliminieren.
-
Die
Anwendungsmöglichkeiten
eines Polynukleotidsyntheseverfahrens mit den obigen Merkmalen sind
zweifellos beträchtlich.
In der Tat gewannen in den letzten Jahren Anwendungen, die deren
Einsatz erfordern, zunehmende Bedeutung auf vielen Gebieten der
wissenschaftlichen Forschung. Es ist beispielsweise von Nutzen bei
der stellenspezifischen Mutagenese bei einem Gen, das für ein bekanntes
Protein kodiert, an mutmaßlichen
Schlüsselpositionen,
um deren tatsächliche
Rolle in der Molekülstruktur
oder -funktion zu verifizieren. Ein weiteres Beispiel sind Banken,
enthaltend "Boxen" von synthetischen
Oligonukleotiden mit statistischer Sequenz, welche erstellt sind,
um Moleküle
auszuwählen,
welche zur Erfüllung
neuer biologischer Funktionen in der Lage sind.
-
In
all diesen Fällen
ist es von äußerster
Bedeutung, dass die statistische Verteilung der Sequenz in einem
gewissen Grad kontrolliert wird, so dass nur die gewünschten
Codons insertiert werden, neben der Eliminierung der Wirkungen der
Degeneration des genetischen Codes. Von gleicher Bedeutung ist offensichtlich die
Tatsache, dass diese Polynukleotidsynthese mit einem einfachen,
kosteneffizienten und wirksamen Verfahren durchgeführt wird.
-
Terminologie
-
Es
ist von Nutzen, hier im folgenden die Begriffe zu spezifizieren:
-
Träger.
-
Der
Begriff Träger
bezieht sich auf ein Material in fester Phase, an das Monomere gebunden
sind, um eine chemische Synthese zu realisieren; dieser Träger besteht
gewöhnlich
aus Harz oder porösen
Glaskörnern,
kann jedoch auch aus irgendeinem anderen Material bestehen, das
dem Fachmann bekannt ist. Der Begriff soll ein oder mehrere Monomere einschließen, das/die
für die
weiteren Reaktionen der Polynukleotidsynthese an den Träger gekoppelt
ist/sind.
-
Konjugieren oder kondensieren:
-
Diese
Begriffe beziehen sich auf die chemischen Reaktionen, welche durchgeführt werden,
um ein Monomer an ein zweites Monomer oder an einen festen Träger zu binden.
Diese Reaktionen sind dem Fachmann auf dem Gebiet bekannt und werden
gewöhnlich
in einem automatischen DNA-Synthesizer nach den vom Hersteller zur
Verfügung
gestellten Instruktionen durchgeführt.
-
Monomere oder Mononukleotide:
-
Die
Begriffe Monomer oder Mononukleotid beziehen sich auf individuelle
Nukleotide, die bei der chemischen Synthese von Oligonukleotiden
eingesetzt werden. Monomere, welche eingesetzt werden können, umfassen
sowohl die Ribo- als auch die Desoxyribo-Formen eines jeden der
fünf Standardnukleotide
(abgeleitet von den Basen Adenin (A bzw. dA), Guanin (G oder dG),
Cytosin (C oder dC), Thymin (T) und Uracil (U)). Basen-Derivate
oder -Vorläufer
wie Inosin werden ebenfalls von den Monomeren umfasst, sowie chemisch modifizierte
Nukleotide, wie z.B. solche mit einer reversiblen Blockierungsgruppe
an irgendeiner Position auf den Purin- oder Pyrimidin-Basen, auf
Ribose oder Desoxyribose oder auf Hydroxyl- oder Phosphatgruppen des
Monomers. Diese Blockierungsgruppen umfassen beispielsweise Dimethoxytrityl-,
Benzoyl-, Isobutyryl-, β-Cyanoethyl- und Diisopropylamingruppen
und werden zum Schutz von Hydroxylgruppen, Phosphaten und hexacyclischen
Aminen verwendet. Jedoch können
andere Blockierungsmittel, die dem Fachmann bekannt sind, verwendet
werden.
-
Dimere oder Dinukleotide:
-
Die
Begriffe Dimere oder Dinukleotide beziehen sich auf molekulare Einheiten,
die aus der Kondensation von zwei Monomeren oder Mononukleotiden
wie oben definiert erhalten werden.
-
Synthese monomerer Einheiten:
-
Dieser
Begriff bezeichnet Einheiten, welche als essentielle Elemente in
dem Syntheseverfahren verwendet werden. In dem Verfahren, welches
Gegenstand der vorliegenden Erfindung ist, können sie aus Monomeren oder
Dimeren bestehen; sie können
auch aus Trinukleotideinheiten in anderen im Stand der Technik bekannten
Verfahren bestehen.
-
Codon oder Triplett:
-
Der
Begriff Codon oder Triplett bezieht sich auf eine Sequenz von drei
aufeinander folgenden Desoxyribonukleotid-Monomeren, welche eine
der 20 natürlichen
Aminosäuren
spezifizieren, die bei einer Polypeptid-Biosynthese verwendet werden.
Der Begriff umfasst auch Nonsense-Codons, Codons, die nicht für irgendeine
Aminosäure
kodieren.
-
Codon oder randomisiertes
Triplett:
-
Diese
Begriffe beziehen sich auf den Fall, in dem die gleiche Sequenzposition
mehr als einem Codon in einem Satz von Polynukleotiden entspricht.
Die Anzahl verschiedener Codons kann von zwei bis 64 für jede spezielle
Position variieren.
-
Anticodon:
-
Der
Begriff Anticodon bezieht sich auf eine Sequenz von drei aufeinander
folgenden Ribonukleotid-Monomeren, welche ein entsprechendes Codon
nach der bekannten Regel der Purin- und Pyrimidinbasen-Kopplung
spezifizieren.
-
Polynukleotide oder randomisierte
Oligonukleotide:
-
Dieser
Begriff bezieht sich auf einen Satz von Oligonukleotiden, die randomisierte
Codons an einer oder mehreren Positionen aufweisen. Falls beispielsweise
die randomisierten Oligonukleotide 6 Nukleotide Länge aufweisen
(d.h. zwei Codons) und sowohl die erste als auch die zweite Position
der Sequenz randomisiert sind, um für alle der 20 Aminosäuren zu
kodieren, dann soll die Population von randomisierten Oligonukleotiden
einen Oligonukleotidsatz mit jeder möglichen Kombination der 20
Tripletts in der ersten und zweiten Position umfassen. In diesem
Fall ist die Anzahl der möglichen
Codonkombinationen daher 400. Analog werden, falls randomisierte
Oligonukleotide von 15 Nukleotiden Länge so synthetisiert werden,
dass sie in jeder Position randomisiert sind, dann alle Tripletts,
die für
jede der 20 Aminosäuren
kodieren, an jeder Position gefunden werden. In diesem Fall wird
die Population randomisierter Oligonukleotide 205 verschiedene
mögliche Oligonukleotidspezies
enthalten.
-
Falls
nicht eindeutig definiert, sind andere Begriffe, die in der vorliegenden
Beschreibung verwendet werden, so zu verstehen, wie sie von Fachleuten
auf dem Gebiet, das die Erfindung betrifft, verstanden werden.
-
Hinsichtlich
einiger Begriffe bezüglich
molekularbiologischer Techniken vergleiche man das Handbuch von
Sambrook et al. (Sambrook et al., 1989). Andere Begriffe, die sich
auf Substanzen chemischer Natur beziehen, die nicht klar definiert
sind, sind so zu verstehen, wie sie von Fachleuten auf dem Gebiet
der Erfindung verstanden werden und deren Definitionen sind jedenfalls
in Handbüchern
wie Gait, M.J., et al., 1984, zu finden.
-
Stand der
Technik
-
Im
Allgemeinen sind Anwendungen, bei denen synthetische Oligonukleotide
verwendet werden, von zweierlei Art: diejenigen, welche die Verwendung
von Oligonukleotiden bekannter Sequenz erfordern, und diejenigen,
welche die Verwendung von Oligonukleotiden mit einer mindestens
teilweise degenerierten oder statistischen Sequenz erfordern.
-
Bezüglich der
ersten Gruppe von Anwendungen basieren die üblichen Syntheseverfahren auf
dem Prinzip des Einbaus der zum Polynukleotid kondensierenden Mononukleotide,
jeweils eines zu einem gegebenen Zeitpunkt, beginnend bei dem ersten
am 3'-Terminus,
und Auswahl eines jeden Mononukleotids für jeden Reaktionszyklus, um
so ein Polynukleotid mit einer gewünschten und eindeutigen Sequenz
zu synthetisieren.
-
Bezüglich der
zweiten Gruppe von Anwendungen folgt die Synthese denselben Modalitäten, jedoch findet
in den Positionen entlang der Sequenz, an denen es erforderlich
ist, eine Variabilität
einzubauen, der Synthesezyklus unter Verwendung von Mischungen zwei
oder mehr verschiedener Monomere statt. In jedem Zyklus werden somit
Oligonukleotidmischungen erzeugt, die sich in dem zum 5'-Terminus hinzufügten Monomer
unterscheiden. Wenn beispielsweise in einem Zyklus vier verschiedene
Mononukleotide als Monomere eingesetzt werden, wird eine Mischung
erhalten, die vier verschiedene Polynukleotide enthält, die
sich voneinander nur in dem letzten eingebauten Nukleotid unterscheiden.
Falls ein Synthesezyklus derselben Art wiederholt wird, wird eine
Mischung von 16 Polynukleotiden erhalten, die sich in den letzten
beiden eingebauten Nukleotiden unterscheiden, usw.
-
Im
Allgemeinen ermöglichen
Anwendungen, die synthetische Polynukleotide verwenden, einen direkten
oder indirekten Einbau der Polynukleotide in genetisches Material,
welches in einem bestimmten lebenden Organismus in Polypeptide translatiert
werden wird (eine in vitro-Translation findet selten statt). Bekanntermaßen ist
der genetische Code der DNA-Translation
teilweise degeneriert, d.h. nachdem 64 mögliche Codons, gebildet von
Gruppen von drei Nukleotiden, für
nur 20 Aminosäuren
kodieren (plus drei Terminations- oder Stoppsignale), kodiert mehr
als ein Codon für
jede Aminosäure.
-
Oligonukleotide
mit einer mindestens teilweise statistischen Sequenz ("random sequence") wie zuvor beschrieben
(wobei ein Polynukleotid mit einer statistischen Sequenz eine mehr
oder weniger komplexe Mischung von Polynukleotiden mit unterschiedlichen
Sequenzen bedeutet) kodieren für
Peptide mit statistischer Sequenz (d.h. für eine Mischung von Peptiden,
wobei jedes Peptid von einem oder mehreren Polynukleotiden kodiert
wird).
-
In
der Tat hat die Degeneration des genetischen Codes drei wichtige
Konsequenzen hinsichtlich der Oligonukleotide mit statistischer
Sequenz, welche für
die Ableitung der statistischen Polypeptide zu verwenden sind:
- a) Jede Mischung von Oligonukleotiden mit einer
mindestens teilweise statistischen Sequenz kodiert für eine viel
einfachere Polypeptidmischung. Beispielsweise besteht eine Mischung
von Oligonukleotiden, bei denen 6 Positionen statistisch von einem
der vier natürlichen
Nukleotide besetzt werden, aus 4096 verschiedenen Molekülen (46, falls Einzelnukleotide betrachtet werden,
oder 642, falls Codons betrachtet werden),
gerade aufgrund der Degeneration des Codes kodieren diese jedoch
nur für
400 verschiedene Polypeptide (d.h. 202).
Dieses
Phänomen
würde für sich genommen
irrelevant sein, vorausgesetzt, dass die verschiedenen Polynukleotide,
die für
das Polypeptid kodieren, die gleichen physikalischen und chemischen
Merkmale haben, jedoch können
verschiedene Sequenzen verschiedene Eigenschaften bezüglich beispielsweise
Löslichkeit,
Stabilität
und elektrostatischer Ladung unter verschiedenen Bedingungen, Adsorption
an Filtermittel usw. verleihen.
- b) In der Mischung von Polypeptiden, welche durch Translation
von Polynukleotiden mit statistischer Sequenz erzeugt wurden, wird
ein Prozentsatz von Peptiden mit verkürzter Sequenz vorliegen. In
der Tat werden während
der statistischen Inkorporation der Codons auch notwendigerweise
solche eingebaut, die ein Stoppsignal bedeuten, und die Bildung
von Polypeptiden mit verkürzter
Sequenz ist daher unvermeidlich.
In dem vorhergehenden Beispiel
werden von 4096 Oligonukleotiden 375 (9 %) für Polypeptide kodieren, die
an der ersten oder zweiten Position verkürzt sind (d.h. 3 mögliche Terminationscodons
an der ersten Position für
jedes der 64 möglichen
Codons an der zweiten Position und 3 mögliche Stoppcodons an der zweiten
Position für
jedes der 61 möglichen
Codons an der ersten Position). Somit werden zusammen mit 400 möglichen
Polypeptiden 21 verkürzte
Polypeptide gefunden (eines an der ersten Position und 20 an der
zweiten Position). Dieses Phänomen
gewinnt besondere Bedeutung, wenn Banken von Polynukleotiden, die
eine lange statistische Sequenz besitzen, erzeugt werden. Beispielsweise
werden in einer 27-Nukleotide-Bank (kodierend für Nonapeptid-Banken, wie in
vielen Anmeldungen beschrieben) bis zu 35 % der Polynukleotide ein
Stoppcodon enthalten (oder [649 – 619]/649). Längere Sequenzen
werden einen höheren Prozentsatz
an Molekülen
enthalten, die für
ein vorzeitiges Ende der Polypeptidkette kodieren.
- c) Das Vorhandensein einer unterschiedlichen Translationseffizienz
der verschiedenen Codons, die für
dieselbe Aminosäure
kodieren, in verschiedenen Organismen wird ersichtlich bei der Ableitung
von Polypeptidmischungen mit Komplexitäten, die sich von denjenigen
der Ausgangspolynukleotidmischungen unterscheiden. Obwohl der genetische
Code einmalig in der Natur ist, gibt es tatsächlich einen Unterschied in den
verschiedenen lebenden Organismen bezüglich der Effizienz, mit der
verschiedene Codons, kodierend für
dieselbe Aminosäure,
translatiert werden. Beispielsweise wird in E. coli Serin 18 mal
häufiger
durch das Codon UCU als durch das Codon UCA kodiert. Daraus folgt,
dass zwei verschiedene Polynukleotide bei äquimolarer Konzentration in
der Anfangsmischung mit unterschiedlichen Effizienzen translatiert
werden und die resultierende Polypeptidmischung ein unterschiedliches
Molverhältnis
der beiden Molekülspezies enthalten
wird. Es ist deshalb zur Maximierung der Effizienz des ausgewählten zellulären Systems
von äußerster
Bedeutung, dass die kodierenden Sequenzen genau die Codons enthalten,
die von dem zellulären System
selbst in erster Linie verwendet werden.
-
Alle
drei dieser Faktoren üben
einen starken Einfluss auf die Effizienz von Systemen aus, welche
Polynukleotide mit statistischer Sequenz verwenden, sowohl in Anwendungen,
welche die Randomisierung in nur einer Position vorsehen, als auch
in Anwendungen, bei denen die Randomisierung längere Sequenzen betrifft. Dieser
Einfluss ist jedoch direkt proportional zur Länge und Komplexität der verwendeten
statistischen Sequenz.
-
Diese
Tatsache beeinträchtigt
insbesondere die Herstellung vollständig homogener Mischungen (d.h. solcher,
welche dieselbe Konzentration jeder möglichen Molekülspezies
enthalten) von Polynukleotiden mit statistischer Sequenz, hergestellt
für die
Bildung gleichermaßen
komplexer und homogener Polypeptidmischungen. Tatsächlich wird
jeder Versuch in dieser Richtung bei der Translation von Polynukleotiden
in Polypeptidmoleküle
gerade durch die Kombination dieser drei Faktoren teilweise vereitelt
und dies kann eine beträchtliche
Reihe von Anwendungen nicht unbeeinflusst lassen.
-
Dies
ist beispielsweise der Fall bei der Effizienz von Expressionsbanken,
die aus einer solchen homogenen Mischung von Polynukleotiden erzeugt
wurden.
-
In
Zusammenhang mit all diesen Problemen wurden mit der Zeit Syntheseverfahren
entwickelt, welche die Überwindung
dieser Probleme und die Verbesserung der Effizienz der verschiedenen
Systeme, welche Polypeptide mit statistischer Sequenz einsetzen,
zum Ziel haben.
-
Eine
erste Lösung
(vielleicht die offensichtlichste unter theoretischen Gesichtspunkten)
ist eine Polynukleotidsynthese, welche für die Verwendung als monomere
Einheiten vorgebildete Trinukleotide (entsprechend Codons) statt
der individuellen Mononukleotide vorsieht (Virkenas, B., et al.,
1994; Lyttle, M.U., et al., 1995; Ono, A., et al., 1994). So können zuerst
die 20 Trimere, entsprechend den gewünschten Codons, synthetisiert
werden und die Polynukleotidsynthese wird erst später durchgeführt, indem
bei jedem Synthesezyklus die aus Trimeren anstatt Monomeren bestehenden
monomeren Einheiten kondensiert werden. Diese Lösung ist anscheinend einfach
und wirksam, erfordert jedoch tatsächlich ein komplexes, teures
und ineffizientes Verfahren, aus den folgenden Gründen:
- 1. Obwohl die Synthese der Anfangstrinukleotide
leicht durch die Kondensation von drei blockierten Nukleotiden,
ausgeführt
gemäß dem regulären Polynukleotidsyntheseverfahren,
(deshalb mit einem relativ einfachen und effizienten Verfahren)
erzielbar ist, gibt es eine Reihe von Probleme, die der Ablösungsphase des
neu gebildeten Trinukleotids von der Synthesematrix unvermeidlich
innewohnen.
-
Tatsächlich findet
bei normalen Verfahren dieser Vorgang gleichzeitig mit der Lyse
aller Schutzgruppen der verschiedenen Basen statt; in diesem Fall
muss jedoch in Anbetracht der nachfolgenden Schritte der Polynukleotidsynthese
die Bindung zwischen den Nukleotiden und seitlichen Schutzgruppen
intakt bleiben, so wurden Versuche unternommen, um eine Lyse der
3'-5'-Bindung mit der
Trägermatrix
zu ermöglichen,
ohne Bindungen mit seitlichen Schutzgruppen zu beeinflussen.
-
Daraus
ergibt sich die Notwendigkeit der Verwendung ungewöhnlicher
Schutzgruppen und man muss mit Produktausbeuten rechnen, die von
einem Codon zum anderen variieren. Die Ausbeuten sind kaum reproduzierbar
und in jedem Fall niedrig.
-
Ganz
analoge Schwierigkeiten entstehen, wenn die Synthese in Lösung statt
auf einem Harz durchgeführt
wird. In diesem Fall müssen
die individuellen Trinukleotide ebenfalls vor der Verwendung selektiv,
ausschließlich
an der 3'-Position
(um sie reaktiv zu machen), entblockiert werden, während alle
anderen Funktionen blockiert bleiben müssen.
- 2.
Bei der normalen Synthese von Polynukleotiden statistischer Sequenz,
die auf der Verwendung von Mononukleotiden basiert, wird in jedem
Synthesezyklus eine Mischung, bestehend aus mindestens zwei Nukleotiden,
verwendet. Unter den komplexesten chemischen Bedingungen werden
alle vier möglichen
Nukleotide verwendet, aber selbst wenn jedes davon eine von den
anderen leicht unterschiedliche Reaktivität besitzt, wären die
optimalen Molverhältnis-Bedingungen,
welche die äquimolare
Inkorporation eines jeden Nukleotids in die sich bildende Polynukleotidkette
fördern,
nicht schwer zu finden, da es nur vier Komponenten gibt.
-
Von
wesentlich größerer Bedeutung
sind die Schwierigkeiten, auf die man stößt, wenn so viele wie 20 verschiedene
Trinukleotide in äquimolarer
Menge inkorporiert werden müssen.
Erstens muss man die Tatsache berücksichtigen, dass bei allen
möglichen
Trinukleotiden ein Unterschied in der relativen chemischen Reaktivität besteht,
der wesentlich größer ist
als bei den vier einfachen Mononukleotiden.
-
Darüber hinaus
werden Trinukleotide aufgrund der vorgenannten Schwierigkeiten in
Lösungen
erhältlich
sein, deren qualitativer und quantitativer Gehalt nicht leicht verifizierbar
ist, während
Nukleotide in reiner Form und mit einer kontrollierten und reproduzierbaren
Reaktivität
leicht erhältlich
sind. Zuletzt wird es offensichtlich schwierig sein, die richtigen
Molverhältnisse
der 20 Komponenten, welche die Synthesemischung bilden, ausreichend,
um eine äquimolare
Inkorporation sicherzustellen, zu finden. Natürlich werden alle diese Schwierigkeiten
durch die Verwendung weniger komplexer Mischungen minimiert.
-
Ein
zweiter Ansatz, viel einfacher unter dem Gesichtspunkt der chemischen
Synthese, basiert auf der Tatsache, dass wenn mehrere Codons für nur eine
Aminosäure
kodieren, die ersten beiden Codonbasen oft konstant sind und sich
nur in der dritten Base des Codons unterscheiden.
-
Die
Unterschiede bei Codons, welche von dem Polynukleotid repräsentiert
werden, können
deshalb verringert werden, wenn während der Synthese einer jeden
Trinukleotideinheit bei dem ersten Zyklus (welcher das 3'-terminale Nukleotid
ergeben wird, d.h. das dritte im Codon) eine Mischung von Guanin-
und Thymin- (oder Uracil)-abgeleiteten Nukleotiden verwendet wird,
während
bei den beiden nachfolgenden Kondensierungszyklen Mischungen der
vier Mononukleotide verwendet werden. Somit werden Polynukleotide
synthetisiert, welche nicht 64 mögliche
Codons enthalten können,
sondern nur die degenerierten 32 der Art NNK, wobei N jedes der
vier Nukleotide ist und K Guanosin oder Thymidin ist. Daraus folgt,
dass von den 20 kodierten Aminosäuren
12 von nur einem Codon kodiert werden, 5 von zwei möglichen
Codons kodiert werden und 3 von drei möglichen Codons kodiert werden.
Schließlich
kodiert nur ein Codon von 32 für
ein Stoppsignal.
-
Dieses
Verfahren bietet im Vergleich zu den üblichen Syntheseverfahren den
bemerkenswerten Vorteil, keinerlei Veränderung zu erfordern, löst aber
nicht oder nur teilweise die vorgenannten Probleme. Insbesondere
löst es,
obwohl es im Vergleich zu den herkömmlichen Verfahren eine teilweise
Lösung
bietet, nicht das Problem der Einführung von Stoppcodons und der
resultierenden Bildung von verkürzten
Polypeptiden (Huang, W., und Santi, D.V., 1994).
-
Ein
weiteres im Stand der Technik beschriebenes Verfahren basiert auf
dem Prinzip der Unterteilung des Syntheseträgers in so viele Synthesebehälter (gewöhnlich Säulen) wie
die verschiedenen Codons, welche in einer vorgegebenen Position
in dem Oligonukleotid inseriert werden. Einzelcodons werden dann
auf jedem Träger
synthetisiert und die verschiedenen Träger werden dann gemischt, um
eine randomisierte Polynukleotidmischung zu erhalten (US-A-05523388).
Falls beispielsweise vier Codons, kodierend für vier Aminosäuren, an
einer vorgegebenen Position eingebaut werden müssen, wird das Syntheseharz
in vier Teile unterteilt, wobei das erste Codon auf dem ersten synthetisiert
wird, das zweite Codon auf dem zweiten usw. Sobald die Synthese
beendet ist, werden die vier Träger
gemischt und somit ein Trägerharz
erhalten, welches ein konjugiertes Polynukleotid trägt, dessen
5'-terminales Codon
hinsichtlich der vier Codons randomisiert (statistisch bestimmt)
ist.
-
Dieses
Verfahren hat den Vorteil, eine exakte Auswahl der Codons zu erlauben,
welche an einer vorgegebenen Position zu inserieren sind. Seine
Hauptbeschränkung
ergibt sich aus der Notwendigkeit, das Syntheseharz erneut in so
viele Teile wie die gewünschten
Codons aufzuteilen. Die Synthese wird dann relativ einfach, wenn
die Anzahl der Codons klein ist, jedoch extrem komplex, falls sie
hoch ist, wenn bis zu 20 verschiedene Syntheseträger für jede zur Randomisierung vorgesehene
Position präpariert
werden müssen.
Nachdem es erforderlich ist, mit relativ kleine Harzmengen zu arbeiten,
um die Produktionskosten niedrig zu halten, wird es extrem mühsam, das
Harz in 10 oder mehr verschiedene Mengen zu unterteilen, und bei
den komplizierten Vorgängen
der chemischen Reaktionen und Waschschritte, die in jedem Synthesezyklus
erforderlich sind, schwierig zu handhaben. Darüber hinaus ist anzumerken,
dass der Maßstab
der Synthese nicht um mehr als einige wenige Mikromol erhöht werden
kann (etwa 10-15 Mikromol), ohne beträchtliche Effizienzverluste
in den Kopplungsreaktionen zu ergeben.
-
Zusammenfassung
der Erfindung
-
Die
vorliegende Erfindung hat die Überwindung
der vorgenannten Probleme durch ein Verfahren, welches gleichzeitig
eine bemerkenswerte Einfachheit und Kosteneffizienz bei der Synthese
gewährleistet,
zum Ziel. Die Erfindung basiert auf der Beobachtung, dass jedes
Trinukleotid, das ein Codon ausmacht, als aus einem Mononukleotid
und einem Dinukleotid, welches diesem in der Sequenz folgt oder
zuvor kommt, gebildet betrachtet werden kann.
-
Die
speziellen Merkmale dieses Ansatzes sind ersichtlich durch einen
einfachen Vergleich der auf die übliche
Weise dargestellten Codons (Tabelle I) mit denselben Codons, welche
dargestellt sind, um die Kombinationen von Mononukleotid-Dinukleotid
(Tabelle II) und Dinukleotid-Mononukleotid (Tabelle III) hervorzuheben. TABELLE
I: Genetischer Code
TABELLE
II: B+D-Kombination
TABELLE
III: D+B-Kombination
-
Speziell
in Tabelle II ist jedes Codon dargestellt als Resultat der Kombination
des ersten Nukleotids mit einem Dinukleotid (hier im folgenden auch
als B+D bezeichnet, wobei B das einzelne Nukleotid bedeutet und
D das Dinukleotid), während
Tabelle III (ebenfalls von I abgeleitet) die Codons als von Dinukleotiden,
welche dieses Mal der ersten und zweiten Base des Codons entsprechen,
plus einem Einzelnukleotid, das der dritten Base entspricht (hier
im folgenden auch als D+B bezeichnet, gemäß der früher verwendeten Terminologie),
abgeleitet darstellt.
-
Eine
sorgfältige
Prüfung
dieser beiden alternativen Darstellungen des genetischen Codes ermöglichte dem
Erfinder die Feststellung, dass im Vergleich zu anderen Ansätzen die
minimale Anzahl monomerer Einheiten (bestehend aus Dinukleotiden),
die für
die Kodierung aller Aminosäuren
erforderlich sind, durchwegs verringert werden kann. Tatsächlich entspricht
sie gemäß der Darstellung
D+B den 13 Dinukleotiden (hervorgehoben durch die Schattierung in
Tabelle III), einer sehr geringen Anzahl, die sogar auf noch weniger,
auf 7, sinkt (ebenfalls durch eine Schattierung in Tabelle II hervorgehoben),
falls der B+D-Code-Darstellung
gefolgt wird. Die B+D-Kombination muss deshalb als die günstigste
betrachtet werden.
-
Ferner
können
andere Kombinationen aus den Tabellen II und III erhalten werden,
welche, obwohl insgesamt weniger günstig als die D+B-Kombination,
aufgrund ihrer niedrigen Anzahl der erforderlichen Dinukleotide
immer noch den Vorteil der Einführung
von Codons, welche bei der genetischen Expression in verschiedenen
Organismen bevorzugt sind, in die Sequenz bieten. Auf Grundlage
des derzeitigen Kenntnisstandes der unterschiedlichen Verwendung
verschiedener Codons in E. coli, Hefen und eukaryotischen Zellen
ist es, wenn die Anzahl der erforderlichen Dimere für die Bildung
jeder Synthesemischung (hinsichtlich der detaillierten Beschreibung
der Erfindung siehe unten) immer minimal gehalten wird, möglich, von
der Tabelle II, den Tabellen IV, V bzw. VI auszugehen, worin die
Codonhäufigkeiten
der einzelnen Codons gezeigt sind, während die günstigsten Auswahlen durch Schattierung
hervorgehoben sind. TABELLE
IV: Kombination B+D, angewandt auf E. coli
TABELLE
V: Kombination B+D, angewandt auf Hefe
TABELLLE
VI: Genetischer Code, Base + Dimer gemäß den häufigsten Codons bei Eukaryoten
-
Das
chemische Syntheseverfahren wird entsprechend der gewählten Kombination
organisiert. Gemäß den Merkmalen
des gewählten
Ansatzes ist das bevorzugte vorgeschlagene Verfahren dasjenige,
welches auf der Nukleotid-Dinukleotid-Kombination basiert, welche
in Tabelle II gezeigt (d.h. die B+D-Kombination) und hier im folgenden
beschrieben ist.
-
Das
Verfahren sieht die Herstellung vier identischer Synthesesäulen vor,
enthaltend das übliche
Harz, das für
diesen Zweck verwendet wird, gekennzeichnet mit den Bezeichnungen
der vier Nukleotide, d.h. T (oder U, wenn ein Polyribonukleotid
zu synthetisieren ist), C, A, G. Dann wird eine Mischung geeignet
ausgewählter Dinukleotide
auf dem Harz in einem automatischen Synthesizer kondensiert. In
der ersten Säule
(T) besteht die Mischung aus den Dinukleotiden, welche in Tabelle
II entsprechend schattiert sind (TT; CT; AT; GT; GG). In der zweiten
Säule (C)
besteht die Mischung aus den Dinukleotiden, die in Tabelle II entsprechend
schattiert sind (TT; CT; AT; AA; GT). In der dritten Säule (A)
besteht die Mischung aus den Dinukleotiden, welche in Tabelle II
entsprechend schattiert sind (TT; TG; CT; AT; AA). In der vierten
(G) besteht die Mischung aus den Dinukleotiden, welche in Tabelle
II entsprechend schattiert sind (TT; CT; AT; AA; GT). Auf diesen
Synthesezyklus folgt dann ein zweiter Zyklus, wobei ein einzelnes
Nukleotid (und speziell dasjenige, das mit dem Symbol der Säule gezeigt
ist, d.h. T in der ersten, C in der zweiten, A in der dritten und
G in der vierten) jeder Säule
zugegeben wird. Am Ende des zweiten Zyklus werden alle 20 der vorgewählten Codons
in das Harz der vier Säulen eingebaut
worden sein, jedoch werden in jeder Säule nur die in Tabelle II schattierten
Codons anwesend sein. Zur weiteren Randomisierung der Sequenz werden
die Säulen
nun geöffnet,
das Syntheseharz wird gewonnen und die vier Harze werden sorgfältig gemischt.
-
Das
gemischte Harz wird erneut auf vier Säulen verteilt, die Säulen werden
erneut mit der Synthesevorrichtung verbunden und die beiden Synthesezyklen
werden wie zuvor beschrieben wiederholt. In der Praxis werden in
jedem doppelten Synthesezyklus drei neue Einheiten der sich bildenden
Polynukleotidkette hinzugefügt,
um nur die vorgewählten
Codons zu bilden, jedoch in völlig
statistischer Weise, d.h. unabhängig
von den ausgewählten
Codons.
-
Dieses
Syntheseverfahren bietet beträchtliche
Vorteile gegenüber
den im Stand der Techniken beschriebenen, welche hier im folgenden
zusammengefasst werden.
- • Die Dinukleotidsynthese wird
nach Verfahren durchgeführt,
die in der Literatur gut beschrieben sind, und daher unter Verwendung
von kostengünstigen,
im Handel erhältlichen
Reagenzien, in Lösung
und mit Produktausbeuten von 85-90 % (Kumar, G., 1984).
- • In
den meisten Fällen
steht zu erwarten, dass der Unterschied in der Reaktivität verschiedener
Dinukleotide geringer ist als Reaktivitätsunterschiede bei insbesondere
Trinukleotiden. Die Hauptfolge ist, dass homogene Inkorporationen
von allen Molekülspezies,
die in der Synthesemischung vorliegen, in der sich bildenden Polynukleotidkette
leichter zu erhalten sind. Die Reinheit der Reagenzien ist ein bestimmender
Faktor für
diesen Aspekt der Reaktion.
- • Die
Gesamtanzahl der Dinukleotide, welche zur Abdeckung aller möglichen
Kombinationen erforderlich ist, ist äußerst niedrig. Tatsächlich variiert
sie von einem Minimum von 7 bis zu einem Maximum von 20 und in den üblicheren
Fällen,
wie den hier beschriebenen, sind 11 Dimere ausreichend.
- • Die
Auswahl der zu verwendenden Dinukleotide kann so erfolgen, dass
die Anzahl der Molekülspezies, welche
die Synthesemischung bilden, minimiert wird. Ein Beispiel ist das
in Tabelle II gezeigte, wobei die Dimere so gewählt sind, dass jede Synthesemischung
nur 5 Dinukleotide enthält.
Dies macht die Suche nach geeigneten Reaktionsbedingungen und relativen
molaren Konzentrationen der Reagenzien viel einfacher, um die homogene
Inkorporation aller Komponenten zu optimieren.
- • Eine
Synthese, die gemäß diesem
Ansatz durchgeführt
wird, ermöglicht
die Inkorporation vollständiger Codons
in der sich bildenden Kette. In der Tat ermöglicht eine sorgfältige Auswahl
von Dinukleotiden und Mononukleosiden eine Steuerung der Synthese,
um unerwünschte
Codons, wie z.B. Stoppcodons, auszuschließen. Eine Kombination, welche
speziell nur Stoppcodons ausschließt, ist beispielsweise die
in Tabelle II gezeigte, es ist jedoch auch möglich, die Kombination zu modifizieren,
um in einer oder mehreren Positionen) der endgültigen Sequenz ein beliebiges
unerwünschtes
Codon auszuschließen.
Falls
beispielsweise irgendwelche Aminosäuren von einer bestimmten Position
der Polypeptidkette ausgeschlossen werden sollen, beispielsweise
die sauren (Glutaminsäure,
Glu oder E, und Asparaginsäure,
Asp oder D), würde
das Weglassen der Dimere AT und AA in der der Säule G zugegebenen Mischung
in dem Synthesezyklus, der der gewünschten Position entspricht,
ausreichen. Jedoch sind entsprechend demselben Prinzip zahlreiche
andere Kombinationen möglich.
- • Bezüglich der
Synthese einer jeden Aminosäure
erlaubt die Möglichkeit
der Auswahl eines geeigneten Codons unter den vielen möglichen
Codons den Einbau nur derjenigen Codons, welche vorwiegend bei der Proteinsynthese
des ausgewählten
Mikroorganismus verwendet werden. Deshalb ist es durch Weglassen aus
der Mischung von Oligonukleotiden mit statistischer Sequenz derjenigen
Oligonukleotide, welche in dem System mit einer geringeren Effizienz
translatiert werden, möglich,
die genetische Expression zu maximieren und somit eine bessere Entsprechung
zwischen den Homogenitäten
des Oligonukleotids und der resultierenden Oligopeptidmischung zu
erhalten.
-
Alle
diese Erwägungen
unterstreichen die bemerkenswerten Vorteile, die sich aus einem
solchen Ansatz ergeben. In der Tat betreffen sie nicht ausschließlich das
Verfahren, das auf einer B+D-Kombination basiert, sondern gelten
im Gegenteil für
jede Art von Verfahren, das sich aus dem allgemeinen Ansatz ergibt
und deshalb aus dem vorgenannten ableitbar ist.
-
In
der Tat ist es beispielsweise auf Grundlage der in Tabelle III gezeigten
Kombination möglich,
ein Syntheseverfahren abzuleiten, welches sich von dem vorhergehenden
nur hinsichtlich des Aspekts unterscheidet, dass die Reihenfolge
der beiden synthetischen Zyklen umgekehrt werden muss: zuerst werden
alle einzelnen Mononukleotide auf synthetischen Harzen kondensiert
und Dinukleotidmischungen nur in der zweiten Runde.
-
Dieses
zweite Verfahren, ebenso wie die anderen, die sich von weiteren
möglichen
Kombinationen ableiten, sollen, obwohl von der Zielsetzung der Erfinder
umfasst, nicht weiter spezifiziert werden, da sie im wesentlichen
von dem zuvor beschriebenen ersten Verfahren ableitbar sind.
-
Beschreibung
der Figuren
-
Die
Erfindung wird mit Hilfe der beigefügten 1 besser
verständlich
werden.
-
1 zeigt
die chemische Struktur der Dimere, welche als monomere Einheiten
bei der Synthese der Codons der endgültigen Sequenz verwendet werden.
Jedes Dimer wird erhalten durch Substitution von Gruppen in B2-
und dann in B1-Position, wie für
jedes Dimer angegeben.
-
Detaillierte
Beschreibung der Erfindung
-
Ein
Verfahren wird beschrieben zur Synthese von Oligonukleotidmischungen,
welche vollständig
oder teilweise randomisierte Nukleotidsequenzen enthalten und welche
die folgenden Merkmale aufweisen:
- • jede Mischungskomponente
kodiert für
ein unterschiedliches Polypeptid. Verschiedene Oligonukleotide, die
für das
gleiche Polypeptid kodieren, liegen in der Mischung nicht vor;
- • der
statistische Sequenzanteil, der in jeder Mischungskomponente inkorporiert
ist, ist so aufgebaut, dass sich die Zufallsbestimmtheit der Sequenz
auf eine Einheit von drei benachbarten Nukleotiden (gewöhnlich einem
Codon entsprechend) anstelle von einzelnen Nukleotiden bezieht.
-
Der
statistische Sequenzanteil, der in jeder Mischungskomponente inkorporiert
ist, ist in der Tat so aufgebaut, dass, wenn man drei benachbarte
Nukleotideinheiten betrachtet, jede Einheit die Sequenz einer begrenzten
Anzahl von Trinukleotiden, definiert in einer vorgegebenen Liste
und 2 bis 64 der möglichen
Trinukleotide, gebildet durch die Kombination der vier natürlichen
Mononukleotide, enthaltend, aufweisen kann.
-
Diese
Merkmale sind eine direkte Folge des Syntheseverfahrens. In seiner
bevorzugten Form basiert dieses auf den folgenden Vorgängen:
- a) Vorselektion von Dinukleotiden in Gruppen,
wobei jede Gruppe aus denjenigen Dinukleotiden besteht, welche die
zweite und dritte Base mindestens eines der Codons bilden, die in
der Sequenz gewünscht
werden und die erste Base gemeinsam haben.
- b) Herstellung von Mischungen, welche aktivierte Dinukleotide
enthalten, wobei die Dinukleotide in den Mischungen durch den Vorgang
unter a) gruppiert und in einer geeigneten Konzentration neu verteilt
sind, um eine Homogenität
in der entsprechenden Repräsentation
von Tripletts zu erhalten;
- c) eine Synthese, welche parallel oder nicht durchgeführt werden
kann, in einem oder mehreren Reaktionsbehältern, die einen Träger für die Festphasensynthese
einer bekannten Sequenz enthalten, die am 3'-Terminus der endgültigen Sequenz entstehen wird;
- d) Zugabe der Mischungen aktivierter Dinukleotide unter b) zu
den Synthesebehältern,
eine für
jeden Behälter,
und Durchführung
einer Bindungsreaktion der darin enthaltenen aktivierten Dinukleotide
mit dem 5'-Terminus
der synthetisierten Sequenzen unter c);
- e) Zugabe von mindestens einem Mononukleotid zu mindestens einem
der Synthesebehälter,
ein Mononukleotid für
jeden Behälter,
und Durchführung
einer Bindungsreaktion am 5'-Terminus
der Dinukleotide;
- f) Öffnen
des Behälters
und Mischen der Träger,
um eine homogene Reaktionsmischung zu erhalten;
- g) Rekonstitution der Synthesebehälter mit einer Menge der homogenen
Mischung unter Punkt g), welche einem Bruchteil von 1/n für jeden
Behälter
entspricht, wobei n die Anzahl der verwendeten Behälter ist;
- h) Wiederholung der Arbeitssequenz unter d), e), f) und g) so
oft wie von der Anwendungsgestaltung gefordert;
- i) parallele oder nicht parallele Synthese einer bekannten Sequenz,
welche am 5'-Terminus des endgültigen Polynukleotidprodukts
vorliegen wird, in den Behältern.
-
Zur
beispielhaften Erläuterung
der Wege zur Durchführung
der verschiedenen vorstehenden Vorgänge wird das Verfahren hier
im folgenden zusammengefasst, deshalb kann auf der Grundlage von
Ausführungskriterien,
die häufiger
in der Laborpraxis angewandt werden, jeder Schritt nachgearbeitet
werden (oder in Teilschritte unterteilt).
-
Das
Verfahren kann somit wie folgt realisiert werden:
- α. Eine Tabelle
der 64 Trinukleotide, erhältlich
unter Berücksichtigung
der Kombination jedes der 4 möglichen
Nukleotide mit jedem der 16 möglichen
Dinukleotide (wie z.B. in Tabelle II).
- β. Neben
jedem in der Tabelle aufgeführten
Trinukleotid sind die Merkmale notiert, welche bei der Verwendung
des zu synthetisierenden Polynukleotids zu berücksichtigen sind. In der üblichsten
(jedoch nicht einzigen) Form sind diese Merkmale die Aminosäuren, welche
entsprechend dem natürlichen
genetischen Code kodierf werden, und die relative Häufigkeit
des Trinukleotids in natürlichen
Polynukleotidsequenzen von Organismen, worin das zu synthetisierende
Polynukleotid schließlich
exprimiert werden soll (wie in den Tabellen IV, V und VI). Sollte
es sich als möglich
erweisen, andere spezielle Merkmale zu etablieren, die Trinukleotiden
inhärent
sind, könnten
diese für
die Wahl einer Synthesestrategie berücksichtigt werden.
- γ. Dann
wird eine Selektion gewünschter
Trinukleotide durchgeführt,
wobei versucht wird, die Anzahl von Dinukleotiden, die für deren
Synthese erforderlich sind, auf einem absoluten Minimum zu halten
und sie so gleichförmig
wie möglich
in den vier Säulen
der Tabelle verteilt zu haben (wie beispielhaft dargestellt durch die
Schattierungen in den Tabellen II, III, IV, V und VI).
- δ. Herstellung
der ausgewählten
Dimere in einer aktivierten und geschützten Form. In einer bevorzugten Ausführungsform
sieht die vorliegende Erfindung die Herstellung der erforderlichen
Dinukleotide wie von Kumar, G., und Poonian, M.S., J. Org. Chem.
(1984), Bd. 49, S. 4905-4912, beschrieben vor. Die so erhaltenen
Dimere werden an ihrem 5'-Terminus
mit einer Dimethoxytritylgruppe geschützt, während der 3'-Terminus des Dimers mit Cyanoethylphosphoramidit
derivatisiert wird. Basen werden mit den im Stand der Technik beschriebenen
und bei der Oligonukleotidsynthese nach dem Phosphoramidit-Verfahren
verwendeten Schutzgruppen geschützt
(wie beispielsweise, nicht beschränkend, in 1 dargestellt).
Die Dimer-Reinheit beträgt
85-90 %, wie mittels Dünnschichtchromatographie
(DC) und magnetischer Kernresonanz, durchgeführt mit Phosphor31(31P-NMR), bestimmt. Zur Festlegung des Umfangs
dieser Erfindung sind die Syntheseverfahren der verschiedenen Dimere
nicht von Bedeutung, so lange sie mit dem Kondensierungsverfahren
auf einer festen Matrix, das für
die Polynukleotidsynthese verwendet wird, kompatibel sind.
- ε. In
der bevorzugten Ausführungsform
wird die Polynukleotidsynthese parallel durchgeführt, wobei als Synthesebehälter vier
Chromatographiesäulen
für die
Festphasensynthese, enthaltend Harz als Träger, eingesetzt werden, wobei übliche Protokolle,
welche vom Hersteller der verwendeten Apparatur beschrieben sind,
eingesetzt werden. Auf jeden Fall werden in dem vorliegenden Patent
Verfahren unter Bezugnahme auf beispielsweise die Firma Perkin Elmer
beschrieben, es ist jedoch gleichermaßen möglich, irgendeinen anderen
Satz oder irgendein anderes Festphasensyntheseverfahren, basierend
auf den gleichen oder ausreichend ähnlichen chemischen Reaktionen,
einzusetzen.
Vier Synthesesäulen
werden dann mit dem Satz verbunden und gewöhnlich (jedoch nicht notwendigerweise)
für die
parallele Synthese eines 3'-terminalen
Abschnitts mit einer einzigen und definierten Sequenz eingesetzt.
Diese enthält
oft Spaltstellen für
die Restriktionsenzyme oder irgendeine andere Sequenz, welche für die Klonierung
oder für
irgendeine andere wünschenswerte
Anwendung des Polynukleotids von Nutzen ist.
- ζ. Dann
werden auf den Säulen
1, 2, 3 bzw. 4 (auch als T, C, A und G bezeichnet, gemäß dem Mononukleotid,
das später
hinzugefügt
werden soll) die Dinukleotid-Mischungen, welche T, C, A und G entsprechen, gemäß der Definition
der Codons wie in der ausgewählten
Referenztabelle (z.B. eine der Tabellen II, IV, V, VI oder sogar
andere, erstellt wie vorstehend unter α, β und γ des vorliegenden Abschnitts
beschrieben) angegeben hinzugefügt.
Die Mischung, welche Dinukleotide entsprechend T enthält, soll
als Mischung T bezeichnet werden, diejenige, die A entspricht, als
Mischung A usw.
-
Die
molare Zusammensetzung der verschiedenen Mischungen sowie die Kopplungszeiten
müssen gemäß den Umständen optimiert
werden.
-
Bei
der üblichen
Praxis werden Kopplungszeiten im Bereich von 20 Sekunden bis 8 Minuten
gewählt, während die
relativen molaren Konzentrationen einzelner Dinukleotide, die in
den Mischungen vorliegen, von der Äquimolarität abweichen können, um
sowohl die Reinheit der einzelnen Dinukleotide als auch deren Reaktivität zu berücksichtigen.
Angaben für
die Reaktivität
einzelner Dinukleotide können
von der Reaktivität
der Trinukleotide mit demselben 3'-terminalen Dinukleotid abgeleitet werden,
wie erörtert
in Virnekas et al., 1994, Ono et al., 1994, Kagushin et al., 1994.
-
Die
Kondensierungsreaktion für
die Dimere geschieht gewöhnlich
mit einer 90-95%igen Ausbeute, gemessen mittels Freisetzung von
Trityl.
-
- η.
Der nächste
Syntheseschritt besteht in der Kopplung eines jeden Monomers an
die entsprechende Säule und
Mischung wie im folgenden beschrieben:
Säule 1 (Mischung T) 5'-O-Dimethoxytrityl,
Thymidin-3'-O-cyanoethylphosphoramidit
Säule 2 (Mischung
C) 5'-O-dimethoxytrityl,
Desoxycytidin-N4-benzoyl-3'-O-cyanoethylphosphoramidit
Säule 3 (Mischung
A) 5'-O-Dimethoxytrityl,
Desoxyadenosin-N6-Benzoyl-3'-O-cyanoethylphosphoramidit
Säule 4 (Mischung
G) 5'-O-Dimethoxytrityl-Monomer,
Desoxyguanosin-N2-isobutyryl-3'-O-cyanoethylphosphoramidit.
Nach
der üblichen
Acetylierung der Sequenzen, welche nicht reagierten, und der Oxidation
der Internukleotidphosphorbrücke
(gemäß klassischen
Syntheseschritten) wird die Synthese beendet.
- θ.
Die vier Synthesesäulen
werden geöffnet
und deren Harze gemischt, um eine homogene Mischung zu erhalten.
- ι. Die
vier Synthesesäulen
werden mit einer äquivalenten
Menge an Harz pro Säule
rekonstituiert und die Säulen
wieder mit dem Synthesizer verbunden.
- κ. Der
Prozess von ζ bis ι wird so
oft widerholt wie von der Anzahl der statistischen Trinukleotide
gefordert, welche in das Polynukleosid inseriert werden.
- λ. Die
Synthese wird gewöhnlich
terminiert durch parallele Synthese auf den vier Säulen eines
5'-terminalen Polynukleotid-Endes
bestimmter Sequenz, welche analoge Funktionen zu der in ε erörterten
3'-terminalen Sequenz
besitzt.
-
Deshalb
ist unter Berücksichtigung
aller Erläuterungen
der Gegenstand der vorliegenden Erfindung ein Verfahren zur chemischen
Synthese von Polynukleotiden mit einer vollständig oder teilweise statistischen Sequenz,
so dass für
den statistischen Sequenzanteil jede Trinukleotideinheit, die einem
Codon entspricht, eine begrenzte Anzahl vorgegebener Sequenzen aufweisen
kann. Das Verfahren ist gekennzeichnet durch die Tatsache, dass
als monomere Einheiten zur Synthese des statistischen Sequenzanteils
vorsynthetisierte Mononukleotide und Dinukleotide eingesetzt werden,
und die Tatsache, dass die Synthese auf einer Mehrzahl von Trägern durchgeführt wird,
so dass auf jedem der Träger
mindestens ein Reaktionszyklus, in dem eine Mischung dieser Dinukleotide
gebunden wird, alternierend mit mindestens einem Reaktionszyklus,
in dem ein Mononukleotid gebunden wird, durchgeführt wird. In einer bevorzugten
Ausführungsform
werden am Ende der Reaktionszyklen, welche für die Synthese eines Codons
erforderlich sind, die Träger
gemischt und dann erneut in zwei oder mehr Reaktionsbehälter aufgeteilt.
-
Insbesondere
wird der Fall betrachtet, dass die Dinukleotide die zweite und dritte
Base oder die erste und zweite Base derjenigen Codons bilden, welche
die erste bzw. dritte Base gemeinsam haben.
-
Ferner
sind die betrachteten Fälle
diejenigen, in denen solche Polynukleotide aus Desoxyribonukleotiden
aufgebaut sind, sowie derjenige, in dem sie aus Ribonukleotiden
aufgebaut sind.
-
Wenn
Dinukleotide, welche der zweiten und dritten Base derjenigen Codons
entsprechen, welche die erste Base gemeinsam haben (entsprechend
der B+D-Struktur, wie in der bevorzugten Ausführungsform zu sehen), eingesetzt
werden, ist das Verfahren dasjenige, das oben ausführlich in
den Vorgängen
a) bis i) erläutert
wurde.
-
In
dem analogen Fall, in dem die Dinukleotide verwendet werden, welche
der ersten und zweiten Base derjenigen Codons entsprechen, welche
die dritte Base gemeinsam haben (entsprechend dem D+B-Schema), ist
das Verfahren fast vollständig
identisch, abgesehen von einer Umkehrung der Vorgänge d) und
e).
-
Spezielle
Fälle treten
auf, wenn die Synthese parallel durchgeführt wird und wenn vier Mischungen vorliegen,
die Träger
aus einem Harz bestehen und die Behälter aus Säulen bestehen.
-
Gegenstand
der vorliegenden Erfindung ist auch das Verfahren unter Verwendung
von Dinukleotiden, welche die Bildung von Trinukleotideinheiten
bestimmen, die den häufigsten
Codons in E. coli, Eukaryoten und Hefegenomen entsprechen, und speziell
den Dinukleotiden TT, TC, TG, CT, CC, CG, AC, AA, AG, GT, GG, den
Dinukleotiden TC, TG, CC, AG, AG, GC, GG, bzw. den Dinukleotiden
TT, TC, TG, CT, CA, AC, AA, AG, GT, GA, GG.
-
Bezüglich der
ersten Folge von Dinukleotiden wird insbesondere der Fall betrachtet,
in dem sie in vier Mischungen wie folgt gemischt werden: W = TC;
TG; CC; AC; AA; X = TG; CG; AC; AG; GT; Y = TT; CT; AC; AA; GT;
Z = TC; CT; AC; GT; GG, und der Fall, in dem Codons auf den vier
Harzsäulen
nach der folgenden Gruppierung erhalten werden:
AW1 = | Isoleucin,
Methionin, Threonin, Asparagin, Lysin; |
CX1 = | Leucin,
Prolin, Histidin, Glutamin, Arginin; |
GY1 = | Valin,
Alanin, Asparaginsäure,
Glutaminsäure,
Glycin; |
TZ1 = | Phenylalanin,
Serin, Tyrosin, Cystein, Tryptophan. |
-
Schließlich wird
als genauso wichtig der Fall betrachtet, in dem Dinukleotide in
den folgenden molaren Anteilen gemischt werden: W2:
[AA] = [CC] = (TG] = [AC] = 1 M, [TC] = 1,5 M; X2:
[TG] = [AG] = [GT] = [CG] = 1 M, [AG] = 1,5 mM; Y2:
[GT] = [AC] = [CT] = [AA] = 1 M, und [TT] = 1,5 M; Z2:
[GG] = 2 M, [AC] = [CT] = [GT] = 1 M und [TC] = 1,5 M.
-
Soweit
wurde nur eine allgemeine Beschreibung der vorliegenden Erfindung
gegeben. Mit Hilfe der hier folgenden Beispiele wird nunmehr eine
detailliertere Beschreibung ihrer spezifischen Ausführungsformen gegeben,
mit dem Ziel, ein besseres Verständnis
der Ziele, Merkmale, Vorteile und Durchführungsmodalitäten der
Erfindung zu vermitteln. Diese Beispiele dienen nur zur Erläuterung
und nicht zur Beschränkung
des Umfangs der vorliegenden Erfindung, welcher durch die beigefügten Ansprüche definiert
ist.
-
BEISPIEL 1
-
Synthese
von 11 geschützten
Dinukleotiden nach den in 1 beschriebenen
Formeln.
-
Zur
Herstellung der erforderlichen Dimere für die Synthese eines Polynukleotids
mit einer teilweise randomisierten (aber hinsichtlich einer besseren
Transkription in E. coli kontrollierten) Sequenz wurde anhand der
Untersuchung der Tabelle IV die Entscheidung getroffen, 11 Dinukleotide,
die schattiert in der Tabelle gezeigt sind, nach dem von Kumar,
G., und Poonian beschriebenen Verfahren (Kumar, G., und Poonian,
M.S., J. Org. Chem. (1984), Bd. 49, S. 4905-4912) herzustellen.
Die so erhaltenen Dimere werden an ihrem 5'-Terminus mit einer Dimethoxytritylgruppe
geschützt,
während
der 3'-Teil des
Dimers mit Cyanoethylphosphoramidit derivatisiert wird. Die Basen
werden mit den Schutzgruppen geschützt, welche zur Synthese der
Oligonukleotide nach dem Phosphoramiditverfahren verwendet werden,
wie in Kumar und Poonian berichtet und in 1 angegeben.
-
Die
Reinheit der Dimere, bestimmt mittels DC und 31P-NMR,
wurde aus der folgenden Aufstellung analytischer Daten abgeleitet:
1H-NMR
(CDCl3), gemeinsam für alle Dimere:
δ 1,15-1,25
(12H, m, Isopropyl), 2,15-2,50 (4 × 2'-H), 2,80-2,90 (2H, m, -CH2CN
und 2H, m, OCH2 Cyanoethyl), 3,70-3,90 (13H,
m, 2 × 5'-H von 5'-Nukleosid, 2 × OCH3 von DMTr, POCH3 und
2H, m, -CH-Isopropyl), 4,00-4,50 (4H, 2 × 5'-H von 3'-Nukleosid und 2 × 4'-H), 5,00-5,35 (2H, m, 3'-H), 6,20-6,50 (2H,
m, 1'-H), 6,80-6,95
(4H, d, J = 8,8 Hz, 3,3',
5,5'-H von DMTr),
7,15-7,30 (9H von DMTr)
DMTr T/T Phos
1H
(CDCl3): δ 1,90-1,95
(6H, m, CH3 von Tim.), 7,20-7,25 (2H, m,
6-H of Tim.). 31P (CDCl3): δ –1,41, –2,26 (2 × P (V)
Diast.); 147,00, 148,60 (2 × P
(III) Diast.). ESI-MS: m/z 1085,03 (M + Na+);
Rf: 0,44 (5 % MeOH/DCM)
DMTr A/A Phos
1H
(CDCl3): δ 7,20-8,05
(10H, m, Bz), 8,10-8,80 (4H, m, 2-H und 8-H von Ade). 31P
(CDCl3): δ –1,69, –1,91 (2 × P (V)
Diast.); 148,10, 148,60 (2 × P
(III) Diast.). ESI-MS: m/z 1289,5 (M + Na+);
Rf: 0,47 (5 % MeOH/DCM)
DMTr C/C Phos
1H
(CDCl3): δ 7,25-7,40
(4H, m, 2 × 5,6-H
von Cit.), 7,50-8,20 (10H, m, Bz). 31P (CDCl3): δ –1,19, –1,94 (2 × P (V)
Diast.); 147,88, 149,07 (2 × P
(III) Diast.). ESI-MS: m/z 1242,5 (M + H+);
Rf: 0,48 (5 % MeOH/DCM)
DMTr G/G Phos
1H
(CDCl3): δ 1,20-1,40
(12H, m, CH3 von Isobut.), 2,40-2,55 (2H,
m, CH von Isobut.), 7,50-7,60
(2H, m, 8-H von Gua.).31P (CDCl3):δ –2,19, –1,51 (2 × P (V)
Diast.); 147,69, 148,19 (2 × P
(III) Diast.). ESI-MS: m/z 1253,2 (M + H+);
Rf: 0,37 (5 % MeOH/DCM) 31P (CDCl3): δ –2,20, –3,00 (2 × P (V)
Diast.); 147,20, 148,20 (2 × P
(III) Diast.). ESI-MS: m/z 1158,4 (M + H+);
Rf: 0,37 (5 % MeOH/DCM)
DMTr T/C Phos
1H
(CDCl3): δ 1,20-1,40
(3H, m, CH3 von Tim.), 7,30-7,40 (3H, m,
5, 6 von Cit. und 6-H von Tim.), 7,45-8,20 (5H, m, Bz). 31P (CDCl3): δ 1,00, –1,98 (2 × P (V)
Diast.); 147,8, 148,4 (2 × P
(III) Diast.). ESI-MS: m/z 1152,4 (M + H+);
Rf: 0,41 (5 % MeOH/DCM)
DMTr T/G Phos
1H
(CDCl3): δ 1,05-1,15
(6H, m, CH3 von Isobut.), 1,20-1,30 (3H,
m, CH3 von Tim.), 2,30-2,45 (1H, m, CH von Isobut.),
7,20-7,25 (1H, m, 6-H von Tim.), 7,40-7,70 (1H, m, 8-H von Gua.).
DMTr
A/G Phos
1H (CDCl3): δ 1,05-1,15
(6H, m, CH3 von Isobut.), 2,30-2,50 (1H,
m, CH von Isobut.), 7,45-8,70
(8H, m, 2, 3, 4, 5, 6-H Di-Bz, 8-H von Gua. und 2,8-H von Ade.). 31P (CDCl3): δ –1,63, –2,20 (2 × P (V)
Diast.); 147,06, 148,54 (2 × P
(III) Diast.). ESI-MS: m/z 1271,4 (M + H+);
Rf: 0,38 (5 % MeOH/DCM)
DMTr A/C Phos
1H
(CDCl3): δ 7,05-7,15
(2H, m, 5, 6-H von Cit.), 7,50-8,70 (12H, m, 2 × (2, 3, 4, 5, 6-H) von Bz
und 2, 8-H von Ade.). 31P (CDCl3): δ –0,19, 0,29
(2 × P
(V) Diast.); 147,66, 148,66, 148,85 (2 × P (III) Diast.). ESI-MS:
m/z 1266,1 (M + H+); Rf: 0,44 (5 % MeOH/DCM)
DMTr
C/T Phos
1H (CDCl3): δ 1,40 (3H,
s, 3H von Tim.), 7,20-7,40 (3H, m, 5, 6-H von Cit. und 6-H von Tim.),
7,50-8,05 (5H, m, Bz). 31P (CDCl3): δ –1,53, –1,98 (2 × P (V)
Diast.); 148,20, 148,45 (2 × P
(III) Diast.). ESI-MS: m/z 1175 (M + Na+);
1191 (M + K+); Rf: 0,42 (5 % MeOH/DCM)
DMTr
G/T Phos
1H (CDCl3): δ 1,1-1,25
(6H, m, CH3 von Isobut.), 1,30-1,35 (3H,
m, CH3 von Tim.), 2,25-2,50 (1H, m, CH von Isobut.),
7,15-7,20 (1H, m, 6-H von Tim.), 7,70-7,75 (1H, m, 8-H von Gua.). 31P (CDCl3): δ –0,40, –1,00 (2 × P (V)
Diast.); 148,00, 148,80 (2 × P
(III) Diast.). ESI-MS: m/z 1158,5 (M + H+),
1181 (M + Na+), 1196,4 (M + K+); 0,41
(5 % MeOH/DCM)
DMTr C/G Phos
1H
(CDCl3): δ 1,30
(6H, m, CH3 von Isobut.), 2,20-2,25 (1H,
m, CH von Isobut.), 7,15-7,25 (2H, m, 5, 6-H von Cit.), 7,45-8,30
(6H, m, 5-H Bz und 8-H von Gua.).31P (CDCl3): δ –2,47, –2,69 (2 × P (V)
Diast.); 147,75, 148,16 (2 × P
(III) Diast.). ESI-MS: m/z 1246 (M + H+);
0,44 (5 % MeOH/DCM)
-
Aus
diesen Daten kann abgeleitet werden, dass die Reinheit der synthetisierten
Dimere zwischen 85 und 90 % liegt.
-
BEISPIEL 2
-
Synthese
eines Oligonukleotids, bestehend aus 20 Nukleotiden gemäß der Formel:
5'-AGTCGCG[P'P]TCGACCT-3'
wobei P' und P Trinukleotide
bedeuten, welche für
irgendwelche der 20 natürlichen
Aminosäuren
kodieren können,
ausgewählt,
um die bekannte Verwendungshäufigkeit
für den
Mikroorganismus E. coli zu reflektieren.
-
Die
Mischung, welche sich aus dieser Synthese ergibt, wird tatsächlich aus
insgesamt 400 verschiedenen Polynukleotiden bestehen.
-
Mit
den 11 Dinukleotiden, die wie in Beispiel 1 hergestellt wurden,
werden dann vier Mischungen auf folgende Weise vorbereitet: Mischung
Z
Dimer
TC | 0,0225
mmol |
CT | 0,015
mmol |
AG | 0,015
mmol |
GT | 0,015
mmol |
GG | 0,03
mmol |
-
Die
ausgewogenen Mengen werden dann in 1 ml Acetonitril gelöst, um eine
Endkonzentration von 0,0975 mmol/ml (d.h. 0,0975 M) zu ergeben. Mischung
X
Dimer
TG | 0,015
mmol |
CG | 0,015
mmol |
AC | 0,015
mmol |
AG | 0,0225
mmol |
GT | 0,015
mmol |
-
Die
ausgewogenen Mengen werden in 1 ml Acetonitril gelöst, um eine
Endkonzentration von 0,0825 mmol/ml (d.h. 0,0825 M) zu ergeben. Mischung
W
Dimer
TC | 0,0225
mmol |
TG | 0,015
mmol |
CC | 0,015
mmol |
AC | 0,015
mmol |
AA | 0,015
mmol |
-
Die
ausgewogenen Mengen werden in 1 ml Acetonitril gelöst, um eine
Endkonzentration von 0,0825 mmol/ml (d.h. 0,0825 M) zu ergeben. Mischung
Y
Dimere
TT | 0,0225
mmol |
CT | 0,015
mmol |
AC | 0,015
mmol |
AA | 0,015
mmol |
GT | 0,015
mmol |
-
Die
ausgewogenen Mengen werden in 1 ml Acetonitril gelöst, um eine
Endkonzentration von 0,0825 mmol/ml (d.h. 0,0825 M) zu ergeben.
-
Die
vier Mischungen (W, X, Y, Z) werden in Acetonitril, das weniger
als 30 ppm Wasser enthält,
und unter Argon gelöst,
auf den DNA APPLIED BIOSYSTEM 394 DNA/RNA-Synthesizer in den Positionen 5, 6,
7 bzw. 8 der Apparatur aufgetragen. Alle Reagenzien (Lösungsmittel,
Aktivatoren und Synthesesäulen
im Maßstab
40 nmol) wurden von Perkin Elmer erworben und gemäß den Instruktionen
des Herstellers verwendet.
-
Die
Synthese beginnt mit der parallelen Synthese des 3'-Abschnitts des Oligonukleotids
auf den vier Säulen:
-
Dann
wird der degenerierte Abschnitt des Oligonukleotids wie zuvor beschrieben
synthetisiert:
Auf den Säulen
1, 2, 3 und 4 werden die Dimer-Mischungen W, X, Y und Z in den vorgenannten
Konzentrationen zugegeben und die Reaktion wird durchgeführt, wobei
eine dreiminütige
Kopplungszeit gestattet wird. Die Kondensationsreaktion der Dimere
wird gewöhnlich
mit einer Ausbeute von 90-95 % durchgeführt, gemessen mittels Freisetzung
von Trityl. Auf den Säulen
werden die folgenden Oligonukleotide synthetisiert:
-
Dann
folgt die Addition der Basen A, C, G und T auf den Reaktionssäulen 1,
2, 3 bzw. 4:
-
Nach
den üblichen
Acetylierung- und Oxidationsreaktionen (gemäß den klassischen Syntheseverfahren)
wird die Synthese beendet. Die Säulen
werden getrennt, geöffnet
und das Harz der vier Synthesesäulen wird
vereinigt (für
insgesamt 40 mg) und homogen gemischt.
-
Die
Mischung wird dann erneut in vier gleiche Teile ( 4 × 10 mg)
aufgeteilt und dann erneut auf vier neue Synthesesäulen aufgeteilt:
wobei P = (AW + CX + GY +
TZ).
-
Das
Verfahren wird für
die zweite degenerierte Position wiederholt: P'
-
Die
Mischungen W, X, Y bzw. Z werden jeweils den Säulen 1, 2, 3 und 4 zugegeben:
dann folgt die Zugabe der
dritten Base des Codons auf die jeweiligen Säulen:
-
Dann
wird das Harz der vier Säulen
homogen gemischt und auf vier neue Synthesesäulen aufgeteilt. Zu diesem
Zeitpunkt wurde das zweite degenerierte Codon P' synthetisiert, deshalb enthalten die
Säulen:
wobei P' = P = (AW, CX, GY, TZ)
-
Nach
der Synthese des zweiten Trinukleotids P' (Base + Dimer-Mischung) wird die 5'-Region, welche das Oligonukleotid flankiert
[AGT CGC G], auf den vier Säulen
parallel synthetisiert, und hat daher die Oligonukleotid-Sequenz:
5'-AGTCGCGP'PTCGACCT-3'
wobei P' = P = (AW, CX, GY,
TZ), entsprechend den Codons: ATC, ATG, ACC, AAC, AAA, CTG, CCG,
CAC, CAG, CGT, GTT, GCT, GAC, GAA, GGT, TTC, TCT, TAC, TGT und TGG.
-
Wenn
die Synthese vollständig
ist, wird das an dem zur Synthese verwendeten Harz haftende Oligomer
entfernt und gemäß den klassischen
Verfahren, welche für
die Konstruktion synthetischer Oligonukleotide unter Verwendung
der Chemie von O-Methylphosphoramiditen verwendet werden (7), von
der Schutzgruppe befreit.
-
BEISPIEL 3
-
Funktionelle
und genetische Analyse des in Beispiel 2 synthetisierten Polynukleotids
mit der Sequenz:
5'-AGTCGCG[P'P]TCGACCT-3'
wobei P' = P = (AW, CX, GY,
TZ), entsprechend den Codons: ATC, ATG, ACC, AAC, AAA, CTG, CCG,
CAC, CAG, CGT, GTT, GCT, GAC, GAA, GGT, TTC, TCT, TAC, TGT und TGG.
-
Das
in Beispiel 2 synthetisierte degenerierte Polynukleotid besteht
aus einer Mischung von 400 Polynukleotiden. Im vorliegenden Beispiel
wurde die Mischung der Bequemlichkeit halber als "Polynukleotid B" bezeichnet. Zur
Analyse seiner tatsächlichen
Zusammensetzung, um in der Praxis zu verifizieren, dass alle 400 Molekülspezies,
die von der Synthese erwartet werden, in der Mischung vorliegen,
wurden die folgenden Schritte durchgeführt:
=> das folgende Oligonukleotid wurde mit
einem herkömmlichen
Verfahren synthetisiert:
Oligonukleotid A
14 Nukleotide
Sequenz:
5'CGCGACTAGGTCGA3'.
-
Die
Sequenz dieses Oligonukleotids wurde so konzipiert, um sowohl in
ihrem 3'-terminalen
Teil (7 Nukleotide) zu dem 3'-terminalen
Teil des Oligonukleotids B als auch in ihrem 5'-terminalen
Teil (7 Nukleotide) zu dem 5'-terminalen
Teil des Oligonukleotids B komplementär zu sein.
- => Beide
Oligonukleotide wurden enzymatisch am 5'-Terminus phosphoryliert, in äquimolaren
Mengen gemischt, bei 95° C
denaturiert und dann verschmelzen und polymerisieren gelassen, indem
die Temperatur langsam auf 15° C
gebracht wurde.
- => Die Mischung
wurde dann einer enzymatischen Ligierung und dann einer Komplettierungsreaktion durch
Inkubation mit Klenow-Polymerase unterzogen. Die Ligierungsreaktion
beinhaltet die Bildung eines Doppelhelix-DNA-Fragments, enthaltend
aufeinanderfolgende "Kopf-Schwanz"-Wiederholungen einer DNA-Einheit,
die aus den beiden gekoppelten Oligonukleotiden A und B besteht.
- => Die gebildeten
Fragmente, welche mit glatten Enden entstanden, wurden dann in die
EcoRV-Stelle des Plasmids pBSks+ kloniert. Die Ligierungsmischung
wurde anschließend
hinsichtlich der rekombinanten Klone mit EcoRV-Verdauung angereichert
und zur Transkription von kompetenten XL-1-Blue-Bakterienzellen
verwendet.
- => Rekombinante
Klone wurden mittels colorimetrischer Selektion auf LB+Amp+Xgal/-IPTG-Platten identifiziert.
- => 20 zufällig ausgewählte Klone
wurden expandiert und die darin enthaltene gesamte rekombinante
Sequenz wurde amplifiziert und mittels PCR (Polymerasekettenreaktion)
kloniert.
- => Die Analyse
mittels Elektrophorese auf einem Agarosegel erlaubte die Feststellung
der Länge
einer jeden Klon-Insertion.
- => Inserts von
20 Klonen wurden sequenziert, was so die Bestimmung von 170 variablen
Abschnitten, enthaltend im Oligonukleotid B, erlaubte.
-
Tabelle
VIII zeigt die Häufigkeiten,
die für
jedes der 20 Trinukleotide, welche der Versuchsaufbau bereitstellte,
beobachtet wurden. Aus Tabelle VIII ergibt sich, dass alle Trinukleotide,
die bei dem Versuchsaufbau (gemäß Tabelle
IV) erwartet wurden, vorliegen und dass deren Häufigkeit sich nicht signifikant
von einer gleichmäßigen Verteilung
unterscheidet.
-
TABELLE
VII: Häufigkeiten
der Tripletts, die bei der Sequenzierung von 170 Codons beobachtet
wurden, welche in dem degenerierten Abschnitt der DNA von 20 Klonen
vorliegen, zufällig
in einer Bank degenerierter Oligonukleotide ausgewählt, die
nach dem Verfahren der Erfindung synthetisiert wurden.
CODONS | HÄUFIGKEIT |
AAA | 11 |
ACC | 7 |
ATC | 11 |
ATG | 7 |
AAC | 7 |
CTG | 12 |
CAG | 13 |
CAC | 11 |
CGT | 7 |
CCG | 5 |
GTT | 14 |
GAA | 11 |
GAC | 11 |
GCT | 5 |
GGT | 3 |
TGG | 6 |
TTC | 6 |
TAC | 10 |
TCT | 10 |
TGT | 3 |
| 170 |
-
BIBLIOGRAPHISCHE REFERENZEN
-
- • Gait,
M.J., Oligonucleotides Synthesis " A Practical Approach Series"; (1984) IRL Press
Oxford, Washington D.C.
- • Huang,
W., und Santi, D.V. (1994), Anal. Biochem. 218, S. 454-457
- • Kayushin,
A.L., Korosteleva, M.D., Miroshnikov, A.I., Kosch, W., Zubov, D.,
und Piel, N. (1998), Nucleic Acid Research, Bd. 24, Nr. 19.
- • Kumar,
G., und Poonian, M.S., J. Org. Chem. (1984), Bd. 49, S. 4905-4912.
- • Lyttle,
M.H., Napolitano, E.W., Calio, B.L., und Kauvar, L.M., Biotechniques
(1995), Bd. 19, N2, S. 274-280.
- • Ono,
A., Matsuda, A., Zhao, J., und Santi, D.V., Nucleic Acids Research
(1994), Bd. 22; N25, S. 5600-5607
- • Sambrook,
J., Fritsch, E.F., und Maniatis, T. (1989), in "Molecular Cloning, a Laboratory Manual", Cold Spring Harbour
Laboratory, 2. Auflage, Cold Spring Harbour, NY
- • Virnekas,
B., Ge I., Plucksthun A., Schneider, K. C., Wellnhofer, G., und
Moroney, S.E., Nucleic Acids Research (1994), Bd. 22; N25, S. 5600-5607