-
FACHGEBIET
-
Die
Erfindung bezieht sich auf DNA-Bindungsproteine, wie Transkriptionsfaktoren.
-
HINTERGRUND
-
Die
Regulation der meisten Gene erfolgt auf der Ebene der Transkription
durch Polypeptid-Transkriptionsfaktoren, die an spezifische DNA-Stellen
innerhalb des Gens binden, im typischen Fall an Promoter- oder Enhancerregionen.
Diese Proteine aktivieren oder reprimieren die Initiation der Transkription
durch RNA-Polymerase am Promoter und regulieren auf diese Weise
die Expression des Zielgens. Viele Transkriptionsfaktoren, und zwar
sowohl Aktivatoren als auch Repressoren, besitzen eine modulare
Struktur. Diese Module können
sich als strukturell eigenständige
Domänen
falten und besitzen spezifische Funktionen, wie DNA-Bindung, Dimerisierung
oder Wechselwirkung mit dem Transkriptionsapparat. Werden Effektordomänen, wie
Aktivierungsdomänen
oder Repressionsdomänen,
zu DNA-Bindungsdomänen
von heterologen Transkriptionsfaktoren übertragen, bleibt ihre Funktion
erhalten (Brent and Ptashne, (1985) Cell 43:729-36; Dawson et al.,
(1995) Mol. Cell. Biol. 15:6923-31).
Die dreidimensionale Struktur zahlreicher DNA-Bindungsdomänen, einschließlich Zinkfingerdomänen, Homöodomänen und
Helix-Turn-Helix-Domänen, sind
aus NMR- und röntgenkristallografischen
Daten ermittelt worden. Greisman und Pabo beschreiben ein Verfahren
zur Auswahl von DNA-Bindungsproteinen,
insbesondere Zinkfingerproteinen, die gewünschte Sequenzen erkennen ((1997),
Science 275:657-661). Zinkfingerdomänen können mit der Polymerasekettenreaktion
charakterisiert und identifiziert werden (Pellegrino and Berg, (1991)
Proc. Natl. Acad. Sci. 88:671-675).
-
ZUSAMMENFASSUNG
-
Die
Erfindung legt ein schnelles und skalierbares, zellbasiertes Verfahren
zur Identifizierung und Konstruktion von chimären Transkriptionsfaktoren
vor. Transkriptionsfaktoren dieser Art können beispielsweise zur Änderung
der Expression von endogenen Genen bei Anwendungen im Bereich der
Biomedizin und Biotechnik verwendet werden. Der Assay von Transkriptionsfaktoren
wird unter In-vivo-Bedingungen, d. h. in intakten, lebenden Zellen,
durchgeführt.
Außerdem
erstreckt sich die Gültigkeit
der Erfindung auf neuartige Nukleinsäurebindungsdomänen, die
beispielsweise durch Anwendung des Verfahrens beim Screening von
Genomsequenzen entdeckt werden können.
-
Die
Erfindung bietet ein Verfahren zur Identifizierung einer Peptiddomäne, die
eine Zielstelle auf einer DNA erkennt. Auf dieses Verfahren wird
im vorliegenden Schriftstück
gelegentlich als das "Domänenauswahlverfahren" oder das "In-vivo-Screeningverfahren" Bezug genommen.
Das Verfahren beinhaltet die Bereitstellung (1) von Zellen, die
ein Reporterkonstrukt enthalten, und (2) einer Vielzahl von Hybridnukleinsäuren. In dem
Reporterkonstrukt ist ein Reportergen auf operative Weise mit einem
Promoter verbunden, der sowohl eine Rekrutierungsstelle als auch
eine Zielstelle besitzt. Das Reportergen wird über ein gegebenes Niveau hinaus
exprimiert, wenn ein Transkriptionsfaktor sowohl die Rekrutierungsstelle
als auch die Zielstelle des Promoters erkennt (d. h. daran mit einem
höheren
Niveau als Background bindet), aber nicht, wenn der Transkriptionsfaktor
nur die Rekrutierungsstelle des Promoters erkennt. Jede Hybridnukleinsäure aus
der Vielzahl enthält
den Code für
ein nicht-natürlich
vorkommendes Protein mit den folgenden Elementen: (i) eine Transkriptionsaktivierungsdomäne, (ii)
eine DNA-Bindungsdomäne, die
die Rekrutierungsstelle erkennt, und (iii) eine Testzinkfingerdomäne. Die
Aminosäuresequenz
der Testzinkfingerdomäne
unterscheidet sich bei den Mitgliedern der Vielzahl von Hybridnukleinsäuren. Das
Verfahren beinhaltet weiterhin: in Kontakt bringen der Vielzahl von
Nukleinsäuren
mit den Zellen unter Bedingungen, die es mindestens einer aus der
Vielzahl von Nukleinsäuren
erlaubt, in mindestens eine der Zellen einzudringen, Kultivierung
der Zellen unter Bedingungen, die die Expression der Hybridnukleinsäuren in
den Zellen erlauben, und Identifizierung einer Zelle, die das Reportergen über das
gegebene Niveau hinaus exprimiert, was darauf hinweist, dass die
Zelle eine Hybridnukleinsäure mit
dem Code für
eine die Zielstelle erkennende Testzinkfingerdomäne enthält.
-
Die
DNA-Bindungsdomäne,
d. h. die Domäne,
die die Rekrutierungsstelle erkennt und sich bei den Mitgliedern
der Vielzahl nicht unterscheidet, kann beispielsweise eine, zwei,
drei oder mehr Zinkfingerdomänen
beinhalten. Bei den bei diesem Verfahren verwendeten Zellen kann
es sich um prokaryotische oder eukaryotische Zellen handeln. Beispielhafte
eukaryotische Zellen sind Hefezellen, z. B. Saccharomyces cerevisiae, Schizosaccharomyces
pombe oder Pichia pasteuris, Insektenzellen, wie Sf9-Zellen, und
Säugetierzellen,
wie Fibroblasten oder Lymphozyten.
-
Das "gegebene Niveau" entspricht der Menge
an Expression, die beobachtet wird, wenn der Transkriptionsfaktor
zwar die Rekrutierungsstelle, aber nicht die Zielstelle erkennt.
Das "gegebene Niveau" kann in manchen
Fälle bei
Null liegen (zumindest innerhalb der Nachweisgrenze des verwendeten
Assays).
-
Das
Verfahren kann einen zusätzlichen
Schritt der Amplifizierung einer Quellnukleinsäure mit dem Code für die Testzinkfingerdomäne aus einer
Nukleinsäure
beinhalten, z. B. genomische DNA, eine mRNA-Mischung oder eine cDNA-Mischung,
um ein amplifiziertes Fragment zu produzieren. Die Quellnukleinsäure kann
unter Verwendung eines Oligonukleotidprimers amplifiziert werden.
Der Oligonukleotidprimer kann eines aus einem Satz von degenerierten
Oligonukleotiden (z. B. ein Pool aus spezifischen Oligonukleotiden
mit unterschiedlichen Nukleinsäuresequenzen
oder ein spezifisches Oligonukleotid mit einer nicht-natürlichen
Base wie Inosin) sein, das durch Annealing an eine Nukleinsäure mit
dem Code für
den Randbereich einer konservierten Domäne bindet. Als Alternative
kann es sich bei dem Primer um ein spezifisches Oligonukleotid handeln.
Die amplifizierten Fragmente werden zur Produktion einer Hybridnukleinsäure zur
Einbeziehung in die beim vorstehend angegebenen Verfahren verwendete
Vielzahl von Hybridnukleinsäuren
verwendet.
-
Darüber hinaus
kann das Verfahren die Schritte der (i) Identifizierung einer Kandidatenaminosäuresequenz
einer Zinkfingerdomäne
in einer Sequenzdatenbank, (ii) Bereitstellung einer Kandidatennukleinsäure mit
dem Code für
die Kandidatenaminosäuresequenz
der Zinkfingerdomäne
und (iii) Nutzung der Kandidatennukleinsäure zur Konstruktion einer
Hybridnukleinsäure
zur Einbeziehung in die beim vorstehend angegebenen Verfahren verwendete
Vielzahl von Hybridnukleinsäuren
beinhalten. Die Datenbank kann Unterlagen für multiple Aminosäuresequenzen
beinhalten, z. B. bekannte und/oder vorhergesagte Proteine, sowie
multiple Nukleinsäuresequenzen,
wie cDNAs, ESTs, genomische DNA oder genomische DNA nach Verarbeitung
mit dem Computer zur Entfernung von Introns beinhalten.
-
Auf
Wunsch kann das Verfahren wiederholt werden, um eine zweite Testzinkfingerdomäne zu identifizieren,
die eine zweite Zielstelle erkennt, d. h. eine andere Stelle als
die von der ersten Zinkfingerdomäne
erkannte Stelle. Anschließend
kann eine Nukleinsäure
mit dem Code für
sowohl die erste als auch die zweite identifizierte Testzinkfingerdomäne konstruiert
werden. Das kodierte Hybridprotein würde eine Zielstelle, die die
Zielstelle der ersten Testzinkfingerdomäne und die Zielstelle der zweiten
Testzinkfingerdomäne
beinhaltet, spezifisch erkennen.
-
Die
Erfindung bietet außerdem
ein Verfahren zur Ermittlung, ob eine Testzinkfingerdomäne eine
Zielstelle an einem Promoter erkennt. Auf dieses Verfahren wird
im vorliegenden Schriftstück
gelegentlich als das "Stellenauswahlverfahren" Bezug genommen.
Das Verfahren beinhaltet die Schritte der Bereitstellung eines Reporterkonstrukts
und einer Hybridnukleinsäure.
Das Reportergen ist auf operative Weise mit einem Promoter verbunden,
der sowohl eine Rekrutierungsstelle als auch eine Zielstelle beinhaltet,
und wird über
ein gegebenes Niveau hinaus exprimiert, wenn ein Transkriptionsfaktor
sowohl die Rekrutierungsstelle als auch die Zielstelle des Promoters
erkennt, aber nicht, wenn der Transkriptionsfaktor nur die Rekrutierungsstelle
des Promoters erkennt. Die Hybridnukleinsäure enthält den Code für ein nicht-natürlich vorkommendes
Protein mit den folgenden Elementen: (i) eine Transkriptionsaktivierungsdomäne, (ii)
eine DNA-Bindungsdomäne, die
die Rekrutierungsstelle erkennt, und (iii) eine Testzinkfingerdomäne. Das
Verfahren beinhaltet weiterhin: in Kontakt bringen des Reporterkonstrukts
mit einer Zelle unter Bedingungen, die es dem Reporterkonstrukt
erlauben, in die Zelle einzudringen, vor, nach oder gleichzeitig
mit dem vorstehend angegebenen Schritt, in Kontakt bringen der Hybridnukleinsäuren mit
der Zelle unter Bedingungen, die es der Hybridnukleinsäure erlauben,
in die Zelle einzudringen, Kultivierung der Zelle unter Bedingungen,
die die Expression der Hybridnukleinsäure in der Zelle erlauben und
Nachweis der Expression des Reportergens in der Zelle. Ein Reportergen-Expressionsniveau,
das größer als
ein gegebenes Niveau ist, ist ein Hinweis darauf, dass die Testzinkfingerdomäne die Zielstelle
erkennt.
-
Das
Reporterkonstrukt und die Hybridnukleinsäure können auf getrennten Plasmiden
enthalten sein. Die beiden Plasmide können gleichzeitig oder nacheinander
in die Zelle eingeführt
werden. Ein oder beide Plasmide können selektierbare Marker enthalten.
Das Reporterkonstrukt und die Hybridnukleinsäure können auf auch dem selben Plasmid
enthalten sein, wobei in diesem Fall lediglich ein einziger Kontaktierungsschritt erforderlich
ist, um beide Nukleinsäuren
in eine Zelle einzuführen.
Bei einer weiteren Umsetzung sind eine oder beide Nukleinsäuren stabil
in ein Genom einer Zelle integriert. Bei diesem Verfahren kann wie
bei jedem im vorliegenden Schriftstück beschriebenen In-vivo-Verfahren
die Transkriptionsaktivierungsdomäne durch eine Transkriptionsrepressionsdomäne ersetzt
sein und es wird eine Zelle identifiziert, in der das Reportergen-Expressionsniveau
auf ein Niveau unter dem gegebenen Niveau gesenkt ist.
-
Ein
weiteres Verfahren der Erfindung ermöglicht die schnelle Ermittlung
einer Bindungspräferenz
einer Testzinkfingerdomäne
durch die Fusion zweier Zellen. Das Verfahren beinhaltet: Bereitstellung
einer ersten Zelle, die das Reportergen enthält; Bereitstellung einer zweiten
Zelle, die die Hybridnukleinsäure
enthält;
Fusion der ersten und zweiten Zelle zur Bildung einer fusionierten
Zelle; Kultivierung der fusionierten Zellen unter Bedingungen, die
die Expression der Hybridnukleinsäuren in der fusionierten Zelle
erlauben; und Nachweis der Reportergenexpression in der fusionierten
Zelle, wobei ein höheres
Reportergen-Expressionsniveau als das gegebene Niveau einen Hinweis
darauf darstellt, dass die Testzinkfingerdomäne die Zielstelle erkennt.
Bei der ersten und zweiten Zelle kann es sich beispielsweise um
Gewebekulturzellen oder Pilzzellen handeln. Bei einer beispielhaften
Implementierung des Verfahrens werden S. cerevisiae-Zellen verwendet.
Die erste Zelle besitzt einen ersten Paarungstyp, z. B. MATa; die
zweite Zelle besitzt einen zweiten Paarungstyp, der sich von dem
ersten unterscheidet, z. B. MATa. Die beiden Zellen werden miteinander
in Kontakt gebracht und durch die Paarung der Hefen wird eine einzelne
Zelle (z. B. MATa/α)
mit einem Zellkern produziert, der das Genom sowohl der ersten als
auch der zweiten Zelle enthält.
Das Verfahren kann die Bereitstellung von multiplen ersten Zellen
beinhalten, die alle denselben ersten Paarungstyp besitzen, wobei
jede erste Zelle ein Reporterkonstrukt mit einer unterschiedlichen
Zielstelle besitzt. Multiple zweite Zellen, die alle den selben
zweiten Paarungstyp besitzen und jeweils eine unterschiedliche Testzinkfingerdomäne besitzen,
werden ebenfalls bereitgestellt. Es wird eine Matrix aus multiplen
paarweisen Paarungen erstellt, z. B. alle möglichen paarweisen Paarungen.
Das Verfahren wird angewandt zur Ermittlung der Bindungspräferenz von
multiplen Testzinkfingerdomänen
für multiple
Bindungsstellen, z. B. einen vollständigen Satz von möglichen
Zielstellen.
-
Die
Erfindung legt außerdem
ein Verfahren zum Assay einer Bindungspräferenz einer Testzinkfingerdomäne vor.
Das Verfahren beinhaltet die Bereitstellung (1) von Zellen, die
im wesentlichen alle eine Hybridnukleinsäure enthalten, und (2) einer
Vielzahl von Reporterkonstrukten. Bei jedem Reporterkonstrukt der
Vielzahl ist ein Reportergen auf operative Weise mit einem Promoter
mit einer Rekrutierungsstelle und einer Zielstelle verknüpft. Das
Reportergen wird über
ein gegebenes Niveau hinaus exprimiert, wenn ein Transkriptionsfaktor
sowohl die Rekrutierungsstelle als auch die Zielstelle des Promoters
erkennt, aber nicht, wenn der Transkriptionsfaktor nur an die Rekrutierungsstelle
des Promoters bindet. Die zweite Zielstelle unterscheidet sich bei
den Mitgliedern der Vielzahl von Reporterkonstrukten. Die Hybridnukleinsäure enthält den Code
für ein
Hybridprotein mit den folgenden Elementen: (i) eine Transkriptionsaktivierungsdomäne, (ii)
eine DNA-Bindungsdomäne,
die die Rekrutierungsstelle erkennt, und (iii) eine Testzinkfingerdomäne. Das
Verfahren beinhaltet weiterhin: in Kontakt bringen der Vielzahl
von Reporterkonstrukten mit den Zellen unter Bedingungen, die es mindestens
einem aus der Vielzahl von Reporterkonstrukten erlauben, in mindestens
eine der Zellen einzudringen, Kultivierung der Zellen unter Bedingungen,
die die Expression der Nukleinsäuren
in den Zellen erlauben, Identifizierung einer Zelle, die ein Reporterkonstrukt
in der Zelle enthält
und das Reporterkonstrukt über das
gegebene Niveau hinaus exprimiert, was darauf hinweist, dass das
Reporterkonstrukt in der Zelle eine Zielstelle besitzt, die von
der Testzinkfingerdomäne
erkannt wird.
-
Mit
dem vorstehenden Verfahren kann eine Vielzahl von Zellen, jeweils
mit einer unterschiedlichen Zielstelle, identifiziert werden, wenn
die Testzinkfingerdomäne
eine Bindungspräferenz
für mehr
als eine Zielstelle besitzt. Das Verfahren kann weiterhin die Identifizierung
der Zelle, die das höchste
Reportergen-Expressionsniveau aufweist, beinhalten. Als Alternative
wird ein Schwellenniveau der Reportergenexpression ermittelt, z.
B. ein 2-, 4-, 8-, 20-, 50-, 100-, 1000- oder mehr-facher Anstieg
der Reportergenexpression, und sämtliche
Zellen mit einer Reportergenexpression über dem Schwellenwert werden
ausgewählt.
-
Die
Zielbindungsstelle kann beispielsweise eine Länge von zwischen zwei und sechs
Nukleotiden aufweisen. Die Vielzahl der Reporterkonstrukte kann
an zwei, drei oder vier oder mehr Positionen der Zielbindungsstelle
jede mögliche
Kombination der Nukleotide A, T, G und C beinhalten.
-
Einem
weiteren Merkmal zufolge bietet die Erfindung ein Verfahren zur
Identifizierung einer Vielzahl von Zinkfingerdomänen. Das Verfahren beinhaltet:
Durchführung
des Domänenauswahlverfahrens
zur Identifizierung einer ersten Testzinkfingerdomäne und erneute
Durchführung
des Domänenauswahlverfahrens
zur Identifizierung einer zweiten Testzinkfingerdomäne, die
eine Zielstelle erkennt, die sich von der Zielstelle der ersten
Testzinkfingerdomäne
unterscheidet. Außerdem
wird ein Verfahren zur Erzeugung einer Nukleinsäure mit dem Code für ein chimäres Zinkfingerprotein
geboten, wobei das Verfahren die zweifache Durchführung des
Domänenauswahlverfahrens
zur Identifizierung einer ersten und einer zweiten Testzinkfingerdomäne und die
Konstruktion einer Nukleinsäure
mit dem Code für
ein Polypeptid beinhaltet, das die erste und die zweite Testzinkfingerdomäne beinhaltet.
Die Nukleinsäure
kann den Code für
ein Hybridprotein enthalten, das die beiden Domänen beinhaltet, die eine Stelle,
die zwei Unterstellen beinhaltet, spezifisch erkennen. Bei den Unterstellen
handelt es sich um die Zielstelle der ersten Testzinkfingerdomäne und die
Zielstelle der zweiten Testzinkfingerdomäne.
-
Einem
weiteren Merkmal zufolge bietet die Erfindung ein Verfahren zur
Identifizierung einer von Testzinkfingerdomänen erkannten DNA-Sequenz.
Das Verfahren beinhaltet: Durchführung
des Stellenauswahlverfahrens zur Identifizierung einer ersten Bindungspräferenz für eine erste
Testzinkfingerdomäne
und die erneute Durchführung
des Stellenauswahlverfahrens zur Identifizierung einer zweiten Bindungspräferenz für eine zweite
Testzinkfingerdomäne.
Es kann eine Nukleinsäure
konstruiert werden, die den Code sowohl für die erste als auch für die zweite
identifizierte Testzinkfingerdomäne
enthält.
Die Nukleinsäure
kann den Code für
ein Hybridprotein enthalten, das die beiden Domänen beinhaltet und eine Stelle,
die die Zielstelle für
die erste Testzinkfingerdomäne
und die Zielstelle für
die zweite Testzinkfingerdomäne
beinhaltet, spezifisch erkennt.
-
Darüber hinaus
bietet die Erfindung ein Verfahren zur Identifizierung einer Peptiddomäne, die
eine Zielstelle auf einer DNA erkennt. Das Verfahren beinhaltet
die Bereitstellung (1) von Zellen, die ein Reporterkonstrukt enthalten,
und (2) einer Vielzahl von Hybridnukleinsäuren. In dem Reporterkonstrukt
ist ein Reportergen auf operative Weise mit einem Promoter verbunden,
der sowohl eine Rekrutierungsstelle als auch eine Zielstelle besitzt.
Das Reportergen wird unter ein gegebenes Niveau exprimiert, wenn
ein Transkriptionsfaktor sowohl die Rekrutierungsstelle als auch
die Zielstelle des Promoters erkennt (d. h. daran mit einem höheren Niveau
als Background bindet), aber nicht, wenn der Transkriptionsfaktor
nur die Rekrutierungsstelle des Promoters erkennt. Jede Hybridnukleinsäure aus
der Vielzahl enthält
den Code für
ein nicht-natürlich
vorkommendes Protein mit den folgenden Elementen: (i) eine Transkriptionsrepressionsdomäne, (ii)
eine DNA-Bindungsdomäne, die
die Rekrutierungsstelle erkennt, und (iii) eine Testzinkfingerdomäne. Die
Aminosäuresequenz
der Testzinkfingerdomäne
unterscheidet sich bei den Mitgliedern der Vielzahl von Hybridnukleinsäuren. Das
Verfahren beinhaltet weiterhin: in Kontakt bringen der Vielzahl
von Nukleinsäuren
mit den Zellen unter Bedingungen, die es mindestens einer aus der
Vielzahl von Nukleinsäuren
erlaubt, in mindestens eine der Zellen einzudringen, Kultivierung
der Zellen unter Bedingungen, die die Expression der Hybridnukleinsäuren in
den Zellen erlauben, Identifizierung einer Zelle, die das Reportergen
unter das gegebene Niveau exprimiert, was darauf hinweist, dass
die Zelle eine Hybridnukleinsäure
mit dem Code für
eine die Zielstelle erkennende Testzinkfingerdomäne enthält. Zusätzliche Ausführungsformen
dieses Verfahrens entsprechen den ähnlichen Verfahren, die eine
Transkriptionsaktivierungsdomäne
nutzen. Desgleichen kann jedes andere im vorliegenden Schriftstück beschriebene
Auswahlverfahren unter Verwendung einer Transkriptionsrepressionsdomäne anstelle
einer Transkriptionsaktivierungsdomäne durchgeführt werden.
-
Einem
weiteren Merkmal zufolge bieten die Verfahren der Erfindung bestimmte
aufgereinigte Polypeptide und isolierte Nukleinsäuren. Zu aufgereinigten Polypeptiden
der Erfindung gehören
Polypeptide mit der Aminosäuresequenz:
Xa-X-Cys-X2-5-Cys-X3-Xa-X-Cys-X-Ser-Asn-Xb-X-Arg-His-X3-5-His
(SEQ. ID. NR. 68),
Xa-X-Cys-X2-5-Cys-X3-Xa-X-His-X-Ser-Asn-Xb-X-Lys-His-X3-5-His (SEQ. ID. NR. 69),
Xa-X-Cys-X2-5-Cys-X3-Xa-X-Ser-X-Ser-Asn-Xb-X-Arg-His-X3-5-His
(SEQ. ID. NR. 70),
Xa-X-Cys-X2-5-Cys-X3-Xa-X-Gln-X-Ser-Thr-Xb-X-Val-His-X3-5-His (SEQ. ID. NR. 71),
Xa-X-Cys-X2-5-Cys-X3-Xa-X-Val-X-Ser-Xc-Xb-X-Arg-His-X3-5-His (SEQ. ID. NR. 72),
Xa-X-Cys-X2-5-Cys-X3-Xa-X-Gln-X-Ser-His-Xb-X-Arg-His-X3-5-His
(SEQ. ID. NR. 73),
Xa-X-Cys-X2-5-Cys-X3-Xa-X-Gln-X-Ser-Asn-Xb-X-Val-His-X3-5-His (SEQ. ID. NR. 74),
Xa-X-Cys-X2-5-Cys-X3-Xa-X-Gln-X-Ser-Xc-Xb-X-Arg-His-X3-5-His (SEQ. ID. NR. 75),
Xa-X-Cys-X2-5-Cys-X3-Xa-X-Gln-X-Ala-His-Xb-X-Arg-His-X3-5-His
(SEQ. ID. NR. 150),
Xa-X-Cys-X2-5-Cys-X3-Xa-X-Gln-X-Phe-Asn-Xb-X-Arg-His-X3-5-His (SEQ. ID. NR. 151),
Xa-X-Cys-X2-5-Cys-X3-Xa-X-Gln-X-Ser-His-Xb-X-Thr-His-X3-5-His
(SEQ. ID. NR. 152),
Xa-X-Cys-X2-5-Cys-X3-Xa-X-Gln-X-Ser-His-Xb-X-Val-His-X3-5-His (SEQ. ID. NR. 153),
Xa-X-Cys-X2-5-Cys-X3-Xa-X-Gln-X-Ser-Asn-Xb-X-Ile-His-X3-5-His
(SEQ. ID. NR. 154),
Xa-X-Cys-X2-5-Cys-X3-Xa-X-Gln-X-Ser-Asn-Xb-X-Arg-His-X3-5-His (SEQ. ID. NR. 155),
Xa-X-Cys-X2-5-Cys-X3-Xa-X-Gln-X-Thr-His-Xb-X-Gln-His-X3-5-His
(SEQ. ID. NR. 156),
Cys-X2-5-Cys-X3-Xa-X-Gln-X-Thr-His-Xb-X-Arg-His-X3-5-His
(SEQ. ID. NR. 157),
Xa-X-Cys-X2-5-Cys-X3-Xa-X-Arg-X-Asp-Lys-Xb-X-Ile-His-X3-5-His (SEQ. ID. NR. 158),
Xa-X-Cys-X2-5-Cys-X3-Xa-X-Arg-X-Ser-Asn-Xb-X-Arg-His-X3-5-His
(SEQ. ID. NR. 159),
Xa-X-Cys-X2-5-Cys-X3-Xa-X-Gln-X-Gly-Asn-Xb-X-Arg-His-X3-5-His (SEQ. ID. NR. 161),
Xa-X-Cys-X2-5-Cys-X3-Xa-X-Arg-X-Asp-Glu-Xb-X-Arg-His-X3-5-His
(SEQ. ID. NR. 162),
Xa-X-Cys-X2-5-Cys-X3-Xa-X-Arg-X-Asp-His-Xb-X-Arg-His-X3-5-His (SEQ. ID. NR. 163),
Xa-X-Cys-X2-5-Cys-X3-Xa-X-Arg-X-Asp-His-Xb-X-Thr-His-X3-5-His
(SEQ. ID. NR. 164),
Xa-X-Cys-X2-5-Cys-X3-Xa-X-Arg-X-Asp-Lys-Xb-X-Arg-His-X3-5-His (SEQ. ID. NR. 165),
Xa-X-Cys-X2-5-Cys-X3-Xa-X-Arg-X-Ser-His-Xb-X-Arg-His-X3-5-His
(SEQ. ID. NR. 166) oder
Xa-X-Cys-X2-5-Cys-X3-Xa-X-Arg-X-Thr-Asn-Xb-X-Arg-His-X3-5-His (SEQ. ID. NR. 167),
wobei es
sich bei Xa um Phenylalanin oder Tyrosin,
bei Xb um einen hydrophoben Rest und bei
Xc um Serin oder Threonin handelt. Die Nukleinsäuren der
Erfindung beinhalten Nukleinsäuren
mit dem Code für
die vorstehend angegebenen Polypeptide.
-
Außerdem können aufgereinigte
Polypeptide der erfindungsgemäßen Verfahren
Aminosäuresequenzen
besitzen, die zu 50%, 60%, 70%, 80%, 90%, 93%, 95%, 96%, 98%, 99%
oder 100% identisch zu SEQ. ID. NRn.: 23, 25, 27, 29, 31, 33, 35,
37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67,
103, 105, 107, 111, 113, 115, 117, 119, 121, 123, 125, 127, 129,
131, 133, 135, 137, 141, 143, 145, 147, 149 oder 151 sind. Die Polypeptide
können
identisch sein zu SEQ. ID. NRn.: 23, 25, 27, 29, 31, 33, 35, 37,
39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 103,
105, 107, 111, 113, 115, 117, 119, 121, 123, 125, 127, 129, 131,
133, 135, 137, 141, 143, 145, 147, 149 oder 151 an den Aminosäurepositionen,
die den Nukleinsäure-kontaktierenden
Resten des Polypeptids entsprechen. Als Alternative unterscheiden
sich die Polypeptide von den SEQ. ID. NRn.: 23, 25, 27, 29, 31,
33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63,
65, 67, 103, 105, 107, 111, 113, 115, 117, 119, 121, 123, 125, 127,
129, 131, 133, 135, 137, 141, 143, 145, 147, 149 oder 151 bei mindestens
einem der Reste, die den Nukleinsäure-kontaktierenden Resten
des Polypeptids entsprechen. Die aufgereinigten Polypeptide können außerdem ein(e)
oder mehrere der folgenden beinhalten: eine heterologe DNA-Bindungsdomäne, ein
Zellkernlokalisierungssignal, eine Kleinmolekül-Bindungsdomäne (z. B. eine Steroidbindungsdomäne), einen
Epitop Tag- oder Aufreinigungs-Hilfe ("handle"), eine katalytische Domäne (z. B. eine
Nukleinsäure-modifizierende
Domäne,
eine Nukleinsäure-spaltende
Domäne
oder eine DNA-Reparatur-katalytische Domäne) und/oder eine Transkriptionsfunktionsdomäne (z. B.
eine Aktivierungsdomäne,
eine Repressionsdomäne
und so weiter). Die Verfahren der Erfindung beinhalten darüber hinaus
isolierte Nukleinsäuresequenzen
mit dem Code für
die vorstehend angegebenen Polypeptide und isolierte Nukleinsäuresequenzen,
die unter Bedingungen hoher Stringenz an eine Einzelstrangsonde
im Sinne der Hybridisation binden, wobei die Sequenz der Sonde aus
den SEQ. ID. NRn: 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44,
46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 102, 104, 106, 110,
112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 136,
140, 142, 144, 146, 148 oder 150 oder den Komplementen derselben
besteht. Darüber
hinaus beinhaltet die Erfindung ein Verfahren zur Expression eines
Polypeptids der Erfindung, das an eine heterologe Nukleinsäure-Bindungsdomäne fusioniert
ist, in einer Zelle. Das Verfahren beinhaltet die Einführung einer
Nukleinsäure
mit dem Code für
das vorstehend angegebene Fusionsprotein in eine Zelle. Eine Nukleinsäure der Erfindung
kann auf operative Weise durch eine heterologe Nukleinsäuresequenz,
z. B. einen induzierbaren Promoter (z. B. ein Steroidhormon-regulierter
Promoter, ein Kleinmolekül-regulierter
Promoter oder ein gentechnisch hergestelltes induzierbares System,
wie die Tetrazyklin Tet-On und Tet-Off-Systeme), reguliert werden.
-
Der
Begriff "Base-kontaktierende
Positionen" bezieht
sich auf die vier Aminosäurepositionen
von Zinkfingerdomänen,
die strukturell den Aminosäuren
ArGlnin 73, AsparaGlnsäure
75, Glutaminsäure
76 und ArGlnin 79 der SEQ. ID. NR.: 21 entsprechen. Auf diese Positionen
wird auch als Positionen -1, 2, 3 und 6 Bezug genommen. Zur Identifizierung
von Positionen in einer Suchanfragesequenz, die den Base-kontaktierenden Positionen
entsprechen, wird ein Alignment der Suchanfragesequenz an die Zinkfingerdomäne von Interesse derart
vorgenommen, dass die Cystein- und Histidinreste der Suchanfragesequenz
im Alignment an denen von Finger 3 von Zif268 angelegt sind. Der
ClustalW WWW-Dienst des European Bioinformatics Institute (http://www2.ebi.ac.uk/clustalw;
Thompson et al. (1994) Nucleic Acids Res. 22:4673-4680) bietet ein
praktisch bequemes Verfahren zum Sequenzalignment.
-
Der
Begriff "heterolog" bezieht sich auf
ein Polypeptid, das durch künstliche
Mittel in einen Kontext eingefügt
wird und nicht auf natürliche
Weise in dem selben Kontext vorkommt. Zum Unterschied von einer
endogenen Einheit kann ein heterologes Polypeptid eine flankierende
Polypeptidsequenz an mindestens einer Seite neben sich haben, die
in keinem natürlichen
vorkommenden Polypeptid an ihrer Seite wäre. Der Begriff "Hybrid" bezieht sich auf
ein Polypeptid, das Aminosäuresequenzen
umfasst, die sich ableiten entweder von (i) mindestens zwei verschiedenen
natürlich
vorkommenden Sequenzen, (ii) mindestens einer künstlichen Sequenz (d. h. einer
Sequenz, die nicht natürlich
vorkommt) und einer natürlich
vorkommenden Sequenz oder (iii) mindestens zwei unterschiedlichen
künstlichen
Sequenzen. Beispiele für
künstliche
Sequenzen beinhalten u. a. Mutanten einer natürlich vorkommenden Sequenz
und Sequenzen mit einer de novo-Gestaltung.
-
Bei
Verwendung im vorliegenden Schriftstück bezieht sich der Begriff "hybridisiert unter
stringenten Bedingungen" auf
Bedingungen für
die Hybridisation in 6 × Natriumchlorid/Natriumcitrat
(SSC) bei 45°C,
gefolgt von zwei Waschdurchgängen
in 0,2 × SSC,
0,1% SDS bei 65°C.
-
Der
Begriff "Bindungspräferenz" bezieht sich auf
die diskriminierende Eigenschaft eines Polypeptids bezüglich der
Auswahl einer Nukleinsäurebindungsstelle
relativ zu einer anderen. Wenn das Polypeptid beispielsweise in
seiner Menge limitierend ist relativ zu den Nukleinsäurebindungsstellen,
wird in einem im vorliegenden Schriftstück beschriebenen In-vivo- oder
In-vitro-Assay eine größere Menge
des Polypeptids an die bevorzugte Stelle relativ zu der anderen
Stelle binden.
-
Bei
Verwendung im vorliegenden Schriftstück bezieht sich der Begriff "erkennt" auf die Fähigkeit
eines Polypeptids zwischen einer Nukleinsäurebindungsstelle und einer
zweiten Nukleinsäurebindungsstelle,
die dazu im Wettbewerb steht, so zu unterscheiden, dass das Polypeptid,
z. B. im Kontext mit einem im vorliegenden Schriftstück beschriebenen
Assay, auch in Anwesenheit eines Überschusses der zweiten Stelle
an die erste Stelle gebunden bleibt. Möglicherweise besitzt das Polypeptid
keine ausreichende Affinität
für die
erste Stelle, um alleine daran binden zu können, könnte aber im Assay bestimmt
werden, wenn es wie bei einem Hybridpolypeptid der Erfindung an
eine andere Nukleinsäurebindungsdomäne fusioniert
wäre, die
an eine in der Nähe
gelegene Rekrutierungsstelle bindet.
-
Bei
Verwendung im vorliegenden Schriftstück bezieht sich der Begriff "degenerierte Oligonukleotide" sowohl auf (a) eine
Population von unterschiedlichen Oligonukleotiden und (b) eine einzelne
Art von Oligonukleotid, die an mehr als eine Sequenz durch Annealing
binden kann, z. B. ein Oligonukleotid mit einem nicht-natürlichen
Nukleotid, wie Inosin.
-
Die
vorliegende Erfindung bietet zahlreiche Nutzeffekte. Die Fähigkeit
zur Auswahl einer DNA-Bindungsdomäne, die eine bestimmte Sequenz
erkennt, erlaubt die Gestaltung neuartiger Polypeptide, die an spezifische
Stellen auf einer DNA binden. Somit ermöglicht die Erfindung die maßgeschneiderte
Erzeugung von neuartigen Polypeptiden, die die Expression eines
ausgewählten
Ziels regulieren können,
z. B. kann ein von einem Krankheitserreger benötigtes Gen reprimiert werden,
kann ein für
das Krebswachstum benötigtes Gen
reprimiert werden, kann ein schwach exprimiertes Gen oder ein Gen
mit dem Code für
ein mutiertes Protein aktiviert und überexprimiert werden, und so
weiter.
-
Die
Verwendung von Zinkfingerdomänen
ist besonders vorteilhaft. Zum einen erkennt das Zinkfingermotiv
stark unterschiedliche DNA-Sequenzen. Zweitens besitzen natürlich vorkommende
Zinkfingerproteine eine modulare Struktur. Beispielsweise das Zinkfingerprotein
Zif268, das auch als "Egr-1" bezeichnet wird, setzt
sich aus einem Tandem-Array aus drei Zinkfingerdomänen zusammen.
In 1 ist die röntgenkristallografische
Struktur des Zinkfingerproteins Zif268 zu sehen, die aus drei Fingern
in einem Komplex mit DNA besteht (Pavletich and Pabo, (1991) Science
252:809-817). Unabhängig
voneinander ist jeder Finger mit 3-4 Basenpaaren der DNA-Erkennungsstelle
in Kontakt. Folglich kann die von jedem einzelnen Finger kontaktierte Unterstelle
als ein unabhängiges
molekulares Erkennungsereignis angesehen werden. Die Bindung mit
hoher Affinität
wird durch den kooperativen Effekt des Vorhandenseins von multiplen
Zinkfingermodulen in der selben Polypeptidkette erreicht.
-
Die
Verwendung eines In-vivo-Auswahlschritts ermöglicht die unmittelbare Identifizierung
derjenigen Polypeptide, die im intrazellulären Milieu an eine spezifische
Stelle auf einer DNA binden. Die mit der Erkennung in einer Zelle,
insbesondere einer eukaryotischen Zelle, verbundenen Faktoren können sich
stark von den Faktoren unterscheiden, die bei einer In-vitro-Auswahlsituation
vorhanden sind. Beispielsweise steht ein Polypeptid in einem eukaryotischen
Zellkern notwendigerweise mit der Unzahl anderer Kernproteine im
Wettbewerb um eine spezifische Nukleinsäurebindungsstelle. Ein Nukleosom
oder sonstiges Chromatinprotein kann die Bindungsstelle besetzen,
verlegen oder im Wettbewerb um diese stehen. Selbst im ungebundenen Zustand
unterliegt die Konformation einer Nukleinsäure in der Zelle Biege-, Supercoiling-,
Torsions- und Auseinanderwicklungseinflüssen. Das
Polypeptid ist andererseits Proteasen und Chaperonen ausgesetzt,
um nur einige Faktoren zu nennen. Darüber hinaus sieht sich das Polypeptid
einem ganzen Genom voller möglicher Bindungsstellen
gegenüber
und muss daher mit einer hohen Spezifität für die gewünschte Stelle ausgestattet sein,
um den Auswahlprozess zu überstehen.
Im Gegensatz zur Auswahl unter In-vivo-Bedingungen kann eine In-vitro-Auswahl
im Hinblick auf den Binder mit der höchsten Affinität anstatt
dem Binder mit der höchsten
Spezifität
stattfinden.
-
Die
Verwendung eines Reportergens als Hinweis auf die Bindungsfähigkeit
einer exprimierten Polypeptidchimäre ist nicht nur effizient
und einfach, sondern verdeutlicht darüber hinaus die Notwendigkeit
zur Entwicklung eines komplexen Wechselwirkungscodes, der die Energieeigenschaften
der Protein-Nukleinsäure-Schnittstelle
und die immense Anzahl von peripheren Faktoren, wie umgebende Reste
und Nukleotide, berücksichtigt,
die die Bindungsschnittstelle ebenfalls beeinflussen. (Segal et
al. (1999) Proc. Natl. Acad. Sci. USA 96:2758-2763).
-
Die
vorliegende Erfindung macht Gebrauch von allen Zinkfingerdomänen, die
im menschlichen Genom oder jedem beliebigen anderen Genom vorhanden
sind. Diese breitgefasste Abdeckung des von der strukturellen Faltung
der Zinkfingerdomäne
belegten Sequenzraums könnte
weitere Vorteile mit sich bringen, die sich aus Ewigkeiten der natürlichen
Selektion ergeben. Darüber
hinaus sorgt die Nutzung von Domänen aus
der Wirtsspezies dafür,
dass es weniger wahrscheinlich ist, dass ein durch die im vorliegenden
Schriftstück beschriebenen
Verfahren gentechnisch für
eine Gentherapieanwendung hergestelltes DNA-Bindungsprotein von
der Immunantwort des Wirtes als fremd angesehen wird.
-
Die
Einzelheiten von einer oder mehreren Ausführungsformen der Erfindung
werden in den Begleitzeichnungen und der folgenden Beschreibung
erläutert.
Weitere Merkmale, Aufgaben und Vorteile der Erfindung sind aus den
Beschreibungen und Zeichnungen sowie aus den Ansprüchen ersichtlich.
-
BESCHREIBUNG DER ZEICHNUNGEN
-
1 ist
eine Darstellung der dreidimensionalen Struktur des Zinkfingerproteins
Zif268, das aus drei Zinkfingerdomänen besteht und an die DNA-Sequenz,
5'-GCG TGG GCG T-3' bindet. Die schwarzen
Kreise geben die Lage der Zinkionen an.
-
2 ist
eine Erläuterung
der Wasserstoffbindungs-Wechselwirkungen zwischen Aminosäureresten von
Zif268 und DNA-Basen. Aminosäurereste
in den Positionen -1, 2, 3 und 6 entlang der α-Helix stehen in Wechselwirkung
mit den Basen an spezifischen Positionen. Die fettgedruckten Linien
stellen die ideale Wasserstoffbindung dar, während die gestrichelten Linien
die potenziellen Wasserstoffbindungen darstellen.
-
3 ist
eine Erkennungscode-Tabelle, in der die Wechselwirkungen zwischen
DNA-Basen und Aminosäureresten
an den Positionen -1, 2, 3 und 6 entlang der α-Helix einer Zinkfingerdomäne zusammengefasst sind.
-
4 ist
eine Darstellung der Positionen von Aminosäureresten und der zugehörigen 3
Basentriplets. Die fettgedruckten Linien stellen die wichtigsten
beobachteten Wechselwirkungen dar, während die gestrichelte Linie
eine Hilfswechselwirkung darstellt.
-
5 ist
eine grafische Darstellung zur Erläuterung der Grundlagen des
im vorliegenden Schriftstück offengelegten
In-vivo-Auswahlsystems. Von den verschiedenen Zinkfingermutanten
erkennt Zinkfingerdomäne
A die Zielsequenz (durch XXX X angegeben) und aktiviert die Transkription
des Reportergens HIS3. Als Ergebnis wachsen Hefekolonien auf einem
Medium, dem Histidin fehlt. Im Gegensatz dazu erkennt Zinkfingerdomäne B die
Zielsequenz nicht und das Reportergen bleibt daher reprimiert. Als
Ergebnis wachsen keine Kolonien auf einem Medium, dem Histidin fehlt.
AD stellt die Transkriptionsaktivierungsdomäne dar.
-
6 ist
eine Liste von 10-bp-Sequenzen, die in Long Terminal Repeats (LTRs)
von HIV-1 und in der Promoterregion von CCR5, einem Humangen mit
dem Code für
einen Korezeptor für
HIV-1 (SEQ. ID. NRn.: 1-5) zu finden sind. Die unterstrichenen Teile
stellen 4-bp-Zielsequenzen dar, die bei der vorliegenden Auswahl verwendet
wurden.
-
7 ist
eine Darstellung der Basensequenzen der mit dem Reportergen verknüpften Bindungsstellen (SEQ.
ID. NRn.: 6-17). Jede Bindungsstelle besteht aus einem Tandem-Array
von 4 zusammengesetzten Bindungssequenzen. Jede zusammengesetzte
Bindungssequenz wurde durch Verbindung der gestutzten Bindungssequenz
5'-GG GCG-3', die von Finger
1 und Finger 2 von Zif268 erkannt wird, mit 4-bp-Zielsequenzen konstruiert.
-
8 ist
eine grafische Darstellung von pPCFMS-Zif, einem Plasmid, das zur
Konstruktion einer Bibliothek von Hybridplasmiden (SEQ. ID. NRn.:
18 und 19) verwendet werden kann.
-
9 ist
eine Darstellung der Basensequenz für das Gen mit dem Code für Zinkfingerprotein
Zif268 nach Einführung
in pPCFMS-Zif und der entsprechenden übersetzten Aminosäuresequenzen
(SEQ. ID. NRn.: 20 und 21). Die von Restriktionsenzymen erkannten
Stellen sind unterstrichen dargestellt.
-
10 ist eine fotografische Aufnahme einer Kulturplatte
mit Hefezellen, die durch Re-Transformation und Kreuztransformation
unter Verwendung von Zinkfingerproteinen erhalten wurden, die mit
dem In-vivo-Auswahlsystem ausgewählt
wurden.
-
11 ist eine Liste einiger DNA-Sequenzen von Zinkfingerdomänen, die
mit dem In-vivo-System aus einer aus dem Humangenom abgeleiteten
Zinkfingerbibliothek ausgewählt
wurden, und von Aminosäuresequenzen,
deren Code die DNA-Sequenzen enthalten (SEQ. ID. NRn.: 22-33). Unterstrichen
dargestellt sind die DNA-Sequenzen, die den degenerierten PCR-Primern
entsprechen, die zur Amplifikation von DNA-Segmenten mit dem Code
für Zinkfingerdomänen im Humangenom
verwendet wurden. Die vier potenziellen Base-kontaktierenden Positionen
sind angegeben und die Aminosäurereste
sind in Fettdruck dargestellt. Die beiden Cys-Reste und die beiden
His-Reste, die der Erwartung zufolge eine koordinative Bindung mit
dem Zinkion eingehen, sind in Kursivschrift dargestellt.
-
EINGEHENDE BESCHREIBUNG
-
Die
Erfindung bietet ein neuartiges Screeningverfahren zur Ermittlung
der Nukleinsäurebindungspräferenzen
von Testzinkfingerdomänen.
Das Verfahren lässt
sich auf einfache Weise für
eine Reihe von DNA-Bindungsdomänen,
eine Reihe von Quellen für
Domänen
dieser Art und eine Anzahl von Bibliothekstrukturen, Reportergenen
und Auswahl- und Screeningsystemen anpassen. Das Screeningverfahren
lässt sich
als Hochdurchsatzplattform umsetzen. Durch das Screeningverfahren
erhaltene Informationen können
auf leichte Weise auf ein Verfahren zur Gestaltung von künstlichen
Nukleinsäurebindungsproteinen
anwenden. Das Gestaltungsverfahren nutzt die Bindungspräferenzen
von Testzinkfingerdomänen,
um den modularen Zusammenbau eines chimären Nukleinsäurebindungsproteins
zu leiten. Ein gestaltetes Protein kann mit dem Screeningverfahren
weiter optimiert werden oder variiert werden.
-
DNA-Bindungsdomänen
-
Die
Erfindung nutzt Sammlungen von Nukleinsäurebindungsdomänen mit
unterschiedlichen Bindungsspezifitäten. Es ist eine Reihe von
Proteinstrukturen bekannt, die mit hoher Affinität und hoher Spezifität an Nukleinsäuren binden.
Diese Strukturen werden in einer Unzahl von unterschiedlichen Proteinen
zur spezifischen Steuerung der Nukleinsäurefunktion wiederverwendet
(für Übersichtsartikel
zu strukturellen Motiven, die doppelsträngige DNA erkennen, siehe,
z. B. Pabo and Sauer (1992) Annu. Rev. Biochem. 61:1053-95; Patikoglou
and Burley (1997) Annu. Rev. Biophys. Biomol. Struct. 26:289-325;
Nelson (1995) Curr Opin Genet Dev. 5:180-9). Einige nicht-einschränkende Beispiele
für Nukleinsäurebindungsdomänen sind
u. a.:
-
Zinkfinger.
-
Zinkfinger
sind kleine Peptiddomänen
aus ungefähr
30 Aminosäureresten,
in denen vier Aminosäuren, entweder
Cystein oder Histidin, räumlich
geeignet angeordnet sind, um koordinativ an ein Zinkion zu binden (1;
für Übersichtsartikel,
siehe z. B. Klug and Rhodes, (1987) Trends Biochem. Sci. 12:464-469
(1987); Evans and Hollenberg, (1988) Cell 52:1-3; Payre and Vincent,
(1988) FEBS Lett. 234:245-50; Miller et al., (1985) EMBO J. 4:1609-1614;
Berg, (1988) Proc. Natl. Acad. Sci. USA 85:99-102; Rosenfeld and
Margalit, (1993) J. Biomol. Struct. Dyn. 11:557-570). Zinkfingerdomänen können somit
anhand der Identität
der Reste, die eine koordinative Bindung mit dem Zinkion eingehen,
klassifiziert werden, z. B. als die Cys2-His2-Klasse, die Cys2-Cys2-Klasse, die Cys2-CysHis-Klasse
und so weiter. Die Reste von Cys2-His2-Zinkfingern
in koordinativer Bindung mit Zink sind im typischen Fall räumlich wie
folgt angeordnet: Xa-X-C-X2-5-C-X3-Xa-X5-ψ-X2-H-X3-5-H, wobei ψ (psi) einen
hydrophoben Rest darstellt (Wolfe et al., (1999) Annu. Rev. Biophys.
Biomol. Struct. 3:183-212) (SEQ. ID. NR.: 76), wobei "X" eine beliebige Aminosäure darstellt, wobei
Xa ein Phenylalanin oder Tyrosin darstellt
und ein tiefgesetzter Index die Anzahl der Aminosäuren angibt und
zwei tiefgesetzte Indices einen typischen Bereich von Zwischenaminosäuren angeben.
Im typischen Fall falten sich die Zwischenaminosäuren zu einer antiparallelen β-Blattstruktur, die
gegen eine α-Helix
gepackt ist, wobei die antiparallele β-Blattstrukturen aber auch kurz, nicht-ideal
oder nicht vorhanden sein können.
Durch die Faltung werden die Seitenketten in koordinativer Bindung
zu Zink so positioniert, dass sie eine für die koordinative Bindung
des Zinkions geeignete Tetraederkonformation annehmen. Die Base-kontaktierenden
Reste befinden sich am N-Terminus des Fingers und in der vorhergehenden
Loopregion (2). Ein Zinkfinger-DNA-Bindungsprotein
besteht im Normalfall aus einem Tandem-Array aus drei oder mehr
Zinkfingerdomänen.
-
Die
Zinkfingerdomäne
(oder "ZFD") ist eines der häufigsten
DNA-Bindungsmotive
bei Eukaryoten, das in Tierarten von Hefe über höhere Pflanzen und bis zum Menschen
zu finden ist. Einer Schätzung
zufolge enthält
allein das menschliche Genom mindestens mehrere Tausend Zinkfingerdomänen. Zinkfingerdomänen können aus
Zinkfingerproteinen isoliert werden. Nicht-einschränkende Beispiele
von Zinkfingerproteinen sind u. a. CF2-II, Kruppel, WT1, Basonuclin, BCL-6/LAZ-3,
erythroider Kruppel-ähnlicher
Transkriptionsfaktor, Transkriptionsfaktoren Sp1, Sp2, Sp3 und Sp4,
Transkriptionsrepressor YY1, EGR1/Krox24, EGR2/Krox20, EGR3/Pilot,
EGR4/AT133, Evi-1, GLI1, GLI2, GLI3, HIV-EP1/ZNF40, HIV-EP2, KR1,
ZfX, ZfY und ZNF7.
-
Nachfolgend
beschriebene Rechenverfahren können
zur Identifizierung aller Zinkfingerdomänen verwendet werden, deren
Code in einem sequenzierten Genom oder in einer Nukleinsäuredatenbank
enthalten ist. Jede solche Zinkfingerdomäne kann genutzt werden. Darüber hinaus
wurden künstliche Zinkfingerdomänen gestaltet,
z. B. anhand von Rechenverfahren (z. B. Dahiyat and Mayo, (1997)
Science 278:82-7). Der Zinkfinger von Dahiyat und Mayo nimmt die
Zinkfingerfaltung an, enthält
in seinem Kern aber kein Zinkion. Somit handelt es sich wegen der
strukturellen Ähnlichkeit
seiner Polypeptid-Rückenkette
zur Faltung von natürlich vorkommenden
Zinkfingern um ein Zinkfingerprotein und nicht aufgrund der funktionellen
Fähigkeit
zur koordinativen Bindung eines Zinkions.
-
Homöodomänen.
-
Homöodomänen sind
einfache eukaryotische Domänen,
die aus einem N-terminalen Arm, der mit der kleinen Furche (Minor
Groove) der DNA in Kontakt ist, gefolgt von drei α-Helices,
die mit der großen
Furche (Major Groove) in Kontakt stehen, bestehen (für einen Übersichtsartikel,
siehe z. B. Laughon, (1991) Biochemistry 30:11357-67). Die dritte α-Helix liegt
in der großen
Furche und enthält
kritische DNA-kontaktierende Seitenketten. Homöodomänen besitzen ein charakteristisches,
hochgradig konserviertes Motiv, das sich am Turn, der in die dritte α-Helix führt, befindet.
Das Motiv beinhaltet ein nicht variables Tryptophan, das in den
hydrophoben Kern der Domäne
gepackt ist. Dieses Motiv ist in der Datenbank Prosite (siehe http://www.expasy.ch/) als
PDOC00027 ([L/I/V/M/F/Y/G]-[A/S/L/V/R]-X(2)-[L/I/V/M/S/T/A/C/N]-X-[L/I/V/M]-X(4)-[L/I/V]-[R/K/N/Q/E/S/T/A/I/Y]-[L/I/V/F/S/T/N/K/H]-W-[F/Y/V/C]-X-[N/D/Q/T/A/H]-X(5)-[R/K/N/A/I/M/W];
SEQ ID NR.77
dargestellt. Homöodomänen sind häufig vorhanden in Transkriptionsfaktoren,
die die Identität
der Zelle bestimmen, und bieten Lageinformationen bei der Entwicklung
des Organismus. Im Genom sind klassische Homöodomänen dieser Art in Clustern
zu finden, so dass die Reihenfolge der Nomöodomänen im Cluster ungefähr ihrem
Expressionsmuster entlang der Körperachse
entspricht. Homöodomänen können durch
ein Alignment mit einer Homöodomän, z. B.
Hox-1, oder durch Alignment mit einem Homöodomänenprofil oder einem Homöodomänen-HMM
(Hidden Markov Model, siehe nachfolgend), z. B. PF00046 der Datenbank
Pfam oder "HOX" der Datenbank SMART
(http://smart.embl-heidelberg.de/) oder, wie bereits erwähnt, über das
Prosite-Motiv PDOC00027 identifiziert werden.
-
Helix-Turn-Helix-Proteine.
-
Dies
ist ein häufiges
DNA-Bindungsmotiv bei zahlreichen prokaryotischen Transkriptionsfaktoren.
Es gibt zahlreiche Unterfamilien, z. B. die LacI-Familie, die AraC-Familie,
um nur einige zu nennen. Die beiden in der Bezeichnung genannten
Helices beziehen sich auf eine erste α-Helix, die gegen eine zweite α-Helix gepackt
ist und diese in der großen
Furche der DNA liegen lässt.
Domänen
dieser Art können
durch Alignment mit einem HMM, z. B. HTH_ARAC, HTH_ARSR, HTH_ASNC,
HTH_CRP, HTH_DEOR, HTH_DTXR, HTH_GNTR, HTH_ICLR, HTH_LACI, HTH_LUXR,
HTH_MARR, HTH_MERR und HTH_XRE Profilen, die in der Datenbank SMART
(http://smart.embl-heidelberg.de/) zur Verfügung stehen, identifiziert
werden.
-
Helix-Loop-Helix-Proteine.
-
Diese
DNA-Bindungsdomäne
ist bei homo- und heterodimeren Transkriptionsfaktoren, z. B. MyoD, fos,
jun, E11 und Myogenin, häufig
zu finden. Die Domäne
besteht aus einem Dimer dessen Monomere jeweils zwei α-Helices
und einen Zwischen-Loop beitragen. Die Domäne kann durch Alignment mit
einem HMM, z. B. dem in der Datenbank SMART (http://smart.embl-heidelberg.de/)
zur Verfügung
stehenden "HLH"-Profil, identifiziert
werden. Obwohl Helix-Loop-Helix-Proteine im typischen Fall dimer
sind, können
auch monomere Versionen konstruiert werden, indem mit gentechnischen
Methoden ein Polypeptid-Linker zwischen den beiden Untereinheiten
eingefügt
wird, so dass ein einzelnes offenes Leseraster den Code für die beiden
Untereinheiten und den Linker enthält.
-
Identifikation von DNA-Bindungsdomänen
-
Zur
Identifikation von Strukturdomänen
kann eine Reihe von Verfahren verwendet werden.
-
Rechenverfahren.
-
Die
Aminosäuresequenz
einer DNA-Bindungsdomäne,
die mit einem im vorliegenden Schriftstück beschriebenen Verfahren
isoliert wurde, kann mit einer Datenbank aus bekannten Sequenzen
verglichen werden, z. B. einer mit Anmerkungen versehenen Datenbank
aus Proteinsequenzen oder einer mit Anmerkungen versehenen Datenbank,
die Einträge
für Nukleinsäurebindungsdomänen beinhaltet.
Bei einer anderen Umsetzung können
Datenbanken aus nicht-charakterisierten Sequenzen, z. B. nicht mit
Anmerkungen versehene genomische, EST- oder cDNA-Sequenzen voller Länge; aus
charakterisierten Sequenzen, z. B. SwissProt oder PDB; und aus Domänen, z.
B. Pfam, ProDom (http://tooulouse.inra.fr/) und SMART (Simple Modular
Architecture Research Tool, http://smart.embl-heidelberg.de/) eine
Quelle von Sequenzen von Nukleinsäurebindungsdomänen bieten.
Nukleinsäuresequenz-Datenbanken
können
für die
Zwecke des Vergleichs mit einer Suchanfragen-Aminosäuresequenz
in alle sechs Leseraster übersetzt
werden. Nukleinsäuresequenzen,
die die Flag enthalten, dass sie den Code für Kandidaten-Nukleinsäurebindungsdomänen enthalten,
können
aus einer geeigneten Nukleinsäurequelle,
z. B. genomischer DNA oder zellulärer RNA, amplifiziert werden.
Aminosäuresequenzen
dieser Art können
in einen Expressionsvektor hinein kloniert werden. Die Verfahren
zur computerbasierten Domänenidentifizierung
können über Schnittstellen
mit einem Oligonukleotid-Synthetisiergerät und Robotsystemen
verbunden werden, um Nukleinsäuren
mit dem Code für
die Domänen
in einer Hochdurchsatzplattform zu produzieren. Geklonte Nukleinsäuren mit
dem Code für
Kandidatendomänen
können auch
in einem Wirts-Expressionsvektor gespeichert werden und auf leichte
Weise in einen Expressionsvektor überführt werden, z. B. in einen
Translations-Fusionsvektor mit Finger 1 und 2 von Zif268, und zwar
entweder durch Restriktionsenzym-vermitteltes Subcloning or durch
stellenspezifisches, Rekombinase-vermitteltes Subcloning (siehe
U.S.-Patent 5,888,732). Die Hochdurchsatzplattform kann zur Erzeugung
von multiplen Mikrotiterplatten verwendet werden, die Nukleinsäuren mit
dem Code für
verschiedene Kandidaten-Nukleinsäurebindungsdomänen enthalten.
-
Detaillierte
Verfahren zur Identifizierung von Domänen aus einer Startsequenz
oder einem -profil sind nach dem Stand der Technik wohlbekannt.
Siehe beispielsweise Prosite (Hofmann et al., (1999) Nucleic Acids Res.
27:215-219), FASTA, BLAST (Altschul et al., (1990) J. Mol. Biol.
215:403-10), usw. Es kann eine einfache Stringsuche durchgeführt werden,
um Aminosäuresequenzen
zu finden, die identisch zu einer Suchanfragen-Sequenz oder einem
Suchanfragen-Profil sind, z. B. durch Verwendung von PerI (http://bio.perI.org/)
zum Durchsuchen von Textdateien. Auf diese Weise identifizierte
Sequenzen können
ungefähr
30%, 40%, 50%, 60%, 70%, 80%, 90% oder mehr identisch zu einer anfänglich eingegebenen
Sequenz sein.
-
Domänen mit Ähnlichkeit
zu einer Suchanfragen-Domäne
können
aus einer öffentlichen
Datenbank identifiziert werden, z. B. durch Verwendung der XBLAST-Programme
(Version 2.0) von Altschul et al. (1990) J. Mol. Biol. 215:403-10.
BLAST-Proteinsuchen können
beispielsweise mit den folgenden XBLAST-Parametern durchgeführt werden:
score = 50, wordlength = 3. Lücken
(Gaps) können
in die Suchanfrage oder die durchsuchten Sequenzen nach der Beschreibung
von Altschul et al., (1997) Nucleic Acids Res. 25(17):3389-3402
eingefügt
werden. Vorgabeparameter für
die Programme XBLAST und Gapped XBLAST sind erhältlich unter http://www.ncbi.nlm.nih.gov.
-
Die
Prosite-Profile PS00028 und PS50157 können zur Identifizierung von
Zinkfingerdomänen
verwendet werden. In einem SWISSPROT-Release mit 80.000 Proteinsequenzen
wurden mit diesen Profilen 3189 bzw. 2316 Zinkfingerdomänen nachgewiesen.
Profile können
mit einer Reihe von unterschiedlichen Techniken aus einem Alignment
multipler Sequenzen von verwandten Proteinen konstruiert werden.
Gribskov und Mitarbeiter (Gribskov et al., (1990) Meth. Enzymol.
183:146-159) nutzten eine Symbolvergleichstabelle zur Umwandlung
eines Alignments multipler Sequenzen, das Häufigkeitsverteilungen der Reste
enthielt, in Gewichtungen für
die einzelnen Positionen. Siehe beispielsweise die Datenbank PROSITE
und die Arbeiten von Luethy et al., (1994) Protein Sci. 3:139-1465.
-
Hidden
Markov Modelle (HMMs), die eine DNA-Bindungsdomäne von Interesse abbilden,
können
aus einer Datenbanken solcher Modelle erzeugt oder erhalten werden,
z. B. der Datenbank Pfam, Release 2.1. Eine Datenbank kann mit dem
HMM durchsucht werden, z. B. unter Verwendung der Vorgabeparameter,
um zusätzliche
Domänen
zu finden (für
Vorgabeparameter siehe z. B. http://www.sanger.ac.uk/Software/Pfam/HMM_Search).
Als Alternative kann der Benutzer die Parameter optimieren. Es kann
ein Grenzscore zur Filterung der Datenbank aus Sequenzen ausgewählt werden,
so dass Sequenzen mit einem größeren Score
als der Grenzwert als Kandidatendomänen angezeigt werden. Eine
Beschreibung der Datenbank Pfam ist Sonhammer et al., (1997) Proteins
28(3):405-420 zu entnehmen und eine detaillierte Beschreibung von HMMs
ist beispielsweise in Gribskov et al., (1990) Meth. Enzymol. 183:146-159;
Gribskov et al., (1987) Proc. Natl. Acad. Sci. USA 84:4355-4358;
Krogh et al., (1994) J. Mol. Biol. 235:1501-1531 und Stultz et al.,
(1993) Protein Sci. 2:305-314 zu finden.
-
Die
Datenbank SMART (Simple Modular Architecture Research Tool, http://smart.embl-heidelberg.de/; Schultz
et al., (1998) Proc. Natl. Acad. Sci. USA 95:5857 und Schultz et
al., (2000) Nucl. Acids Res. 28:231) bietet einen Katalog aus Zinkfingerdomänen (ZnF_C2H2,
ZnF_C2C2, ZnF_C2HC, ZnF_C3H1, ZnF_C4, ZnF_CHCC, ZnF_GATA und ZnF_NFX),
die durch Profilsuche mit den Hidden Markov Modellen des Suchprogramms
HMMer2 (Durbin et al., (1998) Biological sequence analysis: probabilistic
models of proteins and nucleic acids. Cambridge University Press,
http://hmmer.wustI.edu/) identifiziert wurden.
-
Auf Hybridisation basierende Verfahren.
-
Eine
Sammlung von Nukleinsäuren
mit dem Code für
verschiedene Formen einer DNA-Bindungsdomäne kann profilmäßig analysiert
werden, um Sequenzen mit dem Code für konservierte amino- und carboxyterminale
Randsequenzen zu ermitteln. Es können
degenerierte Oligonukleotide gestaltet werden, die an Sequenzen
mit dem Code für
konservierte Sequenzen dieser Art durch Hybridisation binden. Darüber hinaus lässt sich
die Wirksamkeit von degenerierten Oligonukleotiden dieser Art durch
einen Vergleich von deren Zusammensetzung mit der Häufigkeit
von möglichen
Annealingstellen in bekannten Genomsequenzen schätzen. Multiple Gestaltungszyklen
können
dazu dienen, die degenerierten Oligonukleotide zu optimieren. Beispielsweise
ergibt ein Vergleich von bekannten Cys2-His2-Zinkfingern eine gemeinsame bzw. häufig vorhandene
Sequenz in der Linkerregion zwischen benachbarten Fingern in der
natürlichen
Reihenfolge (Agata et al., (1998) Gene 213:55-64). Degenerierte
Oligonukleotide dieser Art werden zur Amplifikation einer Vielzahl
von DNA-Bindungsdomänen verwendet.
Die amplifizierten Domänen
werden als Testzinkfingerdomänen
in die Hybridnukleinsäure
eingefügt
und anschließend
ein Assay bzgl. der Bindung an eine Zielstelle anhand der im vorliegenden
Schriftstück
beschriebenen Verfahren durchgeführt.
-
Gestaltung der Bibliothek
-
Das
Verfahren erlaubt das Screening einer Sammlung von Nukleinsäuren mit
dem Code für
DNA-Bindungsdomänen
(beispielsweise in Form einer Plasmid-, Phagemid- oder Phagenbibliothek)
im Hinblick auf funktionelle Nukleinsäurebindungseigenschaften. Die
Sammlung kann den Code für
eine vielfältige
Gruppe von DNA-Bindungsdomänen
enthalten, sogar für
Domänen
mit unterschiedlichen strukturellen Faltungen. In einem Fall enthält die Sammlung
den Code für
Domänen
einer einzelnen strukturellen Faltung, wie eine Zinkfingerdomäne. Die
folgenden Verfahren sind zwar im Kontext von Zinkfingerdomänen beschrieben,
doch wäre ein
Fachmann auf diesem Gebiet in der Lage, sie an Nukleinsäurebindungsdomänen anderer
Art anzupassen.
-
Mutierte Domänen.
-
In
einem weiteren Fall setzt sich die Sammlung aus Nukleinsäuren mit
dem Code für
eine strukturelle Domäne
zusammen, die aus einer degenerierten gemusterten Bibliothek ("degenerate patterned
library") zusammengesetzt
ist. Zum Beispiel im Fall von Zinkfingern kann ein Alignment von
bekannten Zinkfingern genutzt werden, die optimale Aminosäure an jeder
Position zu identifizieren. Als Alternative können Strukturstudien und Mutageneseversuche
dazu verwendet werden, die bevorzugten Eigenschaften von Aminosäuren an jeder
einzelnen Position zu ermitteln. Jede beliebige Nukleinsäurebindungsdomäne kann
als ein strukturelles Gerüst
für die
Einführung
von Mutationen dienen. Insbesondere Positionen in enger Nähe zur Nukleinsäurebindungs-Schnittstelle
oder benachbart zu einer so gelegenen Position können als Ziele für die Mutagenese dienen.
Eine mutierte Testzinkfingerdomäne
lässt sich
an jeder mutierten Position durch Anwendung einer gemusterten degenerierten
Bibliothek auf ein Subset von möglichen
Aminosäuren
beschränken.
Sets von degenerierten Codons können
verwendet werden, um den Code für
das Profil an jeder einzelnen Position zu bieten. Beispielsweise
stehen Codonsets zur Verfügung,
die nur den Code für
hydrophobe Reste, aliphatische Reste oder hydrophile Reste enthalten.
In der Bibliothek kann eine Selektion im Hinblick auf Klone mit
voller Länge mit
dem Code für
gefaltete Polypeptide erfolgen. Cho et al. ((2000) J. Mol. Biol.
297(2):309-19) legt ein Verfahren zur Produktion von degenerierten
Bibliotheken dieser Art mit Hilfe von degenerierten Oligonukleotiden
vor und legt außerdem
ein Verfahren zur Auswahl von Bibliotheks-Nukleinsäuren mit
dem Code für
Polypeptide vollständiger
Länge vor.
Nukleinsäuren
dieser Art lassen sich auf einfache Weise unter Verwendung von geeigneten
Restriktionsenzym-Spaltungsstellen oder Transposase- oder Rekombinase- Erkennungsstellen
für die
im vorliegenden Schriftstück
beschriebenen Verfahren in ein Expressionsplasmid einfügen.
-
Die
Auswahl der geeigneten Codons und der relativen Anteile der einzelnen
Nukleotide an einer gegebenen Position kann durch einfache Untersuchung
einer Tabelle, die den genetischen Code abbildet, oder durch Rechenalgorithmen
bestimmt werden.
-
Zum
Beispiel in Cho et al., dito, wird ein Computerprogramm beschrieben,
das eine gewünschte
degenerierte Proteinsequenz als Eingabe annimmt und eine bevorzugte
Gestaltung von Oligonukleotiden mit dem Code für die Sequenz ausgibt.
-
Isolierung eines natürlichen Domänenrepertoires.
-
Eine
Domänenbibliothek
kann aus genomischer DNA oder cDNA von eukaryotischen Organismen, wie
Menschen, konstruiert werden. Zu diesem Zweck sind multiple Verfahren
verfügbar.
Beispielsweise kann eine Computersuche nach verfügbaren Aminosäuresequenzen
dazu dienen, die Domänen
auf die vorstehend beschriebene Weise zu identifizieren. Eine Nukleinsäure mit
dem Code für
jede einzelne Domäne
kann isoliert und in einen geeigneten Vektor für die Expression in Zellen
eingefügt
werden, z. B. einen Vektor, der einen Promoter, eine Aktivierungsdomäne und einen
selektierbaren Marker enthält.
Bei einem anderen Beispiel werden degenerierte Oligonukleotide,
die durch Hybridierung an ein konserviertes Motiv binden, zur Amplifikation, z.
B. durch PCR, einer großen
Anzahl von verwandten Domänen,
die das Motiv enthalten, verwendet. Zum Beispiel können Kruppel-ähnliche
Cys2-His2-Zinkfinger
mit dem Verfahren von Agata et al., (1998) Gene 213:55-64 amplifiziert
werden. Bei diesem Verfahren bleiben auch die natürlich vorkommenden
Zinkfingerdomänen-Linkerpeptidsequenzen
erhalten, z. B. Sequenzen mit dem Muster: Thr-Gly-(Glu/Gln)-(Lys/Arg)-Pro-(Tyr/Phe)
(SEQ. ID. NR.: 78). Darüber
hinaus verringert das Screening einer auf Domänen von Interesse beschränkten Bibliothek
im Gegensatz zum Screening einer Bibliothek aus genomischen oder
cDNA-Sequenzen ohne
Vorauswahl, die Komplexität
der Bibliothek beträchtlich
und bewirkt eine signifikante Senkung der Wahrscheinlichkeit, eine
gewünschte
Sequenz aufgrund der inhärenten
Schwierigkeiten beim vollständigen
Screening von großen
Bibliotheken zu verpassen.
-
Das
menschliche Genom enthält
zahlreiche Zinkfingerdomänen,
von denen viele noch nicht charakterisiert und noch nicht identifiziert
sind. Schätzungen
zufolge gibt es Tausende von Genen mit dem Code für Proteine
mit Zinkfingerdomänen
(Pellegrino and Berg, (1991) Proc. Natl. Acad. Sci. 88:671-675). Diese Human-Zinkfingerdomänen stellen
eine umfangreiche Sammlung von vielfaltigen Domänen dar, aus der neuartige
DNA-Bindungsproteine konstruiert werden können. Falls jede Zinkfingerdomäne eine
unique Sequenz von 3 bis 4 bp erkennt, werden zur Bindung aller
möglichen
Sequenzen mit 3 bis 4 bp lediglich 64 bis 256 (43 bis 44) Domänen
benötigt.
Es besteht die Möglichkeit,
dass das natürliche
Repertoire des menschlichen Genoms eine ausreichende Anzahl von
uniquen Zinkfingerdomänen
enthält,
um alle möglichen
Erkennungsstellen abzudecken. Diese Zinkfingerdomänen sind
eine wertvolle Ressource zur Konstruktion von künstlichen chimären DNA-Bindungsproteinen.
Im Gegensatz zu künstlichen
Mutanten, die aus dem menschlichen Genom abgeleitet sind, haben
sich natürlich
vorkommende Zinkfingerdomänen
unter natürlichen
Selektionsdrücken
entwickelt und könnten
deshalb auf natürliche
Weise im Hinblick auf ihre Bindung an spezifische DNA-Sequenzen und ihre
In-vivo-Funktion optimiert sein.
-
Bei
Human-Zinkfingerdomänen
ist es weitaus weniger wahrscheinlich, dass bei der Einführung in Menschen
eine Immunantwort induziert wird, z. B. bei Anwendungen der Gentherapie.
-
In-vivo-Auswahl von Zinkfingerdomänen, die
spezifische DNA-Bindungseigenschaften
besitzen
-
Zinkfingerdomänen mit
gewünschten
DNA-Erkennungseigenschaften können
mit dem folgenden In-vivo-Screeningverfahren identifiziert werden.
Eine zusammengesetzte Bindungsstelle von Interesse wird vor (in
Leserichtung, "upstream") einem Reportergen
so eingeführt,
dass die Rekrutierung einer Transkriptionsaktivierungsdomäne zu der
zusammengesetzten Bindungsstelle zu einer erhöhten Reportergenstranskription über ein
gegebenes Niveau hinaus führt.
Es wird ein Expressionsplasmid mit dem Code für ein Hybridprotein konstruiert,
das aus einer Testzinkfingerdomäne
besteht, die an eine feste DNA-Bindungsdomäne und eine Transkriptionsaktivierungsdomäne fusioniert
ist.
-
Die
zusammengesetzte Bindungsstelle beinhaltet mindestens zwei Elemente,
eine Rekrutierungsstelle und eine Zielstelle. Das System wird gentechnisch
so hergestellt, dass die feste DNA-Bindungsdomäne die Rekrutierungsstelle
erkennt. Die Bindungsaffinität
der festen DNA-Bindungsdomäne
für die
Rekrutierungsstelle ist jedoch so, dass sie unter In-vivo-Bedingungen
alleine nicht zur Aktivierung der Reportergentranskription ausreicht.
Dies lässt
sich durch einen Kontrollversuch bestätigen.
-
Zum
Beispiel, wird die feste DNA-Bindungsdomäne in Zellen exprimiert (in
Abwesenheit eines Testzinkfingerdomäne oder in Anwesenheit einer
Testzinkfingerdomäne,
die bekanntlich nicht-funktionell ist oder deren DNA-kontaktierende Reste
durch eine alternative Aminosäure
wie Alanin ersetzt sind) sollte sie nicht in der Lage sein, die
Transkription des Reportergens über
ein nominelles Niveau hinaus zu aktivieren. Eine gewisse Leck- oder
Niedrigniveau-Aktivierung ist tolerierbar, da das System auf andere
Weise sensibilisiert werden kann (z. B. durch die Verwendung eines
kompetitiven Hemmstoffs für
den Reporter). Es wird erwartet, dass die feste DNA-Bindungsdomäne nicht
stabil an die Rekrutierungsstelle bindet. Zum Beispiel kann die
feste DNA-Bindungsdomäne
mit einer Dissoziationskonstante (Kd) von
ungefähr
0,1 nM, 1 nM, 1 μM,
10 μM, 100 μM oder mehr
an die Rekrutierungsstelle binden. Die Kd der
DNA-Bindungsdomäne
für die
Zielstelle in Abwesenheit einer Testzinkfingerdomäne oder
in Abwesenheit einer Testzinkfingerdomäne mit Spezifität für die zweite
Zielstelle kann mit einem EMSA (electrophoretic mobility shift assay)
unter In-vitro-Bedingungen gemessen werden.
-
Folglich
ist die Anbringung einer funktionellen Testzinkfingerdomäne notwendig,
die die Zielstelle erkennt, z. B. die variable Stelle einer zusammengesetzten
Bindungsstelle, damit das Hybridprotein in Zellen stabil an die
zusammengesetzte Bindungsstelle binden kann und auf diese Weise
das Reportergen aktiviert. Die Bindungspräferenz der Testzinkfingerdomäne für die Zielstelle
führt zu
einer Steigerung der Reportergenexpression relativ zu dem gegebenen
Niveau. Zum Beispiel kann die Steigerung der Reportergenexpression, ausgedrückt durch
Teilung des beobachteten Niveaus durch das gegebene Niveau, ungefähr das 2-,
4-, 8-, 20-, 50-, 100-, 1000- oder mehr-fache betragen. Wenn die
Testzinkfingerdomäne
die Zielstelle erkennt, verringert sich die Kd des
Transkriptionsfaktors, der die DNA-Bindungsdomäne und die Testzinkfingerdomäne umfasst,
z. B. relativ zu einem Transkriptionsfaktor, dem eine Testzinkfingerdomäne mit Spezifität für die Zielstelle fehlt.
Zum Beispiel kann die Dissoziationskonstante (Kd)
eines Transkriptionsfaktors im Komplex mit einer Zielstelle, für die er
eine Spezifität
besitzt, ungefähr
50 nM, 10 nM, 1 nM, 0,1 nM, 0,01 nM oder weniger betragen. Die Kd kann unter In-vitro-Bedingungen mittels
EMSA ermittelt werden.
-
Die
Entdeckung, dass die DNA-Bindungsspezifität auf empfindliche und genaue
Weise in einem Assay gemessen werden kann, indem die Fähigkeit
von Testzinkfingerdomänen
zur Verstärkung
der in-vivo-Bindungsaffinität
einer festen DNA-Bindungsdomäne
ermittelt wird, hat die rasche Isolierung und Charakterisierung
von neuartigen Zinkfingerdomänen
aus dem menschlichen Genom ermöglicht.
-
Feste
DNA-Bindungsdomänen
sind u. a. modulare Domänen,
die aus natürlich
vorkommenden DNA-Bindungsproteinen isoliert werden, z. B. einem
natürlich
vorkommenden DNA-Bindungsprotein, das multiple Domänen besitzt
oder bei dem es sich um ein Oligomer handelt. Zum Beispiel können beide
von zwei bekannten Zinkfingern, z. B. Finger 1 und Finger 2 von
Zif268, als die feste DNA-Bindungsdomäne verwendet werden. Ein fähiger Fachmann
auf diesem Gebiet wäre
in der Lage, aus der Unzahl von Nukleinsäurebindungsdomänen (z.
B. eine im vorliegenden Schriftstück beschriebene Domänenfamilie,
wie eine Homöodomäne, eine
Helix-Turn-Helix-Domäne
oder eine Helix-Loop-Helix-Domäne oder
eine nach dem Stand der Technik gut charakterisierte Nukleinsäurebindungsdomäne) eine
geeignete feste DNA-Bindungsdomäne
für das
System zu identifizieren. Eine geeignete Auswahl einer Rekrutierungsstelle,
die von der festen DNA-Bindungsdomäne erkannt wird, ist ebenfalls
notwendig. Bei der Rekrutierungsstelle kann es sich um eine Unterstelle
innerhalb der natürlichen
Bindungsstelle für
das natürlich
vorkommende DNA-Bindungsprotein
handeln, von dem die feste DNA-Bindungsdomäne stammt. Bei Bedarf können Mutationen
entweder in die feste Domäne oder
in die Rekrutierungsstelle eingeführt werden, um das System zu
sensibilisieren.
-
Geeignete
Zellen für
das In-vivo-Screeningsystem sind u. a. sowohl eukaryotische als
auch prokaryotische Zellen. Beispielhafte eukaryotische Zellen sind
u. a. Hefezellen, z. B. Zellen von Saccharomyces cerevisiae, Saccharomyces
pombe und Pichia pastoris.
-
Das
Saccharomyces cerevisiae verwendende Ein-Hybrid-Hefesystem wurde
modifiziert, um Zinkfingerdomänen
mit dem vorstehend angegebenen Screeningssystem auszuwählen. Als
erstes wurden Reporterplasmide mit dem Code für das Reportergen HIS3 hergestellt.
Die vorbestimmte 4-bp-DNA-Sequenzen
wurden mit einer gestutzten Bindungssequenz verbunden, um zusammengesetzte
Bindungssequenzen für
die DNA-Bindungsdomänen
vorzulegen und jeder der zusammengesetzten Bindungssequenzen wurde
auf operative Weise auf getrennten Plasmiden mit dem Reportergen
verknüpft.
-
Die
Hybridnukleinsäuresequenz
enthält
den Code für
eine Transkriptionsaktivierungsdomäne verknüpft mit einer DNA-Bindungsdomäne, die
eine gestutzte DNA-Bindungsdomäne
und eine Zinkfingerdomäne umfasst.
-
Die
hierbei verwendeten Bindungsstellen sind nicht unbedingt fortlaufend,
obwohl fortlaufende Stellen häufig
verwendet werden. Flexible und/oder erweiterbare Linker zwischen
Nukleinsäurebindungsdomänen können verwendet
werden, um Proteine, die nicht-fortlaufende Stellen erkennen, zu
produzieren.
-
Einem
erfindungsgemäßen Aspekt
zufolge kann ein aus Finger 1 und Finger 2 von Zif268 zusammengesetztes
Polypeptid, das Finger 3 nicht enthält, als eine feste DNA-Bindungsdomäne verwendet
werden. (Von den drei Zinkfingerdomänen von Zif268 bezieht sich
Finger 1 auf die am N-terminalen Ende befindliche Zinkfingerdomäne, Finger
2 auf die Zinkfingerdomäne
in der Mitte und Finger 3 auf die Zinkfingerdomäne am C-terminalen Ende.) Als
Alternative können
zwei beliebige Zinkfingerdomänen,
deren Bindungsstelle charakterisiert wurde, als eine feste DNA-Bindungsdomäne verwendet
werden.
-
Weitere
nützliche
feste DNA-Bindungsdomänen
können
von anderen Zinkfingerproteinen abgeleitet werden, wie Sp1, CF2-II,
YY1, Kruppel, WT1, Egr2 oder POU-Domänenproteinen, wie Oct1, Oct2
und Pit1. Diese werden nur zu Beispielszwecken vorgelegt und die
vorliegende Erfindung ist nicht auf diese beschränkt.
-
Einem
besonderen erfindungsgemäßen Beispiel
zufolge kann die durch Löschung
von 4 bp vom 5'-Ende
der optimalen Erkennungssequenz von Zif268 (5'-GCG TGG GCG-3) abgeleitete Basensequenz
5'-GGGCG-3' als eine Rekrutierungsstelle
verwendet werden. Jede beliebige Zielsequenz von 3 bis 4 bp kann
mit dieser Rekrutierungsstelle verknüpft werden, um eine zusammengesetzte
Bindungssequenz zu ergeben.
-
Aktivierungsdomänen.
-
Zu
den Transkriptionsaktivierungsdomänen, die bei der vorliegenden
Erfindung verwendet werden können,
handelt es sich u. a. um die Gal4-Aktivierungsdomäne von Hefe
und die VP16-Domäne
von Herpes Simplex Virus, ohne auf diese beschränkt zu sein. Bei Bakterien
kann die Funktion der Aktivierungsdomäne nachgeahmt werden durch
Fusion einer Domäne,
die eine C-terminate Domäne
der Alpha-Untereinheit von Wildtyp-RNA-Polymerase oder eine mutierte C-terminale
Domäne
der Alpha-Untereinheit,
z. B. eine an eine Proteinwechselwirkungsdomäne fusionierte C-terminale Domäne, rekrutieren
kann.
-
Repressionsdomänen.
-
Auf
Wunsch kann eine Repressionsdomäne
anstatt einer Aktivierungsdomäne
an die DNA-Bindungsdomäne
fusioniert sein. Beispiele für
eukaryotische Repressionsdomänen
sind u. a. ORANGE, groucho und WRPW (Dawson et al., (1995) Mol.
Cell Biol. 15:6923-31). Bei Verwendung einer Repressionsdomäne kann ein
toxisches Reportergen und/oder ein nicht-selektierbarer Marker zum Screening
im Hinblick auf eine Senkung der Expression verwendet werden.
-
Reportergene.
-
Bei
dem Reportergen kann es sich um einen selektierbaren Marker handeln,
z. B. um ein Gen, das eine Arzneimittelresistenz verleiht, oder
um einen auxotrophen Marker. Beispiele für Arzneimittelresistenzgene sind
u. a. die Cyclohexamidresistenz von S. cerevisiae (CYH), das Canavaninresistenzgen
von S. cerevisiae (CAN1) und das Hygromycinresistenzgen. Auxotrophe
Marker von S. cerevisiae sind u. a. die Gene URA3, HIS3, LEU2, ADE2
und TRP1. Handelt es sich bei dem Reportergen um einen auxotrophen
Marker, fehlt den Zellen eine funktionelle Kopie des auxotrophen
Gens, so dass die Fähigkeit
zur Produktion eines bestimmten Stoffwechselprodukts verwendet wird.
Die Auswahl von Konstrukten mit dem Code für Testzinkfingerdomänen, die
eine Zielstelle binden, wird durch Kultivierung der Zellen in Medium,
dem das Stoffwechselprodukt fehlt, erreicht. Zum Beispiel kann das
Gen HIS3 als ein selektierbarer Marker in Verbindung mit einem Hefestamm des
Typs his3 verwendet werden. Nach Einführung von Konstrukten mit dem
Code für
die Hybridtranskriptionsfaktoren werden die Zellen in Abwesenheit
von Histidin gezüchtet.
Selektierbare Marker zur Verwendung bei Säugetierzellen, wie Thymidinkinase,
Neomycinresistenz und HPRT, sind dem fähigen Fachmann auf diesem Fachgebiet
ebenfalls bekannt.
-
Als
Alternative enthält
das Reportergen den Code für
ein Protein, dessen Anwesenheit leicht nachweisbar und/oder quantifizierbar
ist. Beispielhafte Reportergene sind u. a. lacZ, Chloramphenicolacetyltransferase
(CAT), Luciferase, green fluorescent protein (GFP), Beta-Glucuronidase
(GUS), blue fluorescent protein (BFP) und Derivate von GFP, z. B.
mit geänderten
oder verstärkten
Fluoreszenzeigenschaften (Clontech Laboratories, Inc., CA). Kolonien
von lacZ-exprimierenden Zellen sind leicht nachweisbar, indem die
Kolonien auf Platten gezüchtet
werden, die das kolorimetrische Substrat X-gal enthalten. Die Expression
von GFP kann durch Überwachung
der Fluoreszenzemission nach Anregung nachgewiesen werden. Einzelne
Zellen, die GFP exprimieren, können
durch Fluoreszenz-aktivierte Zellsortierung (FACS) identifiziert
und isoliert werden.
-
Das
System kann mit zwei Reportergenen konstruiert werden, z. B. einem
selektierbaren Reportergen und einem nicht-selektierbaren Reportergen.
Der selektierbare Marker ermöglicht
die schnelle Identifizierung der Domäne von Interesse, da unter
den geeigneten Wachstumsbedingungen nur Zellen wachsen, die die
Domäne
von Interesse tragen. Der nicht-selektierbare Marker bietet ein
Mittel zur Bestätigung,
z. B. zur Unterscheidung von falsch positiven Befunden, und ein
Mittel zur Quantifizierung des Ausmaßes der Bindung. Die beiden
Reporter können
an unterschiedlichen Orten in das Genom integriert sein, hintereinander
("in tandem") im Genom integriert
sein, auf dem selben chromosomalen Element enthalten sein (z. B.
Plasmid) enthalten sein oder auf unterschiedlichen chromosomalen
Elementen enthalten sein.
-
Die
Grundlagen des zur Auswahl von gewünschten Zinkfingerdomänen verwendeten
modifizierten Ein-Hybrid-Systems sind in 5 erläutert. Die
DNA-Bindungsdomäne
des Hybridtranskriptionsfaktors setzt sich zusammen aus (a) einer
gestutzten DNA-Bindungsdomäne,
die aus Finger 1 und Finger 2 von Zif268 besteht, und (b) Zinkfingerdomäne A oder
B. Die Basensequenz der Bindungsstelle in der Promoterregion des Reportergens
ist eine zusammengesetzte Sequenz (5'-XXXXGGGCG-3'), die aus einer 4-bp-Zielsequenz (Nukleotide
1 bis 4, 5'-XXXX-3') und einer gestutzten
Bindungssequenz (Nukleotide 5 bis 9, 5'-GGGCG-3') besteht.
-
Falls
die Testzinkfingerdomäne
(A in 5) in dem Hybridtranskriptionsfaktor
die Zielsequenz erkennt, kann der Hybridtranskriptionsfaktor stabil
an die zusammengesetzte Bindungssequenz binden. Diese stabile Bindung
führt zur
Expression des Reportergens durch die Aktion der Aktivierungsdomäne (AD in 5)
des Hybridtranskriptionsfaktors. Infolgedessen kann bei Verwendung
von HIS3 als ein Reportergen die transformierte Hefe auf einem Medium
wachsen, dem Histidin fehlt. Als Alternative kann die transformierte
Hefe bei Verwendung von lacZ als ein Reportergen in einem Medium,
das X-gal, ein Substrat des lacZ-Proteins, als eine blaue Kolonie
wachsen. Falls die Zinkfingerdomäne
(B in 5) des Hybridtranskriptionsfaktors
die Zielsequenz jedoch nicht erkennt, wird die Expression des Reportergens
nicht induziert. Infolgedessen kann die transformierte Hefe in dem
Medium ohne Histidin nicht wachsen (bei Verwendung von HIS3 als
Reportergen) oder wächst
als weiße
Kolonie in einem X-gal-haltigen Medium (bei Verwendung von lacZ
als Reportergen).
-
Das
Auswahlverfahren, das dieses modifizierte Ein-Hybrid-System verwendet,
ist vorteilhaft, da nachgewiesen wurde, dass mit diesem Verfahren
ausgewählte
Zinkfingerdomänen
im zellulären
Milieu funktionsfähig
sind. Somit sind die Domänen
mutmaßlich
in der Lage sich zu falten, in den Kern zu gelangen und intrazellulären Proteasen
und anderen potenziell schädigenden
intrazellulären
Wirkstoffen Stand zu halten. Darüber
hinaus erlaubt das im vorliegenden Schriftstück offengelegte modifizierte
Ein-Hybrid-System die Isolierung von gewünschten Zinkfingerdomänen auf
eine rasche und einfache Weise. Für das modifizierte Ein-Hybrid-System
ist nur eine einzige Runde der Hefezellentransformation erforderlich,
um die gewünschten
Zinkfingerdomänen
zu isolieren.
-
Das
im vorliegenden Schriftstück
beschriebene Auswahlverfahren kann zur Identifizierung einer Zinkfingerdomäne aus einem
Genom verwendet werden, z. B. einem Genom einer Pflanzen- oder Tierart
(z. B. einem Säugetier,
z. B. einem Menschen). Darüber
hinaus kann das Verfahren zur Identifizierung einer Zinkfingerdomäne aus einer
Bibliothek von mutierten Zinkfingerdomänen verwendet werden, die beispielsweise durch
zufallsbestimmte Mutagenese (Random Mutagenesis) hergestellt werden.
Zudem können
die beiden Verfahren zusammen verwendet werden. Beispielsweise wenn
eine Zinkfingerdomäne
für eine
besondere 3-bp- oder 4-bp-DNA-Sequenz aus dem menschlichen Genom
nicht isoliert werden kann, kann eine Bibliothek von Zinkfingerdomäne, die
durch zufallsbestimmte oder gezielte Mutagenese hergestellt wurden,
im Hinblick auf eine Domäne
dieser Art gescreent werden.
-
Obwohl
das modifizierte Ein-Hybrid-System in Hefe ein bevorzugtes Mittel
zur Auswahl von Zinkfingerdomänen,
die die gegebenen Zielsequenzen erkennen und daran binden, ist,
ist es für
einen Fachmann auf diesem Fachgebiet offensichtlich, dass andere
Systeme als die Ein-Hybrid-Selektion in Hefe verwendet werden können. Zum
Beispiel könnte
eine Phagendisplay-Auswahl zum Screening einer Bibliothek von natürlich vorkommenden
Zinkfingerdomänen,
die von einem Genom eines eukaryotischen Organismus abgeleitet sind, verwendet
werden.
-
Die
vorliegende Erfindung schließt
die Verwendung des Ein-Hybrid-Verfahrens bei einer Reihe von in Kultur
gehaltenen Zellen ein. Zum Beispiel könnte ein operativ mit Zielsequenzen
verknüpftes
Reportergen in prokaryotische oder Tier- oder Pflanzenzellen in
Kultur eingeführt
werden und die Zellen in Kultur könnten anschließend mit
Plasmiden, Phagen oder Viren mit dem Code für eine Bibliothek von Zinkfingerdomänen transfiziert
werden. Gewünschte
Zielsequenzen-erkennende Zinkfingerdomänen lassen sich dann aus den
isolierten Zellen erhalten, in denen das Reportergen aktiviert ist.
-
Die
nachfolgend offengelegten Beispiele belegen, dass mit dem Verfahren
Zinkfingerdomänen
für Bindungsstellen
von Interesse identifiziert werden können. Es wurde eine Bibliothek
von Hybridtranskriptionsfaktoren mit einer Reihe von Zinkfingerdomänen in der
Position von Finger 3 hergestellt. Von den aus der Bibliothek ausgewählten neuartigen
Zinkfingerdomänen
(z. B. die Zinkfinger HSNK, QSTV und VSTR, siehe nachfolgend) kommt
keiner auf natürliche
Weise in seinem entsprechenden Eltern-Zinkfingerprotein am C-Terminus vor. Dies
ist ein klarer Beleg, dass Zinkfingerdomänen modular sind und dass neuartige
DNA-Bindungsdomänen
durch Mischen und Anpassen ("Mix-and-Match") von geeigneten
Zinkfingerdomänen
konstruiert werden können.
-
Die
mit Hilfe des erfindungsgemäßen Verfahrens
ausgewählten
Zinkfingerdomänen
können
als Bausteine zur Herstellung von neuen DNA-Bindungsproteinen durch geeignetes Rearrangement
und Rekombination verwendet werden. Zum Beispiel lässt sich
ein neuartiges DNA-Bindungsprotein,
das die Promoterregion von Human-CCRS, einem Korezeptor von HIV-1,
erkennt, auf die folgende Weise konstruieren. Die Promoterregion
von Human-CCRS enthält
die folgende 10-bp-Sequenz: 5'-AGG
GTG GAG T-3' (SEQ.
ID. NR.: 4) (6). Unter Verwendung des im
vorliegenden Schriftstück
offengelegten Ein-Hybrid-Systems sollte man in der Lage sein, drei
Zinkfingerdomänen
zu isolieren, die jeweils eine der folgenden 4-bp-Zielsequenzen erkennen:
5'-AGGG-3', 5'-GTGG-3' und 5'-GAGT-3'. Bei diesen Zielsequenzen
handelt es sich um überlappende 4-bp-Sequenzen
der CCRS-Zielsequenz.
Diese drei Zinkfingerdomänen
können
mit geeigneten Linkern verknüpft
und an einer regulatorischen Domäne,
wie die Domäne
VP16 und die Domäne
GAL4, oder Repressionsdomänen,
wie die Domäne
KRAB, befestigt werden, um neue Transkriptionsfaktoren zu erzeugen,
die spezifisch an den CCRS-Promoter binden. Diese Zinkfingerproteine
könnten
bei der Gentherapie verwendet werden, um zu helfen, die Proliferation
von HIV-1 zu verhindern.
-
Hochdurchsatz-Screening
-
Das
folgende Verfahren erlaubt die schnelle Messung der relativen In-vivo-Bindungsaffinität für jede einzelne
Domäne
in einer Sammlung von multiplen möglichen DNA-Bindungsstellen
oder sogar allen möglichen
DNA-Bindungsstellen.
Es wird eine große
Sammlung von Nukleinsäuren
mit dem Code für
Nukleinsäurebindungsdomänen erzeugt.
Jede Nukleinsäurebindungsdomäne wird
in Form der Testzinkfingerdomäne
eines Hybridnukleinsäurekonstrukts
kodiert und in einem Hefestamm mit einem Paarungstyp exprimiert.
Auf diese Weise wird ein erster Satz von Hefestämmen, die sämtliche verfügbaren oder
gewünschten
Domänen
exprimieren, erzeugt. Ein zweiter Satz von Hefestämmen, die
Reporterkonstrukte für
mutmaßliche
Zielstellen für die
Domänen
in dem Reporterkonstrukt enthalten, wird in dem anderen Paarungstyp
erzeugt. Das Verfahren erfordert die Durchführung von zahlreichen oder
allen möglichen paarweisen
Paarungen, um eine Matrix von fusionierten Zellen zu erzeugen, die
jeweils eine unterschiedliche Testzinkfingerdomäne und ein unterschiedliches
Zielstellen-Reporterkonstrukt besitzen. Für jede fusionierte Zelle wird
die Expression des Reportergens mit einem Assay bestimmt. Auf diese
Weise werden mit dem Verfahren die Bindungspräferenzen des getesteten Domänen auf
eine schnelle und unaufwändige
Weise ermittelt.
-
Es
wird eine Sammlung von Domänen
identifiziert, z. B. durch Durchsuchen einer genomischen Datenbank
nach mutmaßlichen
Domänen,
die einem gegebenen Profil entsprechen. Die Sammlung kann beispielsweise
zehn bis zwanzig Domänen,
oder alle identifizierten Domänen,
möglicherweise
Tausende oder mehr, beinhalten. Nukleinsäuren mit dem Code für die in
der Datenbank identifizierten Domänen werden unter Verwendung
von synthetischen Oligonukleotiden amplifiziert. Manuelle und automatische
Verfahren zur Gestaltung von synthetischen Oligonukleotiden dieser
Art gehören
zur Routine nach dem Stand der Technik. Mit degenerierten Primern
können
Nukleinsäuren
mit dem Code für
zusätzliche
Domänen
amplifiziert werden. Nukleinsäuren
mit dem Code für
die Domänen
aus der Sammlung werden in das vorstehend beschriebene Hefe-Expressionsplasmid
geklont und auf diese Weise Fusionsproteine, die aus den Domänen und
den ersten beiden Fingern von Zif268 und einer Transkriptionsaktivierungsdomäne bestehen,
erzeugt. Die Amplifikations- und Klonierungsschritte können in
einem Mikrotiterplattenformat durchgeführt werden, um Nukleinsäuren mit dem
Code für
die multiplen Domänen
zu klonieren.
-
Als
Alternative kann ein Rekombinationsklonierungs-Verfahren verwendet
werden, um multiple amplifizierte Nukleinsäuren mit dem Code für die Domänen schnell
in den Hefe-Expressionsvektor einzufügen. Dieses Verfahren, das
in U.S.-Patent Nr. 5,888,732 und im "Gateway"-Handbuch (Life Technologies-Invitrogen, CA, USA)
beschrieben ist, sieht vor, an den Enden der Amplifikationsprimer
maßgeschneiderte
Stellen für
eine stellenspezifische Rekombinase aufzunehmen. Der Expressionsvektor
enthält
eine zusätzliche
Stelle oder zusätzliche
Stellen an den Positionen für
die Einfügung
der amplifizierten Nukleinsäuren
mit dem Code für
die Domänen.
Diese Stellen sind so gestaltet, dass Stop-Codons fehlen. Die Zugabe
des Amplifikationsprodukts, des Expressionsvektors und der stellenspezifischen
Rekombinase zu der Rekombinationsreaktion führt zur Einfügung der
amplifizierten Sequenz in den Vektor. Durch zusätzliche Merkmale, z. B. die
Verdrängung
eines toxischen Gens bei erfolgreicher Einfügung, wird dieses Verfahren
hocheffizient und geeignet für
das Hochdurchsatz-Screening.
-
Mit
Hilfe von Restriktionsenzym-vermitteltem und/oder Rekombinationsklonieren
können
Nukleinsäuren
mit dem Code für
jede der identifizierten Domänen
in einen Expressionsvektor eingefügt werden. Die Vektoren können in
Bakterien gezüchtet
werden und in mit Index versehenen Mikrotiterplatten eingefroren
werden, so dass jedes Well eine Zelle enthält, die eine Nukleinsäure mit
dem Code für
eine der unterschiedlichen, uniquen DNA-Bindungsdomänen enthält.
-
Für jede Domäne wird
Plasmid-DNA isoliert und in eine Hefezelle transformiert, z. B.
eine Saccharomyces cerevisiae MATa-Zelle. Da der Expressionsvektor
einen selektierbaren Marker enthält,
werden die transformierten Zellen in Minimalmedium unter Ernährungsbedingungen
gezüchtet,
die selektiv für
den Marker sind. Zellen dieser Art können für den späteren Gebrauch auch eingefroren
und gelagert werden, z. B. in Mikrotiterplatten.
-
Es
wird ein zweiter Satz von Hefestämmen
konstruiert, z. B. in einer Saccharomyces cerevisiae MATa-Zelle.
Dieser Satz von Hefestämmen
enthält
eine Reihe von unterschiedlichen Reportervektoren. Jeder Hefestamm,
der einen Expressionsvektor mit einer uniquen DNA-Bindungsdomäne enthält, wird
dann mit allen einzelnen Hefestämmen
des Reportergensatzes gepaart. Da diese beiden Stämme gegensätzliche
Paarungstypen besitzen und gentechnisch so konstruiert wurden, dass
sie unterschiedliche Auxotrophien besitzen, können Diploide auf einfache
Weise selektiert werden. Diploide dieser Art besitzen sowohl das
Reporter- als auch das Expressionsplasmid. Die Zellen werden auch
unter Ernährungsbedingungen
kultiviert, die sowohl für
das Reporter- als auch für
das Expressionsplasmid selektiv sind. Uetz et al. (2000) Nature
403:623-7 beschreiben eine vollständige Zwei-Hybrid-Map aller
Hefeproteine durch die Erzeugung einer solchen Matrix von Hefepaarungen.
-
Der
Nachweis der Reportergenexpression kann in einem Großmengenformat
erfolgen, z. B. in Mikrotiterplatten. Beispielweise bei Verwendung
von GFP als Reporter kann eine Platte, die die Matrix mit gepaarten Zellen
enthält,
mit einem Scannergerät
auf Fluoreszenz geprüft
werden.
-
Modularer Zusammenbau von
neuartigen DNA-Bindungsproteinen
-
Ein
neues DNA-Bindungsprotein, das eine Zielsequenz von 9-bp oder eine
längere
DNA-Sequenz erkennt, kann auf rationale Weise konstruiert werden,
indem man geeignete Zinkfingerdomänen miteinander mischt und
anpasst ("Mix-and-Match"). Aufgrund ihrer
modularen Struktur können
Zinkfingerdomänen
umarrangiert werden, um neue DNA-Bindungsproteine zu erzeugen. Wie 1 zu
entnehmen ist, sind die Zinkfingerdomänen in dem natürlich vorkommenden
Protein Zif268 hintereinander entlang der DNA-Doppelhelix angeordnet. Jede Domäne erkennt
unabhängig
von den anderen ein unterschiedliches 3-4 bp DNA-Segment.
-
Eine Zinkfingerdomänen-Datenbank.
-
Das
vorstehend beschriebene Ein-Hybrid-Selektionssystem
kann zur Identifizierung von einer oder mehreren Zinkfingerdomänen für jede mögliche Bindungsstelle
mit 3- oder 4-Basenpaar-Bindungsstelle
verwendet werden. Die Ergebnisse können in Form einer Matrix oder
als Datenbank gespeichert werden, z. B. als eine relationelle Datenbank.
Die Datenbank kann auch einen Hinweis auf die relative Affinität der Zinkfingerdomänen, die
an die einzelnen Stellen binden, enthalten.
-
Zinkfingerdomänen dieser
Art können
im Kontext von multiplen verschiedenen Fusionsproteinen getestet
werden, um ihre Spezifität
zu bestätigen.
Darüber
hinaus können
besondere Bindungsstellen, für
die nur wenige Domänen
verfügbar
sind, das Ziel von zusätzlichen
Auswahlscreenings sein. Bibliotheken für Auswahlvorgänge dieser
Art lassen sich herstellen, indem eine Zinkfingerdomäne, die
an eine ähnliche,
aber unterschiedliche Stelle bindet, einem Mutageneseprozess unterzogen
wird. Eine vollständige
Matrix von Zinkfingerdomänen
für alle
möglichen
Bindungsstellen zu haben ist unbedingt erforderlich, da die Domänen relativ
zu den Zielbindungsstellen gestaffelt werden können, um die verfügbaren Domänen am besten
zu nutzen. Eine Staffelung dieser Art lässt sich erreichen sowohl durch
Zergliederung ("Parsing") der Bindungsstelle
in die nützlichsten
3- oder 4-bp-Bindungsstellen als auch durch Variation der Linkerlänge zwischen
Zinkfingerdomänen.
Um dem auf diese Weise gestalteten Polypeptid sowohl Selektivität als auch
hohe Affinität
zu verleihen, können
flankierend zu Zinkfingerdomänen
mit hoher Spezifität
für eine
gewünschte
Stelle andere Domänen vorgesehen
sein, die mit hoher Affinität,
aber geringerer Spezifität
binden. Das im vorliegenden Schriftstück beschriebene In-vivo-Screeningverfahren
kann zur In-vivo-Prüfung
der Funktion, Affinität
und Spezifität
eines künstlich
zusammengebauten Zinkfingerproteins und von Derivaten desselben
verwendet werden. Gleichermaßen
kann das Verfahren zur Optimierung von zusammengebauten Proteinen
dieser Art verwendet werden, z. B. durch die Erzeugung von Bibliotheken
mit verschiedenen Linker-Zusammensetzungen, Zinkfingerdomänenmodulen,
Zinkfingerdomänenzusammensetzungen
und so weiter.
-
Zergliederung einer Zielstelle.
-
Die
Zielsequenz von 9-bp oder längere
DNA-Zielsequenz
wird in 3- oder 4-bp-Segmente zergliedert. Es werden Zinkfingerdomänen identifiziert
(z. B. aus einer vorstehend beschriebenen Datenbank), die die einzelnen
3- oder 4-bp-Teilsegment erkennen. Längere Zielsequenzen, z. B.
Sequenzen mit 20 bp bis 500 bp, stellen ebenfalls geeignete Ziele
dar, da in ihnen Subsequenzen von 9 bp, 12 bp und 15 bp identifiziert
werden können.
Insbesondere Subsequenzen, die in Stellen zergliedert werden können, die
in der Datenbank gut repräsentiert
sind, können
als anfängliche
Gestaltungsziele dienen.
-
Konstruktion von zusammengebauten Modulen.
-
Es
werden Polypeptidsequenzen so gestaltet, dass sie multiple Zinkfingerdomänen enthalten,
die aneinander grenzende oder nahe aneinander befindliche 3- oder
4-bp-Unterstellen erkennen. Es kann eine Nukleinsäuresequenz
mit dem Code für
die so gestaltete Polypeptidsequenz synthetisiert werden. Verfahren
zur Konstruktion von synthetischen Genen gehören zur Routine nach dem Stand
der Technik. Zu Verfahren dieser Art gehören u. a. die Genkonstruktion
aus maßgeschneidert-synthetisierten
Oligonukleotiden, PCR-vermitteltes Klonieren und Mega-Primer-PCR.
Es können
multiple Nukleinsäuresequenzen
synthetisiert werden, z. B. um eine Bibliothek zu bilden. Beispielsweise
können
die Nukleinsäuren
der Bibliothek so gestaltet werden, dass die Sequenzen mit dem Code
für eine
Domäne
sich an jeder gegebenen Position derart unterscheiden, dass sie
den Code für
unterschiedliche Zinkfingerdomänen
enthalten, deren Erkennungsspezifität sich für diese Position eignet. Sexual PCR
und "DNA ShufflingTM" (Maxygen,
Inc., CA) können
zur Variation der Identität der
Zinkfingerdomänen
an den einzelnen Positionen verwendet werden.
-
Peptidlinker.
-
DNA-Bindungsdomänen können durch
eine Reihe von Linkern verbunden werden. Die Nützlichkeit und die Gestaltung
von Linkern sind nach dem Stand der Technik wohlbekannt. Ein besonders
nützlicher
Linker ist ein Peptidlinker, dessen Code in einer Nukleinsäure enthalten
ist. Folglich lässt
sich ein synthetisches Gen konstruieren, das den Code für eine erste
DNA-Bindungsdomäne, den
Peptidlinker und eine zweite DNA-Bindungsdomäne enthält. Diese Gestaltung lässt sich
wiederholen, um große,
synthetische Multidomänen-DNA-Bindungsproteine
zu konstruieren. Die Gestaltung von Peptidlinkern, die zur Verbindung
von Zinkfingerdomänen
geeignet sind, ist in PCT WO 99/45132 und in Kim and Pabo ((1998)
Proc. Natl. Acad. Sci. USA 95:2812-7) beschrieben.
-
Es
sind zusätzliche
Peptidlinker erhältlich,
die Random Coil-, α-Helix-
oder β-Blatt-Tertiärstrukturen
bilden. Polypeptide, die geeignete flexible Linker bilden, sind
dem Stand der Technik wohlbekannt (siehe z. B. Robinson and Sauer
(1998) Proc. Natl. Acad. Sci. USA 95: 5929-34). Flexible Linker
beinhalten im typischen Fall Glycin, da diese Aminosäure, der
eine Seitenkette fehlt, aufgrund ihrer Rotationsfreiheit einmalig
ist. Serin oder Threonin können
im Linker eingestreut sein, um die Hydrophilizität zu erhöhen. Zusätzlich können Aminosäuren, die mit der Phosphat-Rückenkette
von DNA Wechselwirkungen eingehen können, zur Steigerung der Bindungsaffinität genutzt
werden. Die wohlüberlegte
Verwendung von Aminosäuren
dieser Art erlaubt es, ein Gleichgewicht zwischen Steigerungen der
Affinität
mit Verlusten bei der Sequenzspezifität zu finden. Falls eine feste
Verlängerung
als ein Linker gewünscht
wird, können α-helikale
Linker, wie die in Pantoliano et al. (1991) Biochem. 30:10117-10125
beschriebenen helikalen Linker, verwendet werden. Linker können aber auch
durch Computer Modeling gestaltet werden (siehe z. B. US-Patent
Nr. 4,946,778). Software für
das molekulare Modeling ist im Handel erhältlich (z. B. von Molecular
Simulations, Inc., San Diego, CA). Als Option wird der Linker unter
Anwendung von Standardtechniken der Mutagenese und geeigneten biophysikalischen Tests,
die der Praxis im Bereich des Protein EnGlneering entsprechen, und
der im vorliegenden Schriftstück beschriebenen
Funktionsassays, optimiert, z. B. um die Antigenität zu reduzieren
und/oder die Stabilität
zu erhöhen.
-
Bei
Zinkfingerdomänen
nutzenden Umsetzungen kann das auf natürliche Weise zwischen Zinkfingern vorkommende
Peptid als ein Linker zur Verbindung von Fingern verwendet werden.
Ein typischer natürlich
vorkommender Linker dieser Art ist: Thr-Gly-(Glu oder Gln)-(Lys
oder Arg)-Pro-(Tyr oder Phe) (SEQ. ID. NR.: 78) (Agata et al., dito).
-
Dimerisierungsdomänen.
-
Ein
alternatives Verfahren zur Verknüpfung
von DNA-Bindungsdomänen
ist die Verwendung von Dimerisierungsdomänen, insbesondere von Heterodimerisierungsdomänen (siehe
z. B. Pomerantz et al. (1998) Biochemistry 37:965-970). Bei dieser
Umsetzung befinden sich die DNA-Bindungsdomänen auf
getrennten Polypeptidketten. Beispielsweise enthält ein erstes Polypeptid den
Code für
DNA-Bindungsdomäne
A, Linker und Domäne
B, während
ein zweites Polypeptid den Code für Domäne C, Linker und Domäne D enthält. Ein Fachmann
ist in der Lage, aus den vielen gut charakterisierten Dimerisierungsdomänen eine
Dimerisierungsdomäne
auszuwählen.
Falls Homodimere nicht gewünscht
werden, können
Domänen
verwendet werden, die die Heterodimerisierung begünstigen.
Eine besonders anpassbare Dimerisierungsdomäne ist das Coiled-Coil-Motiv,
z. B. eine dimere parallele oder anti-parallele Coiled-Coil-Struktur.
Coiled-Coil-Sequenzen, die bevorzugt Heterodimere bilden, sind ebenfalls
erhältlich
(Lumb and Kim, (1995) Biochemistry 34:8642-8648). Eine andere Art
von Dimerisierungsdomäne
ist eine, in der die Dimerisierung durch ein Kleinmolekül oder durch
ein Signalereignis ausgelöst
wird. Beispielsweise kann eine dimere Form von FK506 verwendet werden,
um zwei FK506-Bindungsprotein (FKBP)-Domänen zu dimerisieren. Dimerisierungsdomänen dieser
Art können
genützt
werden, um zusätzliche
Regulationsebenen vorzulegen.
-
Funktionsassays und deren
Anwendung
-
Zusätzlich zu
biochemischen Assays kann die Funktion einer Nukleinsäurebindungsdomäne oder
eines mit einem im vorliegenden Schriftstück beschriebenen Verfahren
, z. B. durch modularen Zusammenbau, gestalteten Proteins auch unter
In-vivo-Bedingungen in einem Assay getestet oder genutzt werden.
Beispielsweise können
Domänen
im Hinblick auf die Bindung an eine Zielstelle ausgewählt werden,
z. B. an eine Promoterstelle eines für die Zellproliferation notwendigen
Gens. Durch modularen Zusammenbau lässt sich ein Protein gestalten,
das (1) die ausgewählten
Domänen,
die an Unterstellen binden, die die Ziel-Promoterstelle überspannen,
und (2) eine DNA-Repressionsdomäne,
z. B. eine WRPW-Domäne,
beinhalten.
-
Eine
Nukleinsäuresequenz
mit dem Code für
ein gestaltetes Protein kann in einen Expressionsvektor kloniert
werden, z. B. in einen induzierbaren Expressionsvektor nach der
Beschreibung in Kang and Kim, (2000) J Biol Chem 275:8742. Der induzierbare
Expressionsvektor kann einen induzierbaren Promoter oder eine induzierbare
regulatorische Sequenz beinhalten. Nicht-einschränkende Beispiele für induzierbare
Promoter sind u. a. auf Steroidhormone ansprechende Promoter (z.
B. auf Ecdyson ansprechender Promoter, auf Östrogen ansprechender Promoter
und auf Glutakortikoid ansprechender Promoter), die Tetracyclin "Tet-On" und "Tet-Off"-Systeme und auf
Metalle ansprechende Promoter. Das Konstrukt kann in Gewebekulturzellen
oder in embryonische Stammzellen transfiziert werden, um einen transgenen
Organismus als einen Modellprobanden zu erzeugen. Die Wirksamkeit
des gestalteten Proteins kann durch Induktion der Expression des
Proteins und Assay der Zellproliferation der Gewebekulturzellen
oder Assay im Hinblick auf Änderungen
der Entwicklung und/oder ein Tumorwachstum in einem transgenen Tiermodell
bestimmt werden. Zusätzlich
kann ein Assay des Expressionsniveaus des Zielgens durch Routineverfahren
zum Nachweis von mRNA, z. B. PT-PCR oder Northern Blotting, durchgeführt werden.
Eine vollständigere
Diagnose beinhaltet die Aufreinigung von mRNA aus Zellen, die das
gestaltete Protein exprimieren bzw. nicht exprimieren. Die beiden
mRNA-Pools werden
als Sonden zur Testung eines Mikroarrays, das Sonden für eine große Sammlung
von Genen enthält,
z. B. eine Sammlung von relevanten Genen für den Zustand von Interesse
(z. B. Krebs) oder eine Sammlung von Genen, die im Genom des Organismus
identifiziert wurden, verwendet. Ein Assay dieser Art ist besonders
wertvoll zur Ermittlung der Spezifität des gestalteten Proteins.
Falls das Protein mit hoher Affinität, aber geringer Spezifität bindet,
kann es pleiotrope und unerwünschte
Wirkungen verursachen, indem es neben dem eigentlichen Ziel auch
die Expression von anderen Genen beeinflusst. Wirkungen dieser Art
treten bei einer globalen Transkriptanalyse hervor.
-
Zusätzlich kann
das gestaltete Protein in einer Probandenzelle oder einem Probandenorganismus
produziert werden, um ein endogenes Gen zu regulieren. Das gestaltete
Protein besitzt, wie vorstehend beschrieben, eine geeignete Konfiguration
für die
Bindung an eine Region des endogenen Gens und die Bereitstellung einer
Transkriptionsaktivierungs- oder -repressionsfunktion. Wie in Kang
and Kim (dito) beschrieben, kann die Expression einer Nukleinsäure mit
dem Code für
das gestaltete Protein auf operative Weise mit einem induzierbaren
Promoter verknüpft
werden. Durch Modulation der Konzentration des Inducers für den Promoter kann
die Expression des endogenen Gens auf eine konzentrationsabhängige Weise
reguliert werden.
-
Assay der Bindungsstellenpräferenz
-
Die
Bindungsstellenpräferenz
jeder einzelnen Domäne
lasst sich durch einen biochemischen Assay, wie EMSA, DNAse Footprinting,
Surface Plasmon Resonance oder Säulenbindung,
bestätigen.
Bei dem Bindungssubstrat kann es sich um ein die Zielstelle abdeckendes
synthetisches Oligonukleotid handeln. Der Assay kann auch nicht-spezifische
DNA-Sequenzen als einen Kompetitor oder spezifische DNA-Sequenzen
als einen Kompetitor enthalten. Spezifische Kompetitor-DNAs können u.
a. die Erkennungsstelle mit einer, zwei oder drei Nukleotidmutationen
sein. Somit kann ein biochemischer Assay zur Messung nicht nur der
Affinität einer
Domäne
für eine
gegebene Stelle, sondern auch ihrer Affinität für die Stelle relativ zu anderen
Stellen verwendet werden. Rebar and Pabo, (1994) Science 263:671-673
beschreiben ein Verfahren zum Erhalt von scheinbaren Kd-Konstanten
für Zinkfingerdomänen mittels
EMSA.
-
Nachfolgend
wird die vorliegende Erfindung anhand der folgenden praktischen
Beispiele näher
erläutert.
Dabei ist jedoch anzumerken, dass diese Beispiele nicht dazu gedacht
sind, den Gültigkeitsbereich
der vorliegenden Erfindung einzuschränken.
-
Beispiel 1: Konstruktion von Plasmiden
für die
Expression von Hybridtranskriptionsfaktoren
-
Ein
Expressionsplasmid, das einen Zinkfinger-Transkriptionsfaktor exprimiert,
wurde durch Modifikation von pPC86 hergestellt (Chevray and Nathans,
(1991) Proc. Natl. Acad. Sci. USA 89:5789-5793). Die DNA-Manipulationen
wurden entsprechend der Beschreibung von Ausubel et al. (Current
Protocols in Molecular Biology (1998), Wiley and Sons, Inc.) vorgenommen.
Ein DNA-Fragment
mit dem Code für
das Zinkfingerprotein Zif268 wurde zwischen die Sall- und EcoRI-Erkennungsstellen
von pPC86 eingefügt,
um pPCFM-Zif zu erzeugen. Dieser Klonierungsschritt ergibt ein Translationsfusionsprotein
mit dem Code für
die Gal4-Aktivierungsdomäne
von Hefe gefolgt von den drei Zinkfingern von Zif268. Transformation
von pPCFM-Zif in Hefezellen hinein führte zur Expression eines Hybridtranskriptionsfaktors,
der die Gal4-Aktivierungsdomäne von Hefe
und die Zinkfinger von Zif268 umfasst. Die DNA-Sequenz mit dem Code für das Zinkfingerprotein
Zif268 in der in pPCFM-Zif hinein klonierten Form ist in 9 dargestellt.
-
Das
Plasmid pPCFMS-Zif wurde als Vektor zur Konstruktion von Bibliotheken
von Zinkfingerdomänen genutzt
(8). Zur Konstruktion von pPCFMS-Zif wurde eine
Oligonukleotidkassette, die einen Stop-Codon und eine PstI-Erkennungsstelle
enthielt, vor der Finger 3-kodierenden Region von pPCFM-Zif eingefügt. Die Oligonukleotidkassette
wurde durch Annealing zweier synthetischer Oligonukleotide gebildet:
5'-TGCCTGCAGCATTTGTGGGAGGAAGTTTG-3' (SEQ. ID. NR.: 79)
und 5'-ATGCTGCAGGCTTAAGGCTTCTCGCCGGTG-3' (SEQ. ID. NR.: 80).
Die Erzeugung von Plasmiden in der Bibliothek mit dem Code für Finger
3 von Zif268 wurde durch Einfügen
eines Stop-Codons verhindert.
-
Das
Plasmid wurde als ein Vektor zur Erzeugung von Zinkfingerdomänen-Bibliotheken nach
der Beschreibung im nachfolgenden "Beispiel 2" verwendet.
-
Zusätzlich wurde
ein „Gap
Repair Cloning" der
DNA-Sequenzen mit dem Code für
individuelle Zinkfingerdomänen
nach der Beschreibung von Hudson et al., ((1997) Genome Research
7:1169-1173) mit geringfügigen
Modifikationen durchgeführt.
-
Zur
Klonierung einer einzelnen Zinkfingerdomäne wurden zwei überlappende
Oligonukleotide synthetisiert. Jedes Oligonukleotid besaß an seinem
5'-Ende einen 21
Nukleotide langen gemeinsamen Tail für die zweite Runde PCR (rePCT)
und eine spezifische Sequenz, die durch Annealing an die Nukleinsäure mit
dem Code für
die einzelne Zinkfingerdomäne
band. Bei den Sequenzen für
den Vorwärts-
und den Rückwärts-Primer
handelte es sich um
5'-ACCCACACTGGCCAGAAACCCN48-51-3' (SEQ.
ID. NR.: 108) und 5'-GATCTGAATTCATTCACCGGTN42-45-3' (SEQ.
ID. NR.: 109), wobei N48-51 und N42-45 der maßgeschneiderten Sequenz zum
Annealing an die Nukleinsäure
mit dem Code für
die Zinkfingerdomäne
entspricht. Doppelstrang-DNA
wurde durch Amplifikation von Template-Nukleinsäure mit einer äquimolaren
Mischung zweier Oligonukleotide hergestellt. Die PCR-Bedingungen bestanden
aus einem ersten Zyklus bei 94°C
für 3 Minuten gefolgt
von 5 Zyklen bei 94°C
für 1 Minute,
bei 50°C
für 1 Minute
und bei 72°C
für 30
Sekunden.
-
Die
Doppelstrang-DNA mit dem Code für
die einzelnen Zinkfingerdomänen
wurde dann als Template in einer zweiten Runde PCR verwendet. Die
rePCR-Primer besaßen zwei
Regionen – eine
Region, die mit dem Hefevektor pPCFM-Zif identisch ist, und eine zweite Region,
die mit der vorstehend beschriebenen gemeinsamen Tail-Sequenz mit
einer Länge
von 21 Nukleotiden identisch ist. Die Sequenz des Vorwärts-Primers
war wie folgt:
5'-TGTCGAATCTGCATGCGTAACTTCAGTCGTAGTGACCACCTTACCACCCA
C ATCCGGACCCACACACTGGCCAGAAACCC-3'
(SEQ. ID. NR.: 138) und die Sequenz
des Rückwärts-Primers
war wie folgt:
5'-GGTGGCGGCCGTTACTTACTTAGAGCTCGACGTCTTACTTACTTAGC
GGCCGCACTAGTAGATCTGAATTCATTCACCGGT-3'
(SEQ. ID. NR.: 139). Die Reaktionsmischung
enthielt 2,5 pmol eines jeden Primers, 1,5 mM Mg2+,
2 Einheiten Taq-Polymerase und 0,01 Einheiten Pfu-Polymerase in 25
ul. Die Reaktionen wurden bei 94°C
für eine
Dauer von 3 Minuten durchgeführt
und anschließend
20 Zyklen bei 94°C
für 1 Minute,
bei 65°C
für 1 Minute
und bei 72°C
für 30
Sekunden unterzogen. Das „Gap
Repair Cloning" wurde
durch Transformation der Mischung aus dem rePCR-Produkt und linearisiertem
pPCFM-Zif-Vektor, der mit MscI und EcoRI verdaut worden war, in
Hefezellen des Typs YW1 durchgeführt.
Die zu dem Hefevektor pPCFM- Zif
identische Region erlaubt die homologe Rekombination mit dem Vektor
in den Zellen.
-
Beispiel 2: Konstruktion der Zinkfingerdomänen-Bibliothek
-
Eine
Plasmidbibliothek von natürlich
vorkommenden Zinkfingerdomänen
wurde durch Klonierung von Zinkfingerdomänen aus dem menschlichen Genom
hergestellt. DNA-Segmente mit dem Code für Zinkfingerdomänen wurden
unter Verwendung von PCR und degenerierten Oligonukleotidprimern
aus als Template dienender humaner Genom-DNA (bei Promega Corporation,
Madison, WI, USA käuflich
erworben) amplifiziert. Die DNA-Sequenzen der degenerierten PCR-Primer,
die zur Klonierung von menschlichen Zinkfingerdomänen verwendet
wurden, waren wie folgt:
5'-GCGTCCGGACNCAYACNGGNSARA-3' (SEQ. ID. NR.: 81)
und
5'-CGGAATTCANNBRWANGGYYTYTC-3' (SEQ. ID. NR.: 82),
wobei
R G und A darstellt, B G, C und T darstellt, S G und C darstellt,
W A und T darstellt, Y C und T darstellt und N A, C, G und T darstellt.
-
Die
degenerierten PCR-Primer binden durch Annealing an Nukleinsäuresequenzen
mit dem Code für ein
Aminosäureprofil,
His-Thr-Gly-(Glu
oder Gln)-(Lys oder Arg)-Pro-(Tyr oder Phe) (SEQ. ID. NR.: 83),
das an der Kreuzung zwischen Zinkfingerdomänen in zahlreichen natürlich vorkommenden
Zinkfingerproteinen zu finden ist (Agata et al. (1998) Gene 213:55-64).
-
Die
Pufferzusammensetzung bei der PCR-Reaktion war wie folgt: 50 mM
KCl, 3 mM MgCl2, 10 mM Tris pH 8,3. Es wurde
Taq-DNA-Polymerase zugegeben und die Reaktionsmischung bei 94°C für 30 Sekunden,
bei 42°C
für 60
Sekunden und dann bei 72°C
für 30
Sekunden inkubiert. Dieser Zyklus wurde 35-fach wiederholt und anschließend eine
Endinkubation bei 72°C
für 10
Minuten durchgeführt.
-
Die
PCR-Produkte wurden wie folgt in pPCFMS-Zif hinein kloniert: Die
PCR-Produkte wurden
einer Elektrophorese unterzogen und die DNA-Segmente, die ungefähr 120 bp
entsprachen, wurden isoliert. Nach der Verdauung mit BspEI und EcoRI,
wurden die DNA-Segmente mit einer Größe von 120-bp in pPCFMS-Zif ligiert.
Folglich besteht die DNA-Bindungsdomäne des Hybridtranskriptionsfaktors,
der von dieser Plasmidbibliothek kodiert wird, aus Finger 1 und
Finger 2 von Zif268 und einer aus dem menschlichen Genom abgeleiteten
Zinkfingerdomäne.
Die Plasmidbibliothek wurde aus insgesamt 106 Escherichia
coli-Transformanten hergestellt. Bei diesem Ansatz zur Bibliothekskonstruktion
bleibt die natürlich
vorkommende Linkersequenz, die zwischen Zinkfingerdomänen zu finden
ist, erhalten.
-
Beispiel 3: Konstruktion der Zinkfingerdomänen-Bibliothek
-
Ein
Bibliothek von mutierten Zinkfingerdomänen wurde durch zufallsbestimmte
Mutagenese hergestellt. Dabei wurde Finger 3 von Zif268 als ein
Polypeptidgerüst
verwendet. Die zufallsbestimmten Mutationen wurden an den Positionen
-1, 2, 3, 4, 5 und 6 entlang der α-Helix
eingeführt,
die dem ArGlnin an Position 73, AsparaGlnsäure an Position 75, Glutaminsäure an Position
76, ArGlnin an Position 77, Lysin an Position 78 und ArGlnin an
Position 79 von SEQ. ID. NR.: 21 (innerhalb von Finger 3 von Zif268)
entsprechen.
-
An
jeder der Nukleinsäuresequenzpositionen
mit dem Code für
diese Aminosäuren
wurde ein randomisierter Codon, 5'-(G/A/C) (G/A/C/T) (G/C)-3', eingeführt. Dieser
randomisierte Codon enthält
den Code für 16
verschiedene Aminosäuren
(mit Ausnahme von vier Aminosäuren:
Tryptophan, Tyrosin, Cystein und Phenylalanin). Ebenfalls ausgeschlossen
sind alle drei möglichen
Stop-Codons. Die randomisierten Codons wurden mit einer Oligonukleotidkassette
eingeführt,
die aus zwei Oligonukleotiden konstruiert wurde:
5'-GGGCCCGGGGAGAAGCCTTACGCATGTCCAGTCGAATCTTGTGAT
AGAAGATTC-3' (SEQ.
ID. NR.: 84) und
5'-CTCCCCGCGGTTCGCCGGTGGGATTCTGATATGSNBSNBAAGSNB
SNBSNBSNBTGAGAATCTTCTATCACAAG-3' (SEQ.
ID. NR.: 85),
wobei B G, T und C darstellt, S G und C darstellt
und N A, G, C und T darstellt.
-
Nach
dem Annealing dieser beiden Oligonukleotide wurde die DNA-Duplexkassette durch
Reaktion mit Klenow-Polymerase für
eine Dauer von 30 Minuten synthetisiert. Nach Verdauung mit AvaI
und SacII wurde der DNA-Duplex
in pPCFMS-Zif268, das mit SgrAI und SacII verdaut worden war, ligiert.
Von ungefähr
109 E. coli-Transformanten wurden Plasmide
isoliert.
-
Beispiel 4: Konstruktion von Reporterplasmiden
-
Reporterplasmide,
u. a. mit dem HIS3-Gen von Hefe, wurden durch Modifikation von pRS315His (Wang
and Reed (1993) Nature 364:121-126) hergestellt. Die Reporterplasmide
enthalten auch den Marker LEU2 unter Kontrolle seines natürlichen
Promoters, damit Transformanten, die das Plasmid tragen, selektiert werden
können.
Zunächst
wurde die SalI-Erkennungsstelle in pRS315His durch Ligation des
kleinen Fragments von pRS315His nach Verdauung mit SalI und BamHI
und des großen
Fragments von pRS315His nach Verdauung mit BamHI und XhoI, entfernt,
so dass sich pRS315HisΔ Sal
ergab. Anschließend
wurde innerhalb der Promoterregion des HIS3-Gens eine neue SalI-Erkennungsstelle
erzeugt, indem ein Oligonukleotidduplex zwischen der BamHI- und
der SmaI-Stelle in pRS315HisΔ Sal
eingefügt
wurde. Bei den Sequenzen der beiden Oligonukleotide, die durch Annealing
aneinander gebunden wurden, um den eingefügten Duplex zu erzeugen, handelt
es sich um:
5'-CTAGACCCGGGAATTCGTCGACG-3' (SEQ. ID. NR.: 86)
und
5'-GATCCGTCGACGAATTCCCGGGT-3' (SEQ. ID. NR.: 87).
-
Das
auf diese Weise erhaltene Plasmid erhielt die Bezeichnung pRS315HisMCS.
-
Multiple
Reporterplasmide wurden durch Einfügen von gewünschten zusammengesetzten Sequenzen in
pRS315HisMCS produziert. Die zusammengesetzten Sequenzen werden
in Form eines Tandem-Arrays, der vier Kopien der zusammengesetzten
Sequenz enthält,
eingefügt.
Die Zielsequenzen wurden aus 10-bp-DNA-Sequenzen abgeleitet (6),
die in der LTR-Region von HIV-1 zu finden sind:
5'-GAC ATC GAG C-3' (SEQ.
ID. NR.: 1) HIV-1 LTR (-124/-115)
5'-GCA GCT GCT T-3' (SEQ. ID. NR.: 2) HIV-1 LTR (-23/-14)
5'-GCT GGG GAC T-3' (SEQ. ID. NR.: 3)
HIV-1 LTR (-95/-86)
bzw. im Promoter des menschlichen CCR5-Gens
zu finden sind:
5'-AGG
GTG GAG T-3' (SEQ. ID. NR.: 4) human CCR5 (-70/-79)
5'-GCT GAG ACA T-3' (SEQ. ID. NR.: 5)
human CCR5 (+7/+16).
-
Jede
dieser 10-bp-Sequenzen kann in 4-bp-Zielstellenkomponenten zergliedert
werden, um eine Zinkfingerdomäne
zu identifizieren, die alle Regionen der Stelle erkennt. Unter Verwendung
des modularen Zusammenbauverfahrens können Zinkfingerdomänen dieser
Art miteinander gekoppelt werden, um ein DNA-Bindungsprotein zu
erzeugen, das die Stelle unter In-vivo-Bedingungen erkennt.
-
Die
unterstrichenen Teile in 6 zeigen
Beispiele von 4-bp-Zielsequenzen. Jeder dieser 4-bp-Zielsequenzen
wurde mit der 5-bp-Rekrutierungssequenz, 5'-GGGCG-3', verbunden, die
von Finger 1 und Finger 2 von Zif268 erkannt wird. Die sich auf
diese Weise ergebenden 9-bp-Sequenzen stellen zusammengesetzte Bindungssequenzen
dar. Jede zusammengesetzte Bindungssequenz besitzt das folgende
Format:
5'-XXXXGGGCG-3', wobei XXXX die
4-bp-Zielsequenz und das benachbarte 5'-GGGCG-3' die Rekrutierungssequenz
darstellt.
-
In 7 sind
die DNA-Sequenzen der eingefügten
Tandem-Arrays aus zusammengesetzten Bindungsstellen aufgeführt, die
jeweils auf operative Weise mit dem Reportergen in pRS315HisMCS
verbunden waren. Jeder Tandem-Array enthält 4 Kopien einer zusammengesetzten
Bindungssequenz. Für
jede Bindungsstelle wurden zwei Oligonukleotide synthetisiert, durch
Annealing aneinander gebunden und, nach Restriktion an der Sall-
und der XmaI-Stelle, in pRS315HisMCS hinein ligiert, um ein Reporterplasmid
zu ergeben.
-
Beispiel 5: Konstruktion von Reporterplasmiden
-
Ein
Satz Reporterplasmide, die ein Reporterpaar (einer mit lacZ und
der andere mit HIS3) für
jede 3-bp-Unterstelle beinhalten, wurde auf die folgende Weise konstruiert:
Zur Konstruktion von Reporterplasmiden wurden die gewünschten
Zielssequenzen in pRS315HisMCS und pLacZi eingefügt. Für jede 3-Basenpaar-Zielstelle wurden zwei Oligonukleotide
synthetisiert, durch Annealing aneinander gebunden und in die SalI
und XmaI-Stelle von pRS315HisMCS und von pLacZi eingefügt, um Reporterplasmide
herzustellen.
-
Die
DNA-Sequenzen der Oligonukleotide waren wie folgt:
5'-CCGGT NNNTGGGCG
TAC NNNTGGGCG TCA NNNTGGGCG-3' (SEQ.
ID. NR.: 88) und 5'-TCGA
CGCCCANNN TGA CGCCCANNN GTA CGCCCANNN A-3' (SEQ. ID. NR.: 89). Insgesamt wurden
64 Oligonukleotidpaare synthetisiert und in die beiden Reporterplasmide
eingefügt.
-
Beispiel 6: Auswahl von Zinkfingerdomänen mit
gewünschter
DNA-Bindungsspezifität
-
Zur
Auswahl von Zinkfingerdomänen,
die an gegebene Zielsequenzen spezifisch binden, wurden Hefezellen
zuerst mit einem Reporterplasmid und anschließend mit einer Bibliothek von
Hybridplasmiden mit dem Code für
Hybridtranskriptionsfaktoren transformiert. Die Hefe-Transformation
und Screeningverfahren wurden entsprechend der Beschreibung von
Ausubel et al. (Current Protocols in Molecular Biology (1998), Wiley
and Sons, Inc.) vorgenommen. Es wurde der Hefe-Stamm yWAM2 verwendet
(MATα (alpha) Δ gal4 Δ gal80 URA3::GAL1-lacZ
lys2801 his3-Δ 200
trp1-Δ 63
leu2 ade2-101CYH2).
-
In
einem Fall wurden Hefezellen zuerst mit einem Reporterplasmid transformiert,
das die zusammengesetzte Bindungssequenz 5'-GAGCGGGCG-3' (die 4-bp-Zielsequenz ist unterstrichen)
enthält,
die auf operative Weise mit dem Reportergen verknüpft war.
Anschließend
wurde die durch zufallsbestimmte Mutagenese hergestellte Plasmidbibliothek
von mutierten Zinkfingerdomänen
in die transformierten Hefezellen eingeführt. Ungefähr 106 Kolonien
wurden in einem Medium erhalten, dem sowohl Leucin als auch Tryptophan
fehlte. Da das Reporterplasmid und die Zinkfingerdomänen-Expressionsplasmide
die Hefegene LEU2 bzw. TRP1 als Marker enthalten, wurden die Hefezellen
in einem Medium gezüchtet,
dem sowohl Leucin als auch Tryptophan fehlte, um Zellen zu selektieren,
die sowohl das Reporter- als auch das Zinkfingerdomänen-Expressionsplasmid
enthalten.
-
Bei
einer Umsetzung wurde die aus dem menschlichen Genom abgeleitete
Zinkfingerdomänen-Bibliothek
in Zellen transformiert, die die Reporterplasmide tragen. Die Transformation
wurde mit fünf
verschiedenen Wirtszellstämmen
durchgeführt,
wobei jeder Stamm eine von fünf
verschiedenen Zielsequenzen in operativer Verknüpfung mit dem Reportergen enthielt.
Pro Transformation wurden ungefähr
105 Kolonien in einem Medium erhalten, dem
sowohl Leucin als auch Tryptophan fehlte. Die Transformanten wurden
auf Petrischalen gezüchtet,
die synthetisches Medium ohne Leucin und Tryptophan enthielten.
Nach der Inkubation wurden transformierte Zellen durch Anwendung
einer 10%-igen sterilen
Glycerinlösung
auf die Platten gesammelt, dabei die Kolonien in die Lösung gekratzt
und die Lösung
anschließend
abgezogen. Die Zellen wurden in Form von Teilmengen in der Glycerinlösung in
gefrorenem Zustand aufbewahrt. Eine einzelne Teilmenge wurde auf ein
Medium ohne Leucin, Tryptophan und Histidin gegeben. Zu dem Wachstumsmedium
wurde 3-Aminotriazol (AT)
in Endkonzentrationen von 0, 0,03, 0,1 und 0,3 mM zugegeben. AT
ist ein kompetitiver Hemmstoff von His3 und dient zur Titration
der Empfindlichkeit des HIS3-Selektionssystems. AT unterdrückte die
Basalaktivität von
His3. Eine Basalaktivität
dieser Art kann durch "undichte" Expression des HIS3-Gens
auf dem Reporterplasmid entstehen. Aus den ungefähr 107 Hefezellen,
die auf das Medium gegeben wurden, wuchs eine dreistellige Anzahl
von Kolonien in dem selektiven Medium, dem AT fehlte. Die Anzahl
der Kolonien zeigte einen schrittweisen Abfall mit steigender AT-Konzentration. In
dem selektiven Medium, das 0,3 mM AT enthielt, wuchsen eine zweistellige
Anzahl von Kolonien. Sowohl aus dem Medium ohne AT als auch aus
dem 0,3 mM AT enthaltenden Medium wurden auf zufallsbestimmte Weise
mehrere Kolonien ausgewählt.
Aus den Hefezellen wurden die Plasmide isoliert und in Escherichia
coli-Stamm KC8 (pyrF leuB600 trpC hisB463) hinein transformiert.
Die Plasmide mit dem Code für
Zinkfinger-Transkriptionsfaktoren wurden isoliert und die DNA-Sequenzen
von ausgewählten
Zinkfingerdomänen
wurden ermittelt.
-
Die
Aminosäuresequenz
der einzelnen ausgewählten
Zinkfingerdomänen
wurden aus der DNA-Sequenz abgeleitet. Die Bezeichnungen der Zinkfingerdomänen orientierten
sich an den vier Aminosäureresten an
Basekontaktierenden Positionen, nämlich den Positionen -1, 2,
3 und 6 entlang der alpha-Helix. Die Ergebnisse sind in Tabelle
1 dargestellt. Die Bezeichnungen der identifizierten Zinkfingerdomänen richten
sich nach den vier Aminosäuren
an den Base-kontaktierenden Positionen. Eine Analyse der Sequenzen
ergab, dass in einigen Fällen
die selbe Zinkfingerdomäne
wiederholt erhalten worden war. Die Zahlen in den Klammern in Tabelle
1 geben an, wie häufig
die selbe Zinkfingerdomäne
erhalten wurde. Beispielsweise wurden zwei Zinkfingerdomänen mit
CSNR an den vier Base-kontaktierenden Positionen identifiziert und
festgestellt, dass diese an die Nukleinsäurestelle GAGC binden (siehe
Spalte 3, "GAGC/Humangenom"). Tabelle
1
- * Die 4-Buchstaben-Bezeichnungen in den
sechs rechten Spalten sind Deskriptoren für die Zinkfingerdomänen, die
für die
einzelnen Zielsequenzen isoliert wurden. Diese Bezeichnungen geben
zwar die Aminosäurereste
an Base-kontaktierenden Positionen an, es handelt sich aber nicht
um Polypeptidsequenzen.
-
Die
vollständigen
DNA-Sequenzen mit dem Code für
ausgewählte
humane Zinkfingerdomänen
und deren übersetzte
Aminosäuresequenzen
sind in 11 dargestellt. Die komplementär DNA-Sequenz
zu den degenerierten PCR-Primern,
die zur Amplifikation von DNA-Segmenten mit dem Code für Zinkfingerdomänen im menschlichen
Genom verwendet wurden, sind durch Unterstreichung dargestellt.
Diese Sequenz kann von der ursprünglichen
Basensequenz der berichteten Humangenomsequenz entweder durch Allelunterschiede oder
durch Veränderungen,
die bei der Amplifikation eingeführt
wurde, abweichen.
-
Bei
den meisten Human-Zinkfingerdomänen,
die durch Screening nach dem Verfahren der vorliegenden Erfindung
identifiziert wurden, handelte es sich entweder um neuartige Polypeptide
oder sie entsprachen anonymen offenen Leserastern. Zum Beispiel
Zinkfingerdomänen
mit der Bezeichnung HSNK (in der Sequenz enthalten, die in der GenBank
Zugangsnummer AF155100 berichtet wird) und VSTR (in der Sequenz
enthalten, die in der GenBank Zugangsnummer AF02577 berichtet wird)
wurden in Proteinen gefunden, deren Funktion bisher unbekannt ist.
Die im vorliegenden Schriftstück
beschriebenen Ergebnisse weisen nicht nur darauf hin, dass diese
Zinkfingerdomänen
als sequenzspezifische DNA-Bindungsdomänen funktionieren können, sondern
dokumentieren auch deren bevorzugte Bindungsstellenpräferenz im
Kontext von chimären
Proteinen.
-
Darüber hinaus
belegt die vorliegende Erfindung, dass aus dem Humangenom erhaltene
Zinkfingerdomänen
als modulare Bausteine zur Konstruktion von neuartigen DNA-Bindungsproteinen
verwendet werden können.
Human-Zinkfingerdomänen der
vorliegenden Erfindung wurden infolge ihrer Funktionstüchtigkeit
unter In-vivo-Bedingungen bei Verbindung mit dem C-Terminus von Finger
1 und Finger 2 von Zif268 erhalten. Folglich sind die identifizierten
Zinkfingerdomänen
in der Lage, spezifische Sequenzen in einem künstlichen Kontext erkennen
und eignen sich als modulare Bausteine zur Gestaltung von synthetischen
Transkriptionsfaktoren.
-
Beispiel 7: Paarweise Paarungen
-
Um
die Identifizierung von Zinkfingerdomänen, die an die einzelnen 3-Basenpaar-Zielstelle
binden, zu ermöglichen,
wurde die Hefepaarung verwendet, um keine wiederholten Transformationen
von Hefezellen zu benötigen
und mit einer einzelnen Transformation nach positiven Bindern für jedes
einzelne der 64 Reporterkonstrukte suchen zu können. Es wurden zwei Hefestämme verwendet:
YW1 (Paarungstyp MATα)
und YPH499 (Paarungstyp MATa). YW1 wurde durch Selektion eines Klons,
der gegenüber
5- Fluororotsäure (FOA)
resistent war, aus yWAM2 abgeleitet, um ein ura3-Derivat von yWAM2
zu erzeugen.
-
Die
Plasmidbibliothek von Zinkfingerdomänen wurde durch Hefetransformation
in die YW1-Zellen eingeführt.
Zellen von ungefähr
106 unabhängig transformierten Kolonien
wurden durch Abkratzen der Platten mit einer 10% Glycerinlösung gesammelt.
Die Lösung
wurde in Form von Teilmengen eingefroren. Jedes Paar von 64 Reporterplasmiden
(abgeleitet von pLacZi oder pRS315His) wurden außerdem in den Hefestamm YPH499 ko-transfiziert.
Die Transformanten, die beide Reporterplasmide enthalten, wurden
geerntet und eingefroren.
-
Nach
dem Auftauen wurden die Hefezellen auf Minimalmedium bis zur Mitte
der logarithmischen Phase gezüchtet.
Anschließend
wurden die beiden Zelltypen gemischt und die Paarung konnte in YPD
für eine Dauer
von 5 h ablaufen. Diploide Zellen wurden auf Minimalmedium, das
X-gal und AT (1 mM) enthielt, dem aber Tryptophan, Leucin, Uracil
und Histidin fehlten, selektiert. Nach mehreren Tagen wurden blaue
Kolonien isoliert, die auf den Selektivplatten gewachsen waren.
Aus blauen Kolonien wurden die Plasmide mit dem Code für Zinkfingerdomänen isoliert
und die DNA-Sequenzen der ausgewählten
Zinkfingerdomänen
wurden ermittelt.
-
Die
aus den blauen Kolonien isolierten Nukleinsäuren wurden einzeln in YW1-Zellen re-transformiert. Für jede einzelne
isolierte Nukleinsäure
wurden retransformierte YW1-Zellen auf einer 96-Well-Platte mit YPH499-Zellen
gepaart, die jeweils eines der 64 Reporterplasmide enthielten und
anschließend
auf Minimalmedium gegeben, das X-gal enthielt, dem aber Tryptophan
und Uracil fehlten. Die DNA-Bindungsaffinitäten und -spezifitäten einer
Zinkfingerdomäne
für 64
Zielsequenzen wurde anhand der Intensität der blauen Farbe ermittelt.
Kontrollversuche mit den Zinkfingerdomänen von Zif268 wiesen darauf
hin, dass sich bei positiven Wechselwirkungen zwischen einer Zinkfingerdomäne und einer
Bindungsstelle dunkle- bis blass-blaue Kolonien ergaben (wobei die
Intensität
der blauen Farbe zur Bindungsaffinität proportional ist) und dass
sich bei negativen Wechselwirkungen weiße Kolonien ergaben.
-
Beispiel 8: Vergleich von identifizierten
Zinkfingerdomänen
mit einem Wechselwirkungscode
-
Die
Aminosäurereste
von ausgewählten
Zinkfingerdomänen
an den kritischen Base-kontaktierenden Positionen wurden mit denen,
die nach dem Zinkfingerdomänen-DNA-Wechselwirkungscode
(3) erwartet wurden, verglichen. Die meisten Zinkfingerdomänen zeigten
erwartete Muster, d. h. die Aminosäurereste an den kritischen
Positionen entsprechen den Vorhersagen aus dem Code sehr gut.
-
Zum
Beispiel handelt es sich bei den Konsens-Aminosäureresten in Zinkfingerdomänen, die
aus der durch zufallsbestimmte Mutagenese erzeugten Bibliothek ausgewählt wurden,
um R (Arg, 7 von 14) oder K (Lys, 2 von 14) an der Position -1,
um N (Asp, 6 von 14) an Position 3 und um R (9 von 14) an Position
6 (Tabelle 1). Diese Zinkfingerdomänen wurden mit dem GAGC-Plasmid ausgewählt. (Das
Reporterplasmid, in dem die zusammengesetzte Bindungssequenz, 5'-GAGCGGGCG-3', auf operative Weise
mit dem Reportergen verknüpft
ist, wird als GAGC-Plasmid bezeichnet. Dementsprechend werden die
anderen Reporterplasmide, in denen die Sequenz, 5'-XXXXGGGCG-3', auf operative Weise mit dem Reportergen
verknüpft
ist, als XXXX-Plasmide bezeichnet.) Diese Aminosäurereste an kritischen Base-kontaktierenden
Positionen entsprechen genau den Erwartungen aus dem Code. [Die
meisten Zinkfingerdomänen
im Humangenom enthalten S (Serin) an Position 2 und ein Serinrest
ist in der Lage, zu jeder der vier Basen eine Wasserstoffbindung
auszubilden. Daher wird der Effekt dieser Position nachfolgend nicht
weiter berücksichtigt.
Außerdem
ist bekannt, dass die Reste an Position 2 üblicherweise nur eine untergeordnete
Rolle bei der Basenerkennung spielen (Pavletich and Pabo, (1991)
Science 252:809-817).]
-
Auch
die Aminosäurereste
in Zinkfingerdomänen,
die aus dem Humangenom erhalten wurden, entsprechen den Erwartungen
aus dem Code sehr gut. Zum Beispiel handelt es sich bei den Konsens-Aminosäureresten
an den Positionen -1, 3 und 6 in den mit dem GAGC-Plasmid erhaltenen
Zinkfingerdomänen
um R, N und R (Tabelle 1, Spalte 3). Dies sind genau die Aminosäuren, die
nach dem Code erwartet werden.
-
Bei
den Aminosäureresten
an den Positionen -1, 3 und 6 in den mit dem GCTT-Plasmid erhaltenen Zinkfingerdomänen handelte
es sich um V, T und R (Tabelle 1, Spalte 4). Die Reste T und R entsprechen
genau den Erwartungen aus dem Code. Bei den nach dem Code vorhergesagten
Aminosäurereste
an der Position -1, die mit der Base T (unterstrichen) der GCTT-Stelle
in Wechselwirkung treten würden,
handelt es sich um L, T oder N. Die VSTR-Zinkfingerdomäne, die mit dem GCTT-Plasmid
ausgewählt
wurde, enthielt V (Valin), eine hydrophobe Aminosäure mit Ähnlichkeit
zu L (Leucin) an dieser Position.
-
Insgesamt
entsprechen die Aminosäurereste
in ausgewählten
Zinkfingerdomänen
den Vorhersagen aus dem Code an mindestens zwei Positionen der drei
kritischen Positionen. Die nach dem Code in ausgewählten Zinkfingerdomänen zu erwartenden
Aminosäurereste
sind in Tabelle 1 unterstrichen dargestellt. Diese Ergebnisse sind
ein deutlicher Hinweis darauf, dass das im vorliegenden Schriftstück offengelegte
In-vivo-Auswahlsystem auf die erwartete Weise funktioniert.
-
Beispiel 9: Re-Transformation und Kreuztransformation
-
Um
die Möglichkeit
von falsch positiven Ergebnissen auszuschließen und die Sequenzspezifität des vorstehend
beschriebenen Zinkfingerproteins zu untersuchen, wurden Hefezellen
mit den isolierten Plasmiden re-transformiert und kreuztransformiert.
-
Hefezellen
wurden zuerst mit einem Reporterplasmid und einem Hybridplasmid
mit dem Code für
eine Zinkfingerdomäne
ko-transformiert. Minimalmedium, dem Leucin und Tryptophan fehlte,
wurde mit den Hefetransformanten beimpft und für eine Dauer von 36 Stunden
inkubiert. Ungefähr
1000 Zellen im Wachstumsmedium wurden in Form von Spots direkt auf
Festmedium, dem Leucin, Tryptophan und Histidin fehlten (in 10 als -Histidin bezeichnet), und auf Festmedium,
dem Leucin und Tryptophan fehlten (in 10 als
+Histidin bezeichnet) aufgetragen. Anschließend wurden diese Zellen für eine Dauer
von 50 Stunden bei 30°C
inkubiert. Die Ergebnisse sind in 10 dargestellt.
-
Es
ist zu erwarten, dass Kolonien in dem Medium ohne Histidin wachsen
können,
wenn der Zinkfingerteil des Hybridtranskriptionsfaktors an die zusammengesetzte
Bindungssequenz bindet und auf diese Weise die Aktivierung der Expression
des HIS3-Reportergens durch den Hybridtranskriptionsfaktor erlaubt.
In dem Medium ohne Histidin können
keine Kolonien wachsen, wenn der Zinkfingerteil des Hybridtranskriptionsfaktors nicht
an die zusammengesetzte Bindungssequenz bindet.
-
Wie
in 10 dargestellt, waren die isolierten Zinkfingerdomänen in der
Lage, an entsprechende Zielsequenzen zu binden und zeigten dabei
eine Sequenzspezifität,
die sich deutlich von der von Zif268 unterschied. Zif268 zeigte
eine höhere
Aktivität
mit dem GCGT-Plasmid als mit den fünf anderen Plasmiden, und eine
relativ hohe Aktivität
mit dem GAGT-Plasmid. Stämme
mit Reportern, die andere Bindungsstellen enthielten und das Protein
Zif268 exprimierten, bildeten keine Kolonien.
-
Die
KTNR-Zinkfingerdomäne,
die aus der durch zufallsbestimmte Mutagenese hergestellten Bibliothek
isoliert worden war, war ursprünglich
mit dem GAGC-Plasmid
ausgewählt
worden. Wie erwartet wurden nur mit dem GAGC-Plasmid Kolonien gebildet.
Auch Zinkfingerdomänen
aus der Bibliothek, die aus dem Humangenom abgeleitet war, zeigten
die erwartete Spezifität.
Zum Beispiel HSNK, die mit dem GACT-Plasmid ausgewählt worden
war, erlaubte das Wachstum von Zellen nur, wenn das GACT-Plasmid
in Hefezellen retransformiert worden war. VSTR, die mit dem GCTT-Plasmid
ausgewählt
worden war, zeigte die höchste
Aktivität
mit dem GCTT-Plasmid. RDER, die mit dem GACT-Plasmid ausgewählt worden
war, hatte die selben Aminosäurereste
an den vier Base-kontaktierenden Positionen wie Finger 3 von Zif268.
Wie erwartet zeigte diese Zinkfingerdomäne eine ähnliche Sequenzspezifität wie Finger
3. SSNR, die mit dem GAGC- und dem GACT-Plasmid ausgewählt worden
war, erlaubte das Zellwachstum auf Medium ohne Histidin mit dem GAGC-Plasmid,
aber nicht mit dem GAGT-Plasmid. QSTV, mit dem ACAT-Plasmid erhalten,
erlaubte kein Zellwachstum mit einem der in diesem Assay geprüften Plasmide.
Diese Zinkfingerdomäne
war jedoch in der Lage, unter In-vitro-Bedingungen
fest an die ACAT-Sequenz zu binden, wie an späterer Stelle nachgewiesen wird.
-
Beispiel 10: Gel-Shift-Assays
-
Zinkfingerproteine,
die Zinkfingerdomänen
enthalten, die unter Verwendung des modifizierten Ein-Hybrid-Systems
ausgewählt
wurden, wurden in E. coli exprimiert, aufgereinigt und in Gel Shift
Assays verwendet. Die DNA-Segmente mit dem Code für Zinkfingerproteine
in den Hybridplasmiden wurden durch Verdauung mit SalI und NotI
und Einfügen
zwischen die Sall- und die NotI-Stelle
in pGEX-4T2 (Pharmacia Biotech) isoliert. Zinkfingerproteine wurden
in E. coli-Stamm BL21 in Form von Fusionsproteinen, die mit GST
(Glutathion-S-Transferase)
verbunden sind, exprimiert. Die Fusionsproteine wurden durch Glutathion-Affinitätschromatografie
(Pharmacia Biotech, Piscataway, NJ) aufgereinigt und anschließend mit
Thrombin verdaut, wodurch die Verbindungsstelle zwischen dem GST-Teil
und Zinkfingerproteinen gespalten wird. Aufgereinigte Zinkfingerproteine
enthielten Finger 1 und Finger 2 von Zif268 und ausgewählte Zinkfingerdomänen am C-Terminus.
-
Die
folgenden DNA-Sonden wurden synthetisiert, durch Annealing aneinander
gebunden, unter Verwendung von T4-Polynukleotidkinase mit
32P markiert und in Gel Shift Assays verwendet.
-
Verschiedene
Mengen eines Zinkfingerproteins wurden mit einer markierten Sonden-DNA
für die
Dauer von einer Stunde bei Raumtemperatur in 20 mM Tris pH 7,7,
120 mM NaCl, 5 mM MgCl
2, 20 μM ZnSO
4, 10% Glycerin, 0,1% Nonidet P-40, 5 mM
DTT und 0,10 mg/mL BSA (Rinderserumalbumin) inkubiert und anschließend wurden
die Reaktionsmischungen einer Gelelektrophorese unterzogen. Die
radioaktiven Signale wurden durch eine Phosphorlmager
TM Analyse
(Molecular Dynamics) quantifiziert und Dissoziationskonstanten (K
d) auf die vorbeschriebene Weise (Rebar and
Pabo (1994) Science 263:671-673) ermittelt. Die Ergebnisse sind
in Tabelle 2 beschrieben. Sämtliche
Konstanten wurden in mindestens zwei getrennten Versuchen ermittelt
und der Standardfehler des Mittelwerts ist angegeben. Das Zellwachstum
von Hefetransformanten auf Minimalmedium ohne Histidin (
10) ist in Tabelle 2 ebenfalls angegeben. Tabelle
2
- * +++, 20-100% Wachstum; ++, 5-20% Wachstum;
+, 1-5% Wachstum; -, < 1%
Wachstum.
-
Zinkfingerproteine,
die ein Zellwachstum auf Platten ohne Histidin erlaubten, banden
fest an die entsprechende Sonden-DNA. Zum Beispiel das als eine
Kontrolle verwendete Protein Zif268 erlaubte mit den GCGT- und GAGT-Reporterplasmiden
das Zellwachstum und die unter In-vitro-Bedingungen und unter Verwendung
der entsprechenden Sonden-DNAs gemessenen Dissoziationskonstanten
beliefen sich auf 0,024 nM bzw. 0,17 nM. Im Gegensatz dazu erlaubte
das Protein Zif268 mit anderen Plasmiden kein Zellwachstum und die
unter Verwendung der entsprechenden Sonden-DNAs gemessenen Dissoziationskonstanten
waren größer als
1 nM.
-
Ähnliche
Ergebnisse wurden mit Zinkfingerproteinen erhalten, die neuartige
Zinkfingerdomänen
enthielten. Zum Beispiel das KTNR-Protein zeigte eine hohe Affinität für die GAGC-Sonden-DNA
mit einer Dissoziationskonstante von 0,17 nM, aber nicht für die GCGT-
oder die GACT-Sonden-DNA mit Dissoziationskonstanten von 5,5 nM
bzw. 30 nM. Dieses Protein erlaubte das Zellwachstum nur mit dem
GAGC-Plasmid. Das HSNK-Protein war in der Lage, fest an die GACT-Sonden-DNA
zu binden (Kd = 0,32 nM), aber nicht an
die GCGT- oder die GAGT-Sonden-DNA; wie zu erwarten war, erlaubte
das HSNK-Protein
das Zellwachstum nur mit dem GACT-Plasmid.
-
Das
QSTV-Protein, das mit dem ACAT-Reporterplasmid ausgewählt worden
war, war nicht in der Lage, das Zellwachstum mit irgend einem der
anderen Reporterplasmide nach der Re-Transformation in Hefe zu fördern. Gel-Shift-Assays zeigten, dass
dieses Protein fester an die ACAT-Sonden-DNA als an die anderen Sonden-DNAs
band. QSTV band 13 mal fester an die ACAT-Sonden-DNA als an die GCTT-Sonden-DNA
bzw. 4,3 mal fester als an die GCGT-Sonden-DNA.
-
Im
Allgemeinen gilt, dass ein Zinkfingerprotein, d. h. eines mit drei
Zinkfingerdomänen,
das mit einer Dissoziationskonstante unter 1 nM an eine DNA-Sequenz
bindet, das Zellwachstum erlaubt, während ein Zinkfingerprotein,
das mit einer Dissoziationskonstante über 1 nM an eine DNA-Sequenz
bindet, das Zellwachstum nicht erlaubt. Zinkfingerproteine, die
mit einer Dissoziationskonstante über 1 nM, aber unter 5 nM binden,
können
auch nützlich
sein, z. B. Im Kontext eines chimären Zinkfingerproteins mit
vier Zinkfingerdomänen.
-
Beispiel 11: TG-ZFD-001 "CSNR1"
-
TG-ZFD-001 "CSNR1" wurde durch In-vivo-Screening
aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YKCKQCGKAFGCPSNLRRHGRTH
(SEQ. ID. NR.: 23).
-
Es
wird durch die Human-Nukleinsäuresequenz
5'-TATAAATGTAAGCAATGTGGGAAAGCTTTTGGATGTCCCTCAAACCTTCGAA
GGCATGGAAGGACTCAC-3' (SEQ.
ID. NR.: 22) kodiert.
-
Als
eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-001 "CSNR1" eine Erkennungsspezifität für die 3-bp-Zielsequenzen
GAA, GAC und GAG. Seine Bindungsstellenpräferenz ist GAA > GAC > GAG > GCG basierend auf
den Ergebnissen des In-vivo-Screening und EMSA. Im EMSA besitzt
die TG-ZFD-001 "CSNR" Fusion an die Finger
1 und 2 von Zif268 und die GST-Aufreinigungshilfen
eine scheinbare Kd von 0,17 nM für die GAC-enthaltende
Stelle, 0,46 nM für
die GAG-enthaltende Stelle und 2,7 nM für die GCG-enthaltende Stelle.
-
TG-ZFD-001 "CSNR1" kann als ein Modul
zur Konstruktion eines chimären
DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst,
z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz
GAA, GAC oder GAG enthält.
-
Beispiel 12: TG-ZFD-002 "HSNK"
-
TG-ZFD-002 "HSNK" wurde durch In-vivo-Screening
aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YKCKECGKAFNHSSNFNKHHRIH
(SEQ. ID. NR.: 25).
-
Es
wird durch die Human-Nukleinsäuresequenz
5'-TATAAGTGTAAGGAGTGTGGGAAAGCCTTCAACCACAGCTCCAACTTCAATA
AACACCACAGAATCCAC-3' (SEQ.
ID. NR.: 24) kodiert.
-
Als
eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-002 "HSNK" eine Erkennungsspezifität für die 3-bp-Zielsequenz
GAC. Seine Bindungsstellenpräferenz
ist GAC > GAG > GCG basierend auf
den Ergebnissen des In-vivo-Screening und EMSA. Im EMSA besitzt
die TG-ZFD-002 "HSNK" Fusion an die Finger
1 und 2 von Zif268 und die GST-Aufreinigungshilfen
eine scheinbare Kd von 0,32 nM für die GAC-enthaltende
Stelle, 3,5 nM für
die GAG-enthaltende Stelle und 42 nM für die GCG-enthaltende Stelle.
-
TG-ZFD-002 "HSNK" kann als ein Modul
zur Konstruktion eines chimären
DNA-Bindungsproteins
verwendet werden, das multiple Zinkfingerdomänen umfasst, z. B. zum Zweck
der Erkennung einer DNA-Stelle, die die Sequenz GAC enthält.
-
Beispiel 13: TG-ZFD-003 "SSNR"
-
TG-ZFD-003 "SSNR" wurde durch In-vivo-Screening
aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YECKECGKAFSSGSNFTRHQRIH
(SEQ. ID. NR.: 27).
-
Es
wird durch die Human-Nukleinsäuresequenz
5'-TATGAATGTAAGGAATGTGGGAAAGCCTTTAGTAGTGGTTCAAACTTCACTC
GACATCAGAGAATTCAC-3' (SEQ.
ID. NR.: 26) kodiert.
-
Als
eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-003 "SSNR" eine Erkennungsspezifität für die 3-bp-Zielsequenz
GAG. Seine Bindungsstellenpräferenz
ist GAG > GAC > GCG basierend auf
den Ergebnissen des In-vivo-Screening und EMSA. Im EMSA besitzt
die TG-ZFD- 003 "SSNR" Fusion an die Finger
1 und 2 von Zif268 und die GST-Aufreinigungshilfen
eine scheinbare Kd von 0,45 nM für die GAG-enthaltende
Stelle, 0,61 nM für
die GAC-enthaltende Stelle und 3,8 nM für die GCG-enthaltende Stelle.
-
TG-ZFD-003 "SSNR" kann als ein Modul
zur Konstruktion eines chimären
DNA-Bindungsproteins
verwendet werden, das multiple Zinkfingerdomänen umfasst, z. B. zum Zweck
der Erkennung einer DNA-Stelle, die die Sequenz GAG oder GAC enthält.
-
Beispiel 14: TG-ZFD-004 "RDER1"
-
TG-ZFD-004 "RDER1" wurde durch In-vivo-Screening
aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YVCDVEGCTWKFARSDELNRHKKRH
(SEQ. ID. NR.: 29).
-
Es
wird durch die Human-Nukleinsäuresequenz
5'-TATGTATGCGATGTAGAGGGATGTACGTGGAAATTTGCCCGCTCAGATGAGC
TCAACAGACACAAGAAAAGGCAC-3' (SEQ.
ID. NR.: 28) kodiert.
-
Als
eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-004 "RDER1" eine Erkennungsspezifität für die 3-bp-Zielsequenz
GCG. Seine Bindungsstellenpräferenz
ist GCG > GTG, GAG > GAC basierend auf
den Ergebnissen des In-vivo-Screening und EMSA. Im EMSA besitzt
die TG-ZFD-004 "RDER1" Fusion an die Finger
1 und 2 von Zif268 und die GST-Aufreinigungshilfen
eine scheinbare Kd von 0,027 nM für die GCG-enthaltende
Stelle, 0,18 nM für
die GAG-enthaltende Stelle und 28 nM für die GAC-enthaltende Stelle.
-
TG-ZFD-004 "RDER1" kann als ein Modul
zur Konstruktion eines chimären
DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst,
z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz
GCG, GTG oder GAG enthält.
-
Beispiel 15: TG-ZFD-005 "QSTV"
-
TG-ZFD-005 "QSTV" wurde durch In-vivo-Screening
aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YECNECGKAFAQNSTLRVHQRIH
(SEQ. ID. NR.: 31).
-
Es
wird durch die Human-Nukleinsäuresequenz
5'-TATGAGTGTAATGAATGCGGGAAAGCTTTTGCCCAAAATTCAACTCTCAGAG
TACACCAGAGAATTCAC-3' (SEQ.
ID. NR.: 30) kodiert.
-
Als
eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-005 "QSTV" eine Erkennungsspezifität für die 3-bp-Zielsequenz
ACA. Seine Bindungsstellenpräferenz
ist ACA > GCG > GCT basierend auf
EMSA. Im EMSA besitzt die TG-ZFD-005 "QSTV" Fusion
an die Finger 1 und 2 von Zif268 und die GST-Aufreinigungshilfen
eine scheinbare Kd von 2,3 nM für die ACA-enthaltende Stelle,
9,8 nM für
die GCG-enthaltende Stelle und 29 nM für die GCT-enthaltende Stelle.
-
TG-ZFD-005 "QSTV" kann als ein Modul
zur Konstruktion eines chimären
DNA-Bindungsproteins
verwendet werden, das multiple Zinkfingerdomänen umfasst, z. B. zum Zweck
der Erkennung einer DNA-Stelle, die die Sequenz ACA enthält.
-
Beispiel 16: TG-ZFD-006 "VSTR"
-
TG-ZFD-006 "VSTR" wurde durch In-vivo-Screening
aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YECNYCGKTFSVSSTLIRHQRIH
(SEQ. ID. NR.: 33).
-
Es
wird durch die Human-Nukleinsäuresequenz
5'-TATGAGTGTAATTACTGTGGAAAAACCTTTAGTGTGAGCTCAACCCTTATTA
GACATCAGAGAATCCAC-3' (SEQ.
ID. NR.: 32) kodiert.
-
Als
eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-006 "VSTR" eine Erkennungsspezifität für die 3-bp-Zielsequenz
GCT. Seine Bindungsstellenpräferenz
ist GCT > GCG > GAG basierend auf
den Ergebnissen des In-vivo-Screening und EMSA. Im EMSA besitzt
die TG-ZFD-006 "VSTR" Fusion an die Finger
1 und 2 von Zif268 und die GST-Aufreinigungshilfen
eine scheinbare Kd von 0,53 nM für die GCT-enthaltende
Stelle, 0,76 nM für
die GCG-enthaltende Stelle und 1,4 nM für die GAG-enthaltende Stelle.
-
TG-ZFD-006 "VSTR" kann als ein Modul
zur Konstruktion eines chimären
DNA-Bindungsproteins
verwendet werden, das multiple Zinkfingerdomänen umfasst, z. B. zum Zweck
der Erkennung einer DNA-Stelle, die die Sequenz GCT oder GCG enthält.
-
Beispiel 17: TG-ZFD-007 "CSNR2"
-
TG-ZFD-007 "CSNR2" wurde durch In-vivo-Screening
aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YQCNICGKCFSCNSNLHRHQRTH
(SEQ. ID. NR.: 35).
-
Es
wird durch die Human-Nukleinsäuresequenz
5'-TATCAGTGCAACATTTGCGGAAAATGTTTCTCCTGCAACTCCAACCTCCA
CAGGCACCAGAGAACGCAC-3' (SEQ.
ID. NR.: 34) kodiert.
-
Als
eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-007 "CSNR2" eine Erkennungsspezifität für die 3-bp-Zielsequenzen
GAA, GAC und GAG. Seine Bindungsstellenpräferenz ist GAA > GAC > GAG basierend auf
den Ergebnissen des In-vivo-Screening.
-
TG-ZFD-007 "CSNR2" kann als ein Modul
zur Konstruktion eines chimären
DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst,
z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz
GAA, GAC oder GAG enthält.
-
Beispiel 18: TG-ZFD-008 "QSHR1"
-
TG-ZFD-008 "QSHR1" wurde durch In-vivo-Screening
aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YACHLCGKAFTQSSHLRRHEKTH
(SEQ. ID. NR.: 37).
-
Es
wird durch die Human-Nukleinsäuresequenz
5'-TATGCATGTCATCTATGTGGAAAAGCCTTCACTCAGAGTTCTCACCTTAG
AAGACATGAGAAAACTCAC-3' (SEQ.
ID. NR.: 36) kodiert.
-
Als
eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-008 "QSHR1" eine Erkennungsspezifität für die 3-bp-Zielsequenzen
GGA, GAA und AGA. Seine Bindungsstellenpräferenz ist GGA > GAA > AGA basierend auf
den Ergebnissen des In-vivo-Screening.
-
TG-ZFD-008 "QSHR1" kann als ein Modul
zur Konstruktion eines chimären
DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst,
z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz
GGA, GAA oder AGA enthält.
-
Beispiel 19: TG-ZFD-009 "QSHR2"
-
TG-ZFD-009 "QSHR2" wurde durch In-vivo-Screening
aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YKCGQCGKFYSQVSHLTRHQKIH
(SEQ. ID. NR.: 39).
-
Es
wird durch die Human-Nukleinsäuresequenz
5'-TATAAATGCGGCCAGTGTGGGAAGTTCTACTCGCAGGTCTCCCACCTCA
CCCGCCACCAGAAAATCCAC-3' (SEQ.
ID. NR.: 38) kodiert.
-
Als
eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-009 "QSHR2" eine Erkennungsspezifität für die 3-bp-Zielsequenz
GGA.
-
TG-ZFD-009 "QSHR2" kann als ein Modul
zur Konstruktion eines chimären
DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst,
z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz
GGA enthält.
-
Beispiel 20: TG-ZFD-010 "QSHR3"
-
TG-ZFD-010 "QSHR3" wurde durch In-vivo-Screening
aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YACHLCGKAFTQCSHLRRHEKTH
(SEQ. ID. NR.: 41).
-
Es
wird durch die Human-Nukleinsäuresequenz
5'-TATGCATGTCATCTATGTGGAAAAGCCTTCACTCAGTGTTCTCACCTTAG
AAGACATGAGAAAACTCAC-3' (SEQ.
ID. NR.: 40) kodiert.
-
Als
eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-010 "QSHR3" eine Erkennungsspezifität für die 3-bp-Zielsequenzen
GGA und GAA. Seine Bindungsstellenpräferenz ist GGA > GAA basierend auf
den Ergebnissen des In-vivo-Screening.
-
TG-ZFD-010 "QSHR3" kann als ein Modul
zur Konstruktion eines chimären
DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst,
z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz
GGA oder GAA enthält.
-
Beispiel 21: TG-ZFD-011 "QSHR4"
-
TG-ZFD-011 "QSHR4" wurde durch In-vivo-Screening
aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YACHLCAKAFIQCSHLRRHEKTH
(SEQ. ID. NR.: 43).
-
Es
wird durch die Human-Nukleinsäuresequenz
5'-TATGCATGTCATCTATGTGCAAAAGCCTTCATTCAGTGTTCTCACCTTAGA
AGACATGAGAAACTCAC-3' (SEQ.
ID. NR.: 42) kodiert.
-
Als
eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-011 "QSHR4" eine Erkennungsspezifität für die 3-bp-Zielsequenzen
GGA und GAA. Seine Bindungsstellenpräferenz ist GGA > GAA basierend auf
den Ergebnissen des In-vivo-Screening.
-
TG-ZFD-011 "QSHR4" kann als ein Modul
zur Konstruktion eines chimären
DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst,
z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz
GGA oder GAA enthält.
-
Beispiel 22: TG-ZFD-012 "QSHR5"
-
TG-ZFD-012 "QSHR5" wurde durch In-vivo-Screening
aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YVCRECGRGFRQHSHLVRHKRTH
(SEQ. ID. NR.: 45). Es wird durch die Human-Nukleinsäuresequenz
5'-TATGTTTGCAGGGAATGTGGGCGTGGCTTTCGCCAGCATTCACACC
TGGTCAGACACAAGAGGACACAT-3' (SEQ.
ID. NR.: 44) kodiert.
-
Als
eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-012 "QSHR5" eine Erkennungsspezifität für die 3-bp-Zielsequenzen
GGA, AGA, GAA und CGA. Seine Bindungsstellenpräferenz ist GGA > AGA > GAA > CGA basierend auf
den Ergebnissen des In-vivo-Screening.
-
TG-ZFD-012 "QSHR5" kann als ein Modul
zur Konstruktion eines chimären
DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst,
z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz
GGA, AGA, GAA oder CGA enthält.
-
Beispiel 23: TG-ZFD-013 "QSNR1"
-
TG-ZFD-013 "QSNR1" wurde durch In-vivo-Screening
aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
FECKDCGKAFIQKSNLIRHQRTH
(SEQ. ID. NR.: 47).
-
Es
wird durch die Human-Nukleinsäuresequenz
5'-TTTGAGTGTAAAGATTGCGGGAAAGCTTTCATTCAGAAGTCAAACCTCA
TCAGACACCAGAGAACTCAC-3' (SEQ.
ID. NR.: 46) kodiert.
-
Als
eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-013 "QSNR1" eine Erkennungsspezifität für die 3-bp-Zielsequenz
GAA.
-
TG-ZFD-013 "QSNR1" kann als ein Modul
zur Konstruktion eines chimären
DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst,
z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz
GAA enthält.
-
Beispiel 24: TG-ZFD-014 "QSNR2"
-
TG-ZFD-014 "QSNR2" wurde durch In-vivo-Screening
aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YVCRECRRGFSQKSNLIRHQRTH
(SEQ. ID. NR.: 49).
-
Es
wird durch die Human-Nukleinsäuresequenz
5'-TATGTCTGCAGGGAGTGTAGGCGAGGTTTTAGCCAGAAGTCAAATCTCA
TCAGACACCAGAGGACGCAC-3' (SEQ.
ID. NR.: 48) kodiert.
-
Als
eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-014 "QSNR2" eine Erkennungsspezifität für die 3-bp-Zielsequenz
GAA.
-
TG-ZFD-014 "QSNR2" kann als ein Modul
zur Konstruktion eines chimären
DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst,
z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz
GAA enthält.
-
Beispiel 25: TG-ZFD-015 "QSNV1"
-
TG-ZFD-015 "QSNV1" wurde durch In-vivo-Screening
aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YECNTCRKTFSQKSNLIVHQRTH
(SEQ. ID. NR.: 51). Es wird durch die Human-Nukleinsäuresequenz
5'-TATGAATGTAACACATGCAGGAAAACCTTCTCTCAAAAGTCAAATCTCAT
TGTACATCAGAGAACACAC-3' (SEQ.
ID. NR.: 50) kodiert.
-
Als
eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-015 "QSNV1" eine Erkennungsspezifität für die 3-bp-Zielsequenzen
AAA und CAA. Seine Bindungsstellenpräferenz ist AAA > CAA basierend auf
den Ergebnissen des In-vivo-Screening.
-
TG-ZFD-015 "QSNV1" kann als ein Modul
zur Konstruktion eines chimären
DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst,
z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz
AAA oder CAA enthält.
-
Beispiel 26: TG-ZFD-016 "QSNV2"
-
TG-ZFD-016 "QSNV2" wurde durch In-vivo-Screening
aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YVCSKCGKAFTQSSNLTVHQKIH
(SEQ. ID. NR.: 53).
-
Es
wird durch die Human-Nukleinsäuresequenz
5'-TATGTTTGCTCAAAATGTGGGAAAGCCTTCACTCAGAGTTCAAATCTGAC
TGTACATCAAAAAATCCAC-3' (SEQ.
ID. NR.: 52) kodiert.
-
Als
eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-016 "QSNV2" eine Erkennungsspezifität für die 3-bp-Zielsequenzen
AAA und CAA. Seine Bindungsstellenpräferenz ist AAA > CAA basierend auf
den Ergebnissen des In-vivo-Screening.
-
TG-ZFD-016 "QSNV2" kann als ein Modul
zur Konstruktion eines chimären
DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst,
z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz
AAA oder CAA enthält.
-
Beispiel 27: TG-ZFD-017 "QSNV3"
-
TG-ZFD-017 "QSNV3" wurde durch In-vivo-Screening
aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YKCDECGKNFTQSSNLIVHKRIH
(SEQ. ID. NR.: 55).
-
Es
wird durch die Human-Nukleinsäuresequenz
5'-TACAAATGTGACGAATGTGGAAAAAACTTTACCCAGTCCTCCAACCTTA
TTGTACATAAGAGAATTCAT-3' (SEQ.
ID. NR.: 54) kodiert.
-
Als
eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-017 "QSNV3" eine Erkennungsspezifität für eine 3-bp-Zielsequenz
AAA.
-
TG-ZFD-017 "QSNV3" kann als ein Modul
zur Konstruktion eines chimären
DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst,
z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz
AAA enthält.
-
Beispiel 28: TG-ZFD-018 "QSNV4"
-
TG-ZFD-018 "QSNV4" wurde durch In-vivo-Screening
aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YECDVCGKTFTQKSNLGVHQRTH
(SEQ. ID. NR.: 57).
-
Es
wird durch die Human-Nukleinsäuresequenz
5'-TATGAATGTGATGTGTGTGGAAAAACCTTCACGCAAAAGTCAAACCTTG
GTGTACATCAGAGAACTGAT-3' (SEQ.
ID. NR.: 56) kodiert.
-
Als
eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-018 "QSNV4" eine Erkennungsspezifität für die 3-bp-Zielsequenz
AAA.
-
TG-ZFD-018 "QSNV4" kann als ein Modul
zur Konstruktion eines chimären
DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst,
z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz
AAA enthält.
-
Beispiel 29: TG-ZFD-019 "QSSR1"
-
TG-ZFD-019 "QSSR1" wurde durch In-vivo-Screening
aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YKCPDCGKSFSQSSSLIRHQRTH
(SEQ. ID. NR.: 59).
-
Es
wird durch die Human-Nukleinsäuresequenz
5'-TATAAGTGCCCTGATTGTGGGAAGAGTTTTAGTCAGAGTTCCAGCCTCAT
TCGCCACCAGCGGACACAC-3' (SEQ.
ID. NR.: 58) kodiert.
-
Als
eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-019 "QSSR1" eine Erkennungsspezifität für die 3-bp-Zielsequenzen
GTA und GCA. Seine Bindungsstellenpräferenz ist GTA > GCA basierend auf
den Ergebnissen des In-vivo-Screening.
-
TG-ZFD-019 "QSSR1" kann als ein Modul
zur Konstruktion eines chimären
DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst,
z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz
GTA oder GCA enthält.
-
Beispiel 30: TG-ZFD-020 "QSSR2"
-
TG-ZFD-020 "QSSR2" wurde durch In-vivo-Screening
aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YECQDCGRAFNQNSSLGRHKRTH
(SEQ. ID. NR.: 61).
-
Es
wird durch die Human-Nukleinsäuresequenz
5'-TATGAGTGTCAGGACTGTGGGAGGGCCTTCAACCAGAACTCCTCCCTGG
GGCGGCACAAGAGGACACAC-3' (SEQ.
ID. NR.: 60) kodiert.
-
Als
eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-020 "QSSR2" eine Erkennungsspezifität für die 3-bp-Zielsequenz
GTA.
-
TG-ZFD-020 "QSSR2" kann als ein Modul
zur Konstruktion eines chimären
DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst,
z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz
GTA enthält.
-
Beispiel 31: TG-ZFD-021 "QSTR"
-
TG-ZFD-021 "QSTR" wurde durch In-vivo-Screening
aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YKCEECGKAFNQSSTLTRHKIVH
(SEQ. ID. NR.: 63).
-
Es
wird durch die Human-Nukleinsäuresequenz
5'-TACAAATGTGAAGAATGTGGCAAAGCTTTTAACCAGTCCTCAACCCTTA
CTAGACATAAGATAGTTCAT-3' (SEQ.
ID. NR.: 62) kodiert.
-
Als
eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-021 "QSTR" eine Erkennungsspezifität für die 3-bp-Zielsequenzen
GTA und GCA. Seine Bindungsstellenpräferenz ist GTA > GCA basierend auf
den Ergebnissen des In-vivo-Screening.
-
TG-ZFD-021 "QSTR" kann als ein Modul
zur Konstruktion eines chimären
DNA-Bindungsproteins
verwendet werden, das multiple Zinkfingerdomänen umfasst, z. B. zum Zweck
der Erkennung einer DNA-Stelle, die die Sequenz GTA oder GCA enthält.
-
Beispiel 32: TG-ZFD-022 "RSHR"
-
TG-ZFD-022 "RSHR" wurde durch In-vivo-Screening
aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YKCMECGKAFNRRSHLTRHQRIH
(SEQ. ID. NR.: 65).
-
Es
wird durch die Human-Nukleinsäuresequenz
5'-TATAAGTGCATGGAGTGTGGGAAGGCTTTTAACCGCAGGTCACACCTCA
CACGGCACCAGCGGATTGAC-3' (SEQ.
ID. NR.: 64) kodiert.
-
Als
eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-022 "RSHR" eine Erkennungsspezifität für die 3-bp-Zielsequenz
GGG.
-
TG-ZFD-022 "RSHR" kann als ein Modul
zur Konstruktion eines chimären
DNA-Bindungsproteins
verwendet werden, das multiple Zinkfingerdomänen umfasst, z. B. zum Zweck
der Erkennung einer DNA-Stelle, die die Sequenz GGG enthält.
-
Beispiel 33: TG-ZFD-023-"VSSR"
-
TG-ZFD-023-"VSSR" wurde durch In-vivo-Screening
aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YTCKQCGKAFSVSSSLRRHETTH
(SEQ. ID. NR.: 67).
-
Es
wird durch die Human-Nukleinsäuresequenz
5'-TATACATGTAAACAGTGTGGGAAAGCCTTCAGTGTTTCCAGTTCCCTTCG
AAGACATGAAACCACTCAC-3' (SEQ.
ID. NR.: 66) kodiert.
-
Als
eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-023-"VSSR" eine
Erkennungsspezifität
für die
3-bp-Zielsequenzen GTT, GTG und GTA. Seine Bindungsstellenpräferenz ist
GTT > GTG > GTA basierend auf
den Ergebnissen des In-vivo-Screening.
-
TG-ZFD-023-"VSSR" kann als ein Modul
zur Konstruktion eines chimären
DNA-Bindungsproteins
verwendet werden, das multiple Zinkfingerdomänen umfasst, z. B. zum Zweck
der Erkennung einer DNA-Stelle, die die Sequenz GTT, GTG oder GTA
enthält.
-
Beispiel 34: TG-ZFD-024 "QAHR"
-
TG-ZFD-024 "QAHR" wurde durch In-vivo-Screening
aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YKCKECGQAFRQRAHLIRHHKLH
(SEQ. ID. NR.: 103).
-
Es
wird durch die Human-Nukleinsäuresequenz
5'-TATAAGTGTAAGGAATGTGGGCAGGCCTTTAGACAGCGTGCACATCTT
ATTCGACATCACAAACTTCAC-3' (SEQ.
ID. NR.: 102) kodiert.
-
Als
eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-024 "QAHR" eine Erkennungsspezifität für die 3-bp-Zielsequenz
GGA basierend auf den Ergebnissen des In-vivo-Screening.
-
TG-ZFD-024 "QAHR" kann als ein Modul
zur Konstruktion eines chimären
DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst,
z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz
GGA enthält.
-
Beispiel 35: TG-ZFD-025 "QFNR"
-
TG-ZFD-025 "QFNR" wurde durch In-vivo-Screening
aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YKCHQCGKAFIQSFNLRRHERTH
(SEQ. ID. NR.: 105).
-
Es
wird durch die Human-Nukleinsäuresequenz
5'-TATAAGTGTCATCAATGTGGGAAAGCCTTTATTCAATCCTTTAACCTTC
GAAGACATGAGAGAACTCAC-3' (SEQ.
ID. NR.: 104) kodiert.
-
Als
eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-025 "QFNR" eine Erkennungsspezifität für die 3-bp-Zielsequenz
GAC basierend auf den Ergebnissen des In-vivo-Screening.
-
TG-ZFD-025 "QFNR" kann als ein Modul
zur Konstruktion eines chimären
DNA-Bindungsproteins
verwendet werden, das multiple Zinkfingerdomänen umfasst, z. B. zum Zweck
der Erkennung einer DNA-Stelle, die die Sequenz GAC enthält.
-
Beispiel 36: TG-ZFD-026 "QGNR"
-
TG-ZFD-026 "QGNR" wurde durch In-vivo-Screening
aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
FQCNQCGASFTQKGNLLRHIKLH
(SEQ. ID. NR.: 107).
-
Es
wird durch die Human-Nukleinsäuresequenz
5'-TTCCAGTGTAATCAGTGTGGGGCATCTTTTACTCAGAAAGGTAACCTCC
TCCGCCACATTAAACTGCAC-3' (SEQ.
ID. NR.: 106) kodiert.
-
Als
eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-026 "QGNR" eine Erkennungsspezifität für die 3-bp-Zielsequenz
GAA basierend auf den Ergebnissen des In-vivo-Screening.
-
TG-ZFD-026 "QGNR" kann als ein Modul
zur Konstruktion eines chimären
DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst,
z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz
GAA enthält.
-
Beispiel 37: TG-ZFD-028 "QSHT"
-
TG-ZFD-028 "QSHT" wurde durch In-vivo-Screening
aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YKCEECGKAFRQSSHLTTHKIIH
(SEQ. ID. NR.: 111).
-
Es
wird durch die Human-Nukleinsäuresequenz
5'-TACAAATGTGAAGAATGTGGCAAAGCCTTTAGGCAGTCCTCACACCTTA
CTACACATAAGATAATTCAT-3' (SEQ.
ID. NR.: 110) kodiert.
-
Als
eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-028 "QSHT" eine Erkennungsspezifität für die 3-bp-Zielsequenz
AGA, CGA, TGA und GGA. Seine Bindungsstellenpräferenz ist (AGA und CGA) > TGA > GGA basierend auf
den Ergebnissen des In-vivo-Screening.
-
TG-ZFD-028 "QSHT" kann als ein Modul
zur Konstruktion eines chimären
DNA-Bindungsproteins
verwendet werden, das multiple Zinkfingerdomänen umfasst, z. B. zum Zweck
der Erkennung einer DNA-Stelle, die die Sequenz AGA, CGA, TGA und
GGA enthält.
-
Beispiel 38: TG-ZFD-029 "QSHV"
-
TG-ZFD-029 "QSHV" wurde durch In-vivo-Screening
aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YECDHCGKSFSQSSHLNVHKRTH
(SEQ. ID. NR.: 113).
-
Es
wird durch die Human-Nukleinsäuresequenz
5'-TATGAGTGTGATCACTGTGGAAAATCCTTTAGCCAGAGCTCTCATCTGAA
TGTGCACAAAAGAACTCAC-3' (SEQ.
ID. NR.: 112) kodiert.
-
Als
eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-029 "QSHV" eine Erkennungsspezifität für die 3-bp-Zielsequenz
CGA, AGA und TGA. Seine Bindungsstellenpräferenz ist CGA > AGA > TGA basierend auf
den Ergebnissen des In-vivo-Screening.
-
TG-ZFD-029 "QSHV" kann als ein Modul
zur Konstruktion eines chimären
DNA-Bindungsproteins
verwendet werden, das multiple Zinkfingerdomänen umfasst, z. B. zum Zweck
der Erkennung einer DNA-Stelle, die die Sequenz CGA, AGA und TGA
enthält.
-
Beispiel 39: TG-ZFD-030 "QSNI"
-
TG-ZFD-030 "QSNI" wurde durch In-vivo-Screening
aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YMCSECGRGFSQKSNLIIHQRTH
(SEQ. ID. NR.: 115).
-
Es
wird durch die Human-Nukleinsäuresequenz
5'-TACATGTGCAGTGAGTGTGGGCCAGGCTTCAGCCAGAAGTCAAACCTC
ATCATACACCAGAGGACACAC-3' (SEQ.
ID. NR.: 114) kodiert.
-
Als
eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-030 "QSNI" eine Erkennungsspezifität für die 3-bp-Zielsequenz
AAA und CAA basierend auf den Ergebnissen des In-vivo-Screening.
-
TG-ZFD-030 "QSNI" kann als ein Modul
zur Konstruktion eines chimären
DNA-Bindungsproteins
verwendet werden, das multiple Zinkfingerdomänen umfasst, z. B. zum Zweck
der Erkennung einer DNA-Stelle, die die Sequenz AAA oder CAA enthält.
-
Beispiel 40: TG-ZFD-031 "QSNR3"
-
TG-ZFD-031 "QSNR3" wurde durch In-vivo-Screening
aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YECEKCGKAFNQSSNLTRHKKSH
(SEQ. ID. NR.: 117).
-
Es
wird durch die Human-Nukleinsäuresequenz
5'-TATGAATGTGAAAAATGTGGCAAAGCTTTTAACCAGTCCTCAAATCTTA
CTAGACATAAGAAAAGTCAT-3' (SEQ.
ID. NR.: 116) kodiert.
-
Als
eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-031 "QSNR3" eine Erkennungsspezifität für die 3-bp-Zielsequenz
GAA basierend auf den Ergebnissen des In-vivo-Screening.
-
TG-ZFD-031 "QSNR3" kann als ein Modul
zur Konstruktion eines chimären
DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst,
z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz
GAA enthält.
-
Beispiel 41: TG-ZFD-032 "QSSR3"
-
TG-ZFD-032 "QSSR3" wurde durch In-vivo-Screening
aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YECNECGKFFSQSSSLIRHRRSH
(SEQ. ID. NR.: 119).
-
Es
wird durch die Human-Nukleinsäuresequenz
5'-TATGAGTGCAATGAATGTGGGAAGTTTTTTAGCCAGAGCTCCAGCCTCATTAGACATAGGAGAAGTCAC-3' (SEQ. ID. NR.: 118)
kodiert.
-
Als
eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-032 "QSSR3" eine Erkennungsspezifität für die 3-bp-Zielsequenz
GTA und GCA. Seine Bindungsstellenpräferenz ist GTA > GCA basierend auf
den Ergebnissen des In-vivo-Screening.
-
TG-ZFD-032 "QSSR3" kann als ein Modul
zur Konstruktion eines chimären
DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst,
z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz
GTA oder GCA enthält.
-
Beispiel 42: TG-ZFD-033 "QTHQ"
-
TG-ZFD-033 "QTHQ" wurde durch In-vivo-Screening
aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YECHDCGKSFRQSTHLTQHRRIH
(SEQ. ID. NR.: 121).
-
Es
wird durch die Human-Nukleinsäuresequenz
5'-TATGAGTGTCACGATTGCGGAAAGTCCTTTAGGCAGAGCACCCACCTCA
CTCAGCACCGGAGGATCCAC-3' (SEQ.
ID. NR.: 120) kodiert.
-
Als
eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-033 "QTHQ" eine Erkennungsspezifität für die 3-bp-Zielsequenz
AGA, TGA und CGA. Seine Bindungsstellenpräferenz ist AGA > (TGA und CGA) basierend
auf den Ergebnissen des In-vivo-Screening.
-
TG-ZFD-033 "QTHQ" kann als ein Modul
zur Konstruktion eines chimären
DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst,
z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz
AGA, TGA und CGA enthält.
-
Beispiel 43: TG-ZFD-034 "QTHR1"
-
TG-ZFD-034 "QTHR1" wurde durch In-vivo-Screening
aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YECHDCGKSFRQSTHLTRHRRIH
(SEQ. ID. NR.: 123).
-
Es
wird durch die Human-Nukleinsäuresequenz
5'-TATGAGTGTCACGATTGCGGAAAGTCCTTTAGGCAGAGCACCCACCTCA
CTCGGCACCGGAGGATCCAC-3' (SEQ.
ID. NR.: 122) kodiert.
-
Als
eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-034 "QTHR1" eine Erkennungsspezifität für die 3-bp-Zielsequenz
GGA, GAA und AGA. Seine Bindungsstellenpräferenz ist GGA > (GAA und AGA) basierend
auf den Ergebnissen des In-vivo-Screening.
-
TG-ZFD-034 "QTHR1" kann als ein Modul
zur Konstruktion eines chimären
DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst,
z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz
GGA, GAA und AGA enthält.
-
Beispiel 44: TG-ZFD-035 "QTHR2"
-
TG-ZFD-035 "QTHR2" wurde durch In-vivo-Screening
aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
HKCLECGKCFSQNTHLTRHQRT
(SEQ. ID. NR.: 125).
-
Es
wird durch die Human-Nukleinsäuresequenz
5'-CACAAGTGCCTTGAATGTGGGAAATGCTTCAGTCAGAACACCCATCTG
ACTCGCCACCAACGCACCCAC-3' (SEQ.
ID. NR.: 124) kodiert.
-
Als
eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-035 "QTHR2" eine Erkennungsspezifität für die 3-bp-Zielsequenz
GGA basierend auf den Ergebnissen des In-vivo-Screening.
-
TG-ZFD-035 "QTHR2" kann als ein Modul
zur Konstruktion eines chimären
DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst,
z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz
GGA enthält.
-
Beispiel 45: TG-ZFD-036 "RDER2"
-
TG-ZFD-036 "RDER2" wurde durch In-vivo-Screening
aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YHCDWDGCGWKFARSDELTRHYRKH
(SEQ. ID. NR.: 127).
-
Es
wird durch die Human-Nukleinsäuresequenz
5'-TACCACTGTGACTGGGACGGCTGTGGATGCAAATTCGCCCGCTCAGAT
GAACTGACCAGGCACTACCGTAAACAC-3' (SEQ.
ID. NR.: 126) kodiert.
-
Als
eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-036 "RDER2" eine Erkennungsspezifität für die 3-bp-Zielsequenz
GCG und GTG. Seine Bindungsstellenpräferenz ist GCG > GTG basierend auf
den Ergebnissen des In-vivo-Screening.
-
TG-ZFD-036 "RDER2" kann als ein Modul
zur Konstruktion eines chimären
DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst,
z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz
GCG und GTG enthält.
-
Beispiel 46: TG-ZFD-037 "RDER3"
-
TG-ZFD-037 "RDER3" wurde durch In-vivo-Screening
aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YRCSWEGCEWRFARSDELTRHFRKH
(SEQ. ID. NR.: 129).
-
Es
wird durch die Human-Nukleinsäuresequenz
5'-TACAGATGCTCATGGGAAGGGTGTGAGTGGCGTTTTGCAAGAAGTGAT
GAGTTAACCAGGCACTTCCGAAAGCAC-3' (SEQ.
ID. NR.: 128) kodiert.
-
Als
eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-037 "RDER3" eine Erkennungsspezifität für die 3-bp-Zielsequenz
GCG und GTG basierend auf den Ergebnissen des In-vivo-Screening.
-
TG-ZFD-037 "RDER3" kann als ein Modul
zur Konstruktion eines chimären
DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst,
z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz
GCG und GTG enthält.
-
Beispiel 47: TG-ZFD-038 "RDER4"
-
TG-ZFD-038 "RDER4" wurde durch In-vivo-Screening
aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
FSGSWKGCERRFARSDELSRHRRTH
(SEQ. ID. NR.: 131).
-
Es
wird durch die Human-Nukleinsäuresequenz
5'-TTCAGCTGTAGCTGGAAAGGTTGTGAAAGGAGGTTTGCCCGTTCTGATG
AACTGTCCAGACACAGGCGAACCCAC-3' (SEQ.
ID. NR.: 130) kodiert.
-
Als
eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-038 "RDER4" eine Erkennungsspezifität für die 3-bp-Zielsequenz
GCG und GTG basierend auf den Ergebnissen des In-vivo-Screening.
-
TG-ZFD-038 "RDER4" kann als ein Modul
zur Konstruktion eines chimären
DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst,
z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz
GCG und GTG enthält.
-
Beispiel 48: TG-ZFD-039 "RDER5"
-
TG-ZFD-039 "RDER5" wurde durch In-vivo-Screening
aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
FACSWQDCNKKFARSDELARHYRTH
(SEQ. ID. NR.: 133).
-
Es
wird durch die Human-Nukleinsäuresequenz
5'-TTCGCCTGCAGCTGGCAGGACTGCAACAAGAAGTTCGCGCGCTCCGAC
GAGCTGGCGCGGCACTACCGCACACAC-3' (SEQ.
ID. NR.: 132) kodiert.
-
Als
eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-039 "RDER5" eine Erkennungsspezifität für die 3-bp-Zielsequenz
GCG basierend auf den Ergebnissen des In-vivo-Screening.
-
TG-ZFD-039 "RDER5" kann als ein Modul
zur Konstruktion eines chimären
DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst,
z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz
GCG enthält.
-
Beispiel 49: TG-ZFD-040 "RDER6"
-
TG-ZFD-040 "RDER6" wurde durch In-vivo-Screening
aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YHCNWDGCGWKFARSDELTRHYRKH
(SEQ. ID. NR.: 135).
-
Es
wird durch die Human-Nukleinsäuresequenz
5'-TACCACTGCAACTGGGACGGCTGCGGCTGGAAGTTTGCGCGCTCAGAC
GAGCTCACGCGCCACTACCGAAAGCAC-3' (SEQ.
ID. NR.: 134) kodiert.
-
Als
eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-040 "RDER6" eine Erkennungsspezifität für die 3-bp-Zielsequenz
GCG und GTG. Seine Bindungsstellenpräferenz ist GCG > GTG basierend auf
den Ergebnissen des In-vivo-Screening.
-
TG-ZFD-040 "RDER6" kann als ein Modul
zur Konstruktion eines chimären
DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst,
z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz
GCG und GTG enthält.
-
Beispiel 50: TG-ZFD-041 "RDHR1"
-
TG-ZFD-041 "RDHR1" wurde durch In-vivo-Screening
aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
FLCQYCAQRFGRKDHLTRHMKKSH
(SEQ. ID. NR.: 137).
-
Es
wird durch die Human-Nukleinsäuresequenz
5'-TTCCTCTGTCAGTATTGTGCACAGAGATTTGGGCGAAAGGATCACCTGA
CTCGACATATGAAGAAGAGTCAG-3' (SEQ.
ID. NR.: 136) kodiert.
-
Als
eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-041 "RDHR1" eine Erkennungsspezifität für die 3-bp-Zielsequenz
GAG und GGG basierend auf den Ergebnissen des In-vivo-Screening.
-
TG-ZFD-041 "RDHR1" kann als ein Modul
zur Konstruktion eines chimären
DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst,
z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz
GAG und GGG enthält.
-
Beispiel 51: TG-ZFD-043 "RDHT"
-
TG-ZFD-043 "RDHT" wurde durch In-vivo-Screening
aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
FQCKTCQRKFSRSDHLKTHTRTH
(SEQ. ID. NR.: 141).
-
Es
wird durch die Human-Nukleinsäuresequenz
5'-TTCCAGTGTAAAACTTGTCAGCGAAAGTTCTCCCGGTCCGACCACCTGA
AGACCCACACCAGGACTCAT-3' (SEQ.
ID. NR.: 140) kodiert.
-
Als
eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-043 "RDHT" eine Erkennungsspezifität für die 3-bp-Zielsequenz
TGG, AGG, CGG und GGG basierend auf den Ergebnissen des In-vivo-Screening.
-
TG-ZFD-043 "RDHT" kann als ein Modul
zur Konstruktion eines chimären
DNA-Bindungsproteins
verwendet werden, das multiple Zinkfingerdomänen umfasst, z. B. zum Zweck
der Erkennung einer DNA-Stelle, die die Sequenz TGG, AGG, CGG und
GGG enthält.
-
Beispiel 52: TG-ZFD-044 "RDKI"
-
TG-ZFD-044 "RDKI" wurde durch In-vivo-Screening
aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
FACEVCGVRFTRNDKLKIHMRKH
(SEQ. ID. NR.: 143).
-
Es
wird durch die Human-Nukleinsäuresequenz
5'-TTTGCCTGCGAGGTCTGCGGTGTTCGATTCACCAGGAACGACAAGCTGA
AGATCCACATGCGGAAGCAC-3' (SEQ.
ID. NR.: 142) kodiert.
-
Als
eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-044 "RDKI" eine Erkennungsspezifität für die 3-bp-Zielsequenz
GGG basierend auf den Ergebnissen des In-vivo-Screening.
-
TG-ZFD-044 "RDKI" kann als ein Modul
zur Konstruktion eines chimären
DNA-Bindungsproteins
verwendet werden, das multiple Zinkfingerdomänen umfasst, z. B. zum Zweck
der Erkennung einer DNA-Stelle, die die Sequenz GGG enthält.
-
Beispiel 53: TG-ZFD-045 "RDKR"
-
TG-ZFD-045 "RDKR" wurde durch In-vivo-Screening
aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YVCDVEGCTWKFARSDKLNRHKKRH
(SEQ. ID. NR.: 145).
-
Es
wird durch die Human-Nukleinsäuresequenz
5'-TATGTATGCGATGTAGAGGGATGTACGTGGAAATTTGCCCGCTCAGATA
AGCTCAACAGACACAAGAAAAGGCAC-3' (SEQ.
ID. NR.: 144) kodiert.
-
Als
eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-045 "RDKR" eine Erkennungsspezifität für die 3-bp-Zielsequenz
GGG und AGG. Seine Bindungsstellenpräferenz ist GGG > AGG basierend auf
den Ergebnissen des In-vivo-Screening.
-
TG-ZFD-045 "RDKR" kann als ein Modul
zur Konstruktion eines chimären
DNA-Bindungsproteins
verwendet werden, das multiple Zinkfingerdomänen umfasst, z. B. zum Zweck
der Erkennung einer DNA-Stelle, die die Sequenz GGG und AGG enthält.
-
Beispiel 54: TG-ZFD-046 "RSNR"
-
TG-ZFD-046 "RSNR" wurde durch In-vivo-Screening
aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YICRKCGRGFSRKSNLIRHQRTH
(SEQ. ID. NR.: 147).
-
Es
wird durch die Human-Nukleinsäuresequenz
5'-TATATTTGCAGAAAGTGTGGACGGGGCTTTAGTCGGAAGTCCAACCTTA
TCAGACATCAGAGGACACAC-3' (SEQ.
ID. NR.: 146) kodiert.
-
Als
eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-046 "RSNR" eine Erkennungsspezifität für die 3-bp-Zielsequenz
GAG und GTG. Seine Bindungsstellenpräferenz ist GAG > GTG basierend auf
den Ergebnissen des In-vivo-Screening.
-
TG-ZFD-046 "RSNR" kann als ein Modul
zur Konstruktion eines chimären
DNA-Bindungsproteins
verwendet werden, das multiple Zinkfingerdomänen umfasst, z. B. zum Zweck
der Erkennung einer DNA-Stelle, die die Sequenz GAG und GTG enthält.
-
Beispiel 55: TG-ZFD-047 "RTNR"
-
TG-ZFD-047 "RTNR" wurde durch In-vivo-Screening
aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YLCSECDKCFSRSTNLIRHRRTH
(SEQ. ID. NR.: 149).
-
Es
wird durch die Human-Nukleinsäuresequenz
5'-TATCTATGTAGTGAGTGTGACAAATGCTTCAGTAGAAGTACAAACCTCA
TAAGGCATCGAAGAACTCAC-3' (SEQ.
ID. NR.: 148) kodiert.
-
Als
eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-047 "RTNR" eine Erkennungsspezifität für die 3-bp-Zielsequenz
GAG basierend auf den Ergebnissen des In-vivo-Screening.
-
TG-ZFD-047 "RTNR" kann als ein Modul
zur Konstruktion eines chimären
DNA-Bindungsproteins
verwendet werden, das multiple Zinkfingerdomänen umfasst, z. B. zum Zweck
der Erkennung einer DNA-Stelle, die die Sequenz GAG enthält.
-
Es
wurde eine Reihe von Ausführungsformen
der Erfindung beschrieben. Trotzdem ist davon auszugehen, dass verschiedene
Modifikationen vorgenommen werden können, ohne vom Geist und dem
Gültigkeitsbereich
der Erfindung abzuweichen. Folglich umfasst der Gültigkeitsbereich
der nachfolgenden Ansprüche
auch weitere Ausführungsformen.
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-