DE60127819T2

DE60127819T2 - Zink-Finger Domänen und Verfahren zur Identifizierung derselben

Info

Publication number: DE60127819T2
Application number: DE60127819T
Authority: DE
Inventors: Jin-Soo Kim; Young-Do Kwon; Hyun-Won Kim; Eun Hyun Ryu; Moon Sun Hwang
Original assignee: Toolgen Inc
Current assignee: Toolgen Inc
Priority date: 2000-02-18
Filing date: 2001-02-17
Publication date: 2007-12-27
Anticipated expiration: 2021-02-18
Also published as: ATE359365T1; NZ521293A; CN1416467B; IL151149A0; EP1259597B1; EP1259597A4; AU781103B2; CA2400772C; CN1416467A; WO2001060970A3; US20070087371A1; CA2400772A1; JP4156840B2; WO2001060970A2; US20020061512A1; DE60127819D1; EP1259597A2; JP2006149395A; JP4584840B2; AU3771901A

Description

FACHGEBIET
Die Erfindung bezieht sich auf DNA-Bindungsproteine, wie Transkriptionsfaktoren.
HINTERGRUND
Die Regulation der meisten Gene erfolgt auf der Ebene der Transkription durch Polypeptid-Transkriptionsfaktoren, die an spezifische DNA-Stellen innerhalb des Gens binden, im typischen Fall an Promoter- oder Enhancerregionen. Diese Proteine aktivieren oder reprimieren die Initiation der Transkription durch RNA-Polymerase am Promoter und regulieren auf diese Weise die Expression des Zielgens. Viele Transkriptionsfaktoren, und zwar sowohl Aktivatoren als auch Repressoren, besitzen eine modulare Struktur. Diese Module können sich als strukturell eigenständige Domänen falten und besitzen spezifische Funktionen, wie DNA-Bindung, Dimerisierung oder Wechselwirkung mit dem Transkriptionsapparat. Werden Effektordomänen, wie Aktivierungsdomänen oder Repressionsdomänen, zu DNA-Bindungsdomänen von heterologen Transkriptionsfaktoren übertragen, bleibt ihre Funktion erhalten (Brent and Ptashne, (1985) Cell 43:729-36; Dawson et al., (1995) Mol. Cell. Biol. 15:6923-31). Die dreidimensionale Struktur zahlreicher DNA-Bindungsdomänen, einschließlich Zinkfingerdomänen, Homöodomänen und Helix-Turn-Helix-Domänen, sind aus NMR- und röntgenkristallografischen Daten ermittelt worden. Greisman und Pabo beschreiben ein Verfahren zur Auswahl von DNA-Bindungsproteinen, insbesondere Zinkfingerproteinen, die gewünschte Sequenzen erkennen ((1997), Science 275:657-661). Zinkfingerdomänen können mit der Polymerasekettenreaktion charakterisiert und identifiziert werden (Pellegrino and Berg, (1991) Proc. Natl. Acad. Sci. 88:671-675).
ZUSAMMENFASSUNG
Die Erfindung legt ein schnelles und skalierbares, zellbasiertes Verfahren zur Identifizierung und Konstruktion von chimären Transkriptionsfaktoren vor. Transkriptionsfaktoren dieser Art können beispielsweise zur Änderung der Expression von endogenen Genen bei Anwendungen im Bereich der Biomedizin und Biotechnik verwendet werden. Der Assay von Transkriptionsfaktoren wird unter In-vivo-Bedingungen, d. h. in intakten, lebenden Zellen, durchgeführt. Außerdem erstreckt sich die Gültigkeit der Erfindung auf neuartige Nukleinsäurebindungsdomänen, die beispielsweise durch Anwendung des Verfahrens beim Screening von Genomsequenzen entdeckt werden können.
Die Erfindung bietet ein Verfahren zur Identifizierung einer Peptiddomäne, die eine Zielstelle auf einer DNA erkennt. Auf dieses Verfahren wird im vorliegenden Schriftstück gelegentlich als das "Domänenauswahlverfahren" oder das "In-vivo-Screeningverfahren" Bezug genommen. Das Verfahren beinhaltet die Bereitstellung (1) von Zellen, die ein Reporterkonstrukt enthalten, und (2) einer Vielzahl von Hybridnukleinsäuren. In dem Reporterkonstrukt ist ein Reportergen auf operative Weise mit einem Promoter verbunden, der sowohl eine Rekrutierungsstelle als auch eine Zielstelle besitzt. Das Reportergen wird über ein gegebenes Niveau hinaus exprimiert, wenn ein Transkriptionsfaktor sowohl die Rekrutierungsstelle als auch die Zielstelle des Promoters erkennt (d. h. daran mit einem höheren Niveau als Background bindet), aber nicht, wenn der Transkriptionsfaktor nur die Rekrutierungsstelle des Promoters erkennt. Jede Hybridnukleinsäure aus der Vielzahl enthält den Code für ein nicht-natürlich vorkommendes Protein mit den folgenden Elementen: (i) eine Transkriptionsaktivierungsdomäne, (ii) eine DNA-Bindungsdomäne, die die Rekrutierungsstelle erkennt, und (iii) eine Testzinkfingerdomäne. Die Aminosäuresequenz der Testzinkfingerdomäne unterscheidet sich bei den Mitgliedern der Vielzahl von Hybridnukleinsäuren. Das Verfahren beinhaltet weiterhin: in Kontakt bringen der Vielzahl von Nukleinsäuren mit den Zellen unter Bedingungen, die es mindestens einer aus der Vielzahl von Nukleinsäuren erlaubt, in mindestens eine der Zellen einzudringen, Kultivierung der Zellen unter Bedingungen, die die Expression der Hybridnukleinsäuren in den Zellen erlauben, und Identifizierung einer Zelle, die das Reportergen über das gegebene Niveau hinaus exprimiert, was darauf hinweist, dass die Zelle eine Hybridnukleinsäure mit dem Code für eine die Zielstelle erkennende Testzinkfingerdomäne enthält.
Die DNA-Bindungsdomäne, d. h. die Domäne, die die Rekrutierungsstelle erkennt und sich bei den Mitgliedern der Vielzahl nicht unterscheidet, kann beispielsweise eine, zwei, drei oder mehr Zinkfingerdomänen beinhalten. Bei den bei diesem Verfahren verwendeten Zellen kann es sich um prokaryotische oder eukaryotische Zellen handeln. Beispielhafte eukaryotische Zellen sind Hefezellen, z. B. Saccharomyces cerevisiae, Schizosaccharomyces pombe oder Pichia pasteuris, Insektenzellen, wie Sf9-Zellen, und Säugetierzellen, wie Fibroblasten oder Lymphozyten.
Das "gegebene Niveau" entspricht der Menge an Expression, die beobachtet wird, wenn der Transkriptionsfaktor zwar die Rekrutierungsstelle, aber nicht die Zielstelle erkennt. Das "gegebene Niveau" kann in manchen Fälle bei Null liegen (zumindest innerhalb der Nachweisgrenze des verwendeten Assays).
Das Verfahren kann einen zusätzlichen Schritt der Amplifizierung einer Quellnukleinsäure mit dem Code für die Testzinkfingerdomäne aus einer Nukleinsäure beinhalten, z. B. genomische DNA, eine mRNA-Mischung oder eine cDNA-Mischung, um ein amplifiziertes Fragment zu produzieren. Die Quellnukleinsäure kann unter Verwendung eines Oligonukleotidprimers amplifiziert werden. Der Oligonukleotidprimer kann eines aus einem Satz von degenerierten Oligonukleotiden (z. B. ein Pool aus spezifischen Oligonukleotiden mit unterschiedlichen Nukleinsäuresequenzen oder ein spezifisches Oligonukleotid mit einer nicht-natürlichen Base wie Inosin) sein, das durch Annealing an eine Nukleinsäure mit dem Code für den Randbereich einer konservierten Domäne bindet. Als Alternative kann es sich bei dem Primer um ein spezifisches Oligonukleotid handeln. Die amplifizierten Fragmente werden zur Produktion einer Hybridnukleinsäure zur Einbeziehung in die beim vorstehend angegebenen Verfahren verwendete Vielzahl von Hybridnukleinsäuren verwendet.
Darüber hinaus kann das Verfahren die Schritte der (i) Identifizierung einer Kandidatenaminosäuresequenz einer Zinkfingerdomäne in einer Sequenzdatenbank, (ii) Bereitstellung einer Kandidatennukleinsäure mit dem Code für die Kandidatenaminosäuresequenz der Zinkfingerdomäne und (iii) Nutzung der Kandidatennukleinsäure zur Konstruktion einer Hybridnukleinsäure zur Einbeziehung in die beim vorstehend angegebenen Verfahren verwendete Vielzahl von Hybridnukleinsäuren beinhalten. Die Datenbank kann Unterlagen für multiple Aminosäuresequenzen beinhalten, z. B. bekannte und/oder vorhergesagte Proteine, sowie multiple Nukleinsäuresequenzen, wie cDNAs, ESTs, genomische DNA oder genomische DNA nach Verarbeitung mit dem Computer zur Entfernung von Introns beinhalten.
Auf Wunsch kann das Verfahren wiederholt werden, um eine zweite Testzinkfingerdomäne zu identifizieren, die eine zweite Zielstelle erkennt, d. h. eine andere Stelle als die von der ersten Zinkfingerdomäne erkannte Stelle. Anschließend kann eine Nukleinsäure mit dem Code für sowohl die erste als auch die zweite identifizierte Testzinkfingerdomäne konstruiert werden. Das kodierte Hybridprotein würde eine Zielstelle, die die Zielstelle der ersten Testzinkfingerdomäne und die Zielstelle der zweiten Testzinkfingerdomäne beinhaltet, spezifisch erkennen.
Die Erfindung bietet außerdem ein Verfahren zur Ermittlung, ob eine Testzinkfingerdomäne eine Zielstelle an einem Promoter erkennt. Auf dieses Verfahren wird im vorliegenden Schriftstück gelegentlich als das "Stellenauswahlverfahren" Bezug genommen. Das Verfahren beinhaltet die Schritte der Bereitstellung eines Reporterkonstrukts und einer Hybridnukleinsäure. Das Reportergen ist auf operative Weise mit einem Promoter verbunden, der sowohl eine Rekrutierungsstelle als auch eine Zielstelle beinhaltet, und wird über ein gegebenes Niveau hinaus exprimiert, wenn ein Transkriptionsfaktor sowohl die Rekrutierungsstelle als auch die Zielstelle des Promoters erkennt, aber nicht, wenn der Transkriptionsfaktor nur die Rekrutierungsstelle des Promoters erkennt. Die Hybridnukleinsäure enthält den Code für ein nicht-natürlich vorkommendes Protein mit den folgenden Elementen: (i) eine Transkriptionsaktivierungsdomäne, (ii) eine DNA-Bindungsdomäne, die die Rekrutierungsstelle erkennt, und (iii) eine Testzinkfingerdomäne. Das Verfahren beinhaltet weiterhin: in Kontakt bringen des Reporterkonstrukts mit einer Zelle unter Bedingungen, die es dem Reporterkonstrukt erlauben, in die Zelle einzudringen, vor, nach oder gleichzeitig mit dem vorstehend angegebenen Schritt, in Kontakt bringen der Hybridnukleinsäuren mit der Zelle unter Bedingungen, die es der Hybridnukleinsäure erlauben, in die Zelle einzudringen, Kultivierung der Zelle unter Bedingungen, die die Expression der Hybridnukleinsäure in der Zelle erlauben und Nachweis der Expression des Reportergens in der Zelle. Ein Reportergen-Expressionsniveau, das größer als ein gegebenes Niveau ist, ist ein Hinweis darauf, dass die Testzinkfingerdomäne die Zielstelle erkennt.
Das Reporterkonstrukt und die Hybridnukleinsäure können auf getrennten Plasmiden enthalten sein. Die beiden Plasmide können gleichzeitig oder nacheinander in die Zelle eingeführt werden. Ein oder beide Plasmide können selektierbare Marker enthalten. Das Reporterkonstrukt und die Hybridnukleinsäure können auf auch dem selben Plasmid enthalten sein, wobei in diesem Fall lediglich ein einziger Kontaktierungsschritt erforderlich ist, um beide Nukleinsäuren in eine Zelle einzuführen. Bei einer weiteren Umsetzung sind eine oder beide Nukleinsäuren stabil in ein Genom einer Zelle integriert. Bei diesem Verfahren kann wie bei jedem im vorliegenden Schriftstück beschriebenen In-vivo-Verfahren die Transkriptionsaktivierungsdomäne durch eine Transkriptionsrepressionsdomäne ersetzt sein und es wird eine Zelle identifiziert, in der das Reportergen-Expressionsniveau auf ein Niveau unter dem gegebenen Niveau gesenkt ist.
Ein weiteres Verfahren der Erfindung ermöglicht die schnelle Ermittlung einer Bindungspräferenz einer Testzinkfingerdomäne durch die Fusion zweier Zellen. Das Verfahren beinhaltet: Bereitstellung einer ersten Zelle, die das Reportergen enthält; Bereitstellung einer zweiten Zelle, die die Hybridnukleinsäure enthält; Fusion der ersten und zweiten Zelle zur Bildung einer fusionierten Zelle; Kultivierung der fusionierten Zellen unter Bedingungen, die die Expression der Hybridnukleinsäuren in der fusionierten Zelle erlauben; und Nachweis der Reportergenexpression in der fusionierten Zelle, wobei ein höheres Reportergen-Expressionsniveau als das gegebene Niveau einen Hinweis darauf darstellt, dass die Testzinkfingerdomäne die Zielstelle erkennt. Bei der ersten und zweiten Zelle kann es sich beispielsweise um Gewebekulturzellen oder Pilzzellen handeln. Bei einer beispielhaften Implementierung des Verfahrens werden S. cerevisiae-Zellen verwendet. Die erste Zelle besitzt einen ersten Paarungstyp, z. B. MATa; die zweite Zelle besitzt einen zweiten Paarungstyp, der sich von dem ersten unterscheidet, z. B. MATa. Die beiden Zellen werden miteinander in Kontakt gebracht und durch die Paarung der Hefen wird eine einzelne Zelle (z. B. MATa/α) mit einem Zellkern produziert, der das Genom sowohl der ersten als auch der zweiten Zelle enthält. Das Verfahren kann die Bereitstellung von multiplen ersten Zellen beinhalten, die alle denselben ersten Paarungstyp besitzen, wobei jede erste Zelle ein Reporterkonstrukt mit einer unterschiedlichen Zielstelle besitzt. Multiple zweite Zellen, die alle den selben zweiten Paarungstyp besitzen und jeweils eine unterschiedliche Testzinkfingerdomäne besitzen, werden ebenfalls bereitgestellt. Es wird eine Matrix aus multiplen paarweisen Paarungen erstellt, z. B. alle möglichen paarweisen Paarungen. Das Verfahren wird angewandt zur Ermittlung der Bindungspräferenz von multiplen Testzinkfingerdomänen für multiple Bindungsstellen, z. B. einen vollständigen Satz von möglichen Zielstellen.
Die Erfindung legt außerdem ein Verfahren zum Assay einer Bindungspräferenz einer Testzinkfingerdomäne vor. Das Verfahren beinhaltet die Bereitstellung (1) von Zellen, die im wesentlichen alle eine Hybridnukleinsäure enthalten, und (2) einer Vielzahl von Reporterkonstrukten. Bei jedem Reporterkonstrukt der Vielzahl ist ein Reportergen auf operative Weise mit einem Promoter mit einer Rekrutierungsstelle und einer Zielstelle verknüpft. Das Reportergen wird über ein gegebenes Niveau hinaus exprimiert, wenn ein Transkriptionsfaktor sowohl die Rekrutierungsstelle als auch die Zielstelle des Promoters erkennt, aber nicht, wenn der Transkriptionsfaktor nur an die Rekrutierungsstelle des Promoters bindet. Die zweite Zielstelle unterscheidet sich bei den Mitgliedern der Vielzahl von Reporterkonstrukten. Die Hybridnukleinsäure enthält den Code für ein Hybridprotein mit den folgenden Elementen: (i) eine Transkriptionsaktivierungsdomäne, (ii) eine DNA-Bindungsdomäne, die die Rekrutierungsstelle erkennt, und (iii) eine Testzinkfingerdomäne. Das Verfahren beinhaltet weiterhin: in Kontakt bringen der Vielzahl von Reporterkonstrukten mit den Zellen unter Bedingungen, die es mindestens einem aus der Vielzahl von Reporterkonstrukten erlauben, in mindestens eine der Zellen einzudringen, Kultivierung der Zellen unter Bedingungen, die die Expression der Nukleinsäuren in den Zellen erlauben, Identifizierung einer Zelle, die ein Reporterkonstrukt in der Zelle enthält und das Reporterkonstrukt über das gegebene Niveau hinaus exprimiert, was darauf hinweist, dass das Reporterkonstrukt in der Zelle eine Zielstelle besitzt, die von der Testzinkfingerdomäne erkannt wird.
Mit dem vorstehenden Verfahren kann eine Vielzahl von Zellen, jeweils mit einer unterschiedlichen Zielstelle, identifiziert werden, wenn die Testzinkfingerdomäne eine Bindungspräferenz für mehr als eine Zielstelle besitzt. Das Verfahren kann weiterhin die Identifizierung der Zelle, die das höchste Reportergen-Expressionsniveau aufweist, beinhalten. Als Alternative wird ein Schwellenniveau der Reportergenexpression ermittelt, z. B. ein 2-, 4-, 8-, 20-, 50-, 100-, 1000- oder mehr-facher Anstieg der Reportergenexpression, und sämtliche Zellen mit einer Reportergenexpression über dem Schwellenwert werden ausgewählt.
Die Zielbindungsstelle kann beispielsweise eine Länge von zwischen zwei und sechs Nukleotiden aufweisen. Die Vielzahl der Reporterkonstrukte kann an zwei, drei oder vier oder mehr Positionen der Zielbindungsstelle jede mögliche Kombination der Nukleotide A, T, G und C beinhalten.
Einem weiteren Merkmal zufolge bietet die Erfindung ein Verfahren zur Identifizierung einer Vielzahl von Zinkfingerdomänen. Das Verfahren beinhaltet: Durchführung des Domänenauswahlverfahrens zur Identifizierung einer ersten Testzinkfingerdomäne und erneute Durchführung des Domänenauswahlverfahrens zur Identifizierung einer zweiten Testzinkfingerdomäne, die eine Zielstelle erkennt, die sich von der Zielstelle der ersten Testzinkfingerdomäne unterscheidet. Außerdem wird ein Verfahren zur Erzeugung einer Nukleinsäure mit dem Code für ein chimäres Zinkfingerprotein geboten, wobei das Verfahren die zweifache Durchführung des Domänenauswahlverfahrens zur Identifizierung einer ersten und einer zweiten Testzinkfingerdomäne und die Konstruktion einer Nukleinsäure mit dem Code für ein Polypeptid beinhaltet, das die erste und die zweite Testzinkfingerdomäne beinhaltet. Die Nukleinsäure kann den Code für ein Hybridprotein enthalten, das die beiden Domänen beinhaltet, die eine Stelle, die zwei Unterstellen beinhaltet, spezifisch erkennen. Bei den Unterstellen handelt es sich um die Zielstelle der ersten Testzinkfingerdomäne und die Zielstelle der zweiten Testzinkfingerdomäne.
Einem weiteren Merkmal zufolge bietet die Erfindung ein Verfahren zur Identifizierung einer von Testzinkfingerdomänen erkannten DNA-Sequenz. Das Verfahren beinhaltet: Durchführung des Stellenauswahlverfahrens zur Identifizierung einer ersten Bindungspräferenz für eine erste Testzinkfingerdomäne und die erneute Durchführung des Stellenauswahlverfahrens zur Identifizierung einer zweiten Bindungspräferenz für eine zweite Testzinkfingerdomäne. Es kann eine Nukleinsäure konstruiert werden, die den Code sowohl für die erste als auch für die zweite identifizierte Testzinkfingerdomäne enthält. Die Nukleinsäure kann den Code für ein Hybridprotein enthalten, das die beiden Domänen beinhaltet und eine Stelle, die die Zielstelle für die erste Testzinkfingerdomäne und die Zielstelle für die zweite Testzinkfingerdomäne beinhaltet, spezifisch erkennt.
Darüber hinaus bietet die Erfindung ein Verfahren zur Identifizierung einer Peptiddomäne, die eine Zielstelle auf einer DNA erkennt. Das Verfahren beinhaltet die Bereitstellung (1) von Zellen, die ein Reporterkonstrukt enthalten, und (2) einer Vielzahl von Hybridnukleinsäuren. In dem Reporterkonstrukt ist ein Reportergen auf operative Weise mit einem Promoter verbunden, der sowohl eine Rekrutierungsstelle als auch eine Zielstelle besitzt. Das Reportergen wird unter ein gegebenes Niveau exprimiert, wenn ein Transkriptionsfaktor sowohl die Rekrutierungsstelle als auch die Zielstelle des Promoters erkennt (d. h. daran mit einem höheren Niveau als Background bindet), aber nicht, wenn der Transkriptionsfaktor nur die Rekrutierungsstelle des Promoters erkennt. Jede Hybridnukleinsäure aus der Vielzahl enthält den Code für ein nicht-natürlich vorkommendes Protein mit den folgenden Elementen: (i) eine Transkriptionsrepressionsdomäne, (ii) eine DNA-Bindungsdomäne, die die Rekrutierungsstelle erkennt, und (iii) eine Testzinkfingerdomäne. Die Aminosäuresequenz der Testzinkfingerdomäne unterscheidet sich bei den Mitgliedern der Vielzahl von Hybridnukleinsäuren. Das Verfahren beinhaltet weiterhin: in Kontakt bringen der Vielzahl von Nukleinsäuren mit den Zellen unter Bedingungen, die es mindestens einer aus der Vielzahl von Nukleinsäuren erlaubt, in mindestens eine der Zellen einzudringen, Kultivierung der Zellen unter Bedingungen, die die Expression der Hybridnukleinsäuren in den Zellen erlauben, Identifizierung einer Zelle, die das Reportergen unter das gegebene Niveau exprimiert, was darauf hinweist, dass die Zelle eine Hybridnukleinsäure mit dem Code für eine die Zielstelle erkennende Testzinkfingerdomäne enthält. Zusätzliche Ausführungsformen dieses Verfahrens entsprechen den ähnlichen Verfahren, die eine Transkriptionsaktivierungsdomäne nutzen. Desgleichen kann jedes andere im vorliegenden Schriftstück beschriebene Auswahlverfahren unter Verwendung einer Transkriptionsrepressionsdomäne anstelle einer Transkriptionsaktivierungsdomäne durchgeführt werden.
Einem weiteren Merkmal zufolge bieten die Verfahren der Erfindung bestimmte aufgereinigte Polypeptide und isolierte Nukleinsäuren. Zu aufgereinigten Polypeptiden der Erfindung gehören Polypeptide mit der Aminosäuresequenz:
X_a-X-Cys-X_2-5-Cys-X₃-X_a-X-Cys-X-Ser-Asn-X_b-X-Arg-His-X_3-5-His (SEQ. ID. NR. 68),
X_a-X-Cys-X_2-5-Cys-X₃-X_a-X-His-X-Ser-Asn-X_b-X-Lys-His-X_3-5-His (SEQ. ID. NR. 69),
X_a-X-Cys-X_2-5-Cys-X₃-X_a-X-Ser-X-Ser-Asn-X_b-X-Arg-His-X_3-5-His (SEQ. ID. NR. 70),
X_a-X-Cys-X_2-5-Cys-X₃-X_a-X-Gln-X-Ser-Thr-X_b-X-Val-His-X_3-5-His (SEQ. ID. NR. 71),
X_a-X-Cys-X_2-5-Cys-X₃-X_a-X-Val-X-Ser-X_c-X_b-X-Arg-His-X_3-5-His (SEQ. ID. NR. 72),
X_a-X-Cys-X_2-5-Cys-X₃-X_a-X-Gln-X-Ser-His-X_b-X-Arg-His-X_3-5-His (SEQ. ID. NR. 73),
X_a-X-Cys-X_2-5-Cys-X₃-X_a-X-Gln-X-Ser-Asn-X_b-X-Val-His-X_3-5-His (SEQ. ID. NR. 74),
X_a-X-Cys-X_2-5-Cys-X₃-X_a-X-Gln-X-Ser-X_c-X_b-X-Arg-His-X_3-5-His (SEQ. ID. NR. 75),
X_a-X-Cys-X_2-5-Cys-X₃-X_a-X-Gln-X-Ala-His-X_b-X-Arg-His-X_3-5-His (SEQ. ID. NR. 150),
X_a-X-Cys-X_2-5-Cys-X₃-X_a-X-Gln-X-Phe-Asn-X_b-X-Arg-His-X_3-5-His (SEQ. ID. NR. 151),
X_a-X-Cys-X_2-5-Cys-X₃-X_a-X-Gln-X-Ser-His-X_b-X-Thr-His-X_3-5-His (SEQ. ID. NR. 152),
X_a-X-Cys-X_2-5-Cys-X₃-X_a-X-Gln-X-Ser-His-X_b-X-Val-His-X_3-5-His (SEQ. ID. NR. 153),
X_a-X-Cys-X_2-5-Cys-X₃-X_a-X-Gln-X-Ser-Asn-X_b-X-Ile-His-X_3-5-His (SEQ. ID. NR. 154),
X_a-X-Cys-X_2-5-Cys-X₃-X_a-X-Gln-X-Ser-Asn-X_b-X-Arg-His-X_3-5-His (SEQ. ID. NR. 155),
X_a-X-Cys-X_2-5-Cys-X₃-X_a-X-Gln-X-Thr-His-X_b-X-Gln-His-X_3-5-His (SEQ. ID. NR. 156),
Cys-X_2-5-Cys-X₃-X_a-X-Gln-X-Thr-His-X_b-X-Arg-His-X_3-5-His (SEQ. ID. NR. 157),
X_a-X-Cys-X_2-5-Cys-X₃-X_a-X-Arg-X-Asp-Lys-X_b-X-Ile-His-X_3-5-His (SEQ. ID. NR. 158),
X_a-X-Cys-X_2-5-Cys-X₃-X_a-X-Arg-X-Ser-Asn-X_b-X-Arg-His-X_3-5-His (SEQ. ID. NR. 159),
X_a-X-Cys-X_2-5-Cys-X₃-X_a-X-Gln-X-Gly-Asn-X_b-X-Arg-His-X_3-5-His (SEQ. ID. NR. 161),
X_a-X-Cys-X_2-5-Cys-X₃-X_a-X-Arg-X-Asp-Glu-X_b-X-Arg-His-X_3-5-His (SEQ. ID. NR. 162),
X_a-X-Cys-X_2-5-Cys-X₃-X_a-X-Arg-X-Asp-His-X_b-X-Arg-His-X_3-5-His (SEQ. ID. NR. 163),
X_a-X-Cys-X_2-5-Cys-X₃-X_a-X-Arg-X-Asp-His-X_b-X-Thr-His-X_3-5-His (SEQ. ID. NR. 164),
X_a-X-Cys-X_2-5-Cys-X₃-X_a-X-Arg-X-Asp-Lys-X_b-X-Arg-His-X_3-5-His (SEQ. ID. NR. 165),
X_a-X-Cys-X_2-5-Cys-X₃-X_a-X-Arg-X-Ser-His-X_b-X-Arg-His-X_3-5-His (SEQ. ID. NR. 166) oder
X_a-X-Cys-X_2-5-Cys-X₃-X_a-X-Arg-X-Thr-Asn-X_b-X-Arg-His-X_3-5-His (SEQ. ID. NR. 167),
wobei es sich bei X_a um Phenylalanin oder Tyrosin, bei X_b um einen hydrophoben Rest und bei X_c um Serin oder Threonin handelt. Die Nukleinsäuren der Erfindung beinhalten Nukleinsäuren mit dem Code für die vorstehend angegebenen Polypeptide.
Außerdem können aufgereinigte Polypeptide der erfindungsgemäßen Verfahren Aminosäuresequenzen besitzen, die zu 50%, 60%, 70%, 80%, 90%, 93%, 95%, 96%, 98%, 99% oder 100% identisch zu SEQ. ID. NRn.: 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 103, 105, 107, 111, 113, 115, 117, 119, 121, 123, 125, 127, 129, 131, 133, 135, 137, 141, 143, 145, 147, 149 oder 151 sind. Die Polypeptide können identisch sein zu SEQ. ID. NRn.: 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 103, 105, 107, 111, 113, 115, 117, 119, 121, 123, 125, 127, 129, 131, 133, 135, 137, 141, 143, 145, 147, 149 oder 151 an den Aminosäurepositionen, die den Nukleinsäure-kontaktierenden Resten des Polypeptids entsprechen. Als Alternative unterscheiden sich die Polypeptide von den SEQ. ID. NRn.: 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 103, 105, 107, 111, 113, 115, 117, 119, 121, 123, 125, 127, 129, 131, 133, 135, 137, 141, 143, 145, 147, 149 oder 151 bei mindestens einem der Reste, die den Nukleinsäure-kontaktierenden Resten des Polypeptids entsprechen. Die aufgereinigten Polypeptide können außerdem ein(e) oder mehrere der folgenden beinhalten: eine heterologe DNA-Bindungsdomäne, ein Zellkernlokalisierungssignal, eine Kleinmolekül-Bindungsdomäne (z. B. eine Steroidbindungsdomäne), einen Epitop Tag- oder Aufreinigungs-Hilfe ("handle"), eine katalytische Domäne (z. B. eine Nukleinsäure-modifizierende Domäne, eine Nukleinsäure-spaltende Domäne oder eine DNA-Reparatur-katalytische Domäne) und/oder eine Transkriptionsfunktionsdomäne (z. B. eine Aktivierungsdomäne, eine Repressionsdomäne und so weiter). Die Verfahren der Erfindung beinhalten darüber hinaus isolierte Nukleinsäuresequenzen mit dem Code für die vorstehend angegebenen Polypeptide und isolierte Nukleinsäuresequenzen, die unter Bedingungen hoher Stringenz an eine Einzelstrangsonde im Sinne der Hybridisation binden, wobei die Sequenz der Sonde aus den SEQ. ID. NRn: 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 102, 104, 106, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 136, 140, 142, 144, 146, 148 oder 150 oder den Komplementen derselben besteht. Darüber hinaus beinhaltet die Erfindung ein Verfahren zur Expression eines Polypeptids der Erfindung, das an eine heterologe Nukleinsäure-Bindungsdomäne fusioniert ist, in einer Zelle. Das Verfahren beinhaltet die Einführung einer Nukleinsäure mit dem Code für das vorstehend angegebene Fusionsprotein in eine Zelle. Eine Nukleinsäure der Erfindung kann auf operative Weise durch eine heterologe Nukleinsäuresequenz, z. B. einen induzierbaren Promoter (z. B. ein Steroidhormon-regulierter Promoter, ein Kleinmolekül-regulierter Promoter oder ein gentechnisch hergestelltes induzierbares System, wie die Tetrazyklin Tet-On und Tet-Off-Systeme), reguliert werden.
Der Begriff "Base-kontaktierende Positionen" bezieht sich auf die vier Aminosäurepositionen von Zinkfingerdomänen, die strukturell den Aminosäuren ArGlnin 73, AsparaGlnsäure 75, Glutaminsäure 76 und ArGlnin 79 der SEQ. ID. NR.: 21 entsprechen. Auf diese Positionen wird auch als Positionen -1, 2, 3 und 6 Bezug genommen. Zur Identifizierung von Positionen in einer Suchanfragesequenz, die den Base-kontaktierenden Positionen entsprechen, wird ein Alignment der Suchanfragesequenz an die Zinkfingerdomäne von Interesse derart vorgenommen, dass die Cystein- und Histidinreste der Suchanfragesequenz im Alignment an denen von Finger 3 von Zif268 angelegt sind. Der ClustalW WWW-Dienst des European Bioinformatics Institute (http://www2.ebi.ac.uk/clustalw; Thompson et al. (1994) Nucleic Acids Res. 22:4673-4680) bietet ein praktisch bequemes Verfahren zum Sequenzalignment.
Der Begriff "heterolog" bezieht sich auf ein Polypeptid, das durch künstliche Mittel in einen Kontext eingefügt wird und nicht auf natürliche Weise in dem selben Kontext vorkommt. Zum Unterschied von einer endogenen Einheit kann ein heterologes Polypeptid eine flankierende Polypeptidsequenz an mindestens einer Seite neben sich haben, die in keinem natürlichen vorkommenden Polypeptid an ihrer Seite wäre. Der Begriff "Hybrid" bezieht sich auf ein Polypeptid, das Aminosäuresequenzen umfasst, die sich ableiten entweder von (i) mindestens zwei verschiedenen natürlich vorkommenden Sequenzen, (ii) mindestens einer künstlichen Sequenz (d. h. einer Sequenz, die nicht natürlich vorkommt) und einer natürlich vorkommenden Sequenz oder (iii) mindestens zwei unterschiedlichen künstlichen Sequenzen. Beispiele für künstliche Sequenzen beinhalten u. a. Mutanten einer natürlich vorkommenden Sequenz und Sequenzen mit einer de novo-Gestaltung.
Bei Verwendung im vorliegenden Schriftstück bezieht sich der Begriff "hybridisiert unter stringenten Bedingungen" auf Bedingungen für die Hybridisation in 6 × Natriumchlorid/Natriumcitrat (SSC) bei 45°C, gefolgt von zwei Waschdurchgängen in 0,2 × SSC, 0,1% SDS bei 65°C.
Der Begriff "Bindungspräferenz" bezieht sich auf die diskriminierende Eigenschaft eines Polypeptids bezüglich der Auswahl einer Nukleinsäurebindungsstelle relativ zu einer anderen. Wenn das Polypeptid beispielsweise in seiner Menge limitierend ist relativ zu den Nukleinsäurebindungsstellen, wird in einem im vorliegenden Schriftstück beschriebenen In-vivo- oder In-vitro-Assay eine größere Menge des Polypeptids an die bevorzugte Stelle relativ zu der anderen Stelle binden.
Bei Verwendung im vorliegenden Schriftstück bezieht sich der Begriff "erkennt" auf die Fähigkeit eines Polypeptids zwischen einer Nukleinsäurebindungsstelle und einer zweiten Nukleinsäurebindungsstelle, die dazu im Wettbewerb steht, so zu unterscheiden, dass das Polypeptid, z. B. im Kontext mit einem im vorliegenden Schriftstück beschriebenen Assay, auch in Anwesenheit eines Überschusses der zweiten Stelle an die erste Stelle gebunden bleibt. Möglicherweise besitzt das Polypeptid keine ausreichende Affinität für die erste Stelle, um alleine daran binden zu können, könnte aber im Assay bestimmt werden, wenn es wie bei einem Hybridpolypeptid der Erfindung an eine andere Nukleinsäurebindungsdomäne fusioniert wäre, die an eine in der Nähe gelegene Rekrutierungsstelle bindet.
Bei Verwendung im vorliegenden Schriftstück bezieht sich der Begriff "degenerierte Oligonukleotide" sowohl auf (a) eine Population von unterschiedlichen Oligonukleotiden und (b) eine einzelne Art von Oligonukleotid, die an mehr als eine Sequenz durch Annealing binden kann, z. B. ein Oligonukleotid mit einem nicht-natürlichen Nukleotid, wie Inosin.
Die vorliegende Erfindung bietet zahlreiche Nutzeffekte. Die Fähigkeit zur Auswahl einer DNA-Bindungsdomäne, die eine bestimmte Sequenz erkennt, erlaubt die Gestaltung neuartiger Polypeptide, die an spezifische Stellen auf einer DNA binden. Somit ermöglicht die Erfindung die maßgeschneiderte Erzeugung von neuartigen Polypeptiden, die die Expression eines ausgewählten Ziels regulieren können, z. B. kann ein von einem Krankheitserreger benötigtes Gen reprimiert werden, kann ein für das Krebswachstum benötigtes Gen reprimiert werden, kann ein schwach exprimiertes Gen oder ein Gen mit dem Code für ein mutiertes Protein aktiviert und überexprimiert werden, und so weiter.
Die Verwendung von Zinkfingerdomänen ist besonders vorteilhaft. Zum einen erkennt das Zinkfingermotiv stark unterschiedliche DNA-Sequenzen. Zweitens besitzen natürlich vorkommende Zinkfingerproteine eine modulare Struktur. Beispielsweise das Zinkfingerprotein Zif268, das auch als "Egr-1" bezeichnet wird, setzt sich aus einem Tandem-Array aus drei Zinkfingerdomänen zusammen. In 1 ist die röntgenkristallografische Struktur des Zinkfingerproteins Zif268 zu sehen, die aus drei Fingern in einem Komplex mit DNA besteht (Pavletich and Pabo, (1991) Science 252:809-817). Unabhängig voneinander ist jeder Finger mit 3-4 Basenpaaren der DNA-Erkennungsstelle in Kontakt. Folglich kann die von jedem einzelnen Finger kontaktierte Unterstelle als ein unabhängiges molekulares Erkennungsereignis angesehen werden. Die Bindung mit hoher Affinität wird durch den kooperativen Effekt des Vorhandenseins von multiplen Zinkfingermodulen in der selben Polypeptidkette erreicht.
Die Verwendung eines In-vivo-Auswahlschritts ermöglicht die unmittelbare Identifizierung derjenigen Polypeptide, die im intrazellulären Milieu an eine spezifische Stelle auf einer DNA binden. Die mit der Erkennung in einer Zelle, insbesondere einer eukaryotischen Zelle, verbundenen Faktoren können sich stark von den Faktoren unterscheiden, die bei einer In-vitro-Auswahlsituation vorhanden sind. Beispielsweise steht ein Polypeptid in einem eukaryotischen Zellkern notwendigerweise mit der Unzahl anderer Kernproteine im Wettbewerb um eine spezifische Nukleinsäurebindungsstelle. Ein Nukleosom oder sonstiges Chromatinprotein kann die Bindungsstelle besetzen, verlegen oder im Wettbewerb um diese stehen. Selbst im ungebundenen Zustand unterliegt die Konformation einer Nukleinsäure in der Zelle Biege-, Supercoiling-, Torsions- und Auseinanderwicklungseinflüssen. Das Polypeptid ist andererseits Proteasen und Chaperonen ausgesetzt, um nur einige Faktoren zu nennen. Darüber hinaus sieht sich das Polypeptid einem ganzen Genom voller möglicher Bindungsstellen gegenüber und muss daher mit einer hohen Spezifität für die gewünschte Stelle ausgestattet sein, um den Auswahlprozess zu überstehen. Im Gegensatz zur Auswahl unter In-vivo-Bedingungen kann eine In-vitro-Auswahl im Hinblick auf den Binder mit der höchsten Affinität anstatt dem Binder mit der höchsten Spezifität stattfinden.
Die Verwendung eines Reportergens als Hinweis auf die Bindungsfähigkeit einer exprimierten Polypeptidchimäre ist nicht nur effizient und einfach, sondern verdeutlicht darüber hinaus die Notwendigkeit zur Entwicklung eines komplexen Wechselwirkungscodes, der die Energieeigenschaften der Protein-Nukleinsäure-Schnittstelle und die immense Anzahl von peripheren Faktoren, wie umgebende Reste und Nukleotide, berücksichtigt, die die Bindungsschnittstelle ebenfalls beeinflussen. (Segal et al. (1999) Proc. Natl. Acad. Sci. USA 96:2758-2763).
Die vorliegende Erfindung macht Gebrauch von allen Zinkfingerdomänen, die im menschlichen Genom oder jedem beliebigen anderen Genom vorhanden sind. Diese breitgefasste Abdeckung des von der strukturellen Faltung der Zinkfingerdomäne belegten Sequenzraums könnte weitere Vorteile mit sich bringen, die sich aus Ewigkeiten der natürlichen Selektion ergeben. Darüber hinaus sorgt die Nutzung von Domänen aus der Wirtsspezies dafür, dass es weniger wahrscheinlich ist, dass ein durch die im vorliegenden Schriftstück beschriebenen Verfahren gentechnisch für eine Gentherapieanwendung hergestelltes DNA-Bindungsprotein von der Immunantwort des Wirtes als fremd angesehen wird.
Die Einzelheiten von einer oder mehreren Ausführungsformen der Erfindung werden in den Begleitzeichnungen und der folgenden Beschreibung erläutert. Weitere Merkmale, Aufgaben und Vorteile der Erfindung sind aus den Beschreibungen und Zeichnungen sowie aus den Ansprüchen ersichtlich.
BESCHREIBUNG DER ZEICHNUNGEN
1 ist eine Darstellung der dreidimensionalen Struktur des Zinkfingerproteins Zif268, das aus drei Zinkfingerdomänen besteht und an die DNA-Sequenz, 5'-GCG TGG GCG T-3' bindet. Die schwarzen Kreise geben die Lage der Zinkionen an.
2 ist eine Erläuterung der Wasserstoffbindungs-Wechselwirkungen zwischen Aminosäureresten von Zif268 und DNA-Basen. Aminosäurereste in den Positionen -1, 2, 3 und 6 entlang der α-Helix stehen in Wechselwirkung mit den Basen an spezifischen Positionen. Die fettgedruckten Linien stellen die ideale Wasserstoffbindung dar, während die gestrichelten Linien die potenziellen Wasserstoffbindungen darstellen.
3 ist eine Erkennungscode-Tabelle, in der die Wechselwirkungen zwischen DNA-Basen und Aminosäureresten an den Positionen -1, 2, 3 und 6 entlang der α-Helix einer Zinkfingerdomäne zusammengefasst sind.
4 ist eine Darstellung der Positionen von Aminosäureresten und der zugehörigen 3 Basentriplets. Die fettgedruckten Linien stellen die wichtigsten beobachteten Wechselwirkungen dar, während die gestrichelte Linie eine Hilfswechselwirkung darstellt.
5 ist eine grafische Darstellung zur Erläuterung der Grundlagen des im vorliegenden Schriftstück offengelegten In-vivo-Auswahlsystems. Von den verschiedenen Zinkfingermutanten erkennt Zinkfingerdomäne A die Zielsequenz (durch XXX X angegeben) und aktiviert die Transkription des Reportergens HIS3. Als Ergebnis wachsen Hefekolonien auf einem Medium, dem Histidin fehlt. Im Gegensatz dazu erkennt Zinkfingerdomäne B die Zielsequenz nicht und das Reportergen bleibt daher reprimiert. Als Ergebnis wachsen keine Kolonien auf einem Medium, dem Histidin fehlt. AD stellt die Transkriptionsaktivierungsdomäne dar.
6 ist eine Liste von 10-bp-Sequenzen, die in Long Terminal Repeats (LTRs) von HIV-1 und in der Promoterregion von CCR5, einem Humangen mit dem Code für einen Korezeptor für HIV-1 (SEQ. ID. NRn.: 1-5) zu finden sind. Die unterstrichenen Teile stellen 4-bp-Zielsequenzen dar, die bei der vorliegenden Auswahl verwendet wurden.
7 ist eine Darstellung der Basensequenzen der mit dem Reportergen verknüpften Bindungsstellen (SEQ. ID. NRn.: 6-17). Jede Bindungsstelle besteht aus einem Tandem-Array von 4 zusammengesetzten Bindungssequenzen. Jede zusammengesetzte Bindungssequenz wurde durch Verbindung der gestutzten Bindungssequenz 5'-GG GCG-3', die von Finger 1 und Finger 2 von Zif268 erkannt wird, mit 4-bp-Zielsequenzen konstruiert.
8 ist eine grafische Darstellung von pPCFMS-Zif, einem Plasmid, das zur Konstruktion einer Bibliothek von Hybridplasmiden (SEQ. ID. NRn.: 18 und 19) verwendet werden kann.
9 ist eine Darstellung der Basensequenz für das Gen mit dem Code für Zinkfingerprotein Zif268 nach Einführung in pPCFMS-Zif und der entsprechenden übersetzten Aminosäuresequenzen (SEQ. ID. NRn.: 20 und 21). Die von Restriktionsenzymen erkannten Stellen sind unterstrichen dargestellt.
10 ist eine fotografische Aufnahme einer Kulturplatte mit Hefezellen, die durch Re-Transformation und Kreuztransformation unter Verwendung von Zinkfingerproteinen erhalten wurden, die mit dem In-vivo-Auswahlsystem ausgewählt wurden.
11 ist eine Liste einiger DNA-Sequenzen von Zinkfingerdomänen, die mit dem In-vivo-System aus einer aus dem Humangenom abgeleiteten Zinkfingerbibliothek ausgewählt wurden, und von Aminosäuresequenzen, deren Code die DNA-Sequenzen enthalten (SEQ. ID. NRn.: 22-33). Unterstrichen dargestellt sind die DNA-Sequenzen, die den degenerierten PCR-Primern entsprechen, die zur Amplifikation von DNA-Segmenten mit dem Code für Zinkfingerdomänen im Humangenom verwendet wurden. Die vier potenziellen Base-kontaktierenden Positionen sind angegeben und die Aminosäurereste sind in Fettdruck dargestellt. Die beiden Cys-Reste und die beiden His-Reste, die der Erwartung zufolge eine koordinative Bindung mit dem Zinkion eingehen, sind in Kursivschrift dargestellt.
EINGEHENDE BESCHREIBUNG
Die Erfindung bietet ein neuartiges Screeningverfahren zur Ermittlung der Nukleinsäurebindungspräferenzen von Testzinkfingerdomänen. Das Verfahren lässt sich auf einfache Weise für eine Reihe von DNA-Bindungsdomänen, eine Reihe von Quellen für Domänen dieser Art und eine Anzahl von Bibliothekstrukturen, Reportergenen und Auswahl- und Screeningsystemen anpassen. Das Screeningverfahren lässt sich als Hochdurchsatzplattform umsetzen. Durch das Screeningverfahren erhaltene Informationen können auf leichte Weise auf ein Verfahren zur Gestaltung von künstlichen Nukleinsäurebindungsproteinen anwenden. Das Gestaltungsverfahren nutzt die Bindungspräferenzen von Testzinkfingerdomänen, um den modularen Zusammenbau eines chimären Nukleinsäurebindungsproteins zu leiten. Ein gestaltetes Protein kann mit dem Screeningverfahren weiter optimiert werden oder variiert werden.
DNA-Bindungsdomänen
Die Erfindung nutzt Sammlungen von Nukleinsäurebindungsdomänen mit unterschiedlichen Bindungsspezifitäten. Es ist eine Reihe von Proteinstrukturen bekannt, die mit hoher Affinität und hoher Spezifität an Nukleinsäuren binden. Diese Strukturen werden in einer Unzahl von unterschiedlichen Proteinen zur spezifischen Steuerung der Nukleinsäurefunktion wiederverwendet (für Übersichtsartikel zu strukturellen Motiven, die doppelsträngige DNA erkennen, siehe, z. B. Pabo and Sauer (1992) Annu. Rev. Biochem. 61:1053-95; Patikoglou and Burley (1997) Annu. Rev. Biophys. Biomol. Struct. 26:289-325; Nelson (1995) Curr Opin Genet Dev. 5:180-9). Einige nicht-einschränkende Beispiele für Nukleinsäurebindungsdomänen sind u. a.:
Zinkfinger.
Zinkfinger sind kleine Peptiddomänen aus ungefähr 30 Aminosäureresten, in denen vier Aminosäuren, entweder Cystein oder Histidin, räumlich geeignet angeordnet sind, um koordinativ an ein Zinkion zu binden (1; für Übersichtsartikel, siehe z. B. Klug and Rhodes, (1987) Trends Biochem. Sci. 12:464-469 (1987); Evans and Hollenberg, (1988) Cell 52:1-3; Payre and Vincent, (1988) FEBS Lett. 234:245-50; Miller et al., (1985) EMBO J. 4:1609-1614; Berg, (1988) Proc. Natl. Acad. Sci. USA 85:99-102; Rosenfeld and Margalit, (1993) J. Biomol. Struct. Dyn. 11:557-570). Zinkfingerdomänen können somit anhand der Identität der Reste, die eine koordinative Bindung mit dem Zinkion eingehen, klassifiziert werden, z. B. als die Cys₂-His₂-Klasse, die Cys₂-Cys₂-Klasse, die Cys₂-CysHis-Klasse und so weiter. Die Reste von Cys₂-His₂-Zinkfingern in koordinativer Bindung mit Zink sind im typischen Fall räumlich wie folgt angeordnet: X_a-X-C-X_2-5-C-X₃-X_a-X₅-ψ-X₂-H-X_3-5-H, wobei ψ (psi) einen hydrophoben Rest darstellt (Wolfe et al., (1999) Annu. Rev. Biophys. Biomol. Struct. 3:183-212) (SEQ. ID. NR.: 76), wobei "X" eine beliebige Aminosäure darstellt, wobei X_a ein Phenylalanin oder Tyrosin darstellt und ein tiefgesetzter Index die Anzahl der Aminosäuren angibt und zwei tiefgesetzte Indices einen typischen Bereich von Zwischenaminosäuren angeben. Im typischen Fall falten sich die Zwischenaminosäuren zu einer antiparallelen β-Blattstruktur, die gegen eine α-Helix gepackt ist, wobei die antiparallele β-Blattstrukturen aber auch kurz, nicht-ideal oder nicht vorhanden sein können. Durch die Faltung werden die Seitenketten in koordinativer Bindung zu Zink so positioniert, dass sie eine für die koordinative Bindung des Zinkions geeignete Tetraederkonformation annehmen. Die Base-kontaktierenden Reste befinden sich am N-Terminus des Fingers und in der vorhergehenden Loopregion (2). Ein Zinkfinger-DNA-Bindungsprotein besteht im Normalfall aus einem Tandem-Array aus drei oder mehr Zinkfingerdomänen.
Die Zinkfingerdomäne (oder "ZFD") ist eines der häufigsten DNA-Bindungsmotive bei Eukaryoten, das in Tierarten von Hefe über höhere Pflanzen und bis zum Menschen zu finden ist. Einer Schätzung zufolge enthält allein das menschliche Genom mindestens mehrere Tausend Zinkfingerdomänen. Zinkfingerdomänen können aus Zinkfingerproteinen isoliert werden. Nicht-einschränkende Beispiele von Zinkfingerproteinen sind u. a. CF2-II, Kruppel, WT1, Basonuclin, BCL-6/LAZ-3, erythroider Kruppel-ähnlicher Transkriptionsfaktor, Transkriptionsfaktoren Sp1, Sp2, Sp3 und Sp4, Transkriptionsrepressor YY1, EGR1/Krox24, EGR2/Krox20, EGR3/Pilot, EGR4/AT133, Evi-1, GLI1, GLI2, GLI3, HIV-EP1/ZNF40, HIV-EP2, KR1, ZfX, ZfY und ZNF7.
Nachfolgend beschriebene Rechenverfahren können zur Identifizierung aller Zinkfingerdomänen verwendet werden, deren Code in einem sequenzierten Genom oder in einer Nukleinsäuredatenbank enthalten ist. Jede solche Zinkfingerdomäne kann genutzt werden. Darüber hinaus wurden künstliche Zinkfingerdomänen gestaltet, z. B. anhand von Rechenverfahren (z. B. Dahiyat and Mayo, (1997) Science 278:82-7). Der Zinkfinger von Dahiyat und Mayo nimmt die Zinkfingerfaltung an, enthält in seinem Kern aber kein Zinkion. Somit handelt es sich wegen der strukturellen Ähnlichkeit seiner Polypeptid-Rückenkette zur Faltung von natürlich vorkommenden Zinkfingern um ein Zinkfingerprotein und nicht aufgrund der funktionellen Fähigkeit zur koordinativen Bindung eines Zinkions.
Homöodomänen.
Homöodomänen sind einfache eukaryotische Domänen, die aus einem N-terminalen Arm, der mit der kleinen Furche (Minor Groove) der DNA in Kontakt ist, gefolgt von drei α-Helices, die mit der großen Furche (Major Groove) in Kontakt stehen, bestehen (für einen Übersichtsartikel, siehe z. B. Laughon, (1991) Biochemistry 30:11357-67). Die dritte α-Helix liegt in der großen Furche und enthält kritische DNA-kontaktierende Seitenketten. Homöodomänen besitzen ein charakteristisches, hochgradig konserviertes Motiv, das sich am Turn, der in die dritte α-Helix führt, befindet. Das Motiv beinhaltet ein nicht variables Tryptophan, das in den hydrophoben Kern der Domäne gepackt ist. Dieses Motiv ist in der Datenbank Prosite (siehe http://www.expasy.ch/) als
PDOC00027 ([L/I/V/M/F/Y/G]-[A/S/L/V/R]-X(2)-[L/I/V/M/S/T/A/C/N]-X-[L/I/V/M]-X(4)-[L/I/V]-[R/K/N/Q/E/S/T/A/I/Y]-[L/I/V/F/S/T/N/K/H]-W-[F/Y/V/C]-X-[N/D/Q/T/A/H]-X(5)-[R/K/N/A/I/M/W]; SEQ ID NR.77
dargestellt. Homöodomänen sind häufig vorhanden in Transkriptionsfaktoren, die die Identität der Zelle bestimmen, und bieten Lageinformationen bei der Entwicklung des Organismus. Im Genom sind klassische Homöodomänen dieser Art in Clustern zu finden, so dass die Reihenfolge der Nomöodomänen im Cluster ungefähr ihrem Expressionsmuster entlang der Körperachse entspricht. Homöodomänen können durch ein Alignment mit einer Homöodomän, z. B. Hox-1, oder durch Alignment mit einem Homöodomänenprofil oder einem Homöodomänen-HMM (Hidden Markov Model, siehe nachfolgend), z. B. PF00046 der Datenbank Pfam oder "HOX" der Datenbank SMART (http://smart.embl-heidelberg.de/) oder, wie bereits erwähnt, über das Prosite-Motiv PDOC00027 identifiziert werden.
Helix-Turn-Helix-Proteine.
Dies ist ein häufiges DNA-Bindungsmotiv bei zahlreichen prokaryotischen Transkriptionsfaktoren. Es gibt zahlreiche Unterfamilien, z. B. die LacI-Familie, die AraC-Familie, um nur einige zu nennen. Die beiden in der Bezeichnung genannten Helices beziehen sich auf eine erste α-Helix, die gegen eine zweite α-Helix gepackt ist und diese in der großen Furche der DNA liegen lässt. Domänen dieser Art können durch Alignment mit einem HMM, z. B. HTH_ARAC, HTH_ARSR, HTH_ASNC, HTH_CRP, HTH_DEOR, HTH_DTXR, HTH_GNTR, HTH_ICLR, HTH_LACI, HTH_LUXR, HTH_MARR, HTH_MERR und HTH_XRE Profilen, die in der Datenbank SMART (http://smart.embl-heidelberg.de/) zur Verfügung stehen, identifiziert werden.
Helix-Loop-Helix-Proteine.
Diese DNA-Bindungsdomäne ist bei homo- und heterodimeren Transkriptionsfaktoren, z. B. MyoD, fos, jun, E11 und Myogenin, häufig zu finden. Die Domäne besteht aus einem Dimer dessen Monomere jeweils zwei α-Helices und einen Zwischen-Loop beitragen. Die Domäne kann durch Alignment mit einem HMM, z. B. dem in der Datenbank SMART (http://smart.embl-heidelberg.de/) zur Verfügung stehenden "HLH"-Profil, identifiziert werden. Obwohl Helix-Loop-Helix-Proteine im typischen Fall dimer sind, können auch monomere Versionen konstruiert werden, indem mit gentechnischen Methoden ein Polypeptid-Linker zwischen den beiden Untereinheiten eingefügt wird, so dass ein einzelnes offenes Leseraster den Code für die beiden Untereinheiten und den Linker enthält.
Identifikation von DNA-Bindungsdomänen
Zur Identifikation von Strukturdomänen kann eine Reihe von Verfahren verwendet werden.
Rechenverfahren.
Die Aminosäuresequenz einer DNA-Bindungsdomäne, die mit einem im vorliegenden Schriftstück beschriebenen Verfahren isoliert wurde, kann mit einer Datenbank aus bekannten Sequenzen verglichen werden, z. B. einer mit Anmerkungen versehenen Datenbank aus Proteinsequenzen oder einer mit Anmerkungen versehenen Datenbank, die Einträge für Nukleinsäurebindungsdomänen beinhaltet. Bei einer anderen Umsetzung können Datenbanken aus nicht-charakterisierten Sequenzen, z. B. nicht mit Anmerkungen versehene genomische, EST- oder cDNA-Sequenzen voller Länge; aus charakterisierten Sequenzen, z. B. SwissProt oder PDB; und aus Domänen, z. B. Pfam, ProDom (http://tooulouse.inra.fr/) und SMART (Simple Modular Architecture Research Tool, http://smart.embl-heidelberg.de/) eine Quelle von Sequenzen von Nukleinsäurebindungsdomänen bieten. Nukleinsäuresequenz-Datenbanken können für die Zwecke des Vergleichs mit einer Suchanfragen-Aminosäuresequenz in alle sechs Leseraster übersetzt werden. Nukleinsäuresequenzen, die die Flag enthalten, dass sie den Code für Kandidaten-Nukleinsäurebindungsdomänen enthalten, können aus einer geeigneten Nukleinsäurequelle, z. B. genomischer DNA oder zellulärer RNA, amplifiziert werden. Aminosäuresequenzen dieser Art können in einen Expressionsvektor hinein kloniert werden. Die Verfahren zur computerbasierten Domänenidentifizierung können über Schnittstellen mit einem Oligonukleotid-Synthetisiergerät und Robotsystemen verbunden werden, um Nukleinsäuren mit dem Code für die Domänen in einer Hochdurchsatzplattform zu produzieren. Geklonte Nukleinsäuren mit dem Code für Kandidatendomänen können auch in einem Wirts-Expressionsvektor gespeichert werden und auf leichte Weise in einen Expressionsvektor überführt werden, z. B. in einen Translations-Fusionsvektor mit Finger 1 und 2 von Zif268, und zwar entweder durch Restriktionsenzym-vermitteltes Subcloning or durch stellenspezifisches, Rekombinase-vermitteltes Subcloning (siehe U.S.-Patent 5,888,732). Die Hochdurchsatzplattform kann zur Erzeugung von multiplen Mikrotiterplatten verwendet werden, die Nukleinsäuren mit dem Code für verschiedene Kandidaten-Nukleinsäurebindungsdomänen enthalten.
Detaillierte Verfahren zur Identifizierung von Domänen aus einer Startsequenz oder einem -profil sind nach dem Stand der Technik wohlbekannt. Siehe beispielsweise Prosite (Hofmann et al., (1999) Nucleic Acids Res. 27:215-219), FASTA, BLAST (Altschul et al., (1990) J. Mol. Biol. 215:403-10), usw. Es kann eine einfache Stringsuche durchgeführt werden, um Aminosäuresequenzen zu finden, die identisch zu einer Suchanfragen-Sequenz oder einem Suchanfragen-Profil sind, z. B. durch Verwendung von PerI (http://bio.perI.org/) zum Durchsuchen von Textdateien. Auf diese Weise identifizierte Sequenzen können ungefähr 30%, 40%, 50%, 60%, 70%, 80%, 90% oder mehr identisch zu einer anfänglich eingegebenen Sequenz sein.
Domänen mit Ähnlichkeit zu einer Suchanfragen-Domäne können aus einer öffentlichen Datenbank identifiziert werden, z. B. durch Verwendung der XBLAST-Programme (Version 2.0) von Altschul et al. (1990) J. Mol. Biol. 215:403-10. BLAST-Proteinsuchen können beispielsweise mit den folgenden XBLAST-Parametern durchgeführt werden: score = 50, wordlength = 3. Lücken (Gaps) können in die Suchanfrage oder die durchsuchten Sequenzen nach der Beschreibung von Altschul et al., (1997) Nucleic Acids Res. 25(17):3389-3402 eingefügt werden. Vorgabeparameter für die Programme XBLAST und Gapped XBLAST sind erhältlich unter http://www.ncbi.nlm.nih.gov.
Die Prosite-Profile PS00028 und PS50157 können zur Identifizierung von Zinkfingerdomänen verwendet werden. In einem SWISSPROT-Release mit 80.000 Proteinsequenzen wurden mit diesen Profilen 3189 bzw. 2316 Zinkfingerdomänen nachgewiesen. Profile können mit einer Reihe von unterschiedlichen Techniken aus einem Alignment multipler Sequenzen von verwandten Proteinen konstruiert werden. Gribskov und Mitarbeiter (Gribskov et al., (1990) Meth. Enzymol. 183:146-159) nutzten eine Symbolvergleichstabelle zur Umwandlung eines Alignments multipler Sequenzen, das Häufigkeitsverteilungen der Reste enthielt, in Gewichtungen für die einzelnen Positionen. Siehe beispielsweise die Datenbank PROSITE und die Arbeiten von Luethy et al., (1994) Protein Sci. 3:139-1465.
Hidden Markov Modelle (HMMs), die eine DNA-Bindungsdomäne von Interesse abbilden, können aus einer Datenbanken solcher Modelle erzeugt oder erhalten werden, z. B. der Datenbank Pfam, Release 2.1. Eine Datenbank kann mit dem HMM durchsucht werden, z. B. unter Verwendung der Vorgabeparameter, um zusätzliche Domänen zu finden (für Vorgabeparameter siehe z. B. http://www.sanger.ac.uk/Software/Pfam/HMM_Search). Als Alternative kann der Benutzer die Parameter optimieren. Es kann ein Grenzscore zur Filterung der Datenbank aus Sequenzen ausgewählt werden, so dass Sequenzen mit einem größeren Score als der Grenzwert als Kandidatendomänen angezeigt werden. Eine Beschreibung der Datenbank Pfam ist Sonhammer et al., (1997) Proteins 28(3):405-420 zu entnehmen und eine detaillierte Beschreibung von HMMs ist beispielsweise in Gribskov et al., (1990) Meth. Enzymol. 183:146-159; Gribskov et al., (1987) Proc. Natl. Acad. Sci. USA 84:4355-4358; Krogh et al., (1994) J. Mol. Biol. 235:1501-1531 und Stultz et al., (1993) Protein Sci. 2:305-314 zu finden.
Die Datenbank SMART (Simple Modular Architecture Research Tool, http://smart.embl-heidelberg.de/; Schultz et al., (1998) Proc. Natl. Acad. Sci. USA 95:5857 und Schultz et al., (2000) Nucl. Acids Res. 28:231) bietet einen Katalog aus Zinkfingerdomänen (ZnF_C2H2, ZnF_C2C2, ZnF_C2HC, ZnF_C3H1, ZnF_C4, ZnF_CHCC, ZnF_GATA und ZnF_NFX), die durch Profilsuche mit den Hidden Markov Modellen des Suchprogramms HMMer2 (Durbin et al., (1998) Biological sequence analysis: probabilistic models of proteins and nucleic acids. Cambridge University Press, http://hmmer.wustI.edu/) identifiziert wurden.
Auf Hybridisation basierende Verfahren.
Eine Sammlung von Nukleinsäuren mit dem Code für verschiedene Formen einer DNA-Bindungsdomäne kann profilmäßig analysiert werden, um Sequenzen mit dem Code für konservierte amino- und carboxyterminale Randsequenzen zu ermitteln. Es können degenerierte Oligonukleotide gestaltet werden, die an Sequenzen mit dem Code für konservierte Sequenzen dieser Art durch Hybridisation binden. Darüber hinaus lässt sich die Wirksamkeit von degenerierten Oligonukleotiden dieser Art durch einen Vergleich von deren Zusammensetzung mit der Häufigkeit von möglichen Annealingstellen in bekannten Genomsequenzen schätzen. Multiple Gestaltungszyklen können dazu dienen, die degenerierten Oligonukleotide zu optimieren. Beispielsweise ergibt ein Vergleich von bekannten Cys₂-His₂-Zinkfingern eine gemeinsame bzw. häufig vorhandene Sequenz in der Linkerregion zwischen benachbarten Fingern in der natürlichen Reihenfolge (Agata et al., (1998) Gene 213:55-64). Degenerierte Oligonukleotide dieser Art werden zur Amplifikation einer Vielzahl von DNA-Bindungsdomänen verwendet. Die amplifizierten Domänen werden als Testzinkfingerdomänen in die Hybridnukleinsäure eingefügt und anschließend ein Assay bzgl. der Bindung an eine Zielstelle anhand der im vorliegenden Schriftstück beschriebenen Verfahren durchgeführt.
Gestaltung der Bibliothek
Das Verfahren erlaubt das Screening einer Sammlung von Nukleinsäuren mit dem Code für DNA-Bindungsdomänen (beispielsweise in Form einer Plasmid-, Phagemid- oder Phagenbibliothek) im Hinblick auf funktionelle Nukleinsäurebindungseigenschaften. Die Sammlung kann den Code für eine vielfältige Gruppe von DNA-Bindungsdomänen enthalten, sogar für Domänen mit unterschiedlichen strukturellen Faltungen. In einem Fall enthält die Sammlung den Code für Domänen einer einzelnen strukturellen Faltung, wie eine Zinkfingerdomäne. Die folgenden Verfahren sind zwar im Kontext von Zinkfingerdomänen beschrieben, doch wäre ein Fachmann auf diesem Gebiet in der Lage, sie an Nukleinsäurebindungsdomänen anderer Art anzupassen.
Mutierte Domänen.
In einem weiteren Fall setzt sich die Sammlung aus Nukleinsäuren mit dem Code für eine strukturelle Domäne zusammen, die aus einer degenerierten gemusterten Bibliothek ("degenerate patterned library") zusammengesetzt ist. Zum Beispiel im Fall von Zinkfingern kann ein Alignment von bekannten Zinkfingern genutzt werden, die optimale Aminosäure an jeder Position zu identifizieren. Als Alternative können Strukturstudien und Mutageneseversuche dazu verwendet werden, die bevorzugten Eigenschaften von Aminosäuren an jeder einzelnen Position zu ermitteln. Jede beliebige Nukleinsäurebindungsdomäne kann als ein strukturelles Gerüst für die Einführung von Mutationen dienen. Insbesondere Positionen in enger Nähe zur Nukleinsäurebindungs-Schnittstelle oder benachbart zu einer so gelegenen Position können als Ziele für die Mutagenese dienen. Eine mutierte Testzinkfingerdomäne lässt sich an jeder mutierten Position durch Anwendung einer gemusterten degenerierten Bibliothek auf ein Subset von möglichen Aminosäuren beschränken. Sets von degenerierten Codons können verwendet werden, um den Code für das Profil an jeder einzelnen Position zu bieten. Beispielsweise stehen Codonsets zur Verfügung, die nur den Code für hydrophobe Reste, aliphatische Reste oder hydrophile Reste enthalten. In der Bibliothek kann eine Selektion im Hinblick auf Klone mit voller Länge mit dem Code für gefaltete Polypeptide erfolgen. Cho et al. ((2000) J. Mol. Biol. 297(2):309-19) legt ein Verfahren zur Produktion von degenerierten Bibliotheken dieser Art mit Hilfe von degenerierten Oligonukleotiden vor und legt außerdem ein Verfahren zur Auswahl von Bibliotheks-Nukleinsäuren mit dem Code für Polypeptide vollständiger Länge vor. Nukleinsäuren dieser Art lassen sich auf einfache Weise unter Verwendung von geeigneten Restriktionsenzym-Spaltungsstellen oder Transposase- oder Rekombinase- Erkennungsstellen für die im vorliegenden Schriftstück beschriebenen Verfahren in ein Expressionsplasmid einfügen.
Die Auswahl der geeigneten Codons und der relativen Anteile der einzelnen Nukleotide an einer gegebenen Position kann durch einfache Untersuchung einer Tabelle, die den genetischen Code abbildet, oder durch Rechenalgorithmen bestimmt werden.
Zum Beispiel in Cho et al., dito, wird ein Computerprogramm beschrieben, das eine gewünschte degenerierte Proteinsequenz als Eingabe annimmt und eine bevorzugte Gestaltung von Oligonukleotiden mit dem Code für die Sequenz ausgibt.
Isolierung eines natürlichen Domänenrepertoires.
Eine Domänenbibliothek kann aus genomischer DNA oder cDNA von eukaryotischen Organismen, wie Menschen, konstruiert werden. Zu diesem Zweck sind multiple Verfahren verfügbar. Beispielsweise kann eine Computersuche nach verfügbaren Aminosäuresequenzen dazu dienen, die Domänen auf die vorstehend beschriebene Weise zu identifizieren. Eine Nukleinsäure mit dem Code für jede einzelne Domäne kann isoliert und in einen geeigneten Vektor für die Expression in Zellen eingefügt werden, z. B. einen Vektor, der einen Promoter, eine Aktivierungsdomäne und einen selektierbaren Marker enthält. Bei einem anderen Beispiel werden degenerierte Oligonukleotide, die durch Hybridierung an ein konserviertes Motiv binden, zur Amplifikation, z. B. durch PCR, einer großen Anzahl von verwandten Domänen, die das Motiv enthalten, verwendet. Zum Beispiel können Kruppel-ähnliche Cys₂-His₂-Zinkfinger mit dem Verfahren von Agata et al., (1998) Gene 213:55-64 amplifiziert werden. Bei diesem Verfahren bleiben auch die natürlich vorkommenden Zinkfingerdomänen-Linkerpeptidsequenzen erhalten, z. B. Sequenzen mit dem Muster: Thr-Gly-(Glu/Gln)-(Lys/Arg)-Pro-(Tyr/Phe) (SEQ. ID. NR.: 78). Darüber hinaus verringert das Screening einer auf Domänen von Interesse beschränkten Bibliothek im Gegensatz zum Screening einer Bibliothek aus genomischen oder cDNA-Sequenzen ohne Vorauswahl, die Komplexität der Bibliothek beträchtlich und bewirkt eine signifikante Senkung der Wahrscheinlichkeit, eine gewünschte Sequenz aufgrund der inhärenten Schwierigkeiten beim vollständigen Screening von großen Bibliotheken zu verpassen.
Das menschliche Genom enthält zahlreiche Zinkfingerdomänen, von denen viele noch nicht charakterisiert und noch nicht identifiziert sind. Schätzungen zufolge gibt es Tausende von Genen mit dem Code für Proteine mit Zinkfingerdomänen (Pellegrino and Berg, (1991) Proc. Natl. Acad. Sci. 88:671-675). Diese Human-Zinkfingerdomänen stellen eine umfangreiche Sammlung von vielfaltigen Domänen dar, aus der neuartige DNA-Bindungsproteine konstruiert werden können. Falls jede Zinkfingerdomäne eine unique Sequenz von 3 bis 4 bp erkennt, werden zur Bindung aller möglichen Sequenzen mit 3 bis 4 bp lediglich 64 bis 256 (4³ bis 4⁴) Domänen benötigt. Es besteht die Möglichkeit, dass das natürliche Repertoire des menschlichen Genoms eine ausreichende Anzahl von uniquen Zinkfingerdomänen enthält, um alle möglichen Erkennungsstellen abzudecken. Diese Zinkfingerdomänen sind eine wertvolle Ressource zur Konstruktion von künstlichen chimären DNA-Bindungsproteinen. Im Gegensatz zu künstlichen Mutanten, die aus dem menschlichen Genom abgeleitet sind, haben sich natürlich vorkommende Zinkfingerdomänen unter natürlichen Selektionsdrücken entwickelt und könnten deshalb auf natürliche Weise im Hinblick auf ihre Bindung an spezifische DNA-Sequenzen und ihre In-vivo-Funktion optimiert sein.
Bei Human-Zinkfingerdomänen ist es weitaus weniger wahrscheinlich, dass bei der Einführung in Menschen eine Immunantwort induziert wird, z. B. bei Anwendungen der Gentherapie.
In-vivo-Auswahl von Zinkfingerdomänen, die spezifische DNA-Bindungseigenschaften besitzen
Zinkfingerdomänen mit gewünschten DNA-Erkennungseigenschaften können mit dem folgenden In-vivo-Screeningverfahren identifiziert werden. Eine zusammengesetzte Bindungsstelle von Interesse wird vor (in Leserichtung, "upstream") einem Reportergen so eingeführt, dass die Rekrutierung einer Transkriptionsaktivierungsdomäne zu der zusammengesetzten Bindungsstelle zu einer erhöhten Reportergenstranskription über ein gegebenes Niveau hinaus führt. Es wird ein Expressionsplasmid mit dem Code für ein Hybridprotein konstruiert, das aus einer Testzinkfingerdomäne besteht, die an eine feste DNA-Bindungsdomäne und eine Transkriptionsaktivierungsdomäne fusioniert ist.
Die zusammengesetzte Bindungsstelle beinhaltet mindestens zwei Elemente, eine Rekrutierungsstelle und eine Zielstelle. Das System wird gentechnisch so hergestellt, dass die feste DNA-Bindungsdomäne die Rekrutierungsstelle erkennt. Die Bindungsaffinität der festen DNA-Bindungsdomäne für die Rekrutierungsstelle ist jedoch so, dass sie unter In-vivo-Bedingungen alleine nicht zur Aktivierung der Reportergentranskription ausreicht. Dies lässt sich durch einen Kontrollversuch bestätigen.
Zum Beispiel, wird die feste DNA-Bindungsdomäne in Zellen exprimiert (in Abwesenheit eines Testzinkfingerdomäne oder in Anwesenheit einer Testzinkfingerdomäne, die bekanntlich nicht-funktionell ist oder deren DNA-kontaktierende Reste durch eine alternative Aminosäure wie Alanin ersetzt sind) sollte sie nicht in der Lage sein, die Transkription des Reportergens über ein nominelles Niveau hinaus zu aktivieren. Eine gewisse Leck- oder Niedrigniveau-Aktivierung ist tolerierbar, da das System auf andere Weise sensibilisiert werden kann (z. B. durch die Verwendung eines kompetitiven Hemmstoffs für den Reporter). Es wird erwartet, dass die feste DNA-Bindungsdomäne nicht stabil an die Rekrutierungsstelle bindet. Zum Beispiel kann die feste DNA-Bindungsdomäne mit einer Dissoziationskonstante (K_d) von ungefähr 0,1 nM, 1 nM, 1 μM, 10 μM, 100 μM oder mehr an die Rekrutierungsstelle binden. Die K_d der DNA-Bindungsdomäne für die Zielstelle in Abwesenheit einer Testzinkfingerdomäne oder in Abwesenheit einer Testzinkfingerdomäne mit Spezifität für die zweite Zielstelle kann mit einem EMSA (electrophoretic mobility shift assay) unter In-vitro-Bedingungen gemessen werden.
Folglich ist die Anbringung einer funktionellen Testzinkfingerdomäne notwendig, die die Zielstelle erkennt, z. B. die variable Stelle einer zusammengesetzten Bindungsstelle, damit das Hybridprotein in Zellen stabil an die zusammengesetzte Bindungsstelle binden kann und auf diese Weise das Reportergen aktiviert. Die Bindungspräferenz der Testzinkfingerdomäne für die Zielstelle führt zu einer Steigerung der Reportergenexpression relativ zu dem gegebenen Niveau. Zum Beispiel kann die Steigerung der Reportergenexpression, ausgedrückt durch Teilung des beobachteten Niveaus durch das gegebene Niveau, ungefähr das 2-, 4-, 8-, 20-, 50-, 100-, 1000- oder mehr-fache betragen. Wenn die Testzinkfingerdomäne die Zielstelle erkennt, verringert sich die K_d des Transkriptionsfaktors, der die DNA-Bindungsdomäne und die Testzinkfingerdomäne umfasst, z. B. relativ zu einem Transkriptionsfaktor, dem eine Testzinkfingerdomäne mit Spezifität für die Zielstelle fehlt. Zum Beispiel kann die Dissoziationskonstante (K_d) eines Transkriptionsfaktors im Komplex mit einer Zielstelle, für die er eine Spezifität besitzt, ungefähr 50 nM, 10 nM, 1 nM, 0,1 nM, 0,01 nM oder weniger betragen. Die K_d kann unter In-vitro-Bedingungen mittels EMSA ermittelt werden.
Die Entdeckung, dass die DNA-Bindungsspezifität auf empfindliche und genaue Weise in einem Assay gemessen werden kann, indem die Fähigkeit von Testzinkfingerdomänen zur Verstärkung der in-vivo-Bindungsaffinität einer festen DNA-Bindungsdomäne ermittelt wird, hat die rasche Isolierung und Charakterisierung von neuartigen Zinkfingerdomänen aus dem menschlichen Genom ermöglicht.
Feste DNA-Bindungsdomänen sind u. a. modulare Domänen, die aus natürlich vorkommenden DNA-Bindungsproteinen isoliert werden, z. B. einem natürlich vorkommenden DNA-Bindungsprotein, das multiple Domänen besitzt oder bei dem es sich um ein Oligomer handelt. Zum Beispiel können beide von zwei bekannten Zinkfingern, z. B. Finger 1 und Finger 2 von Zif268, als die feste DNA-Bindungsdomäne verwendet werden. Ein fähiger Fachmann auf diesem Gebiet wäre in der Lage, aus der Unzahl von Nukleinsäurebindungsdomänen (z. B. eine im vorliegenden Schriftstück beschriebene Domänenfamilie, wie eine Homöodomäne, eine Helix-Turn-Helix-Domäne oder eine Helix-Loop-Helix-Domäne oder eine nach dem Stand der Technik gut charakterisierte Nukleinsäurebindungsdomäne) eine geeignete feste DNA-Bindungsdomäne für das System zu identifizieren. Eine geeignete Auswahl einer Rekrutierungsstelle, die von der festen DNA-Bindungsdomäne erkannt wird, ist ebenfalls notwendig. Bei der Rekrutierungsstelle kann es sich um eine Unterstelle innerhalb der natürlichen Bindungsstelle für das natürlich vorkommende DNA-Bindungsprotein handeln, von dem die feste DNA-Bindungsdomäne stammt. Bei Bedarf können Mutationen entweder in die feste Domäne oder in die Rekrutierungsstelle eingeführt werden, um das System zu sensibilisieren.
Geeignete Zellen für das In-vivo-Screeningsystem sind u. a. sowohl eukaryotische als auch prokaryotische Zellen. Beispielhafte eukaryotische Zellen sind u. a. Hefezellen, z. B. Zellen von Saccharomyces cerevisiae, Saccharomyces pombe und Pichia pastoris.
Das Saccharomyces cerevisiae verwendende Ein-Hybrid-Hefesystem wurde modifiziert, um Zinkfingerdomänen mit dem vorstehend angegebenen Screeningssystem auszuwählen. Als erstes wurden Reporterplasmide mit dem Code für das Reportergen HIS3 hergestellt. Die vorbestimmte 4-bp-DNA-Sequenzen wurden mit einer gestutzten Bindungssequenz verbunden, um zusammengesetzte Bindungssequenzen für die DNA-Bindungsdomänen vorzulegen und jeder der zusammengesetzten Bindungssequenzen wurde auf operative Weise auf getrennten Plasmiden mit dem Reportergen verknüpft.
Die Hybridnukleinsäuresequenz enthält den Code für eine Transkriptionsaktivierungsdomäne verknüpft mit einer DNA-Bindungsdomäne, die eine gestutzte DNA-Bindungsdomäne und eine Zinkfingerdomäne umfasst.
Die hierbei verwendeten Bindungsstellen sind nicht unbedingt fortlaufend, obwohl fortlaufende Stellen häufig verwendet werden. Flexible und/oder erweiterbare Linker zwischen Nukleinsäurebindungsdomänen können verwendet werden, um Proteine, die nicht-fortlaufende Stellen erkennen, zu produzieren.
Einem erfindungsgemäßen Aspekt zufolge kann ein aus Finger 1 und Finger 2 von Zif268 zusammengesetztes Polypeptid, das Finger 3 nicht enthält, als eine feste DNA-Bindungsdomäne verwendet werden. (Von den drei Zinkfingerdomänen von Zif268 bezieht sich Finger 1 auf die am N-terminalen Ende befindliche Zinkfingerdomäne, Finger 2 auf die Zinkfingerdomäne in der Mitte und Finger 3 auf die Zinkfingerdomäne am C-terminalen Ende.) Als Alternative können zwei beliebige Zinkfingerdomänen, deren Bindungsstelle charakterisiert wurde, als eine feste DNA-Bindungsdomäne verwendet werden.
Weitere nützliche feste DNA-Bindungsdomänen können von anderen Zinkfingerproteinen abgeleitet werden, wie Sp1, CF2-II, YY1, Kruppel, WT1, Egr2 oder POU-Domänenproteinen, wie Oct1, Oct2 und Pit1. Diese werden nur zu Beispielszwecken vorgelegt und die vorliegende Erfindung ist nicht auf diese beschränkt.
Einem besonderen erfindungsgemäßen Beispiel zufolge kann die durch Löschung von 4 bp vom 5'-Ende der optimalen Erkennungssequenz von Zif268 (5'-GCG TGG GCG-3) abgeleitete Basensequenz 5'-GGGCG-3' als eine Rekrutierungsstelle verwendet werden. Jede beliebige Zielsequenz von 3 bis 4 bp kann mit dieser Rekrutierungsstelle verknüpft werden, um eine zusammengesetzte Bindungssequenz zu ergeben.
Aktivierungsdomänen.
Zu den Transkriptionsaktivierungsdomänen, die bei der vorliegenden Erfindung verwendet werden können, handelt es sich u. a. um die Gal4-Aktivierungsdomäne von Hefe und die VP16-Domäne von Herpes Simplex Virus, ohne auf diese beschränkt zu sein. Bei Bakterien kann die Funktion der Aktivierungsdomäne nachgeahmt werden durch Fusion einer Domäne, die eine C-terminate Domäne der Alpha-Untereinheit von Wildtyp-RNA-Polymerase oder eine mutierte C-terminale Domäne der Alpha-Untereinheit, z. B. eine an eine Proteinwechselwirkungsdomäne fusionierte C-terminale Domäne, rekrutieren kann.
Repressionsdomänen.
Auf Wunsch kann eine Repressionsdomäne anstatt einer Aktivierungsdomäne an die DNA-Bindungsdomäne fusioniert sein. Beispiele für eukaryotische Repressionsdomänen sind u. a. ORANGE, groucho und WRPW (Dawson et al., (1995) Mol. Cell Biol. 15:6923-31). Bei Verwendung einer Repressionsdomäne kann ein toxisches Reportergen und/oder ein nicht-selektierbarer Marker zum Screening im Hinblick auf eine Senkung der Expression verwendet werden.
Reportergene.
Bei dem Reportergen kann es sich um einen selektierbaren Marker handeln, z. B. um ein Gen, das eine Arzneimittelresistenz verleiht, oder um einen auxotrophen Marker. Beispiele für Arzneimittelresistenzgene sind u. a. die Cyclohexamidresistenz von S. cerevisiae (CYH), das Canavaninresistenzgen von S. cerevisiae (CAN1) und das Hygromycinresistenzgen. Auxotrophe Marker von S. cerevisiae sind u. a. die Gene URA3, HIS3, LEU2, ADE2 und TRP1. Handelt es sich bei dem Reportergen um einen auxotrophen Marker, fehlt den Zellen eine funktionelle Kopie des auxotrophen Gens, so dass die Fähigkeit zur Produktion eines bestimmten Stoffwechselprodukts verwendet wird. Die Auswahl von Konstrukten mit dem Code für Testzinkfingerdomänen, die eine Zielstelle binden, wird durch Kultivierung der Zellen in Medium, dem das Stoffwechselprodukt fehlt, erreicht. Zum Beispiel kann das Gen HIS3 als ein selektierbarer Marker in Verbindung mit einem Hefestamm des Typs his3 verwendet werden. Nach Einführung von Konstrukten mit dem Code für die Hybridtranskriptionsfaktoren werden die Zellen in Abwesenheit von Histidin gezüchtet. Selektierbare Marker zur Verwendung bei Säugetierzellen, wie Thymidinkinase, Neomycinresistenz und HPRT, sind dem fähigen Fachmann auf diesem Fachgebiet ebenfalls bekannt.
Als Alternative enthält das Reportergen den Code für ein Protein, dessen Anwesenheit leicht nachweisbar und/oder quantifizierbar ist. Beispielhafte Reportergene sind u. a. lacZ, Chloramphenicolacetyltransferase (CAT), Luciferase, green fluorescent protein (GFP), Beta-Glucuronidase (GUS), blue fluorescent protein (BFP) und Derivate von GFP, z. B. mit geänderten oder verstärkten Fluoreszenzeigenschaften (Clontech Laboratories, Inc., CA). Kolonien von lacZ-exprimierenden Zellen sind leicht nachweisbar, indem die Kolonien auf Platten gezüchtet werden, die das kolorimetrische Substrat X-gal enthalten. Die Expression von GFP kann durch Überwachung der Fluoreszenzemission nach Anregung nachgewiesen werden. Einzelne Zellen, die GFP exprimieren, können durch Fluoreszenz-aktivierte Zellsortierung (FACS) identifiziert und isoliert werden.
Das System kann mit zwei Reportergenen konstruiert werden, z. B. einem selektierbaren Reportergen und einem nicht-selektierbaren Reportergen. Der selektierbare Marker ermöglicht die schnelle Identifizierung der Domäne von Interesse, da unter den geeigneten Wachstumsbedingungen nur Zellen wachsen, die die Domäne von Interesse tragen. Der nicht-selektierbare Marker bietet ein Mittel zur Bestätigung, z. B. zur Unterscheidung von falsch positiven Befunden, und ein Mittel zur Quantifizierung des Ausmaßes der Bindung. Die beiden Reporter können an unterschiedlichen Orten in das Genom integriert sein, hintereinander ("in tandem") im Genom integriert sein, auf dem selben chromosomalen Element enthalten sein (z. B. Plasmid) enthalten sein oder auf unterschiedlichen chromosomalen Elementen enthalten sein.
Die Grundlagen des zur Auswahl von gewünschten Zinkfingerdomänen verwendeten modifizierten Ein-Hybrid-Systems sind in 5 erläutert. Die DNA-Bindungsdomäne des Hybridtranskriptionsfaktors setzt sich zusammen aus (a) einer gestutzten DNA-Bindungsdomäne, die aus Finger 1 und Finger 2 von Zif268 besteht, und (b) Zinkfingerdomäne A oder B. Die Basensequenz der Bindungsstelle in der Promoterregion des Reportergens ist eine zusammengesetzte Sequenz (5'-XXXXGGGCG-3'), die aus einer 4-bp-Zielsequenz (Nukleotide 1 bis 4, 5'-XXXX-3') und einer gestutzten Bindungssequenz (Nukleotide 5 bis 9, 5'-GGGCG-3') besteht.
Falls die Testzinkfingerdomäne (A in 5) in dem Hybridtranskriptionsfaktor die Zielsequenz erkennt, kann der Hybridtranskriptionsfaktor stabil an die zusammengesetzte Bindungssequenz binden. Diese stabile Bindung führt zur Expression des Reportergens durch die Aktion der Aktivierungsdomäne (AD in 5) des Hybridtranskriptionsfaktors. Infolgedessen kann bei Verwendung von HIS3 als ein Reportergen die transformierte Hefe auf einem Medium wachsen, dem Histidin fehlt. Als Alternative kann die transformierte Hefe bei Verwendung von lacZ als ein Reportergen in einem Medium, das X-gal, ein Substrat des lacZ-Proteins, als eine blaue Kolonie wachsen. Falls die Zinkfingerdomäne (B in 5) des Hybridtranskriptionsfaktors die Zielsequenz jedoch nicht erkennt, wird die Expression des Reportergens nicht induziert. Infolgedessen kann die transformierte Hefe in dem Medium ohne Histidin nicht wachsen (bei Verwendung von HIS3 als Reportergen) oder wächst als weiße Kolonie in einem X-gal-haltigen Medium (bei Verwendung von lacZ als Reportergen).
Das Auswahlverfahren, das dieses modifizierte Ein-Hybrid-System verwendet, ist vorteilhaft, da nachgewiesen wurde, dass mit diesem Verfahren ausgewählte Zinkfingerdomänen im zellulären Milieu funktionsfähig sind. Somit sind die Domänen mutmaßlich in der Lage sich zu falten, in den Kern zu gelangen und intrazellulären Proteasen und anderen potenziell schädigenden intrazellulären Wirkstoffen Stand zu halten. Darüber hinaus erlaubt das im vorliegenden Schriftstück offengelegte modifizierte Ein-Hybrid-System die Isolierung von gewünschten Zinkfingerdomänen auf eine rasche und einfache Weise. Für das modifizierte Ein-Hybrid-System ist nur eine einzige Runde der Hefezellentransformation erforderlich, um die gewünschten Zinkfingerdomänen zu isolieren.
Das im vorliegenden Schriftstück beschriebene Auswahlverfahren kann zur Identifizierung einer Zinkfingerdomäne aus einem Genom verwendet werden, z. B. einem Genom einer Pflanzen- oder Tierart (z. B. einem Säugetier, z. B. einem Menschen). Darüber hinaus kann das Verfahren zur Identifizierung einer Zinkfingerdomäne aus einer Bibliothek von mutierten Zinkfingerdomänen verwendet werden, die beispielsweise durch zufallsbestimmte Mutagenese (Random Mutagenesis) hergestellt werden. Zudem können die beiden Verfahren zusammen verwendet werden. Beispielsweise wenn eine Zinkfingerdomäne für eine besondere 3-bp- oder 4-bp-DNA-Sequenz aus dem menschlichen Genom nicht isoliert werden kann, kann eine Bibliothek von Zinkfingerdomäne, die durch zufallsbestimmte oder gezielte Mutagenese hergestellt wurden, im Hinblick auf eine Domäne dieser Art gescreent werden.
Obwohl das modifizierte Ein-Hybrid-System in Hefe ein bevorzugtes Mittel zur Auswahl von Zinkfingerdomänen, die die gegebenen Zielsequenzen erkennen und daran binden, ist, ist es für einen Fachmann auf diesem Fachgebiet offensichtlich, dass andere Systeme als die Ein-Hybrid-Selektion in Hefe verwendet werden können. Zum Beispiel könnte eine Phagendisplay-Auswahl zum Screening einer Bibliothek von natürlich vorkommenden Zinkfingerdomänen, die von einem Genom eines eukaryotischen Organismus abgeleitet sind, verwendet werden.
Die vorliegende Erfindung schließt die Verwendung des Ein-Hybrid-Verfahrens bei einer Reihe von in Kultur gehaltenen Zellen ein. Zum Beispiel könnte ein operativ mit Zielsequenzen verknüpftes Reportergen in prokaryotische oder Tier- oder Pflanzenzellen in Kultur eingeführt werden und die Zellen in Kultur könnten anschließend mit Plasmiden, Phagen oder Viren mit dem Code für eine Bibliothek von Zinkfingerdomänen transfiziert werden. Gewünschte Zielsequenzen-erkennende Zinkfingerdomänen lassen sich dann aus den isolierten Zellen erhalten, in denen das Reportergen aktiviert ist.
Die nachfolgend offengelegten Beispiele belegen, dass mit dem Verfahren Zinkfingerdomänen für Bindungsstellen von Interesse identifiziert werden können. Es wurde eine Bibliothek von Hybridtranskriptionsfaktoren mit einer Reihe von Zinkfingerdomänen in der Position von Finger 3 hergestellt. Von den aus der Bibliothek ausgewählten neuartigen Zinkfingerdomänen (z. B. die Zinkfinger HSNK, QSTV und VSTR, siehe nachfolgend) kommt keiner auf natürliche Weise in seinem entsprechenden Eltern-Zinkfingerprotein am C-Terminus vor. Dies ist ein klarer Beleg, dass Zinkfingerdomänen modular sind und dass neuartige DNA-Bindungsdomänen durch Mischen und Anpassen ("Mix-and-Match") von geeigneten Zinkfingerdomänen konstruiert werden können.
Die mit Hilfe des erfindungsgemäßen Verfahrens ausgewählten Zinkfingerdomänen können als Bausteine zur Herstellung von neuen DNA-Bindungsproteinen durch geeignetes Rearrangement und Rekombination verwendet werden. Zum Beispiel lässt sich ein neuartiges DNA-Bindungsprotein, das die Promoterregion von Human-CCRS, einem Korezeptor von HIV-1, erkennt, auf die folgende Weise konstruieren. Die Promoterregion von Human-CCRS enthält die folgende 10-bp-Sequenz: 5'-AGG GTG GAG T-3' (SEQ. ID. NR.: 4) (6). Unter Verwendung des im vorliegenden Schriftstück offengelegten Ein-Hybrid-Systems sollte man in der Lage sein, drei Zinkfingerdomänen zu isolieren, die jeweils eine der folgenden 4-bp-Zielsequenzen erkennen: 5'-AGGG-3', 5'-GTGG-3' und 5'-GAGT-3'. Bei diesen Zielsequenzen handelt es sich um überlappende 4-bp-Sequenzen der CCRS-Zielsequenz. Diese drei Zinkfingerdomänen können mit geeigneten Linkern verknüpft und an einer regulatorischen Domäne, wie die Domäne VP16 und die Domäne GAL4, oder Repressionsdomänen, wie die Domäne KRAB, befestigt werden, um neue Transkriptionsfaktoren zu erzeugen, die spezifisch an den CCRS-Promoter binden. Diese Zinkfingerproteine könnten bei der Gentherapie verwendet werden, um zu helfen, die Proliferation von HIV-1 zu verhindern.
Hochdurchsatz-Screening
Das folgende Verfahren erlaubt die schnelle Messung der relativen In-vivo-Bindungsaffinität für jede einzelne Domäne in einer Sammlung von multiplen möglichen DNA-Bindungsstellen oder sogar allen möglichen DNA-Bindungsstellen. Es wird eine große Sammlung von Nukleinsäuren mit dem Code für Nukleinsäurebindungsdomänen erzeugt. Jede Nukleinsäurebindungsdomäne wird in Form der Testzinkfingerdomäne eines Hybridnukleinsäurekonstrukts kodiert und in einem Hefestamm mit einem Paarungstyp exprimiert. Auf diese Weise wird ein erster Satz von Hefestämmen, die sämtliche verfügbaren oder gewünschten Domänen exprimieren, erzeugt. Ein zweiter Satz von Hefestämmen, die Reporterkonstrukte für mutmaßliche Zielstellen für die Domänen in dem Reporterkonstrukt enthalten, wird in dem anderen Paarungstyp erzeugt. Das Verfahren erfordert die Durchführung von zahlreichen oder allen möglichen paarweisen Paarungen, um eine Matrix von fusionierten Zellen zu erzeugen, die jeweils eine unterschiedliche Testzinkfingerdomäne und ein unterschiedliches Zielstellen-Reporterkonstrukt besitzen. Für jede fusionierte Zelle wird die Expression des Reportergens mit einem Assay bestimmt. Auf diese Weise werden mit dem Verfahren die Bindungspräferenzen des getesteten Domänen auf eine schnelle und unaufwändige Weise ermittelt.
Es wird eine Sammlung von Domänen identifiziert, z. B. durch Durchsuchen einer genomischen Datenbank nach mutmaßlichen Domänen, die einem gegebenen Profil entsprechen. Die Sammlung kann beispielsweise zehn bis zwanzig Domänen, oder alle identifizierten Domänen, möglicherweise Tausende oder mehr, beinhalten. Nukleinsäuren mit dem Code für die in der Datenbank identifizierten Domänen werden unter Verwendung von synthetischen Oligonukleotiden amplifiziert. Manuelle und automatische Verfahren zur Gestaltung von synthetischen Oligonukleotiden dieser Art gehören zur Routine nach dem Stand der Technik. Mit degenerierten Primern können Nukleinsäuren mit dem Code für zusätzliche Domänen amplifiziert werden. Nukleinsäuren mit dem Code für die Domänen aus der Sammlung werden in das vorstehend beschriebene Hefe-Expressionsplasmid geklont und auf diese Weise Fusionsproteine, die aus den Domänen und den ersten beiden Fingern von Zif268 und einer Transkriptionsaktivierungsdomäne bestehen, erzeugt. Die Amplifikations- und Klonierungsschritte können in einem Mikrotiterplattenformat durchgeführt werden, um Nukleinsäuren mit dem Code für die multiplen Domänen zu klonieren.
Als Alternative kann ein Rekombinationsklonierungs-Verfahren verwendet werden, um multiple amplifizierte Nukleinsäuren mit dem Code für die Domänen schnell in den Hefe-Expressionsvektor einzufügen. Dieses Verfahren, das in U.S.-Patent Nr. 5,888,732 und im "Gateway"-Handbuch (Life Technologies-Invitrogen, CA, USA) beschrieben ist, sieht vor, an den Enden der Amplifikationsprimer maßgeschneiderte Stellen für eine stellenspezifische Rekombinase aufzunehmen. Der Expressionsvektor enthält eine zusätzliche Stelle oder zusätzliche Stellen an den Positionen für die Einfügung der amplifizierten Nukleinsäuren mit dem Code für die Domänen. Diese Stellen sind so gestaltet, dass Stop-Codons fehlen. Die Zugabe des Amplifikationsprodukts, des Expressionsvektors und der stellenspezifischen Rekombinase zu der Rekombinationsreaktion führt zur Einfügung der amplifizierten Sequenz in den Vektor. Durch zusätzliche Merkmale, z. B. die Verdrängung eines toxischen Gens bei erfolgreicher Einfügung, wird dieses Verfahren hocheffizient und geeignet für das Hochdurchsatz-Screening.
Mit Hilfe von Restriktionsenzym-vermitteltem und/oder Rekombinationsklonieren können Nukleinsäuren mit dem Code für jede der identifizierten Domänen in einen Expressionsvektor eingefügt werden. Die Vektoren können in Bakterien gezüchtet werden und in mit Index versehenen Mikrotiterplatten eingefroren werden, so dass jedes Well eine Zelle enthält, die eine Nukleinsäure mit dem Code für eine der unterschiedlichen, uniquen DNA-Bindungsdomänen enthält.
Für jede Domäne wird Plasmid-DNA isoliert und in eine Hefezelle transformiert, z. B. eine Saccharomyces cerevisiae MATa-Zelle. Da der Expressionsvektor einen selektierbaren Marker enthält, werden die transformierten Zellen in Minimalmedium unter Ernährungsbedingungen gezüchtet, die selektiv für den Marker sind. Zellen dieser Art können für den späteren Gebrauch auch eingefroren und gelagert werden, z. B. in Mikrotiterplatten.
Es wird ein zweiter Satz von Hefestämmen konstruiert, z. B. in einer Saccharomyces cerevisiae MATa-Zelle. Dieser Satz von Hefestämmen enthält eine Reihe von unterschiedlichen Reportervektoren. Jeder Hefestamm, der einen Expressionsvektor mit einer uniquen DNA-Bindungsdomäne enthält, wird dann mit allen einzelnen Hefestämmen des Reportergensatzes gepaart. Da diese beiden Stämme gegensätzliche Paarungstypen besitzen und gentechnisch so konstruiert wurden, dass sie unterschiedliche Auxotrophien besitzen, können Diploide auf einfache Weise selektiert werden. Diploide dieser Art besitzen sowohl das Reporter- als auch das Expressionsplasmid. Die Zellen werden auch unter Ernährungsbedingungen kultiviert, die sowohl für das Reporter- als auch für das Expressionsplasmid selektiv sind. Uetz et al. (2000) Nature 403:623-7 beschreiben eine vollständige Zwei-Hybrid-Map aller Hefeproteine durch die Erzeugung einer solchen Matrix von Hefepaarungen.
Der Nachweis der Reportergenexpression kann in einem Großmengenformat erfolgen, z. B. in Mikrotiterplatten. Beispielweise bei Verwendung von GFP als Reporter kann eine Platte, die die Matrix mit gepaarten Zellen enthält, mit einem Scannergerät auf Fluoreszenz geprüft werden.
Modularer Zusammenbau von neuartigen DNA-Bindungsproteinen
Ein neues DNA-Bindungsprotein, das eine Zielsequenz von 9-bp oder eine längere DNA-Sequenz erkennt, kann auf rationale Weise konstruiert werden, indem man geeignete Zinkfingerdomänen miteinander mischt und anpasst ("Mix-and-Match"). Aufgrund ihrer modularen Struktur können Zinkfingerdomänen umarrangiert werden, um neue DNA-Bindungsproteine zu erzeugen. Wie 1 zu entnehmen ist, sind die Zinkfingerdomänen in dem natürlich vorkommenden Protein Zif268 hintereinander entlang der DNA-Doppelhelix angeordnet. Jede Domäne erkennt unabhängig von den anderen ein unterschiedliches 3-4 bp DNA-Segment.
Eine Zinkfingerdomänen-Datenbank.
Das vorstehend beschriebene Ein-Hybrid-Selektionssystem kann zur Identifizierung von einer oder mehreren Zinkfingerdomänen für jede mögliche Bindungsstelle mit 3- oder 4-Basenpaar-Bindungsstelle verwendet werden. Die Ergebnisse können in Form einer Matrix oder als Datenbank gespeichert werden, z. B. als eine relationelle Datenbank. Die Datenbank kann auch einen Hinweis auf die relative Affinität der Zinkfingerdomänen, die an die einzelnen Stellen binden, enthalten.
Zinkfingerdomänen dieser Art können im Kontext von multiplen verschiedenen Fusionsproteinen getestet werden, um ihre Spezifität zu bestätigen. Darüber hinaus können besondere Bindungsstellen, für die nur wenige Domänen verfügbar sind, das Ziel von zusätzlichen Auswahlscreenings sein. Bibliotheken für Auswahlvorgänge dieser Art lassen sich herstellen, indem eine Zinkfingerdomäne, die an eine ähnliche, aber unterschiedliche Stelle bindet, einem Mutageneseprozess unterzogen wird. Eine vollständige Matrix von Zinkfingerdomänen für alle möglichen Bindungsstellen zu haben ist unbedingt erforderlich, da die Domänen relativ zu den Zielbindungsstellen gestaffelt werden können, um die verfügbaren Domänen am besten zu nutzen. Eine Staffelung dieser Art lässt sich erreichen sowohl durch Zergliederung ("Parsing") der Bindungsstelle in die nützlichsten 3- oder 4-bp-Bindungsstellen als auch durch Variation der Linkerlänge zwischen Zinkfingerdomänen. Um dem auf diese Weise gestalteten Polypeptid sowohl Selektivität als auch hohe Affinität zu verleihen, können flankierend zu Zinkfingerdomänen mit hoher Spezifität für eine gewünschte Stelle andere Domänen vorgesehen sein, die mit hoher Affinität, aber geringerer Spezifität binden. Das im vorliegenden Schriftstück beschriebene In-vivo-Screeningverfahren kann zur In-vivo-Prüfung der Funktion, Affinität und Spezifität eines künstlich zusammengebauten Zinkfingerproteins und von Derivaten desselben verwendet werden. Gleichermaßen kann das Verfahren zur Optimierung von zusammengebauten Proteinen dieser Art verwendet werden, z. B. durch die Erzeugung von Bibliotheken mit verschiedenen Linker-Zusammensetzungen, Zinkfingerdomänenmodulen, Zinkfingerdomänenzusammensetzungen und so weiter.
Zergliederung einer Zielstelle.
Die Zielsequenz von 9-bp oder längere DNA-Zielsequenz wird in 3- oder 4-bp-Segmente zergliedert. Es werden Zinkfingerdomänen identifiziert (z. B. aus einer vorstehend beschriebenen Datenbank), die die einzelnen 3- oder 4-bp-Teilsegment erkennen. Längere Zielsequenzen, z. B. Sequenzen mit 20 bp bis 500 bp, stellen ebenfalls geeignete Ziele dar, da in ihnen Subsequenzen von 9 bp, 12 bp und 15 bp identifiziert werden können. Insbesondere Subsequenzen, die in Stellen zergliedert werden können, die in der Datenbank gut repräsentiert sind, können als anfängliche Gestaltungsziele dienen.
Konstruktion von zusammengebauten Modulen.
Es werden Polypeptidsequenzen so gestaltet, dass sie multiple Zinkfingerdomänen enthalten, die aneinander grenzende oder nahe aneinander befindliche 3- oder 4-bp-Unterstellen erkennen. Es kann eine Nukleinsäuresequenz mit dem Code für die so gestaltete Polypeptidsequenz synthetisiert werden. Verfahren zur Konstruktion von synthetischen Genen gehören zur Routine nach dem Stand der Technik. Zu Verfahren dieser Art gehören u. a. die Genkonstruktion aus maßgeschneidert-synthetisierten Oligonukleotiden, PCR-vermitteltes Klonieren und Mega-Primer-PCR. Es können multiple Nukleinsäuresequenzen synthetisiert werden, z. B. um eine Bibliothek zu bilden. Beispielsweise können die Nukleinsäuren der Bibliothek so gestaltet werden, dass die Sequenzen mit dem Code für eine Domäne sich an jeder gegebenen Position derart unterscheiden, dass sie den Code für unterschiedliche Zinkfingerdomänen enthalten, deren Erkennungsspezifität sich für diese Position eignet. Sexual PCR und "DNA Shuffling^TM" (Maxygen, Inc., CA) können zur Variation der Identität der Zinkfingerdomänen an den einzelnen Positionen verwendet werden.
Peptidlinker.
DNA-Bindungsdomänen können durch eine Reihe von Linkern verbunden werden. Die Nützlichkeit und die Gestaltung von Linkern sind nach dem Stand der Technik wohlbekannt. Ein besonders nützlicher Linker ist ein Peptidlinker, dessen Code in einer Nukleinsäure enthalten ist. Folglich lässt sich ein synthetisches Gen konstruieren, das den Code für eine erste DNA-Bindungsdomäne, den Peptidlinker und eine zweite DNA-Bindungsdomäne enthält. Diese Gestaltung lässt sich wiederholen, um große, synthetische Multidomänen-DNA-Bindungsproteine zu konstruieren. Die Gestaltung von Peptidlinkern, die zur Verbindung von Zinkfingerdomänen geeignet sind, ist in PCT WO 99/45132 und in Kim and Pabo ((1998) Proc. Natl. Acad. Sci. USA 95:2812-7) beschrieben.
Es sind zusätzliche Peptidlinker erhältlich, die Random Coil-, α-Helix- oder β-Blatt-Tertiärstrukturen bilden. Polypeptide, die geeignete flexible Linker bilden, sind dem Stand der Technik wohlbekannt (siehe z. B. Robinson and Sauer (1998) Proc. Natl. Acad. Sci. USA 95: 5929-34). Flexible Linker beinhalten im typischen Fall Glycin, da diese Aminosäure, der eine Seitenkette fehlt, aufgrund ihrer Rotationsfreiheit einmalig ist. Serin oder Threonin können im Linker eingestreut sein, um die Hydrophilizität zu erhöhen. Zusätzlich können Aminosäuren, die mit der Phosphat-Rückenkette von DNA Wechselwirkungen eingehen können, zur Steigerung der Bindungsaffinität genutzt werden. Die wohlüberlegte Verwendung von Aminosäuren dieser Art erlaubt es, ein Gleichgewicht zwischen Steigerungen der Affinität mit Verlusten bei der Sequenzspezifität zu finden. Falls eine feste Verlängerung als ein Linker gewünscht wird, können α-helikale Linker, wie die in Pantoliano et al. (1991) Biochem. 30:10117-10125 beschriebenen helikalen Linker, verwendet werden. Linker können aber auch durch Computer Modeling gestaltet werden (siehe z. B. US-Patent Nr. 4,946,778). Software für das molekulare Modeling ist im Handel erhältlich (z. B. von Molecular Simulations, Inc., San Diego, CA). Als Option wird der Linker unter Anwendung von Standardtechniken der Mutagenese und geeigneten biophysikalischen Tests, die der Praxis im Bereich des Protein EnGlneering entsprechen, und der im vorliegenden Schriftstück beschriebenen Funktionsassays, optimiert, z. B. um die Antigenität zu reduzieren und/oder die Stabilität zu erhöhen.
Bei Zinkfingerdomänen nutzenden Umsetzungen kann das auf natürliche Weise zwischen Zinkfingern vorkommende Peptid als ein Linker zur Verbindung von Fingern verwendet werden. Ein typischer natürlich vorkommender Linker dieser Art ist: Thr-Gly-(Glu oder Gln)-(Lys oder Arg)-Pro-(Tyr oder Phe) (SEQ. ID. NR.: 78) (Agata et al., dito).
Dimerisierungsdomänen.
Ein alternatives Verfahren zur Verknüpfung von DNA-Bindungsdomänen ist die Verwendung von Dimerisierungsdomänen, insbesondere von Heterodimerisierungsdomänen (siehe z. B. Pomerantz et al. (1998) Biochemistry 37:965-970). Bei dieser Umsetzung befinden sich die DNA-Bindungsdomänen auf getrennten Polypeptidketten. Beispielsweise enthält ein erstes Polypeptid den Code für DNA-Bindungsdomäne A, Linker und Domäne B, während ein zweites Polypeptid den Code für Domäne C, Linker und Domäne D enthält. Ein Fachmann ist in der Lage, aus den vielen gut charakterisierten Dimerisierungsdomänen eine Dimerisierungsdomäne auszuwählen. Falls Homodimere nicht gewünscht werden, können Domänen verwendet werden, die die Heterodimerisierung begünstigen. Eine besonders anpassbare Dimerisierungsdomäne ist das Coiled-Coil-Motiv, z. B. eine dimere parallele oder anti-parallele Coiled-Coil-Struktur. Coiled-Coil-Sequenzen, die bevorzugt Heterodimere bilden, sind ebenfalls erhältlich (Lumb and Kim, (1995) Biochemistry 34:8642-8648). Eine andere Art von Dimerisierungsdomäne ist eine, in der die Dimerisierung durch ein Kleinmolekül oder durch ein Signalereignis ausgelöst wird. Beispielsweise kann eine dimere Form von FK506 verwendet werden, um zwei FK506-Bindungsprotein (FKBP)-Domänen zu dimerisieren. Dimerisierungsdomänen dieser Art können genützt werden, um zusätzliche Regulationsebenen vorzulegen.
Funktionsassays und deren Anwendung
Zusätzlich zu biochemischen Assays kann die Funktion einer Nukleinsäurebindungsdomäne oder eines mit einem im vorliegenden Schriftstück beschriebenen Verfahren , z. B. durch modularen Zusammenbau, gestalteten Proteins auch unter In-vivo-Bedingungen in einem Assay getestet oder genutzt werden. Beispielsweise können Domänen im Hinblick auf die Bindung an eine Zielstelle ausgewählt werden, z. B. an eine Promoterstelle eines für die Zellproliferation notwendigen Gens. Durch modularen Zusammenbau lässt sich ein Protein gestalten, das (1) die ausgewählten Domänen, die an Unterstellen binden, die die Ziel-Promoterstelle überspannen, und (2) eine DNA-Repressionsdomäne, z. B. eine WRPW-Domäne, beinhalten.
Eine Nukleinsäuresequenz mit dem Code für ein gestaltetes Protein kann in einen Expressionsvektor kloniert werden, z. B. in einen induzierbaren Expressionsvektor nach der Beschreibung in Kang and Kim, (2000) J Biol Chem 275:8742. Der induzierbare Expressionsvektor kann einen induzierbaren Promoter oder eine induzierbare regulatorische Sequenz beinhalten. Nicht-einschränkende Beispiele für induzierbare Promoter sind u. a. auf Steroidhormone ansprechende Promoter (z. B. auf Ecdyson ansprechender Promoter, auf Östrogen ansprechender Promoter und auf Glutakortikoid ansprechender Promoter), die Tetracyclin "Tet-On" und "Tet-Off"-Systeme und auf Metalle ansprechende Promoter. Das Konstrukt kann in Gewebekulturzellen oder in embryonische Stammzellen transfiziert werden, um einen transgenen Organismus als einen Modellprobanden zu erzeugen. Die Wirksamkeit des gestalteten Proteins kann durch Induktion der Expression des Proteins und Assay der Zellproliferation der Gewebekulturzellen oder Assay im Hinblick auf Änderungen der Entwicklung und/oder ein Tumorwachstum in einem transgenen Tiermodell bestimmt werden. Zusätzlich kann ein Assay des Expressionsniveaus des Zielgens durch Routineverfahren zum Nachweis von mRNA, z. B. PT-PCR oder Northern Blotting, durchgeführt werden. Eine vollständigere Diagnose beinhaltet die Aufreinigung von mRNA aus Zellen, die das gestaltete Protein exprimieren bzw. nicht exprimieren. Die beiden mRNA-Pools werden als Sonden zur Testung eines Mikroarrays, das Sonden für eine große Sammlung von Genen enthält, z. B. eine Sammlung von relevanten Genen für den Zustand von Interesse (z. B. Krebs) oder eine Sammlung von Genen, die im Genom des Organismus identifiziert wurden, verwendet. Ein Assay dieser Art ist besonders wertvoll zur Ermittlung der Spezifität des gestalteten Proteins. Falls das Protein mit hoher Affinität, aber geringer Spezifität bindet, kann es pleiotrope und unerwünschte Wirkungen verursachen, indem es neben dem eigentlichen Ziel auch die Expression von anderen Genen beeinflusst. Wirkungen dieser Art treten bei einer globalen Transkriptanalyse hervor.
Zusätzlich kann das gestaltete Protein in einer Probandenzelle oder einem Probandenorganismus produziert werden, um ein endogenes Gen zu regulieren. Das gestaltete Protein besitzt, wie vorstehend beschrieben, eine geeignete Konfiguration für die Bindung an eine Region des endogenen Gens und die Bereitstellung einer Transkriptionsaktivierungs- oder -repressionsfunktion. Wie in Kang and Kim (dito) beschrieben, kann die Expression einer Nukleinsäure mit dem Code für das gestaltete Protein auf operative Weise mit einem induzierbaren Promoter verknüpft werden. Durch Modulation der Konzentration des Inducers für den Promoter kann die Expression des endogenen Gens auf eine konzentrationsabhängige Weise reguliert werden.
Assay der Bindungsstellenpräferenz
Die Bindungsstellenpräferenz jeder einzelnen Domäne lasst sich durch einen biochemischen Assay, wie EMSA, DNAse Footprinting, Surface Plasmon Resonance oder Säulenbindung, bestätigen. Bei dem Bindungssubstrat kann es sich um ein die Zielstelle abdeckendes synthetisches Oligonukleotid handeln. Der Assay kann auch nicht-spezifische DNA-Sequenzen als einen Kompetitor oder spezifische DNA-Sequenzen als einen Kompetitor enthalten. Spezifische Kompetitor-DNAs können u. a. die Erkennungsstelle mit einer, zwei oder drei Nukleotidmutationen sein. Somit kann ein biochemischer Assay zur Messung nicht nur der Affinität einer Domäne für eine gegebene Stelle, sondern auch ihrer Affinität für die Stelle relativ zu anderen Stellen verwendet werden. Rebar and Pabo, (1994) Science 263:671-673 beschreiben ein Verfahren zum Erhalt von scheinbaren K_d-Konstanten für Zinkfingerdomänen mittels EMSA.
Nachfolgend wird die vorliegende Erfindung anhand der folgenden praktischen Beispiele näher erläutert. Dabei ist jedoch anzumerken, dass diese Beispiele nicht dazu gedacht sind, den Gültigkeitsbereich der vorliegenden Erfindung einzuschränken.
Beispiel 1: Konstruktion von Plasmiden für die Expression von Hybridtranskriptionsfaktoren
Ein Expressionsplasmid, das einen Zinkfinger-Transkriptionsfaktor exprimiert, wurde durch Modifikation von pPC86 hergestellt (Chevray and Nathans, (1991) Proc. Natl. Acad. Sci. USA 89:5789-5793). Die DNA-Manipulationen wurden entsprechend der Beschreibung von Ausubel et al. (Current Protocols in Molecular Biology (1998), Wiley and Sons, Inc.) vorgenommen. Ein DNA-Fragment mit dem Code für das Zinkfingerprotein Zif268 wurde zwischen die Sall- und EcoRI-Erkennungsstellen von pPC86 eingefügt, um pPCFM-Zif zu erzeugen. Dieser Klonierungsschritt ergibt ein Translationsfusionsprotein mit dem Code für die Gal4-Aktivierungsdomäne von Hefe gefolgt von den drei Zinkfingern von Zif268. Transformation von pPCFM-Zif in Hefezellen hinein führte zur Expression eines Hybridtranskriptionsfaktors, der die Gal4-Aktivierungsdomäne von Hefe und die Zinkfinger von Zif268 umfasst. Die DNA-Sequenz mit dem Code für das Zinkfingerprotein Zif268 in der in pPCFM-Zif hinein klonierten Form ist in 9 dargestellt.
Das Plasmid pPCFMS-Zif wurde als Vektor zur Konstruktion von Bibliotheken von Zinkfingerdomänen genutzt (8). Zur Konstruktion von pPCFMS-Zif wurde eine Oligonukleotidkassette, die einen Stop-Codon und eine PstI-Erkennungsstelle enthielt, vor der Finger 3-kodierenden Region von pPCFM-Zif eingefügt. Die Oligonukleotidkassette wurde durch Annealing zweier synthetischer Oligonukleotide gebildet:
5'-TGCCTGCAGCATTTGTGGGAGGAAGTTTG-3' (SEQ. ID. NR.: 79) und 5'-ATGCTGCAGGCTTAAGGCTTCTCGCCGGTG-3' (SEQ. ID. NR.: 80). Die Erzeugung von Plasmiden in der Bibliothek mit dem Code für Finger 3 von Zif268 wurde durch Einfügen eines Stop-Codons verhindert.
Das Plasmid wurde als ein Vektor zur Erzeugung von Zinkfingerdomänen-Bibliotheken nach der Beschreibung im nachfolgenden "Beispiel 2" verwendet.
Zusätzlich wurde ein „Gap Repair Cloning" der DNA-Sequenzen mit dem Code für individuelle Zinkfingerdomänen nach der Beschreibung von Hudson et al., ((1997) Genome Research 7:1169-1173) mit geringfügigen Modifikationen durchgeführt.
Zur Klonierung einer einzelnen Zinkfingerdomäne wurden zwei überlappende Oligonukleotide synthetisiert. Jedes Oligonukleotid besaß an seinem 5'-Ende einen 21 Nukleotide langen gemeinsamen Tail für die zweite Runde PCR (rePCT) und eine spezifische Sequenz, die durch Annealing an die Nukleinsäure mit dem Code für die einzelne Zinkfingerdomäne band. Bei den Sequenzen für den Vorwärts- und den Rückwärts-Primer handelte es sich um
5'-ACCCACACTGGCCAGAAACCCN_48-51-3' (SEQ. ID. NR.: 108) und 5'-GATCTGAATTCATTCACCGGTN_42-45-3' (SEQ. ID. NR.: 109), wobei N_48-51 und N_42-45 der maßgeschneiderten Sequenz zum Annealing an die Nukleinsäure mit dem Code für die Zinkfingerdomäne entspricht. Doppelstrang-DNA wurde durch Amplifikation von Template-Nukleinsäure mit einer äquimolaren Mischung zweier Oligonukleotide hergestellt. Die PCR-Bedingungen bestanden aus einem ersten Zyklus bei 94°C für 3 Minuten gefolgt von 5 Zyklen bei 94°C für 1 Minute, bei 50°C für 1 Minute und bei 72°C für 30 Sekunden.
Die Doppelstrang-DNA mit dem Code für die einzelnen Zinkfingerdomänen wurde dann als Template in einer zweiten Runde PCR verwendet. Die rePCR-Primer besaßen zwei Regionen – eine Region, die mit dem Hefevektor pPCFM-Zif identisch ist, und eine zweite Region, die mit der vorstehend beschriebenen gemeinsamen Tail-Sequenz mit einer Länge von 21 Nukleotiden identisch ist. Die Sequenz des Vorwärts-Primers war wie folgt:
5'-TGTCGAATCTGCATGCGTAACTTCAGTCGTAGTGACCACCTTACCACCCA C ATCCGGACCCACACACTGGCCAGAAACCC-3'
(SEQ. ID. NR.: 138) und die Sequenz des Rückwärts-Primers war wie folgt:
5'-GGTGGCGGCCGTTACTTACTTAGAGCTCGACGTCTTACTTACTTAGC GGCCGCACTAGTAGATCTGAATTCATTCACCGGT-3'
(SEQ. ID. NR.: 139). Die Reaktionsmischung enthielt 2,5 pmol eines jeden Primers, 1,5 mM Mg²⁺, 2 Einheiten Taq-Polymerase und 0,01 Einheiten Pfu-Polymerase in 25 ul. Die Reaktionen wurden bei 94°C für eine Dauer von 3 Minuten durchgeführt und anschließend 20 Zyklen bei 94°C für 1 Minute, bei 65°C für 1 Minute und bei 72°C für 30 Sekunden unterzogen. Das „Gap Repair Cloning" wurde durch Transformation der Mischung aus dem rePCR-Produkt und linearisiertem pPCFM-Zif-Vektor, der mit MscI und EcoRI verdaut worden war, in Hefezellen des Typs YW1 durchgeführt. Die zu dem Hefevektor pPCFM- Zif identische Region erlaubt die homologe Rekombination mit dem Vektor in den Zellen.
Beispiel 2: Konstruktion der Zinkfingerdomänen-Bibliothek
Eine Plasmidbibliothek von natürlich vorkommenden Zinkfingerdomänen wurde durch Klonierung von Zinkfingerdomänen aus dem menschlichen Genom hergestellt. DNA-Segmente mit dem Code für Zinkfingerdomänen wurden unter Verwendung von PCR und degenerierten Oligonukleotidprimern aus als Template dienender humaner Genom-DNA (bei Promega Corporation, Madison, WI, USA käuflich erworben) amplifiziert. Die DNA-Sequenzen der degenerierten PCR-Primer, die zur Klonierung von menschlichen Zinkfingerdomänen verwendet wurden, waren wie folgt:
5'-GCGTCCGGACNCAYACNGGNSARA-3' (SEQ. ID. NR.: 81) und
5'-CGGAATTCANNBRWANGGYYTYTC-3' (SEQ. ID. NR.: 82),
wobei R G und A darstellt, B G, C und T darstellt, S G und C darstellt, W A und T darstellt, Y C und T darstellt und N A, C, G und T darstellt.
Die degenerierten PCR-Primer binden durch Annealing an Nukleinsäuresequenzen mit dem Code für ein Aminosäureprofil, His-Thr-Gly-(Glu oder Gln)-(Lys oder Arg)-Pro-(Tyr oder Phe) (SEQ. ID. NR.: 83), das an der Kreuzung zwischen Zinkfingerdomänen in zahlreichen natürlich vorkommenden Zinkfingerproteinen zu finden ist (Agata et al. (1998) Gene 213:55-64).
Die Pufferzusammensetzung bei der PCR-Reaktion war wie folgt: 50 mM KCl, 3 mM MgCl₂, 10 mM Tris pH 8,3. Es wurde Taq-DNA-Polymerase zugegeben und die Reaktionsmischung bei 94°C für 30 Sekunden, bei 42°C für 60 Sekunden und dann bei 72°C für 30 Sekunden inkubiert. Dieser Zyklus wurde 35-fach wiederholt und anschließend eine Endinkubation bei 72°C für 10 Minuten durchgeführt.
Die PCR-Produkte wurden wie folgt in pPCFMS-Zif hinein kloniert: Die PCR-Produkte wurden einer Elektrophorese unterzogen und die DNA-Segmente, die ungefähr 120 bp entsprachen, wurden isoliert. Nach der Verdauung mit BspEI und EcoRI, wurden die DNA-Segmente mit einer Größe von 120-bp in pPCFMS-Zif ligiert. Folglich besteht die DNA-Bindungsdomäne des Hybridtranskriptionsfaktors, der von dieser Plasmidbibliothek kodiert wird, aus Finger 1 und Finger 2 von Zif268 und einer aus dem menschlichen Genom abgeleiteten Zinkfingerdomäne. Die Plasmidbibliothek wurde aus insgesamt 10⁶ Escherichia coli-Transformanten hergestellt. Bei diesem Ansatz zur Bibliothekskonstruktion bleibt die natürlich vorkommende Linkersequenz, die zwischen Zinkfingerdomänen zu finden ist, erhalten.
Beispiel 3: Konstruktion der Zinkfingerdomänen-Bibliothek
Ein Bibliothek von mutierten Zinkfingerdomänen wurde durch zufallsbestimmte Mutagenese hergestellt. Dabei wurde Finger 3 von Zif268 als ein Polypeptidgerüst verwendet. Die zufallsbestimmten Mutationen wurden an den Positionen -1, 2, 3, 4, 5 und 6 entlang der α-Helix eingeführt, die dem ArGlnin an Position 73, AsparaGlnsäure an Position 75, Glutaminsäure an Position 76, ArGlnin an Position 77, Lysin an Position 78 und ArGlnin an Position 79 von SEQ. ID. NR.: 21 (innerhalb von Finger 3 von Zif268) entsprechen.
An jeder der Nukleinsäuresequenzpositionen mit dem Code für diese Aminosäuren wurde ein randomisierter Codon, 5'-(G/A/C) (G/A/C/T) (G/C)-3', eingeführt. Dieser randomisierte Codon enthält den Code für 16 verschiedene Aminosäuren (mit Ausnahme von vier Aminosäuren: Tryptophan, Tyrosin, Cystein und Phenylalanin). Ebenfalls ausgeschlossen sind alle drei möglichen Stop-Codons. Die randomisierten Codons wurden mit einer Oligonukleotidkassette eingeführt, die aus zwei Oligonukleotiden konstruiert wurde:
5'-GGGCCCGGGGAGAAGCCTTACGCATGTCCAGTCGAATCTTGTGAT AGAAGATTC-3' (SEQ. ID. NR.: 84) und
5'-CTCCCCGCGGTTCGCCGGTGGGATTCTGATATGSNBSNBAAGSNB SNBSNBSNBTGAGAATCTTCTATCACAAG-3' (SEQ. ID. NR.: 85),
wobei B G, T und C darstellt, S G und C darstellt und N A, G, C und T darstellt.
Nach dem Annealing dieser beiden Oligonukleotide wurde die DNA-Duplexkassette durch Reaktion mit Klenow-Polymerase für eine Dauer von 30 Minuten synthetisiert. Nach Verdauung mit AvaI und SacII wurde der DNA-Duplex in pPCFMS-Zif268, das mit SgrAI und SacII verdaut worden war, ligiert. Von ungefähr 10⁹ E. coli-Transformanten wurden Plasmide isoliert.
Beispiel 4: Konstruktion von Reporterplasmiden
Reporterplasmide, u. a. mit dem HIS3-Gen von Hefe, wurden durch Modifikation von pRS315His (Wang and Reed (1993) Nature 364:121-126) hergestellt. Die Reporterplasmide enthalten auch den Marker LEU2 unter Kontrolle seines natürlichen Promoters, damit Transformanten, die das Plasmid tragen, selektiert werden können. Zunächst wurde die SalI-Erkennungsstelle in pRS315His durch Ligation des kleinen Fragments von pRS315His nach Verdauung mit SalI und BamHI und des großen Fragments von pRS315His nach Verdauung mit BamHI und XhoI, entfernt, so dass sich pRS315HisΔ Sal ergab. Anschließend wurde innerhalb der Promoterregion des HIS3-Gens eine neue SalI-Erkennungsstelle erzeugt, indem ein Oligonukleotidduplex zwischen der BamHI- und der SmaI-Stelle in pRS315HisΔ Sal eingefügt wurde. Bei den Sequenzen der beiden Oligonukleotide, die durch Annealing aneinander gebunden wurden, um den eingefügten Duplex zu erzeugen, handelt es sich um:
5'-CTAGACCCGGGAATTCGTCGACG-3' (SEQ. ID. NR.: 86) und
5'-GATCCGTCGACGAATTCCCGGGT-3' (SEQ. ID. NR.: 87).
Das auf diese Weise erhaltene Plasmid erhielt die Bezeichnung pRS315HisMCS.
Multiple Reporterplasmide wurden durch Einfügen von gewünschten zusammengesetzten Sequenzen in pRS315HisMCS produziert. Die zusammengesetzten Sequenzen werden in Form eines Tandem-Arrays, der vier Kopien der zusammengesetzten Sequenz enthält, eingefügt. Die Zielsequenzen wurden aus 10-bp-DNA-Sequenzen abgeleitet (6), die in der LTR-Region von HIV-1 zu finden sind:
5'-GAC ATC GAG C-3' (SEQ. ID. NR.: 1) HIV-1 LTR (-124/-115)
5'-GCA GCT GCT T-3' (SEQ. ID. NR.: 2) HIV-1 LTR (-23/-14)
5'-GCT GGG GAC T-3' (SEQ. ID. NR.: 3) HIV-1 LTR (-95/-86)
bzw. im Promoter des menschlichen CCR5-Gens zu finden sind:
5'-AGG GTG GAG T-3' (SEQ. ID. NR.: 4) human CCR5 (-70/-79)
5'-GCT GAG ACA T-3' (SEQ. ID. NR.: 5) human CCR5 (+7/+16).
Jede dieser 10-bp-Sequenzen kann in 4-bp-Zielstellenkomponenten zergliedert werden, um eine Zinkfingerdomäne zu identifizieren, die alle Regionen der Stelle erkennt. Unter Verwendung des modularen Zusammenbauverfahrens können Zinkfingerdomänen dieser Art miteinander gekoppelt werden, um ein DNA-Bindungsprotein zu erzeugen, das die Stelle unter In-vivo-Bedingungen erkennt.
Die unterstrichenen Teile in 6 zeigen Beispiele von 4-bp-Zielsequenzen. Jeder dieser 4-bp-Zielsequenzen wurde mit der 5-bp-Rekrutierungssequenz, 5'-GGGCG-3', verbunden, die von Finger 1 und Finger 2 von Zif268 erkannt wird. Die sich auf diese Weise ergebenden 9-bp-Sequenzen stellen zusammengesetzte Bindungssequenzen dar. Jede zusammengesetzte Bindungssequenz besitzt das folgende Format:
5'-XXXXGGGCG-3', wobei XXXX die 4-bp-Zielsequenz und das benachbarte 5'-GGGCG-3' die Rekrutierungssequenz darstellt.
In 7 sind die DNA-Sequenzen der eingefügten Tandem-Arrays aus zusammengesetzten Bindungsstellen aufgeführt, die jeweils auf operative Weise mit dem Reportergen in pRS315HisMCS verbunden waren. Jeder Tandem-Array enthält 4 Kopien einer zusammengesetzten Bindungssequenz. Für jede Bindungsstelle wurden zwei Oligonukleotide synthetisiert, durch Annealing aneinander gebunden und, nach Restriktion an der Sall- und der XmaI-Stelle, in pRS315HisMCS hinein ligiert, um ein Reporterplasmid zu ergeben.
Beispiel 5: Konstruktion von Reporterplasmiden
Ein Satz Reporterplasmide, die ein Reporterpaar (einer mit lacZ und der andere mit HIS3) für jede 3-bp-Unterstelle beinhalten, wurde auf die folgende Weise konstruiert: Zur Konstruktion von Reporterplasmiden wurden die gewünschten Zielssequenzen in pRS315HisMCS und pLacZi eingefügt. Für jede 3-Basenpaar-Zielstelle wurden zwei Oligonukleotide synthetisiert, durch Annealing aneinander gebunden und in die SalI und XmaI-Stelle von pRS315HisMCS und von pLacZi eingefügt, um Reporterplasmide herzustellen.
Die DNA-Sequenzen der Oligonukleotide waren wie folgt:
5'-CCGGT NNNTGGGCG TAC NNNTGGGCG TCA NNNTGGGCG-3' (SEQ. ID. NR.: 88) und 5'-TCGA CGCCCANNN TGA CGCCCANNN GTA CGCCCANNN A-3' (SEQ. ID. NR.: 89). Insgesamt wurden 64 Oligonukleotidpaare synthetisiert und in die beiden Reporterplasmide eingefügt.
Beispiel 6: Auswahl von Zinkfingerdomänen mit gewünschter DNA-Bindungsspezifität
Zur Auswahl von Zinkfingerdomänen, die an gegebene Zielsequenzen spezifisch binden, wurden Hefezellen zuerst mit einem Reporterplasmid und anschließend mit einer Bibliothek von Hybridplasmiden mit dem Code für Hybridtranskriptionsfaktoren transformiert. Die Hefe-Transformation und Screeningverfahren wurden entsprechend der Beschreibung von Ausubel et al. (Current Protocols in Molecular Biology (1998), Wiley and Sons, Inc.) vorgenommen. Es wurde der Hefe-Stamm yWAM2 verwendet
(MATα (alpha) Δ gal4 Δ gal80 URA3::GAL1-lacZ lys2801 his3-Δ 200 trp1-Δ 63 leu2 ade2-101CYH2).
In einem Fall wurden Hefezellen zuerst mit einem Reporterplasmid transformiert, das die zusammengesetzte Bindungssequenz 5'-GAGCGGGCG-3' (die 4-bp-Zielsequenz ist unterstrichen) enthält, die auf operative Weise mit dem Reportergen verknüpft war. Anschließend wurde die durch zufallsbestimmte Mutagenese hergestellte Plasmidbibliothek von mutierten Zinkfingerdomänen in die transformierten Hefezellen eingeführt. Ungefähr 10⁶ Kolonien wurden in einem Medium erhalten, dem sowohl Leucin als auch Tryptophan fehlte. Da das Reporterplasmid und die Zinkfingerdomänen-Expressionsplasmide die Hefegene LEU2 bzw. TRP1 als Marker enthalten, wurden die Hefezellen in einem Medium gezüchtet, dem sowohl Leucin als auch Tryptophan fehlte, um Zellen zu selektieren, die sowohl das Reporter- als auch das Zinkfingerdomänen-Expressionsplasmid enthalten.
Bei einer Umsetzung wurde die aus dem menschlichen Genom abgeleitete Zinkfingerdomänen-Bibliothek in Zellen transformiert, die die Reporterplasmide tragen. Die Transformation wurde mit fünf verschiedenen Wirtszellstämmen durchgeführt, wobei jeder Stamm eine von fünf verschiedenen Zielsequenzen in operativer Verknüpfung mit dem Reportergen enthielt. Pro Transformation wurden ungefähr 10⁵ Kolonien in einem Medium erhalten, dem sowohl Leucin als auch Tryptophan fehlte. Die Transformanten wurden auf Petrischalen gezüchtet, die synthetisches Medium ohne Leucin und Tryptophan enthielten. Nach der Inkubation wurden transformierte Zellen durch Anwendung einer 10%-igen sterilen Glycerinlösung auf die Platten gesammelt, dabei die Kolonien in die Lösung gekratzt und die Lösung anschließend abgezogen. Die Zellen wurden in Form von Teilmengen in der Glycerinlösung in gefrorenem Zustand aufbewahrt. Eine einzelne Teilmenge wurde auf ein Medium ohne Leucin, Tryptophan und Histidin gegeben. Zu dem Wachstumsmedium wurde 3-Aminotriazol (AT) in Endkonzentrationen von 0, 0,03, 0,1 und 0,3 mM zugegeben. AT ist ein kompetitiver Hemmstoff von His3 und dient zur Titration der Empfindlichkeit des HIS3-Selektionssystems. AT unterdrückte die Basalaktivität von His3. Eine Basalaktivität dieser Art kann durch "undichte" Expression des HIS3-Gens auf dem Reporterplasmid entstehen. Aus den ungefähr 10⁷ Hefezellen, die auf das Medium gegeben wurden, wuchs eine dreistellige Anzahl von Kolonien in dem selektiven Medium, dem AT fehlte. Die Anzahl der Kolonien zeigte einen schrittweisen Abfall mit steigender AT-Konzentration. In dem selektiven Medium, das 0,3 mM AT enthielt, wuchsen eine zweistellige Anzahl von Kolonien. Sowohl aus dem Medium ohne AT als auch aus dem 0,3 mM AT enthaltenden Medium wurden auf zufallsbestimmte Weise mehrere Kolonien ausgewählt. Aus den Hefezellen wurden die Plasmide isoliert und in Escherichia coli-Stamm KC8 (pyrF leuB600 trpC hisB463) hinein transformiert. Die Plasmide mit dem Code für Zinkfinger-Transkriptionsfaktoren wurden isoliert und die DNA-Sequenzen von ausgewählten Zinkfingerdomänen wurden ermittelt.
Die Aminosäuresequenz der einzelnen ausgewählten Zinkfingerdomänen wurden aus der DNA-Sequenz abgeleitet. Die Bezeichnungen der Zinkfingerdomänen orientierten sich an den vier Aminosäureresten an Basekontaktierenden Positionen, nämlich den Positionen -1, 2, 3 und 6 entlang der alpha-Helix. Die Ergebnisse sind in Tabelle 1 dargestellt. Die Bezeichnungen der identifizierten Zinkfingerdomänen richten sich nach den vier Aminosäuren an den Base-kontaktierenden Positionen. Eine Analyse der Sequenzen ergab, dass in einigen Fällen die selbe Zinkfingerdomäne wiederholt erhalten worden war. Die Zahlen in den Klammern in Tabelle 1 geben an, wie häufig die selbe Zinkfingerdomäne erhalten wurde. Beispielsweise wurden zwei Zinkfingerdomänen mit CSNR an den vier Base-kontaktierenden Positionen identifiziert und festgestellt, dass diese an die Nukleinsäurestelle GAGC binden (siehe Spalte 3, "GAGC/Humangenom"). Tabelle 1

* Die 4-Buchstaben-Bezeichnungen in den sechs rechten Spalten sind Deskriptoren für die Zinkfingerdomänen, die für die einzelnen Zielsequenzen isoliert wurden. Diese Bezeichnungen geben zwar die Aminosäurereste an Base-kontaktierenden Positionen an, es handelt sich aber nicht um Polypeptidsequenzen.

Die vollständigen DNA-Sequenzen mit dem Code für ausgewählte humane Zinkfingerdomänen und deren übersetzte Aminosäuresequenzen sind in 11 dargestellt. Die komplementär DNA-Sequenz zu den degenerierten PCR-Primern, die zur Amplifikation von DNA-Segmenten mit dem Code für Zinkfingerdomänen im menschlichen Genom verwendet wurden, sind durch Unterstreichung dargestellt. Diese Sequenz kann von der ursprünglichen Basensequenz der berichteten Humangenomsequenz entweder durch Allelunterschiede oder durch Veränderungen, die bei der Amplifikation eingeführt wurde, abweichen.
Bei den meisten Human-Zinkfingerdomänen, die durch Screening nach dem Verfahren der vorliegenden Erfindung identifiziert wurden, handelte es sich entweder um neuartige Polypeptide oder sie entsprachen anonymen offenen Leserastern. Zum Beispiel Zinkfingerdomänen mit der Bezeichnung HSNK (in der Sequenz enthalten, die in der GenBank Zugangsnummer AF155100 berichtet wird) und VSTR (in der Sequenz enthalten, die in der GenBank Zugangsnummer AF02577 berichtet wird) wurden in Proteinen gefunden, deren Funktion bisher unbekannt ist. Die im vorliegenden Schriftstück beschriebenen Ergebnisse weisen nicht nur darauf hin, dass diese Zinkfingerdomänen als sequenzspezifische DNA-Bindungsdomänen funktionieren können, sondern dokumentieren auch deren bevorzugte Bindungsstellenpräferenz im Kontext von chimären Proteinen.
Darüber hinaus belegt die vorliegende Erfindung, dass aus dem Humangenom erhaltene Zinkfingerdomänen als modulare Bausteine zur Konstruktion von neuartigen DNA-Bindungsproteinen verwendet werden können. Human-Zinkfingerdomänen der vorliegenden Erfindung wurden infolge ihrer Funktionstüchtigkeit unter In-vivo-Bedingungen bei Verbindung mit dem C-Terminus von Finger 1 und Finger 2 von Zif268 erhalten. Folglich sind die identifizierten Zinkfingerdomänen in der Lage, spezifische Sequenzen in einem künstlichen Kontext erkennen und eignen sich als modulare Bausteine zur Gestaltung von synthetischen Transkriptionsfaktoren.
Beispiel 7: Paarweise Paarungen
Um die Identifizierung von Zinkfingerdomänen, die an die einzelnen 3-Basenpaar-Zielstelle binden, zu ermöglichen, wurde die Hefepaarung verwendet, um keine wiederholten Transformationen von Hefezellen zu benötigen und mit einer einzelnen Transformation nach positiven Bindern für jedes einzelne der 64 Reporterkonstrukte suchen zu können. Es wurden zwei Hefestämme verwendet: YW1 (Paarungstyp MATα) und YPH499 (Paarungstyp MATa). YW1 wurde durch Selektion eines Klons, der gegenüber 5- Fluororotsäure (FOA) resistent war, aus yWAM2 abgeleitet, um ein ura3-Derivat von yWAM2 zu erzeugen.
Die Plasmidbibliothek von Zinkfingerdomänen wurde durch Hefetransformation in die YW1-Zellen eingeführt. Zellen von ungefähr 10⁶ unabhängig transformierten Kolonien wurden durch Abkratzen der Platten mit einer 10% Glycerinlösung gesammelt. Die Lösung wurde in Form von Teilmengen eingefroren. Jedes Paar von 64 Reporterplasmiden (abgeleitet von pLacZi oder pRS315His) wurden außerdem in den Hefestamm YPH499 ko-transfiziert. Die Transformanten, die beide Reporterplasmide enthalten, wurden geerntet und eingefroren.
Nach dem Auftauen wurden die Hefezellen auf Minimalmedium bis zur Mitte der logarithmischen Phase gezüchtet. Anschließend wurden die beiden Zelltypen gemischt und die Paarung konnte in YPD für eine Dauer von 5 h ablaufen. Diploide Zellen wurden auf Minimalmedium, das X-gal und AT (1 mM) enthielt, dem aber Tryptophan, Leucin, Uracil und Histidin fehlten, selektiert. Nach mehreren Tagen wurden blaue Kolonien isoliert, die auf den Selektivplatten gewachsen waren. Aus blauen Kolonien wurden die Plasmide mit dem Code für Zinkfingerdomänen isoliert und die DNA-Sequenzen der ausgewählten Zinkfingerdomänen wurden ermittelt.
Die aus den blauen Kolonien isolierten Nukleinsäuren wurden einzeln in YW1-Zellen re-transformiert. Für jede einzelne isolierte Nukleinsäure wurden retransformierte YW1-Zellen auf einer 96-Well-Platte mit YPH499-Zellen gepaart, die jeweils eines der 64 Reporterplasmide enthielten und anschließend auf Minimalmedium gegeben, das X-gal enthielt, dem aber Tryptophan und Uracil fehlten. Die DNA-Bindungsaffinitäten und -spezifitäten einer Zinkfingerdomäne für 64 Zielsequenzen wurde anhand der Intensität der blauen Farbe ermittelt. Kontrollversuche mit den Zinkfingerdomänen von Zif268 wiesen darauf hin, dass sich bei positiven Wechselwirkungen zwischen einer Zinkfingerdomäne und einer Bindungsstelle dunkle- bis blass-blaue Kolonien ergaben (wobei die Intensität der blauen Farbe zur Bindungsaffinität proportional ist) und dass sich bei negativen Wechselwirkungen weiße Kolonien ergaben.
Beispiel 8: Vergleich von identifizierten Zinkfingerdomänen mit einem Wechselwirkungscode
Die Aminosäurereste von ausgewählten Zinkfingerdomänen an den kritischen Base-kontaktierenden Positionen wurden mit denen, die nach dem Zinkfingerdomänen-DNA-Wechselwirkungscode (3) erwartet wurden, verglichen. Die meisten Zinkfingerdomänen zeigten erwartete Muster, d. h. die Aminosäurereste an den kritischen Positionen entsprechen den Vorhersagen aus dem Code sehr gut.
Zum Beispiel handelt es sich bei den Konsens-Aminosäureresten in Zinkfingerdomänen, die aus der durch zufallsbestimmte Mutagenese erzeugten Bibliothek ausgewählt wurden, um R (Arg, 7 von 14) oder K (Lys, 2 von 14) an der Position -1, um N (Asp, 6 von 14) an Position 3 und um R (9 von 14) an Position 6 (Tabelle 1). Diese Zinkfingerdomänen wurden mit dem GAGC-Plasmid ausgewählt. (Das Reporterplasmid, in dem die zusammengesetzte Bindungssequenz, 5'-GAGCGGGCG-3', auf operative Weise mit dem Reportergen verknüpft ist, wird als GAGC-Plasmid bezeichnet. Dementsprechend werden die anderen Reporterplasmide, in denen die Sequenz, 5'-XXXXGGGCG-3', auf operative Weise mit dem Reportergen verknüpft ist, als XXXX-Plasmide bezeichnet.) Diese Aminosäurereste an kritischen Base-kontaktierenden Positionen entsprechen genau den Erwartungen aus dem Code. [Die meisten Zinkfingerdomänen im Humangenom enthalten S (Serin) an Position 2 und ein Serinrest ist in der Lage, zu jeder der vier Basen eine Wasserstoffbindung auszubilden. Daher wird der Effekt dieser Position nachfolgend nicht weiter berücksichtigt. Außerdem ist bekannt, dass die Reste an Position 2 üblicherweise nur eine untergeordnete Rolle bei der Basenerkennung spielen (Pavletich and Pabo, (1991) Science 252:809-817).]
Auch die Aminosäurereste in Zinkfingerdomänen, die aus dem Humangenom erhalten wurden, entsprechen den Erwartungen aus dem Code sehr gut. Zum Beispiel handelt es sich bei den Konsens-Aminosäureresten an den Positionen -1, 3 und 6 in den mit dem GAGC-Plasmid erhaltenen Zinkfingerdomänen um R, N und R (Tabelle 1, Spalte 3). Dies sind genau die Aminosäuren, die nach dem Code erwartet werden.
Bei den Aminosäureresten an den Positionen -1, 3 und 6 in den mit dem GCTT-Plasmid erhaltenen Zinkfingerdomänen handelte es sich um V, T und R (Tabelle 1, Spalte 4). Die Reste T und R entsprechen genau den Erwartungen aus dem Code. Bei den nach dem Code vorhergesagten Aminosäurereste an der Position -1, die mit der Base T (unterstrichen) der GCTT-Stelle in Wechselwirkung treten würden, handelt es sich um L, T oder N. Die VSTR-Zinkfingerdomäne, die mit dem GCTT-Plasmid ausgewählt wurde, enthielt V (Valin), eine hydrophobe Aminosäure mit Ähnlichkeit zu L (Leucin) an dieser Position.
Insgesamt entsprechen die Aminosäurereste in ausgewählten Zinkfingerdomänen den Vorhersagen aus dem Code an mindestens zwei Positionen der drei kritischen Positionen. Die nach dem Code in ausgewählten Zinkfingerdomänen zu erwartenden Aminosäurereste sind in Tabelle 1 unterstrichen dargestellt. Diese Ergebnisse sind ein deutlicher Hinweis darauf, dass das im vorliegenden Schriftstück offengelegte In-vivo-Auswahlsystem auf die erwartete Weise funktioniert.
Beispiel 9: Re-Transformation und Kreuztransformation
Um die Möglichkeit von falsch positiven Ergebnissen auszuschließen und die Sequenzspezifität des vorstehend beschriebenen Zinkfingerproteins zu untersuchen, wurden Hefezellen mit den isolierten Plasmiden re-transformiert und kreuztransformiert.
Hefezellen wurden zuerst mit einem Reporterplasmid und einem Hybridplasmid mit dem Code für eine Zinkfingerdomäne ko-transformiert. Minimalmedium, dem Leucin und Tryptophan fehlte, wurde mit den Hefetransformanten beimpft und für eine Dauer von 36 Stunden inkubiert. Ungefähr 1000 Zellen im Wachstumsmedium wurden in Form von Spots direkt auf Festmedium, dem Leucin, Tryptophan und Histidin fehlten (in 10 als -Histidin bezeichnet), und auf Festmedium, dem Leucin und Tryptophan fehlten (in 10 als +Histidin bezeichnet) aufgetragen. Anschließend wurden diese Zellen für eine Dauer von 50 Stunden bei 30°C inkubiert. Die Ergebnisse sind in 10 dargestellt.
Es ist zu erwarten, dass Kolonien in dem Medium ohne Histidin wachsen können, wenn der Zinkfingerteil des Hybridtranskriptionsfaktors an die zusammengesetzte Bindungssequenz bindet und auf diese Weise die Aktivierung der Expression des HIS3-Reportergens durch den Hybridtranskriptionsfaktor erlaubt. In dem Medium ohne Histidin können keine Kolonien wachsen, wenn der Zinkfingerteil des Hybridtranskriptionsfaktors nicht an die zusammengesetzte Bindungssequenz bindet.
Wie in 10 dargestellt, waren die isolierten Zinkfingerdomänen in der Lage, an entsprechende Zielsequenzen zu binden und zeigten dabei eine Sequenzspezifität, die sich deutlich von der von Zif268 unterschied. Zif268 zeigte eine höhere Aktivität mit dem GCGT-Plasmid als mit den fünf anderen Plasmiden, und eine relativ hohe Aktivität mit dem GAGT-Plasmid. Stämme mit Reportern, die andere Bindungsstellen enthielten und das Protein Zif268 exprimierten, bildeten keine Kolonien.
Die KTNR-Zinkfingerdomäne, die aus der durch zufallsbestimmte Mutagenese hergestellten Bibliothek isoliert worden war, war ursprünglich mit dem GAGC-Plasmid ausgewählt worden. Wie erwartet wurden nur mit dem GAGC-Plasmid Kolonien gebildet. Auch Zinkfingerdomänen aus der Bibliothek, die aus dem Humangenom abgeleitet war, zeigten die erwartete Spezifität. Zum Beispiel HSNK, die mit dem GACT-Plasmid ausgewählt worden war, erlaubte das Wachstum von Zellen nur, wenn das GACT-Plasmid in Hefezellen retransformiert worden war. VSTR, die mit dem GCTT-Plasmid ausgewählt worden war, zeigte die höchste Aktivität mit dem GCTT-Plasmid. RDER, die mit dem GACT-Plasmid ausgewählt worden war, hatte die selben Aminosäurereste an den vier Base-kontaktierenden Positionen wie Finger 3 von Zif268. Wie erwartet zeigte diese Zinkfingerdomäne eine ähnliche Sequenzspezifität wie Finger 3. SSNR, die mit dem GAGC- und dem GACT-Plasmid ausgewählt worden war, erlaubte das Zellwachstum auf Medium ohne Histidin mit dem GAGC-Plasmid, aber nicht mit dem GAGT-Plasmid. QSTV, mit dem ACAT-Plasmid erhalten, erlaubte kein Zellwachstum mit einem der in diesem Assay geprüften Plasmide. Diese Zinkfingerdomäne war jedoch in der Lage, unter In-vitro-Bedingungen fest an die ACAT-Sequenz zu binden, wie an späterer Stelle nachgewiesen wird.
Beispiel 10: Gel-Shift-Assays
Zinkfingerproteine, die Zinkfingerdomänen enthalten, die unter Verwendung des modifizierten Ein-Hybrid-Systems ausgewählt wurden, wurden in E. coli exprimiert, aufgereinigt und in Gel Shift Assays verwendet. Die DNA-Segmente mit dem Code für Zinkfingerproteine in den Hybridplasmiden wurden durch Verdauung mit SalI und NotI und Einfügen zwischen die Sall- und die NotI-Stelle in pGEX-4T2 (Pharmacia Biotech) isoliert. Zinkfingerproteine wurden in E. coli-Stamm BL21 in Form von Fusionsproteinen, die mit GST (Glutathion-S-Transferase) verbunden sind, exprimiert. Die Fusionsproteine wurden durch Glutathion-Affinitätschromatografie (Pharmacia Biotech, Piscataway, NJ) aufgereinigt und anschließend mit Thrombin verdaut, wodurch die Verbindungsstelle zwischen dem GST-Teil und Zinkfingerproteinen gespalten wird. Aufgereinigte Zinkfingerproteine enthielten Finger 1 und Finger 2 von Zif268 und ausgewählte Zinkfingerdomänen am C-Terminus.
Die folgenden DNA-Sonden wurden synthetisiert, durch Annealing aneinander gebunden, unter Verwendung von T4-Polynukleotidkinase mit ³²P markiert und in Gel Shift Assays verwendet.
Verschiedene Mengen eines Zinkfingerproteins wurden mit einer markierten Sonden-DNA für die Dauer von einer Stunde bei Raumtemperatur in 20 mM Tris pH 7,7, 120 mM NaCl, 5 mM MgCl₂, 20 μM ZnSO₄, 10% Glycerin, 0,1% Nonidet P-40, 5 mM DTT und 0,10 mg/mL BSA (Rinderserumalbumin) inkubiert und anschließend wurden die Reaktionsmischungen einer Gelelektrophorese unterzogen. Die radioaktiven Signale wurden durch eine Phosphorlmager^TM Analyse (Molecular Dynamics) quantifiziert und Dissoziationskonstanten (K_d) auf die vorbeschriebene Weise (Rebar and Pabo (1994) Science 263:671-673) ermittelt. Die Ergebnisse sind in Tabelle 2 beschrieben. Sämtliche Konstanten wurden in mindestens zwei getrennten Versuchen ermittelt und der Standardfehler des Mittelwerts ist angegeben. Das Zellwachstum von Hefetransformanten auf Minimalmedium ohne Histidin (10) ist in Tabelle 2 ebenfalls angegeben. Tabelle 2

* +++, 20-100% Wachstum; ++, 5-20% Wachstum; +, 1-5% Wachstum; -, < 1% Wachstum.

Zinkfingerproteine, die ein Zellwachstum auf Platten ohne Histidin erlaubten, banden fest an die entsprechende Sonden-DNA. Zum Beispiel das als eine Kontrolle verwendete Protein Zif268 erlaubte mit den GCGT- und GAGT-Reporterplasmiden das Zellwachstum und die unter In-vitro-Bedingungen und unter Verwendung der entsprechenden Sonden-DNAs gemessenen Dissoziationskonstanten beliefen sich auf 0,024 nM bzw. 0,17 nM. Im Gegensatz dazu erlaubte das Protein Zif268 mit anderen Plasmiden kein Zellwachstum und die unter Verwendung der entsprechenden Sonden-DNAs gemessenen Dissoziationskonstanten waren größer als 1 nM.
Ähnliche Ergebnisse wurden mit Zinkfingerproteinen erhalten, die neuartige Zinkfingerdomänen enthielten. Zum Beispiel das KTNR-Protein zeigte eine hohe Affinität für die GAGC-Sonden-DNA mit einer Dissoziationskonstante von 0,17 nM, aber nicht für die GCGT- oder die GACT-Sonden-DNA mit Dissoziationskonstanten von 5,5 nM bzw. 30 nM. Dieses Protein erlaubte das Zellwachstum nur mit dem GAGC-Plasmid. Das HSNK-Protein war in der Lage, fest an die GACT-Sonden-DNA zu binden (K_d = 0,32 nM), aber nicht an die GCGT- oder die GAGT-Sonden-DNA; wie zu erwarten war, erlaubte das HSNK-Protein das Zellwachstum nur mit dem GACT-Plasmid.
Das QSTV-Protein, das mit dem ACAT-Reporterplasmid ausgewählt worden war, war nicht in der Lage, das Zellwachstum mit irgend einem der anderen Reporterplasmide nach der Re-Transformation in Hefe zu fördern. Gel-Shift-Assays zeigten, dass dieses Protein fester an die ACAT-Sonden-DNA als an die anderen Sonden-DNAs band. QSTV band 13 mal fester an die ACAT-Sonden-DNA als an die GCTT-Sonden-DNA bzw. 4,3 mal fester als an die GCGT-Sonden-DNA.
Im Allgemeinen gilt, dass ein Zinkfingerprotein, d. h. eines mit drei Zinkfingerdomänen, das mit einer Dissoziationskonstante unter 1 nM an eine DNA-Sequenz bindet, das Zellwachstum erlaubt, während ein Zinkfingerprotein, das mit einer Dissoziationskonstante über 1 nM an eine DNA-Sequenz bindet, das Zellwachstum nicht erlaubt. Zinkfingerproteine, die mit einer Dissoziationskonstante über 1 nM, aber unter 5 nM binden, können auch nützlich sein, z. B. Im Kontext eines chimären Zinkfingerproteins mit vier Zinkfingerdomänen.
Beispiel 11: TG-ZFD-001 "CSNR1"
TG-ZFD-001 "CSNR1" wurde durch In-vivo-Screening aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YKCKQCGKAFGCPSNLRRHGRTH (SEQ. ID. NR.: 23).
Es wird durch die Human-Nukleinsäuresequenz
5'-TATAAATGTAAGCAATGTGGGAAAGCTTTTGGATGTCCCTCAAACCTTCGAA GGCATGGAAGGACTCAC-3' (SEQ. ID. NR.: 22) kodiert.
Als eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-001 "CSNR1" eine Erkennungsspezifität für die 3-bp-Zielsequenzen GAA, GAC und GAG. Seine Bindungsstellenpräferenz ist GAA > GAC > GAG > GCG basierend auf den Ergebnissen des In-vivo-Screening und EMSA. Im EMSA besitzt die TG-ZFD-001 "CSNR" Fusion an die Finger 1 und 2 von Zif268 und die GST-Aufreinigungshilfen eine scheinbare K_d von 0,17 nM für die GAC-enthaltende Stelle, 0,46 nM für die GAG-enthaltende Stelle und 2,7 nM für die GCG-enthaltende Stelle.
TG-ZFD-001 "CSNR1" kann als ein Modul zur Konstruktion eines chimären DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst, z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz GAA, GAC oder GAG enthält.
Beispiel 12: TG-ZFD-002 "HSNK"
TG-ZFD-002 "HSNK" wurde durch In-vivo-Screening aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YKCKECGKAFNHSSNFNKHHRIH (SEQ. ID. NR.: 25).
Es wird durch die Human-Nukleinsäuresequenz
5'-TATAAGTGTAAGGAGTGTGGGAAAGCCTTCAACCACAGCTCCAACTTCAATA AACACCACAGAATCCAC-3' (SEQ. ID. NR.: 24) kodiert.
Als eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-002 "HSNK" eine Erkennungsspezifität für die 3-bp-Zielsequenz GAC. Seine Bindungsstellenpräferenz ist GAC > GAG > GCG basierend auf den Ergebnissen des In-vivo-Screening und EMSA. Im EMSA besitzt die TG-ZFD-002 "HSNK" Fusion an die Finger 1 und 2 von Zif268 und die GST-Aufreinigungshilfen eine scheinbare K_d von 0,32 nM für die GAC-enthaltende Stelle, 3,5 nM für die GAG-enthaltende Stelle und 42 nM für die GCG-enthaltende Stelle.
TG-ZFD-002 "HSNK" kann als ein Modul zur Konstruktion eines chimären DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst, z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz GAC enthält.
Beispiel 13: TG-ZFD-003 "SSNR"
TG-ZFD-003 "SSNR" wurde durch In-vivo-Screening aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YECKECGKAFSSGSNFTRHQRIH (SEQ. ID. NR.: 27).
Es wird durch die Human-Nukleinsäuresequenz
5'-TATGAATGTAAGGAATGTGGGAAAGCCTTTAGTAGTGGTTCAAACTTCACTC GACATCAGAGAATTCAC-3' (SEQ. ID. NR.: 26) kodiert.
Als eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-003 "SSNR" eine Erkennungsspezifität für die 3-bp-Zielsequenz GAG. Seine Bindungsstellenpräferenz ist GAG > GAC > GCG basierend auf den Ergebnissen des In-vivo-Screening und EMSA. Im EMSA besitzt die TG-ZFD- 003 "SSNR" Fusion an die Finger 1 und 2 von Zif268 und die GST-Aufreinigungshilfen eine scheinbare K_d von 0,45 nM für die GAG-enthaltende Stelle, 0,61 nM für die GAC-enthaltende Stelle und 3,8 nM für die GCG-enthaltende Stelle.
TG-ZFD-003 "SSNR" kann als ein Modul zur Konstruktion eines chimären DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst, z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz GAG oder GAC enthält.
Beispiel 14: TG-ZFD-004 "RDER1"
TG-ZFD-004 "RDER1" wurde durch In-vivo-Screening aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YVCDVEGCTWKFARSDELNRHKKRH (SEQ. ID. NR.: 29).
Es wird durch die Human-Nukleinsäuresequenz
5'-TATGTATGCGATGTAGAGGGATGTACGTGGAAATTTGCCCGCTCAGATGAGC TCAACAGACACAAGAAAAGGCAC-3' (SEQ. ID. NR.: 28) kodiert.
Als eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-004 "RDER1" eine Erkennungsspezifität für die 3-bp-Zielsequenz GCG. Seine Bindungsstellenpräferenz ist GCG > GTG, GAG > GAC basierend auf den Ergebnissen des In-vivo-Screening und EMSA. Im EMSA besitzt die TG-ZFD-004 "RDER1" Fusion an die Finger 1 und 2 von Zif268 und die GST-Aufreinigungshilfen eine scheinbare K_d von 0,027 nM für die GCG-enthaltende Stelle, 0,18 nM für die GAG-enthaltende Stelle und 28 nM für die GAC-enthaltende Stelle.
TG-ZFD-004 "RDER1" kann als ein Modul zur Konstruktion eines chimären DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst, z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz GCG, GTG oder GAG enthält.
Beispiel 15: TG-ZFD-005 "QSTV"
TG-ZFD-005 "QSTV" wurde durch In-vivo-Screening aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YECNECGKAFAQNSTLRVHQRIH (SEQ. ID. NR.: 31).
Es wird durch die Human-Nukleinsäuresequenz
5'-TATGAGTGTAATGAATGCGGGAAAGCTTTTGCCCAAAATTCAACTCTCAGAG TACACCAGAGAATTCAC-3' (SEQ. ID. NR.: 30) kodiert.
Als eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-005 "QSTV" eine Erkennungsspezifität für die 3-bp-Zielsequenz ACA. Seine Bindungsstellenpräferenz ist ACA > GCG > GCT basierend auf EMSA. Im EMSA besitzt die TG-ZFD-005 "QSTV" Fusion an die Finger 1 und 2 von Zif268 und die GST-Aufreinigungshilfen eine scheinbare K_d von 2,3 nM für die ACA-enthaltende Stelle, 9,8 nM für die GCG-enthaltende Stelle und 29 nM für die GCT-enthaltende Stelle.
TG-ZFD-005 "QSTV" kann als ein Modul zur Konstruktion eines chimären DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst, z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz ACA enthält.
Beispiel 16: TG-ZFD-006 "VSTR"
TG-ZFD-006 "VSTR" wurde durch In-vivo-Screening aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YECNYCGKTFSVSSTLIRHQRIH (SEQ. ID. NR.: 33).
Es wird durch die Human-Nukleinsäuresequenz
5'-TATGAGTGTAATTACTGTGGAAAAACCTTTAGTGTGAGCTCAACCCTTATTA GACATCAGAGAATCCAC-3' (SEQ. ID. NR.: 32) kodiert.
Als eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-006 "VSTR" eine Erkennungsspezifität für die 3-bp-Zielsequenz GCT. Seine Bindungsstellenpräferenz ist GCT > GCG > GAG basierend auf den Ergebnissen des In-vivo-Screening und EMSA. Im EMSA besitzt die TG-ZFD-006 "VSTR" Fusion an die Finger 1 und 2 von Zif268 und die GST-Aufreinigungshilfen eine scheinbare K_d von 0,53 nM für die GCT-enthaltende Stelle, 0,76 nM für die GCG-enthaltende Stelle und 1,4 nM für die GAG-enthaltende Stelle.
TG-ZFD-006 "VSTR" kann als ein Modul zur Konstruktion eines chimären DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst, z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz GCT oder GCG enthält.
Beispiel 17: TG-ZFD-007 "CSNR2"
TG-ZFD-007 "CSNR2" wurde durch In-vivo-Screening aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YQCNICGKCFSCNSNLHRHQRTH (SEQ. ID. NR.: 35).
Es wird durch die Human-Nukleinsäuresequenz
5'-TATCAGTGCAACATTTGCGGAAAATGTTTCTCCTGCAACTCCAACCTCCA CAGGCACCAGAGAACGCAC-3' (SEQ. ID. NR.: 34) kodiert.
Als eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-007 "CSNR2" eine Erkennungsspezifität für die 3-bp-Zielsequenzen GAA, GAC und GAG. Seine Bindungsstellenpräferenz ist GAA > GAC > GAG basierend auf den Ergebnissen des In-vivo-Screening.
TG-ZFD-007 "CSNR2" kann als ein Modul zur Konstruktion eines chimären DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst, z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz GAA, GAC oder GAG enthält.
Beispiel 18: TG-ZFD-008 "QSHR1"
TG-ZFD-008 "QSHR1" wurde durch In-vivo-Screening aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YACHLCGKAFTQSSHLRRHEKTH (SEQ. ID. NR.: 37).
Es wird durch die Human-Nukleinsäuresequenz
5'-TATGCATGTCATCTATGTGGAAAAGCCTTCACTCAGAGTTCTCACCTTAG AAGACATGAGAAAACTCAC-3' (SEQ. ID. NR.: 36) kodiert.
Als eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-008 "QSHR1" eine Erkennungsspezifität für die 3-bp-Zielsequenzen GGA, GAA und AGA. Seine Bindungsstellenpräferenz ist GGA > GAA > AGA basierend auf den Ergebnissen des In-vivo-Screening.
TG-ZFD-008 "QSHR1" kann als ein Modul zur Konstruktion eines chimären DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst, z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz GGA, GAA oder AGA enthält.
Beispiel 19: TG-ZFD-009 "QSHR2"
TG-ZFD-009 "QSHR2" wurde durch In-vivo-Screening aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YKCGQCGKFYSQVSHLTRHQKIH (SEQ. ID. NR.: 39).
Es wird durch die Human-Nukleinsäuresequenz
5'-TATAAATGCGGCCAGTGTGGGAAGTTCTACTCGCAGGTCTCCCACCTCA CCCGCCACCAGAAAATCCAC-3' (SEQ. ID. NR.: 38) kodiert.
Als eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-009 "QSHR2" eine Erkennungsspezifität für die 3-bp-Zielsequenz GGA.
TG-ZFD-009 "QSHR2" kann als ein Modul zur Konstruktion eines chimären DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst, z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz GGA enthält.
Beispiel 20: TG-ZFD-010 "QSHR3"
TG-ZFD-010 "QSHR3" wurde durch In-vivo-Screening aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YACHLCGKAFTQCSHLRRHEKTH (SEQ. ID. NR.: 41).
Es wird durch die Human-Nukleinsäuresequenz
5'-TATGCATGTCATCTATGTGGAAAAGCCTTCACTCAGTGTTCTCACCTTAG AAGACATGAGAAAACTCAC-3' (SEQ. ID. NR.: 40) kodiert.
Als eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-010 "QSHR3" eine Erkennungsspezifität für die 3-bp-Zielsequenzen GGA und GAA. Seine Bindungsstellenpräferenz ist GGA > GAA basierend auf den Ergebnissen des In-vivo-Screening.
TG-ZFD-010 "QSHR3" kann als ein Modul zur Konstruktion eines chimären DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst, z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz GGA oder GAA enthält.
Beispiel 21: TG-ZFD-011 "QSHR4"
TG-ZFD-011 "QSHR4" wurde durch In-vivo-Screening aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YACHLCAKAFIQCSHLRRHEKTH (SEQ. ID. NR.: 43).
Es wird durch die Human-Nukleinsäuresequenz
5'-TATGCATGTCATCTATGTGCAAAAGCCTTCATTCAGTGTTCTCACCTTAGA AGACATGAGAAACTCAC-3' (SEQ. ID. NR.: 42) kodiert.
Als eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-011 "QSHR4" eine Erkennungsspezifität für die 3-bp-Zielsequenzen GGA und GAA. Seine Bindungsstellenpräferenz ist GGA > GAA basierend auf den Ergebnissen des In-vivo-Screening.
TG-ZFD-011 "QSHR4" kann als ein Modul zur Konstruktion eines chimären DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst, z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz GGA oder GAA enthält.
Beispiel 22: TG-ZFD-012 "QSHR5"
TG-ZFD-012 "QSHR5" wurde durch In-vivo-Screening aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YVCRECGRGFRQHSHLVRHKRTH (SEQ. ID. NR.: 45). Es wird durch die Human-Nukleinsäuresequenz
5'-TATGTTTGCAGGGAATGTGGGCGTGGCTTTCGCCAGCATTCACACC TGGTCAGACACAAGAGGACACAT-3' (SEQ. ID. NR.: 44) kodiert.
Als eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-012 "QSHR5" eine Erkennungsspezifität für die 3-bp-Zielsequenzen GGA, AGA, GAA und CGA. Seine Bindungsstellenpräferenz ist GGA > AGA > GAA > CGA basierend auf den Ergebnissen des In-vivo-Screening.
TG-ZFD-012 "QSHR5" kann als ein Modul zur Konstruktion eines chimären DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst, z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz GGA, AGA, GAA oder CGA enthält.
Beispiel 23: TG-ZFD-013 "QSNR1"
TG-ZFD-013 "QSNR1" wurde durch In-vivo-Screening aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
FECKDCGKAFIQKSNLIRHQRTH (SEQ. ID. NR.: 47).
Es wird durch die Human-Nukleinsäuresequenz
5'-TTTGAGTGTAAAGATTGCGGGAAAGCTTTCATTCAGAAGTCAAACCTCA TCAGACACCAGAGAACTCAC-3' (SEQ. ID. NR.: 46) kodiert.
Als eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-013 "QSNR1" eine Erkennungsspezifität für die 3-bp-Zielsequenz GAA.
TG-ZFD-013 "QSNR1" kann als ein Modul zur Konstruktion eines chimären DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst, z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz GAA enthält.
Beispiel 24: TG-ZFD-014 "QSNR2"
TG-ZFD-014 "QSNR2" wurde durch In-vivo-Screening aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YVCRECRRGFSQKSNLIRHQRTH (SEQ. ID. NR.: 49).
Es wird durch die Human-Nukleinsäuresequenz
5'-TATGTCTGCAGGGAGTGTAGGCGAGGTTTTAGCCAGAAGTCAAATCTCA TCAGACACCAGAGGACGCAC-3' (SEQ. ID. NR.: 48) kodiert.
Als eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-014 "QSNR2" eine Erkennungsspezifität für die 3-bp-Zielsequenz GAA.
TG-ZFD-014 "QSNR2" kann als ein Modul zur Konstruktion eines chimären DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst, z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz GAA enthält.
Beispiel 25: TG-ZFD-015 "QSNV1"
TG-ZFD-015 "QSNV1" wurde durch In-vivo-Screening aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YECNTCRKTFSQKSNLIVHQRTH (SEQ. ID. NR.: 51). Es wird durch die Human-Nukleinsäuresequenz
5'-TATGAATGTAACACATGCAGGAAAACCTTCTCTCAAAAGTCAAATCTCAT TGTACATCAGAGAACACAC-3' (SEQ. ID. NR.: 50) kodiert.
Als eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-015 "QSNV1" eine Erkennungsspezifität für die 3-bp-Zielsequenzen AAA und CAA. Seine Bindungsstellenpräferenz ist AAA > CAA basierend auf den Ergebnissen des In-vivo-Screening.
TG-ZFD-015 "QSNV1" kann als ein Modul zur Konstruktion eines chimären DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst, z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz AAA oder CAA enthält.
Beispiel 26: TG-ZFD-016 "QSNV2"
TG-ZFD-016 "QSNV2" wurde durch In-vivo-Screening aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YVCSKCGKAFTQSSNLTVHQKIH (SEQ. ID. NR.: 53).
Es wird durch die Human-Nukleinsäuresequenz
5'-TATGTTTGCTCAAAATGTGGGAAAGCCTTCACTCAGAGTTCAAATCTGAC TGTACATCAAAAAATCCAC-3' (SEQ. ID. NR.: 52) kodiert.
Als eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-016 "QSNV2" eine Erkennungsspezifität für die 3-bp-Zielsequenzen AAA und CAA. Seine Bindungsstellenpräferenz ist AAA > CAA basierend auf den Ergebnissen des In-vivo-Screening.
TG-ZFD-016 "QSNV2" kann als ein Modul zur Konstruktion eines chimären DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst, z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz AAA oder CAA enthält.
Beispiel 27: TG-ZFD-017 "QSNV3"
TG-ZFD-017 "QSNV3" wurde durch In-vivo-Screening aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YKCDECGKNFTQSSNLIVHKRIH (SEQ. ID. NR.: 55).
Es wird durch die Human-Nukleinsäuresequenz
5'-TACAAATGTGACGAATGTGGAAAAAACTTTACCCAGTCCTCCAACCTTA TTGTACATAAGAGAATTCAT-3' (SEQ. ID. NR.: 54) kodiert.
Als eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-017 "QSNV3" eine Erkennungsspezifität für eine 3-bp-Zielsequenz AAA.
TG-ZFD-017 "QSNV3" kann als ein Modul zur Konstruktion eines chimären DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst, z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz AAA enthält.
Beispiel 28: TG-ZFD-018 "QSNV4"
TG-ZFD-018 "QSNV4" wurde durch In-vivo-Screening aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YECDVCGKTFTQKSNLGVHQRTH (SEQ. ID. NR.: 57).
Es wird durch die Human-Nukleinsäuresequenz
5'-TATGAATGTGATGTGTGTGGAAAAACCTTCACGCAAAAGTCAAACCTTG GTGTACATCAGAGAACTGAT-3' (SEQ. ID. NR.: 56) kodiert.
Als eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-018 "QSNV4" eine Erkennungsspezifität für die 3-bp-Zielsequenz AAA.
TG-ZFD-018 "QSNV4" kann als ein Modul zur Konstruktion eines chimären DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst, z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz AAA enthält.
Beispiel 29: TG-ZFD-019 "QSSR1"
TG-ZFD-019 "QSSR1" wurde durch In-vivo-Screening aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YKCPDCGKSFSQSSSLIRHQRTH (SEQ. ID. NR.: 59).
Es wird durch die Human-Nukleinsäuresequenz
5'-TATAAGTGCCCTGATTGTGGGAAGAGTTTTAGTCAGAGTTCCAGCCTCAT TCGCCACCAGCGGACACAC-3' (SEQ. ID. NR.: 58) kodiert.
Als eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-019 "QSSR1" eine Erkennungsspezifität für die 3-bp-Zielsequenzen GTA und GCA. Seine Bindungsstellenpräferenz ist GTA > GCA basierend auf den Ergebnissen des In-vivo-Screening.
TG-ZFD-019 "QSSR1" kann als ein Modul zur Konstruktion eines chimären DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst, z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz GTA oder GCA enthält.
Beispiel 30: TG-ZFD-020 "QSSR2"
TG-ZFD-020 "QSSR2" wurde durch In-vivo-Screening aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YECQDCGRAFNQNSSLGRHKRTH (SEQ. ID. NR.: 61).
Es wird durch die Human-Nukleinsäuresequenz
5'-TATGAGTGTCAGGACTGTGGGAGGGCCTTCAACCAGAACTCCTCCCTGG GGCGGCACAAGAGGACACAC-3' (SEQ. ID. NR.: 60) kodiert.
Als eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-020 "QSSR2" eine Erkennungsspezifität für die 3-bp-Zielsequenz GTA.
TG-ZFD-020 "QSSR2" kann als ein Modul zur Konstruktion eines chimären DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst, z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz GTA enthält.
Beispiel 31: TG-ZFD-021 "QSTR"
TG-ZFD-021 "QSTR" wurde durch In-vivo-Screening aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YKCEECGKAFNQSSTLTRHKIVH (SEQ. ID. NR.: 63).
Es wird durch die Human-Nukleinsäuresequenz
5'-TACAAATGTGAAGAATGTGGCAAAGCTTTTAACCAGTCCTCAACCCTTA CTAGACATAAGATAGTTCAT-3' (SEQ. ID. NR.: 62) kodiert.
Als eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-021 "QSTR" eine Erkennungsspezifität für die 3-bp-Zielsequenzen GTA und GCA. Seine Bindungsstellenpräferenz ist GTA > GCA basierend auf den Ergebnissen des In-vivo-Screening.
TG-ZFD-021 "QSTR" kann als ein Modul zur Konstruktion eines chimären DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst, z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz GTA oder GCA enthält.
Beispiel 32: TG-ZFD-022 "RSHR"
TG-ZFD-022 "RSHR" wurde durch In-vivo-Screening aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YKCMECGKAFNRRSHLTRHQRIH (SEQ. ID. NR.: 65).
Es wird durch die Human-Nukleinsäuresequenz
5'-TATAAGTGCATGGAGTGTGGGAAGGCTTTTAACCGCAGGTCACACCTCA CACGGCACCAGCGGATTGAC-3' (SEQ. ID. NR.: 64) kodiert.
Als eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-022 "RSHR" eine Erkennungsspezifität für die 3-bp-Zielsequenz GGG.
TG-ZFD-022 "RSHR" kann als ein Modul zur Konstruktion eines chimären DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst, z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz GGG enthält.
Beispiel 33: TG-ZFD-023-"VSSR"
TG-ZFD-023-"VSSR" wurde durch In-vivo-Screening aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YTCKQCGKAFSVSSSLRRHETTH (SEQ. ID. NR.: 67).
Es wird durch die Human-Nukleinsäuresequenz
5'-TATACATGTAAACAGTGTGGGAAAGCCTTCAGTGTTTCCAGTTCCCTTCG AAGACATGAAACCACTCAC-3' (SEQ. ID. NR.: 66) kodiert.
Als eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-023-"VSSR" eine Erkennungsspezifität für die 3-bp-Zielsequenzen GTT, GTG und GTA. Seine Bindungsstellenpräferenz ist GTT > GTG > GTA basierend auf den Ergebnissen des In-vivo-Screening.
TG-ZFD-023-"VSSR" kann als ein Modul zur Konstruktion eines chimären DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst, z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz GTT, GTG oder GTA enthält.
Beispiel 34: TG-ZFD-024 "QAHR"
TG-ZFD-024 "QAHR" wurde durch In-vivo-Screening aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YKCKECGQAFRQRAHLIRHHKLH (SEQ. ID. NR.: 103).
Es wird durch die Human-Nukleinsäuresequenz
5'-TATAAGTGTAAGGAATGTGGGCAGGCCTTTAGACAGCGTGCACATCTT ATTCGACATCACAAACTTCAC-3' (SEQ. ID. NR.: 102) kodiert.
Als eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-024 "QAHR" eine Erkennungsspezifität für die 3-bp-Zielsequenz GGA basierend auf den Ergebnissen des In-vivo-Screening.
TG-ZFD-024 "QAHR" kann als ein Modul zur Konstruktion eines chimären DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst, z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz GGA enthält.
Beispiel 35: TG-ZFD-025 "QFNR"
TG-ZFD-025 "QFNR" wurde durch In-vivo-Screening aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YKCHQCGKAFIQSFNLRRHERTH (SEQ. ID. NR.: 105).
Es wird durch die Human-Nukleinsäuresequenz
5'-TATAAGTGTCATCAATGTGGGAAAGCCTTTATTCAATCCTTTAACCTTC GAAGACATGAGAGAACTCAC-3' (SEQ. ID. NR.: 104) kodiert.
Als eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-025 "QFNR" eine Erkennungsspezifität für die 3-bp-Zielsequenz GAC basierend auf den Ergebnissen des In-vivo-Screening.
TG-ZFD-025 "QFNR" kann als ein Modul zur Konstruktion eines chimären DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst, z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz GAC enthält.
Beispiel 36: TG-ZFD-026 "QGNR"
TG-ZFD-026 "QGNR" wurde durch In-vivo-Screening aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
FQCNQCGASFTQKGNLLRHIKLH (SEQ. ID. NR.: 107).
Es wird durch die Human-Nukleinsäuresequenz
5'-TTCCAGTGTAATCAGTGTGGGGCATCTTTTACTCAGAAAGGTAACCTCC TCCGCCACATTAAACTGCAC-3' (SEQ. ID. NR.: 106) kodiert.
Als eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-026 "QGNR" eine Erkennungsspezifität für die 3-bp-Zielsequenz GAA basierend auf den Ergebnissen des In-vivo-Screening.
TG-ZFD-026 "QGNR" kann als ein Modul zur Konstruktion eines chimären DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst, z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz GAA enthält.
Beispiel 37: TG-ZFD-028 "QSHT"
TG-ZFD-028 "QSHT" wurde durch In-vivo-Screening aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YKCEECGKAFRQSSHLTTHKIIH (SEQ. ID. NR.: 111).
Es wird durch die Human-Nukleinsäuresequenz
5'-TACAAATGTGAAGAATGTGGCAAAGCCTTTAGGCAGTCCTCACACCTTA CTACACATAAGATAATTCAT-3' (SEQ. ID. NR.: 110) kodiert.
Als eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-028 "QSHT" eine Erkennungsspezifität für die 3-bp-Zielsequenz AGA, CGA, TGA und GGA. Seine Bindungsstellenpräferenz ist (AGA und CGA) > TGA > GGA basierend auf den Ergebnissen des In-vivo-Screening.
TG-ZFD-028 "QSHT" kann als ein Modul zur Konstruktion eines chimären DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst, z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz AGA, CGA, TGA und GGA enthält.
Beispiel 38: TG-ZFD-029 "QSHV"
TG-ZFD-029 "QSHV" wurde durch In-vivo-Screening aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YECDHCGKSFSQSSHLNVHKRTH (SEQ. ID. NR.: 113).
Es wird durch die Human-Nukleinsäuresequenz
5'-TATGAGTGTGATCACTGTGGAAAATCCTTTAGCCAGAGCTCTCATCTGAA TGTGCACAAAAGAACTCAC-3' (SEQ. ID. NR.: 112) kodiert.
Als eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-029 "QSHV" eine Erkennungsspezifität für die 3-bp-Zielsequenz CGA, AGA und TGA. Seine Bindungsstellenpräferenz ist CGA > AGA > TGA basierend auf den Ergebnissen des In-vivo-Screening.
TG-ZFD-029 "QSHV" kann als ein Modul zur Konstruktion eines chimären DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst, z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz CGA, AGA und TGA enthält.
Beispiel 39: TG-ZFD-030 "QSNI"
TG-ZFD-030 "QSNI" wurde durch In-vivo-Screening aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YMCSECGRGFSQKSNLIIHQRTH (SEQ. ID. NR.: 115).
Es wird durch die Human-Nukleinsäuresequenz
5'-TACATGTGCAGTGAGTGTGGGCCAGGCTTCAGCCAGAAGTCAAACCTC ATCATACACCAGAGGACACAC-3' (SEQ. ID. NR.: 114) kodiert.
Als eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-030 "QSNI" eine Erkennungsspezifität für die 3-bp-Zielsequenz AAA und CAA basierend auf den Ergebnissen des In-vivo-Screening.
TG-ZFD-030 "QSNI" kann als ein Modul zur Konstruktion eines chimären DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst, z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz AAA oder CAA enthält.
Beispiel 40: TG-ZFD-031 "QSNR3"
TG-ZFD-031 "QSNR3" wurde durch In-vivo-Screening aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YECEKCGKAFNQSSNLTRHKKSH (SEQ. ID. NR.: 117).
Es wird durch die Human-Nukleinsäuresequenz
5'-TATGAATGTGAAAAATGTGGCAAAGCTTTTAACCAGTCCTCAAATCTTA CTAGACATAAGAAAAGTCAT-3' (SEQ. ID. NR.: 116) kodiert.
Als eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-031 "QSNR3" eine Erkennungsspezifität für die 3-bp-Zielsequenz GAA basierend auf den Ergebnissen des In-vivo-Screening.
TG-ZFD-031 "QSNR3" kann als ein Modul zur Konstruktion eines chimären DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst, z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz GAA enthält.
Beispiel 41: TG-ZFD-032 "QSSR3"
TG-ZFD-032 "QSSR3" wurde durch In-vivo-Screening aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YECNECGKFFSQSSSLIRHRRSH (SEQ. ID. NR.: 119).
Es wird durch die Human-Nukleinsäuresequenz
5'-TATGAGTGCAATGAATGTGGGAAGTTTTTTAGCCAGAGCTCCAGCCTCATTAGACATAGGAGAAGTCAC-3' (SEQ. ID. NR.: 118) kodiert.
Als eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-032 "QSSR3" eine Erkennungsspezifität für die 3-bp-Zielsequenz GTA und GCA. Seine Bindungsstellenpräferenz ist GTA > GCA basierend auf den Ergebnissen des In-vivo-Screening.
TG-ZFD-032 "QSSR3" kann als ein Modul zur Konstruktion eines chimären DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst, z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz GTA oder GCA enthält.
Beispiel 42: TG-ZFD-033 "QTHQ"
TG-ZFD-033 "QTHQ" wurde durch In-vivo-Screening aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YECHDCGKSFRQSTHLTQHRRIH (SEQ. ID. NR.: 121).
Es wird durch die Human-Nukleinsäuresequenz
5'-TATGAGTGTCACGATTGCGGAAAGTCCTTTAGGCAGAGCACCCACCTCA CTCAGCACCGGAGGATCCAC-3' (SEQ. ID. NR.: 120) kodiert.
Als eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-033 "QTHQ" eine Erkennungsspezifität für die 3-bp-Zielsequenz AGA, TGA und CGA. Seine Bindungsstellenpräferenz ist AGA > (TGA und CGA) basierend auf den Ergebnissen des In-vivo-Screening.
TG-ZFD-033 "QTHQ" kann als ein Modul zur Konstruktion eines chimären DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst, z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz AGA, TGA und CGA enthält.
Beispiel 43: TG-ZFD-034 "QTHR1"
TG-ZFD-034 "QTHR1" wurde durch In-vivo-Screening aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YECHDCGKSFRQSTHLTRHRRIH (SEQ. ID. NR.: 123).
Es wird durch die Human-Nukleinsäuresequenz
5'-TATGAGTGTCACGATTGCGGAAAGTCCTTTAGGCAGAGCACCCACCTCA CTCGGCACCGGAGGATCCAC-3' (SEQ. ID. NR.: 122) kodiert.
Als eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-034 "QTHR1" eine Erkennungsspezifität für die 3-bp-Zielsequenz GGA, GAA und AGA. Seine Bindungsstellenpräferenz ist GGA > (GAA und AGA) basierend auf den Ergebnissen des In-vivo-Screening.
TG-ZFD-034 "QTHR1" kann als ein Modul zur Konstruktion eines chimären DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst, z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz GGA, GAA und AGA enthält.
Beispiel 44: TG-ZFD-035 "QTHR2"
TG-ZFD-035 "QTHR2" wurde durch In-vivo-Screening aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
HKCLECGKCFSQNTHLTRHQRT (SEQ. ID. NR.: 125).
Es wird durch die Human-Nukleinsäuresequenz
5'-CACAAGTGCCTTGAATGTGGGAAATGCTTCAGTCAGAACACCCATCTG ACTCGCCACCAACGCACCCAC-3' (SEQ. ID. NR.: 124) kodiert.
Als eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-035 "QTHR2" eine Erkennungsspezifität für die 3-bp-Zielsequenz GGA basierend auf den Ergebnissen des In-vivo-Screening.
TG-ZFD-035 "QTHR2" kann als ein Modul zur Konstruktion eines chimären DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst, z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz GGA enthält.
Beispiel 45: TG-ZFD-036 "RDER2"
TG-ZFD-036 "RDER2" wurde durch In-vivo-Screening aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YHCDWDGCGWKFARSDELTRHYRKH (SEQ. ID. NR.: 127).
Es wird durch die Human-Nukleinsäuresequenz
5'-TACCACTGTGACTGGGACGGCTGTGGATGCAAATTCGCCCGCTCAGAT GAACTGACCAGGCACTACCGTAAACAC-3' (SEQ. ID. NR.: 126) kodiert.
Als eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-036 "RDER2" eine Erkennungsspezifität für die 3-bp-Zielsequenz GCG und GTG. Seine Bindungsstellenpräferenz ist GCG > GTG basierend auf den Ergebnissen des In-vivo-Screening.
TG-ZFD-036 "RDER2" kann als ein Modul zur Konstruktion eines chimären DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst, z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz GCG und GTG enthält.
Beispiel 46: TG-ZFD-037 "RDER3"
TG-ZFD-037 "RDER3" wurde durch In-vivo-Screening aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YRCSWEGCEWRFARSDELTRHFRKH (SEQ. ID. NR.: 129).
Es wird durch die Human-Nukleinsäuresequenz
5'-TACAGATGCTCATGGGAAGGGTGTGAGTGGCGTTTTGCAAGAAGTGAT GAGTTAACCAGGCACTTCCGAAAGCAC-3' (SEQ. ID. NR.: 128) kodiert.
Als eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-037 "RDER3" eine Erkennungsspezifität für die 3-bp-Zielsequenz GCG und GTG basierend auf den Ergebnissen des In-vivo-Screening.
TG-ZFD-037 "RDER3" kann als ein Modul zur Konstruktion eines chimären DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst, z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz GCG und GTG enthält.
Beispiel 47: TG-ZFD-038 "RDER4"
TG-ZFD-038 "RDER4" wurde durch In-vivo-Screening aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
FSGSWKGCERRFARSDELSRHRRTH (SEQ. ID. NR.: 131).
Es wird durch die Human-Nukleinsäuresequenz
5'-TTCAGCTGTAGCTGGAAAGGTTGTGAAAGGAGGTTTGCCCGTTCTGATG AACTGTCCAGACACAGGCGAACCCAC-3' (SEQ. ID. NR.: 130) kodiert.
Als eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-038 "RDER4" eine Erkennungsspezifität für die 3-bp-Zielsequenz GCG und GTG basierend auf den Ergebnissen des In-vivo-Screening.
TG-ZFD-038 "RDER4" kann als ein Modul zur Konstruktion eines chimären DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst, z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz GCG und GTG enthält.
Beispiel 48: TG-ZFD-039 "RDER5"
TG-ZFD-039 "RDER5" wurde durch In-vivo-Screening aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
FACSWQDCNKKFARSDELARHYRTH (SEQ. ID. NR.: 133).
Es wird durch die Human-Nukleinsäuresequenz
5'-TTCGCCTGCAGCTGGCAGGACTGCAACAAGAAGTTCGCGCGCTCCGAC GAGCTGGCGCGGCACTACCGCACACAC-3' (SEQ. ID. NR.: 132) kodiert.
Als eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-039 "RDER5" eine Erkennungsspezifität für die 3-bp-Zielsequenz GCG basierend auf den Ergebnissen des In-vivo-Screening.
TG-ZFD-039 "RDER5" kann als ein Modul zur Konstruktion eines chimären DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst, z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz GCG enthält.
Beispiel 49: TG-ZFD-040 "RDER6"
TG-ZFD-040 "RDER6" wurde durch In-vivo-Screening aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YHCNWDGCGWKFARSDELTRHYRKH (SEQ. ID. NR.: 135).
Es wird durch die Human-Nukleinsäuresequenz
5'-TACCACTGCAACTGGGACGGCTGCGGCTGGAAGTTTGCGCGCTCAGAC GAGCTCACGCGCCACTACCGAAAGCAC-3' (SEQ. ID. NR.: 134) kodiert.
Als eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-040 "RDER6" eine Erkennungsspezifität für die 3-bp-Zielsequenz GCG und GTG. Seine Bindungsstellenpräferenz ist GCG > GTG basierend auf den Ergebnissen des In-vivo-Screening.
TG-ZFD-040 "RDER6" kann als ein Modul zur Konstruktion eines chimären DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst, z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz GCG und GTG enthält.
Beispiel 50: TG-ZFD-041 "RDHR1"
TG-ZFD-041 "RDHR1" wurde durch In-vivo-Screening aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
FLCQYCAQRFGRKDHLTRHMKKSH (SEQ. ID. NR.: 137).
Es wird durch die Human-Nukleinsäuresequenz
5'-TTCCTCTGTCAGTATTGTGCACAGAGATTTGGGCGAAAGGATCACCTGA CTCGACATATGAAGAAGAGTCAG-3' (SEQ. ID. NR.: 136) kodiert.
Als eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-041 "RDHR1" eine Erkennungsspezifität für die 3-bp-Zielsequenz GAG und GGG basierend auf den Ergebnissen des In-vivo-Screening.
TG-ZFD-041 "RDHR1" kann als ein Modul zur Konstruktion eines chimären DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst, z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz GAG und GGG enthält.
Beispiel 51: TG-ZFD-043 "RDHT"
TG-ZFD-043 "RDHT" wurde durch In-vivo-Screening aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
FQCKTCQRKFSRSDHLKTHTRTH (SEQ. ID. NR.: 141).
Es wird durch die Human-Nukleinsäuresequenz
5'-TTCCAGTGTAAAACTTGTCAGCGAAAGTTCTCCCGGTCCGACCACCTGA AGACCCACACCAGGACTCAT-3' (SEQ. ID. NR.: 140) kodiert.
Als eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-043 "RDHT" eine Erkennungsspezifität für die 3-bp-Zielsequenz TGG, AGG, CGG und GGG basierend auf den Ergebnissen des In-vivo-Screening.
TG-ZFD-043 "RDHT" kann als ein Modul zur Konstruktion eines chimären DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst, z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz TGG, AGG, CGG und GGG enthält.
Beispiel 52: TG-ZFD-044 "RDKI"
TG-ZFD-044 "RDKI" wurde durch In-vivo-Screening aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
FACEVCGVRFTRNDKLKIHMRKH (SEQ. ID. NR.: 143).
Es wird durch die Human-Nukleinsäuresequenz
5'-TTTGCCTGCGAGGTCTGCGGTGTTCGATTCACCAGGAACGACAAGCTGA AGATCCACATGCGGAAGCAC-3' (SEQ. ID. NR.: 142) kodiert.
Als eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-044 "RDKI" eine Erkennungsspezifität für die 3-bp-Zielsequenz GGG basierend auf den Ergebnissen des In-vivo-Screening.
TG-ZFD-044 "RDKI" kann als ein Modul zur Konstruktion eines chimären DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst, z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz GGG enthält.
Beispiel 53: TG-ZFD-045 "RDKR"
TG-ZFD-045 "RDKR" wurde durch In-vivo-Screening aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YVCDVEGCTWKFARSDKLNRHKKRH (SEQ. ID. NR.: 145).
Es wird durch die Human-Nukleinsäuresequenz
5'-TATGTATGCGATGTAGAGGGATGTACGTGGAAATTTGCCCGCTCAGATA AGCTCAACAGACACAAGAAAAGGCAC-3' (SEQ. ID. NR.: 144) kodiert.
Als eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-045 "RDKR" eine Erkennungsspezifität für die 3-bp-Zielsequenz GGG und AGG. Seine Bindungsstellenpräferenz ist GGG > AGG basierend auf den Ergebnissen des In-vivo-Screening.
TG-ZFD-045 "RDKR" kann als ein Modul zur Konstruktion eines chimären DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst, z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz GGG und AGG enthält.
Beispiel 54: TG-ZFD-046 "RSNR"
TG-ZFD-046 "RSNR" wurde durch In-vivo-Screening aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YICRKCGRGFSRKSNLIRHQRTH (SEQ. ID. NR.: 147).
Es wird durch die Human-Nukleinsäuresequenz
5'-TATATTTGCAGAAAGTGTGGACGGGGCTTTAGTCGGAAGTCCAACCTTA TCAGACATCAGAGGACACAC-3' (SEQ. ID. NR.: 146) kodiert.
Als eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-046 "RSNR" eine Erkennungsspezifität für die 3-bp-Zielsequenz GAG und GTG. Seine Bindungsstellenpräferenz ist GAG > GTG basierend auf den Ergebnissen des In-vivo-Screening.
TG-ZFD-046 "RSNR" kann als ein Modul zur Konstruktion eines chimären DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst, z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz GAG und GTG enthält.
Beispiel 55: TG-ZFD-047 "RTNR"
TG-ZFD-047 "RTNR" wurde durch In-vivo-Screening aus Humangenomsequenz identifiziert. Die Aminosäuresequenz lautet:
YLCSECDKCFSRSTNLIRHRRTH (SEQ. ID. NR.: 149).
Es wird durch die Human-Nukleinsäuresequenz
5'-TATCTATGTAGTGAGTGTGACAAATGCTTCAGTAGAAGTACAAACCTCA TAAGGCATCGAAGAACTCAC-3' (SEQ. ID. NR.: 148) kodiert.
Als eine Polypeptidfusion an die Finger 1 und 2 von Zif268 zeigt TG-ZFD-047 "RTNR" eine Erkennungsspezifität für die 3-bp-Zielsequenz GAG basierend auf den Ergebnissen des In-vivo-Screening.
TG-ZFD-047 "RTNR" kann als ein Modul zur Konstruktion eines chimären DNA-Bindungsproteins verwendet werden, das multiple Zinkfingerdomänen umfasst, z. B. zum Zweck der Erkennung einer DNA-Stelle, die die Sequenz GAG enthält.
Es wurde eine Reihe von Ausführungsformen der Erfindung beschrieben. Trotzdem ist davon auszugehen, dass verschiedene Modifikationen vorgenommen werden können, ohne vom Geist und dem Gültigkeitsbereich der Erfindung abzuweichen. Folglich umfasst der Gültigkeitsbereich der nachfolgenden Ansprüche auch weitere Ausführungsformen.
Sequenzliste

Claims

Verfahren zur Identifizierung einer Zinkfingerdomäne, die eine Zielstelle auf einer DNA erkennt, wobei das Verfahren umfasst: (a) Bereitstellung von Zellen, die ein Reporterkonstrukt enthalten, wobei das Konstrukt ein mit einem Promoter auf operative Weise verbundenes Reportergen umfasst, in der die Expression des Reportergens über ein gegebenes Niveau hinaus aktiviert oder unter ein gegebenes Niveau hinaus gehemmt ist, wenn ein Transkriptionsfaktor sowohl eine Rekrutierungsstelle als auch eine Zielstelle des Promoters erkennt, aber nicht, wenn der Transkriptionsfaktor nur die Rekrutierungsstelle des Promoters erkennt, (b) Bereitstellung einer Vielzahl von Hybridnukleinsäuren, die jeweils den Code für ein nicht natürlich vorkommendes Protein tragen, das (i) eine Transkriptionsaktivierungs- oder repressionsdomäne, (ii) eine die Rekrutierungsstelle erkennende DNA-Bindungsdomäne und (iii) eine Testzinkfingerdomäne umfasst, wobei sich der Code für die Aminosäuresequenz der Testzinkfingerdomäne bei den Mitgliedern der Vielzahl unterscheidet, (c) in Kontakt bringen der Vielzahl von Hybridnukleinsäuren mit den Zellen unter Bedingungen, die es mindestens einer aus der Vielzahl von Nukleinsäuren erlauben, in mindestens eine der Zellen einzudringen, (d) Kultivierung der Zellen unter Bedingungen, die die Expression der Hybridnukleinsäuren in den Zellen erlauben, und (e) Identifizierung einer Zelle, die eine der Hybridnukleinsäuren von (b) enthält und in der eine Expression des Reportergens über das gegebene Niveau hinaus aktiviert oder die Expression des Reportergens unter das gegebene Niveau hinaus gehemmt ist, was darauf hinweist, dass die Zelle eine Hybridnukleinsäure mit dem Code für eine die Zielstelle erkennende Testzinkfingerdomäne enthält.
Verfahren gemäß Anspruch 1, wobei es sich bei den Zellen um eukaryotische Zellen handelt.
Verfahren gemäß Anspruch 2, wobei es sich bei den Zellen um Hefezellen handelt.
Verfahren gemäß Anspruch 3, wobei es sich bei den Zellen um Saccharomyces cerevisiae-Zellen handelt.
Verfahren gemäß Anspruch 1, wobei es sich bei dem Reportergen um einen selektierbaren Marker handelt.
Verfahren gemäß Anspruch 5, wobei der selektierbare Marker aus der aus URA3, HIS3, LEU2, ADE2 und TRP1 bestehenden Gruppe ausgewählt wird.
Verfahren gemäß Anspruch 1, wobei das Reportergen aus der aus LacZ, CAT, Luciferase, GUS und GFP bestehenden Gruppe ausgewählt wird.
Verfahren gemäß Anspruch 1, wobei die DNA-Bindungsdomäne eine Zinkfingerdomäne umfasst.
Verfahren gemäß Anspruch 1, wobei die DNA-Bindungsdomäne zwei Zinkfingerdomänen umfasst.
Verfahren gemäß Anspruch 1, wobei die DNA-Bindungsdomäne drei Zinkfingerdomänen umfasst.
Verfahren gemäß Anspruch 1, das darüber hinaus folgende Schritte umfasst: (i) Amplifizierung einer Quellnukleinsäure mit dem Code für die Testzinkfingerdomäne, aus genomischer Nukleinsäure, einer Messenger RNA (mRNA) Mischung, oder einer komplementären DNA (cDNA) Mischung unter Verwendung eines Oligonukleotidprimers, der an eine Sequenz mit dem Code für einen Randbereich einer konservierten Domäne bindet, um ein amplifiziertes Fragment herzustellen, und (ii) Nutzung des amplifizierten Fragments zur Konstruktion einer Hybridnukleinsäure zur Einbeziehung in die Vielzahl von Hybridnukleinsäuren von Schritt (b).
Verfahren gemäß Anspruch 1, das darüber hinaus folgende Schritte umfasst: (i) Identifizierung einer Kandidatenaminosäuresequenz einer Zinkfingerdomäne in einer Sequenzdatenbank, (ii) Bereitstellung einer Kandidatennukleinsäure mit dem Code für die Kandidatenaminosäuresequenz der Zinkfingerdomäne und (iii) Nutzung der Kandidatennukleinsäure zur Konstruktion einer Hybridnukleinsäure zur Einbeziehung in die Vielzahl von Hybridnukleinsäuren von Schritt (b).
Verfahren gemäß Anspruch 5, wobei es sich bei dem selektierbaren Marker um ein für die Synthese eines Metaboliten erforderliches Auxotrophiegen handelt; das Genom der Zellen keine funktionelle Kopie des Auxotrophiegens enthält und in Schritt (d) die Zellen in einem Medium kultiviert werden, das ohne den Metaboliten zubereitet wurde.
Verfahren gemäß Anspruch 1, wobei die Schritte (a) bis (e) wiederholt werden, um eine zweite Testzinkfingerdomäne zu identifizieren, die eine zweite Zielstelle erkennt.
Verfahren gemäß Anspruch 14, das darüber hinaus die Konstruktion einer Nukleinsäure mit dem Code für ein Polypeptid umfasst, das die erste Testzinkfingerdomäne und die zweite Testzinkfingerdomäne umfasst.
Verfahren zur Identifizierung einer Zinkfingerdomäne, die eine Zielstelle auf einer DNA erkennt, wobei das Verfahren umfasst: (a) Bereitstellung von Zellen, die ein Reporterkonstrukt enthalten, wobei das Konstrukt ein mit einem Promoter auf operative Weise verbundenes Reportergen umfasst, in der die Expression des Reportergens über ein gegebenes Niveau hinaus aktiviert oder unter ein gegebenes Niveau hinaus gehemmt ist, wenn ein Transkriptionsfaktor sowohl eine Rekrutierungsstelle als auch eine Zielstelle des Promoters erkennt, aber nicht, wenn der Transkriptionsfaktor nur die Rekrutierungsstelle des Promoters erkennt, (b) Amplifizierung einer Vielzahl von Nukleinsäuresequenzen, jeweils mit dem Code für eine Testzinkfingerdomäne, unter Verwendung eines Oligonukleotidprimers, der an eine Nukleinsäure mit dem Code für einen Randbereich einer konservierten Domäne bindet, (c) Verbindung der einzelnen Nukleinsäuresequenzen von (b) mit Nukleinsäuresequenzen mit dem Code für (i) eine Transkriptionsaktivierungs- oder -repressionsdomäne und (ii) eine die Rekrutierungsstelle erkennende DNA-Bindungsdomäne, um eine Vielzahl von Hybridnukleinsäuren zu bilden, (d) in Kontakt bringen der Vielzahl von Hybridnukleinsäuren von (c) mit den Zellen von (a) unter Bedingungen, die es mindestens einer aus der Vielzahl von Nukleinsäuren erlauben, in mindestens eine der Zellen einzudringen, (e) Kultivierung der Zellen unter Bedingungen, die die Expression der Hybridnukleinsäuren in den Zellen erlauben, und (f) Identifizierung einer Zelle, die eine der Hybridnukleinsäuren von (c) enthält und in der eine Expression des Reportergens über das gegebene Niveau hinaus aktiviert oder die Expression des Reportergens unter das gegebene Niveau hinaus gehemmt ist, wobei die Hybridnukleinsäure den Code für eine Testzinkfingerdomäne enthält, die die Zielstelle auf der DNA erkennt.
Verfahren gemäß Anspruch 16, wobei es sich bei den Zellen um Hefezellen handelt.
Verfahren gemäß Anspruch 16, wobei das Reportergen aus der aus LacZ, CAT, Luciferase, GUS und GFP bestehenden Gruppe ausgewählt ist.
Verfahren gemäß Anspruch 16, wobei die DNA-Bindungsdomäne eine Zinkfingerdomäne umfasst.
Verfahren gemäß Anspruch 16, wobei die DNA-Bindungsdomäne zwei Zinkfingerdomänen umfasst.
Verfahren zur Ermittlung, ob eine Testzinkfingerdomäne eine Zielstelle auf einem Promoter erkennt, wobei das Verfahren umfasst: (a) Bereitstellung eines Reporterkonstrukts, das ein mit einem Promoter auf operative Weise verbundenes Reportergen umfasst, in der die Expression des Reportergens über ein gegebenes Niveau hinaus aktiviert oder unter ein gegebenes Niveau hinaus gehemmt ist, wenn ein Transkriptionsfaktor sowohl eine Rekrutierungsstelle als auch eine Zielstelle des Promoters erkennt, aber nicht, wenn der Transkriptionsfaktor nur die Rekrutierungsstelle des Promoters erkennt, (b) Bereitstellung einer Hybridnukleinsäure mit dem Code für ein nicht natürlich vorkommendes Protein, das (i) eine Transkriptionsaktivierungs- oder -repressionsdomäne, (ii) eine die Rekrutierungsstelle erkennende DNA-Bindungsdomäne und (iii) eine Testzinkfingerdomäne umfasst, (c) in Kontakt bringen des Reporterkonstrukts mit einer Zelle unter Bedingungen, die dem Reporterkonstrukt das Eindringen in die Zelle erlauben, (d) vor, nach oder gleichzeitig mit Schritt (c), in Kontakt bringen der Hybridnukleinsäure mit der Zelle unter Bedingungen, die der Hybridnukleinsäure das Eindringen in die Zelle erlauben, (e) Kultivierung der Zelle unter Bedingungen, die die Expression der Hybridnukleinsäure in der Zelle erlauben, und (f) Feststellung von Unterschieden bei der Reportergenexpression in der Zelle, wobei ein Unterschied bei einem Niveau der Reportergenexpression über das gegebene Niveau hinaus oder unter das gegebene Niveau hinaus einen Hinweis darstellt, dass die Testzinkfingerdomäne die Zielstelle erkennt.
Verfahren gemäß Anspruch 21, darüber hinaus umfassend den Schritt der Amplifizierung einer Nukleinsäure mit dem Code für die Testzinkfingerdomäne aus genomischer Nukleinsäure, einer mRNA-Mischung, oder einer cDNA-Mischung unter Verwendung eines Oligonukleotidprimers, der an eine Sequenz mit dem Code für einen Randbereich einer konservierten Domäne bindet.
Verfahren gemäß Anspruch 21, darüber hinaus umfassend die Schritte (i) der Identifizierung einer Kandidatenaminosäuresequenz einer Zinkfingerdomäne in einer Sequenzdatenbank, (ii) Bereitstellung einer Kandidatennukleinsäure mit dem Code für die Kandidatenaminosäuresequenz der Zinkfingerdomäne und (iii) Nutzung der Kandidatennukleinsäure zur Konstruktion einer Hybridnukleinsäure zur Einbeziehung in die Vielzahl von Hybridnukleinsäuren von Schritt (b).
Verfahren zur Ermittlung, ob eine Testzinkfingerdomäne eine Zielstelle an einem Promoter erkennt, wobei das Verfahren umfasst: (a) Bereitstellung einer ersten Zelle, die ein Reporterkonstrukt umfasst, das ein mit einem Promoter auf operative Weise verbundenes Reportergen umfasst, in der die Expression des Reportergens über ein gegebenes Niveau hinaus aktiviert oder unter ein gegebenes Niveau hinaus gehemmt ist, wenn ein Transkriptionsfaktor sowohl eine Rekrutierungsstelle als auch eine Zielstelle des Promoters erkennt, aber nicht, wenn der Transkriptionsfaktor nur die Rekrutierungsstelle des Promoters erkennt, (b) Bereitstellung einer zweiten Zelle, die eine Hybridnukleinsäure mit dem Code für ein Protein umfasst, das (i) eine Transkriptionsaktivierungs- oder -repressionsdomäne, (ii) eine die Rekrutierungs-Bindungsstelle erkennende DNA-Bindungsdomäne und (iii) eine Testzinkfingerdomäne umfasst, (c) Fusion der ersten und der zweiten Zelle unter Bildung einer fusionierten Zelle, (d) Kultivierung der fusionierten Zelle unter Bedingungen, die die Expression der Hybridnukleinsäuren in der Zelle erlauben, und (e) Feststellung von Unterschieden bei der Reportergenexpression in der fusionierten Zelle, wobei ein Unterschied bei einem Niveau der Reportergenexpression über das gegebene Niveau hinaus oder unter das gegebene Niveau hinaus einen Hinweis darstellt, dass die Testzinkfingerdomäne die Zielstelle erkennt.
Verfahren gemäß Anspruch 24, wobei es sich bei der ersten und der zweiten Zelle um Hefezellen mit gegensätzlichem Paarungstyp handelt.
Verfahren zur Ermittlung, ob eine Testzinkfingerdomäne eine Zielstelle an einem Promoter erkennt, wobei das Verfahren umfasst: (a) Bereitstellung einer Vielzahl von Reporterkonstrukten, die jeweils ein mit einem Promoter auf operative Weise verbundenes Reportergen umfassen, bei denen die Expression des Reportergens über ein gegebenes Niveau hinaus aktiviert oder unter ein gegebenes Niveau hinaus gehemmt ist, wenn ein Transkriptionsfaktor sowohl eine Rekrutierungsstelle als auch eine Zielstelle des Promoters erkennt, aber nicht, wenn der Transkriptionsfaktor nur die Rekrutierungsstelle des Promoters erkennt, (b) Bereitstellung einer Zelle, die eine Hybridnukleinsäure mit dem Code für ein nicht natürlich vorkommendes Protein enthält, das (i) eine Transkriptionsaktivierungs- oder -repressionsdomäne, (ii) eine die Rekrutierungsstelle erkennende DNA-Bindungsdomäne und (iii) eine Testzinkfingerdomäne umfasst, (c) in Kontakt bringen der Vielzahl von Reporterkonstrukten mit der Zelle unter Bedingungen, die mindestens einem aus der Vielzahl der Reporterkonstrukte das Eindringen in die Zelle erlauben, (d) Kultivierung der Zelle unter Bedingungen, die die Expression der Hybridnukleinsäure in der Zelle erlauben, und (e) Identifizierung einer Zelle, die ein Reportergen aus (a) enthält und die Expression des Reportergens über das gegebene Niveau hinaus aktiviert oder die Expression des Reportergens unter das gegebene Niveau hinaus hemmt, was darauf hinweist, dass das Reporterkonstrukt in der Zelle eine Zielstelle umfasst, die von der Testzinkfingerdomäne erkannt wird.
Verfahren gemäß Anspruch 26, wobei die Größe der Zielbindungsstelle zwischen zwei und sechs Nukleotide beträgt.
Verfahren gemäß Anspruch 27, wobei die Vielzahl von Reporterkonstrukten alle möglichen Kombinationen der Nukleotide A, T, G und C an mindestens zwei Positionen der Zielbindungsstelle umfasst.
Verfahren gemäß Anspruch 28, wobei die Vielzahl von Reporterkonstrukten alle möglichen Kombinationen der Nukleotide A, T, G und C an mindestens drei Positionen der Zielbindungsstellen umfasst.
Verfahren gemäß Anspruch 26, wobei die Schritte (a) bis (e) für eine zweite Testzinkfingerdomäne wiederholt werden, um eine zweite Bindungspräferenz zu identifizieren.
Verfahren gemäß Anspruch 30, darüber hinaus umfassend die Konstruktion einer Nukleinsäure mit dem Code für ein Polypeptid, das die erste und zweite Testzinkfingerdomäne umfasst.
Verfahren zur Identifizierung einer Vielzahl von Zinkfingerdomänen, wobei das Verfahren umfasst: Durchführung des Verfahrens gemäß Anspruch 1 zur Identifizierung einer ersten Testzinkfingerdomäne, und erneute Durchführung des Verfahrens gemäß Anspruch 1 zur Identifizierung einer zweiten Testzinkfingerdomäne, die eine Zielstelle erkennt, die sich von der Zielstelle unterscheidet, die von der ersten Testzinkfingerdomäne erkannt wird.
Verfahren zur Herstellung einer Nukleinsäure mit dem Code für ein chimäres Zinkfingerprotein, wobei das Verfahren umfasst: Durchführung des Verfahrens gemäß Anspruch 32, Konstruktion einer Nukleinsäure mit dem Code für ein Polypeptid, das die erste und die zweite Testzinkfingerdomäne umfasst.
Verfahren zur Identifizierung von DNA-Sequenzen, die von Zinkfingerdomänen erkannt werden, wobei das Verfahren umfasst: Durchführung des Verfahrens gemäß Anspruch 24 zur Identifizierung einer ersten Zielstelle, die von einer ersten Testzinkfingerdomäne erkannt wird, und erneute Durchführung des Verfahrens gemäß Anspruch 24 zur Identifizierung einer zweiten Zielstelle, die von einer zweiten Testzinkfingerdomäne erkannt wird.
Verfahren zur Herstellung einer Nukleinsäure mit dem Code für ein chimäres Zinkfingerprotein, wobei das Verfahren umfasst: Durchführung des Verfahrens gemäß Anspruch 34, Konstruktion einer Nukleinsäure mit dem Code für ein Polypeptid, das die erste und die zweite Zinkfingerdomäne umfasst.
Verfahren gemäß Anspruch 1, wobei die identifizierte Zinkfingerdomäne die Aminosäuresequenz: X_a-X-Cys-X_2-5-Cys-X₃-X_a-X-Cys-X-Ser-Asn-X_b-X-Arg-His-X_3-5-His (SEQ. ID. NR. 68) umfasst, wobei es sich bei X_a um Phenylalanin oder Tyrosin und bei X_b um einen hydrophoben Rest handelt.
Verfahren gemäß Anspruch 1, wobei es sich bei der Hybridnukleinsäure mit dem Code für die Testzinkfingerdomäne um eine Nukleinsäuresequenz mit dem Code für die Aminosäuresequenz gemäß Anspruch 36 handelt.
Verfahren gemäß Anspruch 1, wobei die identifizierte Zinkfingerdomäne die Aminosäuresequenz: X_a-X-Cys-X_2-5-Cys-X₃-X_a-X-His-X-Ser-Asn-X_b-X-Lys-His-X_3-5-His (SEQ. ID. NR. 69) umfasst, wobei es sich bei X_a um ein Phenylalanin oder Tyrosin und bei X_b um einen hydrophoben Rest handelt.
Verfahren gemäß Anspruch 1, wobei es sich bei der Hybridnukleinsäure mit dem Code für die Testzinkfingerdomäne um eine Nukleinsäuresequenz mit dem Code für die Aminosäuresequenz gemäß Anspruch 38 handelt.
Verfahren gemäß Anspruch 1, wobei die identifizierte Zinkfingerdomäne die Aminosäuresequenz: X_a-X-Cys-X_2-5-Cys-X₃-X_a-X-Ser-X-Ser-Asn-X_b-X-Arg-His-X_3-5-His (SEQ. ID. NR. 70) umfasst, wobei es sich bei X_a um ein Phenylalanin oder Tyrosin und bei X_b um einen hydrophoben Rest handelt.
Verfahren gemäß Anspruch 1, wobei es sich bei der Hybridnukleinsäure mit dem Code für die Testzinkfingerdomäne um eine Nukleinsäuresequenz mit dem Code für die Aminosäuresequenz gemäß Anspruch 40 handelt.
Verfahren gemäß Anspruch 1, wobei die identifizierte Zinkfingerdomäne die Aminosäuresequenz: X_a-X-Cys-X_2-5-Cys-X₃-X_a-X-Gln-X-Ser-Thr-X_b-X-Val-His-X_3-5-His (SEQ. ID. NR. 71) umfasst, wobei es sich bei X_a um ein Phenylalanin oder Tyrosin und bei X_b um einen hydrophoben Rest handelt.
Verfahren gemäß Anspruch 1, wobei es sich bei der Hybridnukleinsäure mit dem Code für die Testzinkfingerdomäne um eine Nukleinsäuresequenz mit dem Code für die Aminosäuresequenz gemäß Anspruch 42 handelt.
Verfahren gemäß Anspruch 1, wobei die identifizierte Zinkfingerdomäne die Aminosäuresequenz: X_a-X-Cys-X_2-5-Cys-X₃-X_a-X-Val-X-Ser-X_c-X_b-X-Arg-His-X_3-5-His (SEQ. ID. NR. 72) umfasst, wobei es sich bei X_a um ein Phenylalanin oder Tyrosin, bei X_b um einen hydrophoben Rest und bei X_c um Serin oder Threonin handelt.
Verfahren gemäß Anspruch 1, wobei es sich bei der Hybridnukleinsäure mit dem Code für die Testzinkfingerdomäne um eine Nukleinsäuresequenz mit dem Code für die Aminosäuresequenz gemäß Anspruch 44 handelt.
Verfahren gemäß Anspruch 1, wobei die identifizierte Zinkfingerdomäne die Aminosäuresequenz: X_a-X-Cys-X_2-5-Cys-X₃-X_a-X-Gln-X-Ser-His-X_b-X-Arg-His-X_3-5-His (SEQ. ID. NR. 73) umfasst, wobei es sich bei X_a um ein Phenylalanin oder Tyrosin und bei X_b um einen hydrophoben Rest handelt.
Verfahren gemäß Anspruch 1, wobei es sich bei der Hybridnukleinsäure mit dem Code für die Testzinkfingerdomäne um eine Nukleinsäuresequenz mit dem Code für die Aminosäuresequenz gemäß Anspruch 46 handelt.
Verfahren gemäß Anspruch 1, wobei die identifizierte Zinkfingerdomäne die Aminosäuresequenz: X_a-X-Cys-X_2-5-Cys-X₃-X_a-X-Gln-X-Ser-Asn-X_b-X-Val-His-X_3-5-His (SEQ. ID. NR. 74) umfasst, wobei es sich bei X_a um ein Phenylalanin oder Tyrosin und bei X_b um einen hydrophoben Rest handelt.
Verfahren gemäß Anspruch 1, wobei es sich bei der Hybridnukleinsäure mit dem Code für die Testzinkfingerdomäne um eine Nukleinsäuresequenz mit dem Code für die Aminosäuresequenz gemäß Anspruch 48 handelt.
Verfahren gemäß Anspruch 1, wobei die identifizierte Zinkfingerdomäne die Aminosäuresequenz: X_a-X-Cys-X_2-5-Cys-X₃-X_a-X-Gln-X-Ser-X_c-X_b-X-Arg-His-X_3-5-His (SEQ. ID. NR. 75) umfasst, wobei es sich bei X_a um ein Phenylalanin oder Tyrosin, bei X_b um einen hydrophoben Rest und bei X_c um Serin oder Threonin handelt.
Verfahren gemäß Anspruch 1, wobei es sich bei der Hybridnukleinsäure mit dem Code für die Testzinkfingerdomäne um eine Nukleinsäuresequenz mit dem Code für die Aminosäuresequenz gemäß Anspruch 50 handelt.
Verfahren gemäß Anspruch 1, wobei die identifizierte Zinkfingerdomäne eine Aminosäuresequenz umfasst, die zu 50%, 60%, 70%, 80%, 90%, 93%, 95%, 96%, 98%, 99% oder 100% identisch zu SEQ. ID. NR. 65 ist.
Verfahren gemäß Anspruch 1, wobei es sich bei der Hybridnukleinsäure mit dem Code für die Testzinkfingerdomäne um eine Nukleinsäuresequenz mit dem Code für die Aminosäuresequenz gemäß Anspruch 52 handelt.
Verfahren gemäß Anspruch 1, wobei die identifizierte Zinkfingerdomäne eine Aminosäuresequenz umfasst, die zu 50%, 60%, 70%, 80%, 90%, 93%, 95%, 96%, 98%, 99% oder 100% identisch zu einer Aminosäuresequenz ist, die aus der aus SEQ. ID. NR. 29, 127, 129, 131, 133 und 135 bestehenden Gruppe ausgewählt ist.
Verfahren gemäß Anspruch 1, wobei es sich bei der Hybridnukleinsäure mit dem Code für die Testzinkfingerdomäne um eine Nukleinsäuresequenz mit dem Code für die Aminosäuresequenz gemäß Anspruch 54 handelt.
Verfahren gemäß Anspruch 1, wobei die identifizierte Zinkfingerdomäne die Aminosäuresequenz: X_a-X-Cys-X_2-5-Cys-X₃-X_a-X-Gln-X-Ala-His-X_b-X-Arg-His-X_3-5-His (SEQ. ID. NR. 150) umfasst, wobei es sich bei X_a um ein Phenylalanin oder Tyrosin und bei X_b um einen hydrophoben Rest handelt.
Verfahren gemäß Anspruch 1, wobei es sich bei der Hybridnukleinsäure mit dem Code für die Testzinkfingerdomäne um eine Nukleinsäuresequenz mit dem Code für die Aminosäuresequenz gemäß Anspruch 56 handelt.
Verfahren gemäß Anspruch 1, wobei die identifizierte Zinkfingerdomäne die Aminosäuresequenz: X_a-X-Cys-X_2-5-Cys-X₃-X_a-X-Gln-X-Phe-Asn-X_b-X-Arg-His-X_3-5-His (SEQ. ID. NR. 151) umfasst, wobei es sich bei X_a um ein Phenylalanin oder Tyrosin und bei X_b um einen hydrophoben Rest handelt.
Verfahren gemäß Anspruch 1, wobei es sich bei der Hybridnukleinsäure mit dem Code für die Testzinkfingerdomäne um eine Nukleinsäuresequenz mit dem Code für die Aminosäuresequenz gemäß Anspruch 58 handelt.
Verfahren gemäß Anspruch 1, wobei die identifizierte Zinkfingerdomäne die Aminosäuresequenz: X_a-X-Cys-X_2-5-Cys-X₃-X_a-X-Gln-X-Ser-His-X_b-X-Thr-His-X_3-5-His (SEQ. ID. NR. 152) umfasst, wobei es sich bei X_a um ein Phenylalanin oder Tyrosin und bei X_b um einen hydrophoben Rest handelt.
Verfahren gemäß Anspruch 1, wobei es sich bei der Hybridnukleinsäure mit dem Code für die Testzinkfingerdomäne um eine Nukleinsäuresequenz mit dem Code für die Aminosäuresequenz gemäß Anspruch 60 handelt.
Verfahren gemäß Anspruch 1, wobei die identifizierte Zinkfingerdomäne die Aminosäuresequenz: X_a-X-Cys-X_2-5-Cys-X₃-X_a-X-Gln-X-Ser-His-X_b-X-Val-His-X_3-5-His (SEQ. ID. NR. 153) umfasst, wobei es sich bei X_a um ein Phenylalanin oder Tyrosin und bei X_b um einen hydrophoben Rest handelt.
Verfahren gemäß Anspruch 1, wobei es sich bei der Hybridnukleinsäure mit dem Code für die Testzinkfingerdomäne um eine Nukleinsäuresequenz mit dem Code für die Aminosäuresequenz gemäß Anspruch 62 handelt.
Verfahren gemäß Anspruch 1, wobei die identifizierte Zinkfingerdomäne die Aminosäuresequenz: X_a-X-Cys-X_2-5-Cys-X₃-X_a-X-Gln-X-Ser-Asn-X_b-X-Ile-His-X_3-5-His (SEQ. ID. NR. 154) umfasst, wobei es sich bei X_a um ein Phenylalanin oder Tyrosin und bei X_b um einen hydrophoben Rest handelt.
Verfahren gemäß Anspruch 1, wobei es sich bei der Hybridnukleinsäure mit dem Code für die Testzinkfingerdomäne um eine Nukleinsäuresequenz mit dem Code für die Aminosäuresequenz gemäß Anspruch 64 handelt.
Verfahren gemäß Anspruch 1, wobei die identifizierte Zinkfingerdomäne die Aminosäuresequenz: X_a-X-Cys-X_2-5-Cys-X₃-X_a-X-Gln-X-Ser-Asn-X_b-X-Arg-His-X_3-5-His (SEQ. ID. NR. 155) umfasst, wobei es sich bei X_a um ein Phenylalanin oder Tyrosin und bei X_b um einen hydrophoben Rest handelt.
Verfahren gemäß Anspruch 1, wobei es sich bei der Hybridnukleinsäure mit dem Code für die Testzinkfingerdomäne um eine Nukleinsäuresequenz mit dem Code für die Aminosäuresequenz gemäß Anspruch 66 handelt.
Verfahren gemäß Anspruch 1, wobei die identifizierte Zinkfingerdomäne die Aminosäuresequenz: X_a-X-Cys-X_2-5-Cys-X₃-X_a-X-Gln-X-Thr-His-X_b-X-Gln-His-X_3-5-His (SEQ. ID. NR. 156) umfasst, wobei es sich bei X_a um ein Phenylalanin oder Tyrosin und bei X_b um einen hydrophoben Rest handelt.
Verfahren gemäß Anspruch 1, wobei es sich bei der Hybridnukleinsäure mit dem Code für die Testzinkfingerdomäne um eine Nukleinsäuresequenz mit dem Code für die Aminosäuresequenz gemäß Anspruch 68 handelt.
Verfahren gemäß Anspruch 1, wobei die identifizierte Zinkfingerdomäne die Aminosäuresequenz: Cys-X_2-5-Cys-X₃-X_a-X-Gln-X-Thr-His-X_b-X-Arg-His-X_3-5-His (SEQ. ID. NR. 157) umfasst, wobei es sich bei X_a um ein Phenylalanin oder Tyrosin und bei X_b um einen hydrophoben Rest handelt.
Verfahren gemäß Anspruch 1, wobei es sich bei der Hybridnukleinsäure mit dem Code für die Testzinkfingerdomäne um eine Nukleinsäuresequenz mit dem Code für die Aminosäuresequenz gemäß Anspruch 70 handelt.
Verfahren gemäß Anspruch 1, wobei die identifizierte Zinkfingerdomäne die Aminosäuresequenz: X_a-X-Cys-X_2-5-Cys-X₃-X_a-X-Arg-X-Asp-Lys-X_b-X-Ile-His-X_3-5-His (SEQ. ID. NR. 158) umfasst, wobei es sich bei X_a um ein Phenylalanin oder Tyrosin und bei X_b um einen hydrophoben Rest handelt.
Verfahren gemäß Anspruch 1, wobei es sich bei der Hybridnukleinsäure mit dem Code für die Testzinkfingerdomäne um eine Nukleinsäuresequenz mit dem Code für die Aminosäuresequenz gemäß Anspruch 72 handelt.
Verfahren gemäß Anspruch 1, wobei die identifizierte Zinkfingerdomäne die Aminosäuresequenz: X_a-X-Cys-X_2-5-Cys-X₃-X_a-X-Arg-X-Ser-Asn-X_b-X-Arg-His-X_3-5-His (SEQ. ID. NR. 159) umfasst, wobei es sich bei X_a um ein Phenylalanin oder Tyrosin und bei X_b um einen hydrophoben Rest handelt.
Verfahren gemäß Anspruch 1, wobei es sich bei der Hybridnukleinsäure mit dem Code für die Testzinkfingerdomäne um eine Nukleinsäuresequenz mit dem Code für die Aminosäuresequenz gemäß Anspruch 74 handelt.
Verfahren gemäß Anspruch 1, wobei die identifizierte Zinkfingerdomäne eine Aminosäuresequenz umfasst, die zu 50%, 60%, 70%, 80%, 90%, 93%, 95%, 96%, 98%, 99% oder 100% identisch zu SEQ. ID. NR. 137 ist.
Verfahren gemäß Anspruch 1, wobei es sich bei der Hybridnukleinsäure mit dem Code für die Testzinkfingerdomäne um eine Nukleinsäuresequenz mit dem Code für die Aminosäuresequenz gemäß Anspruch 76 handelt.
Verfahren gemäß Anspruch 1, wobei die identifizierte Zinkfingerdomäne eine Aminosäuresequenz umfasst, die zu 50%, 60%, 70%, 80%, 90%, 93%, 95%, 96%, 98%, 99% oder 100% identisch zu SEQ. ID. NR. 145 ist.
Verfahren gemäß Anspruch 1, wobei es sich bei der Hybridnukleinsäure mit dem Code für die Testzinkfingerdomäne um eine Nukleinsäuresequenz mit dem Code für die Aminosäuresequenz gemäß Anspruch 78 handelt.
Verfahren gemäß Anspruch 1, wobei die identifizierte Zinkfingerdomäne eine Aminosäuresequenz umfasst, die zu 50%, 60%, 70%, 80%, 90%, 93%, 95%, 96%, 98%, 99% oder 100% identisch zu SEQ. ID. NR. 149 ist.
Verfahren gemäß Anspruch 1, wobei es sich bei der Hybridnukleinsäure mit dem Code für die Testzinkfingerdomäne um eine Nukleinsäuresequenz mit dem Code für die Aminosäuresequenz gemäß Anspruch 80 handelt.
Verfahren gemäß Anspruch 1, wobei die identifizierte Zinkfingerdomäne eine Aminosäuresequenz umfasst, die zu 50%, 60%, 70%, 80%, 90%, 93%, 95%, 96%, 98%, 99% oder 100% identisch zu SEQ. ID. NR. 141 ist.
Verfahren gemäß Anspruch 1, wobei es sich bei der Hybridnukleinsäure mit dem Code für die Testzinkfingerdomäne um eine Nukleinsäuresequenz mit dem Code für die Aminosäuresequenz gemäß Anspruch 82 handelt.