DE112021002672T5

DE112021002672T5 - Vefahren und zusammensetzungen zum gleichzeitigen editieren beider stränge einer doppelsträngigen nukleotid-zielsequenz

Info

Publication number: DE112021002672T5
Application number: DE112021002672.0T
Authority: DE
Inventors: David R. Liu; Andrew Vito Anzalone; Jonathan Ma Levy; Xin Gao; Christopher J. Podracky
Original assignee: Harvard College; Broad Institute Inc
Current assignee: Harvard College; Broad Institute Inc
Priority date: 2020-05-08
Filing date: 2021-05-07
Publication date: 2023-04-13
Also published as: KR20230019843A; BR112022022603A2; CN116096873A; WO2021226558A8; EP4146804A1; AU2021267940A1; US20230220374A1; CA3177481A1; JP2023525304A; WO2021226558A1; MX2022014008A; US11912985B2; IL297761A; GB202218378D0; GB2614813A

Abstract

Die vorliegende Offenbarung stellt Systeme, Zusammensetzungen und Verfahren zum gleichzeitigen Editieren beider Stränge einer doppelsträngigen DNA-Sequenz an einer zu editierenden Zielstelle bereit. In einigen Punkten umfassen die Systeme einen ersten und zweiten Prime-Editor-Komplex, wobei der erste und zweite Prime-Editor-Komplex jeweils Folgendes umfassen: (1) einen Prime-Editor, der (i) ein Nukleinsäure-programmierbares DNA- Bindungsprotein (napDNAbp), und (ii) ein Polypeptid mit RNA-abhängiger DNA- Polymeraseaktivität umfasst; und (2) eine PEgRNA, die eine Spacer-Sequenz, einen gRNA- Kern, eine DNA-Synthese-Template, und eine Primer-Bindungsstelle umfasst, wobei die DNA-Synthese-Template eine gewünschte DNA-Sequenz oder ein Komplement ebendieser kodiert, wobei die gewünschte DNA-Sequenz und das Komplement ebendieser einen Duplex bilden, der einen editierten Teil umfasst, der in die zu editierende Zielstelle integriert wird. In einigen Punkten umfassen die Systeme einen ersten, zweiten, dritten und vierten Prime-Editor- Komplex, die jeweils einen Prime-Editor sowie eine PEgRNA umfassen. Ebenfalls hier offenbart sind Verfahren zum gleichzeitigen Editieren beider Stränge einer doppelsträngigen DNA-Sequenz an einer zu editierenden Zielstelle. Ferner sind alle pharmazeutischen Zusammensetzungen, Polynukleotide, Vektoren, Zellen und Kits hier offenbart.

Description

STAATLICHE UNTERSTÜTZUNG
Diese Erfindung entstand mit staatlicher Unterstützung unter den Förderungsnummern U01AI142756, RM1HG009490, R01EB022376 und R35GM118062 der National Institutes of Health. Der Staat hat bestimmte Rechte an der Erfindung.
VERWANDTE ANWENDUNGEN UND EINGLIEDERUNG DURCH REFERENZ
Diese Anwendung beansprucht Vorrang gegenüber der vorläufigen US-Anmeldung Nr. 63/022.397 , eingereicht am 8. Mai 2020, und der vorläufigen US-Anmeldung Nr. 63/116.785 , eingereicht am 20. November 2020, deren gesamter Inhalt jeweils durch Bezugnahme in ihrer Gesamtheit hier aufgenommen wird.
Diese vorläufige US-Anwendung bezieht sich auch auf die folgenden Anträge und schließt sie durch Bezugnahme ein, nämlich die vorläufige US-Anmeldung Nr. 62/820.813 , eingereicht am 19. März 2019 (Rechtsanwaltsakte Nr. B1195.70074US00), die vorläufige US- Anmeldung Nr. 62/858.958 (Rechtsanwaltsakte Nr. B1195.70074US01), eingereicht am 7. Juni 2019, die vorläufige US-Anmeldung Nr. 62/889.996 (Rechtsanwaltsakte Nr. B1195.70074US02), eingereicht am 21. August 2019, die vorläufige US-Anmeldung Nr. 62/922.654 , eingereicht am 21. August 2019 (Rechtsanwaltsakte Nr. B1 195.70083US00), die vorläufige US-Anmeldung Nr. 62/913.553 (Rechtsanwaltsakte Nr. B1195.70074US03), eingereicht am 10. Oktober 2019, die vorläufige US-Anmeldung Nr. 62/973.558 (Rechtsanwaltsakte Nr. B1 195.70083US01), eingereicht am 10. Oktober 2019, die vorläufige US-Anmeldung Nr. 62/931.195 (Rechtsanwaltsakte Nr. B1 195.70074US04), eingereicht am 5. November 2019, die vorläufige US-Anmeldung Nr. 62/944.231 (Rechtsanwaltsakte Nr. B1195.70074US05), eingereicht am 5. Dezember 2019, die vorläufige US-Anmeldung Nr. 62/974.537 (Rechtsanwaltsakte Nr. B1195.70083US02), eingereicht am 5. Dezember 2019, die vorläufige US-Anmeldung Nr. 62/991.069 (Rechtsanwaltsakte Nr. B1 195.70074US06), eingereicht am 17. März 2020, die vorläufige US-Anmeldung Nr. ( 63/100.548 ) (Rechtsanwaltsakte Nr. B1195.70083US03), eingereicht am 17. März 2020. Darüber hinaus bezieht sich diese vorläufige US-Anmeldung auf die internationale PCT-Anmeldungsnummer und nimmt diese durch Bezugnahme auf: PCT/US20/23721; PCT/US20/23730; PCT/US20/23713; PCT/US20/23712; PCT/US20/23727; PCT/US20/23724; PCT/US20/23725; PCT/LJS20/23728; PCT/US20/23732; PCT/US20/23723; PCT/US20/23553; und PCT/US20/23583 jeweils eingereicht am 19. März 2020.
HINTERGRUND DER ERFINDUNG
Einigen Schätzungen zufolge tragen pathogene Einzelnukleotid-Mutationen zu etwa 50 % der menschlichen Krankheiten bei, die eine genetische Komponente aufweisen.⁷ Leider sind die Behandlungsmöglichkeiten für Patienten mit diesen genetischen Störungen trotz jahrzehntelanger Erforschung der Gentherapie weiterhin äußerst begrenzt.⁸ Die vielleicht einfachste Lösung für diese therapeutische Herausforderung ist die direkte Korrektur von Einzelnukleotid-Mutationen im Genom der Patienten, die die Ursache der Krankheit bekämpfen und wahrscheinlich einen dauerhaften Nutzen bringen würde. Obwohl eine solche Strategie früher undenkbar war, haben die jüngsten Verbesserungen der Genom-Editing- Möglichkeiten durch das Aufkommen des CRISPR/Cas-Systems⁹ diesen therapeutischen Ansatz nun in greifbare Nähe gerückt. Durch den einfachen Entwurf einer Guide-RNA (gRNA) -Sequenz, die ~20 Nukleotide enthält, die zur Ziel-DNA-Sequenz komplementär sind, kann auf nahezu jede denkbare, genomische Stelle spezifisch durch CRISPR-assoziierte (Cas) Nukleasen^1,2 zugegriffen werden. Bislang wurden mehrere monomere bakterielle Cas- Nuklease-Systeme identifiziert und für Genome-Editing-Anwendungen angepasst.¹⁰ Diese natürliche Vielfalt der Cas-Nukleasen bietet zusammen mit einer wachsenden Sammlung technischer Varianten^11-4 einen fruchtbaren Boden für die Entwicklung neuer Genom-Editing- Technologien.
Während die Gendeaktivierung mit CRISPR inzwischen eine ausgereifte Technik ist, bleibt die Präzisionsbearbeitung einzelner Basenpaare im menschlichen Genom eine große Herausforderung.³ Die homologiegeleitete Reparatur (HDR) wird seit langem in menschlichen Zellen und anderen Organismen eingesetzt, um DNA-Sequenzen an Stellen von Doppelstrangbrüchen (DSBs) einzufügen, zu korrigieren oder auszutauschen. Dabei werden Spender-DNA-Reparatur-Templates verwendet, die für die gewünschten Änderungen kodieren.¹⁵ Die herkömmliche HDR ist jedoch bei den meisten menschlichen Zelltypen sehr ineffizient, insbesondere bei sich nicht teilenden Zellen, und die konkurrierende nicht- homologe Endverbindung (NHEJ) führt überwiegend zu Insertions-Deletions-Nebenprodukten (Indel).¹⁶ Andere Probleme betreffen die Erzeugung von DSBs, die zu großen Chromosomenumlagerungen und Deletionen an den Zielorten¹⁷ führen oder die p53-Achse aktivieren können, was zu Wachstumsstillstand und Apoptose führt.^18,19
Es wurden verschiedene Ansätze untersucht, um diese Nachteile von HDR zu beheben. So hat sich beispielsweise gezeigt, dass die Reparatur von Einzelstrang-DNA-Brüchen (Nicks) mit Oligonukleotidspendern die Indelbildung reduziert, aber die Ergebnisse an gewünschten Reparaturprodukten gering bleiben.²⁰ Andere Strategien versuchen, die Reparatur mit Hilfe kleiner Moleküle und biologischer Reagenzien in Richtung HDR und nicht in Richtung NHEJ zu lenken.^21-23 Die Wirksamkeit dieser Verfahren ist jedoch wahrscheinlich vom Zelltyp abhängig, und die Störung des normalen Zellzustands könnte zu unerwünschten und unvorhersehbaren Auswirkungen führen.
Kürzlich haben die Erfinder unter der Leitung von Prof. David Liu et al. das Base Editing als eine Technologie entwickelt, die die Zielnukleotide bearbeitet, ohne DSBs zu erzeugen oder sich auf HDR^{4-6, 24-27} zu verlassen. Die direkte Modifikation von DNA-Basen durch Cas-fusionierte Deaminase-Enzyme ermöglicht die Umwandlung von C-· in T·A oder A·T in G·C in einem kurzen Zielfenster (~5-7 Basen) mit sehr hoher Effizienz. Infolgedessen wurden die Basis-Editoren schnell von der wissenschaftlichen Gemeinschaft angenommen. Allerdings schränken die folgenden Faktoren ihre Allgemeingültigkeit für das Präzisionsgenom-Editing ein: (1) „Bystander-Editing“ von Nicht-Ziel-C- oder -A-Basen innerhalb des Zielfensters wird beobachtet; (2) Ziel-Nukleotid-Produktmischungen werden beobachtet; (3) die Zielbasen müssen sich 15±2 Nukleotide stromaufwärts einer PAM-Sequenz befinden; und (5) die Reparatur von kleinen Insertions- und Deletionsmutationen ist nicht möglich.
Daher ist die Entwicklung programmierbarer Editoren, die flexibel in der Lage sind, jede gewünschte einzelne Nukleotidänderung einzuführen und/oder Basenpaare einzufügen oder zu entfernen (z.B., mindestens 1, 2, 3, 4, 5, 6, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 30, 40, 50, 60, 70, 80, 90, 100 oder mehr Basenpaar-Insertionen oder -Deletionen) und/oder die die Nukleotidsequenz an einer Zielstelle mit hoher Spezifität und Effizienz verändern oder modifizieren können, würde den Anwendungsbereich und das therapeutische Potenzial von Genom-Editing-Technologien auf der Grundlage von CRISPR erheblich erweitern.
ZUSAMMENFASSUNG DER ERFINDUNG
Die vorliegende Erfindung beschreibt eine neue Plattform für die Genom-Editierung, die als „Multi-Flap-Prime-Editing“ bezeichnet wird (einschließlich z. B. „Dual-Flap-Prime- Editing“ und „Quadruple-Flap-Prime-Editing“) und eine innovative Weiterentwicklung des „Prime-Editing“ oder „klassischen Prime-Editing“ darstellt, wie von den heutigen Erfindern beschrieben in Anzalone, A. V. et al. Search-and-replace genome editing without double-strand breaks or donor DNA. Nature 576, 149-157 (2019), durch Bezugnahme hier aufgenommen. Während beim klassischen Prime-Editing in verschiedenen Ausführungsformen an einer Einstichstelle ein einzelner 3'-Flap polymerisiert wird, der in die Zielnukleinsäure auf demselben Strang integriert wird, umfassen die derzeit beschriebenen Multi-Flap-Prime- Editing-Systeme verschiedene Konstrukte, Systeme und Verfahren, die in verschiedenen Ausführungsformen Paare oder mehrere Paare von 3'-Flaps auf verschiedenen Strängen erzeugen, die Duplexe bilden, die die gewünschten Edits umfassen und in die Ziel- Nukleinsäuremoleküle eingebaut werden, z. B. an spezifischen Loci oder Editierstellen in einem Genom. In verschiedenen Aspekten bilden die Paare oder mehrere Paare von 3'-Flaps Duplexe, weil sie umgekehrt komplementäre Sequenzen enthalten, die sich aneinander anlagern, sobald sie von den hier beschriebenen Prime-Editoren erzeugt wurden. Die Duplexe werden durch zellgesteuerte Mechanismen in die Zielstelle eingebaut, die auf natürliche Weise die endogenen Duplexsequenzen ersetzen, die sich zwischen benachbarten Einstichstellen befinden. In bestimmten Ausführungsformen können die neuen Duplexsequenzen an einer oder mehreren Stellen eingeführt werden (z. B. an benachbarten genomischen Loci oder an zwei verschiedenen chromosomalen Stellen) und können eine oder mehrere Sequenzen von Interesse umfassen, z. B. eine Protein-kodierende Sequenz, eine Peptid-kodierende Sequenz oder eine RNA-kodierende Sequenz. In einer Ausführungsform können die neuen Duplexsequenzen, die von den Multi-Flap-Prime-Editing-Systemen installiert werden, eine Rekombinasestelle umfassen, z. B., eine Bxb1-Rekombinasestelle attB (38 bp) und/oder attP (50 bp) oder eine Rekombinasestelle, die von Hin-Rekombinase, Gin-Rekombinase, Tn3- Rekombinase, β-six-Rekombinase, CinH-Rekombinase, ParA-Rekombinase, γδ- Rekombinase, ϕC31-Rekombinase, TP901-Rekombinase, TG1-Rekombinase, φBT1- Rekombinase, R4-Rekombinase, φRV1-Rekombinase, φFC1-Rekombinase, MR11- Rekombinase, A118-Rekombinase, U153-Rekombinase und gp29-Rekombinase, Cre- Rekombinase, FLP-Rekombinase, R-Rekombinase, Lambda-Rekombinase, HK101- Rekombinase, HK022-Rekombinase und pSAM2-Rekombinase erkannt wird.
Die Erfinder haben vor kurzem das Prime Editing entwickelt, das das Einfügen, Löschen oder Ersetzen von genomischen DNA-Sequenzen ermöglicht, ohne dass fehleranfällige Doppelstrang-DNA-Brüche erforderlich sind. Beim Prime Editing wird ein künstlich hergestelltes Cas9-Nickase-Reverse-Transkriptase-Fusionsprotein (PE1 oder PE2) zusammen mit einer künstlich hergestellten Prime-Editing-Guide-RNA (pegRNA) verwendet, die sowohl Cas9 zur genomischen Zielstelle leitet als auch die Informationen für die Installation des gewünschten Schnitts kodiert. Prime Editing erfolgt in einem mehrstufigen Bearbeitungsprozess: 1) Die Cas9-Domäne bindet an die genomische DNA-Zielstelle, die durch die Spacer-Sequenz der pegRNA spezifiziert ist, und schneidet sie ein. 2) Die Domäne der reversen Transkriptase verwendet die eingekerbte genomische DNA als Primer, um die Synthese eines editierten DNA-Strangs zu initiieren, indem sie eine konstruierte Verlängerung der pegRNA als Template für die reverse Transkription verwendet - dies erzeugt einen einzelsträngigen 3'-Flap, der die editierte DNA-Sequenz enthält; 3) die zelluläre DNA- Reparatur löst das 3'-Flap-Zwischenprodukt durch die Verdrängung einer 5'-Flap-Spezies auf, die durch die Invasion des editierten 3'-Flaps, die Exzision des 5'-Flaps, der die ursprüngliche DNA-Sequenz enthält, und die Ligation des neuen 3'-Flaps erfolgt, um den editierten DNA- Strang zu inkorporieren, wodurch ein Heteroduplex aus einem editierten und einem uneditierten Strang gebildet wird; und 4) die zelluläre DNA-Reparatur ersetzt den uneditierten Strang innerhalb des Heteroduplex unter Verwendung des editierten Strangs als Matrize für die Reparatur, wodurch der Editierungsprozess abgeschlossen wird.
Eine effiziente Integration der gewünschten Editierung erfordert, dass der neu synthetisierte 3'-Flap einen Teil der Sequenz enthält, der homolog zur genomischen DNA- Stelle ist. Diese Homologie ermöglicht es dem bearbeiteten 3'-Flap, mit dem endogenen DNA- Strang (dem entsprechenden 5'-Flap) um die Integration in den DNA-Duplex zu konkurrieren. Da der bearbeitete 3'-Flap eine geringere Sequenzhomologie aufweist als der endogene 5'-Flap, ist zu erwarten, dass die Konkurrenz den 5'-Flap-Strang begünstigt. Ein potenziell limitierender Faktor für die Effizienz des Prime Editing könnte also die Effizienz des Eindringens in den 3'- Flap der endogenen DNA und die anschließende Verdrängung und Ersetzung des 5'-Flap- Strangs sein. Außerdem wird durch die erfolgreiche Invasion des 3'-Flaps und die Entfernung des 5'-Flaps der Schnitt nur auf einem Strang des doppelsträngigen DNA-Genoms durchgeführt. Die dauerhafte Integration der Editierung erfordert eine zelluläre DNA- Reparatur, um den nicht editierten, komplementären DNA-Strang zu ersetzen, wobei der editierte Strang als Template dient. Während die Zelle dazu gebracht werden kann, den Ersatz des nicht editierten Strangs gegenüber dem editierten Strang (Schritt 4 oben) durch Einführung einer Kerbe in den nicht editierten Strang neben der Editierung unter Verwendung einer sekundären sgRNA (dem PE3-System) zu begünstigen, beruht dieser Prozess immer noch auf einer zweiten Stufe der DNA-Reparatur. Diese DNA-Reparaturschritte können besonders ineffizient sein, wenn lange 5'- und 3'-Flap-Intermediate ausgeglichen werden müssen oder lange nicht-homologe Regionen enthalten, wie z. B. lange Insertionen oder lange Deletionen. Weitere Entwicklungen im Bereich Prime Editing würden die Technik voranbringen.
Unter verschiedenen Aspekten beschreibt diese Spezifikation ein Multi-Flap-Prime- Editing-System (einschließlich z. B. Dual-Prime-Editing-Systemen und Quadruple-Prime- Editing-Systemen), das die mit der Flap-Äquilibrierung und dem anschließenden Einbau des Edits in den nicht-editierten komplementären genomischen DNA-Strang verbundenen Herausforderungen angeht, indem es beide DNA-Stränge gleichzeitig editiert. Beim Dual- Flap-Prime-Editing-System zum Beispiel werden zwei pegRNAs verwendet, um gegensätzliche Stränge einer genomischen Stelle anzusteuern und die Synthese von zwei komplementären 3'-Flaps zu steuern, die die editierte DNA-Sequenz enthalten (91). Im Gegensatz zum klassischen Prime Editing muss das Paar der editierten DNA-Stränge (3'-Flaps) nicht direkt mit den 5'-Flaps der endogenen genomischen DNA konkurrieren, da stattdessen der komplementäre editierte Strang für die Hybridisierung zur Verfügung steht. Da beide Stränge des Duplex als editierte DNA synthetisiert werden, erübrigt sich beim Dual-Flap- Prime-Editing-System der Austausch des nicht-editierten komplementären DNA-Strangs, der beim klassischen Prime-Editing erforderlich ist. Stattdessen muss die zelluläre DNA- Reparaturmaschinerie nur die gepaarten 5'-Flaps (ursprüngliche genomische DNA) herausschneiden und die gepaarten 3'-Flaps (bearbeitete DNA) in den Locus einbinden. Daher besteht auch keine Notwendigkeit, in die neu synthetisierten DNA-Stränge Sequenzen aufzunehmen, die homolog zur genomischen DNA sind. Dies ermöglicht eine selektive Hybridisierung der neuen Stränge und erleichtert Bearbeitungen, die eine minimale genomische Homologie enthalten. Nuklease-aktive Versionen von Prime-Editoren, die beide Stränge der DNA schneiden, könnten ebenfalls verwendet werden, um die Entfernung der ursprünglichen DNA-Sequenz zu beschleunigen. Das Quadruple-Flap-Prime-Editing-System, das vier pegRNAs verwendet, bietet ähnliche Vorteile.
Wie das klassische Prime Editing ist das Multi-Flap-Prime-Editing ein vielseitiges und präzises Genom-Editing-Verfahren, bei der neue genetische Informationen direkt in eine bestimmte DNA-Stelle geschrieben werden, indem ein mit Nukleinsäure programmierbares DNA-Bindungsprotein („napDNAbp“) in Verbindung mit einer Polymerase (d. h., in Form eines Fusionsproteins oder auf andere Weise in Verbindung mit dem napDNAbp), wobei das Prime-Editing-System mit einer Prime-Editing-(PE)-Guide-RNA („PEgRNA“) programmiert ist, die sowohl die Zielstelle spezifiziert als auch die Synthese des gewünschten Schnitts in Form eines Ersatz-DNA-Strangs durch eine auf eine Guide-RNA (z. B. am 5'- oder 3'-Ende oder an einem internen Teil einer Guide-RNA) aufgebrachte Verlängerung (entweder DNA oder RNA) vorgibt. Der Ersatzstrang, der den gewünschten Schnitt (z. B. eine einzelne Nukleobase Substitution) enthält, hat die gleiche Sequenz wie der endogene Strang der zu editierenden Zielstelle (mit der Ausnahme, dass er die gewünschte Editierung enthält). Durch die DNA-Reparatur- und/oder Replikationsmaschinerie wird der körpereigene Strang der Zielstelle durch den neu synthetisierten Ersatzstrang, der die gewünschte Editierung enthält, ersetzt. In einigen Fällen kann das Prime Editing als eine „Suchen-und-Ersetzen“-Technologie zur Genom-Editierung angesehen werden, da die Prime Editors, wie hier beschrieben, nicht nur die gewünschte zu editierende Zielstelle suchen und lokalisieren, sondern gleichzeitig einen Ersatzstrang kodieren, der eine gewünschte Editierung enthält und anstelle des entsprechenden endogenen DNA-Strangs der Zielstelle installiert wird.
Die Multi-Flap-Prime-Editoren der vorliegenden Erfindung beruhen zum Teil auf der Entdeckung, dass der Mechanismus der Target-Primed Reverse Transcription (TPRT) oder des „Prime Editing“ für die Durchführung von präzisem CRISPR/Cas-basiertem Genom-Editing mit hoher Effizienz und genetischer Flexibilität genutzt oder angepasst werden kann (z. B. wie in verschiedenen Ausführungsformen der 1A-1F). TPRT wird auf natürliche Weise von mobilen DNA-Elementen wie Nicht-LTR-Retrotransposons von Säugetieren und bakteriellen Introns^28,29 der Gruppe II verwendet. Die Erfinder haben Cas-Protein-Reverse-Transkriptase- Fusionen oder verwandte Systeme verwendet, um eine spezifische DNA-Sequenz mit einer Guide-RNA anzusteuern, einen Einzelstrang-Nick an der Zielstelle zu erzeugen und die eingenickte DNA als Primer für die reverse Transkription einer konstruierten Reverse- Transkriptase-Template zu verwenden, die mit der Guide-RNA integriert ist. Während das Konzept jedoch mit Prime-Editoren beginnt, die reverse Transkriptasen als DNA-Polymerase- Komponente verwenden, sind die hier beschriebenen Multi-Flap-Prime-Editoren nicht auf reverse Transkriptasen beschränkt, sondern können die Verwendung praktisch jeder DNA- Polymerase umfassen. Auch wenn in der Anmeldung durchgehend von Multi-Flap-Prime- Editoren mit „reversen Transkriptasen“ die Rede ist, wird hier dargelegt, dass reverse Transkriptasen nur eine Art von DNA-Polymerase sind, die mit Multi-Flap-Prime-Editoren arbeiten kann. Wenn also in der Spezifikation von „reversen Transkriptasen“ die Rede ist, sollte der Fachmann wissen, dass jede geeignete DNA-Polymerase anstelle der reversen Transkriptase verwendet werden kann. So können die Multi-Flap-Prime-Editoren in einem Aspekt Cas9 (oder ein äquivalentes napDNAbp) umfassen, das so programmiert ist, dass es eine DNA-Sequenz anvisiert, indem es sie mit einer spezialisierten Führungs-RNA (d. h. pegRNA) assoziiert, die eine Spacer-Sequenz enthält, die sich an ein Komplement einer Protospacer-Sequenz in der Ziel-DNA anlagert. Die spezialisierte Guide-RNA enthält auch neue genetische Informationen in Form einer Erweiterung, die für einen Ersatz-DNA-Strang kodiert, der eine gewünschte genetische Veränderung enthält und dazu dient, einen entsprechenden endogenen DNA-Strang an der Zielstelle zu ersetzen. Um die Information von der pegRNA auf die Ziel-DNA zu übertragen, beinhaltet der Mechanismus des Multi-Flap Prime Editing das Einkerben der Zielstelle in einem Strang der DNA, um eine 3'- Hydroxylgruppe freizulegen. Die freiliegende 3'-Hydroxylgruppe kann dann dazu verwendet werden, die DNA-Polymerisation der edit-codierenden Erweiterung der pegRNA direkt an der Zielstelle zu starten. In verschiedenen Ausführungsformen kann die Erweiterung, die die Matrize für die Polymerisation des die Editierung enthaltenden Ersatzstrangs bereitstellt, aus RNA oder DNA gebildet sein. Im Falle einer RNA-Erweiterung kann die Polymerase des Prime Editors eine RNA-abhängige DNA-Polymerase sein (z.B. eine reverse Transkriptase). Im Falle einer DNA-Erweiterung kann die Polymerase des Prime Editors eine DNA-abhängige DNA-Polymerase sein.
Beim klassischen Prime-Editing wäre der neu synthetisierte Strang (d. h. der Ersatz- DNA-Strang, der den gewünschten Edit enthält), der durch die hierin offenbarten Prime- Editoren gebildet wird, homolog zur genomischen Zielsequenz (d. h. er hätte die gleiche Sequenz wie diese), mit Ausnahme der Aufnahme einer gewünschten Nukleotidänderung (z. B. eine einzelne Nukleotidänderung, eine Deletion oder eine Insertion oder eine Kombination davon). Der neu synthetisierte (oder ersetzte) DNA-Strang kann auch als Einzelstrang-DNA- Flap bezeichnet werden, der mit dem komplementären homologen endogenen DNA-Strang um die Hybridisierung konkurriert und dadurch den entsprechenden endogenen Strang verdrängt. In bestimmten Ausführungsformen kann das System mit der Verwendung eines fehleranfälligen Enzyms der Reversen Transkriptase kombiniert werden (z. B. als Fusionsprotein mit der Cas9-Domäne oder in trans mit der Cas9-Domäne). Das fehleranfällige Enzym Reverse Transkriptase kann während der Synthese der einzelsträngigen DNA-Flap Veränderungen einführen. So kann in bestimmten Ausführungsformen eine fehleranfällige reverse Transkriptase verwendet werden, um Nukleotidveränderungen in die Ziel-DNA einzuführen. Je nach der fehleranfälligen reversen Transkriptase, die mit dem System verwendet wird, können die Veränderungen zufällig oder nicht zufällig sein.
Beim klassischen Prime Editing kann die Auflösung des hybridisierten Zwischenprodukts (bestehend aus dem von der reversen Transkriptase synthetisierten einzelsträngigen DNA-Flap, der an den endogenen DNA-Strang hybridisiert wurde) die Entfernung des resultierenden verdrängten Flaps der endogenen DNA (z. B. mit einer 5'-End- DNA-Flap-Endonuklease, FEN1), die Ligation des synthetisierten einzelsträngigen DNA- Flaps an die Ziel-DNA und die Assimilation der gewünschten Nukleotidveränderung als Ergebnis der zellulären DNA-Reparatur- und/oder Replikationsprozesse umfassen. Da die Template-gestützte DNA-Synthese eine nukleotidgenaue Modifikation jedes beliebigen Nukleotids, einschließlich Insertionen und Deletionen, ermöglicht, ist der Anwendungsbereich dieses Ansatzes sehr breit gefächert und könnte vorhersehbar für unzählige Anwendungen in der Grundlagenforschung und in der Therapeutik genutzt werden.
In einigen Aspekten stellt die Spezifikation ein Paar von Prime-Editoren bereit, die jeweils ein Nukleinsäure-programmierbares DNA-Bindungsprotein (napDNAbp) und eine DNA-Polymerase umfassen. In einigen Ausführungsformen ist jeder Prime Editor in der Lage, die Genom-Editierung durch zielgerichtete, reverse Transkription in Anwesenheit einer erweiterten Guide-RNA durchzuführen.
In einigen Aspekten stellt die Spezifikation ein Paar von Prime Editors bereit, die jeweils ein Nukleinsäure-programmierbares DNA-Bindungsprotein (napDNAbp) und eine DNA-Polymerase umfassen, wobei die DNA-Polymerase in trans mit dem napDNAbp bereitgestellt wird. In verschiedenen Ausführungsformen ist jeder Prime Editor in der Lage, die Genom-Editierung durch zielgerichtete, reverse Transkription in Anwesenheit einer erweiterten Guide-RNA durchzuführen.
In einigen Aspekten stellt die Spezifikation ein Paar von Prime Editors bereit, die jeweils ein Nukleinsäure-programmierbares DNA-Bindungsprotein (napDNAbp) und eine reverse Transkriptase umfassen. In verschiedenen Ausführungsformen ist jeder Prime Editor in der Lage, die Genom-Editierung durch zielgerichtete, reverse Transkription in Anwesenheit einer erweiterten Guide-RNA durchzuführen.
In einigen Aspekten stellt die Spezifikation ein Paar von Prime Editors bereit, die jeweils ein Nukleinsäure-programmierbares DNA-Bindungsprotein (napDNAbp) und eine reverse Transkriptase umfassen, wobei die reverse Transkriptase in trans mit dem napDNAbp bereitgestellt wird. In verschiedenen Ausführungsformen ist jeder Prime Editor in der Lage, die Genom-Editierung durch zielgerichtete, reverse Transkription in Anwesenheit einer erweiterten Guide-RNA durchzuführen.
In bestimmten Ausführungsformen weist das napDNAbp eine Nickase-Aktivität auf. Das napDNAbp kann auch ein Cas9-Protein oder ein funktionelles Äquivalent davon sein, wie ein Nuklease-aktives Cas9, ein Nuklease-inaktives Cas9 (dCas9) oder eine Cas9-Nickase (nCas9).
In bestimmten Ausführungsformen wird das napDNAbp ausgewählt aus der Gruppe bestehend aus: Cas9, Cas12e, Cas12d, Cas12a, Cas12b1, Cas13a, Cas12c und Argonaute und weist optional eine Nickase-Aktivität auf.
In anderen Ausführungsformen ist jeder Prime Editor der dualen Prime Editors in der Lage, sich an eine Ziel-DNA-Sequenz zu binden, wenn er mit einer erweiterten Guide-RNA komplexiert ist.
In noch anderen Ausführungsformen umfasst die Ziel-DNA-Sequenz einen Zielstrang und einen komplementären Nicht-Zielstrang.
In anderen Ausführungsformen bildet die Bindung des Prime Editors an die erweiterte Guide-RNA eine R-Schleife. Die R-Schleife kann (i) ein RNA-DNA-Hybrid, das die erweiterte Guide-RNA und den Zielstrang umfasst, und (ii) den komplementären Nicht- Zielstrang umfassen.
In noch anderen Ausführungsformen wird der komplementäre Nicht-Zielstrang eingenickt, um eine Priming-Sequenz der reversen Transkriptase mit einem freien 3'-Ende zu bilden.
In verschiedenen Ausführungsformen umfasst die erweiterte Guide-RNA (a) eine Guide-RNA und (b) eine RNA-Erweiterung am 5'- oder 3'-Ende der Guide-RNA oder an einer intramolekularen Stelle in der Guide-RNA. Die RNA-Verlängerung kann (i) eine Reverse- Transkriptions-Matrizen-Sequenz mit einer gewünschten Nukleotidänderung, (ii) eine Bindungsstelle für einen Reverse-Transkriptions-Primer und (iii) gegebenenfalls eine Linker- Sequenz umfassen. In verschiedenen Ausführungsformen kann die Matrizensequenz für die reverse Transkription einen einzelsträngigen DNA-Flap kodieren, der komplementär zu einer endogenen DNA-Sequenz neben der Einstichstelle ist, wobei der einzelsträngige DNA-Flap die gewünschte Nukleotidveränderung umfasst.
In verschiedenen Ausführungsformen beträgt die RNA-Erweiterung mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide, mindestens 15 Nukleotide, mindestens 16 Nukleotide, mindestens 17 Nukleotide, mindestens 18 Nukleotide, mindestens 19 Nukleotide, mindestens 20 Nukleotide, mindestens 21 Nukleotide, mindestens 22 Nukleotide, mindestens 23 Nukleotide, mindestens 24 Nukleotide oder mindestens 25 Nukleotide.
In noch anderen Ausführungsformen kann der Einzelstrang-DNA-Flap mit der endogenen DNA-Sequenz neben der Einstichstelle hybridisieren und so die gewünschte Nukleotidveränderung bewirken. In noch anderen Ausführungsformen verdrängt der einzelsträngige DNA-Flap die endogene DNA-Sequenz, die an die Einkerbstelle angrenzt und ein freies 5'-Ende hat. In bestimmten Ausführungsformen wird die verdrängte endogene DNA mit dem 5'-Ende von der Zelle ausgeschnitten.
In verschiedenen Ausführungsformen führt die zelluläre Reparatur des Einzelstrang- DNA-Flaps zum Einbau der gewünschten Nukleotidveränderung, wodurch ein gewünschtes Produkt entsteht.
In verschiedenen anderen Ausführungsformen wird die gewünschte Nukleotidänderung in einem Editierfenster integriert, das zwischen etwa -4 und +10 der PAM-Sequenz liegt.
In wieder anderen Ausführungsformen wird die gewünschte Nukleotidänderung in einem Editierfenster integriert, das zwischen etwa -5 bis +5 der Einkerbungsstelle, oder zwischen etwa -10 bis +10 der Einkerbungsstelle, oder zwischen etwa -20 bis +20 der Einkerbungsstelle, oder zwischen etwa -30 bis +30 der Einkerbungsstelle, oder zwischen etwa -40 bis +40 der Einkerbungsstelle, oder zwischen etwa -50 bis +50 der Einkerbungsstelle, oder zwischen etwa -60 bis +60 der Einkerbungsstelle, oder zwischen etwa -70 bis +70 der Einkerbungsstelle, oder zwischen etwa -80 bis +80 der Einkerbungsstelle, oder zwischen etwa -90 bis +90 der Einkerbungsstelle, oder zwischen etwa -100 bis +100 der Einkerbungsstelle, oder zwischen etwa -200 bis +200 der Einkerbungsstelle liegt.
In verschiedenen Ausführungsformen umfassen die napDNAbp der Dual Prime Editors jeweils eine Aminosäuresequenz der SEQ-ID-NR.: 18. In verschiedenen anderen Ausführungsformen umfasst das napDNAbp eine Aminosäuresequenz, die zu mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % mit der Aminosäuresequenz einer der SEQ-ID- Nummern identisch ist: 26-39, 42-61, 75-76, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467 und 482-487 (Cas9); SEQ-ID-NR.: 77-86 (CP-Cas9); SEQ-ID-NR.: 18-25 und 87-88 (SPCas9) und SEQ-ID-Nummern: 62-72(Cas12)
In anderen Ausführungsformen kann die reverse Transkriptase der offengelegten Prime Editors und/oder Zusammensetzungen der dualen Prime Editors eine der Aminosäuresequenzen der SEQ-ID-Nummern umfassen: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700-716, 739-742 und 766. In wieder anderen Ausführungsformen kann die reverse Transkriptase eine Aminosäuresequenz umfassen, die zu mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % mit der Aminosäuresequenz einer der SEQ-ID-Nummern identisch ist: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700-716, 739-742 und 766. Bei diesen Sequenzen kann es sich um natürlich vorkommende, reverse Transkriptase-Sequenzen handeln, z. B. von einem Retrovirus oder einem Retrotransposon, oder um rekombinante Sequenzen.
In verschiedenen anderen Ausführungsformen können die Prime Editors der hier offenbarten dualen Prime Editors verschiedene strukturelle Konfigurationen aufweisen. Zum Beispiel kann in Ausführungsformen, in denen die Prime Editors als Fusionsprotein bereitgestellt werden, jedes der dualen Prime Editor-Fusionsproteine die Struktur NH₂- [napDNAbp]-[reverse Transkriptase]-COOH; oder NH₂-[reverse Transkriptase]- [napDNAbp]-COOH umfassen, wobei jedes „]-[" das Vorhandensein einer optionalen Linker- Sequenz anzeigt.
In verschiedenen Ausführungsformen umfasst die Linker-Sequenz eine Aminosäuresequenz der SEQ-ID-Nummern: 127, 165-176, 446, 453 und 767-769, oder eine Aminosäuresequenz, die zu mindestens 80 %, 85 %, 90 %, 95 % oder 99 % mit einer der Linker-Aminosäuresequenzen der SEQ-ID-Nummern identisch ist: 127, 165-176, 446, 453 und 767-769.
In verschiedenen Ausführungsformen kann die gewünschte Nukleotidänderung, die in die Ziel-DNA eingebaut wird, eine einzelne Nukleotidänderung (z. B. eine Transition oder Transversion), eine Insertion von einem oder mehreren Nukleotiden oder eine Deletion von einem oder mehreren Nukleotiden sein.
In bestimmten Fällen ist die Insertion mindestens 1, mindestens 2, mindestens 3, mindestens 4, mindestens 5, mindestens 6, mindestens 7, mindestens 8, mindestens 9, mindestens 10, mindestens 11, mindestens 12, mindestens 13, mindestens 14, mindestens 15, mindestens 16, mindestens 17, mindestens 18, mindestens 19, mindestens 20, mindestens 30, mindestens 40, mindestens 50, mindestens 60, mindestens 70, mindestens 80, mindestens 90, mindestens 100, mindestens 200, mindestens 300, mindestens 400 oder mindestens 500 Nukleotide lang.
In bestimmten anderen Fällen ist die Deletion mindestens 1, mindestens 2, mindestens 3, mindestens 4, mindestens 5, mindestens 6, mindestens 7, mindestens 8, mindestens 9, mindestens 10, mindestens 11, mindestens 12, mindestens 13, mindestens 14, mindestens 15, mindestens 16, mindestens 17, mindestens 18, mindestens 19, mindestens 20, mindestens 30, mindestens 40, mindestens 50, mindestens 60, mindestens 70, mindestens 80, mindestens 90, mindestens 100, mindestens 200, mindestens 300, mindestens 400 oder mindestens 500 Nukleotide lang.
In einem anderen Aspekt stellt die vorliegende Erfindung eine erweiterte Guide-RNA bereit, die eine Guide-RNA und mindestens eine RNA-Erweiterung umfasst. Die RNA- Erweiterung kann am 3'-Ende der Guide-RNA positioniert werden. In anderen Ausführungsformen kann die RNA-Erweiterung am 5' der Guide-RNA positioniert werden. In noch anderen Ausführungsformen kann die RNA-Erweiterung an einer intramolekularen Position innerhalb der Guide-RNA positioniert werden. Vorzugsweise stört die intramolekulare Positionierung des erweiterten Abschnitts jedoch nicht die Funktion des Protospacers.
In verschiedenen Ausführungsformen ist die erweiterte Guide-RNA in der Lage, an eine napDNAbp zu binden und die napDNAbp zu einer Ziel-DNA-Sequenz zu lenken. Die Ziel-DNA-Sequenz kann einen Zielstrang und einen komplementären Nicht-Zielstrang umfassen, wobei die Guide-RNA mit dem Zielstrang hybridisiert, um ein RNA-DNA-Hybrid und eine R-Schleife zu bilden.
In verschiedenen Ausführungsformen der erweiterten Guide-RNA kann die mindestens eine RNA-Erweiterung eine Template-Sequenz für die reverse Transkription umfassen. In verschiedenen anderen Ausführungsformen kann die RNA-Erweiterung außerdem eine Bindungsstelle für einen Primer für die reverse Transkription enthalten. In noch weiteren Ausführungsformen kann die RNA-Erweiterung eine Linker- oder Spacer-Sequenz umfassen, die die RNA-Erweiterung mit der Guide-RNA verbindet.
In verschiedenen Ausführungsformen kann die RNA-Erweiterung mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nucleotide, mindestens 14 Nucleotide, mindestens 15 Nucleotide, mindestens 16 Nucleotide, mindestens 17 Nucleotide, mindestens 18 Nucleotide, mindestens 19 Nucleotide, mindestens 20 Nucleotide, mindestens 21 Nucleotide, mindestens 22 Nucleotide, mindestens 23 Nucleotide, mindestens 24 Nucleotide, mindestens 25 Nucleotide, mindestens 30 Nucleotide, mindestens 40 Nucleotide, mindestens 50 Nucleotide, mindestens 60 Nucleotide, mindestens 70 Nucleotide, mindestens 80 Nukleotide, mindestens 90 Nukleotide, mindestens 100 Nukleotide, mindestens 150 Nukleotide, mindestens 200 Nukleotide, mindestens 300 Nukleotide, mindestens 400 Nukleotide oder mindestens 500 Nukleotide lang sein.
In anderen Ausführungsformen ist die Sequenz der reversen Transkription mindestens 3 Nukleotide, mindestens 4 Nukleotide, mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide, mindestens 15 Nukleotide, mindestens 16 Nukleotide, mindestens 17 Nucleotide, mindestens 18 Nucleotide, mindestens 19 Nucleotide, mindestens 20 Nucleotide, mindestens 30 Nucleotide, mindestens 40 Nucleotide, mindestens 50 Nucleotide, mindestens 60 Nucleotide, mindestens 70 Nukleotide, mindestens 80 Nukleotide, mindestens 90 Nukleotide, mindestens 100 Nukleotide, mindestens 200 Nukleotide, mindestens 300 Nukleotide, mindestens 400 Nukleotide oder mindestens 500 Nukleotide lang.
In wiederum anderen Ausführungsformen beträgt die Sequenzlänge der Bindungsstelle des Primers für die reverse Transkription mindestens 3 Nukleotide, mindestens 4 Nukleotide, mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide, mindestens 15 Nukleotide, mindestens 16 Nukleotide, mindestens 17 Nucleotide, mindestens 18 Nucleotide, mindestens 19 Nucleotide, mindestens 20 Nucleotide, mindestens 30 Nucleotide, mindestens 40 Nucleotide, mindestens 50 Nucleotide, mindestens 60 Nucleotide, mindestens 70 Nukleotide, mindestens 80 Nukleotide, mindestens 90 Nukleotide, mindestens 100 Nukleotide, mindestens 200 Nukleotide, mindestens 300 Nukleotide, mindestens 400 Nukleotide oder mindestens 500 Nukleotide.
In anderen Ausführungsformen umfasst die optionale Länge der Linker-Sequenz oder Spacer-Sequenz mindestens 3 Nukleotide, mindestens 4 Nukleotide, mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide, mindestens 15 Nukleotide, mindestens 16 Nukleotide, mindestens 17 Nucleotide, mindestens 18 Nucleotide, mindestens 19 Nucleotide, mindestens 20 Nucleotide, mindestens 30 Nucleotide, mindestens 40 Nucleotide, mindestens 50 Nucleotide, mindestens 60 Nucleotide, mindestens 70 Nukleotide, mindestens 80 Nukleotide, mindestens 90 Nukleotide, mindestens 100 Nukleotide, mindestens 200 Nukleotide, mindestens 300 Nukleotide, mindestens 400 Nukleotide oder mindestens 500 Nukleotide.
In verschiedenen Ausführungsformen der erweiterten Guide-RNAs kann die Matrizensequenz für die reverse Transkription einen einzelsträngigen DNA-Flap kodieren, der komplementär zu einer endogenen DNA-Sequenz ist, die an eine Bruchstelle angrenzt, wobei der einzelsträngige DNA-Flap eine gewünschte Nukleotidveränderung aufweist. Der einzelsträngige DNA-Flap kann eine körpereigene, einzelsträngige DNA an der Bruchstelle verdrängen. Die verdrängte endogene Einzelstrang-DNA an der Bruchstelle kann ein 5'-Ende haben und einen endogenen Flap bilden, der von der Zelle abgeschnitten werden kann. In verschiedenen Ausführungsformen kann die Exzision des endogenen 5'-Flaps dazu beitragen, die Produktbildung voranzutreiben, da die Entfernung des endogenen 5'-Flaps die Hybridisierung des einzelsträngigen 3'-DNA-Flaps mit dem entsprechenden komplementären DNA-Strang und die Inkorporation oder die Assimilation der gewünschten Nukleotidänderung, die der einzelsträngige 3'-DNA-Flap trägt, in die Ziel-DNA fördert.
In verschiedenen Ausführungsformen der erweiterten Guide-RNAs führt die zelluläre Reparatur des Einzelstrang-DNA-Flaps zur Integration der gewünschten Nukleotidveränderung, wodurch ein gewünschtes Produkt entsteht.
In bestimmten Ausführungsformen umfasst die pegRNA die Nukleotidsequenz der SEQ-ID-Nummern: 101-104, 181-183, 223-234, 237-244, 277, 324-330, 332, 334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 394, 429-442, 499-505, 641-649, 678-692, 735-736, 757-761, 776-777, 2997-3103, 3113- 3121, 3305-3455, 3479-3493, 3522-3540, 3549-3556, 3628-3698, 3755-3810, 3874, 3890- 3901, 3905-3911, 3913-3929 und 3972-3989 oder eine Nukleotidsequenz mit mindestens 85 %, mindestens 90 %, mindestens 95 %, mindestens 98 % oder mindestens 99 % Sequenzidentität mit einer der SEQ-ID-Nummern: 101-104, 181-183, 223-234, 237-244, 277, 324-330, 332, 334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 394, 429-442, 499-505, 641-649, 678-692, 735-736, 757-761, 776-777, 2997-3103, 3113-3121, 3305-3455, 3479-3493, 3522-3540, 3549-3556, 3628-3698, 3755-3810, 3874, 3890-3901, 3905-3911, 3913-3929 und 3972-3989.
In einem weiteren Aspekt der Erfindung sieht die Spezifikation Komplexe vor, die einen hierin beschriebenen Prime Editor und jede oben beschriebene erweiterte Guide-RNA umfassen.
In wiederum anderen Aspekten der Erfindung stellt die Spezifikation einen Komplex bereit, der ein napDNAbp und eine erweiterte Guide-RNA umfasst. Das napDNAbp kann eine Cas9-Nickase oder eine Aminosäuresequenz der SEQ-ID-Nummern sein: 42-57 (Cas9- Nickase) und 65 (AsCas12A-Nickase) oder eine Aminosäuresequenz, die mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % identisch mit der Aminosäuresequenz einer der SEQ-ID- Nummern ist: 42-57 (Cas9-Nickase) und 65 (AsCas12A-Nickase).
In verschiedenen Ausführungsformen, die einen Komplex beinhalten, ist die erweiterte Guide-RNA in der Lage, die napDNAbp zu einer Ziel-DNA-Sequenz zu lenken. In verschiedenen Ausführungsformen kann eine reverse Transkriptase in trans bereitgestellt werden, d.h. aus einer anderen Quelle als der Komplex selbst. Zum Beispiel könnte eine reverse Transkriptase derselben Zelle mit dem Komplex zugeführt werden, indem ein separater Vektor eingeführt wird, der die reverse Transkriptase separat kodiert.
In einem anderen Aspekt stellt die Erfindung ein System bereit, das einen ersten und einen zweiten Prime-Editor-Komplex umfasst, wobei jeder Komplex einen Prime Editor und eine Prime-Editing-Guide-RNA (pegRNA) umfasst. In einigen Ausführungsformen umfasst jeder Prime Editor ein Nukleinsäure-programmierbares DNA-Bindungsprotein (napDNAbp) und ein Polypeptid mit einer RNA-abhängigen DNA-Polymerase-Aktivität, und jede pegRNA umfasst eine Spacer-Sequenz, einen gRNA-Kern, eine DNA-Synthese-Template und eine Primer-Bindungsstelle. In bestimmten Ausführungsformen kodiert jede DNA-Synthese- Template eine einzelsträngige DNA-Sequenz, die einen editierten Abschnitt umfasst. Zwei einzelsträngige DNA-Sequenzen, die kodiert werden, können komplementär zueinander sein und einen Duplex bilden, der in die zu editierende Zielstelle integriert wird. In einigen Ausführungsformen können die beiden kodierten einzelsträngigen DNA-Sequenzen eine Region der Komplementarität zueinander umfassen. In bestimmten Ausführungsformen können die beiden kodierten einzelsträngigen DNA-Sequenzen einen Bereich der Komplementarität zueinander umfassen, der mindestens 2 bp, mindestens 3 bp, mindestens 4 bp, mindestens 5 bp, mindestens 10 bp, mindestens 20 bp, mindestens 30 bp, mindestens 40 bp, mindestens 50 bp, mindestens 100 bp, mindestens 200 bp, mindestens 300 bp, mindestens 400 bp, mindestens 500 bp, mindestens 600 bp, mindestens 700 bp, mindestens 800 bp, mindestens 900 bp oder mindestens 1000 bp lang ist. In einigen Ausführungsformen wird der Prime Editor als Fusionsprotein bereitgestellt. In bestimmten Ausführungsformen werden die Komponenten des Prime Editors (d. h. das napDNAbp und das Polypeptid mit einer RNA-abhängigen DNA-Polymerase-Aktivität) in trans bereitgestellt.
In einem anderen Aspekt stellt die Erfindung ein System bereit, das einen ersten, einen zweiten, einen dritten und einen vierten Prime-Editor-Komplex umfasst, wobei jeder Komplex einen Prime Editor und eine Prime-Editing-Guide-RNA (pegRNA) umfasst. In einigen Ausführungsformen umfasst jeder Prime Editor ein Nukleinsäure-programmierbares DNA- Bindungsprotein (napDNAbp) und ein Polypeptid mit einer RNA-abhängigen DNA- Polymerase-Aktivität, und jede pegRNA umfasst eine Spacer-Sequenz, einen gRNA-Kern, eine DNA-Synthese-Template und eine Primer-Bindungsstelle. In bestimmten Ausführungsformen kodiert jede DNA-Synthese-Template eine einzelsträngige DNA- Sequenz, die einen editierten Abschnitt umfasst. Zwei einzelsträngige DNA-Sequenzen, die kodiert werden, können komplementär zueinander sein und einen Duplex bilden, der in die zu editierende Zielstelle integriert wird. In einigen Ausführungsformen können die beiden kodierten einzelsträngigen DNA-Sequenzen eine Region der Komplementarität zueinander umfassen. In bestimmten Ausführungsformen können die beiden kodierten einzelsträngigen DNA-Sequenzen einen Bereich der Komplementarität zueinander umfassen, der mindestens 2 bp, mindestens 3 bp, mindestens 4 bp, mindestens 5 bp, mindestens 10 bp, mindestens 20 bp, mindestens 30 bp, mindestens 40 bp, mindestens 50 bp, mindestens 100 bp, mindestens 200 bp, mindestens 300 bp, mindestens 400 bp, mindestens 500 bp, mindestens 600 bp, mindestens 700 bp, mindestens 800 bp, mindestens 900 bp oder mindestens 1000 bp lang ist. In einigen Ausführungsformen wird der Prime Editor als Fusionsprotein bereitgestellt. In bestimmten Ausführungsformen werden die Komponenten des Prime Editors (d. h. das napDNAbp und das Polypeptid mit einer RNA-abhängigen DNA-Polymerase-Aktivität) in trans bereitgestellt.
In einigen Ausführungsformen ist jedes napDNAbp eine Cas9-Domäne oder eine Variante davon. In einigen Ausführungsformen ist jedes napDNAbp eine Nuklease-aktive Cas9-Domäne, eine Nuklease-inaktive Cas9-Domäne oder eine Cas9-Nickase-Domäne oder eine Variante davon. In bestimmten Ausführungsformen ist jedes napDNAbp unabhängig voneinander ausgewählt aus der Gruppe bestehend aus: Cas9, Cas12e, Cas12d, Cas12a, Cas12b1, Cas13a, Cas12c und Argonaute und weist optional eine Nickase-Aktivität auf. In verschiedenen Ausführungsformen umfasst jedes napDNAbp eine Aminosäuresequenz mit einer der SEQ-ID-NR.: 2-65, oder eine Aminosäuresequenz, die zu mindestens 80 %, 85 %, 90 %, 95 % oder 99 % mit einer der SEQ-ID-NR.: 2-65 identisch ist.
In einigen Ausführungsformen ist das Polypeptid, das eine RNA-abhängige DNA- Polymerase-Aktivität aufweist, eine reverse Transkriptase. In bestimmten Ausführungsformen umfasst das Polypeptid, das eine RNA-abhängige DNA-Polymerase-Aktivität aufweist, eine Aminosäuresequenz mit einer der SEQ-ID-NR.: 37, 68-79, 82-98, 81, 98 und 110 oder eine Aminosäuresequenz, die mindestens 80 %, 85 %, 90 %, 95 % oder 99 % Sequenzidentität mit einer der SEQ-ID-NR: 37, 68-79, 82-98, 81, 98 und 110 hat.
In einigen Ausführungsformen kann jeder Prime Editor einen Linker umfassen, der das napDNAbp und die reverse Transkriptase miteinander verbindet. In bestimmten Ausführungsformen umfasst der Linker eine Aminosäuresequenz aus einer der SEQ-ID-NR.: 119-128 oder eine Aminosäuresequenz, die mindestens 80 %, 85 %, 90 %, 95 % oder 99 % Sequenzidentität mit einer der SEQ-ID-NR: 119-128 hat. Jeder Linker kann 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49 oder 50 Aminosäuren lang sein.
In einigen Ausführungsformen kann jede pegRNA unabhängig voneinander eine Nukleotidsequenz aus einer der SEQ-ID-NR.: 192-203 oder eine Nukleotidsequenz umfassen, die mindestens 80 %, 85 %, 90 %, 95 % oder 99 % Sequenzidentität mit einer der SEQ-ID- NR: 192-203 hat.
In verschiedenen Ausführungsformen kann jede Spacer-Sequenz jeder pegRNA an eine spezifische Bindungsstelle der doppelsträngigen DNA-Sequenz neben der zu editierenden Zielstelle binden. In einigen Ausführungsformen führt die Bindung einer Spacer-Sequenz eines Prime-Editor-Komplexes an einen Strang der doppelsträngigen DNA-Sequenz und die Bindung einer Spacer-Sequenz eines anderen Prime-Editor-Komplexes an den gegenüberliegenden Strang der doppelsträngigen DNA-Sequenz zum Einkerben beider DNA- Stränge an einer Bruchstelle proximal zu den PAM-Sequenzen auf jedem Strang.
In einem anderen Aspekt stellt die vorliegende Erfindung Polynukleotide zur Verfügung. In einigen Ausführungsformen können die Polynukleotide für jeden der hier beschriebenen Komplexe kodieren. In bestimmten Ausführungsformen können die Polynukleotide für jede der hier beschriebenen pegRNAs kodieren.
In einem weiteren Aspekt stellt die Spezifikation Polynukleotide bereit. In bestimmten Ausführungsformen können die Polynukleotide für jeden der hier offenbarten Prime Editors kodieren. In bestimmten anderen Ausführungsformen können die Polynukleotide für jedes der hier offenbarten napDNAbps kodieren. In wiederum weiteren Ausführungsformen können die Polynukleotide für eine der hierin offenbarten reversen Transkriptasen kodieren. In anderen Ausführungsformen können die Polynukleotide für eine der hierin offenbarten erweiterten Guide-RNAs, für eine der Matrizensequenzen für die reverse Transkription, für eine der Primerstellen für die reverse Transkription oder für eine der optionalen Linker-Sequenzen kodieren.
In wiederum anderen Aspekten stellt die Spezifikation Vektoren bereit, die die hier beschriebenen Polynukleotide enthalten. So enthalten die Vektoren in bestimmten Ausführungsformen Polynukleotide zur Kodierung der Prime Editors, die ein napDNAbp und eine reverse Transkriptase (d. h. als Fusionsprotein oder in trans exprimiert) umfassen. In bestimmten Ausführungsformen umfassen die Vektoren Polynukleotide zur Kodierung eines der hier beschriebenen Komplexe. In anderen Ausführungsformen umfassen die Vektoren Polynukleotide, die separat für ein napDNAbp und eine reverse Transkriptase kodieren. In noch anderen Ausführungsformen können die Vektoren Polynukleotide enthalten, die für die erweiterten Guide-RNAs kodieren. In verschiedenen Ausführungsformen können die Vektoren ein oder mehrere Polynukleotide enthalten, die napDNAbps, reverse Transkriptase und erweiterte Guide-RNAs auf denselben oder separaten Vektoren kodieren. In einigen Ausführungsformen umfassen die Vektoren Polynukleotide zur Kodierung einer der hier beschriebenen pegRNAs.
In noch anderen Aspekten stellt die Spezifikation Zellen bereit, die einen Prime Editor, wie hier beschrieben, und eine erweiterte Guide-RNA enthalten. Die Zellen können mit den Vektoren transformiert werden, die die Prime Editors, napDNAbps, reverse Transkriptase und erweiterte Guide-RNAs enthalten. Diese genetischen Elemente können auf demselben Vektor oder auf verschiedenen Vektoren enthalten sein. In einigen Ausführungsformen umfassen die Zellen eines der hier beschriebenen Systeme oder Komplexe. Die Zellen können mit Polynukleotiden transformiert werden, die für eines der hierin offenbarten Systeme, Komplexe und/oder pegRNAs kodieren, oder mit Vektoren, die Polynukleotide enthalten, die für eines der hierin offenbarten Systeme, Komplexe oder pegRNAs kodieren.
In einem weiteren Aspekt bietet die Spezifikation pharmazeutische Zusammensetzungen. In bestimmten Ausführungsformen umfassen die pharmazeutischen Zusammensetzungen ein oder mehrere napDNAbp, einen Prime Editor, eine reverse Transkriptase und eine erweiterte Guide-RNA. In bestimmten Ausführungsformen umfassen die pharmazeutischen Zusammensetzungen eines der hier beschriebenen Systeme und/oder Komplexe. In bestimmten Ausführungsformen umfassen die pharmazeutischen Zusammensetzungen einen der hier beschriebenen Prime Editors, Systeme oder Komplexe und einen pharmazeutisch akzeptablen Hilfsstoff. In anderen Ausführungsformen umfassen die pharmazeutischen Zusammensetzungen jede hier beschriebene, erweiterte Guide-RNA und einen pharmazeutisch akzeptablen Hilfsstoff. In noch anderen Ausführungsformen umfassen die pharmazeutischen Zusammensetzungen jede hier beschriebene, erweiterte Guide-RNA in Kombination mit jedem hier beschriebenen Prime Editor und einem pharmazeutisch akzeptablen Hilfsstoff. In noch anderen Ausführungsformen umfassen die pharmazeutischen Zusammensetzungen eine beliebige Polynukleotidsequenz, die für einen oder mehrere napDNAbp, einen Prime Editor, eine reverse Transkriptase und eine erweiterte Guide-RNA oder einen der hierin offenbarten Vektoren kodiert. In noch anderen Ausführungsformen können die verschiedenen hier offengelegten Komponenten in eine oder mehrere pharmazeutische Zusammensetzungen getrennt werden. Zum Beispiel kann eine erste pharmazeutische Zusammensetzung einen Prime Editor oder ein napDNAbp, eine zweite pharmazeutische Zusammensetzung eine reverse Transkriptase und eine dritte pharmazeutische Zusammensetzung eine erweiterte Guide-RNA enthalten.
Ein weiterer Aspekt der vorliegenden Erfindung ist die Bereitstellung von Kits. In einer Ausführungsform umfasst das Kit ein oder mehrere Polynukleotide, die eine oder mehrere Komponenten kodieren, einschließlich eines Prime Editors, eines napDNAbp, einer reversen Transkriptase und einer erweiterten Guide-RNA. Die Kits können auch Vektoren, Zellen und isolierte Zubereitungen von Polypeptiden enthalten, einschließlich der hierin offenbarten Prime Editors, napDNAbp oder reversen Transkriptasen.
In einem weiteren Aspekt sieht die vorliegende Erfindung Verfahren zur Verwendung der offengelegten Stoffzusammensetzungen vor, einschließlich Verfahren zur Verwendung eines der hierin beschriebenen Systeme zum gleichzeitigen Editieren beider komplementärer Stränge einer doppelsträngigen DNA-Sequenz an einer Zielstelle. In einigen Ausführungsformen umfasst das Verfahren das Inkontaktbringen der doppelsträngigen DNA- Sequenz mit einem der hier offenbarten Systeme.
In einer Ausführungsform umfasst das Kit ein oder mehrere Polynukleotide, die eine oder mehrere Komponenten kodieren, einschließlich eines Prime Editors, eines DNA, einer reversen Transkriptase und einer erweiterten Guide-RNA (PEgRNA). In einigen Ausführungsformen umfasst jeder Prime Editor ein Nukleinsäure-programmierbares DNA- Bindungsprotein (napDNAbp) und ein Polypeptid mit einer RNA-abhängigen DNA- Polymerase-Aktivität, und jede pegRNA umfasst eine Spacer-Sequenz, einen gRNA-Kern, eine DNA-Synthese-Template und eine Primer-Bindungsstelle. In einigen Ausführungsformen wird jeder Prime Editor als Fusionsprotein bereitgestellt. In einigen Ausführungsformen werden die Komponenten des Prime Editors in trans bereitgestellt. In bestimmten Ausführungsformen kodiert jede DNA-Synthese-Template eine einzelsträngige DNA- Sequenz, die einen editierten Abschnitt umfasst. Zwei kodierte, einzelsträngige DNA- Sequenzen können komplementär zueinander sein und einen Duplex bilden, der in die zu bearbeitende Zielstelle integriert wird. Die verschiedenen Elemente der Prime-Editor- Komplexe können jede der hier offengelegten Ausführungsformen der Systeme umfassen.
In einem anderen Aspekt stellt die Erfindung Verfahren bereit, die das Inkontaktbringen einer doppelsträngigen DNA-Sequenz an einer Zielstelle mit einem ersten, einem zweiten, einem dritten und einem vierten Prime-Editor-Komplex umfassen, wobei jeder Komplex einen Prime Editor und eine Guide-RNA (pegRNA) für das Prime Editing umfasst. In einigen Ausführungsformen umfasst jeder Prime Editor ein Nukleinsäure-programmierbares DNA- Bindungsprotein (napDNAbp) und ein Polypeptid mit einer RNA-abhängigen DNA- Polymerase-Aktivität, und jede pegRNA umfasst eine Spacer-Sequenz, einen gRNA-Kern, eine DNA-Synthese-Template und eine Primer-Bindungsstelle. In einigen Ausführungsformen wird jeder Prime Editor als Fusionsprotein bereitgestellt. In einigen Ausführungsformen werden die Komponenten des Prime Editors in trans bereitgestellt. In bestimmten Ausführungsformen kodiert jede DNA-Synthese-Template eine einzelsträngige DNA- Sequenz. Zwei kodierte, einzelsträngige DNA-Sequenzen können komplementär zueinander sein und einen Duplex bilden, der in die zu bearbeitende Zielstelle integriert wird. Die verschiedenen Elemente der Prime-Editor-Komplexe können jede der hier offengelegten Ausführungsformen der Systeme umfassen.
In einigen Ausführungsformen ermöglichen die hier vorgestellten Verfahren die Inversion einer Ziel-DNA-Sequenz. In einigen Ausführungsformen befinden sich die erste einzelsträngige DNA-Sequenz, die von der ersten DNA-Synthese-Template kodiert wird, und die zweite einzelsträngige DNA-Sequenz, die von der zweiten DNA-Synthese-Template kodiert wird, an entgegengesetzten Enden einer Ziel-DNA-Sequenz, und die dritte einzelsträngige DNA-Sequenz, die von der dritten DNA-Synthese-Template kodiert wird, und die vierte einzelsträngige DNA-Sequenz, die von der vierten DNA-Synthese-Template kodiert wird, befinden sich an entgegengesetzten Enden der gleichen Ziel-DNA-Sequenz.
In einigen Ausführungsformen umfassen die hier beschriebenen Verfahren außerdem die Bereitstellung eines zirkulären DNA-Donors. In bestimmten Ausführungsformen befinden sich die erste einzelsträngige DNA-Sequenz, die von der ersten DNA-Synthese-Template kodiert wird, und die dritte einzelsträngige DNA-Sequenz, die von der dritten DNA-Synthese- Template kodiert wird, an entgegengesetzten Enden der Ziel-DNA-Sequenz, und die zweite einzelsträngige DNA-Sequenz, die von der zweiten DNA-Synthese-Template kodiert wird, und die vierte einzelsträngige DNA-Sequenz, die von der vierten DNA-Synthese-Template kodiert wird, befinden sich auf dem zirkulären DNA-Donor. In einigen Ausführungsformen ersetzt der Teil des zirkulären DNA-Donors zwischen der zweiten einzelsträngigen DNA- Sequenz und der vierten einzelsträngigen DNA-Sequenz die Ziel-DNA-Sequenz zwischen der ersten einzelsträngigen DNA-Sequenz und der dritten einzelsträngigen DNA-Sequenz.
In einigen Ausführungsformen ermöglichen die hier vorgestellten Verfahren die Translokation einer Ziel-DNA-Sequenz von einem ersten Nukleinsäuremolekül (z. B. einem ersten Chromosom) zu einem zweiten Nukleinsäuremolekül (z. B. einem zweiten Chromosom). In einigen Ausführungsformen befinden sich die erste einzelsträngige DNA- Sequenz, die von der ersten DNA-Synthese-Template kodiert wird, und die dritte einzelsträngige DNA-Sequenz, die von der dritten einzelsträngigen DNA-Synthese-Template kodiert wird, auf einem ersten Nukleinsäuremolekül, und die zweite einzelsträngige DNA- Sequenz, die von der zweiten DNA-Synthese-Template kodiert wird, und die vierte einzelsträngige DNA-Sequenz, die von der vierten DNA-Synthese-Template kodiert wird, befinden sich auf einem zweiten Nukleinsäuremolekül. In bestimmten Ausführungsformen wird ein Teil des ersten Nukleinsäuremoleküls zwischen der ersten einzelsträngigen DNA- Sequenz und der dritten einzelsträngigen DNA-Sequenz in das zweite Nukleinsäuremolekül inkorporiert. In bestimmten Ausführungsformen wird ein Teil des zweiten Nukleinsäuremoleküls zwischen der zweiten einzelsträngigen DNA-Sequenz und der vierten einzelsträngigen DNA-Sequenz in das erste Nukleinsäuremolekül inkorporiert.
In einem anderen Aspekt stellt die vorliegende Erfindung ein Paar pegRNAs zur Verwendung im Multi-Flap Prime Editing bereit. In einigen Ausführungsformen umfasst das Paar eine erste pegRNA und eine zweite pegRNA, und jede pegRNA umfasst unabhängig voneinander eine Spacer-Sequenz, einen gRNA-Kern, eine DNA-Synthese-Template und eine Primer-Bindungsstelle. In bestimmten Ausführungsformen kodiert jede DNA-Synthese- Template eine einzelsträngige DNA-Sequenz. In verschiedenen Ausführungsformen werden die Multi-Flap Prime Editors in Verbindung mit einem Paar pegRNAs verwendet, die separate Prime Editors auf beiden Seiten einer Zielstelle anvisieren, wobei das Paar pegRNAs jeweils für 3'-Nukleinsäure-Flaps kodiert, die Nukleinsäuresequenzen umfassen, die zueinander umgekehrt komplementär sind. In verschiedenen Ausführungsformen können die 3'-Flaps, die die umgekehrten Komplementsequenzen umfassen, aneinander anlagern, um einen Duplex zu bilden, der die gewünschte Schnitt- oder Nukleinsäuresequenz umfasst, die von den pegRNAs kodiert wird. Der Duplex wird dann in die Zielstelle integriert, indem er den entsprechenden endogenen Duplex ersetzt, der sich zwischen benachbarten Bruchstellen befindet.
In einem anderen Aspekt stellt die vorliegende Erfindung eine Vielzahl von pegRNAs zur Verwendung im Multi-Flap Prime Editing bereit. In einigen Ausführungsformen umfasst die Vielzahl eine erste, eine zweite, eine dritte und eine vierte pegRNA. In einigen Ausführungsformen umfasst jede der vier pegRNAs unabhängig voneinander eine Spacer- Sequenz, einen gRNA-Kern, eine DNA-Synthese-Matrize und eine Primer-Bindungsstelle. In bestimmten Ausführungsformen kodiert jede DNA-Synthese-Template eine einzelsträngige DNA-Sequenz. Zwei kodierte einzelsträngige DNA-Sequenzen können komplementär zueinander sein.
In verschiedenen Aspekten stellt die vorliegende Erfindung Polynukleotide zur Verfügung, die für eines der hier beschriebenen Paare oder eine Vielzahl von pegRNAs kodieren. In bestimmten Aspekten stellt die vorliegende Erfindung Vektoren bereit, die für ein Polynukleotid kodieren, das für eines der hier beschriebenen Paare oder eine Vielzahl von pegRNAs kodiert. In einem weiteren Aspekt stellt die vorliegende Erfindung Zellen bereit, die einen Vektor umfassen, der für ein Polynukleotid kodiert, das für eines der hier beschriebenen Paare oder eine Vielzahl von pegRNAs kodiert. In anderen Aspekten stellt die Erfindung pharmazeutische Zusammensetzungen zur Verfügung, die eines der hier beschriebenen Paare oder eine Vielzahl von pegRNAs, einen Vektor, der für eines der hier beschriebenen Paare oder eine Vielzahl von pegRNAs kodiert, oder eine Zelle enthalten, die einen Vektor enthält, der für eines der hier beschriebenen Paare oder eine Vielzahl von pegRNAs kodiert. In bestimmten Ausführungsformen enthalten die pharmazeutischen Zusammensetzungen einen pharmazeutischen Hilfsstoff.
In einer Ausführungsform beziehen sich die Verfahren auf ein Verfahren zur Integration einer gewünschten Nukleotidänderung in eine doppelsträngige DNA-Sequenz. Das Verfahren umfasst zunächst das Inkontaktbringen der doppelsträngigen DNA-Sequenz mit einem Komplex, der einen Prime Editor und eine erweiterte Guide-RNA umfasst, wobei der Prime Editor ein napDNAbp und eine reverse Transkriptase umfasst und wobei die erweiterte Guide-RNA eine Reverse-Transkriptions-Template-Sequenz umfasst, die die gewünschte Nukleotidänderung umfasst. In einigen Ausführungsformen wird jeder Prime Editor als Fusionsprotein bereitgestellt. In einigen Ausführungsformen werden die Komponenten des Prime Editors in trans bereitgestellt. Als Nächstes wird die doppelsträngige DNA-Sequenz auf dem Nicht-Zielstrang eingekerbt, wodurch eine freie einzelsträngige DNA mit einem 3'-Ende entsteht. Das Verfahren beinhaltet dann die Hybridisierung des 3'-Endes der freien Einzelstrang-DNA mit der Template-Sequenz für die reverse Transkription, wodurch die Domäne der reversen Transkriptase geprimt wird. Das Verfahren beinhaltet dann die Polymerisation eines DNA-Strangs vom 3'-Ende aus, wodurch ein einzelsträngiger DNA-Flap entsteht, der die gewünschte Nukleotidänderung enthält. Anschließend wird bei dem Verfahren ein endogener DNA-Strang in der Nähe der Schnittstelle durch den einzelsträngigen DNA-Flap ersetzt, wodurch die gewünschte Nukleotidänderung in die doppelsträngige DNA- Sequenz eingebaut wird.
In anderen Ausführungsformen sieht die Erfindung ein Verfahren zur Einführung einer oder mehrerer Änderungen in der Nukleotidsequenz eines DNA-Moleküls an einem Zielort vor, was das Inkontaktbringen des DNA-Moleküls mit einem Nukleinsäure-programmierbaren DNA-Bindungsprotein (napDNAbp) und einer Guide-RNA umfasst, die das napDNAbp auf den Zielort ausrichtet, wobei die Guide-RNA eine Reverse Transkriptase (RT)- Matrizensequenz umfasst, die mindestens eine gewünschte Nukleotidänderung enthält. Als Nächstes beinhaltet das Verfahren die Bildung eines exponierten 3'-Endes in einem DNA- Strang am Zielort und die anschließende Hybridisierung des exponierten 3'-Endes mit der RT- Template-Sequenz, um die reverse Transkription zu starten. Als Nächstes wird ein einzelsträngiger DNA-Flap, der die mindestens eine gewünschte Nukleotidänderung auf der Basis der RT-Template-Sequenz enthält, durch die reverse Transkriptase synthetisiert oder polymerisiert. Schließlich wird die mindestens eine gewünschte Nukleotidveränderung in die entsprechende endogene DNA eingebaut, wodurch eine oder mehrere Veränderungen in der Nukleotidsequenz des DNA-Moleküls am Ziellocus eingeführt werden.
In wiederum anderen Ausführungsformen stellt die Erfindung ein Verfahren zur Einführung einer oder mehrerer Änderungen in der Nukleotidsequenz eines DNA-Moleküls an einem Zielort durch zielgeprimte, reverse Transkription bereit, wobei das Verfahren umfasst: (a) Inkontaktbringen des DNA-Moleküls am Zielort mit einem (i) Prime Editor, der ein Nukleinsäure-programmierbares DNA-Bindungsprotein (napDNAbp) und eine reverse Transkriptase umfasst, und (ii) einer Guide-RNA, die eine RT-Template umfasst, die eine gewünschte Nukleotidveränderung enthält; (b) Durchführen einer zielgeprimten reversen Transkription der RT-Template, um eine einzelsträngige DNA zu erzeugen, die die gewünschte Nukleotidänderung umfasst; und (c) Einbauen der gewünschten Nukleotidänderung in das DNA-Molekül am Zielort durch einen DNA-Reparatur- und/oder Replikationsprozess.
In bestimmten Ausführungsformen umfasst der Schritt des Ersetzens des endogenen DNA-Strangs: (i) Hybridisieren des Einzelstrang-DNA-Flaps an den endogenen DNA-Strang, der an die Schnittstelle angrenzt, um eine Sequenzfehlanpassung zu erzeugen; (ii) Ausschneiden des endogenen DNA-Strangs; und (iii) Reparieren der Fehlanpassung, um das gewünschte Produkt zu bilden, das die gewünschte Nukleotidänderung in beiden DNA- Strängen umfasst.
In verschiedenen Ausführungsformen kann die gewünschte Nukleotidveränderung eine einzelne Nukleotidsubstitution (z. B. eine Transition oder eine Transversionsveränderung), eine Deletion oder eine Insertion sein. Die gewünschte Nukleotidveränderung kann zum Beispiel (1) eine G-zu-T-Substitution, (2) eine G-zu-A-Substitution, (3) eine G-zu-C- Substitution, (4) eine T-zu-G-Substitution, (5) eine T-zu-A-Substitution, (6) eine T-zu-C- Substitution, (7) eine C-zu-G-Substitution, (8) eine C-zu-T-Substitution, (9) eine C-zu-A- Substitution, (10) eine A-zu-T-Substitution, (11) eine A-zu-G-Substitution oder (12) eine A- zu-C-Substitution sein.
In anderen Ausführungsformen kann die gewünschte Nukleoidänderung (1) ein G:C- Basenpaar in ein T:A-Basenpaar, (2) ein G:C-Basenpaar in ein A:T-Basenpaar, (3) ein G:C- Basenpaar in ein C:G-Basenpaar, (4) ein T:A-Basenpaar in ein G:C-Basenpaar, (5) ein T:A- Basenpaar in ein A:T-Basenpaar, (6) ein T: A-Basenpaar in ein C:G-Basenpaar, (7) ein C:G- Basenpaar in ein G:C-Basenpaar, (8) ein C:G-Basenpaar in ein T:A-Basenpaar, (9) ein C:G- Basenpaar in ein A:T-Basenpaar, (10) ein A:T-Basenpaar in ein T:A-Basenpaar, (11) ein A:T- Basenpaar in ein G:C-Basenpaar oder (12) ein A:T-Basenpaar in ein C:G-Basenpaar sein.
In wieder anderen Ausführungsformen führt das Verfahren eine gewünschte Nukleotidänderung ein, die eine Insertion ist. In bestimmten Fällen ist die Insertion mindestens 1, mindestens 2, mindestens 3, mindestens 4, mindestens 5, mindestens 6, mindestens 7, mindestens 8, mindestens 9, mindestens 10, mindestens 11, mindestens 12, mindestens 13, mindestens 14, mindestens 15, mindestens 16, mindestens 17, mindestens 18, mindestens 19, mindestens 20, mindestens 30, mindestens 40, mindestens 50, mindestens 60, mindestens 70, mindestens 80, mindestens 90, mindestens 100, mindestens 200, mindestens 300, mindestens 400 oder mindestens 500 Nukleotide lang.
In anderen Ausführungsformen führt das Verfahren eine gewünschte Nukleotidänderung ein, die eine Deletion ist. In bestimmten anderen Fällen ist die Deletion mindestens 1, mindestens 2, mindestens 3, mindestens 4, mindestens 5, mindestens 6, mindestens 7, mindestens 8, mindestens 9, mindestens 10, mindestens 11, mindestens 12, mindestens 13, mindestens 14, mindestens 15, mindestens 16, mindestens 17, mindestens 18, mindestens 19, mindestens 20, mindestens 30, mindestens 40, mindestens 50, mindestens 60, mindestens 70, mindestens 80, mindestens 90, mindestens 100, mindestens 200, mindestens 300, mindestens 400 oder mindestens 500 Nukleotide lang.
In verschiedenen Ausführungsformen korrigiert die gewünschte Nukleotidänderung ein krankheitsassoziiertes Gen. Das krankheitsassoziierte Gen kann mit einer monogenetischen Störung assoziiert sein, die ausgewählt ist aus der Gruppe bestehend aus: Adenosindeaminase (ADA) -Mangel; Alpha-1-Antitrypsin-Mangel; Mukoviszidose; Duchenne-Muskeldystrophie; Galaktosämie; Hämochromatose; Huntington-Krankheit; Ahomsirup-Urinerkrankung; Marfan-Syndrom; Neurofibromatose Typ 1; Pachyonychia congenita; Phenylketonurie; Schwere kombinierte Immunschwäche; Sichelzellkrankheit, Smith-Lemli-Opitz-Syndrom und Tay-Sachs-Krankheit. In anderen Ausführungsformen kann das krankheitsassoziierte Gen mit einer polygenen Störung assoziiert sein, die aus der Gruppe bestehend aus: Herzkrankheit, Bluthochdruck, Alzheimer-Krankheit, Arthritis, Diabetes, Krebs und Fettleibigkeit ausgewählt wird.
Die hier offengelegten Verfahren können Fusionsproteine mit einem napDNAbp beinhalten, das ein Nuklease-totes Cas9 (dCas9), eine Cas9-Nickase (nCas9) oder ein Nuklease-aktives Cas9 ist. In anderen Ausführungsformen werden ein napDNAbp und eine reverse Transkriptase nicht als ein einziges Fusionsprotein kodiert, sondern können in separaten Konstrukten bereitgestellt werden. So kann in einigen Ausführungsformen die reverse Transkriptase in trans relativ zu dem napDNAbp bereitgestellt werden (und nicht durch ein Fusionsprotein).
In verschiedenen Ausführungsformen, die Verfahren beinhalten, kann das napDNAbp eine Aminosäuresequenz der SEQ-ID-Nummern umfassen: 26-61, 75-76, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467 und 482-487 (Cas9); (SpCas9); SEQ-ID-NR.: 77-86 (CP-Cas9); SEQ-ID-NR.: 18-25 und 87-88 (SpCas9); SEQ-ID-Nummern: 62-72 (Cas12). In verschiedenen anderen Ausführungsformen umfasst das napDNAbp eine Aminosäuresequenz, die zu mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % mit der Aminosäuresequenz einer der SEQ-ID-Nummern identisch ist: 26-61, 75-76, 126, 130, 137, 141, 147, 153, 157,445,460, 467 und 482-487 (Cas9); (SpCas9); SEQ-ID-NR.: 77-86 (CP-Cas9); SEQ-ID-NR.: 18-25 und 87-88 (SpCas9); SEQ-ID-Nummern: 62-72 (Cas12).
In verschiedenen Ausführungsformen von Verfahren kann die reverse Transkriptase eine der Aminosäuresequenzen der SEQ-ID-NUMMERN umfassen: 89-100, 105-122, 128- 129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700-716, 739-742 und 766. In wieder anderen Ausführungsformen kann die reverse Transkriptase eine Aminosäuresequenz umfassen, die zu mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % mit der Aminosäuresequenz einer der SEQ-ID-NUMMERN identisch ist: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700-716, 739-742 und 766.
Die Verfahren können die Verwendung einer pegRNA beinhalten, die eine Nukleotidsequenz von SEQ-ID-NUMMERN umfasst: 101-104, 181-183, 223-234, 237-244, 277, 324-330, 332, 334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 394, 429-442, 499-505, 641-649, 678-692, 735-736, 757-761, 776-777, 2997- 3103, 3113-3121, 3305-3455, 3479-3493, 3522-3540, 3549-3556, 3628-3698, 3755-3810, 3874, 3890-3901, 3905-3911, 3913-3929 und 3972-3989 oder eine Nukleotidsequenz mit mindestens 80 %, mindestens 85 %, mindestens 90 %, mindestens 95 % oder mindestens 99 % Sequenzidentität dazu. Die Verfahren können die Verwendung von erweiterten Guide-RNAs umfassen, die eine RNA-Erweiterung am 3'-Ende umfassen, wobei die RNA-Erweiterung die Reverse-Transkriptions-Template-Sequenz umfasst.
Die Verfahren können die Verwendung von Extended Guide RNAs umfassen, die am 5'-Ende eine RNA-Erweiterung aufweisen, wobei die RNA-Erweiterung die Reverse- Transkriptions-Template-Sequenz umfasst.
Die Verfahren können die Verwendung von Extended Guide RNAs umfassen, die an einer intramolekularen Stelle in der Guide RNA eine RNA-Erweiterung aufweisen, wobei die RNA-Erweiterung die Reverse-Transkriptions-Template-Sequenz umfasst.
Die Verfahren können die Verwendung von verlängerten Guide RNAs umfassen, die eine oder mehrere RNA-Verlängerungen aufweisen, die mindestens 1, mindestens 2, mindestens 3, mindestens 4, mindestens 5, mindestens 6, mindestens 7, mindestens 8, mindestens 9, mindestens 10, mindestens 11, mindestens 12, mindestens 13, mindestens 14, mindestens 15, mindestens 16, mindestens 17, mindestens 18, mindestens 19, mindestens 20, mindestens 30, mindestens 40, mindestens 50, mindestens 60, mindestens 70, mindestens 80, mindestens 90, mindestens 100, mindestens 200, mindestens 300, mindestens 400 oder mindestens 500 Nukleotide in Länge betragen.
Die vorstehenden Konzepte und die im Folgenden erörterten zusätzlichen Konzepte können in jeder geeigneten Kombination angeordnet werden, da die vorliegende Erfindung in dieser Hinsicht nicht beschränkt ist. Weitere Vorteile und neuartige Merkmale der vorliegenden Erfindung werden aus der folgenden detaillierten Beschreibung verschiedener nicht einschränkender Ausführungsformen ersichtlich, wenn sie in Verbindung mit den begleitenden Figuren betrachtet werden.
Figurenliste
Die folgenden Zeichnungen sind Teil der vorliegenden Spezifikation und dienen der weiteren Veranschaulichung bestimmter Aspekte der vorliegenden Erfindung, die durch Bezugnahme auf eine oder mehrere dieser Zeichnungen in Kombination mit der detaillierten Beschreibung der hierin vorgestellten spezifischen Ausführungsformen besser verstanden werden können.

1A zeigt ein Schema eines beispielhaften Verfahrens zur Einführung einer einzelnen Nukleotidveränderung und/oder Insertion und/oder Deletion in ein DNA-Molekül (z. B. ein Genom) unter Verwendung eines Fusionsproteins, das eine mit einem Cas9-Protein fusionierte reverse Transkriptase im Komplex mit einem erweiterten Guide-RNA-Molekül umfasst. In dieser Ausführungsform ist die Guide-RNA am 3'-Ende verlängert, um eine Reverse Transkriptase-Matrizen-Sequenz zu enthalten. Das Schema zeigt, wie eine mit einer Cas9-Nickase fusionierte Reverse Transkriptase (RT) in einem Komplex mit einer Guide-RNA (gRNA) an die DNA-Zielstelle bindet und den PAM-haltigen DNA-Strang neben dem Zielnukleotid einschneidet. Das RT-Enzym verwendet die eingekerbte DNA als Primer für die DNA-Synthese aus der gRNA, die als Template für die Synthese eines neuen DNA-Strangs verwendet wird, der für den gewünschten Schnitt kodiert. Der gezeigte Editierprozess kann als Target-primed Reverse Transcription Editing (TRT-Editing) oder auch als „Prime Editing“ bezeichnet werden
1B zeigt die gleiche Darstellung wie in 1A, mit der Ausnahme, dass der Prime-Editor-Komplex allgemeiner als [napDNAbp]-[P]:pegRNA oder [P]- [napDNAbp]:pegRNA dargestellt wird, wobei sich „P“ auf eine beliebige Polymerase (z. B. eine reverse Transkriptase), „napDNAbp“ auf ein Nukleinsäure-programmierbares DNA- Bindungsprotein (z. B. SpCas9) und „pegRNA“ auf eine Prime-Editing-Guide-RNA und „]-[" sich auf einen optionalen Linker bezieht. Wie an anderer Stelle beschrieben, z. B. in 3A- 3G umfasst die pegRNA einen 5'-Erweiterungsarm mit einer Primerbindungsstelle und einer DNA-Synthese-Template. Obwohl nicht gezeigt, ist es denkbar, dass der Erweiterungsarm der pegRNA (d. h. der eine Primerbindungsstelle und eine DNA-Synthesematrix umfasst) aus DNA oder RNA bestehen kann. Welche Polymerase in dieser Konfiguration in Frage kommt, hängt von der Art der DNA-Synthese-Template ab. Wenn die Template für die DNA-Synthese beispielsweise RNA ist, dann kann die Polymerase eine RNA-abhängige DNA-Polymerase sein (z. B. eine reverse Transkriptase). Wenn die Template für die DNA-Synthese DNA ist, dann kann die Polymerase eine DNA-abhängige DNA-Polymerase sein.
1C zeigt eine schematische Darstellung eines beispielhaften Verfahrens zur Einführung einer einzelnen Nukleotidveränderung und/oder Insertion und/oder Deletion in ein DNA-Molekül (z. B. ein Genom) unter Verwendung eines Fusionsproteins, das eine mit einem Cas9-Protein fusionierte reverse Transkriptase im Komplex mit einem erweiterten Guide- RNA-Molekül umfasst. In dieser Ausführungsform ist die Guide-RNA am 5'-Ende verlängert, um eine Reverse-Transkriptase-Matrizen-Sequenz zu enthalten. Das Schema zeigt, wie eine mit einer Cas9-Nickase fusionierte Reverse Transkriptase (RT) in einem Komplex mit einer Guide-RNA (gRNA) an die DNA-Zielstelle bindet und den PAM-haltigen DNA-Strang neben dem Zielnukleotid einschneidet. Das RT-Enzym verwendet die eingekerbte DNA als Primer für die DNA-Synthese aus der gRNA, die als Template für die Synthese eines neuen DNA- Strangs verwendet wird, der für den gewünschten Schnitt kodiert. Der gezeigte Editierprozess kann als Target-primed Reverse Transcription Editing (TRT-Editing) oder auch als „Prime Editing“ bezeichnet werden
1D zeigt die gleiche Darstellung wie in 1C, mit der Ausnahme, dass der Prime-Editor-Komplex allgemeiner als [napDNAbp]-[P]:pegRNA oder [P]- [napDNAbp]:pegRNA dargestellt wird, wobei sich „P“ auf eine beliebige Polymerase (z. B., eine reverse Transkriptase), „napDNAbp“ auf ein Nukleinsäure-programmierbares DNA- Bindungsprotein (z. B. SpCas9) und „pegRNA“ auf eine Prime-Editing-Guide-RNA und „]-[" sich auf einen optionalen Linker bezieht. Wie an anderer Stelle beschrieben, z. B. in 3A- 3G umfasst die pegRNA einen 3'-Erweiterungsarm, der eine Primerbindungsstelle und eine DNA-Synthesematrix umfasst. Obwohl nicht gezeigt, ist es denkbar, dass der Erweiterungsarm der pegRNA (d. h. der eine Primerbindungsstelle und eine DNA- Synthesematrix umfasst) aus DNA oder RNA bestehen kann. Welche Polymerase in dieser Konfiguration in Frage kommt, hängt von der Art der DNA-Synthese-Template ab. Wenn die Template für die DNA-Synthese beispielsweise RNA ist, dann kann die Polymerase eine RNA- abhängige DNA-Polymerase sein (z. B. eine reverse Transkriptase). Wenn die Template für die DNA-Synthese DNA ist, dann kann die Polymerase eine DNA-abhängige DNA- Polymerase sein. In verschiedenen Ausführungsformen kann die pegRNA so konstruiert oder synthetisiert werden, dass sie eine DNA-basierte DNA-Synthese-Template einschließt.
1E ist eine schematische Darstellung eines beispielhaften Prozesses, der zeigt, wie der synthetisierte DNA-Einzelstrang (der die gewünschte Nukleotidänderung enthält) aufgelöst wird, so dass die gewünschte Nukleotidänderung in die DNA eingebaut wird. Wie gezeigt, führt nach der Synthese des editierten Strangs (oder „mutagenen Strangs“) die Äquilibrierung mit dem endogenen Strang, die Flap-Spaltung des endogenen Strangs und die Ligation zum Einbau der DNA-Editierung nach Auflösung des fehl angepassten DNA- Duplexes durch die Wirkung endogener DNA-Reparatur- und/oder Replikationsprozesse.
1F ist ein Schema, das zeigt, dass das „gegenläufige Strang-Nicking“ in die Auflösungsmethode integriert werden kann von 1E, um die Bildung des gewünschten Produkts gegenüber dem Reversionsprodukt zu fördern. Beim Nicking in den entgegengesetzten Strang wird ein zweiter Cas9/gRNA-Komplex verwendet, um einen zweiten Nick in den entgegengesetzten Strang des ursprünglich genickten Strangs einzubringen. Dies veranlasst die endogenen zellulären DNA-Reparatur- und/oder Replikationsprozesse dazu, vorzugsweise den unbearbeiteten Strang (d. h. den Strang mit der zweiten Einkerbung) zu ersetzen.
1G zeigt ein weiteres Schema eines beispielhaften Verfahrens zur Einführung einer einzelnen Nukleotidveränderung und/oder Insertion und/oder Deletion in ein DNA- Molekül (z. B. ein Genom) eines Ziellocus unter Verwendung eines Nukleinsäure- programmierbaren DNA-bindenden Proteins (napDNAbp), das mit einer erweiterten Guide- RNA komplexiert ist. Dieser Prozess kann als eine Ausprägung des Prime Editing bezeichnet werden. Die erweiterte Guide-RNA umfasst eine Erweiterung am 3'- oder 5'-Ende der Guide- RNA oder an einer intramolekularen Stelle in der Guide-RNA. In Schritt (a) kontaktiert der napDNAbp/gRNA-Komplex das DNA-Molekül und die gRNA leitet das napDNAbp zur Bindung an den Ziellocus. In Schritt (b) wird eine Einkerbung in einen der DNA-Stränge (den R-Loop-Strang oder den PAM-haltigen Strang oder den Nicht-Ziel-DNA-Strang oder den Protospacer-Strang) des Ziellocus eingeführt (z. B. durch eine Nuklease oder einen chemischen Wirkstoff), wodurch ein verfügbares 3'-Ende in einem der Stränge des Ziellocus entsteht. In bestimmten Ausführungsformen wird der Nick in dem DNA-Strang erzeugt, der dem R-Loop- Strang entspricht, d. h. dem Strang, der nicht mit der RNA-Führungssequenz hybridisiert ist. In Schritt (c) interagiert der DNA-Strang am 3'-Ende mit dem erweiterten Teil der Guide-RNA, um die reverse Transkription zu starten. In bestimmten Ausführungsformen hybridisiert der DNA-Strang mit dem 3'-Ende an eine spezifische RT-Priming-Sequenz auf dem erweiterten Teil der Guide-RNA. In Schritt (d) wird eine reverse Transkriptase eingeführt, die einen einzelnen DNA-Strang vom 3'-Ende der Primed Site zum 3'-Ende der Guide-RNA synthetisiert. Dadurch entsteht ein Einzelstrang-DNA-Flap mit der gewünschten Nukleotidänderung (z. B. die Änderung einer einzelnen Base, die Insertion oder Deletion oder eine Kombination davon). In Schritt (e) werden das napDNAbp und die Guide-RNA freigesetzt. Die Schritte (f) und (g) beziehen sich auf die Auflösung der einzelsträngigen DNA- Flap, so dass die gewünschte Nukleotidänderung in den Ziellocus eingebaut wird. Dieser Prozess kann in Richtung der gewünschten Produktbildung vorangetrieben werden, indem der entsprechende 5' endogene DNA-Flap entfernt wird, der sich bildet, sobald der 3'-Einzelstrang- DNA-Flap eindringt und mit der komplementären Sequenz auf dem anderen Strang hybridisiert. Der Prozess kann auch zur Produktbildung mit einem zweiten Strang führen, wie in 1F gezeigt. Bei diesem Prozess können mindestens eine oder mehrere der folgenden genetischen Veränderungen auftreten: Transversionen, Transitionen, Deletionen und Insertionen.
1H ist ein Schema, das die Arten von genetischen Veränderungen zeigt, die mit den hier beschriebenen Prime-Editing-Verfahren möglich sind. Zu den Arten von Nukleotidänderungen, die durch Prime Editing erreicht werden können, gehören Deletionen (einschließlich kurzer und langer Deletionen), Einzelnukleotidänderungen (einschließlich Transitionen und Transversionen), Inversionen und Insertionen (einschließlich kurzer und langer Deletionen).
1I ist ein Schema, das das zeitlich begrenztes Nicking des zweiten Strangs am Beispiel von PE3b zeigt (PE3b = PE2 Prime Editor Fusionsprotein + pegRNA + Guide RNA des Nickings des zweiten Strangs). Zeitlich begrenztes Nicking des zweiten Strangs ist eine Variante des Nickings des zweiten Strangs, um die Bildung des gewünschten editierten Produkts zu erleichtern. Der Begriff „zeitlich begrenzt“ bezieht sich auf die Tatsache, dass der Nick des zweiten Strangs in den uneditierten Strang erst erfolgt, nachdem der gewünschte Edit im editierten Strang installiert wurde. Dadurch wird vermieden, dass gleichzeitige Kerben auf beiden Strängen zu doppelsträngigen DNA-Brüchen führen.
1J-1K zeigen eine Variante des hierin betrachteten Prime Editing, bei der die napDNAbp (z. B. SpCas9-Nickase) durch eine beliebige programmierbare Nuklease-Domäne ersetzt wird, wie z. B. Zinkfinger-Nukleasen (ZFN) oder Transkriptionsaktivator-ähnliche Effektornukleasen (TALEN). Geeignete Nukleasen müssen also nicht unbedingt durch ein Nukleinsäure-Zielmolekül (wie eine Guide-RNA) „programmiert“ werden, sondern können auch durch die Definition der Spezifität einer DNA-Bindungsdomäne, wie insbesondere einer Nuklease, programmiert werden. Genau wie beim Prime Editing mit napDNAbp-Anteilen ist es vorzuziehen, dass solche alternativen programmierbaren Nukleasen so modifiziert werden, dass nur ein Strang der Ziel-DNA geschnitten wird. Mit anderen Worten: Die programmierbaren Nukleasen sollten vorzugsweise als Nickasen funktionieren. Sobald eine programmierbare Nuklease ausgewählt ist (z. B. eine ZFN oder eine TALEN), können zusätzliche Funktionen in das System eingebaut werden, damit es nach einem Prime-Editingähnlichen Mechanismus arbeitet. Zum Beispiel können die programmierbaren Nukleasen modifiziert werden, indem (z. B. über einen chemischen Linker) ein RNA- oder DNA- Erweiterungsarm daran gekoppelt wird, wobei der Erweiterungsarm eine Primer- Bindungsstelle (PBS) und eine DNA-Synthese-Template umfasst. Die programmierbare Nuklease kann auch (z. B. über einen chemischen oder Aminosäure-Linker) an eine Polymerase gekoppelt sein, deren Art davon abhängt, ob der Erweiterungsarm aus DNA oder RNA besteht. Im Falle eines RNA-Erweiterungsarms kann die Polymerase eine RNA- abhängige DNA-Polymerase sein (z. B. eine reverse Transkriptase). Im Falle eines DNA- Erweiterungsarms kann die Polymerase eine DNA-abhängige DNA-Polymerase sein (z. B. eine prokaryotische Polymerase, einschließlich Pol I, Pol II oder Pol III, oder eine eukaryotische Polymerase, einschließlich Pol a, Pol b, Pol g, Pol d, Pol e oder Pol z). Das System kann auch andere Funktionalitäten enthalten, die als Fusionen zu den programmierbaren Nukleasen hinzugefügt werden, oder die in trans hinzugefügt werden, um die Reaktion als Ganzes zu erleichtern (z. B. (a) eine Helikase zum Abwickeln der DNA an der Schnittstelle, um den geschnittenen Strang mit dem 3'-Ende als Primer verfügbar zu machen, (b) eine Flap-Endonuklease (z. B., FEN1), um die Entfernung des endogenen Strangs auf dem geschnittenen Strang zu unterstützen, um die Reaktion zum Ersatz des endogenen Strangs durch den synthetisierten Strang voranzutreiben, oder (c) ein nCas9:gRNA-Komplex, um einen zweiten Nick auf dem gegenüberliegenden Strang zu erzeugen, der die Integration der synthetisierten Reparatur durch eine bevorzugte zelluläre Reparatur des nicht-editierten Strangs vorantreiben kann). In Analogie zum Prime Editing mit einer napDNAbp könnte ein solcher Komplex mit einer ansonsten programmierbaren Nuklease dazu verwendet werden, einen neu synthetisierten Ersatzstrang der DNA, der einen gewünschten Schnitt trägt, zu synthetisieren und dann dauerhaft in eine Ziel-DNA einzubauen.
1L zeigt in einer Ausführungsform die anatomischen Merkmale einer Ziel-DNA, die durch Prime Editing bearbeitet werden kann. Die Ziel-DNA besteht aus einem „Nicht- Ziel-Strang“ und einem „Ziel-Strang“. Der Zielstrang ist der Strang, der an den Spacer einer pegRNA eines Prime-Editor-Komplexes annealed, der die PAM-Stelle erkennt (in diesem Fall NGG, das von den kanonischen SpCas9-basierten Prime-Editoren erkannt wird). Der Zielstrang kann auch als „Nicht-PAM-Strang“ oder als „nicht editierter Strang“ bezeichnet werden. Im Gegensatz dazu kann der Nicht-Zielstrang (d. h. der Strang, der den Protospacer und die PAM-Sequenz von NGG enthält) als „PAM-Strang“ oder „Edit-Strang“ bezeichnet werden In verschiedenen Ausführungsformen befindet sich die Einkerbung des PE-Komplexes im Protospacer auf dem PAM-Strang (z. B. mit dem SpCas9-basierten PE). Die Position des Nicks ist charakteristisch für das jeweilige Cas9, das das PE bildet. Bei einem SpCas9- basierten PE beispielsweise befindet sich die Einkerbung in der Phosphodiesterbindung zwischen den Basen drei („-3“ Position relativ zur Position 1 der PAM-Sequenz) und vier („- 4“ Position relativ zur Position 1 der PAM-Sequenz). Die Einkerbung im Protospacer bildet eine freie 3'-Hydroxylgruppe, die, wie in den folgenden FIGildungen zu sehen ist, mit der Primer-Bindungsstelle des Erweiterungsarms der pegRNA einen Komplex bildet und das Substrat für den Beginn der Polymerisation eines einzelnen DNA-Strangs bereitstellt, der durch die DNA-Synthese-Template des Erweiterungsarms der pegRNA kodiert wird. Diese Polymerisationsreaktion wird von der Polymerase (z. B. der reversen Transkriptase) des PE- Fusionsproteins in der 5'- zu 3'-Richtung katalysiert. Die Polymerisation endet, bevor der gRNA-Kern erreicht wird (z. B. durch den Einbau eines PolymerisationsFIGruchsignals oder einer Sekundärstruktur, die die Polymerisationsaktivität von PE beendet), wodurch ein einzelsträngiger DNA-Flap entsteht, der von der ursprünglichen 3'-Hydroxylgruppe des eingekerbten PAM-Strangs verlängert wird. Die DNA-Synthese-Template kodiert für einen DNA-Einzelstrang, der homolog zum endogenen 5'-Ende des DNA-Einzelstrangs ist, der unmittelbar auf die Einkerbung des PAM-Strangs folgt und die gewünschte Nukleotidänderung enthält (z. B. Substitution einer einzelnen Base, Insertion, Deletion, Inversion). Die Position des gewünschten Schnitts kann sich an jeder beliebigen Position stromabwärts der Einkerbung auf dem PAM-Strang befinden, einschließlich der Positionen +1, +2, +3, +4 (Beginn der PAM- Stelle), +5 (Position 2 der PAM-Stelle), +6 (Position 3 der PAM-Stelle), +7, +8, +9, +10, +11, +12,+13,+14,+15,+16,+17,+18,+19,+20,+21,+22,+23,+24,+25,+26,+27,+28,+29, +30,+31,+32,+33,+34,+35,+36,+37,+38,+39,+40,+41,+42,+43,+44,+45,+46,+47, +48,+49,+50,+51,+52,+53,+54,+55,+56,+57,+58,+59,+60,+61,+62,+63,+64,+65, +66,+67,+68,+69,+70,+71,+72,+73,+74,+75,+76,+77,+78,+79,+80,+81,+82,+83, +84,+85,+86,+87,+88,+89,+90,+91,+92,+93,+94,+95,+96,+97,+98,+99,+100,+101, +102,+103,+104,+105,+106,+107,+108,+109,+110,+111,+112,+113,+114,+115,+116, +117,+118, +119,+120,+ 121,+122,+123,+124,+125,+126,+127,+128,+129,+130, +131, +132,+133,+134,+135,+l36,+137,+138,+139,+140,+141,+142,+143,+144,+145,+146, +147,+148,+149 oder +150 oder mehr (relativ zur stromabwärts gelegenen Position der Einkerbung). Sobald die einsträngige DNA mit dem 3'-Ende (die den entsprechenden Schnitt enthält) die endogene einsträngige DNA mit dem 5'-Ende ersetzt, führen die DNA-Reparatur- und Replikationsprozesse zu einer permanenten Installation der Schnittstelle auf dem PAM- Strang und einer anschließenden Korrektur der Fehlpaarung auf dem Nicht-PAM-Strang, die an der Schnittstelle vorhanden sein wird. Auf diese Weise erstreckt sich der Schnitt auf beide DNA-Stränge an der Ziel-DNA-Stelle. Sie werden verstehen, dass der Verweis auf den „editierten Strang“ und den „nicht-editierten“ Strang nur dazu dient, die am PE-Mechanismus beteiligten DNA-Stränge abzugrenzen. Der „editierte Strang“ ist der Strang, der zuerst editiert wird, indem die einsträngige DNA mit 5'-Ende unmittelbar stromabwärts der Einkerbung durch die synthetisierte einsträngige DNA mit 3'-Ende ersetzt wird, die den gewünschten Schnitt enthält. Der „nicht-editierte“ Strang ist das Strangpaar mit dem editierten Strang, der jedoch selbst durch Reparatur und/oder Replikation so editiert wird, dass er komplementär zu dem editierten Strang und insbesondere zu dem betreffenden Edit ist.
1M zeigt den Mechanismus des Prime Editing mit den anatomischen Merkmalen der Ziel-DNA, des Prime-Editor-Komplexes und der Interaktion zwischen der pegRNA und der Ziel-DNA. Zunächst wird ein Prime Editor, der ein Fusionsprotein mit einer Polymerase (z. B. Reverse Transkriptase) und einem napDNAbp (z. B. SpCas9-Nickase, z. B. ein SpCas9 mit einer deaktivierenden Mutation in einer HNH-Nuklease-Domäne (z. B. H840A) oder einer deaktivierenden Mutation in einer RuvC-Nuklease-Domäne (D10A)) umfasst, mit einer pegRNA und DNA mit einer zu editierenden Ziel-DNA komplexiert. Die pegRNA besteht aus einem Spacer, einem gRNA-Kern (auch gRNA-Gerüst oder gRNA-Rückgrat genannt) (der an das napDNAbp bindet) und einem Erweiterungsarm. Der Erweiterungsarm kann sich am 3'- Ende, am 5'-Ende oder irgendwo innerhalb des pegRNA-Moleküls befinden. Wie gezeigt, befindet sich der Erweiterungsarm am 3'-Ende der pegRNA. Der Erweiterungsarm umfasst in der 3'-5'-Richtung eine Primerbindungsstelle und eine DNA-Synthese-Template (die sowohl einen interessierenden Schnitt als auch Homologieregionen (d. h. Homologiearme) umfasst), die mit der einzelsträngigen DNA mit 5'-Ende unmittelbar nach der Einkerbung auf dem PAM- Strang homolog sind. Wie gezeigt, wird nach der Einführung des Nicks, wodurch eine freie 3'-Hydroxylgruppe unmittelbar vor der Einkerbung entsteht, der Bereich unmittelbar vor der Einkerbung auf dem PAM-Strang an eine komplementäre Sequenz am 3'-Ende des Erweiterungsarms annektiert, die als „Primer-Bindungsstelle“ bezeichnet wird, wodurch ein kurzer doppelsträngiger Bereich mit einem verfügbaren 3'-Hydroxyl-Ende entsteht, der ein Substrat für die Polymerase des Prime-Editor-Komplexes bildet. Die Polymerase (z. B. Reverse Transkriptase) polymerisiert dann als DNA-Strang vom 3'-Hydroxyl-Ende bis zum Ende des Erweiterungsarms. Die Sequenz der einzelsträngigen DNA wird durch die DNA- Synthese-Template kodiert, d. h. durch den Teil des Erweiterungsarms (d. h. ohne die Primerbindungsstelle), der von der Polymerase „gelesen“ wird, um neue DNA zu synthetisieren. Durch diese Polymerisation wird die Sequenz des ursprünglichen 3'-Hydroxyl- Endes der ursprünglichen Einkerbung effektiv verlängert. Die DNA-Synthese-Template kodiert einen DNA-Einzelstrang, der nicht nur den gewünschten Schnitt enthält, sondern auch Regionen, die homolog zu dem endogenen DNA-Einzelstrang sind, der sich unmittelbar stromabwärts der Einkerbung auf dem PAM-Strang befindet. Als Nächstes verdrängt der kodierte DNA-Einzelstrang mit 3'-Ende (d. h. der 3'-Einzelstrang-DNA-Flap) den entsprechenden homologen endogenen DNA-Einzelstrang mit 5'-Ende unmittelbar stromabwärts der Einkerbung auf dem PAM-Strang und bildet ein DNA-Zwischenprodukt mit einem DNA-Flap mit 5'-Ende, das von der Zelle (z. B. durch eine Flap-Endonuklease) entfernt wird. Der 3'-End-Einzelstrang-DNA-Flap, der sich an das Komplement des endogenen 5'-End- Einzelstrang-DNA-Flaps anlagert, wird an den endogenen Strang ligiert, nachdem der 5'-DNA- Flap entfernt wurde. Der gewünschte Schnitt im 3'-Ende des einzelsträngigen DNA-Flaps, der nun annealed und ligiert wird, bildet eine Fehlpaarung mit dem Komplementstrang, der eine DNA-Reparatur und/oder eine Replikationsrunde durchläuft, wodurch der gewünschte Schnitt dauerhaft auf beiden Strängen installiert wird.
2 zeigt drei Cas-Komplexe (SpCas9, SaCas9 und LbCas12a), die in den hier beschriebenen Prime-Editoren verwendet werden können, sowie ihre PAM-, gRNA- und DNA-Spaltungsmerkmale. Die FIGildung zeigt Entwürfe für Komplexe mit SpCas9, SaCas9 und LbCas12a.
3A-3F zeigen Entwürfe für konstruierte 5' Prime Editor gRNA (3A), 3' Prime Editor gRNA (3B), und eine intramolekulare Erweiterung (3C). Die erweiterte Guide-RNA (oder erweiterte gRNA) kann hier auch als pegRNA oder „prime editing guide RNA“ bezeichnet werden 3D und 3E zeigen zusätzliche Ausführungsformen von 3' und 5' Prime Editor gRNAs (pegRNAs). 3F veranschaulicht die Interaktion zwischen einer 3'-Ende-Prime-Editor-Guide-RNA und einer Ziel-DNA-Sequenz. Die Ausführungsformen von 3A-3C zeigen beispielhafte Anordnungen der Matrizensequenz für die reverse Transkription (d. h., oder allgemeiner als DNA-Synthese-Matrize bezeichnet, wie angegeben, da die RT nur eine Art von Polymerase ist, die im Zusammenhang mit Prime- Editoren verwendet werden kann), die Primer-Bindungsstelle und eine optionale Linker- Sequenz in den erweiterten Abschnitten der 3'-, 5'- und intramolekularen Versionen sowie die allgemeinen Anordnungen der Spacer- und Kernregionen. Der offengelegte Prime-Editing- Prozess ist nicht auf diese Konfigurationen erweiterter Guide-RNAs beschränkt. Die Ausführungsform von 3D zeigt die Struktur einer beispielhaften pegRNA, wie sie hier in Betracht gezogen wird. Die pegRNA besteht aus drei Hauptbestandteilen, die in 5'- zu 3'- Richtung angeordnet sind, nämlich: einem Spacer, einem gRNA-Kern und einem Erweiterungsarm am 3'-Ende. Der Erweiterungsarm kann ferner in die folgenden Strukturelemente in 5'- bis 3'-Richtung unterteilt werden: eine Primerbindungsstelle (A), eine Edit-Template (B) und ein Homologiearm (C). Darüber hinaus kann die pegRNA eine optionale 3'-Endmodifizierungsregion (e1) und eine optionale 5'-Endmodifizierungsregion (e2) umfassen. Darüber hinaus kann die pegRNA ein Transkriptionsterminationssignal am 3'- Ende der pegRNA umfassen (nicht dargestellt). Diese Strukturelemente werden hier weiter definiert. Die Darstellung der Struktur der pegRNA ist nicht als einschränkend zu verstehen und schließt Variationen in der Anordnung der Elemente mit ein. Zum Beispiel könnten die optionalen Sequenzmodifikatoren (e1) und (e2) innerhalb oder zwischen den anderen gezeigten Regionen positioniert werden und sind nicht darauf beschränkt, sich an den 3'- und 5'-Enden zu befinden. Die pegRNA könnte in bestimmten Ausführungsformen eine sekundäre RNA- Struktur umfassen, wie z. B. Haarnadeln, Stamm/Schleifen, Toeloop, RNA-bindende Protein- Rekrutierungsdomänen (z. B. das MS2-Aptamer, das das MS2cp-Protein rekrutiert und daran bindet). Solche Sekundärstrukturen können sich zum Beispiel innerhalb des Spacers, des gRNA-Kerns oder des Erweiterungsarms und insbesondere innerhalb der e1- und/oder e2- Modifikatorregionen befinden. Zusätzlich zu den sekundären RNA-Strukturen könnten die pegRNAs (z. B. innerhalb der e1- und/oder e2-Modifikatorregionen) einen chemischen Linker oder einen Poly(N)-Linker oder -Schwanz umfassen, wobei „N“ eine beliebige Nukleobase sein kann. In einigen Ausführungsformen (z. B. wie in 72(c)), kann der chemische Linker dazu dienen, die reverse Transkription des sgRNA-Gerüsts oder -Kerns zu verhindern. Außerdem können Sie in bestimmten Ausführungsformen (siehe z. B. 72(c)) könnte der Erweiterungsarm (3) aus RNA oder DNA bestehen und/oder eine oder mehrere Nukleobasen- Analoga enthalten (die z. B. zusätzliche Funktionen wie Temperaturbeständigkeit bieten könnten). Darüber hinaus kann die Ausrichtung des Erweiterungsarms (3) in der natürlichen 5'-zu-3'-Richtung erfolgen oder in der entgegengesetzten Ausrichtung in der 3'-zu-5'-Richtung synthetisiert werden (relativ zur Ausrichtung des pegRNA-Moleküls insgesamt). Es wird auch darauf hingewiesen, dass ein Fachmann in der Lage ist, je nach Art der Nukleinsäurematerialien des Erweiterungsarms (d. h. DNA oder RNA) eine geeignete DNA- Polymerase für die Verwendung beim Prime-Editing auszuwählen, die entweder als Fusion mit dem napDNAbp oder in trans als separate Einheit bereitgestellt werden kann, um den gewünschten Template-kodierten 3'-Einzelstrang-DNA-Flap zu synthetisieren, der die gewünschte Editierung enthält. Wenn der Erweiterungsarm beispielsweise RNA ist, dann könnte die DNA-Polymerase eine reverse Transkriptase oder eine andere geeignete RNA- abhängige DNA-Polymerase sein. Wenn der Erweiterungsarm jedoch DNA ist, dann könnte die DNA-Polymerase eine DNA-abhängige DNA-Polymerase sein. In verschiedenen Ausführungsformen könnte die Bereitstellung der DNA-Polymerase in trans erfolgen, z. B. durch die Verwendung einer RNA-Protein-Rekrutierungsdomäne (z. B. eine MS2-Haarnadel, die auf der pegRNA installiert ist (z. B. in der e1- oder e2-Region oder an anderer Stelle und ein MS2cp-Protein, das mit der DNA-Polymerase fusioniert ist, wodurch die DNA-Polymerase an die pegRNA kolokalisiert wird). Es wird auch darauf hingewiesen, dass die Primerbindungsstelle im Allgemeinen keinen Teil der Vorlage bildet, die von der DNA- Polymerase (z. B. der reversen Transkriptase) verwendet wird, um den resultierenden 3'- Einzelstrang-DNA-Flap zu kodieren, der den gewünschten Schnitt enthält. Die Bezeichnung „DNA-Synthese-Template“ bezieht sich also auf die Region oder den Teil des Erweiterungsarms (3), der von der DNA-Polymerase als Matrize verwendet wird, um den gewünschten 3'-Einzelstrang-DNA-Flap zu kodieren, der den Schnitt und die Regionen der Homologie zum 5'-endogenen Einzelstrang-DNA-Flap enthält, der durch das 3'-Einzelstrang- DNA-Strangprodukt der Prime-Editing-DNA-Synthese ersetzt wird. In einigen Ausführungsformen enthält die DNA-Synthese-Template die „Edit-Template“ und den „Homologiearm“ oder einen oder mehrere Homologiearme, z. B. vor und nach der Edit- Template. Die Edit-Template kann so klein wie eine einzelne Nukleotidsubstitution sein, oder es kann sich um eine Insertion oder eine Inversion der DNA handeln. Darüber hinaus kann die Edit-Template auch eine Deletion enthalten, die durch die Kodierung eines Homologiearms, der eine gewünschte Deletion enthält, erzeugt werden kann. In anderen Ausführungsformen kann die DNA-Synthese-Template auch die e2-Region oder einen Teil davon enthalten. Wenn die e2-Region beispielsweise eine Sekundärstruktur enthält, die eine Beendigung der DNA- Polymerase-Aktivität bewirkt, dann ist es möglich, dass die DNA-Polymerase-Funktion beendet wird, bevor ein Teil der e2-Region tatsächlich in die DNA kodiert wird. Es ist auch möglich, dass ein Teil oder sogar die gesamte e2-Region in der DNA kodiert wird. Wie viel von e2 tatsächlich als Vorlage verwendet wird, hängt von seiner Beschaffenheit ab und davon, ob diese Beschaffenheit die Funktion der DNA-Polymerase unterbricht.
Die Ausführungsform von 3E zeigt die Struktur einer anderen pegRNA, die hier in Betracht gezogen wird. Die pegRNA besteht aus drei Hauptbestandteilen, die in 5'- zu 3'- Richtung angeordnet sind, nämlich: einem Spacer, einem gRNA-Kern und einem Erweiterungsarm am 3'-Ende. Der Erweiterungsarm kann ferner in die folgenden Strukturelemente in 5'- bis 3'-Richtung unterteilt werden: eine Primerbindungsstelle (A), eine Edit-Template (B) und ein Homologiearm (C). Darüber hinaus kann die pegRNA eine optionale 3'-Endmodifizierungsregion (e1) und eine optionale 5'-Endmodifizierungsregion (e2) umfassen. Darüber hinaus kann die pegRNA ein Transkriptionsterminationssignal am 3'- Ende der pegRNA umfassen (nicht dargestellt). Diese Strukturelemente werden hier weiter definiert. Die Darstellung der Struktur der pegRNA ist nicht als einschränkend zu verstehen und schließt Variationen in der Anordnung der Elemente mit ein. Zum Beispiel könnten die optionalen Sequenzmodifikatoren (e1) und (e2) innerhalb oder zwischen den anderen gezeigten Regionen positioniert werden und sind nicht darauf beschränkt, sich an den 3'- und 5'-Enden zu befinden. Die pegRNA könnte in bestimmten Ausführungsformen sekundäre RNA- Strukturen umfassen, wie z. B. Haarnadeln, Stamm/Schleifen, Toeloop, RNA-bindende Protein-Rekrutierungsdomänen (z. B. das MS2-Aptamer, das das MS2cp-Protein rekrutiert und daran bindet). Diese Sekundärstrukturen können überall im pegRNA-Molekül platziert werden. Solche Sekundärstrukturen können sich zum Beispiel innerhalb des Spacers, des gRNA-Kerns oder des Erweiterungsarms und insbesondere innerhalb der e1- und/oder e2- Modifikatorregionen befinden. Zusätzlich zu den sekundären RNA-Strukturen könnten die pegRNAs (z. B. innerhalb der e1- und/oder e2-Modifikatorregionen) einen chemischen Linker oder einen Poly(N)-Linker oder -Schwanz umfassen, wobei „N“ eine beliebige Nukleobase sein kann. In einigen Ausführungsformen (z. B. wie in 72(c)), kann der chemische Linker dazu dienen, die reverse Transkription des sgRNA-Gerüsts oder -Kerns zu verhindern. Außerdem können Sie in bestimmten Ausführungsformen (siehe z. B. 72(c)) könnte der Erweiterungsarm (3) aus RNA oder DNA bestehen und/oder eine oder mehrere Nukleobasen- Analoga enthalten (die z. B. zusätzliche Funktionen wie Temperaturbeständigkeit bieten könnten). Darüber hinaus kann die Ausrichtung des Erweiterungsarms (3) in der natürlichen 5'-zu-3'-Richtung erfolgen oder in der entgegengesetzten Ausrichtung in der 3'-zu-5'-Richtung synthetisiert werden (relativ zur Ausrichtung des pegRNA-Moleküls insgesamt). Es wird auch darauf hingewiesen, dass ein Fachmann in der Lage ist, je nach Art der Nukleinsäurematerialien des Erweiterungsarms (d. h. DNA oder RNA) eine geeignete DNA- Polymerase für die Verwendung beim Prime-Editing auszuwählen, die entweder als Fusion mit dem napDNAbp oder in trans als separate Einheit bereitgestellt werden kann, um den gewünschten Template-kodierten 3' Einzelstrang-DNA-Flap zu synthetisieren, der die gewünschte Editierung enthält. Wenn der Erweiterungsarm beispielsweise RNA ist, dann könnte die DNA-Polymerase eine reverse Transkriptase oder eine andere geeignete RNA- abhängige DNA-Polymerase sein. Wenn der Erweiterungsarm jedoch DNA ist, dann könnte die DNA-Polymerase eine DNA-abhängige DNA-Polymerase sein. In verschiedenen Ausführungsformen könnte die Bereitstellung der DNA-Polymerase in trans erfolgen, z. B. durch die Verwendung einer RNA-Protein-Rekrutierungsdomäne (z. B. eine MS2-Haarnadel, die auf der pegRNA installiert ist (z. B. in der e1- oder e2-Region oder an anderer Stelle und ein MS2cp-Protein, das mit der DNA-Polymerase fusioniert ist, wodurch die DNA-Polymerase an die pegRNA kolokalisiert wird). Es wird auch darauf hingewiesen, dass die Primerbindungsstelle im Allgemeinen keinen Teil der Vorlage bildet, die von der DNA- Polymerase (z. B. der reversen Transkriptase) verwendet wird, um den resultierenden 3'- Einzelstrang-DNA-Flap zu kodieren, der den gewünschten Schnitt enthält. Die Bezeichnung „DNA-Synthese-Template“ bezieht sich also auf die Region oder den Teil des Erweiterungsarms (3), der von der DNA-Polymerase als Matrize verwendet wird, um den gewünschten 3'-Einzelstrang-DNA-Flap zu kodieren, der den Schnitt und die Regionen der Homologie zum 5'-endogenen Einzelstrang-DNA-Flap enthält, der durch das 3'-Einzelstrang- DNA-Strangprodukt der Prime-Editing-DNA-Synthese ersetzt wird. In einigen Ausführungsformen enthält die DNA-Synthese-Template die „Edit-Template“ und den „Homologiearm“ oder einen oder mehrere Homologiearme, z. B. vor und nach der Edit- Template. Die Edit-Template kann so klein wie eine einzelne Nukleotidsubstitution sein, oder es kann sich um eine Insertion oder eine Inversion der DNA handeln. Darüber hinaus kann die Edit-Template auch eine Deletion enthalten, die durch die Kodierung eines Homologiearms, der eine gewünschte Deletion enthält, erzeugt werden kann. In anderen Ausführungsformen kann die DNA-Synthese-Template auch die e2-Region oder einen Teil davon enthalten. Wenn die e2-Region beispielsweise eine Sekundärstruktur enthält, die eine Beendigung der DNA- Polymerase-Aktivität bewirkt, dann ist es möglich, dass die DNA-Polymerase-Funktion beendet wird, bevor ein Teil der e2-Region tatsächlich in die DNA kodiert wird. Es ist auch möglich, dass ein Teil oder sogar die gesamte e2-Region in der DNA kodiert wird. Wie viel von e2 tatsächlich als Vorlage verwendet wird, hängt von seiner Beschaffenheit ab und davon, ob diese Beschaffenheit die Funktion der DNA-Polymerase unterbricht.
Die schematische Darstellung von 3F zeigt die Interaktion einer typischen pegRNA mit einer Zielstelle einer doppelsträngigen DNA und die gleichzeitige Produktion eines 3' einzelsträngigen DNA-Flaps, der die gewünschte genetische Veränderung enthält. Die doppelsträngige DNA ist mit dem oberen Strang (d. h. dem Zielstrang) in der 3' zu 5'- Ausrichtung und dem unteren Strang (d. h. dem PAM-Strang oder Nicht-Zielstrang) in der 5' zu 3'-Richtung dargestellt. Der obere Strang besteht aus dem Komplement des „Protospacers“ und dem Komplement der PAM-Sequenz und wird als „Zielstrang“ bezeichnet, weil er der Strang ist, der an den Spacer der pegRNA anknüpft. Der komplementäre untere Strang wird als „Nicht-Ziel-Strang“ oder „PAM-Strang“ oder „Protospacer-Strang“ bezeichnet, da er die PAM-Sequenz (z. B. NGG) und den Protospacer enthält. Obwohl nicht gezeigt, würde die abgebildete pegRNA mit einer Cas9-Domäne oder einer entsprechenden Domäne eines Prime- Editor-Fusionsproteins komplexiert werden. Wie im Schema dargestellt, bindet der Spacer der pegRNA an die komplementäre Region des Protospacers auf dem Zielstrang. Diese Interaktion bildet ein DNA/RNA-Hybrid zwischen der Spacer-RNA und dem Komplement der Protospacer-DNA und führt zur Bildung einer R-Schleife im Protospacer. Wie an anderer Stelle hierin beschrieben, induziert das Cas9-Protein (nicht gezeigt) dann einen Nick in den Nicht-Zielstrang, wie gezeigt. Dies führt dann zur Bildung der 3' ssDNA-Flap-Region unmittelbar stromaufwärts der Einkerbung, die gemäß *z* mit dem 3'-Ende der pegRNA an der Primerbindungsstelle interagiert. Das 3'-Ende der ssDNA-Flap (d. h. die Primer-Sequenz für die reverse Transkriptase) bindet an die Primer-Bindungsstelle (A) auf der pegRNA, wodurch die reverse Transkriptase geprimt wird. Als Nächstes polymerisiert die reverse Transkriptase (z. B. in trans oder cis als Fusionsprotein an das Cas9-Konstrukt gebunden) einen einzelnen DNA-Strang, der durch die DNA-Synthesematrix (einschließlich der Edit- Template (B) und des Homologiearms (C)) kodiert ist. Die Polymerisation setzt sich zum 5'- Ende des Erweiterungsarms hin fort. Der polymerisierte Strang der ssDNA bildet einen ssDNA 3'-End-Flap, der, wie an anderer Stelle beschrieben (z. B. wie in 1G), in die endogene DNA eindringt, den entsprechenden endogenen Strang (der als 5'-End-DNA-Flap von der endogenen DNA entfernt wird) verdrängt und den gewünschten Nukleotid-Edit (Änderung eines einzelnen Nukleotid-Basenpaares, Deletionen, Insertionen (einschließlich ganzer Gene) durch natürlich auftretende DNA-Reparatur-/Replikationsrunden installiert.
3G zeigt eine weitere Ausführungsform der hier in Betracht gezogenen Hauptbearbeitung. Insbesondere zeigt das obere Schema eine Ausführungsform eines Prime Editors (PE), der ein Fusionsprotein aus einem napDNAbp (z. B. SpCas9) und einer Polymerase (z. B. einer reversen Transkriptase) umfasst, die durch einen Linker verbunden sind. Das PE bildet einen Komplex mit einer pegRNA durch Bindung an den gRNA-Kern der pegRNA. In der gezeigten Ausführungsform ist die pegRNA mit einem 3'-Erweiterungsarm ausgestattet, der, beginnend am 3'-Ende, eine Primerbindungsstelle (PBS) gefolgt von einer DNA-Synthese-Template umfasst. Das untere Schema zeigt eine Variante eines Prime- Editors, die als „trans Prime Editor (tPE)“ bezeichnet wird In dieser Ausführungsform werden die DNA-Synthese-Template und PBS von der pegRNA entkoppelt und auf einem separaten Molekül präsentiert, das als trans Prime Editor RNA-Template („tPERT“) bezeichnet wird und eine RNA-Protein-Rekrutierungsdomäne (z. B. eine MS2-Haarnadel) umfasst. Das PE selbst ist so modifiziert, dass es mit einem rPERT-Rekrutierungsprotein („RP“) fusioniert ist. RP ist ein Protein, das die RNA-Protein-Rekrutierungsdomäne spezifisch erkennt und daran bindet. In dem Beispiel, in dem die RNA-Protein-Rekrutierungsdomäne ein MS2-Hairpin ist, kann das entsprechende rPERT-Rekrutierungsprotein MS2cp des MS2-Tagging-Systems sein. Das MS2-Tagging-System basiert auf der natürlichen Wechselwirkung des MS2-Bakteriophagen- Hüllproteins („MCP“ oder „MS2cp“) mit einer im Genom des Phagen vorhandenen Stielschleifen- oder Haarnadelstruktur, d. h. der „MS2-Haarnadel“ oder dem „MS2-Aptamer“. Im Falle des trans-Prime-Editing „rekrutiert“ der RP-PE:gRNA-Komplex ein tPERT, das die entsprechende RNA-Protein-Rekrutierungsdomäne besitzt, um mit dem PE:gRNA-Komplex zu kolokalisieren, wodurch die PBS- und DNA-Synthese-Template in trans für die Verwendung beim Prime-Editing bereitgestellt wird, wie in dem in 3H dargestellten Beispiel gezeigt.
3H zeigt den Prozess der Trans-Prime-Editing. In dieser Ausführungsform umfasst der trans-Prime-Editor einen „PE2“-Prime-Editor (d. h. eine Fusion von Cas9(H840A) und einer Variante von MMLV RT), der mit einem MS2cp-Protein fusioniert ist (d. h. einer Art von Rekrutierungsprotein, das ein MS2-Aptamer erkennt und daran bindet) und der mit einer sgRNA (d. h. einer Standard-Guide-RNA im Gegensatz zu einer pegRNA) komplexiert ist. Der trans-Prime-Editor bindet sich an die Ziel-DNA und schneidet den Nicht-Zielstrang ein. Das MS2cp-Protein rekrutiert ein tPERT in trans durch die spezifische Interaktion mit der RNA-Protein-Rekrutierungsdomäne auf dem tPERT-Molekül. Der tPERT wird mit dem trans- Prime-Editor kolokalisiert, wodurch die Funktionen von PBS und der DNA-Synthese- Template in trans für die Verwendung durch die Polymerase der reversen Transkriptase bereitgestellt werden, um einen einzelsträngigen DNA-Flap mit einem 3'-Ende zu synthetisieren, der die gewünschte genetische Information enthält, die von der DNA-Synthese- Template kodiert wird.
4A-4E zeigen in vitro TPRT-Assays (d. h. Prime-Editing-Assays). 4A ist ein Schema der fluoreszenzmarkierten DNA-Substrate gRNA, die durch ein RT-Enzym, PAGE, verlängert werden. 4B zeigt TPRT (d. h. Prime Editing) mit vorgenickten Substraten, dCas9 und 5'-erweiterten gRNAs unterschiedlicher Länge der Synthese-Template. 4C zeigt die RT-Reaktion mit vorgekerbten DNA-Substraten in Abwesenheit von Cas9. 4D zeigt TPRT (d. h. Prime Editing) auf vollständigen dsDNA-Substraten mit Cas9(H840A) und 5'-extended gRNAs. 4E zeigt eine 3'-erweiterte gRNA-Vorlage mit vorgenickten und vollständigen dsDNA-Substraten. Alle Reaktionen sind mit M-MLV RT.
5 zeigt In-vitro-Validierungen unter Verwendung von 5'-extended gRNAs mit unterschiedlich langen Synthese-Templates. Als Substrate wurden fluoreszenzmarkierte (Cy5) DNA-Targets verwendet, die in dieser Versuchsreihe mit einem Einschnitt versehen wurden. Bei dem in diesen Experimenten verwendeten Cas9 handelt es sich um katalytisch totes Cas9 (dCas9), und die verwendete RT ist Superscript III, eine kommerzielle RT, die aus dem Moloney-Murine Leukemia Virus (M-MLV) gewonnen wurde. dCas9:gRNA-Komplexe wurden aus gereinigten Komponenten gebildet. Dann wurde das fluoreszierend markierte DNA-Substrat zusammen mit dNTPs und dem RT-Enzym hinzugefügt. Nach 1 Stunde Inkubation bei 37 °C wurden die Reaktionsprodukte mittels denaturierender Hamstoff- Polyacrylamid-Gelelektrophorese (PAGE) analysiert. Das Gelbild zeigt die Erweiterung des ursprünglichen DNA-Strangs auf Längen, die mit der Länge der Vorlage für die reverse Transkription übereinstimmen.
6 zeigt In-vitro-Validierungen unter Verwendung von 5'-erweiterten gRNAs mit unterschiedlich langen Synthese-Templates, die denen in 5 sehr ähnlich sind. Allerdings sind die DNA-Substrate in dieser Reihe von Experimenten nicht vorgekerbt. Das in diesen Experimenten verwendete Cas9 ist eine Cas9-Nickase (SpyCas9 H840A-Mutante) und die verwendete RT ist Superscript III, eine kommerzielle RT, die vom Moloney-Murine Leukemia Virus (M-MLV) abgeleitet ist. Die Reaktionsprodukte wurden mittels denaturierender Harnstoff-Polyacrylamid-Gelelektrophorese (PAGE) analysiert. Wie im Gel zu sehen ist, schneidet die Nickase den DNA-Strang effizient, wenn die Standard-gRNA verwendet wird (gRNA_0, Spur 3).
7 zeigt, dass 3'-Erweiterungen die DNA-Synthese unterstützen und die Cas9- Nickase-Aktivität nicht signifikant beeinflussen. Vorgeschnittene Substrate (schwarzer Pfeil) werden nahezu quantitativ in RT-Produkte umgewandelt, wenn entweder dCas9 oder Cas9- Nickase verwendet wird (Spuren 4 und 5). Mehr als 50 % Umwandlung in das RT-Produkt (roter Pfeil) wird mit vollen Substraten (Spur 3) beobachtet. Cas9-Nickase (SpyCas9 H840A- Mutante), katalytisch totes Cas9 (dCas9) und Superscript III, eine kommerzielle RT, die vom Moloney-Murine Leukemia Virus (M-MLV) abgeleitet ist, werden verwendet.
8 zeigt zweifarbige Experimente, die verwendet wurden, um festzustellen, ob die RT-Reaktion vorzugsweise mit der gRNA in cis (im gleichen Komplex gebunden) stattfindet. Zwei separate Experimente wurden für 5'-erweiterte und 3'-erweiterte gRNAs durchgeführt. Die Produkte wurden mittels PAGE analysiert. Produktverhältnis berechnet als (Cy3cis/Cy3trans) / (Cy5trans/Cy5cis).
9A-9D zeigt ein Flap-Modell-Substrat. 9A zeigt einen Dual-FP-Reporter für die Flap-directed Mutagenese. 9B zeigt die Stopcodon-Reparatur in HEK-Zellen. 9C zeigt sequenzierte Hefeklone nach der Flap-Reparatur. 9D zeigt den Test verschiedener Flap-Merkmale in menschlichen Zellen.
10 demonstriert das Prime Editing auf Plasmidsubstraten. Ein dualfluoreszierendes Reporterplasmid wurde für die Expression in Hefe (S. cerevisiae) konstruiert. Die Expression dieses Konstrukts in Hefe produziert nur GFP. Die In-vitro-Prime-Editing- Reaktion führt eine Punktmutation ein und transformiert das Elternplasmid oder ein in vitro Cas9(H840A)-Nicked-Plasmid in Hefe. Die Kolonien werden durch Fluoreszenzbildgebung sichtbar gemacht. Hefe-Dual-FP-Plasmid-Transformanten sind abgebildet. Die Transformation des Elternplasmids oder eines in vitro Cas9(H840A) nicked Plasmids führt nur zu grünen GFP exprimierenden Kolonien. Die Prime-Editing-Reaktion mit 5'-erweiterten oder 3'-erweiterten gRNAs erzeugt eine Mischung aus grünen und gelben Kolonien. Letztere exprimieren sowohl GFP als auch mCherry. Es werden mehr gelbe Kolonien mit der 3'erweiterten gRNA beobachtet. Eine positive Kontrolle, die kein Stopcodon enthält, ist ebenfalls abgebildet.
11 zeigt das Prime Editing auf Plasmidsubstraten ähnlich dem Experiment in 10, aber anstatt eine Punktmutation in das Stopcodon einzubauen, wird beim Prime Editing eine einzelne Nukleotid-Insertion (links) oder -Deletion (rechts) eingebaut, die eine Frameshift-Mutation repariert und die Synthese von mCherry im Downstream ermöglicht. In beiden Experimenten wurden 3' erweiterte gRNAs verwendet.
12 zeigt Editing-Produkte von Prime Editing auf Plasmidsubstraten, die durch Sanger-Sequenzierung charakterisiert wurden. Einzelne Kolonien aus den TRT- Transformationen wurden ausgewählt und mittels Sanger-Sequenzierung analysiert. Bei der Sequenzierung ausgewählter Kolonien wurden präzise Veränderungen beobachtet. Die grünen Kolonien enthielten Plasmide mit der ursprünglichen DNA-Sequenz, während die gelben Kolonien die präzise Mutation enthielten, die durch die Prime Editing gRNA erzeugt wurde. Es wurden keine weiteren Punktmutationen oder Indels beobachtet.
13 zeigt die potenziellen Möglichkeiten der neuen Prime-Editing-Technologie auf und vergleicht sie mit Deaminase-vermittelten Base-Editing-Technologien.
14 zeigt ein Schema des Editierens in menschlichen Zellen.
15 zeigt die Erweiterung der Primerbindungsstelle in gRNA.
16 zeigt verkürzte gRNAs für das benachbarte Targeting.
17A-17C sind Diagramme, die die prozentuale Umwandlung von T in A am Zielnukleotid nach Transfektion der Komponenten in menschlichen embryonalen Nierenzellen (HEK-Zellen) zeigen. 17A zeigt Daten, die Ergebnisse unter Verwendung einer N- terminalen Fusion der unmutierten MLV-Reverse-Transkriptase mit Cas9(H840A)-Nickase (32-Aminosäure-Linker) darstellen. 17B ist ähnlich wie 17A, aber für die C- terminale Fusion des RT-Enzyms. 17C ist ähnlich wie 17A, aber der Linker zwischen dem MLV RT und Cas9 ist 60 Aminosäuren lang statt 32 Aminosäuren.
18 zeigt eine hochreine T-zu-A-Editierung an der HEK3-Stelle durch Hochdurchsatz-Amplikonsequenzierung. Das Ergebnis der Sequenzierungsanalyse zeigt die am häufigsten vorkommenden Genotypen der bearbeiteten Zellen an.
19 zeigt die Editiereffizienz am Zielnukleotid (blaue Balken) und die Indel-Raten (orangefarbene Balken). WT bezieht sich auf den unmutierten Typ des MLV RT-Enzyms. Die mutierten Enzyme (M1 bis M4) enthalten die rechts aufgeführten Mutationen. Die Editierraten wurden durch Hochdurchsatz-Sequenzierung von genomischen DNA-Amplikons quantifiziert.
20 zeigt die Editiereffizienz des Zielnukleotids, wenn ein Einzelstrang-Nick in den komplementären DNA-Strang in der Nähe des Zielnukleotids eingeführt wird. Getestet wurde das Nicking in verschiedenen Abständen vom Zielnukleotid (Dreiecke). Die Editiereffizienz am Zielbasenpaar (blaue Balken) wird zusammen mit der Indel-Bildungsrate (orangefarbene Balken) gezeigt. Das Beispiel „keine“ enthält keine komplementäre Strang- Nicking-Guide-RNA. Die Editierraten wurden durch Hochdurchsatz-Sequenzierung von genomischen DNA-Amplikons quantifiziert.
21 zeigt aufbereitete Hochdurchsatz-Sequenzierungsdaten, die die gewünschte T- zu-A-Transversionsmutation und das generelle Fehlen anderer wichtiger Genom-Editing- Nebenprodukte zeigen.
22 zeigt eine schematische Darstellung eines beispielhaften Verfahrens zur Durchführung einer gezielten Mutagenese mit einer fehleranfälligen reversen Transkriptase an einem Ziellocus unter Verwendung eines programmierbaren DNA-Bindungsproteins (napDNAbp), das mit einer erweiterten Guide-RNA komplexiert ist, d. h. Prime Editing mit einer fehleranfälligen RT. Dieser Prozess kann als eine Ausführungsform des Prime Editing für die gezielte Mutagenese bezeichnet werden. Die erweiterte Guide-RNA umfasst eine Erweiterung am 3'- oder 5'-Ende der Guide-RNA oder an einer intramolekularen Stelle in der Guide-RNA. In Schritt (a) kontaktiert der napDNAbp/gRNA-Komplex das DNA-Molekül und die gRNA leitet das napDNAbp zur Bindung an den zu mutierenden Ziellocus. In Schritt (b) wird eine Einkerbung in einen der DNA-Stränge des Ziellocus eingeführt (z. B. durch eine Nuklease oder einen chemischen Wirkstoff), wodurch ein verfügbares 3'-Ende in einem der Stränge des Ziellocus entsteht. In bestimmten Ausführungsformen wird der Nick in dem DNA- Strang erzeugt, der dem R-Loop-Strang entspricht, d. h. dem Strang, der nicht mit der RNA- Führungssequenz hybridisiert ist. In Schritt (c) interagiert der DNA-Strang am 3'-Ende mit dem erweiterten Teil der Guide-RNA, um die reverse Transkription zu starten. In bestimmten Ausführungsformen hybridisiert der DNA-Strang mit dem 3'-Ende an eine spezifische RT- Priming-Sequenz auf dem erweiterten Teil der Guide-RNA. In Schritt (d) wird eine fehleranfällige reverse Transkriptase eingeführt, die einen mutierten DNA-Einzelstrang vom 3'-Ende der Primed Site zum 3'-Ende der Guide-RNA synthetisiert. Exemplarische Mutationen sind mit einem Sternchen „*“ gekennzeichnet. Dadurch entsteht ein einzelsträngiger DNA- Flap, der die gewünschte mutierte Region enthält. In Schritt (e) werden das napDNAbp und die Guide-RNA freigesetzt. Die Schritte (f) und (g) beziehen sich auf die Auflösung des einzelsträngigen DNA-Flaps (der die mutagenisierte Region umfasst), so dass die gewünschte mutagenisierte Region in den Ziellocus eingebaut wird. Dieser Prozess kann in Richtung der gewünschten Produktbildung vorangetrieben werden, indem der entsprechende 5' endogene DNA-Flap entfernt wird, der sich bildet, sobald der 3'-Einzelstrang-DNA-Flap eindringt und mit der komplementären Sequenz auf dem anderen Strang hybridisiert. Der Prozess kann auch zur Produktbildung mit einem zweiten Strang führen, wie in 1F gezeigt. Nach endogenen DNA-Reparatur- und/oder Replikationsprozessen wird die mutierte Region in beide DNA- Stränge des DNA-Locus eingebaut.
23 ist ein Schema des gRNA-Designs für die Kontraktion von Trinukleotid- Repeat-Sequenzen und die Kontraktion von Trinukleotid-Repeats mit TPRT-Genom-Editing (d. h. Prime Editing). Die Expansion von Trinukleotid-Repeats wird mit einer Reihe von menschlichen Krankheiten in Verbindung gebracht, darunter die Huntington-Krankheit, das Fragile-X-Syndrom und die Friedreich-Ataxie. Die häufigste Trinukleotidwiederholung enthält CAG-Tripletts, obwohl auch GAA-Tripletts (Friedreich-Ataxie) und CGG-Tripletts (Fragiles X-Syndrom) vorkommen. Die Vererbung einer Veranlagung zur Expansion oder der Erwerb eines bereits expandierten elterlichen Allels erhöht die Wahrscheinlichkeit, die Krankheit zu bekommen. Pathogene Expansionen von Trinukleotid-Wiederholungen könnten hypothetisch durch Prime Editing korrigiert werden. Eine Region stromaufwärts der Repeat-Region kann von einer RNA-gesteuerten Nuklease eingekerbt werden, um dann die Synthese eines neuen DNA-Strangs zu starten, der eine gesunde Anzahl von Repeats enthält (die von dem jeweiligen Gen und der Krankheit abhängt). Nach der Wiederholungssequenz wird ein kurzer Abschnitt der Homologie hinzugefügt, der mit der Identität der Sequenz am anderen Ende der Wiederholung (roter Strang) übereinstimmt. Die Invasion des neu synthetisierten Strangs und der anschließende Ersatz der endogenen DNA durch den neu synthetisierten Flap führt zu einem kontrahierten Wiederholungsallel.
24 ist eine schematische Darstellung der präzisen 10-Nukleotid-Deletion mit Prime Editing. Eine Guide-RNA, die auf den HEK3-Locus abzielt, wurde mit einer Vorlage für die reverse Transkription entworfen, die für eine 10-Nukleotid-Deletion nach der Einkerbung kodiert. Die Editing-Effizienz in transfizierten HEK-Zellen wurde durch Amplikon-Sequenzierung ermittelt.
25 ist eine schematische Darstellung des gRNA-Designs für das Peptid-Tagging von Genen an endogenen genomischen Loci und das Peptid-Tagging mit TPRT-Genom- Editing (d. h. Prime Editing). Die Markierungssysteme FlAsH und ReAsH bestehen aus zwei Teilen: (1) eine fluorophor-biarsenische Sonde und (2) ein genetisch kodiertes Peptid, das ein Tetracystein-Motiv enthält, beispielhaft dargestellt durch die Sequenz FLNCCPGCCMEP (SEQ-ID-NR.: 1). Wenn sie in Zellen exprimiert werden, können Proteine, die das Tetracystein-Motiv enthalten, mit Fluorophor-Arsen-Sonden fluoreszierend markiert werden (siehe Ref: J. Am. Chem. Soc., 2002, 124 (21), S. 6063-6076. DOI: 10.1021/ja017687n). Das „Sortagging“-System verwendet bakterielle Sortase-Enzyme, die markierte Peptidsonden kovalent an Proteine konjugieren, die geeignete Peptidsubstrate enthalten (siehe Referenz): Nat. Chem. Biol. 2007 Nov;3(11):707-8. DOI: 10.1038/nchembio.2007.31). Die FLAG-Marke (DYKDDDDK (SEQ-ID-NR.: 2)), V5-Tag (GKPIPNPLLGLDST (SEQ-ID-NR.: 3)), GCN4- Tag (EELLSKNYHLENEVARLKK (SEQ-ID-NR.: 4)), HA-Tag (YPYDVPDYA (SEQ-ID- NR.: 5)) und Myc-Tag (EQKLISEEDL (SEQ-ID-NR.: 6)) werden üblicherweise als Epitop- Tags für Immunoassays verwendet. Der pi-Clamp kodiert eine Peptidsequenz (FCPF (SEQ- ID-NR.: 622)), die mit einem pentafluoro-aromatischen Substrat markiert werden können (Ref: Nat. Chem. 2016 Feb;8(2):120-8. doi: 10.1038/nchem.2413).
26A zeigt den präzisen Einbau eines His₆-Tags und eines FLAG-Tags in genomische DNA. Mit einer Vorlage für die reverse Transkription, die entweder für eine 18- nt His-Tag-Insertion oder eine 24-nt FLAG-Tag-Insertion kodiert, wurde eine Guide-RNA entworfen, die auf den HEK3-Locus abzielt. Die Editing-Effizienz in transfizierten HEK- Zellen wurde durch Amplikon-Sequenzierung ermittelt. Beachten Sie, dass die gesamte 24-nt- Sequenz des FLAG-Tags außerhalb des Sichtfeldes liegt (die Sequenzierung bestätigte die vollständige und präzise Insertion). 26B zeigt eine schematische Darstellung verschiedener Anwendungen, bei denen die Markierung von Proteinen/Peptiden eine Rolle spielt. Dazu gehören (a) die Löslichkeit oder Unlöslichkeit von Proteinen, (b) die Veränderung oder Verfolgung der zellulären Lokalisierung eines Proteins, (c) die Erweiterung der Halbwertszeit eines Proteins, (d) die Erleichterung der Proteinreinigung und (e) die Erleichterung des Nachweises von Proteinen.
27 zeigt einen Überblick über das Prime Editing durch Einfügen einer schützenden Mutation in PRNP, die das Fortschreiten der Prionenkrankheit verhindert oder aufhält. Die pegRNA-Sequenzen entsprechen den Restnummern 1-20 von SEQ-ID-NR.: 810 auf der linken Seite (d. h. 5' des sgRNA-Gerüsts) und den Restnummern 21-43 der SEQ-ID- NR.: 810 auf der rechten Seite (d. h. 3' des sgRNA-Gerüsts).
28A ist eine schematische Darstellung der PE-basierten Insertion von Sequenzen, die RNA-Motive kodieren. 28B ist eine (nicht erschöpfende) Liste einiger Beispielmotive, die möglicherweise eingefügt werden könnten, und ihrer Funktionen.
29A ist eine FIGildung eines Prime Editors. 29B zeigt mögliche Modifikationen an genomischer, Plasmid- oder viraler DNA, die durch ein PE gesteuert werden. 29C zeigt ein Beispielschema für die Insertion einer Bibliothek von Peptidschleifen in ein bestimmtes Protein (in diesem Fall GFP) über eine Bibliothek von pegRNAs. 29D zeigt ein Beispiel für mögliche programmierbare Deletionen von Codons oder N- oder C-terminale Verkürzungen eines Proteins unter Verwendung verschiedener pegRNAs. Es wird erwartet, dass Deletionen mit minimaler Generierung von Frameshift- Mutationen auftreten.
30 zeigt ein mögliches Schema für die iterative Insertion von Codons in einem System der kontinuierlichen Evolution, wie z. B. PACE.
31 ist eine Illustration einer konstruierten gRNA, die den gRNA-Kern, den ~20nt- Spacer, der mit der Sequenz des Zielgens übereinstimmt, die Vorlage für die reverse Transkription mit der Nukleotidsequenz des immunogenen Epitops und die Primerbindungsstelle, die mit der Sequenz des Zielgens übereinstimmt, zeigt.
32 ist ein Schema, das die Verwendung von Prime Editing als Mittel zum Einfügen bekannter immunogener Epitope in endogene oder fremde genomische DNA zeigt, was zu einer Veränderung der entsprechenden Proteine führt.
33 ist eine schematische Darstellung des pegRNA-Designs für Primerbindungssequenz-Insertionen und Primerbindungs-Insertionen in genomische DNA unter Verwendung von Prime-Editing zur Bestimmung von Off-Target-Editing. In dieser Ausführungsform wird das Prime Editing in einer lebenden Zelle, einem Gewebe oder einem Tiermodell durchgeführt. In einem ersten Schritt wird eine geeignete pegRNA entworfen. Das obere Schema zeigt eine beispielhafte pegRNA, die in diesem Aspekt verwendet werden kann. Der Spacer in der pegRNA (als „Protospacer“ bezeichnet) ist komplementär zu einem der Stränge des genomischen Ziels. Der PE:pegRNA-Komplex (d. h. der PE-Komplex) installiert einen einzelsträngigen 3'-End-Flap an der Einkerbung, der die kodierte PrimerBindungssequenz und die Region der Homologie (kodiert durch den Homologiearm der pegRNA) enthält, die komplementär zu der Region direkt stromabwärts der Einkerbung (in rot) ist. Durch Flap-Invasion und DNA-Reparatur-/Replikationsprozesse wird der synthetisierte Strang in die DNA eingebaut, wodurch die Primer-Bindungsstelle installiert wird. Dieser Prozess kann am gewünschten genomischen Ziel stattfinden, aber auch an anderen genomischen Stellen, die mit der pegRNA in einer Off-Target-Weise interagieren könnten (d. h. die pegRNA leitet den PE-Komplex aufgrund der Komplementarität der Spacer-Region zu anderen genomischen Stellen, die nicht die beabsichtigte genomische Stelle sind, zu anderen Off-Target-Stellen). So kann die Primerbindungssequenz nicht nur am gewünschten genomischen Ziel, sondern auch an anderen genomischen Stellen im Genom installiert werden. Um die Insertion dieser Primer-Bindungsstellen sowohl an den beabsichtigten genomischen Zielstellen als auch an den genomischen Off-Target-Stellen nachzuweisen, kann die genomische DNA (nach der PE) isoliert, fragmentiert und an Adapternukleotide (in rot dargestellt) ligiert werden. Als Nächstes kann die PCR mit PCR-Oligonukleotiden durchgeführt werden, die an die Adapter und an die eingefügte Primerbindungssequenz binden, um On-Target- und Off-Target-Regionen der genomischen DNA zu amplifizieren, in die die Primerbindungsstelle durch PE eingefügt wurde. Anschließend kann eine Hochdurchsatz- Sequenzierung durchgeführt und die Sequenzen können abgeglichen werden, um die Einfügepunkte der mit PE eingefügten Primer-Bindungssequenzen entweder an der On-Target- Stelle oder an Off-Target-Stellen zu identifizieren.
34 ist ein Schema, das die genaue Insertion eines Gens mit PE zeigt.
35A ist eine schematische Darstellung des natürlichen Insulin-Signalwegs. 35B ist ein Schema, das die Aktivierung des FKBP12-markierten Insulinrezeptors durch FK1012 zeigt.
36 zeigt kleinmolekulare Monomere. Referenzen: gestoßenes FK506 Nachahmerprodukt (2)¹⁰⁷
37A-37B zeigen kleinmolekulare Dimere. Referenzen: FK1012 4^95,96; FK1012 5¹⁰⁸; FK1012 6¹⁰⁷; AP1903 7¹⁰⁷; Cyclosporin A Dimer 8⁹⁸; FK506-Cyclosporin A Dimer (FkCsA) 9¹⁰⁰.
38A-38F geben einen Überblick über das Prime Editing und Machbarkeitsstudien in vitro und in Hefezellen. 38A zeigt die 75.122 bekannten pathogenen menschlichen genetischen Varianten in ClinVar (Zugriff im Juli 2019), klassifiziert nach Typ. 38B zeigt, dass ein Prime-Editing-Komplex aus einem Prime-Editor (PE)-Protein besteht, das eine RNA-gesteuerte DNA-Nicking-Domäne enthält, wie z. B. Cas9-Nickase, fusioniert mit einer konstruierten Reversen Transkriptase-Domäne und komplexiert mit einer Prime-Editing- Guide-RNA (pegRNA). Der PE:pegRNA-Komplex bindet an die Ziel-DNA und ermöglicht eine Vielzahl präziser DNA-Editierungen an einer Vielzahl von DNA-Positionen vor oder nach dem Protospacer-benachbartes Motiv (PAM) der Ziel-DNA. 38C zeigt, dass der PE:pegRNA-Komplex nach der Bindung an das DNA-Ziel den PAM-haltigen DNA-Strang einschneidet. Das resultierende freie 3'-Ende hybridisiert mit der Primer-Bindungsstelle der pegRNA. Die Domäne der reversen Transkriptase katalysiert die Primer-Erweiterung unter Verwendung der RT-Template der pegRNA, was zu einem neu synthetisierten DNA-Strang führt, der den gewünschten Schnitt (den 3'-Flap) enthält. Das Gleichgewicht zwischen dem editierten 3'-Flap und dem uneditierten 5'-Flap, der die ursprüngliche DNA enthält, gefolgt von der zellulären 5'-Flap-Spaltung und -Ligation und der DNA-Reparatur oder -Replikation, um die Heteroduplex-DNA aufzulösen, führt zu einer stabil editierten DNA. 38D zeigt in vitro 5'-erweiterte pegRNA-Primer-Erweiterungsassays mit vorgekerbten dsDNA-Substraten, die 5'-Cy5-markierte PAM-Stränge, dCas9 und eine kommerzielle M-MLV-RT-Variante (RT, Superscript III) enthalten. dCas9 wurde mit pegRNAs komplexiert, die RT-Templates unterschiedlicher Länge enthalten, und dann zusammen mit den angegebenen Komponenten zu den DNA-Substraten gegeben. Die Reaktionen wurden 1 Stunde lang bei 37 °C inkubiert, dann mittels denaturierender HarnstoffPAGE analysiert und auf Cy5-Fluoreszenz visualisiert.
38E zeigt Primer-Erweiterungsassays, die wie in 38D unter Verwendung von 3'erweiterten pegRNAs durchgeführt werden, die mit dCas9 oder Cas9 H840A-Nickase vorkomplexiert sind, und mit 5'-Cy5-markierten dsDNA-Substraten mit oder ohne Einkerbung.
38F zeigt Hefekolonien, die mit GFP-mCherry-Fusionsreporterplasmiden transformiert wurden, die in vitro mit pegRNAs, Cas9-Nickase und RT bearbeitet wurden. Plasmide, die Nonsense- oder Frameshift-Mutationen zwischen GFP und mCherry enthielten, wurden mit 5'erweiterten oder 3'-erweiterten pegRNAs editiert, die die mCherry-Translation durch Transversionsmutation, 1-bp-Insertion oder 1-bp-Deletion wiederherstellen. GFP und mCherry doppelt-positive Zellen (gelb) zeigen eine erfolgreiche Bearbeitung an.
39A-39D zeigen das Prime Editing der genomischen DNA in menschlichen Zellen durch PE1 und PE2. 39A zeigt, dass pegRNAs eine Spacer-Sequenz, ein sgRNA- Gerüst und eine 3'-Erweiterung enthalten, die eine Primer-Bindungsstelle (grün) und eine Vorlage für die reverse Transkription (RT) (violett) enthält, die die editierte(n) Base(n) (rot) enthält. Die Primer-Bindungsstelle hybridisiert mit dem PAM-haltigen DNA-Strang unmittelbar vor der Stelle des Nicks. Die RT-Template ist homolog zu der DNA-Sequenz stromabwärts des Nicks, mit Ausnahme des kodierten Schnitts. 39B zeigt die Installation einer T-A-zu-A-T-Transversion an der HEK3-Stelle in HEK293T-Zellen unter Verwendung der Cas9 H840A-Nickase, die mit der unmutierten M-MLV Reverse Transkriptase (PE1) fusioniert ist, und pegRNAs mit unterschiedlichen Primer-Bindungsstellenlängen. 39 C zeigt, dass die Verwendung einer gentechnisch veränderten pentamutanten M-MLV Reversen Transkriptase (D200N, L603W, T306K, W313F, T330P) in PE2 die Effizienz der Prime- Editing-Transversionen an fünf genomischen Stellen in HEK293T-Zellen sowie der kleinen Insertions- und kleinen Deletions-Edits in HEK3-Zellen erheblich verbessert. 39D ist ein Vergleich der PE2-Editing-Effizienz mit unterschiedlichen RT-Template-Längen an fünf genomischen Stellen in HEK293T-Zellen. Die Werte und Fehlerbalken geben den Mittelwert und die Standardabweichung von drei unabhängigen biologischen Replikaten wieder.
40A-40C zeigen, dass die PE3- und PE3b-Systeme den nicht-editierten Strang einschneiden, um die Effizienz des Prime Editing zu erhöhen. 40A ist eine Übersicht über die Prime-Editing durch PE3. Nach der anfänglichen Synthese des editierten Strangs entfernt die DNA-Reparatur entweder den neu synthetisierten Strang, der den Edit enthält (3'-Flap-Exzision), oder den ursprünglichen genomischen DNA-Strang (5'-Flap-Exzision). Die 5'-Flap-Exzision hinterlässt einen DNA-Heteroduplex, der einen editierten Strang und einen nicht-editierten Strang enthält. Die Mismatch-Reparaturmaschinerie oder die DNA-Replikation könnte den Heteroduplex auflösen, so dass entweder editierte oder nicht-editierte Produkte entstehen. Das Einkerben des nicht-editierten Strangs begünstigt die Reparatur dieses Strangs, was zu einer bevorzugten Erzeugung von stabiler Duplex-DNA führt, die den gewünschten Schnitt enthält. 40B zeigt den Effekt des komplementären Strang-Nickings auf die PE3-vermittelte Prime-Editing-Effizienz und Indel-Bildung. „Keine“ bezieht sich auf PE2-Kontrollen, die den komplementären Strang nicht einschneiden. 40C ist ein Vergleich der Editing-Effizienz mit PE2 (kein komplementärer Strang-Nick), PE3 (allgemeiner komplementärer Strang- Nick) und PE3b (edit-spezifischer komplementärer Strang-Nick). Alle Editing-Ergebnisse spiegeln den Prozentsatz der gesamten Sequenzierungs-Werte wider, die den beabsichtigten Edit enthalten und keine Indels unter allen behandelten Zellen enthalten, ohne Sortierung. Die Werte und Fehlerbalken geben den Mittelwert und die Standardabweichung von drei unabhängigen biologischen Replikaten wieder.
41A-41K zeigen gezielte Insertionen, Deletionen und alle 12 Arten von Punktmutationen mit PE3 an sieben endogenen menschlichen genomischen Loci in HEK293T- Zellen. 41A ist ein Diagramm, das alle 12 Arten von Einzelnukleotidtransitionen und Transversionen von Position +1 bis +8 (wobei die Position des pegRNA-induzierten Nicks als zwischen Position +1 und -1 liegend gezählt wird) der HEK3-Stelle unter Verwendung einer 10-nt-RT-Template zeigt. 41B ist ein Diagramm, das weitreichende PE3-Transversionen an der HEK3-Stelle unter Verwendung einer 34-nt-RT-Template zeigt. 41C-41H sind Diagramme, die alle 12 Arten von Transitions- und Transversionsbearbeitungen an verschiedenen Positionen im Hauptbearbeitungsfenster für (41C) RNF2, (41D) FANCF, (41E) EMX1, (41F) RUNX1, (41G) VEGFA und (41H) DNMT1 zeigen. 41I ist ein Diagramm, das gezielte 1- und 3-bp-Insertionen sowie 1- und 3-bp-Deletionen mit PE3 an sieben endogenen genomischen Loci zeigt. 41J ist ein Diagramm, das die gezielten präzisen Deletionen von 5 bis 80 bp an der HEK3-Zielstelle zeigt. 41K ist ein Diagramm, das eine Kombination aus Insertionen und Deletionen, Insertionen und Punktmutationen, Deletionen und Punktmutationen sowie doppelten Punktmutationen an drei endogenen genomischen Loci zeigt. Alle Editing-Ergebnisse spiegeln den Prozentsatz der gesamten Sequenzierungs-Werte wider, die den beabsichtigten Edit enthalten und keine Indels unter allen behandelten Zellen enthalten, ohne Sortierung. Die Werte und Fehlerbalken geben den Mittelwert und die Standardabweichung von drei unabhängigen biologischen Replikaten wieder.
42A-42H zeigen den Vergleich von Prime-Editing und Base-Editing sowie Off- Target-Editing durch Cas9 und PE3 an bekannten Cas9 Off-Target-Stellen. 42A zeigt die gesamte C-G-zu-T-A-Editing-Effizienz an denselben Zielnukleotiden für PE2, PE3, BE2max und BE4max an endogenen HEK3-, FANCF- und EMX1-Stellen in HEK293T-Zellen. 42B zeigt die Indel-Häufigkeit der Behandlungen in 42A. 42C zeigt die Editiereffizienz von präzisen C-G-zu-T-A-Edits (ohne Bystander-Edits oder Indels) für PE2, PE3, BE2max und BE4max bei HEK3, FANCF und EMX1. Für EMX1 sind auch die genauen PE-Kombinations-Edits aller möglichen Kombinationen der C-G-zu-T-A-Umwandlung an den drei Zielnukleotiden gezeigt. 42D zeigt die gesamte A-T-zu-G-C-Editierungseffizienz für PE2, PE3, ABEdmax und ABEmax bei HEK3 und FANCF. 42E zeigt die genaue A-T- zu-G-C-Editing-Effizienz ohne Bystander-Edits oder Indels für HEK3 und FANCF. 42F zeigt die Indel-Häufigkeit der Behandlungen in 42D. 42G zeigt die durchschnittliche Dreifach-Editier-Effizienz (Prozentsatz der Sequenzier-Werte mit Indels) in HEK293T-Zellen für Cas9-Nuklease an vier On-Target- und 16 bekannten Off-Target-Stellen. Bei den 16 untersuchten Off-Target-Stellen handelte es sich um die vier am häufigsten berichteten Off-Target-Stellen^118,159 für jede der vier On-Target-Stellen. Für jede On-Target- Stelle wurde Cas9 mit einer sgRNA oder mit jeder der vier pegRNAs gepaart, die denselben Protospacer erkennen. 42H zeigt die durchschnittlichen dreifachen On-Target- und Off- Target-Editing-Effizienzen und Indel-Effizienzen (unten in Klammern) in HEK293T-Zellen für PE2 oder PE3 gepaart mit jeder pegRNA in (42G). Die Ergebnisse des On-Target- Editing spiegeln den Prozentsatz der gesamten Sequenzierungs-Werte wider, die den beabsichtigten Edit enthalten und keine Indels unter allen behandelten Zellen aufweisen, ohne dass eine Sortierung erfolgt. Die Ergebnisse der Off-Target-Editierung spiegeln die Modifikation von Off-Target-Loci wider, die mit dem Prime-Editing übereinstimmen. Die Werte und Fehlerbalken geben den Mittelwert und die Standardabweichung von drei unabhängigen biologischen Replikaten wieder.
43A-43I zeigen das Prime Editing in verschiedenen menschlichen Zelllinien und primären kortikalen Neuronen der Maus, den Einbau und die Korrektur von pathogenen Transversions-, Insertions- oder Deletionsmutationen sowie den Vergleich von Prime Editing und HDR. 43A ist ein Diagramm, das die Installation (durch T-A-zu-A-T-Transversion) und Korrektur (durch A-T-zu-T-A-Transversion) der pathogenen E6V-Mutation in HBB in HEK293T-Zellen zeigt. Gezeigt wird die Korrektur entweder zu unmutierter HBB oder zu HBB mit einer stillen Mutation, die die pegRNA PAM unterbricht. 43B ist ein Diagramm, das die Installation (über 4-bp-Insertion) und Korrektur (über 4-bp-Deletion) des pathogenen HEXA 1278+TATC-Allels in HEK293T-Zellen zeigt. Gezeigt wird die Korrektur entweder zu unmutierter HEXA oder zu HEXA mit einer stillen Mutation, die die pegRNA PAM unterbricht. 43C ist ein Diagramm, das die Installation der schützenden G127V-Variante in PRNP in HEK293T-Zellen durch G-C-zu-T-A-Transversion zeigt. 43D ist ein Diagramm, das das Prime Editing in anderen menschlichen Zelllinien zeigt, darunter K562 (leukämische Knochenmarkzellen), U2OS (Osteosarkomzellen) und HeLa (Gebärmutterhalskrebszellen). 43E ist ein Diagramm, das die Installation einer G-C-zu- T-A-Transversionsmutation in DNMT1 von primären kortikalen Neuronen der Maus unter Verwendung eines dualen Split-Intein PE3-Lentivirus-Systems zeigt, bei dem die N-terminale Hälfte Cas9 (1-573) ist, das mit N-Intein und über ein P2A-Selbstspaltungspeptid mit GFP- KASH fusioniert ist, und die C-terminale Hälfte das C-Intein ist, das mit dem Rest von PE2 fusioniert ist. Die PE2-Hälften werden von einem humanen Synapsin-Promotor exprimiert, der hochspezifisch für reife Neuronen ist. Sortierte Werte spiegeln Editierungen oder Indels aus GFP-positiven Kernen wider, während unsortierte Werte aus allen Kernen stammen. 43F ist ein Vergleich der PE3- und Cas9-vermittelten HDR-Editing-Effizienz an endogenen genomischen Loci in HEK293T-Zellen. 43G ist ein Vergleich der PE3- und Cas9- vermittelten HDR-Editing-Effizienz an endogenen genomischen Loci in K562-, U2OS- und HeLa-Zellen. 43H ist ein Vergleich der PE3- und Cas9-vermittelten HDR Indel- Nebenproduktbildung in HEK293T, K562, U2OS und HeLa-Zellen. 43I zeigt die gezielte Insertion eines His6-Tags (18 bp), eines FLAG-Epitop-Tags (24 bp) oder einer erweiterten LoxP-Stelle (44 bp) in HEK293T-Zellen durch PE3. Alle Editierergebnisse spiegeln den Prozentsatz der gesamten Sequenzierungs-Werte wider, die den beabsichtigten Edit enthalten und keine Indels unter allen behandelten Zellen aufweisen. Die Werte und Fehlerbalken geben den Mittelwert und die Standardabweichung von drei unabhängigen biologischen Replikaten wieder.
44A-44G zeigen in vitro Prime Editing Validierungsstudien mit fluoreszierend markierten DNA-Substraten. 44A zeigt elektrophoretische Mobilitätsverschiebungstests mit dCas9, 5'-erweiterten pegRNAs und 5'-Cy5-markierten DNA-Substraten. Die pegRNAs 1 bis 5 enthalten eine 15-nt-Linkersequenz (Linker A für pegRNA 1, Linker B für pegRNAs 2 bis 5) zwischen dem Spacer und dem PBS, eine 5-nt-PBS-Sequenz und RT-Templates von 7 nt (pegRNAs 1 und 2), 8 nt (pegRNA 3), 15 nt (pegRNA 4) und 22 nt (pegRNA 5). Die pegRNAs sind diejenigen, die in 44E und 44F gezeigt werden; die vollständigen Sequenzen sind in den Tabellen 2A-2C aufgeführt. 44B zeigt in vitro Nicking-Assays von Cas9 H840A unter Verwendung von 5'-erweiterten und 3'-erweiterten pegRNAs. 44C zeigt die Cas9- vermittelte Indel-Bildung in HEK293T-Zellen bei HEK3 unter Verwendung von 5'-erweiterten und 3'-erweiterten pegRNAs. 44D zeigt einen Überblick über die biochemischen Assays für Prime Editing in vitro. Es wurden 5'-Cy5-markierte vorgekerbte und nicht-vergekerbte dsDNA-Substrate getestet. sgRNAs, 5'-erweiterte pegRNAs oder 3'-erweiterte pegRNAs wurden mit dCas9 oder Cas9 H840A-Nickase vorkomplexiert und dann mit dsDNA-Substrat, M-MLV RT und dNTPs kombiniert. Die Reaktionen wurden bei 37 °C für 1 Stunde laufen gelassen, bevor sie durch denaturierende Hamstoff-PAGE aufgetrennt und durch Cy5- Fluoreszenz sichtbar gemacht wurden. 44E zeigt, dass Primer-Erweiterungsreaktionen mit 5'-verlängerten pegRNAs, vorgekerbten DNA-Substraten und dCas9 zu einer signifikanten Umwandlung in RT-Produkte führen. 44F zeigt Primer-Erweiterungsreaktionen mit 5'erweiterten pegRNAs, wie in 44B, mit nicht-genicktem DNA-Substrat und Cas9 H840A- Nickase. Die Produktausbeute ist im Vergleich zu vorgekerbten Substraten stark reduziert. 44G zeigt, dass eine in vitro Primer-Erweiterungsreaktion unter Verwendung einer 3'pegRNA ein einzelnes scheinbares Produkt durch denaturierende Hamstoff-PAGE erzeugt. Die RT-Produktbande wurde herausgeschnitten, aus dem Gel eluiert und dann einem Homopolymer-Tailing mit terminaler Transferase (TdT) unter Verwendung von dGTP oder dATP unterzogen. Die Schwanzprodukte wurden mit poly-T- oder poly-C-Primern verlängert und die resultierende DNA wurde sequenziert. Die Sanger-Spuren zeigen, dass drei Nukleotide, die vom gRNA-Gerüst stammen, revers transkribiert wurden (als die letzten 3' Nukleotide zum DNA-Produkt hinzugefügt). Beachten Sie, dass in Experimenten zum Prime Editing in Säugetierzellen die Insertion von pegRNA-Gerüsten viel seltener ist als in vitro (56A-56D), was möglicherweise darauf zurückzuführen ist, dass die gebundene Reverse Transkriptase keinen Zugang zum Cas9-gebundenen Guide-RNA-Gerüst hat, und/oder auf die zelluläre Exzision von unpassenden 3'-Enden von 3'-Flaps, die pegRNA-Gerüstsequenzen enthalten.
45A-45G zeigen die zelluläre Reparatur in Hefe von 3' DNA-Flaps aus in vitro Prime-Editing-Reaktionen. 45A zeigt, dass duale Fluoreszenzprotein-Reporterplasmide offene Leserahmen von GFP und mCherry enthalten, die durch eine Zielstelle getrennt sind, die ein In-Frame-Stopcodon, einen +1 Frameshift oder einen -1 Frameshift kodiert. Prime- Editing-Reaktionen wurden in vitro mit Cas9 H840A-Nickase, pegRNA, dNTPs und M-MLV Reverse Transkriptase durchgeführt und dann in Hefe transformiert. Kolonien, die unbearbeitete Plasmide enthalten, produzieren GFP, aber kein mCherry. Hefekolonien mit editierten Plasmiden produzieren sowohl GFP als auch mCherry als Fusionsprotein. 45B zeigt eine Überlagerung der GFP- und mCherry-Fluoreszenz für Hefekolonien, die mit Reporterplasmiden transformiert wurden, die ein Stoppcodon zwischen GFP und mCherry enthalten (unbearbeitete Negativkontrolle, oben), oder die kein Stopcodon oder Frameshift zwischen GFP und mCherry enthalten (vorbearbeitete Positivkontrolle, unten). 45C-45F zeigen eine Visualisierung der mCherry- und GFP-Fluoreszenz von Hefekolonien, die mit in vitro Prime Editing Reaktionsprodukten transformiert wurden. 45C zeigt eine Stopcodon- Korrektur durch T-A-zu-A-T-Transversion unter Verwendung einer 3'-erweiterten pegRNA oder einer 5'-erweiterten pegRNA, wie gezeigt in 45D. 45E zeigt eine +1 Frameshift-Korrektur durch eine 1-bp-Deletion mit einer 3'-verlängerten pegRNA. 45F zeigt eine -1 Frameshift-Korrektur durch eine 1-bp-Insertion unter Verwendung einer 3'verlängerten pegRNA. 45G zeigt Sanger-DNA-Sequenzierungsspuren von Plasmiden, die aus reinen GFP-Kolonien isoliert wurden, in 45B, und GFP und mCherry doppeltpositive Kolonien in 45C.
46A-46F zeigen das korrekte Editieren gegenüber der Indel-Generierung mit PE1. 46A zeigt die T-A-zu-A-T-Transversions-Effizienz und die Indel-Generierung durch PE1 an der +1-Position von HEK3 unter Verwendung von pegRNAs mit 10-nt-RT-Templates und PBS-Sequenzen von 8-17 nt. 46B zeigt die Effizienz des Editierens von G-C-zu-T-A- Transversionen und die Erzeugung von Indel durch PE1 an der +5-Position von EMX1 unter Verwendung von pegRNAs, die 13-nt-RT-Templates und PBS-Sequenzen im Bereich von 9- 17 nt enthalten. 46C zeigt die Effizienz der G-C-zu-T-A-Transversion und der Indel- Generierung durch PE1 an der +5-Position von FANCF unter Verwendung von pegRNAs, die 17-nt-RT-Templates und PBS-Sequenzen von 8-17 nt enthalten. 46D zeigt die Effizienz der C-G-zu-A-T-Transversion und der Indel-Generierung durch PE1 an der +1-Position von RNF2 unter Verwendung von pegRNAs, die 11-nt-RT-Templates und PBS-Sequenzen von 9- 17 nt enthalten. 46E zeigt die Effizienz des Editierens von G-C-zu-T-A-Transversionen und die Erzeugung von Indel durch PE1 an der +2-Position von HEK4 unter Verwendung von pegRNAs, die 13-nt-RT-Templates und PBS-Sequenzen im Bereich von 7-15 nt enthalten. 46F zeigt die PE1-vermittelte +1 T-Deletion, +1 A-Insertion und +1 CTT-Insertion an der HEK3-Stelle unter Verwendung einer 13-nt PBS- und 10-nt RT-Template. Die Sequenzen der pegRNAs werden verwendet in 39C (siehe Tabellen 3A-3R). Die Werte und Fehlerbalken geben den Mittelwert und die Standardabweichung von drei unabhängigen biologischen Replikaten wieder.
47A-47S zeigen die Bewertung der M-MLV RT-Varianten für das Prime Editing. 47A zeigt die Abkürzungen für die in dieser FIGildung verwendeten Varianten des Prime Editors. 47B zeigt gezielte Insertions- und Deletions-Edits mit PE1 am HEK3-Locus. 47C-47H zeigen einen Vergleich von 18 Prime-Editor-Konstrukten, die M-MLV RT- Varianten enthalten, hinsichtlich ihrer Fähigkeit, einen +2 G-C-zu-C-G-Transversionsschnitt bei HEK3 zu installieren, wie dargestellt in 47C, eine 24-bp FLAG-Insertion in HEK3, gezeigt in 47D, eine +1 C-G-zu-A-T Transversion-Editierung bei RNF2, gezeigt in 47E, eine +1 G-C-zu-C-G Transversion-Editierung bei EMX1, gezeigt in 47F, eine +2 T-A-zu-A-T-Transversion-Editierung bei HBB, gezeigt in 47G, und eine +1 G-C-zu-C- G Transversion-Editierung bei FANCF, gezeigt in 47H. 47I-47N zeigen einen Vergleich von vier Prime-Editor-Konstrukten, die M-MLV-Varianten enthalten, hinsichtlich ihrer Fähigkeit, die Bearbeitungen zu integrieren, gezeigt in 47C-47H in einer zweiten Runde von unabhängigen Experimenten. 47O-47S zeigen die PE2-Editierungseffizienz an fünf genomischen Loci mit unterschiedlichen PBS-Längen. 47O zeigt eine +1 T-A- zu-A-T Variation bei HEK3. 47P zeigt eine +5 G-C-zu-T-A Variation bei EMX1. 47Q zeigt eine +5 G-C-zu-T-A Variation bei FANCF. 47R zeigt eine +1 C-G-zu-A-T Variation bei RNF2. 47S zeigt eine +2 G-C-zu-T-A Variation bei HEK4. Die Werte und Fehlerbalken geben den Mittelwert und die Standardabweichung von drei unabhängigen biologischen Replikaten wieder.
48A-48C zeigen die Design-Merkmale von pegRNA PBS und RT- Templatessequenzen. 48A zeigt die PE2-vermittelte +5 G-C-zu-T-A- Transversionseffizienz (blaue Linie) bei VEGFA in HEK293T-Zellen als Funktion der RT- Template-Länge. Indels (graue Linie) sind zum Vergleich eingezeichnet. Die Sequenz unter dem Diagramm zeigt das letzte Nukleotid, das für die Synthese durch die pegRNA als Vorlage dient. G-Nukleotide (mit einem C in der pegRNA) sind hervorgehoben. RT-Templates, die auf C enden, sollten beim pegRNA-Design vermieden werden, um die Effizienz des Prime Editing zu maximieren. 48B zeigt +5 G-C-zu-T-A-Transversionen und Indels für DNMT1 wie in 48A. 48C zeigt eine +5 G-C-zu-T-A-Transversion-Editierung und Indels für RUNX1, wie in 48A. Die Werte und Fehlerbalken geben den Mittelwert und die Standardabweichung von drei unabhängigen biologischen Replikaten wieder.
49A-49B zeigen die Auswirkungen von PE2, PE2 R110S K103L, Cas9 H840A Nickase und dCas9 auf die Lebensfähigkeit der Zellen. HEK293T-Zellen wurden mit Plasmiden transfiziert, die für PE2, PE2 R110S K103L, Cas9 H840A Nickase oder dCas9 kodieren, zusammen mit einem HEK3-targeting pegRNA-Plasmid. Die Lebensfähigkeit der Zellen wurde alle 24 Stunden nach der Transfektion für 3 Tage mit dem CellTiter-Glo 2.0 Assay (Promega) gemessen. 49A zeigt die Lebensfähigkeit, gemessen durch Lumineszenz, 1, 2 oder 3 Tage nach der Transfektion. Die Werte und Fehlerbalken geben den Mittelwert und die s.e.m. von drei unabhängigen biologischen Replikaten wieder, die jeweils in dreifacher technischer Ausführung durchgeführt wurden. 49B zeigt das prozentuale Editing und die Indels für PE2, PE2 R110S K103L, Cas9 H840A Nickase oder dCas9 zusammen mit einem HEK3-targeting pegRNA Plasmid, das für einen +5 G-zu-A Edit kodiert. Die Editing-Effizienz wurde am Tag 3 nach der Transfektion von Zellen gemessen, die parallel zu den Zellen behandelt wurden, die für die Bestimmung der Lebensfähigkeit in 49A. Die Werte und Fehlerbalken geben den Mittelwert und die Standardabweichung von drei unabhängigen biologischen Replikaten wieder.
50A-50B zeigen PE3-vermittelte HBB E6V Korrektur und HEXA 1278+TATC Korrektur durch verschiedene pegRNAs. 50A zeigt einen Screen von 14 pegRNAs zur Korrektur des HBB E6V-Allel in HEK293T-Zellen mit PE3. Alle evaluierten pegRNAs konvertieren das HBB E6V-Allele zurück in den unmutierten HBB, ohne dass eine stille PAM- Mutation eingeführt wird. 50B zeigt einen Screen von 41 pegRNAs zur Korrektur des HEXA 1278+TATC Allels in HEK293T Zellen mit PE3 oder PE3b. Diese pegRNAs mit der Bezeichnung HEXAs korrigieren das pathogene Allel durch eine verschobene 4-bp-Deletion, die das PAM unterbricht und eine stumme Mutation hinterlässt. Die mit HEXA gekennzeichneten pegRNAs korrigieren das pathogene Allel zurück zum unmutierten Status. Einträge, die mit „b“ enden, verwenden eine bearbeitungsspezifische Nicking-sgRNA in Kombination mit der pegRNA (das PE3b-System). Die Werte und Fehlerbalken geben den Mittelwert und die Standardabweichung von drei unabhängigen biologischen Replikaten wieder.
51A-51G zeigen eine PE3-Aktivität in menschlichen Zelllinien und einen Vergleich von PE3 und Cas9-initiierter HDR. Effizienz der Erzeugung des korrekten Schnitts (ohne Indels) und Indel-Häufigkeit für PE3 und Cas9-initiierte HDR in HEK293T-Zellen, gezeigt in 51A, K562-Zellen, gezeigt in 51B, U2OS-Zellen, gezeigt in 51C, und HeLa-Zellen, gezeigt in 51D. Jeder Vergleich der Bearbeitung in Klammern integriert identische Bearbeitungen mit PE3 und Cas9-initiiertem HDR. Nicht zielgerichtete Kontrollen sind PE3 und eine pegRNA, die auf einen nicht zielgerichteten Locus abzielt. 51E zeigt Kontrollexperimente mit nicht zielgerichteter pegRNA+PE3 und mit dCas9+sgRNA im Vergleich zu Experimenten mit unmutierter Cas9-HDR, die bestätigen, dass die ssDNA- Donor-HDR-Vorlage, eine häufige Verunreinigung, die die scheinbaren HDR-Effizienzen künstlich erhöht, nicht beiträgt zu den HDR-Messungen in 51A-51D. 51F-51G zeigen Beispiele für HEK3-Site-Allele aus genomischen DNA-Proben, die aus K562-Zellen nach dem Editing mit PE3 oder mit Cas9-initiierter HDR isoliert wurden. Die Allele wurden mit einem Illumina MiSeq sequenziert und mit CRISPResso2¹⁷⁸ analysiert. Die HEK3- Referenzsequenz aus dieser Region ist oben zu sehen. Die Allel-Tabellen sind für eine nicht zielgerichtete pegRNA-Negativkontrolle, eine +1 CTT-Insertion in HEK3 mit PE3 und eine +1 CTT-Insertion in HEK3 mit Cas9-initiierter HDR dargestellt. Für jedes Allel sind die Allelhäufigkeiten und die entsprechenden Illumina-Sequenzierungslesezahlen angegeben. Alle beobachteten Allele mit einer Häufigkeit ≥0,20 % werden gezeigt. Die Werte und Fehlerbalken geben den Mittelwert und die Standardabweichung von drei unabhängigen biologischen Replikaten wieder.
52A-52D zeigen die Verteilung nach Länge der pathogenen Insertionen, Duplikationen, Deletionen und Indels in der ClinVar-Datenbank. Die ClinVar Variantenzusammenfassung wurde am 15. Juli 2019 vom NCBI heruntergeladen. Die Längen der gemeldeten Insertionen, Deletionen und Duplikationen wurden anhand der Referenz- und alternativen Allele, der Start- und Stopp-Positionen der Varianten oder der entsprechenden Informationen im Variantennamen berechnet. Varianten, die keine der oben genannten Informationen enthielten, wurden von der Analyse ausgeschlossen. Die Längen der gemeldeten Indels (einzelne Varianten, die sowohl Insertionen als auch Deletionen im Vergleich zum Referenzgenom enthalten) wurden berechnet, indem die Anzahl der Mismatches oder Lücken im besten paarweisen Alignment zwischen dem Referenzgenom und den alternativen Allelen ermittelt wurde.
53A-53E zeigen FACS-Gating-Beispiele für die Sortierung von GFP-positiven Zellen. Nachfolgend finden Sie Beispiele für Original-Batch-Analysedateien, die die Sortierstrategie für die Erzeugung von HEXA 1278+TATC und HBB E6V HEK293T Zelllinien. Die Bilddaten wurden auf einem Sony LE-MA900 Zytometer mit der Cell Sorter Software v. 3.0.5 erstellt. Grafik 1 zeigt Gating-Plots für Zellen, die kein GFP exprimieren. Grafik 2 zeigt eine Beispielsorte von P2A-GFP-exprimierenden Zellen, die für die Isolierung der HBB E6V HEK293T Zelllinien verwendet werden. HEK293T-Zellen wurden zunächst mit FSC-A/BSC-A (Gate A) auf Population gated und dann mit FSC-A/FSC-H (Gate B) auf Singlets sortiert. Lebende Zellen wurden durch Gating von DAPI-negativen Zellen sortiert (Gate C). Zellen mit GFP-Fluoreszenzwerten, die über denen der Negativ-Kontrollzellen lagen, wurden unter Verwendung von EGFP als Fluorochrom sortiert (Gate D). 53A zeigt HEK293T-Zellen (GFP-negativ). 53B zeigt eine repräsentative Darstellung des FACS- Gatings für Zellen, die PE2-P2A-GFP exprimieren. 53C zeigt die Genotypen für HEXA 1278+TATC homozygote HEK293T Zellen. 53D-53E zeigen Alleltabellen für HBB E6V homozygote HEK293T Zelllinien.
54 ist ein Schema, das das pegRNA-Klonierungsverfahren zusammenfasst.
55A-55G sind schematische Darstellungen von pegRNA-Designs. 55A zeigt ein einfaches Diagramm der pegRNA mit beschrifteten Domänen (links) und an nCas9 gebunden an einer genomischen Stelle (rechts). 55B zeigt verschiedene Arten von Modifikationen an pegRNA, von denen man annimmt, dass sie die Aktivität erhöhen. 55C zeigt Modifikationen an pegRNA, um die Transkription längerer RNAs über die Wahl des Promotors und die 5', 3' Verarbeitung und Terminierung zu erhöhen. 55D zeigt die Erweiterung des P1-Systems, was ein Beispiel für eine Gerüstmodifikation ist. 55E zeigt, dass der Einbau von synthetischen Modifikationen innerhalb der Template-Region oder an anderer Stelle innerhalb der pegRNA die Aktivität erhöhen könnte. 55F zeigt, dass ein gezielter Einbau einer minimalen Sekundärstruktur in die Vorlage die Bildung einer längeren, hemmenden Sekundärstruktur verhindern könnte. 55G zeigt eine geteilte pegRNA mit einer zweiten Template-Sequenz, die durch ein RNA-Element am 3'-Ende der pegRNA verankert ist (links). Der Einbau von Elementen an den 5' oder 3' Enden der pegRNA könnte die RT-Bindung verstärken.
56A-56D zeigen den Einbau der pegRNA-Gerüstsequenz in die Zielloci. Die HTS-Daten wurden für die pegRNA-Gerüstsequenz-Insertion analysiert, wie gezeigt in 60A-60B. 56A zeigt eine Analyse für den EMX1-Locus. Dargestellt ist der prozentuale Anteil der gesamten Sequenzierungs-Werte, die ein oder mehrere pegRNA-Gerüstsequenz- Nukleotide innerhalb einer an die RT-Template angrenzenden Insertion enthalten (links); der prozentuale Anteil der gesamten Sequenzierungs-Werte, die eine pegRNA-Gerüstsequenz- Insertion der angegebenen Länge enthalten (Mitte); und der kumulative Gesamtprozentsatz der pegRNA-Insertion bis zur und einschließlich der auf der X-Achse angegebenen Länge. 56B zeigt das Gleiche wie 56A aber für FANCF. 56C zeigt das Gleiche wie in 56A aber für HEK3. 56D zeigt das Gleiche wie 56A aber für RNF2. Die Werte und Fehlerbalken geben den Mittelwert und die Standardabweichung von drei unabhängigen biologischen Replikaten wieder.
57A-57I zeigen die Auswirkungen von PE2, PE2-dRT und Cas9 H840A-Nickase auf die transkriptomweite RNA-Häufigkeit. Analyse der zellulären RNA, abgereichert an ribosomaler RNA, isoliert aus HEK293T-Zellen, die PE2, PE2-dRT oder Cas9 H840A- Nickase und eine PRNP- oder HEXA-targeting pegRNA exprimieren. RNAs, die 14.410 Genen und 14.368 Genen entsprechen, wurden in PRNP- bzw. HEXA-Proben nachgewiesen. 57A-57F zeigen ein Vulkandiagramm, das den -log10 FDR-bereinigten p-Wert im Vergleich zur log2-fachen Änderung der Transkriptionshäufigkeit für jede RNA anzeigt ( 57A) PE2 vs. PE2-dRT mit PRNP-gerichteter pegRNA, (57B) PE2 vs. Cas9 H840A mit PRNP-gerichteter pegRNA, (57C) PE2-dRT vs. Cas9 H840A mit PRNP-gerichteter pegRNA, (57D) PE2 vs. PE2-dRT mit HEXA-gerichteter pegRNA, (57E) PE2 vs. Cas9 H840A mit HEXA-gerichteter pegRNA, (57F) PE2-dRT vs. Cas9 H840A mit HEXA-gerichteter pegRNA. Rote Punkte kennzeichnen Gene, die eine ≥2fache Veränderung der relativen Häufigkeit aufweisen, die statistisch signifikant ist (FDR-bereinigter p< 0,05). 57G-57I sind Venn-Diagramme der hochregulierten und herunterregulierten Transkripte (≥2fache Veränderung) beim Vergleich von PRNP- und HEXA-Proben für (57G) PE2 vs. PE2-dRT, (57H) PE2 vs. Cas9 H840A und (571) PE2-dRT vs. Cas9 H840A. [0165] 58A-58B zeigen ein repräsentatives FACS-Gating für die Sortierung der neuronalen Kerne. Die Kerne wurden nacheinander auf der Grundlage des DyeCycle Ruby- Signals, des FSC/SSC-Verhältnisses, des SSC-Breiten/SSC-Höhen-Verhältnisses und des GFP/DyeCycle-Verhältnisses gated.
59A-59G zeigen das Protokoll für die Klonierung von 3'-verlängerten pegRNAs in U6-Expressionsvektoren von Säugetieren durch Golden-Gate-Assemblierung. 59A zeigt die Klonübersicht. 59B zeigt „Schritt 1: Digest pU6-pegRNA-GG-Vector Plasmid (Komponente 1)“. 59C zeigt „Schritte 2 und 3: Ordnen und Verbinden der Oligonukleotidteile (Komponenten 2, 3 und 4)“. 59D zeigt „Schritt 2.b.ii.: sgRNA Gerüstphosphorylierung (unnötig, wenn die Oligonukleotide phosphoryliert gekauft wurden)“. 59E zeigt „Schritt 4: Zusammenbau von pegRNA“. 59F zeigt „Schritte 5 und 6: Transformation von assemblierten Plasmiden“. 59G zeigt ein Diagramm, das das pegRNA-Klonierungsprotokoll zusammenfasst.
60A-60B zeigen das Python-Skript zur Quantifizierung der pegRNA- Gerüstintegration. Es wurde ein benutzerdefiniertes Python-Skript erstellt, um die pegRNA- Insertionen an den genomischen Zielloci zu charakterisieren und zu quantifizieren. Das Skript vergleicht iterativ Textstrings zunehmender Länge aus einer Referenzsequenz (Guide RNA Gerüstsequenz) mit den Sequenzierungs-Werte in fastq-Dateien und zählt die Anzahl der Sequenzierungs-Werte, die der Suchanfrage entsprechen. Jede nachfolgende Textzeichenfolge entspricht einem zusätzlichen Nukleotid der Gerüstsequenz der Guide-RNA. Auf diese Weise wurden exakte Längenintegrationen und kumulative Integrationen bis zu einer bestimmten Länge berechnet. Am Anfang der Referenzsequenz werden 5 bis 6 Basen des 3'-Endes des neuen, von der reversen Transkriptase synthetisierten DNA-Strangs eingeschlossen, um das Alignment und die genaue Zählung der kurzen Abschnitte der sgRNA sicherzustellen.
61 ist ein Diagramm, das den Prozentsatz der gesamten Sequenzierungs-Werte mit dem angegebenen Edit für SaCas9(N580A)-MMLV RT HEK3 +6 C>A zeigt. Es werden die Werte für die korrekten Bearbeitungen sowie die Indels angezeigt.
62A-62B zeigen die Bedeutung des Protospacers für die effiziente Installation eines gewünschten Schnitts an einer präzisen Stelle mit erstklassigem Schnitt. 62A ist ein Diagramm, das den Prozentsatz der gesamten Sequenzierungs-Werte mit in A-T umgewandelten T-A-Basenpaaren für verschiedene HEK3-Loci zeigt. 62B ist eine Sequenzanalyse, die das Gleiche zeigt.
63 ist ein Diagramm, das die SpCas9 PAM-Varianten bei der PAM-Bearbeitung zeigt (N=3). Der Prozentsatz der gesamten Sequenzierungs-Werte mit dem gezielten PAM- Edit ist für SpCas9(H840A)-VRQR-MMLV RT, wo NGA > NTA, und für SpCas9(H840A)- VRER-MMLV RT, wo NGCG > NTCG, dargestellt. Die Länge der pegRNA-Primer- Bindungsstelle (PBS), die Länge der RT-Template (RT) und das verwendete PE-System sind aufgeführt.
64A-64F zeigen ein Schema, das die Einführung verschiedener ortsspezifischer Rekombinase (SSR)-Ziele in das Genom mit Hilfe von PE darstellt. 64A zeigt ein allgemeines Schema für die Insertion einer Rekombinase-Zielsequenz durch einen Prime Editor. 64B zeigt, wie ein einzelnes SSR-Target, das durch PE eingefügt wurde, als Ort für die genomische Integration einer DNA-Donor-Vorlage verwendet werden kann. 64C zeigt, wie eine Tandem-Insertion von SSR-Zielstellen verwendet werden kann, um einen Teil des Genoms zu löschen. 64D zeigt, wie eine Tandem-Insertion von SSR-Zielstellen verwendet werden kann, um einen Teil des Genoms zu invertieren. 64E zeigt, wie die Insertion von zwei SSR-Zielstellen an zwei distalen chromosomalen Regionen zu einer chromosomalen Translokation führen kann. 64F zeigt, wie die Insertion von zwei verschiedenen SSR-Zielstellen in das Genom zum Austausch einer Kassette aus einer DNA- Donor-Vorlage verwendet werden kann.
65 zeigt 1) die PE-vermittelte Synthese einer SSR-Zielstelle in einem menschlichen Zellgenom und 2) die Verwendung dieser SSR-Zielstelle zur Integration einer DNA-Donor-Vorlage mit einem GFP-Expressionsmarker. Nach erfolgreicher Integration lässt das GFP die Zelle fluoreszieren.
66 zeigt eine Ausführungsform eines Prime Editors, der als zwei PE-Halbproteine bereitgestellt wird, die sich durch die Selbstspleißung der Split-Intein-Hälften, die sich am Ende oder am Anfang jedes der Prime-Editor-Halbproteine befinden, als ganzer Prime Editor regenerieren.
67A-67B zeigen den Mechanismus der Intein-Entfernung aus einer Polypeptidsequenz und die Neubildung einer Peptidbindung zwischen der N-terminalen und der C-terminalen Extein-Sequenz. 67A zeigt den allgemeinen Mechanismus zweier Halbproteine, die jeweils die Hälfte einer Intein-Sequenz enthalten. Wenn sie in einer Zelle miteinander in Kontakt kommen, entsteht ein voll funktionsfähiges Intein, das sich dann Selbst- Splicing und Exzision unterzieht. Der Prozess der Exzision führt zur Bildung einer Peptidbindung zwischen der N-terminalen Proteinhälfte (oder dem „N-Extein“) und der C- terminalen Proteinhälfte (oder dem „C-Extein“), um ein ganzes, einzelnes Polypeptid zu bilden, das den N-Extein- und den C-Extein-Teil umfasst. In verschiedenen Ausführungsformen kann das N-Extein der N-terminalen Hälfte eines Split Prime Editor Fusionsproteins entsprechen und das C-Extein der C-terminalen Hälfte eines gespaltenen Prime Editors, (b) zeigt einen chemischen Mechanismus der Intein-Exzision und die Neubildung einer Peptidbindung, die die N-Extein-Hälfte (die rot gefärbte Hälfte) und die C- Extein-Hälfte (die blau gefärbte Hälfte) verbindet. Die Exzision der gespaltenen Inteine (d. h. des N-Inteins und des C-Inteins in der gespaltenen Intein-Konfiguration) kann auch als „trans- Spleißung“ bezeichnet werden, da sie die Spleißaktion von zwei separaten Komponenten beinhaltet, sofern in trans.
68A beweist, dass die Verabreichung beider gespaltener Intein-Hälften von SpPE (SEQ-ID-Nummern: 3875, 3876) am Linker die Aktivität an drei Testloci aufrechterhält, wenn es in HEK293T-Zellen co-transfiziert wird.
68B beweist, dass die Verabreichung beider gespaltener Intein-Hälften von SaPE2 (z. B. SEQ-ID-NR.: 443 und SEQ-ID-NR.: 450) die Aktivität von SaPE2 in voller Länge (SEQ-ID-NR.: 134) bei der Co-Transfektion in HEK293T-Zellen rekapitulieren. Die in Anführungszeichen angegebenen Reste sind die Sequenz der Aminosäuren 741-743 in SaCas9 (erste Reste des C-terminalen Exteins), die für die Intein-Trans-Spleißreaktion wichtig sind. ‚SMP‘ sind die nativen Reste, die wir ebenfalls zur ‚CFN‘-Konsensus-Spleißsequenz mutiert haben. Es zeigt sich, dass die Konsenssequenz, gemessen am Prozentsatz des Prime-Editing, die höchste Rekonstitution ergibt.
68C liefert Daten, die zeigen, dass verschiedene offengelegte PE- Ribonukleoprotein-Komplexe (PE2 in hoher Konzentration, PE3 in hoher Konzentration und PE3 in niedriger Konzentration) auf diese Weise abgegeben werden können.
69 zeigt einen Bakteriophagen-Plaque-Assay zur Bestimmung der Wirksamkeit von PE bei PANCE. Plaques (dunkle Kreise) zeigen Phagen an, die E. Coli erfolgreich infizieren können. Eine steigende Konzentration von L-Rhamnose führt zu einer erhöhten Expression von PE und einer Zunahme der Plaquebildung. Die Sequenzierung der Plaques zeigte das Vorhandensein des PE-installierten genomischen Schnitts.
70A-70I liefern ein Beispiel für eine editierte Zielsequenz als Illustration einer Schritt-für-Schritt-Anleitung für das Design von pegRNAs und nicking-sgRNAs für das Prime Editing. 70A: Schritt 1. Zielsequenz und Editierung bestimmen. Rufen Sie die Sequenz der Ziel-DNA-Region (~200 bp) ab, die um die Stelle des gewünschten Schnitts (Punktmutation, Insertion, Deletion oder eine Kombination davon) zentriert ist. 70B: Schritt 2. Ziel-PAMs lokalisieren. Identifizieren Sie PAMs in der Nähe des Bearbeitungsortes. Achten Sie auf die PAMs auf beiden Strängen. Während PAMs in der Nähe der Editierposition bevorzugt werden, ist es möglich, Edits mit Protospacem und PAMs zu installieren, die den Nick ≥ 30 nt von der Editierposition platzieren. 70C: Schritt 3. Einkerbungen lokalisieren. Identifizieren Sie für jede in Frage kommende PAM die entsprechende Einkerbung. Bei der Nickase Sp Cas9 H840A erfolgt die Spaltung im PAM- haltigen Strang zwischen den 3. und 4. Basen 5' zur NGG PAM. Alle editierten Nukleotide müssen 3' von der Einkerbung entfernt sein, so dass geeignete PAMs den Nick 5' zum Zielschnitt auf dem PAM-haltigen Strang platzieren müssen. In dem unten gezeigten Beispiel gibt es zwei mögliche PAMs. Der Einfachheit halber werden die verbleibenden Schritte das Design einer pegRNA nur mit PAM 1 demonstrieren. 70D: Schritt 4. Spacer-Sequenz entwerfen. Der Protospacer von Sp Cas9 entspricht den 20 Nukleotiden 5' zum NGG PAM auf dem PAM-haltigen Strang. Für eine effiziente Pol III-Transkriptionsinitiierung muss ein G das erste transkribierte Nukleotid sein. Wenn das erste Nukleotid des Protospacers ein G ist, ist die Spacer-Sequenz für die pegRNA einfach die Protospacer-Sequenz. Wenn das erste Nukleotid des Protospacers nicht G ist, ist die Spacer-Sequenz der pegRNA G, gefolgt von der Protospacer-Sequenz. 70E: Schritt 5. Primer-Bindungsstelle (PBS) entwerfen. Identifizieren Sie anhand der Ausgangssequenz des Allels den DNA-Primer auf dem PAM- haltigen Strang. Das 3'-Ende des DNA-Primers ist das Nukleotid unmittelbar stromaufwärts der Einkerbung (d. h. die 4. Base 5' zur NGG PAM für Sp Cas9). Als allgemeines Designprinzip für die Verwendung mit PE2 und PE3 kann eine pegRNA-Primer- Bindungsstelle (PBS) mit 12 bis 13 Nukleotiden Komplementarität zum DNA-Primer für Sequenzen verwendet werden, die ~40-60 % GC-Gehalt enthalten. Für Sequenzen mit niedrigem GC-Gehalt sollten längere (14- bis 15-nt) PBSs getestet werden. Für Sequenzen mit höherem GC-Gehalt sollten kürzere (8- bis 11-nt) PBSs getestet werden. Optimale PBS- Sequenzen sollten unabhängig vom GC-Gehalt empirisch ermittelt werden. Um eine Länge -p PBS-Sequenz zu entwerfen, nehmen Sie das umgekehrte Komplement der ersten p Nukleotide 5' der Einkerbung im PAM-haltigen Strang unter Verwendung der anfänglichen Allelsequenz. 70F: Schritt 6. RT-Template entwerfen. Die RT-Template kodiert den geplanten Schnitt und die Homologie zu der Sequenz, die an den Schnitt angrenzt. Die optimale Länge der RT-Template hängt von der Zielstelle ab. Für Editierungen mit kurzer Reichweite (Positionen +1 bis +6) empfiehlt es sich, eine kurze (9 bis 12 nt), eine mittlere (13 bis 16 nt) und eine lange (17 bis 20 nt) RT-Template zu testen. Für weitreichende Schnitte (Positionen +7 und darüber hinaus) wird empfohlen, RT-Templates zu verwenden, die mindestens 5 nt (vorzugsweise 10 oder mehr nt) über die Position des Schnitts hinausreichen, um eine ausreichende 3'-DNA-Flap-Homologie zu gewährleisten. Für langfristige Bearbeitungen sollten mehrere RT-Templates geprüft werden, um funktionale Designs zu identifizieren. Für größere Insertionen und Deletionen (≥5 nt) wird empfohlen, eine größere 3'-Homologie (-20 nt oder mehr) in die RT-Template einzubauen. Die Effizienz des Editierens ist in der Regel beeinträchtigt, wenn die RT-Template für die Synthese eines G als letztes Nukleotid im revers transkribierten DNA-Produkt kodiert (entsprechend einem C in der RT-Template der pegRNA). Da viele RT-Templates ein effizientes Prime-Editing unterstützen, wird empfohlen, bei der Entwicklung von RT-Templates G als letztes synthetisiertes Nukleotid zu vermeiden. Zum Entwerfen einer Länge -r RT-Templatessequenz zu verwenden Sie die gewünschte Allelsequenz und nehmen Sie das umgekehrte Komplement der ersten r Nukleotide 3' der Einkerbung in dem Strang, der ursprünglich die PAM enthielt. Beachten Sie, dass im Vergleich zu SNP-Edits Insertions- oder Deletions-Edits mit RT-Templates gleicher Länge keine identische Homologie aufweisen. 70G: Schritt 7. Vollständige pegRNA-Sequenz zusammenstellen. Verketten Sie die pegRNA-Komponenten in der folgenden Reihenfolge (5' bis 3'): Spacer, Scaffold, RT-Template und PBS. 70H: Schritt 8. Nicking-sgRNAs für PE3 entwickeln. Identifizieren Sie PAMs auf dem nicht-editierten Strang stromaufwärts und stromabwärts des Schnitts. Optimale Einkerbungspositionen sind stark ortsabhängig und sollten empirisch ermittelt werden. Im Allgemeinen führen Einkerbungen, die 40 bis 90 Nukleotide 5' von der Position gegenüber dem pegRNA-induzierten Nick platziert sind, zu einer höheren Editierergebnissen und weniger Indels. Eine nicking sgRNA hat eine Spacer- Sequenz, die mit dem 20-nt-Protospacer im anfänglichen Allel übereinstimmt, mit dem Zusatz eines 5'-G, wenn der Protospacer nicht mit einem G beginnt. 70I: Schritt 9. PE3b nicking-sgRNAs entwickeln. Wenn ein PAM im komplementären Strang existiert und der entsprechende Protospacer sich mit der zu editierenden Sequenz überschneidet, könnte dieser Schnitt ein Kandidat für das PE3b-System sein. Beim PE3b-System stimmt die Spacer- Sequenz der nicking-sgRNA mit der Sequenz des gewünschten editierten Allels überein, aber nicht mit dem Ausgangsallel. Das PE3b-System arbeitet effizient, wenn das/die editierte(n) Nukleotid(e) innerhalb der Seed-Region (~10 nt neben der PAM) des Nicking-sgRNA- Protospacers liegt/liegen. Dadurch wird das Nicking des komplementären Strangs erst nach dem Einbau des editierten Strangs verhindert, wodurch die Konkurrenz zwischen der pegRNA und der sgRNA um die Bindung der Ziel-DNA unterbunden wird. PE3b vermeidet auch die Erzeugung gleichzeitiger Nicks auf beiden Strängen, wodurch die Indel-Bildung deutlich reduziert wird und gleichzeitig eine hohe Editing-Effizienz erhalten bleibt. PE3b sgRNAs sollten eine Spacer-Sequenz haben, die mit dem 20-nt-Protospacer im gewünschten Allel übereinstimmt, mit dem Zusatz eines 5' G, falls erforderlich.
71A zeigt die Nukleotidsequenz eines SpCas9 pegRNA-Moleküls (oben), das am 3'-Ende mit einem „UUU“ endet und kein Toeloop-Element enthält. Der untere Teil der FIGildung zeigt dasselbe SpCas9 pegRNA-Molekül, das jedoch so modifiziert ist, dass es ein Toeloop-Element mit der Sequenz 5'-„GAAANNNNN“-3' unmittelbar vor dem 3'-Ende „UUU“ enthält. Das „N“ kann eine beliebige Nukleobase sein.
71B zeigt, dass die Effizienz des Prime Editing in HEK-Zellen oder EMX-Zellen mit pegRNA, die Toeloop-Elemente enthält, erhöht wird, während der Prozentsatz der Indel- Bildung weitgehend unverändert bleibt.
72A-72C zeigen alternative pegRNA-Konfigurationen, die beim Prime Editing verwendet werden können. 72A zeigt die PE2:pegRNA-Variante des Prime Editing. Bei dieser Ausführungsform wird ein PE2 (ein Fusionsprotein, das ein Cas9 und eine reverse Transkriptase enthält) mit einer pegRNA komplexiert (wie auch in 1A-1I und/oder 3A-3E beschrieben). In dieser Ausführungsform wird die Vorlage für die reverse Transkription in einen 3'-Erweiterungsarm der sgRNA eingebaut, um die pegRNA herzustellen, und das DNA-Polymerase-Enzym ist eine direkt mit Cas9 fusionierte reverse Transkriptase (RT). 72B zeigen die MS2cp-PE2:sgRNA + tPERT-Variante. Diese Ausführungsform umfasst eine PE2-Fusion (Cas9 + eine reverse Transkriptase), die weiter mit dem MS2-Bakteriophagen- Hüllprotein (MS2cp) fusioniert ist, um das MS2cp-PE2-Fusionsprotein zu bilden. Um Prime Editing zu erreichen, wird das MS2cp-PE2-Fusionsprotein mit einer sgRNA komplexiert, die den Komplex auf eine bestimmte Zielstelle in der DNA ausrichtet. Die Ausführungsform beinhaltet dann die Einführung einer trans Prime Editing RNA-Vorlage („tPERT“), die anstelle einer pegRNA wirkt, indem sie eine Primer-Bindungsstelle (PBS) und eine DNA-Synthese- Template auf einem separaten Molekül bereitstellt, d. h. die tPERT, die auch mit einem MS2- Aptamer (Stammschleife) ausgestattet ist. Das MS2cp-Protein rekrutiert das tPERT durch Bindung an das MS2-Aptamer des Moleküls. 72C zeigen alternative Designs für pegRNAs, die durch bekannte Methoden zur chemischen Synthese von Nukleinsäuremolekülen erreicht werden können. Zum Beispiel kann durch chemische Synthese ein hybrides RNA/DNA pegRNA-Molekül für die Verwendung im Prime Editing synthetisiert werden, wobei der Erweiterungsarm der hybriden pegRNA aus DNA statt aus RNA besteht. In einer solchen Ausführungsform kann eine DNA-abhängige DNA- Polymerase anstelle einer reversen Transkriptase verwendet werden, um den 3'-DNA-Flap zu synthetisieren, der die gewünschte genetische Veränderung umfasst, die durch Prime Editing gebildet wird. In einer anderen Ausführungsform kann der Erweiterungsarm so synthetisiert werden, dass er einen chemischen Linker enthält, der die DNA-Polymerase (z. B. eine reverse Transkriptase) daran hindert, das sgRNA-Gerüst oder -Rückgrat als Vorlage zu verwenden. In einer weiteren Ausführungsform kann der Erweiterungsarm eine DNA-Synthese-Template umfassen, die in Bezug auf die Gesamtausrichtung des pegRNA-Moleküls die umgekehrte Orientierung aufweist. Wie zum Beispiel für eine pegRNA in der 5'-zu-3'-Ausrichtung und mit einer Erweiterung, die an das 3'-Ende des sgRNA-Gerüsts angehängt ist, wird die DNA- Synthese-Template in der entgegengesetzten Richtung, d. h. in der 3'-zu-5'-Richtung, ausgerichtet. Diese Ausführungsform kann für pegRNA-Varianten mit Erweiterungsarmen am 3'-Ende einer gRNA von Vorteil sein. Durch die Umkehrung der Ausrichtung des Erweiterungsarms wird die DNA-Synthese durch die Polymerase (z. B. die reverse Transkriptase) beendet, sobald sie die neu ausgerichteten 5' des Erweiterungsarms erreicht, so dass der gRNA-Kern nicht als Vorlage verwendet werden kann.
73 demonstriert das Prime Editing mit tPERTs und dem MS2- Rekrutierungssystem (auch bekannt als MS2-Tagging-Technik). Eine sgRNA, die das Prime- Editor-Protein (PE2) auf den Ziellocus ausrichtet, wird in Kombination mit einem tPERT exprimiert, das eine Primer-Bindungsstelle (ein 13-nt- oder 17-nt-PBS), eine RT-Template, die eine His6-Tag-Insertion und einen Homologiearm kodiert, und ein MS2-Aptamer (am 5'- oder 3'-Ende des tPERT-Moleküls) enthält. Es wurde entweder das Prime-Editor-Protein (PE2) oder eine Fusion des MS2cp mit dem N-Terminus von PE2 verwendet. Die Editierung wurde mit oder ohne eine komplementäre Strang-Nicking-sgRNA durchgeführt, wie bei dem zuvor entwickelten PE3-System (in der x-Achse als „PE2+nick“ bzw. „PE2“ bezeichnet). Dies wird hier auch als „second-strand nicking“ bezeichnet und definiert
74 zeigt, dass die MS2-Aptamer-Expression der reversen Transkriptase in trans und ihre Rekrutierung mit dem MS2-Aptamer-System. Die pegRNApegRNA enthält das MS2 RNA-Aptamer, das in eines von zwei sgRNA-Gerüst-Hairpins eingefügt ist. Die unmutierte M-MLV Reverse Transkriptase wird als N-terminale oder C-terminale Fusion mit dem MS2- Hüllprotein (MCP) exprimiert. Die Editierung erfolgt an der HEK3-Stelle in HEK293T-Zellen.
75 zeigt ein Balkendiagramm, in dem die Effizienz (d. h. „% der gesamten Sequenzierungs-Reads mit dem angegebenen Edit oder Indels“) von PE2, PE2-Trunc, PE3 und PE3-Trunc über verschiedene Zielstellen in verschiedenen Zelllinien verglichen wird. Die Daten zeigen, dass die Prime-Editoren, die die verkürzten RT-Varianten enthielten, etwa genauso effizient waren wie die Prime-Editoren, die die nicht verkürzten RT-Proteine enthielten.
76 demonstriert die Effizienz der Bearbeitung von intein-gesplitteten Prime Editors. HEK239T-Zellen wurden mit Plasmiden transfiziert, die für PE2 in voller Länge oder intein-gesplittetes PE2, pegRNA und Nicking-Guide-RNA kodieren. Die Konsenssequenz (die meisten aminoterminalen Reste des C-terminalen Exteins) sind angegeben. Die prozentuale Bearbeitung an zwei Standorten wird gezeigt: HEK3 +1 CTT-Insertion und PRNP +6 G zu T. Replikat n=3 unabhängige Transfektionen.
77 demonstriert die Effizienz der Bearbeitung von intein-gesplitteten Prime Editors. Das Editing wurde durch gezieltes Deep Sequencing im Bulk-Cortex und in der GFP+ Subpopulation nach der Verabreichung von 5E10vg pro SpPE3-Hälfte und einer kleinen Menge 1E10 von nukleär lokalisiertem GFP:KASH an P0-Mäuse durch ICV-Injektion bewertet. Editoren und GFP wurden in AAV9 mit EFS-Promotor verpackt. Die Mäuse wurden drei Wochen nach der Injektion geerntet und die GFP+ Kerne wurden mittels Durchflusszytometrie isoliert. Es werden einzelne Datenpunkte gezeigt, wobei 1-2 Mäuse pro Bedingung analysiert werden.
78 demonstriert die Effizienz der Bearbeitung von intein-gesplitteten Prime Editors. Die FIGildungen zeigen insbesondere AAV Split-SpPE3 Konstrukte. Die Co- Transduktion durch AAV-Partikel, die SpPE3-N und SpPE3-C getrennt exprimieren, rekapituliert die PE3-Aktivität. Anmerkung: Das N-terminale Genom enthält eine U6-sgRNA- Kassette, die die nicking sgRNA exprimiert, und das C-terminale Genom enthält eine U6- pegRNA-Kassette, die die pegRNA exprimiert.
79 zeigt die Effizienz der Bearbeitung bestimmter optimierter Linker. Die Daten zeigen insbesondere die Editing-Effizienz des PE2-Konstrukts mit dem aktuellen Linker (vermerkt als PE2 - weißer Kasten) im Vergleich zu verschiedenen Versionen, bei denen der Linker durch eine Sequenz ersetzt wurde, wie an den HEK3-, EMX1-, FANCF- und RNF2- Loci für repräsentative pegRNAs für Transition, Transversion, Insertion und Deletion Edits angegeben. Die Ersatzlinker werden als „1x SGGS“ bezeichnet (SEQ-ID-NR.: 174), „2x SGGS“ (SEQ-ID-NR.: 446), „3x SGGS“ (SEQ-ID-NR.: 3889), „1x XTEN“ (SEQ-ID-NR.: 171), „kein Linker“, „1x Gly“, „1x Pro“, „1x EAAAK“ (SEQ-ID-NR.: 3968), „2x EAAAK“ (SEQ-ID-NR.: 3969) und „3x EAAAK" (SEQ-ID-NR.: 3970). Die Bearbeitungseffizienz wird in Form eines Balkendiagramms relativ zur „Kontroll“-Bearbeitungseffizienz von PE2 gemessen. Der Linker von PE2 ist SGGSSGGSSGSETPGTSESATPESSGGSSGGSS (SEQ- ID-NR.: 127). Das gesamte Editing erfolgte im Kontext des PE3-Systems, d. h. mit dem PE2- Editing-Konstrukt und dem Zusatz der optimalen sekundären sgRNA-Nicking-Guide.
[0190] 80. Nimmt man die durchschnittliche Fold-Effizienz im Vergleich zu PE2, ergibt sich das gezeigte Diagramm, das darauf hinweist, dass die Verwendung einer 1x XTEN (SEQ ID NR.: 171) Linker-Sequenz die Editier-Effizienz im Durchschnitt um das 1,14-fache (n=15) verbessert.
81 zeigt das Transkriptionsniveau der pegRNAs von verschiedenen Promotoren.
82 zeigt die Auswirkung verschiedener Arten von Modifikationen der pegRNA- Struktur auf die Editing-Effizienz im Vergleich zu unmodifizierter pegRNA.
83 zeigt ein PE-Experiment, bei dem das HEK3-Gen gezielt editiert wurde, und zwar durch Einfügen einer 10-nt-Insertion an Position +1 relativ zur Einstichstelle und unter Verwendung von PE3.
84A zeigt eine beispielhafte pegRNA mit einem Spacer, einem gRNA-Kern und einem Erweiterungsarm (RT-Template + Primer-Bindungsstelle), der am 3'-Ende der pegRNA mit einem tRNA-Molekül modifiziert und über einen UCU-Linker gekoppelt ist. Die tRNA enthält verschiedene post-transkriptionelle Modifikationen. Diese Änderungen sind jedoch nicht erforderlich.
84B zeigt die Struktur der tRNA, die zur Veränderung der pegRNA-Strukturen verwendet werden kann. Der P1 kann in der Länge variabel sein. Das P1 kann verlängert werden, um die RNAseP-Prozessierung der pegRNA-tRNA-Fusion zu verhindern.
85 zeigt ein PE-Experiment, das auf das Editing des FANCF-Gens abzielt, und zwar durch eine G-zu-T-Konvertierung an Position +5 relativ zur Einkerbung und unter Verwendung des PE3-Konstrukts.
86 zeigt ein PE-Experiment, bei dem das HEK3-Gen gezielt editiert wurde, und zwar durch die Insertion einer 71 nt FLAG-Tag-Insertion an Position +1 relativ zur Einkerbung und unter Verwendung des PE3-Konstrukts.
87 zeigt die Ergebnisse aus einem Screening in N2A-Zellen, bei dem die pegRNA 1412Adel installiert, mit Angaben zur Länge der Primer-Bindungsstelle (PBS) und der Länge der Reversen Transkriptase (RT)-Matrize. (Gezeigt mit und ohne Indels).
88 zeigt die Ergebnisse aus einem Screening in N2A-Zellen, bei dem die pegRNA 1412Adel installiert, mit Angaben zur Länge der Primer-Bindungsstelle (PBS) und der Länge der Reversen Transkriptase (RT)-Matrize. (Gezeigt mit und ohne Indels).
89 zeigt die Ergebnisse des Editierens an einem Proxy-Locus im β-Globin-Gen und an HEK3 in gesunden HSCs, wobei die Konzentration des Editors an pegRNA und nicking gRNA variiert wurde.
90 zeigt eine schematische Darstellung einer Ausführungsform der Dual-Flap- Prime-Editing. Eine DNA-Zielsequenz wird von zwei Prime-Editing-Komplexen (geführt von pegRNA-A und pegRNA-B) bearbeitet. Die beiden pegRNAs zielen auf entgegengesetzte Stränge der Doppelhelix ab. Jeder Prime Editor (pE2·pegRNA) nickt einen einzelnen DNA- Strang und synthetisiert dann einen 3'-DNA-Flap unter Verwendung der pegRNA als Matrize. Die Wirkung der beiden Prime-Editor-Komplexe führt zur Produktion eines Zwischenprodukts, das zwei 3'-Flaps auf gegenüberliegenden Strängen der DNA enthält. Die beiden 3'-Flaps sind an ihren 3'-Enden komplementär zueinander. Das Annealing der 3'-Enden der 3'-Flaps führt zur Bildung einer Doppel-Duplex-Struktur, wobei ein Duplex aus gepaarten 3'-Flaps die neue DNA-Sequenz (rot) und der andere Duplex aus gepaarten 5'-Flaps die ursprüngliche DNA-Sequenz (schwarz) enthält. Die Exzision des dazwischen liegenden ursprünglichen DNA-Duplexes (schwarze gepaarte 5'-Flaps) führt zu einer doppelt eingekerbten DNA-Spezies, die die gewünschte neue DNA-Sequenz (rot) enthält, welche die ursprüngliche DNA-Sequenz ersetzt hat. Die Ligation der beiden Nicks schließt den Bearbeitungsprozess ab.
91A-91B zeigen die Ergebnisse aus Beispiel 7. 91A zeigt die Crispresso2- Ausgangstabelle (ausgerichtet auf das gewünschte Produkt) für den Ersatz einer 90-bp- Sequenz durch eine neue 22-bp-Sequenz an der HEK3-Stelle in HEK293T-Zellen unter Verwendung von Dual-Prime-Editoren. Das gewünschte Produkt macht mehr als 80 % der Sequenzierungs-Werte aus. Das Referenzausgangsallel ist zum Vergleich über den sequenzierten Allelen dargestellt. 91B zeigt die Sequenzen der pegRNAs, die verwendet werden, um die in 91A gezeigte Sequenzersetzung zu erreichen. pegRNA1 und pegRNA 2 zielen auf unterschiedliche Stränge der DNA-Doppelhelix ab und erzeugen 5'-versetzte Kerben, wie in 90 gezeigt.
92 zeigt Ausführungsformen von pegRNA-Entwürfen für das Dual-Flap-Prime- Editing. Für das Dual-Flap Prime Editing werden zwei pegRNAs verwendet, die in der Zeichnung als pegRNA A und pegRNA B dargestellt sind. Jede pegRNA enthält eine Spacer- Sequenz (dunkelblau), die den Prime-Editing-Komplex zur Ziel-DNA-Stelle führt. Die beiden pegRNAs zielen auf entgegengesetzte Stränge der DNA-Doppelhelix ab. Wie andere pegRNAs enthalten dual-flap Prime Editing pegRNAs eine 3'-Erweiterung mit einer Primer- Bindungssequenz (PBS, grün), die sich an den eingekerbten genomischen DNA-Strang anlagert, um die reverse Transkription einzuleiten, sowie eine Vorlage für die reverse Transkription (RT-Template, hellblau), die die Synthese neuer DNA durch das Enzym Reverse Transkriptase vorgibt. Im Gegensatz zu pegRNAs, die für das klassische Prime-Editing verwendet werden und bei denen der neu synthetisierte editierte 3'-Flap benötigt wird, um mit dem endogenen 5'-Flap zu konkurrieren, ist es nicht erforderlich, die Homologie zur Zielstelle innerhalb der RT-Template zu kodieren. Stattdessen müssen die 3'-Enden der beiden synthetisierten 3'-Flaps nur Komplementarität zueinander aufweisen (d. h. die 3'-Enden der 3'- Flaps sind die umgekehrten Komplementsequenzen des jeweils anderen). Diese Komplementarität ermöglicht es den beiden 3'-Flaps, sich zu verbinden und die Bildung der gewünschten editierten DNA-Sequenz zu fördern.
93A-93B zeigen die Ergebnisse von Beispiel 7, in dem die Bxb1 attB- und attP- Stellen mit Dual-Flap-Prime-Editing installiert wurden. 93A zeigt die Installation einer 38-bp Bxb1 attB-Stelle in HEK3. Es wurden sechs pegRNAs konstruiert, drei für den (+) Strang (A1, A2 und A3) und drei für den (-) Strang (B1, B2 und B3). Diese unterscheiden sich in der Menge der in der RT-Template kodierten attB-Sequenz, was zu einer unterschiedlichen Anzahl komplementärer Nukleotide zwischen den beiden Flaps führt. Die 3x3-Matrix der pegRNAs wurde auf den Einbau der attB-Sequenz an der genomischen Zielposition in HEK293T-Zellen untersucht. 93A und 93B zeigen den Einbau einer 50-bp Bxb1 attP-Stelle in HEK3. Es wurden sechs pegRNAs konstruiert, drei für den (+) Strang (A1, A2 und A3) und drei für den (-) Strang (B1, B2 und B3). Diese unterscheiden sich in der Menge der in der RT-Template kodierten attP-Sequenz, was zu einer unterschiedlichen Anzahl komplementärer Nukleotide zwischen den beiden Flaps führt. Die 3x3-Matrix der pegRNAs wurde auf den Einbau der attP-Sequenz an der genomischen Zielposition in HEK293T-Zellen untersucht. Für beide Bearbeitungen in 93A und 93B erfolgt der Einbau der attB- oder attP-Stelle bei gleichzeitiger Deletion der 90 bp der genomischen DNA-Sequenz zwischen den beiden Einkerbungen.
94 zeigt die Ergebnisse der Installation von Bxb1 attB- und attP-Stellen an menschlichen Safe-Harbor-Loci mit Dual-Flap Prime Editing. Installation von Bxb1 attP- Stellen am AAVS1-Locus (links) oder Bxb1 attB-Stellen am CCRS-Locus (rechts) in HEK293T-Zellen. Korrekte Bearbeitungen sind in blau (AAVS1) und rot (CCRS) dargestellt, während Indel-Nebenprodukte in grau gezeigt werden.
95 zeigt ein Schema der genomischen Sequenzinversion mit Quadruple-Flap Prime Editing. Eine Region der genomischen DNA ist für die Inversion vorgesehen (grünes und oranges Segment). Vier pegRNAs werden mit dem PE2 Prime Editor an die Zellen geliefert. Ein Paar pegRNAs zielt auf einen einzelnen genomischen DNA-Strang und dient als Vorlage für die Synthese von zwei komplementären DNA-Flaps (A und A', blau), während das zweite Paar auf den anderen genomischen DNA-Strang zielt und als Vorlage für die Synthese von zwei komplementären DNA-Flaps mit einer orthogonalen DNA-Sequenz dient (B und B', rosa). Die komplementären Flaps annealen, um 3'-Überhang-Duplexe zu bilden. Die 5'- Überhang-Duplexe werden von körpereigenen zellulären Reparaturenzymen abgeschnitten. Nicks werden ligiert, um das Produktallel zu erzeugen, das eine invertierte DNA-Sequenz (grüne und orangefarbene Segmente) und die pegRNA-templierten Sequenzen an den Inversionskreuzungen (blaue und rosa Segmente) enthält.
96 zeigt die Ergebnisse der Amplikon-Sequenzierung von AAVS1- Inversionskreuzungen. Ergebnis der CRISPResso2-Analyse einer 2,7-kb-Inversion am AAVS1-Locus in HEK293T-Zellen unter Verwendung der Quadruple-Flap Primed-Editing- Strategie. Die PCR-Amplifikation und Sequenzierung der erwarteten Inversionskreuzungen ergab die gewünschten Produkte mit Bxb1 attP- oder attB-Sequenzen an den Kreuzungen der Inversion.
97A-97B zeigen die Ergebnisse der gezielten Integration eines zirkulären DNA- Plasmids in das Genom durch Quadruple-Flap-Prime-Editing. (97A) Eine Region der genomischen DNA und eine Region der Plasmid-DNA werden für die Integration des Quadruple Flap Prime Editing ausgewählt. Vier pegRNAs werden mit dem PE2 Prime Editor an die Zellen geliefert. Zwei pegRNAs sind Vorlagen für komplementäre Sequenzen, von denen eine auf einen einzelnen genomischen DNA-Strang und die andere auf einen einzelnen Plasmid-DNA-Strang abzielt (wodurch blaue Flaps entstehen). Die beiden anderen pegRNAs zielen auf entgegengesetzte genomische DNA- und Plasmid-DNA-Stränge als die der ersten beiden pegRNAs ab und templieren die Synthese von zwei komplementären DNA-Flaps (rosa), die orthogonal zum ersten Paar sind. Die komplementären Flaps annealen, um 3'-Überhang- Duplexe zu bilden. Die 5'-Überhang-Duplexe werden von körpereigenen zellulären Reparaturenzymen abgeschnitten. Die Nicks werden ligiert, um das Produktallel zu erzeugen, das eine integrierte Plasmid-DNA-Sequenz (grüne und orangefarbene Segmente) und die pegRNA-templierten Sequenzen an den Integrationsschnittstellen (blaue und rosa Segmente) enthält. (97B) CRISPResso2-Analyse der Amplikon-Sequenzierung der erwarteten Kreuzung, die das Plasmid-Rückgrat und die genomische DNA-Sequenz zeigt, die durch die pegRNA-templierte attP-Sequenz überbrückt werden.
98A-98B zeigen die Ergebnisse einer gezielten chromosomalen Translokation mit Quadruple-Flap Prime Editing. (98A) pegRNAs zielen auf zwei Regionen auf verschiedenen Chromosomen ab. Komplementäre 3'-DNA-Flaps überbrücken die beiden Chromosomensequenzen und steuern die Ausrichtung der Translokation. (98B) Gezielte Translokation zwischen MYC- und TIMM44-Loci in HEK239T-Zellen. CRISPResso2- Analyse der Ergebnisse der Amplikon-Sequenzierung der erwarteten Kreuzungen aus der Translokation zwischen dem MYC-Locus auf Chromosom 8 und dem TIMM44-Locus auf Chromosom 19. Die Mehrheit der Sequenzierungs-Werte entspricht der gewünschten Allelsequenz.
99 zeigt die Installation von Bxb1 attB- und attP-Stellen mit Dual-Flap-Prime- Editing am IDS-Locus. HEK293T-Zellen wurden mit PE2 und verschiedenen Paaren von pegRNAs transfiziert (z. B. in der ersten Spalte pegRNA A1_a und pegRNA B2_a mit Vorlagen für die Installation der attP-Stelle in Vorwärtsrichtung). Die Effizienz wurde mittels HTS gemessen. Diese Daten zeigen, dass das Dual-Flap-Editing die gewünschte Sequenz mit einer Effizienz von bis zu 80 % erfolgreich in den IDS-Locus einfügen kann.
100A-100B beschreiben die Dual-Flap-vermittelte Duplikation. 100A ist eine schematische Darstellung der Dual-Flap-vermittelten Duplikation am AAVS1-Locus in 293T-Zellen. 100B zeigt die Ergebnisse der Verwendung von Dual-Flap pegRNA mit PE2 zur Induktion der Duplikation von genetischen Sequenzen bei AAVS1.
101 zeigt eine durch mehrere Flaps induzierte neue Translokation MYC-CCR5. Die MYC-CCR5-Translokation wurde durch Quad-Flap pegRNAs und PE2 induziert. MYC- CCR5-Translokationsereignisse wurden durch Quadrupel-pegRNAs induziert. Vier verschiedene Sätze von pegRNAs wurden in HEK293T-Zellen getestet. Die Translokations- Kreuzungsprodukte zwischen den abgeleiteten chr8 und chr3 wurden durch Kreuzungsprimer amplifiziert. Der Prozentsatz der Werte, die den erwarteten Kreuzungsallelen zugeordnet sind, wird im Diagramm angezeigt. Das Ergebnis zeigt, dass Quadruple-Flap die Translokation des MYC- und CCRS-Gens mit einer Produktreinheit von nahezu 100 % am Knotenpunkt 1 und ~50 % am Knotenpunkt 2 vermitteln kann. Ein repräsentativer Allelplot zeigt die Sequenzen, die an den erwarteten Allelsequenzen am Knotenpunkt 1 ausgerichtet sind.
102A-102B zeigen Dual-Flap- und Multi-Flap-Editing in anderen menschlichen Zelllinien. 102A zeigt Dual-Flap-Editing in vier verschiedenen menschlichen Zelllinien. HEK293T- und HeLa-Zellen wurden mit dualen pegRNAs und PE2 zur Bearbeitung von drei verschiedenen genomischen Loci (IDS, MYC und TIMM44) transfiziert. U2OS- und K562- Zellen wurden mit denselben Komponenten nukleofiziert. Dual-Flap hat sich in allen vier menschlichen Zellen an den Zielloci als robustes Editing erwiesen, insbesondere in HEK293T- und K562-Zellen. Die zellulären Mechanismen, die das Dual-Flap-Editing ermöglichen, sind in vielen menschlichen Zelltypen konserviert. 102B zeigt eine Multi-Flap (QuadruplepegRNA) gerichtete 2,7 kb Inversion an der AAVS1 in HeLa-Zellen.
103A-103B zeigt die Ergebnisse der Messung der Inversionseffizienz durch HTS am CCRS-Locus. Der Prozentsatz des erwarteten Inversions-Edit-Allels wurde mittels HTS gemessen. Vier quad-pegRNA-Sets PE2 wurden jeweils in HEK293T-Zellen transfiziert. 103A zeigt eine Dual-Flap-vermittelte Sequenzduplikation (-100 nt) am CCRS-Locus in HEK293T-Zellen. Die Editing-Effizienz erreicht -1,5 % über die HTS 300-Zyklus-Paar-End- Sequenzierungsanalyse. 103B zeigt eine Quadruple-Flap-vermittelte Sequenzinversion (-95-117 nt) am CCRS-Locus in HeLa-Zellen. Die Editing-Effizienz erreicht ~1,2 % über die HTS 300-Zyklus-Paar-End-Sequenzierungsanalyse. Dieses Ergebnis zeigt, dass Multi-Flap die Duplikation und Inversion am CCRS-Locus erfolgreich und präzise vermitteln kann. Die Bearbeitungsspezifität ist hoch, wenn die Zielsequenz dupliziert ist (Prozentsatz der Indels< 2 %).
104A-104E zeigen einen gezielten zellulären Reparaturpfad für das Dual-Flap- Editing. In 104A-104D wurden HEK293T-Zellen mit den Plasmiden transfiziert, die Exo1, Fen1, Red Fluorescence Protein (Kontrolle), DNA2, Mlh1 neg und P53 Inhibitor mit pegRNA und PE2 exprimieren. Die Effizienz der Bearbeitung wurde mit HTS gemessen. Die Effizienz der Bearbeitung wurde zwischen dem Kandidaten und der RFP-Kontrolle verglichen. In 104E wurden HEK293T-Zellen mit den siRNA-Plasmiden und pegRNA und PE2 für jeden Ziellocus transfiziert. Nicht zielgerichtete siRNA (siNT) wurde als Kontrolle verwendet. Die Effizienz der Bearbeitung wurde mit HTS gemessen. Die Editing-Effizienz wurde zwischen jeder siRNA-Knockdown und dem siNT ctrl an jedem Ziellocus verglichen. HEK293T-Zellen wurden mit Dual-PegRNAs, PE2 und den Plasmiden transfiziert, die Exo1, Fen1, Red Fluorescence Protein (ctrl), DNA2, Mlh1 neg bzw. P53-Inhibitor exprimieren. Die Effizienz der Bearbeitung wurde mit HTS gemessen. Die Effizienz der Bearbeitung wurde zwischen dem Kandidaten und dem RFP ctrl verglichen. Ein zweiseitiger, gepaarter Student t- Test wurde verwendet, um den statistischen Unterschied zwischen jeder Behandlung und der RFP-Kontrolle zu messen (P< 0,05, *; P< 0,01, **; P< 0,001, ***). Die Überexpression von FEN1 verbessert die Effizienz des Dual-Flap-Editing in allen vier Zielorten (MYC, TIMM44, IDS, CCR5).
105A-105B zeigen eine Dual-Flap-vermittelte Sequenzverdopplung am AAVS1- Locus. 105A zeigt ein schematisches Diagramm der Dual-Flap-vermittelten Sequenzduplikation im AAVS1-Locus. 105B zeigt, dass durch die Verwendung von dualen pegRNAs, die zwei einzigartige 3'-Flap-Strukturen erzeugen, eine -300 bp Sequenzduplikation am AAVS1-Locus in 293T-Zellen induziert wurde. Die erwarteten Allele werden mit spezifischen Primern amplifiziert und einem HTS unterzogen. -94 % der Werte werden an den erwarteten Allelen mit Duplikation ausgerichtet. In den unbehandelten Proben werden keine Duplikationsprodukte beobachtet.
106 zeigt eine gezielte IDS-Genomsequenzinversion mit Quadruple-Flap Prime Editing. Bei ~13 % der Patienten mit Hunter-Syndrom wurde eine Inversion der IDS- Gensequenzen nachgewiesen (Bondeson et al., Human Molecular Genetics, 1995). Das Quadruple-Flap Prime Editing wurde angewandt, um diese pathogene Inversion der -40 kb IDS-Genomsequenz in HEK293T-Zellen zu induzieren. Sechs Sätze von Quadruple-pegRNAs wurden getestet, indem HEK293T-Zellen mit den pegRNAs und PE2 transfiziert wurden. Es wurden Primer verwendet, die spezifisch die invertierten Sequenzen an der Kreuzung „ab“ und der Kreuzung „cd“ amplifizieren. -95 % der erwarteten invertierten Allelsequenzen wurden an beiden Kreuzungen mit IDS_QF1 beobachtet. Andere Sätze von pegRNAs liefern ebenfalls einen hohen Prozentsatz der erwarteten Allelsequenzen an beiden Kreuzungen. In den unbehandelten Proben werden keine invertierten Verbindungsprodukte beobachtet.
107 zeigt, dass die Modifikation des 3'-Motivs der pegRNA die Effizienz des Dual-Flap-Editing am IDS-Locus verbessert. Um die Effizienz der Dual-Flap-Editierung weiter zu verbessern, wurde ein Pseudoknoten evoPreQ1-Motiv eingeführt, um das 3'-Ende der pegRNA zu schützen. Vergleicht man die Editing-Effizienz, die durch die unmodifizierten und die evoPreQ1-modifizierten dualen pegRNAs erzeugt wurde, so zeigt sich insgesamt eine Steigerung der Editing-Effizienz mit den modifizierten pegRNAs am anvisierten IDS-Locus. Die Effizienz der Dual-Flap-Bearbeitung kann bis zum 5,3-fachen gesteigert werden.
108A-108C zeigen einen Überblick über twinPE und die twinPE-vermittelte Sequenzersetzung. 108A zeigt, dass twinPE-Systeme auf genomische DNA-Sequenzen abzielen, die zwei Protospacer-Sequenzen auf gegenüberliegenden Strängen der DNA enthalten. PE2-pegRNA-Komplexe zielen auf jeden Protospacer, erzeugen einen einzelsträngigen Nick und transkribieren die pegRNA-kodierte Vorlage, die die gewünschte Insertionssequenz enthält. Nach der Synthese und Freisetzung der 3'-DNA-Flaps existiert ein hypothetisches Zwischenprodukt, das annealisierte 3'-Flaps mit der editierten DNA-Sequenz und annealisierte 5'-Flaps mit der ursprünglichen DNA-Sequenz enthält. Die Exzision der ursprünglichen DNA-Sequenz, die im 5'-Flap enthalten ist, und die anschließende Ligation des 3'-Flaps an die entsprechende Exzisionsstelle erzeugen das gewünschte editierte Produkt. 108B zeigt ein Beispiel für die twinPE-vermittelte Ersetzung einer 90-bp-Sequenz in HEK- Stelle 3 durch eine 38-bp Bxb1 attB-Sequenz. 108C zeigt eine Auswertung von twinPE in HEK293T-Zellen für den Einbau der 38-bp Bxb1 attB-Stelle, wie gezeigt in 108B, oder der 50-bp Bxb1 attP-Stelle an HEK-Stelle 3 mit Hilfe von pegRNAs, die unterschiedliche Längen der Insertionssequenz vorgeben. Die Werte und Fehlerbalken geben den Mittelwert und die Standardabweichung von drei unabhängigen biologischen Replikaten wieder.
109A-109E zeigen gezielte Sequenzeinfügung, Deletion und Umkodierung mit twinPE in menschlichen Zellen. 109A zeigt die Insertion von FKBP kodierenden Sequenzfragmenten mit PE3 (12 bp, 36 bp, 108 bp oder 321 bp) oder twinPE (108 bp) an HEK site 3 in HEK293T Zellen. 109B zeigt die Rekodierung der Sequenz innerhalb der Exons 4 und 7 in PAH in HEK293T-Zellen mit twinPE. Eine 64-bp-Zielsequenz in Exon 4 wurde unter Verwendung von 24, 36 oder 59 bp überlappenden Flaps editiert, eine 46-bp-Zielsequenz in Exon 7 wurde unter Verwendung von 22 oder 42 bp überlappenden Flaps editiert, oder eine 64-bp-Sequenz in Exon 7 wurde unter Verwendung von 24 oder 47 bp überlappenden Flaps editiert. Die Editing-Aktivität wurde mit Standard-pegRNAs oder epegRNAs mit 3'- EvoPreQ1-Motiven verglichen. 109C ist ein schematisches Diagramm von drei verschiedenen Dual-Flap-Deletionsstrategien, die für die Durchführung von gezielten Deletionen untersucht wurden. Die „Basic-Anchor (BA)“ twinPE-Strategie ermöglicht eine flexible Deletion, die an einer beliebigen Position 3' von einer Einkerbung beginnt und an der anderen Einkerbung endet. Die „Hybrid-Anchor (HA)“ twinPE-Strategie ermöglicht die flexible Deletion von Sequenzen an beliebig gewählten Positionen zwischen den beiden Einkerbungen. Die hier getestete „PrimeDel (PD)“-Strategie ermöglicht die Deletion der Sequenz, die an einer Einkerbung beginnt und an einer anderen Einkerbung endet. 109D zeigt die Deletion von Sequenzen an der HEK-Stelle 3 in HEK293T-Zellen unter Verwendung der BA-twinPE-, HA-twinPE- oder PD-Strategien, die auf dasselbe Protospacer-Paar abzielen. Die Editing-Aktivität wurde mit Standard-pegRNAs oder epegRNAs mit 3'-EvoPreQ1- Motiven verglichen. 109E zeigt die Deletion der Exon 51-Sequenz am DMD-Locus in HEK293T-Zellen unter Verwendung von BA-twinPE, PD, gepaarter Cas9-Nuklease oder twinPE-vermittelter attB-Sequenzersetzung. Die Werte und Fehlerbalken geben den Mittelwert und die Standardabweichung von drei unabhängigen biologischen Replikaten wieder. In dem DMD-Exon 51-Skipping-Experiment wurden mindestens zwei unabhängige biologische Wiederholungen durchgeführt.
110A-110E zeigen eine ortsspezifische genomische Integration von DNA-Fracht mit twinPE und Bxb1-Rekombinase in menschlichen Zellen. 110A zeigt das Screening von twinPE pegRNA-Paaren zur Installation der Bxb1 attP-Sequenz am AAVS1-Locus in HEK293T-Zellen. 110B zeigt das Screening von twinPE pegRNA-Paaren zum Einbau der Bxb1 attB-Sequenz am CCRS-Locus in HEK293T-Zellen. 110C zeigt eine einzelne Knock-in-Transfektion von 5,6-kb-DNA-Spendern mit twinPE pegRNA-Paaren, die auf CCRS (vier Balken ganz links) oder AA VS1 (drei Balken ganz rechts) abzielen. Die twinPE pegRNAs installieren attB an CCRS oder attP an AA VS1. Bxb1 integriert dann einen Donor, der die entsprechende Anheftungsstelle trägt, in die genomische Anheftungsstelle. 110D zeigt die Optimierung eines einzelnen Transfektions-Knock-ins bei CCRS unter Verwendung des 531/584 twinPE pegRNA-Paares. Die Identität der templierten Editierung (attB vs. attP), die Identität des zentralen Dinukleotids (unmutiertes GT vs. orthogonale Mutante GA) und die Länge der Überlappung zwischen den Flaps wurden variiert, um die Kombination zu ermitteln, die die höchste Knock-in-Effizienz unterstützt. 110E zeigt die Insertion der Bxb1 attB Sequenz in Intron 1 von ALB in HEK293T und Huh7 Zelllinien. 110F zeigt einen Vergleich der Einzel-Transfektions-Knock-in-Effizienzen bei CCRS und ALB in HEK293T und Huh7 Zelllinien.
111A-111E zeigen eine ortsspezifische genomische Sequenzinversion mit twinPE und Bxb1-Rekombinase in menschlichen Zellen. 111A ist eine schematische Darstellung der Rekombinations-Hotspots in IDS und IDS2, die zu pathogenen 39-kb- Inversionen führen, sowie der kombinierten twinPE-Bxb1-Strategie zur Installation oder Korrektur der IDS-Inversionsmutation. 111B zeigt ein Screening von pegRNA-Paaren an IDS und IDS2 zur Installation von attP- oder attB-Rekombinationsstellen an IDS- und IDS2- Loci mit spezifischen DNA-Zielen. 111C zeigt eine DNA-Sequenzierungsanalyse der attP- oder attB-Insertion mit sequenzieller DNA-Transfektion. 111D zeigt die Reinheit des Inversionsprodukts an der invertierten Kreuzung 1 und Kreuzung 2 (sequenzielle Transfektion), was auf eine erfolgreiche Inversion an den beiden Kreuzungen hinweist. 111E zeigt die Quantifizierung der Inversionseffizienz an den Kreuzungen (sequenzielle Transfektion und „One-Pot“ RNA-Nukleofektion).
112 zeigt die Umkodierung von Sequenzen innerhalb von Exon 10, 11 und 12 in PAH in HEK293T-Zellen mittels twinPE. Eine 64-bp-Zielsequenz in Exon 10 wurde unter Verwendung von 28 bp überlappenden Flaps editiert, eine 61-bp- und 55-bp-Zielsequenz in Exon 11 wurde unter Verwendung von 25 bp überlappenden Flaps editiert, oder eine 68-bp- und 58-bp-Sequenz in Exon 12 wurde unter Verwendung von 27 bzw. 24 bp überlappenden Flaps editiert. Die Werte und Fehlerbalken geben den Mittelwert und die Standardabweichung von drei unabhängigen biologischen Replikaten wieder.
113 zeigt die Transfektion einer klonalen HEK293T-Zelllinie, die eine homozygote attB-Insertion aufweist, mit BxBI-Plasmiden und attP-haltigen Spender-DNA- Plasmiden. Die Knock-in-Effizienz liegt zwischen 12-17 % an der Zielstelle, gemessen mittels ddPCR.
114 zeigt die HTS-Messung der erwarteten Kreuzungssequenzen, die attL- und attR-Rekombinationsprodukte nach twinPE und BxBI-vermitteltem One-Pot-Knock-in enthalten. Die Produktreinheiten reichen von 71-95 %. Die Werte und Fehlerbalken geben den Mittelwert und die Standardabweichung von drei unabhängigen biologischen Replikaten wieder.
115A zeigt die twinPE-vermittelte attB-Insertionseffizienz mit reduzierter Flap- Überlappungslänge bei den dualen pegRNAs.
115B zeigt PCR-Produkte, die durch spezifische Primer zur Erfassung der Rekombination zwischen Donor-DNA und pegRNA-Plasmiden amplifiziert wurden, auf dem Agarose-Gel. Die Rekombination zwischen der Spender-DNA und dem pegRNA-Plasmid wurde durch eine geringere Überlappung der Flaps reduziert.
116 ist eine schematische Darstellung der entwickelten PCR-Strategien zur Quantifizierung der IDS-Inversions-Effizienz.

DEFINITIONEN
Sofern nicht anders definiert, haben alle hierin verwendeten technischen und wissenschaftlichen Begriffe die Bedeutung, die ein Fachmann auf dem Gebiet, zu dem diese Erfindung gehört, gemeinhin versteht. Die folgenden Referenzen bieten dem Fachmann eine allgemeine Definition vieler der in dieser Erfindung verwendeten Begriffe: Singleton et al., Dictionary of Microbiology and Molecular Biology (2. Aufl. 1994); The Cambridge Dictionary of Science and Technology (Walker Ed., 1988); The Glossary of Genetics, 5th Ed., R. Rieger et al. (eds.), Springer Verlag (1991); und Hale & Marham, The Harper Collins Dictionary of Biology (1991). Sofern nicht anders angegeben, haben die folgenden Begriffe die ihnen zugewiesene Bedeutung.
Antisense-Strang
In der Genetik ist der „Antisense“-Strang eines Segments innerhalb der doppelsträngigen DNA der Template-Strang, der in der Orientierung 3' zu 5' verläuft. Im Gegensatz dazu ist der „Sense“-Strang das Segment innerhalb der doppelsträngigen DNA, das von 5' nach 3' verläuft und das komplementär zum Antisense-Strang der DNA, dem Template- Strang, ist, der von 3' nach 5' verläuft. Im Falle eines DNA-Segments, das für ein Protein kodiert, ist der Sense-Strang der DNA-Strang, der die gleiche Sequenz wie die mRNA hat, die während der Transkription den Antisense-Strang als Vorlage verwendet und schließlich (typischerweise, aber nicht immer) in ein Protein übersetzt wird. Der Antisense-Strang ist also für die RNA verantwortlich, die später in Protein übersetzt wird, während der Sense-Strang einen nahezu identischen Aufbau wie die mRNA besitzt. Beachten Sie, dass es für jedes Segment der dsDNA möglicherweise zwei Sätze von Sense und Antisense gibt, je nachdem, in welche Richtung man liest (da Sense und Antisense relativ zur Perspektive sind). Letztlich ist es das Genprodukt, die mRNA, die bestimmt, welcher Strang eines dsDNA-Segments als Sense oder Antisense bezeichnet wird.
Bi-spezifischer Ligand
Der Begriff „biospezifischer Ligand“ oder „biospezifischer Anteil“, wie er hier verwendet wird, bezieht sich auf einen Liganden, der an zwei verschiedene ligandenbindende Domänen bindet. In bestimmten Ausführungsformen ist der Ligand eine kleine Molekülverbindung, ein Peptid oder ein Polypeptid. In anderen Ausführungsformen ist die ligandenbindende Domäne eine „Dimerisierungsdomäne“, die als Peptid-Tag in ein Protein eingebaut werden kann. In verschiedenen Ausführungsformen können zwei Proteine, die jeweils die gleichen oder unterschiedliche Dimerisierungsdomänen umfassen, durch die Bindung jeder Dimerisierungsdomäne an den biospezifischen Liganden zur Dimerisierung veranlasst werden. Der hier verwendete Begriff „bi-spezifische Liganden“ kann sich auch auf „chemische Auslöser der Dimerisierung“ oder „CIDs“ beziehen.
Cas9
Der Begriff „Cas9“ oder „Cas9-Nuklease“ bezieht sich auf eine RNA-gesteuerte Nuklease, die eine Cas9-Domäne oder ein Fragment davon umfasst(z. B. ein Protein, das eine aktive oder inaktive DNA-Spaltungsdomäne von Cas9 und/oder die gRNA-Bindungsdomäne von Cas9 umfasst). Eine „Cas9-Domäne“, wie hier verwendet, ist ein Proteinfragment, das eine aktive oder inaktive Spaltungsdomäne von Cas9 und/oder die gRNA-Bindungsdomäne von Cas9 umfasst. Ein „Cas9-Protein“ ist ein Cas9-Protein in voller Länge. Eine Cas9-Nuklease wird manchmal auch als casn1-Nuklease oder als CRISPRL(Clustered Regularly Interspaced Short Palindromic Repeat)-assoziierte Nuklease bezeichnet. CRISPR ist ein adaptives Immunsystem, das Schutz gegen mobile genetische Elemente (Viren, transponierbare Elemente und konjugative Plasmide) bietet. CRISPR-Cluster enthalten Spacer, d. h. Sequenzen, die komplementär zu vorausgehenden mobilen Elementen sind, und zielen auf eindringende Nukleinsäuren ab. CRISPR-Cluster werden transkribiert und zu CRISPR-RNA (crRNA) verarbeitet. In CRISPR-Systemen vom Typ II erfordert die korrekte Verarbeitung der prä-crRNA eine trans-kodierte kleine RNA (tracrRNA), endogene Ribonuklease 3 (rnc) und eine Cas9-Domäne. Die tracrRNA dient als Leitfaden für die Ribonuklease 3-gestützte Verarbeitung der prä-crRNA. Anschließend schneidet Cas9/crRNA/tracrRNA endonukleolytisch ein lineares oder zirkuläres dsDNA-Ziel, das komplementär zum Spacer ist. Der Zielstrang, der nicht komplementär zur crRNA ist, wird zunächst endonukleolytisch geschnitten und dann exonukleolytisch auf 3'-5' gekürzt. In der Natur werden für die Bindung und Spaltung von DNA normalerweise Proteine und RNAs benötigt. Einzelne Guide-RNAs („sgRNA“ oder einfach „gNRA“) können jedoch so konstruiert werden, dass sie Aspekte sowohl der crRNA als auch der tracrRNA in eine einzige RNA-Spezies einbringen. Siehe z. B. Jinek M., Chylinski K., Fonfara I., Hauer M., Doudna J.A., Charpentier E. Science 337:816- 821(2012), dessen gesamter Inhalt hiermit durch Verweis einbezogen wird. Cas9 erkennt ein kurzes Motiv in den CRISPR-Wiederholungssequenzen (das PAM- oder Protospacer- benachbartes Motiv), um zwischen selbst und nicht selbst zu unterscheiden. Die Sequenzen und Strukturen der Cas9-Nuklease sind dem Fachmann gut bekannt (siehe z .B. „Complete genome sequence of an M1 strain of Streptococcus pyogenes“ Ferretti et al., J.J., McShan W.M., Ajdic D.J., Savic D.J., Savic G., Lyon K., Primeaux C., Sezate S., Suvorov A.N., Kenton S., Lai H.S., Lin S.P., Qian Y., Jia H.G., Najar F.Z., Ren Q., Zhu H., Song L., White J., Yuan X., Clifton S.W., Roe B.A., McLaughlin R.E., Proc. Natl. Acad. Sci. U.S.A. 98:4658- 4663(2001); „CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III“ Deltcheva E., Chylinski K., Sharma C.M., Gonzales K., Chao Y., Pirzada Z.A., Eckert M.R., Vogel J., Charpentier E., Nature 471:602-607(2011); und „A programmable dual-RNA- guided DNA endonuclease in adaptive bacterial immunity.“ Jinek M., Chylinski K., Fonfara I., Hauer M., Doudna J.A., Charpentier E. Science 337:816-821(2012), deren gesamter Inhalt hier durch Bezugnahme aufgenommen wird). Cas9-Orthologe wurden in verschiedenen Spezies beschrieben, einschließlich, aber nicht beschränkt auf S. pyogenes und S. thermophilus. Weitere geeignete Cas9-Nukleasen und -Sequenzen sind für Fachleute auf der Grundlage dieser Erfindung offensichtlich. Zu diesen Cas9-Nukleasen und -Sequenzen gehören Cas9- Sequenzen aus den Organismen und Loci, die in Chylinski, Rhun und Charpentier, „The tracrRNA and Cas9 families of type II CRISPR-Cas immunity systems“ (2013) RNA Biology 10:5, 726-737, offengelegt sind; der gesamte Inhalt dieses Dokuments wird hier durch Bezugnahme aufgenommen. In einigen Ausführungsformen umfasst eine Cas9-Nuklease eine oder mehrere Mutationen, die die DNA-Spaltungsdomäne teilweise beeinträchtigen oder inaktivieren.
Eine Nuklease-inaktivierte Cas9-Domäne kann auch als „dCas9“-Protein (für Nuklease-„totes“ Cas9) bezeichnet werden. Verfahren zur Erzeugung einer Cas9-Domäne (oder eines Fragments davon) mit einer inaktiven DNA-Spaltungsdomäne sind bekannt (siehe z. B. Jinek et al., Science. 337:816-821(2012); Qi et al., „Repurposing CRISPR as an RNA- Guided Platform for Sequence-Specific Control of Gene Expression“ (2013) Cell. 28; 152(5):1173-83, deren gesamter Inhalt hier durch Bezugnahme aufgenommen wird). So ist zum Beispiel bekannt, dass die DNA-Spaltungsdomäne von Cas9 zwei Subdomänen umfasst, die HNH-Nuklease-Subdomäne und die RuvC1-Subdomäne. Die HNH-Subdomäne schneidet den zur gRNA komplementären Strang, während die RuvC1-Subdomäne den nicht komplementären Strang schneidet. Mutationen innerhalb dieser Subdomänen können die Nukleaseaktivität von Cas9 inaktivieren. Die Mutationen D10A und H840A zum Beispiel inaktivieren die Nukleaseaktivität von S. pyogenes Cas9 vollständig (Jinek et al., Science. 337:816-821(2012); Qi et al., Cell. 28;152(5): 1173-83 (2013)). In einigen Ausführungsformen werden Proteine bereitgestellt, die Fragmente von Cas9 enthalten. In einigen Ausführungsformen umfasst ein Protein zum Beispiel eine von zwei Cas9-Domänen: (1) die gRNA-Bindungsdomäne von Cas9; oder (2) die DNA-Spaltungsdomäne von Cas9. In einigen Ausführungsformen werden Proteine, die Cas9 oder Fragmente davon enthalten, als „Cas9- Varianten“ bezeichnet. Eine Cas9-Variante weist eine Homologie zu Cas9 oder einem Fragment davon auf. Zum Beispiel ist eine Cas9-Variante mindestens etwa 70 % identisch, mindestens etwa 80 % identisch, mindestens etwa 90 % identisch, mindestens etwa 95 % identisch, mindestens etwa 96 % identisch, mindestens etwa 97 % identisch, mindestens etwa 98 % identisch, mindestens etwa 99 % identisch, mindestens etwa 99,5 % identisch, mindestens etwa 99,8 % identisch oder mindestens etwa 99,9 % identisch mit Wildtyp-Cas9 (z. B. SpCas9 von SEQ-ID-NR.: 18). In einigen Ausführungsformen kann die Cas9-Variante 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 21, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50 oder mehr Aminosäureänderungen im Vergleich zum unmutierten Cas9 (z. B., SpCas9 der SEQ-ID-NR.: 18) aufweisen. In einigen Ausführungsformen umfasst die Cas9-Variante ein Fragment von SEQ-ID-NR.: 18 Cas9 (z. B. eine gRNA-Bindungsdomäne oder eine DNA-Spaltungsdomäne), so dass das Fragment zu mindestens etwa 70 % identisch, zu mindestens etwa 80 % identisch, zu mindestens etwa 90 % identisch, zu mindestens etwa 95 % identisch, zu mindestens etwa 96 % identisch, zu mindestens etwa 97 % identisch, zu mindestens etwa 98 % identisch, zu mindestens etwa 99 % identisch, zu mindestens etwa 99,5 % identisch oder zu mindestens etwa 99,9 % identisch mit dem entsprechenden Fragment von unmutiertem Cas9 ist (z. B. SpCas9 von SEQ-ID-NR.: 18). In einigen Ausführungsformen ist das Fragment mindestens 30 %, mindestens 35 %, mindestens 40 %, mindestens 45 %, mindestens 50 %, mindestens 55 %, mindestens 60 %, mindestens 65 %, mindestens 70 %, mindestens 75 %, mindestens 80 %, mindestens 85 %, mindestens 90 %, mindestens 95 % identisch, mindestens 96 %, mindestens 97 %, mindestens 98 %, mindestens 99 % oder mindestens 99,5 % der Aminosäurelänge eines entsprechenden unmutierten Cas9 (z. B. SpCas9 von SEQ-ID-NR.: 18).
cDNA
Der Begriff „cDNA“ bezieht sich auf einen DNA-Strang, der von einer RNA-Vorlage kopiert wurde. cDNA ist komplementär zur RNA-Vorlage.
Kreisförmiger Permutant
Wie hier verwendet, bezieht sich der Begriff „zirkulärer Permutant“ auf ein Protein oder Polypeptid (z. B. Cas9), das eine zirkuläre Permutation aufweist, d. h. eine Änderung der strukturellen Konfiguration des Proteins, die eine Änderung der Reihenfolge der Aminosäuren in der Aminosäuresequenz des Proteins beinhaltet. Mit anderen Worten, zirkuläre Permutanten sind Proteine, die im Vergleich zu ihrem unmutierten Gegenstück veränderte N- und C-Termini aufweisen, z. B. wird die C-terminale Hälfte eines Proteins vom unmutierten Typ zur neuen N- terminalen Hälfte. Bei der zirkulären Permutation (oder CP) handelt es sich im Wesentlichen um die topologische Neuanordnung der primären Sequenz eines Proteins, die dessen N- und C-Terminus miteinander verbindet, häufig mit einem Peptidlinker, während gleichzeitig die Sequenz an einer anderen Position geteilt wird, um neue, benachbarte N- und C-Termini zu schaffen. Das Ergebnis ist eine Proteinstruktur mit unterschiedlicher Konnektivität, die jedoch häufig die gleiche, insgesamt ähnliche dreidimensionale (3D) Form haben kann und möglicherweise verbesserte oder veränderte Eigenschaften aufweist, darunter eine geringere proteolytische Anfälligkeit, eine verbesserte katalytische Aktivität, eine veränderte Substrat- oder Ligandenbindung und/oder eine verbesserte Thermostabilität. Zirkuläre permutante Proteine können in der Natur vorkommen (z. B. Concanavalin A und Lektin). Darüber hinaus kann eine zirkuläre Permutation durch posttranslationale Modifikationen auftreten oder durch rekombinante Techniken erzeugt werden.
Kreisförmig permutiertes Cas9
Der Begriff „zirkulär permutiertes Cas9“ bezieht sich auf jedes Cas9-Protein oder eine Variante davon, das als zirkuläres Permutant auftritt, wobei seine N- und C-Termini topisch umgeordnet wurden. Solche zirkulär permutierten Cas9-Proteine („CP-Cas9“) oder Varianten davon behalten die Fähigkeit, DNA zu binden, wenn sie mit einer Guide-RNA (gRNA) komplexiert sind. Siehe Oakes et al., „Protein Engineering of Cas9 for enhanced function“, Methods Enzymol, 2014, 546: 491-511 und Oakes et al., „CRISPR-Cas9 Circular Permutants as Programmable Scaffolds for Genome Modification“, Cell, January 10, 2019, 176: 254-267 (die hier jeweils durch Bezugnahme aufgenommen sind). Die unmittelbare Offenlegung berücksichtigt jedes bereits bekannte CP-Cas9 oder die Verwendung eines neuen CP-Cas9, solange das resultierende zirkulär permutierte Protein die Fähigkeit behält, DNA zu binden, wenn es mit einer Guide-RNA (gRNA) komplexiert ist. Beispielhafte CP-Cas9-Proteine sind SEQ-ID-Nummern: 77-86.
CRISPR
CRISPR ist eine Familie von DNA-Sequenzen (d. h. CRISPR-Cluster) in Bakterien und Archaeen, die Schnipsel früherer Infektionen durch ein Virus darstellen, das in den Prokaryoten eingedrungen ist. Die DNA-Schnipsel werden von der prokaryotischen Zelle verwendet, um DNA von nachfolgenden Angriffen ähnlicher Viren zu erkennen und zu zerstören. Zusammen mit einer Reihe von CRISPR-assoziierten Proteinen (einschließlich Cas9 und dessen Homologen) und CRISPR-assoziierter RNA bilden sie ein prokaryotisches Immunabwehrsystem. In der Natur werden die CRISPR-Cluster transkribiert und zu CRISPR- RNA (crRNA) verarbeitet. Bei bestimmten Arten von CRISPR-Systemen (z. B. Typ-II- CRISPR-Systemen) erfordert die korrekte Verarbeitung der prä-crRNA eine trans-kodierte kleine RNA (tracrRNA), die endogene Ribonuklease 3 (rnc) und ein Cas9-Protein. Die tracrRNA dient als Leitfaden für die Ribonuklease 3-gestützte Verarbeitung der prä-crRNA. Anschließend schneidet Cas9/crRNA/tracrRNA endonukleolytisch ein lineares oder zirkuläres dsDNA-Ziel, das komplementär zur RNA ist. Konkret wird der Zielstrang, der nicht komplementär zur crRNA ist, zunächst endonukleolytisch geschnitten und dann exonukleolytisch auf 3'-5' gekürzt. In der Natur werden für die Bindung und Spaltung von DNA normalerweise Proteine und RNAs benötigt. Einzelne Guide-RNAs („sgRNA“ oder einfach „gNRA“) können jedoch so konstruiert werden, dass sie Aspekte sowohl der crRNA als auch der tracrRNA in eine einzige RNA-Spezies - die Guide-RNA - integrieren. Siehe z. B. Jinek M., Chylinski K., Fonfara I., Hauer M., Doudna J.A., Charpentier E. Science 337:816-821(2012), dessen gesamter Inhalt hiermit durch Bezugnahme aufgenommen wird. Cas9 erkennt ein kurzes Motiv in den CRISPR-Wiederholungssequenzen (das PAM- oder Protospacer-benachbartes Motiv), um zwischen selbst und nicht selbst zu unterscheiden. Die CRISPR-Biologie sowie die Cas9-Nuklease-Sequenzen und -Strukturen sind dem Fachmann gut bekannt (siehe z B. „Complete genome sequence of an M1 strain of Streptococcus pyogenes“ Ferretti et al., J.J., McShan W.M., Ajdic D.J., Savic D.J., Savic G., Lyon K., Primeaux C., Sezate S., Suvorov A.N., Kenton S., Lai H.S., Lin S.P., Qian Y., Jia H.G., Najar F.Z., Ren Q., Zhu H., Song L., White J., Yuan X., Clifton S.W., Roe B.A., McLaughlin R.E., Proc. Natl. Acad. Sci. U.S.A. 98:4658-4663(2001); „CRISPR RNA maturation by trans- encoded small RNA and host factor RNase III“ Deltcheva E., Chylinski K., Sharma C.M., Gonzales K., Chao Y., Pirzada Z.A., Eckert M.R., Vogel J., Charpentier E., Nature 471:602- 607(2011); und „A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity.“ Jinek M., Chylinski K., Fonfara I., Hauer M., Doudna J.A., Charpentier E. Science 337:816-821(2012), deren gesamter Inhalt hier durch Bezugnahme aufgenommen wird). Cas9- Orthologe wurden in verschiedenen Spezies beschrieben, einschließlich, aber nicht beschränkt auf S. pyogenes und S. thermophilus. Weitere geeignete Cas9-Nukleasen und -Sequenzen sind für Fachleute auf der Grundlage dieser Erfindung offensichtlich. Zu diesen Cas9-Nukleasen und -Sequenzen gehören Cas9-Sequenzen aus den Organismen und Loci, die in Chylinski, Rhun und Charpentier, „The tracrRNA and Cas9 families of type II CRISPR-Cas immunity systems“ (2013) RNA Biology 10:5, 726-737, offengelegt sind; der gesamte Inhalt dieses Dokuments wird hier durch Bezugnahme aufgenommen.
Bei bestimmten Arten von CRISPR-Systemen (z. B. Typ-II-CRISPR-Systemen) erfordert die korrekte Verarbeitung der prä-crRNA eine trans-kodierte kleine RNA (tracrRNA), endogene Ribonuklease 3 (rnc) und ein Cas9-Protein. Die tracrRNA dient als Leitfaden für die Ribonuklease 3-gestützte Verarbeitung der prä-crRNA. Anschließend spaltet Cas9/crRNA/tracrRNA endonukleolytisch ein lineares oder zirkuläres Nukleinsäureziel, das komplementär zur RNA ist. Insbesondere wird der Zielstrang, der nicht komplementär zur crRNA ist, zunächst endonukleolytisch geschnitten und dann exonukleolytisch um 3'-5' gekürzt. In der Natur werden für die Bindung und Spaltung von DNA normalerweise Proteine und RNAs benötigt. Einzelne Guide-RNAs („sgRNA“ oder einfach „gRNA“) können jedoch so konstruiert werden, dass sie Elemente sowohl der crRNA als auch der tracrRNA in eine einzige RNA-Spezies - die Guide-RNA - einbinden.
Im Allgemeinen bezieht sich ein „CRISPR-System“ auf Transkripte und andere Elemente, die an der Expression oder Steuerung der Aktivität von CRISPR-assoziierten („Cas“) Genen beteiligt sind, einschließlich Sequenzen, die für ein Cas-Gen, eine tracr (transaktivierende CRISPR)-Sequenz (z. B. tracrRNA oder eine aktive partielle tracrRNA), eine tracr mate-Sequenz (die eine „direkte Wiederholung“ und eine tracrRNA-verarbeitete partielle direkte Wiederholung im Kontext eines endogenen CRISPR-Systems umfasst), eine Leitsequenz (die im Kontext eines endogenen CRISPR-Systems auch als „Spacer“ bezeichnet wird) oder andere Sequenzen und Transkripte von einem CRISPR-Locus. Die tracrRNA des Systems ist (vollständig oder teilweise) komplementär zu der tracr mate-Sequenz auf der Guide-RNA.
DNA-Synthese-Vorlage
Wie hier verwendet, bezieht sich der Begriff „DNA-Synthese-Template“ auf die Region oder den Teil des Erweiterungsarms einer pegRNA, der von einer Polymerase eines Prime-Editors als Matrizenstrang verwendet wird, um einen 3'-Einzelstrang-DNA-Flap zu kodieren, der den gewünschten Schnitt enthält und der dann durch den Mechanismus des Prime-Editings den entsprechenden endogenen DNA-Strang an der Zielstelle ersetzt. In verschiedenen Ausführungsformen ist die DNA-Synthese-Template in 3A (im Zusammenhang mit einer pegRNA, die einen 5'-Erweiterungsarm umfasst), 3B (im Zusammenhang mit einer pegRNA, die einen 3'-Erweiterungsarm umfasst), 3C (im Zusammenhang mit einem internen Erweiterungsarm), 3D (im Zusammenhang mit einem 3'-Erweiterungsarm) und 3E (im Zusammenhang mit einem 5'-Erweiterungsarm). Der Erweiterungsarm, einschließlich der DNA-Synthesematrix, kann aus DNA oder RNA bestehen. Im Falle von RNA kann die Polymerase des Prime Editors eine RNA-abhängige DNA-Polymerase sein (z. B. eine reverse Transkriptase). Im Falle von DNA kann die Polymerase des Prime Editors eine DNA-abhängige DNA-Polymerase sein. In verschiedenen Ausführungsformen (z. B. wie in 3D-3E) kann die DNA-Synthese-Template (4) die „Edit- Template“ und den „Homologiearm“ sowie die gesamte oder einen Teil der optionalen 5'- Endmodifizierungsregion e2 umfassen. Das heißt, je nach Beschaffenheit der e2-Region (z. B. ob sie eine Hairpin-, Toeloop- oder Stamm/Schleifen-Sekundärstruktur enthält) kann die Polymerase keine, einige oder auch die gesamte e2-Region kodieren. Anders ausgedrückt: Im Falle eines 3'-Erweiterungsarms kann die DNA-Synthese-Template (3) den Teil des Erweiterungsarms (3) umfassen, der sich vom 5'-Ende der Primer-Bindungsstelle (PBS) bis zum 3'-Ende des gRNA-Kerns erstreckt, der als Matrize für die Synthese eines DNA- Einzelstrangs durch eine Polymerase (z. B. eine reverse Transkriptase) dienen kann. Im Falle eines 5'-Erweiterungsarms kann die DNA-Synthese-Template (3) den Teil des Erweiterungsarms (3) enthalten, der sich vom 5'-Ende des pegRNA-Moleküls bis zum 3'-Ende der Edit-Template erstreckt. Vorzugsweise schließt die DNA-Synthese-Template die Primer- Bindungsstelle (PBS) von pegRNAs aus, die entweder einen 3'-Erweiterungsarm oder einen 5'-Erweiterungsarm haben. Bestimmte hier beschriebene Ausführungsformen (z. B. 71A) beziehen sich auf eine „RT-Template“, die die Edit-Template und den Homologiearm umfasst, d. h. die Sequenz des pegRNA-Erweiterungsarms, die während der DNA-Synthese tatsächlich als Vorlage verwendet wird. Der Begriff „RT-Template“ ist gleichbedeutend mit dem Begriff „DNA-Synthese-Template“
Im Fall von trans Prime-Editing (z. B. 3G und 3H) können die Primer- Bindungsstelle (PBS) und die DNA-Synthese-Template in ein separates Molekül eingebaut werden, das als trans Prime Editor RNA Template (tPERT) bezeichnet wird.
Dimerisierungsdomäne
Der Begriff „Dimerisierungsdomäne“ bezieht sich auf eine ligandenbindende Domäne, die an eine Bindungseinheit eines biospezifischen Liganden bindet. Eine „erste“ Dimerisierungsdomäne bindet an eine erste Bindungseinheit eines biospezifischen Liganden und eine „zweite“ Dimerisierungsdomäne bindet an eine zweite Bindungseinheit des gleichen biospezifischen Liganden. Wenn die erste Dimerisierungsdomäne an ein erstes Protein fusioniert ist (z. B. über PE, wie hier besprochen) und die zweite Dimerisierungsdomäne (z. B. über PE, wie hier besprochen) an ein zweites Protein fusioniert ist, dimerisieren das erste und das zweite Protein in Gegenwart eines bi-spezifischen Liganden, wobei der bi-spezifische Ligand mindestens eine Einheit aufweist, die an die erste Dimerisierungsdomäne bindet, und mindestens eine andere Einheit, die an die zweite Dimerisierungsdomäne bindet.
Stromabwärts
Wie hier verwendet, sind die Begriffe „stromaufwärts“ und „stromabwärts“ Relativitätsbegriffe, die die lineare Position von mindestens zwei Elementen definieren, die sich in einem Nukleinsäuremolekül (ob einzel- oder doppelsträngig) befinden, das in einer 5'zu-3'-Richtung orientiert ist. Insbesondere befindet sich ein erstes Element stromaufwärts von einem zweiten Element in einem Nukleinsäuremolekül, wobei das erste Element an einer Stelle positioniert ist, die 5' zu dem zweiten Element liegt. Ein SNP befindet sich beispielsweise stromaufwärts von einer Cas9-induzierten Nick-Stelle, wenn der SNP auf der 5'-Seite der Einkerbung liegt. Umgekehrt befindet sich ein erstes Element stromabwärts von einem zweiten Element in einem Nukleinsäuremolekül, wenn das erste Element an einer Stelle positioniert ist, die 3' zum zweiten Element liegt. Zum Beispiel ist ein SNP stromabwärts von einer Cas9- induzierten Einkerbung, wenn der SNP auf der 3'-Seite der Einkerbung liegt. Das Nukleinsäuremolekül kann eine DNA sein (doppel- oder einzelsträngig). RNA (doppel- oder einzelsträngig) oder ein Hybrid aus DNA und RNA. Die Analyse ist für ein einzelsträngiges Nukleinsäuremolekül und ein doppelsträngiges Molekül die gleiche, da sich die Begriffe „stromaufwärts“ und „stromabwärts“ nur auf einen Einzelstrang eines Nukleinsäuremoleküls beziehen, mit der Ausnahme, dass man auswählen muss, welcher Strang des doppelsträngigen Moleküls betrachtet wird. Oft ist der Strang einer doppelsträngigen DNA, der zur Bestimmung der Positionsrelativität von mindestens zwei Elementen verwendet werden kann, der „Sense- Strang“ oder „kodierende Strang“. In der Genetik ist ein „Sense“-Strang das Segment innerhalb der doppelsträngigen DNA, das von 5' nach 3' verläuft und das komplementär zum Antisense-Strang der DNA, dem Templat-Strang, ist, der von 3' nach 5' verläuft. So ist beispielsweise eine SNP-Nukleobase „stromabwärts“ von einer Promotorsequenz in einer genomischen DNA (die doppelsträngig ist), wenn sich die SNP-Nukleobase auf der 3'-Seite des Promotors auf dem Sense- oder Kodierungsstrang befindet.
Edit-Template
Der Begriff „Edit-Template“ bezieht sich auf einen Teil des Erweiterungsarms, der die gewünschte Editierung in der einzelsträngigen 3'-DNA-Flap kodiert, die von der Polymerase, z. B. einer DNA-abhängigen DNA-Polymerase, einer RNA-abhängigen DNA-Polymerase (z. B. einer reversen Transkriptase) synthetisiert wird. Bestimmte hier beschriebene Ausführungsformen (z. B. 71A) beziehen sich auf „eine RT-Template“, was sich sowohl auf die Edit-Template als auch auf den Homologiearm zusammen bezieht, d. h. auf die Sequenz des pegRNA-Erweiterungsarms, die während der DNA-Synthese tatsächlich als Vorlage verwendet wird. Der Begriff „RT-Edit-Template“ entspricht auch dem Begriff „DNA- Synthese-Template“, wobei die RT-Edit-Template jedoch die Verwendung eines Prime Editors mit einer Polymerase, die eine reverse Transkriptase ist, widerspiegelt und wobei die DNA- Synthese-Template im weiteren Sinne die Verwendung eines Prime Editors mit einer beliebigen Polymerase widerspiegelt.
Wirksame Menge
Der Begriff „wirksame Menge“, wie er hier verwendet wird, bezieht sich auf eine Menge eines biologisch aktiven Mittels, die ausreicht, um eine gewünschte biologische Reaktion hervorzurufen. In einigen Ausführungsformen kann sich eine wirksame Menge eines Prime Editors (PE) beispielsweise auf die Menge des Editors beziehen, die ausreicht, um eine Nukleotidsequenz an der Zielstelle, z. B. ein Genom, zu editieren. In einigen Ausführungsformen kann sich eine wirksame Menge eines hier bereitgestellten Prime Editors (PE), z. B. eines Fusionsproteins, das eine Nickase-Cas9-Domäne und eine reverse Transkriptase umfasst, auf die Menge des Fusionsproteins beziehen, die ausreicht, um die Editierung einer Zielstelle zu induzieren, die spezifisch durch das Fusionsprotein gebunden und editiert wird. Wie den Fachleuten klar sein wird, kann die wirksame Menge eines Mittels, z. B. eines Fusionsproteins, einer Nuklease, eines Hybridproteins, eines Proteindimers, eines Komplexes aus einem Protein (oder Proteindimer) und einem Polynukleotid oder eines Polynukleotids von verschiedenen Faktoren abhängen, wie z. B. von der gewünschten biologischen Reaktion, z. B. von dem spezifischen Allel, Genom oder der Zielstelle, der editiert werden soll, von der Zelle oder dem Gewebe, auf die/das abgezielt wird, und von dem verwendeten Mittel.
Fehleranfällige reverse Transkriptase
Wie hierin verwendet, bezieht sich der Begriff „fehleranfällige“ reverse Transkriptase (oder im weiteren Sinne eine beliebige Polymerase) auf eine reverse Transkriptase (oder im weiteren Sinne eine beliebige Polymerase), die natürlich vorkommt oder von einer anderen reversen Transkriptase (z. B. einer Wildtyp M-MLV reversen Transkriptase) abgeleitet wurde, die eine Fehlerrate aufweist, die geringer ist als die Fehlerrate der Wildtyp M-MLV reversen Transkriptase. Die Fehlerrate der M-MLV-Wildtyp-Reverse-Transkriptase liegt Berichten zufolge im Bereich von einem Fehler auf 15.000 (höher) bis 27.000 (niedriger). Eine Fehlerquote von 1 zu 15.000 entspricht einer Fehlerquote von 6,7 x 10^-5. Eine Fehlerquote von 1 zu 27.000 entspricht einer Fehlerquote von 3,7 x 10^-5. Siehe Boutabout et al. (2001) „DNA synthesis fidelity by the reverse transcriptase of the yeast retrotransposon Ty1", Nucleic Acids Res 29(11):2217-2222, das hier durch Bezugnahme aufgenommen wird. Für die Zwecke dieser Anwendung bezieht sich der Begriff „fehleranfällig“ auf jene RT, die eine Fehlerrate von mehr als einem Fehler in 15.000 Nukleobasen (6,7 x 10^-5 oder höher) aufweisen, z. B., 1 Fehler in 14.000 Nukleobasen (7,14 x 10^-5 oder höher), 1 Fehler in 13.000 Nukleobasen oder weniger (7,7 × 10^-5 oder höher), 1 Fehler in 12.000 Nukleobasen oder weniger (7,7 x 10^-5 oder höher), 1 Fehler in 11.000 Nukleobasen oder weniger (9.1 × 10^-5 oder höher), 1 Fehler in 10.000 Nukleobasen oder weniger (1 × 10^-4 oder 0,0001 oder höher), 1 Fehler in 9.000 Nukleobasen oder weniger (0,00011 oder höher), 1 Fehler in 8.000 Nukleobasen oder weniger (0,00013 oder höher), 1 Fehler in 7.000 Nukleobasen oder weniger (0,00014 oder höher), 1 Fehler in 6.000 Nukleobasen oder weniger (0,00016 oder höher), 1 Fehler in 5.000 Nukleobasen oder weniger (0,0002 oder höher), 1 Fehler in 4.000 Nukleobasen oder weniger (0,00025 oder höher), 1 Fehler in 3.000 Nukleobasen oder weniger (0,00033 oder höher), 1 Fehler in 2.000 Nukleobasen oder weniger (0,00050 oder höher), 1 Fehler in 1.000 Nukleobasen oder weniger (0,001 oder höher), 1 Fehler in 500 Nukleobasen oder weniger (0,002 oder höher) oder 1 Fehler in 250 Nukleobasen oder weniger (0,004 oder höher).
Extein
Der Begriff „Extein“, wie er hier verwendet wird, bezieht sich auf eine Polypeptidsequenz, die von einem Intein flankiert wird und während des Prozesses des Proteinspleißens an ein anderes Extein ligiert wird, um ein reifes, gespleißtes Protein zu bilden. Normalerweise wird ein Intein von zwei Extein-Sequenzen flankiert, die miteinander ligiert werden, wenn das Intein seine eigene Exzision katalysiert. Exteine sind also das Protein- Analogon zu den Exons in der mRNA. Ein Polypeptid, das ein Intein enthält, kann zum Beispiel die Struktur Extein(N) - Intein - Extein(C) haben. Nach der Exzision des Inteins und dem Spleißen der beiden Exteine entstehen die Strukturen Extein(N) - Extein(C) und ein freies Intein. In verschiedenen Konfigurationen können die Exteine separate Proteine sein (z. B. die Hälfte eines Cas9- oder PE-Fusionsproteins), die jeweils mit einem Split-Intein fusioniert sind, wobei die Exzision der Split-Inteine das Zusammenspleißen der Extein-Sequenzen bewirkt.
Erweiterungsarm
Der Begriff „Erweiterungsarm“ bezieht sich auf eine Nukleotidsequenzkomponente einer pegRNA, die mehrere Funktionen erfüllt, darunter eine Primer-Bindungsstelle und eine Edit-Template für die reverse Transkriptase. In einigen Ausführungsformen, z. B. 3D befindet sich der Erweiterungsarm am 3'-Ende der Guide-RNA. In anderen Ausführungsformen, z. B. 3E befindet sich der Erweiterungsarm am 5'-Ende der Guide- RNA. In einigen Ausführungsformen umfasst der Erweiterungsarm auch einen Homologiearm. In verschiedenen Ausführungsformen umfasst der Erweiterungsarm die folgenden Komponenten in 5' bis 3' Richtung: den Homologiearm, die Edit-Template und die Primer-Bindungsstelle. Da die Polymerisationsaktivität der reversen Transkriptase in der 5'zu-3'-Richtung erfolgt, ist die bevorzugte Anordnung des Homologiearms, der Edit-Template und der Primer-Bindungsstelle in der 5'-zu-3'-Richtung, so dass die reverse Transkriptase, sobald sie durch eine angelagerte Primer-Sequenz geprimert wurde, einen einzelnen DNA- Strang unter Verwendung der Edit-Template als komplementären Vorlagenstrang polymerisiert. Weitere Details, wie z. B. die Länge des Erweiterungsarms, werden an anderer Stelle beschrieben.
Der Erweiterungsarm kann auch so beschrieben werden, dass er im Allgemeinen zwei Regionen umfasst: eine Primer-Bindungsstelle (PBS) und eine DNA-Synthese-Template, wie in 3G (oben) zum Beispiel gezeigt. Die Primer-Bindungsstelle bindet an die Primer- Sequenz, die aus dem endogenen DNA-Strang der Zielstelle gebildet wird, wenn dieser durch den Prime-Editor-Komplex eingekerbt wird, wodurch ein 3'-Ende auf dem endogenen eingekerbten Strang freigelegt wird. Wie hier erläutert, wird durch die Bindung der Primer- Sequenz an die Primer-Bindungsstelle auf dem Erweiterungsarm der pegRNA eine Duplex- Region mit einem freiliegenden 3'-Ende (d. h. dem 3' der Primer-Sequenz) erzeugt, die dann ein Substrat für eine Polymerase bereitstellt, um mit der Polymerisation eines einzelnen DNA- Strangs von dem freiliegenden 3'-Ende entlang der Länge der DNA-Synthese-Template zu beginnen. Die Sequenz des einsträngigen DNA-Produkts ist das Komplement der DNA- Synthese-Template. Die Polymerisation setzt sich in Richtung der 5' der DNA-Synthese- Template (oder des Erweiterungsarms) fort, bis die Polymerisation endet. Somit stellt die DNA-Synthese-Template den Teil des Erweiterungsarms dar, der von der Polymerase des Prime-Editor-Komplexes in ein einzelsträngiges DNA-Produkt (d. h. den 3'-Einzelstrang- DNA-Flap, der die gewünschte genetische Schnittinformation enthält) kodiert wird und der letztendlich den entsprechenden endogenen DNA-Strang der Zielstelle ersetzt, der unmittelbar stromabwärts der PE-induzierten Einkerbung liegt. Ohne an die Theorie gebunden zu sein, setzt sich die Polymerisation der DNA-Synthese-Template zum 5'-Ende des Erweiterungsarms hin fort, bis ein FIGruchereignis eintritt. Die Polymerisation kann auf verschiedene Weise beendet werden, einschließlich, aber nicht beschränkt auf (a) das Erreichen eines 5'-Terminus der pegRNA (z. B. im Fall des 5'-Erweiterungsarms, bei dem der DNA-Polymerase einfach die Vorlage ausgeht), (b) das Erreichen einer unpassierbaren RNA-Sekundärstruktur (z. B., Haarnadel oder Stamm/Schleife) oder (c) das Erreichen eines Replikationsterminationssignals, z. B. einer spezifischen Nukleotidsequenz, die die Polymerase blockiert oder hemmt, oder eines topologischen Nukleinsäuresignals, wie z. B. supergewickelte DNA oder RNA.
Flap-Endonuklease (z. B. FEN1)
Wie hier verwendet, bezieht sich der Begriff „Flap-Endonuklease“ auf ein Enzym, das die Entfernung von 5'-Einzelstrang-DNA-Flaps katalysiert. Dies sind natürlich vorkommende Enzyme, die die Entfernung von 5'-Flap verarbeiten, die während zellulärer Prozesse, einschließlich der DNA-Replikation, gebildet werden. Die hier beschriebenen Prime-Editing- Verfahren können endogen bereitgestellte Flap-Endonukleasen oder solche, die in trans bereitgestellt werden, verwenden, um den 5'-Flap der endogenen DNA zu entfernen, der während des Prime-Editings an der Zielstelle gebildet wird. Flap-Endonukleasen sind in der Technik bekannt und werden beschrieben in Patel et al., „Flap endonucleases pass 5'-flaps through a flexible arch using a disorder-thread-order mechanism to confer specificity for free 5'-ends,“ Nucleic Acids Research, 2012, 40(10): 4507-4519, Tsutakawa et al., „Human flap endonuclease structures, DNA double-base flipping, and a unified understanding of the FEN1 superfamily,“ Cell, 2011, 145(2): 198-211, und Balakrishnan et al., „Flap Endonuclease 1,“ Annu Rev Biochem, 2013, Vol 82: 119-138 (die hier jeweils durch Bezugnahme aufgenommen sind). Eine beispielhafte Flap-Endonuklease ist FEN1, die durch die folgende Aminosäuresequenz dargestellt werden kann:

BESCHREIBUNG SEQUENZ SEQ- ID- NR.:

FEN1 WILD TYPE
SEQ- ID-NR: 7
Funktionelles Äquivalent
Der Begriff „funktionelles Äquivalent“ bezieht sich auf ein zweites Biomolekül, das in seiner Funktion, aber nicht unbedingt in seiner Struktur einem ersten Biomolekül gleichwertig ist. Ein „Cas9-Äquivalent“ bezieht sich beispielsweise auf ein Protein, das die gleichen oder im Wesentlichen die gleichen Funktionen wie Cas9 hat, aber nicht unbedingt die gleiche Aminosäuresequenz. Im Zusammenhang mit der Erfindung bezieht sich die Spezifikation durchgehend auf „ein Protein X oder ein funktionelles Äquivalent davon“. In diesem Zusammenhang umfasst ein „funktionelles Äquivalent“ von Protein X jedes Homolog, Paralog, Fragment, jede natürlich vorkommende, manipulierte, mutierte oder synthetische Version von Protein X, die eine äquivalente Funktion aufweist.
Fusionsprotein
Der Begriff „Fusionsprotein“, wie er hier verwendet wird, bezieht sich auf ein hybrides Polypeptid, das Proteindomänen von mindestens zwei verschiedenen Proteinen umfasst. Ein Protein kann sich am aminoterminalen (N-terminalen) Teil des Fusionsproteins oder am carboxyterminalen (C-terminalen) Protein befinden und bildet somit ein „aminoterminales Fusionsprotein“ bzw. ein „carboxyterminales Fusionsprotein“. Ein Protein kann verschiedene Domänen umfassen, zum Beispiel eine Nukleinsäure-Bindungsdomäne(z. B. die gRNA- Bindungsdomäne von Cas9, die die Bindung des Proteins an eine Zielstelle steuert) und eine Nukleinsäure-Spaltungsdomäne oder eine katalytische Domäne eines Nukleinsäure- Editierproteins. Ein weiteres Beispiel ist Cas9 oder ein Äquivalent davon zu einer reversen Transkriptase. Jedes der hier angebotenen Proteine kann durch jede in der Technik bekannte Methode hergestellt werden. Zum Beispiel können die hier angebotenen Proteine durch rekombinante Proteinexpression und -reinigung hergestellt werden, was sich besonders für Fusionsproteine eignet, die einen Peptidlinker enthalten. Die Verfahren zur Expression und Reinigung rekombinanter Proteine sind allgemein bekannt und werden unter anderem beschrieben von Green und Sambrook, Molecular Cloning: A Laboratory Manual (4^th ed, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (2012)), dessen gesamter Inhalt hier durch Verweis aufgenommen wird.
Gen von Interesse (GOI)
Der Begriff „Gen von Interesse“ oder „GOI“ bezieht sich auf ein Gen, das für ein Biomolekül von Interesse kodiert (z. B. ein Protein oder ein RNA-Molekül). Ein Protein von Interesse kann ein intrazelluläres Protein, ein Membranprotein oder ein extrazelluläres Protein sein, z. B. ein Kernprotein, ein Transkriptionsfaktor, ein Kernmembrantransporter, ein mit einer intrazellulären Organelle assoziiertes Protein, ein Membranrezeptor, ein katalytisches Protein, ein Enzym, ein therapeutisches Protein, ein Membranprotein, ein Membrantransportprotein, ein Signaltransduktionsprotein oder ein immunologisches Protein (z. B. ein IgG- oder anderes Antikörperprotein) usw. Das Gen von Interesse kann auch für ein RNA-Molekül kodieren, einschließlich, aber nicht beschränkt auf Boten-RNA (mRNA), Transfer-RNA (tRNA), ribosomale RNA (rRNA), kleine Kern-RNA (snRNA), Antisense- RNA, Guide-RNA, microRNA (miRNA), small interfering RNA (siRNA) und zellfreie RNA (cfRNA).
Guide-RNA („gRNA“)
Wie hier verwendet, ist der Begriff „Guide-RNA“ eine besondere Art von Guide- Nukleinsäure, die meist mit einem Cas-Protein eines CRISPR-Cas9 assoziiert ist und die mit Cas9 assoziiert und das Cas9-Protein zu einer bestimmten Sequenz in einem DNA-Molekül lenkt, die Komplementarität zur Protospacer-Sequenz der Guide-RNA aufweist. Dieser Begriff umfasst jedoch auch die äquivalenten Leitnukleinsäuremoleküle, die mit Cas9- Äquivalenten, Homologen, Orthologen oder Paralogen assoziiert sind, unabhängig davon, ob sie natürlich vorkommen oder nicht (z. B. gentechnisch verändert oder rekombinant), und die das Cas9-Äquivalent anderweitig darauf programmieren, sich an einer bestimmten Zielnukleotidsequenz zu lokalisieren. Die Cas9-Äquivalente können andere napDNAbp von jedem Typ von CRISPR-Systemen (z. B. Typ II, V, VI) umfassen, einschließlich Cpfl (ein Typ-V-CRISPR-Cas-System), C2c1 (ein Typ-V-CRISPR-Cas-System), C2c2 (ein Typ-VI- CRISPR-Cas-System) und C2c3 (ein Typ-V-CRISPR-Cas-System). Weitere Cas-Äquivalente sind beschrieben in Makarova et al., „C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector“, Science 2016; 353(6299), dessen Inhalt hier durch Bezugnahme aufgenommen wird. Beispielhafte Sequenzen und Strukturen von Guide-RNAs sind hier aufgeführt. Darüber hinaus werden hier Verfahren zum Entwurf geeigneter Guide- RNA-Sequenzen vorgestellt. Wie hier verwendet, kann die „Guide RNA“ auch als „traditionelle Guide-RNA“ bezeichnet werden, um sie von den modifizierten Formen der Guide-RNA zu unterscheiden, die als „prime editing Guide-RNAs“ (oder „pegRNAs“) bezeichnet werden und für die hier offengelegten Prime Editing Verfahren und Zusammensetzungen erfunden wurden.
Guide-RNAs oder pegRNAs können verschiedene Strukturelemente umfassen, die unter anderem Folgendes beinhalten:
Spacer-Sequenz - die Sequenz in der Guide-RNA oder pegRNA (mit einer Länge von etwa 20 nts), die an den Protospacer in der Ziel-DNA bindet.
gRNA-Kern (oder gRNA-Gerüst oder Rückgrat-Sequenz) - bezieht sich auf die Sequenz innerhalb der gRNA, die für die Bindung von Cas9 verantwortlich ist. Sie umfasst nicht die 20 bp Spacer/Targeting-Sequenz, die verwendet wird, um Cas9 zur Ziel-DNA zu führen.
Erweiterungsarm - eine Einzelstrangerweiterung am 3'-Ende oder am 5'-Ende der pegRNA, die eine Primer-Bindungsstelle und eine DNA-Synthese-Templaten-Sequenz umfasst, die über eine Polymerase (z. B. eine reverse Transkriptase) einen einzelsträngigen DNA-Flap kodiert, der die gewünschte genetische Veränderung enthält, der dann in die endogene DNA integriert wird, indem der entsprechende endogene Strang ersetzt wird, wodurch die gewünschte genetische Veränderung installiert wird.
Transkriptionsterminator - die Guide-RNA oder pegRNA kann eine Transkriptionsterminationssequenz am 3' des Moleküls enthalten.
Homologiearm
Der Begriff „Homologiearm“ bezieht sich auf einen Teil des Erweiterungsarms, der für einen Teil des resultierenden, durch reverse Transkriptase kodierten Einzelstrang-DNA-Flaps kodiert, der durch Ersetzen des endogenen Strangs in die Ziel-DNA-Stelle integriert werden soll. Der Teil des Einzelstrang-DNA-Flaps, der durch den Homologiearm kodiert wird, ist komplementär zum nicht-editierten Strang der Ziel-DNA-Sequenz, was die Verdrängung des endogenen Strangs und das Anheften des Einzelstrang-DNA-Flaps an dessen Stelle erleichtert, wodurch die Editierung installiert wird. Diese Komponente wird an anderer Stelle näher definiert. Der Homologiearm ist Teil der DNA-Synthese-Template, da er per Definition von der Polymerase der hier beschriebenen Prime-Editoren kodiert wird.
Wirtszelle
Der Begriff „Wirtszelle“, wie er hier verwendet wird, bezieht sich auf eine Zelle, die einen hier beschriebenen Vektor beherbergen, replizieren und exprimieren kann, z. B. einen Vektor, der ein Nukleinsäuremolekül umfasst, das für ein Fusionsprotein kodiert, das ein Cas9 oder Cas9-Äquivalent und eine reverse Transkriptase umfasst.
Inteins
Wie hier verwendet, bezieht sich der Begriff „Intein“ auf selbstverarbeitende Polypeptid-Domänen, die in Organismen aus allen Bereichen des Lebens vorkommen. Ein Intein (intervenierendes Protein) führt ein einzigartiges automatisches Verarbeitungsereignis durch, das als Proteinspleißen bekannt ist. Dabei schneidet es sich selbst aus einem größeren Vorläuferpolypeptid durch die Spaltung von zwei Peptidbindungen heraus und bindet dabei die flankierenden Extein-Sequenzen (externe Proteine) durch die Bildung einer neuen Peptidbindung. Diese Umstrukturierung erfolgt posttranslational (oder möglicherweise kotranslational), da Intein-Gene im Rahmen anderer proteinkodierender Gene eingebettet sind. Darüber hinaus erfolgt das Intein-vermittelte Proteinspleißen spontan; es erfordert keinen externen Faktor oder eine Energiequelle, sondern lediglich die Faltung der Intein-Domäne. Dieser Prozess wird auch als cis-Proteinspleißen bezeichnet, im Gegensatz zum natürlichen Prozess des trans-Proteinspleißens mit „gespaltenen Internen“. Inteins sind das Protein- Äquivalent der sich selbst spaltenden RNA-Introns (siehe Perler et al., Nucleic Acids Res. 22:1125-1127 (1994)), die ihre eigene Exzision von einem Vorläuferprotein mit der gleichzeitigen Fusion der flankierenden Proteinsequenzen, den so genannten Exteinen, katalysieren (Übersicht in Perler et al., Curr. Opin. Chem. Biol. 1 :292-299 (1997); Perler, F. B. Cell 92(1):1-4 (1998); Xu et al., EMBO J. 15(19):5146-5153 (1996)).
Wie hier verwendet, bezieht sich der Begriff „Proteinspleißen“ auf einen Prozess, bei dem eine innere Region eines Vorläuferproteins (ein Intein) herausgeschnitten wird und die flankierenden Regionen des Proteins (Exteine) ligiert werden, um das reife Protein zu bilden. Dieser natürliche Prozess wurde bei zahlreichen Proteinen sowohl von Prokaryoten als auch von Eukaryoten beobachtet (Perler, F. B., Xu, M. Q., Paulus, H. Current Opinion in Chemical Biology 1997, 1, 292-299; Perler, F. B. Nucleic Acids Research 1999, 27, 346-347). Die Intein-Einheit enthält die notwendigen Komponenten, die für die Katalyse des Proteinspleißens erforderlich sind, und enthält oft eine Endonuklease-Domäne, die an der Intein-Mobilität beteiligt ist (Perler, F. B., Davis, E. O., Dean, G. E., Gimble, F. S., Jack, W. E., Neff, N., Noren, C. J., Thomer, J., Belfort, M. Nucleic Acids Research 1994, 22, 1127-1127). Die resultierenden Proteine sind miteinander verbunden, werden aber nicht als separate Proteine exprimiert. Das Spleißen von Proteinen kann auch in trans erfolgen, wobei sich auf getrennten Polypeptiden exprimierte Split-Inteine spontan zu einem einzigen Intein verbinden, das dann den Proteinspleißprozess durchläuft, um sich zu getrennten Proteinen zu verbinden.
Die Aufklärung des Mechanismus des Proteinspleißens hat zu einer Reihe von Inteinbasierten Anwendungen geführt (Comb, et al., U.S.. Pat. Nr. 5.496.714 ; Comb, et al., U.S. Pat. Nr. 5.834.247 ; Camarero und Muir, J. Amer. Chem. Soc., 121:5597-5598 (1999); Chong, et al., Gene, 192:271-281 (1997), Chong, et al., Nucleic Acids Res., 26:5109-5115 (1998); Chong, et al., J. Biol. Chem., 273:10567-10577 (1998); Cotton, et al. J. Am. Chem. Soc., 121:1100-1101 (1999); Evans, et al., J. Biol. Chem., 274:18359-18363 (1999); Evans, et al., J. Biol. Chem., 274:3923-3926 (1999); Evans, et al., Protein Sci., 7:2256-2264 (1998); Evans, et al., J. Biol. Chem., 275:9091-9094 (2000); Iwai und Pluckthun, FEBS Lett. 459:166-172 (1999); Mathys, et al., Gene, 231:1-13 (1999); Mills, et al., Proc. Natl. Acad. Sci. USA 95:3543-3548 (1998); Muir, et al., Proc. Natl. Acad. Sci. USA 95:6705-6710 (1998); Otomo, et al., Biochemistry 38:16040-16044 (1999); Otomo, et al., J. Biolmol. NMR 14:105-114 (1999); Scott, et al., Proc. Natl. Acad. Sci. USA 96:13638-13643 (1999); Severinov und Muir, J. Biol. Chem., 273:16205-16209 (1998); Shingledecker, et al., Gene, 207:187-195 (1998); Southworth, et al., EMBO J. 17:918-926 (1998); Southworth, et al., Biotechniques, 27:110- 120 (1999); Wood, et al., Nat. Biotechnol., 17:889-892 (1999); Wu, et al., Proc. Natl. Acad. Sci. USA 95:9226-9231 (1998a); Wu, et al., Biochim Biophys Acta 1387:422-432 (1998b); Xu, et al., Proc. Natl. Acad. Sci. USA 96:388-393 (1999); Yamazaki, et al., J. Am. Chem. Soc., 120:5591-5592 (1998)). Jede Referenz wird hier durch Bezugnahme aufgenommen.
Ligandenabhängiges Intein
Der Begriff „ligandenabhängiges Intein“, wie er hier verwendet wird, bezieht sich auf ein Intein, das eine ligandenbindende Domäne umfasst. Typischerweise wird die ligandenbindende Domäne in die Aminosäuresequenz des Inteins eingefügt, was zu einer Struktur Intein (N) - ligandenbindende Domäne - Intein (C) führt. Typischerweise zeigen ligandenabhängige Inteine in Abwesenheit eines geeigneten Liganden keine oder nur eine minimale Proteinspleißaktivität und in Anwesenheit des Liganden einen deutlichen Anstieg der Proteinspleißaktivität. In einigen Ausführungsformen zeigt das ligandenabhängige Intein in Abwesenheit des Liganden keine beobachtbare Spleißaktivität, wohl aber in Gegenwart des Liganden. In einigen Ausführungsformen zeigt das ligandenabhängige Intein eine beobachtbare Proteinspleißaktivität in Abwesenheit des Liganden und eine Proteinspleißaktivität in Anwesenheit eines geeigneten Liganden, die mindestens 5-mal, mindestens 10-mal, mindestens 50-mal, mindestens 100-mal, mindestens 150-mal, mindestens 200-mal, mindestens 250-mal, mindestens 500-mal, mindestens 1000-mal, mindestens 1500- mal, mindestens 2000-mal, mindestens 2500-mal, mindestens 5000-mal, mindestens 10000- mal, mindestens 20000-mal, mindestens 25000-mal, mindestens 50000-mal, mindestens 100000-mal, mindestens 500000-mal oder mindestens 1000000-mal größer ist als die in Abwesenheit des Liganden beobachtete Aktivität. In einigen Ausführungsformen ist die Zunahme der Aktivität dosisabhängig über mindestens 1 Größenordnung, mindestens 2 Größenordnungen, mindestens 3 Größenordnungen, mindestens 4 Größenordnungen oder mindestens 5 Größenordnungen, was eine Feinabstimmung der Intein-Aktivität durch Anpassung der Ligandenkonzentration ermöglicht. Geeignete ligandenabhängige Inteine sind in der Technik bekannt und umfassen die unten aufgeführten und diejenigen, die beschrieben sind in den veröffentlichten U.S. Patentanmeldung U.S. 2014/0065711 A1; Mootz et al., „Protein splicing triggered by a small molecule“ J. Am. Chem. Soc. 2002; 124, 9044-9045; Mootz et al., „Conditional protein splicing: a new tool to control protein structure and function in vitro and in vivo.“ J. Am. Chem. Soc. 2003; 125, 10561-10569; Buskirk et al., Proc. Natl. Acad. Sci. USA. 2004; 101, 10505-10510); Skretas & Wood, „Regulation of protein activity with small-molecule-controlled inteins“ Protein Sci. 2005; 14, 523-532; Schwartz, et al., „Posttranslational enzyme activation in an animal via optimized conditional protein splicing“ Nat. Chem. Biol. 2007; 3, 50-54; Peck et al., Chem. Biol. 2011; 18 (5), 619-630; der gesamte Inhalt wird hiermit durch Bezugnahme aufgenommen. Beispielhafte Sequenzen sind wie folgt:

NAME SEQUENZ DES LIGANDENABHÄNGIGEN INTEINS

2-4 INTEIN:

3-2 INTEIN

30R3-1 INTEIN

30R3-2 INTEIN

30R3-3 INTEIN

37R3-1 INTEIN

37R3-2 INTEIN

37R3-3 INTEIN
Linker
Der Begriff „Linker“, wie er hier verwendet wird, bezieht sich auf ein Molekül, das zwei andere Moleküle oder Teile miteinander verbindet. Der Linker kann eine Aminosäuresequenz sein, wenn es sich um einen Linker handelt, der zwei Fusionsproteine verbindet. Zum Beispiel kann ein Cas9 durch eine Aminosäure-Linkersequenz an eine reverse Transkriptase fusioniert werden. Der Linker kann auch eine Nukleotidsequenz sein, wenn zwei Nukleotidsequenzen miteinander verbunden werden sollen. Im vorliegenden Fall ist die herkömmliche Guide-RNA beispielsweise über eine Spacer- oder Linker-Nukleotidsequenz mit der RNA-Erweiterung einer Prime-Editing-Guide-RNA verbunden, die eine RT-Template- Sequenz und eine RT-Primer-Bindungsstelle umfassen kann. In anderen Ausführungsformen ist der Linker ein organisches Molekül, eine Gruppe, ein Polymer oder eine chemische Einheit. In einigen Ausführungsformen ist der Linker 5-100 Aminosäuren lang, zum Beispiel 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 30-35, 35-40, 40-45, 45-50, 50-60, 60-70, 70-80, 80-90, 90-100, 100-150 oder 150-200 Aminosäuren lang. Längere oder kürzere Linker sind ebenfalls denkbar.
Isoliert
„Isoliert“ bedeutet verändert oder aus dem natürlichen Zustand entfernt. So ist beispielsweise eine Nukleinsäure oder ein Peptid, die von Natur aus in einem lebenden Tier vorhanden sind, nicht „isoliert“, aber dieselbe Nukleinsäure oder dasselbe Peptid, das teilweise oder vollständig von den koexistierenden Materialien seines natürlichen Zustands getrennt wurde, ist „isoliert“. Eine isolierte Nukleinsäure oder ein isoliertes Protein kann in weitgehend gereinigter Form vorliegen oder in einer nicht nativen Umgebung, wie z. B. Einer Wirtszelle, existieren.
In einigen Ausführungsformen wird ein Gen von Interesse von einer isolierten Nukleinsäure kodiert. Wie hier verwendet, bezieht sich der Begriff „isoliert“ auf die Eigenschaft eines Materials, das aus seiner ursprünglichen oder natürlichen Umgebung (z. B. Der natürlichen Umgebung, wenn es natürlich vorkommt) entfernt wurde. Daher wird ein natürlich vorkommendes Polynukleotid oder Protein oder Polypeptid, das in einem lebenden Tier vorhanden ist, nicht isoliert, sondern dasselbe Polynukleotid oder Polypeptid, das durch menschliches Eingreifen von einigen oder allen koexistierenden Materialien im natürlichen System abgetrennt wurde, wird isoliert. Ein künstliches oder manipuliertes Material, zum Beispiel ein nicht natürlich vorkommendes Nukleinsäurekonstrukt, wie die hier beschriebenen Expressionskonstrukte und Vektoren, werden dementsprechend auch als isoliert bezeichnet. Ein Material muss nicht gereinigt werden, um isoliert zu werden. Dementsprechend kann ein Material Teil eines Vektors und/oder Teil einer Zusammensetzung sein und dennoch isoliert sein, da dieser Vektor oder diese Zusammensetzung nicht Teil der Umgebung ist, in der das Material in der Natur vorkommt.
MS2 Markierungstechnik
In verschiedenen Ausführungsformen (z. B. Wie in den Ausführungsformen von FIG.. 72-73 und in Beispiel 19) bezieht sich der Begriff „MS2-Tagging-Technik“ auf die Kombination einer „RNA-Protein-Interaktionsdomäne“ (auch bekannt als „RNA-Protein- Rekrutierungsdomäne oder -protein“) mit einem RNA-bindenden Protein, das die RNA- Protein-Interaktionsdomäne spezifisch erkennt und an sie bindet, z. B. Eine spezifische Haarnadelstruktur. Diese Art von Systemen kann genutzt werden, um eine Vielzahl von Funktionalitäten an einen primären Editor-Komplex zu rekrutieren, der an eine Zielstelle gebunden ist. Die MS2-Tagging-Technik basiert auf der natürlichen Wechselwirkung des MS2-Bakteriophagen-Hüllproteins („MCP“ oder „MS2cp“) mit einer im Genom des Phagen vorhandenen Stielschleifen- oder Haarnadelstruktur, d. H. Der „MS2-Haarnadel“. Im Falle des Prime Editing umfasst die MS2-Tagging-Technik die Einführung der MS2-Haarnadel in ein gewünschtes RNA-Molekül, das am Prime Editing beteiligt ist (z. B. Eine pegRNA oder eine tPERT), die dann ein spezifisches interagierbares Bindungsziel für ein RNA-bindendes Protein darstellt, das diese Struktur erkennt und daran bindet. Im Falle des MS2-Hairpins wird es vom MS2-Bakteriophagen-Hüllprotein (MCP) erkannt und gebunden. Und wenn MCP mit einem anderen Protein fusioniert ist (z. B. Einer reversen Transkriptase oder einer anderen DNA- Polymerase), dann kann die MS2-Haarnadel dazu verwendet werden, dieses andere Protein in trans zu der vom Prime-Editing-Komplex besetzten Zielstelle zu „rekrutieren“.
Die hier beschriebenen Prime-Editoren können als einen Aspekt jede bekannte RNA- Protein-Interaktionsdomäne einbeziehen, um spezifische Funktionen von Interesse in einen Prime-Editor-Komplex zu rekrutieren oder zu „kolokalisieren“. Eine Übersicht über andere modulare RNA-Protein-Interaktionsdomänen ist in der Fachliteratur beschrieben, zum Beispiel in Johansson et al., „RNA recognition by the MS2 phage coat protein“, Sem Virol., 1997, Vol. 8(3): 176-185; Delebecque et al., „Organization of intracellular reactions with rationally designed RNA assemblies“, Science, 2011, Vol. 333: 470-474; Mali et al., „Cas9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering“, Nat. Biotechnol., 2013, Vol.31: 833-838; und Zalatan et al., „Engineering complex synthetic transcriptional programs with CRISPR RNA scaffolds,“ Cell, 2015, Vol. 160: 339-350, die hier in ihrer Gesamtheit durch Verweis einbezogen sind. Andere Systeme sind die PP7-Haarnadel, die speziell das PCP-Protein rekrutiert, und die „Com“- Haarnadel, die speziell das Com-Protein rekrutiert. Siehe Zalatan et al.
Die Nukleotidsequenz des MS2-Hairpins (oder gleichwertig als „MS2-Aptamer“ bezeichnet) ist: GCCAACATGAGGATCACCCATGTCTGCAGGGCC (SEQ-ID-NR.: 763).
Die Aminosäuresequenz des MCP oder MS2cp ist: GSASNFTQFVLVDNGGTGDVTVAPSNFANGVAEWISSNSRSQAYKVTCSVRQSSAQNRKYTI KVEVPKVATQTVGGEELPVAGWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIA ANSGIY (SEQ ID NO: 764).
Die MS2-Haarnadel (oder „MS2-Aptamer“) kann auch als eine Art „RNA-Effektor- Rekrutierungsdomäne“ (oder gleichwertig als „RNA-bindende Protein-Rekrutierungsdomäne“ oder einfach als „Rekrutierungsdomäne“) bezeichnet werden, da es sich um eine physikalische Struktur (z. B. Eine Haarnadel) handelt, die in eine pegRNA oder tPERT eingebaut ist und die effektiv andere Effektor-Funktionen (z. B. RNA-bindende Proteine mit verschiedenen Funktionen, wie DNA-Polymerasen oder andere DNA-modifizierende Enzyme) an die pegRNA oder rPERT rekrutiert, die auf diese Weise modifiziert wird, und somit Effektor- Funktionen in trans zur Prime-Editing-Maschinerie ko-lokalisiert. Diese Anwendung ist in keiner Weise auf bestimmte RNA-Effektor-Rekrutierungsdomänen beschränkt und kann jede verfügbare derartige Domäne umfassen, einschließlich der MS2-Haarnadel. Beispiel 19 und 72(b) zeigt die Verwendung des MS2-Aptamers, das mit einer DNA-Synthese-Domäne (d. H. Dem tPERT-Molekül) verbunden ist, und eines Prime-Editors, der ein mit einem PE2 fusioniertes MS2cp-Protein umfasst, um die Ko-Lokalisierung des an die Ziel-DNA-Stelle gebundenen Prime-Editor-Komplexes (MS2cp-PE2:sgRNA-Komplex) und der DNA- Synthese-Domäne des tPERT-Moleküls zu bewirken, um die
napDNAbp
Der hier verwendete Begriff „Nukleinsäure-programmierbares DNA-bindendes Protein“ oder „napDNAbp“, für das Cas9 ein Beispiel ist, bezieht sich auf Proteine, die die RNA:DNA-Hybridisierung nutzen, um spezifische Sequenzen in einem DNA-Molekül anzuvisieren und daran zu binden. Jedes napDNAbp ist mit mindestens einer Leitnukleinsäure (z. B. Guide-RNA) assoziiert, die das napDNAbp an einer DNA-Sequenz lokalisiert, die einen DNA-Strang (d. H. Einen Zielstrang) umfasst, der komplementär zu der Leitnukleinsäure oder einem Teil davon (z. B. Dem Protospacer einer Guide-RNA) ist. Mit anderen Worten: Die Leitnukleinsäure „programmiert“ das napDNAbp (z. B. Cas9 oder ein Äquivalent), eine komplementäre Sequenz zu lokalisieren und daran zu binden.
Ohne an eine Theorie gebunden zu sein, beinhaltet der Bindungsmechanismus eines napDNAbp - Guide-RNA-Komplexes im Allgemeinen den Schritt der Bildung einer R- Schleife, wodurch das napDNAbp die Abspulung eines doppelsträngigen DNA-Ziels induziert und dadurch die Stränge in der durch das napDNAbp gebundenen Region trennt. Der Protospacer der Guide-RNA hybridisiert dann mit dem „Zielstrang“. Dadurch wird ein „Nicht- Zielstrang“ verdrängt, der komplementär zum Zielstrang ist, der die Einzelstrangregion der R- Schleife bildet. In einigen Ausführungsformen enthält das napDNAbp eine oder mehrere Nuklease-Aktivitäten, die dann die DNA schneiden und verschiedene Arten von Läsionen hinterlassen. Zum Beispiel kann das napDNAbp eine Nukleaseaktivität aufweisen, die den Nicht-Zielstrang an einer ersten Stelle schneidet und/oder den Zielstrang an einer zweiten Stelle schneidet. Je nach Nukleaseaktivität kann die Ziel-DNA so geschnitten werden, dass ein „Doppelstrangbruch“ entsteht, bei dem beide Stränge geschnitten werden. In anderen Ausführungsformen kann die Ziel-DNA nur an einer einzigen Stelle geschnitten werden, d. H. Die DNA wird an einem Strang „eingekerbt“. Beispiele für napDNAbp mit unterschiedlichen Nuklease-Aktivitäten sind „Cas9 Nickase“ („nCas9“) und ein deaktiviertes Cas9 ohne Nuklease-Aktivitäten („dead Cas9“ oder „dCas9“). Beispielhafte Sequenzen für diese und andere napDNAbp sind hier aufgeführt.
Nickase
Der Begriff „Nickase“ bezieht sich auf ein Cas9, bei dem eine der beiden Nuklease- Domänen inaktiviert ist. Dieses Enzym ist in der Lage, nur einen Strang der Ziel-DNA zu spalten.
Nukleare Lokalisierungssequenz (NLS)
Der Begriff „nukleare Lokalisierungssequenz“ oder „NLS“ bezieht sich auf eine Aminosäuresequenz, die den Import eines Proteins in den Zellkern fördert, zum Beispiel durch Kerntransport. Nukleare Lokalisierungssequenzen sind in der Kunst bekannt und für den Fachmann offensichtlich. NLS-Sequenzen werden zum Beispiel in der internationalen PCT- Anmeldung PCT/ EP2000/011690 von Plank et al. Beschrieben, die am 23. November 2000 eingereicht und am 31. Mai 2001 als WO/2001/038547 veröffentlicht wurde und deren Inhalt durch Verweis auf die Offenlegung beispielhafter nuklearer Lokalisierungssequenzen hierin aufgenommen wird. In einigen Ausführungsformen umfasst ein NLS die Aminosäuresequenz PKKKRKV (SEQ-ID-NR.: 16) oder MDSLLMNRRKFLYQFKNVRWAKGRRETYLC (SEQ-ID-NR.: 17).
Nukleinsäure-Molekül
Der Begriff „Nukleinsäure“, wie er hier verwendet wird, bezieht sich auf ein Polymer aus Nukleotiden. Das Polymer kann natürliche Nukleoside (d. H. Adenosin, Thymidin, Guanosin, Cytidin, Uridin, Desoxyadenosin, Desoxythymidin, Desoxyguanosin und Desoxycytidin), Nukleosid-Analoga (z. B., 2-Aminoadenosin, 2-Thiothymidin, Inosin, Pyrrolo-Pyrimidin, 3-Methyladenosin, 5-Methylcytidin, C5-Bromuridin, C5-Fluoruridin, C5- Joduridin, C5-Propinyluridin, C5-Propinylcytidin, C5-Methylcytidin, 7-Deazaadenosin, 7- Deazaguanosin, 8-Oxoadenosin, 8-Oxoguanosin, O(6)-Methylguanin, 4-Acetylcytidin, 5- (Carboxyhydroxymethyl)uridin, Dihydrouridin, Methylpseudouridin, 1-Methyladenosin, 1- Methylguanosin, N6-Methyladenosin und 2-Thiocytidin), chemisch modifizierte Basen, biologisch modifizierte Basen (z.g., methylierte Basen), interkalierte Basen, modifizierte Zucker (z. B. 2'-Fluoribose, Ribose, 2`-Desoxyribose, 2'-O-Methylcytidin, Arabinose und Hexose) oder modifizierte Phosphatgruppen (z. B. Phosphorothioate und 5' N-Phosphoramidit- Bindungen) umfassen.
pegRNA
Wie hierin verwendet, beziehen sich die Begriffe „Prime-Editing-Guide-RNA“ oder „pegRNA“ oder „erweiterte Guide-RNA“ auf eine spezialisierte Form einer Guide-RNA, die so modifiziert wurde, dass sie eine oder mehrere zusätzliche Sequenzen zur Implementierung der hier beschriebenen Prime-Editing-Verfahren und -Zusammensetzungen enthält. Wie hier beschrieben, umfasst die Prime-Editing-Guide-RNA eine oder mehrere „erweiterte Regionen“ der Nukleinsäuresequenz. Die erweiterten Regionen können aus einzelsträngiger RNA oder DNA bestehen, sind aber nicht darauf beschränkt. Außerdem können die erweiterten Regionen am 3'-Ende einer herkömmlichen Guide-RNA auftreten. In anderen Anordnungen können die erweiterten Regionen am 5'-Ende einer herkömmlichen Guide-RNA auftreten. In noch anderen Anordnungen kann die erweiterte Region in einer intramolekularen Region der traditionellen Guide-RNA vorkommen, zum Beispiel in der gRNA-Kernregion, die mit dem napDNAbp assoziiert und/oder daran bindet. Die erweiterte Region umfasst eine „DNA- Synthese-Template“, die (durch die Polymerase des Prime Editors) für eine einzelsträngige DNA kodiert, die ihrerseits so konzipiert wurde, dass sie (a) homolog zu der zu editierenden endogenen Ziel-DNA ist und (b) mindestens eine gewünschte Nukleotidveränderung (z. B. Eine Transition, eine Transversion, eine Deletion oder eine Insertion) umfasst, die in die endogene Ziel-DNA eingeführt oder integriert werden soll. Die erweiterte Region kann auch andere funktionelle Sequenzelemente umfassen, wie z. B. Eine „Primer-Bindungsstelle“ und eine „Spacer- oder Linker-Sequenz“ oder andere Strukturelemente, wie z. B. Aptamere, Stammschleifen, Haarnadeln, Toeloop (z. B. Eine 3'-Toeloop) oder eine RNA-Protein- Rekrutierungsdomäne (z. B. MS2-Haarnadel). Wie hier verwendet, umfasst die „Primer- Bindungsstelle“ eine Sequenz, die an eine einzelsträngige DNA-Sequenz mit einem 3'-Ende hybridisiert, das aus der eingekerbten DNA der R-Schleife erzeugt wurde.
In bestimmten Ausführungsformen werden die pegRNAs durch 3A, die eine pegRNA mit einem 5' Erweiterungsarm, einem Spacer und einem gRNA-Kern zeigt, dargestellt. Die 5'-Erweiterung umfasst ferner in der 5'- bis 3'-Richtung eine Reverse- Transkriptase-Matrize, eine Primer-Bindungsstelle und einen Linker. Wie gezeigt, kann die Reverse-Transkriptase-Vorlage auch allgemeiner als „DNA-Synthese-Vorlage“ bezeichnet werden, wenn die Polymerase eines hier beschriebenen Prime Editors keine RT ist, sondern eine andere Art von Polymerase.
In bestimmten anderen Ausführungsformen werden die pegRNAs durch 3B, die eine pegRNA mit einem 5' Erweiterungsarm, einem Spacer und einem gRNA-Kern zeigt, dargestellt. Die 5'-Erweiterung umfasst ferner in der 5'- bis 3'-Richtung eine Reverse- Transkriptase-Matrize, eine Primer-Bindungsstelle und einen Linker. Wie gezeigt, kann die Reverse-Transkriptase-Vorlage auch allgemeiner als „DNA-Synthese-Vorlage“ bezeichnet werden, wenn die Polymerase eines hier beschriebenen Prime Editors keine RT ist, sondern eine andere Art von Polymerase.
In noch anderen Ausführungsformen werden die pegRNAs durch 3D dargestellt, die eine pegRNA zeigt, die in der 5' bis 3' Richtung einen Spacer (1), einen gRNA-Kern (2) und einen Erweiterungsarm (3) aufweist. Der Erweiterungsarm (3) befindet sich am 3'-Ende der pegRNA. Der Erweiterungsarm (3) umfasst ferner in der 5'- bis 3'-Richtung eine „Primer- Bindungsstelle“ (A), eine „Edit-Template“ (B) und einen „Homologiearm“ (C). Der Erweiterungsarm (3) kann auch eine optionale Modifikatorregion an den 3'- und 5'-Enden umfassen, bei denen es sich um dieselben Sequenzen oder unterschiedliche Sequenzen handeln kann. Darüber hinaus kann das 3'-Ende der pegRNA eine Transkriptionsterminatorsequenz umfassen. Diese Sequenzelemente der pegRNAs werden hier weiter beschrieben und definiert.
In noch anderen Ausführungsformen werden die pegRNAs durch 3E dargestellt, die eine pegRNA zeigt, die in der 5' bis 3' Richtung einen Erweiterungsarm (3), einen Spacer (1) und einen gRNA-Kern (2) aufweist. Der Erweiterungsarm (3) befindet sich am 5'-Ende der pegRNA. Der Erweiterungsarm (3) umfasst ferner in der 3'- bis 5'-Richtung eine „Primer- Bindungsstelle“ (A), eine „Editiervorlage“ (B) und einen „Homologiearm“ (C). Der Erweiterungsarm (3) kann auch eine optionale Modifikatorregion an den 3'- und 5'-Enden umfassen, bei denen es sich um dieselben Sequenzen oder unterschiedliche Sequenzen handeln kann. Die pegRNAs können auch eine Transkriptionsterminatorsequenz am 3'-Ende umfassen. Diese Sequenzelemente der pegRNAs werden hier weiter beschrieben und definiert.
PE1
Wie hier verwendet, bezieht sich „PE1“ auf einen PE-Komplex, der ein Fusionsprotein umfasst, das Cas9 (H840A) und ein unmutiertes MMLV-RT mit der folgenden Struktur enthält: [NLS]-[Cas9(H840A)]-[Linker]-[MMLV _RT(wt)] + eine gewünschte pegRNA, wobei die PE-Fusion die Aminosäuresequenz von SEQ-ID-NR.: 123 hat, die wie folgt dargestellt wird;
KEY:

NUCLEAR LOCALlZATION SEOUENCE (NLS) TOP:(SEQ ID NO: 124), BOTTOM: (SEQ ID NO: 133)
CAS9(H840A) (SEQ ID NO: 126)
33-AMINO ACID LINKER (SEQ ID NO: 127)
M-MLV Reverse Transkriptase (SEQ-ID-NR.: 128).

PE2
Wie hier verwendet, bezieht sich „PE2“ auf einen PE-Komplex, der ein Fusionsprotein umfasst, das Cas9(H840A) und eine Variante von MMLV RT mit der folgenden Struktur enthält: [NLS]-[Cas9(H840A)]-[Linker]- [MMLV_RT(D200N)(T330P)(L603W)(T306K)(W313F)] + eine gewünschte pegRNA, wobei die PE-Fusion die Aminosäuresequenz von SEQ-ID-NR. 134 hat, die wie folgt dargestellt wird:
KEY:

NUCLEAR LOCALIZATION SEQUENCE (NLS) TOP:(SEQ ID NO: 124), BOTTOM: (SEQ ID NO: 133)
CAS9(H840A) (SEQ ID NO: 137)
33-AMINO ACID LINKER (SEQ ID NO: 127)
M-MLV Reverse Transkriptase (SEQ-ID-NR.: 139).

PE3
Wie hier verwendet, bezieht sich „PE3“ auf PE2 plus eine Zweitstrang-Nicking-Guide- RNA, die mit PE2 einen Komplex bildet und einen Nick in den nicht-editierten DNA-Strang einführt, um eine bevorzugte Ersetzung des editierten Strangs zu bewirken.
PE3b
Wie hierin verwendet, bezieht sich „PE3b“ auf PE3, wobei die Zweitstrang-Nick- Guide-RNA für eine zeitliche Kontrolle ausgelegt ist, so dass der Zweitstrang-Nick erst nach der Installation des gewünschten Schnitts eingeführt wird. Dies wird erreicht, indem eine gRNA mit einer Spacer-Sequenz entworfen wird, die nur mit dem editierten Strang übereinstimmt, aber nicht mit dem ursprünglichen Allel. Bei dieser Strategie, die im Folgenden als PE3b bezeichnet wird, sollten Fehlpaarungen zwischen dem Protospacer und dem uneditierten Allel das Nicking durch die sgRNA benachteiligen, bis das Editing-Ereignis auf dem PAM-Strang stattgefunden hat.
PE-kurz
Wie hier verwendet, bezieht sich „PE-kurz“ auf ein PE-Konstrukt, das mit einer C- terminal abgeschnittenen reversen Transkriptase fusioniert ist und die folgende Aminosäuresequenz aufweist:
KEY:

NUCLEAR LOCALIZATION SEOUENCE (NLS) TOP:(SEQ ID NO: 124), BOTTOM: (SEQ ID NO: 133)
CAS9(H840A) (SEQ ID NO: 157)
33-AMINO ACID LINKER 1 (SEQ ID NO: 127)
M-MLV TRUNCATED REVERSE TRANSKRIPTASE
(SEQ-ID-NR.: 766)

Peptid-Tag
Der Begriff „Peptid-Tag“ bezieht sich auf eine Peptid-Aminosäuresequenz, die genetisch an eine Proteinsequenz fusioniert ist, um den Proteinen eine oder mehrere Funktionen zu verleihen, die die Manipulation des Proteins für verschiedene Zwecke erleichtern, wie z. B. Visualisierung, Reinigung, Solubilisierung und Trennung usw. Peptid-Tags können verschiedene Arten von Tags umfassen, die nach Zweck oder Funktion kategorisiert sind. Dazu gehören „Affinitäts-Tags“ (zur Erleichterung der Proteinreinigung), „Solubilisierungs-Tags“ (zur Unterstützung der richtigen Faltung von Proteinen), „Chromatographie-Tags“ (zur Veränderung der chromatographischen Eigenschaften von Proteinen), „Epitop-Tags“ (zur Bindung an hochaffine Antikörper), „Fluoreszenz-Tags“ (zur Erleichterung der Visualisierung von Proteinen in einer Zelle oder in vitro).
Polymerase
Wie hier verwendet, bezieht sich der Begriff „Polymerase“ auf ein Enzym, das einen Nukleotidstrang synthetisiert und das in Verbindung mit den hier beschriebenen Prime-Editor- Systemen verwendet werden kann. Die Polymerase kann eine „Template-abhängige“ Polymerase sein (d. H. Eine Polymerase, die einen Nukleotidstrang auf der Grundlage der Reihenfolge der Nukleotidbasen eines Template-Strangs synthetisiert). Die Polymerase kann auch eine „Template-unabhängige“ Polymerase sein (d. H. Eine Polymerase, die einen Nukleotidstrang synthetisiert, ohne dass ein Template-Strang erforderlich ist). Eine Polymerase kann auch als „DNA-Polymerase“ oder „RNA-Polymerase“ kategorisiert werden. In verschiedenen Ausführungsformen umfasst das Prime-Editor-System eine DNA- Polymerase. In verschiedenen Ausführungsformen kann die DNA-Polymerase eine „DNAabhängige DNA-Polymerase“ sein (d. H. Das Template-Molekül ist ein DNA-Strang). In solchen Fällen kann das DNA-Template-Molekül eine pegRNA sein, wobei der Erweiterungsarm einen DNA-Strang umfasst. In solchen Fällen kann die pegRNA als chimäre oder hybride pegRNA bezeichnet werden, die einen RNA-Teil (d. H. Die Guide-RNA- Komponenten, einschließlich des Spacers und des gRNA-Kerns) und einen DNA-Teil (d. H. Den Erweiterungsarm) umfasst. In verschiedenen anderen Ausführungsformen kann die DNA- Polymerase eine „RNA-abhängige DNA-Polymerase“ sein (d. H. Das Template-Molekül ist ein RNA-Strang). In solchen Fällen ist die pegRNA RNA, d. H. Sie enthält eine RNA- Erweiterung. Der Begriff „Polymerase“ kann sich auch auf ein Enzym beziehen, das die Polymerisation von Nukleotiden katalysiert (d. H. Die Polymerase-Aktivität). Im Allgemeinen beginnt das Enzym die Synthese am 3'-Ende eines Primers, der an eine Polynukleotid- Matrizen-Sequenz gebunden ist (z. B. Eine Primer-Sequenz, die an die Primer-Bindungsstelle einer pegRNA gebunden ist) und bewegt sich zum 5'-Ende des Matrizenstrangs. Eine „DNA- Polymerase“ katalysiert die Polymerisation von Desoxynukleotiden. Wie hier in Bezug auf eine DNA-Polymerase verwendet, umfasst der Begriff DNA-Polymerase ein „funktionelles Fragment davon“. Ein „funktionelles Fragment davon“ bezieht sich auf jeden Teil einer Wildtyp- oder mutierten DNA-Polymerase, der weniger als die gesamte Aminosäuresequenz der Polymerase umfasst und der unter mindestens einer Reihe von Bedingungen die Fähigkeit behält, die Polymerisation eines Polynukleotids zu katalysieren. Ein solches funktionelles Fragment kann als eigenständige Einheit existieren, oder es kann Bestandteil eines größeren Polypeptids sein, z. B. Eines Fusionsproteins.
Prime-Editing und Multi-Flap Prime-Editing
Wie hier verwendet, bezieht sich der Begriff „Prime Editing“ oder „klassisches Prime Editing“ auf einen Ansatz für das Gen-Editing unter Verwendung von napDNAbps, einer Polymerase (z. B. Einer reversen Transkriptase) und spezialisierten Guide-RNAs, die eine DNA-Synthese-Template zur Kodierung gewünschter neuer genetischer Informationen (oder zum Löschen genetischer Informationen) enthalten, die dann in eine Ziel-DNA-Sequenz eingebaut wird. Bestimmte Ausführungsformen des Prime Editing werden in den Ausführungsformen der 1A-1H und 72(a)-72(c) neben anderen FIGildungen beschrieben. Das klassische Prime Editing wird in der Veröffentlichung der Erfinder von Anzalone, A. V. Et al. Search-and-replace genome editing without double-strand breaks or donor DNA. Nature 576, 149-157 (2019) beschrieben, auf die hier in vollem Umfang Bezug genommen wird.
Prime Editing ist eine Plattform für das Genom-Editing, eine vielseitige und präzise Genom-Editing-Methode, bei der neue genetische Informationen direkt in eine bestimmte DNA-Stelle geschrieben werden, indem ein mit Nukleinsäure programmierbares DNA- Bindungsprotein („napDNAbp“) in Verbindung mit einer Polymerase (d. H., in Form eines Fusionsproteins oder auf andere Weise in trans mit dem napDNAbp), wobei das Prime- Editing-System mit einer Prime-Editing-(PE)-Guide-RNA („pegRNA“) programmiert ist, die sowohl die Zielstelle spezifiziert als auch die Synthese des gewünschten Schnitts in Form eines Ersatz-DNA-Strangs durch eine auf eine Guide-RNA (z. B. Am 5'- oder 3'-Ende oder an einem internen Teil einer Guide-RNA) aufgebrachte Erweiterung (entweder DNA oder RNA) vorgibt. Der Ersatzstrang, der den gewünschten Schnitt (z. B. Eine einzelne Nukleobase) enthält, hat die gleiche (oder eine homologe) Sequenz wie der endogene Strang (unmittelbar stromabwärts der Einkerbung) der zu editierenden Zielstelle (mit der Ausnahme, dass er die gewünschte Editierung enthält). Durch die DNA-Reparatur- und/oder Replikationsmaschinerie wird der endogene Strang stromabwärts der Einkerbung durch den neu synthetisierten Ersatzstrang ersetzt, der die gewünschte Editierung enthält. In einigen Fällen kann das Prime Editing als eine „Suchen-und-Ersetzen“-Technologie zur Genom-Editierung angesehen werden, da die Prime Editors, wie hier beschrieben, nicht nur die gewünschte zu editierende Zielstelle suchen und lokalisieren, sondern gleichzeitig einen Ersatzstrang kodieren, der eine gewünschte Editierung enthält und anstelle des entsprechenden endogenen DNA-Strangs der Zielstelle installiert wird. Die Prime Editors der vorliegenden Erfindung beziehen sich zum Teil auf die Entdeckung, dass der Mechanismus der Target-primed Reverse Transkription (TPRT) oder des „Prime Editing“ für die Durchführung von präzisem CRISPR/Cas-basiertem Genome Editing mit hoher Effizienz und genetischer Flexibilität genutzt oder angepasst werden kann (z. B. Wie in verschiedenen Ausführungsformen der 1A-1F). TPRT wird auf natürliche Weise von mobilen DNA-Elementen wie Nicht-LTR-Retrotransposons von Säugetieren und bakteriellen Introns^28,29 der Gruppe II verwendet. Die Erfinder haben Cas-Protein-Reverse-Transkriptase- Fusionen oder verwandte Systeme verwendet, um eine spezifische DNA-Sequenz mit einer Guide-RNA anzusteuern, einen Einzelstrang-Nick an der Zielstelle zu erzeugen und die eingenickte DNA als Primer für die reverse Transkription einer konstruierten Reverse- Transkriptase-Template zu verwenden, die mit der Guide-RNA integriert ist. Das Konzept beginnt zwar mit Prime-Editoren, die Reverse Transkriptase als DNA-Polymerase- Komponente verwenden, aber die hier beschriebenen Prime-Editoren sind nicht auf Reverse Transkriptasen beschränkt, sondern können die Verwendung praktisch jeder DNA-Polymerase umfassen. Auch wenn in der Anmeldung durchgängig von Prime-Editoren mit „reversen Transkriptasen“ die Rede ist, wird hier dargelegt, dass reverse Transkriptasen nur eine Art von DNA-Polymerase sind, die mit Prime-Editing arbeiten kann. Wenn also in der Spezifikation von einer „Reversen Transkriptase“ die Rede ist, sollte der Fachmann wissen, dass jede geeignete DNA-Polymerase anstelle der Reversen Transkriptase verwendet werden kann. So können die Prime-Editoren in einem Aspekt Cas9 (oder ein äquivalentes napDNAbp) umfassen, das so programmiert ist, dass es eine DNA-Sequenz anvisiert, indem es sie mit einer spezialisierten Guide-RNA (d. H. pegRNA) assoziiert, die eine Spacer-Sequenz enthält, die sich an ein Komplement eines Protospacers in der Ziel-DNA anlagert. Die spezialisierte Guide- RNA enthält auch neue genetische Informationen in Form einer Erweiterung, die für einen Ersatz-DNA-Strang kodiert, der eine gewünschte genetische Veränderung enthält und dazu dient, einen entsprechenden endogenen DNA-Strang an der Zielstelle zu ersetzen. Um die Informationen von der pegRNA auf die Ziel-DNA zu übertragen, beinhaltet der Mechanismus des Prime Editing das Einkerben der Zielstelle in einem Strang der DNA, um eine 3'- Hydroxylgruppe freizulegen. Die freiliegende 3'-Hydroxylgruppe kann dann dazu verwendet werden, die DNA-Polymerisation der edit-codierenden Erweiterung der pegRNA direkt an der Zielstelle zu starten. In verschiedenen Ausführungsformen kann die Erweiterung, die die Matrize für die Polymerisation des die Editierung enthaltenden Ersatzstrangs bereitstellt, aus RNA oder DNA gebildet sein. Im Falle einer RNA-Erweiterung kann die Polymerase des Prime Editors eine RNA-abhängige DNA-Polymerase sein (z.B. eine reverse Transkriptase). Im Falle einer DNA-Erweiterung kann die Polymerase des Prime Editors eine DNA-abhängige DNA-Polymerase sein. Der neu synthetisierte Strang (d. H. Der Ersatz-DNA-Strang, der den gewünschten Schnitt enthält), der durch die hierin offenbarten Prime-Editoren gebildet wird, wäre homolog zur genomischen Zielsequenz (d. H. Er hätte die gleiche Sequenz wie diese), mit Ausnahme des Einschlusses einer gewünschten Nukleotidänderung (z. B. Eine einzelne Nukleotidänderung, eine Deletion oder eine Insertion oder eine Kombination davon). Der neu synthetisierte (oder ersetzte) DNA-Strang kann auch als Einzelstrang-DNA-Flap bezeichnet werden, der mit dem komplementären homologen endogenen DNA-Strang um die Hybridisierung konkurriert und dadurch den entsprechenden endogenen Strang verdrängt. In bestimmten Ausführungsformen kann das System mit der Verwendung eines fehleranfälligen Enzyms der Reversen Transkriptase kombiniert werden (z. B. Als Fusionsprotein mit der Cas9- Domäne oder in trans mit der Cas9-Domäne). Das fehleranfällige Enzym Reverse Transkriptase kann während der Synthese der einzelsträngigen DNA-Flap Veränderungen einführen. So kann in bestimmten Ausführungsformen eine fehleranfällige reverse Transkriptase verwendet werden, um Nukleotidveränderungen in die Ziel-DNA einzuführen. Je nach der fehleranfälligen reversen Transkriptase, die mit dem System verwendet wird, können die Veränderungen zufällig oder nicht zufällig sein. Die Auflösung des hybridisierten Zwischenprodukts (bestehend aus dem von der reversen Transkriptase synthetisierten einzelsträngigen DNA-Flap, der an den endogenen DNA-Strang hybridisiert wurde) kann die Entfernung des resultierenden verdrängten Flaps der endogenen DNA (z. B. Mit einer 5'-End- DNA-Flap-Endonuklease, FEN1), die Ligation des synthetisierten einzelsträngigen DNA- Flaps an die Ziel-DNA und die Assimilation der gewünschten Nukleotidveränderung als Ergebnis der zellulären DNA-Reparatur- und/oder Replikationsprozesse umfassen. Da die Template-gestützte DNA-Synthese eine nukleotidgenaue Modifikation jedes beliebigen Nukleotids, einschließlich Insertionen und Deletionen, ermöglicht, ist der Anwendungsbereich dieses Ansatzes sehr breit gefächert und könnte vorhersehbar für unzählige Anwendungen in der Grundlagenforschung und in der Therapeutik genutzt werden.
In verschiedenen Ausführungsformen erfolgt das Prime-Editing durch den Kontakt eines Ziel-DNA-Moleküls (für das eine Änderung in der Nukleotidsequenz eingeführt werden soll) mit einem Nukleinsäure-programmierbaren DNA-bindenden Protein (napDNAbp), das mit einer Prime-Editing-Guide-RNA (pegRNA) komplexiert ist. Unter Bezugnahme auf 1G umfasst die Prime-Editing-Guide-RNA (pegRNA) eine Erweiterung am 3'- oder 5'-Ende der Guide-RNA oder an einer intramolekularen Stelle in der Guide-RNA und kodiert die gewünschte Nukleotidänderung (z. B. Eine einzelne Nukleotidänderung, Insertion oder Deletion). In Schritt (a) kontaktiert der napDNAbp/erweiterte gRNA-Komplex das DNA- Molekül und die erweiterte gRNA leitet die napDNAbp zur Bindung an einen Ziel-Locus. In Schritt (b) wird eine Einkerbung in einen der DNA-Stränge des Ziellocus eingeführt (z. B. Durch eine Nuklease oder einen chemischen Wirkstoff), wodurch ein verfügbares 3'-Ende in einem der Stränge des Ziellocus entsteht. In bestimmten Ausführungsformen wird der Nick in dem DNA-Strang erzeugt, der dem R-Loop-Strang entspricht, d. H. Dem Strang, der nicht mit der RNA-Führungssequenz hybridisiert ist, d. H. Dem „Nicht-Ziel-Strang“. Der Einschnitt kann jedoch in einem der beiden Stränge erfolgen. Das heißt, der Nick könnte in den „Zielstrang“ der R-Schleife (d. H. Den Strang, der mit dem Protospacer der erweiterten gRNA hybridisiert) oder in den „Nicht-Zielstrang“ (d. H. Den Strang, der den einzelsträngigen Teil der R-Schleife bildet und der komplementär zum Zielstrang ist) eingeführt werden. In Schritt (c) interagiert das 3'-Ende des DNA-Strangs (gebildet durch den Nick) mit dem erweiterten Teil der Guide-RNA, um die reverse Transkription zu starten (d. H. „Target-primed RT“). In bestimmten Ausführungsformen hybridisiert der DNA-Strang am 3'-Ende mit einer spezifischen RT-Priming-Sequenz auf dem erweiterten Teil der Guide-RNA, d. H. Der „Priming-Sequenz der reversen Transkriptase“ oder „Primer-Bindungsstelle“ auf der pegRNA. In Schritt (d) wird eine reverse Transkriptase (oder eine andere geeignete DNA-Polymerase) eingeführt, die einen einzelnen DNA-Strang vom 3'-Ende der Priming-Stelle zum 5'-Ende der Priming-Guide-RNA synthetisiert. Die DNA-Polymerase (z. B. Reverse Transkriptase) kann an das napDNAbp fusioniert werden oder alternativ in trans zu dem napDNAbp bereitgestellt werden. Dadurch wird ein einzelsträngiger DNA-Flap gebildet, der die gewünschte Nukleotidveränderung (z. B. Die Veränderung einer einzelnen Base, die Insertion oder die Deletion oder eine Kombination davon) enthält und der ansonsten homolog zur endogenen DNA an oder neben der Einkerbung ist. In Schritt (e) werden das napDNAbp und die Guide- RNA freigesetzt. Die Schritte (f) und (g) beziehen sich auf die Auflösung der einzelsträngigen DNA-Flap, so dass die gewünschte Nukleotidänderung in den Ziellocus eingebaut wird. Dieser Prozess kann in Richtung der gewünschten Produktbildung vorangetrieben werden, indem der entsprechende endogene 5`-DNA-Flap entfernt wird, der sich bildet, sobald der 3'- Einzelstrang-DNA-Flap in die endogene DNA-Sequenz eindringt und mit ihr hybridisiert. Ohne an eine Theorie gebunden zu sein, lösen die zelleigenen DNA-Reparatur- und Replikationsprozesse die fehlangepasste DNA auf, um die Nukleotidveränderung(en) einzubauen und das gewünschte veränderte Produkt zu bilden. Der Prozess kann auch in Richtung Produktbildung mit „second strand nicking“ getrieben werden, wie in 1F dargestellt. Bei diesem Prozess können mindestens eine oder mehrere der folgenden genetischen Veränderungen auftreten: Transversionen, Transitionen, Deletionen und Insertionen.
Der Begriff „Prime-Editor (PE)-System“ oder „Prime-Editor (PE)“ oder „PE-System“ oder „PE-Editiersystem“ bezieht sich auf die Zusammensetzungen, die an der hier beschriebenen Methode des Genom-Editierens unter Verwendung der Target-primed Reverse Transkription (TPRT) beteiligt sind, einschließlich, aber nicht beschränkt auf die napDNAbps, Reverse Transkriptasen, Fusionsproteine (z. B., die napDNAbps und reverse Transkriptasen umfassen), Prime-Editing-Guide-RNAs und Komplexe, die Fusionsproteine und Prime- Editing-Guide-RNAs umfassen, sowie Zusatzelemente, wie Zweitstrang-Nicking- Komponenten (z. B. Zweitstrang-sgRNAs) und Endonukleasen zur Entfernung von 5'- endogenen DNA-Flaps (z. B. FEN1), die dazu beitragen, den Prime-Editing-Prozess zur Bildung des editierten Produkts voranzutreiben.
Obwohl in den bisher beschriebenen Ausführungsformen die pegRNA ein einzelnes Molekül darstellt, das eine Guide-RNA (die ihrerseits eine Spacer-Sequenz und einen gRNA- Kern oder ein Gerüst umfasst) und einen 5'- oder 3'-Erweiterungsarm mit der Primer- Bindungsstelle und einer DNA-Synthese-Template umfasst (siehe z. B. 3D), kann die pegRNA auch die Form von zwei einzelnen Molekülen annehmen, die aus einer Guide-RNA und einer trans Prime Editor RNA-Vorlage (tPERT) bestehen, in der im Wesentlichen der Erweiterungsarm (einschließlich insbesondere der Primer-Bindungsstelle und der DNA- Synthese-Domäne) und eine RNA-Protein-Rekrutierungsdomäne (z. B., MS2-Aptamer oder - Haarnadel) in demselben Molekül enthält, das an einen modifizierten Prime-Editor-Komplex kolokalisiert oder rekrutiert wird, der ein tPERT-Rekrutierungsprotein (z. B. Das MS2cp- Protein, das an das MS2-Aptamer bindet) umfasst. Siehe 3G und 3H als Beispiel für ein tPERT, das mit Prime Editing verwendet werden kann.
Beim „Dual-Flap-Prime-Editing-System“ werden zwei pegRNAs verwendet, um gegensätzliche Stränge einer genomischen Stelle anzusteuern und die Synthese von zwei komplementären 3'-Flaps zu steuern, die die editierte DNA-Sequenz enthalten (91). Im Gegensatz zum klassischen Prime Editing muss das Paar der editierten DNA-Stränge (3'-Flaps) nicht direkt mit den 5'-Flaps der endogenen genomischen DNA konkurrieren, da stattdessen der komplementäre editierte Strang für die Hybridisierung zur Verfügung steht. Da beide Stränge des Duplex als editierte DNA synthetisiert werden, erübrigt sich beim Dual-Flap- Prime-Editing-System der Austausch des nicht-editierten komplementären DNA-Strangs, der beim klassischen Prime-Editing erforderlich ist. Stattdessen muss die zelluläre DNA- Reparaturmaschinerie nur die gepaarten 5'-Flaps (ursprüngliche genomische DNA) herausschneiden und die gepaarten 3'-Flaps (bearbeitete DNA) in den Locus einbinden. Daher besteht auch keine Notwendigkeit, in die neu synthetisierten DNA-Stränge Sequenzen aufzunehmen, die homolog zur genomischen DNA sind. Dies ermöglicht eine selektive Hybridisierung der neuen Stränge und erleichtert Bearbeitungen, die eine minimale genomische Homologie enthalten. Nuklease-aktive Versionen von Prime-Editoren, die beide Stränge der DNA schneiden, könnten ebenfalls verwendet werden, um die Entfernung der ursprünglichen DNA-Sequenz zu beschleunigen.
Wie das klassische Prime-Editing ist das Multi-Flap-Prime-Editing (einschließlich Dual-Flap- und Quadruple-Flap-Prime-Editing) eine vielseitige und präzise Genom-Editing- Methode, bei der neue genetische Informationen direkt in eine bestimmte DNA-Stelle geschrieben werden, indem ein programmierbares Nukleinsäure-DNA-Bindungsprotein („napDNAbp“) in Verbindung mit einer Polymerase (d. H., in Form eines Fusionsproteins oder auf andere Weise in trans mit dem napDNAbp), wobei das Prime-Editing-System mit einer Prime-Editing-(PE)-Guide-RNA („pegRNA“) programmiert ist, die sowohl die Zielstelle spezifiziert als auch die Synthese des gewünschten Schnitts in Form eines Ersatz-DNA-Strangs durch eine auf eine Guide-RNA (z. B. Am 5'- oder 3'-Ende oder an einem internen Teil einer Guide-RNA) aufgebrachte Erweiterung (entweder DNA oder RNA) vorgibt. Der Ersatzstrang, der den gewünschten Schnitt (z. B. Eine einzelne Nukleobase Substitution) enthält, hat die gleiche Sequenz wie der endogene Strang der zu editierenden Zielstelle (mit der Ausnahme, dass er die gewünschte Editierung enthält). Durch die DNA-Reparatur- und/oder Replikationsmaschinerie wird der körpereigene Strang der Zielstelle durch den neu synthetisierten Ersatzstrang, der die gewünschte Editierung enthält, ersetzt. In einigen Fällen kann das Prime Editing als eine „Suchen-und-Ersetzen“-Technologie zur Genom-Editierung angesehen werden, da die Prime Editors, wie hier beschrieben, nicht nur die gewünschte zu editierende Zielstelle suchen und lokalisieren, sondern gleichzeitig einen Ersatzstrang kodieren, der eine gewünschte Editierung enthält und anstelle des entsprechenden endogenen DNA-Strangs der Zielstelle installiert wird.
Prime Editor
Das hier beschriebene duale Prime-Editing-System umfasst ein Paar Prime-Editoren. Der Begriff „Prime-Editor“ bezieht sich auf die hier beschriebenen Fusionskonstrukte, die eine napDNAbp (z. B. Cas9-Nickase) und eine reverse Transkriptase umfassen und in der Lage sind, Prime-Editing an einer Zielnukleotidsequenz in Gegenwart einer pegRNA (oder „erweiterten Guide-RNA“) durchzuführen. Der Begriff „Prime-Editor“ kann sich auf das Fusionsprotein oder auf das Fusionsprotein beziehen, das mit einer pegRNA komplexiert ist, und/oder weiter mit einer Zweitstrang-Nicking-sgRNA komplexiert ist. In einigen Ausführungsformen kann sich der Prime-Editor auch auf den Komplex beziehen, der ein Fusionsprotein (mit einem napDNAbp fusionierte reverse Transkriptase), eine pegRNA und eine reguläre Guide-RNA umfasst, die in der Lage ist, den Schritt des Einschneidens der zweiten Stelle des nicht-editierten Strangs zu steuern, wie hier beschrieben. In anderen Ausführungsformen kann die Reverse Transkriptase-Komponente des „Primer-Editors“ in trans bereitgestellt werden.
Das hier beschriebene Dual-Flap-Prime-Editing-System besteht aus einem Paar von Prime-Editoren. Das hier beschriebene Quadruple-Flap-Prime-Editing-System umfasst vier Prime-Editoren.
Primer-Bindungsstelle
Der Begriff „Primer-Bindungsstelle“ oder „die PBS“ bezieht sich auf die Nukleotidsequenz, die sich auf einer pegRNA als Bestandteil des Erweiterungsarms befindet (typischerweise am 3'-Ende des Erweiterungsarms) und dazu dient, an die Primersequenz zu binden, die nach dem Cas9-Nicking der Zielsequenz durch den Prime-Editor gebildet wird. Wie an anderer Stelle beschrieben, wird, wenn die Cas9-Nickase-Komponente eines Prime- Editors einen Strang der Ziel-DNA-Sequenz einschneidet, ein 3'-Enden ssDNA-Flap gebildet, der als Primer-Sequenz dient, die sich an die Primer-Bindungsstelle auf der pegRNA anlagert, um die reverse Transkription zu starten.
Promoter
Der Begriff „Promotor“ ist unter Fachleuten anerkannt und bezieht sich auf ein Nukleinsäuremolekül mit einer Sequenz, die von der zellulären Transkriptionsmaschinerie erkannt wird und in der Lage ist, die Transkription eines nachgeschalteten Gens einzuleiten. Ein Promotor kann konstitutiv aktiv sein, was bedeutet, dass der Promotor in einem bestimmten zellulären Kontext immer aktiv ist, oder bedingt aktiv, was bedeutet, dass der Promotor nur bei Vorliegen einer bestimmten Bedingung aktiv ist. So kann ein konditionaler Promotor beispielsweise nur in Anwesenheit eines spezifischen Proteins aktiv sein, das ein mit einem regulatorischen Element im Promotor assoziiertes Protein mit der grundlegenden Transkriptionsmaschinerie verbindet, oder nur in Abwesenheit eines hemmenden Moleküls. Eine Unterklasse der bedingt aktiven Promotoren sind induzierbare Promotoren, die die Anwesenheit eines kleinen Moleküls als „Induktor“ für ihre Aktivität benötigen. Beispiele für induzierbare Promotoren sind unter anderem Arabinose-induzierbare Promotoren, Tet-on- Promotoren und Tamoxifen-induzierbare Promotoren. Eine Vielzahl von konstitutiven, konditionalen und induzierbaren Promotoren ist den Fachleuten gut bekannt, und diese werden in der Lage sein, eine Vielzahl solcher Promotoren zu ermitteln, die für die Durchführung der vorliegenden Erfindung nützlich sind, die in dieser Hinsicht nicht beschränkt ist.
Protospacer
Wie hier verwendet, bezieht sich der Begriff „Protospacer“ auf die Sequenz (~20 bp) in der DNA, die an die PAM-Sequenz (Protospacer-benachbartes Motiv) angrenzt. Der Protospacer hat die gleiche Sequenz wie die Spacer-Sequenz der Guide-RNA. Die Guide-RNA bindet an das Komplement der Protospacer-Sequenz auf der Ziel-DNA (genauer gesagt, an einen Strang davon, d. H. Den „Zielstrang“ im Gegensatz zum „Nicht-Zielstrang“ der Ziel- DNA-Sequenz). Damit Cas9 funktionieren kann, benötigt es außerdem ein spezifisches Protospacer-benachbartes Motiv (PAM), das je nach Bakterienart des Cas9-Gens variiert. Die am häufigsten verwendete Cas9-Nuklease, die von S. Pyogenes stammt, erkennt eine PAM- Sequenz von NGG, die sich direkt stromabwärts der Zielsequenz in der genomischen DNA auf dem Nicht-Zielstrang befindet. Der Fachmann wird verstehen, dass in der Fachliteratur manchmal der „Protospacer“ als die ~20-nt zielspezifische Leitsequenz auf der Guide-RNA selbst bezeichnet wird, anstatt von einem „Spacer“ zu sprechen Daher kann in einigen Fällen der Begriff „Protospacer“, wie er hier verwendet wird, mit dem Begriff „Spacer“ gleichgesetzt werden. Der Kontext der Beschreibung, in dem der Begriff „Protospacer“ oder „Spacer“ auftaucht, wird dem Leser helfen zu erkennen, ob sich der Begriff auf die gRNA oder das DNA-Ziel bezieht.
Protospacer-benachbartes Motiv (PAM)
Wie hier verwendet, bezieht sich der Begriff „Protospacer-benachbarte Sequence“ oder „PAM“ auf eine DNA-Sequenz mit etwa 2-6 Basenpaaren, die eine wichtige Zielkomponente einer Cas9-Nuklease ist. Normalerweise befindet sich die PAM-Sequenz auf einem der beiden Stränge und liegt stromabwärts in der 5' bis 3' Richtung der Cas9-Schnittstelle. Die kanonische PAM-Sequenz (d. H. Die PAM-Sequenz, die mit der Cas9-Nuklease von Streptococcus pyogenes oder SpCas9 assoziiert ist) ist 5'-NGG-3', wobei „N“ eine beliebige Nukleobase, gefolgt von zwei Guanin-Nukleobasen („G“) ist. Verschiedene PAM-Sequenzen können mit verschiedenen Cas9-Nukleasen oder gleichwertigen Proteinen aus verschiedenen Organismen assoziiert werden. Darüber hinaus kann jede Cas9-Nuklease, z. B. SpCas9, modifiziert werden, um die PAM-Spezifität der Nuklease zu verändern, so dass die Nuklease eine andere PAM-Sequenz erkennt.
Bezugnehmend auf die kanonische SpCas9-Aminosäuresequenz SEQ-ID-NR.: 18, kann zum Beispiel die PAM-Sequenz durch die Einführung einer oder mehrerer Mutationen modifiziert werden, einschließlich (a) D1 135V, R1335Q und T1337R „die VQR-Variante“, die die PAM-Spezifität für NGAN oder NGNG verändert, (b) D1 135E, R1335Q und T1337R „die EQR-Variante“, die die PAM-Spezifität für NGAG verändert, und (c) D1135V, G1218R, R1335E und T1337R „die VRER-Variante“, die die PAM-Spezifität für NGCG verändert. Außerdem erkennt die D1 135E-Variante des kanonischen SpCas9 immer noch NGG, aber sie ist selektiver als das unmutierte SpCas9-Protein.
Es ist auch bekannt, dass Cas9-Enzyme aus verschiedenen bakteriellen Spezies (d. H. Cas9-Orthologe) unterschiedliche PAM-Spezifitäten haben können. Cas9 aus Staphylococcus aureus (SaCas9) erkennt zum Beispiel NGRRT oder NGRRN. Darüber hinaus erkennt Cas9 aus Neisseria meningitis (NmCas) NNNNGATT. In einem anderen Beispiel erkennt Cas9 aus Streptococcus thermophilis (StCas9) NNAGAAW. Ein weiteres Beispiel: Cas9 aus Treponema denticola (TdCas) erkennt NAAAAC. Dies sind Beispiele und nicht als Einschränkung gedacht. Es wird weiter deutlich, dass Nicht-SpCas9s eine Vielzahl von PAM- Sequenzen binden, was sie nützlich macht, wenn keine geeignete SpCas9-PAM-Sequenz an der gewünschten Zielschnittstelle vorhanden ist. Außerdem können Nicht-SpCas9s andere Eigenschaften haben, die sie nützlicher machen als SpCas9. Cas9 aus Staphylococcus aureus (SaCas9) ist beispielsweise etwa 1 Kilobase kleiner als SpCas9, so dass es in ein Adenoassoziiertes Virus (AAV) verpackt werden kann. Weitere Hinweise finden Sie in Shah et al., „Protospacer recognition motifs: mixed identities and functional diversity“, RNA Biology, 10(5): 891-899 (die hier durch Bezugnahme aufgenommen wird).
Rekombinase
Der Begriff „Rekombinase“, wie er hier verwendet wird, bezieht sich auf ein ortsspezifisches Enzym, das die Rekombination von DNA zwischen Rekombinase- Erkennungssequenzen vermittelt, was zur Exzision, Integration, Inversion oder zum Austausch (z. B. Translokation) von DNA-Fragmenten zwischen den Rekombinase- Erkennungssequenzen führt. Rekombinasen lassen sich in zwei verschiedene Familien einteilen: Serin-Rekombinasen(z. B. Resolvasen und Invertasen) und Tyrosin- Rekombinasen(z. B. Integrasen). Beispiele für Serin-Rekombinasen sind, ohne Einschränkung, Hin, Gin, Tn3, β-six, CinH, ParA, γδ, Bxb1, ϕC31, TP901, TG1, φBT1, R4, φRV1, φFC1, MR11, A118, U153 und gp29. Beispiele für Tyrosin-Rekombinasen sind, ohne Einschränkung, Cre, FLP, R, Lambda, HK101, HK022 und pSAM2. Die Namen Serin- und Tyrosin-Rekombinase stammen von dem konservierten nukleophilen Aminosäurerest, mit dem die Rekombinase die DNA angreift und der während des Strangaustauschs kovalent mit der DNA verbunden wird. Rekombinasen haben zahlreiche Anwendungen, darunter die Schaffung von Gen-Knockouts/Knock-ins und Gentherapie-Anwendungen. Siehe z .B.Brown et al., „Serine recombinases as tools for genome engineering" Methods. 2011 ;53(4):372-9; Hirano et al., „Site-specific recombinases as tools for heterologous gene integration." Appl. Microbiol. Biotechnol. 2011; 92(2):227-39; Chavez und Calos, „Therapeutic applications of the ΦC31 integrase system." Curr. Gene Ther. 2011;11(5):375-81; Turan und Bode, „Site-specific recombinases: from tag-and-target- to tag-and-exchange-based genomic modifications." FASEB J. 2011; 25(12):4088-107; Venken und Bellen, „Genome-wide manipulations of Drosophila melanogaster with transposons, Flp recombinase, and ΦC31 integrase." Methods Mol. Biol. 2012; 859:203-28; Murphy, „Phage recombinases and their applications" Adv. Virus Res. 2012; 83:367-414; Zhang et al., „Conditional gene manipulation: Cre-ating a new biological era." J. Zhejiang Univ. Sci. B. 2012; 13(7):511-24; Karpenshif und Bernstein, „From yeast to mammals: recent advances in genetic control of homologous recombination." DNA- Reparatur (Amst). 2012; 1;11(10):781-8 ; der gesamte Inhalt wird hiermit in vollem Umfang durch Bezugnahme aufgenommen. Die hier aufgeführten Rekombinasen sind nicht als exklusive Beispiele für Rekombinasen zu verstehen, die in Ausführungsformen der Erfindung verwendet werden können. Die Methoden und Zusammensetzungen der Erfindung können erweitert werden, indem Datenbanken nach neuen orthogonalen Rekombinasen durchsucht oder synthetische Rekombinasen mit definierten DNA-Spezifitäten entwickelt werden (siehe z .B. Groth et al., „Phage integrases: biology and applications" J. Mol. Biol. 2004; 335, 667-678; Gordley et al., „Synthese von programmierbaren Integrasen" Proc. Natl. Acad. Sci. U S A. 2009; 106, 5053-5058; der gesamte Inhalt wird hiermit in vollem Umfang durch Bezugnahme aufgenommen). Andere Beispiele für Rekombinasen, die in den hier beschriebenen Methoden und Zusammensetzungen nützlich sind, sind dem Fachmann bekannt, und es wird erwartet, dass jede neue Rekombinase, die entdeckt oder erzeugt wird, in den verschiedenen Ausführungsformen der Erfindung verwendet werden kann. In einigen Ausführungsformen sind die katalytischen Domänen einer Rekombinase an eine Nuklease-inaktivierte RNAprogrammierbare Nuklease(z. B. dCas9 oder ein Fragment davon) fusioniert, so dass die Rekombinase-Domäne keine Nukleinsäure-Bindungsdomäne umfasst oder nicht in der Lage ist, an eine Zielnukleinsäure zu binden (z. B. ist die Rekombinase-Domäne so konstruiert, dass sie keine spezifische DNA-Bindungsaktivität besitzt). Rekombinasen, denen es an DNA- Bindungsaktivität mangelt, und Methoden zur Herstellung solcher Rekombinasen sind bekannt, darunter jene beschrieben von Klippel et al., „Isolation and characterisation of unusual gin mutants" EMBO J. 1988; 7: 3983-3989: Burke et al., „Activating mutations of Tn3 resolvase marking interfaces important in recombination catalysis and its regulation. Mol Microbiol. 2004; 51: 937-948; Olorunniji et al., „Synapsis and catalysis by activated Tn3 resolvase mutants" Nucleic Acids Res. 2008; 36: 7181-7191; Rowland et al., „Regulatory mutations in Sin recombinase support a structure-based model of the synaptosome" Mol Microbiol. 2009; 74: 282-298; Akopian et al., „Chimeric recombinases with designed DNA sequence recognition." Proc Natl Acad Sci USA. 2003;100: 8688-8691; Gordley et al., „Evolution of programmable zinc finger-recombinases with activity in human cells. J Mol Biol. 2007; 367: 802-813; Gordley et al., „Synthesis of programmable integrases" Proc Natl Acad Sei USA. 2009; 106: 5053-5058; Amold et al., „Mutants of Tn3 resolvase which do not require accessory binding sites for recombination activity." EMBO J. 1999; 18: 1407-1414; Gaj et al., „Structure-guided reprogramming of serine recombinase DNA sequence specificity" Proc Natl Acad Sei USA. 2011;108(2):498-503; und Proudfoot et al., „Zinc finger recombinases with adaptable DNA sequence specificity." PloS One. 2011;6(4):e19537; der gesamte Inhalt ist hiermit durch Bezugnahme aufgenommen. Zum Beispiel haben die Serin-Rekombinasen der Resolvase-Invertase-Gruppe, z .B. die Tn3- und γδ-Resolvasen und die Hin- und Gin- Invertasen, modulare Strukturen mit autonomen katalytischen und DNA-bindenden Domänen (Siehe z. B. Grindley et al., „Mechanism of site-specific recombination“ Ann Rev Biochem. 2006; 75: 567-605, deren gesamter Inhalt durch Verweis einbezogen wird). Die katalytischen Domänen dieser Rekombinasen können daher mit Nuklease-inaktivierten RNAprogrammierbaren Nukleasen(z. B. dCas9 oder einem Fragment davon) rekombiniert werden, wie hier beschrieben, z .B. nach der Isolierung von „aktivierten“ Rekombinase-Mutanten, die keine zusätzlichen Faktoren(z. B. DNA-Bindungsaktivitäten) benötigen (siehe z. B. Klippel et al., „Isolation and characterisation of unusual gin mutants" EMBO J. 1988; 7: 3983-3989: Burke et al., „Activating mutations of Tn3 resolvase marking interfaces important in recombination catalysis and its regulation. MolMicrobiol. 2004; 51: 937-948; Olorunniji et al., „Synapsis and catalysis by activated Tn3 resolvase mutants" Nucleic Acids Res. 2008; 36: 7181-7191; Rowland et al., „Regulatory mutations in Sin recombinase support a structure- based model of the synaptosome" Mol Microbiol. 2009; 74: 282-298; Akopian et al., „Chimeric recombinases with designed DNA sequence recognition" Proc Natl Acad Sei USA. 2003;100: 8688-8691). Darüber hinaus sind viele andere natürliche Serin-Rekombinasen mit einer N-terminalen katalytischen Domäne und einer C-terminalen DNA-Bindungsdomäne bekannt (z. B. phiC31 Integrase, TnpX Transposase, IS607 Transposase), und ihre katalytischen Domänen können zur Entwicklung programmierbarer ortsspezifischer Rekombinasen, wie hier beschrieben, genutzt werden (siehe z. B. Smith et al., „Diversity in the serine recombinases" Mol Microbiol. 2002;44: 299-307, deren gesamter Inhalt durch Verweis einbezogen wird). Auch die katalytischen Kerndomänen von Tyrosin- Rekombinasen(z. B.Cre, λ-Integrase) sind bekannt und können in ähnlicher Weise genutzt werden, um programmierbare ortsspezifische Rekombinasen zu entwickeln, wie hier beschrieben (siehe z .B. Guo et al., „Structure of Cre recombinase complexed with DNA in a site-specific recombination synapse" Nature. 1997; 389:40-46; Hartung et al., „Cre mutants with altered DNA binding properties" J Biol Chem 1998; 273:22884-22891; Shaikh et al., „Chimeras of the Flp and Cre recombinases: Tests of the mode of cleavage by Flp and Cre. J Mol Biol. 2000; 302:27-48; Rongrong et al., „Effect of deletion mutation on the recombination activity of Cre recombinase" Acta Biochim Pol. 2005; 52:541-544; Kilbride et al., „Determinants of product topology in a hybrid Cre-Tn3 resolvase site-specific recombination system" J Mol Biol. 2006; 355:185-195; Warren et al., „A chimeric cre recombinase with regulated directionality" Proc Natl Acad Sci USA. 2008 105:18278-18283; Van Duyne, „Teaching Cre to follow directions" Proc Natl Acad Sci USA. 2009 Jan 6;106(1):4-5; Numrych et al., „A comparison of the effects of single-base and triple-base changes in the integrase armtype binding sites on the site-specific recombination of bacteriophage λ." Nucleic Acids Res. 1990; 18:3953-3959; Tirumalai et al., „The recognition of core-type DNA sites by λ integrase" J Mol Biol. 1998; 279:513-527; Aihara et al., „A conformational switch controls the DNA cleavage activity of λ integrase" Mol Cell. 2003; 12:187-198; Biswas et al., „A structural basis for allosteric control ofDNA recombination by λ integrase" Nature. 2005; 435:1059-1066; und Warren et al., „Mutations in the amino-terminal domain of λ-integrase have differential effects on integrative and excisive recombination" Mol Microbiol. 2005; 55:1104-1112; der gesamte Inhalt ist durch Bezugnahme aufgenommen).
Rekombinase-Erkennungssepuenz
Der Begriff „Rekombinase-Erkennungssequenz“ oder auch „RRS“ oder „Rekombinase-Zielsequenz“ oder „Rekombinasestelle“, wie er hier verwendet wird, bezieht sich auf eine Nukleotidsequenz, die von einer Rekombinase erkannt wird und die einen Strangaustausch mit einem anderen DNA-Molekül erfährt, das eine RRS aufweist, was zu Exzision, Integration, Inversion oder Austausch von DNA-Fragmenten zwischen den Rekombinase-Erkennungssequenzen führt. In verschiedenen Ausführungsformen können die Multi-Strang-Prime-Editoren eine oder mehrere Rekombinasestellen in einer Zielsequenz oder in mehr als einer Zielsequenz installieren. Wenn mehr als eine Rekombinasestelle von einem Multi-Strang-Prime-Editor installiert wird, können die Rekombinasestellen an benachbarten Zielstellen oder nicht benachbarten Zielstellen (z. B. Getrennten Chromosomen) installiert werden. In verschiedenen Ausführungsformen können einzelne installierte Rekombinasestellen als „Landestellen“ für eine rekombinasevermittelte Reaktion zwischen der genomischen Rekombinasestelle und einer zweiten Rekombinasestelle in einem exogen zugeführten Nukleinsäuremolekül, z. B. Einem Plasmid, verwendet werden. Dies ermöglicht die gezielte Integration eines gewünschten Nukleinsäuremoleküls. In anderen Ausführungsformen, bei denen zwei Rekombinasestellen in benachbarte DNA-Regionen eingefügt werden (z. B. Mit einem Abstand von 25-50 bp, 50-100 bp, 100-200 bp, 200-300 bp, 300-400 bp, 400-500 bp, 500-600 bp, 600-700 bp, 700-800 bp, 800-900 bp, 900-1000 bp, 1000-2000 bp, 2000-3000 bp, 3000-4000 bp, 4000-5000 bp oder mehr), die Rekombinasestellen können für die rekombinasevermittelte Exzision oder Inversion der intervenierenden Sequenz oder für den rekombinasevermittelten Kassettenaustausch mit exogener DNA mit denselben Rekombinasestellen verwendet werden. Wenn die zwei oder mehr Rekombinasestellen durch Multi-Flap-Prime-Editoren auf zwei verschiedenen Chromosomen installiert werden, kann es zu einer Translokation der intervenierenden Sequenz von einer ersten chromosomalen Stelle zur zweiten kommen.
Rekombinieren oder Rekombination
Der Begriff „rekombinieren“ oder „Rekombination“ bezieht sich im Zusammenhang mit einer Nukleinsäuremodifikation (z. B. Einer genomischen Modifikation) auf den Prozess, bei dem zwei oder mehr Nukleinsäuremoleküle oder zwei oder mehr Regionen eines einzelnen Nukleinsäuremoleküls durch die Wirkung eines Rekombinaseproteins (z. B. Eines hierin enthaltenen erfindungsgemäßen Rekombinase-Fusionsproteins) modifiziert werden. Die Rekombination kann unter anderem zu einer Insertion, Inversion, Exzision oder Translokation von Nukleinsäuren führen, z. B. In oder zwischen einem oder mehreren Nukleinsäuremolekülen.
Reverse Transkriptase
Der Begriff „Reverse Transkriptase“ beschreibt eine Klasse von Polymerasen, die als RNA-abhängige DNA-Polymerasen bezeichnet werden. Alle bekannten reversen Transkriptasen benötigen einen Primer, um ein DNA-Transkript aus einer RNA-Vorlage zu synthetisieren. In der Vergangenheit wurde die reverse Transkriptase vor allem dazu verwendet, mRNA in cDNA zu transkribieren, die dann zur weiteren Bearbeitung in einen Vektor kloniert werden kann. Die Reverse Transkriptase des Avian Myoblastosis Virus (AMV) war die erste weit verbreitete RNA-abhängige DNA-Polymerase (Verma, Biochim. Biophys. Acta 473:1 (1977)). Das Enzym hat 5'-3' RNA-gerichtete DNA-Polymerase- Aktivität, 5'-3' DNA-gerichtete DNA-Polymerase-Aktivität und Rnase H-Aktivität. Rnase H ist eine prozessive 5'- und 3'-Ribonuklease, die spezifisch für den RNA-Strang für RNA-DNA- Hybride ist (Perbal, A Practical Guide to Molecular Cloning, New York: Wiley & Sons (1984)). Fehler in der Transkription können von der reversen Transkriptase nicht korrigiert werden, da den bekannten viralen reversen Transkriptasen die für das Korrekturlesen notwendige 3'-5'-Exonuklease-Aktivität fehlt (Saunders und Saunders, Microbial Genetics Applied to Biotechnology, London: Croom Helm (1987)). Eine detaillierte Studie über die Aktivität der reversen Transkriptase des AMV und die damit verbundene Rnase H-Aktivität wurde von Berger et al. In Biochemistry 22:2365-2372 (1983) vorgestellt. Eine weitere reverse Transkriptase, die in der Molekularbiologie häufig verwendet wird, ist die aus dem Moloney- Mausleukämievirus (M-MLV) stammende reverse Transkriptase. Siehe z. B. Gerard, G. R., DNA 5:271-279 (1986) und Kotewicz, M. L., et al., Gene 35:249-258 (1985). Es wurde auch eine M-MLV Reverse Transkriptase beschrieben, der die Rnase H Aktivität weitgehend fehlt. Siehe z. B. U.S. Pat. Nr. 5.244.797 . Die Erfindung sieht die Verwendung solcher reversen Transkriptasen oder von Varianten oder Mutanten davon vor.
Darüber hinaus sieht die Erfindung die Verwendung von reversen Transkriptasen vor, die fehleranfällig sind, d. H., die als fehleranfällige reverse Transkriptasen oder reverse Transkriptasen bezeichnet werden können, die den Einbau von Nukleotiden während der Polymerisation nicht mit hoher Zuverlässigkeit unterstützen. Während der Synthese des Einzelstrang-DNA-Flaps auf der Grundlage der RT-Vorlage, die mit der Guide-RNA integriert ist, kann die fehleranfällige reverse Transkriptase ein oder mehrere Nukleotide einführen, die nicht mit der RT-Vorlagensequenz übereinstimmen, wodurch Änderungen der Nukleotidsequenz durch fehlerhafte Polymerisation des Einzelstrang-DNA-Flaps entstehen. Diese Fehler, die während der Synthese des Einzelstrang-DNA-Flaps entstanden sind, werden dann durch Hybridisierung mit dem entsprechenden endogenen Zielstrang, Entfernung des endogenen verdrängten Strangs, Ligation und dann durch eine weitere Runde endogener DNA- Reparatur- und/oder Sequenzierungsprozesse in das Doppelstrangmolekül integriert.
Reverse Transkription
Der hier verwendete Begriff „reverse Transkription“ bezeichnet die Fähigkeit eines Enzyms, einen DNA-Strang (d. H. Komplementäre DNA oder cDNA) unter Verwendung von RNA als Vorlage zu synthetisieren. In einigen Ausführungsformen kann die reverse Transkription eine „fehleranfällige reverse Transkription“ sein, was sich auf die Eigenschaften bestimmter Enzyme der reversen Transkriptase bezieht, die in ihrer DNA- Polymerisationsaktivität fehleranfällig sind.
PACE
Der Begriff „Phagen-unterstützte kontinuierliche Evolution (PACE)“, wie er hier verwendet wird, bezieht sich auf die kontinuierliche Evolution, bei der Phagen als virale Vektoren eingesetzt werden. Das allgemeine Konzept der PACE-Technologie wurde beispielsweise in der internationalen PCT-Anmeldung PCT/US2009/056194 beschrieben, die am 8. September 2009 eingereicht und am 11. März 2010 als WO 2010/028347 veröffentlicht wurde; in der internationalen PCT-Anmeldung PCT/US2011/066747, die am 22. Dezember 2011 eingereicht und am 28. Juni 2012 als WO 2012/088381 veröffentlicht wurde; in der U.S.. Application, U.S. Patent Nr. 9.023.594 , ausgestellt am 5. Mai 2015, internationale PCT- Anmeldung, PCT/US2015/012022, eingereicht am 20. Januar 2015, veröffentlicht als WO 2015/134121 am 11. September 2015, und internationale PCT-Anmeldung, PCT/US2016/027795, eingereicht am 15. April 2016, veröffentlicht als WO 2016/168631 am 20. Oktober 2016, deren gesamter Inhalt hier durch Bezugnahme aufgenommen wird.
Phage
Der Begriff „Phage“, der hier austauschbar mit dem Begriff „Bakteriophage“ verwendet wird, bezieht sich auf ein Virus, das bakterielle Zellen infiziert. Phagen bestehen in der Regel aus einem äußeren Proteinkapsid, das genetisches Material umschließt. Das genetische Material kann ssRNA, dsRNA, ssDNA oder dsDNA sein, entweder in linearer oder zirkulärer Form. Phagen und Phagenvektoren sind dem Fachmann wohlbekannt und nichteinschränkende Beispiele für Phagen, die für die Durchführung der hier vorgesehenen PACE- Methoden nützlich sind, sind λ (Lysogen), T2, T4, T7, T12, R17, M13, MS2, G4, P1, P2, P4, Phi X174, N4, Φ6 und Φ29. In bestimmten Ausführungsformen ist der in der vorliegenden Erfindung verwendete Phage M13. Weitere geeignete Phagen und Wirtszellen sind für den Fachmann offensichtlich, und die Erfindung ist in diesem Punkt nicht beschränkt. Für eine beispielhafte Beschreibung weiterer geeigneter Phagen und Wirtszellen siehe Elizabeth Kutter und Alexander Sulakvelidze: Bacteriophages: Biology and Applications. CRC Press; 1. Auflage (Dezember 2004), ISBN: 0849313368; Martha R. J. Clokie und Andrew M. Kropinski: Bacteriophages: Methods and Protocols, Band 1: Isolation, Characterization, and Interactions (Methods in Molecular Biology) Humana Press; 1. Auflage (Dezember, 2008), ISBN: 1588296822; Martha R. J. Clokie und Andrew M. Kropinski: Bacteriophages: Methods and Protocols, Band 2: Molecular and Applied Aspects (Methods in Molecular Biology) Humana Press; 1. Auflage (Dezember 2008), ISBN: 1603275649, die hier vollständig durch Verweis auf die Offenlegung geeigneter Phagen und Wirtszellen sowie auf Methoden und Protokolle zur Isolierung, Kultur und Manipulation solcher Phagen einbezogen sind).
Protein, Peptid und Polypeptid
Die Begriffe „Protein“, „Peptid“ und „Polypeptid“ werden hier austauschbar verwendet und beziehen sich auf ein Polymer aus Aminosäureresten, die durch Peptidbindungen (Amide) miteinander verbunden sind. Die Begriffe beziehen sich auf ein Protein, Peptid oder Polypeptid jeglicher Größe, Struktur oder Funktion. In der Regel ist ein Protein, Peptid oder Polypeptid mindestens drei Aminosäuren lang. Ein Protein, Peptid oder Polypeptid kann sich auf ein einzelnes Protein oder eine Sammlung von Proteinen beziehen. Eine oder mehrere der Aminosäuren in einem Protein, Peptid oder Polypeptid können modifiziert werden, beispielsweise durch Hinzufügen einer chemischen Einheit wie einer Kohlenhydratgruppe, einer Hydroxylgruppe, einer Phosphatgruppe, einer Famesylgruppe, einer Isofarnesylgruppe, einer Fettsäuregruppe, eines Linkers zur Konjugation, Funktionalisierung oder einer anderen Modifikation usw. Ein Protein, Peptid oder Polypeptid kann auch ein einzelnes Molekül sein oder einen multimolekularen Komplex darstellen. Ein Protein, Peptid oder Polypeptid kann nur ein Fragment eines natürlich vorkommenden Proteins oder Peptids sein. Ein Protein, Peptid oder Polypeptid kann natürlich vorkommen, rekombinant oder synthetisch sein, oder eine Kombination davon. Jedes der hier angebotenen Proteine kann durch jede in der Technik bekannte Methode hergestellt werden. Zum Beispiel können die hier angebotenen Proteine durch rekombinante Proteinexpression und -reinigung hergestellt werden, was sich besonders für Fusionsproteine eignet, die einen Peptidlinker enthalten. Die Verfahren zur Expression und Reinigung rekombinanter Proteine sind allgemein bekannt und werden unter anderem beschrieben von Green und Sambrook, Molecular Cloning: A Laboratory Manual (4. Auflage, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (2012)), dessen gesamter Inhalt hier durch Verweis aufgenommen wird.
Proteinspleißen
Der Begriff „Proteinspleißen“, wie er hier verwendet wird, bezieht sich auf einen Prozess, bei dem eine Sequenz, ein Intein (oder gegebenenfalls gespaltene Inteine), aus einer Aminosäuresequenz herausgeschnitten wird und die verbleibenden Fragmente der Aminosäuresequenz, die Exteine, über eine Amidbindung ligiert werden, um eine kontinuierliche Aminosäuresequenz zu bilden. Der Begriff „trans“-Proteinspleißen bezieht sich auf den speziellen Fall, dass die Inteine gespaltene Inteine sind und sich auf verschiedenen Proteinen befinden.
Einschneiden des zweiten Strangs
Die Auflösung von Heteroduplex-DNA (d. H. Mit einem editierten und einem nicht- editierten Strang), die als Ergebnis des Prime Editing entsteht, bestimmt die langfristigen Editing-Ergebnisse. Mit anderen Worten: Ein Ziel des Prime Editing ist die Auflösung der Heteroduplex-DNA (der editierte Strang gepaart mit dem endogenen, nicht editierten Strang), die als Zwischenprodukt von PE entsteht, indem der editierte Strang dauerhaft in den komplementären, endogenen Strang integriert wird. Der Ansatz des „second-strand nicking“ kann hier verwendet werden, um die Auflösung von Heteroduplex-DNA zugunsten einer dauerhaften Integration des editierten Strangs in das DNA-Molekül zu unterstützen. Wie hier verwendet, bezieht sich das Konzept des „second-strand nicking“ auf die Einführung eines zweiten Nicks an einer Stelle stromabwärts des ersten Nicks (d. H. Der anfänglichen Einkerbung, die das freie 3'-Ende für die Verwendung beim Priming der reversen Transkriptase auf dem erweiterten Teil der Guide-RNA bereitstellt), vorzugsweise auf dem unbearbeiteten Strang. In bestimmten Ausführungsformen befinden sich die erste Einkerbung und die zweite Einkerbung auf gegenüberliegenden Strängen. In anderen Ausführungsformen befinden sich die erste Einkerbung und die zweite Einkerbung auf gegenüberliegenden Strängen. In einer weiteren Ausführungsform befindet sich der erste Nick auf dem Nicht- Zielstrang (d. H. Dem Strang, der den Einzelstrangteil der R-Schleife bildet) und der zweite Nick auf dem Zielstrang. In wieder anderen Ausführungsformen befindet sich der erste Nick auf dem bearbeiteten Strang und der zweite Nick auf dem unbearbeiteten Strang. Der zweite Nick kann mindestens 5 Nukleotide stromabwärts des ersten Nicks oder mindestens 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140 oder 150 oder mehr Nukleotide stromabwärts des ersten Nicks positioniert sein. Der zweite Nick kann in bestimmten Ausführungsformen zwischen etwa 5- 150 Nukleotiden auf dem uneditierten Strang, entfernt von der Stelle des pegRNA-induzierten Nicks, zwischen etwa 5-140, zwischen etwa 5-130, zwischen etwa 5-120, zwischen etwa 5- 110, zwischen etwa 5-100, zwischen etwa 5-90, zwischen etwa 5-80, zwischen etwa 5-70, zwischen etwa 5-60, zwischen etwa 5-50, zwischen etwa 5-40, zwischen etwa 5-30, zwischen etwa 5-20 oder zwischen etwa 5-10 eingefügt werden. In einer Ausführungsform wird der zweite Nick in einem Abstand von 14-116 Nukleotiden von dem pegRNA-induzierten Nick eingeführt. Ohne an eine Theorie gebunden zu sein, veranlasst der zweite Nick die endogenen DNA-Reparatur- und Replikationsprozesse der Zelle zum Ersatz oder zur Editierung des uneditierten Strangs, wodurch die editierte Sequenz dauerhaft auf beiden Strängen installiert und der Heteroduplex aufgelöst wird, der als Ergebnis von PE entstanden ist. In einigen Ausführungsformen ist der editierte Strang der Nicht-Zielstrang und der uneditierte Strang der Zielstrang. In anderen Ausführungsformen ist der editierte Strang der Zielstrang und der uneditierte Strang ist der Nicht-Zielstrang.
Sense-Strang
In der Genetik ist ein „Sense“-Strang das Segment innerhalb der doppelsträngigen DNA, das von 5' nach 3` verläuft und das komplementär zum Antisense-Strang der DNA, dem Templat-Strang, ist, der von 3' nach 5' verläuft. Im Falle eines DNA-Segments, das für ein Protein kodiert, ist der Sense-Strang der DNA-Strang, der die gleiche Sequenz wie die mRNA hat, die während der Transkription den Antisense-Strang als Vorlage verwendet und schließlich (typischerweise, aber nicht immer) in ein Protein übersetzt wird. Der Antisense-Strang ist also für die RNA verantwortlich, die später in Protein übersetzt wird, während der Sense-Strang einen nahezu identischen Aufbau wie die mRNA besitzt. Beachten Sie, dass es für jedes Segment der dsDNA möglicherweise zwei Sätze von Sense und Antisense gibt, je nachdem, in welche Richtung man liest (da Sense und Antisense relativ zur Perspektive sind). Letztlich ist es das Genprodukt, die mRNA, die bestimmt, welcher Strang eines dsDNA-Segments als Sense oder Antisense bezeichnet wird.
Im Zusammenhang mit einer pegRNA ist der erste Schritt die Synthese einer einzelsträngigen komplementären DNA (d. H. Der 3' ssDNA-Flap, der inkorporiert wird), die in der 5'-zu-3'-Richtung orientiert ist und vom pegRNA-Erweiterungsarm abgeschnitten wird. Ob der 3' ssDNA-Flap als Sense- oder Antisense-Strang zu betrachten ist, hängt von der Richtung der Transkription ab, da es allgemein anerkannt ist, dass beide Stränge der DNA als Vorlage für die Transkription dienen können (aber nicht gleichzeitig). In einigen Ausführungsformen dient also der 3' ssDNA-Flap (der insgesamt in der 5'-zu-3'-Richtung verläuft) als Sense-Strang, da er der kodierende Strang ist. In anderen Ausführungsformen dient der 3' ssDNA-Flap (der insgesamt in Richtung 5' zu 3' verläuft) als Antisense-Strang und damit als Vorlage für die Transkription.
Sequenz-Homologie
Eine „homologe Sequenz“ oder eine Sequenz, die „Homologie“ zu einer anderen Sequenz aufweist, bedeutet eine Sequenz eines Nukleinsäuremoleküls, die mindestens etwa 65 %, 70 %, 75 %, 80 %, 85 % oder 90 % Sequenzidentität mit einem anderen Nukleinsäuremolekül aufweist. In anderen Ausführungsformen kann eine „homologe Sequenz“ von Nukleinsäuren 93 %, 95 % oder 98 % Sequenzidentität mit der Referenznukleinsäure aufweisen.
Wenn im Zusammenhang mit zwei Nukleinsäuresequenzen oder zwei Polypeptidsequenzen ein Prozentsatz der Sequenzhomologie oder -identität angegeben wird, bezieht sich der Prozentsatz der Homologie oder Identität im Allgemeinen auf die Ausrichtung von zwei oder mehr Sequenzen über einen Teil ihrer Länge, wenn sie verglichen und auf maximale Übereinstimmung ausgerichtet werden. Sofern nicht anders angegeben, wird die Sequenzhomologie oder -identität über die angegebene Länge der Nukleinsäure, des Polypeptids oder eines Teils davon bewertet. In einigen Ausführungsformen wird die Homologie oder Identität über einen funktionalen Teil oder einen bestimmten Teil der Länge bewertet.
Der Abgleich von Sequenzen zur Bewertung der Sequenzhomologie kann mit in der Technik bekannten Algorithmen durchgeführt werden, wie z. B. Dem Basic Local Alignment Search Tool (BLAST) Algorithmus, der in Altschul et al, J. Mol. Biol. 215:403- 410, 1990. Eine öffentlich zugängliche Internet-Schnittstelle zur Durchführung von BLAST-Analysen ist über das National Center for Biotechnology Information zugänglich. Weitere bekannte Algorithmen sind unter anderem veröffentlicht in: Smith & Waterman, „Comparison of Biosequences“, Adv. Appl. Math. 2:482, 1981; Needleman & Wunsch, „A general method applicable to the search for similarities in the amino acid sequence of two proteins“ J. Mol. Biol. 48:443, 1970; Pearson & Lipman „Improved tools for biological sequence comparison“, Proc. Natl. Acad. Sci. USA 85:2444, 1988; oder durch automatische Implementierung dieser oder ähnlicher Algorithmen. Globale Alignment-Programme können auch verwendet werden, um ähnliche Sequenzen von ungefähr gleicher Größe auszurichten. Beispiele für globale Ausrichtungsprogramme sind NEEDLE (verfügbar unter www.ebi.ac.uk/Tools/psa/emboss_needle/), das Teil des EMBOSS-Pakets ist (Rice P et al., Trends Genet., 2000; 16: 276-277), und das GGSEARCH-Programm fasta.bioch. Virginia. Edu/fasta_www2/fasta_www.cgi?rm= compare&pgm=gnw), das Teil des FASTA-Pakets ist (Pearson W und Lipman D, 1988, Proc. Natl. Acad. Sci. USA, 85: 2444-2448). Beide Programme basieren auf dem Needleman-Wunsch-Algorithmus, der verwendet wird, um die optimale Ausrichtung (einschließlich Lücken) zweier Sequenzen über deren gesamte Länge zu finden. Eine ausführliche Diskussion der Sequenzanalyse finden Sie auch in Unit 19.3 von Ausubel et al („Current Protocols in Molecular Biology“ John Wiley & Sons Inc, 1994-1998, Chapter 15, 1998).
Spacer-Sequenz
Wie hier verwendet, bezieht sich der Begriff „Spacer-Sequenz“ im Zusammenhang mit einer Guide-RNA oder einer pegRNA auf den Teil der Guide-RNA oder pegRNA von etwa 20 Nukleotiden, der eine Nukleotidsequenz enthält, die dieselbe Sequenz wie die Protospacer- Sequenz in der Ziel-DNA-Sequenz hat. Die Spacer-Sequenz bindet an das Komplement der Protospacer-Sequenz, um eine ssRNA/ssDNA-Hybridstruktur an der Zielstelle und eine entsprechende R-Loop-ssDNA-Struktur des endogenen DNA-Strangs zu bilden.
Subjekt
Der Begriff „Subjekt“, wie er hier verwendet wird, bezieht sich auf einen einzelnen Organismus, zum Beispiel ein einzelnes Säugetier. In einigen Ausführungsformen ist das Subjekt ein Mensch. In einigen Ausführungsformen ist das Subjekt ein nicht-menschliches Säugetier. In einigen Ausführungsformen ist das Subjekt ein nicht-menschlicher Primat. In einigen Ausführungsformen ist das Subjekt ein Nagetier. In einigen Ausführungsformen ist das Subjekt ein Schaf, eine Ziege, ein Rind, eine Katze oder ein Hund. In einigen Ausführungsformen ist das Subjekt ein Wirbeltier, eine Amphibie, ein Reptil, ein Fisch, ein Insekt, eine Fliege oder ein Fadenwurm. In manchen Fällen ist das Subjekt ein Versuchstier. In einigen Ausführungsformen ist das Subjekt gentechnisch verändert, z. B. Ein gentechnisch verändertes nicht-menschliches Subjekt. Die Testperson kann beiden Geschlechtern angehören und sich in jedem Entwicklungsstadium befinden.
Split Intein
Obwohl Inteine am häufigsten als zusammenhängende Domäne vorkommen, gibt es auch einige in einer natürlich geteilten Form. In diesem Fall werden die beiden Fragmente als separate Polypeptide exprimiert und müssen sich verbinden, bevor das Spleißen stattfindet, das so genannte Trans-Splicing von Proteinen.
Ein beispielhaftes Split-Intein ist das Ssp DnaE-Intein, das aus zwei Untereinheiten besteht, nämlich DnaE-N und DnaE-C. Die beiden verschiedenen Untereinheiten werden von separaten Genen kodiert, nämlich dnaE-n und dnaE-c, die für die Untereinheiten DnaE-N bzw. DnaE-C kodieren. DnaE ist ein natürlich vorkommendes Split-Intein in Synechocytis sp. PCC6803 und ist in der Lage, das Trans-Splicing von zwei separaten Proteinen zu steuern, die jeweils eine Fusion mit entweder DnaE-N oder DnaE-C umfassen.
Weitere natürlich vorkommende oder künstlich hergestellte Split-Intein-Sequenzen sind bekannt oder können aus den hier beschriebenen oder in der Technik verfügbaren Ganz- Intein-Sequenzen hergestellt werden. Beispiele für Split-Intein-Sequenzen finden Sie in Stevens et al., „A promiscuous split intein with expanded protein engineering applications", PNAS, 2017, Vol.114: 8538-8543; Iwai et al., „Highly efficient protein trans-splicing by a naturally split DnaE intein from Nostc punctiforme, FEBS Lett, 580: 1853-1858 (die hier jeweils durch Verweis einbezogen sind). Weitere Split-Intein-Sequenzen finden Sie z. B. In WO 2013/045632 , WO 2014/055782 , WO 2016/069774 und EP2877490 , deren Inhalt hier durch Bezugnahme aufgenommen wird.
Darüber hinaus wurde Proteinspleißen in trans in vivo und in vitro beschrieben (Shingledecker, et al.,Gene 207:187 (1998), Southworth, et al., EMBOJ. 17:918 (1998); Mills, et al., Proc. Natl. Acad. Sei. USA, 95:3543-3548 (1998); Lew, et al., J. Biol. Chem., 273:15887- 15890 (1998); Wu, et al., Biochim. Biophys. Acta 35732:1 (1998b), Yamazaki, et al., J. Am. Chem. Soc. 120:5591 (1998), Evans, et al., J. Biol. Chem. 275:9091 (2000); Otomo, et al., Biochemistry 38:16040-16044 (1999); Otomo, et al., J. Biolmol. NMR 14:105-114 (1999); Scott, et al., Proc. Natl. Acad. Sci. USA 96:13638-13643 (1999)) und bietet die Möglichkeit, ein Protein in Form von zwei inaktiven Fragmenten zu exprimieren, die anschließend durch Ligation ein funktionelles Produkt bilden, z. B. Wie in FIG.. 66 und 67 im Hinblick auf die Bildung eines vollständigen PE-Fusionsproteins aus zwei getrennt exprimierten Hälften gezeigt.
Zielstelle
Der Begriff „Zielstelle“ bezieht sich auf eine Sequenz innerhalb eines Nukleinsäuremoleküls, die von einem hier offengelegten Prime Editor (PE) bearbeitet wird. Die Zielstelle bezieht sich ferner auf die Sequenz innerhalb eines Nukleinsäuremoleküls, an die ein Komplex aus dem Prime Editor (PE) und der gRNA bindet.
tPERT
Siehe Definition für „trans Prime Editor RNA template (tPERT)“.
Zeitlich begrenztes Nicking des zweiten Strangs
Wie hier verwendet, bezieht sich der Begriff „zeitlich begrenztes Nicking des zweiten Strangs“ auf eine Variante des Second-Strand-Nickings, bei der die Installation des zweiten Nicks im uneditierten Strang erst erfolgt, nachdem der gewünschte Edit im editierten Strang installiert wurde. Dadurch werden gleichzeitige Einschnitte auf beiden Strängen vermieden, die zu doppelsträngigen DNA-Brüchen führen könnten. Die Zweitstrang-Nick-Guide-RNA ist für eine zeitliche Kontrolle ausgelegt, so dass der Zweitstrang-Nick erst nach der Installation des gewünschten Schnitts eingeführt wird. Dies wird erreicht, indem eine gRNA mit einer Spacer-Sequenz entworfen wird, die nur mit dem editierten Strang übereinstimmt, aber nicht mit dem ursprünglichen Allel. Bei dieser Strategie sollten Fehlpaarungen zwischen dem Protospacer und dem uneditierten Allel das Nicking durch die sgRNA benachteiligen, bis das Editing-Ereignis auf dem PAM-Strang stattgefunden hat.
Trans Prime-Editing
Wie hier verwendet, bezieht sich der Begriff „trans Prime Editing“ oder ähnlich „trans dual prime editing“ auf eine modifizierte Form des Prime Editing oder dual Prime Editing, bei der eine geteilte pegRNA verwendet wird, d. H. Bei der die pegRNA in zwei getrennte Moleküle aufgeteilt ist: eine sgRNA und eine trans Prime Editing RNA-Vorlage (tPERT). Die sgRNA dient dazu, den Prime-Editor (oder allgemeiner, die napDNAbp-Komponente des Prime-Editors) auf die gewünschte genomische Zielstelle auszurichten, während das tPERT von der Polymerase (z. B. Einer reversen Transkriptase) verwendet wird, um eine neue DNA- Sequenz in die Zielstelle zu schreiben, sobald das tPERT durch die Interaktion von Bindungsdomänen auf dem Prime-Editor und dem tPERT in trans zum Prime-Editor rekrutiert wurde. In einer Ausführungsform können die Bindungsdomänen RNA-Protein- Rekrutierungseinheiten enthalten, wie z. B. Ein MS2-Aptamer, das sich auf dem tPERT befindet, und ein MS2cp-Protein, das mit dem Prime-Editor fusioniert ist. Ein Vorteil des Trans-Prime-Editings besteht darin, dass man durch die Trennung der DNA-Synthesematrix von der Guide-RNA potenziell längere Templates verwenden kann.
Eine Ausführungsform der Trans-Prime-Editing ist in FIG.. 3G und 3H dargestellt. 3G zeigt die Zusammensetzung des trans-Prime-Editor-Komplexes auf der linken Seite („RP-PE:gRNA-Komplex“), der ein napDNAbp umfasst, das jeweils mit einer Polymerase (z. B. Einer reversen Transkriptase) und einem rPERT-Rekrutierungsprotein (z. B. MS2sc) fusioniert ist, und der mit einer Guide-RNA komplexiert ist. 3G zeigt außerdem ein separates tPERT-Molekül, das die Erweiterungsarm-Merkmale einer pegRNA umfasst, einschließlich der DNA-Synthese-Template und der Primer-Bindesequenz. Das tPERT- Molekül enthält auch eine RNA-Protein-Rekrutierungsdomäne (die in diesem Fall eine Stamm- Schleifen-Struktur ist und z. B. Ein MS2-Aptamer sein kann). Wie dargestellt in dem beschriebenen Verfahren in 3H bindet der RP-PE:gRNA-Komplex an die Ziel-DNA- Sequenz und schneidet sie ein. Dann rekrutiert das Rekrutierungsprotein (RP) ein tPERT, damit es an den Prime-Editor-Komplex, der an die DNA-Zielstelle gebunden ist, kolokalisiert, wodurch die Primer-Bindungsstelle an die Primer-Sequenz auf dem eingekerbten Strang binden kann und anschließend die Polymerase (z. B. RT) einen einzelnen DNA-Strang gegen die DNA-Synthesevorlage bis zu den 5' des tPERT synthetisieren kann.
Während die tPERT in 3G und 3H das PBS und die DNA-Synthese-Template am 5'-Ende der RNA-Protein-Rekrutierungsdomäne umfasst, kann das tPERT in anderen Konfigurationen so gestaltet sein, dass das PBS und die DNA-Synthese-Template am 3'-Ende der RNA-Protein-Rekrutierungsdomäne angeordnet sind. Das tPERT mit der 5'-Erweiterung hat jedoch den Vorteil, dass die Synthese des DNA-Einzelstrangs auf natürliche Weise am 5'- Ende des tPERT endet und somit nicht das Risiko besteht, dass ein Teil der RNA-Protein- Rekrutierungsdomäne während der DNA-Synthesestufe des Prime Editing als Vorlage verwendet wird.
Trans Prime Editor RNA-Vorlage (tPERT)
Wie hier verwendet, bezieht sich eine „trans Prime Editor RNA-Vorlage (tPERT)“ auf eine Komponente, die beim Trans-Prime-Editing oder Trans-Dual-Prime-Editing verwendet wird, einer modifizierten Version des Prime Editing, bei der die pegRNA in zwei verschiedene Moleküle aufgeteilt wird: eine Guide-RNA und ein tPERT-Molekül. Das tPERT-Molekül ist so programmiert, dass es mit dem Prime-Editor-Komplex an einer Ziel-DNA-Stelle kolokalisiert und so die Primer-Bindungsstelle und die DNA-Synthese-Template in trans zum Prime-Editor bringt. Siehe zum Beispiel 3G für eine Ausführungsform eines Trans- Prime-Editors (tPE), der ein Zweikomponentensystem zeigt, das (1) einen RP-PE:gRNA- Komplex und (2) ein tPERT umfasst, das die Primer-Bindungsstelle und die DNA-Synthese- Template umfasst, die mit einer RNA-Protein-Rekrutierungsdomäne verbunden sind, wobei die RP-Komponente (Rekrutierungsprotein) des RP-PE:gRNA-Komplexes das tPERT zu einer zu editierenden Zielstelle rekrutiert, wodurch die PBS und die DNA-Synthese-Template mit dem Prime Editor in trans assoziiert werden. Anders ausgedrückt: Das tPERT ist so konstruiert, dass es (ganz oder teilweise) den Erweiterungsarm einer pegRNA enthält, der die Primer-Bindungsstelle und die DNA-Synthese-Template umfasst.
Transitionen
Wie hier verwendet, beziehen sich „Transitionen“ auf den Austausch von Purin- Nukleobasen (A ↔ G) oder den Austausch von Pyrimidin-Nukleobasen (C ↔ T). An dieser Klasse von Austauschvorgängen sind Nukleobasen mit ähnlicher Form beteiligt. Die hier offengelegten Zusammensetzungen und Methoden sind in der Lage, eine oder mehrere Transitionen in einem Ziel-DNA-Molekül zu induzieren. Die hier offengelegten Zusammensetzungen und Methoden sind auch in der Lage, sowohl Transitionen als auch Transversionen in demselben Ziel-DNA-Molekül zu induzieren. Bei diesen Veränderungen handelt es sich um A ↔ G, G ↔ A, C ↔ T oder T ↔ C. Im Zusammenhang mit einer doppelsträngigen DNA mit Watson-Crick-Nukleobasenpaaren beziehen sich Transversionen auf die folgenden Basenpaaraustausche: A:T ↔ G:C, G:G ↔ A:T, C:G ↔ T:A, oder T:A ↔ C:G. Die hier offengelegten Zusammensetzungen und Methoden sind in der Lage, eine oder mehrere Transitionen in einem Ziel-DNA-Molekül zu induzieren. Die hier offengelegten Zusammensetzungen und Methoden sind auch in der Lage, sowohl Transitionen als auch Transversionen in demselben Ziel-DNA-Molekül sowie andere Nukleotidveränderungen, einschließlich Deletionen und Insertionen, zu induzieren.
Transversionen
Wie hier verwendet, beziehen sich „Transversionen“ auf den Austausch von Purin- Nukleobasen gegen Pyrimidin-Nukleobasen oder umgekehrt und beinhalten somit den Austausch von Nukleobasen mit unterschiedlicher Form. Diese Veränderungen betreffen T ↔ A, T↔ G, C ↔ G, C ↔ A, A ↔ T, A ↔ C, G ↔ C und G ↔ T. Im Kontext einer doppelsträngigen DNA mit Watson-Crick gepaarten Nukleobasen beziehen sich Transversionen auf die folgenden Basenpaaraustausche: T:A ↔ A:T, T:A ↔ G:C, C:G ↔ G:C, C:G ↔ A:T, A:T ↔ T:A, A:T ↔ C:G, G:C ↔ C:G, und G:C ↔ T:A. Die hier offenbarten Zusammensetzungen und Methoden sind in der Lage, eine oder mehrere Transversionen in einem Ziel-DNA-Molekül zu induzieren. Die hier offengelegten Zusammensetzungen und Methoden sind auch in der Lage, sowohl Transitionen als auch Transversionen in demselben Ziel-DNA-Molekül sowie andere Nukleotidveränderungen, einschließlich Deletionen und Insertionen, zu induzieren.
Behandlung
Die Begriffe „Behandlung“, „behandeln“ und „Behandeln“ beziehen sich auf eine klinische Intervention, die darauf abzielt, eine Krankheit oder Störung oder eines oder mehrere ihrer Symptome umzukehren, zu lindern, ihren Ausbruch zu verzögern oder ihr Fortschreiten zu hemmen, wie hier beschrieben. Wie hierin verwendet, beziehen sich die Begriffe „Behandlung“, „behandeln“ und „Behandeln“ auf eine klinische Intervention, die darauf abzielt, eine Krankheit oder Störung oder eines oder mehrere ihrer Symptome umzukehren, zu lindern, ihren Ausbruch zu verzögern oder ihr Fortschreiten zu hemmen, wie hier beschrieben. In einigen Ausführungsformen kann die Behandlung verabreicht werden, nachdem sich ein oder mehrere Symptome entwickelt haben und/oder nachdem eine Krankheit diagnostiziert worden ist. In anderen Ausführungsformen kann die Behandlung in Abwesenheit von Symptomen verabreicht werden, z. B. Um das Auftreten eines Symptoms zu verhindern oder zu verzögern oder das Auftreten oder Fortschreiten einer Krankheit zu hemmen. Zum Beispiel kann die Behandlung einer anfälligen Person vor dem Auftreten von Symptomen verabreicht werden(z. B. Aufgrund einer Vorgeschichte von Symptomen und/oder aufgrund von genetischen oder anderen Anfälligkeitsfaktoren). Die Behandlung kann auch nach dem Abklingen der Symptome fortgesetzt werden, zum Beispiel um ein Wiederauftreten der Symptome zu verhindern oder zu verzögern.
Trinukleotid-Repeat-Störung
Der Begriff „Trinukleotid-Repeat-Störung“ (oder alternativ „Expansions-Repeat- Störung“ oder „Repeat-Expansions-Störung“) bezieht sich auf eine Reihe von genetischen Störungen, die durch eine „Trinukleotid-Repeat-Expansion“ verursacht werden. Dabei handelt es sich um eine Art von Mutation, bei der sich ein bestimmtes Trinukleotid in bestimmten Genen oder Introns wiederholt. Trinukleotid-Wiederholungen galten einst als alltägliche Iterationen im Genom, aber in den 1990er Jahren wurden diese Störungen aufgeklärt. Diese scheinbar „harmlosen“ DNA-Abschnitte können sich manchmal ausdehnen und Krankheiten verursachen. Die durch Trinukleotid-Repeat-Expansionen verursachten Krankheiten weisen mehrere gemeinsame Merkmale auf. Erstens weisen die mutierten Wiederholungen sowohl eine somatische als auch eine Keimbahninstabilität auf, und häufiger expandieren sie bei aufeinanderfolgenden Übertragungen eher, als dass sie sich zusammenziehen. Zweitens sind ein früheres Alter des Auftretens und eine zunehmende Schwere des Phänotyps in den nachfolgenden Generationen (Antizipation) im Allgemeinen mit einer größeren Repeatlänge korreliert. Schließlich kann der elterliche Ursprung des Krankheitsallels oft die Antizipation beeinflussen, wobei die väterliche Übertragung bei vielen dieser Störungen ein größeres Risiko der Ausbreitung birgt.
Man geht davon aus, dass die Triplett-Expansion durch ein Abrutschen während der DNA-Replikation verursacht wird. Aufgrund des repetitiven Charakters der DNA-Sequenz in diesen Regionen können sich während der DNA-Replikation „Schleifenstrukturen“ bilden, wobei die komplementäre Basenpaarung zwischen dem Elternstrang und dem zu synthetisierenden Tochterstrang erhalten bleibt. Wenn die Loop-Out-Struktur aus einer Sequenz auf dem Tochterstrang gebildet wird, führt dies zu einer Erhöhung der Anzahl der Wiederholungen. Wenn jedoch die Loop-Out-Struktur auf dem Elternstrang gebildet wird, kommt es zu einer Verringerung der Anzahl der Wiederholungen. Es scheint, dass die Expansion dieser Wiederholungen häufiger vorkommt als die Reduktion. Je größer die Ausdehnung ist, desto wahrscheinlicher ist es, dass sie eine Krankheit verursacht oder den Schweregrad der Krankheit erhöht. Diese Eigenschaft führt zu dem Merkmal der Antizipation, das bei Trinukleotid-Repeat-Störungen zu beobachten ist. Antizipation beschreibt die Tendenz, dass das Alter des Ausbruchs der Krankheit abnimmt und der Schweregrad der Symptome durch die Ausbreitung dieser Wiederholungen über mehrere Generationen einer betroffenen Familie zunimmt.
Zu den Nukleotid-Wiederholungsstörungen gehören solche, bei denen die Triplett- Wiederholung in einer nicht-kodierenden Region (d. H. Eine nicht-kodierende Trinukleotid- Wiederholungsstörung) oder in einer kodierenden Region auftritt
Das hier beschriebene Prime-Editor (PE)-System kann zur Behandlung von Nukleotid- Wiederholungsstörungen verwendet werden, zu denen unter anderem das fragile X-Syndrom (FRAXA), die fragile XE-MR (FRAXE), die Freidreich-Ataxie (FRDA), die myotone Dystrophie (DM), die spinozerebelläre Ataxie Typ 8 (SCA8) und die spinozerebelläre Ataxie Typ 12 (SCA12) gehören können.
Stromaufwärts
Wie hier verwendet, sind die Begriffe „stromaufwärts“ und „stromabwärts“ Relativitätsbegriffe, die die lineare Position von mindestens zwei Elementen definieren, die sich in einem Nukleinsäuremolekül (ob einzel- oder doppelsträngig) befinden, das in einer 5'- zu-3'-Richtung orientiert ist. Insbesondere befindet sich ein erstes Element stromaufwärts von einem zweiten Element in einem Nukleinsäuremolekül, wobei das erste Element an einer Stelle positioniert ist, die 5' zu dem zweiten Element liegt. Ein SNP befindet sich beispielsweise stromaufwärts von einer Cas9-induzierten Nick-Stelle, wenn der SNP auf der 5'-Seite der Einkerbung liegt. Umgekehrt befindet sich ein erstes Element stromabwärts von einem zweiten Element in einem Nukleinsäuremolekül, wenn das erste Element an einer Stelle positioniert ist, die 3' zum zweiten Element liegt. Zum Beispiel ist ein SNP stromabwärts von einer Cas9- induzierten Einkerbung, wenn der SNP auf der 3'-Seite der Einkerbung liegt. Das Nukleinsäuremolekül kann eine DNA sein (doppel- oder einzelsträngig). RNA (doppel- oder einzelsträngig) oder ein Hybrid aus DNA und RNA. Die Analyse ist für ein einzelsträngiges Nukleinsäuremolekül und ein doppelsträngiges Molekül die gleiche, da sich die Begriffe „stromaufwärts“ und „stromabwärts“ nur auf einen Einzelstrang eines Nukleinsäuremoleküls beziehen, mit der Ausnahme, dass man auswählen muss, welcher Strang des doppelsträngigen Moleküls betrachtet wird. Oft ist der Strang einer doppelsträngigen DNA, der zur Bestimmung der Positionsrelativität von mindestens zwei Elementen verwendet werden kann, der „Sense- Strang“ oder „kodierende Strang“. In der Genetik ist ein „Sense“-Strang das Segment innerhalb der doppelsträngigen DNA, das von 5' nach 3` verläuft und das komplementär zum Antisense-Strang der DNA, dem Templat-Strang, ist, der von 3' nach 5` verläuft. So ist beispielsweise eine SNP-Nukleobase „stromabwärts“ von einer Promotorsequenz in einer genomischen DNA (die doppelsträngig ist), wenn sich die SNP-Nukleobase auf der 3'-Seite des Promotors auf dem Sense- oder Kodierungsstrang befindet.
Variante
Der hier verwendete Begriff „Variante“ bezeichnet Eigenschaften, die von dem in der Natur vorkommenden Muster abweichen, z. B. Ist eine Cas9-Variante ein Cas9, das eine oder mehrere Änderungen in den Aminosäureresten im Vergleich zu einer unmutierten Cas9- Aminosäure-Sequenz aufweist. Der Begriff „Variante“ umfasst homologe Proteine, die mindestens 75 % oder mindestens 80 % oder mindestens 85 % oder mindestens 90 % oder mindestens 95 % oder mindestens 99 % prozentuale Identität mit einer Referenzsequenz aufweisen und die gleiche oder im Wesentlichen die gleiche(n) funktionelle(n) Aktivität(en) haben wie die Referenzsequenz. Der Begriff umfasst auch Mutanten, Verkürzungen oder Domänen einer Referenzsequenz, die die gleiche oder im Wesentlichen die gleiche(n) funktionelle(n) Aktivität(en) wie die Referenzsequenz aufweisen.
Vektor
Der Begriff „Vektor“, wie er hier verwendet wird, bezieht sich auf eine Nukleinsäure, die modifiziert werden kann, um ein Gen von Interesse zu kodieren, und die in der Lage ist, in eine Wirtszelle einzudringen, zu mutieren und sich innerhalb der Wirtszelle zu replizieren und dann eine replizierte Form des Vektors in eine andere Wirtszelle zu übertragen. Geeignete Vektoren sind zum Beispiel virale Vektoren, wie retrovirale Vektoren oder Bakteriophagen und filamentöse Phagen sowie konjugative Plasmide. Weitere geeignete Vektoren sind für den Fachmann auf der Grundlage der vorliegenden Erfindung offensichtlich.
Unmutiert
Der hier verwendete Begriff „unmutiert“ ist ein Fachbegriff und steht für die typische Form eines Organismus, Stammes, Gens oder Merkmals, wie sie in der Natur vorkommt, im Unterschied zu mutierten oder abweichenden Formen.
5' endogener DNA-Flap
Wie hier verwendet, bezieht sich der Begriff „5'-endogener DNA-Flaps“ auf den DNA- Strang, der sich unmittelbar stromabwärts der PE-induzierten Einkerbung in der Ziel-DNA befindet. Das Nicking des Ziel-DNA-Strangs durch PE legt eine 3'-Hydroxylgruppe auf der stromaufwärts gelegenen Seite der Einkerbung und eine 5`-Hydroxylgruppe auf der stromabwärts gelegenen Seite der Einkerbung frei. Der endogene Strang, der mit der 3'- Hydroxylgruppe endet, wird verwendet, um die DNA-Polymerase des Prime-Editors zu primen (z. B. Wenn die DNA-Polymerase eine reverse Transkriptase ist). Der endogene Strang auf der stromabwärts gelegenen Seite der Einkerbung, der mit der exponierten 5'-Hydroxylgruppe beginnt, wird als „5'-endogener DNA-Flap“ bezeichnet und schließlich entfernt und durch den neu synthetisierten Ersatzstrang (d. H. Den „3'-Ersatz-DNA-Flap“) ersetzt, der durch die Verlängerung der pegRNA kodiert wird.
Entfernung des 5' endogenen DNA-Flaps
Wie hier verwendet, bezieht sich der Begriff „Entfernung des endogenen 5`-DNA- Flaps“ oder „5`-Flap-Entfernung“ auf die Entfernung des endogenen 5`-DNA-Flaps, der sich bildet, wenn der RT-synthetisierte Einzelstrang-DNA-Flap konkurrierend in die endogene DNA eindringt und mit ihr hybridisiert und dabei den endogenen Strang verdrängt. Durch die Entfernung dieses endogenen verdrängten Strangs kann die Reaktion zur Bildung des gewünschten Produkts mit der gewünschten Nukleotidveränderung führen. Die zelleigenen DNA-Reparaturenzyme können die Entfernung oder Exzision des endogenen 5'-Flaps katalysieren (z. B. Eine Flap-Endonuklease wie EXO1 oder FEN1). Außerdem können die Wirtszellen so transformiert werden, dass sie ein oder mehrere Enzyme exprimieren, die die Entfernung der endogenen 5'-Flaps katalysieren und so den Prozess der Produktbildung vorantreiben (z. B. Eine Flap-Endonuklease). Flap-Endonukleasen sind in der Technik bekannt und werden beschrieben in Patel et al., „Flap endonucleases pass 5'-flaps through a flexible arch using a disorder-thread-order mechanism to confer specificity for free 5'-ends,“ Nucleic Acids Research, 2012, 40(10): 4507-4519 und Tsutakawa et al., „Human flap endonuclease structures, DNA double-base flipping, and a unified understanding of the FEN1 superfamily,“ Cell, 2011, 145(2): 198-211 (die hier jeweils durch Bezugnahme aufgenommen sind).
3' Ersatz-DNA-Flap
Wie hier verwendet, bezieht sich der Begriff „3'-Ersatz-DNA-Flap“ oder einfach „Ersatz-DNA-Flap“ auf den DNA-Strang, der vom Prime-Editor synthetisiert und vom Verlängerungsarm des Prime-Editors pegRNA kodiert wird. Insbesondere wird die 3'-Ersatz- DNA-Flap von der Polymerase-Vorlage der pegRNA kodiert. Der 3'-Ersatz-DNA-Flap umfasst dieselbe Sequenz wie der 5'-endogene DNA-Flap, mit der Ausnahme, dass er auch die editierte Sequenz (z. B. Eine einzelne Nukleotidänderung) enthält. Der 3'-Ersatz-DNA-Flap bindet an die Ziel-DNA und verdrängt oder ersetzt dabei den 5'-endogenen DNA-Flap (der zum Beispiel durch eine 5'-Flap-Endonuklease ausgeschnitten werden kann, wie FEN1 oder EXO1) und wird dann ligiert, um das 3'-Ende des 3`-Ersatz-DNA-Flaps mit dem freiliegenden 5'-Hydoxyl-Ende der endogenen DNA (das nach der Entfernung des 5'-endogenen DNA-Flaps freiliegt) zu verbinden, wodurch eine Phospodiesterbindung neu gebildet und der 3'-Ersatz- DNA-Flap installiert wird, um eine Heteroduplex-DNA zu bilden, die einen editierten Strang und einen uneditierten Strang enthält. DNA-Reparaturprozesse lösen den Heteroduplex auf, indem sie die Informationen im editierten Strang auf den komplementären Strang kopieren und den Edit dauerhaft in die DNA einbauen. Dieser Auflösungsprozess kann noch weiter vorangetrieben werden, indem der unbearbeitete Strang eingeklemmt wird, d. H. Durch „second-strand nicking“, wie hier beschrieben.
DETAILLIERTE BESCHREIBUNG BESTIMMTER AUSFÜHRUNGSFORMEN
Die Einführung des CRISPR-Systems (clustered regularly interspaced short palindromic repeat) für das Genom-Editing hat die Biowissenschaften revolutioniert^1-3 . Auch wenn die Unterbrechung von Genen mithilfe von CRISPR inzwischen Routine ist, stellt die präzise Installation einzelner Nukleotid-Edits nach wie vor eine große Herausforderung dar, auch wenn sie für die Untersuchung oder Korrektur einer großen Anzahl von krankheitsverursachenden Mutationen notwendig ist. Die homologiegeleitete Reparatur (HDR) ist in der Lage, solche Bearbeitungen vorzunehmen, leidet jedoch unter der geringen Effizienz (oft <5 %), der Notwendigkeit von Spender-DNA-Reparaturvorlagen und den schädlichen Auswirkungen der Bildung doppelsträngiger DNA-Brüche (DSB). Kürzlich hat das Labor von Prof. David Liu et al.das Base Editing entwickelt, das eine effiziente Bearbeitung einzelner Nukleotide ohne DSBs ermöglicht. Basen-Editoren (Bes) kombinieren das CRISPR-System mit Basen-modifizierenden Deaminase-Enzymen, um die Zielbasenpaare C-G oder A-T in A-T bzw. G-C umzuwandeln^4-6. Obwohl sie bereits von vielen Forschern weltweit eingesetzt werden, ermöglichen die aktuellen Bes nur vier der zwölf möglichen Basenpaarumwandlungen und sind nicht in der Lage, kleine Insertionen oder Deletionen zu korrigieren. Darüber hinaus wird die Reichweite der Basen-Editierung durch die Editierung von C- oder A-Basen, die nicht zur Zielbase gehören („Bystander-Editierung“), und durch die Anforderung, dass eine PAM-Sequenz 15±2 bp von der Zielbase entfernt sein muss, eingeschränkt. Die Überwindung dieser Einschränkungen würde daher die Grundlagenforschung und die therapeutischen Anwendungen des Genome Editing erheblich erweitern.
Es wurden neue Präzisions-Editing-Ansätze(z. B. Klassisches Prime-Editing) entwickelt, die viele der Vorteile der Basen-Editierung bieten - nämlich die Vermeidung von Doppelstrangbrüchen und Spender-DNA-Reparaturvorlagen - und gleichzeitig dessen größte Einschränkungen überwinden. Der hier beschriebene Ansatz ermöglicht die direkte Installation von editierten DNA-Strängen an genomischen Zielstellen mit Hilfe der zielgerichteten reversen Transkription (TPRT). In dem hier besprochenen Design wird die CRISPR-Guide-RNA (gRNA) so konstruiert, dass sie eine Reverse Transkriptase (RT)- Matrizen-Sequenz trägt, die eine einzelsträngige DNA mit einer gewünschten Nukleotidveränderung kodiert. Die von der CRISPR-Nuklease (Cas9) aufgespießte Zielstellen-DNA dient als Primer für die reverse Transkription der Template-Sequenz auf der modifizierten gRNA, so dass jede gewünschte Nukleotid-Editierung direkt eingebaut werden kann.
Der Mechanismus der zielgerichteten reversen Transkription (TPRT) kann für die Durchführung von präzisem CRISPR/Cas-basiertem Genome Editing mit hoher Effizienz und genetischer Flexibilität genutzt oder angepasst werden (z. B. Wie in verschiedenen Ausführungsformen der 1A-1F). Cas-Protein-Fusionen mit Reverser Transkriptase werden verwendet, um eine spezifische DNA-Sequenz mit einer modifizierten Guide-RNA („eine erweiterte Guide-RNA“) anzusteuern, einen Einzelstrang-Nick an der Zielstelle zu erzeugen und die eingekerbte DNA als Primer für die reverse Transkription einer manipulierten Reversen Transkriptase-Vorlage zu verwenden, die in die erweiterte Guide-RNA integriert ist. Der neu synthetisierte Strang wäre homolog zur genomischen Zielsequenz, mit Ausnahme einer gewünschten Nukleotidänderung (z. B. Eine einzelne Nukleotidänderung, eine Deletion oder eine Insertion oder eine Kombination davon). Der neu synthetisierte DNA-Strang kann als Einzelstrang-DNA-Flaps bezeichnet werden, der mit dem komplementären homologen endogenen DNA-Strang um die Hybridisierung konkurriert und dadurch den entsprechenden endogenen Strang verdrängt. Die Auflösung dieses hybridisierten Zwischenprodukts kann die Entfernung des resultierenden verschobenen Flaps endogener DNA (z. B. Mit einer 5'-End- DNA-Flap-Endonuklease, FEN1), die Ligation des synthetisierten Einzelstrang-DNA-Flaps an die Ziel-DNA und die Assimilation der gewünschten Nukleotidänderung als Ergebnis zellulärer DNA-Reparatur- und/oder Replikationsprozesse umfassen. Da die Template- gestützte DNA-Synthese die Präzision eines einzelnen Nukleotids bietet, ist der Anwendungsbereich dieses Ansatzes sehr breit gefächert und könnte vorhersehbar für unzählige Anwendungen in der Grundlagenforschung und in der Therapeutik genutzt werden.
Die vorliegende Erfindung beschreibt eine neue Plattform für die Genom-Editierung, die als „Multi-Flap-Prime-Editing“ bezeichnet wird (einschließlich z. B. „Dual-Flap-Prime- Editing“ und „Quadruple-Flap-Prime-Editing“) und eine innovative Weiterentwicklung des „Prime-Editing“ oder „klassischen Prime-Editing“ darstellt, wie von den heutigen Erfindern beschrieben in Anzalone, A. V. Et al. Search-and-replace genome editing without double- strand breaks or donor DNA. Nature 576, 149-157 (2019), durch Bezugnahme hier aufgenommen. Während beim klassischen Prime-Editing in verschiedenen Ausführungsformen an einer Einstichstelle ein einzelner 3`-Flap polymerisiert wird, der in die Zielnukleinsäure auf demselben Strang integriert wird, umfassen die derzeit beschriebenen Multi-Flap-Prime-Editing-Systeme verschiedene Konstrukte, Systeme und Verfahren, die in verschiedenen Ausführungsformen Paare oder mehrere Paare von 3'-Flaps auf verschiedenen Strängen erzeugen, die Duplexe bilden, die die gewünschten Edits umfassen und in die Ziel- Nukleinsäuremoleküle eingebaut werden, z. B. An spezifischen Loci oder Editierstellen in einem Genom. In verschiedenen Aspekten bilden die Paare oder mehrere Paare von 3'-Flaps Duplexe, weil sie umgekehrt komplementäre Sequenzen enthalten, die sich aneinander anlagern, sobald sie von den hier beschriebenen Prime-Editoren erzeugt wurden. Die Duplexe werden durch zellgesteuerte Mechanismen in die Zielstelle eingebaut, die auf natürliche Weise die endogenen Duplexsequenzen ersetzen, die sich zwischen benachbarten Einstichstellen befinden. In bestimmten Ausführungsformen können die neuen Duplexsequenzen an einer oder mehreren Stellen eingeführt werden (z. B. An benachbarten genomischen Loci oder an zwei verschiedenen chromosomalen Stellen) und können eine oder mehrere Sequenzen von Interesse umfassen, z. B. Eine Protein-kodierende Sequenz, eine Peptid-kodierende Sequenz oder eine RNA-kodierende Sequenz. In einer Ausführungsform können die neuen Duplexsequenzen, die von den Multi-Flap-Prime-Editing-Systemen installiert werden, eine Rekombinasestelle umfassen, z. B., eine Bxb1-Rekombinasestelle attB (38 bp) und/oder attP (50 bp) oder eine Rekombinasestelle, die von Hin-Rekombinase, Gin-Rekombinase, Tn3- Rekombinase, β-six-Rekombinase, CinH-Rekombinase, ParA-Rekombinase, γδ- Rekombinase, ϕC31-Rekombinase, TP901-Rekombinase, TG1-Rekombinase, φBT1- Rekombinase, R4-Rekombinase, (φRV1-Rekombinase, φFC1-Rekombinase, MR11- Rekombinase, A118-Rekombinase, U153-Rekombinase und gp29-Rekombinase, Cre- Rekombinase, FLP-Rekombinase, R-Rekombinase, Lambda-Rekombinase, HK101- Rekombinase, HK022-Rekombinase und pSAM2-Rekombinase erkannt wird.
Unter verschiedenen Aspekten beschreibt diese Spezifikation ein Multi-Flap-Prime- Editing-System (einschließlich z. B. Dual-Prime-Editing-Systemen und Quadruple-Prime- Editing-Systemen), das die mit der Flap-Äquilibrierung und dem anschließenden Einbau des Edits in den nicht-editierten komplementären genomischen DNA-Strang verbundenen Herausforderungen angeht, indem es beide DNA-Stränge gleichzeitig editiert. Beim Dual- Flap-Prime-Editing-System zum Beispiel werden zwei pegRNAs verwendet, um gegensätzliche Stränge einer genomischen Stelle anzusteuern und die Synthese von zwei komplementären 3'-Flaps zu steuern, die die editierte DNA-Sequenz enthalten (90). Im Gegensatz zum klassischen Prime Editing muss das Paar der editierten DNA-Stränge (3`-Flaps) nicht direkt mit den 5'-Flaps der endogenen genomischen DNA konkurrieren, da stattdessen der komplementäre editierte Strang für die Hybridisierung zur Verfügung steht. Da beide Stränge des Duplex als editierte DNA synthetisiert werden, erübrigt sich beim Dual-Flap- Prime-Editing-System der Austausch des nicht-editierten komplementären DNA-Strangs, der beim klassischen Prime-Editing erforderlich ist. Stattdessen muss die zelluläre DNA- Reparaturmaschinerie nur die gepaarten 5'-Flaps (ursprüngliche genomische DNA) herausschneiden und die gepaarten 3'-Flaps (bearbeitete DNA) in den Lokus einbinden. Daher besteht auch keine Notwendigkeit, in die neu synthetisierten DNA-Stränge Sequenzen aufzunehmen, die homolog zur genomischen DNA sind. Dies ermöglicht eine selektive Hybridisierung der neuen Stränge und erleichtert Bearbeitungen, die eine minimale genomische Homologie enthalten. Nuklease-aktive Versionen von Prime-Editoren, die beide Stränge der DNA schneiden, könnten ebenfalls verwendet werden, um die Entfernung der ursprünglichen DNA-Sequenz zu beschleunigen. Das Quadruple-Flap-Prime-Editing-System, das vier pegRNAs verwendet, bietet ähnliche Vorteile.
[1] napDNAbp
Die hier beschriebenen Multi-Flap-Prime-Editoren können ein Nukleinsäureprogrammierbares DNA-bindendes Protein (napDNAbp) enthalten.
In einem Aspekt kann ein napDNAbp mit mindestens einer Leitnukleinsäure (z. B. Einer Guide-RNA oder einer pegRNA) assoziiert oder komplexiert sein, die das napDNAbp an einer DNA-Sequenz lokalisiert, die einen DNA-Strang (d. H. Einen Zielstrang) umfasst, der komplementär zu der Leitnukleinsäure oder einem Teil davon ist (z. B. Der Spacer einer Guide- RNA, der an den Protospacer des DNA-Ziels bindet). Mit anderen Worten: Die Leitnukleinsäure „programmiert“ das napDNAbp (z. B. Cas9 oder ein Äquivalent) so, dass es die komplementäre Sequenz des Protospacers in der DNA lokalisiert und daran bindet.
Jedes geeignete napDNAbp kann in den hier beschriebenen Multi-Flap-Prime-Editoren verwendet werden. In verschiedenen Ausführungsformen kann das napDNAbp ein beliebiges CRISPR-Cas-System der Klasse 2 sein, einschließlich eines CRISPR-Cas-Enzyms vom Typ II, Typ V oder Typ VI. Angesichts der rasanten Entwicklung von CRISPR-Cas als Werkzeug für die Genom-Editierung hat sich die Nomenklatur zur Beschreibung und/oder Identifizierung von CRISPR-Cas-Enzymen, wie Cas9 und Cas9-Orthologe, ständig weiterentwickelt. Diese Anwendung bezieht sich auf CRISPR-Cas-Enzyme mit einer Nomenklatur, die alt und/oder neu sein kann. Der Fachmann wird in der Lage sein, das spezifische CRISPR-Cas-Enzym, auf das in dieser Anwendung Bezug genommen wird, anhand der verwendeten Nomenklatur zu identifizieren, unabhängig davon, ob es sich um eine alte (d. H. „alte“) oder neue Nomenklatur handelt. Die Nomenklatur von CRISPR-Cas wird ausführlich diskutierte in Makarova et al., „Classification and Nomenclature of CRISPR-Cas Systems: Where from Here?,“ The CRISPR Journal, Vol. 1. Nr. 5, 2018, dessen gesamter Inhalt hier durch Bezugnahme aufgenommen wird. Die spezielle CRISPR-Cas-Nomenklatur, die in dieser Anwendung verwendet wird, ist in keiner Weise einschränkend, und der Fachmann wird in der Lage sein zu erkennen, auf welches CRISPR-Cas-Enzym Bezug genommen wird.

Zum Beispiel haben die folgenden CRISPR-Cas-Enzyme vom Typ II, Typ V und Typ VI der Klasse 2 die folgenden nach dem Stand der Technik anerkannten alten (d. H. Veralteten) und neuen Namen. Jedes dieser Enzyme und/oder Varianten davon kann mit den hier beschriebenen Multi-Flap-Prime-Editoren verwendet werden:

Alte Nomenklatur	Aktuelle Nomenklatur*
typ II CRISPR-Cas Enzyme
Cas9	ebenso
typ V CRISPR-Cas Enzyme
Cpfl	Cas12a
CasX	Cas12e
C2c1	Cas12b1
Cas 12b2	ebenso
C2c3	Cas12c
CasY	Cas12d
C2c4	ebenso
C2c8	ebenso
C2c5	ebenso
C2c10	ebenso
C2c9	ebenso
typ VI CRISPR-Cas Enzyme
C2c2	Cas13a
Cas13d	ebenso
C2c7	Cas13c
C2c6	Cas13b

* Siehe Makarova et al., The CRISPR Journal, Vol. 1, No. 5, 2018

Ohne an die Theorie gebunden zu sein, schließt der hier betrachtete Wirkmechanismus bestimmter napDNAbp den Schritt der Bildung einer R-Schleife ein, wodurch das napDNAbp das Abwickeln eines doppelsträngigen DNA-Ziels induziert und dadurch die Stränge in der durch das napDNAbp gebundenen Region trennt. Der Guide-RNA-Spacer hybridisiert dann mit dem „Zielstrang“ an der Protospacer-Sequenz. Dadurch wird ein „Nicht-Zielstrang“ verdrängt, der komplementär zum Zielstrang ist, der die Einzelstrangregion der R-Schleife bildet. In einigen Ausführungsformen enthält das napDNAbp eine oder mehrere Nuklease- Aktivitäten, die dann die DNA schneiden und verschiedene Arten von Läsionen hinterlassen. Zum Beispiel kann das napDNAbp eine Nukleaseaktivität aufweisen, die den Nicht-Zielstrang an einer ersten Stelle schneidet und/oder den Zielstrang an einer zweiten Stelle schneidet. Je nach Nukleaseaktivität kann die Ziel-DNA so geschnitten werden, dass ein „Doppelstrangbruch“ entsteht, bei dem beide Stränge geschnitten werden. In anderen Ausführungsformen kann die Ziel-DNA nur an einer einzigen Stelle geschnitten werden, d. H. Die DNA wird an einem Strang „eingekerbt“. Beispiele für napDNAbp mit unterschiedlichen Nuklease-Aktivitäten sind „Cas9 Nickase“ („nCas9“) und ein deaktiviertes Cas9 ohne Nuklease-Aktivitäten („dead Cas9“ oder „dCas9“).
Die nachfolgende Beschreibung verschiedener napDNAbps, die in Verbindung mit den hier vorgestellten Multi-Flap-Prime-Editoren verwendet werden können, ist in keiner Weise einschränkend gemeint. Die Multi-Flap-Prime-Editoren können das kanonische SpCas9 oder ein beliebiges orthologes Cas9-Protein oder eine beliebige Variante des Cas9-Proteins umfassen, einschließlich einer natürlich vorkommenden Variante, Mutante oder anderweitig manipulierten Version von Cas9, die bekannt ist oder die durch einen gezielten evolutionären oder anderweitig mutagenen Prozess hergestellt oder entwickelt werden kann. In verschiedenen Ausführungsformen haben die Cas9 oder Cas9-Varianten eine Nickase- Aktivität, d. H. Sie spalten nur einen Strang der Ziel-DNA-Sequenz. In anderen Ausführungsformen haben die Cas9 oder Cas9-Varianten inaktive Nukleasen, d. H. Sie sind „tote“ Cas9-Proteine. Andere Cas9-Varianten, die verwendet werden können, sind solche mit einem geringeren Molekulargewicht als das kanonische SpCas9 (z. B. Zur leichteren Verabreichung) oder mit einer modifizierten oder umgestalteten primären Aminosäurestruktur (z. B. Die zirkulären Permutantenformate).
Die hier beschriebenen Multi-Flap-Prime-Editoren können auch Cas9-Äquivalente umfassen, einschließlich Cas12a (Cpfl) und Cas12b1-Proteine, die das Ergebnis einer konvergenten Evolution sind. Die hier verwendeten napDNAbps (z. B. SpCas9, Cas9-Variante oder Cas9-Äquivalente) können auch verschiedene Modifikationen enthalten, die ihre PAM- Spezifizierungen verändern/verbessern. Schließlich umfasst die Anwendung jedes Cas9, jede Cas9-Variante oder jedes Cas9-Äquivalent, das eine Sequenzidentität von mindestens 70 %, mindestens 75 %, mindestens 80 %, mindestens 85 %, mindestens 90 %, mindestens 91 %, mindestens 92 %, mindestens 93 %, mindestens 94 %, mindestens 95 %, mindestens 96 %, mindestens 97 %, mindestens 98 %, mindestens 99 % oder mindestens 99,9 % mit einer Referenz-Cas9-Sequenz, wie einer kanonischen Referenz-SpCas9-Sequenz oder einem Referenz-Cas9-Äquivalent (z. B., Cas12a (Cpfl)) hat.
Das napDNAbp kann eine CRISPR (clustered regularly interspaced short palindromic repeat)-assoziierte Nuklease sein. Wie oben beschrieben, ist CRISPR ein adaptives Immunsystem, das Schutz gegen mobile genetische Elemente (Viren, transponierbare Elemente und konjugative Plasmide) bietet. CRISPR-Cluster enthalten Spacer, d. H. Sequenzen, die komplementär zu vorausgehenden mobilen Elementen sind, und zielen auf eindringende Nukleinsäuren ab. CRISPR-Cluster werden transkribiert und zu CRISPR-RNA (crRNA) verarbeitet. In CRISPR-Systemen vom Typ II erfordert die korrekte Verarbeitung der prä-crRNA eine trans-kodierte kleine RNA (tracrRNA), die endogene Ribonuklease 3 (rnc) und ein Cas9-Protein. Die tracrRNA dient als Leitfaden für die Ribonuklease 3-gestützte Verarbeitung der prä-crRNA. Anschließend schneidet Cas9/crRNA/tracrRNA endonukleolytisch ein lineares oder zirkuläres dsDNA-Ziel, das komplementär zum Spacer ist. Der Zielstrang, der nicht komplementär zur crRNA ist, wird zunächst endonukleolytisch geschnitten und dann exonukleolytisch auf 3'-5' gekürzt. In der Natur werden für die Bindung und Spaltung von DNA normalerweise Proteine und RNAs benötigt. Einzelne Guide-RNAs („sgRNA“ oder einfach „gRNA“) können jedoch so konstruiert werden, dass sie Aspekte sowohl der crRNA als auch der tracrRNA in eine einzige RNA-Spezies einbringen. Siehe z. B. Jinek M. Et al., Science 337:816-821 (2012), dessen gesamter Inhalt hiermit durch Bezugnahme aufgenommen wird.
In einigen Ausführungsformen steuert das napDNAbp die Spaltung eines oder beider Stränge an der Stelle einer Zielsequenz, beispielsweise innerhalb der Zielsequenz und/oder innerhalb des Komplements der Zielsequenz. In einigen Ausführungsformen steuert das napDNAbp die Spaltung eines oder beider Stränge innerhalb von etwa 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 50, 100, 200, 500 oder mehr Basenpaaren vom ersten oder letzten Nukleotid einer Zielsequenz. In einigen Ausführungsformen kodiert ein Vektor für ein napDNAbp, das im Vergleich zu einem entsprechenden unmutierten Enzym mutiert ist, so dass dem mutierten napDNAbp die Fähigkeit fehlt, einen oder beide Stränge eines Ziel-Polynukleotids, das eine Zielsequenz enthält, zu spalten. Eine Aspartat-Alanin-Substitution (D10A) in der katalytischen Domäne von RuvC I von Cas9 aus S. Pyogenes verwandelt Cas9 beispielsweise von einer Nuklease, die beide Stränge spaltet, in eine Nickase (die einen einzigen Strang spaltet). Andere Beispiele für Mutationen, die Cas9 zu einer Nickase machen, sind, ohne Einschränkung, H840A, N854A und N863A in Bezug auf die kanonische SpCas9-Sequenz oder äquivalente Aminosäurepositionen in anderen Cas9-Varianten oder Cas9-Äquivalenten.
Wie hierin verwendet, bezieht sich der Begriff „Cas-Protein“ auf ein Cas-Protein in voller Länge, das aus der Natur gewonnen wurde, ein rekombinantes Cas-Protein mit einer Sequenz, die sich von einem natürlich vorkommenden Cas-Protein unterscheidet, oder ein beliebiges Fragment eines Cas-Proteins, das dennoch alle oder eine beträchtliche Menge der erforderlichen grundlegenden Funktionen beibehält, die für die offengelegten Verfahren benötigt werden, d. H. (i) Besitz einer durch Nukleinsäure programmierbaren Bindung des Cas- Proteins an eine Ziel-DNA und (ii) Fähigkeit, die Ziel-DNA-Sequenz auf einem Strang zu nicken. Die hier betrachteten Cas-Proteine umfassen CRISPR Cas9-Proteine sowie Cas9- Äquivalente, Varianten (z. B. Cas9-Nickase (nCas9) oder Nuklease-inaktives Cas9 (dCas9)), Homologe, Orthologe oder Parologe, unabhängig davon, ob sie natürlich vorkommen oder nicht (z. B. Gentechnisch veränderte oder rekombinante) Cas9-Homologe oder Paraloge, und können ein Cas9-Äquivalent aus einem beliebigen CRISPR-System der Klasse 2 (z. B., typ II, V, VI) umfassen, einschließlich Cas12a (Cpfl), Cas12e (CasX), Cas12b1 (C2c1), Cas12b2, Cas12c (C2c3), C2c4, C2c8, C2c5, C2c10, C2c9 Cas13a (C2c2), Cas13d, Cas13c (C2c7), Cas13b (C2c6) und Cas13b. Weitere Cas-Äquivalente sind beschrieben in Makarova et al., „C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector,“ Science 2016; 353(6299) und Makarova et al., „Classification and Nomenclature of CRISPR- Cas Systems: Where from Here?,“ The CRISPR Journal, Vol. 1. Nr. 5, 2018, dessen Inhalt hier durch Bezugnahme aufgenommen wird.
Die Begriffe „Cas9“ oder „Cas9-Nuklease“ oder „Cas9-Anteil“ oder „Cas9-Domäne“ umfassen jedes natürlich vorkommende Cas9 aus einem beliebigen Organismus, jedes natürlich vorkommende Cas9-Äquivalent oder funktionelle Fragment davon, jedes Cas9- Homolog, Ortholog oder Paralog aus einem beliebigen Organismus und jede Mutante oder Variante eines Cas9, ob natürlich vorkommend oder künstlich hergestellt. Der Begriff Cas9 ist nicht als besonders einschränkend zu verstehen und kann als „Cas9 oder Äquivalent“ bezeichnet werden. Exemplarische Cas9-Proteine werden hier weiter beschrieben und/oder sind im Stand der Technik beschrieben und werden hier durch Bezugnahme aufgenommen. Die vorliegende Offenbarung ist unbegrenzt in Bezug auf das spezielle Cas9, das in den hier beschriebenen Multi-Flap-Prime-Editoren verwendet wird.
Wie bereits erwähnt, sind die Sequenzen und Strukturen der Cas9-Nuklease den Fachleuten gut bekannt (siehe z. B. „Complete genome sequence of an M1 strain of Streptococcus pyogenes“ Ferretti et al., J.J., McShan W.M., Ajdic D.J., Savic D.J., Savic G., Lyon K., Primeaux C., Sezate S., Suvorov A.N., Kenton S., Lai H.S., Lin S.P., Qian Y., Jia H.G., Najar F.Z., Ren Q., Zhu H., Song L., White J., Yuan X., Clifton S.W., Roe B.A., McLaughlin R.E., Proc. Natl. Acad. Sci. U.S.A. 98:4658-4663(2001); „CRISPR RNA maturation by trans-encoded small RNA and host factor Rnase III“ Deltcheva E., Chylinski K., Sharma C.M., Gonzales K., Chao Y., Pirzada Z.A., Eckert M.R., Vogel J., Charpentier E., Nature 471:602-607(2011); und „A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity.“ Jinek M., Chylinski K., Fonfara I., Hauer M., Doudna J.A., Charpentier E. Science 337:816-821(2012), deren gesamter Inhalt hier durch Bezugnahme aufgenommen wird).
Im Folgenden finden Sie Beispiele für Cas9 und Cas9-Äquivalente; diese spezifischen Beispiele sind jedoch nicht als einschränkend zu verstehen. Die Multi-Flap-Prime-Editoren der vorliegenden Offenbarung können jedes geeignete napDNAbp verwenden, einschließlich jedes geeignete Cas9 oder Cas9-Äquivalent.
A. Unmutiertes, kanonisches SpCas9

In einer Ausführungsform können die hier beschriebenen Multi-Flap-Prime-Editor- Konstrukte die „kanonische SpCas9“-Nuklease aus S. Pyogenes enthalten, die weithin als Werkzeug für das Genome-Engineering verwendet wird und als Typ-II-Untergruppe von Enzymen der Klasse 2 der CRISPR-Cas-Systeme eingestuft wird. Dieses Cas9-Protein ist ein großes Multidomänen-Protein, das zwei unterschiedliche Nuklease-Domänen enthält. Punktmutationen können in Cas9 eingeführt werden, um eine oder beide Nuklease-Aktivitäten auszuschalten. Das Ergebnis ist ein Nickase-Cas9 (nCas9) bzw. Ein totes Cas9 (dCas9), das immer noch in der Lage ist, DNA auf eine sgRNA-programmierte Weise zu binden. Im Prinzip kann Cas9 oder eine Variante davon (z. B. nCas9), wenn es mit einem anderen Protein oder einer Domäne fusioniert ist, dieses Protein durch Koexpression mit einer geeigneten sgRNA auf praktisch jede DNA-Sequenz ausrichten. Wie hier verwendet, bezieht sich das kanonische SpCas9-Protein auf das unmutierte Protein von Streptococcus pyogenes mit der folgenden Aminosäuresequenz:

Beschreibung	Sequenz	SEQ- ID-NR.:
SpCas9 Streptococcus pyogenes M1 SwissProt- Hinterlegungs nummer Q99ZW2 unmutiert		SEQ- ID-NR.: 18
SpCas9 Umgekehrte Übersetzung von SwissProt Hinterlegungs nummer Q99ZW2 Streptococcus pyogenes		SEQ- ID-NR.: 19

Die hier beschriebenen Multi-Flap-Prime-Editoren können kanonisches SpCas9 oder eine beliebige Variante davon enthalten, die mindestens 80 %, mindestens 85 %, mindestens 90 %, mindestens 95 % oder mindestens 99 % Sequenzidentität mit einer oben angegebenen, unmutierten Cas9-Sequenz aufweist. Diese Varianten können SpCas9-Varianten umfassen, die eine oder mehrere Mutationen enthalten, einschließlich aller bekannten Mutationen, die unter der SwissProt-Hinterlegungsnr. Q99ZW2 (SEQ-ID-NR.: 18) im Eintrag vermerkt ist, der Folgendes enthält:

SpCas9-Mutation (relativ zu der Aminosäuresequenz der kanonischen	Funktion/Eigenschaft (wie berichtet) (siehe UniProtKB - Q99ZW2 (CAS9_STRPT1)
SpCas9-Sequenz, SEQ-ID-NR.: 18)	Eintrag - hier durch Bezugnahme aufgenommen)
D10A	Nickase-Mutante, die den Protospacer-Strang spaltet (aber keine Spaltung des Nicht- Protospacer-Strangs)
S15A	Verminderte DNA-Spaltungsaktivität
R66A	Verminderte DNA-Spaltungsaktivität
R70A	Keine DNA-Spaltung
R74A	Verminderte DNA-Spaltung
R78A	Verminderte DNA-Spaltung
97-150 Deletion	Keine Nuklease-Aktivität
R165A	Verminderte DNA-Spaltung
175-307 Deletion	Etwa 50 % weniger DNA-Spaltung
312-409 Deletion	Keine Nuklease-Aktivität
E762A	Nickase
H840A	Nickase-Mutante, die den Nicht-Protospacer- Strang spaltet, aber den Protospacer-Strang nicht spaltet
N854A	Nickase
N863A	Nickase
H982A	Verminderte DNA-Spaltung
D986A	Nickase
1099-1368 Deletion	Keine Nuklease-Aktivität
R1333A	Reduzierte DNA-Bindung

Andere unmutierte SpCas9-Sequenzen, die in der vorliegenden Offenbarung verwendet werden können, umfassen:

Beschreibung	Sequenz	SEQ-ID- NR.:
SpCas9 Streptococcus pyogenes MGAS1882 unmutiert NC_017053.1		SEQ-ID- NR.: 20


SpCas9 Streptococcus pyogenes MGAS1882 unmutiert NC_017053.1		SEQ-ID- NR.: 21
SpCas9 Streptococcus pyogenes unmutiert SWBC2D7W 014		SEQ-ID- NR.: 22


SpCas9 Streptococcus pyogenes unmutiert Kodiertes Produkt von SWBC2D7W 014		SEQ-ID- NR.: 23

SpCas9 Streptococcus pyogenes M1GAS unmutiert NC_002737.2		SEQ-ID- NR.: 24


SpCas9 Streptococcus pyogenes M1GAS unmutiert Kodiertes Produkt von NC_002737.2 (100 % identisch mit dem kanonischen Q99ZW2 unmutiert)		SEQ-ID- NR.: 25

Die hier beschriebenen Multi-Flap-Prime-Editoren können jede der oben genannten SpCas9-Sequenzen oder jede Variante davon mit mindestens 80 %, mindestens 85 %, mindestens 90 %, mindestens 95 % oder mindestens 99 % Sequenzidentität dazu enthalten.
B. unmutierte Cas9 Orthologe
In anderen Ausführungsformen kann das Cas9-Protein ein unmutiertes Cas9-Ortholog aus einer anderen bakteriellen Spezies als das kanonische Cas9 aus S. pyogenes sein. Zum Beispiel können die folgenden Cas9-Orthologe in Verbindung mit den in dieser Spezifikation beschriebenen Multi-Flap-Prime-Editor-Konstrukten verwendet werden. Darüber hinaus kann jede Cas9-Ortholog-Variante, die mindestens 80 %, mindestens 85 %, mindestens 90 %, mindestens 95 % oder mindestens 99 % Sequenzidentität mit einem der unten genannten Orthologe aufweist, auch mit den Multi-Flap-Prime-Editoren verwendet werden.

Beschreibung Sequenz

LfCas9 Lactobacillus fermentum unmutiert GenBank: SNX31424.1 1

Beschreibung Sequenz

SaCas9 Staphylococcus aureus unmutiert GenBank: AYD60528.1

SaCas9 Staphylococcus aureus

Beschreibung Sequenz

StCas9 Streptococcus thermophilus UniProtKB/S wiss-Prot: G3ECR1.2 unmutiert

LcCas9 Lactobacillus crispatus NCBI- Referenzsequenz: WP_1334780 44.1 unmutiert

Beschreibung Sequenz

PdCas9 Pedicoccus damnosus NCBI- Referenzsequenz: WP_0629132 73.1 unmutiert

FnCas9 Fusobaterium nucleatum NCBI- Referenzsequenz: WP_0607989 84.1

Beschreibung Sequenz

EcCas9 Enterococcus cecorum NCBI- Referenzsequenz: WP_0473385 01.1 unmutiert

AhCas9 Anaerostipes hadrus NCBI- Referenzsequenz: WP_0449242 78.1 unmutiert

Beschreibung Sequenz

KvCas9 Kandleria vitulina NCBI- Referenzsequenz: WP_0315899 69.1 unmutiert

EfCas9 Enterococcus faecalis NCBI- Referenzsequenz: WP _0166310 44.1 unmutiert

Beschreibung Sequenz

Staphylococcus aureus Cas9

Geobacillus thermodenitrificans Cas9

Beschreibung Sequenz

ScCas9

S. canis

1375 AA

159.2 kDa
Die hier beschriebenen Multi-Flap-Prime-Editoren können jede der oben genannten Cas9-Ortholog-Sequenzen oder jede Variante davon enthalten, die mindestens 80 %, mindestens 85 %, mindestens 90 %, mindestens 95 % oder mindestens 99 % Sequenzidentität damit aufweist.
Das napDNAbp kann alle geeigneten Homologe und/oder Orthologe oder natürlich vorkommende Enzyme, wie Cas9, enthalten. Cas9-Homologe und/oder -Orthologe wurden in verschiedenen Spezies beschrieben, einschließlich, aber nicht beschränkt auf S. pyogenes und S. thermophilus. Vorzugsweise ist die Cas-Einheit als Nickase konfiguriert (z. B. mutiert, rekombinant hergestellt oder anderweitig aus der Natur gewonnen), d. h. sie ist in der Lage, nur einen einzigen Strang der doppelsträngigen Ziel-DNA zu spalten. Weitere geeignete Cas9- Nukleasen und -Sequenzen sind für Fachleute auf der Grundlage dieser Erfindung offensichtlich. Zu diesen Cas9-Nukleasen und -Sequenzen gehören Cas9-Sequenzen aus den Organismen und Loci, die in Chylinski, Rhun und Charpentier, „The tracrRNA and Cas9 families of type II CRISPR-Cas immunity systems“ (2013) RNA Biology 10:5, 726-737, offengelegt sind; der gesamte Inhalt dieses Dokuments wird hier durch Bezugnahme aufgenommen. In einigen Ausführungsformen hat eine Cas9-Nuklease eine inaktive (z. B. eine inaktivierte) DNA-Spaltungsdomäne, d. h. die Cas9 ist eine Nickase. In einigen Ausführungsformen umfasst das Cas9-Protein eine Aminosäuresequenz, die zu mindestens 80 % mit der Aminosäuresequenz eines Cas9-Proteins identisch ist, wie sie von einer der Varianten in Tabelle 3 bereitgestellt wird. In einigen Ausführungsformen umfasst das Cas9- Protein eine Aminosäuresequenz, die zu mindestens 85 %, mindestens 90 %, mindestens 92 %, mindestens 95 %, mindestens 96 %, mindestens 97 %, mindestens 98 %, mindestens 99 % oder mindestens 99,5 % mit der Aminosäuresequenz eines Cas9-Proteins identisch ist, wie sie von einem der Cas9-Orthologen in den obigen Tabellen bereitgestellt wird.
C. Tote Cas9 Variante
In bestimmten Ausführungsformen können die hier beschriebenen Multi-Flap-Prime- Editoren ein totes Cas9, z. B. totes SpCas9, enthalten, das aufgrund einer oder mehrerer Mutationen, die beide Nuklease-Domänen von Cas9, nämlich die RuvC-Domäne (die den Nicht-Protospacer-DNA-Strang spaltet) und die HNH-Domäne (die den Protospacer-DNA- Strang spaltet), inaktivieren, keine Nuklease-Aktivität besitzt. Die Nuklease-Inaktivierung kann auf eine oder mehrere Mutationen zurückzuführen sein, die zu einer oder mehreren Substitutionen und/oder Deletionen in der Aminosäuresequenz des kodierten Proteins oder einer beliebigen Variante davon führen, die mindestens 80 %, mindestens 85 %, mindestens 90 %, mindestens 95 % oder mindestens 99 % Sequenzidentität dazu aufweist.
Wie hier verwendet, bezieht sich der Begriff „dCas9“ auf ein Nuklease-inaktives Cas9 oder Nuklease-totes Cas9 oder ein funktionelles Fragment davon und umfasst jedes natürlich vorkommende dCas9 aus einem beliebigen Organismus, jedes natürlich vorkommende dCas9- Äquivalent oder funktionelle Fragment davon, jedes dCas9-Homolog, Ortholog oder Paralog aus einem beliebigen Organismus und jede Mutante oder Variante eines dCas9, ob natürlich vorkommend oder künstlich hergestellt. Der Begriff dCas9 ist nicht als besonders einschränkend zu verstehen und kann als „dCas9 oder Äquivalent“ bezeichnet werden Beispielhafte dCas9-Proteine und Verfahren zur Herstellung von dCas9-Proteinen sind hier weiter beschrieben und/oder in der Fachliteratur beschrieben und werden hier durch Bezugnahme aufgenommen.
In anderen Ausführungsformen entspricht dCas9 einer Cas9-Aminosäuresequenz mit einer oder mehreren Mutationen, die die Cas9-Nukleaseaktivität inaktivieren, oder umfasst diese ganz oder teilweise. In anderen Ausführungsformen werden Cas9-Varianten mit anderen Mutationen als D10A und H840A bereitgestellt, die zu einer vollständigen oder teilweisen Inaktivierung der endogenen Cas9-Nukleaseaktivität führen können (z. B. nCas9 bzw. dCas9). Solche Mutationen umfassen beispielsweise andere Aminosäure-Substitutionen an D10 und H840 oder andere Substitutionen innerhalb der Nuklease-Domänen von Cas9 (z. B. Substitutionen in der HNH-Nuklease-Subdomäne und/oder der RuvC1-Subdomäne) im Vergleich zu einer unmutierten Sequenz wie Cas9 aus Streptococcus pyogenes (NCBI Referenzsequenz: NC_017053.1). In einigen Ausführungsformen werden Varianten oder Homologe von Cas9 (z. B. Varianten von Cas9 aus Streptococcus pyogenes (NCBI Reference Sequence: NC_017053.1 (SEQ-ID-NR.: 20)) zur Verfügung gestellt, die mindestens etwa 70 % identisch, mindestens etwa 80 % identisch, mindestens etwa 90 % identisch, mindestens etwa 95 % identisch, mindestens etwa 98 % identisch, mindestens etwa 99 % identisch, mindestens etwa 99,5 % identisch oder mindestens etwa 99,9 % identisch mit der NCBI Referenzsequenz sind: NC_017053.1. In einigen Ausführungsformen werden Varianten von dCas9 (z. B. Varianten der NCBI-Referenzsequenz: NC_017053.1 (SEQ-ID-NR.: 20)) mit Aminosäuresequenzen bereitgestellt, die kürzer oder länger sind als NC_017053.1 (SEQ-ID- NR.: 20) um etwa 5 Aminosäuren, um etwa 10 Aminosäuren, um etwa 15 Aminosäuren, um etwa 20 Aminosäuren, um etwa 25 Aminosäuren, um etwa 30 Aminosäuren, um etwa 40 Aminosäuren, um etwa 50 Aminosäuren, um etwa 75 Aminosäuren, um etwa 100 Aminosäuren oder mehr.
In einer Ausführungsform kann das tote Cas9 auf der kanonischen SpCas9-Sequenz von Q99ZW2 basieren und die folgende Sequenz aufweisen, die ein D10X und ein H810X umfasst, wobei X eine beliebige Aminosäure, Substitutionen (unterstrichen und fett gedruckt) oder eine Variante von SEQ-ID-NR.: 40 sein kann mit mindestens 80 %, mindestens 85 %, mindestens 90 %, mindestens 95 % oder mindestens 99 % Sequenzidentität dazu.

In einer Ausführungsform kann das tote Cas9 auf der kanonischen SpCas9-Sequenz von Q99ZW2 basieren und die folgende Sequenz aufweisen, die eine D10A- und eine H810A- Substitution (unterstrichen und fettgedruckt) umfasst, oder eine Variante von SEQ-ID-NR.: 41 mit mindestens 80 %, mindestens 85 %, mindestens 90 %, mindestens 95 % oder mindestens 99 % Sequenzidentität zu ihm.

Beschreibung	Sequenz	SEQ-ID-NR.:
totes Cas9 oder dCas9		SEQ-ID-NR: 40
Streptococcus pyogenes Q99ZW2 Cas9 mit D10 X und H810 X
Wobei „X“ eine beliebige Aminosäure ist
totes Cas9 oder dCas9		SEQ-ID-NR: 41
Streptococcus pyogenes Q99ZW2 Cas9 mit D10A und H810A

Beschreibung	Sequenz	SEQ-ID-NR.:

D. Cas9-Nickase-Variante
In einer Ausführungsform umfassen die hier beschriebenen Multi-Flap-Prime-Editoren eine Cas9-Nickase. Der Begriff „Cas9-Nickase“ oder „nCas9“ bezieht sich auf eine Variante von Cas9, die in der Lage ist, einen Einzelstrangbruch in ein Doppelstrang-DNA-Molekül als Ziel einzuführen. In einigen Ausführungsformen umfasst die Cas9-Nickase nur eine einzige funktionierende Nuklease-Domäne. Der unmutierte Typ von Cas9 (z. B. das kanonische SpCas9) umfasst zwei separate Nuklease-Domänen, nämlich die RuvC-Domäne (die den Nicht-Protospacer-DNA-Strang spaltet) und die HNH-Domäne (die den Protospacer-DNA- Strang spaltet). In einer Ausführungsform umfasst die Cas9-Nickase eine Mutation in der RuvC-Domäne, die die RuvC-Nukleaseaktivität inaktiviert. Zum Beispiel wurden Mutationen in Aspartat (D) 10, Histidin (H) 983, Aspartat (D) 986 oder Glutamat (E) 762 als Loss-of- Function-Mutationen der RuvC-Nuklease-Domäne und die Schaffung einer funktionellen Cas9-Nickase gemeldet (z. B. Nishimasu et al., „Crystal structure of Cas9 in complex with guide RNA and target DNA“, Cell 156(5), 935-949, das hier durch Bezugnahme aufgenommen ist). So könnten Nickase-Mutationen in der RuvC-Domäne D10X, H983X, D986X oder E762X umfassen, wobei X eine beliebige Aminosäure außer der unmutierten Aminosäure ist. In bestimmten Ausführungsformen könnte die Nickase D10A, H983A, D986A oder E762A oder eine Kombination davon sein.

In verschiedenen Ausführungsformen kann die Cas9-Nickase eine Mutation in der RuvC-Nuklease-Domäne aufweisen und eine der folgenden Aminosäuresequenzen oder eine Variante davon mit einer Aminosäuresequenz haben, die mindestens 80 %, mindestens 85 %, mindestens 90 %, mindestens 95 % oder mindestens 99 % Sequenzidentität dazu aufweist.

Beschreibung	Sequenz	SEQ-ID-NR.:
Cas9-Nickase		SEQ-ID-NR: 42
Streptococcus pyogenes Q99ZW2 Cas9 mit D10X, wobei X eine beliebige alternative Aminosäure ist

Beschreibung	Sequenz	SEQ-ID-NR.:
Cas9-Nickase		SEQ-ID-NR: 43
Streptococcus pyogenes Q99ZW2 Cas9 mit E762X, wobei X eine beliebige alternative Aminosäure ist		SEQ-ID-NR: 43

Beschreibung	Sequenz	SEQ-ID-NR.:
Cas9-Nickase		SEQ-ID-NR: 44
Streptococcus pyogenes Q99ZW2 Cas9 mit H983X, wobei X eine beliebige alternative Aminosäure ist
Cas9-Nickase		SEQ-ID-NR: 45
Streptococcus pyogenes Q99ZW2 Cas9 mit D986X, wobei X eine beliebige alternative Aminosäure ist

Beschreibung	Sequenz	SEQ-ID-NR.:

Cas9-Nickase		SEQ-ID-NR: 46
Streptococcus pyogenes Q99ZW2 Cas9 mit D10 A

Beschreibung	Sequenz	SEQ-ID-NR.:

Cas9-Nickase		SEQ-ID-NR: 47
Streptococcus pyogenes Q99ZW2 Cas9 mit E762A

Beschreibung	Sequenz	SEQ-ID-NR.:
Cas9-Nickase		SEQ-ID-NR: 48
Streptococcus pyogenes Q99ZW2 Cas9 mit H983A
Streptococcus pyogenes Q99ZW2 Cas9 mit H983A

Beschreibung	Sequenz	SEQ-ID-NR.:
Cas9-Nickase		SEQ-ID-NR: 49
Streptococcus pyogenes Q99ZW2 Cas9 mit D986A

In einer anderen Ausführungsform umfasst die Cas9-Nickase eine Mutation in der HNH-Domäne, die die HNH-Nukleaseaktivität inaktiviert. Zum Beispiel wurden Mutationen in Histidin (H) 840 oder Asparagin (R) 863 als Loss-of-Function-Mutationen der HNH- Nuklease-Domäne und die Schaffung einer funktionellen Cas9-Nickase berichtet (z. B. Nishimasu et al., „Crystal structure of Cas9 in complex with guide RNA and target DNA“, Cell 156(5), 935-949, das hier durch Bezugnahme aufgenommen ist). So könnten Nickase- Mutationen in der HNH-Domäne H840X und R863X umfassen, wobei X eine beliebige Aminosäure außer der unmutierten Aminosäure ist. In bestimmten Ausführungsformen könnte die Nickase H840A oder R863A oder eine Kombination davon sein.

In verschiedenen Ausführungsformen kann die Cas9-Nickase eine Mutation in der HNH-Nuklease-Domäne aufweisen und eine der folgenden Aminosäuresequenzen oder eine Variante davon mit einer Aminosäuresequenz haben, die mindestens 80 %, mindestens 85 %, mindestens 90 %, mindestens 95 % oder mindestens 99 % Sequenzidentität dazu aufweist.

Beschreibung	Sequenz	SEQ-ID-NR.:
Cas9-Nickase		SEQ-ID-NR: 50
Streptococcus pyogenes Q99ZW2 Cas9 mit H840 X , wobei X eine beliebige alternative Aminosäure ist
Cas9-Nickase		SEQ-ID-NR: 51
Streptococcus pyogenes Q99ZW2 Cas9 mit H840 A

Cas9-Nickase		SEQ-ID-NR: 52
Streptococcus pyogenes Q99ZW2 Cas9 mit R863X, wobei X eine beliebige alternative Aminosäure ist

Cas9-Nickase		SEQ-ID-NR: 53
Streptococcus pyogenes Q99ZW2 Cas9 mit R863 A

In einigen Ausführungsformen wird das N-terminale Methionin aus einer Cas9-Nickase oder aus einer Cas9-Variante, einem Ortholog oder einem Äquivalent, das hier offenbart oder in Erwägung gezogen wird, entfernt. Zu den Methionin-Minus-Cas9-Nickasen gehören beispielsweise die folgenden Sequenzen oder eine Variante davon mit einer Aminosäuresequenz, die mindestens 80 %, mindestens 85 %, mindestens 90 %, mindestens 95 % oder mindestens 99 % Sequenzidentität damit aufweist.

Beschreibung	Sequenz
Cas9-Nickase (Met minus)
Streptococcus pyogenes Q99ZW2 Cas9 mit H840 X , wobei X eine beliebige alternative Aminosäure ist
Cas9-Nickase (Met minus)
Streptococcus pyogenes Q99ZW2 Cas9 mit H840 A
Cas9-Nickase (Met minus)
Streptococcus pyogenes Q99ZW2 Cas9 mit R863X, wobei X eine beliebige alternative Aminosäure ist
Cas9-Nickase (Met minus)
Streptococcus pyogenes Q99ZW2 Cas9 mit R863 A

E. Andere Cas9-Varianten
Neben toten Cas9- und Cas9-Nickase-Varianten können die hier verwendeten Cas9- Proteine auch andere „Cas9-Varianten“ umfassen, die zu mindestens etwa 70 %, mindestens etwa 80 %, mindestens etwa 90 %, mindestens etwa 95 %, mindestens etwa 96 %, mindestens etwa 97 %, mindestens etwa 98 %, mindestens etwa 99 %, mindestens etwa 99,5 % oder mindestens etwa 99,9 % mit einem beliebigen Referenz-Cas9-Protein identisch sind, einschließlich eines unmutierten Cas9 oder eines mutierten Cas9 (z. B., ein totes Cas9 oder eine Cas9-Nickase) oder ein Fragment-Cas9 oder ein zirkuläres permutantes Cas9 oder eine andere Cas9-Variante, die hier offenbart wird oder in der Technik bekannt ist. In einigen Ausführungsformen kann eine Cas9-Variante 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 21, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50 oder mehr Aminosäureänderungen im Vergleich zu einem Referenz-Cas9 aufweisen. In einigen Ausführungsformen umfasst die Cas9-Variante ein Fragment eines Referenz-Cas9 (z. B. eine gRNA-Bindungsdomäne oder eine DNA- Spaltungsdomäne), so dass das Fragment zu mindestens etwa 70 % identisch, zu mindestens etwa 80 % identisch, zu mindestens etwa 90 % identisch, zu mindestens etwa 95 % identisch, zu mindestens etwa 96 % identisch, zu mindestens etwa 97 % identisch, zu mindestens etwa 98 % identisch, zu mindestens etwa 99 % identisch, zu mindestens etwa 99,5 % identisch oder zu mindestens etwa 99,9 % identisch mit dem entsprechenden Fragment des unmutierten Cas9 ist. In einigen Ausführungsformen ist das Fragment mindestens 30 %, mindestens 35 %, mindestens 40 %, mindestens 45 %, mindestens 50 %, mindestens 55 %, mindestens 60 %, mindestens 65 %, mindestens 70 %, mindestens 75 %, mindestens 80 %, mindestens 85 %, mindestens 90 %, mindestens 95 % identisch, mindestens 96 %, mindestens 97 %, mindestens 98 %, mindestens 99 % oder mindestens 99,5 % der Aminosäurelänge eines entsprechenden, unmutierten Cas9 (z. B. SEQ-ID-NR.: 18).
In einigen Ausführungsformen kann die Offenlegung auch Cas9-Fragmente verwenden, die ihre Funktionalität beibehalten und die Fragmente eines hierin offengelegten Cas9-Proteins sind. In einigen Ausführungsformen ist das Cas9-Fragment mindestens 100 Aminosäuren lang. In einigen Ausführungsformen hat das Fragment eine Länge von mindestens 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250 oder mindestens 1300 Aminosäuren.
In verschiedenen Ausführungsformen können die hier offengelegten Multi-Flap-Prime- Editoren eine der nachfolgend beschriebenen Cas9-Varianten oder eine Cas9-Variante davon umfassen, die mindestens zu etwa 70 %, mindestens zu etwa 80 %, mindestens zu etwa 90 %, mindestens zu etwa 95 %, mindestens zu etwa 96 %, mindestens zu etwa 97 %, mindestens zu etwa 98 %, mindestens zu etwa 99 %, mindestens zu etwa 99,5 % oder mindestens zu etwa 99,9 % mit einer beliebigen Referenz-Cas9-Variante identisch ist.
F. Kleinere Cas9-Varianten
In einigen Ausführungsformen können die hier betrachteten Multi-Flap-Prime-Editoren ein Cas9-Protein enthalten, das ein geringeres Molekulargewicht hat als die kanonische SpCas9-Sequenz. In einigen Ausführungsformen können die kleineren Cas9-Varianten die Einbringung in Zellen erleichtern, z. B. durch einen Expressionsvektor, Nanopartikel oder andere Einbringungsmittel. In bestimmten Ausführungsformen können die kleineren Cas9- Varianten Enzyme umfassen, die als Typ-II-Enzyme der Klasse-2-CRISPR-Cas-Systeme kategorisiert sind. In einigen Ausführungsformen können die kleineren Cas9-Varianten Enzyme umfassen, die als Typ-V-Enzyme der Klasse 2 CRISPR-Cas-Systeme kategorisiert sind. In anderen Ausführungsformen können die kleineren Cas9-Varianten Enzyme umfassen, die als Typ VI-Enzyme der Klasse 2 CRISPR-Cas-Systeme eingestuft werden.
Das kanonische SpCas9-Protein ist 1368 Aminosäuren lang und hat ein vorhergesagtes Molekulargewicht von 158 Kilodalton. Der Begriff „kleine Cas9-Variante“, wie er hier verwendet wird, bezieht sich auf jede Cas9-Variante - natürlich vorkommend, konstruiert oder anderweitig -, die weniger als mindestens 1300 Aminosäuren, oder mindestens weniger als 1290 Aminosäuren, oder weniger als 1280 Aminosäuren, oder weniger als 1270 Aminosäuren, oder weniger als 1260 Aminosäuren, oder weniger als 1250 Aminosäuren, oder weniger als 1240 Aminosäuren, oder weniger als 1230 Aminosäuren, oder weniger als 1220 Aminosäuren, oder weniger als 1210 Aminosäuren, oder weniger als 1200 Aminosäuren, oder weniger als 1190 Aminosäuren, oder weniger als 1180 Aminosäuren, oder weniger als 1170 Aminosäuren, oder weniger als 1160 Aminosäuren, oder weniger als 1150 Aminosäuren, oder weniger als 1140 Aminosäuren, oder weniger als 1130 Aminosäuren, oder weniger als 1120 Aminosäuren, oder weniger als 1110 Aminosäuren, oder weniger als 1100 Aminosäuren, oder weniger als 1050 Aminosäuren, oder weniger als 1000 Aminosäuren, oder weniger als 950 Aminosäuren, oder weniger als 900 Aminosäuren, oder weniger als 850 Aminosäuren, oder weniger als 800 Aminosäuren, oder weniger als 750 Aminosäuren, oder weniger als 700 Aminosäuren, oder weniger als 650 Aminosäuren, oder weniger als 600 Aminosäuren, oder weniger als 550 Aminosäuren, oder weniger als 500 Aminosäuren aufweist, aber mindestens größer als etwa 400 Aminosäuren ist und unter Beibehaltung der erforderlichen Funktionen des Cas9-Proteins. Die Cas9-Varianten können als Typ II, Typ V oder Typ VI Enzyme des Klasse 2 CRISPR-Cas Systems kategorisiert werden.

In verschiedenen Ausführungsformen können die hier offengelegten Multi-Flap-Prime- Editoren eine der nachfolgend beschriebenen Cas9-Varianten in kleiner Größe oder eine Cas9- Variante davon umfassen, die zu mindestens etwa 70 %, mindestens etwa 80 %, mindestens etwa 90 %, mindestens etwa 95 %, mindestens etwa 96 %, mindestens etwa 97 %, mindestens etwa 98 %, mindestens etwa 99 %, mindestens etwa 99,5 % oder mindestens etwa 99,9 % mit einem beliebigen Referenz-Cas9-Protein in kleiner Größe identisch ist.

Beschreibung	Sequenz	SEQ-ID-NR.:
SaCas9		SEQ-ID-NR: 58
Staphylococcus aureus
1053 AA
123 kDa

NmeCas9		SEQ-ID-NR: 59
N. meningitidis
1083 AA
124.5 kDa
CjCas9		SEQ-ID-NR: 60
C. jejuni
984 AA
114,9 kDa
GeoCas9		SEQ-ID-NR: 61
G. stearothermophilus
1087 AA
127 kDa
LbaCas 12a		SEQ-ID-NR: 62
L. Bakterium
1228 AA
143,9 kDa
BhCas12b		SEQ-ID-NRR: 63
B. hisashii
1108 AA
130,4 kDa

G. Cas9-Äquivalente
In einigen Ausführungsformen können die hier beschriebenen Multi-Flap-Prime- Editoren jedes Cas9-Äquivalent enthalten. Wie hier verwendet, ist der Begriff „Cas9- Äquivalent“ ein weit gefasster Begriff, der jedes napDNAbp-Protein umfasst, das die gleiche Funktion wie Cas9 in den vorliegenden Multi-Flap-Prime-Editoren erfüllt, obwohl seine primäre Aminosäuresequenz und/oder seine dreidimensionale Struktur aus evolutionärer Sicht unterschiedlich und/oder nicht verwandt sein kann. Während Cas9-Äquivalente also jedes Cas9-Ortholog, -Homolog, -Mutant oder -Variante umfassen, die hierin beschrieben oder einbezogen sind und die evolutionär verwandt sind, umfassen die Cas9-Äquivalente auch Proteine, die sich durch konvergente Evolutionsprozesse entwickelt haben können, um die gleiche oder eine ähnliche Funktion wie Cas9 zu haben, die aber nicht notwendigerweise eine Ähnlichkeit in Bezug auf die Aminosäuresequenz und/oder die dreidimensionale Struktur aufweisen. Die hier beschriebenen Multi-Flap-Prime-Editoren umfassen jedes Cas9- Äquivalent, das die gleiche oder eine ähnliche Funktion wie Cas9 bietet, auch wenn das Cas9- Äquivalent auf einem Protein basiert, das durch konvergente Evolution entstanden ist. Wenn sich Cas9 beispielsweise auf ein Typ II-Enzym des CRISPR-Cas-Systems bezieht, kann sich ein Cas9-Äquivalent auf ein Typ V- oder Typ VI-Enzym des CRISPR-Cas-Systems beziehen.
Cas12e (CasX) zum Beispiel ist ein Cas9-Äquivalent, das Berichten zufolge die gleiche Funktion wie Cas9 hat, sich aber durch konvergente Evolution entwickelt hat. So ist das Cas12e (CasX) Protein, das in Liu et al., „CasX enzymes comprises a distinct family of RNA- guided genome editors“, Nature, 2019, Vol.566: 218-223 beschrieben wird, für die Verwendung mit den hier beschriebenen Multi-Flap-Prime-Editoren vorgesehen. Darüber hinaus ist jede Variante oder Modifikation von Cas12e (CasX) denkbar und liegt im Rahmen der vorliegenden Offenbarung.
Cas9 ist ein bakterielles Enzym, das sich in einer Vielzahl von Arten entwickelt hat. Die hier in Betracht gezogenen Cas9-Äquivalente können jedoch auch aus Archaeen gewonnen werden, die eine andere Domäne und ein anderes Reich einzelliger prokaryotischer Mikroben als Bakterien darstellen.
In einigen Ausführungsformen können sich Cas9-Äquivalente auf Cas12e (CasX) oder Cas12d (CasY) beziehen, die z. B. beschrieben wurden in Burstein et al., „New CRISPR-Cas systems from uncultivated microbes“ Cell Res. 2017 Feb 21. doi: 10.1038/cr.2017.21, dessen gesamter Inhalt hiermit durch Verweis einbezogen wird. Mithilfe der genomaufgelösten Metagenomik wurde eine Reihe von CRISPR-Cas-Systemen identifiziert, darunter das erste Cas9, das in der archäischen Lebensdomäne gefunden wurde. Dieses abweichende Cas9- Protein wurde in wenig untersuchten Nanoarchaea als Teil eines aktiven CRISPR-Cas-Systems gefunden. In Bakterien wurden zwei bisher unbekannte Systeme entdeckt, CRISPR-Cas12e und CRISPR-Cas12d, die zu den kompaktesten Systemen gehören, die bisher entdeckt wurden. In einigen Ausführungsformen bezieht sich Cas9 auf Cas12e oder eine Variante von Cas12e. In einigen Ausführungsformen bezieht sich Cas9 auf Cas12d oder eine Variante von Cas12d. Es ist zu beachten, dass auch andere RNA-gesteuerte DNA-Bindungsproteine als Nukleinsäure-programmierbares DNA-Bindungsprotein (napDNAbp) verwendet werden können und in den Anwendungsbereich dieser Offenbarung fallen. Siehe auch Liu et al., „CasX enzymes comprises a distinct family of RNA-guided genome editors“, Nature, 2019, Vol.566: 218-223. Jedes dieser Cas9-Äquivalente ist denkbar.
In einigen Ausführungsformen umfasst das Cas9-Äquivalent eine Aminosäuresequenz, die mindestens 85 %, mindestens 90 %, mindestens 91 %, mindestens 92 %, mindestens 93 %, mindestens 94 %, mindestens 95 %, mindestens 96 %, mindestens 97 %, mindestens 98 %, mindestens 99 % oder mindestens 99,5 % identisch mit einem natürlich vorkommenden Cas12e (CasX) oder Cas12d (CasY) Protein ist. In einigen Ausführungsformen ist das napDNAbp ein natürlich vorkommendes Cas12e (CasX) oder Cas12d (CasY) Protein. In einigen Ausführungsformen umfasst das napDNAbp eine Aminosäuresequenz, die zu mindestens 85 %, mindestens 90 %, mindestens 91 %, mindestens 92 %, mindestens 93 %, mindestens 94 %, mindestens 95 %, mindestens 96 %, mindestens 97 %, mindestens 98 %, mindestens 99 % oder mindestens 99,5 % mit einer unmutierten Cas-Einheit oder einer hierin bereitgestellten Cas-Einheit identisch ist.
In verschiedenen Ausführungsformen umfassen die Nukleinsäure-programmierbaren DNA-Bindungsproteine, ohne Einschränkung, Cas9 (z. B. dCas9 und nCas9), Cas12e (CasX), Cas12d (CasY), Cas12a (Cpfl), Cas12b1 (C2c1), Cas13a (C2c2), Cas12c (C2c3), Argonaute und Cas12b1. Ein Beispiel für ein durch Nukleinsäure programmierbares DNA-bindendes Protein, das eine andere PAM-Spezifität als Cas9 aufweist, ist Clustered Regularly Interspaced Short Palindromic Repeats from Prevotella and Francisella 1 (d. h. Cas12a (Cpfl)). Ähnlich wie Cas9 ist auch Cas12a (Cpfl) ein CRISPR-Effektor der Klasse 2, aber er gehört zur Untergruppe Typ V der Enzyme und nicht zur Untergruppe Typ II. Es hat sich gezeigt, dass Cas12a (Cpfl) eine robuste DNA-Interferenz mit anderen Eigenschaften als Cas9 vermittelt. Cas12a (Cpfl) ist eine einzelne RNA-gesteuerte Endonuklease, der tracrRNA fehlt und die ein T-reiches, an den Protospacer angrenzendes Motiv (TTN, TTTN oder YTN) verwendet. Außerdem spaltet Cpfl die DNA über einen gestaffelten DNA-Doppelstrangbruch. Von den 16 Proteinen der Cpfl-Familie haben zwei Enzyme aus Acidaminococcus und Lachnospiraceae eine effiziente Genom-Editing-Aktivität in menschlichen Zellen gezeigt. Cpfl-Proteine sind in der Fachwelt bekannt und wurden bereits beschrieben, z. B. Yamano et al., „Crystal structure of Cpfl in complex with guide RNA and target DNA“ Cell (165) 2016, S. 949-962; der gesamte Inhalt wird hiermit durch Bezugnahme aufgenommen.
In noch anderen Ausführungsformen kann das Cas-Protein jedes CRISPR-assoziierte Protein umfassen, einschließlich, aber nicht beschränkt auf Cas12a, Cas12b1, Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9 (auch bekannt als Csn1 und Csx12), Cas10, Csy1, Csy2, Csy3, Csel, Cse2, Cscl, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4, Homologe davon, oder modifizierte Versionen davon, und vorzugsweise umfassend eine Nickase-Mutation (z. B., eine Mutation, die der D10A-Mutation des unmutierten Cas9-Polypeptids der SEQ-ID-NR.: 18).
In verschiedenen anderen Ausführungsformen kann das napDNAbp eines der folgenden Proteine sein: a Cas9, a Cas12a (Cpfl), a Cas12e (CasX), a Cas12d (CasY), a Cas12b1 (C2c1), a Cas13a (C2c2), a Cas12c (C2c3), a GeoCas9, a CjCas9, a Cas12g, a Cas12h, eine Cas12i, eine Cas13b, eine Cas13c, eine Cas13d, eine Cas14, eine Csn2, eine xCas9, eine SpCas9-NG, eine zirkulär permutierte Cas9 oder eine Argonaute (Ago) Domäne oder eine Variante davon.

Exemplarische Cas9-äquivalente Proteinsequenzen können die folgenden sein:

Beschreibung	Sequenz
AsCas 12a (früher bekannt als Cpf1)
Acidaminococcus sp. (Stamm BV3L6)
UniProtKB
U2UMQ6

AsCas12a- Nickase (z. B. R1226A)
LbCas12a (früher bekannt als Cpf1)
Lachnospiraceae Bakterium GAM79
Ref Seq. WP_11962 3382.1
PcCas12a - vorher bekannt
unter Cpf1
Prevotella copri
Ref Seq. WP_11922 7726.1
ErCas12a - vorher bekannt unter Cpf1
Eubacterium rectale
Ref Seq. WP_11922 3642.1
CsCas12a - vorher bekannt unter Cpf1
Clostridium
sp. AF34- 10BH
Ref Seq. WP_11853 8418.1
BhCas12b
Bacillus hisashii
Ref Seq. WP_09514 2515.1
ThCas12b
Thermomonas hydrothermalis
Ref Seq. WP_07275 4838

LsCas12b
Laceyella sacchari
WP_13222 1894.1
DtCas 12b
Dsulfonatronum thiodismutans
WP_03138 6437

Die hier beschriebenen Multi-Flap-Prime-Editoren können auch Cas12a (Cpfl) (dCpfl)-Varianten umfassen, die als eine durch eine Leitnukleotidsequenz programmierbare DNA-bindende Proteindomäne verwendet werden können. Das Cas12a (Cpfl)-Protein hat eine RuvC-ähnliche Endonuklease-Domäne, die der RuvC-Domäne von Cas9 ähnelt, aber keine HNH-Endonuklease-Domäne hat, und der N-Terminus von Cas12a (Cpfl) hat nicht den alfa-helicalen Erkennungslappen von Cas9. In Zetsche et al., Cell, 163, 759-771, 2015 (hier durch Verweis aufgenommen) wurde gezeigt, dass die RuvC-ähnliche Domäne von Cas12a (Cpfl) für die Spaltung beider DNA-Stränge verantwortlich ist und die Inaktivierung der RuvC-ähnlichen Domäne die Nukleaseaktivität von Cas12a (Cpfl) inaktiviert.
In einigen Ausführungsformen ist das napDNAbp ein einzelner Effektor eines mikrobiellen CRISPR-Cas-Systems. Zu den einzelnen Effektoren der mikrobiellen CRISPR- Cas-Systeme gehören unter anderem Cas9, Cas12a (Cpfl), Cas12b1 (C2c1), Cas13a (C2c2) und Cas12c (C2c3). Typischerweise werden mikrobielle CRISPR-Cas-Systeme in Klasse-1- und Klasse-2-Systeme unterteilt. Systeme der Klasse 1 haben Effektor-Komplexe mit mehreren Untereinheiten, während Systeme der Klasse 2 einen einzelnen Protein-Effektor haben. Cas9 und Cas12a (Cpfl) zum Beispiel sind Effektoren der Klasse 2. Neben Cas9 und Cas12a (Cpfl) wurden drei weitere CRISPR-Cas-Systeme der Klasse 2 (Cas12b1, Cas13a und Cas12c) beschrieben von Shmakov et al., „Discovery and Functional Characterization of Diverse Class 2 CRISPR Cas Systems“, Mol. Cell, 2015 Nov 5; 60(3): 385-397, deren gesamter Inhalt hiermit durch Verweis einbezogen wird.
Die Effektoren von zwei der Systeme, Cas12b1 und Cas12c, enthalten RuvC-ähnliche Endonuklease-Domänen, die mit Cas12a verwandt sind. Ein drittes System, Cas13a, enthält einen Effektor mit zwei vorhergesagten HEPN-RNase-Domänen. Die Produktion von ausgereifter CRISPR-RNA ist unabhängig von tracrRNA, im Gegensatz zur Produktion von CRISPR-RNA durch Cas12b1. Cas12b1 ist für die DNA-Spaltung sowohl auf CRISPR-RNA als auch auf tracrRNA angewiesen. Es hat sich gezeigt, dass bakterielles Cas13a eine einzigartige RNase-Aktivität für die CRISPR-RNA-Reifung besitzt, die sich von seiner RNAaktivierten Aktivität zum FIGau einzelsträngiger RNA unterscheidet. Diese RNase-Funktionen unterscheiden sich voneinander und von dem CRISPR-RNA-verarbeitenden Verhalten von Cas12a. Siehe z. B.z. B. East-Seletsky, et al. „Two distinct RNase activities of CRISPR- Cas13a enable guide-RNA processing and RNA detection“, Nature, 13. Okt. 2016; 538(7624):270-273, dessen gesamter Inhalt hiermit durch Bezugnahme aufgenommen wird. Biochemische In-vitro-Analysen von Cas13a in Leptotrichia shahii haben gezeigt, dass Cas13a von einer einzigen CRISPR-RNA geleitet wird und so programmiert werden kann, dass es ssRNA-Ziele mit komplementären Protospacern spaltet. Katalytische Reste in den beiden konservierten HEPN-Domänen vermitteln die Spaltung. Mutationen in den katalytischen Resten erzeugen katalytisch inaktive RNA-bindende Proteine. Siehe z. B. Abudayyeh et al. „C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector“, Science, 5. Aug. 2016; 353(6299), dessen gesamter Inhalt hiermit durch Bezugnahme aufgenommen wird.
Die Kristallstruktur von Alicyclobaccillus acidoterrastris Cas12b1 (AacC2c1) wurde im Komplex mit einer chimären Einzelmolekül-Leit-RNA (sgRNA) veröffentlicht. Siehe z. B. Liu et al. „C2c1-sgRNA Complex Structure Reveals RNA-Guided DNA Cleavage Mechanism“, Mol. Cell, 19. Jan 2017; 65(2):310-322, dessen gesamter Inhalt hiermit durch Bezugnahme aufgenommen wird. Die Kristallstruktur wurde auch für Alicyclobacillus acidoterrestris C2c1, gebunden an Ziel-DNAs als ternäre Komplexe, berichtet. Siehe z. B. Yang et al., „PAM-dependent Target DNA Recognition and Cleavage by C2C1 CRISPR-Cas endonuclease“, Cell, 15. Dez. 2016; 167(7):1814-1828, dessen gesamter Inhalt hiermit durch Bezugnahme aufgenommen wird. Katalytisch kompetente Konformationen von AacC2c1, sowohl mit Ziel- als auch mit Nicht-Ziel-DNA-Strängen, wurden unabhängig voneinander in einer einzigen katalytischen RuvC-Tasche erfasst, wobei die C2c1-vermittelte Spaltung zu einem gestaffelten Sieben-Nukleotid-Bruch der Ziel-DNA führt. Strukturelle Vergleiche zwischen ternären C2c1-Komplexen und zuvor identifizierten Cas9- und Cpfl-Gegenstücken zeigen die Vielfalt der von CRISPR-Cas9-Systemen verwendeten Mechanismen.
In einigen Ausführungsformen kann das napDNAbp ein C2c1-, ein C2c2- oder ein C2c3-Protein sein. In einigen Ausführungsformen ist das napDNAbp ein C2c1-Protein. In einigen Ausführungsformen ist das napDNAbp ein Cas13a-Protein. In einigen Ausführungsformen ist das napDNAbp ein Cas12c-Protein. In einigen Ausführungsformen umfasst das napDNAbp eine Aminosäuresequenz, die zu mindestens 85 %, mindestens 90 %, mindestens 91 %, mindestens 92 %, mindestens 93 %, mindestens 94 %, mindestens 95 %, mindestens 96 %, mindestens 97 %, mindestens 98 %, mindestens 99 % oder mindestens 99,5 % identisch mit einem natürlich vorkommenden Cas12b1 (C2c1)-, Cas13a (C2c2)- oder Cas12c (C2c3)-Protein ist. In einigen Ausführungsformen ist das napDNAbp ein natürlich vorkommendes Cas12b1 (C2c1)-, Cas13a (C2c2)- oder Cas12c (C2c3)-Protein.
H. Zirkuläre Cas9-Permutanten
In verschiedenen Ausführungsformen können die hierin offenbarten Multi-Flap-Prime- Editoren eine zirkuläre Permutante von Cas9 umfassen.
Der Begriff „zirkulär permutiertes Cas9“ oder „zirkulärer Permutant“ von Cas9 oder „CP-Cas9“) bezieht sich auf jedes Cas9-Protein oder eine Variante davon, das als zirkulär permutierte Variante auftritt oder modifiziert wurde, was bedeutet, dass der N-Terminus und der C-Terminus eines Cas9-Proteins (z. B. eines Wildtyp-Cas9-Proteins) topisch umgeordnet wurden. Solche zirkulär permutierten Cas9-Proteine oder Varianten davon behalten die Fähigkeit, DNA zu binden, wenn sie mit einer Leit-RNA (gRNA) komplexiert sind. Siehe, Oakes et al. „Protein Engineering of Cas9 for enhanced function“, Methods Enzymol, 2014, 546: 491-511 und Oakes et al. „CRISPR-Cas9 Circular Permutants as Programmable Scaffolds for Genome Modification,“ Cell, 10. Januar 2019, 176: 254-267, die hierin jeweils durch Bezugnahme aufgenommen sind. Die vorliegende Offenbarung berücksichtigt jedes bereits bekannte CP-Cas9 oder die Verwendung eines neuen CP-Cas9, solange das resultierende zirkulär permutierte Protein die Fähigkeit behält, DNA zu binden, wenn es mit einer Leit-RNA (gRNA) komplexiert ist.
Jedes der hierin beschriebenen Cas9-Proteine, einschließlich jeder Variante, jedes Ortholog, jedes natürlich vorkommende Cas9 oder ein Äquivalent davon, kann als zirkulär permutierte Variante rekonfiguriert werden.
In verschiedenen Ausführungsformen können die zirkulären Permutanten von Cas9 die folgende Struktur aufweisen:

N-Terminus-[ursprünglicher C-Terminus] - [optionaler Linker] - [ursprünglicher N- Terminus]-C-Terminus.

Zum Beispiel betrachtet die vorliegende Offenbarung die folgenden zirkulären Permutanten von kanonischem S. pyogenes Cas9 (1368 Aminosäuren von UniProtKB - Q99ZW2 (CAS9_STRP1) (die Nummerierung basiert auf der Aminosäureposition in SEQ-ID- NR: 18)):

N-Terminus-[1268-1368]-[optionaler Linker]-[1-1267]-C-Terminus;
N-Terminus-[1168-1368]-[optionaler Linker]-[1-1167]-C-Terminus;
N-Terminus-[1068-1368]-[optionaler Linker 1 -1 067]-C-Terminus;
N-Terminus-[968-1368]-[optionaler Linker]-[1-967]-C-Terminus;
N-Terminus-[868-1368]-[optionaler Linker]-[1-867]-C-Terminus;
N-Terminus-[768-1368]-[optionaler Linker]-[1-767]-C-Terminus;
N-Terminus-[668-1368]-[optionaler Linker]-[1-667]-C-Terminus;
N-Terminus-[568-1368]-[optionaler Linker]-[1-567]-C-Terminus;
N-Terminus-[468-1368]-[optionaler Linker]-[1-467]-C-Terminus;
N-Terminus-[368-1368]-[optionaler Linker]-[1-367]-C-Terminus;
N-Terminus-[268-1368]-[optionaler Linker]-[1-267]-C-Terminus;
N-Terminus-[168-1368]-[optionaler Linker]-[1-167]-C-Terminus;
N-Terminus-[68-1368]-[optionaler Linker]-[1-67]-C-Terminus; oder
N-Terminus-[10-1368]-[optionaler Linker]-[1-9]-C-Terminus, oder die entsprechenden zirkulären Permutanten anderer Cas9-Proteine (einschließlich anderer Cas9-Orthologe, Varianten usw.).

In bestimmten Ausführungsformen weist das zirkuläre permuante Cas9 die folgende Struktur auf (basierend auf S. pyogenes Cas9 (1368 Aminosäuren von UniProtKB - Q99ZW2 (CAS9_STRP1) (die Nummerierung basiert auf der Aminosäureposition in SEQ-ID-NR: 18):

N-Terminus-[102-1368]-[optionaler Linker]-[1-101]-C-Terminus;
N-Terminus-[1028-1368]-[optionaler Linker]-[1-1027]-C-Terminus;
N-Terminus-[1041-1368]-[optionaler Linker]-[1-1043]-C-Terminus;
N-Terminus-[1249-1368]-[optionaler Linker]-[1-1248]-C-Terminus; oder
N-Terminus-[1300-1368]-[optionaler Linker]-[1-1299]-C-Terminus, oder die entsprechenden zirkulären Permutanten anderer Cas9-Proteine (einschließlich anderer Cas9-Orthologe, Varianten usw.).

In noch anderen Ausführungsformen weist das zirkuläre permuante Cas9 die folgende Struktur auf (basierend auf S. pyogenes Cas9 (1368 Aminosäuren von UniProtKB - Q99ZW2 (CAS9 _STRP1) (die Nummerierung basiert auf der Aminosäureposition in SEQ-ID-NR: 18):

N-Terminus-[103-1368]-[optionaler Linker]-[1-102]-C-Terminus;
N-Terminus-[1029-1368]-[optionaler Linker]-[1-1028]-C-Terminus;
N-Terminus-[1042-1368]-[optionaler Linker]-[1-1041]-C-Terminus;
N-Terminus-[1250-1368]-[optionaler Linker]-[1-1249]-C-Terminus; oder
N-Terminus-[1301-1368]-[optionaler Linker]-[1-1300]-C-Terminus, oder die entsprechenden zirkulären Permutanten anderer Cas9-Proteine (einschließlich anderer Cas9-Orthologe, Varianten usw.).

In einigen Ausführungsformen kann die zirkuläre Permutante durch Verknüpfung eines C-terminalen Fragments eines Cas9 mit einem N-terminalen Fragment eines Cas9 gebildet werden, entweder direkt oder durch Verwendung eines Linkers, wie etwa eines Aminosäure- Linkers. In einigen Ausführungsformen kann das C-terminale Fragment den C-terminalen 95 % oder mehr der Aminosäuren eines Cas9 (z. B. Aminosäuren etwa 1300-1368) oder den C-terminalen 90 %, 85 %, 80 %, 75 %, 70 %, 65 %, 60 %, 55 %, 50 %, 45 %, 40 %, 35 %, 30 %, 25 %, 20 %, 15 %, 10 % oder 5 % oder mehr eines Cas9 entsprechen (z. B. jede der SEQ-ID-NR: 77-86). Der N-terminale Abschnitt kann den C-terminalen 95 % oder mehr der Aminosäuren eines Cas9 (z. B. Aminosäuren etwa 1-1300) oder den C-terminalen 90 %, 85 %, 80 %, 75 %, 70 %, 65 %, 60 %, 55 %, 50 %, 45 %, 40 %, 35 %, 30 %, 25 %, 20 %, 15 %, 10 % oder 5 % oder mehr eines Cas9 entsprechen (z. B. von SEQ-ID-NR: 18).
In einigen Ausführungsformen kann die zirkuläre Permutante durch Verknüpfung eines C-terminalen Fragments eines Cas9 mit einem N-terminalen Fragment eines Cas9 gebildet werden, entweder direkt oder durch Verwendung eines Linkers, wie etwa eines Aminosäure- Linkers. In einigen Ausführungsformen beinhaltet oder entspricht das C-terminale Fragment, das zum N-Terminus umgeordnet wird, den C-terminalen 30 % oder weniger der Aminosäuren eines Cas9 (z. B. die Aminosäuren 1012-1368 von SEQ-ID-NR: 18). In einigen Ausführungsformen beinhaltet oder entspricht das C-terminale Fragment, das zum N-Terminus umgeordnet ist, den C-terminalen 30 %, 29 %, 28 %, 27 %, 26 %, 25 %, 24 %, 23 %, 22 %, 21 %, 20 %, 19 %, 18 %, 17 %, 16 %, 15 %, 14 %, 13 %, 12 %, 11 %, 10 %, 9 %, 8 %, 7 %, 6 %, 5 %, 4 %, 3 %, 2 % oder 1 % der Aminosäuren eines Cas9 (z. B. das Cas9 der SEQ-ID- NR: 18). In einigen Ausführungsformen beinhaltet oder entspricht das C-terminale Fragment, das zum N-Terminus umgeordnet ist, den C-terminalen 410 Resten oder weniger eines Cas9 (z. B. das Cas9 von SEQ-ID-NR: 18). In einigen Ausführungsformen beinhaltet oder entspricht der C-terminale Abschnitt, der zum N-Terminus umgeordnet ist, den C-terminalen 410, 400, 390, 380, 370, 360, 350, 340, 330, 320, 310, 300, 290, 280, 270, 260, 250, 240, 230, 220, 210, 200, 190, 180, 170, 160, 150, 140, 130, 120, 110, 100, 90, 80, 70, 60, 50, 40, 30, 20 oder 10 Resten eines Cas9 (z. B, das Cas9 der SEQ-ID-NR: 18). In einigen Ausführungsformen beinhaltet oder entspricht der C-terminale Abschnitt, der zum N-Terminus umgeordnet ist, den C-terminalen 357, 341, 328, 120 oder 69 Resten eines Cas9 (z. B. das Cas9 von SEQ-ID-NR: 18).
In anderen Ausführungsformen können zirkuläre permutante Cas9-Varianten als eine topologische Umstrukturierung einer Cas9-Primärstruktur definiert werden, basierend auf dem folgenden Verfahren, das auf S. pyogenes Cas9 der SEQ-ID-NR: 18 basiert: (a) Auswählen einer zirkulären Permutantenstelle (circular permutant - CP), die einem internen Aminosäurerest der Cas9-Primärstruktur entspricht, wodurch das ursprüngliche Protein in zwei Hälften zerlegt wird: eine N-terminale Region und eine C-terminalen Region; (b) Modifizieren der Cas9-Proteinsequenz (z. B. durch gentechnische Verfahren) durch Verschieben der ursprünglichen C-terminalen Region (die die Aminosäure der CP-Stelle umfasst) vor die ursprüngliche N-terminale Region, wodurch ein neuer N-Terminus des Cas9-Proteins gebildet wird, der nun mit dem Aminosäurerest der CP-Stelle beginnt. Die CP-Stelle kann sich in einer beliebigen Domäne des Cas9-Proteins befinden, die zum Beispiel die spiralförmige 11-Domäne, die RuvCIII-Domäne oder die CTD-Domäne beinhaltet. Zum Beispiel kann sich die CP-Stelle (bezogen auf das S. pyogenes Cas9 der SEQ-ID-NR: 18) am ursprünglichen Aminosäurerest 181, 199, 230, 270, 310, 1010, 1016, 1023, 1029, 1041, 1247, 1249 oder 1282 befinden. So würde die ursprüngliche Aminosäure 181, 199, 230, 270, 310, 1010, 1016, 1023, 1029, 1041, 1247, 1249 oder 1282 zur neuen N-terminalen Aminosäure werden, sobald sie an den N- Terminus verlagert wurde. Die Nomenklatur dieser CP-Cas9-Proteine kann als Cas9-CP¹⁸¹, Cas9-CP¹⁹⁹, Cas9-CP²³⁰, Cas9-CP²⁷⁰, Cas9-CP³¹⁰, Cas9-CP¹⁰¹⁰, Cas9-CP¹⁰¹⁶, Cas9-CP¹⁰²³, Cas9-CP¹⁰²⁹, Cas9-CP¹⁰⁴¹, Cas9-CP¹²⁴⁷, Cas9-CP¹²⁴⁹bzw. Cas9-CP¹²⁸² bezeichnet werden. Diese Beschreibung soll sich nicht auf die Herstellung von CP-Varianten aus SEQ-ID-NR: 18 beschränken, sondern kann zur Herstellung von CP-Varianten in jeder Cas9-Sequenz eingesetzt werden, entweder an CP-Stellen, die diesen Positionen entsprechen, oder an ganz anderen CP-Stellen. Diese Beschreibung ist nicht dazu gedacht, die spezifischen CP-Stellen in irgendeiner Weise einzuschränken. Praktisch jede CP-Stelle kann zur Bildung einer CP-Cas9- Variante verwendet werden.
Beispielhafte CP-Cas9-Aminosäuresequenzen, basierend auf dem Cas9 der SEQ-ID- NR: 18, werden im Folgenden bereitgestellt, wobei Linker-Sequenzen durch Unterstreichung und optionale Methionin (M)-Reste fett dargestellt sind. Es sei darauf hingewiesen, dass die Offenbarung CP-Cas9-Sequenzen bereitstellt, die keine Linker-Sequenz oder andere Linker- Sequenzen beinhalten. Es sei darauf hingewiesen, dass CP-Cas9-Sequenzen auf anderen Cas9- Sequenzen als denen von SEQ-ID-NR: 18 basieren können, und die hierin bereitgestellten Beispiele sind nicht als einschränkend zu betrachten. Beispielhafte CP-Cas9-Sequenzen sind wie folgt:

CP-Name Sequenz SEQ-ID-NR:

CP1012
SEQ-ID-NR: 77

CP-Name Sequenz SEQ-ID-NR:

CP1028
SEQ-ID-NR: 78

CP1041
SEQ-ID-NR: 79

CP-Name Sequenz SEQ-ID-NR:

CP1249
SEQ-ID-NR: 80

CP-Name Sequenz SEQ-ID-NR:

CP1300
SEQ-ID-NR: 81

Die zirkulären Cas9-Permutanten können in den hierin beschriebenen Multi-Flap- Prime-Editing-Konstrukten nützlich sein. Beispielhafte C-terminale Fragmente von Cas9, basierend auf dem Cas9 von SEQ-ID-NR: 18, die zu einem N-Terminus von Cas9 umgeordnet werden können, werden im Folgenden bereitgestellt. Es sei darauf hingewiesen, dass solche C- terminalen Fragmente von Cas9 beispielhaft sind und nicht als Einschränkung verstanden werden sollen. Diese beispielhaften CP-Cas9-Fragmente haben die folgenden Sequenzen:

CP-Name	Sequenz	SEQ-ID-NR:
CP1012 C- terminales Fragment		SEQ-ID-NR: 82

CP-Name	Sequenz	SEQ-ID-NR:
CP1028 C- terminales Fragment		SEQ-ID-NR: 83
CP1041 C- terminales Fragment		SEQ-ID-NR: 84
CP1249 C- terminales Fragment		SEQ-ID-NR: 85
CP1300 C- terminales Fragment		SEQ-ID-NR: 86

I. Cas9-Varianten mit modifizierten PAM-Spezifitäten
Die Multi-Flap-Prime-Editoren der vorliegenden Offenbarung können auch Cas9- Varianten mit modifizierten PAM-Spezifitäten umfassen. Einige Aspekte dieser Offenbarung stellen Cas9-Proteine bereit, die eine Aktivität auf einer Zielsequenz aufweisen, die nicht die kanonische PAM (5'-NGG-3', wobei N A, C, G oder T ist) an ihrem 3'-Ende umfasst. In einigen Ausführungsformen zeigt das Cas9-Protein Aktivität gegenüber einer Zielsequenz, die eine 5'- NGG-3'-PAM-Sequenz an ihrem 3'-Ende umfasst. In einigen Ausführungsformen zeigt das Cas9-Protein Aktivität an einer Zielsequenz, die eine 5'-NNG-3'-PAM-Sequenz an ihrem 3'- Ende umfasst. In einigen Ausführungsformen zeigt das Cas9-Protein Aktivität an einer Zielsequenz, die eine 5'-NNA-3'-PAM-Sequenz an ihrem 3'-Ende umfasst. In einigen Ausführungsformen zeigt das Cas9-Protein Aktivität an einer Zielsequenz, die eine 5'-NNC- 3'-PAM-Sequenz an ihrem 3'-Ende umfasst. In einigen Ausführungsformen zeigt das Cas9- Protein Aktivität an einer Zielsequenz, die eine 5'-NNT-3'-PAM-Sequenz an ihrem 3'-Ende umfasst. In einigen Ausführungsformen zeigt das Cas9-Protein Aktivität an einer Zielsequenz, die eine 5'-NGT-3'-PAM-Sequenz an ihrem 3'-Ende umfasst. In einigen Ausführungsformen zeigt das Cas9-Protein Aktivität an einer Zielsequenz, die eine 5'-NGA-3'-PAM-Sequenz an ihrem 3'-Ende umfasst. In einigen Ausführungsformen zeigt das Cas9-Protein Aktivität an einer Zielsequenz, die eine 5'-NGC-3'-PAM-Sequenz an ihrem 3'-Ende umfasst. In einigen Ausführungsformen zeigt das Cas9-Protein Aktivität an einer Zielsequenz, die eine 5'-NAA- 3'-PAM-Sequenz an ihrem 3'-Ende umfasst. In einigen Ausführungsformen zeigt das Cas9- Protein Aktivität an einer Zielsequenz, die eine 5'-NAC-3'-PAM-Sequenz an ihrem 3'-Ende umfasst. In einigen Ausführungsformen zeigt das Cas9-Protein Aktivität an einer Zielsequenz, die eine 5'-NAT-3'-PAM-Sequenz an ihrem 3'-Ende umfasst. In noch anderen Ausführungsformen zeigt das Cas9-Protein Aktivität an einer Zielsequenz, die eine 5'-NAG- 3'-PAM-Sequenz an ihrem 3'-Ende umfasst.
Es sei darauf hingewiesen, dass jede der hierin beschriebenen Aminosäuremutationen (z. B. A262T) von einem ersten Aminosäurerest (z. B. A) zu einem zweiten Aminosäurerest (z. B. T) auch Mutationen vom ersten Aminosäurerest zu einem Aminosäurerest beinhalten kann, der dem zweiten Aminosäurerest ähnlich (z. B. konserviert) ist. Zum Beispiel kann die Mutation einer Aminosäure mit einer hydrophoben Seitenkette (z. B. Alanin, Valin, Isoleucin, Leucin, Methionin, Phenylalanin, Tyrosin oder Tryptophan) eine Mutation zu einer zweiten Aminosäure mit einer anderen hydrophoben Seitenkette (z. B. Alanin, Valin, Isoleucin, Leucin, Methionin, Phenylalanin, Tyrosin oder Tryptophan) sein. Zum Beispiel kann eine Mutation von einem Alanin zu einem Threonin (z. B. eine A262T-Mutation) auch eine Mutation von einem Alanin zu einer Aminosäure sein, die in Größe und chemischen Eigenschaften einem Threonin ähnlich ist, z. B. Serin. Zum Beispiel kann die Mutation einer Aminosäure mit einer positiv geladenen Seitenkette (z. B. Arginin, Histidin oder Lysin) eine Mutation zu einer zweiten Aminosäure mit einer anderen positiv geladenen Seitenkette (z. B. Arginin, Histidin oder Lysin) sein. In einem anderen Beispiel kann die Mutation einer Aminosäure mit einer polaren Seitenkette (z. B. Serin, Threonin, Asparagin oder Glutamin) eine Mutation zu einer zweiten Aminosäure mit einer anderen polaren Seitenkette (z. B. Serin, Threonin, Asparagin oder Glutamin) sein. Weitere ähnliche Aminosäurepaare beinhalten unter anderem die folgenden: Phenylalanin und Tyrosin, Asparagin und Glutamin, Methionin und Cystein, Asparaginsäure und Glutaminsäure sowie Arginin und Lysin. Der erfahrene Fachmann wird erkennen, dass solche konservativen Aminosäure-Substitutionen wahrscheinlich nur geringe Auswirkungen auf die Proteinstruktur haben und wahrscheinlich gut toleriert werden, ohne die Funktion zu beeinträchtigen. In einigen Ausführungsformen kann jede Aminosäure der hierin bereitgestellten Aminosäuremutationen von einer Aminosäure zu einem Threonin eine Aminosäuremutation zu einem Serin sein. In einigen Ausführungsformen kann jede Aminosäure der hierin bereitgestellten Aminosäuremutationen von einer Aminosäure zu einem Arginin eine Aminosäuremutation zu einem Lysin sein. In einigen Ausführungsformen kann jede Aminosäure der hierin bereitgestellten Aminosäuremutationen von einer Aminosäure zu einem Isoleucin eine Aminosäuremutation zu einem Alanin, Valin, Methionin oder Leucin sein. In einigen Ausführungsformen kann jede Aminosäure der hierin bereitgestellten Aminosäuremutationen von einer Aminosäure zu einem Lysin eine Aminosäuremutation zu einem Arginin sein. In einigen Ausführungsformen kann jede Aminosäure der hierin bereitgestellten Aminosäuremutationen von einer Aminosäure zu einer Asparaginsäure eine Aminosäuremutation zu einer Glutaminsäure oder einem Asparagin sein. In einigen Ausführungsformen kann jede Aminosäure der hierin bereitgestellten Aminosäuremutationen von einer Aminosäure zu einem Valin eine Aminosäuremutation zu einem Alanin, Isoleucin, Methionin oder Leucin sein. In einigen Ausführungsformen kann jede der hierin bereitgestellten Aminosäuremutationen von einer Aminosäure zu einem Glycin eine Aminosäuremutation zu einem Alanin sein. Es sollte jedoch gewürdigt werden, dass zusätzliche konservierte Aminosäurereste vom Fachmann erkannt werden und jede der Aminosäuremutationen zu anderen konservierten Aminosäureresten ebenfalls in den Umfang dieser Offenbarung fällt.

In einigen Ausführungsformen umfasst das Cas9-Protein eine Kombination von Mutationen, die Aktivität auf einer Zielsequenz aufweisen, die an ihrem 3'-Ende eine 5'-NAA- 3'-PAM-Sequenz umfasst. In einigen Ausführungsformen ist die Kombination von Mutationen in einem der in Tabelle 1 aufgeführten Klone vorhanden. In einigen Ausführungsformen sind die Mutationskombinationen konservative Mutationen der in Tabelle 1 aufgeführten Klone. In einigen Ausführungsformen umfasst das Cas9-Protein die Kombination von Mutationen eines der in Tabelle 1 aufgeführten Cas9-Klone. Tabelle 1: NAA-PAM-Klone

Mutationen von Wildtyp-SpCas9 (z. B. SEQ-ID-Nr: 18)
D177N, K218R, D614N, D1135N, P1137S, E1219V, A1320V, A1323D, R1333K
D177N, K218R, D614N, D1135N, E1219V, Q1221H, H1264Y, A1320V, R1333K
A10T, I322V, S409I, E427G, G715C, D1135N, E1219V, Q1221H, H1264Y, A1320V, R1333K
A367T, K710E, R1114G, D1135N, P1137S, E1219V, Q1221H, H1264Y, A1320V, R1333K
A10T, I322V, S409I, E427G, R753G, D861N, D1135N, K1188R, E1219V, Q1221H, H1264H, A1320V, R1333K
A10T, I322V, S409I, E427G, R654L, V7431, R753G, M1021T, D1135N, D1180G, K1211R, E1219V, Q1221H, H1264Y, A1320V, R1333K
A10T, I322V, S409I, E427G, V7431, R753G, E762G, D1135N, D1180G, K1211R, E1219V, Q1221H, H1264Y, A1320V, R1333K
A10T, I322V, S409I, E427G, R753G, D1135N, D1180G, K1211R, E1219V, Q1221H, H1264Y, S1274R, A1320V, R1333K
A10T, I322V, S409I, E427G, A589S, R753G, D1135N, E1219V, Q1221H, H1264H, A1320V, R1333K
A10T, I322V, S409I, E427G, R753G, E757K, G865G, D1135N, E1219V, Q1221H, H1264Y, A1320V, R1333K
A10T, I322V, S4091, E427G, R654L, R753G, E757K, D1135N, E1219V, Q1221H, H1264Y, A1320V, R1333K
A10T, I322V, S409I, E427G, K599R, M631A, R654L, K673E, V743I, R753G, N758H, E762G, D1135N, D1180G, E1219V, Q1221H, Q1256R, H1264Y, A1320V, A1323D, R1333K
A10T, I322V, S409I, E427G, R654L, K673E, V743I, R753G, E762G, N869S, Γ11054D, R1114G, D1135N, D1180G, E1219V, Q1221H, H1264Y, A1320V, A1323D, R1333K
A10T, I322V, S409I, E427G, R654L, L727I, V743I, R753G, E762G, R859S, N946D, F1134L, D1135N, D1180G, E1219V, Q1221H, H1264Y, N1317T, A1320V, A1323D, R1333K
A10T, I322V, S4091, E427G, R654L, K673E, V743I. R753G, E762G, N803S, N869S, Y1016D, G1077D, R1114G, F1134L, D1135N, D1180G, E1219V, Q1221H, H1264Y, V1290G, L1318S, A1320V, A1323D, R1333K
A10T, I322V, S409I, E427G, R654L, K673E, V7431, R753G, E762G, N803S, N869S, Y1016D, G1077D, R1114G, F1134L, D1135N, K1151E, D1180G, E1219V, Q1221H, H1264Y, V1290G, L1318S, A1320V, R1333K
A10T, I322V, S409I, E427G, R654L, K673E, V7431, R753G, E762G, N803S, N869S, Y1016D, G1077D, R1114G, F1134L, D1135N, D1180G, E1219V, Q1221H, H1264Y, V1290G, L1318S, A1320V, A1323D, R1333K
A10T, 1322V, S409I, E427G, R654L, K673E, F693L, V743I, R753G, E762G, N803S, N869S, L921P, Y1016D, G1077D, F1080S, R1114G, D1135N, D1180G, E1219V, Q1221H, H1264Y, L1318S, A1320V, A1323D, R1333K
A10T, I322V, S409I, E427G, E630K, R654L, K673E, V743I, R753G, E762G, Q768H, N803S, N869S, Y1016D, G1077D, R1114G, F1134L, D1135N, D1180G, E1219V, Q1221H, H1264Y, L1318S, A1320V, R1333K
A10T, I322V, S409I, E427G, R654L, K673E, F693L, V743I, R753G, E762G, Q768H, N803S, N869S, Y1016D, G1077D, R1114G, F1134L, D1135N, D1180G, E1219V, Q1221H, G1223S, H1264Y, L1318S, A1320V, R1333K
A10T, 1322V, S409I, E427G, R654L, K673E, F693L, V7431, R753G, E762G, N803S, N869S, L921P, Y1016D, G1077D, F1801S, R11 14G, D1135N, D1180G, E1219V, Q1221H, H1264Y, L1318S, A1320V, A1323D, R1333K
A10T, I322V, S409I, E427G, R654L, V7431, R753G, M1021T, D1135N, D1180G, K1211R, E1219V, Q1221H, H1264Y, A1320V, R1333K
A10T, 1322V, S409I, E427G, R654L, K673E, V7431, R753G, E762G, M6731, N803S, N869S, G1077D, R1114G, D1135N, V1139A, D1180G, E1219V, Q1221H, A1320V, R1333K
A10T, I322V, S4091, E427G, R654L, K673E, V7431, R753G, E762G, N803S, N869S, R1114G, D1135N, E1219V, Q1221H, A1320V, R1333K

In einigen Ausführungsformen umfasst das Cas9-Protein eine Aminosäuresequenz, die zu mindestens 80 % identisch mit der Aminosäuresequenz eines Cas9-Proteins ist, wie es von einer der Varianten von Tabelle 1 bereitgestellt wird. In einigen Ausführungsformen umfasst das Cas9-Protein eine Aminosäuresequenz, die mindestens 85 %, mindestens 90 %, mindestens 92 %, mindestens 95 %, mindestens 96 %, mindestens 97 %, mindestens 98 %, mindestens 99 % oder mindestens 99,5 % identisch mit der Aminosäuresequenz eines Cas9- Proteins ist, wie es von einer der Varianten von Tabelle 1 bereitgestellt wird.

In einigen Ausführungsformen weist das Cas9-Protein eine erhöhte Aktivität auf einer Zielsequenz auf, die das kanonische PAM (5'-NGG-3') an seinem 3'-Ende nicht umfasst, im Vergleich zu Streptococcus pyogenes Cas9 gemäß SEQ-ID-Nr: 18. In einigen Ausführungsformen weist das Cas9-Protein eine Aktivität auf einer Zielsequenz mit einem 3'- Ende auf, das nicht direkt an die kanonische PAM-Sequenz (5'-NGG-3') angrenzt, die mindestens 5-fach erhöht ist im Vergleich zur Aktivität von Streptococcus pyogenes Cas9 gemäß SEQ-ID-Nr: 18 auf derselben Zielsequenz. In einigen Ausführungsformen weist das Cas9-Protein eine Aktivität auf einer Zielsequenz auf, die nicht direkt an die kanonische PAM- Sequenz (5'-NGG-3') angrenzt, die mindestens 10-fach, mindestens 50-fach, mindestens 100- fach, mindestens 500-fach, mindestens 1.000-fach, mindestens 5.000-fach, mindestens 10.000- fach, mindestens 50.000-fach, mindestens 100.000-fach, mindestens 500.000-fach oder mindestens 1.000.000-fach erhöht ist im Vergleich zur Aktivität von Streptococcus pyogenes gemäß SEQ-ID-Nr: 18 auf derselben Zielsequenz. In einigen Ausführungsformen grenzt das 3'-Ende der Zielsequenz direkt an eine AAA-, GAA-, CAA- oder TAA-Sequenz an. In einigen Ausführungsformen umfasst das Cas9-Protein eine Kombination von Mutationen, die Aktivität auf einer Zielsequenz aufweisen, die an ihrem 3'-Ende eine 5'-NAC-3'-PAM-Sequenz umfasst. In einigen Ausführungsformen ist die Kombination von Mutationen in einem der in Tabelle 2 aufgeführten Klone vorhanden. In einigen Ausführungsformen sind die Mutationskombinationen konservative Mutationen der in Tabelle 2 aufgeführten Klone. In einigen Ausführungsformen umfasst das Cas9-Protein die Kombination von Mutationen eines der in Tabelle 2 aufgeführten Cas9-Klone. Tabelle 2: NAC-PAM-Klone

MUTATIONEN VON WILDTYP-SPCAS9 (Z. B. SEQ-ID-NR: 18)
T472I, R753G, K890E, D1332N, R1335Q, T1337N
I1057S, D1135N, P1301S, R1335Q, T1337N
T472I, R753G, D1332N, R1335Q, T1337N
D1135N, E1219V, D1332N, R1335Q, T1337N
T472I, R753G, K890E, D1332N, R1335Q, T1337N
I1057S, D1135N, P1301S, R1335Q, T1337N
T472I, R753G, D1332N, R1335Q, T1337N
T472I, R753G, Q771H,D1332N,R1335Q, T1337N
E627K, T638P, K652T, R753G, N803S, K959N, R1114G, D1135N, E1219V, D1332N, R1335Q, T1337N
E627K, T638P, K652T, R753G, N803S, K959N, R1114G, D1135N, K1156E, E1219V, D1332N, R1335Q, T1337N
E627K, T638P, V647I, R753G, N803S, K959N, G1030R, I1055E, R1114G, D1135N, E1219V, D1332N, R1335Q, T1337N
E627K, E630G, T638P, V647A, G687R, N767D, N803S, K959N, R1114G, D1135N, E1219V, D1332G, R1335Q, T1337N
E627K, T638P, R753G, N803S, K959N, R1114G, D1135N, E1219V, N1266H, D1332N, R1335Q, T1337N
E627K, T638P, R753G, N803S, K959N, I1057T, R1114G, D1135N, E1219V, D1332N, R1335Q, T1337N
E627K, T638P, R753G, N803S, K959N, R1114G, D1135N, E1219V, D1332N, R1335Q, T1337N
E627K, M631I, T638P, R753G, N803S, K959N, Y1036H, R1114G, D1135N, E1219V, D1251G, D1332G, R1335Q, T1337N
E627K, T638P, R753G, N803S, V875I, K959N, Y1016C, R1114G, D1135N, E1219V, D1251G, D1332G, R1335Q, T1337N, I1348V
K608R, E627K, T638P, V647I, R654L, R753G, N803S, T804A, K848N, V922A, K959N, R1114G, D1135N, E1219V, D1332N, R1335Q, T1337N
K608R, E627K, T638P, V647I, R753G, N803S, V922A, K959N, K1014N, V1015A, R1114G, D1135N, K1156N, E1219V, N1252D, D1332N, R1335Q, T1337N
K608R, E627K, R629G, T638P, V647I, A711T, R753G, K775R, K789E, N803S, K959N, V1015A, Y1036H, R1114G, D1135N, E1219V, N1286H, D1332N, R1335Q, T1337N
K608R, E627K, T638P, V647I, T740A, R753G, N803S, K948E, K959N, Y1016S, R1114G, D1135N, E1219V, N1286H, D1332N,R1335Q, T1337N
K608R, E627K, T638P, V647I, T740A, N803S, K948E, K959N, Y1016S, R1114G, D1135N, E1219V, N1286H, D1332N, R1335Q, T1337N
I670S, K608R, E627K, E630G, T638P, V647I, R653K, R753G, I795L, K797N, N803S, K866R, K890N, K959N, Y1016C, R1114G, D1135N, E1219V, D1332N, R1335Q, T1337N
K608R, E627K, T638P, V647I, T740A, G752R, R753G, K797N, N803S, K948E, K959N, V1015A, Y1016S, R1114G, D1135N, E1219V, N1266H, D1332N, R1335Q, T1337N
I570T, A589V, K608R, E627K, T638P, V647I, R654L, Q716R, R753G, N803S, K948E, K959N, Y1016S, R1114G, D1135N, E1207G, E1219V, N1234D, D1332N, R1335Q, T1337N
K608R, E627K, R629G, T638P, V647I, R654L, Q740R, R753G, N803S, K959N, N990S, T995S, V1015A, Y1036D, R1114G, D1135N, E1207G, E1219V, N1234D, N1266H, D1332N, R1335Q, T1337N
I562F, V565D, I570T, K608R, L625S, E627K, T638P, V647I, R654I, G752R, R753G, N803S, N808D, K959N, M1021L, R1114G, D1135N, N1177S, N1234D, D1332N, R1335Q, T1337N
I562F, I570T, K608R, E627K, T638P, V647I, R753G, E790A, N803S, K959N, V1015A, Y1036H, R1114G, D1135N, D1180E, A1184T, E1219V, D1332N, R1335Q, T1337N
1570T, K608R, E627K, T638P, V6471, R654H, R753G, E790A, N803S, K959N, V1015A, R1114G, D1127A, D1135N, E1219V, D1332N, R1335Q, T1337N
1570T, K608R, L625S, E627K, T638P, V647I, R654I, T703P, R753G, N803S, N808D, K959N, M1021L, R1114G, D1135N, E1219V, D1332N, R1335Q, T1337N
1570S, K608R, E627K, E630G, T638P, V647I, R653K, R753G, 1795L, N803S, K866R, K890N, K959N, Y1016C, R1114G, D1135N, E1219V, D1332N, R1335Q, T1337N
1570T, K608R, E627K, T638P, V647I, R654H, R753G, E790A, N803S, K959N, V1016A, R1114G, D1135N, E1219V, K1246E, D1332N, R1335Q, T1337N
K608R, E627K, T638P, V647I, R654L, K673E, R753G, E790A, N803S, K948E, K959N, R1114G, D1127G, D1135N, D1180E, E1219V, N1286H, D1332N,R1335Q, T1337N
K608R, L625S, E627K, T638P, V647I, R654I, I670T, R753G, N803S, N808D, K959N, M1021L, R1114G,D1135N, E1219V, N1286H, D1332N,R1335Q, T1337N
E627K, M631V,T638P, V6471, K710E, R753G, N803S, N808D, K948E, M1021L, R1114G, D1135N, E1219V, D1332N, R1335Q, T1337N, S1338T, H1349R

In einigen Ausführungsformen umfasst das Cas9-Protein eine Aminosäuresequenz, die zu mindestens 80 % identisch mit der Aminosäuresequenz eines Cas9-Proteins ist, wie es von einer der Varianten von Tabelle 2 bereitgestellt wird. In einigen Ausführungsformen umfasst das Cas9-Protein eine Aminosäuresequenz, die mindestens 85 %, mindestens 90 %, mindestens 92 %, mindestens 95 %, mindestens 96 %, mindestens 97 %, mindestens 98 %, mindestens 99 % oder mindestens 99,5 % identisch mit der Aminosäuresequenz eines Cas9- Proteins ist, wie es von einer der Varianten von Tabelle 2 bereitgestellt wird.
In einigen Ausführungsformen weist das Cas9-Protein eine erhöhte Aktivität auf einer Zielsequenz auf, die das kanonische PAM (5'-NGG-3') an seinem 3'-Ende nicht umfasst, im Vergleich zu Streptococcus pyogenes Cas9 gemäß SEQ-ID-Nr: 18. In einigen Ausführungsformen weist das Cas9-Protein eine Aktivität auf einer Zielsequenz mit einem 3'- Ende auf, das nicht direkt an die kanonische PAM-Sequenz (5'-NGG-3') angrenzt, die mindestens 5-fach erhöht ist im Vergleich zur Aktivität von Streptococcus pyogenes Cas9 gemäß SEQ-ID-Nr: 18 auf derselben Zielsequenz. In einigen Ausführungsformen weist das Cas9-Protein eine Aktivität auf einer Zielsequenz auf, die nicht direkt an die kanonische PAM- Sequenz (5'-NGG-3') angrenzt, die mindestens 10-fach, mindestens 50-fach, mindestens 100- fach, mindestens 500-fach, mindestens 1.000-fach, mindestens 5.000-fach, mindestens 10.000- fach, mindestens 50.000-fach, mindestens 100.000-fach, mindestens 500.000-fach oder mindestens 1.000.000-fach erhöht ist im Vergleich zur Aktivität von Streptococcus pyogenes gemäß SEQ-ID-Nr: 18 auf derselben Zielsequenz. In einigen Ausführungsformen grenzt das 3'-Ende der Zielsequenz direkt an eine AAC-, GAC-, CAC- oder TAC-Sequenz an.

In einigen Ausführungsformen umfasst das Cas9-Protein eine Kombination von Mutationen, die Aktivität auf einer Zielsequenz aufweisen, die an ihrem 3'-Ende eine 5'-NAT- 3'-PAM-Sequenz umfasst. In einigen Ausführungsformen ist die Kombination von Mutationen in einem der in Tabelle 3 aufgeführten Klone vorhanden. In einigen Ausführungsformen sind die Mutationskombinationen konservative Mutationen der in Tabelle 3 aufgeführten Klone. In einigen Ausführungsformen umfasst das Cas9-Protein die Kombination von Mutationen eines der in Tabelle 3 aufgeführten Cas9-Klone. Tabelle 3: NAT PAM-Klone

MUTATIONEN VON WILDTYP-SPCAS9 (Z. B. SEQ-ID-NR: 18)
K961E, H985Y, D1135N, K1191N, E1219V, Q1221H, A1320A, P1321S, R1335L
D1135N, G1218S, E1219V, Q1221H, P1249S, P1321S, D1322G, R1335L
V7431, R753G, E790A, D1135N, G1218S, E1219V, Q1221H, A1227V, P1249S, N1286K, A1293T, P1321S, D1322G, R1335L, T1339I
F575S, M631L, R654L, V748I, V743I, R753G, D853E, V922A, R1114G D1135N, G1218S, E1219V, Q1221H, A1227V, P1249S, N1286K, A1293T, P1321S, D1322G, R1335L, T1339I
F575S, M631L, R654L, R664K, R753G, D853E, V922A, R1114G D1135N, D1180G, G1218S, E1219V, Q1221H, P1249S, N1286K, P1321S, D1322G, R1335L
M631L, R654L, R753G, K797E, D853E, V922A, D1012A, R1114G D1135N, G1218S, E1219V, Q1221H, P1249S, N1317K, P1321S, D1322G, R1335L
F575S, M631L, R654L, R664K, R753G, D853E, V922A, R1114G, Y1131C, D1135N, D1180G, G1218S, E1219V, Q1221H, P1249S, P1321S, D1322G, R1335L
F575S, M631L, R654L, R664K, R753G, D853E, V922A, R1114G, Y1131C, D1135N, D1180G, G1218S, E1219V, Q1221H, P1249S, P1321S, D1322G, R1335L
F575S, D596Y, M631L, R654L, R664K, R753G, D853E, V922A, R1114G, Y1131C, D1135N, D1180G, G1218S, E1219V, Q1221H, P1249S, Q1256R, P1321S, D1322G, R1335L
F575S, M631L, R654L, R664K, K710E, V750A, R753G, D853E, V922A, R1114G, Y1131C, D1135N, D1180G, G1218S, E1219V, Q1221H, P1249S, P1321S, D1322G, R1335L
F575S, M631L, K649R, R654L, R664K, R753G, D853E, V922A, R1114G, Y1131C, D1135N, K1156E, D1180G, G1218S, E1219V, Q1221H, P1249S, P1321S, D1322G, R1335L
F575S, M631L, R654L, R664K, R753G, D853E, V922A, R1114G, Y1131C, D1135N, D1180G, G1218S, E1219V, Q1221H, P1249S, P1321S, D1322G, R1335L
F575S, M631L, R654L, R664K, R753G, D853E, V922A, I1057G, R1114G, Y1131C, D1135N, D1180G, G1218S, E1219V, Q1221H, P1249S, N1308D, P1321S, D1322G, R1335L
M631L, R654L, R753G, D853E, V922A, R1114G, Y1131C, D1135N, E1150V, D1180G, G1218S, E1219V, Q1221H, P1249S, P1321S, D1332G, R1335L
M631L, R654L, R664K, R753G, D853E, I1057V, Y1131C, D1135N, D1180G, G1218S, E1219V, Q1221H, P1249S, P1321S, D1332G, R1335L
M631L, R654L, R664K, R753G, I1057V, R1114G, Y1131C, D1135N, D1180G, G1218S, E1219V, Q1221H, P1249S, P1321S, D1332G, R1335L

Die obige Beschreibung verschiedener napDNAbps, die in Verbindung mit den derzeit offenbaren Multi-Flap-Prime-Editoren verwendet werden können, soll in keiner Weise einschränkend sein. Die Multi-Flap-Prime-Editoren können das kanonische SpCas9 oder ein beliebiges orthologes Cas9-Protein oder eine beliebige Variante des Cas9-Proteins umfassen - einschließlich einer natürlich vorkommenden Variante, Mutante oder anderweitig manipulierten Version von Cas9, die bekannt ist oder die durch einen gerichteten evolutionären oder anderweitig mutagenen Prozess hergestellt oder entwickelt werden kann. In verschiedenen Ausführungsformen haben die Cas9 oder Cas9-Varianten eine Nickase-Aktivität, d. h., sie spalten nur einen Strang der Ziel-DNA-Sequenz. In anderen Ausführungsformen haben die Cas9 oder Cas9-Varianten inaktive Nukleasen, d. h. sie sind „tote“ Cas9-Proteine. Andere Cas9-Varianten, die verwendet werden können, haben ein geringeres Molekulargewicht als das kanonische SpCas9 (z. B. zur leichteren Einschleusung) oder haben eine modifizierte oder umstrukturierte primäre Aminosäurestruktur (z. B. die zirkulären Permutantenformate). Die hierin beschriebenen Multi-Flap-Prime-Editoren können auch Cas9-Äquivalente umfassen, die Cas12a1Cpf1- und Cas12b-Proteine beinhalten, die das Ergebnis einer konvergenten Evolution sind. Die hierin verwendeten napDNAbps (z. B. SpCas9, Cas9-Variante oder Cas9- Äquivalente) können auch verschiedene Modifikationen enthalten, die ihre PAM-Spezifitäten verändern/erhöhen. Schließlich kommt für die Anwendung jedes Cas9, jede Cas9-Variante oder jedes Cas9-Äquivalent in Betracht, das mindestens 70 %, mindestens 75 %, mindestens 80 %, mindestens 85 %, mindestens 90 %, mindestens 91 %, mindestens 92 %, mindestens 93 %, mindestens 94 %, mindestens 95 %, mindestens 96 %, mindestens 97 %, mindestens 98 %, mindestens 99 % oder mindestens 99,9 % Sequenzidentität mit einer Referenz-Cas9- Sequenz, wie etwa einer kanonischen SpCas9-Referenzsequenz oder einem Referenz-Cas9- Äquivalent (z. B. Cas12a/Cpfl) aufweist.
In einer besonderen Ausführungsform ist die Cas9-Variante mit erweiterten PAM- Fähigkeiten SpCas9 (H840A) VRQR (SEQ-ID-NR: 87), die die folgende Aminosäuresequenz aufweist (wobei die Substitutionen V, R, Q, R im Vergleich zu SpCas9 (H840A) von SEQ-ID- NR: 51 in fetter Unterstreichung gezeigt sind. Außerdem wurde der Methionin-Rest in SpCas9 (H840) für SpCas9 (H840A) VRQR entfernt):
In einer anderen besonderen Ausführungsform ist die Cas9-Variante mit erweiterten PAM-Fähigkeiten SpCas9 (H840A) VRER, die die folgende Aminosäuresequenz aufweist (wobei die Substitutionen V, R, E, R im Vergleich zu SpCas9 (H840A) von SEQ-ID-NR: 51 in fetter Unterstreichung gezeigt sind. Außerdem wurde der Methionin-Rest in SpCas9 (H840) für SpCas9 (H840A) VRER entfernt):
In einigen Ausführungsformen ist das napDNAbp, das mit einer nicht-kanonischen PAM-Sequenz funktioniert, ein Argonautenprotein. Ein Beispiel für ein solches nukleinsäureprogrammierbares DNA-Bindungsprotein ist ein Argonautenprotein aus Natronobacterium gregoryi (NgAgo). NgAgo ist eine ssDNA-gesteuerte Endonuklease. NgAgo bindet 5'-phosphorylierte ssDNA von ~24 Nukleotiden (gDNA), um sie zu ihrem Zielort zu leiten, und führt DNA-Doppelstrangbrüche an der gDNA-Stelle durch. Im Gegensatz zu Cas9 benötigt das NgAgo-gDNA-System kein Protospacer-Adjacent-Motiv (PAM). Die Verwendung eines nuklease-inaktiven NgAgo (dNgAgo) kann die Zahl der Basen, die angegriffen werden können, erheblich erweitern. Die Charakterisierung und Verwendung von NgAgo wurde in Gao et al., Nat Biotechnol, Jul 2016; 34(7):768-73. PubMed PMID: 27136078; Swarts et al., Nature. 507(7491) (2014):258-61; und Swarts et al., Nucleic Acids Res. 43(10)(2015):5120-9 beschrieben, die hierin jeweils durch Bezugnahme aufgenommen sind.
In einigen Ausführungsformen ist das napDNAbp ein prokaryotisches Homolog eines Argonautenproteins. Prokaryotische Homologe von Argonautenproteinen sind bekannt und wurden zum Beispiel in Makarova K., et al. „Prokaryotic homologs of Argonaute proteins are predicted to function as key components of a novel system of defense against mobile genetic elements“, Biol Direct. 25. Aug. 2009; 4:29. doi: 10.1186/1745-6150-4-29 beschrieben, dessen gesamter Inhalt hiermit durch Bezugnahme aufgenommen wird. In einigen Ausführungsformen ist das napDNAbp ein Marinitoga-piezophila-Argunauten(MpAgo)- Protein. Das CRISPR-assoziierte Marinitoga-piezophila-Argunauten(MpAgo)-Protein spaltet einzelsträngige Zielsequenzen unter Verwendung von 5'-phosphorylierten Guides. Die 5'- Guides werden von allen bekannten Argonauten verwendet. Die Kristallstruktur eines MpAgo- RNA-Komplexes zeigt eine Leitstrang-Bindungsstelle, die Reste umfasst, die 5'-Phosphat- Interaktionen blockieren. Diese Daten deuten auf die Entwicklung einer Argonauten- Unterklasse mit nicht-kanonischer Spezifität für einen 5'-hydroxylierten Guide hin. Siehe z. B. Kaya et al., „A bacterial Argonaute with noncanonical guide RNA specificity“, Proc Natl Acad Sei USA. 12. Apr 2016; 113(15):4057-62, dessen gesamter Inhalt hiermit durch Bezugnahme aufgenommen wird). Es sollte gewürdigt werden, dass andere Argonautenproteine verwendet werden können und in den Umfang dieser Offenbarung fallen.
Einige Aspekte der Offenbarung stellen Cas9-Domänen bereit, die unterschiedliche PAM-Spezifitäten aufweisen. Normalerweise benötigen Cas9-Proteine, wie etwa Cas9 aus S. pyogenes (spCas9), eine kanonische NGG-PAM-Sequenz, um eine bestimmte Nukleinsäure- Region zu binden. Dies kann die Fähigkeit einschränken, gewünschte Basen innerhalb eines Genoms zu verändern. In einigen Ausführungsformen müssen die hierin bereitgestellten baseneditierenden Fusionsproteine möglicherweise an einer präzisen Stelle platziert werden, z. B. dort, wo sich eine Zielbase innerhalb einer 4-Basen-Region (z. B. einem „Editing- Fenster“) befindet, die etwa 15 Basen stromaufwärts von der PAM liegt. Siehe Komor, A.C., et al. „Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage“ Nature 533, 420-424 (2016), dessen gesamter Inhalt hiermit durch Bezugnahme aufgenommen wird. Dementsprechend kann in einigen Ausführungsformen jedes der hierin bereitgestellten Fusionsproteine eine Cas9-Domäne enthalten, die in der Lage ist, eine Nukleotidsequenz zu binden, die keine kanonische (z. B. NGG) PAM-Sequenz enthält. Cas9- Domänen, die an nicht-kanonische PAM-Sequenzen binden, sind in der Fachliteratur beschrieben worden und für den Fachmann offensichtlich. Zum Beispiel wurden Cas9- Domänen, die an nicht-kanonische PAM-Sequenzen binden, in Kleinstiver, B. P., et al., „Engineered CRISPR-Cas9 nucleases with altered PAM specificities“ Nature 523, 481-485 (2015); und Kleinstiver, B. P., et al. „Broadening the targeting range of Staphylococcus aureus CRISPR-Cas9 by modifying PAM recognition“ Nature Biotechnology 33, 1293-1298 (2015) beschrieben; der gesamte Inhalt jedes Dokuments wird hiermit durch Bezugnahme aufgenommen.
Zum Beispiel eine napDNAbp-Domäne mit veränderter PAM-Spezifität, wie etwa eine Domäne mit mindestens 80 %, mindestens 85 %, mindestens 90 %, mindestens 95 % oder mindestens 99 % Sequenzidentität mit dem Wildtyp Francisella novicida Cpfl (D917, E1006 und D1255) (SEQ-ID-NR: 74), die die folgende Aminosäuresequenz aufweist:
Eine zusätzliche napDNAbp-Domäne mit veränderter PAM-Spezifität, wie etwa eine Domäne mit mindestens 80 %, mindestens 85 %, mindestens 90 %, mindestens 95 % oder mindestens 99 % Sequenzidentität mit dem Wildtyp Geobacillus thermodenitrificans Cas9 (SEQ-ID-NR: 75), die die folgende Aminosäuresequenz aufweist:
In einigen Ausführungsformen ist das nukleinsäureprogrammierbare DNA- Bindungsprotein (napDNAbp) ein nukleinsäureprogrammierbares DNA-Bindungsprotein, das keine kanonische (NGG) PAM-Sequenz benötigt. In einigen Ausführungsformen ist das napDNAbp ein Argonautenprotein. Ein Beispiel für ein solches nukleinsäureprogrammierbares DNA-Bindungsprotein ist ein Argonautenprotein aus Natronobacterium gregoryi (NgAgo). NgAgo ist eine ssDNA-gesteuerte Endonuklease. NgAgo bindet 5'-phosphorylierte ssDNA von ~24 Nukleotiden (gDNA), um sie zu ihrem Zielort zu leiten, und führt DNA- Doppelstrangbrüche an der gDNA-Stelle durch. Im Gegensatz zu Cas9 benötigt das NgAgo- gDNA-System kein Protospacer-Adjacent-Motiv (PAM). Die Verwendung eines nuklease- inaktiven NgAgo (dNgAgo) kann die Zahl der Basen, die angegriffen werden können, erheblich erweitern. Die Charakterisierung und Verwendung von NgAgo wurde in Gao et al. Nat Biotechnol, 34(7): 768-73 (2016), PubMed PMID: 27136078; Swarts et al., Nature, 507(7491): 258-61 (2014); und Swarts et al., Nucleic Acids Res. 43(10) (2015): 5120-9 beschrieben, die hierin jeweils durch Bezugnahme aufgenommen sind. Die Sequenz des Natronobacterium-gregoryi-Argonauten ist in SEQ-ID-NR: 76 bereitgestellt.
Die offenbarten Fusionsproteine können eine napDNAbp-Domäne umfassen, die mindestens 80 %, mindestens 85 %, mindestens 90 %, mindestens 95 % oder mindestens 99 % Sequenzidentität mit dem Wildtyp Natronobacterium-gregoryi-Argonauten (SEQ-ID-NR: 76) aufweist, die die folgende Aminosäuresequenz aufweist:
Darüber hinaus können alle verfügbaren Verfahren verwendet werden, um eine Variante oder ein mutiertes Cas9-Protein zu erhalten oder zu konstruieren. Der Begriff „Mutation“, wie er hierin verwendet wird, bezieht sich auf die Substitution eines Restes innerhalb einer Sequenz, z. B. einer Nukleinsäure- oder Aminosäuresequenz, durch einen anderen Rest oder eine Deletion oder Insertion eines oder mehrerer Reste innerhalb einer Sequenz. Mutationen werden hierin in der Regel durch Angabe des ursprünglichen Restes, gefolgt von der Position des Restes innerhalb der Sequenz und der Identität des neu substituierten Restes beschrieben. Verschiedene Verfahren zur Durchführung der hierin bereitgestellten Aminosäuresubstitutionen (Mutationen) sind in der Fachwelt wohlbekannt und werden zum Beispiel von Green und Sambrook, Molecular Cloning: A Laboratory Manual (4. Aufl., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (2012)) bereitgestellt. Mutationen können eine Vielzahl von Kategorien beinhalten, wie etwa Einzelbasen- Polymorphismen, Mikroduplikationsregionen, Indel und Inversionen, und sind in keiner Weise als einschränkend zu verstehen. Mutationen können „loss-of-function“-Mutationen beinhalten, die das normale Ergebnis einer Mutation sind, die eine Proteinaktivität reduziert oder aufhebt. Die meisten „loss-of-function“-Mutationen sind rezessiv, da bei einem Heterozygoten die zweite Chromosomenkopie eine nicht mutierte Version des Gens trägt, die für ein voll funktionsfähiges Protein kodiert, dessen Vorhandensein die Wirkung der Mutation ausgleicht. Mutationen umfassen auch „gain-of-function“-Mutationen, d. h. Mutationen, die einem Protein oder einer Zelle eine abnorme Aktivität verleihen, die im Normalzustand nicht vorhanden ist. Viele gain-of-function-Mutationen befinden sich in regulatorischen Sequenzen und nicht in kodierenden Regionen und können daher eine Reihe von Konsequenzen haben. Zum Beispiel kann eine Mutation dazu führen, dass ein oder mehrere Gene in den falschen Geweben exprimiert werden und diese Gewebe Funktionen erhalten, die ihnen normalerweise fehlen. Aufgrund ihrer Natur sind gain-of-function-Mutationen in der Regel dominant.
Mutationen können durch ortsgerichtete Mutagenese in ein Cas9-Referenzprotein eingeführt werden. Ältere Verfahren der im Fach bekannten ortsgerichteten Mutagenese beruhen auf der Subklonierung der zu mutierenden Sequenz in einen Vektor, wie etwa einen M13-Bakteriophagenvektor, der die Isolierung eines einzelsträngigen DNA-Templats ermöglicht. Bei diesen Verfahren wird ein mutagener Primer (d. h. ein Primer, der in der Lage ist, an die zu mutierende Stelle zu binden, aber ein oder mehrere Nukleotide mit Diskrepanz an der zu mutierenden Stelle trägt) an das einzelsträngige Templat gebunden und dann das Komplement des Templats ausgehend vom 3'-Ende des mutagenen Primers polymerisiert. Die resultierenden Duplexe werden dann in Wirtsbakterien transformiert und die Plaques auf die gewünschte Mutation untersucht. In jüngerer Zeit werden bei der ortsgerichteten Mutagenese PCR-Verfahren eingesetzt, die den Vorteil haben, dass sie keine einzelsträngige Template benötigen. Darüber hinaus wurden Verfahren entwickelt, die keine Subklonierung erfordern. Beim Ausführen der PCR-basierten ortsgerichteten Mutagenese müssen mehrere Aspekte berücksichtigt werden. Erstens ist es bei diesen Verfahren wünschenswert, die Anzahl der PCR-Zyklen zu reduzieren, um die Ausbreitung unerwünschter, von der Polymerase eingeführter Mutationen zu verhindern. Zweitens muss eine Selektion durchgeführt werden, um die Anzahl der nicht mutierten Elternmoleküle zu reduzieren, die in der Reaktion verbleiben. Drittens wird ein verlängertes PCR-Verfahren bevorzugt, um die Verwendung eines einzigen PCR-Primersatzes zu ermöglichen. Und viertens ist es aufgrund der nicht- templat-abhängigen terminalen Verlängerungsaktivität einiger thermostabiler Polymerasen häufig erforderlich, vor der Ligation des durch PCR erzeugten Mutantenprodukts am stumpfen Ende einen Endpolierschritt in das Verfahren einzubauen.
Mutationen können auch durch gerichtete Evolutionsprozesse eingeführt werden, wie etwa die phagengestützte kontinuierliche Evolution (PACE) oder die phagengestützte nicht- kontinuierliche Evolution (PANCE). Der hierin verwendete Begriff „phagengestützte kontinuierliche Evolution (PACE)“ bezieht sich auf eine kontinuierliche Evolution, bei der Phagen als virale Vektoren eingesetzt werden. Das allgemeine Konzept der PACE-Technologie wurde beispielsweise beschrieben in der internationalen PCT-Anmeldung PCT/US2009/056194, eingereicht am 8. September 2009, veröffentlicht als WO 2010/028347 am 11. März 2010; der internationalen PCT-Anmeldung PCT/US2011/066747, eingereicht am 22. Dezember 2011, veröffentlicht als WO 2012/088381 am 28. Juni 2012; der US-Anmeldung US-Patent Nr. 9,023,594 , ausgestellt am 5. Mai 2015, der internationalen PCT-Anmeldung PCT/US2015/012022, eingereicht am 20. Januar 2015, veröffentlicht als WO 2015/134121 am 11. September 2015, und der internationalen PCT-Anmeldung PCT/US2016/027795, eingereicht am 15. April 2016, veröffentlicht als WO 2016/168631 am 20. Oktober 2016, deren gesamter Inhalt hierin durch Bezugnahme aufgenommen sind. Cas9-Varianten können auch durch „phagengestützte nicht-kontinuierliche Evolution (PANCE)“ erhalten werden, was sich hierin auf nicht-kontinuierliche Evolution bezieht, bei der Phagen als virale Vektoren eingesetzt werden. PANCE ist eine vereinfachte Technik für die schnelle gerichtete In-vivo- Evolution, bei der serielle Kolbenübertragungen von evolvierenden „Selektionsphagen“ (SP), die ein zu evolvierendes Gen von Interesse enthalten, über frische E. coli-Wirtszellen erfolgen, wodurch die Gene in den E. coli-Wirtszellen konstant gehalten werden können, während die in den SP enthaltenen Gene kontinuierlich evolvieren. Serielle Kolbenübertragungen sind seit langem ein weithin zugänglicher Ansatz für die Laborevolution von Mikroben, und in jüngerer Zeit wurden analoge Ansätze für die Bakteriophagenevolution entwickelt. Das PANCE- System weist eine geringere Stringenz als das PACE-System auf.
Alle oben genannten Referenzen, die sich auf Cas9 oder Cas9-Äquivalente beziehen, werden hiermit in ihrer Gesamtheit durch Bezugnahme aufgenommen, sofern dies nicht bereits angegeben ist.
J. Geteilte napDNAbp-Domänen für gesplittete PE-Einschleusung
In verschiedenen Ausführungsformen können die hierin beschriebenen Prime-Editoren in Form von zwei oder mehr Fragmenten, die innerhalb der Zelle (entweder durch passive Zusammensetzung oder durch aktive Zusammensetzung, wie etwa unter Verwendung von gesplitteten Intein-Sequenzen) zu einem rekonstituierten Prime-Editor zusammengesetzt werden, in Zellen eingeschleust werden. In einigen Fällen kann die Selbstzusammensetzung passiv sein, wobei sich die zwei oder mehr Fragmente des Prime-Editors innerhalb der Zelle kovalent oder nicht kovalent verbinden, um den Prime-Editor zu rekonstituieren. In anderen Fällen kann die Selbstzusammensetzung durch Dimerisierungsdomänen katalysiert werden, die auf jedem der Fragmente eingebaut sind. Beispiele für Dimerisierungsdomänen sind hierin beschrieben. In wieder anderen Fällen kann die Selbstzusammensetzung durch geteilte Intein- Sequenzen katalysiert werden, die auf jedem der Prime-Editor-Fragmente eingebaut sind.
Eine geteilte PE-Einschleusung kann vorteilhaft sein, um verschiedenen Größenbeschränkungen unterschiedlicher Einschleusungsansätze zu begegnen. Zum Beispiel können Einschleusungsansätze Verfahren auf der Basis von Viren, Boten-RNA oder RNP (Ribonukleoprotein) beinhalten. Jedes dieser Verfahren kann effizienter und/oder effektiver sein, wenn der Prime-Editor in kleinere Teile zerlegt wird. In der Zelle angekommen, können sich die kleineren Teile zu einem funktionsfähigen Prime-Editor zusammensetzen. Je nach Art des Splittings können sich die geteilten Prime-Editor-Fragmente auf nicht-kovalente oder kovalente Weise wieder zusammensetzen, um den Prime-Editor neu zu bilden. In einer Ausführungsform kann der Prime-Editor an einer oder mehreren Splitstellen in zwei oder mehr Fragmente gesplittet werden. Die Fragmente können unverändert bleiben (außer, dass sie gesplittet werden). Sobald die Fragmente in die Zelle eingeschleust sind (z. B. durch direkte Einschleusung eines Ribonukleoproteinkomplexes oder durch Einschleusung von Nukleinsubstanzen - z. B. mRNA oder durch einen Virusvektor), können sich die Fragmente kovalent oder nicht-kovalent reassoziieren, um den Prime-Editor wiederherzustellen. In einer anderen Ausführungsform kann der Prime-Editor an einer oder mehreren Splitstellen in zwei oder mehr Fragmente gesplittet werden. Jedes der Fragmente kann so modifiziert werden, dass es eine Dimerisierungsdomäne umfasst, wobei jedes entstehende Fragment an eine Dimerisierungsdomäne gekoppelt ist. Sobald die Dimerisierungsdomänen der verschiedenen Fragmente in eine Zelle eingeschleust oder dort exprimiert werden, assoziieren und binden sie sich aneinander, wodurch die verschiedenen Prime-Editor-Fragmente zu einem funktionellen Prime-Editor zusammengefügt werden. In einer weiteren Ausführungsform kann das Prime- Editor-Fragment so modifiziert werden, dass es ein gesplittetes Intein umfasst. Sobald es in eine Zelle eingeschleust oder exprimiert wird, assoziieren und binden sich die gesplitteten Intein-Domänen der verschiedenen Fragmente aneinander und werden dann einem Trans- Splicing unterzogen, das zur Exzision der Split-Intein-Domänen aus jedem der Fragmente und zur gleichzeitigen Bildung einer Peptidbindung zwischen den Fragmenten führt, wodurch der Prime-Editor wiederhergestellt wird.
In einer Ausführungsform kann der Prime-Editor durch einen Split-Intein-Ansatz eingeschleustwerden.
Der Ort der Splitstelle kann zwischen einem oder mehreren Paaren von Resten im Prime-Editor und in beliebigen Domänen darin positioniert werden, einschließlich innerhalb der napDNAbp-Domäne, der Polymerase-Domäne (z. B. RT-Domäne), der Linker-Domäne, die die napDNAbp-Domäne und die Polymerase-Domäne miteinander verbindet.
In einer Ausführungsform, dargestellt in 66, ist der Prime-Editor (PE) an einer Splitstelle innerhalb der napDNAbp geteilt.
In bestimmten Ausführungsformen ist das napDNAbp ein kanonisches SpCas9- Polypeptid der SEQ-ID-NR: 18, wie folgt:

SpCas9 Streptococcus pyogenes M1 SwissProt Zugriffs-Nr. Q99ZW2 Wildtyp
SEQ-ID-Nr: 18

1368 AA
In bestimmten Ausführungsformen wird das SpCas9 an einer Splitstelle in zwei Fragmente gesplittet, die sich zwischen den Resten 1 und 2, 2 und 3, 3 und 4, 4 und 5, 5 und 6, 6 und 7, 7 und 8, 8 und 9, 9 und 10 oder zwischen zwei beliebigen Paaren von Resten irgendwo zwischen den Resten 1-10, 10-20, 20-30, 30-40, 40-50, 50-60, 60-70, 70-80, 80-90, 90-100, 100-200, 200-300, 300-400, 400-500, 500-600, 600-700, 700-800, 800-900, 1000-1100, 1100- 1200, 1200-1300, oder 1300-1368 des kanonischen SpCas9 der SEQ-ID-NR: 18 befindet.
In bestimmten Ausführungsformen wird ein napDNAbp an einer Splitstelle in zwei Fragmente gesplittet, die sich an einem Restepaar befindet, das zwei beliebigen Restepaaren entspricht, die sich irgendwo zwischen den Positionen 1-10, 10-20, 20-30, 30-40, 40-50, 50- 60, 60-70, 70-80, 80-90, 90-100, 100-200, 200-300, 300-400, 400-500, 500-600, 600-700, 700- 800, 800-900, 1000-1100, 1100-1200, 1200-1300, oder 1300-1368 des kanonischen SpCas9 der SEQ-ID-NR: 18 befindet.
In bestimmten Ausführungsformen wird das SpCas9 an einer Splitstelle in zwei Fragmente gesplittet, die sich zwischen den Resten 1 und 2, 2 und 3, 3 und 4, 4 und 5, 5 und 6, 6 und 7, 7 und 8, 8 und 9, 9 und 10 oder zwischen zwei beliebigen Paaren von Resten irgendwo zwischen den Resten 1-10, 10-20, 20-30, 30-40, 40-50, 50-60, 60-70, 70-80, 80-90, 90-100, 100-200, 200-300, 300-400, 400-500, 500-600, 600-700, 700-800, 800-900, 1000-1100, 1100- 1200, 1200-1300, oder 1300-1368 des kanonischen SpCas9 der SEQ-ID-NR: 18 befindet. In bestimmten Ausführungsformen befindet sich die Splitstelle an einer oder mehreren Polypeptidbindungsstellen (d. h. eine „Splitstelle oder Split-Intein-Splitstelle“), die mit einem gesplitteten Intein fusioniert und dann als getrennt kodierte Fusionsproteine in die Zellen eingeschleust werden. Sobald die Split-Intein-Fusionsproteine (d. h. die Proteinhälften) in einer Zelle exprimiert werden, werden die Proteine Trans-Splicing unterzogen, um einen vollständigen oder ganzen PE zu bilden, wobei gleichzeitig die verbundenen Split-Intein- Sequenzen entfernt werden.
Zum Beispiel, wie in 66 gezeigt, kann das N-terminale Extein mit einem ersten gesplitteten Protein (z. B. N-Intein) und das C-terminale Extein mit einem zweiten gesplitteten Protein (z. B. C-Intein) fusioniert werden. Das N-terminale Extein wird mit dem C-terminalen Extein fusioniert, um ein ganzes Prime-Editor-Fusionsprotein zu bilden, das eine napDNAbp- Domäne und eine Polymerase-Domäne (z. B. RT-Domäne) umfasst, und zwar nach der Selbstassoziation des N-Inteins und des C-Inteins innerhalb der Zelle, gefolgt von ihrer Selbstabspaltung und der gleichzeitigen Bildung einer Peptidbindung zwischen den N- terminalen Extein- und C-terminalen Extein-Abschnitten eines ganzen Prime-Editors (PE).
Um die Vorteile einer Split-PE-Einschleusungsstrategie unter Verwendung von Split- Inteins zu nutzen, muss der Prime-Editor an einer oder mehreren Splitstellen geteilt werden, um mindestens zwei getrennte Hälften eines Prime-Editors zu schaffen, von denen jede innerhalb einer Zelle wieder zusammengefügt werden kann, wenn jede Hälfte mit einer Split- Intein-Sequenz fusioniert ist.
In bestimmten Ausführungsformen wird der Prime-Editor an einer einzigen Splitstelle gesplittet. In bestimmten anderen Ausführungsformen wird der Prime-Editor an zwei Splitstellen oder an drei Splitstellen oder an vier Splitstellen oder an mehr gesplittet.
In einer bevorzugten Ausführungsform wird der Prime-Editor an einer einzigen Splitstelle gesplittet, um zwei getrennte Hälften eines Prime-Editors zu erzeugen, von denen jede mit einer Split-Intein-Sequenz fusioniert werden kann.
Ein beispielhaftes Split-Intein ist das Ssp-DnaE-Intein, das zwei Untereinheiten umfasst, nämlich DnaE-N und DnaE-C. Die beiden unterschiedlichen Untereinheiten werden von separaten Genen kodiert, nämlich dnaE-n und dnaE-c, die die Untereinheiten DnaE-N bzw. DnaE-C kodieren. DnaE ist ein natürlich vorkommendes Split-Intein in Synechocytis sp. PCC6803 und ist in der Lage, das Trans-Splicing von zwei separaten Proteinen zu steuern, die jeweils eine Fusion mit DnaE-N oder DnaE-C umfassen.
Weitere natürlich vorkommende oder künstlich hergestellte Split-Intein-Sequenzen sind bekannt oder können aus den hierin beschriebenen oder in der Fachwelt verfügbaren Ganz- Intein-Sequenzen hergestellt werden. Beispiele für Split-Intein-Sequenzen sind zu finden in Stevens et al. „A promiscuous split intein with expanded protein engineering applications", PNAS, 2017, Vol. 114: 8538-8543; Iwai et al. „Highly efficient protein trans-splicing by a naturally split DnaE intein from Nostc punctiforme", FEBS Lett, 580: 1853-1858, die hierin durch Bezugnahme aufgenommen sind. Weitere Split-Intein-Sequenzen finden sich zum Beispiel in WO 2013/045632 , WO 2014/055782 , WO 2016/069774 und EP2877490 , deren Inhalte hierin jeweils durch Bezugnahme aufgenommen sind.
Darüber hinaus wurde das Proteinspleißen in trans in vivo und in vitro beschrieben (Shingledecker, et al., Gene 207:187 (1998), Southworth, et al., EMBOJ. 17:918 (1998); Mills, et al., Proc. Natl. Acad. Sci. USA, 95:3543-3548 (1998); Lew, et al., J. Biol. Chem., 273:15887- 15890 (1998); Wu, et al., Biochim. Biophys. Acta 35732:1 (1998b), Yamazaki, et al., J. Am. Chem. Soc. 120:5591 (1998), Evans, et al., J. Biol. Chem. 275:9091 (2000); Otomo, et al., Biochemistry 38:16040-16044 (1999); Otomo, et al., J. Biolmol. NMR 14:105-114 (1999); Scott, et al., Proc. Natl. Acad. Sci. USA 96:13638-13643 (1999)) und stellt die Möglichkeit bereit, ein Protein in zwei inaktiven Fragmenten zu exprimieren, die anschließend durch Ligation ein funktionelles Produkt bilden, z. B. wie in 66 und 67 im Hinblick auf die Bildung eines vollständigen PE-Fusionsproteins aus zwei getrennt exprimierten Hälften gezeigt.
In verschiedenen hierin beschriebenen Ausführungsformen können die Verfahren der kontinuierlichen Evolution (z. B. PACE) verwendet werden, um einen ersten Abschnitt eines Baseneditors zuevolvieren. Ein erster Abschnitt könnte eine einzelne Komponente oder Domäne beinhalten, z. B. eine Cas9-Domäne, eine Deaminase-Domäne oder eine UGI- Domäne. Die separat evolvierte Komponente oder Domäne kann dann mit den verbleibenden Abschnitten des Baseneditors innerhalb einer Zelle fusioniert werden, indem sowohl der evolvierte Abschnitt als auch die verbleibenden nicht evolvierten Abschnitte mit Split-Intein- Polypeptiddomänen separat exprimiert werden. Der erste Abschnitt könnte im weiteren Sinne einen beliebigen ersten Aminosäureabschnitt eines Baseneditors beinhalten, der mit einem hierin beschriebenen kontinuierlichen Evolutionsverfahren evolviert werden soll. Der zweite Abschnitt würde sich in dieser Ausführungsform auf den verbleibenden Aminosäureabschnitt des Baseneditors beziehen, der nicht mit den hierin beschriebenen Verfahren evolviert wird. Der evolvierte erste Abschnitt und der zweite Abschnitt des Baseneditors könnten jeweils mit Split-Intein-Polypeptiddomänen in einer Zelle exprimiert werden. Die natürlichen Proteinspleißmechanismen der Zelle würden den evolvierten ersten Abschnitt und den nicht evolvierten zweiten Abschnitt zu einem einzigen Fusionsprotein zusammenfügen, das einen evolvierten Basis-Editor darstellt. Der evolvierte erste Abschnitt kann entweder den N- oder den C-terminalen Teil des einzelnen Fusionsproteins umfassen. In analoger Weise könnte die Verwendung eines zweiten orthogonalen Trans-Splicing-Intein-Paares es ermöglichen, dass der evolvierte erste Abschnitt einen internen Teil des einzelnen Fusionsproteins umfasst.
Auf diese Weise kann jede der hierin beschriebenen evolvierten und nicht evolvierten Komponenten der Baseneditoren mit Split-Intein-Tags exprimiert werden, um die Bildung eines vollständigen Baseneditors, der die evolvierte und nicht evolvierte Komponente umfasst, in einer Zelle zu erleichtern.
Der Mechanismus des Proteinspleißprozesses ist sehr detailliert untersucht worden (Chong, et al., J. Biol. Chem. 1996, 271, 22159-22168; Xu, M-Q & Perler, F. B. EMBO Journal, 1996, 15, 5146-5153) und es wurden konservierte Aminosäuren an den Intein- und Extein-Spleißstellen gefunden (Xu, et al., EMBO Journal, 1994, 13 5517-522). Die hierin beschriebenen Konstrukte enthalten eine Intein-Sequenz, die an den 5'-Terminus des ersten Gens (z. B. den evolvierten Abschnitt des Baseneditors) fusioniert ist. Geeignete Intein- Sequenzen können aus allen Proteinen ausgewählt werden, von denen bekannt ist, dass sie Proteinspleiß-Elemente enthalten. Eine Datenbank, die alle bekannten Inteine enthält, ist im World Wide Web zu finden (Perler, F. B. Nucleic Acids Research, 1999, 27, 346-347). Die Intein-Sequenz ist am 3'-Ende mit dem 5'-Ende eines zweiten Gens fusioniert. Um dieses Gen auf eine bestimmte Organelle auszurichten, kann ein Peptidsignal an die kodierende Sequenz des Gens fusioniert werden. Nach dem zweiten Gen kann die Sequenz des Intein-Gens zur Exprimierung mehrerer Proteine in derselben Zelle beliebig oft wiederholt werden. Bei Konstrukten, die mehrere Inteins enthalten, kann es sinnvoll sein, Intein-Elemente aus verschiedenen Quellen zu verwenden. Nach der Sequenz des letzten zu exprimierenden Gens muss eine Transkriptionsterminationssequenz eingefügt werden. In einer Ausführungsform wird eine modifizierte Intein-Spleißeinheit so ausgestaltet, dass sie sowohl die Exzision der Exteine von den Inteinen katalysieren als auch die Ligation der Exteine verhindern kann. Die Mutagenese der C-terminalen Extein-Kreuzung in der GB-D-DNA-Polymerase der Spezies Pyrococcus führte zu einem veränderten Spleiß-Element, das die Abspaltung von Exteinen und Inteinen bewirkt, aber die anschließende Ligation der Exteine verhindert (Xu, M-Q & Perler, F. B. EMBO Journal, 1996, 15, 5146-5153). Die Mutation von Serin 538 zu einem Alanin oder Glycin induzierte die Spaltung, verhinderte aber die Ligation. Die Mutation äquivalenter Reste in anderen Intein-Spleißeinheiten sollte aufgrund der Erhaltung von Aminosäuren an der C- terminalen Extein-Verbindung zum Intein ebenfalls die Extein-Ligation verhindern. Ein bevorzugtes Intein, das keine Endonuklease-Domäne enthält, ist das Mycobacterium xenopi GyrA-Protein (Telenti, et al. J. Bacteriol. 1997, 179, 6378-6382). Andere wurden in der Natur gefunden oder künstlich hergestellt, indem die Endonuklease-Domänen aus endonukleasehaltigen Inteinen entfernt wurden (Chong, et al. J. Biol. Chem. 1997, 272, 15587- 15590). In einer bevorzugten Ausführungsform wird das Intein so ausgewählt, dass es aus der minimalen Anzahl von Aminosäuren besteht, die zum Ausführen der Spleißfunktion erforderlich sind, wie etwa das Intein aus dem Mycobacterium xenopi GyrA-Protein (Telenti, A., et al., J. Bacteriol. 1997, 179, 6378-6382). In einer alternativen Ausführungsform wird ein Intein ohne Endonuklease-Aktivität gewählt, wie etwa das Intein des Mycobacterium xenopi GyrA-Proteins oder das VMA-Intein von Saccharaomyces cerevisiae, das so modifiziert wurde, dass die Endonuklease-Domänen entfernt wurden (Chong, 1997). Eine weitere Modifikation der Intein-Spleißeinheit kann es ermöglichen, die Reaktionsgeschwindigkeit der Spaltreaktion zu verändern, so dass die Proteindosierung durch einfache Modifizierung der Gensequenz der Spleißeinheit gesteuert werden kann.
Inteine können auch als zwei Fragmente vorliegen, die von zwei getrennt transkribierten und übersetzten Genen kodiert werden. Diese so genannten Split-Inteine assoziieren sich selbst und katalysieren die Proteinspleißaktivität in trans. Split-Inteine wurden in verschiedenen Cyanobakterien und Archaeen nachgewiesen (Caspi et al, Mol Microbiol. 50: 1569-1577 (2003); Choi J. et al, J Mol Biol. 556: 1093-1106 (2006.); Dassa B. et al, Biochemistry. 46:322-330 (2007.); Liu X. und Yang J., J Biol Chem. 275:26315-26318 (2003); Wu H. et al.
Proc Natl Acad Sei USA. £5:9226-9231 (1998.); und Zettler J. et al, FEBS Letters. 553:909-914 (2009)), wurden aber bisher noch nicht in Eukaryoten gefunden. Kürzlich wurden bei einer bioinformatischen Analyse von Umwelt-Metagenomdaten 26 verschiedene Loci mit einer neuartigen genomischen Anordnung entdeckt. An jedem Locus ist eine konservierte Enzymkodierungsregion durch ein Split-Intein unterbrochen, wobei zwischen den Abschnitten, die für Intein-Subdomänen kodieren, ein freistehendes Endonuklease-Gen eingefügt ist. Von diesen wurden fünf Loci vollständig zusammengefügt: DNA-Helikasen (gp41-1, gp41-8); Inosin-5'-Monophosphat-Dehydrogenase (IMPDH-1); und katalytische Untereinheiten der Ribonukleotid-Reduktase (NrdA-2 und NrdJ-1). Diese zersplitterte Genorganisation scheint hauptsächlich bei Phagen aufzutreten (Dassa et al, Nucleic Acids Research. 57:2560-2573 (2009)). 57:2560-2573 (2009)).
Das Split-Intein Npu DnaE wurde als das mit der höchsten Rate charakterisiert, die für die Protein-Transspleißreaktion berichtet wurde. Darüber hinaus gilt die Npu DnaE- Proteinspleißreaktion als robust und ertragreich in Bezug auf verschiedene Extein-Sequenzen, Temperaturen von 6 bis 37 °C und die Anwesenheit von bis zu 6 M Harnstoff (Zettler J. et al, FEBS Letters. 553:909-914 (2009); Iwai I. et al, FEBS Letters 550: 1853-1858 (2006)). Wie erwartet, wurde bei Einführung der Cysl-Ala-Mutation in der N-Domäne dieser Inteine die anfängliche N- zu S-Acylverschiebung und damit das Proteinspleißen blockiert. Leider wurde auch die C-terminale Spaltreaktion fast vollständig gehemmt. Die Abhängigkeit der Asparagin- Cyclisierung an der C-terminalen Spleißstelle von der Acylverschiebung an der N-terminalen spaltbaren Peptidbindung scheint eine einzigartige Eigenschaft zu sein, die den natürlich gesplitteten DnaE-Intein-Allelen gemeinsam ist (Zettler J. et al. FEBS Letters. 555:909-914 (2009)).
Der Mechanismus des Proteinspleißens umfasst in der Regel vier Schritte [29-30]: 1) eine N-S- oder N-O-Acylverschiebung am N-Terminus des Inteins, die die stromaufwärts gelegene Peptidbindung bricht und eine Esterbindung zwischen dem N-Extein und der Seitenkette der ersten Aminosäure des Inteins (Cys oder Ser) bildet; 2) eine Umesterung, die das N-Extein an den C-Terminus des Inteins verlagert und eine neue Esterbindung bildet, die das N-Extein mit der Seitenkette der ersten Aminosäure des C-Exteins (Cys, Ser oder Thr) verknüpft; 3) eine Asn-Cyclisierung, die die Peptidbindung zwischen dem Intein und dem C- Extein bricht; und 4) eine S-N- oder O-N-Acylverschiebung, die die Esterbindung durch eine Peptidbindung zwischen dem N-Extein und dem C-Extein ersetzt.
Das Trans-Splicing von Proteinen, das durch Split-Inteine katalysiert wird, stellt ein rein enzymatisches Verfahren zur Proteinbindung bereit [31]. Bei einem Split-Intein handelt es sich im Wesentlichen um ein zusammenhängendes Intein (z. B. ein Mini-Intein), das in zwei Teile, das N-Intein und das C-Intein, gesplittet wird. Das N-Intein und das C-Intein eines Split- Inteins können sich nicht-kovalent assoziieren, um ein aktives Intein zu bilden und die Spleißreaktion im Wesentlichen auf die gleiche Weise zu katalysieren wie ein zusammenhängendes Intein. Split-Inteine wurden in der Natur gefunden und auch in Laboren hergestellt [31-35]. Wie hierin verwendet, bezieht sich der Begriff „Split-Intein“ auf jedes Intein, bei dem eine oder mehrere Peptidbindungen zwischen den N-terminalen und C- terminalen Aminosäuresequenzen unterbrochen sind, so dass die N-terminalen und C- terminalen Sequenzen zu separaten Molekülen werden, die sich nicht-kovalent reassoziieren oder zu einem Intein rekonstituieren können, das für Trans-Splicing-Reaktionen funktional ist. Jedes katalytisch aktive Intein oder Fragment davon kann verwendet werden, um ein Split- Intein zur Verwendung in den erfindungsgemäßen Verfahren abzuleiten. Zum Beispiel kann in einem Aspekt das Split-Intein von einem eukaryotischen Intein abgeleitet sein. In einem anderen Aspekt kann das Split-Intein von einem bakteriellen Intein abgeleitet sein. In einem anderen Aspekt kann das Split-Intein von einem Archaeen-Intein abgeleitet sein. Vorzugsweise besitzt das so abgeleitete Split-Intein nur die Aminosäuresequenzen, die für die Katalyse von Trans-Splicing-Reaktionen wesentlich sind.
Wie hierin verwendet, bezieht sich das „N-terminale Split-Intein (In)“ auf jede Intein- Sequenz, die eine N-terminale Aminosäuresequenz umfasst, die für Trans-Splicing-Reaktionen funktionell ist. Ein In umfasst also auch eine Sequenz, die beim Trans-Splicing ausgespleißt wird. Ein In kann eine Sequenz umfassen, die eine Modifikation des N-terminalen Abschnitts einer natürlich vorkommenden Intein-Sequenz ist. Zum Beispiel kann ein In zusätzliche Aminosäurereste und/oder mutierte Reste umfassen, solange der Einschluss solcher zusätzlichen und/oder mutierten Reste das In beim Trans-Splicing nicht funktionsunfähig macht. Vorzugsweise verbessert oder steigert die Aufnahme der zusätzlichen und/oder mutierten Reste die Trans-Splicing-Aktivität des In.
Wie hierin verwendet, bezieht sich das „C-terminale Split-Intein (Ic)“ auf jede Intein- Sequenz, die eine C-terminale Aminosäuresequenz umfasst, die für Trans-Splicing-Reaktionen funktionell ist. In einem Aspekt umfasst das Ic 4 bis 7 zusammenhängende Aminosäurereste, von denen mindestens 4 Aminosäuren aus dem letzten β-Strang des Inteins stammen, von dem es abgeleitet wurde. Ein Ic umfasst also auch eine Sequenz, die beim Trans-Splicing ausgespleißt wird. Ein Ic kann eine Sequenz umfassen, die eine Modifikation des C-terminalen Abschnitts einer natürlich vorkommenden Intein-Sequenz ist. Zum Beispiel kann ein Ic zusätzliche Aminosäurereste und/oder mutierte Reste umfassen, solange die Aufnahme solcher zusätzlichen und/oder mutierten Reste das In beim Trans-Splicing nicht funktionsunfähig macht. Vorzugsweise verbessert oder steigert die Aufnahme der zusätzlichen und/oder mutierten Reste die Trans-Splicing-Aktivität des Ic.
In einigen Ausführungsformen der Erfindung kann ein mit einem Ic oder einem In verknüpftes Peptid eine zusätzliche chemische Einheit umfassen, die unter anderem Fluoreszenzgruppen, Biotin, Polyethylenglykol (PEG), Aminosäureanaloga, unnatürliche Aminosäuren, Phosphatgruppen, Glycosylgruppen, Radioisotopenmarker und pharmazeutische Moleküle beinhaltet. In anderen Ausführungsformen kann ein mit einem Ic verknüpftes Peptid eine oder mehrere chemisch reaktive Gruppen umfassen, die u. a. Keton, Aldehyd, Cys-Reste und Lys-Reste beinhalten. Das N-Intein und das C-Intein eines Split- Inteins können sich nicht-kovalent verbinden, um ein aktives Intein zu bilden und die Spleißreaktion zu katalysieren, wenn ein „Intein-Splicing-Polypeptid (ISP)“ vorhanden ist. Wie hierin verwendet, bezieht sich „Intein-Splicing-Polypeptid (ISP)“ auf den Abschnitt der Aminosäuresequenz eines Split-Inteins, der übrig bleibt, wenn das Ic, das In oder beide aus dem Split-Intein entfernt werden. In bestimmten Ausführungsformen umfasst das In das ISP. In einer anderen Ausführungsform umfasst das Ic die ISP. In einer weiteren Ausführungsform ist das ISP ein separates Peptid, das weder mit In noch mit Ic kovalent verknüpft ist.
Split-Inteine können aus zusammenhängenden Inteinen gebildet werden, indem eine oder mehrere Splitstellen in die unstrukturierte Schleife oder die dazwischen liegende Aminosäuresequenz zwischen den -12 konservierten Betasträngen, die in der Struktur der Mini-Inteine zu finden sind, eingebaut werden [25-28]. Eine gewisse Flexibilität bei der Position der Splitstellen in den Regionen zwischen den Betasträngen ist möglich, vorausgesetzt, dass die Struktur des Inteins, insbesondere die strukturierten Betastränge, durch die Schaffung des Splits nicht so stark gestört wird, dass die Proteinspleißaktivität verloren geht.
Beim Trans-Splicing von Proteinen besteht ein Vorläuferprotein aus einem N-Extein- Teil, auf den das N-Intein folgt, ein anderes Vorläuferprotein besteht aus dem C-Intein, auf das ein C-Extein-Teil folgt, und eine Trans-Splicing-Reaktion (die von den N- und C-Inteinen gemeinsam katalysiert wird) schneidet die beiden Intein-Sequenzen heraus und verknüpft die beiden Extein-Sequenzen mit einer Peptidbindung. Protein-Trans-Splicing ist eine enzymatische Reaktion, die mit sehr niedrigen (z. B. mikromolaren) Proteinkonzentrationen arbeiten kann und unter physiologischen Bedingungen durchgeführt werden kann.
[2] Andere programmierbare Nukleasen
In verschiedenen hierin beschriebenen Ausführungsformen umfassen die Multi-Flap- Prime-Editoren ein napDNAbp, wie etwa ein Cas9-Protein. Diese Proteine sind dadurch „programmierbar“, dass sie mit einer Leit-RNA (bzw. einer PEgRNA) komplexiert werden, die das Cas9-Protein zu einer Zielstelle auf der DNA führt, die eine Sequenz besitzt, die komplementär zum Spacer-Abschnitt der gRNA (oder PEgRNA) ist und die auch die erforderliche PAM-Sequenz besitzt. In bestimmten hier vorgesehenen Ausführungsformen kann das napDNAbp jedoch durch eine andere Art von programmierbarem Protein ersetzt werden, wie etwa eine Zinkfinger-Nuklease oder eine Transkriptionsaktivator-ähnliche Effektornuklease (TALEN).
1J zeigt eine solche hierin vorgesehene Variante des Prime-Editing, bei der das napDNAbp (z. B. SpCas9-Nickase) durch eine beliebige programmierbare Nuklease-Domäne, wie etwa Zinkfinger-Nukleasen (ZFN) oder Transkriptionsaktivator-ähnliche Effektornukleasen (TALEN), ersetzt wird. Geeignete Nukleasen müssen also nicht unbedingt durch ein Nukleinsäure-Zielmolekül (wie etwa eine Leit-RNA) „programmiert“ werden, sondern können auch durch die Definition der Spezifität einer DNA-Bindungsdomäne, wie etwa und insbesondere einer Nuklease, programmiert werden. Wie etwa beim Prime-Editing mit napDNAbp-Molekülen ist es vorzuziehen, dass solche alternativen programmierbaren Nukleasen so modifiziert werden, dass nur ein Strang einer Ziel-DNA geschnitten wird. Mit anderen Worten sollten die programmierbaren Nukleasen vorzugsweise als Nickasen funktionieren. Sobald eine programmierbare Nuklease ausgewählt wurde (z. B. eine ZFN oder eine TALEN), können zusätzliche Funktionalitäten in das System eingebaut werden, damit es gemäß einem Prime-Editing-ähnlichen Mechanismus operieren kann. Zum Beispiel können die programmierbaren Nukleasen modifiziert werden, indem (z. B. über einen chemischen Linker) ein RNA- oder DNA-Verlängerungsarm daran gekoppelt wird, wobei der Verlängerungsarm eine Primer-Bindungsstelle (PBS) und ein DNA-Synthese-Templat umfasst. Die programmierbare Nuklease kann auch (z. B. über einen chemischen Linker oder einen Aminosäure-Linker) an eine Polymerase gekoppelt sein, deren Art davon abhängt, ob der Verlängerungsarm aus DNA oder RNA besteht. Im Falle eines RNA-Verlängerungsarms kann die Polymerase eine RNA-abhängige DNA-Polymerase sein (z. B. eine reverse Transkriptase). Im Falle eines DNA-Verlängerungsarms kann die Polymerase eine DNA-abhängige DNA- Polymerase sein (z. B. eine prokaryotische Polymerase, die Pol I, Pol II oder Pol III beinhaltet, oder eine eukaryotische Polymerase, die Pol a, Pol b, Pol g, Pol d, Pol e oder Pol z beinhaltet). Das System kann auch andere Funktionalitäten beinhalten, die als Fusionen zu den programmierbaren Nukleasen hinzugefügt werden, oder die in trans hinzugefügt werden, um die Reaktion als Ganzes zu erleichtern (z. B. (a) eine Helikase zum Abwickeln der DNA an der Schnittstelle, um den geschnittenen Strang mit dem 3'-Ende als Primer verfügbar zu machen, (b) ein FEN1 zur Unterstützung der Entfernung des endogenen Strangs auf dem geschnittenen Strang, um die Reaktion zum Austausch des endogenen Strangs durch den synthetisierten Strang voranzutreiben, oder (c) einen nCas9:gRNA-Komplex zur Erzeugung eines zweiten Nicks auf dem gegenüberliegenden Strang, der dazu beitragen kann, die Integration der synthetisierten Reparatur durch eine bevorzugte zelluläre Reparatur des nicht editierten Strangs voranzutreiben). In Analogie zum Prime-Editing mit einer napDNAbp könnte ein solcher Komplex mit einer ansonsten programmierbaren Nuklease verwendet werden, um einen neu synthetisierten Austausch-DNA-Strang, der eine gewünschte Änderung trägt, zu synthetisieren und dann dauerhaft in eine Zielstelle der DNA einzubauen.
Geeignete alternative programmierbare Nukleasen sind in der Technik wohlbekannt, die anstelle eines napDNAbp:gRNA-Komplexes verwendet werden können, um ein alternatives Prime-Editor-System zu konstruieren, das so programmiert werden kann, dass es selektiv an eine Ziel-DNA-Stelle bindet, und das ferner in der oben beschriebenen Weise modifiziert werden kann, um eine Polymerase und einen RNA- oder DNA-Verlängerungsarm, der eine Primer-Bindungsstelle und ein DNA-Synthese-Templat umfasst, zu einer spezifischen Nickstelle zu kolokalisieren. Zum Beispiel, und wie in 1J dargestellt ist, können Transkriptionsaktivator-ähnliche Effektornukleasen (TALENs) als programmierbare Nuklease in den hierin beschriebenen Verfahren und Stoffzusammensetzungen zum Multi-Flap-Prime- Editing verwendet werden. TALENS sind künstliche Restriktionsenzyme, die durch die Fusion der DNA-Bindungsdomäne des TAL-Effektors mit einer DNA-Spaltungsdomäne erzeugt werden. Diese Reagenzien ermöglichen eine effiziente, programmierbare und spezifische DNA-Spaltung und sind leistungsstarke Werkzeuge für das Genom-Editing in situ. Transkriptionsaktivator-ähnliche Effektoren (TALEs) können schnell so konstruiert werden, dass sie praktisch jede beliebige DNA-Sequenz binden. Der hier verwendete Begriff TALEN ist weit gefasst und beinhaltet einen monomeren TALEN, der doppelsträngige DNA ohne Unterstützung durch einen anderen TALEN spalten kann. Der Begriff TALEN wird auch für ein oder beide Mitglieder eines Paares von TALENs verwendet, die so konstruiert sind, dass sie zusammenarbeiten, um DNA an derselben Stelle zu spalten. TALENs, die zusammenarbeiten, können als Links-TALEN und Rechts-TALEN bezeichnet werden, was sich auf die Händigkeit der DNA bezieht. Siehe US-Ser. Nr. 12/965,590 ; US-Ser. Nr. 13/426,991 (US-Pat. Nr. 8,450,471 ); US-Ser. Nr. 13/427,040 (US-Pat. Nr. 8,440,431 ); US-Ser. Nr. 13/427,137 (US-Pat. Nr. 8,440,432 ); und US-Ser. Nr. 13/738,381 , die hierin jeweils in ihrer Gesamtheit durch Bezugnahme aufgenommen sind. Darüber hinaus werden TALENS beschrieben in WO 2015/027134 , US 9,181,535 , Boch et al., „Breaking the Code of DNA Binding Specificity of TAL-Type III Effectors", Science, Bd. 326, S. 1509-1512 (2009), Bogdanove et al., TAL Effectors: Customizable Proteins for DNA Targeting, Science, Bd. 333, S. 1843-1846 (2011), Cade et al., „Highly efficient generation of heritable zebrafish gene mutations using homo- and heterodimeric TALENs", Nucleic Acids Research, Bd. 40, S. 8001- 8010 (2012), und Cermak et al, „Efficient design and assembly of custom TALEN and other TAL effector-based constructs for DNA targeting“, Nucleic Acids Research, vol. 39, No. 17, e82 (2011), die hierin jeweils durch Bezugnahme aufgenommen sind.
Wie in 1J dargestellt ist, können Zinkfingernukleasen auch als alternative programmierbare Nukleasen zur Verwendung beim Multi-Flap-Prime-Editing anstelle von napDNAbps, wie etwa Cas9-Nickasen, verwendet werden. Wie bei TALENS können die ZFN- Proteine so modifiziert werden, dass sie als Nickasen fungieren, d. h., das ZFN wird so verändert, dass es nur einen Strang der Ziel-DNA schneidet, ähnlich wie das napDNAbp, das bei den hierin beschriebenen Multi-Flap-Prime-Editoren verwendet wird. ZFN-Proteine sind in der Fachwelt ausführlich beschrieben worden, zum Beispiel in Carroll et al. „Genome Engineering with Zinc-Finger Nucleases", Genetics, Aug 2011, Vol. 188: 773-782; Durai et al. „Zinc finger nucleases: custom-designed molecular scissors for genome engineering of plant and mammalian cells," Nucleic Acids Res, 2005, Vol. 33: 5978-90; und Gaj et al. „ZFN, TALEN, and CRISPR/Cas-based methods for genome engineering," Trends Biotechnol. 2013, Vol.31: 397-405, die hierin jeweils in ihrer Gesamtheit durch Bezugnahme aufgenommen sind.
[3] Polymerasen (z. B. reverse Transkriptasen)
In verschiedenen Ausführungsformen beinhaltet das hierin offenbarte Multi-Flap- Prime-Editor-System eine Polymerase (z. B. DNA-abhängige DNA-Polymerase oder RNA- abhängige DNA-Polymerase, wie etwa Reverse Transkriptase) oder eine Variante davon, die als Fusionsprotein mit einer napDNAbp oder einer anderen programmierbaren Nuklease bereitgestellt werden kann, oder in trans.
Jede beliebige Polymerase kann in den hierin beschriebenen Multi-Flap-Prime- Editoren verwendet werden. Bei den Polymerasen kann es sich um Wildtyp-Polymerasen, funktionelle Fragmente, Mutanten, Varianten oder trunkierte Varianten und ähnliches handeln. Die Polymerasen können Wildtyp-Polymerasen aus eukaryotischen, prokaryotischen, archaealen oder viralen Organismen beinhalten und/oder die Polymerasen können durch Gentechnik, Mutagenese oder auf Evolution basierende Verfahren modifiziert sein. Die Polymerasen können T7-DNA-Polymerase, T5-DNA-Polymerase, T4-DNA-Polymerase, Klenow-Fragment-DNA-Polymerase, DNA-Polymerase III und dergleichen beinhalten. Die Polymerasen können auch thermostabil sein und Taq-, Tne-, Tma-, Pfu-, Tfl-, Tth-, Stoffel- Fragment-, VENT®- und DEEPVENT®-DNA-Polymerasen, KOD, Tgo, JDF3 sowie Mutanten, Varianten und Ableitungen davon beinhalten (siehe US-Pat. Nr. 5,436,149 ; US-Pat. Nr. 4,889,818 ; US-Pat. Nr. 4,965,185 ; US-Pat. Nr. 5,079,352 ; US-Pat. Nr. 5,614,365 ; US-Pat. Nr. 5,374,553 ; US-Pat. Nr. 5,270,179 ; US-Pat. Nr. 5,047,342 ; US-Pat. Nr. 5,512,462 ; WO 92/06188 ; WO 92/06200 ; WO 96/10640 ; Barnes, W. M., Gene 112:29-35 (1992); Lawyer, F. C., et al., PCR Meth. Appl. 2:275-287 (1993); Flaman, J.-M, et al., Nuc. Acids Res. 22(15): 3259- 3260(1994), die jeweils durch Bezugnahme aufgenommen sind). Für die Synthese längerer Nukleinsäuremoleküle (z. B. Nukleinsäuremoleküle mit einer Länge von mehr als 3- 5 Kb) können mindestens zwei DNA-Polymerasen eingesetzt werden. In bestimmten Ausführungsformen kann eine der Polymerasen im Wesentlichen keine 3'- Exonukleaseaktivität aufweisen und die andere kann eine 3'-Exonukleaseaktivität aufweisen. Solche Paarungen können gleiche oder unterschiedliche Polymerasen beinhalten. Beispiele für DNA-Polymerasen, denen es im Wesentlichen an 3'-Exonukleaseaktivität fehlt, beinhalten, sind unter anderem Taq, Tne(exo-), Tma(exo-), Pfu(exo-), Pwo(exo-), exo-KOD und Tth- DNA-Polymerasen sowie Mutanten, Varianten und Ableitungen davon.
Vorzugsweise sind die in den hierin offenbarten Multi-Flap-Prime-Editoren verwendbaren Polymerasen „Templat-abhängige“ Polymerasen (da die Polymerasen dazu bestimmt sind, sich auf das DNA-Synthese-Templat zu stützen, um die Sequenz des während des Prime-Editings zu synthetisierenden DNA-Strangs zu spezifizieren. Wie hierin verwendet, bezieht sich der Begriff „Templat-DNA-Molekül“ auf den Strang einer Nukleinsäure, aus dem ein komplementärer Nukleinsäurestrang durch eine DNA-Polymerase synthetisiert wird, zum Beispiel in einer Primer-Verlängerungsreaktion des DNA-Synthese-Templats einer PEgRNA.
Hierin bezieht sich der Begriff „Templat-abhängige Weise“ auf einen Prozess, der die Templat-abhängige Verlängerung eines Primermoleküls beinhaltet (z. B. DNA-Synthese durch DNA-Polymerase). Der Begriff „Templat-abhängige Weise“ bezieht sich auf die Polynukleotidsynthese von RNA oder DNA, bei der die Sequenz des neu synthetisierten Polynukleotidstrangs durch die bekannten Regeln der komplementären Basenpaarung bestimmt wird (siehe zum Beispiel Watson, J. D. et al., In: Molecular Biology of the Gene, 4th Ed., W. A. Benjamin, Inc., Menlo Park, Calif. (1987)). Der Begriff „komplementär“ bezieht sich auf das breite Konzept der Sequenzkomplementarität zwischen Regionen zweier Polynukleotidstränge oder zwischen zwei Nukleotiden durch Basenpaarung. Es ist bekannt, dass ein Adenin-Nukleotid in der Lage ist, spezifische Wasserstoffbrückenbindungen („Basenpaarung“) mit einem Nukleotid zu bilden, das Thymin oder Uracil ist. Ebenso ist bekannt, dass ein Cytosin-Nukleotid in der Lage ist, eine Basenpaarung mit einem Guanin- Nukleotid einzugehen. Im Falle des Prime-Editings kann man also sagen, dass der von der Polymerase des Prime-Editors gegen das DNA-Synthese-Templat synthetisierte DNA- Einzelstrang „komplementär“ zur Sequenz des DNA-Synthese-Templats ist.
A. Beispielhafte Polymerasen
In verschiedenen Ausführungsformen umfassen die hierin beschriebenen Multi-Flap- Prime-Editoren eine Polymerase. Die Offenbarung bezieht sich auf jede beliebige Wildtyp- Polymerase, die aus einem natürlich vorkommenden Organismus oder Virus oder aus einer kommerziellen oder nichtkommerziellen Quelle gewonnen wird. Darüber hinaus können die in den Multi-Flap-Prime-Editoren der Offenbarung verwendbaren Polymerasen jede natürlich vorkommende Mutantenpolymerase, gentechnisch veränderte Mutantenpolymerase oder andere Polymerasevarianten beinhalten, einschließlich trunkierter Varianten, die ihre Funktion beibehalten. Die hierin verwendbaren Polymerasen können auch so konstruiert sein, dass sie spezifische Aminosäuresubstitutionen enthalten, wie etwa die hierin offenbarten. In bestimmten bevorzugten Ausführungsformen sind die in den Multi-Flap-Prime-Editoren der Offenbarung verwendbaren Polymerasen Templat-basierte Polymerasen, d. h. sie synthetisieren Nukleotidsequenzen in einer Templat-abhängigen Weise.
Eine Polymerase ist ein Enzym, das einen Nukleotidstrang synthetisiert und das in Verbindung mit den hierin beschriebenen Multi-Flap-Prime-Editor-Systemen verwendet werden kann. Bei den Polymerasen handelt es sich vorzugsweise um „Templat-abhängige“ Polymerasen (d. h. um eine Polymerase, die einen Nukleotidstrang basierend auf der Reihenfolge der Nukleotidbasen eines Templat-Strangs synthetisiert). In bestimmten Konfigurationen können die Polymerasen auch „Templat-unabhängig“ sein (d. h. eine Polymerase, die einen Nukleotidstrang ohne die Notwendigkeit eines Templat-Strangs synthetisiert). Eine Polymerase kann ferner als „DNA-Polymerase“ oder „RNA-Polymerase“ kategorisiert werden. In verschiedenen Ausführungsformen umfassen die Multi-Flap-Prime- Editor-Systeme eine DNA-Polymerase. In verschiedenen Ausführungsformen kann die DNA- Polymerase eine „DNA-abhängige DNA-Polymerase“ sein (d. h. das Templatmolekül ist ein DNA-Strang). In solchen Fällen kann das DNA-Templatmolekül eine PEgRNA sein, wobei der Verlängerungsarm einen DNA-Strang umfasst. In solchen Fällen kann die PEgRNA als chimäre oder hybride PEgRNA bezeichnet werden, die einen RNA-Abschnitt (d. h. die Komponenten der Leit-RNA, einschließlich des Spacers und des gRNA-Kerns) und einen DNA-Abschnitt (d. h. den Verlängerungsarm) umfasst. In verschiedenen anderen Ausführungsformen kann die DNA-Polymerase eine „RNA-abhängige DNA-Polymerase“ sein (d. h. das Templatmolekül ist ein RNA-Strang). In solchen Fällen ist die PEgRNA RNA, d. h. sie beinhaltet eine RNA-Verlängerung. Der Begriff „Polymerase“ kann sich auch auf ein Enzym beziehen, das die Polymerisation von Nukleotiden katalysiert (d. h. die Polymeraseaktivität). Im Allgemeinen beginnt das Enzym die Synthese am 3'-Ende eines Primers, der an eine Polynukleotid-Templatsequenz (wie z. B. eine Primer-Sequenz, die an die Primer-Bindungsstelle einer PEgRNA gebunden ist), und bewegt sich dann zum 5'-Ende des Templat-Strangs. Eine „DNA-Polymerase“ katalysiert die Polymerisation von Desoxynukleotiden. Wenn hierin auf eine DNA-Polymerase Bezug genommen wird, beinhaltet der Begriff „DNA-Polymerase“ ein „funktionelles Fragment davon“. Ein „funktionelles Fragment davon“ bezieht sich auf einen beliebigen Abschnitt einer Wildtyp- oder mutierten DNA-Polymerase, der weniger als die gesamte Aminosäuresequenz der Polymerase umfasst und der unter mindestens einem Satz von Bedingungen die Fähigkeit behält, die Polymerisation eines Polynukleotids zu katalysieren. Ein solches funktionales Fragment kann als eigenständige Einheit existieren oder Bestandteil eines größeren Polypeptids, wie etwa eines Fusionsproteins, sein.
In einigen Ausführungsformen können die Polymerasen von Bakteriophagen stammen. Bakteriophagen-DNA-Polymerasen besitzen im Allgemeinen keine 5'-3'-Exonukleaseaktivität, da diese Aktivität von einem separaten Polypeptid kodiert wird. Beispiele für geeignete DNA- Polymerasen sind T4-, T7- und phi29-DNA-Polymerase. Die im Handel erhältlichen Enzyme sind: T4 (erhältlich von vielen Quellen, z. B. Epicentre) und T7 (erhältlich von vielen Quellen, z. B. Epicentre für unmodifizierte und USB für 3' zu 5' exo T7 „Sequenase“ DNA-Polymerase).
Bei den anderen Ausführungsformen handelt es sich um Archaeen-Polymerasen. Es gibt 2 verschiedene Klassen von DNA-Polymerasen, die in Archaeen identifiziert worden sind: 1. Familie B/Pol I type (Homologe von Pfu aus Pyrococcus furiosus) und 2. Pol II type (Homologe von P. furiosus DP1/DP2-Polymerase mit 2 Untereinheiten). Eswurde nachgewiesen, dass DNA-Polymerasen aus beiden Klassen von Natur aus keine 5'-3'- Exonukleaseaktivität aufweisen, wohl aber eine 3'-5'-Exonukleaseaktivität (Korrekturlesen). Geeignete DNA-Polymerasen (Pol I oder Pol II) können aus Archaeen mit optimalen Wachstumstemperaturen, die den gewünschten Testtemperaturen ähnlich sind, gewonnen werden.
Thermostabile archaeale DNA-Polymerasen werden aus Pyrococcus-Arten (furiosus, Arten GB-D, woesii, abysii, horikoshii), Thermococcus-Arten (kodakaraensis KOD1, litoralis, Arten 9 Grad Nord-7, Arten JDF-3, gorgonarius), Pyrodictium occultum und Archaeoglobus fulgidus isoliert.
Die Polymerasen können auch von eubakteriellen Arten stammen. Es gibt 3 Klassen von eubakteriellen DNA-Polymerasen, Pol I, II und III. Die Enzyme der Pol-I-DNA- Polymerase-Familie besitzen eine 5'-3'-Exonukleaseaktivität, und einige Mitglieder weisen auch eine 3'-5'-Exonukleaseaktivität auf. Den Pol II-DNA-Polymerasen fehlt natürlicherweise die 5'-3'-Exonukleaseaktivität, aber sie zeigen eine 3'-5'-Exonukleaseaktivität. Pol III-DNA- Polymerasen stellen die wichtigste replikative DNA-Polymerase der Zelle dar und bestehen aus mehreren Untereinheiten. Der katalytischen Untereinheit von Pol III fehlt die 5'-3'- Exonukleaseaktivität, aber in einigen Fällen befindet sich die 3'-5'-Exonukleaseaktivität im selben Polypeptid.
Es gibt eine Reihe von im Handel erhältlichen Pol I-DNA-Polymerasen, von denen einige modifiziert wurden, um die 5'-3'-Exonukleaseaktivität zu reduzieren oder aufzuheben.
Geeignete thermostabile Pol I-DNA-Polymerasen können aus einer Vielzahl thermophiler Eubakterien isoliert werden, die Thermus-Arten und Thermotoga maritima beinhalten, wie etwa Thermus aquaticus (Taq), Thermus thermophilus (Tth) und Thermotoga maritima (Tma UlTma).
Weitere Eubakterien, die mit den oben genannten verwandt sind, werden in Thermophilic Bacteria (Kristjansson, J. K., Hrsg.) CRC Press, Inc. 1992, Boca Raton, Florida, beschrieben.
Die Erfindung stellt ferner chimäre oder nicht-chimäre DNA-Polymerasen bereit, die chemisch modifiziert sind gemäß den Verfahren, die in US-Pat. Nr. 5,677,152 , 6,479,264 und 6,183,998 offenbart sind, deren Inhalt hiermit in vollem Umfang durch Bezugnahme aufgenommen sind.
Zusätzliche Archaea-DNA-Polymerasen, die mit den oben aufgeführten verwandt sind, werden in den folgenden Referenzen beschrieben: Archaea: A Laboratory Manual (Robb, F. T. und Place, A. R., Hrsg.), Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York, 1995 und Thermophilic Bacteria (Kristjansson, J. K., Hrsg.) CRC Press, Inc., Boca Raton, Florida, 1992.
B. Beispielhafte reverse Transkriptasen
In verschiedenen Ausführungsformen umfassen die hierin beschriebenen Multi-Flap- Prime-Editoren eine reverse Transkriptase als Polymerase. Die Offenbarung bezieht sich auf jede beliebige reverse Transkriptase, die aus einem natürlich vorkommenden Organismus oder Virus oder aus einer kommerziellen oder nichtkommerziellen Quelle gewonnen wird. Darüber hinaus können die in den Multi-Flap-Prime-Editoren der Offenbarung verwendbaren reversen Transkriptasen jede beliebige natürlich vorkommende Mutanten-RT, gentechnisch veränderte Mutanten-RT oder andere RT-Varianten beinhalten, einschließlich trunkierter Varianten, die ihre Funktion beibehalten. Die RTs können auch so konstruiert sein, dass sie spezifische Aminosäuresubstitutionen enthalten, wie etwa die hierin offenbarten.
Reverse Transkriptasen sind multifunktionale Enzyme mit typischerweise drei enzymatischen Aktivitäten, die eine RNA- und eine DNA-abhängige DNA- Polymerisationsaktivität beinhalten, sowie eine RNaseH-Aktivität, die die Spaltung von RNA in RNA-DNA-Hybriden katalysiert. Einige Mutanten der reversen Transkriptasen weisen eine deaktivierte RNaseH-Komponente auf, um unbeabsichtigte Schäden an der mRNA zu verhindern. Diese Enzyme, die komplementäre DNA (cDNA) unter Verwendung von mRNA als Templat synthetisieren, wurden zuerst in RNA-Viren entdeckt. In der Folge wurden reverse Transkriptasen direkt aus Viruspartikeln, Zellen oder Geweben isoliert und gereinigt, (z. B. siehe Kacian et al., 1971, Biochim. Biophys. Acta 46: 365-83; Yang et al., 1972, Biochem. Biophys. Res. Comm. 47: 505-11; Gerard et al., 1975, J. Virol. 15: 785-97; Liu et al., 1977, Arch. Virol. 55 187-200; Kato et al., 1984, J. Virol. Methods 9: 325-39; Luke et al., 1990, Biochem. 29: 1764-69 and Le Grice et al., 1991, J. Virol. 65: 7004-07, die jeweils durch Bezugnahme aufgenommen sind). In jüngster Zeit wurden auf der Suche nach verbesserten Eigenschaften wie etwa Thermostabilität, Verlässlichkeit und Aktivität auch Mutanten und Fusionsproteine erzeugt. Alle beliebigen Wildtyp-, Varianten- und/oder Mutantenformen der reversen Transkriptase, die auf dem Gebiet der Technik bekannt sind oder mit Hilfe bekannter Verfahren hergestellt werden können, kommen hierin in Betracht.
Das Reverse-Transkriptase (RT)-Gen (oder die darin enthaltene genetische Information) kann aus einer Reihe verschiedener Quellen gewonnen werden. So kann das Gen beispielsweise aus eukaryontischen Zellen, die mit einem Retrovirus infiziert sind, oder aus einer Reihe von Plasmiden, die entweder einen Abschnitt oder das gesamte Retrovirus-Genom enthalten, gewonnen werden. Darüber hinaus kann aus Retroviren eine Boten-RNA-ähnliche RNA gewonnen werden, die das RT-Gen enthält. Beispiele für RT-Quellen beinhalten unter anderem Moloney-Mausleukämievirus (M-MLV oder MLVRT), humanes T-Zellen- Leukämievirus Typ 1 (HTLV-1), Rinderleukämievirus (BLV), Rous-Sarkom-Virus (RSV), humanes Immundefizienz-Virus (HIV), Hefe, einschließlich Saccharomyces, Neurospora, Drosophila, Primaten und Nager. Siehe zum Beispiel Weiss, et al., US-Pat. Nr. 4,663,290 (1987); Gerard, G. R., DNA:271-79 (1986); Kotewicz, M. L., et al., Gene 35:249-58 (1985); Tanese, N., et al., Proc. Natl. Acad. Sci. (USA):4944-48 (1985); Roth, M. J., at al., J. Biol. Chem. 260:9326-35 (1985); Michel, F., et al., Nature 316:641-43 (1985); Akins, R. A., et al., Cell 47:505-16 (1986), EMBO J. 4:1267-75 (1985); und Fawcett, D. F., Cell 47:1007-15 (1986) (die hierin jeweils in vollem Umfang durch Bezugnahme aufgenommen sind).
Wildtyp-RTs
Beispielhafte Enzyme zur Verwendung mit den hierin offenbaren Multi-Flap-Prime- Editoren können unter anderem M-MLV reverse Transkriptase und RSV reverse Transkriptase beinhalten. Enzyme, die reverse Transkriptase-Aktivität aufweisen, sind im Handel erhältlich. In bestimmten Ausführungsformen wird die reverse Transkriptase in trans zu den anderen Komponenten des Multi-Flap-Prime-Editor (PE)-Systems bereitgestellt. Das heißt, die reverse Transkriptase wird exprimiert oder anderweitig als einzelne Komponente bereitgestellt, d. h. nicht als Fusionsprotein mit einem napDNAbp.
Fachleute wissen, dass reverse Transkriptasen des Wildtyps, einschließlich unter anderem Moloney Murines Leukämievirus (M-MLV); reverse Transkriptase des Humanen Immundefizienz-Virus (HIV) und reverse Transkriptase des Aviären Sarkom-Leukose-Virus (ASLV), die unter anderem die reverse Transkriptase des Rous-Sarkom-Virus (RSV), reverse Transkriptase des Aviären Myeloblastose-Virus (AMV), reverse Transkriptase des Aviären Erythroblastose-Virus (AEV) Helfervirus MCAV, reverse Transkriptase des Aviären Myelozytomatose-Virus MC29 Helfervirus MCAV, reverse Transkriptase des Aviären Retikuloendotheliose-Virus (REV-T) Helfervirus REV-A, reverse Transkriptase des Aviären Sarkom-Virus UR2 Helfervirus UR2AV, reverse Transkriptase des Aviären Sarkom-Virus Y73 Helfervirus YAV, reverse Transkriptase des Rous-Assoziierten Virus (RAV) und reverse Transkriptase des Myeloblastose-Assoziierten Virus (MAV) beinhaltet, in den hierin beschriebenen Verfahren und Zusammensetzungen verwendet werden können.

Beispiele für Wildtyp-RT-Enzyme sind die folgenden:

BESCHREIBUNG	SEQUENZ
REVERSE TRANSKRIPTASE (M-MLV RT) WILDTYP

MOLONEY-MAUS- LEUKÄMIE-VIRUS

VERWENDET IN PE1 (PRIME- EDITOR 1 FUSIONSPROTEIN, HIERIN OFFENBART)
REVERSE TRANSKRIPTASE

MOLONEY-MAUS- LEUKÄMIE-VIRUS

REF-SEQ. AAA66622.1
REVERSE TRANSKRIPTASE

FELINES LEUKÄMIE-VIRUS

REF-SEQ. NP955579.1
REVERSE TRANSKRIPTASE

HIV-1 RT, KETTE A

REF-SEQ. ITL3-A
REVERSE TRANSKRIPTASE

HIV-1 RT, KETTE B

REF-SEQ. ITL3-B
REVERSE TRANSKRIPTASE

ROUS-SARKOM- VIRUS RT

REF-SEQ. ACL 14945
REVERSE TRANSKRIPTASE

BLUMENKOHLMOSAIK-VIRUS RT

REF-SEQ. AGT42196
REVERSE TRANSKRIPTASE

KLEBSIELLA PNEUMONIA

REF-SEQ. RFF81513.1
REVERSE TRANSKRIPTASE

BACILLUS SUBTILIS RT
REF-SEQ. QBJ66766
EUBACTERIUM REKTALE GRUPPE II INTRON RT

GEOBACILLUS STEAROTHERMOP HILUS GRUPPE II INTRON RT

Abweichende undfehleranfällige RTs
Reverse Transkriptasen sind für die Synthese komplementärer DNA-Stränge (cDNA) aus RNA-Templaten unerlässlich. Reverse Transkriptasen sind Enzyme, die aus verschiedenen Domänen bestehen, die unterschiedliche biochemische Aktivitäten aufweisen. Die Enzyme katalysieren die Synthese von DNA aus einem RNA-Templat wie folgt: In Anwesenheit eines hybridisierten Primers bindet die reverse Transkriptase an ein RNA-Templat und leitet die Polymerisationsreaktion ein. Die RNA-abhängige DNA-Polymerase-Aktivität synthetisiert den komplementären DNA-Strang (cDNA) unter Einbindung von dNTPs. Die RNase-H- Aktivität baut das RNA-Templat des DNA:RNA-Komplexes ab. Reverse Transkriptasen umfassen also (a) eine Bindungsaktivität, die ein RNA/DNA-Hybrid erkennt und daran bindet, (b) eine RNA-abhängige DNA-Polymerase-Aktivität und (c) eine RNase-H-Aktivität. Darüber hinaus weisen reverse Transkriptasen im Allgemeinen verschiedene Eigenschaften auf, die ihre Thermostabilität, Prozessivität (dNTP-Einbaurate) und Verlässlichkeit (oder Fehlerrate) beinhalten. Die hierin in Betracht gezogenen Varianten der reversen Transkriptase können alle Mutationen der reversen Transkriptase beinhalten, die eine oder mehrere dieser enzymatischen Aktivitäten (z. B. RNA-abhängige DNA-Polymerase-Aktivität, RNase-H-Aktivität oder DNA/RNA-Hybridbindungsaktivität) oder Enzymeigenschaften (z. B. Thermostabilität, Prozessivität oder Verlässlichkeit) beeinflussen oder verändern. Derartige Varianten können allgemein verfügbar sein, im Handel erhältlich sein oder mit Hilfe bekannter Verfahren der Mutagenese, einschließlich gerichteter Evolutionsprozesse (z. B. PACE oder PANCE), hergestellt werden.
In verschiedenen Ausführungsformen kann die reverse Transkriptase eine Variante der reversen Transkriptase sein. Wie hierin verwendet, umfasst eine „Variante der reversen Transkriptase“ jede natürlich vorkommende oder gentechnisch hergestellte Variante, die eine oder mehrere Mutationen (einschließlich singulärer Mutationen, Inversionen, Deletionen, Insertionen und Umlagerungen) im Vergleich zu einer Referenzsequenz (z. B. einer Referenz- Wildtyp-Sequenz) beinhaltet. RT weisen natürlicherweise mehrere Aktivitäten auf, die eine RNA-abhängige DNA-Polymerase-Aktivität, eine Ribonuklease-H-Aktivität und eine DNA- abhängige DNA-Polymerase-Aktivität beinhalten. Zusammengenommen ermöglichen diese Aktivitäten dem Enzym, einzelsträngige RNA in doppelsträngige cDNA umzuwandeln. In Retroviren und Retrotransposons kann diese cDNA dann in das Wirtsgenom integriert werden, aus dem durch Transkription in der Wirtszelle neue RNA-Kopien hergestellt werden können. RT-Varianten können eine Mutation umfassen, die sich auf eine oder mehrere dieser Aktivitäten auswirkt (entweder reduziert oder verstärkt sie diese Aktivitäten, oder sie schaltet sie ganz aus). Darüber hinaus können RT-Varianten eine oder mehrere Mutationen umfassen, die die RT mehr oder weniger stabil machen, weniger anfällig für Aggregation sind, die Reinigung und/oder Erkennung erleichtern und/oder andere Modifikationen von Eigenschaften oder Merkmalen bewirken.
Fachleute wissen, dass Varianten reverser Transkriptasen, die von anderen reversen Transkriptasen abgeleitet sind, einschließlich unter anderem Moloney Murines Leukämie- Virus (M-MLV); reverse Transkriptase des Humanen Immundefizienz-Virus (HIV) und reverse Transkriptase des Aviären Sarkom-Leukose-Virus (ASLV), die unter anderem die reverse Transkriptase des Rous-Sarkom-Virus (RSV), reverse Transkriptase des Aviären Myeloblastose-Virus (AMV), reverse Transkriptase des Aviären Erythroblastose-Virus (AEV), reverse Transkriptase des Aviären Myelozytomatose-Virus MC29, reverse Transkriptase des Aviären Retikuloendotheliose-Virus (REV-T) Helper-Virus REV-A, reverse Transkriptase des Aviären Sarkom-Virus UR2 Helfervirus UR2AV, reverse Transkriptase das Aviären Sarkom-Virus Y73 Helfervirus YAV, reverse Transkriptase des Rous-Assoziierten Virus (RAV) und reverse Transkriptase des Myeloblastose-Assoziierten Virus (MAV) beinhaltet, in den hierin beschriebenen Verfahren und Zusammensetzungen verwendet werden können.
Ein Verfahren zur Herstellung von RT-Varianten ist die genetische Modifikation (z. B. durch Modifizierung der DNA-Sequenz einer Wildtyp-Reverse-Transkriptase). In der Technik sind eine Reihe von Verfahren bekannt, die sowohl die zufällige als auch die gezielte Mutation von DNA-Sequenzen erlauben (siehe zum Beispiel Ausubel et. al. Short Protocols in Molecular Biology (1995) 3.sup.rd Ed. John Wiley & Sons, Inc.). Darüber hinaus gibt es eine Reihe von kommerziell erhältlichen Kits für die ortsgerichtete Mutagenese, die sowohl konventionelle als auch PCR-basierte Verfahren beinhalten. Beispiele beinhalten die QuikChange Site-Directed Mutagenesis Kits (AGILENT®), das Q5^® Site-Directed Mutagenesis Kit (NEW ENGLAND BIOLABS®) und das GeneArt™ Site-Directed Mutagenesis System (THERMOFISHER SCIENTIFIC®).
Darüber hinaus können mutierte reverse Transkriptasen durch Insertionsmutation oder Trunkierung (N-terminale, interne oder C-terminale Insertionen oder Trunkierungen) gemäß den einem Fachmann bekannten Verfahren erzeugt werden. Der Begriff „Mutation“, wie er hierin verwendet wird, bezieht sich auf die Substitution eines Restes innerhalb einer Sequenz, z. B. einer Nukleinsäure- oder Aminosäuresequenz, durch einen anderen Rest oder eine Deletion oder Insertion eines oder mehrerer Reste innerhalb einer Sequenz. Mutationen werden hierin in der Regel durch Angabe des ursprünglichen Restes, gefolgt von der Position des Restes innerhalb der Sequenz und der Identität des neu substituierten Restes beschrieben. Verschiedene Verfahren zur Durchführung der hierin bereitgestellten Aminosäuresubstitutionen (Mutationen) sind in der Fachwelt wohlbekannt und werden zum Beispiel von Green und Sambrook, Molecular Cloning bereitgestellt: A Laboratory Manual (4. Aufl., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (2012)). Mutationen können eine Vielzahl von Kategorien beinhalten, wie etwa Einzelbasen-Polymorphismen, Mikroduplikationsregionen, Indel und Inversionen, und sind in keiner Weise als einschränkend zu verstehen. Mutationen können „loss-of-function“-Mutationen beinhalten, die das normale Ergebnis einer Mutation sind, die eine Proteinaktivität reduziert oder aufhebt. Die meisten „loss-of-function“-Mutationen sind rezessiv, da bei einem Heterozygoten die zweite Chromosomenkopie eine nicht mutierte Version des Gens trägt, die für ein voll funktionsfähiges Protein kodiert, dessen Vorhandensein die Wirkung der Mutation ausgleicht. Mutationen umfassen auch „gain-of-function“-Mutationen, d. h. Mutationen, die einem Protein oder einer Zelle eine abnorme Aktivität verleihen, die im Normalzustand nicht vorhanden ist. Viele gain-of-function-Mutationen befinden sich in regulatorischen Sequenzen und nicht in codierenden Regionen und können daher eine Reihe von Konsequenzen haben. Zum Beispiel kann eine Mutation dazu führen, dass ein oder mehrere Gene in den falschen Geweben exprimiert werden und diese Gewebe Funktionen erhalten, die ihnen normalerweise fehlen. Aufgrund ihrer Natur sind gain-of-function-Mutationen in der Regel dominant.
Ältere Verfahren der ortsgerichteten Mutagenese beruhen auf der Subklonierung der zu mutierenden Sequenz in einen Vektor, wie etwa einen M13-Bakteriophagenvektor, der die Isolierung eines einzelsträngigen DNA-Templats ermöglicht. Bei diesen Verfahren wird ein mutagener Primer (d. h. ein Primer, der in der Lage ist, an die zu mutierende Stelle zu binden, aber ein oder mehrere Nukleotide mit Diskrepanz an der zu mutierenden Stelle trägt) an das einzelsträngige Templat gebunden und dann das Komplement des Templats ausgehend vom 3'-Ende des mutagenen Primers polymerisiert. Die resultierenden Duplexe werden dann in Wirtsbakterien transformiert und die Plaques auf die gewünschte Mutation untersucht.
In jüngerer Zeit werden bei der ortsgerichteten Mutagenese PCR-Verfahren eingesetzt, die den Vorteil haben, dass sie kein einzelsträngiges Templat benötigen. Darüber hinaus wurden Verfahren entwickelt, die keine Subklonierung erfordern. Beim Ausführen der PCR- basierten ortsgerichteten Mutagenese müssen mehrere Aspekte berücksichtigt werden. Erstens ist es bei diesen Verfahren wünschenswert, die Anzahl der PCR-Zyklen zu reduzieren, um die Ausbreitung unerwünschter, von der Polymerase eingeführter Mutationen zu verhindern. Zweitens muss eine Selektion durchgeführt werden, um die Anzahl der nicht mutierten Elternmoleküle zu reduzieren, die in der Reaktion verbleiben. Drittens wird ein PCR-Verfahren mit verlängerter Länge bevorzugt, um die Verwendung eines einzigen PCR-Primersatzes zu ermöglichen. Und viertens ist es aufgrund der nicht-templat-abhängigen terminalen Verlängerungsaktivität einiger thermostabiler Polymerasen häufig erforderlich, vor der Ligation des durch PCR erzeugten Mutantenprodukts am stumpfen Ende einen Endpolierschritt in das Verfahren einzubauen.
Verfahren der Zufallsmutagenese, die zu einer Gruppe von Mutanten führen, die eine oder mehrere zufällig angeordnete Mutationen tragen, sind in der Technik bekannt. Ein solches Panel von Mutanten kann dann auf diejenigen untersucht werden, die die gewünschten Eigenschaften aufweisen, zum Beispiel eine erhöhte Stabilität im Vergleich zu einer Wildtyp- Reversen-Transkriptase.
Ein Beispiel für ein Verfahren zur Zufallsmutagenese ist das sogenannte „fehleranfällige PCR-Verfahren“. Wie der Name schon sagt, wird bei diesem Verfahren eine bestimmte Sequenz unter Bedingungen amplifiziert, unter denen die DNA-Polymerase nicht mit hoher Verlässlichkeit eingebaut werden kann. Obwohl die Bedingungen, die einen fehleranfälligen Einbau begünstigen, für verschiedene DNA-Polymerasen unterschiedlich sind, kann ein Fachmann solche Bedingungen für ein bestimmtes Enzym bestimmen. Eine Schlüsselvariable für die Verlässlichkeit der Amplifikation ist für viele DNA-Polymerasen zum Beispiel die Art und Konzentration des zweiwertigen Metallions im Puffer. Die Verwendung von Mangan-Ionen und/oder die Variation der Magnesium- oder Mangan-IonenKonzentration kann daher zur Beeinflussung der Fehlerrate der Polymerase eingesetzt werden.
Unter verschiedenen Aspekten kann die RT des Multi-Flap-Prime-Editors eine „fehleranfällige“ Variante der reversen Transkriptase sein. Fehleranfällige reverse Transkriptasen, die in der Technik bekannt und/oder verfügbar sind, können verwendet werden. Reverse Transkriptasen weisen naturgemäß keine Korrekturlesefunktion auf; daher ist die Fehlerrate von reversen Transkriptasen im Allgemeinen höher als die von DNA- Polymerasen, die eine Korrekturleseaktivität aufweisen. Die Fehlerrate einer bestimmten reversen Transkriptase ist eine Eigenschaft der „Verlässlichkeit“ des Enzyms, die die Genauigkeit der vom Templat gesteuerten Polymerisation der DNA gegen ihr RNA-Templat darstellt. Eine RT mit hoher Verlässlichkeit weist eine niedrige Fehlerrate auf. Umgekehrt weist eine RT mit geringer Verlässlichkeit eine hohe Fehlerrate auf. Die Verlässlichkeit von M-MLV-basierten reversen Transkriptasen weist Berichten zufolge eine Fehlerrate im Bereich von einem Fehler auf 15.000 bis 27.000 synthetisierte Nukleotide auf. Siehe Boutabout et al. „DNA synthesis fidelity by the reverse transcriptase of the yeast retrotransposon Ty1 ", Nucleic Acids Res, 2001, 29: 2217-2222, das durch Bezugnahme aufgenommen wird. Für die Zwecke dieser Anmeldung werden also diejenigen reversen Transkriptasen als „fehleranfällig“ oder mit einer „fehleranfälligen Verlässlichkeit“ betrachtet, die eine Fehlerrate von weniger als einem Fehler auf 15.000 synthetisierte Nukleotide aufweisen.
Fehleranfällige reverse Transkriptase kann auch durch Mutagenese eines Ausgangs- RT-Enzyms (z. B. eines Wildtyp-M-MLV-RT) erzeugt werden. Das Verfahren der Mutagenese ist nicht eingeschränkt und kann gerichtete Evolutionsprozesse beinhalten, wie etwa die phagengestützte kontinuierliche Evolution (PACE) oder die phagengestützte nicht- kontinuierliche Evolution (PANCE). Der hierin verwendete Begriff „phagengestützte kontinuierliche Evolution (PACE)“ bezieht sich auf eine kontinuierliche Evolution, bei der Phagen als virale Vektoren eingesetzt werden. Das allgemeine Konzept der PACE-Technologie wurde beispielsweise beschrieben in der internationalen PCT-Anmeldung PCT/US2009/056194, eingereicht am 8. September 2009, veröffentlicht als WO 2010/028347 am 11. März 2010; der internationalen PCT-Anmeldung PCT/US2011/066747, eingereicht am 22. Dezember 2011, veröffentlicht als WO 2012/088381 am 28. Juni 2012; der US-Anmeldung US-Patent Nr. 9,023,594 , ausgestellt am 5. Mai 2015, der internationalen PCT-Anmeldung, PCT/US2015/012022, eingereicht am 20. Januar 2015, veröffentlicht als WO 2015/134121 am 11. September 2015, und der internationalen PCT-Anmeldung, PCT/US2016/027795, eingereicht am 15. April 2016, veröffentlicht als WO 2016/168631 am 20. Oktober 2016, deren gesamter Inhalt hierin durch Bezugnahme aufgenommen sind.
Fehleranfällige reverse Transkriptasen können auch durch phagengestützte nicht- kontinuierliche Evolution (PANCE) erhalten werden, was sich hierin auf nicht-kontinuierliche Evolution bezieht, bei der Phagen als virale Vektoren eingesetzt werden. PANCE ist eine vereinfachte Technik für die schnelle gerichtete In-vivo-Evolution, bei der serielle Kolbenübertragungen von evolvierenden „Selektionsphagen“ (SP), die ein zu evolvierendes Gen von Interesse enthalten, über frische E. coli-Wirtszellen erfolgen, wodurch die Gene in den E. coli-Wirtszellen konstant gehalten werden können, während die in den SP enthaltenen Gene kontinuierlich evolvieren. Serielle Kolbenübertragungen sind seit langem ein weithin zugänglicher Ansatz für die Laborevolution von Mikroben, und in jüngerer Zeit wurden analoge Ansätze für die Bakteriophagenevolution entwickelt. Das PANCE-System weist eine geringere Stringenz auf als das PACE-System.
Andere fehleranfällige reverse Transkriptasen sind in der Literatur beschrieben worden, die alle für die Verwendung in den hierin beschriebenen Verfahren und Zusammensetzungen in Betracht kommen. Zum Beispiel sind fehleranfällige reverse Transkriptasen beschrieben worden in Bebenek et al. „Error-prone Polymerization by HIV-1 Reverse Transcriptase", JBiol Chem, 1993, Vol. 268: 10324-10334, und Sebastian-Martin et al. „Transcriptional inaccuracy threshold attenuates differences in RNA-dependent DNA synthesis fidelity between retroviral reverse transcriptases", Scientific Reports, 2018, Vol. 8: 627, die jeweils durch Bezugnahme aufgenommen sind. Ferner können reverse Transkriptasen, einschließlich fehleranfälliger reverser Transkriptasen, von einem kommerziellen Anbieter bezogen werden, einschließlich ProtoScript® (II) Reverse Transcriptase, AMV Reverse Transcriptase, WarmStart® Reverse Transcriptase und M-MuLV Reverse Transcriptase, alle von NEW ENGLAND BIOLABS®, oder AMV Reverse Transcriptase XL, SMARTScribe Reverse Transcriptase, GPR ultra-pure MMLV Reverse Transcriptase, alle von TAKARA BIO USA, INC. (ehemals CLONTECH).
Die Offenbarung hierin bezieht sich auch auf reverse Transkriptasen, die Mutationen in der RNaseH-Domäne aufweisen. Wie bereits erwähnt, ist eine der intrinsischen Eigenschaften von reversen Transkriptasen die RNase-H-Aktivität, die das RNA-Templat des RNA:cDNA-Hybrids gleichzeitig mit der Polymerisation spaltet. Die RNase-H-Aktivität kann bei der Synthese langer cDNAs unerwünscht sein, da das RNA-Templat vor Abschluss der reversen Transkription in voller Länge abgebaut werden kann. Die RNase-H-Aktivität kann auch die Effizienz der reversen Transkription verringern, vermutlich aufgrund ihrer Konkurrenz mit der Polymeraseaktivität des Enzyms. Die vorliegende Offenbarung bezieht sich daher auf alle Varianten der reversen Transkriptase, die eine modifizierte RNase-H- Aktivität umfassen.
Die Offenbarung hierin bezieht sich auch auf reverse Transkriptasen, die Mutationen in der RNA-abhängigen DNA-Polymerase-Domäne aufweisen. Wie bereits erwähnt, ist eine der intrinsischen Eigenschaften von reversen Transkriptasen die RNA-abhängige DNA- Polymerase-Aktivität, die die Nukleobasen in den naszierenden cDNA-Strang einbaut, wie er durch den Templat-Strang des RNA:cDNA-Hybrids kodiert ist. Die Aktivität der RNA- abhängigen DNA-Polymerase kann erhöht oder verringert werden (d. h. in Bezug auf ihre Einbaurate), um die Prozessivität des Enzyms zu erhöhen oder zu verringern. Die vorliegende Offenbarung bezieht sich somit auf alle Varianten der reversen Transkriptase, die eine modifizierte RNA-abhängige DNA-Polymerase-Aktivität umfassen, wie etwa eine erhöhte oder verringerte Prozessivität des Enzyms im Vergleich zu einer unmodifizierten Version.
Hierin eingeschlossen sind auch Varianten der reversen Transkriptase, die veränderte Thermostabilitätseigenschaften aufweisen. Die Fähigkeit einer reversen Transkriptase, hohen Temperaturen zu widerstehen, ist ein wichtiger Aspekt der cDNA-Synthese. Erhöhte Reaktionstemperaturen tragen dazu bei, RNA mit starken Sekundärstrukturen und/oder hohem GC-Gehalt zu denaturieren, so dass reverse Transkriptasen die Sequenz durchlesen können. Infolgedessen ermöglicht die reverse Transkription bei höheren Temperaturen die Synthese von cDNA in voller Länge und eine höhere Ausbeute, was zu einer verbesserten Erzeugung der 3'-Flap-sDNA als Ergebnis des Multi-Flap-Prime-Editing-Prozesses führen kann. Die reverse Transkriptase des Wildtyps von M-MLV weist in der Regel eine optimale Temperatur im Bereich von 37-48 °C auf; es können jedoch Mutationen eingeführt werden, die die reverse Transkriptionsaktivität bei höheren Temperaturen als 48°C ermöglichen, die 49 °C, 50 °C, 51 °C, 52 °C, 53 °C, 54 °C, 55 °C, 56 °C, 57 °C, 58 °C, 59 °C, 60 °C, 61 °C, 62 °C, 63 °C,64 °C,65 °C,66 °C und höher beinhalten.
Die hierin in Betracht gezogenen Varianten reverser Transkriptasen, einschließlich fehleranfälliger RTs, thermostabiler RTs und RTs mit erhöhter Prozessivität, können durch verschiedene Routinestrategien, einschließlich Mutagenese oder evolutionäre Prozesse, hergestellt werden. In einigen Fällen können die Varianten durch Einführung einer einzigen Mutation hergestellt werden. In anderen Fällen können die Varianten mehr als eine Mutation erfordern. Bei denjenigen Mutanten, die mehr als eine Mutation umfassen, kann die Wirkung einer bestimmten Mutation, die die jeweilige Mutante trägt, durch Einbringen der identifizierten Mutation in das Wildtyp-Gen durch ortsgerichtete Mutagenese isoliert von den anderen Mutationen bewertet werden. Screening-Tests mit der so erzeugten einzelnen Mutante ermöglichen dann die Bestimmung der Wirkung dieser Mutation allein.
Die hierin verwendeten RT-Varianten können auch andere „RT-Varianten“ beinhalten, die mindestens etwa 70 % identisch, mindestens etwa 80 % identisch, mindestens etwa 90 % identisch, mindestens etwa 95 % identisch, mindestens etwa 96 % identisch, mindestens etwa 97 % identisch, mindestens etwa 98 % identisch, mindestens etwa 99 % identisch, mindestens etwa 99,5 % identisch oder mindestens etwa 99,9 % identisch mit einem beliebigen RT- Referenzprotein sind, einschließlich aller RT-Wildtypen oder RT-Mutanten oder RT- Fragmente oder anderer RT-Varianten, die hierin offenbart oder in Betracht gezogen werden oder in der Technik bekannt sind.
In einigen Ausführungsformen kann eine RT-Variante 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 21, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50 oder bis zu 100, oder bis zu 200, oder bis zu 300, oder bis zu 400, oder bis zu 500 oder mehr Aminosäureänderungen im Vergleich zu einer Referenz-RT aufweisen. In einigen Ausführungsformen umfasst die RT-Variante ein Fragment einer Referenz-RT, wie etwa, dass das Fragment zu mindestens etwa 70 % identisch, zu mindestens etwa 80 % identisch, zu mindestens etwa 90 % identisch, zu mindestens etwa 95 % identisch, zu mindestens etwa 96 % identisch, zu mindestens etwa 97 % identisch, zu mindestens etwa 98 % identisch, zu mindestens etwa 99 % identisch, zu mindestens etwa 99,5 % identisch oder zu mindestens etwa 99,9 % identisch mit dem entsprechenden Fragment der Referenz-RT ist. In einigen Ausführungsformen ist das Fragment mindestens 30 %, mindestens 35 %, mindestens 40 %, mindestens 45 %, mindestens 50 %, mindestens 55 %, mindestens 60 %, mindestens 65 %, mindestens 70 %, mindestens 75 %, mindestens 80 %, mindestens 85 %, mindestens 90 %, mindestens 95 % identisch, mindestens 96 %, mindestens 97 %, mindestens 98 %, mindestens 99 % oder mindestens 99,5 % der Aminosäurelänge einer entsprechenden Wildtyp-RT (M-MLV-Reverse Transkriptase) (z. B. SEQ-ID-NR: 89) oder zu einer der reversen Transkriptasen der SEQ-ID-NR: 90-100.
In einigen Ausführungsformen können im Rahmen der Offenbarung auch RT- Fragmente verwendet werden, die ihre Funktionalität beibehalten und die Fragmente beliebiger hierin offenbarer RT-Proteine sind. In einigen Ausführungsformen hat das RT-Fragment eine Länge von mindestens 100 Aminosäuren. In einigen Ausführungsformen hat das Fragment eine Länge von mindestens 100, 150, 200, 250, 300, 350, 400, 450, 500, 550 oder bis zu 600 oder mehr Aminosäuren.
In noch anderen Ausführungsformen kann die Offenbarung auch RT-Varianten verwenden, die am N-Terminus oder am C-Terminus oder an beiden um eine bestimmte Anzahl von Aminosäuren trunkiert sind, was zu einer trunkierten Variante führt, die noch eine ausreichende Polymerasefunktion beibehält. In einigen Ausführungsformen weist die RT- trunkierte Variante eine Trunkierung von mindestens 1, mindestens 2, mindestens 3, mindestens 4, mindestens 5, mindestens 6, mindestens 7, mindestens 8, mindestens 9, mindestens 10, mindestens 11, mindestens 12, mindestens 13, mindestens 14, mindestens 15, mindestens 16, mindestens 17, mindestens 18, mindestens 19, mindestens 20, mindestens 21, mindestens 22, mindestens 23, mindestens 24, mindestens 25, mindestens 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 210, 220, 230, 240, oder 250 Aminosäuren am N-terminalen Ende des Proteins auf. In anderen Ausführungsformen weist die RT-trunkierte Variante eine Trunkierung von mindestens 1, mindestens 2, mindestens 3, mindestens 4, mindestens 5, mindestens 6, mindestens 7, mindestens 8, mindestens 9, mindestens 10, mindestens 11, mindestens 12, mindestens 13, mindestens 14, mindestens 15, mindestens 16, mindestens 17, mindestens 18, mindestens 19, mindestens 20, mindestens 21, mindestens 22, mindestens 23, mindestens 24, mindestens 25, mindestens 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 210, 220, 230, 240, oder 250 Aminosäuren am N-terminalen Ende des Proteins auf. In noch anderen Ausführungsformen weist die RT-trunkierte Variante eine Trunkierung am N-terminalen und am C-terminalen Ende auf, die gleich oder unterschiedlich lang sind.
Zum Beispiel können die hierin offenbarten Multi-Flap-Prime-Editoren eine trunkierte Version der reversen Transkriptase von M-MLV beinhalten. In dieser Ausführungsform enthält die reverse Transkriptase 4 Mutationen (D200N, T306K, W313F, T330P; wobei zu beachten ist, dass die in PE2 vorhandene L603W-Mutation aufgrund des Trunkierens nicht mehr vorhanden ist). Die DNA-Sequenz, die diesen trunkierten Editor kodiert, ist 522 bp kleiner als PE2 und eignet sich daher für Anwendungen, bei denen die Übertragung der DNA-Sequenz aufgrund ihrer Größe eine Herausforderung darstellt (z. B. bei der Übertragung von Adenoassoziierten Viren und Lentiviren). Diese Ausführungsform wird als MMLV-RT(trunc) bezeichnet und weist die folgende Aminosäuresequenz auf

MMLV- RT(TRUNC)
In verschiedenen Ausführungsformen können die hierin offenbaren Multi-Flap-Prime- Editoren eine der hierin beschriebenen RT-Varianten oder eine RT-Variante davon umfassen, die mindestens etwa 70 % identisch, mindestens etwa 80 % identisch, mindestens etwa 90 % identisch, mindestens etwa 95 % identisch, mindestens etwa 96 % identisch, mindestens etwa 97 % identisch, mindestens etwa 98 % identisch, mindestens etwa 99 % identisch, mindestens etwa 99,5 % identisch oder mindestens etwa 99,9 % identisch mit beliebigen Referenz-Cas9- Varianten aufweist.
In noch anderen Ausführungsformen können die vorliegenden Verfahren und Zusammensetzungen eine DNA-Polymerase verwenden, die zu einer reversen Transkriptase evolviert wurde, wie in Effefson et al. „Synthetic evolutionary origin of a proofreading reverse transcriptase“, Science, June 24, 2016, Vol. 352: 1590-1593 beschrieben, deren Inhalt hierin durch Bezugnahme aufgenommen ist.
In bestimmten anderen Ausführungsformen wird die reverse Transkriptase als eine Komponente eines Fusionsproteins bereitgestellt, das auch ein napDNAbp umfasst. Mit anderen Worten, in einigen Ausführungsformen ist die reverse Transkriptase mit einem napDNAbp als Fusionsprotein fusioniert.
In verschiedenen Ausführungsformen können reverse Transkriptase-Varianten aus der M-MLV-Wildtyp-Reverse-Transkriptase entwickelt werden, dargestellt durch SEQ-ID-NR: 89.
In verschiedenen Ausführungsformen können die hierin beschriebenen Multi-Flap- Prime-Editoren (mit RT, die entweder als Fusionspartner oder in trans bereitgestellt wird) eine RT-Variante beinhalten, die eine oder mehrere der folgenden Mutationen umfasst: P51L, S67K, E69K, L139P, T197A, D200N, H204R, F209N, E302K, E302R, T306K, F309N, W313F, T330P, L345G, L435G, N454K, D524G, E562Q, D583N, H594Q, L603W, E607K oder D653N in der Wildtyp-M-MLV-RT von SEQ-ID-NR: 89 oder an einer entsprechenden Aminosäureposition in einer anderen Wildtyp-RT-Polypeptidsequenz.

Einige beispielhafte reverse Transkriptasen, die gemäß verschiedener Ausführungsformen dieser Offenbarung an napDNAbp-Proteine fusioniert oder als einzelne Proteine bereitgestellt werden können, werden im Folgenden bereitgestellt. Beispielhafte reverse Transkriptasen beinhalten Varianten mit mindestens 80 %, mindestens 85 %, mindestens 90 %, mindestens 95 % oder mindestens 99 % Sequenzidentität zu den folgenden Wildtyp-Enzymen oder Teilenzymen:

Beschreibung	Sequenz (Varianten-Substitutionen im Vergleich zum Wildtyp)
Reverse Transkriptase (M-MLV RT) Wildtyp

Moloney Murines Leukämie- Virus

Verwendet in PE1 (Prime- Editor 1 Fusionsprotein, hierin offenbart)
M-MLV RT D200N

M-MLV RT D200N T330P
M-MLV RT D200N T330P L603W
M-MLV RT D200N T330P L603W E69K
M-MLV RT D200N T330P L603 W E302R
M-MLV RT D200N T330P L603 W E607K
M-MLV RT D200N T330P L603 W L139P
M-MLV RT D200N T330P L603 W L435G

M-MLV RT D200N T330P L603 W N454K
M-MLV RT D200N T330P L603 W T306K
M-MLV RT D200N T330P L603 W W313F
M-MLV RT D200N T330P L603 W D524G
E562Q D583N
M-MLV RT D200N T330P L603W E302R W313F
M-MLV RT D200N T330P L603 W E607K L139P
M-MLV RT P51L S67K T197A H204R E302K F309N W313F T330P L435G N454K D524G D583N H594Q D653N M-MLV RT D200N P51L S67K T197A
H204R E302K F309N W313F T330P L345G N454K D524G D583N H594Q D653N
M-MLV RT D200N T330P L603 W T306K W313F

in PE2

In verschiedenen anderen Ausführungsformen können die hierin beschriebenen Multi- Flap-Prime-Editoren (mit RT, die entweder als Fusionspartner oder in trans bereitgestellt wird) eine RT-Variante beinhalten, die eine oder mehrere der folgenden Mutationen umfasst: P51X, S67X, E69X, L139X, T197X, D200X, H204X, F209X, E302X, T306X, F309X, W313X, T330X, L345X, L435X, N454X, D524X, E562X, D583X, H594X, L603X, E607X oder D653X in der Wildtyp-M-MLV-RT von SEQ-ID-NR: 89 oder an einer entsprechenden Aminosäureposition in einer anderen Wildtyp-RT-Polypeptidsequenz, wobei „X“ eine beliebige Aminosäure sein kann.
In verschiedenen anderen Ausführungsformen können die hierin beschriebenen Multi- Flap-Prime-Editoren (mit RT, die entweder als Fusionspartner oder in trans bereitgestellt wird) eine RT-Variante beinhalten, die eine P51X-Mutation in der Wildtyp-M-MLV-RT von SEQ- ID-NR: 89 oder an einer entsprechenden Aminosäureposition in einer anderen Wildtyp-RT- Polypeptidsequenz umfasst, wobei „X“ eine beliebige Aminosäure sein kann. In bestimmten Ausführungsformen ist X L.
In verschiedenen anderen Ausführungsformen können die hierin beschriebenen Multi- Flap-Prime-Editoren (mit RT, die entweder als Fusionspartner oder in trans bereitgestellt wird) eine RT-Variante beinhalten, die eine S67X-Mutation in der Wildtyp-M-MLV-RT von SEQ- ID-NR: 89 oder an einer entsprechenden Aminosäureposition in einer anderen Wildtyp-RT- Polypeptidsequenz umfasst, wobei „X“ eine beliebige Aminosäure sein kann. In bestimmten Ausführungsformen ist X K.
In verschiedenen anderen Ausführungsformen können die hierin beschriebenen Multi- Flap-Prime-Editoren (mit RT, die entweder als Fusionspartner oder in trans bereitgestellt wird) eine RT-Variante beinhalten, die eine E69X-Mutation in der Wildtyp-M-MLV-RT von SEQ- ID-NR: 89 oder an einer entsprechenden Aminosäureposition in einer anderen Wildtyp-RT- Polypeptidsequenz umfasst, wobei „X“ eine beliebige Aminosäure sein kann. In bestimmten Ausführungsformen ist X K.
In verschiedenen anderen Ausführungsformen können die hierin beschriebenen Multi- Flap-Prime-Editoren (mit RT, die entweder als Fusionspartner oder in trans bereitgestellt wird) eine RT-Variante beinhalten, die eine L139X-Mutation in der Wildtyp-M-MLV-RT von SEQ- ID-NR: 89 oder an einer entsprechenden Aminosäureposition in einer anderen Wildtyp-RT- Polypeptidsequenz umfasst, wobei „X“ eine beliebige Aminosäure sein kann. In bestimmten Ausführungsformen ist X P.
In verschiedenen anderen Ausführungsformen können die hierin beschriebenen Multi- Flap-Prime-Editoren (mit RT, die entweder als Fusionspartner oder in trans bereitgestellt wird) eine RT-Variante beinhalten, die eine T197X-Mutation in der Wildtyp-M-MLV-RT von SEQ- ID-NR: 89 oder an einer entsprechenden Aminosäureposition in einer anderen Wildtyp-RT- Polypeptidsequenz umfasst, wobei „X“ eine beliebige Aminosäure sein kann. In bestimmten Ausführungsformen ist X A.
In verschiedenen anderen Ausführungsformen können die hierin beschriebenen Multi- Flap-Prime-Editoren (mit RT, die entweder als Fusionspartner oder in trans bereitgestellt wird) eine RT-Variante beinhalten, die eine D200X-Mutation in der Wildtyp-M-MLV-RT von SEQ- ID-NR: 89 oder an einer entsprechenden Aminosäureposition in einer anderen Wildtyp-RT- Polypeptidsequenz umfasst, wobei „X“ eine beliebige Aminosäure sein kann. In bestimmten Ausführungsformen ist X N.
In verschiedenen anderen Ausführungsformen können die hierin beschriebenen Multi- Flap-Prime-Editoren (mit RT, die entweder als Fusionspartner oder in trans bereitgestellt wird) eine RT-Variante beinhalten, die eine H204X-Mutation in der Wildtyp-M-MLV-RT von SEQ- ID-NR: 89 oder an einer entsprechenden Aminosäureposition in einer anderen Wildtyp-RT- Polypeptidsequenz umfasst, wobei „X“ eine beliebige Aminosäure sein kann. In bestimmten Ausführungsformen ist X R.
In verschiedenen anderen Ausführungsformen können die hierin beschriebenen Multi- Flap-Prime-Editoren (mit RT, die entweder als Fusionspartner oder in trans bereitgestellt wird) eine RT-Variante beinhalten, die eine F209X-Mutation in der Wildtyp-M-MLV-RT von SEQ- ID-NR: 89 oder an einer entsprechenden Aminosäureposition in einer anderen Wildtyp-RT- Polypeptidsequenz umfasst, wobei „X“ eine beliebige Aminosäure sein kann. In bestimmten Ausführungsformen ist X N.
In verschiedenen anderen Ausführungsformen können die hierin beschriebenen Multi- Flap-Prime-Editoren (mit RT, die entweder als Fusionspartner oder in trans bereitgestellt wird) eine RT-Variante beinhalten, die eine E302X-Mutation in der Wildtyp-M-MLV-RT von SEQ- ID-NR: 89 oder an einer entsprechenden Aminosäureposition in einer anderen Wildtyp-RT- Polypeptidsequenz umfasst, wobei „X“ eine beliebige Aminosäure sein kann. In bestimmten Ausführungsformen ist X K.
In verschiedenen anderen Ausführungsformen können die hierin beschriebenen Multi- Flap-Prime-Editoren (mit RT, die entweder als Fusionspartner oder in trans bereitgestellt wird) eine RT-Variante beinhalten, die eine E302X-Mutation in der Wildtyp-M-MLV-RT von SEQ- ID-NR: 89 oder an einer entsprechenden Aminosäureposition in einer anderen Wildtyp-RT- Polypeptidsequenz umfasst, wobei „X“ eine beliebige Aminosäure sein kann. In bestimmten Ausführungsformen ist X R.
In verschiedenen anderen Ausführungsformen können die hierin beschriebenen Multi- Flap-Prime-Editoren (mit RT, die entweder als Fusionspartner oder in trans bereitgestellt wird) eine RT-Variante beinhalten, die eine T306X-Mutation in der Wildtyp-M-MLV-RT von SEQ- ID-NR: 89 oder an einer entsprechenden Aminosäureposition in einer anderen Wildtyp-RT- Polypeptidsequenz umfasst, wobei „X“ eine beliebige Aminosäure sein kann. In bestimmten Ausführungsformen ist X K.
In verschiedenen anderen Ausführungsformen können die hierin beschriebenen Multi- Flap-Prime-Editoren (mit RT, die entweder als Fusionspartner oder in trans bereitgestellt wird) eine RT-Variante beinhalten, die eine F309X-Mutation in der Wildtyp-M-MLV-RT von SEQ- ID-NR: 89 oder an einer entsprechenden Aminosäureposition in einer anderen Wildtyp-RT- Polypeptidsequenz umfasst, wobei „X“ eine beliebige Aminosäure sein kann. In bestimmten Ausführungsformen ist X N.
In verschiedenen anderen Ausführungsformen können die hierin beschriebenen Multi- Flap-Prime-Editoren (mit RT, die entweder als Fusionspartner oder in trans bereitgestellt wird) eine RT-Variante beinhalten, die eine W313X-Mutation in der Wildtyp-M-MLV-RT von SEQ- ID-NR: 89 oder an einer entsprechenden Aminosäureposition in einer anderen Wildtyp-RT- Polypeptidsequenz umfasst, wobei „X“ eine beliebige Aminosäure sein kann. In bestimmten Ausführungsformen ist X F.
In verschiedenen anderen Ausführungsformen können die hierin beschriebenen Multi- Flap-Prime-Editoren (mit RT, die entweder als Fusionspartner oder in trans bereitgestellt wird) eine RT-Variante beinhalten, die eine T330X-Mutation in der Wildtyp-M-MLV-RT von SEQ- ID-NR: 89 oder an einer entsprechenden Aminosäureposition in einer anderen Wildtyp-RT- Polypeptidsequenz umfasst, wobei „X“ eine beliebige Aminosäure sein kann. In bestimmten Ausführungsformen ist X P.
In verschiedenen anderen Ausführungsformen können die hierin beschriebenen Multi- Flap-Prime-Editoren (mit RT, die entweder als Fusionspartner oder in trans bereitgestellt wird) eine RT-Variante beinhalten, die eine L345X-Mutation in der Wildtyp-M-MLV-RT von SEQ- ID-NR: 89 oder an einer entsprechenden Aminosäureposition in einer anderen Wildtyp-RT- Polypeptidsequenz umfasst, wobei „X“ eine beliebige Aminosäure sein kann. In bestimmten Ausführungsformen ist X G.
In verschiedenen anderen Ausführungsformen können die hierin beschriebenen Multi- Flap-Prime-Editoren (mit RT, die entweder als Fusionspartner oder in trans bereitgestellt wird) eine RT-Variante beinhalten, die eine L435X-Mutation in der Wildtyp-M-MLV-RT von SEQ- ID-NR: 89 oder an einer entsprechenden Aminosäureposition in einer anderen Wildtyp-RT- Polypeptidsequenz umfasst, wobei „X“ eine beliebige Aminosäure sein kann. In bestimmten Ausführungsformen ist X G.
In verschiedenen anderen Ausführungsformen können die hierin beschriebenen Multi- Flap-Prime-Editoren (mit RT, die entweder als Fusionspartner oder in trans bereitgestellt wird) eine RT-Variante beinhalten, die eine N454X-Mutation in der Wildtyp-M-MLV-RT von SEQ- ID-NR: 89 oder an einer entsprechenden Aminosäureposition in einer anderen Wildtyp-RT- Polypeptidsequenz umfasst, wobei „X“ eine beliebige Aminosäure sein kann. In bestimmten Ausführungsformen ist X K.
In verschiedenen anderen Ausführungsformen können die hierin beschriebenen Multi- Flap-Prime-Editoren (mit RT, die entweder als Fusionspartner oder in trans bereitgestellt wird) eine RT-Variante beinhalten, die eine D524X-Mutation in der Wildtyp-M-MLV-RT von SEQ- ID-NR: 89 oder an einer entsprechenden Aminosäureposition in einer anderen Wildtyp-RT- Polypeptidsequenz umfasst, wobei „X“ eine beliebige Aminosäure sein kann. In bestimmten Ausführungsformen ist X G.
In verschiedenen anderen Ausführungsformen können die hierin beschriebenen Multi- Flap-Prime-Editoren (mit RT, die entweder als Fusionspartner oder in trans bereitgestellt wird) eine RT-Variante beinhalten, die eine E562X-Mutation in der Wildtyp-M-MLV-RT von SEQ- ID-NR: 89 oder an einer entsprechenden Aminosäureposition in einer anderen Wildtyp-RT- Polypeptidsequenz umfasst, wobei „X“ eine beliebige Aminosäure sein kann. In bestimmten Ausführungsformen ist X Q.
In verschiedenen anderen Ausführungsformen können die hierin beschriebenen Multi- Flap-Prime-Editoren (mit RT, die entweder als Fusionspartner oder in trans bereitgestellt wird) eine RT-Variante beinhalten, die eine D583X-Mutation in der Wildtyp-M-MLV-RT von SEQ- ID-NR: 89 oder an einer entsprechenden Aminosäureposition in einer anderen Wildtyp-RT- Polypeptidsequenz umfasst, wobei „X“ eine beliebige Aminosäure sein kann. In bestimmten Ausführungsformen ist X N.
In verschiedenen anderen Ausführungsformen können die hierin beschriebenen Multi- Flap-Prime-Editoren (mit RT, die entweder als Fusionspartner oder in trans bereitgestellt wird) eine RT-Variante beinhalten, die eine H594X-Mutation in der Wildtyp-M-MLV-RT von SEQ- ID-NR: 89 oder an einer entsprechenden Aminosäureposition in einer anderen Wildtyp-RT- Polypeptidsequenz umfasst, wobei „X“ eine beliebige Aminosäure sein kann. In bestimmten Ausführungsformen ist X Q.
In verschiedenen anderen Ausführungsformen können die hierin beschriebenen Multi- Flap-Prime-Editoren (mit RT, die entweder als Fusionspartner oder in trans bereitgestellt wird) eine RT-Variante beinhalten, die eine L603X-Mutation in der Wildtyp-M-MLV-RT von SEQ- ID-NR: 89 oder an einer entsprechenden Aminosäureposition in einer anderen Wildtyp-RT- Polypeptidsequenz umfasst, wobei „X“ eine beliebige Aminosäure sein kann. In bestimmten Ausführungsformen ist X W.
In verschiedenen anderen Ausführungsformen können die hierin beschriebenen Multi- Flap-Prime-Editoren (mit RT, die entweder als Fusionspartner oder in trans bereitgestellt wird) eine RT-Variante beinhalten, die eine E607X-Mutation in der Wildtyp-M-MLV-RT von SEQ- ID-NR: 89 oder an einer entsprechenden Aminosäureposition in einer anderen Wildtyp-RT- Polypeptidsequenz umfasst, wobei „X“ eine beliebige Aminosäure sein kann. In bestimmten Ausführungsformen ist X K.
In verschiedenen anderen Ausführungsformen können die hierin beschriebenen Multi- Flap-Prime-Editoren (mit RT, die entweder als Fusionspartner oder in trans bereitgestellt wird) eine RT-Variante beinhalten, die eine D653X-Mutation in der Wildtyp-M-MLV-RT von SEQ- ID-NR: 89 oder an einer entsprechenden Aminosäureposition in einer anderen Wildtyp-RT- Polypeptidsequenz umfasst, wobei „X“ eine beliebige Aminosäure sein kann. In bestimmten Ausführungsformen ist X N.

BESCHREIBUNG	SEQUENZ (VARIANTEN-SUBSTITUTIONEN IM VERGLEICH ZUM WILDTYP)
REVERSE TRANSKRIPTASE (M- MLV RT) WILDTYP

MOLONEY MURINES LEUKÄMIE- VIRUS

VERWENDET IN PE1 (PRIME- EDITOR 1 FUSIONSPROTEIN, HIERIN OFFENBART)
M-MLV RT D200N
M-MLV RT D200N T330P
M-MLV RT D200N T330P L603W
M-MLV RT E69K D200N T330P L603W
M-MLV RT D200N T330P L603W E302R
M-MLV RT D200N T330P L603W E607K
M-MLV RT D200N T330P L603W E607K
M-MLV RT D200N T330P L603W L139P
M-MLV RT D200N T330P L603W L435G
M-MLV RT D200N T330P L603W N454K
M-MLV RT D200N T330P L603W T306K

M-MLV RT D200N T330P L603W W313F
M-MLV RT D200N T330P L603W D524G E562Q D583N
M-MLV RT D200N T330P L603W E302R W313F

M-MLV RT D200N T330P L603W E607K L139P
M-MLV RT P51L S67K T197A H204R E302K F309N W313F T330P L435G N454K D524G D583N H594Q D653N
M-MLV RT P51L S67K T197A D200N H204R E302K F309N W313F T330P L345G N454K D524G D583N H594Q D653N
M-MLV RT D200N T330P L603 W T306K W313F

IN PE2

Das hier beschriebene Multi-Flap-Prime-Editor-System kommt für jede beliebige öffentlich verfügbare reverse Transkriptase in Betracht, die in einem der folgenden US-Patente beschrieben oder offenbart ist (die in ihrer Gesamtheit durch Bezugnahme einbezogen sind): US-Patent-Nr: 10,202,658; 10,189,831; 10,150,955; 9,932,567; 9,783,791; 9,580,698; 9,534,201; und 9,458,484, sowie jede beliebige Variante davon, die mit bekannten Verfahren zum Einbauen von Mutationen oder bekannten Verfahren zur Entwicklung von Proteinen hergestellt werden kann. Die folgenden Referenzen beschreiben reverse Transkriptasen in der Technik. Jede ihrer Offenbarungen ist durch Bezugnahme in vollem Umfang hierin aufgenommen.

Herzig, E., Voronin, N., Kucherenko, N. & Hizi, A. A Novel Leu92 Mutant of HIV-1 Reverse Transcriptase with a Selective Deficiency in Strand Transfer Causes a Loss of Viral Replication. J. Virol. 89,8119-8129 (2015).
Mohr, G. et al. A Reverse Transcriptase-Cas1 Fusion Protein Contains a Cas6 Domain Required for Both CRISPR RNA Biogenesis and RNA Spacer Acquisition. Mol. Cell 72, 700-714.e8 (2018).
Zhao, C., Liu, F. & Pyle, A. M. An ultraprocessive, accurate reverse transcriptase encoded by a metazoan group II intron. RNA 24, 183-195 (2018).
Zimmerly, S. & Wu, L. An Unexplored Diversity of Reverse Transcriptases in Bacteria. Microbiol Spectr 3, MDNA3-0058-2014 (2015).
Ostertag, E. M. & Kazazian Jr, H. H. Biology of Mammalian L1 Retrotransposons. Annual Review of Genetics 35, 501-538 (2001).
Perach, M. & Hizi, A. Catalytic Features of the Recombinant Reverse Transcriptase of Bovine Leukemia Virus Expressed in Bacteria. Virology 259, 176-189 (1999).
Lim, D. et al. Crystal structure of the moloney murine leukemia virus RNase H domain. J. Virol. 80, 8379-8389 (2006).
Zhao, C. & Pyle, A. M. Crystal structures of a group II intron maturase reveal a missing link in spliceosome evolution. Nature Structural & Molecular Biology 23, 558-565 (2016).
Griffiths, D. J. Endogenous retroviruses in the human genome sequence. Genome Biol. 2, REVIEWS1017 (2001).
Baranauskas, A. et al. Generation and characterization of new highly thermostable and processive M-MuLV reverse transcriptase variants. Protein Eng Des Sei 25, 657-668 (2012).
Zimmerly, S., Guo, H., Perlman, P. S. & Lambowitz, A. M. Group II intron mobility occurs by target DNA-primed reverse transcription. Cell 82, 545-554 (1995).
Feng, Q., Moran, J. V., Kazazian, H. H. & Boeke, J. D. Human L1 retrotransposon encodes a conserved endonuclease required for retrotransposition. Cell 87, 905-916 (1996).
Berkhout, B., Jebbink, M. & Zsiros, J. Identification of an Active Reverse Transcriptase Enzyme Encoded by a Human Endogenous HERV-K Retrovirus. Journal of Virology 73, 2365-2375 (1999).
Kotewicz, M. L., Sampson, C. M., D'Alessio, J. M. & Gerard, G. F. Isolation of cloned Moloney murine leukemia virus reverse transcriptase lacking ribonuclease H activity. Nucleic Acids Res 16, 265-277 (1988).
Arezi, B. & Hogrefe, H. Novel mutations in Moloney Murine Leukemia Virus reverse transcriptase increase thermostability through tighter binding to template-primer. Nucleic Acids Res 37, 473-481 (2009).
Blain, S. W. & Goff, S. P. Nuclease activities of Moloney murine leukemia virus reverse transcriptase. Mutants with altered substrate specificities. J. Biol. Chem. 268, 23585-23592 (1993).
Xiong, Y. & Eickbush, T. H. Origin and evolution of retroelements based upon their reverse transcriptase sequences. EMBO J 9, 3353-3362 (1990).
Herschhorn, A. & Hizi, A. Retroviral reverse transcriptases. Cell. Mol. Life Sci. 67, 2717- 2747 (2010).
Taube, R., Loya, S., Avidan, O., Perach, M. & Hizi, A. Reverse transcriptase of mouse mammary tumour virus: expression in bacteria, purification and biochemical characterization. Biochem. J. 329 (Pt 3), 579-587 (1998).
Liu, M. et al. Reverse Transcriptase-Mediated Tropism Switching in Bordetella Bacteriophage. Science 295, 2091-2094 (2002).
Luan, D. D., Korman, M. H., Jakubczak, J. L. & Eickbush, T. H. Reverse transcription of R2Bm RNA is primed by a nick at the chromosomal target site: a mechanism for non-LTR retrotransposition. Cell72, 595-605 (1993).
Nottingham, R. M. et al. RNA-seq of human reference RNA samples using a thermostable group II intron reverse transcriptase. RNA 22, 597-613 (2016).
Telesnitsky, A. & Goff, S. P. RNase H domain mutations affect the interaction between Moloney murine leukemia virus reverse transcriptase and its primer-template. Proc. Natl. Acad. Sci. U.S.A. 90, 1276-1280 (1993).
Halvas, E. K., Svarovskaia, E. S. & Pathak, V. K. Role of Murine Leukemia Virus Reverse Transcriptase Deoxyribonucleoside Triphosphate-Binding Site in Retroviral Replication and In Vivo Fidelity. Journal of Virology 74, 10349-10358 (2000).
Nowak, E. et al. Structural analysis of monomeric retroviral reverse transcriptase in complex with an RNA/DNA hybrid. Nucleic Acids Res 41, 3874-3887 (2013).
Stamos, J. L., Lentzsch, A. M. & Lambowitz, A. M. Structure of a Thermostable Group II Intron Reverse Transcriptase with Template-Primer and Its Functional and Evolutionary Implications. Molecular Cell 68, 926-939.e4 (2017).
Das, D. & Georgiadis, M. M. The Crystal Structure of the Monomeric Reverse Transcriptase from Moloney Murine Leukemia Virus. Structure 12, 819-829 (2004).
Avidan, O., Meer, M. E., Oz, I. & Hizi, A. The processivity and fidelity of DNA synthesis exhibited by the reverse transcriptase of bovine leukemia virus. European Journal of Biochemistry 269, 859-867 (2002).
Gerard, G. F. et al. The role of template-primer in protection of reverse transcriptase from thermal inactivation. Nucleic Acids Res 30, 3118-3129 (2002).
Monot, C. et al. The Specificity and Flexibility of L1 Reverse Transcription Priming at Imperfect T-Tracts. PLOS Genetics 9, e1003499 (2013).
Mohr, S. et al. Thermostable group II intron reverse transcriptase fusion proteins and their use in cDNA synthesis and next-generation RNA sequencing. RNA 19, 958-970 (2013).

Alle oben genannten Referenzen, die sich auf reverse Transkriptasen beziehen, werden hiermit in ihrer Gesamtheit in Bezug genommen, sofern dies nicht bereits angegeben ist.
[4] Prime-Editoren
Die Offenbarung stellt Systeme bereit, die Prime-Editoren umfassen. In einem Aspekt stellt diese Offenbarung Systeme für gleichzeitiges Editieren beider Stränge einer doppelsträngigen DNA-Sequenz an einer zu editierenden Zielstelle bereit, die einen ersten Prime-Editor-Komplex und einen zweiten Prime-Editor-Komplex umfassen, wobei jeder der ersten und zweiten Prime-Editor-Komplexe Folgendes umfasst: (1) einen Prime-Editor, der (i) ein Nukleinsäure-programmierbares DNA-Bindungsprotein (napDNAbp) und (ii) ein Polypeptid mit einer RNA-abhängigen DNA-Polymerase-Aktivität umfasst; und (2) eine pegRNA, umfassend eine Spacer-Sequenz, einen gRNA-Kern, ein DNA-Synthese-Templat und eine Primer-Bindungsstelle, wobei das DNA-Synthese-Templat der pegRNA des ersten Prime-Editor-Komplexes für eine erste einzelsträngige DNA-Sequenz kodiert und das DNA- Synthese-Templat der pegRNA des zweiten Prime-Editor-Komplexes für eine zweite einzelsträngige DNA-Sequenz kodiert, wobei die erste einzelsträngige DNA-Sequenz und die zweite einzelsträngige DNA-Sequenz jeweils eine Region der Komplementarität zur anderen umfassen, und wobei die erste einzelsträngige DNA-Sequenz und die zweite einzelsträngige DNA-Sequenz einen Duplex bilden, der einen editierten Abschnitt im Vergleich zur DNA- Sequenz an der zu editierenden Zielstelle umfasst, der sich in die zu editierende Zielstelle integriert.
In einem anderen Aspekt stellt die vorliegende Offenbarung Systeme für das Editieren einer oder mehrerer doppelsträngiger DNA-Sequenzen bereit, wobei das System Folgendes umfasst:

a) einen ersten Prime-Editor-Komplex, umfassend:
1. i. einen ersten Prime-Editor, umfassend ein erstes Nukleinsäure-programmierbares DNA- Bindeprotein (erstes napDNAbp) und ein erstes Polypeptid, das eine RNA-abhängige DNA-Polymerase-Aktivität umfasst; und
2. ii. eine erste Prime-Editing-Leit-RNA (erste PEgRNA), die an eine erste Bindungsstelle auf einem ersten Strang einer ersten doppelsträngigen DNA-Sequenz an einer ersten zu editierenden Zielstelle bindet;
b) einen zweiten Prime-Editor-Komplex, umfassend:
1. i. einen zweiten Prime-Editor, umfassend ein zweites Nukleinsäure-programmierbares DNA- Bindeprotein (zweites napDNAbp) und ein zweites Polypeptid, das eine RNA-abhängige DNA-Polymerase-Aktivität aufweist; und
2. ii. eine zweite Prime-Editing-Leit-RNA (zweite PEgRNA), die an eine zweite Bindungsstelle auf einem zweiten Strang der ersten doppelsträngigen DNA-Sequenz an der ersten zu editierenden Zielstelle bindet;
c) einen dritten Prime-Editor-Komplex, umfassend:
1. i. einen dritten Prime-Editor, umfassend ein drittes Nukleinsäure-programmierbares DNA- Bindeprotein (drittes napDNAbp) und ein drittes Polypeptid, das eine RNA-abhängige DNA-Polymerase-Aktivität aufweist; und
2. ii. eine dritte Prime-Editing-Leit-RNA (dritte PEgRNA), die an eine erste Bindungsstelle auf einem ersten Strang einer zweiten doppelsträngigen DNA-Sequenz an einer zweiten zu editierenden Zielstelle bindet;
d) einen vierten Prime-Editor-Komplex, umfassend:
1. i. einen vierten Prime-Editor, umfassend ein viertes Nukleinsäure-programmierbares DNA- Bindeprotein (viertes napDNAbp) und ein viertes Polypeptid, das eine RNA-abhängige DNA-Polymerase-Aktivität aufweist; und
2. ii. eine vierte Prime-Editing Leit-RNA (vierte PEgRNA), die an eine zweite Bindungsstelle auf einem zweiten Strang der zweiten doppelsträngigen DNA-Sequenz an der zweiten zu editierenden Zielstelle bindet;

In einigen Ausführungsformen sind die in den hierin beschriebenen Systemen verwendeten Prime-Editoren (z. B. der erste Prime-Editor, der zweite Prime-Editor, der dritte Prime-Editor und/oder der vierte Prime-Editor in den oben beschriebenen Systemen) als Fusionsproteine bereitgestellt. In einigen Ausführungsformen umfassen die Prime-Editor- Fusionsproteine ein napDNAbp und eine Polymerase (z. B. eine DNA-abhängige DNA- Polymerase oder eine RNA-abhängige DNA-Polymerase, wie etwa eine reverse Transkriptase). In einigen Ausführungsformen sind das napDNAbp und die Polymerase optional durch einen Linker verbunden, um das Fusionsprotein zu bilden. Verschiedene Konfigurationen der Prime-Editor-Fusionsproteine und zusätzliche Domänen der Fusionsproteine werden ferner hierin beschrieben. In verschiedenen Ausführungsformen ziehen die durch die vorliegende Offenbarung bereitgestellten Systeme und Verfahren die Verwendung beliebiger der hierin beschriebenen Prime-Editor-Fusionsproteine in Betracht.
In einigen Ausführungsformen umfassen die in den hierin beschriebenen Systemen verwendeten Prime-Editor-Komplexe einen Prime-Editor (z. B. den ersten Prime-Editor, den zweiten Prime-Editor, den dritten Prime-Editor und/oder den vierten Prime-Editor in den oben beschriebenen Systemen), wobei die Komponenten eines oder mehrerer Prime-Editoren in trans bereitgestellt werden, wie dies in der vorliegenden Spezifikation im Detail beschrieben ist. In einigen Ausführungsformen umfasst der Prime-Editor ein napDNAbp und eine in trans exprimierte Polymerase. In einigen Ausführungsformen werden das napDNAbp und die Polymerase von einem oder mehreren Vektoren exprimiert (z. B. werden beide Komponenten von demselben Vektor exprimiert, oder jede Komponente wird von einem anderen Vektor exprimiert). In bestimmten Ausführungsformen umfassen die Prime-Editoren zusätzliche Komponenten, wie hierin beschrieben, die in trans exprimiert werden. In einigen Ausführungsformen können die Prime-Editoren, die in den hierin beschriebenen Systemen verwendet werden, sowohl einen oder mehrere Prime-Editoren umfassen, die als Fusionsproteine bereitgestellt werden, als auch einen oder mehrere Prime-Editoren, deren Komponenten in trans bereitgestellt werden.
In einigen Ausführungsformen umfassen die hierin beschriebenen Multi-Flap-Prime- Editor-Systeme Fusionsproteine, die ein napDNAbp und eine Polymerase (z. B. DNA- abhängige DNA-Polymerase oder RNA-abhängige DNA-Polymerase, wie etwa reverse Transkriptase) umfassen und gegebenenfalls durch einen Linker verbunden sind. Der Antrag sieht vor, dass jede geeignete napDNAbp und Polymerase (z. B. DNA-abhängige DNA- Polymerase oder RNA-abhängige DNA-Polymerase, wie etwa reverse Transkriptase) in einem einzigen Fusionsprotein kombiniert werden. Beispiele für napDNAbps und Polymerasen (z. B. DNA-abhängige DNA-Polymerase oder RNA-abhängige DNA-Polymerase, wie etwa reverse Transkriptase) sind hierin jeweils definiert. Da Polymerasen in der Technik bekannt sind und die Aminosäuresequenzen leicht verfügbar sind, soll diese Offenbarung in keiner Weise auf die hierin genannten spezifischen Polymerasen beschränkt sein.
In verschiedenen Ausführungsformen können die Fusionsproteine jede beliebige geeignete strukturelle Konfiguration umfassen. Zum Beispiel kann das Fusionsprotein vom N- Terminus bis zum C-Terminus ein napDNAbp umfassen, das an eine Polymerase (z. B. DNA- abhängige DNA-Polymerase oder RNA-abhängige DNA-Polymerase, wie etwa reverse Transkriptase) fusioniert ist. In anderen Ausführungsformen kann das Fusionsprotein vom N- Terminus bis zum C-Terminus eine Polymerase (z. B. eine reverse Transkriptase) umfassen, die mit einem napDNAbp fusioniert ist. Die fusionierte Domäne kann gegebenenfalls durch einen Linker, z. B. eine Aminosäuresequenz, verbunden sein. In anderen Ausführungsformen können die Fusionsproteine die Struktur NH₂-[napDNAbp]-[ Polymerase]-COOH; oder NH₂- [Polymerase]-[napDNAbp]-COOH umfassen, wobei jedes „]-[" das Vorhandensein einer optionalen Linker-Sequenz anzeigt. In Ausführungsformen, in denen die Polymerase eine reverse Transkriptase ist, können die Fusionsproteine die Struktur NH₂-[napDNAbp]-[RT]- COOH; oder NH₂-[RT]-[napDNAbp]-COOH umfassen, wobei jedes „]-[" das Vorhandensein einer optionalen Linker-Sequenz anzeigt.
Ein beispielhaftes Fusionsprotein ist in 14 dargestellt, das ein Fusionsprotein zeigt, das eine MLV-reverse Transkriptase („MLV-RT“) umfasst, die über eine Linker- Sequenz mit einer Nickase-Cas9 („Cas9(H840A)“) fusioniert ist. Dieses Beispiel soll den Umfang der Fusionsproteine, die für das hierin beschriebene Prime-Editor (PE)-System verwendet werden können, nicht einschränken.

In verschiedenen Ausführungsformen kann das Multi-Flap-Prime-Editor- Fusionsprotein die folgende Aminosäuresequenz aufweisen (hierin als „PE1“ bezeichnet), die eine Cas9-Variante umfassend eine H840A-Mutation (d. h. eine Cas9-Nickase) und einen M- MLV-RT-Wildtyp sowie eine N-terminale NLS-Sequenz (19 Aminosäuren) und einen Aminosäure-Linker (32 Aminosäuren), der den C-Terminus der Cas9-Nickase-Domäne mit dem N-Terminus der RT-Domäne verbindet, beinhaltet. Das PE1-Fusionsprotein weist die folgende Struktur auf [NLS]-[Cas9(H840A)]-[Linker]-[MMLV_RT(wt)]. Die Aminosäuresequenz von PE1 und seiner einzelnen Komponenten ist wie folgt:

BESCHREIBUNG	SEQUENZ
PE1- FUSIONSPROTEIN

CAS9(H840A)- MMLV_RT(WT)	KEY: NUCLEAR LOCALIZATION SEQUENCE (NLS) TOP:(SEQ ID NO: 124), BOTTOM: (SEQ ID NO: 133) CAS9(H840A) (SEQ ID NO:126) 33-AMINO ACID LINKER (SEQ ID NO: 127) M-MLV REVERSE TRANSCRIPTASE (SEQ ID NO: 128)
PE1 -N- TERMINALE NLS	MKRTADGSEFESPKKKRKV (SEQ ID NO: 124)

BESCHREIBUNG	SEQUENZ
PE1 -CAS9 (H840A) (MET MINUS)
PE1 - LINKER ZWISCHEN CAS9- DOMÄNE UND RT- DOMÄNE (33 AMINOSÄUREN)	SGGSSGGSSGSETPGTSESATPESSGGSSGGSS (SEQ ID NO: 127)
PE1 - M-MLV RT
PE1 -C- TERMINALE NLS	SGGSKRTADGSEFEPKKKRKV (SEQ ID NO: 133)

In einer anderen Ausführungsform kann das Fusionsprotein des Multi-Flap-Prime- Editors die folgende Aminosäuresequenz aufweisen (hierin als „PE2“ bezeichnet), die eine Cas9-Variante umfassend eine H840A-Mutation (d. h., eine Cas9-Nickase) und eine M-MLV- RT, die die Mutationen D200N, T330P, L603W, T306K und W313F umfasst, sowie eine N- terminale NLS-Sequenz (19 Aminosäuren) und einen Aminosäure-Linker (33 Aminosäuren), der den C-Terminus der Cas9-Nickasedomäne mit dem N-Terminus der RT-Domäne verbindet, beinhaltet. Das PE2-Fusionsprotein weist die folgende Struktur auf: [NLS]- [Cas9(H840A)]-[Linker]-[MMLV_RT(D200N)(T330P)(L603W)(T306K)(W313F)]. Die Aminosäuresequenz von PE2 ist wie folgt:

In noch anderen Ausführungsformen kann das Prime-Editor-Fusionsprotein die folgenden Aminosäuresequenzen aufweisen:

PE- FUSIONSPROTEIN

MMLV_RT(WT)- 32AA- CAS9(H840A)	KEY: NUCLEAR LOCALIZATION SEQUENCE (NLS) TOP:(SEQ ID NO: 124), BOTTOM: (SEQ ID NO: 133) CAS9(H840A) (SEQ ID NO:147) 33-AMINO ACID LINKER (SEQ ID NO: 127) M-MLV REVERSE TRANSCRIPTASE (SEQ ID NO: 149)
PE- FUSIONSPROTEIN

MMLV_RT(WT)- 60AA- CAS9(H840A)	KEY: NUCLEAR LOCALIZATION SEQUENCE (NLS) TOP:(SEQ ID NO: 124), BOTTOM: (SEQ ID NO: 133) CAS9(H840A) (SEQ ID NO:153) 33-AMINO ACID LINKER (SEQ ID NO: 175) M-MLV REVERSE TRANSCRIPTASE (SEQ ID NO: 149)
PE- FUSIONSPROTEIN

CAS9(H840A)- FEN1-MMLV_RT D200N T330P L603W T306K W313F	KEY: NUCLEAR LOCALIZATION SEQUENCE (NLS) TOP:(SEQ ID NO: 124), BOTTOM: (SEQ ID NO: 133) CAS9(H840A) (SEQ ID NO:157) 33-AMINO ACID LINKER 1 (SEQ ID NO: 127) M-MLV REVERSE TRANSCRIPTASE (SEQ ID NO: 159) 33-AMINO ACID LINKER 2 (SEQ ID NO: 127) FEN1 (SEQ ID NO: 161)

In anderen Ausführungsformen können die Fusionsproteine des Multi-Flap-Prime- Editors auf SaCas9 oder auf SpCas9-Nickasen mit veränderten PAM-Spezifitäten basieren, wie etwa die folgenden beispielhaften Sequenzen:

SACAS9-M-MLV RT PRIME- EDITOR
SPCAS9(H840A)- VRQR-MALONEY MURINES LEUKÄMIE- VIRUS REVERSE TRANSKRIPTASE- PRIME-EDITOR
SPCAS9(H840A)- VRER-MALONEY MURINES LEUKÄMIE- VIRUS REVERSE TRANSKRIPTASE- PRIME-EDITOR

In noch weiteren Ausführungsformen können die hierin in Betracht gezogenen Multi- Flap-Prime-Editor-Fusionsproteine eine Cas9-Nickase (z. B. Cas9 (H840A)) beinhalten, die mit einer trunkierten Version der M-MLV-Reverse-Transkriptase fusioniert ist. In dieser Ausführungsform enthält die reverse Transkriptase ebenfalls 4 Mutationen (D200N, T306K, W313F, T330P; wobei zu beachten ist, dass die in PE2 vorhandene L603W-Mutation aufgrund des Trunkierens nicht mehr vorhanden ist). Die DNA-Sequenz, die diesen trunkierten Editor kodiert, ist 522 bp kleiner als PE2 und eignet sich daher für Anwendungen, bei denen die Übertragung der DNA-Sequenz aufgrund ihrer Größe eine Herausforderung darstellt (z. B. bei der Übertragung von Adeno-assoziierten Viren und Lentiviren). Diese Ausführungsform wird als Cas9(H840A)-MMLV-RT(trunc) oder „PE2-short“ oder „PE2-Trunc“ bezeichnet und weist die folgende Aminosäuresequenz auf

CAS9(H840A)- MMLV- RT(TRUNC) ODER PE2-SHORT
	KEY: NUCLEAR LOCALIZATION SEQUENCE (NLS) TOP:(SEQ ID NO: 124), BOTTOM: (SEQ ID NO: 133) CAS9(H840A) (SEQ ID NO:157) 33-AMINO ACID LINKER 1 (SEQ ID NO: 127) M-MLV TRUNCATED REVERSE TRANSCRIPTASE (SEQ ID NO: 766)

Siehe 75, die ein Balkendiagramm bereitstellt, in dem die Effizienz (d.h. „% der gesamten Sequenzierungsauslesungen mit der angegebenen Editierung oder Indels“) von PE2, PE2-Trunc, PE3 und PE3-Trunc über verschiedene Zielstellen in verschiedenen Zelllinien verglichen wird. Die Daten zeigen, dass die Prime-Editoren, die die trunkierten RT-Varianten umfassen, etwa genauso effizient waren wie die Prime-Editoren, die die nicht trunkierten RT- Proteine umfassen.
In verschiedenen Ausführungsformen können die hierin in Betracht gezogenen Multi- Flap-Prime-Editor-Fusionsproteine auch beliebige Varianten der oben offenbarten Sequenzen beinhalten, die eine Aminosäuresequenz aufweisen, die zu mindestens etwa 70 % identisch, zu mindestens etwa 80 % identisch, zu mindestens etwa 90 % identisch, zu mindestens etwa 95 % identisch, zu mindestens etwa 96 % identisch, zu mindestens etwa 97 % identisch, zu mindestens etwa 98 % identisch, zu mindestens etwa 99,5 % identisch oder zu mindestens etwa 99,9 % identisch mit PE1, PE2 oder einer der oben angegebenen Prime-Editor- Fusionssequenzen ist.
In bestimmten Ausführungsformen können Linker verwendet werden, um eines der Peptide oder Peptiddomänen oder -teile der Erfindung zu verknüpfen (z. B. ein napDNAbp, das mit einer reversen Transkriptase verknüpft oder fusioniert ist).
[5] Linker und andere Domänen
Die PE-Fusionsproteine können neben dem napDNAbp (z. B. Cas9-Domäne) und der Polymerase-Domäne (z. B. RT-Domäne) verschiedene andere Domänen umfassen. Zum Beispiel können die PE-Fusionsproteine einen oder mehrere Linker umfassen, die die Cas9- Domäne mit der RT-Domäne verbinden, wenn das napDNAbp ein Cas9 und die Polymerase eine RT ist. Die Linker können auch andere funktionelle Domänen, wie etwa Kemlokalisierungssequenzen (NLS) oder eine FEN1 (oder andere Flap-Endonuklease) mit den PE-Fusionsproteinen oder einer Domäne davon verbinden.
Darüber hinaus können in Ausführungsformen, die ein Trans-Prime-Editing beinhalten, Linker verwendet werden, um das tPERT-Rekrutierungsprotein mit einem Prime-Editor zu verbinden, z. B. zwischen dem tPERT-Rekrutierungsprotein und dem napDNAbp. Siehe z. B. 3G für ein beispielhaftes Schema eines Trans-Prime-Editors (tPE), der Linker beinhaltet, um eine Polymerase-Domäne und eine Rekrutierungsprotein-Domäne getrennt an ein napDNAbp zu fusionieren.
A. Linker
Wie oben definiert, bezieht sich der Begriff „Linker“, wie hierin verwendet, auf eine chemische Gruppe oder ein Molekül, das zwei Moleküle oder Einheiten verbindet, z. B. eine Bindungsdomäne und eine Spaltungsdomäne einer Nuklease. In einigen Ausführungsformen verbindet ein Linker eine gRNA-Bindungsdomäne einer RNA-programmierbaren Nuklease und die katalytische Domäne einer Polymerase (z. B. einer reversen Transkriptase). In einigen Ausführungsformen verbindet ein Linker ein dCas9 und eine reverse Transkriptase. In der Regel befindet sich der Linker zwischen zwei Gruppen, Molekülen oder anderen Einheiten oder wird von diesen flankiert und ist mit diesen über eine kovalente Bindung verbunden, wodurch die beiden miteinander verbunden werden. In einigen Ausführungsformen ist der Linker eine Aminosäure oder eine Vielzahl von Aminosäuren (z. B. ein Peptid oder Protein). In einigen Ausführungsformen ist der Linker ein organisches Molekül, eine Gruppe, ein Polymer oder eine chemische Einheit. In einigen Ausführungsformen hat der Linker eine Länge von 5-100 Aminosäuren, zum Beispiel 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 30-35, 35-40, 40-45, 45-50, 50-60, 60-70, 70-80, 80-90, 90-100, 100-150 oder eine Länge von 150-200 Aminosäuren. Längere oder kürzere Linker sind ebenfalls denkbar.
Bei dem Linker kann es sich um eine einfache kovalente Bindung oder um einen polymeren Linker mit einer Länge von vielen Atomen handeln. In bestimmten Ausführungsformen ist der Linker ein Polpeptid oder basiert auf Aminosäuren. In anderen Ausführungsformen ist der Linker nicht peptidähnlich. In bestimmten Ausführungsformen ist der Linker eine kovalente Bindung (z. B. eine Kohlenstoff-Kohlenstoff-Bindung, Disulfidbindung, Kohlenstoff-Heteroatom-Bindung usw.). In bestimmten Ausführungsformen ist der Linker eine Kohlenstoff-Stickstoff-Bindung einer Amidbindung. In bestimmten Ausführungsformen ist der Linker ein cyclischer oder acyclischer, substituierter oder unsubstituierter, verzweigter oder unverzweigter aliphatischer oder heteroaliphatischer Linker. In bestimmten Ausführungsformen ist der Linker ein Polymer (z. B. Polyethylen, Polyethylenglykol, Polyamid, Polyester usw.). In bestimmten Ausführungsformen umfasst der Linker ein Monomer, Dimer oder Polymer der Aminoalkansäure. In bestimmten Ausführungsformen umfasst der Linker eine Aminoalkansäure (z. B. Glycin, Ethansäure, Alanin, Beta-Alanin, 3-Aminopropansäure, 4-Aminobutansäure, 5-Pentansäure, usw.). In bestimmten Ausführungsformen umfasst der Linker ein Monomer, Dimer oder Polymer der Aminohexansäure (Ahx). In bestimmten Ausführungsformen basiert der Linker auf einer carbocyclischen Einheit (z. B. Cyclopentan, Cyclohexan). In anderen Ausführungsformen umfasst der Linker einen Polyethylenglykol-Anteil (PEG). In anderen Ausführungsformen umfasst der Linker Aminosäuren. In bestimmten Ausführungsformen umfasst der Linker ein Peptid. In bestimmten Ausführungsformen umfasst der Linker eine Aryl- oder Heteroarylgruppe. In bestimmten Ausführungsformen basiert der Linker auf einem Phenylring. Der Linker kann funktionalisierte Einheiten beinhalten, um die Bindung eines Nukleophils (z. B. Thiol, Amino) aus dem Peptid an den Linker zu erleichtern. Jedes beliebige Elektrophil kann als Teil des Linkers verwendet werden. Beispielhafte Elektrophile beinhalten unter anderem aktivierte Ester, aktivierte Amide, Michael-Akzeptoren, Alkylhalogenide, Arylhalogenide, Acylhalogenide und Isothiocyanate.
In einigen anderen Ausführungsformen umfasst der Linker die Aminosäuresequenz (GGGGS)_n (SEQ-ID-NR: 165), (G)_n (SEQ-ID-NR: 166), (EAAAK) _n (SEQ-ID-NR: 167), (GGS)_n (SEQ-ID-NR: 168), (SGGS)_n (SEQ-ID-NR: 169), (XP)_n (SEQ-ID-NR: 170), oder eine beliebige Kombination davon, wobei n unabhängig eine ganze Zahl zwischen 1 und 30 ist und wobei X eine beliebige Aminosäure ist. In einigen Ausführungsformen umfasst der Linker die Aminosäuresequenz (GGS)N (SEQ-ID-NR: 176), wobei n 1, 3, or 7 ist. In einigen Ausführungsformen umfasst der Linker die Aminosäuresequenz SGSETPGTSESATPES (SEQ-ID-NR: 171). In einigen Ausführungsformen umfasst der Linker die Aminosäuresequenz SGGSSGGSSGSETPGTSESATPESSGGSSGGS (SEQ-ID-NR: 172). In einigen Ausführungsformen umfasst der Linker die Aminosäuresequenz SGGSGGSGGS (SEQ-ID- NR: 173). In einigen Ausführungsformen umfasst der Linker die Aminosäuresequenz SGGS (SEQ-ID-NR: 174). In anderen Ausführungsformen umfasst der Linker die Aminosäuresequenz SGGSSGGSSGSETPGTSESATPESAGSYPYDVPDYAGSAAPAAKKKKLDGSGSGGSSG GS (SEQ-ID-NR: 175, 60AA).
In bestimmten Ausführungsformen können Linker verwendet werden, um eines der Peptide oder Peptiddomänen oder -einheiten der Erfindung zu verknüpfen (z. B. ein napDNAbp, das mit einer reversen Transkriptase verknüpft oder fusioniert ist).
Wie oben definiert, bezieht sich der Begriff „Linker“, wie hierin verwendet, auf eine chemische Gruppe oder ein Molekül, das zwei Moleküle oder Einheiten verbindet, z. B. eine Bindungsdomäne und eine Spaltungsdomäne einer Nuklease. In einigen Ausführungsformen verbindet ein Linker eine gRNA-Bindungsdomäne einer RNA-programmierbaren Nuklease und die katalytische Domäne einer Rekombinase. In einigen Ausführungsformen verbindet ein Linker ein dCas9 und eine reverse Transkriptase. In der Regel befindet sich der Linker zwischen zwei Gruppen, Molekülen oder anderen Einheiten oder wird von diesen flankiert und ist mit diesen über eine kovalente Bindung verbunden, wodurch die beiden miteinander verbunden werden. In einigen Ausführungsformen ist der Linker eine Aminosäure oder eine Vielzahl von Aminosäuren (z. B. ein Peptid oder Protein). In einigen Ausführungsformen ist der Linker ein organisches Molekül, eine Gruppe, ein Polymer oder eine chemische Einheit. In einigen Ausführungsformen hat der Linker eine Länge von 5-100 Aminosäuren, zum Beispiel 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 30- 35, 35-40, 40-45, 45-50, 50-60, 60-70, 70-80, 80-90, 90-100, 100-150 oder eine Länge von 150-200 Aminosäuren. Längere oder kürzere Linker sind ebenfalls denkbar.
Bei dem Linker kann es sich um eine einfache kovalente Bindung oder um einen polymeren Linker mit einer Länge von vielen Atomen handeln. In bestimmten Ausführungsformen ist der Linker ein Polypeptid oder basiert auf Aminosäuren. In anderen Ausführungsformen ist der Linker nicht peptidähnlich. In bestimmten Ausführungsformen ist der Linker eine kovalente Bindung (z. B. eine Kohlenstoff-Kohlenstoff-Bindung, Disulfidbindung, Kohlenstoff-Heteroatom-Bindung usw.). In bestimmten Ausführungsformen ist der Linker eine Kohlenstoff-Stickstoff-Bindung einer Amidbindung. In bestimmten Ausführungsformen ist der Linker ein cyclischer oder acyclischer, substituierter oder unsubstituierter, verzweigter oder unverzweigter aliphatischer oder heteroaliphatischer Linker. In bestimmten Ausführungsformen ist der Linker ein Polymer (z. B. Polyethylen, Polyethylenglykol, Polyamid, Polyester usw.). In bestimmten Ausführungsformen umfasst der Linker ein Monomer, Dimer oder Polymer der Aminoalkansäure. In bestimmten Ausführungsformen umfasst der Linker eine Aminoalkansäure (z. B. Glycin, Ethansäure, Alanin, Beta-Alanin, 3-Aminopropansäure, 4-Aminobutansäure, 5-Pentansäure, usw.). In bestimmten Ausführungsformen umfasst der Linker ein Monomer, Dimer oder Polymer von AminoHEXAnoesäure (Ahx). In bestimmten Ausführungsformen basiert der Linker auf einer carbocyclischen Einheit (z. B. Cyclopentan, CycloHEXAn). In anderen Ausführungsformen umfasst der Linker einen Polyethylenglykol-Anteil (PEG). In anderen Ausführungsformen umfasst der Linker Aminosäuren. In bestimmten Ausführungsformen umfasst der Linker ein Peptid. In bestimmten Ausführungsformen umfasst der Linker eine Aryl- oder Heteroarylgruppe. In bestimmten Ausführungsformen basiert der Linker auf einem Phenylring. Der Linker kann funktionalisierte Einheiten beinhalten, um die Bindung eines Nukleophils (z. B. Thiol, Amino) aus dem Peptid an den Linker zu erleichtern. Jedes Elektrophil kann als Teil des Linkers verwendet werden. Beispielhafte Elektrophile beinhalten unter anderem aktivierte Ester, aktivierte Amide, Michael-Akzeptoren, Alkylhalogenide, Arylhalogenide, Acylhalogenide und Isothiocyanate.
In einigen anderen Ausführungsformen umfasst der Linker die Aminosäuresequenz (GGGGS)n (SEQ-ID-NR: 165), (G)n (SEQ-ID-NR: 166), (EAAAK)_n (SEQ-ID-NR: 167), (GGS)_n (SEQ-ID-NR: 168), (SGGS)n (SEQ-ID-NR: 169), (XP)n (SEQ-ID-NR: 170), oder eine beliebige Kombination davon, wobei n unabhängig eine ganze Zahl zwischen 1 und 30 ist und wobei X eine beliebige Aminosäure ist. In einigen Ausführungsformen umfasst der Linker die Aminosäuresequenz (GGS)N (SEQ-ID-NR: 176), wobei n 1, 3, or 7 ist. In einigen Ausführungsformen umfasst der Linker die Aminosäuresequenz SGSETPGTSESATPES (SEQ-ID-NR: 171). In einigen Ausführungsformen umfasst der Linker die Aminosäuresequenz SGGSSGGSSGSETPGTSESATPESSGGSSGGS (SEQ-ID-NR: 172). In einigen Ausführungsformen umfasst der Linker die Aminosäuresequenz SGGSGGSGGS (SEQ-ID- NR: 173). In einigen Ausführungsformen umfasst der Linker die Aminosäuresequenz SGGS (SEQ-ID-NR: 174).
Insbesondere die folgenden Linker können in verschiedenen Ausführungsformen verwendet werden, um Prime-Editor-Domänen miteinander zu verbinden:

GGS (SEQ ID NO: 767);
GGSGGS (SEQ ID NO: 768);
GGSGGSGGS (SEQ ID NO: 769);
SGGSSGGSSGSETPGTSESATPESSGGSSGGSS (SEQ ID NO: 127);
SGSETPGTSESATPES (SEQ ID NO: 171);
SGGSSGGSSGSETPGTSESATPESACSYPYDVPDYAGSAAPAAKKKKLDGSGSGGTSSGS (SEQ ID NO: 175).

B. Kernlokalisierungssequenz (NLS)

In verschiedenen Ausführungsformen können die PE-Fusionsproteine eine oder mehrere Kemlokalisierungssequenzen (NLS) umfassen, die die Translokation eines Proteins in den Zellkern unterstützen. Solche Sequenzen sind in der Technik bekannt und können die folgenden Beispiele beinhalten:

BESCHREIBUNG	SEQUENZ	SEQ-ID- NR:
NLS VON SV40 GROß T-AG	PKKKRKV	SEQ-ID- NR: 16
NLS	MKRTADGSEFESPKKKRKV	SEQ-ID- NR: 124
NLS	MDSLLMNRRKFLYQFKNVRWAKGRRETYLC	SEQ-ID- NR: 17
NLS VON NUKLEOPLASMIN	AVKRPAATKKAGQAKKKKLD	SEQ-ID- NR: 190
NLS VON EGL-13	MSRRRKANPTKLSENAKLAKEVEN	SEQ-ID-NR: 191
NLS VON C-MYC	PAAKRVKLD	SEQ-ID- NR: 192
NLS DES TUS- PROTEINS	KLKIKRPVK	SEQ-ID- NR: 193
NLS DES POLYOMA GROß TAG	VSRKRPRP	SEQ-ID- NR: 194
NLS DES HEPATITIS-D- VIRUS-ANTIGENS	EGAPPAKRAR	SEQ-ID- NR: 195
NLS DES MURINEN P53	PPQPKKKPLDGE	SEQ-ID- NR: 196
NLS VON PE1 UND PE2	SGGSKRTADGSEFEPKKKRKV	SEQ-ID- NR: 133

Die oben genannten NLS-Beispiele sind nicht einschränkend. Die PE-Fusionsproteine können jede beliebige bekannte NLS-Sequenz beinhalten, einschließlich derjenigen, die in Cokol et al. „Finding nuclear localization signals“, EMBO Rep. 2000, 1(5): 411-415 und Freitas et al. „Mechanisms and Signals for the Nuclear Import of Proteins“, Current Genomics, 2009, 10(8): 550-7 beschrieben sind, die hierin jeweils durch Bezugnahme aufgenommen sind.
In verschiedenen Ausführungsformen umfassen die hierin offenbarten Multi-Flap- Prime-Editoren und Konstrukte, die die Prime-Editoren kodieren, ferner ein oder mehrere, vorzugsweise mindestens zwei Kemlokalisierungssignale. In bestimmten Ausführungsformen umfassen die Multi-Flap-Prime-Editoren mindestens zwei NLS. In Ausführungsformen mit mindestens zwei NLS können die NLS dieselben NLS sein oder sie können unterschiedliche NLS sein. Darüber hinaus können die NLS als Teil eines Fusionsproteins mit den übrigen Abschnitten der Multi-Flap-Prime-Editoren exprimiert werden. In einigen Ausführungsformen sind eine oder mehrere der NLS bipartite NLS („bpNLS“). In bestimmten Ausführungsformen umfassen die offenbaren Fusionsproteine zwei bipartite NLS. In einigen Ausführungsformen umfassen die offenbaren Fusionsproteine mehr als zwei bipartite NLS.
Die Stelle der NLS-Fusion kann am N-Terminus, am C-Terminus oder innerhalb einer Sequenz eines Prime-Editors (z. B. eingefügt zwischen der kodierten napDNAbp-Komponente (z. B. Cas9) und einer Polymerase-Domäne (z. B. einer reversen Transkriptase-Domäne) liegen.
Bei den NLS kann es sich um jede beliebige in der Technik bekannte NLS-Sequenz handeln. Bei den NLS kann es sich auch um beliebige, in der Zukunft entdeckte NLS für die Kernlokalisierung handeln. Bei den NLS kann es sich auch um jede beliebige natürlich vorkommende NLS oder eine beliebige nicht natürlich vorkommende NLS (z. B. eine NLS mit einer oder mehreren gewünschten Mutationen) handeln.
Der Begriff „Kemlokalisierungssequenz“ oder „NLS“ bezieht sich auf eine Aminosäuresequenz, die den Import eines Proteins in den Zellkern fördert, zum Beispiel durch Kerntransport. Kernlokalisierungssequenzen sind in der Fachwelt bekannt und für den Fachmann offensichtlich. Zum Beispiel sind NLS-Sequenzen in der internationalen PCT- Anmeldung PCT/ EP2000/011690 von Plank et al. beschrieben, die am 23. November 2000 eingereicht und am 31. Mai 2001 als WO/2001/038547 veröffentlicht wurde und deren Inhalt hierin durch Bezugnahme aufgenommen ist. In einigen Ausführungsformen umfasst ein NLS die Aminosäuresequenz PKKKRKV (SEQ-ID-NR: 16), MDSLLMNRRKFLYQFKNVRWAKGRRETYLC (SEQ-ID-NR: 17), KRTADGSEFESPKKKRKV (SEQ-ID-NR: 3864), oder KRTADGSEFEPKKKRKV (SEQ- ID-NR: 125). In anderen Ausführungsformen umfasst NLS die Aminosäuresequenzen NLSKRPAAIKKAGQAKKKK (SEQ-ID-NR: 136), PAAKRVKLD (SEQ-ID-NR 192), RQRRNELKRSF (SEQ-ID-NR: 3934), NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY (SEQ-ID-NR: 3935).
In einem Aspekt der Offenbarung kann ein Multi-Flap-Prime-Editor mit einem oder mehreren Kemlokalisierungssignalen (NLS) modifiziert werden, vorzugsweise mit mindestens zwei NLS. In bestimmten Ausführungsformen sind die Multi-Flap-Prime-Editoren mit zwei oder mehr NLS modifiziert. Die Offenbarung sieht die Verwendung jedes beliebigen Kemlokalisierungssignals vor, das zum Zeitpunkt der Offenbarung in der Technik bekannt ist, oder jedes beliebigen Kernlokalisierungssignals, das nach dem Zeitpunkt der Einreichung der vorliegenden Anmeldung identifiziert oder auf andere Weise im Stand der Technik verfügbar gemacht wird. Ein repräsentatives Kernlokalisierungssignal ist eine Peptidsequenz, die das Protein in den Kern der Zelle lenkt, in der die Sequenz exprimiert wird. Ein Kernlokalisierungssignal ist überwiegend basisch, kann fast überall in der Aminosäuresequenz eines Proteins positioniert werden und umfasst im Allgemeinen eine kurze Sequenz von vier Aminosäuren (Autieri & Agrawal, (1998) J. Biol. Chem. 273: 14731-37, hierin aufgenommen durch Bezugnahme) bis acht Aminosäuren und ist typischerweise reich an Lysin- und Argininresten (Magin et al. (2000) Virology 274: 11-16, hierin aufgenommen durch Bezugnahme). Kemlokalisierungssignale umfassen häufig Prolinreste. Es wurde eine Vielzahl von Kemlokalisierungssignalen identifiziert, die für den Transport biologischer Moleküle aus dem Zytoplasma in den Zellkern verwendet werden. Siehe z. B. Tinland et al. (1992) Proc. Natl. Acad. Sci. U.S.A. 89:7442-46; Moede et al. (1999) FEBS Lett. 461: 229-34, das durch Bezugnahme aufgenommen ist. Derzeit geht man davon aus, dass an der Translokation Kemporenproteine beteiligt sind.
Die meisten NLS lassen sich in drei allgemeine Gruppen einteilen: (i) ein monopartites NLS, wie das NLS des SV40 Large T Antigens (PKKKRKV (SEQ-ID-NR: 16)); (ii) ein bipartites Motiv, das aus zwei Basisdomänen besteht, die durch eine variable Anzahl von Spacer-Aminosäuren getrennt sind, und das durch das Xenopus-Nukleoplasmin-NLS (KRXXXXXXXXXXKKKL (SEQ-ID-NR: 3936)); und (iii) nicht-kanonische Sequenzen wie M9 des hnRNP Al-Proteins, das Influenza-Virus-Nukleoprotein NLS und das Hefe-Gal4- Protein NLS (Dingwall und Laskey 1991).
Kemlokalisierungssignale treten an verschiedenen Stellen in den Aminosäuresequenzen von Proteinen auf. NLS wurden am N-Terminus, am C-Terminus und in der zentralen Region von Proteinen identifiziert. Daher stellt die Offenbarung Multi-Flap- Prime-Editoren bereit, die mit einem oder mehreren NLS am C-Terminus, am N-Terminus sowie in einer internen Region des Multi-Flap-Prime-Editors modifiziert werden können. Die Reste einer längeren Sequenz, die nicht als Komponenten-NLS-Reste fungieren, sollten so ausgewählt werden, dass sie nicht mit dem eigentlichen Kernlokalisierungssignal interferieren, zum Beispiel tonisch oder sterisch. Daher kann eine solche Sequenz, auch wenn es keine strengen Grenzen für die Zusammensetzung einer NLS-umfassenden Sequenz gibt, in der Praxis in ihrer Länge und Zusammensetzung funktionell begrenzt sein.
Die vorliegende Offenbarung zieht jedes beliebige geeignete Mittel in Betracht, um einen Multi-Flap-Prime-Editor so zu modifizieren, dass er ein oder mehrere NLS beinhaltet. In einem Aspekt können die Multi-Flap-Prime-Editoren so manipuliert werden, dass sie ein Prime-Editor-Protein exprimieren, das an seinem N-Terminus oder seinem C-Terminus (oder an beiden) translational mit einem oder mehreren NLS fusioniert ist, d. h. ein Prime-Editor- NLS-Fusionskonstrukt bildet. In anderen Ausführungsformen kann die für den Prime-Editor kodierende Nukleotidsequenz genetisch modifiziert werden, um einen Reading Frame einzubauen, der einen oder mehrere NLS in einer internen Region des kodierten Prime-Editors kodiert. Darüber hinaus können die NLS verschiedene Aminosäure-Linker oder Spacer- Regionen beinhalten, die zwischen dem Prime-Editor und der N-terminalen, C-terminalen oder intern angebrachten NLS-Aminosäuresequenz kodiert werden, z. B. und in der zentralen Region von Proteinen. Somit stellt die vorliegende Offenbarung auch Nukleotidkonstrukte, Vektoren und Wirtszellen zur Exprimierung von Fusionsproteinen bereit, die einen Prime- Editor und eine oder mehrere NLS umfassen.
Die hierin beschriebenen Multi-Flap-Prime-Editoren können auch Kernlokalisierungssignale umfassen, die über einen oder mehrere Linker, z. B. ein polymeres, Aminosäure-, Nukleinsäure-, Polysaccharid-, chemisches oder Nukleinsäure-Linkerelement, mit einem Prime-Editor verknüpft sind. Die Linker im Rahmen der Offenbarung sollen keine Einschränkungen aufweisen und können jede beliebige geeignete Art von Molekül sein (z. B. Polymer, Aminosäure, Polysaccharid, Nukleinsäure, Lipid oder eine beliebige synthetische chemische Linker-Domäne) und mit dem Prime-Editor durch eine geeignete Strategie verbunden werden, die die Bildung einer Bindung (z. B. kovalente Bindung, Wasserstoffbrückenbindung) zwischen dem Prime-Editor und der einen oder mehreren NLS bewirkt.
C. Flap-Endonukleasen (z. B. FEN1)
In verschiedenen Ausführungsformen können die PE-Fusionsproteine eine oder mehrere Flap-Endonulceasen (z. B. FEN1) umfassen, d. h. ein Enzym, das die Entfernung von 5'-Einzelstrang-DNA-Flaps katalysiert. Dabei handelt es sich um natürlich vorkommende Enzyme, die die Entfernung von 5'-Flaps, die während zellulärer Prozesse, einschließlich der DNA-Replikation, gebildet werden, verarbeiten. Die hierin beschriebenen Verfahren zum Multi-Flap-Prime-Editing können endogen bereitgestellte Flap-Endonukleasen oder solche, die in trans bereitgestellt werden, verwenden, um den 5'-Flap der endogenen DNA zu entfernen, der während des Multi-Flap-Prime-Editing an der Zielstelle gebildet wird. Flap-Endonukleasen sind in der Technik bekannt und sind bei Patel et al. „Flap endonucleases pass 5'-flaps through a flexible arch using a disorder-thread-order mechanism to confer specificity for free 5'-ends“, Nucleic Acids Research, 2012, 40(10): 4507-4519, und Tsutakawa et al. „Human flap endonuclease structures, DNA double-base flipping, and a unified understanding of the FEN1 superfamily“, Cell, 2011, 145(2): 198-211, beschrieben (die hierin jeweils durch Bezugnahme aufgenommen sind). Eine beispielhafte Flap-Endonuklease ist FEN1, die durch die folgende Aminosäuresequenz dargestellt werden kann:

Beschreibung Sequenz SEQ-ID-Nr:

FEN1 Wildtyp (wt)
SEQ ID NO: 198

Die Flap-Endonukleasen können auch eine beliebige FEN1-Variante, -Mutante oder ein anderes Ortholog, Homolog oder eine Variante der Flap-Endonuklease beinhalten. Nicht einschränkende Beispiele für FEN1-Varianten sind die folgenden:

Beschreibung	Sequenz	SEQ-ID-Nr:
FEN1 K168R (relativ zu FEN1 wt)		SEQ ID NO: 199
FEN1 S187A (relativ zu FEN1 wt)		SEQ ID NO: 200
FEN1 K354R (relativ zu FEN1 wt)		SEQ ID NO: 201
GEN1		SEQ ID NO: 202
ERCC5		SEQ ID NO: 203

In verschiedenen Ausführungsformen können die hierin in Betracht gezogenen Multi- Flap-Prime-Editor-Fusionsproteine jede beliebige Flap-Endonuklease-Variante der oben offenbarten Sequenzen beinhalten, die eine Aminosäuresequenz aufweisen, die zu mindestens etwa 70 % identisch, zu mindestens etwa 80 % identisch, zu mindestens etwa 90 % identisch, zu mindestens etwa 95 % identisch, zu mindestens etwa 96 % identisch, zu mindestens etwa 97 % identisch, zu mindestens etwa 98 % identisch, zu mindestens etwa 99,5 % identisch oder zu mindestens etwa 99,9 % identisch mit einer beliebigen der oben genannten Sequenzen ist.
Andere Endonukleasen, die in den vorliegenden Verfahren zur Erleichterung der Entfernung des 5'-Einzelstrang-DNA-Flaps verwendet werden können, beinhalten unter anderem (1) trex 2, (2) exo1-Endonuklease (z. B. Keijzers et al. Biosci Rep. 2015, 35(3): e00206)
Trex 2
3'-Drei-Prime-Reparatur-Exonuklease 2 (TREX2) - Mensch
Zugriffs-Nr. NM_080701
3'-Drei-Prime-Reparatur-Exonuklease 2 (TREX2) - Maus
Zugriffs-Nr. NM_011907
3'- Drei-Prime-Reparatur-Exonuklease 2 (TREX2) - Ratte
Zugriffs-Nr. NM_001107580
ExoI
Die humane Exonuklease 1 (EXO1) ist an vielen verschiedenen DNA- Stoffwechselprozessen beteiligt, die die Reparatur von DNA-Diskrepanzen (MMR), die mikrovermittelte Endverbindung, die homologe Rekombination (HR) und die Replikation beinhalten. Das humane EXO1 gehört zu einer Familie von eukaryotischen Nukleasen, Rad2/XPG, die auch FEN1 und GEN1 beinhaltet. Die Rad2/XPG-Familie ist in der Nuklease- Domäne über alle Spezies hinweg konserviert, vom Phagen bis zum Menschen. Das EXO1- Genprodukt weist sowohl 5'-Exonuklease- als auch 5'-Flap-Aktivität auf. Außerdem enthält EXO1 eine intrinsische 5'-RNase-H-Aktivität. Humanes EXO1 weist eine hohe Affinität für die Verarbeitung von doppelsträngiger DNA (dsDNA), Nicks, Lücken und Pseudo-Y- Strukturen auf und kann Holliday-Strukturen mit Hilfe seiner angeborenen Flap-Aktivität auflösen. Das humane EXO1 ist an der MMR beteiligt und enthält konservierte Bindungsdomänen, die direkt mit MLH1 und MSH2 interagieren. Die nukleolytische Aktivität von EXO1 wird durch PCNA, MutSa (MSH2/MSH6-Komplex), 14-3-3, MRN und 9-1-1- Komplex positiv stimuliert.
Exonuklease 1 (EXO1) Zugriffs-Nr. NM_003686 (Homo sapiens Exonuklease 1 (EXO1), Transkriptvariante 3) - Isoform A
Exonuklease 1 (EXO1) Zugriffs-Nr. NM_006027 (Homo sapiens Exonuklease 1 (EXO1), Transkriptvariante 3) - Isoform B
Exonuklease 1 (EXO1) Zugriffs-Nr. NM_001319224 (Homo sapiens Exonuklease 1 (EXO1), Transkriptvariante 4) - Isoform C
D. Inteine und Split-Inteine
Es versteht sich, dass es in einigen Ausführungsformen (z. B. Einschleusung eines Multi-Flap-Prime-Editors in vivo unter Verwendung von AAV-Partikeln) von Vorteil sein kann, ein Polypeptid (z. B. eine Deaminase oder ein napDNAbp) oder ein Fusionsprotein (z. B. einen Multi-Flap-Prime-Editor) in eine N-terminale und eine C-terminale Hälfte zu splitten, sie separat einzuschleusen und dann ihre Kolokalisierung zuzulassen, um das vollständige Protein (bzw. Fusionsprotein) in der Zelle neu zu bilden. Separate Hälften eines Proteins oder eines Fusionsproteins können jeweils ein Split-Intein-Tag umfassen, um die Neubildung des vollständigen Proteins oder Fusionsproteins durch den Mechanismus des Protein-Trans- Splicing zu erleichtern.
Das Trans-Splicing von Proteinen, das durch Split-Inteine katalysiert wird, stellt ein rein enzymatisches Verfahren zur Proteinbindung bereit. Bei einem Split-Intein handelt es sich im Wesentlichen um ein zusammenhängendes Intein (z. B. ein Mini-Intein), das in zwei Teile, das N-Intein und das C-Intein, gesplittet wird. Das N-Intein und das C-Intein eines Split-Inteins können sich nicht-kovalent verbinden, um ein aktives Intein zu bilden und die Spleißreaktion im Wesentlichen auf die gleiche Weise zu katalysieren wie ein zusammenhängendes Intein. Split-Inteine wurden in der Natur gefunden und auch in Labors hergestellt. Wie hierin verwendet, bezieht sich der Begriff „Split-Intein“ auf jedes Intein, bei dem eine oder mehrere Peptidbindungen zwischen den N-terminalen und C-terminalen Aminosäuresequenzen unterbrochen sind, so dass die N-terminalen und C-terminalen Sequenzen zu separaten Molekülen werden, die sich nicht-kovalent reassoziieren oder zu einem Intein rekonstituieren können, das für Trans-Splicing-Reaktionen funktional ist. Jedes katalytisch aktive Intein oder Fragment davon kann verwendet werden, um ein Split-Intein zur Verwendung in den erfindungsgemäßen Verfahren abzuleiten. Zum Beispiel kann in einem Aspekt das Split-Intein von einem eukaryotischen Intein abgeleitet sein. In einem anderen Aspekt kann das Split-Intein von einem bakteriellen Intein abgeleitet sein. In einem anderen Aspekt kann das Split-Intein von einem Archaeen-Intein abgeleitet sein. Vorzugsweise besitzt das so gewonnene Split- Intein nur die Aminosäuresequenzen, die für die Katalyse von Trans-Splicing-Reaktionen wesentlich sind.
Wie hierin verwendet, bezieht sich das „N-terminale Split-Intein (In)“ auf jede Intein- Sequenz, die eine N-terminale Aminosäuresequenz umfasst, die für Trans-Splicing-Reaktionen funktionell ist. Ein In umfasst also auch eine Sequenz, die beim Trans-Splicing ausgespleißt wird. Ein In kann eine Sequenz umfassen, die eine Modifikation des N-terminalen Abschnitts einer natürlich vorkommenden Intein-Sequenz ist. Zum Beispiel kann ein In zusätzliche Aminosäurereste und/oder mutierte Reste umfassen, solange die Aufnahme solcher zusätzlichen und/oder mutierten Reste das In beim Trans-Splicing nicht funktionsunfähig macht. Vorzugsweise verbessert oder steigert die Aufnahme der zusätzlichen und/oder mutierten Reste die Trans-Splicing-Aktivität des In.
Wie hierin verwendet, bezieht sich das „C-terminale Split-Intein (Ic)“ auf jede Intein- Sequenz, die eine C-terminale Aminosäuresequenz umfasst, die für Trans-Splicing-Reaktionen funktionell ist. In einem Aspekt umfasst das Ic 4 bis 7 zusammenhängende Aminosäurereste, von denen mindestens 4 Aminosäuren aus dem letzten β-Strang des Inteins stammen, von dem es abgeleitet wurde. Ein Ic umfasst also auch eine Sequenz, die beim Trans-Splicing ausgespleißt wird. Ein Ic kann eine Sequenz umfassen, die eine Modifikation des C terminalen Abschnitts einer natürlich vorkommenden Intein-Sequenz ist. Zum Beispiel kann ein Ic zusätzliche Aminosäurereste und/oder mutierte Reste umfassen, solange die Aufnahme solcher zusätzlichen und/oder mutierten Reste das In beim Trans-Splicing nicht funktionsunfähig macht. Vorzugsweise verbessert oder steigert die Aufnahme der zusätzlichen und/oder mutierten Reste die Trans-Splicing-Aktivität des Ic.
In einigen Ausführungsformen der Erfindung kann ein mit einem Ic oder einem In verknüpftes Peptid eine zusätzliche chemische Einheit umfassen, die unter anderem Fluoreszenzgruppen, Biotin, Polyethylenglykol (PEG), Aminosäureanaloga, unnatürliche Aminosäuren, Phosphatgruppen, Glycosylgruppen, Radioisotopenmarker und pharmazeutische Moleküle beinhaltet. In anderen Ausführungsformen kann ein mit einem Ic verknüpftes Peptid eine oder mehrere chemisch reaktive Gruppen umfassen, die u. a. Keton, Aldehyd, Cys-Reste und Lys-Reste beinhalten. Das N-Intein und das C-Intein eines Split- Inteins können sich nicht-kovalent verbinden, um ein aktives Intein zu bilden und die Spleißreaktion zu katalysieren, wenn ein „Intein-Splicing-Polypeptid (ISP)“ vorhanden ist. Wie hierin verwendet, bezieht sich „Intein-Splicing-Polypeptid (ISP)“ auf den Abschnitt der Aminosäuresequenz eines Split-Inteins, der übrig bleibt, wenn das Ic, das In oder beide aus dem Split-Intein entfernt werden. In bestimmten Ausführungsformen umfasst das In das ISP. In einer anderen Ausführungsform umfasst das Ic das ISP. In einer weiteren Ausführungsform ist das ISP ein separates Peptid, das weder mit In noch mit Ic kovalent verknüpft ist.
Split-Inteine können aus zusammenhängenden Inteinen gebildet werden, indem eine oder mehrere Splitstellen in die unstrukturierte Schleife oder die dazwischen liegende Aminosäuresequenz zwischen den -12 konservierten Betasträngen, die in der Struktur der Mini-Inteine zu finden sind, eingebaut werden. Eine gewisse Flexibilität bei der Position der Splitstellen in den Regionen zwischen den Betasträngen ist möglich, vorausgesetzt, dass die Struktur des Inteins, insbesondere die strukturierten Betastränge, durch die Schaffung der Splitstelle nicht so stark gestört wird, dass die Proteinspleißaktivität verloren geht.
Beim Trans-Splicing von Proteinen besteht ein Vorläuferprotein aus einem N-Extein- Teil, auf den das N-Intein folgt, ein anderes Vorläuferprotein besteht aus dem C-Intein, auf das ein C-Extein-Teil folgt, und eine Trans-Splicing-Reaktion (die von den N- und C-Inteinen gemeinsam katalysiert wird) schneidet die beiden Intein-Sequenzen heraus und verknüpft die beiden Extein-Sequenzen mit einer Peptidbindung. Protein-Trans-Splicing ist eine enzymatische Reaktion, die mit sehr niedrigen (z. B. mikromolaren) Proteinkonzentrationen arbeiten kann und unter physiologischen Bedingungen durchgeführt werden kann.
Beispielhafte-Sequenzen sind wie folgt:

NAME SEQUENZ DES LIGANDENABHÄNGIGEN INTEINS

2-4-INTEIN:

3-2-INTEIN

30R3-1-INTEIN

30R3-2-INTEIN

30R3-3-INTEIN

37R3-1-INTEIN

37R3-2-INTEIN

37R3-3-INTEIN
Obwohl Inteine am häufigsten als zusammenhängende Domäne vorkommen, gibt es auch einige, die von Natur aus in gesplitteter Form vorliegen. In diesem Fall werden die beiden Fragmente als getrennte Polypeptide exprimiert und müssen sich vor dem Spleißen verbinden, das so genannte Protein-Trans-Splicing.
Ein beispielhaftes Split-Intein ist das Ssp-DnaE-Intein, das zwei Untereinheiten umfasst, nämlich DnaE-N und DnaE-C. Die beiden unterschiedlichen Untereinheiten werden von separaten Genen kodiert, nämlich dnaE-n und dnaE-c, die für die Untereinheiten DnaE-N bzw. DnaE-C kodieren. DnaE ist ein natürlich vorkommendes Split-Intein in Synechocytis sp. PCC6803 und ist in der Lage, das Trans-Splicing von zwei separaten Proteinen zu steuern, die jeweils eine Fusion mit DnaE-N oder DnaE-C umfassen.
Weitere natürlich vorkommende oder künstlich hergestellte Split-Intein-Sequenzen sind bekannt oder können aus den hierin beschriebenen oder in der Fachwelt verfügbaren Ganz- Intein-Sequenzen hergestellt werden. Beispiele für Split-Intein-Sequenzen sind zu finden in Stevens et al. „A promiscuous split intein with expanded protein engineering applications“, PNAS, 2017, Vol.114: 8538-8543; Iwai et al. „Highly efficient protein trans-splicing by a naturally split DnaE intein from Nostc punctiforme“, FEBS Lett, 580: 1853-1858, die hierin jeweils durch Bezugnahme aufgenommen sind. Weitere Split-Intein-Sequenzen finden sich beispielsweise in WO 2013/045632 , WO 2014/055782 , WO 2016/069774 und EP2877490 , deren Inhalte hierin jeweils durch Bezugnahme aufgenommen sind.
Darüber hinaus wurde das Proteinspleißen in trans in vivo und in vitro beschrieben (Shingledecker, et al., Gene 207:187 (1998), Southworth, et al., EMBOJ. 17:918 (1998); Mills, et al., Proc. Natl. Acad. Sci. USA, 95:3543-3548 (1998); Lew, et al., J. Biol. Chem., 273:15887- 15890 (1998); Wu, et al., Biochim. Biophys. Acta 35732:1 (1998b), Yamazaki, et al., J. Am. Chem. Soc. 120:5591 (1998), Evans, et al., J. Biol. Chem. 275:9091 (2000); Otomo, et al., Biochemistry 38:16040-16044 (1999); Otomo, et al., J. Biolmol. NMR 14:105-114 (1999); Scott, et al., Proc. Natl. Acad. Sci. USA 96:13638-13643 (1999)) und stellt die Möglichkeit bereit, ein Protein in zwei inaktiven Fragmenten zu exprimieren, die anschließend durch Ligation ein funktionelles Produkt bilden, z. B. wie in 66 und 67 im Hinblick auf die Bildung eines vollständigen PE-Fusionsproteins aus zwei getrennt exprimierten Hälften gezeigt.
E. RNA-Protein-Interaktionsdomäne
In verschiedenen Ausführungsformen können zwei separate Proteindomänen (z. B. eine Cas9-Domäne und eine Polymerase-Domäne) miteinander kolokalisiert werden, um einen funktionellen Komplex zu bilden (ähnlich der Funktion eines Fusionsproteins, das die beiden separaten Proteindomänen umfasst), indem ein „RNA-Protein-Rekrutierungssystem“ wie die „MS2-Tagging-Technik“ verwendet wird. Bei solchen Systemen wird in der Regel eine Proteindomäne mit einer „RNA-Protein-Interaktionsdomäne“ (auch „RNA-Protein- Rekrutierungsdomäne“ genannt) und die andere mit einem „RNA-bindenden Protein“ markiert, das die RNA-Protein-Interaktionsdomäne spezifisch erkennt und an sie bindet, z. B. eine spezifische Haarnadelstruktur. Diese Arten von Systemen können zur Kolokalisierung der Domänen eines Multi-Flap-Prime-Editors sowie zur Rekrutierung zusätzlicher Funktionalitäten für einen Multi-Flap-Prime-Editor, wie z. B. eine UGI-Domäne, genutzt werden. In einem Beispiel basiert die MS2-Tagging-Technik auf der natürlichen Wechselwirkung des MS2-Bakteriophagen-Hüllproteins („MCP“ oder „MS2cp“) mit einer im Genom des Phagen vorhandenen Stielschleifen- oder Haarnadelstruktur, d. h. der „MS2- Haarnadel“. Im Falle der MS2-Haarnadel wird sie vom MS2-Bakteriophagen-Hüllprotein (MCP) erkannt und gebunden. So kann in einem Beispielszenario eine Deaminase-MS2-Fusion eine Cas9-MCP-Fusion rekrutieren.
Eine Übersicht über andere modulare RNA-Protein-Interaktionsdomänen ist in der Fachliteratur beschrieben, zum Beispiel in Johansson et al. „RNA recognition by the MS2 phage coat protein", Sein Virol, 1997, Vol. 8(3): 176-185; Delebecque et al. „Organization of intracellular reactions with rationally designed RNA assemblies," Science, 2011, Vol. 333: 470-474; Mali et al. „Cas9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering", Nat. Biotechnol., 2013, Vol.31: 833-838; und Zalatan et al. „Engineering complex synthetic transcriptional programs with CRISPR RNA scaffolds", Cell, 2015, Vol. 160: 339-350, die hierin jeweils in ihrer Gesamtheit durch Bezugnahme aufgenommen sind. Andere Systeme beinhalten die PP7-Haarnadel, die speziell das PCP-Protein rekrutiert, und die „Com“-Haamadel, die speziell das Com-Protein rekrutiert. Siehe Zalatan et al.
Die Nukleotidsequenz der MS2-Haarnadel (oder gleichwertig als „MS2-Aptamer“ bezeichnet) ist: GCCAACATGAGGATCACCCATGTCTGCAGGGCC (SEQ-ID-NR: 763).
Die Aminosäuresequenz des MCP oder MS2cp ist:
F. UGI-Domäne
In anderen Ausführungsformen können die hierin beschriebenen Multi-Flap-Prime- Editoren eine oder mehrere Uracil-Glycosylase-Inhibitor-Domänen umfassen. Der Begriff „Uracil-Glykosylase-Inhibitor (UGI)“ oder „UGI-Domäne“, wie hierin verwendet, bezieht sich auf ein Protein, das in der Lage ist, ein Uracil-DNA-Glykosylase-Basenausschneide- Reparaturenzym zu hemmen. In einigen Ausführungsformen umfasst eine UGI-Domäne ein Wildtyp-UGI oder ein UGI, wie dargelegt in SEQ-ID-NR: 3873. In einigen Ausführungsformen beinhalten die hierin bereitgestellten UGI-Proteine Fragmente von UGI und Proteine, die zu einem UGI oder einem UGI-Fragment homolog sind. Zum Beispiel umfasst in einigen Beispielen eine UGI-Domäne ein Fragment der Aminosäuresequenz, die in SEQ-ID-NR: 3873 dargelegt ist. In einigen Ausführungsformen umfasst ein UGI-Fragment eine Aminosäuresequenz, die mindestens 60 %, mindestens 65 %, mindestens 70 %, mindestens 75 %, mindestens 80 %, mindestens 85 %, mindestens 90 %, mindestens 95 %, mindestens 96 %, mindestens 97 %, mindestens 98 %, mindestens 99 % oder mindestens 99,5 % der Aminosäuresequenz umfasst, wie dargelegt in SEQ-ID-NR: 3873. In einigen Ausführungsformen umfasst ein UGI eine Aminosäuresequenz, die homolog zu der in SEQ- ID-NR: 3873 dargelegten Aminosäuresequenz ist, oder eine Aminosäuresequenz, die zu einem Fragment der in SEQ-ID-NR: 3873 dargelegten Aminosäuresequenz homolog ist. In einigen Ausführungsformen werden Proteine, die UGI oder Fragmente von UGI oder Homologe von UGI oder UGI-Fragmenten umfassen, als „UGI-Varianten“ bezeichnet. Eine UGI-Variante weist eine Homologie zu UGI oder einem Fragment davon auf. Zum Beispiel ist eine UGI- Variante zu mindestens 70 % identisch, zu mindestens 75 % identisch, zu mindestens 80 % identisch, zu mindestens 85 % identisch, zu mindestens 90 % identisch, zu mindestens 95 % identisch, zu mindestens 96 % identisch, zu mindestens 97 % identisch, zu mindestens 98 % identisch, zu mindestens 99 % identisch, zu mindestens 99,5 % identisch oder zu mindestens 99,9 % identisch mit einem Wildtyp UGI oder einem UGI, wie dargelegt in SEQ-ID-NR: 3873. In einigen Ausführungsformen umfasst die UGI-Variante ein Fragment von UGI, so dass das Fragment zu mindestens 70 % identisch, zu mindestens 80 % identisch, zu mindestens 90 % identisch, zu mindestens 95 % identisch, zu mindestens 96 % identisch, zu mindestens 97 % identisch, zu mindestens 98 % identisch, zu mindestens 99 % identisch, zu mindestens 99,5 % identisch oder zu mindestens 99,9 % identisch mit dem entsprechenden Fragment von Wildtyp UGI oder einem UGI ist, wie dargelegt in SEQ ID-NR: 3873. In einigen Ausführungsformen umfasst der UGI die folgende Aminosäuresequenz:

Uracil-DNA-Glycosylase-Inhibitor:
- >sp|P14739|UNGI_BPPB2

Die hierin beschriebenen Multi-Flap-Prime-Editoren können mehr als eine UGI- Domäne umfassen, die durch einen oder mehrere Linker, wie hierin beschrieben, getrennt sein können.
G. Zusätzliche PE-Elemente
In bestimmten Ausführungsformen können die hierin beschriebenen Multi-Flap-Prime- Editoren einen Inhibitor der Basenreparatur umfassen. Der Begriff „Inhibitor der Basenreparatur“ oder „IBR“ bezieht sich auf ein Protein, das in der Lage ist, die Aktivität eines Nukleinsäure-Reparaturenzyms, zum Beispiel eines Basen-Exzisions-Reparaturenzyms, zu hemmen. In einigen Ausführungsformen ist der IBR ein Inhibitor der OGG-Basen- Exzisionsreparatur. In einigen Ausführungsformen ist der IBR ein Inhibitor der Basen- Exzisionsreparatur („iBER“). Beispielhafte Inhibitoren der Basen-Exzisionsreparatur beinhalten Inhibitoren von APE1, Endo III, Endo IV, Endo V, Endo VIII, Fpg, hOGG1, hNEIL1, T7 EndoI, T4PDG, UDG, hSMUG1, und hAAG. In einigen Ausführungsformen ist der IBR ein Inhibitor von Endo V oder hAAG. In einigen Ausführungsformen ist der IBR ein iBER, bei dem es sich um eine katalytisch inaktive Glykosylase oder katalytisch inaktive Dioxygenase oder um einen niedermolekularen oder peptidischen Inhibitor einer Oxidase oder Varianten davon handeln kann. In einigen Ausführungsformen ist der IBR ein iBER, der ein TDG-Inhibitor, MBD4-Inhibitor oder ein Inhibitor eines AlkBH-Enzyms sein kann. In einigen Ausführungsformen ist der IBR ein iBER, der ein katalytisch inaktives TDG oder ein katalytisch inaktives MBD4 umfasst. Ein beispielhaftes katalytisch inaktives TDG ist eine N140A-Mutante von SEQ-ID-NR: 3872 (humanes TDG).
Im Folgenden werden einige beispielhafte Glykosylasen bereitgestellt. Die katalytisch inaktivierten Varianten dieser Glykosylase-Domänen sind iBERs, die mit der napDNAbp- oder Polymerase-Domäne der in dieser Offenbarung bereitgestellten Multi-Flap-Prime-Editoren fusioniert werden können.
OGG (human)
MBD4 (human)
TDG (human)
In einigen Ausführungsformen können die hierin beschriebenen Fusionsproteine eine oder mehrere heterologe Proteindomänen umfassen (z. B. etwa oder mehr als etwa 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 oder mehr Domänen zusätzlich zu den Prime-Editor-Komponenten). Ein Fusionsprotein kann eine beliebige zusätzliche Proteinsequenz und gegebenenfalls eine Linker-Sequenz zwischen zwei beliebigen Domänen umfassen. Andere beispielhafte Merkmale, die vorhanden sein können, sind Lokalisierungssequenzen, wie z.B. zytoplasmatische Lokalisierungssequenzen, Exportsequenzen, wie z. B. Kernexportsequenzen, oder andere Lokalisierungssequenzen, sowie Sequenz-Tags, die für die Solubilisierung, Reinigung oder Erkennung der Fusionsproteine nützlich sind.
Beispiele von Proteindomänen, die mit einem Multi-Flap-Prime-Editor oder einer Komponente davon (z. B. der napDNAbp-Domäne, der Polymerase-Domäne oder der NLS- Domäne) fusioniert werden können, beinhalten ohne Einschränkung Epitop-Markierungen und Reportergen-Sequenzen. Nicht einschränkende Beispiele für Epitop-Tags beinhalten Histidin (His)-Tags, V5-Tags, FLAG-Tags, Influenza-Hämagglutinin (HA)-Tags, Myc-Tags, VSV-G- Tags und Thioredoxin (Trx)-Tags. Beispiele für Reportergene beinhalten unter anderem Glutathion-5-Transferase (GST), Meerrettichperoxidase (HRP), Chloramphenicol- Acetyltransferase (CAT), Beta-Galaktosidase, Beta-Glucuronidase, Luciferase, grün fluoreszierendes Protein (GFP), HcRed, DsRed, cyan fluoreszierendes Protein (CFP), gelb fluoreszierendes Protein (YFP) und autofluoreszierende Proteine, die blau fluoreszierendes Protein (BFP) beinhalten. Ein Multi-Flap-Prime-Editor kann mit einer Gensequenz fusioniert werden, die ein Protein oder ein Fragment eines Proteins kodiert, das DNA-Moleküle bindet oder andere zelluläre Moleküle bindet, einschließlich unter anderem Maltose-Bindungsprotein (MBP), S-Tag, Lex-A-DNA-Bindungsdomänen (DBD)-Fusionen, GAL4-DNA- Bindungsdomänen-Fusionen und Herpes-Simplex-Virus (HSV)-BP16-Protein-Fusionen. Zusätzliche Domänen, die Teil eines Prime-Editors sein können, sind in der US- Patentveröffentlichung Nr. 2011/0059502 beschrieben, die am 10. März 2011 veröffentlicht wurde und durch Bezugnahme hierin vollständig aufgenommen ist.
In einem Aspekt der Offenbarung kann ein Reportergen beinhaltend unter anderem Glutathion-5-Transferase (GST), Meerrettichperoxidase (HRP), Chloramphenicol- Acetyltransferase (CAT), beta-Galactosidase, beta-Glucuronidase, Luciferase, grün fluoreszierendes Protein (GFP), HcRed, DsRed, cyan fluoreszierendes Protein (CFP), gelb fluoreszierendes Protein (YFP) und autofluoreszierende Proteine, die blau fluoreszierendes Protein (BFP) beinhalten, in eine Zelle eingebracht werden, um ein Genprodukt zu kodieren, das als Marker dient, um die Veränderung oder Modifikation der Exprimierung des Genprodukts zu messen. In bestimmten Ausführungsformen der Offenbarung ist das Genprodukt Luciferase. In einer weiteren Ausführungsform der Offenbarung ist die Exprimierung des Genprodukts vermindert.
Geeignete, hierin bereitgestellte Protein-Tags beinhalten unter anderem Biotin- Carboxylase-Trägerprotein (BCCP)-Tags, Myc-Tags, Calmodulin-Tags, FLAG-Tags, Hämagglutinin (HA)-Tags, Polyhistidin-Tags, auch Histidin-Tags oder His-Tags genannt, Maltose-Bindungsprotein (MBP)-Tags, Nus-Tags, Glutathion-S-Transferase (GST)-Tags, grün fluoreszierendes Protein (GFP)-Tags, Thioredoxin-Tags, S-Tags, Softags (z. g., Softag 1, Softag 3), Strep-Tags, Biotin-Ligase-Tags, FlAsH-Tags, V5-Tags und SBP-Tags. Weitere geeignete Sequenzen sind für den Fachmann offensichtlich. In einigen Ausführungsformen umfasst das Fusionsprotein einen oder mehrere His-Tags.
In einigen Ausführungsformen der vorliegenden Offenbarung kann die Aktivität des Multi-Flap-Prime-Editing-Systems zeitlich reguliert werden, indem die Verweilzeit, die Menge und/oder die Aktivität der exprimierten Komponenten des PE-Systems angepasst werden. Zum Beispiel kann, wie hierin beschrieben, das PE mit einer Proteindomäne fusioniert werden, die in der Lage ist, die intrazelluläre Halbwertszeit des PE zu modifizieren. In bestimmten Ausführungsformen, die zwei oder mehr Vektoren umfassen (z. B. ein Vektorsystem, in dem die hierin beschriebenen Komponenten auf zwei oder mehr separaten Vektoren kodiert sind), kann die Aktivität des PE-Systems zeitlich reguliert werden, indem der Zeitpunkt, zu dem die Vektoren geliefert werden, gesteuert wird. Zum Beispiel kann in einigen Ausführungsformen ein Vektor, der das Nuklease-System kodiert, das PE vor dem Vektor liefern, der das Templat kodiert. In anderen Ausführungsformen kann der Vektor, der die PEgRNA kodiert, den Guide vor dem Vektor liefern, der das PE-System kodiert. In einigen Ausführungsformen werden die Vektoren, die das PE-System und die PEgRNA kodieren, gleichzeitig bereitgestellt. In bestimmten Ausführungsformen liefern die gleichzeitig eingeschleusten Vektoren vorübergehend z. B. die PE-, PEgRNA- und/oder Zweitstrang-Leit- RNA-Komponenten. In weiteren Ausführungsformen kann die von der Codierung auf den Vektoren transkribierte RNA (wie z. B. das Nuklease-Transkript) ferner mindestens ein Element umfassen, das in der Lage ist, die intrazelluläre Halbwertszeit der RNA zu modifizieren und/oder die Translationskontrolle zu modulieren. In einigen Ausführungsformen kann die Halbwertszeit der RNA erhöht werden. In einigen Ausführungsformen kann die Halbwertszeit der RNA verringert werden. In einigen Ausführungsformen kann das Element in der Lage sein, die Stabilität der RNA zu erhöhen. In einigen Ausführungsformen kann das Element in der Lage sein, die Stabilität der RNA zu verringern In einigen Ausführungsformen kann sich das Element innerhalb der 3'-UTR der RNA befinden. In einigen Ausführungsformen kann das Element ein Polyadenylierungssignal (PA) beinhalten. In einigen Ausführungsformen kann das Element eine Kappe beinhalten, z. B. ein vorgelagertes mRNA- oder PEgRNA-Ende. In einigen Ausführungsformen kann die RNA kein PA umfassen, so dass sie nach der Transkription einem schnelleren FIGau in der Zelle unterliegt. In einigen Ausführungsformen kann das Element mindestens ein AU-reiches Element (ARE) beinhalten. Die AREs können von ARE-Bindungsproteinen (ARE-BPs) in einer Weise gebunden werden, die vom Gewebetyp, Zelltyp, Zeitpunkt, der zellulären Lokalisierung und der Umgebung abhängt. In einigen Ausführungsformen kann das destabilisierende Element den RNA-Zerfall fördern, die RNA-Stabilität beeinflussen oder die Translation aktivieren. In einigen Ausführungsformen kann das ARE eine Länge von 50 bis 150 Nukleotiden umfassen. In einigen Ausführungsformen kann das ARE mindestens eine Kopie der Sequenz AUUUA umfassen. In einigen Ausführungsformen kann mindestens ein ARE an die 3'-UTR der RNA angefügt werden. In einigen Ausführungsformen kann das Element ein Woodchuck-Hepatitis-sVirus (WHP) sein.
Posttranskriptionelles regulatorisches Element (WPRE), das eine Tertiärstruktur zur Verstärkung der Exprimierung des Transkripts erzeugt. In weiteren Ausführungsformen ist das Element eine modifizierte und/oder trunkierte WPRE-Sequenz, die in der Lage ist, die Exprimierung des Transkripts zu verstärken, wie zum Beispiel in Zufferey et al., J Virol, 73(4): 2886-92 (1999) und Flajolet et al., J Virol, 72(7): 6175-80 (1998). In einigen Ausführungsformen kann das WPRE oder ein gleichwertiges Element der 3'-UTR der RNA hinzugefügt werden. In einigen Ausführungsformen kann das Element aus anderen RNA- Sequenzmotiven ausgewählt werden, die entweder in schnell oder langsam abklingenden Transkripten angereichert sind.
In einigen Ausführungsformen kann der Vektor, der den PE oder die PEgRNA kodiert, durch Spaltung einer auf dem Vektor vorhandenen Zielsequenz durch das PE-System selbst zerstört werden. Die Spaltung kann die weitere Transkription eines PE oder einer PEgRNA aus dem Vektor verhindern. Obwohl die Transkription auf dem linearisierten Vektor für eine gewisse Zeit erfolgen kann, werden die exprimierten Transkripte oder Proteine, die dem intrazellulären FIGau unterliegen, weniger Zeit haben, um Off-Target-Effekte zu erzeugen, wenn die Exprimierung der kodierenden Vektoren nicht fortgesetzt wird.
[61] PEgRNAs
Für das hierin beschriebene Multi-Flap-Prime-Editing-System können alle beliebigen geeigneten PEgRNAs verwendet werden. Der Mechanismus der Target-primed Reverse Transcription (TPRT) kann für die Durchführung von präzisem und vielseitigem CRISPR/Casbasiertem Genom-Editing genutzt oder angepasst werden, indem eine speziell konfigurierte Leit-RNA verwendet wird, die eine Templat-Sequenz für die Reverse Transkription (RT) umfasst, die für die gewünschte Nukleotidänderung kodiert. Die Anmeldung bezeichnet diese speziell konfigurierte Leit-RNA als „verlängerte Leit-RNA“ oder „PEgRNA“, da die RT- Templat-Sequenz als Verlängerung eines Standard- oder herkömmlichen Leit-RNA-Moleküls bereitgestellt werden kann. Die Anmeldung sieht jede beliebige geeignete Konfiguration oder Anordnung für die verlängerten Leit-RNAs zur Verwendung im Dual-Flap- und Quadruple- Flap-Prime-Editing vor.
Die allgemeinen Ausgestaltungen von pegRNAs, die für Dual-Flap- und Multi-Flap- Prime-Editing verwendet werden, werden in 92 gezeigt. pegRNAs, die für das Dual-Flap- und Multi-Flap-Prime-Editing verwendet werden, haben eine ähnliche Ausgestaltung wie diejenigen, die für das klassische Prime-Editing verwendet werden, jedoch ist es nicht erforderlich, dass die RT-Templat-Region eine Homologie zum Ziel-Locus aufweist. Stattdessen können die beiden pegRNAs in verschiedenen Ausführungsformen RT-Template enthalten, die die Synthese von 3'-Flaps kodieren, deren 3'-Enden zueinander komplementäre Sequenzen sind. Diese Komplementarität zwischen den 3'-Flaps fördert deren Hybridisierung und den Austausch der endogenen DNA-Sequenz durch die beabsichtigte neue DNA-Sequenz. Dies setzt voraus, dass die 5'-Regionen der RT-Template in den beiden pegRNAs zueinander umgekehrt komplementäre Sequenzen sind, und dieser Grad der Komplementarität kann variieren (92).
PEgRNA-Architektur
3A zeigt eine Ausführungsform einer verlängerten Leit-RNA, die in dem hier offenbarten Multi-Flap-Prime-Editing-System verwendet werden kann, wobei eine herkömmliche Leit-RNA (der grüne Abschnitt) eine ~20 nt Protospacer-Sequenz und eine gRNA-Kernregion beinhaltet, die sich mit dem napDNAbp verbindet. In dieser Ausführungsform beinhaltet die Leit-RNA ein verlängertes RNA-Segment am 5'-Ende, d. h. eine 5'- Verlängerung. In dieser Ausführungsform beinhaltet die 5'-Verlängerung eine Templat-Sequenz für die reverse Transkription, eine Bindungsstelle für den Primer für die reverse Transkription und eine optionale 5-20 Nukleotid-Linkersequenz. Wie in den 1A- 1B gezeigt, hybrisiert die RT-Primer-Bindungsstelle an das freie 3'-Ende, das nach der Bildung eines Nicks im Nicht-Zielstrang der R-Schleife gebildet wird, wodurch die reverse Transkriptase für die DNA-Polymerisation in 5'-3'-Richtung geprimt wird.
3B zeigt eine weitere Ausführungsform einer verlängerten Leit-RNA, die in dem hier offenbarten-Prime-Editing-System verwendet werden kann, wobei eine herkömmliche Leit-RNA (der grüne Abschnitt) eine -20 nt Protospacer-Sequenz und einen gRNA-Kern beinhaltet, der sich mit dem napDNAbp verbindet. In dieser Ausführungsform beinhaltet die Leit-RNA ein verlängertes RNA-Segment am 3'-Ende, d. h. eine 3'- Verlängerung. In dieser Ausführungsform beinhaltet die 3'-Verlängerung eine Templat-Sequenz für die reverse Transkription und eine Primer-Bindungsstelle für die reverse Transkription. Wie in den 1C-1D gezeigt, hybrisiert die RT-Primer-Bindungsstelle an das freie 3'-Ende, das nach der Bildung eines Nicks im Nicht-Zielstrang der R-Schleife gebildet wird, wodurch die reverse Transkriptase für die DNA-Polymerisation in 5'-3'-Richtung geprimt wird.
3C zeigt eine weitere Ausführungsform einer verlängerten Leit-RNA, die in dem hier offenbarten-Prime-Editing-System verwendet werden kann, wobei eine herkömmliche Leit-RNA (der grüne Abschnitt) eine -20 nt Protospacer-Sequenz und einen gRNA-Kern beinhaltet, der sich mit dem napDNAbp verbindet. In dieser Ausführungsform beinhaltet die Leit-RNA ein verlängertes RNA-Segment an einer intermolekularen Position innerhalb des gRNA-Kerns, d. h. eine intramolekulare Verlängerung. In dieser Ausführungsform beinhaltet die intramolekulare Verlängerung eine Templat-Sequenz für die reverse Transkription und eine Primer-Bindungsstelle für die reverse Transkription. Die RT-Primer-Bindungsstelle hybrisiert an das freie 3'-Ende, das nach der Bildung eines Nicks im Nicht-Zielstrang der R-Schleife gebildet wird, wodurch die reverse Transkriptase für die DNA-Polymerisation in 5'-3'- Richtung geprimt wird.
In einer Ausführungsform befindet sich die Position der intermolekularen RNA- Verlängerung nicht in der Protospacer-Sequenz der Leit-RNA. In einer anderen Ausführungsform befindet sich die Position der intermolekularen RNA- Verlängerung im gRNA-Kern. In einer weiteren Ausführungsform befindet sich die Position der intermolekularen RNA-Verlängerung an einer beliebigen Stelle des Leit-RNA-Moleküls, außer innerhalb der Protospacer-Sequenz, oder an einer Stelle, die die Protospacer-Sequenz unterbricht.
In einer Ausführungsform ist die intermolekulare RNA-Verlängerung stromabwärts vom 3'-Ende der Protospacer-Sequenz eingefügt. In einer anderen Ausführungsform ist die intermolekulare RNA-Verlängerung mindestens 1 Nukleotid, mindestens 2 Nukleotide, mindestens 3 Nukleotide, mindestens 4 Nukleotide, mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide, mindestens 15 Nukleotide, mindestens 16 Nukleotide, mindestens 17 Nukleotide, mindestens 18 Nukleotide, mindestens 19 Nukleotide, mindestens 20 Nukleotide, mindestens 21 Nukleotide, mindestens 22 Nukleotide, mindestens 23 Nukleotide, mindestens 24 Nukleotide, mindestens 25 Nukleotide stromabwärts vom 3'- Ende der Protospacer-Sequenz eingefügt.
In anderen Ausführungsformen wird die intermolekulare RNA-Verlängerung in die gRNA eingefügt, was sich auf den Abschnitt der Leit-RNA bezieht, der der tracrRNA entspricht oder diese umfasst, die an das Cas9-Protein oder ein Äquivalent davon bindet und/oder mit diesem interagiert (d. h. ein anderes napDNAbp). Vorzugsweise wird durch das Einfügen der intermolekularen RNA-Verlängerung die Wechselwirkung zwischen dem tracrRNA-Abschnitt und dem napDNAbp nicht oder nur minimal gestört.
Die Länge der RNA-Verlängerung (die mindestens das RT-Templat und die Primer- Bindungsstelle beinhaltet, z. B. siehe 92) kann eine beliebige nützliche Länge haben. In verschiedenen Ausführungsformen beträgt die RNA-Verlängerung mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide, mindestens 15 Nukleotide, mindestens 16 Nukleotide, mindestens 17 Nukleotide, mindestens 18 Nukleotide, mindestens 19 Nukleotide, mindestens 20 Nukleotide, mindestens 21 Nukleotide, mindestens 22 Nukleotide, mindestens 23 Nukleotide, mindestens 24 Nukleotide, mindestens 25 Nukleotide, mindestens 30 Nukleotide, mindestens 40 Nukleotide, mindestens 50 Nukleotide, mindestens 60 Nukleotide, mindestens 70 Nukleotide, mindestens 80 Nukleotide, mindestens 90 Nukleotide, mindestens 100 Nukleotide, mindestens 200 Nukleotide, mindestens 300 Nukleotide, mindestens 400 Nukleotide oder mindestens 500 Nukleotide in Länge.
Die Sequenz des RT-Templats kann auch jede beliebige andere geeignete Länge haben. Zum Beispiel kann die RT-Templat-Sequenz mindestens 3 Nukleotide, mindestens 4 Nukleotide, mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide, mindestens 15 Nukleotide, mindestens 16 Nukleotide, mindestens 17 Nukleotide, mindestens 18 Nukleotide, mindestens 19 Nukleotide, mindestens 20 Nukleotide, mindestens 30 Nukleotide, mindestens 40 Nukleotide, mindestens 50 Nukleotide, mindestens 60 Nukleotide, mindestens 70 Nukleotide, mindestens 80 Nukleotide, mindestens 90 Nukleotide, mindestens 100 Nukleotide, mindestens 200 Nukleotide, mindestens 300 Nukleotide, mindestens 400 Nukleotide oder mindestens 500 Nukleotide in Länge betragen.
In noch anderen Ausführungsformen, wobei die Sequenz der Bindungsstelle des Primers für die reverse Transkription mindestens 3 Nukleotide, mindestens 4 Nukleotide, mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide, mindestens 15 Nukleotide, mindestens 16 Nukleotide, mindestens 17 Nukleotide, mindestens 18 Nukleotide, mindestens 19 Nukleotide, mindestens 20 Nukleotide, mindestens 30 Nukleotide, mindestens 40 Nukleotide, mindestens 50 Nukleotide, mindestens 60 Nukleotide, mindestens 70 Nukleotide, mindestens 80 Nukleotide, mindestens 90 Nukleotide, mindestens 100 Nukleotide, mindestens 200 Nukleotide, mindestens 300 Nukleotide, mindestens 400 Nukleotide oder mindestens 500 Nukleotide in Länge beträgt.
In anderen Ausführungsformen beträgt die optionale Linker- oder Spacer-Sequenz mindestens 3 Nukleotide, mindestens 4 Nukleotide, mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide, mindestens 15 Nukleotide, mindestens 16 Nukleotide, mindestens 17 Nukleotide, mindestens 18 Nukleotide, mindestens 19 Nukleotide, mindestens 20 Nukleotide, mindestens 30 Nukleotide, mindestens 40 Nukleotide, mindestens 50 Nukleotide, mindestens 60 Nukleotide, mindestens 70 Nukleotide, mindestens 80 Nukleotide, mindestens 90 Nukleotide, mindestens 100 Nukleotide, mindestens 200 Nukleotide, mindestens 300 Nukleotide, mindestens 400 Nukleotide oder mindestens 500 Nukleotide in Länge.
In bestimmten Ausführungsformen kodiert die RT-Templatmolekül-Sequenz ein einzelsträngiges DNA-Molekül, das zum Nicht-Zielstrang homolog (und damit komplementär zur entsprechenden Stelle des Ziel-Strangs) ist, aber eine oder mehrere Nukleotidänderungen beinhaltet. Die mindestens eine Nukleotidveränderung kann eine oder mehrere einbasige Nukleotidveränderungen, eine oder mehrere Deletionen und eine oder mehrere Insertionen beinhalten.
Wie in 1G dargestellt, ist das synthetisierte einzelsträngige DNA-Produkt der RT- Templat-Sequenz homolog zum Nicht-Ziel-Strang und enthält eine oder mehrere Nukleotidveränderungen. Das einzelsträngige DNA-Produkt der RT-Templat-Sequenz hybridisiert im Gleichgewicht mit der komplementären Sequenz des Zielstrangs und verdrängt dabei die homologe endogene Sequenz des Zielstrangs. Der verdrängte endogene Strang kann in einigen Ausführungsformen als eine 5'-endogene DNA-Flap-Spezies bezeichnet werden (siehe z. B. 1E). Diese 5'-endogene DNA-Flap-Spezies kann durch eine 5'-Flap- Endonuklease (z. B. FEN1) entfernt werden, und das einzelsträngige DNA-Produkt, das nun mit dem endogenen Zielstrang hybridisiert, kann ligiert werden, wodurch eine Diskrepanz zwischen der endogenen Sequenz und dem neu synthetisierten Strang entsteht. Die Diskrepanz kann durch zelleigene DNA-Reparatur- und/oder Replikationsprozesse gelöst werden.
In verschiedenen Ausführungsformen entspricht die Nukleotidsequenz der RT- Templat-Sequenz der Nukleotidsequenz des Nicht-Zielstrangs, der als 5'-Flap-Spezies verdrängt wird und sich mit der zu editierenden Stelle überlappt.
In verschiedenen Ausführungsformen der verlängerten Leit-RNAs kann die Templat- Sequenz für die reverse Transkription einen einzelsträngigen DNA-Flap kodieren, der komplementär zu einer endogenen DNA-Sequenz neben einer Nickstelle ist, wobei der einzelsträngige DNA-Flap eine gewünschte Nukleotidänderung umfasst. Der einzelsträngige DNA-Flap kann eine endogene einzelsträngige DNA an der Nickstelle verdrängen. Die verdrängte endogene Einzelstrang-DNA an der Nickstelle kann ein 5'-Ende aufweisen und einen endogenen Flap bilden, der von der Zelle abgeschnitten werden kann. In verschiedenen Ausführungsformen kann die Exzision des endogenen 5'-Endlappens dazu beitragen, die Produktbildung voranzutreiben, da die Entfernung des endogenen 5'-Endlappens die Hybridisierung des 3'-Einzelstrang-DNA-Flaps mit dem entsprechenden komplementären DNA-Strang und den Einbau oder die Assimilation der gewünschten Nukleotidänderung, die von dem 3'-Einzelstrang-DNA-Flap getragen wird, in die Ziel-DNA fördert.
In verschiedenen Ausführungsformen der verlängerten Leit-RNAs führt die zelluläre Reparatur des einzelsträngigen DNA-Flaps zum Einbau der gewünschten Nukleotidveränderung, wodurch ein gewünschtes Produkt entsteht.
In noch anderen Ausführungsformen wird die gewünschte Nukleotidänderung in ein Editing-Fenster eingebaut, das zwischen etwa -5 bis +5 der Nickstelle, oder zwischen etwa -10 bis +10 der Nickstelle, oder zwischen etwa -20 bis +20 der Nickstelle, oder zwischen etwa -30 bis +30 der Nickstelle, oder zwischen etwa -40 bis + 40 der Nickstelle, oder zwischen etwa - 50 bis +50 der Nickstelle, oder zwischen etwa -60 bis +60 der Nickstelle, oder zwischen etwa -70 bis +70 der Nickstelle, oder zwischen etwa -80 bis +80 der Nickstelle, oder zwischen etwa -90 bis +90 der Nickstelle, oder zwischen etwa -100 bis +100 der Nickstelle, oder zwischen etwa -200 bis +200 der Nickstelle liegt. In anderen Ausführungsformen wird die gewünschte Nukleotidänderung in ein Editing-Fenster eingebaut, das zwischen etwa +1 bis +2 von der Nickstelle liegt, oder etwa +1 bis +3,+1bis +4,+1 bis +5,+1bis +6,+1bis +7,+1 bis +8,+1 bis +9,+1 bis +10, +1 bis +11,+1 bis +12,+1 bis +13,+1 bis +14,+1 bis +15,+1 bis +16,+1 bis +17,+1 bis +18,+1 bis +19,+1 bis +20,+1 bis +21,+1 bis +22,+1 bis +23,+1 bis +24, +1 bis +25,+1 bis +26,+1 bis +27,+1 bis +28,+1 bis +29,+1 bis +30,+1 bis +31,+1 bis +32, +1 bis +33,+1 bis +34,+1 bis +35,+1 bis +36,+1 bis +37,+1 bis +38,+1 bis +39,+1 bis +40, +1 bis +41,+1 bis +42, +1 bis +43,+1 bis +44,+1 bis +45,+1 bis +46,+1 bis +47,+1 bis +48, +1 bis +49,+1 bis +50,+1 bis +51,+1 bis +52,+1 bis +53,+1 bis +54,+1 bis +55,+1 bis +56, +1 bis +57,+1 bis +58,+1 bis +59,+1 bis +60,+1 bis +61,+1 bis +62,+1 bis +63,+1 bis +64, +1 bis +65,+1 bis +66,+1 bis +67,+1 bis +68,+1 bis +69,+1 bis +70,+1 bis +71,+1 bis +72, +1 bis +73,+1 bis +74,+1 bis +75,+1 bis +76,+1 bis +77,+1 bis +78,+1 bis +79,+1 bis +80, +1 bis +81,+1 bis +82,+1 bis +83,+1 bis +84,+1 bis +85,+1 bis +86,+1 bis +87,+1 bis +88, +1 bis +89,+1 bis +90,+1 bis +90,+1 bis +91,+1 bis +92,+1 bis +93,+1 bis +94,+1 bis +95, +1 bis +96,+1 bis +97,+1 bis +98,+1 bis +99,+1 bis +100,+1 bis +101,+1 bis +102,+1 bis +103,+1 bis +104,+1 bis +105,+1 bis +106,+1 bis +107,+1 bis +108,+1 bis +109,+1 bis +110,+1 bis +111,+1 bis +112,+1 bis +113,+1 bis +114,+1 bis +115,+1 bis +116,+1 bis +117,+1 bis +118,+1 bis +119,+1 bis +120,+1 bis +121,+1 bis +122,+1 bis +123,+1 bis +124 oder +1 bis +125 von der Nickstelle.
In noch anderen Ausführungsformen wird die gewünschte Nukleotidänderung in ein Editing-Fenster eingebaut, das zwischen etwa +1 bis +2 von der Nickstelle oder etwa +1 bis +5,+1 bis +10,+1 bis +15,+1 bis +20,+1 bis +25,+1 bis +30,+1 bis +35,+1 bis +40,+1 bis +45,+1 bis +50,+1 bis +55,+1 bis +100,+1 bis +105,+1 bis +110,+1 bis +115,+1 bis +120, +1 bis +125,+1 bis +130,+1 bis +135,+1 bis +140,+1 bis +145,+1 bis +150,+1 bis +155, +1 bis +160, +1 bis +165,+1 bis +170,+1 bis +175,+1 bis +180,+1 bis +185,+1 bis +190, +1 bis +195 oder +1 bis +200 von der Nickstelle liegt.
In verschiedenen Aspekten sind die verlängerten Leit-RNAs modifizierte Versionen einer Leit-RNA. Leit-RNAs können natürlich vorkommen, von einer kodierenden Nukleinsäure exprimiert oder chemisch synthetisiert werden. Verfahren zur Gewinnung oder anderweitigen Synthese von Leit-RNAs und zur Bestimmung der geeigneten Sequenz der Leit- RNA, einschließlich der Protospacer-Sequenz, die mit dem Zielstrang einer genomischen Zielstelle von Interesse interagiert und hybridisiert, sind in der Technik wohlbekannt.
In verschiedenen Ausführungsformen hängen die besonderen Ausgestaltungsaspekte einer Leit-RNA-Sequenz von der Nukleotidsequenz einer genomischen Zielstelle von Interesse (d. h. der gewünschten zu editierenden Stelle) und dem Typ des napDNAbp (z. B. Cas9- Protein) ab, der in den hierin beschriebenen Multi-Flap-Prime-Editing-Systemen vorhanden ist, neben anderen Faktoren wie PAM-Sequenzpositionen, prozentualem G/C-Gehalt in der Zielsequenz, dem Grad der Mikrohomologieregionen, Sekundärstrukturen usw.
Im Allgemeinen ist eine Leitsequenz eine beliebige Polynukleotidsequenz, die eine ausreichende Komplementarität mit einer Ziel-Polynukleotidsequenz aufweist, um mit der Zielsequenz zu hybridisieren und eine sequenzspezifische Bindung eines napDNAbp (z. B. eines Cas9, Cas9-Homologs oder einer Cas9-Variante) an die Zielsequenz zu ermöglichen. In einigen Ausführungsformen beträgt der Grad der Komplementarität zwischen einer Leitsequenz und ihrer entsprechenden Zielsequenz bei optimaler Ausrichtung mit einem geeigneten Alignment-Algorithmus etwa 50 %, 60 %, 75 %, 80 %, 85 %, 90 %, 95 %, 97,5 %, 99 % oder mehr. Die optimale Ausrichtung kann mit jedem geeigneten Algorithmus zum Ausrichten von Sequenzen bestimmt werden, wobei nicht einschränkende Beispiele den Smith- Waterman-Algorithmus, den Needleman-Wunsch-Algorithmus, Algorithmen basierend auf der Burrows-Wheeler-Transformation (z. B, Burrows Wheeler Aligner), ClustalW, Clustal X, BLAT, Novoalign (Novocraft Technologies), ELAND (Illumina, San Diego, Calif.), SOAP (verfügbar unter soap.genomics.org.cn) und Maq (verfügbar unter maq.sourceforge.net) beinhalten. In einigen Ausführungsformen ist eine Leitsequenz etwa 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19,20,21,22,23,24,25,26,27,28,29,30,35,40,45,50, 75 oder mehr Nukleotide lang.
In einigen Ausführungsformen ist eine Leitsequenz weniger als etwa 75, 50, 45, 40, 35, 30, 25, 20, 15, 12 oder weniger Nukleotide lang. Die Fähigkeit einer Leitsequenz, die sequenzspezifische Bindung eines Multi-Flap-Prime-Editors an eine Zielsequenz zu steuern, kann durch jeden geeigneten Test beurteilt werden. Zum Beispiel können die Komponenten eines Multi-Flap-Prime-Editors, einschließlich der zu prüfenden Leitsequenz, einer Wirtszelle bereitgestellt werden, die die entsprechende Zielsequenz aufweist, wie z. B. durch Transfektion mit Vektoren, die die hierin offenbarten Komponenten eines Multi-Flap-Prime-Editors kodieren, gefolgt von einer Bewertung der bevorzugten Spaltung innerhalb der Zielsequenz, wie z. B. durch einen Surveyor-Test, wie hierin beschrieben. In ähnlicher Weise kann die Spaltung einer Ziel-Polynukleotidsequenz in einem Reagenzglas bewertet werden, indem die Zielsequenz, Komponenten eines Multi-Flap-Prime-Editors, einschließlich der zu testenden Leitsequenz und einer Kontroll-Leitsequenz, die sich von der Test-Leitsequenz unterscheidet, bereitgestellt werden und die Bindung oder Rate der Spaltung an der Zielsequenz zwischen den Test- und Kontroll-Leitsequenz-Reaktionen verglichen wird. Andere Tests sind möglich und werden sich dem Fachmann erschließen.
Eine Leitsequenz kann so ausgewählt werden, dass sie eine beliebige Zielsequenz anspricht. In einigen Ausführungsformen ist die Zielsequenz eine Sequenz innerhalb des Genoms einer Zelle. Exemplarische Zielsequenzen beinhalten solche, die im Zielgenom einzigartig sind. Zum Beispiel kann für S. pyogenes Cas9 eine einzigartige Zielsequenz in einem Genom eine Cas9-Zielstelle der Form MMMMMMMMNNNNNNNNNNNNXGG (SEQ-ID-NR: 204) beinhalten, wobei NNNNNNNNNNNNXGG (SEQ-ID-NR: 205) (N ist A, G, T, oder C; und X kann alles Beliebige sein. Eine einzigartige Zielsequenz in einem Genom kann eine S. pyogenes Cas9-Zielstelle der Form MMMMMMMMMNNNNNNNNNNNNXGG (SEQ-ID-NR: 206) beinhalten, wobei NNNNNNNNNNNXGG (SEQ-ID-NR: 207) (N ist A, G, T, oder C; und X kann alles Beliebige sein. Für S. thermophilus CRISPR1Cas9 kann eine einzigartige Zielsequenz in einem Genom eine Cas9-Zielstelle der Form MMMMMMMMNNNNNNNNNNNNXXAGAAW (SEQ-ID- NR: 208) beinhalten, wobei NNNNNNNNNNNNXXAGAAW (SEQ-ID-NR: 209) (N ist A, G, T, oder C; X kann alles Beliebige sein; und W ist A oder T). Eine einzigartige Zielsequenz in einem Genom kann eine S. thermophilus CRISPR 1 Cas9-Zielstelle der Form MMMMMMMMMNNNNNNNNNNNXXAGAAW (SEQ-ID-NR: 210) beinhalten, wobei NNNNNNNNNNNXXAGAAW (SEQ-ID-NR: 211) (N ist A, G, T, oder C; X kann alles Beliebige sein; und W ist A oder T). Für S. pyogenes Cas9 kann eine eindeutige Zielsequenz in einem Genom eine Cas9-Zielstelle der Form MMMMMMMMNNNNNNNNNNNNXGGXG (SEQ-ID-NR: 212) beinhalten, wobei NNNNNNNNNNNNXGGXG (SEQ-ID-NR: 213) (N ist A, G, T, oder C; und X kann alles Beliebige sein. Eine einzigartige Zielsequenz in einem Genom kann eine S. pyogenes Cas9- Zielstelle der Form MMMMMMMMMNNNNNNNNNNNXGGXG (SEQ-ID-NR: 214) beinhalten, wobei NNNNNNNNNNNXGGXG (SEQ-ID-NR: 215) (N ist A, G, T, oder C; und X kann alles Beliebige sein. In jeder dieser Sequenzen kann „M“ A, G, T oder C sein und muss bei der Identifizierung einer Sequenz als einzigartig nicht berücksichtigt werden.
Wie hierin in einer PEgRNA- oder Leit-RNA-Sequenz verwendet, sollte, sofern nicht anders angegeben, davon ausgegangen werden, dass der Buchstabe „T“ oder „Thymin“ eine Nukleobase in einer DNA-Sequenz bezeichnet, die die PEgRNA- oder Leit-RNA-Sequenz kodiert, und sich auf eine Uracil (U)-Nukleobase der PEgRNA oder Leit-RNA oder eine beliebige chemisch modifizierte Uracil-Nukleobase bezieht, die in der Technik bekannt ist, wie etwa 5-Methoxyuracil.
In einigen Ausführungsformen wird eine Leitsequenz ausgewählt, um den Grad der Sekundärstruktur innerhalb der Leitsequenz zu reduzieren. Die Sekundärstruktur kann durch jeden geeigneten Polynukleotidfaltungsalgorithmus bestimmt werden. Einige Programme basieren auf der Berechnung der minimalen freien Gibbs-Energie. Ein Beispiel für einen solchen Algorithmus ist mFold, wie von Zuker und Stiegler beschrieben (Nucleic Acids Res. 9 (1981), 133-148). Ein weiteres Beispiel für einen Faltungsalgorithmus ist der Online- Webserver RNAfold, der am Institut für Theoretische Chemie der Universität Wien entwickelt wurde und den Algorithmus zur Vorhersage der Zentroidstruktur verwendet (siehe z. B. A. R. Gruber et al., 2008, Cell 106(1): 23-24; und PA Carr und GM Church, 2009, Nature Biotechnology 27(12): 1151-62). Weitere Algorithmen finden sich in der US-Anmeldung Ser. Nr. 61/836,080 ; Broad Reference BI-2013/004A), die hierin durch Bezugnahme aufgenommen ist.
Im Allgemeinen beinhaltet eine Tracr-Mate-Sequenz jede Sequenz, die eine ausreichende Komplementarität mit einer Tracr-Sequenz aufweist, um eine oder mehrere der folgenden Aktionen zu fördern: (1) Exzision einer Leitsequenz, die von Tracr-Mate-Sequenzen flankiert wird, in einer Zelle, die die entsprechende Tracr-Sequenz enthält; und (2) Bildung eines Komplexes an einer Zielsequenz, wobei der Komplex die an die Tracr-Sequenz hybridisierte Tracr-Mate-Sequenz umfasst. Im Allgemeinen bezieht sich der Grad der Komplementarität auf die optimale Ausrichtung der Tracr-Mate-Sequenz und der Tracr- Sequenz entlang der Länge der kürzeren der beiden Sequenzen. Die optimale Ausrichtung kann durch jeden geeigneten Ausrichtungsalgorithmus bestimmt werden und kann ferner Sekundärstrukturen berücksichtigen, wie z. B. die Selbstkomplementarität innerhalb der Tracr- Sequenz oder der Tracr-Mate-Sequenz. In einigen Ausführungsformen beträgt der Grad der Komplementarität zwischen der Tracr-Sequenz und der Tracr-Mate-Sequenz entlang der Länge der kürzeren der beiden Sequenzen bei optimaler Ausrichtung etwa oder mehr als etwa 25 %, 30 %, 40 %, 50 %, 60 %, 70 %, 80 %, 90 %, 95 %, 97,5 %, 99 % oder höher. In einigen Ausführungsformen beträgt die Länge der Tracr-Sequenz etwa oder mehr als etwa 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 40, 50 oder mehr Nukleotide. In einigen Ausführungsformen sind die Tracr-Sequenz und die Tracr-Mate-Sequenz in einem einzigen Transkript enthalten, so dass die Hybridisierung zwischen den beiden ein Transkript ergibt, das eine Sekundärstruktur, wie z. B. eine Haarnadel, aufweist. Bevorzugte schleifenbildende Sequenzen zur Verwendung in Haarnadelstrukturen sind vier Nukleotide lang und weisen vorzugsweise die Sequenz GAAA auf. Es können jedoch auch längere oder kürzere Sequenzen verwendet werden, ebenso wie alternative Sequenzen. Die Sequenzen beinhalten vorzugsweise ein Nukleotid-Triplett (zum Beispiel AAA) und ein zusätzliches Nukleotid (zum Beispiel C oder G). Beispiele für schleifenbildende Sequenzen beinhalten CAAA und AAAG. In einer Ausführungsform der Erfindung weist das Transkript oder die transkribierte Polynukleotidsequenz mindestens zwei oder mehr Haarnadeln auf. In bevorzugten Ausführungsformen weist das Transkript zwei, drei, vier oder fünf Haarnadeln auf. In einer weiteren Ausführungsform der Erfindung weist das Transkript höchstens fünf Haarnadeln auf. In einigen Ausführungsformen beinhaltet das Einzeltranskript ferner eine Transkriptionsterminationssequenz; vorzugsweise ist dies eine polyT-Sequenz, zum Beispiel sechs T-Nukleotide. Weitere nicht einschränkende Beispiele für einzelne Polynukleotide, die eine Leitsequenz, eine Tracr-Mate-Sequenz und eine Tracr-Sequenz umfassen, sind die folgenden (aufgelistet von 5' bis 3'), wobei „N“ eine Base einer Leitsequenz darstellt, der erste Block von Kleinbuchstaben die Tracr-Mate-Sequenz und der zweite Block von Kleinbuchstaben die Tracr-Sequenz darstellt und die letzte poly-T-Sequenz den Transkriptionsterminator darstellt:

(1)
(2)
(3)
(4)
(5)

AND
(6)

In einigen Ausführungsformen werden die Sequenzen (1) bis (3) in Kombination mit Cas9 aus S. thermophilus CRISPR1 verwendet. In einigen Ausführungsformen werden die Sequenzen (4) bis (6) in Kombination mit Cas9 von S. pyogenes verwendet. In einigen Ausführungsformen ist die Tracr-Sequenz ein von einem Transkript, das die Tracr-Mate- Sequenz umfasst, getrenntes Transkript.
Fachleuten wird klar sein, dass es zur Ausrichtung eines der Fusionsproteine, die eine Cas9-Domäne und ein Einzelstrang-DNA-Bindungsprotein umfassen, wie hierin offenbart, auf eine Zielstelle, z. B. eine Stelle, die eine zu editierende Punktmutation umfasst, typischerweise erforderlich ist, das Fusionsprotein zusammen mit einer Leit-RNA, z. B. einer sgRNA, zu exprimieren. Wie an anderer Stelle hierin näher erläutert, umfasst eine Leit-RNA typischerweise ein tracrRNA-Framework, das die Bindung von Cas9 ermöglicht, und eine Leitsequenz, die dem Cas9:Nukleinsäure-Editing-Enzym/Domänen-Fusionsprotein Sequenzspezifität verleiht.
In einigen Ausführungsformen umfasst die Leit-RNA eine Struktur 5'-[Leitsequenz]- GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAAGGCUAGUCCGUUAUCAACUUGAAA AAGUGGCACCGAGUCGGUGCUUUUU-3' (SEQ ID NO: 222), wobei die Leitsequenz eine Sequenz umfasst, die komplementär zur Zielsequenz ist. Die Leitsequenz ist in der Regel 20 Nukleotide lang. Die Sequenzen geeigneter Leit-RNAs für die Ausrichtung von Cas9:Nukleinsäure-Editing-Enzym/Domänen-Fusionsproteinen auf spezifische genomische Zielstellen werden für Fachleute basierend auf der vorliegenden Offenbarung offensichtlich sein. Solche geeigneten Leit-RNA-Sequenzen umfassen typischerweise Leitsequenzen, die komplementär zu einer Nukleinsequenz innerhalb von 50 Nukleotiden stromaufwärts oder stromabwärts des zu editierenden Zielnukleotids sind. Hierin werden einige beispielhafte Leit- RNA-Sequenzen bereitgestellt, die für die Ausrichtung eines der bereitgestellten Fusionsproteine auf spezifische Zielsequenzen geeignet sind. Weitere Leitsequenzen sind in der Technik wohlbekannt und können mit dem hierin beschriebenen Multi-Flap-Prime-Editor verwendet werden.
In anderen Ausführungsformen beinhalten die PEgRNAs die in 3D abgebildeten.
In wieder anderen Ausführungsformen können die PEgRNAs die in 3E abgebildeten beinhalten.
3D stellt die Struktur einer Ausführungsform einer hierin betrachteten PEgRNA bereit, die gemäß der in Beispiel 2 definierten Methodik ausgestaltet werden kann. Die PEgRNA umfasst drei Hauptkomponenten, die in 5'-zu-3'-Richtung angeordnet sind, nämlich: einen Spacer, einen gRNA-Kern und einen Verlängerungsarm am 3'-Ende. Der Verlängerungsarm kann ferner in die folgenden Strukturelemente in 5'-zu-3'-Richtung unterteilt sein, nämlich: eine Primer-Bindungsstelle (A), ein Edit-Templat (B) und einen Homologiearm (C). Darüber hinaus kann die PEgRNA eine optionale 3'- Endmodifizierungsregion (e1) und eine optionale 5'-Endmodifizierungsregion (e2) umfassen. Darüber hinaus kann die PEgRNA ein Transkriptionsterminationssignal am 3'-Ende der PEgRNA umfassen (nicht abgebildet). Diese Strukturelemente sind ferner hierin definiert. Die Darstellung der Struktur der PEgRNA ist nicht als einschränkend zu verstehen und schließt Variationen in der Anordnung der Elemente mit ein. Zum Beispiel könnten die fakultativen Sequenz-Modifikatoren (e1) und (e2) innerhalb oder zwischen einer der anderen dargestellten Regionen positioniert sein und sind nicht darauf beschränkt, sich an den 3'- und 5'-Enden zu befinden.
3E stellt die Struktur einer anderen Ausführungsform einer hierin betrachteten PEgRNA bereit, die gemäß der in Beispiel 2 definierten Methodik ausgestaltet werden kann. Die PEgRNA umfasst drei Hauptkomponenten, die in 5'-zu-3'-Richtung angeordnet sind, nämlich: einen Spacer, einen gRNA-Kern und einen Verlängerungsarm am 3'-Ende. Der Verlängerungsarm kann ferner in die folgenden Strukturelemente in 5'-zu-3'-Richtung unterteilt sein, nämlich: eine Primerbindungsstelle (A), ein Edit-Templat (B) und einen Homologiearm (C). Darüber hinaus kann die PEgRNA eine optionale 3'- Endmodifizierungsregion (e1) und eine optionale 5'-Endmodifizierungsregion (e2) umfassen. Darüber hinaus kann die PEgRNA ein Transkriptionsterminationssignal am 3'-Ende der PEgRNA umfassen (nicht abgebildet). Diese Strukturelemente sind ferner hierin definiert. Die Darstellung der Struktur der PEgRNA ist nicht als einschränkend zu verstehen und schließt Variationen in der Anordnung der Elemente mit ein. Zum Beispiel könnten die fakultativen Sequenz-Modifikatoren (e1) und (e2) innerhalb oder zwischen einem der anderen dargestellten Bereiche positioniert sein und sind nicht darauf beschränkt, sich an den 3'- und 5'-Enden zu befinden.
PEgRNA-Verbesserungen
Die PEgRNAs können außerdem zusätzliche Ausgestaltungsverbesserungen beinhalten, die die Eigenschaften und/oder Eigenschaften von PEgRNAs modifizieren können, wodurch die Wirksamkeit des Prime-Editing verbessert wird. In verschiedenen Ausführungsformen können diese Verbesserungen zu einer oder mehreren einer Reihe verschiedener Kategorien gehören, einschließlich unter anderem: (1) Ausgestaltungen, um eine effiziente Expression funktioneller PEgRNAs von Nicht-Polymerase III (Pol III)-Promotoren zu ermöglichen, was die Expression längerer PEgRNAs ohne lästige Sequenzerfordernisse ermöglichen würde; (2) Verbesserungen am Kern, dem Cas9-bindenden PEgRNA-Gerüst, was die Wirksamkeit verbessern könnte; (3) Modifikationen an der PEgRNA, um die RT- Prozessivität zu verbessern, wodurch die Insertion längerer Sequenzen an gezielten genomischen Loci ermöglicht wird; und (4) Hinzufügen von RNA-Motiven an die 5'- oder 3'- Termini der PEgRNA, die die PEgRNA-Stabilität verbessern, die RT-Prozessivität erhöhen, eine Fehlfaltung der PEgRNA verhindern oder zusätzliche Faktoren rekrutieren, die für das Genom-Editing wichtig sind.
In einer Ausführungsform könnte PEgRNA mit Pol-III-Promotoren ausgestaltet werden, um die Exprimierung längerer PEgRNA mit größeren Verlängerungsarmen zu verbessern. sgRNAs werden typischerweise vom U6-snRNA-Promotor exprimiert. Dieser Promotor rekrutiert Pol III, um die assoziierte RNA zu exprimieren, und ist nützlich für die Exprimierung von kurzen RNAs, die im Kern zurückgehalten werden. Pol III ist jedoch nicht hoch prozessiv und ist nicht in der Lage, RNAs mit einer Länge von mehr als einigen hundert Nukleotiden in dem für ein effizientes Genom-Editing erforderlichen Niveau zu exprimieren. Darüber hinaus kann Pol III an Abschnitten von U anhalten oder terminieren, was möglicherweise die Sequenzdiversität begrenzt, die mit einer PEgRNA eingefügt werden könnte. Andere Promotoren, die Polymerase II (wie pCMV) oder Polymerase I (wie der U1- snRNA-Promotor) rekrutieren, wurden auf ihre Fähigkeit untersucht, längere sgRNAs zu exprimieren. Diese Promotoren werden jedoch typischerweise teilweise transkribiert, was zu einer zusätzlichen Sequenz 5' des Spacers in der exprimierten PEgRNA führen würde, was nachweislich zu einer deutlich reduzierten Cas9:sgRNA-Aktivität in einer ortsabhängigen Weise führt. Während Pol-III-transkribierte PEgRNAs einfach in einem Lauf von 6-7 U terminieren können, benötigen PEgRNAs, die von Pol II oder Pol I transkribiert wurden, ein anderes Terminationssignal. Häufig führen solche Signale auch zu einer Polyadenylierung, die zu einem unerwünschten Transport der PEgRNA aus dem Zellkern führen würde. In ähnlicher Weise sind RNAs, die von Pol-II-Promotoren wie pCMV exprimiert werden, typischerweise 5'-verkappt, was ebenfalls zu ihrem Kernexport führt.
Zuvor haben Rinn und Mitarbeiter eine Vielzahl von Exprimierungsplattformen für die Produktion von langen, nicht kodierenden RNA(IncRNA)-markierten sgRNAs gescreent¹⁸³. Diese Plattformen umfassen RNAs, die von pCMV exprimiert werden und die im ENE- Element der MALAT1-ncRNA von Menschen¹⁸⁴, dem PAN-ENE-Element von KSHV¹⁸⁵ oder der 3'-Box von U1-snRNA¹⁸⁶ enden. Bemerkenswerterweise bilden die MALATl-ncRNA und die PAN-ENE Tripelhelices, die den PolyA-Schwanz schützen^{184, 187}. Diese Konstrukte könnten auch die RNA-Stabilität erhöhen. Es wird erwogen, dass diese Exprimierungssysteme auch die Exprimierung längerer PEgRNAs ermöglichen.
Darüber hinaus wurde eine Reihe von Verfahren für die Spaltung des Teils des Pol-II- Promotors entwickelt, der als Teil der PEgRNA transkribiert werden würde, indem entweder ein selbstspaltendes Ribozym wie Hammerhead¹⁸⁸, Pistol¹⁸⁹, Hatchet¹⁸⁹, Hairpin¹⁹⁰, VS¹⁹¹, Twister¹⁹²- oder Twister-Sister¹⁹²-Ribozyme oder andere selbstspaltende Elemente hinzugefügt werden, um den transkribierten Guide zu verarbeiten, oder eine Haarnadel, die von Csy4¹⁹³ erkannt wird und ebenfalls zur Verarbeitung des Guides führt. Es wird auch vermutet, dass der Einbau mehrerer ENE-Motive zu einer verbesserten PEgRNA-Exprimierung und - Stabilität führen könnte, wie zuvor für die KSHV PAN-RNA und das Element gezeigt¹⁸⁵. Es wird auch erwartet, dass die Zirkularisierung der PEgRNA in Form einer zirkulären intronischen RNA (ciRNA) auch zu einer verbesserten RNA-Exprimierung und -Stabilität sowie zu einer Kernlokalisation führen könnte¹⁹⁴.
In verschiedenen Ausführungsformen kann die PEgRNA verschiedene obige Elemente umfassen, wie durch die folgende Sequenz beispielhaft dargestellt.

Nicht einschränkendes Beispiel 1 - PEgRNA-Expressionsplattform bestehend aus pCMV, Csy4-Haarnadel, der PEgRNA und MALAT1 ENE
Nicht einschränkendes Beispiel 2 - PEgRNA-Expressionsplattform bestehend aus pCMV, Csy4-Haarnadel, der PEgRNA und PAN ENE
Nicht einschränkendes Beispiel 3 - PEgRNA-Expressionsplattform bestehend aus pCMV, Csy4-Haarnadel, der PEgRNA und 3xPAN ENE
Nicht einschränkendes Beispiel 4 - PEgRNA-Expressionsplattform bestehend aus pCMV, Csy4-Haarnadel, der PEgRNA und 3'-Box
Nicht einschränkendes Beispiel 5 -PEgRNA-Expressionsplattform bestehend aus pU1, Csy4-Haarnadel, der PEgRNA und 3'-Box

In verschiedenen anderen Ausführungsformen kann die PEgRNA verbessert werden, indem Verbesserungen an den Gerüst- oder Kernsequenzen eingeführt werden. Dies kann durch die Einführung von Bekanntem erfolgen
Der Kern, das Cas9-bindende PEgRNA-Gerüst, kann wahrscheinlich verbessert werden, um die PE-Aktivität zu erhöhen. Mehrere solcher Ansätze wurden bereits demonstriert. Zum Beispiel enthält das erste Paarungselement des Gerüsts (P1) ein GTTTT- AAAAC (SEQ-ID-NR: 3939) als Paarungselement. Es wurde gezeigt, dass solche Durchläufe von Ts zu einer Pol-III-Pausierung und einer vorzeitigen Beendigung des RNA-Transkripts führen. Es wurde gezeigt, dass die rationale Mutation eines der T-A-Paare zu einem G-C-Paar in diesem Teil von P1 die sgRNA-Aktivität erhöht, was darauf hindeutet, dass dieser Ansatz auch für PEgRNAs möglich wäre¹⁹⁵. Darüber hinaus wurde auch gezeigt, dass die Verlängerung der P1-Länge die sgRNA-Faltung verbessert und zu einer verbesserten Aktivität führt¹⁹⁵, was darauf hindeutet, dass dies ein weiterer Weg zur Verbesserung der PEgRNA- Aktivität ist. Beispiele für Verbesserungen am Kern können Folgendes beinhalten:

PEgRNA mit einer 6 nt-Verlängerung zu P1
PEgRNA mit einer T-A-zu-G-C-Mutation innerhalb von P1

In verschiedenen anderen Ausführungsformen kann die PEgRNA durch Modifikationen in der Edit-Templat-Region verbessert werden. Da die Größe des durch die PEgRNA erzeugten Templats zunimmt, ist es wahrscheinlicher, dass es durch Endonukleasen abgebaut wird, spontan hydrolysiert wird oder sich zu Sekundärstrukturen faltet, die von der RT nicht rücktranskribiert werden können oder die die Faltung des PEgRNA-Gerüsts und die anschließende Cas9-RT-Bindung stören. Dementsprechend ist es wahrscheinlich, dass eine Modifikation des Templats der PEgRNA notwendig sein könnte, um große Insertionen, wie die Insertion ganzer Gene, zu beeinflussen. Einige Strategien dazu umfassen den Einbau modifizierter Nukleotide in eine synthetische oder halbsynthetische PEgRNA, die die RNA resistenter gegen FIGau oder Hydrolyse machen oder inhibitorische Sekundärstrukturen weniger wahrscheinlich annehmen¹⁹⁶. Solche Modifikationen könnten 8-Aza-7- Deazaguanosin einschließen, das die RNA-Sekundärstruktur in G-reichen Sequenzen reduzieren würde; Locked-Nucleinsäuren (LNA), die den FIGau reduzieren und bestimmte Arten der RNA-Sekundärstruktur verbessern; 2'-O-Methyl-, 2'-Fluor- oder 2'-O- Methoxyethoxy-Modifikationen, die die RNA-Stabilität erhöhen. Solche Modifikationen könnten auch an anderer Stelle in die PEgRNA aufgenommen werden, um die Stabilität und Aktivität zu erhöhen. Alternativ oder zusätzlich könnte das Templat der PEgRNA so ausgestaltet werden, dass es sowohl für ein gewünschtes Proteinprodukt kodiert als auch eher einfache Sekundärstrukturen annimmt, die durch die RT entfaltet werden können. Solche einfachen Strukturen würden als thermodynamische Senke wirken, was es weniger wahrscheinlich macht, dass kompliziertere Strukturen auftreten, die eine reverse Transkription verhindern würden. Schließlich könnte man das Templat auch in zwei separate PEgRNAs aufteilen. In einer solchen Ausgestaltung würde ein PE verwendet, um die Transkription zu initiieren und auch eine separate Templat-RNA über ein RNA-bindendes Protein, das an Cas9 fusioniert ist, oder ein RNA-Erkennungselement auf der PEgRNA selbst, wie das MS2- Aptamer, an die Zielstelle zu rekrutieren. Die RT könnte entweder direkt an diese separate Templat-RNA binden oder die Reverse Transkription auf der ursprünglichen PEgRNA initiieren, bevor sie zum zweiten Templat wechselt. Ein solcher Ansatz könnte lange Insertionen ermöglichen, indem er sowohl eine Fehlfaltung der PEgRNA bei Zugabe des langen Templats verhindert als auch keine Dissoziation von Cas9 vom Genom für lange Insertionen erfordert, was möglicherweise PE-basierte lange Insertionen hemmt.
In noch anderen Ausführungsformen kann die PEgRNA durch Einführung zusätzlicher RNA-Motive an den 5'- und 3'-Termini der PEgRNAs oder sogar an Positionen dazwischen (z. B. in der gRNA-Kernregion oder im Spacer) verbessert werden. Mehrere solcher Motive - wie das PAN ENE von KSHV und das ENE von MALAT1 wurden oben als mögliche Mittel erörtert, um die Exprimierung längerer PEgRNAs von Nicht-Pol-III-Promotoren zu beenden. Diese Elemente bilden RNA-Tripelhelices, die den PolyA-Schwanz umhüllen, was dazu führt, dass sie im Kern verbleiben^{184, 187}. Durch die Bildung komplexer Strukturen am 3'-Terminus der PEgRNA, die das terminale Nukleotid verschließen, würden diese Strukturen jedoch wahrscheinlich auch dazu beitragen, den Exonuklease-vermittelten FIGau von PEgRNAs zu verhindern.
Andere am 3'-Terminus inserierte Strukturelemente könnten ebenfalls die RNA- Stabilität erhöhen, jedoch ohne die Termination von Nicht-Pol-III-Promotoren zu ermöglichen. Solche Motive könnten Haarnadeln oder RNA-Quadruplexe umfassen, die den 3'-Terminus verschließen¹⁹⁷, oder selbstspaltende Ribozyme wie HDV, die zur Bildung eines 2'-3' cyclischen Phosphats am 3'-Terminus führen und möglicherweise auch dazu führen, dass die PEgRNA weniger wahrscheinlich durch Exonukleasen abgebaut wird¹⁹⁸. Das Induzieren der PEgRNA durch unvollständiges Spleißen zur Cyclisierung - um eine ciRNA zu bilden - könnte auch die PEgRNA-Stabilität erhöhen und dazu führen, dass die PEgRNA im Zellkern verbleibt¹⁹⁴.
Zusätzliche RNA-Motive könnten auch die RT-Prozessivität verbessern oder die PEgRNA-Aktivität steigern, indem sie die RT-Bindung an den DNA-RNA-Duplex verstärken. Die Zugabe der nativen Sequenz, die von der RT in ihrem verwandten retroviralen Genom gebunden wird, könnte die RT-Aktivität erhöhen¹⁹⁹. Dies könnte die native Primer- Bindungsstelle (PBS), den Polypurintrakt („polypurine tract“ - PPT) oder Kissing Loops umfassen, die an der retroviralen Genomdimerisierung und Transkriptionsinitiation beteiligt sind¹⁹⁹.
Das Hinzufügen von Dimerisierungsmotiven - wie Kissing Loops oder einem GNRA- Tetraloop/Tetraloop-Rezeptorpaar²⁰⁰ - an den 5'- und 3'-Termini der PEgRNA könnte auch zu einer effektiven Zirkularisierung der PEgRNA führen, was die Stabilität verbessert. Darüber hinaus wird in Betracht gezogen, dass die Zugabe dieser Motive die physikalische Trennung des PEgRNA-Spacers und des Primers ermöglichen könnte, wodurch eine Okklusion des Spacers verhindert wird, die die PE-Aktivität behindern würde. Kurze 5'-Verlängerungen oder 3'-Verlängerungen der PEgRNA, die eine kleine Haarnadel in der Spacer-Region oder entlang der Primer-Bindungsstelle bilden, könnten ebenfalls günstig mit der Hybridisierung intrakomplementärer Regionen entlang der Länge der PEgRNA konkurrieren, z. B. mit der Interaktion zwischen dem Spacer und der Primer-Bindungsstelle, die auftreten kann. Schließlich könnten Kissing Loops auch dazu verwendet werden, andere Templat-RNAs an die genomische Stelle zu rekrutieren und ein Swapping der RT-Aktivität von einer RNA zur anderen zu ermöglichen. Als beispielhafte Ausführungsformen für verschiedene Sekundärstrukturen führen die in 3D und 3E gezeigte PEgRNA eine Anzahl sekundärer RNA-Strukturen auf, die in jede beliebige Region der PEgRNA eingebaut werden können, einschließlich der terminalen Abschnitte des Verlängerungsarms (d. h. e1 und e2), wie gezeigt.
Beispiele für Verbesserungen beinhalten unter anderem:

PEgRNA-HDV-Fusion
PEgRNA-MMLV-Kissing Loop
PEgRNA-VS-Ribozym-Kissing Loop
PEgRNA-GNRA-Tetraloop/Tetraloop-Rezeptor
PEgRNA-Templat-Switching sekundäre RNA-HDV-Fusion

PEgRNA-Gerüste könnte durch gerichtete Evolution weiter verbessert werden, ähnlich wie SpCas9 und Prime-Editoren (PE) verbessert wurden. Die gerichtete Evolution könnte die Erkennung von PEgRNA durch Cas9 oder evoluierte Cas9-Varianten verbessern. Darüber hinaus ist es wahrscheinlich, dass unterschiedliche PEgRNA-Gerüstsequenzen an unterschiedlichen genomischen Loci optimal wären, indem sie entweder die PE-Aktivität an der fraglichen Stelle erhöhen, Off-Target-Aktivitäten reduzieren oder beides. Schließlich würde die Evolution von PEgRNA-Gerüsten, denen andere RNA-Motive hinzugefügt wurden, mit ziemlicher Sicherheit die Aktivität der fusionierten PEgRNA im Vergleich zur nicht evoluierten Fusions-RNA verbessern. Beispielsweise führte die Evolution allosterischer Ribozyme, die aus c-di-GMP-I-Aptameren und Hammerhead-Ribozymen bestehen, zu einer dramatisch verbesserten Aktivität²⁰², was darauf hindeutet, dass die Evolution auch die Aktivität von Hammerhead-PEgRNA-Fusionen verbessern würde. Darüber hinaus wird, während Cas9 derzeit im Allgemeinen keine 5'-Verlängerung der sgRNA toleriert, die gerichtete Evolution wahrscheinlich Mutationen erzeugen, die diese Intoleranz mildern und die Verwendung zusätzlicher RNA-Motive ermöglichen.
Die vorliegende Offenbarung erwägt alle derartigen Möglichkeiten, die Wirksamkeit der hier offenbarten Multi-Flap-Prime-Editing-Systeme weiter zu verbessern.
In verschiedenen Ausführungsformen kann es vorteilhaft sein, das Auftreten von aufeinanderfolgenden Sequenzen von Ts aus dem Verlängerungsarm zu begrenzen, da aufeinanderfolgende Reihen von Ts die Fähigkeit der PEgRNA, transkribiert zu werden, begrenzen können. Zum Beispiel sollten Strings von mindestens drei aufeinanderfolgenden Ts, mindestens vier aufeinanderfolgenden Ts, mindestens fünf aufeinanderfolgenden Ts, mindestens sechs aufeinanderfolgenden Ts, mindestens sieben aufeinanderfolgenden Ts, mindestens acht aufeinanderfolgenden Ts, mindestens neun aufeinanderfolgenden Ts, mindestens zehn aufeinanderfolgenden Ts, mindestens elf aufeinanderfolgenden Ts, mindestens zwölf aufeinanderfolgenden Ts, mindestens dreizehn aufeinanderfolgenden Ts, mindestens vierzehn aufeinanderfolgenden Ts oder mindestens fünfzehn aufeinanderfolgenden Ts bei der Ausgestaltung der PEgRNA vermieden werden oder zumindest aus der endgültigen Sequenz entfernt werden. In einer Ausführungsform kann man vermeiden, dass unerwünschte Strings von aufeinanderfolgenden Ts in PEgRNA-Verlängerungsarmen enthalten sind, indem man Zielstellen vermeidet, die reich an aufeinanderfolgenden A:T-Nukleobasenpaaren sind.
Split-PEgRNA-Ausgestaltungen für trans-Prime-Editing
Die vorliegende Offenbarung bezieht sich auch auf das trans-Prime-Editing, d. h. eine modifizierte Version des Prime-Editing, bei der die PEgRNA in zwei unterschiedliche Moleküle aufgeteilt wird: eine Leit-RNA und ein tPERT-Molekül. Das tPERT-Molekül ist so programmiert, dass es mit dem Prime-Editor-Komplex an einer Ziel-DNA-Stelle kolokalisiert und die Primer-Bindungsstelle und das DNA-Synthese-Templat zum Prime-Editor in trans bringt. Zum Beispiel, siehe 3G für eine Ausführungsform eines trans-Prime-Editors (tPE), die ein Zwei-Komponenten-System zeigt, das (1) einen Rekrutierungsprotein (RP)-PE:gRNA- Komplex und (2) ein tPERT beinhaltet, das eine Primer-Bindungsstelle und ein DNA- Synthese-Templat, das mit einer RNA-Protein-Rekrutierungsdomäne (z. B. Stammschleife oder Haarnadel) verbunden ist, wobei die rekrutierende Proteinkomponente des RP-PE:gRNA- Komplexes das tPERT zu einer zu editierenden Zielstelle rekrutiert, wodurch die PBS und das DNA-Synthese-Templat mit dem Prime-Editor in trans assoziiert werden. Anders ausgedrückt ist das tPERT so konstruiert, dass es (ganz oder teilweise) den Verlängerungsarm einer PEgRNA enthält, der die Primer-Bindungsstelle und das DNA-Synthesemuster beinhaltet. Ein Vorteil dieses Ansatzes besteht darin, dass der Verlängerungsarm einer PEgRNA von der Leit- RNA getrennt wird, wodurch Hybridisierungswechselwirkungen minimiert werden, die zwischen der PBS des Verlängerungsarms und der Spacer-Sequenz der Leit-RNA auftreten können.
Ein wesentliches Merkmal des trans-Prime-Editing ist die Fähigkeit des trans-Prime- Editors, das tPERT an die Stelle des DNA-Editings zu rekrutieren, wodurch alle Funktionen einer PEgRNA an der Stelle des Prime-Editing effektiv kolokalisiert werden. Die Rekrutierung kann erreicht werden, indem eine RNA-Protein-Rekrutierungsdomäne, wie z. B. ein MS2- Aptamer, in das tPERT eingebaut wird und ein entsprechendes Rekrutierungsprotein an den Prime-Editor fusioniert wird (z. B. über einen Linker an das napDNAbp oder über einen Linker an die Polymerase), das in der Lage ist, spezifisch an die RNA-Protein-Rekrutierungsdomäne zu binden, wodurch das tPERT-Molekül an den Prime-Editor-Komplex rekrutiert wird. Wie in dem in 3H beschriebenen Verfahren abgebildet ist, bindet der RP-PE:gRNA-Komplex an die Ziel-DNA-Sequenz und kerbt („nickt“) sie. Dann rekrutiert das Rekrutierungsprotein (RP) ein tPERT, damit es an den Prime-Editor-Komplex, der an die DNA-Zielstelle gebunden ist, kolokalisiert, wodurch die Primer-Bindungsstelle, die sich auf dem tPERT befindet, an die Primer-Sequenz auf dem genickten Strang binden kann, und anschließend die Polymerase (z. B. RT) einen einzelnen DNA-Strang gegen das DNA-Synthese-Templat, das sich auf dem tPERT befindet, bis zum 5'-Ende des tPERT synthetisieren kann.
Während das tPERT in 3G und 3H so dargestellt ist, dass er das PBS- und DNA-Synthese-Templat am 5'-Ende der RNA-Protein-Rekrutierungsdomäne umfasst, kann das tPERT in anderen Konfigurationen so ausgestaltet werden, dass sich das PBS- und DNA- Synthese-Templat am 3'-Ende der RNA-Protein-Rekrutierungsdomäne befindet. Das tPERT mit der 5'-Verlängerung weist jedoch den Vorteil auf, dass die Synthese des DNA- Einzelstrangs auf natürliche Weise am 5'-Ende des tPERT endet und somit nicht die Gefahr besteht, dass irgendein Abschnitt der RNA-Protein-Rekrutierungsdomäne während der DNA- Synthesestufe des Prime-Editing als Templat verwendet wird.
Verfahren zur Ausgestaltung von PEgRNAs
Die vorliegende Offenbarung betrifft auch Verfahren für die Ausgestaltung von PEgRNAs.
Bei einem Aspekt der Ausgestaltung kann der Ausgestaltungsansatz die spezielle Anwendung berücksichtigen, für die Prime-Editing verwendet wird. Beispielsweise kann, wie hierin beschrieben und erörtert, Prime-Editing ohne Einschränkung verwendet werden, um (a) mutationskorrigierende Änderungen in eine Nukleotidsequenz einzubauen, (b) Protein- und RNA-Tags einzubauen, (c) Immunepitope auf Proteinen von Interesse einzubauen, (d) induzierbare Dimerisierungsdomänen in Proteine einzubauen, (e) Sequenzen einzubauen oder zu entfernen, um diese Aktivität eines Biomoleküls zu verändern, (f) Rekombinase-Zielstellen einzubauen, um spezifische genetische Veränderungen zu steuern, und (g) zur Mutagenese einer Zielsequenz unter Verwendung einer fehleranfälligen RT. Neben diesen Verfahren, bei denen im Allgemeinen Nukleotidsequenzen an Zielstellen von Interesse eingefügt, verändert oder gelöscht werden, können Prime-Editoren auch zum Aufbau hochgradig programmierbarer Bibliotheken sowie zur Aufzeichnung von Zelldaten und zur Untersuchung der Abstammung verwendet werden. Bei diesen verschiedenen Anwendungen kann es, wie hierin beschrieben, besondere Ausgestaltungsaspekte in Bezug auf die Herstellung einer PEgRNA geben, die für jede dieser Anwendungen besonders nützlich ist.
Beim Ausgestalten einer PEgRNA für eine bestimmte Anwendung oder Verwendung von Prime-Editing kann eine Reihe von Überlegungen berücksichtigt werden, die unter anderem Folgendes beinhalten:

(a) die Zielsequenz, d. h. die Nukleotidsequenz, in der eine oder mehrere Nukleobasenmodifikationen durch den Prime-Editor eingebaut werden sollen;
(b) die Position der Schnittstelle innerhalb der Zielsequenz, d. h. die spezifische Nukleobasenposition, an der der Prime-Editor einen Single-Stand-Nick induziert, um eine 3'- Ende-RT-Primersequenz auf einer Seite des Nicks und den 5'-Ende-endogenen Flap auf der anderen Seite des Nicks (der schließlich durch FEN1 oder ein Äquivalent dazu entfernt und durch den 3'-ssDNA-Flap ersetzt wird. Die Schnittstelle ist analog zum „Edit-Ort“, da hier die 3'-endogene RT-Primersequenz entsteht, die von der RT während der RNA-abhängigen DNA- Polymerisation verlängert wird, um den 3'-ssDNA-Flap zu erzeugen, der den gewünschten Edit enthält, der dann den 5'-endogenen DNA-Flap in der Zielsequenz ersetzt.
(c) die verfügbaren PAM-Sequenzen (einschließlich der kanonischen SpCas9-PAM-Stellen sowie nicht-kanonischer PAM-Stellen, die von Cas9-Varianten und Äquivalenten mit erweiterten oder unterschiedlichen PAM-Spezifitäten erkannt werden);
(d) den Abstand zwischen den verfügbaren PAM-Sequenzen und die Lage der Schnittstelle in der Zielsequenz;
(e) das jeweilige Cas9, die Cas9-Variante oder das Cas9-Äquivalent des verwendeten Prime- Editors;
(f) die Sequenz und Länge der Primer-Bindungsstelle;
(g) die Sequenz und Länge des Edit-Templats;
(h) die Sequenz und Länge des Homologiearms;
(i) die Spacer-Sequenz und -Länge; und
(j) die Kernsequenz.

In der vorliegenden Offenbarung werden diese Aspekte erörtert.
In einer Ausführungsform wird hiermit ein Ansatz für das Ausgestalten einer geeigneten PEgRNA und optional eine Anleitung für die Ausgestaltung einer Nicking-sgRNA für das Nicking an der zweiten Stelle bereitgestellt. Diese Ausführungsform stellt einen schrittweisen Anweisungssatz für das Ausgestalten von PEgRNAs und Nicking-sgRNAs für Prime-Editing bereit, der eine oder mehrere der oben genannten Überlegungen berücksichtigt. Die Schritte beziehen sich auf die in den 70A-70I gezeigten Beispiele.

1. Definieren der Zielsequenz und des Edits. Man rufe die Sequenz der Ziel-DNA- Region (∼200 bp) ab, die um den Ort des gewünschten Edits (Punktmutation, Insertion, Deletion oder Kombination davon) zentriert ist. Siehe 70A.
2. Lokalisieren der Ziel-PAMs. Man identifiziere die PAMs in der Nähe des gewünschten Edit-Orts. PAMs können auf jedem DNA-Strang in der Nähe des gewünschten Edit-Ortes identifiziert werden. Während PAMs in der Nähe der Edit-Position bevorzugt werden (d. h. bei denen die Nickstelle weniger als 30 nt von der Edit-Position entfernt ist oder weniger als 29 nt, 28 nt, 27 nt, 26 nt, 25 nt, 24 nt, 23 nt, 22 nt, 21 nt, 20 nt, 19 nt, 18 nt, 17 nt, 16 nt, 15 nt, 14 nt, 13 nt, 12 nt, 11 nt, 10 nt, 9 nt, 8 nt, 7 nt, 6 nt, 5 nt, 4 nt, 3 nt, oder 2 nt von der Edit-Position zur Nickstelle), ist es möglich, Edits mit Protospacern und PAMs einzubauen, die den Nick ≥ 30 nt von der Edit-Position entfernt platzieren. Siehe 70B.
3. Lokalisieren der Nickstellen. Für jede in Betracht gezogene PAM identifiziere man die entsprechende Nickstelle und auf welchem Strang. Für Sp-Cas9-H840A-Nickase erfolgt die Spaltung im PAM enthaltenden Strang zwischen der 3. und 4. Base 5' zur NGG PAM. Alle editierten Nukleotide müssen 3' von der Nickstelle existieren, daher müssen geeignete PAMs den Nick 5' zum Ziel-Edit auf dem PAM-enthaltenden Strang platzieren. Im unten gezeigten Beispiel gibt es zwei mögliche PAMs. Der Einfachheit halber demonstrieren die verbleibenden Schritte die Ausgestaltung einer PEgRNA, die nur PAM 1 verwendet. Siehe 70C.
4. Ausgestalten der Spacer-Sequenz. Der Protospacer von Sp Cas9 entspricht den 20 Nukleotiden 5' zum NGG-PAM auf dem PAM-enthaltenden Strang. Eine effiziente Pol-III- Transkriptionsinitiation erfordert, dass das erste transkribierte Nukleotid ein G ist. Wenn das erste Nukleotid des Protospacers ein G ist, ist die Spacer-Sequenz für die PEgRNA einfach die Protospacersequenz. Wenn das erste Nukleotid des Protospacers kein G ist, ist die Spacer- Sequenz der PEgRNA G gefolgt von der Protospacersequenz. Siehe 70D.
5. Ausgestalten einer Primer-Bindungsstelle (PBS). Man identifiziere den DNA-Primer auf dem PAM-enthaltenden Strang mithilfe der Allel-Startsequenz. Das 3'-Ende des DNA- Primers ist das Nukleotid direkt stromaufwärts der Nickstelle (d. h. die 4. Base 5' von der NGG- PAM für Sp-Cas9). Als allgemeines Ausgestaltungsprinzip für die Verwendung mit PE2 und PE3 kann eine PEgRNA-Primer-Bindungsstelle (PBS) mit 12 bis 13 Nukleotiden komplementär zum DNA-Primer für Sequenzen verwendet werden, die -40-60 % GC-Gehalt enthalten. Bei Sequenzen mit geringem GC-Gehalt sollten längere (14- bis 15-nt) PBSs getestet werden. Bei Sequenzen mit höherem GC-Gehalt sollten kürzere (8- bis 11-nt) PBSs getestet werden. Optimale PBS-Sequenzen sollten unabhängig vom GC-Gehalt empirisch bestimmt werden. Um eine PBS-Sequenz der Länge p auszugestalten, nehme man das reverse Komplement der ersten p-Nukleotide 5' von der Nickstelle in dem PAM-enthaltenden Strang unter Verwendung der Allel-Startsequenz. Siehe 70E.
6. Ausgestalten eines RT-Templats (oder DNA-Synthese-Templats). Das RT-Templat (oder DNA-Synthese-Templat, bei der die Polymerase keine reverse Transkriptase ist) kodiert das ausgestaltete Edit und die Homologie zu der Sequenz neben dem Edit. In einer Ausführungsform entsprechen diese Regionen dem DNA-Synthese-Templat von 3D und 3E, wobei das DNA-Synthese-Templat das „Edit-Templat“ und den „Homologiearm“ umfasst. Die optimale Länge des RT-Templats variiert je nach Zielstelle. Für Short-Range- Edits (Positionen +1 bis +6) wird empfohlen, ein kurzes (9 bis 12 nt), ein mittleres (13 bis 16 nt) und ein langes (17 bis 20 nt) RT-Templat zu testen. Für Long-Range-Edits (Positionen +7 und darüber hinaus) wird empfohlen, RT-Template zu verwenden, die sich mindestens 5 nt (vorzugsweise 10 oder mehr nt) über die Position des Edits hinaus erstrecken, um eine ausreichende 3'-DNA-Flap-Homologie zu ermöglichen. Für Long-Range-Edits sollten mehrere RT-Template überprüft werden, um funktionale Ausgestaltungen zu identifizieren. Für größere Insertionen und Deletionen (≥5 nt) wird der Einbau einer größeren 3'-Homologie (∼20 nt oder mehr) in das RT-Templat empfohlen. Die Editing-Effizienz wird typischerweise beeinträchtigt, wenn das RT-Templat die Synthese eines G als letztes Nukleotid im revers transkribierten DNA-Produkt kodiert (entsprechend einem C im RT-Tamplate der PEgRNA). Da viele RT- Template ein effizientes Prime-Editing unterstützen, wird bei der Ausgestaltung von RT- Templaten empfohlen, G als das endgültig synthetisierte Nukleotid zu vermeiden. Um eine RT- Templat-Sequenz der Länge r auszugestalten, verwende man die gewünschte Allelsequenz und nehme man das reverse Komplement der ersten r-Nukleotide 3' von der Nickstelle in dem Strang, der ursprünglich die PAM enthielt. Man beachte, dass im Vergleich zu SNP-Edits Insertions- oder Deletions-Edits unter Verwendung von RT-Templaten derselben Länge keine identische Homologie enthalten. Siehe 70F.
7. Zusammenbauen der vollständigen PEgRNA-Sequenz. Man verkette die PEgRNA- Komponenten in der folgenden Reihenfolge (5' bis 3'): Spacer, Gerüst, RT-Templat und PBS. Siehe 70G.
8. Ausgestalten von Nicking-sgRNAs für PE3. Man identifiziere PAMs auf dem nicht- editierten Strang stromaufwärts und stromabwärts des Edits. Optimale Nicking-Positionen sind stark ortsabhängig und sollten empirisch bestimmt werden. Im Allgemeinen führen Nicks, die 40 bis 90 Nukleotide 5' von der Position gegenüber dem PEgRNA-induzierten Nick platziert werden, zu höheren Editing-Ausbeuten und weniger Indels. Eine Nicking-sgRNA hat eine Spacer-Sequenz, die mit dem 20-nt-Protospacer im Startallel übereinstimmt, mit dem Zusatz eines 5'-G, wenn der Protospacer nicht mit einem G beginnt. Siehe 70H.
9. Ausgestalten von PE3b Nicking-sgRNAs. Wenn eine PAM im komplementären Strang existiert und ihr entsprechender Protospacer mit der für das Editing anvisierten Sequenz überlappt, könnte dieses Editing ein Kandidat für das PE3b-System sein. Im PE3b-System stimmt die Spacer-Sequenz der Nicking-sgRNA mit der Sequenz des gewünschten editierten Allels überein, jedoch nicht mit dem Startallel. Das PE3b-System arbeitet effizient, wenn das (die) editierte(n) Nukleotid(e) in die Saatregion (~10 nt neben der PAM) des Nicking-sgRNA- Protospacers fällt. Dies verhindert das Nicken des komplementären Strangs bis nach dem Einbau des editierten Strangs, wodurch Konkurrenz zwischen der PEgRNA und der sgRNA um die Bindung der Ziel-DNA verhindert wird. PE3b vermeidet auch die Erzeugung simultaner Nicks auf beiden Strängen, wodurch die Informationsbildung erheblich reduziert wird, während eine hohe Editing-Effizienz beibehalten wird. PE3b-sgRNAs sollten eine Spacer- Sequenz aufweisen, die mit dem 20-nt-Protospacer im gewünschten Allel übereinstimmt, gegebenenfalls unter Hinzufügung eines 5'-G. Siehe 70I.

Das obige schrittweise Verfahren zum Ausgestalten einer geeigneten PEgRNA und einer Zweitstellen-Nicking-sgRNA soll in keiner Weise einschränkend sein. Die Offenbarung sieht Variationen des oben beschriebenen Schritt-für-Schritt-Verfahrens vor, die von einem Durchschnittsfachmann daraus abgeleitet werden können.
[7] Anwendungen für das Multi-Flap-Prime-Editing
Das Dual-Flap und Quadruple-Flap-Prime-Editing (d. h. das Multi-Flap-Prime- Editing) weist viele potenzielle Anwendungen auf, wie z. B. das Einbauen von Peptid-Tags, RNA-Tags, Immunoepitopen, Dimerisierungsdomänen und Rekombinase-Zielstellen. Eine solche Anwendung des Dual-Flap-Prime-Editing ist der Einbau von Rekombinase- oder Integrase-Sequenzen an benutzerdefinierten Stellen im Genom. 93 veranschaulicht den Einbau der Bxb 1-Rekombinasesequenzen attB (38 bp) und attP (50 bp) in eine Zielregion des humanen Genoms (HEK293T site 3 oder HEK3) bei gleichzeitiger Deletion von 90 bp dazwischenliegender Sequenz zwischen den beiden Nickstellen. Verschiedene Grade der Komplementarität zwischen den 3'-Flaps ermöglichen ein erfolgreiches Editing, wobei längere Sequenzen mit Komplementarität ein günstigeres Verhältnis von gewünschten Edits zu Indels ergeben. Weitere Anwendungen des Dual-Flap-Prime-Editing beinhalten das endogene Tagging von Genen mit Peptid- oder Proteinsequenzen oder den Austausch von Exons durch neue DNA-Sequenzen, die das Potenzial aufweisen, mehrere Varianten zu ersetzen, bei denen die Mutation innerhalb der Exon-Sequenz liegt.
Mit dem Dual-Flap-Prime-Editing können eine oder zwei Rekombinasestellen an den Zielpositionen im humanen Genom eingeführt werden. Werden einzelne Rekombinasestellen eingefügt, können diese als Landeplätze für eine rekombinasevermittelte Reaktion zwischen der genomischen Rekombinasestelle und einer zweiten Rekombinasestelle innerhalb einer von außen zugeführten DNA, wie z. B. einem Plasmid, genutzt werden. Dies ermöglicht die gezielte Integration von DNA-Fracht. Werden zwei Rekombinasestellen in benachbarte DNA- Regionen eingefügt, können diese je nach Ausrichtung der Rekombinasestellen für die rekombinasevermittelte Exzision oder Inversion der dazwischenliegenden Sequenz oder für den rekombinasevermittelten Kassettenaustausch mit exogener DNA zur Integration der Fracht genutzt werden. Die Integration kompatibler Rekombinasestellen auf verschiedenen Chromosomen ermöglicht eine gezielte und gerichtete chromosomale Translokation. Mit Dual- Flap-Prime-Editing lassen sich Rekombinasestellen an einer Reihe von Loci im humanen Genom effizient einfügen (94). Die Kopplung der Integration von Rekombinasestellen durch Dual-Flap-Prime-Editing mit DNA-Rekombinase-Enzymen ist somit ein leistungsfähiger Ansatz für viele Arten von SV-Editings und die Zielintegration von DNA- Fracht.
Die Multi-Flap-Prime-Editoren (z. B. die in 90 dargestellte Ausführungsform) können hierin für die präzise Insertion einer neuen DNA-Sequenz, die präzise Deletion einer endogenen genomischen DNA-Sequenz oder den Austausch einer endogenen genomischen DNA-Sequenz durch eine neue DNA-Sequenz verwendet werden.
Zum Beispiel und wie hierin beispielhaft dargestellt und erörtert, kann das Dual-Prime- Editing dazu verwendet werden, (a) mutationskorrigierende Veränderungen in eine Nukleotidsequenz einzubauen, (b) Protein- und RNA-Tags einzubauen, (c) Immunoepitope auf Proteinen von Interesse einzubauen, (d) induzierbare Dimerisierungsdomänen in Proteine einzubauen, (e) Rekombinase-Zielstellen einzubauen, um spezifische genetische Veränderungen zu steuern. Neben diesen Verfahren, bei denen im Allgemeinen Nukleotidsequenzen an Zielstellen von Interesse eingefügt, verändert oder gelöscht werden, können Dual-Prime-Editoren auch zum Aufbau hochgradig programmierbarer Bibliotheken sowie zur Aufzeichnung von Zelldaten und zur Untersuchung der Abstammung verwendet werden.
Diese spezifischen beispielhaften Anwendungen des Dual-Prime-Editings sind in keiner Weise als einschränkend zu verstehen. In der vorliegenden Anmeldung wird jede Anwendung des Dual-Prime-Editings erwogen, die im Allgemeinen eine Form der Insertion, der Deletion und/oder des Austauschs einer oder mehrerer Nukleobasen an einer Zielstelle in einer Nukleotidsequenz, z. B. einer genomischen DNA, umfasst.
Für jede der beispielhaften Verwendungen des Dual-Prime-Editings kann jeder hierin offengelegte Prime-Editor verwendet werden, einschließlich PE1, PE2, PE3 und PE3b oder PE-short.
A. Prime-Editing versus Mulit-Flap-Prime-Editing
Klassisches Prime-Editing
In verschiedenen Ausführungsformen erfolgt das Prime-Editing (oder „Prime-Editing“) durch den Kontakt eines Ziel-DNA-Moleküls (bei dem eine Änderung der Nukleotidsequenz eingeführt werden soll) mit einem Nukleinsäure-programmierbaren DNA-bindenden Protein (napDNAbp), das mit einer verlängerten Leit-RNA komplexiert ist. Bezugnehmend auf 1G umfasst die verlängerte Leit-RNA eine Verlängerung am 3'- oder 5'-Ende der Leit- RNA oder an einer intramolekularen Stelle in der Leit-RNA und kodiert die gewünschte Nukleotidänderung (z. B. eine einzelne Nukleotidänderung, Insertion oder Deletion). In Schritt (a) kontaktiert das napDNAbp / der verlängerte gRNA-Komplex das DNA-Molekül, und die verlängerte gRNA leitet das napDNAbp zur Bindung an einen Ziel-Locus. In Schritt (b) wird (z. B. durch eine Nuklease oder einen chemischen Wirkstoff) ein Nick in einen der DNA- Stränge des Ziel-Locus eingeführt, wodurch ein verfügbares 3'-Ende in einem der Stränge des Ziel-Locus entsteht. In bestimmten Ausführungsformen wird der Nick in dem DNA-Strang erzeugt, der dem R-Loop-Strang entspricht, d. h. dem Strang, der nicht mit der Leit-RNA- Sequenz hybridisiert ist, d. h. dem „Nicht-Ziel-Strang“. Der Nick kann jedoch in jeden der beiden Stränge eingeführt werden. Das heißt, der Nick könnte in den „Zielstrang“ der R- Schleife (d. h. den Strang, der mit der Protospacer-Sequenz der verlängerten gRNA hybridisiert ist) oder in den „Nicht-Zielstrang“ (d. h. den Strang, der den einzelsträngigen Abschnitt der R- Schleife bildet und der komplementär zum Zielstrang ist) eingeführt werden. In Schritt (c) interagiert das 3'-Ende des DNA-Strangs (gebildet durch den Nick) mit dem verlängerten Abschnitt der Leit-RNA, um die reverse Transkription zu primen (d. h. „Ziel-geprimte RT“). In bestimmten Ausführungsformen hybridisiert der DNA-Strang am 3'-Ende mit einer spezifischen RT-Priming-Sequenz auf dem verlängerten Abschnitt der Leit-RNA, d. h. der „Priming-Sequenz für die reverse Transkriptase“. In Schritt (d) wird eine reverse Transkriptase eingeführt (als Fusionsprotein mit dem napDNAbp oder in trans), die einen einzelnen DNA- Strang vom 3'-Ende der geprimten Stelle in Richtung des 5'-Endes der verlängerten Leit-RNA synthetisiert. Dadurch wird ein einzelsträngiger DNA-Flap gebildet, der die gewünschte Nukleotidänderung umfasst (z. B. die Änderung einer einzelnen Base, die Insertion oder die Deletion oder eine Kombination davon) und der ansonsten homolog zur endogenen DNA an oder neben der Nickstelle ist. In Schritt (e) werden das napDNAbp und die Leit-RNA freigesetzt. Die Schritte (f) und (g) beziehen sich auf die Auflösung des einzelsträngigen DNA- Flap, so dass die gewünschte Nukleotidänderung in den Ziel-Locus eingebaut wird. Dieser Prozess kann in Richtung der gewünschten Produktbildung vorangetrieben werden, indem der entsprechende endogene 5'-DNA-Flap entfernt wird (z. B. durch FEN1 oder ein ähnliches Enzym, das in trans, als Fusion mit dem Prime-Editor oder endogen bereitgestellt wird), der sich bildet, sobald der 3'-Einzelstrang-DNA-Flap in die endogene DNA-Sequenz eindringt und mit ihr hybridisiert. Ohne an eine Theorie gebunden zu sein, lösen die zelleigenen DNA- Reparatur- und Replikationsprozesse die Diskrepanz in der DNA auf, um die Nukleotidveränderung(en) einzubauen und das gewünschte veränderte Produkt zu bilden. Der Prozess kann auch durch „Zweitstrang-Nicking“ zur Produktbildung getrieben werden, wie in 1G beispielhaft verdeutlicht wird, oder mit „termporalem Zweitstrang-Nicking“, wie in 11 beispielhaft verdeutlicht und hierin erörtert wird.
Beim Prime-Editing können mindestens eine oder mehrere der folgenden genetischen Veränderungen vorgenommen werden: Transversionen, Transitionen, Deletionen und Insertionen. Darüber hinaus kann das Prime-Editing für bestimmte Anwendungen eingesetzt werden. Beispielsweise kann, wie hierin beschrieben und erörtert, Prime-Editing verwendet werden, um (a) mutationskorrigierende Änderungen in eine Nukleotidsequenz einzubauen, (b) Protein- und RNA-Tags einzubauen, (c) Einbauen von Immunepitopen auf Proteinen von Interesse, (d) induzierbare Dimerisierungsdomänen in Proteine einzubauen, (e) Sequenzen einzubauen oder zu entfernen, um diese Aktivität eines Biomoleküls zu verändern, (f) Rekombinase-Zielstellen einzubauen, um spezifische genetische Veränderungen zu steuern, und (g) zur Mutagenese einer Zielsequenz unter Verwendung einer fehleranfälligen RT. Neben diesen Verfahren, bei denen im Allgemeinen Nukleotidsequenzen an Zielstellen von Interesse eingefügt, verändert oder gelöscht werden, können Prime-Editoren auch zum Aufbau hochgradig programmierbarer Bibliotheken sowie zur Aufzeichnung von Zelldaten und zur Untersuchung der Abstammung verwendet werden. Die Erfinder haben auch zusätzliche Ausgestaltungen von PEgRNAs in Betracht gezogen, die darauf abzielen, die Wirksamkeit des Prime-Editing zu verbessern. Ferner haben die Erfinder Verfahren für die erfolgreiche Einschleusung von Prime-Editoren unter Verwendung von Vektoreinschleusungssystemen aufgezeigt, die ein Splitting des napDNAbp unter Verwendung von Intein-Domänen beinhalten.
Der Begriff „Prime-Editing System“ oder „Prime-Editor (PE)“ bezieht sich auf die Zusammensetzungen, die in dem hierin beschriebenen Verfahren des Genom-Editings unter Verwendung der Ziel-geprimten reversen Transkription (TPRT) verwendet werden, einschließlich unter anderem die napDNAbps, reverse Transkriptasen, Fusionsproteine (z. B. napDNAbps und reverse Transkriptasen umfassend), verlängerte Leit-RNAs und Komplexe, die Fusionsproteine und verlängerte Leit-RNAs umfassen, sowie Zusatzelemente, wie z. B. Zweitstrang-Nicking-Komponenten und Endonukleasen zur Entfernung von 5'-endogenen DNA-Flaps (z. B. FEN1), die dazu beitragen, den Prime-Editing-Prozess zur Bildung des editierten Produkts zu führen.
In einer anderen Ausführungsform stellt die schematische Darstellung in 3F die Interaktion einer typischen PEgRNA mit einer Zielstelle einer doppelsträngigen DNA und die gleichzeitige Produktion eines einzelsträngigen 3'-DNA-Flaps dar, der die gewünschte genetische Veränderung enthält. Die Doppelstrang-DNA ist so dargestellt, dass sich der obere Strang in der 3'-zu-5'-Ausrichtung und der untere Strang in der 5'-zu-3'-Richtung befindet. Der obere Strang umfasst den „Protospacer“ und die PAM-Sequenz und wird als „Zielstrang“ bezeichnet. Der komplementäre untere Strang wird als „Nicht-Zielstrang“ bezeichnet. Die abgebildete PEgRNA ist zwar nicht dargestellt, würde aber mit einem Cas9 oder einem Äquivalent komplexiert werden. Wie im Schema dargestellt, bindet der Spacer der PEgRNA an eine komplementäre Region auf dem Zielstrang, die als Protospacer bezeichnet wird und sich unmittelbar stromabwärts der PAM-Sequenz befindet und etwa 20 Nukleotide lang ist. Diese Wechselwirkung bildet ein DNA/RNA-Hybrid zwischen der Spacer-RNA und der Protospacer-DNA und führt zur Bildung einer R-Schleife in der Region gegenüber dem Protospacer. Wie an anderer Stelle hierin gelehrt, induziert das Cas9-Protein (nicht gezeigt) dann eine Einkerbung („Nick“) im Nicht-Zielstrang, wie gezeigt. Dies führt dann zur Bildung der 3' ssDNA-Flap-Region, die gemäß *z* mit dem 3'-Ende der PEgRNA an der Primer- Bindungsstelle interagiert. Das 3'-Ende des ssDNA-Flaps (d. h. die Primer-Sequenz der reversen Transkriptase) bindet an die Primer-Bindungsstelle (A) auf der PEgRNA, wodurch die reverse Transkriptase geprimt wird. Anschließend polymerisiert die reverse Transkriptase (z. B. in trans oder cis als Fusionsprotein bereitgestellt und an das Cas9-Konstrukt angehängt) einen einzelnen DNA-Strang, der durch das Edit-Templat (B) und den Homologiearm (C) kodiert wird. Die Polymerisation setzt sich zum 5'-Ende des Verlängerungsarms hin fort. Der polymerisierte ssDNA-Strang bildet einen ssDNA-3'-End-Flap, der, wie an anderer Stelle beschrieben (z. B. wie in 1G), in die endogene DNA eindringt, den entsprechenden endogenen Strang verdrängt (der als 5'-DNA-Flap von der endogenen DNA entfernt wird) und das gewünschte Nukleotid-Editing (Änderung einzelner Nukleotid-Basenpaare, Deletionen, Insertionen (die ganze Gene beinhalten)) durch natürlich auftretende DNA-Reparatur- /Replikationsrunden einbaut.
Diese Anwendung des Prime-Editing kann in Beispiel 1 weiter beschrieben werden.
Dual-Prime-Editing
Diese Spezifikation beschreibt ein Dual-Prime-Editing-System (oder ein Dual-Flap- Prime-Editing-System), das die Herausforderungen im Zusammenhang mit der Flap- Equilibrierung und dem anschließenden Einbau des Edits in den nicht-editierten komplementären genomischen DNA-Strang durch gleichzeitiges Editing beider DNA-Stränge löst. Beim Dual-Flap-Prime-Editing werden zwei pegRNAs verwendet, die auf entgegengesetzte Stränge einer genomischen Stelle abzielen und die Synthese von zwei komplementären 3'-Flaps ansteuern, die die editierte DNA-Sequenz enthalten (91). Im Gegensatz zum klassischen Prime-Editing muss das Paar der editierten DNA-Stränge (3'-Flaps) nicht direkt mit den 5'-Flaps der endogenen genomischen DNA konkurrieren, da stattdessen der komplementäre editierte Strang für die Hybridisierung zur Verfügung steht. Da beide Stränge des Duplex als editierte DNA synthetisiert werden, erübrigt sich beim Dual-Flap- Prime-Editing der Austausch des nicht-editierten komplementären DNA-Strangs, der beim klassischen Prime-Editing erforderlich ist. Stattdessen muss die zelluläre DNA- Reparaturmaschinerie nur die gepaarten 5'-Flaps (ursprüngliche genomische DNA) herausschneiden und die gepaarten 3'-Flaps (editierte DNA) in den Locus ligieren. Daher müssen die neu synthetisierten DNA-Stränge keine Sequenzen enthalten, die mit der genomischen DNA homolog sind, was eine selektive Hybridisierung der neuen Stränge ermöglicht und Editing mit minimaler genomischer Homologie erleichtert. Nuklease-aktive Versionen von Prime-Editoren, die beide DNA-Stränge schneiden, könnten auch verwendet werden, um die Entfernung der ursprünglichen DNA-Sequenz zu beschleunigen. Gemäß bestimmten Ausführungsformen umfasst ein Dual-Flap-Prime-Editing-System ein Paar neu synthetisierter DNA-Stränge (z. B. 3'-Flaps), die mit der endogenen DNA-Sequenz an einer zu editierenden Zielstelle homolog sind. In einigen Ausführungsformen umfasst ein Dual-Flap- Prime-Editing-System ein Paar neu synthetisierter DNA-Stränge, wobei mindestens einer der neu synthetisierten DNA-Stränge keine Homologie mit der endogenen DNA-Sequenz an der zu editierenden Zielstelle aufweist. In einigen Ausführungsformen umfasst einer der neu synthetisierten DNA-Stränge eine Homologie mit der endogenen DNA-Sequenz an der Zielstelle und nicht mit dem anderen neu synthetisierten DNA-Strang. In einigen Ausführungsformen umfasst jeder der neu synthetisierten DNA-Stränge eine Homologie mit der endogenen DNA-Sequenz an der Zielstelle und nicht mit dem anderen neu synthetisierten DNA-Strang. Zum Beispiel kann ein neu synthetisierter 3'-Flap, der von einer der Dual-Flap- pegRNAs kodiert wird, eine Region der Komplementarität zu einer Protospacer-Sequenz der anderen Dual-Flap-pegRNA umfassen. Dementsprechend kann in einigen Ausführungsformen ein Paar Dual-Flap-pegRNAs, die jeweils Komplementarität zu einer Spacer-Sequenz der anderen pegRNA aufweisen, zu einer Deletion der endogenen DNA-Sequenz führen, die zwischen den Protospacer-Sequenzen des Paares von Dual-Flap-pegRNAs liegt. In einigen Ausführungsformen umfasst ein Dual-Flap-Prime-Editing-System ein Paar neu synthetisierter DNA-Stränge, wobei keiner der neu synthetisierten DNA-Stränge eine Homologie mit der endogenen DNA-Sequenz an der zu editierenden Zielstelle aufweist. Vielmehr umfassen die beiden neu synthetisierten DNA-Stränge (z. B. 3'-Flaps) jeweils eine Region der Komplementarität zueinander und können durch die Komplementarität einen Duplex bilden. An der Zielstelle des Duplex kann dann ein gewünschter editierter Abschnitt gegenüber der zu editierenden endogenen Sequenz der DNA eingebaut werden. Wie das klassische Prime- Editing ist das Dual-Prime-Editing ein vielseitiges und präzises Verfahren zum Genom- Editing, bei dem neue genetische Informationen direkt in eine bestimmte DNA-Stelle geschrieben werden, und zwar mit Hilfe eines programmierbaren DNA-Bindungsproteins („napDNAbp“), das in Assoziation mit einer Polymerase (d. h, in Form eines Fusionsproteins oder anderweitig in trans mit dem napDNAbp bereitgestellt) funktioniert, wobei das Prime- Editing-System mit einer Prime-Editing (PE)-Leit-RNA („PEgRNA“) programmiert ist, die sowohl die Zielstelle spezifiziert als auch die Synthese des gewünschten Edits in Form eines Austausch-DNA-Strangs mittels einer auf eine Leit-RNA (z. B. am 5'- oder 3'-Ende oder an einem internen Abschnitt einer Leit-RNA) aufgebrachten Verlängerung (entweder DNA oder RNA) als Templat bereitstellt. Der Austauschstrang, der den gewünschten Edit enthält (z. B. eine einzelne Nukleobasensubstitution), weist dieselbe Sequenz auf wie der endogene Strang der zu editierenden Zielstelle (mit der Ausnahme, dass er den gewünschten Edit beinhaltet). Durch die DNA-Reparatur- und/oder Replikationsmaschinerie wird der endogene Strang der Zielstelle durch den neu synthetisierten Austauschstrang ersetzt, der den gewünschten Edit enthält. In einigen Fällen kann das Prime-Editing als eine „Suchen-und-Ersetzen“-Technologie für das Genom-Editing angesehen werden, da die Prime-Editoren, wie hierin beschrieben, nicht nur die gewünschte zu editierende Zielstelle suchen und lokalisieren, sondern gleichzeitig einen Austauschstrang kodieren, der den gewünschten Edit enthält und anstelle des entsprechenden endogenen DNA-Strangs der Zielstelle eingebaut wird.
B. Verwendung von Prime-Editing für Peptid-Tagging
In einem weiteren Aspekt stellt die Offenbarung ein Verfahren zur Verwendung der hierin beschriebenen Dual-Prime-Editoren zum genetischen Pfropfen eines oder mehrerer Peptid-Tags auf ein Protein mittels Prime-Editing bereit (wie etwa die in 90 gezeigte Ausführungsform). Insbesondere stellt die Offenbarung ein Verfahren zum genetischen Einbauen eines oder mehrerer Peptid-Tags an ein Protein bereit, das Folgendes umfasst: Inkontaktbringen einer Ziel-Nukleotidsequenz, die das Protein kodiert, mit einem Prime- Editor, der dazu konfiguriert ist, eine zweite Nukleotidsequenz, die das eine oder die mehreren Peptid-Tags kodiert, einzufügen, um eine rekombinante Nukleotidsequenz zu erhalten, die ein Fusionsprotein kodiert, das das mit dem Protein-Tag fusionierte Protein umfasst.
In anderen Ausführungsformen stellt die Offenbarung ein Verfahren zur Herstellung eines Fusionsproteins bereit, das ein Peptid von Interesse und eines oder mehrere Peptid-Tags umfasst, wobei das Verfahren Folgendes umfasst: Inkontaktbringen einer Ziel- Nukleotidsequenz, die für das Protein kodiert, mit einem Prime-Editor, der dazu konfiguriert ist, eine zweite Nukleotidsequenz, die für den einen oder die mehreren Peptid-Tags kodiert, einzufügen, um eine rekombinante Nukleotidsequenz zu erhalten, die für das Fusionsprotein kodiert, das das mit dem Protein-Tag fusionierte Protein umfasst.
In verschiedenen Ausführungsformen ist die Ziel-Nukleotidsequenz ein spezifisches Gen von Interesse in einer genomischen DNA. Das Gen von Interesse kann ein Protein von Interesse kodieren (z. B. einen Rezeptor, ein Enzym, ein therapeutisches Protein, ein Membranprotein, ein Transportprotein, ein Signalübertragungsprotein oder ein immunologisches Protein usw.). Das betreffende Gen kann auch für ein RNA-Molekül kodieren, was unter anderem Boten-RNA (mRNA), Transfer-RNA (tRNA), ribosomale RNA (rRNA), kleine Kern-RNA (snRNA), Antisense-RNA, Leit-RNA, microRNA (miRNA), small interfering RNA (siRNA) und zellfreie RNA (cfRNA) beinhaltet.

Bei dem Peptid-Tag kann es sich um ein beliebiges Peptid-Tag oder eine Variante davon handeln, das einem Protein eine oder mehrere Funktionen verleiht, z. B. für die Trennung, Reinigung, Visualisierung, Solubilisierung oder Erkennung. Die Peptid-Tags können „Affinitäts-Tags“ (zur Erleichterung der Proteinreinigung), „Solubilisierungs-Tags“ (zur Unterstützung der richtigen Faltung von Proteinen), „Chromatographie-Tags“ (zur Veränderung der chromatographischen Eigenschaften von Proteinen), „Epitop-Tags“ (zur Bindung an hochaffine Antikörper) und „Fluoreszenz-Tags“ (zur Erleichterung der Visualisierung von Proteinen in einer Zelle oder in vitro) beinhalten. Beispiele für Peptid-Tags beinhalten unter anderem die folgenden Tags:

NAME	AMINOSÄURE-SEQUENZ	SEQ-ID-NR:
AVITAG™	GLNDIFEAQKIEWHE	SEQ-ID-NR: 245
C-TAG	EPEA	SEQ-ID-NR: 246
CALMODULIN-TAG	KRRWKKNFIKISAANRFKKISSSGAL	SEQ-ID-NR: 247
POLYGLUTAMAT-TAG	EEEEEE	SEQ-ID-NR: 248
E-TAG	GAPVPYPDPLEPR	SEQ-ID-NR: 249
FLAG-TAG	DYKDDDDK	SEQ-ID-NR: 250
HA-TAG	YPYDVPDYA	SEQ-ID-NR: 251
HIS-TAG	H (HIS₁)	SEQ ID NO: 252
	HH (HIS₂)	SEQ ID NO: 253
	HHH (HiS₃)	SEQ ID NO: 254
	HHHH (HIS₄)	SEQ ID NO: 255
	HHHHH (HIS₅)	SEQ ID NO: 256
	HHHHHH (HIS₆)	SEQ ID NO: 257
	HHHHHHH (HIS₇)	SEQ ID NO: 258
	HHHHHHHH (HIS₈)	SEQ ID NO: 259
	HHHHHHHHH (H1S₉)	SEQ ID NO: 260
	HHHHHHHHHH (HIS₁₀)	SEQ ID NO: 261
	HHHHHHHHHH...H...(HIS_N, WHEREIN N = 1-25)	SEQ ID NO: 262
MYC-TAG	EQKLISEEDL	SEQ-ID-NR: 263
NE-TAG	TKENPRSNOEESYDDNES	SEQ-ID-NR: 264
RHO1D4-TAG	TETSQVAPA	SEQ-ID-NR: 265
S-TAG	KETAAAKFLROHMDS	SEQ-ID-NR: 266
SBP-TAG		SEQ ID NO: 267
SOFTAG-1	SLAELLNAGLGGS	SEQ ID NO: 268
SOFTAG-2	TQDPSRVG	SEQ ID NO: 269
SPOT-TAG	PDRVRAVSHWSS	SEQ ID NO: 270
STREP-TAG	WSHPQFEK	SEQ ID NO: 271
TC-TAG	CCPGCC	SEQ-ID-NR: 272
TY-TAG	EVHTNQDPLD	SEQ-ID-NR: 273
V5-TAG	GKPIPNPLLGLDST	SEQ-ID-NR: 274
VSV-TAG	YTDIEMNRLGK	SEQ-ID-NR: 275
XPRESS-TAG	DLYDDDDK	SEQ ID NO: 276

Bei den Peptid-Tags kann es sich auch um die folgenden Affinitäts-Tags (für die Trennung und/oder Reinigung von Proteinen) handeln (wie in Tabelle 9.9.1 von Kimple et al. „Overview of Affinity Tags for Protein Purification“, Curr Protoc Protein Sci, 2013, 73: Unit- 9.9, beschrieben, die hierin durch Bezugnahme aufgenommen ist).

NAME	AMINOSÄURE-SEQUENZ
AU 1-EPITOP	DTYRYI	SEQ-ID-NR: 278
AUS-EPITOP	TDFYLK	SEQ-ID-NR: 279
BAKTERIOPHAGEN-T7- EPITOP (T7-TAG)	MASMTGGQQMG	SEQ-ID-NR: 280
BLUETONGUE-VIRUS-TAG (B-TAG)	QYPALT	SEQ-ID-NR: 281
E2-EPITOP	SSTSSDFRDR	SEQ-ID-NR: 282
HISTIDIN-AFFINITÄTS- TAG (HAT)	KDHLIHNVHKEFHAHAHNK	SEQ-ID-NR: 283
HSV-EPITOP	OPELAPED	SEQ-ID-NR: 284
POLYARGININ (ARG-TAG)	RRRRR	SEQ-ID-NR: 285
POLYASPARTAT (ASP-TAG)	CCCC	SEQ-ID-NR: 286
POLYPHENYLALANIN (PHE-TAG)	FFFFFFFFFFF	SEQ-ID-NR: 287
S1-TAG	NANNPDWDF	SEQ-ID-NR: 288
S-TAG	KETAAAKFERQHMDS	SEQ-ID-NR: 289
VSV-G	YTDIEMNRLGK	SEQ-ID-NR: 290

In bestimmten Ausführungsformen können die Peptid-Tags einen His⁶-Tag, FLAG- Tag, V5-Tag, GCN4-Tag, HA-Tag, Myc-Tag, FIAsH/ReAsH-Tag, ein Sortase-Substrat, eine pi-Klemme beinhalten.
In verschiedenen Ausführungsformen können die Peptid-Tags für Anwendungen verwendet werden, die Protein-Fluoreszenzmarkierung, Immunpräzipitation, Immunoblotting, Immunhistochemie, Proteinrekrutierung, induzierbare Proteindegradierung und genomweites Screening beinhalten.
In verschiedenen anderen Ausführungsformen kann das Peptid-Tag eine Intein- Sequenz beinhalten, um die Selbstspleißfunktion des Proteins einzubauen. Wie hierin verwendet, bezieht sich der Begriff „Intein“ auf selbstverarbeitende Polypeptiddomänen, die in Organismen aus allen Domänen des Lebens vorkommen. Ein Intein (intervenierendes Protein) führt ein einzigartiges Selbstverarbeitungsereignis durch, das als Proteinspleißen bekannt ist, bei dem es sich selbst aus einem größeren Vorläuferpolypeptid durch die Spaltung von zwei Peptidbindungen herausschneidet und dabei die flankierenden Extein-Sequenzen (externe Proteine) durch die Bildung einer neuen Peptidbindung ligiert. Diese Umlagerung erfolgt posttranslational (oder möglicherweise co-translational), da Intein-Gene in Frames innerhalb anderer proteincodierender Gene eingebettet sind. Außerdem erfolgt das Inteinvermittelte Proteinspleißen spontan; es erfordert keinen externen Faktor oder eine Energiequelle, sondern lediglich die Faltung der Intein-Domäne. Dieser Prozess wird auch als Cis-Protein-Spleißen bezeichnet, im Gegensatz zum natürlichen Prozess des Trans-Protein- Spleißens mit „Split-Inteins“. Inteins sind das Proteinäquivalent zu den selbstspleißenden RNA-Introns (siehe Perler et al., Nucleic Acids Res. Inteins sind das Proteinäquivalent zu den selbstspleißenden RNA-Introns (siehe Perler et al., Nucleic Acids Res. 22:1125-1127 (1994)), die ihre eigene Abspaltung von einem Vorläuferprotein mit der gleichzeitigen Fusion der flankierenden Proteinsequenzen, den so genannten Exteinen, katalysieren (Übersicht in Perler et al., Curr. Opin. Chem. Biol. 1 :292-299 (1997); Perler, F. B. Cell92(1):1-4 (1998); Xu et al., EMBO J. 15(19):5146-5153 (1996)).
Der Mechanismus des Proteinspleißprozesses ist sehr detailliert untersucht worden (Chong, et al., J. Biol. Chem. 1996, 271, 22159-22168; Xu, M-Q & Perler, F. B. EMBO Journal, 1996, 15, 5146-5153) und es wurden konservierte Aminosäuren an den Intein- und Extein-Spleißstellen gefunden (Xu, et al., EMBO Journal, 1994, 13 5517-522).
Inteine können auch als zwei Fragmente vorliegen, die von zwei getrennt transkribierten und übersetzten Genen kodiert werden. Diese so genannten Split-Inteine assoziieren sich selbst und katalysieren die Proteinspleißaktivität in trans. Split-Inteine wurden in verschiedenen Cyanobakterien und Archaeen nachgewiesen (Caspi et al, Mol Microbiol. 50: 1569-1577 (2003); Choi J. Et al, J Mol Biol. 556: 1093-1106 (2006.); Dassa B. Et al, Biochemistry. 46:322-330 (2007.); Liu X. Und Yang J., J Biol Chem. 275:26315-26318 (2003); WuH. Et al. Proc Natl Acad Sei USA. £5:9226-9231 (1998.); und Zettler J. Et al, FEBS Letters. 553:909-914 (2009)), wurden aber bisher noch nicht in Eukaryoten gefunden. Kürzlich wurden bei einer bioinformatischen Analyse von Umwelt-Metagenomdaten 26 verschiedene Loci mit einer neuartigen genomischen Anordnung entdeckt. An jedem Locus ist eine konservierte Enzymkodierungsregion durch ein Split-Intein unterbrochen, wobei zwischen den Abschnitten, die für Intein-Subdomänen kodieren, ein freistehendes Endonuklease-Gen eingefügt ist. Von diesen wurden fünf Loci vollständig zusammengefügt: DNA-Helikasen (gp41-1, gp41-8); Inosin- 5' Monophosphat-Dehydrogenase (IMPDH-1); und katalytische Untereinheiten der Ribonukleotid-Reduktase (NrdA-2 und NrdJ-1). Diese zersplitterte Genorganisation scheint hauptsächlich bei Phagen aufzutreten (Dassa et al, Nucleic Acids Research. 57:2560-2573 (2009)). 57:2560-2573 (2009)).
In bestimmten Ausführungsformen können die hierin beschriebenen Prime-Editoren dazu verwendet werden, Split-Intein-Tags in zwei verschiedene Proteine einzufügen, die bei gemeinsamer Exprimierung zur Bildung eines Fusionsproteins intrazellulär ligiert werden. Beim Trans-Splicing von Proteinen besteht ein Vorläuferprotein aus einem N-Extein-Teil, auf den das N-Intein folgt, ein anderes Vorläuferprotein besteht aus dem C-Intein, auf das ein C- Extein-Teil folgt, und eine Trans-Splicing-Reaktion (die von den N- und C-Inteinen gemeinsam katalysiert wird) schneidet die beiden Intein-Sequenzen heraus und verknüpft die beiden Extein-Sequenzen mit einer Peptidbindung. Protein-Trans-Splicing ist eine enzymatische Reaktion, die mit sehr niedrigen (z. B. Mikromolaren) Proteinkonzentrationen arbeiten kann und unter physiologischen Bedingungen durchgeführt werden kann.
Das Split-Intein Npu DnaE wurde als das mit der höchsten Rate charakterisiert, die für die Protein-Trans-Splicing-Reaktion berichtet wurde. Darüber hinaus gilt die Npu DnaE- Proteinspleißreaktion als robust und ertragreich in Bezug auf verschiedene Extein-Sequenzen, Temperaturen von 6 bis 37 °C und die Anwesenheit von bis zu 6 M Harnstoff (Zettler J. Et al, FEBS Letters. 553:909-914 (2009); Iwai I. Et al, FEBS Letters 550: 1853-1858 (2006)). Wie erwartet, wurde bei Einführung der Cysl-Ala-Mutation in der N-Domäne dieser Inteine die anfängliche N- zu S-Acylverschiebung und damit das Proteinspleißen blockiert. Leider wurde auch die C-terminale Spaltreaktion fast vollständig gehemmt. Die Abhängigkeit der Asparagin- Cyclisierung an der C-terminalen Spleißstelle von der Acylverschiebung an der N-terminalen spaltbaren Peptidbindung scheint eine einzigartige Eigenschaft zu sein, die den natürlich gesplitteten DnaE-Intein-Allelen gemeinsam ist (Zettler J. Et al. FEBS Letters. 555:909-914 (2009)).
Das Trans-Splicing von Proteinen, das durch Split-Inteine katalysiert wird, stellt ein rein enzymatisches Verfahren zur Proteinbindung bereit. Bei einem Split-Intein handelt es sich im Wesentlichen um ein zusammenhängendes Intein (z. B. Ein Mini-Intein), das in zwei Teile, das N-Intein und das C-Intein, gesplittet wird. Das N-Intein und das C-Intein eines Split-Inteins können sich nicht-kovalent verbinden, um ein aktives Intein zu bilden und die Spleißreaktion im Wesentlichen auf die gleiche Weise zu katalysieren wie ein zusammenhängendes Intein. Split-Inteine wurden in der Natur gefunden und auch in Labors hergestellt. Wie hierin verwendet, bezieht sich der Begriff „Split-Intein“ auf jedes Intein, bei dem eine oder mehrere Peptidbindungen zwischen den N-terminalen und C-terminalen Aminosäuresequenzen unterbrochen sind, so dass die N-terminalen und C-terminalen Sequenzen zu separaten Molekülen werden, die sich nicht-kovalent reassoziieren oder zu einem Intein rekonstituieren können, das für Trans-Splicing-Reaktionen funktional ist. Jedes katalytisch aktive Intein oder Fragment davon kann verwendet werden, um ein Split-Intein zur Verwendung in den erfindungsgemäßen Verfahren abzuleiten. Zum Beispiel kann in einem Aspekt das Split-Intein von einem eukaryotischen Intein abgeleitet sein. In einem anderen Aspekt kann das Split-Intein von einem bakteriellen Intein abgeleitet sein. In einem anderen Aspekt kann das Split-Intein von einem Archaeen-Intein abgeleitet sein. Vorzugsweise besitzt das so gewonnene Split- Intein nur die Aminosäuresequenzen, die für die Katalyse von Trans-Splicing-Reaktionen wesentlich sind.
Split-Inteine können aus zusammenhängenden Inteinen gebildet werden, indem eine oder mehrere Splitstellen in die unstrukturierte Schleife oder die dazwischen liegende Aminosäuresequenz zwischen den -12 konservierten Betasträngen, die in der Struktur der Mini-Inteine zu finden sind, eingebaut werden. Eine gewisse Flexibilität bei der Position der Spaltstellen in den Regionen zwischen den Betasträngen ist möglich, vorausgesetzt, dass die Struktur des Inteins, insbesondere die strukturierten Betastränge, durch die Schaffung der Spaltstelle nicht so stark gestört wird, dass die Proteinspleißaktivität verloren geht.
Die hierin beschriebenen Prime-Editoren können Peptid-Tags (einschließlich Inteins) in das C-terminale Ende eines Proteins von Interesse einbauen. In anderen Ausführungsformen können die Peptid-Tags (einschließlich Inteins) in das N-terminale Ende eines Proteins von Interesse eingebaut werden. Die Peptid-Tags können auch in das Innere eines Proteins von Interesse eingebaut werden. Die resultierenden Fusionsproteine, die mit den hierin beschriebenen Prime-Editoren hergestellt werden, können die folgenden Strukturen aufweisen:

[Protein von Interesse] - [Peptid-Tag];
[Peptid-Tag] - [Protein von Interesse]; oder
[Protein von Interesse - N-terminale Region] - [Peptid-Tag] - [Protein von Interesse - C-terminale Region].

Die Grundsätze der Ausgestaltung von Leit-RNA zur Verwendung bei der Peptidmarkierung können auch auf das Peptid-Tagging angewendet werden. Zum Beispiel kann in einer Ausführungsform die PEgRNA-Struktur für das Peptid-Tagging die folgende Struktur aufweisen: 5'-[Spacer-Sequenz]-[gRNA-Kern oder -Gerüst]-[Verlängerungsarm]-3', wobei der Verlängerungsarm in der 5'-zu-3'-Richtung einen Homologiearm, ein Edit-Templat (das die Sequenz umfasst, die das Peptid-Tag kodiert) und eine Primer-Bindungsstelle umfasst. Diese Konfiguration ist in 3D und in 24 veranschaulicht.
In einer anderen Ausführungsform kann die PEgRNA-Struktur für das Peptid-Tagging die folgende Struktur aufweisen: 5'-[Verlängerungsarm]-[Spacer-Sequenz]-[gRNA-Kern oder -Gerüst]-3', wobei der Verlängerungsarm in der 5'-zu-3'-Richtung einen Homologiearm, ein Edit-Templat (das die Sequenz umfasst, die den Peptid-Tag kodiert) und eine Primer- Bindungsstelle umfasst. Diese Konfiguration ist in 3E veranschaulicht.
Ausführungsformen des Peptid-Taggings durch Prime-Editing sind in 25 und 26 dargestellt und in Beispiel 4 beschrieben.
B. Verwendung von Dual-Prime-Editing für RNA-Tagging
Dual-Prime-Editing kann auch verwendet werden, um die Sequenzen von DNA, die RNA-Funktionen durch RNA-Tagging kodiert, zu manipulieren, zu verändern und anderweitig zu modifizieren, und stellt auf diese Weise ein Mittel bereit, um die Struktur und Funktion von RNA indirekt zu modifizieren. Dual-PE kann zum Beispiel verwendet werden, um Motive einzufügen, die auf RNA-Ebene funktionell sind (im Folgenden RNA-Motive), um nichtkodierende RNAs oder mRNAs zu markieren oder anderweitig zu manipulieren. Diese Motive könnten dazu dienen, die Genexprimierung zu erhöhen, die Genexprimierung zu verringern, das Spleißen zu verändern, die posttranskriptionelle Modifikation zu verändern, die subzelluläre Lage der RNA zu beeinflussen, die Isolierung oder Bestimmung der intra- oder extrazellulären Lage der RNA zu ermöglichen (z. B. Durch Verwendung fluoreszierender RNA-Aptamere wie Spinat, Spinat2, Baby-Spinat oder Brokkoli), endogene oder exogene Protein- oder RNA-Binder zu rekrutieren, sgRNAs einzuführen oder die Verarbeitung der RNA entweder durch Selbstspaltung oder RNAsen zu induzieren (siehe 28B und Beispiel 6 für weitere Details).

Die folgenden RNA-Tags oder -Motive können durch Dual-Prime-Editing (z. B. Mit dem Dual-PE-Verfahren aus 90) mit einer geeigneten PEgRNA (die nach den hierin gegebenen Anleitungen ausgestaltet wurde) in ein Gen von Interesse eingefügt werden, um verschiedene RNA-Eigenschaften zu beeinflussen, einschließlich RNA-Transport, Exprimierung, Spleißen und Erkennung.

RNA-MOTIV	SEQUENZ DES RNA-MOTIVS	FUNKTION/ WIRKUNG	BEISPIELHAFTE PEGRNA FÜR DIE PRIME-EDITING- INSTERTION DES RNA-MOTIVS IN DAS BEISPIELHAFTE HEXA-GEN*
POLYOMAVIRUS AFFENVIRUS 40 (SV40) TYP1		BEENDUNG DER TRANSKRIPTION DES MARKIERTEN GENS; TRANSPORT VON MRNA INS CYTOSOL; ERHÖHTE RNA- STABILITÄT UND EXPRIMIERUNG VON KODIERTEM PROTEIN
POLYOMAVIRUS AFFENVIRUS 40 (SV40) TYP2		BEENDUNG DER TRANSKRIPTION DES MARKIERTEN GENS; TRANSPORT VON MRNA INS CYTOSOL; ERHÖHTE RNA- STABILITÄT UND EXPRIMIERUNG VON KODIERTEM PROTEIN
POLYOMAVIRUS AFFENVIRUS 40 (SV40) TYP3		BEENDUNG DER TRANSKRIPTION DES MARKIERTEN GENS; TRANSPORT VON MRNA INS CYTOSOL; ERHÖHTE RNA- STABILITÄT UND EXPRIMIERUNG VON KODIERTEM PROTEIN

HUMANES WACHSTUMSHORMON (HUMAN GROWTH HORMONE - HGH)		TRANSPORT VON RNA IN DAS ZYTOPLASMA; VERBESSERTE RNA-STABILITÄT UND EXPRIMIERUNG DES KODIERTEN PROTEINS
RINDERWACHSTUMSHORMON (BOVINE GROWTH HORMONE - BGH)		TRANSPORT VON RNA IN DAS ZYTOPLASMA; VERBESSERTE RNA-STABILITÄT UND EXPRIMIERUNG DES KODIERTEN PROTEINS
KANINCHEN- BETA-GLOBIN (RBGLOB)		TRANSPORT VON RNA IN DAS ZYTOPLASMA; VERBESSERTE RNA-STABILITÄT UND EXPRIMIERUNG DES KODIERTEN PROTEINS

THYMIDINKINASE (TK)		TRANSPORT VON RNA IN DAS ZYTOPLASMA; VERBESSERTE RNA-STABILITÄT UND EXPRIMIERUNG DES KODIERTEN PROTEINS
MALAT1 ENE- MASCRNA		FÜHRT ZUR RETENTION VON RNA IM ZELLKERN, TRANSKRIPTTER MINATION UND STABILISIERUNG
KSHV PAN ENE		FÜHRT ZUR RETENTION VON RNA IM ZELLKERN, TRANSKRIPTTER MINATION UND STABILISIERUNG

DREI SEQUENTIELLE KSHV PAN ENES MIT KURZEN, NICHT KONSERVIERTEN RNA- LINKERN		FÜHRT ZUR RETENTION VON RNA IM NUKLEUS, TRANSKRIPTTER MINATION UND - STABILISIERUNG, VORAUSSICHTLIC H GRÖßER ALS EIN EINZELNES PAN ENE

SMBOX/U1 SNRNA BOX		FÜHRT ZUR RETENTION VON RNA IM NUKLEUS UND TRANSKRIPTTER MINATION
U1 SNRNA 3' BOX		FÜHRT ZUR RETENTION VON RNA IM NUKLEUS UND TRANSKRIPTTER MINATION
TRNA-LYSIN		ERMÖGLICHT BERICHTEN ZUFOLGE DEN TRANSPORT VON RNA ZU MITOCHONDRIEN
BROKKOLI- APTAMER		VISUALISIERUNG (FLUORESZENZ)
SPINAT- APTAMER		VISUALISIERUNG (FLUORESZENZ)
SPINAT2- APTAMER		VISUALISIERUNG (FLUORESZENZ)
MANGO- APTAMER		VISUALISIERUNG (FLUORESZENZ)
HDV-RIBOZYM		3'-ENDE-RNA- VERARBEITUNG
N⁶- METHYLADEN OSIN-MARKER (M⁶A)		ZIEL FÜR DIE METHYLIERUNG (UNTERSTRICHENE A SIND METHYLIERT). DIE M6A- METHYLIERUNG KANN ZU EINER VERBESSERTEN RNA-STABILITÄT UND - EXPRIMIERUNG FÜHREN, IST JEDOCH NOCH NICHT VOLLSTÄNDIG VERSTANDEN

* jede PEgRNA ist in 5'-zu-3'-Richtung gezeigt und weist die folgenden Strukturelemente von 3F, wie nach Schriftart angegeben, wie folgt auf: 5' - Spacer-Sequenz (normale Schriftart) - gRNA-Kern (unterstrichene Sequenz) - Homologiearm (kursiv) - RT-Templat (fett gedruckt) - Primer-Bindungsstelle (kursiv) - 3'.

Die PEgRNAs der obigen Tabelle sind ausgestaltet, um ortsspezifisch Beispiele der obigen Motive in das HEXA-Gen (defekt bei Tay-Sachs-Krankheit) einzufügen (z. B. GenBank Nr. KR710351.1 (SEQ-ID-Nr: 369), was jedoch nur der Veranschaulichung dient. Die Verwendung von Prime-Editing beim RNA-Tagging ist nicht auf das HEXA-Gen beschränkt und kann tatsächlich beliebig sein. Die HEXA-mRNA hat die folgende Nukleotidsequenz:
Das entsprechende HEXA-Protein hat folgende Aminosäuresequenz:
Bemerkenswerterweise würden die resultierenden RNA-Motive innerhalb der translatierten Region des HEXA-Gens enthalten sein, wodurch die Funktion des Proteinkodierenden Gens unterbrochen würde. Eingefügte Polyadenylierungsmotive würden zu einer vorzeitigen Transkripttermination führen. Diese Stelle ist lediglich illustrativ für die potenziellen PEgRNAs, die zur Insertion der aufgelisteten RNA-Motive der obigen Tabelle innerhalb einer genomischen Stelle führen könnten, die transkribiert wird und somit ein RNA- Produkt produzieren würde.
PEgRNAs zur Verwendung mit PE zum RNA-Tagging könnten von einem U6- Promotor exprimiert werden (in diesem Fall würde ein einzelnes Guanosin an das 5'-Ende der PEgRNA für Guides hinzugefügt, die Protospacer enthalten, die nicht mit einem G und 6-7 Thymin beginnen, am 3'-Ende angefügt) oder ein Pol II-Promotor wie pCMV (in diesem Fall könnte es notwendig sein, die intrinsisch transkribierte Sequenz dieses Promotors vom 5'-Ende der RNA über ein selbstspaltendes Element oder Csy4-Motiv zu entfernen, und ein Terminationsmotiv müsste an das 3'-Ende der RNA angefügt werden, das nicht zum Export der RNA aus dem Kern führt, wie das oben aufgeführte 3'-Box-Motiv. Man beachte, dass dieses Motiv aufgrund von PE nicht in das Genom eingefügt würde, da es 3' der Hybridisierungsregion wäre). Das Kern-PEgRNA-Gerüst ist unterstrichen, die Homologie- und Hybridisierungsregionen sind kursiv gedruckt und die eingefügte Sequenz ist fett gedruckt. Man beachte, dass die eingefügte Sequenz das reverse Komplement der obigen Beispiele ist - wie unten beschrieben, weshalb diese PEgRNAs auf den kodierenden Strang gerichtet werden müssten.
Außerdem ist zu beachten, dass andere selbstspaltende Ribozyme als HDV in einigen Ausführungsformen auf die gegebene Zielstelle zugeschnitten werden müssen; das heißt, während HDV das kodierte Transkript sofort 5' zu sich selbst spaltet, befinden sich die Schnittstellen für alle anderen selbstspaltenden Ribozyme innerhalb des Ribozyms selbst. Daher wären die ersten und letzten ungefähr 5-10 Nukleotide (und in einigen Fällen möglicherweise mehr als 10) tatsächlich ein Teil der kodierten Sequenz. Beispielsweise würde, um die Sequenz 5'NNNNNTCATCCTGATAAACTGCAAA3' (SEQ-ID-NR: 371) nach den 5 Ns zu spalten, wobei N ein beliebiges Nukleotid ist, unter Verwendung eines selbstspaltenden Hammerhead-Ribozyms die folgende Sequenz eingefügt werden, wobei die unterstrichenen Sequenzen ein unvollkommenes RNA-Paarungselement bilden.
Hinsichtlich der Länge und Art dieses Paarungselements besteht eine erhebliche Flexibilität, und dies würde für jedes der in der ursprünglichen Einreichung aufgeführten selbstspaltenden Nicht-HDV-Ribozyme zutreffen. Um ein Hammerhead-Ribozym einzubauen, um die hexA-mRNA unter Verwendung einer PEgRNA mit dem gleichen Protospacer wie die oben aufgeführten Konstrukte zu spalten, könnte die folgende PEgRNA- Sequenz verwendet werden (Markierungen wie oben):
(wobei das PEgRNA-Kerngerüst unterstrichen ist, die Homologie- und Hybridisierungsregionen kursiv und die eingefügte Sequenz fett gedruckt sind) (SEQ-ID-NR: 373).
Das Ausgestalten anderer PEgRNA zur Insertion von RNA-Motiven kann dem hierin beschriebenen allgemeinen Prinzip folgen. Es ist jedoch anzumerken, dass viele der RNA- Motive potenziell stark strukturiert sind, was ihre Reverse-Transkribierung und Insertion in das Genom erschweren könnte. Obwohl für einige RNA-Sequenzen, wie beispielsweise einfache Haarnadeln, sowohl die RNA-Sequenz selbst als auch ihr Komplement strukturiert sind. Es ist jedoch unwahrscheinlich, dass dies für die oben genannten Sequenzen zutrifft. Daher wäre es beim Einfügen dieser Motive höchstwahrscheinlich am besten, wenn die PEgRNA das reverse Komplement dieser Sequenzen kodiert, was dazu führt, dass die DNA-Sequenz, die das Motiv tatsächlich kodiert, in das Genom eingefügt wird. In ähnlicher Weise würde die Aufnahme eines selbstspaltenden Ribozyms in die PEgRNA-Templat-Region zu einer Verarbeitung und ineffizienter Aktivität führen, während die Aufnahme seines reversen Komplements dies nicht würde. Somit müssen diese PEgRNAs wahrscheinlich auf den kodierenden Strang abzielen, wohingegen PEgRNAs, die andere Arten von Insertionen (wie therapeutische Korrektur) kodieren, theoretisch auf jeden Strang abzielen könnten.
Man beachte auch, dass für viele der eingefügten Motive die resultierende PEgRNA möglicherweise nicht vom U6-Promotor transkribiert werden kann, was die Verwendung anderer Promotoren wie pCMV erfordert. In ähnlicher Weise könnten auch längere PEgRNAs weniger stabil sein. Kürzere Motive wie m⁶A-Marker hätten diese Herausforderung nicht.
D. Verwendung von Dual-Prime-Editing zum Einfügen von Immunepitopen
Dual-Prime-Editing (z. B. wie in der Ausführungsform in 90) kann auch als Mittel verwendet werden, um bekannte Immunogenitäts-Epitope in endogene oder fremde genomische DNA einzufügen, was zu einer Modifikation der entsprechenden Proteine für therapeutische oder biotechnologische Anwendungen führt (siehe 31 und 32) Vor der Erfindung des klassischen Prime-Editings oder Dual-Prime-Editings konnten solche Einfügungen nur ineffizient und mit hohen Informationsraten von DSBs erreicht werden. Prime-Editing löst das Problem der hohen Informationsdichte bei Insert-Edits und bietet im Allgemeinen eine höhere Effizienz als HDR. Diese niedrigere Rate der Indel-Bildung stellt einen Hauptvorteil des Prime-Editing gegenüber HDR als Verfahren für gezielte DNA- Insertionen dar, insbesondere bei der beschriebenen Anwendung der Insertion von Immunogenitätsepitopen. Die Länge der Epitope liegt im Bereich von wenigen Basen bis zu Hunderten von Basen. Prime-Editing ist ein effizienter Ansatz, um solche gezielten Insertionen in Säugetierzellen zu erreichen.
Das Schlüsselkonzept der Erfindung ist die Verwendung von Dual-Prime-Editoren, um eine Nukleotidsequenz, die zuvor beschriebene Immunogenitätsepitope enthält, in endogene oder fremde genomische DNA zur Herunterregulierung und/oder Zerstörung ihrer Proteinprodukte und/oder exprimierenden Zelltypen einzufügen. Nukleotidsequenzen für die immunogene Epitopinsertion würden in einer Weise auf Gene gezielt werden, um Fusionsproteine des kodierten Proteins des Ziel-Gens und der entsprechenden Proteintranslation des eingefügten immunogenen Epitops zu produzieren. Das Immunsystem des Patienten wurde zuvor darauf trainiert, diese Epitope als Ergebnis einer vorherigen Standardimmunisierung von einer routinemäßigen Impfung beispielsweise gegen Tetanus oder Diphtherie oder Masern zu erkennen. Aufgrund der immunogenen Natur der fusionierten Epitope würde erwartet, dass das Immunsystem des Patienten das prime-editierte Protein (nicht nur das eingefügte Epitop) und möglicherweise die Zellen, aus denen es exprimiert wurde, erkennt und deaktiviert.
Präzise Genom-Targeting-Technologien unter Verwendung des CRISPR/Cas-Systems wurden kürzlich in einer Vielzahl von Anwendungen untersucht, einschließlich der Insertion von gentechnisch veränderten DNA-Sequenzen in gezielte genomische Loci. Zuvor wurde für diese Anwendung die homologiegerichtete Reparatur (homology-directed repair - HDR) verwendet, die ein ssDNA-Donor-Templat und eine Reparaturinitiation mittels eines doppelsträngigen DNA-Bruchs (double-stranded DNA break - DSB) erforderte. Diese Strategie bietet das breiteste Spektrum möglicher Veränderungen in Zellen und ist das einzige verfügbare Verfahren, um große DNA-Sequenzen in Säugerzellen einzufügen. HDR wird jedoch durch unerwünschte zelluläre Nebenwirkungen behindert, die von seinem initiierenden DSB herrühren, wie z. B. hohe Indel-Bildung, DNA-Translokationen, große Deletionen und P53-Aktivierung. Zusätzlich zu diesen Nachteilen ist HDR in vielen Zelltypen durch eine geringe Effizienz eingeschränkt (T-Zellen sind eine bemerkenswerte Ausnahme von dieser Beobachtung). Zu den jüngsten Bemühungen, diese Nachteile zu überwinden, gehört die Fusion humaner Rad51-Mutanten mit einer Cas9-D10A-Nickase (RDN), was zu einem DSBfreien HDR-System führt, das verbesserte HDR-Produkt:Indel-Verhältnisse und ein geringeres Off-Target-Editing aufweist, aber immer noch durch Zelltyp-Abhängigkeiten und nur bescheidene HDR-Editing-Effizienz behindert wird.
Kürzlich entwickelte Fusionen von Cas9 mit reversen Transkriptasen („Prime- Editoren“) gekoppelt mit PEgRNAs stellen eine neuartige Genom-Editing-Technologie dar, die eine Reihe von Vorteilen gegenüber bestehenden Genom-Editing-Verfahren bietet, einschließlich der Möglichkeit, jede einzelne Nukleotid-Substitution einzubauen und jeden kurzen Abschnitt von Nukleotiden (bis zu mindestens mehreren Dutzend Basen) auf ortsspezifische Weise einzufügen oder zu löschen. Bemerkenswerterweise werden PE-Edits mit im Allgemeinen geringen Raten unbeabsichtigter Indels erreicht. Als solches ermöglicht PE gezielte, einfügebasierte Editingsanwendungen, die zuvor unmöglich oder unpraktisch waren.
Dieser besondere Aspekt beschreibt ein Verfahren zur Verwendung von Prime-Editing als Mittel zum Einfügen bekannter Immunogenitätsepitope in endogene oder fremde genomische DNA, was zu einer Modifikation der entsprechenden Proteine für therapeutische oder biotechnologische Anwendungen führt (siehe 31 und 32) Vor der Erfindung des Prime-Editing konnten solche Einfügungen nur ineffizient und mit hohen Informationsraten von DSBs erreicht werden. Prime-Editing löst das Problem der hohen Informationsdichte bei Insert-Edits und bietet im Allgemeinen eine höhere Effizienz als HDR. Diese niedrigere Rate der Indel-Bildung stellt einen Hauptvorteil des Prime-Editing gegenüber HDR als Verfahren für gezielte DNA-Insertionen dar, insbesondere bei der beschriebenen Anwendung der Insertion von Immunogenitätsepitopen. Die Länge der Epitope liegt im Bereich von wenigen Basen bis zu Hunderten von Basen. Prime-Editing ist die effizienteste und sauberste Technologie, um solche gezielten Insertionen in Säugetierzellen zu erreichen.
Das Schlüsselkonzept dieses Aspekts ist die Verwendung von Prime-Editoren, um eine Nukleotidsequenz, die zuvor beschriebene Immunogenitätsepitope enthält, in endogene oder fremde genomische DNA zur Herunterregulierung und/oder Zerstörung ihrer Proteinprodukte und/oder exprimierenden Zelltypen einzufügen. Nukleotidsequenzen für die immunogene Epitopinsertion würden in einer Weise auf Gene gezielt werden, um Fusionsproteine des kodierten Proteins des Ziel-Gens und der entsprechenden Proteintranslation des eingefügten immunogenen Epitops zu produzieren. Das Immunsystem des Patienten wurde zuvor darauf trainiert, diese Epitope als Ergebnis einer vorherigen Standardimmunisierung von einer routinemäßigen Impfung beispielsweise gegen Tetanus oder Diphtherie oder Masern zu erkennen. Aufgrund der immunogenen Natur der fusionierten Epitope würde erwartet, dass das Immunsystem des Patienten das prime-editierte Protein (nicht nur das eingefügte Epitop) und möglicherweise die Zellen, aus denen es exprimiert wurde, erkennt und deaktiviert.
Fusionen mit Ziel-Genen würden nach Bedarf manipuliert, um sicherzustellen, dass die Translation des inserierten Epitopproteins für die Erkennung des Immunsystems exponiert wird. Dies könnte gezielte Nukleotidinsertionen umfassen, die zu Proteintranslationen führen, die C-terminale Fusionen von Immunogenitätsepitopen mit Ziel-Genen, N-terminale Fusionen von Immunogenitätsepitopen mit Zielgenen oder die Insertion von Nukleotiden in Gene ergeben, so dass Immunogenitätsepitope innerhalb oberflächenexponierter Regionen der Proteinstruktur kodiert werden.
Protein-Linker, die als Nukleotide kodiert werden, die zwischen der Zielgensequenz und der eingefügten Immunogenitätsepitop-Nukleotidsequenz eingefügt sind, müssen möglicherweise als Teil dieser Erfindung konstruiert werden, um die Erkennung des Immunsystems, den Zelltransport, die Proteinfunktion oder die Proteinfaltung des Zielgens zu erleichtern. Diese inserierten Nukleotid-kodierten Protein-Linker können (unter anderem) variable Längen und Sequenzen des XTEN-Linkers oder variable Längen und Sequenzen von Glycin-Serin-Linkern umfassen. Diese konstruierten Linker wurden früher verwendet, um Proteinfusionen erfolgreich zu erleichtern. Beispielhafte Linker können jeden der hierin beschriebenen umfassen, einschließlich der Aminosäuresequenz (GGGGS)n (SEQ-ID-NR: 165), (G)n (SEQ-ID-NR: 166), (EAAAK)n (SEQ-ID-NR: 167), (GGS)n (SEQ-ID-NR: 168), (SGGS)n (SEQ-ID-NR: 169), (XP)n (SEQ-ID-NR: 170), oder eine beliebige Kombination davon, wobei n unabhängig eine ganze Zahl zwischen 1 und 30 ist und wobei X eine beliebige Aminosäure ist. In einigen Ausführungsformen umfasst der Linker die Aminosäuresequenz (GGS)n (SEQ-ID-NR: 176), wobei n 1, 3, or 7 ist. In einigen Ausführungsformen umfasst der Linker die Aminosäuresequenz SGSETPGTSESATPES (SEQ-ID-NR: 171). In einigen Ausführungsformen umfasst der Linker die Aminosäuresequenz SGGSSGGSSGSETPGTSESATPESSGGSSGGS (SEQ-ID-NR: 172). In einigen Ausführungsformen umfasst der Linker die Aminosäuresequenz SGGSGGSGGS (SEQ-ID- NR: 173). In einigen Ausführungsformen umfasst der Linker die Aminosäuresequenz SGGS (SEQ-ID-NR: 174).
Unterscheidungsmerkmale dieses Aspekts schließen die Fähigkeit ein, zuvor erworbene Immunantworten auf spezifische Aminosäuresequenzen als Mittel zu verwenden, um eine Immunantwort gegen ansonsten nicht immunogene Proteine zu induzieren. Ein weiteres Unterscheidungsmerkmal ist die Fähigkeit, die Nukleotidsequenzen dieser immunogenen Epitope zielgerichtet einzufügen, so dass kein hohes Maß an unerwünschten Indels als Nebenprodukt des Editings entsteht und die Einfügung effizient erfolgt. Diese spezifische Anwendung von PE hat die Fähigkeit, zelltypspezifische Einschleusungsverfahren (wie AAV-Serotypen) zu kombinieren, um Epitope in Zelltypen zu inserieren, die für die Auslösung einer Immunantwort von Interesse sind.
Prime-Editing als Mittel zum Einfügen immunogener Epitope in pathogene Gene könnte verwendet werden, um das Immunsystem des Patienten so zu programmieren, dass es eine Vielzahl von Krankheiten bekämpft (nicht beschränkt auf Krebs wie bei immunonkologischen Strategien). Eine unmittelbar relevante Anwendung dieser Technologie wäre als Krebstherapeutikum, da sie den Immunfluchtmechanismus eines Tumors untergraben könnte, indem sie eine Immunantwort auf ein relevantes Onkogen wie HER2 oder Wachstumsfaktoren wie EGFR auslöst. Ein solcher Ansatz könnte dem T-Zell-Engineering ähnlich erscheinen, aber ein neuer Fortschritt dieses Ansatzes besteht darin, dass er in vielen Zelltypen und bei Krankheiten jenseits von Krebs eingesetzt werden kann, ohne dass manipulierte T-Zellen erzeugt und in Patienten eingeführt werden müssen.
Verwendung von PE zum Einfügen eines Immunogenitätsepitops, gegen das die meisten Menschen bereits geimpft sind (Tetanus, Keuchhusten, Diphtherie, Masern, Mumps, Röteln usw.) in ein fremdes oder endogenes Gen, das eine Krankheit verursacht, damit das Immunsystem des Patienten lernt, dieses Protein zu deaktivieren.
Krankheiten, die einen potenziellen therapeutischen Nutzen aus der oben genannten Strategie haben könnten, beinhalten solche, die durch Aggregation toxischer Proteine verursacht werden, wie etwa bei tödlicher familiärer Schlaflosigkeit. Andere Krankheiten, die davon profitieren könnten, beinhalten solche, die durch eine pathogene Überexprimierung eines ansonsten ungiftigen endogenen Proteins verursacht werden, und solche, die durch fremde Pathogene verursacht werden.

Zu den primären therapeutischen Indikationen gehören die oben erwähnten, wie Therapeutika für Krebs-, Prionen- und andere neurodegenerative Erkrankungen, Infektionskrankheiten und Präventivmedizin. Sekundäre therapeutische Indikationen können die vorbeugende Behandlung von Patienten mit spät einsetzenden genetischen Erkrankungen sein. Es wird erwartet, dass die aktuellen Standardmedikamente in Verbindung mit der Erstbehandlung bei einigen Krankheiten wie besonders aggressiven Krebsarten oder in Fällen verwendet werden, in denen Medikamente zur Linderung der Krankheitssymptome beitragen, bis die Krankheit vollständig geheilt ist. Nachfolgend Beispiele für Immunepitope, die durch die hierin offenbarten Prime-Editoren in Gene eingefügt werden können:

VAKZIN	ERKRANKUNG	EPITOPE AMINOSÄURESEQUENZ	BEISPIEL NUKLEINSÄURESEQUENZ (8)
1	TETANUS TOXOID
2	DIPHTHERI A TOXIN MUTANT CRM197

3	MUMPS IMMUNOEPITOPE 1
4	MUMPS IMMUNOEPITOPE 2 MUMPS IMMUNOEPITOPE 1		SELECTED EXAMPLES FROM HEMAGGLUTININ-NEURAMINIDASE (HN) DIVERSITY AMONG OUTBREAK STRAINS (TABLE1) DIVERGENCE BETWEEN VACCINE STRAIN JL5 AND OUTBREAK STRAINS (TABLE2)
5	RUBELLA VIRUS (RV)
6	HEMAGGLUTININ
7	NEURAMINIDASE
8	TAPI (TRANSPORT ANTIGEN PRESENTATION) ON H5N1 VIRUS HEMAGGLUTININ
9	TAP2
	(TRANSPORT ANTIGEN PRESENTATION) ON H5N1 VIRUS NEURAMINIDASE
10	HEMAGGLUTININ EPITOPES TOWARD CLASS I HLA
11	NEURAMINIDASE EPITOPES TOWARD CLASS I HLA
12	HEMAGGLUTININ EPITOPES TOWARD CLASS II HLA
13	NEURAMINIDASE EPITOPES TOWARD CLASS II HLA
14	HEMAGGLUTININ EPITOPE H5N1- BOUND CLASS I AND CLASS II HLA
15	NEURAMIN IDASE EPITOPE H5N1- BOUND CLASS I AND CLASS II HLA

Es können auch zusätzliche Immunepitope eingebaut werden, die dem Fachmann bekannt sind. Jedes der Immunepitope, die von der Immune Epitope Database and Analysis Resource (iedb.org/epitopedetails_v3.php) (deren Inhalt hierin durch Bezugnahme aufgenommen wird) verfügbar sind, kann von den hierin offenbarten Prime-Editoren eingebaut werden.

In einigen Ausführungsformen können die Immunepitope, die von den hierin offenbarten Prime-Editoren eingebaut werden können, eines der folgenden Epitope beinhalten:

NR.	ERKRANKUNG	EPITOPE AMINOSÄURESEQUENZ	SEQ -ID- NR	ZUGRIFF NR.
1	TETANUS TOXOID	QYIKANSKFIGITEL	396	NA
2	DIPHTHERIA TOXIN MUTANT CRM197		428	NA
3	MUMPS	GTYRLIPNARANLTA	400	NA
4	MUMPS	PSKFFTISDSATFAPGPVSNA; PSKLFIMLDNATFAPGPVVNA	402; 404	NA
5	RUBELLA VIRUS (RV)	TPPPYQVSCGGESDRASARVIDPAAQS	406	NA
6	HEMAGGLUTININ		408	NA
7	NEURAMINIDASE		410	NA

8	TAP (TRANSPORT ANTIGEN PRESENTATION) ON H5N1 VIRUS HEMAGGLUTININ		412	NA
9	TAP (TRANSPORT ANTIGEN PRESENTATION) ON H5N1 VIRUS NEURAMINIDASE		414	NA
10	HEMAGGLUTININ EPITOPES TOWARD CLASS I HLA		416	NA
11	NEURAMINIDASE EPITOPES TOWARD CLASS I HLA		418	NA
12	HEMAGGLUTININ EPITOPES TOWARD CLASS II HLA	MVSLVKSDQIGTSTLNQR	420	NA
13	NEURAMINIDASE EPITOPES TOWARD CLASS II HLA	YNGIITDTI	422	NA
14	HEMAGGLUTININ EPITOPE HSN1- BOUND CLASS I AND CLASS II HLA		424	NA
15	NEURAMINIDASE EPITOPE H5N1- BOUND CLASS I AND CLASS II HLA		426	NA
16	CORYNEBACTERIUM DIPHTHERIAE	AACAGNRVRRSVGSSLKC	899	SRC280292
17	MEASLES VIRUS STRAIN EDMONSTON	AADHCPVVEVNGVTI	900	P69353.1
18	MEASLES VIRUS STRAIN EDMONSTON	AAHLPTGTPLD1D	901	P04851.1
19	BORDETELLA PERTUSSIS	AALAVWAGLAVQ	902	Q00879.1
20	MEASLES VIRUS STRAIN EDMONSTON	AALGVATAAQITAGI	903	P69353.1
21	RUBELLA VIRUS STRAIN THERIEN	AALLNTPPPYQVSCGGESDRATAR	904	P07566.1
22	RUBELLA VIRUS	AAQSFTGVVYGTHTT	905	BAA28178.1
23	RUBELLA VIRUS	ACEVEPAFGHSDAAC	906	BAA28178.1
24	RUBELLA VIRUS	ACTFWAVNAYSSGGY	907	BAA28178.1
25	RUBELLA VIRUS	ADDPLLR	908	BAA19893.1
26	RUBELLA VIRUS	ADDPLLRT	909	CAJ88851.1
27	MEASLES VIRUS STRAIN EDMONSTON	AEMICDIDTYIVEAG	910	P04851.1
28	MEASLES VIRUS STRAIN EDMONSTON	AEMICDIDTYIVEAGLASFI	911	P04851.1
29	MEASLES VIRUS STRAIN EDMONSTON	AEPLLSC	912	P04851.1
30	BORDETELLA PERTUSSIS	AFVSTSSSRRYTEVY	913	CAD44970.1
31	BORDETELLA PERTUSSIS		914	P04979.1
32	RUBELLA VIRUS	AGLLACCAKCLYYLR	915	BAA28178.1
33	RUBELLA VIRUS	AHTTSDPWHPPG	916	BAA19893.1
34	MEASLES VIRUS STRAIN EDMONSTON	AIAKLEDAKELLESS	917	P69353.1
35	MEASLES VIRUS STRAIN EDMONSTON	AIDNLRASLETTNQA	918	P69353.1
36	BORDETELLA PERTUSSIS	AKGVEFR	919	AC116088.1
37	MEASLES VIRUS STRAIN EDMONSTON	AKWAVPTTRTDDKLR	920	P08362.1
38	MEASLES VIRUS STRAIN EDMONSTON	ALAEVLKKPV	921	ABO69699.1
39	MEASLES VIRUS STRAIN EDMONSTON	ALGVINTLEWIPRFK	922	P08362.1
40	MEASLES VIRUS STRAIN EDMONSTON	ALHQSMLNSQAIDNL	923	P69353.1
41	MEASLES VIRUS STRAIN EDMONSTON	ALIGILSLFV	924	ABI54110.1
42	RUBELLA VIRUS	ALLNTPPPYQVSCGGESDRA	925	CAJ88851.1
43	RUBELLA VIRUS STRAIN M33	ALLNTPPPYQVSCGGESDRASARV	926	CAJ88851.1
44	RUBELLA VIRUS	ALVEGLAPGGGNCHL	927	BAA28178.1
45	BORDETELLA PERTUSSIS	AMAAWSERAGEA	928	P04977.1
46	MEASLES VIRUS STRAIN EDMONSTON	ANCASILCKCYTTGT	929	P69353.1
47	BORDETELLA PERTUSSIS	ANPNPYTSRRSV	930	P04977.1
48	RUBELLA VIRUS	APGPGEVW	931	CAJ88851.1
49	RUBELLA VIRUS	APLPPHTTERIETRSARHPWRIR	932	ABD64214.1
50	RUBELLA VIRUS VACCINE STRAIN RA27/3	APPMPPQPPRAHGQHYGHHHHQLPFLG	933	CAA33016.1
51	RUBELLA VIRUS STRAIN THERIEN	APPTLPQPPCAHGQHYGHHHHQLPFLG	934	P07566.1
52	RUBELLA VIRUS	APPTLPQPPRAHGQHYGHHHHQLPFLG	935	ABD64214.1
53	BORDETELLA PERTUSSIS	APQPGPQPPQPPQPQPEAPAPQ	936	P14283.3
54	RUBELLA VIRUS	AQLASYFNPGGSYYK	937	BAA28178.1
55	MEASLES VIRUS STRAIN EDMONSTON	ARAAHLPTGTPLD	938	P04851.1
56	MEASLES VIRUS STRAIN EDMONSTON	ARLVSEIAMHTTEDK	939	P04851.1
57	MEASLES VIRUS STRAIN EDMONSTON	ARLVSEIAMHTTEDKISRAV	940	P04851.1
58	MEASLES VIRUS STRAIN EDMONSTON-B	ASDVETAEGGEIHELLR	941	P03422.1
59	MEASLES MORBILLIVIRUS	ASDVETAEGGEIHELLRLQ	942	AB069699.1
60	MEASLES VIRUS STRAIN EDMONSTON-B	ASDVETAEGGEIHELLRLQSR	943	P03422.1
61	MEASLES MORBILLIVIRUS	ASDVETAEGGEIHKLLRLQ	944	AAA63285.1
62	RUBELLA VIRUS STRAIN M33	ASDVLPGHWLQG	945	NP_740663.1
63	MEASLES VIRUS STRAIN EDMONSTON	ASELGITAEDARLVS	946	P04851.1
64	MEASLES VIRUS STRAIN EDMONSTON	ASELGITAEDARLVSEIAMH	947	P04851.1
65	MEASLES VIRUS STRAIN EDMONSTON	ASESSQDPQDSRR	948	P04851.1
66	MEASLES VIRUS STRAIN EDMONSTON	ASILCKCYTTGTIIN	949	P69353.1
67	RUBELLA VIRUS	ASPVCQRHSPDCSRL	950	BAA28178.1
68	BORDETELLA PERTUSSIS	ASQARWTGATRA	951	BAF35031.1
69	RUBELLA VIRUS STRAIN THERIEN	ASYFNPGGSYYKQYHPTACEVEPAFGHS	952	P07566.1
70	MEASLES VIRUS STRAIN EDMONSTON	ASYKVMTRSSHQSLV	953	P69353.1
71	BORDETELLA PERTUSSIS	ASYVKKPKEDVD	954	ACI16088.1
72	MEASLES VIRUS STRAIN EDMONSTON	ATAAQITAGIALHQS	955	P69353.1
73	RUBELLA VIRUS	ATPERPRL	956	CAJ88851.1
74	MEASLES VIRUS STRAIN EDMONSTON	AVCLGGLIGIPALIC	957	P69353.1
75	MEASLES VIRUS STRAIN EDMONSTON	AVGPRQAQVSF	958	P04851.1
76	RUBELLA VIRUS	AVNAYSSGGYAQLAS	959	BAA28178.1
77	RUBELLA VIRUS	AVSETRQTWAEWAAA	960	BAA28178.1
78	MEASLES VIRUS STRAIN EDMONSTON	AVTAPDTAADSELRR	961	P04851.1
79	MEASLES VIRUS STRAIN EDMONSTON	AVTAPDTAADSELRRWIKYT	962	P04851.1
80	BORDETELLA PERTUSSIS	AYGGIIKDAPPGAGFIYRETFC	963	P04979.1
81	RUBELLA VIRUS	CALPLAGLLACCAKC	964	BAA28178.1
82	RUBELLA VIRUS	CARIWNGTQRACTFW	965	BAA28178.1
83	MEASLES VIRUS STRAIN EDMONSTON	CARTLVSGSFGNRFI	966	P69353.1
84	BORDETELLA PERTUSSIS	CASPYEGRYRDMYDALRBRLLY	967	SRC280066
85	BORDETELLA PERTUSSIS	CAVFVRSGQPVIGA	968	AAA83981.1
86	RUBELLA VIRUS	CCAKCLYYLRGAIAPR	969	BAA28178.1
87	MEASLES VIRUS STRAIN EDMONSTON	CCRGRCNKKGEQVGM	970	P69353.1
88	RUBELLA VIRUS	CEIPTDVSCEGLGAW	971	BAA28178.1
89	BORDETELLA PERTUSSIS	CFGKDLKRPGSSPMEV	972	P0A3R5.1
90	MEASLES MORBILLIVIRUS	CFQQACKGK1QALCE	973	P06830.1
91	MEASLES MORBILLIVIRUS		974	AAR89413.1
92	RUBELLA VIRUS	CGGESDRASARVIDP	975	BAA28178.1
93	BORDETELLA PERTUSSIS	CITTIYKTGQPAADHYYSKVTA	976	P04979.1
94	MEASLES MORBILLIVIRUS	CKGKIQALCENPEWA	977	AAR89413.1
95	MEASLES VIRUS STRAIN EDMONSTON	CKPWQESRKNKAQ	978	P04851.1
96	MEASLES VIRUS STRAIN EDMONSTON	CNKKGEQVGMSRPGL	979	P69353.1
97	RUBELLA VIRUS	CNVTTEHPFCNTPHG	980	BAA28178.1
98	BORDETELLA PERTUSSIS	CQVGSSNSAF	981	P04977.1
99	MEASLES MORBILLIVIRUS	CSGPTTIRGQFS	982	P08362.1
100	BORDETELLA PERTUSSIS	CTSPYDGKYWSMYSRL	983	AAA83981.1
101	MEASLES VIRUS STRAIN EDMONSTON	CVLADSESGGHITHS	984	P08362.1
102	MEASLES MORBILLIVIRUS	CYTTGTIINQDPDKILTYIAADHC	985	AAF02706.1
103	RUBELLA VIRUS	DADDPLLR	986	CAJ88851.1
104	MEASLES VIRUS STRAIN EDMONSTON	DARAAHLPTGTPLDI	987	P04851.1
105	MEASLES VIRUS STRAIN EDMONSTON	DARAAHLPTGTPLDIDTASE	988	P04851.1
106	MEASLES VIRUS STRAIN EDMONSTON	DCHAPTYLPAEVDGD	989	P08362.1
107	RUBELLA VIRUS	DCSRLVGATPERPRL	990	BAA28178.1
108	MEASLES VIRUS STRAIN EDMONSTON	DDKLRMETCFQQACK	991	P08362.1
109	RUBELLA VIRUS	DDPLLRTA	992	CAJ88851.1
110	RUBELLA VIRUS	DDPLLRTAPGPGEVW	993	BAA28178.1
111	BORDETELLA PERTUSSIS	DDPPATVYRYD	994	P04977.1
112	BORDETELLA PERTUSSIS	DDPPATVYRYDSRPPED	995	CAD44970.1
113	BORDETELLA PERTUSSIS	DDPPATVYRYDSRPPEDV	996	ACI04548.1
114	MEASLES MORBILLIVIRUS	DEVGLRTPQRFTDLV	997	P06830.1
115	MEASLES VIRUS STRAIN EDMONSTON	DHCPVVEVNGVTIQV	998	P69353.1
116	MEASLES VIRUS STRAIN EDMONSTON	DIDTASESSQDPQ	999	P04851.1
117	MEASLES VIRUS STRAIN EDMONSTON	DINKVLEKLGYSGGD	1000	P69353.1
118	BORDETELLA PERTUSSIS	DLIAYKQ	1001	ACI16088.1
119	MEASLES VIRUS STRAIN EDMONSTON	DLIGQKLGLKLLRYY	1002	P69353.1
120	RUBELLA VIRUS	DLQKALEAQSRALRAELAA	1003	P07566.1
121	MEASLES MORBILLIVIRUS	DLQYVLATYDTSRVE	1004	P06830.1
122	MEASLES VIRUS STRAIN EDMONSTON	DLSLRRFMV	1005	P04851.1
123	MEASLES VIRUS STRAIN EDMONSTON	DLSNCMVALGELKLA	1006	P08362.1
124	RUBELLA VIRUS	DLVEYIMNYTGNQQSRWGLGSPNC	1007	CAJ88851.1
125	MEASLES MORBILLIVIRUS	DLVKFISDKIKFLNP	1008	AAR89413.1
126	MEASLES MORBILLIVIRUS	DLVKFISTKIKFLNP	1009	SRC280117
127	MEASLES VIRUS STRAIN EDMONSTON	DLYKSNHNNV	1010	P08362.1
128	BORDETELLA PERTUSSIS	DNVLDHLTGR	1011	ACI04548.1
129	BORDETELLA PERTUSSIS	DNVLDHLTGRSC	1012	P04977.1
130	BORDETELLA PERTUSSIS	DNVLDHLTGRSCQ	1013	P04977.1
131	MEASLES MORBILLIVIRUS	DPDKILTYIAA	1014	AAF02706.1
132	RUBELLA VIRUS STRAIN THERIEN	DPGDLVEYIMNYTGNQQSR	1015	P07566.1
133	RUBELLA VIRUS	DPLLRTAP	1016	CAJ88851.1
134	RUBELLA VIRUS	DPLLRTAPGPGEVWVTPVIGSQ	1017	CAJ88851.1
135	MEASLES VIRUS STRAIN EDMONSTON	DPQDSRRSAEPLL	1018	P04851.1
136	MEASLES VIRUS STRAIN EDMONSTON	DPVIDRLYLSSHRGV	1019	P08362.1
137	MEASLES VIRUS STRAIN EDMONSTON	DQILRSMKGLSSTSI	1020	P69353.1
138	MEASLES MORBILLIVIRUS	DQYCADVAAEELMNA	1021	P06830.1
139	MEASLES VIRUS STRAIN EDMONSTON	DSESGGHITH	1022	P08362.1
140	MEASLES VIRUS STRAIN EDMONSTON	DTASESSQDPQDS	1023	P04851.1
141	RUBELLA VIRUS	DTVMSVFALASYVQH	1024	BAA28178.1
142	BORDETELLA PERTUSSIS	DVFQNGFTAWGNND	1025	P04977.1
143	RUBELLA VIRUS	DVGAVPPGKFVTAAL	1026	BAA28178.1
144	CORYNEBACTERIUM DIPHTHERIAE	DVNKSKTHISVNGRKI	1027	CAE11230.1
145	RUBELLA VIRUS	DVSCEGLGAWVPAAP	1028	BAA28178.1
146	RUBELLA VIRUS STRAIN THERIEN	DWASPVCQRHSPDCSRLVGATPERPRL	1029	P07566.1
147	MEASLES VIRUS STRAIN EDMONSTON	EARESYRETGPSR	1030	P04851.1
148	BORDETELLA PERTUSSIS	EAVEAERAGRGTG	1031	ACI04548.1
149	MEASLES VIRUS STRAIN EDMONSTON	EDAKELLESSDQILR	1032	P69353.1
150	MEASLES VIRUS STRAIN EDMONSTON	EDRRVKQSRGEAR	1033	P04851.1
151	MEASLES VIRUS STRAIN EDMONSTON	EDSITIPYQGSGKGV	1034	P08362.1
152	RUBELLA VIRUS	EEAFTYLCTAPGCAT	1035	BAA28178.1
153	MEASLES VIRUS STRAIN EDMONSTON	EGFNMILGTILAQIW	1036	P04851.1
154	MEASLES VIRUS STRAIN EDMONSTON	EGFNMILGTILAQIWVLLAK	1037	P04851.1
155	RUBELLA VIRUS	EHPFCNTPHGQLEVQ	1038	BAA28178.1
156	MEASLES VIRUS STRAIN EDMONSTON	EISDIEVQDPEGFNM	1039	P04851.1
157	MEASLES VIRUS STRAIN EDMONSTON	EISDIEVQDPEGFNMILGTI	1040	P04851.1
158	MEASLES VIRUS STRAIN EDMONSTON	EKPNLSSKRSE	1041	P08362.1
159	MEASLES VIRUS STRAIN EDMONSTON	ELKLAALCHGEDSIT	1042	P08362.1
160	MEASLES MORBILLIVIRUS	ELMNALVNSTLLETR	1043	P06830.1
161	MEASLES VIRUS STRAIN EDMONSTON	ELPRL	1044	P04851.1
162	MEASLES MORBILLIVIRUS	ENPEWAPLKDNRIPSYGVLSVDL	1045	AAR89413.1
163	MEASLES VIRUS STRAIN EDMONSTON	EPIRDALNAMTQNIR	1046	P69353.1
164	MEASLES VIRUS STRAIN EDMONSTON	EQVGMSRPGLKPDLT	1047	P69353.1
165	RUBELLA VIRUS	ERPRLRLV	1048	CAJ88851.1
166	RUBELLA VIRUS	ERPRLRLVDADDPLL	1049	BAA28178.1
167	MEASLES VIRUS CAM/RB	ESPGQLIQRITDDPDVS	1050	P04851.1
168	MEASLES VIRUS STRAIN EDMONSTON	ESRGIKARITHVDTE	1051	P69353.1
169	MEASLES VIRUS STRAIN EDMONSTON	ESSCTFMPEGTVCSQ	1052	P69353.1
170	MEASLES VIRUS STRAIN EDMONSTON	ESSQDPQDSRRSA	1053	P04851.1
171	MEASLES VIRUS STRAIN EDMONSTON	ETRTTNQFLAVSKGN	1054	P08362.1
172	MEASLES VIRUS STRAIN EDMONSTON	EVDGDVKLSSNLVIL	1055	P08362.1
173	MEASLES VIRUS STRAIN EDMONSTON-B	EVNGVTIQV	1056	P26031.1
174	RUBELLA VIRUS	EVWVTPVI	1057	CAJ88851.1
175	RUBELLA VIRUS	EVWVTPVIGSQA	1058	BAA19893.1
176	RUBELLA VIRUS	EWAAAHWWQLTLGAT	1059	BAA28178.1
177	MEASLES MORBILLIVIRUS	EWIPRFKVSPYLFTV	1060	P06830.1
178	BORDETELLA PERTUSSIS	FEYVDTYGDNAG	1061	P04977.1
179	MEASLES MORBILLIVIRUS	FGPLITHGSGMDLYK	1062	P06830.1
180	MEASLES VIRUS STRAIN EDMONSTON	FIFDALAEV	1063	ABK40531.1
181	MEASLES VIRUS STRAIN EDMONSTON	FISDKIKFL	1064	P08362.1
182	MEASLES VIRUS STRAIN EDMONSTON	FKRNKDKPPITSGSG	1065	P04851.1
183	MEASLES VIRUS STRAIN EDMONSTON	FKRNKDKPPITSGSGGAIRG	1066	P04851.1
184	RUBELLA VIRUS	FKTVRPVALPRTLAP	1067	BAA28178.1
185	MEASLES VIRUS STRAIN EDMONSTON	FLMDRHIIV	1068	ABK40531.1
186	MEASLES VIRUS STRAIN EDMONSTON	FMAVLLTLQTPTGQI	1069	P69353.1
187	MEASLES VIRUS STRAIN EDMONSTON	FMPEGTVCSQNALYP	1070	P69353.1
188	MEASLES MORBILLIVIRUS	FMYMSLLGV	1071	AAN09804.1
189	MEASLES VIRUS STRAIN EDMONSTON	FNVPIKEAGEDCHAP	1072	P08362.1
190	MEASLES MORBILLIVIRUS	FRDLTWCINPPERIK	1073	AAC35876.2
191	MEASLES VIRUS STRAIN EDMONSTON	FSHDDPISSDQSRFG	1074	P04851.1
192	MEASLES VIRUS STRAIN EDMONSTON	FSHDDPISSDQSRFGWFENK	1075	P04851.1
193	MEASLES MORBILLIVIRUS	FTDLVKFISDKIKFL	1076	P06830.1
194	MEASLES MORBILLIVIRUS	FTWDQKLWCRHFCVL	1077	P06830.1
195	BORDETELLA PERTUSSIS		1078	SRC280066
196	BORDETELLA PERTUSSIS		1079	SRC280066
197	MEASLES MORBILLIVIRUS	FYKDNPHPKGSRIVI	1080	P06830.1
198	BORDETELLA PERTUSSIS	GAASSYFEYVDTYG	1081	ACI04548.1
199	BORDETELLA PERTUSSIS	GAFDLKTTFCIMTTRNTGQPA	1082	AAA83981.1
200	MEASLES VIRUS STRAIN EDMONSTON	GALIGILSLFVESPG	1083	P04851.1
201	MEASLES VIRUS STRAIN EDMONSTON	GALIGILSLFVESPGQLIQR	1084	P04851.1
202	RUBELLA VIRUS	GATPERPR	1085	CAJ88851.1
203	BORDETELLA PERTUSSIS	GAYGRCPNGTRALTVAELRGNAEL	1086	P04979.1
204	RUBELLA VIRUS	GCFAPWDLEATGACI	1087	BAA28178.1
205	MEASLES MORBILLIVIRUS	GDINKVLEKLGYS	1088	BAB60865.1
206	MEASLES MORBILLIVIRUS	GDINKVLEKLGYSGGDLLG	1089	AAL29688.1
207	RUBELLA VIRUS	GDLRAVHHRPVPA	1090	CAA28880.1
208	RUBELLA VIRUS	GDLVEYIMNYTGNQQ	1091	BAA28178.1
209	MEASLES VIRUS STRAIN EDMONSTON	GDSSITTRSRLLDRL	1092	P04851.1
210	MEASLES VIRUS STRAIN EDMONSTON	GDSSITTRSRLLDRLVRLIG	1093	P04851.1
211	MEASLES MORBILLIVIRUS	GEDCHAPTYLPAEVD	1094	P06830.1
212	MEASLES VIRUS STRAIN EDMONSTON	GELSTLESLMNLYQQ	1095	P04851.1
213	MEASLES VIRUS STRAIN EDMONSTON	GELSTLESLMNLYQQMGKPA	1096	P04851.1
214	MUMPS RUBULAVIRUS	GEQARYLALLEA	1097	P21186.1
215	RUBELLA VIRUS	GEVWVT	1098	BAA19893.1
216	RUBELLA VIRUS	GEVWVTPV	1099	CAJ88851.1
217	RUBELLA VIRUS	GEVWVTPVIGSQAR	1100	BAA19893.1
218	BORDETELLA PERTUSSIS	GEYGGVIKDGTPGGA	1101	AAA83981.1
219	RUBELLA VIRUS	GFLSGVGPMRLRHGADT	1102	SRC265968
220	MEASLES VIRUS STRAIN EDMONSTON-B	GFRASDVETAEGGEIHELLRLQ	1103	P03422.1
221	BORDETELLA PERTUSSIS	GGAVPGGAVPGGAVPGGFGPGGFGP	1104	P14283.3
222	BORDETELLA PERTUSSIS	GGAVPGGAVPGGFGPGGFGPGGFGP	1105	CAA09475.1
223	BORDETELLA PERTUSSIS		1106	CAA09474.1
224	MEASLES MORBILLIVIRUS	GGHITHSGMVGMGVS	1107	P06830.1
225	MEASLES MORBILLIVIRUS	GILESRGIKARITHVDTESY	1108	P26032.1
226	BORDETELLA PERTUSSIS	GITGETTTTEYSNARYV	1109	CAD44970.1
227	MEASLES VIRUS STRAIN EDMONSTON	GKEDRRVKQSRGE	1110	P04851.1
228	BORDETELLA PERTUSSIS	GKVTNGS	1111	ACI16088.1
229	RUBELLA VIRUS	GLGAWVPAAPCARIW	1112	BAA28178.1
230	MEASLES VIRUS STRAIN EDMONSTON	GL1G1PAL1CCCRGR	1113	P69353.1
231	RUBELLA VIRUS STRAIN THERIEN	GLLACCAKCLYYLRGAIAPR	1114	P07566.1
232	MEASLES MORBILLIVIRUS	GLLAIAGIRLHRAAI	1115	P06830.1
233	RUBELLA VIRUS	GLQPRADMAAPPTLPQ	1116	NP_740663.1
234	MEASLES MORBILLIVIRUS	GMGVSCTVTREDGTNRR	1117	AAR89413.1
235	MEASLES MORBILLIVIRUS	GMYGGTYLVEKP	1118	AAR89413.1
236	BORDETELLA PERTUSSIS	GNAELQTYLRQITPGWSIYGLYDGTYLG	1119	P04979.1
237	RUBELLA VIRUS	GNCHLTVNGEDVGAV	1120	BAA28178.1
238	BORDETELLA PERTUSSIS	GNNDNVLDHLTGR	1121	P04977.1
239	BORDETELLA PERTUSSIS	GNNDNVLDHLTGRSC	1122	P04977.1
240	MEASLES VIRUS STRAIN EDMONSTON	GNRFILSQGNLIANC	1123	P69353.1
241	RUBELLA VIRUS		1124	P07566.1
242	RUBELLA VIRUS	GPGEVWVT	1125	CAJ88851.1
243	RUBELLA VIRUS STRAIN THERIEN	GPMRLRHGADTRCGRLI	1126	P07566.1
244	BORDETELLA PERTUSSIS	GPNHTKV	1127	ACI16083.1
245	MEASLES VIRUS STRAIN HALLE	GPRQAQVSF	1128	P10050.1
246	MEASLES VIRUS STRAIN EDMONSTON	GPRQAQVSFLQGDQS	1129	P04851.1
247	MEASLES VIRUS STRAIN EDMONSTON	GPRQAQVSFLQGDQSENELP	1130	P04851.1
248	MEASLES MORBILLIVIRUS	GRGYNVSSIVTMTSQ	1131	P06830.1
249	BORDETELLA PERTUSSIS	GRTPFII	1132	ACI16083.1
250	RUBELLA VIRUS	GSPNCHGPDWASPVC	1133	BAA28178.1
251	RUBELLA VIRUS	GSQARKCGLHIRAGP	1134	BAA28178.1
252	BORDETELLA PERTUSSIS	GSSNSAFVSTSSSRR	1135	P04977.1
253	MEASLES VIRUS STRAIN EDMONSTON	GSTKSCARTLVSGSF	1136	P69353.1
254	RUBELLA VIRUS	GSYYKQYHPTACEVE	1137	BAA28178.1
255	RUBELLA VIRUS	GTHTTAVSETRQTWA	1138	BAA28178.1
256	MEASLES VIRUS STRAIN EDMONSTON	GTIINQDPDKILTYI	1139	P69353.1
257	BORDETELLA PERTUSSIS	GTLVRMAPVIG	1140	ADA85124.1
258	MEASLES VIRUS STRAIN EDMONSTON	GTPLDIDTASESS	1141	P04851.1
259	BORDETELLA PERTUSSIS	GTYLGQAYGGIIKDAPPGAGFIYRETFC	1142	P04979.1
260	BORDETELLA PERTUSSIS	GVATKGLGVHAKSSDWG	1143	P15318.2
261	CORYNEBACTERIUM DIPHTHERIAE	GVLLPTIPGKLDVNKSKTHI	1144	AAV70486.1
262	MEASLES MORBILLIVIRUS	GVLSVDLSLTVELKI	1145	P06830.1
263	MEASLES MORBILLIVIRUS	GVPIELQVECFTWDQ	1146	P06830.1
264	MEASLES VIRUS STRAIN EDMONSTON	GVSCTVTREDGTNRR	1147	P08362.1
265	MEASLES VIRUS STRAIN EDMONSTON	GVSYNIGSQEWYTTV	1148	P69353.1
266	MEASLES VIRUS STRAIN EDMONSTON	GYNVSSIVTMTSQGM	1149	P08362.1
267	MEASLES MORBILLIVIRUS	HFCVLADSESGGHIT	1150	P06830.1
268	MEASLES MORBILLIVIRUS	HGEDSITIPYQGSGK	1151	P06830.1
269	RUBELLA VIRUS	HGPDWASP	1152	BAA19893.1
270	RUBELLA VIRUS	HGPDWASPVCQRHSP	1153	BAA28178.1
271	RUBELLA VIRUS	HGPDWASPVCQRHSPDCSRLVG	1154	CAJ88851.1
272	RUBELLA VIRUS STRAIN M33		1155	CAJ88851.1
273	MEASLES VIRUS STRAIN EDMONSTON	HITHSGMEGMGVSCT	1156	P08362.1
274	MEASLES MORBILLIVIRUS	HKSLSTNLDVTNSIE	1157	P06830.1
275	MEASLES VIRUS STRAIN EDMONSTON	HLMIDRPYV	1158	P08362.1
276	MEASLES VIRUS STRAIN EDMONSTON	HLPTGTPLDIDTA	1159	P04851.1
277	MEASLES VIRUS STRAIN EDMONSTON-B	HLPTGTPLDIDTATESSQDPQDSR	1160	Q77M43.1
278	MEASLES MORBILLIVIRUS	HMTNYLEQPVSNDLS	1161	P06830.1
279	MEASLES VIRUS STRAIN EDMONSTON	HQSLVIKLMPNITLL	1162	P69353.1
280	MEASLES MORBILLIVIRUS	HRAAIYTAEIHKSLS	1163	P06830.1
281	BORDETELLA PERTUSSIS	HRMQEAVEAERAGRGTGH	1164	P04977.1
282	MEASLES VIRUS STRAIN EDMONSTON	HVDTESYFIVLSIAY	1165	P69353.1
283	MEASLES VIRUS STRAIN EDMONSTON	HWGNLSKIGVVGIGS	1166	P69353.1
284	RUBELLA VIRUS	HWWQLTLGATCALPL	1167	BAA28178.1
285	RUBELLA VIRUS	HYRNASDVLPGHWLQGGWGCYNL	1168	NP_740663.1
286	MEASLES VIRUS STRAIN EDMONSTON	IDLGPPISLERLDVG	1169	P69353.1
287	MEASLES VIRUS STRAIN EDMONSTON	IEAIRQAGQEMILAV	1170	P69353.1
288	RUBELLA VIRUS STRAIN M33	IETRSARHP	1171	CAA28880.1
289	MEASLES VIRUS STRAIN EDMONSTON	IGSQEWYTTVPKYVA	1172	P69353.1
290	MEASLES VIRUS STRAIN EDMONSTON	IKGVIVHRLEGVSYN	1173	P69353.1
291	MEASLES VIRUS STRAIN EDMONSTON	IKHIIIVPIPGDSSI	1174	P04851.1
292	MEASLES VIRUS STRAIN EDMONSTON	IKHIIIVPIPGDSSITTRSR	1175	P04851.1
293	BORDETELLA PERTUSSIS	IKLKDCP	1176	ACI16083.1
294	MEASLES VIRUS STRAIN EDMONSTON	IKLMPNITLLNNCTR	1177	P69353.1
295	MEASLES MORBILLIVIRUS	ILLERLDVGT	1178	AAF85664.1
296	MEASLES MORBILLIVIRUS	ILPGQDLQYV	1179	P08362.1
297	MEASLES VIRUS STRAIN EDMONSTON	ILTYIAADHCPVVEV	1180	P69353.1
298	MEASLES MORBILLIVIRUS	INQDPDKILTY	1181	AAL29688.1
299	MEASLES VIRUS STRAIN EDMONSTON	IPRFKVSPYLFNVPI	1182	P08362.1
300	MEASLES VIRUS STRAIN EDMONSTON	IQALSYALGGDINKV	1183	P69353.1
301	RUBELLA VIRUS	IRAGPYGHATVEMPE	1184	BAA28178.1
302	BORDETELLA PERTUSSIS	IRMGTDK	1185	ACI16088.1
303	MEASLES VIRUS STRAIN EDMONSTON	ISNFDESSCTFMPEG	1186	P69353.1
304	MEASLES VIRUS STRAIN EDMONSTON	ITAGIALHQSMLNSQ	1187	P69353.1
305	MEASLES VIRUS STRAIN EDMONSTON	ITDDPDVSIRLLEVV	1188	P04851.1
306	MEASLES VIRUS STRAIN EDMONSTON	ITDDPDVSIRLLEVVQSDQS	1189	P04851.1
307	BORDETELLA PERTUSSIS	ITTYV	1190	ACI16083.1
308	MEASLES VIRUS STRAIN EDMONSTON	IVEAGLASFILTIKF	1191	P04851.1
309	MEASLES VIRUS STRAIN EDMONSTON	IVEAGLASFILTIKFGIETM	1192	P04851.1
310	MEASLES VIRUS STRAIN EDMONSTON	IVEAGLASFILTIKFGIETMYPALG	1193	P04851.1
311	RUBELLA VIRUS	KALEAQSRALRAELAA	1194	P07566.1
312	MEASLES VIRUS STRAIN EDMONSTON	KARITHVDTESYFIV	1195	P69353.1
313	RUBELLA VIRUS	KCGLHIRAGPYGHAT	1196	BAA28178.1
314	MEASLES VIRUS STRAIN EDMONSTON	KCYTTGTIINQDPDK	1197	P69353.1
315	MEASLES VIRUS STRAIN EDMONSTON	KDNPHPKGSR	1198	P08362.1
316	MEASLES VIRUS STRAIN EDMONSTON	KDNRIPSYGVLSVDL	1199	P08362.1
317	MEASLES MORBILLIVIRUS	KFLNPDREYDFRDLT	1200	AAC35876.2
318	RUBELLA VIRUS	KFVTAALLN	1201	BAA28178.1
319	MEASLES VIRUS STRAIN EDMONSTON	KGNCSGPTTIR	1202	P08362.1
320	MEASLES MORBILLIVIRUS	KIKFLNPDREYDFRD	1203	P06830.1
321	RUBELLA VIRUS	KIVDGGCFAPWDLEA	1204	BAA28178.1
322	MEASLES VIRUS STRAIN EDMONSTON	KLGLKLLRYYTEILS	1205	P69353.1
323	MEASLES VIRUS STRAIN EDMONSTON	KLGVWKSPTDMQSWV	1206	P08362.1
324	BORDETELLA PERTUSSIS	KLKECPQ	1207	ACI16088.1
325	MEASLES MORBILLIVIRUS	KLLRYYTEI	1208	P26031.1
326	MEASLES VIRUS STRAIN EDMONSTON	KLMPFSGDFV	1209	ABK40531.1
327	MEASLES MORBILLIVIRUS	KLMPNITLL	1210	P26031.1
328	MEASLES MORBILLIVIRUS	KLRMETCFQQACKGKIQALCENPEWA	1211	AAR89413.1
329	MEASLES MORBILLIVIRUS	KLWCRHFCV	1212	P08362.1
330	MEASLES VIRUS STRAIN EDMONSTON	KLWCRHFCVL	1213	P08362.1
331	MEASLES MORBILLIVIRUS	KLWESPQEI	1214	BAB60863.1
332	MEASLES VIRUS STRAIN EDMONSTON	KMSSAVGFV	1215	ABO69699.1
333	MEASLES VIRUS STRAIN EDMONSTON-B	KMSSAVGFVPDTGPASR	1216	P03422.1
334	BORDETELLA PERTUSSIS	KMVYATN	1217	ACI16083.1
335	MEASLES VIRUS STRAIN EDMONSTON	KPDLTGTSKSYVRSL	1218	P69353.1
336	MEASLES MORBILLIVIRUS	KPNLSSKRSELSQLS	1219	P08362.1
337	MEASLES VIRUS STRAIN EDMONSTON	KPNLSSKRSELSQLSMYRVF	1220	P08362.1
338	MEASLES VIRUS STRAIN EDMONSTON	KQSRGEARESYRETG	1221	P04851.1
339	MEASLES VIRUS STRAIN EDMONSTON	KQSRGEARESYRETGPSRAS	1222	P04851.1
340	MEASLES VIRUS STRAIN EDMONSTON	KRFAGVVLAGAALGV	1223	P69353.1
341	MEASLES VIRUS STRAIN EDMONSTON	KRTPGNKPRIAEMIC	1224	P04851.1
342	MEASLES VIRUS STRAIN EDMONSTON	KRTPGNKPRIAEMICDIDTY	1225	P04851.1
343	MEASLES MORBILLIVIRUS	KSNHNNVYWLTIPPMKNLALGVINTL	1226	AAR89413.1
344	MEASLES MORBILLIVIRUS	KVSPYLFNV	1227	P08362.1
345	BORDETELLA PERTUSSIS	KVVQLPKISKNALKANG	1228	ACI16083.1
346	BORDETELLA PERTUSSIS	KWQLPKISKNALRNDG	1229	ACI16087.1
347	BORDETELLA PERTUSSIS	LAHRRIPPENIR	1230	P04977.1
348	BORDETELLA PERTUSSIS	LALALWAGFALS	1231	P11092.1
349	RUBELLA VIRUS	LAPGGGNCHLTVNGE	1232	BAA28178.1
350	MEASLES VIRUS STRAIN EDMONSTON	LAQIWVLLAKAVTAP	1233	P04851.1
351	MEASLES VIRUS STRAIN EDMONSTON	LAQIWVLLAKAVTAPDTAAD	1234	P04851.1
352	RUBELLA VIRUS		1235	BAA19893.1
353	MEASLES MORBILLIVIRUS	LAVSKGNCSGPTTIR	1236	P06830.1
354	MEASLES VIRUS STRAIN EDMONSTON	LCENPEWAPLKDNRI	1237	P08362.1
355	MEASLES MORBILLIVIRUS	LDRLVRLIG	1238	ABI54110.1
356	CORYNEBACTERIUM DIPHTHERIAE	LEEEGVTPL	1239	P33120.2
357	BORDETELLA PERTUSSIS	LEHRMQEAVEAERAGRGTGHFI	1240	CAD44970.1
358	MEASLES VIRUS STRAIN EDMONSTON	LEKLGYSGGDLLGIL	1241	P69353.1
359	MEASLES VIRUS STRAIN EDMONSTON	LEQPVSNDLS	1242	P08362.1
360	MEASLES VIRUS STRAIN EDMONSTON	LERKWLDVVRNIIAE	1243	P04851.1
361	MEASLES VIRUS STRAIN EDMONSTON	LERKWLDVVRNIIAEDLSLR	1244	P04851.1
362	MEASLES VIRUS STRAIN EDMONSTON	LFGPSLRDPISAEIS	1245	P69353.1
363	MEASLES MORBILLIVIRUS	LGELKLAALCHGEDS	1246	P06830.1
364	MEASLES VIRUS STRAIN EDMONSTON	LGGKEDRRVKQSR	1247	P04851.1
365	RUBELLA VIRUS	LGHDGHHGGTLRVGQHHRNASDVL	1248	ABD64214.1
366	RUBELLA VIRUS STRAIN THERIEN	LGSPNCHGPDWASPVCQRHS	1249	P07566.1
367	RUBELLA VIRUS STRAIN THERIEN	LGSPNCHGPDWASPVCQRHSPDCSRLV	1250	P07566.1
368	RUBELLA VIRUS	LHDPDTEAPTEACVTSWL	1251	ABD64214.1
369	MEASLES VIRUS STRAIN EDMONSTON	LIANCASILCKCYTT	1252	P69353.1
370	MEASLES MORBILLIVIRUS	LIGLLAIAGIRLHRAAIYTAEIHK	1253	AAR89413.1
371	MEASLES VIRUS STRAIN EDMONSTON	LIPSMNQLSCDLIGQ	1254	P69353.1
372	MEASLES VIRUS STRAIN EDMONSTON	LKIKIASGFGPLITH	1255	P08362.1
373	MEASLES MORBILLIVIRUS	LKIKIASGFGPLITHGSGMDLYK	1256	AAR89413.1
374	BORDETELLA PERTUSSIS	LKLYFEP	1257	ACI16088.1
375	MEASLES VIRUS STRAIN EDMONSTON	LLAVLFVMFL	1258	P08362.1
376	MEASLES VIRUS STRAIN EDMONSTON	LLDRLVRLIGNPDVS	1259	P04851.1
377	MEASLES VIRUS STRAIN EDMONSTON	LLDRLVRLIGNPDVSGPKLT	1260	P04851.1
378	MEASLES VIRUS STRAIN EDMONSTON	LLESSDQILRSMKGL	1261	P69353.1
379	MEASLES MORBILLIVIRUS	LLETRTTNQFLAVSK	1262	P06830.1
380	MEASLES VIRUS STRAIN EDMONSTON	LLEWQSDQSQSGLT	1263	P04851.1
381	MEASLES VIRUS STRAIN EDMONSTON	LLEVVQSDQSQSGLTFASR	1264	P04851.1
382	MEASLES VIRUS STRAIN EDMONSTON	LLEVVQSDQSQSGLTFASRG	1265	P04851.1
383	MEASLES MORBILLIVIRUS	LLGILESRGIKARIT	1266	AAL29688.1
384	RUBELLA VIRUS	LLRTAPGP	1267	CAJ88851.1
385	MEASLES VIRUS STRAIN EDMONSTON	LLRYYTEILSLFGPS	1268	P69353.1
386	RUBELLA VIRUS STRAIN THERIEN	LLVPWVLIFMVCRRACRRRG	1269	P07566.1
387	MEASLES VIRUS STRAIN EDMONSTON	LLWRSRCKIV	1270	ABK40528.1
388	MEASLES MORBILLIVIRUS	LLWSYAMGV	1271	P04851.1
389	MEASLES VIRUS STRAIN EDMONSTON	LLWSYAMGVGVELEN	1272	P04851.1
390	MEASLES VIRUS STRAIN EDMONSTON	LLWSYAMGVGVELENSMGGL	1273	P04851.1
391	MEASLES MORBILLIVIRUS	LMIDRPYVL	1274	P08362.1
392	MEASLES VIRUS STRAIN EDMONSTON	LNAMTQNIRPVQSVA	1275	P69353.1
393	RUBELLA VIRUS	LNTPPPYQVSCGGES	1276	BAA28178.1
394	MEASLES VIRUS STRAIN EDMONSTON	LRDPISAEISIQALS	1277	P69353.1
395	BORDETELLA PERTUSSIS	LRGSGDLQEYLRHVTR	1278	AAA83981.1
396	RUBELLA VIRUS	LRLVDADD	1279	CAJ88851.1
397	RUBELLA VIRUS	LRLVDADDPLLR	1280	BAA19893.1
398	RUBELLA VIRUS		1281	BAA19893.1
399	BORDETELLA PERTUSSIS		1282	P04979.1
400	RUBELLA VIRUS	LRTAPGPG	1283	CAJ88851.1
401	RUBELLA VIRUS	LRVGQHYRNASDVLPGHWLQ	1284	NP_740663.1
402	BORDETELLA PERTUSSIS	LRYLA	1285	ACI16088.1
403	MEASLES VIRUS STRAIN EDMONSTON	LSCKPWQESRKNK	1286	P04851.1
404	MEASLES MORBILLIVIRUS	LSEIKGVIVHRLEGV	1287	AAL29688.1
405	MEASLES VIRUS STRAIN EDMONSTON	LSIAYPTLSEIKGVI	1288	P69353.1
406	MEASLES VIRUS STRAIN EDMONSTON	LSLLDLYLGRGYNVS	1289	P08362.1
407	MEASLES VIRUS STRAIN EDMONSTON	LSQGNLIANCASILC	1290	P69353.1
408	MEASLES MORBILLIVIRUS	LSSHRGVIADNQAKW	1291	P06830.1
409	MEASLES VIRUS STRAIN EDMONSTON	LSVDLSLTVELKIKI	1292	P08362.1
410	BORDETELLA PERTUSSIS	LTGISICNPGSSLC	1293	AAA83981.1
411	MEASLES VIRUS STRAIN EDMONSTON	LTIKFGIETMYPALG	1294	P04851.1
412	MEASLES VIRUS STRAIN EDMONSTON	LTIKFGIETMYPALGLHEFA	1295	P04851.1
413	MEASLES VIRUS STRAIN EDMONSTON	LTLQTPTGQIHWGNL	1296	P69353.1
414	RUBELLA VIRUS	LVDADDPL	1297	CAJ88851.1
415	RUBELLA VIRUS	LVDADDPLLR	1298	BAA19893.1
416	MEASLES VIRUS STRAIN EDMONSTON	LVEKPNLSSKRSELS	1299	P08362.1
417	RUBELLA VIRUS	LVGATPE	1300	BAA19893.1
418	RUBELLA VIRUS	LVGATPER	1301	CAJ88851.1
419	MEASLES MORBILLIVIRUS	LVKLGVWKSPTGMQS	1302	P06830.1
420	MEASLES VIRUS STRAIN EDMONSTON-B	LVSGSFGNRFILSQGNLI	1303	P26031.1
421	MEASLES VIRUS STRAIN EDMONSTON	LYKSNHNNVYWLTIP	1304	P08362.1
422	MEASLES VIRUS STRAIN EDMONSTON	LYPMSPLLQECLRGSTKSCARTLVS	1305	P69353.1
423	RUBELLA VIRUS	MASTTPITMEDLQKALEA	1306	P07566.1
424	RUBELLA VIRUS	MASTTPITMEDLQKALEAQSR	1307	ABD64200.1
425	RUBELLA VIRUS STRAIN THERIEN		1308	P07566.1
426	RUBELLA VIRUS		1309	ABD64200.1
427	RUBELLA VIRUS VACCINE STRAIN RA27/3		1310	CAA33016.1
428	MEASLES VIRUS STRAIN EDMONSTON	MATLLRSLALFKRNK	1311	P04851.1
429	MEASLES VIRUS STRAIN EDMONSTON	MATLLRSLALFKRNKDKPPI	1312	P04851.1
430	MEASLES MORBILLIVIRUS	MDLYKSNHNNVYWLT	1313	P06830.1
431	RUBELLA VIRUS	MEDLQKALEAQSRA	1314	P07566.1
432	RUBELLA VIRUS	MEDLQKALEAQSRALRAELAA	1315	P07566.1
433	MEASLES VIRUS STRAIN EDMONSTON	MGLKVNVSAIFMAVL	1316	P69353.1
434	MEASLES MORBILLIVIRUS	MIDRPYVLLAVLFVM	1317	P06830.1
435	MEASLES VIRUS STRAIN EDMONSTON	MILAVQGVQDYINNE	1318	P69353.1
436	MEASLES VIRUS STRAIN EDMONSTON	MLNSQAIDNLRASLE	1319	P69353.1
437	MEASLES VIRUS STRAIN EDMONSTON	MNALVNSTLLETRTT	1320	P08362.1
438	RUBELLA VIRUS		1321	BAA19893.1
439	MEASLES VIRUS STRAIN EDMONSTON	MQSWVPLSTDDPVID	1322	P08362.1
440	MEASLES MORBILLIVIRUS	MSLSLLDLYLGRGYN	1323	P06830.1
441	MEASLES VIRUS STRAIN EDMONSTON	MSPLLQECLRGSTKS	1324	P69353.1
442	MEASLES MORBILLIVIRUS	MSPQRDRINAFYKDN	1325	P06830.1
443	MEASLES MORBILLIVIRUS	MYRVFEVSVIRNPGL	1326	P06830.1
444	MEASLES VIRUS STRAIN EDMONSTON	NALYPMSPLLQECLR	1327	P69353.1
445	RUBELLA VIRUS STRAIN THERIEN	NCHGPDWASPVCQRHSPDCSRLVGAT	1328	P07566.1
446	MEASLES VIRUS STRAIN EDMONSTON	NFGRSYFDPAYFRLG	1329	P04851.1
447	MEASLES VIRUS STRAIN EDMONSTON	NFGRSYFDPAYFRLGQEMVR	1330	P04851.1
448	RUBELLA VIRUS	NGTQRACTFWAVNAY	1331	BAA28178.1
449	MEASLES VIRUS STRAIN EDMONSTON	NGVTIQVGSRRYPDA	1332	P69353.1
450	MEASLES VIRUS STRAIN EDMONSTON	NIIAEDLSLRRFMVA	1333	P04851.1
451	MEASLES VIRUS STRAIN EDMONSTON	NIIAEDLSLRRFMVALILDI	1334	P04851.1
452	MEASLES VIRUS STRAIN EDMONSTON	NITLLNNCTRVEIAE	1335	P69353.1
453	MEASLES MORBILLIVIRUS	NLALGVINTLEWIPR	1336	P06830.1
454	CORYNEBACTERIU M DIPHTHERIAE	NLFQVVHWSYNRPAYSPG	1337	SRC280292
455	MEASLES VIRUS STRAIN EDMONSTON	NLVILPGQDLQYVLA	1338	P08362.1
456	MEASLES VIRUS STRAIN EDMONSTON	NLYQQMGKPAPYMVN	1339	P04851.1
457	MEASLES VIRUS STRAIN EDMONSTON	NLYQQMGKPAPYMVNLENSI	1340	P04851.1
458	MEASLES VIRUS STRAIN EDMONSTON	NNCTRVEIAEYRRLL	1341	P69353.1
459	MEASLES VIRUS STRAIN EDMONSTON	NPDREYDFRD	1342	P08362.1
460	MEASLES VIRUS STRAIN HALLE	NPDVSGPKL	1343	P10050.1
461	MEASLES VIRUS STRAIN EDMONSTON	NPDVSGPKLTGALIG	1344	P04851.1
462	MEASLES VIRUS STRAIN EDMONSTON	NPDVSGPKLTGALIGILSLF	1345	P04851.1
463	MEASLES MORBILLIVIRUS	NPPERIKLDYDQYCA	1346	P06830.1
464	MEASLES MORBILLIVIRUS	NQAKWAVPTTRTDDK	1347	P06830.1
465	MEASLES MORBILLIVIRUS	NQDPDKILTYIAADH	1348	AAF02706.1
466	MEASLES VIRUS STRAIN EDMONSTON	NQLSCDLIGQKLGLK	1349	P69353.1
467	RUBELLA VIRUS	NQQSRWGLGSPNCHGPDWASPVCQRHS	1350	ABD64214.1
468	MUMPS RUBULAVIRUS	NSTLGVKSAREF	1351	ABP48111.1
469	RUBELLA VIRUS	NTPHGQLEVQVPPDP	1352	BAA28178.1
470	MEASLES VIRUS STRAIN EDMONSTON	NVSAIFMAVLLTLQT	1353	P69353.1
471	MEASLES MORBILLIVIRUS	PAEVDGDVKLSSNLV	1354	P06830.1
472	RUBELLA VIRUS	PAFGHSDAACWGFPT	1355	BAA28178.1
473	MEASLES VIRUS STRAIN EDMONSTON	PALICCCRGRCNKKG	1356	P69353.1
474	MEASLES MORBILLIVIRUS	PDKILTYIAADHC	1357	AAF02706.1
475	MEASLES VIRUS STRAIN EDMONSTON	PERIKLDYDQYCADV	1358	P08362.1
476	RUBELLA VIRUS	PERPRLRL	1359	CAJ88851.1
477	RUBELLA VIRUS	PGCATQAPVPVRLAG	1360	BAA28178.1
478	RUBELLA VIRUS VACCINE STRAIN RA27/3		1361	CAJ88851.1
479	RUBELLA VIRUS	PGEVWVTP	1362	CAJ88851.1
480	RUBELLA VIRUS	PGEVWVTPVIGSQAR	1363	BAA28178.1
481	CORYNEBACTERIUM DIPHTHERIAE	PGKLDVNKSKTHISVN	1364	CAE11230.1
482	MEASLES VIRUS STRAIN EDMONSTON	PGLGAPVFHMTNYLE	1365	P08362.1
483	RUBELLA VIRUS	PGPGEVWV	1366	CAJ88851.1
484	RUBELLA VIRUS	PHKTVRVKFHTETRT	1367	BAA28178.1
485	MEASLES MORBILLIVIRUS	PIELQVECFTWDQKL	1368	AAR89413.1
486	MEASLES VIRUS STRAIN EDMONSTON-B	PISLERLDVG	1369	P26031.1
487	MEASLES VIRUS STRAIN EDMONSTON	PISLERLDVGTNLGN	1370	P69353.1
488	BORDETELLA PERTUSSIS	PKALFTQQGGAYGRC	1371	P04979.1
489	MEASLES VIRUS STRAIN EDMONSTON	PKYVATQGYLISNFD	1372	P69353.1
490	MEASLES VIRUS STRAIN EDMONSTON	PLDIDTASESSQD	1373	P04851.1
491	RUBELLA VIRUS	PLGLKFKTVRPVALP	1374	BAA28178.1
492	MEASLES VIRUS STRAIN EDMONSTON	PLITHGSGMDLYKSN	1375	P08362.1
493	MEASLES MORBILLIVIRUS	PLKDNRIPSYGVLSV	1376	P06830.1
494	RUBELLA VIRUS	PLLRTAPG	1377	CAJ88851.1
495	MEASLES VIRUS STRAIN EDMONSTON	PLLSCKPWQESRK	1378	P04851.1
496	BORDETELLA PERTUSSIS	PPATVYRYDSRPPE	1379	P04977.1
497	MEASLES MORBILLIVIRUS	PPISLERLDVGT	1380	AAL29688.1
498	RUBELLA VIRUS	PPPPEERQETRSQTPAPKPS	1381	P07566.1
499	BORDETELLA PERTUSSIS	PQEQITQHGSPYGRC	1382	AAA83981.1
500	BORDETELLA PERTUSSIS	PQEQITQHGSPYGRCANK	1383	AAA83981.1
501	BORDETELLA PERTUSSIS	PQPGPQPPQPPQPQPEAPAPQPPAG	1384	P14283.3
502	MEASLES VIRUS STRAIN EDMONSTON	PRLGGKEDRRVKQ	1385	P04851.1
503	RUBELLA VIRUS	PRLRLVDA	1386	CAJ88851.1
504	RUBELLA VIRUS	PRNVRVTGCYQCGTP	1387	BAA28178.1
505	MEASLES VIRUS STRAIN EDMONSTON	PSRASDARAAHLP	1388	P04851.1
506	MEASLES VIRUS STRAIN EDMONSTON	PTGQIHWGNLSKIGV	1389	P69353.1
507	MEASLES VIRUS STRAIN EDMONSTON	PTGTPLDIDTASE	1390	P04851.1
508	MEASLES VIRUS STRAIN EDMONSTON	PTLSEIKGVIVHRLE	1391	P69353.1
509	MEASLES MORBILLIVIRUS	PTTIRGQFSNMSLSL	1392	P06830.1
510	MEASLES MORBILLIVIRUS	PTTRTDDKLR	1393	AAR89413.1
511	MEASLES MORBILLIVIRUS	PTTRTDDKLRMETCFQQACKG	1394	AAR89413.1
512	RUBELLA VIRUS	PVALPRTLAPPRNVR	1395	BAA28178.1
513	CORYNEBACTERIUM DIPHTHERIAE	PVFAGANYAAWAVNVAQVI	1396	AAV70486.1
514	RUBELLA VIRUS	PVTGSQAR	1397	CAJ88851.1
515	MEASLES MORBILLIVIRUS	PVVEVNGVTIQVGSR	1398	AAL29688.1
516	RUBELLA VIRUS STRAIN THERIEN	PWELV VLTARPEDGWTCRGV	1399	P07566.1
517	MEASLES VIRUS STRAIN EDMONSTON	PWQESRKNKAQTR	1400	P04851.1
518	MEASLES VIRUS STRAIN EDMONSTON	PYMVNLENSIQNKFS	1401	P04851.1
519	MEASLES VIRUS STRAIN EDMONSTON	PYMVNLENSIQNKFSAGSYP	1402	P04851.1
520	MEASLES VIRUS STRAIN EDMONSTON	PYQGSGKGVS	1403	P08362.1
521	RUBELLA VIRUS	PYQVSCGGESDRASA	1404	BAA28178.1
522	MEASLES MORBILLIVIRUS	QACKGKIQALCEN	1405	P08362.1
523	MEASLES VIRUS STRAIN EDMONSTON	QAGQEMILAVQGVQD	1406	P69353.1
524	MEASLES MORBILLIVIRUS	QALCENPECVPLKDN	1407	P06830.1
525	BORDETELLA PERTUSSIS	QALGALK	1408	ACI16088.1
526	RUBELLA VIRUS	QAPVPVRLAGVRFES	1409	BAA28178.1
527	RUBELLA VIRUS	QCGTPALVEGLAPGG	1410	BAA28178.1
528	MEASLES VIRUS STRAIN EDMONSTON	QDPDKILTYIAADHC	1411	P69353.1
529	MEASLES VIRUS STRAIN EDMONSTON	QECLRGSTKSCARTL	1412	P69353.1
530	BORDETELLA PERTUSSIS	QEQITQHGSPYGRC	1413	AAA83981.1
531	MEASLES VIRUS STRAIN EDMONSTON	QESRKNKAQTRTP	1414	P04851.1
532	MEASLES VIRUS STRAIN EDMONSTON	QGDQSENELPRLGGK	1415	P04851.1
533	MEASLES VIRUS STRAIN EDMONSTON	QGDQSENELPRLGGKEDRRV	1416	P04851.1
534	CORYNEBACTERIUM DIPHTHERIAE	QGESGHDIKITAENTPLPIA	1417	AAV70486.1
535	MEASLES MORBILLIVIRUS	QGSGKGVSFQLVKLG	1418	P06830.1
536	MEASLES VIRUS STRAIN EDMONSTON	QGVQDY1NNEL1PSM	1419	P69353.1
537	RUBELLA VIRUS	QLEVQVPPDPGDLVE	1420	BAA28178.1
538	MEASLES MORBILLIVIRUS	QLPEATFMV	1421	ABK40528.1
539	RUBELLA VIRUS	QLPFLGHDGHHGGTLRVGQHYRNAS	1422	NP_740663.1
540	MEASLES VIRUS STRAIN EDMONSTON	QLSMYRVFEV	1423	P08362.1
541	BORDETELLA PERTUSSIS	QLSNIT	1424	ACI16083.1
542	MEASLES VIRUS STRAIN EDMONSTON	QNIRPVQSVASSRRH	1425	P69353.1
543	MEASLES VIRUS STRAIN EDMONSTON	QNKFSAGSYPLLWSY	1426	P04851.1
544	MEASLES VIRUS STRAIN EDMONSTON	QNKFSAGSYPLLWSYAMGVG	1427	P04851.1
545	MEASLES VIRUS STRAIN EDMONSTON	QNKFSAGSYPLLWSYAMGVGVELEN	1428	P04851.1
546	MEASLES VIRUS STRAIN EDMONSTON	QQACKGKIQALCENP	1429	P08362.1
547	MEASLES VIRUS STRAIN EDMONSTON	QQRRVVGEFRLERKW	1430	P04851.1
548	MEASLES VIRUS STRAIN EDMONSTON	QQRRVVGEFRLERKWLDVVR	1431	P04851.1
549	BORDETELLA PERTUSSIS	QQTRANPNPYTSRRSVAS	1432	P04977.1
550	RUBELLA VIRUS	QRHSPDCSRLVGATP	1433	BAA28178.1
551	MEASLES VIRUS STRAIN EDMONSTON	QSGLTFASRGTNMED	1434	P04851.1
552	MEASLES VIRUS STRAIN EDMONSTON	QSGLTFASRGTNMEDEADQY	1435	P04851.1
553	CORYNEBACTERIUM DIPHTHERIAE	QSIALSSLMVAQAIPLVGEL	1436	AAV70486.1
554	MEASLES VIRUS STRAIN EDMONSTON	QSRFGWFENKEISDI	1437	P04851.1
555	MEASLES VIRUS STRAIN EDMONSTON	QSRFGWFENKEISDIEVQDP	1438	P04851.1
556	MEASLES VIRUS STRAIN EDMONSTON	QSRGEAR	1439	P04851.1
557	MEASLES VIRUS STRAIN EDMONSTON	QSRGEARESYRETGPSRA	1440	P04851.1
558	RUBELLA VIRUS STRAIN THERIEN	QTGRGGSAPRPELGPPTN	1441	P07566.1
559	RUBELLA VIRUS STRAIN THERIEN	QTPAPKPSRAPPQQPQPPRMQTGRG	1442	P07566.1
560	MEASLES VIRUS STRAIN EDMONSTON	QVGSRRYPDAVYLHR	1443	P69353.1
561	MEASLES VIRUS STRAIN EDMONSTON	QVSFLQGDQSENE	1444	P04851.1
562	RUBELLA VIRUS	QYHPTACEVEPAFGH	1445	BAA28178.1
563	MEASLES VIRUS STRAIN EDMONSTON	QYVLATYDTSRVEHA	1446	P08362.1
564	BORDETELLA PERTUSSIS	RANPNPYTSRRSV	1447	ACI04548.1
565	MEASLES VIRUS STRAIN EDMONSTON	RASDARAAHLPTG	1448	P04851.1
566	MEASLES VIRUS STRAIN EDMONSTON	RASLETTNQAIEAIR	1449	P69353.1
567	RUBELLA VIRUS STRAIN THERIEN	RCGRLICGLSTTAQYPPTRF	1450	P07566.1
568	BORDETELLA PERTUSSIS	RDGQSVIGACASPYEGRYR	1451	P04979.1
569	MEASLES VIRUS STRAIN EDMONSTON	RESYRETGPSRAS	1452	P04851.1
570	MEASLES VIRUS STRAIN EDMONSTON	RETGPSRASDARA	1453	P04851.1
571	MUMPS RUBULAVIRUS	RFAKYQQQGRLEAR	1454	P21186.1
572	RUBELLA VIRUS STRAIN THERIEN	RFGAPQAFLAGLLLATVAVGTARA	1455	P07566.1
573	MEASLES VIRUS STRAIN EDMONSTON	RFMVALILDIKRTPG	1456	P04851.1
574	MEASLES VIRUS STRAIN EDMONSTON	RFMVALILDIKRTPGNKPRI	1457	P04851.1
575	MEASLES VIRUS STRAIN EDMONSTON	RGEARESYRETGP	1458	P04851.1
576	RUBELLA VIRUS	RGTTPPAYG	1459	CAA28880.1
577	RUBELLA VIRUS STRAIN M33	RIETRSARH	1460	ABD64214.1
578	BORDETELLA PERTUSSIS	RILAGALATYQ	1461	P04977.1
579	BORDETELLA PERTUSSIS	RIPPENIRRVT	1462	ACI04548.1
580	BORDETELLA PERTUSSIS	RISNLND	1463	ACI16083.1
581	BORDETELLA PERTUSSIS	RLANLNG	1464	ACI16088.1
582	MEASLES VIRUS STRAIN EDMONSTON	RLDVGTNLGNAIAKL	1465	P69353.1
583	MEASLES VIRUS STRAIN EDMONSTON	RLERKWLDV	1466	P04851.1
584	MEASLES VIRUS STRAIN EDMONSTON	RLGGKEDRRVKQSRG	1467	P04851.1
585	MEASLES VIRUS STRAIN EDMONSTON	RLGGKEDRRVKQSRGEARES	1468	P04851.1
586	MEASLES VIRUS STRAIN EDMONSTON	RLLDRLVRL	1469	ABI54110.1
587	RUBELLA VIRUS	RLRLVDAD	1470	CAJ88851.1
588	RUBELLA VIRUS	RLRLVDADDPLLR	1471	BAA19893.1
589	RUBELLA VIRUS		1472	BAA19893.1
590	RUBELLA VIRUS		1473	SRC265968
591	MEASLES VIRUS STRAIN EDMONSTON	RLSDNGYYTV	1474	ABK40528.1
592	RUBELLA VIRUS	RLVDADDP	1475	CAJ88851.1
593	RUBELLA VIRUS	RLVDADDPLLRTAPG	1476	BAA28178.1
594	RUBELLA VIRUS	RLVGATPE	1477	CAJ88851.1
595	RUBELLA VIRUS	RMQTGRGGSAPRPELGPPTNPFQAAVA	1478	ABD64216.1
596	MEASLES MORBILLIVIRUS	RMSKGVFKV	1479	ABY21184.1
597	MEASLES MORBILLIVIRUS	RNPGLGAPVFHMTNY	1480	P06830.1
598	RUBELLA VIRUS	RPRLRLVD	1481	CAJ88851.1
599	BORDETELLA PERTUSSIS	RQAESSEAMAAWSERAGEA	1482	P04977.1
600	RUBELLA VIRUS	RQTWAEWAAAHWWQL	1483	BAA28178.1
601	MEASLES VIRUS STRAIN EDMONSTON	RRVKQSRGEARES	1484	P04851.1
602	MEASLES MORBILLIVIRUS	RRYPDAVYL	1485	ACA09725.1
603	MEASLES VIRUS STRAIN EDMONSTON	RRYPDAVYLHRIDLG	1486	P69353.1
604	MEASLES VIRUS STRAIN EDMONSTON	RSAGKVSSTLASELG	1487	P04851.1
605	MEASLES VIRUS STRAIN EDMONSTON	RSAGKVSSTLASELGITAED	1488	P04851.1
606	MEASLES VIRUS STRAIN EDMONSTON	RSELSQLS	1489	P08362.1
607	MEASLES VIRUS STRAIN EDMONSTON	RSELSQLSMYRVFEV	1490	P08362.1
608	RUBELLA VIRUS	RSQTPAPKPSRAPPQQPQPPRMQT	1491	ABD64214.1
609	RUBELLA VIRUS	RTAPGPGE	1492	CAJ88851.1
610	RUBELLA VIRUS	RTAPGPGEVWVTPVI	1493	BAA28178.1
611	MEASLES MORBILLIVIRUS	RTDDKLRMETCFQQA	1494	P06830.1
612	RUBELLA VIRUS	RTLAPPRNVRVTGCY	1495	BAA28178.1
613	MEASLES VIRUS STRAIN EDMONSTON	RTVLEPIRDALNAMT	1496	P69353.1
614	MEASLES VIRUS STRAIN EDMONSTON	RVEHAVVYYVYSPSR	1497	P08362.1
615	MEASLES VIRUS STRAIN EDMONSTON	RVFEVGVIRNPGLGA	1498	P08362.1
616	BORDETELLA PERTUSSIS	RVHVSKEEQYYDYEDATFE	1499	P04978.2
617	RUBELLA VIRUS	RVIDPAAQ	1500	BAA28178.1
618	RUBELLA VIRUS	RVKFHTETRTVWQLS	1501	BAA28178.1
619	BORDETELLA PERTUSSIS	RVYHNGITGET	1502	ACI04548.1
620	BORDETELLA PERTUSSIS	RYDSRPPEDVF	1503	ACI04548.1
621	MEASLES VIRUS STRAIN EDMONSTON	RYPDAVYLHRIDLGP	1504	P69353.1
622	MEASLES VIRUS STRAIN EDMONSTON	SAEIS1QALSYALGG	1505	P69353.1
623	MEASLES VIRUS STRAIN EDMONSTON	SAEPLLSCKPWQESR	1506	P04851.1
624	MEASLES VIRUS STRAIN EDMONSTON	SAEPLLSCKPWQESRKNKAQ	1507	P04851.1
625	MEASLES MORBILLIVIRUS	SAGKVSSTLASELG	1508	P04851.1
626	MEASLES VIRUS STRAIN EDMONSTON	SAGKVSSTLASELGITAEDARLVS	1509	P04851.1
627	MEASLES VIRUS STRAIN EDMONSTON	SCTVTREDGT	1510	P08362.1
628	RUBELLA VIRUS	SDAACWGFPTDTVMS	1511	BAA28178.1
629	MEASLES VIRUS STRAIN EDMONSTON	SDARAAHLPTGTP	1512	P04851.1
630	RUBELLA VIRUS STRAIN THERIEN	SDWHQGTHVCHTKHMDFWCVEHD	1513	P07566.1
631	MEASLES VIRUS STRAIN EDMONSTON	SELRRWIKYTQQRRV	1514	P04851.1
632	MEASLES VIRUS STRAIN EDMONSTON	SELRRWIKYTQQRRVVGEFR	1515	P04851.1
633	MEASLES VIRUS STRAIN EDMONSTON	SELSQL	1516	P08362.1
634	MEASLES VIRUS STRAIN EDMONSTON	SELSQLS	1517	P08362.1
635	BORDETELLA PERTUSSIS	SEYLAHRRIPPENIRRVTRV	1518	CAD44970.1
636	MEASLES VIRUS STRAIN EDMONSTON	SFLQGDQSENELP	1519	P04851.1
637	MEASLES VIRUS STRAIN EDMONSTON	SGKGVSFQLVKLGVW	1520	P08362.1
638	MEASLES VIRUS STRAIN EDMONSTON	SHRGVIADNQAKWAV	1521	P08362.1
639	MEASLES VIRUS STRAIN EDMONSTON	SIEHQVKDVLTPLFK	1522	P08362.1
640	MEASLES VIRUS STRAIN EDMONSTON	SKIGVVGIGSASYKV	1523	P69353.1
641	MEASLES MORBILLIVIRUS	SKRSELSQLSMYRVF	1524	P06830.1
642	MEASLES MORBILLIVIRUS	SLFVESPGQLIQRITDDPDVS	1525	ABI54110.1
643	MEASLES VIRUS STRAIN EDMONSTON	SLSTNLDVTNSIEHQ	1526	P08362.1
644	MEASLES VIRUS STRAIN EDMONSTON	SLSTNLDVTNSIEHQVKDVLTPLFK	1527	P08362.1
645	MEASLES VIRUS STRAIN EDMONSTON	SLWGSGLLML	1528	BAE98296.1
646	MEASLES VIRUS STRAIN EDMONSTON	SMKGLSSTSIVYILI	1529	P69353.1
647	MEASLES MORBILLIVIRUS	SMYRVFEVGV	1530	P08362.1
648	MEASLES MORBILLIVIRUS	SNDLSNCMVALGELK	1531	P06830.1
649	MEASLES VIRUS STRAIN HALLE	SPGQLIQR	1532	P10050.1
650	MEASLES VIRUS STRAIN EDMONSTON	SQDPQDSRRSAEP	1533	P04851.1
651	MEASLES MORBILLIVIRUS	SRIVINREHLMIDRP	1534	P06830.1
652	MEASLES VIRUS STRAIN EDMONSTON	SRKNKAQTRTPLQ	1535	P04851.1
653	RUBELLA VIRUS	SRLVGATP	1536	CAJ88851.1
654	RUBELLA VIRUS	SRLVGATPERPRLRLVDADDPLLR	1537	CAJ88851.1
655	MEASLES VIRUS STRAIN EDMONSTON	SRPGLKPDLTGTSKS	1538	P69353.1
656	BORDETELLA PERTUSSIS	SRRSVASIVGTLVRM	1539	CAD44970.1
657	RUBELLA VIRUS	SRWGLGSPNCHGPDW	1540	BAA28178.1
658	BORDETELLA PERTUSSIS	SSATK	1541	ACI16088.1
659	RUBELLA VIRUS	SSGGYAQLASYFNPG	1542	BAA28178.1
660	BORDETELLA PERTUSSIS	SSLGNGV	1543	ACI16083.1
661	MEASLES MORBILLIVIRUS	SSNLUILPGQDLQYV	1544	P06830.1
662	MEASLES VIRUS STRAIN EDMONSTON	SSQDPQDSRRSAEPL	1545	P04851.1
663	MEASLES VIRUS STRAIN EDMONSTON	SSQDPQDSRRSAEPLLSCKP	1546	P04851.1
664	MEASLES VIRUS STRAIN EDMONSTON	SSRRHKRFAGVVLAG	1547	P69353.1
665	MEASLES VIRUS STRAIN EDMONSTON	SSTSIVYILIAVCLG	1548	P69353.1
666	BORDETELLA PERTUSSIS	STPGIVI	1549	AAA83981.1
667	BORDETELLA PERTUSSIS	STPGIVIPPQEQITQHGSPYGRC	1550	AAA83981.1
668	BORDETELLA PERTUSSIS	STSSSRRYTEVY	1551	P04977.1
669	MEASLES VIRUS STRAIN EDMONSTON	SYFIVLSIAYPTLSE	1552	P69353.1
670	MEASLES VIRUS STRAIN EDMONSTON	SYRETGPSRASDA	1553	P04851.1
671	BORDETELLA PERTUSSIS	SYVK	1554	ACI16083.1
672	RUBELLA VIRUS	SYVQHPHKTVRVKFH	1555	BAA28178.1
673	RUBELLA VIRUS	TAPGPGEV	1556	CAJ88851.1
674	BORDETELLA PERTUSSIS	TATRLLSSTNSRLC	1557	AAA83981.1
675	MEASLES MORBILLIVIRUS	TDDPVIDRLYLSSHR	1558	P06830.1
676	MEASLES VIRUS STRAIN EDMONSTON	TEILSLFGPSLRDPI	1559	P69353.1
677	RUBELLA VIRUS	TETRTVWQLSVAGVS	1560	BAA28178.1
678	BORDETELLA PERTUSSIS	TEVYLEHRMQEAVE	1561	P04977.1
679	MEASLES VIRUS STRAIN EDMONSTON	TFMPEGTVCSQNALY	1562	P69353.1
680	RUBELLA VIRUS	TGACICEIPTDVSCE	1563	BAA28178.1
681	BORDETELLA PERTUSSIS	TGDLRAY	1564	AC116083.1
682	MEASLES MORBILLIVIRUS	TGMQSWVPLSTDDPV	1565	P06830.1
683	RUBELLA VIRUS	TGNQQSRWGLGSPNC	1566	BAA28178.1
684	MEASLES VIRUS STRAIN EDMONSTON	TGPSRASDARAAH	1567	P04851.1
685	MEASLES MORBILLIVIRUS	TGTIINQDPDKILTY	1568	AAF02706.1
686	RUBELLA VIRUS	TGVVYGTHTTAVSET	1569	BAA28178.1
687	MEASLES VIRUS STRAIN EDMONSTON	TIRGQFSNMSLSLLD	1570	P08362.1
688	RUBELLA VIRUS	TLGATCALPLAGLLA	1571	BAA28178.1
689	MEASLES MORBILLIVIRUS	TLLNNCTRV	1572	P26031.1
690	MEASLES VIRUS STRAIN EDMONSTON-B	TLNVPPPPDPGR	1573	P03422.1
691	MEASLES VIRUS STRAIN EDMONSTON-B	TLNVPPPPDPGRASTSGTPIKK	1574	P03422.1
692	MEASLES MORBILLIVIRUS	TMTSQGMYGGTYPVE	1575	P06830.1
693	MEASLES VIRUS STRAIN EDMONSTON	TNLGNAIAKLEDAKE	1576	P69353.1
694	MEASLES VIRUS STRAIN EDMONSTON	TNMEDEADQYFSHDD	1577	P04851.1
695	MEASLES VIRUS STRAIN EDMONSTON	TNMEDEADQYFSHDDPISSD	1578	P04851.1
696	RUBELLA VIRUS STRAIN M33	TNPFQAAVARGLRPP	1579	CAA28880.1
697	MEASLES MORBILLIVIRUS	TNSIEHQVKDVLTPL	1580	P06830.1
698	MEASLES VIRUS STRAIN EDMONSTON	TNYLEQPVSNDLSNC	1581	P08362.1
699	MEASLES MORBILLIVIRUS	TNYLEQPVSNDLSNCMVALGELKLAAL	1582	AAR89413.1
700	RUBELLA VIRUS	TPERPRLR	1583	CAJ88851.1
701	RUBELLA VIRUS STRAIN THERIEN	TPERPRLRLVDADDPLLRTA	1584	P07566.1
702	MEASLES VIRUS STRAIN HALLE	TPGNKPRIA	1585	P10050.1
703	MEASLES VIRUS STRAIN EDMONSTON	TPLDIDTASESSQDP	1586	P04851.1
704	MEASLES VIRUS STRAIN EDMONSTON	TPLDIDTASESSQDPQDSRR	1587	P04851.1
705	MEASLES VIRUS STRAIN EDMONSTON	TPLFKTTGDEVGLRT	1588	P08362.1
706	MEASLES VIRUS STRAIN EDMONSTON	TPLQCTM	1589	P04851.1
707	RUBELLA VIRUS	TPVIGSQA	1590	CAJ88851.1
708	RUBELLA VIRUS	TPVIGSQARK	1591	BAA19893.1
709	MEASLES VIRUS STRAIN EDMONSTON	TQGYLISNFDESSCT	1592	P69353.1
710	BORDETELLA PERTUSSIS	TRANPNPYTSRRSVASIVGTLVRM	1593	P04977.1
711	RUBELLA VIRUS	TRFGCAMRWGLPP	1594	NP_740663.1
712	BORDETELLA PERTUSSIS	TRNTGQPATDHYYSNV	1595	AAA83981.1
713	MEASLES VIRUS STRAIN EDMONSTON	TRTPLQCTMTEIF	1596	P04851.1
714	RUBELLA VIRUS	TRWHRLLRMPVR	1597	ABD64216.1
715	MEASLES VIRUS STRAIN EDMONSTON	TSGSGGAIRGIKHII	1598	P04851.1
716	MEASLES VIRUS STRAIN EDMONSTON	TSGSGGAIRGIKHIIIVPIP	1599	P04851.1
717	MEASLES VIRUS STRAIN EDMONSTON	TSQGMYGGTYLVEKP	1600	P08362.1
718	MEASLES MORBILLIVIRUS	TSRVEHAVVYYVYSP	1601	P06830.1
719	BORDETELLA PERTUSSIS	TSSSRRYTEVYL	1602	ACI04548.1
720	BORDETELLA PERTUSSIS	TSYVG	1603	ACI16088.1
721	MEASLES VIRUS STRAIN EDMONSTON	TTEDKISRAVGPRQA	1604	P04851.1
722	MEASLES VIRUS STRAIN EDMONSTON	TTEDKISRAVGPRQAQVSFL	1605	P04851.1
723	RUBELLA VIRUS STRAIN M33	TTERIETRSARHP	1606	ABD64214.1
724	MEASLES VIRUS STRAIN EDMONSTON	TTNQAIEAIRQAGQE	1607	P69353.1
725	RUBELLA VIRUS	TTSDPWHPPGPLGLK	1608	BAA28178.1
726	MEASLES VIRUS STRAIN EDMONSTON	TVCSQNALYPMSPLL	1609	P69353.1
727	RUBELLA VIRUS	TVNGEDVGAVPPGKF	1610	BAA28178.1
728	MEASLES MORBILLIVIRUS	TYPVEKPNLSSKRSE	1611	P06830.1
729	RUBELLA VIRUS	VAGVSCNVTTEHPFC	1612	BAA28178.1
730	BORDETELLA PERTUSSIS	VAPGIVIPPKALFTQQGGAYGRC	1613	P04979.1
731	RUBELLA VIRUS	VCHTKHMDFWCVEHDRPPPATPTPL	1614	NP_740663.1
732	RUBELLA VIRUS	VCQRHSPDCSRLVGATPER	1615	BAA19893.1
733	RUBELLA VIRUS	VDADDPLL	1616	CAJ88851.1
734	RUBELLA VIRUS	VDADDPLLRTAPGPGEVWVT	1617	BAA19893.1
735	CORYNEBACTERIUM DIPHTHERIAE	VDIGFAAYNFVESIINLFQV	1618	AAV70486.1
736	MEASLES VIRUS STRAIN EDMONSTON	VEIAEYRRLLRTVLE	1619	P69353.1
737	MEASLES VIRUS STRAIN EDMONSTON	VELENSMGGLNFGRS	1620	P04851.1
738	MEASLES VIRUS STRAIN EDMONSTON	VELENSMGGLNFGRSYFDPA	1621	P04851.1
739	MEASLES MORBILLIVIRUS	VELKIKIASGFGPLI	1622	P06830.1
740	RUBELLA VIRUS	VEMDEWIHAHTTSD	1623	SRC265968
741	RUBELLA VIRUS	VEMPEWIHAHTTSDP	1624	BAA28178.1
742	CORYNEBACTERIUM DIPHTHERIAE	VERRLVKVL	1625	P33120.2
743	MEASLES MORBILLIVIRUS	VESPGQLI	1626	ABI54110.1
744	MEASLES VIRUS STRAIN EDMONSTON	VESPGQLIQRITDDP	1627	P04851.1
745	MEASLES VIRUS STRAIN EDMONSTON	VESPGQLIQRITDDPDVSIR	1628	P04851.1
746	RUBELLA VIRUS	VFALASYVQHPHKTV	1629	BAA28178.1
747	RUBELLA VIRUS	VGATPERP	1630	CAJ88851.1
748	RUBELLA VIRUS	VGATPERPRL	1631	BAA19893.1
749	RUBELLA VIRUS	VGATPERPRLRLVDA	1632	BAA28178.1
750	MEASLES VIRUS STRAIN EDMONSTON	VGIGSASYKVMTRSS	1633	P69353.1
751	MEASLES VIRUS STRAIN EDMONSTON	VGLRTPQRFTDLVKF	1634	P08362.1
752	CORYNEBACTERIUM DIPHTHERIAE	VHHNTEEIVAQSIALSSLMV	1635	AAV70486.1
753	MEASLES VIRUS STRAIN EDMONSTON	VHRLEGVSYNIGSQE	1636	P69353.1
754	RUBELLA VIRUS	VIGSQARK	1637	CAJ88851.1
755	BORDETELLA PERTUSSIS	VITGSI	1638	ACI16088.1
756	BORDETELLA PERTUSSIS	VITGTI	1639	ACI16083.1
757	MEASLES VIRUS STRAIN EDMONSTON	VKQSRGEA	1640	P04851.1
758	MEASLES VIRUS STRAIN EDMONSTON	VLFVMFLSLI	1641	P08362.1
759	MEASLES MORBILLIVIRUS	VLFVMFLSLIGLLAI	1642	P06830.1
760	MEASLES MORBILLIVIRUS	VLTPLFKIIGDEVGL	1643	P06830.1
761	MEASLES VIRUS STRAIN EDMONSTON	VMTRSSHQSLVIKLM	1644	P69353.1
762	RUBELLA VIRUS	VPAAPCARIWNGTQR	1645	BAA28178.1
763	RUBELLA VIRUS	VPPDPGDLVEYIMNY	1646	BAA28178.1
764	MEASLES VIRUS STRAIN EDMONSTON	VQSVASSRRHKRFAG	1647	P69353.1
765	BORDETELLA PERTUSSIS	VQTGGTSRTVTMRYLAS	1648	ACI16083.1
766	BORDETELLA PERTUSSIS	VQVRI	1649	ACI16083.1
767	RUBELLA VIRUS	VRAYNQPAGDV	1650	NP_740662.1
768	RUBELLA VIRUS	VRFESKIVDGGCFAP	1651	BAA28178.1
769	RUBELLA VIRUS	VRLAGVRFESKIVDG	1652	BAA28178.1
770	MEASLES VIRUS STRAIN EDMONSTON	VSGSFGNRFILSQGN	1653	P69353.1
771	BORDETELLA PERTUSSIS	VSKEEQYYDYEDAT	1654	AAA83981.1
772	MEASLES VIRUS STRAIN EDMONSTON	VSKGNCSGPTTIRGQ	1655	P08362.1
773	RUBELLA VIRUS	VTAALLNTPPPYQVS	1656	BAA28178.1
774	RUBELLA VIRUS	VTGCYQCGTPALVEG	1657	BAA28178.1
775	RUBELLA VIRUS	VTPVIGSQ	1658	CAJ88851.1
776	RUBELLA VIRUS STRAIN THERIEN	VTTEHPFCNTPHGQLEVQVPPD	1659	P07566.1
777	MEASLES VIRUS STRAIN EDMONSTON	VVLAGAALGVATAAQ	1660	P69353.1
778	RUBELLA VIRUS	VWQLSVAGVSCNVTT	1661	BAA28178.1
779	RUBELLA VIRUS	VWVTPVIG	1662	CAJ88851.1
780	RUBELLA VIRUS	VWVTPVIGSQAR	1663	BAA19893.1
781	MEASLES VIRUS STRAIN EDMONSTON	VYILIAVCLGGLIGI	1664	P69353.1
782	MEASLES VIRUS STRAIN EDMONSTON	VYLHRIDLGPPISLE	1665	P69353.1
783	BORDETELLA PERTUSSIS	VYRYDSRP	1666	P04977.1
784	BORDETELLA PERTUSSIS	VYRYDSRPPEDV	1667	P04977.1
785	MEASLES MORBILLIVIRUS	VYWLTIPPMKNLALG	1668	P06830.1
786	RUBELLA VIRUS	WDLEATGACICEIPT	1669	BAA28178.1
787	MEASLES MORBILLIVIRUS	WDQKLWCRHFCVLAD	1670	AAR89413.1
788	RUBELLA VIRUS	WGFPTDTVMSVFALA	1671	BAA28178.1
789	RUBELLA VIRUS	WHPPGPLGLKFKTVR	1672	BAA28178.1
790	RUBELLA VIRUS	WIHAHTTSDPWHPPG	1673	BAA28178.1
791	MEASLES VIRUS STRAIN EDMONSTON	WLTIPPMKNLALGVI	1674	P08362.1
792	MEASLES VIRUS STRAIN EDMONSTON	WQESRKNKAQTRTPLQCTMT	1675	P04851.1
793	RUBELLA VIRUS	WVCIFMVCRRACR	1676	SRC265968
794	RUBELLA VIRUS	WVTPVIGS	1677	CAJ88851.1
795	MEASLES VIRUS STRAIN EDMONSTON	WYTTVPKYVATQGYL	1678	P69353.1
796	MEASLES VIRUS STRAIN EDMONSTON	YALGGDINKVLEKLG	1679	P69353.1
797	MEASLES VIRUS STRAIN EDMONSTON	YAMGVGVELE	1680	P04851.1
798	MEASLES MORBILLIVIRUS	YAMGVGVELEN	1681	ABI54110.1
799	MEASLES MORBILLIVIRUS	YCADVAAEELMNALV	1682	AAR89413.1
800	MEASLES MORBILLIVIRUS	YDFRDLTWCINPPER	1683	P06830.1
801	BORDETELLA PERTUSSIS	YFEPGPT	1684	ACI16083.1
802	RUBELLA VIRUS	YFNPGGSYYKQYHPT	1685	BAA28178.1
803	MEASLES VIRUS STRAIN EDMONSTON	YFRLGQEMVRRSAGK	1686	P04851.1
804	MEASLES VIRUS STRAIN EDMONSTON	YFRLGQEMVRRSAGKVSSTL	1687	P04851.1
805	MEASLES MORBILLIVIRUS	YFYPFRLPIKGVPIE	1688	P06830.1
806	BORDETELLA PERTUSSIS	YGDNAGRILAGALAT	1689	P04977.1
807	RUBELLA VIRUS	YGHATVEMPEWIHAH	1690	BAA28178.1
808	RUBELLA VIRUS	Y1MNYTGNQQSRWGL	1691	BAA28178.1
809	MEASLES VIRUS STRAIN EDMONSTON	YINNELIPSMNQLSC	1692	P69353.1
810	RUBELLA VIRUS	YLCTAPGCATQAPVP	1693	BAA28178.1
811	MEASLES MORBILLIVIRUS	YLFTVPIKEAGEDCH	1694	P06830.1
812	MEASLES VIRUS STRAIN EDMONSTON	YLHDPEFNL	1695	ABK40531.1
813	MEASLES VIRUS STRAIN EDMONSTON	YLNMSRLFV	1696	ABK40531.1
814	MEASLES VIRUS STRAIN HALLE	YPALGLHEF	1697	P10050.1
815	MEASLES MORBILLIVIRUS	YPALGLHEFA	1698	ABI54110.1
816	MEASLES VIRUS STRAIN EDMONSTON	YPALGLHEFAGELST	1699	P04851.1
817	MEASLES VIRUS STRAIN EDMONSTON	YPALGLHEFAGELSTLESLM	1700	P04851.1
818	MEASLES VIRUS STRAIN EDMONSTON	YPFRLPIKGVPIELQ	1701	P08362.1
819	MEASLES VIRUS STRAIN HALLE	YPLLWSYAM	1702	P10050.1
820	MUMPS RUBULAVIRUS	YQQQGRL	1703	P21186.1
821	BORDETELLA PERTUSSIS	YQSEYLAHRR	1704	P04977.1
822	MEASLES VIRUS STRAIN EDMONSTON	YRETGPSRASDARAA	1705	P04851.1
823	MEASLES VIRUS STRAIN EDMONSTON	YRETGPSRASDARAAHLPTG	1706	P04851.1
824	RUBELLA VIRUS	YRNASDVLPGHWLQGGWGCYNLSDW	1707	NP_740663.1
825	MEASLES VIRUS STRAIN EDMONSTON	YRRLLRTVLEPIRDA	1708	P69353.1
826	BORDETELLA PERTUSSIS	YRYDSRPP	1709	P04977.1
827	MEASLES VIRUS STRAIN EDMONSTON	YSGGDLLGILESRGI	1710	P69353.1
828	BORDETELLA PERTUSSIS	YSKVTATBLLASTNSRLCAVFVRDG	1711	SRC280066
829	MEASLES VIRUS STRAIN EDMONSTON	YSPSRSFSYFYPFRL	1712	P08362.1
830	RUBELLA VIRUS STRAIN THERIEN	YTGNQQSRWGLGSPNCHGPDWASPV	1713	P07566.1
831	MEASLES MORBILLIVIRUS	YVLLAVLFV	1714	P08362.1
832	MEASLES MORBILLIVIRUS	YVYSPGRSFSYFYPF	1715	P06830.1
833	BORDETELLA PERTUSSIS	YYDYEDATFQTYALTGISLCNPAASIC	1716	P04979.1
834	MEASLES MORBILLIVIRUS	GDLLGILESRGIKAR	1717	AAF02706.1
835	MEASLES MORBILLIVIRUS	TVPKYVATQGYLISN	1718	AAL29688.1
836	MEASLES MORBILLIVIRUS	KPWDSPQEI	1719	P26035.1
837	MEASLES MORBILLIVIRUS	KPWESPQEI	1720	CAA34579.1
838	BORDETELLA PERTUSSIS	ATYQSEYLAHRRIPP	1721	ACI04548.1
839	BORDETELLA PERTUSSIS	CMARQAESSEAMAAWSERAGEAMVLV YYESIAYSF	1722	ACI04548.1
840	BORDETELLA PERTUSSIS	CQVGSSNSAFVSTSSSRRYTEVYL	1723	ACI04548.1
841	BORDETELLA PERTUSSIS	DDPPATVYRYDSRPP	1724	ACI04548.1
842	BORDETELLA PERTUSSIS	GALATYQSEYLAHRRIPP	1725	ACI04548.1
843	BORDETELLA PERTUSSIS	MAAWSERAGEAMVLVYYESIAYSF	1726	ACI04548.1
844	BORDETELLA PERTUSSIS	MVLVYYESIAYSF	1727	ACI04548.1
845	BORDETELLA PERTUSSIS	PATVYRYDSRPPEDV	1728	AC104548.1
846	BORDETELLA PERTUSSIS	YDSRPPEDV	1729	ACI04548.1
847	BORDETELLA PERTUSSIS	EPGITTNYDT	1730	ACI16087.1
848	BORDETELLA PERTUSSIS	GDLRAYKMVYATNPQTQLSN	1731	ACI16083.1
849	BORDETELLA PERTUSSIS	KNGDVEASAITTYVGFSVVYP	1732	ACI16083.1
850	BORDETELLA PERTUSSIS	KVTNGSKSYTLRYLASYVK	1733	ACI16088.1
851	BORDETELLA PERTUSSIS		1734	ACI16088.1
852	BORDETELLA PERTUSSIS	YATNPQTQLS	1735	ACI16083.1
853	CORYNEBACTERIUM DIPHTHERIAE	DNENPLSGKAGGVVKVTYPGLTKV	1736	AAV70486.1
854	CORYNEBACTERIUM DIPHTHERIAE	ENFSSYHGTKPGYVDSI	1737	AAV70486.1
855	CORYNEBACTERIUM DIPHTHERIAE	KVDNAETIKKELGLSLTEP	1738	AAV70486.1
856	RUBELLA VIRUS STRAIN M33	MEDLQKALEAQSRALRAGLAA	1739	CAA28880.1
857	CORYNEBACTERIUM DIPHTHERIAE	QKGIQKPKSGTQGNYDDDWKGFY	1740	AAV70486.1
858	RUBELLA VIRUS STRAIN M33		1741	CAA28880.1
859	RUBELLA VIRUS		1742	SRC265968
860	RUBELLA VIRUS	CVTSWLWSEGEGAVFYRVDLHFINLGTP	1743	CAA28880.1
861	RUBELLA VIRUS	FRVGGTRWHRLLRMPVRGLDGDTAPLP	1744	CAA28880.1
862	CORYNEBACTERIUM DIPHTHERIAE	GRKIRMRCRAIDGDVTFCRPKSPVYVGN	1745	1007216A
863	RUBELLA VIRUS	GTPPLDEDGRWDPALMYNPCGPEPPAHV	1746	CAA28880.1
864	CORYNEBACTERIUM DIPHTHERIAE		1747	AAV70486.1
865	RUBELLA VIRUS		1748	ABD64200.1
866	RUBELLA VIRUS		1749	CAA28880.1
867	RUBELLA VIRUS	PLPPHTTERIETRSARHPWRIRFGAP	1750	CAA28880.1
868	RUBELLA VIRUS	SRAPPPPEERQESRSQTPAPKPSRAPP	1751	CAA28880.1
869	RUBELLA VIRUS	SRAPPQQPQPPRMQTGRGGSAPRPELGP	1752	CAA28880.1
870	RUBELLA VIRUS	TPAVTPEGPAPPRTGAWQRKDWSRAPP	1753	CAA28880.1
871	RUBELLA VIRUS		1754	CAA28880.1
872	RUBELLA VIRUS	AFGHSDAACWGFPTDTVMSV	1755	CAA28880.1
873	RUBELLA VIRUS	CARIWNGTQRACTFWAVNAYS	1756	CAA28880.1
874	RUBELLA VIRUS	EEAFTYLCTAPGCATQTPVPVR	1757	CAA28880.1
875	RUBELLA VIRUS	FAPWDLEATGACICEIPTDV	1758	CAA28880.1
876	RUBELLA VIRUS	GEDVGAFPPGKFVTAAL	1759	CAA28880.1
877	RUBELLA VIRUS	GEVWVTPVIGSQARKCGLHI	1760	CAA28880.1
878	RUBELLA VIRUS	GQLEVQVPPDPGDLVEYIMN	1761	CAA28880.1
879	RUBELLA VIRUS	GSYYKQYHPTACEVEPAFGH	1762	CAA28880.1
880	RUBELLA VIRUS	IHAHTTSDPWHPPGPLGLKF	1763	CAA28880.1
881	RUBELLA VIRUS	IMNYTGNQQSRWGLGSPNCH	1764	CAA28880.1
882	RUBELLA VIRUS	LHIRAGPYGHATVEMPEWIH	1765	CAA28880.1
883	RUBELLA VIRUS	LKFKTVRPVALPRALAPPRN	1766	CAA28880.1
884	RUBELLA VIRUS	LNTPPPYQVSCGGESDRASAGH	1767	CAA28880.1
885	RUBELLA VIRUS	NCHGPDWASPVCQRHSPDCS	1768	CAA28880.1
886	RUBELLA VIRUS	PDCSRLVGATPERPRLRLVD	1769	CAA28880.1
887	RUBELLA VIRUS	PRNVRVTGCYQCGTPALVEG	1770	CAA28880.1
888	RUBELLA VIRUS	PTDVSCEGLGAWVPTAPCARI	1771	CAA28880.1
889	RUBELLA VIRUS	RLVDADDPLLRTAPGPGEVW	1772	CAA28880.1
890	RUBELLA VIRUS	SVFALASYVQHPHKTVRVKF	1773	CAA28880.1
891	RUBELLA VIRUS	VEGLAPGGGNCHLTVNGEDV	1774	CAA28880.1
892	RUBELLA VIRUS	VKEHIELRIVWQLSVAGVSC	1775	CAA28880.1
893	RUBELLA VIRUS	VPVRLAGVGFESKIVDGGCF	1776	CAA28880.1
894	RUBELLA VIRUS	VSCNVTTEHPFCNTPHGQLE	1777	CAA28880.1
895	BORDETELLA PERTUSSIS	AAASSPDAHVPF	1778	AAA22983.1
896	BORDETELLA PERTUSSIS	AASSPDA	1779	AAA22983.1
897	BORDETELLA PERTUSSIS	AKLGAAASSPDA	1780	AAA22983.1
898	BORDETELLA PERTUSSIS	AMKPYEVTPTRM	1781	AAA22983.1
899	BORDETELLA PERTUSSIS	AMTHLSPALADVPYVLVKTNMVVTS	1782	AAA22983.1
900	BORDETELLA PERTUSSIS	ASSPDAHVPFCF	1783	AAA22983.1
901	BORDETELLA PERTUSSIS	ASSPDAHVPFCFGKDLKRPGSSPME	1784	AAA22983.1
902	BORDETELLA PERTUSSIS	CFGKDLKRPGSS	1785	AAA22983.1
903	BORDETELLA PERTUSSIS	CFGKDLKRPGSSPMEVMLRAVFMQQ	1786	AAA22983.1
904	BORDETELLA PERTUSSIS	CGIAAKLGAAAS	1787	AAA22983.1
905	BORDETELLA PERTUSSIS	CGIAAKLGAAASSPDAHVPFCFGKD	1788	AAA22983.1
906	BORDETELLA PERTUSSIS	DAHVPFCFGKDL	1789	AAA22983.1
907	BORDETELLA PERTUSSIS	DLKRPGSSPMEV	1790	AAA22983.1
908	BORDETELLA PERTUSSIS	DVPYVLVKTNMV	1791	AAA22983.1
909	BORDETELLA PERTUSSIS	DVPYVLVKTNMVVTSVAMKPYEVTPT	1792	AAA22983.1
910	BORDETELLA PERTUSSIS	EVMLRAVFMQQR	1793	AAA22983.1
911	BORDETELLA PERTUSSIS	FEGKPALELIRM	1794	AAA22983.1
912	BORDETELLA PERTUSSIS	FLGPKQLTFEGK	1795	AAA22983.1
913	BORDETELLA PERTUSSIS	FLGPKQLTFEGKPALELIRMVECSG	1796	AAA22983.1
914	BORDETELLA PERTUSSIS	FMQQRPLRMFLGPKQLT	1797	AAA22983.1
915	BORDETELLA PERTUSSIS	GKDLKRPGSSPM	1798	AAA22983.1
916	BORDETELLA PERTUSSIS	GKDLKRPGSSPME	1799	AAA22983.1
917	BORDETELLA PERTUSSIS	GKPALELIRMVE	1800	AAA22983.1
918	BORDETELLA PERTUSSIS	GPKQLTFEGKPA	1801	AAA22983.1
919	BORDETELLA PERTUSSIS	HVPFCFGKDLKR	1802	AAA22983.1
920	BORDETELLA PERTUSSIS	IAAKLGAAASSP	1803	AAA22983.1
921	BORDETELLA PERTUSSIS	KPYEVTPTRMLV	1804	AAA22983.1
922	BORDETELLA PERTUSSIS	KQLTFEGKPALE	1805	AAA22983.1
923	BORDETELLA PERTUSSIS	KRPGSSPMEVML	1806	AAA22983.1
924	BORDETELLA PERTUSSIS	LELIRMVECSGK	1807	AAA22983.1
925	BORDETELLA PERTUSSIS	LGAAASSPDAHV	1808	AAA22983.1
926	BORDETELLA PERTUSSIS	LIRMVECSGKQD	1809	AAA22983.1
927	BORDETELLA PERTUSSIS	LVCGIAAKLGAA	1810	AAA22983.1
928	BORDETELLA PERTUSSIS	MKPYEVTPTRM	1811	AAA22983.1
929	BORDETELLA PERTUSSIS	MLRAVFMQQRPL	1812	AAA22983.1
930	BORDETELLA PERTUSSIS	MQQRPLRM	1813	AAA22983.1
931	BORDETELLA PERTUSSIS	MQQRPLRMFLGP	1814	AAA22983.1
932	BORDETELLA PERTUSSIS	MVVTSVAMKPYE	1815	AAA22983.1
933	BORDETELLA PERTUSSIS	MVVTSVAMKPYEVTPTRMLVCGIAA	1816	AAA22983.1
934	BORDETELLA PERTUSSIS	PALELIRMVECS	1817	AAA22983.1
935	BORDETELLA PERTUSSIS	PALELIRMVECSGK	1818	AAA22983.1
936	BORDETELLA PERTUSSIS	PFCFGKDLKRPG	1819	AAA22983.1
937	BORDETELLA PERTUSSIS	PGSSPMEVMLRA	1820	AAA22983.1
938	BORDETELLA PERTUSSIS	PGSSPMEVMLRAVF	1821	AAA22983.1
939	BORDETELLA PERTUSSIS	PKQLTFEGK	1822	AAA22983.1
940	BORDETELLA PERTUSSIS	PLRMFLGPKQLT	1823	AAA22983.1
941	BORDETELLA PERTUSSIS	PTRMLVCGIAAK	1824	AAA22983.1
942	BORDETELLA PERTUSSIS	PYVLVKTNMVVT	1825	AAA22983.1
943	BORDETELLA PERTUSSIS	QLTFEGKPALELIRMVECSGKQDCP	1826	AAA22983.1
944	BORDETELLA PERTUSSIS	QRPLRMFLGPKQ	1827	AAA22983.1
945	BORDETELLA PERTUSSIS	RAVFMQQRPLRM	1828	AAA22983.1
946	BORDETELLA PERTUSSIS	RMFLGPKQLTFE	1829	AAA22983.1
947	BORDETELLA PERTUSSIS	RMLVCGIAAKLG	1830	AAA22983.1
948	BORDETELLA PERTUSSIS	RMVECSGKQDCP	1831	AAA22983.1
949	BORDETELLA PERTUSSIS	SPDAHVPFCFGK	1832	AAA22983.1
950	BORDETELLA PERTUSSIS	SSPMEVMLRAVF	1833	AAA22983.1
951	BORDETELLA PERTUSSIS	SSPMEVMLRAVFMQQRPLRMFLGPK	1834	AAA22983.1
952	BORDETELLA PERTUSSIS	SVAMKPYEVTPT	1835	AAA22983.1
953	BORDETELLA PERTUSSIS	VECSGKQDCP	1836	AAA22983.1
954	BORDETELLA PERTUSSIS	VFMQQRPLRMFL	1837	AAA22983.1
955	BORDETELLA PERTUSSIS	VFMQQRPLRMFLGPKQLTFEGKPAL	1838	AAA22983.1
956	BORDETELLA PERTUSSIS	VKTNMVVTSVAM	1839	AAA22983.1
957	BORDETELLA PERTUSSIS	VLVKTNMVVTSV	1840	AAA22983.1
958	BORDETELLA PERTUSSIS	VTPTRMLVCGIA	1841	AAA22983.1
959	BORDETELLA PERTUSSIS	VTSVAMKPYEVT	1842	AAA22983.1
960	BORDETELLA PERTUSSIS	YEVTPTRMLVCG	1843	AAA22983.1
961	BORDETELLA PERTUSSIS	YEVTPTRMLVCGIAAKLGAAASSPD	1844	AAA22983.1
962	BORDETELLA PERTUSSIS	CASPYEGRYRDMYDALR	1845	P04979.1
963	BORDETELLA PERTUSSIS	CAVFVRDGQSV	1846	P04979.1
964	BORDETELLA PERTUSSIS	CITTIYKTG	1847	P04979.1
965	BORDETELLA PERTUSSIS	CPNGTRALTV	1848	P04979.1
966	BORDETELLA PERTUSSIS	DALRRLLYMIYMSG	1849	P04979.1
967	RUBELLA VIRUS STRAIN THERIEN	GNRGRGQRRDWSRAPPPPEERQETRS	1850	P07566.1
968	BORDETELLA PERTUSSIS	GQPAADHYYSKVT	1851	P04979.1
969	RUBELLA VIRUS	GSPNCHGPDWASPVCQRHS	1852	ABD64214.1
970	MEASLES VIRUS STRAIN EDMONSTON	HKSLSTNLDVTNSIEHQ	1853	P08362.1
971	BORDETELLA PERTUSSIS	LFTQQGGAYGRC	1854	P04979.1
972	MEASLES VIRUS STRAIN EDMONSTON	LIGLLAIAGIRLHRAAIYTAEI	1855	P08362.1
973	MEASLES MORBILLIVIRUS	PDTAADSELRRWIKY	1856	ABI54110.1
974	RUBELLA VIRUS STRAIN THERIEN	PNCHGPDWASPVCQRHS	1857	P07566.1
975	RUBELLA VIRUS	QTPAPKPSRAPPQQPQPPRMQTGR	1858	ABD64216.1
976	RUBELLA VIRUS VACCINE STRAIN RA27/3	RAGLTAGASQSRRPRPPR	1859	CAA33016.1
977	RUBELLA VIRUS VACCINE STRAIN RA27/3	RFGAPQAFLAGLLLAAVAVGTARA	1860	ABD64214.1
978	BORDETELLA PERTUSSIS	RGNAELQTYLRQITPG	1861	P04979.1
979	BORDETELLA PERTUSSIS	RVHVSKEEQYYDYED	1862	P04979.1
980	BORDETELLA PERTUSSIS	SIYGLYDGTYL	1863	P04979.1
981	BORDETELLA PERTUSSIS	SKVTATRLLASTNS	1864	P04979.1
982	BORDETELLA PERTUSSIS	TQQGGAYGRCPNGTRA	1865	P04979.1
983	BORDETELLA PERTUSSIS	VAPGIVIPPKAL	1866	P04979.1
984	BORDETELLA PERTUSSIS	DSRPPEDVFQNGFTAWG	1867	ACI04548.1
985	BORDETELLA PERTUSSIS	EHRMQEAVEAERAGR	1868	ACI04548.1
986	MEASLES VIRUS STRAIN EDMONSTON	ETCFQQACKGKIQALCENPEWA	1869	P08362.1
987	BORDETELLA PERTUSSIS	EYVDTYGDNAGRILAGALATYQ	1870	ACI04548.1
988	BORDETELLA PERTUSSIS	HRRIPPENIRRVTR	1871	ACI04548.1
989	BORDETELLA PERTUSSIS	MARQAESSE	1872	ACI04548.1
990	BORDETELLA PERTUSSIS	MQEAVEAERAGR	1873	ACI04548.1
991	BORDETELLA PERTUSSIS	SQQTRANPNPYTSRR	1874	ACI04548.1
992	BORDETELLA PERTUSSIS	TRANPNPYTSRRSVAS1VGTLVHG	1875	SRC280066
993	BORDETELLA PERTUSSIS	TVYRYDSRPPED	1876	ACI04548.1
994	MEASLES MORBILLIVIRUS	NDRNLLD	1877	P10050.1
995	MEASLES MORBILLIVIRUS		1878	P04851.1
996	MEASLES MORBILLIVIRUS	SRASDARAAHLPTGTPLDID	1879	P04851.1
997	BORDETELLA PERTUSSIS	EDVFQNGFTAW	1880	ACI04548.1
998	CORYNEBACTERIUM DIPHTHERIAE	AEGSSSVEYINNWEQAK	1881	AAV70486.1
999	CORYNEBACTERIUM DIPHTHERIAE	GPIKNKMSESPNKT	1882	AAV70486.1
1000	MEASLES VIRUS STRAIN HALLE		1883	P10050.1
1001	CORYNEBACTERIUM DIPHTHERIAE	GYQKTVDHTKVNSK	1884	AAV70486.1
1002	CORYNEBACTERIUM DIPHTHERIAE	KTVDH	1885	AAV70486.1
1003	CORYNEBACTERIUM DIPHTHERIAE	SESPNK	1886	AAV70486.1
1004	CORYNEBACTERIUM DIPHTHERIAE	AEGSSSVEYINNWEQAKALS	1887	AAV70486.1
1005	CORYNEBACTERIUM DIPHTHERIAE	AQAIPLVGELVDIGFAAYNF	1888	AAV70486.1
1006	CORYNEBACTERIUM DIPHTHERIAE	ASRVVLSLPFAEGSSSVEYI	1889	AAV70486.1
1007	CORYNEBACTERIUM DIPHTHERIAE	CINLDWDVIRDKTKTKIESL	1890	AAV70486.1
1008	CORYNEBACTERIUM DIPHTHERIAE	CRAIDGDVTFCRPKSPVYVG	1891	AAV70486.1
1009	CORYNEBACTERIUM DIPHTHERIAE	CRPKSPVYVGNGVHANLHVA	1892	AAV70486.1
1010	CORYNEBACTERIUM DIPHTHERIAE	DAAGYSVDNENPLSGKAGGV	1893	AAV70486.1
1011	CORYNEBACTERIUM DIPHTHERIAE	DKTKTKIESLKEHGPIKNKM	1894	AAV70486.1
1012	CORYNEBACTERIUM DIPHTHERIAE	EEFIKRFGDGASRVVLSLPF	1895	AAV70486.1
1013	CORYNEBACTERIUM DIPHTHERIAE	EKAKQYLEEFHQTALEHPEL	1896	AAV70486.1
1014	CORYNEBACTERIUM DIPHTHERIAE	FHRSSSEKIHSNEISSDSIG	1897	AAV70486.1
1015	CORYNEBACTERIUM DIPHTHERIAE	GADDVVDSSKSFVMENFSSY	1898	CAE11230.1
1016	CORYNEBACTERIUM DIPHTHERIAE	GKRGQDAMYEYMAQACAGΓ1R	1899	AAV70486.1
1017	CORYNEBACTERIUM DIPHTHERIAE	GSVMGIADGAVHHNTEEIVA	1900	AAV70486.1
1018	CORYNEBACTERIUM DIPHTHERIAE	GTQGNYDDDWKGFYSTDNKY	1901	AAV70486.1
1019	CORYNEBACTERIUM DIPHTHERIAE	HDGYAVSWNTVEDSIIRTGF	1902	AAV70486.1
1020	CORYNEBACTERIUM DIPHTHERIAE	HGTKPGYVDSIQKGIQKPKS	1903	AAV70486.1
1021	CORYNEBACTERIUM DIPHTHERIAE	HQTALEHPELSELKTVTGTN	1904	AAV70486.1
1022	CORYNEBACTERIUM DIPHTHERIAE	IQKGIQKPKSGTQGNYDDDW	1905	AAV70486.1
1023	CORYNEBACTERIUM DIPHTHERIAE	KEHGPIKNKMSESPNKTVSE	1906	AAV70486.1
1024	CORYNEBACTERIUM DIPHTHERIAE	KGFYSTDNKYDAAGYSVDNE	1907	AAV70486.1
1025	CORYNEBACTERIUM DIPHTHERIAE	LDVNKSKTHISVNGRKIRMR	1908	AAV70486.1
1026	RUBELLA VIRUS	MASTIPITMEDLQKALEA	1909	SRC265968
1027	CORYNEBACTERIUM DIPHTHERIAE	NGVHANLHVAFHRSSSEKIH	1910	AAV70486.1
1028	CORYNEBACTERIUM DIPHTHERIAE	NNWEQAKALSVELEINFETR	1911	AAV70486.1
1029	CORYNEBACTERIUM DIPHTHERIAE	NPLSGKAGGVVKVTYPGLTK	1912	AAV70486.1
1030	CORYNEBACTERIUM DIPHTHERIAE	PVFAGANYAAWAVNVAQVID	1913	AAV70486.1
1031	CORYNEBACTERIUM DIPHTHERIAE	SELKTVTGTNPVFAGANYAA	1914	AAV70486.1
1032	CORYNEBACTERIUM DIPHTHERIAE	SESPNKTVSEEKAKQYLEEF	1915	AAV70486.1
1033	CORYNEBACTERIUM DIPHTHERIAE	SETADNLEKTTAALSILPGI	1916	AAV70486.1
1034	CORYNEBACTERIUM DIPHTHERIAE	SFVMENFSSYHGTKPGYVDS	1917	AAV70486.1
1035	CORYNEBACTERIUM DIPHTHERIAE	SNEISSDSIGVLGYQKTVDH	1918	AAV70486.1
1036	CORYNEBACTERIUM DIPHTHERIAE	SPGHKTQPFLHDGYAVSWNT	1919	AAV70486.1
1037	CORYNEBACTERIUM DIPHTHERIAE	SVNGRKIRMRCRAIDGDVTF	1920	AAV70486.1
1038	CORYNEBACTERIUM DIPHTHERIAE	TAALSILPGIGSVMGIADGA	1921	AAV70486.1
1039	CORYNEBACTERIUM DIPHTHERIAE	TAENTPLPIAGVLLPTIPGK	1922	AAV70486.1
1040	CORYNEBACTERIUM DIPHTHERIAE	TEPLMEQVGTEEFIKRFGDG	1923	AAV70486.1
1041	CORYNEBACTERIUM DIPHTHERIAE	TIKKELGLSLTEPLMEQVGT	1924	AAV70486.1
1042	CORYNEBACTERIUM DIPHTHERIAE	TKVNSKLSLFFEIKS	1925	AAV70486.1
1043	CORYNEBACTERIUM DIPHTHERIAE	VEDSIIRTGFQGESGHDIKI	1926	AAV70486.1
1044	CORYNEBACTERIUM DIPHTHERIAE	VELEINFETRGKRGQDAMYE	1927	AAV70486.1
1045	CORYNEBACTERIUM DIPHTHERIAE	VESIINLFQVVHNSYNRPAY	1928	AAV70486.1
1046	CORYNEBACTERIUM DIPHTHERIAE	VHNSYNRPAYSPGHKTQPFL	1929	AAV70486.1
1047	CORYNEBACTERIUM DIPHTHERIAE	VKVTYPGLTKVLALKVDNAE	1930	AAV70486.1
1048	CORYNEBACTERIUM DIPHTHERIAE	VLALKVDNAETIKKELGLSL	1931	AAV70486.1
1049	CORYNEBACTERIUM DIPHTHERIAE	VLGYQKTVDHTKVNSKLSLF	1932	AAV70486.1
1050	CORYNEBACTERIUM DIPHTHERIAE	VRRSVGSSLSCINLDWDVIR	1933	AAV70486.1
1051	CORYNEBACTERIUM DIPHTHERIAE	WAVNVAQVIDSETADNLEKT	1934	AAV70486.1
1052	CORYNEBACTERIUM DIPHTHERIAE	YMAQACAGNRVRRSVGSSLS	1935	AAV70486.1
1053	BORDETELLA PERTUSSIS	AKAPPAPKPAPQPGP	1936	ABO77783.1
1054	BORDETELLA PERTUSSIS	APKPAPQPGP	1937	ABO77783.1
1055	BORDETELLA PERTUSSIS	APKPAPQPGPQPPQP	1938	ABO77783.1
1056	MEASLES VIRUS STRAIN EDMONSTON	AQTRTPLQCTMTEIF	1939	P04851.1
1057	MEASLES VIRUS STRAIN EDMONSTON	ASRGTNMEDEADQYFSHDD	1940	P04851.1
1058	BORDETELLA PERTUSSIS	ATIRR	1941	ABO77783.1
1059	BORDETELLA PERTUSSIS	DNRAG	1942	ABO77783.1
1060	BORDETELLA PERTUSSIS	EAPAPQPPAGRELSA	1943	ABO77783.1
1061	MEASLES VIRUS STRAIN EDMONSTON	EMVRRSAGKVSSTLASELGI	1944	P04851.1
1062	BORDETELLA PERTUSSIS	GASEL	1945	ABO77783.1
1063	BORDETELLA PERTUSSIS	GDALAGGAVP	1946	AAA22980.1
1064	BORDETELLA PERTUSSIS	GDAPAGGAVP	1947	ABO77783.1
1065	BORDETELLA PERTUSSIS	GDTWDDD	1948	ABO77783.1
1066	BORDETELLA PERTUSSIS	GERQH	1949	ABO77783.1
1067	BORDETELLA PERTUSSIS	GGAVP	1950	ABO77783.1
1068	BORDETELLA PERTUSSIS	GGFGP	1951	P14283.3
1069	BORDETELLA PERTUSSIS	GGFGPGGFGP	1952	BAF35031.1
1070	BORDETELLA PERTUSSIS	GGFGPVLDGW	1953	ABO77783.1
1071	MEASLES VIRUS STRAIN EDMONSTON	GGKEDRRVKQSRGEARESYR	1954	P04851.1
1072	BORDETELLA PERTUSSIS	GILLEN	1955	ABO77783.1
1073	BORDETELLA PERTUSSIS	GIRRFL	1956	ABO77783.1
1074	MEASLES VIRUS STRAIN EDMONSTON	HDDPISSDQSRFGWFENKEI	1957	P04851.1
1075	MEASLES VIRUS STRAIN EDMONSTON	HEFAGELSTLESLMNLY	1958	P04851.1
1076	BORDETELLA PERTUSSIS	HLGGLAGY	1959	ABO77783.1
1077	MEASLES VIRUS STRAIN EDMONSTON	HTTEDKISRAVGPRQAQVSFL	1960	P04851.1
1078	MEASLES VIRUS STRAIN EDMONSTON	ICDIDTYIVEAGLASFILTI	1961	P04851.1
1079	MEASLES VIRUS STRAIN EDMONSTON	IIIVPIPGDSSITTRSRLLD	1962	P04851.1
1080	MEASLES VIRUS STRAIN EDMONSTON	ILDIKRTPGNKPRIAEMICD	1963	P04851.1
1081	BORDETELLA PERTUSSIS	KALLYR	1964	ABO77783.1
1082	MEASLES VIRUS STRAIN EDMONSTON	KPPITSGSGGAIRGIKHIII	1965	P04851.1
1083	BORDETELLA PERTUSSIS	LAGSGL	1966	ABO77783.1
1084	MEASLES VIRUS STRAIN EDMONSTON	LGTTAEDARLVSEIAMHTTE	1967	P04851.1
1085	MEASLES VIRUS STRAIN EDMONSTON	LGTILAQIWVLLAKAVTA	1968	P04851.1
1086	MEASLES VIRUS STRAIN EDMONSTON	LPTGTPLDIDTASESSQD	1969	P04851.1
1087	MEASLES VIRUS STRAIN EDMONSTON	MATLLRSLALFKRNKDK	1970	P04851.1
1088	BORDETELLA PERTUSSIS	PAPQPP	1971	ABO77783.1
1089	MEASLES VIRUS STRAIN EDMONSTON	PDTAADSELRRWIKYTQQRR	1972	P04851.1
1090	MEASLES VIRUS STRAIN EDMONSTON	PKLTGALIGILSLFVESPGQ	1973	P04851.1
1091	BORDETELLA PERTUSSIS	PQP	1974	ABO77783.1
1092	BORDETELLA PERTUSSIS	PQPGP	1975	ABO77783.1
1093	BORDETELLA PERTUSSIS	PQPGPQPPQPPQPQP	1976	ABO77783.1
1094	MEASLES VIRUS STRAIN EDMONSTON	QDPQDSRRSAEPLLSCKPWQ	1977	P04851.1
1095	MEASLES VIRUS STRAIN EDMONSTON	QRRVVGEFRLERKWLDVVR	1978	P04851.1
1096	BORDETELLA PERTUSSIS	RELSA	1979	ABO77783.1
1097	BORDETELLA PERTUSSIS	RFAPQ	1980	ABO77783.1
1098	MEASLES VIRUS STRAIN EDMONSTON	SIQNKFSAGSYPLLWSYAMG	1981	P04851.1
1099	BORDETELLA PERTUSSIS	SITLQAGAH	1982	ABO77783.1
1100	BORDETELLA PERTUSSIS	SLQPED	1983	ABO77783.1
1101	BORDETELLA PERTUSSIS	SNALSKRL	1984	ABO77783.1
1102	MEASLES VIRUS STRAIN EDMONSTON	SPGQLIQRITDDPDVSIRLL	1985	P04851.1
1103	BORDETELLA PERTUSSIS	TELPSIPG	1986	ABO77783.1
1104	BORDETELLA PERTUSSIS	TFTLANK	1987	ABO77783.1
1105	BORDETELLA PERTUSSIS	TWDDD	1988	ABO77783.1
1106	MEASLES VIRUS STRAIN EDMONSTON	VSFLQGDQSENELPRLGGKE	1989	P04851.1
1107	MEASLES VIRUS STRAIN EDMONSTON	WQESRKNKAQTRTPLQC	1990	P04851.1
1108	MEASLES VIRUS STRAIN EDMONSTON	YAMGVGVELENSMGGLNFGR	1991	P04851.1
1109	MEASLES VIRUS STRAIN EDMONSTON	YQQMGKPAPYMVNLENSI	1992	P04851.1
1110	MEASLES VIRUS STRAIN HALLE	MTRSSHQSLVIKLMP	1993	P69355.1
1111	MEASLES VIRUS STRAIN HALLE	PIRDALNAMTQNIRP	1994	P69355.1
1112	RUBELLA VIRUS STRAIN M33	ALLNTPPPYQVSCGGESDRASAGH	1995	CAA28880.1
1113	RUBELLA VIRUS STRAIN THERIEN	GLGSPNCHGPDWASPVCQRHS	1996	P07566.1
1114	RUBELLA VIRUS STRAIN THERIEN	GLGSPNCHGPDWASPVCQRHSPDCSRLV	1997	P07566.1
1115	RUBELLA VIRUS STRAIN THERIEN	NYTGNQQSRWGLGSPNCHGPDWASPV	1998	P07566.1
1116	RUBELLA VIRUS STRAIN THERIEN	TLPQPPCAHGQHYGHHHHQL	1999	P07566.1
1117	RUBELLA VIRUS STRAIN THERIEN	TVRVKFHTETRTVWQLSVAGVSCNVT	2000	P07566.1
1118	RUBELLA VIRUS	ASYFNPGGSYYKQYH	2001	BAA28178.1
1119	RUBELLA VIRUS	FALASYVQHPHKTVR	2002	BAA28178.1
1120	RUBELLA VIRUS	GGESDRASARVIDPAAQSFIG	2003	BAA28178.1
1121	RUBELLA VIRUS	GPGEVWVTPVIGSQARKC	2004	BAA28178.1
1122	RUBELLA VIRUS	GSQARKCGLHIRAG	2005	BAA28178.1
1123	RUBELLA VIRUS	LVGATPERPRLRLVDADDPLLRTAP	2006	BAA28178.1
1124	RUBELLA VIRUS	TAPGPGEVWVTPVI	2007	BAA28178.1
1125	MEASLES MORBILLIVIRUS	FIVLSIAYPTLSEIK	2008	AAL29688.1
1126	MEASLES VIRUS STRAIN EDMONSTON- ZAGREB		2009	P08362.1
1127	MEASLES MORBILLIVIRUS	LPRLGGKEDR	2010	P04851.1
1128	MEASLES MORBILLIVIRUS	MSKTEWNASQ	2011	SRC280080
1129	MEASLES MORBILLIVIRUS	SRFGWFENKE	2012	P04851.1
1130	RUBELLA VIRUS		2013	CAA28880.1
1131	RUBELLA VIRUS	MDFWCVEHDRPPPATPTSLTT	2014	CAA33016.1
1132	RUBELLA VIRUS	PFLGHDGHHGGTLRVGQHHRNASDV	2015	CAA33016.1
1133	RUBELLA VIRUS	RVKFHTETRTVWQLSVAGVSC	2016	BAA19893.1
1134	MEASLES MORBILLIVIRUS	AEEQARHVKNGLE	2017	ABO69699.1
1135	MEASLES MORBILLIVIRUS	ESPQEISKHQALG	2018	SRC280080
1136	MEASLES MORBILLIVIRUS	GVGVELENSMGGLNF	2019	ABI54110.1
1137	MEASLES MORBILLIVIRUS	IKGANDLAKFHQMLMKIIMK	2020	ABO69699.1
1138	MEASLES MORBILLIVIRUS	MSKTLHAQLGFKKT	2021	ABK40528.1
1139	MEASLES MORBILLIVIRUS	NASGLSRPSPSAH	2022	BAE98296.1
1140	MEASLES MORBILLIVIRUS	VRVIDPSLGDRKDE	2023	SRC280148
1141	BORDETELLA PERTUSSIS	DLSDGDLLV	2024	AAC31207.1
1142	BORDETELLA PERTUSSIS	EAERAGRGTG	2025	ACI04548.1
1143	BORDETELLA PERTUSSIS	YRYDSRPPEDV	2026	ACI04548.1
1144	BORDETELLA PERTUSSIS	YVDTYGDNAG	2027	ACI04548.1
1145	MEASLES MORBILLIVIRUS	SFSYFYPFR	2028	CAB43772.1
1146	MUMPS RUBULAVIRUS	DIFIVSPR	2029	ADF49557.1
1147	MEASLES MORBILLIVIRUS		2030	CAA59302.1
1148	MEASLES MORBILLIVIRUS	SAEALLRLQA	2031	BAH22350.1
1149	MEASLES MORBILLIVIRUS	RIVINREHL	2032	BAB39835.1
1150	MEASLES VIRUS GENOTYPE A	IPRFK	2033	BAB39848.1
1151	BORDETELLA PERTUSSIS	AAALSPMEI	2034	P15318.2
1152	BORDETELLA PERTUSSIS	AAASVVGAPV	2035	P15318.2
1153	BORDETELLA PERTUSSIS	AALGRQDSI	2036	P15318.2
1154	BORDETELLA PERTUSSIS	AAQRLVHA1A	2037	P15318.2
1155	BORDETELLA PERTUSSIS	AAVEAAEL	2038	P15318.2
1156	BORDETELLA PERTUSSIS	AGANVLNGL	2039	P15318.2
1157	BORDETELLA PERTUSSIS	AGYANAAD	2040	P15318.2
1158	BORDETELLA PERTUSSIS	AGYEQFEFRV	2041	P15318.2
1159	BORDETELLA PERTUSSIS	AITGNADNL	2042	P15318.2
1160	BORDETELLA PERTUSSIS	AKEKNATLM	2043	P15318.2
1161	BORDETELLA PERTUSSIS	AKGVFLSL	2044	P15318.2
1162	BORDETELLA PERTUSSIS	APHEYGFGI	2045	P15318.2
1163	BORDETELLA PERTUSSIS	ARQGNDLEI	2046	P15318.2
1164	BORDETELLA PERTUSSIS	ASVVGAPV	2047	P15318.2
1165	BORDETELLA PERTUSSIS	ATLMFRLV	2048	P15318.2
1166	BORDETELLA PERTUSSIS	AVAAAQRL	2049	P15318.2
1167	BORDETELLA PERTUSSIS	DAGANVLNGL	2050	P15318.2
1168	BORDETELLA PERTUSSIS	DALLAQLYR	2051	P15318.2
1169	BORDETELLA PERTUSSIS	DANGVLKHSI	2052	P15318.2
1170	BORDETELLA PERTUSSIS	DGDMNIGVI	2053	P15318.2
1171	BORDETELLA PERTUSSIS	DHVKNlENL	2054	P15318.2
1172	BORDETELLA PERTUSSIS	DIDMFAIM	2055	P15318.2
1173	BORDETELLA PERTUSSIS	DMFAIMPHL	2056	P15318.2
1174	BORDETELLA PERTUSSIS	DNVRNVENV	2057	P15318.2
1175	BORDETELLA PERTUSSIS	DNVRNVENVI	2058	P15318.2
1176	BORDETELLA PERTUSSIS	DTVDYSAM	2059	P15318.2
1177	BORDETELLA PERTUSSIS	DTVDYSAMI	2060	P15318.2
1178	BORDETELLA PERTUSSIS	DYLRQAGL	2061	P15318.2
1179	BORDETELLA PERTUSSIS	DYYDNVRNV	2062	P15318.2
1180	BORDETELLA PERTUSSIS	EFTTFVEI	2063	P15318.2
1181	BORDETELLA PERTUSSIS	EFTTFVEIV	2064	P15318.2
1182	BORDETELLA PERTUSSIS	EGYVFYEN	2065	P15318.2
1183	BORDETELLA PERTUSSIS	ENVQYRHV	2066	P15318.2
1184	BORDETELLA PERTUSSIS	EQLANSDGL	2067	P15318.2
1185	BORDETELLA PERTUSSIS	FGVGYGHDTI	2068	P15318.2
1186	BORDETELLA PERTUSSIS	FSPDVLETVP	2069	P15318.2
1187	BORDETELLA PERTUSSIS	FSVDHVKNI	2070	P15318.2
1188	BORDETELLA PERTUSSIS	GDDTYLFGV	2071	P15318.2
1189	BORDETELLA PERTUSSIS	GDDVFLQDL	2072	P15318.2
1190	BORDETELLA PERTUSSIS	GEDGNDIFL	2073	P15318.2
1191	BORDETELLA PERTUSSIS	GERFNVRKQL	2074	P15318.2
1192	BORDETELLA PERTUSSIS	GGAGNDTLV	2075	P15318.2
1193	BORDETELLA PERTUSSIS	GGDDFEAV	2076	P15318.2
1194	BORDETELLA PERTUSSIS	GKSEFTTFV	2077	P15318.2
1195	BORDETELLA PERTUSSIS	GKSLFDDGL	2078	P15318.2
1196	BORDETELLA PERTUSSIS	GNADNLKSV	2079	P15318.2
1197	BORDETELLA PERTUSSIS	GQLVEVDTL	2080	P15318.2
1198	BORDETELLA PERTUSSIS	GRSKFSPDV	2081	P15318.2
1199	BORDETELLA PERTUSSIS	GSSAYDTV	2082	P15318.2
1200	BORDETELLA PERTUSSIS	GTVEKWPAL	2083	P15318.2
1201	BORDETELLA PERTUSSIS	GVDYYDNV	2084	P15318.2
1202	BORDETELLA PERTUSSIS	GYEQFEFRV	2085	P15318.2
1203	BORDETELLA PERTUSSIS	HAVGAQDVV	2086	P15318.2
1204	BORDETELLA PERTUSSIS	IAAGRIGLG1	2087	P15318.2
1205	BORDETELLA PERTUSSIS	IGDAQANTL	2088	P15318.2
1206	BORDETELLA PERTUSSIS	IGLGILADL	2089	P15318.2
1207	BORDETELLA PERTUSSIS	IGNAAGIPL	2090	P15318.2
1208	BORDETELLA PERTUSSIS	IGTSMKDVL	2091	P15318.2
1209	BORDETELLA PERTUSSIS	IGVITDFEL	2092	P15318.2
1210	BORDETELLA PERTUSSIS	IPLTADIDM	2093	P15318.2
1211	BORDETELLA PERTUSSIS	ISKSALEL	2094	P15318.2
1212	BORDETELLA PERTUSSIS	ITGNADNL	2095	P15318.2
1213	BORDETELLA PERTUSSIS	KIFVVSAT	2096	P15318.2
1214	BORDETELLA PERTUSSIS	KQLNNANVYR	2097	P15318.2
1215	BORDETELLA PERTUSSIS	KVIGNAAGI	2098	P15318.2
1216	BORDETELLA PERTUSSIS	LAKVVSQL	2099	P15318.2
1217	BORDETELLA PERTUSSIS	LANDYARKI	2100	P15318.2
1218	BORDETELLA PERTUSSIS	LDYLRQAGL	2101	P15318.2
1219	BORDETELLA PERTUSSIS	LGKGFASL	2102	P15318.2
1220	BORDETELLA PERTUSSIS	LGKGFASLM	2103	P15318.2
1221	BORDETELLA PERTUSSIS	LGVDYYDN	2104	P15318.2
1222	BORDETELLA PERTUSSIS	LGVDYYDNV	2105	P15318.2
1223	BORDETELLA PERTUSSIS	LKHSIKLDVI	2106	P15318.2
1224	BORDETELLA PERTUSSIS	LQAGYIPV	2107	P15318.2
1225	BORDETELLA PERTUSSIS	LQLTGGTVE	2108	P15318.2
1226	BORDETELLA PERTUSSIS	LSAAVFGL	2109	P15318.2
1227	BORDETELLA PERTUSSIS	LSLGKGFASL	2110	P15318.2
1228	BORDETELLA PERTUSSIS	LSPMEIYGL	2111	P15318.2
1229	BORDETELLA PERTUSSIS	NAHDNFLAGG	2112	P15318.2
1230	BORDETELLA PERTUSSIS	NANVYREGV	2113	P15318.2
1231	BORDETELLA PERTUSSIS	NDTLYGGL	2114	P15318.2
1232	BORDETELLA PERTUSSIS	NGLAGNDVL	2115	P15318.2
1233	BORDETELLA PERTUSSIS	NNANVYREGV	2116	P15318.2
1234	BORDETELLA PERTUSSIS	NTVSYAAL	2117	P15318.2
1235	BORDETELLA PERTUSSIS	NVLRNIENAV	2118	P15318.2
1236	BORDETELLA PERTUSSIS	PALTFITPL	2119	P15318.2
1237	BORDETELLA PERTUSSIS	PETSNVLRNI	2120	P15318.2
1238	BORDETELLA PERTUSSIS	PMEIYGLV	2121	P15318.2
1239	BORDETELLA PERTUSSIS	PQAYFEKNL	2122	P15318.2
1240	BORDETELLA PERTUSSIS	PVNPNLSKL	2123	P15318.2
1241	BORDETELLA PERTUSSIS	QAGWNASSV	2124	P15318.2
1242	BORDETELLA PERTUSSIS	QAGWNASSVI	2125	P15318.2
1243	BORDETELLA PERTUSSIS	QDAANAGNL	2126	P15318.2
1244	BORDETELLA PERTUSSIS	QDAANAGNLL	2127	P15318.2
1245	BORDETELLA PERTUSSIS	QDSGYDSL	2128	P15318.2
1246	BORDETELLA PERTUSSIS	QQSHYADQL	2129	P15318.2
1247	BORDETELLA PERTUSSIS	RALQGAQAV	2130	P15318.2
1248	BORDETELLA PERTUSSIS	RGGLGLDTL	2131	P15318.2
1249	BORDETELLA PERTUSSIS	RKQLNNANV	2132	P15318.2
1250	BORDETELLA PERTUSSIS	RQDSGYDSL	2133	P15318.2
1251	BORDETELLA PERTUSSIS	RQFRYDGDM	2134	P15318.2
1252	BORDETELLA PERTUSSIS	RSKFSPDVL	2135	P15318.2
1253	BORDETELLA PERTUSSIS	SAGAAAGAL	2136	P15318.2
1254	BORDETELLA PERTUSSIS	SAHWGQRAL	2137	P15318.2
1255	BORDETELLA PERTUSSIS	SAMIHPGRI	2138	P15318.2
1256	BORDETELLA PERTUSSIS	SAMIHPGRIV	2139	P15318.2
1257	BORDETELLA PERTUSSIS	SAYDTVSGI	2140	P15318.2
1258	BORDETELLA PERTUSSIS	SAYGYEGD	2141	P15318.2
1259	BORDETELLA PERTUSSIS	SGGAGDDVL	2142	P15318.2
1260	BORDETELLA PERTUSSIS	SGLQVAGA	2143	P15318.2
1261	BORDETELLA PERTUSSIS	SGYDSLDGV	2144	P15318.2
1262	BORDETELLA PERTUSSIS	SLLTGALNGI	2145	P15318.2
1263	BORDETELLA PERTUSSIS	SPMEIYGL	2146	P15318.2
1264	BORDETELLA PERTUSSIS	SQMLTRGQL	2147	P15318.2
1265	BORDETELLA PERTUSSIS	SSAYDTVSGI	2148	P15318.2
1266	BORDETELLA PERTUSSIS	SSLAHGHTA	2149	P15318.2
1267	BORDETELLA PERTUSSIS	SSVTSGDSV	2150	P15318.2
1268	BORDETELLA PERTUSSIS	SVIGVQTTEI	2151	P15318.2
1269	BORDETELLA PERTUSSIS	TNTVSYAAL	2152	P15318.2
1270	BORDETELLA PERTUSSIS	TSLIAEGV	2153	P15318.2
1271	BORDETELLA PERTUSSIS	TSLLTGAL	2154	P15318.2
1272	BORDETELLA PERTUSSIS	TVPASPGL	2155	P15318.2
1273	BORDETELLA PERTUSSIS	VAKEKNATL	2156	P15318.2
1274	BORDETELLA PERTUSSIS	VAPHEYGFGI	2157	P15318.2
1275	BORDETELLA PERTUSSIS	VAVVTSLL	2158	P15318.2
1276	BORDETELLA PERTUSSIS	VFYENRAYG	2159	P15318.2
1277	BORDETELLA PERTUSSIS	VFYENRAYGV	2160	P15318.2
1278	BORDETELLA PERTUSSIS	VITDFELEV	2161	P15318.2
1279	BORDETELLA PERTUSSIS	VNPHSTSL	2162	P15318.2
1280	BORDETELLA PERTUSSIS	VNPHSTSLI	2163	P15318.2
1281	BORDETELLA PERTUSSIS	VNPNLSKL	2164	P15318.2
1282	BORDETELLA PERTUSSIS	VNPNLSKLF	2165	P15318.2
1283	BORDETELLA PERTUSSIS	VQQPIIEKL	2166	P15318.2
1284	BORDETELLA PERTUSSIS	VQYRHVEL	2167	P15318.2
1285	BORDETELLA PERTUSSIS	VSIAAAASV	2168	P15318.2
1286	BORDETELLA PERTUSSIS	VSIAAAASVV	2169	P15318.2
1287	BORDETELLA PERTUSSIS	VTSLLTGAL	2170	P15318.2
1288	BORDETELLA PERTUSSIS	VVLANASRI	2171	P15318.2
1289	BORDETELLA PERTUSSIS	WPALNLFSV	2172	P15318.2
1290	BORDETELLA PERTUSSIS	WVRKASAL	2173	P15318.2
1291	BORDETELLA PERTUSSIS	YAVQYRRKGG	2174	P15318.2
1292	BORDETELLA PERTUSSIS	YGGLGDDTL	2175	P15318.2
1293	BORDETELLA PERTUSSIS	YGLVQQSHYA	2176	P15318.2
1294	BORDETELLA PERTUSSIS	YGYEGDALL	2177	P15318.2
1295	BORDETELLA PERTUSSIS	YIPVNPNL	2178	P15318.2
1296	BORDETELLA PERTUSSIS	YSAMIHPGRI	2179	P15318.2
1297	BORDETELLA PERTUSSIS	YSQTGAHAGI	2180	P15318.2
1298	CORYNEBACTERIU M DIPHTHERIAE	AYNFVESIINLFQVVHNSYN	2181	CAE11230.1
1299	BORDETELLA PERTUSSIS	SGTTIK	2182	BAF35031.1
1300	BORDETELLA PERTUSSIS	RGHTLESAEGRKIFG	2183	AAA22974.1
1301	BORDETELLA PERTUSSIS	AGAMTVRDVAAAADLALQAGDA	2184	AAA22974.1
1302	BORDETELLA PERTUSSIS	AGAMTVRDVAAAADLALQAGDAL	2185	AAA22974.1
1303	BORDETELLA PERTUSSIS		2186	AAA22974.1
1304	BORDETELLA PERTUSSIS	ALSIDSMTALGA	2187	AAA22974.1
1305	BORDETELLA PERTUSSIS	DLSAARGADISGEGR	2188	AAA22974.1
1306	BORDETELLA PERTUSSIS	DQNRYEYIWGLY	2189	AAA22974.1
1307	BORDETELLA PERTUSSIS	DYTVSADAIALA	2190	AAA22974.1
1308	BORDETELLA PERTUSSIS	GPIVVEAGELVSHAGG	2191	AAA22974.1
1309	BORDETELLA PERTUSSIS	GRPEGLKIGAHSATSVSGSFDAL	2192	AAA22974.1
1310	BORDETELLA PERTUSSIS	ITVTSRGGFDNEGKMESNK	2193	AAA22974.1
1311	BORDETELLA PERTUSSIS	LDQNRYEYIWGLYP	2194	AAA22974.1
1312	BORDETELLA PERTUSSIS	LSAARGADISG	2195	AAA22974.1
1313	BORDETELLA PERTUSSIS	NKIRLMGPLQ	2196	AAA22974.1
1314	BORDETELLA PERTUSSIS	NKLGRIRAGEDM	2197	AAA22974.1
1315	BORDETELLA PERTUSSIS	NKLGRIRAGEDMHLDAPRIE	2198	AAA22974.1
1316	BORDETELLA PERTUSSIS	PHLRNTGQVVAG	2199	AAA22974.1
1317	BORDETELLA PERTUSSIS	QVDLHDLSAARGADISG	2200	AAA22974.1
1318	BORDETELLA PERTUSSIS	RDVAAAADLALQ	2201	AAA22974.1
1319	BORDETELLA PERTUSSIS	SAARGADISGEG	2202	AAA22974.1
1320	BORDETELLA PERTUSSIS	TKGEMQIAGKGGGSP	2203	AAA22974.1
1321	BORDETELLA PERTUSSIS	TVSADAIALAAQ	2204	AAA22974.1
1322	BORDETELLA PERTUSSIS	VVAGHDIHI	2205	AAA22974.1
1323	BORDETELLA PERTUSSIS	PSGPNHTKVVQLPKISKNALKANG	2206	CAD12823.1
1324	RUBELLA VIRUS		2207	BAA19902.1
1325	RUBELLA VIRUS	QQSRWGLGSPNCHGPDWASPVCQRHSP	2208	BAA19902.1
1326	BORDETELLA PERTUSSIS	AGEAMVLVYYESIAYSF	2209	ACI04548.1
1327	BORDETELLA PERTUSSIS	GGVGLASTLWYAESNALSKRLGEL	2210	AAZ74322.1
1328	BORDETELLA PERTUSSIS	GTLVRIAPVIGACMARQA	2211	ACI04548.1
1329	BORDETELLA PERTUSSIS	IRRVTRVYHNGITGETTT	2212	ACI04548.1
1330	BORDETELLA PERTUSSIS	IVKTGERQHGIHIQGSDP	2213	AAZ74322.1
1331	BORDETELLA PERTUSSIS	IVKTGERQHGIHIQGSDPGGVRTA	2214	AAZ74338.1
1332	BORDETELLA PERTUSSIS	LRDTNVTAVPASGAPAAVSVLGAS	2215	AAZ74338.1
1333	BORDETELLA PERTUSSIS	PEAPAPQPPAGRELSAAANAAVNT	2216	AAZ74322.1
1334	BORDETELLA PERTUSSIS	AAADFAHAE	2217	WP_019247158.1
1335	BORDETELLA PERTUSSIS	AAAEVAGAL	2218	WP_019249248.1
1336	BORDETELLA PERTUSSIS	AAESTFESY	2219	WP_019247158.1
1337	BORDETELLA PERTUSSIS	AAGFDPEVQ	2220	WP_019248145.1
1338	BORDETELLA PERTUSSIS	AALGRGHSL	2221	AGS56996.1
1339	BORDETELLA PERTUSSIS	AAMQGAVVH	2222	AGT50936.1
1340	BORDETELLA PERTUSSIS	AAPAAHADW	2223	AGS56996.1
1341	BORDETELLA PERTUSSIS	AAQATVVQR	2224	WP_019247158.1
1342	BORDETELLA PERTUSSIS	AARVAGDNY	2225	WP_019249248.1
1343	BORDETELLA PERTUSSIS	AAVALLNKL	2226	WP_019249248.1
1344	BORDETELLA PERTUSSIS	ADDPPATVY	2227	AAW72734.1
1345	BORDETELLA PERTUSSIS	AEAGRFKVL	2228	AGS56996.1
1346	BORDETELLA PERTUSSIS	AEATQLVTA	2229	WP_019247158.1
1347	BORDETELLA PERTUSSIS	AEGGATLGA	2230	WP_019249248.1
1348	BORDETELLA PERTUSSIS	AEHGEVSIQ	2231	WP_019249248.1
1349	BORDETELLA PERTUSSIS	AEIAFYPKE	2232	WP_019249248.1
1350	BORDETELLA PERTUSSIS	AEKVTTPAV	2233	WP_019247158.1
1351	BORDETELLA PERTUSSIS	AELQTYLRQ	2234	1BCP_C
1352	BORDETELLA PERTUSSIS	AEQSLIEVG	2235	WP_019249248.1
1353	BORDETELLA PERTUSSIS	AESNALSKR	2236	AGS56996.1
1354	BORDETELLA PERTUSSIS	AESSEAMAA	2237	AFK26302.1
1355	BORDETELLA PERTUSSIS	AEVKVGYRA	2238	WP_019247158.1
1356	BORDETELLA PERTUSSIS	AEVTDTSPS	2239	WP_019249248.1
1357	BORDETELLA PERTUSSIS	AGKSLKKKN	2240	WP_019247158.1
1358	BORDETELLA PERTUSSIS	AGLAGPSAV	2241	WP_019249248.1
1359	BORDETELLA PERTUSSIS	AIRVGRGAR	2242	AGT50936.1
1360	BORDETELLA PERTUSSIS	ALAAIASAA	2243	WP_019248145.1
1361	BORDETELLA PERTUSSIS	ALADVPYVL	2244	AAA22983.1
1362	BORDETELLA PERTUSSIS	ALANDGTIV	2245	WP_019248658.1
1363	BORDETELLA PERTUSSIS	ALGRGHSLY	2246	AGS56996.1
1364	BORDETELLA PERTUSSIS	ALILAASPV	2247	WP_019248658.1
1365	BORDETELLA PERTUSSIS	ALMLACTGL	2248	AAA22974.1
1366	BORDETELLA PERTUSSIS	AMQGAVVHL	2249	AGT50936.1
1367	BORDETELLA PERTUSSIS	AMTHLSPAL	2250	AAA22983.1
1368	BORDETELLA PERTUSSIS	AMYGKHITL	2251	WP_019249248.1
1369	BORDETELLA PERTUSSIS	ANEANALLW	2252	WP_019249248.1
1370	BORDETELLA PERTUSSIS	APLSITLQA	2253	AGT50936.1
1371	BORDETELLA PERTUSSIS	APNALAWAL	2254	AAA22974.1
1372	BORDETELLA PERTUSSIS	APPAPKPAP	2255	AGS56996.1
1373	BORDETELLA PERTUSSIS	APPGAGFIY	2256	1BCP_C
1374	BORDETELLA PERTUSSIS	APQAAPLSI	2257	AGT50936.1
1375	BORDETELLA PERTUSSIS	APRIENTAK	2258	WP_019249248.1
1376	BORDETELLA PERTUSSIS	AQGKALLYR	2259	AGT50936.1
1377	BORDETELLA PERTUSSIS	AQITSYVGF	2260	WP_019248658.1
1378	BORDETELLA PERTUSSIS	AQLEVRGQR	2261	WP_019249248.1
1379	BORDETELLA PERTUSSIS	AQQLKQADR	2262	WP_019247699.1
1380	BORDETELLA PERTUSSIS	AQVTVAGRY	2263	WP_019249248.1
1381	BORDETELLA PERTUSSIS	ARRSRVRAL	2264	NP_882284.1
1382	BORDETELLA PERTUSSIS	ASPRRARRA	2265	WP_019249248.1
1383	BORDETELLA PERTUSSIS	ASSPDAHVP	2266	AAA22983.1
1384	BORDETELLA PERTUSSIS	ASVSNPGTF	2267	WP_019249248.1
1385	BORDETELLA PERTUSSIS	ATWNFQSTY	2268	WP_019249248.1
1386	BORDETELLA PERTUSSIS	ATYIADSGF	2269	AGS56996.1
1387	BORDETELLA PERTUSSIS	AVAAPAVGA	2270	WP_019249248.1
1388	BORDETELLA PERTUSSIS	AVFMQQRPL	2271	AAA22983.1
1389	BORDETELLA PERTUSSIS	AVLVNPHIF	2272	WP_019249248.1
1390	BORDETELLA PERTUSSIS	CFGKDLKRP	2273	AAA22983.1
1391	BORDETELLA PERTUSSIS	CPSSLGNGV	2274	WP_019248145.1
1392	BORDETELLA PERTUSSIS	DAGHEHDTW	2275	AAA22984.1
1393	BORDETELLA PERTUSSIS	DAKHDLTVT	2276	WP_019249248.1
1394	BORDETELLA PERTUSSIS	DASGQHRLW	2277	AGS56996.1
1395	BORDETELLA PERTUSSIS	DATFETYAL	2278	YP_006628018.1
1396	BORDETELLA PERTUSSIS	DATFQTYAL	2279	1BCP_C
1397	BORDETELLA PERTUSSIS	DATLVGAKF	2280	WP_019247158.1
1398	BORDETELLA PERTUSSIS	DDEVDVSGR	2281	AAA22974.1
1399	BORDETELLA PERTUSSIS	DENGKPQTY	2282	WP_019247158.1
1400	BORDETELLA PERTUSSIS	DGPPSRPTT	2283	WP_019247158.1
1401	BORDETELLA PERTUSSIS	DHLTGRSCQ	2284	AAW72734.1
1402	BORDETELLA PERTUSSIS	DNEGKMESN	2285	WP_019249248.1
1403	BORDETELLA PERTUSSIS	DPPATVYRY	2286	AAW72734.1
1404	BORDETELLA PERTUSSIS	EATEGDATL	2287	WP_019247158.1
1405	BORDETELLA PERTUSSIS	EATQQAAGF	2288	WP_019248145.1
1406	BORDETELLA PERTUSSIS	ECSGKQDCP	2289	AAA22983.1
1407	BORDETELLA PERTUSSIS	EGGKLRGKD	2290	AAA22974.1
1408	BORDETELLA PERTUSSIS	EGKMESNKD	2291	WP_019249248.1
1409	BORDETELLA PERTUSSIS	EHRMQEAVE	2292	AAW72734.1
1410	BORDETELLA PERTUSSIS	EKRLDIDDA	2293	WP_019249248.1
1411	BORDETELLA PERTUSSIS	EPASANTLL	2294	AGS56996.1
1412	BORDETELLA PERTUSSIS	EPQAELAVF	2295	AGS56996.1
1413	BORDETELLA PERTUSSIS	EPVKLTLTG	2296	AGT50936.1
1414	BORDETELLA PERTUSSIS	ESAEGRKIF	2297	WP_019249248.1
1415	BORDETELLA PERTUSSIS	ESYSESHNF	2298	WP_019247158.1
1416	BORDETELLA PERTUSSIS	ETFCITTIY	2299	1BCP_C
1417	BORDETELLA PERTUSSIS	EVAGALELS	2300	WP_019249248.1
1418	BORDETELLA PERTUSSIS	EVAKVEVVP	2301	WP_019247158.1
1419	BORDETELLA PERTUSSIS	EVDGIIQEF	2302	WP_019249248.1
1420	BORDETELLA PERTUSSIS	EVRADNNFY	2303	WP_019248344.1
1421	BORDETELLA PERTUSSIS	FAILSSTTE	2304	WP_019247158.1
1422	BORDETELLA PERTUSSIS	FAISAYALK	2305	AAA22984.1
1423	BORDETELLA PERTUSSIS	FALYDGTYL	2306	AFK26303.1
1424	BORDETELLA PERTUSSIS	FDTMLGFAI	2307	AAA22984.1
1425	BORDETELLA PERTUSSIS	FEGKPALEL	2308	AAA22983.1
1426	BORDETELLA PERTUSSIS	FELGADHAV	2309	AGS56996.1
1427	BORDETELLA PERTUSSIS	FEPGITTNY	2310	WP_019248658.1
1428	BORDETELLA PERTUSSIS	FETYALTGI	2311	YP_006628018.1
1429	BORDETELLA PERTUSSIS	F1YRETFC1	2312	1BCP_C
1430	BORDETELLA PERTUSSIS	FPTRTTAPG	2313	NP_882284.1
1431	BORDETELLA PERTUSSIS	FQTYALTGI	2314	1BCP_C
1432	BORDETELLA PERTUSSIS	FTHADGWFL	2315	AGS56996.1
1433	BORDETELLA PERTUSSIS	FVRDGQSVI	2316	1BCP_C
1434	BORDETELLA PERTUSSIS	FVRSGQPVI	2317	YP_006628018.1
1435	BORDETELLA PERTUSSIS	FVWYVDTVI	2318	WP_019248866.1
1436	BORDETELLA PERTUSSIS	GAASSRQAL	2319	WP_019249248.1
1437	BORDETELLA PERTUSSIS	GAASSYFEY	2320	AAW72734.1
1438	BORDETELLA PERTUSSIS	GAFDLKTTF	2321	AFK26303.1
1439	BORDETELLA PERTUSSIS	GAPAAVSVL	2322	AGS56996.1
1440	BORDETELLA PERTUSSIS	GATRAVDSL	2323	AGS56996.1
1441	BORDETELLA PERTUSSIS	GAVPGGAVP	2324	AGT50936.1
1442	BORDETELLA PERTUSSIS	GEAMVLVYY	2325	AFK26302.1
1443	BORDETELLA PERTUSSIS	GEIALGDAT	2326	WP_019249248.1
1444	BORDETELLA PERTUSSIS	GELMAAQVA	2327	WP_019247158.1
1445	BORDETELLA PERTUSSIS	GGVPGGAVP	2328	AAZ74338.1
1446	BORDETELLA PERTUSSIS	GHEHDTWFD	2329	AAA22984.1
1447	BORDETELLA PERTUSSIS	GIGALKAGA	2330	WP_019249248.1
1448	BORDETELLA PERTUSSIS	GIVIPPKAL	2331	1BCP_C
1449	BORDETELLA PERTUSSIS	GKDLKRPGS	2332	AAA22983.1
1450	BORDETELLA PERTUSSIS	GKLPKPVTV	2333	WP_019247158.1
1451	BORDETELLA PERTUSSIS	GKSLKKKNQ	2334	WP_019247158.1
1452	BORDETELLA PERTUSSIS	GLDVQQGTV	2335	WP_019249248.1
1453	BORDETELLA PERTUSSIS	GLTDGVSRI	2336	WP_019249248.1
1454	BORDETELLA PERTUSSIS	GLYPTYTEW	2337	WP_019249248.1
1455	BORDETELLA PERTUSSIS	GLYQTYTEW	2338	YP_006626470.1
1456	BORDETELLA PERTUSSIS	GPPSRPTTP	2339	WP_019247158.1
1457	BORDETELLA PERTUSSIS	GPSAVAAPA	2340	WP_019249248.1
1458	BORDETELLA PERTUSSIS	GVAPTAQQL	2341	WP_019248866.1
1459	BORDETELLA PERTUSSIS	GVGLASTLW	2342	AGS56996.1
1460	BORDETELLA PERTUSSIS	GYEAGFSLG	2343	WP_019247158.1
1461	BORDETELLA PERTUSSIS	HADDGTIVI	2344	WP_019248145.1
1462	BORDETELLA PERTUSSIS	HADWNNQSI	2345	AGS56996.1
1463	BORDETELLA PERTUSSIS	HAEHEKDVR	2346	WP_019247158.1
1464	BORDETELLA PERTUSSIS	HANHYGTRI	2347	WP_019247158.1
1465	BORDETELLA PERTUSSIS	HAQGKALLY	2348	AGT50936.1
1466	BORDETELLA PERTUSSIS	HFIGYIYEV	2349	AAW72734.1
1467	BORDETELLA PERTUSSIS	HLSPALADV	2350	AAA22983.1
1468	BORDETELLA PERTUSSIS	HSLYASYEY	2351	AGS56996.1
1469	BORDETELLA PERTUSSIS	HVRGMLVPV	2352	AAA22974.1
1470	BORDETELLA PERTUSSIS	HVSKEEQYY	2353	YP_006628018.1
1471	BORDETELLA PERTUSSIS	HVTRGWSIF	2354	AFK26303.1
1472	BORDETELLA PERTUSSIS	IADSGFYLD	2355	AGS56996.1
1473	BORDETELLA PERTUSSIS	IAHRTELRG	2356	AGS56996.1
1474	BORDETELLA PERTUSSIS	IENTAKLSG	2357	WP_019249248.1
1475	BORDETELLA PERTUSSIS	IESKISQSV	2358	WP_019249248.1
1476	BORDETELLA PERTUSSIS	IETGGARRF	2359	AGT50936.1
1477	BORDETELLA PERTUSSIS	IIKDAPPGA	2360	1BCP_C
1478	BORDETELLA PERTUSSIS	IIQEFAADL	2361	WP_019249248.1
1479	BORDETELLA PERTUSSIS	ILAGALATY	2362	AAW72734.1
1480	BORDETELLA PERTUSSIS	ILLENPAAE	2363	AGS56996.1
1481	BORDETELLA PERTUSSIS	ILPILVLAL	2364	NP_882286.1
1482	BORDETELLA PERTUSSIS	IPFQRALRL	2365	WP_019248145.1
1483	BORDETELLA PERTUSSIS	ISVRVHVSK	2366	YP_006628018.1
1484	BORDETELLA PERTUSSIS	ITNETGKTY	2367	WP_019247158.1
1485	BORDETELLA PERTUSSIS	ITNKRAALI	2368	WP_019249248.1
1486	BORDETELLA PERTUSSIS	ITSYVGFSV	2369	WP_019248658.1
1487	BORDETELLA PERTUSSIS	ITVTSRGGF	2370	WP_019249248.1
1488	BORDETELLA PERTUSSIS	IVIPPKALF	2371	1BCP_C
1489	BORDETELLA PERTUSSIS	IVVEAGELV	2372	WP_019249248.1
1490	BORDETELLA PERTUSSIS	KAAKSVNLM	2373	WP_019247158.1
1491	BORDETELLA PERTUSSIS	KAAPLRRTT	2374	AGS56996.1
1492	BORDETELLA PERTUSSIS	KAGKLSATG	2375	WP_019249248.1
1493	BORDETELLA PERTUSSIS	KAGTIAAPW	2376	WP_019249248.1
1494	BORDETELLA PERTUSSIS	KAKSLTTEI	2377	WP_019249248.1
1495	BORDETELLA PERTUSSIS	KATVTTVQV	2378	WP_019247158.1
1496	BORDETELLA PERTUSSIS	KDYRDKDGG	2379	WP_019247158.1
1497	BORDETELLA PERTUSSIS	KEAATIVAA	2380	WP_019249248.1
1498	BORDETELLA PERTUSSIS	KEDVDAAQI	2381	WP_019248658.1
1499	BORDETELLA PERTUSSIS	KEVDGIIQE	2382	WP_019249248.1
1500	BORDETELLA PERTUSSIS	KGPKLAMPW	2383	AGS56996.1
1501	BORDETELLA PERTUSSIS	KLASGGGAV	2384	WP_019249248.1
1502	BORDETELLA PERTUSSIS	KLKGKNQEF	2385	AAA22984.1
1503	BORDETELLA PERTUSSIS	KLLHHILPI	2386	NP_882286.1
1504	BORDETELLA PERTUSSIS	KPAPQPGPQ	2387	AGS56996.1
1505	BORDETELLA PERTUSSIS	KPAPTAPPM	2388	WP_019249248.1
1506	BORDETELLA PERTUSSIS	KPAVSVKVA	2389	WP_019249248.1
1507	BORDETELLA PERTUSSIS	KPDRAARVA	2390	WP_019249248.1
1508	BORDETELLA PERTUSSIS	KPLADIAVI	2391	YP_006626470.1
1509	BORDETELLA PERTUSSIS	KPLADIAVV	2392	WP_019249248.1
1510	BORDETELLA PERTUSSIS	KPLPKPLPV	2393	WP_019247158.1
1511	BORDETELLA PERTUSSIS	KQADRDFVW	2394	WP_019247699.1
1512	BORDETELLA PERTUSSIS	KSLPGGKLP	2395	WP_019247158.1
1513	BORDETELLA PERTUSSIS	KSYTLRYLA	2396	WP_019248658.1
1514	BORDETELLA PERTUSSIS	KTNMVVTSV	2397	AAA22983.1
1515	BORDETELLA PERTUSSIS	KVLAPRLYL	2398	AAA22974.1
1516	BORDETELLA PERTUSSIS	KVLSTKTTL	2399	WP_019247158.1
1517	BORDETELLA PERTUSSIS	LAAGAGLTL	2400	WP_019249248.1
1518	BORDETELLA PERTUSSIS	LAAIASAAH	2401	WP_019248145.1
1519	BORDETELLA PERTUSSIS	LAANGNGQW	2402	AGS56996.1
1520	BORDETELLA PERTUSSIS	LAAQVTQRG	2403	WP_019249248.1
1521	BORDETELLA PERTUSSIS	LAARGDGAL	2404	AAA22974.1
1522	BORDETELLA PERTUSSIS	LAAVLVNPH	2405	WP_019249248.1
1523	BORDETELLA PERTUSSIS	LAGSGLFRM	2406	AGS56996.1
1524	BORDETELLA PERTUSSIS	LAKALSAAL	2407	WP_019249248.1
1525	BORDETELLA PERTUSSIS	LALQAGDAL	2408	WP_019249248.1
1526	BORDETELLA PERTUSSIS	LAMPWTFHA	2409	AGS56996.1
1527	BORDETELLA PERTUSSIS	LANDGTIVI	2410	WP_019248658.1
1528	BORDETELLA PERTUSSIS	LAPTVGVAF	2411	WP_019247158.1
1529	BORDETELLA PERTUSSIS	LASDGSVDF	2412	AGS56996.1
1530	BORDETELLA PERTUSSIS	LATYQSEYL	2413	AAW72734.1
1531	BORDETELLA PERTUSSIS	LAWALMLAC	2414	AAA22974.1
1532	BORDETELLA PERTUSSIS	LEAGRRFTH	2415	AGS56996.1
1533	BORDETELLA PERTUSSIS	LFTQQGGAY	2416	1BCP_C
1534	BORDETELLA PERTUSSIS	LKRPGSSPM	2417	AAA22983.1
1535	BORDETELLA PERTUSSIS	LLGSHVARA	2418	AFK26303.1
1536	BORDETELLA PERTUSSIS	LLHHILPIL	2419	NP_882286.1
1537	BORDETELLA PERTUSSIS	LLNAGGTLL	2420	WP_019249248.1
1538	BORDETELLA PERTUSSIS	LMGPLQVNA	2421	WP_019249248.1
1539	BORDETELLA PERTUSSIS	LNDSKITMG	2422	WP_019248145.1
1540	BORDETELLA PERTUSSIS	LPEPVKLTL	2423	AGT50936.1
1541	BORDETELLA PERTUSSIS	LPILVLALL	2424	NP_882286.1
1542	BORDETELLA PERTUSSIS	LPKISKNAL	2425	WP_019248145.1
1543	BORDETELLA PERTUSSIS	LPKPVTVKL	2426	WP_019247158.1
1544	BORDETELLA PERTUSSIS	LPLKANPMH	2427	NP_882285.1
1545	BORDETELLA PERTUSSIS	LPPRPVVAE	2428	WP_019247158.1
1546	BORDETELLA PERTUSSIS	LPSIPGTSI	2429	AGS56996.1
1547	BORDETELLA PERTUSSIS	LPTHLYKNF	2430	AAA22984.1
1548	BORDETELLA PERTUSSIS	LPVRGVALV	2431	WP_019249248.1
1549	BORDETELLA PERTUSSIS	LPVSLTALD	2432	WP_019249248.1
1550	BORDETELLA PERTUSSIS	LQGGNKVPV	2433	WP_019249248.1
1551	BORDETELLA PERTUSSIS	LSAALGADW	2434	WP_019249248.1
1552	BORDETELLA PERTUSSIS	LSDAGHEHD	2435	AAA22984.1
1553	BORDETELLA PERTUSSIS	LSGEVQRKG	2436	WP_019249248.1
1554	BORDETELLA PERTUSSIS	LSSPSAITV	2437	WP_019249248.1
1555	BORDETELLA PERTUSSIS	LTWLAILAV	2438	AAW72734.1
1556	BORDETELLA PERTUSSIS	LVFSHVRGM	2439	AAA22974.1
1557	BORDETELLA PERTUSSIS	LVSDAGADL	2440	WP_019249248.1
1558	BORDETELLA PERTUSSIS	LVYYESIAY	2441	AFK26302.1
1559	BORDETELLA PERTUSSIS	MAAESTFES	2442	WP_019247158.1
1560	BORDETELLA PERTUSSIS	MAAGHDATL	2443	WP_019249248.1
1561	BORDETELLA PERTUSSIS	MAAWSERAG	2444	AFK26302.1
1562	BORDETELLA PERTUSSIS	MALGALGAA	2445	AGS56996.1
1563	BORDETELLA PERTUSSIS	MAPVMGACM	2446	ADA85123.1
1564	BORDETELLA PERTUSSIS	MATKGEMQI	2447	WP_019249248.1
1565	BORDETELLA PERTUSSIS	MDAKGGTLL	2448	WP_019249248.1
1566	BORDETELLA PERTUSSIS	MESNKDIVI	2449	WP_019249248.1
1567	BORDETELLA PERTUSSIS	MEVMLRAVF	2450	AAA22983.1
1568	BORDETELLA PERTUSSIS	MEYFKTPLP	2451	WP_019249248.1
1569	BORDETELLA PERTUSSIS	MHTIASILL	2452	AAA22984.1
1570	BORDETELLA PERTUSSIS	MIYMSGLAV	2453	1BCP_C
1571	BORDETELLA PERTUSSIS	MLACTGLPL	2454	AAA22974.1
1572	BORDETELLA PERTUSSIS	MPIDRKTLC	2455	AFK26303.1
1573	BORDETELLA PERTUSSIS	MPKAPELDL	2456	WP_019249248.1
1574	BORDETELLA PERTUSSIS	MQRQAGLPL	2457	NP _882285.1
1575	BORDETELLA PERTUSSIS	NALAWALML	2458	AAA22974.1
1576	BORDETELLA PERTUSSIS	NITNKRAAL	2459	WP_019249248.1
1577	BORDETELLA PERTUSSIS	NLMAAESTF	2460	WP_019247158.1
1578	BORDETELLA PERTUSSIS	NNETMSGRQ	2461	WP_019249248.1
1579	BORDETELLA PERTUSSIS	NPGSLlAEV	2462	WP_019249248.1
1580	BORDETELLA PERTUSSIS	NPMHTIASI	2463	NP_882285.1
1581	BORDETELLA PERTUSSIS	NPQTQLSNI	2464	WP_019248145.1
1582	BORDETELLA PERTUSSIS	NPYTSRRSV	2465	AFK26302.1
1583	BORDETELLA PERTUSSIS	PAPTAPPMP	2466	WP_019249248.1
1584	BORDETELLA PERTUSSIS	PASANTLLL	2467	AGS56996.1
1585	BORDETELLA PERTUSSIS	PAVALPRPL	2468	WP_019249248.1
1586	BORDETELLA PERTUSSIS	PDAHVPFCF	2469	AAA22983.1
1587	BORDETELLA PERTUSSIS	PELGAAIRV	2470	AGT50936.1
1588	BORDETELLA PERTUSSIS	PFIIKLKDC	2471	WP_019248145.1
1589	BORDETELLA PERTUSSIS	PGPQPPQPP	2472	AGS56996.1
1590	BORDETELLA PERTUSSIS	PGPQPPQPQ	2473	AAZ74338.1
1591	BORDETELLA PERTUSSIS	PGPTTDYST	2474	WP_019248145.1
1592	BORDETELLA PERTUSSIS	PGTFTAGKD	2475	WP_019249248.1
1593	BORDETELLA PERTUSSIS	PGTPGDLLE	2476	AAA22984.1
1594	BORDETELLA PERTUSSIS	PKPKPKAER	2477	WP_019247158.1
1595	BORDETELLA PERTUSSIS	PKPKPKPKA	2478	WP_019247158.1
1596	BORDETELLA PERTUSSIS	PKPKPKPKP	2479	WP_019247158.1
1597	BORDETELLA PERTUSSIS	PLPPRPVVA	2480	WP_019247158.1
1598	BORDETELLA PERTUSSIS	PPAPKPAPQ	2481	AGS56996.1
1599	BORDETELLA PERTUSSIS	PPKPAPVAK	2482	WP_019247158.1
1600	BORDETELLA PERTUSSIS	PPRPVAAQV	2483	WP_019247158.1
1601	BORDETELLA PERTUSSIS	PPRPVVAEK	2484	WP_019247158.1
1602	BORDETELLA PERTUSSIS	PPSRPTTPP	2485	WP_019247158.1
1603	BORDETELLA PERTUSSIS	PRRARRALR	2486	WP_019249248.1
1604	BORDETELLA PERTUSSIS	QAAPLSITL	2487	AGT50936.1
1605	BORDETELLA PERTUSSIS	QADRDFVWY	2488	WP_019247699.1
1606	BORDETELLA PERTUSSIS	QAIVVGKDL	2489	WP_019249248.1
1607	BORDETELLA PERTUSSIS	QALGALKLY	2490	ACI16088.1
1608	BORDETELLA PERTUSSIS	QELALKLKG	2491	AAA22984.1
1609	BORDETELLA PERTUSSIS	QITQHGGPY	2492	NP_882283.1
1610	BORDETELLA PERTUSSIS	QITQHGSPY	2493	AFK26303.1
1611	BORDETELLA PERTUSSIS	QPLPPRPVA	2494	WP_019247158.1
1612	BORDETELLA PERTUSSIS	QPPAGRELS	2495	AGS56996.1
1613	BORDETELLA PERTUSSIS	QQLKQADRD	2496	WP_019247699.1
1614	BORDETELLA PERTUSSIS	QQVQVLQRQ	2497	WP_019247158.1
1615	BORDETELLA PERTUSSIS	QSIVEAPEL	2498	AGT50936.1
1616	BORDETELLA PERTUSSIS	QVGSSNSAF	2499	AAW72734.1
1617	BORDETELLA PERTUSSIS	RAGLSPATW	2500	WP_019249248.1
1618	BORDETELLA PERTUSSIS	RARRALRQD	2501	WP_019249248.1
1619	BORDETELLA PERTUSSIS	RASASRARI	2502	WP_019249248.1
1620	BORDETELLA PERTUSSIS	RELSAAANA	2503	AGS56996.1
1621	BORDETELLA PERTUSSIS	RETFCITTI	2504	1BCP_C
1622	BORDETELLA PERTUSSIS	RGFAQRQQL	2505	AGS56996.1
1623	BORDETELLA PERTUSSIS	RGSAATFTL	2506	WP_019248295.1
1624	BORDETELLA PERTUSSIS	RGWSIFALY	2507	AFK26303.1
1625	BORDETELLA PERTUSSIS	RKMLYLIYV	2508	YP_006628018.1
1626	BORDETELLA PERTUSSIS	RLRKMLYLI	2509	YP_006628018.1
1627	BORDETELLA PERTUSSIS	RPQITDAVT	2510	WP_019249248.1
1628	BORDETELLA PERTUSSIS	RPSVNGGRI	2511	WP_019249248.1
1629	BORDETELLA PERTUSSIS	RRFTHADGW	2512	AGS56996.1
1630	BORDETELLA PERTUSSIS	RSGARATSL	2513	AAA22974.1
1631	BORDETELLA PERTUSSIS	RSRVRALAW	2514	NP_882284.1
1632	BORDETELLA PERTUSSIS	RSRVRALSW	2515	YP_006628019.1
1633	BORDETELLA PERTUSSIS	RTHGVGASL	2516	AGS56996.1
1634	BORDETELLA PERTUSSIS	RTRGQARSG	2517	AAA22974.1
1635	BORDETELLA PERTUSSIS	RVAPPAVAL	2518	WP_019249248.1
1636	BORDETELLA PERTUSSIS	RVLPEPVKL	2519	AGT50936.1
1637	BORDETELLA PERTUSSIS	RVRALAWLL	2520	NP_882284.1
1638	BORDETELLA PERTUSSIS	RVRALSWLL	2521	YP_006628019.1
1639	BORDETELLA PERTUSSIS	RVTVSGGSL	2522	AGT50936.1
1640	BORDETELLA PERTUSSIS	SEAMAAWSE	2523	AFK26302.1
1641	BORDETELLA PERTUSSIS	SESHNFHAS	2524	WP_019247158.1
1642	BORDETELLA PERTUSSIS	SGEGRVNIG	2525	WP_019249248.1
1643	BORDETELLA PERTUSSIS	SGLAVRVHV	2526	1BCP_C
1644	BORDETELLA PERTUSSIS	SLADISLGA	2527	WP_019249248.1
1645	BORDETELLA PERTUSSIS	SLFAILSST	2528	WP_019247158.1
1646	BORDETELLA PERTUSSIS	SLFAPHGNV	2529	AAZ74338.1
1647	BORDETELLA PERTUSSIS	SLSIDNATW	2530	AGS56996.1
1648	BORDETELLA PERTUSSIS	SPMEVMLRA	2531	AAA22983.1
1649	BORDETELLA PERTUSSIS	SPQPIRATV	2532	WP_019247158.1
1650	BORDETELLA PERTUSSIS	SPRRARRAL	2533	WP_019249248.1
1651	BORDETELLA PERTUSSIS	SPSRLAGTL	2534	WP_019249248.1
1652	BORDETELLA PERTUSSIS	SSTPLGSLF	2535	WP_019247158.1
1653	BORDETELLA PERTUSSIS	STYELLDYL	2536	WP_019249248.1
1654	BORDETELLA PERTUSSIS	SVAMKPYEV	2537	AAA22983.1
1655	BORDETELLA PERTUSSIS	SVAPNALAW	2538	AAA22974.1
1656	BORDETELLA PERTUSSIS	SVKVAKKLF	2539	WP_019249248.1
1657	BORDETELLA PERTUSSIS	TAFMSGRSL	2540	AAA22984.1
1658	BORDETELLA PERTUSSIS	TAGATPFDI	2541	WP_019248658.1
1659	BORDETELLA PERTUSSIS	TAPVTSPAW	2542	AAW72734.1
1660	BORDETELLA PERTUSSIS	TARTGWLTW	2543	AAW72734.1
1661	BORDETELLA PERTUSSIS	TEAQGVQVR	2544	WP_019248145.1
1662	BORDETELLA PERTUSSIS	TEVYLEHRM	2545	AAW72734.1
1663	BORDETELLA PERTUSSIS	TFEGKPALE	2546	AAA22983.1
1664	BORDETELLA PERTUSSIS	TFTGKVTNG	2547	WP_019248658.1
1665	BORDETELLA PERTUSSIS	TGDGGGHTD	2548	AGS56996.1
1666	BORDETELLA PERTUSSIS	TLAKALSAA	2549	WP_019249248.1
1667	BORDETELLA PERTUSSIS	TLANVGDTW	2550	AGS56996.1
1668	BORDETELLA PERTUSSIS	TLNASNLTL	2551	WP_019249248.1
1669	BORDETELLA PERTUSSIS	TLSSAHGNV	2552	WP_019249248.1
1670	BORDETELLA PERTUSSIS	TPFDIKLKE	2553	WP_019248658.1
1671	BORDETELLA PERTUSSIS	TPFIIKLKD	2554	WP_019248145.1
1672	BORDETELLA PERTUSSIS	TPGWSIYGL	2555	1BCP_C
1673	BORDETELLA PERTUSSIS	TPLGSAATF	2556	AGS56996.1
1674	BORDETELLA PERTUSSIS	TPLGSLFAI	2557	WP_019247158.1
1675	BORDETELLA PERTUSSIS	TPLPVSLTA	2558	WP_019249248.1
1676	BORDETELLA PERTUSSIS	TRQGIMDQY	2559	YP_006626873.1
1677	BORDETELLA PERTUSSIS	TSKQDERNY	2560	WP_019247158.1
1678	BORDETELLA PERTUSSIS	TSPYDGKYW	2561	YP_006628018.1
1679	BORDETELLA PERTUSSIS	TSRRSVASI	2562	AFK26302.1
1680	BORDETELLA PERTUSSIS	TSRTVTMRY	2563	NP_879898.1
1681	BORDETELLA PERTUSSIS	TTEYPNARY	2564	ADA85123.1
1682	BORDETELLA PERTUSSIS	TTEYSNARY	2565	AFK26302.1
1683	BORDETELLA PERTUSSIS	TTLGLEQTF	2566	WP_019247158.1
1684	BORDETELLA PERTUSSIS	TVLAAGAGL	2567	WP_019249248.1
1685	BORDETELLA PERTUSSIS	TVQELALKL	2568	AAA22984.1
1686	BORDETELLA PERTUSSIS	TWQRNKHW	2569	WP_019247158.1
1687	BORDETELLA PERTUSSIS	VAAAADLAL	2570	WP_019249248.1
1688	BORDETELLA PERTUSSIS	VALASQARW	2571	AGS56996.1
1689	BORDETELLA PERTUSSIS	VAMKPYEVT	2572	AAA22983.1
1690	BORDETELLA PERTUSSIS	VARLVKLQG	2573	WP_019249248.1
1691	BORDETELLA PERTUSSIS	VAVAGGRWH	2574	AGS56996.1
1692	BORDETELLA PERTUSSIS	VEASAITTY	2575	WP_019248145.1
1693	BORDETELLA PERTUSSIS	VEDIGGKNY	2576	WP_019247158.1
1694	BORDETELLA PERTUSSIS	VEVSSPPPV	2577	WP_019247158.1
1695	BORDETELLA PERTUSSIS	VGAGGYEAG	2578	WP_019247158.1
1696	BORDETELLA PERTUSSIS	VGGGEHGRW	2579	WP_019249248.1
1697	BORDETELLA PERTUSSIS	VHVSKEEQY	2580	YP_006628018.1
1698	BORDETELLA PERTUSSIS	VIDGQKVLA	2581	AAA22974.1
1699	BORDETELLA PERTUSSIS	VIGACTSPY	2582	YP_006628018.1
1700	BORDETELLA PERTUSSIS	VKLGGVYEA	2583	AAA22974.1
1701	BORDETELLA PERTUSSIS	VLAPRLYLT	2584	AAA22974.1
1702	BORDETELLA PERTUSSIS	VLVKTNMVV	2585	AAA22983.1
1703	BORDETELLA PERTUSSIS	VPASGAPAA	2586	AGS56996.1
1704	BORDETELLA PERTUSSIS	VPFCFGKDL	2587	AAA22983.1
1705	BORDETELLA PERTUSSIS	VPVSEHCTV	2588	AAA22974.1
1706	BORDETELLA PERTUSSIS	VPVTPPKVE	2589	WP_019247158.1
1707	BORDETELLA PERTUSSIS	VRTVSAMEY	2590	WP_019249248.1
1708	BORDETELLA PERTUSSIS	VSGGSLSAP	2591	AGT50936.1
1709	BORDETELLA PERTUSSIS	VSSATKAKG	2592	WP_019248658.1
1710	BORDETELLA PERTUSSIS	VSSPPPVSV	2593	WP_019247158.1
1711	BORDETELLA PERTUSSIS	VSVKVAKKL	2594	WP_019249248.1
1712	BORDETELLA PERTUSSIS	VTMRYLASY	2595	WP_019248145.1
1713	BORDETELLA PERTUSSIS	VTSVAMKPY	2596	AAA22983.1
1714	BORDETELLA PERTUSSIS	VVAEKVTTP	2597	WP_019247158.1
1715	BORDETELLA PERTUSSIS	VVDGPPSRP	2598	WP_019247158.1
1716	BORDETELLA PERTUSSIS	VVETAQPLP	2599	WP_019247158.1
1717	BORDETELLA PERTUSSIS	WLTWLAILA	2600	AAW72734.1
1718	BORDETELLA PERTUSSIS	WTFHAGYRY	2601	AGS56996.1
1719	BORDETELLA PERTUSSIS	WVMTDNSNV	2602	AGS56996.1
1720	BORDETELLA PERTUSSIS	YAEHGEVSI	2603	WP_019249248.1
1721	BORDETELLA PERTUSSIS	YAIDGTAAG	2604	WP_019249248.1
1722	BORDETELLA PERTUSSIS	YALKSRIAL	2605	AAA22984.1
1723	BORDETELLA PERTUSSIS	YATNPQTQL	2606	WP_019248145.1
1724	BORDETELLA PERTUSSIS	YDTGDLIAY	2607	WP_019248658.1
1725	BORDETELLA PERTUSSIS	YEAGFSLGS	2608	WP_019247158.1
1726	BORDETELLA PERTUSSIS	YEDATFETY	2609	YP_006628018.1
1727	BORDETELLA PERTUSSIS	YENKSSTPL	2610	WP_019247158.1
1728	BORDETELLA PERTUSSIS	YEVTPTRML	2611	AAA22983.1
1729	BORDETELLA PERTUSSIS	YEYIWGLYP	2612	WP_019249248.1
1730	BORDETELLA PERTUSSIS	YEYIWGLYQ	2613	YP_006626470.1
1731	BORDETELLA PERTUSSIS	YEYSKGPKL	2614	AGS56996.1
1732	BORDETELLA PERTUSSIS	YFEPGPTTD	2615	WP_019248145.1
1733	BORDETELLA PERTUSSIS	YIWGLYPTY	2616	WP_019249248.1
1734	BORDETELLA PERTUSSIS	YIWGLYQTY	2617	YP_006626470.1
1735	BORDETELLA PERTUSSIS	YLRQITPGW	2618	1BCP_C
1736	BORDETELLA PERTUSSIS	YMIYMSGLA	2619	1BCP_C
1737	BORDETELLA PERTUSSIS	YPALRAALI	2620	WP_019248658.1
1738	BORDETELLA PERTUSSIS	YPGTPGDLL	2621	AAA22984.1
1739	BORDETELLA PERTUSSIS	YPTYTEWSV	2622	WP_019249248.1
1740	BORDETELLA PERTUSSIS	YQTYTEWSV	2623	YP_006626470.1
1741	BORDETELLA PERTUSSIS	YSTGDLRAY	2624	WP_019248145.1
1742	BORDETELLA PERTUSSIS	YTLRYLASY	2625	WP_019248658.1
1743	BORDETELLA PERTUSSIS	YVLVKTNMV	2626	AAA22983.1
1744	BORDETELLA PERTUSSIS	YYDYEDATF	2627	YP_006628018.1
1745	BORDETELLA PERTUSSIS 509	AAFIALYPNSQLAPT	2628	Q7VU05
1746	BORDETELLA PERTUSSIS 509	GGAEYNLALGQRRA	2629	Q7VU04
1747	BORDETELLA PERTUSSIS 509	GGAEYNLALGQRRADA	2630	Q7VU04
1748	BORDETELLA PERTUSSIS 509	IALYPNSQLAPT	2631	Q7VU05
1749	BORDETELLA PERTUSSIS 509	KPDQGEVVAVGPGKKTED	2632	P0A339.1
1750	BORDETELLA PERTUSSIS 509	KPDQGEVVAVGPGKKTEDG	2633	P0A339.1
1751	BORDETELLA PERTUSSIS 509	LAEVLDYHNFVLTQ	2634	Q7VWM1.1
1752	CORYNEBACTERIUM DIPHTHERIAE	QSIALSSLMVAQAIP	2635	AAV70486.1
1753	CORYNEBACTERIUM DIPHTHERIAE	SIGVLGYQKTVDHTKVNSKLSLF	2636	AAV70486.1
1754	BORDETELLA PERTUSSIS	AAHADWNNQSIVKT	2637	ABO77783.1
1755	BORDETELLA PERTUSSIS	AALGRG	2638	ABO77783.1
1756	BORDETELLA PERTUSSIS	AALGRGHSLYASYE	2639	ABO77783.1
1757	BORDETELLA PERTUSSIS	AAPLRRTTLAMALG	2640	ABO77783.1
1758	BORDETELLA PERTUSSIS	AAPLSITLQAGAHA	2641	ABO77783.1
1759	BORDETELLA PERTUSSIS	ADAQGDIVATELPS	2642	ABO77783.1
1760	BORDETELLA PERTUSSIS	ADSGFYLDATLRAS	2643	ABO77783.1
1761	BORDETELLA PERTUSSIS	AELA	2644	ABO77783.1
1762	BORDETELLA PERTUSSIS	AELAVFRAGGGAYR	2645	ABO77783.1
1763	BORDETELLA PERTUSSIS	AELQFRNGSVTSSG	2646	ABO77783.1
1764	BORDETELLA PERTUSSIS	AGGRWHLGGLAGYT	2647	ABO77783.1
1765	BORDETELLA PERTUSSIS	AGVAAMQGAVVHLQ	2648	ABO77783.1
1766	BORDETELLA PERTUSSIS	AGYTRGDRGFTGDG	2649	ABO77783.1
1767	BORDETELLA PERTUSSIS	ALASQARWTGATRA	2650	ABO77783.1
1768	BORDETELLA PERTUSSIS	AMPWTFHAGYRYSW	2651	ABO77783.1
1769	BORDETELLA PERTUSSIS	AMQGAVVHLQRATIRRGDAP	2652	ABO77783.1
1770	BORDETELLA PERTUSSIS	ANGLRVRDE	2653	ABO77783.1
1771	BORDETELLA PERTUSSIS	ANGLRVRDEGGSSV	2654	ABO77783.1
1772	BORDETELLA PERTUSSIS	ANKDGKVDIGTYRY	2655	ABO77783.1
1773	BORDETELLA PERTUSSIS	APAAVSVLGASELT	2656	ABO77783.1
1774	BORDETELLA PERTUSSIS	APPAPKPAPQPGPQ	2657	ABO77783.1
1775	BORDETELLA PERTUSSIS	AQGILLENPAAELQ	2658	ABO77783.1
1776	BORDETELLA PERTUSSIS	ARWTGATRAVDSLS	2659	ABO77783.1
1777	BORDETELLA PERTUSSIS	ASLEAGRRFTHADG	2660	ABO77783.1
1778	BORDETELLA PERTUSSIS	ASYEYSKGPKLAMP	2661	ABO77783.1
1779	BORDETELLA PERTUSSIS	ATFTLANKD	2662	ABO77783.1
1780	BORDETELLA PERTUSSIS	ATFTLANKDGKVDI	2663	ABO77783.1
1781	BORDETELLA PERTUSSIS	ATRAVDSLSIDNAT	2664	ABO77783.1
1782	BORDETELLA PERTUSSIS	DDDGIALYVAGEQAQ	2665	ABO77783.1
1783	BORDETELLA PERTUSSIS	DDGIALYVAGEQAQ	2666	ABO77783.1
1784	BORDETELLA PERTUSSIS	DGGHITGGRAAGVA	2667	ABO77783.1
1785	BORDETELLA PERTUSSIS	DGIRRFLGTVTVKAGK	2668	ABO77783.1
1786	BORDETELLA PERTUSSIS	DGSVDFQQPAEAGR	2669	ABO77783.1
1787	BORDETELLA PERTUSSIS	DGYAVKGKYRTHGV	2670	ABO77783.1
1788	BORDETELLA PERTUSSIS	DIVATELPSIPGTS	2671	ABO77783.1
1789	BORDETELLA PERTUSSIS	DKLVVMQDASGQHR	2672	ABO77783.1
1790	BORDETELLA PERTUSSIS	DLGLSDKLVVMQDA	2673	ABO77783.1
1791	BORDETELLA PERTUSSIS	DNATWVMTDNSNVGA	2674	ABO77783.1
1792	BORDETELLA PERTUSSIS	DNATWVMTDNSNVGALRLA	2675	ABO77783.1
1793	BORDETELLA PERTUSSIS	DNRAGRRFDQKVAG	2676	ABO77783.1
1794	BORDETELLA PERTUSSIS	EAGRFKVLTVNTLA	2677	ABO77783.1
1795	BORDETELLA PERTUSSIS	ELAQSIVEAPELGA	2678	ABO77783.1
1796	BORDETELLA PERTUSSIS	ELGAAIRVGRGARV	2679	ABO77783.1
1797	BORDETELLA PERTUSSIS	ELGADHAVAVAGGR	2680	ABO77783.1
1798	BORDETELLA PERTUSSIS	ELPSIPGTSIGPLD	2681	ABO77783.1
1799	BORDETELLA PERTUSSIS	EPVKLTLTGGADAQ	2682	ABO77783.1
1800	BORDETELLA PERTUSSIS	EQAQASIADSTLQG	2683	ABO77783.1
1801	BORDETELLA PERTUSSIS	ERGANVTVQRSAIV	2684	ABO77783.1
1802	BORDETELLA PERTUSSIS	ERQHGIHIQGSDPG	2685	ABO77783.1
1803	BORDETELLA PERTUSSIS	EVGKRIELAGGRQV	2686	ABO77783.1
1804	BORDETELLA PERTUSSIS	FDGAGTVHTNGIAH	2687	ABO77783.1
1805	BORDETELLA PERTUSSIS	FQQPAEAGRFKVLT	2688	ABO77783.1
1806	BORDETELLA PERTUSSIS	FRAGGGAYRAANGL	2689	ABO77783.1
1807	BORDETELLA PERTUSSIS	GAHAQGKALLYRVL	2690	ABO77783.1
1808	BORDETELLA PERTUSSIS	GARVTVSGGSLSAP	2691	ABO77783.1
1809	BORDETELLA PERTUSSIS	GAYRAANGLRVRDE	2692	ABO77783.1
1810	BORDETELLA PERTUSSIS	GDAPAGGAVPGGAV	2693	ABO77783.1
1811	BORDETELLA PERTUSSIS	GGAVPGGAVPGGFG	2694	ABO77783.1
1812	BORDETELLA PERTUSSIS	GGAVPGGFGPVLDG	2695	ABO77783.1
1813	BORDETELLA PERTUSSIS	GGFGPVLDGWYGVD	2696	ABO77783.1
1814	BORDETELLA PERTUSSIS	GGLHIGALQSLQPE	2697	ABO77783.1
1815	BORDETELLA PERTUSSIS	GGVQIERGANVTVQ	2698	ABO77783.1
1816	BORDETELLA PERTUSSIS	GHSLYASYEYSKGP	2699	ABO77783.1
1817	BORDETELLA PERTUSSIS	GHTDSVHVGGYATY	2700	ABO77783.1
1818	BORDETELLA PERTUSSIS	GIAHRTELRGTRAE	2701	ABO77783.1
1819	BORDETELLA PERTUSSIS	GKALLYRVLPEPVK	2702	ABO77783.1
1820	BORDETELLA PERTUSSIS	GLGMAAALGRGHSL	2703	ABO77783.1
1821	BORDETELLA PERTUSSIS	GNVIETGGARRHAP	2704	ABO77783.1
1822	BORDETELLA PERTUSSIS	GPLDVALASQARWT	2705	ABO77783.1
1823	BORDETELLA PERTUSSIS	GQHRLWVRN	2706	ABO77783.1
1824	BORDETELLA PERTUSSIS	GRGFAQRQQLDNRA	2707	ABO77783.1
1825	BORDETELLA PERTUSSIS	GRLGLEVGKRIELA	2708	ABO77783.1
1826	BORDETELLA PERTUSSIS	GRQVQPYIKASVLQ	2709	ABO77783.1
1827	BORDETELLA PERTUSSIS	GRRFTHADGWFLEPQAELA	2710	ABO77783.1
1828	BORDETELLA PERTUSSIS	GSEPASANTLLLVQ	2711	ABO77783.1
1829	BORDETELLA PERTUSSIS	GSSVLGRLGLEVGK	2712	ABO77783.1
1830	BORDETELLA PERTUSSIS	GTTIKVSGRQAQGI	2713	ABO77783.1
1831	BORDETELLA PERTUSSIS	GTVTVKAGKLVADH	2714	ABO77783.1
1832	BORDETELLA PERTUSSIS	HAVAVAGGRWHLGG	2715	ABO77783.1
1833	BORDETELLA PERTUSSIS	IELAGGRQVQPYIK	2716	ABO77783.1
1834	BORDETELLA PERTUSSIS	IHIQGSDPGGVRTA	2717	ABO77783.1
1835	BORDETELLA PERTUSSIS	IRRFLGTVTVKAGK	2718	ABO77783.1
1836	BORDETELLA PERTUSSIS	IRVGRGARVTVSGG	2719	ABO77783.1
1837	BORDETELLA PERTUSSIS	ITLQAGAHA	2720	ABO77783.1
1838	BORDETELLA PERTUSSIS	ITLQAGAHAQGKAL	2721	ABO77783.1
1839	BORDETELLA PERTUSSIS	IVEAPELGAAIRVG	2722	ABO77783.1
1840	BORDETELLA PERTUSSIS	IVKTGERQHGIHIQ	2723	ABO77783.1
1841	BORDETELLA PERTUSSIS	KAGKLVADHATLAN	2724	ABO77783.1
1842	BORDETELLA PERTUSSIS	KGKYRTHGVGASLE	2725	ABO77783.1
1843	BORDETELLA PERTUSSIS	KPAPQPGPQPPQPP	2726	ABO77783.1
1844	BORDETELLA PERTUSSIS	KVAGFELGADHAVA	2727	ABO77783.1
1845	BORDETELLA PERTUSSIS	KVAGSDGYAVKGKY	2728	ABO77783.1
1846	BORDETELLA PERTUSSIS	KVDIGTYRYRLAAN	2729	ABO77783.1
1847	BORDETELLA PERTUSSIS	KVLTVNTLAGSGLF	2730	ABO77783.1
1848	BORDETELLA PERTUSSIS	LAANGNGQWSLVGA	2731	ABO77783.1
1849	BORDETELLA PERTUSSIS	LAMPWTFHAGYRYS	2732	ABO77783.1
1850	BORDETELLA PERTUSSIS	LASTLWYAESNALS	2733	ABO77783.1
1851	BORDETELLA PERTUSSIS	LENDFKVAGSDGYA	2734	ABO77783.1
1852	BORDETELLA PERTUSSIS	LENPAAELQFRNGS	2735	ABO77783.1
1853	BORDETELLA PERTUSSIS	LGAAPAAHADWNNQ	2736	ABO77783.1
1854	BORDETELLA PERTUSSIS	LGGLAGYTRGDRGPTGDG	2737	ABO77783.1
1855	BORDETELLA PERTUSSIS	LLENP	2738	ABO77783.1
1856	BORDETELLA PERTUSSIS	LLVQTPLGSAATFT	2739	ABO77783.1
1857	BORDETELLA PERTUSSIS	LPPSRVVLRDTNVT	2740	ABO77783.1
1858	BORDETELLA PERTUSSIS	LQPEDLPPS	2741	ABO77783.1
1859	BORDETELLA PERTUSSIS	LQPEDLPPSRVVLR	2742	ABO77783.1
1860	BORDETELLA PERTUSSIS	LRASRLENDFKVAG	2743	ABO77783.1
1861	BORDETELLA PERTUSSIS	LRLASDGSVDFQQP	2744	ABO77783.1
1862	BORDETELLA PERTUSSIS	LSAAANAAVNTGGV	2745	ABO77783.1
1863	BORDETELLA PERTUSSIS	LSAPHGNVIETGGA	2746	ABO77783.1
1864	BORDETELLA PERTUSSIS	LSDDGIRRFLGTVT	2747	ABO77783.1
1865	BORDETELLA PERTUSSIS	LVGAKAPPAPKPAP	2748	ABO77783.1
1866	BORDETELLA PERTUSSIS	LYVAGEQAQASIAD	2749	ABO77783.1
1867	BORDETELLA PERTUSSIS	MALGALGAAPAAHA	2750	ABO77783.1
1868	BORDETELLA PERTUSSIS	MNMSLSRIVKAAPL	2751	ABO77783.1
1869	BORDETELLA PERTUSSIS	MQDASGQHR	2752	ABO77783.1
1870	BORDETELLA PERTUSSIS	MQGAVVHLQRATIR	2753	ABO77783.1
1871	BORDETELLA PERTUSSIS	NAAVNTGGVGLAST	2754	ABO77783.1
1872	BORDETELLA PERTUSSIS	NALSKRLGELRLNP	2755	ABO77783.1
1873	BORDETELLA PERTUSSIS	NGQWSLVGAKAPPA	2756	ABO77783.1
1874	BORDETELLA PERTUSSIS	NTLAGSGLFRMNVF	2757	ABO77783.1
1875	BORDETELLA PERTUSSIS	PAGRELSAAANAAV	2758	ABO77783.1
1876	BORDETELLA PERTUSSIS	PAPQPPAGRELSAA	2759	ABO77783.1
1877	BORDETELLA PERTUSSIS	PGPQPPQPPQPQPE	2760	ABO77783.1
1878	BORDETELLA PERTUSSIS	PGTSIGPLDVALAS	2761	ABO77783.1
1879	BORDETELLA PERTUSSIS	PLGSAATFTLANKD	2762	ABO77783.1
1880	BORDETELLA PERTUSSIS	PQPEAPAPQPPAGR	2763	ABO77783.1
1881	BORDETELLA PERTUSSIS	PQPPQPQPEAPAPQ	2764	ABO77783.1
1882	BORDETELLA PERTUSSIS	PYIKASVLQEFDGA	2765	ABO77783.1
1883	BORDETELLA PERTUSSIS	RFAPQAAPLSITLQ	2766	ABO77783.1
1884	BORDETELLA PERTUSSIS	RLGELRLNPDAGGA	2767	ABO77783.1
1885	BORDETELLA PERTUSSIS	RLNPDAGGAWGRGF	2768	ABO77783.1
1886	BORDETELLA PERTUSSIS	RNGSVTSSGQLSDD	2769	ABO77783.1
1887	BORDETELLA PERTUSSIS	RRFDQKVAGFELGA	2770	ABO77783.1
1888	BORDETELLA PERTUSSIS	RTTLAMALGALGAA	2771	ABO77783.1
1889	BORDETELLA PERTUSSIS	SAIVDGGLHIGALQ	2772	ABO77783.1
1890	BORDETELLA PERTUSSIS	SANTLLLVQTPLGS	2773	ABO77783.1
1891	BORDETELLA PERTUSSIS	SDPGGVRTASGTTI	2774	ABO77783.1
1892	BORDETELLA PERTUSSIS	SELTLDGGHITGGR	2775	ABO77783.1
1893	BORDETELLA PERTUSSIS	SGLFRMNVF	2776	ABO77783.1
1894	BORDETELLA PERTUSSIS	SGLFRMNVFADLGL	2777	ABO77783.1
1895	BORDETELLA PERTUSSIS	SGSSVELAQSIVEA	2778	ABO77783.1
1896	BORDETELLA PERTUSSIS	SIADSTLQGAGGVQ	2779	ABO77783.1
1897	BORDETELLA PERTUSSIS	SKGPKLAMPWTFHA	2780	ABO77783.1
1898	BORDETELLA PERTUSSIS	SNVGALRLASDGSV	2781	ABO77783.1
1899	BORDETELLA PERTUSSIS	SRIVKAAPLRRTTL	2782	ABO77783.1
1900	BORDETELLA PERTUSSIS	SVLGASELTLDGGH	2783	ABO77783.1
1901	BORDETELLA PERTUSSIS	SVLQEFDGA	2784	ABO77783.1
1902	BORDETELLA PERTUSSIS	SVLQEFDGAGTVHT	2785	ABO77783.1
1903	BORDETELLA PERTUSSIS	TELR	2786	ABO77783.1
1904	BORDETELLA PERTUSSIS	TELRGTRAELGLGM	2787	ABO77783.1
1905	BORDETELLA PERTUSSIS	TGDGGGHTDSVHVG	2788	ABO77783.1
1906	BORDETELLA PERTUSSIS	TGGARRFAPQAAPL	2789	ABO77783.1
1907	BORDETELLA PERTUSSIS	TGGRAAGVAAMQGA	2790	ABO77783.1
1908	BORDETELLA PERTUSSIS	TGGVGLASTLWYAE	2791	ABO77783.1
1909	BORDETELLA PERTUSSIS	THGVGASLEAGRRF	2792	ABO77783.1
1910	BORDETELLA PERTUSSIS	TIRRGDAPA	2793	ABO77783.1
1911	BORDETELLA PERTUSSIS	TLANVGDTWDDDGI	2794	ABO77783.1
1912	BORDETELLA PERTUSSIS	TLQGAGGVQIERGA	2795	ABO77783.1
1913	BORDETELLA PERTUSSIS	TLTGGADAQGDIVA	2796	ABO77783.1
1914	BORDETELLA PERTUSSIS	TNVTAVPASGAPAA	2797	ABO77783.1
1915	BORDETELLA PERTUSSIS	TRAELGLGMAAALG	2798	ABO77783.1
1916	BORDETELLA PERTUSSIS	TSSGQLSDDGIRRF	2799	ABO77783.1
1917	BORDETELLA PERTUSSIS	TVHTNGIAHRTELR	2800	ABO77783.1
1918	BORDETELLA PERTUSSIS	TYRYRLAANGNGQW	2801	ABO77783.1
1919	BORDETELLA PERTUSSIS	VADHATLANVGDTW	2802	ABO77783.1
1920	BORDETELLA PERTUSSIS	VHVGGYATYIADSG	2803	ABO77783.1
1921	BORDETELLA PERTUSSIS	VLDGWYGVD	2804	ABO77783.1
1922	BORDETELLA PERTUSSIS	VPASGAPAAVSVLG	2805	ABO77783.1
1923	BORDETELLA PERTUSSIS	VRDEGGSSVLGRLG	2806	ABO77783.1
1924	BORDETELLA PERTUSSIS	VRTASGTTIKVSGR	2807	ABO77783.1
1925	BORDETELLA PERTUSSIS	VSGGSLSAPHGNVI	2808	ABO77783.1
1926	BORDETELLA PERTUSSIS	VSGRQAQGILLENP	2809	ABO77783.1
1927	BORDETELLA PERTUSSIS	VTVQRSAIVDGGLH	2810	ABO77783.1
1928	BORDETELLA PERTUSSIS	VVLRDTNVTAVPAS	2811	ABO77783.1
1929	BORDETELLA PERTUSSIS	WNNQSIVKTGERQH	2812	ABO77783.1
1930	BORDETELLA PERTUSSIS	WVRNSGSEPASANT	2813	ABO77783.1
1931	BORDETELLA PERTUSSIS	WYAESNALSKRLGE	2814	ABO77783.1
1932	BORDETELLA PERTUSSIS	YATYIADSGFYLDA	2815	ABO77783.1
1933	BORDETELLA PERTUSSIS	YGVDVSGSS	2816	ABO77783.1
1934	BORDETELLA PERTUSSIS	YGVDVSGSSVELAQ	2817	ABO77783.1
1935	BORDETELLA PERTUSSIS	YLDATLRASRLEND	2818	ABO77783.1
1936	BORDETELLA PERTUSSIS	YRVLPEPVKLTLTG	2819	ABO77783.1
1937	BORDETELLA PERTUSSIS	VKAQNITNKRAALIEA	2820	AAA22974.1
1938	BORDETELLA PERTUSSIS	YYSNVTATRLLSSTNS	2821	AAA83981.1
1939	BORDETELLA PERTUSSIS	SPNLTDERAAQAGVT	2822	CPP72976.1
1940	MEASLES MORBILLIVIRUS	SSRASDERAAHLPTS	2823	BAA33867.1
1941	CORYNEBACTERIUM DIPHTHERIAE	QWHNSYNRPAYSPG	2824	1007216A
1942	MEASLES VIRUS STRAIN EDMONSTON-B	AEGGEIHEL	2825	AAF85692 .1
1943	MEASLES VIRUS STRAIN EDMONSTON-B	AENLISNGIGKY	2826	AAF85698.1
1944	MEASLES VIRUS STRAIN EDMONSTON-B	AEVDGDVKL	2827	CAB43772.1
1945	MEASLES VIRUS STRAIN EDMONSTON-B	AIYTAEIHK	2828	AAF85697.1
1946	MEASLES VIRUS STRAIN EDMONSTON-B	APVFHMTNY	2829	CAB43772.1
1947	MEASLES VIRUS STRAIN EDMONSTON-B	APVFHMTNYLEQPVSN	2830	AAR89413.1
1948	MEASLES VIRUS STRAIN EDMONSTON-B	AQRLNEIY	2831	AAF85698.1
1949	MEASLES VIRUS STRAIN EDMONSTON-B	ARVPHAYSL	2832	AAF85698.1
1950	MEASLES VIRUS STRAIN EDMONSTON-B	AVRDLERAM	2833	P03424.1
1951	MEASLES VIRUS STRAIN EDMONSTON-B	AVRDLERAMTTLK	2834	P03424.1
1952	MEASLES VIRUS STRAIN EDMONSTON-B	DALLRLQAM	2835	Q89933.1
1953	MEASLES VIRUS STRAIN EDMONSTON-B	DIKEKVINL	2836	AAF85698.1
1954	MEASLES VIRUS STRAIN EDMONSTON-B	DQGLFKVL	2837	AAF85695.1
1955	MEASLES VIRUS STRAIN EDMONSTON-B	DTGVDTRIW	2838	Q9EMA9.1
1956	MEASLES VIRUS STRAIN EDMONSTON-B	EPIGSLATEEAM	2839	AAF85692.1
1957	MEASLES VIRUS STRAIN EDMONSTON-B	EPIRDALNAM	2840	P69354.1
1958	MEASLES VIRUS STRAIN EDMONSTON-B	FPKLGKTL	2841	AAF85692.1
1959	MEASLES VIRUS STRAIN EDMONSTON-B	FRSVNAVAF	2842	AAF85695.1
1960	MEASLES VIRUS STRAIN EDMONSTON-B	GHIIDNTEQL	2843	AAF85695.1
1961	MEASLES VIRUS STRAIN EDMONSTON-B	GLNEKLVFY	2844	AAF85695.1
1962	MEASLES VIRUS STRAIN EDMONSTON-B	GMYGGTYLVEK	2845	AAC35876.2
1963	MEASLES VIRUS STRAIN EDMONSTON-B	GPPISLERLDVGTN	2846	P69354.1
1964	MEASLES VIRUS STRAIN EDMONSTON-B	GPRQAQVSFL	2847	Q89933.1
1965	MEASLES VIRUS STRAIN EDMONSTON-B	GRLVPQVRVID	2848	AAF85695.1
1966	MEASLES VIRUS STRAIN EDMONSTON-B	GSAPISMGFR	2849	AAF85692.1
1967	MEASLES VIRUS STRAIN EDMONSTON-B	HILAKSTAL	2850	AAF85698.1
1968	MEASLES VIRUS STRAIN EDMONSTON-B	HYREVNLVY	2851	AAF85698.1
1969	MEASLES VIRUS STRAIN EDMONSTON-B	IPPMKNLAL	2852	AAC35876.2
1970	MEASLES VIRUS STRAIN EDMONSTON-B	IPYQGSGKGVSF	2853	CAB43772.1
1971	MEASLES VIRUS STRAIN EDMONSTON-B	ISKESQHVY	2854	AAF85698.1
1972	MEASLES VIRUS STRAIN EDMONSTON-B	IVSSHFFVY	2855	AAF85698.1
1973	MEASLES VIRUS STRAIN EDMONSTON-B	KEIKETGRLF	2856	AAF85698.1
1974	MEASLES VIRUS STRAIN EDMONSTON-B	KESQHVYYL	2857	AAF85698.1
1975	MEASLES VIRUS STRAIN EDMONSTON-B	KIIDNTEQL	2858	AAF85695.1
1976	MEASLES VIRUS STRAIN EDMONSTON-B	KKQINRQN	2859	AAA63285.1
1977	MEASLES VIRUS STRAIN EDMONSTON-B	KKVDTNFIYQ	2860	AAF85698.1
1978	MEASLES VIRUS STRAIN EDMONSTON-B	KLIDGFFPA	2861	AAF85698.1
1979	MEASLES VIRUS STRAIN EDMONSTON-B	KPNLSSKRSEL	2862	BAB39848.1
1980	MEASLES VIRUS STRAIN EDMONSTON-B	KVSPYLFTV	2863	AAR89413.1
1981	MEASLES VIRUS STRAIN EDMONSTON-B	LETRTTNQFL	2864	CAB43772.1
1982	MEASLES VIRUS STRAIN EDMONSTON-B	LLKEATEL	2865	AAF85695.1
1983	MEASLES VIRUS STRAIN EDMONSTON-B	LLKKGNSLY	2866	AAF85698.1
1984	MEASLES VIRUS STRAIN EDMONSTON-B	LPAPIGGMNY	2867	AAF85698.1
1985	MEASLES VIRUS STRAIN EDMONSTON-B	MPEETLHQVM	2868	AAF85698.1
1986	MEASLES VIRUS STRAIN EDMONSTON-B	PTTIRGQFS	2869	CAB43772.1
1987	MEASLES VIRUS STRAIN EDMONSTON-B	QEISRHQALGY	2870	P03424.1
1988	MEASLES VIRUS STRAIN EDMONSTON-B	RITHVDTESY	2871	P69354.1
1989	MEASLES VIRUS STRAIN EDMONSTON-B	RPGLKPDL	2872	P69354.1
1990	MEASLES VIRUS STRAIN EDMONSTON-B	RPIYGLEV	2873	AAF85698.1
1991	MEASLES VIRUS STRAIN EDMONSTON-B	RQAGQEMILAV	2874	P69354.1
1992	MEASLES VIRUS STRAIN EDMONSTON-B	SAVRIATVY	2875	AAF85698.1
1993	MEASLES VIRUS STRAIN EDMONSTON-B	SLMPEETLHQV	2876	AAF85698.1
1994	MEASLES VIRUS STRAIN EDMONSTON-B	SMIDLVTKF	2877	AAF85698.1
1995	MEASLES VIRUS STRAIN EDMONSTON-B	SMLNSQAIDNLRA	2878	P69354.1
1996	MEASLES VIRUS STRAIN EDMONSTON-B	SMYRVFEV	2879	CAB43772.1
1997	MEASLES VIRUS STRAIN EDMONSTON-B	SQQGMFHAY	2880	AAF85698.1
1998	MEASLES VIRUS STRAIN EDMONSTON-B	TDTPIVYNDRNLLD	2881	Q89933.1
1999	MEASLES VIRUS STRAIN EDMONSTON-B	VIINDDQGLFKV	2882	AAF85695.1
2000	MEASLES VIRUS STRAIN EDMONSTON-B	YESGVRIASL	2883	AAF85698.1
2001	MEASLES VIRUS STRAIN EDMONSTON-B	YLKDKALA	2884	AAF85698.1
2002	MEASLES VIRUS STRAIN EDMONSTON-B	YVYDHSGEAVK	2885	AAF85692.1
2003	RUBELLA VIRUS	ARVIDPAAQSFTGVV	2886	BAA28178.1
2004	RUBELLA VIRUS	SDRASARVIDPAAQS	2887	BAA28178.1
2005	RUBELLA VIRUS	VPPGKFVTAALLNTP	2888	BAA28178.1
2006	RUBELLA VIRUS	WVTPVIGSQARKCGL	2889	BAA28178.1
2007	MUMPS RUBULAVIRUS	GTYRLIPNARANLTA	400	AGC97176.1

E. Einschleusung von Multi-Flap-Prime-Editoren
In einem anderen Aspekt sieht die vorliegende Offenbarung die Einschleusung von Multi-Flap-Prime-Editoren in vitro und in vivo unter Verwendung verschiedener Strategien vor, einschließlich auf getrennten Vektoren unter Verwendung von gesplitteten Inteinen und sowie direkter Einschleusungsstrategien des Ribonukleoproteinkomplexes (d. h. des Prime- Editors komplexiert mit dem PEgRNA und/oder der Zweitstellen-gRNA) unter Verwendung von Techniken wie Elektroporation, Verwendung von kationischen Lipid-vermittelten Formulierungen und induzierten Endocytose-Verfahren unter Verwendung von Rezeptorliganden, die an die Ribonukleotproteinkomplexe fusioniert sind. Alle derartigen Verfahren werden hierin in Betracht gezogen.
Übersicht der Einschleusungsoptionen
In einigen Aspekten stellt die Erfindung Verfahren bereit, umfassend die Einschleusung eines oder mehrerer Multi-Flap-Prime-Editor-kodierender Polynukleotide, wie etwa eines oder mehrerer Vektoren, wie hierin beschrieben, die eine oder mehrere Komponenten des hierin beschriebenen Multi-Flap-Prime-Editing-Systems kodieren, eines oder mehrere Transkripte davon, und/oder eines oder davon transkribierte Proteine in eine Wirtszelle. In einigen Aspekten stellt die Erfindung ferner Zellen bereit, die durch solche Verfahren hergestellt werden, und Organismen (wie Tiere, Pflanzen oder Pilze), die solche Zellen umfassen oder daraus hergestellt werden. In einigen Ausführungsformen wird ein Multi-Flap-Prime-Editor, wie hierin beschrieben, in Kombination mit (und optional komplexiert mit) einer Leitsequenz in eine Zelle eingeschleust. Herkömmliche Gentransferverfahren auf viraler und nicht-viraler Basis können verwendet werden, um Nukleinsäuren in Säugetierzellen oder Ziel-Gewebe einzuführen. Solche Verfahren können verwendet werden, um Nukleinsäuren, die Komponenten eines Multi-Flap-Prime-Editor-Systems kodieren, an Zellen in Kultur oder in einem Wirtsorganismus einzuschleusen. Nicht-virale Vektoreinschleusungssysteme umfassen DNA-Plasmide, RNA (z. B. ein Transkript eines hierin beschriebenen Vektors), nackte Nukleinsäure und Nukleinsäure, die mit einem Einschleusungsvehikel, wie einem Liposom, komplexiert ist. Virale Vektoreinschleusungssysteme umfassen DNA- und RNA-Viren, die nach Einschleusung in die Zelle entweder episomale oder integrierte Genome aufweisen. Eine Übersicht über Gentherapieverfahren ist zu finden unter Anderson, Science 256:808-813 (1992); Nabel & Felgner, TIBTECH 11:211-217 (1993); Mitani & Caskey, TIBTECH 11:162- 166 (1993); Dillon, TIBTECH 11:167-175 (1993); Miller, Nature 357:455-460 (1992); Van Brunt, Biotechnology 6(10):1149-1154 (1988); Vigne, Restorative Neurology and Neuroscience 8:35-36 (1995); Kremer & Perricaudet, British Medical Bulletin 51(1):31-44 (1995); Haddada et al., in Current Topics in Microbiology and Immunology Doerfler and Bihm (eds) (1995); and Yu et al., Gene Therapy 1 :13-26 (1994).
Verfahren zur nicht-viralen Einschleusung von Nukleinsäuren umfassen Lipofektion, Nukleofektion, Mikroinjektion, Biolistik, Virosomen, Liposomen, Immunoliposomen, Polykation oder Lipid:Nukleinsäure-Konjugate, nackte DNA, künstliche Virionen und Wirkstoff-verstärkte Aufnahme von DNA. Die Lipofektion ist z. B. in US-Pat. Nr. 5,049,386 , 4,946,787 und 4,897,355 ) beschrieben und Lipofektionsreagenzien werden kommerziell verkauft (z. B. Transfectam™ und Lipofectin™). Kationische und neutrale Lipide, die für eine effiziente Rezeptor-Erkennungs-Lipofektion von Polynukleotiden geeignet sind, umfassen die von Feigner, WO 91/17424 ; WO 91/16024 . Die Einschleusung kann in Zellen (z. B. In-vitro- oder Ex-vivo-Verabreichung) oder Ziel-Gewebe (z. B. In-vivo-Verabreichung) erfolgen.
Die Herstellung von Lipid:Nukleinsäure-Komplexen, einschließlich zielgerichteter Liposomen, wie Immunlipid-Komplexe, ist dem Fachmann gut bekannt (siehe z. B. Crystal, Science 270:404-410 (1995); Blaese et al., Cancer Gen Ther. 2:291-297 (1995); Behr et al., Bioconjugate Chem. 5:382-389 (1994); Remy et al., Bioconjugate Chem. 5:647-654 (1994); Gao et al., Gene Therapy 2:710-722 (1995); Ahmad et al., Cancer Res. 52:4817-4820 (1992); US-Pat. Nr. 4,186,183 , 4,217,344 , 4,235,871 , 4,261,975 , 4,485,054 , 4,501,728 , 4,774,085 , 4,837,028 und 4,946,787 ).
Die Verwendung von auf RNA- oder DNA-Viren basierenden Systemen zur Einschleusung von Nukleinsäuren nutzt hochentwickelte Prozesse, um ein Virus auf spezifische Zellen im Körper zu richten und die virale Nutzlast zum Zellkern zu transportieren. Virale Vektoren können Patienten direkt (in vivo) verabreicht werden oder sie können verwendet werden, um Zellen in vitro zu behandeln, und die modifizierten Zellen können gegebenenfalls Patienten (ex vivo) verabreicht werden. Herkömmliche auf Viren basierende Systeme könnten retrovirale, Lentivirus-, adenovirale, adenoassoziierte und Herpes-simplex- Virusvektoren für den Gentransfer beinhalten. Die Integration in das Wirtsgenom ist mit den Retrovirus-, Lentivirus- und Adeno-assoziierten Virus-Gentransferverfahren möglich, was oft zu einer Langzeitexprimierung des eingefügten Transgens führt. Darüber hinaus wurden in vielen verschiedenen Zelltypen und Ziel-Geweben hohe Transduktionseffizienzen beobachtet.
Der Tropismus eines Virus kann durch den Einbau fremder Hüllproteine verändert werden, wodurch die potenzielle Ziel-Population von Ziel-Zellen erweitert wird. Lentivirale Vektoren sind retrovirale Vektoren, die sich nicht teilende Zellen transduzieren oder infizieren können und typischerweise hohe Virustiter produzieren. Die Auswahl eines retroviralen Gentransfersystems würde daher vom Ziel-Gewebe abhängen. Retrovirale Vektoren bestehen aus cis-wirkenden langen terminalen Wiederholungen mit einer Verpackungskapazität für bis zu 6-10 kb Fremdsequenz. Die minimalen cis-wirkenden LTRs (long terminal repeats - LTR) reichen für die Replikation und Verpackung der Vektoren aus, die dann verwendet werden, um das therapeutische Gen in die Ziel-Zelle zu integrieren, um eine permanente Transgenexprimierung bereitzustellen. Weit verbreitete retrovirale Vektoren umfassen solche, die auf dem Murinen Leukämievirus (murine leukemia virus - MuLV), dem Gibbonaffen- Leukämievirus (gibbon ape leukemia virus - GaLV), dem Affen-Immundefizienzvirus (Simian Immuno deficiency virus - SIV), dem Humanen Immundefizienzvirus (human immuno deficiency virus - HIV) und Kombinationen davon basieren (siehe z. B. Buchscher et al ., J. Virol. 66:2731-2739 (1992); Johann et al., J. Virol. 66:1635-1640 (1992); Sommnerfelt et al., Virol. 176:58-59 (1990); Wilson et al., J. Virol. 63:2374-2378 (1989); Miller et al., J. Virol. 65:2220-2224 (1991); PCT/US94/05700). Bei Anwendungen, bei denen eine vorübergehende Exprimierung bevorzugt wird, können auf Adenovirus basierende Systeme verwendet werden. Vektoren auf Adenovirusbasis sind in vielen Zelltypen zu einer sehr hohen Transduktionseffizienz fähig und erfordern keine Zellteilung. Mit solchen Vektoren wurden hohe Titer und Exprimierungsniveaus erhalten. Dieser Vektor kann in einem relativ einfachen System in großen Mengen hergestellt werden. Adeno-assoziierte Virus-(„AAV“)-Vektoren können auch verwendet werden, um Zellen mit Ziel-Nukleinsäuren zu transduzieren, z. B. in der In-vitro-Produktion von Nukleinsäuren und Peptiden, und für in vivo und ex vivo Gentherapie-Verfahren (siehe z. B. West et al., Virology 160:38-47 (1987); US-Pat. Nr. 4,797,368 ; WO 93/24641 ; Kotin, Human Gene Therapy 5:793-801 (1994); Muzyczka, J. Clin. Invest. 94:1351 (1994). Die Konstruktion rekombinanter AAV-Vektoren wird in einer Reihe von Veröffentlichungen beschrieben, einschließlich US-Pat. Nr. 5,173,414 ; Tratschin et al., Mol. Cell. Biol. 5:3251-3260 (1985); Tratschin et al., Mol. Cell. Biol. 4:2072-2081 (1984); Hermonat & Muzyczka, PNAS 81:6466-6470 (1984); und Samulski et al., J. Virol. 63:03822- 3828 (1989).
Verpackungszellen werden typischerweise verwendet, um Viruspartikel zu bilden, die eine Wirtszelle infizieren können. Solche Zellen umfassen 293-Zellen, die Adenoviren verpacken, und ψ2-Zellen oder PA317-Zellen, die Retroviren verpacken. Virale Vektoren, die in der Gentherapie verwendet werden, werden normalerweise durch die Herstellung einer Zelllinie erzeugt, die einen Nukleinsäurevektor in ein virales Partikel verpackt. Die Vektoren enthalten typischerweise die minimalen viralen Sequenzen, die für die Verpackung und die anschließende Integration in einen Wirt erforderlich sind, wobei andere virale Sequenzen durch eine Exprimierungskassette für das/die zu exprimierende(n) Polynukleotid(e) ersetzt werden. Die fehlenden viralen Funktionen werden typischerweise in trans von der Verpackungszellinie geliefert. Beispielsweise besitzen in der Gentherapie verwendete AAV-Vektoren typischerweise nur ITR-Sequenzen aus dem AAV-Genom, die für die Verpackung und Integration in das Wirtsgenom benötigt werden. Virale DNA wird in eine Zelllinie verpackt, die ein Helferplasmid enthält, das für die anderen AAV-Gene, nämlich rep und cap, kodiert, denen jedoch ITR-Sequenzen fehlen. Die Zelllinie kann auch mit dem Adenovirus als Helfer infiziert werden. Das Helfervirus fördert die Replikation des AAV-Vektors und die Exprimierung von AAV-Genen aus dem Helferplasmid. Das Helferplasmid wird aufgrund fehlender ITR-Sequenzen nicht in signifikanten Mengen verpackt. Die Kontamination mit dem Adenovirus kann z. B. durch Hitzebehandlung, auf die Adenoviren empfindlicher sind als AAV, reduziert werden. Dem Fachmann sind zusätzliche Verfahren zur Einschleusung von Nukleinsäuren in Zellen bekannt. Siehe zum Beispiel US20030087817 , das hierin durch Bezugnahme aufgenommen ist.
In verschiedenen Ausführungsformen können die Dual-PE-Konstrukte (einschließlich der Split-Konstrukte) zur Einschleusung in einen oder mehrere rAAV-Vektoren konstruiert werden. Ein rAAV in Bezug auf eines der hierin bereitgestellten Verfahren und Zusammensetzungen kann jeden beliebigen Serotyp, einschließlich alle beliebigen Derivate oder Pseudotypen (z. B. 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 2/1, 2/5, 2/8, 2/9, 3/1, 3/5, 3/8 oder 3/9) aufweisen. Ein rAAV kann eine genetische Ladung umfassen (d. h. einen rekombinanten Nukleinsäurevektor, der ein Gen von Interesse exprimiert, wie etwa ein ganzes oder gesplittetes PE-Fusionsprotein, das von dem rAAV in eine Zelle getragen wird), die in eine Zelle eingeschleust werden soll. Ein rAAV kann chimär sein.
Wie hierin verwendet, bezieht sich der Serotyp eines rAAV auf den Serotyp der Kapsidproteine des rekombinanten Virus. Nicht einschränkende Beispiele für Derivate und Pseudotypen beinhalten rAAV2/1, rAAV2/5, rAAV2/8, rAAV2/9, AAV2-AAV3-Hybrid, AAVrh.10, AAVhu.14, AAV3a/3b, AAVrh32.33, AAV-HSC15, AAV-HSC17, AAVhu.37, AAVrh.8, CHt-P6, AAV2.5, AAV6.2, AAV2i8, AAV-HSC15/17, AAVM41, AAV9.45, AAV6(Y445F/Y731F), AAV2.5T, AAV-HAE1/2, AAV-Klon 32/83, AAVShH10, AAV2 (Y- >F), AAV8 (Y733F), AAV2.15, AAV2.4, AAVM41 und AAVr3.45. Ein nicht einschränkendes Beispiel für Derivate und Pseudotypen, die chimäre VP1-Proteine aufweisen, ist rAAV2/5-1VP1u, das das Genom von AAV2, das Kapsid-Rückgrat von AAV5 und VPlu von AAV1 aufweist. Andere nicht einschränkende Beispiele für Derivate und Pseudotypen, die chimäre VP1-Proteine aufweisen, sind rAAV2/5-8VP1u, rAAV2/9-1VP1u und rAAV2/9- 8 VP1u.
AAV-Derivate/Pseudotypen und Verfahren zur Herstellung solcher Derivate/Pseudotypen sind im Stand der Technik bekannt (siehe z. B. Mol Ther. 2012 Apr; 20(4):699-708. doi: 10.1038/mt.2011.287. Epub 24. Jan 2012. The AAV vector toolkit: poised at the clinical crossroads. Asokan A1, Schaffer DV, Samulski RJ.). Verfahren zur Herstellung und Verwendung pseudotypisierter rAAV-Vektoren sind im Stand der Technik bekannt (siehe, e.g., Duan et al., J. Virol., 75:7662-7671, 2001; Halbert et al., J. Virol., 74:1524-1532, 2000; Zolotukhin et al., Methods, 28:158-167, 2002; und Auricchio et al., Hum. Molec. Genet., 10:3075-3081, 2001).
Verfahren zur Herstellung oder Verpackung von rAAV-Partikeln sind im Stand der Technik bekannt und Reagenzien sind im Handel erhältlich (siehe z. B. Zolotukhin et al. Production and purification of serotype 1, 2, and 5 recombinant adeno-associated viral vectors. Methods 28 (2002) 158-167; und US-Patentveröffentlichungsnummern US20070015238 und US20120322861 , die hierin durch Bezugnahme aufgenommen sind; und Plasmide und Kits, erhältlich von ATCC und Cell Biolabs, Inc.). Beispielsweise kann ein Plasmid, das ein Gen von Interesse beinhaltet, mit einem oder mehreren Helferplasmiden kombiniert werden, die beispielsweise ein rep-Gen (das beispielsweise Rep78, Rep68, Rep52 und Rep40 kodiert) und ein cap-Gen (das VP1, VP2 und VP3 kodiert, einschließlich einer modifizierten VP2-Region, wie hierin beschrieben) enthalten und in rekombinante Zellen transfiziert werden, so dass das rAAV-Partikel verpackt und anschließend gereinigt werden kann.
Rekombinantes AAV kann einen Nukleinsäurevektor umfassen, der mindestens Folgendes umfassen kann: (a) eine oder mehrere heterologe Nukleinsäureregionen, die eine Sequenz umfassen, die ein Protein oder Polypeptid von Interesse oder eine RNA von Interesse (z. B. eine siRNA oder microRNA) kodiert, und (b) eine oder mehrere Regionen, die Inverted Terminal Repeat (ITR)-Sequenzen umfassen (z. B. Wildtyp-ITR-Sequenzen oder manipulierte ITR-Sequenzen), die die eine oder mehreren Nukleinsäureregionen (z. B. heterologe Nukleinsäureregionen) flankieren. Hierin werden heterologe Nukleinsäureregionen, die eine Sequenz umfassen, die ein Protein von Interesse oder eine RNA von Interesse kodiert, als Gene von Interesse bezeichnet.
Jedes beliebige der hierin bereitgestellten rAAV-Partikel kann Kapsidproteine aufweisen, die Aminosäuren unterschiedlicher Serotypen außerhalb der VP1u-Region aufweisen. In einigen Ausführungsformen unterscheidet sich der Serotyp des Rückgrats des VP1-Proteins vom Serotyp der ITRs und/oder des Rep-Gens. In einigen Ausführungsformen ist der Serotyp des Rückgrats des VP1-Kapsidproteins eines Partikels derselbe wie der Serotyp der ITRs. In einigen Ausführungsformen ist der Serotyp des Rückgrats des VP1- Kapsidproteins eines Partikels derselbe wie der Serotyp des Rep-Gens. In einigen Ausführungsformen umfassen Kapsidproteine von rAAV-Partikeln Aminosäuremutationen, die zu einer verbesserten Transduktionseffizienz führen.
In einigen Ausführungsformen umfasst der Nukleinsäurevektor eine oder mehrere Regionen, die eine Sequenz umfassen, die die Exprimierung der Nukleinsäure (z. B. der heterologen Nukleinsäure) erleichtert, z. B. Exprimierungskontrollsequenzen, die operativ mit der Nukleinsäure verbunden sind. Im Stand der Technik sind zahlreiche solcher Sequenzen bekannt. Nicht einschränkende Beispiele für Exprimierungskontrollsequenzen umfassen Promotoren, Isolatoren, Silencer, Response-Elemente, Introns, Enhancer, Initiationsstellen, Terminationssignale und Poly(A)-Schwänze. Jede Kombination solcher Kontrollsequenzen wird hierin in Betracht gezogen (z. B. ein Promotor und ein Enhancer).
Endgültige AAV-Konstrukte können eine Sequenz enthalten, die für die PEgRNA kodiert. In anderen Ausführungsformen können die AAV-Konstrukte eine Sequenz enthalten, die die Zweitstellen-Nicking-Leit-RNA kodiert. In noch anderen Ausführungsformen können die AAV-Konstrukte eine Sequenz enthalten, die die Zweitstellen-Nicking-Leit-RNA kodiert, und eine Sequenz, die die PEgRNA kodiert.
In verschiedenen Ausführungsformen können die PEgRNAs und die Zweitstellen- Nicking-Leit-RNAs von einem geeigneten Promotor exprimiert werden, wie beispielsweise einem humanen U6 (hU6)-Promotor, einem Maus-U6 (mU6)-Promotor oder einem anderen geeigneten Promotor. Die PEgRNAs und die Zweitstellen-Nicking-Leit-RNAs können von denselben Promotoren oder unterschiedlichen Promotoren getrieben werden.
In einigen Ausführungsformen werden rAAV-Konstrukte oder die hierin beschriebenen Zusammensetzungen einem Patienten enteral verabreicht. In einigen Ausführungsformen werden rAAV-Konstrukte oder die hierin beschriebenen Zusammensetzungen dem Patienten parenteral verabreicht. In einigen Ausführungsformen werden ein rAAV-Partikel oder die hierin beschriebenen Zusammensetzungen einem Patienten subkutan, intraokular, intravitreal, subretinal, intravenös (IV), intracerebroventrikulär, intramuskulär, intrathekal (IT), intrazisternal, intraperitoneal, durch Inhalation, topisch oder durch direkte Injektion in eine oder mehrere Zellen, Gewebe oder Organe verabreicht. In einigen Ausführungsformen werden ein rAAV-Partikel oder die hierin beschriebenen Zusammensetzungen dem Patienten durch Injektion in die Leberarterie oder Pfortader verabreicht.
Gesplittete Multi-Flap-PE-Vektor-basierte Strategien
In diesem Aspekt können die Multi-Flap-Prime-Editoren an einer Splitstelle geteilt werden und als zwei Hälften eines ganzen/kompletten Prime-Editors bereitgestellt werden. Die beiden Hälften können in Zellen eingeschleust werden (z. B. als exprimierte Proteine oder auf separaten Exprimierungsvektoren) und sobald sie in der Zelle in Kontakt sind, bilden die beiden Hälften den vollständigen Prime-Editor durch die selbstspleißende Wirkung der Inteine auf jeder Prime-Editor-Hälfte. Gesplittete Inteinsequenzen können in jede der Hälften des kodierten Prime-Editors eingebaut werden, um ihr Trans-Spleißen innerhalb der Zelle und die gleichzeitige Wiederherstellung des vollständigen, funktionsfähigen PE zu erleichtern.
Diese Split-Intein-basierten Verfahren überwinden mehrere Barrieren für die In-vivo- Einschleusung. Zum Beispiel ist die DNA, die Prime-Editoren kodiert, größer als die rAAV- Verpackungsgrenze und erfordert daher spezielle Lösungen. Eine solche Lösung besteht darin, den Editor zu formulieren, der fusioniert ist, um Intein-Paare zu splitten, die in zwei separate rAAV-Partikel verpackt sind, die, wenn sie gemeinsam in eine Zelle eingeschleust werden, das funktionelle Editor-Protein rekonstituieren. Es werden einige weitere spezielle Überlegungen zur Berücksichtigung der einzigartigen Merkmale des Mulit-Flap-Prime-Editing beschrieben, die die Optimierung von Zweit-Nickstellen-Zielen und die richtige Verpackung von Multi- Flap-Prime-Editoren in Virusvektoren, einschließlich Lentiviren und rAAV, beinhalten.
In diesem Aspekt können die Multi-Flap-Prime-Editoren an einer Splitstelle geteilt werden und als zwei Hälften eines ganzen/kompletten Prime-Editors bereitgestellt werden. Die beiden Hälften können in Zellen eingeschleust werden (z. B. als exprimierte Proteine oder auf separaten Exprimierungsvektoren) und sobald sie in der Zelle in Kontakt sind, bilden die beiden Hälften den vollständigen Prime-Editor durch die selbstspleißende Wirkung der Inteine auf jeder Prime-Editor-Hälfte. Split-Intein-Sequenzen können in jede der Hälften des kodierten Prime-Editors eingebaut werden, um ihr Trans-Spleißen innerhalb der Zelle und die gleichzeitige Wiederherstellung des vollständigen, funktionsfähigen PE zu erleichtern.
66 stellt eine Ausführungsform eines Prime-Editors dar, der als zwei PE- Halbproteine bereitgestellt wird, die als ganzer Prime-Editor durch die selbstspleißende Wirkung der Split-Intein-Hälften, die sich am Ende oder Anfang jedes der Prime-Editor- Halbproteins befinden, regenerieren. Die hierin beschriebenen Multi-Flap-Prime-Editoren können ebenfalls auf die gleiche Weise bereitgestellt werden. Wie hierin verwendet, bezieht sich der Begriff „PE N-terminale Hälfte“ auf die N-terminale Hälfte eines vollständigen Prime- Editors und umfasst das „N-Intein“ am C-terminalen Ende der PE-N-terminalen Hälfte (d. h. des N-terminalen Exteins) des kompletten Prime-Editors. Das „N-Intein“ bezieht sich auf die N-terminale Hälfte einer vollständigen, voll ausgebildeten Split-Intein-Einheit. Wie hierin verwendet, bezieht sich der Begriff „PE-C-terminale Hälfte“ auf die C-terminale Hälfte eines vollständigen Prime-Editors und umfasst das „C-Intein“ am N-terminalen Ende der C- terminalen Hälfte (d. h. des C-terminalen Exteins) des kompletten Prime-Editors. Wenn die beiden Halbproteine, d. h. die N-terminale Hälfte von PE und die C-terminale Hälfte von PE, miteinander in Kontakt kommen, z. B. innerhalb der Zelle, durchlaufen das N-Intein und das C-Intein den gleichzeitigen Prozess der Selbstexzision und die Bildung einer Peptidbindung zwischen dem C-terminalen Ende der N-terminalen Hälfte von PE und dem N-terminalen Ende der C-terminalen Hälfte von PE, um das vollständige Prime-Editor-Protein, das die vollständige napDNAbp-Domäne umfasst (z. B. Cas9-Nickase ) und die RT-Domäne zu reformieren. Obwohl in der Zeichnung nicht gezeigt, kann der Prime-Editor auch zusätzliche Sequenzen umfassen, einschließlich NLS am N-Terminus und/oder C-Terminus, sowie Aminosäure-Linker-Sequenzen, die jede Domäne verbinden.
In verschiedenen Ausführungsformen können die Multi-Flap-Prime-Editoren als zwei Halbproteine (d. h. eine PE N-terminale Hälfte und eine PE C-terminale Hälfte) durch „Splitting“ des gesamten Prime-Editors als „Splitstelle“ hergestellt werden. Die „Splitstelle“ bezieht sich auf die Stelle der Insertion von Split-Intein-Sequenzen (d. h. das N-Intein und das C-Intein) zwischen zwei benachbarten Aminosäureresten im Prime-Editor. Genauer gesagt bezieht sich die „Splitstelle“ auf die Stelle, an der der gesamte Prime-Editor in zwei separate Hälften geteilt wird, wobei er in jeder Hälfte an der Splitstelle entweder mit dem N-Intein- oder dem C-Intein-Motiv fusioniert ist. Die Splitstelle kann sich an jeder geeigneten Stelle im Prime-Editor-Fusionsprotein befinden, aber vorzugsweise befindet sich die Splitstelle an einer Position, die die Bildung von zwei Halbproteinen ermöglicht, die für die Einschleusung (z. B. durch einen Exprimierungsvektor) geeignet bemessen sind und wobei die Inteine, die an den Splitstellen-Termini mit jeder Proteinhälfte fusioniert sind, zur Verfügung stehen, um ausreichend miteinander zu interagieren, wenn eine Proteinhälfte mit der anderen Proteinhälfte in der Zelle in Kontakt kommt.
In einigen Ausführungsformen befindet sich die Splitstelle in der napDNAbp-Domäne. In anderen Ausführungsformen befindet sich die Splitstelle in der RT-Domäne. In anderen Ausführungsformen befindet sich die Splitstelle in einem Linker, der die napDNAbp-Domäne und die RT-Domäne verbindet.
In verschiedenen Ausführungsformen erfordert die Ausgestaltung von Splittstellen die Suche nach Stellen zum Splitten und Einfügen eines N- und C-terminalen Inteins, die beide strukturell zulässig sind, um die beiden halben Prime-Editor-Domänen in zwei verschiedene AAV-Genome zu verpacken. Darüber hinaus können Inteinreste, die für das Trans-Spleißen notwendig sind, eingebaut werden, indem Reste am N-Terminus des C-terminalen Exteins mutiert werden oder Reste eingefügt werden, die eine Intein-„Narbe“ hinterlassen.

Beispielhafte Split-Konfigurationen von Split-Prime-Editoren, die entweder die SpCas9-Nickase oder die SaCas9-Nickase umfassen, sind wie folgt.

S. PYOGENES PE, SPLIT AT LINKER, N TERMINAL PORTION

STRUCTURE: [N EXTEIN]-[N INTEIN]

KEY: NLS (SEQ ID NO: 124, 125) CAS9 (SEQ ID NO: 445) LINKER (SEQ ID NO: 446) NPUN INTEIN (SEQ ID NO: 447)

S. PYOGENES PE, SPLIT AT LINKER, C TERMINAL PORTION

STRUCTURE: [C INTEIN]-[C EXTEIN]

KEY: NLS (SEQ ID NO: 124, 125) LINKER 1 (SEQ ID NO: 453) LINKER 2 (SEQ ID NO: 174)

NPUC INTEIN (SEQ ID NO: 452) RT (SEQ ID NO: 454)

S. AUREUS PE, SPLIT BETWEEN RESIDUES 740/741, N TERMINAL PORTION

STRUCTURE: [N EXTEIN]-[N INTEIN]

KEY: NLS (SEQ ID NO: 124, 125) CAS9 (SEQ ID NO: 460) LINKER (SEQ ID NO: 174) NPUN INTEIN (SEQ ID NO: 462)

S. AUREUS PE, SPLIT BETWEEN RESIDUES 740/741, C TERMINAL PORTION

STRUCTURE: [C INTEIN]-[C EXTEIN]

KEY: NLS (SEQ ID NO: 124, 125) CAS9 (SEQ ID NO: 467) LINKER 1 (SEQ ID NO: 127) LINKER 2 (SEQ ID NO: 174) NPUC INTEIN (SEQ ID NO: 452) RT (SEQ ID NO: 471)

In verschiedenen Ausführungsformen unter Verwendung von SpCas9-Nickase (SEQ- ID-Nr: 18, 1368 Aminosäuren) kann, als ein Beispiel, das Splitting zwischen zwei beliebigen Aminosäuren zwischen 1 und 1368 erfolgen. Bevorzugte Splittings befinden sich jedoch zwischen der zentralen Region des Proteins, z. B. von den Aminosäuren 50-1250 oder von 100- 1200 oder von 150-1150 oder von 200-1100 oder von 250-1050 oder von 300-1000 oder von 350-950 oder von 400-900 oder von 450-850 oder von 500-800 oder von 550-750 oder von 600-700 von SEQ-ID-Nr: 18. In bestimmten beispielhaften Ausführungsformen kann die Splitstelle zwischen 740/741 oder 801/802 oder 1010/1011 oder 1041/1042 liegen. In anderen Ausführungsformen kann die Splitstelle zwischen 1/2, 2/3, 3/4, 4/5, 5/6, 6/7, 7/8, 8/9, 9/10, 10/11, 12/13, 14/15, 15/16, 17/18, 19/20, 20/21, 21/22, 22/23, 23/24, 24125, 25/26, 26/27, 27/28 , 28/29, 29/30, 30/31, 31/32, 32/33, 33/34, 34/35, 35/36, 36/37, 38/39, 39/40, 41/42, 42 /43, 43/44, 44/45, 45/46, 46/47, 47/48, 48/49, 49/50, 51/52, 52/53, 53/54, 54/55, 55/56 , 56/57, 57/58, 58/59, 59/60, 61/62, 62/63, 63/64, 64/65, 65/66, 66/67, 67/68, 68/69, 69 /70, 71/72, 72/73, 73/74, 74/75, 75/76, 76/77, 77/78, 78/79, 79/80, 81/82, 82/83, 83/84 , 84/85, 85/86, 86/87, 87/88, 88/89, 89/90 oder zwischen zwei beliebigen Paaren benachbarter Reste zwischen 90-100, 100-150, 150-200, 200-250, 250-300, 300-350, 350-400, 450-500, 500-550, 550-600, 600-650, 650-700, 700-750, 750-800, 800-850, 850-900, 900- 950, 950-1000, 1000-1050, 1050-1100, 1100-1150, 1150-1200, 1200-1250, 1250-1300, 1300-1350 und 1350-1368, bezogen auf SpCas9 von SEQ-ID-Nr: 18 liegen, zwischen zwei beliebigen entsprechenden Resten in einer Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 %, 99 % oder 99,9 % Sequenzidentität mit SEQ-ID-Nr: 18, oder zwischen zwei beliebigen entsprechenden Resten in einer Variante oder einem Äquivalent von SpCas9 einer der Aminosäuresequenzen SEQ-ID-Nr. 19-88, oder einer Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 %, 99 % oder 99,9 % Sequenzidentität mit einer der SEQ-ID-Nm: 19-88.

In verschiedenen Ausführungsformen können die geteilten Inteinsequenzen durch die folgenden Inteinsequenzen konstruiert werden.

NAME	SEQUENZ VON LIGANDENABHÄNGIGEM INTEIN
2-4 INTEIN:
3-2 INTEIN
30R3-1 INTEIN
30R3-2 INTEIN
30R3-3 INTEIN

37R3-1 INTEIN
37R3-2 INTEIN
37R3-3 INTEIN

In verschiedenen anderen Ausführungsformen können die geteilten Inteinsequenzen wie folgt verwendet werden:

INTEIN-N INTEIN-C

NPU-N
NPU-C
In verschiedenen Ausführungsformen können die gesplitteten Inteine verwendet werden, um getrennte Teile eines vollständigen PE-Fusionsproteins separat in eine Zelle einzuschleusen, die bei Exprimierung in einer Zelle durch das Trans-Spleißen als vollständiges PE-Fusionsprotein rekonstituiert werden.
In einigen Ausführungsformen stellt die Offenbarung ein Verfahren zur Einschleusung eines PE-Fusionsproteins in eine Zelle bereit, umfassend:

(a) Konstruieren eines ersten Exprimierungsvektors, der ein N-terminales Fragment des PE- Fusionsproteins kodiert, das an eine erste geteilte Inteinsequenz fusioniert ist;
(b) Konstruieren eines zweiten Exprimierungsvektors, der ein C-terminales Fragment des PE- Fusionsproteins kodiert, das an eine zweite geteilte Inteinsequenz fusioniert ist;
(c) Einschleusen des ersten und zweiten Exprimierungsvektors in eine Zelle,

Die Splitstelle kann sich in einigen Ausführungsformen an beliebiger Stelle in der Prime-Editor-Fusion befinden, einschließlich der napDNAbp-Domäne, des Linkers oder der Reverse-Transkriptase-Domäne.
In anderen Ausführungsformen befindet sich die Splitstelle in der napDNAbp-Domäne.
In noch anderen Ausführungsformen befindet sich die Splitstelle in der reversen Transkriptase- oder Polymerase-Domäne.
In noch anderen Ausführungsformen befindet sich die Splitstelle im Linker.
In verschiedenen Ausführungsformen stellt die vorliegende Offenbarung Multi-Flap- Prime-Editoren bereit, die einen napDNAbp (z. B. eine Cas9-Domäne) und eine reverse Transkriptase umfassen, wobei einer oder beide von napDNAbp und/oder der reversen Transkriptase ein Intein umfassen, beispielsweise ein ligandenabhängiges Intein. Typischerweise ist das Intein ein ligandenabhängiges Intein, das in Abwesenheit eines Liganden (z. B. kleine Moleküle wie 4-Hydroxytamoxifen, Peptide, Proteine, Polynukleotide, Aminosäuren und Nukleotide) keine oder nur eine minimale Proteinspleißaktivität zeigt. Ligandenabhängige Inteine sind bekannt und umfassen diejenigen, die in der US- Patentanmeldung U.S.S.N. 14/004,280, veröffentlicht als US 2014/0065711 A1, beschrieben ist, deren gesamter Inhalt hierin durch Bezugnahme aufgenommen ist. Darüber hinaus umfasst das Intein bei der Verwendung der Split-Cas9-Architektur in einigen Ausführungsformen eine Aminosäuresequenz ausgewählt aus der Gruppe bestehend aus SEQ-ID-Nm: 8-15, 447, 452, 462, und 472-479.
In verschiedenen Ausführungsformen sind die napDNAbp-Domänen kleinere napDNAbp-Domänen im Vergleich zur kanonischen SpCas9-Domäne von Seq- ID-Nr: 18.
Das kanonische SpCas9-Protein ist 1368 Aminosäuren lang und hat ein vorhergesagtes Molekulargewicht von 158 Kilodalton. Der Begriff „kleine Cas9-Variante“, wie hierin verwendet, bezieht sich auf jede Cas9-Variante - natürlich vorkommend, technisch hergestellt oder anderweitig - die weniger als mindestens 1300 Aminosäuren oder mindestens weniger als 1290 Aminosäuren oder weniger als 1280 Aminosäuren oder weniger als 1270 Aminosäuren oder weniger als 1260 Aminosäuren oder weniger als 1250 Aminosäuren oder weniger als 1240 Aminosäuren oder weniger als 1230 Aminosäuren oder weniger als 1220 Aminosäuren oder weniger als 1210 Aminosäuren oder weniger als 1200 Aminosäuren oder weniger als 1190 Aminosäuren oder weniger als 1180 Aminosäuren oder weniger als 1170 Aminosäuren oder weniger als 1160 Aminosäuren oder weniger als 1150 Aminosäuren oder weniger als 1140 Aminosäuren oder weniger als 1130 Aminosäuren oder weniger als 1120 Aminosäuren oder weniger als 1110 Aminosäuren oder weniger als 1100 Aminosäuren oder weniger als 1050 Aminosäuren oder weniger als 1000 Aminosäuren oder weniger als 950 Aminosäuren oder weniger als 900 Aminosäuren oder weniger als 850 Aminosäuren oder weniger als 800 Aminosäuren oder weniger als 750 Aminosäuren oder weniger als 700 Aminosäuren oder weniger als 650 Aminosäuren oder weniger als 600 Aminosäuren oder weniger als 550 Aminosäuren oder weniger als 500 Aminosäuren, aber mindestens mehr als etwa 400 Aminosäuren beträgt und die erforderlichen Funktionen des Cas9-Proteins beibehält.
In einer Ausführungsform, wie in Beispiel 20 dargestellt, umfasst die Spezifikation die folgenden Split-Intein-PE-Konstrukte, die zwischen den Resten 1024 und 1025 des kanonischen SpCas9 (SEQ-ID-Nr: 18) gesplittet sind (oder die als Reste 1023 bzw. 1024 bezeichnet werden können bezogen auf eine Met-Minus-SEQ-ID-Nr: 18).

Zunächst wird die Aminosäuresequenz von SEQ-ID-NR: 18 wie folgt dargestellt, wobei die Lage der Splittstelle zwischen 1024 („K“) und 1025 („S“) Resten angezeigt wird:

Beschreibung	Sequenz	SEQ-ID-Nr:
SpCas9 Streptococcus pyogenes M1 SwissProt Zugriff Nr. Q99ZW2 Wildtyp		SEQ-ID-Nr: 18, gekennzeichnet mit Splitstelle 1024/1025 in Fettdruck Das M an Position 1 ist in bestimmten Ausführung sformen nicht notwendiger weise im PE- Fusionsprotein vorhanden. Somit ist die Nummerierung der Splitstelle 1023/1024 für den Fall, dass die Aminosäure sequenz Met an Position 1 ausschließt.

In dieser Konfiguration ist die Aminosäuresequenz der N-terminalen Hälfte (Aminosäuren 1-1024) wie folgt:
In dieser Konfiguration ist die Aminosäuresequenz der N-terminalen Hälfte (Aminosäuren 1-1023) (wobei das Protein Met-Minus an Position 1 ist) wie folgt:
In dieser Konfiguration ist die Aminosäuresequenz der C-terminalen Hälfte (Aminosäuren 1024-1368 (oder gezählt als Aminosäuren 1023-1367 in einem Met-Minus- Cas9) wie folgt:
Wie in Beispiel 20 gezeigt, ist das PE2-Konstrukt (basierend auf SpCas9 von SEQ-ID- Nr: 18) an Position 1023/1024 (relativ zu einer Met-Minus SEQ-ID-Nr 18) in zwei separate Konstrukte gesplittet, wie folgt:

SpPE2-Split bei 1023/1024 N-terminale Hälfte

Legende: NLS, Cas9, mutierte Reste, Linker, NpuNIntein, NpuC-Intein, RT
SpPE2-Split bei 1023/1024, C-terminale Hälfte
Legende: NLS, Cas9, mutierte Reste. Linker, NpuIntein, NpuC-Intein, RT
Die vorliegende Offenbarung erwägt auch Verfahren zum Einschleusen von Split- Intein-Multi-Flap-Prime-Editoren in Zellen und/oder zum Behandeln von Zellen mit Split- Intein-Multi-Flap-Prime-Editoren.
In einigen Ausführungsformen stellt die Offenbarung ein Verfahren zur Einschleusung eines PE-Fusionsproteins in eine Zelle bereit, umfassend:

(a) Konstruieren eines ersten Exprimierungsvektors, der ein N-terminales Fragment des PE-Fusionsproteins kodiert, das an eine erste geteilte Inteinsequenz fusioniert ist;
(b) Konstruieren eines zweiten Exprimierungsvektors, der ein C-terminales Fragment des PE-Fusionsproteins kodiert, das an eine zweite geteilte Inteinsequenz fusioniert ist;
(c) Einschleusen des ersten und zweiten Exprimierungsvektors in eine Zelle,

In bestimmten Ausführungsformen ist das N-terminale Fragment des PE- Fusionsproteins, das an eine erste geteilte Inteinsequenz fusioniert ist, SEQ-ID-Nr: 3875, oder eine Aminosäuresequenz mit mindestens 80 %, mindestens 85 %, mindestens 90 %, mindestens 95 %, mindestens 98 % oder mindestens 99,9 % Sequenzidentität mit SEQ-ID-Nr: 3875.
In anderen Ausführungsformen ist das C-terminale Fragment des PE-Fusionsproteins, das an eine erste geteilte Inteinsequenz fusioniert ist, SEQ-ID-Nr: 3876, oder eine Aminosäuresequenz mit mindestens 80 %, mindestens 85 %, mindestens 90 %, mindestens 95 %, mindestens 98 % oder mindestens 99,9 % Sequenzidentität mit SEQ-ID-Nr: 3876.
In anderen Ausführungsformen stellt die Offenbarung ein Verfahren für das Editing einer DNA-Sequenz innerhalb einer Zelle bereit, umfassend:

In bestimmten Ausführungsformen ist das N-terminale Fragment des PE- Fusionsproteins, das an eine erste geteilte Inteinsequenz fusioniert ist, SEQ-ID-Nr: 3875, oder eine Aminosäuresequenz mit mindestens 80 %, mindestens 85 %, mindestens 90 %, mindestens 95 %, mindestens 98 % oder mindestens 99,9 % Sequenzidentität mit SEQ-ID-Nr: 3875.
In anderen Ausführungsformen ist das C-terminale Fragment des PE-Fusionsproteins, das an eine erste geteilte Inteinsequenz fusioniert ist, SEQ-ID-Nr: 3876, oder eine Aminosäuresequenz mit mindestens 80 %, mindestens 85 %, mindestens 90 %, mindestens 95 %, mindestens 98 % oder mindestens 99,9 % Sequenzidentität mit SEQ-ID-Nr: 3876.
Einschleusung von PE-Ribonukleoprotein-Komplexen
In diesem Aspekt können die Multi-Flap-Prime-Editoren durch nicht-virale Einschleusungsstrategien eingeschleust werden, die die Einschleusung eines mit PEgRNA (d. h. einem PE-Ribonukleoprotein-Komplex) komplexierten Multi-Flap-Prime-Editors durch verschiedene Verfahren beinhalten, einschließlich Elektroporation und Lipid-Nanopartikel. Verfahren zur nicht-viralen Einschleusung von Nukleinsäuren umfassen Lipofektion, Nukleofektion, Mikroinjektion, Biolistik, Virosomen, Liposomen, Immunoliposomen, Polykation oder Lipid:Nukleinsäure-Konjugate, nackte DNA, künstliche Virionen und Wirkstoff-verstärkte Aufnahme von DNA. Die Lipofektion ist z. B. in US-Pat. Nr. 5,049,386 , 4,946,787 und 4,897,355 ) beschrieben und Lipofektionsreagenzien werden kommerziell verkauft (z. B. Transfectam™ und Lipofectin™). Kationische und neutrale Lipide, die für eine effiziente Rezeptor-Erkennungs-Lipofektion von Polynukleotiden geeignet sind, umfassen die von Feigner, WO 91/17424 ; WO 91/16024 . Die Einschleusung kann in Zellen (z. B. In-vitro- oder Ex-vivo-Verabreichung) oder Ziel-Geweben (z. B. In-vivo-Verabreichung) erfolgen.
Die Herstellung von Lipid:Nukleinsäure-Komplexen, einschließlich zielgerichteter Liposomen, wie Immunlipid-Komplexe, ist dem Fachmann gut bekannt (siehe z. B. Crystal, Science 270:404-410 (1995); Blaese et al., Cancer Gen Ther. 2:291-297 (1995); Behr et al., Bioconjugate Chem. 5:382-389 (1994); Remy et al., Bioconjugate Chem. 5:647-654 (1994); Gao et al., Gene Therapy 2:710-722 (1995); Ahmad et al., Cancer Res. 52:4817-4820 (1992); US-Pat. Nr. 4,186,183 , 4,217,344 , 4,235,871 , 4,261,975 , 4,485,054 , 4,501,728 , 4,774,085 , 4,837,028 , and 4,946,787 ).
Zusätzlich kann auf die folgenden Referenzen verwiesen werden, die Ansätze für die nicht-virale Verabreichung von Ribonukleoproteinkomplexen erörtern, von denen jede hierin durch Bezugnahme aufgenommen ist.
Chen, Sean, et al. „Highly efficient mouse genome editing by CRISPR ribonucleoprotein electroporation of zygotes.“ Journal of Biological Chemistry (2016): jbc- M116. PubMed
Zuris, John A., et al. „Cationic lipid-mediated delivery of proteins enables efficient protein-based genome editing in vitro and in vivo.“ Nature biotechnology 33.1 (2015): 73. PubMed
Rouet, Romain, et al. „Receptor-Mediated Delivery of CRISPR-Cas9 Endonuclease for Cell-Type-Specific Gene Editing.“ Journal of the American Chemical Society 140.21 (2018): 6596-6603. PubMed.
68C stellt Daten bereit, die zeigen, dass verschiedene offenbarte PE- Ribonukleoproteinkomplexe (PE2 bei hoher Konzentration, PE3 bei hoher Konzentration und PE3 bei niedriger Konzentration) auf diese Weise eingeschleust werden können.
Einschleusung von PE durch mRNA
Ein weiteres Verfahren, das verwendet werden kann, um Multi-Flap-Prime-Editoren und/oder PEgRNAs in Zellen einzuschleusen, in denen eine auf Multi-Flap-Prime-Editingbasierende Genom-Editing erwünscht ist, besteht in der Verwendung von Boten-RNA- (mRNA)-Einschleusungsverfahren und -technologien. Beispiele für mRNA- Einschleusungsverfahren und -Zusammensetzungen, die in der vorliegenden Offenbarung verwendet werden können, beinhalten beispielsweise PCT/ US2014/028330 , US8822663B2 , NZ700688A, ES2740248T3 , EP2755693A4 , EP2755986A4 , WO2014152940A1 , EP3450553B1 , BR112016030852A2 und EP3362461A1 , die hierin jeweils durch Bezugnahme in ihrer Gesamtheit aufgenommen sind. Eine zusätzliche Offenbarung, die hiermit durch Bezugnahme aufgenommen ist, findet sich in Kowalski et al., „Delivering the Messenger: Advances in Technologies for Therapeutic mRNA Delivery,“ Mol Therap., 2019; 27(4): 710-728.
Im Gegensatz zu DNA-Vektoren, die Multi-Flap-Prime-Editoren kodieren, hat die Verwendung von RNA als Einschleusungsmittel für Multi-Flap-Prime-Editoren den Vorteil, dass das genetische Material nicht in den Zellkern eindringen muss, um seine Funktion zu erfüllen. Die eingeschleuste mRNA kann direkt im Zytoplasma in das gewünschte Protein (z. B. Prime-Editor-Fusionsprotein) und Nukleinsäureprodukte (z. B. PEgRNA) translatiert werden. Um jedoch stabiler zu sein (z. B. RNA-FIGauenden Enzymen im Zytoplasma zu widerstehen), ist es in einigen Ausführungsformen notwendig, die mRNA zu stabilisieren, um die Einschleusungseffizienz zu verbessern. Bestimmte Einschleusungsträger wie kationische Lipide oder polymere Einschleusungsträger können auch dazu beitragen, die transfizierte mRNA vor endogenen RNase-Enzymen zu schützen, die andernfalls die therapeutische mRNA FIGauen könnten, die die gewünschten Prime-Editor-Fusionsproteine kodiert. Darüber hinaus bleibt trotz der erhöhten Stabilität der modifizierten mRNA die Einschleusung von mRNA, insbesondere von mRNA, die Protein in voller Länge kodiert, in Zellen in vivo auf eine Weise, die therapeutische Mengen an Proteinproduktion ermöglicht, eine Herausforderung.
Mit einigen Ausnahmen ist der intrazelluläre Transport von mRNA im Allgemeinen schwieriger als der von kleinen Oligonukleotiden und erfordert die Einkapselung in ein Transport-Nanopartikel, teilweise aufgrund der deutlich größeren Größe der mRNA-Moleküle (300-5.000 kDa, ~1-15 kb) im Vergleich zu anderen RNA-Typen (kleine interferierende RNAs [siRNAs], ~14 kDa; Antisense-Oligonukleotide [ASOs], 4-10 kDa).
mRNA muss die Zellmembran passieren, um das Zytoplasma zu erreichen. Die Zellmembran ist eine dynamische und gewaltige Barriere für die intrazelluläre Einschleusung. Sie besteht hauptsächlich aus einer Lipiddoppelschicht aus zwitterionischen und negativ geladenen Phospholipiden, wobei die polaren Köpfe der Phospholipide zur wässrigen Umgebung zeigen und die hydrophoben Schwänze einen hydrophoben Kern bilden.
In einigen Ausführungsformen umfassen die mRNA-Zusammensetzungen der Offenbarung mRNA (die einen Prime-Editor und/oder PEgRNA kodiert), ein Transportvehikel und optional ein Mittel, das den Kontakt mit der Ziel-Zelle und die anschließende Transfektion erleichtert.
In einigen Ausführungsformen kann die mRNA eine oder mehrere Modifikationen beinhalten, die der mRNA Stabilität verleihen (z. B. im Vergleich zur Wildtyp- oder nativen Version der mRNA) und an der damit verbundenen abnormalen Exprimierung des Proteins beteiligt sind. Eine oder mehrere Modifikationen des Wildtyps, die den Defekt korrigieren, können ebenfalls beinhaltet sein. Zum Beispiel können die Nukleinsäuren der Erfindung Modifikationen einer oder beider einer 5'-untranslatierten Region oder einer 3'-untranslatierten Region beinhalten. Solche Modifikationen können den Einschluss von Sequenzen beinhalten, die eine Teilsequenz des Immediate-Early-1-(IE1)-Gens des Cytomegalovirus (CMV), des Poly-A-Schwanzes, der Cap1-Struktur oder des humanen Wachstumshormons (hGH) kodieren. In einigen Ausführungsformen wird die mRNA modifiziert, um die mRNA- Immunogenität zu reduzieren.
In einer Ausführungsform kann die Multi-Flap-Prime-Editor-mRNA in der Zusammensetzung der Erfindung in einem Liposomen-Transfervehikel formuliert sein, um die Einschleusung in Ziel-Zellen zu erleichtern. In Betracht gezogene Transfervehikel können ein oder mehrere kationische Lipide, nicht-kationische Lipide und/oder PEG-modifizierte Lipide umfassen. Zum Beispiel kann das Transfervehikel mindestens eines der folgenden kationischen Lipide beinhalten: C12-200, DLin-KC2-DMA, DODAP, HGT4003, ICE, HGT5000 oder HGT5001. In Ausführungsformen umfasst das Transfervehikel Cholesterin (Chol) und/oder PEG-modifizierte Lipide. In einigen Ausführungsformen umfasst das Transfervehikel DMG- PEG2K. In bestimmten Ausführungsformen weist das Transfervehikel die folgende Lipidformulierung auf: C12-200, DOPE, chol, DMG-PEG2K; DODAP, DOPE, Cholesterin, DMG-PEG2K; HGT5000, DOPE, Chol, DMG-PEG2K, HGT5001, DOPE, Chol, eines von DMG-PEG2K.
Die vorliegende Offenbarung stellt auch Zusammensetzungen und Verfahren bereit, die zum Erleichtern der Transfektion von Ziel-Zellen mit einem oder mehreren PE-kodierenden mRNA-Molekülen nützlich sind. Zum Beispiel erwägen die Zusammensetzungen und Verfahren der vorliegenden Erfindung die Verwendung von Targeting-Liganden, die die Affinität der Zusammensetzung für eine oder mehrere Ziel-Zellen erhöhen können. In einer Ausführungsform ist der Targeting-Ligand Apolipoprotein B oder Apolipoprotein E und die entsprechenden Ziel-Zellen exprimieren Lipoproteinrezeptoren niedriger Dichte und fördern somit die Erkennung des Targeting-Liganden. Unter Verwendung der Verfahren und Zusammensetzungen der vorliegenden Offenbarung kann auf eine große Anzahl von Ziel- Zellen bevorzugt abgezielt werden. Zu den in Betracht gezogenen Ziel-Zellen gehören beispielsweise Hepatozyten, Epithelzellen, hämatopoetische Zellen, Epithelzellen, Endothelzellen, Lungenzellen, Knochenzellen, Stammzellen, Mesenchymzellen, Nervenzellen, Herzzellen, Adipozyten, vaskuläre, glatte Muskelzellen, Kardiomyozyten, Skelettmuskelzellen, Betazellen, Hypophysenzellen, Synovialschleimhautzellen, Eierstockzellen, Hodenzellen, Fibroblasten, B-Zellen, T-Zellen, Retikulozyten, Leukozyten, Granulozyten und Tumorzellen. Dies ist jedoch nicht darauf beschränkt.
In einigen Ausführungsformen kann die PE-kodierende mRNA optional chemische oder biologische Modifikationen aufweisen, die beispielsweise die Stabilität und/oder Halbwertszeit einer solchen mRNA verbessern oder die Proteinproduktion verbessern oder anderweitig erleichtern. Bei der Transfektion kann eine natürliche mRNA in den Zusammensetzungen der Erfindung mit einer Halbwertszeit zwischen 30 Minuten und mehreren Tagen zerfallen. Die mRNAs in den Zusammensetzungen der Offenbarung können zumindest eine gewisse Fähigkeit zur Translation beibehalten, wodurch ein funktionelles Protein oder Enzym hergestellt wird. Dementsprechend stellt die Erfindung Zusammensetzungen bereit, die eine stabilisierte mRNA umfassen und Verfahren zu ihrer Verabreichung. In einigen Ausführungsformen wird die Aktivität der mRNA über einen längeren Zeitraum verlängert. Zum Beispiel kann die Aktivität der mRNA verlängert werden, so dass die Zusammensetzungen der vorliegenden Offenbarung einem Patienten halbwöchentlich oder zweiwöchentlich oder bevorzugterweise monatlich, zweimonatlich, vierteljährlich oder jährlich verabreicht werden. Die verlängerte oder verlängerte Aktivität der mRNA der vorliegenden Erfindung steht in direktem Zusammenhang mit der Menge an Protein oder Enzym, die aus einer solchen mRNA produziert wird. In ähnlicher Weise kann die Aktivität der Zusammensetzungen der vorliegenden Offenbarung durch Modifikationen, die dazu gedacht sind, die Translation der mRNA zu verbessern oder zu verstärken, weiter verlängert oder erweitert werden. Darüber hinaus ist die Menge an funktionellem Protein oder Enzym, die von der Ziel-Zelle produziert wird, eine Funktion der Menge der in die Ziel-Zellen eingeschleusten mRNA und der Stabilität einer solchen mRNA. Soweit die Stabilität der mRNA der vorliegenden Erfindung verbessert oder erhöht werden kann, können die Halbwertszeit, die Aktivität des produzierten Proteins oder Enzyms und die Dosierungshäufigkeit der Zusammensetzung weiter verlängert werden.
Dementsprechend umfasst die mRNA in den Zusammensetzungen der Offenbarung in einigen Ausführungsformen mindestens eine Modifikation, die der Nukleinsäure eine erhöhte oder verbesserte Stabilität verleiht, einschließlich beispielsweise einer verbesserten Resistenz gegenüber Nukleaseverdauung in vivo. Wie hierin verwendet, umfassen die Begriffe „Modifikation“ und „modifiziert“, da sich diese Begriffe auf die hierin bereitgestellten Nukleinsäuren beziehen, mindestens eine Änderung, die vorzugsweise die Stabilität erhöht und die mRNA stabiler macht (z. B. resistenter gegen Nukleaseverdauung) als die Wildtyp- oder natürlich vorkommende Version der mRNA. Wie hierin verwendet, beziehen sich die Begriffe „stabil“ und „Stabilität“ als solche Begriffe auf die Nukleinsäuren der vorliegenden Erfindung, und beziehen sich insbesondere in Bezug auf die mRNA auf eine erhöhte oder verstärkte Widerstandsfähigkeit gegenüber einem FIGau durch beispielsweise Nukleasen (d. h. Endonukleasen oder Exonukleasen), die normalerweise in der Lage sind, solche mRNA abzubauen. Erhöhte Stabilität kann beispielsweise eine geringere Empfindlichkeit gegenüber Hydrolyse oder anderer Zerstörung durch endogene Enzyme (z. B. Endonukleasen oder Exonukleasen) oder Bedingungen innerhalb der Ziel-Zelle oder des Ziel-Gewebes umfassen, wodurch die Verweildauer solcher mRNA in der Ziel-Zelle, dem Gewebe, Patienten und/oder Zytoplasma erhöht oder verbessert wird. Die hier bereitgestellten stabilisierten mRNA- Moleküle zeigen längere Halbwertszeiten im Vergleich zu ihren natürlich vorkommenden, unmodifizierten Gegenstücken (z. B. der Wildtyp-Version der mRNA). Von den Begriffen „Modifikation“ und „modifiziert“ als solche Begriffe, die sich auf die mRNA der vorliegenden Erfindung beziehen, werden auch Veränderungen in Betracht gezogen, die die Translation von mRNA-Nukleinsäuren verbessern oder verstärken, einschließlich beispielsweise der Aufnahme von Sequenzen, die bei der Initiation von Proteintranslation wirken (z. B. die Kozak-Konsensussequenz). (Kozak, M., Nucleic Acids Res 15 (20): 8125-48 (1987)).
In einigen Ausführungsformen wurden die in den Zusammensetzungen der Offenbarung verwendeten mRNAs einer chemischen oder biologischen Modifikation unterzogen, um sie stabiler zu machen. Beispielhafte Modifikationen an einer mRNA beinhalten die Verarmung einer Base (z. B. durch Deletion oder durch die Substitution eines Nukleotids durch ein anderes) oder die Modifikation einer Base, z. B. die chemische Modifikation einer Base. Der Ausdruck „chemische Modifikationen“, wie er hier verwendet wird, schließt Modifikationen ein, die Chemien einführen, die sich von denen in natürlich vorkommender mRNA unterscheiden, zum Beispiel kovalente Modifikationen wie die Einführung modifizierter Nukleotide (z. B. Nukleotidanaloga oder die Aufnahme von Seitengruppen, die in solchen mRNA-Molekülen nicht natürlich vorkommen).
Andere geeignete Polynukleotid-Modifikationen, die in die PE-kodierende mRNA eingebaut werden können, die in den Zusammensetzungen der Offenbarung verwendet wird, beinhalten unter anderem 4'-Thio-modifizierte Basen: 4'-Thio-Adenosin, 4'-Thio-Guanosin, 4'- Thio-Cytidin, 4'-Thio-Uridin, 4'-Thio-5-Methyl-Cytidin, 4'-Thio-Pseudouridin und 4'- Thio-2- Thiouridin, Pyridin-4-on-Ribonukleosid, 5-Aza-Uridin, 2-Thio-5-Aza-Uridin, 2-Thiouridin, 4- Thio-Pseudouridin, 2-Thio-Pseudouridin, 5-Hydroxyuridin, 3-Methyluridin, 5- Carboxymethyl-Uridin, 1-Carboxymethyl-Pseudouridin, 5-Propinyl-Uridin, 1-Propinyl- Pseudouridin, 5-Taurinomethyluridin, 1-Taurinomethyl-Pseudouridin, 5-Taurinomethyl-2- Thio-Uridin, 1-Taurinomethyl-4-Thio-Uridin, 5-Methyl-Uridin, 1-Methyl-Pseudouridin, 4- Thio-1 -Methyl-Pseudouridin, 2-Thio-1 -Methyl-Pseudouridin, 1-Methyl-1-Deaza- Pseudouridin, 2-Thio-1-methyl-1-Deaza-Pseudouridin, Dihydrouridin, Dihydropseudouridin, 2-Thio-Dihydrouridin, 2-Thio-Dihydropseudouridin, 2-Methoxyuridin, 2-Methoxy-4-Thio- Uridin, 4-Methoxy-Pseudouridin, 4-Methoxy-2-Thio-Pseudouridin, 5-Aza-Cytidin, Pseudoisocytidin, 3-Methyl-Cytidin, N4-Acetylcytidin, 5-Formylcytidin, N4-Methylcy Tidin, 5-Hydroxymethylcytidin, 1-Methyl-Pseudoisocytidin, Pyrrolo-Cytidin, Pyrrolo- Pseudoisocytidin, 2-Thio-Cytidin, 2-Thio-5-Methyl-Cytidin, 4-Thio-Pseudoisocytidin, 4- Thio-1-Methyl-Pseudoisocytidin, 4-Thio-1-Methyl-1-Deaza-Pseudoisocytidin, 1-Methyl-1- Deaza-Pseudoisocytidin, Zebularin, 5-Aza-Zebularin, 5-Methyl-Zebularin, 5-Aza-2-Thio- Zebularin, 2-Thio-Zebularin, 2-Methoxy-Cytidin, 2-Methoxy-5-Methyl-Cytidin, 4-Methoxy- Pseudoisocytidin, 4-Methoxy-1-Methyl-Pseudoisocytidin, 2-Aminopurin, 2,6-Diaminopurin, 7-Deaza-Adenin, 7-Deaza-8-Aza-Adenin, 7-Deaza-2-Aminopurin, 7-Deaza-8-Aza-2- Aminopurin, 7-Deaza-2,6-Diaminopurin, 7-Deaza-8-Aza-2,6-Diaminopurin, 1- Methyladenosin, N6-Methyladenosin, N6-Isopentenyladenosin, N6-(cis-Hydroxyisopentenyl- )Adenosin, 2-Methylthio-N6-(cis-Hydroxyisopentenyl-)Adenosin, N6- Glycinylcarbamoyladenosin, N6-Threonyl, 2-Methylthio-N6-Threonylcarbamoyladenosin, N6,N6-Dimethyladenosin, 7-Methyladenin, 2-Methylthio-Adenin und 2-Methoxy-Adenin, Inosin, 1-Methyl-Inosin, Wyosin, Wybutosin, 7-Deaza-Guanosin, 7-Deaza-8-Aza-Guanosin, 6-Thio-Guanosin, 6-Thio-7-Deaza-Guanosin, 6-Thio-7-Deaza-8-Aza-Guanosin, 7-MethylGuanosin, 6-Thio-7-Methyl-Guanosin, 7-Methylinosin, 6-Methoxy-Guanosin, 1- Methylguanosin, N2-Methylguanosin, N2,N2-Dimethylguanosin, 8-Oxo-Guanosin, 7-Methyl- 8-Oxo-Guanosin, 1-Methyl-6-Thio-Guanosin, N2-Methyl-6-Thio-Guanosin und N2,N2- Dimethyl-6-Thioguanosin und Kombinationen davon. Der Begriff Modifikation umfasst beispielsweise auch den Einbau von Nicht-Nukleotid-Bindungen oder modifizierten Nukleotiden in die mRNA-Sequenzen der vorliegenden Erfindung (z. B. Modifikationen an einem oder beiden der 3'- und 5'-Enden eines mRNA-Moleküls, das ein funktionelles Protein oder Enzym kodiert). Solche Modifikationen umfassen das Hinzufügen von Basen zu einer mRNA-Sequenz (z. B. die Aufnahme eines Poly-A-Schwanzes oder eines längeren Poly-A- Schwanzes), die Veränderung der 3'-UTR oder der 5'-UTR, die Komplexierung der mRNA mit einem Agent (z. B. ein Protein oder ein komplementäres Nukleinsäuremolekül) und der Einschluss von Elementen, die die Struktur eines mRNA-Moleküls verändern (z. B. die Sekundärstrukturen bilden).
In einigen Ausführungsformen umfassen PE-kodierende mRNAs eine 5'-Kappen- Struktur. Ein 5'-Kappe wird typischerweise wie folgt hinzugefügt: Zuerst entfernt eine RNAterminale Phosphatase eine der terminalen Phosphatgruppen vom 5'-Nukleotid, wodurch zwei terminale Phosphate zurückbleiben; Guanosintriphosphat (GTP) wird dann über eine Guanylyltransferase zu den terminalen Phosphaten hinzugefügt, wodurch eine 5'5'5- Triphosphatbindung erzeugt wird; und der 7-Stickstoff von Guanin wird dann durch eine Methyltransferase methyliert. Beispiele für Kappenstrukturen umfassen, aber sind nicht beschränkt auf m7G(5')ppp (5'(A,G(5')ppp(5')A und G(5')ppp(5')G. Natürlich vorkommende Kappen-Strukturen umfassen ein 7-Methylguanosin, das über eine Triphosphatbrücke mit dem 5'-Ende des ersten transkribierten Nukleotids verbunden ist, was zu einem Dinukleotid-Cap von m7G(5')ppp(5')N führt, wobei N ein beliebiges Nukleosid ist. In vivo wird die Kappe enzymatisch hinzugefügt. Die Kappe wird im Zellkern hinzugefügt und durch das Enzym Guanylyltransferase katalysiert. Die Anfügung der Kappe an das 5'-terminale Ende der RNA erfolgt unmittelbar nach Initiation der Transkription. Das terminale Nukleosid ist typischerweise ein Guanosin und ist umgekehrt zu allen anderen Nukleotiden ausgerichtet, d. h. G(5')ppp(5')GpNpNp.
Zusätzliche Kappen-Analoga umfassen, sind unter anderem chemische Strukturen, ausgewählt aus der Gruppe bestehend aus m7GpppG, m7GpppA, m7GpppC; unmethylierte Kappen-Analoga (z. B. GpppG); dimethyliertes Kappen-Analogon (z. B. m2,7GpppG), trimethyliertes Kappen-Analogon (z. B. m2,2,7GpppG), dimethylierte symmetrische Kappen- Analoga (z. B. m7Gpppm7G) oder Anti-Reverse- Kappen-Analoga (z. B. ARCA; m7,2'OmeGpppG, m72'dGpppG, m7,3'OmeGpppG, m7,3'dGpppG und deren Tetraphosphat- Derivate) (siehe z. B. Jemieliity, J. et al., „Novel ‚anti-reverse‘ cap analogs with superior translational properties“, RNA, 9: 1108-1122 (2003)).
Typischerweise dient die Anwesenheit eines „Schwanzes“ dazu, die mRNA vor dem FIGau durch Exonuklease zu schützen. Es wird angenommen, dass ein Poly-A- oder Poly-U- Schwanz natürliche Botenstoffe und synthetische Sense-RNA stabilisiert. Daher kann in bestimmten Ausführungsformen ein langer Poly-A- oder Poly-U-Schwanz zu einem mRNA- Molekül hinzugefügt werden, wodurch die RNA stabiler wird. Poly-A- oder Poly-U-Schwänze können mit einer Vielzahl von anerkannten Techniken hinzugefügt werden. Zum Beispiel können lange Poly-A-Schwänze an synthetische oder in vitro transkribierte RNA unter Verwendung von Poly-A-Polymerase hinzugefügt werden (Yokoe et al. Nature Biotechnology. 1996; 14; 1252-1256). Ein Transkriptionsvektor kann auch lange Poly-A-Schwänze kodieren. Außerdem können Poly-A-Schwänze durch Transkription direkt aus PCR-Produkten hinzugefügt werden. Poly-A kann auch mit RNA-Ligase an das 3'-Ende einer Sense-RNA ligiert werden (siehe z. B. Molecular Cloning A Laboratory Manual, 2nd Ed., ed. by Sambrook, Fritsch and Maniatis (Cold Spring Harbor Laboratory Press: 1991 edition)).
Typischerweise kann die Länge eines Poly-A- oder Poly-U-Schwanzes mindestens etwa 10, 50, 100, 200, 300, 400 oder mindestens 500 Nukleotide betragen. In einigen Ausführungsformen beinhaltet ein Poly-A-Schwanz am 3'-Terminus von mRNA typischerweise etwa 10 bis 300 Adenosinnukleotide (z. B. etwa 10 bis 200 Adenosinnukleotide, etwa 10 bis 150 Adenosinnukleotide, etwa 10 bis 100 Adenosinnukleotide, etwa 20 bis 70 Adenosinnukleotide oder etwa 20 bis 60 Adenosinnukleotide). In einigen Ausführungsformen umfassen mRNAs eine 3'-Poly(C)- Schwanzstruktur. Ein geeigneter Poly-C-Schwanz am 3'-Terminus der mRNA beinhaltet typischerweise etwa 10 bis 200 Cytosinnukleotide (z. B. etwa 10 bis 150 Cytosinnukleotide, etwa 10 bis 100 Cytosinnukleotide, etwa 20 bis 70 Cytosinnukleotide, etwa 20 bis 60 Cytosin Nukleotide oder etwa 10 bis 40 Cytosinnukleotide). Der Poly-C-Schwanz kann dem Poly-A- oder Poly-U-Schwanz hinzugefügt werden oder kann den Poly-A- oder Poly-U-Schwanz ersetzen.
PE-kodierende mRNAs gemäß der vorliegenden Offenbarung können gemäß einer Vielzahl bekannter Verfahren synthetisiert werden. Beispielsweise können mRNAs gemäß der vorliegenden Erfindung über In-vitro-Transkription (IVT) synthetisiert werden. Kurz gesagt wird IVT typischerweise mit einem linearen oder zirkulären DNA-Templat durchgeführt, die einen Promotor, einen Pool von Ribonukleotidtriphosphaten, ein Puffersystem, das DTT und Magnesiumionen enthalten kann, und eine geeignete RNA-Polymerase (z. B. T3-, T7- oder SP6-RNA-Polymerase), DNAse I, Pyrophosphatase und/oder RNAse-Inhibitor enthält. Die genauen Bedingungen variieren je nach spezifischer Anwendung.
In Ausführungsformen, die die mRNA-Einschleusung beinhalten, kann das Verhältnis der mRNA, die das PE-Fusionsprotein kodiert, zu der PEgRNA für ein effizientes Editing wichtig sein. In bestimmten Ausführungsformen beträgt das Gewichtsverhältnis von mRNA (die das PE-Fusionsprotein kodiert) zu PEgRNA 1:1. In bestimmten anderen Ausführungsformen beträgt das Gewichtsverhältnis von mRNA (die das PE-Fusionsprotein kodiert) zu PEgRNA 2:1. In noch anderen Ausführungsformen beträgt das Gewichtsverhältnis von mRNA (die das PE-Fusionsprotein kodiert) zu PEgRNA 1:2. In noch weiteren Ausführungsformen wird das Gewichtsverhältnis von mRNA (die das PE-Fusionsprotein kodiert) zu PEgRNA ausgewählt aus der Gruppe bestehend aus etwa 1:1000, 1:900; 1:800; 1:700; 1:600; 1:500; 1:400; 1:300; 1:200; 1:100; 1:90; 1:80; 1:70; 1:60; 1:50; 1:40; 1:30; 1:20; 1:10 und 1:1. In anderen Ausführungsformen wird das Gewichtsverhältnis von mRNA (die das PE-Fusionsprotein kodiert) zu PEgRNA ausgewählt aus der Gruppe bestehend aus etwa 1:1000, 1:900; 800:1; 700:1; 600:1; 500:1; 400:1; 300:1; 200:1; 100:1; 90:1; 80:1; 70:1; 60:1; 50:1; 40:1; 30:1; 20:1; 10:1 und 1:1.
F. Verwendung von Multi-Flap-Prime-Editing zur Insertion induzierbarer Dimerisierungsdomänen
Die hier beschriebenen Multi-Flap-Prime-Editoren (wie in 90, 95, 97A, 98A dargestellt), können auch verwendet werden, um Dimerisierungsdomänen in ein oder mehrere Zielproteine einzubauen. Die Dimerisierungsdomänen können die induzierbare Regulierung der Aktivität erleichtern, die mit der Dimerisierung des einen oder der mehreren Protein-Ziele über eine verbindende Einheit (z. B. ein kleines Molekül, Peptid oder Protein) verbunden ist, die auf bispezifische Weise bindet. In verschiedenen Aspekten binden die Dimerisierungsdomänen, wenn sie auf unterschiedlichen Proteinen (z. B. dem gleichen Typ oder unterschiedlichen Proteinen) eingebaut sind, jeweils an dieselbe bispezifische Einheit (z. B. ein bispezifisches kleines Molekül, Peptid oder Polypeptid mit mindestens zwei Regionen, die getrennt an die Dimerisierungsdomänen binden), wodurch die Dimerisierung der Proteine durch ihre gemeinsame Wechselwirkung mit dem bispezifischen Liganden verursacht wird. Auf diese Weise fungiert der bispezifische Ligand als „Induktor“ der Dimerisierung zweier Proteine. In einigen Fällen weist der bispezifische Ligand oder die bispezifische Verbindung zwei gleiche Targeting-Einheiten auf. In anderen Ausfürungsformen weist der bispezifische Ligand oder die bispezifische Verbindung Targeting-Einheiten auf, die sich voneinander unterscheiden. Der bispezifische Ligand oder die bispezifische Verbindung mit den gleichen zwei Targeting-Einheiten wird in der Lage sein, auf die gleiche Dimerisierungsdomäne abzuzielen, die auf verschiedenen Protein-Ziele eingebaut ist. Der bispezifische Ligand oder die bispezifische Verbindung mit unterschiedlichen Targeting- Einheiten wird in der Lage sein, auf unterschiedliche Dimerisierungsdomänen abzuzielen, die auf verschiedenen Protein-Zielen eingebaut sind.
Wie hierin verwendet, bezieht sich der Begriff „Dimerisierungsdomäne“ auf eine ligandenbindende Domäne, die an eine Bindungseinheit eines bispezifischen Liganden bindet. Eine „erste“ Dimerisierungsdomäne bindet an eine erste Bindungseinheit eines bispezifischen Liganden und eine „zweite“ Dimerisierungsdomäne bindet an eine zweite Bindungseinheit desselben bispezifischen Liganden. Wenn die erste Dimerisierungsdomäne an ein erstes Protein fusioniert wird (z. B. über PE, wie hierin erörtert) und die zweite Dimerisierungsdomäne (z. B. über PE, wie hierin erörtert) an ein zweites Protein fusioniert wird, so dimerisieren das erste und das zweite Protein in Anwesenheit eines bispezifischen Liganden, wobei der bispezifische Ligand mindestens eine Einheit aufweist, die an die erste Dimerisierungsdomäne bindet, und mindestens eine andere Einheit, die an die zweite Dimerisierungsdomäne bindet.
Der Begriff „bispezifischer Ligand“ oder „bispezifische Einheit“, wie hierin verwendet, bezieht sich auf einen Liganden, der an zwei verschiedene Ligandenbindungsdomänen bindet. In verschiedenen Ausführungsformen ist die bispezifische Einheit selbst ein Dimer von zwei gleichen oder zwei unterschiedlichen chemischen Einheiten, wobei jede Einheit spezifisch und fest an eine Dimerisierungsdomäne bindet. In bestimmten Ausführungsformen ist der Ligand eine kleine Molekülverbindung oder ein Peptid oder ein Polypeptid. In anderen Ausführungsformen ist die Ligandenbindungsdomäne eine „Dimerisierungsdomäne“, die als Peptid-Tag auf einem Protein eingebaut werden kann. In verschiedenen Ausführungsformen können zwei Proteine, die jeweils die gleichen oder unterschiedliche Dimerisierungsdomänen umfassen, durch die Bindung jeder Dimerisierungsdomäne an den bispezifischen Liganden zur Dimerisierung induziert werden. Diese Moleküle können auch als „chemische Induktoren der Dimerisierung“ oder CIDs bezeichnet werden. Außerdem können die bispezifischen Liganden durch Koppeln (z. B. durch standardisierte chemische Bindungen) von zwei gleichen Einheiten oder zwei verschiedenen Einheiten zusammen hergestellt werden, wobei jede Einheit fest und spezifisch an eine Dimerisierungsdomäne bindet.
In verschiedenen Aspekten können die von Multi-Flap-PE eingebauten Dimerisierungsdomänen gleich oder unterschiedlich sein.
Die Dimerisierungsdomänen können beispielsweise FKBP12 sein, das die folgende Aminosäuresequenz aufweist:

FKBP12
In einem anderen Beispiel kann die Dimerisierungsdomäne eine Mutante von FKBP12 sein, die als FKBP12-F36V bezeichnet wird, eine Mutante von FKBP12 mit einem konstruierten Loch, das ein synthetisches FK506-Mimetikum mit Höckern bindet (2, 3)¹⁰⁷:

FK13P12-F36V
In einem anderen Beispiel kann die Dimerisierungsdomäne wie folgt Cyclophilin sein:

CYCLOPHILIN
In verschiedenen Ausführungsformen können die Aminosäuresequenzen dieser Dimerisierungsdomänen verändert werden, um die Bindung zu optimieren oder die Bindungsorthogonalität zu nativen Ziele zu verbessern. Die Nukleinsäuresequenzen der Gene, die für niedermolekulare Bindungsproteine kodieren, können verändert werden, um die Effizienz des PE-Prozesses zu optimieren, beispielsweise durch Reduzieren der PEgRNA- Sekundärstruktur.

Andere Beispiele für geeignete Dimerisierungsdomänen und eine verwandte kleine Molekülverbindung, die daran bindet, werden wie folgt bereitgestellt. Man beachte, dass die verwandte Kleinmolekülverbindung (z. B. über einen chemischen Linker) an eine zweite Kleinmolekülverbindung (entweder die gleiche Verbindung oder eine unterschiedliche Verbindung) gekoppelt werden könnte, um einen bispezifischen Liganden zu bilden, der zwei Dimerisierungsdomänen binden kann. In einigen Fällen, wie FK506 und Cyclosporin A, reduziert oder eliminiert die Dimerisierung von jedem (z. B. FK506-FK506 oder Cyclosporin A-Cyclosporin A) die immunsuppressive Aktivität der monomeren Verbindungen.

KLEINMOLEKÜL - BINDET AN DIE DIMERISIERUNGSDOMÄNE - EIN DIMER DIESER MOLEKÜLE WÜRDE EINEN BISPEZIFISCHEN LIGANDEN BILDEN, DER ZWEI DIMERISIERUNGSDOMÄNEN BINDEN WÜRDE	DIMERISIERUNGSDOMÄNE(N)
FK506	AMINOSÄURESEQUENZ VON FKBP12:

	CALCINEURIN:
ZIELE: FKBP12 + CALCINEURIN
CYCLOSPORIN A	AMINOSÄURESEQUENZ VON HUMANEM CYCLOPHILIN A:

	AMINOSÄURESEQUENZ VON HUMANEM CYCLOPHILIN B:
ZIELE: CYCLOPHILIN + CALCINEURIN
	AMINOSÄURESEQUENZ VON HUMANEM CYCLOPHILIN C:

AP1867	AMINOSÄURESEQUENZ VON FKBP12-F36V
AP1867
ZIEL(E): FKBP12
METHOTREXAT	AMINOSÄURESEQUENZ VON HUMANER DIHYDROFOLATREDUKTASE

ZIEL(E): DIHYDROFOLATREDUKTASE
TRIMETHOPRIM	AMINOSÄURESEQUENZ FÜR E. COLI DIHYDROFOLATREDUKTASE

ZIEL(E): DIHYDROFOLATREDUKTASE
DEXAMETHASON	AMINOSÄURESEQUENZ FÜR HUMANEN GLUCOCORTICOID- REZEPTOR
	AMINOSÄURESEQUENZ FÜR HUMANEN GLUCOCORTICOID- REZEPTOR

	AMINOSÄURESEQUENZ VON FKBP12:

RAPAMYCIN

Andere Beispiele für natürlich vorkommende bifunktionelle Moleküle und ihre dualen Ziel-Rezeptoren sind wie folgt. Prime-Editing kann verwendet werden, um die dualen Ziel- Rezeptoren in verschiedene Proteine einzubauen. Sobald die verschiedenen Proteine durch PE modifiziert sind, um einen bifunktionellen Molekülrezeptor zu enthalten, können die bifunktionellen Moleküle eingeführt werden, wodurch die Dimerisierung der modifizierten Proteine bewirkt wird, um die verschiedenen Dimerisierungsdomänen zu umfassen. Beispiele für Kopplungen von (1) einem biofunktionellen Molekül und (2) ihren dualen Ziel-Rezeptoren sind wie folgt:

NATÜRLICH VORKOMMENDE BIOFUNKTIONELLE MOLEKÜLE	ZIEL-REZEPTOREN DES BIOFUNKTIONELLEN MOLEKÜLS
	Ziel-Rezeptor 1: Auxinrezeptor
	Ziel-Rezeptor 2: TIR1 E3-Ligase
Auxin
	Ziel-Rezeptor 1: JAZ-Rezeptor
	Ziel-Rezeptor 2: Coll E3-Ligase
Methyljasmonat
Brefeldin A	Ziel-Rezeptor 1: GBF1
	Target-Rezeptor 2: GTPase Arflp
Abscisinsäure	Ziel-Rezeptor 1: PYR-Rezeptor
	Ziel-Rezeptor 2: Phosphoproteinphosphatase 2C

Forskolin	Ziel-Rezeptor 1: Adenylylcyclase- Monomere
	Ziel-Rezeptor 1: Adenylylcyclase- Monomere
	Ziel-Rezeptor 2: Adenylylcyclase- Monomere
Fusicoccin A	Ziel-Rezeptor 1: 14-3-3-Proteine
	Ziel-Rezeptor 2: H⁺-ATPase
Rapamycin	Ziel-Rezeptor 1: FKBP12
	Ziel-Rezeptor 2: mTOR

Sanglifehrin A	Ziel-Rezeptor 1: Cyclophilin Ziel-Rezeptor 2: IMP Dehydrogenase 2
Cyclosporin A	Ziel-Rezeptor 1: Cyclophilin
	Ziel-Rezeptor 2: Calcineurin

Beispiele für andere bifunktionelle Moleküle, die mit diesem Aspekt des Prime- Editing verwendet werden können, sind wie folgt:

Synstab A:
Paclitaxel:
Discodermolid:
GNE-0011
ARV-825 und
dBET1

Synstab A, Paclitaxel und Discodermolid sind Mikrotubuli-Stabilisatoren. Somit könnten diese Verbindungen verwendet werden, um durch PE modifizierte Proteine zu dimerisieren, um Mikrotubuli-Proteine zu umfassen. GNE-0011, ARV-825 und dBET1 umfassen ein BRD4-Bindungsmotiv und ein CRBN-Bindungsmotiv. Somit könnten diese Verbindungen verwendet werden, um Proteine zu dimerisieren, die durch PE modifiziert wurden, um diese Targeting-Domänen zu umfassen.
Die PEgRNAs zum Einbauen von Dimerisierungsdomänen können die folgenden Strukturen umfassen (in Bezug auf 3D):

5'-[Spacer]-[gRNA-Kern]-[Verlängerungsarm]-3', wobei der Verlängerungsarm 5'- [Homologiearm]-[Edit-Templat]-[Primer-Bindungsstelle]-3' umfasst; oder
5'-[Verlängerungsarm]-[Spacer]-[gRNA-Kern]-3', wobei der Verlängerungsarm 5'- [Homologiearm]-[ Edit-Templat]-[Primer-Bindungsstelle]-3' umfasst, und wobei bei jeder Konfiguration das „Edit-Templat“ eine Nukleotidsequenz einer Dimerisierungsdomäne umfasst.

In einem Beispiel die PEgRNA zur Insertion der FKBP12-Dimerisierungsdomäne am C-terminalen Ende des Humaninsulinrezeptors (Spacer unterstrichen, gRNA-Kern in Normalschrift, Flap-Homologie fett, FKBP12-Insertion kursiv, Hybridisierungsregion fett kursiv):

PEGRNA ZUM EINBAUEN VON FKBP12 IN HUMANEN INSULINREZEPTOREN
In einem anderen Beispiel die PEgRNA zur Insertion der FKBP12- Dimerisierungsdomäne am HEK3-Locus (zur Optimierung):

PEGRNA ZUM EINBAUEN VON FKBP12 IN HEK3

Die Ziel-Proteine zum Einbauen von Dimerisierungsdomänen sind nicht besonders beschränkt; es ist jedoch von Vorteil, dass ihre Dimerisierung (einmal durch PE modifiziert) in Gegenwart eines bispezifischen Liganden eine vorteilhafte biologische Wirkung hervorruft, z. B. einen Signalweg, eine verminderte Immunantwort usw. In verschiedenen Aspekten können die Ziel-Proteine, die durch den PE-abhängigen Einbau von Dimerisierungsdomänen dimerisiert werden sollen, das gleiche Protein oder verschiedene Proteine sein. Vorzugsweise lösen die Proteine, wenn sie dimerisiert sind, eine oder mehrere stromabwärtige biologische Kaskaden aus, z. B. eine Signaltransduktionskaskade, Phosphorylierung usw. Beispielhafte Ziel-Proteine, in welchen PE verwendet werden kann, um Dimerisierungsdomänen einzubauen, beinhalten unter anderem:

MEMBRANGEBUNDENER REZEPTOR	KINASEDOMÄNE FUSIONIERT MIT	EINGESETZTES CID	SIGNALKASKADE	REFERENZ
T-ZELLEN- REZEPTOR	FKBP12	FK1012 (FK506- DIMER)	T-ZELL- REZEPTOR- SIGNALISIERUNG	SCIENCE 262, 1019- 24 (1993)
T-ZELLEN- REZEPTOR	FKBP12	FK1012 (FK506- DIMER)	T-ZELL- REZEPTOR- SIGNALISIERUNG	CHEM. BIOL. 1, 163- 172 (1994).
FAS-RECEPTOR	MURINES CYCLOPHILIN C	CYCLOSPORIN A- DIMER	FAS-WEG ZUR APOPTOSE	CHEM. BIOL. 3, 731- 738 (1996).
INSULINREZEPTOR	FKBP12	FK1012 (FK506- DIMER)	INSULIN- SIGNALISIERUNG	CURR. BIOL. 8, 11-18 (1998).
THROMBOZYTEN- ABGELEITETER WACHSTUMSFAKTOR (PLATELET- DERIVED GROWTH FACTOR - PDGF) BETA	FKBP12	FK1012 (FK506- DIMER)	SIGNALISIERUNG DER PDGF- MESODERM BILDUNG	CURR. BIOL. 8, 11-18 (1998).
ERYTHROPOIETIN-REZEPTOR (EPOR)	FKBP12	FK1012 (FK506- DIMER)	EPOR- VERMITTELTE PROLIFERATIVE SIGNALÜBERTRAGUNG	PROC. NATL. ACAD. SCI. 94, 3076-3081 (2002).

In einem Aspekt können die hierin beschriebenen Multi-Flap-Prime-Editor-Systeme verwendet werden, um Sequenzen, die Dimerisierungsdomänen kodieren, in ein oder mehrere Gene einzubauen, die für Ziel-Proteine von Interesse in einer lebenden Zelle oder einem Patienten kodieren. Dies kann als „Prime-Editing-CID-System“ bezeichnet werden, wobei das CID der bispezifische Ligand ist, der die Dimerisierung von Ziel-Proteinen induzierte, die jeweils an eine durch Multi-Flap-PE eingebaute Dimerisierungsdomäne fusioniert sind. Das Editing allein sollte keine physiologische Wirkung haben. Nach Verabreichung eines bispezifischen Liganden, bei dem es sich in der Regel um ein dimeres Kleinmolekül handelt, das gleichzeitig an zwei Dimerisierungsdomänen binden kann, von denen jede mit einer Kopie des Zielproteins fusioniert ist, bewirkt der bispezifische Ligand die Dimerisierung des anvisierten Proteins. Dieses Ziel-Protein-Dimerisierungsereignis induziert dann ein biologisches Signalereignis, wie beispielsweise Erythropoese oder Insulinsignalisierung. Ein neues Verfahren, um dimerisierungsinduzierte biologische Prozesse, wie beispielsweise die Rezeptorsignalisierung, unter die Kontrolle eines geeigneten niedermolekularen Arzneimittels (d. h. der bispezifische Ligand) durch die genomische Integration von Genen, die niedermolekulare Bindungsproteine (d. h. die Dimerisierungsdomänen) mit Multi-Flap-Prime- Editing kodieren, zu stellen, wird hierin beschrieben.
Proteindimerisierung ist ein allgegenwärtiger biologischer Prozess. Insbesondere ist bekannt, dass die Homodimerisierung vieler membrangebundener Rezeptoren Signalkaskaden mit oft tiefgreifenden biologischen Konsequenzen in Gang setzt. Eine Reihe von niedermolekularen Naturstoffen, die als Arzneimittel zugelassen sind, wirken als Teil ihres Wirkmechanismus als chemischer Induktor der Proteindimerisierung.⁹² Beispielsweise bindet FK506 fest an FKBP12, und der resultierende niedermolekulare Proteinkomplex bindet dann die Phosphatase Calcineurin, wodurch ein Schritt in der T-Zellen-Rezeptor-Signalisierung gehemmt wird.⁹³ Ebenso induziert Cyclosporin A die Dimerisierung von Cyclophilin und Calcineurin, und Rapamycin induziert die Dimerisierung von FKBP und mTOR.^93,94
In einer Ausführungsform wurden unter Nutzung der selektiven, hochaffinen Bindung der FK506:FKBP12- und Cyclosporin A:Cyclophilin-Kleinmolekül:Protein- Bindungsinteraktion auch synthetische chemische Induktoren der Dimerisierung entwickelt. In einem Beispiel wurde gezeigt, dass ein aus zwei Einheiten von FK506 bestehendes kleines Molekül, das als FK1012 bezeichnet wird, die Signalübertragung bewirkt, wenn die zytoplasmatischen Domänen von Signalrezeptoren mit FKBP12 markiert wurden.⁹⁵ Chemische Dimerisierungsinduktoren (inducers of dimerization - CIDs) werden seitdem verwendet, um eine Anzahl der Signalwegen zu kontrollieren.^96-103
Synthetische CIDs sind zwar nützliche Werkzeuge zur Untersuchung biologischer Prozesse, eine Herausforderung für ihre therapeutische Anwendungen besteht jedoch darin, dass die Einführung der FKBP12- oder Cyclophilin-Ziel-Proteinchimären in Patienten eine Herausforderung darstellt.
Die vorliegende Offenbarung führt mehrere Konzepte zusammen, um einen zuvor unzugänglichen therapeutischen Prozess zu schaffen. Das erste Konzept ist das hierin beschriebene Mulit-Flap-Prime-Editing (z. B. Dual-Flap- oder Quadruple-Flap-Prime- Editing), das ein präzises Genom-Editing, einschließlich gezielter Einfügungen, in lebenden Zellen ermöglicht. Das zweite Konzept ist die chemisch induzierte Dimerisierung, ein leistungsstarkes Werkzeug, das die Kontrolle über Signal- und Oligomerisierungsprozesse in Zellkulturen durch kleine Moleküle ermöglicht hat.
Es wurden spezifische Fälle identifiziert, in denen die chemische Kontrolle der Proteindimerisierung eine vorteilhafte therapeutische Wirkung gehabt haben könnte.
Der Insulinrezeptor ist ein heterotetrameres Transmembranprotein, das auf die Insulinbindung an die extrazelluläre Domäne durch Phosphorylierung der zytoplasmatischen Kinasedomäne reagiert.¹⁰⁴ Ein konstruiertes chimäres Protein bestehend aus einer Membranlokalisierungskomponente, der C-terminalen Kinasedomäne des Insulinrezeptors, und drei Kopien von FKBP12 reagieren auf FK1012 und initiieren die Insulinreaktion in Zellkulturen.⁹⁹ In ähnlicher Weise wird erwartet, dass die Fusion von FKBP12 an das C- terminale Ende der Kinasedomäne des nativen Insulinrezeptors in Patientenzellen eine FK1012- abhängige Phosphorylierung und Initiierung der Insulin-Signalkaskade erlaubt. Dieses System könnte die Insulinanwendung bei Patienten ersetzen oder ergänzen, die kein Insulin herstellen können (z. B. Typ-1-Diabetiker) oder die schwach auf Insulin ansprechen (z. B. Typ-2-Diabetiker).
Darüber hinaus stimuliert Erythropoietin die Erythrozytenproliferation durch Bindung an den Erythropoietin-Rezeptor (EpoR), was entweder eine Dimerisierung oder eine Konformationsänderung in einem vorgebildeten Rezeptordimer induziert, was zur Aktivierung der Jak/STAT-Signalkaskade führt.¹⁰⁵ Es wurde gezeigt, dass eine FK1012-induzierte Oligomerisierung der membranverankerten zytoplasmatischen Domäne von EpoR, die mit FKBP12 markiert ist, ausreicht, um die Jak/STAT-Signalkaskade zu initiieren und die Zellproliferation zu fördern.¹⁰⁶ Es wird erwartet, dass die Fusion von FKBP12 mit nativem EpoR durch Prime-Editing in Patientenzellen die FK1012-induzierte Kontrolle der Erythrozytenproliferation erlaubt (Erythropoese). Dieses System könnte verwendet werden, um das Wachstum von roten Blutkörperchen bei anämischen Patienten auszulösen. FK1012- induzierbarer EpoR könnte auch als ein in vivo-selektierbarer Marker für Blutzellen verwendet werden, die einer Ex-vivo-Entwicklung unterzogen wurden.

Im Prinzip könnte jede Rezeptor-Tyrosin-Kinase ein brauchbares Ziel für ein Prime- Editing-CID-Therapeutikum sein. Die folgende Tabelle enthält eine Liste aller Rezeptor- Tyrosin-Kinasen im humanen Genom.¹¹⁰

Familie	Rezeptor	Synonyme	NT-Zugriff	PROT- Zugriff	Chromosom
ALK familv	ALK	Ki1	NM_004304	NP_004295	2p23
ALK familv	LTK	TYK1	NM_002344	NP_002335	15q15.1-q21.1
AXL family	AXL	UFO, Tyro7(r) Ark(m)	NM_001699	NP_001690	19q 13.1
	MER	MERTK, NYK, Eyk(ch)	NM_006343	NP_006334	2q14.1
	TYRO3	RSE, SKY, BRT, DTK, TIF	NM_006293	NP_006284	15q15.1-q21.1
DDR family	DDR1	CAK, TRKE, NEP NTRK4, EDDR1, PTK3	NM_013993	NP_001945	6p21.3
DDR family	DDR2	TKT, TYRO10, NTRKR3	NM_006182	NP_006173	1q21-q22
EGFR family	EGFR	ERBB, ERBB1	NM_005228	NP_005219	7p12
	ERBB2	HER2, Neu(r), NGL	NM_004448	NP_004439	17q 11.2-q 12
	ERBB3	HER3	NM_001982	NP_001973	12q13
	ERBB4	HER4	NM_005235	NP_005226	2q33.3-q34
EPH family	EPHA 1	EPH, EPHT	NM_005232	NP_005223	7q32-q36
	EPHA2	ECK, Sek(m), Mvk2(m)	NM_004431	NP_004422	1p34
	EPHA3	HEK, ETK1, Tyro4(r), Mek4(m), Cek4(ch)	NM_005233	NP_005224	3p11.2
	EPHA4	HEK8, Tyro1(r), Sek1(m), Cek8(ch)	NM_004438	NP_004429	2q36qter
	EPHA5	HEK7, Ehk(r), Bsk(r), Cek7(ch)	L36644	P54756
	EPHA6	DKFZp434C1418, Ehk2(r)	AL133666
	EPHA7	HEK11, Mdk1(m), Ebk(m), Ehk3(r), Cek11(ch)	NM_004440	NP_004431	6q21
	EPHA8	HEK3, KIAA1459, Eek(r), Cek10(ch)	AB040892	CAB81612	1q23-q24
	EPHB1	NET, EPHT2, HEK6, Elk(r), Cek6(ch)	NM_004441	NP_004432	3q21-q23
	EPHB2	HEK5, ERK, DRT, EPHT3, Tyro5(r), Nuk(m), Sek3(m), Cek5(ch)	AF025304	AAB94602	1p36.1-p35
	EPHB3	HEK2, Tyro6, Mdk5(m), Sek4(m)	NM_004443	NP_004434	3q21-qter
	EPHB4	HTK, Tyro11(r), Mdk2(m), Mvkl(m)	NM_004444	NP_004435
	EPHB6	HEP, Mep(m), Cek1(ch)	NM_004445	NP_004436	7q33-q35
FGFR family	FGFR1	FLT2, bFGFR, FLG, N- SAM	M34641	AAA35835	8p11.2
	FGFR2	KGFR, K-SAM, Bek(m), CFD1, JWS, Cek3(ch)	NM_000141	NP_000132	10q26
	FGFR3	HBGFR, ACH, Cek2(ch)	NM_000142	NP_000133	4p16.3
	FGFR4		NM_002011	NP_002002	5q35.1-qter
INSR family	IGF1R	JTK13	NM_000875	NP_000866	15q25-q26
	INSR	IR	NM_000208	NP_000199	19p13.3-p13.2
	INSRR	IRR	J05046	AAC31759	1q21-q23
MET Family	MET	HGFR	NM_000245	NP_000236	7q31
MET Family	RON	MST1R, CDw136, Fv2(m), STK(m), SEA(ch)	NM_002447	NP_002438	3p21.3
MUSK family	MUSK	Nsk2(m), Mlk1(m), Mk2(m)	NM_005592	NP_005583	9q31.3-q32
PDGFR	CSF1R	FMS, C-FMS, CD115	NM_005211	NP_005202	5q31-q32
family	FLT3	FLK2, STK1, CD135	NM_004119	NP_0041110	13q12
	KIT	Sfr(m), CKIT	NM_000222	NP_000213	4q11-q12
	PDGFRA		NM_006206	NP_006197	4q11-q13
	PDGFRB	PDGFR, JTK12	NM_002609	NP_002600	5q31-q32
PTK7 familv	PTK7	CCK4, KLG(ch)	NM_002821	NP_002812	6p21.2-p12.2
RET family	RET	MEN2A/B, HSCR1, MTC1	X12949	P07949	10q11.2
ROR family	ROR1	NTRKR1	NM_005012	NP_005003	1p32-p31
ROR family	ROR2	NTRKR2	NM_004560	NP_004551
ROS familv	ROS1	MCF3	NM_002944	NP_002935	6q22
RYK family	RYK	Vlk(m), Mrk(m)	S59184	AAB263411	3q22
TIE family	TEK	TIE2	NM_000459	NP_000450	9p21
TIE family	TIE	TIE1, JTK14	NM_005424	NP_005415	1p34-p33
TRK family	NTRK1	TRK, TRKA	NM_002529	NP_002520	1q21-q22
	NTRK2	TRKB	NM_006180	NP_006171	9q22.1
	NTRK3	TRKC	NM_002530	NP_002521	15q25
VEGFR family	VEGFR1	FLT1	NM_002019	NP_002010	13q12
	VEGFR2	KDR, FLK1		AAB88005	4q11-q12
	VEGFR3	FLT4, PCL	NM_002020	NP_002011	5q34-q35
AATYK family	AATYK	AATK, KIAA0641	NM_004920	NP_004911	17q25.3
	AATYK2	KIAA 1079	NM_014916	NP_055731	7q21-q22
	AATYK3				19q13.2-q13.3

Das Mulit-Flap-Prime-Editing-CID-System bietet zahlreiche Vorteile. Ein solcher Vorteil besteht darin, dass es endogene Liganden, bei denen es sich typischerweise um Proteine handelt, die bei Herstellung, Kosten, Lieferung, Produktion oder Lagerung Komplikationen verursachen, durch arzneimittelähnliche kleine Moleküle ersetzen kann, die oral verabreicht werden können, anstatt sie durch IV oder Injektion zu verabreichen, sich leicht aus von der FDA zugelassenen Arzneimitteln herstellen lassen (oder selbst bereits Arzneimittel sind) und keine besonderen Produktions- oder Lagerkosten, die typischerweise mit Proteinarzneimitteln verbunden sind, verursachen. Ein weiterer Vorteil ist, dass das Editing allein keine physiologische Wirkung haben sollte. Das Ausmaß der Dimerisierung des Ziel-Proteins kann durch Dosierung des niedermolekularen CID kontrolliert werden. Außerdem ist die Dimerisierung des Ziel-Proteins durch Zugabe der monomeren Form des CID leicht und schnell reversibel. Ein weiterer Vorteil besteht darin, dass in Fällen, in denen ein einzelner Ligand auf mehrere Rezeptoren abzielt, Selektivität durch Prime-Editing nur eines Rezeptors erreicht werden kann. Schließlich kann es in Abhängigkeit von dem für das Prime-Editing verwendeten Einschleusungsverfahren auch möglich sein, das Editing auf ein lokalisiertes Gewebe oder Organ zu beschränken, wodurch eine induzierbare Rezeptoraktivierung nur in bestimmten Bereichen ermöglicht wird.
Wenn die Editing-Effizienz beim Multi-Flap-Prime-Editing hoch genug ist, dass zwei separate Editing-Ereignisse auf hohem Niveau auftreten könnten, wäre es auch möglich, zwei Proteine von Interesse mit unterschiedlichen niedermolekularen Bindungsdomänen (wie FKBP und Cyclophilin) zu markieren und Heterodimerisierungen mit kleinen Molekülheterodimeren (wie ein FK506-Cyclosporin-A-Dimer) zu induzieren.
Die Fusion von FKBP12 oder anderen niedermolekularen Bindungsproteinen mit nativen Proteinen wurde im Allgemeinen durch Überexprimierung von Plasmid in Gewebekultur erreicht. Es wurde gezeigt, dass die anschließende chemisch induzierte Dimerisierung phänotypische Veränderungen an Zellen induziert, die die Fusionsproteine produzieren.
Die folgenden Referenzen werden im obigen Abschnitt zitiert und sind hierin durch Bezugnahme aufgenommen.

1. Crabtree, G. R. & Schreiber, S. L. Three-part inventions: intracellular signaling and induced proximity. Trends Biochem. Sci. 21, 418-22 (1996).
2. Liu, J. et al. Calcineurin Is a Common Target of A and FKBP-FK506 Complexes. Cell 66, 807-815 (1991).
3. Keith, C. T. et al. A mammalian protein targeted by Gl-arresting rapamycin-receptor complex. Nature 369, 756-758 (2003).
4. Spencer, D. M., Wandless, T. J., Schreiber, S. L. S. & Crabtree, G. R. Controlling signal transduction with synthetic ligands. Science 262, 1019-24 (1993).
5. Pruschy, M. N. et al. Mechanistic studies of a signaling pathway activated by the organic dimerizer FK1012. Chem. Biol. 1, 163-172 (1994).
6. Spencer, D. M. et al. Functional analysis of Fas signaling in vivo using synthetic inducers of dimerization. Curr. Biol. 6, 839-847 (1996).
7. Belshaw, P. J., Spencer, D. M., Crabtree, G. R. & Schreiber, S. L. Controlling programmed cell death with a cyclophilin-cyclosporin-based chemical inducer of dimerization. Chem. Biol. 3, 731-738 (1996).
8. Yang, J. X., Symes, K., Mercola, M. & Schreiber, S. L. Small-molecule control of insulin and PDGF receptor signaling and the role of membrane attachment. Curr. Biol. 8, 11-18 (1998).
9. Belshaw, P. J., Ho, S. N., Crabtree, G. R. & Schreiber, S. L. Controlling protein association and subcellular localization with a synthetic ligand that induces heterodimerization of proteins. Proc.Natl. Acad. Sci. 93, 4604-4607 (2002).
10. Stockwell, B. R. & Schreiber, S. L. Probing the role of homomeric and heteromeric receptor interactions in TGF-β signaling using small molecule dimerizers. Curr. Biol. 8, 761-773 (2004).
11. Spencer, D. M., Graef, I., Austin, D. J., Schreiber, S. L. & Crabtree, G. R. A general strategy for producing conditional alleles of Src-like tyrosine kinases. Proc. Natl. Acad. Sci. 92, 9805-9809 (2006).
12. Holsinger, L. J., Spencer, D. M., Austin, D. J., Schreiber, S. L. & Crabtree, G. R. Signal transduction in T lymphocytes using a conditional allele of Sos. Proc. Natl. Acad. Sci. 92, 9810-9814 (2006).
13. Myers, M. G. Insulin Signal Transduction and the IRS Proteins. Annu. Rev. Pharmacol. Toxicol. 36, 615-658 (1996).
14. Watowich, S. S. The erythropoietin receptor: Molecular structure and hematopoietic signaling pathways. J. Investig. Med. 59, 1067-1072 (2011).
15. Blau, C. A., Peterson, K. R., Drachman, J. G. & Spencer, D. M. A proliferation switch for genetically modified cells. Proc. Natl. Acad. Sci. 94, 3076-3081 (2002).
16. Clackson, T. et al. Redesigning an FKBP-ligand interface to generate chemical dimerizers with novel specificity. Proc. Natl. Acad. Sci. 95, 10437-10442 (1998).
17. Diver, S. T. & Schreiber, S. L. Single-step synthesis of cell-permeable protein dimerizers that activate signal transduction and gene expression. J. Am. Chem. Soc. 119, 5106-5109 (1997).
18. Guo, Z. F., Zhang, R. & Liang, F. Sen. Facile functionalization of FK506 for biological studies by the thiol-ene ‚dick‘ reaction. RSC Adv. 4, 11400-11403 (2014).
19. Robinson, D. R., Wu, Y.-M. & Lin, S.-F. The protein tyrosine kinase family of the human genome. Oncogene 19, 5548-5557 (2000).

G. Verwendung von Mulit-Flap-Prime-Editing zum Einfügen von Rekombinase- Zielstellen
In einem anderen Aspekt kann das Mulit-Flap-Prime-Editing (z. B. wie in 90, 95, 97A, 98A dargestellt) zum Einfügen von Rekombinasestellen (oder „Rekombinase- Erkennungssequenzen“) in eine gewünschte genomische Stelle verwendet werden. Die Insertion von Rekombinasestellen stellt eine programmierte Stelle bereit, um ortsspezifische genetische Veränderungen in einem Genom zu bewirken. Solche genetischen Veränderungen können beispielsweise genomische Integration eines Plasmids, genomische Deletion oder Insertion, chromosomale Translokationen und Kassettenaustausch neben anderen genetischen Veränderungen umfassen. Diese beispielhaften Typen genetischer Veränderungen sind in 64(b)-64(f) dargestellt. Die eingebauten Rekombinase-Erkennungssequenzen können dann verwendet werden, um eine ortsspezifische Rekombination an dieser Stelle durchzuführen, um eine Vielzahl von Rekombinationsergebnissen zu bewirken, wie beispielsweise Exzision, Integration, Inversion oder Austausch von DNA-Fragmenten. Zum Beispiel veranschaulicht 65 den Einbau einer Rekombinasestelle, die dann verwendet werden kann, um ein DNA- Donor-Templat zu integrieren, das einen GFP-Exprimierungsmarker umfasst. Zellen, die das integrierte GFP-Exprimierungssystem in der Rekombinasestelle enthalten, werden fluoreszieren.
Der Mechanismus des Einbaus einer Rekombinasestelle in das Genom ist analog zum Einbau anderer Sequenzen, wie etwa Peptid-/Protein- und RNA-Tags, in das Genom. Ein Schema, das den Einbau einer Rekombinase-Zielsequenz beispielhaft darstellt, ist in 64(a) gezeigt. Das Verfahren beginnt mit der Auswahl eines gewünschten Ziel-Locus, in den die Rekombinase-Zielsequenz eingeführt wird. Als nächstes wird eine Prime-Editor-Fusion bereitgestellt („RT-Cas9:gRNA“). Hier bezieht sich die „gRNA“ auf eine PEgRNA, die unter Verwendung der hierin beschriebenen Prinzipien ausgestaltet werden kann. Die PEgRNA umfasst in verschiedenen Ausführungsformen eine Architektur entsprechend 3D (5'- [~20-NT-Spacer]-[gRNA-Kem]-[Verlängerungsarm]-3', wobei der Verlängerungsarm in 3'- zu-5'-Richtung eine Primer-Bindungsstelle („A“), ein Edit-Templat („B“) und einen Homologiearm („C“) umfasst. Das Edit-Templat („B“) umfasst eine Sequenz, die einer Rekombinasestelle entspricht, d. h. eine Einzelstrang-RNA der PEgRNA, die eine komplementäre Einzelstrang-DNA kodiert, die entweder der Sense- oder der Antisense-Strang der Rekombinasestelle ist und die durch den Multi-Flap-Prime-Editing-Prozess in den genomischen DNA-Ziel-Locus eingebaut wird.
In verschiedenen Aspekten sieht die vorliegende Offenbarung die Verwendung eines Multi-Flap-PE vor, um Rekombinase-Erkennungssequenzen an hochwertige Loci in humanen oder anderen Genomen einzuführen, die nach Exposition gegenüber ortsspezifischer Rekombinase(n) präzise und effiziente genomische Modifikationen lenken (64). In verschiedenen in 64 gezeigten Ausführungsformen kann PE verwendet werden, um (b) ein einzelnes SSR-Ziel zur Verwendung als Stelle für die genomische Integration eines DNA- Donor-Templats zu inserieren. (c) zu zeigen, wie eine Tandem-Insertion von SSR-Zielstellen verwendet werden kann, um einen Teil des Genoms zu löschen, (d) zu zeigen, wie eine Tandem-Insertion von SSR-Zielstellen verwendet werden kann, um einen Teil des Genoms zu invertieren, (e) zu zeigen, wie die Insertion von zwei SSR-Zielstellen an zwei distalen chromosomalen Regionen zu einer chromosomalen Translokation führen kann. (f) zu zeigen, wie die Insertion von zwei verschiedenen SSR-Zielstellen im Genom verwendet werden kann, um eine Kassette von einem DNA-Donor-Templat auszutauschen. Jede der Arten von Genommodifikationen wird durch die Verwendung von PE zum Einfügen von SSR-Tagets ins Auge gefasst, aber diese Liste soll auch nicht einschränkend sein.
Die Multi-Flap-PE-vermittelte Einführung von Rekombinase-Erkennungssequenzen könnte besonders nützlich für die Behandlung genetischer Erkrankungen sein, die durch großräumige Genomdefekte verursacht werden, wie etwa Genverlust, Inversion oder Duplikation oder chromosomale Translokation^1-7 (Tabelle 6). Das Williams-Beuren-Syndrom ist beispielsweise eine Entwicklungsstörung, die durch eine Deletion von 24 auf Chromosom 721 verursacht wird. Es gibt derzeit keine Technologie für die effiziente und gezielte Insertion mehrerer vollständiger Gene in lebende Zellen (das Potenzial von PE für eine solche vollständige Geninsertion wird derzeit untersucht, ist aber noch nicht festgestellt); jedoch bietet die rekombinasevermittelte Integration an einem durch PE inserierten Ziel einen Ansatz zur dauerhaften Heilung dieser und anderer Krankheiten. Darüber hinaus könnte die gezielte Einführung von Rekombinase-Erkennungssequenzen für Anwendungen, einschließlich der Erzeugung von transgenen Pflanzen, Tierforschungsmodellen, Bioproduktionszelllinien oder anderen kundenspezifischen eukaryotischen Zelllinien, sehr hilfreich sein. Beispielsweise könnte die rekombinasevermittelte genomische Umlagerung in transgenen Pflanzen an Multi- Flap-PE-spezifischen Zielen einen der Engpässe bei der Erzeugung von Nutzpflanzen mit verbesserten Eigenschaften überwinden^8,9.

Tabelle 6. Beispiele für genetische Erkrankungen im Zusammenhang mit groß angelegten genomischen Veränderungen, die durch den Multi-Flap-PE-basierten Einbau von Rekombinase-Erkennungssequenzen repariert werden könnten.

ERKRANKUNG	URSACHE
TRISOMIE 17P	GENDUPLIKATION
CHARCOT-MARIE-TOOTH- KRANKHEIT TYP I	GENDUPLIKATION
SMITH-MAGENIS-SYNDROM	GENLÖSCHUNG
WILLIAMS-BEUREN-SYNDROM	GENLÖSCHUNG
DE LA CHAPELLE-SYNDROM	CHROMOSOMALE TRANSLOKATION
DOWN-SYNDROM (EINIGE FORMEN)	CHROMOSOMALE TRANSLOKATION
HÄMOPHILIE A	GENINVERSION
HUNTER-SYNDROM	GENINVERSION

Eine Reihe von Mitgliedern der SSR-Familie wurden charakterisiert und ihre Rekombinase-Erkennungssequenzen beschrieben, einschließlich natürlicher und manipulierter Tyrosin-Rekombinasen (Tabelle 7), große Serin-Integrasen (Tabelle 8), Serin-Resolvasen (Tabelle 9) und Tyrosin-Integrasen (Tabelle 10). Modifizierte Zielsequenzen, die erhöhte Raten der genomischen Integration zeigen, wurden auch für mehrere SSRs^22-30 beschrieben. Zusätzlich zu natürlichen Rekombinasen wurden programmierbare Rekombinasen mit unterschiedlichen Spezifitäten entwickelt^31-40. Unter Verwendung von PE könnten eine oder mehrere dieser Erkennungssequenzen in Abhängigkeit von der gewünschten Anwendung an einer bestimmten Stelle in das Genom eingeführt werden, wie zum Beispiel an einem Safe- Harbor-Locus ^41-43.
Zum Beispiel würde die Einführung einer einzelnen Rekombinase-Erkennungssequenz in das Genom durch Prime-Editing zu einer integrativen Rekombination mit einem DNA- Donor-Templat führen (64b). Serinintegrasen, die in humanen Zellen robust funktionieren, können für die Genintegration besonders gut geeignet sein^44,45.
Außerdem könnte die Einführung von zwei Rekombinase-Erkennungssequenzen in Abhängigkeit von der Identität und Orientierung der Ziele zu einer Deletion der intervenierenden Sequenz, einer Inversion der intervenierenden Sequenz, einer chromosomalen Translokation oder einem Kassettenaustausch führen (64c-f). Durch die Wahl endogener Sequenzen, die bereits Rekombinase-Zielen sehr ähnlich sind, würde der Umfang des Editings, der erforderlich ist, um das vollständige Rekombinase-Ziel einzuführen, reduziert werden.
Schließlich wurde für mehrere Rekombinasen gezeigt, dass sie sich an nativ vorkommenden Pseudostellen^46-64 in humane oder eukaryotische Genome integrieren. Multi- Flap-Prime-Editing könnte verwendet werden, um diese Loci zu modifizieren, um die Integrationsraten an diesen natürlichen Pseudostellen zu erhöhen, oder alternativ, um Pseudostellen zu eliminieren, die als unerwünschte Off-Target-Sequenzen dienen können.
Diese Offenbarung beschreibt eine allgemeine Methodik zum Einführen von Rekombinase-Zielsequenzen in eukaryontische Genome unter Verwendung von Multi-Flap- PE, deren Anwendungen nahezu unbegrenzt sind. Die Genom-Editing-Reaktionen sind für die Verwendung mit „Prime-Editoren“ vorgesehen, einer chimären Fusion eines CRISPR/Cas9- Proteins und einer Reverse-Transkriptase-Domäne, die eine benutzerdefinierte Prime-Editing- Guide-RNA (PEgRNA) verwendet. Als Erweiterung können Cas9-Werkzeuge und Homologie-gerichtete Reparatur (HDR)-Wege auch genutzt werden, um Rekombinase- Erkennungssequenzen durch DNA-Template einzuführen, indem die Indel-Raten unter Verwendung verschiedener Techniken gesenkt werden^65-67. Ein Proof-of-Concept-Experiment in humaner Zellkultur ist in 65 gezeigt. In einigen Ausführungsformen handelt es sich bei den Prime-Editoren um Multi-Flap-Prime-Editoren.

Die folgenden mehreren Tabellen werden in der obigen Beschreibung bezüglich des PE-gerichteten Einbaus von Rekombinase-Erkennungssequenzen zitiert und stellen eine Auflistung beispielhafter Rekombinasen, die verwendet werden können, und ihrer verwandten Rekombinase-Erkennungssequenzen, die von Multi-Flap-PE eingebaut werden können, bereit. Tabelle 7. Tyrosin-Rekombinasen und SSR-Zielsequenzen.

Recombinase	Recombinase recognition sequence	Name
Cre		loxP
Dre		rox
VCre		loxV
SCre		loxS
Flp		FRT
B2		loxB
B3		IoxB3
Kw
R		RS
TD1-40		TDRS
Vika		vox
Nigri		nox
Panto		pox
Kd		loxK
Fre		loxH
CreALSHG		loxM7
Tre		loxLTR
Brec1		loxBTR
Cre-R3M3		loxK2

Tabelle 8. Große Serinintegrasen und SSR-Zielsequenzen.

Rekombinase	Rekombinase-Erkennungssequen links	Rekombinase-Erkennungssequenz rechts
Bxb1
phiC31
R4
phiBT1
MJ1 (phiFC1)
MR11
TP901-1
A118
U153
phiRV1
phi370.1
TG1
WB
BL3
SprA

phiJoe
--	--
phiK38
Int2
Int3
Int4
Int7
Int8
Int9
Int10
Int11
Int12
Int13
LI
Peaches
Bxz2
SV1

Tabelle 9. Serinresolvasen und SSR-Zielsequenzen.

Resolvasen	Rekombinase-Erkennungssequenz Links	Rekombinase-Erkennungssequenz Rechts
Gin
Cin
Hin
Min
Sin		CGTATGATTAGGGTGTATATTAATTT (SEQ ID NO: 608)

Tabelle 10. Tyrosin-Integrasen und-Zielsequenzen.

Integrase	*attP*	*attB*
HK022		GCACTTTAGGTGAAAAAGGTT (SEQ ID NO: 610)


P22
L5

In verschiedenen anderen Aspekten betrifft die vorliegende Offenbarung Verfahren zur Verwendung von Multi-Flap-PE, um eine oder mehrere Rekombinase-Erkennungssequenzen einzubauen, und ihre Verwendung bei der stellenspezifischen Rekombination.
In einigen Ausführungsformen kann die stellenspezifische Rekombination eine Vielzahl von Rekombinationsergebnissen bewirken, wie beispielsweise Exzision, Integration, Inversion oder Austausch von DNA-Fragmenten.
In einigen Ausführungsformen sind die Verfahren zum Induzieren einer Rekombination von oder zwischen zwei oder mehr Regionen von zwei oder mehr Nukleinsäure- (z. B. DNA)-Molekülen nützlich. In anderen Ausführungsformen sind die Verfahren zum Induzieren einer Rekombination von oder zwischen zwei oder mehr Regionen in einem einzelnen Nukleinsäuremolekül (z. B. DNA) nützlich.
In einigen Ausführungsformen stellt die Offenbarung ein Verfahren zum Integrieren eines Donor-DNA-Templats durch ortsspezifische Rekombination bereit, umfassend: (a) Einbauen einer Rekombinase-Erkennungssequenz an einem genomischen Locus durch Multi- Flap-Prime-Editing; (b) Kontaktieren des genomischen Locus mit einem DNA-Donor- Templat, das auch die Rekombinase-Erkennungssequenz in Gegenwart einer Rekombinase umfasst.
In anderen Ausführungsformen stellt die Offenbarung ein Verfahren zum Deletieren einer genomischen Region durch stellenspezifische Rekombination bereit, umfassend: (a) Einbauen eines Paares von Rekombinase-Erkennungssequenzen an einem genomischen Locus durch Multi-Flap-Prime-Editing; (b) Kontaktieren des genomischen Locus mit einer Rekombinase, wodurch die Deletion der genomischen Region zwischen dem Paar von Rekombinase-Erkennungssequenzen katalysiert wird.
In noch anderen Ausführungsformen stellt die Offenbarung ein Verfahren zum Invertieren einer genomischen Region durch stellenspezifische Rekombination bereit, umfassend: (a) Einbauen einer Rekombinase-Erkennungssequenz an einem genomischen Locus durch Multi-Flap-Prime-Editing; (b) Kontaktieren des genomischen Locus mit einer Rekombinase, wodurch die Inversion der genomischen Region zwischen dem Paar von Rekombinase-Erkennungssequenzen katalysiert wird.
In noch anderen Ausführungsformen stellt die Offenbarung ein Verfahren zum Induzieren einer chromosomalen Translokation zwischen einer ersten genomischen Stelle und einer zweiten genomischen Stelle bereit, umfassend: (a) Einbauen einer ersten Rekombinase- Erkennungssequenz an einem ersten genomischen Locus durch Prime-Editing; (b) Einbauen einer zweiten Rekombinase-Erkennungssequenz an einem zweiten genomischen Locus durch Multi-Flap-Prime-Editing; (c) Kontaktieren des ersten und des zweiten genomischen Locus mit einer Rekombinase, wodurch die chromosomale Translokation des ersten und zweiten genomischen Locus katalysiert wird.
In anderen Ausführungsformen stellt die Offenbarung ein Verfahren zum Induzieren eines Kassettenaustauschs zwischen einem genomischen Locus und einer Donor-DNA bereit, die eine Kassette umfasst, umfassend: (a) Einbauen einer ersten Rekombinase- Erkennungssequenz an einem ersten genomischen Locus durch Multi-Flap-Prime-Editing; (b) Einbauen einer zweiten Rekombinase-Erkennungssequenz an einem zweiten genomischen Locus durch Multi-Flap-Prime-Editing; (c) Kontaktieren des ersten und des zweiten genomischen Locus mit einer Donor-DNA, umfassend eine Kassette, die von der ersten und zweiten Rekombinase-Erkennungssequenz und einer Rekombinase flankiert wird, wodurch der Austausch des flankierten genomischen Locus und der Kassette im DNA-Donor katalysiert wird.
In verschiedenen Ausführungsformen, die die Insertion von mehr als einer Rekombinase-Erkennungssequenz in das Genom beinhalten, können die Rekombinase- Erkennungssequenzen gleich oder unterschiedlich sein. In einigen Ausführungsformen sind die Rekombinase-Erkennungssequenzen gleich. In anderen Ausführungsformen sind diese Rekombinase-Erkennungssequenzen unterschiedlich.
In verschiedenen Ausführungsformen kann die Rekombinase eine Tyrosinrekombinase sein, wie Cre, Dre, Vcre, Scre, Flp, B2, B3, Kw, R, TD1-40, Vika, Nigri, Panto, Kd, Fre, Cre(ALSHG), Tre, Brec1, oder Cre-R3M3, wie in Tabelle 7 gezeigt. In solchen Ausführungsformen kann die Rekombinase-Erkennungssequenz ein RRS aus Tabelle 7 sein, das der verwendeten Rekombinase entspricht.
In verschiedenen anderen Ausführungsformen kann die Rekombinase eine große Serin- Rekombinase sein, wie Bxb1, PhiC31, R4, phiBT1, MJ1, MR11, TP901-1, A118, V153, phiRV1, phi370.1, TG1, WB, BL3, SprA, phiJoe, phiK38, Int2, Int3, Int4, Int7, Int8, Int9, Int10, Int11, Int12, Int13, L1, peaches, Bxz2, oder SV1, wie in Tabelle 8 gezeigt. In solchen Ausführungsformen kann die Rekombinase-Erkennungssequenz ein RRS aus Tabelle 8 sein, das der verwendeten Rekombinase entspricht.
In noch verschiedenen anderen Ausführungsformen kann die Rekombinase eine Serin- Rekombinase sein, wie Bxb1, PhiC31, R4, phiBT1, MJ1, MR11, TP901-1, A118, V153, phiRV1, phi370.1, TG1, WB, BL3, SprA, phiJoe, phiK38, Int2, Int3, Int4, Int7, Int8, Int9, Int10, Int11, Int12, Int13, L1, peaches, Bxz2, oder SV1, wie in Tabelle 8 gezeigt. In solchen Ausführungsformen kann die Rekombinase-Erkennungssequenz ein RRS aus Tabelle 8 sein, das der verwendeten Rekombinase entspricht.
In anderen Ausführungsformen kann die Rekombinase eine Serinresolvase sein, wie Gin, Cin, Hin, Min oder Sin, wie in Tabelle 9 gezeigt. In solchen Ausführungsformen kann die Rekombinase-Erkennungssequenz ein RRS aus Tabelle 9 sein, das der verwendeten Rekombinase entspricht.
In verschiedenen anderen Ausführungsformen kann die Rekombinase eine Tyrosin- Integrase sein, wie beispielsweise HK022, P22 oder L5, wie in Tabelle 10 gezeigt. In solchen Ausführungsformen kann die Rekombinase-Erkennungssequenz ein RRS aus Tabelle 10 sein, das der verwendeten Rekombinase entspricht.
In einigen Ausführungsformen kann jedes der Verfahren zur stellenspezifischen Rekombination mit Multi-Flap-PE in vivo oder in vitro durchgeführt werden. In einigen Ausführungsformen wird jedes der Verfahren zur stellenspezifischen Rekombination in einer Zelle durchgeführt (z. B. rekombinieren genomischer DNA in einer Zelle). Die Zelle kann prokaryotisch oder eukaryotisch sein. Die Zelle, wie beispielsweise eine eukaryotische Zelle, kann sich in einem Individuum, wie beispielsweise einem Probanden, wie hierin beschrieben, befinden (z. B. einem humanen Probanden). Die hierin beschriebenen Verfahren sind nützlich für die genetische Modifikation von Zellen in vitro und in vivo, beispielsweise im Zusammenhang mit der Erzeugung transgener Zellen, Zelllinien oder Tieren, oder bei der Veränderung der genomischen Sequenz, z. B. der Korrektur eines genetischen Defekts in einer Zelle eines Probanden.
181 Ausführungsformen der hierin beschriebenen Multi-Flap-Prime-Editoren
Die folgenden nicht-einschränkenden Ausführungsformen beschreiben Aspekte der Dual-Prime-Editoren und deren Verwendung, wie sie in dieser Anmeldung beschrieben sind.

1. Ein System für gleichzeitiges Editieren beider Stränge einer doppelsträngigen DNA- Sequenz an einer zu editierenden Zielstelle, wobei das System einen ersten Prime-Editor- Komplex und einen zweiten Prime-Editor-Komplex umfasst, wobei jeder der ersten und zweiten Prime-Editor-Komplexe Folgendes umfasst: (1) einen Prime-Editor, der (i) ein Nukleinsäure-programmierbares DNA-Bindungsprotein (napDNAbp) und (ii) ein Polypeptid mit einer RNA-abhängigen DNA-Polymerase-Aktivität umfasst; und (2) eine pegRNA, umfassend eine Spacer-Sequenz, einen gRNA-Kern, ein DNA-Synthese-Templat und eine Primer-Bindungsstelle, wobei das DNA-Synthese-Templat der pegRNA des ersten Prime- Editor-Komplexes für eine erste einzelsträngige DNA-Sequenz kodiert und das DNA- Synthese-Templat der pegRNA des zweiten Prime-Editor-Komplexes für eine zweite einzelsträngige DNA-Sequenz kodiert, wobei die erste einzelsträngige DNA-Sequenz und die zweite einzelsträngige DNA-Sequenz jeweils eine Region der Komplementarität zur anderen umfassen, und wobei die erste einzelsträngige DNA-Sequenz und die zweite einzelsträngige DNA-Sequenz einen Duplex bilden, der einen editierten Abschnitt im Vergleich zur DNA- Sequenz an der zu editierenden Zielstelle umfasst, der in die zu editierende Zielstelle integriert wird.
2. Das System nach Ausführungsform 1, wobei der Prime-Editor des ersten Prime-Editor- Komplexes, des zweiten Prime-Editor-Komplexes oder sowohl des ersten Prime-Editor- Komplexes als auch des zweiten Prime-Editor-Komplexes ein Fusionsprotein ist, das das napDNAbp und das Polypeptid umfasst, das eine RNA-abhängige DNA-Polymerase-Aktivität aufweist.
3. Das System nach Ausführungsform 1 oder 2, wobei der erste Prime-Editor-Komplex und der zweite Prime-Editor-Komplex denselben Prime-Editor umfassen.
4. Das System nach Ausführungsform 1 oder 2, wobei der erste Prime-Editor-Komplex und der zweite Prime-Editor-Komplex unterschiedliche Prime-Editoren umfassen.
5. Das System nach einer der Ausführungsformen 1-4, wobei das napDNAbp eine Cas9- Domäne oder eine Variante davon ist.
6. Das System nach einer der Ausführungsformen 1-5, wobei das napDNAbp eine nukleaseaktive Cas9-Domäne, eine nuklease-inaktive Cas9-Domäne, eine Cas9-Nickase- Domäne oder eine Variante davon ist.
7. Das System nach einer der Ausführungsformen 1-4, wobei das napDNAbp ausgewählt ist aus der Gruppe bestehend aus: Cas9, Cas12e, Cas12d, Cas12a, Cas12b1, Cas13a, Cas12c, CasX, CasY und Argonaut.
8. Das System nach einer der Ausführungsformen 1-7, wobei das napDNAbp eine Nickase-Aktivität aufweist.
9. Das System nach einer der Ausführungsformen 1-4, wobei das napDNAbp eine Aminosäuresequenz einer der SEQ-ID-NR: 18-88 umfasst, oder eine Aminosäuresequenz, die mindestens 80 %, 85 %, 90 %, 95 % oder 99 % Sequenzidentität mit einer der SEQ-ID-NR: 18-88 aufweist.
10. Das System nach einer der Ausführungsformen 1-9, wobei das Polypeptid, das eine RNA-abhängige DNA-Polymerase-Aktivität aufweist, eine reverse Transkriptase ist.
11. Das System nach einer der Ausführungsformen 1-10, wobei das Polypeptid mit einer RNA-abhängigen DNA-Polymerase-Aktivität eine Aminosäuresequenz einer der SEQ-ID-NR: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159 und 700-766 umfasst, oder eine Aminosäuresequenz, die mindestens 80 %, 85 %, 90 %, 95 % oder 99 % Sequenzidentität mit einer beliebigen der SEQ-ID-NR: 89-100, 105-122, 128-129 und 132 aufweist.
12. Das System nach einer der Ausführungsformen 1-11, wobei der Prime-Editor ferner einen Linker umfasst, der das napDNAbp und das Polypeptid mit der RNA-abhängigen DNA- Polymerase-Aktivität verbindet.
13. Das System nach Ausführungsform 12, wobei der Linker eine Aminosäuresequenz einer der SEQ-ID-NR: 166-177 umfasst, oder eine Aminosäuresequenz, die mindestens 80 %, 85 %, 90 %, 95 % oder 99 % Sequenzidentität mit einer der SEQ-ID-NR: 166-177 aufweist.
14. Das System nach Ausführungsform 12 oder 13, wobei der Linker 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 38, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49 oder 50 Aminosäuren in Länge beträgt.
15. Das System nach einer der Ausführungsformen 1-14, wobei die pegRNA eine Nukleotidsequenz einer der SEQ-ID-NR: 325-330, 499-505, 101-104, 181-183 und 223-244 umfasst, oder eine Nukleotidsequenz, die mindestens 80 %, 85 %, 90 %, 95 % oder 99 % Sequenzidentität mit einer der SEQ-ID-NR: 325-330, 499-505, 101-104, 181-183 und 223- 244 aufweist.
16. Das System nach einer der Ausführungsformen 1-15, wobei die Spacer-Sequenz der PegRNA des ersten Prime-Editor-Komplexes an eine erste Bindungsstelle auf einem ersten Strang der doppelsträngigen DNA-Sequenz stromaufwärts von der zu editierenden Zielstelle bindet.
17. Das System nach einer der Ausführungsformen 1-16, wobei die Spacer-Sequenz der PegRNA des zweiten Prime-Editor-Komplexes an eine zweite Bindungsstelle auf einem zweiten Strang der doppelsträngigen DNA-Sequenz stromabwärts von der zu editierenden Zielstelle bindet.
18. Das System nach Ausführungsform 17, wobei das Binden der Spacer-Sequenz der pegRNAs des ersten und zweiten Prime-Editor-Komplexes in Gegenwart einer PAM-Sequenz zum Nicking des ersten bzw. zweiten Stranges an einer Nickstelle proximal zu den PAM- Sequenzen auf jedem Strang durch die napDNAbps des ersten und zweiten Prime-Editor- Komplexes führt.
19. Das System nach Ausführungsform 18, wobei die erste und die zweite Bindungsstelle zwei Enden einer zusammenhängenden Region doppelsträngiger DNA definieren, die die zu editierende Zielstelle umfasst.
20. Das System nach Ausführungsform 19, wobei die zusammenhängende Region zwischen der ersten und der zweiten Bindungsstelle mindestens 10 Nukleobasenpaare, mindestens 11 Nukleobasenpaare, mindestens 12 Nukleobasenpaare, mindestens 13 Nukleobasenpaare, mindestens 14 Nukleobasenpaare, mindestens 15 Nukleobasenpaare, mindestens 16 Nukleobasenpaare, mindestens 17 Nukleobasenpaare, mindestens 18 Nukleobasenpaare, mindestens 19 Nukleobasenpaare, mindestens 20 Nukleobasenpaare, mindestens 21 Nukleobasenpaare, mindestens 22 Nukleobasenpaare, mindestens 23 Nukleobasenpaare, mindestens 24 Nukleobasenpaare, mindestens 25 Nukleobasenpaare, mindestens 26 Nukleobasenpaare, mindestens 27 Nukleobasenpaare, mindestens 28 Nukleobasenpaare, mindestens 29 Nukleobasenpaare, mindestens 30 Nukleobasenpaare, mindestens 31 Nukleobasenpaare, mindestens 32 Nukleobasenpaare, mindestens 33 Nukleobasenpaare, mindestens 34 Nukleobasenpaare, mindestens 35 Nukleobasenpaare, mindestens 36 Nukleobasenpaare, mindestens 37 Nukleobasenpaare, mindestens 37 Nukleobasenpaare, mindestens 38 Nukleobasenpaare, mindestens 39 Nukleobasenpaare oder mindestens 40 Nukleobasenpaare, mindestens 41 Nukleotide, mindestens 42 Nukleotide, mindestens 43 Nukleotide, mindestens 44 Nukleotide, mindestens 45 Nukleotide, mindestens 46 Nukleotide, mindestens 47 Nukleotide, mindestens 48 Nukleotide, mindestens 49 Nukleotide, mindestens 50 Nukleotide, mindestens 51 Nukleotide, mindestens 52 Nukleotide, mindestens 53 Nukleotide, mindestens 54 Nukleotide, mindestens 55 Nukleotide, mindestens 56 Nukleotide, mindestens 57 Nukleotide, mindestens 58 Nukleotide, mindestens 59 Nukleotide, mindestens 60 Nukleotide, mindestens 61 Nukleotide, mindestens 62 Nukleotide, mindestens 63 Nukleotide, mindestens 64 Nukleotide, mindestens 65 Nukleotide, mindestens 66 Nukleotide, mindestens 67 Nukleotide, mindestens 68 Nukleotide, mindestens 69 Nukleotide, mindestens 70 Nukleotide, mindestens 71 Nukleotide, mindestens 72 Nukleotide, mindestens 73 Nukleotide, mindestens 74 Nukleotide, mindestens 75 Nukleotide, mindestens 76 Nukleotide, mindestens 77 Nukleotide, mindestens 78 Nukleotide, mindestens 79 Nukleotide, mindestens 80 Nukleotide, mindestens 81 Nukleotide, mindestens 82 Nukleotide mindestens 83 Nukleotide, mindestens 84 Nukleotide, mindestens 85 Nukleotide, mindestens 86 Nukleotide, mindestens 87 Nukleotide, mindestens 88 Nukleotide, mindestens 89 Nukleotide, mindestens 90 Nukleotide, mindestens 91 Nukleotide, mindestens 92 Nukleotide, mindestens 93 Nukleotide, mindestens 94 Nukleotide, mindestens 95 Nukleotide, mindestens 96 Nukleotide, mindestens 97 Nukleotide, mindestens 98 Nukleotide, mindestens 99 Nukleotide, mindestens 100 Nukleotide, mindestens 101 Nukleotide, mindestens 102 Nukleotide, mindestens 103 Nukleotide, mindestens 104 Nukleotide, mindestens 105 Nukleotide, mindestens 106 Nukleotide, mindestens 107 Nukleotide, mindestens 108 Nukleotide, mindestens 109 Nukleotide oder mindestens 110 Nukleotide in Länge beträgt.
21. Das System nach Ausführungsform 19, wobei die zusammenhängende Region durch das Duplex ersetzt wird, das den editierten Abschnitt umfasst.
22. Das System nach einer der Ausführungsformen 1-21, wobei das DNA-Synthese- Templat mindestens 1 Nukleotid, mindestens 2 Nukleotide, mindestens 3 Nukleotide, mindestens 4 Nukleotide, mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide ist, mindestens 13 Nukleotide, mindestens 14 Nukleotide, mindestens 15 Nukleotide, mindestens 16 Nukleotide, mindestens 17 Nukleotide, mindestens 18 Nukleotide, mindestens 19 Nukleotide, mindestens 20 Nukleotide, mindestens 21 Nukleotide, mindestens 22 Nukleotide, mindestens 23 Nukleotide, mindestens 24 Nukleotide, mindestens 25 Nukleotide, mindestens 26 Nukleotide mindestens 27 Nukleotide, mindestens 28 Nukleotide, mindestens 29 Nukleotide, mindestens 30 Nukleotide, mindestens 31 Nukleotide, mindestens 32 Nukleotide, mindestens 33 Nukleotide, mindestens 34 Nukleotide, mindestens 35 Nukleotide, mindestens 36 Nukleotide, mindestens 37 Nukleotide, mindestens 38 Nukleotide, mindestens 39 Nukleotide, mindestens 40 Nukleotide mindestens 41 Nukleotide, mindestens 42 Nukleotide, mindestens 43 Nukleotide, mindestens 44 Nukleotide, mindestens 45 Nukleotide, mindestens 46 Nukleotide, mindestens 47 Nukleotide, mindestens 48 Nukleotide, mindestens 49 Nukleotide, mindestens 50 Nukleotide, mindestens 51 Nukleotide, mindestens 52 Nukleotide, mindestens 53 Nukleotide, mindestens 54 Nukleotide mindestens 55 Nukleotide, mindestens 56 Nukleotide, mindestens 57 Nukleotide, mindestens 58 Nukleotide, mindestens 59 Nukleotide, mindestens 60 Nukleotide, mindestens 61 Nukleotide, mindestens 62 Nukleotide, mindestens 63 Nukleotide, mindestens 64 Nukleotide, mindestens 65 Nukleotide, mindestens 66 Nukleotide, mindestens 67 Nukleotide, mindestens 68 Nukleotide, mindestens 69 Nukleotide, mindestens 70 Nukleotide, mindestens 71 Nukleotide, mindestens 72 Nukleotide, mindestens 73 Nukleotide, mindestens 74 Nukleotide, mindestens 75 Nukleotide, mindestens 76 Nukleotide, mindestens 77 Nukleotide, mindestens 78 Nukleotide, mindestens 79 Nukleotide, mindestens 80 Nukleotide, mindestens 81 Nukleotide, mindestens 82 Nukleotide mindestens 83 Nukleotide, mindestens 84 Nukleotide, mindestens 85 Nukleotide, mindestens 86 Nukleotide, mindestens 87 Nukleotide, mindestens 88 Nukleotide, mindestens 89 Nukleotide, mindestens 90 Nukleotide, mindestens 91 Nukleotide, mindestens 92 Nukleotide, mindestens 93 Nukleotide, mindestens 94 Nukleotide, mindestens 95 Nukleotide, mindestens 96 Nukleotide, mindestens 97 Nukleotide, mindestens 98 Nukleotide, mindestens 99 Nukleotide, mindestens 100 Nukleotide, mindestens 101 Nukleotide, mindestens 102 Nukleotide, mindestens 103 Nukleotide, mindestens 104 Nukleotide, mindestens 105 Nukleotide, mindestens 106 Nukleotide, mindestens 107 Nukleotide, mindestens 108 Nukleotide, mindestens 109 Nukleotide oder mindestens 110 Nukleotide in Länge beträgt.
23. Das System nach einer der Ausführungsformen 1-22, wobei die erste einzelsträngige DNA-Sequenz und die zweite einzelsträngige DNA-Sequenz die gleichen Längen aufweisen.
24. Das System nach einer der Ausführungsformen 1-22, wobei die erste einzelsträngige DNA-Sequenz und die zweite einzelsträngige DNA-Sequenz unterschiedliche Längen aufweisen.
25. Das System nach einer der Ausführungsformen 1-24, wobei die Region der Komplementarität mindestens 99 %, mindestens 95 %, mindestens 90 %, mindestens 85 %, mindestens 80 %, mindestens 75 %, mindestens 70 %, mindestens 65 %, mindestens 60 %, mindestens 55 %, mindestens 50 %, mindestens 45 %, mindestens 40 %, mindestens 35 %, mindestens 30 %, mindestens 25 %, mindestens 20 %, mindestens 15 % oder mindestens 10 % der Gesamtlänge der ersten einzelsträngigen DNA-Sequenz oder der zweiten einzelsträngigen DNA-Sequenz beträgt.
26. Das System nach Ausführungsform 25, wobei die Region der Komplementarität mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide, mindestens 15 Nukleotide, mindestens 16 Nukleotide, mindestens 17 Nukleotide, mindestens 18 Nukleotide, mindestens 19 Nukleotide, mindestens 20 Nukleotide, mindestens 21 Nukleotide, mindestens 22 Nukleotide, mindestens 23 Nukleotide, mindestens 24 Nukleotide, mindestens 25 Nukleotide, mindestens 26 Nukleotide, mindestens 27 Nukleotide, mindestens 28 Nukleotide, mindestens 29 Nukleotide, mindestens 30 Nukleotide mindestens 31 Nukleotide, mindestens 32 Nukleotide, mindestens 33 Nukleotide, mindestens 34 Nukleotide, mindestens 35 Nukleotide, mindestens 36 Nukleotide, mindestens 37 Nukleotide, mindestens 38 Nukleotide, mindestens 39 Nukleotide, mindestens 40 Nukleotide, mindestens 41 Nukleotide, mindestens 42 Nukleotide, mindestens 43 Nukleotide, mindestens 44 Nukleotide mindestens 45 Nukleotide, mindestens 46 Nukleotide, mindestens 47 Nukleotide, mindestens 48 Nukleotide, mindestens 49 Nukleotide, mindestens 50 Nukleotide, mindestens 51 Nukleotide, mindestens 52 Nukleotide, mindestens 53 Nukleotide, mindestens 54 Nukleotide, mindestens 55 Nukleotide, mindestens 56 Nukleotide, mindestens 57 Nukleotide, mindestens 58 Nukleotide, mindestens 59 Nukleotide, mindestens 60 Nukleotide, mindestens 61 Nukleotide, mindestens 62 Nukleotide, mindestens 63 Nukleotide, mindestens 64 Nukleotide, mindestens 65 Nukleotide, mindestens 66 Nukleotide, mindestens 67 Nukleotide, mindestens 68 Nukleotide, mindestens 69 Nukleotide, mindestens 70 Nukleotide, mindestens 71 Nukleotide, mindestens 72 Nukleotide, mindestens 73 Nukleotide, mindestens 74 Nukleotide, mindestens 75 Nukleotide, mindestens 76 Nukleotide, mindestens 77 Nukleotide, mindestens 78 Nukleotide, mindestens 79 Nukleotide, mindestens 80 Nukleotide, mindestens 81 Nukleotide, mindestens 82 Nukleotide, mindestens 83 Nukleotide, mindestens 84 Nukleotide, mindestens 85 Nukleotide, mindestens 86 Nukleotide, mindestens 87 Nukleotide, mindestens 88 Nukleotide, mindestens 89 Nukleotide, mindestens 90 Nukleotide, mindestens 91 Nukleotide, mindestens 92 Nukleotide, mindestens 93 Nukleotide, mindestens 94 Nukleotide, mindestens 95 Nukleotide, mindestens 96 Nukleotide, mindestens 97 Nukleotide, mindestens 98 Nukleotide, mindestens 99 Nukleotide, mindestens 100 Nukleotide, mindestens 101 Nukleotide, mindestens 102 Nukleotide, mindestens 103 Nukleotide, mindestens 104 Nukleotide, mindestens 105 Nukleotide, mindestens 106 Nukleotide, mindestens 107 Nukleotide, mindestens 108 Nukleotide, mindestens 109 Nukleotide oder mindestens 110 Nukleotide in Länge beträgt und entweder kleiner oder gleich der Länge der gewünschten DNA-Sequenz und deren Komplement ist.
27. Das System nach Ausführungsform 25, wobei die Region der Komplementarität der ersten einzelsträngigen DNA-Sequenz und der zweiten einzelsträngigen DNA-Sequenz den Duplex bilden, der den editierten Abschnitt umfasst.
28. Das System nach einer der Ausführungsformen 1-27, wobei die erste einzelsträngige DNA-Sequenz und die zweite einzelsträngige DNA-Sequenz jeweils einzelsträngige DNA- Stränge sind, die 3'-Enden aufweisen.
29. Das System nach Ausführungsform 21, wobei der Austausch der zusammenhängenden Region durch den Duplex, der den editierten Abschnitt umfasst, zu einer Insertion, Deletion oder einem Austausch der DNA an der Zielstelle führt.
30. Ein System für gleichzeitiges Editieren beider Stränge einer doppelsträngigen DNA- Sequenz an einer zu editierenden Zielstelle, wobei das System Folgendes umfasst:
1. (a) einen ersten Prime-Editor-Komplex, umfassend:
  1. i. einen ersten Prime-Editor, umfassend ein erstes Nukleinsäure-programmierbares DNA- Bindungsprotein (erstes napDNAbp) und ein erstes Polypeptid, das eine RNA-abhängige DNA-Polymerase-Aktivität umfasst; und
  2. ii. eine erste Prime-Editing-Leit-RNA (erste PEgRNA), die an eine erste Bindungsstelle auf einem ersten Strang der doppelsträngigen DNA-Sequenz stromaufwärts von der zu editierenden Zielstelle bindet;
2. (b) einen zweiten Prime-Editor-Komplex, umfassend:
  1. i. einen zweiten Prime-Editor, umfassend ein zweites Nukleinsäure-programmierbares DNA- Bindeprotein (zweites napDNAbp) und ein zweites Polypeptid, das eine RNA-abhängige DNA-Polymerase-Aktivität umfasst; und
  2. ii. eine zweite Prime-Editing-Leit-RNA (zweite PEgRNA), die an eine zweite Bindungsstelle auf einem zweiten Strang der doppelsträngigen DNA-Sequenz stromabwärts von der zu editierenden Zielstelle bindet;
wobei die erste PEgRNA eine erstes DNA-Synthese-Templat umfasst, das eine erste einzelsträngige DNA-Sequenz kodiert, und die zweite PEgRNA ein zweites DNA-Synthese- Templat umfasst, das eine zweite einzelsträngige DNA-Sequenz kodiert, und wobei der erste Strang und der zweite Strang der doppelsträngigen DNA-Sequenz komplementär zueinander sind.
31. Das System nach Ausführungsform 30, wobei der Prime-Editor des ersten Prime- Editor-Komplexes, des zweiten Prime-Editor-Komplexes oder sowohl des ersten Prime- Editor-Komplexes als auch des zweiten Prime-Editor-Komplexes ein Fusionsprotein ist, das das napDNAbp und das Polypeptid umfasst, das eine RNA-abhängige DNA-Polymerase- Aktivität aufweist.
32. Das System nach Ausführungsform 30, wobei die erste und die zweite einzelsträngige DNA-Sequenz jeweils eine Region der Komplementarität zur anderen umfassen.
33. Das System nach Ausführungsform 30, wobei die erste einzelsträngige DNA-Sequenz und die zweite einzelsträngige DNA-Sequenz einen Duplex bilden, der den editierten Abschnitt umfasst, der in die zu editierende Zielstelle integriert wird.
34. Das System nach Ausführungsform 30, wobei die erste einzelsträngige DNA-Sequenz und/oder die zweite einzelsträngige Sequenz keine Sequenzhomologie im Vergleich zur DNA- Sequenz an der Zielstelle umfasst.
35. Das System nach Ausführungsform 30, wobei die erste PEgRNA ferner eine erste Spacer-Sequenz, einen ersten gRNA-Kern und eine erste Primer-Bindungsstelle umfasst, und die zweite PEgRNA ferner eine zweite Spacer-Sequenz, einen zweiten gRNA-Kern und eine zweite Primer-Bindungsstelle umfasst.
36. Das System nach einer der Ausführungsformen 30-35, wobei der erste Prime-Editor- Komplex und der zweite Prime-Editor-Komplex denselben Prime-Editor umfassen.
37. Das System nach einer der Ausführungsformen 30-35, wobei das erste Polypeptid, das eine RNA-abhängige DNA-Polymerase-Aktivität umfasst, und das zweite Polypeptid, das eine RNA-abhängige DNA-Polymerase-Aktivität umfasst, das gleiche sind.
38. Das System nach einer der Ausführungsformen 30-37, wobei das erste und/oder zweite napDNAbp eine Cas9-Domäne oder eine Variante davon ist.
39. Das System nach einer der Ausführungsformen 30-38, wobei das erste und/oder zweite napDNAbp eine nukleaseaktive Cas9-Domäne, eine nuklease-inaktive Cas9-Domäne, eine Cas9-Nickase-Domäne oder eine Variante davon ist.
40. Das System nach einer der Ausführungsformen 30-39, wobei das erste und/oder zweite napDNAbp ausgewählt ist aus der Gruppe bestehend aus Cas9, Cas12e, Cas12d, Cas12a, Cas12b1, Cas13a, Cas12c, CasX, CasY und Argonaut.
41. Das System nach einer der Ausführungsformen 30-40, wobei das napDNAbp eine Nickase-Aktivität aufweist.
42. Das System nach einer der Ausführungsformen 30-41, wobei das das erste und/oder zweite napDNAbp eine Aminosäuresequenz einer der SEQ-ID-NR: 18-88 umfasst, oder eine Aminosäuresequenz, die mindestens 80 %, 85 %, 90 %, 95 % oder 99 % Sequenzidentität mit einer der SEQ-ID-NR: 18-88 aufweist.
43. Das System nach einer der Ausführungsformen 30-42, wobei das das erste und/oder zweite Polypeptid, das eine RNA-abhängige DNA-Polymerase-Aktivität aufweist, eine reverse Transkriptase ist.
44. Das System nach einer der Ausführungsformen 30-43, wobei das das erste und/oder zweite Polypeptid mit einer RNA-abhängigen DNA-Polymerase-Aktivität eine Aminosäuresequenz einer der SEQ-ID-NR: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159 und 700-766 umfasst, oder eine Aminosäuresequenz, die mindestens 80 %, 85 %, 90 %, 95 % oder 99 % Sequenzidentität mit einer der SEQ-ID-NR: 89-100, 105-122, 128-129 und 132 aufweist.
45. Das System nach einer der Ausführungsformen 30-44, wobei der erste Prime-Editor ferner einen Linker umfasst, der das erste napDNAbp und das erste Polypeptid mit der RNA- abhängigen DNA-Polymerase-Aktivität verbindet; und/oder der zweite Prime-Editor ferner einen Linker umfasst, der das zweite napDNAbp und das zweite Polypeptid mit der RNA- abhängigen DNA-Polymerase-Aktivität verbindet.
46. Das System nach Ausführungsform 45, wobei der Linker eine Aminosäuresequenz einer der SEQ-ID-NR: 166-177 umfasst, oder eine Aminosäuresequenz, die mindestens 80 %, 85 %, 90 %, 95 % oder 99 % Sequenzidentität mit einer der SEQ-ID-NR: 166-177 aufweist.
47. Das System nach Ausführungsform 45 oder 46, wobei der Linker 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 38, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49 oder 50 Aminosäuren in Länge beträgt.
48. Das System nach einer der Ausführungsformen 30-47, wobei das das erste und/oder zweite pegRNA eine Nukleotidsequenz einer der SEQ-ID-NR: 325-330, 499-505, 101-104, 181-183 und 223-244 umfasst, oder eine Nukleotidsequenz, die mindestens 80 %, 85 %, 90 %, 95 % oder 99 % Sequenzidentität mit einer der SEQ-ID-NR: 325-330, 499-505, 101-104, 181-183 und 223-244 aufweist.
49. Das System nach einer der Ausführungsformen 30-48, wobei die erste Spacer-Sequenz an eine erste Bindungsstelle auf einem ersten Strang der doppelsträngigen DNA-Sequenz stromaufwärts von der zu editierenden Zielstelle bindet.
50. Das System nach Ausführungsform 49, wobei die zweite Spacer-Sequenz des zweiten Prime-Editor-Komplexes an eine zweite Bindungsstelle auf einem zweiten Strang der doppelsträngigen DNA-Sequenz stromabwärts von der zu editierenden Zielstelle bindet.
51. Das System nach Ausführungsform 50, wobei die Bindung der Spacer-Sequenz des ersten und zweiten Prime-Editor-Komplexes in Gegenwart einer PAM-Sequenz zum Nicking des ersten bzw. zweiten Stranges an einer Nickstelle proximal zu den PAM-Sequenzen auf jedem Strang durch die ersten und/oder zweiten napDNAbps jedes der ersten und zweiten Prime-Editor-Komplexe führt.
52. Das System nach Ausführungsform 51, wobei die erste und die zweite Bindungsstelle zwei Enden einer zusammenhängenden Region doppelsträngiger DNA definieren, die die zu editierende Zielstelle umfasst.
53. Das System nach Ausführungsform 52, wobei die zusammenhängende Region zwischen der ersten und der zweiten Bindungsstelle mindestens 10 Nukleobasenpaare, mindestens 11 Nukleobasenpaare, mindestens 12 Nukleobasenpaare, mindestens 13 Nukleobasenpaare, mindestens 14 Nukleobasenpaare, mindestens 15 Nukleobasenpaare, mindestens 16 Nukleobasenpaare, mindestens 17 Nukleobasenpaare, mindestens 18 Nukleobasenpaare, mindestens 19 Nukleobasenpaare, mindestens 20 Nukleobasenpaare, mindestens 21 Nukleobasenpaare, mindestens 22 Nukleobasenpaare, mindestens 23 Nukleobasenpaare, mindestens 24 Nukleobasenpaare, mindestens 25 Nukleobasenpaare, mindestens 26 Nukleobasenpaare, mindestens 27 Nukleobasenpaare, mindestens 28 Nukleobasenpaare, mindestens 29 Nukleobasenpaare, mindestens 30 Nukleobasenpaare, mindestens 31 Nukleobasenpaare, mindestens 32 Nukleobasenpaare, mindestens 33 Nukleobasenpaare, mindestens 34 Nukleobasenpaare, mindestens 35 Nukleobasenpaare, mindestens 36 Nukleobasenpaare, mindestens 37 Nukleobasenpaare, mindestens 37 Nukleobasenpaare, mindestens 38 Nukleobasenpaare, mindestens 39 Nukleobasenpaare oder mindestens 40 Nukleobasenpaare, mindestens 41 Nukleotide, mindestens 42 Nukleotide, mindestens 43 Nukleotide, mindestens 44 Nukleotide, mindestens 45 Nukleotide, mindestens 46 Nukleotide, mindestens 47 Nukleotide, mindestens 48 Nukleotide, mindestens 49 Nukleotide, mindestens 50 Nukleotide, mindestens 51 Nukleotide, mindestens 52 Nukleotide, mindestens 53 Nukleotide, mindestens 54 Nukleotide, mindestens 55 Nukleotide, mindestens 56 Nukleotide, mindestens 57 Nukleotide, mindestens 58 Nukleotide, mindestens 59 Nukleotide, mindestens 60 Nukleotide, mindestens 61 Nukleotide, mindestens 62 Nukleotide, mindestens 63 Nukleotide, mindestens 64 Nukleotide, mindestens 65 Nukleotide, mindestens 66 Nukleotide, mindestens 67 Nukleotide, mindestens 68 Nukleotide, mindestens 69 Nukleotide, mindestens 70 Nukleotide, mindestens 71 Nukleotide, mindestens 72 Nukleotide, mindestens 73 Nukleotide, mindestens 74 Nukleotide, mindestens 75 Nukleotide, mindestens 76 Nukleotide, mindestens 77 Nukleotide, mindestens 78 Nukleotide, mindestens 79 Nukleotide, mindestens 80 Nukleotide, mindestens 81 Nukleotide, mindestens 82 Nukleotide mindestens 83 Nukleotide, mindestens 84 Nukleotide, mindestens 85 Nukleotide, mindestens 86 Nukleotide, mindestens 87 Nukleotide, mindestens 88 Nukleotide, mindestens 89 Nukleotide, mindestens 90 Nukleotide, mindestens 91 Nukleotide, mindestens 92 Nukleotide, mindestens 93 Nukleotide, mindestens 94 Nukleotide, mindestens 95 Nukleotide, mindestens 96 Nukleotide, mindestens 97 Nukleotide, mindestens 98 Nukleotide, mindestens 99 Nukleotide, mindestens 100 Nukleotide, mindestens 101 Nukleotide, mindestens 102 Nukleotide, mindestens 103 Nukleotide, mindestens 104 Nukleotide, mindestens 105 Nukleotide, mindestens 106 Nukleotide, mindestens 107 Nukleotide, mindestens 108 Nukleotide, mindestens 109 Nukleotide oder mindestens 110 Nukleotide in Länge beträgt.
54. Das System nach Ausführungsform 53, wobei die zusammenhängende Region durch das Duplex ersetzt wird, das den editierten Abschnitt umfasst.
55. System nach einer der Ausführungsformen 30-54, wobei das erste und/oder zweite DNA-Synthese-Templat mindestens 1 Nukleotid, mindestens 2 Nukleotide, mindestens 3 Nukleotide, mindestens 4 Nukleotide, mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide ist, mindestens 13 Nukleotide, mindestens 14 Nukleotide, mindestens 15 Nukleotide, mindestens 16 Nukleotide, mindestens 17 Nukleotide, mindestens 18 Nukleotide, mindestens 19 Nukleotide, mindestens 20 Nukleotide, mindestens 21 Nukleotide, mindestens 22 Nukleotide, mindestens 23 Nukleotide, mindestens 24 Nukleotide, mindestens 25 Nukleotide, mindestens 26 Nukleotide mindestens 27 Nukleotide, mindestens 28 Nukleotide, mindestens 29 Nukleotide, mindestens 30 Nukleotide, mindestens 31 Nukleotide, mindestens 32 Nukleotide, mindestens 33 Nukleotide, mindestens 34 Nukleotide, mindestens 35 Nukleotide, mindestens 36 Nukleotide, mindestens 37 Nukleotide, mindestens 38 Nukleotide, mindestens 39 Nukleotide, mindestens 40 Nukleotide mindestens 41 Nukleotide, mindestens 42 Nukleotide, mindestens 43 Nukleotide, mindestens 44 Nukleotide, mindestens 45 Nukleotide, mindestens 46 Nukleotide, mindestens 47 Nukleotide, mindestens 48 Nukleotide, mindestens 49 Nukleotide, mindestens 50 Nukleotide, mindestens 51 Nukleotide, mindestens 52 Nukleotide, mindestens 53 Nukleotide, mindestens 54 Nukleotide mindestens 55 Nukleotide, mindestens 56 Nukleotide, mindestens 57 Nukleotide, mindestens 58 Nukleotide, mindestens 59 Nukleotide, mindestens 60 Nukleotide, mindestens 61 Nukleotide, mindestens 62 Nukleotide, mindestens 63 Nukleotide, mindestens 64 Nukleotide, mindestens 65 Nukleotide, mindestens 66 Nukleotide, mindestens 67 Nukleotide, mindestens 68 Nukleotide, mindestens 69 Nukleotide, mindestens 70 Nukleotide, mindestens 71 Nukleotide, mindestens 72 Nukleotide, mindestens 73 Nukleotide, mindestens 74 Nukleotide, mindestens 75 Nukleotide, mindestens 76 Nukleotide, mindestens 77 Nukleotide, mindestens 78 Nukleotide, mindestens 79 Nukleotide, mindestens 80 Nukleotide, mindestens 81 Nukleotide, mindestens 82 Nukleotide mindestens 83 Nukleotide, mindestens 84 Nukleotide, mindestens 85 Nukleotide, mindestens 86 Nukleotide, mindestens 87 Nukleotide, mindestens 88 Nukleotide, mindestens 89 Nukleotide, mindestens 90 Nukleotide, mindestens 91 Nukleotide, mindestens 92 Nukleotide, mindestens 93 Nukleotide, mindestens 94 Nukleotide, mindestens 95 Nukleotide, mindestens 96 Nukleotide, mindestens 97 Nukleotide, mindestens 98 Nukleotide, mindestens 99 Nukleotide, mindestens 100 Nukleotide, mindestens 101 Nukleotide, mindestens 102 Nukleotide, mindestens 103 Nukleotide, mindestens 104 Nukleotide, mindestens 105 Nukleotide, mindestens 106 Nukleotide, mindestens 107 Nukleotide, mindestens 108 Nukleotide, mindestens 109 Nukleotide oder mindestens 110 Nukleotide in Länge beträgt.
56. Das System nach einer der Ausführungsformen 30-55, wobei die erste einzelsträngige DNA-Sequenz und die zweite einzelsträngige DNA-Sequenz die gleichen Längen aufweisen.
57. Das System nach einer der Ausführungsformen 30-55, wobei die erste einzelsträngige DNA-Sequenz und die zweite einzelsträngige DNA-Sequenz unterschiedliche Längen aufweisen.
58. Das System nach einer der Ausführungsformen 30-57, wobei die Region der Komplementarität mindestens 99 %, mindestens 95 %, mindestens 90 %, mindestens 85 %, mindestens 80 %, mindestens 75 %, mindestens 70 %, mindestens 65 %, mindestens 60 %, mindestens 55 %, mindestens 50 %, mindestens 45 %, mindestens 40 %, mindestens 35 %, mindestens 30 %, mindestens 25 %, mindestens 20 %, mindestens 15 % oder mindestens 10 % der Gesamtlänge der ersten einzelsträngigen DNA-Sequenz oder der zweiten einzelsträngigen DNA-Sequenz beträgt.
59. Das System nach einer der Ausführungsformen 30-58, wobei die Region der Komplementarität mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide ist, mindestens 13 Nukleotide, mindestens 14 Nukleotide, mindestens 15 Nukleotide, mindestens 16 Nukleotide, mindestens 17 Nukleotide, mindestens 18 Nukleotide, mindestens 19 Nukleotide, mindestens 20 Nukleotide, mindestens 21 Nukleotide, mindestens 22 Nukleotide, mindestens 23 Nukleotide, mindestens 24 Nukleotide, mindestens 25 Nukleotide, mindestens 26 Nukleotide mindestens 27 Nukleotide, mindestens 28 Nukleotide, mindestens 29 Nukleotide, mindestens 30 Nukleotide, mindestens 31 Nukleotide, mindestens 32 Nukleotide, mindestens 33 Nukleotide, mindestens 34 Nukleotide, mindestens 35 Nukleotide, mindestens 36 Nukleotide, mindestens 37 Nukleotide, mindestens 38 Nukleotide, mindestens 39 Nukleotide, mindestens 40 Nukleotide mindestens 41 Nukleotide, mindestens 42 Nukleotide, mindestens 43 Nukleotide, mindestens 44 Nukleotide, mindestens 45 Nukleotide, mindestens 46 Nukleotide, mindestens 47 Nukleotide, mindestens 48 Nukleotide, mindestens 49 Nukleotide, mindestens 50 Nukleotide, mindestens 51 Nukleotide, mindestens 52 Nukleotide, mindestens 53 Nukleotide, mindestens 54 Nukleotide mindestens 55 Nukleotide, mindestens 56 Nukleotide, mindestens 57 Nukleotide, mindestens 58 Nukleotide, mindestens 59 Nukleotide, mindestens 60 Nukleotide, mindestens 61 Nukleotide, mindestens 62 Nukleotide, mindestens 63 Nukleotide, mindestens 64 Nukleotide, mindestens 65 Nukleotide, mindestens 66 Nukleotide, mindestens 67 Nukleotide, mindestens 68 Nukleotide, mindestens 69 Nukleotide, mindestens 70 Nukleotide, mindestens 71 Nukleotide, mindestens 72 Nukleotide, mindestens 73 Nukleotide, mindestens 74 Nukleotide, mindestens 75 Nukleotide, mindestens 76 Nukleotide, mindestens 77 Nukleotide, mindestens 78 Nukleotide, mindestens 79 Nukleotide, mindestens 80 Nukleotide, mindestens 81 Nukleotide, mindestens 82 Nukleotide mindestens 83 Nukleotide, mindestens 84 Nukleotide, mindestens 85 Nukleotide, mindestens 86 Nukleotide, mindestens 87 Nukleotide, mindestens 88 Nukleotide, mindestens 89 Nukleotide, mindestens 90 Nukleotide, mindestens 91 Nukleotide, mindestens 92 Nukleotide, mindestens 93 Nukleotide, mindestens 94 Nukleotide, mindestens 95 Nukleotide, mindestens 96 Nukleotide, mindestens 97 Nukleotide, mindestens 98 Nukleotide, mindestens 99 Nukleotide, mindestens 100 Nukleotide, mindestens 101 Nukleotide, mindestens 102 Nukleotide, mindestens 103 Nukleotide, mindestens 104 Nukleotide, mindestens 105 Nukleotide, mindestens 106 Nukleotide, mindestens 107 Nukleotide, mindestens 108 Nukleotide, mindestens 109 Nukleotide oder mindestens 110 Nukleotide in Länge beträgt.
60. Das System nach einer der Ausführungsformen 30-59, wobei die Region der Komplementarität der ersten einzelsträngigen DNA-Sequenz und der zweiten einzelsträngigen DNA-Sequenz einen Duplex bilden.
61. Das System nach einer der Ausführungsformen 30-60, wobei die erste einzelsträngige DNA-Sequenz und die zweite einzelsträngige DNA-Sequenz jeweils einzelsträngige DNA- Stränge sind, die 3'-Enden aufweisen.
62. Das System nach Ausführungsform 54, wobei der Austausch der zusammenhängenden Region durch den Duplex, der den editierten Abschnitt umfasst, zu einer Insertion, Deletion oder einem Austausch der DNA an der Zielstelle führt.
63. Ein Polynukleotid, das das System von einer der Ausführungsformen 1-62 kodiert.
64. Ein Polynukleotid, das den ersten und zweiten Prime-Editor einer der Ausführungsformen 1-62 kodiert.
65. Ein Polynukleotid, das die erste und/oder zweite PegRNA einer der Ausführungsformen 1-29 kodiert.
66. Ein Polynukleotid, das die erste und/oder zweite PegRNA einer der Ausführungsformen 30-62 kodiert.
67. Ein Polynukleotid, das die erste und zweite pegRNA einer der Ausführungsformen 1- 29 kodiert.
68. Ein Polynukleotid, das die erste und zweite pegRNA einer der Ausführungsformen 30- 62 kodiert.
69. Ein Vektor, der ein Polynukleotid einer der Ausführungsformen 63-68 umfasst.
70. Eine Zelle, die ein Polynukleotid einer der Ausführungsformen 63-69 oder einen Vektor der Ausführungsform 64 umfasst.
71. Eine pharmazeutische Zusammensetzung, die ein Polynukleotid nach einer der Ausführungsformen 63-68, einen Vektor nach Ausführungsform 69 oder eine Zelle nach Ausführungsform 70 und einen pharmazeutischen Hilfsstoff umfasst.
72. Ein Kit, umfassend ein Polynukleotid nach einer der Ausführungsformen 63-69 oder einen Vektor nach Ausführungsform 70 und Anweisungen für gleichzeitiges Editieren beider Stränge einer doppelsträngigen DNA-Sequenz an einer zu editierenden Zielstelle.
73. Ein Verfahren für gleichzeitiges Editieren eines ersten und eines zweiten komplementären Strangs einer doppelsträngigen DNA-Sequenz an einer Zielstelle, wobei das Verfahren das Inkontaktbringen der doppelsträngigen DNA-Sequenz mit einem Paar von Prime-Editor-Komplexen umfasst, wobei das Paar Folgendes umfasst:
1. a. einen ersten Prime-Editor-Komplex, umfassend:
  1. i. einen ersten Prime-Editor, umfassend ein erstes Nukleinsäure-programmierbares DNA- Bindungsprotein (napDNAbp) und ein erstes Polypeptid, das eine RNA-abhängige DNA- Polymerase-Aktivität umfasst; und
  2. ii. eine erste Prime-Editing-Leit-RNA (erste PEgRNA), die an eine erste Bindungsstelle auf dem ersten Strang der genomischen DNA-Sequenz stromaufwärts von der Zielstelle bindet;
2. b. einen zweiten Prime-Editor-Komplex, umfassend:
  - i. einen zweiten Prime-Editor, umfassend ein zweites Nukleinsäure-programmierbares DNA- Bindeprotein (zweites napDNAbp) und ein zweites Polypeptid, das eine RNA-abhängige DNA-Polymerase-Aktivität umfasst; und
  - ii. eine zweite Prime-Editing-Leit-RNA (zweite PEgRNA), die an eine zweite Bindungsstelle auf dem zweiten Strang der genomischen DNA-Sequenz stromabwärts der Zielstelle bindet;
wobei der erste Prime-Editor-Komplex einen ersten Nick an einer Sequenz, die komplementär zu der ersten Bindungsstelle ist, und die anschließende Polymerisation einer ersten einzelsträngigen DNA-Sequenz, die ein 3'-Ende von dem verfügbaren 5'-Ende aufweist, das durch den ersten Nick gebildet wird, bewirkt; wobei der zweite Prime-Editor-Komplex einen zweiten Nick an einer Sequenz, die komplementär zu der zweiten Bindungsstelle ist, und die anschließende Polymerisation einer zweiten einzelsträngigen DNA-Sequenz, die ein 3'-Ende von dem verfügbaren 5'-Ende aufweist, das durch den zweiten Nick gebildet wird, bewirkt; wobei die erste einzelsträngige DNA-Sequenz und die zweite einzelsträngige DNA-Sequenz über mindestens eine Region der Komplementarität umgekehrt komplementär sind und einen Duplex bilden, der ein Editing umfasst; und wobei der Duplex den genickten ersten und zweiten komplementären Strang der doppelsträngigen DNA-Sequenz ersetzt.
74. Das Verfahren nach Ausführungsform 73, wobei der Prime-Editor des ersten Prime- Editor-Komplexes, des zweiten Prime-Editor-Komplexes oder sowohl des ersten Prime- Editor-Komplexes als auch des zweiten Prime-Editor-Komplexes ein Fusionsprotein ist, das das napDNAbp und das Polypeptid umfasst, das eine RNA-abhängige DNA-Polymerase- Aktivität aufweist.
75. Das Verfahren nach Ausführungsform 73, wobei der erste Prime-Editor-Komplex und der zweite Prime-Editor-Komplex denselben Prime-Editor umfassen.
76. Das Verfahren nach Ausführungsform 73, wobei der erste Prime-Editor-Komplex und der zweite Prime-Editor-Komplex unterschiedliche Prime-Editoren umfassen.
77. Das Verfahren nach einer der Ausführungsformen 73-76, wobei das erste und/oder zweite napDNAbp eine Cas9-Domäne oder eine Variante davon ist.
78. Das Verfahren nach einer der Ausführungsformen 73-77, wobei das erste und/oder zweite napDNAbp eine nukleaseaktive Cas9-Domäne, eine nuklease-inaktive Cas9-Domäne, eine Cas9-Nickase-Domäne oder eine Variante davon ist.
79. Das Verfahren nach einer der Ausführungsformen 73-76, wobei das erste und/oder zweite napDNAbp ausgewählt ist aus der Gruppe bestehend aus: Cas9, Cas12e, Cas12d, Cas12a, Cas12b1, Cas13a, Cas12c, CasX, CasY und Argonaut.
80. Das Verfahren nach einer der Ausführungsformen 73-79, wobei das erste und/oder zweite napDNAbp eine Nickase-Aktivität aufweist.
81. Das Verfahren nach einer der Ausführungsformen 73-80, wobei das das erste und/oder zweite napDNAbp eine Aminosäuresequenz einer der SEQ-ID-NR: 18-88 umfasst, oder eine Aminosäuresequenz, die mindestens 80 %, 85 %, 90 %, 95 % oder 99 % Sequenzidentität mit einer der SEQ-ID-NR: 18-88 aufweist.
82. Das Verfahren nach einer der Ausführungsformen 73-81, wobei das das erste und/oder zweite Polypeptid, das eine RNA-abhängige DNA-Polymerase-Aktivität aufweist, eine reverse Transkriptase ist.
83. Das Verfahren nach einer der Ausführungsformen 73-82, wobei das das erste und/oder zweite Polypeptid mit einer RNA-abhängigen DNA-Polymerase-Aktivität eine Aminosäuresequenz einer der SEQ-ID-NR: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159 und 700-766 umfasst, oder eine Aminosäuresequenz, die mindestens 80 %, 85 %, 90 %, 95 % oder 99 % Sequenzidentität mit einer der SEQ-ID-NR: 89-100, 105-122, 128-129 und 132 aufweist.
84. Das Verfahren nach einer der Ausführungsformen 73-83, wobei der erste Prime-Editor ferner einen Linker umfasst, der das erste napDNAbp und das erste Polypeptid mit der RNA- abhängigen DNA-Polymerase-Aktivität verbindet, und/oder der zweite Prime-Editor ferner einen Linker umfasst, der das zweite napDNAbp und das zweite Polypeptid mit der RNA- abhängigen DNA-Polymerase-Aktivität verbindet.
85. Das Verfahren nach Ausführungsform 84, wobei der Linker eine Aminosäuresequenz einer der SEQ-ID-NR: 166-177 umfasst, oder eine Aminosäuresequenz, die mindestens 80 %, 85 %, 90 %, 95 % oder 99 % Sequenzidentität mit einer der SEQ-ID-NR: 166-177 aufweist.
86. Das Verfahren nach Ausführungsform 84 oder 85, wobei der Linker 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 38, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49 oder 50 Aminosäuren in Länge beträgt.
87. Das Verfahren nach einer der Ausführungsformen 73-86, wobei das das erste und/oder zweite pegRNA eine Nukleotidsequenz einer der SEQ-ID-NR: 325-330, 499-505, 101-104, 181-183 und 223-244 umfasst, oder eine Nukleotidsequenz, die mindestens 80 %, 85 %, 90 %, 95 % oder 99 % Sequenzidentität mit einer der SEQ-ID-NR: 325-330, 499-505, 101-104, 181-183 und 223-244 aufweist.
88. Das Verfahren nach einer der Ausführungsformen 73-87, wobei das das erste und/oder zweite PEgRNA eine Nukleotidsequenz einer der SEQ-ID-NR: 325-330, 499-505, 101-104, 181-183 und 223-244 umfasst, oder eine Nukleotidsequenz, die mindestens 80 %, 85 %, 90 %, 95 % oder 99 % Sequenzidentität mit einer der SEQ-ID-NR: 325-330, 499-505, 101-104, 181-183 und 223-244 aufweist.
89. Das Verfahren nach einer der Ausführungsformen 73-88, wobei die erste Spacer- Sequenz des ersten Prime-Editor-Komplexes an eine erste Bindungsstelle auf einem ersten Strang der doppelsträngigen DNA-Sequenz stromaufwärts von der zu editierenden Zielstelle bindet.
90. Das Verfahren nach einer der Ausführungsformen 73-89, wobei die zweite Spacer- Sequenz des zweiten Prime-Editor-Komplexes an eine zweite Bindungsstelle auf einem zweiten Strang der doppelsträngigen DNA-Sequenz stromabwärts von der zu editierenden Zielstelle bindet.
91. Das Verfahren nach Ausführungsform 90, wobei die Bindung der ersten und zweiten Spacer-Sequenzen des ersten und zweiten Prime-Editor-Komplexes in Gegenwart einer PAM- Sequenz zum Nicking des ersten bzw. zweiten Stranges an einer Nickstelle proximal zur PAM- Sequenz auf jedem Strang durch die napDNAbps jedes ersten und zweiten Prime-Editor- Komplexes führt.
92. Das Verfahren nach Ausführungsform 91, wobei die erste und die zweite Bindungsstelle zwei Enden einer zusammenhängenden Region doppelsträngiger DNA definieren, die die zu editierende Zielstelle umfasst.
93. Das Verfahren nach Ausführungsform 92, wobei die zusammenhängende Region zwischen der ersten und der zweiten Bindungsstelle mindestens 10 Nukleobasenpaare, mindestens 11 Nukleobasenpaare, mindestens 12 Nukleobasenpaare, mindestens 13 Nukleobasenpaare, mindestens 14 Nukleobasenpaare, mindestens 15 Nukleobasenpaare, mindestens 16 Nukleobasenpaare, mindestens 17 Nukleobasenpaare, mindestens 18 Nukleobasenpaare, mindestens 19 Nukleobasenpaare, mindestens 20 Nukleobasenpaare, mindestens 21 Nukleobasenpaare, mindestens 22 Nukleobasenpaare, mindestens 23 Nukleobasenpaare, mindestens 24 Nukleobasenpaare, mindestens 25 Nukleobasenpaare, mindestens 26 Nukleobasenpaare, mindestens 27 Nukleobasenpaare, mindestens 28 Nukleobasenpaare, mindestens 29 Nukleobasenpaare, mindestens 30 Nukleobasenpaare, mindestens 31 Nukleobasenpaare, mindestens 32 Nukleobasenpaare, mindestens 33 Nukleobasenpaare, mindestens 34 Nukleobasenpaare, mindestens 35 Nukleobasenpaare, mindestens 36 Nukleobasenpaare, mindestens 37 Nukleobasenpaare, mindestens 37 Nukleobasenpaare, mindestens 38 Nukleobasenpaare, mindestens 39 Nukleobasenpaare oder mindestens 40 Nukleobasenpaare, mindestens 41 Nukleotide, mindestens 42 Nukleotide, mindestens 43 Nukleotide, mindestens 44 Nukleotide, mindestens 45 Nukleotide, mindestens 46 Nukleotide, mindestens 47 Nukleotide, mindestens 48 Nukleotide, mindestens 49 Nukleotide, mindestens 50 Nukleotide, mindestens 51 Nukleotide, mindestens 52 Nukleotide, mindestens 53 Nukleotide, mindestens 54 Nukleotide, mindestens 55 Nukleotide, mindestens 56 Nukleotide, mindestens 57 Nukleotide, mindestens 58 Nukleotide, mindestens 59 Nukleotide, mindestens 60 Nukleotide, mindestens 61 Nukleotide, mindestens 62 Nukleotide, mindestens 63 Nukleotide, mindestens 64 Nukleotide, mindestens 65 Nukleotide, mindestens 66 Nukleotide, mindestens 67 Nukleotide, mindestens 68 Nukleotide, mindestens 69 Nukleotide, mindestens 70 Nukleotide, mindestens 71 Nukleotide, mindestens 72 Nukleotide, mindestens 73 Nukleotide, mindestens 74 Nukleotide, mindestens 75 Nukleotide, mindestens 76 Nukleotide, mindestens 77 Nukleotide, mindestens 78 Nukleotide, mindestens 79 Nukleotide, mindestens 80 Nukleotide, mindestens 81 Nukleotide, mindestens 82 Nukleotide mindestens 83 Nukleotide, mindestens 84 Nukleotide, mindestens 85 Nukleotide, mindestens 86 Nukleotide, mindestens 87 Nukleotide, mindestens 88 Nukleotide, mindestens 89 Nukleotide, mindestens 90 Nukleotide, mindestens 91 Nukleotide, mindestens 92 Nukleotide, mindestens 93 Nukleotide, mindestens 94 Nukleotide, mindestens 95 Nukleotide, mindestens 96 Nukleotide, mindestens 97 Nukleotide, mindestens 98 Nukleotide, mindestens 99 Nukleotide, mindestens 100 Nukleotide, mindestens 101 Nukleotide, mindestens 102 Nukleotide, mindestens 103 Nukleotide, mindestens 104 Nukleotide, mindestens 105 Nukleotide, mindestens 106 Nukleotide, mindestens 107 Nukleotide, mindestens 108 Nukleotide, mindestens 109 Nukleotide oder mindestens 110 Nukleotide in Länge beträgt.
94. Das Verfahren nach Ausführungsform 92 oder 93, wobei die zusammenhängende Region durch das Duplex ersetzt wird, das den editierten Abschnitt umfasst.
95. Das Verfahren nach einer der Ausführungsformen 73-94, wobei das erste und/oder zweite DNA-Synthese-Templat mindestens 1 Nukleotid, mindestens 2 Nukleotide, mindestens 3 Nukleotide, mindestens 4 Nukleotide, mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide, mindestens 15 Nukleotide, mindestens 16 Nukleotide, mindestens 17 Nukleotide, mindestens 18 Nukleotide, mindestens 19 Nukleotide, mindestens 20 Nukleotide, mindestens 21 Nukleotide, mindestens 22 Nukleotide, mindestens 23 Nukleotide, mindestens 24 Nukleotide, mindestens 25 Nukleotide, mindestens 26 Nukleotide mindestens 27 Nukleotide, mindestens 28 Nukleotide, mindestens 29 Nukleotide, mindestens 30 Nukleotide, mindestens 31 Nukleotide, mindestens 32 Nukleotide, mindestens 33 Nukleotide, mindestens 34 Nukleotide, mindestens 35 Nukleotide, mindestens 36 Nukleotide, mindestens 37 Nukleotide, mindestens 38 Nukleotide, mindestens 39 Nukleotide, mindestens 40 Nukleotide mindestens 41 Nukleotide, mindestens 42 Nukleotide, mindestens 43 Nukleotide, mindestens 44 Nukleotide, mindestens 45 Nukleotide, mindestens 46 Nukleotide, mindestens 47 Nukleotide, mindestens 48 Nukleotide, mindestens 49 Nukleotide, mindestens 50 Nukleotide, mindestens 51 Nukleotide, mindestens 52 Nukleotide, mindestens 53 Nukleotide, mindestens 54 Nukleotide mindestens 55 Nukleotide, mindestens 56 Nukleotide, mindestens 57 Nukleotide, mindestens 58 Nukleotide, mindestens 59 Nukleotide, mindestens 60 Nukleotide, mindestens 61 Nukleotide, mindestens 62 Nukleotide, mindestens 63 Nukleotide, mindestens 64 Nukleotide, mindestens 65 Nukleotide, mindestens 66 Nukleotide, mindestens 67 Nukleotide, mindestens 68 Nukleotide, mindestens 69 Nukleotide, mindestens 70 Nukleotide, mindestens 71 Nukleotide, mindestens 72 Nukleotide, mindestens 73 Nukleotide, mindestens 74 Nukleotide, mindestens 75 Nukleotide, mindestens 76 Nukleotide, mindestens 77 Nukleotide, mindestens 78 Nukleotide, mindestens 79 Nukleotide, mindestens 80 Nukleotide, mindestens 81 Nukleotide, mindestens 82 Nukleotide mindestens 83 Nukleotide, mindestens 84 Nukleotide, mindestens 85 Nukleotide, mindestens 86 Nukleotide, mindestens 87 Nukleotide, mindestens 88 Nukleotide, mindestens 89 Nukleotide, mindestens 90 Nukleotide, mindestens 91 Nukleotide, mindestens 92 Nukleotide, mindestens 93 Nukleotide, mindestens 94 Nukleotide, mindestens 95 Nukleotide, mindestens 96 Nukleotide, mindestens 97 Nukleotide, mindestens 98 Nukleotide, mindestens 99 Nukleotide, mindestens 100 Nukleotide, mindestens 101 Nukleotide, mindestens 102 Nukleotide, mindestens 103 Nukleotide, mindestens 104 Nukleotide, mindestens 105 Nukleotide, mindestens 106 Nukleotide, mindestens 107 Nukleotide, mindestens 108 Nukleotide, mindestens 109 Nukleotide oder mindestens 110 Nukleotide in Länge beträgt.
96. Das Verfahren nach einer der Ausführungsformen 73-95, wobei die erste einzelsträngige DNA-Sequenz und die zweite einzelsträngige DNA-Sequenz die gleichen Längen aufweisen.
97. Das Verfahren nach einer der Ausführungsformen 73-95, wobei die erste einzelsträngige DNA-Sequenz und die zweite einzelsträngige DNA-Sequenz unterschiedliche Längen aufweisen.
98. Das Verfahren nach einer der Ausführungsformen 73-97, wobei die Region der Komplementarität mindestens 99 %, mindestens 95 %, mindestens 90 %, mindestens 85 %, mindestens 80 %, mindestens 75 %, mindestens 70 %, mindestens 65 %, mindestens 60 %, mindestens 55 %, mindestens 50 %, mindestens 45 %, mindestens 40 %, mindestens 35 %, mindestens 30 %, mindestens 25 %, mindestens 20 %, mindestens 15 % oder mindestens 10 % der Gesamtlänge der ersten einzelsträngigen DNA-Sequenz oder der zweiten einzelsträngigen DNA-Sequenz beträgt.
99. Das Verfahren nach einer der Ausführungsformen 73-98, wobei die Region der Komplementarität mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide, mindestens 15 Nukleotide, mindestens 16 Nukleotide, mindestens 17 Nukleotide, mindestens 18 Nukleotide, mindestens 19 Nukleotide, mindestens 20 Nukleotide, mindestens 21 Nukleotide, mindestens 22 Nukleotide, mindestens 23 Nukleotide, mindestens 24 Nukleotide, mindestens 25 Nukleotide, mindestens 26 Nukleotide, mindestens 27 Nukleotide, mindestens 28 Nukleotide, mindestens 29 Nukleotide, mindestens 30 Nukleotide mindestens 31 Nukleotide, mindestens 32 Nukleotide, mindestens 33 Nukleotide, mindestens 34 Nukleotide, mindestens 35 Nukleotide, mindestens 36 Nukleotide, mindestens 37 Nukleotide, mindestens 38 Nukleotide, mindestens 39 Nukleotide, mindestens 40 Nukleotide, mindestens 41 Nukleotide, mindestens 42 Nukleotide, mindestens 43 Nukleotide, mindestens 44 Nukleotide mindestens 45 Nukleotide, mindestens 46 Nukleotide, mindestens 47 Nukleotide, mindestens 48 Nukleotide, mindestens 49 Nukleotide, mindestens 50 Nukleotide, mindestens 51 Nukleotide, mindestens 52 Nukleotide, mindestens 53 Nukleotide, mindestens 54 Nukleotide, mindestens 55 Nukleotide, mindestens 56 Nukleotide, mindestens 57 Nukleotide, mindestens 58 Nukleotide, mindestens 59 Nukleotide, mindestens 60 Nukleotide, mindestens 61 Nukleotide, mindestens 62 Nukleotide, mindestens 63 Nukleotide, mindestens 64 Nukleotide, mindestens 65 Nukleotide, mindestens 66 Nukleotide, mindestens 67 Nukleotide, mindestens 68 Nukleotide, mindestens 69 Nukleotide, mindestens 70 Nukleotide, mindestens 71 Nukleotide, mindestens 72 Nukleotide, mindestens 73 Nukleotide, mindestens 74 Nukleotide, mindestens 75 Nukleotide, mindestens 76 Nukleotide, mindestens 77 Nukleotide, mindestens 78 Nukleotide, mindestens 79 Nukleotide, mindestens 80 Nukleotide, mindestens 81 Nukleotide, mindestens 82 Nukleotide, mindestens 83 Nukleotide, mindestens 84 Nukleotide, mindestens 85 Nukleotide, mindestens 86 Nukleotide, mindestens 87 Nukleotide, mindestens 88 Nukleotide, mindestens 89 Nukleotide, mindestens 90 Nukleotide, mindestens 91 Nukleotide, mindestens 92 Nukleotide, mindestens 93 Nukleotide, mindestens 94 Nukleotide, mindestens 95 Nukleotide, mindestens 96 Nukleotide, mindestens 97 Nukleotide, mindestens 98 Nukleotide, mindestens 99 Nukleotide, mindestens 100 Nukleotide, mindestens 101 Nukleotide, mindestens 102 Nukleotide, mindestens 103 Nukleotide, mindestens 104 Nukleotide, mindestens 105 Nukleotide, mindestens 106 Nukleotide, mindestens 107 Nukleotide, mindestens 108 Nukleotide, mindestens 109 Nukleotide oder mindestens 110 Nukleotide in Länge beträgt und entweder kleiner oder gleich der Länge der gewünschten DNA-Sequenz und deren Komplement ist.
100. Das Verfahren nach einer der Ausführungsformen 73-99, wobei die Region der Komplementarität der ersten einzelsträngigen DNA-Sequenz und der zweiten einzelsträngigen DNA-Sequenz den Duplex bilden.
101. Das Verfahren nach einer der Ausführungsformen 73-100, wobei die erste einzelsträngige DNA-Sequenz und die zweite einzelsträngige DNA-Sequenz jeweils einzelsträngige DNA-Stränge sind, die 3'-Enden aufweisen.
102. Das Verfahren nach Ausführungsform 94, wobei der Austausch der zusammenhängenden Region durch den Duplex, der den editierten Abschnitt umfasst, zu einer Insertion, Deletion oder einem Austausch der DNA an der Zielstelle führt.
103. Das Verfahren nach einer der Ausführungsformen 73-102, wobei der Duplex ein Editing umfasst, das eine oder mehrere Rekombinasestellen umfasst.
104. Das Verfahren nach Ausführungsform 103, ferner umfassend das Bereitstellen einer Rekombinase zur Förderung des rekombinasevermittelten Editings der DNA-Sequenz an der zu editierenden Zielstelle.
105. Ein Paar von pegRNAs zur Verwendung beim Dual-Prime-Editing, wobei das Paar Folgendes umfasst:
1. a. eine erste Prime-Editing-Leit-RNA (erste PEgRNA), die an eine erste Bindungsstelle auf einem ersten Strang einer doppelsträngigen DNA-Sequenz stromaufwärts einer zu editierenden Zielstelle bindet, wobei die erste PEgRNA eine erste Spacer-Sequenz, einen ersten gRNA-Kern, ein erstes DNA-Synthese-Templat und eine erste Primer-Bindungsstelle umfasst, wobei das erste DNA-Synthese-Templat eine erste einzelsträngige DNA-Sequenz kodiert, die einen editierten Abschnitt umfasst;
2. b. eine zweite Prime-Editing-Leit-RNA (zweite PEgRNA), die an eine zweite Bindungsstelle auf einem zweiten Strang der doppelsträngigen DNA-Sequenz stromabwärts von der zu editierenden Zielstelle bindet, wobei die zweite PEgRNA eine zweite Spacer- Sequenz, einen zweiten gRNA-Kern, ein zweites DNA-Synthese-Templat und eine zweite Primer-Bindungsstelle umfasst, wobei das zweite DNA-Synthese-Templat eine zweite einzelsträngige DNA-Sequenz kodiert, die den editierten Abschnitt umfasst, wobei die zweite einzelsträngige DNA-Sequenz eine Region der Komplementarität zur ersten einzelsträngigen DNA-Sequenz umfasst.
106. Das pegRNA-Paar nach Ausführungsform 105, wobei die erste PEgRNA die folgende Struktur umfasst:
- 5'-[erste gRNA-Spacer-Sequenz]-[erster gRNA-Kern]-[erstes DNA-Synthese-Templat]-[erste Primer-Bindungsstelle]-3'; und
wobei die zweite PEgRNA die folgende Struktur umfasst:
- 5'-[zweite gRNA-Spacer-Sequenz]-[zweiter gRNA-Kern]-[zweites DNA-Synthese-Templat]- [zweite Primer-Bindungsstelle]-3'.
107. Das pegRNA-Paar nach Ausführungsform 105 oder 106, wobei die erste einzelsträngige DNA-Sequenz und die zweite einzelsträngige DNA-Sequenz einen Duplex bilden, der an der zu editierenden Zielstelle in die doppelsträngige DNA-Sequenz integriert wird.
108. Das pegRNA-Paar nach Ausführungsform 107, wobei die Integration des Duplex zu einer Insertion, Deletion oder einem Austausch von DNA an der Zielstelle führt.
109. Das Paar von pegRNAs nach Ausführungsform 108, wobei die Insertion mindestens 1 Nukleotid, mindestens 2 Nukleotide, mindestens 3 Nukleotide, mindestens 4 Nukleotide, mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide ist, mindestens 13 Nukleotide, mindestens 14 Nukleotide, mindestens 15 Nukleotide, mindestens 16 Nukleotide, mindestens 17 Nukleotide, mindestens 18 Nukleotide, mindestens 19 Nukleotide, mindestens 20 Nukleotide, mindestens 21 Nukleotide, mindestens 22 Nukleotide, mindestens 23 Nukleotide, mindestens 24 Nukleotide, mindestens 25 Nukleotide, mindestens 26 Nukleotide mindestens 27 Nukleotide, mindestens 28 Nukleotide, mindestens 29 Nukleotide, mindestens 30 Nukleotide, mindestens 31 Nukleotide, mindestens 32 Nukleotide, mindestens 33 Nukleotide, mindestens 34 Nukleotide, mindestens 35 Nukleotide, mindestens 36 Nukleotide, mindestens 37 Nukleotide, mindestens 38 Nukleotide, mindestens 39 Nukleotide, mindestens 40 Nukleotide mindestens 41 Nukleotide, mindestens 42 Nukleotide, mindestens 43 Nukleotide, mindestens 44 Nukleotide, mindestens 45 Nukleotide, mindestens 46 Nukleotide, mindestens 47 Nukleotide, mindestens 48 Nukleotide, mindestens 49 Nukleotide, mindestens 50 Nukleotide, mindestens 51 Nukleotide, mindestens 52 Nukleotide, mindestens 53 Nukleotide, mindestens 54 Nukleotide mindestens 55 Nukleotide, mindestens 56 Nukleotide, mindestens 57 Nukleotide, mindestens 58 Nukleotide, mindestens 59 Nukleotide, mindestens 60 Nukleotide, mindestens 61 Nukleotide, mindestens 62 Nukleotide, mindestens 63 Nukleotide, mindestens 64 Nukleotide, mindestens 65 Nukleotide, mindestens 66 Nukleotide, mindestens 67 Nukleotide, mindestens 68 Nukleotide, mindestens 69 Nukleotide, mindestens 70 Nukleotide, mindestens 71 Nukleotide, mindestens 72 Nukleotide, mindestens 73 Nukleotide, mindestens 74 Nukleotide, mindestens 75 Nukleotide, mindestens 76 Nukleotide, mindestens 77 Nukleotide, mindestens 78 Nukleotide, mindestens 79 Nukleotide, mindestens 80 Nukleotide, mindestens 81 Nukleotide, mindestens 82 Nukleotide mindestens 83 Nukleotide, mindestens 84 Nukleotide, mindestens 85 Nukleotide, mindestens 86 Nukleotide, mindestens 87 Nukleotide, mindestens 88 Nukleotide, mindestens 89 Nukleotide, mindestens 90 Nukleotide, mindestens 91 Nukleotide, mindestens 92 Nukleotide, mindestens 93 Nukleotide, mindestens 94 Nukleotide, mindestens 95 Nukleotide, mindestens 96 Nukleotide, mindestens 97 Nukleotide, mindestens 98 Nukleotide, mindestens 99 Nukleotide, mindestens 100 Nukleotide, mindestens 101 Nukleotide, mindestens 102 Nukleotide, mindestens 103 Nukleotide, mindestens 104 Nukleotide, mindestens 105 Nukleotide, mindestens 106 Nukleotide, mindestens 107 Nukleotide, mindestens 108 Nukleotide, mindestens 109 Nukleotide oder mindestens 110 Nukleotide in Länge beträgt.
110. Das Paar von pegRNAs nach Ausführungsform 109, wobei die Deletion mindestens 1 Nukleotid, mindestens 2 Nukleotide, mindestens 3 Nukleotide, mindestens 4 Nukleotide, mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide ist, mindestens 13 Nukleotide, mindestens 14 Nukleotide, mindestens 15 Nukleotide, mindestens 16 Nukleotide, mindestens 17 Nukleotide, mindestens 18 Nukleotide, mindestens 19 Nukleotide, mindestens 20 Nukleotide, mindestens 21 Nukleotide, mindestens 22 Nukleotide, mindestens 23 Nukleotide, mindestens 24 Nukleotide, mindestens 25 Nukleotide, mindestens 26 Nukleotide mindestens 27 Nukleotide, mindestens 28 Nukleotide, mindestens 29 Nukleotide, mindestens 30 Nukleotide, mindestens 31 Nukleotide, mindestens 32 Nukleotide, mindestens 33 Nukleotide, mindestens 34 Nukleotide, mindestens 35 Nukleotide, mindestens 36 Nukleotide, mindestens 37 Nukleotide, mindestens 38 Nukleotide, mindestens 39 Nukleotide, mindestens 40 Nukleotide mindestens 41 Nukleotide, mindestens 42 Nukleotide, mindestens 43 Nukleotide, mindestens 44 Nukleotide, mindestens 45 Nukleotide, mindestens 46 Nukleotide, mindestens 47 Nukleotide, mindestens 48 Nukleotide, mindestens 49 Nukleotide, mindestens 50 Nukleotide, mindestens 51 Nukleotide, mindestens 52 Nukleotide, mindestens 53 Nukleotide, mindestens 54 Nukleotide mindestens 55 Nukleotide, mindestens 56 Nukleotide, mindestens 57 Nukleotide, mindestens 58 Nukleotide, mindestens 59 Nukleotide, mindestens 60 Nukleotide, mindestens 61 Nukleotide, mindestens 62 Nukleotide, mindestens 63 Nukleotide, mindestens 64 Nukleotide, mindestens 65 Nukleotide, mindestens 66 Nukleotide, mindestens 67 Nukleotide, mindestens 68 Nukleotide, mindestens 69 Nukleotide, mindestens 70 Nukleotide, mindestens 71 Nukleotide, mindestens 72 Nukleotide, mindestens 73 Nukleotide, mindestens 74 Nukleotide, mindestens 75 Nukleotide, mindestens 76 Nukleotide, mindestens 77 Nukleotide, mindestens 78 Nukleotide, mindestens 79 Nukleotide, mindestens 80 Nukleotide, mindestens 81 Nukleotide, mindestens 82 Nukleotide mindestens 83 Nukleotide, mindestens 84 Nukleotide, mindestens 85 Nukleotide, mindestens 86 Nukleotide, mindestens 87 Nukleotide, mindestens 88 Nukleotide, mindestens 89 Nukleotide, mindestens 90 Nukleotide, mindestens 91 Nukleotide, mindestens 92 Nukleotide, mindestens 93 Nukleotide, mindestens 94 Nukleotide, mindestens 95 Nukleotide, mindestens 96 Nukleotide, mindestens 97 Nukleotide, mindestens 98 Nukleotide, mindestens 99 Nukleotide, mindestens 100 Nukleotide, mindestens 101 Nukleotide, mindestens 102 Nukleotide, mindestens 103 Nukleotide, mindestens 104 Nukleotide, mindestens 105 Nukleotide, mindestens 106 Nukleotide, mindestens 107 Nukleotide, mindestens 108 Nukleotide, mindestens 109 Nukleotide oder mindestens 110 Nukleotide oder mehr in Länge beträgt.
111. Das Paar von pegRNAs nach Ausführungsform 110, wobei der Austausch mindestens 1 Nukleotid, mindestens 2 Nukleotide, mindestens 3 Nukleotide, mindestens 4 Nukleotide, mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide ist, mindestens 13 Nukleotide, mindestens 14 Nukleotide, mindestens 15 Nukleotide, mindestens 16 Nukleotide, mindestens 17 Nukleotide, mindestens 18 Nukleotide, mindestens 19 Nukleotide, mindestens 20 Nukleotide, mindestens 21 Nukleotide, mindestens 22 Nukleotide, mindestens 23 Nukleotide, mindestens 24 Nukleotide, mindestens 25 Nukleotide, mindestens 26 Nukleotide mindestens 27 Nukleotide, mindestens 28 Nukleotide, mindestens 29 Nukleotide, mindestens 30 Nukleotide, mindestens 31 Nukleotide, mindestens 32 Nukleotide, mindestens 33 Nukleotide, mindestens 34 Nukleotide, mindestens 35 Nukleotide, mindestens 36 Nukleotide, mindestens 37 Nukleotide, mindestens 38 Nukleotide, mindestens 39 Nukleotide, mindestens 40 Nukleotide mindestens 41 Nukleotide, mindestens 42 Nukleotide, mindestens 43 Nukleotide, mindestens 44 Nukleotide, mindestens 45 Nukleotide, mindestens 46 Nukleotide, mindestens 47 Nukleotide, mindestens 48 Nukleotide, mindestens 49 Nukleotide, mindestens 50 Nukleotide, mindestens 51 Nukleotide, mindestens 52 Nukleotide, mindestens 53 Nukleotide, mindestens 54 Nukleotide mindestens 55 Nukleotide, mindestens 56 Nukleotide, mindestens 57 Nukleotide, mindestens 58 Nukleotide, mindestens 59 Nukleotide, mindestens 60 Nukleotide, mindestens 61 Nukleotide, mindestens 62 Nukleotide, mindestens 63 Nukleotide, mindestens 64 Nukleotide, mindestens 65 Nukleotide, mindestens 66 Nukleotide, mindestens 67 Nukleotide, mindestens 68 Nukleotide, mindestens 69 Nukleotide, mindestens 70 Nukleotide, mindestens 71 Nukleotide, mindestens 72 Nukleotide, mindestens 73 Nukleotide, mindestens 74 Nukleotide, mindestens 75 Nukleotide, mindestens 76 Nukleotide, mindestens 77 Nukleotide, mindestens 78 Nukleotide, mindestens 79 Nukleotide, mindestens 80 Nukleotide, mindestens 81 Nukleotide, mindestens 82 Nukleotide mindestens 83 Nukleotide, mindestens 84 Nukleotide, mindestens 85 Nukleotide, mindestens 86 Nukleotide, mindestens 87 Nukleotide, mindestens 88 Nukleotide, mindestens 89 Nukleotide, mindestens 90 Nukleotide, mindestens 91 Nukleotide, mindestens 92 Nukleotide, mindestens 93 Nukleotide, mindestens 94 Nukleotide, mindestens 95 Nukleotide, mindestens 96 Nukleotide, mindestens 97 Nukleotide, mindestens 98 Nukleotide, mindestens 99 Nukleotide, mindestens 100 Nukleotide, mindestens 101 Nukleotide, mindestens 102 Nukleotide, mindestens 103 Nukleotide, mindestens 104 Nukleotide, mindestens 105 Nukleotide, mindestens 106 Nukleotide, mindestens 107 Nukleotide, mindestens 108 Nukleotide, mindestens 109 Nukleotide oder mindestens 110 Nukleotide oder mehr in Länge beträgt.
112. Ein Polynukleotid, das ein Paar von pegRNAs nach einer der Ausführungsformen 105- 111 kodiert.
113. Ein Vektor, der das Polynukleotid nach Ausführungsform 112 zur Exprimierung des Paares von pegRNAs in einer Zelle umfasst.
114. Eine Zelle, umfassend den Vektor nach Ausführungsform 113.
115. Eine pharmazeutische Zusammensetzung, umfassend ein Paar von pegRNAs nach einer der Ausführungsformen 105-111, einen Vektor nach Ausführungsform 113 oder eine Zelle nach Ausführungsform 114 und einen pharmazeutischen Hilfsstoff.
116. Ein Paar von Prime-Editor Komplexen, wobei das Paar Folgendes umfasst:
1. a. einen ersten Prime-Editor-Komplex, umfassend:
  1. i. einen ersten Prime-Editor, umfassend ein erstes Nukleinsäure-programmierbares DNA- Bindungsprotein (napDNAbp) und ein erstes Polypeptid, das eine RNA-abhängige DNA- Polymerase-Aktivität umfasst; und
  2. ii. eine erste Prime-Editing-Leit-RNA (erste PEgRNA), die an eine erste Zielsequenz auf dem Strang der genomischen DNA-Sequenz stromaufwärts der Zielstelle bindet;
2. b. einen zweiten Prime-Editor-Komplex, umfassend:
  1. i. einen zweiten Prime-Editor, umfassend ein zweites Nukleinsäure-programmierbares DNA- Bindeprotein (zweites napDNAbp) und ein zweites Polypeptid, das eine RNA-abhängige DNA-Polymerase-Aktivität umfasst; und
  2. ii. eine zweite Prime-Editing-Leit-RNA (zweite PEgRNA), die an eine zweite Zielsequenz auf dem zweiten Strang der genomischen DNA-Sequenz stromabwärts der Zielstelle bindet.
117. Das Paar von Prime-Editor-Komplexen nach Ausführungsform 116, wobei der Prime- Editor des ersten Prime-Editor-Komplexes, des zweiten Prime-Editor-Komplexes oder sowohl des ersten Prime-Editor-Komplexes als auch des zweiten Prime-Editor-Komplexes ein Fusionsprotein ist, das das napDNAbp und das Polypeptid umfasst, das eine RNA-abhängige DNA-Polymerase-Aktivität aufweist.
118. Ein Polynukleotid, das ein Paar von Prime-Editor Komplexen nach Ausführungsform 116 oder 117 kodiert.
119. Ein Vektor, der das Polynukleotid nach Ausführungsform 118 zur Exprimierung des Paares von Prime-Editor-Komplexen in einer Zelle umfasst.
120. Eine Zelle, umfassend den Vektor nach Ausführungsform 119.
121. Eine pharmazeutische Zusammensetzung, umfassend ein Paar von Prime-Editor- Komplexen nach Ausführungsform 116 oder 117, einen Vektor nach Ausführungsform 119 oder eine Zelle nach Ausführungsform 120, und einen pharmazeutischen Hilfsstoff.
122. Das System nach einer der Ausführungsformen 1-62 oder das Verfahren nach einer der Ausführungsformen 68-98, wobei die Integration des Duplexes, der den editierten Abschnitt umfasst, zu einer Insertion, Deletion oder einem Austausch von DNA an der Zielstelle führt.
123. Das System oder Verfahren nach Ausführungsform 122, wobei die Insertion ein Peptid- Tag ist.
124. Das System oder Verfahren nach Ausführungsform 123, wobei das Peptid-Tag ein Polyhistidin (z. B. HHHHHH) (SEQ-ID-NR: 252-262), FLAG (z. B. DYKDDDDK) (SEQ- ID-NR: 2), V5 (z. B. GKPIPNPLLGLDST) (SEQ-ID-NR: 3), GCN4, HA (z. B. YPYDVPDYA) (SEQ-ID-NR: 5), Myc (z. B. EQKLISEED) (SEQ-ID-NR: 6) oder GST ist.
125. Das System oder Verfahren nach Ausführungsform 123, wobei das Peptid-Tag eine Aminosäuresequenz aufweist, ausgewählt aus der Gruppe bestehend aus SEQ-ID-NR: 1-6, 245-249, 252-262, 264-273, 275-276, 281, 278-288 und 622.
126. Das System oder Verfahren nach Ausführungsform 122, wobei die Insertion ein Immunoepitop-Tag ist.
127. Das System oder Verfahren nach Ausführungsform 126, wobei das Immunoepitop-Tag ausgewählt ist aus der Gruppe bestehend aus: Tetanustoxoid (SEQ-ID-NR: 396); Diphtherietoxin-Mutante CRM197 (SEQ-ID-NR: 630); Mumps-Immunoepitop 1 (SEQ-ID- NR: 400); Mumps-Immunoepitop 2 (SEQ-ID-NR: 402); Mumps-Immunoepitop 3 (SEQ-ID- NR: 404); Rötelnvirus (SEQ-ID-NR: 406); Hämagglutinin (SEQ-ID-NR: 408); Neuraminidase (SEQ-ID-NR: 410); TAP1 (SEQ-ID-NR: 412); TAP2 (SEQ-ID-NR: 414); Hämagglutinin- Epitope gegenüber Klasse I HLA (SEQ-ID-NR: 416); Neuraminidase-Epitope gegen Klasse I HLA (SEQ-ID-NR: 418); Hämagglutinin-Epitope gegen Klasse II HLA (SEQ-ID-NR: 420); Neuraminidase-Epitope gegen Klasse II HLA (SEQ-ID-NR: 422); Hämagglutinin-Epitop H5N1-gebundene Klasse I und Klasse II HLA (SEQ-ID-NR: 424); und Neuraminidase-Epitop H5N1-gebundene Klasse I und Klasse II HLA (SEQ-ID-NR: 426).
128. Das System oder Verfahren nach Ausführungsform 122, wobei die Insertion eine Dimerisierungsdomäne ist.
129. Das System oder Verfahren nach Ausführungsform 128, wobei die Dimerisierungsdomäne eine Bindungsdomäne für kleine Moleküle von FKBP12 der SEQ-ID- NR: 488, FKBP12-F36V von SEQ-ID-NR: 489, oder Cyclophilin der SEQ-ID-NR: 490 oder 493-494 ist.
130. Ein System für gleichzeitiges Editieren beider Stränge einer doppelsträngigen DNA- Sequenz an einer zu editierenden Zielstelle, wobei das System Folgendes umfasst:
1. a) einen ersten Prime-Editor-Komplex, umfassend:
  - i.einen ersten Prime-Editor, umfassend ein erstes Nukleinsäure-programmierbares DNA- Bindungsprotein (erstes napDNAbp) und ein erstes Polypeptid, das eine RNA-abhängige DNA-Polymerase-Aktivität umfasst; und
  - ii.eine erste Prime-Editing-Leit-RNA (erste PEgRNA), die an eine erste Bindungsstelle auf einem ersten Strang der doppelsträngigen DNA-Sequenz stromaufwärts von der zu editierenden Zielstelle bindet;
2. b) einen zweiten Prime-Editor-Komplex, umfassend:
  - iii.einen zweiten Prime-Editor, umfassend ein zweites Nukleinsäure-programmierbares DNA- Bindeprotein (zweites napDNAbp) und ein zweites Polypeptid, das eine RNA-abhängige DNA-Polymerase-Aktivität umfasst; und
  - iv.eine zweite Prime-Editing-Leit-RNA (zweite PEgRNA), die an eine zweite Bindungsstelle auf einem zweiten Strang der doppelsträngigen DNA-Sequenz stromaufwärts von der zu editierenden Zielstelle bindet;
3. c) einen dritten Prime-Editor-Komplex, umfassend:
  - iii.einen dritten Prime-Editor, umfassend ein drittes Nukleinsäure-programmierbares DNA- Bindeprotein (drittes napDNAbp) und ein drittes Polypeptid, das eine RNA-abhängige DNA-Polymerase-Aktivität umfasst; und
  - iv.eine dritte Prime-Editing-Leit-RNA (dritte PEgRNA), die an eine dritte Bindungsstelle auf einem ersten Strang der doppelsträngigen DNA-Sequenz stromabwärts von der zu editierenden Zielstelle bindet;
4. d) einen vierten Prime-Editor-Komplex, umfassend:
  - iii. einen vierten Prime-Editor, umfassend ein viertes Nukleinsäure-programmierbares DNA- Bindeprotein (viertes napDNAbp) und ein viertes Polypeptid, das eine RNA-abhängige DNA-Polymerase-Aktivität umfasst; und
  - iv. eine vierte Prime-Editing-Leit-RNA (vierte PEgRNA), die an eine vierte Bindungsstelle auf einem zweiten Strang der doppelsträngigen DNA-Sequenz stromabwärts von der zu editierenden Zielstelle bindet;
    - wobei die erste PEgRNA ein erstes DNA-Synthese-Templat umfasst, die eine erste einzelsträngige DNA-Sequenz kodiert, die zweite PEgRNA ein zweites DNA-Synthese- Templat umfasst, die eine zweite einzelsträngige DNA-Sequenz kodiert, die dritte PEgRNA ein drittes DNA-Synthese-Templat umfasst, die eine dritte einzelsträngige DNA-Sequenz kodiert, und die vierte PEgRNA ein viertes DNA-Synthese-Templat umfasst, die eine vierte einzelsträngige DNA-Sequenz kodiert;
    - wobei die erste und die dritte einzelsträngige DNA-Sequenz jeweils eine Region der Komplementarität zur anderen umfassen; und wobei die zweite und die vierte einzelsträngige DNA-Sequenz jeweils eine Region der Komplementarität zur anderen umfassen.
131. Ein System für das Editieren einer oder mehrerer doppelsträngiger DNA-Sequenzen, wobei das System Folgendes umfasst:
- e) einen ersten Prime-Editor-Komplex, umfassend:
  - iii. einen ersten Prime-Editor, umfassend ein erstes Nukleinsäure-programmierbares DNA- Bindungsprotein (erstes napDNAbp) und ein erstes Polypeptid, das eine RNA-abhängige DNA-Polymerase-Aktivität umfasst; und
  - iv. eine erste Prime-Editing-Leit-RNA (erste PEgRNA), die an eine erste Bindungsstelle auf einem ersten Strang einer ersten doppelsträngigen DNA-Sequenz an einer ersten zu editierenden Zielstelle bindet;
- f) einen zweiten Prime-Editor-Komplex, umfassend:
  - v. einen zweiten Prime-Editor, umfassend ein zweites Nukleinsäure-programmierbares DNA- Bindeprotein (zweites napDNAbp) und ein zweites Polypeptid, das eine RNA-abhängige DNA-Polymerase-Aktivität umfasst; und
  - vi. eine zweite Prime-Editing-Leit-RNA (zweite PEgRNA), die an eine zweite Bindungsstelle auf einem zweiten Strang der ersten doppelsträngigen DNA-Sequenz an der ersten zu editierenden Zielstelle bindet;
- g) einen dritten Prime-Editor-Komplex, umfassend:
  - v. einen dritten Prime-Editor, umfassend ein drittes Nukleinsäure-programmierbares DNA- Bindeprotein (drittes napDNAbp) und ein drittes Polypeptid, das eine RNA-abhängige DNA-Polymerase-Aktivität umfasst; und
  - vi. eine dritte Prime-Editing-Leit-RNA (dritte PEgRNA), die an eine erste Bindungsstelle auf einem ersten Strang einer zweiten doppelsträngigen DNA-Sequenz an einer zweiten zu editierenden Zielstelle bindet;
- h) einen vierten Prime-Editor-Komplex, umfassend:
  - v. einen vierten Prime-Editor, umfassend ein viertes Nukleinsäure-programmierbares DNA- Bindeprotein (viertes napDNAbp) und ein viertes Polypeptid, das eine RNA-abhängige DNA-Polymerase-Aktivität umfasst; und
  - vi. eine vierte Prime-Editing Leit-RNA (vierte PEgRNA), die sich an eine zweite Bindungsstelle auf einem zweiten Strang der zweiten doppelsträngigen DNA-Sequenz an der zweiten zu editierenden Zielstelle bindet;
    - wobei die erste PEgRNA ein erstes DNA-Synthese-Templat umfasst, die eine erste einzelsträngige DNA-Sequenz kodiert, die zweite PEgRNA ein zweites DNA-Synthese- Templat umfasst, die eine zweite einzelsträngige DNA-Sequenz kodiert, die dritte PEgRNA ein drittes DNA-Synthese-Templat umfasst, die eine dritte einzelsträngige DNA-Sequenz kodiert, und die vierte PEgRNA ein viertes DNA-Synthese-Templat umfasst, die eine vierte einzelsträngige DNA-Sequenz kodiert;
    - wobei die erste und die dritte einzelsträngige DNA-Sequenz jeweils eine Region der Komplementarität zur anderen umfassen; und wobei die zweite und die vierte einzelsträngige DNA-Sequenz jeweils eine Region der Komplementarität zur anderen umfassen.
132. Das System nach Ausführungsform 130 oder 131, wobei der Prime-Editor des ersten Prime-Editor-Komplexes, des zweiten Prime-Editor-Komplexes, des dritten Prime-Editor- Komplexes und/oder des vierten Prime-Editor-Komplexes ein Fusionsprotein ist, das das napDNAbp und das Polypeptid mit einer RNA-abhängigen DNA-Polymerase-Aktivität umfasst.
133. Das System nach einer der Ausführungsformen 129-132, wobei
1. (i) die erste PEgRNA ferner eine erste Spacer-Sequenz, einen ersten gRNA-Kern und eine erste Primer-Bindungsstelle umfasst;
2. (ii) die zweite PEgRNA ferner eine zweite Spacer-Sequenz, einen zweiten gRNA-Kern und eine zweite Primer-Bindungsstelle umfasst;
3. (iii) die dritte PEgRNA ferner eine dritte Spacer-Sequenz, einen dritten gRNA-Kern und eine dritte Primer-Bindungsstelle umfasst; und
4. (iv) die vierte PEgRNA eine vierte Spacer-Sequenz, einen vierten gRNA-Kern, ein viertes DNA-Synthese-Templat und eine vierte Primer-Bindungsstelle umfasst.
134. Das System nach Ausführungsform 131, wobei die Region der Komplementarität der ersten und dritten einzelsträngigen DNA-Sequenz und/oder die Region der Komplementarität der zweiten und vierten einzelsträngigen DNA-Sequenz einen Duplex bilden.
135. Das System nach Ausführungsform 134, wobei die erste Spacer-Sequenz an die erste Bindungsstelle der ersten doppelsträngigen DNA-Sequenz stromaufwärts von der ersten zu editierenden Zielstelle bindet und die zweite Spacer-Sequenz an die zweite Bindungsstelle auf der ersten doppelsträngigen DNA-Sequenz stromabwärts von der ersten zu editierenden Zielstelle bindet.
136. Das System nach Ausführungsform 134 oder 135, wobei die dritte Spacer-Sequenz an die erste Bindungsstelle der zweiten doppelsträngigen DNA-Sequenz stromaufwärts von der zweiten zu editierenden Zielstelle bindet und die vierte Spacer-Sequenz an die zweite Bindungsstelle auf der zweiten doppelsträngigen DNA-Sequenz stromabwärts von der zweiten zu editierenden Zielstelle bindet.
137. Das System nach einer der Ausführungsformen 134-136, wobei die erste und zweite Bindungsstelle zwei Enden einer ersten zusammenhängenden Region der ersten doppelsträngigen DNA definieren.
138. Das System nach einer der Ausführungsformen 134-137, wobei die dritte und vierte Bindungsstelle zwei Enden einer zweiten zusammenhängenden Region der zweiten doppelsträngigen DNA definieren.
139. Das System nach Ausführungsform 138, wobei die zusammenhängende Region zwischen der ersten und zweiten Bindungsstelle oder der dritten und vierten Bindungsstelle mindestens 10 Nukleobasenpaare, mindestens 11 Nukleobasenpaare, mindestens 12 Nukleobasenpaare, mindestens 13 Nukleobasenpaare, mindestens 14 Nukleobasenpaare, mindestens 15 Nukleobasenpaare, mindestens 16 Nukleobasenpaare, mindestens 17 Nukleobasenpaare, mindestens 18 Nukleobasenpaare, mindestens 19 Nukleobasenpaare, mindestens 20 Nukleobasenpaare, mindestens 21 Nukleobasenpaare, mindestens 22 Nukleobasenpaare, mindestens 23 Nukleobasenpaare, mindestens 24 Nukleobasenpaare, mindestens 25 Nukleobasenpaare, mindestens 26 Nukleobasenpaare, mindestens 27 Nukleobasenpaare, mindestens 28 Nukleobasenpaare, mindestens 29 Nukleobasenpaare, mindestens 30 Nukleobasenpaare, mindestens 31 Nukleobasenpaare, mindestens 32 Nukleobasenpaare, mindestens 33 Nukleobasenpaare, mindestens 34 Nukleobasenpaare, mindestens 35 Nukleobasenpaare, mindestens 36 Nukleobasenpaare, mindestens 37 Nukleobasenpaare, mindestens 37 Nukleobasenpaare, mindestens 38 Nukleobasenpaare, mindestens 39 Nukleobasenpaare oder mindestens 40 Nukleobasenpaare, mindestens 41 Nukleotide, mindestens 42 Nukleotide, mindestens 43 Nukleotide, mindestens 44 Nukleotide, mindestens 45 Nukleotide, mindestens 46 Nukleotide, mindestens 47 Nukleotide, mindestens 48 Nukleotide, mindestens 49 Nukleotide, mindestens 50 Nukleotide, mindestens 51 Nukleotide, mindestens 52 Nukleotide, mindestens 53 Nukleotide, mindestens 54 Nukleotide, mindestens 55 Nukleotide, mindestens 56 Nukleotide, mindestens 57 Nukleotide, mindestens 58 Nukleotide, mindestens 59 Nukleotide, mindestens 60 Nukleotide, mindestens 61 Nukleotide, mindestens 62 Nukleotide, mindestens 63 Nukleotide, mindestens 64 Nukleotide, mindestens 65 Nukleotide, mindestens 66 Nukleotide, mindestens 67 Nukleotide, mindestens 68 Nukleotide, mindestens 69 Nukleotide, mindestens 70 Nukleotide, mindestens 71 Nukleotide, mindestens 72 Nukleotide, mindestens 73 Nukleotide, mindestens 74 Nukleotide, mindestens 75 Nukleotide, mindestens 76 Nukleotide, mindestens 77 Nukleotide, mindestens 78 Nukleotide, mindestens 79 Nukleotide, mindestens 80 Nukleotide, mindestens 81 Nukleotide, mindestens 82 Nukleotide mindestens 83 Nukleotide, mindestens 84 Nukleotide, mindestens 85 Nukleotide, mindestens 86 Nukleotide, mindestens 87 Nukleotide, mindestens 88 Nukleotide, mindestens 89 Nukleotide, mindestens 90 Nukleotide, mindestens 91 Nukleotide, mindestens 92 Nukleotide, mindestens 93 Nukleotide, mindestens 94 Nukleotide, mindestens 95 Nukleotide, mindestens 96 Nukleotide, mindestens 97 Nukleotide, mindestens 98 Nukleotide, mindestens 99 Nukleotide, mindestens 100 Nukleotide, mindestens 101 Nukleotide, mindestens 102 Nukleotide, mindestens 103 Nukleotide, mindestens 104 Nukleotide, mindestens 105 Nukleotide, mindestens 106 Nukleotide, mindestens 107 Nukleotide, mindestens 108 Nukleotide, mindestens 109 Nukleotide oder mindestens 110 Nukleotide in Länge beträgt.
140. Das System nach einer der Ausführungsformen 134-140, wobei die Region der Komplementarität der ersten einzelsträngigen DNA-Sequenz und der zweiten einzelsträngigen DNA-Sequenz und/oder die Region der Komplementarität der zweiten einzelsträngigen DNA- Sequenz und der vierten einzelsträngigen DNA-Sequenz einen Duplex bilden.
141. Das System nach Ausführungsform 140, wobei der Duplex in die erste doppelsträngige DNA und/oder die zweite doppelsträngige DNA eingebaut ist.
142. Das System nach einer der Ausführungsformen 134-141, wobei das System zu einem Austausch der ersten zusammenhängenden Region durch die zweite zusammenhängende Region in der ersten doppelsträngigen DNA führt.
143. Das System nach einer der Ausführungsformen 134-141, wobei das System zu einem Austausch der ersten zusammenhängenden Region und der zweiten zusammenhängenden Region zwischen der ersten doppelsträngigen DNA und der zweiten doppelsträngigen DNA führt.
144. Das System nach einer der Ausführungsformen 130-143, wobei der erste Prime-Editor- Komplex, der zweite Prime-Editor-Komplex, der dritte Prime-Editor-Komplex und der vierte Prime-Editor-Komplex denselben Prime-Editor umfassen.
145. Das System nach einer der Ausführungsformen 130-144, wobei das erste, zweite, dritte und vierte Polypeptid, das eine RNA-abhängige DNA-Polymerase-Aktivität umfasst, dasselbe ist.
146. Das System nach einer der Ausführungsformen 130-145, wobei das erste, zweite, dritte und/oder vierte napDNAbp eine Cas9-Domäne oder eine Variante davon ist.
147. Das System nach einer der Ausführungsformen 130-146, wobei das erste, zweite, dritte und/oder vierte napDNAbp eine nukleaseaktive Cas9-Domäne, eine nuklease-inaktive Cas9- Domäne oder eine Cas9-Nickase-Domäne oder eine Variante davon ist.
148. Das System nach einer der Ausführungsformen 130-147, wobei das erste, zweite, dritte und/oder vierte napDNAbp ausgewählt ist aus der Gruppe bestehend aus: Cas9, Cas12e, Cas12d, Cas12a, Cas12b1, Cas13a, Cas12c und Argonaut.
149. Das System nach einer der Ausführungsformen 130-148, wobei das erste, zweite, dritte und/oder vierte napDNAbp eine Nickase-Aktivität aufweist.
150. Das System nach einer der Ausführungsformen 130-149, wobei das erste, zweite, dritte und/oder vierte napDNAbp eine Aminosäuresequenz einer der SEQ-ID-NR: 2-65 umfasst, oder eine Aminosäuresequenz, die mindestens 80 %, 85 %, 90 %, 95 % oder 99 % Sequenzidentität mit einer der SEQ-ID-NR: 2-65 aufweist.
151. Das System nach einer der Ausführungsformen 130-150, wobei das das erste, zweite, dritte und/oder vierte Polypeptid, das eine RNA-abhängige DNA-Polymerase-Aktivität aufweist, eine reverse Transkriptase ist.
152. Das System nach einer der Ausführungsformen 130-151, wobei das erste, zweite, dritte und/oder vierte Polypeptid mit einer RNA-abhängigen DNA-Polymerase-Aktivität eine Aminosäuresequenz einer der SEQ-ID-NR: 37, 68-79, 82-98, 81, 98 und 110 umfasst, oder eine Nukleotidsequenz, die mindestens 80 %, 85 %, 90 %, 95 % oder 99 % Sequenzidentität mit einer der SEQ-ID-NR: 37, 68-79, 82-98, 81, 98 und 110 aufweist.
153. Das System nach einer der Ausführungsformen 130-152, wobei
- (i) der erste Prime-Editor ferner einen Linker umfasst, der das erste napDNAbp und das erste Polypeptid, das die RNA-abhängige DNA-Polymerase-Aktivität aufweist, miteinander verbindet;
- (ii) der zweite Prime-Editor ferner einen Linker umfasst, der das zweite napDNAbp und das zweite Polypeptid, das die RNA-abhängige DNA-Polymerase-Aktivität aufweist, miteinander verbindet;
- (iii) der dritte Prime-Editor ferner einen Linker umfasst, der das dritte napDNAbp und das dritte Polypeptid, das die RNA-abhängige DNA-Polymerase-Aktivität aufweist, miteinander verbindet; und/oder
- (iv) der vierte Prime-Editor ferner einen Linker umfasst, der das vierte napDNAbp und das vierte Polypeptid, das die RNA-abhängige DNA-Polymerase-Aktivität aufweist, miteinander verbindet.
154. Das System nach Ausführungsform 153, wobei der Linker eine Aminosäuresequenz einer der SEQ-ID-NR: 119-128 umfasst, oder eine Aminosäuresequenz, die mindestens 80 %, 85 %, 90 %, 95 % oder 99 % Sequenzidentität mit einer der SEQ-ID-NR: 119-128 aufweist.
155. Das System nach Ausführungsform 153 oder 154, wobei der Linker 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 38, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49 oder 50 Aminosäuren in Länge beträgt.
156. Das System nach einer der Ausführungsformen 130-155, wobei die erste, zweite, dritte und/oder vierte PEgRNA eine Nukleotidsequenz mit einer der SEQ-ID-NR: 192-203 umfasst, oder eine Aminosäuresequenz, die mindestens 80 %, 85 %, 90 %, 95 % oder 99 % Sequenzidentität mit einer der SEQ-ID-NR: 192-203 aufweist.
157. Das System nach einer der Ausführungsformen 130-156, wobei die erste Spacer- Sequenz an eine erste Bindungsstelle auf einem ersten Strang der doppelsträngigen DNA- Sequenz stromaufwärts von der zu editierenden Zielstelle bindet.
158. Das System nach einer der Ausführungsformen 130-157, wobei die zweite Spacer- Sequenz des zweiten Prime-Editor-Komplexes an eine zweite Bindungsstelle auf einem zweiten Strang der doppelsträngigen DNA-Sequenz stromaufwärts von der zu editierenden Zielstelle bindet.
159. Das System nach einer der Ausführungsformen 130-158, wobei die dritte Spacer- Sequenz an eine dritte Bindungsstelle auf einem ersten Strang der doppelsträngigen DNA- Sequenz stromabwärts von der zu editierenden Zielstelle bindet.
160. Das System nach einer der Ausführungsformen 130-159, wobei die vierte Spacer- Sequenz des vierten Prime-Editor-Komplexes an eine vierte Bindungsstelle auf einem zweiten Strang der doppelsträngigen DNA-Sequenz stromabwärts von der zu editierenden Zielstelle bindet.
161. Das System nach Ausführungsform 160, wobei die Bindung der Spacer-Sequenz des ersten und zweiten Prime-Editor-Komplexes in Gegenwart einer PAM-Sequenz zum Nicking des ersten bzw. zweiten Stranges an einer Nickstelle proximal zu den PAM-Sequenzen auf jedem Strang durch die ersten und/oder zweiten napDNAbps jedes ersten und zweiten Prime- Editor-Komplexes führt.
162. Das System nach Ausführungsform 161, wobei die Bindung der Spacer-Sequenz der dritten und vierten Prime-Editor-Komplexe in Gegenwart einer PAM-Sequenz zum Nicking des ersten bzw. zweiten Strangs an einer Nickstelle proximal zu den PAM-Sequenzen auf jedem Strang durch die dritten und/oder vierten napDNAbps jedes dritten und vierten Prime- Editor-Komplexes führt.
163. Das System nach Ausführungsform 160 oder 162, wobei die ersten und dritten Bindungsstellen oder die zweiten und vierten Bindungsstellen zwei Enden einer zusammenhängenden Region doppelsträngiger DNA definieren.
164. Das System nach Ausführungsform 163, wobei die zusammenhängende Region zwischen der ersten und dritten Bindungsstelle oder der zweiten und vierten Bindungsstelle mindestens 10 Nukleobasenpaare, mindestens 11 Nukleobasenpaare, mindestens 12 Nukleobasenpaare, mindestens 13 Nukleobasenpaare, mindestens 14 Nukleobasenpaare, mindestens 15 Nukleobasenpaare, mindestens 16 Nukleobasenpaare, mindestens 17 Nukleobasenpaare, mindestens 18 Nukleobasenpaare, mindestens 19 Nukleobasenpaare, mindestens 20 Nukleobasenpaare, mindestens 21 Nukleobasenpaare, mindestens 22 Nukleobasenpaare, mindestens 23 Nukleobasenpaare, mindestens 24 Nukleobasenpaare, mindestens 25 Nukleobasenpaare, mindestens 26 Nukleobasenpaare, mindestens 27 Nukleobasenpaare, mindestens 28 Nukleobasenpaare, mindestens 29 Nukleobasenpaare, mindestens 30 Nukleobasenpaare, mindestens 31 Nukleobasenpaare, mindestens 32 Nukleobasenpaare, mindestens 33 Nukleobasenpaare, mindestens 34 Nukleobasenpaare, mindestens 35 Nukleobasenpaare, mindestens 36 Nukleobasenpaare, mindestens 37 Nukleobasenpaare, mindestens 37 Nukleobasenpaare, mindestens 38 Nukleobasenpaare, mindestens 39 Nukleobasenpaare oder mindestens 40 Nukleobasenpaare, mindestens 41 Nukleotide, mindestens 42 Nukleotide, mindestens 43 Nukleotide, mindestens 44 Nukleotide, mindestens 45 Nukleotide, mindestens 46 Nukleotide, mindestens 47 Nukleotide, mindestens 48 Nukleotide, mindestens 49 Nukleotide, mindestens 50 Nukleotide, mindestens 51 Nukleotide, mindestens 52 Nukleotide, mindestens 53 Nukleotide, mindestens 54 Nukleotide, mindestens 55 Nukleotide, mindestens 56 Nukleotide, mindestens 57 Nukleotide, mindestens 58 Nukleotide, mindestens 59 Nukleotide, mindestens 60 Nukleotide, mindestens 61 Nukleotide, mindestens 62 Nukleotide, mindestens 63 Nukleotide, mindestens 64 Nukleotide, mindestens 65 Nukleotide, mindestens 66 Nukleotide, mindestens 67 Nukleotide, mindestens 68 Nukleotide, mindestens 69 Nukleotide, mindestens 70 Nukleotide, mindestens 71 Nukleotide, mindestens 72 Nukleotide, mindestens 73 Nukleotide, mindestens 74 Nukleotide, mindestens 75 Nukleotide, mindestens 76 Nukleotide, mindestens 77 Nukleotide, mindestens 78 Nukleotide, mindestens 79 Nukleotide, mindestens 80 Nukleotide, mindestens 81 Nukleotide, mindestens 82 Nukleotide mindestens 83 Nukleotide, mindestens 84 Nukleotide, mindestens 85 Nukleotide, mindestens 86 Nukleotide, mindestens 87 Nukleotide, mindestens 88 Nukleotide, mindestens 89 Nukleotide, mindestens 90 Nukleotide, mindestens 91 Nukleotide, mindestens 92 Nukleotide, mindestens 93 Nukleotide, mindestens 94 Nukleotide, mindestens 95 Nukleotide, mindestens 96 Nukleotide, mindestens 97 Nukleotide, mindestens 98 Nukleotide, mindestens 99 Nukleotide, mindestens 100 Nukleotide, mindestens 101 Nukleotide, mindestens 102 Nukleotide, mindestens 103 Nukleotide, mindestens 104 Nukleotide, mindestens 105 Nukleotide, mindestens 106 Nukleotide, mindestens 107 Nukleotide, mindestens 108 Nukleotide, mindestens 109 Nukleotide oder mindestens 110 Nukleotide in Länge beträgt.
165. Das System nach einer der Ausführungsformen 130-164, wobei die Region der Komplementarität der ersten einzelsträngigen DNA-Sequenz und der dritten einzelsträngigen DNA-Sequenz und/oder die Region der Komplementarität der zweiten einzelsträngigen DNA- Sequenz und der vierten einzelsträngigen DNA-Sequenz einen Duplex bilden.
166. Das System nach Ausführungsform 164 oder 165, wobei die zusammenhängende Region durch den Duplex ausgetauscht wird.
167. Das System nach Ausführungsform 164 oder 165, wobei der Duplex in die doppelsträngige DNA an der Zielstelle eingebaut ist.
168. Das System nach einer Ausführungsform der Ausführungsformen 130-167, wobei das erste, zweite, dritte und/oder vierte DNA-Synthese-Templat mindestens 1 Nukleotid, mindestens 2 Nukleotide, mindestens 3 Nukleotide, mindestens 4 Nukleotide, mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide ist, mindestens 13 Nukleotide, mindestens 14 Nukleotide, mindestens 15 Nukleotide, mindestens 16 Nukleotide, mindestens 17 Nukleotide, mindestens 18 Nukleotide, mindestens 19 Nukleotide, mindestens 20 Nukleotide, mindestens 21 Nukleotide, mindestens 22 Nukleotide, mindestens 23 Nukleotide, mindestens 24 Nukleotide, mindestens 25 Nukleotide, mindestens 26 Nukleotide mindestens 27 Nukleotide, mindestens 28 Nukleotide, mindestens 29 Nukleotide, mindestens 30 Nukleotide, mindestens 31 Nukleotide, mindestens 32 Nukleotide, mindestens 33 Nukleotide, mindestens 34 Nukleotide, mindestens 35 Nukleotide, mindestens 36 Nukleotide, mindestens 37 Nukleotide, mindestens 38 Nukleotide, mindestens 39 Nukleotide, mindestens 40 Nukleotide mindestens 41 Nukleotide, mindestens 42 Nukleotide, mindestens 43 Nukleotide, mindestens 44 Nukleotide, mindestens 45 Nukleotide, mindestens 46 Nukleotide, mindestens 47 Nukleotide, mindestens 48 Nukleotide, mindestens 49 Nukleotide, mindestens 50 Nukleotide, mindestens 51 Nukleotide, mindestens 52 Nukleotide, mindestens 53 Nukleotide, mindestens 54 Nukleotide mindestens 55 Nukleotide, mindestens 56 Nukleotide, mindestens 57 Nukleotide, mindestens 58 Nukleotide, mindestens 59 Nukleotide, mindestens 60 Nukleotide, mindestens 61 Nukleotide, mindestens 62 Nukleotide, mindestens 63 Nukleotide, mindestens 64 Nukleotide, mindestens 65 Nukleotide, mindestens 66 Nukleotide, mindestens 67 Nukleotide, mindestens 68 Nukleotide, mindestens 69 Nukleotide, mindestens 70 Nukleotide, mindestens 71 Nukleotide, mindestens 72 Nukleotide, mindestens 73 Nukleotide, mindestens 74 Nukleotide, mindestens 75 Nukleotide, mindestens 76 Nukleotide, mindestens 77 Nukleotide, mindestens 78 Nukleotide, mindestens 79 Nukleotide, mindestens 80 Nukleotide, mindestens 81 Nukleotide, mindestens 82 Nukleotide mindestens 83 Nukleotide, mindestens 84 Nukleotide, mindestens 85 Nukleotide, mindestens 86 Nukleotide, mindestens 87 Nukleotide, mindestens 88 Nukleotide, mindestens 89 Nukleotide, mindestens 90 Nukleotide, mindestens 91 Nukleotide, mindestens 92 Nukleotide, mindestens 93 Nukleotide, mindestens 94 Nukleotide, mindestens 95 Nukleotide, mindestens 96 Nukleotide, mindestens 97 Nukleotide, mindestens 98 Nukleotide, mindestens 99 Nukleotide, mindestens 100 Nukleotide, mindestens 101 Nukleotide, mindestens 102 Nukleotide, mindestens 103 Nukleotide, mindestens 104 Nukleotide, mindestens 105 Nukleotide, mindestens 106 Nukleotide, mindestens 107 Nukleotide, mindestens 108 Nukleotide, mindestens 109 Nukleotide oder mindestens 110 Nukleotide in Länge beträgt.
169. Das System nach einer der Ausführungsformen 130-168, wobei die erste einzelsträngige DNA-Sequenz und die zweite einzelsträngige DNA-Sequenz und/oder die dritte einzelsträngige DNA-Sequenz und die vierte einzelsträngige DNA-Sequenz die gleichen Längen aufweisen.
170. Das System nach einer der Ausführungsformen 130-168, wobei die erste einzelsträngige DNA-Sequenz und die zweite einzelsträngige DNA-Sequenz und/oder die dritte einzelsträngige DNA-Sequenz und die vierte einzelsträngige DNA-Sequenz unterschiedliche Längen aufweisen.
171. Das System nach einer der Ausführungsformen 130-170, wobei die Region der Komplementarität der ersten, zweiten, dritten und/oder vierten einzelsträngigen DNA-Sequenz mindestens 99 %, mindestens 95 %, mindestens 90 %, mindestens 85 %, mindestens 80 %, mindestens 75 %, mindestens 70 %, mindestens 65 %, mindestens 60 %, mindestens 55 %, mindestens 50 %, mindestens 45 %, mindestens 40 %, mindestens 35 %, mindestens 30 %, mindestens 25 %, mindestens 20 %, mindestens 15 % oder mindestens 10 % der Gesamtlänge der ersten einzelsträngigen DNA-Sequenz und der dritten einzelsträngigen DNA-Sequenz oder der zweiten einzelsträngigen DNA-Sequenz und der vierten einzelsträngigen DNA-Sequenz beträgt.
172. Das System nach einer der Ausführungsformen 130-171, wobei die Region der Komplementarität der ersten, zweiten, dritten und/oder vierten einzelsträngigen DNA-Sequenz mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide, mindestens 15 Nukleotide, mindestens 16 Nukleotide, mindestens 17 Nukleotide, mindestens 18 Nukleotide, mindestens 19 Nukleotide, mindestens 20 Nukleotide, mindestens 21 Nukleotide, mindestens 22 Nukleotide, mindestens 23 Nukleotide, mindestens 24 Nukleotide, mindestens 25 Nukleotide, mindestens 26 Nukleotide, mindestens 27 Nukleotide, mindestens 28 Nukleotide, mindestens 29 Nukleotide, mindestens 30 Nukleotide mindestens 31 Nukleotide, mindestens 32 Nukleotide, mindestens 33 Nukleotide, mindestens 34 Nukleotide, mindestens 35 Nukleotide, mindestens 36 Nukleotide, mindestens 37 Nukleotide, mindestens 38 Nukleotide, mindestens 39 Nukleotide, mindestens 40 Nukleotide, mindestens 41 Nukleotide, mindestens 42 Nukleotide, mindestens 43 Nukleotide, mindestens 44 Nukleotide mindestens 45 Nukleotide, mindestens 46 Nukleotide, mindestens 47 Nukleotide, mindestens 48 Nukleotide, mindestens 49 Nukleotide, mindestens 50 Nukleotide, mindestens 51 Nukleotide, mindestens 52 Nukleotide, mindestens 53 Nukleotide, mindestens 54 Nukleotide, mindestens 55 Nukleotide, mindestens 56 Nukleotide, mindestens 57 Nukleotide, mindestens 58 Nukleotide, mindestens 59 Nukleotide, mindestens 60 Nukleotide, mindestens 61 Nukleotide, mindestens 62 Nukleotide, mindestens 63 Nukleotide, mindestens 64 Nukleotide, mindestens 65 Nukleotide, mindestens 66 Nukleotide, mindestens 67 Nukleotide, mindestens 68 Nukleotide, mindestens 69 Nukleotide, mindestens 70 Nukleotide, mindestens 71 Nukleotide, mindestens 72 Nukleotide, mindestens 73 Nukleotide, mindestens 74 Nukleotide, mindestens 75 Nukleotide, mindestens 76 Nukleotide, mindestens 77 Nukleotide, mindestens 78 Nukleotide, mindestens 79 Nukleotide, mindestens 80 Nukleotide, mindestens 81 Nukleotide, mindestens 82 Nukleotide, mindestens 83 Nukleotide, mindestens 84 Nukleotide, mindestens 85 Nukleotide, mindestens 86 Nukleotide, mindestens 87 Nukleotide, mindestens 88 Nukleotide, mindestens 89 Nukleotide, mindestens 90 Nukleotide, mindestens 91 Nukleotide, mindestens 92 Nukleotide, mindestens 93 Nukleotide, mindestens 94 Nukleotide, mindestens 95 Nukleotide, mindestens 96 Nukleotide, mindestens 97 Nukleotide, mindestens 98 Nukleotide, mindestens 99 Nukleotide, mindestens 100 Nukleotide, mindestens 101 Nukleotide, mindestens 102 Nukleotide, mindestens 103 Nukleotide, mindestens 104 Nukleotide, mindestens 105 Nukleotide, mindestens 106 Nukleotide, mindestens 107 Nukleotide, mindestens 108 Nukleotide, mindestens 109 Nukleotide oder mindestens 110 Nukleotide in Länge beträgt und entweder kleiner oder gleich der Länge der ersten einzelsträngigen DNA-Sequenz und der dritten einzelsträngigen DNA-Sequenz und der zweiten einzelsträngigen DNA-Sequenz und der vierten einzelsträngigen DNA-Sequenz ist.
173. Das System nach einer der Ausführungsformen 130-172, wobei die erste, zweite, dritte und vierte einzelsträngige DNA-Sequenz jeweils einzelsträngige DNA-Stränge sind, die 3'- Enden aufweisen.
174. Das System nach Ausführungsform 167, wobei der Einbau des Duplex, der den editierten Abschnitt umfasst, zu einer Insertion, Deletion oder einem Austausch von DNA an der Zielstelle führt.
175. Ein Polynukleotid, das den ersten, zweiten, dritten und vierten Prime-Editor nach einer der Ausführungsformen 130-174 kodiert.
176. Ein Polynukleotid, das die erste, zweite, dritte und vierte PEgRNA nach einer der Ausführungsformen 130-174 kodiert.
177. Ein Vektor, der ein Polynukleotid nach Ausführungsform 175 oder 176 umfasst.
178. Eine Zelle, die ein Polynukleotid nach Ausführungsform 175 oder 176 oder einen Vektor nach Ausführungsform 177 umfasst.
179. Eine pharmazeutische Zusammensetzung, umfassend ein Polynukleotid nach Ausführungsform 175 oder 176, einen Vektor nach Ausführungsform 177 oder eine Zelle nach Ausführungsform 178 und einen pharmazeutischen Hilfsstoff.
180. Ein Kit, umfassend ein Polynukleotid nach Ausführungsform 175 oder 176 oder einen Vektor nach Ausführungsform 177 und Anweisungen für gleichzeitiges Editieren beider Stränge einer doppelsträngigen DNA-Sequenz an einer zu editierenden Zielstelle.
181. Ein Verfahren für gleichzeitiges Editieren eines ersten und eines zweiten komplementären Strangs einer doppelsträngigen DNA-Sequenz an einer Zielstelle, wobei das Verfahren das Inkontaktbringen der doppelsträngigen DNA-Sequenz mit einem Paar von Prime-Editor-Komplexen umfasst, wobei das Paar Folgendes umfasst:
- (a) einen ersten Prime-Editor-Komplex, umfassend:
  1. i. einen ersten Prime-Editor, umfassend ein erstes Nukleinsäure-programmierbares DNA- Bindungsprotein (erstes napDNAbp) und ein erstes Polypeptid, das eine RNA-abhängige DNA-Polymerase-Aktivität umfasst; und
  2. ii. eine erste Prime-Editing-Leit-RNA (erste PEgRNA), die an eine erste Zielsequenz auf dem ersten Strang der genomischen DNA-Sequenz stromaufwärts der Zielstelle bindet;
- (b) einen zweiten Prime-Editor-Komplex, umfassend:
  1. i. einen zweiten Prime-Editor, umfassend ein zweites Nukleinsäure-programmierbares DNA- Bindeprotein (zweites napDNAbp) und ein zweites Polypeptid, das eine RNA-abhängige DNA-Polymerase-Aktivität umfasst; und
  2. ii. eine zweite Prime-Editing-Leit-RNA (zweite PEgRNA), die an eine zweite Zielsequenz auf dem zweiten Strang der genomischen DNA-Sequenz stromaufwärts der;
- (c) einen dritten Prime-Editor-Komplex, umfassend:
  1. i. einen dritten Prime-Editor, umfassend ein drittes Nukleinsäure-programmierbares DNA- Bindeprotein (drittes napDNAbp) und ein drittes Polypeptid, das eine RNA-abhängige DNA-Polymerase-Aktivität umfasst; und
  2. ii. eine dritte Prime-Editing-Leit-RNA (dritte PEgRNA), die an eine erste Zielsequenz auf dem dritten Strang der genomischen DNA-Sequenz stromabwärts der Zielstelle bindet;
- (d) einen vierten Prime-Editor-Komplex, umfassend:
  1. i. einen vierten Prime-Editor, umfassend ein zweites Nukleinsäure-programmierbares DNA- Bindeprotein (viertes napDNAbp) und ein viertes Polypeptid, das eine RNA-abhängige DNA-Polymerase-Aktivität umfasst; und
  2. ii. eine vierte Prime-Editing-Leit-RNA (vierte PEgRNA), die an eine zweite Zielsequenz auf dem vierten Strang der genomischen DNA-Sequenz stromabwärts der Zielstelle bindet; wobei der erste Prime-Editor-Komplex einen ersten Nick an der ersten Zielsequenz und die anschließende Polymerisation einer ersten einzelsträngigen DNA-Sequenz verursacht, die ein 3'-Ende von dem verfügbaren 5'-Ende aufweist, das durch den ersten Nick gebildet wird;
wobei der zweite Prime-Editor-Komplex einen zweiten Nick an der zweiten Zielsequenz und die anschließende Polymerisation einer zweiten einzelsträngigen DNA-Sequenz verursacht, die ein 3'-Ende von dem verfügbaren 5'-Ende aufweist, das durch den zweiten Nick gebildet wird; wobei der dritte Prime-Editor-Komplex einen dritten Nick an der dritten Zielsequenz und die anschließende Polymerisation einer dritten einzelsträngigen DNA-Sequenz verursacht, die ein 3'-Ende von dem verfügbaren 5'-Ende aufweist, das durch den dritten Nick gebildet wird; wobei der vierte Prime-Editor-Komplex einen vierten Nick an der vierten Zielsequenz und die anschließende Polymerisation einer vierten einzelsträngigen DNA-Sequenz verursacht, die ein 3'-Ende von dem verfügbaren 5'-Ende aufweist, das durch den vierten Nick gebildet wird; wobei die erste einzelsträngige DNA-Sequenz und die zweite einzelsträngige DNA-Sequenz über mindestens eine Region der Komplementarität umgekehrt komplementär sind und einen Duplex bilden, wobei der Duplex die genickten ersten und zweiten komplementären Stränge der doppelsträngigen DNA-Sequenz ersetzt; und wobei die dritte einzelsträngige DNA-Sequenz und die vierte einzelsträngige DNA-Sequenz über mindestens eine Region der Komplementarität umgekehrt komplementär sind und einen Duplex bilden, wobei der Duplex die genickten ersten und zweiten komplementären Stränge der doppelsträngigen DNA-Sequenz ersetzt.
182. Das Verfahren nach Ausführungsform 181, wobei der Prime-Editor des ersten Prime- Editor-Komplexes, des zweiten Prime-Editor-Komplexes, des dritten Prime-Editor- Komplexes und/oder des vierten Prime-Editor-Komplexes ein Fusionsprotein ist, das das napDNAbp und das Polypeptid mit einer RNA-abhängigen DNA-Polymerase-Aktivität umfasst.
183. Das Verfahren nach Ausführungsform 181 oder 182, wobei der erste Prime-Editor- Komplex, der zweite Prime-Editor-Komplex, der dritte Prime-Editor-Komplex und der vierte Prime-Editor-Komplex denselben Prime-Editor umfassen.
184. Das Verfahren nach Ausführungsform 181 oder 182, wobei der erste, zweite, dritte und/oder vierte Prime-Editor-Komplex einen unterschiedlichen Prime-Editor umfasst.
185. Das Verfahren nach einer der Ausführungsformen 181-184, wobei das erste, zweite, dritte und/oder vierte napDNAbp eine Cas9-Domäne oder eine Variante davon ist.
186. Das Verfahren nach einer der Ausführungsformen 181-185, wobei das erste, zweite, dritte und/oder vierte napDNAbp eine nukleaseaktive Cas9-Domäne, eine nuklease-inaktive Cas9-Domäne oder eine Cas9-Nickase-Domäne oder Variante davon ist.
187. Das Verfahren nach einer der Ausführungsformen 181-184, wobei das erste, zweite, dritte und/oder vierte napDNAbp ausgewählt ist aus der Gruppe bestehend aus: Cas9, Cas12e, Cas12d, Cas12a, Cas12b1, Cas13a, Cas12c.
188. Das Verfahren nach einer der Ausführungsformen 181-187, wobei das erste, zweite, dritte und/oder vierte napDNAbp eine Nickase-Aktivität aufweist.
189. Das Verfahren nach einer der Ausführungsformen 181-188, wobei das erste, zweite, dritte und/oder vierte napDNAbp eine Aminosäuresequenz einer der SEQ-ID-NR: 2-65 umfasst, oder eine Aminosäuresequenz, die mindestens 80 %, 85 %, 90 %, 95 % oder 99 % Sequenzidentität mit einer der SEQ-ID-NR: 2-65 aufweist.
190. Das Verfahren nach einer der Ausführungsformen 181-189, wobei das das erste, zweite, dritte und/oder vierte Polypeptid, das eine RNA-abhängige DNA-Polymerase-Aktivität aufweist, eine reverse Transkriptase ist.
191. Das Verfahren nach einer der Ausführungsformen 181-190, wobei das erste, zweite, dritte und/oder vierte Polypeptid mit einer RNA-abhängigen DNA-Polymerase-Aktivität eine Aminosäuresequenz einer der SEQ-ID-NR: 37, 68-79, 82-98, 81, 98 und 110 umfasst, oder eine Nukleotidsequenz, die mindestens 80 %, 85 %, 90 %, 95 % oder 99 % Sequenzidentität mit einer der SEQ-ID-NR: 37, 68-79, 82-98, 81, 98, und 110 aufweist.
192. Das Verfahren nach einer der Ausführungsformen 181-191, wobei
- (i) der erste Prime-Editor ferner einen Linker umfasst, der das erste napDNAbp und das erste Polypeptid, das die RNA-abhängige DNA-Polymerase-Aktivität aufweist, miteinander verbindet;
- (ii) der zweite Prime-Editor ferner einen Linker umfasst, der das zweite napDNAbp und das zweite Polypeptid, das die RNA-abhängige DNA-Polymerase-Aktivität aufweist, miteinander verbindet;
- (iii) der dritte Prime-Editor ferner einen Linker umfasst, der das dritte napDNAbp und das dritte Polypeptid, das die RNA-abhängige DNA-Polymerase-Aktivität aufweist, miteinander verbindet; und/oder
- (iv) der vierte Prime-Editor ferner einen Linker umfasst, der das vierte napDNAbp und das vierte Polypeptid, das die RNA-abhängige DNA-Polymerase-Aktivität aufweist, miteinander verbindet.
193. Das Verfahren nach Ausführungsform 192, wobei der Linker eine Aminosäuresequenz einer der SEQ-ID-NR: 119-128 umfasst, oder eine Aminosäuresequenz, die mindestens 80 %, 85 %, 90 %, 95 % oder 99 % Sequenzidentität mit einer der SEQ-ID-NR: 119-128 aufweist.
194. Das Verfahren nach Ausführungsform 192 oder 193, wobei der Linker 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 38, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49 oder 50 Aminosäuren in Länge beträgt.
195. Das Verfahren nach einer der Ausführungsformen 181-191, wobei die erste, zweite, dritte und/oder vierte PEgRNA eine Nukleotidsequenz mit einer der SEQ-ID-NR: 192-203 umfasst, oder eine Aminosäuresequenz, die mindestens 80 %, 85 %, 90 %, 95 % oder 99 % Sequenzidentität mit einer der SEQ-ID-NR: 192-203 aufweist.
196. Das Verfahren nach einer der Ausführungsformen 181-195, wobei die erste Spacer- Sequenz des ersten Prime-Editor-Komplexes an eine erste Bindungsstelle auf einem ersten Strang der doppelsträngigen DNA-Sequenz stromaufwärts von der zu editierenden Zielstelle bindet.
197. Das Verfahren nach einer der Ausführungsformen 181-196, wobei die zweite Spacer- Sequenz des zweiten Prime-Editor-Komplexes an eine zweite Bindungsstelle auf einem zweiten Strang der doppelsträngigen DNA-Sequenz stromabwärts von der zu editierenden Zielstelle bindet.
198. Das Verfahren nach einer der Ausführungsformen 181-197, wobei die dritte Spacer- Sequenz des dritten Prime-Editor-Komplexes an eine dritte Bindungsstelle auf einem ersten Strang der doppelsträngigen DNA-Sequenz stromaufwärts von der zu editierenden Zielstelle bindet.
199. Das Verfahren nach einer der Ausführungsformen 181-198, wobei die vierte Spacer- Sequenz des vierten Prime-Editor-Komplexes an eine vierte Bindungsstelle auf einem zweiten Strang der doppelsträngigen DNA-Sequenz stromabwärts von der zu editierenden Zielstelle bindet.
200. Das Verfahren nach Ausführungsform 197, wobei die Bindung der ersten und zweiten Spacer-Sequenzen des ersten und zweiten Prime-Editor-Komplexes in Gegenwart einer PAM- Sequenz zum Nicking des ersten bzw. zweiten Stranges an einer Nickstelle proximal zur PAM- Sequenz auf jedem Strang durch die napDNAbps jedes ersten und zweiten Prime-Editor- Komplexes führt.
201. Das Verfahren nach Ausführungsform 199, wobei die Bindung der dritten und vierten Spacer-Sequenzen des dritten und vierten Prime-Editor-Komplexes in Gegenwart einer PAM- Sequenz zum Nicking des ersten bzw. zweiten Stranges an einer Nickstelle proximal zur PAM- Sequenz auf jedem Strang durch die napDNAbps jedes dritten und vierten Prime-Editor- Komplexes führt.
202. Das Verfahren nach Ausführungsform 200 oder 201, wobei die erste und zweite Bindungsstelle und/oder die dritte und vierte Bindungsstelle zwei Enden einer zusammenhängenden Region doppelsträngiger DNA definieren, die die zu editierende Zielstelle umfasst.
203. Das Verfahren nach Ausführungsform 202, wobei die zusammenhängende Region zwischen der ersten und zweiten Bindungsstelle und/oder die zusammenhängende Region zwischen der dritten und vierten Bindungsstelle mindestens 10 Nukleobasenpaare, mindestens 11 Nukleobasenpaare, mindestens 12 Nukleobasenpaare, mindestens 13 Nukleobasenpaare, mindestens 14 Nukleobasenpaare, mindestens 15 Nukleobasenpaare, mindestens 16 Nukleobasenpaare, mindestens 17 Nukleobasenpaare, mindestens 18 Nukleobasenpaare, mindestens 19 Nukleobasenpaare, mindestens 20 Nukleobasenpaare, mindestens 21 Nukleobasenpaare, mindestens 22 Nukleobasenpaare, mindestens 23 Nukleobasenpaare, mindestens 24 Nukleobasenpaare, mindestens 25 Nukleobasenpaare, mindestens 26 Nukleobasenpaare, mindestens 27 Nukleobasenpaare, mindestens 28 Nukleobasenpaare, mindestens 29 Nukleobasenpaare, mindestens 30 Nukleobasenpaare, mindestens 31 Nukleobasenpaare, mindestens 32 Nukleobasenpaare, mindestens 33 Nukleobasenpaare, mindestens 34 Nukleobasenpaare, mindestens 35 Nukleobasenpaare, mindestens 36 Nukleobasenpaare, mindestens 37 Nukleobasenpaare, mindestens 37 Nukleobasenpaare, mindestens 38 Nukleobasenpaare, mindestens 39 Nukleobasenpaare oder mindestens 40 Nukleobasenpaare, mindestens 41 Nukleotide, mindestens 42 Nukleotide, mindestens 43 Nukleotide, mindestens 44 Nukleotide, mindestens 45 Nukleotide, mindestens 46 Nukleotide, mindestens 47 Nukleotide, mindestens 48 Nukleotide, mindestens 49 Nukleotide, mindestens 50 Nukleotide, mindestens 51 Nukleotide, mindestens 52 Nukleotide, mindestens 53 Nukleotide, mindestens 54 Nukleotide, mindestens 55 Nukleotide, mindestens 56 Nukleotide, mindestens 57 Nukleotide, mindestens 58 Nukleotide, mindestens 59 Nukleotide, mindestens 60 Nukleotide, mindestens 61 Nukleotide, mindestens 62 Nukleotide, mindestens 63 Nukleotide, mindestens 64 Nukleotide, mindestens 65 Nukleotide, mindestens 66 Nukleotide, mindestens 67 Nukleotide, mindestens 68 Nukleotide, mindestens 69 Nukleotide, mindestens 70 Nukleotide, mindestens 71 Nukleotide, mindestens 72 Nukleotide, mindestens 73 Nukleotide, mindestens 74 Nukleotide, mindestens 75 Nukleotide, mindestens 76 Nukleotide, mindestens 77 Nukleotide, mindestens 78 Nukleotide, mindestens 79 Nukleotide, mindestens 80 Nukleotide, mindestens 81 Nukleotide, mindestens 82 Nukleotide mindestens 83 Nukleotide, mindestens 84 Nukleotide, mindestens 85 Nukleotide, mindestens 86 Nukleotide, mindestens 87 Nukleotide, mindestens 88 Nukleotide, mindestens 89 Nukleotide, mindestens 90 Nukleotide, mindestens 91 Nukleotide, mindestens 92 Nukleotide, mindestens 93 Nukleotide, mindestens 94 Nukleotide, mindestens 95 Nukleotide, mindestens 96 Nukleotide, mindestens 97 Nukleotide, mindestens 98 Nukleotide, mindestens 99 Nukleotide, mindestens 100 Nukleotide, mindestens 101 Nukleotide, mindestens 102 Nukleotide, mindestens 103 Nukleotide, mindestens 104 Nukleotide, mindestens 105 Nukleotide, mindestens 106 Nukleotide, mindestens 107 Nukleotide, mindestens 108 Nukleotide, mindestens 109 Nukleotide oder mindestens 110 Nukleotide in Länge beträgt.
204. Das Verfahren nach Ausführungsform 202 oder 203, wobei die zusammenhängende Region durch den Duplex ausgetauscht wird.
205. Das Verfahren nach einer der Ausführungsformen 181-204, wobei das erste, zweite, dritte und/oder vierte DNA-Synthese-Templat mindestens 1 Nukleotid, mindestens 2 Nukleotide, mindestens 3 Nukleotide, mindestens 4 Nukleotide, mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide ist, mindestens 13 Nukleotide, mindestens 14 Nukleotide, mindestens 15 Nukleotide, mindestens 16 Nukleotide, mindestens 17 Nukleotide, mindestens 18 Nukleotide, mindestens 19 Nukleotide, mindestens 20 Nukleotide, mindestens 21 Nukleotide, mindestens 22 Nukleotide, mindestens 23 Nukleotide, mindestens 24 Nukleotide, mindestens 25 Nukleotide, mindestens 26 Nukleotide mindestens 27 Nukleotide, mindestens 28 Nukleotide, mindestens 29 Nukleotide, mindestens 30 Nukleotide, mindestens 31 Nukleotide, mindestens 32 Nukleotide, mindestens 33 Nukleotide, mindestens 34 Nukleotide, mindestens 35 Nukleotide, mindestens 36 Nukleotide, mindestens 37 Nukleotide, mindestens 38 Nukleotide, mindestens 39 Nukleotide, mindestens 40 Nukleotide mindestens 41 Nukleotide, mindestens 42 Nukleotide, mindestens 43 Nukleotide, mindestens 44 Nukleotide, mindestens 45 Nukleotide, mindestens 46 Nukleotide, mindestens 47 Nukleotide, mindestens 48 Nukleotide, mindestens 49 Nukleotide, mindestens 50 Nukleotide, mindestens 51 Nukleotide, mindestens 52 Nukleotide, mindestens 53 Nukleotide, mindestens 54 Nukleotide mindestens 55 Nukleotide, mindestens 56 Nukleotide, mindestens 57 Nukleotide, mindestens 58 Nukleotide, mindestens 59 Nukleotide, mindestens 60 Nukleotide, mindestens 61 Nukleotide, mindestens 62 Nukleotide, mindestens 63 Nukleotide, mindestens 64 Nukleotide, mindestens 65 Nukleotide, mindestens 66 Nukleotide, mindestens 67 Nukleotide, mindestens 68 Nukleotide, mindestens 69 Nukleotide, mindestens 70 Nukleotide, mindestens 71 Nukleotide, mindestens 72 Nukleotide, mindestens 73 Nukleotide, mindestens 74 Nukleotide, mindestens 75 Nukleotide, mindestens 76 Nukleotide, mindestens 77 Nukleotide, mindestens 78 Nukleotide, mindestens 79 Nukleotide, mindestens 80 Nukleotide, mindestens 81 Nukleotide, mindestens 82 Nukleotide mindestens 83 Nukleotide, mindestens 84 Nukleotide, mindestens 85 Nukleotide, mindestens 86 Nukleotide, mindestens 87 Nukleotide, mindestens 88 Nukleotide, mindestens 89 Nukleotide, mindestens 90 Nukleotide, mindestens 91 Nukleotide, mindestens 92 Nukleotide, mindestens 93 Nukleotide, mindestens 94 Nukleotide, mindestens 95 Nukleotide, mindestens 96 Nukleotide, mindestens 97 Nukleotide, mindestens 98 Nukleotide, mindestens 99 Nukleotide, mindestens 100 Nukleotide, mindestens 101 Nukleotide, mindestens 102 Nukleotide, mindestens 103 Nukleotide, mindestens 104 Nukleotide, mindestens 105 Nukleotide, mindestens 106 Nukleotide, mindestens 107 Nukleotide, mindestens 108 Nukleotide, mindestens 109 Nukleotide oder mindestens 110 Nukleotide in Länge beträgt.
206. Das Verfahren nach einer der Ausführungsformen 181-205, wobei die erste einzelsträngige DNA-Sequenz und die zweite einzelsträngige DNA-Sequenz und/oder die dritte einzelsträngige DNA-Sequenz und die vierte einzelsträngige DNA-Sequenz die gleichen Längen aufweisen.
207. Das Verfahren nach einer der Ausführungsformen 181-206, wobei die erste einzelsträngige DNA-Sequenz und die zweite einzelsträngige DNA-Sequenz und/oder die dritte einzelsträngige DNA-Sequenz und die vierte einzelsträngige DNA-Sequenz unterschiedliche Längen aufweisen.
208. Das Verfahren nach einer der Ausführungsformen 181-207, wobei die Region der Komplementarität mindestens 99%, mindestens 95%, mindestens 90%, mindestens 85%, mindestens 80%, mindestens 75%, mindestens 70%, mindestens 65%, mindestens 60%, mindestens 55%, mindestens 50% beträgt, mindestens 45 %, mindestens 40 %, mindestens 35 %, mindestens 30 %, mindestens 25 %, mindestens 20 %, mindestens 15 % oder mindestens 10 % der Gesamtlänge der ersten einzelsträngigen DNA-Sequenz und der zweiten einzelsträngigen DNA-Sequenz oder der dritten einzelsträngigen DNA-Sequenz und der vierten einzelsträngigen DNA-Sequenz beträgt.
209. Das Verfahren nach einer der Ausführungsformen 181-208, wobei die Region der Komplementarität mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide ist, mindestens 13 Nukleotide, mindestens 14 Nukleotide, mindestens 15 Nukleotide, mindestens 16 Nukleotide, mindestens 17 Nukleotide, mindestens 18 Nukleotide, mindestens 19 Nukleotide, mindestens 20 Nukleotide, mindestens 21 Nukleotide, mindestens 22 Nukleotide, mindestens 23 Nukleotide, mindestens 24 Nukleotide, mindestens 25 Nukleotide, mindestens 26 Nukleotide mindestens 27 Nukleotide, mindestens 28 Nukleotide, mindestens 29 Nukleotide, mindestens 30 Nukleotide, mindestens 31 Nukleotide, mindestens 32 Nukleotide, mindestens 33 Nukleotide, mindestens 34 Nukleotide, mindestens 35 Nukleotide, mindestens 36 Nukleotide, mindestens 37 Nukleotide, mindestens 38 Nukleotide, mindestens 39 Nukleotide, mindestens 40 Nukleotide mindestens 41 Nukleotide, mindestens 42 Nukleotide, mindestens 43 Nukleotide, mindestens 44 Nukleotide, mindestens 45 Nukleotide, mindestens 46 Nukleotide, mindestens 47 Nukleotide, mindestens 48 Nukleotide, mindestens 49 Nukleotide, mindestens 50 Nukleotide, mindestens 51 Nukleotide, mindestens 52 Nukleotide, mindestens 53 Nukleotide, mindestens 54 Nukleotide mindestens 55 Nukleotide, mindestens 56 Nukleotide, mindestens 57 Nukleotide, mindestens 58 Nukleotide, mindestens 59 Nukleotide, mindestens 60 Nukleotide, mindestens 61 Nukleotide, mindestens 62 Nukleotide, mindestens 63 Nukleotide, mindestens 64 Nukleotide, mindestens 65 Nukleotide, mindestens 66 Nukleotide, mindestens 67 Nukleotide, mindestens 68 Nukleotide, mindestens 69 Nukleotide, mindestens 70 Nukleotide, mindestens 71 Nukleotide, mindestens 72 Nukleotide, mindestens 73 Nukleotide, mindestens 74 Nukleotide, mindestens 75 Nukleotide, mindestens 76 Nukleotide, mindestens 77 Nukleotide, mindestens 78 Nukleotide, mindestens 79 Nukleotide, mindestens 80 Nukleotide, mindestens 81 Nukleotide, mindestens 82 Nukleotide mindestens 83 Nukleotide, mindestens 84 Nukleotide, mindestens 85 Nukleotide, mindestens 86 Nukleotide, mindestens 87 Nukleotide, mindestens 88 Nukleotide, mindestens 89 Nukleotide, mindestens 90 Nukleotide, mindestens 91 Nukleotide, mindestens 92 Nukleotide, mindestens 93 Nukleotide, mindestens 94 Nukleotide, mindestens 95 Nukleotide, mindestens 96 Nukleotide, mindestens 97 Nukleotide, mindestens 98 Nukleotide, mindestens 99 Nukleotide, mindestens 100 Nukleotide, mindestens 101 Nukleotide, mindestens 102 Nukleotide, mindestens 103 Nukleotide, mindestens 104 Nukleotide, mindestens 105 Nukleotide, mindestens 106 Nukleotide, mindestens 107 Nukleotide, mindestens 108 Nukleotide, mindestens 109 Nukleotide oder mindestens 110 Nukleotide in Länge beträgt.
210. Das Verfahren nach einer der Ausführungsformen 181-209, wobei die Region der Komplementarität der ersten einzelsträngigen DNA-Sequenz und der zweiten einzelsträngigen DNA-Sequenz und/oder der dritten einzelsträngigen DNA-Sequenz und der vierten einzelsträngigen DNA-Sequenz den Duplex bilden.
211. Das Verfahren nach einer der Ausführungsformen 181-210, wobei die erste einzelsträngige DNA-Sequenz und die zweite einzelsträngige DNA-Sequenz und/oder die dritte einzelsträngige DNA-Sequenz und die vierte einzelsträngige DNA-Sequenz jeweils einzelsträngige DNA-Stränge sind, die 3'-Enden aufweisen.
212. Das Verfahren nach Ausführungsform 204, wobei der Austausch der zusammenhängenden Region durch den Duplex, der den editierten Abschnitt umfasst, zu einer Insertion, Deletion oder einem Austausch der DNA an der Zielstelle führt.
213. Das Verfahren nach einer der Ausführungsformen 181-212, wobei die erste einzelsträngige DNA-Sequenz und die zweite einzelsträngige DNA-Sequenz an Enden einer Ziel-DNA-Sequenz liegen und wobei die dritte einzelsträngige DNA-Sequenz und die vierte einzelsträngige DNA-Sequenz an entgegengesetzten Enden derselben Ziel-DNA-Sequenz liegen.
214. Das Verfahren nach Ausführungsform 213, wobei die Ziel-DNA-Sequenz invertiert ist.
215. Das Verfahren nach einer der Ausführungsformen 181-214, ferner umfassend Bereitstellen eines zirkulären DNA-Donors.
216. Das Verfahren nach Ausführungsform 215, wobei die erste einzelsträngige DNA- Sequenz und die dritte einzelsträngige DNA-Sequenz an entgegengesetzten Enden der Ziel- DNA-Sequenz liegen und wobei die zweite einzelsträngige DNA-Sequenz und die vierte einzelsträngige DNA-Sequenz auf dem zirkulären DNA-Donor liegen.
217. Das Verfahren nach Ausführungsform 216, wobei ein Abschnitt des zirkulären DNA- Donors zwischen der zweiten einzelsträngigen DNA-Sequenz und der vierten einzelsträngigen DNA-Sequenz die Zielsequenz zwischen der ersten einzelsträngigen DNA-Sequenz und der dritten einzelsträngigen DNA-Sequenz austauscht.
218. Das Verfahren nach einer der Ausführungsformen 181-214, wobei sich die erste einzelsträngige DNA-Sequenz und die dritte einzelsträngige DNA-Sequenz auf einem ersten Nukleinsäuremolekül befinden, und wobei sich die zweite einzelsträngige DNA-Sequenz und die vierte einzelsträngige DNA-Sequenz auf einem zweiten Nukleinsäuremolekül befinden.
219. Das Verfahren nach Ausführungsform 218, wobei ein Abschnitt des ersten Nukleinsäuremoleküls zwischen der ersten einzelsträngigen DNA-Sequenz und der dritten einzelsträngigen DNA-Sequenz in das zweite Nukleinsäuremolekül eingebaut wird, und wobei ein Abschnitt des zweiten Nukleinsäuremoleküls zwischen der zweiten einzelsträngigen DNA- Sequenz und der vierten einzelsträngigen DNA-Sequenz in das erste Nukleinsäuremolekül eingebaut wird.
220. Das Verfahren nach Ausführungsform 218 oder 219, wobei das erste Nukleinsäuremolekül ein erstes Chromosom und das zweite Nukleinsäuremolekül ein zweites Chromosom ist.
221. Ein Satz von PEgRNAs zur Verwendung beim Mulit-Flap-Prime-Editing, wobei die PEgRNAs Folgendes umfassen:
1. (a) eine erste Prime-Editing-Leit-RNA (erste PEgRNA), die an eine erste Bindungsstelle auf einem ersten Strang einer doppelsträngigen DNA-Sequenz stromaufwärts einer zu editierenden Zielstelle bindet, wobei die erste PEgRNA eine erste Spacer-Sequenz, einen ersten gRNA- Kern, ein erstes DNA-Synthese-Templat und eine erste Primer-Bindungsstelle umfasst, wobei das erste DNA-Synthese-Templat eine erste einzelsträngige DNA-Sequenz kodiert;
2. (b) eine zweite Prime-Editing-Leit-RNA (zweite PEgRNA), die an eine zweite Bindungsstelle auf einem zweiten Strang der doppelsträngigen DNA-Sequenz stromaufwärts von der zu editierenden Zielstelle bindet, wobei die zweite PEgRNA eine zweite Spacer-Sequenz, einen zweiten gRNA-Kern, ein zweites DNA-Synthese-Templat und eine zweite Primer- Bindungsstelle umfasst, wobei das zweite DNA-Synthese-Templat eine zweite einzelsträngige DNA-Sequenz kodiert, die den editierten Abschnitt umfasst, wobei die zweite einzelsträngige DNA-Sequenz komplementär zu der ersten einzelsträngigen DNA-Sequenz ist.
3. (c) eine erste Prime-Editing-Leit-RNA (erste PEgRNA), die an eine erste Bindungsstelle auf einem ersten Strang einer doppelsträngigen DNA-Sequenz stromaufwärts einer zu editierenden Zielstelle bindet, wobei die erste PEgRNA eine erste Spacer-Sequenz, einen ersten gRNA- Kern, ein erstes DNA-Synthese-Templat und eine erste Primer-Bindungsstelle umfasst, wobei das erste DNA-Synthese-Templat eine erste einzelsträngige DNA-Sequenz kodiert, die einen editierten Abschnitt umfasst;
4. (d) eine vierte Prime-Editing-Leit-RNA (vierte PEgRNA), die an eine vierte Bindungsstelle auf einem zweiten Strang der doppelsträngigen DNA-Sequenz stromabwärts der zu editierenden Zielstelle bindet, wobei die vierte PEgRNA eine vierte Spacer-Sequenz, einen vierten gRNA-Kern, ein viertes DNA-Synthese-Templat und eine vierte Primer-Bindungsstelle umfasst, wobei das vierte DNA-Synthese-Templat eine vierte einzelsträngige DNA-Sequenz kodiert, wobei die vierte einzelsträngige DNA-Sequenz eine Region der Komplementarität zur dritten einzelsträngigen DNA-Sequenz umfasst.
222. Der Satz von PEgRNAs nach Ausführungsform 221, wobei die erste PEgRNA die folgende Struktur umfasst:
- 5'-[erste gRNA-Spacer-Sequenz]-[erster gRNA-Kern]-[erstes DNA-Synthese-Templat]-[erste Primer-Bindungsstelle]-3';
die zweite PEgRNA die folgende Struktur umfasst:
- 5'-[zweite gRNA-Spacer-Sequenz]-[zweiter gRNA-Kem]-[zweites DNA-Synthese-Templat]- [zweite Primer-Bindungsstelle]-3';
- die dritte PEgRNA die folgende Struktur umfasst:
  - 5'-[dritte gRNA-Spacer-Sequenz]-[dritter gRNA-Kern]-[drittes DNA-Synthese-Templat]- [dritte Primer-Bindungsstelle]-3'; und
- die vierte PEgRNA die folgende Struktur umfasst:
  - 5'-[vierte gRNA-Spacer-Sequenz]-[vierter gRNA-Kern]-[viertes DNA-Synthese-Templat]- [vierte Primer-Bindungsstelle]-3'.
223. Der Satz von PEgRNAs nach Ausführungsform 221 oder 222, wobei die erste einzelsträngige DNA-Sequenz und die zweite einzelsträngige DNA-Sequenz und/oder die dritte einzelsträngige DNA-Sequenz und die vierte einzelsträngige DNA-Sequenz einen Duplex bilden, der in die doppelsträngige DNA-Sequenz an der zu editierenden Zielstelle integriert wird.
224. Der Satz von PEgRNAs nach einer der Ausführungsformen 221-223, wobei die Integration des Duplexes zu einer Insertion, Deletion oder einem Austausch von DNA an der Zielstelle führt.
225. Der Satz von PEgRNAs nach Ausführungsform 224, wobei die Insertion mindestens 1 Nukleotid, mindestens 2 Nukleotide, mindestens 3 Nukleotide, mindestens 4 Nukleotide, mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide ist, mindestens 13 Nukleotide, mindestens 14 Nukleotide, mindestens 15 Nukleotide, mindestens 16 Nukleotide, mindestens 17 Nukleotide, mindestens 18 Nukleotide, mindestens 19 Nukleotide, mindestens 20 Nukleotide, mindestens 21 Nukleotide, mindestens 22 Nukleotide, mindestens 23 Nukleotide, mindestens 24 Nukleotide, mindestens 25 Nukleotide, mindestens 26 Nukleotide mindestens 27 Nukleotide, mindestens 28 Nukleotide, mindestens 29 Nukleotide, mindestens 30 Nukleotide, mindestens 31 Nukleotide, mindestens 32 Nukleotide, mindestens 33 Nukleotide, mindestens 34 Nukleotide, mindestens 35 Nukleotide, mindestens 36 Nukleotide, mindestens 37 Nukleotide, mindestens 38 Nukleotide, mindestens 39 Nukleotide, mindestens 40 Nukleotide mindestens 41 Nukleotide, mindestens 42 Nukleotide, mindestens 43 Nukleotide, mindestens 44 Nukleotide, mindestens 45 Nukleotide, mindestens 46 Nukleotide, mindestens 47 Nukleotide, mindestens 48 Nukleotide, mindestens 49 Nukleotide, mindestens 50 Nukleotide, mindestens 51 Nukleotide, mindestens 52 Nukleotide, mindestens 53 Nukleotide, mindestens 54 Nukleotide mindestens 55 Nukleotide, mindestens 56 Nukleotide, mindestens 57 Nukleotide, mindestens 58 Nukleotide, mindestens 59 Nukleotide, mindestens 60 Nukleotide, mindestens 61 Nukleotide, mindestens 62 Nukleotide, mindestens 63 Nukleotide, mindestens 64 Nukleotide, mindestens 65 Nukleotide, mindestens 66 Nukleotide, mindestens 67 Nukleotide, mindestens 68 Nukleotide, mindestens 69 Nukleotide, mindestens 70 Nukleotide, mindestens 71 Nukleotide, mindestens 72 Nukleotide, mindestens 73 Nukleotide, mindestens 74 Nukleotide, mindestens 75 Nukleotide, mindestens 76 Nukleotide, mindestens 77 Nukleotide, mindestens 78 Nukleotide, mindestens 79 Nukleotide, mindestens 80 Nukleotide, mindestens 81 Nukleotide, mindestens 82 Nukleotide mindestens 83 Nukleotide, mindestens 84 Nukleotide, mindestens 85 Nukleotide, mindestens 86 Nukleotide, mindestens 87 Nukleotide, mindestens 88 Nukleotide, mindestens 89 Nukleotide, mindestens 90 Nukleotide, mindestens 91 Nukleotide, mindestens 92 Nukleotide, mindestens 93 Nukleotide, mindestens 94 Nukleotide, mindestens 95 Nukleotide, mindestens 96 Nukleotide, mindestens 97 Nukleotide, mindestens 98 Nukleotide, mindestens 99 Nukleotide, mindestens 100 Nukleotide, mindestens 101 Nukleotide, mindestens 102 Nukleotide, mindestens 103 Nukleotide, mindestens 104 Nukleotide, mindestens 105 Nukleotide, mindestens 106 Nukleotide, mindestens 107 Nukleotide, mindestens 108 Nukleotide, mindestens 109 Nukleotide oder mindestens 110 Nukleotide in Länge beträgt.
226. Der Satz von PEgRNAs nach Ausführungsform 224, wobei die Deletion mindestens 1 Nukleotid, mindestens 2 Nukleotide, mindestens 3 Nukleotide, mindestens 4 Nukleotide, mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide ist, mindestens 13 Nukleotide, mindestens 14 Nukleotide, mindestens 15 Nukleotide, mindestens 16 Nukleotide, mindestens 17 Nukleotide, mindestens 18 Nukleotide, mindestens 19 Nukleotide, mindestens 20 Nukleotide, mindestens 21 Nukleotide, mindestens 22 Nukleotide, mindestens 23 Nukleotide, mindestens 24 Nukleotide, mindestens 25 Nukleotide, mindestens 26 Nukleotide mindestens 27 Nukleotide, mindestens 28 Nukleotide, mindestens 29 Nukleotide, mindestens 30 Nukleotide, mindestens 31 Nukleotide, mindestens 32 Nukleotide, mindestens 33 Nukleotide, mindestens 34 Nukleotide, mindestens 35 Nukleotide, mindestens 36 Nukleotide, mindestens 37 Nukleotide, mindestens 38 Nukleotide, mindestens 39 Nukleotide, mindestens 40 Nukleotide mindestens 41 Nukleotide, mindestens 42 Nukleotide, mindestens 43 Nukleotide, mindestens 44 Nukleotide, mindestens 45 Nukleotide, mindestens 46 Nukleotide, mindestens 47 Nukleotide, mindestens 48 Nukleotide, mindestens 49 Nukleotide, mindestens 50 Nukleotide, mindestens 51 Nukleotide, mindestens 52 Nukleotide, mindestens 53 Nukleotide, mindestens 54 Nukleotide mindestens 55 Nukleotide, mindestens 56 Nukleotide, mindestens 57 Nukleotide, mindestens 58 Nukleotide, mindestens 59 Nukleotide, mindestens 60 Nukleotide, mindestens 61 Nukleotide, mindestens 62 Nukleotide, mindestens 63 Nukleotide, mindestens 64 Nukleotide, mindestens 65 Nukleotide, mindestens 66 Nukleotide, mindestens 67 Nukleotide, mindestens 68 Nukleotide, mindestens 69 Nukleotide, mindestens 70 Nukleotide, mindestens 71 Nukleotide, mindestens 72 Nukleotide, mindestens 73 Nukleotide, mindestens 74 Nukleotide, mindestens 75 Nukleotide, mindestens 76 Nukleotide, mindestens 77 Nukleotide, mindestens 78 Nukleotide, mindestens 79 Nukleotide, mindestens 80 Nukleotide, mindestens 81 Nukleotide, mindestens 82 Nukleotide mindestens 83 Nukleotide, mindestens 84 Nukleotide, mindestens 85 Nukleotide, mindestens 86 Nukleotide, mindestens 87 Nukleotide, mindestens 88 Nukleotide, mindestens 89 Nukleotide, mindestens 90 Nukleotide, mindestens 91 Nukleotide, mindestens 92 Nukleotide, mindestens 93 Nukleotide, mindestens 94 Nukleotide, mindestens 95 Nukleotide, mindestens 96 Nukleotide, mindestens 97 Nukleotide, mindestens 98 Nukleotide, mindestens 99 Nukleotide, mindestens 100 Nukleotide, mindestens 101 Nukleotide, mindestens 102 Nukleotide, mindestens 103 Nukleotide, mindestens 104 Nukleotide, mindestens 105 Nukleotide, mindestens 106 Nukleotide, mindestens 107 Nukleotide, mindestens 108 Nukleotide, mindestens 109 Nukleotide oder mindestens 110 Nukleotide oder mehr in Länge beträgt.
227. Der Satz von PEgRNAs nach Ausführungsform 224, wobei der Austausch mindestens 1 Nukleotid, mindestens 2 Nukleotide, mindestens 3 Nukleotide, mindestens 4 Nukleotide, mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide ist, mindestens 13 Nukleotide, mindestens 14 Nukleotide, mindestens 15 Nukleotide, mindestens 16 Nukleotide, mindestens 17 Nukleotide, mindestens 18 Nukleotide, mindestens 19 Nukleotide, mindestens 20 Nukleotide, mindestens 21 Nukleotide, mindestens 22 Nukleotide, mindestens 23 Nukleotide, mindestens 24 Nukleotide, mindestens 25 Nukleotide, mindestens 26 Nukleotide mindestens 27 Nukleotide, mindestens 28 Nukleotide, mindestens 29 Nukleotide, mindestens 30 Nukleotide, mindestens 31 Nukleotide, mindestens 32 Nukleotide, mindestens 33 Nukleotide, mindestens 34 Nukleotide, mindestens 35 Nukleotide, mindestens 36 Nukleotide, mindestens 37 Nukleotide, mindestens 38 Nukleotide, mindestens 39 Nukleotide, mindestens 40 Nukleotide mindestens 41 Nukleotide, mindestens 42 Nukleotide, mindestens 43 Nukleotide, mindestens 44 Nukleotide, mindestens 45 Nukleotide, mindestens 46 Nukleotide, mindestens 47 Nukleotide, mindestens 48 Nukleotide, mindestens 49 Nukleotide, mindestens 50 Nukleotide, mindestens 51 Nukleotide, mindestens 52 Nukleotide, mindestens 53 Nukleotide, mindestens 54 Nukleotide mindestens 55 Nukleotide, mindestens 56 Nukleotide, mindestens 57 Nukleotide, mindestens 58 Nukleotide, mindestens 59 Nukleotide, mindestens 60 Nukleotide, mindestens 61 Nukleotide, mindestens 62 Nukleotide, mindestens 63 Nukleotide, mindestens 64 Nukleotide, mindestens 65 Nukleotide, mindestens 66 Nukleotide, mindestens 67 Nukleotide, mindestens 68 Nukleotide, mindestens 69 Nukleotide, mindestens 70 Nukleotide, mindestens 71 Nukleotide, mindestens 72 Nukleotide, mindestens 73 Nukleotide, mindestens 74 Nukleotide, mindestens 75 Nukleotide, mindestens 76 Nukleotide, mindestens 77 Nukleotide, mindestens 78 Nukleotide, mindestens 79 Nukleotide, mindestens 80 Nukleotide, mindestens 81 Nukleotide, mindestens 82 Nukleotide mindestens 83 Nukleotide, mindestens 84 Nukleotide, mindestens 85 Nukleotide, mindestens 86 Nukleotide, mindestens 87 Nukleotide, mindestens 88 Nukleotide, mindestens 89 Nukleotide, mindestens 90 Nukleotide, mindestens 91 Nukleotide, mindestens 92 Nukleotide, mindestens 93 Nukleotide, mindestens 94 Nukleotide, mindestens 95 Nukleotide, mindestens 96 Nukleotide, mindestens 97 Nukleotide, mindestens 98 Nukleotide, mindestens 99 Nukleotide, mindestens 100 Nukleotide, mindestens 101 Nukleotide, mindestens 102 Nukleotide, mindestens 103 Nukleotide, mindestens 104 Nukleotide, mindestens 105 Nukleotide, mindestens 106 Nukleotide, mindestens 107 Nukleotide, mindestens 108 Nukleotide, mindestens 109 Nukleotide oder mindestens 110 Nukleotide oder mehr in Länge beträgt.
228. Ein Polynukleotid, das einen Satz von PEgRNAs nach einer der Ausführungsformen 221-227 kodiert.
229. Ein Vektor, der das Polynukleotid nach Ausführungsform 228 umfasst, um die Vielzahl von PEgRNAs in einer Zelle zu exprimieren.
230. Eine Zelle, umfassend den Vektor nach Ausführungsform 229.
231. Eine pharmazeutische Zusammensetzung, umfassend die Vielzahl von PEgRNAs aus einer der Ausführungsformen 221-227, einen Vektor aus Ausführungsform 229 oder eine Zelle aus Ausführungsform 230 und einen pharmazeutischen Hilfsstoff.
232. Ein Verfahren zum Modifizieren eines Genoms in einer Zelle, Folgendes umfassend:
- (i) Inkontaktbringen eines Genoms mit einem Dual-Flap-pegRNA-Editing-System, wobei das System einen ersten Prime-Editor/pegRNA-Komplex umfasst, der in der Lage ist, einen ersten 3'-Nukleinsäure-Flap an einer ersten Nickstelle an einem ersten Strang einer Zielstelle einzubauen, und einen zweiten Prime-Editor/pegRNA-Komplex, der in der Lage ist, einen zweiten 3'-Nukleinsäure-Flap an einer zweiten Nickstelle an einem zweiten Strang einer Zielstelle einzubauen, wobei der erste 3'-Nukleinsäure-Flap und der zweite 3'-Nukleinsäure-Flap revers komplementäre Sequenzen sind, die einen Duplex bilden, und wobei der Duplex eine erste Rekombinasestelle umfasst, und wobei die Zelle den Duplex, der die erste Rekombinasestelle umfasst, an der Zielstelle anstelle eines endogenen Duplex einbaut, der zwischen der ersten und der zweiten Nickstelle positioniert ist;
- (ii) Inkontaktbringen der ersten Rekombinasestelle mit einer Donor-Nukleinsäure, die eine zweite Rekombinasestelle umfasst; und
- (iii) Inkontaktbringen des Genoms mit einer Rekombinase, die zur Rekombination zwischen der ersten und der zweiten Rekombinasestelle fähig ist, wodurch die Donor-Nukleinsäure an der Zielstelle in das Genom integriert wird.

[9] Verfahren
Verfahren für Mulit-Flap-Prime-Editing
In einem Aspekt stellt die vorliegende Offenbarung Verfahren für gleichzeitiges Editieren eines ersten und eines zweiten komplementären Strangs einer doppelsträngigen DNA-Sequenz an einer Zielstelle bereit, wobei das Verfahren das Inkontaktbringen der doppelsträngigen DNA-Sequenz mit einem Paar von Prime-Editor-Komplexen umfasst, wobei das Paar Folgendes umfasst:

a. einen ersten Prime-Editor-Komplex, umfassend:
1. i. einen ersten Prime-Editor, umfassend ein erstes Nukleinsäure-programmierbares DNA- Bindeprotein (napDNAbp) und ein erstes Polypeptid, das eine RNA-abhängige DNA- Polymerase-Aktivität umfasst; und
2. ii. eine erste Prime-Editing-Leit-RNA (erste PEgRNA), die an eine erste Bindungsstelle auf dem ersten Strang der genomischen DNA-Sequenz stromaufwärts von der Zielstelle bindet;
b. einen zweiten Prime-Editor-Komplex, umfassend:
1. i. einen zweiten Prime-Editor, umfassend ein zweites Nukleinsäure-programmierbares DNA- Bindeprotein (zweites napDNAbp) und ein zweites Polypeptid, das eine RNA-abhängige DNA-Polymerase-Aktivität umfasst; und
2. ii. eine zweite Prime-Editing-Leit-RNA (zweite PEgRNA), die an eine zweite Bindungsstelle auf dem zweiten Strang der genomischen DNA-Sequenz stromabwärts der Zielstelle bindet; wobei der erste Prime-Editor-Komplex einen ersten Nick an einer Sequenz, die komplementär zu der ersten Bindungsstelle ist, und die anschließende Polymerisation einer ersten einzelsträngigen DNA-Sequenz, die ein 3'-Ende von dem verfügbaren 5'-Ende aufweist, das durch den ersten Nick gebildet wird, bewirkt; wobei der zweite Prime-Editor-Komplex einen zweiten Nick an einer Sequenz, die komplementär zu der zweiten Bindungsstelle ist, und die anschließende Polymerisation einer zweiten einzelsträngigen DNA-Sequenz, die ein 3'-Ende von dem verfügbaren 5'-Ende aufweist, das durch den zweiten Nick gebildet wird, bewirkt; wobei die erste einzelsträngige DNA-Sequenz und die zweite einzelsträngige DNA-Sequenz über mindestens eine Region der Komplementarität umgekehrt komplementär sind und einen Duplex bilden, der ein Editing umfasst; und wobei der Duplex den genickten ersten und zweiten komplementären Strang der doppelsträngigen DNA-Sequenz ersetzt.

In einem anderen Aspekt stellt die vorliegende Offenbarung Verfahren für gleichzeitiges Editieren erster und zweiter komplementärer Stränge einer doppelsträngigen DNA-Sequenz an einer Zielstelle bereit, wobei das Verfahren Inkontaktbringen der doppelsträngigen DNA-Sequenz mit einem Paar von Prime-Editor-Komplexen umfasst, wobei das Paar Folgendes umfasst:

(a) einen ersten Prime-Editor-Komplex, umfassend:
1. i. einen ersten Prime-Editor, umfassend ein erstes Nukleinsäure-programmierbares DNA- Bindungsprotein (erstes napDNAbp) und ein erstes Polypeptid, das eine RNA-abhängige DNA-Polymerase-Aktivität umfasst; und
2. ii. eine erste Prime-Editing-Leit-RNA (erste PEgRNA), die an eine erste Zielsequenz auf dem ersten Strang der genomischen DNA-Sequenz stromaufwärts der Zielstelle bindet;
(b) einen zweiten Prime-Editor-Komplex, umfassend:
1. i. einen zweiten Prime-Editor, umfassend ein zweites Nukleinsäure-programmierbares DNA- Bindeprotein (zweites napDNAbp) und ein zweites Polypeptid, das eine RNA-abhängige DNA-Polymerase-Aktivität umfasst; und
2. ii. eine zweite Prime-Editing-Leit-RNA (zweite PEgRNA), die an eine zweite Zielsequenz auf dem zweiten Strang der genomischen DNA-Sequenz stromaufwärts der Zielstelle bindet;
(c) einen dritten Prime-Editor-Komplex, umfassend:
1. i. einen dritten Prime-Editor, umfassend ein drittes Nukleinsäure-programmierbares DNA- Bindeprotein (drittes napDNAbp) und ein drittes Polypeptid, das eine RNA-abhängige DNA- Polymerase-Aktivität umfasst; und
2. ii. eine dritte Prime-Editing-Leit-RNA (dritte PEgRNA), die an eine erste Zielsequenz auf dem dritten Strang der genomischen DNA-Sequenz stromabwärts der Zielstelle bindet;
(d) einen vierten Prime-Editor-Komplex, umfassend:
1. i. einen vierten Prime-Editor, umfassend ein zweites Nukleinsäure-programmierbares DNA- Bindeprotein (viertes napDNAbp) und ein viertes Polypeptid, das eine RNA-abhängige DNA- Polymerase-Aktivität umfasst; und
2. ii. eine vierte Prime-Editing-Leit-RNA (vierte PEgRNA), die an eine zweite Zielsequenz auf dem vierten Strang der genomischen DNA-Sequenz stromabwärts der Zielstelle bindet; wobei der erste Prime-Editor-Komplex einen ersten Nick an der ersten Zielsequenz und die anschließende Polymerisation einer ersten einzelsträngigen DNA-Sequenz bewirkt, die ein 3'- Ende von dem verfügbaren 5'-Ende aufweist, das durch den ersten Nick gebildet wird; wobei der zweite Prime-Editor-Komplex einen zweiten Nick an der zweiten Zielsequenz und die anschließende Polymerisation einer zweiten einzelsträngigen DNA-Sequenz bewirkt, die ein 3'-Ende von dem verfügbaren 5'-Ende aufweist, das durch den zweiten Nick gebildet wird; wobei der dritte Prime-Editor-Komplex einen dritten Nick an der dritten Zielsequenz und die anschließende Polymerisation einer dritten einzelsträngigen DNA-Sequenz bewirkt, die ein 3'- Ende von dem verfügbaren 5'-Ende aufweist, das durch den dritten Nick gebildet wird; wobei der vierte Prime-Editor-Komplex einen vierten Nick an der vierten Zielsequenz und die anschließende Polymerisation einer vierten einzelsträngigen DNA-Sequenz bewirkt, die ein 3'- Ende von dem verfügbaren 5'-Ende aufweist, das durch den vierten Nick gebildet wird; wobei die erste einzelsträngige DNA-Sequenz und die zweite einzelsträngige DNA-Sequenz über mindestens eine Region der Komplementarität umgekehrt komplementär sind und einen Duplex bilden, wobei der Duplex die genickten ersten und zweiten komplementären Stränge der doppelsträngigen DNA-Sequenz ersetzt; und wobei die dritte einzelsträngige DNA-Sequenz und die vierte einzelsträngige DNA-Sequenz über mindestens eine Region der Komplementarität umgekehrt komplementär sind und einen Duplex bilden, wobei der Duplex die genickten ersten und zweiten komplementären Stränge der doppelsträngigen DNA-Sequenz ersetzt.

Diese Spezifikation beschreibt Mulit-Flap-Prime-Editing-Systeme (zum Beispiel ein Dual-Flap-Prime-Editing-System und ein Quadruple-Flap-Prime-Editing-System beinhaltend), die die mit der Flap-Equilibrierung und dem anschließenden Einbau des Edits in den nicht-editierten komplementären genomischen DNA-Strang verbundenen Herausforderungen durch gleichzeitiges Editieren beider DNA-Stränge lösen. Beim Dual- Flap-Prime-Editing werden zwei PEgRNAs verwendet, die auf entgegengesetzte Stränge einer genomischen Stelle abzielen und die Synthese von zwei komplementären 3'-Flaps ansteuern, die die editierte DNA-Sequenz enthalten (90). Im Quadruple-Flap-Prime-Editing-System werden vier PEgRNAs verwendet, die die Synthese von vier 3'-Flaps steuern, von denen zwei zueinander komplementär sind und die anderen beiden zueinander komplementär sind (95, 96A und 98A). Im Gegensatz zum klassischen Prime-Editing muss das Paar der editierten DNA-Stränge (3'-Flaps) nicht direkt mit den 5'-Flaps der endogenen genomischen DNA konkurrieren, da stattdessen der komplementäre editierte Strang für die Hybridisierung zur Verfügung steht. Da beide Stränge des Duplex als editierte DNA synthetisiert werden, erübrigt sich beim Multi-Flap-Prime-Editing der Austausch des nicht- editierten komplementären DNA-Strangs, der beim klassischen Prime-Editing erforderlich ist. Stattdessen muss die zelluläre DNA-Reparaturmaschinerie nur die gepaarten 5'-Flaps (ursprüngliche genomische DNA) herausschneiden und die gepaarten 3'-Flaps (editierte DNA) in den Locus ligieren. Daher müssen die neu synthetisierten DNA-Stränge keine Sequenzen enthalten, die mit der genomischen DNA homolog sind, was eine selektive Hybridisierung der neuen Stränge ermöglicht und ein Editieren mit minimaler genomischer Homologie erleichtert. Nuklease-aktive Versionen von Multi-Flap Prime-Editoren, die beide DNA-Stränge schneiden, könnten auch verwendet werden, um die Entfernung der ursprünglichen DNA-Sequenz zu beschleunigen.
Wie das klassische Prime-Editing ist das Multi-Flap-Prime-Editing ein vielseitiges und präzises Verfahren zum Genom-Editing, bei dem neue genetische Informationen direkt in eine bestimmte DNA-Stelle geschrieben werden, und zwar mit Hilfe eines programmierbaren DNA- Bindungsproteins („napDNAbp“), das mit einer Polymerase (d. h. in Form eines Fusionsproteins oder anderweitig in trans mit dem napDNAbp bereitgestellt), wobei das Prime- Editing-System mit einer Prime-Editing (PE)-Leit-RNA („PEgRNA“) programmiert ist, die sowohl die Zielstelle spezifiziert als auch die Synthese des gewünschten Edits in Form eines Austausch-DNA-Strangs mittels einer auf eine Leit-RNA (z. B. am 5'- oder 3'-Ende oder an einem internen Abschnitt einer Leit-RNA) aufgebrachten Verlängerung (entweder DNA oder RNA) als Templat bereitstellt. Der Austauschstrang, der den gewünschten Edit enthält (z. B. eine einzelne Nukleobasensubstitution), weist dieselbe Sequenz auf wie der endogene Strang der zu editierenden Zielstelle (mit der Ausnahme, dass er den gewünschten Edit beinhaltet). Durch die DNA-Reparatur- und/oder Replikationsmaschinerie wird der endogene Strang der Zielstelle durch den neu synthetisierten Austauschstrang ersetzt, der den gewünschten Edit enthält. In einigen Fällen kann das Prime-Editing als eine „Suchen-und-Ersetzen“-Technologie für das Genom-Editing angesehen werden, da die Dual-Prime-Editoren, wie hierin beschrieben, nicht nur die gewünschte zu editierende Zielstelle suchen und lokalisieren, sondern gleichzeitig einen Austauschstrang kodieren, der den gewünschten Edit enthält und anstelle des entsprechenden endogenen DNA-Strangs der Zielstelle eingebaut wird.
Beim Dual-Flap Prime-Editing wird eine doppelsträngige DNA-Sequenz an einer Zielstelle mit einem ersten und einem zweiten Prime-Editor-Komplex in Kontakt gebracht. Jeder Komplex umfasst ein Fusionsprotein und eine PEgRNA. In einigen Ausführungsformen umfasst jedes Fusionsprotein ein Nukleinsäure-programmierbares DNA-Bindungsprotein (napDNAbp) und ein Polypeptid mit einer RNA-abhängigen DNA-Polymerase-Aktivität (z. B. eine reverse Transkriptase), und jede PEgRNA weist eine Spacer-Sequenz, einen gRNA-Kern, ein DNA-Synthese-Templat und eine Primer-Bindungsstelle auf. Jedes DNA-Synthese- Templat kann eine einzelsträngige DNA-Sequenz kodieren, die einen editierten Abschnitt von einem oder mehreren Nukleotiden umfassen kann. Die beiden kodierten einzelsträngigen DNA-Sequenzen können komplementär zueinander sein und einen Duplex bilden, der in die zu editierende Zielstelle integriert werden kann. Die verschiedenen Elemente der Prime-Editor- Komplexe (z. B. Fusionsproteine, napDNAbp, Polymerase, PEgRNAs usw.) können jede beliebige der Ausführungsformen der hierin offengelegten Systeme umfassen.
Beim Quadruple-Flap Prime-Editing wird eine doppelsträngige DNA-Sequenz an einer Zielstelle mit einem ersten, einem zweiten, einem dritten und einem vierten Prime-Editor- Komplex in Kontakt gebracht. Jeder Komplex umfasst ein Fusionsprotein und eine PEgRNA. In einigen Ausführungsformen umfasst jedes Fusionsprotein ein Nukleinsäure- programmierbares DNA-Bindungsprotein (napDNAbp) und ein Polypeptid mit einer RNA- abhängigen DNA-Polymerase-Aktivität (z. B. eine reverse Transkriptase), und jede PEgRNA weist eine Spacer-Sequenz, einen gRNA-Kern, ein DNA-Synthese-Templat und eine Primer- Bindungsstelle auf. Jedes DNA-Synthese-Templat kodiert eine einzelsträngige DNA-Sequenz. Die beiden kodierten einzelsträngigen DNA-Sequenzen können komplementär zueinander sein und einen Duplex bilden, der in die zu editierende Zielstelle integriert werden kann. Die verschiedenen Elemente der Prime-Editor-Komplexe (z. B. Fusionsproteine, napDNAbp, Polymerase, PEgRNAs usw.) können jede der Ausführungsformen der hierin offengelegten Systeme umfassen.
Die hierin bereitgestellten Verfahren für Mulit-Flap-Prime-Editing können für zahlreiche Anwendungen genutzt werden. Zum Beispiel können sie verwendet werden, um die Inversion einer Ziel-DNA-Sequenz zu erleichtern. In dieser Anwendung befinden sich eine erste einzelsträngige DNA-Sequenz, die durch das DNA-Synthese-Templat der ersten PEgRNA kodiert wird, und eine zweite einzelsträngige DNA-Sequenz, die durch das DNA- Synthese-Templat der zweiten PEgRNA kodiert wird, an entgegengesetzten Enden einer Ziel- DNA-Sequenz, und eine dritte einzelsträngige DNA-Sequenz, die durch das DNA-Synthese- Templat der dritten PEgRNA kodiert wird, und befinden sich eine vierte einzelsträngige DNA- Sequenz, die durch das DNA-Synthese-Templat einer vierten PEgRNA kodiert wird, an entgegengesetzten Enden derselben Ziel-DNA-Sequenz.
In einigen Ausführungsformen umfassen die hierin bereitgestellten Verfahren zum Mulit-Flap-Prime-Editing ferner das Bereitstellen eines zirkulären DNA-Donors, von dem ein Teil an einer Zielstelle in eine doppelsträngige Nukleinsäure integriert werden kann. In dieser Anwendung befinden sich eine erste einzelsträngige DNA-Sequenz, die durch das DNA- Synthese-Templat der ersten PEgRNA kodiert wird, und eine dritte einzelsträngige DNA- Sequenz, die durch das DNA-Synthese-Templat der dritten PEgRNA kodiert wird, an entgegengesetzten Enden der Ziel-DNA-Sequenz, und befinden sich eine zweite einzelsträngige DNA-Sequenz, die durch das DNA-Synthese-Templat der zweiten PEgRNA kodiert wird, und eine vierte einzelsträngige DNA-Sequenz, die durch das DNA-Synthese- Templat der vierten PEgRNA kodiert wird, auf dem zirkulären DNA-Donor. Der Abschnitt des zirkulären DNA-Donors zwischen der zweiten einzelsträngigen DNA-Sequenz und der vierten einzelsträngigen DNA-Sequenz kann einen Duplex bilden, der die Ziel-DNA-Sequenz zwischen der ersten einzelsträngigen DNA-Sequenz und der dritten einzelsträngigen DNA- Sequenz ersetzt.
In einer anderen Anwendung ermöglichen die hierin bereitgestellten Verfahren zum Mulit-Flap-Prime-Editing die Translokation einer Ziel-DNA-Sequenz von einem ersten Nukleinsäuremolekül (z. B. einem ersten Chromosom) zu einem zweiten Nukleinsäuremolekül (z. B. einem zweiten Chromosom). In dieser Anwendung befinden sich eine erste einzelsträngige DNA-Sequenz, die durch das DNA-Synthese-Templat der ersten PEgRNA kodiert wird, und eine dritte einzelsträngige DNA-Sequenz, die durch das DNA-Synthese- Templat der dritten PEgRNA kodiert wird, auf einem ersten Nukleinsäuremolekül, und befinden sich eine zweite einzelsträngige DNA-Sequenz, die durch das DNA-Synthese- Templat der zweiten PEgRNA kodiert wird, und eine vierte einzelsträngige DNA-Sequenz, die durch das DNA-Synthese-Templat der vierten PEgRNA kodiert wird, auf einem zweiten Nukleinsäuremolekül. Der Abschnitt des ersten Nukleinsäuremoleküls zwischen der ersten einzelsträngigen DNA-Sequenz und der dritten einzelsträngigen DNA-Sequenz kann in das zweite Nukleinsäuremolekül eingebaut werden, und der Abschnitt des zweiten Nukleinsäuremoleküls zwischen der zweiten einzelsträngigen DNA-Sequenz und der vierten einzelsträngigen DNA-Sequenz wird in das erste Nukleinsäuremolekül eingebaut.
Andere Verfahren
Die vorliegende Offenbarung stellt Verfahren zur Behandlung eines Patienten bereit, bei dem eine Krankheit diagnostiziert wurde, die mit einer Punktmutation oder anderen Mutationen (z. B. Deletion, Insertion, Inversion, Duplikation usw.) assoziiert ist, die durch das hierin bereitgestellte Mulit-Flap-Prime-Editing-System korrigiert werden können, wie z. B. unter anderem die Prionenkrankheit (z. B. Beispiel 5 hierin), die Trinukleotid-Repeat- Expansionskrankheit (z. B. Beispiel 3 hierin) oder die CDKL5-Mangelerkrankung (CDD) (z. B. Beispiel 23 hierin).
Praktisch jeder krankheitsverursachende genetische Defekt kann durch Multi-Flap- Prime-Editing repariert werden, was die Auswahl eines geeigneten Prime-Editor- Fusionsproteins (einschließlich eines napDNAbp und einer Polymerase (z. B. einer reversen Transkriptase) und das Ausgestalten einer geeigneten PEgRNA beinhaltet, die dazu ausgestaltet ist, (a) auf die geeignete, eine Editstelle enthaltende Ziel-DNA abzuzielen und (b) ein Templat für die Synthese eines DNA-Einzelstrangs vom 3'-Ende der die gewünschte Editstelle beinhaltenden Nickstelle bereitzustellen, die den endogenen Strang sofort stromabwärts der Nickstelle verdrängt und ersetzt. Multi-Flap-Prime-Editing kann ohne Einschränkung verwendet werden, um (a) mutationskorrigierende Änderungen an einer Nukleotidsequenz einzubauen, (b) Protein- und RNA-Tags einzubauen, (c) Immunepitope auf Proteinen von Interesse einzubauen, (d) induzierbare Dimerisierungsdomänen in Proteine einzubauen, (e) Sequenzen einzubauen oder zu entfernen, um diese Aktivität eines Biomoleküls zu verändern, (f) Rekombinase-Zielstellen einzubauen, um spezifische genetische Veränderungen zu steuern, und (g) zur Mutagenese einer Zielsequenz unter Verwendung einer fehleranfälligen RT.
Das Verfahren zur Behandlung einer Störung kann in einem frühen Schritt die Ausgestaltung einer geeigneten PEgRNA und eines geeigneten Prime-Editor-Fusionsproteins gemäß den hierin beschriebenen Verfahren beinhalten, die eine Reihe von Überlegungen beinhalten, die berücksichtigt werden können, wie zum Beispiel:

(a) die Zielsequenz, d. h. die Nukleotidsequenz, in der eine oder mehrere Nukleobasenmodifikationen durch den Prime-Editor eingebaut werden sollen;
(b) die Position der Schnittstelle innerhalb der Zielsequenz, d. h. die spezifische Nukleobasenposition, an der der Prime-Editor einen Single-Stand-Nick induziert, um eine 3'- Ende-RT-Primersequenz auf einer Seite des Nicks und den 5'-Ende-endogenen Flap auf der anderen Seite des Nicks zu erzeugen (der schließlich durch FEN1 oder ein Äquivalent dazu entfernt und durch den 3'-ssDNA-Flap ersetzt wird. Die Schnittstelle erzeugt die 3'-End- Primersequenz, die während der RNA-abhängigen DNA-Polymerisation durch die Polymerase des PE-Fusionsproteins (z. B. ein RT-Enzym) verlängert wird, um den 3'-ssDNA-Flap mit dem gewünschten Edit zu erzeugen, der dann den 5'-endogenen DNA-Flap in der Zielsequenz erzeugt.
(c) die verfügbaren PAM-Sequenzen (einschließlich der kanonischen SpCas9-PAM-Stellen sowie nicht-kanonischer PAM-Stellen, die von Cas9-Varianten und Äquivalenten mit erweiterten oder unterschiedlichen PAM-Spezifitäten erkannt werden);
(d) den Abstand zwischen den verfügbaren PAM-Sequenzen und die Lage der Schnittstelle im PAM-Strang;
(e) das jeweilige Cas9, die Cas9-Variante oder das Cas9-Äquivalent des zur Verwendung verfügbaren Prime-Editors (was teilweise durch das verfügbare PAM diktiert wird);
(f) die Sequenz und Länge der Primer-Bindungsstelle;
(g) die Reihenfolge und Länge des Edit-Templats;
(h) die Sequenz und Länge des Homologiearms;
(i) die Spacer-Sequenz und -Länge; und
(j) die gRNA-Kernsequenz.

Eine geeignete PEgRNA und optional ein Nicking-sgRNA-Ausgestaltungs-Guide für Zweitstellen-Nicking kann mit Hilfe der folgenden beispielhaften Schritt-für-Schritt-Anleitung ausgestaltet werden, die eine oder mehrere der obigen Überlegungen berücksichtigt. Die Schritte beziehen sich auf die in den 70A-70I gezeigten Beispiele.

1. Definieren der Zielsequenz und des Edits. Man rufe die Sequenz der Ziel-DNA- Region (-200 bp) ab, die um den Ort des gewünschten Edits (Punktmutation, Insertion, Deletion oder Kombination davon) zentriert ist. Siehe 70A.
2. Lokalisieren der Ziel-PAMs. Man identifiziere die PAMs in der Nähe der gewünschten Edit-Ortes. PAMs können auf jedem DNA-Strang in der Nähe des gewünschten Edit-Ortes identifiziert werden. Während PAMs in der Nähe der Edit-Position bevorzugt werden (d. h. bei denen die Nickstelle weniger als 30 nt von der Edit-Position entfernt ist oder weniger als 29 nt, 28 nt, 27 nt, 26 nt, 25 nt, 24 nt, 23 nt, 22 nt, 21 nt, 20 nt, 19 nt, 18 nt, 17 nt, 16 nt, 15 nt, 14 nt, 13 nt, 12 nt, 11 nt, 10 nt, 9 nt, 8 nt, 7 nt, 6 nt, 5 nt, 4 nt, 3 nt oder 2 nt von der Edit-Position zur Nickstelle), ist es möglich, Edits mit Protospacern und PAMs einzubauen, die den Nick ≥ 30 nt von der Edit-Position entfernt platzieren. Siehe 70B.
3. Lokalisieren der Nickstellen. Für jede in Betracht gezogene PAMM identifiziere man die entsprechende Nickstelle und auf welchem Strang. Für Sp-Cas9-H840A-Nickase erfolgt die Spaltung im PAM enthaltenden Strang zwischen der 3. und 4. Base 5' zur NGG PAM. Alle editierten Nukleotide müssen 3' von der Nickstelle existieren, daher müssen geeignete PAMs den Nick 5' zum Ziel-Edit auf dem PAM-enthaltenden Strang platzieren. Im unten gezeigten Beispiel gibt es zwei mögliche PAMs. Der Einfachheit halber demonstrieren die verbleibenden Schritte die Ausgestaltung einer PEgRNA, die nur PAM 1 verwendet. Siehe 70C.
4. Ausgestalten der Spacer-Sequenz. Der Protospacer von SpCas9 entspricht den 20 Nukleotiden 5' zum NGG-PAM auf dem PAM-enthaltenden Strang. Eine effiziente Pol-III- Transkriptionsinitiation erfordert, dass das erste transkribierte Nukleotid ein G ist. Wenn das erste Nukleotid des Protospacers ein G ist, ist die Spacer-Sequenz für die PEgRNA einfach die Protospacersequenz. Wenn das erste Nukleotid des Protospacers kein G ist, ist die Spacer- Sequenz der PEgRNA G gefolgt von der Protospacersequenz. Siehe 70D.
5. Ausgestalten einer Primer-Bindungsstelle (PBS). Man identifiziere das DNA- Primers auf dem PAM-enthaltenden Strang mithilfe der Allel-Startsequenz. Das 3'-Ende des DNA-Primers ist das Nukleotid direkt stromaufwärts der Nickstelle (d. h. die 4. Base 5' von der NGG-PAM für Sp-Cas9). Als allgemeines Ausgestaltungsprinzip für die Verwendung mit PE2 und PE3 kann eine PEgRNA-Primer-Bindungsstelle (PBS) mit 12 bis 13 Nukleotiden komplementär zum DNA-Primer für Sequenzen verwendet werden, die -40-60 % GC-Gehalt enthalten. Bei Sequenzen mit geringem GC-Gehalt sollten längere (14- bis 15-nt)-PBSs getestet werden. Bei Sequenzen mit höherem GC-Gehalt sollten kürzere (8- bis 11-nt)-PBSs getestet werden. Optimale PBS-Sequenzen sollten unabhängig vom GC-Gehalt empirisch bestimmt werden. Um eine PBS-Sequenz der Länger auszugestalten, nehme man das reverse Komplement der ersten p-Nukleotide 5' von der Nickstelle in dem PAM-enthaltenden Strang unter Verwendung der Allel-Startsequenz. Siehe 70E.
6. Ausgestalten eines RT-Templats (oder DNA-Synthese-Templats). Das RT-Templat (oder DNA-Synthese-Templat, bei der die Polymerase keine Reverse Transkriptase ist) kodiert das ausgestaltete Edit und die Homologie zu der Sequenz neben dem Edit. In einer Ausführungsform entsprechen diese Regionen dem DNA-Synthese-Templat von 3D und 3E, wobei das DNA-Synthese-Templat das „Edit-Templat“ und den „Homologiearm“ umfasst. Die optimale Länge des RT-Templats variiert je nach Zielstelle. Für Short-Range- Edits (Positionen +1 bis +6) wird empfohlen, ein kurzes (9 bis 12 nt), ein mittleres (13 bis 16 nt) und ein langes (17 bis 20 nt) RT-Template zu testen. Für Long-Range-Edits (Positionen +7 und darüber hinaus) wird empfohlen, RT-Template zu verwenden, die sich mindestens 5 nt (vorzugsweise 10 oder mehr nt) über die Position des Edits hinaus erstrecken, um eine ausreichende 3'-DNA-Flap-Homologie zu ermöglichen. Für Long-Range-Edits sollten mehrere RT-Template überprüft werden, um funktionale Ausgestaltungen zu identifizieren. Für größere Insertionen und Deletionen (≥5 nt) wird der Einbau einer größeren 3'-Homologie (-20 nt oder mehr) in das RT-Templat empfohlen. Die Editing-Effizienz wird typischerweise beeinträchtigt, wenn das RT-Templat die Synthese eines G als letztes Nukleotid im revers transkribierten DNA-Produkt kodiert (entsprechend einem C im RT-Templat der PEgRNA). Da viele RT- Template ein effizientes Prime-Editing unterstützen, wird bei der Ausgestaltung von RT- Templaten empfohlen, G als das endgültig synthetisierte Nukleotid zu vermeiden. Um eine RT- Templat-Sequenz der Länge r auszugestalten, verwende man die gewünschte Allelsequenz und nehme man das reverse Komplement der ersten r-Nukleotide 3' von der Nickstelle in dem Strang, der ursprünglich die PAM enthielt. Man beachte, dass im Vergleich zu SNP-Edits Insertions- oder Deletions-Edits unter Verwendung von RT-Templaten derselben Länge keine identische Homologie enthalten. Siehe 70F.
7. Zusammenbauen der vollständigen PEgRNA-Sequenz. Man verkette die PEgRNA- Komponenten in der folgenden Reihenfolge (5' bis 3'): Spacer, Gerüst, RT-Template und PBS. Siehe 70G.
8. Ausgestalten von Nicking-sgRNAs für PE3. Man identifiziere PAMs auf dem nicht- editierten Strang stromaufwärts und stromabwärts des Edits. Optimale Nicking-Positionen sind stark ortsabhängig und sollten empirisch bestimmt werden. Im Allgemeinen führen Nicks, die 40 bis 90 Nukleotide 5' von der Position gegenüber dem PEgRNA-induzierten Nick platziert werden, zu höheren Editing-Ausbeuten und weniger Indels. Eine Nicking-sgRNA hat eine Spacer-Sequenz, die mit dem 20-nt-Protospacer im Startallel übereinstimmt, mit dem Zusatz eines 5'-G, wenn der Protospacer nicht mit einem G beginnt. Siehe 70H.
9. Ausgestalten von PE3b Nicking-sgRNAs. Wenn eine PAM im komplementären Strang existiert und ihr entsprechender Protospacer mit der für das Editing anvisierten Sequenz überlappt, könnte dieses Edit ein Kandidat für das PE3b-System sein. Im PE3b-System stimmt die Spacer-Sequenz der Nicking-sgRNA mit der Sequenz des gewünschten editierten Allels überein, jedoch nicht mit dem Startallel. Das PE3b-System arbeitet effizient, wenn das (die) editierte(n) Nukleotid(e) in die Saatregion (~10 nt neben der PAM) des Nicking-sgRNA- Protospacers fällt. Dies verhindert das Nicken des komplementären Strangs bis nach dem Einbau des editierten Strangs, wodurch Konkurrenz zwischen der PEgRNA und der sgRNA um die Bindung der Ziel-DNA verhindert wird. PE3b vermeidet auch die Erzeugung simultaner Nicks auf beiden Strängen, wodurch die Informationsbildung erheblich reduziert wird, während eine hohe Editing-Effizienz beibehalten wird. PE3b-sgRNAs sollten eine Spacer- Sequenz aufweisen, die mit dem 20-nt-Protospacer im gewünschten Allel übereinstimmt, gegebenenfalls unter Hinzufügung eines 5'-G. Siehe 70I.

Das obige schrittweise Verfahren zum Ausgestalten einer geeigneten PEgRNA und einer Zweitstellen-Nicking-sgRNA soll in keiner Weise einschränkend sein. Die Offenbarung sieht Variationen des oben beschriebenen Schritt-für-Schritt-Verfahrens vor, die von einem Durchschnittsfachmann daraus abgeleitet werden können.
Sobald eine geeignete PEgRNA und ein geeignetes PE-Fusionsprotein ausgewählt/ausgestaltet sind, können sie durch eine geeignete Methodik eingeschleust werden, wie etwa durch vektorbasierte Transfektion (bei der ein oder mehrere Vektoren, die DNA umfassen, die für die PEgRNA und das PE-Fusionsprotein kodiert und innerhalb einer Zelle nach Transfektion mit den Vektoren exprimiert werden), direkte Einschleusung des mit der PEgRNA komplexierten PE-Fusionsproteins (z. B. RNP-Verabreichung) in einem Einschleusungsformat (z. B. Lipidpartikel, Nanopartikel) oder durch ein mRNA-basiertes Einschleusungssystem. Solche Verfahren werden hierin in der vorliegenden Offenbarung beschrieben und jedes bekannte Verfahren kann verwendet werden.
Die PEgRNA und das PE-Fusionsprotein (oder zusammen als PE-Komplex bezeichnet) können in einer therapeutisch wirksamen Menge in eine Zelle eingeschleust werden, so dass bei Kontakt mit der Ziel-DNA von Interesse das gewünschte Edit darin eingebaut wird.
Es ist vorstellbar, dass jede Krankheit durch solche Verfahren behandelbar ist, solange die Einschleusung in die geeigneten Zellen durchführbar ist. Der Durchschnittsfachmann wird in der Lage sein, eine PE-Einschleusungsmethodik zu wählen und/oder zu selektieren, die dem beabsichtigten Zweck und den beabsichtigten Ziel-Zellen entspricht.
Beispielsweise wird in einigen Ausführungsformen ein Verfahren bereitgestellt, das die Verabreichung einer wirksamen Menge des hierin beschriebenen Multi-Flap Prime-Editing- Systems, das die Punktmutation korrigiert, an einen Patienten mit einer solchen Krankheit umfasst, z. B. einen Krebs, der mit einer Punktmutation wie oben beschrieben verbunden ist, oder eine desaktivierende Mutation in ein krankheitsassoziiertes Gen einführt, wie durch homologiegerichtete Reparatur in Gegenwart eines Donor-DNA-Moleküls, das die gewünschte genetische Veränderung umfasst, vermittelt wird. In einigen Ausführungsformen wird ein Verfahren bereitgestellt, das die Verabreichung einer wirksamen Menge des hierin beschriebenen Mulit-Flap-Prime-Editing-Systems, das die Punktmutation korrigiert oder eine deaktivierende Mutation in ein krankheitsassoziiertes Gen einführt, an einen Patienten mit einer solchen Krankheit umfasst, z. B. einen Krebs, der mit einer Punktmutation wie oben beschrieben verbunden ist. In einigen Ausführungsformen ist die Krankheit eine proliferative Krankheit. In einigen Ausführungsformen ist die Krankheit eine genetische Krankheit. In einigen Ausführungsformen ist die Krankheit eine neoplastische Krankheit. In einigen Ausführungsformen ist die Krankheit eine metabolische Krankheit. In einigen Ausführungsformen ist die Krankheit eine lysosomale Speicherkrankheit. Andere Krankheiten, die durch Korrigieren einer Punktmutation oder Einführen einer deaktivierenden Mutation in ein krankheitsassoziiertes Gen behandelt werden können, sind dem Fachmann bekannt und die Offenbarung ist diesbezüglich nicht beschränkt.
Die vorliegende Offenbarung stellt Verfahren zur Behandlung zusätzlicher Krankheiten oder Störungen bereit, z. B. Krankheiten oder Störungen, die mit einer Punktmutation assoziiert sind oder dadurch verursacht werden, die durch TPRT-vermitteltes Gen-Editing korrigiert werden können. Einige dieser Krankheiten werden hierin beschrieben, und zusätzliche geeignete Krankheiten, die mit den hierin bereitgestellten Strategien und Fusionsproteinen behandelt werden können, werden Fachleuten auf der Grundlage der vorliegenden Offenbarung offensichtlich sein. Beispielhafte geeignete Krankheiten und Störungen sind unten aufgeführt. Es versteht sich, dass die Numerierung der spezifischen Positionen oder Reste in den jeweiligen Sequenzen von dem jeweiligen verwendeten Protein und Numerierungsschema abhängt. Die Nummerierung kann unterschiedlich sein, z. B. bei Vorläufern eines reifen Proteins und dem reifen Protein selbst, und Unterschiede in den Sequenzen von Spezies zu Spezies können die Nummerierung beeinflussen. Ein Fachmann wird in der Lage sein, den jeweiligen Rest in jedem homologen Protein und in der jeweiligen kodierenden Nukleinsäure durch im Fachgebiet wohlbekannte Verfahren zu identifizieren, z. B. durch Sequenz-Alignment und Bestimmung von homologen Resten. Beispielhafte geeignete Krankheiten und Störungen umfassen ohne Einschränkung: 2-Methyl-3- Hydroxybuttersäureurie; 3-Beta-Hydroxysteroid-Dehydrogenase-Mangel; 3- Methylglutaconsäureurie; 3-Oxo-5-Alpha-Steroid-Delta-4-Dehydrogenase-Mangel; 46,XY- Geschlechtsumkehr, Typ 1, 3 und 5; 5-Oxoprolinase-Mangel; 6-Pyruvoyl-Tetrahydropterin- Synthase-Mangel; Aarskog-Syndrom; Aase-Syndrom; Achondrogenese Typ 2; Achromatopsie 2 und 7; Erworbenes Long-QT-Syndrom; Akrokallosales Syndrom, Schinzel-Typ; Akrokapitofemorale Dysplasie; Akrodysostose 2, mit oder ohne Hormonresistenz; Akroerythrokeratodermie; Akromikrische Dysplasie; Acth-unabhängige makronoduläre Nebennierenhyperplasie 2; Aktiviertes PI3K-Delta-Syndrom; Akute intermittierende Porphyrie; Mangel an Acyl-CoA-Dehydrogenase-Familie, Mitglied 9; Adams-Oliver- Syndrom 5 und 6; Adenin-Phosphoribosyltransferase-Mangel; Adenylatkinase-Mangel; hämolytische Anämie aufgrund von Adenylosuccinat-Lyase-Mangel; jugendliche Nephronophthise; renal-hepatisch-pankreatische Dysplasie; Meckel-Syndrom Typ 7; Adrenoleukodystrophie; junktionale Epidermolysis bullosa im Erwachsenenalter; Epidermolysis bullosa junctionalis, Variante localisata; Neuronale Ceroidlipofuszinose im Erwachsenenalter; Neuronale Ceroidlipofuszinose im Erwachsenenalter; Ataxie im Erwachsenenalter mit okulomotorischer Apraxie; ADULT-Syndrom; Afibrinogenämie und kongenitale Afibrinogenämie; autosomal rezessive Agammaglobulinämie 2; altersbedingte Makuladegeneration 3, 6, 11 und 12; Aicardi-Goutieres-Syndrome 1, 4 und 5; Chilbain-Lupus 1; Alagille-Syndrome 1 und 2; Alexander-Krankheit; Alkaptonurie; Allan-Hemdon-Dudley- Syndrom; Kongenitale Alopecia universalis; Alpers-Enzephalopathie; Alpha-1-Antitrypsin- Mangel; autosomal dominante, autosomal rezessive und X-chromosomal rezessive Alport- Syndrome; Alzheimer-Krankheit, familiär, 3, mit spastischer Paraparese und Apraxie; Alzheimer-Krankheit, Typen, 1, 3 und 4; Hypokalzifizierungstyp und Hypomaturationstyp, IIA1 Amelogenesis imperfecta; Aminoacylase-1-Mangel; Amish infantile epilepsy syndrome; Amyloidogene Transthyretin-Amyloidose; Amyloid-Kardiomyopathie, Transthyretinbezogen; Kardiomyopathie; Amyotrophe Lateralsklerose Typ 1, 6, 15 (mit oder ohne frontotemporaler Demenz), 22 (mit oder ohne Frontotemporaler Demenz) und 10; Frontotemporale Demenz mit TDP43-Einschlüssen, TARDBP-bezogen; Andermann- Syndrom; Andersen-Tawil-Syndrom; Kongenitales Long-QT-Syndrom; Anämie, nichtsphärozytäre hämolytische, aufgrund von G6PD-Mangel; Angelman-Syndrom; Schwere neonatale Enzephalopathie mit Mikrozephalie; Anfälligkeit für Autismus, X-chromosomal 3; Angiopathie, erblich, mit Nephropathie, Aneurysmen und Muskelkrämpfen; Angiotensin i- konvertierendes Enzym, gutartige Serumerhöhung; Aniridie, zerebelläre Ataxie und geistige Retardierung; Anonychie; Antithrombin-III-Mangel; Antley-Bixler-Syndrom mit genitalen Anomalien und gestörter Steroidogenese; Aortenaneurysma, familiäres thorakales 4, 6 und 9; Thorakale Aortenaneurysmen und Aortendissektionen; Multisystemisches Syndrom der Dysfunktion der glatten Muskulatur; Moyamoya-Krankheit 5; Aplastische Anämie; Offensichtlicher Mineralokortikoidüberschuss; Arginase-Mangel; Argininosuccinat-Lyase- Mangel; Aromatase-Mangel; Arrhythmogene rechtsventrikuläre Kardiomyopathie Typ 5, 8 und 10; Primäre familiäre hypertrophe Kardiomyopathie; Arthrogryposis multiplex congenita, distal, X-chromosomal; Arthrogrypose-Nierenfunktionsstörung-Cholestase-Syndrom; Arthrogrypose, Nierenfunktionsstörung und Cholestase 2; Asparagin-Synthetase-Mangel; Abnormalität der neuronalen Migration; Ataxie mit Vitamin-E-Mangel; Ataxie, sensorisch, autosomal-dominant; Ataxie-Telangiektasie-Syndrom; Hereditäres Krebs-prädisponierendes Syndrom; Atransferrinämie; Vorhofflimmern, familiär, 11, 12, 13 und 16; Vorhofseptumdefekte 2, 4 und 7 (mit oder ohne atrioventrikuläre Erregungsleitungsstörungen); Vorhofstillstand 2; Atrioventrikulärer Septumdefekt 4; Atrophia bulborum hereditaria; ATR- X-Syndrom; Auriculocondylar-Syndrom 2; Autoimmunerkrankung, Multisystem, mit Beginn im Kindesalter; Autoimmunes lymphoproliferatives Syndrom, Typ 1a; Autosomal dominante hypohidrotische ektodermale Dysplasie; Autosomal dominante progressive externe Ophthalmoplegie mit mitochondrialen DNA-Deletionen 1 und 3; Autosomal dominante Torsionsdystonie 4; Autosomal rezessive zentronukleäre Myopathie; Autosomal rezessive kongenitale Ichthyose 1, 2, 3, 4A und 4B; Autosomal rezessive Cutis Laxa Typ IA und 1B; Autosomal rezessives hypohidrotisches ektodermales Dysplasie-Syndrom; Ektodermale Dysplasie 11b; Hypohidrotischer/Haar/Zahn-Typ, autosomal rezessiv; Autosomal rezessive hypophosphatämische Knochenkrankheit; Axenfeld-Rieger-Syndrom Typ 3; Bainbridge- Ropers-Syndrom; Bannayan-Riley-Ruvalcaba-Syndrom; PTEN-Hamartom-Tumorsyndrom; Baraitser-Winter-Syndrome 1 und 2; Barakat-Syndrom; Bardet-Biedl-Syndrome 1, 11, 16 und 19; Bare-Lymphozyten-Syndrom Typ 2, Komplementgruppe E; Bartter-Syndrom vorgeburtlicher Typ 2; Bartter-Syndrom Typ 3, 3 mit Hypocalciurie und 4; Basalganglienverkalkung, idiopathisch, 4; Spindelhaare; gutartige familiäre Hämaturie; gutartige familiäre neonatale Anfälle 1 und 2; Anfälle, gutartige familiäre neonatale, 1, und/oder Myokymie; Anfälle, frühkindliche epileptische Enzephalopathie 7; gutartige familiäre neonatale-infantile Anfälle; Benigne hereditäre Chorea; Benigne skapuloperoneale Muskeldystrophie mit Kardiomyopathie; Bernard-Soulier-Syndrom, Typ A1 und A2 (autosomal dominant); Bestrophinopathie, autosomal rezessiv; Beta-Thalassämie; Bethlem- Myopathie und Bethlem-Myopathie 2; Bietti kristalline korneoretinale Dystrophie; Gallensäure-Synthesedefekt, kongenital, 2; Biotinidase-Mangel; Birk-Barel-Syndrom der mentalen Retardierung; Blepharophimose, Ptosis und Epikanthus inversus; Bloom-Syndrom; Borjeson-Forssman-Lehmann-Syndrom; Boucher-Neuhauser-Syndrom; Brachydaktylie Typ A1 und A2; Brachydaktylie mit Bluthochdruck; Erkrankung der kleinen Hirngefäße mit Blutungen; Mangel an verzweigtkettiger Keto-Säure-Dehydrogenase-Kinase; Branchiootische Syndrome 2 und 3; Brustkrebs, frühes Auftreten; Brust- und Eierstockkrebs, familiäres 1, 2 und 4; Hornhautbrüchigkeitssyndrom 2; Brody-Myopathie; Bronchiektasie mit oder ohne erhöhtem Schweißchlorid 3; Brown-Vialetto-Van Laere-Syndrom und Brown-Vialetto-Van Laere-Syndrom 2; Brugada-Syndrom; Brugada-Syndrom 1; Kammerflimmern; Paroxysmales familiäres Kammerflimmern; Brugada-Syndrom und Brugada-Syndrom 4; Langes QT- Syndrom; Plötzlicher Herztod; Stieraugen-Makuladystrophie; Stargardt-Krankheit 4; Zapfen- Stäbchen-Dystrophie 12; Bulöse ichthyosiforme Erythrodermie; Burn-Mckeown-Syndrom; Candidiasis, familiär, 2, 5, 6 und 8; Kohlenhydratdefizit-Glykoprotein-Syndrom Typ I und II; Kohlensäureanhydrase-VA-Mangel, Hyperammonämie aufgrund von; Kolonkarzinom; Herzrhythmusstörungen; Long-QT-Syndrom, LQT1-Subtyp; Kardioenzephalomyopathie, tödlich infantil, aufgrund von Cytochrom-c-Oxidase-Mangel; kardiofaziokutanes Syndrom; Kardiomyopathie; Danon-Krankheit; hypertrophe Kardiomyopathie; Linksventrikuläre Nichtkompaktions-Kardiomyopathie; Carnevale-Syndrom; Carney-Komplex, Typ 1; Carnitin- Acylcamitin-Translokase-Mangel; Carnitin-Palmitoyltransferase I, II, II (spät einsetzender) und II (kindlicher) Mangel; Katarakt 1, 4, autosomal-dominant, autosomal-dominant, multiple Typen, mit Mikrokornea, kupferartig, juvenil, mit Mikrokornea und Glukosurie, und nukleär diffus, nicht-progressiv; katecholaminerge polymorphe ventrikuläre Tachykardie; kaudales Regressionssyndrom; Cd8-Mangel, familiär; Zentrale Kernkrankheit; zentromerische Instabilität der Chromosomen 1, 9 und 16 und Immunschwäche; zerebelläre Ataxie infantil mit progressiver externer Ophthalmoplegie und zerebelläre Ataxie, geistige Retardierung und Dysequilibrium-Syndrom 2; Zerebrale Amyloid-Angiopathie, APP-bezogen; zerebrale autosomal dominante und rezessive Arteriopathie mit subkortikalen Infarkten und Leukoenzephalopathie; zerebrale kavernöse Malformationen 2; zerebro-okulofazioskeletales Syndrom 2; zerebro-okulo-fazioskeletales Syndrom; Zerebroretinale Mikroangiopathie mit Verkalkungen und Zysten; Ceroidlipofuszinose neuronal 2, 6, 7 und 10; Ch\xc3\xa9diak- Higashi-Syndrom , Chediak-Higashi-Syndrom, Erwachsenentyp; Charcot-Marie-Tooth- Krankheit Typ 1B, 2B2, 2C, 2F, 21, 2U (axonal), 1C (demyelinisierend), dominant intermediär C, rezessiv intermediär A, 2A2, 4C, 4D, 4H, IF, IVF und X; Skapuloperoneale spinale Muskelatrophie; Distale spinale Muskelatrophie, kongenital nicht-progressiv; Spinale Muskelatrophie, distal, autosomal rezessiv, 5; CHARGE-Assoziation; Hypophosphatasie im Kindesalter; Hypophosphatasie im Erwachsenenalter; Cholezystitis; Progressive familiäre intrahepatische Cholestase 3; Cholestase, intrahepatisch, in der Schwangerschaft 3; Cholesterinspeicherkrankheit; Cholesterinmonooxygenasemangel (Seitenkettenspaltung); Chondrodysplasie Blomstrand-Typ; Chondrodysplasia punctata 1, X-chromosomal rezessiv und 2 X-chromosomal dominant; CHOPS-Syndrom; Chronische granulomatöse Erkrankung, autosomal rezessiv, Cytochrom b-positiv, Typ 1 und 2; Chudley-McCullough-Syndrom; Ziliardyskinesie, primär, 7, 11, 15, 20 und 22; Citrullinämie Typ I; Citrullinämie Typ I und II; Cleidocraniale Dysostose; C-like-Syndrom; Cockayne-Syndrom Typ A; Coenzym-Q10- Mangel, primär 1, 4 und 7; Coffin Siris/Intellektuelle Behinderung; Coffin-Lowry-Syndrom; Cohen-Syndrom, ; Kälteinduziertes Schwitzsyndrom 1; COLE-CARPENTER-SYNDROM 2; Kombinierte zelluläre und humorale Immundefekte mit Granulomen; Kombinierte d-2- und 1- 2-Hydroxyglutarsäureurie; Kombinierte Malon- und Methylmalonsäureurie; Kombinierte oxidative Phosphorylierungsdefekte 1, 3, 4, 12, 15 und 25; Kombinierter partieller und vollständiger 17-alpha-Hydroxylase/17,20-Lyase-Mangel; Allgemeiner variabler Immundefekt 9; Komplementkomponente 4, partieller Mangel aufgrund eines dysfunktionalen c1-Inhibitors; Komplementfaktor-B-Mangel; Zapfen-Monochromatismus; Zapfen-Stäbchen- Dystrophie 2 und 6; Zapfen-Stäbchen-Dystrophie Amelogenesis imperfecta; kongenitale Nebennierenhyperplasie und kongenitale Nebennierenhypoplasie, X-chromosomal; Kongenitale amegakaryozytäre Thrombozytopenie; kongenitale Aniridie; kongenitale zentrale Hypoventilation; Morbus Hirschsprung 3; kongenitale kontraktale Arachnodaktylie; kongenitale Kontrakturen der Gliedmaßen und des Gesichts, Hypotonie und Entwicklungsverzögerung; Kongenitale Glykosylierungsstörung Typ 1B, 1D, 1G, 1H, 1J, 1K, 1N, 1P, 2C, 2J, 2K, IIm; kongenitale dyserythropoetische Anämie, Typ I und II; kongenitale ektodermale Dysplasie des Gesichts; kongenitale erythropoetische Porphyrie; kongenitale generalisierte Lipodystrophie Typ 2; Kongenitale Herzerkrankung, mehrere Typen, 2; Kongenitale Herzerkrankung; Unterbrochener Aortenbogen; Kongenitale lipomatöse Überwucherung, vaskuläre Fehlbildungen und epidermale Nävi; Nicht-kleinzelliger Lungenkrebs; Neoplasma des Eierstocks; Herzleitungsstörung, unspezifisch; Kongenitale mikrovillöse Atrophie; Kongenitale Muskeldystrophie; Kongenitale Muskeldystrophie aufgrund eines partiellen LAMA2-Mangels; Kongenitale Muskeldystrophie- Dystroglykanopathie mit Gehirn- und Augenanomalien, Typen A2, A7, A8, A11 und A14; Kongenitale Muskeldystrophie-Dystroglykanopathie mit mentaler Retardierung, Typen B2, B3, B5 und B15; Kongenitale Muskeldystrophie-Dystroglykanopathie ohne mentale Retardierung, Typ B5; Kongenitales Muskelhypertrophie-Zerebralsyndrom; Kongenitales myasthenisches Syndrom, Acetazolamid-empfindlich; Kongenitale Myopathie mit Fasertyp- Disproportion; Kongenitales Augenkolobom; Kongenitale stationäre Nachtblindheit, Typ 1A, 1B, 1C, 1E, 1F und 2A; Koproporphyrie; Cornea plana 2; Hornhautdystrophie, Fuchs endothelial, 4; Hornhautendotheldystrophie Typ 2; Hornhautfragilität Keratoglobus, blaue Skleren und Gelenkhypermobilität; Cornelia de Lange Syndrome 1 und 5; Koronare Herzkrankheit, autosomal dominant 2; Koronare Herzkrankheit; Hyperalphalipoproteinämie 2; Kortikale Dysplasie, komplex, mit anderen Hirnfehlbildungen 5 und 6; Kortikale Fehlbildungen, okzipital; Kortikosteroid-bindendes Globulin-Mangel; Corticosteron- Methyloxidase-Mangel Typ 2; Costello-Syndrom; Cowden-Syndrom 1; Coxa plana; Kraniodiaphysen-Dysplasie, autosomal dominant; Kraniosynostose 1 und 4; Kraniosynostose und Zahnanomalien; Kreatin-Mangel, X-chromosomal; Crouzon-Syndrom; Kryptophthalmus- Syndrom; Kryptorchismus, ein- oder beidseitig; Cushing-Symphalangismus; kutanes malignes Melanom 1; Cutis laxa mit Osteodystrophie und mit schweren pulmonalen, gastrointestinalen und urinären Anomalien; Zyanose, transiente neonatale und atypische Nephropathie; Zystische Fibrose; Cystinurie; Cytochrom-c-Oxidase i-Mangel; Cytochrom-c-Oxidase-Mangel; D-2- Hydroxyglutarsäureurie 2; Darier-Krankheit, segmental; Taubheit mit Labyrinth-Aplasie- Mikrotie und Mikrodontie (LAMM); Taubheit, autosomal dominant 3a, 4, 12, 13, 15, autosomal dominant nicht-syndromal sensorineural 17, 20 und 65; Taubheit, autosomal rezessiv 1A, 2, 3, 6, 8, 9, 12, 15, 16, 18b, 22, 28, 31, 44, 49, 63, 77, 86 und 89; Taubheit, cochleär, mit Myopie und intellektueller Beeinträchtigung, ohne vestibuläre Beteiligung, autosomal dominant, X-chromosomal 2; Mangel an 2-Methylbutyryl-CoA-Dehydrogenase; Mangel an 3-Hydroxyacyl-CoA-Dehydrogenase; Mangel an alpha-Mannosidase; Mangel an aromatischer L-Aminosäure-Decarboxylase; Mangel an Bisphosphoglyceratmutase; Mangel an Butyryl-CoA-Dehydrogenase; Mangel an Ferroxidase; Mangel an Galactokinase; Mangel an Guanidinoacetat-Methyltransferase; Mangel an Hyaluronoglucosaminidase; Mangel an Ribose-5-Phosphat-Isomerase; Mangel an Steroid-11-beta-Monooxygenase; Mangel an UDP- Glucose-Hexose-1-Phosphat-Uridylyltransferase; Mangel an Xanthinoxidase; Dejerine- Sottas-Krankheit; Charcot-Marie-Tooth-Krankheit, Typen ID und IVF; Dejerine-Sottas- Syndrom, autosomal dominant; Mangel an dendritischen Zellen, Monozyten, B-Lymphozyten und natürlichen Killer-Lymphozyten; Desbuquois-Dysplasie 2; Desbuquois-Syndrom; DFNA 2 Nicht-syndromale Schwerhörigkeit; Diabetes mellitus und Insipidus mit Optikusatrophie und Taubheit; Diabetes mellitus, Typ 2, und insulinabhängig, 20; Diamond-Blackfan-Anämie 1, 5, 8 und 10; Diarrhöe 3 (sekretorisches Natrium, kongenital, syndromisch) und 5 (mit Tufting- Enteropathie, kongenital); Dicarbonsäureaminoazidurie; Diffuses palmoplantares Keratoderma, Bothnian-Typ; Digitorenozerebrales Syndrom; Dihydropteridin-Reduktase- Mangel; Dilatative Kardiomyopathie 1A, 1AA, 1C, 1G, 1BB, 1DD, 1FF, 1HH, 11, 1KK, 1N, 1 S, 1Y und 3B; Linksventrikuläre Nichtkompaktion 3; Gestörte Steroidogenese aufgrund eines Mangels an Cytochrom-p450-Oxidoreduktase; Distale Arthrogrypose Typ 2B; Distale hereditäre motorische Neuronopathie Typ 2B; Distale Myopathie Typ Markesbery-Griggs; Distale spinale Muskelatrophie, X-chromosomal 3; Distichiasis-Lymphödem-Syndrom; Dominante dystrophe Epidermolysis bullosa mit Fehlen der Haut; Dominante hereditäre Optikusatrophie; Donnai-Barrow-Syndrom; Dopamin-Beta-Hydroxylase-Mangel; Dopaminrezeptor d2, reduzierte Hirndichte von; Dowling-Degos-Krankheit 4; Doyne-Waben- Netzhautdystrophie; Malattia leventinese; Duane-Syndrom Typ 2; Dubin-Johnson-Syndrom; Duchenne-Muskeldystrophie; Becker-Muskeldystrophie; Dysfibrinogenämie; Dyskeratosis congenita autosomal dominant und autosomal dominant, 3; Dyskeratosis congenita, autosomal rezessiv, 1, 3, 4 und 5; Dyskeratosis congenita X-linked; Dyskinesie, familiär, mit Gesichtsmyokymie; Dysplasminogenämie; Dystonie 2 (Torsion, autosomal rezessiv), 3 (Torsion, X-chromosomal), 5 (Dopa-responsiver Typ ), 10, 12, 16, 25, 26 (myoklonisch); Krampfanfälle, benigne familiäre infantile, 2; Frühkindliche epileptische Enzephalopathie 2, 4, 7, 9, 10, 11, 13 und 14; Atypisches Rett-Syndrom; Frühe akute lymphoblastische T-Zell- Progenitor-Leukämie; Ektodermale Dysplasie-Hautfragilitätssyndrom; Ektodermale Dysplasie-Syndaktylie-Syndrom 1; Ektopia lentis, isoliert autosomal rezessiv und dominant; Ektrodaktylie, ektodermale Dysplasie und Lippen-Gaumenspalte-Syndrom 3; Ehlers-Danlos- Syndrom Typ 7 (autosomal rezessiv), klassischer Typ, Typ 2 (progeroid), Hydroxylysindefizient, Typ 4, Typ 4-Variante und aufgrund von Tenascin-X-Mangel; kongenitale Muskeldystrophie vom Eichsfeld-Typ; endokrin-zerebroosteodysplasie; erweitertes S-Zapfen- Syndrom; Syndrom des vergrößerten vestibulären Aquädukts; Enterokinase-Mangel; Epidermodysplasia verruciformis; Epidermolysa bullosa simplex und GliedergürtelMuskeldystrophie, simplex mit gesprenkelter Pigmentierung, simplex mit Pylorusatresie, simplex, autosomal rezessiv, und mit Pylorusatresie; Epidermolytische palmoplantare Keratodermie; Familiäre Fieberkrämpfe 8; Epilepsie, kindliche Absence 2, 12 (idiopathisch generalisiert, Anfälligkeit für) 5 (nächtlicher Frontallappen), nächtlicher Frontallappen Typ 1, partiell, mit variablen Herden, progressiv myoklonisch 3, und X-chromosomal, mit variablen Lernbehinderungen und Verhaltensstörungen; Epileptische Enzephalopathie im Kindesalter, frühkindlich, 1, 19, 23, 25, 30 und 32; Epiphyseale Dysplasie, multiple, mit Myopie und konduktiver Taubheit; Episodische Ataxie Typ 2; Episodisches Schmerzsyndrom, familiär, 3; Epstein-Syndrom; Fechtner-Syndrom; Erythropoetische Protoporphyrie; Östrogenresistenz; Exsudative Vitreoretinopathie 6; Morbus Fabry und Morbus Fabry, kardiale Variante; Faktor H, VII, X, v und Faktor viii, kombinierter Mangel an 2, xiii, a-Untereinheit, Mangel; Familiäre adenomatöse Polyposis 1 und 3; Familiäre Amyloid-Nephropathie mit Urtikaria und Taubheit; Familiäre kalte Urtikaria; Familiäre Aplasie des Vermis; Familiärer benigner Pemphigus; Familiärer Brustkrebs; Brustkrebs, Anfälligkeit für; Osteosarkom; Bauchspeicheldrüsenkrebs 3; Familiäre Kardiomyopathie; Familiäres kaltes autoinflammatorisches Syndrom 2; Familiärer kolorektaler Krebs; Familiäre exsudative Vitreoretinopathie, X-chromosomal; Familiäre hemiplegische Migräne Typ 1 und 2; Familiäre Hypercholesterinämie; Familiäre hypertrophe Kardiomyopathie 1, 2, 3, 4, 7, 10, 23 und 24; Familiäre Hypokaliämie- Hypomagnesiämie; Familiäre hypoplastische, glomerulozystische Niere; Familiäre infantile Myasthenie; Familiäre juvenile Gicht; Familiäres Mittelmeerfieber und Familiäres Mittelmeerfieber, autosomal dominant; Familiäre Porencephalie; Familiäre Porphyria cutanea tarda; Familiäre pulmonale kapillare Hämangiomatose; Familiäre renale Glukosurie; Familiäre renale Hypourikämie; Familiäre restriktive Kardiomyopathie 1; Familiäre Hyperlipoproteinämie Typ 1 und 3; Fanconi-Anämie, Komplementationsgruppe E, I, N und O; Fanconi-Bickel-Syndrom; Favismus, Anfälligkeit für; Fieberkrämpfe, familiär, 11; Feingold- Syndrom 1; Fötales Hämoglobin, quantitativer Trait-Locus 1; FG-Syndrom und FG-Syndrom 4; Fibrose der extraokularen Muskeln, angeboren, 1, 2, 3a (mit oder ohne extraokulare Beteiligung), 3b; Fischaugenkrankheit; Fleck-Hornhautdystrophie; Floating-Harbor-Syndrom; Fokale Epilepsie mit Sprachstörung mit oder ohne geistige Retardierung; Fokale segmentale Glomerulosklerose 5; Vorderhirndefekte; Frank-Ter-Haar-Syndrom; Borrone Di Rocco Crovato-Syndrom; Frasier-Syndrom; Wilms-Tumor 1; Freeman-Sheldon-Syndrom; Frontometaphysäre Dysplasie 1 und 3; Frontotemporale Demenz; Frontotemporale Demenz und/oder Amyotrophe Lateralsklerose 3 und 4; Frontotemporale Demenz Chromosom 3- Linked und Frontotemporale Demenz Ubiquitin-positiv; Fructose-Biphosphatase-Mangel; Fuhrmann-Syndrom; Gamma-Aminobuttersäure-Transaminase-Mangel; Gamstorp-Wohlfart- Syndrom; Gaucher-Krankheit Typ 1 und Subakute Neuronopathie; Blicklähmung, familiär horizontal, mit progressiver Skoliose; Generalisierte dominante dystrophische Epidermolysis bullosa; Generalisierte Epilepsie mit fiebrigen Anfällen plus 3, Typ 1, Typ 2; Epileptische Enzephalopathie Typ Lennox-Gastaut; Riesenaxonale Neuropathie; Glanzmann- Thrombasthenie; Glaukom 1, offener Winkel, e, F und G; Glaukom 3, primär kongenital, d; Glaukom, kongenital und Glaukom, kongenital, Kolobom; Glaukom, primär offener Winkel,
juvenil; Gliom-Suszeptibilität 1; Glukose-Transporter-Typ-1-Mangelsyndrom; Glukose-6- Phosphat-Transportdefekt; GLUT1-Mangelsyndrom 2; Epilepsie, idiopathisch generalisiert, Anfälligkeit für, 12; Glutamat-Formiminotransferase-Mangel; Glutarsäureanämie IIA und IIB; Glutarsäureurie, Typ 1; Gluthathion-Synthetase-Mangel; Glykogenspeicherkrankheit 0 (Muskel), II (Erwachsenenform), IXa2, IXc, Typ 1A; Typ II, Typ IV, IV (kombiniert hepatisch und myopathisch), Typ V und Typ VI; Goldmann-Favre-Syndrom; Gordon-Syndrom; Gorlin- Syndrom; Holoprosencephalie-Sequenz; Holoprosencephalie 7; Granulomatöse Erkrankung, chronisch, X-chromosomal, Variante; Granulosazelltumor des Eierstocks; Gray-Plättchen- Syndrom; Griscelli-Syndrom Typ 3; Groenouw-Hornhautdystrophie Typ I; Wachstums- und geistige Retardierung, mandibulofaziale Dysostose, Mikrozephalie und Gaumenspalte; Wachstumshormonmangel mit Hypophysenanomalien; Wachstumshormoninsensitivität mit Immundefizienz; GTP-Cyclohydrolase-I-Mangel; Hajdu-Cheney-Syndrom; Hand-Fuß- Uterus-Syndrom; Schwerhörigkeit; Hämangiom, kapillär infantil; hämatologische Neoplasie; Hämochromatose Typ 1, 2B und 3; mikrovaskuläre Komplikationen bei Diabetes 7; Transferrin-Serumspiegel quantitativer Trait-Locus 2; Hämoglobin-H-Krankheit, nicht deletionär; Hämolytische Anämie, nicht sphärozytär, aufgrund eines Glucosephosphat- Isomerase-Mangels; Hämophagozytische Lymphohistiozytose, familiär, 2; Hämophagozytische Lymphohistiozytose, familiär, 3; Heparin-Cofaktor-II-Mangel; Hereditäre Acrodermatitis enteropathica; Hereditäres Brust- und Eierstockkrebssyndrom; Ataxie-Telangiektasie-ähnliche Störung; Hereditärer diffuser Magenkrebs; Hereditäre diffuse Leukoenzephalopathie mit Sphäroiden; Hereditäre Faktor II, IX, VIII-Mangelerkrankung; Hereditäre hämorrhagische Teleangiektasie Typ 2; Hereditäre Schmerzunempfindlichkeit mit Anhidrose; Hereditäres Lymphödem Typ I; Hereditäre motorische und sensorische Neuropathie mit Optikusatrophie; Hereditäre Myopathie mit frühem Atemversagen; Hereditäre neuralgische Amyotrophie; Hereditäre nichtpolypöse kolorektale Neoplasmen; Lynch- Syndrom I und II; Hereditäre Pankreatitis; Pankreatitis, chronisch, Anfälligkeit dafür; Hereditäre sensorische und autonome Neuropathie Typ IIB und IIA; Hereditäre sideroblastische Anämie; Hermansky-Pudlak-Syndrom 1, 3, 4 und 6; Heterotaxie, viszeral, 2, 4 und 6, autosomal; Heterotaxie, viszeral, X-chromosomal; Heterotopie; Histiozytäre medulläre Retikulose; Histiozytose-Lymphadenopathie plus-Syndrom; Holocarboxylase- Synthetase-Mangel; Holoprosencephalie 2, 3, 7 und 9; Holt-Oram-Syndrom; Homocysteinämie aufgrund von MTHFR-Mangel, CBS-Mangel und Homocystinurie, Pyridoxin-responsiv; Homocystinurie-Megaloblastenanämie aufgrund eines Defekts im Cobalamin-Stoffwechsel, cblE-Komplementationstyp; Howel-Evans-Syndrom; Hurler- Syndrom; Hutchinson-Gilford-Syndrom; Hydrozephalus; Hyperammonämie, Typ III; Hypercholesterinämie und Hypercholesterinämie, autosomal rezessiv; Hyperekplexie 2 und Hyperekplexie hereditär; Hyperferritinämie-Katarakt-Syndrom; Hyperglycinurie; Hyperimmunglobulin D mit periodischem Fieber; Mevalonsäureurie; Hyperimmunglobulin E- Syndrom; Hyperinsulinämische Hypoglykämie familiär 3, 4 und 5; Hyperinsulinismus- Hyperammonämie-Syndrom; Hyperlysinämie; Hypermanganämie mit Dystonie, Polyzythämie und Zirrhose; Hyperornithinämie-Hγperammonämie-Homocitrullinurie- Syndrom; Hyperparathyreoidismus 1 und 2; Hyperparathyreoidismus, neonatal schwer; Hyperphenylalaninämie, bh4-defizient, a, aufgrund von partiellem pts-Mangel, BH4-defizient, D, und non-pku; Hyperphosphatasie mit mentaler Retardierung Syndrom 2, 3 und 4; Hypertrichotische Osteochondrodysplasie; Hypobetalipoproteinämie, familiär, assoziiert mit apob32; Hypokalzämie, autosomal dominant 1; Hypokalziurische Hyperkalzämie, familiär, Typ 1 und 3; Hypochondrogenese; Hypochrome mikrozytäre Anämie mit Eisenüberladung; Hypoglykämie mit Mangel an Glykogensynthetase in der Leber; Hypogonadotroper Hypogonadismus 11 mit oder ohne Anosmie; Hypohidrotische ektodermale Dysplasie mit Immunschwäche; Hypohidrotische X-chromosomale ektodermale Dysplasie; Hypokaliämische periodische Paralyse 1 und 2; Hypomagnesiämie 1, intestinal; Hypomagnesiämie, Krampfanfälle und geistige Retardierung; Hypomyelinisierende Leukodystrophie 7; Hypoplastisches Linksherzsyndrom; Atrioventrikulärer Septumdefekt und gemeinsame atrioventrikuläre Verbindung; Hypospadie 1 und 2, X-chromosomal; Hypothyreose, kongenital, nicht-zitronisch, 1; Hypotrichose 8 und 12; Hypotrichose- Lymphödem-Telangiektasie-Syndrom; 1-Blutgruppensystem; Ichthyosis bullosa von Siemens; Ichthyosis exfoliativa; Ichthyosis-Prämaturitätssyndrom; Idiopathische Basalganglienverkalkung 5; Idiopathische fibrosierende Alveolitis, chronische Form; Dyskeratosis congenita, autosomal dominant, 2 und 5; Idiopathische Hyperkalzämie des Kindesalters; Immunstörung mit T-Zell-Inaktivierung aufgrund eines Kalzium-Eintrittsdefekts 2; Immundefizienz 15, 16, 19, 30, 31C, 38, 40, 8, aufgrund eines Defekts von cd3-zeta, mit Hyper-IgM Typ 1 und 2, und X-gebunden, mit Magnesiumdefekt, Epstein-Barr-VirusInfektion und Neoplasie; Immundefizienz-Zentromerische Instabilität-Gesichtsanomalien- Syndrom 2; Einschlusskörper-Myopathie 2 und 3; Nonaka-Myopathie; Infantile Krämpfe und paroxysmale Choreoathetose, familiär; Infantile kortikale Hyperostose; Infantile GM1- Gangliosidose; Infantile Hypophosphatasie; Infantile Nephronophthisis; Infantiler Nystagmus, X-chromosomal; Infantiler Parkinsonismus-Dystonie; Unfruchtbarkeit in Verbindung mit mehrschwänzigen Spermien und übermäßiger DNA; Insulinresistenz; Insulinresistenter Diabetes mellitus und Acanthosis nigricans; Insulinabhängiger Diabetes mellitus, sekretorisches Diarrhöesyndrom; Interstitielle Nephritis, karyomegal; Intrauterine Wachstumsretardierung, metaphysäre Dysplasie, adrenale Hypoplasia congenita und genitale Anomalien; Iodotyrosyl-Kopplungsdefekt; IRAK4-Mangel; Iridogoniodysgenese dominanter Typ und Typ 1; Eisenakkumulation im Gehirn; Ischiopatellare Dysplasie; Inselzellhyperplasie; Isolierter 17,20-Lyase-Mangel; Isolierter Lutropinmangel; Isovaleryl-CoA-Dehydrogenase- Mangel; Jankovic-Rivera-Syndrom; Jervell- und Lange-Nielsen-Syndrom 2; Joubert-Syndrom 1, 6, 7, 9/15 (digenisch), 14, 16 und 17 und Orofaciodigital-Syndrom xiv; Junktionale Epidermolysis bullosa gravis von Herlitz; Juvenile GM>1<-Gangliosidose; Juveniles Polyposis-Syndrom; Juveniles Polyposis/Hämorrhagisches Teleangiektasie-Syndrom; Juvenile Retinoschisis; Kabuki-Make-up-Syndrom; Kallmann-Syndrom 1, 2 und 6; Verzögerte Pubertät; Kanzak-Krankheit; Karak-Syndrom; Kartagener-Syndrom; Kenny-Caffey-Syndrom Typ 2; Keppen-Lubinsky-Syndrom; Keratokonus 1; Keratosis follicularis; Keratosis palmoplantaris striata 1; Kindler-Syndrom; L-2-Hydroxyglutarsäureurie; Larsen-Syndrom, dominanter Typ; Gitter-Hornhautdystrophie Typ III; Leber-Amaurose; Zellweger-Syndrom; Peroxisom-Biogenese-Störungen; Zellweger-Syndrom-Spektrum; Lebersche kongenitale Amaurose 11, 12, 13, 16, 4, 7 und 9; Lebersche Optikusatrophie; Aminoglykosid-induzierte Taubheit; Taubheit, nicht-syndromale sensorineurale, mitochondriale Taubheit; Linksventrikuläre Nichtkompaktion 5; Fehlbildungen der Links-Rechts-Achse; Leigh- Syndrom; Mitochondrialer kurzkettiger Enoyl-CoA-Hydratase-1-Mangel; Leigh-Syndrom aufgrund eines mitochondrialen Komplex-I-Mangels; Leiner-Krankheit; Leri-Weill- Dyschondrosteose; Letales kongenitales Kontraktursyndrom 6; Leukozytenadhäsionsmangel Typ I und III; Leukodystrophie, hypomyelinisierend, 11 und 6; Leukoenzephalopathie mit Ataxie, mit Hirnstamm- und Rückenmarksbeteiligung und Laktaterhöhung, mit verschwindender weißer Substanz und progressiv, mit Ovarialinsuffizienz; Leukonychia totalis; Lewy-Körper-Demenz; Lichtenstein-Knorr-Syndrom; Li-Fraumeni-Syndrom 1; Lig4- Syndrom; Gliedergürtelmuskeldystrophie, Typ 1B, 2A, 2B, 2D, C1, C5, C9, C14; Kongenitale Muskeldystrophie-Dystroglykanopathie mit Gehirn- und Augenanomalien, Typ A14 und B14; Lipasemangel kombiniert; Lipidproteinose; Lipodystrophie, familiär partiell, Typ 2 und 3; Lissencephalie 1, 2 (X-chromosomal), 3, 6 (mit Mikrozephalie), X-chromosomal; Subkortikale laminare Heterotopie, X-chromosomal; Akutes kindliches Leberversagen; Loeys-Dietz- Syndrom 1, 2, 3; Langes QT-Syndrom 1, 2, 2/9, 2/5, (digenisch), 3, 5 und 5, erworben, Anfälligkeit für; Lungenkrebs; Lymphödem, erblich, id; Lymphödem, primär, mit Myelodysplasie; Lymphoproliferatives Syndrom 1, 1 (X-chromosomal) und 2; Lysosomaler saurer Lipasemangel; Makrozephalie, Makrosomie, Syndrom des Gesichtsdysmorphismus; Makuladystrophie, vitelliform, bei Erwachsenen; Maligne Hyperthermie-Suszeptibilität Typ 1; Malignes Lymphom, Non-Hodgkin; Malignes Melanom; Bösartiger Prostatatumor; Mandibuloakrale Dysostose; Mandibuloakrale Dysplasie mit Lipodystrophie Typ A oder B, atypisch; Mandibulofaziale Dysostose, Treacher-Collins-Typ, autosomal rezessiv; Mannose- Bindungsprotein-Mangel; Ahornsirup-Urin-Krankheit Typ 1A und Typ 3; Marden-Walkerähnliches Syndrom; Marfan-Syndrom; Marinesco-Sj\xc3\xb6gren-Syndrom; Martsolf- Syndrom; Reifungsdiabetes bei Jugendlichen, Typ 1, Typ 2, Typ 11, Typ 3 und Typ 9; May- Hegglin-Anomalie; MYH9-verwandte Störungen; Sebastian-Syndrom; McCune-Albright- Syndrom; Somatotropes Adenom; Geschlechtsstrang-Stromatumor; Cushing-Syndrom; McKusick-Kaufman-Syndrom; McLeod-Neuroakanthozytose-Syndrom; Meckel-Gruber- Syndrom; Mangel an mittelkettiger Acyl-Coenzym-A-Dehydrogenase; Medulloblastom; megalencephale Leukoenzephalopathie mit subkortikalen Zysten 1 und 2a; Megalencephaly cutis marmorata telangiectatica congenital; PIK3CA Related Overgrowth Spectrum; Megalencephaly-polymicrogyria-polydactyly-hydrocephalus-Syndrom 2; Megaloblastische Anämie, thiaminempfindlich, mit Diabetes mellitus und sensorineuraler Taubheit; Meier- Gorlin-Syndrome 1 und 4; Melnick-Needles-Syndrom; Meningiom; Mentale Retardierung, X- chromosomal, 3, 21, 30 und 72; Mentale Retardierung und Mikrozephalie mit pontiner und zerebellarer Hypoplasie; Mentale Retardierung, X-chromosomal, syndromal 5; Mentale Retardierung, anteriore Maxillarprotrusion und Strabismus; Mentale Retardierung, autosomal dominant 12, 13, 15, 24, 3, 30, 4, 5, 6 und 9; Mentale Retardierung, autosomal rezessiv 15, 44, 46 und 5; Geistige Retardierung, stereotype Bewegungen, Epilepsie und/oder zerebrale Fehlbildungen; Geistige Retardierung, syndromaler Claes-Jensen-Typ, X-chromosomal; Geistige Retardierung, X-chromosomal, unspezifisch, syndromaler Hedera-Typ und syndromaler Wu-Typ; Merosin-defiziente kongenitale Muskeldystrophie; Metachromatische Leukodystrophie juveniler, spätinfantiler und erwachsener Typ; Metachromatische Leukodystrophie; Metatrophische Dysplasie; Methämoglobinämie Typ I und 2; Methionin- Adenosyltransferase-Mangel, autosomal dominant; Methylmalonsäureanämie mit Homocystinurie; Methylmalonsäureanämie cblB-Typ; Methylmalonsäureanämie aufgrund eines Methylmalonyl-CoA-Mutasemangels; METHYLMALONSÄURE, mut(0)-Typ; Mikrozephaler osteodysplastischer primordialer Zwergwuchs Typ 2; Mikrozephalie mit oder ohne Chorioretinopathie, Lymphödem oder mentaler Retardierung; Mikrozephalie, Hiatushemie und nephrotisches Syndrom; Mikrozephalie; Hypoplasie des Corpus callosum; Spastische Paraplegie 50, autosomal rezessiv; Globale Entwicklungsverzögerung; ZNS- Hypomyelinisierung; Himatrophie; Mikrozephalie, normale Intelligenz und Immunschwäche; Mikrozephalie-Kapillarmissbildungssyndrom; Mikrozytäre Anämie; Mikrophthalmie syndromisch 5, 7 und 9; Mikrophthalmie, isoliert 3, 5, 6, 8 und mit Kolobom 6; Mikrospherophakie; Migräne, familiäre basilare; Miller-Syndrom; Minicore-Myopathie mit externer Ophthalmoplegie; Myopathie, kongenital mit Kernen; Mitchell-Riley-Syndrom; mitochondrialer 3-Hydroxy-3-methylglutaryl-CoA-Synthase-Mangel; Mitochondrialer Komplex I, II, III, III (Kerntyp 2, 4 oder 8) Mangel; Mitochondriales DNA-Depletionssyndrom 11, 12 (kardiomyopathischer Typ), 2, 4B (MNGIE-Typ), 8B (MNGIE-Typ); Mitochondriales DNA-Depletionssyndrom 3 und 7, hepatozerebrale Typen, und 13 (enzephalomyopathischer Typ); Mitochondrialer Phosphatträger- und Pyruvatträger-Mangel; Mitochondrialer trifunktionaler Proteinmangel; Langkettiger 3-Hydroxyacyl-CoA-Dehydrogenase-Mangel; Miyoshi-Muskeldystrophie 1; Myopathie, distal, mit anteriorem tibialen Beginn; Mohr- Tranebjaerg-Syndrom; Molybdän-Cofaktor-Mangel, Komplementationsgruppe A; Mowat- Wilson-Syndrom; Mukolipidose III Gamma; Mukopolysaccharidose Typ VI, Typ VI (schwer) und Typ VII; Mukopolysaccharidose, MPS-I-H/S, MPS-II, MPS-III-A, MPS-III-B, MPS-III- C, MPS-IV-A, MPS-IV-B; Retinitis Pigmentosa 73; Gangliosidose GM1 Typ 1 (mit Herzbeteiligung) 3; Multizentrische Osteolyse-Nephropathie; Multizentrische Osteolyse, Nodulose und Arthropathie; Multiple kongenitale Anomalien; Vorhofseptumdefekt 2; Multiple kongenitale Anomalien-Hypotonie-Anfalls-Syndrom 3; Multiple kutane und mukosale Venenfehlbildungen; Multiple endokrine Neoplasien, Typ 1 und 4; Multiple epiphysäre Dysplasie 5 oder dominant; Multiple gastrointestinale Atresien; Multiples Pterygium-Syndrom vom Escobar-Typ; Multipler Sulfatase-Mangel; Multiples Synostose-Syndrom 3; Muskel- AMP-Guanin-Oxidase-Mangel; Muskel-Augen-Hirn-Krankheit; Muskeldystrophie, kongenital, Megakolon-Typ; Myasthenie, familiär infantil, 1; Myasthenisches Syndrom, kongenital, 11, assoziiert mit Acetylcholin-Rezeptor-Mangel; Myasthenisches Syndrom, kongenital, 17, 2A (langsamer Kanal), 4B (schneller Kanal), und ohne tubuläre Aggregate; Myeloperoxidase-Mangel; MYH-assoziierte Polyposis; Endometriumkarzinom; Myokardinfarkt 1; Myoklonische Dystonie; Myoklonisch-ottonische Epilepsie; Myoklonus mit Epilepsie mit gezackten roten Fasern; Myofibrilläre Myopathie 1 und ZASP-bezogen; Myoglobinurie, akut rezidivierend, autosomal rezessiv; Myoneurales gastrointestinales Enzephalopathiesyndrom; Zerebelläre Ataxie infantil mit progressiver externer Ophthalmoplegie; Mitochondriales DNA-Depletionssyndrom 4B, MNGIE-Typ; Myopathie, zentronukleär, 1, kongenital, mit Überschuss an Muskelspindeln, distal, 1, Laktatazidose und sideroblastischer Anämie 1, mitochondrial progressiv mit kongenitalem Katarakt, Hörverlust und Entwicklungsverzögerung, und tubulärem Aggregat, 2; Myopie 6; Myosklerose, autosomal rezessiv; Myotonie kongenital; Kongenitale Myotonie, autosomal dominante und rezessive Formen; Nagel-Patella-Syndrom; Nance-Horan-Syndrom; Nanophthalmus 2; Navajo-Neurohepatopathie; Nemaline Myopathie 3 und 9; Neonatale Hypotonie; Geistige Behinderung; Krampfanfälle; Verzögerte Sprachentwicklung; Mentale Retardierung, autosomal dominant 31; Neonatale intrahepatische Cholestase durch Citrin-Mangel; Nephrogener Diabetes insipidus, Nephrogener Diabetes insipidus, X-chromosomal; Nephrolithiasis/Osteoporose, hypophosphatämisch, 2; Nephronophthisis 13, 15 und 4; Unfruchtbarkeit; Cerebello-okulo-renales Syndrom (Nephronophthisis, okulomotorische Apraxie und Kleinhirnanomalien); Nephrotisches Syndrom, Typ 3, Typ 5, mit oder ohne Augenanomalien, Typ 7 und Typ 9; Nestor-Guillermo-Progerie-Syndrom; Neu-Laxova- Syndrom 1; Neurodegeneration mit Eisenanreicherung im Gehirn 4 und 6; Neuroferntinopathie; Neurofibromatose, Typ 1 und Typ 2; Neurofibrosarkom; Neurohypophysärer Diabetes insipidus; Hereditäre sensorische Neuropathie, Typ IC; Neutraler 1-Aminosäure-Transportdefekt; Neutrale Lipidspeicherkrankheit mit Myopathie; Neutrophiles Immundefektsyndrom; Nicolaides-Baraitser-Syndrom; Niemann-Pick-Krankheit Typ C1, C2, Typ A und Typ C1, Erwachsenenform; Nicht-ketotische Hyperglyzinämie; Noonan-Syndrom 1 und 4, LEOPARD-Syndrom 1; Noonan-Syndrom-ähnliche Störung mit oder ohne juvenile myelomonozytäre Leukämie; Normokalämische periodische Paralyse, kaliumempfindlich; Norum-Krankheit; Epilepsie, Hörverlust und Syndrom der geistigen Behinderung; Geistige Behinderung, X-chromosomal 102 und syndromal 13; Fettleibigkeit; Okulärer Albinismus, Typ I; Okulokutaner Albinismus Typ 1B, Typ 3 und Typ 4; Okulodentodigitale Dysplasie; Odontohypophosphatasie; Odontotrichomelie-Syndrom; Oguchi-Krankheit; Oligodontie- Kolorektalkarzinom-Syndrom; Opitz G/BBB-Syndrom; Optikusatrophie 9; Oral-fazialdigitales Syndrom; Ornithin-Aminotransferase-Mangel; Orofaziale Spaltbildung 11 und 7, Lippen-Kiefer-Gaumendysplasie-Syndrom; Orstavik-Lindemann-Solberg-Syndrom; Osteoarthritis mit leichter Chondrodysplasie; Osteochondritis dissecans; Osteogenesis imperfecta Typ 12, Typ 5, Typ 7, Typ 8, Typ I, Typ III, mit normalen Skleren, dominante Form, rezessive perinatale Letalität; Osteopathia striata mit kranialer Sklerose; Osteopetrose autosomal dominant Typ 1 und 2, rezessiv 4, rezessiv 1, rezessiv 6; Osteoporose mit Pseudogliom; Oto-palato-digitales Syndrom, Typ I und II; Ovarialdysgenese 1; Ovarioleukodystrophie; Pachyonychia congenita 4 und Typ 2; Paget-Krankheit der Knochen, familiär; Pallister-Hall-Syndrom; Palmoplantar-Keratodermie, nicht epidermolytisch, fokal oder diffus; Pankreas-Agenesie und kongenitale Herzerkrankung; Papillon-Leflxc3\xa8vre- Syndrom; Paragangliome 3; Paramyotonia congenita von Eulenburg; Nebenschilddrüsenkarzinom; Parkinson-Krankheit 14, 15, 19 (juveniles Auftreten), 2, 20 (frühes Auftreten), 6 (autosomal rezessives frühes Auftreten) und 9; partieller Albinismus; partieller Hypoxanthin-Guaninphosphoribosyltransferase-Mangel; gemusterte Dystrophie des retinalen Pigmentepithels; PC-K6a; Pelizaeus-Merzbacher-Krankheit; Pendred-Syndrom; Periphere demyelinisierende Neuropathie, zentrale Dysmyelinisierung; Hirschsprung- Krankheit; Permanenter neonataler Diabetes mellitus; Diabetes mellitus, permanenter neonataler, mit neurologischen Merkmalen; Neonataler insulinabhängiger Diabetes mellitus; Reifungsdiabetes bei Jugendlichen, Typ 2; Peroxisom-Biogenesestörung 14B, 2A, 4A, 5B, 6A, 7A und 7B; Perrault-Syndrom 4; Perry-Syndrom; Persistierende hyperinsulinämische Hypoglykämie im Kindesalter; familiärer Hyperinsulinismus; Phänotypen; Phenylketonurie; Phäochromozytom; Hereditäre Paragangliom-Pheochromozytom-Syndrome; Paragangliome 1; Karzinoid-Tumor des Darms; Cowden-Syndrom 3; Phosphoglycerat-Dehydrogenase- Mangel; Phosphoglycerat-Kinase-1-Mangel; Photosensitive Trichothiodystrophie; Phytansäurespeicherkrankheit; Pick-Krankheit; Pierson-Syndrom; Pigmentäre Netzhautdystrophie; Pigmentierte noduläre adrenokortikale Erkrankung, primär, 1; Pilomatrixom; Pitt-Hopkins-Syndrom; Hypophysenabhängiger Hyperkortisolismus; Hypophysärer Hormonmangel, kombiniert 1, 2, 3 und 4; Plasminogen-Aktivator-Inhibitor- Typ-1-Mangel; Plasminogen-Mangel, Typ I; Blutungsstörung vom Plättchen-Typ 15 und 8; Poikiloderma, hereditäre Fibrose, mit Sehnenkontrakturen, Myopathie und Lungenfibrose; Polyzystische Nierenerkrankung 2, Erwachsenentyp und infantiler Typ; Polyzystische lipomembranöse Osteodysplasie mit sklerosierender Leukoenzephalopathie; Polyglucosan- Körperchen-Myopathie 1 mit oder ohne Immundefizienz; Polymikrogyrie, asymmetrisch, bilateral frontoparietal; Polyneuropathie, Schwerhörigkeit, Ataxie, Retinitis pigmentosa und Katarakt; Pontocerebelläre Hypoplasie Typ 4; Popliteales Pterygium-Syndrom; Porencephalie 2; Porokeratose 8, disseminierter oberflächlicher aktinischer Typ; Porphobilinogen-Synthase- Mangel; Porphyria cutanea tarda; Posteriore Säulenataxie mit Retinitis pigmentosa; Posteriore polare Katarakt Typ 2; Prader-Willi-Syndrom; Vorzeitige Ovarialinsuffizienz 4, 5, 7 und 9; Primäre autosomal rezessive Mikrozephalie 10, 2, 3 und 5; Primäre ziliare Dyskinesie 24; Primäre dilatative Kardiomyopathie; linksventrikuläre Nichtkompaktion 6; 4, linksventrikuläre Nichtkompaktion 10; paroxysmales Vorhofflimmern; primäre Hyperoxalurie, Typ I, Typ und Typ III; primäre hypertrophe Osteoarthropathie, autosomal rezessiv 2; primäre Hypomagnesiämie; Primäres Offenwinkelglaukom juveniler Beginn 1; Primrose-Syndrom; Progressiver familiärer Herzblock Typ 1B; Progressive familiäre intrahepatische Cholestase 2 und 3; Progressive intrahepatische Cholestase; Progressive Myoklonus-Epilepsie mit Ataxie; Progressive pseudorheumatoide Dysplasie; Progressive sklerosierende Poliodystrophie; Prolidase-Mangel; Prolin-Dehydrogenase-Mangel; Schizophrenie 4; Properdin-Mangel, X- chromosomal; Propionsäure-Akademie; Proprotein-Convertase 1/3-Mangel; Prostatakrebs, erblich, 2; Protan-Defekt; Proteinurie; Finnisches kongenitales nephrotisches Syndrom; Proteus-Syndrom; Brust-Adenokarzinom; Pseudoachondroplastisches spondyloepiphyseales Dysplasie-Syndrom; Pseudohypoaldosteronismus Typ 1 autosomal dominant und rezessiv und Typ 2; Pseudohypoparathyreoidismus Typ 1A, Pseudopseudohypoparathyreoidismus; Pseudoneonatale Adrenoleukodystrophie; Pseudoprimärer Hyperaldosteronismus; Pseudoxanthoma elasticum; Generalisierte arterielle Verkalkung im Kindesalter 2; Pseudoxanthoma elasticum-ähnliche Störung mit Mangel an multiplen Gerinnungsfaktoren; Psoriasis-Suszeptibilität 2; PTEN-Hamartom-Tumor-Syndrom; Pulmonale arterielle Hypertonie im Zusammenhang mit hereditärer hämorrhagischer Teleangiektasie; Pulmonale Fibrose und / oder Knochenmarkversagen, Telomer-bezogen, 1 und 3; Pulmonale Hypertonie, primär, 1, mit hereditärer hämorrhagischer Teleangiektasie; Purin-Nukleosid-Phosphorylase- Mangel; Pyruvat-Carboxylase-Mangel; Pyruvat-Dehydrogenase-El-alpha-Mangel; Pyruvat- Kinase-Mangel der roten Zellen; Raine-Syndrom; Rasopathie; Rezessive dystrophe Epidermolysis bullosa; Nagelstörung, nicht-syndromal kongenital, 8; Reifenstein-Syndrom; Nierenadysplasie; Nieren-Carnitin-Transportdefekt; Nierenkolobom-Syndrom; Nierendysplasie; Nierendysplasie, retinale Pigmentdystrophie, Kleinhimataxie und Skelettdysplasie; Renale tubuläre Azidose, distal, autosomal rezessiv, mit spät einsetzender Innenohrschwerhörigkeit oder mit hämolytischer Anämie; Renale tubuläre Azidose, proximal, mit Augenanomalien und geistiger Retardierung; Retinale Zapfendystrophie 3B; Retinitis pigmentosa; Retinitis pigmentosa 10, 11, 12, 14, 15, 17 und 19; Retinitis pigmentosa 2, 20, 25, 35, 36, 38, 39, 4, 40, 43, 45, 48, 66, 7, 70, 72; Retinoblastom; Rett-Störung; Rhabdoidtumor- Prädisposition-Syndrom 2; Rhegmatogene Netzhautablösung, autosomal dominant; Rhizomelische Chondrodysplasie punctata Typ 2 und Typ 3; Roberts-SC-Phokomelie- Syndrom; Robinow-Sorauf-Syndrom; Robinow-Syndrom, autosomal rezessiv, autosomal rezessiv, mit Brachy-Synpolydaktylie; Rothmund-Thomson-Syndrom; Rapadilino-Syndrom; RRM2B-verwandte mitochondriale Erkrankung; Rubinstein-Taybi-Syndrom; Salla-Krankheit; Sandhoff-Krankheit, adulter und infantiler Typ; Sarkoidose, früh einsetzende; Blau-Syndrom; Schindler-Krankheit, Typ 1; Schizencephalie; Schizophrenie 15; Schneckenbecken-Dysplasie; Schwannomatose 2; Schwartz-Jampel-Syndrom Typ 1; Sklerokornea, autosomal rezessiv; Sklerosteose; sekundäre Hypothyreose; Segawa-Syndrom, autosomal rezessiv; Senior-Loken- Syndrom 4 und 5, ; sensorische ataktische Neuropathie, Dysarthrie und Ophthalmoparese; Sepiapterin-Reduktase-Mangel; SeSAME-Syndrom; Schwere kombinierte Immunschwäche aufgrund von ADA-Mangel, mit Mikrozephalie, Wachstumsretardierung und Empfindlichkeit gegenüber ionisierender Strahlung, atypisch, autosomal rezessiv, T-Zellen-negativ, B-Zellenpositiv, NK-Zellen-negativ oder NK-positiv; Schwere kongenitale Neutropenie; Schwere kongenitale Neutropenie 3, autosomal rezessiv oder dominant; Schwere kongenitale Neutropenie und 6, autosomal rezessiv; Schwere myoklonische Epilepsie im Säuglingsalter; Generalisierte Epilepsie mit Fieberkrämpfen plus, Typ 1 und 2; Schwere X-chromosomale myotubuläre Myopathie; Kurz-QT-Syndrom 3; Kleinwuchs mit unspezifischen Skelettanomalien; Kleinwuchs, Gehörgangsatresie, Unterkieferhypoplasie, Skelettanomalien; Kleinwuchs, Onychodysplasie, Gesichtsdysmorphie und Hypotrichose; Primordialer Zwergwuchs; Kurzrippen-Thoraxdysplasie 11 oder 3 mit oder ohne Polydaktylie; Sialidose Typ 1 und II; Silbernes spastisches Paraplegie-Syndrom; Verlangsamte Nervenleitgeschwindigkeit, autosomal dominant; Smith-Lemli-Opitz-Syndrom; Snyder- Robinson-Syndrom; Somatotropes Adenom; Prolaktinom; familiär, Hypophysenadenom- Prädisposition; Sotos-Syndrom 1 oder 2; Spastische Ataxie 5, autosomal rezessiv, Charlevoix- Saguenay-Typ, 1, 10 oder 11, autosomal rezessiv; Amyotrophe Lateralsklerose Typ 5; Spastische Paraplegie 15, 2, 3, 35, 39, 4, autosomal dominant, 55, autosomal rezessiv, und 5A; Gallensäuresynthesedefekt, angeboren, 3; Spermatogenes Versagen 11, 3, und 8; Sphärozytose Typ 4 und 5; Sphärokörper-Myopathie; Spinale Muskelatrophie, vorwiegend der unteren Extremitäten 2, autosomal dominant; Spinale Muskelatrophie, Typ II; Spinozerebelläre Ataxie 14, 21, 35, 40 und 6; Spinozerebelläre Ataxie autosomal rezessiv 1 und 16; Milzhypoplasie; Spondylocarpotarsal-Synostose-Syndrom; Spondylocheirodysplasie, Ehlers-Danlos- Syndrom-ähnlich, mit Immundysregulation, Aggrecan-Typ, mit kongenitalen Gelenkverrenkungen, Kurzhandtyp, Sedaghatian-Typ, mit Zapfenstäbchendystrophie, und Kozlowski-Typ; Parastrematischer Zwergwuchs; Stargardt-Krankheit 1; Zapfen-Stäbchen- Dystrophie 3; Stickler-Syndrom Typ 1; Kniest-Dysplasie; Stickler-Syndrom, Typ 1 (nicht syndromal okulär) und 4; Sting-assoziierte Vaskulopathie, infantil; Stormorken-Syndrom; Sturge-Weber-Syndrom, Kapillarfehlbildungen, kongenital, 1; Succinyl-CoA-Acetoacetat- Transferase-Mangel; Sucrase-Isomaltase-Mangel; Plötzlicher Kindstod; Sulfitoxidase- Mangel, isoliert; Supravalväre Aortenstenose; Surfactant-Stoffwechselstörung, pulmonal, 2 und 3; Symphalangismus, proximal, 1b; Syndaktylie Typ Cenani Lenz; Syndaktylie Typ 3; Syndromische X-chromosomale mentale Retardierung 16; Talipes equinovarus; Tanger- Krankheit; TARP-Syndrom; Tay-Sachs-Krankheit, B1-Variante, Gm2-Gangliosidose (adult), Gm2-Gangliosidose (adult-onset); Temtamy-Syndrom; Tenorio-Syndrom; Endständige Knochendysplasie; Testosteron-17-beta-Dehydrogenase-Mangel; Tetraamelie, autosomal rezessiv; Tetralogie von Fallot; Hypoplastisches Linksherzsyndrom 2; Truncus arteriosus; Fehlbildung des Herzens und der großen Gefäße; Ventrikelseptumdefekt 1; Thiel-Behnke- Hornhautdystrophie; Thorakale Aortenaneurysmen und Aortendissektionen; Marfanoider Habitus; Three-M-Syndrom 2; Thrombozytopenie, Thrombozytenfunktionsstörung, Hämolyse und unausgewogene Globinsynthese; Thrombozytopenie, X-chromosomal; Thrombophilie, erblich, aufgrund von Protein-C-Mangel, autosomal dominant und rezessiv; Schilddrüsenagenesie; Schilddrüsenkrebs, follikulär; Schilddrüsenhormonstoffwechsel, abnormal; Schilddrüsenhormonresistenz, generalisiert, autosomal dominant; Thyreotoxische periodische Lähmung und Thyreotoxische periodische Lähmung 2; Thyreotropin-Releasing- Hormon-Resistenz, generalisiert; Timothy-Syndrom; TNF-Rezeptor-assoziiertes periodisches Fieber-Syndrom (TRAPS); Zahn-Agenesie, selektiv, 3 und 4; Torsades de pointes; Townes- Brocks-Branchiootorenal-ähnliches Syndrom; Transiente bullöse Dermolyse des Neugeborenen; Treacher-Collins-Syndrom 1; Trichomegalie mit geistiger Retardierung, Zwergwuchs und Pigmentdegeneration der Netzhaut; Trichorhinophalangeale Dysplasie Typ I; Trichorhinophalangeales Syndrom Typ 3; Trimethylaminurie; Tuberöse Sklerose; Lymphangiomyomatose; Tuberöse Sklerose 1 und 2; Tyrosinase-negativer okulokutaner Albinismus; Tyrosinase-positiver okulokutaner Albinismus; Tyrosinämie Typ I; UDP- Glucose-4-Epimerase-Mangel; Ullrich kongenitale Muskeldystrophie; Fehlen von Ulna und Fibula mit schwerem Gliedmaßenmangel; Upshaw-Schulman-Syndrom; Urocanat-Hydratase- Mangel; Usher-Syndrom, Typen 1, 1B, 1D, 1G, 2A, 2C und 2D; Retinitis pigmentosa 39; UVempfindliches Syndrom; Van-der-Woude-Syndrom; Van-Maldergem-Syndrom 2; Hennekam- Lymphangiektasie-Lymphödem-Syndrom 2; Variegate-Porphyrie; Ventrikulomegalie mit zystischer Nierenerkrankung; Verheij-Syndrom; Mangel an sehr langkettiger Acyl-CoA- Dehydrogenase; Vesikoureteraler Reflux 8; Viszerale Heterotaxie 5, autosomal; Viszerale Myopathie; Vitamin-D-abhängige Rachitis, Typ 1 und 2; Vitelliforme Dystrophie ; von- Willebrand-Krankheit Typ 2M und Typ 3; Waardenburg-Syndrom Typ 1, 4C und 2E (mit neurologischer Beteiligung); Klein-Waardenberg-Syndrom; Walker-Warburg kongenitale Muskeldystrophie; Warburg-Mikro-Syndrom 2 und 4; Warzen, Hypogammaglobulinämie, Infektionen und Myelokathexis; Weaver-Syndrom; Weill-Marchesani-Syndrom 1 und 3; Weill-Marchesani-Syndrom; Weissenbacher-Zweymüller-Syndrom; Werdnig-Hoffmann- Krankheit; Charcot-Marie-Tooth-Krankheit; Werner-Syndrom; WFS1-verwandte Störungen; Wiedemann-Steiner-Syndrom; Wilson-Krankheit; Wolfram-ähnliches Syndrom, autosomal dominant; Worth-Krankheit; Van-Buchem-Krankheit Typ 2; Xeroderma pigmentosum, Komplementationsgruppe b, Gruppe D, Gruppe E und Gruppe G; X-chromosomale Agammaglobulinämie; X-chromosomale hereditäre motorische und sensorische Neuropathie; X-chromosomale Ichthyose mit Sterylsulfatase-Mangel; X-chromosomale periventrikuläre Heterotopie; Oto-palato-digitales Syndrom, Typ I; X-chromosomale schwere kombinierte Immundefizienz; Zimmermann-Laband-Syndrom und Zimmermann-Laband-Syndrom 2; und Zonulärer pulverförmiger Katarakt 3.
Die Ziel-Nukleotidsequenz kann eine Zielsequenz (z. B. eine Punktmutation) umfassen, die mit einer Krankheit, Störung oder einem Zustand verbunden ist. Die Zielsequenz kann eine T zu C- (oder A zu G-) Punktmutation umfassen, die mit einer Krankheit, Störung oder einem Zustand verbunden ist, und wobei die Desaminierung der mutierten C-Base zu einer durch Fehlpaarungsreparatur vermittelten Korrektur einer Sequenz führt, die nicht assoziiert ist mit einer Krankheit, Störung oder einem Zustand. Die Zielsequenz kann eine G zu A- (oder C zu T-) Punktmutation umfassen, die mit einer Krankheit, Störung oder einem Zustand verbunden ist, und wobei die Desaminierung der mutierten A-Base zu einer durch Fehlpaarungsreparatur vermittelten Korrektur einer Sequenz führt, die nicht assoziiert ist mit einer Krankheit, Störung oder einem Zustand. Die Zielsequenz kann ein Protein kodieren, und wobei die Punktmutation in einem Codon ist und zu einer Änderung der Aminosäure führt, die durch das mutierte Codon im Vergleich zu einem Wildtyp-Codon kodiert wird. Die Zielsequenz kann sich auch an einer Spleißstelle befinden und die Punktmutation zu einer Änderung beim Spleißen eines mRNA-Transkripts im Vergleich zu einem Wildtyp-Transkript führen. Außerdem kann sich das Ziel an einer nicht-kodierenden Sequenz eines Gens befinden, wie beispielsweise einem Promotor, und die Punktmutation zu einer erhöhten oder verringerten Exprimierung des Gens führen.
Somit führt in einigen Aspekten die Desaminierung einer Mutante C zu einer Änderung der Aminosäure, die durch das mutierte Codon kodiert wird, was in einigen Fällen zur Exprimierung einer Wildtyp-Aminosäure führen kann. In anderen Aspekten führt die Desaminierung einer Mutante A zu einer Änderung der Aminosäure, die durch das mutierte Codon kodiert wird, was in einigen Fällen zur Exprimierung einer Wildtyp-Aminosäure führen kann.
Die hierin beschriebenen Verfahren, die das Kontaktieren einer Zelle mit einer Zusammensetzung oder einem rAAV-Partikel beinhalten, können in vitro, ex vivo oder in vivo erfolgen. In bestimmten Ausführungsformen erfolgt der Schritt des Kontaktierens in einem Patienten. In bestimmten Ausführungsformen wurde bei dem Patienten eine Krankheit, Störung oder ein Zustand diagnostiziert.
In einigen Ausführungsformen beinhalten die hierin offenbarten Verfahren das Kontaktieren einer Säugetierzelle mit einer Zusammensetzung oder einem rAAV-Partikel. In bestimmten Ausführungsformen beinhalten die Verfahren das Kontaktieren einer Netzhautzelle, Kortikaliszelle oder Kleinhirnzelle.
Das Split-Cas9-Protein oder der Split-Prime-Editor, der unter Verwendung der hierin beschriebenen Verfahren geliefert wird, weist vorzugsweise eine vergleichbare Aktivität im Vergleich zum ursprünglichen Cas9-Protein oder Prime-Editor auf (d. h. ungeteiltes Protein, das an eine Zelle geliefert oder in einer Zelle als Ganzes exprimiert wird). Zum Beispiel erhält das Split-Cas9-Protein oder der Split-Prime-Editor mindestens 50 % (z. B. mindestens 50 %, mindestens 60 %, mindestens 70 %, mindestens 80 %, mindestens 90 %, mindestens 95 %, mindestens 98 %, mindestens 99 % oder 100 %) der Aktivität des ursprünglichen Cas9- Proteins oder Prime-Editors. In einigen Ausführungsformen ist das Split-Cas9-Protein oder der Split-Prime-Editor aktiver (z. B. 2-fach, 5-fach, 10-fach, 100-fach, 1000-fach oder mehr) als das eines ursprünglichen Cas9-Proteins oder -Prime-Editors.
Die hierin beschriebenen Zusammensetzungen können einem Patienten, der diese benötigt, in einer therapeutisch wirksamen Menge verabreicht werden, um eine Krankheit oder Störung zu behandeln und/oder zu verhindern, an der der Patient leidet. Jede Krankheit oder Störung, die mit CRISPR/Cas9-basierter Genom Editing-Technologie behandelt und/oder verhindert werden kann, kann durch das hier beschriebene Split-Cas9-Protein oder den Split- Multi-Flap Prime-Editor behandelt werden. Es versteht sich, dass, wenn die Nukleotidsequenzen, die das Split-Cas9-Protein oder den Multi-Flap Prime-Editor kodieren, nicht weiter eine gRNA kodieren, ein separater Nukleinsäurevektor, der die gRNA kodiert, zusammen mit den hierin beschriebenen Zusammensetzungen eingeschleust werden kann.
Beispielhafte geeignete Krankheiten, Störungen oder Zustände umfassen, ohne darauf beschränkt zu sein, die Krankheit oder Störung ausgewählt aus der Gruppe bestehend aus: Mukoviszidose, Phenylketonurie, epidermolytische Hyperkeratose (EHK), chronisch obstruktive Lungenerkrankung (chronic obstructive pulmonary disease - COPD), Charcot- Marie-Toot-Krankheit Typ 4J , Neuroblastom (NB), von Willebrand-Krankheit (von Willebrand disease - vWD), angeborene Myotonie, hereditäre renale Amyloidose, dilatative Kardiomyopathie, hereditäres Lymphödem, familiäre Alzheimer-Krankheit, Prionenerkrankung, chronisches infantiles neurologisches kutanes Gelenksyndrom (chronic infantile neurologic cutaneous articular syndrome - CINCA), angeborene Taubheit, Niemann- Pick-Krankheit Typ C (NPC) und Desmin-bedingte Myopathie (desmin-related myopathy - DRM). In bestimmten Ausführungsformen handelt es sich bei der Krankheit oder dem Zustand um die Niemann-Pick-Krankheit Typ C (NPC).
In einigen Ausführungsformen ist die Krankheit, Störung oder der Zustand mit einer Punktmutation in einem NPC-Gen, einem DNMTI-Gen, einem PCSK9-Gen oder einem TMC1-Gen verbunden. In bestimmten Ausführungsformen ist die Punktmutation eine T3182C- Mutation in NPC, die zu einer I1061T-Aminosäuresubstitution führt.
In bestimmten Ausführungsformen ist die Punktmutation eine A545G-Mutation in TMC1, die zu einer Y182C-Aminosäuresubstitution führt. TMCI kodiert ein Protein, das mechanosensitive Ionenkanäle in sensorischen Haarzellen des Innenohrs bildet und für eine normale Hörfunktion benötigt wird. Die Aminosäuresubstitution Y182C ist mit angeborener Taubheit verbunden.
In einigen Ausführungsformen ist die Krankheit, Störung oder Erkrankung mit einer Punktmutation verbunden, die ein Stopcodon erzeugt, beispielsweise ein vorzeitiges Stopcodon innerhalb der kodierenden Region eines Gens.
Zu weiteren beispielhaften Kranheiten, Störungen und Erkrankungen gehören Mukoviszidose (siehe z. B. Schwank et al., Functional Repair of CFTR by CRISPR/Cas9 in intestinal stem cell organoids of cystic fibrosis patients. Cell stem cell. 2013; 13: 653-658; und Wu et. al., Correction of a genetic disease in mouse via use of CRISPR-Cas9. Cell stem cell. 2013; 13: 659-662, von denen keiner ein Desaminase-Fusionsprotein verwendet, um den genetischen Defekt zu korrigieren); Phenylketonurie - z. B. Phenylalanin-Serin-Mutation an Position 835 (Maus) oder 240 (Mensch) oder ein homologer Rest im Phenylalanin- Hydroxylase-Gen (T>C-Mutation) - siehe z. B. McDonald et al., Genomics. 1997; 39:402- 405; Bernard-Soulier syndrome (BSS) - z. B. Mutation von Phenylalanin zu Serin an Position 55 oder einem homologen Rest oder Cystein zu Arginin an Rest 24 oder einem homologen Rest im Thrombozytenmembran-Glykoprotein IX (T>C-Mutation) - siehe z. B. Noris et al., British Journal of Haematology. 1997; 97: 312-320, und Ali et al., Hematol. 2014; 93: 381- 384; epidermolytische Hyperkeratose (EHK) - z. B. Leucin-zu-Prolin-Mutation an Position 160 oder 161 (bei Zählung des Initiator-Methionins) oder ein homologer Rest in Keratin 1 (T>C-Mutation) - siehe z. B. Chipev et al., Cell. 1992; 70: 821-828, siehe auch Zugangsnummer P04264 in der UNIPROT-Datenbank unter www[dot]uniprot[dot]org; Chronisch obstruktive Lungenerkrankung (COPD) - z. B. Mutation von Leucin zu Prolin an Position 54 oder 55 (wenn das Initiator-Methionin gezählt wird) oder ein homologer Rest in prozessierter Form von α1-Antitrypsin oder Rest 78 in unprozessierter Form oder ein homologer Rest (T>C-Mutation) - siehe z. B. Poller et al., Genomics. 1993; 17: 740-743, siehe auch Zugangsnummer P01011 in der UNIPROT-Datenbank; Charcot-Marie-Toot-Krankheit Typ 4J - z. B. Isoleucin-Threonin-Mutation an Position 41 oder ein homologer Rest in 4 (T>C-Mutation) - siehe z. B. Lenk et al., PLoS Genetics. 2011; 7: e1002104; Neuroblastom (NB) - z. B. Leucin-zu-Prolin-Mutation an Position 197 oder ein homologer Rest in Caspase- 9 (T>C-Mutation) - siehe z. B. Kundu et al., 3 Biotech. 2013, 3:225-234; von-Willebrand- Krankheit (vWD) - z. B. Cystein-Arginin-Mutation an Position 509 oder ein homologer Rest in der prozessierten Form des von-Willebrand-Faktors oder an Position 1272 oder ein homologer Rest in der unprozessierten Form des von-Willebrand-Faktors (T>C-Mutation) - siehe z. B. Lavergne et al., Br. J. Haematol. 1992, siehe auch Zugangsnummer P04275 in der UNIPROT-Datenbank; 82: 66-72; Angeborene Myotonie - z. B. Cystein-Arginin-Mutation an Position 277 oder ein homologer Rest im Muskelchloridkanal-Gen CLCN1 (T>C-Mutation) - siehe z. B. Weinberger et al., The J. of Physiology. 2012; 590: 3449-3464; hereditäre renale Amyloidose - z. B. Stoppcodon-zu-Arginin-Mutation an Position 78 oder ein homologer Rest in der prozessierten Form von Apolipoprotein AII oder an Position 101 oder ein homologer Rest in der nicht prozessierten Form (T>C-Mutation) - siehe z. B. Yazaki et al., Kidney Int. 2003; 64: 11-16; dilatative Kardiomyopathie (DCM) - z. B. Tryptophan-Arginin-Mutation an Position 148 oder ein homologer Rest im FOXD4-Gen (T>C-Mutation), siehe z. B. Minoretti et. al., Int. J. of Mol. Med. 2007; 19: 369-372; hereditäres Lymphödem - z. B. Histidin- Arginin-Mutation an Position 1035 oder ein homologer Rest in der VEGFR3-Tyrosinkinase (A>G-Mutation), siehe z. B. Irrthum et al., Am. J. Hum. Genet. 2000; 67: 295-301; familiäre Alzheimer-Krankheit - z. B. Isoleucin-zu-Valin-Mutation an Position 143 oder ein homologer Rest in Presenilin1 (A>G-Mutation), siehe z. B. Gallo et. al., J. Alzheimer's disease. 2011; 25: 425-431; Prionenerkrankung - z. B. Methionin-zu-Valin-Mutation an Position 129 oder ein homologer Rest im Prionprotein (A>G-Mutation) - siehe z. B. Lewis et. al., J. of General Virology. 2006; 87: 2443-2449; Chronisches infantiles neurologisches kutanes Gelenksyndrom (CINCA) - z. B. Tyrosin-Cystein-Mutation an Position 570 oder ein homologer Rest in Cryopyrin (A>G-Mutation) - siehe z. B. Fujisawa et. al. Blood. 2007; 109: 2903-2911; und Desmin-bedingte Myopathie (DRM) - z. B. Arginin-zu-Glycin-Mutation an Position 120 oder ein homologer Rest in αβ-Kristallin (A>G-Mutation) - siehe z. B. Kumar et al., J. Biol. Chem. 1999; 274: 24137-24141. Der gesamte Inhalt aller Referenzen und Datenbankeinträge ist hierin durch Bezugnahme aufgenommen.
Trinukleotid-Repeat-Expansion-Krankheit
Die Trinukleotid-Repeat-Expansion wird mit einer Reihe humaner Krankheiten in Verbindung gebracht, die unter anderem die Huntington-Krankheit, das Fragile-X-Syndrom und die Friedreich-Ataxie beinhalten. Das häufigste Trinukleotid-Repeat enthält CAG- Tripletts, obwohl auch GAA-Tripletts (Friedreich-Ataxie) und CGG-Tripletts (Fragile-X- Syndrom) vorkommen. Die Vererbung einer Veranlagung zur Expansion oder der Erwerb eines bereits expandierten elterlichen Allels erhöht die Wahrscheinlichkeit, die Krankheit zu erwerben. Pathogene Expansionen von Trinukleotid-Wiederholungen könnten hypothetisch unter Verwendung von Multi-Flap-Prime-Editing korrigiert werden.
Eine Region stromaufwärts der Repeat-Region kann von einer RNA-gesteuerten Nuklease gesplittet und dann verwendet werden, um die Synthese eines neuen DNA-Strangs zu starten, der eine gesunde Anzahl von Repeats enthält (die von dem jeweiligen Gen und der jeweiligen Krankheit abhängt), in Übereinstimmung mit den allgemeinen Mechanismus, der in 1G oder 22 umrissen ist. Nach der Wiederholungssequenz wird ein kurzer Homologieabschnitt hinzugefügt, der mit der Identität der Sequenz neben dem anderen Ende der Wiederholung (roter Strang) übereinstimmt. Die Invasion des neu synthetisierten Strangs durch das TPRT-System und der anschließende Austausch der endogenen DNA durch den neu synthetisierten Flap führt zu einem kontrahierten Repeat-Allel. Der Begriff „kontrahiert“ bezieht sich auf eine Verkürzung der Länge der Nukleotid-Wiederholungsregion, was zu einer Reparatur der Trinukleotid-Wiederholungsregion führt.
Die hierin beschriebenen Mulit-Flap-Prime-Editing-Systeme (z. B. Dual-Flap- und Quadruple-Flap-Prime-Editing-Systeme) können verwendet werden, um Trinukleotid-Repeat- Mutationen (oder „Triplett-Expansions-Krankheiten“) zu kontrahieren und Krankheiten wie Chorea Huntington und andere Trinukleotid-Repeat-Krankheiten zu behandeln. Trinukleotid- Repeat-Expansionsstörungen sind komplexe, fortschreitende Störungen, die die Entwicklungsneurobiologie betreffen und häufig die Kognition sowie sensomotorische Funktionen beeinträchtigen. Die Störungen zeigen eine genetische Antizipation (d. h. eine Zunahme des Schweregrades mit jeder Generation). Die DNA-Erweiterungen oder - Kontraktionen erfolgen normalerweise meiotisch (d. h. während der Gametogenese oder früh in der Embryonalentwicklung) und haben oft einen Sex-Bias, was bedeutet, dass einige Gene nur durch das Weibchen, andere nur durch das Männchen vererbt werden. Beim Menschen können Trinukleotid-Repeat-Expansionsstörungen entweder auf Transkriptions- oder Translationsebene Gen-Silencing verursachen, was die Genfunktion im Wesentlichen ausschaltet. Alternativ können Trinukleotid-Repeat-Expansionsstörungen veränderte Proteine verursachen, die mit großen repetitiven Aminosäuresequenzen erzeugt werden, die die Proteinfunktion entweder aufheben oder verändern, oft auf dominant-negative Weise (z. B. Polyglutamin-Erkrankungen).
Ohne an eine Theorie gebunden sein zu wollen, wird die Triplettexpansion durch Schlupf während der DNA-Replikation oder während der DNA-Reparatursynthese verursacht. Da die Tandem-Repeats untereinander identische Sequenzen aufweisen, kann die Basenpaarung zwischen zwei DNA-Strängen an mehreren Stellen entlang der Sequenz stattfinden. Dies kann zur Bildung von „Loop-out“-Strukturen während der DNA-Replikation oder DNA-Reparatursynthese führen. Dies kann zu einem wiederholten Kopieren der wiederholten Sequenz führen, wodurch die Anzahl der Wiederholungen erhöht wird. Zusätzliche Mechanismen, die hybride RNA:DNA-Zwischenprodukte beinhalten, wurden vorgeschlagen. Multi-Flap-Prime-Editing kann verwendet werden, um diese Triplett- Expansionsregionen durch Deletion eines oder mehrerer der problematischen Wiederholungscodontripletts zu reduzieren oder zu eliminieren. In einer Ausführungsform dieser Verwendung stellt 23 ein Schema einer PEgRNA-Ausgestaltung zum Kontrahieren oder Reduzieren von Trinukleotid-Wiederholungssequenzen mit Prime-Editing bereit.
Multi-Flap-Prime-Editing kann implementiert werden, um Triplett- Expansionsregionen zu kontrahieren, indem man eine Region stromaufwärts der Triplett- Repeat-Region mit dem Prime-Editor schneidet, der eine PEgRNA umfasst, die auf die Schnittstelle ausgerichtet ist. Der Prime-Editor synthetisiert dann einen neuen DNA-Strang (ssDNA-Flap) basierend auf der PEgRNA als Templat (d. h. das Edit-Templat davon), das eine gesunde Anzahl von Triplett-Wiederholungen kodiert (was von dem jeweiligen Gen und der jeweiligen Krankheit abhängt). Der neu synthetisierte ssDNA-Strang, der die gesunde Triplett- Wiederholungssequenz umfasst, wird auch so synthetisiert, dass er einen kurzen Homologieabschnitt (d. h. den Homologiearm) umfasst, der mit der Sequenz neben dem anderen Ende der Wiederholung (roter Strang) übereinstimmt. Die Invasion des neu synthetisierten Strangs und der anschließende Austausch der endogenen DNA durch den neu synthetisierten ssDNA-Flap führt zu einem kontrahierten Repeat-Allel.
Abhängig von der jeweiligen Trinukleotid-Expansionsstörung können die defektinduzierenden Triplett-Expansionen in „Trinukleotid-Repeat-Expansionsproteinen“ auftreten. Trinukleotid-Repeat-Expansionsproteine sind ein vielfältiger Satz von Proteinen, die mit der Anfälligkeit für die Entwicklung einer Trinukleotid-Repeat-Expansionsstörung, dem Vorliegen einer Trinukleotid-Repeat-Expansionsstörung, der Schwere einer Trinukleotid- Repeat-Expansionsstörung oder einer beliebigen Kombination davon verbunden sind. Trinukleotid-Repeat-Expansionsstörungen werden in zwei Kategorien unterteilt, die durch die Art der Wiederholung bestimmt werden. Die häufigste Wiederholung ist das Triplett CAG, das, wenn es in der kodierenden Region eines Gens vorhanden ist, die Aminosäure Glutamin (Q) kodiert. Daher werden diese Störungen als Polyglutamin (polyQ)-Störungen bezeichnet und umfassen die folgenden Krankheiten: Huntington-Krankheit (Huntington Disease - HD); Spinobulbäre Muskelatrophie (Spinobulbar Muscular Atrophy - SBMA); Spinozerebelläre Ataxien (Spinocerebellar Ataxias - SCA-Typen 1, 2, 3, 6, 7 und 17); und Dentatorubro- Pallidoluysian Atrophie (DRPLA). Die verbleibenden Trinukleotid-Repeat- Expansionsstörungen betreffen entweder nicht das CAG-Triplett oder das CAG-Triplett befindet sich nicht in der kodierenden Region des Gens und werden daher als Nicht- Polyglutamin-Störungen bezeichnet. Die Nicht-Polyglutamin-Störungen umfassen das Fragile- X-Syndrom (FRAXA); Fragile XE Mental Retardation (FRAXE); Friedreich-Ataxie (FRDA); Myotone Dystrophie (DM); und Spinozerebelläre Ataxien (SCA-Typen 8 und 12).
Die Proteine, die mit Trinukleotid-Repeat-Expansionsstörungen assoziiert sind, können basierend auf einer experimentellen Assoziation des Proteins, das mit einer Trinukleotid- Repeat-Expansionsstörung assoziiert ist, zu einer Trinukleotid-Repeat-Expansionsstörung ausgewählt werden. Zum Beispiel kann die Produktionsrate oder zirkulierende Konzentration eines Proteins, das mit einer Trinukleotid-Repeat-Expansionsstörung assoziiert ist, in einer Population mit einer Trinukleotid-Repeat-Expansionsstörung relativ zu einer Population, der die Trinukleotid-Repeat-Expansionsstörung fehlt, erhöht oder erniedrigt sein. Unterschiede in den Proteinspiegeln können unter Verwendung proteomischer Techniken bewertet werden, einschließlich unter anderem Western Blot, immunhistochemische Färbung, Enzyme-Linked Immunosorbent Assay (ELISA) und Massenspektrometrie. Alternativ können die Proteine, die mit Trinukleotid-Repeat-Expansionsstörungen assoziiert sind, identifiziert werden, indem Genexprimierungsprofile der Gene, die die Proteine kodieren, unter Verwendung genomischer Techniken erhalten werden, einschließlich unter anderem DNA-Mikroarray-Analyse, serielle Analyse der Genexprimierung (SAGE) und quantitative Echtzeit Polymerase-Kettenreaktion (Q-PCR).
Nicht einschränkende Beispiele für Proteine, die mit Trinukleotid-Repeat- Expansionsstörungen assoziiert sind und durch Multi-Flap-Prime-Editing korrigiert werden können, beinhalten AR (Androgenrezeptor), FMR1 (fragile X mentale Retardation 1), HTT (Huntingtin), DMPK (Dystrophia myotonica-Proteinkinase), FXN (Frataxin), ATXN2 (Ataxin 2), ATN1 (Atrophin 1). FEN1 (Flap struktur-spezifische Endonuklease 1), TNRC6A (Trinukleotidwiederholung enthaltend 6A), PABPNa (Poly(A) bindendes Protein, Nuklear 1), JPH3 (Junctophilin 3), MED15 (Mediatorkomplex-Untereinheit 15), ATXN1 (Ataxin 1), ATXN3 (Ataxin 3), TBP (TATA-Box-Bindungsprotein), CACNA1A (Calciumkanal, spannungsabhängig, P/Q-Typ, alpha 1A-Untereinheit), ATXN80S (ATXN8-Gegenstrang (nicht proteinkodierend)), PPP2R2B (Proteinphosphatase 2, regulatorische Untereinheit B, Beta), ATXN7 (Ataxin 7), TNRC6B (Trinukleotid-Wiederholung mit 6B), TNRC6C (Trinukleotid-Wiederholung mit 6C), CELF3 (CUGBP, Elav-ähnliches Familienmitglied 3), MAB21L1 (mab-21-like 1 (C. elegans)), MSH2 (mutS-Homolog 2, Dickdarmkrebs, nonpo Lyposis Typ 1 (E. coli)), TMEM185A (Transmembranprotein 185A), SIX5 (SIX Homöobox 5), CNPY3 (Canopy 3-Homolog (Zebrafisch)), FRAXE (fragile Stelle, Folsäuretyp, selten, fra(X)(q28) E), GNB2 (Guaninnukleotid-bindendes Protein (G-Protein), Beta-Polypeptid 2), RPL14 (ribosomales Protein L14), ATXN8 (Ataxin 8), INSR (Insulinrezeptor), TTR (Transthyretin), EP400 (E1A-bindendes Protein p400), GIGYF2 (GRB10 interagierendes GYF-Protein 2), OGG1 (8-Oxoguanin-DNA-Glykosylase), STC1 (Stanniocalcin 1), CNDP1 (Carnosindipeptidase 1 (Metallopeptidase M20-Familie)), C10orf2 (Chromosom 10 offener Leseraster 2), MAML3 Mastermind-like 3 (Drosophila.)), DKC1 (Dyskeratosis congenita 1, Dyskerin), PAXIP1 (PAX interagierendes (mit Transkriptions-Aktivierungsdomäne) Protein 1), CASK (Calcium/Calmodulin-abhängige Serinproteinkinase (MAGUK-Familie)), MAPT (Mikrotubuli-assoziiertes Protein Tau) , SP1 (Sp1-Transkriptionsfaktor), POLG (Polymerase (DNA-gerichtet), Gamma), AFF2 (AF4/FMR2-Familie, Mitglied 2), THBS1 (Thrombospondin 1), TP53 (Tumo r-Protein p53), ESR1 (Östrogenrezeptor 1), CGGBP1 (CGG-Triplett-Repeat-Bindungsprotein 1), ABT1 (Aktivator der basalen Transkription 1), KLK3 (Kallikrein-related Peptidase 3), PRNP (Prionprotein), JUN (Jun Onkogen), KCNN3 (Kalium-Intermediat/Kalzium-aktivierter Kanal mit geringer Leitfähigkeit, Unterfamilie N, Mitglied 3), BAX (BCL2-assoziiertes X-Protein), FRAXA (fragile Stelle, Folsäure-Typ, selten, fra(X)(q27.3) A (Makroorchismus, geistige Behinderung)), KTBBD10 (Kelch-Repeat und BTB (POZ)-Domäne mit 10), MBNL1 (muskelblindartig (Drosophila)), RAD51 (RAD51- Homolog (RecA-Homolog, E. coli) (S. cerevisiae)), NCOA3 (Kernrezeptor-Koaktivator 3), ERDA1 (erweiterte Wiederholungsdomäne, CAG/CTG 1), TSC1 (tuberöse Sklerose 1), COMP (Oligomeres Matrixprotein des Knorpels), GCLC (Glutamat-Cystein-Ligase, katalytische Untereinheit), RRAD (Ras-verwandt mit Diabetes), MSH3 (mutS-Homolog 3 (E. coli)), DRD2 (Dopaminrezeptor D2), CD44 (CD44-Molekül (indische Blutgruppe)), CTCF (CCCTC-bindender Faktor (Zinkfingerprotein))), CCND1 (Cyclin D1), CLSPN (Claspin- Homolog (Xenopus laevis)), MEF2A (Myozyten-Enhancer-Faktor 2A), PTPRU (Protein- Tyrosin-Phosphatase, Rezeptortyp, U), GAPDH (Glyceraldehyd-3-Phosphat-Dehydrogenase), TRIM22 (dreiteiliges Motiv-enthaltend 22), WT1 (Wilms-Tumor 1), AHR (Aryl- Kohlenwasserstoff-Rezeptor), GPX1 (Glutathionperoxidase 1), TPMT (Thiopurin-S- Methyltransferase), NDP (Norrie-Krankheit (Pseudogliom)), ARX (aristaless related .) Homöobox), MUS81 (MUS81 Endonuklease-Homolog (S. cerevisiae)), TYR (Tyrosinase (okulokutaner Albinismus IA)), EGR1 (frühe Wachstumsreaktion 1), UNG (Uracil-DNA- Glykosylase), NUMBL (taubes Homolog (Drosophila)-like), FABP2 (Fettsäurebindendes Protein 2, intestinal), EN2 (engrailed homeobox 2), CRYGC (Crystallin, Gamma C), SRP14 (Signalerkennungspartikel 14 kDa (homologes Alu-RNA-Bindungsprotein)), CRYGB (Crystallin, Gamma B), PDCD1 (programmierter Zelltod 1), HOXA1 (Homöobox A1), ATXN2L (Ataxin 2-like), PMS2 (PMS2 postmeiotische Segregation erhöht 2 (S. cerevisiae)), GLA (Galactosidase, alpha), CBL (Cas-Br-M (murin) ecotropic retroviral transforming sequence), FTH1 (Ferritin, schweres Polypeptid 1), IL12RB2 (Interleukin-12-Rezeptor, Beta 2), OTX2 (Orthodentikel-Homöobox 2), HOXA5 (Homöobox A5), POLG2 (Polymerase (DNA-gerichtet), Gamma 2, akzessorische Untereinheit), DLX2 (distallose Homöobox 2), SIRPA (signalregulatorisches Protein alpha), OTX1 (orthodentikuläre Homöobox 1), AHRR (Aryl-Kohlenwasserstoff-Rezeptor-Repressor), MANF (Mesencephalic Astrocyte-derived neurotrophic factor), TMEM158 (Transmembranprotein 158 (Gen/Pseudogen)) und ENSG00000078687.
In einem besonderen Aspekt stellt die vorliegende Offenbarung TPRT-basierte Verfahren zur Behandlung eines Patienten bereit, bei dem eine Expansions-Repeat-Störung diagnostiziert wurde (auch bekannt als eine Repeat-Expansions-Störung oder eine Trinukleotid-Repeat-Störung). Expansions-Wiederholungsstörungen treten auf, wenn Mikrosatelliten-Wiederholungen über einen Schwellenwert hinaus expandieren. Derzeit wird angenommen, dass mindestens 30 genetische Krankheiten durch wiederholte Ausbreitung verursacht werden. Das wissenschaftliche Verständnis dieser vielfältigen Gruppe von Erkrankungen kam in den frühen 1990er Jahren mit der Entdeckung ans Licht, dass Trinukleotid-Wiederholungen mehreren bedeutenden Erbkrankheiten zugrunde liegen, darunter Fragiles X, Spinale und Bulbäre Muskelatrophie, Myotone Dystrophie und Chorea Huntington (Nelson et al. „The unstable repeats - three evolving faces of neurological disease“, Neuron, March 6, 2013, Vol.77; 825-843, die hierin durch Bezugnahme aufgenommen ist), sowie Haw-River-Syndrom, Jacobsen-Syndrom, Dentatorubral-Pallidoluysian-Atrophie (DRPLA), Machado-Joseph-Krankheit, Synpolydaktylie (SPD II), Hand-Fuß-Genitalsyndrom (HFGS), Kleidokranielle Dysplasie (CCD), Holoprosenzephalie-Erkrankung (HPE), Angeborenes zentrales Hypventilationssyndrom (CCHS), ARX-nicht-syndromale X- chromosomale geistige Behinderung (XLMR) und okulopharyngeale Muskeldystrophie (OPMD) (siehe. Es wurde festgestellt, dass die wiederholte Instabilität von Mikrosatelliten ein Kennzeichen dieser Bedingungen ist, ebenso wie die Antizipation - das Phänomen, bei dem mit jeder nachfolgenden Generation eine Wiederholungsexpansion auftreten kann, was zu einem schwereren Phänotyp und einem früheren Erkrankungsalter bei den Nachkommen führt. Es wird angenommen, dass wiederholte Expansionen über verschiedene Mechanismen Krankheiten verursachen. Expansionen können nämlich die zelluläre Funktion auf der Ebene des Gens, des mRNA-Transkripts und/oder des kodierten Proteins beeinträchtigen. Unter einigen Bedingungen wirken Mutationen über einen Funktionsverlustmechanismus, indem sie Wiederholungsgene stummschalten. In anderen Fällen resultieren die Erkrankungen aus Gainof-Function-Mechanismen, bei denen entweder das mRNA-Transkript oder das Protein neue, abweichende Funktionen übernimmt.
In einer Ausführungsform ist ein Verfahren zur Behandlung einer Trinukleotid- Repeat-Störung in 23 dargestellt. Im Allgemeinen beinhaltet der Ansatz die Verwendung von TPRT Genom Editing (d. h. Multi-Flap-Prime-Editing) in Kombination mit einer verlängerten gRNA, die eine Region umfasst, die eine gewünschte und gesunde Austausch- Trinukleotid-Wiederholungssequenz kodiert, die die endogene kranke Trinukleotid- Wiederholungssequenz durch den Mechanismus des Hauptbearbeitungsprozesses ersetzen soll. Ein Schema einer beispielhaften gRNA-Ausgestaltung zum Kontrahieren von Trinukleotid- Repeat-Sequenzen und Trinukleotid-Repeat-Kontraktion mit TPRT-Genom-Editing (d. h. Multi-Flap-Prime-Editing) ist in 23 gezeigt.
Prionenerkrankung
Multi-Flap-Prime-Editing kann auch verwendet werden, um das Fortschreiten der Prionenerkrankung zu verhindern oder zu stoppen, indem eine oder mehrere schützende Mutationen in Prionenproteine (PRNP) eingebaut werden, die im Verlauf der Krankheit fehlgefaltet werden. Prionenerkrankungen oder übertragbare spongiforme Enzephalopathien (transmissible spongiform encephalopathies - TSE) sind eine Familie seltener progressiver neurodegenerativer Erkrankungen, die sowohl Menschen als auch Tiere betreffen. Sie zeichnen sich durch lange Inkubationszeiten, charakteristische spongiforme Veränderungen, die mit neuronalem Verlust verbunden sind, und ein Versagen, eine Entzündungsreaktion auszulösen, aus.
Beim Menschen umfasst die Prionerkrankung die Creutzfeldt-Jakob-Krankheit (Creutzfeldt-Jakob Disease - CJD), die Variante der Creutzfeldt-Jakob-Krankheit (Variant Creutzfeldt-Jakob Disease - vCJD), das Gerstmann-Straussler-Scheinker-Syndrom, die tödliche familiäre Schlaflosigkeit und Kuru. Bei Tieren umfasst die Prionenerkrankung die bovine spongiforme Enzephalopathie (BSE oder „Rinderwahnsinn“), die chronische Auszehrungskrankheit (Chronic Wasting Disease - CWD), Scrapie, die übertragbare Nerz- Enzephalopathie, die feline spongiforme Enzephalopathie und die spongiforme Enzephalopathie bei Huftieren. Multi-Flap-Prime-Editing kann verwendet werden, um schützende Punktmutationen in ein Prionenprotein einzubauen, um das Fortschreiten einer dieser Prionenkrankheiten zu verhindern oder zu stoppen.
Die klassische CJD ist eine humane Prionenerkrankung. Es handelt sich um eine neurodegenerative Erkrankung mit charakteristischen klinischen und diagnostischen Merkmalen. Diese Krankheit ist schnell fortschreitend und immer tödlich. Eine Infektion mit dieser Krankheit führt in der Regel innerhalb von 1 Jahr nach Krankheitsbeginn zum Tod. CJD ist eine schnell fortschreitende, ausnahmslos tödliche neurodegenerative Erkrankung, von der angenommen wird, dass sie durch eine abnormale Isoform eines zellulären Glykoproteins, das als Prionprotein bekannt ist, verursacht wird. CJD tritt weltweit auf und die geschätzte jährliche Inzidenz in vielen Ländern, einschließlich der Vereinigten Staaten, wird mit etwa einem Fall pro Million Einwohner angegeben. Die überwiegende Mehrheit der CJD-Patienten stirbt normalerweise innerhalb eines Jahres nach Krankheitsbeginn. CJD wird zusammen mit anderen Prionenerkrankungen, die bei Mensch und Tier vorkommen, als übertragbare spongiforme Enzephalopathie (TSE) klassifiziert. Bei etwa 85 % der Patienten tritt CJD als sporadische Erkrankung ohne erkennbares Übertragungsmuster auf. Ein geringerer Anteil der Patienten (5 bis 15 %) entwickelt CJD aufgrund von vererbten Mutationen des Prionprotein- Gens. Zu diesen Erbformen gehören das Gerstmann-Straussler-Scheinker-Syndrom und die tödliche familiäre Schlaflosigkeit. Derzeit ist keine Behandlung für CJD bekannt.
Die Variante Creutzfeldt-Jakob-Krankheit (vCJD) ist eine Prionenerkrankung, die erstmals 1996 im Vereinigten Königreich beschrieben wurde. Es gibt inzwischen starke wissenschaftliche Beweise dafür, dass der Erreger, der für den Ausbruch der Prionenerkrankung bei Kühen, der bovinen spongiformen Enzephalopathie (BSE oder „Rinderwahn“), derselbe Erreger ist, der für den Ausbruch der vCJD beim Menschen verantwortlich ist. Die variante CJD (vCJD) ist nicht dieselbe Krankheit wie die klassische CJD (oft einfach CJD genannt). Sie hat andere klinische und pathologische Merkmale als die klassische CJD. Jede Erkrankung weist ebenso ein bestimmtes genetisches Profil des Prionprotein-Gens auf. Beide Erkrankungen sind ausnahmslos tödliche Hirnerkrankungen mit ungewöhnlich langen Inkubationszeiten, gemessen in Jahren, und werden durch einen unkonventionellen übertragbaren Erreger namens Prion verursacht. Derzeit ist keine Behandlung für vCJD bekannt.
BSE (bovine spongiforme Enzephalopathie oder „Rinderwahnsinn“) ist eine fortschreitende neurologische Erkrankung von Rindern, die aus einer Infektion mit einem ungewöhnlichen übertragbaren Erreger namens Prion resultiert. Die Natur des übertragbaren Mittels ist noch nicht richtig verstanden. Derzeit ist die am meisten akzeptierte Theorie, dass der Erreger eine modifizierte Form eines normalen Proteins ist, das als Prionprotein bekannt ist. Aus noch nicht verstandenen Gründen geht das normale Prionprotein in eine pathogene (schädliche) Form über, die dann das Zentralnervensystem von Rindern schädigt. Es gibt zunehmend Hinweise darauf, dass es verschiedene BSE-Stämme gibt: den typischen oder klassischen BSE-Stamm, der für den Ausbruch im Vereinigten Königreich verantwortlich ist, und zwei atypische Stämme (H- und L-Stämme). Derzeit ist keine Behandlung für BSE bekannt.
Die chronische Auszehrungskrankheit (Chronic Wasting Disease - CWD) ist eine Prionenkrankheit, die Hirsche, Elche, Rentiere, Sikahirsche und Elentiere befällt. Sie wurde in einigen Gebieten Nordamerikas entdeckt, darunter Kanada und die Vereinigten Staaten, Norwegen und Südkorea. Es kann über ein Jahr dauern, bis ein infiziertes Tier Symptome entwickelt, die drastischen Gewichtsverlust (Auszehrung), Stolpern, Antriebslosigkeit und andere neurologische Symptome beinhalten können. CWD kann Tiere jeden Alters betreffen und einige infizierte Tiere können sterben, ohne die Krankheit jemals zu entwickeln. CWD ist für Tiere tödlich und es gibt keine Behandlungen oder Impfstoffe.
Als Erreger von TSE gelten Prionen. Der Begriff „Prionen“ bezieht sich auf abnormale, pathogene Erreger, die übertragbar und in der Lage sind, eine abnormale Faltung bestimmter normaler zellulärer Proteine, genannt Prionenproteine, die am häufigsten im Gehirn vorkommen, zu induzieren. Die Funktionen dieser normalen Prionenproteine sind noch nicht vollständig verstanden. Die abnormale Faltung der Prionenproteine führt zu Hirnschäden und den charakteristischen Anzeichen und Symptomen der Krankheit. Prionenerkrankungen sind gewöhnlich schnell fortschreitend und immer tödlich.
Wie hier verwendet, soll der Begriff „Prion“ ein infektiöses Partikel bedeuten, von dem bekannt ist, dass es bei Menschen und Tieren Krankheiten (spongiforme Enzephalopathien) verursacht. Der Begriff „Prion“ ist eine Kontraktion der Wörter „Protein“ und „Infektion“, und die Partikel bestehen größtenteils, wenn nicht ausschließlich, aus PRNP^Sc-Molekülen, die von einem PRNP-Gen kodiert werden, das PRNP^C exprimiert, das seine Konformation ändert, um zu PRNP^Sc zu werden. Prionen unterscheiden sich von Bakterien, Viren und Viroiden. Bekannte Prionen umfassen solche, die Tiere infizieren, um Scrapie zu verursachen, eine übertragbare degenerative Erkrankung des Nervensystems von Schafen und Ziegen, sowie bovine spongiforme Enzephalopathien (BSE) oder Rinderwahn und feline spongiforme Enzephalopathien bei Katzen. Vier Prionenerkrankungen, wie oben erörtert, die bekanntermaßen den Menschen betreffen, sind (1) Kuru, (2) Creutzfeldt-Jakob-Krankheit (CJD), (3) Gerstmann-Strassler-Scheinker-Krankheit (GSS) und (4) tödliche familiäre Schlaflosigkeit (FFI). Wie hierin verwendet, schließt Prion alle Formen von Prionen ein, die alle oder eine beliebige dieser Krankheiten oder andere bei allen verwendeten Tieren verursachen - und insbesondere bei Menschen und in domestizierten Nutztieren.
Im Allgemeinen und ohne an eine Theorie gebunden sein zu wollen, werden Vorerkrankungen durch Fehlfaltung von Prionenproteinen verursacht. Bei solchen Krankheiten - oft auch Ablagerungskrankheiten genannt - kann die Fehlfaltung der Prionenproteine wie folgt erklärt werden. Wenn A das normalerweise synthetisierte Genprodukt ist, das eine beabsichtigte physiologische Rolle in einem monomeren oder oligomeren Zustand ausübt, ist A* eine konformativ aktivierte Form von A, die kompetent ist, eine dramatische Konformationsänderung einzugehen, B ist der konformativ veränderte Zustand, der multimere Anordnungen (d. h. die fehlgefaltete Form, die Ablagerungen bildet) bevorzugt und B_n ist das multimere Material, das pathogen und relativ schwer zu recyceln ist. Bei den Prionenerkrankungen entsprechen PRNP^C und PRNP^Sc den Zuständen A und B_n, wobei A weitgehend helixförmig und monomer und B_n β-reich und multimer ist.
Es ist bekannt, dass bestimmte Mutationen in Prionenproteinen mit einem erhöhten Risiko einer Vorerkrankung verbunden sein können. Umgekehrt können bestimmte Mutationen in Prionenproteinen schützender Natur sein. Siehe Bagynszky et al. „Characterization of mutations in PRNP (prion) gene and their possible roles in neurodegenerative disease", Neuropsychiatr Dis Treat., 2018; 14: 2067-2085, deren Inhalt hierin durch Bezugnahme aufgenommen ist.
PRNP (NCBI RefSeq Nr. NP_000302.1 (SEQ-ID-NR: 291)) - das humane Prionprotein - wird von einem 16 kb langen Gen kodiert, das sich auf Chromosom 20 (4686151-4701588) befindet. Es enthält zwei Exons, und das Exon 2 trägt den offenen Leserahmen, der das 253 Aminosäuren (AA) lange PrP-Protein codiert. Exon 1 ist ein nicht-kodierendes Exon, das als Transkriptionsinitiationsstelle dienen kann. Die posttranslationalen Modifikationen führen zur Entfernung des ersten 22 AA N-terminalen Fragments (NTF) und des letzten 23 AA C- terminalen Fragments (CTF). Das NTF wird nach dem Transport von PrP zum endoplasmatischen Retikulum (ER) gespalten, während das CTF (Glycosylphosphatidylinositol [GPI]-Signalpeptid [GPI-SP]) durch den GPI-Anker gespalten wird. GPI-Anker könnten am PrP-Proteintransport beteiligt sein. Sie können auch eine Rolle bei der Anheftung von Prionenprotein an die äußere Oberfläche der Zellmembran spielen. Normales PrP besteht aus einer langen N-terminalen Schleife (die die Octapeptid- Wiederholungsregion enthält), zwei kurzen β-Faltblättern, drei α-Helices und einer C- terminalen Region (die den GPI-Anker enthält). Die Spaltung von PrP führt zu einem 208 AA langen Glykoprotein, das in der Zellmembran verankert ist.
Die 253-Aminosäuresequenz von PRNP (NP_000302.1) ist wie folgt:
Die 253-Aminosäuresequenz von PRNP (NP_000302.1) wird durch die folgende Nukleotidsequenz (NCBI Ref. Seq Nr. NM_000311.5, „Homo Sapiens Prionenprotein (PRNP), Transkriptvariante 1, mRNA) wie folgt kodiert:

Mutationsstellenn relativ zu PRNP (NP_000302.1), die mit CJD und FFI verknüpft sind, werden wie folgt beschrieben. Diese Mutationen können unter Verwendung der hierin offenbarten Multi-Flap-Prime-Editoren entfernt oder eingebaut werden.

MUTATION	AMINOSÄURESEQUENZ VON MUTIERTEM PRNP IN VERBINDUNG MIT CJD-PRIONERKRANKUNG (SIEHE TABELLE 1 VON BAGYNSZKY ET AL., 2018) (RELATIV ZU SEQ-ID-NR: 291 VON PRNP NP_00302.1)
D178N
T188K
E196K
E196A
E200K
E200G
V203I
R208H
V210I
E211Q
M232R

Es wird über Mutationsstellen relativ zu PRNP (NP_000302.1) (SEQ-ID-Nr: 291) berichtet, die mit GSS verknüpft sind, wie folgt:

MUTATION	AMINOSÄURESEQUENZ VON MUTIERTEM PRNP IN VERBINDUNG MIT GSS-PRIONERKRANKUNG (SIEHE TABELLE 2 VON BAGYNSZKY ETAL., 2018) (RELATIV ZU SEQ-ID-NR: 291 VON PRNP NP_00302. 1)
P102L
P105L
A117V
G131V
V176G
H187R

F198S
D202N
Q212P
Q217R
M232T

Mutationsstellen relativ zu PRNP (NP_000302.1) (SEQ-ID-Nr: 291), die mit einem möglichen Schutzcharakter gegen Prionenerkrankungen verbunden sind, wie folgt:

MUTATION	AMINOSÄURESEQUENZ VON MUTIERTEM PRNP IN VERBINDUNG MIT EINER SCHÜTZENDEN NATUR GEGEN PRIONERKRANKUNGEN (SIEHE TABELLE 4 VON BAGYNSZKY ET AL., 2018) (RELATIV ZU SEQ-ID-NR: 291 VON PRNP NP_00302.1)
MUTATION
G127S
G127V
M129V
D167G
D167N
N171S
E219K
P238S

Somit kann in verschiedenen Ausführungsformen ein Multi-Flap-Prime-Editing verwendet werden, um eine Mutation in PRNP zu entfernen, die mit einer Prionenerkrankung verbunden ist, oder eine Mutation in PRNP einzubauen, die als Schutz gegen eine Prionenerkrankung angesehen wird. Multi-Flap-Prime-Editing kann beispielsweise verwendet werden, um eine D178N-, V180I-, T188K-, E196K-, E196A-, E200K-, E200G-, V203I-, R208H-, V210I-, E211Q-, I215V- oder M232R-Mutation im PRNP-Protein (relativ zu PRNP von NP_000302.1) zu entfernen oder wiederherzustellen (Seq-ID-NR: 291). In weiteren Ausführungen kann Multi-Flap-Prime-Editing beispielsweise verwendet werden, um eine P102L-, P105L-, A117V-, G131V-, V176G-, H187R-, F198S-, D202N-, Q212P-, Q217R- oder M232R-Mutation im PRNP-Protein (relativ zu PRNP von NP_000302.1) zu entfernen oder wiederherzustellen (Seq-ID-NR: 291). Durch Entfernen oder Korrigieren des Vorhandenseins solcher Mutationen in PRNP unter Verwendung von Prime-Editing kann das Risiko einer Prionenerkrankung verringert oder eliminiert werden.
In anderen Ausführungsformen kann Multi-Flap-Prime-Editing verwendet werden, um eine schützende Mutation in PRNP einzubauen, die mit einer schützenden Wirkung gegen eine oder mehrere Prionenerkrankungen verbunden ist. Beispielsweise kann Multi-Flap-Prime- Editing verwendet werden, um eine schützende G127S-, G127V-, M129V-, D167G-, D167N- , N171S-, E219K oder P238S-Mutation im PRNP (relativ zu PRNP von NP_000302.1) einzubauen (Seq-ID-NR: 291). In noch anderen Ausführungsformen kann die schützende Mutation eine beliebige alternative Aminosäure sein, die bei G127, G127, M129, D167, D167, N171, E219 oder P238 im PRNP eingebaut ist (relativ zu PRNP von NP_000302.1) (SEQ-ID- NR: 291).
In bestimmten Ausführungsformen kann Multi-Flap-Prime-Editing verwendet werden, um eine G127V-Schutzmutation in PRNP einzubauen, wie in 27 dargestellt und in Beispiel 5 erörtert.
In einer anderen Ausführungsformen kann Prime-Editing verwendet werden, um eine E219K-Schutzmutation in PRNP einzubauen.
Das PRNP-Protein und die schützende Mutationsstelle sind bei Säugetieren konserviert, so dass es neben der Behandlung von Krankheiten beim Menschen auch dazu verwendet werden könnte, Kühe und Schafe zu erzeugen, die gegen Prionenerkrankungen immun sind, oder sogar zur Heilung von Wildpopulationen von Tieren, die an Prionenerkrankungen leiden. Prime-Editing wurde bereits eingesetzt, um -25 % eines natürlich vorkommenden schützenden Allels in humane Zellen einzubauen, und frühere Mausexperimente deuten darauf hin, dass dieser Grad des Einbaus ausreicht, um Immunität gegen die meisten Prionenerkrankungen zu bewirken. Dieses Verfahren ist die erste und möglicherweise einzige gegenwärtige Möglichkeit, dieses Allel mit so hoher Effizienz in den meisten Zelltypen einzubauen. Eine andere mögliche Behandlungsstrategie besteht darin, Prime-Editing oder Multi-Flap-Prime-Editing zu verwenden, um die Expression von PRNP zu reduzieren oder zu eliminieren, indem ein frühes Stoppcodon in das Gen eingebaut wird.
Unter Verwendung der hierin beschriebenen Prinzipien für die PEgRNA-Ausgestaltung können geeignete PEgRNAs zum Einbauen gewünschter schützender Mutationen oder zum Entfernen von Prionenerkrankung-assoziierten Mutationen aus PRNP ausgestaltet werden. Beispielsweise kann die folgende Liste von PEgRNAs verwendet werden, um das G127V- Schutzallel und das E219K-Schutzallel in humanem PRNP sowie das G127V-Schutzallel in PRNP verschiedener Tiere einzubauen.
[10] Pharmazeutische Zusammensetzungen
Andere Aspekte der vorliegenden Offenbarung beziehen sich auf pharmazeutische Zusammensetzungen, die eine der verschiedenen Komponenten des hierin beschriebenen Multi-Flap-Prime-Editing-Systems umfassen (z. B. einschließlich unter anderem die napDNAbps, Reverse Transkriptasen, Fusionsproteine (z. B. umfassend napDNAbps und reverse Transkriptasen), verlängerte Leit-RNAs und Komplexe, die Fusionsproteine und Extended-Guide-RNAs umfassen, sowie akzessorische Elemente, wie z. B. Zweitstrang- Nicking-Komponenten und endogene 5'-DNA-Flap-Entfernungsendonukleasen, um den Multi-Flap-Prime-Editing-Prozess in Richtung der editierten Produktbildung zu treiben).
Der Begriff „pharmazeutische Zusammensetzung“, wie er hier verwendet wird, bezieht sich auf eine Zusammensetzung, die zur pharmazeutischen Verwendung formuliert ist. In einigen Ausführungsformen umfasst die pharmazeutische Zusammensetzung ferner einen pharmazeutisch annehmbaren Träger. In einigen Ausführungsformen umfasst die pharmazeutische Zusammensetzung zusätzliche Mittel (z. B. zur spezifischen Einschleusung, Erhöhung der Halbwertszeit oder andere therapeutische Verbindungen).
Wie hier verwendet, bedeutet der Begriff „pharmazeutisch annehmbarer Träger“ ein pharmazeutisch annehmbares Material, eine Zusammensetzung oder ein pharmazeutisch annehmbares Vehikel, wie ein flüssiger oder fester Füllstoff, ein Verdünnungsmittel, ein Hilfsstoff, ein Herstellungshilfsmittel (z. B. Schmiermittel, Talkum Magnesium, Calcium- oder Zinkstearat, oder Sterinsäure) oder lösungsmittelverkapselndes Material, das am Tragen oder Transportieren der Verbindung von einer Stelle (z. B. der Einschleusungsstelle) des Körpers zu einer anderen Stelle (z. B. Organ, Gewebe oder Körperteil) beteiligt ist. Ein pharmazeutisch annehmbarer Träger ist „annehmbar“ in dem Sinne, dass er mit den anderen Bestandteilen der Formulierung kompatibel ist und das Gewebe des Patienten nicht schädigt (z. B. physiologisch kompatibel, steril, physiologischer pH-Wert usw.). Einige Beispiele für Materialien, die als pharmazeutisch verträgliche Träger dienen können, beinhalten: (1) Zucker, wie Lactose, Glucose und Saccharose; (2) Stärken, wie Maisstärke und Kartoffelstärke; (3) Zellulose und deren Derivate, wie Natriumcarboxymethylzellulose, Methylzellulose, Ethylzellulose, mikrokristalline Zellulose und Zelluloseacetat; (4) pulverisierter Traganth; (5) Malz; (6) Gelatine; (7) Schmiermittel, wie Magnesiumstearat, Natriumlaurylsulfat und Talk; (8) Hilfsstoffe, wie Kakaobutter und Zäpfchenwachse; (9) Öle, wie Erdnussöl, Baumwollsamenöl, Distelöl, Sesamöl, Olivenöl, Maisöl und Sojabohnenöl; (10) Glykole, wie Propylenglykol; (11) Polyole, wie Glycerin, Sorbit, Mannit und Polyethylenglycol (PEG); (12) Ester, wie Ethyloleat und Ethyllaurat; (13) Agar; (14) Puffermittel, wie Magnesiumhydroxid und Aluminiumhydroxid; (15) Alginsäure; (16) pyrogenfreies Wasser; (17) isotonische Kochsalzlösung; (18) Ringer-Lösung; (19) Ethylalkohol; (20) pH-gepufferte Lösungen; (21) Polyester, Polycarbonate und/oder Polyanhydride; (22) Füllstoffe wie Polypeptide und Aminosäuren (23) Serumkomponente wie Serumalbumin, HDL und LDL; (22) C2-C12- Alkohole, wie Ethanol; und (23) andere nicht-toxische kompatible Substanzen, die in pharmazeutischen Rezepturen verwendet werden. Benetzungsmittel, Färbemittel, Trennmittel, Beschichtungsmittel, Süßungsmittel, Geschmacksstoffe, Duftstoffe, Konservierungsmittel und Antioxidantien können auch in der Rezeptur enthalten sein. Die Begriffe wie „Hilfsstoff“, „Träger“, „pharmazeutisch annehmbarer Träger“ oder dergleichen werden hier austauschbar verwendet.
In einigen Ausführungsformen wird die pharmazeutische Zusammensetzung zur Verabreichung an einen Patienten formuliert, z. B. für Gen Editing. Geeignete Verabreichungswege der hierin beschriebenen pharmazeutischen Zusammensetzung beinhalten unter anderem: topische, subkutane, transdermale, intradermale, intraläsionale, intraartikuläre, intraperitoneale, intravesikale, transmukosale, gingivale, intradentale, intracochleare, transtympanale, intraorganische, epidurale, intrathekale, intramuskuläre, intravenöse, intravaskuläre, intraossäre, periokuläre, intratumorale, intrazerebrale und intrazerebroventrikuläre Verabreichung.
In einigen Ausführungsformen wird die hierin beschriebene pharmazeutische Zusammensetzung lokal an eine erkrankte Stelle (z. B. eine Tumorstelle) verabreicht. In einigen Ausführungsformen wird die hierin beschriebene pharmazeutische Zusammensetzung einem Patienten durch Injektion, mittels eines Katheters, mittels eines Zäpfchens oder mittels eines Implantats verabreicht, wobei das Implantat aus einem porösen, nicht porösen oder gelatineartigen Material besteht, einschließlich einer Membran, wie einer sialastischen Membran, oder einer Faser.
In anderen Ausführungsformen wird die hierin beschriebene pharmazeutische Zusammensetzung in einem kontrollierten Freisetzungssystem eingeschleust. In einer Ausführungsform kann eine Pumpe verwendet werden (siehe z. B. Langer, 1990, Science 249:1527-1533; Sefton, 1989, CRC Crit. Ref. Biomed. Eng. 14:201; Buchwald et al., 1980, Surgery 88:507; Saudek et al., 1989, N. Engl. J. Med. 321 :574). In einer anderen Ausführungsform können Polymermaterialien verwendet werden. (Siehe z. B. Medical Applications of Controlled Release (Langer and Wise eds., CRC Press, Boca Raton, Fla., 1974); Controlled Drug Bioavailability, Drug Product Design and Performance (Smolen and Ball eds., Wiley, New York, 1984); Ranger and Peppas, 1983, Macromol. Sci. Rev. Macromol. Chem. 23:61. Siehe auch Levy et al., 1985, Science 228:190; During et al., 1989, Ann. Neurol. 25:351; Howard et al., 1989, J. Neurosurg. 71:105). Andere kontrollierte Freisetzungssysteme werden beispielsweise bei Langer, supra, erörtert.
In einigen Ausführungsformen wird die pharmazeutische Zusammensetzung gemäß Routineverfahren als Zusammensetzung formuliert, die zur intravenösen oder subkutanen Verabreichung an einen Probanden, z. B. einen Menschen, angepasst ist. In einigen Ausführungsformen sind pharmazeutische Zusammensetzungen zur Verabreichung durch Injektion Lösungen in sterilem isotonischem wässrigem Puffer. Falls erforderlich, kann das Arzneimittel auch ein Solubilisierungsmittel und ein Lokalanästhetikum wie Lignocain enthalten, um Schmerzen an der Injektionsstelle zu lindern. Im Allgemeinen werden die Inhaltsstoffe entweder getrennt oder zusammengemischt in Einheitsdosierungsform geliefert, zum Beispiel als trockenes lyophilisiertes Pulver oder wasserfreies Konzentrat in einem hermetisch verschlossenen Behälter, wie einer Ampulle oder einem Beutel, der die Wirkstoffmenge anzeigt. Wenn das Arzneimittel durch Infusion verabreicht werden soll, kann es mit einer Infusionsflasche abgegeben werden, die steriles Wasser oder Kochsalzlösung pharmazeutischer Qualität enthält. Wenn die pharmazeutische Zusammensetzung durch Injektion verabreicht wird, kann eine Ampulle mit sterilem Wasser zur Injektion oder Kochsalzlösung bereitgestellt werden, so dass die Inhaltsstoffe vor der Verabreichung gemischt werden können.
Eine pharmazeutische Zusammensetzung zur systemischen Verabreichung kann eine Flüssigkeit sein, z. B. sterile Kochsalzlösung, Ringer-Laktat- oder Hank-Lösung. Außerdem kann die pharmazeutische Zusammensetzung in fester Form vorliegen und unmittelbar vor der Verwendung wieder aufgelöst oder suspendiert werden. Lyophilisierte Formen werden ebenfalls in Betracht gezogen.
Die pharmazeutische Zusammensetzung kann in einem Lipidpartikel oder Vesikel enthalten sein, wie einem Liposom oder Mikrokristall, das auch für die parenterale Verabreichung geeignet ist. Die Partikel können jede geeignete Struktur aufweisen, wie unilamellar oder plurilamellar, solange Zusammensetzungen darin enthalten sind. Verbindungen können in „stabilisierten Plasmid-Lipid-Partikeln“ (SPLP) eingeschlossen werden, die das fusogene Lipid Dioleoylphosphatidylethanolamin (DOPE), geringe Mengen (5-10 Mol-%) an kationischem Lipid enthalten und durch eine Polyethylenglycol (PEG)- Beschichtung stabilisiert werden (Zhang YP et al., Gene Ther. 1999, 6:1438-47). Besonders bevorzugt für solche Partikel und Vesikel sind positiv geladene Lipide wie N-[1-(2,3- Dioleoyloxi)propyl]-N,N,N-Trimethyl-Amoniummethylsulfat oder „DOTAP“. Die Herstellung solcher Lipidpartikel ist gut bekannt. Siehe z. B. US-Patent Nr. 4,880,635 ; 4.906.477 ; 4.911.928 ; 4.917.951 ; 4.920.016 und 4.921.757 ; die jeweils durch Bezugnahme hierin aufgenommen sind.
Die hierin beschriebene pharmazeutische Zusammensetzung kann beispielsweise als Einheitsdosis verabreicht oder verpackt werden. Der Begriff „Einheitsdosis“, wenn er in Bezug auf eine pharmazeutische Zusammensetzung der vorliegenden Offenbarung verwendet wird, bezieht sich auf physikalisch diskrete Einheiten, die als Einheitsdosis für den Patienten geeignet sind, wobei jede Einheit eine vorbestimmte Menge an aktivem Material enthält, die berechnet wird, um die gewünschte therapeutische Wirkung in Verbindung mit dem erforderlichen Verdünnungsmittel zu produzieren; d. h. Träger oder Vehikel.
Ferner kann die pharmazeutische Zusammensetzung als pharmazeutischer Kit bereitgestellt werden, umfassend (a) einen Behälter, der eine Verbindung der Erfindung in lyophilisierter Form enthält, und (b) einen zweiten Behälter, der ein pharmazeutisch annehmbares Verdünnungsmittel (z. B. steriles Wasser) zur Injektion enthält. Das pharmazeutisch annehmbares Verdünnungsmittel kann zur Rekonstitution oder Verdünnung der lyophilisierten Verbindung der Erfindung verwendet werden. Optional mit einem oder mehreren solchen Behältern verbunden sein kann eine Mitteilung in der Form, wie sie von einer Regierungsbehörde vorgeschrieben ist, die die Herstellung, Verwendung oder den Verkauf von Arzneimitteln oder biologischen Produkten regelt, wobei die Mitteilung die Genehmigung der Herstellungs-, Verwendungs- oder Verkaufsstelle für die humane Verabreichung wiedergibt.
In einem anderen Aspekt ist ein Herstellungsartikel enthalten, der Materialien enthält, die für die Behandlung der oben beschriebenen Krankheiten nützlich sind. In einigen Ausführungsformen umfasst der Herstellungsartikel einen Behälter und ein Etikett. Geeignete Behälter umfassen beispielsweise Flaschen, Ampullen, Spritzen und Teströhrchen. Die Behälter können aus einer Vielzahl von Materialien wie Glas oder Kunststoff gebildet sein. In einigen Ausführungsformen enthält der Behälter eine Zusammensetzung, die zur Behandlung einer hierin beschriebenen Krankheit wirksam ist und eine sterile Zugangsöffnung aufweisen kann. Zum Beispiel kann der Behälter ein Beutel mit intravenöser Lösung oder ein Fläschchen mit einem Stopfen sein, der mit einer Injektionsnadel durchstechbar ist. Der Wirkstoff in der Zusammensetzung ist eine erfindungsgemäße Verbindung. In einigen Ausführungsformen zeigt das Etikett auf oder in Verbindung mit dem Behälter an, dass die Zusammensetzung zur Behandlung der Krankheit der Wahl verwendet wird. Der Herstellungsartikel kann ferner einen zweiten Behälter umfassen, der einen pharmazeutisch annehmbaren Puffer umfasst, wie beispielsweise phosphatgepufferte Kochsalzlösung, Ringer-Lösung oder Dextroselösung. Es kann ferner andere Materialien umfassen, die aus kommerzieller Sicht und vom Standpunkt des Benutzers wünschenswert sind, einschließlich anderer Puffer, Verdünnungsmittel, Filter, Nadeln, Spritzen und Packungsbeilagen mit Gebrauchsanweisungen.
[11] Kits, Zellen, Vektoren und Einschleusung
Kits
Die Zusammensetzungen der vorliegenden Offenbarung können zu Kits zusammengestellt werden. In einigen Ausführungsformen umfasst der Kit NukleinsäureVektoren für die Exprimierung der hierin beschriebenen Multi-Flap-Prime-Editoren. In anderen Ausführungsformen umfasst der Kit ferner geeignete Leitnukleotidsequenzen (z. B. PEgRNAs und gRNAs der zweiten Stelle) oder Nukleinsäurevektoren für die Exprimierung solcher Leitnukleotidsequenzen, um das Cas9-Protein oder den Prime-Editor auf die gewünschte Zielsequenz auszurichten.
Der hierin beschriebene Kit kann einen oder mehrere Behälter beinhalten, die Komponenten zum Ausführen der hierin beschriebenen Verfahren und gegebenenfalls Anweisungen für den Gebrauch enthalten. Jeder der hierin beschriebenen Kits kann ferner Komponenten umfassen, die zum Ausführen der Verfahren benötigt werden. Jede Komponente der Kits kann gegebenenfalls in flüssiger Form (z. B. in Lösung) oder in fester Form (z. B. als Trockenpulver) bereitgestellt werden. In bestimmten Fällen können einige der Komponenten rekonstituierbar oder anderweitig verarbeitbar sein (z. B. in eine aktive Form), z. B. durch Zugabe eines geeigneten Lösungsmittels oder einer anderen Substanz (z. B. Wasser), die mit dem Kit bereitgestellt werden kann oder auch nicht.
In einigen Ausführungsformen können die Kits optional Anweisungen und/oder Werbung für die Verwendung der bereitgestellten Komponenten beinhalten. Wie hierin verwendet, kann der Begriff „Anweisungen“ eine Komponente der Anweisung und/oder Werbung bezeichnen und umfasst in der Regel schriftliche Anweisungen auf oder in Verbindung mit der Verpackung der Offenbarung. Anweisungen können auch mündliche oder elektronische Anweisungen beinhalten, die auf eine Art und Weise bereitgestellt werden, bei der der Benutzer klar erkennen kann, dass die Anweisungen mit dem Kit verbunden sind, z. B. audiovisuelle (z. B. Videokassette, DVD usw.), internet- und/oder webbasierte Kommunikation usw. Die schriftlichen Anweisungen können in einer Form vorliegen, die von einer staatlichen Behörde, die die Herstellung, die Verwendung oder den Verkauf von Arzneimitteln oder biologischen Produkten regelt, vorgeschrieben ist und die auch die Genehmigung der Behörde für die Herstellung, die Verwendung oder den Verkauf zur Verabreichung an Tiere wiedergeben kann. Wie hierin verwendet, beinhaltet der Begriff „beworben“ alle Verfahren der Geschäftstätigkeit, einschließlich Verfahren der Ausbildung, der klinischen Anweisung, der wissenschaftlichen Untersuchung, der Entdeckung oder Entwicklung von Arzneimitteln, der akademischen Forschung, der Tätigkeit der pharmazeutischen Industrie, einschließlich des Verkaufs von Arzneimitteln, und jeder Werbung oder sonstigen verkaufsfördernden Tätigkeit, einschließlich schriftlicher, mündlicher und elektronischer Kommunikation in jeder Form, die mit der Offenbarung verbunden ist. Darüber hinaus können die Kits je nach spezifischer Anwendung weitere Komponenten beinhalten, wie hierin beschrieben.
Die Kits können eine oder mehrere der hierin beschriebenen Komponenten in einem oder mehreren Behältern enthalten. Die Komponenten können steril aufbereitet, in einer Spritze verpackt und gekühlt versandt werden. Alternativ können sie in einem Fläschchen oder einem anderen Behälter zur Lagerung abgefüllt werden. Ein zweiter Behälter kann weitere steril aufbereitete Komponenten aufweisen. Alternativ können die Kits die Wirkstoffe vorgemischt enthalten und in einer Ampulle, einem Röhrchen oder einem anderen Behältnis versandt werden.
Die Kits können eine Vielzahl von Formen aufweisen, wie z. B. einen Blisterbeutel, einen eingeschweißten Beutel, einen vakuumversiegelbaren Beutel, eine versiegelbare, tiefgezogene Schale oder eine ähnliche Beutel- oder Schalenform, wobei das Zubehör lose im Beutel, in einer oder mehreren Tuben, Behältern, einer Schachtel oder einem Beutel verpackt ist. Die Kits können sterilisiert werden, nachdem die Zubehörteile hinzugefügt wurden, so dass die einzelnen Zubehörteile im Behälter anderweitig verpackt werden können. Die Kits können mit allen geeigneten Sterilisationsverfahren sterilisiert werden, wie z. B. Strahlensterilisation, Hitzesterilisation oder anderen in der Technik bekannten Sterilisationsverfahren. Die Kits können auch andere Komponenten beinhalten, je nach spezifischer Anwendung, zum Beispiel Behälter, Zellmedien, Salze, Puffer, Reagenzien, Spritzen, Nadeln, ein Gewebe, wie z. B. Gaze, zum Auftragen oder Entfernen eines Desinfektionsmittels, Einweghandschuhe, eine Halterung für die Mittel vor der Verabreichung, usw. Einige Aspekte dieser Offenbarung stellen Kits bereit, die ein Nukleinsäurekonstrukt umfassen, das eine Nukleotidsequenz kodiert, die die verschiedenen Komponenten der hierin beschriebenen Mulit-Flap-Prime-Editing- Systeme (z. B. Dual-Prime-Editing- und Quadruple-Prime-Editing-Systeme) kodiert (z. B. beinhaltend unter anderem die napDNAbps, reverse Transkriptasen, Polymerasen, Fusionsproteine (z. B. napDNAbps und reverse Transkriptasen (oder im weiteren Sinne Polymerasen) umfassend), verlängerte Leit-RNAs und Komplexe, die Fusionsproteine und verlängerte Leit-RNAs umfassen, sowie Zusatzelemente, wie z. B. Zweitstrang-Nicking- Komponenten (z. B. Zweitstrang-Nicking-gRNA) und endogene 5'-DNA-Flap- Entfernungsendonukleasen, um den Mulit-Flap-Prime-Editing-Prozess zur Bildung des editierten Produkts zu unterstützen). In einigen Ausführungsformen umfasst die Nukleotidsequenz(en) einen heterologen Promotor (oder mehr als einen einzigen Promotor), der die Exprimierung der Komponenten des Mulit-Flap-Prime-Editing-Systems antreibt.
Andere Aspekte dieser Offenbarung stellen Kits bereit, die ein oder mehrere Nukleinsäurekonstrukte umfassen, die die verschiedenen Komponenten der hierin beschriebenen Mulit-Flap-Prime-Editing-Systeme kodieren, z. B. umfassend eine Nukleotidsequenz, die die Komponenten des Mulit-Flap-Prime-Editing-Systems kodiert, das in der Lage ist, eine Ziel-DNA-Sequenz zu modifizieren. In einigen Ausführungsformen umfasst die Nukleotidsequenz einen heterologen Promotor, der die Exprimierung der Komponenten des Mulit-Flap-Prime-Editing Systems antreibt.
Einige Aspekte dieser Offenbarung stellen Kits bereit, die ein Nukleinsäurekonstrukt umfassen, das (a) eine Nukleotidsequenz, die ein napDNAbp (z. B. eine Cas9-Domäne) kodiert, fusioniert mit einer reversen Transkriptase und (b) einen heterologen Promotor, der die Exprimierung der Sequenz von (a) antreibt, umfasst.
Zellen
Zellen, die eine der hierin beschriebenen Zusammensetzungen enthalten können, beinhalten prokaryotische Zellen und eukaryotische Zellen. Die hierin beschriebenen Verfahren werden verwendet, um ein Cas9-Protein oder einen Multi-Flap-Prime-Editor in eine eukaryotische Zelle (z. B. eine Säugetierzelle, wie eine humane Zelle) einzuschleusen. In einigen Ausführungsformen ist die Zelle in vitro (z. B. in einer Zellkultur). In einigen Ausführungsformen ist die Zelle in vivo (z. B. in einem Probanden, wie etwa einem humanen Probanden). In einigen Ausführungsformen ist die Zelle ex vivo (z. B. isoliert von einem Probanden und kann wieder demselben oder einem anderen Probanden verabreicht werden).
Säugetierzellen im Sinne der vorliegenden Offenbarung beinhalten humane Zellen, Primatenzellen (z. B. Vero-Zellen), Rattenzellen (z. B. GH3-Zellen, OC23-Zellen) oder Mauszellen (z. B. MC3T3-Zellen). Es gibt eine Vielzahl humaner Zelllinien, die unter anderem humane embryonale Nierenzellen (HEK), HeLa-Zellen, Krebszellen aus den 60 Krebszelllinien des National Cancer Institute (NCI60), DU145-Zellen (Prostatakrebs), Lncap- Zellen (Prostatakrebs), MCF-7 (Brustkrebs)-Zellen, MDA-MB-438 (Brustkrebs)-Zellen, PC3 (Prostatakrebs)-Zellen, T47D (Brustkrebs)-Zellen, THP-1 (akute myeloische Leukämie)- Zellen, U87 (Glioblastom)-Zellen, SHSY5Y humane Neuroblastomzellen (geklont aus einem Myelom) und Saos-2 (Knochenkrebs)-Zellen beinhalten. In einigen Ausführungsformen werden rAAV-Vektoren in humane embryonale Nierenzellen (HEK-Zellen, z. B. HEK 293 oder HEK 293T-Zellen) eingeschleust. In einigen Ausführungsformen werden rAAV- Vektoren in Stammzellen (z. B. humane Stammzellen) wie zum Beispiel pluripotente Stammzellen (z. B. humane pluripotente Stammzellen, einschließlich humaner induzierter pluripotenter Stammzellen (hiPSCs)) eingeschleust. Eine Stammzelle ist eine Zelle, die die Fähigkeit besitzt, sich in Kultur auf unbestimmte Zeit zu teilen und spezialisierte Zellen hervorzubringen. Eine pluripotente Stammzelle bezieht sich auf einen Stammzellentyp, der in der Lage ist, sich in alle Gewebeformen eines Organismus zu differenzieren, aber nicht allein in der Lage ist, eine vollständige organismische Entwicklung zu durchlaufen. Eine humane induzierte pluripotente Stammzelle bezieht sich auf eine somatische (z. B. reife oder erwachsene) Zelle, die in einen embryonalen stammzellähnlichen Zustand umprogrammiert wurde, indem sie gezwungen wurde, Gene und Faktoren zu exprimieren, die für die Aufrechterhaltung der definierenden Eigenschaften embryonaler Stammzellen wichtig sind (siehe z. B. Takahashi und Yamanaka, Cell 126 (4): 663-76, 2006, hierin durch Bezugnahme aufgenommen). Humane induzierte pluripotente Stammzellen exprimieren Stammzellmarker und sind in der Lage, Zellen zu erzeugen, die für alle drei Keimschichten (Ektoderm, Endoderm, Mesoderm) charakteristisch sind.
Weitere nicht einschränkende Beispiele für Zelllinien, die gemäß der vorliegenden Offenbarung verwendet werden können, beinhalten 293-T, 293-T, 3T3, 4T1, 721, 9L, A-549, A172, A20, A253, A2780, A2780ADR, A2780cis, A431, ALC, B16, B35, BCP-1, BEAS-2B, bEnd.3, BHK-21, BR 293, BxPC3, C2C12, C3H-10T1/2, C6, C6/36, Cal-27, CGR8, CHO, CML T1, CMT, COR-L23, COR-L23/5010, COR-L23/CPR, COR-L23/R23, COS-7, COV- 434, CT26, D17, DH82, DU145, DuCaP, E14Tg2a, EL4, EM2, EM3, EMT6/AR1, EMT6/AR10. 0, FM3, H1299, H69, HB54, HB55, HCA2, Hepalclc7, High Five-Zellen, HL- 60, HMEC, HT-29, HUVEC, J558L-Zellen, Jurkat, JY-Zellen, K562-Zellen, KCL22, KG1, Ku812, KYO1, LNCap, Ma-Mel 1, 2, 3.... 48, MC-38, MCF-10A, MCF-7, MDA-MB-231, MDA-MB-435, MDA-MB-468, MDCK II, MG63, MONO-MAC 6, MOR/0. 2R, MRC5, MTD-1A, MyEnd, NALM-1, NCI-H69/CPR, NCI-H69/LX10, NCI-H69/LX20, NCI- H69/LX4, NIH-3T3, NW-145, OPCN/OPCT Peer, PNT-1A/PNT 2, PTK2, Raji, RBL-Zellen, RenCa, RIN-5F, RMA/RMAS, S2, Saos-2-Zellen, Sf21, Sf9, SiHa, SKBR3, SKOV-3, T-47D, T2, T84, THP1, U373, U87, U937, VCaP, WM39, WT-49, X63, YAC-1 und YAR-Zellen.
Einige Aspekte dieser Offenbarung stellen Zellen bereit, die eines der hierin offenbarten Konstrukte umfassen. In einigen Ausführungsformen wird eine Wirtszelle transient oder nicht-transient mit einem oder mehreren hierin beschriebenen Vektoren transfiziert. In einigen Ausführungsformen wird eine Zelle so transfiziert, wie sie natürlicherweise in einem Probanden vorkommt. In einigen Ausführungsformen wird eine Zelle, die transfiziert wird, einem Individuum entnommen. In einigen Ausführungsformen wird die Zelle von Zellen abgeleitet, die einem Individuum entnommen wurden, wie zum Beispiel von einer Zelllinie. Eine große Vielzahl von Zelllinien für die Gewebekultur ist in der Technik bekannt. Beispiele für Zelllinien beinhalten unter anderem C8161, CCRF-CEM, MOLT, mIMCD-3, NHDF, HeLa-S3, Huh1, Huh4, Huh7, HUVEC, HASMC, HEKn, HEKa, MiaPaCell, Panel, PC-3, TF1, CTLL-2, C1R, Rat6, CV1, RPTE, A10, T24, J82, A375, ARH- 77, Calu1, SW480, SW620, SKOV3, SK-UT, CaCo2, P388D1, SEM-K2, WEHI-231, HB56, TIB55, Jurkat, J45. 01, LRMB, Bcl-1, BC-3, IC21, DLD2, Raw264. 7, NRK, NRK-52E, MRC5, MEF, Hep G2, HeLa B, HeLa T4, COS, COS-1, COS-6, COS-M6A, BS-C-1 Affennierenepithel, BALB/3T3 Mausembryo-Fibroblasten, 3T3 Swiss, 3T3-L1, 132-d5 humane fetale Fibroblasten; 10. 1 Mausfibroblasten, 293-T, 3T3, 721, 9L, A2780, A2780ADR, A2780cis, A 172, A20, A253, A431, A-549, ALC, B16, B35, BCP-1-Zellen, BEAS-2B, bEnd.3, BHK-21, BR 293. BxPC3. C3H-10T1/2, C6/36, Cal-27, CHO, CHO-7, CHO-IR, CHO-K1, CHO-K2, CHO-T, CHO Dhfr -/-, COR-L23, COR-L23/CPR, COR-L23/5010, COR- L23/R23, COS-7, COV-434, CML T1, CMT, CT26, D17, DH82, DU145, DuCaP, EL4, EM2, EM3, EMT6/AR1, EMT6/AR10. 0, FM3, H1299, H69, HB54, HB55, HCA2, HEK-293, HeLa, Hepalclc7, HL-60, HMEC, HT-29, Jurkat, JY-Zellen, K562-Zellen, Ku812, KCL22, KG1, KYO1, LNCap, Ma-Mel 1-48, MC-38, MCF-7, MCF-10A, MDA-MB-231, MDA-MB-468, MDA-MB-435, MDCK II, MDCK 11, MOR/0. 2R, MONO-MAC 6, MTD-1A, MyEnd, NCI- H69/CPR, NCI-H69/LX10, NCI-H69/LX20, NCI-H69/LX4, NIH-3T3, NALM-1, NW-145, OPCN/OPCT Zelllinien, Peer, PNT-1 A/PNT 2, RenCa, RIN-5F, RMA/RMAS, Saos-2-Zellen, Sf-9, SkBr3, T2, T-47D, T84, THP1-Zelllinie, U373, U87, U937, VCaP, Vero-Zellen, WM39, WT-49, X63, YAC-1, YAR und transgene Varianten davon.
Zelllinien sind von einer Vielzahl von Quellen erhältlich, die den Fachleuten bekannt sind (siehe z. B. die American Type Culture Collection (ATCC) (Manassus, Va.)). In einigen Ausführungsformen wird eine Zelle, die mit einem oder mehreren hierin beschriebenen Vektoren transfiziert wurde, zur Etablierung einer neuen Zelllinie verwendet, die eine oder mehrere vom Vektor abgeleitete Sequenzen umfasst. In einigen Ausführungsformen wird eine Zelle, die mit den hierin beschriebenen Komponenten eines CRISPR-Systems transient transfiziert wurde (wie durch transiente Transfektion eines oder mehrerer Vektoren oder Transfektion mit RNA) und durch die Aktivität eines CRISPR-Komplexes modifiziert wurde, verwendet, um eine neue Zelllinie zu etablieren, die Zellen umfasst, die die Modifikation enthalten, denen jedoch eine beliebige andere exogene Sequenz fehlt. In einigen Ausführungsformen werden Zellen, die mit einem oder mehreren hierin beschriebenen Vektoren transient oder nicht transient transfiziert wurden, oder von solchen Zellen abgeleitete Zelllinien zur Bewertung einer oder mehrerer Testverbindungen verwendet.
Vektoren
Einige Aspekte der vorliegenden Offenbarung beziehen sich auf die Verwendung rekombinanter Virusvektoren (z. B. Adeno-assoziierte Virusvektoren, Adenovirus-Vektoren oder Herpes-Simplex-Virus-Vektoren) für die Einschleusung der hierin beschriebenen Multi- Flap-Prime-Editoren oder Komponenten davon, z. B. des Split-Cas9-Proteins oder eines Split- Nukleobasen-Multi-Flap-Prime-Editors, in eine Zelle. Im Falle eines Split-PE-Ansatzes werden der N-terminale Abschnitt eines PE-Fusionsproteins und der C-terminale Abschnitt einer PE-Fusion durch separate rekombinante Virusvektoren (z. B. Adeno-assoziierte Virusvektoren, Adenovirus-Vektoren oder Herpes-Simplex-Virus-Vektoren) in dieselbe Zelle eingeschleust, da das Cas9-Protein in voller Länge oder Multi-Flap-Prime-Editoren die Packungsgrenze verschiedener Virusvektoren, z. B. rAAV (~4,9 kb), überschreiten.
In einer Ausführungsform werden daher Vektoren in Betracht gezogen, die in der Lage sind, aufgeteilte Multi-Flap-Prime-Editor-Fusionsproteine oder aufgeteilte Komponenten davon einzuschleusen. In einigen Ausführungsformen wird eine Zusammensetzung zum Einschleusen des Split Cas9-Proteins oder des Split-Prime-Editors in eine Zelle (z. B. eine Säugetierzelle, eine humane Zelle) bereitgestellt. In einigen Ausführungsformen umfasst die Zusammensetzung der vorliegenden Offenbarung: (i) ein erstes rekombinantes Adeno- assoziiertes Virus (rAAV)-Partikel, umfassend eine erste Nukleotidsequenz, die einen N- terminalen Abschnitt eines Cas9-Proteins oder Prime-Editors kodiert, der an seinem C- Terminus an ein Intein-N fusioniert ist; und (ii) ein zweites rekombinantes Adeno-assoziiertes Virus (rAAV)-Partikel, umfassend eine zweite Nukleotidsequenz, die ein Intein-C kodiert, das an den N-Terminus eines C-terminalen Abschnitts des Cas9-Proteins oder Prime-Editors fusioniert ist. Die rAAV-Partikel der vorliegenden Offenbarung umfassen einen rAAV-Vektor (d. h. ein rekombinantes Genom des rAAV), der in die viralen Kapsidproteine eingekapselt ist.
In einigen Ausführungsformen umfasst der rAAV-Vektor: (1) eine heterologe Nukleinsäure-Region, umfassend die erste oder zweite Nukleotidsequenz, die den N- terminalen Abschnitt oder den C-terminalen Abschnitt eines Split-Cas9-Proteins oder eines Split-Multi-Flap-Prime-Editors in einer beliebigen hierin beschriebenen Form kodiert, (2) eine oder mehrere Nukleotidsequenzen, umfassend eine Sequenz, die die Exprimierung der heterologen Nukleinsäure-Region erleichtert (z. B. einen Promotor), und (3) eine oder mehrere Nukleinsäureregionen, die eine Sequenz umfassen, die die Integration der heterologen Nukleinsäureregion (gegebenenfalls mit der einen oder mehreren Nukleinsäureregionen, die eine Sequenz umfassen, die die Expression erleichtert) in das Genom einer Zelle erleichtert. In einigen Ausführungsformen umfassen die viralen Sequenzen, die die Integration erleichtern, Inverted Terminal Repeat (ITR)-Sequenzen. In einigen Ausführungsformen wird die erste oder zweite Nukleotidsequenz, die den N-terminalen Abschnitt oder den C-terminalen Abschnitt eines Split-Cas9-Proteins oder eines Split-Multi-Flap-Prime-Editors kodiert, auf jeder Seite von einer ITR-Sequenz flankiert. In einigen Ausführungsformen umfasst der Nukleinsäurevektor ferner eine Region, die ein AAV-Rep-Protein, wie hierin beschrieben, kodiert, das entweder innerhalb der von ITRs flankierten Region oder außerhalb der Region enthalten ist. Die ITR-Sequenzen können von einem beliebigen AAV-Serotyp (z. B. 1, 2, 3, 4, 5, 6, 7, 8, 9 oder 10) oder von mehr als einem Serotyp abgeleitet sein. In einigen Ausführungsformen sind die ITR-Sequenzen von AAV2 oder AAV6 abgeleitet.
In einigen Ausführungsformen umfassen die hierin offenbarten rAAV-Partikel also mindestens ein rAAV2-Partikel, rAAV6-Partikel, rAAV8-Partikel, rPHP.B-Partikel, rPHP.eB- Partikel oder rAAV9-Partikel oder eine Variante davon. In besonderen Ausführungsformen sind die offenbaren rAAV-Partikel rPHP.B-Partikel, rPHP.eB-Partikel, rAAV9-Partikel.
ITR-Sequenzen und Plasmide, die ITR-Sequenzen enthalten, sind in der Fachwelt bekannt und im Handel erhältlich (siehe z. B. Produkte und Dienstleistungen von Vector Biolabs, Philadelphia, PA; Cellbiolabs, San Diego, CA; Agilent Technologies, Santa Clara, Ca; und Addgene, Cambridge, MA; und „Gene delivery to skeletal muscle results in sustained expression and systemic delivery of a therapeutic protein". Kessler PD, Podsakoff GM, Chen X, McQuiston SA, Colosi PC, Matelis LA, Kurtzman GJ, Byme BJ. Proc Natl Acad Sei USA. 1996 Nov 26;93(24):14082-7; und Curtis A. Machida. „Methods in Molecular Medicine™. Viral Vectors for Gene Therapy Methods and Protocols." 10.1385/1-59259-304-6:201 © Humana Press Inc. 2003. Kapitel 10. „Targeted Integration by Adeno-Associated Virus.“ Matthew D. Weitzman, Samuel M. Young Jr., Toni Cathomen und Richard Jude Samulski; US-Pat. Nr. 5,139,941 und 5,962,313 , die alle hierin durch Bezugnahme aufgenommen sind).
In einigen Ausführungsformen umfasst der rAAV-Vektor der vorliegenden Offenbarung ein oder mehrere regulatorische Elemente zur Kontrolle der Exprimierung der heterologen Nukleinsäure-Region (z. B. Promotoren, Transkriptionsterminatoren und/oder andere regulatorische Elemente). In einigen Ausführungsformen ist die erste und/oder zweite Nukleotidsequenz operativ mit einem oder mehreren (z. B. 1, 2, 3, 4, 5 oder mehr) Transkriptionsterminatoren verbunden. Nicht einschränkende Beispiele für Transkriptionsterminatoren, die gemäß der vorliegenden Offenbarung verwendet werden können, beinhalten Transkriptionsterminatoren des bovinen Wachstumshormon-Gens (bGH), des humanen Wachstumshormon-Gens (hGH), SV40, CW3, ϕ oder Kombinationen davon. Die Wirksamkeit verschiedener Transkriptionsterminatoren wurde getestet, um ihre jeweiligen Auswirkungen auf die Exprimierung des Split-Cas9-Proteins oder des Split-Multi-Flap-Prime- Editors zu bestimmen. In einigen Ausführungsformen ist der in der vorliegenden Offenbarung verwendete Transkriptionsterminator ein bGH-Transkriptionsterminator. In einigen Ausführungsformen umfasst der rAAV-Vektor ferner ein posttranskriptionales regulatorisches Element (WPRE) des Woodchuck-Hepatitis-Virus. In bestimmten Ausführungsformen ist das WPRE eine trunkierte WPRE-Sequenz, wie etwa „W3“. In einigen Ausführungsformen ist das WPRE 5' vom Transkriptionsterminator eingefügt. Solche Sequenzen bilden bei der Transkription eine Tertiärstruktur, die die Exprimierung, insbesondere durch virale Vektoren, verstärkt.
In einigen Ausführungsformen können die hierin verwendeten Vektoren die PE- Fusionsproteine oder eine ihrer Komponenten kodieren (z. B. napDNAbp, Linker oder Polymerasen). Darüber hinaus können die hierin verwendeten Vektoren die PEgRNAs und/oder die zusätzliche gRNA für das Zweitstrang-Nicking kodieren. Die Vektoren können in der Lage sein, die Exprimierung einer oder mehrerer kodierender Sequenzen in einer Zelle zu steuern. In einigen Ausführungsformen kann die Zelle eine prokaryotische Zelle sein, wie z. B. eine Bakterienzelle. In einigen Ausführungsformen kann die Zelle eine eukaryotische Zelle sein, wie z. B. eine Hefe-, Pflanzen-, Insekten- oder Säugetierzelle. In einigen Ausführungsformen kann es sich bei der eukaryotischen Zelle um eine Säugetierzelle handeln. In einigen Ausführungsformen kann es sich bei der eukaryotischen Zelle um eine Nagetierzelle handeln. In einigen Ausführungsformen kann es sich bei der eukaryotischen Zelle um eine humane Zelle handeln. Geeignete Promotoren für die Exprimierung in verschiedenen Zelltypen sind im Stand der Technik bekannt. In einigen Ausführungsformen kann der Promotor vom Wildtyp sein. In anderen Ausführungsformen kann der Promotor modifiziert sein, um eine effizientere oder wirksamere Exprimierung zu erreichen. In wieder anderen Ausführungsformen kann der Promotor trunkiert sein, aber seine Funktion beibehalten. Zum Beispiel kann der Promotor eine normale Größe oder eine reduzierte Größe aufweisen, die für die richtige Verpackung des Vektors in ein Virus geeignet ist.
In einigen Ausführungsformen können die Promotoren, die in den Vektoren des Prime- Editors verwendet werden, konstitutiv, induzierbar oder gewebespezifisch sein. In einigen Ausführungsformen kann es sich bei den Promotoren um konstitutive Promotoren handeln. Nicht einschränkende beispielhafte konstitutive Promotoren beinhalten den unmittelbaren frühen Promotor des Cytomegalovirus (CMV), den Promotor des Affenvirus (SV40), den Hauptpromotor des Adenovirus (MLP), den Promotor des Rous-Sarkom-Virus (RSV), den Promotor des Maus-Mammartumor-Virus (MMTV), Phosphoglyceratkinase (PGK)-Promotor, Elongationsfaktor-alpha (EFla)-Promotor, Ubiquitin-Promotoren, Aktin-Promotoren, Tubulin- Promotoren, Immunglobulin-Promotoren, ein funktionelles Fragment davon oder eine Kombination aus beliebigen der Vorgenannten. In einigen Ausführungsformen kann der Promotor ein CMV-Promotor sein. In einigen Ausführungsformen kann der Promotor ein trunkierter CMV-Promotor sein. In anderen Ausführungsformen kann der Promotor ein EFla- Promotor sein. In einigen Ausführungsformen kann der Promotor ein induzierbarer Promotor sein. Nicht einschränkende beispielhafte induzierbare Promotoren beinhalten solche, die durch Hitzeschock, Licht, Chemikalien, Peptide, Metalle, Steroide, Antibiotika oder Alkohol induzierbar sind. In einigen Ausführungsformen kann der induzierbare Promotor ein Promotor sein, der eine geringe basale (nicht induzierte) Exprimierung aufweist, wie z. B. der Tet-On®- Promotor (Clontech). In einigen Ausführungsformen kann der Promotor ein gewebespezifischer Promotor sein. In einigen Ausführungsformen wird der gewebespezifische Promotor ausschließlich oder überwiegend in Lebergewebe exprimiert. Nicht einschränkende beispielhafte gewebespezifische Promotoren beinhalten den B29-Promotor, CD14-Promotor, CD43-Promotor, CD45-Promotor, CD68-Promotor, Desmin-Promotor, Elastase-1-Promotor, Endoglin-Promotor, Fibronectin-Promotor, Fit-1-Promotor, GFAP-Promotor, GPIIb- Promotor, ICAM-2-Promotor, INF-ß-Promotor, Mb-Promotor, Nphsl-Promotor, OG-2- Promotor, SP-B-Promotor, SYN1-Promotor und WASP-Promotor.
In einigen Ausführungsformen können die Prime-Editor-Vektoren (z. B. einschließlich aller Vektoren, die das Prime-Editor-Fusionsprotein und/oder die PEgRNAs und/oder die akzessorischen Zweitstrang-Nicking-gRNAs kodieren) induzierbare Promotoren umfassen, um die Exprimierung erst zu starten, nachdem er in eine Zielzelle eingeschleust wurde. Nicht einschränkende beispielhafte induzierbare Promotoren beinhalten solche, die durch Hitzeschock, Licht, Chemikalien, Peptide, Metalle, Steroide, Antibiotika oder Alkohol induzierbar sind. In einigen Ausführungsformen kann der induzierbare Promotor ein Promotor sein, der eine geringe basale (nicht induzierte) Exprimierung aufweist, wie z. B. der Tet-On®- Promotor (Clontech).
In weiteren Ausführungsformen können die Prime-Editor-Vektoren (z. B. einschließlich aller Vektoren, die das Prime-Editor-Fusionsprotein und/oder die PEgRNAs und/oder die zusätzlichen Zweitstrang-Nicking-gRNAs kodieren) gewebespezifische Promotoren umfassen, damit die Exprimierung erst nach der Einschleusung in ein spezifisches Gewebe beginnt. Nicht einschränkende beispielhafte gewebespezifische Promotoren beinhalten den B29-Promotor, CD14-Promotor, CD43-Promotor, CD45-Promotor, CD68- Promotor, Desmin-Promotor, Elastase-1-Promotor, Endoglin-Promotor, Fibronectin- Promotor, Flt-1-Promotor, GFAP-Promotor, GPIIb-Promotor, ICAM-2-Promotor, INF-(3- Promotor, Mb-Promotor, Nphsl-Promotor, OG-2-Promotor, SP-B-Promotor, SYN 1 -Promotor und WASP-Promotor.
In einigen Ausführungsformen kann die Nukleotidsequenz, die die PEgRNA kodiert (oder andere Leit-RNAs, die in Verbindung mit Mulit-Flap-Prime-Editing verwendet werden), mit mindestens einer Transkriptions- oder Translationskontrollsequenz operativ verknüpft sein. In einigen Ausführungsformen kann die Nukleotidsequenz, die für die Leit-RNA kodiert, operativ mit mindestens einem Promotor verknüpft sein. In einigen Ausführungsformen kann der Promotor von der RNA-Polymerase III (Pol III) erkannt werden. Nicht einschränkende Beispiele für Pol-III-Promotoren beinhalten U6-, HI- und tRNA-Promotoren. In einigen Ausführungsformen kann die Nukleotidsequenz, die die Leit-RNA kodiert, operativ mit einem Maus- oder humanen U6-Promotor verknüpft sein. In anderen Ausführungsformen kann die Nukleotidsequenz, die die Leit-RNA kodiert, operativ mit einem Maus- oder humanen HI- Promotor verknüpft sein. In einigen Ausführungsformen kann die Nukleotidsequenz, die die Leit-RNA kodiert, operativ mit einem tRNA-Promotor der Maus oder des Menschen verknüpft sein. In Ausführungsformen mit mehr als einer Leit-RNA können die für die Exprimierung verwendeten Promotoren gleich oder unterschiedlich sein. In einigen Ausführungsformen können das Nukleotid, das für die crRNA der Leit-RNA kodiert, und das Nukleotid, das für die tracr-RNA der Leit-RNA kodiert, auf demselben Vektor bereitgestellt werden. In einigen Ausführungsformen können das Nukleotid, das für die crRNA kodiert, und das Nukleotid, das für die tracr-RNA kodiert, von demselben Promotor angetrieben werden. In einigen Ausführungsformen können die crRNA und die tracr-RNA in ein einziges Transkript transkribiert werden. Zum Beispiel können die crRNA und die tracr-RNA aus einem einzigen Transkript zu einer Doppelmolekül-Leit-RNA verarbeitet werden. Alternativ dazu können die crRNA und die tracr-RNA in eine Einzelmolekül-Leit-RNA transkribiert werden.
In einigen Ausführungsformen kann sich die Nukleotidsequenz, die für die Leit-RNA kodiert, auf demselben Vektor befinden, der die Nukleotidsequenz umfasst, die für das PE- Fusionsprotein kodiert. In einigen Ausführungsformen kann die Exprimierung der Leit-RNA und des PE-Fusionsproteins durch ihre entsprechenden Promotoren angetrieben werden. In einigen Ausführungsformen kann die Expression der Leit-RNA durch denselben Promotor angetrieben werden, der auch die Exprimierung des PE-Fusionsproteins antreibt. In einigen Ausführungsformen können die Leit-RNA und das PE-Fusionsprotein-Transkript in einem einzigen Transkript enthalten sein. Zum Beispiel kann sich die Leit-RNA in einer nichttranslatierten Region (UTR) des Cas9-Protein-Transkripts befinden. In einigen Ausführungsformen kann sich die Leit-RNA innerhalb der 5'-UTR des PE-Fusionsprotein- Transkripts befinden. In anderen Ausführungsformen kann sich die Leit-RNA innerhalb der 3'- UTR des PE-Fusionsprotein-Transkripts befinden. In einigen Ausführungsformen kann die intrazelluläre Halbwertszeit des PE-Fusionsprotein-Transkripts reduziert werden, indem die Leit-RNA in seiner 3'-UTR enthalten ist und dadurch die Länge seiner 3'-UTR verkürzt wird. In weiteren Ausführungsformen kann sich die Leit-RNA innerhalb eines Introns des PE- Fusionsprotein-Transkripts befinden. In einigen Ausführungsformen können geeignete Spleißstellen an dem Intron, in dem sich die Leit-RNA befindet, hinzugefügt werden, so dass die Leit-RNA ordnungsgemäß aus dem Transkript herausgespleißt wird. In einigen Ausführungsformen kann die Exprimierung des Cas9-Proteins und der Leit-RNA in unmittelbarer Nähe auf demselben Vektor die effizientere Bildung des CRISPR-Komplexes erleichtern.
Das Vektorsystem des Multi-Flap-Prime-Editors kann einen Vektor, zwei Vektoren, drei Vektoren, vier Vektoren, fünf Vektoren oder mehr umfassen. In einigen Ausführungsformen kann das Vektorsystem einen einzigen Vektor umfassen, der sowohl das PE-Fusionsprotein als auch die PEgRNA kodiert. In anderen Ausführungsformen kann das Vektorsystem zwei Vektoren umfassen, wobei ein Vektor für das PE-Fusionsprotein und der andere für die PEgRNA kodiert. In weiteren Ausführungsformen kann das Vektorsystem drei Vektoren umfassen, wobei der dritte Vektor die in den hierin beschriebenen Verfahren verwendete Zweitstrang-Nicking-gRNA kodiert.
In einigen Ausführungsformen umfasst die Zusammensetzung, die das rAAV-Partikel (in jeder hierin in Betracht gezogenen Form) umfasst, ferner einen pharmazeutisch annehmbaren Träger. In einigen Ausführungsformen wird die Zusammensetzung in geeigneten pharmazeutischen Vehikeln zur Verabreichung an humane oder tierische Probanden formuliert.
Einige Beispiele für Materialien, die als pharmazeutisch annehmbare Träger dienen können, beinhalten: (1) Zucker, wie Lactose, Glucose und Saccharose; (2) Stärken, wie Maisstärke und Kartoffelstärke; (3) Zellulose und deren Derivate, wie Natriumcarboxymethylzellulose, Methylzellulose, Ethylzellulose, mikrokristalline Zellulose und Zelluloseacetat; (4) pulverisierter Traganth; (5) Malz; (6) Gelatine; (7) Schmiermittel, wie Magnesiumstearat, Natriumlaurylsulfat und Talk; (8) Hilfsstoffe, wie Kakaobutter und Zäpfchenwachse; (9) Öle, wie Erdnussöl, Baumwollsamenöl, Distelöl, Sesamöl, Olivenöl, Maisöl und Sojabohnenöl; (10) Glykole, wie Propylenglykol; (11) Polyole, wie Glycerin, Sorbit, Mannit und Polyethylenglycol (PEG); (12) Ester, wie Ethyloleat und Ethyllaurat; (13) Agar; (14) Puffermittel, wie Magnesiumhydroxid und Aluminiumhydroxid; (15) Alginsäure; (16) pyrogenfreies Wasser; (17) isotonische Kochsalzlösung; (18) Ringer-Lösung; (19) Ethylalkohol; (20) pH-gepufferte Lösungen; (21) Polyester, Polycarbonate und/oder Polyanhydride; (22) Füllstoffe wie Polypeptide und Aminosäuren (23) Serumkomponente wie Serumalbumin, HDL und LDL; (22) C2-C12-Alkohole, wie Ethanol; und (23) andere nicht- toxische kompatible Substanzen, die in pharmazeutischen Rezepturen verwendet werden. Benetzungsmittel, Färbemittel, Trennmittel, Beschichtungsmittel, Süßungsmittel, Geschmacksstoffe, Duftstoffe, Konservierungsmittel und Antioxidantien können auch in der Rezeptur enthalten sein. Die Begriffe wie etwa „Hilfsstoff“, „Träger“, „pharmazeutisch annehmbarer Träger“ oder dergleichen werden hier austauschbar verwendet.
Einschleusungsverfahren
In einigen Aspekten stellt die Erfindung Verfahren bereit, die das Einschleusen eines oder mehrerer Polynukleotide, die die verschiedenen Komponenten der hierin beschriebenen Multi-Flap-Prime-Editoren kodieren, wie zum Beispiel einen oder mehrere Vektoren, wie hierin beschrieben, ein oder mehrere Transkripte davon und/oder ein oder mehrere davon transkribierte Proteine, in eine Wirtszelle umfassen. In einigen Aspekten stellt die Erfindung ferner Zellen bereit, die durch solche Verfahren hergestellt werden, und Organismen (wie Tiere, Pflanzen oder Pilze), die solche Zellen umfassen oder daraus hergestellt werden. In einigen Ausführungsformen wird ein hierin beschriebener Basen-Editor in Kombination mit (und gegebenenfalls komplexiert mit) einer Leitsequenz in eine Zelle eingeschleust.
Beispielhafte Verabreichungsstrategien sind an anderer Stelle beschrieben, darunter vektorbasierte Strategien, PE-Ribonukleoprotein-Komplex-Verabreichung und Verabreichung von PE durch mRNA-Verfahren.
In einigen Ausführungsformen umfasst das vorgesehene Einschleusungsverfahren Nukleoinfektion, Mikroinjektion, Biologistik, Virosomen, Liposomen, Immunoliposomen, Polykation- oder Lipid-Nukleinsäure-Konjugate, nackte DNA, künstliche Virionen und die durch Wirkstoffe verstärkte Aufnahme von DNA.
Beispielhafte Verfahren zur Einschleusung von Nukleinsäuren umfassen Lipofektion, Nukleofektion, Elektroporation, stabile Genomintegration (z. B. Piggybac), Mikroinjektion, Biologistik, Virosomen, Liposomen, Immunoliposomen, Polykation- oder Lipid- Nukleinsäure-Konjugate, nackte DNA, künstliche Virionen und die durch ein Mittel verstärkte Aufnahme von DNA. Die Lipofektion ist z. B. im US-Pat. Nr. 5,049,386 , 4,946,787 und 4,897,355 beschrieben und Lipofektionsreagenzien sind im Handel erhältlich (z. B. Transfectam™, Lipofectin™ und SF Cell Line 4D-Nucleofector X Kit™ (Lonza)). Kationische und neutrale Lipide, die für eine effiziente Rezeptor-Erkennungs-Lipofektion von Polynukleotiden geeignet sind, beinhalten jene von Feigner, WO 91/17424 ; WO 91/16024 . Die Einschleusung kann in Zellen (z. B. In-vitro- oder Ex-vivo-Verabreichung) oder Ziel-Gewebe (z. B. In-vivo-Verabreichung) erfolgen. Die Einschleusung kann durch die Verwendung von RNP-Komplexen erfolgen.
Die Herstellung von Lipid:Nukleinsäure-Komplexen, einschließlich zielgerichteter Liposomen, wie etwa Immunlipid-Komplexe, ist dem Fachmann gut bekannt (siehe z. B. Crystal, Science 270:404-410 (1995); Blaese et al., Cancer Gen Ther. 2:291-297 (1995); Behr et al., Bioconjugate Chem. 5:382-389 (1994); Remy et al., Bioconjugate Chem. 5:647-654 (1994); Gao et al., Gene Therapy 2:710-722 (1995); Ahmad et al., Cancer Res. 52:4817-4820 (1992); US-Pat. Nr. 4,186,183 , 4,217,344 , 4,235,871 , 4,261,975 , 4,485,054 , 4,501,728 , 4,774,085 , 4,837,028 und 4,946,787 ).
In anderen Ausführungsformen ist das hierin bereitgestellte Einschleusungsverfahren und der hierin bereitgestellte Vektor ein RNP-Komplex. Die RNP-Einschleusung von Fusionsproteinen erhöht die DNA-Spezifität der Basenbearbeitung deutlich. Die RNP- Einschleusung von Fusionsproteinen führt zu einer Entkopplung von On- und Off-Target- DNA-Editing. Die RNP-Einschleusung vermindert das Off-Target-Editing an nicht repetitiven Stellen, während es ein On-Target-Editing vergleichbar mit der Plasmid-Einschleusung beibehält und das Off-Target-DNA-Editing sogar an der hoch repetitiven VEGFA-Stelle 2 stark reduziert. Siehe Rees, H.A. et al. „Improving the DNA specificity and applicability of base editing through protein engineering and protein delivery", Nat. Commun. 8, 15790 (2017), US-Patent Nr. 9,526,784 , ausgestellt am 27. Dezember 2016, und US-Patent Nr. 9,737,604 , ausgestellt am 22. August 2017, die jeweils durch Bezugnahme hierin aufgenommen sind.
Dem Fachmann sind zusätzliche Verfahren zur Einschleusung von Nukleinsäuren in Zellen bekannt. Siehe zum Beispiel US 2003/0087817 , hierin durch Bezugnahme aufgenommen.
Andere Aspekte der vorliegenden Offenbarung stellen Verfahren zur Einschleusung der Multi-Flap-Prime-Editor-Konstrukte in eine Zelle bereit, um einen vollständigen und funktionellen Prime-Editor in einer Zelle zu bilden. Zum Beispiel wird in einigen Beispielen eine Zelle mit einer hierin beschriebenen Zusammensetzung in Kontakt gebracht (z. B. Zusammensetzungen, die Nukleotidsequenzen umfassen, die das Split Cas9 oder den Split Prime-Editor kodieren, oder AAV-Partikel, die Nukleinsäurevektoren enthalten, die solche Nukleotidsequenzen umfassen). In einigen Ausführungsformen führt das Inkontaktbringen zur Einschleusung solcher Nukleotidsequenzen in eine Zelle, wobei der N-terminale Abschnitt des Cas9-Proteins oder des Prime-Editors und der C-terminale Abschnitt des Cas9-Proteins oder des Prime-Editors in der Zelle exprimiert und zusammengefügt werden, um einen vollständigen Cas9-Protein oder einem vollständigen Prime-Editor zu bilden.
Es sollte gewürdigt werden, dass jedes hierin bereitgestellte rAAV-Partikel, Nukleinsäuremolekül oder jede Zusammensetzung auf jede beliebige geeignete Weise in die Zelle eingeführt werden kann, entweder stabil oder transient. In einigen Ausführungsformen können die offenbaren Proteine in die Zelle transfiziert werden. In einigen Ausführungsformen kann die Zelle mit einem Nukleinsäuremolekül transduziert oder transfiziert werden. Zum Beispiel kann eine Zelle transduziert (z. B. mit einem Virus, das für ein Splitting-Protein kodiert) oder transfiziert (z. B. mit einem Plasmid, das für ein Splitting-Protein kodiert) werden mit einem Nukleinsäuremolekül, das für ein Splitting-Protein kodiert, oder mit einem rAAV- Partikel, der ein virales Genom enthält, das für ein oder mehrere Nukleinsäuremoleküle kodiert. Eine solche Transduktion kann eine stabile oder transiente Transduktion sein. In einigen Ausführungsformen können Zellen, die ein Splitting-Protein exprimieren oder ein Splitting- Protein enthalten, mit einer oder mehreren Leit-RNA-Sequenzen transduziert oder transfiziert werden, z. B. bei der Einschleusung eines Split-Cas9 (z. B. nCas9) -Proteins. In einigen Ausführungsformen kann ein Plasmid, das ein Split-Protein exprimiert, durch Elektroporation, transiente (z. B. Lipofektion) und stabile Genomintegration (z. B. Piggybac) und virale Transduktion oder andere Verfahren, die dem Fachmann bekannt sind, in Zellen eingebracht werden.
In bestimmten Ausführungsformen umfassen die hierin bereitgestellten Zusammensetzungen ein Lipid und/oder ein Polymer. In bestimmten Ausführungsformen ist das Lipid und/oder Polymer kationisch. Die Herstellung solcher Lipidpartikel ist gut bekannt. Siehe z. B. die US-Patentnummern 4,880,635; 4,906,477; 4,911,928; 4,917,951; 4,920,016; 4,921,757 und 9,737,604, die hierin jeweils durch Bezugnahme aufgenommen sind.
Die Leit-RNA-Sequenz kann 15-100 Nukleotide lang sein und eine Sequenz von mindestens 10, mindestens 15 oder mindestens 20 zusammenhängenden Nukleotiden umfassen, die komplementär zu einer Zielnukleotidsequenz ist. Die Leit-RNA kann eine Sequenz von 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39 oder 40 zusammenhängenden Nukleotiden umfassen, die komplementär zu einer Ziel-Nukleotidsequenz ist. Die Leit-RNA kann 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49 oder 50 Nukleotide in der Länge betragen.
In einigen Ausführungsformen ist die Ziel-Nukleotidsequenz eine DNA-Sequenz in einem Genom, z. B. einem eukaryotischen Genom. In bestimmten Ausführungsformen befindet sich die Ziel-Nukleotidsequenz in einem Säugetier- (z. B. einem humanen) Genom.
Die Zusammensetzungen dieser Offenbarung können zum Beispiel als Einheitsdosis verabreicht oder verpackt werden. Der Begriff „Einheitsdosis“, wenn er in Bezug auf eine pharmazeutische Zusammensetzung der vorliegenden Offenbarung verwendet wird, bezieht sich auf physikalisch diskrete Einheiten, die als Einheitsdosis für den Probanden geeignet sind, wobei jede Einheit eine vorbestimmte Menge an aktivem Material enthält, die berechnet wird, um die gewünschte therapeutische Wirkung in Verbindung mit dem erforderlichen Verdünnungsmittel, d. h. einem Träger oder Vehikel, zu produzieren.
Die Behandlung einer Krankheit oder Störung beinhaltet das Verzögern der Entwicklung oder des Fortschreitens der Krankheit oder das Reduzieren des Schweregrads der Krankheit. Die Behandlung der Krankheit erfordert nicht unbedingt heilende Ergebnisse.
In diesem Zusammenhang bedeutet „Verzögern“ der Entwicklung einer Krankheit, dass das Fortschreiten der Krankheit aufgeschoben, verhindert, verlangsamt, verzögert, stabilisiert und/oder hinausgezögert wird. Diese Verzögerung kann je nach Verlauf der Krankheit und/oder dem zu behandelnden Individuums unterschiedlich lang sein. Ein Verfahren, das die Entwicklung einer Krankheit „verzögert“ oder lindert oder den Ausbruch der Krankheit verzögert, ist ein Verfahren, das die Wahrscheinlichkeit der Entwicklung eines oder mehrerer Krankheitssymptome in einem bestimmten Rahmen reduziert und/oder das Ausmaß der Symptome in einem bestimmten Rahmen reduziert, verglichen mit der Nichtanwendung des Verfahrens. Solche Vergleiche basieren in der Regel auf klinischen Studien mit einer ausreichenden Anzahl von Probanden, um ein statistisch signifikantes Ergebnis zu erzielen.
„Entwicklung“ oder „Fortschreiten“ einer Krankheit bedeutet erste Manifestationen und/oder das anschließende Fortschreiten der Krankheit. Die Entwicklung der Krankheit kann mit klinischen Standardtechniken, die in der Fachwelt bekannt sind, erkannt und bewertet werden. Der Begriff Entwicklung bezieht sich jedoch auch auf ein Fortschreiten, das möglicherweise nicht nachweisbar sein kann. Für die Zwecke dieser Offenbarung bezieht sich die Entwicklung oder das Fortschreiten auf den biologischen Verlauf der Symptome. „Entwicklung“ beinhaltet Auftreten, Wiederauftreten und Ausbruch.
Wie hierin verwendet, beinhaltet der Begriff „Ausbruch“ oder „Auftreten“ einer Krankheit den erstmaligen Ausbruch und/oder das erneute Auftreten. Zur Verabreichung des isolierten Polypeptids oder der pharmazeutischen Zusammensetzung an den Probanden können je nach Art der zu behandelnden Krankheit oder des Krankheitsherdes herkömmliche, dem medizinischen Fachmann bekannte Verfahren verwendet werden.
Ohne weitere Vertiefung wird davon ausgegangen, dass ein Fachmann basierend auf der obigen Beschreibung die vorliegende Offenbarung in vollem Umfang nutzen kann. Die folgenden spezifischen Ausführungsformen sind daher lediglich als veranschaulichend zu verstehen und schränken die übrige Offenbarung in keiner Weise ein. Alle hierin zitierten Veröffentlichungen sind für die Zwecke oder den Gegenstand, auf den hierin verwiesen wird, durch Bezugnahme aufgenommen.
BEISPIELE
BEISPIEL 1. PRIME-EDITING (PE) FÜR DEN EINBAU PRÄZISER NUKLEOTIDVERÄNDERUNGEN IN DAS GENOM
Das Ziel ist die Entwicklung einer transformativen Genom-Editing-Technologie für den präzisen und allgemeinen Einbau einzelner Nukleotidveränderungen in Säugetiergenomen. Diese Technologie würde es Forschern ermöglichen, die Auswirkungen einzelner Nukleotidvariationen in praktisch jedem Säugetiergen zu untersuchen und möglicherweise therapeutische Eingriffe zur Korrektur pathogener Punktmutationen bei menschlichen Patienten zu ermöglichen.
Die Einführung des CRISPR-Systems (clustered regularly interspaced short palindromic repeat) zum Genom-Editing hat die Biowissenschaften revolutioniert^1-3. Obwohl die Unterbrechung von Genen mithilfe von CRISPR inzwischen Routine ist, bleibt der präzise Einbau einzelner Nukleotid-Edits eine große Herausforderung, obzwar sie für die Untersuchung oder Korrektur einer großen Anzahl von krankheitsverursachenden Mutationen notwendig ist. Mit der homologiegeleiteten Reparatur (homology-directed repair - HDR) können solche Edits durchgeführt werden, aber sie leidet unter der geringen Effizienz (oft <5 %), der Notwendigkeit von Donor-DNA-Reparatur-Templaten und den nachteiligen Auswirkungen der Bildung von doppelsträngigen DNA-Brüchen (double-stranded DNA break - DSB). Kürzlich hat das Liu-Labor das Basen-Editing entwickelt, mit dem ein effizientes Editing einzelner Nukleotide ohne DSBs erreicht werden kann. Basen-Editoren (BEs) kombinieren das CRISPR-System mit basenmodifizierenden Deaminase-Enzymen, um die Zielbasenpaare C·G oder A·T in A·T bzw. G·C umzuwandeln^4-6. Obwohl sie von Forschern weltweit bereits in großem Umfang genutzt werden (> 5.000 Liu-Labor-BE-Konstrukte werden von Addgene vertrieben), ermöglichen die derzeitigen BEs nur vier der zwölf möglichen Basenpaarumwandlungen und sind nicht in der Lage, kleine Insertionen oder Deletionen zu korrigieren. Darüber hinaus wird das Editing von Basen durch das Editieren von C- oder A- Basen, die nicht zur Zielbase gehören („Bystander Editing“), und durch die Anforderung, dass eine PAM-Sequenz 15±2 bp von der Zielbase entfernt sein muss, eingeschränkt. Die Überwindung dieser Einschränkungen würde daher die Grundlagenforschung und die therapeutischen Anwendungen des Genom-Editings erheblich erweitern.
Hier wird vorgeschlagen, einen neuen Ansatz für das Precision Editing zu entwickeln, der viele der Vorteile des Basen-Editing bietet - nämlich die Vermeidung von Doppelstrangbrüchen und Donor-DNA-Reparatur-Templaten - und gleichzeitig dessen größte Einschränkungen überwindet. Um dieses ehrgeizige Ziel zu erreichen, sollen die editierten DNA-Stränge mithilfe der Ziel-geprimten reversen Transkription (target-primed reverse transcription - TPRT) direkt an den genomischen Zielstellen eingebaut werden. In der hierin erörterten Ausgestaltung wird die CRISPR-Leit-RNA (gRNA) so konstruiert, dass sie ein Templat trägt, das die Synthese des mutagenen DNA-Strangs kodiert und von einem zugehörigen Reverse-Transkriptase (RT)-Enzym ausgeführt wird. Die DNA der CRISPR- Nuklease (Cas9) an der Zielstelle dient als Primer für die reverse Transkription, so dass jeder gewünschte Nukleotid-Edit direkt eingebaut werden kann.
Abschnitt 1
Etablierung einer Leit-RNA-Templat-templierten reversen Transkription mutagener DNA-Stränge. Frühere Studien haben gezeigt, dass Cas9 nach der DNA-Spaltung, aber vor der Dissoziation des Komplexes, den Nicht-Ziel-DNA-Strang freisetzt, um einen freien 3'- Terminus freizulegen. Es wird angenommen, dass dieser DNA-Strang für die Verlängerung durch Polymeraseenzyme zugänglich ist und dass gRNAs durch Verlängerung ihres 5'- oder 3'-Terminus so verändert werden können, dass sie als Templat für die DNA-Synthese dienen. In vorläufigen In-vitro-Studien wurde festgestellt, dass genickte DNA-Stränge in Cas9:gRNAgebundenen Komplexen tatsächlich die reverse Transkription unter Verwendung der gebundenen gRNA als Templat (RT-Enzym in trans) in Gang setzen können. Als Nächstes werden verschiedene gRNA-Linker, Primer-Bindungsstellen und Synthese-Template untersucht, um optimale Regeln für die Ausgestaltung in vitro zu bestimmen. Anschließend werden verschiedene RT-Enzyme, die in trans oder als Fusionen mit Cas9 agieren, in vitro bewertet. Schließlich werden konstruierte gRNA-Ausgestaltungen identifiziert, die eine effiziente Bindung und Schneideaktivität in den Zellen beibehalten. Die erfolgreiche Demonstration dieses Ziels wird eine Grundlage für die Durchführung der mutagenen Strangsynthese in Zellen bereitstellen.
Abschnitt 2
Etablierung von-Prime-Editing in humanen Zellen. Basierend auf den Mechanismen der DNA-Verarbeitung und -Reparatur wird angenommen, dass mutagene DNA-Stränge (einzelsträngige Flaps) zum gezielten und effizienten Editieren von Zielnukleotiden verwendet werden können. In ermutigenden Vorstudien wurde die Durchführbarkeit dieser Strategie nachgewiesen, indem das Editing mit Modellplasmidsubstraten, die mutagene Flaps enthalten, demonstriert wurde. In Verbindung mit Ziel 1 werden die Reparaturergebnisse ferner durch systematische Variation der Länge, der Sequenzzusammensetzung, der Identität der Zielnukleotide und des 3'-Terminus des mutagenen Flap bewertet. Kleine Insertionen und Deletionen von 1 bis 3 Nukleotiden werden ebenfalls getestet. Parallel dazu werden, aufbauend auf Ziel 1, Cas9-RT-Architekturen bewertet, die Fusionsproteine und nicht-kovalente Rekrutierungsstrategien beinhalten. Cas9-RT-Architekturen und verlängerte gRNAs werden für das zelluläre Editing an mehreren Zielstellen im humanen Genom getestet und anschließend auf hohe Effizienz optimiert. Im Erfolgsfall würde dieses Ziel das TPRT-Genom-Editing (d. h. Prime-Editing) sofort für grundlegende wissenschaftliche Anwendungen etablieren.
Abschnitt 3
Erreichen des stellenspezifischen Editing pathogener Mutationen in kultivierten humanen Zellen. Die potenzielle Allgemeingültigkeit dieser Technologie könnte das Editing von Transversionsmutationen und Indels ermöglichen, die derzeit nicht durch BEs korrigierbar sind. Auf der Grundlage der Ergebnisse von Ziel 1 und Ziel 2 sollen pathogene Transversionsmutationen in kultivierten humanen Zellen gezielt bearbeitet werden, einschließlich der Sichelzellkrankheit-Gründermutation in Betaglobin (die zur Korrektur eine A·T-zu-T·A-Transversion beinhaltet) und der am weitesten verbreiteten Wilson-Mutation in ATP7B (die zur Korrektur eine G·C-zu-T·A-Transversion erfordert). Die Korrektur kleiner Insertions- und Deletionsmutationen wird ebenfalls untersucht werden, einschließlich der 3- Nukleotid ΔF508 Deletion in CFTR, die zystische Fibrose verursacht. Im Erfolgsfall würde dies die Grundlage für die Entwicklung leistungsfähiger therapeutischer Ansätze zur Bekämpfung dieser bedeutenden humanen Krankheiten bilden.
Ansatz
Ziel ist die Entwicklung einer Genom-Editing-Strategie, die Punktmutationen direkt an den Zielstellen im Genom einbaut. In der Phase der Technologieentwicklung werden sich die Bemühungen auf die Entwicklung von Proteinen und RNA konzentrieren, um die TPRT- Funktionalität in das CRISPR/Cas-System zu integrieren. Mithilfe von In-vitro-Tests soll die Funktion jedes TPRT-Schrittes sorgfältig untersucht werden, wobei von Grund auf neu aufgebaut wird (Ziel 1). Als zweiter Fokusbereich werden die Ergebnisse des Editing in Säugetierzellen unter Verwendung einer Kombination von Modellsubstraten und konstruierten CRISPR/Cas-Systemen bewertet (Ziel 2). In der Anwendungsphase schließlich wird die Technologie eingesetzt, um Mutationen zu korrigieren, die mit anderen Verfahren des Genom- Editing nicht zu beheben sind (Ziel 3).
Die allgemeine Editing-Ausgestaltung wird in den 1A-1B gezeigt. Cas9-Nickasen enthalten inaktivierende Mutationen in der HNH-Nuklease-Domäne (Spy Cas9 H840A oder N863A), wodurch die DNA-Spaltung auf den PAM-haltigen Strang (Nicht-Zielstrang) beschränkt wird. Leit-RNAs (gRNAs) sind so konstruiert, dass sie ein Templat für die reverse Transkription enthalten (Ausgestaltungen siehe Folie 5). Abgebildet ist eine 5'-Erweiterung der gRNA, es können aber auch 3'-Verlängerungen umgesetzt werden. Die Cas9-Nickase ist entweder über den C-Terminus oder den N-Terminus mit einem Reverse-Transkriptase (RT)- Enzym fusioniert. Der gRNA:Cas9-RT-Komplex zielt auf die DNA-Region von Interesse und bildet eine R-Schleife, nachdem er den Nicht-Zielstrang verdrängt hat. Cas9 nickt den Nicht- Zielstrang der DNA ein. Durch die Freisetzung des genickten Strangs wird ein freier 3'-OH- Terminus freigelegt, der in der Lage ist, die reverse Transkription unter Verwendung der verlängerten gRNA als Templat zu starten. Diese DNA-Synthesereaktion wird von dem fusionierten RT-Enzym durchgeführt. Das gRNA-Templat kodiert eine DNA-Sequenz, die homolog zum ursprünglichen DNA-Duplex ist, mit Ausnahme des Nukleotids, das für das Editing anvisiert ist. Das Produkt der reversen Transkription ist ein einzelsträngiger DNA-Flap, der den gewünschten Edit kodiert. Dieser Flap, der einen freien 3'-Terminus enthält, kann sich mit dem benachbarten DNA-Strang abgleichen, was zu einer 5'-Flap-Spezies führt. Es wird angenommen, dass diese Spezies als effizientes Substrat für FEN1 (Flap-Endonuklease 1) dient, ein Enzym, das auf natürliche Weise 5'-Flaps aus Okazaki-Fragmenten während der DNA-Synthese des zurückbleibenden Strangs herausschneidet und 5'-Flaps nach der Strangverschiebungssynthese entfernt, die während der Long-Patch-Basen-Exzisionsreparatur stattfindet. Bei der Ligation der genickten DNA entsteht ein nicht zusammenpassendes Basenpaar. Dieses Zwischenprodukt kann entweder in das ursprüngliche Basenpaar zurückverwandelt oder durch Mismatch-Repair (MMR)-Prozesse in das gewünschte editierte Basenpaar umgewandelt werden. Alternativ könnte die semikonservative DNA-Replikation zu je einer Kopie der Reversion und des Edits führen.
BEISPIEL 2 - PRIME-EDITING: HOCHFLEXIBLES UND PRÄZISES SUCHEN- UND-ERSETZEN-GENOM-EDITING IN HUMANEN ZELLEN OHNE DOPPELSTRÄNGIGE DNA-BRÜCHE
Die derzeitigen Verfahren des Genom-Editing können mithilfe programmierbarer Nukleasen Zielgene mit den begleitenden Nebenprodukten doppelsträngiger DNA-Brüche unterbrechen, löschen oder einfügen und mithilfe von Basen-Editoren die vier Transversionspunktmutationen an den Ziel-Loci einbauen. Kleine Insertionen, kleine Deletionen und die acht Transversionspunktmutationen stellen jedoch zusammengenommen die meisten pathogenen genetischen Varianten dar, können aber in den meisten Zelltypen nicht effizient und ohne ein Übermaß an Nebenprodukten korrigiert werden. Hierin wird das Prime- Editing beschrieben, ein äußerst vielseitiges und präzises Verfahren zum Genom-Editing, bei dem neue genetische Informationen direkt in eine bestimmte DNA-Stelle eingeschrieben werden, und zwar mithilfe eines katalytisch beeinträchtigten Cas9, der mit einer manipulierten reversen Transkriptase fusioniert und mit einer manipulierten Leit-RNA (PEgRNA) programmiert ist, die sowohl die Zielstelle spezifiziert als auch den gewünschte Edit kodiert. Es wurden mehr als 175 verschiedene Edits in humanen Zellen ausgeführt, um nachzuweisen, dass Prime-Editing gezielte Insertionen, Deletionen, alle 12 möglichen Arten von Punktmutationen und Kombinationen davon effizient (typischerweise 20-60 %, bis zu 77 % in unsortierten Zellen) und mit geringen Nebenprodukten (typischerweise 1-10 %) durchführen kann, ohne dass doppelsträngige Brüche oder Donor-DNA-Template erforderlich sind. Prime- Editing wurde in humanen Zellen angewandt, um die primären genetischen Ursachen der Sichelzellenkrankheit (die eine A·T-zu-T·A-Transversion in HBB erfordert) und der Tay- Sachs-Krankheit (die eine 4-Basen-Deletion in HEXA erfordert) zu korrigieren, wobei in beiden Fällen die pathogenen genomischen Allele mit minimalen Nebenprodukten effizient in den Wildtyp zurückverwandelt wurden. Prime-Editing wurde auch eingesetzt, um humane Zelllinien mit diesen pathogenen HBB-Transversionen und HEXA-Insertionsmutationen zu erzeugen, um die G127V-Mutation in PRNP einzubauen, die eine Resistenz gegen die Prionenkrankheit verleiht (was eine G·C-zu-T·A-Transversion erfordert), und um einen His6- Tag, einen FLAG-Epitop-Tag und eine verlängerte LoxP-Stelle effizient in Ziel-Loci in humanen Zellen einzufügen. Prime-Editing bietet gegenüber HDR Vorteile in Bezug auf Effizienz und Produktreinheit sowie komplementäre Stärken und Schwächen im Vergleich zum Basen-Editing. In Übereinstimmung mit seinem Such- und Ersetzungsmechanismus, der drei verschiedene Basenpaarungsereignisse erfordert, ist Prime-Editing viel weniger anfällig für die Modifikation der DNA an bekannten Cas9-Zielstellen als Cas9. Prime-Editing erweitert den Umfang und die Möglichkeiten des Genom-Editings erheblich und kann im Prinzip ~89 % der bekannten pathogenen humanen genetischen Varianten korrigieren.
Die Fähigkeit, praktisch jede beliebige gezielte Veränderung im Genom jeder beliebigen lebenden Zelle oder jedes beliebigen Organismus vorzunehmen, ist ein lang gehegter Wunsch der Biowissenschaften. Trotz der rasanten Fortschritte bei den Genom- Editing-Technologien kann die Mehrzahl der >75.000 bekannten humanen genetischen Varianten, die mit Krankheiten in Verbindung gebracht werden¹¹¹, nicht korrigiert oder in den meisten therapeutisch relevanten Zellen eingebaut werden (38A). Programmierbare Nukleasen wie CRISPR-Cas9 erzeugen doppelsträngige DNA-Brüche (DSBs), die Gene unterbrechen können, indem sie an den Zielstellen eine Mischung aus Insertionen und Deletionen (Indels) induzieren^112-114. Nukleasen können auch zur Deletion von Zielgenen^115,116 oder zum Insertion von exogenen Genen^117-119 durch homologieunabhängige Prozesse verwendet werden. Doppelsträngige DNA-Brüche sind jedoch auch mit unerwünschten Ergebnissen verbunden, die komplexe Produktmischungen, Translokationen¹²⁰ und die Aktivierung von p53 beinhalten^121,122. Darüber hinaus unterscheidet sich die überwiegende Mehrheit der pathogenen Allele von ihren nicht-pathogenen Gegenstücken durch kleine Insertionen, Deletionen oder Basensubstitutionen, die zu ihrer Korrektur wesentlich präzisere Editing-Technologien erfordern (38A). Die durch Nuklease-induzierte DSBs¹²³ stimulierte homologiegeleitete Reparatur (HDR) ist weit verbreitet, um eine Vielzahl von präzisen DNA-Veränderungen einzubauen. HDR ist jedoch auf exogene Donor-DNA- Reparatur-Template angewiesen, erzeugt in der Regel einen Überschuss an Indel- Nebenprodukten aus der End-Join-Reparatur von DSBs und ist in den meisten therapeutisch relevanten Zelltypen ineffizient (T-Zellen und einige Stammzellen sind wichtige Ausnahmen)^124,121. Während die Verbesserung der Effizienz und Präzision des DSBvermittelten Genom-Editings nach wie vor im Mittelpunkt vielversprechender Bemühungen steht^126-130, erfordern diese Herausforderungen die Erforschung alternativer Strategien für das Genom-Editing mit Präzision.
Durch Basen-Editing können die vier Arten von Übergangsmutationen (C zu T, G zu A, A zu G und T zu C) effizient eingebaut oder korrigiert werden, ohne dass DSBs in einer Vielzahl von Zelltypen und Organismen, einschließlich Säugetieren, erforderlich sind^128-131, kann aber derzeit keine der acht Transversionsmutationen (C zu A, C zu G, G zu C, G zu T, A zu C, A zu T, T zu A und T zu G) erreichen, wie z. B. die T·A-zu-A·T-Mutation, die für die direkte Korrektur der häufigsten Ursache der Sichelzellenkrankheit (HBB E6V) erforderlich ist¹³². Darüber hinaus ist kein DSB-freies Verfahren zur Durchführung von gezielten Deletionen, wie der Entfernung der 4-Basen-Duplikation, die die Tay-Sachs-Krankheit (HEXA 1278+TATC)¹³³ verursacht, oder von gezielten Insertionen, wie der präzisen 3-Basen- Insertion, die zur direkten Korrektur der häufigsten Ursache der zystischen Fibrose (CFTR ΔF508)¹³⁴ erforderlich ist, ausgewiesen. Gezielte Transversionspunktmutationen, Insertionen und Deletionen sind daher in den meisten Zelltypen nur schwer effizient und ohne überschüssige Nebenprodukte einzubauen oder zu korrigieren, auch wenn sie zusammengenommen die meisten bekannten pathogenen Allele ausmachen (38A).
Hierin wird die Entwicklung des Prime-Editing beschrieben, einer neuen „Suchen-und- Ersetzen“-Technologie für das Genom-Editing, die gezielte Insertionen, Deletionen und alle 12 möglichen Basen-zu-Basen-Umwandlungen an Ziel-Loci in humanen Zellen vermittelt, ohne dass doppelsträngige DNA-Brüche oder Donor-DNA-Template erforderlich sind. Prime- Editoren, deren erstes Beispiel PE1 ist, verwenden eine reverse Transkriptase, die mit einer programmierbaren Nickase und einer verlängerten Leit-RNA (PEgRNA) für das Prime-Editing fusioniert ist, um die genetische Information von der Verlängerung der PEgRNA direkt in den Ziel-Locus zu kopieren. Ein Prime-Editor der zweiten Generation (PE2) verwendet eine gentechnisch veränderte reverse Transkriptase, um die Editing-Effizienz bei minimaler (typischerweise <2 %) Indel-Bildung erheblich zu steigern, während ein PE3-System der dritten Generation eine zweite Leit-RNA hinzufügt, um den nicht-editierten Strang zu nicken und dadurch den Austausch des nicht-editierten Strangs zu begünstigen und die Editing- Effizienz weiter zu steigern, typischerweise auf etwa 20-50 % in humanen Zellen bei etwa 1- 10 % Indel-Bildung. PE3 bietet weit weniger Nebenprodukte und eine höhere oder ähnliche Effizienz im Vergleich zur optimierten Cas9-Nuklease-initiierten HDR und bietet komplementäre Stärken und Schwächen im Vergleich zu den Basen-Editoren der aktuellen Generation.
PE3 wurde an genomischen Loci in humanen HEK293T-Zellen angewandt, um eine effiziente Umwandlung von HBB E6V in Wildtyp-HBB, eine Deletion des eingefügten TATC zur Wiederherstellung von HEXA 1278+TATC in Wildtyp-HEXA, einen Einbau der G127V- Mutation in PRNP, die eine Resistenz gegen die Prionenkrankheit verleiht¹³⁵ (was eine G-C- zu-T-A-Transversion erfordert), und eine gezielte Einfügung eines His₆-Tags (18 bp), eines FLAG-Epitop-Tags (24 bp) und einer verlängerten LoxP-Stelle für die Cre-vermittelte Rekombination (44 bp) zu erreichen. Prime-Editing war auch in drei anderen humanen Zelllinien sowie in post-mitotischen primären kortikalen Neuronen der Maus erfolgreich, allerdings mit unterschiedlicher Effizienz. Aufgrund des hohen Maßes an Flexibilität in Bezug auf den Abstand zwischen dem anfänglichen Nick und dem Edit-Ort wird das Prime-Editing nicht wesentlich durch die PAM-Anforderungen von Cas9 eingeschränkt und kann im Prinzip die große Mehrheit der genomischen Loci anvisieren. Off-Target-Prime-Editing ist sehr viel seltener als Off-Target Cas9 Editing an bekannten Cas9 Off-Target-Loci, was wahrscheinlich darauf zurückzuführen ist, dass für ein produktives Prime-Editing drei verschiedene DNA- Basenpaarungen erforderlich sind. Durch die Möglichkeit der präzisen gezielten Insertion, Deletion und aller 12 möglichen Klassen von Punktmutationen an einer Vielzahl von genomischen Loci, ohne dass DSBs oder Donor-DNA-Template erforderlich sind, weist das Prime-Editing das Potenzial auf, die Untersuchung und Korrektur vieler Genvarianten voranzutreiben.
Ergebnisse
Strategie zur Übertragung von Informationen von einer verlängerten Leit-RNA in einen Ziel- Locus der DNA
Cas9 zielt auf DNA mithilfe einer Leit-RNA ab, die eine Spacer-Sequenz enthält, die an die Ziel-DNA hybridisiert^{112-114,136,137}. Ziel war es, Leit-RNAs zu entwickeln, die sowohl das DNA-Ziel spezifizieren, wie dies bei natürlichen CRISPR-Systemen^138,139 der Fall ist, als auch neue genetische Informationen enthalten, die die entsprechenden DNA-Nukleotide am Ziel-Locus austauschen. Die direkte Übertragung genetischer Informationen von einer verlängerten Leit-RNA in eine bestimmte DNA-Stelle und der anschließende Austausch der ursprünglichen, nicht editierten DNA könnte im Prinzip ein allgemeines Mittel zum Einbau gezielter Änderungen der DNA-Sequenz in lebenden Zellen bereitstellen, ohne dass DSBs oder Donor-DNA-Template erforderlich sind. Um diesen direkten Informationstransfer zu erreichen, sollte genomische DNA verwendet werden, die an der Zielstelle genickt wurde, um eine 3'-Hydroxylgruppe freizulegen, um die reverse Transkription der genetischen Information von einer Verlängerung der manipulierten Leit-RNA (im Folgenden als Prime-Editing Leit- RNA oder PEgRNA bezeichnet) direkt in die Zielstelle zu veranlassen (38A).
Diese einleitenden Schritte des Nicking und der reversen Transkription, die den Mechanismen ähneln, die von einigen natürlichen mobilen genetischen Elementen ¹⁴⁰ verwendet werden, führen zu einem verzweigten Zwischenprodukt mit zwei redundanten einzelsträngigen DNA-Flaps auf einem Strang: einem 5'-Flap, der die uneditierte DNA- Sequenz enthält, und einem 3'-Flap, der die von der PEgRNA kopierte editierte Sequenz enthält (38B). Um ein erfolgreiches Editing zu erreichen, muss dieses verzweigte Zwischenprodukt aufgelöst werden, so dass der editierte 3'-Flap den uneditierten 5'-Flap austauscht. Während die Hybridisierung des 5'-Flaps mit dem uneditierten Strang wahrscheinlich thermodynamisch begünstigt wird, da der editierte 3'-Flap weniger Basenpaare mit dem uneditierten Strang bilden kann, sind 5'-Flaps das bevorzugte Substrat für strukturspezifische Endonukleasen wie FEN1¹⁴¹, die 5'-Flaps, die während der Lagging-Strand-DNA- Synthese und der Long-Patch-Base-Excision-Reparatur erzeugt werden, ausschneiden. Es wurde angenommen, dass die bevorzugte 5'-Flap-Exzision und 3'-Flap-Ligation den Einbau des editierten DNA-Strangs vorantreiben könnte, wodurch eine Heteroduplex-DNA entsteht, die einen editierten und einen uneditierten Strang enthält (38B).
Der dauerhafte Einbau des Edits könnte durch eine anschließende DNA-Reparatur erfolgen, die die Diskrepanz zwischen den beiden DNA-Strängen so auflöst, dass die Information des editierten Strangs in den komplementären DNA-Strang kopiert wird (38C). Basierend auf einer ähnlichen Strategie, die entwickelt wurde, um die Effizienz des DNA-Basen-Editings zu maximieren^131-133, wurde davon ausgegangen, dass die Verzerrung des nicht-editierten DNA-Strangs, die weit genug von der Stelle des anfänglichen Nicks entfernt ist, um die Bildung von Doppelstrangbrüchen zu minimieren, die DNA- Reparatur so beeinflussen könnte, dass der nicht-editierte Strang bevorzugt ausgetauscht wird. Validierung der Schritte des Prime-Editing in vitro und in Hefezellen
Nach der Spaltung des PAM-enthaltenden DNA-Strangs durch die RuvC-Nuklease- Domäne von Cas9 kann das PAM-distale Fragment dieses Strangs von ansonsten stabilen Cas9:sgRNA:DNA-Komplexen dissoziieren¹⁴³. Es wurde die Hypothese aufgestellt, dass das 3'-Ende dieses freigesetzten Strangs ausreichend zugänglich sein könnte, um die DNA- Polymerisation zu starten. Leit-RNA-Engineering-Bemühungen^{144 146} und Kristallstrukturen von Cas9:sgRNA:DNA-Komplexen^141-149 legen nahe, dass die 5'- und 3'-Enden der sgRNA verlängert werden können, ohne die Cas9:sgRNA-Aktivität einzubüßen. PEgRNAs wurden entworfen, indem sgRNAs so verlängert wurden, dass sie zwei entscheidende Komponenten enthalten: eine Primer-Bindungsstelle (PBS), die es dem 3'-Ende des genickten DNA-Strangs ermöglicht, an die PEgRNA zu hybridisieren, und ein Reverse-Transkriptase-(RT)-Templat, das den gewünschten Edit enthält, der direkt in die genomische DNA-Stelle kopiert wird, wenn das 3'-Ende des genickten DNA-Strangs durch eine Polymerase über das RNA-Templat verlängert wird (38C).
Diese Hypothesen wurden in vitro mit gereinigtem S. pyogenes Cas9-Protein getestet. Es wurde eine Reihe von PEgRNA-Kandidaten konstruiert, indem sgRNAs an einem beliebigen der beiden Termini mit einer PBS-Sequenz (5 bis 6 Nukleotide, nt) und einem RT- Templat (7 bis 22 nt) verlängert wurden. Es wurde bestätigt, dass 5'-verlängerte PEgRNAs Cas9 direkt an die Ziel-DNA binden, und dass sowohl 5'-verlängerte PEgRNAs als auch 3'verlängerte PEgRNAs die Cas9-vermittelten Ziel-Nicking-in vitro- und DNA- Spaltungsaktivitäten in Säugetierzellen unterstützen (44A-44C). Diese Ausgestaltungen von PEgRNA-Kandidaten wurden unter Verwendung von vorgenickten 5'-Cy5-markierten dsDNA-Substraten, katalytisch totem Cas9 (dCas9) und einer kommerziellen Variante der reversen Transkriptase des Moloney-Mausleukämie-Virus (M-MLV) getestet (44D). Wenn alle Komponenten vorhanden waren, wurde eine effiziente Umwandlung des fluoreszenzmarkierten DNA-Strangs in längere DNA-Produkte mit Gelmobilitäten, die mit der reversen Transkription entlang des RT-Templats übereinstimmten (38D, 44D-44E) beobachtet. Produkte der gewünschten Länge wurden entweder mit 5'-verlängerten oder 3'verlängerten PEgRNAs gebildet (38D-38E). Der Verzicht auf dCas9 führte zu Nick- Translationsprodukten, die durch reverse Transkriptase-vermittelte DNA-Polymerisation auf dem DNA-Templat entstanden, ohne dass PEgRNA-Informationen übertragen wurden (38D). Es wurden keine DNA-Polymerisationsprodukte beobachtet, wenn die PEgRNA durch eine herkömmliche sgRNA ausgetauscht wurde, was die Notwendigkeit der Komponenten PBS und RT-Templat der PEgRNA bestätigt (38D). Diese Ergebnisse zeigen, dass das Cas9-vermittelte Schmelzen der DNA eine einzelsträngige R-Schleife freilegt, die, wenn sie genickt wird, in der Lage ist, die reverse Transkription entweder von einer 5'verlängerten oder 3'-verlängerten PEgRNA zu starten.
Als Nächstes wurden nicht-vernetzte dsDNA-Substrate mit einer Cas9-Nickase (H840A-Mutante) getestet, die ausschließlich den PAM-haltigen Strang nickt¹¹². In diesen Reaktionen erzeugten 5'-verlängerte PEgRNAs ineffiziente Produkte der reversen Transkription, was möglicherweise auf eine beeinträchtigte Cas9-Nickase-Aktivität zurückzuführen ist (44F). 3'-verlängerte PEgRNAs ermöglichten jedoch ein robustes Cas9-Nicking und eine effiziente reverse Transkription (38E). Die Verwendung von 3'verlängerten PEgRNAs erzeugte nur ein einziges offensichtliches Produkt, obwohl die reverse Transkription prinzipiell an jeder beliebigen Stelle innerhalb des Rests der PEgRNA enden kann. Die DNA-Sequenzierung der Produkte von Reaktionen mit Cas9-Nickase, RT und 3'verlängerten PEgRNAs ergab, dass die komplette RT-Templat-Sequenz in das DNA-Substrat revers transkribiert wurde (44G). Mit diesen Experimenten wurde nachgewiesen, dass 3'verlängerte PEgRNAs die reverse Transkription neuer DNA-Stränge templieren können und gleichzeitig die Fähigkeit behalten, die Cas9-Nickase-Aktivität zu steuern.
Um die DNA-Reparaturergebnisse von 3'-Flaps, die durch PEgRNA-programmierte reverse Transkription in vitro erzeugt wurden, in eukaryontischen Zellen zu bewerten, wurden DNA-Nicking und reverse Transkription unter Verwendung von PEgRNAs, Cas9-Nickase und RT in vitro auf Reporterplasmid-Substraten ausgeführt, und die Reaktionsprodukte wurden dann in Hefezellen (S. cerevisiae) transformiert (45A). Erfreulicherweise exprimierten 37 % der Hefetransformanten sowohl GFP- als auch mCherry-Proteine, wenn die Plasmide in vitro mit 3'-verlängerten PEgRNAs editiert wurden, die eine T·A-zu-A·T-Transversion kodieren, die das vorzeitige Stoppcodon korrigiert (38F, 45C). In Übereinstimmung mit den Ergebnissen in 38E und 44F, ergaben in vitro durchgeführte Editing- Reaktionen mit 5'-verlängerten PEgRNAs weniger GFP- und mCherry-Doppel-positive Kolonien (9 %) als solche mit 3'-verlängerten PEgRNAs (38F und 45D). Produktives Editing wurde auch bei Verwendung von 3'- verlängerten PEgRNAs beobachtet, die ein einzelnes Nukleotid einfügen (15 % doppelpositive Transformanten) oder ein einzelnes Nukleotid löschen (29 % doppelpositive Transformanten), um Frameshift-Mutationen zu korrigieren (38F und 45E-45F). Die DNA-Sequenzierung der editierten Plasmide, die aus doppelt positiven Hefekolonien gewonnen wurden, bestätigte, dass der kodierte Edit an der gewünschten Sequenzposition stattfand (45G). Diese Ergebnisse zeigen, dass die DNA-Reparatur in eukaryontischen Zellen 3' DNA-Flaps auflösen kann, die durch Prime- Editing entstehen, um präzise DNA-Edits einzubauen, die Transversionen, Insertionen und Deletionen beinhalten.
Ausgestaltung von Prime-Editor 1 (PE1)
Ermutigt durch die Ergebnisse in vitro und in Hefe wurde nach einem Prime-Editing- System mit einer minimalen Anzahl von Komponenten gesucht, das in der Lage ist, genomische DNA in Säugetierzellen zu editieren. Es wurde die Hypothese aufgestellt, dass 3'verlängerte PEgRNAs (im Folgenden einfach als PEgRNAs bezeichnet, 39A) und direkte Fusionen von Cas9 H840A mit der reversen Transkriptase über einen flexiblen Linker ein funktionelles Prime-Editing-System mit zwei Komponenten bilden könnten. HEK293T-Zellen (immortalisierte humane embryonale Nieren) wurden mit einem Plasmid transfiziert, das eine Fusion von Wildtyp-M-MLV-Reverse-Transkriptase mit einem beliebigen der beiden Termini von Cas9 H840A-Nickase kodiert, sowie mit einem zweiten Plasmid, das eine PEgRNA kodiert. Erste Versuche führten zu keiner nachweisbaren T·A-zu-A·T-Umwandlung am HEK3 Ziel-Locus.
Die Verlängerung der PBS in der PEgRNA auf 8-15 Basen (39A) führte jedoch zu nachweisbarem T·A-zu-A·T-Editing an der HEK3-Zielstelle (39B), wobei die Effizienz bei Prime-Editor-Konstrukten, bei denen die RT mit dem C-Terminus der Cas9- Nickase fusioniert war, höher war (3,7 % maximale T·A-zu-A·T-Umwandlung bei PBS- Längen von 8-15 nt) als bei N-terminalen RT-Cas9-Nickase-Fusionen (1,3 % maximale T·A- zu-A·T-Umwandlung) (39B; alle Säugetierzelldaten hierin beziehen sich auf die gesamte behandelte Zellpopulation, ohne Selektion oder Sortierung, sofern nicht anders angegeben). Diese Ergebnisse deuten darauf hin, dass die mit Cas9 fusionierte Wildtyp-M-MLV-RT für das Genom-Editing in humanen Zellen längere PBS-Sequenzen benötigt, als dies in vitro bei Verwendung der kommerziellen Variante der M-MLV-RT der Fall ist. Diese Wildtyp-M- MLV-Reverse-Transkriptase der ersten Generation, die mit dem C-Terminus der Cas9 H840A- Nickase fusioniert ist, wurde als PE1 bezeichnet.
Die Fähigkeit von PE1 zur präzisen Einführung von Transversionspunktmutationen an vier weiteren genomischen Zielstellen, die durch die PEgRNA spezifiziert wurden (39C), wurde getestet. Ähnlich wie beim Editing am HEK3-Locus war die Effizienz an diesen genomischen Stellen von der PBS-Länge abhängig, wobei die maximale Editing-Effizienz zwischen 0,7 und 5,5 % lag (39C). Die Indels von PE1 waren gering und betrugen im Durchschnitt 0,2±0,1 % für die fünf Stellen unter Bedingungen, die die Editing-Effizienz jeder Stelle maximierten (46A). PE1 war auch in der Lage, gezielte Insertionen und Deletionen einzubauen, z. B. eine Ein-Nukleotid-Deletion (4,0 % Effizienz), eine Ein-Nukleotid-Insertion (9,7 %) und eine Drei-Nukleotid-Insertion (17 %) am HEK3-Locus (39C). Diese Ergebnisse belegen die Fähigkeit von PE1, gezielte Transversionen, Insertionen und Deletionen direkt einzubauen, ohne dass doppelsträngige DNA-Brüche oder DNA-Template erforderlich sind.
Ausgestaltung von Prime-Editor 2 (PE2)
Während PE1 eine Vielzahl von Edits an verschiedenen Loci in HEK293T-Zellen einbauen kann, war die Editing-Effizienz im Allgemeinen gering (typischerweise ≤5 %) (39C). Es wurde die Hypothese aufgestellt, dass eine Veränderung der reversen Transkriptase in PE1 die Effizienz der DNA-Synthese innerhalb der einzigartigen konformationellen Beschränkungen des Prime-Editing-Komplexes verbessern könnte, was zu einer höheren Ausbeute beim Genom-Editing führen würde. M-MLV-RT-Mutationen, die die Thermostabilität des Enzyms^150,151, die Prozessivität¹⁵⁰ und die DNA:RNA-Heteroduplex- Substrataffinität¹⁵² erhöhen und die RNaseH-Aktivität¹⁵³ inaktivieren, sind bereits bekannt. Es wurden 19 PE1-Varianten konstruiert, die verschiedene Reverse-Transkriptase-Mutationen enthalten, um ihre Prime-Editing-Effizienz in humanen Zellen zu bewerten.
Zunächst wurde eine Reihe von M-MLV-RT-Varianten untersucht, die zuvor in der Laborevolution aufgrund ihrer Fähigkeit zur Unterstützung der reversen Transkription bei erhöhten Temperaturen¹⁵⁰ entstanden waren. Die sukzessive Einführung von drei dieser Aminosäuresubstitutionen (D200N, L603W und T330P) in M-MLV RT, im Folgenden als M3 bezeichnet, führte zu einer 6,8-fachen durchschnittlichen Steigerung der Effizienz des Transversions- und Insertions-Editings an fünf genomischen Loci in HEK293T-Zellen im Vergleich zu PE1 (47A-47S).
Als Nächstes wurden in Kombination mit M3 zusätzliche Reverse-Transkriptase- Mutationen getestet, die nachweislich die Bindung an den Templat:PBS-Komplex, die Prozessivität des Enzyms und die Thermostabilität¹⁵² verbessern. Unter den 14 zusätzlich analysierten Mutanten verbesserte eine Variante mit den Substitutionen T306K und W313F zusätzlich zu den M3-Mutationen die Editing-Effizienz um das 1,3- bis 3,0-fache im Vergleich zu M3 bei sechs Transversions- oder Insertions-Edits an fünf Genomstellen in humanen Zellen (47A-47S). Diese Pentamutante der M-MLV-Reverse-Transkriptase, die in die PE1- Architektur integriert ist (Cas9 H840A-M-MLV RT (D200N L603W T330P T306K W313F)), wird im Folgenden als PE2 bezeichnet.
PE2 baut Einzelnukleotid-Transversions-, Insertions- und Deletionsmutationen mit wesentlich höherer Effizienz ein als PE1 (39C) und ist kompatibel mit kürzeren PBS PEgRNA Sequenzen (39C), was mit einer verbesserten Fähigkeit zum produktiven Ineingriffbringen von transienten genomischen DNA:PBS-Komplexen einhergeht. Im Durchschnitt führte PE2 zu einer 1,6- bis 5,1-fachen Verbesserung der Prime-Editing- Punktmutationseffizienz gegenüber PE1 (39C) und in einigen Fällen zu einer dramatischen Verbesserung der Editing-Ausbeute um das bis zu 46-fache (47F und 47I). PE2 führte auch gezielte Insertionen und Deletionen effizienter durch als PE1 und erreichte die gezielte Insertion des 24-bp-FLAG-Epitop-Tags am HEK3-Locus mit einer Effizienz von 4,5 %, was eine 15-fache Verbesserung gegenüber der Effizienz des Einbaus dieser Insertion mit PE1 darstellt (47D), und vermittelte eine 1-bp-Deletion in HEK3 mit einer Effizienz von 8,6 %, 2,1 mal höher als die von PE1 (39C). Diese Ergebnisse belegen, dass PE2 ein effizienterer Prime-Editor als PE1 ist.
Optimierung der PEgRNA-Merkmale
Die Beziehung zwischen der PEgRNA-Architektur und Prime-Editing-Effizienz wurde systematisch an fünf genomischen Loci in HEK293T-Zellen mit PE2 untersucht (39C). Im Allgemeinen erforderten Priming-Stellen mit geringerem GC-Gehalt längere PBS- Sequenzen (EMX1 und RNF2, die 40 % bzw. 30 % GC-Gehalt in den ersten 10 nt stromaufwärts des Nicks enthielten), während solche mit höherem GC-Gehalt Prime-Editing mit kürzeren PBS-Sequenzen unterstützten (HEK4 und FANCF, die 80 % bzw. 60 % GC- Gehalt in den ersten 10 nt stromaufwärts des Nicks enthielten) (39C), was mit den energetischen Anforderungen für die Hybridisierung des genickten DNA-Strangs an die PEgRNA-PBS übereinstimmt. Weder die PBS-Länge noch die Höhe des GC-Inhalts waren für die Prime-Editing-Effizienz ausschlaggebend, und andere Faktoren wie die Sekundärstruktur des DNA-Primers oder die PEgRNA-Verlängerung können die Editing-Aktivität ebenfalls beeinflussen. Es wird empfohlen, mit einer PBS-Länge von ~13 nt für eine typische Zielsequenz zu beginnen und andere PBS-Längen zu untersuchen, wenn die Sequenz von ~40- 60 % GC-Inhalt abweicht. Falls erforderlich, sollten optimale PBS-Sequenzen empirisch bestimmt werden.
Als nächstes wurden die leistungsbestimmenden Faktoren des RT-Templat-Abschnitts der PEgRNA untersucht. PEgRNAs mit RT-Templaten von 10-20 nt Länge wurden systematisch an fünf genomischen Zielstellen mit PE2 (39D) und mit längeren RT- Templaten von bis zu 31 nt Länge an drei genomischen Stellen bewertet (48A-48C). Wie bei der PBS-Länge konnte auch die RT-Templat-Länge variiert werden, um die Prime-Editing- Effizienz zu maximieren, obwohl im Allgemeinen viele RT-Templat-Längen von ≥10 nt ein effizienteres Prime-Editing unterstützen (39D). Da einige Zielstellen längere RT- Template (>15 nt) bevorzugten, um eine höhere Editing-Effizienz zu erreichen (FANCF, EMX1), während andere Loci kurze RT-Template bevorzugten (HEK3, HEK4) (39D), empfiehlt es sich, bei der Optimierung einer PEgRNA sowohl kurze als auch lange RT- Template zu testen, beginnend mit ~10-16 nt.
Wichtig ist, dass RT-Template, die ein C als Nukleotid neben der terminalen Haarnadel des sgRNA-Gerüsts platzieren, im Allgemeinen zu einer geringeren Editing-Effizienz im Vergleich zu anderen PEgRNAs mit RT-Templaten ähnlicher Länge führen (48A-48C). Basierend auf der Struktur von sgRNAs, die an Cas9^148,149 gebunden sind, wurde spekuliert, dass das Vorhandensein eines C als erstes Nukleotid der 3'-Verlängerung einer kanonischen sgRNA die sgRNA-Gerüstfaltung durch Paarung mit G81, einem Nukleotid, das nativ einen pi-Stapel mit Tyr 1356 in Cas9 und ein nicht-kanonisches Basenpaar mit sgRNA A68 bildet, unterbrechen kann. Da viele RT-Templat-Längen das Prime-Editing unterstützen, wird empfohlen, PEgRNAs zu wählen, bei denen die erste Base der 3'-Erweiterung (die letzte revers transkribierte Base des RT-Templats) nicht C ist.
Ausgestaltung von Prime-Editor-3-Systemen (PE3 und PE3b)
Während PE2 die genetische Information von der PEgRNA effizienter auf den Ziel- Locus übertragen kann als PE1, bestimmt die Art und Weise, wie die Zelle die entstehende Heteroduplex-DNA auflöst, die aus einem editierten und einem uneditierten Strang besteht, ob der Edit dauerhaft ist. Eine frühere Entwicklung des Basen-Editing stand vor einer ähnlichen Herausforderung, da das Ausgangsprodukt der Cytosin- oder Adenin-Desaminierung eine Heteroduplex-DNA ist, die einen editierten und einen nicht-editierten Strang enthält. Um die Basen-Editing-Effizienz zu erhöhen, wurde eine Cas9 D10A-Nickase verwendet, um einen Nick in den nicht editierten Strang einzuführen und die DNA-Reparatur auf diesen Strang zu lenken, wobei der editierte Strang als Templat diente^129,130,142. Um dieses Prinzip zur Steigerung der Prime-Editing-Effizienz zu nutzen, wurde eine ähnliche Strategie getestet, bei der der nicht-editierte Strang mithilfe der bereits in PE2 vorhandenen Cas9 H840A-Nickase und einer einfachen sgRNA genickt wird, um einen bevorzugten Austausch des nicht-editierten Strangs durch die Zelle zu induzieren (40A). Da der editierte DNA-Strang ebenfalls genickt wurde, um das Prime-Editing einzuleiten, wurden verschiedene sgRNA-programmierte Nick-Orte auf dem nicht-editierten Strang getestet, um die Produktion von doppelsträngigen DNA-Brüchen, die zu Indels führen, zu minimieren.
Diese PE3-Strategie wurde zunächst an fünf genomischen Stellen in HEK293T-Zellen getestet, indem sgRNAs gescreent wurden, die 14 bis 116 Basen von der Stelle der PEgRNA- induzierten Nickstelle entfernt liegen, entweder 5' oder 3' vom PAM. An vier der fünf getesteten Stellen erhöhte das Nicking des nicht-editierten Strangs die Menge an indel-freien Prime-Editing-Produkten im Vergleich zum PE2-System um das 1,5- bis 4,2-fache, und zwar auf bis zu 55 % (40B). Während die optimale Nicking-Position je nach Genomstelle variierte, führten Nicks, die 3' von der PAM (positive Abstände in 40B) etwa 40-90 bp von dem PEgRNA-induzierten Nick positioniert sind, im Allgemeinen zu einer günstigen Steigerung der Prime-Editing-Effizienz (durchschnittlich 41 %) ohne übermäßige Indelbildung (durchschnittlich 6,8 % Indels für die sgRNA, die für jede der fünf getesteten Stellen die höchste Editiereffizienz ergab) (40B). Wie erwartet, führte die Platzierung des nicht- editierten Strang-Nicks innerhalb von 40 bp des PEgRNA-induzierten Nicks an einigen Stellen zu einem starken Anstieg der Indel-Bildung um bis zu 22 % (40B), was vermutlich auf die Bildung eines Doppelstrangbruchs durch das Nicking beider Stränge dicht nebeneinander zurückzuführen ist. An anderen Stellen hingegen führte ein Nicking, das nur 14 bp von dem PEgRNA-induzierten Nicking entfernt war, zu nur 5 % Indels (40B), was darauf hindeutet, dass ortsabhängige Faktoren die Umwandlung von proximalen dualen Nicks in Doppelstrang-DNA-Brüche kontrollieren. An einer getesteten Stelle (HEK4) stellten komplementäre Strang-Nicks entweder keinen Nutzen bereit oder führten zu Indel-Werten, die die Editing-Effizienz übertrafen (bis zu 26 %), selbst wenn sie in Abständen von >70 bp vom PEgRNA-induzierten Nick platziert wurden, was auf eine ungewöhnliche Neigung des editierten Strangs an dieser Stelle zurückzuführen ist, von der Zelle genickt zu werden oder ineffizient ligiert zu werden. Es wird empfohlen, mit nicht-editierten Strang-Knicks zu beginnen, die etwa 50 bp vom PEgRNA-vermittelten Nick entfernt sind, und alternative Nick- Orte zu testen, wenn die Indel-Häufigkeit akzeptable Werte überschreitet.
Dieses Modell zur Verbesserung der Prime-Editing-Effizienz durch Nicking des komplementären Strangs (40A) sagte voraus, dass das Nicking des nicht-editierten Strangs erst nach der Auflösung des editierten Strangs das Vorhandensein von gleichzeitigen Nicks minimieren könnte, wodurch die Häufigkeit von Doppelstrangbrüchen, die zur Bildung von Indels führen, verringert würde. Um eine vorübergehende Kontrolle über das Nicking des nicht-editierten Strangs zu erreichen, wurden sgRNAs mit Spacer-Sequenzen entworfen, die mit dem editierten Strang, aber nicht mit dem ursprünglichen Allel übereinstimmen. Bei dieser Strategie, die im Folgenden als PE3b bezeichnet wird, sollten Diskrepanzen zwischen dem Spacer und dem nicht-editierten Allel das Nicking durch die sgRNA so lange behindern, bis das Editing auf dem PAM-Strang stattgefunden hat. Dieser PE3b-Ansatz wurde mit fünf verschiedenen Edits an drei genomischen Stellen in HEK293T-Zellen getestet und die Ergebnisse mit denen der PE2- und PE3-Systeme verglichen. In allen Fällen war PE3b im Vergleich zu PE3 mit wesentlich weniger Indels verbunden (3,5- bis 30-fach, im Durchschnitt 12-fach weniger Indels oder 0,85 %), ohne dass die Gesamteffizienz des Editing im Vergleich zu PE3 deutlich abnahm (40C). Wenn der Edit innerhalb eines zweiten Protospacers lag, konnte das PE3b-System also die Zahl der Indels verringern und gleichzeitig die Editing- Effizienz im Vergleich zu PE2 verbessern, oft auf ein Niveau, das dem von PE3 ähnelt (40C).
Zusammengenommen ergaben diese Ergebnisse, dass PE3-Systeme (Cas9-Nickaseoptimierte reverse Transkriptase + PEgRNA + sgRNA) die Editing-Effizienz im Vergleich zu PE2 um das ~3-fache verbesserten (40B-40C). Wie angesichts der zusätzlichen Nicking- Aktivität von PE3 zu erwarten war, wurde PE3 von einer größeren Bandbreite an Indels begleitet als PE2. Die Verwendung von PE3 wird empfohlen, wenn die Prime-Editing- Effizienz im Vordergrund steht. Wenn die Minimierung von Indels entscheidend ist, bietet PE2 eine ~10-fach niedrigere Indel-Häufigkeit. Wenn es möglich ist, eine sgRNA zu verwenden, die den eingebauten Edit erkennt, um den nicht-editierten Strang zu nicken, kann das PE3b- System ein PE3-ähnliches Editing-Niveau erreichen und gleichzeitig die Indel-Bildung stark reduzieren.
Um die Reichweite und Vielseitigkeit des Prime-Editing mit PE3 zu demonstrieren, wurde der Einbau aller möglichen Einzelnukleotid-Substitutionen an den Positionen +1 bis +8 (wobei die erste Base 3' von dem PEgRNA-induzierten Nick als Position +1 gezählt wird) von der HEK3-Zielstelle unter Verwendung von PE3 und PEgRNAs mit 10-Nukleotid-RT- Templaten (41A) untersucht. Insgesamt decken diese 24 verschiedenen Edits alle vier Übergangsmutationen und alle acht Transversionsmutationen ab und führen zu einer Editing- Effizienz (die keine Indels enthält) von durchschnittlich 33±7,9 % (zwischen 14 % und 48 %), mit einem Durchschnitt von 7,5±1,8 % Indels.
Wichtig ist, dass auch RT-Template mit großer Entfernung zu einem effizienten Prime- Editing mit PE3 führen können. Zum Beispiel wurden unter Verwendung von PE3 mit einem 34-nt-RT-Templat Punktmutationen an den Positionen +12, +14,+17,+20,+23,+24,+26,+30 und +33 (12 bis 33 Basen vom PEgRNA-induzierten Nick) im HEK3-Locus mit einer durchschnittlichen Effizienz von 36±8,7% und 8,6±2,0% Indels (41B) eingebaut. Obwohl Edits jenseits der +10-Position an anderen Loci nicht versucht wurden, unterstützen andere RT- Template ≥30 nt an drei alternativen Stellen ebenfalls ein effizientes Editing (48A-C). Die Lebensfähigkeit langer RT-Template ermöglichte effizientes Prime-Editing für Dutzende von Nukleotiden ab der ersten Nickstelle. Da eine NGG-PAM auf jedem DNA-Strang im Durchschnitt alle ~8 bp vorkommt, weit weniger als die maximalen Abstände zwischen dem Edit und der PAM, die ein effizientes Prime-Editing unterstützen, wird das Prime-Editing im Gegensatz zu anderen Verfahren des Präzisions-Genom-Editing nicht wesentlich durch die Verfügbarkeit einer nahe gelegenen PAM-Sequenz eingeschränkt^125,142,154. In Anbetracht der vermuteten Beziehung zwischen RNA-Sekundärstruktur und Prime-Editing-Effizienz ist es bei der Ausgestaltung von PEgRNAs für Long-Range-Edits ratsam, RT-Template verschiedener Längen und ggf. Sequenzzusammensetzungen (z. B. synonyme Codons) zu testen, um die Editing-Effizienz zu optimieren.
Um ferner den Umfang und die Grenzen des PE3-Systems bei der Einführung von Übergangs- und Transversionspunktmutationen zu testen, wurden 72 zusätzliche Edits, die alle 12 möglichen Arten von Punktmutationen an sechs zusätzlichen genomischen Zielstellen abdecken (41C-41H) getestet. Insgesamt lag die Indel-freie Editing-Effizienz bei durchschnittlich 25±14 %, während die Indel-Bildung durchschnittlich 8,3±7,5 % betrug. Da das PEgRNA-RT-Templat die PAM-Sequenz beinhaltete, konnte das Prime-Editing Veränderungen in der PAM-Sequenz hervorrufen. In diesen Fällen wurden eine höhere Editing-Effizienz (durchschnittlich 39±9,7 %) und eine geringere Indel-Bildung (durchschnittlich 5,0±2,9 %) beobachtet (41A-41K, Punktmutationen an den Positionen +5 oder +6). Diese höhere Effizienz und geringere Indelbildung bei PAM-Edits könnte darauf zurückzuführen sein, dass die Cas9-Nickase den editierten Strang vor der Reparatur des komplementären Strangs nicht erneut binden und nicken kann. Da das Prime-Editing Kombinations-Edits ohne offensichtlichen Verlust an Editing-Effizienz unterstützt, wird das Editieren der PAM, wenn möglich, zusätzlich zu anderen gewünschten Änderungen empfohlen.
Als nächstes wurden 14 gezielte kleine Insertionen und 14 gezielte kleine Deletionen an sieben genomischen Stellen mit PE3 (41I) ausgeführt. Gezielte 1-bp-Insertionen erfolgten mit einer durchschnittlichen Effizienz von 32±9,8 %, während 3-bp-Insertionen mit einer durchschnittlichen Effizienz von 39±16 % eingebaut wurden. Gezielte 1-bp- und 3-bp- Deletionen waren ebenfalls effizient und erfolgten mit einer durchschnittlichen Ausbeute von 29±14 % bzw. 32±11 %. Die Erzeugung von Indel (jenseits der gezielten Insertion oder Deletion) betrug im Durchschnitt 6,8±5,4 %. Da Insertionen und Deletionen, die zwischen den Positionen +1 und +6 eingeführt werden, die Position oder die Struktur der PAM verändern, wurde spekuliert, dass Insertions- und Deletions-Edits in diesem Bereich typischerweise effizienter ist, da Cas9-Nickase den editierten DNA-Strang vor der Reparatur des komplementären Strangs nicht erneut binden und nicken kann, ähnlich wie bei Punktmutationen, die die PAM editieren.
PE3 wurde auch auf seine Fähigkeit getestet, größere präzise Deletionen von 5 bp bis 80 bp an der HEK3-Stelle zu vermitteln (41J). Bei Verwendung eines 13-nt-PBS- und eines RT-Templats, das 29, 24 bzw. 19 bp Homologie zum Ziel-Locus enthielt, wurden sehr hohe Editing-Effizienzen (52 bis 78 %) für 5-, 10- und 15-bp-Deletionen beobachtet. Die Verwendung eines RT-Templats mit 26 nt ermöglichte eine größere Deletion von 25 bp mit einer Effizienz von 72±4,2 %, während ein RT-Templat mit 20 nt eine Deletion von 80 bp mit einer Effizienz von 52±3,8 % ermöglichte. Diese gezielten Deletionen gingen mit Indel- Frequenzen von durchschnittlich 11±4,8 % einher (41J).
Schließlich wurde die Fähigkeit von PE3 getestet, 12 Kombinationen von multiplen Edits am selben Ziel-Locus zu vermitteln, die aus Insertionen und Deletionen, Insertionen und Punktmutationen, Deletionen und Punktmutationen oder zwei Punktmutationen an drei Genomstellen bestehen. Diese kombinierten Edits waren sehr effizient und erreichten im Durchschnitt 55 % des Ziel-Edits mit 6,4 % Indels (41K) und zeigen, dass Prime-Editing in der Lage ist, Kombinationen von Präzisions-Insertionen, Deletionen und Punktmutationen an einzelnen Zielstellen mit hoher Effizienz und geringer Indel-Häufigkeit durchzuführen.
Zusammengenommen stellen die Beispiele in 41A-41K 156 verschiedene Transitions-, Transversions-, Insertions-, Deletions- und Kombinations-Edits an sieben humanen genomischen Loci. dar. Diese Ergebnisse belegen die Vielseitigkeit, Präzision und Zielflexibilität des Prime-Editing.
Prime-Editing im Vergleich zum Basen-Editing
Cytidinbasen-Editoren (CBEs) und Adeninbasen-Editoren (ABEs) der aktuellen Generation können C·G-zu-T·A- und A-T-zu-G-C-Übergangsmutationen mit hoher Effizienz und geringen Indels einbauen^129,130,142. Die Anwendung des Basen-Editing kann durch das Vorhandensein mehrerer Cytidin- oder Adeninbasen innerhalb des Aktivitätsfensters für das Basen-Editing (typischerweise ~5 bp breit) eingeschränkt werden, was zu unerwünschten Bystander-Edits führt^{129,130,142,155}, oder durch das Fehlen einer PAM, die etwa 15±2 nt vom Zielnukleotid entfernt ist^142,156. Es wurde erwartet, dass das Prime-Editing besonders nützlich sein könnte, wenn es um den präzisen Einbau von Übergangsmutationen ohne Bystander-Edits geht oder wenn das Fehlen von geeignet positionierten PAMs eine günstige Positionierung des Zielnukleotids innerhalb des CBE- oder ABE-Aktivitätsfensters ausschließt.
Prime-Editing und Cytosin-Basen-Editing wurden verglichen, indem drei genomische Loci, die mehrere Ziel-Cytidine im kanonischen Basen-Editing-Fenster (Protospacer- Positionen 4-8, wobei die PAM als Positionen 21-23 gezählt werden) enthalten, mit optimierten CBEs¹⁵⁷ ohne Nickase-Aktivität (BE2max) oder mit Nickase-Aktivität (BE4max) oder mit den analogen PE2- und PE3-Prime-Editing-Systemen editiert wurden. Unter den insgesamt neun Ziel-Cytosinen innerhalb der Basen-Editing-Fenster der drei Stellen ergab BE4max eine 2,2-fach höhere durchschnittliche C·G-zu-T·A-Umwandlung als PE3 für Basen in der Mitte des Basen-Editing-Fensters (Protospacer-Positionen 5-7, 42A). Ebenso übertraf BE2max ohne Nicking PE2 bei diesen gut positionierten Basen im Durchschnitt um das 1,4-fache (42A). PE3 übertraf jedoch BE4max um das 2,7-fache und PE2 übertraf BE2max um das 2,0-fache bei Cytosinen jenseits des Zentrums des Basen-Editierfensters (durchschnittliches Editing von 40±17 % für PE3 gegenüber 15±18 % für BE4max und 22±11 % für PE2 gegenüber 11±13 % für BE2max). Insgesamt waren die Indel-Häufigkeiten bei PE2 sehr niedrig (durchschnittlich 0,86±0,47 %) und bei PE3 ähnlich oder leicht höher als bei BE4max (BE4max-Bereich: 2,5 % bis 14 %; PE3-Bereich: 2,5 % bis 21 %) (42B).
Beim Vergleich der Effizienz des Basen-Editing mit dem Prime-Editing für den Einbau präziser C·G-zu-T·A-Edits (ohne Bystander-Editing) übertraf die Effizienz des Prime-Editing die des Basen-Editing an den oben genannten Stellen, die wie die meisten genomischen DNA- Stellen mehrere Cytosine innerhalb des -5-bp-Basen-Editing-Fensters enthalten, bei weitem (42C). An diesen Stellen, wie EMX1, die Cytosine an den Protospacer-Positionen C5, C6 und C7 enthält, erzeugte BE4max nur wenige Produkte, die nur die Umwandlung des einzelnen Zielbasenpaares enthielten, ohne Bystander-Edits. Im Gegensatz dazu konnte Prime-Editing an dieser Stelle dazu verwendet werden, selektiv einen C·G-zu-T·A-Edit an einer beliebigen Position oder Kombination von Positionen (C5, C6, C7, C5+C6, C6+C7, C5+C7 oder C5+C6+C7) einzubauen (42C). Alle präzisen Edits mit einer oder zwei Basen (d. h. Edits, die keine anderen Basen in der Nähe modifizieren) waren mit PE3 oder PE2 wesentlich effizienter als mit BE4max bzw. BE2, während der dreibasige C·G-zu-T·A-Edit mit BE4max effizienter war (42C), was die Neigung der Editoren widerspiegelt, alle Zielbasen innerhalb des Aktivitätsfensters zu editieren. Zusammengenommen zeigen diese Ergebnisse, dass Cytosin-Basen-Editoren bei optimal positionierten Zielbasen ein höheres Maß an Editing erreichen können als PE2 oder PE3, dass aber Prime-Editing das Editing von Basen bei nicht optimal positionierten Zielbasen übertreffen kann und bei mehreren editierbaren Basen eine viel höhere Präzision erreicht.
Das A·T-zu-G·C-Editing wurde an zwei genomischen Loci durch eine optimierte Nicht-Nicking-ABE (ABEmax¹⁵² mit einer dCas9- statt einer Cas9-Nickase, im Folgenden ABEdmax genannt) im Vergleich zu PE2 und durch den optimierten Nicking-Adeninbasen- Editor ABEmax im Vergleich zu PE3 verglichen. An einer Stelle, die zwei Zieladenine im Basen-Editing-Fenster enthält (HEK3), waren ABEs effizienter als PE2 oder PE3 für die Umwandlung von A5, aber PE3 war effizienter für die Umwandlung von A8, das am Rand des Editing-Fensters von ABEmax liegt (42D). Beim Vergleich der Effizienz von Präzisions- Edits, bei denen nur ein einziges Adenin umgewandelt wird, schnitt PE3 sowohl bei A5 als auch bei A8 besser ab als ABEmax (42E). Insgesamt produzierten ABEs bei HEK3 weit weniger Indels als Prime-Editoren (0,19±0,02 % für ABEdmax gegenüber 1,5±0,46 % für PE2 und 0,53±0,16 % für ABEmax gegenüber 11±2,3 % für PE3, 42F). Bei FANCF, bei dem nur ein einziges A innerhalb des Basen-Editing-Fensters vorhanden ist, übertrafen ABE2 und ABEmax ihre Prime-Editing-Pendants bei der Gesamtumwandlung der Zielbasenpaare um das 1,8- bis 2,9-fache, wobei praktisch alle editierten Produkte sowohl aus dem Basen-Editing als auch aus dem Prime-Editing nur den präzisen Edit enthielten (42D-42E). Wie bei der HEK3-Stelle erzeugten die ABEs auch an der FANCF-Stelle weit weniger Indels (42F).
Insgesamt deuten diese Ergebnisse darauf hin, dass Basen-Editing und Prime-Editing komplementäre Stärken und Schwächen bei der Durchführung gezielter Übergangsmutationen aufweisen. In Fällen, in denen ein einzelnes Zielnukleotid innerhalb des Basen-Editing- Fensters vorhanden ist, oder wenn Bystander-Edits akzeptabel sind, sind die aktuellen Basen- Editoren in der Regel effizienter und führen zu weniger Indels als Prime-Editoren. Wenn mehrere Cytosine oder Adenine vorhanden sind und Bystander-Editing unerwünscht ist, oder wenn die Zielbasen für das Basen-Editing im Vergleich zu den verfügbaren PAMs schlecht positioniert sind, bieten Prime-Editoren erhebliche Vorteile.
Off-Target-Prime-Editing
Für ein produktives Editing erfordert Prime-Editing eine Komplementarität von Ziel- Locus:PEgRNA-Spacer, damit die Cas9-Domäne binden kann, eine Komplementarität von Ziel-Locus:PEgRNA-PBS, damit die PEgRNA-geprimte reverse Transkription initiiert werden kann, und eine Komplementarität von Ziel-Locus:Produkt der reversen Transkriptase für die Flap-Auflösung. Es wurde die Hypothese aufgestellt, dass diese drei unterschiedlichen Anforderungen an die DNA-Hybridisierung das Off-Target-Prime-Editing im Vergleich zu anderen Verfahren des Genom-Editing minimieren könnten. Um diese Möglichkeit zu testen, wurden HEK293T-Zellen mit PE3 oder PE2 und insgesamt 16 PEgRNAs behandelt, die so ausgestaltet wurden, dass sie auf vier genomische Ziel-Loci zielen, mit Cas9 und den vier entsprechenden sgRNAs, die auf dieselben Protospacer zielen, oder mit Cas9 und denselben 16 PEgRNAs. Diese vier Ziel-Loci wurden ausgewählt, weil jeder mindestens vier gut charakterisierte Off-Target-Stellen aufweist, für die Cas9 und die entsprechende On-TargetsgRNA in HEK293T-Zellen bekanntermaßen erhebliche Off-Target-DNA-Veränderungen verursachen^118,159. Nach der Behandlung wurden die vier On-Target-Loci und die vier bekanntesten Off-Target-Stellen von Cas9 für jeden On-Target-Spacer sequenziert, was insgesamt 16 Off-Target-Stellen ergibt (Tabelle 1).
In Übereinstimmung mit früheren Studien¹¹⁸ modifizierten Cas9 und die vier ZielsgRNAs alle 16 der zuvor berichteten Off-Target-Loci (42G). Die Effizienz der Cas9- Off-Target-Modifikation an den vier Off-Target-Stellen für den HEK3-Ziel-Locus lag bei durchschnittlich 16 %. Cas9 und die auf HEK4 abzielende sgRNA führten zu einer durchschnittlichen Modifikation von 60 % der vier getesteten bekannten Off-Target-Stellen. Ebenso wurden die Off-Target-Stellen für EMX1 und FANCF durch Cas9:sgRNA mit einer durchschnittlichen Häufigkeit von 48 % bzw. 4,3 % modifiziert (42G). Es wurde festgestellt, dass PEgRNAs mit Cas9-Nuklease im Vergleich zu sgRNAs im Durchschnitt On- Target-Stellen mit ähnlicher (1- bis 1,5-fach geringerer) Effizienz modifizierten, während PEgRNAs mit Cas9-Nuklease Off-Target-Stellen mit einer ~4-fach geringeren durchschnittlichen Effizienz als sgRNAs modifizierten.
Auffallend ist, dass PE3 oder PE2 mit denselben 16 getesteten PEgRNAs, die diese vier Zielspacer enthalten, zu einem wesentlich geringeren Off-Target-Editing führten (42H). Von den 16 Stellen, von denen bekannt ist, dass sie durch Cas9+sgRNA einem Off-Target- Editing unterzogen werden, führten PE3+PEgRNAs oder PE2+PEgRNAs nur an 3 von 16 Off- Target-Stellen zu einem nachweisbaren Off-Target-Prime-Editing, wobei nur 1 von 16 Stellen eine Off-Target-Editing-Effizienz von ≥1 % aufwies (42H). Das durchschnittliche Off- Target-Prime-Editing für die PEgRNAs, die auf HEK3, HEK4, EMX1 und FANCF an diesen 16 bekannten Cas9-Off-Target-Stellen abzielten, betrug <0,1 %, <2,2±5,2 %, <0,1 % bzw. <0,13±0,11 % (42H). Bemerkenswerterweise führt PE2+PEgRNAl an der HEK4 Off- Target-3-Stelle, die Cas9+PEgRNA1 mit 97 % Effizienz editiert, zu einem Off-Target-Editing von nur 0,7 %, obwohl sie dieselbe Spacer-Sequenz teilen was zeigt, wie die zwei zusätzlichen DNA-Hybridisierungsereignisse, die für das Prime-Editing im Vergleich zum Cas9-Editing erforderlich sind, das Off-Target-Editing erheblich reduzieren können. Zusammengenommen deuten diese Ergebnisse darauf hin, dass PE3 und PEgRNAs ein viel geringeres Off-Target- DNA-Editing in humanen Zellen induzieren als Cas9 und sgRNAs, die auf dieselben Protospacer abzielen.
Die reverse Transkription von 3'-verlängerten PEgRNAs kann im Prinzip in das Leit- RNA-Gerüst erfolgen. Wenn der resultierende 3'-Flap trotz fehlender Komplementarität an seinem 3'-Ende mit dem uneditierten DNA-Strang in den Ziel-Locus eingebaut wird, führt dies zum Einfügen von PEgRNA-Gerüstnukleotiden, die zur Indel-Häufigkeit beitragen. Wir analysierten die Sequenzierungsdaten von 66 PE3-vermittelten Editing-Experimenten an vier Loci in HEK293T-Zellen und beobachteten eine geringe Häufigkeit der PEgRNA- Gerüstinsertion, im Durchschnitt 1,7±1,5 % Gesamtinsertion einer beliebigen Anzahl von PEgRNA-Gerüstnukleotiden (56A-56D). Es wird spekuliert, dass die Unzugänglichkeit des Leit-RNA-Gerüsts für die reverse Transkriptase aufgrund der Bindung der Cas9-Domäne sowie die zelluläre Exzision während der Flap-Auflösung des fehlangepassten 3'-Endes des 3'- Flaps, die aus der reversen Transkription des PEgRNA-Gerüsts resultiert, Produkte minimiert, die PEgRNA-Gerüstnukleotide einschließen. Obwohl solche Ereignisse selten sind, könnten künftige Bemühungen um die Entwicklung von PEgRNAs oder Prime-Editor-Proteinen, die den Einbau von PEgRNA-Gerüsten minimieren, die Häufigkeit von Indels weiter verringern.
Deaminasen in einigen Basen-Editoren können Cas9-unabhängig agieren, was zu geringem, aber weit verbreitetem Off-Target-DNA-Editing bei CBEs der ersten Generation (aber nicht bei ABEs)^160-162 und Off-Target-RNA-Editing bei CBEs und ABEs der ersten Generation^163-165 führt, obwohl neuere CBE- und ABE-Varianten mit konstruierten Deaminasen das Cas9-unabhängige Off-Target-DNA- und RNA-Editing stark reduzieren^163-165. Prime-Editoren verfügen nicht über Enzyme zur Basenmodifikation wie Deaminasen und weisen daher keine inhärente Fähigkeit auf, DNA- oder RNA-Basen auf eine Cas9- unabhängige Weise zu modifizieren.
Während die Reverse-Transkriptase-Domäne in Prime-Editoren prinzipiell in der Lage wäre, ordnungsgemäß geprimte RNA- oder DNA-Template in Zellen zu verarbeiten, wurde festgestellt, dass Retrotransposons wie die der LINE-1-Familie¹⁶⁶, endogene Retroviren^167,168 und die humane Telomerase alle aktive endogene humane reverse Transkriptasen bereitstellen. Ihr natürliches Vorhandensein in humanen Zellen lässt darauf schließen, dass die Aktivität der reversen Transkriptase selbst nicht wesentlich toxisch ist. In der Tat wurden keine PE3- abhängigen Unterschiede in der Lebensfähigkeit von HEK293T-Zellen im Vergleich zu Kontrollen beobachtet, die dCas9, Cas9-H840A-Nickase oder PE2 mit R110S+K103L (PE2- dRT) Mutationen exprimieren, die die reverse Transkriptase inaktivieren¹⁶⁹ (49A-49B).
Ungeachtet der oben genannten Daten und Analysen sind weitere Studien erforderlich, um Off-Target-Prime-Editing auf unvoreingenommene, genomweite Weise zu bewerten und das Ausmaß zu charakterisieren, in dem die Varianten der reversen Transkriptase in Prime- Editoren oder Prime-Editing-Zwischenprodukten Zellen beeinträchtigen können.
Prime-Editing-pathogene Transversions-, Insertions- und Deletionsmutationen in humanen Zellen
Die Fähigkeit von PE3, in humanen Zellen Transversions-, kleine Insertions- und kleine Deletionsmutationen, die genetische Krankheiten verursachen, direkt einzubauen oder zu korrigieren, wurde getestet. Die Sichelzellenkrankheit wird am häufigsten durch eine A·T-zu- T·A-Transversionsmutation in HBB verursacht, die zu der Mutation Glu6->Val in Beta-Globin führt. Die Behandlung hämatopoetischer Stammzellen ex vivo mit Cas9-Nuklease und eines Donor-DNA-Templats für HDR, gefolgt von der Anreicherung der editierten Zellen, Transplantation und Verpflanzung ist eine vielversprechende potenzielle Strategie für die Behandlung der Sichelzellkrankheit¹⁷⁰. Allerdings werden bei diesem Ansatz neben dem korrekt editierten HBB-Allel immer noch viele Indel-haltige Nebenprodukte erzeugt^170-171. Obwohl Editoren im Allgemeinen weit weniger Indels erzeugen, können sie derzeit nicht die T·A-zu-A·T-Transversionsmutation durchführen, die zur direkten Wiederherstellung der normalen Sequenz von HBB erforderlich ist.
PE3 wurde verwendet, um die HBB-E6V-Mutation in HEK293T-Zellen mit 44 % Effizienz und 4,8 % Indels einzubauen (43A). Aus der Mischung der PE3-behandelten Zellen isolierten wir sechs HEK293T-Zelllinien, die homozygot (triploid) für das HBB E6V- Allel sind (53A-53D), was die Fähigkeit des Prime-Editing zur Erzeugung von humanen Zelllinien mit pathogenen Mutationen belegt. Um das HBB E6V-Allel zu Wildtyp-HBB zu korrigieren, behandelten wir homozygote HBB E6V HEK293T-Zellen mit PE3 und einer PEgRNA, die so programmiert ist, dass sie die HBB E6V-Mutation direkt in Wildtyp-HBB umwandelt. Insgesamt wurden 14 PEgRNA-Ausgestaltungen getestet. Nach drei Tagen ergab die DNA-Sequenzierung, dass alle 14 PEgRNAs in Kombination mit PE3 zu einer effizienten Korrektur von HBB E6V zu Wildtyp-HBB führten (≥26 % Wildtyp-HBB ohne Indels), wobei die Indel-Werte im Durchschnitt 2,8±0,70 % betrugen (50A). Die beste PEgRNA führte zu einer 52%igen Korrektur von HBB E6V zu Wildtyp bei 2,4 % Indels (43A). Die Einführung einer stillen Mutation, die die von der PEgRNA erkannte PAM modifiziert, verbesserte die Editing-Effizienz und die Produktreinheit geringfügig auf 58 % Korrektur bei 1,4 % Indels (43A). Diese Ergebnisse belegen, dass durch Prime-Editing eine pathogene Transversionspunktmutation in einer humanen Zelllinie mit hoher Effizienz und minimalen Nebenprodukten eingebaut und korrigiert werden kann.
Die Tay-Sachs-Krankheit wird am häufigsten durch eine 4-bp-Insertion in das HEXA- Gen (HEXA 1278+TATC)¹³⁶ verursacht. PE3 wurde verwendet, um diese 4-bp-Insertion mit 31 % Effizienz und 0,8 % Indels in HEK293T-Zellen einzubauen (43B) und isolierte zwei HEK293T-Zelllinien, die homozygot für das HEXA 1278+TATC-Allel sind (53A-53D). Diese Zellen wurden verwendet, um 43 PEgRNAs und drei Nicking-sgRNAs mit PE3- oder PE3b-Systemen zur Korrektur der pathogenen Insertion in HEXA zu testen (50B), entweder durch perfekte Reversion zum Wildtyp-Allel oder durch eine verschobene 4-bp- Deletion, die die PAM unterbricht und eine stille Mutation einführt. Neunzehn der 43 getesteten PEgRNAs führten zu einem Editing von ≥20 %. Die perfekte Korrektur zu Wildtyp- HEXA mit PE3 oder PE3b und der besten PEgRNA verlief mit ähnlichen durchschnittlichen Effizienzen (30 % für PE3 gegenüber 33 % für PE3b), jedoch ging das PE3b-System mit 5,3- mal weniger Indel-Produkten einher (1,7 % für PE3 gegenüber 0,32 % für PE3b) (43B und 50B). Diese Ergebnisse zeigen, dass das Prime-Editing in der Lage ist, präzise kleine Insertionen und Deletionen vorzunehmen, die ein pathogenes Allel in Säugetierzellen effizient und mit einem Minimum an Nebenprodukten einbauen oder korrigieren.
Schließlich wurde der Einbau eines schützenden SNP in PRNP, das Gen, das das humane Prionprotein (PrP) kodiert, getestet. Die Fehlfaltung von PrP verursacht eine fortschreitende und tödliche neurodegenerative Prionenkrankheit, die spontan durch vererbte dominante Mutationen im PRNP-Gen oder durch Exposition gegenüber fehlgefaltetem PrP¹⁷² entstehen kann. Ein natürlich vorkommendes PRNP-G127V-Mutationsallel verleiht Menschen¹³⁸ und Mäusen¹⁷³ eine Resistenz gegen die Prionenkrankheit. PE3 wurde verwendet, um G127V in das humane PRNP-Allel in HEK293T-Zellen einzubauen, was eine G·C-zu- T·A-Transversion erfordert. Vier PEgRNAs und drei Nicking-sgRNAs wurden mit dem PE3- System bewertet. Nach dreitägiger Exposition mit der effektivsten PE3- und PEgRNA zeigte die DNA-Sequenzierung eine Effizienz von 53±11 % bei dem Einbau der G127V-Mutation und Indel-Werte von 1,7±0,7 % (43C). Zusammengenommen belegen diese Ergebnisse die Fähigkeit des Prime-Editing in humanen Zellen, Transversions-, Insertions- oder Deletionsmutationen, die eine Krankheit verursachen oder eine Resistenz gegen diese verleihen, effizient und mit einem Minimum an Nebenprodukten einzubauen oder zu korrigieren.
Prime-Editing in verschiedenen humanen Zelllinien und primären Mausneuronen
Als nächstes wurde das Prime-Editing auf seine Fähigkeit zum Editieren endogener Stellen in drei weiteren humanen Zelllinien getestet. In K562-Zellen (leukämisches Knochenmark) wurde PE3 verwendet, um Edits mit Transversionen an den HEK3-, EMX1- und FANCF-Stellen auszuführen, ebenso wie die 18-bp-Insertion eines 6xHis-Tags in HEK3. Bei jedem dieser vier PE3-vermittelten Edits wurde eine durchschnittliche Editing-Effizienz von 15-30 % beobachtet, wobei die Indels im Durchschnitt 0,85-2,2 % betrugen (43A). In U2OS-Zellen (Osteosarkom) wurden Transversionsmutationen in HEK3 und FANCF sowie eine 3-bp-Insertion und eine 6xHis-Tag-Insertion in HEK3 mit einer Editing-Effizienz von 7,9-22 % eingebaut, die die Indel-Bildung um das 10- bis 76-fache überstieg (43A). Schließlich wurde in HeLa-Zellen (Gebärmutterhalskrebs) eine 3-bp-Insertion in HEK3 mit einer durchschnittlichen Effizienz von 12 % und 1,3 % Indels ausgeführt (43A). Insgesamt deuten diese Daten darauf hin, dass mehrere Zelllinien über HEK293T-Zellen hinaus das Prime-Editing unterstützen, obwohl die Editing-Effizienzen je nach Zelltyp variieren und im Allgemeinen weniger effizient sind als in HEK293T-Zellen. Das Editing:Indel-Verhältnis blieb in allen getesteten humanen Zelllinien hoch.
Um zu bestimmen, ob Prime-Editing in post-mitotischen, terminal differenzierten primären Zellen möglich ist, wurden primäre kortikale Neuronen aus E18,5-Mäusen mit einem Dual-Split-PE3-Lentiviralverabreichungssystem transduziert, bei dem Split-Intein-Splicing²⁰³ das PE2-Protein aus N-terminalen und C-terminalen Hälften rekonstituiert, die jeweils von einem separaten Virus eingeschleust werden. Um das Editing auf post-mitotische Neuronen zu beschränken, wurde der humane Synapsin-Promotor, der hochspezifisch für reife Neuronen²⁰⁴ ist, für die Exprimierung beider PE2-Protein-Komponenten verwendet. GFP wurde durch ein selbstspaltendes P2A-Peptid²⁰⁵ mit der N-terminalen Hälfte von PE2 fusioniert. Kerne von Neuronen wurden zwei Wochen nach der dualen viralen Transduktion isoliert und direkt sequenziert oder vor der Sequenzierung für GFP-Exprimierung sortiert. Ein durchschnittliches Prime-Editing von 7,1±1,2 % zum Einbau einer Transversion am DNMT1-Locus mit durchschnittlich 0,58±0,14 % Indels in sortierten Kernen (43D) wurde beobachtet. Die Cas9-Nuklease in demselben Split-Intein-Dual-Lentivirus-System führte zu 31±5,5 % Indels in sortierten kortikalen Neuronenkernen (43D). Diese Daten weisen darauf hin, dass post- mitotische, terminal differenzierte Primärzellen Prime-Editing unterstützen können, und belegen somit, dass Prime-Editing keine Zellreplikation erfordert.
Prime-Editing im Vergleich zu Cas9-initiiertem HDR
Die Leistung von PE3 wurde mit der des optimierten Cas9-initiierten HDR^128,125 in mitotischen Zelllinien, die HDR¹²⁸ unterstützen, verglichen. HEK293T-, HeLa-, K562- und U2OS-Zellen wurden mit Cas9-Nuklease, einer sgRNA und einem ssDNA-Donor- Oligonukleotid-Templat behandelt, das so entworfen wurde, dass es eine Vielzahl von Transversions- und Insertions-Editings ermöglicht (43E-43G und 51A-51F). Cas9- initiierte HDR führte in allen Fällen erfolgreich das gewünschte Editing durch, allerdings mit einem weitaus höheren Anteil an Nebenprodukten (vorwiegend Indels), wie bei Behandlungen, die doppelsträngige Brüche verursachen, zu erwarten. Bei der Verwendung von PE3 in HEK293T-Zellen verlief der Einbau und die Korrektur von HBB E6V mit einer durchschnittlichen Editing-Effizienz von 42 % bzw. 58 % bei durchschnittlich 2,6 % bzw. 1,4 % Indels (43E und 43G). Im Gegensatz dazu führten die gleichen Edits mit der Cas9-Nuklease und einem HDR-Templat zu einer durchschnittlichen Editing-Effizienz von 5,2 % und 6,7 % bei einer durchschnittlichen Indel-Häufigkeit von 79 % und 51 % (43E und 43G). In ähnlicher Weise baute PE3 PRNP-G127V mit 53 % Effizienz und 1,7 % Indels ein, während Cas9-initiierte HDR diese Mutation mit 6,9 % Effizienz und 53 % Indels einbaute (43E und 43G). So war das Verhältnis von Editing:Indels für den Einbau von HBB-E6V, die Korrektur von HBB-E6V und den Einbau von PRNP-G127V im Durchschnitt 270-mal höher für PE3 als für Cas9-initiierte HDR.
Vergleiche zwischen PE3 und HDR in anderen humanen Zelllinien als HEK293T zeigten ähnliche Ergebnisse, wenn auch mit niedrigeren PE3-Editing-Effizienzen. Zum Beispiel verlief in K562-Zellen die PE3-vermittelte 3-bp-Insertion in HEK3 mit 25 % Effizienz und 2,8 % Indels, verglichen mit 17 % Editing und 72 % Indels bei Cas9-initiierter HDR, ein 40-faches Editing:Indel-Verhältnis zugunsten von PE3 (43F-43G). In U2OS-Zellen führte PE3 diese 3-bp-Insertion mit 22 % Effizienz und 2,2 % Indels aus, während Cas9- initiierte HDR zu 15 % Editing und 74 % Indels führte, was einem 49-fach niedrigeren Editing:Indel-Verhältnis entspricht (43F-43G). In HeLa-Zellen führte PE3 diese Insertion mit einer Effizienz von 12 % und 1,3 % Indels durch, gegenüber 3,0 % Editing und 69 % Indels bei Cas9-initiierter HDR, was einem 210-fachen Unterschied im Editing:Indel-Verhältnis entspricht (43F-43G). Insgesamt zeigten diese Daten, dass HDR in den vier getesteten Zelllinien typischerweise zu ähnlichen oder niedrigeren Editing-Effizienzen und weit höheren Indels als PE3 führt (51A-51F).
Erörterung und zukünftige Richtungen
Die Fähigkeit, DNA-Sequenzen mit einer Präzision von einem einzigen Nukleotid einzufügen, ist eine besonders wichtige Fähigkeit des Prime-Editing. Zum Beispiel wurde PE3 verwendet, um in HEK293T-Zellen ein His₆-Tag (18 bp, 65 % durchschnittliche Effizienz), ein FLAG-Epitop-Tag (24 bp, 18 % durchschnittliche Effizienz) und eine verlängerte LoxP-Stelle (44 bp, 23 % durchschnittliche Effizienz), die das native Substrat für die Cre-Rekombinase ist, präzise in den HEK3-Locus einzufügen. Die durchschnittlichen Indels lagen bei diesen Beispielen zwischen 3,0 % und 5,9 % (43H). Die Fähigkeit, neue DNA-Sequenzen effizient und präzise in die Zielstellen von Interesse in lebenden Zellen einzubringen, wird voraussichtlich zahlreiche biotechnologische, synthetische biologische und therapeutische Anwendungen ermöglichen.
Insgesamt wurden bei den hierin beschriebenen Prime-Editing-Experimenten 18 Insertionen bis zu 44 bp, 22 Deletionen bis zu 80 bp, 113 Punktmutationen, einschließlich 77 Transversionen, und 18 kombinierte Edits an 12 endogenen Loci im Human- und Mausgenom an Stellen zwischen 3 bp stromaufwärts und 29 bp stromabwärts vom Beginn einer PAM durchgeführt, ohne dass dabei explizite doppelsträngige DNA-Brüche entstanden. Diese Ergebnisse machen das Prime-Editing zu einem bemerkenswert vielseitigen Verfahren des Genom-Editing. Da die überwältigende Mehrheit (85-99 %) der Insertionen, Deletionen, Indels und Duplikationen in ClinVar ≤30 bp sind (52A-52D), kann Prime-Editing im Prinzip bis zu ~89 % der 75.122 derzeit bekannten pathogenen humanen genetischen Varianten in ClinVar korrigieren (Transitionen, Transversionen, Insertionen, Deletionen, Indels und Duplikationen in 38A), mit zusätzlichem Potenzial zur Verbesserung von Krankheiten, die durch Kopienzahlzuwachs oder -verlust verursacht werden.
Wie hierin ausführlich dargelegt, bietet die Flexibilität des Prime-Editing für jeden gewünschten Edit viele Wahlmöglichkeiten in Bezug auf PEgRNA-induzierte Nick-Orte, sgRNA-induzierte Zweitstrang-Nick-Orte, PBS-Längen, RT-Templat-Längen und den zuerst zu editierenden Strang. Diese Flexibilität, die im Gegensatz zu den begrenzteren Optionen steht, die typischerweise für andere Präzisions-Genom-Editing-Verfahren^125,142,154 zur Verfügung stehen, ermöglicht es, die Editing-Effizienz, die Produktreinheit, die DNA- Spezifität oder andere Parameter zu optimieren, um den Bedürfnissen einer bestimmten Anwendung gerecht zu werden, wie in 50A-50B gezeigt, in denen das Testen von 14 und 43 PEgRNAs, die eine Reihe von Prime-Editing-Strategien abdecken, die Korrektur von pathogenen HBB- bzw. HEXA-Allelen optimiert.
Um das Prime-Editing weiter zu verstehen und zu verbessern, sind noch viel zusätzliche Forschung erforderlich. Zusätzliche Modifikationen von Prime-Editor-Systemen könnten erforderlich sein, um ihre Kompatibilität auf andere Zelltypen, wie post-mitotische Zellen, zu erweitern. Die Verknüpfung von Prime-Editing mit viralen und nicht-viralen In-vitro- und Invivo-Einschleusungsstrategien ist erforderlich, um das Potenzial von Prime-Editing für eine breite Palette von Anwendungen, die die Erforschung und Behandlung genetischer Krankheiten beinhalten, voll auszuschöpfen. Durch das Ermöglichen hochpräziser gezielter Übergänge, Transversionen, kleiner Insertionen und kleiner Deletionen im Genom von Säugetierzellen ohne Doppelstrangbrüche oder HDR stellt das Prime-Editing jedoch eine neue „Suchen-und Ersetzen“-Funktion bereit, die den Anwendungsbereich des Genom-Editings erheblich erweitert.
Verfahren
Allgemeine Verfahren
Die DNA-Amplifikation erfolgte durch PCR unter Verwendung von Phusion U Green Multiplex PCR Master Mix (ThermoFisher Scientific) oder Q5 Hot Start High-Fidelity 2x Master Mix (New England BioLabs), sofern nicht anders angegeben. DNA-Oligonukleotide, einschließlich Cy5-markierter DNA-Oligonukleotide, dCas9-Protein und Cas9 H840A-Protein wurden von Integrated DNA Technologies bezogen. Die Hefe-Reporterplasmide wurden von zuvor beschriebenen Plasmiden64 abgeleitet und nach dem Gibson-Assembly-Verfahren kloniert. Alle hierin verwendeten Editoren-Plasmide für Säugetiere wurden mit dem USER- Klonierungsverfahren wie zuvor beschrieben¹⁷⁵ zusammengebaut. Plasmide, die sgRNAs exprimieren, wurden durch Ligation von annealisierten Oligonukleotiden in einen BsmBIverdauten Akzeptor-Vektor konstruiert. Plasmide, die PEgRNAs exprimieren, wurden nach Gibson-Assembly oder Golden-Gate-Assembly unter Verwendung eines benutzerdefinierten Akzeptor-Plasmids konstruiert (siehe ergänzende Skizze „Golden-Gate-Assembly“). Die Sequenzen der hierin verwendeten sgRNA- und PEgRNA-Konstrukte sind in den Tabellen 2A- 2C und 3A-3R aufgeführt. Alle Vektoren für Experimente mit Säugetierzellen wurden mit Plasmid-Plus-Midiprep-Kits (Qiagen) oder PureYield-Plasmid-Miniprep-Kits (Promega) gereinigt, die Schritte zur Endotoxinentfernung beinhalten. Alle Experimente, bei denen lebende Tiere verwendet wurden, wurden vom Broad Institute Institutional and Animal Care and Use Committees genehmigt. Wildtyp-C57BL/6-Mäuse wurden von Charles River (Nr. 027) bezogen.
Biochemische In-vitro-Tests
PEgRNAs und sgRNAs wurden in vitro mit dem HiScribe-T7-in-vitro- Transkriptionskit (New England Biolabs) aus PCR-amplifizierten Templaten, die eine T7- Promotorsequenz enthalten, transkribiert. Die RNA wurde durch denaturierende Hamstoff- PAGE gereinigt und die Qualität vor der Verwendung durch ein analytisches Gel bestätigt. 5'- Cy5-markierte DNA-Duplex-Substrate wurden unter Verwendung von zwei Oligonukleotiden (Cy5-AVA024 und AVA025; Verhältnis 1:1,1) für das nicht genickte Substrat oder von drei Oligonukleotiden (Cy5-AVA023, AVA025 und AVA026; Verhältnis 1:1,1:1,1) für das vorgenickte Substrat annealisiert, indem sie 3 Minuten lang auf 95 °C erhitzt und anschließend langsam auf Raumtemperatur abgekühlt wurden (Tabellen 2A-2C). Die Cas9-Spaltung und die Reaktionen zur reversen Transkription wurden in 1x-Spaltungspuffer²⁰⁵ mit dNTPs (20 mM HEPES-K, pH 7,5; 100 mM KCl; 5 % Glycerin; 0,2 mM EDTA, pH 8,0; 3 mM MgCl2; 0,5 mM dNTP-Mix; 5 mM DTT) durchgeführt. dCas9 oder Cas9 H840A (5 µM final) und die sgRNA oder PEgRNA (5 µM final) wurden vor der Zugabe von Duplex-DNA-Substrat (400 nM final) 10 Minuten lang bei Raumtemperatur in einer 5-µl-Reaktionsmischung inkubiert, gefolgt von der Zugabe von Superscript-III-Reverse-Transkriptase (ThermoFisher Scientific), gegebenenfalls einer nicht angegebenen M-MLV-RT-Variante. Die Reaktionen wurden 1 Stunde lang bei 37 °C durchgeführt, dann mit Wasser auf ein Volumen von 10 µl verdünnt, mit 0,2 µl Proteinase-K-Lösung (20 mg/ml, ThermoFisher Scientific) behandelt und 30 Minuten lang bei Raumtemperatur inkubiert. Nach einer 10-minütigen Hitzeinaktivierung bei 95 °C wurden die Reaktionsprodukte mit 2x Formamid-Gel-Ladepuffer (90 % Formamid; 10 % Glycerin; 0,01 % Bromphenolblau) versetzt, 5 Minuten lang bei 95 °C denaturiert und durch ein denaturierendes Hamstoff-PAGE-Gel (15 % TBE-Harnstoff, 55 °C, 200 V) getrennt. Die DNA-Produkte wurden durch ein Cy5-Fluoreszenzsignal mit einem Typhoon-FLA-7000- Biomolekularimager sichtbar gemacht.
Elektrophoretische Mobilitätsverschiebungstests wurden in 1x Bindungspuffer (1x Spaltpuffer + 10 µg/ml Heparin) mit vorinkubierten dCas9:sgRNA- oder dCas9:PEgRNA- Komplexen (Konzentrationsbereich zwischen 5 nM und 1 µM final) und Cy5-markierter Duplex-DNA (Cy5- AVA024 und AVA025; 20 nM final) durchgeführt. Nach einer 15- minütigen Inkubation bei 37 °C wurden die Samples mittels nativem PAGE-Gel (10 % TBE) analysiert und auf Cy5-Fluoreszenz abgebildet.
Für die DNA-Sequenzierung der Produkte der reversen Transkription wurden die fluoreszierenden Gruppen aus den Hamstoff-PAGE-Gelen herausgeschnitten und gereinigt und dann gemäß dem Herstellerprotokoll mit terminaler Transferase (TdT; New England Biolabs) in Gegenwart von dGTP oder dATP 3'-verkettet. Die verkürzten DNA-Produkte wurden 10-fach mit Bindungspuffer (40 % gesättigtes wässriges Guanidiniumchlorid + 60 % Isopropanol) verdünnt und mit der QIAquick-Spin-Säule (Qiagen) gereinigt. Anschließend wurden sie als Templat für die Primerverlängerung mit Klenow-Fragment (New England Biolabs) unter Verwendung des Primers AVA134 (A-verkettete Produkte) oder AVA135 (G- verkettete Produkte) verwendet (Tabellen 2A-2C). Die Verlängerungen wurden durch PCR für 10 Zyklen mit den Primern AVA110 und AVA122 amplifiziert und dann mit AVA037 nach dem Sanger-Verfahren sequenziert (Tabellen 2A-2C).
Hefe-Fluoreszenz-Reporter-Tests
Dual-fluoreszierende Reporterplasmide, die ein In-Frame-Stopcodon, einen +1 Frameshift oder einen -1 Frameshift enthielten, wurden in vitro wie oben beschrieben 5'- verlängerten PEgRNA- oder 3'-verlängerten PEgRNA Prime-Editing-Reaktionen unterzogen. Nach einstündiger Inkubation bei 37 °C wurden die Reaktionen mit Wasser verdünnt und die Plasmid-DNA mit 0,3 M Natriumacetat und 70 % Ethanol ausgefällt. Die resuspendierte DNA wurde wie zuvor beschrieben⁶⁷ durch Elektroporation in S. cerevisiae transformiert und auf synthetischen Komplettmedien ohne Leucin (SC(Glucose), L-) ausgebracht. Die GFP- und mCherry-Fluoreszenzsignale wurden von den Kolonien mit dem biomolekularen Imager Typhoon FLA 7000 sichtbar gemacht.
Allgemeine Säugetier-Zellkulturbedingungen
HEK293T- (ATCC CRL-3216), U2OS- (ATTC HTB-96), K562- (CCL-243) und HeLa- (CCL-2) Zellen wurden von ATCC erworben und in Dulbecco's Modified Eagle's Medium (DMEM) plus GlutaMAX (ThermoFisher Scientific), McCoy's 5A-Medium (Gibco), RPMI-Medium-1640 plus GlutaMAX (Gibco) oder Eagle's Minimal-Essential-Medium (EMEM, ATCC) kultiviert und weitergegeben, jeweils ergänzt mit 10 % (v/v) fötalem Rinderserum (Gibco, qualifiziert) und 1x Penicillin-Streptomycin (Corning). Alle Zelltypen wurden bei 37 °C und 5 % CO₂ inkubiert, gehalten und kultiviert. Die Zelllinien wurden von ihren jeweiligen Lieferanten authentifiziert und negativ auf Mykoplasmen getestet.
HEK293T-Transfektionsprotokoll für Gewebekulturen und Präparation genomischer DNA
Gezüchtete HEK293T-Zellen wurden auf mit Poly-D-Lysin beschichteten 48-Well- Platten (Corning) ausgesät. 16 bis 24 Stunden nach der Aussaat wurden die Zellen bei etwa 60 % Konfluenz mit 1 µl Lipofectamine 2000 (Thermo Fisher Scientific) gemäß den Herstellerprotokollen und 750 ng PE-Plasmid, 250 ng PEgRNA-Plasmid und 83 ng sgRNA- Plasmid (für PE3 und PE3b) transfiziert. Sofern nicht anders angegeben, wurden die Zellen drei Tage nach der Transfektion kultiviert. Danach wurde das Medium entfernt, die Zellen wurden mit 1x PBS-Lösung (Thermo Fisher Scientific) gewaschen, und die genomische DNA wurde durch Zugabe von 150 µl frisch hergestelltem Lysepuffer (10 mM Tris-HCl, pH 7,5; 0,05 % SDS; 25 µg/ml Proteinase K (Thermo Fisher Scientific)) direkt in jedes Well der Gewebekulturplatte extrahiert. Die genomische DNA-Mischung wurde 1 bis 2 Stunden lang bei 37 °C inkubiert, gefolgt von einem 30-minütigen Enzym-Inaktivierungsschritt bei 80 °C. Die für die Amplifikation genomischer Säugetierzell-DNA verwendeten Primer sind in Tabelle 4 aufgeführt. Für HDR-Experimente in HEK293T-Zellen wurden 231 ng Nuklease- Exprimierungsplasmid, 69 ng sgRNA-Exprimierungsplasmid, 50 ng (1,51 pmol) 100-nt ssDNA-Donor-Templat (PAGE-gereinigt; Integrated DNA Technologies) mit 1,4 µl Lipofectamine 2000 (ThermoFisher) pro Well lipofiziert. Genomische DNA aus allen HDR- Experimenten wurde gemäß dem Herstellerprotokoll mit dem Agencourt-DNAdvance-Kit (Beckman Coulter) aufgereinigt.
Hochdurchsatz-DNA-Sequenzierung von genomischen DNA-Samples
Genomische Stellen von Interesse wurden aus genomischen DNA-Samples amplifiziert und auf einem Illumina MiSeq sequenziert, wie zuvor mit den folgenden Änderungen beschrieben^129,130. Kurz gesagt, Amplifikationsprimer, die Illumina-Vorwärts- und Rückwärtsadapter (Tabelle 4) enthalten, wurden für eine erste Runde der PCR (PCR 1) verwendet, die die genomische Region von Interesse amplifiziert. 25 µl PCR 1-Reaktionen wurden mit 0,5 µM von jedem Vorwärts- und Rückwärtsprimer, 1 µl genomischem DNA- Extrakt und 12,5 µl Phusion-U-Green-Multiplex-PCR-Master-Mix ausgeführt. Die PCR- Reaktionen wurden wie folgt durchgeführt: 98 °C für 2 Minuten, dann 30 Zyklen [98 °C für 10 Sekunden, 61 °C für 20 Sekunden und 72 °C für 30 Sekunden], gefolgt von einer abschließenden 72 °C-Verlängerung für 2 Minuten. Jedes Sample wurde in einer sekundären PCR-Reaktion (PCR 2) mit eindeutigen Illumina-Barcoding-Primerpaaren versetzt. Konkret enthielten 25 µl einer gegebenen PCR 2-Reaktion 0,5 µM jedes eindeutigen Vorwärts- und Rückwärts-Illumina-Barcoding-Primerpaares, 1 µl der ungereinigten PCR 1- Reaktionsmischung und 12,5 µl des Phusion-U-Green-Multiplex-PCR-2x-Master-Mix. Die Barcoding PCR 2-Reaktionen wurden wie folgt durchgeführt: 98 °C für 2 Minuten, dann 12 Zyklen [98 °C für 10 Sekunden, 61 °C für 20 Sekunden und 72 °C für 30 Sekunden], gefolgt von einer abschließenden 72 °C-Verlängerung für 2 Minuten. Die PCR-Produkte wurden analytisch durch Elektrophorese in einem 1,5%igen Agarosegel ausgewertet. PCR-2-Produkte (gepoolt nach gemeinsamen Amplicons) wurden durch Elektrophorese mit einem 1,5%igen Agarosegel unter Verwendung eines QIAquick-Gelextraktionskits (Qiagen) gereinigt und mit 40 µl Wasser eluiert. Die DNA-Konzentration wurde mittels fluorometrischer Quantifizierung (Qubit, ThermoFisher Scientific) oder qPCR (KAPA-Library-Quantification-Kit-Illumina, KAPA Biosystems) gemessen und auf einem Illumina MiSeq-Instrument gemäß den Herstellerprotokollen sequenziert.
Die Sequenzierungs-Reads wurden mit MiSeq-Reporter (Illumina) demultiplexiert. Das Alignment der Amplikon-Sequenzen auf eine Referenzsequenz wurde mit CRISPResso2¹⁷⁸ ausgeführt. Zur Quantifizierung des Punktmutations-Editings wurde CRISPResso2 im Standardmodus mit eingeschalteter Funktion „discard_indel_reads“ ausgeführt. Die Editing-Effizienz wurde wie folgt berechnet: (Häufigkeit der spezifizierten Punktmutation in nicht verworfenen Reads) x (Anzahl der nicht verworfenen Reads) ÷ Gesamt- Reads. Für Insertion- oder Deletion-Edits wurde CRISPResso2 im HDR-Modus mit dem gewünschten Allel als erwartetem Allel (e-Flag) und mit „discard_indel_reads“ ON ausgeführt. Die Editing-Ausbeute wurde berechnet als die Anzahl der HDR-ausgerichteten Reads geteilt durch die Gesamtanzahl der Reads. Für alle Edits wurde die Indel-Ausbeute als die Anzahl der verworfenen Reads geteilt durch die Gesamtzahl der Reads berechnet.
Nukleofektion von U2OS-, K562- und HeLa-Zellen
Die Nukleofektion wurde in allen Experimenten mit K562-, HeLa- und U2OS-Zellen ausgeführt. Für PE-Bedingungen in diesen Zelltypen wurden 800 ng Prime-Editor- Exprimierungsplasmid, 200 ng PEgRNA-Exprimierungsplasmid und 83 ng Nicking-Plasmid in einem Endvolumen von 20 µl in einem 16-Well-Nukleoküvettenstreifen (Lonza) nukleoinfiziert. Für HDR-Bedingungen in diesen drei Zelltypen wurden 350 ng Nuklease- Exprimierungsplasmid, 150 ng sgRNA-Exprimierungsplasmid und 200 pmol (6,6 µg) 100-nt ssDNA-Donor-Templat (PAGE-gereinigt; Integrated DNA Technologies) in einem Endvolumen von 20 µl pro Sample in einem 16-Well-Nukleoküvettenstreifen (Lonza) nukleoinfiziert. K562-Zellen wurden gemäß dem Herstellerprotokoll mit dem SF Cell Line 4D- Nucleofector X Kit (Lonza) mit 5 × 10⁵ Zellen pro Sample (Programm FF-120) nukleofiziert. U2OS-Zellen wurden gemäß dem Herstellerprotokoll mit dem SE Cell Line 4D-Nucleofector X Kit (Lonza) mit 3-4 × 10⁵ Zellen pro Sample (Programm DN-100) nukleofiziert. HeLa- Zellen wurden gemäß dem Herstellerprotokoll mit dem SE Cell Line 4D-Nucleofector X Kit (Lonza) mit 2 × 10⁵ Zellen pro Sample (Programm CN-114) nukleofiziert. Die Zellen wurden 72 Stunden nach der Nukleofektion für die Extraktion genomischer DNA geerntet.
Extraktion genomischer DNA für HDR-Experimente
Genomische DNA aus allen HDR-Vergleichsexperimenten in HEK293T-, HEK293T HBB E6V-, K562-, U2OS- und HeLa-Zellen wurde gemäß dem Herstellerprotokoll mit dem Agencourt DNAdvance Kit (Beckman Coulter) gereinigt.
Vergleich zwischen PE2, PE3, BE2, BE4max, ABEdmax und ABEmax
HEK293T-Zellen wurden auf mit Poly-D-Lysin beschichteten 48-Well-Platten (Corning) ausgesät. Nach 16 bis 24 Stunden wurden die Zellen bei etwa 60 % Konfluenz transfiziert. Für das Editing von Basen mit CBE- oder ABE-Konstrukten wurden die Zellen mit 750 ng des Basen-Editor-Plasmids, 250 ng des sgRNA-Exprimierungsplasmids und 1 µl Lipofectamine 2000 (Thermo Fisher Scientific) transfiziert. PE-Transfektionen wurden wie oben beschrieben ausgeführt. Die Extraktion genomischer DNA für PE und BE wurde wie oben beschrieben ausgeführt.
Bestimmung der PE3-Aktivität an bekannten Cas9-Off-Target-Stellen
Um die Editing-Aktivität von PE3 an bekannten Cas9-Off-Target-Stellen zu bewerten, wurde genomische DNA, die drei Tage nach der Transfektion mit PE3 aus HEK293T-Zellen extrahiert wurde, als Templat für die PCR-Amplifikation von 16 zuvor berichteten genomischen Cas9-Off-Target-Stellen^118,159 verwendet (die vier wichtigsten Off-Target- Stellen jeweils für die HEK3-, EMX1-, FANCF- und HEK4-Spacer; Primer-Sequenzen sind in Tabelle 4 aufgeführt). Diese genomischen DNA-Samples waren identisch mit denen, die für die Quantifizierung der On-Target-PE3-Editing-Aktivitäten in den 41A-41K; PEgRNA und Nicking-sgRNA-Sequenzen sind in den Tabellen 3A-3R aufgeführt. Nach der PCR- Amplifikation der Off-Target-Stellen wurden die Amplikons auf der Illumina MiSeq-Plattform wie oben beschrieben sequenziert (HTS-Analyse). Um die On-Target- und Off-Target-Editing- Aktivität von Cas9-Nuklease, Cas9 H840A-Nickase, dCas9 und PE2-dRT zu bestimmen, wurden HEK293T-Zellen mit 750 ng Editor-Plasmid (Cas9-Nuklease, Cas9 H840A-Nickase, dCas9 oder PE2-dRT), 250 ng PEgRNA- oder sgRNA-Plasmid und 1 µl Lipofectamine 2000 transfiziert. Genomische DNA wurde 3 Tage nach der Transfektion wie oben beschrieben aus den Zellen isoliert. Die genomischen On-Target- und Off-Target-Loci wurden mittels PCR unter Verwendung der Primer-Sequenzen in Tabelle 4 amplifiziert und auf einem Illumina MiSeq sequenziert.
Die HTS-Datenanalyse wurde mit CRISPResso2¹⁷⁸ ausgeführt. Die Editing-Effizienz von Cas9-Nuklease, Cas9 H840A-Nickase und dCas9 wurde als Prozentsatz der gesamten Sequenz-Reads, die Indels enthalten, quantifiziert. Zur Quantifizierung der PE3- und PE3- dRT-Off-Targets wurden die alignierten Sequenzierungs-Reads auf Punktmutationen, Insertionen oder Deletionen untersucht, die mit dem erwarteten Produkt der an der Cas9- Nickstelle initiierten reversen PEgRNA-Transkription übereinstimmen. Einzelne Nukleotidvariationen, die mit einer Gesamthäufigkeit von <0,1 % unter den gesamten Reads innerhalb eines Samples auftraten, wurden von der Analyse ausgeschlossen. Für Reads, die einzelne Nukleotidvariationen enthielten, die beide mit Häufigkeiten ≥ 0,1 % auftraten und teilweise mit dem PEgRNA-kodierten Edit übereinstimmten, wurden t-Tests (ungepaart, einseitig, α = 0,5) verwendet, um zu bestimmen, ob die Varianten im Vergleich zu Samples, die mit PEgRNAs behandelt wurden, die denselben Spacer enthielten, aber andere Edits kodierten, signifikant häufiger auftraten. Um Unterschiede bei den Sequenzierungsfehlern zu vermeiden, wurden Vergleiche zwischen Samples durchgeführt, die gleichzeitig im selben MiSeq-Lauf sequenziert wurden. Varianten, die das Kriterium eines p-Wertes > 0,05 nicht erfüllten, wurden ausgeschlossen. Off-Target-PE3-Editing-Aktivität wurde dann als Prozentsatz der gesamten Sequenzierungs-Reads berechnet, die die oben genannten Kriterien erfüllten.
Erzeugung einer HEK293T-Zelllinie, die die HBB E6V-Mutation unter Verwendung von Cas9-initiierter HDR enthält
HEK293T-Zellen wurden in einer 48-Well-Platte ausgesät und bei etwa 60 % Konfluenz mit 1,5 µl Lipofectamine 2000, 300 ng Cas9 D10A-Nickase-Plasmid, 100 ng sgRNA-Plasmid und 200 ng 100-mer ssDNA-Donor-Templat transfiziert (Tabelle 5). Drei Tage nach der Transfektion wurde das Medium gegen frisches Medium ausgetauscht. Vier Tage nach der Transfektion wurden die Zellen mit 30 µl TrypLE-Lösung dissoziiert und in 1,5 ml Medium suspendiert. Einzelne Zellen wurden durch fluoreszenzaktivierte Zellsortierung (FACS) (Beckman-Coulter Astrios) in einzelne Wells von zwei 96-Well-Platten isoliert. Siehe 53A-53B für repräsentative Beispiele für die FACS-Sortierung. Die Zellen wurden 14 Tage lang expandiert, bevor die genomische DNA-Sequenzierung wie oben beschrieben durchgeführt wurde. Von den isolierten klonalen Populationen erwies sich keine als homozygot für die HBB E6V-Mutation, so dass eine zweite Runde des Editings durch Lipofektion, Sortierung und Auswuchs in einer teilweise editierten Zelllinie wiederholt wurde, um eine Zelllinie zu erhalten, die homozygot für das E6V-Allel ist.
Erzeugung einer HEK293T-Zelllinie, die die HBB E6V-Mutation enthält, unter Verwendung von PE3
2,5 × 104 HEK293T-Zellen, die in Abwesenheit von Antibiotika gezüchtet wurden, wurden auf mit Poly-D-Lysin beschichtete 48-Well-Platten (Corning) ausgesät. 16 bis 24 Stunden nach der Aussaat wurden die Zellen bei etwa 70 % Konfluenz mit 1 µl Lipofectamine 2000 (Thermo Fisher Scientific) gemäß den Herstellerprotokollen und 750 ng PE2-P2A-GFP- Plasmid, 250 ng PEgRNA-Plasmid und 83 ng sgRNA-Plasmid transfiziert. Nach 3 Tagen nach der Transfektion wurden die Zellen mit phosphatgepufferter Kochsalzlösung (Gibco) gewaschen und mit TrypLE Express (Gibco) dissoziiert. Die Zellen wurden dann mit DMEM plus GlutaMax (Thermo Fisher Scientific), ergänzt mit 10 % (v/v) FBS (Gibco), verdünnt und vor der Sortierung durch ein 35-µm-Zellsieb (Corning) gegeben. Die Durchflusszytometrie wurde mit einem LE-MA900 Zellsortierer (Sony) durchgeführt. Die Zellen wurden 15 Minuten vor der Sortierung mit 3 nM DAPI (BioLegend) behandelt. Nach dem Ausschluss von Doubletten wurden einzelne DAPI-negative Zellen mit einer GFP-Fluoreszenz, die über der einer GFP-negativen Kontrollpopulation lag, in 96-Well-Flachboden-Zellkulturplatten (Corning) sortiert, die mit vorgekühlter DMEM mit GlutaMax, ergänzt mit 10 % FBS, gefüllt waren. Siehe 53A-53B für repräsentative Beispiele für die FACS-Sortierung. Die Zellen wurden 10 Tage lang kultiviert, bevor die genomische DNA extrahiert und mittels HTS charakterisiert wurde, wie oben beschrieben. Es wurden insgesamt sechs klonale Zelllinien identifiziert, die homozygot für die E6V-Mutation in HBB sind.
Erzeugung einer HEK293T-Zelllinie, die die HEXA 1278+ TATC-Insertion enthält, unter Verwendung von PE3
HEK293T-Zellen, die das HEXA 1278+TATC-Allel enthalten, wurden nach dem oben beschriebenen Protokoll zur Erzeugung der HBB-E6V-Zelllinie erzeugt; die PEgRNA- und sgRNA-Sequenzen sind in den Tabellen 2A-2C unter den 43A-43H aufgeführt. Nach der Transfektion und Sortierung wurden die Zellen 10 Tage lang kultiviert, bevor die genomische DNA extrahiert und mittels HTS charakterisiert wurde, wie oben beschrieben. Es wurden zwei heterozygote Zelllinien isoliert, die 50 % HEXA 1278+TATC-Allele enthielten, und es wurden zwei homozygote Zelllinien gewonnen, die 100 % HEXA 1278+TATC-Allele enthielten.
Tests zur Lebensfähigkeit der Zellen
HEK293T-Zellen wurden in 48-Well-Platten ausgesät und bei etwa 70 % Konfluenz mit 750 ng Editor-Plasmid (PE3, PE3 R110S K103L, Cas9 H840A Nickase oder dCas9), 250 ng HEK3-Ziel-PEgRNA-Plasmid und 1 µl Lipofectamine 2000 transfiziert, wie oben beschrieben. Die Lebensfähigkeit der Zellen wurde alle 24 Stunden nach der Transfektion für 3 Tage mit dem CellTiter-Glo 2.0-Test (Promega) gemäß dem Herstellerprotokoll gemessen. Die Lumineszenz wurde in 96-Well-Flachboden-Polystyrol-Mikroplatten (Corning) mit einem M1000 Pro Mikroplatten-Lesegerät (Tecan) mit einer Integrationszeit von 1 Sekunde gemessen.
Lentivirus-Herstellung
Das Lentivirus wurde wie zuvor beschrieben hergestellt²⁰⁶. T-75-Kolben mit sich schnell teilenden HEK293T-Zellen (ATCC; Manassas, VA, USA) wurden mit den Lentivirus- Produktionshelferplasmiden pVSV-G und psPAX2 in Kombination mit modifizierten lentiCRISPR_v2-Genomen transfiziert, die einen Intein-split PE2-Editor tragen, wobei FuGENE HD (Promega, Madison, WI, USA) gemäß den Anweisungen des Herstellers verwendet wurde. Es wurden vier Split-Intein-Editor-Konstrukte ausgestaltet: 1) ein virales Genom, das eine U6-PEgRNA-Exprimierungskassette und den N-terminalen Abschnitt (1- 573) der Cas9 H840A-Nickase kodiert, die mit dem Npu N-Intein, einem selbstspaltenden P2A-Peptid und GFP-KASH fusioniert ist; 2) ein virales Genom, das für das Npu C-Intein kodiert, das mit dem C-terminalen Rest von PE2 fusioniert ist; 3) ein virales Genom, das für das Npu C-Intein kodiert, das mit dem C-terminalen Rest von Cas9 für die Cas9-Kontrolle fusioniert ist; und 4) eine Nicking-sgRNA für DNMT1. Das Split-Intein vermittelt das Trans- Splitting, um die beiden Hälften von PE2 oder Cas9 zu verbinden, während das P2A GFP- KASH die co-translationale Produktion eines an die Kernmembran gebundenen GFP ermöglicht. Nach 48 Stunden wurde der Überstand gesammelt, 5 Minuten lang bei 500 g zentrifugiert, um Zelltrümmer zu entfernen, und mit einem 0,45-µm-Filter filtriert. Der gefilterte Überstand wurde mit der PEG-it Virus Precipitation Solution (System Biosciences, Palo Alto, CA, USA) gemäß den Anweisungen des Herstellers konzentriert. Das resultierende Pellet wurde in Opti-MEM (Thermo Fisher Scientific, Waltham, MA, USA) mit 1 % des ursprünglichen Medienvolumens resuspendiert. Das resuspendierte Pellet wurde tiefgefroren und bis zur Verwendung bei -80 °C gelagert.
Dissektion und Kultur primärer kortikaler Neuronen der Maus
E18.5 dissoziierte kortikale Kulturen wurden von trächtigen, zeitlich bestimmten C57BL/6-Mäusen (Charles River) geerntet. Die Embryonen wurden den trächtigen Mäusen nach Euthanasie durch CO2 und anschließender Enthauptung entnommen. Die Kortikalkappen wurden in eiskaltem Hibernate-E mit Penicillin/Streptomycin-Zusatz (Life Technologies) seziert. Nach einer Spülung mit eiskaltem Hibemate-E wurde das Gewebe bei 37 °C 8 Minuten lang in Papain/DNase (Worthington/Sigma) aufgeschlossen. Das Gewebe wurde in NBActiv4 (BrainBits), ergänzt mit DNase, trituriert. Die Zellen wurden gezählt und in 24-Well-Platten mit 100.000 Zellen pro Well ausgebracht. Die Hälfte des Mediums wurde zweimal pro Woche gewechselt.
Prime-Editing in primären Neuronen und Isolierung der Zellkerne
Bei DIV 1 wurden 15 µl Lentivirus im Verhältnis 10:10:1 von N-terminal:C- terminal:Nicking-sgRNA hinzugefügt. Bei DIV 14 wurden neuronale Kerne unter Verwendung des EZ-PREP-Puffers (Sigma D8938) nach dem Protokoll des Herstellers isoliert. Alle Schritte wurden auf Eis oder bei 4 °C ausgeführt. Medien wurden aus den dissoziierten Kulturen entfernt, und die Kulturen wurden mit eiskaltem PBS gewaschen. PBS wurde abgesaugt und durch 200 µl EZ-PREP-Lösung ausgetauscht. Nach einer 5-minütigen Inkubation auf Eis wurde EZ-PREP über die Oberfläche des Wells pipettiert, um die verbleibenden Zellen zu lösen. Das Sample wurde 5 Minuten lang bei 500 g zentrifugiert, und der Überstand wurde entfernt. Die Samples wurden mit 200 µl EZ-PREP gewaschen und erneut 5 Minuten lang bei 500 g zentrifugiert. Die Samples wurden durch vorsichtiges Pipettieren in 200 µl eiskaltem Nuclei Suspension Buffer (NSB), bestehend aus 100 µg/ml BSA und 3,33 µM Vybrant DyeCycle Ruby (Thermo Fisher) in 1xPBS, resuspendiert und anschließend bei 500 g 5 Minuten lang zentrifugiert. Der Überstand wurde entfernt und die Kerne wurden in 100 µl NSB resuspendiert und in 100 µl Agencourt DNAdvance Lysepuffer mit einem MoFlo Astrios (Beckman Coulter) in der Durchflusszytometrie-Einrichtung des Broad Institute sortiert. Die genomische DNA wurde gemäß den Anweisungen des Herstellers von Agencourt DNAdvance aufgereinigt.
RNA-Sequenzierung und Datenanalyse
HEK293T-Zellen wurden mit PRNP-Targeting- oder HEXA-Targeting-PEgRNAs und PE2, PE2-dRT oder Cas9-H840A-Nickase kotransfiziert. 72 Stunden nach der Transfektion wurde die Gesamt-RNA mit TRIzol-Reagenz (Thermo Fisher) aus den Zellen gewonnen und mit dem RNeasy Mini Kit (Qiagen) gereinigt, was eine DNaseI-Behandlung auf der Säule beinhaltete. Ribosomen wurden mit dem rRNA-Entfernungsprotokoll des TruSeq-Stranded- Total-RNA-Library-Prep-Kits (Illumina) von der Gesamt-RNA abgetrennt und anschließend mit RNAClean-XP-Beads (Beckman Coulter) gewaschen. Sequenzierungsbibliotheken wurden unter Verwendung von ribo-depletierter RNA auf einem SMARTer-PrepX-Apollo- NGS-Library-Prep-System (Takara) gemäß dem Herstellerprotokoll vorbereitet. Die resultierenden Bibliotheken wurden auf einer 2200 TapeStation (Agilent Technologies) visualisiert, mit einem Qubit-dsDNA-HS-Test (Thermo Fisher) normalisiert und auf einem NextSeq 550 mit einer High Output-v2-Fließzelle (Illumina) als 75-bp paired-end-reads sequenziert. Fastq-Dateien wurden mit bcl2fastq2 Version 2.20 erzeugt und mit TrimGalore Version 0.6.2 (github.com/FelixKrueger/TrimGalore) getrimmt, um Basen geringer Qualität, ungepaarte Sequenzen und Adaptorsequenzen zu entfernen. Die getrimmten Reads wurden mithilfe von RSEM Version 1.3.1²⁰⁷ an eine Homo-Sapiens-Genom-Assembly GRCh¹⁴⁸ mit einem benutzerdefinierten Cas9-H840A-Geneintrag ausgerichtet. Das limma-voom²⁰⁸-Paket wurde verwendet, um das Niveau der Genexprimierung zu normalisieren und eine Analyse der differentiellen Exprimierung mit Batch-Effekt-Korrektur auszuführen. Differentiell exprimierte Gene wurden mit FDR-korrigiertem p-Wert < 0,05 und Fold-change > 2 Cutoffs aufgerufen, und die Ergebnisse wurden in R visualisiert.
ClinVar-Analyse
Die ClinVar-Variantenzusammenfassung wurde vom NCBI heruntergeladen (Zugriff am 15. Juli 2019), und die darin enthaltenen Informationen wurden für alle nachgeschalteten Analysen verwendet. Die Liste aller gemeldeten Varianten wurde nach Allel-ID gefiltert, um Duplikate zu entfernen, und nach klinischer Bedeutung, um die Analyse auf pathogene Varianten zu beschränken. Die Liste der pathogenen Varianten wurde sequenziell nach dem Variantentyp gefiltert, um den Anteil der pathogenen Varianten zu berechnen, bei denen es sich um Insertionen, Deletionen usw. handelt. Einzelnukleotidvarianten (SNVs) wurden basierend auf den gemeldeten Referenz- und alternativen Allelen in zwei Kategorien unterteilt (Transitionen und Transversionen). SNVs, für die keine Referenz- oder alternativen Allele gemeldet wurden, wurden von der Analyse ausgeschlossen.
Die Längen der gemeldeten Insertionen, Deletionen und Duplikationen wurden anhand der Referenz-/Alternativallele, der Start-/Stopp-Positionen der Variante oder der entsprechenden identifizierenden Informationen im Variantennamen berechnet. Varianten, die keine der oben genannten Informationen enthielten, wurden von der Analyse ausgeschlossen. Die Längen der gemeldeten Indels (einzelne Varianten, die sowohl Insertionen als auch Deletionen im Vergleich zum Referenzgenom beinhalten) wurden berechnet, indem die Anzahl der Diskrepanzen oder Lücken im besten paarweisen Alignment zwischen dem Referenz- und dem alternativen Allel bestimmt wurde. Die Häufigkeitsverteilungen der Variantenlängen wurden mit GraphPad Prism 8 berechnet.
Datenverfügbarkeit
Daten der Hochdurchsatz-Sequenzierung sind in der Datenbank des NCBI Sequence Read Archive hinterlegt. Plasmide, die PE1-, PE2-/PE3- und PEgRNA-Exprimierungsvektoren kodieren, sind bei Addgene erhältlich.
Code-Verfügbarkeit
Das Skript, das zur Quantifizierung der PEgRNA-Gerüstinsertion verwendet wird, ist in 60A-60B veranschaulicht.
Ergänzende Informationen: Tabellen und Sequenzen
Tabelle 1: Aktivitäten der Prime-Editoren, Cas9-Nuklease, Cas9 H840A-Nickase und PE2-dRT an HEK3-, HEK4-, EMX1- und FANCF-On-Target- und Off-Target-Stellen. PE2/PE3-Editing wird als % Prime-Editing neben % Indels (in Klammern) angezeigt. % Indels werden für Cas9, Cas9-H840A-Nickase (nCas9) und PE2-dRT an den ersten vier zuvor charakterisierten Off-Target-Stellen gezeigt^179,180. sgRNA- und PEgRNA-Sequenzen können in den Tabellen 3A-3R unter der Überschrift der 42A-42H gefunden werden. Alle Werte sind der Durchschnitt von drei unabhängigen biologischen Wiederholungen.

Tabellen 2A-2C: Sequenzen der für die In-vitro-Experimente verwendeten DNA- Oligonukleotide, PEgRNAs und sgRNAs. Tabelle 2A: DNA-Oligonukleotide

OLIGONUKLEOTID	SEQUENZ
AVA023
AVA024
AVA025
AVA026	5PHOS-TGATGGCAGAGGAAAGG (SEQ ID NO: 377)
AVA037	GCAGGCTTTAAAGGAACCAATTC (SEQ ID NO: 378)
AVA110
AVA122	CTCTGGAGGATCTAGCGGAG (SEQ ID NO: 380)
AVA134
AVA135

Tabelle 2B: 5'-verlängerte PEgRNAs

PEGRNA	SPACER- SEQUENZ	5'- VERLÄNGERUNGSSEQUENZ	LINKER- LÄNGE (NT)	PBS- LÄNGE (NT)	RT- TEMPLAT- LÄNGE (NT)
PEGRNA 1			15	7	7
PEGRNA 2			15	5	7
PEGRNA 3			15	5	8
PEGRNA 4			15	5	15
PEGRNA 5			15	5	22
5'- PEGRNA_R T_7_A			15	5	7
5'- PEGRNA_R T_7_B			15	5	7
5'- PEGRNA_R T_8			15	5	8
5'- PEGRNA_R T_15			15	5	15
5'- PEGRNA_R T_22			15	5	22

Tabelle 2C: 3'-verlängerte PEgRNAs

PEGRNA	SPACER-SEQUENZ	3'- VERLÄNGERUNGS SEQUENZ	PBS- LÄNGE (NT)	RT- TEMPLAT- LÄNGE (NT)
3'- PEGRNA_10			7	10
3'- PEGRNA_H EFE_TTOA			7	10
3'- PEGRNA_H EFE_+1AINS			7	11
3'- PEGRNA_H EFE_+1TDEL			7	9

Tabellen 3A-3R: Sequenzen von PEgRNAs und sgRNAs, die in Experimenten mit Säugetierzellen verwendet wurden. Alle Sequenzen sind in 5'- bis 3'-Ausrichtung dargestellt. Zur Konstruktion von PEgRNAs wurden die unten aufgeführten Spacer-Sequenzen an das 5'- Ende des sgRNA-Gerüsts und die unten aufgeführten 3'-Verlängerungen, die die Primer- Bindungsstelle und das RT-Templat enthalten, an das 3'-Ende des sgRNA-Gerüsts angefügt. Die Sequenz des sgRNA-Gerüsts lautet

Tabelle 3B: FIG. 40A-40C PEgRNA

PEGRNA	SPACER-SEQUENZ (SEQ-ID-NR: 3104- 3112)	3'-VERLÄNGERUNG (SEQ- ID-NR: 3113-3121)	PBS- LÄNGE (NT)	RT- TEMPLAT- LÄNGE (NT)
RNF2_3B			15	14
EMX1_38			15	13
FANCF_3B			15	17
HE3_3B			13	10
HEK4_3B		TTAACCCCAACCTCCAGCC	9	10
RNF2_3C_4A TOC			15	14
RNF2_3C_4A TOG			15	14
FANCF_3C_5 GTOT			13	17
FANCF_3C_7 ATOC			14	17

Tabelle 3C: FIG. 40A-40C Nicking-sgRNA-Sequenzen

NICKING-SGRNA	SPACER-SEQUENZ	SEQ-ID-NR:
RNF2_2B_t41	GTCAACCATTAAGCAAAACAT	3122
RNF2_2B_+67	GTCTCAGGCTGTGCAGACAAA	3123
EMX1_2B_-116	GGGGCACAGATG AGAAACTC	3124
EMX1_2B_-57	GCCGTTTGTACTTTGTCCTC	3125
EMX1_2B_+14	GCGCCACCGGTTGATGTGAT	3126
EMX1_2B_+27	GCTTCGTGGCAATGCGCCAC	3127
EMX1_2B_+53	GACATCGATGTCCTCCCCAT	3128
EMX1_2B_+80	GTGGTTGCCCACCCTAGTCAT	3129
FANCF_2B_-78	GCGACTCTCTGCGTACTGAT	3130
FANCF_2B_-50	GCCCTACTTCCGCTTTCACCT	3131
FANCF_2B_-27	GGATTCC ATG AGGTGCGCGA	3132
FANCF_2B_-17	GCTGCAGAAGGGATTCCATG	3133
FANCF_2B_+21	GCTTGAGACCGCCAGAAGCT	3134
FANCF_2B_+48	GGGGTCCCAGGTGCTGACGT	3135
HEK3_2B_-108	GCAGAAATAGACTAATTGCA	3136
HEK3_2B_-38	GGATTGACCCAGGCCAGGGC	3137
HEK3_2B_+26	GACGCCCTCTGGAGGAAGCA	3138
HEK3_2B_+37	GCTGTCCTGCGACGCCCTC	3139
HEK3_2B_+63	GCACATACTAGCCCCTGTCT	3140
HEK3_2B_+90	GTCAACCAGTATCCCGGTGC	3141
HEK4_2B_-95	TCCCTTCCTTCCACCCAGCC	3142
HEK4_2B_-51	CCCTGCCTGTCATCCTGCTT	3143
HEK4_2B_-26	GCAGTGCCACCGGGGCGCCG	3144
HEK4_2B_+52	GCGGGGGCTCAGAGAGGGCA	3145
HEK4_2B_+14	GAGACACACACACAGGCCTGG	3146
RNF2_2C_+41	GTCAACCATTAAGCAAAACAT	3147
RNF2_2C_4ATOC_+5	GTGAGTTACAACGAACACCGC	3148
RNF2_2C_4ATOG_+5	GTGAGTTACAACGAACACCCC	3149
FANCF_2C_+48	GGGGTCCCAGGTGCTGACGT	3150
FANCF_2C_5GTOT_+7	GAAGCTCGGAAAAGCGATCA	3151
FANCF_2C_7ATOC_+7	GAAGCTCGGAAAAGCGAGCC	3152
HEK3_2C_+90	GTCAACCAGTATCCCGGTGC	3153

Tabelle 3D: FIG. 41A-41K PEgRNA

PEGRNA	SPACER-SEQUENZ (SEQ-ID-NR: 3154- 3304)	3'-VERLÄNGERUNG (SEQ- ID-NR: 3305-3455)	PBS - LÄNGE (NT)	RT- TEMPLAT- LÄNGE (NT)
HEK3_4A_1TTOA			13	10
HEK3_4A_1TTOC			13	10
HEK3_4A_1TTOG			13	10
HEK3_4A_2GTOA			13	10
HEK3_4A_2GTOC			13	10
HEK3_4A_2GTOT			13	10
HEK3_4A_3ATOC			13	10
HEK3_4A_3ATOG			13	10
HEK3_4A_3ATOT			13	10
HEK3_4A_4TTOA			13	10
HEK3_4A_4TTOC			13	10
HEK3_4A_4TTOG			13	10
HEK3_4A_5GTOA			13	10
HEK3_4A_5GTOC			13	10
HEK3_4A_5GTOT			13	10
HEK3_4A_6GTOA			13	10
HEK3_4A_6GTOC			13	10
HEK3_4A_6GTOT			13	10
HEK3_4A_7CTOA			13	10
HEK3_4A_7CTOG			13	10
HEK3_4A_7CTOT			13	10
HEK3_4A_8ATOC			13	10
HEK3_4A_8ATOG			13	10
HEK3_4A_8ATOT			13	10
HEK3_4B_1TTOA			13	34
HEK3_4B_12GTOC			13	34
HEK3_4B_14ATOT			13	34
HEK3_4B_17GTOC			13	34
HEK3_4B_2OGTOC			13	34
HEK3_4B_23CTOG			13	34
HEK3_4B_24TTOA			13	34
HEK3_4B_26CTOG			13	34
HEK3_4B_30CTOG			13	34
HEK3_4B_33CTOG			13	34
RNF2_4C_1CTOA			15	14
RNF2_4C_1CTOG			15	14
RNF2_4C_1CTOT			15	14
RNF2_4C_2TTOA			15	14
RNF2_4C_2TTOG			15	14
RNF2_4C_3GTOC			15	14
RNF2_4C_4ATOC			15	14
RNF2_4C_4ATOT			15	14
RNF2_4C_4ATOG			15	14
RNF2_4C_5GTOT			15	14
RNF2_4C_6GTOA			15	14
RNF2_4C_7TTOC			15	14
FANCF_4D_1ATOG			14	17
FANCF_4D_1ATOT			14	17
FANCF_4D_2CTOA			14	17
FANCF_4D_3CTOG			14	17
FANCF_4D_3CTOT			14	17
FANCF_4D_4TTOA			14	17
FANCF_4D_4TTOG			14	17
FANCF_4D_5GTOA			14	17
FANCF_4D_6GTOC			14	17
FANCF_4D_7ATOC			14	17
FANCF_4D_8TTOC			14	17
FANCF_4D_10GTOT			14	17
EMX1_4E_2ATOC			14	16
EMX1_4E_2ATOT			14	16
EMX1_4E_3ATOG			14	16
EMX1_4E_4GTOC			14	16
EMX1_4E_5GTOA			14	16
EMX1_4E_5GTOT			14	16
EMX1_4E_7CTOA			14	16
EMX1_4E_8TTOA			14	16
EMX1_4E_8TTOC			14	16
EMX1_4E_8TTOG			14	16
EMX1_4E_9CTOG			14	16
EMX1_4E_9CTOT			14	16
RUNX1_4F_1CTOA			15	15
RUNX1_4F_1CTOG			15	15
RUNX1_4F_1CTOT			15	15
RUNX1_4F_2GTOA			15	15
RUNX1 _4F_3ATOC			15	15
RUNX1_4F_3ATOG			15	15
RUNX1_4F_3ATOT			15	15
RUNX1_4F_4TTOA			15	15
RUNX1_4F_4TTOC			15	15
RUNX1_4F_4TTOG			15	15
RUNX1_4F_SGTOT			15	15
RUNX1_4F_6GTOC			15	15
VEGFA_4G_1TTOA			13	22
VEGFA_4G_1TTOC			13	22
VEGFA_4G_1TTOG			13	22
VEGFA_4G_2GTOA			13	22
VEGFA_4G_3ATOC			13	22
VEGFA_4G_3ATOG			13	22
VEGFA_4G_3ATOT			13	22
VEGFA_4G_5GTOT			13	22
VEGFA_4G_6GTOC			13	22
VEGFA_4G_7CTOA			13	22
VEGFA_4G_7CTOT			13	22
VEGFA_4G_9CTOG			13	22
DNMT1_4H_1ATOC			13	11
DNMT1_4H_1ATOG			13	11
DNMT1_4H_2CTOA			13	11
DNMT1_4H_2CTOG			13	11
DNMT1_4H_2CTOT			13	11
DNMT1_4H_3ATOT			13	11
DNMT1_4H_4GTOA			13	11
DNMT1_4H_5GTOT			13	11
DNMT1_4H_6GTOC			13	11
DNMT1_4H_8TTOA			13	19
DNMT1_4H_8TTOC			13	19
DNMT1_4H_8TTOG			13	19
HEK3_4J_DEL1-5			13	29
HEK3_4J_DEL1-10			13	24
HEK3_4J_DEL1-15			13	19
HEK3_4J_DEL1-25			13	26
HEK3_4J_DEL1-30			13	21
HEK3_4J_DEL1-80			13	20
HEK3_4I_1AINS			13	11
HEK3_4I_1CTTINS			13	13
HEK3_4I_1TDEL			13	9
HEK3_4I_1- 3TGADEL			13	31
RNF2_4I_1TINS			15	15
RNF2_4I_1GTAINS			15	17
RNF2_4I_4ADEL			15	13
RNF2_4I_3- 5GAGDEL			15	11
FANCF_4I_3CINS			14	18
FANCF_4I_4GATINS			14	20
FANCF_4I_6GDEL			14	16
FANCF_4I_5-7GGADEL			14	14
EMX1_4I_6TINS			14	17
EMX1_4I_1TGCINS			14	19
EMX1_4I_5GDEL			14	15
EMX1_4I_4- 6GGGDEL			14	13
RUNX1_4I_1CINS			15	16
RUNX1_4I_1ATGINS			15	18
RUNX1 _4I_2GDEL			15	14
RUNX1_4I_2-4GATDEL			15	12
VEGFA_4I_4CINS			13	23
VEGFA_4I_2ACAINS			13	25
VEGFA_4I_3ADEL			13	21
VEGFA_4I_2-4GAGDEL			13	19
DNMT1_4I_4CINS			13	16
DNMT1_4I_1TCAINS			13	18
DNMT1_4I_3ADEL			13	14
DNMT1_4I_3-5AGGDEL			13	12
HEK3_4K_1CTTINS_5GDEL			13	36
HEK3_4K_1CTTINS_2GTOC			13	37
HEK3_4K_3TDEL_5GTOC			13	33
HEK3_4K_3GTOC_6GTOT			13	34
RNF2_4K_2AAINS_3- 4GADEL			15	14
RNF2_4K_1AINS_5GTOC			15	15
RNF2_4K_1- 2CTDEL_6GTOT			15	12
RNF2_4K_1CTOA_5GTOT			15	14
FANCF_4K_1TINS_3- 4TGDEL			14	16
FANCF_ 4K_1TINS_6GTOA			14	18
FANCF_4K_2CDEL_5GTOT			14	16

Tabelle 3E: FIG. 41A-41K Nicking-sgRNA

NICKING-SGRNA	SPACER-SEQUENZ (SEQ-ID-NR: 3456-3463)
HEK3_4A_+90	GTCAACCAGTATCCCGGTGC
HEK3_4B_+90	GTCAACCAGTATCCCGGTGC
RNF2_4C_+41	GTCAACCATTAAGCAAAACAT
FANCF_4D_+48	GGGGTCCCAGGTGCTGACGT
EMX1_4E_+53	GACATCGATGTCCTCCCCAT
RUNX1_4F_+38	GATGAAGCACTGTGGGTACGA
VEGFA_4G_+57	GATGTACAGAGAGCCCAGGGC
DNMT1_4H_+49	GCCCTTCAGCTAAAATAAAGG

Tabelle 3F: FIG. 42A-42H PEgRNA

PEGRNA	SPACER- SEQUENZ (SEQ-ID-NR: 3464- 3478)	3'-VERLÄNGERUNG (SEQ-ID- NR: 3479-3493)	PBS- LÄNGE (NT)	RT- TEMPLAT- LÄNGE (NT)
HEK3_5A_C3			13	10
HEK3_5A_C4			13	10
HEK3_5A_C7			13	10
FANCF_5A_C3			14	17
FANCF_5A_C7			14	17
FANCF_5A_C8			14	17
EMX1_5A_C5			14	16
EMX1_5A_C6			14	16
EMX1_5A_C7			14	16
EMX1_5C_C5_6			14	16
EMX1_5C_C5_7			14	16
EMXJ_5C_C6_7			14	16
EMX1_5C_C5_6_7			14	16
HEK3_5D_A5			13	10
HEK3_5D_A8			13	10

Tabelle 3G: FIG. 42A-42H Nicking-sgRNA

NICKING- SGRNA	MÖGLICHE SPACER- SEQUENZ (SEQ-ID-NR: 616- 618)	MÖGLICHE SPACER- SEQUENZ (SEQ-ID-NR: 619- 621)
HEK3_5A-F_+90	GTCAACCAGTATCCCGGTGC	GTCAACCAGTATCCCGGTGC
PANCF_5A-F_+48	GGGGTCCCAGGTGCTGACGT	GATGTACAGAGAGCCCAGGGC
EMX1_5A-F_+57	GATGTACAGAGAGCCCAGGGC	GGGGTCCCAGGTCGTGACGT

Tabelle 3H: FIG. 42A-42H Basen-Editing von sgRNA

BASEN-EDITING VON SGRNA	SPACER-SEQUENZ
HEK3_5A-F_BE	GTGCCATCACGTGCTCAGTCT (SEQ ID NO: 455)
FANCF_5A-F_BE	GAGCGATCCAGGTGCTGCAGA (SEQ ID NO: 456)
EMX1_5A-F_BE	GGAGCCCTTCTTCTTCTGCT (SEQ ID NO: 457)

Tabelle 3I: FIG. 42A-42H On-Target-sgRNA

ON-TARGET- SGRNA	SPACER-SEQUENZ
HEK3_5G	GGCCCAGACTGAGCACGTGA (SEQ ID NO: 510)
HEK4_5G	GGCACTGCGGCTGGAGGTGG (SEQ ID NO: 511)
EMX1_5G	GAGTCCGAGCAGAAGAAGAA (SEQ ID NO: 512)
FANCF_5G	GGAATCCCTTCTGCAGCACC (SEQ ID NO: 513)

Tabelle 3J: FIG. 42A-42H On-Target-PEgRNA

ON-TARGET- PEGRNA	SPACER-SEQUENZ (SEQ-ID-NR: 663-677)	3'-VERLÄNGERUNG (SEQ-ID-NR: 678-692)	PBS - LÄNGE (NT)	RT- TEMPLAT- LÄNGE (NT)
HEK3_5G- H_PEGRNA_1			13	10
HEK3_5G- H_PEGRNA_2			13	13
HEK3_5G- H_PEGRNA_3			13	9
HEK3_5G- H_PEGRNA_4			13	10
HEK4_5G- H_PEGRNA_J		TTAACGCCCACCTCCAGCC	9	10
HEK4_5G- H_PEGRNA_2		TTAACCCCCCCCTCCAGCC	9	10
HEK4_5G- H_PEGRNA_3			9	13
HEK4_5G- H_PEGRNA_4		TTAACCCCCCCTCCAGCC	9	9
EMX1_5G- H_PEGRNA_1			14	16
EMX1_5G- H_PEGRNA_2			14	16
EMX1_5G- H_PEGRNA_3			14	19
EMX1_5G- H_PEGRNA_4			14	13
FANCF_5G- H_PEGRNA_1			14	17
FANCF_5G- H_PEGRNA_2			14	17
FANCF_5G- H_PEGRNA_3			14	20

Tabelle 3K: FIG. 49A-49B PEgRNA

PEGRNA	SPACER- SEQUENZ (SEQ- ID-NR: 3494- 3521)	3'-VERLÄNGERUNG (SEQ- ID-NR: 3522-3540)	PBS- LÄNGE (NT)	RT- TEMPLAT- LÄNGE (NT)
HEK3_6A_2GTOC			13	10
HEK3_6A_2GTOC
EMX1_6A_3GTOC			13	13
EMX1_6A_3GTOC
FANCF_6A_5GTOT			13	15
FANCF_6A_5GTOT
HEK3_6A_1HIS6INS			13	52
HEK3_6A_1HIS6INS
HEK3_6A_5GTOT			13	10
HEK3_6A_5GTOT
HEK3_6A_1CTTINS			13	10
HEK3_6A_1CTTINS
HBB_6B_INSALL			13	14
HBB_6B_INSALL
HBB_6B_CORRECT			13	14
HBB_6B_CORRECT
HBB_6B_CORRECT_W_SILENT			13	14
HBB_6B_CORRECT_W_SILENT
HEXA_6B_INSTALL			12	14
HEXA_6B_CORRECT			10	21
HEXA_6B_CORRECT_W_SIL.ENT			9	27
PRNP_6C			12	12
HEK3_6EG_1TTOG			13	10
HEK3_6EG_1CTTINS			13	10
RNF2_6EG_1CTOC			15	14
HBB_6EG_4ATOT			13	14
HEK3_6H_1HIS6INS			13	52
HEK3_6H_1FLAGINS			13	58

Tabelle 3L: FIG. 47A-74D PEgRNA

PEGRNA	SPACER-SEQUENZ (SEQ-ID-NR: 3541- 3547)	3'- VERLÄNGERUNGSSEQ UENZ (SEQ-ID-NR: 3549- 3556)	PBS- LÄNGE (NT)	RT- TEMPLAT LÄNGE (NT)
HEK3_ED4B_1 T DEL			13	9
HEK3_ED4B_1A INS			13	11
HEK3_ED4B_1C TTINS			13	13
HEK3_ED4C_2G TOC			13	10
HEK3_ED4D_1F LAGINS			13	58
RNF2_ED4E_1C TOA			15	14
EMX1_ED4F_1G TOC			13	13
HBB_ED4G_2TT OA			12	14

Tabelle 3M: FIG. 48A-48C PEgRNA

PEGRNA	SPACER- SEQUENZ (SEQ-ID-NR: 3557-3627)	3'- VERLÄNGERUNGSSEQUENZ (SEQ-ID-NR: 3628-3698)	PBS- LÄNGE (NT)	RT- TEMPLAT- LÄNGE (NT)
VEGFA_ED5 A_31			13	31
VEGFA_ED5 A_30			13	30
VEGFA_ED5 A_29			13	29
VEGFA_ED5 A_28			13	28
VEGFA_ED5 A_27			13	27
VEGFA_ED5 A_26			13	26
VEGFA_ED5 A_25			13	25
VEGFA_ED5 A_24			13	24
VEGFA_ED5 A_23			13	23
VEGFA_ED5 A_22			13	22
VEGFA_ED5 A_21			13	21
VEGFA_ED5 A_20			13	20
VEGFA_ED5 A_19			13	19
VEGFA_ED5 A_18			13	18
VEGFA_ED5 A_17			13	17
VEGFA_ED5 A_16			13	16
VEGFA_ED5 A_15			13	15
VEGFA_ED5 A_14			13	14
VEGFA_ED5 A_13			13	13
VEGFA_ED5 A_12			13	12
VEGFA_ED5 A_11			13	11
VEGFA_ED5 A_10			13	10
VEGFA_ED5 A_9			13	9
VEGFA_ED5 A_8		AGCACTCATCTGGCCTGCAGA	13	8
DNMT1_ED5 B_31			13	31
DNMT1_ED5 B_30			13	30
DNMT1_ED5 B_29			13	29
DNMT1_ED5 B_28			13	28
DNMT1_ED5 B_27			13	27
DNMT1_ED5 B_26			13	26
DNMT1_ED5 B_25			13	25
DNMT1_ED5 B_24			13	24
DNMT1_ED5 B_23			13	23
DNMT1_ED5 B_22			13	22
DNMT1_ED5 B_21			13	21
DNMT1_ED5 B_20			13	20
DNMT1_ED5 B_19			13	19
DNMT1_ED5 B_18			13	18
DNMT1_ED5 B_17			13	17
DNMT1_ED5 B_16			13	16
DNMT1_ED5 B_15			13	15
DNMT1_ED5 B_14			13	14
DNMT1_ED5 B_13			13	13
DNMT1_ED5 B_12			13	12
DNMT1_ED5 B_11			13	11
DNMT1_ED5 B_10			13	10
DNMT1_ED5 B_9		CACCACTGTTTCTGGCACCAGG	13	9
DNMT1_ED5 B_8		ACCACTGTTTCTGGCACCAGG	13	8
RUNX1_ED5 C_31			15	31
RUNX1_ED5 C_30			15	30
RUNX1_ED5 C_29			15	29
RUNX1_ED5 C_28			15	28
RUNX1_ED5 C_27			15	27
RUNX1 ED5 C_26			15	26
RUNX1_ED5 C_25			15	25
RUNX1_ED5 C_24			15	24
RUNX1_ED5 C_23			15	23
RUNX1_ED5 C_22			15	22
RUNX1_ED5 C_21			15	21
RUNX1_ED5 C_20			15	20
RUNX1_ED5 C_19			15	19
RUNX1_ED5 C_18			15	18
RUNX1_ED5 C_17			15	17
RUNX1_EO5 C_16			15	16
RUNX1_ED5 C_15			15	15
RUNX1_ED5 C_14			15	14
RUNX1_ED5 C_13			15	13
RUNX1_ED5 C_12			15	12
RUNX1_ED5 C_11			15	11
RUNX1_ED5 C_10			15	10
RUNX1_ED5 C_9			15	9

Tabelle 3N: FIG. 48A-48C PEgRNA

PEGRNA	SPACER-SEQUENZ	3'- VERLÄNGERUNGSSEQUENZ	PBS- LÄNGE (NT)	RT- TEMPLAT- LÄNGE (NT)
HEK3_ED6_5GTOA			13	10

Tabelle 3O: FIG. 48A-48C Nicking-sgRNA

NICKING-SGRNA	SPACER-SEQUENZ
HEK3_ED6_+63	GCACATACTAGCCCCTGTCT (SEQ ID NO: 395)

Tabelle 3P: FIG. 50A-50B PEgRNA

PEGRNA	SPACER (SEQ-ID-NR: 3699-3754)	3'-VERLÄNGERUNG (5' BIS 3')(SEQ-ID-NR: 3755-3810)	PBS- LÄNGE (NT)	RT- TEMPLAT- LÄNGE (NT)
HBB 3.5			12	14
HBB 3.7			13	14
HBB 5.2			13	19
HBB 5.3			13	17
HBB 5.4			13	16
HBB 5.5			13	13
HBB 5.6			13	12
HBB 5.7		ACTTCTCCTCAGGAGTCAGGTGCAC	13	21
HBB 5.8			12	19
HBB 5.9			12	17
HBB 5.10			12	16
HBB 5.11			12	13
HBB 5.12		GACTTCTCCTCAGGAGTCAGGTGCA	12	12
HBB 5.13		ACTTCTCCTCAGGAGTCAGGTGCA	12	14
HEXA S1		ATATCTTATGGCCCTGACTGGAA	13	14
HEXA S2		TATATCTTATGGCCCTGACTGGAA	13	15
HEXA S3		GTATATCTTATGGCCCTGACTGGAA	13	16
HEXA S4			13	19
HEXA S5			13	20
HEXA S6			13	21
HEXA S7			13	22
HEXA S8		ATATCTTATGGCCCTGACT	9	14
HEXA S9		TATATCTTATGGCCCTGACT	9	15
HEXA S 10		GTATATCTTATGGCCCTGACT	9	16
HEXA S 11		ACCGTATATCTTATGGCCCTGACT	9	19
HEXA S 12		AACCGTATATCTTATGGCCCTGACT	9	20
HEXA S 13		GAACCGTATATCTTATGGCCCTGACT	9	21
HEXA S 14			9	22
HEXA S 15		TGAACCGTATATCTTATGGCCCTGAC	8	22
HEXA S 16			10	22
HEXA S 17			11	22
HEXA S 18			12	22
HEXA S 19			13	22
HEXA S 20			14	22
HEXA S 21			15	22
HEXA S 22			9	25
HEXA S 23			9	26
HEXA S24			9	27
HEXA S 25			9	28
HEXA S 26			9	29
HEXA 5			13	21
HEXA 6			13	15
HEXA 7			15	21
HEXA 8			14	21
HEXA 9			12	21
HEXA 10			11	21
HEXA 11			10	21
HEXA 12			13	16
HEXA 13			13	18
HEXA 14			13	22
HEXA 15			13	25
HEXA 16			13	23
HEXA 17		AACCGTATATCCTATGGCCCTGACTG	10	16
HEXA 18			10	18
HEXA 19			10	22
HEXA 20			10	25

Tabelle 3Q: FIG. 50A-50B Nicking-sgRNA

NICKING-SGRNA	SPACER-SEQUENZ
HBB_ED7A_+72	GCCTTGATACCAACCTGCCCA (SEQ ID NO: 626)
HEXA_ED7B_+60	GCTGGAACTGGTCACCAAGGC (SEQ ID NO: 627)
HEXA_ED7B_CORRECT_WT_PE3B	GTACCTGAACCGTATATCCTA (SEQ ID NO: 628)
HEXA_ED7B_CORRECT_SILENT_PE3B	GTACCTGAACCGTATATCTTA (SEQ ID NO: 629)

Tabelle 3R: FIG. 51A-51G PEgRNA

PEGRNA	SPACER-SEQUENZ (SEQ-ID-NR: 632-640)	3'-VERLÄNGERUNG (SEQ- ID-NR: 641-649)	PBS- LÄNGE (NT)	RT- TEMPLAT- LÄNGE (NT)
HEK3_ED8_1 T TOG			13	10
HEK3_ED8_3 A TOC			13	10
HEK3_ED8_3 A TOT			13	10
HEK3_ED8_3 A TOT_5- 6GGTOTT			13	34
HEK3_ED8 _1C TTINS			13	10
RNF2_E08_1 C TOA			15	14
RNF2_ED8_1 C TOG			15	14
RNF2_ED8_1 G TAINS			15	17
HBB_ED8_ 4AT OT			13	14

Tabelle 4: Sequenzen der Primer, die für die Amplifikation genomischer Säugetierzell- DNA und HTS¹⁸¹ verwendet wurden.

BESCHREIBUNG	SPACER (SEQ-ID-NR: 3811-3863)
HEK3 FWD
HEK3 REV
RNF2 FWD
RNF2 REV
HEK4 FWD
HEK4 REV
EMX1 FWD
EMX1 REV
FANCF FWD
FANCF REV
HBB FWD
HBB REV
PRNP FWD
PRNP REV
HEXA FWD
HEXA REV
RUNX1 FWD
RUNX1 REV
VEGFA FWD
VEGFA REV
DNMT FWD
DNMT REV
HEK3 OFF- TARGET SITE 1 FWD
HEK3 OFF- TARGET SITE 1 REV
HEK3 OFF- TARGET SITE 2 FWD
HEK3 OFF- TARGET SITE 2 REV
HEK3 OFF- TARGET SITE 3 FWD
HEK3 OFF- TARGET SITE 3 REV
HEK3 OFF- TARGET SITE 4 FWD
HEK3 OFF- TARGET SITE 4 REV
HEK4 OFF- TARGET SITE 1 FWD
HEK4 OFF- TARGET SITE 1 REV
HEK4 OFF- TARGET SITE 2 FWD
HEK4 OFF- TARGET SITE 2 REV
HEK4 OFF- TARGET SITE 3 FWD
HEK4 OFF- TARGET SITE 3 REV
HEK4 OFF- TARGET SITE 4 FWD
HEK4 OFF- TARGET SITE 4REV
EMX1 OFF- TARGET SITE 1 FWD
EMX1 OFF- TARGET SITE 1 REV
EMX1 OFF- TARGET SITE 2 FWD
EMX1 OFF- TARGET SITE 2 REV
EMX1 OFF- TARGET SITE 3FWD
EMX1 OFF- TARGET SITE 3 REV
EMX1 OFF- TARGET SITE 4 FWD
EMX1 OFF- TARGET SITE 4 REV
FANCF OFF- TARGET SITE 1 FWD
FANCF OFF- TARGET SITE 1 REV
FANCF OFF- TARGET SITE 2 FWD
FANCF OFF- TARGET SITE 2 REV
FANCF OFF- TARGET SITE 3 FWD
FANCF OFF- TARGET SITE 3 REV
FANCF OFF- TARGET SITE 4 FWD

Tabelle 5: Sequenzen von 100-mer einzelsträngigen DNA-Oligonukleotid-Donor- Templaten, die in HDR-Experimenten und bei der Herstellung der HBB-E6V-HEK293T- Zelllinie verwendet wurden. Die Oligonukleotide haben eine Länge von 100-103 nt mit Homologiearmen, die um die Stelle des Edits zentriert sind. Die Oligonukleotide stammen von Integrated DNA Technologies, gereinigt durch PAGE.

HEK3 +3 A TO T
HEK3 +3 A TO T, +5,6 GG TO TT
HEK3 +1 T T OG
HEK3 +3 A T OC
HEK3+1 CTT INSERTION
RNF2 +1 C TO A
RNF2 +1 C TO G
RNF2 +1 GTA INSERTION
HBB E6V INSTALLATION (ALSO USED FOR CREATION OF THE HBB E6V HEK293T CELL LINE)
HBB E6V CORRECTION PROTOSPACER A
HBB E6V CORRECTION PROTOSPACER B
HBB E6V CORRECTION PROTOSPACER B, SILENT PAM MUTATION
PRNP G127V

Zusätzliche Sequenzen
Sequenzen der hierin verwendeten dual-fluoreszierenden Hefe-Reporterplasmide
p425-GFP_stop_mCherry:

p425-GFP_+1fs_mCherry.

p425-GFP_-lfs_mCherry:
LEGENDE:

GFP offener Leserahmen
Linker, enthaltend Stopcodon +1 Frameshift, oder -1 Frameshift
mCherry offener Leserahmen
Plasmid-Rückgrat (enthält den GPD-Promotor, Leu2-Marker und AmpR)

Protospacer (unterstrichen)
PAM (fettgedruckt)
DNA-Sequenzen von Prime-Editor-Plasmiden von Säugetieren und beispielhaftes PEgRNA-Plasmid
pCMV PEI:

pCMV-PE2:

N-terminale NLS + Cas9 H840A
Flexibler Linker
M-MLV reverse Transkriptase + C-terminale NLS
Plasmid-Rückgrat (enthaltend CMV-Promotor und AmpR)
pU6-HEK3_PEgRNA_CTTins:

U6-Promotorsequenz
Spacer-Sequenz
sgRNA-Gerüst
3'-Verlängerung (enthält PBS und RT-Templat)
Rückgrat (enthält AmpR)
pLenti-hSyn-N-PE2-NpuN-P2A-GFP-KASH_U6-DNMTI-PEgRNA:
U6-Promotor
PEgRNA
hSynpromotor
N-termPE2
N-termNpu
P2A-GFP-KASH
pLenti-hSyn-C-PE2-NpuC:

hSynpromotor
C-termNpu
C-termwtCas9
pLenti-U6-DNMTI_nicking_sgRNA:

U6Promoter
sgRNA
Aminosäuresequenzen der hierin verwendeten Varianten der reversen Transkriptase des Maloney-Mausleukämievirus (M-MLV RT).
PE1 M-MLV RT:
M3 M-ML VRT (D200N, T330P, L603W) (siehe Baranauskas et al.¹⁸¹):
PE2 M-MLVRT (D200N, T306K, W313F, T330P, L603W):
M3-deadRT M-MLV RT:
Referenzen für Beispiel 2
Jede der folgenden Referenzen wird in Beispiel 12 zitiert, von denen jede hierin durch Bezugnahme aufgenommen wird

1. Landrum, M. J. et al. ClinVar: public archive of interpretations of clinically relevant variants. Nucleic Acids Res. 44, D862-D868 (2016).
2. Jinek, M. et al. A Programmable Dual-RNA-Guided DNA Endonucluse in Adaptive Bacterial Immunity. Science 337, 816-821 (2012).
3. Cong, L. et al. Multiplex Genome Engineering Using CRISPR/Cas Systems. Science 339, 819- 823 (2013).
4. Mali, P. et al. RNA-Guided Human Genome Engineering via Cas9. Science 339, 823-826 (2013).
5. Yang, H. et al. One-Stcp Generation of Mice Carrying Reporter and Conditional Alleles by CRISPR/Cas-Mediated Genome Engineering. Cell 154, 1370-1379 (2013).
6. Kim, S., Kim, D., Cho, S. W., Kim, J. & Kim, J.-S. Highly efficient RNA-guided genome editing in human cells via delivery of purified Cas9 ribonuclcoprotcins. Genome Res. 24, 1012-1019 (2014).
7. Orlando, S. J. et al. Zinc-finger nuclease-driven targeted integration into mammalian genomεs using donors with limited chromosomal homology. Nucleic Acids Res. 38, el52-el52 (2010).
8. Tsai, S. Q. et al. GUlDE-seq enables genome-wide profiling of off-target cleavage by CRISPRCas nucleases. Nat. Biotechnol. 33, 187-197 (2015).
9. Suzuki, K. et al. In vivo genome editing via CRISPR/Cas9 mediated homology-independent targeted integration. Nature 540, 144-149 (2016).
10. Kosicki, M., Tomberg, K. & Bradley, A. Repair of double-strand breaks induced by CRISPRCas9 leads to large deletions and complex rearrangements. Nat. Biotechnol. 36,765-771 (2018).
11. Haapanicmi, E., Botla, S., Persson, J., Schmierer, B. & Taipale, J. CRISPR-Cas9 genome editing induces a p53-medialed DNA damage response. Nat. Med. 24, 927-930 (2018).
12. Ihry, R. J. et al. p53 inhibits CRISPR-Cas9 engineering in human pluripotent stem cells. Nat. Metd. 24,939-946 (2018).
13. Rouet, P., Smih, F. & Jasin, M. Expression of a sile-specific endonuclease stimulates homologous recombination in mammalian cells. Proc. Natl. Acad. Sei. 91, 6064-6068 (1994).
14. Chapman, J. R., Taylor, M. R. G. & Boulton, S. J. Playing the end game: DNA double-strand break repair pathway choice. Mol. Cell 47, 497-510 (2012).
15. Cox, D. B. T., Platt, R. J. & Zhang, F. Therapeutic genome editing: prospects and challenges. Nat. Med. 21, 121-131 (2015).
16. Paquet. D. et al. Efficient introduction of specific homozygous and heterozygous mutations using CRISPR/Cas9. Nature 533,125-129 (2016).
17. Chu, V. T. et al. Increasing the efficiency of homology-directed repair for CRISPR-Cas9-induccd precise gene editing in mammalian cells. Nat. Biotechnol. 33, 543-548 (2015).
18. Maruyama, T. et al. Increasing the efficiency of precise genome editing with CRISPR-Cas9 by inhibition of nonhomologous end joining. Nat. Biotechnol. 33, 538-542 (2015).
19. Rees, H. A., Yεh, W.-H. & Liu, D. R. Development of hRad51-Cas9 nickase fusions that mediale HDR without doublc-strandcd breaks. Nat. Commun. 10.1-12 (2019).
20. Shen, M. W. et al. Predictable and precise template-free CRISPR editing of pathogenic variants. Nature 563, 646-651 (2018).
21. Rees, H. A. & Liu, D. R. Base editing: precision chemistry on the genome and transcriptome of living cells. Nat. Rev. Genet. 19,770 (2018).
22. Komor, A. C., Kim, Y. B., Packer, M. S., Zuris, J. A. & Liu, D. R. Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage. Nature 533, 420-424 (2016).
23. Gaudelli, N. M. et al. Programmable base editing of A·T to G·C in genomic DNA without DNA cleavage. Nature 551, 464-471 (2017).
24. Gao, X. et al. Treatment of autosomal dominant Hearing loss by in vivo delivery of genome editing agents. Nature 553, 217-221 (2018).
25. Ingram, V. M. A specific chemical difference between the globins of normal human and sicklecell anaemia haemoglobin. Nature 178, 792-794 (1956).
26. Mycrowitz, R. & Costigan, F. C. The major defect in Ashkenazi Jews with Tay-Sachs disease is an insertion in the gene für the alpha-chain of beta-hexosaminidase. J. Biol. Chem. 263, 18587-18589 (1988).
27. Zielenski, J. Genotype and Phenotype in Cystic Fibrosis. Respiration 67, 117-133 (2000).
28. Mead, S. et al. A Novel Protective Prion Protein Variant that Colocalizes with Kuru Exposure. N. Engl. J. Med. 361, 2056-2065 (2009).
29. Marraffini, L. A. & Sontheimer, E. J. CRISPR interference limits horizontal gene transfer in staphylococci by targeting DNA. Science 322, 1843-1845 (2008).
30. Ban angou, R. et al. CRISPR provides acquired resistance against viruses in prokaryotes. Science 315, 1709-1712 (2007).
31. Jiang, F. & Doudna, J. A. CRISPR-Cas9 Structures and Mechanisms. Anna. Rev. Biophys. 46, 505-529 (2017).
32. Hille, F. et al. The Biology of CRISPR-Cas: Backward and Forward. Cell 172, 1239-1259 (2018).
33. Luan, D. D., Korman, M. H., Jakubczak, J. L. & Eickbush, T. H. Reverse transcription of R2Bm RNA is primed by a nick at the chromosomal target site: a mechanism for non-LTR retrotransposition. Cell 72, 595-605 (1993).
34. Liu, Y., Kao, H.-1. & Bambara, R. A. Flap endonuclease 1: a central component of DNA metabolism. Annu. Rev. Biochem. 73,589-615 (2004).
35. Richardson, C. D., Ray, G. J., DeWitt, M. A., Curie, G. L. & Corn, J.E. Enhancing homology directed genome editing by catalytically active and inactive CRISPR-Cas9 using asymmetric donor DNA. Nat. Biotechnol. 34, 339-344 (2016).
36. Qi, L. S. et al. Repurposing CRISPR as an RNA-Guided Platfonn for Sequence-Specific Control of Gene Expression. Cell 152, 1173-1183 (2013).
37. Shechner, D. M., Hacisuleyman, E., Younger, S. T. & Rinn, J. L. Multiplexable, locus-specific targeting of long RNAs with CRISPR-Display. Nat. Methods 12,664-670 (2015).
38. Tang, W., Hu, J. H. & Liu, D. R. Aptazyme-embedded guide RNAs enablc ligand-responsive genome editing and transcriptional activation. Nat. Commun. 8,15939 (2017).
39. Jinck, M. et al. Structures of Cas9 Endonucleases Revcal RNA-Mediated Conformational Activation. Science 343, 1247997 (2014).
40. Nishimasu, H. et al. Crystal Structure of Cas9 in Complex with Guide RNA and Target DNA. Cell 155, 935-949 (2014).
41. Jiang, F., Zhou, K., Ma, L., Gressel, S. & Doudna, J. A. A Cas9-guide RNA complex preorgatiized for target DNA recognition. Science 348, 1477-1481 (2015).
42. Baranauskas, A. et al. Generation and characterization of new highly thermostable and processive M-MuLV reverse transcriptase variants. Protein Eng. Des. Sei. 25, 657-668 (2012).
43. Gerard, G. F. et al. The role of template-primer in protection of reverse transcriptase from thermal inactivation. Nucleic Acids Res. 30, 3118-3129 (2002).
44. Arezi, B. & Hogrefe, H. Novel mutations in Moloney Murine Leukemia Virus reverse transcriptase increase thermostability through tighter binding to template-primer. Nucleic Acids Res. 37. 473-481 (2009).
45. Kotewicz, M. L., Sampson, C. M., D'Alessio, J. M. & Gerard, G. F. Isolation of cloned Moloney murine leukemia virus reverse transcriptase lacking ribonuclease H activity. Nucleic Acids Res. 16, 265-277 (1988).
46. Thuronyi, B. W. et al. Continuous evolution of base editors with expanded target compatibility and improved activity. Nat. Biotechnol. (2019). doi:10.1038/s41587-019-0193-0
47. Kim, Y. B. et al. Increasing the genome-targeting scope and precision of base editing with engineered Cas9-cytidine deaminase fusions. Nat. Biotechnol. 35, 371-376 (2017).
48. Koblan, L. W. et al. Improving cytidine and adenine base editors by expression optimization and anccstral reconstruction. Nat. Biotechnol. (2018). doi:10.1038/nbt.4172
49. Kleinstiver, B. P. et al. High-fidelity CRISPR-Cas9 nucleases with no detectable genome-wide off target effects. Nature 529, 490-495 (2016).
50. Zuo, E. et al. Cytosine base editor generates substantial off-target single-nucleotide variants in mouse embryos. Science 364, 289-292 (2019).
51. Jin, S. et al. Cytosine, but not adenine, base editors induce genome-wide off-target mutations in rice. Science 364, 292-295 (2019).
52. Kim, D., Kim, D., Lee, G., Cho, S.-I. & Kim, J.-S. Genome-wide target specificity of CRISPR RNA guided adenine base editors. Nat. Biotechnol. 37, 430-435 (2019).
53. Grunewald, J. et al. Transcriptome-wide off-target RNA editing induced by CRISPR-guided DNA base editors. Nature 569, 433-437 (2019).
54. Zhou, C. et al. Off-target RNA mutation induced by DNA base editing and its elimination by mutagenesis. Nature 571, 275-278 (2019).
55. Rees, H. A., Wilson, C., Doman, J. L. & Liu, D. R. Analysis and minimization of cellular RNA editing by DNA adenine base editors. Sei. Adv. 5, eaax5717 (2019).
56. Osteitag, L. M. & Kazazian Jr, H. H. Biology of Mammalian L1 Retrotransposons. Annu. Rev. Genet. 35,501-538 (2001).
57. Griffiths, D. J. Endogenous retroviruses in the human genome sequence. Genome Biol. 2, REVJEWS1017 (2001).
58. Berkhout, B., Jebbink, M. & Zsiros, J. Identification of an Active Reverse Transcriptase Enzyme Encoded by a Human Endogenous HERV-K Retrovirus. J. Virol. 73, 2365-2375 (1999).
59. Halvas, E. K., Svarovskaia, E. S. & Pathak, V. K. Role of Murine Leukemia Virus Reverse Transcriptase Deoxyribonucleoside Triphosphate-Binding Site in Retroviral Replication and in Vivo Fidelity. J. Virol. 74, 10349-10358 (2000).
60. Dever, D. P. et al. CRISPR/Cas9 Beta-globin Gene Targeting in Human Hematopoietic Stern Cells. Nature 539, 384-389 (2016).
61. Park, S. H. et al. Highly efficient editing of the β-globin gene in patient-derived hematopoietic stem and progenitor cells to treat sickle cell disease. Nucleic Acids Res. doi:10.1093/nar/gkz475
62. Collinge, J. Prion diseases of humans and animals: their causes and molecular basis. Annu. Rev. Neurosci. 24, 519-550 (2001).
63. Asante, E. A. et al. A naturally occurring variant of the human prion protein completely prevents prion disease. Nature 522, 478-481 (2015).
64. Zettler, J., Schutz, V. & Mootz, H. D. The naturally split Npu DnaE intein exhibits an extraordinarily high rate in the protein trans-splicing reaction. FEBS Leu. 583, 909-914 (2009).
65. Kugler, S., Kilic, E. & Bahr, M. Human synapsin 1 gene promoter confers highly neuron-specific long-term transgene expression from an adenoviral vector in the adult rat brain depending on the transduced area. Gene Ther. 10. 337-347 (2003).
66. de Felipe, P., Hughes, L. E., Ryan, M. D. & Brown, J. D. Co-translational, intraribosomal cleavageof polypeptides by the foot-and-mouth disease virus 2A peptide. J. Biol. Chem. 278, 11441- 11448 (2003).

1. Etablierung einer Leit-RNA-templierten reversen Transkription von mutagenen DNA-Strängen.
Hintergrund und Argumentation
Bei der vorgeschlagenen Genom-Editing-Strategie fungiert der mit Cas9 genickte Nicht-Ziel-DNA-Strang (PAM-haltiger Strang, der die R-Schleife bildet) als Primer für die DNA-Synthese. Die Hypothese, dass dies möglich ist, basiert auf mehreren biochemischen und strukturellen Daten. Nuklease-Schutz-Experimente³², kristallografische Studien³³ und Basen- Editing-Fenster^4,24 haben ein hohes Maß an Flexibilität und Unordnung für die Nicht- Zielstrang-Nukleotide -20 bis -10 innerhalb der sogenannten R-Schleife des Cas9-gebundenen Komplexes (die Nummerierung gibt den Abstand 5' vom ersten PAM-Nukleotid an) gezeigt. Darüber hinaus kann der PAM-distale Abschnitt des gespaltenen Nicht-Zielstrangs aus den fest gebundenen ternären Komplexen verdrängt werden, wenn komplementäre ssDNA in trans²⁰ hinzugefügt wird. Diese Studien belegen, dass der Nicht-Zielstrang hochflexibel und für Enzyme zugänglich ist und dass nach dem Nicking der 3'-Terminus des PAM-distalen Fragments vor der Dissoziation von Cas9 freigesetzt wird. Außerdem wird angenommen, dass gRNAs auf die Templat-DNA-Synthese verlängert werden können. Frühere Studien haben gezeigt, dass gRNAs für SpCas9, SaCas9 und LbCas12a (ehemals Cpfl) gRNA- Verlängerungen mit RNA-Aptameren³⁴, Liganden-induzierbaren selbstspaltenden Ribozymen³⁵ und langen nicht-kodierenden RNAs³⁶ tolerieren. In dieser Literatur finden sich Hinweise auf zwei wichtige Merkmale, die genutzt werden sollen. Bei der Bewertung dieser Strategie werden mehrere CRISPR-Cas-Systeme in Verbindung mit 5'- und 3'-verlängerten gRNA-Ausgestaltungen unter Verwendung einer Kombination von In vitro- und zellulären Tests bewertet (2A-2C).
Ausgestaltungen für gRNAs, die für das TRT-Editing entwickelt wurden, werden in 3A-3B gezeigt. Die DNA-Synthese verläuft von 5' nach 3' und kopiert somit das RNA- Templat in der Richtung 3' nach 5'. Die Ausgestaltung für die 5'-Verlängerung enthält eine Linker-Region, eine Primer-Bindungsstelle, an der der genickte DNA-Strang annealisiert, und ein Templat für die DNA-Synthese durch reverse Transkription. Die 3'-verlängerte gRNA enthält eine Primer-Bindungsstelle und ein Templat für die reverse Transkription. In einigen Fällen wird die 3'-RNA-Haarnadel des gRNA-Kerns so modifiziert, dass sie mit der DNA- Zielsequenz übereinstimmt, da In-vitro-Experimente gezeigt haben, dass die reverse Transkription den gRNA-Kern für die 3'-verlängerten gRNA-Konstrukte um ~3 Nukleotide verlängert (die Modifikation der Haarnadelsequenz scheint gut toleriert zu werden, solange kompensatorische Änderungen vorgenommen werden, die die Haarnadel-RNA-Struktur erhalten). Die DNA-Synthese verläuft von 5' bis 3', wobei die Nukleotide an das 3' OH des wachsenden DNA-Strangs angefügt werden.
Vorläufige Ergebnisse
Cas9-genickte DNA stimuliert die reverse Transkription von gRNA-Templaten. Um die Zugänglichkeit des genickten Nicht-Ziel-DNA-Strangs zu bewerten, wurden biochemische In-vitro-Tests mit der Cas9-Nuklease aus S. Pyogenes (SpCas9) und Cy5- fluoreszenzmarkierten Duplex-DNA-Substraten (51 Basenpaare) ausgeführt. Zunächst wurde eine Reihe von gRNAs, die 5'-Verlängerungen mit unterschiedlichen Längen des Synthese- Templats enthielten, durch In-vitro-Transkription hergestellt (die Gesamtausgestaltung wird in 2B gezeigt). Elektrophoretische Mobilitätsverschiebungstests (EMSA) mit nukleasefreiem Cas9 (dCas9) ergaben, dass 5'-verlängerte gRNAs die Zielbindungsaffinität aufrechterhalten (Daten nicht gezeigt). Als Nächstes wurde die TPRT-Aktivität an vorgenickten Cy5-markierten Duplex-DNA-Substraten unter Verwendung von dCas9, 5'verlängerten gRNAs und reverser Transkriptase des Molony-Mausleukämie-Virus (M-MLV) (Superscript III) getestet. Nach einer einstündigen Inkubation bei 37 °C wurden die Produkte mittels denaturierender Polyacrylamid-Gelelektrophorese (PAGE) ausgewertet und mit Cy5- Fluoreszenz abgebildet (4A). Jede 5'-verlängerte gRNA-Variante führte zu einer signifikanten Produktbildung, wobei die beobachteten DNA-Produktgrößen mit der Länge des Templats für die Verlängerung übereinstimmten (4B). Wichtig ist, dass in Abwesenheit von dCas9 die vorgenickten Substrate auf die volle Länge von 51 bp des DNA-Substrats verlängert wurden, was stark darauf hindeutet, dass der komplementäre DNA-Strang und nicht die gRNA als Templat für die DNA-Synthese verwendet wurde, wenn dCas9 nicht vorhanden war (4C). Bemerkenswert ist, dass das System so ausgestaltet wurde, dass der neu synthetisierte DNA-Strang das Produkt widerspiegelt, das für das Editieren der Zielstelle erforderlich wäre (ein homologer Strang mit einer einzigen Nukleotidänderung). Dieses Ergebnis belegt, dass die Cas9:gRNA-Bindung das 3'-Ende des genickten Nicht-Zielstrangs freilegt und dass der Nicht-Zielstrang für die reverse Transkription zugänglich ist.
Als Nächstes wurden nicht genickte dsDNA-Substrate unter Verwendung der Cas9(H840A)-Mutante untersucht, die den Nicht-Ziel-DNA-Strang genickt hat. Um die Nickase-Aktivität von Cas9(H840A) mit 5'-verlängerten gRNAs zu testen, wurden zunächst In-vitro-Spaltungstests ausgeführt, wie zuvor beschrieben³⁷. Obwohl das Nicking im Vergleich zur Standard-gRNA beeinträchtigt war, wurden nennenswerte Spaltprodukte gebildet (4D). Wichtig ist, dass RT-Produkte auch beobachtet wurden, wenn TPRT-Reaktionen mit 5'-verlängerten gRNAs und Cas9(H840A) durchgeführt wurden, wenn auch mit geringeren Erträgen, die sich wahrscheinlich durch die verminderte Nicking-Aktivität erklären lassen (4D). Dieses Ergebnis belegt, dass 5'-verlängerte gRNA:Cas9(H840A)-Komplexe DNA nicken und Templat-Reverse-Transkription durchführen können.
Schließlich wurden 3'-gRNA-Verlängerungen auf Cas9(H840A)-Nicking und TPRT untersucht. Im Vergleich zu 5'-verlängerten gRNAs war die DNA-Spaltung durch 3'verlängerte gRNAs im Vergleich zu den Standard-gRNAs nicht in nennenswertem Umfang beeinträchtigt. Bezeichnenderweise unterstützten 3'-verlängerte gRNA-Template auch eine effiziente reverse Transkription mit sowohl genickten als auch intakten Duplex-DNA- Substraten, wenn M-MLV RT in trans zugeführt wurde (4E). Überraschenderweise wurde bei 3'-verlängerten Templaten nur ein einziges Produkt beobachtet, was darauf hinweist, dass die reverse Transkription an einer bestimmten Stelle entlang des gRNA-Gerüsts endet. Das Homopolymer-Tailing des Produkts mit terminaler Transferase, gefolgt von Klenow- Verlängerung und Sanger-Sequenzierung, ergab, dass das gesamte gRNA-Synthese-Templat zusätzlich zu den terminalen 3 Nukleotiden des gRNA-Kerns kopiert wurde. In Zukunft wird der Flap-Terminus durch Modifizieren der terminalen gRNA-Sequenz umprogrammiert^38,39. Dieses Ergebnis zeigt, dass 3'-verlängerte gRNAs als effiziente Nuklease-Targeting-Guides dienen und als Templat für die reverse Transkription dienen können.
Cas9-TPRT verwendet genickte DNA und gRNA in cis. Mithilfe von Zweifarb- Experimenten wurde bestimmt, ob die RT-Reaktion vorzugsweise mit der gRNA in cis (im selben Komplex gebunden) abläuft (siehe 8). Es wurden zwei separate Experimente für 5'-verlängerte und 3'-verlängerte gRNAs durchgeführt. Für ein bestimmtes Experiment wurden ternäre Komplexe aus dCas9, gRNA und DNA-Substrat in separaten Röhrchen gebildet. In einem Röhrchen kodiert die gRNA ein langes RT-Produkt und das DNA-Substrat ist mit Cy3 (rot) markiert; im anderen kodiert die gRNA ein kurzes RT-Produkt und das DNA-Substrat ist mit Cy5 (blau) markiert. Nach kurzen Inkubationen wurden die Komplexe gemischt und anschließend mit RT-Enzym und dNTPs behandelt. Die Produkte wurden durch Harnstoffdenaturierende PAGE aufgetrennt und durch Fluoreszenz im Cy3- und Cy5-Kanal sichtbar gemacht. Es wurde festgestellt, dass die Reaktionsprodukte bevorzugt unter Verwendung des gRNA-Templats gebildet werden, das mit dem DNA-Substrat vorkomplexiert wurde, was darauf hindeutet, dass die RT-Reaktion wahrscheinlich in cis stattfinden kann. Diese Ergebnisse belegen, dass ein einzelner Cas9:gRNA-Komplex eine DNA-Stelle anvisieren und die reverse Transkription eines mutagenen DNA-Strangs einleiten kann.
Testen von TPRT mit anderen Cas-Systemen
Ähnliche Experimente wie in den vorangegangenen Abschnitten werden mit anderen Cas-Systemen durchgeführt, einschließlich Cas9 von S. Aureus und Cas12a von L. Bacterium (siehe 2A-2C). Wenn TRPT auch für diese Cas-Varianten nachgewiesen werden kann, würden sich der potenzielle Umfang des Editing und die Wahrscheinlichkeit eines Gesamterfolgs in Zellen erhöhen.
Testen von TPRT mit RT-Cas9-Fusionsproteinen
Eine Reihe von kommerziell erhältlichen oder reinigbaren RT-Enzymen wird zunächst in trans auf TPRT-Aktivität untersucht. Neben der bereits getesteten RT aus M-MLV werden die RT aus dem Avian Myeloblastosis Virus (AMV), das Geobacillus stearothermophilus Group II Intron (GsI-IIC)^41,42 und das Eubacterium rectale Group II Intron (Eu.re.I2)^43,44 untersucht. Bezeichnenderweise führen die beiden letztgenannten RTs die TPRT in ihrem natürlichen biologischen Kontext aus. Gegebenenfalls werden RNAse inaktivierende Mutationen und andere potenziell nützliche Modifikationen des RT-Enzyms getestet. Sobald funktionsfähige RTs bei In-Trans-Zuführung identifiziert sind, wird jede als Fusionsprotein zu Cas9-Varianten bewertet. Es werden sowohl die N-Terminus- als auch die C-Terminus- Fusionsausrichtung sowie verschiedene Linkerlängen und -architekturen getestet. Kinetische Zeitverlaufsexperimente sollen bestimmen, ob TPRT unter Verwendung des RT-Enzyms in cis stattfinden kann. Wenn eine RT-Cas9-Fusionsarchitektur konstruiert werden kann, die eine effiziente TPRT-Chemie ermöglicht, wird dies die Wahrscheinlichkeit eines funktionellen Editings im Kontext einer Zelle erheblich erhöhen.
Cas9-Targeting mit konstruierten gRNAs in Zellen
Die konstruierten Kandidaten-gRNAs, die in den vorangegangenen Unterzielen entwickelt wurden, werden in humanen Zellkulturexperimenten (HEK293) evaluiert, um die Effizienz des Cas9-Targetings zu bestätigen. Mithilfe etablierter Indel-Bildungstests unter Verwendung von Wildtyp-SpCas⁹⁴⁵ werden die entwickelten gRNAs Seite an Seite mit Standard-gRNAs an 5 oder mehr Stellen im humanen Genom verglichen. Die Effizienz des Genom-Editings wird durch Amplikon-Sequenzierung im Multiplexverfahren mit der im Labor befindlichen Illumina MiSeq-Plattform charakterisiert. Es wird erwartet, dass die Ergebnisse aus diesem und den vorangegangenen Abschnitten Erkenntnisse erzeugen, die in die nachfolgenden Iterationen des Ausgestaltungs-Bau-Test-Zyklus einfließen, in denen gRNAs sowohl für das Templating der reversen Transkription als auch für die effiziente Cas9- Zielsteuerung in Zellen optimiert werden können.
Die Ergebnisse der In-vitro-Validierungen werden in den 5-7 gezeigt. In-vitro- Experimente haben gezeigt, dass der genickte Nicht-Ziel-DNA-Strang flexibel und für das Priming der DNA-Synthese verfügbar ist, und dass die gRNA-Verlängerung als Templat für die reverse Transkription dienen kann (siehe 5). In diesem Satz von Experimenten wurden 5'-verlängerte gRNAs (Ausgestaltung wie in 3A-3B) mit Synthese-Templaten unterschiedlicher Länge (links aufgeführt) verwendet. Als Substrate wurden fluoreszierend markierte (Cy5) DNA-Ziele verwendet, die in diesem Satz von Experimenten vorgenickt wurden. Bei dem in diesen Experimenten verwendeten Cas9 handelt es sich um katalytisch totes Cas9 (dCas9), das keine DNA schneiden, aber dennoch effizient binden kann. Superscript III, ein kommerzielles RT, das aus dem Moloney-Mausleukämie-Virus (M-MLV) abgeleitet ist, wurde in trans zugeführt. Zunächst wurden aus den gereinigten Komponenten dCas9:gRNA-Komplexe gebildet. Dann wurde das fluoreszenzmarkierte DNA-Substrat zusammen mit dNTPs und dem RT-Enzym zugegeben. Nach einer einstündigen Inkubation bei 37 °C wurden die Reaktionsprodukte durch denaturierende Harnstoff-Polyacrylamid- Gelelektrophorese (PAGE) analysiert. Das Gelbild zeigt die Verlängerung des ursprünglichen DNA-Strangs auf Längen, die mit der Länge des Templats für die reverse Transkription übereinstimmen. Bemerkenswert ist, dass Reaktionen, die in Abwesenheit von dCas9 durchgeführt wurden, unabhängig von der verwendeten gRNA DNA-Produkte mit einer Länge von 51 Nukleotiden erzeugten. Dieses Produkt entspricht der Verwendung des komplementären DNA-Strangs als Templat für die DNA-Synthese und nicht der RNA (Daten nicht gezeigt). Die Cas9-Bindung ist also erforderlich, um die DNA-Synthese auf das RNA- Templat zu lenken. Dieser Satz von In vitro-Experimenten weist enge Parallelen zu denen in 5 auf, außer, dass das DNA-Substrat nicht genickt ist und eine Cas9-Nickase (SpyCas9 H840A-Mutante) verwendet wird. Wie im Gel gezeigt, spaltet die Nickase den DNA-Strang effizient, wenn die Standard-gRNA verwendet wird (gRNA_0, Spur 3). Es werden mehrere Spaltprodukte beobachtet, was mit früheren biochemischen Untersuchungen von SpyCas9 übereinstimmt. Die 5'-Verlängerung beeinträchtigt die Nicking-Aktivität (Spuren 4-8), aber es wird immer noch ein RT-Produkt beobachtet. 7 zeigt, dass 3'-Verlängerungen die DNA- Synthese unterstützen und die Cas9-Nickase-Aktivität nicht signifikant beeinflussen. Vorgenickte Substrate (schwarzer Pfeil) werden nahezu quantitativ in RT-Produkte umgewandelt, wenn entweder dCas9 oder Cas9-Nickase verwendet werden (Spuren 4 und 5). Mehr als 50 % Umwandlung in das RT-Produkt (roter Pfeil) wird mit vollen Substraten (Spur 3) beobachtet. Um die Länge und Sequenz des RT-Produkts zu bestimmen, wurde die Produktgruppe aus dem Gel herausgeschnitten, extrahiert und sequenziert. Dies ergab, dass die RT 3 Nukleotide in die 3'-terminale Haarnadel des gRNA-Kerns verlängert. Anschließende Experimente (nicht gezeigt) zeigten, dass diese drei Nukleotide so verändert werden können, dass sie mit den Sequenzen der Ziel-DNA übereinstimmen, solange komplementäre Änderungen vorgenommen werden, die die Haarnadel-RNA-Struktur erhalten.
Potenzielle Schwierigkeiten und Alternativen
(1) RT funktioniert nicht als Fusion: Molekulares Gedränge und/oder ungünstige Geometrien könnten die Polymeraseverlängerung durch Cas9-fusionierte RT-Enzyme behindern. Zunächst kann eine Optimierung des Linkers getestet werden. Es werden zirkulär permutierte Varianten von Cas9 untersucht, die die räumliche Beziehung zwischen DNA- Primer, gRNA und RT-Enzym neu ausrichten könnten. Nicht-kovalente RT- Rekrutierungsstrategien, wie in Ziel 2 beschrieben, können getestet werden. (2) Verminderte Cas-Targeting-Effizienz durch verlängerte gRNA-Varianten: Dies ist am ehesten ein Problem für 5'-verlängerte gRNAs. Basierend auf Strukturdaten²⁴ können Cas9-Mutanten entworfen und gescreent werden, um Varianten mit größerer Toleranz gegenüber gRNA-Verlängerung zu identifizieren. Darüber hinaus Signifikanzkönnten gRNA-Bibliotheken in Zellen auf Linker gescreent werden, die die Targeting-Aktivität verbessern.
Signifikanz
Diese vorläufigen Ergebnisse belegen, dass Cas9-Nickasen und verlängerte gRNAs eine gezielte reverse Transkription an gebundenen DNA-Zielen mithilfe einer in trans zugeführten reversen Transkriptase einleiten können. Wichtig ist, dass sich die Cas9-Bindung als entscheidend für die Produktbildung erwiesen hat. Auch wenn dies vielleicht keine absolute Voraussetzung für das Genom-Editing in Zellen ist, würde eine weitere Entwicklung des Systems, die die Funktion des RT-Enzyms in cis einbezieht, die Erfolgswahrscheinlichkeit bei zellbasierten Anwendungen deutlich erhöhen. Die Verwirklichung der verbleibenden Aspekte dieses Ziels würde eine molekulare Grundlage für die Durchführung des Präzisions-Genom- Editing im Kontext des humanen Genoms bereitstellen.
2. Etablierung von Prime-Editing in humanen Zellen.
Hintergrund und Argumentation
Die vorgeschlagene Strategie sieht vor, dass ein künstlich hergestellter RT- Cas9:gRNA-Komplex mutagene 3'-DNA-Flaps an genomischen Zielstellen einführt. Es wird angenommen, dass mutagene 3'-Flaps, die eine einzelne Diskrepanz enthalten, von der DNA- Reparaturmaschinerie durch energetisch zugängliche Äquilibrierung mit benachbarten 5'-Flaps inkorporiert werden, die dann bevorzugt entfernt werden (1C-1D). Die DNA- Replikations- und -Reparaturmaschinerie stößt bei der Verarbeitung von Okazaki- Fragmenten⁴⁶ und während der Long-Patch-Base-Excision-Repair (LP-BER)⁴⁷ auf 5'-ssDNA- Flaps. 5'-Flaps sind die bevorzugten Substrate für die weithin exprimierte Flap-Endonuklease FEN1, die durch den homotrimeren Gleitklemmenkomplex PCNA⁴⁸ an DNA-Reparaturstellen rekrutiert wird. PCNA dient auch als Gerüst für die gleichzeitige Rekrutierung anderer Reparaturfaktoren, einschließlich der DNA-Ligase Lig1⁴⁹. Als „Werkzeuggürtel“ beschleunigt PCNA die serielle Flap-Spaltung und -Ligierung, die für die Verarbeitung der Millionen von Okazaki-Fragmenten, die bei jeder Zellteilung erzeugt werden, unerlässlich ist^50,51. Basierend auf der Ähnlichkeit mit diesen natürlichen DNA-Zwischenprodukten wird angenommen, dass mutagene Stränge durch Gleichgewicht mit 5'-Flaps eingebaut werden, gefolgt von koordinierter 5'-Flap-Exzision und Ligation. Die Diskrepanz-Reparatur (MMR) sollte dann auf beiden Strängen mit gleicher Wahrscheinlichkeit stattfinden, was zu Editing oder Reversion führt (1C-1D). Alternativ könnte die DNA-Replikation zuerst stattfinden und direkt zum Einbau des Editing in den neu synthetisierten Tochterstrang führen. Während der höchste zu erwartende Wirkungsgrad dieses Prozesses bei 50 % liegt, könnten mehrere Versuche des Editings von Substraten die Reaktion aufgrund der Unumkehrbarkeit der Reparatur durch Editing zum Abschluss bringen.
Vorläufiges Ergebnis
DNA-Flaps induzieren stellenspezifische Mutagenese in Plasmid-Modellsubstraten in Hefe und HEK-Zellen. Um die vorgeschlagene Editing-Strategie zu testen, wurden Studien mit Modellplasmid-Substraten begonnen, die mutagene 3'-Flaps enthalten, die dem Produkt von TPRT ähneln. Es wurde ein dual-fluoreszierender Protein-Reporter entwickelt, der ein Stoppcodon zwischen GFP und mCherry kodiert. Mutagene Flaps kodieren eine Korrektur des Stoppcodons (9A), was die Synthese von mCherry ermöglicht. Somit kann die Effizienz der Mutagenese anhand des Verhältnisses GFP mCherry quantifiziert werden. Die Plasmidsubstrate wurden in vitro hergestellt und in Hefe- (S.Cerevisiae) oder humane Zellen (HEK293) eingebracht. In beiden Systemen wurde eine hochfrequente Mutagenese beobachtet (9B), und isolierte Hefekolonien enthielten entweder die umgewandelte Base, die mutierte Base oder eine Mischung aus beiden Produkten (9C). Die Erkennung des letzteren lässt darauf schließen, dass die Plasmidreplikation in diesen Fällen vor der MMR stattfand, und legt ferner nahe, dass die Flap-Exzision und -Ligation der MMR vorausgehen. Dieses Ergebnis belegt die Durchführbarkeit des DNA-Editings mit 3' mutagenen Strängen.
• Systematische Studien mit Modell-Flap-Substraten
Basierend auf den oben beschriebenen vorläufigen Ergebnissen soll ein breiteres Spektrum von Flap-Substraten in HEK-Zellen untersucht werden, um die Prinzipien des effizienten Editings zu ermitteln. 3' ssDNA-Flaps werden systematisch variiert, um den Einfluss von Diskrepanz-Paarungen, die Position des mutagenen Nukleotids entlang des Flaps und die Identität des terminalen Nukleotids zu bestimmen (9D). Einzelne Nukleotidinsertionen und -deletionen werden ebenfalls getestet. Zur Analyse der Präzision des Editing wird die Sequenzierung von Amplikons verwendet. Diese Ergebnisse werden in die Ausgestaltung von Templaten für die reverse Transkription von gRNA einfließen.
In-vitro-TPRT auf Plasmidsubstraten führt zu effizienten Editing-Ergebnissen. Die in Ziel 1 entwickelten TPRT-Reaktionen wurden verwendet, um Mutagenese in einem Plasmidsubstrat zu induzieren. Die Reaktion wurde mit zirkulären DNA-Plasmidsubstraten durchgeführt (siehe 10). Dies schließt die Möglichkeit einer DNA-Strangdissoziation als Mechanismus für die RT-Verlängerung in den vorherigen In-vitro-Experimenten aus. Außerdem konnte so die DNA-Reparatur von Flap-Substraten in Zellen getestet werden. Für die Exprimierung in Hefe (S. Cerevisiae) wurde ein dual-fluoreszierendes Reporterplasmid konstruiert. Dieses Plasmid kodiert GFP (grünes fluoreszierendes Protein) und mCherry (rot fluoreszierendes Protein) mit einem dazwischenliegenden Stoppcodon (TGA). Die Exprimierung dieses Konstrukts in Hefe erzeugt nur GFP. Das Plasmid wurde als Substrat für In-vitro-TRT verwendet [Cas9(H840A) Nickase, manipulierte gRNA, MLV RT-Enzym, dNTPS]. Die gRNA-Verlängerung kodiert eine Mutation zum Stoppcodon. Der Flap-Strang wird für die Reparatur des Stoppcodons verwendet, und es wird erwartet, dass ein Plasmid entsteht, das sowohl GFP als auch mCherry als Fusionsprotein exprimiert. Die Hefe-Dual-FP- Plasmid-Transformanten werden in 10 gezeigt. Die Transformation des Elternplasmids oder eines In-vitro-Cas9(H840A)-genickten Plasmids führt nur zu Kolonien, die grünes GFP exprimieren. Die TRT-Reaktion mit 5'-verlängerten oder 3'-verlängerten gRNAs erzeugt eine Mischung aus grünen und gelben Kolonien. Letztere exprimieren sowohl GFP als auch mCherry. Mit der 3'-verlängerten gRNA werden mehr gelbe Kolonien beobachtet. Eine positive Kontrolle, die kein Stoppcodon enthält, ist ebenfalls abgebildet.
Dieses Ergebnis belegt, dass lange doppelsträngige Substrate TPRT unterzogen werden können und dass TPRT-Produkte in eukaryontischen Zellen Editing induzieren.
Ein weiteres Experiment, das dem vorangegangenen Prime-Editing-Experiment ähnelt, wurde durchgeführt. Anstatt jedoch eine Punktmutation in das Stoppcodon einzubauen, wird beim TRT-Editing eine einzelne Nukleotid-Insertion (links) oder -Deletion (rechts) eingebaut, die eine Frameshift-Mutation repariert und die Synthese von nachgeschaltetem mCherry ermöglicht (siehe 11). In beiden Experimenten wurden 3'-verlängerte gRNAs verwendet. Einzelne Kolonien aus den TRT-Transformationen wurden ausgewählt und mittels Sanger- Sequenzierung analysiert (siehe 12). Grüne Kolonien enthielten Plasmide mit der ursprünglichen DNA-Sequenz, während gelbe Kolonien die präzise Mutation enthielten, die durch die TRT-Editing-gRNA ausgestaltet wurde. Andere Punktmutationen oder Indels wurden nicht beobachtet.
Etablieren von Prime-Editing in HEK-Zellen unter Verwendung von RT-Cas9- Architekturen
Die optimierten Konstrukte aus den vorangegangenen Zielen werden für die Exprimierung in Säugetieren und das Editing an Zielstellen im humanen Genom angepasst. Es werden mehrere RT-Enzyme und Fusionsarchitekturen getestet, zusätzlich zum benachbarten Targeting mit sekundären gRNAs (trunkiert, um Nicking zu verhindern). Die nicht-kovalente RT-Rekrutierung wird auch unter Verwendung des Sun-Tag-Systems⁵² und des MS2-Aptamer- Systems⁵³ bewertet. Indel-Bildungstests werden zur Bewertung der Targeting-Effizienz mit Standard-gRNAs und RT-Cas9-Fusionen (wie oben) verwendet. Anschließend werden für jede genomische Stelle verlängerte gRNAs und RT-Cas9-Paare auf das Editing einzelner Nukleotide getestet. Die Editing-Ergebnisse werden mit MiSeq ausgewertet.
Erste Experimente in HEK-Zellen wurden mit Cas9-RT-Fusionen ausgeführt. Für das Editing durch Komponenten, die in Zellen exprimiert werden, sind eine Cas9(H840A)- Nickase, eine reverse Transkriptase (als Fusion exprimiert oder in trans zugeführt) und eine konstruierte gRNA mit einer 3'-Verlängerung erforderlich (siehe 14). Vorläufige Studien deuteten darauf hin, dass die Länge der Primer-Bindungsstelle innerhalb der gRNA- Verlängerung für die Steigerung der Editing-Effizienz in humanen Zellen wichtig war (siehe 15).
Optimieren der Parameter für das Prime-Editing in HEK-Zellen
Nach dem Identifizieren von Cas9-RT-Architekturen, die Prime-Editing in Zellen ausführen können, werden die Komponenten und die Ausgestaltung optimiert, um ein hocheffizientes Editing zu erreichen. Der Ort und die Nukleotid-Identität der kodierten Punktmutation sowie die Gesamtlänge des neu synthetisierten DNA-Strangs werden variiert, um den Umfang des Editing und mögliche Einschränkungen zu bewerten. Kurze Insertions- und Deletionsmutationen werden ebenfalls untersucht. Die Konstrukte für die Proteinexprimierung werden kodonoptimiert. Im Erfolgsfall würde dies zu einem effizienten Prime-Editing in Säugetierzellen führen.
Vorläufiges Ergebnis. Es wurden zusätzliche gRNAs ausgestaltet, um das RT-Enzym auf eine höhere lokale Konzentration am Editing-Locus zu bringen, falls eine intramolekulare reverse Transkription durch das fusionierte RT-Enzym nicht möglich wäre. Diese Hilfs-Guides sind am 5'-Ende (14-15-nt-Spacer) trunkiert, von dem zuvor gezeigt wurde, dass es das Schneiden durch Cas9 verhindert, aber die Bindung aufrechterhält (siehe 16). Der HEK3- Locus wurde ausgewählt, um diese Strategie zu erforschen.
Potenzielle Schwierigkeiten und Alternativen
1) gRNA-FIGau in Zellen: Wenn verlängerte gRNA-Termini in Zellen trunkiert werden, könnten stabilisierende Sekundärstrukturen eingebaut oder synthetische gRNAs mit stabilisierenden Modifikationen getestet werden. (2) Kein beobachtetes Editing in humanen Zellen: Es werden zusätzliche Strategien erforscht, die eine sekundäre Ausrichtung von RT- Cas9-Fusionen auf benachbarte genomische Stellen beinhalten⁵⁴. Darüber hinaus könnten potenzielle Strategien der gerichteten Evolution in E. Coli oder S. Cerevisiae erforscht werden.
Signifikanz
Wenn Prime-Editing in experimentellen Zelllinien etabliert werden könnte, hätte dies unmittelbare Auswirkungen auf die biomedizinische Grundlagenforschung, da es die rasche Erzeugung und Charakterisierung einer großen Anzahl von Punktmutationen in humanen Genen ermöglichen würde. Die Allgemeingültigkeit des Verfahrens und sein orthogonales Editing-Fenster in Bezug auf die Editoren von Basen würde einen Ansatz zum Einbau vieler derzeit unzugänglicher Mutationen bereitstellen. Wenn das Prime-Editing für eine hohe Effizienz und Produktreinheit optimiert werden könnte, wäre seine potenzielle Anwendbarkeit für die Korrektur von Krankheitsmutationen in anderen humanen Zelltypen von Bedeutung.
3. Erreichen von stellenspezifischem Editing pathogener Mutationen in kultivierten humanen Zellen.
Hintergrund und Argumentation.
Eine große Anzahl pathogener Mutationen kann von den derzeitigen Editoren nicht korrigiert werden, da PAM-Beschränkungen bestehen oder eine Korrektur von Transversionen oder Indel-Mutationen erforderlich ist. Mit Prime-Editing sind theoretisch alle Transitionen und Transversionen möglich, ebenso wie kleine Insertionen und Deletionen. Außerdem unterscheidet sich das Prime-Editing-Fenster (voraussichtlich -3 bis +4) in Bezug auf die PAM von dem der Basen-Editoren (-18 bis -12) (13). Mendelsche Erkrankungen, die derzeit nicht durch Editoren korrigiert werden können, beinhalten: (1) die Sichelzellenkrankheit Glu6Val-Gründermutation in Hämoglobin beta (erfordert eine A·T-T·A-Transversion); (2) die häufigste Variante der Wilson-Krankheit His1069G1n in ATP7B (erfordert eine G·C-T·A- Transversion); und (3) die ΔPhe508-Mutation in CFTR, die zystische Fibrose verursacht (erfordert eine 3-Nukleotid-Insertion). Jedes dieser Ziele enthält eine entsprechend positionierte PAM für SpCas9-Targeting und Prime-Editing.
Vorläufige Ergebnisse.
• Das T-zu-A-Editing in HEK3-Zellen ist nicht durch das aktuelle Basen-Editing erreichbar, aber erreichbar durch das TRPT-Editing (siehe FIG. 17A-17C).
17A zeigt einen Graph, der die prozentuale Umwandlung von T zu A am Zielnukleotid nach Transfektion von Komponenten in humanen embryonalen Nieren(HEK)- Zellen darstellt. Diese Daten zeigen Ergebnisse unter Verwendung einer N-terminalen Fusion von reverser Transkriptase des Wildtyps von MLV mit Cas9(H840A)-Nickase (32- Aminosäure-Linker). Die Editing-Effizienz wurde drastisch verbessert, wenn die Länge der Primer-Bindungsstelle von 7 Nukleotiden auf 11 oder 12 Nukleotide verlängert wird. Darüber hinaus verbessert der Hilfs-Guide A, der unmittelbar vor dem Editing-Locus angeordnet ist (siehe 16), die Editing-Aktivität erheblich, insbesondere für Primer-Bindungsstellen kürzerer Länge. Die Editing-Effizienz wurde durch Amplikon-Sequenzierung mit der Illumina MiSeq-Plattform quantifiziert. 17B zeigt ebenfalls die prozentuale Umwandlung von T zu A am Zielnukleotid nach der Transfektion von Komponenten in humanen embryonalen Nieren(HEK)-Zellen, wobei diese Daten jedoch Ergebnisse unter Verwendung einer C- terminalen Fusion des RT-Enzyms zeigen. In diesem Fall weist der Hilfs-Guide A keine so große Wirkung auf, und die Editing-Effizienz ist insgesamt höher. 17C zeigt Daten, die Ergebnisse unter Verwendung einer N-terminalen Fusion von reverser Transkriptase des Wildtyps von MLV mit Cas9(H840A)-Nickase ähnlich der in 17A darstellen; allerdings ist der Linker zwischen der MLV-RT und Cas9 60 Aminosäuren lang statt 32 Aminosäuren.
• Das T-zu-A-Editing an der HEK3-Stelle durch TRPT-Editing ergibt eine hohe Reinheit
18 zeigt die Ausgabe der Sequenzierungsanalyse durch Hochdurchsatz- Amplikon-Sequenzierung. Die Ausgabe zeigt die am häufigsten vorkommenden Genotypen der editierten Zellen. Bemerkenswert ist, dass keine größeren Indel-Produkte erhalten werden und die gewünschte Punktmutation (T zu A) sauber und ohne Bystander-Editings eingebaut wird. Die erste Sequenz zeigt den Referenzgenotyp. Die beiden oberen Produkte sind der Ausgangsgenotyp, der einen endogenen Polymorphismus (G oder A) enthält. Die beiden unteren Produkte stellen die korrekt editierten Genotypen dar.
• MLV-RT-Mutanten verbessern das Editing.
Die mutante reverse Transkriptase, die in Baranauskas et al. (doi:10.1093/protein/gzs034) beschrieben ist, wurde als C-terminale Fusion mit der Cas9(H840A)-Nickase für das Editing von Zielnukleotiden in humanen embryonalen Nieren(HEK)-Zellen getestet. Das Cas9-RT-Editor-Plasmid wurde mit einem Plasmid co- transfiziert, das für eine 3'-Prime-Editing Leit-RNA kodiert, die die reverse Transkription kodiert. Die Editing-Effizienz am Zielnukleotid (blaue Balken) wird neben den Indel-Raten (orangefarbene Balken) in 19 gezeigt. WT bezieht sich auf das Wildtyp-MLV-RT- Enzym. Die mutierten Enzyme (M1 bis M4) enthalten die rechts aufgeführten Mutationen. Die Editing-Raten wurden durch Hochdurchsatz-Sequenzierung von genomischen DNA- Amplikonen quantifiziert.
Komplementäres Strang-Nicking mit einer zweiten gRNA verbessert das Editing.
In diesem Experiment wird die Editing-Effizienz des Zielnukleotids bewertet, wenn ein einzelsträngiges Nicking in den komplementären DNA-Strang in der Nähe des Zielnukleotids eingeführt wird, wobei die Hypothese lautet, dass dies die Diskrepanzreparatur dazu veranlasst, das ursprüngliche Nukleotid bevorzugt zu entfernen und das Basenpaar in den gewünschten Edit umzuwandeln. Das Cas9(H840A)-RT-Editing-Konstrukt wurde mit zwei Leit-RNA kodierenden Plasmiden co-transfiziert, von denen eines die reverse Transkription kodiert, während das andere den komplementären DNA-Strang für das Nicking kodiert. Es wurde Nicking in verschiedenen Abständen vom Zielnukleotid getestet (orangefarbene Dreiecke) (siehe 20). Die Editing-Effizienz am Zielbasenpaar (blaue Balken) ist zusammen mit der Indel-Bildungsrate (orangefarbene Balken) dargestellt. Das „Null“-Beispiel enthält keine Leit- RNA mit komplementärem Nicking. Die Editing-Raten wurden durch Hochdurchsatz- Sequenzierung von genomischen DNA-Amplikonen quantifiziert.
21 zeigt verarbeitete Hochdurchsatz-Sequenzierungsdaten, die die gewünschte T- zu-A-Transversionsmutation und das generelle Fehlen anderer wichtiger Nebenprodukte des Genom-Editing zeigen.
Anwendungsbereich. Der mögliche Anwendungsbereich der neuen Editing- Technologie ist in 13 dargestellt und wird mit Deaminase-vermittelten Editoren- Technologien für Basen verglichen. Bisherige Editoren zielen auf eine Region ~15 ± 2 bp stromaufwärts der PAM ab. Durch die Umwandlung der Zielnukleotide C oder A zu T bzw. G ermöglichen die bisher entwickelten Basen-Editoren alle Übergangsmutationen (Umwandlung von A:T zu G:C). Die bisher entwickelten Basen-Editoren sind jedoch nicht in der Lage, Transversionsmutationen (A zu T, A zu C, G zu T, G zu C, T zu A, T zu G, C zu A, C zu G) einzubauen. Wenn sich außerdem mehrere Zielnukleotide im Editing-Fenster befinden, kann es zu zusätzlichen unerwünschten Edits kommen.
Mit der neuen Prime-Editing-Technologie könnten theoretisch alle Nukleotid- und Basenpaarumwandlungen und möglicherweise auch kleine Insertions- und Deletions-Edits vorgenommen werden. In Bezug auf die PAM beginnen die Prime-Editing-Fenster an der Stelle des DNA-Nickings (3 Basen stromaufwärts der PAM) und enden an einer noch unbestimmten Position stromabwärts der PAM. Dieses Editing-Fenster unterscheidet sich übrigens von dem der Deaminase-Editoren. Da das TPRT-System das Editing mithilfe von DNA-Polymerase- Enzymen ausführt, weist es potenziell alle ihre Vorteile auf, einschließlich Allgemeinheit, Präzision und Verlässlichkeit.
Korrigieren pathogener Mutationen in von Patienten stammenden Zelllinien.
Zelllinien mit den entsprechenden Mutationen (Sichelzellenkrankheit: CD34+ hämatopoetische Stammzellen; Morbus Wilson: kultivierte Fibroblasten; zystische Fibrose: kultivierte Bronchialepithelien) werden von ATCC, der Coriell Biobank oder kooperierenden Harvard/Broad-Partnerlabors bezogen. Die Editing-Effizienz wird durch Hochdurchsatz- Sequenzierung bewertet, und die Wirksamkeit des korrigierten Genotyps wird mit phänotypischen Tests (Hämoglobin-HPLC, ATP7B-Immunfärbung und CFTR- Membranpotenzial-Tests) getestet.
Charakterisieren der Off-Target-Editing-Aktivität.
Potenzielles Off-Target-Editing wird mit etablierten Verfahren wie GUIDE-seq⁵⁵ und CIRCLE-seq⁵⁶ unter Verwendung von Ziel-gRNAs gepaart mit Wildtyp-Cas9 untersucht. Wenn potenzielle Off-Targets identifiziert werden, werden diese Loci in TPRT-editierten Zellen untersucht, um echte Off-Target-Editing-Ereignisse zu identifizieren.
Potenzielle Schwierigkeiten und Alternativen.
(1) Geringe Editing-Effizienz: Prime-Editoren (PE) müssen möglicherweise für jedes Ziel optimiert werden. In diesem Fall können gRNA-Bibliotheken getestet werden, um die am besten funktionierenden Varianten für bestimmte Anwendungen zu ermitteln. Die Exprimierung der RT-Cas-Fusion und die Nuklearlokalisierung können optimiert werden. Liposomale RNP können eingesetzt werden, um Off-Target Editing zu begrenzen.
Kommende Experimente.
Die Optimierung der gRNA-Ausgestaltungen kann durch die weitere Erforschung der Länge der Primer-Bindungsstelle und der Verlängerung des Synthese-Templats erreicht werden. Die Tests werden verschiedene Nukleotidumwandlungen, kleine Insertionen und Deletionen sowie verschiedene Editing-Positionen in Bezug auf PAM und mehrere Stellen im humanen Genom beinhalten. Die Optimierung der RT-Komponente beinhaltet die Erforschung von Mutationen in der MLV-RT zur Steigerung der Aktivität (Inaktivierung von Rnase H, Erhöhung der Bindungsaffinität zwischen Primer und Templat, Anpassungen der Prozessivität) sowie von neuen RT-Enzymen (Intro-RTs der Gruppe II, andere retrovirale RTs).
Signifikanz
Unzählige genetische Erkrankungen sind auf Veränderungen einzelner Nukleotide in einzelnen Genen zurückzuführen. Die Entwicklung der hier beschriebenen Genom-Editing- Technologie und ihre Anwendung in krankheitsrelevanten Zelltypen würde eine Grundlage für die Umsetzung in die Klinik schaffen. Bei einigen Krankheiten wie der Sichelzellkrankheit stellt eine einzelne Punktmutation den in der gesamten Bevölkerung domanten Genotyp dar. Bei vielen anderen genetischen Erkrankungen wird jedoch in der gesamten Patientenpopulation eine große Heterogenität verschiedener Punktmutationen innerhalb eines einzigen Gens beobachtet, von denen jede zu einem ähnlichen Krankheitsphänotyp führt. Als allgemeines Verfahren des Genom-Editing, das theoretisch eine große Zahl solcher Mutationen angreifen könnte, könnte diese Technologie daher einen enormen potenziellen Nutzen für viele dieser Patienten und ihre Familien bereitstellen. Wenn der Grundsatzbeweis für diese Anwendungen in Zellen erbracht werden könnte, würde dies die Grundlage für Studien an Tiermodellen für Krankheiten bilden.
Vorteile
Präzision: der gewünschte Edit wird gezielt in der Sequenz der Nukleinsäure kodiert. Allgemeingültigkeit: Theoretisch können alle Basenpaarumwandlungen, einschließlich Transversions-Edits, sowie kleine Insertionen oder Deletionen vorgenommen werden. Es gibt ein eindeutiges Editing-Fenster, das sich von dem der Basen-Editoren in Bezug auf die Cas9- Protospacer-Attachment-Motiv(PAM) -Sequenz unterscheidet. Mit diesem Verfahren werden viele der Editing-Funktionen von HDR (homology-directed repair) erreicht, jedoch ohne die großen Einschränkungen von HDR (ineffizient bei den meisten Zelltypen und in der Regel mit einem Übermaß an unerwünschten Nebenprodukten wie etwa Indels verbunden). Außerdem werden keine doppelsträngigen DNA-Brüche (DSBs) erzeugt, so dass nur wenige Indels, Translokationen, große Deletionen, p53-Aktivierungen usw. Auftreten.
BEISPIEL 3 - PEPTID-TAGGING MITHILFE VON PE
Die hierin beschriebenen Prime-Editing-Systeme (d. H. PE-Systeme) können auch verwendet werden, um verschiedene Peptid-Tags in proteincodierende Gene einzuführen. Solche Tags können HEXAhistidin-Tags, FLAG-Tags, V5-Tags, GCN4-Tags, HA-Tags, Myc- Tags und andere beinhalten. Dieser Ansatz kann für Anwendungen wie Protein- Fluoreszenzmarkierung, Immunpräzipitation, Immunblotting, Immunhistochemie, Proteinrekrutierung, induzierbare Protein-Degrons und genomweites Screening nützlich sein. Ausführungsformen sind in 25 und 26 dargestellt.
25 zeigt schematisch die gRNA-Ausgestaltung für das Peptid-Tagging von Genen an endogenen genomischen Loci und das Peptid-Tagging mit TPRT-Genom-Editing (d. H. Prime-Editing). Die FlAsH- und ReAsH-Tagging-Systeme umfassen zwei Teile: (1) eine fluorophor-biarsenische Sonde und (2) ein genetisch kodiertes Peptid, das ein Tetracystein- Motiv enthält, z. B. Die Sequenz FLNCCPGCCMEP (SEQ-ID-NR: 1). Wenn sie in Zellen exprimiert werden, können Proteine, die das Tetracystein-Motiv enthalten, mit fluoreszierenden Sonden markiert werden (siehe Ref: J. Am. Chem. Soc., 2002, 124 (21), S. 6063-6076. DOI: 10.1021/ja017687n). Beim „Sortagging“-System (werden bakterielle Sortase-Enzyme eingesetzt, die markierte Peptidsonden kovalent an Proteine konjugieren, die geeignete Peptidsubstrate enthalten (siehe Ref: Nat. Chem. Biol. 2007 Nov;3(11):707-8. DOI: 10.1038/nchembio.2007.31). Das FLAG-Tag (DYKDDDDK (SEQ-ID-NR: 2)), V5-Tag (GKPIPNPLLGLDST (SEQ-ID-NR: 3)), GCN4-Tag (EELLSKNYHLENEVARLKK (SEQ- ID-NR: 4)), HA-Tag (YPYDVPDYA (SEQ-ID-NR: 5)), und Myc-Tag (EQKLISEEDL (SEQ- ID-NR: 6)) werden üblicherweise als Epitop-Tags für Immuntests verwendet. Die pi-Klemme kodiert eine Peptidsequenz (FCPF) (SEQ-ID-NR: 622), die mit einem pentafluoroaromatischen Substrat markiert werden kann (Ref: Nat. Chem. 2016 Feb;8(2):120-8. Doi: 10.1038/nchem.2413).
26 zeigt den präzisen Einbau eines His6-Tags und eines FLAG-Tags in genomische DNA. Eine Leit-RNA, die auf den HEK3 Locus abzielt, wurde mit einem Templat für die reverse Transkription ausgestaltet, das entweder eine 18-nt-His-Tag-Insertion oder eine 24-nt-FLAG-Tag-Insertion kodiert. Die Editing-Effizienz in transfizierten HEK-Zellen wurde mithilfe der Amplikon-Sequenzierung bewertet. Man beachte, dass die vollständige 24-nt- Sequenz des FLAG-Tags außerhalb des sichtbaren Frames liegt (die Sequenzierung bestätigte die vollständige und präzise Insertion).
BEISPIEL 4 - RNA-TAGGING UND MANIPULATION MITHILFE VON PE
Hierin wird ein neues Verfahren zum Einfügen von Motiven in genetische Sequenzen beschrieben, die RNA in Säugetier-, eukaryontischen und bakteriellen Zellen markieren oder anderweitig manipulieren. Obgleich schätzungsweise nur 1 % des humanen Genoms für Proteine kodiert, wird praktisch das gesamte Genom auf irgendeiner Ebene transkribiert. Es ist eine offene Frage, wie viel der daraus resultierenden nicht-kodierenden RNA (ncRNA) eine funktionelle Rolle spielt, geschweige denn, welche Aufgaben die meisten dieser mutmaßlichen RNAs haben. Das „Tagging“ dieser RNA-Moleküle durch das Einfügen einer neuartigen RNAkodierenden Sequenz mit einer nützlichen Eigenschaft in Gene von Interesse ist ein nützliches Verfahren zur Untersuchung der biologischen Funktionen von RNA-Molekülen in Zellen. Es kann auch nützlich sein, Tags an Protein-kodierende mRNAs anzubringen, um zu verstehen, wie sich Modifikationen der mRNA auf die Zellfunktionen auswirken können. So wird beispielsweise ein allgegenwärtiges natürliches RNA-Tag - die Polyadenylierung - von Zellen verwendet, um den Transport von mRNA in das Zytoplasma zu beeinflussen. Verschiedene Arten von Polyadenylierungssignalen führen zu unterschiedlichen Transportraten und unterschiedlichen Lebensdauern der mRNA und damit zu Unterschieden in der Exprimierung des kodierten Proteins.
Ein gängiger Ansatz für das Exprimieren von markierten RNAs in Zellen ist die exogene Einführung eines synthetischen Konstrukts, entweder durch (i) transiente Plasmid- Transfektion, die einen kurzfristigen Ausbruch von Genexprimierung erzeugt, oft auf supraphysiologischem Niveau; oder (ii) permanente Integration des markierten RNA-Gens in das Genom (an zufälligen Stellen) durch lentivirale Integration oder Transposons, was eine verlängerte Exprimierung ermöglicht. Beide Ansätze sind durch die Erzeugung veränderter Exprimierungsniveaus und durch das Fehlen natürlicher Mechanismen zur Regulierung der Exprimierung oder Aktivität des Gens begrenzt. Eine alternative Strategie besteht darin, ein gewünschtes Gen direkt an seinem endogenen Locus zu markieren, indem man die durch Cas9 oder andere gezielte DNA-Nukleasen induzierten doppelsträngigen DNA-Brüche mithilfe der homologiegeleiteten Reparatur (HDR) repariert. Während dieser Ansatz die Erzeugung eines breiten Spektrums von endogen markierten Genen ermöglicht, ist HDR ausgesprochen ineffizient und erfordert daher ein umfangreiches Screening, um die gewünschte klonale Zellpopulation zu identifizieren, die erfolgreich markiert ist. Darüber hinaus ist HDR bei einer Vielzahl von Zelltypen, insbesondere bei post-mitotischen Zellen, in der Regel sehr ineffizient oder völlig inaktiv. Die geringe Effizienz der HDR wird ferner durch die Erzeugung unerwünschter Indel-Produkte erschwert, was im Falle von RNA-Genen besonders problematisch sein könnte, da sie zur Produktion einer RNA führen könnten, deren Aktivitäten die Funktion normaler Allele beeinträchtigen. Schließlich müssen Forscher häufig verschiedene Tagging-Positionen innerhalb eines RNA-Moleküls untersuchen, um eine optimale Leistung zu erzielen. Zusammengenommen machen diese Nachteile HDR zu einem weniger wünschenswerten Verfahren für den Einbau von Tags in RNA.
Prime-Editing ist eine neue Genom-Editing-Technologie, die das gezielte Editieren genomischer Loci durch die Übertragung genetischer Informationen von RNA auf DNA ermöglicht. Beim Prime-Editing können RNA-Gene mit einer Vielzahl von Komponenten wie RNA-Aptameren, Ribozymen oder anderen RNA-Motiven markiert werden. Prime-Editing weist im Vergleich zu HDR-Strategien das Potenzial auf, schneller, kostengünstiger und bei einer größeren Anzahl von Zelltypen wirksam zu sein. Damit stellt die beschriebene Erfindung ein neuartiges, nützliches und nicht-offensichtliches Werkzeug zur Erforschung der Biologie von RNA-Genen in Gesundheit und Krankheit dar. Hierin wird ein neues Verfahren zum Einfügen von RNA-Motiven in genetische Sequenzen beschrieben, die RNA markieren oder anderweitig manipulieren, indem Prime-Editoren (Pes) verwendet werden. Pes sind in der Lage, mehrere Nukleotide an einem gewünschten genomischen Locus, der von einem CRISPR/Cas-System anvisiert werden kann, stellenspezifisch einzufügen, zu mutieren und/oder zu deletieren. Pes bestehen aus Fusionen zwischen Cas9-Nuklease-Domänen und Reversen Transkriptase-Domänen. Sie werden mithilfe von PEgRNAs (Prime-Editing-Leit- RNAs), die einen Spacer-Abschnitt für das DNA-Targeting sowie ein Templat für die reverse Transkription enthalten, die das gewünschte Genom-Editing kodiert, zu ihrem genomischen Ziel geführt (siehe 28A). Es ist vorgesehen, dass PE verwendet werden, um Motive einzufügen, die auf RNA-Ebene funktionell sind (im Folgenden RNA-Motive), um nichtkodierende RNAs oder mRNAs zu markieren oder anderweitig zu manipulieren. Diese Motive könnten dazu dienen, die Genexprimierung zu erhöhen, die Genexprimierung zu verringern, das Spleißen zu verändern, die posttranskriptionelle Modifikation zu verändern, die subzelluläre Lage der RNA zu beeinflussen, die Isolierung oder Bestimmung der intra- oder extrazellulären Lage der RNA zu ermöglichen (z. B. Durch Verwendung fluoreszierender RNA-Aptamere wie Spinat, Spinat2, Baby-Spinat oder Brokkoli), endogene oder exogene Protein- oder RNA-Binder zu rekrutieren, sgRNAs einzuführen oder die Verarbeitung der RNA entweder durch Selbstspaltung oder RNAsen zu induzieren (siehe 28B). Aufgrund der Flexibilität des Prime-Editing ist es nicht möglich, eine umfassende Liste von RNA- Motiven bereitzustellen, die im Genom eingebaut werden können. Es werden hier eine Reihe von Beispielen gezeigt, die den voraussichtlichen Umfang der PE-eingebauten RNA-Motive veranschaulichen, die verwendet werden könnten, um RNA-Gene zu markieren. Derzeit ist es nicht möglich, diese Veränderungen in den meisten Zelltypen (einschließlich der vielen, die HDR nicht unterstützen) mit einem anderen Verfahren des Genom-Editings als PE effizient und relativ sauber durchzuführen.
Die Genexprimierung könnte durch das Kodieren einer 3' untranslatierten Region (UTR) beeinflusst werden, was zu Veränderungen des Nukleartransports, der Retention oder der Lebensdauer der mRNA führt. So weist beispielsweise der PolyA-Schwanz des Polyomavirus Simian Virus 40 (SV40) zusätzliche Hilfssequenzen auf, die eine effiziente Transkriptionstermination ermöglichen und die Genexprimierung im Vergleich zu anderen 3' UTRs^{57, 58} steigern können. Beispielhafte Sequenz des SV40-PolyA-Schwanzes von:

SV40- POLYA- SCHWANZ
Neben Polyadenylierungssignalen können auch posttranslationale Modifikationssignale durch PE kodiert werden. Diese beinhalten Signale, die N6- Methyladenosin-, N1-Methyladenosin-, 5-Methylcytosin- und Pseudouridin-Modifikationen einschließen⁵⁹. Durch die Verwendung von PE, das Sequenzen beinhaltet, die von Enzymen gebunden werden, die diese Modifikationen in ein RNA-Transkript schreiben oder entfernen, wäre es möglich, deren Schreiben oder Löschen zu veranlassen. Dies könnte als Instrument verwendet werden, um die Auswirkungen dieser Marker zu untersuchen, die Zelldifferenzierung zu induzieren, die Stressreaktionen zu beeinflussen oder, da die Funktion dieser Marker noch nicht erforscht ist, die Zielzellen auf andere Weise zu beeinflussen.
PE könnte Mutationen kodieren, die die subzelluläre Lokalisierung beeinflussen. Beispielsweise kann der Einbau von tRNA-Lys in eine mRNA theoretisch zu einem Transport in die Mitochondrien führen⁶⁰, während verschiedene 3'-UTRs zu Retention oder Transport im Kern führen können⁶¹.
Beispiele:
Das SV40-PolyA-Signal führt zum Transport.

SV40- POLYA- SCHWANZ
U1 snRNA 3'-Box führt zu Retention.

U1 SNRNA 3'-BOX
Das Bestimmen der subzellulären Lokalisierung endogener RNA kann eine Herausforderung sein und erfordert die Zugabe exogener, fluoreszenzmarkierter Nukleotidsonden, wie im Falle von FISH, oder eine zeitaufwändige und möglicherweise ungenaue Zellfraktionierung mit anschließender RNA-Erkennung. Das Kodieren einer Sonde in der endogenen RNA würde viele dieser Probleme ausräumen. Ein Beispiel wäre die Kodierung eines fluoreszierenden RNA-Aptamers wie Spinat⁶² oder Brokkoli in einer endogenen RNA, wodurch das Vorhandensein dieser RNA durch Zugabe eines niedermolekularen Proto-Fluorophors sichtbar gemacht würde.
Brokkoli-Aptamer:

BROKKOLI- APTAMER
PE könnte Sequenzen einfügen oder entfernen, die RNA kodieren, die von RNAbindenden Proteinen erkannt werden, was sich auf die Stabilität, Exprimierung, Lokalisierung oder Modifikation der RNA auswirkt (siehe z. B. die aufgeführten Proteine⁶³).
PE könnte Sequenzen, die sgRNAs kodieren, in das Genom einfügen, um Viren oder Krebs zu bekämpfen. In ähnlicher Weise könnte sie zum Einfügen von microRNAs (z. B. premicroRNAs) verwendet werden, um gezielte Gene zum Schweigen zu bringen.
PE könnte Sequenzen einfügen, die zu einer Verarbeitung der RNA führen, entweder durch sich selbst oder durch externe Faktoren, entweder als Therapie oder als Werkzeug zur Untersuchung der Funktion verschiedener Abschnitte der RNA. Beispielsweise führt das HDV-Ribozym⁶⁴, wenn es in einer RNA-Sequenz enthalten ist, zu einer Verarbeitung der RNA unmittelbar 5' vom Ribozym, während das Hammerhead-Ribozym vor dem dritten Stamm innerhalb des Ribozyms spaltet⁶⁵. Andere selbstspaltende Ribozyme beinhalten Pistole⁶⁶, Bei1⁶⁶, Haarnadel⁶⁷, Neuropora-Varkud-Satellit⁶⁸, glmS⁶⁹, Twister⁷⁰ und Twister-Sister⁶⁶. Diese Sequenzen können Wildtypen oder manipulierte oder weiterentwickelte Versionen von Ribozymen beinhalten. Die Mehrzahl dieser Ribozyme könnte unterschiedliche Sequenzen aufweisen, je nachdem, in welche Region der RNA sie eingebaut wurden, je nachdem, wo sich die Ribozymschnittstelle befindet. Auch Sequenzen, die die Verarbeitung der RNA durch externe Faktoren lenken würden, wie sequenzspezifische RNAsen⁷¹, RNAsen, die bestimmte Strukturen erkennen⁷² - wie etwa Dicer⁷³ und Drosha⁷⁴ - könnten erreicht werden.
HDV-Ribozym:

HDV- RIBOZYM
Referenzen für Beispiel 4
Die folgenden Referenzen sind durch Bezugnahme hierin vollumfänglich aufgenommen.

1. Schek N, Cooke C, Alwine JC. Molecular and Cellular Biology. 1992.
2. Gil A, Proudfoot NJ. Cell. 1987.
3. Zhao, B.S., Roundtree, I.A., He, C. Nat Rev Mol Cell Biol. 2017.
4. Rubio, M.A.T., Hopper, A.K. Wiley Interdiscip Rev RNA 2011.
5. Shechner, D.M., Hacisuleyman E., Younger, S.T., Rinn, J.L. Nat Methods. 2015.
6. Paige, J.S., Wu, K.Y., Jaffrey, S.R. Science 2011.
7. Ray D., ... Hughes TR. Nature 2013.
8. Chadalavada, D. M., Cerrone-Szakal, A. L., Bevilacqua, P.C. RNA 2007.
9. Forster AC, Symons RH. Cell. 1987.
10. Weinberg Z, Kim PB, Chen TH, Li S, Harris KA, Lünse CE, Breaker RR. Nat. Chem. Biol. 2015.
11. Feldstein PA, Buzayan JM, Bruening G. Gene 1989.
12. Saville BJ, Collins RA. Cell. 1990.
13. Winkler WC, Nahvi A, Roth A, Collins JA, Breaker RR. Nature 2004.
14. Roth A, Weinberg Z, Chen AG, Kim PG, Ames TD, Breaker RR. Nat Chem Biol. 2013.
15. Choudhury R, Tsai YS, Dominguez D, Wang Y, Wang Z. Nat Commun. 2012.
16. MacRac IJ, Doudna JA. Curr Opin Struct Biol. 2007.
17. Bernstein F, Caudy AA, Hammond SM, Hannon GJ Nature 2001.
18. Filippov V, Solovyev V, Filippova M, Gill SS. Gene 2000.

BEISPIEL 5 - IMMUNOEPITOP-INSERTION DURCH PE
Präzise Genom-Targeting-Technologien unter Verwendung des CRISPR/Cas-Systems wurden kürzlich in einer Vielzahl von Anwendungen untersucht, einschließlich der Insertion von gentechnisch veränderten DNA-Sequenzen in gezielte genomische Loci. Zuvor wurde für diese Anwendung die homologiegerichtete Reparatur (homology-directed repair - HDR) verwendet, die ein ssDNA-Donor-Templat und eine Reparaturinitiation mittels eines doppelsträngigen DNA-Bruchs (double-stranded DNA break - DSB) erforderte. Diese Strategie bietet das breiteste Spektrum möglicher Veränderungen in Zellen und ist das einzige verfügbare Verfahren, um große DNA-Sequenzen in Säugerzellen einzufügen. HDR wird jedoch durch unerwünschte zelluläre Nebenwirkungen behindert, die von seinem initiierenden DSB herrühren, wie z. B. hohe Indel-Bildung, DNA-Translokationen, große Deletionen und P53-Aktivierung. Zusätzlich zu diesen Nachteilen ist HDR in vielen Zelltypen durch eine geringe Effizienz eingeschränkt (T-Zellen sind eine bemerkenswerte Ausnahme von dieser Beobachtung). Zu den jüngsten Bemühungen, diese Nachteile zu überwinden, gehört die Fusion humaner Rad51-Mutanten mit einer Cas9-D10A-Nickase (RDN), was zu einem DSBfreien HDR-System führt, das verbesserte HDR-Produkt:Indel-Verhältnisse und ein geringeres Off-Target-Editing aufweist, aber immer noch durch Zelltyp-Abhängigkeiten und nur bescheidene HDR-Editing-Effizienz behindert wird.
Kürzlich entwickelte Fusionen von Cas9 mit reversen Transkriptasen („Prime- Editoren“) gekoppelt mit PEgRNAs stellen eine neuartige Genom-Editing-Technologie dar, die eine Reihe von Vorteilen gegenüber bestehenden Genom-Editing-Verfahren bietet, einschließlich der Möglichkeit, jede einzelne Nukleotid-Substitution einzubauen und zu inserieren oder jeden kurzen Abschnitt von Nukleotiden (bis zu mindestens mehreren Dutzend Basen) auf stellenspezifische Weise zu löschen. Bemerkenswerterweise werden PE-Edits mit im Allgemeinen geringen Raten unbeabsichtigter Indels erreicht. So ermöglicht PE gezielte, auf Insertion basierende Editing-Anwendungen, die bisher unmöglich oder unpraktisch waren.
Die vorliegende Erfindung beschreibt ein Verfahren zur Verwendung von Prime- Editing als Mittel zum Einfügen bekannter Immunogenitätsepitope in endogene oder fremde genomische DNA, was zu einer Modifikation der entsprechenden Proteine für therapeutische oder biotechnologische Anwendungen führt (siehe 31 und 32). Vor der Erfindung des Prime-Editing konnten solche Insertionen nur ineffizient und mit hohen Informationsraten von DSBs erreicht werden. Prime-Editing löst das Problem der hohen Informationsdichte bei Insert-Edits und bietet im Allgemeinen eine höhere Effizienz als HDR. Diese niedrigere Rate der Indel-Bildung stellt einen Hauptvorteil des Prime-Editing gegenüber HDR als Verfahren für gezielte DNA-Insertionen dar, insbesondere bei der beschriebenen Anwendung der Insertion von Immunogenitätsepitopen. Die Länge der Epitope liegt im Bereich von wenigen Basen bis zu Hunderten von Basen. Prime-Editing ist die effizienteste und sauberste Technologie, um solche gezielten Insertionen in Säugetierzellen zu erreichen.
Das Schlüsselkonzept der Erfindung ist die Verwendung von Prime-Editoren, um eine Nukleotidsequenz, die zuvor beschriebene Immunogenitätsepitope enthält, in endogene oder fremde genomische DNA zur Herunterregulierung und/oder Zerstörung ihrer Proteinprodukte und/oder exprimierenden Zelltypen einzufügen. Nukleotidsequenzen für die immunogene Epitopinsertion würden auf Gene in einer Weise angesetzt werden, um Fusionsproteine des kodierten Proteins des anvisierten Gens und der entsprechenden Proteintranslation des eingefügten immunogenen Epitops zu produzieren. Das Immunsystem des Patienten wurde zuvor darauf trainiert, diese Epitope infolge einer vorherigen Standardimmunisierung aus einer routinemäßigen Impfung beispielsweise gegen Tetanus oder Diphtherie oder Masern zu erkennen. Aufgrund der immunogenen Natur der fusionierten Epitope würde erwartet, dass das Immunsystem des Patienten das prime-editierte Protein (nicht nur das eingefügte Epitop) und möglicherweise die Zellen, aus denen es exprimiert wurde, erkennt und deaktiviert.
Fusionen mit anvisierten Genen würden nach Bedarf manipuliert, um sicherzustellen, dass die Proteintranslation des eingefügten Epitops für die Erkennung des Immunsystems exponiert wird. Dies könnte gezielte Nukleotidinsertionen umfassen, die zu Proteintranslationen führen, die C-terminale Fusionen von Immunogenitätsepitopen mit anvisierten Genen, N-terminale Fusionen von Immunogenitätsepitopen mit anvisierten Genen oder die Insertion von Nukleotiden in Gene ergeben, so dass Immunogenitätsepitope innerhalb oberflächenexponierter Regionen der Proteinstruktur kodiert werden.
Protein-Linker, die als Nukleotide kodiert werden, die zwischen der Zielgensequenz und der eingefügten Immunogenitätsepitop-Nukleotidsequenz eingefügt sind, müssen möglicherweise als Teil dieser Erfindung konstruiert werden, um die Erkennung des Immunsystems, den Zelltransport, die Proteinfunktion oder die Proteinfaltung des Zielgens zu erleichtern. Diese eingefügten Nukleotid-kodierten Protein-Linker können (unter anderem) variable Längen und Sequenzen des XTEN-Linkers oder variable Längen und Sequenzen von Glycin-Serin-Linkern beinhalten. Diese konstruierten Linker wurden früher verwendet, um Proteinfusionen erfolgreich zu erleichtern.
Unterscheidungsmerkmale dieser Erfindung schließen die Fähigkeit ein, zuvor erworbene Immunantworten auf spezifische Aminosäuresequenzen als Mittel zu verwenden, um eine Immunantwort gegen ansonsten nicht immunogene Proteine zu induzieren. Ein weiteres Unterscheidungsmerkmal ist die Fähigkeit, die Nukleotidsequenzen dieser immunogenen Epitope gezielt einzufügen, so dass kein hohes Maß an unerwünschten Indels als Nebenprodukt des Editings entsteht und die Insertion effizient erfolgt. Die hierin erörterte Erfindung weist die Fähigkeit auf, zelltypspezifische Einschleusungsverfahren (wie AAV- Serotypen) zu kombinieren, um Epitope in Zelltypen einzufügen, die für die Auslösung einer Immunantwort von Interesse sind.
Prime-Editing als Mittel zum Einfügen immunogener Epitope in pathogene Gene könnte verwendet werden, um das Immunsystem des Patienten so zu programmieren, dass es eine Vielzahl von Krankheiten bekämpft (nicht beschränkt auf Krebs wie bei immunonkologischen Strategien). Eine unmittelbar relevante Anwendung dieser Technologie wäre als Krebstherapeutikum, da sie den Immunfluchtmechanismus eines Tumors untergraben könnte, indem sie eine Immunantwort auf ein relevantes Onkogen wie HER2 oder Wachstumsfaktoren wie EGFR auslöst. Ein solcher Ansatz könnte dem T-Zell-Engineering ähnlich erscheinen, aber ein neuer Fortschritt dieses Ansatzes besteht darin, dass er in vielen Zelltypen und für Krankheiten jenseits von Krebs eingesetzt werden kann, ohne dass manipulierte T-Zellen erzeugt und in Patienten eingeführt werden müssen.
Verwendung von PE zum Einfügen eines Immunogenitätsepitops, gegen das die meisten Menschen bereits geimpft sind (Tetanus, Keuchhusten, Diphtherie, Masern, Mumps, Röteln usw.) in ein fremdes oder endogenes Gen, das eine Krankheit verursacht, damit das Immunsystem des Patienten lernt, dieses Protein zu deaktivieren.
Krankheiten, die einen potenziellen therapeutischen Nutzen aus der oben genannten Strategie haben könnten, beinhalten solche, die durch Aggregation toxischer Proteine verursacht werden, wie etwa bei tödlicher familiärer Schlaflosigkeit. Andere Krankheiten, die davon profitieren könnten, beinhalten solche, die durch eine pathogene Überexprimierung eines ansonsten ungiftigen endogenen Proteins verursacht werden, und solche, die durch fremde Pathogene verursacht werden.

Zu den primären therapeutischen Indikationen gehören die oben erwähnten, wie Therapeutika für Krebs-, Prionen- und andere neurodegenerative Erkrankungen, Infektionskrankheiten und Präventivmedizin. Sekundäre therapeutische Indikationen können die vorbeugende Behandlung von Patienten mit spät einsetzenden genetischen Erkrankungen sein. Es wird erwartet, dass die aktuellen Standardmedikamente in Verbindung mit Prime- Editing bei einigen Krankheiten, wie besonders aggressiven Krebsarten, oder in Fällen verwendet werden, in denen Medikamente zur Linderung der Krankheitssymptome beitragen, bis die Krankheit vollständig geheilt ist.
Nachstehend sind Beispiele für immunogene Epitope aufgeführt, die durch Prime-Editing eingefügt werden können:

Vakzin	Erkrankung	Epitope Aminosäuresequenz	Beispielhafte Nukleinsäuresequenz (8)
1	Tetanustoxoid	QYIKANSKFIGITEL (SEQ ID NO: 396)
2	Diphtherie- Toxin-Mutante CRM 197

3	Mumps
4	Mumps

			Ausgewählte Beispiele aus der Hämagglutinin-Neuraminidase (HN)- Diversität zwischen Ausbruchsstämmen (Tabelle 1) Divergenz zwischen Impfstamm JL5 und Ausbruchsstämmen (Tabelle 2)
5	Rötelnvirus (RV)
6	Hämagglutinin
7	Neuraminidase
8	TAP (Transportantig enpräsentation) auf H5N1- Virus- Hämagglutinin
9	TAP (Transportantig enpräsentation) auf H5N1- Virus- Neuraminidase
10	Hämagglutinin -Epitope zu Klasse I HLA
11	Neuraminidase -Epitope zu Klasse I HLA
12	Hämagglutinin -Epitope zu Klasse II HLA
13	Neuraminidase -Epitope zu Klasse II HLA	YNGIITDTI (SEQ ID NO: 422)	TACAACGGCATCATCACCGACACCATC (SEQ ID NO: 423)
14	Hämagglutinin -Epitop H5N1- gebundene Klasse I und Klasse II HLA
15	Neuraminidase -Epitop H5N1- gebundene Klasse I und Klasse II HLA

Im Folgenden sind weitere Beispiele für Epitope aufgeführt, die in ein Zielgen für das Immunoepitop-Tagging integriert werden können:
Zitierte Referenzen in Beispiel 5
Die folgenden Referenzen sind durch Bezugnahme in ihrer Gesamtheit aufgenommen.

1. X. Wen, K. Wen, D. Cao, G. Li, R. W. Jones, J. Li, S. Szu, Y. Hoshino, L. Yuan, Inclusion of a universal tetanus toxoid CD4(+) T cell epitope P2 significantly enhanced the immunogenicity of recombinant rotavirus ΔVP8* subunit parenteral vaccines. Vaccine 32, 4420-4427 (2014).
2. G. Ada, D. Isaacs, Carbohydrate-protein conjugate vaccines. Clin Microbiol Infect 9, 79-85 (2003).
3. E. Malito, B. Bursulaya, C. Chen, P. L. Surdo, M. Picchianti, E. Balducci, M. Biancucci, A. Brock, F. Bern, M. J. Bottomley, M. Nissum, P. Costantino, R. Rappuoli, G. Spraggon, Structural basis for lack of toxicity of die diphtheria toxin mutant CRM197. Proceedings of the National Academy of Sciences 109, 5229 (2012).
4. J. de Wit, M. E. Emmelot, M. C. M. Poelen. J. Lanfermeijer, W. G. H. Han. C. van Els, P. Kaaijk, The Human CD4(+) T Cell Response against Mumps Virus Targets a Broadly Recognized Nucleoprotein Epitope. J Virol 93, (2019).
5. M. May, C. A. Rieder, R. J. Rowe, Emergent lineages of mumps virus suggest the need for a polyvalent vaccine. Int J Infect Dis 66, 1-4 (2018).
6. M. Ramumurthy, P. Rajendiran, N. Saravanan, S. Sankar, S. Gopalan, B. Nandagopal, Identification of immunogenic B-cell epitope peptides of rubella virus E1 glycoprotein towards development of highly specific immunoassays and/or vaccine. Conference Abstract, (2019).
7. U. S. F. Tambunan, F. R. P. Sipahutar, A. A. Parikesit, D. Kerami, Vaccine Design for H5N1 Based on B- und T-cell Epitope Predictions. Bioinform Biol Insights 10, 27-35 (2016).

BEISPIEL 6 - VERWENDUNG VON PE ZUM ERMÖGLICHEN EINER CHEMISCH INDUZIERTEN DIMERISIERUNG VON ZIELPROTEINEN IN VIVO
Die hierin beschriebenen Prime-Editoren können auch verwendet werden, um durch Dimerisierung induzierte biologische Prozesse, wie etwa die Signalisierung von Rezeptoren, unter die Kontrolle eines geeigneten niedermolekularen Medikaments zu stellen, indem Gene, die niedermolekulare Bindungsproteine kodieren, durch Prime-Editing in das Genom integriert werden. Unter Verwendung der hierin beschriebenen Prime-Editoren kann die Gensequenz, die ein niedermolekulares Bindungsprotein kodiert, in ein Gen eingefügt werden, das ein Ziel- Protein von Interesse in einer lebenden Zelle oder einem Patienten kodiert. Dieser Edit allein sollte keine physiologische Wirkung haben. Nach Verabreichung des niedermolekularen Arzneimittels, bei dem es sich in der Regel um ein dimeres niedermolekulares Molekül handelt, das gleichzeitig an zwei arzneimittelbindende Proteindomänen binden kann, von denen jede an eine Kopie des Ziel-Proteins fusioniert ist, induziert das niedermolekulare Molekül die Dimerisierung des Ziel-Proteins. Dieses Ziel-Protein-Dimerisierungsereignis induziert dann ein biologisches Signalereignis, wie beispielsweise Erythropoese oder Insulinsignalisierung.
BEISPIEL 7 - DNA-SEQUENZ-INSERTION, DELETION UND AUSTAUSCH MIT DUAL-PRIME-EDITOREN
Dieses Beispiel beschreibt die Verwendung von Multi-Flap-Prime-Editing, insbesondere unter Verwendung von Dual-Prime-Editoren, für die präzise Insertion neuer DNA-Sequenzen, die präzise Deletion endogener genomischer DNA-Sequenzen oder den Austausch einer endogenen genomischen DNA-Sequenz durch eine neue DNA-Sequenz. Siehe 90. Diese Erfindung betrifft ein seit langem bestehendes Ziel des Genom-Engineering: die programmierbare Insertion, Deletion oder den Austausch von DNA-Sequenzen in den Genomen lebender Zellen. Diese Technologie kann zum Modifizieren oder Editieren des Genoms jeder beliebigen lebenden Zelle zu Forschungs-, Therapie- oder Industriezwecken eingesetzt werden.
Bisher wurde die homologiegeleitete Reparatur (HDR) von Nuklease-induzierten DNA-Doppelstrangbrüchen (DSBs) eingesetzt, um DNA-Sequenzen in das Genom lebender Zellen einzufügen, zu löschen oder auszutauschen. Trotz ihrer Vielseitigkeit schränkt die geringe Effizienz der HDR ihre Anwendung bei vielen Säugetierzelltypen ein, insbesondere bei therapeutisch relevanten humanen Zelltypen^1-4. Darüber hinaus führt die Erzeugung von DSBs zu einer bevorzugten Reparatur durch fehleranfällige Endjoining-Mechanismen, die Insertions- und Deletions- (Indel-) Reparaturprodukte erzeugen, die anschließend nicht in die gewünschte editierte DNA-Sequenz umgewandelt werden können^5-10. Infolgedessen stellen Indels typischerweise die Mehrheit der modifizierten genomischen DNA-Produkte dar, wenn Nukleasen in Säugetierzellen verwendet werden. Außerdem können durch Nukleasen erzeugte DSBs zu unerwünschten genomischen Veränderungen wie großen Deletionen und chromosomalen Translokationen¹¹, sowie zur Aktivierung von p53^12,13 führen. Strukturelle Varianten (SVs) können auch mithilfe programmierbarer Nukleasen erzeugt oder korrigiert werden, ohne auf homologe Rekombination angewiesen zu sein, obwohl nukleasebasierte Strategien für diese Anwendungen ähnliche Nachteile aufweisen. Zum Beispiel können Dual- Cutting-Strategien verwendet werden, um eine genomische DNA-Zielsequenz zu invertieren, aber die meisten Produktallele enthalten große Deletionen zwischen den Schnittstellen anstelle der gewünschten invertierten Sequenz oder Indels an den einzelnen Schnittstellen.
Prime-Editing ist eine kürzlich vorgestellte Genom-Editing-Technologie, die die Insertion, Deletion oder den Austausch genomischer DNA-Sequenzen ermöglicht, ohne dass fehleranfällige doppelsträngige DANN-Brüche erforderlich sind¹⁴. Prime-Editing verwendet ein gentechnisch verändertes Cas9-Nickase-Reverse-Transkriptase-Fusionsprotein (PE1 oder PE2), das mit einer gentechnisch veränderten Leit-RNA (pegRNA) gepaart ist, die sowohl Cas9 zur genomischen Zielstelle leitet als auch die Informationen für die Durchführung des gewünschten Edits kodiert. Prime-Editing erfolgt in einem mehrstufigen Editing-Prozess: 1) Die Cas9-Domäne bindet an die genomische DNA-Zielstelle, die durch die Spacer-Sequenz der pegRNA spezifiziert ist, und nickt sie; 2) die Reverse-Transkriptase-Domäne verwendet die genomische DNA, die genickt wurde, als Primer, um die Synthese eines editierten DNA- Strangs einzuleiten, wobei eine konstruierte Verlängerung der pegRNA als Templat für die reverse Transkription verwendet wird - dadurch wird ein einzelsträngiger 3'-Flap erzeugt, der die editierte DNA-Sequenz enthält; 3) die zelluläre DNA-Reparatur löst das 3'-Flap- Zwischenprodukt durch die Verdrängung einer 5'-Flap-Spezies auf, die durch die Invasion des editierten 3'-Flaps, die Exzision des 5'-Flaps, der die ursprüngliche DNA-Sequenz enthält, und die Ligation des neuen 3'-Flaps erfolgt, um den editierten DNA-Strang einzubauen, wodurch ein Heteroduplex aus einem editierten und einem uneditierten Strang gebildet wird; und 4) die zelluläre DNA-Reparatur tauscht den uneditierten Strang innerhalb des Heteroduplex unter Verwendung des editierten Strangs als Templat für die Reparatur aus, wodurch der Editing- Prozess abgeschlossen wird.
Ein effizienter Einbau des gewünschten Edits erfordert, dass der neu synthetisierte 3'- Flap einen Abschnitt der Sequenz enthält, der homolog zur genomischen DNA-Stelle ist. Diese Homologie ermöglicht es dem editierten 3'-Flap, mit dem endogenen DNA-Strang (dem entsprechenden 5'-Flap) um den Einbau in den DNA-Duplex zu konkurrieren. Da der editierte 3'-Flap weniger Sequenzhomologie enthält als der endogene 5'-Flap, ist zu erwarten, dass der Wettbewerb zugunsten des 5'-Flap-Strangs ausgeht. Daher kann es sein, dass der 3'-Flap, der das Edit enthält, nicht effektiv in den 5'-Flap-Strang eindringt und ihn verdrängt. Außerdem wird bei erfolgreicher Invasion des 3'-Flaps und Entfernung des 5'-Flaps der Edit nur auf einem Strang des doppelsträngigen DNA-Genoms eingebaut. Der permanente Einbau des Edits erfordert eine zelluläre DNA-Reparatur, um den uneditierten komplementären DNA-Strang unter Verwendung des editierten Strangs als Templat auszutauschen. Zwar kann die Zelle dazu gebracht werden, den Austausch des uneditierten Strangs gegenüber dem editierten Strang zu bevorzugen (Schritt 4 oben), indem mit einer sekundären sgRNA (dem PE3-System) ein Nicking in den uneditierten Strang neben dem Edit eingeführt wird, doch ist dieser Prozess immer noch auf eine zweite Stufe der DNA-Reparatur angewiesen. Diese DNA- Reparaturschritte können besonders ineffizient für Edits sein, die eine Equilibrierung von langen 5'- und 3'-Flap-Intermediaten erfordern oder lange nicht-homologe Regionen enthalten, wie etwa lange Insertionen oder lange Deletionen.
Dieses Beispiel beschreibt ein Dual-Prime-Editing-System (oder ein Dual-Flap-Prime- Editing-System), das die Herausforderungen im Zusammenhang mit der Flap-Equilibrierung und dem anschließenden Einbau des Edits in den nicht-editierten komplementären genomischen DNA-Strang durch gleichzeitiges Editing beider DNA-Stränge angeht. Beim Dual-Flap-Prime-Editing werden zwei pegRNAs verwendet, die auf entgegengesetzte Stränge einer genomischen Stelle abzielen und die Synthese von zwei komplementären 3'-Flaps ansteuern, die die editierte DNA-Sequenz enthalten (91). Im Gegensatz zum klassischen Prime-Editing muss das Paar der editierten DNA-Stränge (3'-Flaps) nicht direkt mit den 5'- Flaps der endogenen genomischen DNA konkurrieren, da stattdessen der komplementäre editierte Strang für die Hybridisierung zur Verfügung steht. Da beide Stränge des Duplex als editierte DNA synthetisiert werden, erübrigt sich beim Dual-Flap-Prime-Editing der Austausch des nicht-editierten komplementären DNA-Strangs, der beim klassischen Prime-Editing erforderlich ist. Stattdessen muss die zelluläre DNA-Reparaturmaschinerie nur die gepaarten 5'-Flaps (ursprüngliche genomische DNA) herausschneiden und die gepaarten 3'-Flaps (editierte DNA) in den Locus ligieren. Daher müssen die neu synthetisierten DNA-Stränge keine Sequenzen enthalten, die mit der genomischen DNA homolog sind, was eine selektive Hybridisierung der neuen Stränge ermöglicht und Edits mit minimaler genomischer Homologie erleichtert. Nuklease-aktive Versionen von Prime-Editoren, die beide DNA-Stränge schneiden, könnten auch verwendet werden, um die Entfernung der ursprünglichen DNA-Sequenz zu beschleunigen.
Je nach Ausrichtung der von den Dual-Prime-Editoren erzeugten gestaffelten DNA- Nicks kann das System entweder die Sequenz zwischen den beiden Nicks durch eine neue gewünschte Sequenz austauschen (gestaffelte Ausrichtung mit 5'-Überhang) oder eine neue DNA-Sequenz mit gleichzeitiger Zielstellenduplikation einfügen (gestaffelte Ausrichtung mit 3'-Überhang). 90 zeigt eine Orientierung (5'-verschobene Nicks), bei der die Sequenz zwischen den Nicks ausgetauscht wird. Bemerkenswert ist, dass die neuen 3'-Flaps nicht über die gesamte Länge der neuen DNA-Sequenz überlappen müssen, sondern nur in einem Abschnitt der neuen Sequenz komplementär sein können. Auf diese Weise kann jeder Flap kürzer sein als die gesamte Länge der neuen DNA-Sequenz.
Dual-Flap-Prime-Editing am HEK293-Stelle 3-Locus
Dual-Flap-Prime-Editing am HEK293-Stelle 3-Locus in humanen Zellen (HEK293T) wurde verwendet, um eine hocheffiziente Einführung heterologer Sequenzen zu erreichen. Zum Beispiel erfolgte der Austausch einer 90-bp-Sequenz im Locus durch eine neue 22-bp- Sequenz, die einen 6xHis-Tag kodiert, mit mehr als 80 % Effizienz (92 Allel-Tabelle). In ähnlicher Weise wurde beim Austausch derselben 90-bp-Sequenz durch eine GFP-11- Peptidsequenz (52 bp) ein Wirkungsgrad von >60 % erzielt. Die GFP-11-Tag-Insertion wurde auch am C-Terminus des MVC-Gens mit einer Effizienz von >20 % ausgeführt, was mit einer gleichzeitigen programmierten Deletion eines Abschnitts der Myc 3' UTR Sequenz einherging.
Dual-Flap-Prime-Editing-pegRNAs
Die allgemeinen Ausgestaltungen von pegRNAs, die für Dual-Flap-Prime-Editing verwendet werden, werden in 93 gezeigt. pegRNAs, die für das Dual-Flap-Prime-Editing verwendet werden, haben eine ähnliche Ausgestaltung wie diejenigen, die für das klassische Prime-Editing verwendet werden, jedoch ist es nicht erforderlich, dass die RT-Templat-Region eine Homologie zum Ziel-Locus aufweist. Stattdessen können die beiden pegRNAs RT- Template enthalten, die die Synthese von 3'-Flaps kodieren, deren 3'-Enden zueinander komplementäre Sequenzen sind. Diese Komplementarität zwischen den 3'-Flaps fördert deren Annealing und den Austausch der endogenen DNA-Sequenz durch die beabsichtigte neue DNA-Sequenz. Dies setzt voraus, dass die 5'-Regionen der RT-Template in den beiden pegRNAs zueinander umgekehrt komplementäre Sequenzen sind, und dieser Grad der Komplementarität kann variieren (93).
Verwendung von Dual-Flap-Prime-Editing zum Einbau von Rekombinationsstellen
Dual-Flap-Prime-Editing weist viele Anwendungsmöglichkeiten auf, wie z. B. das Einbauen von Peptid-Tags, RNA-Tags, Immunoepitopen, Dimerisierungsdomänen und Rekombinase-Zielstellen.
Eine solche Anwendung ist der Einbau von Rekombinase- oder Integrase-Sequenzen an benutzerdefinierten Stellen im Genom. 94 veranschaulicht den Einbau der Bxb1 - Rekombinasesequenzen attB (38 bp) und attP (50 bp) in eine Zielregion des humanen Genoms (HEK293T-Stelle 3 oder HEK3) bei gleichzeitiger Deletion von 90 bp dazwischenliegender Sequenz zwischen den beiden Nickstellen. Verschiedene Grade der Komplementarität zwischen den 3'-Flaps ermöglichen ein erfolgreiches Editing, wobei längere Sequenzen mit Komplementarität ein günstigeres Verhältnis von gewünschten Edits zu Indels ergeben. Weitere Anwendungen des Dual-Flap-Prime-Editing beinhalten das endogene Tagging von Genen mit Peptid- oder Proteinsequenzen oder den Austausch von Exons durch neue DNA- Sequenzen, die das Potenzial aufweisen, mehrere Varianten zu ersetzen, bei denen die Mutation innerhalb der Exon-Sequenz liegt.
Mit dem Dual-Flap-Prime-Editing können eine oder zwei Rekombinasestellen an den Zielpositionen im humanen Genom eingeführt werden. Werden einzelne Rekombinasestellen eingefügt, können diese als Landeplätze für eine rekombinasevermittelte Reaktion zwischen der genomischen Rekombinasestelle und einer zweiten Rekombinasestelle innerhalb einer von außen zugeführten DNA, wie z. B. einem Plasmid, genutzt werden. Dies ermöglicht die gezielte Integration von DNA-Fracht. Werden zwei Rekombinasestellen in benachbarte DNA- Regionen eingefügt, können diese je nach Ausrichtung der Rekombinasestellen für die rekombinasevermittelte Exzision oder Inversion der dazwischenliegenden Sequenz oder für den rekombinasevermittelten Kassettenaustausch mit exogener DNA zur Integration der Fracht genutzt werden. Die Integration kompatibler Rekombinasestellen auf verschiedenen Chromosomen ermöglicht eine gezielte und gerichtete chromosomale Translokation. Mit Dual- Flap-Prime-Editing lassen sich Rekombinasestellen an einer Reihe von Loci im humanen Genom effizient einfügen (94). Die Kopplung der Integration von Rekombinasestellen durch Dual-Flap-Prime-Editing mit DNA-Rekombinase-Enzymen ist somit ein leistungsfähiger Ansatz für viele Arten von SV-Edits und die Zielintegration von DNA-Fracht.
BEISPIEL 8 - DNA-SEQUENZ-INSERTION, DELETION, INVERSION, TRANSLOKATION UND INTEGRATION UNTER VERWENDUNG VON QUADRUPLE-FLAP-PRIME-EDITING
Dieses Beispiel beschreibt die Verwendung des Multi-Flap-Prime-Editing, insbesondere des Quadruple-Flap-Prime-Editing, für die gezielte Insertion, Deletion, Duplikation und den Austausch endogener genomischer DNA-Sequenzen sowie für die gezielte Inversion genomischer DNA-Sequenzen, die gezielte chromosomale Translokation und die gezielte Integration exogener DNA. Diese Technologie weist das Potenzial auf, seit langem bestehende Ziele des Genom-Engineering in Angriff zu nehmen: den programmierbaren Einbau oder die Korrektur struktureller Varianten (im Allgemeinen definiert als eine Veränderung der genomischen Sequenz von mehr als 50 bp, häufig in Form von großen Deletionen, Insertionen/Duplikationen, Inversionen und Translokationen) und die gezielte Integration von DNA-Fracht an einer bestimmten Stelle im humanen Genom. Letzteres könnte therapeutische Strategien zur Genaugmentation und andere biotechnologische Anwendungen ermöglichen. Diese Technologie könnte potenziell zum Modifizieren oder Editieren des Genoms jeder beliebigen lebenden Zelle zu Forschungs-, Therapie- oder Industriezwecken eingesetzt werden.
Diese Erfindung beschreibt ein Multi-Flap-Prime-Editing-System, das die Herausforderungen im Zusammenhang mit der Flap-Equilibrierung und dem anschließenden Einbau des Edits in den nicht-editierten komplementären genomischen DNA-Strang durch gleichzeitiges Editing beider DNA-Stränge angeht. Es erweitert außerdem die Möglichkeiten des traditionellen Prime-Editing, indem es den neu synthetisierten 3'-Flaps erlaubt, größere Sequenzumstellungen vorzunehmen.
Es wurde ein Quadruple-Flap-Prime-Editing-Ansatz entwickelt, mit dem die gewünschten Sequenzveränderungen direkt durchgeführt werden können, ohne dass ein Rekombinase-Enzym (wie beim Dual-Flap-Prime-Editing) benötigt wird, aber mit ähnlicher Vielseitigkeit. Beim Quadruple-Flap-Prime-Editing werden den Zellen zusammen mit dem PE2-Editor vier verschiedene pegRNA-Sequenzen zugeführt. Ein Paar pegRNAs ist das Templat für die Synthese komplementärer DNA-Flaps, wie beim Dual-Flap-Prime-Editing, während das andere Paar pegRNAs das Templat für die Synthese eines orthogonalen Paares komplementärer DNA-Flaps ist. Die Lage dieser Flaps, ihre relative Ausrichtung und die Paarung der Komplementarität bestimmen, welche Art der Umlagerung stattfindet. Die Verbindungsstellen der umgelagerten DNA enthalten die von den pegRNA-templierten 3'- Flaps kodierte Sequenz, die die Ausrichtung der Umlagerung bestimmt und als nützliche DNA- Sequenz für nachgeschaltete Prozesse dienen kann. Die gezielte Inversion der genomischen Sequenz wurde mit der Quadruple-Flap-Prime-Editing-Strategie ausgeführt (95). Eine Inversion einer 2,7-kb-Sequenz am AAVS1-Locus in HEK293T-Zellen wurde mit vier pegRNAs erreicht, die Bxb1-attB- und attP-Sequenzen an den Inversionskreuzungen platzieren. Die Überprüfung der erwarteten Kreuzungen wurde mithilfe der AmplikonSequenzierung ausgeführt, die zeigte, dass die korrekten Kreuzungen die attB- oder attP- Stellen-Sequenzen in ≥90 % der Sequenzierungs-Reads enthalten (96).
Die gezielte Integration von exogenen DNA-Plasmiden wurde auch mit Quadruple- Flap-Prime-Editing erreicht. Bei diesem Ansatz zielen zwei pegRNAs auf die endogene genomische DNA-Stelle und zwei pegRNAs auf eine Region auf dem Frachtplasmid. 3'-DNA- Flaps werden sowohl auf der genomischen DNA als auch auf der Plasmid-DNA synthetisiert, so dass sowohl die Plasmid- als auch die genomische DNA durch hybridisierte 3'-Flaps überbrückt werden (97A). Die Exzision von 5'-Überhängen und die Ligation der Nicks führen zu einem integrierten Plasmidprodukt. Die Ausrichtung der Integration kann durch die Paarung von pegRNA-Sequenzen des Templats gesteuert werden.
Ein Plasmid, das für die Exprimierung eines H2B-GFP-Fusionsproteins kodiert, wurde durch Quadruple-Flap-Prime-Editing in HEK293T-Zellen am AAVS1-Locus integriert. Dies führte dazu, dass 1,6 % der Zellen eine lang anhaltende, kernlokalisierte GFP-Fluoreszenz aufwiesen, die mittels Durchflusszytometrie gemessen wurde. Die PCR einer vorhergesagten Kreuzung zeigte das erwartete Produkt, das die pegRNA-templierte BxB1-attP-Sequenz enthielt (97B).
Chromosomentranslokationen wurden auch durch Quadruple Flap-Prime-Editing ausgeführt (98A), um eine chromosomale Translokation zwischen dem MYC-Locus auf Chromosom 8 und dem TIMM44-Locus auf Chromosom 19 zu erzeugen (98B).
Dual-Flap-Prime-Editing am IDS-Locus wurde mit 12 Paaren von pegRNAs und PE2 ausgeführt. HEK293T-Zellen wurden mit PE2 und verschiedenen Paaren von pegRNAs transfiziert (z. B. in der ersten Spalte pegRNA Al_a und pegRNA B2_amit Templaten für den Einbau der attP-Stelle in Vorwärtsrichtung). Die Effizienz wurde mittels HTS gemessen. Diese Daten zeigten, dass das Dual-Flap-Editing die gewünschte Sequenz mit einer Effizienz von bis zu 80 % erfolgreich in den IDS-Locus einfügen kann (99).
Die Dual-Flap-vermittelte Duplikation wurde auch am AAVS1-Locus in 293T-Zellen ausgeführt (100A). Dual-Flap-pegRNA mit PE2 wurde verwendet, um die Duplikation der genetischen Sequenzen von AAVS1 zu induzieren (100B).
Multi-Flap-Prime-Editing, das die Translokation von MYC-CCR5 induziert, wurde ebenfalls ausgeführt (101). Die MYC-CCRS-Translokation wurde durch Quad-Flap- pegRNAs und PE2 induziert. MYC-CCR5-Translokationsereignisse wurden durch QuadrupelpegRNAs ausgelöst. Vier verschiedene Sätze von pegRNAs wurden in HEK293T-Zellen getestet. Die Translokationskreuzungsprodukte zwischen abgeleiteten chr8 und chr3 wurden mit Kreuzungsprimem amplifiziert. Der Graph zeigt den Prozentsatz der Reads, die mit den erwarteten Kreuzungsallelen ausgerichtet sind. Dies zeigt, dass Quadruple-Flap-Prime-Editing die Translokation des MYC- und des CCRS-Gens mit einer Produktreinheit von nahezu 100 % an Knotenpunkt 1 und ~50 % an Knotenpunkt 2 vermitteln kann. Ein repräsentativer Allelplot zeigt die Sequenzen, die an den erwarteten Allelsequenzen an Knotenpunkt 1 ausgerichtet sind.
Dual-Flap- und Quadruple-Flap-Prime-Editing wurden auch in anderen humanen Zelllinien ausgeführt (102A-102B). Dual-Flap-Prime-Editing wurde in vier verschiedenen humanen Zelllinien ausgeführt (102A). HEK293T- und HeLa-Zellen wurden mit dualen pegRNAs und PE2 zum Editing von drei verschiedenen genomischen Loci (IDS, MYC und TIMM44) transfiziert. U2OS- und K562-Zellen wurden mit denselben Komponenten nukleofiziert. Das Dual-Flap-Prime-Editing zeigte in allen vier humanen Zellen an den Ziel-Loci eine robuste Editing-Effizienz, insbesondere bei HEK293T- und K562- Zellen. Die zellulären Mechanismen, die Dual-Flap-Prime-Editing ermöglichen, sind in vielen humanen Zelltypen konserviert. Multi-Flap-(Quadruple-pegRNA) gerichtete Inversion einer 2,7-kb-Sequenz wurde auch am AAVS1-Locus in HeLa Zellen ausgeführt (102B).
Die Inversionseffizienz wurde auch mittels HTS am CCRS-Locus gemessen (103A-103B). Der Prozentsatz des erwarteten Inversions-Edit-Allels wurde mit HTS gemessen. Vier Quad-pegRNA-Sätze von PE2 wurden jeweils in HEK293T-Zellen transfiziert. Es wurde eine Dual-Flap-vermittelte Sequenzduplikation (~100 nt) am CCRS-Locus in HEK293T-Zellen ausgeführt (103A). Die Editing-Effizienz erreicht ~1,5 % über die HTS 300-Zyklus-Paarend-Sequenzierungsanalyse. Eine Quadruple-Flap-vermittelte Sequenzinversion (~95-117 nt) wurde ebenfalls am CCRS-Locus in HeLa-Zellen ausgeführt (103B). Die Editing-Effizienz erreicht -1,2 % über die HTS 300-Zyklus-Paarend- Sequenzierungsanalyse. Dieses Ergebnis zeigt, dass das Multi-Flap-Prime-Editing die Duplikation und Inversion am CCRS-Locus erfolgreich und präzise vermitteln kann. Die Editing-Spezifität ist hoch, wenn die anvisierte Sequenz dupliziert ist (Prozentsatz der Indels < 2 %).
Anschließend wurden HEK293T-Zellen mit den Plasmiden transfiziert, die Exo1, Fen1, Red Fluorescence-Protein (Kontrolle), DNA2, Mlh1 neg und P53-Inhibitor mit pegRNA und PE2 exprimieren (104A-104D). Die Editing-Effizienz wurde mittels HTS gemessen. Die Editing-Effizienz wurde zwischen dem Kandidaten und der RFP-Kontrolle verglichen. HEK293T-Zellen wurden auch mit den siRNA-Plasmiden und pegRNA und PE2 für jeden Ziel-Locus transfiziert (104E). Nicht-gezielte siRNA (siNT) wurde als Kontrolle verwendet. Die Editing-Effizienz wurde mittels HTS gemessen. Die Editing-Effizienz wurde für jeden Ziel-Locus zwischen siRNA-Knockdown und siNT ctrl verglichen. HEK293T-Zellen wurden mit dualen pegRNAs, PE2 und den Plasmiden transfiziert, die Exol, Fen1, Red Fluorescence-Protein (ctrl), DNA2, M1h1 neg bzw. P53-Inhibitor exprimieren. Die Editing- Effizienz wurde - mittels HTS gemessen. Die Editing-Effizienz wurde zwischen dem Kandidaten und der RFP-Kontrolle verglichen. Es zeigte sich, dass die Überexprimierung von FEN1 die Dual-Flap-Editing-Effizienz bei allen vier Ziel-Loci (MYC, TIMM44, IDS, CCR5) verbessert.
Die Dual-Flap-vermittelte Sequenzverdopplung wurde auch am AAVS1-Locus ausgeführt (105A). Durch die Verwendung von Dual-Flap-pegRNAs, die zwei einzigartige 3'-Flap-Strukturen erzeugen, wurde eine -300 bp Sequenzverdopplung am AAVS1-Locus in 293T-Zellen induziert (105B). Erwartete Allele wurden mit spezifischen Primern amplifiziert und einem HTS unterzogen. Ungefähr 94 % der Reads wurden an die erwarteten Allele mit Duplikation angeglichen. In den unbehandelten Samples wurden keine Duplikationsprodukte beobachtet.
Gezielte IDS-Genomsequenz-Inversion wurde auch mit Quadruple-Flap-Prime-Editing ausgeführt (106). Ungefähr 13 % der Patienten mit Hunter-Syndrom weisen eine Inversion der IDS-Gensequenzen auf (Bondeson et al., Human Molecular Genetics, 1995). Mit Quadruple-Flap-Prime-Editing wurde diese pathogene Inversion der etwa 40 kb großen IDS- Genomsequenz in HEK293T-Zellen induziert. Sechs Sätze vierfacher pegRNAs wurden getestet, indem HEK293T-Zellen mit den pegRNAs und PE2 transfiziert wurden. Es wurden Primer verwendet, die spezifisch die invertierten Sequenzen an der Kreuzung „ab“ und der Kreuzung „cd“ amplifizieren. Ungefähr 95 % der erwarteten Sequenzen des invertierten Allels wurden an beiden Kreuzungen mit IDS_QF1 beobachtet. Andere Sätze von pegRNAs haben ebenfalls einen hohen Wirkungsgrad der erwarteten Allelsequenzen an beiden Kreuzungen. In den unbehandelten Samples wurden keine invertierten Kreuzungsprodukte beobachtet.
Es wurde auch festgestellt, dass die Modifikation des 3'-Motivs der PegRNA die Dual- Flap-Editing-Effizienz am IDS-Locus verbessert (107). Um die Dual-Flap-Editing- Effizienz weiter zu verbessern, wurde ein Pseudoknoten-evoPreQ1-Motiv zum Schutz des 3'- Endes der PegRNA eingeführt. Beim Vergleichen der durch die unmodifizierten und die evoPreQ1-modifizierten dualen pegRNAs erzeugten Editing-Effizienz wurde eine allgemeine Steigerung der Editing-Effizienz mit modifizierten pegRNAs am Ziel-Locus IDS festgestellt. Die Verbesserung der Dual-Flap-Editing-Effizienz kann bis zum 5,3-Fachen betragen.
Referenzen Beispiele 7 und 8):

1. Rouct, P., Smih, F. & Jasin, M. Expression of a site-specific endonuclease stimulatcs [1328] homologous recombination in mammalian cells. PNAS 91, 6064-6068 (1994).
2. Heyer, W.-D., Ehmsen, K. T. & Liu, J. Regulation of homologous recombination in [1329] eukaryotes. Annu. Rev. Genet. 44, 113-139 (2010).
3. Chapman, J. R., Taylor, M. R. G. & Boulton, S. J. Playing the end game: DNA [1330] double-strand break repair pathway choice. Mol. Cell 47, 497-510 (2012).
4. Cox, D. B. T., Platt, R. J. & Zhang, F. Therapeutic genome editing: prospects and [1331] challeilges. Nature Medicine 21,121-131 (2015).
S. Rouet, P., Smih, F. & Jasin, M. Introduction of doublc-strand break;; into the genome [1332] of mouse cells by expression of a rare-cutting endonuclease. Mol Cell Biol 14, 8096-8106 (1994).
6. Bibikova, M., Golic, M., Golic, K. G. & Carroll, D. Targeted chromosomal cleavage [1333] and mutagenesis in Drosophila using zinc-finger nucleases. Genetics 161, 1169-1175 (2002).
7. Umov, F. D., Rcbar, E. J., Holmes, M. C., Zhang, H. S. & Gregory, P. D. Genome [1334] editing with cnginccred zinc finger nucleases. Nat Rev Genet 11, 636-646 (2010).
8. Mali, P. et al. RNA-guided human genome engineering via Cas9. Science 339, 823- [1335] 826 (2013).
9. Cong, L. et al. Multiplex genome engineering using CRISPR/Cas Systems. Science [1336] 339,819-823 (2013).
10.Jinek, M. et al. RNA-programmed genome editing in human cells. eLite 2, e00471 [1337] (2013).
11. Kosicki, M., Tomberg, K. & Bradley, A. Repair of double-strand breaks induced by CRISPR-Cas9 leads to large deletions and complex rearrangements. Nature Biotechnology 36. 765- [1338] 771 (2018).
12. Ihry, R. J. et al. p53 inhibits CRISPR-Cas9 engineering in human pluripotent stem [1339] cells. Nature Medicine 24, 939-946 (2018).
13. Haapanicmi, E., Botla, S., Persson, J., Schmierer, B. & Taipalc, J. CRISPR-Cas9 genome editing induces a p53-mediated DNA damage response. Nature Medicine 24. 927-930 [1340] (2018).
14. Anzalone, A. V. et al. Scarch-and-rcplace genome editing without double-strand [1341] breaks or donor DNA. Nature 576,149-157 (2019).

BEISPIEL 9 - PROGRAMMIERBARE GROSSE DNA-DELETION, AUSTAUSCH, INTEGRATION UND INVERSION MIT TWIN-PRIME-EDITING UND STELLENSPEZIFISCHEN REKOMBINASEN
Die gezielte Deletion, der Austausch, die Integration oder die Inversion von DNA- Sequenzen an bestimmten Stellen im Genom kann prinzipiell zur Erforschung oder Behandlung vieler humaner genetischer Krankheiten eingesetzt werden. Es ist jedoch nach wie vor eine Herausforderung, diese Umwandlungen von DNA-Sequenzen in einem Säugetierzellgenom präzise und effizient durchzuführen. Hierin wird das Twin-Prime-Editing (twinPE) vorgestellt, ein Verfahren für den programmierbaren Austausch oder die Entfernung von DNA-Sequenzen an endogenen humanen Genomstellen, ohne dass Doppelstrang-DNA- Brüche erforderlich sind. twinPE verwendet ein Prime-Editor (PE)-Protein und zwei Prime- Editing-Leit-RNAs (pegRNAs), die die Synthese komplementärer DNA-Flaps auf gegenüberliegenden Strängen der genomischen DNA templieren, was zum Austausch endogener DNA-Sequenzen zwischen den PE-induzierten Nickstellen durch pegRNA-kodierte Sequenzen führt. Hierin wird gezeigt, dass twinPE präzise Deletionen von bis zu 780 bp und einen präzisen Austausch genomischer DNA-Sequenzen durch neue Sequenzen von bis zu 108 bp ausführen kann. Durch die Kombination von Einzel- oder Multiplex-TwinPE mit stellenspezifischen Serin-Rekombinasen wird gezeigt, dass eine gezielte Integration von DNA- Plasmiden in Gengröße an Safe-Harbor-Loci, die AAVS1, CCR5 und ALB beinhalten, möglich ist. Ferner wird eine 39-kb-Inversion an IDS demonstriert, die zur Korrektur eines häufigen Hunter-Syndrom-Allels verwendet werden könnte. TwinPE erweitert die Möglichkeiten des Genom-Editings erheblich, ohne dass Doppelstrang-DNA-Brüche erforderlich sind, und ermöglicht in Kombination mit anderen Genom-Editing-Tools die Korrektur oder Ergänzung komplexer pathogener Allelvarianten in humanen Zellen.
Krankheitsassoziierte humangenetische Varianten entstehen durch eine Vielzahl von Sequenzveränderungen, die von Substitutionen einzelner Basenpaare bis hin zu Deletionen und Umlagerungen im Megabasenbereich reichen. Genom-Editing-Ansätze, die diese pathogenen Varianten in humane Zellen einbauen, korrigieren oder ergänzen können, weisen das Potenzial auf, das Verständnis für humangenetische Krankheiten zu verbessern und könnten zur Entwicklung neuer Therapeutika führen. In jüngster Zeit wurden mehrere Genom-Editing- Ansätze basierend auf CRISPR-Cas-Systemen für das Genom-Editing entwickelt, die Nukleasen, Basen-Editoren und Prime-Editoren beinhalten. CRISPR-Cas-Nukleasen können, wenn sie mit einer Leit-RNA verwendet werden, zur Unterbrechung von Genen durch die Erzeugung von DNA-Doppelstrangbrüchen (DSBs) verwendet werden, die zu stochastischen Indels führen. Basen-Editoren können verwendet werden, um präzise C·G-zu-T·A- oder A·T- zu-G·C-Übergangs-Basenpaar-Edits oder C·G-zu-G·C-Basenpaar-Edits einzubauen. Prime- Editoren können jedes beliebige der zwölf Basenpaar-Substitutions-Edits sowie kleine bis mittelgroße Insertionen und Deletionen präzise einbauen. Diese Strategien sind jedoch nicht direkt für umfangreichere Genom-Edits wie große Deletionen, Insertionen, Austausche oder Inversionen geeignet.
Bisher wurden gepaarte Cas9-Nuklease-Strategien für die gezielte Deletion von genomischen DNA-Sequenzen mit einer Länge von ~50 bis >100.000 Basenpaaren entwickelt. Durch Bereitstellen einer linearen Donor-DNA-Sequenz kann außerdem die gezielte Insertion neuer DNA-Sequenzen an einzelnen Schnittstellen oder zwischen gepaarten Schnittstellen durch Endjoining oder homologiegeleitete DNA-Reparaturprozesse ausgeführt werden. Obwohl sie in vielerlei Hinsicht vielseitig sind, haben die Ansätze mit einzelnen und gepaarten Nukleasen auch einige Nachteile. Erstens kann die Verwendung gepaarter Nukleasen für Deletionen mehrere On-Target-Nebenprodukte erzeugen, einschließlich der gewünschte Deletion mit Indels, Indels an einzelnen DSB-Stellen ohne die gewünschte Deletion, eine unerwünschte Inversion der DNA-Sequenz zwischen DSB-Stellen und die unbeabsichtigte Integration einer exogenen DNA-Sequenz an DSB-Stellen. Darüber hinaus ist die genaue Lage der Deletionen durch die Verfügbarkeit von PAM und die entsprechenden von der Nuklease erzeugten Schnittstellen eingeschränkt. Ähnliche Einschränkungen und Nebenprodukte gibt es beim DNA-Donor-Knock-in, das bei homologieunabhängigen Ansätzen häufig ohne Kontrolle der Sequenzausrichtung erfolgt. Schließlich kann die gleichzeitige Erzeugung mehrerer DSBs an On-Target- und Off-Target-Stellen, die mit zusätzlichen Leit-RNAs wahrscheinlicher wird, zu Genom-Modifikationen außerhalb des Ziels, chromosomalen Umlagerungen oder Chromothripsen führen. Daher bestehen bei der Anwendung von Nuklease-basierten Editing- Strategien für die Exzision, den Austausch oder die Insertion größerer DNA-Sequenzen erhebliche Herausforderungen in Bezug auf Produktkontrolle und -reinheit.
Prime-Editing hat gezeigt, dass es in der Lage ist, präzise Insertionen von bis zu ~40 bp und Deletionen von bis zu ~80 bp in humanen Zellen mit einem hohen Verhältnis von gewünschtem Produkt zu Nebenprodukt durchzuführen. Im Prinzip könnten mit Prime-Editing viele der Herausforderungen, die mit Nukleasen verbunden sind, umgangen werden, indem die Erzeugung von DSBs vermieden wird. Prime-Editing hat jedoch noch nicht gezeigt, dass es größere Insertionen und Deletionen in der Größe typischer Genkodierungssequenzen vermitteln kann, und der vermutete Mechanismus einfacher Prime-Editing-Reaktionen erschwert diese größeren DNA-Veränderungen, da lange PegRNA-Template für die reverse Transkription erforderlich sind. Stellenspezifische DNA-Rekombinase-Enzyme weisen die Fähigkeit auf, mehrere DNA-Transformationen auszuführen, einschließlich Exzision, Inversion, Integration oder Austausch großer DNA-Sequenzen. Die Umprogrammierung stellenspezifischer Rekombinasen stellt jedoch eine Herausforderung dar, die den Einsatz für Genom-Engineering- und Editing-Anwendungen erschwert.
Hierin wird die Entwicklung des Twin-Prime-Editing (twinPE) vorgestellt, das die Deletion, Substitution oder Insertion von DNA-Sequenzen an endogenen genomischen Stellen mit hoher Effizienz in humanen Zellen ermöglicht. Zusätzlich zu diesen Veränderungen wird gezeigt, dass twinPE verwendet werden kann, um eine oder mehrere Rekombinase- Erkennungsstellen mit hoher Effizienz an Zielstellen im humanen Genom zu integrieren, die anschließend als Substrate für stellenspezifische Serin-Rekombinase-Enzyme verwendet werden können, die die gezielte Integration von genetischer Fracht oder die gezielte Inversion der genomischen DNA-Sequenz ermöglichen.
Ergebnisse
Beim Prime-Editing wird ein Prime-Editor-Protein verwendet, das eine Fusion einer katalytisch beeinträchtigten Cas9-Nickase und eines Wildtyp- (PE1) oder gentechnisch veränderten (PE2) MMLV-Enzyms für die reverse Transkriptase umfasst, sowie eine Leit- RNA für das Prime-Editing (pegRNA), die sowohl die genomische Zielstelle spezifiziert als auch den gewünschten Edit kodiert. Nach der Erkennung der Zielstelle kappen PE-pegRNA- Komplexe den PAM-haltigen DNA-Strang und transkribieren das RT-Templat der pegRNA direkt in die genomische DNA, wobei der genickte Strang als Primer dient. Nach der reversen Transkription dringt der neu synthetisierte 3'-Flap in die benachbarte DNA ein, zu der er weitgehend homolog ist, und tauscht die redundante 5'-Flap-Sequenz aus. Der gegenüberliegende, nicht-editierte Strang wird dann unter Verwendung des editierten DNA- Strangs als Templat repariert. Dieser vorgeschlagene Editing-Weg bietet daher zwei Möglichkeiten, bei denen die zelluläre DNA-Reparatur den gewünschten Edit ablehnen und die DNA-Sequenz in ihre ursprüngliche Form zurückführen kann.
Es wurde vorhergesagt, dass die Umgehung potenziell ungünstiger Schritte bei der DNA-Reparatur das Prime-Editing mit erhöhter Effizienz ermöglichen und verschiedene Klassen von Genom-Edits erlauben könnte. Darüber hinaus wurde eine Twin-Prime-Editing (TwinPE)-Strategie entwickelt, bei der ein Paar pegRNAs verwendet wird, die jeweils auf den einen oder den anderen DNA-Strang abzielen und die Synthese einer 3'-Flap-DNA-Sequenz templieren, die komplementär zu der von der anderen pegRNA vorgegebenen Sequenz ist (108A). Es wurde die Hypothese aufgestellt, dass, wenn die neu synthetisierten DNA- Stränge der endogenen Zielstelle sehr unähnlich sind, die 3'-Flaps bevorzugt hybridisieren würden, um ein Zwischenprodukt zu erzeugen, das annealisierte 3'-Überhänge der neuen DNA- Sequenz und annealisierte 5'-Überhänge der ursprünglichen DNA-Sequenz aufweist (108A). Da beide editierten Stränge von Prime-Editor-Komplexen synthetisiert werden, ist es nicht erforderlich, dass edithaltige Flap-Stränge in die Zielstelle eindringen oder dass der Edit in den komplementären DNA-Strang kopiert wird. Die Exzision der ursprünglichen DNA- Sequenz (annealisierte 5'-Überhänge), das Auffüllen von Lücken durch Polymerasen und die Ligation des Nicking-Paares würden zum Austausch der endogenen Sequenz zwischen den Nickstellen durch die gepaarten 3'-Flap-Sequenzen führen (108A). Aufgrund der Flexibilität bei der Templat-Ausgestaltung kann der Edit im Prinzip eine neue DNA-Sequenz einführen, einen Abschnitt der DNA-Sequenz austauschen oder einen Abschnitt der DNA- Sequenz löschen.
Um die twinPE-Strategie zu evaluieren, wurde der HEK-Stelle-3-Locus (zuvor als HEK3 bezeichnet) in HEK293T gezielt so verändert, dass 90 bp der endogenen Sequenz durch eine 38-bp-Bxb1-attB-Ansatzsequenz ausgetauscht wurden (108B). Für jeden Protospacer wurden drei pegRNAs mit RT-Templaten ausgestaltet, die 30, 34 oder 38 nt der 38-bp-attB-Sequenz enthielten (108C). Paarweise Kombinationen dieser pegRNAs sollen 3'-Flaps mit überlappender Komplementarität im Bereich von 22 bis 38 bp erzeugen (108C). Spannenderweise wurde, als beide pegRNAs zusammen mit PE2 in einer Plasmid-DNA-Transfektion in Zellen eingebracht wurden, eine hohe Effizienz der Insertion der attB-Stelle beobachtet, wobei einige Kombinationen von pegRNAs basierend auf der Sequenzierung des Amplikons einen Wirkungsgrad von >80 % Umwandlung in das gewünschte Produkt erbrachten (108C). Eine ähnliche Strategie für die Insertion der 50- bp-Bxb1-attP-Anheftungssequenz führte zu einem Editing mit einer Effizienz von bis zu 58 % (108C). Dabei war es nicht notwendig, dass jede pegRNA die gesamte Insertionssequenz kodiert, da teilweise überlappende komplementäre Flaps den Einbau der attB- oder attP- Sequenz in voller Länge ermöglichten. Allerdings führten 3'-Flaps mit größerer Überlappung zu einer etwas höheren Editing-Effizienz und weniger Indels für die Insertion der Bxb1-attB- und attP-Sequenzen an HEK-Stelle 3.
Als Nächstes wurde twinPE getestet, um zu bestimmen, ob es die Insertion von DNA- Sequenzen unterstützen kann, die größer sind als die, die mit den Systemen PE2 oder PE3 nachgewiesen wurden. Zunächst wurde die PE3-vermittelte Insertion von Fragmenten der kodierenden Sequenz von FKBP12 mit einer Länge von 12 bis 321 bp untersucht. Bei der PE3- Insertion in den HEK-Stelle-3-Locus wurden für die kürzeren 12-bp- und 36-bp-Insertionen bescheidene Wirkungsgrade erzielt (31,8 % bzw. 17,3 %), während für die 108-bp-Insertion nur sehr wenig Produkt (0,8 %) und für die 321-bp-lnsertion kein Produkt in voller Länge beobachtet wurde (109A). Im Gegensatz dazu ermöglichte twinPE eine Insertionseffizienz von 16 % für das 108-bp-Fragment, was einer 20-fachen Verbesserung gegenüber PE3 entspricht. Darüber hinaus wurden 113-bp- und 103-bp-Insertionen, die gepaarte Bxb1-Rekombinasestellen enthielten, mit ähnlicher Effizienz (10,7 % bzw. 9,7 %) am CCRS-Locus erzielt (Daten nicht gezeigt). Diese Ergebnisse veranschaulichen das Potenzial für eine größere Sequenzinsertion mit twinPE im Vergleich zu PE3.
Eine potenzielle Anwendung der twinPE-Strategie ist der Austausch exonischer kodierender DNA-Sequenzen durch neu kodierte Sequenzen, die die Proteinsequenz beibehalten und das Potenzial aufweisen, jede Mutation zwischen den twinPE-induzierten Nickstellen zu korrigieren. Um diesen Ansatz zu testen, wurde das PAH-Gen anvisiert, dessen Mutationen die genetische Stoffwechselstörung Phenylketonurie (PKU) verursachen. Die Umkodierung von Abschnitten von Exon 4 und Exon 7 wurde in PAH von HEK293T- Wildtypzellen getestet, wo ein korrigierendes Editing nachweisbar ist. Durch das Testen verschiedener Flap-Überlappungslängen und das Hinzufügen von evoPreQ1-Motiven am 3'- Ende der pegRNAs wurde die gewünschte Sequenz-Rekodierung mit bescheidenen Effizienzen erreicht, die bis zu 9,4 % durchschnittliche Effizienz für eine 64-bp-Rekodierung in Exon 4, bis zu 22,7 % durchschnittliche Effizienz für eine 46-bp-Rekodierung in Exon 7 und bis zu 27,4 % durchschnittliche Effizienz für eine 64-bp-Rekodierung in Exon 7 erreichten (109B). Basierend auf den in der bioPKU-Datenbank verzeichneten Mutationen ermöglicht das TwinPE-Editing dieser Regionen insgesamt die Korrektur verschiedener Mutationen, die bei PKU eine Rolle spielen. Weitere untersuchte Exons konnten ebenfalls rekodiert werden, wenn auch mit geringerer Effizienz (112). Diese Ergebnisse zeigen, dass twinPE im Prinzip dazu verwendet werden könnte, mehrere Mutationen mit einem einzigen Paar pegRNAs zu korrigieren.
Neben der Insertion und dem Austausch von DNA-Sequenzen sollte twinPE auch in der Lage sein, präzise Deletion-Edits vorzunehmen. Gepaarte-Nuklease-Deletions-Strategien erzeugen Deletionen, die sich über die beiden DSB-Stellen erstrecken und somit durch die PAM-Verfügbarkeit eingeschränkt sind, und erwünschte Deletionen werden oft von unerwünschten Indel-Nebenprodukten begleitet. Im Gegensatz dazu weist twinPE das Potenzial auf, Deletionen mit größerer Flexibilität und Präzision durchzuführen, da keine DSB erzeugt werden und zusätzliche DNA-Sequenzen an den twinPE-induzierten Nickstellen eingeschrieben werden können. Um twinPE für präzise Deletionen zu bewerten, wurden drei Strategien mit gepaarten pegRNAs verglichen: eine „Single-Anker“-twinPE-Strategie, eine „Hybrid-Anker“-twinPE-Strategie und die kürzlich berichtete „PrimeDel“-Strategie (109C). Jede Strategie unterscheidet sich in der Sequenz, die in den komplementären Flaps kodiert wird, was eine flexible Positionierung der Deletion in Bezug auf die Nickstellen ermöglicht.
Mit der Single-Anker-Strategie wurden komplementäre 13-nt-Flaps verwendet, um 77 bp der Sequenz neben einer der pegRNA-induzierten Nickstellen mit einer Effizienz von 14,8 % zu löschen, und komplementäre 34-nt-Flaps wurden verwendet, um 56 bp der Sequenz mit einer Effizienz von 18,8 % präzise herauszuschneiden (109D). Unter Verwendung der Hybrid-Anker-Strategie wurden 64 bp zwischen den pegRNA-induzierten Nickstellen gelöscht, so dass das Produkt 13 bp der Sequenz 3' von jeder Nickstelle beibehält, mit einer Effizienz von 11,7 % (109D). Schließlich wurde die PrimeDel-Strategie auf die Deletion von 90 bp zwischen den pegRNA-induzierten Nickstellen getestet, was mit einer Effizienz von 40,4 % gelang (109D). Bemerkenswert ist, dass die PrimeDel-Strategie die PAM- Sequenzen auf beiden Strängen unterbricht, was wahrscheinlich die Effizienz erhöht und gleichzeitig die Zahl der Indels verringert. Die Editing-Effizienz konnte durch die Hinzufügung des evoPreQ1-Motivs am 3'-Ende der pegRNAs um das 1,5- bis 2,5-fache gesteigert werden, wenngleich dies in einigen Fällen mit einer Zunahme der Indels einherging (109D). Zusammengenommen zeigen diese Daten, dass twinPE eine Strategie zur Ausführung gezielter Deletionen mit hoher Flexibilität bietet, die nicht von der Verfügbarkeit perfekt positionierter Nuklease-Schnittstellen abhängt.
Schließlich wurde ein therapeutisch relevanter Locus, DMD, als Ziel gewählt, um twinPE für größere Deletionen einzusetzen. Pathogene DMD-Allele, die für die Duchenne- Muskeldystrophie verantwortlich sind, enthalten in der Regel große Deletionen in Regionen, die Exons enthalten, die zu rahmenverschobenen mRNA-Transkripten führen. Da die Produktion des Dystrophin-Proteins in voller Länge ohne Austausch der gelöschten Exons zu einer teilweisen Rettung der Proteinfunktion führen kann, wurde die Unterbrechung eines zweiten Exons, das den Reading Frame wiederherstellt, als mögliche therapeutische Strategie vorgeschlagen. Drei twinPE-Deletionsstrategien wurden zusammen mit einer bereits berichteten Cas9-Nuklease-Deletionsstrategie zur Exzision von Exon 51 bei DMD untersucht. Bei der Verwendung von twinPE-Deletionsansätzen mit einem Anker wurde eine Effizienz von 14,4 % bis 24 % für die Deletion einer 780-bp-Sequenz beobachtet, die Exon 51 in DMD enthält (109E). Während die gepaarte Cas9-Nuklease-Strategie eine höhere Deletionseffizienz (durchschnittlich 49,8 %) im Vergleich zu den twinPE-Strategien (durchschnittlich 14 % bis 24 %) erzielte, ging die gepaarte Cas9-Nuklease-vermittelte Deletion auch mit wesentlich höheren Indel-Werten (33 % gewünschte Deletion mit Indels, 11% Indels ohne die gewünschte Deletion) im Vergleich zu twinPE (1% bis 12 % Gesamtindels) einher (109E). Exon 51 von DMD konnte auch unter Verwendung alternativer Spacer-Paare exzidiert werden, die mit der PrimeDel-Strategie eine Deletion von 627 bp (28,8 % durchschnittliche Effizienz) oder mit der Single-Anker-twinPE-Strategie eine Deletion von 590 bp (26,4 % durchschnittliche Effizienz) erzeugten, oder indem mit twinPE eine Sequenz von 589 bp durch eine Bxb1-attB-Sequenz von 38 bp ausgetauscht wurde (bis zu 40,4 % durchschnittliche Effizienz) (109E). Diese Experimente zeigen, dass twinPE und PrimeDel in der Lage sind, große Deletionen an therapeutisch relevanten Loci in humanen Zellen mit überlegener Produktreinheit im Vergleich zu gepaarten Cas9-Nuklease-Strategien zu erzeugen, wenn auch mit niedrigeren durchschnittlichen Effizienzen.
Gezielte DNA-Integration an Safe-Harbor-Loci mit twinPE und Bxb1-Integrase
Obwohl twinPE in der Lage ist, größere Insertions-Edits auszuführen als PE3, reichten die oberen Grenzen der Sequenzinsertionsgröße von noch nicht aus, um die Integration von DNA-Fragmenten in Gengröße zu unterstützen. Da mit twinPE die Insertion von Bxb1- Anheftungssequenzen in endogene humane Genomstellen mit hoher Effizienz erreicht worden ist, wurde twinPE mit Serinrekombinasen zur stellenspezifischen Integration von DNA-Fracht kombiniert. Zur Identifizierung von Stellen für die Integration von DNA-Fracht wurde die twinPE-vermittelte Insertion von Bxb1-attB- und attP-Anheftungssequenzen an etablierten Safe-Harbor-Loci in HEK293T-Zellen durchgeführt. 32 Spacer-Paare, die auf den AAVS1- Locus abzielen, wurden auf die Insertion der 50-bp-Bxb1-attP-Sequenz untersucht (Daten nicht gezeigt). Von den evaluierten Spacer-Paaren erreichten die optimalen pegRNAs für 18 von 32 Spacer-Kombinationen eine korrekte Insertionseffizienz von >50 % durch Amplikon- Sequenzierung (110A). Zusätzlich wurden 19 Spacer-Paare, die auf den CCR5-Locus abzielen, auf die Insertion der 38-bp-Bxb1-attB-Sequenz untersucht (Daten nicht gezeigt), von denen 6 Spacer-Paare durch Amplikon-Sequenzierung >50 % der gewünschten Editing- Effizienz erreichten (110B). Diese Ergebnisse zeigen, dass twinPE zur Insertion von Rekombinase-Anheftungssequenzen an Safe-Harbor-Loci in humanen Zellen mit hoher Effizienz verwendet werden kann.
Als Nächstes wurden mit twinPE eingefügte Bxb1-attB- und attP-Sequenzen untersucht, um zu bestimmen, ob sie als Zielstellen für die Integration von Plasmid-DNA- Fracht dienen können, die Partner-Bxb1-Anheftungsstellen beherbergt. Zunächst wurden mit twinPE Einzelzellklone erzeugt, die homozygote attB-Insertionen am CCRS-Locus tragen (Daten nicht gezeigt). Die Transfektion dieser klonalen Zelllinie mit einem Plasmid, das Bxb1- Rekombinase exprimiert, und einem 5,6-kB-attP-enthaltenden Donor-DNA-Plasmid ergab einen Wirkungsgrad von 12-17 % Knock-in an der Zielstelle, gemessen mittels ddPCR (113), was mit den zuvor berichteten BxB1-Integrationseffizienzen übereinstimmt. Ermutigt durch diese Ergebnisse wurden die twinPE-vermittelte Insertion an der Anheftungsstelle und die BxB1-vermittelte DNA-Donor-Integration untersucht, um zu bestimmen, ob sie in einem einzigen Transfektionsschritt erreicht werden können. Spannenderweise führte die Transfektion von HEK293T-Zellen mit Plasmiden, die PE2, beide pegRNAs, Bxb1-und Donor-DNA kodieren, zu einer Knock-in-Effizienz von 1,4-6,8 %, gemessen mittels ddPCR (110C). Die erwarteten Kreuzungssequenzen, die die erwarteten attL- und attR-Rekombinationsprodukte enthielten, wurden durch Amplikonsequenzierung bestätigt, wobei die Produktreinheiten zwischen 71 und 95 % lagen (114).
In dem Bemühen, die „One-Pot“-Knock-in-Effizienz zu verbessern, wurde der twinPE- vermittelte Einbau entweder von attB- oder attP-Anheftungsstellen, der kanonischen (GT) Bxb1-Kernsequenz, einer alternativen (GA) Bxb1-Kernsequenz und unterschiedlicher Flap- Überlappungslängen getestet. Es zeigte sich, dass der Einbau der attB-Stelle mit twinPE besser ausgeführt wurde als der Einbau der attP-Stelle für One-Pot-Knock-in-Transfektionen (3,3 % gegenüber 0,5 % Knock-in, 110D). Darüber hinaus wurde beobachtet, dass die Insertion von Anheftungsstellen mit der kanonischen GT-Kernsequenz generell zu höheren Knock-in- Effizienzen führte als die Insertion von Anheftungsstellen mit der alternativen GA-Sequenz (3,3 % gegenüber 0% im attB-Kontext, 110D). Bemerkenswert ist jedoch, dass die kanonischen und alternativen Kernsequenzen eine orthogonale Rekombination mit den entsprechenden attP-Anheftungsstellen ermöglichen. Das Reduzieren der Überlappung zwischen pegRNA-kodierten Rekombinase-Sequenzen verbesserte ebenfalls die Knock-in- Effizienz, und zwar von 3,3 % mit 38 Basenpaaren Überlappung auf 5,5 % mit 20 Basenpaaren Überlappung beim Einfügen von attB (110D), was möglicherweise auf den reduzierten Umfang der Anheftungssequenz innerhalb der pegRNA-exprimierenden Plasmid-DNA- Sequenz zurückzuführen ist. Obwohl bei allen Überlappungslängen eine ähnliche twinPE- Effizienz beobachtet wurde, war die Rekombination zwischen Donor-DNA und pegRNA- Plasmid reduziert (115A-115B).
Als Nächstes wurde die Donor-Integration am ALB-Locus bewertet, der für die therapeutische Proteinsekretion aus Hepatozyten genutzt werden kann. Albumin wird aktiv von der Leber sezerniert und macht etwa 60 % der humanen Plasmaproteine aus. Daher könnte durch die Integration therapeutischer Transgene in den ALB-Locus bei einem relativ kleinen Prozentsatz von Hepatozyten ein therapeutisches Niveau der Proteinexprimierung für viele Krankheiten erreicht werden. Es wurde eine Strategie entwickelt, die auf das Intron 1 von ALB abzielt, wobei Bxb1 die Integration einer zirkulären DNA vermittelt, die eine Spleißakzeptorsequenz enthält, gefolgt von der cDNA für ein gewünschtes Protein. Die Integration würde im Prinzip das Spleißen des Albumin-Sekretionssignals, das in Exon 1 kodiert ist, in die Sequenz, die das therapeutische Transgen kodiert, ermöglichen. Zunächst wurden pegRNA-Paare auf die Insertion der Bxb1-attB-Sequenz in Intron 1 von ALB untersucht. Nach dem Screening der pegRNA-Paare wurde eine Spacer-Kombination identifiziert, die bei der Amplikon-Sequenzierung eine 43%ige korrekte Insertion der attB- Sequenz erreichte (110E). Eine einfache Knock-in-Transfektion an diesem Locus wurde mit einer Effizienz von 1,3 % in HEK293T erreicht (110F). In Huh7-Zellen wurde eine 34%ige korrekte Insertion der attB-Sequenz mit einer Knock-in-Effizienz von 2,6 % bei einmaliger Transfektion beobachtet. Interessanterweise war das Knock-in an ALB in Huh7 effizienter als das Knock-in an CCR5 (2,6 % gegenüber 1,1 %), obwohl das CCR5-Knock-in effizienter war als das ALB-Knock-in in HEK293T-Zellen.
Multiplex-Editing und rekombinasevermittelte Inversion
Große strukturelle Varianten finden sich in vielen humanpathogenen Allelen, wie z. B. die große 0,6-Mb-Inversion am Locus F8, die ~50% der schweren Hämophilie-A-Fälle verursacht. Inspiriert durch die hohe Effizienz der Insertion von Anheftungsstellen durch Rekombinasen mit twinPE wurde die Idee geboren, dass das Multiplexing der Insertion von attB- und attP-Bxb1-Anheftungsstellen zur Korrektur komplexerer genetischer Varianten durch unidirektionale Deletion oder Inversion der dazwischenliegenden DNA-Sequenz genutzt werden könnte. Um diesen Ansatz an einem therapeutisch relevanten Locus zu testen, wurde eine 39-kb-Inversion zwischen IDS und seinem Pseudogen IDS2 versucht. Inversionen zwischen diesen Stellen wurden in ~13 % der Fälle von Hunter-Syndrom beobachtet, und die Charakterisierung der Bruchpunkte in pathogenen Allelen hat ergeben, dass die Inversion häufig innerhalb eines Rekombinations-Hotspots von Intron 7 auftritt, der sowohl in IDS als auch in IDS2 vorhanden ist. Daher wurden Regionen, die diese Rekombinations-Hotspots flankieren, gezielt für die Insertion von Bxb1-attP- und attB-Anheftungssequenzen ausgewählt, die, wenn sie in entgegengesetzte Richtungen ausgerichtet sind, als Substrate für die unidirektionale Inversion durch Bxb1 zur Korrektur der pathogenen Allelsequenz in Patientenzellen verwendet werden können (111A). Nach dem Screening von 12 pegRNA-Spacer-Paaren und der Optimierung von pegRNA-Sequenz-Merkmalen wurde festgestellt, dass pegRNA-Paare, die in der Lage sind, attP- oder attB-Anheftungsstellen an der linken bzw. rechten Zielstelle einzufügen, eine Effizienz von 73,7 % bzw. 69,8 % aufweisen (111B).
Als nächstes wurde die Multiplexing twinPE-vermittelte Insertion von attP- und attB- Anheftungsstellen mit der Bxb1-Rekombinase-vermittelten Inversion der 39-kb-Sequenz in IDS und IDS2 untersucht. Zunächst wurde die sequentielle DNA-Transfektion mit twinPE- Komponenten und anschließender Bxb1-Rekombinase untersucht. Ein erster Satz von pegRNAs (Satz 1) wurde getestet, der eine vorwärtsgerichtete attP-Sequenz in Intron 3 von IDS2 und eine rückwärtsgerichtete attB-Sequenz in Intron 7 von IDS einbaut. Darüber hinaus wurde ein zweiter Satz pegRNAs (Satz 2) verwendet, um in einer ersten Transfektion eine rückwärtsgerichtete attP-Sequenz in IDS2 und eine vorwärtsgerichtete attB-Sequenz in IDS einzubauen. Beim Multiplex-Editing mit pegRNA Satz 1 bzw. Satz 2 wurden 52,3 % bzw. 54,5 % attP-Sequenz-Insertion und 27,6 % bzw. 30,9 % attB-Sequenz-Insertion beobachtet (111C). Wurden die editierten Zellen anschließend mit Bxb1-Rekombinase transfiziert, wurde im Vergleich zu Mock-Transfektionskontrollen ein deutlich geringerer Prozentsatz amplifizierter Allele beobachtet, die attP- und attB-Sequenzen enthielten (p-Wert < 0,05), was darauf hindeutet, dass einige editierte Allele als Substrate für die Bxb1-vermittelte Rekombination verwendet wurden (111C). Die Amplifikation der erwarteten Inversionskreuzungen und die anschließende Amplikonsequenzierung zeigten sowohl die attLals auch die attR-Sequenzsignaturen der Bxb1-vermittelten Rekombination, wobei die Produktreinheit an beiden Kreuzungen bei oder über 80 % lag (111D).
Um die One-Pot-twinPE und die Bxb1-vermittelte Inversion durchzuführen und unerwünschte Rekombinationen zwischen pegRNA-Plasmid-DNA zu vermeiden, wurden all- RNA-Komponenten, die PE2-mRNA, synthetische pegRNAs aus Satz 1 und Bxb1-mRNA umfassen, nukleofiziert. Mithilfe der Amplikonsequenzierung wurden die erwarteten invertierten Allelkreuzungen, die attR- und attL-Sequenzen enthalten, erfasst. Um die Inversionseffizienz zu quantifizieren, wurde ferner ein reverse Primer entworfen, der an eine identische Sequenz sowohl im nicht-invertierten als auch im invertierten Allel binden kann und daher beide Edits mit demselben Primerpaar amplifiziert (116). Es wurden ~4,6-7,2 % bzw. ~1,5-2,3 % Inversionseffizienz für die „sequenzielle“ und die „One-Pot“-Strategie beobachtet (111E). Insgesamt belegen diese Daten, dass die Kombination von twinPE mit stellenspezifischen Serinrekombinasen zur Korrektur einer bei Hunter-Syndrom-Allelen häufig vorkommenden 39-kb-Inversion verwendet werden kann und als vielversprechende therapeutische Plattform für die Korrektur anderer komplexer pathogener Varianten dienen könnte.
Erörterung
Wie hierin vorgestellt, wurde ein Twin-Prime-Editing-Ansatz entwickelt, mit dem DNA-Sequenzen an bestimmten Stellen im Genom humaner Zellen gelöscht, ausgetauscht oder eingefügt werden können. In Kombination mit stellenspezifischen Serin-Rekombinase- Enzymen kann twinPE auch die Integration von DNA-Fracht oder die Inversion von DNA- Sequenzen unterstützen.
Verfahren
Allgemeine Verfahren

Die DNA-Amplifikation erfolgte durch PCR unter Verwendung von Phusion U Green Multiplex PCR Master Mix (ThermoFisher Scientific) oder Q5 Hot Start High-Fidelity 2x Master Mix (New England BioLabs), sofern nicht anders angegeben. DNA-Oligonukleotide wurden von Integrated DNA Technologies bezogen. Plasmide, die sgRNAs exprimieren, wurden durch Ligation von annealisierten Oligonukleotiden in einen BsmBI-aufgeschlossenen Akzeptor-Vektor konstruiert. Plasmide, die pegRNAs exprimieren, wurden durch Gibson- Assembly oder Golden-Gate-Assembly konstruiert, wie zuvor beschrieben. Die Sequenzen der in diesem Beispiel verwendeten sgRNA- und pegRNA-Konstrukte sind in den Tabellen 11-12 aufgelistet. Tabelle 11. Sequenzen der in diesem Beispiel verwendeten sgRNA

sgRNA	Spacer-Sequenz	SEQ-ID- NR:
HEK3_3b _+90_Nicking		616
pU6-Sp-sgRNA- DMDExo51-A1		3971
pU6-Sp-sgRNA- DMDExo51-A3		3972
pU6-Sp-sgRNA- DMDExo51-B1	Gcagttgcctaagaactggt	3973

Tabelle 12. Sequenzen der in diesem Beispiel verwendeten pegRNA

pegRNA	Spacer- Sequenz	Spacer SEQ-ID- NR:	3'-Verlängerung	Verlängerung SEQ- ID-NR:
HEK3_attB_A_38		383		4029
HEK3_attB_A_34		383		4030
HEK3_attB_A_30		383		4031
HEK3_attB_B_38		616		4032
HEK3_attB_B_34		616		4033
HEK3_attB_B_30		616		4034
HEK3_attP_A_43		383		4035
HEK3_attP_A_39		383		4036
HEK3_attP_A_35		383		4037
HEK3_attP_B_44		616		4038
HEK3_attP_B_40		616		4039
HEK3_attP_B_36		616		4040
PE3_HEK3_FKBP_ins12bp		383		4041
PE3_HEK3_ FKBP_ins36bp		383		4042
PE3_HEK3_ FKBP_ins108bp		383		4043
PE3_HEK3_ FKBP_ins321bp		383		4044
twinPE_HEK3_FKBP_ins108bp_32bp_Überhang_A		383		4045
twinPE_HEK3_FKBP_ins108bp_32bp_Überhang_B		616		4046
pU6-Sp- gRNA- HEK3_del_DF_A_13ntTEMP_Basic		383	tcctctgccatcacgtgctcagtctg	4047
pU6-Sp- gRNA- HEK3_del_DF_B_13ntTEMP_Basic		616	tgatggcagaggaccgggatactgg	4048
pU6-Sp- gRNA- HEK3_del_DF_A 34ntTEMP_Basic		383		4049
pU6-Sp- gRNA- HEK3_del_DF_B 34ntTEMP_Basic		616		4050
pU6-Sp- gRNA- HEK3_del_DF_A_13- 13TEMP_Hybrid		383	tgcaggagctgcatcctctgccatcacgtgctcagtctg	4051
pU6-Sp- gRNA- HEK3_del_DF_B_13- 13TEMP_Hybrid		616	tgatggcagaggatgcagctcctgcaccgggatactgg	4052
pU6-Sp- gRNA- HEK3_del_DF_A_31ntTEMP_Shendure		383		4053
pU6-Sp- gRNA- HEK3_del_DF_B_31ntTEMP_Shendure		616		4054
pU6-Sp- gRNA- HEK3_del_DF_A_13ntTEMP_Basic_EvoPreQ1		383		4055
pU6-Sp- gRNA- HEK3_del_DF_B_13ntTEMP_Basic_EvoPreQ1		616		4056
pU6-Sp- gRNA- HEK3_del_DF_A_34ntTEMP_Basic_EvoPreQ1		383		4057
pU6-Sp- gRNA- HEK3_del_DF_B_34ntTEMP_Basic_EvoPreQ1		616		4058
pU6-Sp- gRNA- HEK3_del_DF_A_13- 13TEMP_Hybrid_EvoPreQ1		383		4059
pU6-Sp- gRNA- HEK3_del_DF_B_13- 13TEMP_Hybrid_EvoPreQ1		616		4060
pU6-Sp- gRNA- HEK3_del_DF_A_31ntTEMP_Shendure_EvoPreQ1		383		4061
pU6-Sp- gRNA- HEK3_del_DF_B_31ntTEMP_Shendure_EvoPreQ1		616		4062
pU6-Sp- pegRNA- DMDExo51- A1_a_Basic		3971		4063
pU6-Sp- pegRNA- DMDExo51- A1_b_Basic		3971		4064
pU6-Sp- pegRNA- DMDExo51- A1_c_Basic		3971		4065
pU6-Sp- pegRNA- DMDExo51- B1_A1_b_Basic		3973		4066
pU6-Sp- pegRNA- DMDExo51- B1_A1_c_Basic		3973		4067
pU6-Sp- pegRNA- DMDExo51- A3_c_Basic		3972		4068
pU6-Sp- pegRNA- DMDExo51- B_ A3_a_Basic		3973		4069
pu6-sp- pegma- dmdexo51- a3- b1_a_PrimeDel		3972		4070
pu6-sp- pegma- dmdexo51- b1-a3_a- PrimeDel		3973	accacttccacaatgtatatgattgttactgagttcttagg	4071
pu6-sp- pegma- dmdexo51- b1-a3__b- PrimeDel		3973	accacttccacaatgtatatgattgttactgagttcttaggcaa	4072
pU6-Sp- pegRNA- DMDExo51- A3_b_attB_fwd		3972		4073
pU6-Sp- pegRNA- DMDExo51- A3_c_attB_fwd		3972		4074
pU6-Sp- pegRNA- DMDExo51- B1_b _attB_fwd		3973		4075
pU6-Sp- pegRNA- DMDExoS1- B1_c_attB_fwd		3973		4076
pU6-Sp- pegRNA- DMDExo51- B2_b_attB_fwd		3974		4077
pU6-Sp- pegRNA- DMDExo51- B2_c_attB_fwd		3974		4078
A_1077a		3975		4079
A 1077b		3975		4080
A_1077c		3975		4081
A_1098a		3976		4082
A_1098b		3976		4083
A_1098c		3976		4084
A_1246a		3977		4085
A_1246b		3977		4086
A_1246c		3977		4087
A_1267a		3978		4088
A_1267b		3978		4089
A_1267c		3978		4090
A_1293a		3979		4091
A_1293b		3979		4092
A_1293c		3979		4093
A_1307a		3980		4094
A_1307b		3980		4095
A_1307c		3980		4096
A_1582a		3981		4097
A_1582b		3981		4098
A_1582c		3981		4099
A_1615a		3982		4100
A_1615b		3982		4101
A_1615c		3982		4102
A_1647a		3983		4103
A_1647b		3983		4104
A_1647c		3983		4105
A_1810a		3984		4106
A_1810b		3984		4107
A_1810c		3984		4108
A_1890a		3985		4109
A_1890b		3985		4110
A_1890c		3985		4111
A_3786a		3986		4112
A_3786b		3986		4113
A_3786c		3986		4114
A_3835a		3987		4115
A_3835b		3987		4116
A_3835c		3987		4117
A_3856a		3988		4118
A_3856b		3988		4119
A_3856c		3988		4120
B_1154a		3989		4121
B_1154b		3989		4122
B_1154c		3989		4123
B_1314a		3990		4124
B_1314b		3990		4125
B_1314c		3990		4126
B_1376a		3991		4127
B_1376b		3991		4128
B_1376c		3991		4129
B_1640a		3992		4130
B_1640b		3992		4131
B_1640c		3992		4132
B_1676a		3993		4133
B_1676b		3993		4134
B_1676c		3993		4135
B_1701a		3994		4136
B_1701b		3994		4137
B_1701c		3994		4138
B_1705a		3995		4139
B_1705b		3995		4140
B_1705c		3995		4141
B_1883a		3996		4142
B_1883b		3996		4143
B_1883c		3996		4144
B_1902a		3997		4145
B_1902b		3997		4146
B_1902c		3997		4147
B_1962a		3998		4148
B_1962b		3998		4149
B_1962c		3998		4150
B_3839a		3999		4151
B_3839b		3999		4152
B_3839c		3999		4153
B_3903a		4000		4154
B_3903b		4000		4155
B_3903c		4000		4156
B_3930a		4001		4157
B_3930b		4001		4158
B_3930c		4001		4159
A_1_223_a		4002		4160
A_1_223_b		4002		4161
A_1_223_c		4002		4162
A_2_260_a		4003		4163
A_2_260_b		4003		4164
A_2_260_c		4003		4165
A_3_325_a		4004		4166
A_3_325_b		4004		4167
A_3_325_c		4004		4168
A_4_360_a		4005		4169
A_4_360_b		4005		4170
A_4_360_c		4005		4171
A_5_507_a		4006		4172
A_5_507_b		4006		4173
A_5_507_c		4006		4174
A_6_510_a		4007		4175
A_6_510_b		4007		4176
A_6_510_c		4007		4177
A_7_532_a		4008		4178
A_7_532_b		4008		4179
A_7_532_c		4008		4180
B_1_272_a		4009		4181
B_1_272_b		4009		4182
B_1_272_c		4009		4183
B_2_291_a		4010		4184
B_2_291_b		4010		4185
B_2_291_c		4010		4186
B_3_305_a		4011		4187
B_3_305_b		4011		4188
B_3_305_c		4011		4189
B_4_326_a		4012		4190
B_4_326_b		4012		4191
B_4_326_c		4012		4192
B_5_330_a		4013		4193
B_5_330_b		4013		4194
B_5_330_c		4013		4195
B_6_414_a		4014		4196
B_6_414_b		4014		4197
B_6_414_c		4014		4198
B_7_538_a		4015		4199
B_7_538_b		4015		4200
B_7_538_c		4015		4201
B_8_584_a		4016		4202
B_8_584_b		4016		4203
B_8_584_c		4016		4204
B_9_601_a		4017		4205
B_9_601_b		4017		4206
B_9_601_c		4017		4207
A_3_325_a		4004		4166
B_6_414_b		4014		4197
A_5_507_c		4006		4174
A_6_510_b		4007		4176
A_7_532_b		4008		4179
B_8_584_b		4016		4203
A_1077c		3975		4081
B_1154c		3989		4123
A_3786c		3986		4114
B_3903c		4000		4156
B_3930c		4001		4159
A_7_532_b		4008		4179
B_8_584_b		4016		4203
A7_attB_30		4008		4208
B8_attB_30		4016		4209
A7_attB_20		4008		4210
B8_attB_20		4016		4211
A7_attB_GA_38		4008		4212
B8_attB_GA_38		4016		4213
A7_attB_GA_30		4008		4214
B8_attB_GA_30		4016		4215
A7_attB_GA_20		4008		4216
B8_attB_GA_20		4016		4217
A7_attP_50		4008		4218
B8_attP_50		4016		4219
A7_attP_40		4008		4220
B8_attP_40		4016		4221
A7_attP_30		4008		4222
B8_attP_30		4016		4223
A7_attP_GA_50		4008		4224
B8_attP_GA_50		4016		4225
A7_attP_GA_40		4008		4226
B8_attP_GA_40		4016		4227
A7_attP_GA_30		4008		4228
B8_attP_GA_30		4016		4229
A277_b		4018		4230
A277_c		4018		4231
B358_b		4019		4232
B358_c		4019		4233
A7_attB_20		4008		4210
B8_attB_20		4016		4211
A277_c		4018		4231
B358_c		4019		4233
pU6-Sp- gRNA- IDS_DF_A1_a_attP_fwd.dna		4020		4234
pU6-Sp- gRNA- IDS_DF_A1_a_attP_rev.dna		4020		4235
pU6-Sp- gRNA- IDS_DF_A1_c_attP_fwd.dna		4020		4236
pU6-Sp- gRNA- IDS_DF_A1_c_attP_rev.dna		4020		4237
pU6-Sp- gRNA- IDS_DF_A4_b_attP_fwd.dna		4021		4238
pU6-Sp- gRNA- IDS_DF_A4_b_attP_rev.dna		4021		4236
pU6-Sp- gRNA- IDS_DF_B2_a_attP_fwd.dna		4022		4240
pU6-Sp- gRNA- IDS_DF_B2 _a_attP_rev. dna		4022		4241
pU6-SpgRNA- IDS_DF_B3_a_attP_fwd.dna		4023		4242
pU6-Sp- gRNA- IDS_DF_B3_a_attP_rev.dna		4023		4243
pU6-Sp- gRNA- IDS_DF_B4_b_attP_fwd. dna		4024		4244
pU6-Sp- gRNA- IDS_DF_B4 _b_attP_rev.dna		4024		4245
pU6-Sp- gRNA- IDS_DF_B7 _b_attP_fwd.dna		4025		4246
pU6-Sp- gRNA- IDS_DF_B7_b_attP_rev.dna		4025		4247
pU6-Sp- gRNA- IDS_DF_C2_c_attB_fwd.dna		4026		4248
pU6-Sp- gRNA- IDS_DF_C2_c_attB_rev.dna		4026		4249
pU6-Sp- gRNA- IDS_DF_D1_b_attB_fwd.dna		4027		4250
pU6-Sp- gRNA- IDS_DF_D1_b_attB_rev.dna		4027		4251
pU6-Sp- gRNA- IDS_DF_D2_c_attB_fwd.dna		4028		4252
pU6-Sp- gRNA- IDS_DF_D2_c_attB_rev.dna		4028		4253

Alle Vektoren für Experimente mit Säugetierzellen wurden mit Plasmid Plus Midiprep- Kits (Qiagen) oder PureYield Plasmid Miniprep-Kits (Promega) oder QIAprep Spin Miniprep- Kits gereinigt.
Allgemeine Säugetierzellkulturbedingungen
HEK293T- (ATCC CRL-3216), U2OS- (ATTC HTB-96), K562- (CCL-243) und HeLa- (CCL-2) Zellen wurden von ATCC erworben und in Dulbecco's Modified Eagle's Medium (DMEM) plus GlutaMAX (ThermoFisher Scientific), McCoy's 5A-Medium (Gibco), RPMI-Medium-1640 plus GlutaMAX (Gibco) oder Eagle's Minimal Essential Medium (EMEM, ATCC) kultiviert und überführt, jeweils ergänzt mit 10 % (v/v) fötalem Rinderserum (Gibco, qualifiziert) und 1x Penicillin-Streptomycin (Corning). Alle Zelltypen wurden bei 37 °C und 5 % CO₂ inkubiert, gepflegt und kultiviert. Die Zelllinien wurden von ihren jeweiligen Lieferanten authentifiziert und negativ auf Mykoplasmen getestet.
Transfektionsprotokoll für HEK293T-, HeLa- und Huh7-Gewebekulturen und genomische DNA-Präparation

Gezüchtete HEK293T-Zellen wurden auf mit Poly-D-Lysin beschichteten 48-Well- Platten (Corning) ausgesät. 16-24 Stunden nach der Aussaat wurden die Zellen bei ca. 60 % Konfluenz mit 1 µ1 Lipofectamine 2000 (Thermo Fisher Scientific) gemäß den Herstellerprotokollen transfiziert und entweder mit: 750 ng PE2-Plasmid, 125 ng pegRNA 1 und 125 ng pegRNA 2 (für twinPE-Transfektionen); 750 ng PE2-Plasmid, 250 ng pegRNA- Plasmid und 83 ng sgRNA-Plasmid (für PE3-Transfektionen); oder 750 ng Cas9 und 125 ng sgRNA 1 und 125 ng sgRNA 2 (für gepaarte Cas9-Nuklease-Transfektionen). Sofern nicht anders angegeben, wurden die Zellen drei Tage nach der Transfektion kultiviert. Danach wurde das Medium entfernt, die Zellen wurden mit 1x PBS-Lösung (Thermo Fisher Scientific) gewaschen, und die genomische DNA wurde durch Zugabe von 150 µl frisch hergestelltem Lysepuffer (10 mM Tris-HCl, pH 7,5; 0,05 % SDS; 25 µg/ml Proteinase K (Thermo Fisher Scientific)) direkt in jedes Well der Gewebekulturplatte extrahiert. Die genomische DNA- Mischung wurde 1 bis 2 Stunden bei 37 °C inkubiert, gefolgt von einer 30-minütigen Inaktivierung des Enzyms bei 80°C. Die für die Amplifikation genomischer Säugetierzell- DNA verwendeten Primer sind in Tabelle 13 aufgeführt. Tabelle 13. Sequenzen der in diesem Beispiel verwendeten Primer

Primer	Sequenz	SEQ-ID- NR:
HEK3_fwd		3811
HEK3_rev		3812
HEK3_fwd		3811
HEK3_rev		3812
DMD_UMI_fwd1		4254
DMD_UMI_fwd2		4255
DMD_rev0	TGGAGTTCAGACGTGTGCTCTTCCGATCTggctacttttgttatttgcatt	4256
AAVS1_AVA1713		4257
AAVS1_AVA1717		4258
AAVS1_AVA1651		4259
AAVS1_AVA1652		4260
AAVS1_AVA1653		4261
AAVS1_AVA1715		4262
AAVS1_AVA1655		4263
AAVS1_AVA1656		4264
AAVS1_AVA1707		4265
AAVS1_AVA1710		4266
CCR5_AVA1678		4267
CCR5_AVA1679		4268
CCR5_AVA1680		4269
CCR5_AVA1681		4270
CCR5_AVA1682		4271
CCR5_AVA1683		4272
IDS_AVA 1763		4273
IDS_AVA1764		4274
IDS_AVA1765		4275
IDS_AVA1766		4276
IDS_AVA1769		4277
IDS_AVA1770		4278
IDS_UMI_junc1_fwd		4279
IDS_junc2_fwd		4280
IDS_universal_rev		4281

HeLa-Zellen wurden mit einer ähnlichen Dichte wie HEK293T-Zellen gezüchtet und ausgesät, und jedes Well der Zellen wurde mit 190 ng PE2_P2A_Blast (Blasticidin- Resistenzgen), 31,5 ng pegRNA1 und 31,5 ng pegRNA 2 (für twinPE-Transfektionen) mit 0,75 ul HeLa-Monsterreagenz (Mirus) transfiziert. Die Zellen wurden dann 24 Stunden nach der Transfektion mit 10 ug/ml für die Seletion behandelt. Die übrigen Schritte zur Gewinnung genomischer DNA sind mit denen von HEK293T-Zellen identisch. Huh7-Zellen wurden mit 150 k/Well auf mit Poly-D-Lysin beschichteten 24-Well-Platten (Corning) ausgesät. 16-24 Stunden nach der Aussaat wurden die Zellen bei hoher Konfluenz mit 2 µl Lipofectamine 2000 (Thermo Fisher Scientific) gemäß den Herstellerprotokollen und bis zu 800 ng Plasmid-DNA transfiziert. Die Sammlung genomischer DNA erfolgte wie oben für HEK293T beschrieben.
Hochdurchsatz-DNA-Seguenzierung von genomischen DNA-Samples
Genomische Stellen von Interesse wurden aus genomischen DNA-Samples amplifiziert und auf einem Illumina MiSeq sequenziert, wie zuvor mit den folgenden Änderungen beschrieben. Kurz gesagt, Amplifikationsprimer, die Illumina-Vorwärts- und Rückwärtsadapter (Tabelle 13) enthalten, wurden für eine erste Runde der PCR (PCR 1) verwendet, die die genomische Region von Interesse amplifiziert. 25 µl PCR 1-Reaktionen wurden mit 0,5 µM von jedem Vorwärts- und Rückwärtsprimer, 1 µl genomischem DNA- Extrakt und 12,5 µl Phusion-U-Green-Multiplex-PCR-Master-Mix ausgeführt. Die PCR- Reaktionen wurden wie folgt durchgeführt: 98 °C für 2 min, dann 30 Zyklen [98 °C für 10 s, 61 °C für 20 s und 72 °C für 30 s], gefolgt von einer abschließenden 72 °C-Verlängerung für 2 min. Jedem Sample wurden in einer sekundären PCR-Reaktion (PCR 2) eindeutige Illumina- Barcoding-Primerpaare hinzugefügt. Konkret enthielten 25 µl einer gegebenen PCR 2- Reaktion 0,5 µM jedes eindeutigen Vorwärts- und Rückwärts-Illumina-Barcoding- Primerpaares, 1 µl der ungereinigten PCR 1-Reaktionsmischung und 12,5 µl des Phusion U Green Multiplex PCR 2x Master Mix. Die Barcoding-PCR-2-Reaktionen wurden wie folgt durchgeführt: 98 °C für 2 min, dann 12 Zyklen [98 °C für 10 s, 61 °C für 20 s und 72 °C für 30 s], gefolgt von einer abschließenden 72 °C-Verlängerung für 2 min. Die PCR-Produkte wurden analytisch durch Elektrophorese in einem 1,5%igen Agarosegel ausgewertet. PCR-2- Produkte (gepoolt nach gemeinsamen Amplicons) wurden durch Elektrophorese mit einem 1,5%igen Agarosegel unter Verwendung eines QIAquick-Gelextraktionskits (Qiagen) gereinigt und mit 40 µl Wasser eluiert. Die DNA-Konzentration wurde mittels fluorometrischer Quantifizierung (Qubit, ThermoFisher Scientific) oder qPCR (KAPA- Library-Quantification-Kit-Illumina, KAPA Biosystems) gemessen und auf einem Illumina MiSeq-Instrument gemäß den Herstellerprotokollen sequenziert.
Die Sequenzierungs-Reads wurden mit MiSeq-Reporter (Illumina) demultiplexiert. Das Alignment der Amplikon-Sequenzen auf eine Referenzsequenz wurde mit CRISPResso2 ausgeführt. Für die Quantifizierung des Prime-Editing-Gesamtertrags wurde die Prime- Editing-Effizienz wie folgt berechnet: % von [Anzahl der Reads mit dem gewünschten Edit, die keine Indels enthalten] ÷ [Anzahl der gesamten Reads]. Zur Quantifizierung des Punktmutations-Editings wurde CRISPResso2 im Standardmodus mit eingeschalteter Funktion „discard_indel_reads“ ausgeführt. Das Prime-Editing für den Einbau von Punktmutationen wurde dann explizit berechnet als: [Häufigkeit der spezifizierten Punktmutation in nicht verworfenen Reads] x [Anzahl der nicht verworfenen Reads] ÷ [Gesamt-Reads]. Für Quantifizierung des Editing wurde CRISPResso2 im HDR-Modus mit dem gewünschten Allel als erwartetem Allel (e-Flag) und mit eingeschaltetem „discard_indel_reads“ ausgeführt. Der Editing-Wirkungsgrad wurde wie folgt berechnet: [Anzahl der nicht verworfenen HDR-ausgerichteten Reads] ÷ [Gesamt-Reads]. Der Wirkungsgrad von Indel-Reads wurde berechnet als: [Anzahl der Indel-enthaltenden verworfenen Reads] ÷ [Gesamt-Reads]. Eindeutige molekulare Identifikatoren (UMIs) wurden zur Quantifizierung der Deletionseffizienz und zur Bewertung der PCR-Verzerrung in diesem dreistufigen PCR-Protokoll verwendet. Kurz gesagt wurde im ersten Schritt der linearen Amplifikation 1 ul genomischer DNA-Extrakt mit 0,1 uM eines einzelnen Vorwärts-UMI- Primers, der 15-bp- oder 16-bp-Unique Molecular Identifiers enthält, und 12,5 ul Phusion-U- Green-Multiplex-PCR-Master-Mix in einer 25-ul-Reaktion linear amplifiziert. Die PCR- Produkte wurden dann mit 1,6-fachen AmPure-Beads (Beckman Coulter) gereinigt und in 20 ul QIAGEN-Elutionspuffer eluiert. Im zweiten Schritt wurden dann 1 oder 2 ul linear amplifizierter PCR-Eluente für 30 Zyklen mit 0,5 uM jedes Vorwärts- und Rückwärtsprimers, Phusion-U-Green-Multiplex-PCR-Mix in einer 25-ul-Reaktion amplifiziert. In diesem Fall wird der Vorwärtsprimer an die P5 Illumina-Adaptor-Sequenz annealisiert, die sich an der 5' des UMI Primers und stromaufwärts von UMI befindet. Die PCR-Produkte wurden mit 1X Ampure-Beads gereinigt und in 25 ul Elutionspuffer eluiert. Im dritten Schritt wurde 1 ul Elutionspuffer für 12 Zyklen amplifiziert, wie oben erwähnt, um eine eindeutige Illumina- Barcodierung hinzuzufügen. Um die große Deletion am DMD-Locus zu beurteilen, wurden die obere Gruppe (uneditiertes großes Amplikon) und die untere Gruppe (editierte Amplikons mit Deletionen) separat aus der 1,5%igen Agarose herausgeschnitten und die endgültige Bibliothek (60 pM der oberen Gruppen gegenüber 20 pM der unteren Gruppen) wurde in zwei getrennte Miseq-Kits geladen, um ein schwaches Clustering von großen Amplikons (~1 kb) im Vergleich zu kurzen (~300 bp) zu vermeiden.
Rohe Sequenzierungs-Reads wurden mit AmpUMI UMI dedupliziert. Für Paired-End- Reads wurde SeqKit verwendet, um R1s mit dem umgekehrten Komplement von R2s zu verketten (ohne Überlappung zusammenzuführen). Die verketteten R1+R2s wurden mithilfe der UMI am 5'-Ende von R1 dedupliziert. UMI-deduplizierte R1s oder konkatenierte R1+R2s wurden mit CRISPResso2 analysiert. Für die Analyse konkatenierter R1+R2s wurde eine geeignete konkatenierte Referenz-Amplikon-Sequenz bereitgestellt, um Sequenzierungs- Alignment-Artefakte aufgrund der Konkatenation zu minimieren.
Nukleofektion von U2OS und K562
Die Nukleofektion wurde in allen Experimenten mit K562- und U2OS-Zellen ausgeführt. Pro Nukleofektion wurden 200.000 Zellen verwendet. Die gezählten Zellen wurden abgeschleudert und mit PBS gewaschen und dann in der Nukleofektionslösung gemäß der Empfehlung des Lonza SE Cell Line 4D-Nucleofector Kits resuspendiert. Nach der Nukleofektion der Zellen in der Vorrichtung wurden die Zellen in der Küvette bei Raumtemperatur 10 Minuten lang inkubiert. Der Inhalt der Küvette wurde in eine 48-Well- Platte überführt, die mit vorgewärmten Medien gefüllt war. Die genomische DNA wurde extrahiert und für die Illumina Miseq-Vorbereitung vorbereitet, wie oben beschrieben.
One-Pot-twinPE und BxbI-vermitteltes Fracht-Knock-in und große Inversion:
Für das One-Pot-vermittelte große Inversions-Experiment wurden eine sequenzielle Plasmid-Transfektion und eine One-Pot-mRNA-Nukleofektion ausgeführt. Bei der sequentiellen Plasmid-Transfektion wurden HEK293T-Zellen mit 750 ng PE2 und 62,5 ng jeder pegRNA (insgesamt vier) unter Verwendung von Lipofectamine 2000 wie oben beschrieben transfiziert. Nach drei Tagen wurden die Zellen trypsinisiert, in 24-Well-Platten ausplattiert und etwa sieben Tage lang weitergegeben. Anschließend wurden 20 k Zellen erneut ausgesät und mit 500 ng BxBI-Plasmid transfiziert. Die genomische DNA wurde extrahiert und für die Illumina Miseq-Vorbereitung vorbereitet, wie oben beschrieben. Bei dem One-Pot- mRNA-Nukleofektionsexperiment wurden 200.000 Zellen mit 1 ug PE2 mRNA, 30 pmol jeder synthetischen pegRNA (insgesamt 4 pegRNAs) und 750 ng BxBI mRNA nukleofiziert. Synthetische pegRNAs wurden bei IDT bestellt, und die mRNA-Transkripte wurden nach dem veröffentlichten Protokoll in vitro transkribiert. 20 ul einer Mischung aus Lonza-Puffer und Zellen wurden mit dem Programm CM-130 elektroporiert und mit 80 ul erwärmtem Medium fünf Minuten lang aufgefangen. 25 ul Samples aus der Küvette wurden dann in jedes Well der 48-Well-Platte gegeben und bei 37 °C 72 Stunden lang inkubiert.
SONSTIGE IN DIESER OFFENBARUNG ANGEGEBENE REFERENZEN
Die folgenden Referenzen sind hierin jeweils in ihrer Gesamtheit durch Bezugnahme aufgenommen.

1. Jinek, M. et al. A Programmable Dual-RNA-Guided DNA Endonuclease in Adaptive Bacterial Immunity. Science 337, 816-821 (2012).
2. Cong, L. et al. Multiplex Genome Engineering Using CRISPR/Cas Systems. Science 339, 819-823 (2013).
3. Komor, A. C., Badran, A. H. & Liu, D. R. CRISPR-Based Technologies for the Manipulation of Eukaryotic Genomes. Cell 168, 20-36 (2017).
4. Komor, A. C., Kim, Y. B., Packer, M. S., Zuris, J. A. & Liu, D. R. Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage. Nature 533, 420-424 (2016).
5. Nishida, K. et al. Targeted nucleotide editing using hybrid prokaryotic and vertebrate adaptive immune systems. Science 353, aaf8729 (2016).
6. Gaudelli, N. M. et al. Programmable base editing of A·T to G·C in genomic DNA without DNA cleavage. Nature 551, 464-471 (2017).
7. ClinVar, July 2019.
8. Dunbar, C. E. et al. Gene therapy comes of age. Science 359, eaan4672 (2018).
9. Cox, D. B. T., Platt, R. J. & Zhang, F. Therapeutic genome editing: prospects and challenges. Nat. Med. 21, 121-131 (2015).
10. Adli, M. The CRISPR tool kit for genome editing and beyond. Nat. Commun. 9,1911 (2018).
11. Kleinstiver, B. P. et al. Engineered CRISPR-Cas9 nucleases with altered PAM specificities. Nature 523, 481-485 (2015).
12. Kleinstiver, B. P. et al. High-fidelity CRISPR-Cas9 nucleases with no detectable genomewide off-target effects. Nature 529,490-495 (2016).
13. Hu, J. H. et al. Evolved Cas9 variants with broad PAM compatibility and high DNA specificity. Nature 556, 57-63 (2018).
14. Nishimasu, H. et al. Engineered CRISPR-Cas9 nuclease with expanded targeting space. Science 361, 1259-1262 (2018).
15. Jasin, M. & Rothstein, R. Repair of strand breaks by homologous recombination. Cold Spring Harb. Perspect. Biol. 5, a012740 (2013).
16. Paquet, D. et al. Efficient introduction of specific homozygous and hetcrozygous mutations using CR1SPR/Cas9. Nature 533,125-129 (2016).
17. Kosicki, M., Tomberg, K. & Bradley, A. Repair of double-strand breaks induced by CRISPR-Cas9 leads to large deletions and complex reairangements. Nat. Biotechnol. 36, 765-771 (2018).
18. Haapaniemi, E., Botla, S., Persson, J., Schmierer, B. & Taipale, J. CRISPR-Cas9 genome editing induces a p53-mediated DNA damage response. Nat. Med. 24,927-930 (2018).
19. Ihry. R. J. et al. p53 inhibits CRISPR-Cas9 engineering in human pluripotent stem cells. Nat. Med. 24, 939-946 (2018).
20. Richardson, C. D., Ray, G. J., DeWitt, M. A., Curie, G. L. & Corn, J. E. Enhancing homology-directed genome editing by catalytically active and inactive CRISPR-Cas9 using asymmetrie donor DNA. Nat. Biotechnol. 34,339-344 (2016).
21. Srivastava, M. et al. An Inhibitor of Nonhomologous End-Joining Abrogates Double-Strand Break Repair and Impedes Cancer Progression. Cell 151, 1474-1487 (2012).
22. Chu, V. T. et al. Incrcasing the efficiency of homology-directcd repair für CRISPR-Cas9- induced precise gene editing in mammalian cells. Nat. Biotechnol. 33, 543-548 (2015).
23. Maruyama, T. et al. Increasing the efficiency of precise genome editing with CRISPR-Cas9 by inhibition of nonhomologous end joining. Nat. Biotechnol. 33, 538-542 (2015).
24. Kim, Y. B. et al. Increasing the genome-targeting scope and precision of base editing with engineered Cas9-cytidine deaminase fusions. Nat. Biotechnol. 35, 371-376 (2017).
25. Li, X. et al. Base editing with a Cpfl-cytidine deaminase fusion. Nat. Biotechnol. 36, 324-327 (2018).
26. Gehrke, J. M. et al. An APOBEC3A-Cas9 base editor with minimized bystander and off- target activities. Nat. Biotechnol. (2018). doi:10.1038/nbt.4199
27. Rees, H. A. & Liu, D. R. Base editing: precision chemistry on the genome and transcriptome of living cells. Nat. Rev. Genet. 1 (2018). doi:10.1038/s41576-018-0059-1.
28. Ostertag, E. M. & Kazazian Jr, H. H. Biology of Mammalian Ll Retrotransposons. Annu. Rev. Genet. 35, 501-538 (2001).
29. Zimmerly, S., Guo, H., Perlman, P. S. & Lambowitz, A. M. Group II intron mobility occurs by target DNA- primed reverse transcription. Cell 82, 545-554 (1995).
30. Luan, D. D., Korman, M. H., Jakubczak, J. L. & Eickbush, T. H. Reverse transcription of R2Bm RNA is primed by a nick at the chromosomal target site: a mechanism for non-LTR retrotransposition. Cell 72, 595-605 (1993).
31. Feng, Q., Moran, J. V., Kazazian, H. H. & Boeke, J. D. Human Ll retrotransposon encodes a conscrvcd endonuclcase required for retrotransposition. Cell 87, 905-916 (1996).
32. Jinek, M. et al. Structures of Cas9 Endonucleases Reveal RNA-Mediated Conformational Activation. Science 343, 1247997 (2014).
33. Jiang, F. et al. Structures of a CRISPR-Cas9 R-loop complex primed for DNA cleavage. Science aa(18282 (2016). doi:10.1126/science.aad8282
34. Qi, L. S. et al. Repuiposing CRISPR as an RNA-Guided Platform für Sequence-Specific Control of Gene Expression. Cell 152, 1173-1183 (2013).
35. Tang, W., Hu, J. H. & Liu, D. R. Aptazyme-cmbcddcd guide RNAs enable ligandresponsive genome editing and transcriptional activation. Nat. Commun. 8, 15939 (2017).
36. Shechner, D. M., Hacisuleyman, E., Younger, S. T. & Rinn, J. L. Multiplexable, locusspecific targeting of long RNAs with CRISPR-Display. Nat. Methods 12, 664-670 (2015).
37. Anders, C. & Jinck, M. Chapter One - In vitro Enzymology of Cas9. in Methods in Enzymology (eds. Doudna, J. A. & Sontheimer, E. J.) 546,1-20 (Academic Press, 2014).
38. Briner, A. E. et al. Guide RNA Functional Modules Direct Cas9 Activity and Orthogonality. Mol. Cell 56, 333-339 (2014).
39. Nowalk-, C. M., Lawson, S., Zerez, M. & Bleris, L. Guide RNA engineering for versatile Cas9 functionality. Nucleic Acids Res. 44, 9555-9564 (2016).
40. Sternberg, S. H., Redding, S., Jinek, M., Greene, E. C. & Doudna, J. A. DNA interrogation by the CRISPR RNA-guided endonuclease Cas9. Nature 507, 62-67 (2014).
41. Mohr, S. et al. Thermostabie group II intron reverse transcriptasc fusion proteins and their use in cDNA synthesis and next-generation RNA sequencing. RNA 19, 958-970 (2013).
42. Stamos, J. L., Lentzsch, A. M. & Lambowitz, A. M. Structure of a Thermostable Group II Intron Reverse Transcriptase with Template-Primer and Its Functional and Evolutionary Implications. Mol. Cell 68, 926- 939.e4 (2017).
43. Zhao, C. & Pyle, A. M. Crystal structures of a group II intron maturase reveal a missing link in spliceosome evolution. Nat. Struct. Mol. Biol. 23,558-565 (2016).
44. Zhao, C., Liu, F. & Pyle, A. M. An ultraprocessive, accurate reverse transcriptase encoded by a metazoan group II intron. RNA 24, 183-195 (2018).
45. Ran, F. A. et al. Genome engineering using the CRISPR-Cas9 system. Nat. Protoc. 8, 2281-2308 (2013).
46. Liu, Y., Kao, H.-I. & Bambara, R. A. Flap endonuclease 1: a central component of DNA metabolism. Annu. Rev. Biochem. 73,589-615 (2004).
47. Krokan, H. E. & Bjorås M. Base Excision Repair. Cold Spring Harb. Perspect. Biol. 5, (2013).
48. Kelman, Z. PCNA: structure, functions and interactions. Oncogene 14,629-640 (1997).
49. Choc, K. N. & Moldovan, G.-L. Forging Ahead through Darkness: PCNA, Still the Principal Conductor at the Replication Fork. Mol. Cell 65, 380-392 (2017).
50. Li, X., Li, J., Harrington, J., Lieber, M. R. & Burgers, P. M. Lagging strand DNA synthesis at the eukaryotic replication fork involves binding and stimulation of FEN-1 by proliferating cell nuclear antigen. J. Biol. Chem. 270,22109-22112 (1995).
51. Tom, S., Henricksen, L. A. & Bambara, R. A. Mechanism whereby proliferating cell nuclear antigen stimulates flap endonuclease 1. J. Biol. Chem. 275, 10498-10505 (2000).
52. Tanenbaum, M. E., Gilbert, L. A., Qi, L. S., Weissman, J. S. & Vale, R. D. A proteintagging system for signal amplification in gene expression and fluorescence imaging. Cell 159, 635- 646 (2014).
53. Bertrand, E. et al. Localization of ASH1 mRNA particles in living yeast. Mol. Cell 2, 437-445 (1998).
54. Dahlman, J. E. et al. Orthogonal gene knockout and activation with a catalytically active Cas9 nuclease. Nat. Biotechnol. 33, 1159-1161 (2015).
55. Tsai, S. Q. et al. GUIDE-seq enables genome-wide profiling of off-target cleavage by CRISPR-Cas nucleases. Nat. Biotechnol. 33, 187-197 (2015).
56. Tsai, S. Q. et al. CIRCLE-seq: a highly sensitive in vitro screen for genome-wide CRISPR- Cas9 nuclease off-targets. Nat. Methods 14, 607-614 (2017).
57. Schek N, Cooke C, Alwine JC. Molecular and Cellular Biology. (1992).
58. Gil A, Proudfoot NJ. Cell. (1987).
59. Zhao, B.S., Roundtree, I.A., He, C. Nat Rev Mol Cell Biol. (2017).
60. Rubio, M.A.T., Hopper, A.K. Wiley Interdiscip Rev RNA (2011).
61. Shechner, D.M., Hacisulcyman E., Youngcr, S.T., Rinn, J.L. Nat Methods. (2015).
62. Paige, J.S., Wu, K.Y., Jaffrey, S.R. Science (2011).
63. Ray D., ... Hughes TR. Nature (2013).
64. Chadalavada, D. M., Cerrone-Szakal, A. L., Bevilacqua. P.C. RNA (2007).
65. Forster AC, Symons RH. Cell. (1987).
66. Weinberg Z, Kim PB, Chen TH, Li S, Harns KA, Lünse CE, Breaker RR. Nat. Chem. Biol. (2015).
67. Feldstein PA, Buzayan JM. Bruening G. Gene (1989).
68. Saville BJ, Collins RA. Cell. (1990).
69. Winkler WC, Nahvi A, Roth A, Collins JA, Breaker RR. Nature (2004).
70. Roth A, Weinberg Z, Chen AG, Kim PG, Ames TD, Breaker RR. Nat Chem Biol. (2013).
71. Choudhury R, Tsai YS, Oominguez D, Wang Y, Wang Z. Nat Commun. (2012).
72. MacRae IJ. Doudna JA. Curr Opin Struct Biol. (2007).
73. Bernstein E, Caudy AA, Hammond SM, Hannon GJ Nature (2001).
74. Filippov V, Solovyev V, Filippova M, Gill SS. Gene (2000).
75. Cadwell RC and Joyce GF. PCR Methods Appl. (1992).
76. McInerney P, Adams P, and Hadi MZ. Mol Biol lnt. (2014).
77. Esvelt KM, Carlson JC, and Liu DR. Nature. (2011).
78. Naorem SS, Hin J, Wang S, Lee WR, Heng X, Miller JF, Guo H. Proc Natl Acad Sci USA (2017).
79. Martinez MA, Vartanian JP, Wain-Hobson S. Proc Natl Acad Sei USA (1994).
80. Meyer AJ, Ellefson JW, Ellington AD. Curr Protoc Mol Biol. (2014).
81. Wang HH, Isaacs FJ, Carr PA, Sun ZZ, Xu G, Forest CR, Church GM. Nature. (2009).
82. Nyerges Ä et al. Proc Natl Acad Sci USA. (2016).
83. Mascola JR, Haynes BF. Immunol Rev. (2013).
84. X. Wen, K. Wen, D. Cao. G. Li, R. W. Jones, J. Li, S. Szu, Y. Hoshino, L. Yuan, Inclusion of a universal tetanus toxoid CD4(+) T cell epitope P2 significantly cnhanced the immunogenicity of recombinant rotavirus ΔVP8* subunit parenteral vaccines. Vaccine 32, 4420-4427 (2014).
85. G. Ada, D. Isaacs, Carbohydrate-protein conjugate vaccines. Clin Microbiol Infect 9, 79-$5 (2003).
86. E. Malito, B. Bursulaya, C. Chen, P. L. Surdo, M. Picchianti, E. Balducci, M. Biancucci, A. Brock, F. Berti, M. J. Bottomley, M. Nissum, P. Costantino, R. Rappuoli, G. Spraggon, Structural basis for lack of toxicity of the diphtheria toxin mutant CRM 197. Proceedings of the National Academy of Sciences 109,5229 (2012).
87. J. de Wit, M. E. Emmelot, M. C. M. Poelen, J. Lanfermeijer, W. G. H. Han, C. van Els, P. Kaaijk, The Human CD4(+) T Cell Response against Mumps Virus Targets a Broadly Recognized Nucleoprotein Epitope. J Virol 93, (2019).
88. M. May, C. A. Rieder, R. J. Rowe, Emergent lineages of mumps virus suggest the need für a polyvalent vaccine. Int J Infect Dis 66, 1-4 (2018).
89. M. Ramamurthy, P. Rajendiran, N. Saravanan, S. Sankar, S. Gopalan, B. Nandagopal, Identification of immunogenic β-cell epitope peptides of rubella virus El glycoprotein towards development of highly specific immunoassays and/or vaccine. Conference Abstract, (2019).
90. U. S. F. Tambunan, F. R. P. Sipahutar, A. A. Parikesit, D. Kerami, Vaccine Design for H5N1 Based on B- and T-cell Epitope Predictions. Bioinform Biol Insights 10, 27-35 (2016).
91. Asante, EA. et. al. „A naturally occurring variant of the human prion protein completely prevents prion disease“. Nature. (2015).
92. Crabtree, G. R. & Schreiber, S. L. Three-part inventions: intracellular signaling and induced proximity. Trends Biochem. Sci. 21, 418-22 (1996).
93. Liu, J. et al. Calcineurin Is a Common Target of A and FKBP-FK506 Complexes. Cell 66, 807-815 (1991).
94. Keith, C. T. et al. A mammalian protein targeted by G I -arresting rapamycin-receptor complex. Nature 369, 756-758 (2003).
95. Spencer, D. M., Wandless, T. J., Schreiber, S. L. S. & Crabtree, G. R. Controlling signal transduction with synthetic ligands. Science 262, 1019-24 (1993).
96. Pruschy, M. N. et al. Mechanistic studies of a signaling pathway activated by the organic dimerizer FK10:12. Chem. Biol. 1, 163-172 (1994).
97. Spencer, D. M. et al. Functional analysis of Fas signaling in vivo using synthetic inducers of dimerization. Curr. Biol. 6, 839-847 (1996).
98. Belshaw, P. J., Spencer, D. M., Crabtree, G. R. & Schreiber, S. L. Controlling programmed cell death with a cyclophilin-cyclosporin-based chemical inducer of dimerization. Chem. Biol. 3,731-738 (1996).
99. Yang, J. X., Symes, K., Mercola, M. & Schreiber, S. L. Small-molecule control of insulin and PDGF receptor signaling and the role of membrane attachment. Curr. Biol. 8, 11-18 (1998).
100. Belshaw, P. J., Ho, S. N., Crabtree, G. R. & Schreiber, S. L. Controlling protein association and subcellular localization with a synthetic ligand that induces heterodimerization of proteins. Proc. Natl. Acad. Sci. 93,4604-4607 (2002).
101. Stockwell, B. R. & Schreiber, S. L. Probing the role of homc>meric and heteromeric receptor interactions in TGF-β signaling using small molecule dimenzers. Curr. Biol. 8, 761-773 (2004).
102. Spencer, D. M., Graef, I., Austin, D. J., Schreiber, S. L. & Crabtree, G. R. A general strategy for producing conditional alleles of Src-like tyrosine kinases. Proc. Natl. Acad. Sei. 92, 9805- 9809 (2006).
103. Holsinger, L. J., Spencer, D. M., Austin, D. J., Schreiber, S. L. & Crabtree, G. R. Signal transduction in T lymphocytes using a conditional allele of Sos. Proc. Natl. Acad. Sei. 92, 9810-9814 (2006).
104. Myers, M. G. Insulin Signal Transduction and the 1RS Proteins. Annu. Rev. Pharmacol. Toxicol. 36,615-658 (1996).
105. Watowich, S. S. The erythropoietin receptor: Molecular structure and hematopoietic signaling pathways. J. Investig. Med. 59, 1067-1072 (2011).
106. Blau, C. A., Peterson, K. R., Drachman, J. G. & Spencer, D. M. A proliferation switch for genetically modified cells. Proc. Natl. Acad. Sci. 94, 3076-3081 (2002).
107. Clackson, T. et al. Redesigning an FKBP-ligand interface to generate chemical dimerizers with novel specificity. Proc. Natl. Acad. Sci. 95, 10437-10442 (1998).
108. Diver, S. T. & Schreiber, S. L. Single-step synthesis of cell-permeable protein dimerizers that activate signal transduction and gene expression. J. Am. Chem. Soc. 119, 5106-5109 (1997).
109. Guo, Z. F., Zhang, R. & Liang, F. Sen. Facile functionalixation of FK506 for biological studies by the thiol-ene ‚click‘ reaction. RSC Adv. 4, 11400-11403 (2014).
110. Robinson, D. R., Wu, Y.-M. & Lin, S.-F. The protein tyrosine kinase family of the human genome. Oncogene 19, 5548-5557 (2000).
111. Landrum, M. J. et al. ClinVar: public archive of interpretations of clinically relevant variants. Nucleic Acids Res. 44, D862-D868 (2016).
112. Jinck, M. et al. A Programmable Dual-RNA-Guided DNA Endonuclease in Adaptive Bacterial Immunity. Science 337, 816-821 (2012).
113. Cong, L. et al. Multiplex Genome Engineering Using CRISPR/Cas Systems. Science 339, 819-823 (2013).
114. Mali, P. et al. RNA-Guided Human Genome Engineering via Cas9. Science 339, 823- 826 (2013).
115. Yang, H. et al. One-Step Generation of Mice Carrying Reporter and Conditional Alleles by CRISPR/Cas-Mediated Genome Engineering. Cell 154, 1370-1379 (2013).
116. Kim, S., Kim, D., Cho, S. W., Kim, J. & Kim, J.-S. Highly efficient RNA-guided genome editing in human cells via delivery of purified Cas9 ribonucleoproteins. Genome Res. 24, 1012-1019 (2014).
117. Orlando, S. J. et al. Zinc-finger nuclease-driven targeted integration into mammalian genomes using donors with limited chromosomal homology. Nucleic Acids Res. 38, e152-e152 (2010).
118. Tsai, S. Q. et al. GUlDE-seq enables genome-wide profiling of off-target cleavage by CRISPR-Cas nucleases. Nat. Biotechnol. 33, 187-197 (2015).
119. Suzuki, K. et al. In vivo genome editing via CRISPR/Cas9 mediated homology- independent targeted integration. Nature 540, 144-149 (2016).
120. Kosicki, M., Tomberg, K. & Bradley, A. Repair of double-strand breaks induced by CRISPR- Cas9 leads to large deletions and complex rearrangements. Nat. Biotechnol. 36, 765-771 (2018).
121. Haapanicmi, E., Botla, S., Persson, J., Schmierer, B. & Taipale, J. CRISPR-Cas9 genome editing induces a p53-mediated DNA damage response. Nat. Med. 24, 927-930 (2018).
122. Ihry, R. J. et al. p53 inhibits CRISPR-Cas9 engineering in human pluripotent stem cells. Nat. Med. 24, 939-94fi (2018).
123. Chapman, J. R., Taylor, M. R. G. & Boulton, S. J. Playing die end game: DNA double- strand break repair pathway choice. Mol. Cell 47, 497-510 (2012).
124. Cox, D. B. T., Platt, R. J. & Zhang, F. Therapeutic genome editing: prospects and challenges. Nat. Med. 21, 121-131 (2015).
125. Paquet, D. et al. Efficient introduction of specific homozygous and heterozygous mutations using CRISPR/Cas9. Nature 533,125-129 (2016).
126. Chu, V. T. et al. Increasing the efficiency of homology-directed repair for CRISPR-Cas9- induccd precise gene editing in mammalian cells. Nat. Biotechnol. 33, 543-548 (2015).
127. Maruyama, T. et al. Increasing the efficiency of precise genome editing with CRISPR- Cas9 by inhibition of nonhomologous end joining. Nat. Biotechnol. 33, 538-542 (2015).
128. Rees, H. A., Yeh, W.-H. & Liu, D. R. Development of hRad5l-Cas9 nickase fusions that mediale HDR without double-stranded breaks. Nat. Commun. 10, 1-12 (2019).
129. Komor, A. C., Kim, Y. B., Packer, M. S., Zuris, J. A. & Liu, D. R. Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage. Nature 533, 420- 424 (2016).
130. Gaudelli, N. M. et al. Programmable base editing of A·T to G·C in genomic DNA without DNA cleavage. Nature 551, 464-471 (2017).
131. Gao, X. et al. Treatment of autosomal dominant hearing loss by in vivo delivery of genome editing agents. Nature 553, 217-221 (2018).
132. Ingram, V. M. A specific chemical difference between the globins of normal human and sickle-cell anaemia haemoglobin. Nature 178, 792-794 (1956).
133. Myerowitz, R. & Costigan, F. C. The major defect in Ashkenazi Jews with Tay-Sachs disease is an insertion in the gene for the alpha-chain of beta-hexosaminidase. J. Biol. Chem. 263, 18587-18589 (1988).
134. Zielenski, J. Genotype and Phenotype in Cystic Fibrosis. Respiration 67, 1 17-133 (2000).
135. Mead, S. et al. A Novel Protective Prion Protein Variant that Colocalizes with Kuru Exposure. N. Engt. J. Med. 361, 2056-2065 (2009).
136. Manaffini, L. A. & Sontheimer, E. J. CRISPR interference limits horizontal gene transfer in staphylococci by targeting DNA. Science 322, 1843-1845 (2008).
137. Barrangou, R. et al. CRISPR provides acquired resistance against viruses in prokaryotes. Science 315, 1709-1712 (2007).
138. Jiang, F. & Doudna, J. A. CRISPR-Cas9 Structures and Mechanisms. Annu. Rev. Biophys. 46, 505-529 (2017).
139. Hille, F. et al. The Biology of CRISPR-Cas: Backward and Forward. Cell 172, 1239-1259 (2018).
140. Luan, D. D., Korman, M. H., Jakubczak, J. L. & Eickbush, T. H. Reverse transcription of R2Bm RNA is primed by a nick at the chromosomal target site: a mechanism for non- LTR retrotransposition. Cell 72, 595-605 (1993).
141. Liu, Y., Kao, H.-I. & Bambara, R. A. Flap endonuclease 1: a central component of DNA metabolism. Annu. Rev. Biochem. 73, 589-615 (2004).
142. Rees, H. A. & Liu, D. R. Base editing: precision chemistry on the genome and transcriptome of living cells. Nat. Rev. Genet. 19, 770 (2018).
143. Richardson, C. D., Ray, G. J., DeWitt, M. A., Curie, G. L. & Corn, J. E. Enhancing homology- directed genome editing by catalytically active and inactive CRISPR-Cas9 using asymmeuric donor DNA. Nat. Biotechnol. 34, 339-344 (2016).
144. Qi, L. S. et al. Repurposing CRISPR as an RNA-Guided Platform for Sequence-Specific Control of Gene Expression. Cell 152, 1173-1 183 (2013).
145. Shechner, D. M., Hacisulcyman, E., Younger, S. T. & Rinn, J. L. Multiplexable, locusspecific targeting of long RNAs with CRISPR-Display. Nat. Methods 12,664-670 (2015).
146. Tang, W., Hu, J. H. & Liu, D. R. Aptazyme-embedded guide RNAs enable ligand- responsive genome editing and transcriptional activation. Nat. Commun. 8, 15939 (2017).
147. Jinek, M. et al. Structures of Cas9 Endonucleases Reveal RNA-Mediated Conformational Activation. Science 343, 1247997 (2014).
148. Nishimasu, H. et al. Crystal Structure of Cas9 in Complex with Guide RNA and Target DNA. Cell 156, 935-949 (2014).
149. Jiang, F., Zhou, K., Ma, L., Gressel, S. & Doudna, J. A. A Cas9-guide RNA complex preorganized for target DNA recognition. Science 348, 1477-1481 (2015).
150. Baranauskas, A. et al. Generation and characterization of new highly thermostable and processive M-MuLV reverse transcriptase variants. Protein Eng. Des. Sei. 25, 657-668 (2012).
151. Gerard, G. F. et al. The role of template-primer in protection of reverse transcriptase from thermal inactivation. Nucleic Acids Res. 30, 3118-3129 (2002).
152. Arezi, B. & Hogrefe, H. Novel mutations in Moloney Murine Leukemia Virus reverse transcriptase increase thermostability through tighter binding to template-primer. Nucleic Acids Res. 37,473-481 (2009).
153. Kotewicz, M. L., Sampson, C. M., D'Alessio, J. M. & Gerard, G. F. Isolation of cloned Moloney murine leukemia virus reverse transcriptase lacking ribonuclease H activity. Nucleic Acids Res. 16, 265-277 (1988).
154. Shen, M. W. et al. Predictable and precise template-free CRISPR editing of pathogenic variants. Nature 563, 646-651 (2018).
155. Thuronyi, B. W. et al. Continuous evolution of base editors with expanded target compatibility and improved activity. Nat. Biotechnol. (2019). doi:10.1038/s41587-019- 0193-0
156. Kim, Y. B. et al. Increasing the genome-targeting scope and precision of base editing with engineered Cas9-cytidine deaminase fusions. Nat. Biotechnol. 35, 371-376 (2017).
157. Koblan, L. W. et al. Improving cytidine and adenine base editors by expression optimization and ancestral reconstruction. Nat. Biotechnol. (2018). doi:10.1038/nbt.4172
158. Komor, A. C. et al. Improved base excision repair inhibition and bacteriophage Mu Gam protein yietds C:G-to-T:A base editors with higher efficiency and product purity. Sei. Adv. 3. eaao4774 (2017).
159. Kleinstiver, B. P. et al. High-fidelity CRISPR-Cas9 nucleases with no detectable genome- wide off-target effects. Nature 529, 490-495 (2016).
160. Zuo, E. et al. Cytosine base editor generates substantial off-target single-nucleotide variants in mouse embryos. Science 364, 289-292 (2019).
161. Jin, S. et al. Cytosine, but not adenine, base editors induce genome-wide off-target mutations in rice. Science 364, 292-295 (2019).
162. Kim, D., Kim, D., Lee, G., Cho, S.-I. & Kim, J.-S. Genome-wide target specificity of CRISPR RNA-guided adenine base editors. Nat. Biotechnol. 37, 430-435 (2019).
163. Grünewald, J. et al. Transcriptome-wide off-target RNA editing induced by CRISPR- guided DNA base editors. Nature 569, 433-437 (2019).
164. Zhou, C. et al. Off-target RNA mutation induced by DNA base editing and its elimination by mutagenesis. Nature 571, 275-278 (2019).
165. Rees, H. A., Wilson, C., Doman, J. L. & Liu, D. R. Analysis and minimization of cellular RNA editing by DNA adenine base editors. Sei. Adv. 5, eaax5717 (2019).
166. Ostertag, E. M. & Kazazian Jr, H. H. Biology of Mammalian L1 Retrotransposons. Annu. Rev. Genet. 35, 501-538 (2001).
167. Griffiths, D. J. Endogenous retroviruses in the human genome sequence, Genome Biol. 2, REVIEWS1017 (2001).
168. Berkhout, S., Jebbink, M. & Zsiros, J. Identification of an Active Reverse Transcriptase Enzyme Encoded by a Human Endogenous HERV-K Retrovirus. J. Virol. 73, 2365-2375 (1999).
169. Halvas, E. K., Svarovskaia, E. S. & Pathak, V. K. Role of Murine Leukemia Virus Reverse Transcriptase Deoxyribonucleoside Triphosphate-Binding Site in Retroviral Replication and In Vivo Fidelity. J. Virol. 74, 10349-10358 (2000).
170. Dever, D. P. et al. CRISPR/Cas9 Beta-globin Gene Targeting in Human Hematopoietic Stern Cells. Nature 539, 384-389 (2016).
171. Park, S. H. et al. Highly efficient editing of the β-globin gene in patient-derived hematopoietic stem and progenitor cells to treat sickle cell disease. Nucleic Acids Res. doi:10.1093/nar/gkz475
172. Collinge, J. Prion diseases of humans and animals: their causes and molecular basis. Annu. Rev. Neurosci. 24, 519-550 (2001).
173. Asante, E. A. et al. A naturally occurring variant of the human prion protein completely prevents prion disease. Nature 522, 478-481 (2015).
174. Anzalone, A. V., Lin, A. J., Zairis, S., Rabadan, R. & Cornish, V. W. Reprogramming eukaryotic translation with ligand-responsive synthetic RNA switches. Nat. Methods 13, 453- 458 (2016).
175. Badran, A. H. et al. Continuous evolution of Bacillus thuringiensis toxins overcomes insect resistance. Nature 533, 58-63 (2016).
176. Anders, C. & Jinek, M. Chapter One - In Vitro Enzymology of Cas9. in Methods in Enzymology (eds. Doudna, J. A. & Sontheimer, E. J.) 546, 1-20 (Academic Press, 2014).
177. Pirakitikulr, N., Ostrov, N., Perulta-Yahya, P. & Cornish, V. W. PCRIess library mutagenesis via oligonucleotide recombination in yeast. Protein Sei. Publ. Protein Soc. 19, 2336-2346 (2010).
178. Clement, K. et al. CRISPResso2 provides accurate and rapid genome editing sequence analysis. Nat. Biotechnol. 37, 224-226 (2019).
179. Tsai, S. Q. et al. GUIDE-seq enables genome-wide proftling of off-target cleavage by CRISPR-Cas nucleases. Nat. Biotechnol. 33, 187-197 (2015).
180. Kleinstiver, B. P. et al. High-fidelity CRISPR-Cas9 nucleases with no detectable genome- wide off- target effects. Nature 529, 490-495 (2016).
181. Koblan, L. W. et al. Improving cytidine and adenine base editors by expression optimization and ancestral reconstruction. Nat. Biotechnol. (2018). doi: 10.1038/nbt.4172
182. Baranauskas, A. et al. Generation and characterization of new highly thermostable and processive M-MuLV reverse transcriptase variants. Protein Eng. Des. Sei. 25, 657-668 (2012).
183. Schechner, DM, Hacisuleyman E.. Younger ST, Rinn JL. Nat Methods 664-70 (2015).
184. Brown JA, et al. Nat Struct Mol Biol 633-40 (2014).
185. Conrad NA and Steitz JA. EMBO J 1831-41 (2005).
186. Bartlett JS, et al. Proc Natl Acad Sei USA 8852-7 (1996).
187. Mitton-Fry RM, DeGregorio SJ, Wang J, Steitz TA, Steitz JA. Science 1244-7 (2010).
188. Forster AC, Symons RH. Cell. 1987.
189. Weinberg Z, Kim PB, Chen TH, Li S, Harris KA, Lünse CE, Breaker RR. Nat. Chem. Biol. 2015.
190. Feldstein PA, Buzayan JM, Bruening G. Gene 1989.
191. Saville BJ, Collins RA. Cell. 1990.
192. Roth A, Weinberg Z, Chen AG. Kim PG, Ames TD, Breaker RR. Nat Chem Biol. 2013.
193. Borchardt EK, et al. RNA 1921-30 (2015).
194. Zhang Y, et al. Mol Cell 792-806 (2013).
195. Dang Y, et al. Genome Biol 280 (2015).
196. Schaefer M, Kapoor U, and Jantsch MF. Open Biol 170077 (2017).
197. Nahar S, et al. Chem Comm 2377-80 (2018).
198. Gao Y and Zhao Y. J Integr Plant Biol 343-9 (2014).
199. Dubois N, Marquet R, Paillart J, Bemacchi S. Front Microbiol 527 (2018).
200. Costa M and Michel F. EMBO J 1276-85 (1995).
201. Hu JH, et al. Nature 57-63 (2018).
202. Furukawa K, Gu H, Breaker RR. Methods Mol Biol. 209-20 (2014).
203. Zettler, J., Schütz, V. & Mootz, H. D. The naturally split Npu DnaE intein exhibits an extraordinarily high rate in the protein trans-splicing reaction. FEBS Lett. 583, 909-914 (2009).
204. Kügler, S., Kilic, E. & Bähr, M. Human synapsin 1 gene promoter confers highly neuronspecific long-term transgene expression from an adenoviral vector in the adult rat brain depending on the transduced area. Gene Ther. 10, 337-347 (2003).
205. de Felipe, P., Hughes, L. E., Ryan, M. D. & Brown, J. D. Co-translational, intraribosoinat cleavage of polypeptides by the foot-and-mouth disease virus 2A peptide. J. Biol. Chem. 278, 11441-11448 (2003).
206. Levy, J. M. & Nicoll, R. A. Membrane-associated guanylate kinase dynamics reveat regional and developmental specificity of synapse stability. J. Physiol. 595, 1699-1709 (2017).
207. Li, B. & Dewey, C. N. RSEM: accurate transcript quantification from RNA-Seq data with or without a reference genome. BMC Bioinformatics 12, 323 (2011).
208. Ritchie, M. E. et al. limma powers differential expression analyses for RNA-sequencing and microarray studies. Nucleic Acids Res. 43, e47-e47 (2015).

ÄQUIVALENTE UND UMFANG
In den Artikeln können „ein“/„eine“/„einer“ und „der“/„die“/„das“ eines oder mehrere bedeuten, sofern nicht das Gegenteil angegeben oder anderweitig aus dem Kontext ersichtlich ist. Ausführungsformen oder Beschreibungen, die ein „oder“ zwischen einem oder mehreren Mitgliedern einer Gruppe beinhalten, gelten als erfüllt, wenn ein, mehr als ein oder alle Mitglieder der Gruppe in einem bestimmten Produkt oder Verfahren vorhanden sind, darin verwendet werden oder anderweitig für dieses relevant sind, sofern nicht das Gegenteil angegeben oder anderweitig aus dem Zusammenhang ersichtlich ist. Die Erfindung beinhaltet Ausführungsformen, bei denen genau ein Mitglied der Gruppe in einem bestimmten Produkt oder Verfahren vorhanden ist, verwendet wird oder anderweitig für dieses relevant ist. Die Erfindung beinhaltet Ausführungsformen, bei denen mehr als ein oder alle Mitglieder der Gruppe in einem bestimmten Produkt oder Verfahren vorhanden sind, darin verwendet werden oder anderweitig für dieses relevant sind.
Ferner umfasst die Offenbarung alle Variationen, Kombinationen und Permutationen, bei denen eine oder mehrere Beschränkungen, Elemente, Klauseln und beschreibende Begriffe aus einem oder mehreren der aufgeführten Ansprüche in einen anderen Anspruch aufgenommen werden. Zum Beispiel kann jeder Anspruch, der von einem anderen Anspruch abhängt, modifiziert werden, um eine oder mehrere Beschränkungen zu beinhalten, die in einem anderen Anspruch enthalten sind, der von demselben Grundaanspruch abhängt. Werden Elemente in Form von Listen dargestellt, z. B. in Form von Markush-Gruppen, so wird jede Untergruppe der Elemente ebenfalls offenbart, und jedes Element kann aus der Gruppe entfernt werden. Es versteht sich, dass im Allgemeinen, wenn die Erfindung oder Aspekte der Erfindung als bestimmte Elemente und/oder Merkmale umfassend bezeichnet wird/werden, bestimmte Ausführungsformen der Offenbarung oder Aspekte der Offenbarung aus solchen Elementen und/oder Merkmalen bestehen oder im Wesentlichen daraus bestehen. Der Einfachheit halber wurden diese Ausführungsformen hierin nicht spezifisch in diesen Worten dargestellt. Es wird auch darauf hingewiesen, dass die Begriffe „umfassend“ und „enthaltend“ offen zu verstehen sind und die Aufnahme zusätzlicher Elemente oder Schritte erlauben. Wo Bereiche angegeben sind, sind Endpunkte beinhaltet. Darüber hinaus können Werte, die als Bereiche ausgedrückt sind, jeden beliebigen spezifischen Wert oder Teilbereich innerhalb der angegebenen Bereiche in verschiedenen Ausführungsformen der Erfindung annehmen, und zwar bis zum Zehntel der Einheit der unteren Grenze des Bereichs, sofern der Kontext nicht eindeutig etwas anderes vorschreibt, oder sich aus dem Kontext und dem Verständnis eines Fachmanns ergibt.
Diese Anmeldung bezieht sich auf verschiedene erteilte Patente, veröffentlichte Patentanmeldungen, Fachzeitschriftenartikel und andere Veröffentlichungen, die alle hierin durch Bezugnahme aufgenommen sind. Im Falle eines Widerspruchs zwischen einer der enthaltenen Referenzen und der vorliegenden Spezifikation ist die Spezifikation maßgebend. Darüber hinaus kann jede bestimmte Ausführungsform der vorliegenden Erfindung, die zum Stand der Technik gehört, ausdrücklich von einer oder mehreren Ausführungsformen ausgeschlossen werden. Da solche Ausführungsformen als dem Fachmann bekannt vorausgesetzt werden, können sie ausgeschlossen sein, auch wenn der Ausschluss hierin nicht ausdrücklich dargelegt ist. Jede bestimmte Ausführungsform der Erfindung kann aus jedem beliebigen Grund ausgeschlossen werden, unabhängig davon, ob dies mit dem Stand der Technik zusammenhängt oder nicht.
Der Fachmann wird viele Äquivalente zu den hierin beschriebenen Ausführungsformen erkennen oder in der Lage sein, sie durch einfaches Experimentieren festzustellen. Der Umfang der hierin beschriebenen Ausführungsformen ist nicht auf die obige Beschreibung beschränkt, sondern entspricht vielmehr den Sätzen in den beigefügten Ausführungsformen. Dem Fachmann erschließt sich, dass verschiedene Änderungen und Modifikationen an dieser Beschreibung vorgenommen werden können, ohne vom Geist oder Umfang der vorliegenden Erfindung, wie sie in den folgenden Ausführungsformen definiert ist, abzuweichen.
ZITATE ENTHALTEN IN DER BESCHREIBUNG
Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
Zitierte Patentliteratur

US 63022397 B [0002]
US 63116785 B [0002]
US 62820813 B [0003]
US 62858958 B [0003]
US 62889996 B [0003]
US 62922654 B [0003]
US 62913553 B [0003]
US 62973558 B [0003]
US 62931195 B [0003]
US 62944231 B [0003]
US 62974537 B [0003]
US 62991069 B [0003]
US 63100548 B [0003]
US 5496714 A [0128]
US 5834247 A [0128]
EP 2000011690 A [0141, 0445]
WO 2001038547 A [0141]
US 5244797 A [0176]
WO 2010028347 A [0179, 0303, 0369]
WO 2012088381 A [0179, 0303, 0369]
US 9023594 B [0179, 0303, 0369]
WO 2015134121 A [0179, 0303, 0369]
WO 2016168631 A [0179, 0303, 0369]
WO 2013045632 A [0193, 0319, 0475]
WO 2014055782 A [0193, 0319, 0475]
WO 2016069774 A [0193, 0319, 0475]
EP 2877490 A [0193, 0319, 0475]
US 12965590 B [0336]
US 13426991 B [0336]
US 8450471 B [0336]
US 13427040 B [0336]
US 8440431 B [0336]
US 13427137 B [0336]
US 8440432 B [0336]
US 13738381 B [0336]
WO 2015027134 A [0336]
US 9181535 B [0336]
US 5436149 A [0339]
US 4889818 A [0339]
US 4965185 A [0339]
US 5079352 A [0339]
US 5614365 A [0339]
US 5374553 A [0339]
US 5270179 A [0339]
US 5047342 A [0339]
US 5512462 A [0339]
WO 9206188 A [0339]
WO 9206200 A [0339]
WO 9610640 A [0339]
US 5677152 A [0351]
US 6479264 B [0351]
US 6183998 B [0351]
US 4663290 A [0355]
US 20110059502 A [0489]
US 61836080 B [0520]
KR 710351 [0586]
US 5049386 A [0611, 0662, 0847]
US 4946787 A [0611, 0612, 0662, 0663, 0847, 0848]
US 4897355 A [0611, 0662, 0847]
WO 9117424 A [0611, 0662, 0847]
WO 9116024 A [0611, 0662, 0847]
US 4186183 A [0612, 0663, 0848]
US 4217344 A [0612, 0663, 0848]
US 4235871 A [0612, 0663, 0848]
US 4261975 A [0612, 0663, 0848]
US 4485054 A [0612, 0663, 0848]
US 4501728 A [0612, 0663, 0848]
US 4774085 A [0612, 0663, 0848]
US 4837028 A [0612, 0663, 0848]
US 4797368 A [0614]
WO 9324641 A [0614]
US 5173414 A [0614]
US 20030087817 A [0615, 0850]
US 20120322861 A [0619]
US 2014028330 A [0669]
US 8822663 B2 [0669]
ES 2740248 T3 [0669]
EP 2755693 A4 [0669]
EP 2755986 A4 [0669]
WO 2014152940 A1 [0669]
EP 3450553 B1 [0669]
EP 3362461 A1 [0669]
US 4880635 A [0813]
US 4906477 A [0813]
US 4911928 A [0813]
US 4917951 A [0813]
US 4920016 A [0813]
US 4921757 A [0813]
US 5139941 A [0833]
US 5962313 A [0833]
US 9526784 B [0849]
US 9737604 B [0849]

Zitierte Nicht-Patentliteratur

U01AI142756, RM1HG009490, R01EB022376 und R35GM118062 [0001]
akte Nr. B1195.70074US00 [0003]
B1195.70074US01 [0003]
B1195.70074US02 [0003]
B1 195.70083US00 [0003]
B1195.70074US03 [0003]
B1 195.70083US01 [0003]
B1 195.70074US04 [0003]
B1195.70074US05 [0003]
akte Nr. B1195.70083US02 [0003]
B1 195.70074US06 [0003]
B1195.70083US03 [0003]
PCT/US20/23721; PCT/US20/23730; PCT/US20/23713; PCT/US20/23712; PCT/US20/23727; PCT/US20/23724; PCT/US20/23725; PCT/LJS20/23728; PCT/US20/23732; PCT/US20/23723; PCT/US20/23553; und PCT/US20/23583 [0003]
Camarero und Muir, J. Amer. Chem. Soc., 121:5597-5598 (1999); Chong, et al., Gene, 192:271-281 (1997), Chong, et al., Nucleic Acids Res., 26:5109-5115 (1998); Chong, et al., J. Biol. Chem., 273:10567-10577 (1998); Cotton, et al. J. Am. Chem. Soc., 121:1100-1101 (1999); Evans, et al., J. Biol. Chem., 274:18359-18363 (1999); Evans, et al., J. Biol. Chem., 274:3923-3926 (1999); Evans, et al., Protein Sci., 7:2256-2264 (1998); Evans, et al., J. Biol. Chem., 275:9091-9094 (2000); Iwai und Pluckthun, FEBS Lett. 459:166-172 (1999); Mathys, et al., Gene, 231:1-13 (1999); Mills, et al., Proc. Natl. Acad. Sci. USA 95:3543-3548 (1998); Muir, et al., Proc. Natl. Acad. Sci. USA 95:6705-6710 (1998); Otomo, et al., Biochemistry 38:16040-16044 (1999); Otomo, et al., J. Biolmol. NMR 14:105-114 (1999); Scott, et al., Proc. Natl. Acad. Sci. USA 96:13638-13643 (1999); Severinov und Muir, J. Biol. Chem., 273:16205-16209 (1998); Shingledecker, et al., Gene, 207:187-195 (1998); Southworth, et al., EMBO J. 17:918-926 (1998); Southworth, et al., Biotechniques, 27:110- 120 (1999); Wood, et al., Nat. Biotechnol., 17:889-892 (1999); Wu, et al., Proc. Natl. Acad. Sci. USA 95:9226-9231 (1998a); Wu, et al., Biochim Biophys Acta 1387:422-432 (1998b); Xu, et al., Proc. Natl. Acad. Sci. USA 96:388-393 (1999); Yamazaki, et al., J. Am. Chem. Soc., 120:5591-5592 (1998 [0128]
Brown et al., „Serine recombinases as tools for genome engineering“ Methods. 2011 ;53(4):372-9; Hirano et al., „Site-specific recombinases as tools for heterologous gene integration.“ Appl. Microbiol. Biotechnol. 2011; 92(2):227-39; Chavez und Calos, „Therapeutic applications of the ΦC31 integrase system.“ Curr. Gene Ther. 2011;11(5):375-81; Turan und Bode, „Site-specific recombinases: from tag-and-target- to tag-and-exchange-based genomic modifications.“ FASEB J. 2011; 25(12):4088-107; Venken und Bellen, „Genome-wide manipulations of Drosophila melanogaster with transposons, Flp recombinase, and ΦC31 integrase.“ Methods Mol. Biol. 2012; 859:203-28; Murphy, „Phage recombinases and their applications“ Adv. Virus Res. 2012; 83:367-414; Zhang et al., „Conditional gene manipulation: Cre-ating a new biological era.“ J. Zhejiang Univ. Sci. B. 2012; 13(7):511-24; Karpenshif und Bernstein, „From yeast to mammals: recent advances in genetic control of homologous recombination.“ DNA- Reparatur (Amst). 2012; 1;11(10):781-8 [0173]
Groth et al., „Phage integrases: biology and applications“ J. Mol. Biol. 2004; 335, 667-678; Gordley et al., „Synthese von programmierbaren Integrasen“ Proc. Natl. Acad. Sci. U S A. 2009; 106, 5053-5058 [0173]
Klippel et al., „Isolation and characterisation of unusual gin mutants“ EMBO J. 1988; 7: 3983-3989: Burke et al., „Activating mutations of Tn3 resolvase marking interfaces important in recombination catalysis and its regulation. Mol Microbiol. 2004; 51: 937-948; Olorunniji et al., „Synapsis and catalysis by activated Tn3 resolvase mutants“ Nucleic Acids Res. 2008; 36: 7181-7191; Rowland et al., „Regulatory mutations in Sin recombinase support a structure-based model of the synaptosome“ Mol Microbiol. 2009; 74: 282-298; Akopian et al., „Chimeric recombinases with designed DNA sequence recognition.“ Proc Natl Acad Sci USA. 2003;100: 8688-8691; Gordley et al., „Evolution of programmable zinc finger-recombinases with activity in human cells. J Mol Biol. 2007; 367: 802-813; Gordley et al., „Synthesis of programmable integrases“ Proc Natl Acad Sei USA. 2009; 106: 5053-5058; Amold et al., „Mutants of Tn3 resolvase which do not require accessory binding sites for recombination activity.“ EMBO J. 1999; 18: 1407-1414; Gaj et al., „Structure-guided reprogramming of serine recombinase DNA sequence specificity“ Proc Natl Acad Sei USA. 2011;108(2):498-503; und Proudfoot et al., „Zinc finger recombinases with adaptable DNA sequence specificity.“ PloS One. 2011;6(4):e19537 [0173]
Klippel et al., „Isolation and characterisation of unusual gin mutants“ EMBO J. 1988; 7: 3983-3989: Burke et al., „Activating mutations of Tn3 resolvase marking interfaces important in recombination catalysis and its regulation. MolMicrobiol. 2004; 51: 937-948; Olorunniji et al., „Synapsis and catalysis by activated Tn3 resolvase mutants“ Nucleic Acids Res. 2008; 36: 7181-7191; Rowland et al., „Regulatory mutations in Sin recombinase support a structure- based model of the synaptosome“ Mol Microbiol. 2009; 74: 282-298; Akopian et al., „Chimeric recombinases with designed DNA sequence recognition“ Proc Natl Acad Sei USA. 2003;100: 8688-8691 [0173]
Smith et al., „Diversity in the serine recombinases“ Mol Microbiol. 2002;44: 299-307 [0173]
Guo et al., „Structure of Cre recombinase complexed with DNA in a site-specific recombination synapse“ Nature. 1997; 389:40-46; Hartung et al., „Cre mutants with altered DNA binding properties“ J Biol Chem 1998; 273:22884-22891; Shaikh et al., „Chimeras of the Flp and Cre recombinases: Tests of the mode of cleavage by Flp and Cre. J Mol Biol. 2000; 302:27-48; Rongrong et al., „Effect of deletion mutation on the recombination activity of Cre recombinase“ Acta Biochim Pol. 2005; 52:541-544; Kilbride et al., „Determinants of product topology in a hybrid Cre-Tn3 resolvase site-specific recombination system“ J Mol Biol. 2006; 355:185-195; Warren et al., „A chimeric cre recombinase with regulated directionality“ Proc Natl Acad Sci USA. 2008 105:18278-18283; Van Duyne, „Teaching Cre to follow directions“ Proc Natl Acad Sci USA. 2009 Jan 6;106(1):4-5; Numrych et al., „A comparison of the effects of single-base and triple-base changes in the integrase armtype binding sites on the site-specific recombination of bacteriophage λ.“ Nucleic Acids Res. 1990; 18:3953-3959; Tirumalai et al., „The recognition of core-type DNA sites by λ integrase“ J Mol Biol. 1998; 279:513-527; Aihara et al., „A conformational switch controls the DNA cleavage activity of λ integrase“ Mol Cell. 2003; 12:187-198; Biswas et al., „A structural basis for allosteric control ofDNA recombination by λ integrase“ Nature. 2005; 435:1059-1066; und Warren et al., „Mutations in the amino-terminal domain of λ-integrase have differential effects on integrative and excisive recombination“ Mol Microbiol. 2005; 55:1104-1112 [0173]
Berger et al. In Biochemistry 22:2365-2372 (1983 [0176]
Gerard, G. R., DNA 5:271-279 (1986) und Kotewicz, M. L., et al., Gene 35:249-258 (1985 [0176]
PCT/US2009/056194 [0179, 0303, 0369]
PCT/US2011/066747 [0179, 0303, 0369]
PCT/US2015/012022 [0179, 0303, 0369]
PCT/US2016/027795 [0179, 0303, 0369]
Stevens et al., „A promiscuous split intein with expanded protein engineering applications“, PNAS, 2017, Vol.114: 8538-8543; Iwai et al., „Highly efficient protein trans-splicing by a naturally split DnaE intein from Nostc punctiforme, FEBS Lett, 580: 1853-1858 [0193]
Shingledecker, et al.,Gene 207:187 (1998), Southworth, et al., EMBOJ. 17:918 (1998); Mills, et al., Proc. Natl. Acad. Sei. USA, 95:3543-3548 (1998); Lew, et al., J. Biol. Chem., 273:15887- 15890 (1998); Wu, et al., Biochim. Biophys. Acta 35732:1 (1998b), Yamazaki, et al., J. Am. Chem. Soc. 120:5591 (1998), Evans, et al., J. Biol. Chem. 275:9091 (2000); Otomo, et al., Biochemistry 38:16040-16044 (1999); Otomo, et al., J. Biolmol. NMR 14:105-114 (1999); Scott, et al., Proc. Natl. Acad. Sci. USA 96:13638-13643 (1999 [0194]
Stevens et al. „A promiscuous split intein with expanded protein engineering applications“, PNAS, 2017, Vol. 114: 8538-8543; Iwai et al. „Highly efficient protein trans-splicing by a naturally split DnaE intein from Nostc punctiforme“, FEBS Lett, 580: 1853-1858 [0319]
Shingledecker, et al., Gene 207:187 (1998), Southworth, et al., EMBOJ. 17:918 (1998); Mills, et al., Proc. Natl. Acad. Sci. USA, 95:3543-3548 (1998); Lew, et al., J. Biol. Chem., 273:15887- 15890 (1998); Wu, et al., Biochim. Biophys. Acta 35732:1 (1998b), Yamazaki, et al., J. Am. Chem. Soc. 120:5591 (1998), Evans, et al., J. Biol. Chem. 275:9091 (2000); Otomo, et al., Biochemistry 38:16040-16044 (1999); Otomo, et al., J. Biolmol. NMR 14:105-114 (1999); Scott, et al., Proc. Natl. Acad. Sci. USA 96:13638-13643 (1999 [0320, 0476]
Boch et al., „Breaking the Code of DNA Binding Specificity of TAL-Type III Effectors“, Science, Bd. 326, S. 1509-1512 (2009), Bogdanove et al., TAL Effectors: Customizable Proteins for DNA Targeting, Science, Bd. 333, S. 1843-1846 (2011), Cade et al., „Highly efficient generation of heritable zebrafish gene mutations using homo- and heterodimeric TALENs“, Nucleic Acids Research, Bd. 40, S. 8001- 8010 (2012 [0336]
Carroll et al. „Genome Engineering with Zinc-Finger Nucleases“, Genetics, Aug 2011, Vol. 188: 773-782; Durai et al. „Zinc finger nucleases: custom-designed molecular scissors for genome engineering of plant and mammalian cells,“ Nucleic Acids Res, 2005, Vol. 33: 5978-90 [0337]
Gaj et al. „ZFN, TALEN, and CRISPR/Cas-based methods for genome engineering,“ Trends Biotechnol. 2013, Vol.31: 397-405 [0337]
Barnes, W. M., Gene 112:29-35 (1992); Lawyer, F. C., et al., PCR Meth. Appl. 2:275-287 (1993); Flaman, J.-M, et al., Nuc. Acids Res. 22(15): 3259- 3260(1994 [0339]
Kacian et al., 1971, Biochim. Biophys. Acta 46: 365-83; Yang et al., 1972, Biochem. Biophys. Res. Comm. 47: 505-11; Gerard et al., 1975, J. Virol. 15: 785-97; Liu et al., 1977, Arch. Virol. 55 187-200; Kato et al., 1984, J. Virol. Methods 9: 325-39; Luke et al., 1990, Biochem. 29: 1764-69 and Le Grice et al., 1991, J. Virol. 65: 7004-07 [0354]
Gerard, G. R., DNA:271-79 (1986); Kotewicz, M. L., et al., Gene 35:249-58 (1985); Tanese, N., et al., Proc. Natl. Acad. Sci. (USA):4944-48 (1985); Roth, M. J., at al., J. Biol. Chem. 260:9326-35 (1985); Michel, F., et al., Nature 316:641-43 (1985); Akins, R. A., et al., Cell 47:505-16 (1986), EMBO J. 4:1267-75 (1985); und Fawcett, D. F., Cell 47:1007-15 (1986 [0355]
Bebenek et al. „Error-prone Polymerization by HIV-1 Reverse Transcriptase“, JBiol Chem, 1993, Vol. 268: 10324-10334 [0371]
Sebastian-Martin et al. „Transcriptional inaccuracy threshold attenuates differences in RNA-dependent DNA synthesis fidelity between retroviral reverse transcriptases“, Scientific Reports, 2018, Vol. 8: 627 [0371]
Johansson et al. „RNA recognition by the MS2 phage coat protein“, Sein Virol, 1997, Vol. 8(3): 176-185; Delebecque et al. „Organization of intracellular reactions with rationally designed RNA assemblies,“ Science, 2011, Vol. 333: 470-474; Mali et al. „Cas9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering“, Nat. Biotechnol., 2013, Vol.31: 833-838; und Zalatan et al. „Engineering complex synthetic transcriptional programs with CRISPR RNA scaffolds“, Cell, 2015, Vol. 160: 339-350 [0478]
A. R. Gruber et al., 2008, Cell 106(1): 23-24; und PA Carr und GM Church, 2009, Nature Biotechnology 27(12): 1151-62 [0520]
BI-2013/004A [0520]
Anderson, Science 256:808-813 (1992); Nabel & Felgner, TIBTECH 11:211-217 (1993); Mitani & Caskey, TIBTECH 11:162- 166 (1993); Dillon, TIBTECH 11:167-175 (1993); Miller, Nature 357:455-460 (1992); Van Brunt, Biotechnology 6(10):1149-1154 (1988); Vigne, Restorative Neurology and Neuroscience 8:35-36 (1995); Kremer & Perricaudet, British Medical Bulletin 51(1):31-44 (1995); Haddada et al., in Current Topics in Microbiology and Immunology Doerfler and Bihm (eds) (1995); and Yu et al., Gene Therapy 1 :13-26 (1994 [0610]
Crystal, Science 270:404-410 (1995); Blaese et al., Cancer Gen Ther. 2:291-297 (1995); Behr et al., Bioconjugate Chem. 5:382-389 (1994); Remy et al., Bioconjugate Chem. 5:647-654 (1994); Gao et al., Gene Therapy 2:710-722 (1995); Ahmad et al., Cancer Res. 52:4817-4820 (1992 [0612, 0663, 0848]
Buchscher et al ., J. Virol. 66:2731-2739 (1992); Johann et al., J. Virol. 66:1635-1640 (1992); Sommnerfelt et al., Virol. 176:58-59 (1990); Wilson et al., J. Virol. 63:2374-2378 (1989); Miller et al., J. Virol. 65:2220-2224 (1991); PCT/US94/05700 [0614]
West et al., Virology 160:38-47 (1987 [0614]
Kotin, Human Gene Therapy 5:793-801 (1994); Muzyczka, J. Clin. Invest. 94:1351 (1994 [0614]
Tratschin et al., Mol. Cell. Biol. 5:3251-3260 (1985); Tratschin et al., Mol. Cell. Biol. 4:2072-2081 (1984); Hermonat & Muzyczka, PNAS 81:6466-6470 (1984); und Samulski et al., J. Virol. 63:03822- 3828 (1989 [0614]
Bagynszky et al. „Characterization of mutations in PRNP (prion) gene and their possible roles in neurodegenerative disease“, Neuropsychiatr Dis Treat., 2018; 14: 2067-2085 [0792]
Zhang YP et al., Gene Ther. 1999, 6:1438-47 [0813]
„Gene delivery to skeletal muscle results in sustained expression and systemic delivery of a therapeutic protein". Kessler PD, Podsakoff GM, Chen X, McQuiston SA, Colosi PC, Matelis LA, Kurtzman GJ, Byme BJ. Proc Natl Acad Sei USA. 1996 Nov 26;93(24):14082-7 [0833]
Curtis A. Machida. „Methods in Molecular Medicine™. Viral Vectors for Gene Therapy Methods and Protocols.“ 10.1385/1-59259-304-6:201 [0833]
t. Siehe Rees, H.A. et al. „Improving the DNA specificity and applicability of base editing through protein engineering and protein delivery“, Nat. Commun. 8, 15790 (2017 [0849]

Claims

Ein System zum gleichzeitigen Editieren beider Stränge einer doppelsträngigen DNA- Sequenz an einer zu editierenden Zielstelle, wobei das System einen ersten Primer-Editor- Komplex und einen zweiten Primer-Editor-Komplex umfasst, wobei jeder der ersten und zweiten Primer-Editor-Komplexe umfasst: (1) einen Primer-Editor, umfassend (i) ein Nukleinsäure-programmierbares DNA-bindendes Protein (napDNAbp) und (ii) ein Polypeptid mit einer RNA-abhängigen DNA-Polymerase-Aktivität; und (2) eine pegRNA, die eine Spacersequenz, einen gRNA-Kern, eine DNA-Synthese-Template und eine Primer- Bindungsstelle umfasst, wobei die DNA-Synthese-Template der pegRNA des ersten Prime- Editor-Komplexes eine erste einzelsträngige DNA-Sequenz kodiert und die DNA-Synthese- Template der pegRNA des zweiten Prime-Editor-Komplexes eine zweite einzelsträngige DNA-Sequenz kodiert, wobei die erste einzelsträngige DNA-Sequenz und die zweite einzelsträngige DNA-Sequenz jeweils eine Region der Komplementarität zur anderen umfassen, und wobei die erste einzelsträngige DNA-Sequenz und die zweite einzelsträngige DNA-Sequenz einen Duplex bilden, der einen editierten Abschnitt im Vergleich zur DNA- Sequenz an der zu editierenden Zielstelle umfasst, der in die zu editierende Zielstelle integriert wird.
System nach Anspruch 1, wobei der Prime-Editor des ersten Prime-Editor-Komplexes, des zweiten Prime-Editor-Komplexes oder sowohl des ersten Prime-Editor-Komplexes als auch des zweiten Prime-Editor-Komplexes ein Fusionsprotein ist, das das napDNAbp und das Polypeptid mit einer RNA-abhängigen DNA-Polymerase-Aktivität umfasst.
Das System nach Anspruch 1 oder 2, wobei der erste Prime-Editor-Komplex und der zweite Prime-Editor-Komplex denselben Prime-Editor umfassen.
Das System nach Anspruch 1 oder 2, wobei der erste Prime-Editor-Komplex und der zweite Prime-Editor-Komplex unterschiedliche Prime-Editoren umfassen.
Das System nach einem der Ansprüche 1-4, wobei das napDNAbp eine Cas9-Domäne oder eine Variante davon ist.
Das System nach einem der Ansprüche 1-5, wobei das napDNAbp eine nukleaseaktive Cas9-Domäne, eine Nuklease-inaktive Cas9-Domäne, eine Cas9-Nickase-Domäne oder eine Variante davon ist.
Das System nach einem der Ansprüche 1-4, wobei das napDNAbp ausgewählt ist aus der Gruppe bestehend aus: Cas9, Cas12e, Cas12d, Cas12a, Cas12b1, Cas13a, Cas12c, CasX, CasY und Argonaute.
Das System nach einem der Ansprüche 1-7, wobei das napDNAbp eine Nickase- Aktivität aufweist.
Das System nach einem der Ansprüche 1-4, wobei das napDNAbp eine Aminosäuresequenz einer der SEQ-ID-NR.: 18-88 umfasst, oder eine Aminosäuresequenz umfasst, die mindestens 80 %, 85 %, 90 %, 95 % oder 99 % Sequenzidentität mit einer beliebigen SEQ-ID-NR: 18-88 hat.
Das System nach einem der Ansprüche 1-9, wobei das Polypeptid mit einer RNA- abhängigen DNA-Polymerase-Aktivität eine reverse Transkriptase ist.
Das System nach einem der Ansprüche 1-10, wobei das Polypeptid mit einer RNA- abhängigen DNA-Polymerase-Aktivität eine Aminosäuresequenz nach einer der folgenden SEQ-ID-NR.: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159 und 700-766 umfasst, oder eine Aminosäuresequenz umfasst, die mindestens 80 %, 85 %, 90 %, 95 % oder 99 % Sequenzidentität mit einer beliebigen von SEQ-ID-NR: 89-100, 105-122, 128-129 und 132 hat.
Das System nach einem der Ansprüche 1 bis 11, wobei der Prime-Editor weiterhin einen Linker umfasst, der das napDNAbp und das Polypeptid mit der RNA-abhängigen DNA- Polymerase-Aktivität miteinander verbindet.
System nach Anspruch 12, wobei der Linker eine Aminosäuresequenz aus einer der SEQ-ID-NR.: 166-177 umfasst, oder eine Aminosäuresequenz umfasst, die mindestens 80 %, 85 %, 90 %, 95 % oder 99 % Sequenzidentität mit einer beliebigen SEQ-ID-NR: 166-177 hat.
Das System nach Anspruch 12 oder 13, wobei der Linker 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49 oder 50 Aminosäuren lang ist.
Das System nach einem der Ansprüche 1-14, wobei die pegRNA eine Nukleotidsequenz einer der SEQ-ID-NR.: 325-330, 499-505, 101-104, 181-183 und 223-244 umfasst, oder eine Nukleotidsequenz umfasst, die mindestens 80 %, 85 %, 90 %, 95 % oder 99 % Sequenzidentität mit einer beliebigen von SEQ-ID-NR: 325-330,499-505,101-104,181- 183 und 223-244 hat.
Das System nach einem der Ansprüche 1-15, wobei die Spacer-Sequenz der pegRNA des ersten Prime-Editor-Komplexes an eine erste Bindungsstelle auf einem ersten Strang der doppelsträngigen DNA-Sequenz stromaufwärts von der zu editierenden Zielstelle bindet.
Das System nach einem der Ansprüche 1-16, wobei die Spacer-Sequenz der pegRNA des zweiten Prime-Editor-Komplexes an eine zweite Bindungsstelle auf einem zweiten Strang der doppelsträngigen DNA-Sequenz stromabwärts von der zu editierenden Zielstelle bindet.
System nach Anspruch 17, wobei die Bindung der Spacer-Sequenz der pegRNAs des ersten und zweiten Prime-Editor-Komplexes in Gegenwart einer PAM-Sequenz zum Nicking des ersten bzw. zweiten Strangs an einer Einkerbung proximal zu den PAM-Sequenzen auf jedem Strang durch die napDNAbps des ersten und zweiten Prime-Editor-Komplexes führt.
System nach Anspruch 18, wobei die erste und zweite Bindungsstelle zwei Enden einer zusammenhängenden Region doppelsträngiger DNA definieren, die die zu editierende Zielstelle umfasst.
System nach Anspruch 19, wobei der zusammenhängende Bereich zwischen der ersten und zweiten Bindungsstelle mindestens 10 Nukleobasenpaare, mindestens 11 Nukleobasenpaare, mindestens 12 Nukleobasenpaare, mindestens 13 Nukleobasenpaare, mindestens 14 Nukleobasenpaare, mindestens 15 Nukleobasenpaare, mindestens 16 Nukleobasenpaare, mindestens 17 Nukleobasenpaare, mindestens 18 Nukleobasenpaare, mindestens 19 Nukleobasenpaare, mindestens 20 Nukleobasenpaare, mindestens 21 Nukleobasenpaare, mindestens 22 Nukleobasenpaare, mindestens 23 Nukleobasenpaare, mindestens 24 Nukleobasenpaare, mindestens 25 Nukleobasenpaare, mindestens 26 Nukleobasenpaare, mindestens 27 Nukleobasenpaare, mindestens 28 Nukleobasenpaare, mindestens 29 Nukleobasenpaare, mindestens 30 Nukleobasenpaare, mindestens 31 Nukleobasenpaare, mindestens 32 Nukleobasenpaare, mindestens 33 Nukleobasenpaare, mindestens 34 Nukleobasenpaare, mindestens 35 Nukleobasenpaare, mindestens 36 Nukleobasenpaare, mindestens 37 Nukleobasenpaare, mindestens 38 Nukleobasenpaare, mindestens 39 Nukleobasenpaare, oder mindestens 40 Nukleobasenpaare, mindestens 41 Nukleotide, mindestens 42 Nukleotide, mindestens 43 Nukleotide, mindestens 44 Nukleotide, mindestens 45 Nukleotide, mindestens 46 Nukleotide, mindestens 47 Nukleotide, mindestens 48 Nukleotide, mindestens 49 Nukleotide, mindestens 50 Nukleotide, mindestens 51 Nukleotide, mindestens 52 Nukleotide, mindestens 53 Nukleotide, mindestens 54 Nukleotide, mindestens 55 Nukleotide, mindestens 56 Nukleotide, mindestens 57 Nukleotide, mindestens 58 Nukleotide, mindestens 59 Nukleotide, mindestens 60 Nukleotide, mindestens 61 Nukleotide, mindestens 62 Nukleotide, mindestens 63 Nukleotide, mindestens 64 Nukleotide, mindestens 65 Nukleotide, mindestens 66 Nukleotide, mindestens 67 Nukleotide, mindestens 68 Nukleotide, mindestens 69 Nukleotide, mindestens 70 Nukleotide, mindestens 71 Nukleotide, mindestens 72 Nukleotide, mindestens 73 Nukleotide, mindestens 74 Nukleotide, mindestens 75 Nukleotide, mindestens 76 Nukleotide, mindestens 77 Nukleotide, mindestens 78 Nukleotide, mindestens 79 Nukleotide, mindestens 80 Nukleotide, mindestens 81 Nukleotide, mindestens 82 Nukleotide, mindestens 83 Nukleotide, mindestens 84 Nukleotide, mindestens 85 Nukleotide, mindestens 86 Nukleotide, mindestens 87 Nukleotide, mindestens 88 Nukleotide, mindestens 89 Nukleotide, mindestens 90 Nukleotide, mindestens 91 Nukleotide, mindestens 92 Nukleotide, mindestens 93 Nukleotide, mindestens 94 Nukleotid, mindestens 95 Nukleotide, mindestens 96 Nukleotide, mindestens 97 Nukleotide, mindestens 98 Nukleotide, mindestens 99 Nukleotide, mindestens 100 Nukleotide, mindestens 101 Nukleotide, mindestens 102 Nukleotide, mindestens 103 Nukleotide, mindestens 104 Nukleotide, mindestens 105 Nukleotide, mindestens 106 Nukleotide, mindestens 107 Nukleotide, mindestens 108 Nukleotide, mindestens 109 Nukleotide oder mindestens 110 Nukleotide lang ist.
Das System nach Anspruch 19, wobei der zusammenhängende Bereich durch den Duplex ersetzt wird, der den bearbeiteten Teil umfasst.
Das System nach einem der Ansprüche 1-21, wobei die DNA-Synthesematrize mindestens 1 Nukleotid, mindestens 2 Nukleotide, mindestens 3 Nukleotide, mindestens 4 Nukleotide, mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide, mindestens 15 Nukleotide, mindestens 16 Nukleotide, mindestens 17 Nukleotide, mindestens 18 Nukleotide, mindestens 19 Nukleotide, mindestens 20 Nukleotide, mindestens 21 Nukleotide, mindestens 22 Nukleotide, mindestens 23 Nukleotide, mindestens 24 Nukleotide, mindestens 25 Nukleotide, mindestens 26 Nukleotide, mindestens 27 Nukleotide, mindestens 28 Nukleotide, mindestens 29 Nukleotide, mindestens 30 Nukleotide, mindestens 31 Nukleotide, mindestens 32 Nukleotide, mindestens 33 Nukleotide, mindestens 34 Nukleotide, mindestens 35 Nukleotide, mindestens 36 Nukleotide, mindestens 37 Nukleotide, mindestens 38 Nukleotide, mindestens 39 Nukleotide, mindestens 40 Nukleotide, mindestens 41 Nukleotide, mindestens 42 Nukleotide, mindestens 43 Nukleotide, mindestens 44 Nukleotide, mindestens 45 Nukleotide, mindestens 46 Nukleotide, mindestens 47 Nukleotide, mindestens 48 Nukleotide, mindestens 49 Nukleotide, mindestens 50 Nukleotide, mindestens 51 Nukleotide, mindestens 52 Nukleotide, mindestens 53 Nukleotide, mindestens 54 Nukleotide, mindestens 55 Nukleotide, mindestens 56 Nukleotide, mindestens 57 Nukleotide, mindestens 58 Nukleotide, mindestens 59 Nukleotide, mindestens 60 Nukleotide, mindestens 61 Nukleotide, mindestens 62 Nukleotide, mindestens 63 Nukleotide, mindestens 64 Nukleotide, mindestens 65 Nukleotide, mindestens 66 Nukleotide, mindestens 67 Nukleotide, mindestens 68 Nukleotide, mindestens 69 Nukleotide, mindestens 70 Nukleotide, mindestens 71 Nukleotide, mindestens 72 Nukleotide, mindestens 73 Nukleotide, mindestens 74 Nukleotide, mindestens 75 Nukleotide, mindestens 76 Nukleotide, mindestens 77 Nukleotide, mindestens 78 Nukleotide, mindestens 79 Nukleotide, mindestens 80 Nukleotide, mindestens 81 Nukleotide, mindestens 82 Nukleotide, mindestens 83 Nukleotide, mindestens 84 Nukleotide, mindestens 85 Nukleotide, mindestens 86 Nukleotide, mindestens 87 Nukleotide, mindestens 88 Nukleotide, mindestens 89 Nukleotide, mindestens 90 Nukleotide, mindestens 91 Nukleotide, mindestens 92 Nukleotide, mindestens 93 Nukleotide, mindestens 94 Nukleotide, mindestens 95 Nukleotide, mindestens 96 Nukleotide, mindestens 97 Nukleotide, mindestens 98 Nukleotide, mindestens 99 Nukleotide, mindestens 100 Nukleotide, mindestens 101 Nukleotide, mindestens 102 Nukleotide, mindestens 103 Nukleotide, mindestens 104 Nukleotide, mindestens 105 Nukleotide, mindestens 106 Nukleotide, mindestens 107 Nukleotide, mindestens 108 Nukleotide, mindestens 109 Nukleotide oder mindestens 110 Nukleotide lang ist.
System nach einem der Ansprüche 1-22, wobei die erste einzelsträngige DNA-Sequenz und die zweite einzelsträngige DNA-Sequenz die gleichen Längen aufweisen.
System nach einem der Ansprüche 1-22, wobei die erste einzelsträngige DNA-Sequenz und die zweite einzelsträngige DNA-Sequenz unterschiedliche Längen aufweisen.
System nach einem der Ansprüche 1-24, wobei die Komplementaritätsregion mindestens 99 %, mindestens 95 %, mindestens 90 %, mindestens 85 %, mindestens 80 %, mindestens 75 %, mindestens 70 %, mindestens 65 %, mindestens 60 %, mindestens 55 %, mindestens 50 %, mindestens 45 %, mindestens 40 %, mindestens 35 %, mindestens 30 %, mindestens 25 %, mindestens 20 %, mindestens 15 % oder mindestens 10 % der Gesamtlänge der ersten einzelsträngigen DNA-Sequenz oder der zweiten einzelsträngigen DNA-Sequenz beträgt.
System nach Anspruch 25, wobei die Komplementaritätsregion mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide, mindestens 15 Nukleotide, mindestens 16 Nukleotide, mindestens 17 Nukleotide, mindestens 18 Nukleotide, mindestens 19 Nukleotide, mindestens 20 Nukleotide, mindestens 21 Nukleotide, mindestens 22 Nukleotide, mindestens 23 Nukleotide, mindestens 24 Nukleotide, mindestens 25 Nukleotide, mindestens 26 Nukleotide, mindestens 27 Nukleotide, mindestens 28 Nukleotide, mindestens 29 Nukleotide, mindestens 30 Nukleotide, mindestens 31 Nukleotide, mindestens 32 Nukleotide, mindestens 33 Nukleotide, mindestens 34 Nukleotide, mindestens 35 Nukleotide, mindestens 36 Nukleotide, mindestens 37 Nukleotide, mindestens 38 Nukleotide, mindestens 39 Nukleotide, mindestens 40 Nukleotide, mindestens 41 Nukleotide, mindestens 42 Nukleotide, mindestens 43 Nukleotide, mindestens 44 Nukleotide, mindestens 45 Nukleotide, mindestens 46 Nukleotide, mindestens 47 Nukleotide, mindestens 48 Nukleotide, mindestens 49 Nukleotide, mindestens 50 Nukleotide, mindestens 51 Nukleotide, mindestens 52 Nukleotide, mindestens 53 Nukleotide, mindestens 54 Nukleotide, mindestens 55 Nukleotide, mindestens 56 Nukleotide, mindestens 57 Nukleotide, mindestens 58 Nukleotide, mindestens 59 Nukleotide, mindestens 60 Nukleotide, mindestens 61 Nukleotide, mindestens 62 Nukleotide, mindestens 63 Nukleotide, mindestens 64 Nukleotide, mindestens 65 Nukleotide, mindestens 66 Nukleotide, mindestens 67 Nukleotide, mindestens 68 Nukleotide, mindestens 69 Nukleotide, mindestens 70 Nukleotide, mindestens 71 Nukleotide, mindestens 72 Nukleotide, mindestens 73 Nukleotide, mindestens 74 Nukleotide, mindestens 75 Nukleotide, mindestens 76 Nukleotide, mindestens 77 Nukleotide, mindestens 78 Nukleotide, mindestens 79 Nukleotide, mindestens 80 Nukleotide, mindestens 81 Nukleotide, mindestens 82 Nukleotide, mindestens 83 Nukleotide, mindestens 84 Nukleotide, mindestens 85 Nukleotide, mindestens 86 Nukleotide, mindestens 87 Nukleotide, mindestens 88 Nukleotide, mindestens 89 Nukleotide, mindestens 90 Nukleotide, mindestens 91 Nukleotide, mindestens 92 Nukleotide, mindestens 93 Nukleotide, mindestens 94 Nukleotid, mindestens 95 Nukleotide, mindestens 96 Nukleotide, mindestens 97 Nukleotide, mindestens 98 Nukleotide, mindestens 99 Nukleotide, mindestens 100 Nukleotide, mindestens 101 Nukleotide, mindestens 102 Nukleotide, mindestens 103 Nukleotide, mindestens 104 Nukleotide, mindestens 105 Nukleotide, mindestens 106 Nukleotide, mindestens 107 Nukleotide, mindestens 108 Nukleotide, mindestens 109 Nukleotide oder mindestens 110 Nukleotide lang ist und entweder kürzer oder gleich der Länge der gewünschten DNA-Sequenz und ihres Komplements ist.
System nach Anspruch 25, wobei die Komplementaritätsregion der ersten einzelsträngigen DNA-Sequenz und der zweiten einzelsträngigen DNA-Sequenz den Duplex formen, der den editierten Teil umfasst.
System nach einem der Ansprüche 1-27, wobei die erste einzelsträngige DNA-Sequenz und die zweite einzelsträngige DNA-Sequenz jeweils einzelsträngige DNA-Stränge mit 3'- Enden sind.
System nach Anspruch 21, wobei das Ersetzen der zusammenhängenden Region durch den Duplex, der den editierten Teil umfasst, zu einer Insertion, Deletion oder einem Ersetzen von DNA an der Zielstelle führt.
System zum gleichzeitigen Editieren beider Stränge einer doppelsträngigen DNA- Sequenz an einer zu editierenden Zielstelle, wobei das System Folgendes umfasst: a) einen ersten Prime-Editor-Komplex, der Folgendes umfasst: i.einen ersten Prime-Editor, der ein erstes Nukleinsäure-programmierbares DNA- Bindungsprotein (erstes napDNAbp) umfasst, und ein erstes Polypeptid, das eine RNA- abhängige DNA-Polymeraseaktivität umfasst; und ii.eine erste Prime-Editing-Guide-RNA (erste PEgRNA), die an eine erste Bindungsstelle auf einem ersten Strang der doppelsträngigen DNA-Sequenz stromaufwärts der zu editierenden Zielstelle anbindet; b) einen zweiten Prime-Editor-Komplex, der Folgendes umfasst: iii.einen zweiten Prime-Editor, der ein zweites Nukleinsäure-programmierbares DNA- Bindungsprotein (zweites napDNAbp) umfasst, und ein zweites Polypeptid, das eine RNA-abhängige DNA-Polymeraseaktivität umfasst; und iv.eine zweite Prime-Editing-Guide-RNA (zweite PEgRNA), die an eine zweite Bindungsstelle auf einem zweiten Strang der doppelsträngigen DNA-Sequenz stromabwärts der zu editierenden Zielstelle anbindet; wobei die erste PEgRNA eine erste DNA-Synthese-Template umfasst, die eine erste einzelsträngige DNA-Sequenz kodiert, und die zweite PEgRNA mit einer zweiten DNA- Synthese-Template, die eine zweite einzelsträngige DNA-Sequenz kodiert, und wobei der erste Strang und der zweite Strang der doppelsträngigen DNA-Sequenz komplementär sind.
System nach Anspruch 30, wobei der Prime-Editor des ersten Prime-Editor-Komplex, der zweite Prime-Editor-Komplex oder der erste und der zweite Prime-Editor-Komplex ein Fusionsprotein ist, welches das napDNAbp und das Polypeptid mit RNA-abhängiger DNA- Polymeraseaktivität umfasst.
System nach Anspruch 30, wobei die erste und die zweite einzelsträngige DNA- Sequenz jeweils eine Komplementaritätsregion mit der anderen aufweisen.
System nach Anspruch 30, wobei die erste einzelsträngige DNA-Sequenz und die zweite einzelsträngige DNA-Sequenz einen Duplex bilden, der den editierten Teil umfasst, der sich in die zu editierende Zielstelle integriert.
System nach Anspruch 30, wobei die erste einzelsträngige DNA-Sequenz und/oder die zweite einzelsträngige Sequenz keine Sequenzhomologie im Vergleich zur DNA-Sequenz an der Zielstelle umfasst.
System nach Anspruch 30, wobei die erste PEgRNA überdies eine erste Spacer- Sequenz, einen ersten gRNA-Kern und eine erste Primer-Bindungsstelle umfasst, und die zweite PEgRNA überdies eine zweite Spacer-Sequenz, einen zweiten gRNA-Kern und eine zweite Primer-Bindungsstelle umfasst.
System nach einem der Ansprüche 30-35, wobei der erste Prime-Editor-Komplex und der zweite Prime-Editor-Komplex denselben Prime-Editor umfassen.
System nach einem der Ansprüche 30-36, wobei das erste Polypeptid, das eine RNA- abhängige DNA-Polymeraseaktivität umfasst, und das zweite Polypeptid, das eine RNA- abhängige DNA-Polymeraseaktivität umfasst, gleich sind.
System nach einem der Ansprüche 30-37, wobei das erste und/oder zweite napDNAbp eine Cas9-Domäne oder Variante davon ist.
System nach einem der Ansprüche 30-38, wobei das erste und/oder zweite napDNAbp eine Nuklease-aktive Cas9-Domäne, eine Nuklease-inaktive Cas9-Domäne, eine Cas9- Nickase-Domäne oder eine Variante ebendieser ist.
System nach einem der Ansprüche 30-39, wobei das erste und/oder zweite napDNAbp aus der Gruppe ausgewählt ist, die aus Cas9, Cas12e, Cas12d, Cas12a, Cas12b1, Cas13a, Cas12c, CasX, CasY und Argonaute besteht.
System nach einem der Ansprüche 30-40, wobei das napDNAbp eine Nickase-Aktivität aufweist.
System nach einem der Ansprüche 30-41, wobei das erste und/oder zweite napDNAbp eine beliebige Aminosäuresequenz von SEQ-ID-NR: 18-88 umfasst, oder eine Aminosäuresequenz umfasst, die mindestens 80 %, 85 %, 90 %, 95 % oder 99 % Sequenzidentität mit einer beliebigen SEQ-ID-NR: 18-88 hat.
System nach einem der Ansprüche 30-42, wobei das erste und/oder zweite Polypeptid mit einer RNA-abhängigen DNA-Polymeraseaktivität eine reverse Transkriptase ist.
System nach einem der Ansprüche 30-43, wobei das erste und/oder zweite Polypeptid mit einer RNA-abhängigen DNA-Polymeraseaktivität eine Aminosäuresequenz mit einer beliebigen von SEQ-ID-NR: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159 und 700- 766 umfasst, oder eine Aminosäuresequenz umfasst, die mindestens 80 %, 85 %, 90 %, 95 % oder 99 % Sequenzidentität mit einer beliebigen von SEQ-ID-NR: 89-100, 105-122, 128-129 und 132 hat.
System nach einem der Ansprüche 30-44, wobei der erste Prime-Editor überdies einen Linker umfasst, der das erste napDNAbp und das erste Polypeptid mit RNA-abhängiger DNA- Polymeraseaktivität verknüpft; und/oder der zweite Prime-Editor überdies einen Linker umfasst, der das zweite napDNAbp und das zweite Polypeptid mit RNA-abhängiger DNA- Polymeraseaktivität verknüpft.
System nach Anspruch 45, wobei der Linker eine beliebige Aminosäuresequenz von SEQ-ID-NR: 166-177 umfasst, oder eine Aminosäuresequenz umfasst, die mindestens 80 %, 85 %, 90 %, 95 % oder 99 % Sequenzidentität mit einer beliebigen SEQ-ID-NR: 166-177 hat.
System nach Anspruch 45, wobei der Linker eine Länge von 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49 oder 50 Aminosäuren hat.
System nach einem der Ansprüche 30-47, wobei die erste und/oder zweite PEgRNA eine beliebige Nukleotidsequenz von SEQ-ID-NR: 325-330, 499-505, 101-104, 181-183 und 223-244 umfasst, oder eine Nukleotidsequenz umfasst, die mindestens 80 %, 85 %, 90 %, 95 % oder 99 % Sequenzidentität mit einer beliebigen von SEQ-ID-NR: 325-330, 499-505, 101-104, 181-183 und 223-244 hat.
System nach einem der Ansprüche 30-48, wobei die erste Spacer-Sequenz an eine erste Bindungsstelle auf einem ersten Strang der doppelsträngigen DNA-Sequenz stromaufwärts der zu editierenden Zielstelle anbindet.
System nach Anspruch 35, wobei die zweite Spacer-Sequenz des zweiten Prime-Editor- Komplexes an eine zweite Bindungsstelle auf einem zweiten Strang der doppelsträngigen DNA-Sequenz stromabwärts der zu editierenden Zielstelle anbindet.
System nach Anspruch 35, wobei das Anbinden der Spacer-Sequenz des ersten und zweiten Prime-Editor-Komplexes in Präsenz einer PAM-Sequenz zum Nicking des ersten und zweiten Strangs führt, jeweils an einer Nick-Stelle, die proximal zur PAM-Sequenz jedes Strangs beim ersten und/oder zweiten napDNAbp der beiden ersten und zweiten Prime-Editor- Komplexe liegt.
System nach Anspruch 30, wobei die erste und zweite Bindungsstelle zwei Enden einer zusammenhängenden Region doppelsträngiger DNA definieren, welche die zu editierende Zielstelle umfasst.
System nach Anspruch 52, wobei die zusammenhängende Region zwischen der ersten und zweiten Bindungsstelle mindestens 10 Nukleobasenpaare, mindestens 11 Nukleobasenpaare, mindestens 12 Nukleobasenpaare, mindestens 13 Nukleobasenpaare, mindestens 14 Nukleobasenpaare, mindestens 15 Nukleobasenpaare, mindestens 16 Nukleobasenpaare, mindestens 17 Nukleobasenpaare, mindestens 18 Nukleobasenpaare, mindestens 19 Nukleobasenpaare, mindestens 20 Nukleobasenpaare, mindestens 21 Nukleobasenpaare, mindestens 22 Nukleobasenpaare, mindestens 23 Nukleobasenpaare, mindestens 24 Nukleobasenpaare, mindestens 25 Nukleobasenpaare, mindestens 26 Nukleobasenpaare, mindestens 27 Nukleobasenpaare, mindestens 28 Nukleobasenpaare, mindestens 29 Nukleobasenpaare, mindestens 30 Nukleobasenpaare, mindestens 31 Nukleobasenpaare, mindestens 32 Nukleobasenpaare, mindestens 33 Nukleobasenpaare, mindestens 34 Nukleobasenpaare, mindestens 35 Nukleobasenpaare, mindestens 36 Nukleobasenpaare, mindestens 37 Nukleobasenpaare, mindestens 38 Nukleobasenpaare, mindestens 39 Nukleobasenpaare, mindestens 40 Nukleobasenpaare, mindestens 41 Nukleotide, mindestens 42 Nukleotide, mindestens 43 Nukleotide, mindestens 44 Nukleotide, mindestens 45 Nukleotide, mindestens 46 Nukleotide, mindestens 47 Nukleotide, mindestens 48 Nukleotide, mindestens 49 Nukleotide, mindestens 50 Nukleotide, mindestens 51 Nukleotide, mindestens 52 Nukleotide, mindestens 53 Nukleotide, mindestens 54 Nukleotide, mindestens 55 Nukleotide, mindestens 56 Nukleotide, mindestens 57 Nukleotide, mindestens 58 Nukleotide, mindestens 59 Nukleotide, mindestens 60 Nukleotide, mindestens 61 Nukleotide, mindestens 62 Nukleotide, mindestens 63 Nukleotide, mindestens 64 Nukleotide, mindestens 65 Nukleotide, mindestens 66 Nukleotide, mindestens 67 Nukleotide, mindestens 68 Nukleotide, mindestens 69 Nukleotide, mindestens 70 Nukleotide, mindestens 71 Nukleotide, mindestens 72 Nukleotide, mindestens 73 Nukleotide, mindestens 74 Nukleotide, mindestens 75 Nukleotide, mindestens 76 Nukleotide, mindestens 77 Nukleotide, mindestens 78 Nukleotide, mindestens 79 Nukleotide, mindestens 80 Nukleotide, mindestens 81 Nukleotide, mindestens 82 Nukleotide, mindestens 83 Nukleotide, mindestens 84 Nukleotide, mindestens 85 Nukleotide, mindestens 86 Nukleotide, mindestens 87 Nukleotide, mindestens 88 Nukleotide, mindestens 89 Nukleotide, mindestens 90 Nukleotide, mindestens 91 Nukleotide, mindestens 92 Nukleotide, mindestens 93 Nukleotide, mindestens 94 Nukleotide, mindestens 95 Nukleotide, mindestens 96 Nukleotide, mindestens 97 Nukleotide, mindestens 98 Nukleotide, mindestens 99 Nukleotide, mindestens 100 Nukleotide, mindestens 101 Nukleotide, mindestens 102 Nukleotide, mindestens 103 Nukleotide, mindestens 104 Nukleotide, mindestens 105 Nukleotide, mindestens 106 Nukleotide, mindestens 107 Nukleotide, mindestens 108 Nukleotide, mindestens 109 Nukleotide oder mindestens 110 Nukleotide lang ist.
System nach Anspruch 52, wobei die zusammenhängende Region von dem Duplex ersetzt wird, der den editierten Teil enthält.
System nach einem der Ansprüche 30-54, wobei die erste und/oder zweite DNA- Synthese-Template mindestens 1 Nukleotid, mindestens 2 Nukleotide, mindestens 3 Nukleotide, mindestens 4 Nukleotide, mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide, mindestens 15 Nukleotide, mindestens 16 Nukleotide, mindestens 17 Nukleotide, mindestens 18 Nukleotide, mindestens 19 Nukleotide, mindestens 20 Nukleotide, mindestens 21 Nukleotide, mindestens 22 Nukleotide, mindestens 23 Nukleotide, mindestens 24 Nukleotide, mindestens 25 Nukleotide, mindestens 26 Nukleotide, mindestens 27 Nukleotide, mindestens 28 Nukleotide, mindestens 29 Nukleotide, mindestens 30 Nukleotide, mindestens 31 Nukleotide, mindestens 32 Nukleotide, mindestens 33 Nukleotide, mindestens 34 Nukleotide, mindestens 35 Nukleotide, mindestens 36 Nukleotide, mindestens 37 Nukleotide, mindestens 38 Nukleotide, mindestens 39 Nukleotide, mindestens 40 Nukleotide, mindestens 41 Nukleotide, mindestens 42 Nukleotide, mindestens 43 Nukleotide, mindestens 44 Nukleotide, mindestens 45 Nukleotide, mindestens 46 Nukleotide, mindestens 47 Nukleotide, mindestens 48 Nukleotide, mindestens 49 Nukleotide, mindestens 50 Nukleotide, mindestens 51 Nukleotide, mindestens 52 Nukleotide, mindestens 53 Nukleotide, mindestens 54 Nukleotide, mindestens 55 Nukleotide, mindestens 56 Nukleotide, mindestens 57 Nukleotide, mindestens 58 Nukleotide, mindestens 59 Nukleotide, mindestens 60 Nukleotide, mindestens 61 Nukleotide, mindestens 62 Nukleotide, mindestens 63 Nukleotide, mindestens 64 Nukleotide, mindestens 65 Nukleotide, mindestens 66 Nukleotide, mindestens 67 Nukleotide, mindestens 68 Nukleotide, mindestens 69 Nukleotide, mindestens 70 Nukleotide, mindestens 71 Nukleotide, mindestens 72 Nukleotide, mindestens 73 Nukleotide, mindestens 74 Nukleotide, mindestens 75 Nukleotide, mindestens 76 Nukleotide, mindestens 77 Nukleotide, mindestens 78 Nukleotide, mindestens 79 Nukleotide, mindestens 80 Nukleotide, mindestens 81 Nukleotide, mindestens 82 Nukleotide, mindestens 83 Nukleotide, mindestens 84 Nukleotide, mindestens 85 Nukleotide, mindestens 86 Nukleotide, mindestens 87 Nukleotide, mindestens 88 Nukleotide, mindestens 89 Nukleotide, mindestens 90 Nukleotid, mindestens 91 Nukleotide, mindestens 92 Nukleotide, mindestens 93 Nukleotide, mindestens 94 Nukleotide, mindestens 95 Nukleotide, mindestens 96 Nukleotide, mindestens 97 Nukleotide, mindestens 98 Nukleotide, mindestens 99 Nukleotide, mindestens 100 Nukleotide, mindestens 101 Nukleotide, mindestens 102 Nukleotide, mindestens 103 Nukleotide, mindestens 104 Nukleotide, mindestens 105 Nukleotide, mindestens 106 Nukleotide, mindestens 107 Nukleotide, mindestens 108 Nukleotide, mindestens 109 Nukleotide oder mindestens 110 Nukleotide lang ist.
System nach einem der Ansprüche 30-55, wobei die erste einzelsträngige DNA- Sequenz und die zweite einzelsträngige DNA-Sequenz die gleichen Längen aufweisen.
System nach einem der Ansprüche 30-56, wobei die erste einzelsträngige DNA- Sequenz und die zweite einzelsträngige DNA-Sequenz unterschiedliche Längen aufweisen.
System nach einem der Ansprüche 30-57, wobei die Komplementaritätsregion mindestens 99 %, mindestens 95 %, mindestens 90 %, mindestens 85 %, mindestens 80 %, mindestens 75 %, mindestens 70 %, mindestens 65 %, mindestens 60 %, mindestens 55 %, mindestens 50 %, mindestens 45 %, mindestens 40 %, mindestens 35 %, mindestens 30 %, mindestens 25 %, mindestens 20 %, mindestens 15 % oder mindestens 10 % der Gesamtlänge der ersten einzelsträngigen DNA-Sequenz oder der zweiten einzelsträngigen DNA-Sequenz beträgt.
System nach einem der Ansprüche 30-58, wobei die Komplementaritätsregion mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide, mindestens 15 Nukleotide, mindestens 16 Nukleotide, mindestens 17 Nukleotide, mindestens 18 Nukleotide, mindestens 19 Nukleotide, mindestens 20 Nukleotide, mindestens 21 Nukleotide, mindestens 22 Nukleotide, mindestens 23 Nukleotide, mindestens 24 Nukleotide, mindestens 25 Nukleotide, mindestens 26 Nukleotide, mindestens 27 Nukleotide, mindestens 28 Nukleotide, mindestens 29 Nukleotide, mindestens 30 Nukleotide, mindestens 31 Nukleotide, mindestens 32 Nukleotide, mindestens 33 Nukleotide, mindestens 34 Nukleotide, mindestens 35 Nukleotide, mindestens 36 Nukleotide, mindestens 37 Nukleotide, mindestens 38 Nukleotide, mindestens 39 Nukleotide, mindestens 40 Nukleotide, mindestens 41 Nukleotide, mindestens 42 Nukleotide, mindestens 43 Nukleotide, mindestens 44 Nukleotide, mindestens 45 Nukleotide, mindestens 46 Nukleotide, mindestens 47 Nukleotide, mindestens 48 Nukleotide, mindestens 49 Nukleotide, mindestens 50 Nukleotide, mindestens 51 Nukleotide, mindestens 52 Nukleotide, mindestens 53 Nukleotide, mindestens 54 Nukleotide, mindestens 55 Nukleotide, mindestens 56 Nukleotide, mindestens 57 Nukleotide, mindestens 58 Nukleotide, mindestens 59 Nukleotide, mindestens 60 Nukleotide, mindestens 61 Nukleotide, mindestens 62 Nukleotide, mindestens 63 Nukleotide, mindestens 64 Nukleotide, mindestens 65 Nukleotide, mindestens 66 Nukleotide, mindestens 67 Nukleotide, mindestens 68 Nukleotide, mindestens 69 Nukleotide, mindestens 70 Nukleotide, mindestens 71 Nukleotide, mindestens 72 Nukleotide, mindestens 73 Nukleotide, mindestens 74 Nukleotide, mindestens 75 Nukleotide, mindestens 76 Nukleotide, mindestens 77 Nukleotide, mindestens 78 Nukleotide, mindestens 79 Nukleotide, mindestens 80 Nukleotide, mindestens 81 Nukleotide, mindestens 82 Nukleotide, mindestens 83 Nukleotide, mindestens 84 Nukleotide, mindestens 85 Nukleotide, mindestens 86 Nukleotide, mindestens 87 Nukleotide, mindestens 88 Nukleotide, mindestens 89 Nukleotide, mindestens 90 Nukleotide, mindestens 91 Nukleotide, mindestens 92 Nukleotide, mindestens 93 Nukleotide, mindestens 94 Nukleotid, mindestens 95 Nukleotide, mindestens 96 Nukleotide, mindestens 97 Nukleotide, mindestens 98 Nukleotide, mindestens 99 Nukleotide, mindestens 100 Nukleotide, mindestens 101 Nukleotide, mindestens 102 Nukleotide, mindestens 103 Nukleotide, mindestens 104 Nukleotide, mindestens 105 Nukleotide, mindestens 106 Nukleotide, mindestens 107 Nukleotide, mindestens 108 Nukleotide, mindestens 109 Nukleotide oder mindestens 110 Nukleotide lang ist.
System nach einem der Ansprüche 30-59, wobei die Komplementaritätsregion der ersten einzelsträngigen DNA-Sequenz und der zweiten einzelsträngigen DNA-Sequenz einen Duplex formen.
System nach einem der Ansprüche 30-60, wobei die erste einzelsträngige DNA- Sequenz und die zweite einzelsträngige DNA-Sequenz jeweils einzelsträngige DNA-Stränge mit 3'-Enden sind.
System nach Anspruch 54, wobei das Ersetzen der zusammenhängenden Region durch den Duplex, der den editierten Teil umfasst, zu einer Insertion, Deletion oder einem Ersetzen von DNA an der Zielstelle führt.
Polynukleotid, welches das System nach einem der Ansprüche 1-62 kodiert.
Polynukleotid, das den ersten und zweiten Prime-Editor nach einem der Ansprüche 1- 62 kodiert.
Polynukleotid, das die erste und/oder zweite PEgRNA nach einem der Ansprüche 1-62 kodiert.
Polynukleotid, das die erste und/oder zweite PEgRNA nach einem der Ansprüche 30- 62 kodiert.
Polynukleotid, das die erste und zweite PEgRNA nach einem der Ansprüche 1-29 kodiert.
Polynukleotid, das die erste und zweite PEgRNA nach einem der Ansprüche 30-62 kodiert.
Vektor, der ein Polynukleotid nach einem der Ansprüche 63-68 umfasst.
Zelle, die ein Polynukleotid nach einem der Ansprüche 63-68 oder einen Vektor nach Anspruch 69 umfasst.
Pharmazeutische Zusammensetzung, die ein Polynukleotid nach einem der Ansprüche 63-68, einen Vektor nach Anspruch 69 oder eine Zelle nach Anspruch 70 und einen pharmazeutisch verträglichen Hilfsstoff umfasst.
Kit, das ein Polynukleotid nach einem der Ansprüche 63-68, oder einen Vektor nach Anspruch 69 und Anweisungen für das gleichzeitige Editieren beider Stränge einer doppelsträngigen DNA-Sequenz an der zu editierenden Zielstelle umfasst.
Verfahren zum gleichzeitigen Editieren eines ersten und eines zweiten komplementären Strangs einer doppelsträngigen DNA-Sequenz an der Zielstelle, besagtes Verfahren umfasst das Inkontaktbringen der doppelsträngigen DNA-Sequenz mit einem Paar Prime-Editor- Komplexe, wobei das Paar Folgendes umfasst: a. einen ersten Prime-Editor-Komplex, der Folgendes umfasst: i.einen ersten Prime-Editor, der ein erstes Nukleinsäure-programmierbares DNA- Bindungsprotein (napDNAbp) umfasst, und ein erstes Polypeptid, das eine RNA-abhängige DNA-Polymeraseaktivität umfasst; und ii.eine erste Prime-Editing-Guide-RNA (erste PEgRNA), die an eine erste Bindungsstelle auf einem ersten Strang der genomischen DNA-Sequenz stromaufwärts der Zielstelle anbindet; b. einen zweiten Prime-Editor-Komplex, der Folgendes umfasst: i.einen zweiten Prime-Editor, der ein zweites Nukleinsäure-programmierbares DNA- Bindungsprotein (zweites napDNAbp) umfasst, und ein zweites Polypeptid, das eine RNA- abhängige DNA-Polymeraseaktivität umfasst; und ii.eine zweite Prime-Editing-Guide-RNA (zweite PEgRNA), die an eine zweite Bindungsstelle auf einem zweiten Strang der genomischen DNA-Sequenz stromabwärts der Zielstelle anbindet; wobei der erste Prime-Editor-Komplex einen ersten Nick bei einer Sequenz erzeugt, die der ersten Bindungsstelle komplementär ist, und daraufhin die Polymerisation einer ersten einzelsträngigen DNA-Sequenz mit 3'-Ende ausgehend vom 5'-Ende, das durch den ersten Nick entstand, hervorruft; wobei der zweite Prime-Editor-Komplex einen zweiten Nick bei einer Sequenz erzeugt, die der zweiten Bindungsstelle komplementär ist, und daraufhin die Polymerisation einer zweiten einzelsträngigen DNA-Sequenz mit 3'-Ende ausgehend vom 5'-Ende, das durch den zweiten Nick entstand, hervorruft; wobei die erste einzelsträngige DNA-Sequenz und die zweite einzelsträngige DNA-Sequenz reverse Komplemente für zumindest eine Komplementaritätsregion sind und einen Duplex formen, der ein Edit enthält; und wobei der Duplex den genickten ersten und zweiten komplementären Strang der doppelsträngigen DNA-Sequenz ersetzt.
Verfahren nach Anspruch 73, wobei der Prime-Editor des ersten Prime-Editor- Komplexes, der zweite Prime-Editor-Komplex oder der erste und der zweite Prime-Editor- Komplex ein Fusionsprotein ist, welches das napDNAbp und das Polypeptid mit RNA- abhängiger DNA-Polymeraseaktivität umfasst.
Verfahren nach Anspruch 73, wobei der erste Prime-Editor-Komplex und der zweite Prime-Editor-Komplex denselben Prime-Editor umfassen.
Verfahren nach Anspruch 73, wobei der erste Prime-Editor-Komplex und der zweite Prime-Editor-Komplex einen unterschiedlichen Prime-Editor umfassen.
Verfahren nach einem der Ansprüche 73-76, wobei das erste und/oder zweite napDNAbp eine Cas9-Domäne oder Variante ebendieser ist.
Verfahren nach einem der Ansprüche 73-77, wobei das erste und/oder zweite napDNAbp eine Nuklease-aktive Cas9-Domäne, eine Nuklease-inaktive Cas9-Domäne, eine Cas9-Nickase-Domäne oder eine Variante ebendieser ist.
Verfahren nach einem der Ansprüche 73-78, wobei das erste und/oder zweite napDNAbp aus der Gruppe bestehend aus: Cas9, Cas12e, Cas12d, Cas12a, Cas12b1, Cas13a, Cas12c, CasX, CasY und Argonaute.
Verfahren nach einem der Ansprüche 73-79, wobei das erste und/oder zweite napDNAbp eine Nickase-Aktivität aufweist.
Verfahren nach einem der Ansprüche 73-80, wobei das erste und/oder zweite napDNAbp eine beliebige Aminosäuresequenz von SEQ-ID-NR: 18-88 umfasst, oder eine Aminosäuresequenz umfasst, die mindestens 80 %, 85 %, 90 %, 95 % oder 99 % Sequenzidentität mit einer beliebigen SEQ-ID-NR: 18-88 hat.
Verfahren nach einem der Ansprüche 73-81, wobei das erste und/oder zweite Polypeptid mit einer RNA-abhängigen DNA-Polymeraseaktivität eine reverse Transkriptase ist.
Verfahren nach einem der Ansprüche 73-82, wobei das erste und/oder zweite Polypeptid mit einer RNA-abhängigen DNA-Polymeraseaktivität eine Aminosäuresequenz mit einer beliebigen von SEQ-ID-NR: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159 und 700-766 umfasst, oder eine Aminosäuresequenz umfasst, die mindestens 80 %, 85 %, 90 %, 95 % oder 99 % Sequenzidentität mit einer beliebigen von SEQ-ID-NR: 89-100, 105-122, 128- 129 und 132 hat.
Verfahren nach einem der Ansprüche 73-83, wobei der erste Prime-Editor überdies einen Linker umfasst, der das erste napDNAbp und das erste Polypeptid mit RNA-abhängiger DNA-Polymeraseaktivität verknüpft, und/oder der zweite Prime-Editor überdies einen Linker umfasst, der das zweite napDNAbp und das zweite Polypeptid mit RNA-abhängiger DNA- Polymeraseaktivität verknüpft.
Verfahren nach Anspruch 84, wobei der Linker eine beliebige Aminosäuresequenz von SEQ-ID-NR: 166-177 umfasst, oder eine Aminosäuresequenz umfasst, die mindestens 80 %, 85 %, 90 %, 95 % oder 99 % Sequenzidentität mit einer beliebigen SEQ-ID-NR: 166-177 hat.
Verfahren nach Anspruch 84 oder 85, wobei der Linker eine Länge von 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49 oder 50 Aminosäuren hat.
Verfahren nach einem der Ansprüche 73-86, wobei die erste und/oder zweite PEgRNA eine beliebige Nukleotidsequenz von SEQ-ID-NR: 325-330, 499-505, 101-104, 181-183 und 223-244 umfasst, oder eine Nukleotidsequenz umfasst, die mindestens 80 %, 85 %, 90 %, 95 % oder 99 % Sequenzidentität mit einer beliebigen von SEQ-ID-NR: 325-330, 499-505, 101-104, 181-183 und 223-244 hat.
Verfahren nach einem der Ansprüche 73-87, wobei die erste und/oder zweite PEgRNA eine beliebige Nukleotidsequenz von SEQ-ID-NR: 325-330, 499-505, 101-104, 181-183 und 223-244 umfasst, oder eine Nukleotidsequenz umfasst, die mindestens 80 %, 85 %, 90 %, 95 % oder 99 % Sequenzidentität mit einer beliebigen von SEQ-ID-NR: 325-330, 499-505, 101-104, 181-183 und 223-244 hat.
Verfahren nach einem der Ansprüche 73-88, wobei die erste Spacer-Sequenz des ersten Prime-Editor-Komplexes an eine erste Bindungsstelle auf einem ersten Strang der doppelsträngigen DNA-Sequenz stromaufwärts der zu editierenden Zielstelle anbindet.
Verfahren nach einem der Ansprüche 73-89, wobei die zweite Spacer-Sequenz des zweiten Prime-Editor-Komplexes an eine zweite Bindungsstelle auf einem zweiten Strang der doppelsträngigen DNA-Sequenz stromabwärts der zu editierenden Zielstelle anbindet.
Verfahren nach Anspruch 90, wobei das Anbinden der ersten und zweiten Spacer- Sequenz des ersten und zweiten Prime-Editor-Komplexes in Präsenz einer PAM-Sequenz zum Nicking des ersten und zweiten Strangs führt, jeweils an einer Nick-Stelle, die proximal zur PAM-Sequenz jedes Strangs beim napDNAbp der beiden ersten und zweiten Prime-Editor- Komplexe liegt.
Verfahren nach Anspruch 91, wobei die erste und zweite Bindungsstelle zwei Enden einer zusammenhängenden Region doppelsträngiger DNA definieren, welche die zu editierende Zielstelle umfasst.
Verfahren nach Anspruch 92, wobei die zusammenhängende Region mindestens 10 Nukleobasenpaare, mindestens 11 Nukleobasenpaare, mindestens 12 Nukleobasenpaare, mindestens 13 Nukleobasenpaare, mindestens 14 Nukleobasenpaare, mindestens 15 Nukleobasenpaare, mindestens 16 Nukleobasenpaare, mindestens 17 Nukleobasenpaare, mindestens 18 Nukleobasenpaare, mindestens 19 Nukleobasenpaare, mindestens 20 Nukleobasenpaare, mindestens 21 Nukleobasenpaare, mindestens 22 Nukleobasenpaare, mindestens 23 Nukleobasenpaare, mindestens 24 Nukleobasenpaare, mindestens 25 Nukleobasenpaare, mindestens 26 Nukleobasenpaare, mindestens 27 Nukleobasenpaare, mindestens 28 Nukleobasenpaare, mindestens 29 Nukleobasenpaare, mindestens 30 Nukleobasenpaare, mindestens 31 Nukleobasenpaare, mindestens 32 Nukleobasenpaare, mindestens 33 Nukleobasenpaare, mindestens 34 Nukleobasenpaare, mindestens 35 Nukleobasenpaare, mindestens 36 Nukleobasenpaare, mindestens 37 Nukleobasenpaare, mindestens 38 Nukleobasenpaare, mindestens 39 Nukleobasenpaare, mindestens 40 Nukleobasenpaare, mindestens 41 Nukleotide, mindestens 42 Nukleotide, mindestens 43 Nukleotide, mindestens 44 Nukleotide, mindestens 45 Nukleotide, mindestens 46 Nukleotide, mindestens 47 Nukleotide, mindestens 48 Nukleotide, mindestens 49 Nukleotide, mindestens 50 Nukleotide, mindestens 51 Nukleotide, mindestens 52 Nukleotide, mindestens 53 Nukleotide, mindestens 54 Nukleotide, mindestens 55 Nukleotide, mindestens 56 Nukleotide, mindestens 57 Nukleotide, mindestens 58 Nukleotide, mindestens 59 Nukleotide, mindestens 60 Nukleotide, mindestens 61 Nukleotide, mindestens 62 Nukleotide, mindestens 63 Nukleotide, mindestens 64 Nukleotide, mindestens 65 Nukleotide, mindestens 66 Nukleotide, mindestens 67 Nukleotide, mindestens 68 Nukleotide, mindestens 69 Nukleotide, mindestens 70 Nukleotide, mindestens 71 Nukleotide, mindestens 72 Nukleotide, mindestens 73 Nukleotide, mindestens 74 Nukleotide, mindestens 75 Nukleotide, mindestens 76 Nukleotide, mindestens 77 Nukleotide, mindestens 78 Nukleotide, mindestens 79 Nukleotide, mindestens 80 Nukleotide, mindestens 81 Nukleotide, mindestens 82 Nukleotide, mindestens 83 Nukleotide, mindestens 84 Nukleotide, mindestens 85 Nukleotide, mindestens 86 Nukleotide, mindestens 87 Nukleotide, mindestens 88 Nukleotide, mindestens 89 Nukleotide, mindestens 90 Nukleotide, mindestens 91 Nukleotide, mindestens 92 Nukleotide, mindestens 93 Nukleotide, mindestens 94 Nukleotide, mindestens 95 Nukleotide, mindestens 96 Nukleotide, mindestens 97 Nukleotide, mindestens 98 Nukleotide, mindestens 99 Nukleotide, mindestens 100 Nukleotide, mindestens 101 Nukleotide, mindestens 102 Nukleotide, mindestens 103 Nukleotide, mindestens 104 Nukleotide, mindestens 105 Nukleotide, mindestens 106 Nukleotide, mindestens 107 Nukleotide, mindestens 108 Nukleotide, mindestens 109 Nukleotide oder mindestens 110 Nukleotide lang ist.
Verfahren nach Anspruch 92 oder 93, wobei die zusammenhängende Region von dem Duplex ersetzt wird, der den editierten Teil enthält.
Verfahren nach einem der Ansprüche 73-94, wobei die erste und/oder zweite DNA- Synthese-Template mindestens 1 Nukleotid, mindestens 2 Nukleotide, mindestens 3 Nukleotide, mindestens 4 Nukleotide, mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide, mindestens 15 Nukleotide, mindestens 16 Nukleotide, mindestens 17 Nukleotide, mindestens 18 Nukleotide, mindestens 19 Nukleotide, mindestens 20 Nukleotide, mindestens 21 Nukleotide, mindestens 22 Nukleotide, mindestens 23 Nukleotide, mindestens 24 Nukleotide, mindestens 25 Nukleotide, mindestens 26 Nukleotide, mindestens 27 Nukleotide, mindestens 28 Nukleotide, mindestens 29 Nukleotide, mindestens 30 Nukleotide, mindestens 31 Nukleotide, mindestens 32 Nukleotide, mindestens 33 Nukleotide, mindestens 34 Nukleotide, mindestens 35 Nukleotide, mindestens 36 Nukleotide, mindestens 37 Nukleotide, mindestens 38 Nukleotide, mindestens 39 Nukleotide, mindestens 40 Nukleotide, mindestens 41 Nukleotide, mindestens 42 Nukleotide, mindestens 43 Nukleotide, mindestens 44 Nukleotide, mindestens 45 Nukleotide, mindestens 46 Nukleotide, mindestens 47 Nukleotide, mindestens 48 Nukleotide, mindestens 49 Nukleotide, mindestens 50 Nukleotide, mindestens 51 Nukleotide, mindestens 52 Nukleotide, mindestens 53 Nukleotide, mindestens 54 Nukleotide, mindestens 55 Nukleotide, mindestens 56 Nukleotide, mindestens 57 Nukleotide, mindestens 58 Nukleotide, mindestens 59 Nukleotide, mindestens 60 Nukleotide, mindestens 61 Nukleotide, mindestens 62 Nukleotide, mindestens 63 Nukleotide, mindestens 64 Nukleotide, mindestens 65 Nukleotide, mindestens 66 Nukleotide, mindestens 67 Nukleotide, mindestens 68 Nukleotide, mindestens 69 Nukleotide, mindestens 70 Nukleotide, mindestens 71 Nukleotide, mindestens 72 Nukleotide, mindestens 73 Nukleotide, mindestens 74 Nukleotide, mindestens 75 Nukleotide, mindestens 76 Nukleotide, mindestens 77 Nukleotide, mindestens 78 Nukleotide, mindestens 79 Nukleotide, mindestens 80 Nukleotide, mindestens 81 Nukleotide, mindestens 82 Nukleotide, mindestens 83 Nukleotide, mindestens 84 Nukleotide, mindestens 85 Nukleotide, mindestens 86 Nukleotide, mindestens 87 Nukleotide, mindestens 88 Nukleotide, mindestens 89 Nukleotide, mindestens 90 Nukleotid, mindestens 91 Nukleotide, mindestens 92 Nukleotide, mindestens 93 Nukleotide, mindestens 94 Nukleotide, mindestens 95 Nukleotide, mindestens 96 Nukleotide, mindestens 97 Nukleotide, mindestens 98 Nukleotide, mindestens 99 Nukleotide, mindestens 100 Nukleotide, mindestens 101 Nukleotide, mindestens 102 Nukleotide, mindestens 103 Nukleotide, mindestens 104 Nukleotide, mindestens 105 Nukleotide, mindestens 106 Nukleotide, mindestens 107 Nukleotide, mindestens 108 Nukleotide, mindestens 109 Nukleotide oder mindestens 110 Nukleotide lang ist.
Verfahren nach einem der Ansprüche 73-95, wobei die erste einzelsträngige DNA- Sequenz und die zweite einzelsträngige DNA-Sequenz die gleichen Längen aufweisen.
Verfahren nach einem der Ansprüche 73-96, wobei die erste einzelsträngige DNA- Sequenz und die zweite einzelsträngige DNA-Sequenz unterschiedliche Längen aufweisen.
Verfahren nach einem der Ansprüche 73-97, wobei die Komplementaritätsregion mindestens 99 %, mindestens 95 %, mindestens 90 %, mindestens 85 %, mindestens 80 %, mindestens 75 %, mindestens 70 %, mindestens 65 %, mindestens 60 %, mindestens 55 %, mindestens 50 %, mindestens 45 %, mindestens 40 %, mindestens 35 %, mindestens 30 %, mindestens 25 %, mindestens 20 %, mindestens 15 % oder mindestens 10 % der Gesamtlänge der ersten einzelsträngigen DNA-Sequenz oder der zweiten einzelsträngigen DNA-Sequenz beträgt.
Verfahren nach einem der Ansprüche 73-98, wobei die Komplementaritätsregion mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide, mindestens 15 Nukleotide, mindestens 16 Nukleotide, mindestens 17 Nukleotide, mindestens 18 Nukleotide, mindestens 19 Nukleotide, mindestens 20 Nukleotide, mindestens 21 Nukleotide, mindestens 22 Nukleotide, mindestens 23 Nukleotide, mindestens 24 Nukleotide, mindestens 25 Nukleotide, mindestens 26 Nukleotide, mindestens 27 Nukleotide, mindestens 28 Nukleotide, mindestens 29 Nukleotide, mindestens 30 Nukleotide, mindestens 31 Nukleotide, mindestens 32 Nukleotide, mindestens 33 Nukleotide, mindestens 34 Nukleotide, mindestens 35 Nukleotide, mindestens 36 Nukleotide, mindestens 37 Nukleotide, mindestens 38 Nukleotide, mindestens 39 Nukleotide, mindestens 40 Nukleotide, mindestens 41 Nukleotide, mindestens 42 Nukleotide, mindestens 43 Nukleotide, mindestens 44 Nukleotide, mindestens 45 Nukleotide, mindestens 46 Nukleotide, mindestens 47 Nukleotide, mindestens 48 Nukleotide, mindestens 49 Nukleotide, mindestens 50 Nukleotide, mindestens 51 Nukleotide, mindestens 52 Nukleotide, mindestens 53 Nukleotide, mindestens 54 Nukleotide, mindestens 55 Nukleotide, mindestens 56 Nukleotide, mindestens 57 Nukleotide, mindestens 58 Nukleotide, mindestens 59 Nukleotide, mindestens 60 Nukleotide, mindestens 61 Nukleotide, mindestens 62 Nukleotide, mindestens 63 Nukleotide, mindestens 64 Nukleotide, mindestens 65 Nukleotide, mindestens 66 Nukleotide, mindestens 67 Nukleotide, mindestens 68 Nukleotide, mindestens 69 Nukleotide, mindestens 70 Nukleotide, mindestens 71 Nukleotide, mindestens 72 Nukleotide, mindestens 73 Nukleotide, mindestens 74 Nukleotide, mindestens 75 Nukleotide, mindestens 76 Nukleotide, mindestens 77 Nukleotide, mindestens 78 Nukleotide, mindestens 79 Nukleotide, mindestens 80 Nukleotide, mindestens 81 Nukleotide, mindestens 82 Nukleotide, mindestens 83 Nukleotide, mindestens 84 Nukleotide, mindestens 85 Nukleotide, mindestens 86 Nukleotide, mindestens 87 Nukleotide, mindestens 88 Nukleotide, mindestens 89 Nukleotide, mindestens 90 Nukleotide, mindestens 91 Nukleotide, mindestens 92 Nukleotide, mindestens 93 Nukleotide, mindestens 94 Nukleotid, mindestens 95 Nukleotide, mindestens 96 Nukleotide, mindestens 97 Nukleotide, mindestens 98 Nukleotide, mindestens 99 Nukleotide, mindestens 100 Nukleotide, mindestens 101 Nukleotide, mindestens 102 Nukleotide, mindestens 103 Nukleotide, mindestens 104 Nukleotide, mindestens 105 Nukleotide, mindestens 106 Nukleotide, mindestens 107 Nukleotide, mindestens 108 Nukleotide, mindestens 109 Nukleotide oder mindestens 110 Nukleotide lang ist und entweder kürzer oder gleich der Länge der gewünschten DNA-Sequenz und ihres Komplements ist.
Verfahren nach einem der Ansprüche 73-99, wobei die Komplementaritätsregion der ersten einzelsträngigen DNA-Sequenz und der zweiten einzelsträngigen DNA-Sequenz den Duplex formen.
Verfahren nach einem der Ansprüche 73-100, wobei die erste einzelsträngige DNA- Sequenz und die zweite einzelsträngige DNA-Sequenz jeweils einzelsträngige DNA-Stränge mit 3'-Enden sind.
Verfahren nach Anspruch 94, wobei das Ersetzen der zusammenhängenden Region durch den Duplex, der den editierten Teil umfasst, zu einer Insertion, Deletion oder einem Ersetzen von DNA an der Zielstelle führt.
Verfahren nach einem der Ansprüche 73-102, wobei der Duplex, der einen Edit umfasst, eine oder mehrere Rekombinasestellen umfasst.
Verfahren nach Anspruch 103, das überdies das Bereitstellen einer Rekombinase umfasst, um ein Rekombinase-vermitteltes Editing der DNA-Sequenz an der zu editierenden Zielstelle zu fördern.
PEgRNA-Paar zum Verwenden in Dual-Prime-Editing, wobei das Paar Folgendes umfasst: c. eine erste Prime-Editing-Guide-RNA (erste PEgRNA), die an eine erste Bindungsstelle auf einem ersten Strang einer doppelsträngigen DNA-Sequenz stromaufwärts der zu editierenden Zielstelle anbindet, wobei die erste PEgRNA eine erste Spacer-Sequenz, einen ersten gRNA-Kern, eine erste DNA-Synthese-Template und eine erste Primer-Bindungsstelle umfasst, wobei die erste DNA-Synthese-Template eine erste einzelsträngige DNA-Sequenz kodiert, die einen editierten Teil enthält; d. eine zweite Prime-Editing-Guide-RNA (zweite PEgRNA), die an eine zweite Bindungsstelle auf einem zweiten Strang einer doppelsträngigen DNA-Sequenz stromabwärts der zu editierenden Zielstelle anbindet, wobei die zweite PEgRNA eine zweite Spacer- Sequenz, einen zweiten gRNA-Kern, eine zweite DNA-Synthese-Template und eine zweite Primer-Bindungsstelle umfasst, wobei die zweite DNA-Synthese-Template eine zweite einzelsträngige DNA-Sequenz kodiert, die einen editierten Teil enthält, wobei die zweite einzelsträngige DNA-Sequenz eine Komplementaritätsregion mit der ersten einzelsträngigen DNA-Sequenz aufweist.
PEgRNA-Paar nach Anspruch 105, wobei die erste PEgRNA folgende Struktur umfasst: 5'-[erste gRNA-Spacer-Sequenz]-[erster gRNA-Kern]-[erste DNA-Synthese-Template]-[erste Primer-Bindungsstelle]-3'; und wobei die zweite PEgRNA folgende Struktur umfasst: 5'-[zweite gRNA-Spacer-Sequenz]-[zweiter gRNA-Kern]-[zweite DNA-Synthese-Template]- [zweite Primer-Bindungsstelle]-3'.
PEgRNAs-Paar nach Anspruch 105 oder 106, wobei die erste einzelsträngige DNA- Sequenz und die zweite einzelsträngige DNA-Sequenz einen Duplex bilden, der sich in an der zu editierende Zielstelle in die doppelsträngige DNA-Sequenz integriert.
PEgRNA-Paar nach Anspruch 107, wobei die Integration des Duplex zu einer Insertion, Deletion oder einem Ersetzen von DNA an der Zielstelle führt.
PEgRNA-Paar nach Anspruch 108, wobei die Insertion mindestens 1 Nukleotid, mindestens 2 Nukleotide, mindestens 3 Nukleotide, mindestens 4 Nukleotide, mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide, mindestens 15 Nukleotide, mindestens 16 Nukleotide, mindestens 17 Nukleotide, mindestens 18 Nukleotide, mindestens 19 Nukleotide, mindestens 20 Nukleotide, mindestens 21 Nukleotide, mindestens 22 Nukleotide, mindestens 23 Nukleotide, mindestens 24 Nukleotide, mindestens 25 Nukleotide, mindestens 26 Nukleotide, mindestens 27 Nukleotide, mindestens 28 Nukleotide, mindestens 29 Nukleotide, mindestens 30 Nukleotide, mindestens 31 Nukleotide, mindestens 32 Nukleotide, mindestens 33 Nukleotide, mindestens 34 Nukleotide, mindestens 35 Nukleotide, mindestens 36 Nukleotide, mindestens 37 Nukleotide, mindestens 38 Nukleotide, mindestens 39 Nukleotide, mindestens 40 Nukleotide, mindestens 41 Nukleotide, mindestens 42 Nukleotide, mindestens 43 Nukleotide, mindestens 44 Nukleotide, mindestens 45 Nukleotide, mindestens 46 Nukleotide, mindestens 47 Nukleotide, mindestens 48 Nukleotide, mindestens 49 Nukleotide, mindestens 50 Nukleotide, mindestens 51 Nukleotide, mindestens 52 Nukleotide, mindestens 53 Nukleotide, mindestens 54 Nukleotide, mindestens 55 Nukleotide, mindestens 56 Nukleotide, mindestens 57 Nukleotide, mindestens 58 Nukleotide, mindestens 59 Nukleotide, mindestens 60 Nukleotide, mindestens 61 Nukleotide, mindestens 62 Nukleotide, mindestens 63 Nukleotide, mindestens 64 Nukleotide, mindestens 65 Nukleotide, mindestens 66 Nukleotide, mindestens 67 Nukleotide, mindestens 68 Nukleotide, mindestens 69 Nukleotide, mindestens 70 Nukleotide, mindestens 71 Nukleotide, mindestens 72 Nukleotide, mindestens 73 Nukleotide, mindestens 74 Nukleotide, mindestens 75 Nukleotide, mindestens 76 Nukleotide, mindestens 77 Nukleotide, mindestens 78 Nukleotide, mindestens 79 Nukleotide, mindestens 80 Nukleotide, mindestens 81 Nukleotide, mindestens 82 Nukleotide, mindestens 83 Nukleotide, mindestens 84 Nukleotide, mindestens 85 Nukleotide, mindestens 86 Nukleotide, mindestens 87 Nukleotide, mindestens 88 Nukleotide, mindestens 89 Nukleotide, mindestens 90 Nukleotid, mindestens 91 Nukleotide, mindestens 92 Nukleotide, mindestens 93 Nukleotide, mindestens 94 Nukleotide, mindestens 95 Nukleotide, mindestens 96 Nukleotide, mindestens 97 Nukleotide, mindestens 98 Nukleotide, mindestens 99 Nukleotide, mindestens 100 Nukleotide, mindestens 101 Nukleotide, mindestens 102 Nukleotide, mindestens 103 Nukleotide, mindestens 104 Nukleotide, mindestens 105 Nukleotide, mindestens 106 Nukleotide, mindestens 107 Nukleotide, mindestens 108 Nukleotide, mindestens 109 Nukleotide oder mindestens 110 Nukleotide lang ist.
PEgRNA-Paar nach Anspruch 108, wobei die Deletion mindestens 1 Nukleotid, mindestens 2 Nukleotide, mindestens 3 Nukleotide, mindestens 4 Nukleotide, mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide, mindestens 15 Nukleotide, mindestens 16 Nukleotide, mindestens 17 Nukleotide, mindestens 18 Nukleotide, mindestens 19 Nukleotide, mindestens 20 Nukleotide, mindestens 21 Nukleotide, mindestens 22 Nukleotide, mindestens 23 Nukleotide, mindestens 24 Nukleotide, mindestens 25 Nukleotide, mindestens 26 Nukleotide, mindestens 27 Nukleotide, mindestens 28 Nukleotide, mindestens 29 Nukleotide, mindestens 30 Nukleotide, mindestens 31 Nukleotide, mindestens 32 Nukleotide, mindestens 33 Nukleotide, mindestens 34 Nukleotide, mindestens 35 Nukleotide, mindestens 36 Nukleotide, mindestens 37 Nukleotide, mindestens 38 Nukleotide, mindestens 39 Nukleotide, mindestens 40 Nukleotide, mindestens 41 Nukleotide, mindestens 42 Nukleotide, mindestens 43 Nukleotide, mindestens 44 Nukleotide, mindestens 45 Nukleotide, mindestens 46 Nukleotide, mindestens 47 Nukleotide, mindestens 48 Nukleotide, mindestens 49 Nukleotide, mindestens 50 Nukleotide, mindestens 51 Nukleotide, mindestens 52 Nukleotide, mindestens 53 Nukleotide, mindestens 54 Nukleotide, mindestens 55 Nukleotide, mindestens 56 Nukleotide, mindestens 57 Nukleotide, mindestens 58 Nukleotide, mindestens 59 Nukleotide, mindestens 60 Nukleotide, mindestens 61 Nukleotide, mindestens 62 Nukleotide, mindestens 63 Nukleotide, mindestens 64 Nukleotide, mindestens 65 Nukleotide, mindestens 66 Nukleotide, mindestens 67 Nukleotide, mindestens 68 Nukleotide, mindestens 69 Nukleotide, mindestens 70 Nukleotide, mindestens 71 Nukleotide, mindestens 72 Nukleotide, mindestens 73 Nukleotide, mindestens 74 Nukleotide, mindestens 75 Nukleotide, mindestens 76 Nukleotide, mindestens 77 Nukleotide, mindestens 78 Nukleotide, mindestens 79 Nukleotide, mindestens 80 Nukleotide, mindestens 81 Nukleotide, mindestens 82 Nukleotide, mindestens 83 Nukleotide, mindestens 84 Nukleotide, mindestens 85 Nukleotide, mindestens 86 Nukleotide, mindestens 87 Nukleotide, mindestens 88 Nukleotide, mindestens 89 Nukleotide, mindestens 90 Nukleotid, mindestens 91 Nukleotide, mindestens 92 Nukleotide, mindestens 93 Nukleotide, mindestens 94 Nukleotide, mindestens 95 Nukleotide, mindestens 96 Nukleotide, mindestens 97 Nukleotide, mindestens 98 Nukleotide, mindestens 99 Nukleotide, mindestens 100 Nukleotide, mindestens 101 Nukleotide, mindestens 102 Nukleotide, mindestens 103 Nukleotide, mindestens 104 Nukleotide, mindestens 105 Nukleotide, mindestens 106 Nukleotide, mindestens 107 Nukleotide, mindestens 108 Nukleotide, mindestens 109 Nukleotide oder mindestens 110 Nukleotide lang ist.
PEgRNA-Paar nach Anspruch 108, wobei der Ersatz mindestens 1 Nukleotid, mindestens 2 Nukleotide, mindestens 3 Nukleotide, mindestens 4 Nukleotide, mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide, mindestens 15 Nukleotide, mindestens 16 Nukleotide, mindestens 17 Nukleotide, mindestens 18 Nukleotide, mindestens 19 Nukleotide, mindestens 20 Nukleotide, mindestens 21 Nukleotide, mindestens 22 Nukleotide, mindestens 23 Nukleotide, mindestens 24 Nukleotide, mindestens 25 Nukleotide, mindestens 26 Nukleotide, mindestens 27 Nukleotide, mindestens 28 Nukleotide, mindestens 29 Nukleotide, mindestens 30 Nukleotide, mindestens 31 Nukleotide, mindestens 32 Nukleotide, mindestens 33 Nukleotide, mindestens 34 Nukleotide, mindestens 35 Nukleotide, mindestens 36 Nukleotide, mindestens 37 Nukleotide, mindestens 38 Nukleotide, mindestens 39 Nukleotide, mindestens 40 Nukleotide, mindestens 41 Nukleotide, mindestens 42 Nukleotide, mindestens 43 Nukleotide, mindestens 44 Nukleotide, mindestens 45 Nukleotide, mindestens 46 Nukleotide, mindestens 47 Nukleotide, mindestens 48 Nukleotide, mindestens 49 Nukleotide, mindestens 50 Nukleotide, mindestens 51 Nukleotide, mindestens 52 Nukleotide, mindestens 53 Nukleotide, mindestens 54 Nukleotide, mindestens 55 Nukleotide, mindestens 56 Nukleotide, mindestens 57 Nukleotide, mindestens 58 Nukleotide, mindestens 59 Nukleotide, mindestens 60 Nukleotide, mindestens 61 Nukleotide, mindestens 62 Nukleotide, mindestens 63 Nukleotide, mindestens 64 Nukleotide, mindestens 65 Nukleotide, mindestens 66 Nukleotide, mindestens 67 Nukleotide, mindestens 68 Nukleotide, mindestens 69 Nukleotide, mindestens 70 Nukleotide, mindestens 71 Nukleotide, mindestens 72 Nukleotide, mindestens 73 Nukleotide, mindestens 74 Nukleotide, mindestens 75 Nukleotide, mindestens 76 Nukleotide, mindestens 77 Nukleotide, mindestens 78 Nukleotide, mindestens 79 Nukleotide, mindestens 80 Nukleotide, mindestens 81 Nukleotide, mindestens 82 Nukleotide, mindestens 83 Nukleotide, mindestens 84 Nukleotide, mindestens 85 Nukleotide, mindestens 86 Nukleotide, mindestens 87 Nukleotide, mindestens 88 Nukleotide, mindestens 89 Nukleotide, mindestens 90 Nukleotid, mindestens 91 Nukleotide, mindestens 92 Nukleotide, mindestens 93 Nukleotide, mindestens 94 Nukleotide, mindestens 95 Nukleotide, mindestens 96 Nukleotide, mindestens 97 Nukleotide, mindestens 98 Nukleotide, mindestens 99 Nukleotide, mindestens 100 Nukleotide, mindestens 101 Nukleotide, mindestens 102 Nukleotide, mindestens 103 Nukleotide, mindestens 104 Nukleotide, mindestens 105 Nukleotide, mindestens 106 Nukleotide, mindestens 107 Nukleotide, mindestens 108 Nukleotide, mindestens 109 Nukleotide oder mindestens 110 Nukleotide lang ist.
Polynukleotid, das ein PEgRNA-Paar nach einem der Ansprüche 105-111 kodiert.
Vektor, der das Polynukleotid aus Anspruch 112 umfasst, für die Expression des PEgRNA-Paares in einer Zelle.
Zelle, die den Vektor nach Anspruch 113 umfasst.
Pharmazeutische Zusammensetzung, die ein PEgRNA-Paar nach einem der Ansprüche 105-111, einen Vektor nach Anspruch 113 oder eine Zelle nach Anspruch 114 und einen pharmazeutisch verträglichen Hilfsstoff umfasst.
Paar Prime-Editor-Komplexe, wobei das Paar Folgendes umfasst: e. einen ersten Prime-Editor-Komplex, der Folgendes umfasst: i.einen ersten Prime-Editor, der ein erstes Nukleinsäure-programmierbares DNA- Bindungsprotein (napDNAbp) umfasst, und ein erstes Polypeptid, das eine RNA-abhängige DNA-Polymeraseaktivität umfasst; und ii.eine erste Prime-Editing-Guide-RNA (erste PEgRNA), die an eine erste Zielsequenz auf einem ersten Strang der genomischen DNA-Sequenz stromaufwärts der Zielstelle anbindet; f. einen zweiten Prime-Editor-Komplex, der Folgendes umfasst: i.einen zweiten Prime-Editor, der ein zweites Nukleinsäure-programmierbares DNA- Bindungsprotein (zweites napDNAbp) umfasst, und ein zweites Polypeptid, das eine RNA- abhängige DNA-Polymeraseaktivität umfasst; und ii.eine zweite Prime-Editing-Guide-RNA (zweite PEgRNA), die an eine zweite Zielsequenz auf einem zweiten Strang der genomischen DNA-Sequenz stromabwärts der Zielstelle anbindet.
Paar Prime-Editor-Komplexe nach Anspruch 116, wobei der Prime-Editor des ersten Prime-Editor-Komplexes, der zweite Prime-Editor-Komplex oder der erste und der zweite Prime-Editor-Komplex ein Fusionsprotein ist, welches das napDNAbp und das Polypeptid mit RNA-abhängiger DNA-Polymeraseaktivität umfasst.
Polynukleotid, das ein Paar Prime-Editor-Komplexe nach Anspruch 116 oder 117 kodiert.
Vektor, der das Polynukleotid aus Anspruch 118 umfasst, für die Expression der Prime- Editor-Komplexe in einer Zelle.
Zelle, die den Vektor nach Anspruch 119 umfasst.
Pharmazeutische Zusammensetzung, die ein Paar Prime-Editor-Komplexe nach Anspruch 116 oder 117, einen Vektor nach Anspruch 119 oder eine Zelle nach Anspruch 120 und einen pharmazeutisch verträglichen Hilfsstoff umfasst.
System nach einem der Ansprüche 1-62, oder Verfahren nach einem der Ansprüche 73- 104, wobei die Integration des Duplex, der den editierten Teil umfasst, zu einer Insertion, Deletion oder einem Ersetzen von DNA an der Zielstelle führt.
System oder Verfahren nach Anspruch 122, wobei die Insertion ein Peptid-Tag ist.
System oder Verfahren nach Anspruch 123, wobei das Peptid-Tag ein Polyhistidin ist (z. B. HHHHHH) (SEQ-ID-NR: 252-262), FLAG (z. B. DYKDDDDK) (SEQ-ID-NR.: 2), V5 (z. B. GKPIPNPLLGLDST) (SEQ-ID-NR: 3), GCN4, HA (z. B. YPYDVPDYA) (SEQ-ID- NR: 5), Myc (z. B. EQKLISEED) (SEQ-ID-NR: 6) oder GST.
System oder Verfahren nach Anspruch 123, wobei das Peptid-Tag eine Aminosäuresequenz aufweist, die aus der Gruppe ausgewählt ist, die aus SEQ-ID-NR: 1-6, 245-249, 252-262, 264-273, 275-276, 281, 278-288 und 622 besteht.
System oder Verfahren nach Anspruch 122, wobei die Insertion ein Immunepitop-Tag ist.
System oder Verfahren nach Anspruch 126, wobei das Immunepitop-Tag aus folgender Gruppe ausgewählt ist: Tetanustoxoid (SEQ-ID-NR: 396); Diphtherie-Toxin-Mutante CRM197 (SEQ-ID-NR: 630); Mumps-Immunepitop 1 (SEQ-ID-NR: 400); Mumps- Immunepitop 2 (SEQ-ID-NR: 402); Mumps-Immunepitop 3 (SEQ-ID-NR: 404); Rötelnvirus (SEQ-ID-NR: 406); Hämagglutinin (SEQ-ID-NR: 408); Neuraminidase (SEQ-ID-NR: 410); TAP1 (SEQ-ID-NR: 412); TAP2 (SEQ-ID-NR: 414); Hämagglutinin-Epitope zu Klasse IHLA (SEQ-ID-NR: 416); Neuraminidase-Epitope zu Klasse 1 HLA (SEQ-ID-NR: 418); Hämagglutinin-Epitope zu Klasse II HLA (SEQ-ID-NR: 420); Neuraminidase-Epitope zu Klasse II HLA (SEQ-ID-NR: 422); Hämagglutinin-Epitop H5N1-gebundene Klasse I und Klasse II HLA (SEQ-ID-NR: 424); und Neuraminidase-Epitop H5N1-gebundene Klasse I und Klasse II HLA (SEQ-ID-NR: 426).
System oder Verfahren nach Anspruch 122, wobei die Insertion eine Dimerisierungsdomäne ist.
System oder Verfahren nach Anspruch 128, wobei die Dimerisierungsdomäne eine Kleinmolekül-Bindungsdomäne ist, von FKBP12 mit SEQ-ID-NR: 488, FKBP12-F36V mit SEQ-ID-NR: 489, oder Cyclophilin mit SEQ-ID-NR: 490 oder 493-494.
System zum gleichzeitigen Editieren beider Stränge einer doppelsträngigen DNA- Sequenz an einer zu editierenden Zielstelle, wobei das System Folgendes umfasst: a) einen ersten Prime-Editor-Komplex, der Folgendes umfasst: i. einen ersten Prime-Editor, der ein erstes Nukleinsäure-programmierbares DNA- Bindungsprotein (erstes napDNAbp) umfasst, und ein erstes Polypeptid, das eine RNA- abhängige DNA-Polymeraseaktivität umfasst; und ii.eine erste Prime-Editing-Guide-RNA (erste PEgRNA), die an eine erste Bindungsstelle auf einem ersten Strang der doppelsträngigen DNA-Sequenz stromaufwärts der zu editierenden Zielstelle anbindet; b) einen zweiten Prime-Editor-Komplex, der Folgendes umfasst: i.einen zweiten Prime-Editor, der ein zweites Nukleinsäure-programmierbares DNA- Bindungsprotein (zweites napDNAbp) umfasst, und ein zweites Polypeptid, das eine RNA- abhängige DNA-Polymeraseaktivität umfasst; und ii.eine zweite Prime-Editing-Guide-RNA (zweite PEgRNA), die an eine zweite Bindungsstelle auf einem zweiten Strang der doppelsträngigen DNA-Sequenz stromaufwärts der zu editierenden Zielstelle anbindet; c) einen dritten Prime-Editor-Komplex, der Folgendes umfasst: i.einen dritten Prime-Editor, der ein drittes Nukleinsäure-programmierbares DNA- Bindungsprotein (drittes napDNAbp) umfasst, und ein drittes Polypeptid, das eine RNA- abhängige DNA-Polymeraseaktivität umfasst; und ii.eine dritte Prime-Editing-Guide-RNA (dritte PEgRNA), die an eine dritte Bindungsstelle auf dem ersten Strang der doppelsträngigen DNA-Sequenz stromabwärts der zu editierenden Zielstelle anbindet; d) einen vierten Prime-Editor-Komplex, der Folgendes umfasst: i.einen vierten Prime-Editor, der ein viertes Nukleinsäure-programmierbares DNA- Bindungsprotein (viertes napDNAbp) umfasst, und ein viertes Polypeptid, das eine RNA- abhängige DNA-Polymeraseaktivität umfasst; und ii.eine vierte Prime-Editing-Guide-RNA (vierte PEgRNA), die an eine vierte Bindungsstelle auf dem zweiten Strang der doppelsträngigen DNA-Sequenz stromabwärts der zu editierenden Zielstelle anbindet; wobei die erste PEgRNA eine erste DNA-Synthese-Template umfasst, die eine erste einzelsträngige DNA-Sequenz kodiert, und die zweite PEgRNA eine zweite DNA-Synthese- Template umfasst, die eine zweite einzelsträngige DNA-Sequenz kodiert, und die dritte PEgRNA eine dritte DNA-Synthese-Template umfasst, die eine dritte einzelsträngige DNA- Sequenz kodiert, und die vierte PEgRNA eine vierte DNA-Synthese-Template umfasst, die eine vierte einzelsträngige DNA-Sequenz kodiert; wobei die erste und die dritte einzelsträngige DNA-Sequenz jeweils eine Komplementaritätsregion mit der anderen umfassen, und wobei die zweite und die vierte einzelsträngige DNA-Sequenz jeweils eine Komplementaritätsregion mit der anderen umfassen.
System zum Editieren einer oder mehrerer doppelsträngiger DNA-Sequenz, wobei das System Folgendes umfasst: a) einen ersten Prime-Editor-Komplex, der Folgendes umfasst: i.einen ersten Prime-Editor, der ein erstes Nukleinsäure-programmierbares DNA- Bindungsprotein (erstes napDNAbp) umfasst, und ein erstes Polypeptid, das eine RNA- abhängige DNA-Polymeraseaktivität umfasst; und ii.eine erste Prime-Editing-Guide-RNA (erste PEgRNA), die an eine erste Bindungsstelle auf einem ersten Strang der ersten doppelsträngigen DNA-Sequenz an einer ersten zu editierenden Zielstelle anbindet; b) einen zweiten Prime-Editor-Komplex, der Folgendes umfasst: i.einen zweiten Prime-Editor, der ein zweites Nukleinsäure-programmierbares DNA- Bindungsprotein (zweites napDNAbp) umfasst, und ein zweites Polypeptid, das eine RNA- abhängige DNA-Polymeraseaktivität umfasst; und ii.eine zweite Prime-Editing-Guide-RNA (zweite PEgRNA), die an eine zweite Bindungsstelle auf einem zweiten Strang der ersten doppelsträngigen DNA-Sequenz an der ersten zu editierenden Zielstelle anbindet; c) einen dritten Prime-Editor-Komplex, der Folgendes umfasst: i.einen dritten Prime-Editor, der ein drittes Nukleinsäure-programmierbares DNA- Bindungsprotein (drittes napDNAbp) umfasst, und ein drittes Polypeptid, das eine RNA- abhängige DNA-Polymeraseaktivität umfasst; und ii.eine dritte Prime-Editing-Guide-RNA (dritte PEgRNA), die an eine erste Bindungsstelle auf einem ersten Strang der zweiten doppelsträngigen DNA-Sequenz an einer zweiten zu editierenden Zielstelle anbindet; d) einen vierten Prime-Editor-Komplex, der Folgendes umfasst: i.einen vierten Prime-Editor, der ein viertes Nukleinsäure-programmierbares DNA- Bindungsprotein (viertes napDNAbp) umfasst, und ein viertes Polypeptid, das eine RNA- abhängige DNA-Polymeraseaktivität umfasst; und ii.eine vierte Prime-Editing-Guide-RNA (vierte PEgRNA), die an eine zweite Bindungsstelle auf einem zweiten Strang der zweiten doppelsträngigen DNA-Sequenz an der zweiten zu editierenden Zielstelle anbindet; wobei die erste PEgRNA eine erste DNA-Synthese-Template umfasst, die eine erste einzelsträngige DNA-Sequenz kodiert, und die zweite PEgRNA eine zweite DNA-Synthese- Template umfasst, die eine zweite einzelsträngige DNA-Sequenz kodiert, und die dritte PEgRNA eine dritte DNA-Synthese-Template umfasst, die eine dritte einzelsträngige DNA- Sequenz kodiert, und die vierte PEgRNA eine vierte DNA-Synthese-Template umfasst, die eine vierte einzelsträngige DNA-Sequenz kodiert; wobei die erste und die dritte einzelsträngige DNA-Sequenz jeweils eine Komplementaritätsregion mit der anderen umfassen, und wobei die zweite und die vierte einzelsträngige DNA-Sequenz jeweils eine Komplementaritätsregion mit der anderen umfassen.
System nach Anspruch 131, wobei der Prime-Editor des ersten Prime-Editor-Komplex, der zweite Prime-Editor-Komplex, der dritte Prime-Editor-Komplex, und/oder der vierte Prime-Editor-Komplex ein Fusionsprotein ist, welches das napDNAbp und das Polypeptid mit RNA-abhängiger DNA-Polymeraseaktivität umfasst.
System nach einem der Ansprüche 130-132, wobei (i) die erste PEgRNA überdies eine erste Spacer-Sequenz, einen ersten gRNA-Kern und eine erste Primer-Bindungsstelle umfasst; (ii) die zweite PEgRNA überdies eine zweite Spacer-Sequenz, einen zweiten gRNA- Kern und eine zweite Primer-Bindungsstelle umfasst; (iii) die dritte PEgRNA überdies eine dritte Spacer-Sequenz, einen dritten gRNA-Kern und eine dritte Primer-Bindungsstelle umfasst; und (iv) die vierte PEgRNA überdies eine vierte Spacer-Sequenz, einen vierten gRNA-Kern und eine vierte Primer-Bindungsstelle umfasst.
System nach Anspruch 131, wobei die Komplementaritätsregion der ersten und dritten einzelsträngigen DNA-Sequenz und/oder die Komplementaritätsregion der zweiten und vierten einzelsträngigen DNA-Sequenz einen Duplex formen.
System nach Anspruch 134, wobei die erste Spacer-Sequenz an die erste Bindungsstelle der ersten doppelsträngigen DNA-Sequenz stromaufwärts der ersten zu editierenden Zielstelle anbindet und die zweite Spacer-Sequenz an die zweite Bindungsstelle der ersten doppelsträngigen DNA-Sequenz stromabwärts der ersten zu editierenden Zielstelle anbindet.
System nach Anspruch 134 und 135, wobei die dritte Spacer-Sequenz an die erste Bindungsstelle der zweiten doppelsträngigen DNA-Sequenz stromabwärts der zweiten zu editierenden Zielstelle anbindet und die vierte Spacer-Sequenz an die zweite Bindungsstelle der zweiten doppelsträngigen DNA-Sequenz stromabwärts der zweiten zu editierenden Zielstelle anbindet.
System nach einem der Ansprüche 134-136, wobei die erste und zweite Bindungsstelle zwei Enden einer ersten zusammenhängenden Region der ersten doppelsträngigen DNA definieren.
System nach einem der Ansprüche 134-137, wobei die dritte und vierte Bindungsstelle zwei Enden einer zweiten zusammenhängenden Region der zweiten doppelsträngigen DNA definieren.
System nach Anspruch 134, wobei die zusammenhängende Region zwischen der ersten und zweiten Bindungsstelle oder der dritten und vierten Bindungsstelle mindestens 10 Nukleobasenpaare, mindestens 11 Nukleobasenpaare, mindestens 12 Nukleobasenpaare, mindestens 13 Nukleobasenpaare, mindestens 14 Nukleobasenpaare, mindestens 15 Nukleobasenpaare, mindestens 16 Nukleobasenpaare, mindestens 17 Nukleobasenpaare, mindestens 18 Nukleobasenpaare, mindestens 19 Nukleobasenpaare, mindestens 20 Nukleobasenpaare, mindestens 21 Nukleobasenpaare, mindestens 22 Nukleobasenpaare, mindestens 23 Nukleobasenpaare, mindestens 24 Nukleobasenpaare, mindestens 25 Nukleobasenpaare, mindestens 26 Nukleobasenpaare, mindestens 27 Nukleobasenpaare, mindestens 28 Nukleobasenpaare, mindestens 29 Nukleobasenpaare, mindestens 30 Nukleobasenpaare, mindestens 31 Nukleobasenpaare, mindestens 32 Nukleobasenpaare, mindestens 33 Nukleobasenpaare, mindestens 34 Nukleobasenpaare, mindestens 35 Nukleobasenpaare, mindestens 36 Nukleobasenpaare, mindestens 37 Nukleobasenpaare, mindestens 38 Nukleobasenpaare, mindestens 39 Nukleobasenpaare, mindestens 40 Nukleobasenpaare, mindestens 41 Nukleotide, mindestens 42 Nukleotide, mindestens 43 Nukleotide, mindestens 44 Nukleotide, mindestens 45 Nukleotide, mindestens 46 Nukleotide, mindestens 47 Nukleotide, mindestens 48 Nukleotide, mindestens 49 Nukleotide, mindestens 50 Nukleotide, mindestens 51 Nukleotide, mindestens 52 Nukleotide, mindestens 53 Nukleotide, mindestens 54 Nukleotide, mindestens 55 Nukleotide, mindestens 56 Nukleotide, mindestens 57 Nukleotide, mindestens 58 Nukleotide, mindestens 59 Nukleotide, mindestens 60 Nukleotide, mindestens 61 Nukleotide, mindestens 62 Nukleotide, mindestens 63 Nukleotide, mindestens 64 Nukleotide, mindestens 65 Nukleotide, mindestens 66 Nukleotide, mindestens 67 Nukleotide, mindestens 68 Nukleotide, mindestens 69 Nukleotide, mindestens 70 Nukleotide, mindestens 71 Nukleotide, mindestens 72 Nukleotide, mindestens 73 Nukleotide, mindestens 74 Nukleotide, mindestens 75 Nukleotide, mindestens 76 Nukleotide, mindestens 77 Nukleotide, mindestens 78 Nukleotide, mindestens 79 Nukleotide, mindestens 80 Nukleotide, mindestens 81 Nukleotide, mindestens 82 Nukleotide, mindestens 83 Nukleotide, mindestens 84 Nukleotide, mindestens 85 Nukleotide, mindestens 86 Nukleotide, mindestens 87 Nukleotide, mindestens 88 Nukleotide, mindestens 89 Nukleotide, mindestens 90 Nukleotide, mindestens 91 Nukleotide, mindestens 92 Nukleotide, mindestens 93 Nukleotide, mindestens 94 Nukleotide, mindestens 95 Nukleotide, mindestens 96 Nukleotide, mindestens 97 Nukleotide, mindestens 98 Nukleotide, mindestens 99 Nukleotide, mindestens 100 Nukleotide, mindestens 101 Nukleotide, mindestens 102 Nukleotide, mindestens 103 Nukleotide, mindestens 104 Nukleotide, mindestens 105 Nukleotide, mindestens 106 Nukleotide, mindestens 107 Nukleotide, mindestens 108 Nukleotide, mindestens 109 Nukleotide oder mindestens 110 Nukleotide lang ist.
System nach einem der Ansprüche 134-139, wobei die Komplementaritätsregion der ersten einzelsträngigen DNA-Sequenz und der zweite einzelsträngige DNA-Sequenz und/oder die Komplementaritätsregion der zweiten einzelsträngigen DNA-Sequenz und der vierten einzelsträngige DNA-Sequenz einen Duplex formen.
System nach Anspruch 140, wobei der Duplex in die erste doppelsträngige DNA und/oder die zweite doppelsträngige DNA eingebaut wird.
System nach einem der Ansprüche 134-141, wobei das System zum Ersetzen der ersten zusammenhängenden Region durch die zweite zusammenhängende Region in der ersten doppelsträngigen DNA führt.
System nach einem der Ansprüche 134-142, wobei das System zum Austausch der ersten zusammenhängenden Region und der zweiten zusammenhängenden Region zwischen der ersten doppelsträngigen DNA und der zweiten doppelsträngigen DNA führt.
System nach einem der Ansprüche 134-143, wobei der erste Prime-Editor-Komplex, der zweite Prime-Editor-Komplex, der dritte Prime-Editor-Komplex und der vierte Prime- Editor-Komplex den gleichen Prime-Editor umfassen.
System nach einem der Ansprüche 134-144, wobei das erste, zweite, dritte und vierte Polypeptid mit einer RNA-abhängigen DNA-Polymeraseaktivität gleich sind.
System nach einem der Ansprüche 134-145, wobei das erste, zweite, dritte und/oder vierte napDNAbp eine Cas9-Domäne oder Variante davon ist.
System nach einem der Ansprüche 134-146, wobei das erste, zweite, dritte und/oder vierte napDNAbp eine Nuklease-aktive Cas9-Domäne, eine Nuklease-inaktive Cas9-Domäne, eine Cas9-Nickase-Domäne oder eine Variante ebendieser ist.
System nach einem der Ansprüche 134-147, wobei das erste, zweite, dritte und/oder vierte napDNAbp aus der Gruppe bestehend aus: Cas9, Cas12e, Cas12d, Cas12a, Cas12b1, Cas13a, Cas12c und Argonaute stammt.
System nach einem der Ansprüche 134-148, wobei das erste, zweite, dritte und/oder vierte napDNAbp eine Nickase-Aktivität aufweist.
System nach einem der Ansprüche 134-149, wobei das erste, zweite, dritte und/oder vierte napDNAbp eine Aminosäuresequenz mit einer der SEQ-ID-NR: 2-65 umfasst, oder eine Aminosäuresequenz umfasst, die mindestens 80 %, 85 %, 90 %, 95 % oder 99 % Sequenzidentität mit einer der SEQ-ID-NR: 2-65 hat.
System nach einem der Ansprüche 134-150, wobei das erste, zweite, dritte und/oder vierte Polypeptid mit einer RNA-abhängigen DNA-Polymeraseaktivität eine reverse Transkriptase ist.
System nach einem der Ansprüche 134-151, wobei das erste, zweite, dritte und/oder vierte Polypeptid mit einer RNA-abhängigen DNA-Polymeraseaktivität eine Aminosäuresequenz mit einer der SEQ-ID-NR: 37, 68-79, 82-98, 81, 98 und 110 umfasst, oder eine Aminosäuresequenz umfasst, die mindestens 80 %, 85 %, 90 %, 95 % oder 99 % Sequenzidentität mit einer der SEQ-ID-NR: 37, 68-79, 82-98, 81, 98 und 110 hat.
System nach einem der Ansprüche 134-152, wobei (i) der erste Prime-Editor überdies einen Linker enthält, der das erste napDNAbp und das erste Polypeptid mit RNA-abhängiger DNA-Polymeraseaktivität verbindet; (ii) der zweite Prime-Editor überdies einen Linker enthält, der das zweite napDNAbp und das zweite Polypeptid mit RNA-abhängiger DNA-Polymeraseaktivität verbindet; (iii) der dritte Prime-Editor überdies einen Linker enthält, der das dritte napDNAbp und das dritte Polypeptid mit RNA-abhängiger DNA-Polymeraseaktivität verbindet; und/oder (iv) der vierte Prime-Editor überdies einen Linker enthält, der das vierte napDNAbp und das vierte Polypeptid mit RNA-abhängiger DNA-Polymeraseaktivität verbindet.
System nach Anspruch 153, wobei der Linker eine Aminosäuresequenz mit einer der SEQ-ID-NR: 119-128 umfasst, oder eine Aminosäuresequenz umfasst, die mindestens 80 %, 85 %, 90 %, 95 % oder 99 % Sequenzidentität mit einer der SEQ-ID-NR: 119-128 hat.
System nach Anspruch 153 oder 154, wobei der Linker eine Länge von 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49 oder 50 Aminosäuren hat.
System nach einem der Ansprüche 134-155, wobei die erste, zweite, dritte und/oder vierte PEgRNA eine Nukleotidsequenz mit einer der SEQ-ID-NR: 192-203 umfasst, oder eine Nukleotidsequenz umfasst, die mindestens 80 %, 85 %, 90 %, 95 % oder 99 % Sequenzidentität mit einer der SEQ-ID-NR: 192-203 hat.
System nach einem der Ansprüche 134-156, wobei die erste Spacer-Sequenz an eine erste Bindungsstelle auf einem ersten Strang der doppelsträngigen DNA-Sequenz stromaufwärts der zu editierenden Zielstelle anbindet.
System nach einem der Ansprüche 134-157, wobei die zweite Spacer-Sequenz des zweiten Prime-Editor-Komplexes an eine zweite Bindungsstelle auf einem zweiten Strang der doppelsträngigen DNA-Sequenz stromaufwärts der zu editierenden Zielstelle anbindet.
System nach einem der Ansprüche 134-158, wobei die dritte Spacer-Sequenz an eine dritte Bindungsstelle auf einem ersten Strang der doppelsträngigen DNA-Sequenz stromabwärts der zu editierenden Zielstelle anbindet.
System nach einem der Ansprüche 134-159, wobei die vierte Spacer-Sequenz des vierten Prime-Editor-Komplexes an eine vierte Bindungsstelle auf einem zweiten Strang der doppelsträngigen DNA-Sequenz stromabwärts der zu editierenden Zielstelle anbindet.
System nach Anspruch 160, wobei das Anbinden der Spacer-Sequenz des ersten und zweiten Prime-Editor-Komplexes in Präsenz einer PAM-Sequenz zum Nicken des ersten und zweiten Strangs führt, jeweils an einer Nick-Stelle, die proximal zur PAM-Sequenz jedes Strangs beim ersten und/oder zweiten napDNAbp der beiden ersten und zweiten Prime-Editor- Komplexe liegt.
System nach Anspruch 161, wobei das Anbinden der Spacer-Sequenz des dritten und vierten Prime-Editor-Komplexes in Präsenz einer PAM-Sequenz zum Nicken des ersten und zweiten Strangs führt, jeweils an einer Nick-Stelle, die proximal zur PAM-Sequenz jedes Strangs beim dritten und/oder vierten napDNAbp der beiden dritten und vierten Prime-Editor- Komplexe liegt.
System nach Anspruch 133, wobei die erste und dritte Bindungsstelle, oder die zweite und vierte Bindungsstelle zwei Enden einer zusammenhängenden Region doppelsträngiger DNA definieren.
System nach Anspruch 163, wobei die zusammenhängende Region zwischen der ersten und dritten Bindungsstelle oder der zweiten und vierten Bindungsstelle mindestens 10 Nukleobasenpaare, mindestens 11 Nukleobasenpaare, mindestens 12 Nukleobasenpaare, mindestens 13 Nukleobasenpaare, mindestens 14 Nukleobasenpaare, mindestens 15 Nukleobasenpaare, mindestens 16 Nukleobasenpaare, mindestens 17 Nukleobasenpaare, mindestens 18 Nukleobasenpaare, mindestens 19 Nukleobasenpaare, mindestens 20 Nukleobasenpaare, mindestens 21 Nukleobasenpaare, mindestens 22 Nukleobasenpaare, mindestens 23 Nukleobasenpaare, mindestens 24 Nukleobasenpaare, mindestens 25 Nukleobasenpaare, mindestens 26 Nukleobasenpaare, mindestens 27 Nukleobasenpaare, mindestens 28 Nukleobasenpaare, mindestens 29 Nukleobasenpaare, mindestens 30 Nukleobasenpaare, mindestens 31 Nukleobasenpaare, mindestens 32 Nukleobasenpaare, mindestens 33 Nukleobasenpaare, mindestens 34 Nukleobasenpaare, mindestens 35 Nukleobasenpaare, mindestens 36 Nukleobasenpaare, mindestens 37 Nukleobasenpaare, mindestens 38 Nukleobasenpaare, mindestens 39 Nukleobasenpaare, mindestens 40 Nukleobasenpaare, mindestens 41 Nukleotide, mindestens 42 Nukleotide, mindestens 43 Nukleotide, mindestens 44 Nukleotide, mindestens 45 Nukleotide, mindestens 46 Nukleotide, mindestens 47 Nukleotide, mindestens 48 Nukleotide, mindestens 49 Nukleotide, mindestens 50 Nukleotide, mindestens 51 Nukleotide, mindestens 52 Nukleotide, mindestens 53 Nukleotide, mindestens 54 Nukleotide, mindestens 55 Nukleotide, mindestens 56 Nukleotide, mindestens 57 Nukleotide, mindestens 58 Nukleotide, mindestens 59 Nukleotide, mindestens 60 Nukleotide, mindestens 61 Nukleotide, mindestens 62 Nukleotide, mindestens 63 Nukleotide, mindestens 64 Nukleotide, mindestens 65 Nukleotide, mindestens 66 Nukleotide, mindestens 67 Nukleotide, mindestens 68 Nukleotide, mindestens 69 Nukleotide, mindestens 70 Nukleotide, mindestens 71 Nukleotide, mindestens 72 Nukleotide, mindestens 73 Nukleotide, mindestens 74 Nukleotide, mindestens 75 Nukleotide, mindestens 76 Nukleotide, mindestens 77 Nukleotide, mindestens 78 Nukleotide, mindestens 79 Nukleotide, mindestens 80 Nukleotide, mindestens 81 Nukleotide, mindestens 82 Nukleotide, mindestens 83 Nukleotide, mindestens 84 Nukleotide, mindestens 85 Nukleotide, mindestens 86 Nukleotide, mindestens 87 Nukleotide, mindestens 88 Nukleotide, mindestens 89 Nukleotide, mindestens 90 Nukleotide, mindestens 91 Nukleotide, mindestens 92 Nukleotide, mindestens 93 Nukleotide, mindestens 94 Nukleotide, mindestens 95 Nukleotide, mindestens 96 Nukleotide, mindestens 97 Nukleotide, mindestens 98 Nukleotide, mindestens 99 Nukleotide, mindestens 100 Nukleotide, mindestens 101 Nukleotide, mindestens 102 Nukleotide, mindestens 103 Nukleotide, mindestens 104 Nukleotide, mindestens 105 Nukleotide, mindestens 106 Nukleotide, mindestens 107 Nukleotide, mindestens 108 Nukleotide, mindestens 109 Nukleotide oder mindestens 110 Nukleotide lang ist.
System nach einem der Ansprüche 130-164, wobei die Komplementaritätsregion der ersten einzelsträngigen DNA-Sequenz und der dritten einzelsträngige DNA-Sequenz und/oder die Komplementaritätsregion der zweiten einzelsträngigen DNA-Sequenz und der vierten einzelsträngige DNA-Sequenz einen Duplex formen.
System nach Anspruch 164, wobei die zusammenhängende Region von dem Duplex ersetzt wird.
System nach Anspruch 166, wobei der Duplex an der Zielstelle in die doppelsträngige DNA eingebaut wird.
System nach einem der Ansprüche 122-167, wobei die erste, zweite, dritte und/oder vierte DNA-Synthese-Template mindestens 1 Nukleotid, mindestens 2 Nukleotide, mindestens 3 Nukleotide, mindestens 4 Nukleotide, mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide, mindestens 15 Nukleotide, mindestens 16 Nukleotide, mindestens 17 Nukleotide, mindestens 18 Nukleotide, mindestens 19 Nukleotide, mindestens 20 Nukleotide, mindestens 21 Nukleotide, mindestens 22 Nukleotide, mindestens 23 Nukleotide, mindestens 24 Nukleotide, mindestens 25 Nukleotide, mindestens 26 Nukleotide, mindestens 27 Nukleotide, mindestens 28 Nukleotide, mindestens 29 Nukleotide, mindestens 30 Nukleotide, mindestens 31 Nukleotide, mindestens 32 Nukleotide, mindestens 33 Nukleotide, mindestens 34 Nukleotide, mindestens 35 Nukleotide, mindestens 36 Nukleotide, mindestens 37 Nukleotide, mindestens 38 Nukleotide, mindestens 39 Nukleotide, mindestens 40 Nukleotide, mindestens 41 Nukleotide, mindestens 42 Nukleotide, mindestens 43 Nukleotide, mindestens 44 Nukleotide, mindestens 45 Nukleotide, mindestens 46 Nukleotide, mindestens 47 Nukleotide, mindestens 48 Nukleotide, mindestens 49 Nukleotide, mindestens 50 Nukleotide, mindestens 51 Nukleotide, mindestens 52 Nukleotide, mindestens 53 Nukleotide, mindestens 54 Nukleotide, mindestens 55 Nukleotide, mindestens 56 Nukleotide, mindestens 57 Nukleotide, mindestens 58 Nukleotide, mindestens 59 Nukleotide, mindestens 60 Nukleotide, mindestens 61 Nukleotide, mindestens 62 Nukleotide, mindestens 63 Nukleotide, mindestens 64 Nukleotide, mindestens 65 Nukleotide, mindestens 66 Nukleotide, mindestens 67 Nukleotide, mindestens 68 Nukleotide, mindestens 69 Nukleotide, mindestens 70 Nukleotide, mindestens 71 Nukleotide, mindestens 72 Nukleotide, mindestens 73 Nukleotide, mindestens 74 Nukleotide, mindestens 75 Nukleotide, mindestens 76 Nukleotide, mindestens 77 Nukleotide, mindestens 78 Nukleotide, mindestens 79 Nukleotide, mindestens 80 Nukleotide, mindestens 81 Nukleotide, mindestens 82 Nukleotide, mindestens 83 Nukleotide, mindestens 84 Nukleotide, mindestens 85 Nukleotide, mindestens 86 Nukleotide, mindestens 87 Nukleotide, mindestens 88 Nukleotide, mindestens 89 Nukleotide, mindestens 90 Nukleotide, mindestens 91 Nukleotide, mindestens 92 Nukleotide, mindestens 93 Nukleotide, mindestens 94 Nukleotide, mindestens 95 Nukleotide, mindestens 96 Nukleotide, mindestens 97 Nukleotide, mindestens 98 Nukleotide, mindestens 99 Nukleotide, mindestens 100 Nukleotide, mindestens 101 Nukleotide, mindestens 102 Nukleotide, mindestens 103 Nukleotide, mindestens 104 Nukleotide, mindestens 105 Nukleotide, mindestens 106 Nukleotide, mindestens 107 Nukleotide, mindestens 108 Nukleotide, mindestens 109 Nukleotide oder mindestens 110 Nukleotide lang ist.
System nach einem der Ansprüche 122-168, wobei die erste einzelsträngige DNA- Sequenz und die zweite einzelsträngige DNA-Sequenz und/oder die dritte einzelsträngige DNA-Sequenz und die vierte einzelsträngige DNA-Sequenz die gleichen Längen aufweisen.
System nach einem der Ansprüche 122-169, wobei die erste einzelsträngige DNA- Sequenz und die zweite einzelsträngige DNA-Sequenz und/oder die dritte einzelsträngige DNA-Sequenz und die vierte einzelsträngige DNA-Sequenz unterschiedliche Längen aufweisen.
System nach einem der Ansprüche 122-170, wobei die Komplementaritätsregion der ersten, zweiten, dritten und/oder vierten einzelsträngigen DNA-Sequenz mindestens 99 %, mindestens 95 %, mindestens 90 %, mindestens 85 %, mindestens 80 %, mindestens 75 %, mindestens 70 %, mindestens 65 %, mindestens 60 %, mindestens 55 %, mindestens 50 %, mindestens 45 %, mindestens 40 %, mindestens 35 %, mindestens 30 %, mindestens 25 %, mindestens 20 %, mindestens 15 % oder mindestens 10 % der Gesamtlänge der ersten einzelsträngigen DNA-Sequenz und der dritten einzelsträngigen DNA-Sequenz oder der zweiten einzelsträngigen DNA-Sequenz und der vierten einzelsträngigen DNA-Sequenz beträgt.
System nach einem der Ansprüche 122-171, wobei die Komplementaritätsregion der ersten, zweiten, dritten und/oder vierten einzelsträngigen DNA-Sequenz mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide, mindestens 15 Nukleotide, mindestens 16 Nukleotide, mindestens 17 Nukleotide, mindestens 18 Nukleotide, mindestens 19 Nukleotide, mindestens 20 Nukleotide, mindestens 21 Nukleotide, mindestens 22 Nukleotide, mindestens 23 Nukleotide, mindestens 24 Nukleotide, mindestens 25 Nukleotide, mindestens 26 Nukleotide, mindestens 27 Nukleotide, mindestens 28 Nukleotide, mindestens 29 Nukleotide, mindestens 30 Nukleotide, mindestens 31 Nukleotide, mindestens 32 Nukleotide, mindestens 33 Nukleotide, mindestens 34 Nukleotide, mindestens 35 Nukleotide, mindestens 36 Nukleotide, mindestens 37 Nukleotide, mindestens 38 Nukleotide, mindestens 39 Nukleotide, mindestens 40 Nukleotide, mindestens 41 Nukleotide, mindestens 42 Nukleotide, mindestens 43 Nukleotide, mindestens 44 Nukleotide, mindestens 45 Nukleotide, mindestens 46 Nukleotide, mindestens 47 Nukleotide, mindestens 48 Nukleotide, mindestens 49 Nukleotide, mindestens 50 Nukleotide, mindestens 51 Nukleotide, mindestens 52 Nukleotide, mindestens 53 Nukleotide, mindestens 54 Nukleotide, mindestens 55 Nukleotide, mindestens 56 Nukleotide, mindestens 57 Nukleotide, mindestens 58 Nukleotide, mindestens 59 Nukleotide, mindestens 60 Nukleotide, mindestens 61 Nukleotide, mindestens 62 Nukleotide, mindestens 63 Nukleotide, mindestens 64 Nukleotide, mindestens 65 Nukleotide, mindestens 66 Nukleotide, mindestens 67 Nukleotide, mindestens 68 Nukleotide, mindestens 69 Nukleotide, mindestens 70 Nukleotide, mindestens 71 Nukleotide, mindestens 72 Nukleotide, mindestens 73 Nukleotide, mindestens 74 Nukleotide, mindestens 75 Nukleotide, mindestens 76 Nukleotide, mindestens 77 Nukleotide, mindestens 78 Nukleotide, mindestens 79 Nukleotide, mindestens 80 Nukleotide, mindestens 81 Nukleotide, mindestens 82 Nukleotide, mindestens 83 Nukleotide, mindestens 84 Nukleotide, mindestens 85 Nukleotide, mindestens 86 Nukleotide, mindestens 87 Nukleotide, mindestens 88 Nukleotide, mindestens 89 Nukleotide, mindestens 90 Nukleotide, mindestens 91 Nukleotide, mindestens 92 Nukleotide, mindestens 93 Nukleotide, mindestens 94 Nukleotide, mindestens 95 Nukleotide, mindestens 96 Nukleotide, mindestens 97 Nukleotide, mindestens 98 Nukleotide, mindestens 99 Nukleotide, mindestens 100 Nukleotide, mindestens 101 Nukleotide, mindestens 102 Nukleotide, mindestens 103 Nukleotide, mindestens 104 Nukleotide, mindestens 105 Nukleotide, mindestens 106 Nukleotide, mindestens 107 Nukleotide, mindestens 108 Nukleotide, mindestens 109 Nukleotide oder mindestens 110 Nukleotide lang ist und entweder kürzer oder gleich der Länge der ersten einzelsträngigen DNA-Sequenz und der dritten einzelsträngigen DNA-Sequenz, und der zweiten einzelsträngigen DNA-Sequenz und der vierten einzelsträngigen DNA-Sequenz ist.
System nach einem der Ansprüche 130-172, wobei die erste, zweite, dritte und/oder vierte einzelsträngige DNA-Sequenz jeweils einzelsträngige DNA-Stränge mit 3'-Enden sind.
System nach Anspruch 173, wobei das Integrieren des Duplex, der den editierten Teil umfasst, zu einer Insertion, Deletion oder einem Ersetzen von DNA an der Zielstelle führt.
Polynukleotid, das den ersten, zweiten, dritten und/oder vierten Prime-Editor nach einem der Ansprüche 130-174 kodiert.
Polynukleotid, das die erste, zweite, dritte und/oder vierte PEgRNA nach einem der Ansprüche 130-175 kodiert.
Vektor, der ein Polynukleotid nach Anspruch 175 oder 176 umfasst.
Zelle, die ein Polynukleotid nach Anspruch 175 oder 176 oder einen Vektor nach Anspruch 177 umfasst.
Pharmazeutische Zusammensetzung, die ein Polynukleotid nach Anspruch 175 oder 176, einen Vektor nach Anspruch 177 oder eine Zelle nach Anspruch 178 und einen pharmazeutisch verträglichen Hilfsstoff umfasst.
Kit, das ein Polynukleotid nach Anspruch 175 oder 176, oder einen Vektor nach Anspruch 177 und Anweisungen für das gleichzeitige Editieren beider Stränge einer doppelsträngigen DNA-Sequenz an der zu editierenden Zielstelle umfasst.
Verfahren zum gleichzeitigen Editieren eines ersten und zweiten komplementären Strangs einer doppelsträngigen DNA-Sequenz an einer Zielstelle, wobei besagtes Verfahren das Inkontaktbringen der doppelsträngigen DNA-Sequenz mit einem Paar Prime-Editor- Komplexe umfasst, wobei das Paar Folgendes umfasst: (a) einen ersten Prime-Editor-Komplex, der Folgendes umfasst: i.einen ersten Prime-Editor, der ein erstes Nukleinsäure-programmierbares DNA- Bindungsprotein (erstes napDNAbp) umfasst, und ein erstes Polypeptid, das eine RNAabhängige DNA-Polymeraseaktivität umfasst; und ii.eine erste Prime-Editing-Guide-RNA (erste PEgRNA), die an eine erste Zielsequenz auf dem ersten Strang der genomischen DNA-Sequenz stromaufwärts der Zielstelle anbindet; (b) einen zweiten Prime-Editor-Komplex, der Folgendes umfasst: i.einen zweiten Prime-Editor, der ein zweites Nukleinsäure-programmierbares DNA- Bindungsprotein (zweites napDNAbp) umfasst, und ein zweites Polypeptid, das eine RNAabhängige DNA-Polymeraseaktivität umfasst; und ii.eine zweite Prime-Editing-Guide-RNA (zweite PEgRNA), die an eine zweite Zielsequenz auf dem zweiten Strang der genomischen DNA-Sequenz stromaufwärts der Zielstelle anbindet; (c) einen dritten Prime-Editor-Komplex, der Folgendes umfasst: i.einen dritten Prime-Editor, der ein drittes Nukleinsäure-programmierbares DNA- Bindungsprotein (drittes napDNAbp) umfasst, und ein drittes Polypeptid, das eine RNAabhängige DNA-Polymeraseaktivität umfasst; und ii.eine dritte Prime-Editing-Guide-RNA (dritte PEgRNA), die an eine dritte Zielsequenz auf dem ersten Strang der genomischen DNA-Sequenz stromabwärts der Zielstelle anbindet; (d) einen vierten Prime-Editor-Komplex, der Folgendes umfasst: i.einen vierten Prime-Editor, der ein zweites Nukleinsäure-programmierbares DNA- Bindungsprotein (viertes napDNAbp) umfasst, und ein viertes Polypeptid, das eine RNAabhängige DNA-Polymeraseaktivität umfasst; und ii.eine vierte Prime-Editing-Guide-RNA (vierte PEgRNA), die an eine vierte Zielsequenz auf dem zweiten Strang der genomischen DNA-Sequenz stromabwärts der Zielstelle anbindet; wobei der erste Prime-Editor-Komplex einen ersten Nick bei der ersten Zielsequenz erzeugt und daraufhin die Polymerisation einer ersten einzelsträngigen DNA-Sequenz mit 3'-Ende ausgehend vom 5'-Ende, das durch den ersten Nick entstand, hervorruft; wobei der zweite Prime-Editor-Komplex einen zweiten Nick bei der zweiten Zielsequenz erzeugt und daraufhin die Polymerisation einer zweiten einzelsträngigen DNA-Sequenz mit 3'- Ende ausgehend vom 5'-Ende, das durch den zweiten Nick entstand, hervorruft; wobei der dritte Prime-Editor-Komplex einen dritten Nick bei der dritten Zielsequenz erzeugt und daraufhin die Polymerisation einer dritten einzelsträngigen DNA-Sequenz mit 3'-Ende ausgehend vom 5'-Ende, das durch den dritten Nick entstand, hervorruft; wobei der vierte Prime-Editor-Komplex einen vierten Nick bei der vierten Zielsequenz erzeugt und daraufhin die Polymerisation einer vierten einzelsträngigen DNA-Sequenz mit 3'-Ende ausgehend vom 5'-Ende, das durch den vierten Nick entstand, hervorruft; wobei die erste einzelsträngige DNA-Sequenz und die zweite einzelsträngige DNA-Sequenz reverse Komplemente für zumindest eine Komplementaritätsregion sind und einen Duplex formen, wobei der Duplex die genickten ersten und zweiten komplementären Stränge der doppelsträngigen DNA-Sequenz ersetzt; und wobei die dritte einzelsträngige DNA-Sequenz und die vierte einzelsträngige DNA-Sequenz reverse Komplemente für zumindest eine Komplementaritätsregion sind und einen Duplex formen, wobei der Duplex die genickten ersten und zweiten komplementären Stränge der doppelsträngigen DNA-Sequenz ersetzt.
Verfahren nach Anspruch 181, wobei der Prime-Editor des ersten Prime-Editor- Komplexes, des zweiten Prime-Editor-Komplexes, des dritten Prime-Editor-Komplexes und/oder des vierten Prime-Editor-Komplexes ein Fusionsprotein ist, welches das napDNAbp und das Polypeptid mit RNA-abhängiger DNA-Polymeraseaktivität umfasst.
Verfahren nach Anspruch 181 oder 182, wobei der erste Prime-Editor-Komplex, der zweite Prime-Editor-Komplex, der dritte Prime-Editor-Komplex und der vierte Prime-Editor- Komplex den gleichen Prime-Editor umfassen.
Verfahren nach einem der Ansprüche 181-183, wobei der erste, zweite, dritte und/oder vierte Prime-Editor-Komplex einen unterschiedlichen Prime-Editor umfassen.
Verfahren nach einem der Ansprüche 181-184, wobei das erste, zweite, dritte und/oder vierte napDNAbp eine Cas9-Domäne oder Variante davon ist.
Verfahren nach einem der Ansprüche 181-185, wobei das erste, zweite, dritte und/oder vierte napDNAbp eine Nuklease-aktive Cas9-Domäne, eine Nuklease-inaktive Cas9-Domäne, eine Cas9-Nickase-Domäne oder eine Variante ebendieser ist.
Verfahren nach einem der Ansprüche 181-184, wobei das erste, zweite, dritte und/oder vierte napDNAbp aus der Gruppe bestehend aus: Cas9, Cas12e, Cas12d, Cas12a, Cas12b1, Casl3a, Cas12c stammt.
Verfahren nach einem der Ansprüche 181-187, wobei das erste, zweite, dritte und/oder vierte napDNAbp eine Nickase-Aktivität aufweist.
Verfahren nach einem der Ansprüche 181-188, wobei das erste, zweite, dritte und/oder vierte napDNAbp eine Aminosäuresequenz mit einer der SEQ-ID-NR: 2-65 umfasst, oder eine Aminosäuresequenz umfasst, die mindestens 80 %, 85 %, 90 %, 95 % oder 99 % Sequenzidentität mit einer der SEQ-ID-NR: 2-65 hat.
Verfahren nach einem der Ansprüche 181-189, wobei das erste, zweite, dritte und/oder vierte Polypeptid mit einer RNA-abhängigen DNA-Polymeraseaktivität eine reverse Transkriptase ist.
Verfahren nach einem der Ansprüche 181-190, wobei das erste, zweite, dritte und/oder vierte Polypeptid mit einer RNA-abhängigen DNA-Polymeraseaktivität eine Aminosäuresequenz mit einer der SEQ-ID-NR: 37, 68-79, 82-98, 81, 98 und 110 umfasst, oder eine Aminosäuresequenz umfasst, die mindestens 80 %, 85 %, 90 %, 95 % oder 99 % Sequenzidentität mit einer der SEQ-ID-NR: 37, 68-79, 82-98, 81, 98 und 110 hat.
Verfahren nach einem der Ansprüche 181-191, wobei (i) der erste Prime-Editor überdies einen Linker enthält, der das erste napDNAbp und das erste Polypeptid mit RNA-abhängiger DNA-Polymeraseaktivität verbindet; (ii) der zweite Prime-Editor überdies einen Linker enthält, der das zweite napDNAbp und das zweite Polypeptid mit RNA-abhängiger DNA-Polymeraseaktivität verbindet; (iii) der dritte Prime-Editor überdies einen Linker enthält, der das dritte napDNAbp und das dritte Polypeptid mit RNA-abhängiger DNA-Polymeraseaktivität verbindet; und/oder (iv) der vierte Prime-Editor überdies einen Linker enthält, der das vierte napDNAbp und das vierte Polypeptid mit RNA-abhängiger DNA-Polymeraseaktivität verbindet.
Verfahren nach Anspruch 192, wobei der Linker eine Aminosäuresequenz mit einer der SEQ-ID-NR: 119-128 umfasst, oder eine Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 % oder 99 % Sequenzidentität mit einer der SEQ-ID-Nummern: 119-128 hat.
Verfahren nach Anspruch 192 oder 193, wobei der Linker eine Länge von 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49 oder 50 Aminosäuren hat.
Verfahren nach einem der Ansprüche 192-194, wobei die erste, zweite, dritte und/oder vierte PEgRNA eine Nukleotidsequenz mit einer der SEQ-ID-NR: 192-203 umfasst, oder eine Nukleotidsequenz umfasst, die mindestens 80 %, 85 %, 90 %, 95 % oder 99 % Sequenzidentität mit einer der SEQ-ID-NR: 192-203 hat.
Verfahren nach einem der Ansprüche 192-195, wobei die erste Spacer-Sequenz des ersten Prime-Editor-Komplexes an eine erste Bindungsstelle auf einem ersten Strang der doppelsträngigen DNA-Sequenz stromaufwärts der zu editierenden Zielstelle anbindet.
Verfahren nach einem der Ansprüche 192-196, wobei die zweite Spacer-Sequenz des zweiten Prime-Editor-Komplexes an eine zweite Bindungsstelle auf einem zweiten Strang der doppelsträngigen DNA-Sequenz stromabwärts der zu editierenden Zielstelle anbindet.
Verfahren nach einem der Ansprüche 192-197, wobei die dritte Spacer-Sequenz des dritten Prime-Editor-Komplexes an eine dritte Bindungsstelle auf einem ersten Strang der doppelsträngigen DNA-Sequenz stromaufwärts der zu editierenden Zielstelle anbindet.
Verfahren nach einem der Ansprüche 192-198, wobei die vierte Spacer-Sequenz des vierten Prime-Editor-Komplexes an eine vierte Bindungsstelle auf einem zweiten Strang der doppelsträngigen DNA-Sequenz stromabwärts der zu editierenden Zielstelle anbindet.
Verfahren nach Anspruch 199, wobei das Anbinden der ersten und zweiten Spacer- Sequenz des ersten und zweiten Prime-Editor-Komplexes in Präsenz einer PAM-Sequenz zum Nicken des ersten und zweiten Strangs führt, jeweils an einer Nick-Stelle, die proximal zur PAM-Sequenz jedes Strangs beim napDNAbp der beiden ersten und zweiten Prime-Editor- Komplexe liegt.
Verfahren nach Anspruch 200, wobei das Anbinden der dritten und vierten Spacer- Sequenz des dritten und vierten Prime-Editor-Komplexes in Präsenz einer PAM-Sequenz zum Nicken des ersten und zweiten Strangs führt, jeweils an einer Nick-Stelle, die proximal zur PAM-Sequenz jedes Strangs beim dritten und/oder vierten napDNAbp der beiden dritten und vierten Prime-Editor-Komplexe liegt.
Verfahren nach Anspruch 200 oder 201, wobei die erste und zweite Bindungsstelle und/oder die dritte und vierte Bindungsstelle zwei Enden einer zusammenhängenden Region doppelsträngiger DNA definieren, welche die zu editierende Zielstelle umfasst.
Verfahren nach Anspruch 202, wobei die zusammenhängende Region zwischen der ersten und zweiten Bindungsstelle und/oder die zusammenhängende Region zwischen der dritten und vierten Bindungsstelle mindestens 10 Nukleobasenpaare, mindestens 11 Nukleobasenpaare, mindestens 12 Nukleobasenpaare, mindestens 13 Nukleobasenpaare, mindestens 14 Nukleobasenpaare, mindestens 15 Nukleobasenpaare, mindestens 16 Nukleobasenpaare, mindestens 17 Nukleobasenpaare, mindestens 18 Nukleobasenpaare, mindestens 19 Nukleobasenpaare, mindestens 20 Nukleobasenpaare, mindestens 21 Nukleobasenpaare, mindestens 22 Nukleobasenpaare, mindestens 23 Nukleobasenpaare, mindestens 24 Nukleobasenpaare, mindestens 25 Nukleobasenpaare, mindestens 26 Nukleobasenpaare, mindestens 27 Nukleobasenpaare, mindestens 28 Nukleobasenpaare, mindestens 29 Nukleobasenpaare, mindestens 30 Nukleobasenpaare, mindestens 31 Nukleobasenpaare, mindestens 32 Nukleobasenpaare, mindestens 33 Nukleobasenpaare, mindestens 34 Nukleobasenpaare, mindestens 35 Nukleobasenpaare, mindestens 36 Nukleobasenpaare, mindestens 37 Nukleobasenpaare, mindestens 38 Nukleobasenpaare, mindestens 39 Nukleobasenpaare, mindestens 40 Nukleobasenpaare, mindestens 41 Nukleotide, mindestens 42 Nukleotide, mindestens 43 Nukleotide, mindestens 44 Nukleotide, mindestens 45 Nukleotide, mindestens 46 Nukleotide, mindestens 47 Nukleotide, mindestens 48 Nukleotide, mindestens 49 Nukleotide, mindestens 50 Nukleotide, mindestens 51 Nukleotide, mindestens 52 Nukleotide, mindestens 53 Nukleotide, mindestens 54 Nukleotide, mindestens 55 Nukleotide, mindestens 56 Nukleotide, mindestens 57 Nukleotide, mindestens 58 Nukleotide, mindestens 59 Nukleotide, mindestens 60 Nukleotide, mindestens 61 Nukleotide, mindestens 62 Nukleotide, mindestens 63 Nukleotide, mindestens 64 Nukleotide, mindestens 65 Nukleotide, mindestens 66 Nukleotide, mindestens 67 Nukleotide, mindestens 68 Nukleotide, mindestens 69 Nukleotide, mindestens 70 Nukleotide, mindestens 71 Nukleotide, mindestens 72 Nukleotide, mindestens 73 Nukleotide, mindestens 74 Nukleotide, mindestens 75 Nukleotide, mindestens 76 Nukleotide, mindestens 77 Nukleotide, mindestens 78 Nukleotide, mindestens 79 Nukleotide, mindestens 80 Nukleotide, mindestens 81 Nukleotide, mindestens 82 Nukleotide, mindestens 83 Nukleotide, mindestens 84 Nukleotide, mindestens 85 Nukleotide, mindestens 86 Nukleotide, mindestens 87 Nukleotide, mindestens 88 Nukleotide, mindestens 89 Nukleotide, mindestens 90 Nukleotide, mindestens 91 Nukleotide, mindestens 92 Nukleotide, mindestens 93 Nukleotide, mindestens 94 Nukleotide, mindestens 95 Nukleotide, mindestens 96 Nukleotide, mindestens 97 Nukleotide, mindestens 98 Nukleotide, mindestens 99 Nukleotide, mindestens 100 Nukleotide, mindestens 101 Nukleotide, mindestens 102 Nukleotide, mindestens 103 Nukleotide, mindestens 104 Nukleotide, mindestens 105 Nukleotide, mindestens 106 Nukleotide, mindestens 107 Nukleotide, mindestens 108 Nukleotide, mindestens 109 Nukleotide oder mindestens 110 Nukleotide lang ist.
Verfahren nach Anspruch 202 oder 203, wobei die zusammenhängende Region vom Duplex ersetzt wird.
Verfahren nach einem der Ansprüche 181-204, wobei die erste, zweite, dritte und/oder vierte DNA-Synthese-Template mindestens 1 Nukleotid, mindestens 2 Nukleotide, mindestens 3 Nukleotide, mindestens 4 Nukleotide, mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide, mindestens 15 Nukleotide, mindestens 16 Nukleotide, mindestens 17 Nukleotide, mindestens 18 Nukleotide, mindestens 19 Nukleotide, mindestens 20 Nukleotide, mindestens 21 Nukleotide, mindestens 22 Nukleotide, mindestens 23 Nukleotide, mindestens 24 Nukleotide, mindestens 25 Nukleotide, mindestens 26 Nukleotide, mindestens 27 Nukleotide, mindestens 28 Nukleotide, mindestens 29 Nukleotide, mindestens 30 Nukleotide, mindestens 31 Nukleotide, mindestens 32 Nukleotide, mindestens 33 Nukleotide, mindestens 34 Nukleotide, mindestens 35 Nukleotide, mindestens 36 Nukleotide, mindestens 37 Nukleotide, mindestens 38 Nukleotide, mindestens 39 Nukleotide, mindestens 40 Nukleotide, mindestens 41 Nukleotide, mindestens 42 Nukleotide, mindestens 43 Nukleotide, mindestens 44 Nukleotide, mindestens 45 Nukleotide, mindestens 46 Nukleotide, mindestens 47 Nukleotide, mindestens 48 Nukleotide, mindestens 49 Nukleotide, mindestens 50 Nukleotide, mindestens 51 Nukleotide, mindestens 52 Nukleotide, mindestens 53 Nukleotide, mindestens 54 Nukleotide, mindestens 55 Nukleotide, mindestens 56 Nukleotide, mindestens 57 Nukleotide, mindestens 58 Nukleotide, mindestens 59 Nukleotide, mindestens 60 Nukleotide, mindestens 61 Nukleotide, mindestens 62 Nukleotide, mindestens 63 Nukleotide, mindestens 64 Nukleotide, mindestens 65 Nukleotide, mindestens 66 Nukleotide, mindestens 67 Nukleotide, mindestens 68 Nukleotide, mindestens 69 Nukleotide, mindestens 70 Nukleotide, mindestens 71 Nukleotide, mindestens 72 Nukleotide, mindestens 73 Nukleotide, mindestens 74 Nukleotide, mindestens 75 Nukleotide, mindestens 76 Nukleotide, mindestens 77 Nukleotide, mindestens 78 Nukleotide, mindestens 79 Nukleotide, mindestens 80 Nukleotide, mindestens 81 Nukleotide, mindestens 82 Nukleotide, mindestens 83 Nukleotide, mindestens 84 Nukleotide, mindestens 85 Nukleotide, mindestens 86 Nukleotide, mindestens 87 Nukleotide, mindestens 88 Nukleotide, mindestens 89 Nukleotide, mindestens 90 Nukleotide, mindestens 91 Nukleotide, mindestens 92 Nukleotide, mindestens 93 Nukleotide, mindestens 94 Nukleotide, mindestens 95 Nukleotide, mindestens 96 Nukleotide, mindestens 97 Nukleotide, mindestens 98 Nukleotide, mindestens 99 Nukleotide, mindestens 100 Nukleotide, mindestens 101 Nukleotide, mindestens 102 Nukleotide, mindestens 103 Nukleotide, mindestens 104 Nukleotide, mindestens 105 Nukleotide, mindestens 106 Nukleotide, mindestens 107 Nukleotide, mindestens 108 Nukleotide, mindestens 109 Nukleotide oder mindestens 110 Nukleotide lang ist.
Verfahren nach einem der Ansprüche 181-205, wobei die erste einzelsträngige DNA- Sequenz und die zweite einzelsträngige DNA-Sequenz und/oder die dritte einzelsträngige DNA-Sequenz und die vierte einzelsträngige DNA-Sequenz die gleichen Längen aufweisen.
Verfahren nach einem der Ansprüche 181-206, wobei die erste einzelsträngige DNA- Sequenz und die zweite einzelsträngige DNA-Sequenz und/oder die dritte einzelsträngige DNA-Sequenz und die vierte einzelsträngige DNA-Sequenz unterschiedliche Längen aufweisen.
Verfahren nach einem der Ansprüche 181-207, wobei die Komplementaritätsregion mindestens 99 %, mindestens 95 %, mindestens 90 %, mindestens 85 %, mindestens 80 %, mindestens 75 %, mindestens 70 %, mindestens 65 %, mindestens 60 %, mindestens 55 %, mindestens 50 %, mindestens 45 %, mindestens 40 %, mindestens 35 %, mindestens 30 %, mindestens 25 %, mindestens 20 %, mindestens 15 % oder mindestens 10 % der Gesamtlänge der ersten einzelsträngigen DNA-Sequenz und der zweiten einzelsträngigen DNA-Sequenz oder der dritten einzelsträngigen DNA-Sequenz und der vierten einzelsträngigen DNA- Sequenz beträgt.
Verfahren nach einem der Ansprüche 181-208, wobei die Komplementaritätsregion mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide, mindestens 15 Nukleotide, mindestens 16 Nukleotide, mindestens 17 Nukleotide, mindestens 18 Nukleotide, mindestens 19 Nukleotide, mindestens 20 Nukleotide, mindestens 21 Nukleotide, mindestens 22 Nukleotide, mindestens 23 Nukleotide, mindestens 24 Nukleotide, mindestens 25 Nukleotide, mindestens 26 Nukleotide, mindestens 27 Nukleotide, mindestens 28 Nukleotide, mindestens 29 Nukleotide, mindestens 30 Nukleotide, mindestens 31 Nukleotide, mindestens 32 Nukleotide, mindestens 33 Nukleotide, mindestens 34 Nukleotide, mindestens 35 Nukleotide, mindestens 36 Nukleotide, mindestens 37 Nukleotide, mindestens 38 Nukleotide, mindestens 39 Nukleotide, mindestens 40 Nukleotide, mindestens 41 Nukleotide, mindestens 42 Nukleotide, mindestens 43 Nukleotide, mindestens 44 Nukleotide, mindestens 45 Nukleotide, mindestens 46 Nukleotide, mindestens 47 Nukleotide, mindestens 48 Nukleotide, mindestens 49 Nukleotide, mindestens 50 Nukleotide, mindestens 51 Nukleotide, mindestens 52 Nukleotide, mindestens 53 Nukleotide, mindestens 54 Nukleotide, mindestens 55 Nukleotide, mindestens 56 Nukleotide, mindestens 57 Nukleotide, mindestens 58 Nukleotide, mindestens 59 Nukleotide, mindestens 60 Nukleotide, mindestens 61 Nukleotide, mindestens 62 Nukleotide, mindestens 63 Nukleotide, mindestens 64 Nukleotide, mindestens 65 Nukleotide, mindestens 66 Nukleotide, mindestens 67 Nukleotide, mindestens 68 Nukleotide, mindestens 69 Nukleotide, mindestens 70 Nukleotide, mindestens 71 Nukleotide, mindestens 72 Nukleotide, mindestens 73 Nukleotide, mindestens 74 Nukleotide, mindestens 75 Nukleotide, mindestens 76 Nukleotide, mindestens 77 Nukleotide, mindestens 78 Nukleotide, mindestens 79 Nukleotide, mindestens 80 Nukleotide, mindestens 81 Nukleotide, mindestens 82 Nukleotide, mindestens 83 Nukleotide, mindestens 84 Nukleotide, mindestens 85 Nukleotide, mindestens 86 Nukleotide, mindestens 87 Nukleotide, mindestens 88 Nukleotide, mindestens 89 Nukleotide, mindestens 90 Nukleotide, mindestens 91 Nukleotide, mindestens 92 Nukleotide, mindestens 93 Nukleotide, mindestens 94 Nukleotid, mindestens 95 Nukleotide, mindestens 96 Nukleotide, mindestens 97 Nukleotide, mindestens 98 Nukleotide, mindestens 99 Nukleotide, mindestens 100 Nukleotide, mindestens 101 Nukleotide, mindestens 102 Nukleotide, mindestens 103 Nukleotide, mindestens 104 Nukleotide, mindestens 105 Nukleotide, mindestens 106 Nukleotide, mindestens 107 Nukleotide, mindestens 108 Nukleotide, mindestens 109 Nukleotide oder mindestens 110 Nukleotide lang ist.
Verfahren nach einem der Ansprüche 188-209, wobei die Komplementaritätsregion der ersten einzelsträngigen DNA-Sequenz und der zweiten einzelsträngige DNA-Sequenz und/oder der dritten einzelsträngigen DNA-Sequenz und der vierten einzelsträngige DNA- Sequenz den Duplex formen.
Verfahren nach einem der Ansprüche 188-210, wobei die erste einzelsträngige DNA- Sequenz und die zweite einzelsträngige DNA-Sequenz und/oder die dritte einzelsträngige DNA-Sequenz und die vierte einzelsträngige DNA-Sequenz alle einzelsträngige DNA-Stränge mit 3'-Enden sind.
Verfahren nach Anspruch 204, wobei das Ersetzen der zusammenhängenden Region durch den Duplex, der den editierten Teil umfasst, zu einer Insertion, Deletion oder einem Ersetzen von DNA an der Zielstelle führt.
Verfahren nach einem der Ansprüche 181-212, wobei sich die erste einzelsträngige DNA-Sequenz und die zweite einzelsträngige DNA-Sequenz an den Enden der Ziel-DNA- Sequenz befinden und wobei sich die dritte einzelsträngige DNA-Sequenz und die vierte einzelsträngige DNA-Sequenz an den gegenüberliegenden Enden der gleichen Ziel-DNA- Sequenz befinden.
Verfahren nach Anspruch 213, wobei die Ziel-DNA-Sequenz invertiert wird.
Verfahren nach einem der Ansprüche 181-214, das überdies einen zirkulären DNA- Donor umfasst.
Verfahren nach einem der Ansprüche 215, wobei sich die erste einzelsträngige DNA- Sequenz und die dritte einzelsträngige DNA-Sequenz an unterschiedlichen Enden der DNA- Zielsequenz befinden und wobei sich die zweite einzelsträngige DNA-Sequenz und die vierte einzelsträngige DNA-Sequenz am zirkulären DNA-Donor befinden.
Verfahren nach Anspruch 216, wobei ein Teil des zirkulären DNA-Donors zwischen der zweiten einzelsträngigen DNA-Sequenz und der vierten einzelsträngigen DNA-Sequenz die Zielsequenz zwischen der ersten einzelsträngigen DNA-Sequenz und der dritten einzelsträngigen DNA-Sequenz ersetzt.
Verfahren nach einem der Ansprüche 181-217, wobei sich die erste einzelsträngige DNA-Sequenz und die dritte einzelsträngige DNA-Sequenz auf einem Nukleinsäuremolekül befinden und wobei sich die zweite einzelsträngige DNA-Sequenz und die vierte einzelsträngige DNA-Sequenz auf einem zweiten Nukleinsäuremolekül befinden.
Verfahren nach Anspruch 218, wobei ein Teil des ersten Nukleinsäuremoleküls zwischen der ersten einzelsträngigen DNA-Sequenz und der dritten einzelsträngigen DNA- Sequenz in das zweite Nukleinsäuremolekül eingebaut wird und wobei ein Teil des zweiten Nukleinsäuremoleküls zwischen der zweiten einzelsträngigen DNA-Sequenz und der vierten einzelsträngigen DNA-Sequenz in das erste Nukleinsäuremolekül eingebaut wird.
Verfahren nach Anspruch 218 oder 219, wobei das erste Nukleinsäuremolekül ein erstes Chromosom ist und das zweite Nukleinsäuremolekül ein zweites Chromosom ist.
PEgRNA-Set, das im Multi-Flap-Prime-Editing verwendet wird, wobei die PEgRNAs Folgendes umfassen: (a) eine erste Prime-Editing-Guide-RNA (erste PEgRNA), die an eine erste Bindungsstelle auf einem ersten Strang einer doppelsträngigen DNA-Sequenz stromaufwärts der zu editierenden Zielstelle anbindet, wobei die erste PEgRNA eine erste Spacer-Sequenz, einen ersten gRNA-Kern, eine erste DNA-Synthese-Template und eine erste Primer-Bindungsstelle umfasst, wobei die erste DNA-Synthese-Template eine erste einzelsträngige DNA-Sequenz kodiert; (b) eine zweite Prime-Editing-Guide-RNA (zweite PEgRNA), die an eine zweite Bindungsstelle auf einem zweiten Strang einer doppelsträngigen DNA-Sequenz stromaufwärts der zu editierenden Zielstelle anbindet, wobei die zweite PEgRNA eine zweite Spacer- Sequenz, einen zweiten gRNA-Kern, eine zweite DNA-Synthese-Template und eine zweite Primer-Bindungsstelle umfasst, wobei die zweite DNA-Synthese-Template eine zweite einzelsträngige DNA-Sequenz kodiert, die den editierten Teil enthält, wobei die zweite einzelsträngige DNA-Sequenz komplementär zur ersten einzelsträngigen DNA-Sequenz ist. (c) eine dritte Prime-Editing-Guide-RNA (dritte PEgRNA), die an eine dritte Bindungsstelle auf einem ersten Strang einer doppelsträngigen DNA-Sequenz stromabwärts der zu editierenden Zielstelle anbindet, wobei die dritte PEgRNA eine dritte Spacer-Sequenz, einen dritten gRNA-Kern, eine dritte DNA-Synthese-Template und eine dritte Primer- Bindungsstelle umfasst, wobei die dritte DNA-Synthese-Template eine dritte einzelsträngige DNA-Sequenz kodiert; (d) eine vierte Prime-Editing-Guide-RNA (vierte PEgRNA), die an eine vierte Bindungsstelle auf einem zweiten Strang einer doppelsträngigen DNA-Sequenz stromabwärts der zu editierenden Zielstelle anbindet, wobei die vierte PEgRNA eine vierte Spacer-Sequenz, einen vierten gRNA-Kern, eine vierte DNA-Synthese-Template und eine vierte Primer- Bindungsstelle umfasst, wobei die vierte DNA-Synthese-Template eine vierte einzelsträngige DNA-Sequenz kodiert, wobei die vierte einzelsträngige DNA-Sequenz eine Komplementaritätsregion mit der dritten einzelsträngigen DNA-Sequenz aufweist.
PEgRNA-Set nach Anspruch 221, wobei die erste PEgRNA folgende Struktur umfasst: 5'-[erste gRNA-Spacer-Sequenz]-[erster gRNA-Kern]-[erste DNA-Synthese-Template]-[erste Primer-Bindungsstelle]-3'; die zweite PEgRNA folgende Struktur umfasst: 5'-[zweite gRNA-Spacer-Sequenz]-[zweiter gRNA-Kern]-[zweite DNA-Synthese-Template]- [zweite Primer-Bindungsstelle]-3'; die dritte PEgRNA folgende Struktur umfasst: 5'-[dritte gRNA-Spacer-Sequenz]-[dritte gRNA-Kem]-[dritte DNA-Synthese-Template]- [dritte Primer-Bindungsstelle]-3'; und die vierte PEgRNA folgende Struktur umfasst: 5'-[vierte gRNA-Spacer-Sequenz]-[vierter gRNA-Kern]-[vierte DNA-Synthese-Template]- [vierte Primer-Bindungsstelle]-3'.
PEgRNA-Set nach Anspruch 221 oder 222, wobei die erste einzelsträngige DNA- Sequenz und die zweite einzelsträngige DNA-Sequenz und/oder die dritte einzelsträngige DNA-Sequenz und die vierte einzelsträngige DNA-Sequenz einen Duplex bilden, der sich an der zu editierenden Zielstelle in die doppelsträngige DNA-Sequenz integriert.
PEgRNA-Set nach einem der Ansprüche 221-223, wobei das Integrieren des Duplex zu einer Insertion, Deletion oder einem Ersetzen von DNA an der Zielstelle führt.
PEgRNA-Set nach Anspruch 224, wobei die Insertion mindestens 1 Nukleotid, mindestens 2 Nukleotide, mindestens 3 Nukleotide, mindestens 4 Nukleotide, mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide, mindestens 15 Nukleotide, mindestens 16 Nukleotide, mindestens 17 Nukleotide, mindestens 18 Nukleotide, mindestens 19 Nukleotide, mindestens 20 Nukleotide, mindestens 21 Nukleotide, mindestens 22 Nukleotide, mindestens 23 Nukleotide, mindestens 24 Nukleotide, mindestens 25 Nukleotide, mindestens 26 Nukleotide, mindestens 27 Nukleotide, mindestens 28 Nukleotide, mindestens 29 Nukleotide, mindestens 30 Nukleotide, mindestens 31 Nukleotide, mindestens 32 Nukleotide, mindestens 33 Nukleotide, mindestens 34 Nukleotide, mindestens 35 Nukleotide, mindestens 36 Nukleotide, mindestens 37 Nukleotide, mindestens 38 Nukleotide, mindestens 39 Nukleotide, mindestens 40 Nukleotide, mindestens 41 Nukleotide, mindestens 42 Nukleotide, mindestens 43 Nukleotide, mindestens 44 Nukleotide, mindestens 45 Nukleotide, mindestens 46 Nukleotide, mindestens 47 Nukleotide, mindestens 48 Nukleotide, mindestens 49 Nukleotide, mindestens 50 Nukleotide, mindestens 51 Nukleotide, mindestens 52 Nukleotide, mindestens 53 Nukleotide, mindestens 54 Nukleotide, mindestens 55 Nukleotide, mindestens 56 Nukleotide, mindestens 57 Nukleotide, mindestens 58 Nukleotide, mindestens 59 Nukleotide, mindestens 60 Nukleotide, mindestens 61 Nukleotide, mindestens 62 Nukleotide, mindestens 63 Nukleotide, mindestens 64 Nukleotide, mindestens 65 Nukleotide, mindestens 66 Nukleotide, mindestens 67 Nukleotide, mindestens 68 Nukleotide, mindestens 69 Nukleotide, mindestens 70 Nukleotide, mindestens 71 Nukleotide, mindestens 72 Nukleotide, mindestens 73 Nukleotide, mindestens 74 Nukleotide, mindestens 75 Nukleotide, mindestens 76 Nukleotide, mindestens 77 Nukleotide, mindestens 78 Nukleotide, mindestens 79 Nukleotide, mindestens 80 Nukleotide, mindestens 81 Nukleotide, mindestens 82 Nukleotide, mindestens 83 Nukleotide, mindestens 84 Nukleotide, mindestens 85 Nukleotide, mindestens 86 Nukleotide, mindestens 87 Nukleotide, mindestens 88 Nukleotide, mindestens 89 Nukleotide, mindestens 90 Nukleotid, mindestens 91 Nukleotide, mindestens 92 Nukleotide, mindestens 93 Nukleotide, mindestens 94 Nukleotide, mindestens 95 Nukleotide, mindestens 96 Nukleotide, mindestens 97 Nukleotide, mindestens 98 Nukleotide, mindestens 99 Nukleotide, mindestens 100 Nukleotide, mindestens 101 Nukleotide, mindestens 102 Nukleotide, mindestens 103 Nukleotide, mindestens 104 Nukleotide, mindestens 105 Nukleotide, mindestens 106 Nukleotide, mindestens 107 Nukleotide, mindestens 108 Nukleotide, mindestens 109 Nukleotide oder mindestens 110 Nukleotide lang ist.
PEgRNA-Set nach Anspruch 224, wobei die Deletion mindestens 1 Nukleotid, mindestens 2 Nukleotide, mindestens 3 Nukleotide, mindestens 4 Nukleotide, mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide, mindestens 15 Nukleotide, mindestens 16 Nukleotide, mindestens 17 Nukleotide, mindestens 18 Nukleotide, mindestens 19 Nukleotide, mindestens 20 Nukleotide, mindestens 21 Nukleotide, mindestens 22 Nukleotide, mindestens 23 Nukleotide, mindestens 24 Nukleotide, mindestens 25 Nukleotide, mindestens 26 Nukleotide, mindestens 27 Nukleotide, mindestens 28 Nukleotide, mindestens 29 Nukleotide, mindestens 30 Nukleotide, mindestens 31 Nukleotide, mindestens 32 Nukleotide, mindestens 33 Nukleotide, mindestens 34 Nukleotide, mindestens 35 Nukleotide, mindestens 36 Nukleotide, mindestens 37 Nukleotide, mindestens 38 Nukleotide, mindestens 39 Nukleotide, mindestens 40 Nukleotide, mindestens 41 Nukleotide, mindestens 42 Nukleotide, mindestens 43 Nukleotide, mindestens 44 Nukleotide, mindestens 45 Nukleotide, mindestens 46 Nukleotide, mindestens 47 Nukleotide, mindestens 48 Nukleotide, mindestens 49 Nukleotide, mindestens 50 Nukleotide, mindestens 51 Nukleotide, mindestens 52 Nukleotide, mindestens 53 Nukleotide, mindestens 54 Nukleotide, mindestens 55 Nukleotide, mindestens 56 Nukleotide, mindestens 57 Nukleotide, mindestens 58 Nukleotide, mindestens 59 Nukleotide, mindestens 60 Nukleotide, mindestens 61 Nukleotide, mindestens 62 Nukleotide, mindestens 63 Nukleotide, mindestens 64 Nukleotide, mindestens 65 Nukleotide, mindestens 66 Nukleotide, mindestens 67 Nukleotide, mindestens 68 Nukleotide, mindestens 69 Nukleotide, mindestens 70 Nukleotide, mindestens 71 Nukleotide, mindestens 72 Nukleotide, mindestens 73 Nukleotide, mindestens 74 Nukleotide, mindestens 75 Nukleotide, mindestens 76 Nukleotide, mindestens 77 Nukleotide, mindestens 78 Nukleotide, mindestens 79 Nukleotide, mindestens 80 Nukleotide, mindestens 81 Nukleotide, mindestens 82 Nukleotide, mindestens 83 Nukleotide, mindestens 84 Nukleotide, mindestens 85 Nukleotide, mindestens 86 Nukleotide, mindestens 87 Nukleotide, mindestens 88 Nukleotide, mindestens 89 Nukleotide, mindestens 90 Nukleotid, mindestens 91 Nukleotide, mindestens 92 Nukleotide, mindestens 93 Nukleotide, mindestens 94 Nukleotide, mindestens 95 Nukleotide, mindestens 96 Nukleotide, mindestens 97 Nukleotide, mindestens 98 Nukleotide, mindestens 99 Nukleotide, mindestens 100 Nukleotide, mindestens 101 Nukleotide, mindestens 102 Nukleotide, mindestens 103 Nukleotide, mindestens 104 Nukleotide, mindestens 105 Nukleotide, mindestens 106 Nukleotide, mindestens 107 Nukleotide, mindestens 108 Nukleotide, mindestens 109 Nukleotide oder mindestens 110 Nukleotide lang ist.
PEgRNA-Set nach Anspruch 224, wobei der Ersatz mindestens 1 Nukleotid, mindestens 2 Nukleotide, mindestens 3 Nukleotide, mindestens 4 Nukleotide, mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide, mindestens 15 Nukleotide, mindestens 16 Nukleotide, mindestens 17 Nukleotide, mindestens 18 Nukleotide, mindestens 19 Nukleotide, mindestens 20 Nukleotide, mindestens 21 Nukleotide, mindestens 22 Nukleotide, mindestens 23 Nukleotide, mindestens 24 Nukleotide, mindestens 25 Nukleotide, mindestens 26 Nukleotide, mindestens 27 Nukleotide, mindestens 28 Nukleotide, mindestens 29 Nukleotide, mindestens 30 Nukleotide, mindestens 31 Nukleotide, mindestens 32 Nukleotide, mindestens 33 Nukleotide, mindestens 34 Nukleotide, mindestens 35 Nukleotide, mindestens 36 Nukleotide, mindestens 37 Nukleotide, mindestens 38 Nukleotide, mindestens 39 Nukleotide, mindestens 40 Nukleotide, mindestens 41 Nukleotide, mindestens 42 Nukleotide, mindestens 43 Nukleotide, mindestens 44 Nukleotide, mindestens 45 Nukleotide, mindestens 46 Nukleotide, mindestens 47 Nukleotide, mindestens 48 Nukleotide, mindestens 49 Nukleotide, mindestens 50 Nukleotide, mindestens 51 Nukleotide, mindestens 52 Nukleotide, mindestens 53 Nukleotide, mindestens 54 Nukleotide, mindestens 55 Nukleotide, mindestens 56 Nukleotide, mindestens 57 Nukleotide, mindestens 58 Nukleotide, mindestens 59 Nukleotide, mindestens 60 Nukleotide, mindestens 61 Nukleotide, mindestens 62 Nukleotide, mindestens 63 Nukleotide, mindestens 64 Nukleotide, mindestens 65 Nukleotide, mindestens 66 Nukleotide, mindestens 67 Nukleotide, mindestens 68 Nukleotide, mindestens 69 Nukleotide, mindestens 70 Nukleotide, mindestens 71 Nukleotide, mindestens 72 Nukleotide, mindestens 73 Nukleotide, mindestens 74 Nukleotide, mindestens 75 Nukleotide, mindestens 76 Nukleotide, mindestens 77 Nukleotide, mindestens 78 Nukleotide, mindestens 79 Nukleotide, mindestens 80 Nukleotide, mindestens 81 Nukleotide, mindestens 82 Nukleotide, mindestens 83 Nukleotide, mindestens 84 Nukleotide, mindestens 85 Nukleotide, mindestens 86 Nukleotide, mindestens 87 Nukleotide, mindestens 88 Nukleotide, mindestens 89 Nukleotide, mindestens 90 Nukleotid, mindestens 91 Nukleotide, mindestens 92 Nukleotide, mindestens 93 Nukleotide, mindestens 94 Nukleotide, mindestens 95 Nukleotide, mindestens 96 Nukleotide, mindestens 97 Nukleotide, mindestens 98 Nukleotide, mindestens 99 Nukleotide, mindestens 100 Nukleotide, mindestens 101 Nukleotide, mindestens 102 Nukleotide, mindestens 103 Nukleotide, mindestens 104 Nukleotide, mindestens 105 Nukleotide, mindestens 106 Nukleotide, mindestens 107 Nukleotide, mindestens 108 Nukleotide, mindestens 109 Nukleotide oder mindestens 110 Nukleotide lang ist.
Polynukleotid, das ein PEgRNA-Set nach einem der Ansprüche 221-227 kodiert.
Vektor, der das Polynukleotid aus Anspruch 228 umfasst, für die Expression einer Vielzahl von PEgRNAs in einer Zelle.
Zelle, die den Vektor nach Anspruch 229 umfasst.
Pharmazeutische Zusammensetzung, die eine Vielzahl von PEgRNAs nach einem der Ansprüche 221-227, einen Vektor nach Anspruch 229 oder eine Zelle nach Anspruch 230 und einen pharmazeutisch verträglichen Hilfsstoff umfasst.
Verfahren zum Modifizieren eines Genoms in einer Zelle, das Folgendes umfasst: (i) das Inkontaktbringen eines Genoms mit einem Dual-Flap-Prime-Editing-System, wobei besagtes System einen ersten Prime-Editor- / PegRNA-Komplex umfasst, der ein erstes 3'-Nukleinsäure-Flap an der ersten Nick-Stelle auf einem ersten Strang einer Zielstelle installieren kann, und einen zweiter Prime-Editor- / PEgRNA-Komplex umfasst, der ein zweites 3'-Nukleinsäure-Flap an einer zweiten Nick-Stelle auf einem zweiten Strang der Zielstelle installieren kann, wobei das erste 3'-Nukleinsäure-Flap und das zweite 3'-Nukleinsäure-Flap reverse Komplementsequenzen sind, die einen Duplex formen, und wobei der Duplex eine erste Rekombinasestelle umfasst und wobei die Zelle den Duplex, der die erste Rekombinasestelle umfasst, an der Zielstelle statt eines endogenen Duplex installiert, der sich zwischen der ersten und zweiten Nick-Stelle befindet; (ii) das Inkontaktbringen der ersten Rekombinasestelle mit einer Donor-Nukleinsäure, welche die zweite Rekombinasestelle umfasst; und (iii) das Inkontaktbringen des Genoms mit einer rekombinasefähigen Rekombination zwischen der ersten und zweiten Rekombinasestelle, wodurch die Donor-Nukleinsäure an der Zielstelle in das Genom integriert wird.