DE112020001339T5 - Verfahren und zusammensetzung zum editing von nukleotidsequenzen - Google Patents

Verfahren und zusammensetzung zum editing von nukleotidsequenzen Download PDF

Info

Publication number
DE112020001339T5
DE112020001339T5 DE112020001339.1T DE112020001339T DE112020001339T5 DE 112020001339 T5 DE112020001339 T5 DE 112020001339T5 DE 112020001339 T DE112020001339 T DE 112020001339T DE 112020001339 T5 DE112020001339 T5 DE 112020001339T5
Authority
DE
Germany
Prior art keywords
nucleotides
dna
die
der
complex
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DE112020001339.1T
Other languages
English (en)
Inventor
David R. Liu
Andrew Vito Anzalone
Peyton Randolph
James Nelson
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harvard College
Broad Institute Inc
Original Assignee
Harvard College
Broad Institute Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harvard College, Broad Institute Inc filed Critical Harvard College
Publication of DE112020001339T5 publication Critical patent/DE112020001339T5/de
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/43Enzymes; Proenzymes; Derivatives thereof
    • A61K38/45Transferases (2)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/43Enzymes; Proenzymes; Derivatives thereof
    • A61K38/46Hydrolases (3)
    • A61K38/465Hydrolases (3) acting on ester bonds (3.1), e.g. lipases, ribonucleases
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P17/00Drugs for dermatological disorders
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P19/00Drugs for skeletal disorders
    • A61P19/02Drugs for skeletal disorders for joint disorders, e.g. arthritis, arthrosis
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P25/00Drugs for disorders of the nervous system
    • A61P25/14Drugs for disorders of the nervous system for treating abnormal movements, e.g. chorea, dyskinesia
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P25/00Drugs for disorders of the nervous system
    • A61P25/28Drugs for disorders of the nervous system for treating neurodegenerative disorders of the central nervous system, e.g. nootropic agents, cognition enhancers, drugs for treating Alzheimer's disease or other forms of dementia
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P3/00Drugs for disorders of the metabolism
    • A61P3/04Anorexiants; Antiobesity agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P3/00Drugs for disorders of the metabolism
    • A61P3/08Drugs for disorders of the metabolism for glucose homeostasis
    • A61P3/10Drugs for disorders of the metabolism for glucose homeostasis for hyperglycaemia, e.g. antidiabetics
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P37/00Drugs for immunological or allergic disorders
    • A61P37/02Immunomodulators
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P43/00Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P7/00Drugs for disorders of the blood or the extracellular fluid
    • A61P7/06Antianaemics
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P9/00Drugs for disorders of the cardiovascular system
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P9/00Drugs for disorders of the cardiovascular system
    • A61P9/12Antihypertensives
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/001Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof by chemical synthesis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1089Design, preparation, screening or analysis of libraries using computer algorithms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/111General methods applicable to biologically active non-coding nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • C12N9/1276RNA-directed DNA polymerase (2.7.7.49), i.e. reverse transcriptase or telomerase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/07Nucleotidyltransferases (2.7.7)
    • C12Y207/07049RNA-directed DNA polymerase (2.7.7.49), i.e. telomerase or reverse-transcriptase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y301/00Hydrolases acting on ester bonds (3.1)
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/20Polymerase chain reaction [PCR]; Primer or probe design; Probe optimisation
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/80Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/90Fusion polypeptide containing a motif for post-translational modification
    • C07K2319/92Fusion polypeptide containing a motif for post-translational modification containing an intein ("protein splicing")domain
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/35Nature of the modification
    • C12N2310/351Conjugate
    • C12N2310/3515Lipophilic moiety, e.g. cholesterol
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/35Nature of the modification
    • C12N2310/351Conjugate
    • C12N2310/3517Marker; Tag
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/35Nature of the modification
    • C12N2310/351Conjugate
    • C12N2310/3519Fusion with another nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Medicinal Chemistry (AREA)
  • Plant Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • General Chemical & Material Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Immunology (AREA)
  • Diabetes (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Biology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Epidemiology (AREA)
  • Neurosurgery (AREA)

Abstract

Die vorliegende Offenbarung stellt Zusammensetzungen und Verfahren zum Durchführen von Prime Editing eines Target-DNA-Moleküls (z. B. eines Genoms) bereit, das die Aufnahme einer Nukleotidänderung und/oder eine zielgerichtete Mutagenese ermöglicht. Die Nukleotidänderung kann eine Einzelnukleotidänderung (z.B. eine beliebige Transition oder eine beliebige Transversion), eine Insertion eines oder mehrerer Nukleotide oder eine Deletion eines oder mehrerer Nukleotide beinhalten. Insbesondere stellt die Offenbarung Fusionsproteine bereit, die Nukleinsäure-programmierbare DNA-Bindungsproteine (napDNAbp) und eine Polymerase (z.B. reverse Transkriptase) umfassen, die durch eine modifizierte Guide-RNA, genannt PEgRNA, zu einer bestimmten DNA-Sequenz geführt wird. Die PEgRNA wurde (bezogen auf eine Standard-Guide-RNA) so verändert, dass sie einen verlängerten Abschnitt umfasst, der eine DNA-Synthese-Template-Sequenz bereitstellt, die für einen Einzelstrang-DNA-Flap codiert, das homolog zu einem Strang der zu editierenden endogenen Target-DNA-Sequenz ist, die jedoch die gewünschten eine oder mehrere Nukleotidänderungen enthält und die nach der Synthese durch die Polymerase (z.B. reverse Transkriptase) in das Target-DNA-Molekül aufgenommen wird. Ebenfalls hier offenbart sind verschiedene Verfahren, die Prime Editing nutzen, einschließlich unter anderem der Behandlung von Trinukleotid-Repeat-Kontraktions-Krankheiten, des Einbaus zielgerichteter Peptid-Tags, der Behandlung von Prionenkrankheit durch den Einbau von Schutzmutationen, der Bearbeitung von RNA-codierenden Genen für den Einbau von RNA-Tags zur Steuerung der Funktion und Expression von RNA, der Verwendung von Prime Editing zum Aufbauen komplexer Genbibliotheken, der Verwendung von Prime Editing zum Inserieren von Immunepitopen in Proteine, der Verwendung von Prime Editing zum Inserieren induzierbarer Dimerisierungsdomänen in Protein-Targets und Abgabeverfahren.

Description

  • STAATLICHE UNTERSTÜTZUNG
  • Diese Erfindung wurde mit staatlicher Unterstützung im Rahmen der Zuschüsse Nr. U01AI142756, RM1HG009490, R01EB022376 und R35GM118062, verliehen durch National Institutes of Health, gefertigt. Die Regierung verfügt über bestimmte Rechte der Erfindung.
  • VERWANDTE PATENTANMELDUNGEN UND EINBEZIEHUNG DURCH VERWEIS
  • Diese vorläufige US-Anmeldung bezieht sich auf die folgenden Anmeldungen und schließt diese durch Bezugnahme ein, nämlich, Vorläufige US-Anmeldung Nr. 62/820,813 , eingereicht am 19. März 2019 (Anwaltsakte Nr. B1195.70074US00), Vorläufige US-Anmeldung Nr. 62/858,958 (Anwaltsakte Nr. B1195.70074US01), eingereicht am 7. Juni 2019, Vorläufige US-Anmeldung Nr. 62/889,996 (Anwaltsakte Nr. B1195.70074US02), eingereicht am 21. August 2019, Vorläufige US-Anmeldung Nr. 62/922,654 , eingereicht am 21. August 2019 (Anwaltsakte Nr. B1195.70083US00), Vorläufige US-Anmeldung Nr. 62/913,553 (Anwaltsakte Nr. B1195.70074US03), eingereicht am 10. Oktober 2019, Vorläufige US-Anmeldung Nr. 62/973,558 (Anwaltsakte Nr. B1195.70083US01), eingereicht am 10. Oktober 2019, Vorläufige US-Anmeldung Nr. 62/931,195 (Anwaltsakte No. B1195.70074US04), eingereicht am 5. November 2019, Vorläufige US-Anmeldung Nr. 62/944,231 (Anwaltsakte Nr. B1195.70074US05), eingereicht am 5. Dezember 2019, Vorläufige US-Anmeldung Nr. 62/974,537 (Anwaltsakte Nr. B1195.70083US02), eingereicht am 5. Dezember 2019, Vorläufige US-Anmeldung Nr. 62/991,069 (Anwaltsakte Nr. B1195.70074US06), eingereicht am 17. März 2020. Vorläufige US-Anmeldung Nr. 62/991,069 (Anwaltsakte Nr. B1195.70074US06), eingereicht am 17. März 2020, und US-Vorläufige US-Anmeldung Nr. (Seriennummer zum Zeitpunkt der Einreichung nicht verfügbar) (Anwaltsakte Nr. B1195.70083US03), eingereicht am 17. März 2020.
  • HINTERGRUND DER ERFINDUNG
  • Einigen Schätzungen zufolge sind pathogene Einzelnukleotidmutationen für etwa 50 % der menschlichen Krankheiten verantwortlich, die eine genetische Komponente aufweisen7. Leider sind die Behandlungsmöglichkeiten für Patienten mit diesen genetischen Störungen trotz jahrzehntelanger Erforschung der Gentherapie immer noch äußerst begrenzt8. Die vielleicht einfachste Lösung für diese therapeutische Herausforderung ist die direkte Korrektur einzelner Nukleotidmutationen im Genom der Patienten, die die Ursache der Krankheit an der Wurzel packen und wahrscheinlich einen dauerhaften Nutzen bringen würde. Obwohl eine solche Strategie früher undenkbar war, haben die jüngsten Verbesserungen der Genom-Editing-Möglichkeiten durch das Aufkommen des CRISPR/Cas-Systems9 diesen therapeutischen Ansatz in greifbare Nähe gerückt. Durch einfaches Design einer Guide-RNA-Sequenz (gRNA), die ~20 Nukleotide enthält, die komplementär zur Target-DNA-Sequenz sind, kann fast jede denkbare genomische Stelle durch CRISPR-assoziierte (Cas) Nukleasen1,2 spezifisch erreicht werden. Bislang wurden mehrere monomere bakterielle Cas-Nuklease-Systeme identifiziert und für Genome Editing-Anwendungen angepasst10. Diese natürliche Vielfalt der Cas-Nukleasen bietet zusammen mit einer wachsenden Sammlung von künstlich hergestellten Varianten11-14 einen fruchtbaren Boden für die Entwicklung neuer Genome Editing-Technologien.
  • Während die Gendeaktivierung mit CRISPR inzwischen eine ausgereifte Technik ist, bleibt die präzise Bearbeitung einzelner Basenpaare im menschlichen Genom eine große Herausforderung3. Die homologiegerichtete Reparatur (HDR) wird seit langem in menschlichen Zellen und anderen Organismen eingesetzt, um DNA-Sequenzen an Stellen von Doppelstrangbrüchen (DSBs) einzufügen, zu korrigieren oder auszutauschen. Dabei werden Donor-DNA-Reparatur-Templates verwendet, die für die gewünschten Änderungen codieren15. Allerdings ist die herkömmliche HDR bei den meisten menschlichen Zelltypen, insbesondere bei sich nicht teilenden Zellen, nur sehr wenig effizient, und die konkurrierende nicht-homologe Endverbindung (NHEJ) führt überwiegend zu Insertions-Deletions (Indel)-Nebenprodukten16. Andere Probleme betreffen die Erzeugung von DSBs, die zu großen chromosomalen Umlagerungen und Deletionen an den Targetorten führen können17 oder die p53-Achse aktivieren, was zu Wachstumsstillstand und Apoptose führt18,19.
  • Es wurden mehrere Ansätze erforscht, um diese Nachteile von HDR zu beheben. So hat sich beispielsweise gezeigt, dass die Reparatur von Einzelstrang-DNA-Brüchen (Nicks) mit Oligonukleotiddonoren die Indelbildung reduziert, aber die Ausbeute an gewünschten Reparaturprodukten bleibt gering20. Andere Strategien versuchen, die Reparatur mit Hilfe kleiner Moleküle und biologischer Reagenzien über NHEJ in Richtung HDR zu lenken21-23. Die Wirksamkeit dieser Verfahren ist jedoch wahrscheinlich vom Zelltyp abhängig, und die Störung des normalen Zellzustands könnte zu unerwünschten und unvorhersehbaren Auswirkungen führen.
  • Kürzlich entwickelten die Erfinder unter der Leitung von Prof. David Liu et al. das Base Editing als eine Technologie, die die Targetnukleotide bearbeitet, ohne DSBs zu erzeugen oder sich auf HDR zu verlassen4-6,24-27. Die direkte Modifikation von DNA-Basen durch Casfusionierte Deaminase-Enzyme ermöglicht die Umwandlung von C•G in T•A oder A•T in G•C in einem kurzen Target-Fenster (~5-7 Basen) mit sehr hoher Effizienz. Infolgedessen wurden die Basis-Editoren von der wissenschaftlichen Gemeinschaft schnell angenommen. Allerdings schränken die folgenden Faktoren ihre Allgemeingültigkeit für das präzises Genome Editing ein: (1) „Bystander Editing“ von Nicht-Target-C- oder -A-Basen innerhalb des Target-Fensters wird beobachtet; (2) Target-Nukleotid-Produktmischungen werden beobachtet; (3) die Target-Basen müssen sich 15±2 Nukleotide stromaufwärts einer PAM-Sequenz befinden; und (5) die Reparatur von kleinen Insertions- und Deletionsmutationen ist nicht möglich.
  • Daher ist die Entwicklung programmierbarer Editoren, die flexibel in der Lage sind, jede gewünschte einzelne Nukleotidänderung einzuführen und/oder Basenpaare einzufügen oder zu entfernen (z. B., mindestens 1, 2, 3, 4, 5, 6, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 30, 40, 50, 60, 70, 80, 90, 100 oder mehr Basenpaar-Insertionen oder -Deletionen) und/oder die die Nukleotidsequenz an einem Target-Stelle mit hoher Spezifität und Effizienz verändern oder modifizieren können, würde den Anwendungsbereich und das therapeutische Potenzial von Genome Editing Technologien auf der Basis von CRISPR erheblich erweitern.
  • KURZDARSTELLUNG DER ERFINDUNG
  • Die vorliegende Erfindung beschreibt eine völlig neue Plattform für das Genome Editing, das sogenannte „Prime Editing“. Prime Editing ist ein vielseitiges und präzises Genom Editing Verfahren, bei dem neue genetische Informationen direkt in eine bestimmte DNA-Stelle geschrieben werden, wobei ein mit Nukleinsäure programmierbares DNA-Bindungsprotein („napDNAbp“) in Verbindung mit einer Polymerase (d. h., in Form eines Fusionsproteins oder auf andere Weise in trans mit dem napDNAbp) arbeitet, wobei das Prime Editing System mit einer Prime Editing-(PE) Guide-RNA („PEgRNA“) programmiert ist, die sowohl die Target-Stelle spezifiziert als auch die Synthese des gewünschten Edits in Form eines Ersatz-DNA-Strangs durch eine auf eine Guide-RNA (z. B. am 5'- oder 3'-Ende oder an einem internen Teil einer Guide-RNA) aufgebrachte Extension (entweder DNA oder RNA) vorgibt. Der Ersatzstrang, der das gewünschte Edit (z. B. eine einzelne Nukleobase) enthält, hat die gleiche Sequenz wie der endogene Strang der zu editierenden Target-Stelle (mit der Ausnahme, dass er das gewünschte Edit enthält). Durch die DNA-Reparatur- und/oder Replikationsmaschinerie wird der endogene Strang der Target-Stelle durch den neu synthetisierten Ersatzstrang, der das gewünschte Edit enthält, ersetzt. In einigen Fällen kann das Prime Editing als eine „Suchen-und-Ersetzen“-Technologie zum Genome Editing angesehen werden, da die Prime Editoren, wie hier beschrieben, nicht nur die gewünschte zu editierende Target-Stelle suchen und lokalisieren, sondern gleichzeitig einen Ersatzstrang codieren, der ein gewünschte Editing enthält und anstelle des entsprechenden endogenen DNA-Strangs der Target-Stelle installiert wird.
  • Die Prime Editoren der vorliegenden Offenbarung beziehen sich zum Teil auf die Entdeckung, dass der Mechanismus der Target-primed Reverse Transkription (TPRT) oder des „Prime Editing“ für die Durchführung von präzisem CRISPR/Cas-basiertem Genome Editing mit hoher Effizienz und genetischer Flexibilität genutzt oder angepasst werden kann (z. B. wie in verschiedenen Ausführungsformen der 1A-1F) dargestellt. TPRT wird auf natürliche Weise von mobilen DNA-Elementen wie Nicht-LTR-Retrotransposons von Säugetieren und bakteriellen Introns der Gruppe II verwendet28,29. Die Erfinder haben Cas-Protein-Reverse-Transkriptase-Fusionen oder verwandte Systeme verwendet, um eine spezifische DNA-Sequenz mit einer Guide-RNA anzusteuern, einen Einzelstrang-Nick an der Target-Stelle zu erzeugen und die DNA, die mit einem Nick versehen wurde, als Primer für die reverse Transkription einers konstruierten Reverse-Transkriptase-Templates zu verwenden, die mit der Guide-RNA integriert ist. Während das Konzept jedoch mit Prime Editoren beginnt, die reverse Transkriptasen als DNA-Polymerase-Komponente verwenden, sind die hier beschriebenen Prime Editoren nicht auf reverse Transkriptasen beschränkt, sondern können die Verwendung von virtueller und DNA-Polymerase beinhalten. Auch wenn in der Anmeldung durchgängig von Prime Editoren mit „reversen Transkriptasen“ die Rede ist, wird hier dargelegt, dass reverse Transkriptasen nur eine Art von DNA-Polymerase sind, die mit Prime Editing arbeiten kann. Wenn also in der Spezifikation von „reversen Transkriptasen“ die Rede ist, sollte der Fachmann wissen, dass jede geeignete DNA-Polymerase anstelle der reversen Transkriptase verwendet werden kann. So können die Prime Editoren in einem Aspekt Cas9 (oder ein äquivalentes napDNAbp) umfassen, das so programmiert ist, dass es eine DNA-Sequenz anvisiert, indem es sie mit einer spezialisierten Guide-RNA (d. h. PEgRNA) assoziiert, die eine Spacer-Sequenz enthält, die sich an einen komplementären Protospacer in der Target-DNA anlagert. Die spezialisierte Guide-RNA enthält auch neue genetische Informationen in Form einer Extension, die für einen Ersatz-DNA-Strang codiert, der eine gewünschte genetische Änderung enthält und dazu dient, einen entsprechenden endogenen DNA-Strang an der Target-Stelle zu ersetzen. Um die Information von der PEgRNA auf die Target-DNA zu übertragen, beinhaltet der Mechanismus des Prime Editing das Versehen der Target-Stelle mit einem Nick in einem Strang der DNA, um eine 3'-Hydroxylgruppe freizulegen. Die freiliegende 3'-Hydroxylgruppe kann dann dazu verwendet werden, die DNA-Polymerisation der edit-codierenden Extension der PEgRNA direkt an der Target-Stelle zu starten. In verschiedenen Ausführungsformen kann die Extension, die die Matrize für die Polymerisation des Ersatzstrangs, der das Edit enthält, bereitstellt, aus RNA oder DNA gebildet werden. Im Falle einer RNA-Extension kann die Polymerase des Prime Editors eine RNA-abhängige DNA-Polymerase sein (z. B. eine reverse Transkriptase). Im Falle einer DNA-Extension kann die Polymerase des Prime Editors eine DNA-abhängige DNA-Polymerase sein.
  • Der neu synthetisierte Strang (d. h. der Ersatz-DNA-Strang, der das gewünschte Edit enthält), der von den hierin offenbarten Prime Editoren gebildet wird, wäre homolog zur genomischen Target-Sequenz (d. h. er hätte die gleiche Sequenz wie diese), mit Ausnahme des Einschlusses einer gewünschten Nukleotidextension (z. B. eine einzelne Nukleotidänderung, eine Deletion oder eine Insertion oder eine Kombination davon). Der neu synthetisierte (oder ersetzte) DNA-Strang kann auch als Einzelstrang-DNA-Flap bezeichnet werden, der mit dem komplementären homologen endogenen DNA-Strang um die Hybridisierung konkurriert und dadurch den entsprechenden endogenen Strang verdrängt. In bestimmten Ausführungsformen kann das System mit der Verwendung eines fehleranfälligen Enzyms der reversen Transkriptase kombiniert werden (z. B. als Fusionsprotein mit der Cas9-Domäne oder in trans mit der Cas9-Domäne). Das fehleranfällige Enzym reverse Transkriptase kann während der Synthese des Einzelstrang-DNA-Flaps Änderungen einführen. So kann in bestimmten Ausführungsformen eine fehleranfällige reverse Transkriptase verwendet werden, um Nukleotidänderungen in die Target-DNA einzuführen. Je nach der fehleranfälligen reversen Transkriptase, die mit dem System verwendet wird, können die Änderungen zufällig oder nicht zufällig sein.
  • Die Auflösung des hybridisierten Zwischenprodukts (bestehend aus dem von der reversen Transkriptase synthetisierten Einzelstrang-DNA-Flap, der an den endogenen DNA-Strang hybridisiert wurde) kann die Entfernung des resultierenden verdrängten Flaps der endogenen DNA (z. B. mit einer 5'-End-DNA-Flap-Endonuklease, FEN1), die Ligation des synthetisierten Einzelstrang-DNA-Flaps an die Target-DNA und die Assimilation der gewünschten Nukleotidänderung als Ergebnis zellulärer DNA-Reparatur- und/oder Replikationsprozesse umfassen. Da die durch Template-bestimmte DNA-Synthese eine nukleotidgenaue Modifikation jedes beliebigen Nukleotids, einschließlich Insertionen und Deletionen, ermöglicht, ist der Anwendungsbereich dieses Ansatzes sehr breit gefächert und könnte vorhersehbar für unzählige Anwendungen in der Grundlagenforschung und in der Therapeutik genutzt werden.
  • In einem Aspekt stellt die Spezifikation ein Fusionsprotein bereit, das ein Nukleinsäure-programmierbares DNA-bindendes Protein (napDNAbp) und eine reverse Transkriptase umfasst. In verschiedenen Ausführungsformen ist das Fusionsprotein in der Lage, das Genom Editing durch zielgerichtete reverse Transkription in Gegenwart einer erweiterten Guide-RNA durchzuführen.
  • In bestimmten Ausführungsformen weist das napDNAbp eine Nickase-Aktivität auf. Das napDNAbp kann auch ein Cas9-Protein oder ein funktionelles Äquivalent davon sein, wie ein nukleaseaktives Cas9, ein nuklease-inaktives Cas9 (dCas9) oder eine Cas9-Nickase (nCas9).
  • In bestimmen Ausführungsformen ist das napDNAbp ausgewählt aus der Gruppe bestehend aus: Cas9, Cas12e, Cas12d, Cas12a, Cas12b1, Cas13a, Cas12c und Argonauten und weist optional eine Nickase-Aktivität auf.
  • In anderen Ausführungsformen ist das Fusionsprotein, wenn es mit einer erweiterten Guide-RNA komplexiert ist, in der Lage, an eine Target-DNA-Sequenz zu binden.
  • In noch weiteren Ausführungsformen umfasst die Target-DNA-Sequenz einen Target-Strang und einen komplementären Nicht-Target-Strang.
  • In anderen Ausführungsformen bildet die Bindung des Fusionsproteins im Komplex mit der erweiterten Guide-RNA eine R-Schleife. Die R-Schleife kann (i) ein RNA-DNA-Hybrid umfassen, das die erweiterte Guide-RNA und den Target-Strang umfasst, und (ii) den komplementären Nicht-Target-Strang.
  • In noch weiteren Ausführungsformen wird der komplementäre Nicht-Target-Strang mit einem Nick versehen, um eine Priming-Sequenz der reversen Transkriptase mit einem freien 3'-Ende zu bilden.
  • In verschiedenen Ausführungsformen umfasst die erweiterete Guide-RNA (a) eine Guide-RNA und (b) eine RNA-Extension am 5'- oder 3'-Ende der Guide-RNA oder an einer intramolekularen Stelle in der Guide-RNA. Die RNA-Extension kann (i) eine Reverse-Transkriptions-Template-Sequenz mit einer gewünschten Nukleotidänderung, (ii) eine Bindungsstelle für einen Reverse-Transkriptions-Primer und (iii) optional eine Linker-Sequenz umfassen. In mehreren Ausführungsformen kann das Reverse-Transkriptions-Template für einen Einzelstrang-DNA-Flap codieren, der zu einer endogenen DNA-Sequenz benachbart zu der Nick-Stelle komplementär ist, wobei der Einzelstrang-DNA-Flap die gewünschte Nukleotidänderung umfasst.
  • In mehreren Ausführungsformen ist die RNA-Extension mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide, mindestens 15 Nukleotide, mindestens 16 Nukleotide, mindestens 17 Nukleotide, mindestens 18 Nukleotide, mindestens 19 Nukleotide, mindestens 20 Nukleotide, mindestens 21 Nukleotide, mindestens 22 Nukleotide, mindestens 23 Nukleotide, mindestens 24 Nukleotide oder mindestens 25 Nukleotide lang.
  • In noch weiteren Ausführungsformen kann der Einzelstrang-DNA-Flap mit der endogenen DNA-Sequenz neben der Nick-Stelle hybridisieren, wodurch die gewünschte Nukleotidänderung eingebaut wird. In noch weiteren Ausführungsformen verdrängt der Einzelstrang-DNA-Flap die endogene DNA-Sequenz neben der Nick-Stelle und die ein freies 5'-Ende aufweist. In bestimmten Ausführungsformen wird die verdrängte endogene DNA mit dem 5'-Ende von der Zelle ausgeschnitten.
  • In mehreren Ausführungsformen führt die zelluläre Reparatur des Einzelstrang-DNA-Flap zum Einbau der gewünschten Nukleotidänderung, wodurch ein gewünschtes Produkt gebildet wird.
  • In mehreren weiteren Ausführungsformen wird die gewünschte Nukleotidänderung in einem Editing-Fenster eingebaut, das zwischen etwa -4 und +10 der PAM-Sequenz liegt.
  • In noch weiteren Ausführungsformen wird die gewünschte Nukleotidänderung in einem Editing-Fenster eingebaut, das zwischen etwa -5 bis +5 der Nick-Stelle, oder zwischen etwa -10 bis +10 der Nick-Stelle, oder zwischen etwa -20 bis +20 der Nick-Stelle, oder zwischen etwa -30 bis +30 der Nick-Stelle, oder zwischen etwa -40 bis +40 der Nick-Stelle, oder zwischen etwa -50 bis +50 der Nick-Stelle, oder zwischen etwa -60 bis +60 der Nick-Stelle, oder zwischen etwa -70 bis +70 der Nick-Stelle, oder zwischen etwa -80 bis +80 der Nick-Stelle, oder zwischen etwa -90 bis +90 der Nick-Stelle, oder zwischen etwa -100 bis +100 der Nick-Stelle, oder zwischen etwa - 200 bis +200 der Nick-Stelle liegt.
  • In mehreren Ausführungsformen umfasst das napDNAbp eine Aminosäuresequenz von SEQ ID NO: 18. In mehreren weiteren Ausführungsformen umfasst das napDNAbp eine Aminosäuresequenz, die zu mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % mit der Aminosäuresequenz einer von SEQ ID NOs: 26-39, 42- 61, 75-76, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467 und 482-487 (Cas9); (SpCas9); SEQ ID NO: 77-86 (CP-Cas9); SEQ ID NO: 18-25 und 87-88 (SpCas9); und SEQ ID NOs: 62-72(Cas12) identisch ist.
  • In anderen Ausführungsformen kann die reverse Transkriptase der offenbarten Fusionsproteine und/oder Zusammensetzungen eine der Aminosäuresequenzen von SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700-716, 739-742, und 766 umfassen. In noch weiteren Ausführungsformen kann die reverse Transkriptase eine Aminosäuresequenz umfassen, die zu mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % mit der Aminosäuresequenz einer von SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700-716, 739-742, und 766 identisch ist. Bei diesen Sequenzen kann es sich um natürlich vorkommende Sequenzen der reversen Transkriptase handeln, z. B. von einem Retrovirus oder einem Retrotransposon, oder sie können rekombinant sein.
  • In verschiedenen anderen Ausführungsformen können die hier offenbarten Fusionsproteine verschiedene strukturelle Konfigurationen aufweisen. Die Fusionsproteine können beispielsweise die Struktur NH2-[napDNAbp]-[reverse Transkriptase]-COOH; oder NH2-[reverse Transkriptase]-[napDNAbp]-COOH aufweisen, wobei jedes „]-[“ auf das Vorhandensein einer optionalen Linkersequenz hinweist.
  • In mehreren Ausführungsformen umfasst die Linker-Sequenz eine Aminosäuresequenz von SEQ ID NOs: 127, 165-176, 446, 453 und 767-769, oder eine Aminosäuresequenz, die zu mindestens 80 %, 85 %, 90 %, 95 % oder 99 % mit einer der Linker-Aminosäuresequenzen von SEQ ID NOs: 127, 165-176, 446, 453 und 767-769 identisch ist.
  • In verschiedenen Ausführungsformen kann die gewünschte Nukleotidänderung, die in die Target-DNA eingebaut wird, eine einzelne Nukleotidänderung (z. B. eine Transition oder Transversion), eine Insertion von einem oder mehreren Nukleotiden oder eine Deletion von einem oder mehreren Nukleotiden sein.
  • In bestimmten Fällen ist die Insertion mindestens 1, mindestens 2, mindestens 3, mindestens 4, mindestens 5, mindestens 6, mindestens 7, mindestens 8, mindestens 9, mindestens 10, mindestens 11, mindestens 12, mindestens 13, mindestens 14, mindestens 15, mindestens 16, mindestens 17, mindestens 18, mindestens 19, mindestens 20, mindestens 30, mindestens 40, mindestens 50, mindestens 60, mindestens 70, mindestens 80, mindestens 90, mindestens 100, mindestens 200, mindestens 300, mindestens 400 oder mindestens 500 Nukleotide lang.
  • In bestimmten anderen Fällen ist die Deletion mindestens 1, mindestens 2, mindestens 3, mindestens 4, mindestens 5, mindestens 6, mindestens 7, mindestens 8, mindestens 9, mindestens 10, mindestens 11, mindestens 12, mindestens 13, mindestens 14, mindestens 15, mindestens 16, mindestens 17, mindestens 18, mindestens 19, mindestens 20, mindestens 30, mindestens 40, mindestens 50, mindestens 60, mindestens 70, mindestens 80, mindestens 90, mindestens 100, mindestens 200, mindestens 300, mindestens 400 oder mindestens 500 Nukleotide lang.
  • In einem weiteren Aspekt stellt die vorliegende Offenbarung eine erweiterte Guide-RNA bereit, die eine Guide-RNA und mindestens eine RNA-Extension umfasst. Die RNA-Extension kann am 3'-Ende der Guide-RNA positioniert werden. In anderen Ausführungsformen kann die RNA-Extension am 5' der Guide-RNA positioniert werden. In noch weiteren Ausführungsformen kann die RNA-Extension an einer intramolekularen Position innerhalb der Guide-RNA positioniert werden, wobei es jedoch vorzuziehen ist, dass die intramolekulare Positionierung des erweiterten Teils die Funktion des Protospacers nicht stört.
  • In mehreren Ausführungsformen ist die erweiterte Guide-RNA in der Lage, an ein napDNAbp zu binden und das napDNAbp an eine Target-DNA-Sequenz zu lenken. Die Target-DNA-Sequenz kann einen Target-Strang und einen komplementären Nicht-Target-Strang umfassen, wobei die Guide-RNA mit dem Target-Strang hybridisiert, um ein RNA-DNA-Hybrid und eine R-Schleife zu bilden.
  • In verschiedenen Ausführungsformen der erweiterten Guide-RNA kann die mindestens eine RNA-Extension eine Template-Sequenz für die reverse Transkription umfassen. In verschiedenen weiteren Ausführungsformen kann die RNA-Extension außerdem eine Bindungsstelle für einen Primer für die reverse Transkription umfassen. In noch weiteren Ausführungsformen kann die RNA-Extension eine Linker- oder Spacer-Sequenz umfassen, die die RNA-Extension mit der Guide-RNA verbindet.
  • In verschiedenen Ausführungsformen kann die RNA-Extension mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide, mindestens 15 Nukleotide, mindestens 16 Nukleotide, mindestens 17 Nukleotide, mindestens 18 Nukleotide, mindestens 19 Nukleotide, mindestens 20 Nukleotide, mindestens 21 Nukleotide, mindestens 22 Nukleotide, mindestens 23 Nukleotide, mindestens 24 Nukleotide, mindestens 25 Nukleotide, mindestens 30 Nukleotide, mindestens 40 Nukleotide, mindestens 50 Nukleotide, mindestens 60 Nukleotide, mindestens 70 Nukleotide, mindestens 80 Nukleotide, mindestens 90 Nukleotide, mindestens 100 Nukleotide, mindestens 150 Nukleotide, mindestens 200 Nukleotide, mindestens 300 Nukleotide, mindestens 400 Nukleotide oder mindestens 500 Nukleotide lang sein.
  • In anderen Ausführungsformen ist die Sequenz des reversen Transkriptions-Templates mindestens 3 Nukleotide, mindestens 4 Nukleotide, mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide, mindestens 15 Nukleotide, mindestens 16 Nukleotide, mindestens 17 Nukleotide, mindestens 18 Nukleotide, mindestens 19 Nukleotide, mindestens 20 Nukleotide, mindestens 30 Nukleotide, mindestens 40 Nukleotide, mindestens 50 Nukleotide, mindestens 60 Nukleotide, mindestens 70 Nukleotide, mindestens 80 Nukleotide, mindestens 90 Nukleotide, mindestens 100 Nukleotide, mindestens 200 Nukleotide, mindestens 300 Nukleotide, mindestens 400 Nukleotide oder mindestens 500 Nukleotide lang.
  • In noch anderen Ausführungsformen ist die Sequenz der Bindungsstelle des Primers für die reverse Transkription mindestens 3 Nukleotide, mindestens 4 Nukleotide, mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide, mindestens 15 Nukleotide, mindestens 16 Nukleotide, mindestens 17 Nukleotide, mindestens 18 Nukleotide, mindestens 19 Nukleotide, mindestens 20 Nukleotide, mindestens 30 Nukleotide, mindestens 40 Nukleotide, mindestens 50 Nukleotide, mindestens 60 Nukleotide, mindestens 70 Nukleotide, mindestens 80 Nukleotide, mindestens 90 Nukleotide, mindestens 100 Nukleotide, mindestens 200 Nukleotide, mindestens 300 Nukleotide, mindestens 400 Nukleotide oder mindestens 500 Nukleotide lang.
  • In anderen Ausführungsformen ist die optionale Linker- oder Spacer-Sequenz mindestens 3 Nukleotide, mindestens 4 Nukleotide, mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide, mindestens 15 Nukleotide, mindestens 16 Nukleotide, mindestens 17 Nukleotide, mindestens 18 Nukleotide, mindestens 19 Nukleotide, mindestens 20 Nukleotide, mindestens 30 Nukleotide, mindestens 40 Nukleotide, mindestens 50 Nukleotide, mindestens 60 Nukleotide, mindestens 70 Nukleotide, mindestens 80 Nukleotide, mindestens 90 Nukleotide, mindestens 100 Nukleotide, mindestens 200 Nukleotide, mindestens 300 Nukleotide, mindestens 400 Nukleotide oder mindestens 500 Nukleotide lang.
  • In mehreren Ausführungsformen der erweiterten Guide-RNAs kann das Reverse-Transkriptions-Template für einen Einzelstrang-DNA-Flap codieren, der zu einer endogenen DNA-Sequenz benachbart zu einer Nick-Stelle komplementär ist, wobei der Einzelstrang-DNA-Flap eine gewünschte Nukleotidänderung umfasst. Der Einzelstrang-DNA-Flap kann eine endogene Einzelstrang-DNA an der Nick-Stelle verdrängen. Die verdrängte endogene Einzelstrang-DNA an der Nick-Stelle kann ein 5'-Ende haben und einen endogenen Flap bilden, der von der Zelle abgeschnitten werden kann. In verschiedenen Ausführungsformen kann die Exzision des endogenen 5'-Flaps dazu beitragen, die Produktbildung voranzutreiben, da die Entfernung des endogenen 5'-Flaps die Hybridisierung des Einzestrang-3'-DNA-Flap mit dem entsprechenden komplementären DNA-Strang und den Einbau oder die Assimilation der gewünschten Nukleotidänderung, die von dem Einzelstrang-3'-DNA-Flap getragen wird, in die Target-DNA fördert.
  • In mehreren Ausführungsformen der erweiterten Guide-RNAs führt die zelluläre Reparatur des Einzelstrang-DNA-Flap zum Einbau der gewünschten Nukleotidänderung, wodurch ein gewünschtes Produkt gebildet wird.
  • [0001]In bestimmten Ausführungsformen umfasst die PEgRNA die Nukleotidsequenz der SEQ ID NOs: 131, 222, 394, 429, 430,431,432, 433, 434,435,436,437, 438, 439, 440, 441, 442, 641, 642, 643, 644, 645, 646, 647, 648, 649, 678, 679, 680, 681, 682, 683, 684, 685, 686, 687, 688, 689, 690, 691, 692, 738, 2997, 2998, 2999, 3000, 3001, 3002, 3003, 3004, 3005, 3006, 3007, 3008, 3009, 3010, 3011, 3012, 3013, 3014, 3015, 3016, 3017, 3018, 3019, 3020, 3021, 3022, 3023, 3024, 3025, 3026, 3027, 3028, 3029, 3030, 3031, 3032, 3033, 3034, 3035, 3036, 3037, 3038, 3039, 3040, 3041, 3042, 3043, 3044, 3045, 3046, 3047, 3048, 3049, 3050, 3051, 3052, 3053, 3054, 3055, 3056, 3057, 3058, 3059, 3060, 3061, 3062, 3063, 3064, 3065, 3066, 3067, 3068, 3069, 3070, 3071, 3072, 3073, 3074, 3075, 3076, 3077, 3078, 3079, 3080, 3081, 3082, 3083, 3084, 3085, 3086, 3087, 3088, 3089, 3090, 3091, 3092, 3093, 3094, 3095, 3096, 3097, 3098, 3099, 3100, 3101, 3102, 3103, 3113, 3114, 3115, 3116, 3117, 3118, 3119, 3120, 3121, 3305, 3306, 3307, 3308, 3309, 3310, 3311, 3312, 3313, 3314, 3315, 3316, 3317, 3318, 3319, 3320, 3321, 3322, 3323, 3324, 3325, 3326, 3327, 3328, 3329, 3330, 3331, 3332, 3333, 3334, 3335, 3336, 3337, 3338, 3339, 3340, 3341, 3342, 3343, 3344, 3345, 3346, 3347, 3348, 3349, 3350, 3351, 3352, 3353, 3354, 3355, 3356, 3357, 3358, 3359, 3360, 3361, 3362, 3363, 3364, 3365, 3366, 3367, 3368, 3369, 3370, 3371, 3372, 3373, 3374, 3375, 3376, 3377, 3378, 3379, 3380, 3381, 3382, 3383, 3384, 3385, 3386, 3387, 3388, 3389, 3390, 3391, 3392, 3393, 3394, 3395, 3396, 3397, 3398, 3399, 3400, 3401, 3402, 3403, 3404, 3405, 3406, 3407, 3408, 3409, 3410, 3411, 3412, 3413, 3414, 3415, 3416, 3417, 3418, 3419, 3420, 3421, 3422, 3423, 3424, 3425, 3426, 3427, 3428, 3429, 3430, 3431, 3432, 3433, 3434, 3435, 3436, 3437, 3438, 3439, 3440, 3441, 3442, 3443, 3444, 3445, 3446, 3447, 3448, 3449, 3450, 3451, 3452, 3453, 3454, 3455, 3479, 3480, 3481, 3482, 3483, 3484, 3485, 3486, 3487, 3488, 3489, 3490, 3491, 3492, 3493, 3522, 3523, 3524, 3525, 3526, 3527, 3528, 3529, 3530, 3531, 3532, 3533, 3534, 3535, 3536, 3537, 3538, 3539, 3540, 3549, 3550, 3551, 3552, 3553, 3554, 3555, 3556, 3628, 3629, 3630, 3631, 3632, 3633, 3634, 3635, 3636, 3637, 3638, 3639, 3640, 3641, 3642, 3643, 3644, 3645, 3646, 3647, 3648, 3649, 3650, 3651, 3652, 3653, 3654, 3655, 3656, 3657, 3658, 3659, 3660, 3661, 3662, 3663, 3664, 3665, 3666, 3667, 3668, 3669, 3670, 3671, 3672, 3673, 3674, 3675, 3676, 3677, 3678, 3679, 3680, 3681, 3682, 3683, 3684, 3685, 3686, 3687, 3688, 3689, 3690, 3691, 3692, 3693, 3694, 3695, 3696, 3697, 3698, 3755, 3756, 3757, 3758, 3759, 3760, 3761, 3762, 3763, 3764, 3765, 3766, 3767, 3768, 3769, 3770, 3771, 3772, 3773, 3774, 3775, 3776, 3777, 3778, 3779, 3780, 3781, 3782, 3783, 3784, 3785, 3786, 3787, 3788, 3789, 3790, 3791, 3792, 3793, 3794, 3795, 3796, 3797, 3798, 3799, 3800, 3801, 3802, 3803, 3804, 3805, 3806, 3807, 3808, 3809 und 3810 oder eine Nukleotidsequenz mit mindestens 85 %, oder mindestens 90 %, oder mindestens 95 %, oder mindestens 98 %, oder mindestens 99 % Sequenzidentität mit einer der SEQ ID NOs: 131, 222, 394, 429, 430, 431, 432, 433, 434, 435, 436, 437, 438, 439, 440, 441, 442, 641, 642, 643, 644, 645, 646, 647, 648, 649, 678, 679, 680, 681, 682, 683, 684, 685, 686, 687, 688, 689, 690, 691, 692, 738, 2997, 2998, 2999, 3000, 3001, 3002, 3003, 3004, 3005, 3006, 3007, 3008, 3009, 3010, 3011, 3012, 3013, 3014, 3015, 3016, 3017, 3018, 3019, 3020, 3021, 3022, 3023, 3024, 3025, 3026, 3027, 3028, 3029, 3030, 3031, 3032, 3033, 3034, 3035, 3036, 3037, 3038, 3039, 3040, 3041, 3042, 3043, 3044, 3045, 3046, 3047, 3048, 3049, 3050, 3051, 3052, 3053, 3054, 3055, 3056, 3057, 3058, 3059, 3060, 3061, 3062, 3063, 3064, 3065, 3066, 3067, 3068, 3069, 3070, 3071, 3072, 3073, 3074, 3075, 3076, 3077, 3078, 3079, 3080, 3081, 3082, 3083, 3084, 3085, 3086, 3087, 3088, 3089, 3090, 3091, 3092, 3093, 3094, 3095, 3096, 3097, 3098, 3099, 3100, 3101, 3102, 3103, 3113, 3114, 3115, 3116, 3117, 3118, 3119, 3120, 3121, 3305, 3306, 3307, 3308, 3309, 3310, 3311, 3312, 3313, 3314, 3315, 3316, 3317, 3318, 3319, 3320, 3321, 3322, 3323, 3324, 3325, 3326, 3327, 3328, 3329, 3330, 3331, 3332, 3333, 3334, 3335, 3336, 3337, 3338, 3339, 3340, 3341, 3342, 3343, 3344, 3345, 3346, 3347, 3348, 3349, 3350, 3351, 3352, 3353, 3354, 3355, 3356, 3357, 3358, 3359, 3360, 3361, 3362, 3363, 3364, 3365, 3366, 3367, 3368, 3369, 3370, 3371, 3372, 3373, 3374, 3375, 3376, 3377, 3378, 3379, 3380, 3381, 3382, 3383, 3384, 3385, 3386, 3387, 3388, 3389, 3390, 3391, 3392, 3393, 3394, 3395, 3396, 3397, 3398, 3399, 3400, 3401, 3402, 3403, 3404, 3405, 3406, 3407, 3408, 3409, 3410, 3411, 3412, 3413, 3414, 3415, 3416, 3417, 3418, 3419, 3420, 3421, 3422, 3423, 3424, 3425, 3426, 3427, 3428, 3429, 3430, 3431, 3432, 3433, 3434, 3435, 3436, 3437, 3438, 3439, 3440, 3441, 3442, 3443, 3444, 3445, 3446, 3447, 3448, 3449, 3450, 3451, 3452, 3453, 3454, 3455, 3479, 3480, 3481, 3482, 3483, 3484, 3485, 3486, 3487, 3488, 3489, 3490, 3491, 3492, 3493, 3522, 3523, 3524, 3525, 3526, 3527, 3528, 3529, 3530, 3531, 3532, 3533, 3534, 3535, 3536, 3537, 3538, 3539, 3540, 3549, 3550, 3551, 3552, 3553, 3554, 3555, 3556, 3628, 3629, 3630, 3631, 3632, 3633, 3634, 3635, 3636, 3637, 3638, 3639, 3640, 3641, 3642, 3643, 3644, 3645, 3646, 3647, 3648, 3649, 3650, 3651, 3652, 3653, 3654, 3655, 3656, 3657, 3658, 3659, 3660, 3661, 3662, 3663, 3664, 3665, 3666, 3667, 3668, 3669, 3670, 3671, 3672, 3673, 3674, 3675, 3676, 3677, 3678, 3679, 3680, 3681, 3682, 3683, 3684, 3685, 3686, 3687, 3688, 3689, 3690, 3691, 3692, 3693, 3694, 3695, 3696, 3697, 3698, 3755, 3756, 3757, 3758, 3759, 3760, 3761, 3762, 3763, 3764, 3765, 3766, 3767, 3768, 3769, 3770, 3771, 3772, 3773, 3774, 3775, 3776, 3777, 3778, 3779, 3780, 3781, 3782, 3783, 3784, 3785, 3786, 3787, 3788, 3789, 3790, 3791, 3792, 3793, 3794, 3795, 3796, 3797, 3798, 3799, 3800, 3801, 3802, 3803, 3804, 3805, 3806, 3807, 3808, 3809 und 3810.
  • In einem weiteren Aspekt der Erfindung stellt die Spezifikation Komplexe bereit, die ein hier beschriebenes Fusionsprotein und jede oben beschriebene erweiterte Guide-RNA umfassen.
  • In noch weiteren Aspekten der Erfindung stellt die Spezifikation einen Komplex bereit, der eine napDNAbp und eine erweiterte Guide-RNA umfasst. Die napDNAbp kann eine Cas9-Nickase sein, oder eine Aminosäuresequenz von SEQ ID NOs: 42-57 (Cas9-Nickase) und 65 (AsCas12a-Nickase), oder eine Aminosäuresequenz, die zu mindestens 80 %, 85%, 90 %, 95 %, 98 % oder 99 % mit der Aminosäuresequenz einer von SEQ ID NOs: 42-57 (Cas9-Nickase) und 65 (AsCas12a-Nickase) identisch ist.
  • In verschiedenen Ausführungsformen, die einen Komplex beinhalten, ist die erweiterte Guide-RNA in der Lage, die napDNAbp zu einer Target-DNA-Sequenz zu lenken. In verschiedenen Ausführungsformen kann eine reverse Transkriptase in trans bereitgestellt werden, d. h. aus einer anderen Quelle als der Komplex selbst. Zum Beispiel könnte eine reverse Transkriptase derselben Zelle mit dem Komplex zugeführt werden, indem ein separater Vektor eingeführt wird, der die reverse Transkriptase separat codiert.
  • In einem weiteren Aspekt stellt die Spezifikation Polynukleotide bereit. In bestimmten Ausführungsformen können die Polynukleotide für eines der hier offenbarten Fusionsproteine codieren. In bestimmten anderen Ausführungsformen können die Polynukleotide für jedes der hier offenbarten napDNAbps codieren. In noch weiteren Ausführungsformen können die Polynukleotide für eine der hierin offenbarten reversen Transkriptasen codieren. In noch weiteren Ausführungsformen können die Polynukleotide für eine der hierin offenbarten erweiterten Guide-RNAs, eine der Template-Sequenzen für die reverse Transkription, eine der Primerstellen für die reverse Transkription oder eine der optionalen Linker-Sequenzen codieren.
  • In noch anderen Aspekten stellt die Spezifikation Vektoren bereit, die die hier beschriebenen Polynukleotide umfassen. So umfassen die Vektoren in bestimmten Ausführungsformen Polynukleotide zur Codierung der Fusionsproteine, die ein napDNAbp und eine reverse Transkriptase umfassen. In anderen Ausführungsformen umfassen die Vektoren Polynukleotide, die separat für ein napDNAbp und eine reverse Transkriptase codieren. In noch anderen Ausführungsformen können die Vektoren Polynukleotide umfassen, die für die erweiterten Guide-RNAs codieren. In verschiedenen Ausführungsformen können die Vektoren ein oder mehrere Polynukleotide umfassen, die napDNAbps, reverse Transkriptase und erweiterte Guide-RNAs auf denselben oder separaten Vektoren codieren.
  • In noch anderen Aspekten stellt die Spezifikation Zellen bereit, die ein hier beschriebenes Fusionsprotein und eine erweiterte Guide-RNA umfassen. Die Zellen können mit den Vektoren transformiert werden, die die Fusionsproteine, napDNAbps, reverse Transkriptase und erweiterte Guide-RNAs umfassen. Diese genetischen Elemente können auf denselben Vektoren oder auf verschiedenen Vektoren umfasst sein.
  • In einem weiteren Aspekt stellt die Spezifikation pharmazeutische Zusammensetzungen bereit. In bestimmten Ausführungsformen umfassen die pharmazeutischen Zusammensetzungen ein oder mehrere napDNAbp, ein Fusionsprotein, eine reverse Transkriptase und eine erweiterte Guide-RNA. In bestimmten Ausführungsformen ist das hier beschriebene Fusionsprotein und ein pharmazeutisch verträglicher Hilfsstoff. In anderen Ausführungsformen umfassen die pharmazeutischen Zusammensetzungen eine beliebige hier beschriebene erweiterte Guide-RNA und einen pharmazeutisch verträglichen Hilfsstoff. In noch anderen Ausführungsformen umfassen die pharmazeutischen Zusammensetzungen eine beliebige hier beschriebene erweiterte Guide-RNA in Kombination mit einem beliebigen hier beschriebenen Fusionsprotein und einem pharmazeutisch verträglichen Hilfsstoff. In noch anderen Ausführungsformen umfassen die pharmazeutischen Zusammensetzungen eine beliebige Polynukleotidsequenz, die für ein oder mehrere napDNAbp, ein Fusionsprotein, eine reverse Transkriptase und eine erweiterte Guide-RNA codiert. In noch anderen Ausführungsformen können die verschiedenen hier offenbarten Komponenten in eine oder mehrere pharmazeutische Zusammensetzungen aufgeteilt werden. Zum Beispiel kann eine erste pharmazeutische Zusammensetzung ein Fusionsprotein oder ein napDNAbp, eine zweite pharmazeutische Zusammensetzung eine reverse Transkriptase und eine dritte pharmazeutische Zusammensetzung eine erweiterte Guide-RNA umfassen.
  • In einem weiteren Aspekt stellt die vorliegende Offenbarung Kits bereit. In einer Ausführungsform umfasst das Kit ein oder mehrere Polynukleotide, die für eine oder mehrere Komponenten codieren, darunter ein Fusionsprotein, ein napDNAbp, eine reverse Transkriptase und eine erweiterte Guide-RNA. Die Kits können auch Vektoren, Zellen und isolierte Zubereitungen von Polypeptiden umfassen, einschließlich der hierin offenbarten Fusionsproteine, napDNAbp oder reversen Transkriptasen.
  • In einem weiteren Aspekt stellt die vorliegende Offenbarung Verfahren zur Verwendung der offengelegten Zusammensetzungen bereit.
  • In einer Ausführungsform beziehen sich die Verfahren auf ein Verfahren zum Einbauen einer gewünschten Nukleotidänderung in eine Doppelstrang-DNA-Sequenz. Das Verfahren umfasst zunächst das Inkontaktbringen der Doppelstrang-DNA-Sequenz mit einem Komplex, der ein Fusionsprotein und eine erweiterte Guide-RNA umfasst, wobei das Fusionsprotein ein napDNAbp und eine reverse Transkriptase umfasst und wobei die erweiterte Guide-RNA eine Template-Sequenz für die reverse Transkription umfasst, die die gewünschte Nukleotidänderung umfasst. Als nächstes wird die Doppelstrang-DNA-Sequenz auf dem Nicht-Target-Strang mit einem Nick versehen, wodurch eine freie Einzelstrang-DNA mit einem 3'-Ende entsteht. Bei dem Verfahren wird dann das 3'-Ende der freien Einzelstrang-DNA mit der Template-Sequenz für die reverse Transkription hybridisiert, wodurch die Domäne der reversen Transkriptase geprimt wird. Das Verfahren beinhaltet dann die Polymerisation eines DNA-Strangs vom 3'-Ende aus, wodurch ein Einzelstrang-DNA-Flap entsteht, der die gewünschte Nukleotidänderung umfasst. Anschließend wird bei dem Verfahren ein endogener DNA-Strang in der Nähe der Schnittstelle durch den Einzelstrang-DNA-Flap ersetzt, wodurch die gewünschte Nukleotidänderung in der Doppelstrang-DNA-Sequenz eingebaut wird.
  • In anderen Ausführungsformen stellt die Offenbarung ein Verfahren zur Einführung einer oder mehrerer Änderungen in der Nukleotidsequenz eines DNA-Moleküls an einer Target-Stelle bereit, das das Inkontaktbringen des DNA-Moleküls mit einem Nukleinsäure-programmierbaren DNA-Bindungsprotein (napDNAbp) und einer Guide-RNA umfasst, die das napDNAbp auf die Target-Stelle ausrichtet, wobei die Guide-RNA eine Reverse Transkriptase (RT)-Template-Sequenz umfasst, die mindestens eine gewünschte Nukleotidänderung umfasst. Als nächstes beinhaltet das Verfahren die Bildung eines exponierten 3'-Endes in einem DNA-Strang an der Target-Stelle und die anschließende Hybridisierung des exponierten 3'-Endes mit der RT-Template-Sequenz, um die reverse Transkription zu starten. Als nächstes wird ein Einzelstrang-DNA-Flap, der die mindestens eine gewünschte Nukleotidänderung auf der Basis der RT-Template-Sequenz umfasst, durch die reverse Transkriptase synthetisiert oder polymerisiert. Schließlich wird die mindestens eine gewünschte Nukleotidänderung in die entsprechende endogene DNA eingebaut, wodurch eine oder mehrere Änderungen in der Nukleotidsequenz des DNA-Moleküls am Target-Locus eingeführt werden.
  • In noch anderen Ausführungsformen stellt die Offenbarung ein Verfahren zur Einführung einer oder mehrerer Änderungen in der Nukleotidsequenz eines DNA-Moleküls an einem Target-Locus durch zielgerichtete reverse Transkription bereit, wobei das Verfahren umfasst: (a) Inkontaktbringen des DNA-Moleküls am Target-Locus mit einem (i) Fusionsprotein, das ein Nukleinsäure-programmierbares DNA-Bindungsprotein (napDNAbp) und eine reverse Transkriptase umfasst, und (ii) einer Guide-RNA, die ein RT-Template umfasst, das eine gewünschte Nukleotidänderung umfasst; (b) Durchführen einer zielgerichteten reversen Transkription des RT-Templates, um eine Einzelstrang-DNA zu erzeugen, die die gewünschte Nukleotidänderung umfasst; und (c) Einbauen der gewünschten Nukleotidänderung in das DNA-Molekül am Target-Locus durch einen DNA-Reparatur- und/oder Replikationsprozess.
  • In bestimmten Ausführungsformen umfasst der Schritt des Ersetzens des endogenen DNA-Strangs: (i) Hybridisierung des Einzelstrang-DNA-Flaps mit dem endogenen DNA-Strang in der Nähe der Schnittstelle, um eine Sequenzfehlanpassung zu erzeugen; (ii) Ausschneiden des endogenen DNA-Strangs; und (iii) Reparieren der Fehlanpassung, um das gewünschte Produkt zu bilden, das die gewünschte Nukleotidänderung in beiden DNA-Strängen umfasst.
  • In verschiedenen Ausführungsformen kann die gewünschte Nukleotidänderung eine einzelne Nukleotidsubstitution (z. B. eine Transition oder eine Transversionsänderung), eine Deletion oder eine Insertion sein. Zum Beispiel kann die gewünschte Nukleotidänderung (1) eine G-zu-T-Substitution, (2) eine G-zu-A-Substitution, (3) eine G-zu-C-Substitution, (4) eine T-zu-G-Substitution, (5) eine T-zu-A-Substitution, (6) eine T zu C Substitution, (7) eine C zu G Substitution, (8) eine C zu T Substitution, (9) eine C zu A Substitution, (10) eine A zu T Substitution, (11) eine A zu G Substitution oder (12) eine A zu C Substitution sein.
  • In anderen Ausführungsformen kann die gewünschte Nukleoidänderung (1) ein G:C-Basenpaar in ein T:A-Basenpaar, (2) ein G:C-Basenpaar in ein A:T-Basenpaar, (3) ein G:C-Basenpaar in ein C:G-Basenpaar, (4) ein T:A-Basenpaar in ein G:C-Basenpaar, (5) ein T:A-Basenpaar in ein A:T-Basenpaar, (6) ein T:A-Basispaar zu einem C:G-Basispaar, (7) ein C:G-Basispaar zu einem G:C-Basispaar, (8) ein C:G-Basispaar zu einem T:A-Basispaar, (9) ein C:G-Basispaar zu einem A:T-Basispaar, (10) ein A:T-Basispaar zu einem T:A-Basispaar, (11) ein A:T-Basispaar zu einem G:C-Basispaar, oder (12) ein A:T-Basispaar zu einem C:G-Basispaar umwandeln.
  • In noch anderen Ausführungsformen führt das Verfahren eine gewünschte Nukleotidänderung ein, die eine Insertion ist. In bestimmten Fällen ist die Insertion mindestens 1, mindestens 2, mindestens 3, mindestens 4, mindestens 5, mindestens 6, mindestens 7, mindestens 8, mindestens 9, mindestens 10, mindestens 11, mindestens 12, mindestens 13, mindestens 14, mindestens 15, mindestens 16, mindestens 17, mindestens 18, mindestens 19, mindestens 20, mindestens 30, mindestens 40, mindestens 50, mindestens 60, mindestens 70, mindestens 80, mindestens 90, mindestens 100, mindestens 200, mindestens 300, mindestens 400 oder mindestens 500 Nukleotide lang.
  • In anderen Ausführungsformen führt das Verfahren eine gewünschte Nukleotidänderung ein, die eine Deletion ist. In bestimmten anderen Fällen ist die Deletion mindestens 1, mindestens 2, mindestens 3, mindestens 4, mindestens 5, mindestens 6, mindestens 7, mindestens 8, mindestens 9, mindestens 10, mindestens 11, mindestens 12, mindestens 13, mindestens 14, mindestens 15, mindestens 16, mindestens 17, mindestens 18, mindestens 19, mindestens 20, mindestens 30, mindestens 40, mindestens 50, mindestens 60, mindestens 70, mindestens 80, mindestens 90, mindestens 100, mindestens 200, mindestens 300, mindestens 400 oder mindestens 500 Nukleotide lang.
  • In verschiedenen Ausführungsformen korrigiert die gewünschte Nukleotidänderung ein krankheitsassoziiertes Gen. Das krankheitsassoziierte Gen kann mit einer monogenetischen Störung assoziiert sein, die aus der Gruppe ausgewählt wurde, bestehend aus: Adenosin-Deaminase (ADA)-Mangel; Alpha-1-Antitrypsin-Mangel; Zystische Fibrose; Duchenne-Muskeldystrophie; Galaktosämie; Hämochromatose; Chorea Huntington; Ahornsirup-Urin-Krankheit; Marfan-Syndrom; Neurofibromatose Typ 1; Pachyonychia Congenita; Phenylkeotnurie; Schwere kombinierte Immunschwäche; Sichelzellkrankheit; Smith-Lemli-Opitz-Syndrom; und Tay-Sachs-Krankheit. In anderen Ausführungsformen kann das krankheitsassoziierte Gen mit einer polygenen Störung assoziiert sein, die aus der Gruppe bestehend aus: Herzkrankheit, Bluthochdruck, Alzheimer-Krankheit, Arthritis, Diabetes, Krebs und Fettleibigkeit ausgewählt wird.
  • Die hier offenbarten Verfahren können Fusionsproteine mit einem napDNAbp beinhalten, das ein nuklease-totes Cas9 (dCas9), eine Cas9-Nickase (nCas9) oder ein nukleaseaktives Cas9 ist. In anderen Ausführungsformen werden ein napDNAbp und eine reverse Transkriptase nicht als ein einziges Fusionsprotein codiert, sondern können in separaten Konstrukten bereitgestellt werden. So kann in einigen Ausführungsformen die reverse Transkriptase in trans relativ zu dem napDNAbp bereitgestellt werden (und nicht durch ein Fusionsprotein).
  • In verschiedenen Ausführungsformen, die Verfahren beinhalten, kann das napDNAbp eine Aminosäuresequenz von SEQ ID NOs: 26- 61, 75-76, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, und 482-487 (Cas9); (SpCas9); SEQ ID NO: 77-86 (CP-Cas9); SEQ ID NO: 18 -25 und 87-88 (SpCas9); und SEQ ID NOs: 62-72(Cas12) umfassen. Das napDNAbp kann auch eine Aminosäuresequenz umfassen, die zu mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % mit der Aminosäuresequenz einer der SEQ ID NOs: 26- 61, 75-76, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, und 482-487 (Cas9); (SpCas9); SEQ ID NO: 77-86 (CP-Cas9); SEQ ID NO: 18 - 25 und 87-88 (SpCas9); und SEQ ID NOs: 62-72(Cas12) identisch ist.
  • In verschiedenen Ausführungsformen, die Verfahren beinhalten, kann die reverse Transkriptase eine der Aminosäuresequenzen der SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700-716, 739-742, und 766 identisch ist. Die reverse Transkriptase kann auch eine Aminosäuresequenz umfassen, die zu mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % mit der Aminosäuresequenz einer der SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700-716, 739-742, und 766 identisch ist.
  • Die Verfahren können die Verwendung einer PEgRNA beinhalten, die eine Nukleotidsequenz von SEQ ID NOs: 131, 222, 394, 429, 430, 431, 432, 433, 434, 435, 436, 437, 438, 439, 440, 441, 442, 641, 642, 643, 644, 645, 646, 647, 648, 649, 678, 679, 680, 681, 682, 683, 684, 685, 686, 687, 688, 689, 690, 691, 692, 738, 2997, 2998, 2999, 3000, 3001, 3002, 3003, 3004, 3005, 3006, 3007, 3008, 3009, 3010, 3011, 3012, 3013, 3014, 3015, 3016, 3017, 3018, 3019, 3020, 3021, 3022, 3023, 3024, 3025, 3026, 3027, 3028, 3029, 3030, 3031, 3032, 3033, 3034, 3035, 3036, 3037, 3038, 3039, 3040, 3041, 3042, 3043, 3044, 3045, 3046, 3047, 3048, 3049, 3050, 3051, 3052, 3053, 3054, 3055, 3056, 3057, 3058, 3059, 3060, 3061, 3062, 3063, 3064, 3065, 3066, 3067, 3068, 3069, 3070, 3071, 3072, 3073, 3074, 3075, 3076, 3077, 3078, 3079, 3080, 3081, 3082, 3083, 3084, 3085, 3086, 3087, 3088, 3089, 3090, 3091, 3092, 3093, 3094, 3095, 3096, 3097, 3098, 3099, 3100, 3101, 3102, 3103, 3113, 3114, 3115, 3116, 3117, 3118, 3119, 3120, 3121, 3305, 3306, 3307, 3308, 3309, 3310, 3311, 3312, 3313, 3314, 3315, 3316, 3317, 3318, 3319, 3320, 3321, 3322, 3323, 3324, 3325, 3326, 3327, 3328, 3329, 3330, 3331, 3332, 3333, 3334, 3335, 3336, 3337, 3338, 3339, 3340, 3341, 3342, 3343, 3344, 3345, 3346, 3347, 3348, 3349, 3350, 3351, 3352, 3353, 3354, 3355, 3356, 3357, 3358, 3359, 3360, 3361, 3362, 3363, 3364, 3365, 3366, 3367, 3368, 3369, 3370, 3371, 3372, 3373, 3374, 3375, 3376, 3377, 3378, 3379, 3380, 3381, 3382, 3383, 3384, 3385, 3386, 3387, 3388, 3389, 3390, 3391, 3392, 3393, 3394, 3395, 3396, 3397, 3398, 3399, 3400, 3401, 3402, 3403, 3404, 3405, 3406, 3407, 3408, 3409, 3410, 3411, 3412, 3413, 3414, 3415, 3416, 3417, 3418, 3419, 3420, 3421, 3422, 3423, 3424, 3425, 3426, 3427, 3428, 3429, 3430, 3431, 3432, 3433, 3434, 3435, 3436, 3437, 3438, 3439, 3440, 3441, 3442, 3443, 3444, 3445, 3446, 3447, 3448, 3449, 3450, 3451, 3452, 3453, 3454, 3455, 3479, 3480, 3481, 3482, 3483, 3484, 3485, 3486, 3487, 3488, 3489, 3490, 3491, 3492, 3493, 3522, 3523, 3524, 3525, 3526, 3527, 3528, 3529, 3530, 3531, 3532, 3533, 3534, 3535, 3536, 3537, 3538, 3539, 3540, 3549, 3550, 3551, 3552, 3553, 3554, 3555, 3556, 3628, 3629, 3630, 3631, 3632, 3633, 3634, 3635, 3636, 3637, 3638, 3639, 3640, 3641, 3642, 3643, 3644, 3645, 3646, 3647, 3648, 3649, 3650, 3651, 3652, 3653, 3654, 3655, 3656, 3657, 3658, 3659, 3660, 3661, 3662, 3663, 3664, 3665, 3666, 3667, 3668, 3669, 3670, 3671, 3672, 3673, 3674, 3675, 3676, 3677, 3678, 3679, 3680, 3681, 3682, 3683, 3684, 3685, 3686, 3687, 3688, 3689, 3690, 3691, 3692, 3693, 3694, 3695, 3696, 3697, 3698, 3755, 3756, 3757, 3758, 3759, 3760, 3761, 3762, 3763, 3764, 3765, 3766, 3767, 3768, 3769, 3770, 3771, 3772, 3773, 3774, 3775, 3776, 3777, 3778, 3779, 3780, 3781, 3782, 3783, 3784, 3785, 3786, 3787, 3788, 3789, 3790, 3791, 3792, 3793, 3794, 3795, 3796, 3797, 3798, 3799, 3800, 3801, 3802, 3803, 3804, 3805, 3806, 3807, 3808, 3809 und 3810 umfassen, oder eine Nukleotidsequenz mit mindestens 80 % oder mindestens 85 % oder mindestens 90 % oder mindestens 95 % oder mindestens 99 % Sequenzidentität dazu. Die Verfahren können die Verwendung von erweiterten Guide-RNAs umfassen, die eine RNA-Extension am 3'-Ende umfassen, wobei die RNA-Extension die Sequenz der reversen Transkriptionsvorlage umfasst.
  • Die Verfahren können die Verwendung von erweiterten Guide-RNAs umfassen, die eine RNA-Extension am 5'-Ende aufweisen, wobei die RNA-Extension die Sequenz des reversen Transkriptions-Templates umfasst.
  • Die Verfahren können die Verwendung von erweiterten Guide-RNAs umfassen, die eine RNA-Extension an einem intramolekularen Ort in der Guide-RNA aufweisen, wobei die RNA-Extension die Sequenz des reversen Transkriptions-Templates umfasst.
  • Die Verfahren können die Verwendung von erweiterten Guide-RNAs mit einer oder mehreren RNA-Extensionen umfassen, die mindestens 1, mindestens 2, mindestens 3, mindestens 4, mindestens 5, mindestens 6, mindestens 7, mindestens 8, mindestens 9, mindestens 10, mindestens 11, mindestens 12, mindestens 13, mindestens 14, mindestens 15, mindestens 16, mindestens 17, mindestens 18, mindestens 19, mindestens 20, mindestens 30, mindestens 40, mindestens 50, mindestens 60, mindestens 70, mindestens 80, mindestens 90, mindestens 100, mindestens 200, mindestens 300, mindestens 400 oder mindestens 500 Nukleotide lang sind.
  • Die vorstehenden Konzepte und die im Folgenden erörterten zusätzlichen Konzepte können in jeder geeigneten Kombination angeordnet werden, da die vorliegende Offenbarung in dieser Hinsicht nicht beschränkt ist. Weitere Vorteile und neuartige Merkmale der vorliegenden Offenbarung werden aus der folgenden detaillierten Beschreibung verschiedener nichteinschränkender Ausführungsformen ersichtlich, wenn sie in Verbindung mit den begleitenden Figuren betrachtet werden.
  • Figurenliste
  • Die folgenden Zeichnungen sind Teil der vorliegenden Spezifikation und dienen der weiteren Veranschaulichung bestimmter Aspekte der vorliegenden Offenbarung, die durch Bezugnahme auf eine oder mehrere dieser Zeichnungen in Kombination mit der detaillierten Beschreibung der hierin dargestellten spezifischen Ausführungsformen besser verstanden werden können.
    • 1A stellt eine schematische Darstellung eines beispielhaften Verfahrens zur Einführung einer einzelnen Nukleotidänderung und/oder Insertion und/oder Deletion in ein DNA-Molekül (z. B. ein Genom) unter Verwendung eines Fusionsproteins bereit, das eine mit einem Cas9-Protein fusionierte reverse Transkriptase im Komplex mit einem erweiterten Guide-RNA-Molekül umfasst. In dieser Ausführungsform ist die Guide-RNA am 3'-Ende erweitert, um eine Reverse Transkriptase-Template-Sequenz zu beinhalten. Das Schema zeigt, wie eine mit einer Cas9-Nickase fusionierte Reverse Transkriptase (RT) in einem Komplex mit einer Guide-RNA (gRNA) an die DNA-Target-Stelle bindet und den PAM-haltigen DNA-Strang neben dem Target-Nukleotid mit einem Nick versieht. Das RT-Enzym verwendet die mit einem Nick versehene DNA als Primer für die DNA-Synthese aus der gRNA, die als Template für die Synthese eines neuen DNA-Strangs verwendet wird, der für das gewünschte Edit codiert. Der gezeigte Editing Prozess kann als zielgerichtetes Reverse Transkription Editing (TRT-Editing) oder auch als „Prime Editing“ bezeichnet werden
    • 1B stellt die gleiche Darstellung wie in 1A bereit, mit der Ausnahme, dass der Prime-Editor-Komplex allgemeiner als [napDNAbp]-[P]:PEgRNA oder [P]-[napDNAbp]:PEgRNA dargestellt wird, wobei sich „P“ auf eine beliebige Polymerase (z. B., eine reverse Transkriptase), „napDNAbp“ auf ein Nukleinsäure-programmierbares DNA-Bindungsprotein (z. B. SpCas9) und „PEgRNA“ auf eine Prime-Editing-Guide-RNA bezieht und „]-[“ sich auf einen optionalen Linker bezieht. Wie an anderer Stelle beschrieben, z. B. in 3A-3G, umfasst die PEgRNA einen 5'-Extension-Arm mit einer Primerbindungsstelle und einem DNA-Synthese-Template. Obwohl nicht gezeigt, ist es denkbar, dass der Extension-Arm der PEgRNA (d. h. der eine Primerbindungsstelle und ein DNA-Synthese-Template umfasst) aus DNA oder RNA bestehen kann. Welche Polymerase in dieser Konfiguration in Frage kommt, hängt von der Art des DNA-Synthese-Templates ab. Wenn das Template für die DNA-Synthese beispielsweise RNA ist, dann kann die Polymerase eine RNA-abhängige DNA-Polymerase sein (z. B. eine reverse Transkriptase). Wenn das Tempalte für die DNA-Synthese DNA ist, dann kann die Polymerase eine DNA-abhängige DNA-Polymerase sein.
    • 1C stellt eine schematische Darstellung eines beispielhaften Verfahrens zur Einführung einer einzelnen Nukleotidänderung und/oder Insertion und/oder Deletion in ein DNA-Molekül (z. B. ein Genom) unter Verwendung eines Fusionsproteins bereit, das eine mit einem Cas9-Protein fusionierte reverse Transkriptase im Komplex mit einem erweiterten Guide-RNA-Molekül umfasst. In dieser Ausführungsform ist die Guide-RNA am 5'-Ende erweitert, um eine Reverse Transkriptase-Template-Sequenz zu beinhalten. Das Schema zeigt, wie eine mit einer Cas9-Nickase fusionierte Reverse Transkriptase (RT) in einem Komplex mit einer Guide-RNA (gRNA) an die DNA-Target-Stelle bindet und den PAM-haltigen DNA-Strang neben dem Target-Nukleotid mit einem Nick versieht. Das RT-Enzym verwendet die mit einem Nick versehene DNA als Primer für die DNA-Synthese aus der gRNA, die als Template für die Synthese eines neuen DNA-Strangs verwendet wird, der für das gewünschte Edit codiert. Der gezeigte Editing Prozess kann als zielgerichtetes Reverse Transkription Editing (TRT-Editing) oder auch als „Prime Editing“ bezeichnet werden
    • 1D stellt die gleiche Darstellung wie in 1C bereit, mit der Ausnahme, dass der Prime-Editor-Komplex allgemeiner als [napDNAbp]-[P]:PEgRNA oder [P]-[napDNAbp]:PEgRNA dargestellt wird, wobei sich „P“ auf eine beliebige Polymerase (z. B., eine reverse Transkriptase), „napDNAbp“ auf ein Nukleinsäure-programmierbares DNA-Bindungsprotein (z. B. SpCas9) und „PEgRNA“ auf eine Prime-Editing-Guide-RNA bezieht und „]-[“ sich auf einen optionalen Linker bezieht. Wie an anderer Stelle beschrieben, z. B. in 3A-3G, umfasst die PEgRNA einen 3'-Extension-Arm mit einer Primerbindungsstelle und einem DNA-Synthese-Template. Obwohl nicht gezeigt, ist es denkbar, dass der Extension-Arm der PEgRNA (d. h. der eine Primerbindungsstelle und ein DNA-Synthese-Template umfasst) aus DNA oder RNA bestehen kann. Welche Polymerase in dieser Konfiguration in Frage kommt, hängt von der Art des DNA-Synthese-Templates ab. Wenn das Template für die DNA-Synthese beispielsweise RNA ist, dann kann die Polymerase eine RNA-abhängige DNA-Polymerase sein (z. B. eine reverse Transkriptase). Wenn das Template für die DNA-Synthese DNA ist, dann kann die Polymerase eine DNA-abhängige DNA-Polymerase sein. In verschiedenen Ausführungsformen kann die PEgRNA so konstruiert oder synthetisiert werden, dass sie ein DNAbasiertes DNA-Synthese-Template einschließt.
    • 1E ist eine schematische Darstellung eines beispielhaften Prozesses, der zeigt, wie der synthetisierte DNA-Einzelstrang (der die gewünschte Nukleotidänderung umfasst) aufgelöst wird, so dass die gewünschte Nukleotidänderung in die DNA eingebaut wird. Wie gezeigt, führt nach der Synthese des editierten Strangs (oder „mutagenen Strangs“) die Äquilibrierung mit dem endogenen Strang, die Flap-Spaltung des endogenen Strangs und die Ligation zum Einbau der DNA-Editierung nach Auflösung des fehlangepassten DNA-Duplexes durch die Wirkung endogener DNA-Reparatur- und/oder Replikationsprozesse.
    • 1F ist ein Schema, das zeigt, dass das „entgegengesetzte Strang-Nicking“ in das Auflösungsverfahren von 1E integriert werden kann, um die Bildung des gewünschten Produkts gegenüber dem Reversionsprodukt zu fördern. Beim Nicking in den entgegengesetzten Strang wird ein zweiter Cas9/gRNA-Komplex verwendet, um einen zweiten Nick in den entgegengesetzten Strang des ursprünglich mit einem Nick versehenen Strangs einzubringen. Dies veranlasst die endogenen zellulären DNA-Reparatur- und/oder Replikationsprozesse dazu, vorzugsweise den nicht editierten Strang (d. h. den Strang mit der zweiten Nick-Stelle) zu ersetzen.
    • 1G stellt ein weiteres Schema eines beispielhaften Verfahrens zur Einführung einer einzelnen Nukleotidänderung und/oder Insertion und/oder Deletion in ein DNA-Molekül (z. B. ein Genom) eines Target-Locus unter Verwendung eines Nukleinsäure-programmierbaren DNAbindenden Proteins (napDNAbp) bereit, das mit einer erweiterten Guide-RNA komplexiert ist. Dieser Prozess kann als eine Ausführungsform des Prime Editing bezeichnet werden. Die erweiterte Guide-RNA umfasst eine Extension am 3'- oder 5'-Ende der Guide-RNA oder an einer intramolekularen Stelle in der Guide-RNA. In Schritt (a) kontaktiert der napDNAbp/gRNA-Komplex das DNA-Molekül und die gRNA leitet das napDNAbp zur Bindung an den Target-Locus. In Schritt (b) wird ein Nick in einen der DNA-Stränge (den R-Schleifen-Strang oder den PAM-haltigen Strang oder den Nicht-Target-DNA-Strang oder den Protospacer-Strang) des Target-Locus eingeführt (z. B. durch eine Nuklease oder einen chemischen Wirkstoff), wodurch ein verfügbares 3'-Ende in einem der Stränge des Target-Locus entsteht. In bestimmten Ausführungsformen wird der Nick in dem DNA-Strang erzeugt, der dem R-Schleifen-Strang entspricht, d. h. dem Strang, der nicht mit der RNA-Guide-Sequenz hybridisiert ist. In Schritt (c) interagiert der DNA-Strang am 3'-Ende mit dem erweiterten Teil der Guide-RNA, um die reverse Transkription zu starten. In bestimmten Ausführungsformen hybridisiert der DNA-Strang mit dem 3'-Ende an eine spezifische RT-Priming-Sequenz auf dem erweiterten Teil der Guide-RNA. In Schritt (d) wird eine reverse Transkriptase eingeführt, die einen einzelnen DNA-Strang vom 3'-Ende der geprimten Stelle zum 3'-Ende der Guide-RNA synthetisiert. Dadurch entsteht ein Einzelstrang-DNA-Flap mit der gewünschten Nukleotidänderung (z. B. die Änderung einer einzelnen Base, die Insertion oder Deletion oder eine Kombination davon). In Schritt (e) werden das napDNAbp und die Guide-RNA freigesetzt. Die Schritte (f) und (g) beziehen sich auf die Auflösung des Einzelstrang-DNA-Flaps, so dass die gewünschte Nukleotidänderung in den Target-Locus eingebaut wird. Dieser Prozess kann in Richtung der gewünschten Produktbildung vorangetrieben werden, indem der entsprechende 5' endogene DNA-Flap entfernt wird, der sich bildet, sobald der 3'-Einzelstrang-DNA-Flap eindringt und mit der komplementären Sequenz auf dem anderen Strang hybridisiert. Der Prozess kann auch zur Produktbildung mit einem zweiten Strang führen, wie in 1F beispielhaft dargestellt. Bei diesem Prozess können mindestens eine oder mehrere der folgenden genetischen Änderungen auftreten: Transversionen, Transitionen, Deletionen und Insertionen.
    • 1H ist ein Schema, das die Arten von genetischen Änderungen zeigt, die mit den hier beschriebenen Prime-Editing-Verfahren möglich sind. Zu den Arten von Nukleotidänderungen, die durch Prime Editing erreicht werden können, gehören Deletionen (einschließlich kurzer und langer Deletionen), einzelne Nukleotidänderungen (einschließlich Transitionen und Transversionen), Inversionen und Insertionen (einschließlich kurzer und langer Deletionen).
    • 1I ist ein Schema, das das zeitliche Nicking des zweiten Strangs am Beispiel von PE3b beispielhaft darstellt (PE3b = PE2 Prime-Editor-Fusionsprotein + PEgRNA + Guide-RNA vom zweiten genickten Strang). Zeitlich begrenztes Nicking des zweiten Strangs ist eine Variante des Nickings des zweiten Strangs, um die Bildung des gewünschten editierten Produkts zu erleichtern. Der Begriff „zeitlich“ bezieht sich auf die Tatsache, dass der Nick des zweiten Strangs in den nicht editierten Strang erst erfolgt, nachdem das gewünschte Edit im editierten Strang eingebaut wurde. Dadurch wird vermieden, dass gleichzeitige Nicks auf beiden Strängen zu doppelsträngigen DNA-Brüchen führen.
    • 1J zeigt eine Variante des hier betrachteten Prime Editing, bei der das napDNAbp (z. B. SpCas9-Nickase) durch eine beliebige programmierbare Nuklease-Domäne ersetzt wird, wie z. B. Zinkfinger-Nukleasen (ZFN) oder Transkriptionsaktivator-ähnliche Effektornukleasen (TALEN). Geeignete Nukleasen müssen also nicht unbedingt durch ein Nukleinsäure-Target-Molekül (wie eine Guide-RNA) „programmiert“ werden, sondern können auch durch die Definition der Spezifität einer DNA-Bindungsdomäne, wie insbesondere einer Nuklease, programmiert werden. Genau wie beim Prime Editing mit napDNAbp-Anteilen ist es vorzuziehen, dass solche alternativen programmierbaren Nukleasen so modifiziert werden, dass nur ein Strang der Target-DNA geschnitten wird. Mit anderen Worten: Die programmierbaren Nukleasen sollten vorzugsweise als Nickasen funktionieren. Sobald eine programmierbare Nuklease ausgewählt ist (z. B. eine ZFN oder eine TALEN), können zusätzliche Funktionen in das System eingebaut werden, damit es nach einem Prime-Editing-ähnlichen Mechanismus arbeitet. Zum Beispiel können die programmierbaren Nukleasen modifiziert werden, indem (z. B. über einen chemischen Linker) ein RNA- oder DNA-Extension-Arm daran gekoppelt wird, wobei der Extension-Arm eine Primer-Bindungsstelle (PBS) und ein DNA-Synthese-Template umfasst. Die programmierbare Nuklease kann auch (z. B. über einen chemischen oder Aminosäure-Linker) an eine Polymerase gekoppelt sein, deren Art davon abhängt, ob der Extension-Arm aus DNA oder RNA besteht. Im Falle eines RNA-Extension-Arms kann die Polymerase eine RNA-abhängige DNA-Polymerase sein (z. B. eine reverse Transkriptase). Im Falle eines DNA-Extension-Arms kann die Polymerase eine DNA-abhängige DNA-Polymerase sein (z. B. eine prokaryotische Polymerase, einschließlich Pol I, Pol II oder Pol III, oder eine eukaryotische Polymerase, einschließlich Pol a, Pol b, Pol g, Pol d, Pol e oder Pol z). Das System kann auch andere Funktionalitäten beinhalten, die als Fusionen zu den programmierbaren Nukleasen hinzugefügt werden, oder die in trans hinzugefügt werden, um die Reaktion als Ganzes zu erleichtern (z. B. (a) eine Helikase zum Abwickeln der DNA an der Schnittstelle, um den geschnittenen Strang mit dem 3'-Ende als Primer verfügbar zu machen, (b) eine Flap-Endonuklease (z. B., FEN1), um die Entfernung des endogenen Strangs auf dem geschnittenen Strang zu unterstützen, um die Reaktion in Richtung des Ersatzes des endogenen Strangs durch den synthetisierten Strang voranzutreiben, oder (c) ein nCas9:gRNA-Komplex, um einen zweiten Stellen-Nick auf dem gegenüberliegenden Strang zu erzeugen, der die Integration der synthetisierten Reparatur durch eine bevorzugte zelluläre Reparatur des nicht-editierten Strangs vorantreiben kann). In Analogie zum Prime Editing mit einer napDNAbp könnte ein solcher Komplex mit einer ansonsten programmierbaren Nuklease dazu verwendet werden, einen neu synthetisierten Ersatzstrang der DNA zu synthetisieren und dann dauerhaft in einer Target-Stelle der DNA einzubauen, die das gewünschte Edit trägt.
    • 1K zeigt in einer Ausführungsform die anatomischen Merkmale einer Target-DNA, die durch Prime Editing bearbeitet werden kann. Die Target-DNA besteht aus einem „Nicht-Target-Strang“ und einem „Target-Strang“ Der Target-Strang ist der Strang, der an den Spacer einer PEgRNA eines Prime-Editor-Komplexes angelagert ist, der die PAM-Stelle erkennt (in diesem Fall NGG, das von den kanonischen SpCas9-basierten Prime-Editoren erkannt wird). Der Target-Strang kann auch als „Nicht-Pam-Strnag“ oder der „Nicht-Edit-Strang“ bezeichnet werden. Im Gegensatz dazu kann der Nicht-Target-Strang (d. h. der Strang, der den Protospacer und die PAM-Sequenz von NGG enthält) als „PAM-Strang“ oder „Edit-Strang“ bezeichnet werden. In verschiedenen Ausführungsformen befindet sich die Nick-Stelle des PE-Komplexes im Protospacer auf dem PAM-Strang (z. B. mit dem SpCas9-basierten PE). Die Position des Nicks ist charakteristisch für das jeweilige Cas9, das den PE bildet. Bei einem SpCas9-basierten PE befindet sich die Nick-Stelle beispielweise in der Phosphodiesterbindung zwischen den Basen drei („-3“-Position relativ zur Position 1 der PAM-Sequenz) und vier („-4“-Position relativ zur Position 1 der PAM-Sequenz). Die Nick-Stelle im Protospacer bildet eine freie 3'-Hydroxylgruppe, die, wie in den folgenden Figuren zu sehen ist, mit der Primer-Bindungsstelle des Extension-Arms der PEgRNA einen Komplex bildet und das Substrat für den Beginn der Polymerisation eines einzelnen DNA-Strangs bereitstellt, der durch das DNA-Synthese-Template des Extension-Arms der PEgRNA codiert wird. Diese Polymerisationsreaktion wird von der Polymerase (z. B. der reversen Transkriptase) des PE-Fusionsproteins in der 5'- zu 3'-Richtung katalysiert. Die Polymerisation wird beendet, bevor der gRNA-Kern erreicht wird (z. B. durch den Einbau eines Polymerisationsabbruchsignals oder einer Sekundärstruktur, die die Polymerisationsaktivität von PE beendet), wodurch ein Einzelstrang-DNA-Flap entsteht, der sich von der ursprünglichen 3'-Hydroxylgruppe des genickten PAM-Strangs aus erstreckt. Das DNA-Synthese-Template codiert für einen DNA-Einzelstrang, der homolog zum endogenen 5'-Ende des DNA-Einzelstrangs ist, der unmittelbar auf die Nick-Stelle des PAM-Strangs folgt und die gewünschte Nukleotidänderung enthält (z. B. Substitution einer einzelnen Base, Insertion, Deletion, Inversion). Die Position des gewünschten Edits kann sich an jeder beliebigen Position stromabwärts der Nick-Stelle auf dem PAM-Strang befinden, einschließlich der Positionen +1, +2, +3, +4 (Beginn der PAM-Stelle), +5 (Position 2 der PAM-Stelle), +6 (Position 3 der PAM-Stelle), +7, +8, +9, +10, +11, +12, +13, +14, +15, +16, +17, +18, +19, +20, +21, +22, +23, +24, +25, +26, +27, +28, +29, +30, +31, +32, +33, +34, +35, +36, +37, +38, +39, +40, +41, +42, +43, +44, +45, +46, +47, +48, +49, +50, +51, +52, +53, +54, +55, +56, +57, +58, +59, +60, +61, +62, +63, +64, +65, +66, +67, +68, +69, +70, +71, +72, +73, +74, +75, +76, +77, +78, +79, +80, +81, +82, +83, +84, +85, +86, +87, +88, +89, +90, +91, +92, +93, +94, +95, +96, +97, +98, +99, +100, +101, +102, +103, +104, +105, +106, +107, +108, +109, +110, +111, +112, +113, +114, +115, +116, +117, +118, +119, +120, + 121, +122, +123, +124, +125, +126, +127, +128, +129, +130, +131, +132, +133, +134, +135, +136, +137, +138, +139, +140, +141, +142, +143, +144, +145, +146, +147, +148, +149 oder +150 oder mehr (relativ zur stromabwärts gelegenen Position der Nick-Stelle). Sobald die Einzelstrang-DNA mit dem 3'-Ende (die das Edit von Interesse enthält) die endogene Einzelstrnag-DNA mit dem 5'-Ende ersetzt, führen die DNA-Reparatur- und Replikationsprozesse zu einer permanenten Installation der Schnittstelle auf dem PAM-Strang und einer anschließenden Korrektur der Fehlpaarung auf dem Nicht-PAM-Strang, die an der Edit-Stelle vorhanden ist. Auf diese Weise erstreckt sich das Edit auf beide DNA-Stränge an der Target-DNA-Stelle. Es ist zu verstehen, dass der Verweis auf den „editierten Strang“ und den „nicht-editierten“ Strang nur dazu dient, die am PE-Mechanismus beteiligten DNA-Stränge abzugrenzen. Der „editierte Strang“ ist der Strang, der zuerst editiert wird, indem die Einzelstrang-DNA mit 5'-Ende unmittelbar stromabwärts der Nick-Stelle durch die synthetisierte Einzelstrang-DNA mit 3'-Ende ersetzt wird, die das gewünschte Edit enthält. Der „nicht-editierte“ Strang ist das Strangpaar mit dem editierten Strang, der jedoch selbst durch Reparatur und/oder Replikation so editiert wird, dass er komplementär zum editierten Strang und insbesondere zum Edit von Interesse ist.
    • 1L zeigt den Mechanismus des Prime Editing mit den anatomischen Merkmalen der Target-DNA, dem Prime Editor-Komplex und der Interaktion zwischen der PEgRNA und der Target-DNA. Zunächst wird ein Prime Editor, der ein Fusionsprotein mit einer Polymerase (z. B. Reverse Transkriptase) und einem napDNAbp (z. B. SpCas9-Nickase, z. B. ein SpCas9 mit einer deaktivierenden Mutation in einer HNH-Nuklease-Domäne (z. B. H840A) oder einer deaktivierenden Mutation in einer RuvC-Nuklease-Domäne (D10A)) umfasst, mit einer PEgRNA und DNA mit einer zu editierenden Target-DNA komplexiert. Die PEgRNA umfasst einen Spacer, einen gRNA-Kern (auch gRNA-Gerüst oder gRNA-Rückgrat genannt) (der an das napDNAbp bindet) und einen Extension-Arm. Der Extension-Arm kann sich am 3'-Ende, am 5'-Ende oder irgendwo innerhalb des PEgRNA-Moleküls befinden. Wie gezeigt, befindet sich der Extension-Arm am 3'-Ende der PEgRNA. Der Extension-Arm umfasst in der 3'- zu 5'-Richtung eine Primer-Bindungsstelle und ein DNA-Synthese-Template (das sowohl ein Edit von Interesse als auch Homologieregionen (d. h. Homologiearme) umfasst), die mit der Einzelstrang-DNA mit 5'-Ende unmittelbar nach der Nick-Stelle auf dem PAM-Strang homolog sind. Wie gezeigt, wird nach der Einführung des Nicks, wodurch eine freie 3'-Hydroxylgruppe unmittelbar vor der Nickstelle entsteht, lagert sich die Region unmittelbar vor der Nick-Stelle auf dem PAM-Strang an eine komplementäre Sequenz am 3'-Ende des Extension-Arms an, die als „Primer-Bindungsstelle“ bezeichnet wird, wodurch eine kurze doppelsträngiger Region mit einem verfügbaren 3'-Hydroxylende entsteht, die ein Substrat für die Polymerase des Primer-Editor-Komplexes bildet. Die Polymerase (z. B. Reverse Transkriptase) polymerisiert dann als DNA-Strang vom 3'-Hydroxylende bis zum Ende des Extension-Arms. Die Sequenz der Einzelstrang-DNA wird durch das DNA-Synthese-Template codiert, d. h. durch den Teil des Extension-Arms (d. h. ohne die Primer-Bindungsstelle), der von der Polymerase „gelesen“ wird, um neue DNA zu synthetisieren. Durch diese Polymerisation wird die Sequenz des ursprünglichen 3'-Hydroxylendes der ursprünglichen Nick-Stelle effektiv erweitert. Das DNA-Synthese-Template codiert einen DNA-Einzelstrang, der nicht nur das gewünschte Edit umfasst, sondern auch Regionen, die homolog zu dem endogenen DNA-Einzelstrang sind, der sich unmittelbar stromabwärts der Nick-Stelle auf dem PAM-Strang befindet. Als nächstes verdrängt der codierte DNA-Einzelstrang mit 3'-Ende (d. h. der 3'-Einzelstrang-DNA-Flap) den entsprechenden homologen endogenen DNA-Einzelstrang mit 5'-Ende unmittelbar stromabwärts der Nick-Stelle auf dem PAM-Strang und bildet ein DNA-Zwischenprodukt mit einem DNA-Flap mit 5'-Ende, das von der Zelle entfernt wird (z. B. durch eine Flap-Endonuklease). Der 3'-endige Einzelstrang-DNA-Flap, der sich an das Komplement des endogenen 5'-endigen Einzelstrang-DNA-Flaps anlagert, wird an den endogenen Strang ligiert, nachdem der 5'-DNA-Flap entfernt wurde. Das gewünschte Edit im 3'-endigen Einzelstrang-DNA-Flap, der nun angelagert und ligiert wird, bildet eine Fehlpaarung mit dem Komplementärstrang, der eine DNA-Reparatur und/oder eine Replikationsrunde durchläuft, wodurch das gewünschte Edit dauerhaft auf beiden Strängen eingebaut wird.
    • 2 zeigt drei Cas-Komplexe (SpCas9, SaCas9 und LbCas12a), die in den hier beschriebenen Prime-Editoren verwendet werden können, sowie ihre PAM-, gRNA- und DNA-Spaltungsmerkmale. Die Figur zeigt Designs für Komplexe mit SpCas9, SaCas9 und LbCas12a.
    • 3A-3F zeigen Designs für konstruierte 5'-Prime-Editor-gRNA(3A), 3'-Prime-Editor-gRNA( 3B), und eine intramolekulare Extension (3C). Die erweiterte Guide-RNA (oder erweiterte gRNA) kann hier auch als PEgRNA oder „Prime Editing Guide RNA“ bezeichnet werden. 3D und 3E zeigen zusätzliche Ausführungsformen von 3'- und 5'-Prime-Editor-gRNAs (PEgRNAs). 3F veranschaulicht die Interaktion zwischen einer 3'endigen Prime-Editor-Guide-RNA und einer Target-DNA-Sequenz. Die Ausführungsformen von 3A-3C zeigen beispielhafte Anordnungen der Reverse-Transkriptions-Template-Sequenz (d. h. oder allgemeiner als DNA-Synthese-Template bezeichnet, wie angegeben, da die RT nur eine Art von Polymerase ist, die im Zusammenhang mit Prime-Editoren verwendet werden kann), die Primer-Bindungsstelle und eine optionale Linker-Sequenz in den erweiterten Abschnitten der 3'-, 5'- und intramolekularen Versionen sowie die allgemeinen Anordnungen der Spacer- und Core-Regionen. Der offenbarte Prime-Editing-Prozess ist nicht auf diese Konfigurationen erweiterter Guide-RNAs beschränkt. Die Ausführungsform von 3D stellt die Struktur einer beispielhaften PEgRNA bereit, wie sie hier in Betracht gezogen wird. Die PEgRNA umfasst drei Hauptbestandteile, die in 5'- zu 3'-Richtung angeordnet sind, nämlich: einem Spacer, einem gRNA-Kern und einem Extension-Arm am 3'-Ende. Der Extension-Arm kann ferner in die folgenden Strukturelemente in 5'- bis 3'-Richtung unterteilt werden: eine Primer-Bindungsstelle (A), ein Edit-Template (B) und ein Homologiearm (C). Darüber hinaus kann die PEgRNA eine optionale 3'-endige Modifizierungsregion (e1) und eine optionale 5'-endige Modifizierungsregion (e2) umfassen. Darüber hinaus kann die PEgRNA ein Transkriptionsterminationssignal am 3'-Ende der PEgRNA umfassen (nicht dargestellt). Diese Strukturelemente werden hier weiter definiert. Die Darstellung der Struktur der PEgRNA ist nicht als einschränkend zu verstehen und schließt Variationen in der Anordnung der Elemente mit ein. Die optionalen Sequenzmodifikatoren (e1) und (e2) könnten beispielsweise innerhalb oder zwischen den anderen gezeigten Regionen positioniert sein und sind nicht darauf beschränkt, sich an den 3'- und 5'-Enden zu befinden. Die PEgRNA könnte in bestimmten Ausführungsformen eine sekundäre RNA-Struktur aufweisen, wie unter anderem, Haarnadeln, Stamm/Schleifen, Toe Loops, RNA-bindende Protein-Rekrutierungsdomänen (z. B. das MS2-Aptamer, das das MS2cp-Protein rekrutiert und daran bindet). Solche Sekundärstrukturen können sich zum Beispiel innerhalb des Spacers, des gRNA-Kerns oder des Extension-Arms und insbesondere innerhalb der e1- und/oder e2-Modifikatorregionen befinden. Zusätzlich zu den sekundären RNA-Strukturen könnten die PEgRNAs (z. B. innerhalb der e1- und/oder e2-Modifikatorregionen) einen chemischen Linker oder einen Poly(N)-Linker oder -Schwanz umfassen, wobei „N“ eine beliebige Nukleobase sein kann. In einigen Ausführungsformen (z. B. wie gezeigt in 72(c)), kann der chemische Linker dazu dienen, die reverse Transkription des sgRNA-Gerüsts oder -Kerns zu verhindern. Zusätzlich, in bestimmten Ausführungsformen (siehe z. B. 72(c)), könnte der Extension-Arm (3) aus RNA oder DNA bestehen und/oder eine oder mehrere Nukleobasenanaloga beinhalten (die z. B. zusätzliche Funktionen wie Temperaturbeständigkeit bieten könnten). Darüber hinaus kann die Ausrichtung des Extension-Arms (3) in der natürlichen 5'-zu-3'-Richtung erfolgen oder in der entgegengesetzten Ausrichtung in der 3'-zu-5'-Richtung synthetisiert werden (relativ zur Ausrichtung des PEgRNA-Moleküls insgesamt). Es wird auch darauf hingewiesen, dass ein Fachmann in der Lage ist, je nach Art der Nukleinsäurematerialien des Extension-Arms (d. h. DNA oder RNA) eine geeignete DNA-Polymerase für die Verwendung bei dem Prime Editing auszuwählen, die entweder als Fusion mit dem napDNAbp oder in trans als separate Einheit bereitgestellt werden kann, um den gewünschten Template-codierten 3'-Einzelstrang-DNA-Flap zu synthetisieren, der das gewünschte Edit beinhaltet. Wenn der Extension-Arm beispielsweise RNA ist, dann könnte die DNA-Polymerase eine reverse Transkriptase oder eine andere geeignete RNA-abhängige DNA-Polymerase sein. Wenn der Extension-Arm jedoch DNA ist, dann könnte die DNA-Polymerase eine DNA-abhängige DNA-Polymerase sein. In verschiedenen Ausführungsformen könnte die Bereitstellung der DNA-Polymerase in trans erfolgen, z. B. durch die Verwendung einer RNA-Protein-Rekrutierungsdomäne (z. B. eine MS2-Haarnadel, die auf der PEgRNA installiert ist (z. B. in der e1- oder e2-Region oder an anderer Stelle und ein MS2cp-Protein, das mit der DNA-Polymerase fusioniert ist, wodurch die DNA-Polymerase an die PEgRNA colokalisiert wird). Es wird auch darauf hingewiesen, dass die Primer-Bindungsstelle im Allgemeinen keinen Teil des Templates bildet, das von der DNA-Polymerase (z. B. der reversen Transkriptase) verwendet wird, um den resultierenden 3'-Einzelstrang-DNA-Flap zu codieren, der das gewünschte Edit beinhaltet. Somit bezieht sich die Bezeichnung „DNA-Synthese-Template“ auf die Region oder den Teil des Extension-Arms (3), der von der DNA-Polymerase als Matrize verwendet wird, um den gewünschten 3'-Einzelstrang-DNA-Flap zu codieren, der das Edit und die Regionen der Homologie zum 5'-endogenen Einzelstrang-DNA-Flap enthält, der durch das 3'-Einzelstrang-DNA-Strangprodukt der Prime Editing-DNA-Synthese ersetzt wird. In einigen Ausführungsformen beinhaltet das DNA-Synthese-Template das „Edit Template“ und den „Homologiearm“ oder einen oder mehrere Homologiearme, z. B. vor und nach dem Editing Template. Das Editing Template kann so klein wie eine einzelne Nukleotidsubstitution sein, oder es kann sich um eine Insertion oder eine Inversion der DNA handeln. Darüber hinaus kann das Editing Template auch eine Deletion beinhalten, die durch die Codierung eines Homologiearms, der eine gewünschte Deletion enthält, erzeugt werden kann. In anderen Ausführungsformen kann das DNA-Synthese-Template auch die e2-Region oder einen Teil davon beinhalten. Wenn die e2-Region beispielsweise eine Sekundärstruktur umfasst, die die Beendigung der DNA-Polymerase-Aktivität bewirkt, dann ist es möglich, dass die DNA-Polymerase-Funktion beendet wird, bevor ein Teil der e2-Region tatsächlich in die DNA codiert wird. Es ist auch möglich, dass ein Teil oder sogar die gesamte e2-Region in der DNA codiert wird. Wie viel von e2 tatsächlich als Template verwendet wird, hängt von seiner Beschaffenheit ab und davon, ob diese Beschaffenheit die Funktion der DNA-Polymerase unterbricht.
    • Die Ausführungsform von 3E stellt die Struktur einer weiteren PEgRNA bereit, wie sie hier in Betracht gezogen wird. Die PEgRNA umfasst drei Hauptbestandteile, die in 5'- zu 3'-Richtung angeordnet sind, nämlich: einem Spacer, einem gRNA-Kern und einem Extension-Arm am 3'-Ende. Der Extension-Arm kann ferner in die folgenden Strukturelemente in 5'- bis 3'-Richtung unterteilt werden: eine Primer-Bindungsstelle (A), ein Edit-Template (B) und ein Homologiearm (C). Darüber hinaus kann die PEgRNA eine optionale 3'-endige Modifizierungsregion (e1) und eine optionale 5'-endige Modifizierungsregion (e2) umfassen. Darüber hinaus kann die PEgRNA ein Transkriptionsterminationssignal am 3'-Ende der PEgRNA umfassen (nicht dargestellt). Diese Strukturelemente werden hier weiter definiert. Die Darstellung der Struktur der PEgRNA ist nicht als einschränkend zu verstehen und schließt Variationen in der Anordnung der Elemente mit ein. Die optionalen Sequenzmodifikatoren (e1) und (e2) könnten beispielsweise innerhalb oder zwischen den anderen gezeigten Regionen positioniert sein und sind nicht darauf beschränkt, sich an den 3'- und 5'-Enden zu befinden. Die PEgRNA könnte in bestimmten Ausführungsformen eine sekundäre RNA-Strukturen aufweisen, wie, unter anderem, Haarnadeln, Stamm/Schleifen, Toe Loops, RNA-bindende Protein-Rekrutierungsdomänen (z. B. das MS2-Aptamer, das das MS2cp-Protein rekrutiert und daran bindet). Diese Sekundärstrukturen können überall im PEgRNA-Molekül platziert werden. Solche Sekundärstrukturen können sich zum Beispiel innerhalb des Spacers, des gRNA-Kerns oder des Extension-Arms und insbesondere innerhalb der e1- und/oder e2-Modifikatorregionen befinden. Zusätzlich zu den sekundären RNA-Strukturen könnten die PEgRNAs (z. B. innerhalb der e1- und/oder e2-Modifikatorregionen) einen chemischen Linker oder einen Poly(N)-Linker oder - Schwanz umfassen, wobei „N“ eine beliebige Nukleobase sein kann. In einigen Ausführungsformen (z. B. wie gezeigt in 72(c)), kann der chemische Linker dazu dienen, die reverse Transkription des sgRNA-Gerüsts oder -Kerns zu verhindern. Zusätzlich, in bestimmten Ausführungsformen (siehe z. B. 72(c)), könnte der Extension-Arm (3) aus RNA oder DNA bestehen und/oder eine oder mehrere Nukleobasenanaloga beinhalten (die z. B. zusätzliche Funktionen wie Temperaturbeständigkeit bieten könnten). Darüber hinaus kann die Ausrichtung des Extension-Arms (3) in der natürlichen 5'-zu-3'-Richtung erfolgen oder in der entgegengesetzten Ausrichtung in der 3'-zu-5'-Richtung synthetisiert werden (relativ zur Ausrichtung des PEgRNA-Moleküls insgesamt). Es wird auch darauf hingewiesen, dass ein Fachmann in der Lage ist, je nach Art der Nukleinsäurematerialien des Extension-Arms (d. h. DNA oder RNA) eine geeignete DNA-Polymerase für die Verwendung bei dem Prime Editing auszuwählen, die entweder als Fusion mit dem napDNAbp oder in trans als separate Einheit bereitgestellt werden kann, um den gewünschten Template-codierten 3'-Einzelstrang-DNA-Flap zu synthetisieren, der das gewünschte Edit beinhaltet. Wenn der Extension-Arm beispielsweise RNA ist, dann könnte die DNA-Polymerase eine reverse Transkriptase oder eine andere geeignete RNA-abhängige DNA-Polymerase sein. Wenn der Extension-Arm jedoch DNA ist, dann könnte die DNA-Polymerase eine DNA-abhängige DNA-Polymerase sein. In verschiedenen Ausführungsformen könnte die Bereitstellung der DNA-Polymerase in trans erfolgen, z. B. durch die Verwendung einer RNA-Protein-Rekrutierungsdomäne (z. B. eine MS2-Haarnadel, die auf der PEgRNA installiert ist (z. B. in der e1- oder e2-Region oder an anderer Stelle und ein MS2cp-Protein, das mit der DNA-Polymerase fusioniert ist, wodurch die DNA-Polymerase an die PEgRNA colokalisiert wird). Es wird auch darauf hingewiesen, dass die Primer-Bindungsstelle im Allgemeinen keinen Teil des Templates bildet, das von der DNA-Polymerase (z. B. der reversen Transkriptase) verwendet wird, um den resultierenden 3'-Einzelstrang-DNA-Flap zu codieren, der das gewünschte Edit beinhaltet. Somit bezieht sich die Bezeichnung „DNA-Synthese-Template“ auf die Region oder den Teil des Extension-Arms (3), der von der DNA-Polymerase als Matrize verwendet wird, um den gewünschten 3'-Einzelstrang-DNA-Flap zu codieren, der das Edit und die Regionen der Homologie zum 5'-endogenen Einzelstrang-DNA-Flap enthält, der durch das 3'-Einzelstrang-DNA-Strangprodukt der Prime Editing-DNA-Synthese ersetzt wird. In einigen Ausführungsformen beinhaltet das DNA-Synthese-Template das „Edit Template“ und den „Homologiearm“ oder einen oder mehrere Homologiearme, z. B. vor und nach dem Editing Template. Das Editing Template kann so klein wie eine einzelne Nukleotidsubstitution sein, oder es kann sich um eine Insertion oder eine Inversion der DNA handeln. Darüber hinaus kann das Editing Template auch eine Deletion beinhalten, die durch die Codierung eines Homologiearms, der eine gewünschte Deletion enthält, erzeugt werden kann. In anderen Ausführungsformen kann das DNA-Synthese-Template auch die e2-Region oder einen Teil davon beinhalten. Wenn die e2-Region beispielsweise eine Sekundärstruktur umfasst, die die Beendigung der DNA-Polymerase-Aktivität bewirkt, dann ist es möglich, dass die DNA-Polymerase-Funktion beendet wird, bevor ein Teil der e2-Region tatsächlich in die DNA codiert wird. Es ist auch möglich, dass ein Teil oder sogar die gesamte e2-Region in der DNA codiert wird. Wie viel von e2 tatsächlich als Template verwendet wird, hängt von seiner Beschaffenheit ab und davon, ob diese Beschaffenheit die Funktion der DNA-Polymerase unterbricht.
    • Das Schema von 3F zeigt die Interaktion einer typischen PEgRNA mit einer Target-Stelle einer Doppelstrang-DNA und die gleichzeitige Produktion eines 3'-Einzelstrang-DNA-Flaps, der die gewünschte genetische Änderung enthält. Die Doppelstrang-DNA ist mit dem oberen Strang (d. h. dem Target-Strang) in der 3'- zu 5'-Ausrichtung und dem unteren Strang (d. h. dem PAM-Strang oder Nicht-Target-Strang) in der 5'- zu 3'-Richtung dargestellt. Der obere Strang besteht aus dem Komplement des „Protospacers“ und dem Komplement der PAM-Sequenz und wird als „Target-Strang“ bezeichnet, weil er der Strang ist, der an den Spacer der PEgRNA anlagert. Der komplementäre untere Strang wird als „Nicht-Target-Strang“ oder „PAM-Strang“ oder „Protospacer-Strang“ bezeichnet, da er die PAM-Sequenz (z. B. NGG) und den Protospacer enthält. Obwohl nicht gezeigt, würde die abgebildete PEgRNA mit einer Cas9-Domäne oder einer entsprechenden Domäne eines Prime-Editor-Fusionsproteins komplexiert werden. Wie im Schema dargestellt, bindet der Spacer der PEgRNA an die komplementäre Region des Protospacers auf dem Target-Strang. Diese Interaktion bildet ein DNA/RNA-Hybrid zwischen der Spacer-RNA und dem Komplement der Protospacer-DNA und führt zur Bildung einer R-Schleife im Protospacer. Wie an anderer Stelle hierin beschrieben, induziert das Cas9-Protein (nicht gezeigt) dann einen Nick in den Nicht-Target-Strang, wie gezeigt. Dies führt dann zur Bildung der 3'-ssDNA-Flap-Region unmittelbar stromaufwärts der Nick-Stelle, die gemäß *z* mit dem 3'-Ende der PEgRNA an der Primer-Bindungsstelle interagiert. Das 3'-Ende der ssDNA-Klappe (d. h. die Primer-Sequenz für die reverse Transkriptase) bindet an die Primer-Bindungsstelle (A) auf der PEgRNA, wodurch die reverse Transkriptase geprimt wird. Als nächstes polymerisiert die reverse Transkriptase (z. B. in trans bereitgestellt oder cis als Fusionsprotein bereitgestellt, an das Cas9-Konstrukt gebunden) einen einzelnen DNA-Strang, der durch das DNA-Synthese-Template (einschließlich des Edit-Template (B) und des Homologiearms (C)) codiert wird. Die Polymerisation setzt sich zum 5'-Ende des Extension-Arms hin fort. Der polymerisierte Strang der ssDNA bildet einen ssDNA 3'-End-Flap, der, wie an anderer Stelle beschrieben (z. B. wie in FIG. IG gezeigt), in die endogene DNA eindringt, den entsprechenden endogenen Strang verdrängt (der als 5' endiger DNA-Flap von der endogenen DNA entfernt wird) und das gewünschte Nukleotid-Edit (Änderung einzelner Nukleotid-Basenpaare, Deletionen, Insertionen (einschließlich ganzer Gene) durch natürlich auftretende DNA-Reparatur-/Replikationsrunden einbaut.
    • 3G zeigt noch eine weitere Ausführungsform des hier in Betracht gezogenen Prime Editing. Das obere Schema zeigt insbesondere eine Ausführungsform eines Prime Editors (PE), der ein Fusionsprotein aus einem napDNAbp (z. B. SpCas9) und einer Polymerase (z. B. einer reversen Transkriptase) umfasst, die durch einen Linker verbunden sind. Das PE bildet einen Komplex mit einer PEgRNA durch Bindung an den gRNA-Kern der PEgRNA. In der gezeigten Ausführungsform ist die PEgRNA mit einem 3'-Extension-Arm ausgestattet, der, beginnend am 3'-Ende, eine Primer-Bindungsstelle (PBS) gefolgt von einem DNA-Synthese-Template umfasst. Das untere Schema zeigt eine Variante eines Prime-Editors, die als „trans Prime-Editor (tPE)“ bezeichnet wird. In dieser Ausführungsform werden das DNA-Synthese-Template und PBS von der PEgRNA entkoppelt und auf einem separaten Molekül präsentiert, das als trans Prime-Editor-RNA-Template („tPERT“) bezeichnet wird und eine RNA-Protein-Rekrutierungsdomäne (z. B. eine MS2-Haarnadel) umfasst. Der PE selbst ist so modifiziert, dass er mit einem rPERT-Rekrutierungsprotein („RP“) fusioniert ist. RP ist ein Protein, das die RNA-Protein-Rekrutierungsdomäne spezifisch erkennt und daran bindet. In dem Beispiel, in dem die RNA-Protein-Rekrutierungsdomäne eine MS2-Haarnadel ist, kann das entsprechende rPERT-Rekrutierungsprotein MS2cp des MS2-Tagging-Systems sein. Das MS2-Tagging-System basiert auf der natürlichen Interaktion des MS2-Bakteriophagen-Hüllproteins („MCP“ oder „MS2cp“) mit einer im Genom des Phagen vorhandenen Stamm-Schleifen- oder Haarnadelstruktur, d. h. der „MS2-Haarnadel“ oder dem „MS2-Aptamer“. Im Falle des trans Prime Editing „rekrutiert“ der RP-PE:gRNA-Komplex ein tPERT, das die entsprechende RNA-Protein-Rekrutierungsdomäne besitzt, um mit dem PE:gRNA-Komplex zu colokalisieren, wodurch das PBS und das DNA-Synthese-Template in trans für die Verwendung bei dem Prime Editing bereitgestellt werden, wie in dem Beispiel in 3H gezeigt.
    • 3H zeigt den Prozess des trans Prime Editing. In dieser Ausführungsform umfasst der trans Prime-Editor einen „PE2“-Prime-Editor (d. h. eine Fusion von Cas9(H840A) und einer Variante von MMLV RT), der mit einem MS2cp-Protein fusioniert ist (d. h. einer Art von Rekrutierungsprotein, das ein MS2-Aptamer erkennt und daran bindet) und der mit einer sgRNA (d. h. einer Standard-Guide-RNA im Gegensatz zu einer PEgRNA) komplexiert ist. Der trans Prime-Editor bindet sich an die Target-DNA und versieht den Nicht-Target-Strang mit einem Nick. Das MS2cp-Protein rekrutiert ein tPERT in trans durch die spezifische Interaktion mit der RNA-Protein-Rekrutierungsdomäne auf dem tPERT-Molekül. Der tPERT wird mit dem trans Prime-Editor colokalisiert, wodurch die Funktionen von PBS und dem DNA-Synthese-Template in trans für die Verwendung durch die Polymerase der reversen Transkriptase bereitgestellt werden, um einen Einzelstrang-DNA-Flap mit einem 3'-Ende zu synthetisieren, der die gewünschte genetische Information enthält, die von dem DNA-Synthese-Template codiert wird.
    • 4A-4E zeigen in vitro TPRT-Assays (d. h. Prime Editing-Assays). 4A ist ein Schema der durch Template-bestimmten gRNA-Extension durch ein RT-Enzym, PAGE, von fluoreszenzmarkierten DNA-Substraten. 4B zeigt TPRT (d. h. Prime Editing) mit vorgenickten Substraten, dCas9 und 5'-erweiterten gRNAs unterschiedlicher Länge des Synthese-Templates. 4C zeigt die RT-Reaktion mit vorgenickten DNA-Substraten in Abwesenheit von Cas9. 4D zeigt TPRT (d. h. Prime Editing) auf vollständigen dsDNA-Substraten mit Cas9(H840A) und 5'-erweiterten gRNAs. 4E zeigt eine 3'-erweitertes gRNA-Template mit vorgenickten und vollständigen dsDNA-Substraten. Alle Reaktionen sind mit M-MLV RT.
    • 5 zeigt in vitro-Validierungen unter Verwendung von 5'-erweiterten gRNAs mit unterschiedlich langen Synthese-Templates. Als Substrate wurden fluoreszenzmarkierte (Cy5) DNA-Targets verwendet, die in dieser Versuchsreihe vorgenickt wurden. Bei dem in diesen Experimenten verwendeten Cas9 handelt es sich um katalytisch totes Cas9 (dCas9), und die verwendete RT ist Superscript III, eine kommerzielle RT, die aus dem Moloney-Mausleukämie-Virus (M-MLV) gewonnen wurde. dCas9:gRNA-Komplexe wurden aus gereinigten Komponenten gebildet. Dann wurde das fluoreszenzmarkierte DNA-Substrat zusammen mit dNTPs und dem RT-Enzym hinzugefügt. Nach 1 Stunde Inkubation bei 37 °C wurden die Reaktionsprodukte mittels denaturierender Urea-Polyacrylamid-Gelelektrophorese (PAGE) analysiert. Das Gelbild zeigt die Extension des ursprünglichen DNA-Strangs auf Längen, die mit der Länge dem Template für die reverse Transkription übereinstimmen.
    • 6 zeigt in vitro-Validierungen unter Verwendung von 5'-erweiterten gRNAs mit unterschiedlich langen Syntheses-Templates, die denen in 5 sehr ähnlich sind. Allerdings sind die DNA-Substrate in dieser Reihe von Experimenten nicht vorgenickt. Das in diesen Experimenten verwendete Cas9 ist eine Cas9-Nickase (SpyCas9 H840A-Mutante) und die verwendete RT ist Superscript III, eine kommerzielle RT, die vom Moloney-Mausleukämie-Virus (M-MLV) abgeleitet ist. Die Reaktionsprodukte wurden mittels denaturierender Urea-Polyacrylamid-Gelelektrophorese (PAGE) analysiert. Wie im Gel zu sehen ist, spaltet die Nickase den DNA-Strang effizient, wenn die Standard-gRNA verwendet wird (gRNA_0, Spur 3).
    • 7 zeigt, dass 3'-Extensionen die DNA-Synthese unterstützen und die Cas9-Nickase-Aktivität nicht signifikant beeinflussen. Vorgenickte Substrate (schwarzer Pfeil) werden nahezu quantitativ in RT-Produkte umgewandelt, wenn entweder dCas9 oder Cas9-Nickase verwendet wird (Spur 4 und 5). Mehr als 50 % Umwandlung in das RT-Produkt (roter Pfeil) wird mit vollen Substraten (Spur 3) beobachtet. Cas9-Nickase (SpyCas9 H840A-Mutante), katalytisch totes Cas9 (dCas9) und Superscript III, ein kommerzielles RT, das aus dem Moloney-Mausleukämie-Virus (M-MLV) abgeleitet ist, werden verwendet.
    • 8 zeigt zweifarbige Experimente, die verwendet wurden, um festzustellen, ob die RT-Reaktion bevorzugt mit der gRNA in cis (im gleichen Komplex gebunden) stattfindet. Zwei separate Experimente wurden für 5'-erweiterte und 3'-erweiterte gRNAs durchgeführt. Die Produkte wurden mittels PAGE analysiert. Produktverhältnis berechnet als (Cy3cis/Cy3trans) / (Cy5trans/Cy5cis).
    • 9A-9D zeigt ein Flap-Modell-Substrat. 9A zeigt einen Dual-FP-Reporter für die Flap-gerichtete Mutagenese. 9B zeigt die Stoppcodon-Reparatur in HEK-Zellen. 9C zeigt sequenzierte Hefeklone nach der Flap-Reparatur. 9D zeigt den Test verschiedener Flap-Merkmale in menschlichen Zellen.
    • 10 zeigt das Prime Editing auf Plasmidsubstraten. Ein dual-fluoreszierendes Reporterplasmid wurde für die Expression in Hefe (S. cerevisiae) konstruiert. Die Expression dieses Konstrukts in Hefe produziert nur GFP. Die in vitro-Prime Editing-Reaktion führt eine Punktmutation ein und transformiert das Eltemplasmid oder ein in vitro Cas9(H840A)-genicktes Plasmid in Hefe. Die Kolonien werden durch Fluoreszenzbildgebung sichtbar gemacht. Hefe-Dual-FP-Plasmid-Transformanten sind abgebildet. Die Transformation des Elternplasmids oder eines in vitro Cas9(H840A)-genickten Plasmids führt nur zu grünen GFP-exprimierenden Kolonien. Die Prime Editing-Reaktion mit 5'-erweiterten oder 3'-erweiterten gRNAs erzeugt eine Mischung aus grünen und gelben Kolonien. Letztere exprimieren sowohl GFP als auch mCherry. Es werden mehr gelbe Kolonien mit der 3'-erweiterten gRNA beobachtet. Eine positive Kontrolle, die kein Stoppcodon enthält, ist ebenfalls abgebildet.
    • 11 zeigt das Prime Editing auf Plasmidsubstraten ähnlich dem Experiment in 10, aber anstatt eine Punktmutation in das Stoppcodon einzubauen, wird beim Prime Editing eine einzelne Nukleotid-Insertion (links) oder -Deletion (rechts) eingebaut, die eine Frameshift-Mutation repariert und die Synthese von mCherry stromabwärts ermöglicht. In beiden Experimenten wurden 3'-erweiterte gRNAs verwendet.
    • 12 zeigt Editing-Produkte von Prime Editing auf Plasmidsubstraten, die durch Sanger-Sequenzierung charakterisiert wurden. Einzelne Kolonien aus den TRT-Transformationen wurden ausgewählt und mittels Sanger-Sequenzierung analysiert. Bei der Sequenzierung ausgewählter Kolonien wurden präzise Änderungen beobachtet. Die grünen Kolonien enthielten Plasmide mit der ursprünglichen DNA-Sequenz, während die gelben Kolonien die präzise Mutation enthielten, die durch die Prime Editing-gRNA erzeugt wurde. Es wurden keine weiteren Punktmutationen oder Indels beobachtet.
    • 13 zeigt die potenziellen Möglichkeiten der neuen Prime-Editing-Technologie auf und vergleicht sie mit Deaminase-vermittelten Base-Editing-Technologien.
    • 14 zeigt eine schematische Darstellung des Editing in menschlichen Zellen.
    • 15 zeigt die Extension der Primer-Bindungsstelle in gRNA.
    • 16 zeigt verkürzte gRNAs für benachbarte Target-Strukturen.
    • 17A-17C sind Diagramme, die die prozentuale Umwandlung von T in A am Target-Nukleotid nach der Transfektion von Komponenten in menschlichen embryonalen Nierenzellen (HEK-Zellen) zeigen. 17A zeigt Daten, die Ergebnisse unter Verwendung einer N-terminalen Fusion der MLV-Wildtyp-Reverse-Transkriptase mit Cas9(H840A)-Nickase (32-Aminosäure-Linker) darstellen. 17B ist ähnlich wie 17A, aber für die C-terminale Fusion des RT-Enzyms. 17C ist ähnlich wie 17A, aber der Linker zwischen dem MLV RT und Cas9 ist 60 Aminosäuren lang statt 32 Aminosäuren.
    • 18 zeigt ein hochreines T-zu-A-Editing an der HEK3-Stelle durch Hochdurchsatz-Amplikonsequenzierung. Das Ergebnis der Sequenzierungsanalyse zeigt die am häufigsten vorkommenden Genotypen der editierten Zellen an.
    • 19 zeigt die Editing-Effizienz am Target-Nukleotid (blaue Balken) und die Indel-Raten (orangefarbene Balken). WT bezieht sich auf den Wildtyp des MLV RT-Enzyms. Die mutierten Enzyme (M1 bis M4) enthalten die rechts aufgeführten Mutationen. Die Editing-Raten wurden durch Hochdurchsatz-Sequenzierung von genomischen DNA-Amplikons quantifiziert.
    • 20 zeigt die Editing-Effizienz des Target-Nukleotids, wenn ein Einzelstrang-Nick in den komplementären DNA-Strang in der Nähe des Target-Nukleotids eingeführt wird. Getestet wurde das Nicking in verschiedenen Abständen vom Target-Nukleotid (Dreiecke). Die Editing-Effizienz am Target-Basenpaar (blaue Balken) wird zusammen mit der Indel-Bildungsrate (orangefarbene Balken) gezeigt. Das Beispiel „keine“ enthält keine komplementäre Strang-Nicking-Guide-RNA. Die Editing-Raten wurden durch Hochdurchsatz-Sequenzierung von genomischen DNA-Amplikons quantifiziert.
    • 21 zeigt verarbeitete Hochdurchsatz-Sequenzierungsdaten, die die gewünschte T-zu-A-Transversionsmutation und das generelle Fehlen anderer wichtiger Genome Editing-Nebenprodukte zeigen.
    • 22 zeigt eine schematische Darstellung eines beispielhaften Verfahrens zur Durchführung einer gezielten Mutagenese mit einer fehleranfälligen reversen Transkriptase an einem Target-Locus unter Verwendung eines programmierbaren DNA-Bindungsproteins (napDNAbp), das mit einer erweiterten Guide-RNA komplexiert ist, d. h. Prime Editing mit einer fehleranfälligen RT. Dieser Prozess kann als eine Ausführungsform des Prime Editing für die gezielte Mutagenese bezeichnet werden. Die erweiterte Guide-RNA umfasst eine Extension am 3'- oder 5'-Ende der Guide-RNA oder an einer intramolekularen Stelle in der Guide-RNA. In Schritt (a) kontaktiert der napDNAbp/gRNA-Komplex das DNA-Molekül und die gRNA leitet das napDNAbp zur Bindung an den zu mutagenisierenden Target-Locus. In Schritt (b) wird ein Nick in einen der DNA-Stränge des Target-Locus eingeführt (z. B. durch eine Nuklease oder einen chemischen Wirkstoff), wodurch ein verfügbares 3'-Ende in einem der Stränge des Target-Locus entsteht. In bestimmten Ausführungsformen wird der Nick in dem DNA-Strang erzeugt, der dem R-Schleifen-Strang entspricht, d. h. dem Strang, der nicht mit der RNA-Guide-Sequenz hybridisiert ist. In Schritt (c) interagiert der DNA-Strang am 3'-Ende mit dem erweiterten Teil der Guide-RNA, um die reverse Transkription zu starten. In bestimmten Ausführungsformen hybridisiert der DNA-Strang mit dem 3'-Ende an eine spezifische RT-Priming-Sequenz auf dem erweiterten Teil der Guide-RNA. In Schritt (d) wird ein fehleranfällige reverse Transkriptase eingeführt, die einen mutagenisierten einzelnen DNA-Strang vom 3'-Ende der geprimten Stelle zum 3'-Ende der Guide-RNA synthetisiert. Beispielhafte Mutationen sind mit einem Sternchen „*“ gekennzeichnet. Dadurch entsteht ein Einzelstrang-DNA-Flap, der die gewünschte mutagenisierte Region umfasst. In Schritt (e) werden das napDNAbp und die Guide-RNA freigesetzt. Die Schritte (f) und (g) beziehen sich auf die Auflösung des Einzelstrang-DNA-Flaps (umfassend die mutagenisierte Region), so dass die gewünschte mutagenisierte Region in den Target-Locus eingebaut wird. Dieser Prozess kann in Richtung der gewünschten Produktbildung vorangetrieben werden, indem der entsprechende 5' endogene DNA-Flap entfernt wird, der sich bildet, sobald der 3'-Einzelstrang-DNA-Flap eindringt und mit der komplementären Sequenz auf dem anderen Strang hybridisiert. Der Prozess kann auch zur Produktbildung mit einem zweiten Strang führen, wie in 1F beispielhaft dargestellt. Nach endogenen DNA-Reparatur- und/oder Replikationsprozessen wird die mutagenisierte Region in beide DNA-Stränge des DNA-Locus eingebaut.
    • 23 ist ein Schema des gRNA-Designs für die Kontraktion von Trinukleotid-Repeat-Sequenzen und die Kontraktion von Trinukleotid-Repeats mit TPRT-Genome Editing (d. h. Prime Editing). Die Expansion von Trinukleotid-Repeats wird mit einer Reihe von menschlichen Krankheiten in Verbindung gebracht, darunter die Huntington-Krankheit, das Fragile-X-Syndrom und die Friedreich-Ataxie. Das häufigste Trinukleotid-Repeat enthält CAG-Tripletts, obwohl auch GAA-Tripletts (Friedreich-Ataxie) und CGG-Tripletts (Fragiles X-Syndrom) vorkommen. Die Vererbung einer Veranlagung zur Expansion oder der Erwerb eines bereits expandierten elterlichen Allels erhöht die Wahrscheinlichkeit, die Krankheit zu erwerben. Pathogene Expansionen von Trinukleotid-Repeats könnten hypothetisch durch Prime Editing korrigiert werden. Eine Region stromaufwärts der Repeat-Region kann von einer RNA-gesteuerten Nuklease mit einem Nick versehen werden, um dann die Synthese eines neuen DNA-Strangs zu starten, der eine gesunde Anzahl von Repeats enthält (die von dem jeweiligen Gen und der Krankheit abhängt). Nach der Repeat-Sequenz wird ein kurzer Abschnitt der Homologie hinzugefügt, der mit der Identität der Sequenz am anderen Ende des Repeats (roter Strang) übereinstimmt. Die Invasion des neu synthetisierten Strangs und der anschließende Ersatz der endogenen DNA durch den neu synthetisierten Flap führt zu einem zusammengezogenen Wiederholungsallel.
    • 24 ist eine schematische Darstellung der präzisen 10-Nukleotid-Deletion mit Prime Editing. Eine Guide-RNA, die auf den HEK3-Locus abzielt, wurde mit einem Template für die reverse Transkription entworfen, die für eine 10-Nukleotid-Deletion nach der Nick-Stelle codiert. Die Editing-Effizienz in transfizierten HEK-Zellen wurde durch Amplikonsequenzierung ermittelt.
    • 25 ist eine schematische Darstellung des gRNA-Designs für das Peptid-Tagging von Genen an endogenen genomischen Loci und das Peptid-Tagging mit TPRT-Genome Editing (d. h. Prime Editing). Die Tagging-Systeme FlAsH und ReAsH umfassen zwei Teile: (1) eine fluorophor-biarsenische Sonde und (2) ein genetisch codiertes Peptid, das ein Tetracystein-Motiv enthält, beispielhaft dargestellt durch die Sequenz FLNCCPGCCMEP (SEQ ID NO: 1). Wenn sie in Zellen exprimiert werden, können Proteine, die das Tetracystein-Motiv enthalten, mit Fluorophor-Arsen-Sonden fluoreszierend markiert werden (siehe Ref: J. Am. Chem. Soc., 2002, 124 (21), S. 6063-6076. DOI: 10.1021/ja017687n). Das „Sortagging“-System verwendet bakterielle Sortase-Enzyme, die markierte Peptidsonden kovalent an Proteine konjugieren, die geeignete Peptidsubstrate enthalten (siehe Referenz): Nat. Chem. Biol. 2007 Nov;3(11):707-8. DOI: 10.1038/nchembio.2007.31). Das FLAG-Tag (DYKDDDDK (SEQ ID NO: 2)), V5-Tag (GKPIPNPLLGLDST (SEQ ID NO: 3)), GCN4-Tag (EELLSKNYHLENEVARLKK (SEQ ID NO: 4)), HA-Tag (YPYDVPDYA (SEQ ID NO: 5)) und Myc-Tag (EQKLISEEDL (SEQ ID NO: 6)) werden üblicherweise als Epitop-Tags für Immunoassays verwendet. Die Pi-Klemme codiert eine Peptidsequenz (FCPF), die mit einem pentafluor-aromatischen Substrat markiert werden kann (siehe: Nat. Chem. 2016 Feb;8(2): 120-8. doi: 10.1038/nchem.2413).
    • 26A zeigt den präzisen Einbau eines His6-Tags und eines FLAG-Tags in genomische DNA. Eine Guide-RNA, die auf den HEK3-Locus abzielt, wurde mit einem Template für die reverse Transkription entworfen, die entweder für eine 18-nt-His-Tag-Insertion oder eine 24-nt-FLAG-Tag-Insertion codiert. Die Editing-Effizienz in transfizierten HEK-Zellen wurde durch Amplikonsequenzierung ermittelt. Es ist zu beachten, dass die gesamte 24-nt-Sequenz des FLAG-Tags außerhalb des Sichtfeldes liegt (die Sequenzierung bestätigte die vollständige und präzise Insertion). 26B zeigt eine schematische Darstellung verschiedener Anwendungen, bei denen das Tagging von Proteinen/Peptiden eine Rolle spielt. Dazu gehören (a) die Löslichkeit oder Unlöslichkeit von Proteinen, (b) die Änderung oder Verfolgung der zellulären Lokalisierung eines Proteins, (c) die Verlängerung der Halbwertszeit eines Proteins, (d) die Erleichterung der Proteinreinigung und (e) die Erleichterung des Nachweises von Proteinen.
    • 27 zeigt einen Überblick über das Prime Editing durch Einfügen einer schützenden Mutation in PRNP, die das Fortschreiten der Prionenerkrankung verhindert oder aufhält. Die PEgRNA-Sequenzen entsprechen SEQ ID NO: 351 auf der linken Seite (d. h. 5' des sgRNA-Gerüsts) und SEQ ID NO 3864 auf der rechten Seite (d. h. 3' des sgRNA-Gerüsts).
    • 28A ist eine schematische Darstellung der PE-basierten Insertion von Sequenzen, die RNA-Motive codieren. 28B ist eine (nicht erschöpfende) Liste mit einigen Beispielmotiven, die möglicherweise eingefügt werden könnten, und ihren Funktionen.
    • 29A ist eine Abbildung eines Prime-Editors. 29B zeigt mögliche Modifikationen an genomischer, Plasmid- oder viraler DNA, die durch einen PE gesteuert werden.
    • 29C zeigt ein Beispielschema für die Insertion einer Bibliothek von Peptidschleifen in ein bestimmtes Protein (in diesem Fall GFP) über eine Bibliothek von PEgRNAs. 29D zeigt ein Beispiel für mögliche programmierbare Deletionen von Codons oder N- oder C-terminale Verkürzungen eines Proteins unter Verwendung verschiedener PEgRNAs. Es wird erwartet, dass Deletionen mit minimaler Erzeugung von Frameshift-Mutationen auftreten.
    • 30 zeigt ein mögliches Schema für die iterative Insertion von Codons in einem System der kontinuierlichen Evolution, wie z. B. PACE.
    • 31 ist eine Illustration einer konstruierten gRNA, die den gRNA-Kern, den ~20nt-Spacer, der mit der Sequenz des Target-Gens übereinstimmt, das Template für die reverse Transkription mit der Nukleotidsequenz des immunogenen Epitops und die Primer-Bindungsstelle, die mit der Sequenz des Target-Gens übereinstimmt, zeigt.
    • 32 ist ein Schema, das die Verwendung von Prime Editing als Mittel zum Einfügen bekannter immunogener Epitope in endogene oder fremde genomische DNA zeigt, was zu einer Änderung der entsprechenden Proteine führt.
    • 33 ist eine schematische Darstellung des PEgRNA-Designs für Primer-Bindungssequenz-Insertionen und Primer-Bindungs-Insertionen in genomische DNA unter Verwendung von Prime Editing zur Bestimmung von Off-Target-Editing. In dieser Ausführungsform wird das Prime Editing in einer lebenden Zelle, einem Gewebe oder einem Tiermodell durchgeführt. In einem ersten Schritt wird eine geeignete PEgRNA entworfen. Das obere Schema zeigt eine beispielhafte PEgRNA, die in diesem Aspekt verwendet werden kann. Der Spacer in der PEgRNA (als „Protospacer“ bezeichnet) ist komplementär zu einem der Stränge des genomischen Targets. Der PE:PEgRNA-Komplex (d. h. der PE-Komplex) installiert einen Einzelstrang-3'-End-Flap an der Nick-Stelle, der die codierte Primer-Bindungssequenz und die Region der Homologie (codiert durch den Homologie-Arm der PEgRNA) enthält, die komplementär zu der Region direkt stromabwärts der Nick-Stelle (in rot) ist. Durch Flap-Invasion und DNA-Reparatur-/Replikationsprozesse wird der synthetisierte Strang in die DNA eingebaut, wodurch die Primer-Bindungsstelle installiert wird. Dieser Prozess kann am gewünschten genomischen Target stattfinden, aber auch an anderen genomischen Stellen, die mit der PEgRNA in einer Off-Target-Weise interagieren könnten (d. h. die PEgRNA leitet den PE-Komplex aufgrund der Komplementarität der Spacer-Region zu anderen genomischen Stellen, die nicht die beabsichtigte genomische Stelle sind, zu anderen Off-Target-Stellen). So kann die Primer-Bindungssequenz nicht nur am gewünschten genomischen Target, sondern auch an anderen genomischen Stellen im Genom installiert werden. Um die Insertion dieser Primer-Bindungsstellen sowohl an den beabsichtigten genomischen Targetstellen als auch an den genomischen Off-Target-Stellen nachzuweisen, kann die genomische DNA (nach der PE) isoliert, fragmentiert und an Adapternukleotide (in rot dargestellt) ligiert werden. Als nächstes kann die PCR mit PCR-Oligonukleotiden durchgeführt werden, die an die Adapter und an die eingefügte Primer-Bindungssequenz binden, um die genomischen DNA-Regionen zu amplifizieren, in die die Primer-Bindungsstelle durch PE eingefügt wurde (on-target und off-target). Anschließend können Hochdurchsatz-Sequenzierungen und Sequenzabgleiche durchgeführt werden, um die Insertionspunkte der Pe-eingefügten Primer-Bindungssequenzen entweder an der On-Target-Stelle oder an Off-Target-Stellen zu identifizieren.
    • 34 ist ein Schema, das die präzise Insertion eines Gens mit PE zeigt.
    • 35A ist eine schematische Darstellung des natürlichen Insulin-Signalwegs. 35B ist ein Schema, das die Aktivierung des FKBP12-markierten Insulinrezeptors durch FK1012 zeigt.
    • 36 zeigt kleinmolekulare Monomere. Referenzen: gestoßener FK506-Imitator (2)107
    • 37 zeigt kleine Moleküldimere. Referenzen: FK1012 495,96; FK1012 5108; FK1012 6107; AP1903 7107; Cyclosporin A-Dimer 898; FK506-Cyclosporin A-Dimer (FkCsA) 9100.
    • 38A-38F geben einen Überblick über das Prime Editing und Machbarkeitsstudien in vitro und in Hefezellen. 38A zeigt die 75.122 bekannten pathogenen menschlichen genetischen Varianten in ClinVar (Zugriff im Juli 2019), klassifiziert nach Typ. 38B zeigt, dass ein Prime-Editing-Komplex aus einem Prime-Editor (PE)-Protein besteht, das eine RNAgesteuerte DNA-Nicking-Domäne enthält, wie z. B. die Cas9-Nickase, die mit einer konstruierten Reversen Transkriptase-Domäne fusioniert und mit einer Prime-Editing-Guide-RNA (PEgRNA) komplexiert ist. Der PE:PEgRNA-Komplex bindet an die Target-DNA und ermöglicht eine Vielzahl präziser DNA-Edits an einer Vielzahl von DNA-Positionen vor oder nach dem benachbarten Motiv des Protospacers (PAM) der Target-Stelle. 38C zeigt, dass der PE:PEgRNA-Komplex nach der Bindung an das DNA-Target den PAM-haltigen DNA-Strang mit einem Nick versieht. Das resultierende freie 3'-Ende hybridisiert mit der Primer-Bindungsstelle der PEgRNA. Die Domäne der reversen Transkriptase katalysiert die Primerextension unter Verwendung des RT-Template der PEgRNA, was zu einem neu synthetisierten DNA-Strang führt, der das gewünschte Edit (den 3'-Flap) enthält. Das Gleichgewicht zwischen dem editierten 3'-Flap und dem nicht editierten 5'-Flap, der die ursprüngliche DNA enthält, gefolgt von der zellulären 5'-Flap-Spaltung und -Ligation und der DNA-Reparatur oder -Replikation, um die Heteroduplex-DNA aufzulösen, führt zu einer stabil editierten DNA. 38D zeigt in vitro 5'-erweiterte PEgRNA-Primer-Extensionsassays mit vorgenickten dsDNA-Substraten, die 5'-Cy5-markierte PAM-Stränge, dCas9 und eine kommerzielle M-MLV-RT-Variante (RT, Superscript III) enthalten. dCas9 wurde mit PEgRNAs komplexiert, die RT-Templates unterschiedlicher Länge enthalten, und dann zusammen mit den angegebenen Komponenten zu den DNA-Substraten gegeben. Die Reaktionen wurden 1 Stunde lang bei 37 °C inkubiert, dann mittels denaturierender Harnstoff-PAGE analysiert und auf Cy5-Fluoreszenz visualisiert. 38E zeigt Primer-Extensionsassays, die wie in 38D unter Verwendung von 3'-erweiterten PEgRNAs durchgeführt werden, die mit dCas9 oder Cas9 H840A-Nickase vorkomplexiert sind, und mit 5'-Cy5- markierten dsDNA-Substraten mit oder ohne Nick. 38F zeigt Hefekolonien, die mit GFP-mCherry-Fusionsreporterplasmiden transformiert wurden, die in vitro mit PEgRNAs, Cas9-Nickase und RT editiert wurden. Plasmide, die Nonsense- oder Frameshift-Mutationen zwischen GFP und mCherry enthielten, wurden mit 5'-erweiterten oder 3'-erweiterten PEgRNAs editiert, die die mCherry-Translation durch Transversionsmutation, 1-bp-Insertion oder 1-bp-Deletion wiederherstellen. GFP und mCherry doppelt-positive Zellen (gelb) zeigen eine erfolgreiches Editing an.
    • 39A-39D zeigen das Prime Editing von genomischer DNA in menschlichen Zellen durch PE1 und PE2. 39A zeigt, dass PEgRNAs eine Spacer-Sequenz, ein sgRNA-Gerüst und eine 3'-Extension enthalten, die eine Primer-Bindungsstelle (grün) und ein Template für die reverse Transkription (RT) (violett) enthält, das die editierte(n) Base(n) (rot) enthält. Die Primer-Bindungsstelle hybridisiert mit dem PAM-haltigen DNA-Strang unmittelbar vor der Stelle des Nicks. Das RT-Template ist homolog zu der DNA-Sequenz stromabwärts des Nicks, mit Ausnahme des codierten Edits. 39B zeigt den Einbau einer T•A-zu-A•T-Transversion an der HEK3-Stelle in HEK293T-Zellen unter Verwendung der Cas9 H840A-Nickase, die mit der Wildtyp M-MLV Reverse Transkriptase (PE1) fusioniert ist, und PEgRNAs mit unterschiedlichen Primer-Bindungsstellenlängen. 39C zeigt, dass die Verwendung einer gentechnisch veränderten pentamutanten M-MLV reversen Transkriptase (D200N, L603W, T306K, W313F, T330P) in PE2 die Effizienz der Prime-Editing-Transversionen an fünf genomischen Stellen in HEK293T-Zellen sowie der kleinen Insertions- und kleinen Deletions-Edits in HEK3-Zellen erheblich verbessert. 39D ist ein Vergleich der PE2-Editing-Effizienz mit unterschiedlichen RT-Template-Längen an fünf genomischen Stellen in HEK293T-Zellen. Die Werte und Fehlerbalken geben den Mittelwert und die Standardabweichung von drei unabhängigen biologischen Replikaten wieder.
    • 40A-40C zeigen, dass die PE3- und PE3b-Systeme den nicht-editierten Strang mit einem Nick versehen, um die Effizienz des Prime Editing zu erhöhen. 40A ist eine Übersicht über das Prime Editing durch PE3. Nach der anfänglichen Synthese des editierten Strangs entfernt die DNA-Reparatur entweder den neu synthetisierten Strang, der das Edit enthält (3'-Flap-Exzision) oder den ursprünglichen genomischen DNA-Strang (5'-Flap-Exzision). Die 5'-Flap-Exzision hinterlässt einen DNA-Heteroduplex, der einen editierten Strang und einen nicht-editierten Strang enthält. Die Mismatch-Reparaturmaschinerie oder die DNA-Replikation könnte den Heteroduplex auflösen, so dass entweder editierte oder nicht-editierte Produkte entstehen. Das Nicken des nicht-editierten Strangs begünstigt die Reparatur dieses Strangs, was zu einer bevorzugten Erzeugung von stabiler Duplex-DNA führt, die das gewünschte Edit enthält. 40B zeigt den Effekt des komplementären Strang-Nickings auf die PE3-vermittelte Prime-Editing-Effizienz und die Indel-Bildung. „Keine“ bezieht sich auf PE2-Kontrollen, die den komplementären Strang nicht mit einem Nick versehen. 40C ist ein Vergleich der Editing-Effizienz mit PE2 (kein komplementärer Strang-Nick), PE3 (allgemeiner komplementärer Strang-Nick) und PE3b (edit-spezifischer komplementärer Strang-Nick). Alle Editing-Erträge spiegeln den Prozentsatz der gesamten Sequenzierungs-Reads wider, die das beabsichtigte Edit enthalten und keine Indels unter allen behandelten Zellen enthalten, ohne dass eine Sortierung erfolgt. Die Werte und Fehlerbalken geben den Mittelwert und die Standardabweichung von drei unabhängigen biologischen Replikaten wieder.
    • 41A-41K zeigen gezielte Insertionen, Deletionen und alle 12 Arten von Punktmutationen mit PE3 an sieben endogenen menschlichen genomischen Loci in HEK293T-Zellen. 41A ist ein Diagramm, das alle 12 Arten von Einzelnukleotidübergängen und Transversionen von Position +1 bis +8 (wobei die Position des PEgRNA-induzierten Nicks als zwischen Position +1 und -1 liegend gezählt wird) der HEK3-Site unter Verwendung eines 10-nt-RT-Templates zeigt. 41B ist ein Diagramm, das weitreichende PE3-Transversionen an der HEK3-Stelle unter Verwendung eines 34-nt-RT-Templates zeigt. 41C-41H sind Diagramme, die alle 12 Arten von Transitions- und Transversionsbearbeitungen an verschiedenen Positionen im Prime Editing-Fenster für(41C) RNF2, (41D) FANCF, (41E) EMX1, (41F) RUNX1, (41G) VEGFA und (41H) DNMT1 zeigen. 41I ist ein Diagramm, das gezielte 1- und 3-bp-Insertionen sowie 1- und 3-bp-Deletionen mit PE3 an sieben endogenen genomischen Loci zeigt. 41J ist ein Diagramm, das die gezielten präzisen Deletionen von 5 bis 80 bp an der HEK3-Target-Stelle zeigt. 41K ist ein Diagramm, das eine Kombination aus Insertionen und Deletionen, Insertionen und Punktmutationen, Deletionen und Punktmutationen sowie doppelten Punktmutationen an drei endogenen genomischen Loci zeigt. Alle Editing-Erträge spiegeln den Prozentsatz der gesamten Sequenzierungs-Reads wider, die das beabsichtigte Edit enthalten und keine Indels unter allen behandelten Zellen enthalten, ohne dass eine Sortierung erfolgt. Die Werte und Fehlerbalken geben den Mittelwert und die Standardabweichung von drei unabhängigen biologischen Replikaten wieder.
    • 42A-42H zeigen den Vergleich von Prime Editing und Base Editing sowie Off-Target-Editing durch Cas9 und PE3 an bekannten Cas9 Off-Target-Stellen. 42A zeigt die gesamte C•G-zu-T•A-Editing-Effizienz an denselben Target-Nukleotiden für PE2, PE3, BE2max und BE4max an endogenen HEK3-, FANCF- und EMX1-Stellen in HEK293T-Zellen. 42B zeigt die Indel-Häufigkeit der Behandlungen in 42A. 42C zeigt die Editing-Effizienz von präzisen C•G-zu-T•A-Edits (ohne Bystander-Edits oder Indels) für PE2, PE3, BE2max und BE4max bei HEK3, FANCF und EMX1. Für EMX1 sind auch die präzise PE-Kombinations-Edits aller möglichen Kombinationen der C•G-zu-T•A-Umwandlung an den drei Target-Nukleotiden gezeigt. 42D zeigt die gesamte A•T-zu-G•C-Editing-Effizienz für PE2, PE3, ABEdmax und ABEmax bei HEK3 und FANCF. 42E zeigt die präzise A•T-zu-G•C-Editing-Effizienz ohne Bystander-Edits oder Indels für HEK3 und FANCF. 42F zeigt die Indel-Häufigkeit der Behandlungen in 42D. 42G zeigt die durchschnittliche Dreifach-Editing-Effizienz (Prozentsatz der Sequenzier-Reads mit Indels) in HEK293T-Zellen für Cas9-Nuklease an vier On-Target- und 16 bekannten Off-Target-Stellen. Bei den 16 untersuchten Off-Target-Stellen handelte es sich um die vier wichtigsten, zuvor gemeldeten Off-Target-Stellen118,159 für jede der vier On-Target-Stellen. Für jede On-Target-Stelle wurde Cas9 mit einer sgRNA oder mit jeder der vier PEgRNAs gepaart, die denselben Protospacer erkennen. 42H zeigt die durchschnittlichen dreifachen On-Target- und Off-Target-Editing-Effizienzen und Indel-Effizienzen (unten in Klammern) in HEK293T-Zellen für PE2 oder PE3 gepaart mit jeder PEgRNA in(42G). On-Target-Editing-Erträge spiegeln den Prozentsatz der gesamten Sequenzierungs-Reads wider, die das beabsichtigte Edit enthalten und keine Indels unter allen behandelten Zellen enthalten, ohne dass eine Sortierung erfolgt. Die Ergebnisse des Off-Target-Editing spiegeln die Modifikation von Off-Target-Loci wider, die mit dem Prime Editing übereinstimmen. Die Werte und Fehlerbalken geben den Mittelwert und die Standardabweichung von drei unabhängigen biologischen Replikaten wieder.
    • 43A-43I zeigen das Prime Editing in verschiedenen menschlichen Zelllinien und primären kortikalen Neuronen der Maus, den Einbau und die Korrektur von pathogenen Transversions-, Insertions- oder Deletionsmutationen sowie den Vergleich von Prime Editing und HDR. 43A ist ein Diagramm, das den Einbau (durch T•A-zu-A•T-Transversion) und Korrektur (durch A•T-zu-T•A-Transversion) der pathogenen E6V-Mutation in HBB in HEK293T-Zellen zeigt. Gezeigt wird die Korrektur entweder zu Wildtyp-HBB oder zu HBB mit einer stillen Mutation, die die PEgRNA PAM unterbricht. 43B ist ein Diagramm, das die Installation (über 4-bp-Insertion) und Korrektur (über 4-bp-Deletion) des pathogenen HEXA 1278+TATC-Allels in HEK293T-Zellen zeigt. Gezeigt wird die Korrektur entweder zu Wildtyp-HEXA oder zu HEXA mit einer stillen Mutation, die die PEgRNA PAM unterbricht. 43C ist ein Diagramm, das die Installation der schützenden G127V-Variante in PRNP in HEK293T-Zellen durch G•Czu-T•A-Transversion zeigt. 43D ist eine Grafik, die das Prime Editing in anderen menschlichen Zelllinien zeigt, darunter K562 (leukämische Knochenmarkzellen), U2OS (Osteosarkomzellen) und HeLa (Gebärmutterhalskrebszellen). 43E ist ein Diagramm, das den Einbau einer G•C-zu-T•A-Transversionsmutation in DNMT1 in primären kortikalen Neuronen der Maus unter Verwendung eines dualen Split-Intein-PE3-Lentivirus-Systems zeigt, bei dem die N-terminale Hälfte Cas9 (1-573) ist, das mit N-Intein und über ein P2A-Selbstspaltungspeptid mit GFP-KASH fusioniert ist, und die C-terminale Hälfte das C-Intein ist, das mit dem Rest von PE2 fusioniert ist. Die PE2-Hälften werden von einem menschlichen Synapsin-Promotor exprimiert, der hochspezifisch für reife Neuronen ist. Sortierte Werte spiegeln Editing oder Indels aus GFP-positiven Kernen wider, während unsortierte Werte aus allen Kernen stammen. 43F ist ein Vergleich der PE3- und Cas9-vermittelten HDR-Editing-Effizienz an endogenen genomischen Loci in HEK293T-Zellen. 43G ist ein Vergleich der PE3- und Cas9-vermittelten HDR-Editing-Effizienz an endogenen genomischen Loci in K562-, U2OS- und HeLa-Zellen. 43H ist ein Vergleich der PE3- und Cas9-vermittelten HDR Indel-Nebenproduktbildung in HEK293T, K562, U2OS und HeLa-Zellen. 43I zeigt die gezielte Insertion eines His6-Tags (18 bp), eines FLAG-Epitop-Tags (24 bp) oder einer erweiterten LoxP-Stelle (44 bp) in HEK293T-Zellen durch PE3. Alle Editing-Erträge spiegeln den Prozentsatz der gesamten Sequenzierungs-Reads wider, die das beabsichtigte Edit enthalten und keine Indels unter allen behandelten Zellen enthalten. Die Werte und Fehlerbalken geben den Mittelwert und die Standardabweichung von drei unabhängigen biologischen Replikaten wieder.
    • 44A-44G zeigen in vitro Prime Editing-Validierungsstudien mit fluoreszenzmarkierten DNA-Substraten. 44A zeigt elektrophoretische Mobilitätsverschiebungstests mit dCas9, 5'-erweiterten PEgRNAs und 5'-Cy5-markierten DNA-Substraten. Die PEgRNAs 1 bis 5 enthalten eine 15-nt-Linkersequenz (Linker A für PEgRNA 1, Linker B für PEgRNAs 2 bis 5) zwischen dem Spacer und dem PBS, eine 5-nt-PBS-Sequenz und RT-Templates von 7 nt (PEgRNAs 1 und 2), 8 nt (PEgRNA 3), 15 nt (PEgRNA 4) und 22 nt (PEgRNA 5). PEgRNAs sind diejenigen, die in 44E und 44F verwendet werden; die vollständigen Sequenzen sind in den Tabellen 2A-2C aufgeführt. 44B zeigt in vitro Nicking-Assays von Cas9 H840A unter Verwendung von 5'-erweiterten und 3'-erweiterten PEgRNAs.
    • 44C zeigt die Cas9-vermittelte Indel-Bildung in HEK293T-Zellen bei HEK3 unter Verwendung von 5'-erweiterten und 3'-erweiterten PEgRNAs. 44D zeigt einen Überblick über die biochemischen in vitro-Assays von Prime Editing. Es wurden 5'-Cy5-markierte vorgenickte und nicht-genickte dsDNA-Substrate getestet. sgRNAs, 5'-erweiterte PEgRNAs oder 3'erweiterte PEgRNAs wurden mit dCas9 oder Cas9 H840A-Nickase vorkomplexiert und dann mit dsDNA-Substrat, M-MLV RT und dNTPs kombiniert. Die Reaktionen wurden bei 37 °C für 1 Stunde laufen gelassen, bevor sie durch denaturierende Harnstoff-PAGE aufgetrennt und durch Cy5-Fluoreszenz sichtbar gemacht wurden. 44E zeigt, dass Primerextensionsreaktionen mit 5'-erweiterten PEgRNAs, vorgenickten DNA-Substraten und dCas9 zu einer signifikanten Umwandlung in RT-Produkte führen. 44F zeigt Primerextensionsreaktionen mit 5'erweiterten PEgRNAs wie in 44B, mit nicht-genicktem DNA-Substrat und Cas9 H840A-Nickase. Die Produktausbeute ist im Vergleich zu vorgenickten Substraten stark reduziert. 44G zeigt eine in vitro Primerextensionsreaktion unter Verwendung einer 3'-PEgRNA, die ein einzelnes scheinbares Produkt durch denaturierende Harnstoff-PAGE erzeugt. Die RT-Produktbande wurde herausgeschnitten, aus dem Gel eluiert und dann einem Homopolymer-Tailing mit terminaler Transferase (TdT) unter Verwendung von dGTP oder dATP unterzogen. Die Schwanzprodukte wurden mit poly-T- oder poly-C-Primern erweitert und die resultierende DNA wurde sequenziert. Die Sanger-Spuren zeigen, dass drei Nukleotide, die vom gRNA-Gerüst stammen, revers transkribiert wurden (als die letzten 3'-Nukleotide zum DNA-Produkt hinzugefügt). Es ist zu beachten, dass in Experimenten zum Prime Editing von Säugetierzellen die Insertion von PEgRNA-Gerüsten viel seltener ist als in vitro (56A-56D), was möglicherweise darauf zurückzuführen ist, dass die gebundene reverse Transkriptase keinen Zugang zum Cas9-gebundenen Guide-RNA-Gerüst hat, und/oder auf die zelluläre Exzision von unpassenden 3'-Enden von 3'-Flaps, die PEgRNA-Gerüstsequenzen enthalten.
    • 45A-45G zeigen die zelluläre Reparatur von 3' DNA-Flaps aus in vitro Prime Editing-Reaktionen in Hefe. 45A zeigt, dass duale Fluoreszenzprotein-Reporterplasmide offene Leserahmen von GFP und mCherry enthalten, die durch eine Target-Stelle getrennt sind, die für ein Stoppcodon im Rahmen, einen +1 Frameshift oder einen -1 Frameshift codiert. Prime Editing-Reaktionen wurden in vitro mit Cas9 H840A-Nickase, PEgRNA, dNTPs und M-MLV reverser Transkriptase durchgeführt und anschließend in Hefe transformiert. Kolonien, die nicht editierte Plasmide enthalten, produzieren GFP, aber kein mCherry. Hefekolonien mit editierten Plasmiden produzieren sowohl GFP als auch mCherry als Fusionsprotein. 45B zeigt eine Überlagerung der GFP- und mCherry-Fluoreszenz von Hefekolonien, die mit Reporterplasmiden transformiert wurden, die ein Stoppcodon zwischen GFP und mCherry enthalten (nicht editierte Negativkontrolle, oben), oder die kein Stoppcodon oder Frameshift zwischen GFP und mCherry enthalten (vor-editierte Positivkontrolle, unten). 45C-45F zeigen eine Visualisierung der mCherry- und GFP-Fluoreszenz von Hefekolonien, die mit in vitro Prime Editing-Reaktionsprodukten transformiert wurden. 45C zeigt eine Stoppcodon-Korrektur durch T•Azu-A•T-Transversion unter Verwendung einer 3'-erweiterten PEgRNA oder einer 5'-erweiterten PEgRNA, wie in 45D. 45E zeigt eine +1 Frameshift-Korrektur durch eine 1-bp-Deletion unter Verwendung einer 3'-erweiterten PEgRNA. 45F zeigt eine -1 Frameshift-Korrektur durch eine 1-bp-Insertion unter Verwendung einer 3'-erweiterten PEgRNA. 45G zeigt Sanger-DNA-Sequenzierungsspuren von Plasmiden, die aus GFP-allein-Kolonien in 45B und GFP und mCherry doppelt-positiven Kolonien in 45C isoliert wurden..
    • 46A-46F zeigen das korrekte Editing im Vergleich zur Indel-Erzeugung mit PE1. 46A zeigt die T•A-zu-A•T-Transversions-Effizienz und die Indel-Erzeugung durch PE1 an der +1-Position von HEK3 unter Verwendung von PEgRNAs, die 10-nt-RT-Templates und eine PBS-Sequenz von 8-17 nt enthalten. 46B zeigt die G•C-zu-T•A-Transversions-Effizienz und die Indel-Erzeugung durch PE1 an der +5-Position von EMX1 unter Verwendung von PEgRNAs, die 13-nt-RT-Templates und eine PBS-Sequenz von 9-17 nt enthalten. 46C zeigt die G•Czu-T•A-Transversions-Effizienz und die Indel-Erzeugung durch PE1 an der +5-Position von FANCF unter Verwendung von PEgRNAs, die 17-nt-RT-Templates und PBS-Sequenzen von 8-17 nt enthalten. 46D zeigt die C•G-zu-A•T-Transversions-Effizienz und die Indel-Erzeugung durch PE1 an der +1-Position von RNF2 unter Verwendung von PEgRNAs, die 11-nt-RT-Templates und eine PBS-Sequenz von 9-17 nt enthalten. 46E zeigt die G•C-zu-T•A-Transversions-Effizienz und die Indel-Erzeugung durch PE1 an der +2-Position von HEK4 unter Verwendung von PEgRNAs, die 13-nt-RT-Templates und eine PBS-Sequenz von 7-15 nt enthalten. 46F zeigt die PE1-vermittelte +1 T-Deletion, +1 A-Insertion und +1 CTT-Insertion an der HEK3-Stelle unter Verwendung einer 13-nt PBS- und 10-nt RT-Template. Die Sequenzen der PEgRNAs sind die, die in 39C (siehe Tabellen 3A-3R) gezeigt sind. Die Werte und Fehlerbalken geben den Mittelwert und die Standardabweichung von drei unabhängigen biologischen Replikaten wieder.
    • 47A-47S zeigen die Bewertung der M-MLV RT-Varianten für Prime Editing. 47A zeigt die Abkürzungen für die in dieser Figur verwendeten Varianten des Prime Editors. 47B zeigt gezielte Insertions- und Deletions-Edits mit PE1 am HEK3-Locus. 47C-47H zeigen einen Vergleich von 18 Prime-Editor-Konstrukten, die M-MLV-RT-Varianten enthalten, hinsichtlich ihrer Fähigkeit, einen +2 G•C-zu-C•G-Transversions-Edit bei HEK3 einzubauen, wie in 47C gezeigt, eine 24-bp-FLAG-Insertion in HEK3, wie in 47D gezeigt, eine +1 C•Gzu-A•T-Transversion bei RNF2, wie in 47E gezeigt, eine +1 G•C-zu-C•G-Transversion bei EMX1, wie in 47F gezeigt, eine +2 T•A-zu-A•T-Transversion bei HBB, wie in 47G gezeigt, und eine +1 G•C-zu-C•G-Transversion bei FANCF, wie in 47H gezeigt. 47I-47N zeigen einen Vergleich von vier Prime-Editor-Konstrukten, die M-MLV-Varianten enthalten, hinsichtlich ihrer Fähigkeit, die in 47C-47H gezeigten Edits in einer zweiten Runde von unabhängigen Experimenten einzubauen. 47O-47S zeigen die PE2-Editing-Effizienz an fünf genomischen Loci mit unterschiedlichen PBS-Längen. 47O zeigt eine +1 T•A-zu-A•T-Variation bei HEK3. 47P zeigt eine +5 G•C-zu-A•T-Variation bei EMX1. 47Q zeigt eine +5 G•C-zu-T•A-Variation bei FANCF. 47R zeigt eine +1 C•G-zu-A•T-Variation bei RNF2. 47S zeigt eine +2 G•C-zu-T•A-Variation bei HEK4. Die Werte und Fehlerbalken geben den Mittelwert und die Standardabweichung von drei unabhängigen biologischen Replikaten wieder.
    • 48A-48C zeigen die Design-Merkmale von PEgRNA PBS und RT-Template-Sequenzen. 48A zeigt die PE2-vermittelte +5 G•C-zu-T•A-Transversionseffizienz (blaue Linie) bei VEGFA in HEK293T-Zellen als Funktion der RT-Template-Länge. Indels (graue Linie) sind zum Vergleich eingezeichnet. Die Sequenz unter dem Diagramm zeigt das letzte Nukleotid, das für die Synthese durch die PEgRNA als Template dient. G-Nukleotide (mit einem C in der PEgRNA) sind hervorgehoben. RT-Templates, die auf C enden, sollten beim PEgRNA-Design vermieden werden, um die Effizienz des Prime Editing zu maximieren. 48B zeigt +5 G•Czu-T•A-Transversionen und Indels für DNMT1 wie in 48A. 48C zeigt +5 G•C-zu-T•A-Transversionen und Indels für RUNX1 wie in 48A. Die Werte und Fehlerbalken geben den Mittelwert und die Standardabweichung von drei unabhängigen biologischen Replikaten wieder.
    • 49A-49B zeigen die Auswirkungen von PE2, PE2 R110S K103L, Cas9 H840A-Nickase und dCas9 auf die Lebensfähigkeit der Zellen. HEK293T-Zellen wurden mit Plasmiden transfiziert, die für PE2, PE2 R110S K103L, Cas9 H840A-Nickase oder dCas9 codieren, zusammen mit einem HEK3-targeting PEgRNA-Plasmid. Die Lebensfähigkeit der Zellen wurde alle 24 Stunden nach der Transfektion für 3 Tage mit dem CellTiter-Glo 2.0 Assay (Promega) gemessen. 49A zeigt die Lebensfähigkeit, gemessen durch Lumineszenz, 1, 2 oder 3 Tage nach der Transfektion. Die Werte und Fehlerbalken geben den Mittelwert und die Standardabweichung von drei unabhängigen biologischen Replikaten wieder, die jeweils in dreifacher technischer Ausführung durchgeführt wurden. 49B zeigt das prozentuale Editing und die Indels für PE2, PE2 R110S K103L, Cas9 H840A-Nickase oder dCas9, zusammen mit einem HEK3-targeting PEgRNA Plasmid, das für einen +5 G-zu-A-Edit codiert. Die Editing-Effizienz wurde am Tag 3 nach der Transfektion von Zellen gemessen, die parallel zu den Zellen behandelt wurden, die für die Bestimmung der Lebensfähigkeit in 49A. Die Werte und Fehlerbalken geben den Mittelwert und die Standardabweichung von drei unabhängigen biologischen Replikaten wieder.
    • 50A-50B zeigen die PE3-vermittelte Korrektur von HBB E6V und die Korrektur von HEXA 1278+TATC durch verschiedene PEgRNAs. 50A zeigt ein Screening von 14 PEgRNAs zur Korrektur des HBB E6V-Allels in HEK293T-Zellen mit PE3. Alle untersuchten PEgRNAs wandeln das HBB E6V-Allel in den Wildtyp HBB zurück, ohne eine stille PAM-Mutation einzuführen. 50B zeigt ein Screening von 41 PEgRNAs zur Korrektur des HEXA 1278+TATC-Allels in HEK293T-Zellen mit PE3 oder PE3b. Diese PEgRNAs mit der Bezeichnung HEXA korrigieren das pathogene Allel durch eine verschobene 4-bp-Deletion, die das PAM unterbricht und eine stille Mutation hinterlässt. Diese PEgRNAs mit der Bezeichnung HEXA korrigieren das pathogene Allel zurück zum Wildtyp. Einträge, die mit „b“ enden, verwenden eine edit-spezifische Nicking-sgRNA in Kombination mit der PEgRNA (das PE3b-System). Die Werte und Fehlerbalken geben den Mittelwert und die Standardabweichung von drei unabhängigen biologischen Replikaten wieder.
    • 51A-51F zeigen eine PE3-Aktivität in menschlichen Zelllinien und einen Vergleich von PE3 und Cas9-initiierter HDR. Effizienz der Erzeugung des korrekten Edits (ohne Indels) und Indel-Häufigkeit für PE3 und Cas9-initiierte HDR in HEK293T-Zellen, wie in 51A gezeigt, K562-Zellen, wie in 51B gezeigt, U2OS-Zellen, wie in 51C gezeigt, und HeLa-Zellen, wie in 51D gezeigt. Jeder Vergleich des eingeklammerten Editing baut identische Edits mit PE3 und Cas9-initiiertem HDR ein. Nicht zielgerichtete Kontrollen sind PE3 und eine PEgRNA, die auf einen Nicht-Target-Locus abzielt. 51E zeigt Kontrollexperimente mit nicht zielgerichteter PEgRNA+PE3 und mit dCas9+sgRNA im Vergleich zu Wildtyp-Cas9-HDR-Experimenten, die bestätigen, dass das ssDNA-Donor-HDR-Template, eine häufige Verunreinigung, die die scheinbaren HDR-Effizienzen künstlich erhöht, nicht zu den HDR-Messungen in 51A-51D beiträgt. 51F zeigt ein Beispiel für HEK3-Stellen-Allele aus genomischen DNA-Proben, die aus K562-Zellen nach dem Editing mit PE3 oder mit Cas9-initiierter HDR isoliert wurden. Die Allele wurden mit einem Illumina MiSeq sequenziert und mit CRISPResso2178 analysiert. Die HEK3-Referenzsequenz aus dieser Region ist oben zu sehen. Die Allel-Tabellen sind für eine nicht zielgerichtete PEgRNA-Negativkontrolle, eine +1 CTT-Insertion in HEK3 mit PE3 und eine +1 CTT-Insertion in HEK3 mit Cas9-initiierter HDR dargestellt. Für jedes Allel sind die Allelhäufigkeiten und die entsprechenden Illumina-Sequenzierungslesezahlen angegeben. Alle beobachteten Allele mit einer Häufigkeit von ≥0,20 % werden gezeigt. Die Werte und Fehlerbalken geben den Mittelwert und die Standardabweichung von drei unabhängigen biologischen Replikaten wieder.
    • 52A-52D zeigen die Verteilung der pathogenen Insertionen, Duplikationen, Deletionen und Indels in der ClinVar-Datenbank nach Länge. Die ClinVar Variantenzusammenfassung wurde am 15. Juli 2019 vom NCBI heruntergeladen. Die Längen der gemeldeten Insertionen, Deletionen und Duplikationen wurden anhand der Referenz- und alternativen Allele, der Start- und Stopp-Positionen der Variante oder der entsprechenden Informationen im Variantennamen berechnet. Varianten, die keine der oben genannten Informationen meldeten, wurden von der Analyse ausgeschlossen. Die Längen der gemeldeten Indels (einzelne Varianten, die sowohl Insertionen als auch Deletionen im Vergleich zum Referenzgenom beinhalten) wurden berechnet, indem die Anzahl der Mismatches oder Lücken in der besten paarweisen Ausrichtung zwischen dem Referenz- und dem alternativen Allel ermittelt wurde.
    • 53A-53B zeigen FACS-Gating-Beispiele für die Sortierung GFP-positiver Zellen. Nachfolgend finden Sie Beispiele für Original-Charge-Analysedateien, in denen die Sortierstrategie für die Erzeugung der HEXA 1278+TATC und HBB E6V HEK293T-Zelllinien beschrieben ist. Die Bilddaten wurden auf einem Sony LE-MA900 Zytometer mit der Cell Sorter Software v. 3.0.5 erstellt. Grafik 1 zeigt Gating-Plots für Zellen, die kein GFP exprimieren. Grafik 2 zeigt eine Beispielsorte von P2A-GFP-exprimierenden Zellen, die für die Isolierung der HBB E6V HEK293T-Zelllinien verwendet wurden. HEK293T-Zellen wurden zunächst mit FSC-A/BSC-A (Gate A) auf Population gegated und dann mit FSC-A/FSC-H (Gate B) auf Singlets sortiert. Lebende Zellen wurden durch Gating von DAPI-negativen Zellen sortiert (Gate C). Zellen mit GFP-Fluoreszenzwerten, die über denen der Negativkontrollzellen lagen, wurden unter Verwendung von EGFP als Fluorchrom sortiert (Gate D). 53A zeigt HEK293T-Zellen (GFPnegativ). 53B zeigt eine repräsentative Darstellung des FACS-Gatings für Zellen, die PE2-P2A-GFP exprimieren. 53C zeigt die Genotypen für HEXA 1278+TATC homozygote HEK293T-Zellen. 53D zeigt Alleltabellen für HBB E6V homozygote HEK293T-Zelllinien.
    • 54 ist ein Schema, das das PEgRNA-Klonierungsverfahren zusammenfasst.
    • 55A-55G sind schematische Darstellungen von PEgRNA-Designs. 55A zeigt ein einfaches Diagramm der PEgRNA mit markierten Domänen (links) und gebunden an nCas9 an einer genomischen Stelle (rechts). 55B zeigt verschiedene Arten von Modifikationen der PEgRNA, von denen angenommen wird, dass sie die Aktivität erhöhen. 55C zeigt Modifikationen der PEgRNA, um die Transkription längerer RNAs über die Wahl des Promotors und die 5'-, 3'-Verarbeitung und Terminierung zu erhöhen. 55D zeigt die Verlängerung des P1-Systems, die ein Beispiel für eine Gerüstmodifikation ist. 55E zeigt, dass der Einbau von synthetischen Modifikationen in die Template-Region oder an anderer Stelle in der PEgRNA die Aktivität erhöhen könnte. 55F zeigt, dass ein gezielter Einbau einer minimalen Sekundärstruktur in das Template die Bildung einer längeren, hemmenden Sekundärstruktur verhindern könnte. 55G zeigt eine geteilte PEgRNA mit einer zweiten Template-Sequenz, die durch ein RNA-Element am 3'-Ende der PEgRNA verankert ist (links). Der Einbau von Elementen an den 5' oder 3' Enden der PEgRNA könnte die RT-Bindung verbessern.
    • 56A-56D zeigen den Einbau der PEgRNA-Gerüstsequenz in die Target-Loci. Die HTS-Daten wurden für die PEgRNA-Gerüstsequenz-Insertion analysiert, wie in 60A-60B beschrieben. 56A zeigt eine Analyse für den EMX1-Locus. Dargestellt ist der prozentuale Anteil der gesamten Sequenzierungs-Reads, die ein oder mehrere PEgRNA-Gerüstsequenz-Nukleotide innerhalb einer an das RT-Template angrenzenden Insertion enthalten (links); der prozentuale Anteil der gesamten Sequenzierungs-Reads, die eine PEgRNA-Gerüstsequenz-Insertion der angegebenen Länge enthalten (Mitte); und der kumulative Gesamtprozentsatz der PEgRNA-Insertion bis zur und einschließlich der auf der X-Achse angegebenen Länge. 56B zeigt dasselbe wie 56A, aber für FANCF. 56C zeigt dasselbe wie in 56A, aber für HEK3. 56D zeigt dasselbe wie 56A, aber für RNF2. Die Werte und Fehlerbalken geben den Mittelwert und die Standardabweichung von drei unabhängigen biologischen Replikaten wieder.
    • 57A-57I zeigen die Auswirkungen von PE2, PE2-dRT und Cas9 H840A-Nickase auf die transkriptomweite RNA-Häufigkeit. Analyse der zellulären RNA, abgereichert an ribosomaler RNA, isoliert aus HEK293T-Zellen, die PE2, PE2-dRT oder Cas9 H840A-Nickase und eine PRNP-targeting oder HEXA-targeting PEgRNA exprimieren. RNAs, die 14.410 Genen und 14.368 Genen entsprechen, wurden in PRNP- bzw. HEXA-Proben nachgewiesen. 57A-57F zeigen ein Vulkandiagramm, das den -log10 FDR-bereinigten p-Wert im Vergleich zur log2-fachen Änderung der Transkriptionshäufigkeit für jede RNA anzeigt, wobei (57A) PE2 vs. PE2-dRT mit PRNP-targeting PEgRNA verglichen wird, (57B) PE2 vs. Cas9 H840A mit PRNP-targeting PEgRNA, (57C) PE2-dRT vs. Cas9 H840A mit PRNP-targeting PEgRNA, (57D) PE2 vs. PE2-dRT mit HEXA-targeting PEgRNA, (57E) PE2 vs. Cas9 H840A mit HEXA-targeting PEgRNA, (57F) PE2-dRT vs. Cas9 H840A mit HEXA-targeting PEgRNA. Rote Punkte kennzeichnen Gene, die eine ≥2-fache Änderung der relativen Häufigkeit aufweisen, die statistisch signifikant ist (FDR-angepasster p < 0,05). 57G-57I sind Venn-Diagramme der hochregulierten und herunterregulierten Transkripte (≥2-fache Änderung) beim Vergleich von PRNP- und HEXA-Proben für (57G) PE2 vs. PE2-dRT, (57H) PE2 vs. Cas9 H840A und (57I) PE2-dRT vs. Cas9 H840A.
    • 58 zeigt ein repräsentatives FACS-Gating für die Sortierung der neuronalen Kerne. Die Kerne wurden nacheinander auf der Grundlage des DyeCycle Ruby-Signals, des FSC/SSC-Verhältnisses, des SSC-Breiten/SSC-Höhen-Verhältnisses und des GFP/DyeCycle-Verhältnisses gegated.
    • 59A-59F zeigen das Protokoll zur Klonierung von 3'-erweiterten PEgRNAs in U6-Expressionsvektoren für Säugetiere durch Golden Gate Assembly. 59A zeigt die Klonübersicht. 59B zeigt „Schritt 1: Digest pU6-PEgRNA-GG-Vektorplasmid (Komponente 1)“. 59C zeigt „Schritte 2 und 3: Ordnen und anlagern der Oligonukleotidteile (Komponenten 2, 3 und 4)“. 59D zeigt „Schritt 2.b.ii.: sgRNA Gerüstphosphorylierung (unnötig, wenn die Oligonukleotide phosphoryliert gekauft wurden)“. 59E zeigt „Schritt 4: PEgRNA-Anordnung“. 59F zeigt „Schritte 5 und 6: Transformation von angeordneten Plasmiden“. 59G zeigt ein Diagramm mit einer Zusammenfassung des PEgRNA-Klonierungsprotokolls.
    • 60A-60B zeigen das Python-Skript zur Quantifizierung der PEgRNA-Gerüstintegration. Es wurde ein benutzerdefiniertes Python-Skript erstellt, um die PEgRNA-Insertionen an den genomischen Target-Loci zu charakterisieren und zu quantifizieren. Das Skript vergleicht iterativ Textstrings mit zunehmender Länge aus einer Referenzsequenz (Guide-RNA-Gerüstsequenz) mit den Sequenzierungs-Reads in fastq-Dateien und zählt die Anzahl der Sequenzierungs-Reads, die der Suchanfrage entsprechen. Jeder nachfolgender Textstring entspricht einem zusätzlichen Nukleotid der Gerüstsequenz der Guide-RNA. Auf diese Weise wurden exakte Längenintegrationen und kumulative Integrationen bis zu einer bestimmten Länge berechnet. Am Anfang der Referenzsequenz werden 5 bis 6 Basen des 3'-Endes des neuen, von der reversen Transkriptase synthetisierten DNA-Strangs eingeschlossen, um die Ausrichtung und die genaue Zählung der kurzen Abschnitte der sgRNA sicherzustellen.
    • 61 ist ein Diagramm, das den Prozentsatz der gesamten Sequenzierungs-Reads mit dem angegebenen Edit für SaCas9(N580A)-MMLV RT HEK3 +6 C>A zeigt. Dargestellt sind die Werte für die korrekten Edits sowie die Indels.
    • 62A-62B zeigen die Bedeutung des Protospacers für den effizienten Einbau eines gewünschten Edits an einer präzisen Stelle mit Prime Editing. 62A ist ein Diagramm, das den Prozentsatz der gesamten Sequenzierungs-Reads mit in A•T umgewandelten T•A-Basenpaaren für verschiedene HEK3-Loci zeigt. 62B ist eine Sequenzanalyse, die dasselbe zeigt.
    • 63 ist ein Diagramm, das die SpCas9 PAM-Varianten beim PAM-Editing zeigt (N=3). Der Prozentsatz der gesamten Sequenzierungs-Reads mit dem gezielten PAM-Edit ist für SpCas9(H840A)-VRQR-MMLV RT, wo NGA > NTA, und für SpCas9(H840A)-VRER-MMLV RT, wo NGCG > NTCG, dargestellt. Die Länge der PEgRNA-Primer-Bindungsstelle (PBS), die Länge des RT-Templates (RT) und das verwendete PE-System sind aufgeführt.
    • 64 ist ein Schema, das die Einführung verschiedener ortsspezifischer Rekombinase (SSR)-Targets in das Genom mit Hilfe von PE zeigt, (a) zeigt ein allgemeines Schema der Insertion einer Rekombinase-Target-Sequenz durch einen Prime Editor. (b) zeigt, wie ein einzelnes SSR-Target, das durch PE eingefügt wurde, als Ort für die genomische Integration eines DNA-Donor-Templates verwendet werden kann. (c) zeigt, wie eine Tandem-Insertion von SSR-Target-Stellen verwendet werden kann, um einen Teil des Genoms zu löschen, (d) zeigt, wie eine Tandem-Insertion von SSR-Target-Stellen verwendet werden kann, um einen Teil des Genoms umzukehren. (e) zeigt, wie die Insertion von zwei SSR-Target-Stellen an zwei distalen chromosomalen Regionen zu einer chromosomalen Translokation führen kann. (f) zeigt, wie die Insertion von zwei verschiedenen SSR-Target-Stellen in das Genom genutzt werden kann, um eine Kassette aus einem DNA-Donor-Template auszutauschen. Siehe Beispiel 17 für weitere Details.
    • 65 zeigt 1) die PE-vermittelte Synthese einer SSR-Target-Stelle in einem menschlichen Zellgenom und 2) die Verwendung dieser SSR-Target-Stelle zur Integration eines DNA-Donor-Templates mit einem GFP-Expressionsmarker. Nach erfolgreicher Integration lässt das GFP die Zelle fluoreszieren. Siehe Beispiel 17 für weitere Details.
    • 66 zeigt eine Ausführungsform eines Prime Editors in Form von zwei PE-Halbproteinen, die sich durch die Selbstspleißung der Split-Intein-Hälften, die sich am Ende oder am Anfang jedes der Prime-Editor-Halbproteine befinden, als ganzer Prime Editor regenerieren.
    • 67 zeigt den Mechanismus der Intein-Entfernung aus einer Polypeptidsequenz und die Neubildung einer Peptidbindung zwischen der N-terminalen und der C-terminalen Extein-Sequenz. (a) zeigt den allgemeinen Mechanismus zweier Halbproteine, die jeweils die Hälfte einer Intein-Sequenz enthalten. Wenn sie in einer Zelle miteinander in Kontakt kommen, entsteht ein voll funktionsfähiges Intein, das sich dann Seblst-Spleißen und Exzision unterzieht. Der Prozess der Exzision führt zur Bildung einer Peptidbindung zwischen der N-terminalen Proteinhälfte (oder dem „N-Extein“) und der C-terminalen Proteinhälfte (oder dem „C-Extein“), um ein ganzes, einzelnes Polypeptid zu bilden, das den N-Extein- und den C-Extein-Teil umfasst. In verschiedenen Ausführungsformen kann das N-Extein der N-terminalen Hälfte eines Split Prime Editor-Fusionsproteins entsprechen und das C-Extein der C-terminalen Hälfte eines Split Prime Editors. (b) zeigt einen chemischen Mechanismus der Intein-Exzision und der Neubildung einer Peptidbindung, die die N-Extein-Hälfte (die rot gefärbte Hälfte) und die C-Extein-Hälfte (die blau gefärbte Hälfte) miteinander verbindet. Die Exzision der gespaltenen Inteine (d. h. des N-Inteins und des C-Inteins in der gespaltenen Intein-Konfiguration) kann auch als „Trans-Spleißung“ bezeichnet werden, da sie die Spleiß-Aktion von zwei separaten, in trans angeordneten Komponenten beinhaltet.
    • 68A zeigt, dass die Verabreichung der beiden gespaltenen Intein-Hälften von SpPE (SEQ ID NO: 762) am Linker die Aktivität an drei Testloci aufrecht erhält, wenn es in HEK293T-Zellen co-transfiziert wird.
    • 68B zeigt, dass die Verabreichung der beiden gespaltenen Intein-Hälften von SaPE2 (z. B. SEQ ID NO: 443 und SEQ ID NO: 450) rekapitulieren die Aktivität von SaPE2 in voller Länge (SEQ ID NO: 134) bei der Co-Transfektion in HEK293T-Zellen. Die in Anführungszeichen angegebenen Reste sind die Sequenz der Aminosäuren 741-743 in SaCas 9 (erste Reste des C-terminalen Exteins), die für die Trans-Spleißreaktion des Inteins wichtig sind. „SMP“ sind die nativen Reste, die wir ebenfalls zur „CFN“-Konsensus-Spleißsequenz mutiert haben. Es zeigt sich, dass die Konsenssequenz, gemessen am Prozentsatz des Prime Editing, die höchste Rekonstitution ergibt.
    • 68C stellt Daten bereit, die zeigen, dass verschiedene offenbarte PE-Ribonukleoprotein-Komplexe (PE2 in hoher Konzentration, PE3 in hoher Konzentration und PE3 in niedriger Konzentration) auf diese Weise verabreicht werden können.
    • 69 zeigt einen Bakteriophagen-Plaque-Assay zur Bestimmung der Wirksamkeit von PE bei PANCE. Plaques (dunkle Kreise) weisen auf Phagen hin, die E. coli erfolgreich infizieren können. Eine steigende Konzentration von L-Rhamnose führt zu einer erhöhten Expression von PE und einer Zunahme der Plaquebildung. Die Sequenzierung der Plaques zeigte das Vorhandensein des PE-installierten genomischen Edits.
    • 70A-70I zeigen ein Beispiel einer editierten Target-Sequenz zur Veranschaulichung einer Schritt-für-Schritt-Anleitung für das Design von PEgRNAs und Nicking-sgRNAs für das Prime Editing. 70A: Schritt 1. Definieren der Target-Sequenz und des Edits. Die Sequenz der Target-DNA-Region (~200bp), die um die Stelle der gewünschten Änderung (Punktmutation, Insertion, Deletion oder eine Kombination davon) zentriert ist, muss abgerufen werden. 70B: Schritt 2. Target-PAMs lokalisieren. Identifizieren von PAMs in der Nähe des Edit-Ortes. PAMs müssen auf beiden Strängen gesucht werden. Während PAMs in der Nähe der Edit-Position bevorzugt werden, ist es möglich, Edits mit Protospacem und PAMs zu installieren, die den Nick ≥ 30 nt von der Edit-Position platzieren. 70C: Schritt 3. Nick-Stellen lokalisieren. Für jede in Frage kommende PAM die entsprechende Nick-Stelle identifizieren. Bei der Nickase Sp Cas9 H840A erfolgt die Spaltung im PAM-haltigen Strang zwischen der 3. und 4. Base 5' zur NGG PAM. Alle editierten Nukleotide müssen 3' von der Nick-Stelle entfernt sein, so dass geeignete PAMs den Nick 5' zum Target-Edit auf dem PAM-haltigen Strang platzieren müssen. In dem unten gezeigten Beispiel gibt es zwei mögliche PAMs. Der Einfachheit halber werden die verbleibenden Schritte das Design einer PEgRNA nur mit PAM 1 demonstrieren. 70D: Schritt 4. Entwerfen der Spacer-Sequenz. Der Protospacer von Sp Cas9 entspricht den 20 Nukleotiden 5' zum NGG PAM auf dem PAM-haltigen Strang. Für eine effiziente Pol III-Transkriptionsinitiierung muss ein G das erste transkribierte Nukleotid sein. Wenn das erste Nukleotid des Protospacers ein G ist, ist die Spacer-Sequenz für die PEgRNA einfach die Protospacer-Sequenz. Wenn das erste Nukleotid des Protospacers nicht G ist, ist die Spacer-Sequenz der PEgRNA G, gefolgt von der Protospacer-Sequenz. 70E: Schritt 5. Entwerfen der Primer-Bindungsstelle (PBS). Anhand der Ausgangssequenz des Allels den DNA-Primer auf dem PAM-haltigen Strang identifizieren. Das 3'-Ende des DNA-Primers ist das Nukleotid unmittelbar stromaufwärts der Nick-Stelle (d. h. die 4. Base 5' zur NGG PAM für Sp Cas9). Als allgemeines Designprinzip für die Verwendung mit PE2 und PE3 kann eine PEgRNA-Primer-Bindungsstelle (PBS) mit 12 bis 13 Nukleotiden Komplementarität zum DNA-Primer für Sequenzen verwendet werden, die -40-60 % GC-Gehalt enthalten. Für Sequenzen mit niedrigem GC-Gehalt sollten längere (14- bis 15-nt) PBSs getestet werden. Für Sequenzen mit höherem GC-Gehalt sollten kürzere (8- bis 11-nt) PBSs getestet werden. Optimale PBS-Sequenzen sollten unabhängig vom GC-Gehalt empirisch ermittelt werden. Um eine Länge-p-PBS-Sequenz zu entwerfen, wird das umgekehrte Komplement der ersten p- Nukleotide 5' der Nick-Stelle im PAM-haltigen Strang unter Verwendung der Start-Allel-Sequenz verwendet. 70F: Schritt 6. Entwerfen des RT-Templates. Das RT-Template codiert das entworfene Edit und die Homologie zu der Sequenz, die an das Edit angrenzt. Die optimale Länge des RT-Templates hängt von der Target-Stelle ab. Für Edits mit kurzer Reichweite (Positionen +1 bis +6) empfiehlt es sich, ein kurzes (9 bis 12 nt), ein mittleres (13 bis 16 nt) und ein langes (17 bis 20 nt) RT-Template zu testen. Für weitreichende Edits (Positionen +7 und darüber hinaus) wird empfohlen, RT-Templates zu verwenden, die mindestens 5 nt (vorzugsweise 10 oder mehr nt) über die Position des Edits hinausreichen, um eine ausreichende 3'-DNA-Flap-Homologie zu gewährleisten. Für langfristige Edits sollten mehrere RT-Templates geprüft werden, um funktionale Designs zu identifizieren. Für größere Insertionen und Deletionen (≥5 nt) wird empfohlen, eine größere 3'-Homologie (~20 nt oder mehr) in das RT-Template einzubauen. Die Editing-Effizienz ist in der Regel beeinträchtigt, wenn das RT-Template für die Synthese eines G als letztes Nukleotid im revers transkribierten DNA-Produkt codiert (entsprechend einem C in dem RT-Template der PEgRNA). Da viele RT-Templates ein effizientes Prime Editing unterstützen, wird empfohlen, bei der Entwicklung von RT-Templates G als letztes synthetisiertes Nukleotid zu vermeiden. Um eine RT-Template-Sequenz der Länge r zu entwerfen, verwenden Sie die gewünschte Allelsequenz und nehmen das umgekehrte Komplement der ersten r-Nukleotide 3' der Nick-Stelle in dem Strang, der ursprünglich die PAM enthielt. Es ist zu beachten, dass im Vergleich zu SNP-Edits Insertions- oder Deletions-Edits mit RT-Templates gleicher Länge keine identische Homologie aufweisen. 70G: Schritt 7. Zusammenbau der vollständigen PEgRNA-Sequenz. Verketten der PEgRNA-Komponenten in der folgenden Reihenfolge (5' bis 3'): Spacer, Gerüst, RT-Template und PBS. 70H: Schritt 8. Design von Nicking-sgRNAs für PE3. Identifizieren der PAMs auf dem nicht-editierten Strang stromaufwärts und stromabwärts des Edits. Optimale Nicking-Positionen sind stark ortsabhängig und sollten empirisch ermittelt werden. Im Allgemeinen führen Nicks, die 40 bis 90 Nukleotide 5' von der Position gegenüber dem PEgRNA-induzierten Nick platziert sind, zu höheren Editing-Erträgen und weniger Indels. Eine Nicking-sgRNA hat eine Spacer-Sequenz, die mit dem 20-nt-Protospacer im Auszanzs-Allel übereinstimmt, wobei ein 5'-G hinzugefügt wird, wenn der Protospacer nicht mit einem G beginnt. 70I: Schritt 9. Design von PE3b Nicking-sgRNAs. Wenn ein PAM im komplementären Strang existiert und der entsprechende Protospacer sich mit der zu editierenden Sequenz überschneidet, könnte dieses Edit ein Kandidat für das PE3b-System sein. Beim PE3b-System stimmt die Spacer-Sequenz der Nicking-sgRNA mit der Sequenz des gewünschten editierten Allels überein, aber nicht mit dem Ausgangsallel. Das PE3b-System arbeitet effizient, wenn das/die editierte(n) Nukleotid(e) innerhalb der Seed-Region (~10 nt neben der PAM) des Nicking-sgRNA-Protospacers liegt/liegen. Dadurch wird das Nicking des komplementären Strangs erst nach dem Einbau des editierten Strangs verhindert und die Konkurrenz zwischen der PEgRNA und der sgRNA um die Bindung der Target-DNA unterbunden. PE3b vermeidet auch die Erzeugung gleichzeitiger Nicks auf beiden Strängen, wodurch die Indel-Bildung deutlich reduziert wird und gleichzeitig eine hohe Editing-Effizienz erhalten bleibt. PE3b sgRNAs sollten eine Spacer-Sequenz haben, die mit dem 20-nt-Protospacer im gewünschten Allel übereinstimmt, mit dem Zusatz eines 5'-G, falls erforderlich.
    • 71A zeigt die Nukleotidsequenz eines SpCas9 PEgRNA-Moleküls (oben), das am 3'-Ende mit einem „UUU“ endet und kein Toeloop-Element enthält. Der untere Teil der Figur zeigt dasselbe SpCas9 PEgRNA-Molekül, das jedoch so modifiziert ist, dass es ein Toeloop-Element mit der Sequenz 5'-„GAAANNNNN“-3' unmittelbar vor dem 3'-Ende „UUU“ enthält. Das „N“ kann eine beliebige Nukleobase sein.
    • 71B zeigt die Ergebnisse von Beispiel 18, die zeigen, dass die Effizienz des Prime Editing in HEK-Zellen oder EMX-Zellen durch die Verwendung von PEgRNA, die Toeloop-Elemente enthält, erhöht wird, während der Prozentsatz der Indelbildung weitgehend unverändert bleibt.
    • 72 zeigt alternative PEgRNA-Konfigurationen, die beim Prime Editing verwendet werden können. (a) Zeigt die PE2:PEgRNA-Variante des Prime Editing. Bei dieser Ausführungsform wird ein PE2 (ein Fusionsprotein, das ein Cas9 und eine reverse Transkriptase umfasst) mit einer PEgRNA komplexiert (wie auch in 1A-1I und/oder 3A-3E) beschrieben. In dieser Ausführungsform wird das Template für die reverse Transkription in einen 3'-Extesion-Arm der sgRNA eingebaut, um die PEgRNA herzustellen, und das DNA-Polymerase-Enzym ist eine direkt mit Cas9 fusionierte reverse Transkriptase (RT). (b) Zeigt die MS2cp-PE2:sgRNA + tPERT-Variante. Diese Ausführungsform umfasst eine PE2-Fusion (Cas9 + eine reverse Transkriptase), die weiter mit dem MS2-Bakteriophagen-Hüllprotein (MS2cp) fusioniert ist, um das MS2cp-PE2-Fusionsprotein zu bilden. Um Prime Editing zu erreichen, wird das MS2cp-PE2-Fusionsprotein mit einer sgRNA komplexiert, die den Komplex auf eine bestimmte Target-Stelle in der DNA ausrichtet. Die Ausführungsform beinhaltet dann die Einführung eines trans Prime Editing RNA-Templates („tPERT“), das anstelle einer PEgRNA wirkt, indem sie eine Primer-Bindungsstelle (PBS) und ein DNA-Synthese-Template auf einem separaten Molekül bereitstellt, d. h. das tPERT, das auch mit einem MS2-Aptamer (Stammschleife) ausgestattet ist. Das MS2cp-Protein rekrutiert das tPERT durch Bindung an das MS2-Aptamer des Moleküls. (c) Zeigt alternative Designs für PEgRNAs, die durch bekannte Verfahren zur chemischen Synthese von Nukleinsäuremolekülen erreicht werden können. So kann zum Beispiel durch chemische Synthese ein hybrides RNA/DNA PEgRNA-Molekül zur Verwendung beim Prime Editing synthetisiert werden, wobei der Extension-Arm der hybriden PEgRNA aus DNA statt aus RNA besteht. In einer solchen Ausführungsform kann eine DNA-abhängige DNA-Polymerase anstelle einer reversen Transkriptase verwendet werden, um den 3'-DNA-Flap zu synthetisieren, der die gewünschte genetische Änderung umfasst, die durch Prime Editing gebildet wird. In einer anderen Ausführungsform kann der Extension-Arm so synthetisiert werden, dass er einen chemischen Linker beinhaltet, der die DNA-Polymerase (z. B. eine reverse Transkriptase) daran hindert, das sgRNA-Gerüst oder -Grundgerüst als Template zu verwenden. In einer weiteren Ausführungsform kann der Extension-Arm ein DNA-Synthese-Template umfassen, das im Vergleich zur Gesamtausrichtung des PEgRNA-Moleküls die umgekehrte Orientierung aufweist. Zum Beispiel, und wie für eine PEgRNA in der 5'-zu-3'-Ausrichtung und mit einer Extension, die an das 3'-Ende des sgRNA-Gerüsts angehängt ist, gezeigt, ist das DNA-Synthese-Template in der entgegengesetzten Richtung orientiert, d. h. in der 3'-zu-5'-Richtung. Diese Ausführungsform kann für PEgRNA-Varianten mit Extension-Armen am 3'-Ende einer gRNA von Vorteil sein. Durch die Umkehrung der Ausrichtung des Extension-Arms wird die DNA-Synthese durch die Polymerase (z. B. die reverse Transkriptase) beendet, sobald sie die neu ausgerichteten 5' des Extension-Arms erreicht, so dass der gRNA-Kern nicht als Template verwendet werden kann.
    • 73 stellt das Prime Editing mit tPERTs und dem MS2-Rekrutierungssystem (auch bekannt als MS2-Tagging-Technik) dar. Eine sgRNA, die das Primer-Editor-Protein (PE2) auf den Target-Locus ausrichtet, wird in Kombination mit einem tPERT exprimiert, das eine Primer-Bindungsstelle (eine 13-nt oder 17-nt PBS), ein RT-Template, das eine His6-Tag-Insertion und einen Homologiearm codiert, und ein MS2-Aptamer (am 5'- oder 3'-Ende des tPERT-Moleküls) enthält. Es wurde entweder das Prime-Editor-Protein (PE2) oder eine Fusion des MS2cp mit dem N-Terminus von PE2 verwendet. Das Editing wurde mit oder ohne eine komplementäre Strang-Nicking-sgRNA durchgeführt, wie bei dem zuvor entwickelten PE3-System (in der x-Achse als „PE2+-Nick“ bzw. „PE2“ bezeichnet). Dies wird hier auch als „Zweites Strang-Nicking“ bezeichnet und definiert.
    • 74 stellt die MS2-Aptamer-Expression der reversen Transkriptase in trans und ihre Rekrutierung mit dem MS2-Aptamer-System dar. Die PEgRNAPEgRNA enthält das MS2 RNA-Aptamer, das in eine von zwei sgRNA-Gerüst-Haarnadeln eingefügt ist. Die Wildtyp M-MLV reverse Transkriptase wird als N-terminale oder C-terminale Fusion mit dem MS2-Hüllprotein (MCP) exprimiert. Das Editing erfolgt an der HEK3-Stelle in HEK293T-Zellen.
    • 75 zeigt ein Balkendiagramm, in dem die Effizienz (d. h. „% der gesamten Sequenzierungs-Reads mit dem angegebenen Edit oder Indels“) von PE2, PE2-Trunc, PE3 und PE3-Trunc über verschiedene Target-Stellen in verschiedenen Zelllinien verglichen wird. Die Daten zeigen, dass die Prime-Editoren, die die verkürzten RT-Varianten umfassen, etwa genauso effizient waren wie die Prime-Editoren, die die nicht verkürzten RT-Proteine umfassen.
    • 76 stellt die Editing-Effizienz von intein-gespaltenen Prime-Editoren für Beispiel 20 dar. HEK239T-Zellen wurden mit Plasmiden transfiziert, die für PE2 in voller Länge oder inteingespaltenes PE2, PEgRNA und Nicking-Guide-RNA codieren. Die Konsenssequenz (die meisten aminoterminalen Reste des C-terminalen Exteins) sind angegeben. Das prozentuale Editing an zwei Stellen wird gezeigt: HEK3 +1 CTT-Insertion und PRNP +6 G zu T. Replikat n=3 unabhängige Transfektionen. Siehe Beispiel 20.
    • 77 stellt die Editing-Effizienz von intein-gespaltenen Prime-Editoren für Beispiel 20 dar. Das Editing wurde durch gezielte Tiefensequenzierung im Bulk-Cortex und in der GFP+ Subpopulation nach der Verabreichung von 5E10vg pro SpPE3-Hälfte und einer kleinen Menge 1E10 von nukleär lokalisiertem GFP:KASH an P0-Mäuse durch ICV-Injektion bewertet. Editoren und GFP wurden in AAV9 mit EFS-Promotor verpackt. Die Mäuse wurden drei Wochen nach der Injektion geerntet und die GFP+ Kerne wurden mittels Durchflusszytometrie isoliert. Es werden einzelne Datenpunkte gezeigt, wobei 1-2 Mäuse pro Bedingung analysiert werden. Siehe Beispiel 20.
    • 78 stellt die Editing-Effizienz von intein-gespaltenen Prime-Editoren von Beispiel 20 dar. Die Figuren zeigen insbesondere die in Beispiel 20 verwendeten AAV-Split-SpPE3-Konstrukte. Die Co-Transduktion durch AAV-Partikel, die SpPE3-N und SpPE3-C getrennt exprimieren, rekapituliert die PE3-Aktivität. Anmerkung: Das N-terminale Genom enthält eine U6-sgRNA-Kassette, die die Nicking-sgRNA exprimiert, und das C-terminale Genom enthält eine U6-PEgRNA-Kassette, die die PEgRNA exprimiert. Siehe Beispiel 20.
    • 79 zeigt die Editing-Effizienz bestimmter optimierter Linker, wie in Beispiel 21 beschrieben. Die Daten zeigen insbesondere die Editing-Effizienz des PE2-Konstrukts mit dem aktuellen Linker (vermerkt als PE2 - weißer Kasten) im Vergleich zu verschiedenen Versionen, bei denen der Linker durch eine Sequenz ersetzt wurde, wie an den HEK3-, EMX1-, FANCF- und RNF2-Loci für repräsentative PEgRNAs für Transitions-, Transversions-, Insertions- und Deletions-Edits angegeben. Die Ersatzlinker werden als „1x SGGS“, „2x SGGS“, „3x SGGS“, „1x XTEN“, „kein Linker“, „1x Gly“, „1x Pro“, „1x EAAAK“, „2x EAAAK“, und „3x EAAAK“ bezeichnet. Die Editing-Effizienz wird in Form eines Balkendiagramms im Verhältnis zur „Kontroll“-Editing-Effizienz von PE2 gemessen. Der Linker von PE2 ist SGGSSGGSSGSETPGTSESATPESSGGSSGGSS (SEQ ID NO: 127). Das gesamte Editing erfolgte im Kontext des PE3-Systems, d. h. mit dem PE2-Editing-Konstrukt und dem Zusatz der optimalen sekundären sgRNA-Nicking-Guide. Siehe Beispiel 21.
    • 80. Nimmt man die durchschnittliche Fold-Effizienz im Vergleich zu PE2, so ergibt sich das gezeigte Diagramm. Es zeigt, dass die Verwendung einer 1x XTEN-Linkersequenz die Editing-Effizienz im Durchschnitt um das 1,14-fache verbessert (n=15). Siehe Beispiel 21.
    • 81 zeigt das Transkriptionsniveau von PEgRNAs von verschiedenen Promotoren, wie in Beispiel 22 beschrieben.
    • 82 Wie in Beispiel 22 dargestellt, wirken sich verschiedene Arten von Modifikationen der PEgRNA-Struktur auf die Editing-Effizienz im Vergleich zu unmodifizierter PEgRNA aus.
    • 83 Zeigt ein PE-Experiment, bei dem das HEK3-Gen gezielt editiert wurde, und zwar durch Insertion einer 10-nt-Insertion an Position +1 relativ zur Nick-Stelle und unter Verwendung von PE3. Siehe Beispiel 22.
    • 84A zeigt eine beispielhafte PEgRNA mit einem Spacer, einem gRNA-Kern und einem Extension-Arm (RT-Template + Primer-Bindungsstelle), der am 3'-Ende der PEgRNA mit einem tRNA-Molekül modifiziert und über einen UCU-Linker gekoppelt ist. Die tRNA beinhaltet verschiedene post-transkriptionelle Modifikationen. Diese Änderungen sind jedoch nicht erforderlich.
    • 84B zeigt die Struktur der tRNA, die zur Änderung der PEgRNA-Strukturen verwendet werden kann. Siehe Beispiel 22. Der P1 kann in der Länge variabel sein. Das P1 kann erweitert werden, um die RNAseP-Prozessierung der PEgRNA-tRNA-Fusion zu verhindern.
    • 85 zeigt ein PE-Experiment, das auf das Editing des FANCF-Gens abzielt, und zwar durch eine G-zu-T-Umwandlung an Position +5 relativ zur Nick-Stelle und unter Verwendung des PE3-Konstrukts. Siehe Beispiel 22.
    • 86 zeigt ein PE-Experiment, bei dem das HEK3-Gen gezielt editiert wurde, und zwar durch Insertion einer 71-nt-FLAG-Tag-Insertion an Position +1 relativ zur Nick-Stelle und unter Verwendung eines PE3-Konstrukts. Siehe Beispiel 22.
    • 87 ergibt sich aus einem Screening in N2A-Zellen, bei dem die pegRNA 1412Adel einbaut, mit Angaben zur Länge der Primer-Bindungsstelle (PBS) und der Länge des Reversen Transkriptase (RT)-Templates. (Gezeigt mit und ohne Indels). Siehe Beispiel 23.
    • 88 ergibt sich aus einem Screening in N2A-Zellen, bei dem die pegRNA 1412Adel einbaut, mit Angaben zur Länge der Primer-Bindungsstelle (PBS) und der Länge des Reversen Transkriptase (RT)-Templates. (Gezeigt mit und ohne Indels). Siehe Beispiel 23.
    • 89 veranschaulicht die Ergebnisse des Editings an einem Proxy-Locus im β-Globin-Gen und an HEK3 in gesunden HSCs, wobei die Konzentration des Editors an pegRNA und Nicking-gRNA variiert wurde. Siehe Beispiel 23.
  • DEFINITIONEN
  • Sofern nicht anders angegeben, haben alle hierin verwendeten technischen und wissenschaftlichen Begriffe in der Regel die Bedeutung, die von einem Fachmann verstanden, zu welchem diese Erfindung gehört. Die folgenden Referenzen stellen dem Fachmann eine allgemeine Definition vieler der in dieser Erfindung verwendeten Begriffe bereit: Singleton et al., Dictionary of Microbiology and Molecular Biology (2. Aufl. 1994); The Cambridge Dictionary of Science and Technology (Walker Hrsg., 1988); The Glossary of Genetics, 5. Aufl., R. Rieger et al. (Hrsg.), Springer Verlag (1991); und Hale & Marham, The Harper Collins Dictionary of Biology (1991). Wie hierin verwendet, weisen die folgenden Begriffe die ihnen zugewiesenen Bedeutungen auf, sofern nicht anders angegeben.
  • Antisense-Strang
  • In der Genetik ist der „Antisense“-Strang eines Segments innerhalb der Doppelstrang-DNA der Template-Strang, der in der Richtung 3' zu 5' verläuft. Im Gegensatz dazu ist der „Sense“-Strang das Segment innerhalb der Doppelstrang-DNA, das von 5' nach 3' verläuft und das komplementär zum Antisense-Strang der DNA, dem Template-Strang, ist, der von 3' nach 5' verläuft. Im Falle eines DNA-Segments, das für ein Protein codiert, ist der Sense-Strang der DNA-Strang, der die gleiche Sequenz wie die mRNA hat, die während der Transkription den Antisense-Strang als Template verwendet und schließlich (typischerweise, aber nicht immer) in ein Protein übersetzt wird. Der Antisense-Strang ist also für die RNA verantwortlich, die später in Protein übersetzt wird, während der Sense-Strang einen nahezu identischen Aufbau wie die mRNA besitzt. Es ist zu beachten, dass es für jedes Segment der dsDNA möglicherweise zwei Sätze von Sense und Antisense gibt, je nachdem, in welche Richtung gelesen wird (da Sense und Antisense relativ zur Perspektive sind). Letztlich ist es das Genprodukt, die mRNA, die bestimmt, welcher Strang eines dsDNA-Segments als Sense oder Antisense bezeichnet wird.
  • Bispezifischer Ligand
  • Der Begriff „bispezifischer Ligand“ oder „bispezifischer Anteil“, wie er hier verwendet wird, bezieht sich auf einen Liganden, der an zwei verschiedene ligandenbindende Domänen bindet. In bestimmten Ausführungsformen ist der Ligand eine kleine Molekülverbindung, ein Peptid oder ein Polypeptid. In anderen Ausführungsformen ist die ligandenbindende Domäne eine „Dimerisierungsdomäne“, die als Peptid-Tag in ein Protein eingebaut werden kann. In verschiedenen Ausführungsformen können zwei Proteine, die jeweils die gleichen oder unterschiedliche Dimerisierungsdomänen umfassen, durch die Bindung jeder Dimerisierungsdomäne an den bispezifischen Liganden zur Dimerisierung veranlasst werden. Der hier verwendete Begriff „bispezifische Liganden“ kann sich auch auf „chemische Auslöser der Dimerisierung“ oder „CIDs“ beziehen.
  • Cas9
  • Der Begriff „Cas9“ oder „Cas9-Nuklease“ bezieht sich auf eine RNA-gesteuerte Nuklease, die eine Cas9-Domäne oder ein Fragment davon umfasst (z. B. ein Protein, das eine aktive oder inaktive DNA-Spaltungsdomäne von Cas9 und/oder die gRNA-Bindungsdomäne von Cas9 umfasst). Eine „Cas9-Domäne“, wie hier verwendet, ist ein Proteinfragment, das eine aktive oder inaktive Spaltungsdomäne von Cas9 und/oder die gRNA-Bindungsdomäne von Cas9 umfasst. Ein „Cas9-Protein“ ist ein Cas9-Protein in voller Länge. Eine Cas9-Nuklease wird manchmal auch als casn1-Nuklease oder als CRISPR (Clustered Regularly Interspaced Short Palindromic Repeat)-assoziierte Nuklease bezeichnet. CRISPR ist ein adaptives Immunsystem, das Schutz gegen mobile genetische Elemente (Viren, transponierbare Elemente und konjugative Plasmide) bereitstellt. CRISPR-Cluster enthalten Spacer, d. h. Sequenzen, die komplementär zu vorhergehenden mobilen Elementen sind, und zielen auf eindringende Nukleinsäuren ab. CRISPR-Cluster werden transkribiert und zu CRISPR-RNA (crRNA) verarbeitet. In CRISPR-Systemen vom Typ II erfordert die korrekte Verarbeitung der prä-crRNA eine trans-codierte kleine RNA (tracrRNA), endogene Ribonuklease 3 (rnc) und eine Cas9-Domäne. Die tracrRNA dient als Leitfaden für die Ribonuklease 3-gestützte Verarbeitung der prä-crRNA. Anschließend spaltet Cas9/crRNA/tracrRNA endonukleolytisch lineare oder zirkuläre dsDNA, die komplementär zum Spacer ist. Der Target-Strang, der nicht komplementär zur crRNA ist, wird zunächst endonukleolytisch geschnitten und dann exonukleolytisch auf 3'-5' gekürzt. In der Natur werden für die Bindung und Spaltung von DNA normalerweise Proteine und RNAs benötigt. Einzelne Guide-RNAs („sgRNA“ oder einfach „gNRA“) können jedoch so konstruiert werden, dass sie Aspekte sowohl der crRNA als auch der tracrRNA in eine einzige RNA-Spezies einbringen. Siehe z. B. Jinek M., Chylinski K., Fonfara I., Hauer M., Doudna J.A., Charpentier E. Science 337:816-821(2012), dessen gesamter Inhalt hiermit durch Bezugnahme aufgenommen wird. Cas9 erkennt ein kurzes Motiv in den CRISPR-Wiederholungssequenzen (das PAM- oder Protospacer-benachbartes Motiv), um zwischen selbst und nicht selbst zu unterscheiden. Die Sequenzen und Strukturen der Cas9-Nuklease sind dem Fachmann gut bekannt (siehe z .B. „Complete genome sequence of an M1 strain of Streptococcus pyogenes.“ Ferretti et al., J.J., McShan W.M., Ajdic D.J., Savic D.J., Savic G., Lyon K., Primeaux C., Sezate S., Suvorov A.N., Kenton S., Lai H.S., Lin S.P., Qian Y., Jia H.G., Najar F.Z., Ren Q., Zhu H., Song L., White J., Yuan X., Clifton S.W., Roe B.A., McLaughlin R.E., Proc. Natl. Acad. Sci. U.S.A. 98:4658-4663(2001); „CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III.“ Deltcheva E., Chylinski K., Sharma C.M., Gonzales K., Chao Y., Pirzada Z.A., Eckert M.R., Vogel J., Charpentier E., Nature 471:602-607(2011); und „A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity.“ Jinek M., Chylinski K., Fonfara I., Hauer M., Doudna J.A., Charpentier E. Science 337:816-821(2012), deren gesamter Inhalt hier durch Verweis aufgenommen wird). Cas9-Orthologe wurden in verschiedenen Spezies beschrieben, einschließlich, aber nicht beschränkt auf S. pyogenes und S. thermophilus. Weitere geeignete Cas9-Nukleasen und -Sequenzen sind für Fachleute auf der Grundlage dieser Offenbarung ersichtlich. Zu diesen Cas9-Nukleasen und - Sequenzen gehören Cas9-Sequenzen aus den Organismen und Loci, die in Chylinski, Rhun und Charpentier, „The tracrRNA and Cas9 families of type II CRISPR-Cas immunity systems“ (2013) RNA Biology 10:5, 726-737, offenbart sind, deren gesamter Inhalt hier durch Bezugnahme aufgenommen ist. In einigen Ausführungsformen umfasst eine Cas9-Nuklease eine oder mehrere Mutationen, die die DNA-Spaltungsdomäne teilweise beeinträchtigen oder inaktivieren.
  • Eine nuklease-inaktivierte Cas9-Domäne kann auch als „dCas9“-Protein (für nuklease„totes“ Cas9) bezeichnet werden. Verfahren zur Erzeugung einer Cas9-Domäne (oder eines Fragments davon) mit einer inaktiven DNA-Spaltungsdomäne sind bekannt (siehe z. B. Jinek et al., Science. 337:816-821(2012); Qi et al., „Repurposing CRISPR as an RNA-Guided Platform for Sequence-Specific Control of Gene Expression“ (2013) Cell. 28; 152(5): 1173-83, deren gesamter Inhalt hier durch Bezugnahme aufgenommen wird). So ist zum Beispiel bekannt, dass die DNA-Spaltungsdomäne von Cas9 zwei Subdomänen umfasst, die HNH-Nuklease-Subdomäne und die RuvC1-Subdomäne. Die HNH-Subdomäne spaltet den zur gRNA komplementären Strang, während die RuvC1-Subdomäne den nicht komplementären Strang spaltet. Mutationen innerhalb dieser Subdomänen können die Nukleaseaktivität von Cas9 zum Schweigen bringen. Die Mutationen D10A und H840A zum Beispiel inaktivieren die Nukleaseaktivität von S. pyogenes Cas9 vollständig (Jinek et al., Science. 337:816-821(2012); Qi et al., Cell. 28;152(5):1173-83 (2013)). In einigen Ausführungsformen werden Proteine bereitgestellt, die Fragmente von Cas9 umfassen. In einigen Ausführungsformen umfasst ein Protein zum Beispiel eine von zwei Cas9-Domänen: (1) die gRNA-Bindungsdomäne von Cas9; oder (2) die DNA-Spaltungsdomäne von Cas9. In einigen Ausführungsformen werden Proteine, die Cas9 oder Fragmente davon enthalten, als „Cas9-Varianten“ bezeichnet. Eine Cas9-Variante weist eine Homologie zu Cas9 oder einem Fragment davon auf. Zum Beispiel ist eine Cas9-Variante mindestens etwa 70 % identisch, mindestens etwa 80 % identisch, mindestens etwa 90 % identisch, mindestens etwa 95 % identisch, mindestens etwa 96 % identisch, mindestens etwa 97 % identisch, mindestens etwa 98 % identisch, mindestens etwa 99 % identisch, mindestens etwa 99,5 % identisch, mindestens etwa 99,8 % identisch oder mindestens etwa 99,9 % identisch mit Wildtyp-Cas9 (z. B. SpCas9 von SEQ ID NO: 18). In einigen Ausführungsformen kann die Cas9-Variante 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 21, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50 oder mehr Aminosäureänderungen im Vergleich zum Wildtyp-Cas9 (z. B., SpCas9 von SEQ ID NO: 18) aufweisen. In einigen Ausführungsformen umfasst die Cas9-Variante ein Fragment von SEQ ID NO: 18 Cas9 (z. B. eine gRNA-Bindungsdomäne oder eine DNA-Spaltungsdomäne), so dass das Fragment zu mindestens etwa 70 % identisch, zu mindestens etwa 80 % identisch, zu mindestens etwa 90 % identisch, zu mindestens etwa 95 % identisch, zu mindestens etwa 96 % identisch, zu mindestens etwa 97 % identisch, zu mindestens etwa 98 % identisch, zu mindestens etwa 99 % identisch, zu mindestens etwa 99,5 % identisch oder zu mindestens etwa 99,9 % identisch mit dem entsprechenden Fragment von Wildtyp-Cas9 ist (z. B. SpCas9 von SEQ ID NO: 18). In einigen Ausführungsformen ist das Fragment mindestens 30 %, mindestens 35 %, mindestens 40 %, mindestens 45 %, mindestens 50 %, mindestens 55 %, mindestens 60 %, mindestens 65 %, mindestens 70 %, mindestens 75 %, mindestens 80 %, mindestens 85 %, mindestens 90 %, mindestens 95 % identisch, mindestens 96 %, mindestens 97 %, mindestens 98 %, mindestens 99 % oder mindestens 99,5 % der Aminosäurelänge eines entsprechenden Wildtyp-Cas9 (z. B. SpCas9 von SEQ ID NO: 18).
  • cDNA
  • Der Begriff „cDNA“ bezieht sich auf einen DNA-Strang, der von einem RNA-Template kopiert wurde. cDNA ist komplementär zum RNA-Template.
  • Kreisförmiger Permutant
  • Wie hier verwendet, bezieht sich der Begriff „kreisförmiger Permutant“ auf ein Protein oder Polypeptid (z. B. Cas9), das eine kreisförmige Permutation aufweist, d. h. eine Änderung der strukturellen Konfiguration des Proteins, die eine Änderung der Reihenfolge der Aminosäuren in der Aminosäuresequenz des Proteins beinhaltet. Mit anderen Worten, kreisförmige Permutanten sind Proteine, die im Vergleich zu ihrem Wildtyp-Gegenstück veränderte N- und C-Termini aufweisen, z. B. wird die C-terminale Hälfte eines Proteins vom Wildtyp zur neuen N-terminalen Hälfte. Bei der kreisförmigen Permutation (oder CP) handelt es sich im Wesentlichen um die topologische Umstrukturierung der Primärsequenz eines Proteins, bei der der N- und C-Terminus miteinander verbunden werden, häufig mit einem Peptidlinker, während gleichzeitig die Sequenz an einer anderen Position geteilt wird, um neue, benachbarte N- und C-Termini zu schaffen. Das Ergebnis ist eine Proteinstruktur mit unterschiedlicher Konnektivität, die jedoch häufig die gleiche, insgesamt ähnliche dreidimensionale (3D) Form haben kann und möglicherweise verbesserte oder veränderte Eigenschaften aufweist, darunter eine geringere proteolytische Anfälligkeit, eine verbesserte katalytische Aktivität, eine veränderte Substrat- oder Ligandenbindung und/oder eine verbesserte Thermostabilität. Kreisförmige permutante Proteine können in der Natur vorkommen (z. B. Concanavalin A und Lektin). Darüber hinaus kann eine kreisförmige Permutation durch posttranslationale Modifikationen auftreten oder durch rekombinante Techniken erzeugt werden.
  • Kreisförmig permutiertes Cas9
  • Der Begriff „kreisförmig permutiertes Cas9“ bezieht sich auf jedes Cas9-Protein oder eine Variante davon, das als kreisförmiger Permutant auftritt, wobei seine N- und C-Termini topisch umgeordnet wurden. Solche kreisförmig permutierten Cas9-Proteine („CP-Cas9“) oder Varianten davon behalten die Fähigkeit, DNA zu binden, wenn sie mit einer Guide-RNA (gRNA) komplexiert sind. Siehe Oakes et al., „Protein Engineering of Cas9 for enhanced function,“ Methods Enzymol, 2014, 546: 491-511 und Oakes et al., „CRISPR-Cas9 Circular Permutants as Programmable Scaffolds for Genome Modification,“ Cell, Januar 10, 2019, 176: 254-267, die hier durch Bezugnahme aufgenommen sind. Die vorliegende Offenbarung berücksichtigt jedes bereits bekannte CP-Cas9 oder die Verwendung eines neuen CP-Cas9, solange das resultierende kreisförmig permutierte Protein die Fähigkeit behält, DNA zu binden, wenn es mit einer guide RNA (gRNA) komplexiert ist. Beispielhafte CP-Cas9-Proteine sind SEQ ID NOs: 77-86.
  • CRISPR
  • CRISPR ist eine Familie von DNA-Sequenzen (d. h. CRISPR-Cluster) in Bakterien und Archaeen, die Schnipsel früherer Infektionen durch ein Virus darstellen, das in den Prokaryoten eingedrungen ist. Die DNA-Bausteine werden von der prokaryontischen Zelle verwendet, um DNA von nachfolgenden Angriffen ähnlicher Viren zu erkennen und zu zerstören. Zusammen mit einer Reihe von CRISPR-assoziierten Proteinen (einschließlich Cas9 und dessen Homologen) und CRISPR-assoziierter RNA bilden sie ein prokaryontisches Immunabwehrsystem. In der Natur werden CRISPR-Cluster transkribiert und zu CRISPR-RNA (crRNA) verarbeitet. In bestimmten Arten von CRISPR-Systemen (z. B. CRISPR-Systeme vom Typ II), erfordert die korrekte Verarbeitung der prä-crRNA eine trans-codierte kleine RNA (tracrRNA), endogene Ribonuklease 3 (rnc) und ein Cas9-Protein. Die tracrRNA dient als Leitfaden für die Ribonuklease 3-gestützte Verarbeitung der prä-crRNA. Anschließend spaltet Cas9/crRNA/tracrRNA endonukleolytisch lineare oder zirkuläre dsDNA, die komplementär zu der RNA ist. Insbesondere der Target-Strang, der nicht komplementär zur crRNA ist, wird zunächst endonukleolytisch geschnitten und dann exonukleolytisch auf 3'-5' gekürzt. In der Natur werden für die Bindung und Spaltung von DNA normalerweise Proteine und RNAs benötigt. Einzelne Guide-RNAs („sgRNA“ oder einfach „gNRA“) können jedoch so konstruiert werden, dass sie Aspekte sowohl der crRNA als auch der tracrRNA in eine einzige RNA-Spezies, die Guide-RNA, einbringen. Siehe z. B. Jinek M., Chylinski K., Fonfara I., Hauer M., Doudna J.A., Charpentier E. Science 337:816-821(2012), dessen gesamter Inhalt hiermit durch Bezugnahme aufgenommen wird. Cas9 erkennt ein kurzes Motiv in den CRISPR-Wiederholungssequenzen (das PAM- oder Protospacer-benachbartes Motiv), um zwischen selbst und nicht selbst zu unterscheiden. Die CRISPR-Biologie sowie die Sequenzen und Strukturen der Cas9-Nuklease sind dem Fachmann gut bekannt (siehe z .B. „Complete genome sequence of an M1 strain of Streptococcus pyogenes.“ Ferretti et al., J.J., McShan W.M., Ajdic D.J., Savic D.J., Savic G., Lyon K., Primeaux C., Sezate S., Suvorov A.N., Kenton S., Lai H.S., Lin S.P., Qian Y., Jia H.G., Najar F.Z., Ren Q., Zhu H., Song L., White J., Yuan X., Clifton S.W., Roe B.A., McLaughlin R.E., Proc. Natl. Acad. Sci. U.S.A. 98:4658-4663(2001); „CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III.“ Deltcheva E., Chylinski K., Sharma C.M., Gonzales K., Chao Y., Pirzada Z.A., Eckert M.R., Vogel J., Charpentier E., Nature 471:602-607(2011); und „A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity.“ Jinek M., Chylinski K., Fonfara I., Hauer M., Doudna J.A., Charpentier E. Science 337:816-821(2012), deren gesamter Inhalt hier durch Verweis aufgenommen wird). Cas9-Orthologe wurden in verschiedenen Spezies beschrieben, einschließlich, aber nicht beschränkt auf S. pyogenes und S. thermophilus. Weitere geeignete Cas9-Nukleasen und -Sequenzen sind für Fachleute auf der Grundlage dieser Offenbarung ersichtlich. Zu diesen Cas9-Nukleasen und -Sequenzen gehören Cas9-Sequenzen aus den Organismen und Loci, die in Chylinski, Rhun und Charpentier, „The tracrRNA and Cas9 families of type II CRISPR-Cas immunity systems“ (2013) RNA Biology 10:5, 726-737, offenbart sind, deren gesamter Inhalt hier durch Bezugnahme aufgenommen ist.
  • In bestimmten Arten von CRISPR-Systemen (z. B. CRISPR-Systeme vom Typ II), erfordert die korrekte Verarbeitung der prä-crRNA eine trans-codierte kleine RNA (tracrRNA), endogene Ribonuklease 3 (rnc) und ein Cas9-Protein. Die tracrRNA dient als Leitfaden für die Ribonuklease 3-gestützte Verarbeitung der prä-crRNA. Anschließend spaltet Cas9/crRNA/tracrRNA endonukleolytisch lineare oder kreisförmige Nukleinsäure-Targets, die komplementär zur RNA sind. Insbesondere der Target-Strang, der nicht komplementär zur crRNA ist, wird zunächst endonukleolytisch geschnitten und dann exonukleolytisch auf 3'-5' gekürzt. In der Natur werden für die Bindung und Spaltung von DNA normalerweise Proteine und RNAs benötigt. Einzelne Guide-RNAs („sgRNA“ oder einfach „gNRA“) können jedoch so konstruiert werden, dass sie Ausführungsformen sowohl der crRNA als auch der tracrRNA in eine einzige RNA-Spezies, die Guide-RNA, einbringen.
  • Im Allgemeinen bezieht sich ein „CRISPR-System“ auf Transkripte und andere Elemente, die an der Expression von CRISPR-assoziierten („Cas“) Genen beteiligt sind oder deren Aktivität steuern, einschließlich Sequenzen, die für ein Cas-Gen, einer tracr (trans-aktivierende CRISPR)-Sequenz (z. B. tracrRNA oder eine aktive partielle tracrRNA), einer tracr-mate-Sequenz (die eine „direkte Wiederholung“ und eine tracrRNA-verarbeitete partielle direkte Wiederholung im Kontext eines endogenen CRISPR-Systems umfasst), einer Leitsequenz (die im Kontext eines endogenen CRISPR-Systems auch als „Spacer“ bezeichnet wird) oder anderen Sequenzen und Transkripten von einem CRISPR-Locus. Die tracrRNA des Systems ist (vollständig oder teilweise) komplementär zu der tracr mate-Sequenz auf der Guide-RNA.
  • DNA-Synthese-Template
  • Wie hier verwendet, bezieht sich der Begriff „DNA-Synthese-Template“ auf die Region oder den Teil des Extension-Arms einer PEgRNA, der von einer Polymerase eines Prime Editors als Template-Strang verwendet wird, um einen 3'-Einzelstrang-DNA-Flap zu codieren, der das gewünschte Edit enthält und der dann durch den Mechanismus des Prime Editing den entsprechenden endogenen DNA-Strang an der Target-Stelle ersetzt. In verschiedenen Ausführungsformen ist das DNA-Synthese-Template in 3A (im Zusammenhang mit einer PEgRNA, die einen 5'-Extension-Arm umfasst), 3B (im Zusammenhang mit einer PEgRNA, die einen 3'-Extension-Arm umfasst), 3C (im Zusammenhang mit einem internen Extension-Arm), 3D (im Zusammenhang mit einem 3'-Extension-Arm), und 3E (im Zusammenhang mit einem 5'-Extension-Arm) gezeigt. Der Extension-Arm, einschließlich des DNA-Synthese-Templates kann aus DNA oder RNA bestehen. Im Falle von RNA kann die Polymerase des Prime Editors eine RNA-abhängige DNA-Polymerase sein (z. B. eine reverse Transkriptase). Im Falle von DNA kann die Polymerase des Prime Editors eine DNA-abhängige DNA-Polymerase sein. In verschiedenen Ausführungsformen (z. B. wie in 3D-3E) kann das DNA-Synthese-Template (4) das „Edit-Template“ und den „Homologiearm“ sowie die gesamte oder einen Teil der optionalen 5'-Endmodifizierungsregion e2 umfassen. Das heißt, je nach Beschaffenheit der e2-Region (z. B. ob sie eine Haarnadel-, Toeloop- oder Stamm/Schleifen-Sekundärstruktur beinhaltet) kann die Polymerase keine, einige oder auch die gesamte e2-Region codieren. Anders ausgedrückt: Im Falle eines 3'-Extension-Arms kann das DNA-Synthese-Template (3) den Teil des Extension-Arms (3) umfassen, der vom 5'-Ende der Primer-Bindungsstelle (PBS) bis zum 3'-Ende des gRNA-Kerns erstreckt, der als Template für die Synthese eines DNA-Einzelstrangs durch eine Polymerase (z. B. eine reverse Transkriptase) dienen kann. Im Falle eines 5'-Extension-Arms kann das DNA-Synthese-Template (3) den Teil des Extension-Arms (3) beinhalten, der sich vom 5'-Ende des PEgRNA-Moleküls bis zum 3'-Ende des Edit-Templates erstreckt. Vorzugsweise schließt das DNA-Synthese-Template die Primer-Bindungsstelle (PBS) von PEgRNAs aus, die entweder einen 3'-Extension-Arm oder einen 5'-Extension-Arm haben. Bestimmte hier beschriebene Ausführungsformen (z. B. 71A) beziehen sich auf ein „RT-Template“, das das Edit-Template und den Homologiearm umfasst, d. h. die Sequenz des PEgRNA-Extension-Arms, die während der DNA-Synthese tatsächlich als Template verwendet wird. Der Begriff „RT-Template“ ist gleichbedeutend mit dem Begriff „DNA-Synthese-Template“.
  • Im Falle des trans Prime Editing (z. B. 3G und 3H), können die Primer-Bindungsstelle (PBS) und das DNA-Synthese-Template in ein separates Molekül eingebaut werden, das als trans Prime-Editor-RNA-Template (tPERT) bezeichnet wird.
  • Dimerisierungsdomäne
  • Der Begriff „Dimerisierungsdomäne“ bezieht sich auf eine ligandenbindende Domäne, die an eine Bindungseinheit eines bispezifischen Liganden bindet. Eine „erste“ Dimerisierungsdomäne bindet an eine erste Bindungseinheit eines bispezifischen Liganden und eine „zweite“ Dimerisierungsdomäne bindet an eine zweite Bindungseinheit des gleichen bispezifischen Liganden. Wenn die erste Dimerisierungsdomäne an ein erstes Protein fusioniert ist (z. B. über PE, wie hier besprochen) und die zweite Dimerisierungsdomäne (z. B. über PE, wie hier besprochen) an ein zweites Protein fusioniert ist, dimerisieren das erste und das zweite Protein in Gegenwart eines bispezifischen Liganden, wobei der bispezifische Ligand mindestens eine Einheit aufweist, die an die erste Dimerisierungsdomäne bindet und mindestens eine andere Einheit, die an die zweite Dimerisierungsdomäne bindet.
  • Stromabwärts
  • Wie hier verwendet, sind die Begriffe „stromaufwärts“ und „stromabwärts“ Relativitätsbegriffe, die die lineare Position von mindestens zwei Elementen definieren, die sich in einem Nukleinsäuremolekül (ob einzel- oder doppelsträngig) befinden, das in einer 5'-zu-3'-Richtung ausgerichtet ist. Insbesondere befindet sich ein erstes Element stromaufwärts von einem zweiten Element in einem Nukleinsäuremolekül, wobei das erste Element an einer Stelle positioniert ist, die 5' zu dem zweiten Element liegt. Ein SNP befindet sich beispielsweise stromaufwärts von einer Cas9-induzierten Nick-Stelle, wenn der SNP auf der 5'-Seite der Nick-Stelle liegt. Umgekehrt befindet sich ein erstes Element stromabwärts von einem zweiten Element in einem Nukleinsäuremolekül, wenn das erste Element an einer Stelle positioniert ist, die 3' zum zweiten Element liegt. Ein SNP befindet sich beispielsweise stromabwärts von einer Cas9-induzierten Nick-Stelle, wenn der SNP auf der 3'-Seite der Nick-Stelle liegt. Das Nukleinsäuremolekül kann eine DNA sein (einzelsträngig oder doppelsträngig). RNA (doppel- oder einzelsträngig), oder ein Hybrid aus DNA und RNA. Die Analyse ist für ein Einzelstrang-Nukleinsäuremolekül und ein Doppelstrang-Molekül gleich, da sich die Begriffe stromaufwärts und stromabwärts nur auf einen einzelnen Strang eines Nukleinsäuremoleküls beziehen, mit der Ausnahme, dass ausgewählt werden muss, welcher Strang des Doppelstrang-Moleküls betrachtet werden soll. Oft ist der Strang einer Doppelstrang-DNA, der zur Bestimmung der Positionsrelativität von mindestens zwei Elementen verwendet werden kann, der „Sense-“ oder „Codierungsstrang“. In der Genetik ist ein „Sense“-Strang das Segment innerhalb der Doppelstrang-DNA, das von 5' nach 3' verläuft und das komplementär zum Antisense-Strang der DNA, dem Template-Strang, ist, der von 3' nach 5' verläuft. So ist zum Beispiel eine SNP-Nukleobase „stromabwärts“ einer Promotorsequenz in einer genomischen DNA (die doppelsträngig ist), wenn sich die SNP-Nukleobase auf der 3'-Seite des Promotors auf dem Sense- oder Codierungsstrang befindet.
  • Edit-Template
  • Der Begriff „Edit-Template“ bezieht sich auf einen Teil des Extension-Arms, der das gewünschte Edit in dem Einzelstrang-3'-DNA-Flap codiert, die von der Polymerase, z. B. einer DNA-abhängigen DNA-Polymerase, einer RNA-abhängigen DNA-Polymerase (z. B. einer reversen Transkriptase) synthetisiert wird. Bestimmte hier beschriebene Ausführungsformen (z. B. 71A) beziehen sich auf ein „RT-Template“, das sich auf das Edit-Template und den Homologiearm zusammen bezieht, d. h. die Sequenz des PEgRNA-Extension-Arms, die während der DNA-Synthese tatsächlich als Template verwendet wird. Der Begriff „RT-Edit-Template“ entspricht auch dem Begriff „DNA-Synthese-Template“, wobei das RT-Edit-Template jedoch die Verwendung eines Prime Editors mit einer Polymerase, die eine reverse Transkriptase ist, widerspiegelt und wobei das DNA-Synthese-Template im weiteren Sinne die Verwendung eines Prime Editors mit einer beliebigen Polymerase widerspiegelt.
  • Wirksame Menge
  • Der Begriff „wirksame Menge“, wie er hier verwendet wird, bezieht sich auf eine Menge eines biologischemWirkstoffs, die ausreicht, um eine gewünschte biologische Reaktion hervorzurufen. In einigen Ausführungsformen kann sich eine wirksame Menge eines Prime Editors (PE) beispielsweise auf die Menge des Editors beziehen, die ausreicht, um eine Nukleotidsequenz an der Target-Stelle, z. B. ein Genom, zu editieren. In einigen Ausführungsformen kann sich eine wirksame Menge eines hier bereitgestellten Prime Editors (PE), z. B. eines Fusionsproteins, das eine Nickase-Cas9-Domäne und eine reverse Transkriptase umfasst, auf die Menge des Fusionsproteins beziehen, die ausreicht, um die Editierung einer Target-Stelle zu induzieren, die spezifisch durch das Fusionsprotein gebunden und editiert wird. Wie dem Fachmann klar sein wird, kann die wirksame Menge eines Mittels, z. B. eines Fusionsproteins, einer Nuklease, eines Hybridproteins, eines Proteindimers, eines Komplexes aus einem Protein (oder Proteindimer) und einem Polynukleotid oder eines Polynukleotids, von verschiedenen Faktoren abhängen, wie z. B. von der gewünschten biologischen Reaktion, z. B. von dem spezifischen Allel, Genom oder Targetort, der editiert werden soll, von der Zelle oder dem Gewebe, auf die/das abgezielt wird, und von dem verwendeten Mittel.
  • Fehler anfällige reverse Transkriptase
  • Wie hierin verwendet, bezieht sich der Begriff „fehleranfällige“ reverse Transkriptase (oder im weiteren Sinne eine beliebige Polymerase) auf eine reverse Transkriptase (oder im weiteren Sinne eine beliebige Polymerase), die natürlich vorkommt oder die von einer anderen reversen Transkriptase (z. B. einer Wildtyp M-MLV reversen Transkriptase) abgeleitet wurde, die eine Fehlerrate aufweist, die geringer ist als die Fehlerrate der Wildtyp M-MLV reversen Transkriptase. Die Fehlerrate der M-MLV-Wildtyp reversen Transkriptase liegt Berichten zufolge im Bereich von einem Fehler bei 15.000 (höher) bis 27.000 (niedriger). Eine Fehlerquote von 1 zu 15.000 entspricht einer Fehlerquote von 6,7 × 10-5. Eine Fehlerquote von 1 zu 27.000 entspricht einer Fehlerquote von 3,7 × 10-5. Siehe Boutabout et al. (2001) „DNA synthesis fidelity by the reverse transcriptase of the yeast retrotransposon Ty1“, Nucleic Acids Res 29(11):2217-2222, das hier durch Bezugnahme aufgenommen wird. Für die Zwecke dieser Anmeldung bezieht sich der Begriff „fehleranfällig“ auf jene RT, die eine Fehlerrate von mehr als einem Fehler in 15.000 Nukleobasen (6,7 × 10-5 oder höher) aufweisen, z. B., 1 Fehler in 14.000 Nukleobasen (7,14 × 10-5
    oder höher), 1 Fehler in 13.000 Nukleobasen oder weniger (7,7 × 10-5 oder höher), 1 Fehler in 12.000 Nukleobasen oder weniger (7,7 × 10-5 oder höher), 1 Fehler in 11.000 Nukleobasen oder weniger (9,1 x 10-5 oder höher), 1 Fehler in 10.000 Nukleobasen oder weniger (1 × 10-4 oder 0,0001 oder höher), 1 Fehler in 9.000 Nukleobasen oder weniger (0,00011 oder höher), 1 Fehler in 8.000 Nukleobasen oder weniger (0,00013 oder höher), 1 Fehler in 7.000 Nukleobasen oder weniger (0.00014 oder höher), 1 Fehler in 6.000 Nukleobasen oder weniger (0.00016 oder höher), 1 Fehler in 5.000 Nukleobasen oder weniger (0.0002 oder höher), 1 Fehler in 4.000 Nukleobasen oder weniger (0.00025 oder höher), 1 Fehler in 3.000 Nukleobasen oder weniger (0,00033 oder höher), 1 Fehler in 2.000 Nukleobasen oder weniger (0,00050 oder höher), oder 1 Fehler in 1.000 Nukleobasen oder weniger (0,001 oder höher), oder 1 Fehler in 500 Nukleobasen oder weniger (0,002 oder höher), oder 1 Fehler in 250 Nukleobasen oder weniger (0,004 oder höher).
  • Extein
  • Der Begriff „Extein“, wie er hier verwendet wird, bezieht sich auf eine Polypeptidsequenz, die von einem Intein flankiert wird und während des Prozesses des Proteinspleißens an ein anderes Extein ligiert wird, um ein reifes, gespleißtes Protein zu bilden. Normalerweise wird ein Intein von zwei Extein-Sequenzen flankiert, die miteinander ligiert werden, wenn das Intein seine eigene Exzision katalysiert. Exteine sind also das Protein-Analogon zu den Exons in der mRNA. Ein Polypeptid, das ein Intein umfasst, kann zum Beispiel die Struktur Extein(N) - Intein - Extein(C) haben. Nach der Exzision des Inteins und dem Spleißen der beiden Exteine entstehen die Strukturen Extein(N) - Extein(C) und ein freies Intein. In verschiedenen Konfigurationen können die Exteine separate Proteine sein (z. B. die Hälfte eines Cas9- oder PE-Fusionsproteins), die jeweils mit einem Split-Intein fusioniert sind, wobei die Exzision der Split-Inteine das Zusammenspleißen der Extein-Sequenzen bewirkt.
  • Extension-Arm
  • Der Begriff „Extension-Arm“ bezieht sich auf eine Nukleotidsequenzkomponente einer PEgRNA, die mehrere Funktionen erfüllt, darunter eine Primer-Bindungsstelle und ein Edit-Template für die reverse Transkriptase. In einigen Ausführungsformen, z. B. 3D befindet sich der Extension-Arm am 3'-Ende der Guide-RNA. In anderen Ausführungsformen, z. B. 3E befindet sich der Extension-Arm am 5'-Ende der Guide-RNA. In einigen Ausführungsformen umfasst der Extension-Arm auch einen Homologiearm. In verschiedenen Ausführungsformen umfasst der Extension-Arm die folgenden Komponenten in 5' bis 3' Richtung: den Homologiearm, das Edit-Template und die Primer-Bindungsstelle. Da die Polymerisationsaktivität der reversen Transkriptase in der 5'-zu-3'-Richtung erfolgt, ist die bevorzugte Anordnung des Homologiearms, des Edit-Templates und der Primer-Bindungsstelle in der 5'-zu-3'-Richtung, so dass die reverse Transkriptase, sobald sie durch eine angelagerte Primer-Sequenz geprimert wurde, einen einzelnen DNA-Strang unter Verwendung des Edit-Templates als komplementären Template-Strang polymerisiert. Weitere Details, wie z. B. die Länge des Extension-Arms, werden an anderer Stelle beschrieben.
  • Der Extension-Arm kann auch so beschrieben werden, dass er im Allgemeinen zwei Regionen umfasst: eine Primer-Bindungsstelle (PBS) und ein DNA-Synthese-Template, wie zum Beispiel in 3G (oben) gezeigt. Die Primer-Bindungsstelle bindet an die Primer-Sequenz, die aus dem endogenen DNA-Strang der Target-Seile gebildet wird, wenn dieser durch den Primer-Editor-Komplex mit einem Nick versehen wird, wodurch ein 3'-Ende auf dem endogenen genickten Strang freigelegt wird. Wie hier erläutert, wird durch die Bindung der Primer-Sequenz an die Primer-Bindungsstelle auf dem Extension-Arm der PEgRNA eine Duplex-Region mit einem freiliegenden 3'-Ende (d. h. dem 3' der Primer-Sequenz) erzeugt, die dann ein Substrat für eine Polymerase bereitstellt, um mit der Polymerisation eines einzelnen DNA-Strangs von dem freiliegenden 3'-Ende entlang der Länge des DNA-Synthese-Templates zu beginnen. Die Sequenz des Einzelstrang-DNA-Produkts ist das Komplement des DNA-Synthese-Templates. Die Polymerisation setzt sich in Richtung der 5' des DNA-Synthese-Templates (oder des Extension-Arms) fort, bis die Polymerisation endet. Somit stellt das DNA-Synthese-Template den Teil des Extension-Arms dar, der von der Polymerase des Prime-Editor-Komplexes in ein Einzelstrang-DNA-Produkt (d. h. den 3'-Einzelstrang-DNA-Flap, der die gewünschte genetische Edit-Information enthält) codiert wird und der letztendlich den entsprechenden endogenen DNA-Strang der Target-Stelle ersetzt, der unmittelbar stromabwärts der PE-induzierten Nick-Stelle liegt. Ohne an die Theorie gebunden zu sein, setzt sich die Polymerisation des DNA-Synthese-Templates zum 5'-Ende des Extension-Arms hin fort, bis ein Abbruchereignis eintritt. Die Polymerisation kann auf verschiedene Weise beendet werden, einschließlich, aber nicht beschränkt auf (a) das Erreichen eines 5'-Terminus der PEgRNA (z. B. im Fall des 5'-Extension-Arms, bei dem der DNA-Polymerase einfach das Template ausgeht), (b) das Erreichen einer unpassierbaren RNA-Sekundärstruktur (z. B., Haarnadel oder Stamm/Schleife), oder (c) das Erreichen eines Replikationsterminationssignals, z. B. einer spezifischen Nukleotidsequenz, die die Polymerase blockiert oder hemmt, oder eines topologischen Nukleinsäuresignals, wie z. B. supergewundene DNA oder RNA.
  • Flap-Endonuklease (z. B. FEN1)
  • Wie hier verwendet, bezieht sich der Begriff „Flap-Endonuklease“ auf ein Enzym, das die Entfernung von 5'-Einzelstrang-DNA-Flaps katalysiert. Dies sind natürlich vorkommende Enzyme, die die Entfernung von 5'-Flaps verarbeiten, die während zellulärer Prozesse, einschließlich der DNA-Replikation, gebildet werden. Die hier beschriebenen Prime Editing-Verfahren können endogen bereitgestellte Flap-Endonukleasen oder solche, die in trans bereitgestellt werden, verwenden, um den 5'-Flap der endogenen DNA zu entfernen, der während des Prime Editings an der Target-Stelle gebildet wird. Flap-Endonukleasen sind in der Technik bekannt und können in Patel et al., „Flap endonucleases pass 5'-flaps through a flexible arch using a disorder-thread-order mechanism to confer specificity for free 5'-ends,“ Nucleic Acids Research, 2012, 40(10): 4507-4519, Tsutakawa et al., „Human flap endonuclease structures, DNA doublebase flipping, and a unified understanding of the FEN1 superfamily,“ Cell, 2011, 145(2): 198-211, und Balakrishnan et al., „Flap Endonuclease 1,“ Annu Rev Biochem, 2013, Bd. 82: 119-138 (die hier durch Bezugnahme aufgenommen sind) beschrieben gefunden werden. Eine beispielhafte Flap-Endonuklease ist FEN1, die durch die folgende Aminosäuresequenz dargestellt werden kann:
    BESCHREI BUNG SEQUENZ SEQ ID NO:
    FEN1 WILDTYP
    Figure DE112020001339T5_0001
    SEQ ID NO: 7
  • Funktionales Äquivalent
  • Der Begriff „funktionelles Äquivalent“ bezieht sich auf ein zweites Biomolekül, das in seiner Funktion, aber nicht unbedingt in seiner Struktur einem ersten Biomolekül gleichwertig ist. Ein „Cas9-Äquivalent“ bezieht sich beispielsweise auf ein Protein, das die gleichen oder im Wesentlichen die gleichen Funktionen wie Cas9 hat, aber nicht unbedingt die gleiche Aminosäuresequenz. Im Zusammenhang mit der Offenbarung bezieht sich die Spezifikation durchgehend auf „ein Protein X oder ein funktionelles Äquivalent davon“. In diesem Zusammenhang umfasst ein „funktionelles Äquivalent“ von Protein X jedes Homolog, Paralog, Fragment, jede natürlich vorkommende, manipulierte, mutierte oder synthetische Version von Protein X, die eine äquivalente Funktion aufweist.
  • Fusionsprotein
  • Der Begriff „Fusionsprotein“, wie er hier verwendet wird, bezieht sich auf ein hybrides Polypeptid, das Proteindomänen von mindestens zwei verschiedenen Proteinen umfasst. Ein Protein kann sich am aminoterminalen (N-terminalen) Teil des Fusionsproteins oder am carboxyterminalen (C-terminalen) Protein befinden und bildet somit ein „aminoterminales Fusionsprotein“ bzw. ein „carboxyterminales Fusionsprotein“. Ein Protein kann verschiedene Domänen umfassen, zum Beispiel eine Nukleinsäurebindungsdomäne (z. B. die gRNA-Bindungsdomäne von Cas9, die die Bindung des Proteins an eine Target-Stelle steuert) und eine Nukleinsäurespaltungsdomäne oder eine katalytische Domäne eines Nukleinsäure-Editing-Proteins. Ein weiteres Beispiel ist Cas9 oder ein Äquivalent davon zu einer reversen Transkriptase. Jedes hierin bereitgestellte Protein kann gemäß jedem in der Technik bekannten Verfahren hergestellt werden. Zum Beispiel können die hier bereitgestellten Proteine durch rekombinante Proteinexpression und -reinigung hergestellt werden, was sich besonders für Fusionsproteine eignet, die einen Peptidlinker umfassen. Die Verfahren zur Expression und Reinigung rekombinanter Proteine sind allgemein bekannt und werden unter anderem von Green und Sambrook, Molecular Cloning: A Laboratory Manual (4. Aufl., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (2012)) beschrieben, dessen Inhalt hier durch Verweis aufgenommen wird.
  • Gen von Interesse (GOI)
  • Der Begriff „Gen von Interesse“ oder „GOI“ bezieht sich auf ein Gen, das für ein Biomolekül von Interesse (z. B. ein Protein oder ein RNA-Molekül) codiert. Ein Protein von Interesse kann ein intrazelluläres Protein, ein Membranprotein oder ein extrazelluläres Protein sein, z. B. ein Kernprotein, ein Transkriptionsfaktor, ein Kernmembrantransporter, ein mit einer intrazellulären Organelle assoziiertes Protein, ein Membranrezeptor, ein katalytisches Protein, ein Enzym, ein therapeutisches Protein, ein Membranprotein, ein Membrantransportprotein, ein Signaltransduktionsprotein oder ein immunologisches Protein (z. B. ein IgG- oder anderes Antikörperprotein) usw. Das Gen von Interesse kann auch für ein RNA-Molekül codieren, einschließlich, aber nicht beschränkt auf Boten-RNA (mRNA), Transfer-RNA (tRNA), ribosomale RNA (rRNA), kleine Kern-RNA (snRNA), Antisense-RNA, Guide-RNA, mikroRNA (miRNA), small interfering RNA (siRNA) und zellfreie RNA (cfRNA).
  • Guide-RNA („gRNA“)
  • Wie hier verwendet, ist der Begriff „Guide-RNA“ eine besondere Art von Guide-Nukleinsäure, die meist mit einem Cas-Protein eines CRISPR-Cas9 assoziiert ist und die mit Cas9 assoziiert und das Cas9-Protein zu einer bestimmten Sequenz in einem DNA-Molekül lenkt, die Komplementarität zur Protospacer-Sequenz der Guide-RNA aufweist. Dieser Begriff umfasst jedoch auch die äquivalenten Leitnukleinsäuremoleküle, die mit Cas9-Äquivalenten, Homologen, Orthologen oder Paralogen assoziiert sind, unabhängig davon, ob sie natürlich vorkommen oder nicht (z. B. gentechnisch verändert oder rekombinant), und die das Cas9-Äquivalent anderweitig darauf programmieren, sich an einer bestimmten Target-Nukleotidsequenz zu lokalisieren. Die Cas9-Äquivalente können andere napDNAbp von jedem Typ von CRISPR-Systemen (z. B. Typ II, V, VI) umfassen, einschließlich Cpfl (ein Typ-V-CRISPR-Cas-System), C2c1 (ein Typ-V-CRISPR-Cas-System), C2c2 (ein Typ-VI-CRISPR-Cas-System) und C2c3 (ein Typ-V-CRISPR-Cas-System). Weitere Cas-Äquivalente sind beschrieben in Makarova et al., „C2c2 is a singlecomponent programmable RNA-guided RNA-targeting CRISPR effector,“ Science 2016; 353(6299), dessen Inhalt hier durch Bezugnahme aufgenommen wird. Beispielhafte Sequenzen und Strukturen von Guide-RNAs sind hier aufgeführt. Darüber hinaus werden hier Verfahren zum Entwurf geeigneter Guide-RNA-Sequenzen bereitgestellt. Wie hier verwendet, kann die „Guide-RNA“ auch als „traditionelle Guide-RNA“ bezeichnet werden, um sie von den modifizierten Formen der Guide-RNA zu unterscheiden, die als „Prime Editing Guide RNAs“ (oder „PEgRNAs“) bezeichnet werden und für die hier offenbarten Prime Editing Verfahren und Zusammensetzungen erfunden wurden.
  • Guide-RNAs oder PEgRNAs können verschiedene Strukturelemente umfassen, die unter anderem Folgendes beinhalten:
  • Spacer-Sequenz - die Sequenz in der Guide-RNA oder PEgRNA (mit einer Länge von etwa 20 nts), die an den Protospacer in der Target-DNA bindet.
  • gRNA-Kern (oder gRNA-Gerüst oder Rückgrat-Sequenz) - bezieht sich auf die Sequenz innerhalb der gRNA, die für die Bindung von Cas9 verantwortlich ist. Sie umfasst nicht die 20 bp Spacer/Targeting-Sequenz, die verwendet wird, um Cas9 zur Target-DNA zu führen.
  • Extension-Arm - eine Einzelstrang-Erweiterung am 3'-Ende oder am 5'-Ende der PEgRNA, die eine Primer-Bindungsstelle und eine DNA-Synthese-Template-Sequenz umfasst, die über eine Polymerase (z. B. eine reverse Transkriptase) einen Einzelstrang-DNA-Flap codiert, der die gewünschte genetische Änderung enthält, der dann in die endogene DNA integriert wird, indem der entsprechende endogene Strang ersetzt wird, wodurch die gewünschte genetische Änderung installiert wird.
  • Transkriptionsterminator - die Guide-RNA oder PEgRNA kann eine Transkriptionsterminationssequenz am 3' des Moleküls umfassen.
  • Homologiearm
  • Der Begriff „Homologiearm“ bezieht sich auf einen Teil des Extension-Arms, der für einen Teil des resultierenden, durch reverse Transkriptase codierten Einzelstrang-DNA-Flaps codiert, der durch Ersetzen des endogenen Strangs in die Target-DNA-Stelle integriert werden soll. Der Teil des Einzelstrang-DNA-Flaps, der durch den Homologie-Arm codiert wird, ist komplementär zum nicht-editierten Strang der Target-DNA-Sequenz, was die Verdrängung des endogenen Strangs und das Anheften des Einzelstrang-DNA-Flaps an dessen Stelle erleichtert, wodurch das Edit eingebaut wird. Diese Komponente wird an anderer Stelle näher definiert. Der Homologiearm ist Teil des DNA-Synthese-Templates, da er per Definition von der Polymerase der hier beschriebenen Prime-Editoren codiert wird.
  • Wirtszelle
  • Der Begriff „Wirtszelle“, wie er hier verwendet wird, bezieht sich auf eine Zelle, die einen hier beschriebenen Vektor beherbergen, replizieren und exprimieren kann, z. B. einen Vektor, der ein Nukleinsäuremolekül umfasst, das für ein Fusionsprotein codiert, das ein Cas9 oder Cas9-Äquivalent und eine reverse Transkriptase umfasst.
  • Inteine
  • Wie hier verwendet, bezieht sich der Begriff „Intein“ auf selbstverarbeitende Polypeptid-Domänen, die in Organismen aus allen Bereichen des Lebens vorkommen. Ein Intein (intervenierendes Protein ) führt ein einzigartiges automatisches Verarbeitungsereignis durch, das als Proteinspleißen bekannt ist. Dabei schneidet es sich selbst aus einem größeren Vorläuferpolypeptid durch die Spaltung von zwei Peptidbindungen heraus und bindet dabei die flankierenden Extein-Sequenzen (externe Proteine) durch die Bildung einer neuen Peptidbindung. Diese Umstrukturierung erfolgt posttranslational (oder möglicherweise cotranslational), da Intein-Gene im Rahmen anderer proteincodierender Gene eingebettet sind. Darüber hinaus erfolgt das Intein-vermittelte Proteinspleißen spontan; es erfordert keinen externen Faktor oder eine Energiequelle, sondern lediglich die Faltung der Intein-Domäne. Dieser Prozess wird auch als cis-Proteinspleißen bezeichnet, im Gegensatz zum natürlichen Prozess des trans-Proteinspleißens mit „gespaltenen Internen“. Inteine sind das Protein-Äquivalent der sich selbst-spleißenden RNA-Introns (siehe Perler et al., Nucleic Acids Res. 22:1125-1127 (1994)), die ihre eigene Exzision von einem Vorläuferprotein mit der gleichzeitigen Fusion der flankierenden Proteinsequenzen, den so genannten Exteinen, katalysieren (besprochen in Perler et al., Curr. Opin. Chem. Biol. 1:292-299 (1997); Perler, F. B. Cell 92(1):1-4 (1998); Xu et al., EMBO J. 15(19):5146-5153 (1996)).
  • Wie hier verwendet, bezieht sich der Begriff „Proteinspleißen“ auf einen Prozess, bei dem eine innere Region eines Vorläuferproteins (ein Intein) herausgeschnitten wird und die flankierenden Regionen des Proteins (Exteine) ligiert werden, um das reife Protein zu bilden. Dieser natürliche Prozess wurde bei zahlreichen Proteinen sowohl von Prokaryoten als auch von Eukaryoten beobachtet (Perler, F. B., Xu, M. Q., Paulus, H. Current Opinion in Chemical Biology 1997, 1, 292-299; Perler, F. B. Nucleic Acids Research 1999, 27, 346-347). Die Intein-Einheit enthält die notwendigen Komponenten, die für die Katalyse des Proteinspleißens erforderlich sind, und enthält häufig eine Endonuklease-Domäne, die an der Intein-Mobilität beteiligt ist (Perler, F. B., Davis, E. O., Dean, G. E., Gimble, F. S., Jack, W. E., Neff, N., Noren, C. J., Thomer, J., Belfort, M. Nucleic Acids Research 1994, 22, 1127-1127). Die resultierenden Proteine sind miteinander verbunden, werden aber nicht als separate Proteine exprimiert. Das Spleißen von Proteinen kann auch in trans erfolgen, wobei sich auf getrennten Polypeptiden exprimierte Split-Inteine spontan zu einem einzigen Intein verbinden, das dann den Proteinspleißprozess durchläuft, um sich zu getrennten Proteinen zu verbinden.
  • Die Aufklärung des Mechanismus des Proteinspleißens hat zu einer Reihe von Inteinbasierten Anmeldungen geführt (Comb, et al., US-Pat. Nr. 5,496,714 ; Comb, et al., US-Pat. Nr. 5,834,247 ; Camarero und Muir, J. Amer. Chem. Soc., 121:5597-5598 (1999); Chong, et al., Gene, 192:271-281 (1997), Chong, et al., Nucleic Acids Res., 26:5109-5115 (1998); Chong, et al., J. Biol. Chem., 273:10567-10577 (1998); Cotton, et al. J. Am. Chem. Soc., 121:1100-1101 (1999); Evans, et al., J. Biol. Chem., 274:18359-18363 (1999); Evans, et al., J. Biol. Chem., 274:3923-3926 (1999); Evans, et al., Protein Sci., 7:2256-2264 (1998); Evans, et al., J. Biol. Chem., 275:9091-9094 (2000); Iwai und Pluckthun, FEBS Lett. 459:166-172 (1999); Mathys, et al., Gene, 231:1-13 (1999); Mills, et al., Proc. Natl. Acad. Sci. USA 95:3543-3548 (1998); Muir, et al., Proc. Natl. Acad. Sci. USA 95:6705-6710 (1998); Otomo, et al., Biochemistry 38:16040-16044 (1999); Otomo, et al., J. Biolmol. NMR 14:105-114 (1999); Scott, et al., Proc. Natl. Acad. Sci. USA 96:13638-13643 (1999); Severinov und Muir, J. Biol. Chem., 273:16205-16209 (1998); Shingledecker, et al., Gene, 207:187-195 (1998); Southworth, et al., EMBO J. 17:918-926 (1998); Southworth, et al., Biotechniques, 27:110-120 (1999); Wood, et al., Nat. Biotechnol., 17:889-892 (1999); Wu, et al., Proc. Natl. Acad. Sci. USA 95:9226-9231 (1998a); Wu, et al., Biochim Biophys Acta 1387:422-432 (1998b); Xu, et al., Proc. Natl. Acad. Sci. USA 96:388-393 (1999); Yamazaki, et al., J. Am. Chem. Soc., 120:5591-5592 (1998)). Jede Referenz ist durch Bezugnahme hier aufgenommen.
  • Ligandenabhängiges Intein
  • Der Begriff „ligandenabhängiges Intein“, wie er hier verwendet wird, bezieht sich auf ein Intein, das eine ligandenbindende Domäne umfasst. In der Regel wird die ligandenbindende Domäne in die Aminosäuresequenz des Inteins eingefügt, was zu einer Struktur Intein (N) - ligandenbindende Domäne - Intein (C) führt. Typischerweise zeigen ligandenabhängige Inteine in Abwesenheit eines geeigneten Liganden keine oder nur eine minimale Proteinspleißaktivität und in Anwesenheit des Liganden einen deutlichen Anstieg der Proteinspleißaktivität. In einigen Ausführungsformen zeigt das ligandenabhängige Intein in Abwesenheit des Liganden keine beobachtbare Spleißaktivität, wohl aber in Anwesenheit des Liganden. In einigen Ausführungsformen zeigt das ligandenabhängige Intein eine beobachtbare Proteinspleißaktivität in Abwesenheit des Liganden und eine Proteinspleißaktivität in Anwesenheit eines geeigneten Liganden, die mindestens 5 mal, mindestens 10 mal, mindestens 50 mal, mindestens 100 mal, mindestens 150 mal, mindestens 200 mal, mindestens 250 mal, mindestens 500 mal, mindestens 1000 mal, mindestens 1500 mal, mindestens 2000 mal, mindestens 2500 mal, mindestens 5000 mal, mindestens 10000 mal, mindestens 20000 mal, mindestens 25000 mal, mindestens 50000 mal, mindestens 100000 mal, mindestens 500000 mal oder mindestens 1000000 mal größer ist als die in Abwesenheit des Liganden beobachtete Aktivität. In einigen Ausführungsformen ist die Zunahme der Aktivität dosisabhängig über mindestens 1 Größenordnung, mindestens 2 Größenordnungen, mindestens 3 Größenordnungen, mindestens 4 Größenordnungen oder mindestens 5 Größenordnungen, was eine Feinabstimmung der Intein-Aktivität durch Anpassung der Ligandenkonzentration ermöglicht. Geeignete ligandenabhängige Inteine sind in der Technik bekannt und umfassen die unten aufgeführten und die, die beschrieben sind in der veröffentlichten US-Patentanmeldung US 2014/0065711 A1 ; Mootz et al., „Protein splicing triggered by a small molecule“ J. Am. Chem. Soc. 2002; 124, 9044-9045; Mootz et al., „Conditional protein splicing: a new tool to control protein structure and function in vitro and in vivo.“ J. Am. Chem. Soc. 2003; 125, 10561-10569; Buskirk et al., Proc. Natl. Acad. Sci. USA. 2004; 101, 10505-10510); Skretas & Wood, „Regulation of protein activity with small-molecule-controlled inteins.“ Protein Sci. 2005; 14, 523-532; Schwartz, et al., „Post-translational enzyme activation in an animal via optimized conditional protein splicing.“ Nat. Chem. Biol. 2007; 3, 50-54; Peck et al., Chem. Biol. 2011; 18 (5), 619-630; deren gesamter Inhalt hiermit durch Bezugnahme aufgenommen wird. Beispielhafte Sequenzen sind wie folgt:
    Figure DE112020001339T5_0002
    Figure DE112020001339T5_0003
    Figure DE112020001339T5_0004
  • Linker
  • Der Begriff „Linker“, wie er hier verwendet wird, bezieht sich auf ein Molekül, das zwei andere Moleküle oder Teile miteinander verbindet. Der Linker kann eine Aminosäuresequenz sein, wenn es sich um einen Linker handelt, der zwei Fusionsproteine verbindet. Zum Beispiel kann ein Cas9 durch eine Aminosäure-Linkersequenz an eine reverse Transkriptase fusioniert werden. Der Linker kann auch eine Nukleotidsequenz sein, wenn zwei Nukleotidsequenzen miteinander verbunden werden sollen. Im vorliegenden Fall ist die herkömmliche Guide-RNA beispielsweise über eine Spacer- oder Linker-Nukleotidsequenz mit der RNA-Extension einer Prime-Editing-Guide-RNA verbunden, die eine RT-Template-Sequenz und eine RT-Primer-Bindungsstelle umfassen kann. In anderen Ausführungsformen ist der Linker ein organisches Molekül, eine Gruppe, ein Polymer oder eine chemische Einheit. In einigen Ausführungsformen ist der Linker 5-100 Aminosäuren lang, zum Beispiel 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 30-35, 35-40, 40-45, 45-50, 50-60, 60-70, 70-80, 80-90, 90-100, 100-150 oder 150-200 Aminosäuren lang. Längere oder kürzere Linker sind ebenfalls denkbar.
  • Isoliert
  • „Isoliert“ bedeutet verändert oder aus dem natürlichen Zustand entfernt. So ist beispielsweise eine Nukleinsäure 20 oder ein Peptid, die von Natur aus in einem lebenden Tier vorhanden sind, nicht „isoliert“, aber dieselbe Nukleinsäure oder dasselbe Peptid, das teilweise oder vollständig von den coexistierenden Materialien seines natürlichen Zustands getrennt wurde, ist „isoliert“ Eine isolierte Nukleinsäure oder ein isoliertes Protein kann in einer im Wesentlichen gereinigten Form vorliegen oder in einer nicht nativen Umgebung, wie z. B. einer Wirtszelle, existieren.
  • In einigen Ausführungsformen wird ein Gen von Interesse von einer isolierten Nukleinsäure codiert. Wie hier verwendet, bezieht sich der Begriff „isoliert“ auf die Eigenschaft eines Materials, das aus seiner ursprünglichen oder natürlichen Umgebung (z. B. der natürlichen Umgebung, wenn es natürlich vorkommt) entfernt wurde. Daher wird ein natürlich vorkommendes Polynukleotid oder Protein oder Polypeptid, das in einem lebenden Tier vorhanden ist, nicht isoliert, sondern dasselbe Polynukleotid oder Polypeptid, das durch menschliches Eingreifen von einigen oder allen coexistierenden Materialien im natürlichen System abgetrennt wurde, wird isoliert. Ein künstliches oder manipuliertes Material, zum Beispiel ein nicht natürlich vorkommendes Nukleinsäurekonstrukt, wie die hier beschriebenen Expressionskonstrukte und Vektoren, werden dementsprechend auch als isoliert bezeichnet. Ein Material muss nicht gereinigt werden, um isoliert zu werden. Dementsprechend kann ein Material Teil eines Vektors und/oder Teil einer Zusammensetzung sein und dennoch isoliert sein, da dieser Vektor oder diese Zusammensetzung nicht Teil der Umgebung ist, in der das Material in der Natur vorkommt.
  • MS2-Tagging-Technik
  • In verschiedenen Ausführungsformen (z. B. wie in den Ausführungsformen von 72-73 und in Beispiel 19) bezieht sich der Begriff „MS2-Tagging-Technik“ auf die Kombination einer „RNA-Protein-Interaktionsdomäne“ (auch bekannt als „RNA-Protein-Rekrutierungsdomäne oder -protein“)) mit einem RNA-bindenden Protein, das die RNA-Protein-Interaktionsdomäne spezifisch erkennt und an sie bindet, z. B. eine spezifische Haarnadelstruktur. Diese Art von Systemen kann genutzt werden, um eine Vielzahl von Funktionalitäten an einen primären Editor-Komplex zu rekrutieren, der an eine Target-Stelle gebunden ist. Die MS2-Tagging-Technik basiert auf der natürlichen Interaktion des MS2-Bakteriophagen-Hüllproteins („MCP“ oder „MS2cp“) mit einer im Genom des Phagen vorhandenen Stamm-Schleifen- oder Haarnadelstruktur, d. h. der „MS2-Haarnadel“. Im Falle des Prime Editing umfasst die MS2-Tagging-Technik die Einführung der MS2-Haarnadel in ein gewünschtes RNA-Molekül, das am Prime Editing beteiligt ist (z. B. eine PEgRNA oder eine tPERT), das dann ein spezifisches interagierbares Bindungs-Target für ein RNA-bindendes Protein darstellt, das diese Struktur erkennt und daran bindet. Im Falle der MS2-Haarnadel wird es vom MS2-Bakteriophagen-Hüllprotein (MCP) erkannt und gebunden. Und wenn MCP mit einem anderen Protein fusioniert ist (z. B. einer reversen Transkriptase oder einer anderen DNA-Polymerase), dann kann die MS2-Haarnadel dazu verwendet werden, dieses andere Protein in trans zu der vom Prime-Editing-Komplex besetzten Target-Stelle zu „rekrutieren“.
  • Die hier beschriebenen Prime-Editoren können als einen Aspekt jede bekannte RNA-Protein-Interaktionsdomäne einbeziehen, um spezifische Funktionen von Interesse in einen Prime-Editor-Komplex zu rekrutieren oder zu „colokalisieren“. Eine Übersicht über andere modulare RNA-Protein-Interaktionsdomänen ist in der Fachliteratur beschrieben, zum Beispiel in Johansson et al., „RNA recognition by the MS2 phage coat protein“, Sem Virol., 1997, Bd. 8(3): 176-185; Delebecque et al., „Organization of intracellular reactions with rationally designed RNA assemblies“, Science, 2011, Bd. 333: 470-474; Mali et al., „Cas9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering“, Nat. Biotechnol., 2013, Bd. 31: 833-838; und Zalatan et al., „Engineering complex synthetic transcriptional programs with CRISPR RNA scaffolds“, Cell, 2015, Bd. 160: 339-350, die hier durch Bezugnahme vollständig aufgenommen sind. Andere Systeme sind die PP7-Haarnadel, die speziell das PCP-Protein rekrutiert, und die „Com“-Haarnadel, die speziell das Com-Protein rekrutiert. Siehe Zalatan et al.
  • Die Nukleotidsequenz der MS2-Haarnadel (oder gleichwertig als „MS2-Aptamer“ bezeichnet) ist: GCCAACATGAGGATCACCCATGTCTGCAGGGCC (SEQ ID NO: 763).
  • Die Aminosäuresequenz von dem MCP oder MS2cp ist:
 GSASNFTQFVLVDNGGTGDVTVAPSNFANGVAEWISSNSRSQAYKVTCSVRQSSAQNR
 KYTIKVEVPKVATQTVGGEELPVAGWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDG
 NPIPSAIAANSGIY (SEQ ID NO: 764).
  • Die MS2-Haarnadel (oder „MS2-Aptamer“) kann auch als eine Art „RNA-Effektor-Rekrutierungsdomäne“ (oder gleichwertig als „RNA-bindende Protein-Rekrutierungsdomäne“ oder einfach als „Rekrutierungsdomäne“) bezeichnet werden, da es sich um eine physikalische Struktur (z. B. eine Haarnadel) handelt, die in eine PEgRNA oder tPERT eingebaut wird und die effektiv andere Effektor-Funktionen (z. B. RNA-bindende Proteine mit verschiedenen Funktionen, wie DNA-Polymerasen oder andere DNA-modifizierende Enzyme) an die PEgRNA oder rPERT rekrutiert, die auf diese Weise modifiziert wird, und somit Effektor-Funktionen in trans zur Prime-Editing-Maschinerie co-lokalisiert. Diese Anmeldung ist in keiner Weise auf bestimmte RNA-Effektor-Rekrutierungsdomänen beschränkt und kann jede verfügbare derartige Domäne umfassen, einschließlich der MS2-Haarnadel. Beispiel 19 und 72(b) zeigen die Verwendung des MS2-Aptamers, das mit einer DNA-Synthese-Domäne (d. h. dem tPERT-Molekül) verbunden ist, und eines Prime-Editors, der ein mit einem PE2 fusioniertes MS2cp-Protein umfasst, um die Co-Lokalisierung des an die Target-DNA-Stelle gebundenen Prime-Editor-Komplexes (MS2cp-PE2:sgRNA-Komplex) und der DNA-Synthese-Domäne des tPERT-Moleküls zu bewirken, um die
  • napDNAbp
  • Der hier verwendete Begriff „Nukleinsäure-programmierbares DNA-bindendes Protein“ oder „napDNAbp“, für das Cas9 ein Beispiel ist, bezieht sich auf Proteine, die die RNA:DNA-Hybridisierung nutzen, um an spezifische Sequenzen in einem DNA-Molekül zu binden. Jedes napDNAbp ist mit mindestens einer Guide-Nukleinsäure (z. B. Guide-RNA) assoziiert, die das napDNAbp an einer DNA-Sequenz lokalisiert, die einen DNA-Strang (d. h. einen Target-Strang) umfasst, der komplementär zu der Guide-Nukleinsäure oder einem Teil davon (z. B. dem Protospacer einer Guide-RNA) ist. Mit anderen Worten: Die Guide-Nukleinsäure „programmiert“ das napDNAbp (z. B. Cas9 oder ein Äquivalent), eine komplementäre Sequenz zu lokalisieren und daran zu binden.
  • Ohne an eine Theorie gebunden zu sein, beinhaltet der Bindungsmechanismus eines napDNAbp - Guide-RNA-Komplexes im Allgemeinen den Schritt der Bildung einer R-Schleife, wodurch das napDNAbp die Abspulung eines Doppelstrang-DNA-Targets induziert und dadurch die Stränge in der durch das napDNAbp gebundenen Region trennt. fDer Protospacer der Guide-RNA hybridisiert dann mit dem „Target-Strang“. Dadurch wird ein „Nicht-Target-Strang“ verdrängt, der komplementär zum Target-Strang ist, der die Einzelstrang-Region der R-Schleife bildet. In einigen Ausführungsformen enthält das napDNAbp eine oder mehrere Nuklease-Aktivitäten, die dann die DNA schneiden und verschiedene Arten von Läsionen hinterlassen. Zum Beispiel kann das napDNAbp eine Nukleaseaktivität aufweisen, die den Nicht-Target-Strang an einer ersten Stelle schneidet und/oder den Target-Strang an einer zweiten Stelle schneidet. Je nach Nukleaseaktivität kann die Target-DNA so geschnitten werden, dass ein „Doppelstrangbruch“ entsteht, bei dem beide Stränge geschnitten werden. In anderen Ausführungsformen kann die Target-DNA nur an einer einzigen Stelle geschnitten werden, d. h. die DNA wird an einem Strang „mit einem Nick versehen“. Beispiele für napDNAbp mit unterschiedlichen Nuklease-Aktivitäten sind „Cas9-Nickase“ („nCas9“) und ein deaktiviertes Cas9 ohne Nuklease-Aktivitäten („totes Cas9“ oder „dCas9“). Beispielhafte Sequenzen für diese und andere napDNAbp sind hier aufgeführt.
  • Nickase
  • Der Begriff „Nickase“ bezieht sich auf ein Cas9, bei dem eine der beiden Nuklease-Domänen inaktiviert ist. Dieses Enzym ist in der Lage, nur einen Strang der Target-DNA zu spalten.
  • Kernlokalisierungssequenz (NLS)
  • Der Begriff „Kernlokalisierungssequenz“ oder „NLS“ bezieht sich auf eine Aminosäuresequenz, die den Import eines Proteins in den Zellkern fördert, zum Beispiel durch Kerntransport. Kernlokalisierungssequenzen sind in der Technik bekannt und für den Fachmann offensichtlich. NLS-Sequenzen werden zum Beispiel in der internationalen PCT-Anmeldung PCT/EP2000/011690 von Plank et al. beschrieben, die am 23. November 2000 eingereicht und am 31. Mai 2001 als WO/2001/038547 veröffentlicht wurde und deren Inhalt durch Verweis auf die Offenbarung beispielhafter Kernlokalisierungssequenzen hierin aufgenommen wird. In einigen Ausführungsformen umfasst eine NLS die Aminosäuresequenz PKKKRKV (SEQ ID NO: 16) oder MDSLLMNRRKFLYQFKNVRWAKGRRETYLC (SEQ ID NO: 17).
  • Nukleinsäuremolekül
  • Der Begriff „Nukleinsäure“, wie er hier verwendet wird, bezieht sich auf ein Polymer aus Nukleotiden. Das Polymer kann natürliche Nukleoside (d. h. Adenosin, Thymidin, Guanosin, Cytidin, Uridin, Desoxyadenosin, Desoxythymidin, Desoxyguanosin und Desoxycytidin), Nukleosid-Analoga (z. B., 2-Aminoadenosin, 2-Thiothymidin, Inosin, Pyrrolo-Pyrimidin, 3-Methyladenosin, 5-Methylcytidin, C5-Bromuridin, C5-Fluoruridin, C5-Joduridin, C5-Propinyluridin, C5-Propinylcytidin, C5-Methylcytidin, 7-Deazaadenosin, 7-Deazaguanosin, 8-Oxoadenosin, 8-Oxoguanosin, O(6)-Methylguanin, 4-Acetylcytidin, 5-(Carboxyhydroxymethyl)uridin, Dihydrouridin, Methylpseudouridin, 1-Methyladenosin, 1-Methylguanosin, N6-Methyladenosin und 2-Thiocytidin), chemisch modifizierte Basen, biologisch modifizierte Basen (z. B., methylierte Basen), interkalierte Basen, modifizierte Zucker (z. B. 2'-Fluororibose, Ribose, 2'-Desoxyribose, 2'-O-Methylcytidin, Arabinose und Hexose) oder modifizierte Phosphatgruppen (z. B. Phosphorothioate und 5' N-Phosphoramidit-Bindungen) beinhalten.
  • PEgRNA
  • Wie hierin verwendet, bezieht sich der Begriff „Prime-Editing-Guide-RNA“ oder „PEgRNA“ oder „erweiterte Guide-RNA“ auf eine spezialisierte Form einer Guide-RNA, die so modifiziert wurde, dass sie eine oder mehrere zusätzliche Sequenzen zur Implementierung der hier beschriebenen Prime-Editing-Verfahren und -Zusammensetzungen beinhaltet. Wie hier beschrieben, umfasst die Prime-Editing-Guide-RNA eine oder mehrere „erweiterte Regionen“ der Nukleinsäuresequenz. Die erweiterten Regionen können aus Einzelstrang-RNA oder DNA bestehen, sind aber nicht darauf beschränkt. Außerdem können die erweiterten Regionen am 3'-Ende einer herkömmlichen Guide-RNA auftreten. In anderen Anordnungen können die erweiterten Regionen am 5'-Ende einer herkömmlichen Guide-RNA auftreten. In noch anderen Anordnungen kann die erweiterte Region in einer intramolekularen Region der traditionellen Guide-RNA vorkommen, zum Beispiel in der gRNA-Kernregion, die mit dem napDNAbp assoziiert und/oder daran bindet. Die erweiterte Region umfasst ein „DNA-Synthese-Template“, das (durch die Polymerase des Prime Editors) für eine Einzelstrang-DNA codiert, die ihrerseits so konzipiert wurde, dass sie (a) homolog zu der zu editierenden endogenen Target-DNA ist und (b) mindestens eine gewünschte Nukleotidänderung (z. B. einen Übergang, eine Transversion, eine Deletion oder eine Insertion) umfasst, die in die endogene Target-DNA eingeführt oder integriert werden soll. Die erweiterte Region kann auch andere funktionelle Sequenzelemente umfassen, wie z. B. eine „Primer-Bindungsstelle“ und eine „Spacer- oder Linker-Sequenz“ oder andere Strukturelemente, wie z. B. Aptamere, Stammschleifen, Haarnadeln, Toe-Loops (z. B. eine 3'-Toe-Loop) oder eine RNA-Protein-Rekrutierungsdomäne (z. B. MS2-Haarnadel). Wie hier verwendet, umfasst die „Primer-Bindungsstelle“ eine Sequenz, die an eine Einzelstrang-DNA-Sequenz mit einem 3'-Ende hybridisiert, das aus der genickten DNA der R-Schleife erzeugt wurde.
  • In bestimmten Ausführungsformen werden die PEgRNAs durch 3A dargestellt, die eine PEgRNA mit einem 5'-Extension-Arm, einem Spacer und einem gRNA-Kern zeigt. Die 5'-Extension umfasst ferner in der 5'- bis 3'-Richtung ein Reverse-Transkriptase-Template, eine Primer-Bindungsstelle und einen Linker. Wie gezeigt, kann das Reverse-Transkriptase-Template auch allgemeiner als „DNA-Synthese-Template“ bezeichnet werden, wenn die Polymerase eines hier beschriebenen Prime Editors keine RT ist, sondern eine andere Art von Polymerase.
  • In bestimmten anderen Ausführungsformen werden die PEgRNAs durch 3B dargestellt, die eine PEgRNA mit einem 5'-Extension-Arm, einem Spacer und einem gRNA-Kern zeigt. Die 5'-Extension umfasst ferner in der 5'- bis 3'-Richtung ein Reverse-Transkriptase-Template, eine Primer-Bindungsstelle und einen Linker. Wie gezeigt, kann das Reverse-Transkriptase-Template auch allgemeiner als „DNA-Synthese-Template“ bezeichnet werden, wenn die Polymerase eines hier beschriebenen Prime Editors keine RT ist, sondern eine andere Art von Polymerase.
  • In noch anderen Ausführungsformen werden die PEgRNAs durch 3D dargestellt, die eine PEgRNA zeigt, die in der 5' bis 3'-Richtung einen Spacer (1), einen gRNA-Kern (2) und einen Extension-Arm (3) aufweist. Der Extension-Arm (3) befindet sich am 3'-Ende der PEgRNA. Der Extension-Arm (3) umfasst ferner in der 5' bis 3'-Richtung eine „Primer-Bindungsstelle“ (A), ein „Edit-Template“ (B) und einen „Homologiearm“ (C). Der Extension-Arm (3) kann auch eine optionale Modifikatorregion an den 3'- und 5'-Enden umfassen, bei denen es sich um dieselben Sequenzen oder unterschiedliche Sequenzen handeln kann. Darüber hinaus kann das 3'-Ende der PEgRNA eine Transkriptionsterminatorsequenz umfassen. Diese Sequenzelemente der PEgRNAs werden hier weiter beschrieben und definiert.
  • In noch anderen Ausführungsformen werden die PEgRNAs durch 3E dargestellt, die eine PEgRNA zeigt, die in der 5' bis 3'-Richtung einen Extension-Arm (3), einen Spacer (1) und einen gRNA-Kern (2) aufweist. Der Extension-Arm (3) befindet sich am 5'-Ende der PEgRNA. Der Extension-Arm (3) umfasst ferner in der 3' bis 5'-Richtung eine „Primer-Bindungsstelle“ (A), ein „Edit-Template“ (B) und einen „Homologiearm“ (C). Der Extension-Arm (3) kann auch eine optionale Modifikatorregion an den 3'- und 5'-Enden umfassen, bei denen es sich um dieselben Sequenzen oder unterschiedliche Sequenzen handeln kann. Die PEgRNAs können auch eine Transkriptionsterminatorsequenz am 3'-Ende umfassen. Diese Sequenzelemente der PEgRNAs werden hier weiter beschrieben und definiert.
  • PE1
  • Wie hier verwendet, bezieht sich „PE1“ auf einen PE-Komplex, der ein Fusionsprotein umfasst, das Cas9(H840A) und ein Wildtyp-MMLV-RT mit der folgenden Struktur aufweist: [NLS]-[Cas9(H840A)]-[Linker]-[MMLV_RT(wt)] + eine gewünschte PEgRNA, wobei die PE-Fusion die Aminosäuresequenz von SEQ ID NO: 123 aufweist, die wie folgt dargestellt wird;
    Figure DE112020001339T5_0005
    Figure DE112020001339T5_0006
  • LEGENDE:
  • NUKLEARE LOKALISIERUNGSSEQUENZ (NLS) OBEN: (SEQ ID NO: 124), UNTEN: (SEQ ID NO: 133)
    CAS9(H840A) (SEQ ID NO: 126)
  • 33-AMINOSÄURELINKER (SEQ ID NO: 127)
  • M-MLV reverse Transkriptase (SEQ ID NO: 128).
  • PE2
  • Wie hier verwendet, bezieht sich „PE2“ auf einen PE-Komplex, der ein Fusionsprotein umfasst, das Cas9(H840A) und eine Varianten-MMLV-RT mit der folgenden Struktur aufweist: [NLS]-[Cas9(H840A)]-[Linker]-[MMLV _RT(D200N)(T330P)(L603W)(T306K)(W313F)] + eine gewünschte PEgRNA, wobei die PE-Fusion die Aminosäuresequenz von SEQ ID NO: 134 aufweist, die wie folgt dargestellt wird:
    Figure DE112020001339T5_0007
    Figure DE112020001339T5_0008
    Figure DE112020001339T5_0009
  • LEGENDE:
  • NUKLEARE LOKALISIERUNGSSEQUENZ (NLS) OBEN: (SEQ ID NO: 124), UNTEN: (SEQ ID NO: 133)
    CAS9(H840A) (SEQ ID NO: 137)
  • 33-AMINOSÄURELINKER (SEQ ID NO: 127)
  • M-MLV reverse Transkriptase (SEQ ID NO: 139).
  • PE3
  • Wie hier verwendet, bezieht sich „PE3“ auf PE2 plus eine Zweitstrang-Nicking-Guide-RNA, die mit PE2 einen Komplex bildet und einen Nick in den nicht-editierten DNA-Strang einführt, um eine bevorzugte Ersetzung des editierten Strangs zu bewirken.
  • PE3b
  • Wie hierin verwendet, bezieht sich „PE3b“ auf PE3, wobei die Zweitstrang-Nicking-Guide-RNA für eine zeitliche Kontrolle ausgelegt ist, so dass der Zweitstrang-Nick erst nach dem Einbau des gewünschten Edits eingeführt wird. Dies wird erreicht, indem eine gRNA mit einer Spacer-Sequenz entworfen wird, die nur mit dem editierten Strang übereinstimmt, aber nicht mit dem ursprünglichen Allel. Bei dieser Strategie, die im Folgenden als PE3b bezeichnet wird, sollten Fehlpaarungen zwischen dem Protospacer und dem nicht editierten Allel das Nicking durch die sgRNA benachteiligen, bis das Editing-Ereignis auf dem PAM-Strang stattgefunden hat.
  • PE-kurz
  • Wie hier verwendet, bezieht sich „PE-kurz“ auf ein PE-Konstrukt, das mit einer C-terminal gekürzten reversen Transkriptase fusioniert ist und die folgende Aminosäuresequenz aufweist:
    Figure DE112020001339T5_0010
    Figure DE112020001339T5_0011
  • LEGENDE:
  • NUKLEARE LOKALISIERUNGSSEQUENZ (NLS) OBEN: (SEQ ID NO: 124), UNTEN: (SEQ ID NO: 133) CAS9(H840A) (SEQ ID NO: 157)
  • 33-AMINOSÄURELINKER 1 (SEQ ID NO: 127)
  • M-MLV GEKÜRZTE REVERSE TRANSKRIPTASE
    (SEQ ID NO: 766)
  • Peptid-Tag
  • Der Begriff „Peptid-Tag“ bezieht sich auf eine Peptid-Aminosäuresequenz, die genetisch an eine Proteinsequenz fusioniert ist, um den Proteinen eine oder mehrere Funktionen zu verleihen, die die Manipulation des Proteins für verschiedene Zwecke erleichtern, wie z. B. Visualisierung, Reinigung, Solubilisierung und Trennung usw. Peptid-Tags können verschiedene Arten von Tags umfassen, die nach Zweck oder Funktion kategorisiert sind. Dazu gehören „Affinitäts-Tags“ (zur Erleichterung der Proteinreinigung), „Solubilisierungs-Tags“ (zur Unterstützung der richtigen Faltung von Proteinen), „Chromatographie-Tags“ (zur Änderung der chromatographischen Eigenschaften von Proteinen), „Epitop-Tags“ (zur Bindung an hochaffine Antikörper), „Fluoreszenz-Tags“ (zur Erleichterung der Visualisierung von Proteinen in einer Zelle oder in vitro).
  • Polymerase
  • Wie hier verwendet, bezieht sich der Begriff „Polymerase“ auf ein Enzym, das einen Nukleotidstrang synthetisiert und das in Verbindung mit den hier beschriebenen Prime-Editor-Systemen verwendet werden kann. Die Polymerase kann eine „Template-abhängige“ Polymerase sein (d. h. eine Polymerase, die einen Nukleotidstrang auf der Grundlage der Reihenfolge der Nukleotidbasen eines Template-Strangs synthetisiert). Die Polymerase kann auch eine „Templateunabhängige“ Polymerase sein (d. h. eine Polymerase, die einen Nukleotidstrang synthetisiert, ohne dass ein Template-Strang erforderlich ist). Eine Polymerase kann auch als „DNA-Polymerase“ oder „RNA-Polymerase“ kategorisiert werden. In verschiedenen Ausführungsformen umfasst das Prime-Editor-System eine DNA-Polymerase. In verschiedenen Ausführungsformen kann die DNA-Polymerase eine „DNA-abhängige DNA-Polymerase“ sein (d. h. das Template-Molekül ist ein DNA-Strang). In solchen Fällen kann das DNA-Template-Molekül eine PEgRNA sein, wobei der Extension-Arm einen DNA-Strang umfasst. In solchen Fällen kann die PEgRNA als chimäre oder hybride PEgRNA bezeichnet werden, die einen RNA-Teil (d. h. die Guide-RNA-Komponenten, einschließlich des Spacers und des gRNA-Kerns) und einen DNA-Teil (d. h. den Extension-Arm) umfasst. In verschiedenen anderen Ausführungsformen kann die DNA-Polymerase eine „RNA-abhängige DNA-Polymerase“ sein (d. h. das Template-Molekül ist ein RNA-Strang). In solchen Fällen ist die PEgRNA RNA, d. h. sie enthält eine RNA-Extension. Der Begriff „Polymerase“ kann sich auch auf ein Enzym beziehen, das die Polymerisation von Nukleotiden katalysiert (d. h. die Polymerase-Aktivität). Im Allgemeinen beginnt das Enzym die Synthese am 3'-Ende eines Primers, der an eine Polynukleotid-Template-Sequenz gebunden ist (z. B. eine Primer-Sequenz, die an die Primer-Bindungsstelle einer PEgRNA gebunden ist), und bewegt sich zum 5'-Ende des Template-Strangs. Eine „DNA-Polymerase“ katalysiert die Polymerisation von Desoxynukleotiden. Wie hier in Bezug auf eine DNA-Polymerase verwendet, umfasst der Begriff DNA-Polymerase ein 2funktionelles Fragment davon“. Ein „funktionelles Fragment davon“ bezieht sich auf jeden Teil einer Wildtyp- oder mutierten DNA-Polymerase, der weniger als die gesamte Aminosäuresequenz der Polymerase umfasst und der unter mindestens einer Reihe von Bedingungen die Fähigkeit behält, die Polymerisation eines Polynukleotids zu katalysieren. Ein solches funktionelles Fragment kann als eigenständige Einheit existieren oder es kann Bestandteil eines größeren Polypeptids sein, wie z. B. eines Fusionsproteins.
  • Prime Editing
  • Wie hier verwendet, bezieht sich der Begriff „Prime Editing“ auf einen neuartigen Ansatz für das Gen-Editing unter Verwendung von napDNAbps, einer Polymerase (z. B. einer reversen Transkriptase) und spezialisierten Guide-RNAs, die ein DNA-Synthese-Template zur Codierung gewünschter neuer genetischer Informationen (oder zur Löschung genetischer Informationen) beinhalten, die dann in eine Target-DNA-Sequenz eingebaut wird. Bestimmte Ausführungsformen des Prime Editing werden in den Ausführungsformen der 1A-1H und 72(a)-72(c) beschrieben, neben anderen Figuren.
  • Prime Editing stellt eine völlig neue Plattform für das Genome Editing dar, das ein vielseitiges und präzises Genom Editing Verfahren ist, bei dem neue genetische Informationen direkt in eine bestimmte DNA-Stelle geschrieben werden, wobei ein mit Nukleinsäure programmierbares DNA-Bindungsprotein („napDNAbp“) in Verbindung mit einer Polymerase (d. h., in Form eines Fusionsproteins oder auf andere Weise in trans mit dem napDNAbp) arbeitet, wobei das Prime Editing System mit einer Prime Editing-(PE) Guide-RNA („PEgRNA“) programmiert ist, die sowohl die Target-Stelle spezifiziert als auch die Synthese des gewünschten Edits in Form eines Ersatz-DNA-Strangs durch eine auf eine Guide-RNA (z. B. am 5'- oder 3'-Ende oder an einem internen Teil einer Guide-RNA) aufgebrachte Extension (entweder DNA oder RNA) vorgibt. Der Ersatzstrang, der das gewünschte Edit (z. B. eine einzelne Nukleobase) enthält, hat die gleiche Sequenz (oder ist homolog dazu) wie der endogene Strang (unmittelbar stromabwärts der Nick-Stelle) der zu editierenden Target-Stelle (mit der Ausnahme, dass er das gewünschte Edit enthält). Durch die DNA-Reparatur- und/oder Replikationsmaschinerie wird der endogene Strang stromabwärts der Nick-Stelle durch den neu synthetisierten Ersatzstrang, der das gewünschte Edit enthält, ersetzt. In einigen Fällen kann das Prime Editing als eine „Suchen-und-Ersetzen“-Technologie zum Genome Editing angesehen werden, da die Prime Editoren, wie hier beschrieben, nicht nur die gewünschte zu editierende Target-Stelle suchen und lokalisieren, sondern gleichzeitig einen Ersatzstrang codieren, der ein gewünschte Editing enthält und anstelle des entsprechenden endogenen DNA-Strangs der Target-Stelle installiert wird. Die Prime Editoren der vorliegenden Offenbarung beziehen sich zum Teil auf die Entdeckung, dass der Mechanismus der Target-primed Reverse Transkription (TPRT) oder des „Prime Editing“ für die Durchführung von präzisem CRISPR/Cas-basiertem Genome Editing mit hoher Effizienz und genetischer Flexibilität genutzt oder angepasst werden kann (z. B. wie in verschiedenen Ausführungsformen der 1A-1F) beschrieben. TPRT wird auf natürliche Weise von mobilen DNA-Elementen wie Nicht-LTR-Retrotransposons von Säugetieren und bakteriellen Introns der Gruppe II verwendet28,29. Die Erfinder haben Cas-Protein-Reverse-Transkriptase-Fusionen oder verwandte Systeme verwendet, um eine spezifische DNA-Sequenz mit einer Guide-RNA anzusteuern, einen Einzelstrang-Nick an der Target-Stelle zu erzeugen und die DNA, die mit einem Nick versehen wurde, als Primer für die reverse Transkription eines konstruierten Reverse-Transkriptase-Templates zu verwenden, die mit der Guide-RNA integriert ist. Während das Konzept jedoch mit Prime Editoren beginnt, die reverse Transkriptase als DNA-Polymerase-Komponente verwenden, sind die hier beschriebenen Prime Editoren nicht auf reverse Transkriptasen beschränkt, sondern können die Verwendung von nahezu jeder DNA-Polymerase beinhalten. Auch wenn in der Anmeldung durchgängig von Prime Editoren mit „reversen Transkriptasen“ die Rede ist, wird hier dargelegt, dass reverse Transkriptasen nur eine Art von DNA-Polymerase sind, die mit Prime Editing arbeiten kann. Wenn also in der Spezifikation von „reverser Transkriptase“ die Rede ist, sollte der Fachmann wissen, dass jede geeignete DNA-Polymerase anstelle der reversen Transkriptase verwendet werden kann. So können die Prime Editoren in einem Aspekt Cas9 (oder ein äquivalentes napDNAbp) umfassen, das so programmiert ist, dass es eine DNA-Sequenz anvisiert, indem es sie mit einer spezialisierten Guide-RNA (d. h. PEgRNA) assoziiert, die eine Spacer-Sequenz enthält, die sich an einen komplementären Protospacer in der Target-DNA anlagert. Die spezialisierte Guide-RNA enthält auch neue genetische Informationen in Form einer Extension, die für einen Ersatz-DNA-Strang codiert, der eine gewünschte genetische Änderung enthält und dazu dient, einen entsprechenden endogenen DNA-Strang an der Target-Stelle zu ersetzen. Um die Information von der PEgRNA auf die Target-DNA zu übertragen, beinhaltet der Mechanismus des Prime Editing das Versehen der Target-Stelle mit einem Nick in einem Strang der DNA, um eine 3'-Hydroxylgruppe freizulegen. Die freiliegende 3'-Hydroxylgruppe kann dann dazu verwendet werden, die DNA-Polymerisation der edit-codierenden Extension der PEgRNA direkt an der Target-Stelle zu starten. In verschiedenen Ausführungsformen kann die Extension, die die Matrize für die Polymerisation des Ersatzstrangs, der das Edit enthält, bereitstellt, aus RNA oder DNA gebildet werden. Im Falle einer RNA-Extension kann die Polymerase des Prime Editors eine RNA-abhängige DNA-Polymerase sein (z. B. eine reverse Transkriptase). Im Falle einer DNA-Extension kann die Polymerase des Prime Editors eine DNA-abhängige DNA-Polymerase sein. Der neu synthetisierte Strang (d. h. der Ersatz-DNA-Strang, der das gewünschte Edit enthält), der von den hierin offenbarten Prime Editoren gebildet wird, wäre homolog zur genomischen Target-Sequenz (d. h. er hätte die gleiche Sequenz wie diese), mit Ausnahme des Einschlusses einer gewünschten Nukleotidextension (z. B. eine einzelne Nukleotidänderung, eine Deletion oder eine Insertion oder eine Kombination davon). Der neu synthetisierte (oder ersetzte) DNA-Strang kann auch als Einzelstrang-DNA-Flap bezeichnet werden, der mit dem komplementären homologen endogenen DNA-Strang um die Hybridisierung konkurriert und dadurch den entsprechenden endogenen Strang verdrängt. In bestimmten Ausführungsformen kann das System mit der Verwendung eines fehleranfälligen Enzyms der reversen Transkriptase kombiniert werden (z. B. als Fusionsprotein mit der Cas9-Domäne oder in trans mit der Cas9-Domäne). Das fehleranfällige Enzym reverse Transkriptase kann während der Synthese des Einzelstrang-DNA-Flaps Änderungen einführen. So kann in bestimmten Ausführungsformen eine fehleranfällige reverse Transkriptase verwendet werden, um Nukleotidänderungen in die Target-DNA einzuführen. Je nach der fehleranfälligen reversen Transkriptase, die mit dem System verwendet wird, können die Änderungen zufällig oder nicht zufällig sein. Die Auflösung des hybridisierten Zwischenprodukts (bestehend aus dem von der reversen Transkriptase synthetisierten Einzelstrang-DNA-Flap, der an den endogenen DNA-Strang hybridisiert wurde) kann die Entfernung des resultierenden verdrängten Flaps der endogenen DNA (z. B. mit einer 5'-End-DNA-Flap-Endonuklease, FEN1), die Ligation des synthetisierten Einzelstrang-DNA-Flaps an die Target-DNA und die Assimilation der gewünschten Nukleotidänderung als Ergebnis zellulärer DNA-Reparatur- und/oder Replikationsprozesse umfassen. Da die durch Template-bestimmte DNA-Synthese eine nukleotidgenaue Modifikation jedes beliebigen Nukleotids, einschließlich Insertionen und Deletionen, ermöglicht, ist der Anwendungsbereich dieses Ansatzes sehr breit gefächert und könnte vorhersehbar für unzählige Anwendungen in der Grundlagenforschung und in der Therapeutik genutzt werden.
  • In verschiedenen Ausführungsformen erfolgt das Prime Editing durch den Kontakt eines Target-DNA-Moleküls (für das eine Änderung in der Nukleotidsequenz eingeführt werden soll) mit einem programmierbaren Nukleinsäure-DNA-Bindeprotein (napDNAbp), das mit einer Prime-Editing-Guide-RNA (PEgRNA) komplexiert ist. Mit Bezug auf 1G umfasst die Prime-Editing-Guide-RNA (PEgRNA) eine Extension am 3'- oder 5'-Ende der Guide-RNA oder an einer intramolekularen Stelle in der Guide-RNA und codiert die gewünschte Nukleotidänderung (z. B. eine einzelne Nukleotidänderung, Insertion oder Deletion). In Schritt (a) kontaktiert der napDNAbp/erweiterte gRNA-Komplex das DNA-Molekül und die erweitete gRNA leitet das napDNAbp zur Bindung an einen Target-Locus. In Schritt (b) wird ein Nick in einen der DNA-Stränge des Target-Locus eingeführt (z. B. durch eine Nuklease oder einen chemischen Wirkstoff), wodurch ein verfügbares 3'-Ende in einem der Stränge des Target-Locus entsteht. In bestimmten Ausführungsformen wird der Nick in dem DNA-Strang erzeugt, der dem R-Schleifen-Strang entspricht, d. h. dem Strang, der nicht mit der RNA-Guide-Sequenz hybridisiert ist, d. h. dem „Nicht-Target-Strang“. Der Nick kann jedoch in einem der beiden Stränge erfolgen. Das heißt, der Nick könnte in den „Target-Strang“ der R-Schleife (d. h. den Strang, der mit dem Protospacer der erweiterten gRNA hybridisiert) oder in den „Nicht-Target-Strang“ (d. h. den Strang, der den Einzelstrang-Teil der R-Schleife bildet und der komplementär zum Target-Strang ist) eingeführt werden. In Schritt (c) interagiert das 3'-Ende des DNA-Strangs (gebildet durch den Nick) mit dem erweiterten Teil der Guide-RNA, um die reverse Transkription zu starten (d. h. „Target-geprimte RT“). In bestimmten Ausführungsformen hybridisiert der DNA-Strang am 3'-Ende mit einer spezifischen RT-Priming-Sequenz auf dem erweiterten Teil der Guide-RNA, d. h. der „Priming-Sequenz der reversen Transkriptase“ oder „Primer-Bindungsstelle“ auf der PEgRNA. In Schritt (d) wird eine reverse Transkriptase (oder eine andere geeignete DNA-Polymerase) eingeführt, die einen einzelnen DNA-Strang vom 3'-Ende der geprimten Stelle zum 5'-Ende der Prime-Editing-Guide-RNA synthetisiert. Die DNA-Polymerase (z. B. Reverse Transkriptase) kann an das napDNAbp fusioniert werden oder alternativ in trans zu dem napDNAbp bereitgestellt werden. Dadurch wird ein Einzelstrang-DNA-Flap gebildet, der die gewünschte Nukleotidänderung (z. B. die Änderung einer einzelnen Base, die Insertion oder die Deletion oder eine Kombination davon) umfasst und der ansonsten homolog zur endogenen DNA an oder neben der Nick-Stelle ist. In Schritt (e) werden das napDNAbp und die Guide-RNA freigesetzt. Die Schritte (f) und (g) beziehen sich auf die Auflösung des Einzelstrang-DNA-Flaps, so dass die gewünschte Nukleotidänderung in den Target-Locus eingebaut wird. Dieser Prozess kann in Richtung der gewünschten Produktbildung vorangetrieben werden, indem der entsprechende endogene 5'-DNA-Flap entfernt wird, der sich bildet, sobald der 3'-Einzelstrang-DNA-Flap in die endogene DNA-Sequenz eindringt und mit ihr hybridisiert. Ohne an eine Theorie gebunden zu sein, lösen die endogenen DNA-Reparatur- und Replikationsprozesse die fehlangepasste DNA auf, um die Nukleotidänderung(en) einzubauen und das gewünschte veränderte Produkt zu bilden. Der Prozess kann auch zur Produktbildung mit einem „zweiten Strang-Nicking“ führen, wie in 1F gezeigt. Bei diesem Prozess können mindestens eine oder mehrere der folgenden genetischen Änderungen auftreten: Transversionen, Transitionen, Deletionen und Insertionen.
  • Der Begriff „Prime-Editor (PE)-System“ oder „Prime-Editor (PE)“ oder „PE-System“ oder „PE-Editing-System“ bezieht sich auf die Zusammensetzungen, die an dem hier beschriebenen Verfahren des Genome Editing unter Verwendung der Target-primed Reverse Transkription (TPRT) beteiligt sind, einschließlich, aber nicht beschränkt auf die napDNAbps, Reverse Transkriptasen, Fusionsproteine (z. B., die napDNAbps und reverse Transkriptasen umfassen), Prime-Editing-Guide-RNAs und Komplexe, die Fusionsproteine und Prime-Editing-Guide-RNAs umfassen, sowie Zusatzelemente, wie Zweitstrang-Nicking-Komponenten (z. B. ZweitstrangsgRNAs) und Endonukleasen zur Entfernung von 5'-endogenen DNA-Flaps (z. B. FEN1), die dazu beitragen, den Prime-Editing-Prozess zur Bildung des editierten Produkts voranzutreiben.
  • Obwohl in den bisher beschriebenen Ausführungsformen die PEgRNA ein einzelnes Molekül darstellt, das eine Guide-RNA (die ihrerseits eine Spacer-Sequenz und einen gRNA-Kern oder ein Gerüst umfasst) und einen 5'- oder 3'-Extension-Arm mit der Primer-Bindungsstelle und einem DNA-Synthese-Template umfasst (siehe z. B. 3D), kann die PEgRNA auch die Form von zwei einzelnen Molekülen annehmen, die aus einer Guide-RNA und einem trans Prime Editor RNA-Template (tPERT) bestehen, in der im Wesentlichen der Extension-Arm (einschließlich insbesondere der Primer-Bindungsstelle und der DNA-Synthese-Domäne) und eine RNA-Protein-Rekrutierungsdomäne (z. B., MS2-Aptamer oder -Haarnadel) in demselben Molekül enthält, das an einen modifizierten Prime-Editor-Komplex colokalisiert oder rekrutiert wird, der ein tPERT-Rekrutierungsprotein (z. B. das MS2cp-Protein, das an das MS2-Aptamer bindet) umfasst. Siehe 3G und 3H als Beispiel für ein tPERT, das mit Prime Editing verwendet werden kann.
  • Prime-Editor
  • Der Begriff „Prime-Editor“ bezieht sich auf die hier beschriebenen Fusionskonstrukte, die eine napDNAbp (z. B. Cas9-Nickase) und eine reverse Transkriptase umfassen und in der Lage sind, Prime Editing an einer Target-Nukleotidsequenz in Gegenwart einer PEgRNA (oder „erweiterten Guide-RNA“) durchzuführen. Der Begriff „Prime-Editor“ kann sich auf das Fusionsprotein oder auf das Fusionsprotein beziehen, das mit einer PEgRNA komplexiert ist, und/oder weiter mit einer Zweitstrang-Nicking-sgRNA komplexiert ist. In einigen Ausführungsformen kann sich der Prime-Editor auch auf den Komplex beziehen, der ein Fusionsprotein (mit einem napDNAbp fusionierte reverse Transkriptase), eine PEgRNA und eine reguläre Guide-RNA umfasst, die in der Lage ist, den Schritt des Nicking der zweiten Stelle des nicht-editierten Strangs zu steuern, wie hier beschrieben. In anderen Ausführungsformen kann die Reverse Transkriptase-Komponente des „Primer-Editors“ in trans bereitgestellt werden.
  • Primer-Bindungsstelle
  • Der Begriff „Primer-Bindungsstelle“ oder „die PBS“ bezieht sich auf die Nukleotidsequenz, die sich auf einer PEgRNA als Bestandteil des Extension-Arms befindet (typischerweise am 3'-Ende des Extension-Arms) und dazu dient, an die Primersequenz zu binden, die nach dem Cas9-Nicking der Target-Sequenz durch den Primer-Editor gebildet wird. Wie an anderer Stelle beschrieben, wird, wenn die Cas9-Nickase-Komponente eines Prime-Editors einen Strang der Target-DNA-Sequenz mit einem Nick versieht, ein 3'-endender ssDNA-Flap gebildet, der als Primer-Sequenz dient, die sich an die Primer-Bindungsstelle auf der PEgRNA anlagert, um die reverse Transkription zu starten. 27 und 28 zeigen Ausführungsformen der Primer-Bindungsstelle, die sich an einem 3'- bzw. 5'-Extension-Arm befindet.
  • Promotor
  • Der Begriff „Promotor“ ist in der Technik anerkannt und bezieht sich auf ein Nukleinsäuremolekül mit einer Sequenz, die von der zellulären Transkriptionsmaschinerie erkannt wird und die Transkription eines stromabwärtigen Gens einleiten kann. Ein Promotor kann konstitutiv aktiv sein, was bedeutet, dass der Promotor in einem bestimmten zellulären Kontext immer aktiv ist, oder bedingt aktiv, was bedeutet, dass der Promotor nur bei Vorliegen einer bestimmten Bedingung aktiv ist. So kann ein bedingter Promotor beispielsweise nur in Anwesenheit eines spezifischen Proteins aktiv sein, das ein mit einem regulatorischen Element im Promotor assoziiertes Protein mit der grundlegenden Transkriptionsmaschinerie verbindet, oder nur in Abwesenheit eines hemmenden Moleküls. Eine Unterklasse der bedingt aktiven Promotoren sind induzierbare Promotoren, die die Anwesenheit eines kleinen Moleküls als „Induzierer“ für ihre Aktivität benötigen. Beispiele für induzierbare Promotoren sind unter anderem Arabinose-induzierbare Promotoren, Tet-on-Promotoren und Tamoxifen-induzierbare Promotoren. Eine Vielzahl von konstitutiven, bedingten und induzierbaren Promotoren ist dem Fachmann gut bekannt, und der Fachmann wird in der Lage sein, eine Vielzahl solcher Promotoren zu ermitteln, die für die Durchführung der vorliegenden Erfindung nützlich sind, die in dieser Hinsicht nicht beschränkt ist.
  • Protospacer
  • Wie hier verwendet, bezieht sich der Begriff „Protospacer“ auf die Sequenz (~20 bp) in der DNA, die an die PAM-Sequenz angrenzt. Der Protospacer hat die gleiche Sequenz wie die Spacer-Sequenz der Guide-RNA. Die Guide-RNA bindet an das Komplement der Protospacer-Sequenz auf der Target-DNA (genauer gesagt, an einen Strang davon, d. h. den „Target-Strang“ im Gegensatz zum „Nicht-Target-Strang“ der Target-DNA-Sequenz). Damit Cas9 funktionieren kann, benötigt es außerdem ein spezifisches Protospacer-benachbartes Motiv (PAM), das je nach Bakterienart des Cas9-Gens variiert. Die am häufigsten verwendete Cas9-Nuklease, die von S. pyogenes stammt, erkennt eine PAM-Sequenz von NGG, die sich direkt stromabwärts der Target-Sequenz in der genomischen DNA auf dem Nicht-Target-Strang befindet. Der Fachmann wird verstehen, dass in der Fachliteratur manchmal der „Protospacer“ als die ~20-nt targetspezifische Guide-Sequenz auf der Guide-RNA selbst bezeichnet wird und nicht als „Spacer“. Daher kann in einigen Fällen der Begriff „Protospacer“, wie er hier verwendet wird, mit dem Begriff „Spacer“ gleichgesetzt werden Der Kontext der Beschreibung, in dem der Begriff „Protospacer“ oder „Spacer“ auftaucht, wird dem Leser helfen zu erkennen, ob sich der Begriff auf die gRNA oder das DNA-Target bezieht.
  • Protospacer-benachbartes Motiv (PAM)
  • Wie hier verwendet, bezieht sich der Begriff „Protospacer-benachbartes Motiv“ oder „PAM“ auf eine DNA-Sequenz mit etwa 2-6 Basenpaaren, die eine wichtige Targetkomponente einer Cas9-Nuklease ist. Normalerweise befindet sich die PAM-Sequenz auf einem der beiden Stränge und liegt stromabwärts in der 5' bis 3'-Richtung der Cas9-Schnittstelle. Die kanonische PAM-Sequenz (d. h. die PAM-Sequenz, die mit der Cas9-Nuklease von Streptococcus pyogenes oder SpCas9 assoziiert ist) ist 5'-NGG-3', wobei „N“ eine beliebige Nukleobase, gefolgt von zwei Guanin-Nukleobasen („G“) ist. Verschiedene PAM-Sequenzen können mit verschiedenen Cas9-Nukleasen oder gleichwertigen Proteinen aus verschiedenen Organismen assoziiert werden. Darüber hinaus kann jede Cas9-Nuklease, z. B. SpCas9, modifiziert werden, um die PAM-Spezifität der Nuklease zu verändern, so dass die Nuklease eine andere PAM-Sequenz erkennt.
  • Zum Beispiel ist die kanonische SpCas9-Aminosäuresequenz SEQ ID NO: 18, kann die PAM-Sequenz durch Einführen einer oder mehrerer Mutationen modifiziert werden, einschließlich (a) D1135V, R1335Q und T1337R „die VQR-Variante“, die die PAM-Spezifität für NGAN oder NGNG verändert, (b) D1135E, R1335Q und T1337R „die EQR-Variante“, die die PAM-Spezifität für NGAG verändert, und (c) D1135V, G1218R, R1335E und T1337R „die VRER-Variante“, die die PAM-Spezifität für NGCG verändert. Außerdem erkennt die D1135E-Variante des kanonischen SpCas9 immer noch NGG, aber sie ist selektiver als das Wildtyp-SpCas9-Protein.
  • Es ist auch bekannt, dass Cas9-Enzyme aus verschiedenen bakteriellen Spezies (d. h. Cas9-Orthologe) unterschiedliche PAM-Spezifitäten haben können. Cas9 aus Staphylococcus aureus (SaCas9) erkennt zum Beispiel NGRRT oder NGRRN. Darüber hinaus erkennt Cas9 aus Neisseria meningitis (NmCas) NNNNGATT. In einem weiteren Beispiel erkennt Cas9 aus Streptococcus thermophilis (StCas9) NNAGAAW. In noch einem weiteren Beispiel erkennt Cas9 aus Treponema denticola (TdCas) NAAAAC. Diese Beispiele sind nicht als Einschränkung gedacht. Es wird weiter deutlich, dass Nicht-SpCas9 eine Vielzahl von PAM-Sequenzen binden, was sie nützlich macht, wenn keine geeignete SpCas9-PAM-Sequenz an der gewünschten TargetSchnittstelle vorhanden ist. Außerdem können Nicht-SpCas9s andere Eigenschaften haben, die sie nützlicher machen als SpCas9. Cas9 aus Staphylococcus aureus (SaCas9) ist beispielsweise etwa 1 Kilobase kleiner als SpCas9, so dass es in ein Adeno-assoziiertes Virus (AAV) verpackt werden kann. Weitere Hinweise finden Sie in Shah et al., „Protospacer recognition motifs: mixed identities and functional diversity“, RNA Biology, 10(5): 891-899 (welches hier durch Bezugnahme aufgenommen ist).
  • Rekombinase
  • Der Begriff „Rekombinase“, wie er hier verwendet wird, bezieht sich auf ein ortsspezifisches Enzym, das die Rekombination von DNA zwischen Rekombinase-Erkennungssequenzen vermittelt, was zur Exzision, Integration, Inversion oder zum Austausch (z. B. Translokation) von DNA-Fragmenten zwischen den Rekombinase-Erkennungssequenzen führt. Rekombinasen lassen sich in zwei verschiedene Familien einteilen: Serin-Rekombinasen (z. B. Resolvasen und Invertasen) und Tyrosin-Rekombinasen (z. B. Integrasen). Beispiele für Serin-Rekombinasen sind, ohne Einschränkung, Hin, Gin, Tn3, β-six, CinH, ParA, γδ, Bxb1, ΦC31, TP901, TG1, φBT1, R4, φPV1, φFC1 MR11, A118, U153 und gp29. Beispiele für Tyrosin-Rekombinasen sind, ohne Einschränkung, Cre, FLP, R, Lambda, HK101, HK022 und pSAM2. Die Namen Serin- und Tyrosin-Rekombinase stammen von dem konservierten nukleophilen Aminosäurerest, mit dem die Rekombinase die DNA angreift und der während des Strangaustauschs kovalent an die DNA gebunden wird. Rekombinasen haben zahlreiche Anwendungen, darunter die Schaffung von Gen-Knockouts/Knock-ins und Gentherapie-Anwendungen. Siehe, z. B., Brown et al., „Serine recombinases as tools for genome engineering.“ Methods. 2011;53(4):372-9; Hirano et al., „Site-specific recombinases as tools for heterologous gene integration.“ Appl. Microbiol. Biotechnol. 2011; 92(2):227-39; Chavez und Calos, „Therapeutic applications of the ΦC31 integrase system.“ Curr. Gene Ther. 2011; 11(5):375-81; Turan ud Bode, „Site-specific recombinases: from tag-and-target- to tag-and-exchange-based genomic modifications.“ FASEB J. 2011; 25(12):4088-107; Venken und Bellen, „Genome-wide manipulations of Drosophila melanogaster with transposons, Flp recombinase, and ΦC31 integrase.“ Methods Mol. Biol. 2012; 859:203-28; Murphy, „Phage recombinases and their applications.“ Adv. Virus Res. 2012; 83:367-414; Zhang et al., „Conditional gene manipulation: Cre-ating a new biological era.“ J. Zhejiang Univ. Sci. B. 2012; 13(7):511-24; Karpenshif und Bernstein, „From yeast to mammals: recent advances in genetic control of homologous recombination.“ DNA Repair (Amst). 2012; 1;11(10):781-8; der gesamte Inhalt wird hiermit in vollem Umfang durch Bezugnahme aufgenommen. Die hier aufgeführten Rekombinasen sind nicht als exklusive Beispiele für Rekombinasen zu verstehen, die in Ausführungsformen der Erfindung verwendet werden können. Die Verfahren und Zusammensetzungen der Erfindung können erweitert werden, indem Datenbanken nach neuen orthogonalen Rekombinasen durchsucht werden oder synthetische Rekombinasen mit definierten DNA-Spezifitäten entwickelt werden (siehe z. B. Groth et al., „Phage integrases: biology and applications“ J. Mol. Biol. 2004; 335, 667-678; Gordley et al., „Synthesis of programmable integrases.“ Proc. Natl. Acad. Sci. US A. 2009; 106, 5053-5058; der gesamte Inhalt wird hiermit in vollem Umfang durch Bezugnahme aufgenommen). Andere Beispiele für Rekombinasen, die in den hier beschriebenen Verfahren und Zusammensetzungen nützlich sind, sind dem Fachmann bekannt, und es wird erwartet, dass jede neue Rekombinase, die entdeckt oder erzeugt wird, in den verschiedenen Ausführungsformen der Erfindung verwendet werden kann. In einigen Ausführungsformen sind die katalytischen Domänen einer Rekombinase an eine Nuklease-inaktivierte RNA-programmierbare Nuklease (z. B. dCas9 oder ein Fragment davon) fusioniert, so dass die Rekombinase-Domäne keine Nukleinsäure-Bindungsdomäne umfasst oder nicht in der Lage ist, an eine Target-Nukleinsäure zu binden (z. B.ist die Rekombinase-Domäne so konstruiert, dass sie keine spezifische DNA-Bindungsaktivität besitzt). Rekombinasen, denen es an DNA-Bindungsaktivität mangelt, und Verfahren zur Herstellung solcher Rekombinasen sind bekannt, z. B. die von Klippel et al, „Isolation and characterisation of unusual gin mutants.“ EMBO J. 1988; 7: 3983-3989: Burke et al., „Activating mutations of Tn3 resolvase marking interfaces important in recombination catalysis and its regulation.“ Mol Microbiol. 2004; 51: 937-948; Olorunniji et al., „Synapsis and catalysis by activated Tn3 resolvase mutants.“ Nucleic Acids Res. 2008; 36: 7181-7191; Rowland et al., „Regulatory mutations in Sin recombinase support a structure-based model of the synaptosome.“ Mol Microbiol. 2009; 74: 282-298; Akopian et al., „Chimeric recombinases with designed DNA sequence recognition.“ Proc Natl Acad Sci USA. 2003;100: 8688-8691; Gordley et al., „Evolution of programmable zinc finger-recombinases with activity in human cells.“ J Mol Biol. 2007; 367: 802-813; Gordley et al., „Synthesis of programmable integrases.“ Proc Natl Acad Sci USA. 2009;106: 5053-5058; Arnold et al., „Mutants of Tn3 resolvase which do not require accessory binding sites for recombination activity.“ EMBO J. 1999; 18: 1407-1414; Gaj et al., „Structure-guided reprogramming of serine recombinase DNA sequence specificity.“ Proc Natl Acad Sci USA. 2011;108(2):498-503; und Proudfoot et al., „Zinc finger recombinases with adaptable DNA sequence specificity.“ PLoS One. 2011;6(4):e19537; der gesamte Inhalt ist hiermit durch Bezugnahme aufgenommen. Zum Beispiel haben die Serin-Rekombinasen der Resolvase-Invertase-Gruppe, z. B. die Tn3- und γδ-Resolvasen und die Hin- und Gin-Invertasen, modulare Strukturen mit autonomen katalytischen und DNA-bindenden Domänen (Siehe z. B. Grindley et al., „Mechanism of site-specific recombination.“ Ann Rev Biochem. 2006; 75: 567-605, deren gesamter Inhalt durch Bezugnahme aufgenommen wird). Die katalytischen Domänen dieser Rekombinasen können daher mit Nuklease-inaktivierten RNA-programmierbaren Nukleasen (z. B. dCas9 oder einem Fragment davon) rekombiniert werden, wie hier beschrieben, z. B. nach der Isolierung von „aktivierten“ Rekombinase-Mutanten, die keine zusätzlichen Faktoren (z. B. DNA-Bindungsaktivitäten) benötigen (siehe z. B. Klippel et al., „Isolation and characterisation of unusual gin mutants.“ EMBO J. 1988; 7: 3983-3989: Burke et al., „Activating mutations of Tn3 resolvase marking interfaces important in recombination catalysis and its regulation.“ Mol Microbiol. 2004; 51: 937-948; Olorunniji et al., „Synapsis and catalysis by activated Tn3 resolvase mutants.“ Nucleic Acids Res. 2008; 36: 7181-7191; Rowland et al., „Regulatory mutations in Sin recombinase support a structure-based model of the synaptosome.“ Mol Microbiol. 2009; 74: 282-298; Akopian et al., „Chimeric recombinases with designed DNA sequence recognition.“ Proc Natl Acad Sci USA. 2003; 100: 8688-8691). Darüber hinaus sind viele andere natürliche Serin-Rekombinasen mit einer N-terminalen katalytischen Domäne und einer C-terminalen DNA-Bindungsdomäne bekannt (z. B. phiC31 Integrase, TnpX Transposase, IS607 Transposase), und ihre katalytischen Domänen können zur Entwicklung programmierbarer ortsspezifischer Rekombinasen, wie hier beschrieben, genutzt werden (siehe z .B. Smith et al., „Diversity in the serine recombinases.“ Mol Microbiol. 2002;44: 299-307, deren gesamter Inhalt durch Bezugnahme aufgenommen wird). Auch die katalytischen Kerndomänen von Tyrosin-Rekombinasen (z. B.Cre, λ-Integrase) sind bekannt und können in ähnlicher Weise genutzt werden, um programmierbare ortsspezifische Rekombinasen zu entwickeln, wie hier beschrieben (siehe z. B. Guo et al., „Structure of Cre recombinase complexed with DNA in a site-specific recombination synapse.“ Nature. 1997; 389:40-46; Härtung et al., „Cre mutants with altered DNA binding properties.“ JBiol Chem 1998; 273:22884-22891; Shaikh et al., „Chimeras of the Flp and Cre recombinases: Tests of the mode of cleavage by Flp and Cre.“ JMol Biol. 2000; 302:27-48; Rongrong et al., „Effect of deletion mutation on the recombination activity of Cre recombinase.“ Acta Biochim Pol. 2005; 52:541-544; Kilbride et al., „Determinants of product topology in a hybrid Cre-Tn3 resolvase site-specific recombination system.“ J Mol Biol. 2006; 355:185-195; Warren et al., „A chimeric cre recombinase with regulated directionality.“ Proc Natl Acad Sci USA. 2008 105:18278-18283; Van Duyne, „Teaching Cre to follow directions.“ Proc Natl Acad Sci USA. 2009 Jan 6;106(1):4-5; Numrych et al., „A comparison of the effects of single-base and triple-base changes in the integrase arm-type binding sites on the site-specific recombination of bacteriophage λ.“ Nucleic Acids Res. 1990; 18:3953-3959; Tirumalai et al., „The recognition of core-type DNA sites by λ integrase.“ J Mol Biol. 1998; 279:513-527; Aihara et al., „A conformational switch controls the DNA cleavage activity of λ integrase.“ Mol Cell. 2003; 12:187-198; Biswas et al., „A structural basis for allosteric control of DNA recombination by λ integrase.“ Nature. 2005; 435:1059-1066; und Warren et al., „Mutations in the amino-terminal domain of λ-integrase have differential effects on integrative and excisive recombination.“ Mol Microbiol. 2005; 55:1104-1112; deren gesamter Inhalt durch Bezugnahme aufgenommen ist).
  • Rekombinase-Erkennungssequenz
  • Der Begriff „Rekombinase-Erkennungssequenz“ oder auch „RRS“ oder „Rekombinase-Target-Sequenz“, wie er hier verwendet wird, bezieht sich auf eine Nukleotidsequenz, die von einer Rekombinase erkannt wird und die einen Strangaustausch mit einem anderen DNA-Molekül erfährt, das die RRS aufweist, was zu Exzision, Integration, Inversion oder Austausch von DNA-Fragmenten zwischen den Rekombinase-Erkennungssequenzen führt.
  • Rekombinieren oder Rekombination
  • Der Begriff „rekombinieren“ oder „Rekombination“ bezieht sich im Zusammenhang mit einer Nukleinsäuremodifikation (z. B. einer genomischen Modifikation) auf den Prozess, bei dem zwei oder mehr Nukleinsäuremoleküle oder zwei oder mehr Regionen eines einzelnen Nukleinsäuremoleküls durch die Wirkung eines Rekombinaseproteins (z. B. eines hierin enthaltenen erfindungsgemäßen Rekombinase-Fusionsproteins) modifiziert werden. Die Rekombination kann unter anderem zu einer Insertion, Inversion, Exzision oder Translokation von Nukleinsäuren führen, z. B. in oder zwischen einem oder mehreren Nukleinsäuremolekülen.
  • Rekombinase-Erkennungssequenzen
  • Reverse Transkriptase
  • Der Begriff „reverse Transkriptase“ beschreibt eine Klasse von Polymerasen, die als RNAabhängige DNA-Polymerasen bezeichnet werden. Alle bekannten reversen Transkriptasen benötigen einen Primer, um ein DNA-Transkript aus einem RNA-Template zu synthetisieren. In der Vergangenheit wurde die reverse Transkriptase vor allem dazu verwendet, mRNA in cDNA zu transkribieren, die dann zur weiteren Bearbeitung in einen Vektor kloniert werden kann. Die reverse Transkriptase des Avian Myoblastosis Virus (AMV) war die erste weit verbreitete RNAabhängige DNA-Polymerase (Verma, Biochim. Biophys. Acta 473:1 (1977)). Das Enzym hat 5'-3'-RNA-gerichtete DNA-Polymerase-Aktivität, 5'-3'-DNA-gerichtete DNA-Polymerase-Aktivität und RNase H-Aktivität. RNase H ist eine prozessive 5'- und 3'-Ribonuklease, die spezifisch für den RNA-Strang für RNA-DNA-Hybride ist (Perbal, A Practical Guide to Molecular Cloning, New York: Wiley & Sons (1984)). Fehler in der Transkription können von der reversen Transkriptase nicht korrigiert werden, da den bekannten viralen reversen Transkriptasen die für das Korrekturlesen notwendige 3'-5'-Exonuklease-Aktivität fehlt (Saunders und Saunders, Microbial Genetics Applied to Biotechnology, London: Croom Helm (1987)). Eine detaillierte Studie über die Aktivität der reversen Transkriptase des AMV und die damit verbundene RNase H-Aktivität wurde von Berger et al. in Biochemistry 22:2365-2372 (1983) vorgestellt. Eine weitere reverse Transkriptase, die in der Molekularbiologie häufig verwendet wird, ist die aus dem Moloney-Mausleukämievirus (M-MLV) stammende reverse Transkriptase. Siehe, z. B., Gerard, G. R., DNA 5:271-279 (1986) und Kotewicz, M. L., et al., Gene 35:249-258 (1985). Es wurde auch eine M-MLV reverse Transkriptase beschrieben, der die RNase H Aktivität weitgehend fehlt. Siehe, z. B., US-Patent Nr. 5,244,797. Die Erfindung sieht die Verwendung solcher reversen Transkriptasen oder von Varianten oder Mutanten davon vor.
  • Darüber hinaus sieht die Erfindung die Verwendung von reversen Transkriptasen vor, die fehleranfällig sind, d. h. die als fehleranfällige reverse Transkriptasen oder reverse Transkriptasen bezeichnet werden können, die den Einbau von Nukleotiden während der Polymerisation nicht mit hoher Zuverlässigkeit unterstützen. Während der Synthese des Einzelstrang-DNA-Flaps auf der Grundlage des RT-Templates, die mit der Guide-RNA integriert ist, kann die fehleranfällige reverse Transkriptase ein oder mehrere Nukleotide einführen, die nicht mit der RT-Template-Sequenz übereinstimmen, wodurch Änderungen der Nukleotidsequenz durch fehlerhafte Polymerisation des Einzelstrang-DNA-Flaps entstehen. Diese Fehler, die während der Synthese des Einzelstrang-DNA-Flaps entstanden sind, werden dann durch Hybridisierung mit dem entsprechenden endogenen Target-Strang, Entfernung des endogenen verdrängten Strangs, Ligation und dann durch eine weitere Runde endogener DNA-Reparatur- und/oder Sequenzierungsprozesse in das Doppelstrangmolekül integriert.
  • Reverse Transkription
  • Der hier verwendete Begriff „reverse Transkription“ bezeichnet die Fähigkeit eines Enzyms, einen DNA-Strang (d. h. komplementäre DNA oder cDNA) unter Verwendung von RNA als Template zu synthetisieren. In einigen Ausführungsformen kann die reverse Transkription eine „fehleranfällige reverse Transkription“ sein, was sich auf die Eigenschaften bestimmter Enzyme der reversen Transkriptase bezieht, die in ihrer DNA-Polymerisationsaktivität fehleranfällig sind.
  • PACE
  • Der Begriff „Phagen-unterstützte kontinuierliche Evolution (PACE)“, wie er hier verwendet wird, bezieht sich auf die kontinuierliche Evolution, bei der Phagen als virale Vektoren eingesetzt werden. Das allgemeine Konzept der PACE-Technologie wurde beispielsweise beschrieben in der internationalen PCT-Anmeldung PCT/US2009/056194 , eingereicht am 8. September 2009, veröffentlicht als WO 2010/028347 am 11. März 2010; der internationalen PCT-Anmeldung PCT/US2011/066747 , eingereicht am 22. Dezember 2011, veröffentlicht als WO 2012/088381 am 28. Juni 2012; der US-Anmeldung US-Patent Nr. 9,023,594 , ausgestellt am 5. Mai 2015, der internationalen PCT-Anmeldung, PCT/US2015/012022 , eingereicht am 20. Januar 2015, veröffentlicht als WO 2015/134121 am 11. September 2015, und der internationalen PCT-Anmeldung, PCT/US2016/027795 , eingereicht am 15. April 2016, veröffentlicht als WO 2016/168631 am 20. Oktober 2016, deren gesamter Inhalt hier durch Bezugnahme aufgenommen wird.
  • Phase
  • Der Begriff „Phage“, der hier austauschbar mit dem Begriff „Bakteriophage“ verwendet wird, bezieht sich auf ein Virus, das bakterielle Zellen infiziert. Phagen bestehen in der Regel aus einem äußeren Proteinkapsid, das genetisches Material umschließt. Das genetische Material kann ssRNA, dsRNA, ssDNA oder dsDNA sein, entweder in linearer oder kreisförmiger Form. Phagen und Phagenvektoren sind dem Fachmann wohlbekannt und nicht einschränkende Beispiele für Phagen, die für die Durchführung der hier bereitgestellten PACE-Verfahren nützlich sind, sind λ (Lysogen), T2, T4, T7, T12, R17, M13, MS2, G4, P1, P2, P4, Phi X174, N4, Φ6 und Φ29. In bestimmten Ausführungsformen ist der in der vorliegenden Erfindung verwendete Phage M13. Weitere geeignete Phagen und Wirtszellen sind für den Fachmann offensichtlich, und die Erfindung ist in diesem Punkt nicht beschränkt. Für eine beispielhafte Beschreibung weiterer geeigneter Phagen und Wirtszellen siehe Elizabeth Kutter und Alexander Sulakvelidze: Bacteriophages: Biology and Applications. CRC Press; 1. Auflage (Dezember 2004), ISBN: 0849313368; Martha R. J. Clokie und Andrew M. Kropinski: Bacteriophages: Methods and Protocols, Band 1: Isolation, Characterization, and Interactions (Methods in Molecular Biology) Humana Press; 1. Auflage (Dezember 2008), ISBN: 1588296822; Martha R. J. Clokie und Andrew M. Kropinski: Bacteriophages: Methods and Protocols, Band 2: Molecular and Applied Aspects (Methods in Molecular Biology) Humana Press; 1. Auflage (Dezember 2008), ISBN: 1603275649, die hier vollständig durch Bezugnahme auf die Offenbarung geeigneter Phagen und Wirtszellen sowie auf Verfahren und Protokolle zur Isolierung, Kultur und Manipulation solcher Phagen einbezogen sind).
  • Protein, Peptid und Polypeptid
  • Die Begriffe „Protein“, „Peptid“ und „Polypeptid“ werden hier austauschbar verwendet und beziehen sich auf ein Polymer aus Aminosäureresten, die durch Peptid-(Amid-)Bindungen miteinander verbunden sind. Die Begriffe beziehen sich auf ein Protein, Peptid oder Polypeptid beliebiger Größe, Struktur oder Funktion. In der Regel ist ein Protein, Peptid oder Polypeptid mindestens drei Aminosäuren lang. Ein Protein, Peptid oder Polypeptid kann sich auf ein einzelnes Protein oder eine Sammlung von Proteinen beziehen. Eine oder mehrere der Aminosäuren in einem Protein, Peptid oder Polypeptid können modifiziert sein, zum Beispiel durch Hinzufügen einer chemischen Einheit wie einer Kohlenhydratgruppe, einer Hydroxylgruppe, einer Phosphatgruppe, einer Famesylgruppe, einer Isofamesylgruppe, einer Fettsäuregruppe, eines Linkers zur Konjugation, Funktionalisierung oder einer anderen Modifikation, usw. Ein Protein, Peptid oder Polypeptid kann auch ein einzelnes Molekül sein oder einen multimolekularen Komplex darstellen. Ein Protein, Peptid oder Polypeptid kann nur ein Fragment eines natürlich vorkommenden Proteins oder Peptids sein,. Ein Protein, Peptid oder Polypeptid kann natürlich vorkommen, rekombinant oder synthetisch sein, oder eine Kombination davon. Jedes hierin bereitgestellte Protein kann gemäß jedem in der Technik bekannten Verfahren hergestellt werden. Zum Beispiel können die hier bereitgestellten Proteine durch rekombinante Proteinexpression und -reinigung hergestellt werden, was sich besonders für Fusionsproteine eignet, die einen Peptidlinker umfassen. Die Verfahren zur Expression und Reinigung rekombinanter Proteine sind allgemein bekannt und werden unter anderem von Green und Sambrook, Molecular Cloning: A Laboratory Manual, 4. Aufl., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (2012)) beschrieben, dessen Inhalt hier durch Verweis aufgenommen wird.
  • Proteinspleißen
  • Der Begriff „Proteinspleißen“, wie er hier verwendet wird, bezieht sich auf einen Prozess, bei dem eine Sequenz, ein Intein (oder gegebenenfalls gespaltene Inteine), aus einer Aminosäuresequenz herausgeschnitten wird und die verbleibenden Fragmente der Aminosäuresequenz, die Exteine, über eine Amidbindung ligiert werden, um eine kontinuierliche Aminosäuresequenz zu bilden. Der Begriff „trans“-Proteinspleißen bezieht sich auf den speziellen Fall, dass die Inteine gespaltene Inteine sind und sich auf verschiedenen Proteinen befinden.
  • Zweitstrang-Nicking
  • Die Auflösung von Heteroduplex-DNA (d. h. mit einem editierten und einem nichteditierten Strang), die als Ergebnis des Prime Editing entsteht, bestimmt die langfristigen Editing-Ergebnisse. Mit anderen Worten: Ein Target des Prime Editing ist die Auflösung der Heteroduplex-DNA (der editierte Strang gepaart mit dem endogenen, nicht editierten Strang), die als Zwischenprodukt von PE entsteht, indem der editierte Strang dauerhaft in den komplementären, endogenen Strang integriert wird. Der Ansatz des „Zweitstrang-Nicking“ kann hier verwendet werden, um die Auflösung von Heteroduplex-DNA zugunsten einer dauerhaften Integration des editierten Strangs in das DNA-Molekül zu unterstützen. Wie hier verwendet, bezieht sich das Konzept des „Zweitstrang-Nicking“ auf die Einführung eines zweiten Nicks an einer Stelle stromabwärts des ersten Nicks (d. h. der anfänglichen Nick-Stelle, die das freie 3'-Ende für die Verwendung beim Priming der reversen Transkriptase auf dem erweiterten Teil der Guide-RNA bereitstellt), vorzugsweise auf dem nicht editierten Strang. In bestimmten Ausführungsformen befinden sich der erste Nick und der zweite Nick auf gegenüberliegenden Strängen. In anderen Ausführungsformen befinden sich der erste Nick und der zweite Nick auf gegenüberliegenden Strängen. In einer weiteren Ausführungsform befindet sich der erste Nick auf dem Nicht-Target-Strang (d. h. dem Strang, der den Einzelstrangteil der R-Schleife bildet) und der zweite Nick auf dem Target-Strang. In wieder anderen Ausführungsformen befindet sich der erste Nick auf dem editierten Strang und der zweite Nick auf dem nicht editierten Strang. Der zweite Nick kann mindestens 5 Nukleotide stromabwärts des ersten Nicks oder mindestens 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140 oder 150 oder mehr Nukleotide stromabwärts des ersten Nicks positioniert sein. Der zweite Nick kann in bestimmten Ausführungsformen zwischen etwa 5-150 Nukleotiden auf dem nicht editierten Strang eingefügt werden, entfernt von der Stelle des PEgRNA-induzierten Nicks, oder zwischen etwa 5-140, oder zwischen etwa 5-130, oder zwischen etwa 5-120, oder zwischen etwa 5-110, oder zwischen etwa 5-100, oder zwischen etwa 5-90, oder zwischen etwa 5-80, oder zwischen etwa 5-70, oder zwischen etwa 5-60, oder zwischen etwa 5-50, oder zwischen etwa 5-40, oder zwischen etwa 5-30, oder zwischen etwa 5-20, oder zwischen etwa 5-10. In einer Ausführungsform wird der zweite Nick in einem Abstand von 14-116 Nukleotiden von dem PEgRNA-induzierten Nick eingefügt. Ohne an eine Theorie gebunden zu sein, veranlasst der zweite Nick die endogenen DNA-Reparatur- und Replikationsprozesse der Zelle zum Ersatz oder zum Editing des nicht editierten Strangs, wodurch die editierte Sequenz dauerhaft auf beiden Strängen eingebaut und der Heteroduplex, der als Ergebnis von PE gebildet wird, aufgelöst wird. In einigen Ausführungsformen ist der editierte Strang der Nicht-Target-Strang und der nicht editierte Strang der Targetstrang. In anderen Ausführungsformen ist der editierte Strang der Targetstrang und der uneditierte Strang ist der Nicht-Target-Strang.
  • Sense-Strang
  • In der Genetik ist ein „Sense“-Strang das Segment innerhalb der Doppelstrang-DNA, das von 5' nach 3' verläuft und das komplementär zum Antisense-Strang der DNA, dem Template-Strang, ist, der von 3' nach 5' verläuft. Im Falle eines DNA-Segments, das für ein Protein codiert, ist der Sense-Strang der DNA-Strang, der die gleiche Sequenz wie die mRNA hat, die während der Transkription den Antisense-Strang als Template verwendet und schließlich (typischerweise, aber nicht immer) in ein Protein übersetzt wird. Der Antisense-Strang ist also für die RNA verantwortlich, die später in Protein übersetzt wird, während der Sense-Strang einen nahezu identischen Aufbau wie die mRNA besitzt. Es ist zu beachten, dass es für jedes Segment der dsDNA möglicherweise zwei Sätze von Sense und Antisense gibt, je nachdem, in welche Richtung gelesen wird (da Sense und Antisense relativ zur Perspektive sind). Letztlich ist es das Genprodukt, die mRNA, die bestimmt, welcher Strang eines dsDNA-Segments als Sense oder Antisense bezeichnet wird.
  • Im Zusammenhang mit einer PEgRNA besteht der erste Schritt in der Synthese einer einzelsträngigen komplementären DNA (d. h. des 3' ssDNA-Flaps, der eingebaut wird), die in der 5'-zu-3'-Richtung orientiert ist und vom PEgRNA-Extension-Arm abgeleitet wird. Ob der 3' ssDNA-Flap als Sense- oder Antisense-Strang zu betrachten ist, hängt von der Richtung der Transkription ab, da es allgemein anerkannt ist, dass beide Stränge der DNA als Template für die Transkription dienen können (aber nicht gleichzeitig). In einigen Ausführungsformen dient also der 3' ssDNA-Flap (der insgesamt in der 5'-zu-3'-Richtung verläuft) als Sense-Strang, da er der codierende Strang ist. In anderen Ausführungsformen dient der 3' ssDNA-Flap (der insgesamt in Richtung 5' zu 3' verläuft) als Antisense-Strang und damit als Template für die Transkription.
  • Spacer-Sequenz
  • Wie hier verwendet, bezieht sich der Begriff „Spacer-Sequenz“ in Verbindung mit einer Guide-RNA oder einer PEgRNA auf den Teil der Guide-RNA oder PEgRNA von etwa 20 Nukleotiden, der eine Nukleotidsequenz enthält, die komplementär zur Protospacer-Sequenz in der Target-DNA-Sequenz ist. Die Spacer-Sequenz lagert an die Protospacer-Sequenz an, um eine ssRNA/ssDNA-Hybridstruktur an der Target-Stelle und eine entsprechende R-Schleifen-sDNA-Struktur des endogenen DNA-Strangs zu bilden, die komplementär zur Protospacer-Sequenz ist.
  • Subjekt
  • Der Begriff „Subjekt“, wie er hier verwendet wird, bezieht sich auf einen einzelnen Organismus, zum Beispiel ein einzelnes Säugetier. In einigen Ausführungsformen ist das Subjekt ein Mensch. In einigen Ausführungsformen ist das Subjekt ein nicht menschliches Säugetier. In einigen Ausführungsformen ist das Subjekt ein nicht menschlicher Primat. In einigen Ausführungsformen ist das Subjekt ein Nagetier. In einigen Ausführungsformen ist das Subjekt ein Schaf, eine Ziege, ein Rind, eine Katze oder ein Hund. In einigen Ausführungsformen ist das Subjekt ein Wirbeltier, eine Amphibie, ein Reptil, ein Fisch, ein Insekt, eine Fliege oder ein Fadenwurm. In einigen Ausführungsformen ist das Subjekt ein Forschungstier. In einigen Ausführungsformen ist das Subjekt gentechnisch verändert, z. B. ein gentechnisch verändertes nicht menschliches Subjekt. Das Subjekt kann beiden Geschlechtern angehören und sich in jedem Entwicklungsstadium befinden.
  • Split-Intein
  • Obwohl Inteine am häufigsten als zusammenhängende Domäne vorkommen, gibt es auch einige in einer natürlich geteilten Form. In diesem Fall werden die beiden Fragmente als separate Polypeptide exprimiert und müssen sich verbinden, bevor das Spleißen stattfindet, das so genannte Trans-Splicing von Proteinen.
  • Ein beispielhaftes Split-Intein ist das Ssp DnaE-Intein, das zwei Untereinheiten umfasst, nämlich DnaE-N und DnaE-C. Die beiden unterschiedlichen Untereinheiten werden von separaten Genen codiert, nämlich dnaE-n und dnaE-c, die für die Untereinheiten DnaE-N bzw. DnaE-C codieren. DnaE ist ein natürlich vorkommendes Split-Intein in Synechocytis sp. PCC6803 und ist in der Lage, das Trans-Spleißen von zwei separaten Proteinen zu steuern, die jeweils eine Fusion mit entweder DnaE-N oder DnaE-C umfassen.
  • Weitere natürlich vorkommende oder künstlich hergestellte Split-Intein-Sequenzen sind bekannt oder können aus den hier beschriebenen oder in der Technik verfügbaren Ganz-Intein-Sequenzen hergestellt werden. Beispiele für Split-Intein-Sequenzen finden sich in Stevens et al., „A promiscuous split intein with expanded protein engineering applications“, PNAS, 2017, Bd. 114: 8538-8543; Iwai et al., „Highly efficient protein trans-splicing by a naturally split DnaE intein from Nostc punctiforme“, FEBS Lett, 580: 1853-1858, die hier jeweils durch Bezugnahme aufgenommen werden. Weitere Split-Intein-Sequenzen finden sich z. B. in WO 2013/045632 , WO 2014/055782 , WO 2016/069774 und EP2877490 , deren Inhalt hier durch Bezugnahme aufgenommen wird.
  • Darüber hinaus wurde Proteinspleißen in trans in vivo und in vitro beschrieben (Shingledecker, et al., Gene 207:187 (1998), Southworth, et al., EMBO J. 17:918 (1998); Mills, et al., Proc. Natl. Acad. Sci. USA, 95:3543-3548 (1998); Lew, et al., J. Biol. Chem., 273:15887-15890 (1998); Wu, et al., Biochim. Biophys. Acta 35732:1 (1998b), Yamazaki, et al., J. Am. Chem. Soc. 120:5591 (1998), Evans, et al., J. Biol. Chem. 275:9091 (2000); Otomo, et al., Biochemistry 38:16040-16044 (1999); Otomo, et al., J. Biolmol. NMR 14:105-114 (1999); Scott, et al., Proc. Natl. Acad. Sci. USA 96: 13638-13643 (1999)) und stellt die Möglichkeit bereit, ein Protein in Form von zwei inaktiven Fragmenten zu exprimieren, die anschließend durch Ligation einfunktionelles Produktbilden, z. B. wie in 66 und 67 im Hinblick auf die Bildung eines vollständigen PE-Fusionsproteins aus zwei getrennt exprimierten Hälften gezeigt.
  • Target-Site
  • Der Begriff „Target-Site“ bezieht sich auf eine Sequenz innerhalb eines Nukleinsäuremoleküls, die durch einen hier offenbarten Prime Editor (PE) editiert wird. Die Target-Site bezieht sich ferner auf die Sequenz innerhalb eines Nukleinsäuremoleküls, an die ein Komplex aus dem Prime Editor (PE) und gRNA bindet.
  • tPERT
  • Siehe Definition von „trans-Prime Editor-RNA-Template (tPERT).“
  • Zeitliches Nicken des zweiten Strangs
  • Im hier verwendeten Sinne bezieht sich der Begriff „zeitliches Nicken des zweiten Stranges“ auf eine Variante des Nickens des zweiten Stranges, wobei der Einbau des zweiten Nicks in dem uneditierten Strang erst erfolgt, nachdem die gewünschte Editierung in dem editierten Strang eingebaut ist. Dadurch werden gleichzeitige Nicks an beiden Strängen verhindert, die zu doppelsträngigen DNA-Nicks führen könnten. Die den zweiten Strang nickende Guide-RNA ist so für die zeitliche Steuerung entwickelt, dass das Nicken des zweiten Strangs erst nach dem Einbau der gewünschten Editierung eingeführt wird. Dies wird erreicht, indem eine gRNA mit einer Spacer-Sequenz entwickelt wird, die nur mit dem editierten Strang, nicht aber mit dem ursprünglichen Allel übereinstimmt. Mit dieser Strategie sollen Fehlpaarungen zwischen dem Protospacer und dem uneditierten Allel das Nicken durch die sgRNA verhindern, bis das Editierereignis auf dem PAM-Strang stattfindet.
  • Trans-Prime-Editing
  • Im hier verwendeten Sinne bezieht sich der Begriff „trans-Prime-Editing“ auf eine modifizierte Form des Prime Editings, bei der eine gespaltene PEgRNA verwendet wird, d. h. wobei die PEgRNA in zwei separate Moleküle getrennt ist: eine sgRNA und ein RNA-Template für das trans-Prime-Editing (tPERT). Die sgRNA dient dazu, den Prime Editor (oder allgemeiner die napDNAbp-Komponente des Prime Editors) auf die gewünschte genomische Target-Site auszurichten, während die tPERT von der Polymerase (z. B. einer reversen Transkriptase) verwendet wird, um eine neue DNA-Sequenz in den Target-Locus zu schreiben, sobald die tPERT durch die Interaktion von Bindungsdomänen, die sich im Prime Editor und auf der tPERT befinden, in trans an den Prime Editor rekrutiert ist. In einer Ausführungsform können die Bindungsdomänen RNA-Protein-Rekrutierungsgruppen beinhalten, wie beispielsweise ein MS2-Aptamer, das sich auf dem tPERT befindet, und ein MS2cp-Protein, das an den Prime Editor fusioniert ist. Ein Vorteil des trans-Prime-Editing besteht darin, dass durch die Trennung des DNA-Synthese-Templates von der Guide-RNA potenziell längere Templates verwendet werden können.
  • Eine Ausführungsform des trans-Prime-Editing ist in den 3G und 3H gezeigt. 3G zeigt die Zusammensetzung des trans-Prime-Editor-Komplexes auf der linken Seite („RP-PE:gRNA-Komplex“), der ein napDNAbp umfasst, das an jeweils eine Polymerase (z. B. eine reversen Transkriptase) und ein RNA-Rekrutierungsprotein (z. B. MS2sc) fusioniert ist und das mit einer Guide-RNA komplexiert ist. 3G zeigt ferner ein separates tPERT-Molekül, das die Extension-Arm-Merkmale einer PEgRNA umfasst, einschließlich des DNA-Synthese-Templates und der Primer-Bindungssequenz. Das tPERT-Molekül beinhaltet auch eine RNA-Protein-Rekrutierungsdomäne (die in diesem Fall eine Stammschleifen-Struktur ist und beispielsweise MS2-Aptamer sein kann). Wie in dem in 3H beschriebenen Prozess dargestellt, bindet der RP-PE:gRNA-Komplex an die DNA-Target-Sequenz und nickt sie. Dann rekrutiert das Rekrutierungsprotein (RP) eine tPERT, um an den an die DNA-Target-Site gebundenen Primer-Bindungskomplex zu kolokalisieren, wodurch es der Primer-Bindungsstelle ermöglicht wird, an die Primersequenz auf dem geknickten Strang zu binden, und anschließend es der Polymerase (z. B. RT) ermöglicht wird, einen einzelnen DNA-Strang gegen das DNA-Synthese-Template bis zu 5' der tPERT zu synthetisieren.
  • Während die tPERT in 3G und 3H so dargestellt ist, dass sie die PBS und das DNA-Synthese-Template am 5'-Ende der RNA-Protein-Rekrutierungsdomäne umfasst, kann die tPERT in anderen Konfigurationen so entwickelt sein, dass sich die PBS und das DNA-Synthese-Template am 3'-Ende der RNA-Protein-Rekrutierungsdomäne befinden. Die tPERT mit der 5'-Extension hat jedoch den Vorteil, dass die Synthese des einzelnen DNA-Strangs auf natürliche Weise am 5'-Ende der tPERT endet und somit nicht die Gefahr besteht, dass ein Teil der RNA-Protein-Rekrutierungsdomäne während der DNA-Synthesestufe des Prime Editing als Template verwendet wird.
  • Trans-Prime-Editor-RNA-Template (tPERT)
  • Im hier verwendeten Sinne bezieht sich ein „Trans-Prime-Editor-RNA-Template (tPERT)“ auf eine Komponente, die beim trans-Prime-Editing verwendet wird, einer modifizierten Version des Prime Editing, die durch Trennen der PEgRNA in zwei verschiedene Moleküle funktioniert: eine Guide-RNA und ein tPERT-Molekül. Das tPERT-Molekül ist so programmiert, dass es mit dem Prime-Editor-Komplex an einer DNA-Target-Site kolokalisiert und die Primer-Bindungsstelle und das DNA-Synthese-Template in trans zum Prime Editor bringt. Zum Beispiel siehe 3G für eine Ausführungsform eines trans-Prime-Editors (tPE), die ein Zweikomponentensystem zeigt, umfassend (1) einen RP-PE:gRNA-Komplex und (2) eine tPERT, die die Primer-Bindungsstelle und das DNA-Synthese-Template umfasst, die an eine RNA-Protein-Rekrutierungsdomäne gebunden sind, wobei die RP(Rekrutierungsprotein)-Komponente des RP-PE:gRNA-Komplexes die tPERT an eine zu editierende Target-Site rekrutiert, wodurch die PBS und das DNA-Synthese-Template mit dem Prime Editor in trans assoziiert werden. Anders ausgedrückt ist die tPERT so konstruiert, dass sie (ganz oder teilweise) den Extension-Arm einer PEgRNA enthält, die die Primer-Bindungsstelle und das DNA-Synthese-Template enthält.
  • Transitionen
  • Im hier verwendeten Sinne beziehen sich „Transitionen“ auf den Austausch von Purinnukleobasen (A ↔ G) oder den Austausch von Pyrimidinnukleobasen (C ↔T). An dieser Klasse von Austauschvorgängen sind Nukleobasen mit ähnlicher Form beteiligt. Die hier offenbarten Zusammensetzungen und Verfahren sind in der Lage, eine oder mehrere Transitionen in einem DNA-Target-Molekül zu induzieren. Die hier offenbarten Zusammensetzungen und Verfahren sind auch in der Lage, sowohl Transitionen als auch Transversionen in demselben DNA-Target-Molekül zu induzieren. Bei diesen Veränderungen handelt es sich um A ↔ G, G ↔ A, C ↔T oder T ↔C. Im Zusammenhang mit einer doppelsträngigen DNA mit Watson-Crick-Nukleobasenpaaren beziehen sich die Transversionen auf die folgenden Basenpaaraustausche: A:T ↔ G:C, G:G ↔ A:T, C:G ↔ T:A oder T:A ↔ C:G. Die hier offenbarten Zusammensetzungen und Verfahren sind in der Lage, eine oder mehrere Transitionen in einem DNA-Target-Molekül zu induzieren. Die hier offenbarten Zusammensetzungen und Verfahren sind auch in der Lage, sowohl Transitionen als auch Transversion in demselben DNA-Target-Molekül als auch andere Nukleotidveränderungen, einschließlich Deletionen und Insertionen, zu induzieren.
  • Transversionen
  • Im hier verwendeten Sinne beziehen sich „Transversionen“ auf den Austausch von Purinnukleobasen gegen Pyrimidinnukleobasen oder umgekehrt und beinhalten somit den Austausch von Nukleobasen mit unterschiedlicher Form. Bei diesen Veränderungen handelt es sich um T ↔A, T↔ G, C ↔G, C ↔ A, A ↔T, A ↔ C, G ↔C und G ↔T. Im Zusammenhang mit einer doppelsträngigen DNA mit Watson-Crick-Nukleobasenpaaren beziehen sich Transversionen auf die folgenden Basenpaaraustausche: T:A ↔A:T, T:A ↔G:C, C:G ↔G:C, C:G ↔ A:T, A:T ↔ T:A, A:T ↔ C:G, G:C ↔ C:G, und G:C ↔ T:A. Die hier offenbarten Zusammensetzungen und Verfahren sind in der Lage, eine oder mehrere Transversionen in einem DNA-Target-Molekül zu induzieren. Die hier offenbarten Zusammensetzungen und Verfahren sind auch in der Lage, sowohl Transitionen als auch Transversion in demselben DNA-Target-Molekül als auch andere Nukleotidveränderungen, einschließlich Deletionen und Insertionen, zu induzieren.
  • Behandlung
  • Die Begriffe „Behandlung“, „behandeln“ und „Behandeln“ beziehen sich auf eine klinische Intervention, die darauf abzielt, den Ausbruch einer Krankheit oder Störung oder eines oder mehrerer Symptome davon, wie hier beschrieben, umzukehren, zu lindern, zu verzögern oder ihr Fortschreiten zu hemmen. Im hier verwendeten Sinne beziehen sich die Begriffe „Behandlung“, „behandeln“ und „Behandeln“ auf eine klinische Intervention, die darauf abzielt, den Ausbruch einer Krankheit oder Störung oder eines oder mehrerer Symptome davon, wie hier beschrieben, umzukehren, zu lindern, zu verzögern oder ihr Fortschreiten zu hemmen. In einigen Ausführungsformen kann eine Behandlung verabreicht werden, nachdem sich ein oder mehrere Symptome entwickelt haben und/oder nachdem eine Krankheit diagnostiziert wurde. In anderen Ausführungsformen kann die Behandlung in Abwesenheit von Symptomen verabreicht werden, z. B., um den Ausbruch eines Symptoms zu verhindern oder zu verzögern oder den Ausbruch oder das Fortschreiten einer Krankheit zu hemmen. Zum Beispiel kann die Behandlung einer anfälligen Person vor dem Auftreten von Symptomen verabreicht werden (z. B. aufgrund einer Vorgeschichte von Symptomen und/oder aufgrund genetischer oder anderer Anfälligkeitsfaktoren). Die Behandlung kann auch fortgesetzt werden, nachdem die Symptome abgeklungen sind, um beispielsweise ihr Wiederauftreten zu verhindern oder zu verzögern.
  • Trinukleotid-Repeat-Störung
  • Im hier verwendeten Sinne bezieht sich eine „Trinukleotid-Repeat-Störung“ (oder alternativ „expandierende Repeat-Störung“ oder „Repeat-Expansion-Störung“) auf eine Reihe von genetischen Störungen, die durch eine „Trinukleotid-Repeat-Expansion“ verursacht werden, was eine Art Mutation ist, bei der sich ein bestimmtes Trinukleotid in bestimmten Genen oder Introns wiederholt. Trinukleotid-Repeats galten früher als normale Wiederholungen im Genom, in den 1990er Jahren wurden diese Störungen jedoch geklärt. Diese anscheinend „gutartigen“ DNA-Abschnitte können sich manchmal ausdehnen und Krankheiten verursachen. Durch Trinukleotid-Repeat-Expansionen verursachte Störungen weisen mehrere gemeinsame kennzeichnende Merkmale auf. Erstens weisen die mutierten Wiederholungen sowohl eine somatische als auch eine Keimbahn-Instabilität auf, und häufiger expandieren sie eher, als dass sie bei aufeinanderfolgenden Übertragungen kontrahieren. Zweitens korrelieren ein früheres Erkrankungsalter und eine zunehmende Schwere des Phänotyps in nachfolgenden Generationen (Antizipation) im Allgemeinen mit einer größeren Wiederholungslänge. Schließlich kann der elterliche Ursprung des Krankheitsallels häufig die Antizipation beeinflussen, wobei väterliche Übertragungen für viele dieser Störungen ein höheres Expansionsrisiko bergen.
  • Man geht davon aus, dass die Triplett-Expansion durch eine Slippage während der DNA-Replikation verursacht wird. Aufgrund des repetitiven Charakters der DNA-Sequenz in diesen Regionen können sich während der DNA-Replikation „Schleifen“-Strukturen bilden, während die komplementäre Basenpaarung zwischen dem Elternstrang und dem zu synthetisierenden Tochterstrang erhalten bleibt. Wenn die Schleifenstruktur aus einer Sequenz auf dem Tochterstrang gebildet wird, führt dies zu einer Erhöhung der Anzahl der Wiederholungen. Wenn jedoch die Schleifenstruktur auf dem Elternstrang gebildet wird, verringert sich die Anzahl der Wiederholungen. Es hat den Anschein, dass eine Expansion dieser Wiederholungen häufiger vorkommt als eine Reduktion. Je größer die Expansion ist, desto wahrscheinlicher ist es im Allgemeinen, dass sie Krankheiten verursachen oder den Schweregrad der Krankheit erhöhen. Diese Eigenschaft führt zu dem Merkmal der Antizipation, das bei Trinukleotid-Repeat-Störungen auftritt. Antizipation beschreibt die Tendenz, dass das Alter des Krankheitsausbruchs abnimmt und der Schweregrad der Symptome über die aufeinanderfolgenden Generationen einer betroffenen Familie zunimmt, was auf die Expansion dieser Wiederholungen zurückzuführen ist.
  • Zu den Nukleotid-Repeat-Störungen können solche gehören, bei denen die Triplett-Wiederholung in einer nicht codierenden Region (d. h. eine nicht codierende Trinukleotid-Repeat-Störung) oder in einer codierenden Region auftritt.
  • Das hier beschriebene Prime-Editor(PE)-System kann zur Behandlung von Nukleotid-Repeat-Störungen verwendet werden, zu denen unter anderem Fragiles-X-Syndrom (FRAXA), Fragiles XE-MR (FRAXE), Friedreich-Ataxie (FRDA), Myotone Dystrophie (DM), Spinozerebelläre Ataxie Typ 8 (SCA8) und Spinozerebelläre Ataxie Typ 12 (SCA12) gehören können.
  • Stromaufwärts
  • Die hier verwendeten Begriffe „stromaufwärts“ und „stromabwärts“ bezeichnen eine Relativität und definieren die lineare Position von mindestens zwei Elementen, die sich in einem Nukleinsäuremolekül (unabhängig davon, ob einzel- oder doppelsträngig) befinden, das in einer 5'-zu-3'-Richtung ausgerichtet ist. Insbesondere befindet sich ein erstes Element stromaufwärts von einem zweiten Element in einem Nukleinsäuremolekül, wobei das erste Element an einer Stelle positioniert ist, die 5' zu dem zweiten Element liegt. Beispielsweise liegt ein SNP stromaufwärts von einer Cas9-induzierten Nick-Site, wenn sich der SNP auf der 5'-Seite der Nick-Site befindet. Umgekehrt befindet sich ein erstes Element stromabwärts von einem zweiten Element in einem Nukleinsäuremolekül, wobei das erste Element an einer Stelle positioniert ist, die 3' zu dem zweiten Element liegt. Beispielsweise liegt ein SNP stromabwärts von einer Cas9-induzierten Nick-Site, wenn sich der SNP auf der 3'-Seite der Nick-Site befindet. Das Nukleinsäuremolekül kann eine DNA (doppel- oder einzelsträngig), eine RNA (doppel- oder einzelsträngig) oder ein Hybrid aus DNA und RNA sein. Die Analyse ist für ein einzelsträngiges Nukleinsäuremolekül und ein doppelsträngiges Molekül gleich, da sich die Begriffe stromaufwärts und stromabwärts nur auf einen Einzelstrang eines Nukleinsäuremoleküls beziehen, außer dass man auswählen muss, welcher Strang des doppelsträngigen Moleküls betrachtet wird. Häufig ist der Strang einer doppelsträngigen DNA, der zur Bestimmung der Positionsrelativität von mindestens zwei Elementen verwendet werden kann, der „Sinn-“ bzw. „codierende“ Strang. In der Genetik ist ein „Sinn“-Strang das Segment innerhalb der doppelsträngigen DNA, das von 5' zu 3' verläuft und das komplementär zu dem Antisinn-Strang der DNA oder dem Template-Strang ist, der von 3' zu 5' verläuft. So befindet sich beispielsweise eine SNP-Nukleobase „stromabwärts“ von einer Promotorsequenz in einer genomischen DNA (die doppelsträngig ist), wenn sich die SNP-Nukleobase auf der 3'-Seite des Promotors auf dem Sinn- bzw. codierenden Strang befindet.
  • Variante
  • Wie hier verwendet ist der Begriff „Variante“ so zu verstehen, dass er Eigenschaften aufweist, die von dem in der Natur vorkommenden Muster abweichen, z. B. ist eine Cas9-Variante ein Cas9, das im Vergleich zu einer Wildtyp-Cas9-Aminosäuresequenz eine oder mehrere Veränderungen in den Aminosäureresten umfasst. Der Begriff „Variante“ umschließt homologe Proteine, die zu mindestens 75 % oder zu mindestens 80 % oder zu mindestens 85 % oder zu mindestens 90 % oder zu mindestens 95 % oder zu mindestens 99 % identisch mit einer Referenzsequenz sind und die gleiche oder im Wesentlichen die gleiche funktionelle Aktivität oder die gleichen funktionellen Aktivitäten wie die Referenzsequenz aufweisen. Der Begriff umschließt auch Mutanten, Trunkationen oder Domänen einer Referenzsequenz, die die gleiche oder im Wesentlichen die gleiche funktionelle Aktivität oder die gleichen funktionellen Aktivitäten wie die Referenzsequenz aufweisen.
  • Vektor
  • Wie hier verwendet bezieht sich der Begriff „Vektor“ auf eine Nukleinsäure, die so modifiziert werden kann, dass sie für ein interessierendes Gen codiert, und die in der Lage ist, in eine Wirtszelle einzudringen, zu mutieren und sich in der Wirtszelle zu replizieren und dann eine replizierte Form des Vektors in eine andere Wirtszelle zu transferieren. Geeignete Vektoren sind beispielsweise virale Vektoren, wie retrovirale Vektoren oder Bakteriophagen und filamentöse Phagen, sowie konjugative Plasmide. Weitere geeignete Vektoren sind für den Fachmann auf der Grundlage der vorliegenden Offenbarung ersichtlich.
  • Wildtyp
  • Im hier verwendeten Sinne ist der Begriff „Wildtyp“ ein Fachbegriff und bezeichnet die typische Form eines Organismus, Stammes, Gens oder Merkmals, wie sie in der Natur vorkommt, im Unterschied zu mutierten oder Varianten-Formen.
  • Endogener 5'-DNA-Flap
  • Im hier verwendeten Sinne bezieht sich der Begriff „endogener 5'-DNA-Flap“ auf den DNA-Strang, der unmittelbar stromabwärts der PE-induzierten Nick-Site in der Target-DNA angeordnet ist. Durch das Nicken des DNA-Target-Strangs durch PE wird eine 3'-Hydroxylgruppe auf der stromaufwärts gelegenen Seite der Nick-Site und eine 5'-Hydroxylgruppe auf der stromabwärts gelegenen Seite der Nick-Site exponiert. Der endogene Strang, der in der 3'-Hydroxylgruppe endet, wird verwendet, um die DNA-Polymerase des Prime Editors zu primieren (z. B. wobei die DNA-Polymerase eine reverse Transkriptase ist). Der endogene Strang auf der stromabwärts gelegenen Seite der Nick-Site, der mit der exponierten 5'-Hydroxylgruppe beginnt, wird als „endogener 5'-DNA-Flap“ bezeichnet und schließlich entfernt und durch den neu synthetisierten Ersatzstrang (d. h. „Ersatz-3'-DNA-Flap“) ersetzt, der durch die Extension der PEgRNA codiert wird.
  • Entfernung des endogenen 5'-DNA-Flaps
  • Im hier verwendeten Sinne bezieht sich der Begriff „Entfernung des endogenen 5'-DNA-Flaps“ oder „Entfernung des 5'-Flaps“ auf die Entfernung des endogenen 5'-DNA-Flaps, der sich bildet, wenn der RT-synthetisierte Einzelstrang-DNA-Flap kompetitiv in die endogene DNA eindringt und mit derselben hybridisiert, wobei der endogene Strang in dem Prozess verdrängt wird. Durch die Entfernung dieses endogenen verdrängten Stranges kann die Reaktion zur Bildung des gewünschten Produkts mit der gewünschten Nukleotidveränderung führen. Die zelleigenen DNA-Reparaturenzyme können die Entfernung oder Exzision des endogenen 5'-Flaps katalysieren (z. B. einer Flap-Endonuklease, wie etwa EXO1 oder FEN1). Außerdem können Wirtszellen so transformiert werden, dass sie ein oder mehrere Enzyme exprimieren, die die Entfernung der endogenen 5'-Flaps katalysieren und so den Prozess der Produktbildung vorantreiben (z. B. einer Flap-Endonuklease). Flap-Endonukleasen sind im Stand der Technik bekannt und sind beschrieben in Patel et al., „Flap endonucleases pass 5'-flaps through a flexible arch using a disorder-thread-order mechanism to confer specificity for free 5'-ends“, Nucleic Acids Research, 2012, 40(10): 4507-4519, und Tsutakawa et al., „Human flap endonuclease structures, DNA double-base flipping, and a unified understanding of the FEN1 superfamily“, Cell, 2011, 145(2): 198-211 (die hier jeweils durch Bezugnahme aufgenommen sind).
  • Ersatz-3'-DNA-Flap
  • Im hier verwendeten Sinne bezieht sich der Begriff „Erzatz-3'-DNA-Flap“ oder einfach „Ersatz-DNA-Flap“ auf den DNA-Strang, der durch den Prime Editor synthetisiert wird und der durch den Extension-Arm des Prime Editors PEgRNA codiert wird. Insbesondere wird der Ersatz-3'-DNA-Flap durch das Polymerase-Template der PEgRNA codiert. Der Ersatz-3'-DNA-Flap umfasst dieselbe Sequenz wie der endogene 5'-DNA-Flap, außer dass er auch die editierte Sequenz (z. B. eine Einzelnukleotidänderung) enthält. Der Ersatz-3'-DNA-Flap lagert sich an die Target-DNA an und verdrängt oder ersetzt den endogenen 5'-DNA-Flap (der beispielsweise durch eine 5'-Flap-Endonuklease, wie etwa FEN1 oder EXO1, exzidiert werden kann) und wird dann ligiert, um das 3'-Ende des Ersatz-3'-DNA-Flaps mit dem exponierten 5'-Hydoxylende der endogenen DNA (das nach der Exzision des endogenen 5'-DNA-Flaps exponiert ist) zu verbinden, wodurch eine Phospodiester-Bindung neu gebildet und der Ersatz-3'-DNA-Flap eingebaut wird, um eine Heteroduplex-DNA zu bilden, die einen editierten Strang und einen uneditierten Strang enthält. DNA-Reparaturprozesse lösen den Heteroduplex auf, indem sie die Informationen in dem editierten Strang in den komplementären Strang kopieren und die Editierung dauerhaft in die DNA einbauen. Dieser Auflösungsprozess kann durch Nicken des uneditierten Strangs, d. h. durch „Nicken des zweiten Strangs“, wie hier beschrieben, weiter bis zur Fertigstellung vorangetrieben werden.
  • DETAILLIERTE BESCHREIBUNG BESTIMMTER AUSFÜHRUNGSFORMEN
  • Die Einführung des CRISPR-Systems (clustered regularly interspaced short palindromic repeat) für das Genom-Editing hat die Biowissenschaften revolutioniert1-3. Obwohl die Gendisruption mit CRISPR heute Routine ist, bleibt der präzise Einbau von Einzelnukleotid-Edits eine große Herausforderung, obwohl er für die Untersuchung oder Korrektur einer großen Anzahl krankheitsverursachender Mutationen erforderlich ist. Die homologiegeleitete Reparatur (homology directed repair — HDR) ist in der Lage, solche Edits vorzunehmen, es bestehen jedoch die Schwierigkeiten einer geringen Effizienz (oft < 5 %), der Notwendigkeit von Spender-DNA-Reparatur-Templates und von schädlichen Auswirkungen der Bildung von doppelsträngigen DNA-Brüchen (DSB). Kürzlich hat das Labor von Prof. David Liu et al. das Basen-Editieren entwickelt, das ein effizientes Editieren von Einzelnukleotiden ohne DSB ermöglicht. Basen-Editoren (BE) kombinieren das CRISPR-System mit Basen-modifizierenden Deaminase-Enzymen, um die Target-Basenpaare C•G oder A•T in A•T bzw. G•C umzuwandeln4-6. Obwohl sie bereits von vielen Forschern weltweit eingesetzt werden, ermöglichen die derzeitigen BE nur vier der zwölf möglichen Basenpaarumwandlungen und sind nicht in der Lage, kleine Insertionen oder Deletionen zu korrigieren. Darüber hinaus ist der Targetbereich des Basen-Editierens durch das Editieren von Nicht-Target-C- oder -A-Basen angrenzend an der Target-Base („Bystander-Editierung“) und durch die Anforderung, dass eine PAM-Sequenz 15±2 bp von der Target-Base entfernt sein muss, eingeschränkt. Die Überwindung dieser Einschränkungen würde daher die Grundlagenforschung und die therapeutischen Anwendungen des Genom-Editings erheblich erweitern.
  • Die vorliegende Veröffentlichung schlägt einen neuen Ansatz für das Präzisions-Editieren vor, der viele der Vorteile des Basen-Editierens — nämlich die Vermeidung von Doppelstrangbrüchen und Spender-DNA-Reparatur- Templates — bietet und gleichzeitig dessen wesentliche Einschränkungen überwindet. Der hier beschriebene Ansatz ermöglicht den direkten Einbau von editierten DNA-Strängen an genomischen Target-Sites unter Verwendung von Targetprimierter reverser Transkription (target-primed reverse transcription — TPRT). Bei der hier erörterten Entwicklung wird die CRISPR-Guide-RNA (gRNA) so konstruiert, dass sie eine Reverse-Transkriptase(RT)-Template-Sequenz trägt, die für eine einzelsträngige DNA mit einer gewünschten Nukleotidänderung codiert. Die mit der CRISPR-Nuklease (Cas9) genickte Target-Site-DNA dient als Primer für die reverse Transkription der Template-Sequenz auf der modifizierten gRNA und ermöglicht den direkten Einbau jedes gewünschten Nukleotid-Edits.
  • Dementsprechend betrifft die vorliegende Erfindung teilweise die Entdeckung, dass der Mechanismus der Target-primierten reversen Transkription (TPRT) genutzt oder angepasst werden kann, um ein Präzisions-CRISPR/Cas-basiertes Genom-Editing mit hoher Effizienz und genetischer Flexibilität durchzuführen (z. B. wie in verschiedenen Ausführungsformen der 1A-1F dargestellt). Die Erfinder haben hier vorgeschlagen, Cas-Protein-Reverse-Transkriptase-Fusionen zu verwenden, um eine spezifische DNA-Sequenz mit einer modifizierten Guide-RNA anzusteuern („eine erweiterte Guide-RNA“), einen Einzelstrang-Nick an der Target-Site zu erzeugen und die genickte DNA als Primer für die reverse Transkription eines konstruierten Reverse-Transkriptase-Templates zu verwenden, das in die erweiterte Guide-RNA integriert ist. Der neu synthetisierte Strang wäre homolog zur genomischen Target-Sequenz, mit Ausnahme der Einfügung einer gewünschten Nukleotidänderung (z. B. einer Einzelnukleotidänderung, einer Deletion oder einer Insertion oder einer Kombination davon). Der neu synthetisierte DNA-Strang kann als Einzelstrang-DNA-Flap bezeichnet werden, der mit dem komplementären homologen endogenen DNA-Strang um die Hybridisierung konkurriert und dadurch den entsprechenden endogenen Strang verdrängt. Die Auflösung dieses hybridisierten Zwischenprodukts kann die Entfernung des resultierenden verdrängten Flaps endogener DNA (z. B. mit einer 5'-Ende-DNA-Flap-Endonuklease, FEN1), die Ligation des synthetisierten Einzelstrang-DNA-Flaps an die Target-DNA und die Assimilation der gewünschten Nukleotidänderung als Ergebnis zellulärer DNA-Reparatur- und/oder Replikationsprozesse beinhalten. Da die Template-abhängige DNA-Synthese die Präzision eines Einzelnukleotids bietet, ist der Anwendungsbereich dieses Konzepts sehr breit gefächert und könnte vorhersehbar für unzählige Anwendungen in der Grundlagenforschung und in der Therapeutik genutzt werden.
  • napDNAbp
  • Die hier beschriebenen Prime Editoren und trans-Prime-Editoren können ein Nukleinsäure-programmierbares DNA-Bindungsprotein (napDNAbp) umfassen.
  • In einem Aspekt kann ein napDNAbp mit mindestens einer Guide-Nukleinsäure (z. B. Guide-RNA oder einer PEgRNA) assoziiert oder mit dieser komplexiert sein, wodurch das napDNAbp an einer DNA-Sequenz lokalisiert wird, die einen DNA-Strang (d. h. einen Target-Strang) umfasst, der komplementär zu der Guide-Nukleinsäure ist, oder mit einem Teil davon (z. B. dem Spacer einer Guide-RNA, die sich am Protospacer des DNA-Targets anlagert). Anders gesagt „programmiert“ die Guide-Nukleinsäure das napDNAbp (z. B. Cas9 oder ein Äquivalent) darauf, an der komplementären Sequenz des Protospacers in der DNA zu lokalisieren und an sie zu binden.
  • Jedes geeignete napDNAbp kann in den hier beschriebenen Prime Editoren verwendet werden. In verschiedenen Ausführungsformen kann das napDNAbp ein beliebiges CRISPR-Cas-System der Klasse 2 sein, einschließlich eines CRISPR-Cas-Enzyms vom Typ II, Typ V oder Typ VI. Angesichts der rasanten Entwicklung von CRISPR-Cas als Werkzeug für das Genom-Editing gab es ständige Entwicklungen in der Nomenklatur, die zur Beschreibung und/oder Identifizierung von CRISPR-Cas-Enzymen wie Cas9 und Cas9-Orthologen verwendet wurde. Diese Anwendung bezieht sich auf CRISPR-Cas-Enzyme mit einer Nomenklatur, die alt und/oder neu sein kann. Der Fachmann wird in der Lage sein, das spezifische CRISPR-Cas-Enzym, auf das in dieser Anmeldung Bezug genommen wird, anhand der verwendeten Nomenklatur zu identifizieren, unabhängig davon, ob es sich um eine alte (d. h. „veraltete“) oder eine neue Nomenklatur handelt. Die CRISPR-Cas-Nomenklatur wird ausführlich in Makarova et al., „Classification and Nomenclature of CRISPR-Cas Systems: Where from Here?“, The CRISPR Journal, Bd. 1, Nr. 5, 2018, diskutiert, dessen gesamter Inhalt hier durch Bezugnahme aufgenommen ist. Die jeweilige CRISPR-Cas-Nomenklatur, die in der vorliegenden Anmeldung verwendet wird, ist in keiner Weise einschränkend, und der Fachmann kann erkennen, auf welches CRISPR-Cas-Enzym Bezug genommen wird.
  • Beispielsweise haben die folgenden CRISPR-Cas-Enzyme vom Typ II, Typ V und Typ VI der Klasse 2 die folgenden nach dem Stand der Technik anerkannten alten (d. h. veralteten) und neuen Namen. Jedes dieser Enzyme und/oder Varianten davon kann mit den hier beschriebenen Prime Editoren verwendet werden:
    Veraltete Nomenklatur Aktuelle Nomenklatur*
    CRISPR-Cas-Enzyme Typ II
    Cas9 identisch
    CRISPR-Cas-Enzyme Typ V
    Cpfl Cas12a
    CasX Cas12e
    C2c1 Cas12b1
    Cas12b2 identisch
    C2c3 Cas12c
    CasY Cas12d
    C2c4 identisch
    C2c8 identisch
    C2c5 identisch
    C2c10 identisch
    C2c9 identisch
    CRISPR-Cas-Enzyme Typ VI
    C2c2 Cas13a
    Cas13d identisch
    C2c7 Cas13c
    C2c6 Cas13b

    * Siehe Makarova et al., The CRISPR Journal, Bd. 1, Nr. 5, 2018
  • Ohne an die Theorie gebunden zu sein, schließt der Wirkmechanismus bestimmter hier betrachteter napDNAbp den Schritt der Bildung einer R-Schleife ein, wodurch das napDNAbp das Abwickeln eines Doppelstrang-DNA-Targets induziert und dadurch die Stränge in der durch das napDNAbp gebundenen Region trennt. Der Guide-RNA-Spacer hybridisiert dann an der Protospacersequenz mit dem „Target-Strang“. Dies verdrängt einen „Nicht-Target-Strang“, der komplementär zu dem Target-Strang ist, der die Einzelstrangregion der R-Schleife bildet. In einigen Ausführungsformen beinhaltet das napDNAbp eine oder mehrere Nukleaseaktivitäten, die dann die DNA schneiden und verschiedene Arten von Läsionen hinterlassen. Beispielsweise kann das napDNAbp eine Nukleaseaktivität umfassen, die den Nicht-Target-Strang an einer ersten Stelle schneidet und/oder den Target-Strang an einer zweiten Stelle schneidet. Abhängig von der Nukleaseaktivität kann die Target-DNA geschnitten werden, um einen „doppelsträngigen Bruch“ zu bilden, wobei beide Stränge geschnitten werden. In anderen Ausführungsformen kann die Target-DNA nur an einer einzigen Stelle geschnitten werden, d. h. die DNA wird an einem Strang „genickt“. Beispiele für napDNAbp mit unterschiedlichen Nukleaseaktivitäten sind „Cas9-Nickase“ („nCas9“) und ein deaktiviertes Cas9 ohne Nukleaseaktivitäten („totes Cas9“ oder „dCas9“).
  • Die folgende Beschreibung verschiedener napDNAbp, die in Verbindung mit den hier vorgestellten Prime Editoren verwendet werden können, soll in keiner Weise einschränkend sein. Die Prime Editoren können das kanonische SpCas9 oder jedes orthologe Cas9-Protein oder jede Cas9-Protein-Variante - einschließlich einer natürlich vorkommenden Variante, Mutante oder anderweitig konstruierten Version von Cas9 - umfassen, das bekannt ist oder das durch einen gezielten evolutionären oder anderweitig mutagenen Prozess hergestellt oder entwickelt werden kann. In verschiedenen Ausführungsformen weisen das Cas9 oder die Cas9-Varianten eine Nickaseaktivität auf, d. h. sie spalten nur den Strang der DNA-Target-Sequenz. In anderen Ausführungsformen weisen das Cas9 oder die Cas9-Varianten inaktive Nukleasen auf, d. h. es handelt sich um „tote“ Cas9-Proteine. Andere Varianten von Cas9-Proteinen, die verwendet werden können, haben ein geringeres Molekulargewicht als das kanonische SpCas9 (z. B. zur leichteren Einbringung) oder haben eine modifizierte oder umgeordnete primäre Aminosäurestruktur (z. B. die zirkulären permutierten Formate).
  • Die hier beschriebenen Prime Editoren können auch Cas9-Äquivalente umfassen, einschließlich Cas12a (Cpfl) und Cas12b1-Proteine, die das Ergebnis einer konvergenten Evolution sind. Die hier verwendeten napDNAbp (z. B. SpCas9, Cas9-Variante oder Cas9-Äquivalente) können auch verschiedene Modifikationen enthalten, die ihre PAM-Spezifitäten verändern/verbessern. Schließlich sieht die Anmeldung jedes Cas9, jede Cas9-Variante oder jedes Cas9-Äquivalent vor, das mindestens 70 %, mindestens 75 %, mindestens 80 %, mindestens 85 %, mindestens 90 %, mindestens 91%, mindestens 92 %, mindestens 93 %, mindestens 94 %, mindestens 95 %, mindestens 96 %, mindestens 97 %, mindestens 98 %, mindestens 99 % oder mindestens 99,9 % Sequenzidentität mit einer Referenz-Cas9-Sequenz aufweist, wie etwa einer kanonischen Referenz-SpCas9-Sequenz oder einem Referenz-Cas9-Äquivalent (z. B. Cas12a (Cpfl)).
  • Die napDNAbp kann eine CRISPR(clustered regularly interspaced short palindromic repeat)-assoziierte Nuklease sein. Wie oben ausgeführt, ist CRISPR ein adaptives Immunsystem, das Schutz vor mobilen genetischen Elementen (Viren, transponierbaren Elemente und konjugativen Plasmiden) bietet. CRISPR-Cluster enthalten Spacer, Sequenzen, die komplementär zu vorausgehenden mobilen Elementen sind, und zielen auf eindringende Nukleinsäuren ab. CRISPR-Cluster werden transkribiert und zu CRISPR-RNA (crRNA) verarbeitet. In Typ-II-CRISPR-Systemen erfordert die korrekte Verarbeitung von pre-crRNA eine transcodierte kleine RNA (tracrRNA), endogene Ribonuklease 3 (rnc) und ein Cas9-Protein. Die tracrRNA dient als Guide für die Ribonuklease-3-gestützte Verarbeitung von pre-crRNA. Anschließend spaltet Cas9/crRNA/tracrRNA endonukleolytisch das lineare oder zirkuläre dsDNA-Target, das komplementär zum Spacer ist. Der Target-Strang, der nicht komplementär zur crRNA ist, wird zuerst endonukleolytisch geschnitten und dann 3'-5' exonukleolytisch getrimmt. In der Natur sind für die Bindung und Spaltung von DNA in der Regel Proteine und beide RNA erforderlich. Single-Guide-RNA („sgRNA“ oder einfach „gRNA“) können jedoch so konstruiert werden, dass sie Aspekte sowohl der crRNA als auch der tracrRNA in eine einzige RNA-Spezies einbringen. Siehe z.B. Jinek M. et al., Science 337: 816-821(2012), deren gesamter Inhalt hiermit durch Bezugnahme aufgenommen ist.
  • In einigen Ausführungsformen steuert das napDNAbp die Spaltung eines oder beider Stränge an der Stelle einer Target-Sequenz, wie etwa innerhalb der Target-Sequenz und/oder innerhalb des Komplements der Target-Sequenz. In einigen Ausführungsformen steuert das napDNAbp die Spaltung eines oder beider Stränge innerhalb von etwa 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 50, 100, 200, 500 oder mehr Basenpaaren aus dem ersten oder letzten Nukleotid einer Target-Sequenz. In einigen Ausführungsformen codiert ein Vektor für ein napDNAbp, das gegenüber einem entsprechenden Wildtyp-Enzym mutiert ist, sodass dem mutierten napDNAbp die Fähigkeit fehlt, einen oder beide Stränge eines Target-Polynukleotids, das eine Target-Sequenz enthält, zu spalten. Beispielsweise wandelt eine Aspartat-zu-Alanin-Substitution (D10A) in der katalytischen RuvC-I-Domäne von Cas9 aus S. pyogenes Cas9 von einer Nuklease, die beide Stränge spaltet, in eine Nickase um (spaltet einen einzelnen Strang). Andere Beispiele für Mutationen, die Cas9 zu einer Nickase machen, beinhalten ohne Einschränkung H840A, N854A und N863A in Bezug auf die kanonische SpCas9-Sequenz oder auf äquivalente Aminosäurepositionen in anderen Cas9-Varianten oder Cas9-Äquivalenten.
  • Im hier verwendeten Sinne bezieht sich der Begriff „Cas-Protein“ auf ein aus der Natur gewonnenes Cas-Protein in voller Länge, ein rekombinantes Cas-Protein mit einer Sequenz, die sich von einem natürlich vorkommenden Cas-Protein unterscheidet, oder auf ein beliebiges Fragment eines Cas-Proteins, das dennoch alle oder eine signifikante Menge der erforderlichen Grundfunktionen beibehält, die für die offenbarten Verfahren erforderlich sind, d. h. (i) Besitz der durch Nukleinsäure programmierbaren Bindung des Cas-Proteins an eine Target-DNA und (ii) Fähigkeit, die DNA-Target-Sequenz auf einem Strang zu nicken. Die hier betrachteten Cas-Proteine umschließen CRISPR-Cas9-Proteine sowie Cas9-Äquivalente, -Varianten (z. B. Cas9-Nickase (nCas9) oder Nuklease-inaktives Cas9(dCas9)), -Homologe, -Orthologe oder -Paraloge, sowohl natürlich vorkommende als auch nicht natürlich vorkommende (z. B. konstruierte oder rekombinante), und können ein Cas9-Äquivalent eines beliebigen CRISPR-Systems der Klasse 2 (z. B. Typ II, V, VI) beinhalten, einschließlich Cas12a (Cpfl), Cas12e (CasX), Cas12b1 (C2c1), Cas12b2, Cas12c (C2c3), C2c4, C2c8, C2c5, C2c10, C2c9, Cas13a (C2c2), Cas13d, Cas13c (C2c7), Cas13b (C2c6) und Cas13b. Weitere Cas-Äquivalente sind beschrieben in Makarova et al., „C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector“, Science 2016; 353(6299), und Makarova et al., „Classification and Nomenclature of CRISPR-Cas Systems: Where from Here?“, The CRISPR Journal, Bd. 1. Nr. 5, 2018, deren gesamter Inhalt hier durch Bezugnahme aufgenommen ist.
  • Die Begriffe „Cas9“ oder „Cas9-Nuklease“ oder „Cas9-Einheit“ oder „Cas9-Domäne“ umschließen jedes natürlich vorkommende Cas9 aus einem beliebigen Organismus, jedes natürlich vorkommende Cas9-Äquivalent oder funktionelle Fragment davon, jedes Cas9-Homolog, - Ortholog oder -Paralog aus einem beliebigen Organismus und jede Mutante oder Variante eines Cas9, sowohl natürlich vorkommend als auch konstruiert. Der Begriff Cas9 ist nicht als besonders einschränkend zu verstehen und kann als „Cas9 oder Äquivalent“ bezeichnet werden. Beispielhafte Cas9-Proteine sind hier weiter beschrieben und/oder im Stand der Technik beschrieben und sind hier durch Bezugnahme aufgenommen. Die vorliegende Offenbarung ist in Bezug auf das spezielle Cas9, das im Prime Editor (PE) der Erfindung verwendet wird, unbegrenzt.
  • Wie bereits erwähnt, sind die Sequenzen und Strukturen der Cas9-Nuklease den Fachleuten gut bekannt (siehe z. B. „Complete genome sequence of an M1 strain of Streptococcus pyogenes“. Ferretti et al., J.J., McShan W.M., Ajdic D.J., Savic D.J., Savic G., Lyon K., Primeaux C., Sezate S., Suvorov A.N., Kenton S., Lai H.S., Lin S.P., Qian Y., Jia H.G., Najar F.Z., Ren Q., Zhu H., Song L., White J., Yuan X., Clifton S.W., Roe B.A., McLaughlin R.E., Proc. Natl. Acad. Sci., USA 98:4658-4663(2001); „CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III.“ Deltcheva E, Chylinski K., Sharma, C. M., Gonzalez, K., Chao Y., Pirzada Z. A., Eckert M. R., Vogel J., Charpentier E. Nature 471:602-607(2011); und „A programmable dual-RNA-guided DNA-endonuklease in adaptive bacterial immunity.“ Jinek M., K. Chylinski, I. Fonfara, M. Hauer, Doudna, J. A., Charpentier E. Science 337:816-821 (2012), deren gesamter Inhalt hier durch Bezugnahme aufgenommen ist).
  • Beispiele für Cas9 und Cas9-Äquivalente werden wie nachfolgend bereitgestellt; diese spezifischen Beispiele sollen jedoch nicht einschränkend sein. Der Prime Editor der vorliegenden Offenbarung kann jedes geeignete napDNAbp, einschließlich jedes geeigneten Cas9 oder Cas9-Äquivalents, verwenden.
  • A. Kanonisches SpCas9 vom Wildtyp
  • In einer Ausführungsform können die hier beschriebenen Prime-Editor-Konstrukte die „kanonische SpCas9“-Nuklease aus S. pyogenes umfassen, die weithin als Werkzeug für das Genom-Engineering verwendet wird und als Typ-II-Untergruppe von Enzymen der CRISPR-Cas-Systeme der Klasse 2 kategorisiert wird. Dieses Cas9-Protein ist ein großes Multidomänenprotein, das zwei verschiedene Nukleasedomänen enthält. Punktmutationen können in Cas9 eingeführt werden, um eine oder beide Nukleaseaktivitäten abzuschalten, was zu einem Nickase-Cas9 (nCas9) bzw. einem toten Cas9 (dCas9) führt, das immer noch seine Fähigkeit behält, DNA in einer sgRNA-programmierten Weise zu binden. Im Prinzip kann Cas9 oder eine Variante davon (z. B. nCas9), wenn es mit einem anderen Protein oder einer anderen Domäne fusioniert ist, dieses Protein einfach durch Koexpression mit einer geeigneten sgRNA auf praktisch jede DNA-Sequenz ausrichten. Im hier verwendeten Sinne bezieht sich das kanonische SpCas9-Protein auf das Wildtyp-Protein aus Streptococcus pyogenes mit der folgenden Aminosäuresequenz:
    Figure DE112020001339T5_0012
    Figure DE112020001339T5_0013
    Figure DE112020001339T5_0014
    Figure DE112020001339T5_0015
    Figure DE112020001339T5_0016
    Figure DE112020001339T5_0017
  • Die hier beschriebenen Prime Editoren können kanonisches SpCas9 oder eine beliebige Variante davon beinhalten, die mindestens 80 %, mindestens 85 %, mindestens 90 %, mindestens 95 % oder mindestens 99 % Sequenzidentität mit einer oben angegebenen Wildtyp-Cas9-Sequenz aufweist. Diese Varianten können SpCas9-Varianten beinhalten, die eine oder mehrere Mutationen enthalten, einschließlich aller bekannten Mutationen, die unter der SwissProt-Hinterlegungsnummer Q99ZW2 (SEQ ID NO: 18) gemeldet sind, darunter:
    SpCas9-Mutation (im Vergleich zur Aminosäuresequenz der kanonischen SpCas9-Sequenz, SEQ ID NO: 18) Funktion/Merkmal (wie gemeldet) (siehe Eintrag UniProtKB - Q99ZW2 (CAS9 _STRPT1) - hier durch Bezugnahme aufgenommen)
    D10A Nickase-Mutante, die den Protospacer-Strang spaltet (aber keine Spaltung des Nicht-Protospacer-Strangs)
    S15A Verminderte DNA-Spaltungsaktivität
    R66A Verminderte DNA-Spaltungsaktivität
    R70A Keine DNA-Spaltung
    R74A Verminderte DNA-Spaltung
    R78A Verminderte DNA-Spaltung
    97-150 Deletion Keine Nukleaseaktivität
    R165A Verminderte DNA-Spaltung
    175-307 Deletion Um etwa 50 % verringerte DNA-Spaltung
    312-409 Deletion Keine Nukleaseaktivität
    E762A Nickase
    H840A Nickase-Mutante, die den Nicht-Protospacer-Strang spaltet, den Protospacer-Strang aber nicht spaltet
    N854A Nickase
    N863A Nickase
    H982A Verminderte DNA-Spaltung
    D986A Nickase
    1099-1368 Deletion Keine Nukleaseaktivität
    R1333A Reduzierte DNA-Bindung
  • Andere Wildtyp-SpCas9-Sequenzen, die in der vorliegenden Offenbarung verwendet werden können, beinhalten:
    Figure DE112020001339T5_0018
    Figure DE112020001339T5_0019
    Figure DE112020001339T5_0020
    Figure DE112020001339T5_0021
    Figure DE112020001339T5_0022
    Figure DE112020001339T5_0023
    Figure DE112020001339T5_0024
    Figure DE112020001339T5_0025
    Figure DE112020001339T5_0026
    Figure DE112020001339T5_0027
    Figure DE112020001339T5_0028
    Figure DE112020001339T5_0029
    Figure DE112020001339T5_0030
    Figure DE112020001339T5_0031
    Figure DE112020001339T5_0032
  • Die hier beschriebenen Prime Editoren können jede der oben genannten SpCas9-Sequenzen oder jede Variante davon mit mindestens 80 %, mindestens 85 %, mindestens 90 %, mindestens 95 % oder mindestens 99 % Sequenzidentität dazu beinhalten.
  • B. Wildtyp-Cas9-Orthologe
  • In anderen Ausführungsformen kann das Cas9-Protein ein Wildtyp-Cas9-Ortholog von einer anderen Bakterienart sein, das sich von dem kanonischen Cas9 aus S. pyogenes unterscheidet. Beispielsweise können die folgenden Cas9-Orthologe in Verbindung mit den in dieser Beschreibung beschriebenen Prime-Editor-Konstrukten verwendet werden. Darüber hinaus kann jede Cas9-Ortholog-Variante, die mindestens 80 %, mindestens 85 %, mindestens 90 %, mindestens 95 % oder mindestens 99 % Sequenzidentität mit einem der unten genannten Orthologe aufweist, ebenfalls mit den vorliegenden Prime Editoren verwendet werden.
    Figure DE112020001339T5_0033
    Figure DE112020001339T5_0034
    Figure DE112020001339T5_0035
    Figure DE112020001339T5_0036
    Figure DE112020001339T5_0037
    Figure DE112020001339T5_0038
    Figure DE112020001339T5_0039
    Figure DE112020001339T5_0040
    Figure DE112020001339T5_0041
    Figure DE112020001339T5_0042
    Figure DE112020001339T5_0043
    Figure DE112020001339T5_0044
    Figure DE112020001339T5_0045
    Figure DE112020001339T5_0046
  • Die hier beschriebenen Prime Editoren können jede der oben genannten Cas9-Ortholog-Sequenzen oder Varianten davon mit mindestens 80 %, mindestens 85 %, mindestens 90 %, mindestens 95 % oder mindestens 99 % Sequenzidentität dazu beinhalten.
  • Das napDNAbp kann alle geeigneten Homologe und/oder Orthologe oder natürlich vorkommenden Enzyme, wie etwa Cas9, beinhalten. Cas9-Homologe und/oder Orthologe wurden in verschiedenen Spezies beschrieben, einschließlich, aber nicht beschränkt auf, S. pyogenes und S. thermophilus. Vorzugsweise ist die Cas-Einheit als eine Nickase konfiguriert (z. B. mutagenisiert, rekombinant konstruiert oder anderweitig aus der Natur gewonnen), d. h. weitere geeignete Cas9-Nukleasen und -Sequenzen, die in der Lage sind, nur einen einzelnen Strang des Targets zu spalten, sind für Fachleute auf der Grundlage dieser Offenbarung offensichtlich, und solche Cas9-Nukleasen und -Sequenzen beinhalten Cas9-Sequenzen aus den Organismen und Loci, die in Chylinski, Rhun und Charpentier, „The tracrRNA and Cas9 families of type II CRISPR-Cas immunity systems“, (2013) RNA Biology 10:5, 726-737, offenbart sind; dessen gesamter Inhalt ist hier durch Bezugnahme aufgenommen. In einigen Ausführungsformen weist eine Cas9-Nuklease eine inaktive (z. B. eine inaktivierte) DNA-Spaltdomäne auf, das heißt, die Cas9 ist eine Nickase. In einigen Ausführungsformen umfasst das Cas9-Protein eine Aminosäuresequenz, die zu mindestens 80 % mit der Aminosäuresequenz eines Cas9-Proteins identisch ist, wie sie durch eine der Varianten der Tabelle 3 bereitgestellt wird. In einigen Ausführungsformen umfasst das Cas9-Protein eine Aminosäuresequenz, die zu mindestens 85 %, mindestens 90 %, mindestens 92 %, mindestens 95 %, mindestens 96 %, mindestens 97 %, mindestens 98 %, mindestens 99 % oder mindestens 99,5 % identisch mit der Aminosäuresequenz eines Cas9-Proteins ist, wie sie von einem der Cas9-Orthologe in den obigen Tabellen bereitgestellt wird.
  • C. Tote Cas9-Variante
  • In bestimmten Ausführungsformen können die hier beschriebenen Prime Editoren ein totes Cas9, z. B. ein totes SpCas9, beinhalten, das aufgrund einer oder mehrerer Mutationen, die beide Nuklease-Domänen von Cas9, nämlich die RuvC-Domäne (die den Nicht-Protospacer-DNA-Strang spaltet) und die HNH-Domäne (die den Protospacer-DNA-Strang spaltet), inaktivieren, keine Nukleaseaktivität aufweist. Die Nukleaseinaktivierung kann auf eine oder mehrere Mutationen zurückzuführen sein, die zu einer oder mehreren Substitutionen und/oder Deletionen in der Aminosäuresequenz des codierten Proteins führen, oder auf beliebige Varianten davon, die mindestens 80 %, mindestens 85 %, mindestens 90 %, mindestens 95 % oder mindestens 99 % Sequenzidentität dazu aufweisen.
  • Der hier verwendete Begriff „dCas9“ bezieht sich auf ein Nuklease-inaktives Cas9 oder Nuklease-totes Cas9 oder ein funktionelles Fragment davon und umschließt jedes natürlich vorkommende dCas9 aus einem beliebigen Organismus, jedes natürlich vorkommende dCas9-Äquivalent oder funktionelle Fragment davon, jedes dCas9-Homolog, -Ortholog oder -Paralog aus einem beliebigen Organismus und jede Mutante oder Variante eines dCas9, sowohl natürlich vorkommend als auch konstruiert. Der Begriff dCas9 ist nicht als besonders einschränkend zu verstehen und kann als „dCas9 oder Äquivalent“ bezeichnet werden. Beispielhafte dCas9-Proteine und Verfahren zur Herstellung von dCas9-Proteinen sind hier weiter beschrieben und/oder im Stand der Technik beschrieben und sind hier durch Bezugnahme aufgenommen.
  • In anderen Ausführungsformen entspricht dCas9 einer Cas9-Aminosäuresequenz mit einer oder mehreren Mutationen, die die Cas9-Nukleaseaktivität inaktivieren, oder umfasst diese ganz oder teilweise. In anderen Ausführungsformen werden Cas9-Varianten mit anderen Mutationen als D10A und H840A bereitgestellt, die zu einer vollständigen oder teilweisen Inaktivierung der endogenen Cas9-Nukleaseaktivität (z. B. nCas9 bzw. dCas9) führen können. Solche Mutationen umfassen beispielsweise andere Aminosäure-Substitutionen an D10 und H820 oder andere Substitutionen innerhalb der Nuklease-Domänen von Cas9 (z. B. Substitutionen in der HNH-Nuklease-Subdomäne und/oder der RuvC1-Subdomäne) im Vergleich zu einer Wildtyp-Sequenz wie Cas9 aus Streptococcus pyogenes (NCBI-Referenzsequenz: NC_017053.1). In einigen Ausführungsformen werden Varianten oder Homologe von Cas9 (z. B. Varianten von Cas9 aus Streptococcus pyogenes (NCBI-Referenzsequenz: NC_017053.1 (SEQ ID NO: 20))) bereitgestellt, die zu mindestens etwa 70 % identisch, zu mindestens etwa 80 % identisch, zu mindestens etwa 90 % identisch, zu mindestens etwa 95 % identisch, zu mindestens etwa 98 % identisch, zu mindestens etwa 99 % identisch, zu mindestens etwa 99,5 % identisch oder zu mindestens etwa 99,9 % identisch mit der NCBI-Referenzsequenz: NC_017053.1 sind. In einigen Ausführungsformen werden Varianten von dCas9 (z. B. Varianten der NCBI-Referenzsequenz: NC_017053.1 (SEQ ID NO: 20)) mit Aminosäuresequenzen bereitgestellt, die um etwa 5 Aminosäuren, um etwa 10 Aminosäuren, um etwa 15 Aminosäuren, um etwa 20 Aminosäuren, um etwa 25 Aminosäuren, um etwa 30 Aminosäuren, um etwa 40 Aminosäuren, um etwa 50 Aminosäuren, um etwa 75 Aminosäuren, um etwa 100 Aminosäuren oder mehr kürzer oder länger als NC_017053.1 (SEQ ID NO: 20) sind.
  • In einer Ausführungsform kann das tote Cas9 auf der kanonischen SpCas9-Sequenz von Q99ZW2 basieren und die folgende Sequenz aufweisen, die ein D10X und ein H810X umfasst, wobei X eine beliebige Aminosäure, Substitutionen (unterstrichen und fett gedruckt) oder eine Variante von SEQ ID NO: 40 mit mindestens 80 %, mindestens 85 %, mindestens 90 %, mindestens 95 % oder mindestens 99 % Sequenzidentität dazu sein kann.
  • In einer Ausführungsform kann das tote Cas9 auf der kanonischen SpCas9-Sequenz von Q99ZW2 basieren und die folgende Sequenz aufweisen, die eine D10A- und eine H810A-Substitution (unterstrichen und fett gedruckt) umfasst, oder eine Variante von SEQ ID NO: 41 sein, die mindestens 80 %, mindestens 85 %, mindestens 90 %, mindestens 95 % oder mindestens 99 % Sequenzidentität dazu aufweist.
    Figure DE112020001339T5_0047
    Figure DE112020001339T5_0048
    Figure DE112020001339T5_0049
  • D. Cas9-Nickase-Variante
  • In einer Ausführungsform umfassen die hier beschriebenen Prime Editoren eine Cas9-Nickase. Der Begriff „Cas9-Nickase“ bei „nCas9“ bezieht sich auf eine Variante von Cas9, die in der Lage ist, einen Einzelstrang-Bruch in ein Doppelstrang-DNA-Molekül-Target einzuführen. In einigen Ausführungsformen umfasst die Cas9-Nickase nur eine einzelne funktionierende Nukleasedomäne. Das Wildtyp-Cas9 (z. B. das kanonische SpCas9) umfasst zwei separate Nukleasedomänen, nämlich die RuvC-Domäne (die den Nicht-Protospacer-DNA-Strang spaltet) und die HNH-Domäne (die den Protospacer-DNA-Strang spaltet). In einer Ausführungsform umfasst die Cas9-Nickase eine Mutation in der RuvC-Domäne, die die RuvC-Nukleaseaktivität inaktiviert. Beispielsweise wurden Mutationen in Aspartat (D) 10, Histidin (H) 983, Aspartat (D) 986 oder Glutamat (E) 762 als Loss-of-Function-Mutationen der RuvC-Nukleasedomäne und die Entstehung einer funktionellen Cas9-Nickase gemeldet (z. B. Nishimasu et al., „Crystal structure of Cas9 in complex with guide RNA and target DNA“, Cell 156(5), 935-949, was hier durch Bezugnahme aufgenommen ist). Somit könnten Nickase-Mutationen in der RuvC-Domäne D10X, H983X, D986X oder E762X umfassen, wobei X eine andere Aminosäure als die Wildtyp-Aminosäure ist. In bestimmten Ausführungsformen könnte die Nickase D10A, H983A oder D986A oder E762A oder eine Kombination davon sein.
  • In verschiedenen Ausführungsformen kann die Cas9-Nickase eine Mutation in der RuvC-Nukleasedomäne aufweisen und eine der folgenden Aminosäuresequenzen oder eine Variante davon mit einer Aminosäuresequenz aufweisen, die mindestens 80 %, mindestens 85 %, mindestens 90 %, mindestens 95 % oder mindestens 99 % Sequenzidentität dazu aufweist.
    Figure DE112020001339T5_0050
    Figure DE112020001339T5_0051
    Figure DE112020001339T5_0052
    Figure DE112020001339T5_0053
    Figure DE112020001339T5_0054
    Figure DE112020001339T5_0055
    Figure DE112020001339T5_0056
    Figure DE112020001339T5_0057
    Figure DE112020001339T5_0058
    Figure DE112020001339T5_0059
  • In einer anderen Ausführungsform umfasst die Cas9-Nickase eine Mutation in der HNH-Domäne, die die HNH-Nukleaseaktivität inaktiviert. Zum Beispiel wurden Mutationen in Histidin (H) 840 oder Asparagin (R) 863 als Loss-of-Function-Mutationen der HNH-Nukleasedomäne und die Entstehung einer funktionellen Cas9-Nickase gemeldet (z. B. Nishimasu et al., „Crystal structure of Cas9 in complex with guide RNA and target DNA“, Cell 156(5), 935-949, das hier durch Bezugnahme aufgenommen ist). Somit könnten Nickase-Mutationen in der HNH-Domäne H840X und R863X beinhalten, wobei X eine andere Aminosäure als die Wildtyp-Aminosäure ist. In bestimmten Ausführungsformen könnte die Nickase H840A oder R863A oder eine Kombination davon sein.
  • In verschiedenen Ausführungsformen kann die Cas9-Nickase eine Mutation in der HNH-Nukleasedomäne aufweisen und eine der folgenden Aminosäuresequenzen oder eine Variante davon mit einer Aminosäuresequenz aufweisen, die mindestens 80 %, mindestens 85 %, mindestens 90 %, mindestens 95 % oder mindestens 99 % Sequenzidentität dazu aufweist.
    Figure DE112020001339T5_0060
    Figure DE112020001339T5_0061
    Figure DE112020001339T5_0062
    Figure DE112020001339T5_0063
    Figure DE112020001339T5_0064
    Figure DE112020001339T5_0065
  • In einigen Ausführungsformen wird das N-terminale Methionin aus einer Cas9-Nickase oder aus einer Cas9-Variante, einem Cas9-Ortholog oder -Äquivalent, die/das hier offenbart oder in Betracht gezogen wird, entfernt. Zu den Methionin-Minus-Cas9-Nickasen gehören beispielsweise die folgenden Sequenzen oder eine Variante davon mit einer Aminosäuresequenz, die mindestens 80 %, mindestens 85 %, mindestens 90 %, mindestens 95 % oder mindestens 99 % Sequenzidentität dazu aufweist.
    Figure DE112020001339T5_0066
    Figure DE112020001339T5_0067
    Figure DE112020001339T5_0068
    Figure DE112020001339T5_0069
    Figure DE112020001339T5_0070
  • E. Andere Cas9-Varianten
  • Neben toten Cas9- und Cas9-Nickase-Varianten können die hier verwendeten Cas9-Proteine auch andere „Cas9-Varianten“ beinhalten, die zu mindestens etwa 70 %, mindestens etwa 80 %, mindestens etwa 90 %, mindestens etwa 95 %, mindestens etwa 96 %, mindestens etwa 97 %, mindestens etwa 98 %, mindestens etwa 99 %, mindestens etwa 99,5 % oder mindestens etwa 99,9 % mit einem beliebigen Referenz-Cas9-Protein identisch sind, einschließlich eines Wildtyp-Cas9 oder eines mutierten Cas9 (z. B., ein totes Cas9 oder eine Cas9-Nickase) oder eines Fragment-Cas9 oder eines zirkulären permutanten Cas9 oder einer anderen Variante von Cas9, die hier offenbart ist oder im Stand der Technik bekannt ist. In einigen Ausführungsformen kann eine Cas9-Variante 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 21, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50 oder mehr Aminosäureänderungen im Vergleich zu einem Referenz-Cas9 aufweisen. In einigen Ausführungsformen umfasst die Cas9-Variante ein Fragment eines Referenz-Cas9 (z. B. eine gRNA-Bindungsdomäne oder eine DNA-Spaltungsdomäne), sodass das Fragment zu mindestens etwa 70 %, zu mindestens etwa 80 %, zu mindestens etwa 90 %, zu mindestens etwa 95 %, zu mindestens etwa 96 %, zu mindestens etwa 97 %, zu mindestens etwa 98 %, zu mindestens etwa 99 %, zu mindestens etwa 99,5 % oder zu mindestens etwa 99,9 % mit dem entsprechenden Fragment des Wildtyp-Cas9 identisch ist. In einigen Ausführungsformen weist das Fragment mindestens 30 %, mindestens 35 %, mindestens 40 %, mindestens 45 %, mindestens 50 %, mindestens 55 %, mindestens 60 %, mindestens 65 %, mindestens 70 %, mindestens 75 %, mindestens 80 %, mindestens 85 %, mindestens 90 %, mindestens 95 %, mindestens 96 %, mindestens 97 %, mindestens 98 %, mindestens 99 % oder mindestens 99,5 % der Aminosäurelänge eines entsprechenden Wildtyp-Cas9 (z. B. SEQ ID NO: 18) auf.
  • In einigen Ausführungsformen kann die Offenbarung auch Cas9-Fragmente verwenden, die ihre Funktionalität behalten und die Fragmente eines hier offenbarten Cas9-Proteins sind. In einigen Ausführungsformen ist das Cas9-Fragment mindestens 100 Aminosäuren lang. In einigen Ausführungsformen ist das Fragment mindestens 100, 150,200,250, 300, 350,400,450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250 oder mindestens 1300 Aminosäuren lang.
  • In verschiedenen Ausführungsformen können die hier offenbarten Prime Editoren eine der nachfolgend beschriebenen Cas9-Varianten oder eine Cas9-Variante davon, die zu mindestens etwa 70 % identisch, zu mindestens etwa 80 % identisch, zu mindestens etwa 90 % identisch, zu mindestens etwa 95 % identisch, zu mindestens etwa 96 % identisch, zu mindestens etwa 97 % identisch, zu mindestens etwa 98 % identisch, zu mindestens etwa 99 % identisch, zu mindestens etwa 99,5 % identisch oder zu mindestens etwa 99,9 % identisch mit beliebigen Referenz-Cas9-Varianten ist, umfassen.
  • F. Kleine Cas9-Varianten
  • In einigen Ausführungsformen können die hier betrachteten Prime Editoren ein Cas9-Protein beinhalten, das ein geringeres Molekulargewicht hat als die kanonische SpCas9-Sequenz. In einigen Ausführungsformen können die kleineren Cas9-Varianten die Einbringung in Zellen erleichtern, z. B. durch einen Expressionsvektor, Nanopartikel oder andere Einbringungsmöglichkeiten. In bestimmten Ausführungsformen können die kleineren Cas9-Varianten Enzyme beinhalten, die als Typ-II-Enzyme der CRISPR-Cas-Systeme der Klasse 2 kategorisiert sind. In einigen Ausführungsformen können die kleineren Cas9-Varianten Enzyme beinhalten, die als Typ-V-Enzyme der CRISPR-Cas-Systeme der Klasse 2 kategorisiert sind. In anderen Ausführungsformen können die kleineren Cas9-Varianten Enzyme beinhalten, die als Typ-VI-Enzyme der CRISPR-Cas-Systeme der Klasse 2 kategorisiert sind.
  • Das kanonische SpCas9-Protein ist 1368 Aminosäuren lang und hat ein vorhergesagtes Molekulargewicht von 158 Kilodalton. Der Begriff „kleine Cas9-Variante“, wie er hier verwendet wird, bezieht sich auf eine beliebige Cas9-Variante - natürlich vorkommend, konstruiert oder anderweitig -, die weniger als mindestens 1300 Aminosäuren oder mindestens weniger als 1290 Aminosäuren oder weniger als 1280 Aminosäuren oder weniger als 1270 Aminosäuren oder weniger als 1260 Aminosäuren oder weniger als 1250 Aminosäuren oder weniger als 1240 Aminosäuren oder weniger als 1230 Aminosäuren oder weniger als 1220 Aminosäuren oder weniger als 1210 Aminosäuren oder weniger als 1200 Aminosäuren oder weniger als 1190 Aminosäuren oder weniger als 1180 Aminosäuren oder weniger als 1170 Aminosäuren oder weniger als 1160 Aminosäuren oder weniger als 1150 Aminosäuren oder weniger als 1140 Aminosäuren oder weniger als 1130 Aminosäuren oder weniger als 1120 Aminosäuren oder weniger als 1110 Aminosäuren oder weniger als 1100 Aminosäuren oder weniger als 1050 Aminosäuren oder weniger als 1000 Aminosäuren oder weniger als 950 Aminosäuren oder weniger als 900 Aminosäuren oder weniger als 850 Aminosäuren oder weniger als 800 Aminosäuren oder weniger als 750 Aminosäuren oder weniger als 700 Aminosäuren oder weniger als 650 Aminosäuren oder weniger als 600 Aminosäuren oder weniger als 550 Aminosäuren oder weniger als 500 Aminosäuren, aber mindestens mehr als etwa 400 Aminosäuren aufweist und die gewünschten Funktionen des Cas9-Proteins behält. Die Cas9-Varianten können solche beinhalten, die als Typ-II-, Typ-V- oder Typ-VI-Enzyme des CRISPR-Cas-Systems der Klasse 2 kategorisiert sind.
  • In verschiedenen Ausführungsformen können die hier offenbarten Prime Editoren eine der nachfolgend beschriebenen kleinen Cas9-Varianten oder eine Cas9-Variante davon umfassen, die zu mindestens etwa 70 % identisch, zu mindestens etwa 80 % identisch, zu mindestens etwa 90 % identisch, zu mindestens etwa 95 % identisch, zu mindestens etwa 96 % identisch, zu mindestens etwa 97 % identisch, zu mindestens etwa 98 % identisch, zu mindestens etwa 99 % identisch, zu mindestens etwa 99,5 % identisch oder zu mindestens etwa 99,9 % identisch mit einem beliebigen kleinen Referenz-Cas9-Protein ist.
    Figure DE112020001339T5_0071
    Figure DE112020001339T5_0072
    Figure DE112020001339T5_0073
    Figure DE112020001339T5_0074
    Figure DE112020001339T5_0075
    Figure DE112020001339T5_0076
  • G. Cas9-Äquivalente
  • In einigen Ausführungsformen können die hier beschriebenen Prime Editoren ein beliebiges Cas9-Äquivalent beinhalten. Im hier verwendeten Sinne ist der Begriff „Cas9-Äquivalent“ ein breiter Begriff, der jedes napDNAbp-Protein einschließt, das die gleiche Funktion wie Cas9 in den vorliegenden Prime Editoren erfüllt, obwohl seine primäre Aminosäuresequenz und/oder seine dreidimensionale Struktur aus evolutionärer Sicht möglicherweise unterschiedlich und/oder nicht verwandt ist. Während Cas9-Äquivalente also jede(s) Cas9-Ortholog, -Homolog, - Mutante oder -Variante beinhalten, die hier beschrieben oder eingeschlossen sind und die evolutionär verwandt sind, schließen die Cas9-Äquivalente auch Proteine ein, die sich durch konvergente Evolutionsprozesse entwickelt haben können, um die gleiche oder eine ähnliche Funktion wie Cas9 zu haben, die aber nicht notwendigerweise eine Ähnlichkeit in Bezug auf die Aminosäuresequenz und/oder die dreidimensionale Struktur aufweisen. Die hier beschriebenen Prime Editoren schließen jedes Cas9-Äquivalent ein, das die gleiche oder eine ähnliche Funktion wie Cas9 bereitstellen würde, auch wenn das Cas9-Äquivalent auf einem Protein basieren kann, das durch konvergente Evolution entstanden ist. Wenn sich Cas9 beispielsweise auf ein Typ-II-Enzym des CRISPR-Cas-Systems bezieht, kann sich ein Cas9-Äquivalent auf ein Typ-V- oder Typ-VI-Enzym des CRISPR-Cas-Systems beziehen.
  • Zum Beispiel ist Cas12e (CasX) ein Cas9-Äquivalent, das Berichten zufolge die gleiche Funktion wie Cas9 hat, sich aber durch konvergente Evolution entwickelt hat. Das bei Liu et al., „CasX enzymes comprises a distinct family of RNA-guided genome editors“, Nature, 2019, Bd. 566: 218-223, beschriebene Cas12e(CasX)-Protein könnte also mit den hier beschriebenen Prime Editoren verwendet werden. Darüber hinaus ist jede Variante oder Modifikation von Cas12e (CasX) denkbar und liegt im Schutzumfang der vorliegenden Offenbarung.
  • Cas9 ist ein bakterielles Enzym, das sich in einer Vielzahl von Arten entwickelt hat. Die hier in Betracht gezogenen Cas9-Äquivalente können jedoch auch aus Archaeen gewonnen werden, die eine andere Domäne und ein anderes Reich einzelliger prokaryotischer Mikroben als Bakterien darstellen.
  • In einigen Ausführungsformen können sich Cas9-Äquivalente auf Cas12e (CasX) oder Cas12d (CasY) beziehen, die z. B. bei Burstein et al., „New CRISPR-Cas systems from uncultivated microbes,“, Cell Res., 21. Februar 2017, doi: 10.1038/cr.2017.21, beschrieben wurden, dessen gesamter Inhalt hiermit durch Bezugnahme aufgenommen ist. Mithilfe der Genom-aufgelösten Metagenomik wurde eine Reihe von CRISPR-Cas-Systemen identifiziert, darunter das erste Cas9, das in der Lebensdomäne der Archaeen nachgewiesen wurde. Dieses divergierende Cas9-Protein wurde in wenig untersuchten Nanoarchaeen als Teil eines aktiven CRISPR-Cas-Systems gefunden. In Bakterien wurden zwei bisher unbekannte Systeme entdeckt, CRISPR-Cas12e und CRISPR-Cas12d, die zu den kompaktesten Systemen gehören, die bisher entdeckt wurden. In einigen Ausführungsformen bezieht sich Cas9 auf Cas12e oder eine Variante von Cas12e. In einigen Ausführungsformen bezieht sich Cas9 auf ein Cas12d oder eine Variante von Cas12d. Es sei darauf hingewiesen, dass auch andere RNA-gesteuerte DNA-Bindungsproteine als Nukleinsäure-programmierbares DNA-Bindungsprotein (napDNAbp) verwendet werden können und in den Schutzumfang dieser Offenbarung fallen. Siehe auch Liu et al., „CasX enzymes comprises a distinct family of RNA-guided genome editors“, Nature, 2019, Bd. 566: 218-223. Jedes dieser Cas9-Äquivalente ist denkbar.
  • In einigen Ausführungsformen umfasst das Cas9-Äquivalent eine Aminosäuresequenz, die zu mindestens 85 %, mindestens 90 %, mindestens 91 %, mindestens 92 %, mindestens 93 %, mindestens 94 %, mindestens 95 %, mindestens 96 %, mindestens 97 %, mindestens 98 %, mindestens 99 % oder zu mindestens 99,5 % mit einem natürlich vorkommenden Cas12e(CasX)- oder Cas12d(CasY)-Protein identisch ist. In einigen Ausführungsformen ist das napDNAbp ein natürlich vorkommendes Cas12e(CasX)- oder Cas12d(CasY)-Protein. In einigen Ausführungsformen umfasst das napDNAbp eine Aminosäuresequenz, die zu mindestens 85 %, mindestens 90 %, mindestens 91 %, mindestens 92 %, mindestens 93 %, mindestens 94 %, mindestens 95 %, mindestens 96 %, mindestens 97 %, mindestens 98 %, mindestens 99 % oder zu mindestens 99,5 % mit einer Wildtyp-Cas-Einheit oder einer hier bereitgestellten Cas-Einheit identisch ist.
  • In verschiedenen Ausführungsformen beinhalten die Nukleinsäure-programmierbaren DNA-Bindungsproteine ohne Einschränkung Cas9 (z. B. dCas9 und nCas9), Cas12e (CasX), Cas12d (CasY), Cas12a (Cpfl), Cas12b1 (C2c1), Cas13a (C2c2), Cas12c (C2c3), Argonaute und Cas12b1. Ein Beispiel für ein Nukleinsäure-programmierbares DNA-bindendes Protein, das eine andere PAM-Spezifität als Cas9 aufweist, Clustered Regularly Interspaced Short Palindromic Repeats aus Prevotella und Francisella 1 (d. h. Cas12a (Cpfl)). Ähnlich wie Cas9 ist Cas12a (Cpfl) auch ein CRISPR-Effektor der Klasse 2, es ist aber ein Mitglied der Typ-V-Untergruppe von Enzymen und nicht der Typ-II-Untergruppe. Es hat sich gezeigt, dass Cas12a (Cpfl) eine robuste DNA-Interferenz mit anderen Eigenschaften als Cas9 vermittelt. Cas12a (Cpfl) ist eine einzelne RNA-gesteuerte Endonuklease, der tracrRNA fehlt und die ein T-reiches, an den Protospacer angrenzendes Motiv (TTN, TTTN oder YTN) verwendet. Außerdem spaltet Cpfl die DNA über einen versetzten DNA-Doppelstrangbruch. Von 16 Proteinen der Cpfl-Familie wurde bei zwei Enzymen aus Acidaminococcus und Lachnospiraceae gezeigt, dass sie in menschlichen Zellen eine effiziente Genom-Editier-Aktivität aufweisen. Cpfl-Proteine sind im Stand der Technik bekannt und wurden bereits beschrieben, z. B. bei Yamano et al. „Crystal structure of Cpfl in complex with guide RNA and target DNA“, Cell (165) 2016, S. 949-962; dessen gesamter Inhalt ist hiermit durch Bezugnahme aufgenommen.
  • In noch anderen Ausführungsformen kann das Cas-Protein jedes CRISPR-assoziierte Protein beinhalten, einschließlich, aber nicht beschränkt auf Cas12a, Cas12b1, Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9 (auch bekannt als Csn1 und Csx12), Cas10, Csy1, Csy2, Csy3, Csel, Cse2, Cscl, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4, Homologe davon oder modifizierte Versionen davon, und vorzugsweise umfassend eine Nickase-Mutation (z. B. eine Mutation, die der D10A-Mutation des Wildtyp-Cas9-Polypeptids von SEQ ID NO: 18 entspricht).
  • In verschiedenen anderen Ausführungsformen kann das napDNAbp eines der folgenden Proteine sein: ein Cas9, ein Cas12a (Cpfl), ein Cas12e (CasX), ein Cas12d (CasY), ein Cas12b1 (C2c1), ein Cas13a (C2c2), ein Cas12c (C2c3), ein GeoCas9, ein CjCas9, ein Cas12g, ein Cas12h, ein Cas12i, ein Cas13b, ein Cas13c, ein Cas13d, ein Cas14, ein Csn2, ein xCas9, ein SpCas9-NG, ein zirkulär permutiertes Cas9 oder eine Argonaute(Ago)-Domäne oder eine Variante davon.
  • Beispielhafte Cas9-äquivalente Proteinsequenzen können Folgendes beinhalten:
    Figure DE112020001339T5_0077
    Figure DE112020001339T5_0078
    Figure DE112020001339T5_0079
    Figure DE112020001339T5_0080
    Figure DE112020001339T5_0081
    Figure DE112020001339T5_0082
    Figure DE112020001339T5_0083
    Figure DE112020001339T5_0084
    Figure DE112020001339T5_0085
  • Die hier beschriebenen Prime Editoren können auch Cas12a(Cpf1)(dCpf1)-Varianten umfassen, die als Guide-Nukleotidsequenz-programmierbare DNA-bindende Proteindomäne verwendet werden können. Das Cas12a(Cpf1)-Protein weist eine RuvC-ähnliche Endonuklease-Domäne auf, die der RuvC-Domäne von Cas9 ähnlich ist, aber keine HNH-Endonuklease-Domäne aufweist, und das N-Terminal von Cas12a (Cpfl) weist nicht den alfa-helikalen Erkennungslappen von Cas9 auf. In Zetsche et al., Cell, 163, 759-771, 2015, wurde gezeigt, dass die RuvC-ähnliche Domäne von Cas12a (Cpfl) für die Spaltung beider DNA-Stränge verantwortlich ist und die Inaktivierung der RuvC-ähnlichen Domäne die Cas12a(Cpf1)-Nukleaseaktivität inaktiviert.
  • In einigen Ausführungsformen ist das napDNAbp ein einzelner Effektor eines mikrobiellen CRISPR-Cas-Systems. Einzelne Effektoren mikrobieller CRISPR-Cas-Systeme beinhalten ohne Einschränkung Cas9, Cas12a (Cpfl), Cas12b1 (C2c1), Cas13a (C2c2) und Cas12c (C2c3). Typischerweise werden mikrobielle CRISPR-Cas-Systeme in Systeme der Klasse 1 und Klasse 2 unterteilt. Klasse-1-Systeme haben Effektorkomplexe mit mehreren Untereinheiten, während Klasse-2-Systeme einen einzelnen Protein-Effektor haben. Zum Beispiel sind Cas9 und Cas12a (Cpfl) Effektoren der Klasse 2. Zusätzlich zu Cas9 und Cas12a (Cpfl) wurden drei verschiedene Klasse-2-CRISPR-Cas-Systeme (Cas12b1, Cas13a und Cas12c) von Shmakov et al., „Discovery and Functional Characterization of Diverse Class 2 CRISPR Cas Systems“, Mol. Cell, 5. Nov. 2015; 60(3): 385-397, beschrieben, dessen gesamter Inhalt hiermit durch Bezugnahme aufgenommen ist.
  • Die Effektoren von zwei dieser Systeme, Cas12b1 und Cas12c, enthalten RuvC-ähnliche Endonuklease-Domänen, die mit Cas12a verwandt sind. Ein drittes System, Cas13a, enthält einen Effektor mit zwei prädizierten HEPN-RNase-Domänen. Die Produktion von reifer CRISPR-RNA ist tracrRNA-unabhängig, im Gegensatz zur Produktion von CRISPR-RNA durch Cas12b1. Cas12b1 ist für die DNA-Spaltung sowohl von CRISPR-RNA als auch von tracrRNA abhängig. Es wurde gezeigt, dass bakterielles Cas13a eine einzigartige RNase-Aktivität für die CRISPR-RNA-Reifung besitzt, die sich von seiner RNA-aktivierten einzelsträngigen RNA-Abbauaktivität unterscheidet. Diese RNase-Funktionen unterscheiden sich voneinander und vom CRISPR-RNA-Verarbeitungsverhalten von Cas12a. Siehe z. B. East-Seletsky et al., „Two distinct RNase activities of CRISPR-Cas13a enable guide-RNA processing and RNA detection“, Nature, 13. Okt. 2016; 538(7624): 270-273, dessen gesamter Inhalt hiermit durch Bezugnahme aufgenommen ist. Die biochemische In-vitro-Analyse von Cas13a in Leptotrichia shahii hat gezeigt, dass Cas13a von einer einzelnen CRISPR-RNA gesteuert wird und so programmiert werden kann, dass es ssRNA-Targets mit komplementären Protospacern spaltet. Katalytische Reste in den beiden konservierten HEPN-Domänen vermitteln die Spaltung. Mutationen in den katalytischen Resten erzeugen katalytisch inaktive RNA-bindende Proteine. Siehe z. B. Abudayyeh et al., „C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector“, Science, 5. August 2016; 353(6299), dessen gesamter Inhalt hiermit durch Bezugnahme aufgenommen ist.
  • Die Kristallstruktur von Cas12b1 (AacC2c1) aus Alicyclobaccillus acidoterrastris wurde im Komplex mit einer chimären Einzelmolekül-Guide-RNA (sgRNA) berichtet. Siehe z. B. Liu et al., „C2c1-sgRNA Complex Structure Reveals RNA-Guided DNA Cleavage Mechanism“, Mol. Cell, 19. Jan. 2017; 65(2): 310-322, dessen gesamter Inhalt hiermit durch Bezugnahme aufgenommen ist. Die Kristallstruktur wurde auch für Alicyclobacillus-acidoterrestris-C2c1 berichtet, das an Target-DNAs als ternäre Komplexe gebunden ist. Siehe z. B. Yang et al., „PAMdependent Target DNA Recognition and Cleavage by C2C1 CRISPR-Cas endonuclease“, Cell, 15. Dez. 2016; 167(7): 1814-1828, dessen gesamter Inhalt hiermit durch Bezugnahme aufgenommen ist. Katalytisch kompetente Konformationen von AacC2c1, sowohl mit Target- als auch mit Nicht-Target-DNA-Strängen, wurden unabhängig voneinander in einer einzelnen katalytischen RuvC-Tasche eingefangen, wobei die C2c1-vermittelte Spaltung zu einem gestaffelten Sieben-Nukleotid-Bruch der Target-DNA führt. Strukturelle Vergleiche zwischen ternären C2c1-Komplexen und zuvor identifizierten Cas9- und Cpfl-Gegenstücken zeigen die Vielfalt der Mechanismen, die von CRISPR-Cas9-Systemen verwendet werden.
  • In einigen Ausführungsformen kann das napDNAbp ein C2c1-, ein C2c2- oder ein C2c3-Protein sein. In einigen Ausführungsformen ist das napDNAbp ein C2c1-Protein. In einigen Ausführungsformen ist das napDNAbp ein Cas13a-Protein. In einigen Ausführungsformen ist das napDNAbp ein Cas12c-Protein. In einigen Ausführungsformen umfasst das napDNAbp eine Aminosäuresequenz, die zu mindestens 85 %, mindestens 90 %, mindestens 91 %, mindestens 92 %, mindestens 93 %, mindestens 94 %, mindestens 95 %, mindestens 96 %, mindestens 97 %, mindestens 98 %, mindestens 99 % oder zu mindestens 99,5 % mit einem natürlich vorkommenden Cas12b1(C2c1)-, Cas13a(C2c2)- oder Cas12c(C2c3)-Protein identisch ist. In einigen Ausführungsformen ist das napDNAbp ein natürlich vorkommendes Cas12b1(C2c1)-, Cas13a(C2c2)- oder Cas12c(C2c3)-Protein.
  • H. Zirkuläre Cas9-Permutanten
  • In verschiedenen Ausführungsformen können die hier offenbarten Prime Editoren eine zirkuläre Permutante von Cas9 umfassen.
  • Der Begriff „zirkulär permutiertes Cas9“ oder „zirkuläre Permutante“ von Cas9 oder „CP-Cas9“ bezieht sich auf ein Cas9-Protein oder eine Variante davon, die als zirkulär permutierte Variante auftritt oder modifiziert wurde, was bedeutet, dass der N-Terminus und der C-Terminus eines Cas9-Proteins (z. B. eines Wildtyp-Cas9-Proteins) topisch umgeordnet wurden. Solche zirkulär permutierten Cas9-Proteine oder Varianten davon behalten die Fähigkeit, DNA zu binden, wenn sie mit einer Guide-RNA (gRNA) komplexiert werden. Siehe Oakes et al., „Protein Engineering of Cas9 for enhanced function“, Methods Enzymol, 2014, 546: 491-511, und Oakes et al., „CRISPR-Cas9 Circular Permutants as Programmable Scaffolds for Genome Modification“, Cell, 10. Januar 2019, 176: 254-267, die hier jeweils durch Bezugnahme aufgenommen sind. Die vorliegende Offenbarung zieht jedes zuvor bekannte CP-Cas9 oder die Verwendung eines neuen CP-Cas9 in Betracht, solange das resultierende zirkulär permutierte Protein die Fähigkeit behält, DNA zu binden, wenn es mit einer Guide-RNA (gRNA) komplexiert ist.
  • Jedes der hier beschriebenen Cas9-Proteine, einschließlich jeder Variante, jedes Orthologs oder natürlich vorkommenden Cas9 oder eines Äquivalents davon, kann als zirkuläre Permutantenvariante rekonfiguriert werden.
  • In verschiedenen Ausführungsformen können die zirkulären Permutanten von Cas9 die folgende Struktur aufweisen:
    N-Terminus-[ursprünglicher C-Terminus]-[optionaler Linker]-[ursprünglicher N-Terminus]-C-Terminus.
  • Als Beispiel betrachtet die vorliegende Offenbarung die folgenden zirkulären Permutanten von kanonischem Cas9 aus S. pyogenes (1368 Aminosäuren von UniProtKB - Q99ZW2 (CAS9_STRP1) (die Nummerierung basiert auf der Aminosäureposition in SEQ ID NO: 18)):
    N-Terminus-[1268-1368]-[optionaler Linker]-[1-1267]-C-Terminus;
    N-Terminus-[1168-1368]-[optionaler Linker]-[1-1 167]-C-Terminus;
    N-Terminus-[1068-1368]-[optionaler Linker]-[1-1067]-C-Terminus;
    N-Terminus-[968-1368]-[optionaler Linker]-[1-967]-C-Terminus;
    N-Terminus-[868-1368]-[optionaler Linker]-[1-867]-C-Terminus;
    N-Terminus-[768-1368]-[optionaler Linker]-[1-767]-C-Terminus;
    N-Terminus-[668-1368]-[optionaler Linker]-[1-667]-C-Terminus;
    N-Terminus-[568-1368]-[optionaler Linker]-[1-567]-C-Terminus;
    N-Terminus-[468-1368]-[optionalerLinker]-[1-467]-C-Terminus;
    N-Terminus-[368-1368]-[optionaler Linker]-[1-367]-C-Terminus;
    N-Terminus-[268-1368]-[optionaler Linker]-[1-267]-C-Terminus;
    N-Terminus-[168-1368]-[optionaler Linker]-[1-167]-C-Terminus;
    N-Terminus-[68-1368]-[optionaler Linker]-[1-67]-C-Terminus; oder
    N-Terminus-[10-1368]-[optionaler Linker]-[1-9]-C-Terminus oder die entsprechenden zirkulären Permutanten anderer Cas9-Proteine (einschließlich anderer Cas9-Orthologe, -Varianten usw.).
  • In bestimmten Ausführungsformen weist das zirkuläre permutante Cas9 die folgende Struktur auf (basierend auf Cas9 aus S. pyogenes (1368 Aminosäuren von UniProtKB - Q99ZW2 (CAS9_STRP1) (die Nummerierung basiert auf der Aminosäureposition in SEQ ID NO: 18)):
    N-Terminus-[102-1368]-[optionaler Linker]-[1-101]-C-Terminus;
    N-Terminus-[1028-1368]-[optionaler Linker]-[1-1027]-C-Terminus;
    N-Terminus-[1041-1368]-[optionaler Linker]-[1-1043]-C-Terminus;
    N-Terminus-[1249-1368]-[optionaler Linker]-[1-1248]-C-Terminus; oder
    N-Terminus-[1300-1368]-[optionaler Linker]-[1-1299]-C-Terminus oder die entsprechenden zirkulären Permutanten anderer Cas9-Proteine (einschließlich anderer Cas9-Orthologe, -Varianten usw.).
  • In anderen Ausführungsformen weist das zirkuläre permutante Cas9 die folgende Struktur auf (basierend auf Cas9 aus S. pyogenes (1368 Aminosäuren von UniProtKB - Q99ZW2 (CAS9_STRP1) (die Nummerierung basiert auf der Aminosäureposition in SEQ ID NO: 18)):
    N-Terminus-[103-1368]-[optionaler Linker]-[1-102]-C-Terminus;
    N-Terminus-[1029-1368]-[optionaler Linker]-[1-1028]-C-Terminus;
    N-Terminus-[1042-1368]-[optionaler Linker]-[1-1041]-C-Terminus;
    N-Terminus-[1250-1368]-[optionaler Linker]-[1-1249]-C-Terminus; oder
    N-Terminus-[1301-1368]-[optionaler Linker]-[1-1300]-C-Terminus oder die entsprechenden zirkulären Permutanten anderer Cas9-Proteine (einschließlich anderer Cas9-Orthologe, -Varianten usw.).
  • In einigen Ausführungsformen kann die zirkuläre Permutante gebildet werden, indem ein C-terminales Fragment eines Cas9 mit einem N-terminalen Fragment eines Cas9 entweder direkt oder unter Verwendung eines Linkers, wie beispielsweise eines Aminosäure-Linkers, verbunden wird. In einigen Ausführungsformen kann das C-terminale Fragment den C-terminalen 95 % oder mehr der Aminosäuren eines Cas9 (z. B. etwa Aminosäuren 1300-1368) oder den C-terminalen 90 %, 85 %, 80 %, 75 %, 70 %, 65 %, 60 %, 55 %, 50 %, 45 %, 40 %, 35 %, 30 %, 25 %, 20 %, 15 %, 10 % oder 5 % oder mehr eines Cas9 (z. B. einer der SEQ ID NO: 77-86) entsprechen. Der N-terminale Teil kann den N-terminalen 95 % oder mehr der Aminosäuren eines Cas9 (z. B. etwa Aminosäuren 1-1300) oder den N-terminalen 90 %, 85 %, 80 %, 75 %, 70 %, 65 %, 60 %, 55 %, 50 %, 45 %, 40 %, 35 %, 30 %, 25 %, 20 %, 15 %, 10 % oder 5 % oder mehr eines Cas9 (z. B. von SEQ ID NO: 18) entsprechen.
  • In einigen Ausführungsformen kann die zirkuläre Permutante gebildet werden, indem ein C-terminales Fragment eines Cas9 mit einem N-terminalen Fragment eines Cas9 entweder direkt oder unter Verwendung eines Linkers, wie beispielsweise eines Aminosäure-Linkers, verbunden wird. In einigen Ausführungsformen beinhaltet das C-terminale Fragment, das zum N-Terminus umgeordnet ist, die C-terminalen 30 % oder weniger der Aminosäuren eines Cas9 (z. B. die Aminosäuren 1012-1368 von SEQ ID NO: 18) oder entspricht diesen. In einigen Ausführungsformen beinhaltet das C-terminale Fragment, das zum N-Terminus umgeordnet ist, die C-terminalen 30 %, 29 %, 28 %, 27 %, 26 %, 25 %, 24 %, 23 %, 22 %, 21 %, 20 %, 19 %, 18 %, 17 %, 16 %, 15 %, 14 %, 13 %, 12 %, 11 %, 10 %, 9 %, 8 %, 7 %, 6 %, 5 %, 4 %, 3 %, 2 % oder 1 % der Aminosäuren eines Cas9 (z. B. das Cas9 der SEQ ID NO: 18) oder entspricht diesen. In einigen Ausführungsformen beinhaltet das C-terminale Fragment, das zum N-Terminus umgeordnet ist, die 410 C-terminalen Reste oder weniger eines Cas9 (z. B. das Cas9 von SEQ ID NO: 18) oder entspricht diesen. In einigen Ausführungsformen beinhaltet der C-terminale Teil, der zum N-Terminus umgeordnet ist, die C-terminalen 410, 400, 390, 380, 370, 360, 350, 340, 330, 320, 310, 300, 290, 280, 270, 260, 250, 240, 230, 220, 210, 200, 190, 180, 170, 160, 150, 140, 130, 120, 110, 100, 90, 80, 70, 60, 50, 40, 30, 20 oder 10 Reste eines Cas9 (z. B. das Cas9 der SEQ ID NO: 18) oder entspricht diesen. In einigen Ausführungsformen beinhaltet der C-terminale Teil, der zum N-Terminus umgeordnet ist, die C-terminalen 357, 341, 328, 120 oder 69 Reste eines Cas9 (z. B. das Cas9 der SEQ ID NO: 18) oder entspricht diesen.
  • In anderen Ausführungsformen können zirkuläre permutante Cas9-Varianten als eine topologische Umordnung einer Cas9-Primärstruktur definiert werden, die auf dem folgenden Verfahren basiert, das auf S.-pyogenes-Cas9 der SEQ ID NO: 18 beruht: (a) Auswahl einer zirkulären permutanten (circular permutant - CP-) Stelle, die einem internen Aminosäurerest der Cas9-Primärstruktur entspricht, die das ursprüngliche Protein in zwei Hälften zerlegt: eine N-terminale Region und eine C-terminale Region; (b) Modifizierung der Cas9-Proteinsequenz (z. B. durch gentechnische Verfahren), indem die ursprüngliche C-terminale Region (die die Aminosäure der CP-Stelle umfasst) vor die ursprüngliche N-terminale Region verschoben wird, wodurch ein neuer N-Terminus des Cas9-Proteins gebildet wird, der nun mit dem Aminosäurerest der CP-Stelle beginnt. Die CP-Stelle kann sich in einer beliebigen Domäne des Cas9-Proteins befinden, einschließlich beispielsweise der Helikal-II-Domäne, der RuvCIII-Domäne oder der CTD-Domäne. Beispielsweise kann sich die CP-Stelle (in Bezug auf das S.-pyogenes-Cas9 der SEQ ID NO: 18) am ursprünglichen Aminosäurerest 181, 199, 230, 270, 310, 1010, 1016, 1023, 1029, 1041, 1247, 1249 oder 1282 befinden. So würde die ursprüngliche Aminosäure 181, 199, 230, 270, 310, 1010, 1016, 1023, 1029, 1041, 1247, 1249 oder 1282 nach ihrer Verlagerung an den N-Terminus zur neuen N-terminalen Aminosäure. Die Nomenklatur dieser CP-Cas9-Proteine kann als Cas9-CP181, Cas9-CP199, Cas9-CP230, Cas9-CP270, Cas9-CP310, Cas9-CP1010, Cas9-CP1016, Cas9-CP1023, Cas9-CP1029, Cas9-CP1041, Cas9-CP1247, Cas9-CP1249 bzw. Cas9-CP1282 bezeichnet werden. Diese Beschreibung ist nicht auf die Herstellung von CP-Varianten aus SEQ ID NO: 18 beschränkt, sondern kann zur Herstellung von CP-Varianten in jeder Cas9-Sequenz eingesetzt werden, entweder an CP-Stellen, die diesen Positionen entsprechen, oder an gänzlich anderen CP-Stellen. Diese Beschreibung soll die spezifischen CP-Stellen in keiner Weise einschränken. Praktisch jede CP-Stelle kann verwendet werden, um eine CP-Cas9-Variante zu bilden.
  • Beispielhafte CP-Cas9-Aminosäuresequenzen, basierend auf dem Cas9 von SEQ ID NO: 18, sind unten angegeben, wobei Linker-Sequenzen durch Unterstreichen und optionale Methionin(M)-Reste durch Fettdruck angegeben sind. Es ist zu beachten, dass die Offenbarung CP-Cas9-Sequenzen bereitstellt, die keine Linker-Sequenz oder die andere Linker-Sequenzen beinhalten. Es ist zu beachten, dass CP-Cas9-Sequenzen auch auf anderen Cas9-Sequenzen als derjenigen von SEQ ID NO: 18 basieren können und die hier angeführten Beispiele nicht als einschränkend zu verstehen sind. Beispielhafte CP-Cas9-Sequenzen sind wie folgt:
    Figure DE112020001339T5_0086
    Figure DE112020001339T5_0087
    Figure DE112020001339T5_0088
    Figure DE112020001339T5_0089
    Figure DE112020001339T5_0090
    Figure DE112020001339T5_0091
    Figure DE112020001339T5_0092
  • Die zirkulären Cas9-Permutanten, die in den hier beschriebenen Prime-Editing-Konstrukten nützlich sein können. Beispielhafte C-Terminal-Fragmente von Cas9, basierend auf dem Cas9 von SEQ ID NO: 18, die zu einem N-Terminus von Cas9 umgeordnet werden können, sind unten angegeben. Es ist zu beachten, dass solche C-terminalen Fragmente von Cas9 beispielhaft sind und nicht als einschränkend zu verstehen sind. Diese beispielhaften CP-Cas9-Fragmente weisen die folgenden Sequenzen auf:
    Figure DE112020001339T5_0093
    Figure DE112020001339T5_0094
  • I. Cas9-Varianten mit modifizierten PAM-Spezifitäten
  • Die Prime Editoren der vorliegenden Offenbarung können auch Cas9-Varianten mit modifizierten PAM-Spezifitäten umfassen. Einige Aspekte dieser Offenbarung stellen Cas9-Proteine bereit, die Aktivität auf einer Target-Sequenz zeigen, die nicht das kanonische PAM (5'-NGG-3', wobei N A, C, G oder T ist) an ihrem 3'-Ende umfasst. In einigen Ausführungsformen zeigt das Cas9-Protein Aktivität auf einer Target-Sequenz, die eine 5'-NGG-3'-PAM-Sequenz an ihrem 3'-Ende umfasst. In einigen Ausführungsformen zeigt das Cas9-Protein Aktivität auf einer Target-Sequenz, die eine 5'-NNG-3'-PAM-Sequenz an ihrem 3'-Ende umfasst. In einigen Ausführungsformen zeigt das Cas9-Protein Aktivität auf einer Target-Sequenz, die eine 5'-NNA-3'-PAM-Sequenz an ihrem 3'-Ende umfasst. In einigen Ausführungsformen zeigt das Cas9-Protein Aktivität auf einer Target-Sequenz, die eine 5'-NNC-3'-PAM-Sequenz an ihrem 3'-Ende umfasst. In einigen Ausführungsformen zeigt das Cas9-Protein Aktivität auf einer Target-Sequenz, die eine 5'-NNT-3'-PAM-Sequenz an ihrem 3'-Ende umfasst. In einigen Ausführungsformen zeigt das Cas9-Protein Aktivität auf einer Target-Sequenz, die eine 5'-NGT-3'-PAM-Sequenz an ihrem 3'-Ende umfasst. In einigen Ausführungsformen zeigt das Cas9-Protein Aktivität auf einer Target-Sequenz, die eine 5'-NGA-3'-PAM-Sequenz an ihrem 3'-Ende umfasst. In einigen Ausführungsformen zeigt das Cas9-Protein Aktivität auf einer Target-Sequenz, die eine 5'-NGC-3'-PAM-Sequenz an ihrem 3'-Ende umfasst. In einigen Ausführungsformen zeigt das Cas9-Protein Aktivität auf einer Target-Sequenz, die eine 5'-NAA-3'-PAM-Sequenz an ihrem 3'-Ende umfasst. In einigen Ausführungsformen zeigt das Cas9-Protein Aktivität auf einer Target-Sequenz, die eine 5'-NAC-3'-PAM-Sequenz an ihrem 3'-Ende umfasst. In einigen Ausführungsformen zeigt das Cas9-Protein Aktivität auf einer Target-Sequenz, die eine 5'-NAT-3'-PAM-Sequenz an ihrem 3'-Ende umfasst. In noch anderen Ausführungsformen zeigt das Cas9-Protein Aktivität auf einer Target-Sequenz, die eine 5'-NAG-3'-PAM-Sequenz an ihrem 3'-Ende umfasst.
  • Es ist zu beachten, dass jede der hier beschriebenen Aminosäuremutationen (z. B. A262T) von einem ersten Aminosäurerest (z. B. A) zu einem zweiten Aminosäurerest (z. B. T) auch Mutationen vom ersten Aminosäurerest zu einem Aminosäurerest beinhalten kann, der dem zweiten Aminosäurerest ähnlich ist (z. B. konserviert). Beispielsweise kann die Mutation einer Aminosäure mit einer hydrophoben Seitenkette (z. B. Alanin, Valin, Isoleucin, Leucin, Methionin, Phenylalanin, Tyrosin oder Tryptophan) eine Mutation zu einer zweiten Aminosäure mit einer anderen hydrophoben Seitenkette (z. B. Alanin, Valin, Isoleucin, Leucin, Methionin, Phenylalanin, Tyrosin oder Tryptophan) sein. Beispielsweise kann eine Mutation eines Alanins zu einem Threonin (z. B. eine A262T-Mutation) auch eine Mutation von einem Alanin zu einer Aminosäure sein, die in Größe und chemischen Eigenschaften einem Threonin, beispielsweise Serin, ähnlich ist. Als ein anderes Beispiel kann die Mutation einer Aminosäure mit einer positiv geladenen Seitenkette (z. B. Arginin, Histidin oder Lysin) eine Mutation zu einer zweiten Aminosäure mit einer anderen positiv geladenen Seitenkette (z. B. Arginin, Histidin oder Lysin) sein. Als weiteres Beispiel kann die Mutation einer Aminosäure mit einer polaren Seitenkette (z. B. Serin, Threonin, Asparagin oder Glutamin) eine Mutation zu einer zweiten Aminosäure mit einer anderen polaren Seitenkette (z. B. Serin, Threonin, Asparagin oder Glutamin) sein. Weitere ähnliche Aminosäurepaare beinhalten, ohne auf diese beschränkt zu sein, die folgenden: Phenylalanin und Tyrosin; Asparagin und Glutamin; Methionin und Cystein; Asparaginsäure und Glutaminsäure; und Arginin und Lysin. Der Fachmann würde erkennen, dass solche konservativen Aminosäuresubstitutionen wahrscheinlich geringe Auswirkungen auf die Proteinstruktur haben und wahrscheinlich gut toleriert werden, ohne die Funktion zu beeinträchtigen. In einigen Ausführungsformen kann jede Aminosäure der hier bereitgestellten Aminosäuremutationen von einer Aminosäure zu einem Threonin eine Aminosäuremutation zu einem Serin sein. In einigen Ausführungsformen kann jede Aminosäure der hier bereitgestellten Aminosäuremutationen von einer Aminosäure zu einem Arginin eine Aminosäuremutation zu einem Lysin sein. In einigen Ausführungsformen kann jede Aminosäure der hier bereitgestellten Aminosäuremutationen von einer Aminosäure zu einem Isoleucin eine Aminosäuremutation zu einem Alanin, Valin, Methionin oder Leucin sein. In einigen Ausführungsformen kann jede Aminosäure der hier bereitgestellten Aminosäuremutationen von einer Aminosäure zu einem Lysin eine Aminosäuremutation zu einem Arginin sein. In einigen Ausführungsformen kann jede Aminosäure der hier bereitgestellten Aminosäuremutationen von einer Aminosäure zu einer Asparaginsäure eine Aminosäuremutation zu einer Glutaminsäure oder einem Asparagin sein. In einigen Ausführungsformen kann jede Aminosäure der hier bereitgestellten Aminosäuremutationen von einer Aminosäure zu einem Valin eine Aminosäuremutation zu einem Alanin, Isoleucin, Methionin oder Leucin sein. In einigen Ausführungsformen kann jede Aminosäure der hier bereitgestellten Aminosäuremutationen von einer Aminosäure zu einem Glycin eine Aminosäuremutation zu einem Alanin sein. Es ist zu beachten, dass zusätzliche konservierte Aminosäurereste vom Fachmann erkannt würden und jede der Aminosäuremutationen zu anderen konservierten Aminosäureresten ebenfalls in den Schutzumfang dieser Offenbarung fällt.
  • In einigen Ausführungsformen umfasst das Cas9-Protein eine Kombination von Mutationen, die Aktivität auf einer Target-Sequenz mit einer 5'-NAA-3'-PAM-Sequenz an ihrem 3'-Ende zeigen. In einigen Ausführungsformen ist die Kombination von Mutationen in einem der in Tabelle 1 aufgeführten Klone vorhanden. In einigen Ausführungsformen sind die Kombination von Mutationen konservative Mutationen der in Tabelle 1 aufgeführten Klone. In einigen Ausführungsformen umfasst das Cas9-Protein die Kombination von Mutationen eines beliebigen der in Tabelle 1 aufgeführten Cas9-Klone. Tabelle 1: NAA-PAM-Klone
    Mutationen aus Wildtyp-SpCas9 (z. B. SEQ ID NO: 18)
    D177N, K218R, D614N, D1135N, P1137S, E1219V, A1320V, A1323D, R1333K
    D177N, K218R, D614N, D1135N, E1219V, Q1221H, H1264Y, A1320V, R1333K
    A10T, I322V, S409I, E427G, G715C, D1135N, E1219V, Q1221H, H1264Y, A1320V, R1333K
    A367T, K710E, R1114G, D1135N, P1137S, E1219V, Q1221H, H1264Y, A1320V, R1333K
    A10T, I322V, S409I, E427G, R753G, D861N, D1135N, K1188R, E1219V, Q1221H, H1264H, A1320V, R1333K
    A10T, I322V, S409I, E427G, R654L, V743I, R753G, M1021T, D1135N, D1180G, K1211R, E1219V, Q1221H, H1264Y, A1320V, R1333K
    A10T, I322V, S409I, E427G, V743I, R753G, E762G, D1135N, D1180G, K1211R, E1219V, Q1221H, H1264Y, A1320V, R1333K
    A10T, I322V, S409I, E427G, R753G, D1135N, D1180G, K1211R, E1219V, Q1221H, H1264Y, S1274R, A1320V, R1333K
    A10T, I322V, S409I, E427G, A589S, R753G, D1135N, E1219V, Q1221H, H1264H, A1320V, R1333K
    A10T, I322V, S409I, E427G, R753G, E757K, G865G, D1135N, E1219V, Q1221H, H1264Y, A1320V, R1333K
    A10T, I322V, S409I, E427G, R654L, R753G, E757K, D1135N, E1219V, Q1221H, H1264Y, A1320V, R1333K
    A10T, I322V, S409I, E427G, K599R, M631A, R654L, K673E, V743I, R753G, N758H, E762G, D1135N, D1180G, E1219V, Q1221H, Q1256R, H1264Y, A1320V, A1323D, R1333K
    A10T, I322V, S409I, E427G, R654L, K673E, V743I, R753G, E762G, N869S, N1054D, R1114G, D1135N, D1180G, E1219V, Q1221H, H1264Y, A1320V, A1323D, R1333K
    A10T, I322V, S409I, E427G, R654L, L727I, V743I, R753G, E762G, R859S, N946D, F1134L, D1135N, D1180G, E1219V, Q1221H, H1264Y, N1317T, A1320V, A1323D, R1333K
    A10T, I322V, S409I, E427G, R654L, K673E, V743I, R753G, E762G, N803S, N869S, Y1016D, G1077D, R1114G, F1134L, D1135N, D1180G, E1219V, Q1221H, H1264Y, V1290G, L1318S, A1320V, A1323D, R1333K
    A10T, I322V, S409I, E427G, R654L, K673E, V743I, R753G, E762G, N803S, N869S, Y1016D, G1077D, R1114G, F1134L, D1135N, K1151E, D1180G, E1219V, Q1221H, H1264Y, V1290G, L1318S, A1320V, R1333K
    A10T, I322V, S409I, E427G, R654L, K673E, V743I, R753G, E762G, N803S, N869S, Y1016D, G1077D, R1114G, F1134L, D1135N, D1180G, E1219V, Q1221H, H1264Y, V1290G, L1318S, A1320V, A1323D, R1333K
    A10T, I322V, S409I, E427G, R654L, K673E, F693L, V743I, R753G, E762G, N803S, N869S, L921P, Y1016D, G1077D, F1080S, R1114G, D1135N, D1180G, E1219V, Q1221H, H1264Y, L1318S, A1320V, A1323D, R1333K
    A10T, I322V, S409I, E427G, E630K, R654L, K673E, V743I, R753G, E762G, Q768H, N803S, N869S, Y1016D, G1077D, R1114G, F1134L, D1135N, D1180G, E1219V, Q1221H, H1264Y, L1318S, A1320V, R1333K
    A10T, I322V, S409I, E427G, R654L, K673E, F693L, V743I, R753G, E762G, Q768H, N803S, N869S, Y1016D, G1077D, R1114G, F1134L, D1135N, D1180G, E1219V, Q1221H, G1223S, H1264Y, L1318S, A1320V, R1333K
    A10T, I322V, S409I, E427G, R654L, K673E, F693L, V743I, R753G, E762G, N803S, N869S, L921P, Y1016D, G1077D, F1801S, R1114G, D1135N, D1180G, E1219V, Q1221H, H1264Y, L1318S, A1320V, A1323D, R1333K
    A10T, I322V, S409I, E427G, R654L, V743I, R753G, M1021T, D1135N, D1180G, K1211R, E1219V, Q1221H, H1264Y, A1320V, R1333K
    A10T, I322V, S409I, E427G, R654L, K673E, V743I, R753G, E762G, M673I, N803S, N869S, G1077D, R1114G, D1135N, V1139A, D1180G, E1219V, Q1221H, A1320V, R1333K
    A10T, I322V, S409I, E427G, R654L, K673E, V743I, R753G, E762G, N803S, N869S, R1114G, D1135N, E1219V, Q1221H, A1320V, R1333K
  • In einigen Ausführungsformen umfasst das Cas9-Protein eine Aminosäuresequenz, die zu mindestens 80 % mit der Aminosäuresequenz eines Cas9-Proteins identisch ist, wie sie durch eine der Varianten aus Tabelle 1 bereitgestellt wird. In einigen Ausführungsformen umfasst das Cas9-Protein eine Aminosäuresequenz, die zu mindestens 85 %, mindestens 90 %, mindestens 92 %, mindestens 95 %, mindestens 96 %, mindestens 97 %, mindestens 98 %, mindestens 99 % oder mindestens 99,5 % identisch mit der Aminosäuresequenz eines Cas9-Proteins ist, wie sie durch eine der Varianten aus Tabelle 1 bereitgestellt wird.
  • In einigen Ausführungsformen zeigt das Cas9-Protein eine erhöhte Aktivität auf einer Target-Sequenz, die, im Vergleich zum Streptococcus-pyogenes-Cas9, nicht das kanonische PAM (5'-NGG-3') an ihrem 3'-Ende umfasst, wie in SEQ ID NO: 18 angegeben. In einigen Ausführungsformen zeigt das Cas9-Protein eine Aktivität auf einer Target-Sequenz mit einem 3'-Ende, das nicht direkt an die kanonische PAM-Sequenz (5'-NGG-3') angrenzt, die im Vergleich zur Aktivität von Streptococcus-pyogenes-Cas9 gemäß SEQ ID NO: 18 auf derselben Target-Sequenz mindestens 5-fach erhöht ist. In einigen Ausführungsformen weist das Cas9-Protein eine Aktivität auf einer Target-Sequenz auf, die nicht direkt an die kanonische PAM-Sequenz (5'-NGG-3') angrenzt, die im Vergleich zur Aktivität von Streptococcuspyogenes gemäß SEQ ID NO: 2 auf derselben Target-Sequenz mindestens 10-fach, mindestens 50-fach, mindestens 100-fach, mindestens 500-fach, mindestens 1.000-fach, mindestens 5.000-fach, mindestens 10.000-fach, mindestens 50.000-fach, mindestens 100.000-fach, mindestens 500.000-fach oder mindestens 1.000.000-fach erhöht ist. In einigen Ausführungsformen grenzt das 3'-Ende der Target-Sequenz direkt an einer AAA-, GAA-, CAA- oder TAA-Sequenz an. In einigen Ausführungsformen umfasst das Cas9-Protein eine Kombination von Mutationen, die Aktivität auf einer Target-Sequenz mit einer 5'-NAC-3'-PAM-Sequenz an ihrem 3'-Ende zeigen. In einigen Ausführungsformen ist die Kombination von Mutationen in einem der in Tabelle 2 aufgeführten Klone vorhanden. In einigen Ausführungsformen sind die Kombination von Mutationen konservative Mutationen der in Tabelle 2 aufgeführten Klone. In einigen Ausführungsformen umfasst das Cas9-Protein die Kombination von Mutationen eines beliebigen der in Tabelle 2 aufgeführten Cas9-Klone. Tabelle 2: NAC-PAM-Klone
    MUTATIONEN AUS WILDTYP-SPCAS9 (Z. B. SEQ ID NO: 18)
    T472I, R753G, K890E, D1332N, R1335Q, T1337N
    I1057S, D1135N, P1301S, R1335Q, T1337N
    T472I, R753G, D1332N, R1335Q, T1337N
    D1135N, E1219V, D1332N, R1335Q, T1337N
    T472I, R753G, K890E, D1332N, R1335Q, T1337N
    I1057S, D1135N, P1301S, R1335Q, T1337N
    T472I, R753G, D1332N, R1335Q, T1337N
    T472I, R753G, Q771H, D1332N, R1335Q, T1337N
    E627K, T638P, K652T, R753G, N803S, K959N, R1114G, D1135N, E1219V, D1332N, R1335Q, T1337N
    E627K, T638P, K652T, R753G, N803S, K959N, R1114G, D1135N, K1156E, E1219V, D1332N, R1335Q, T1337N
    E627K, T638P, V647I, R753G, N803S, K959N, G1030R, I1055E, R1114G, D1135N, E1219V, D1332N, R1335Q, T1337N
    E627K, E630G, T638P, V647A, G687R, N767D, N803S, K959N, R1114G, D1135N, E1219V, D1332G, R1335Q, T1337N
    E627K, T638P, R753G, N803S, K959N, R1114G, D1135N, E1219V, N1266H, D1332N, R1335Q, T1337N
    E627K, T638P, R753G, N803S, K959N, I1057T, R1114G, D1135N, E1219V, D1332N, R1335Q, T1337N
    E627K, T638P, R753G, N803S, K959N, R1114G, D1135N, E1219V, D1332N, R1335Q, T1337N
    E627K, M631I, T638P, R753G, N803S, K959N, Y1036H, R1114G, D1135N, E1219V, D1251G, D1332G, R1335Q, T1337N
    E627K, T638P, R753G, N803S, V875I, K959N, Y1016C, R1114G, D1135N, E1219V, D1251G, D1332G, R1335Q, T1337N, I1348V
    K608R, E627K, T638P, V647I, R654L, R753G, N803S, T804A, K848N, V922A, K959N, R1114G, D1135N, E1219V, D1332N, R1335Q, T1337N
    K608R, E627K, T638P, V647I, R753G, N803S, V922A, K959N, K1014N, V1015A, R1114G, D1135N, K1156N, E1219V, N1252D, D1332N, R1335Q, T1337N
    K608R, E627K, R629G, T638P, V647I, A711T, R753G, K775R, K789E, N803S, K959N, V1015A, Y1036H, R1114G, D1135N, E1219V, N1286H, D1332N, R1335Q, T1337N
    K608R, E627K, T638P, V647I, T740A, R753G, N803S, K948E, K959N, Y1016S, R1114G, D1135N, E1219V, N1286H, D1332N, R1335Q, T1337N
    K608R, E627K, T638P, V647I, T740A, N803S, K948E, K959N, Y1016S, R1114G, D1135N, E1219V, N1286H, D1332N, R1335Q, T1337N
    I670S, K608R, E627K, E630G, T638P, V647I, R653K, R753G, I795L, K797N, N803S, K866R, K890N, K959N, Y1016C, R1114G, D1135N, E1219V, D1332N, R1335Q, T1337N
    K608R, E627K, T638P, V647I, T740A, G752R, R753G, K797N, N803S, K948E, K959N, V1015A, Y1016S, R1114G, D1135N, E1219V, N1266H, D1332N, R1335Q, T1337N
    I570T, A589V, K608R, E627K, T638P, V647I, R654L, Q716R, R753G, N803S, K948E, K959N, Y1016S, R1114G, D1135N, E1207G, E1219V, N1234D, D1332N, R1335Q, T1337N
    K608R, E627K, R629G, T638P, V647I, R654L, Q740R, R753G, N803S, K959N, N990S, T995S, V1015A, Y1036D, R1114G, D1135N, E1207G, E1219V, N1234D, N1266H, D1332N, R1335Q, T1337N
    I562F, V565D, I570T, K608R, L625S, E627K, T638P, V647I, R654I, G752R, R753G, N803S, N808D, K959N, M1021L, R1114G, D1135N, N1177S, N1234D, D1332N, R1335Q, T1337N
    I562F, I570T, K608R, E627K, T638P, V647I, R753G, E790A, N803S, K959N, V1015A, Y1036H, R1114G, D1135N, D1180E, A1184T, E1219V, D1332N, R1335Q, T1337N
    I570T, K608R, E627K, T638P, V647I, R654H, R753G, E790A, N803S, K959N, V1015A, R1114G, D1127A, D1135N, E1219V, D1332N, R1335Q, T1337N
    I570T, K608R, L625S, E627K, T638P, V647I, R654I, T703P, R753G, N803S, N808D, K959N, M1021L, R1114G, D1135N, E1219V, D1332N, R1335Q, T1337N
    I570S, K608R, E627K, E630G, T638P, V647I, R653K, R753G, I795L, N803S, K866R, K890N, K959N, Y1016C, R1114G, D1135N, E1219V, D1332N, R1335Q, T1337N
    I570T, K608R, E627K, T638P, V647I, R654H, R753G, E790A, N803S, K959N, V1016A, R1114G, D1135N, E1219V, K1246E, D1332N, R1335Q, T1337N
    K608R, E627K, T638P, V647I, R654L, K673E, R753G, E790A, N803S, K948E, K959N, R1114G, D1127G, D1135N, D1180E, E1219V, N1286H, D1332N, R1335Q, T1337N
    K608R, L625S, E627K, T638P, V647I, R654I, I670T, R753G, N803S, N808D, K959N, M1021L, R1114G, D1135N, E1219V, N1286H, D1332N, R1335Q, T1337N
    E627K, M631V, T638P, V647I, K710E, R753G, N803S, N808D, K948E, M1021L, R1114G, D1135N, E1219V, D1332N, R1335Q, T1337N, S1338T, H1349R
  • In einigen Ausführungsformen umfasst das Cas9-Protein eine Aminosäuresequenz, die zu mindestens 80 % mit der Aminosäuresequenz eines Cas9-Proteins identisch ist, wie sie durch eine der Varianten aus Tabelle 2 bereitgestellt wird. In einigen Ausführungsformen umfasst das Cas9-Protein eine Aminosäuresequenz, die zu mindestens 85 %, mindestens 90 %, mindestens 92 %, mindestens 95 %, mindestens 96 %, mindestens 97 %, mindestens 98 %, mindestens 99 % oder mindestens 99,5 % identisch mit der Aminosäuresequenz eines Cas9-Proteins ist, wie sie durch eine der Varianten aus Tabelle 2 bereitgestellt wird.
  • In einigen Ausführungsformen zeigt das Cas9-Protein eine erhöhte Aktivität auf einer Target-Sequenz, die, im Vergleich zum Streptococcus-pyogenes-Cas9, nicht das kanonische PAM (5'-NGG-3') an ihrem 3'-Ende umfasst, wie in SEQ ID NO: 18 angegeben. In einigen Ausführungsformen zeigt das Cas9-Protein eine Aktivität auf einer Target-Sequenz mit einem 3'-Ende, das nicht direkt an die kanonische PAM-Sequenz (5'-NGG-3') angrenzt, die im Vergleich zur Aktivität von Streptococcus-pyogenes-Cas9 gemäß SEQ ID NO: 18 auf derselben Target-Sequenz mindestens 5-fach erhöht ist. In einigen Ausführungsformen weist das Cas9-Protein eine Aktivität auf einer Target-Sequenz auf, die nicht direkt an die kanonische PAM-Sequenz (5'-NGG-3') angrenzt, die im Vergleich zur Aktivität von Streptococcus pyogenes gemäß SEQ ID NO: 18 auf derselben Target-Sequenz mindestens 10-fach, mindestens 50-fach, mindestens 100-fach, mindestens 500-fach, mindestens 1.000-fach, mindestens 5.000-fach, mindestens 10.000-fach, mindestens 50.000-fach, mindestens 100.000-fach, mindestens 500.000-fach oder mindestens 1.000.000-fach erhöht ist. In einigen Ausführungsformen grenzt das 3'-Ende der Target-Sequenz direkt an eine AAC-, GAC-, CAC- oder TAC-Sequenz an.
  • In einigen Ausführungsformen umfasst das Cas9-Protein eine Kombination von Mutationen, die Aktivität auf einer Target-Sequenz mit einer 5'-NAT-3'-PAM-Sequenz an ihrem 3'-Ende zeigen. In einigen Ausführungsformen ist die Kombination von Mutationen in einem der in Tabelle 3 aufgeführten Klone vorhanden. In einigen Ausführungsformen sind die Kombination von Mutationen konservative Mutationen der in Tabelle 3 aufgeführten Klone. In einigen Ausführungsformen umfasst das Cas9-Protein die Kombination von Mutationen eines beliebigen der in Tabelle 3 aufgeführten Cas9-Klone. Tabelle 3: NAT-PAM-Klone
    MUTATIONEN AUS WILDTYP-SPCAS9 (Z. B. SEQ ID NO: 18)
    K961E, H985Y, D1135N, K1191N, E1219V, Q1221H, A1320A, P1321S, R1335L
    D1135N, G1218S, E1219V, Q1221H, P1249S, P1321S, D1322G, R1335L
    V743I, R753G, E790A, D1135N, G1218S, E1219V, Q1221H, A1227V, P1249S, N1286K, A1293T, P1321S, D1322G, R1335L, T1339I
    F575S, M631L, R654L, V748I, V743I, R753G, D853E, V922A, R1114G D1135N, G1218S, E1219V, Q1221H, A1227V, P1249S, N1286K, A1293T, P1321S, D1322G, R1335L, T1339I
    F575S, M631L, R654L, R664K, R753G, D853E, V922A, R1114G D1135N, D1180G, G1218S, E1219V, Q1221H, P1249S, N1286K, P1321S, D1322G, R1335L
    M631L, R654L, R753G, K797E, D853E, V922A, D1012A, R1114G D1135N, G1218S, E1219V, Q1221H, P1249S, N1317K, P1321S, D1322G, R1335L
    F575S, M631L, R654L, R664K, R753G, D853E, V922A, R1114G, Y1131C, D1135N, D1180G, G1218S, E1219V, Q1221H, P1249S, P1321S, D1322G, R1335L
    F575S, M631L, R654L, R664K, R753G, D853E, V922A, R1114G, Y1131C, D1135N, D1180G, G1218S, E1219V, Q1221H, P1249S, P1321S, D1322G, R1335L
    F575S, D596Y, M631L, R654L, R664K, R753G, D853E, V922A, R1114G, Y1131C, D1135N, D1180G, G1218S, E1219V, Q1221H, P1249S, Q1256R, P1321S, D1322G, R1335L
    F575S, M631L, R654L, R664K, K710E, V750A, R753G, D853E, V922A, R1114G, Y1131C, D1135N, D1180G, G1218S, E1219V, Q1221H, P1249S, P1321S, D1322G, R1335L
    F575S, M631L, K649R, R654L, R664K, R753G, D853E, V922A, R1114G, Y1131C, D1135N, K1156E, D1180G, G1218S, E1219V, Q1221H, P1249S, P1321S, D1322G, R1335L
    F575S, M631L, R654L, R664K, R753G, D853E, V922A, R1114G, Y1131C, D1135N, D1180G, G1218S, E1219V, Q1221H, P1249S, P1321S, D1322G, R1335L
    F575S, M631L, R654L, R664K, R753G, D853E, V922A, I1057G, R1114G, Y1131C, D1135N, D1180G, G1218S, E1219V, Q1221H, P1249S, N1308D, P1321S, D1322G, R1335L
    M631L, R654L, R753G, D853E, V922A, R1114G, Y1131C, D1135N, E1150V, D1180G, G1218S, E1219V, Q1221H, P1249S, P1321S, D1332G, R1335L
    M631L, R654L, R664K, R753G, D853E, I1057V, Y1131C, D1135N, D1180G, G1218S, E1219V, Q1221H, P1249S, P1321S, D1332G, R1335L
    M631L, R654L, R664K, R753G, I1057V, R1114G, Y1131C, D1135N, D1180G, G1218S, E1219V, Q1221H, P1249S, P1321S, D1332G, R1335L
  • Die folgende Beschreibung verschiedener napDNAbp, die in Verbindung mit den hier vorgestellten Prime Editoren verwendet werden können, soll in keiner Weise einschränkend sein. Die Prime Editoren können das kanonische SpCas9 oder jedes orthologe Cas9-Protein oder jede Cas9-Protein-Variante - einschließlich einer natürlich vorkommenden Variante, Mutante oder anderweitig konstruierten Version von Cas9 - umfassen, das bekannt ist oder das durch einen gezielten evolutionären oder anderweitig mutagenen Prozess hergestellt oder entwickelt werden kann. In verschiedenen Ausführungsformen weisen das Cas9 oder die Cas9-Varianten eine Nickaseaktivität auf, d. h. sie spalten nur den Strang der DNA-Target-Sequenz. In anderen Ausführungsformen weisen das Cas9 oder die Cas9-Varianten inaktive Nukleasen auf, d. h. es handelt sich um „tote“ Cas9-Proteine. Andere Varianten von Cas9-Proteinen, die verwendet werden können, haben ein geringeres Molekulargewicht als das kanonische SpCas9 (z. B. zur leichteren Einbringung) oder haben eine modifizierte oder umgeordnete primäre Aminosäurestruktur (z. B. die zirkulären permutierten Formate). Die hier beschriebenen Prime Editoren können auch Cas9-Äquivalente umfassen, einschließlich Cas12a/Cpf1 und Cas12b-Proteine, die das Ergebnis einer konvergenten Evolution sind. Die hier verwendeten napDNAbp (z. B. SpCas9, Cas9-Variante oder Cas9-Äquivalente) können auch verschiedene Modifikationen enthalten, die ihre PAM-Spezifitäten verändern/verbessern. Schließlich sieht die Anmeldung jedes Cas9, jede Cas9-Variante oder jedes Cas9-Äquivalent vor, das mindestens 70 %, mindestens 75 %, mindestens 80 %, mindestens 85 %, mindestens 90 %, mindestens 91 %, mindestens 92%, mindestens 93 %, mindestens 94 %, mindestens 95 %, mindestens 96 %, mindestens 97 %, mindestens 98 %, mindestens 99 % oder mindestens 99,9 % Sequenzidentität mit einer Referenz-Cas9-Sequenz aufweist, wie etwa einer kanonischen Referenz-SpCas9-Sequenz oder einem Referenz-Cas9-Äquivalent (z. B. Cas12a (Cpf1)).
  • In einer bestimmten Ausführungsform ist die Cas9-Variante mit erweiterten PAM-Fähigkeiten SpCas9 (H840A) VRQR (SEQ ID NO: 87), das die folgende Aminosäuresequenz aufweist (wobei die V-, R-, Q-, R-Substitutionen im Vergleich zu SpCas9 (H840A) von SEQ ID NO: 51 fett gedruckt und unterstrichen sind. Außerdem wurde der Methionin-Rest in SpCas9 (H840) für SpCas9 (H840A) VRQR) entfernt:
    Figure DE112020001339T5_0095
    Figure DE112020001339T5_0096
  • In einer anderen besonderen Ausführungsform ist die Cas9-Variante mit erweiterten PAM-Fähigkeiten SpCas9 (H840A) VRER, das die folgende Aminosäuresequenz aufweist (wobei die V-, R-, E-, R-Substitutionen im Vergleich zu SpCas9 (H840A) von SEQ ID NO: 51 fett gedruckt und unterstrichen sind. Außerdem wurde der Methionin-Rest in SpCas9 (H840) für SpCas9 (H840A) VRER) entfernt:
    Figure DE112020001339T5_0097
    Figure DE112020001339T5_0098
  • In einigen Ausführungsformen ist das napDNAbp, das mit einer nichtkanonischen PAM-Sequenz funktioniert, ein Argonauten-Protein. Ein Beispiel für ein solches Nukleinsäure-programmierbares DNA-Bindungsprotein ist ein Argonauten-Protein aus Natronobacterium gregoryi (NgAgo). NgAgo ist eine ssDNA-gesteuerte Endonuklease. NgAgo bindet 5'-phosphorylierte ssDNA von ~24 Nukleotiden (gDNA), um sie zu ihrem Zielort zu leiten, und führt an der gDNA-Stelle DNA-Doppelstrangbrüche durch. Im Gegensatz zu Cas9 benötigt das NgAgo-gDNA-System kein Protospacer-angrenzendes Motiv (PAM). Die Verwendung eines Nuklease-inaktiven NgAgo (dNgAgo) kann die Zahl der anvisierbaren Basen erheblich erweitern. Die Charakterisierung und Verwendung von NgAgo wurde beschrieben in Gao et al., Nat Biotechnol., Juli 2016; 34(7):768-73. PubMed PMID: 27136078; Swarts et al., Nature. 507(7491) (2014):258-61; und Swarts et al., Nucleic Acids Res. 43(10) (2015):5120-9, von denen jeder hier durch Bezugnahme aufgenommen ist.
  • In einigen Ausführungsformen ist das napDNAbp ein prokaryotischer Homolog eines Argonauten-Proteins. Prokaryotische Homologe von Argonauten-Proteinen sind bekannt und wurden beispielsweise beschrieben in Makarova K. et al., „Prokaryotic homologs of Argonaute proteins are predicted to function as key components of a novel system of defense against mobile genetic elements“, Biol Direct., 25. August 2009;4:29. doi: 10.1186/1745-6150-4-29, dessen gesamter Inhalt hiermit durch Bezugnahme aufgenommen ist. In einigen Ausführungsformen ist das napDNAbp ein Argonauten(MpAgo)-Protein aus Marinitoga piezophila. Das CRISPRassoziierte Argonauten(MpAgo)-Protein aus Marinitoga piezophila spaltet einzelsträngige Target-Sequenzen unter Verwendung von 5'-phosphorylierten Guides. Die 5'-Guides werden von allen bekannten Argonauten verwendet. Die Kristallstruktur eines MpAgo-RNA-Komplexes zeigt eine Guide-Strang-Bindungsstelle, die Reste umfasst, die 5'-Phosphat-Interaktionen blockieren. Diese Daten deuten auf die Evolution einer Argonauten-Unterklasse mit nichtkanonischer Spezifität für einen 5'-hydroxylierten Guide hin. Siehe z. B. Kaya et al., „A bacterial Argonaute with noncanonical guide RNA specificity“, Proc Natl Acad Sci USA, 12. April 2016; 113(15):4057-62, dessen gesamter Inhalt hiermit durch Bezugnahme aufgenommen ist. Es ist zu beachten, dass andere Argonauten-Proteine verwendet werden können und in den Schutzumfang dieser Offenbarung fallen.
  • Einige Aspekte der Offenbarung stellen Cas9-Domänen bereit, die unterschiedliche PAM-Spezifitäten aufweisen. Typischerweise erfordern Cas9-Proteine, wie Cas9 aus S. pyogenes (spCas9), eine kanonische NGG-PAM-Sequenz, um eine bestimmte Nukleinsäureregion zu binden. Dies kann die Fähigkeit einschränken, gewünschte Basen innerhalb eines Genoms zu editieren. In einigen Ausführungsformen müssen die hier bereitgestellten Basen-Editing-Fusionsproteine möglicherweise an einer bestimmten Stelle platziert werden, zum Beispiel dort, wo sich eine Target-Base innerhalb einer 4-Basen-Region (z. B. einem „Editing-Fenster“) befindet, die etwa 15 Basen stromaufwärts des PAM liegt. Siehe Komor, A.C. et al., „Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage“, Nature 533, 420-424 (2016), dessen gesamter Inhalt hiermit durch Bezugnahme aufgenommen ist. Dementsprechend kann in einigen Ausführungsformen jedes der hier bereitgestellten Fusionsproteine eine Cas9-Domäne enthalten, die in der Lage ist, eine Nukleotidsequenz zu binden, die keine kanonische (z. B. NGG-)PAM-Sequenz enthält. Cas9-Domänen, die an nichtkanonische PAM-Sequenzen binden, wurden im Stand der Technik beschrieben und sind für den Fachmann ersichtlich. Cas9-Domänen, die nichtkanonische PAM-Sequenzen binden, wurden zum Beispiel beschrieben in Kleinstiver, B. P. et al., „Engineered CRISPR-Cas9 nucleases with altered PAM specificities“, Nature 523, 481-485 (2015); und Kleinstiver, B. P. et al., „Broadening the targeting range of Staphylococcus aureus CRISPR-Cas9 by modifying PAM recognition“, Nature Biotechnology 33, 1293-1298 (2015); der gesamte Inhalt jedes Dokuments ist hiermit durch Bezugnahme aufgenommen.
  • Beispielsweise eine napDNAbp-Domäne mit veränderter PAM-Spezifität, wie etwa eine Domäne mit mindestens 80 %, mindestens 85 %, mindestens 90 %, mindestens 95 % oder mindestens 99 % Sequenzidentität mit Wildtyp-Francisella-novicida-Cpf1 (D917, E1006 und D1255) (SEQ ID NO: 74), das die folgende Aminosäuresequenz aufweist:
    Figure DE112020001339T5_0099
    Figure DE112020001339T5_0100
  • Eine zusätzliche napDNAbp-Domäne mit veränderter PAM-Spezifität, wie etwa eine Domäne mit mindestens 80 %, mindestens 85 %, mindestens 90 %, mindestens 95 % oder mindestens 99 % Sequenzidentität mit Wildtyp-Geobacillus-thermodenitrificans-Cas9 (SEQ ID NO: 75), das die folgende Aminosäuresequenz aufweist:
    Figure DE112020001339T5_0101
    Figure DE112020001339T5_0102
  • In einigen Ausführungsformen ist das Nukleinsäure-programmierbare DNA-Bindungsprotein (napDNAbp) ein Nukleinsäure-programmierbares DNA-Bindungsprotein, das keine kanonische (NGG-)PAM-Sequenz erfordert. In einigen Ausführungsformen ist das napDNAbp ein Argonauten-Protein. Ein Beispiel für ein solches Nukleinsäure-programmierbares DNA-Bindungsprotein ist ein Argonauten-Protein aus Natronobacterium gregoryi (NgAgo). NgAgo ist eine ssDNA-gesteuerte Endonuklease. NgAgo bindet 5'-phosphorylierte ssDNA von ~24 Nukleotiden (gDNA), um sie zu ihrem Zielort zu leiten, und führt an der gDNA-Stelle DNA-Doppelstrangbrüche durch. Im Gegensatz zu Cas9 benötigt das NgAgo-gDNA-System kein Protospacer-angrenzendes Motiv (PAM). Die Verwendung eines Nuklease-inaktiven NgAgo (dNgAgo) kann die Zahl der anvisierbaren Basen erheblich erweitern. Die Charakterisierung und Verwendung von NgAgo wurde beschrieben in Gao et al., Nat Biotechnol., 34(7): 768-73 (2016), PubMed PMID: 27136078; Swarts et al., Nature, 507(7491): 258-61 (2014); und Swarts et al., Nucleic Acids Res. 43(10) (2015): 5120-9, von denen jeder hier durch Bezugnahme aufgenommen ist. Die Sequenz des Natronobacterium-gregoryi-Argonauten ist in SEQ ID NO: 76 angegeben.
  • Die offenbarten Fusionsproteine können eine napDNAbp-Domäne mit mindestens 80 %, mindestens 85 %, mindestens 90 %, mindestens 95 % oder mindestens 99 % Sequenzidentität mit dem Wildtyp-Natronobacterium-gregoryi-Argonauten (SEQ ID NO: 76) aufweisen, das die folgende Aminosäuresequenz hat:
    Figure DE112020001339T5_0103
    Figure DE112020001339T5_0104
  • Darüber hinaus können alle verfügbaren Verfahren verwendet werden, um eine Variante oder ein mutiertes Cas9-Protein zu erhalten oder zu konstruieren. Der Begriff „Mutation“, wie er hier verwendet wird, bezieht sich auf eine Substitution eines Restes innerhalb einer Sequenz, z. B. einer Nukleinsäure- oder Aminosäuresequenz, durch einen anderen Rest oder eine Deletion oder Insertion eines oder mehrerer Reste innerhalb einer Sequenz. Mutationen werden hier typischerweise beschrieben, indem der ursprüngliche Rest identifiziert wird, gefolgt von der Position des Rests innerhalb der Sequenz und von der Identität des neu substituierten Rests. Verschiedene Verfahren zur Herstellung der hier bereitgestellten Aminosäuresubstitutionen (Mutationen) sind im Stand der Technik gut bekannt und werden beispielsweise durch Green und Sambrook, Molecular Cloning: A Laboratory Manual (4. Aufl., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N. Y. (2012)) bereitgestellt. Mutationen können eine Vielzahl von Kategorien beinhalten, wie etwa Einzelbasen-Polymorphismen, Mikroduplikationsregionen, Indel und Inversionen, und sollen in keiner Weise einschränkend sein. Mutationen können „Loss-of-Function“-Mutationen beinhalten, die das normale Ergebnis einer Mutation sind, die eine Proteinaktivität reduziert oder aufhebt. Die meisten Loss-of-Function-Mutationen sind rezessiv, da in einer Heterozygote die zweite Chromosomenkopie eine nicht mutierte Version des Gens trägt, die für ein voll funktionsfähiges Protein codiert, dessen Anwesenheit den Effekt der Mutation kompensiert. Mutationen umschließen auch „Gain-of-Function“-Mutationen, die einem Protein oder einer Zelle eine abnormale Aktivität verleihen, die ansonsten in einem normalen Zustand nicht vorhanden ist. Viele Gain-of-Function-Mutationen befinden sich eher in regulatorischen Sequenzen als in codierenden Regionen und können daher eine Reihe von Konsequenzen haben. Zum Beispiel könnte eine Mutation dazu führen, dass ein oder mehrere Gene in den falschen Geweben exprimiert werden und diese Gewebe Funktionen erhalten, die ihnen normalerweise fehlen. Aufgrund ihrer Natur sind Gain-of-Function-Mutationen normalerweise dominant.
  • Mutationen können mittels ortsspezifischer Mutagenese in ein Referenz-Cas9-Protein eingebracht werden. Ältere Verfahren der ortsspezifischen Mutagenese, die im Stand der Technik bekannt sind, stützen sich auf das Subklonieren der zu mutierenden Sequenz in einen Vektor, wie etwa einen M13-Bakteriophagenvektor, der die Isolierung eines einzelsträngigen DNA-Templates ermöglicht. Bei diesen Verfahren wird ein mutagener Primer (d. h. ein Primer, der in der Lage ist, sich an die zu mutierende Stelle anzulagern, aber ein oder mehrere nicht übereinstimmende Nukleotide an der zu mutierenden Stelle trägt) an das einzelsträngige Template angelagert, und dann wird das Komplement des Templates ausgehend vom 3'-Ende des mutagenen Primers polymerisiert. Die resultierenden Duplexe werden dann in Wirtsbakterien umgewandelt, und Plaques werden auf die gewünschte Mutation gescreent. In jüngerer Zeit wurden bei der ortsspezifischen Mutagenese PCR-Methoden eingesetzt, die den Vorteil haben, dass sie kein einzelsträngiges Template erfordern. Darüber hinaus wurden Verfahren entwickelt, die kein Subklonieren erfordern. Bei der Durchführung einer PCR-basierten ortsspezifischen Mutagenese müssen mehrere Probleme berücksichtigt werden. Erstens ist es bei diesen Verfahren wünschenswert, die Anzahl der PCR-Zyklen zu reduzieren, um eine Expansion unerwünschter Mutationen zu verhindern, die durch die Polymerase eingeführt werden. Zweitens muss eine Selektion durchgeführt werden, um die Anzahl der nicht mutierten Eltemmoleküle zu reduzieren, die in der Reaktion verbleiben. Drittens wird ein PCR-Verfahren mit größerer Länge bevorzugt, um die Verwendung eines einzelnen PCR-Primersatzes zu ermöglichen. Und viertens ist es aufgrund der nicht-Template-abhängigen terminalen Extensionsaktivität einiger thermostabiler Polymerasen häufig erforderlich, vor der Ligation des durch PCR erzeugten mutierten Produkts am stumpfen Ende einen Endpolierschritt in die Prozedur einzubauen.
  • Mutationen können auch durch gerichtete Evolutionsprozesse eingeführt werden, z. B. durch phagengestützte kontinuierliche Evolution (phage-assisted continuous evolution - PACE) oder phagengestützte nichtkontinuierliche Evolution (phage-assisted noncontinuous evolution - PANCE). Der Begriff „phagengestützte kontinuierliche Evolution (PACE)“, wie er hier verwendet wird, bezieht sich auf eine kontinuierliche Evolution, die Phagen als virale Vektoren einsetzt. Das allgemeine Konzept der PACE-Technologie wurde beispielsweise beschrieben in der Internationalen PCT-Anmeldung PCT/US2009/056194 , eingereicht am 8.September 2009, veröffentlicht als WO 2010/028347 am 11. März 2010; der Internationalen PCT-Anmeldung PCT/US2011/066747 , eingereicht am 22. Dezember 2011, veröffentlicht als WO 2012/088381 am 28. Juni 2012; der US-Anmeldung, dem US-Patent Nr. 9.023.594 , ausgestellt am 5. Mai 2015, der Internationalen PCT-Anmeldung PCT/US2015/012022 , eingereicht am 20. Januar 2015, veröffentlicht als WO 2015/134121 am 11. September 2015, und der Internationalen PCT-Anmeldung PCT/US2016/027795 , eingereicht am 15. April 2016, veröffentlicht als WO 2016/168631 am 20. Oktober 2016, deren gesamter Inhalt hier durch Bezugnahme aufgenommen ist. Die Variante Cas9s kann auch durch phagengestützte nichtkontinuierliche Evolution (PANCE) erhalten werden, was sich, wie hier verwendet, auf nichtkontinuierliche Evolution bezieht, bei der Phagen als virale Vektoren eingesetzt werden. PANCE ist eine vereinfachte Technik für eine schnelle gerichtete In-vivo-Evolution unter Verwendung von seriellen Kolben-Transfers von sich entwickelnden „Selektionsphagen“ (SP), die ein zu entwickelndes Gen von Interesse enthalten, über frische E.-coli-Wirtszellen, so dass die Gene in den Wirts-E.-coli konstant gehalten werden können, während sich die in den SP enthaltenen Gene kontinuierlich weiterentwickeln. Serielle Kolben-Transfers haben lange als ein weithin zugänglicher Ansatz für die Laborevolution von Mikroben gedient, und in jüngerer Zeit wurden analoge Ansätze für die Bakteriophagen-Evolution entwickelt. Das PANCE-System verfügt über eine geringere Stringenz als das PACE-System.
  • Alle oben genannten Quellen, die sich auf Cas9 oder Cas9-Äquivalente beziehen, sind, sofern nicht bereits erwähnt, hiermit vollständig durch Bezugnahme aufgenommen.
  • J. Unterteilte napDNAbp-Domänen für getrennte PE-Einbringung
  • In verschiedenen Ausführungsformen können die hier beschriebenen Prime Editoren als zwei oder mehr Fragmente in Zellen eingebracht werden, die innerhalb der Zelle (entweder durch passives Zusammensetzen oder durch aktives Zusammensetzen, wie beispielsweise unter Verwendung von Sequenzen getrennter Inteine) zu einem rekonstituierten Prime Editor zusammengesetzt werden. In einigen Fällen kann die Selbstzusammensetzung passiv sein, wobei die zwei oder mehr Prime-Editor-Fragmente innerhalb der Zelle kovalent oder nichtkovalent assoziieren, um den Prime Editor zu rekonstituieren. In anderen Fällen kann die Selbstzusammensetzung durch Dimerisationsdomänen, die auf jedem der Fragmente eingebaut sind, katalysiert werden. Beispiele für Dimerisationsdomänen sind hier beschrieben. In noch anderen Fällen kann die Selbstzusammensetzung durch Sequenzen getrennter Inteine katalysiert werden, die auf jedem der Prime-Editor-Fragmente eingebaut sind.
  • Eine getrennte PE-Einbringung kann vorteilhaft sein, um verschiedene Größenbeschränkungen verschiedener Einbringungsansätze zu berücksichtigen. Beispielsweise können die Einbringungsansätze virusbasierte Einbringungsverfahren, Messenger-RNA-basierte Einbringungsverfahren oder RNP-basierte Einbringungsverfahren (Ribonukleoprotein-basierte Einbringung) beinhalten. Und jedes dieser Einbringungsverfahren könnte effizienter und/oder effektiver sein, indem der Prime Editor in kleinere Teile unterteilt wird. Sobald sie sich in der Zelle befinden, können sich die kleineren Teile zu einem funktionellen Prime Editor zusammensetzen. Abhängig von den Mitteln der Trennung können die unterteilten Prime-Editor-Fragmente in nichtkovalenter Weise oder in kovalenter Weise wieder zusammengesetzt werden, um wieder den Prime Editor zu bilden. In einer Ausführungsform kann der Prime Editor an einer oder mehreren Trenn-Sites in zwei oder mehr Fragmente getrennt werden. Die Fragmente können unmodifiziert sein (außer dass sie getrennt werden). Sobald die Fragmente in die Zelle eingebracht wurden (z. B. durch direktes Einbringen eines Ribonukleoprotein-Komplexes oder durch Nukleinsäure-Einbringung - z. B. mRNA-Einbringung oder virusvektorbasierte Einbringung), können sich die Fragmente kovalent oder nichtkovalent neu assoziieren, um den Prime Editor zu rekonstituieren. In einer anderen Ausführungsform kann der Prime Editor an einer oder mehreren Trenn-Sites in zwei oder mehr Fragmente getrennt werden. Jedes der Fragmente kann modifiziert werden, um eine Dimerisationsdomäne zu umfassen, wobei jedes Fragment, das gebildet wird, mit einer Dimerisationsdomäne gekoppelt ist. Sobald sie in eine Zelle eingebracht oder dort exprimiert werden, assoziieren und binden die Dimerisationsdomänen der verschiedenen Fragmente aneinander, wodurch die verschiedenen Prime-Editor-Fragmente zu einem funktionellen Prime Editor zusammengefügt werden. In einer weiteren Ausführungsform kann das Prime-Editor-Fragment modifiziert werden, um ein getrenntes Intein zu umfassen. Sobald sie in eine Zelle eingebracht oder dort exprimiert werden, assoziieren und binden sich die Domänen getrennter Inteine der verschiedenen Fragmente aneinander und werden dann einem Trans-Spleißen unterzogen, das zur Exzision der Domänen getrennter Inteine aus jedem der Fragmente und zur gleichzeitigen Bildung einer Peptidbindung zwischen den Fragmenten führt, wodurch der Prime Editor wiederhergestellt wird.
  • In einer Ausführungsform kann der Prime Editor unter Verwendung eines Ansatzes getrennter Inteine eingebracht werden.
  • Der Ort der Trenn-Site kann zwischen einem oder mehreren Paaren von Resten im Prime Editor und in beliebigen Domänen darin positioniert sein, einschließlich innerhalb der napDNAbp-Domäne, der Polymerase-Domäne (z. B. RT-Domäne), der Linker-Domäne, die die napDNAbp-Domäne und die Polymerase-Domäne verbindet.
  • In einer Ausführungsform, dargestellt in 66, ist der Prime Editor (PE) an einer Trenn-Site innerhalb des napDNAbp unterteilt.
  • In bestimmten Ausführungsformen ist das napDNAbp ein kanonisches SpCas9-Polypeptid von SEQ ID NO: 18, wie folgt:
    SpCas9 Streptococc us pyogenes M1 SwissProt-Hinterlegun gsnr. Q99ZW2 Wildtyp 1368 AA
    Figure DE112020001339T5_0105
    SEQ ID NO: 18
    Figure DE112020001339T5_0106
  • In bestimmten Ausführungsformen wird das SpCas9 an einer Trenn-Site, die sich zwischen den Resten 1 und 2 oder 2 und 3 oder 3 und 4 oder 4 und 5 oder 5 und 6 oder 6 und 7 oder 7 und 8 oder 8 und 9 oder 9 und 10 oder zwischen zwei beliebigen Paaren von Resten an einer beliebigen Stelle zwischen den Resten 1-10, 10-20, 20-30, 30-40, 40-50, 50-60, 60-70, 70-80, 80-90, 90-100, 100-200, 200-300, 300-400, 400-500, 500-600, 600-700, 700-800, 800-900, 1000-1100, 1100-1200, 1200-1300 oder 1300-1368 des kanonischen SpCas9 von SEQ ID NO: 18 befindet, in zwei Fragmente getrennt.
  • In bestimmten Ausführungsformen wird ein napDNAbp in zwei Fragmente an einer Trenn-Site getrennt, die sich an einem Paar von Resten befindet, das zwei beliebigen Paaren von Resten entspricht, die sich an einer beliebigen Stelle zwischen den Positionen 1-10, 10-20, 20-30, 30-40, 40-50, 50-60, 60-70, 70-80, 80-90, 90-100, 100-200, 200-300, 300-400, 400-500, 500-600, 600-700, 700-800, 800-900, 1000-1100, 1100-1200, 1200-1300 oder 1300-1368 des kanonischen SpCas9 von SEQ ID NO: 18 befinden.
  • In bestimmten Ausführungsformen wird das SpCas9 an einer Trenn-Site, die sich zwischen den Resten 1 und 2 oder 2 und 3 oder 3 und 4 oder 4 und 5 oder 5 und 6 oder 6 und 7 oder 7 und 8 oder 8 und 9 oder 9 und 10 oder zwischen zwei beliebigen Paaren von Resten an einer beliebigen Stelle zwischen den Resten 1-10, 10-20, 20-30, 30-40, 40-50, 50-60, 60-70, 70-80, 80-90, 90-100, 100-200, 200-300, 300-400, 400-500, 500-600, 600-700, 700-800, 800-900, 1000-1100, 1100-1200, 1200-1300 oder 1300-1368 des kanonischen SpCas9 von SEQ ID NO: 18 befindet, in zwei Fragmente getrennt. In bestimmten Ausführungsformen befindet sich die Trenn-Site an einer oder mehreren Polypeptid-Bindungsstellen (d. h. eine „Trenn-Site oder Trenn-Site getrennter Inteine“), die mit einem getrennten Intein fusioniert und dann als separat codierte Fusionsproteine in die Zellen eingebracht werden. Sobald die Fusionsproteine getrennter Inteine (d. h. Proteinhälften) innerhalb einer Zelle exprimiert sind, werden die Proteine einem Trans-Spleißen unterzogen, um einen vollständigen oder ganzen PE zu bilden, wobei die verbundenen Sequenzen getrennter Inteine gleichzeitig entfernt werden.
  • Zum Beispiel kann, wie in 66 gezeigt, das N-terminale Extein an ein erstes getrenntes Intein (z. B. N-Intein) und das C-terminale Extein an ein zweites getrenntes Intein (z. B. C-Intein) fusioniert werden. Das N-terminale Extein wird mit dem C-terminalen Extein fusioniert, um wieder ein ganzes Prime-Editor-Fusionsprotein zu bilden, das eine napDNAbp-Domäne und eine Polymerase-Domäne (z. B. RT-Domäne) umfasst, und zwar nach der Selbstassoziation des N-Inteins und des C-Inteins innerhalb der Zelle, gefolgt von ihrer Selbstexzision und der gleichzeitigen Bildung einer Peptidbindung zwischen den N-terminalen Extein- und C-terminalen Extein-Abschnitten eines ganzen Prime Editors (PE).
  • Um die Vorteile einer Einbringungsstrategie getrennter PE unter Verwendung von getrennten Inteins zu nutzen, muss der Prime Editor an einer oder mehreren Trenn-Sites getrennt werden, um mindestens zwei getrennte Hälften eines Prime Editors zu erzeugen, von denen jede innerhalb einer Zelle wieder zusammengefügt werden kann, wenn jede Hälfte an eine Split-Intein-Sequenz fusioniert ist.
  • In bestimmten Ausführungsformen wird der Prime Editor an einer einzelnen Trenn-Site getrennt. In bestimmten anderen Ausführungsformen wird der Prime Editor an zwei Trenn-Sites oder drei Trenn-Sites oder vier Trenn-Sites oder mehr getrennt.
  • In einer bevorzugten Ausführungsform wird der Prime Editor an einer einzelnen Trenn-Site getrennt, um zwei separate Hälften eines Prime Editors zu erzeugen, von denen jede zu einer Sequenz getrennter Inteine fusioniert werden kann.
  • Ein beispielhaftes getrenntes Intein ist das Ssp-DnaE-Intein, das zwei Untereinheiten umfasst, nämlich DnaE-N und DnaE-C. Die beiden unterschiedlichen Untereinheiten werden von separaten Genen codiert, nämlich dnaE-n und dnaE-c, die für die Untereinheiten DnaE-N bzw. DnaE-C codieren. DnaE ist ein natürlich vorkommendes getrenntes Intein in Synechocytis sp. PCC6803 und ist in der Lage, das Trans-Spleißen von zwei getrennten Proteinen zu steuern, die jeweils eine Fusion mit entweder DnaE-N oder DnaE-C umfassen.
  • Weitere natürlich vorkommende oder konstruierte Sequenzen getrennter Inteine sind bekannt oder können aus den hier beschriebenen oder im Stand der Technik verfügbaren Whole-Intein-Sequenzen hergestellt werden. Beispiele für Sequenzen getrennter Inteine finden sich in Stevens et al. „A promiscuous split intein with expanded protein engineering applications“, PNAS, 2017, Bd. 114: 8538-8543; Iwai et al. „Highly efficient protein trans-splicing by a naturally split DnaE intein from Nostc punctiforme“, FEBS Lett, 580: 1853-1858, die hier jeweils durch Bezugnahme aufgenommen sind. Zusätzliche Sequenzen getrennter Inteine finden sich beispielsweise in WO 2013/045632 , WO 2014/055782 , WO 2016/069774 und EP2877490 , deren Inhalte jeweils durch Bezugnahme hier aufgenommen sind.
  • Das Spleißen von Proteinen in trans wurde darüber hinaus in vivo und in vitro beschrieben (Shingledecker et al., Gene 207:187 (1998), Southworth et al., EMBO J., 17:918 (1998); Mills et al., Proc. Natl. Acad. Sci. USA, 95:3543-3548 (1998); Lew et al., J. Biol. Chem., 273:15887-15890 (1998); Wu et al., Biochim. Biophys. Acta, 35732:1 (1998b), Yamazaki et al., J. Am. Chem. Soc. 120:5591 (1998), Evans et al., J. Biol. Chem. 275:9091 (2000); Otomo et al., Biochemistry 38:16040-16044 (1999); Otomo et al., J. Biolmol. NMR 14:105-114 (1999); Scott et al., Proc. Natl. Acad. Sci. USA 96:13638-13643 (1999)) und bietet die Möglichkeit, ein Protein in zwei inaktiven Fragmenten zu exprimieren, die anschließend ligiert werden, um ein funktionelles Produkt zu bilden, z. B. wie in 66 und 67 im Hinblick auf die Bildung eines vollständigen PE-Fusionsproteins aus zwei getrennt exprimierten Hälften gezeigt ist.
  • In verschiedenen hier beschriebenen Ausführungsformen können die kontinuierlichen Evolutionsverfahren (z. B. PACE) verwendet werden, um einen ersten Abschnitt eines Baseneditors zu entwickeln. Ein erster Abschnitt könnte eine einzelne Komponente oder Domäne beinhalten, z. B. eine Cas9-Domäne, eine Deaminase-Domäne oder eine UGI-Domäne. Die separat entwickelte Komponente oder Domäne kann dann mit den verbleibenden Abschnitten des Baseneditors innerhalb einer Zelle fusioniert werden, indem sowohl der entwickelte Abschnitt als auch die verbleibenden nichtentwickelten Abschnitte separat mit Polypeptiddomänen getrennter Inteine exprimiert werden. Der erste Abschnitt kann weiter gefasst jeden ersten Aminosäure-Abschnitt eines Baseneditors beinhalten, der unter Verwendung eines hier beschriebenen kontinuierlichen Evolutionsverfahrens entwickelt werden soll. Der zweite Abschnitt würde sich in dieser Ausführungsform auf den verbleibenden Aminosäure-Abschnitt des Baseneditors beziehen, der nicht unter Verwendung der hier beschriebenen Verfahren entwickelt wird. Der entwickelte erste Abschnitt und der zweite Abschnitt des Baseneditors könnten jeweils mit Polypeptiddomänen getrennter Inteine in einer Zelle exprimiert werden. Die natürlichen Protein-Spleiß-Mechanismen der Zelle würden den entwickelten ersten Abschnitt und den nicht entwickelten zweiten Abschnitt wieder zusammensetzen, um einen einzelnen aus Fusionsproteinen entwickelten Baseneditor zu bilden. Der entwickelte erste Abschnitt kann entweder den N- oder den C-terminalen Teil des einzelnen Fusionsproteins umfassen. In analoger Weise könnte die Verwendung eines zweiten orthogonalen Trans-Spleiß-Intein-Paares es ermöglichen, dass der entwickelte erste Abschnitt einen inneren Teil des einzelnen Fusionsproteins umfasst.
  • Somit kann jede der entwickelten und nichtentwickelten Komponenten der hier beschriebenen Baseneditoren mit Tags getrennter Inteine exprimiert werden, um die Bildung eines vollständigen Baseneditors zu erleichtern, der die entwickelte und nichtentwickelte Komponente innerhalb einer Zelle umfasst.
  • Der Mechanismus des Protein-Spleiß-Prozesses wurde sehr detailliert untersucht (Chong et al. J. Biol. Chem. 1996, 271, 22159-22168; Xu, M-Q & Perler, F. B. EMBO Journal, 1996, 15, 5146-5153), und es wurden konservierte Aminosäuren an den Intein- und Extein-Spleiß-Punkten gefunden (Xu et al., EMBO Journal, 1994, 13-5517-522). Die hier beschriebenen Konstrukte enthalten eine Intein-Sequenz, die mit dem 5'-Terminus des ersten Gens fusioniert ist (z. B. dem entwickelten Abschnitt des Baseneditors). Geeignete Intein-Sequenzen können aus jedem der Proteine ausgewählt werden, von dem bekannt ist, dass es Protein-Spleiß-Elemente enthält. Eine Datenbank, die alle bekannten Inteine enthält, ist im World Wide Web zu finden (Perler, F. B. Nucleic Acids Research, 1999, 27, 346-347). Die Intein-Sequenz ist am 3'-Ende mit dem 5'-Ende eines zweiten Gens fusioniert. Um dieses Gen auf eine bestimmte Organelle auszurichten, kann ein Peptidsignal an die codierende Sequenz des Gens fusioniert werden. Nach dem zweiten Gen kann die Intein-Gensequenz beliebig oft zur Expression mehrerer Proteine in derselben Zelle wiederholt werden. Bei Konstrukten, die mehrere Inteine enthalten, kann es sinnvoll sein, Intein-Elemente aus verschiedenen Quellen zu verwenden. Nach der Sequenz des letzten zu exprimierenden Gens muss eine Transkriptionsterminationssequenz eingefügt werden. In einer Ausführungsform ist eine modifizierte Intein-Spleiß-Einheit so ausgelegt, dass sie sowohl die Exzision der Exteine aus den Inteinen katalysieren als auch eine Ligation der Exteine verhindern kann. Es wurde festgestellt, dass die Mutagenese der C-terminalen Extein-Verbindung in der Pyrococcus-Spezies-GB-D-DNA-Polymerase ein verändertes Spleißelement erzeugt, das die Spaltung von Exteinen und Inteinen induziert, aber eine nachfolgende Ligation der Exteine verhindert (Xu, M-Q & Perler, F. B. EMBO Journal, 1996, 15, 5146-5153). Die Mutation von Serin 538 zu einem Alanin oder Glycin induzierte die Spaltung, verhinderte jedoch die Ligation. Die Mutation von äquivalenten Resten in anderen Intein-Spleiß-Einheiten sollte auch eine Extein-Ligation aufgrund der Konservierung von Aminosäuren an der C-terminalen Extein-Verbindung mit dem Intein verhindern. Ein bevorzugtes Intein, das keine Endonuklease-Domäne enthält, ist das GyrA-Protein aus Mycobacterium xenopiodra (Telenti et al. J. Bacteriol. 1997, 179, 6378-6382). Andere wurden in der Natur gefunden oder künstlich erzeugt, indem die Endonuklease-Domänen aus Endonuklease-enthaltende Inteinen entfernt wurden (Chong et al., J. Biol. Chem. 1997, 272, 15587-15590). In einer bevorzugten Ausführungsform ist das Intein so gewählt, dass es aus der minimalen Anzahl von Aminosäuren besteht, die zur Durchführung der Spleißfunktion benötigt werden, wie etwa das Intein aus dem GyrA-Protein aus Mycobacterium xenopiodra (Telenti A. et al., J. Bacteriol. 1997, 179, 6378-6382). In einer alternativen Ausführungsform wird ein Intein ohne Endonukleaseaktivität ausgewählt, wie etwa das Intein aus dem GyrA-Protein aus Mycobacterium xenopiodra oder das VMA-Intein aus Saccharaomyces cerevisiae, das modifiziert wurde, um Endonuklease-Domänen zu entfernen (Chong, 1997). Eine weitere Modifikation der Intein-Spleiß-Einheit kann es ermöglichen, die Reaktionsgeschwindigkeit der Spaltreaktion zu verändern, sodass die Proteindosierung durch einfaches Modifizieren der Gensequenz der Spleiß-Einheit gesteuert werden kann.
  • Inteine können auch als zwei Fragmente vorliegen, die von zwei getrennt transkribierten und translatierten Genen codiert werden. Diese sogenannten getrennten Inteine assoziieren sich selbst und katalysieren die Protein-Spleiß-Aktivität in trans. Getrennte Inteine wurden in verschiedenen Cyanobakterien und Archaeen identifiziert (Caspi et al., Mol Microbiol. 50: 1569-1577 (2003); Choi J. et al, J Mol Biol. 556: 1093-1106 (2006.); Dassa B. et al., Biochemistry. 46:322-330 (2007.); Liu, X. Yang, J., J, Biol Chem. 275:26315-26318 (2003); Wu H. et al.,
  • Proc Natl Acad Sci USA. £5:9226-9231 (1998.); und J. Zettler et al, FEBS Letters. 553:909-914 (2009)), sie wurden aber bisher nicht in Eukaryoten gefunden. Kürzlich ergab eine bioinformatische Analyse von Umwelt-Metagenom-Daten 26 verschiedene Loci mit einer neuartigen genomischen Anordnung. An jedem Locus ist eine konservierte Enzym-codierende Region durch ein geteiltes Intein getrennt, wobei zwischen den Sektionen, die für Intein-Subdomänen codieren, ein freistehendes Endonuklease-Gen eingefügt ist. Unter ihnen wurden fünf Loci vollständig zusammengesetzt: DNA-Helicasen (gp41-1, gp41-8); Inosin-5'-Monophosphat-Dehydrogenase (IMPDH-1); und katalytische Untereinheiten der Ribonukleotid-Reduktase (NrdA-2 und NrdJ-1). Diese gebrochene Gen-Organisation scheint hauptsächlich in Phagen vorhanden zu sein (Dassa et al., Nucleic Acids Research. 57:2560-2573 (2009)).
  • Das getrennte Intein Npu-DnaE wurde als das mit der höchsten Rate charakterisiert, die für die Protein-Trans-Spleiß-Reaktion berichtet wurde. Darüber hinaus gilt die Npu-DnaE-Protein-Spleiß-Reaktion als robust und ergiebig in Bezug auf verschiedene Extein-Sequenzen, Temperaturen von 6 bis 37 °C und das Vorhandensein von bis zu 6 M Harnstoff (Zettler J. et al., FEBS Letters. 553:909-914 (2009); I. Iwai et al., FEBS Letters 550: 1853-1858 (2006)). Als die Cysl-Ala-Mutation in die N-Domäne dieser Inteine eingeführt wurde, wurde erwartungsgemäß die ursprüngliche N-zu-S-Acyl-Verschiebung und damit das Proteinspleißen blockiert. Leider wurde auch die C-terminale Spaltreaktion fast vollständig gehemmt. Die Abhängigkeit der Asparagin-Cyclisierung an der C-terminalen Spleißverbindung von der Acyl-Verschiebung an der N-terminalen spaltbaren Peptidbindung scheint eine einzigartige Eigenschaft zu sein, die den natürlich getrennten DnaE-Intein-Allelen gemeinsam ist (Zettler J. et al. FEBS Letters. 555:909-914 (2009)).
  • Der Mechanismus des Proteinspleißens weist typischerweise vier Schritte auf [29-30]: 1) eine N-S- oder N-O-Acyl-Verschiebung am Intein-N-Terminus, die die Stromaufwärts-Peptidbindung bricht und eine Esterbindung zwischen dem N-Extein und der Seitenkette der ersten Aminosäure des Inteins (Cys oder Ser) bildet; 2) eine Umesterung, die das N-Extein zum Intein-C-Terminus verlagert und eine neue Esterbindung bildet, die das N-Extein mit der Seitenkette der ersten Aminosäure des C-Exteins (Cys, Ser oder Thr) verbindet; 3) eine Asn-Cyclisierung, die die Peptidbindung zwischen dem Intein und dem C-Extein bricht; und 4) eine S-N- oder O-N-Acyl-Verschiebung, die die Esterbindung durch eine Peptidbindung zwischen dem N-Extein und dem C-Extein ersetzt.
  • Das Trans-Spleißen von Proteinen, das von getrennten Inteinen katalysiert wird, ist eine rein enzymatische Methode zur Proteinligation [31]. Ein getrenntes Intein ist im Wesentlichen ein zusammenhängendes Intein (z. B. ein Mini-Intein), das in zwei Teile getrennt ist, die als N-Intein bzw. C-Intein bezeichnet werden. Das N-Intein und das C-Intein eines getrennten Inteins können sich nichtkovalent assoziieren, um ein aktives Intein zu bilden und die Spleißreaktion im Wesentlichen auf die gleiche Weise zu katalysieren wie ein zusammenhängendes Intein. Getrennte Inteine wurden sowohl in der Natur gefunden als auch in Laboratorien konstruiert [31-35]. Der hier verwendete Begriff „getrenntes Intein“ bezieht sich auf jedes Intein, bei dem eine oder mehrere Peptidbindungbrüche zwischen den N-terminalen und C-terminalen Aminosäuresequenzen vorhanden sind, sodass die N-terminalen und C-terminalen Sequenzen zu separaten Molekülen werden, die sich nichtkovalent reassoziieren oder zu einem Intein rekonstituieren können, das für Trans-Spleiß-Reaktionen funktionell ist. Jedes katalytisch aktive Intein oder Fragment davon kann verwendet werden, um ein getrenntes Intein zur Verwendung in den erfindungsgemäßen Verfahren abzuleiten. Zum Beispiel kann in einem Aspekt das getrennte Intein von einem eukaryotischen Intein abgeleitet sein. In einem anderen Aspekt kann das getrennte Intein von einem bakteriellen Intein abgeleitet sein. In einem anderen Aspekt kann das getrennte Intein von einem archaealen Intein abgeleitet sein. Vorzugsweise besitzt das so abgeleitete getrennte Intein nur die Aminosäuresequenzen, die für das Katalysieren von Trans-Spleiß-Reaktionen essentiell sind.
  • Der hier verwendete Begriff „N-terminal getrenntes Intein (In)“ bezieht sich auf jede Intein-Sequenz, die eine N-terminale Aminosäuresequenz umfasst, die für Trans-Spleiß-Reaktionen funktionell ist. Ein In umfasst somit auch eine Sequenz, die beim Trans-Spleißen herausgespleißt wird. Ein In kann eine Sequenz umfassen, die eine Modifikation des N-terminalen Abschnitts einer natürlich vorkommenden Intein-Sequenz ist. Beispielsweise kann ein In zusätzliche Aminosäurereste und/oder mutierte Reste umfassen, solange der Einschluss solcher zusätzlichen und/oder mutierten Reste das In beim Trans-Spleißen nicht funktionsunfähig macht. Vorzugsweise verbessert oder verstärkt der Einschluss der zusätzlichen und/oder mutierten Reste die Trans-Spleiß-Aktivität des In.
  • Der Begriff „C-terminal getrenntes Intein (Ic)“ bezieht sich auf jede Intein-Sequenz, die eine C-terminale Aminosäuresequenz umfasst, die für Trans-Spleiß-Reaktionen funktionell ist. In einem Aspekt umfasst das Ic 4 bis 7 zusammenhängende Aminosäurereste, von denen mindestens 4 Aminosäuren aus dem letzten β-Strang des Inteins stammen, von dem es abgeleitet wurde. Ein Ic umfasst somit auch eine Sequenz, die beim Trans-Spleißen herausgespleißt wird. Ein Ic kann eine Sequenz umfassen, die eine Modifikation des C-terminalen Abschnitts einer natürlich vorkommenden Intein-Sequenz ist. Beispielsweise kann ein Ic zusätzliche Aminosäurereste und/oder mutierte Reste umfassen, solange der Einschluss solcher zusätzlichen und/oder mutierten Reste das In beim Trans-Spleißen nicht funktionsunfähig macht. Vorzugsweise verbessert oder verstärkt der Einschluss der zusätzlichen und/oder mutierten Reste die Trans-Spleiß-Aktivität des Ic.
  • In einigen erfindungsgemäßen Ausführungsformen kann ein Peptid, das an einem Ic oder einem In gebunden ist, eine zusätzliche chemische Einheit umfassen, die unter anderem Fluoreszenzgruppen, Biotin, Polyethylenglykol (PEG), Aminosäureanaloga, unnatürliche Aminosäuren, Phosphatgruppen, Glykosylgruppen, Radioisotopenmarkierungen und pharmazeutische Moleküle beinhaltet. In anderen Ausführungsformen kann ein an einem Ic gebundenes Peptid eine oder mehrere chemisch reaktive Gruppen umfassen, einschließlich unter anderem Keton, Aldehyd, Cys-Reste und Lys-Reste. Das N-Intein und das C-Intein eines getrennten Inteins können sich nichtkovalent assoziieren, um ein aktives Intein zu bilden und die Spleißreaktion zu katalysieren, wenn ein „Intein-spleißendes Polypeptid (ISP)“ vorhanden ist. Der hier verwendete Begriff „Intein-spleißendes Polypeptid (ISP)“ bezieht sich auf den Abschnitt der Aminosäuresequenz eines getrennten Inteins, der übrig bleibt, wenn das Ic, das In oder beide aus dem getrennten Intein entfernt werden. In bestimmten Ausführungsformen umfasst das In das ISP. In einer anderen Ausführungsform umfasst das Ic das ISP. In einer weiteren Ausführungsform ist das ISP ein separates Peptid, das weder am In noch am Ic kovalent gebunden ist.
  • Getrennte Inteine können aus zusammenhängenden Inteinen erzeugt werden, indem eine oder mehrere Trenn-Sites in der unstrukturierten Schleife oder in der dazwischenliegenden Aminosäuresequenz zwischen den -12 konservierten Beta-Strängen, die in der Struktur der Mini-Inteine zu finden sind, konstruiert werden [25-28]. Eine gewisse Flexibilität in der Position der Trenn-Site innerhalb von Regionen zwischen den Beta-Strängen kann bestehen, vorausgesetzt, dass die Erzeugung der Trennung die Struktur des Inteins, insbesondere der strukturierten Beta-Stränge, nicht in ausreichendem Maße stört, dass die Protein-Spleiß-Aktivität verloren geht.
  • Beim Protein-Trans-Spleißen besteht ein Vorläuferprotein aus einem N-Extein-Teil gefolgt vom N-Intein, ein anderes Vorläuferprotein besteht aus dem C-Intein gefolgt von einem C-Extein-Teil, und eine Trans-Spleiß-Reaktion (die durch die N- und C-Inteine gemeinsam katalysiert wird) exzidiert die beiden Intein-Sequenzen und verbindet die beiden Extein-Sequenzen mit einer Peptidbindung. Das Trans-Spleißen von Proteinen ist eine enzymatische Reaktion, die mit sehr niedrigen (z. B. mikromolaren) Konzentrationen von Proteinen arbeiten und unter physiologischen Bedingungen durchgeführt werden kann.
  • Andere programmierbare Nukleasen
  • In verschiedenen hier beschriebenen Ausführungsformen umfassen die Prime Editoren ein napDNAbp, wie etwa ein Cas9-Protein. Diese Proteine sind „programmierbar“, indem sie mit einer Guide-RNA (oder gegebenenfalls einer PEgRNA) komplexiert werden, die das Cas9-Protein zu einer Target-Site auf der DNA steuert, die eine Sequenz besitzt, die komplementär zu dem Spacer-Abschnitt der gRNA (oder PEgRNA) ist und auch die erforderliche PAM-Sequenz besitzt. In bestimmten Ausführungsbeispielen, die hier vorgesehen sind, kann das napDNAbp jedoch durch eine andere Art programmierbaren Proteins ersetzt werden, wie beispielsweise eine Zinkfinger-Nuklease oder eine transkriptionsaktivatorartige Effektornuklease (transcription activator-like effector nuclease - TALEN).
  • 1J zeigt eine solche Variation des hier betrachteten Prime Editing, bei der das napDNAbp (z. B. SpCas9-Nickase) durch eine beliebige programmierbare Nukleasedomäne, wie Zinkfinger-Nukleasen (ZFN) oder transkriptionsaktivatorartige Effektornukleasen (TALEN), ersetzt wird. Als solches wird in Betracht gezogen, dass geeignete Nukleasen nicht notwendigerweise durch ein Nukleinsäure-Target-Molekül (wie etwa einer Guide-RNA) „programmiert“ werden müssen, sondern vielmehr durch Definieren der Spezifität einer DNAbindenden Domäne, wie insbesondere einer Nuklease, programmiert werden können. Ebenso wie beim Prime Editing mit napDNAbp-Einheiten ist vorzuziehen, dass solche alternativen programmierbaren Nukleasen derart modifiziert werden, dass nur ein Strang einer Target-DNA geschnitten wird. Mit anderen Worten, die programmierbaren Nukleasen sollten vorzugsweise als Nukleasen fungieren. Sobald eine programmierbare Nuklease ausgewählt ist (z. B. eine ZFN oder eine TALEN), können zusätzliche Funktionalitäten in das System konstruiert werden, damit es gemäß einem Prime-Editing-artigen Mechanismus arbeiten kann. Beispielsweise können die programmierbaren Nukleasen durch Kopplung (z. B. über einen chemischen Linker) eines RNA- oder DNA-Extension-Arms an diesen modifiziert werden, wobei der Extension-Arm eine Primer-Bindungsstelle (PBS) und ein DNA-Synthese-Template umfasst. Die programmierbare Nuklease kann auch (z. B. über einen chemischen oder Aminosäure-Linker) an eine Polymerase gekoppelt werden, deren Art davon abhängt, ob der Extension-Arm DNA oder RNA ist. Im Falle eines RNA-Extension-Arms kann die Polymerase eine RNA-abhängige DNA-Polymerase (z. B. reverse Transkriptase) sein. Im Falle eines DNA-Extension-Arms kann die Polymerase eine DNA-abhängige DNA-Polymerase sein (z. B. eine prokaryotische Polymerase, einschließlich Pol I, Pol II oder Pol III, oder eine eukaryotische Polymerase, einschließlich Pol a, Pol b, Pol g, Pol d, Pol e oder Pol z). Das System kann auch andere Funktionalitäten beinhalten, die als Fusionen zu den programmierbaren Nukleasen hinzugefügt werden oder in trans hinzugefügt werden, um die Reaktion als Ganzes zu erleichtern (z. B. (a) eine Helicase, um die DNA an der Schnittstelle abzuwickeln, um den geschnittenen Strang mit dem 3'-Ende als Primer verfügbar zu machen, (b) eine FEN1, um die Entfernung des endogenen Strangs auf dem geschnittenen Strang zu unterstützen, um die Reaktion in Richtung Ersatz des endogenen Strangs durch den synthetisierten Strang voranzutreiben, oder (c) einen nCas9:gRNA-Komplex, um eine zweite Nick-Site auf dem gegenüberliegenden Strang zu erzeugen, was dazu beitragen kann, die Integration der Synthesereparatur durch eine bevorzugte zelluläre Reparatur des nicht editierten Strangs voranzutreiben). Analog zum Prime Editing mit einem napDNAbp könnte ein solcher Komplex mit einer anderweitig programmierbaren Nuklease dazu verwendet werden, einen neu synthetisierten Ersatz-DNA-Strang, der eine Editierung von Interesse aufweist, zu synthetisieren und dann dauerhaft in eine DNA-Target-Site einzubauen.
  • Geeignete alternative programmierbare Nukleasen sind im Stand der Technik bekannt, die anstelle eines napDNAbp:gRNA-Komplexes verwendet werden können, um ein alternatives Prime-Editor-System zu konstruieren, das so programmiert werden kann, dass es selektiv an eine DNA-Target-Site bindet, und das in der oben beschriebenen Weise weiter modifiziert werden kann, um eine Polymerase und einen RNA- oder DNA-Extension-Arm, der eine Primer-Bindungsstelle und ein DNA-Synthese-Template umfasst, an eine spezifische Nick-Site zu kolokalisieren. Zum Beispiel und wie in 1J dargestellt können transkriptionsaktivatorartige Effektornukleasen (TALEN) als die programmierbare Nuklease in den hier beschriebenen Prime-Editing-Verfahren und Stoffzusammensetzungen verwendet werden. TALEN sind künstliche Restriktionsenzyme, die durch Fusion der TAL-Effektor-DNA-Bindungsdomäne mit einer DNA-Spaltdomäne erzeugt werden. Diese Reagenzien ermöglichen eine effiziente, programmierbare und spezifische DNA-Spaltung und stellen leistungsstarke Werkzeuge für das Genom-Editing in situ dar. Transkriptionsaktivatorartige Effektoren (TALE) können schnell konstruiert werden, um praktisch jede DNA-Sequenz zu binden. Der hier verwendete Begriff TALEN ist weit gefasst und beinhaltet auch monomere TALEN, die doppelsträngige DNA ohne Unterstützung durch andere TALEN spalten können. Der Begriff TALEN wird auch verwendet, um sich auf ein oder beide Mitglieder eines Paares von TALEN zu beziehen, die so konstruiert sind, dass sie zusammenarbeiten, um DNA an derselben Stelle zu spalten. TALEN, die zusammenarbeiten, können als eine linke TALEN und eine rechte TALEN bezeichnet werden, was auf die Händigkeit der DNA verweist. Siehe US-Ser.-Nr. 12/965,590 ; US-Ser.-Nr. 13/426,991 ( US-Pat.-Nr. 8,450,471 ); US-Ser.-Nr. 13/427,040 ( US-Pat.-Nr. 8,440,431 ); US-Ser.-Nr. 13/427,137 ( US-Pat.-Nr. 8,440,432 ); und US-Ser.-Nr. 13/738 , 381 , die hier alle durch Bezugnahme in ihrer Gesamtheit aufgenommen sind. Darüber hinaus sind TALEN beschrieben in WO 2015/027134 , US 9,181,535 , Boch et al., „Breaking the Code of DNA-Binding Specificity of TAL-Type III Effectors“, Science, Bd. 326, S. 1509-1512 (2009), Bogdanove et al., TAL Effectors: Customizable Proteins for DNA Targeting, Science, Bd. 333, S. 1843-1846 (2011), Cade et al., „Highly efficient generation of heritable zebrafish gene mutations using homo- and heterodimeric TALENs“, Nucleic Acids Research, Bd. 40, S. 8001-8010 (2012), und Cermak et al., „Efficient design and assembly of custom TALEN and other TAL effector-based constructs for DNA targeting“, Nucleic Acids Research, Bd. 39, Nr. 17, e82 (2011), die jeweils hier durch Bezugnahme aufgenommen sind.
  • Wie in 1J dargestellt, können Zinkfinger-Nukleasen auch als alternative programmierbare Nukleasen zur Verwendung beim Prime Editing anstelle von napDNAbp, wie etwa Cas9-Nickasen, verwendet werden. Wie bei TALEN können die ZFN-Proteine so modifiziert werden, dass sie als Nickasen fungieren, d. h. die ZFN wird so konstruiert, dass sie nur einen Strang der Target-DNA auf ähnliche Weise spaltet wie das napDNAbp, das mit den hier beschriebenen Prime Editoren verwendet wird. ZFN-Proteine sind im Stand der Technik ausführlich beschrieben worden, beispielsweise in Carroll et al., „Genome Engineering with Zinc-Finger Nucleases“, Genetics Aug. 2011, Bd. 188: 773-782; Durai et al., „Zinc finger nucleases: custom-designed molecular scissors for genome engineering of plant and mammalian cells“, Nucleic Acids Res, 2005, Bd. 33: 5978-90; und Gaj et al., „ZFN, TALEN, and CRISPR/Cas-based methods for genome engineering“, Trends Biotechnol, 2013, Bd. 31: 397-405, von denen jede hier durch Bezugnahme in ihrer Gesamtheit aufgenommen ist.
  • Polymerasen (z. B., reverse Transkriptasen)
  • In verschiedenen Ausführungsformen beinhaltet das hier offenbarte Prime-Editor(PE)-System eine Polymerase (z. B. DNA-abhängige DNA-Polymerase oder RNA-abhängige DNA-Polymerase, z. B. reverse Transkriptase) oder eine Variante davon, die als Fusionsprotein mit einem napDNAbp oder einer anderen programmierbaren Nuklease bereitgestellt sein kann oder in trans bereitgestellt sein kann.
  • Jede geeignete Polymerase kann in den hier offenbarten Prime Editoren verwendet werden. Die Polymerasen können Wildtyp-Polymerasen, funktionelle Fragmente, Mutanten, Varianten oder trunkierte Varianten und dergleichen sein. Die Polymerasen können Wildtyp-Polymerasen aus eukaryotischen, prokaryotischen, archaealen oder viralen Organismen beinhalten, und/oder die Polymerasen können durch gentechnische Verfahren, Mutagenese oder gezielte evolutionsbasierte Prozesse modifiziert werden. Zu den Polymerasen können T7-DNA-Polymerase, T5-DNA-Polymerase, T4-DNA-Polymerase, Klenow-Fragment-DNA-Polymerase, DNA-Polymerase III und dergleichen gehören. Die Polymerasen können auch thermostabil sein und Taq-, Tne-, Tma-, Pfu-, Tfl-, Tth-, Stoffel-Fragment-, VENT®- und DEEPVENT®-DNA-Polymerasen, KOD, Tgo, JDF3 sowie Mutanten, Varianten und Derivate davon beinhalten (siehe US-Pat.-Nr. 5,436,149 ; US-Pat.-Nr. 4,889,818 ; US-Pat.-Nr. 4,965,185 ; US-Pat.-Nr. 5,079,352 ; US-Pat.-Nr. 5,614,365 ; US-Pat.-Nr. 5,374,553 ; US-Pat.-Nr. 5,270,179 ; US-Pat.-Nr. 5,047,342 ; US-Pat.-Nr. 5,512,462 ; WO 92/06188 ; WO 92/06200 ; WO 96/10640 ; Barnes, W. M., Gen 112:29-35 (1992); Lawyer, F. C. et al., PCR Meth. Appl. 2:275-287 (1993); Flaman, J.-M. et al., Nuc. Acids Res. 22(15):3259-3260 (1994), die jeweils durch Bezugnahme aufgenommen sind). Für die Synthese längerer Nukleinsäuremoleküle (z. B. Nukleinsäuremoleküle, die länger als etwa 3-5 Kb sind) können mindestens zwei DNA-Polymerasen verwendet werden. In bestimmten Ausführungsformen kann einer der Polymerasen im Wesentlichen eine 3'-Exonukleaseaktivität fehlen und die andere kann eine 3'-Exonukleaseaktivität aufweisen. Solche Paarungen können Polymerasen beinhalten, die gleich oder unterschiedlich sind. Beispiele für DNA-Polymerasen, denen die 3'-Exonukleaseaktivität im Wesentlichen fehlt, beinhalten, ohne auf diese beschränkt zu sein, Taq-, Tne(exo -)-, Tma(exo-)-, Pfu(exo-)-, Pwo(exo-)-, exo-KOD- und Tth-DNA-Polymerasen sowie Mutanten, Varianten und Derivate davon.
  • Vorzugsweise sind die Polymerasen, die in den hier offenbarten Prime Editoren verwendet werden, „Template-abhängige“ Polymerasen (da die Polymerasen sich auf das DNA-Synthese-Template stützen sollen, um die Sequenz des zu synthetisierenden DNA-Strangs während des Prime Editing festzulegen). Wie hier verwendet, bezieht sich der Begriff „DNA-Template-Molekül“ auf den Strang einer Nukleinsäure, aus dem ein komplementärer Nukleinsäurestrang durch eine DNA-Polymerase synthetisiert wird, z. B. in einer Primer-Extension-Reaktion des DNA-Synthese-Templates einer PEgRNA.
  • Wie hier verwendet, soll sich der Begriff „Template-abhängige Weise“ auf einen Prozess beziehen, der die Template-abhängige Extension eines Primermoleküls beinhaltet (z. B. DNA-Synthese durch DNA-Polymerase). Der Begriff „Template-abhängige Weise“ bezieht sich auf die Polynukleotidsynthese von RNA oder DNA, bei der die Sequenz des neu synthetisierten Polynukleotidstrangs durch die bekannten Regeln der komplementären Basenpaarung bestimmt wird (siehe zum Beispiel Watson, J. D. et al., In: Molecular Biology of the Gene, 4. Aufl., W. A. Benjamin, Inc., Menlo Park, Calif. (1987)). Der Begriff „komplementär“ bezieht sich auf das breite Konzept der Sequenzkomplementarität zwischen Regionen zweier Polynukleotidstränge oder zwischen zwei Nukleotiden durch Basenpaarung. Es ist bekannt, dass ein Adeninnukleotid in der Lage ist, spezifische Wasserstoffbrückenbindungen („Basenpaarung“) mit einem Nukleotid zu bilden, das Thymin oder Uracil ist. In ähnlicher Weise ist bekannt, dass ein Cytosin-Nukleotid zur Basenpaarung mit einem Guanin-Nukleotid fähig ist. Als solches kann man im Fall des Prime Editing sagen, dass der einzelne DNA-Strang, der durch die Polymerase des Prime Editors gegen das DNA-Synthese-Template synthetisiert wird, „komplementär“ zu der Sequenz der DNA-Syntheseschablone ist.
  • A. Beispielhafte Polymerasen
  • In verschiedenen Ausführungsformen umfassen die hier beschriebenen Prime Editoren eine Polymerase. Die Offenbarung zieht jede Wildtyp-Polymerase in Betracht, die aus einem natürlich vorkommenden Organismus oder Virus oder aus einer kommerziellen oder nichtkommerziellen Quelle gewonnen wird. Darüber hinaus können die Polymerasen, die in den Prime Editoren der Offenbarung verwendet werden, jede natürlich vorkommende mutierte Polymerase, konstruierte mutierte Polymerase oder eine andere Polymerasevariante, einschließlich trunkierter Varianten, die ihre Funktion beibehalten, beinhalten. Die hier verwendbaren Polymerasen können auch so konstruiert sein, dass sie spezifische Aminosäuresubstitutionen beinhalten, wie sie hier speziell offenbart sind. In bestimmten bevorzugten Ausführungsformen sind die in den Prime Editoren der Offenbarung verwendbaren Polymerasen Template-basierte Polymerasen, d. h. sie synthetisieren Nukleotidsequenzen in einer Template-abhängigen Weise.
  • Eine Polymerase ist ein Enzym, das einen Nukleotidstrang synthetisiert und das in Verbindung mit den hier beschriebenen Prime-Editor-Systemen verwendet werden kann. Die Polymerasen sind bevorzugt „Template-abhängige“ Polymerasen (d. h. eine Polymerase, die einen Nukleotidstrang basierend auf der Reihenfolge der Nukleotidbasen eines Template-Strangs synthetisiert). In bestimmten Konfigurationen können die Polymerasen auch „Templateunabhängig“ sein (d. h. eine Polymerase, die einen Nukleotidstrang synthetisiert, ohne dass ein Template-Strang erforderlich ist). Eine Polymerase kann ferner auch als eine „DNA-Polymerase“ oder eine „RNA-Polymerase“ kategorisiert sein. In verschiedenen Ausführungsformen umfasst das Prime-Editor-System eine DNA-Polymerase. In verschiedenen Ausführungsformen kann die DNA-Polymerase eine „DNA-abhängige DNA-Polymerase“ sein (d. h. wobei das Template-Molekül ein DNA-Strang ist). In solchen Fällen kann das DNA- Template-Molekül eine PEgRNA sein, wobei der Extension-Arm einen DNA-Strang umfasst. In solchen Fällen kann die PEgRNA als chimäre oder hybride PEgRNA bezeichnet werden, die einen RNA-Abschnitt (d. h. die Guide-RNA-Komponenten, einschließlich des Spacers und des gRNA-Kerns) und einen DNA-Abschnitt (d. h. den Extension-Arm) umfasst. In verschiedenen Ausführungsformen kann die DNA-Polymerase eine „RNA-abhängige DNA-Polymerase“ sein (d. h. wobei das Template-Molekül ein RNA-Strang ist). In solchen Fällen ist die PEgRNA RNA, d. h. einschließlich einer RNA-Extension. Der Begriff „Polymerase“ kann sich auch auf ein Enzym beziehen, das die Polymerisation von Nukleotiden katalysiert (d. h. die Polymeraseaktivität). Im Allgemeinen wird das Enzym die Synthese am 3'-Ende eines Primers initiieren, der an einer Polynukleotid-Template-Sequenz angelagert ist (z. B. wie etwa einer Primer-Sequenz, die an der Primer-Bindungsstelle einer PEgRNA angelagert ist), und wird in Richtung des 5'-Endes des Template-Strangs fortfahren. Eine „DNA-Polymerase“ katalysiert die Polymerisation von Desoxynukleotiden. Wie hier in Bezug auf eine DNA-Polymerase verwendet, beinhaltet der Begriff DNA-Polymerase ein „funktionelles Fragment davon“. Ein „funktionelles Fragment davon“ bezieht sich auf jeden Abschnitt einer Wildtyp- oder mutierten DNA-Polymerase, der weniger als die gesamte Aminosäuresequenz der Polymerase umschließt und der unter mindestens einem Satz von Bedingungen die Fähigkeit behält, die Polymerisation eines Polynukleotids zu katalysieren. Ein solches funktionelles Fragment kann als separate Einheit existieren, oder es kann Bestandteil eines größeren Polypeptids wie etwa eines Fusionsproteins sein.
  • In einigen Ausführungsformen können die Polymerasen aus Bakteriophagen stammen. Bakteriophagen-DNA-Polymerasen weisen im Allgemeinen keine 5'-3'-Exonukleaseaktivität auf, da diese Aktivität durch ein separates Polypeptid codiert wird. Beispiele für geeignete DNA-Polymerasen sind T4-, T7- und phi29-DNA-Polymerase. Die im Handel erhältlichen Enzyme sind: T4 (erhältlich von vielen Quellen, z. B. Epicentre) und T7 (erhältlich von vielen Quellen, z. B. Epicentre für unmodifizierte und USB für 3'-5'-exo-T7 „Sequenase“-DNA-Polymerase).
  • In den anderen Ausführungsformen sind die Polymerasen archaeale Polymerasen. Es gibt 2 verschiedene Klassen von DNA-Polymerasen, die in Archaeen identifiziert wurden: 1. Familie B-/pol-I-Typ (Homologe von Pfu aus Pyrococcus furiosus) und 2. pol-II-Typ (Homologe der DP1/DP2-2-Untereinheit der Polymerase aus P. furiosus). Es wurde gezeigt, dass DNA-Polymerasen beider Klassen von Natur aus keine assoziierte 5'-3'-Exonukleaseaktivität aufweisen und eine 3'-5'-Exonukleaseaktivität (Proofreading) besitzen. Geeignete DNA-Polymerasen (pol I oder pol II) können aus Archaeen mit optimalen Wachstumstemperaturen, die den gewünschten Assay-Temperaturen ähnlich sind, abgeleitet werden.
  • Thermostabile archaeale DNA-Polymerasen werden aus Pyrococcus-Spezies (furiosus, Spezies GB-D, woesii, abysii, horikoshii), Thermococcus-Spezies (kodakaraensis KOD1, litoralis, Spezies 9°N7, Spezies JDF-3, gorgonarius), Pyrodictium occultum und Archaeoglobus fulgidus isoliert.
  • Polymerasen können auch von eubakteriellen Spezies stammen. Es gibt 3 Klassen von eubakteriellen DNA-Polymerasen, pol I, II und III. Enzyme in der Pol-I-DNA-Polymerase-Familie besitzen eine 5'-3'-Exonukleaseaktivität, und bestimmte Mitglieder zeigen auch eine 3'-5'-Exonukleaseaktivität. Pol-II-DNA-Polymerasen haben von Natur aus keine 5'-3'-Exonukleaseaktivität, weisen jedoch eine 3'-5'-Exonukleaseaktivität auf. Pol-III-DNA-Polymerasen sind die wichtigsten replikativen DNA-Polymerasen der Zelle und bestehen aus mehreren Untereinheiten. Der katalytischen pol-III-Untereinheit fehlt die 5'-3'-Exonukleaseaktivität, in einigen Fällen ist die 3'-5'-Exonukleaseaktivität jedoch im selben Polypeptid lokalisiert.
  • Es gibt eine Vielzahl im Handel erhältlicher Pol-I-DNA-Polymerasen, von denen einige modifiziert wurden, um die 5'-3'-Exonukleaseaktivität zu reduzieren oder zu beseitigen.
  • Geeignete thermostabile pol-I-DNA-Polymerasen können aus einer Vielzahl thermophiler Eubakterien isoliert werden, einschließlich Thermus-Spezies und Thermotoga maritima wie etwa Thermus aquaticus (Taq), Thermus thermophilus (Tth) und Thermotoga maritima (Tma UlTma).
  • Zusätzliche Eubakterien, die mit den oben aufgeführten verwandt sind, sind in Thermophilic Bacteria (Kristjansson, J. K., Hrsg.) CRC Press, Inc., Boca Raton, Fla., 1992, beschrieben.
  • Die Erfindung sieht ferner chimäre oder nichtchimäre DNA-Polymerasen vor, die chemisch gemäß den in den US-Patenten Nr. 5,677,152, 6,479,264 und 6,183,998 offenbarten Verfahren modifiziert wurden, deren Inhalt hiermit durch Bezugnahme in ihrer Gesamtheit aufgenommen ist.
  • Zusätzliche Archaea-DNA-Polymerasen im Zusammenhang mit den oben aufgeführten sind in den folgenden Quellen beschrieben: Archaea: A Laboratory Manual (Robb, F. T. und Place, A. R., Hrsg.), Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1995, und Thermophilic Bacteria (Kristjansson, J. K., Hrsg.) CRC Press, Inc., Boca Raton, Fla., 1992.
  • B. Beispielhafte reverse Transkriptasen
  • In verschiedenen Ausführungsformen umfassen die hier beschriebenen Prime Editoren eine reverse Transkriptase als Polymerase. Die Offenbarung zieht jede reverse Transkriptase vom Wildtyp in Betracht, die aus einem natürlich vorkommenden Organismus oder Virus oder aus einer kommerziellen oder nichtkommerziellen Quelle gewonnen wird. Darüber hinaus können die reversen Transkriptasen, die in den Prime Editoren der Offenbarung verwendet werden, jede natürlich vorkommende mutierte RT, konstruierte mutierte RT oder eine andere RT-Variante, einschließlich trunkierter Varianten, die ihre Funktion beibehalten, beinhalten. Die RT können auch so konstruiert sein, dass sie spezifische Aminosäuresubstitutionen beinhalten, wie sie hier speziell offenbart sind.
  • Reverse Transkriptasen sind multifunktionelle Enzyme, typischerweise mit drei enzymatischen Aktivitäten, einschließlich RNA- und DNA-abhängiger DNA-Polymerisationsaktivität, und einer RNaseH-Aktivität, die die Spaltung von RNA in RNA-DNA-Hybride katalysiert. Bei einigen Mutanten der reversen Transkriptasen ist die RNaseH-Einheit deaktiviert, um eine unbeabsichtigte Schädigung der mRNA zu verhindern. Diese Enzyme, die komplementäre DNA (cDNA) unter Verwendung von mRNA als Template synthetisieren, wurden zuerst in RNA-Viren identifiziert. Anschließend wurden reverse Transkriptasen isoliert und direkt aus Viruspartikeln, Zellen oder Geweben gereinigt (siehe z. B. Kacian et al., 1971, Biochim. Biophys. Acta 46: 365-83; Yang et al., 1972, Biochem. Biophys. Res. Comm. 47: 505-11; Gerard et al., 1975, J. Virol. 15: 785-97; Liu et al., 1977, Arch. Virol. 55 187-200; Kato et al., 1984, J. Virol. Methods 9: 325-39; Lukas et al., 1990, Biochem. 29: 1764-69 und Le Grice et al., 1991, J. Virol. 65: 7004-07, die jeweils durch Bezugnahme aufgenommen sind). In jüngerer Zeit wurden bei der Suche nach verbesserten Eigenschaften wie Thermostabilität, Genauigkeit und Aktivität Mutanten und Fusionsproteine entwickelt. Alle Wildtyp-, Varianten- und/oder Mutantenformen der reversen Transkriptase, die im Stand der Technik bekannt sind oder die mit Hilfe von im Stand der Technik bekannten Verfahren hergestellt werden können, kommen hier in Betracht.
  • Das Reverse-Transkriptase(RT)-Gen (oder die darin enthaltene genetische Information) kann aus einer Reihe verschiedener Quellen erhalten werden. Beispielsweise kann das Gen aus eukaryotischen Zellen erhalten werden, die mit einem Retrovirus infiziert sind, oder aus einer Anzahl von Plasmiden, die entweder einen Abschnitt oder die Gesamtheit des Retrovirus-Genoms enthalten. Zusätzlich kann Messenger-RNA-ähnliche RNA, die das RT-Gen enthält, aus Retroviren erhalten werden. Beispiele für Quellen für RT beinhalten, ohne aber auf diese beschränkt zu sein, das Moloney-Maus-Leukämie-Virus (M-MLV oder MLVRT); das humane T-Zell-Leukämie-Virus Typ 1 (HTLV-1); das Rinder-Leukämie-Virus (BLV); das Rous-Sarkom-Virus (RSV); das humane Immunschwäche-Virus (HIV); Hefe, einschließlich Saccharomyces, Neurospora, Drosophila; Primaten; und Nagetiere. Siehe zum Beispiel Weiss et al., US-Pat.-Nr. 4,663,290 (1987); Gerard, G. R., DNA:271-79 (1986); Kotewicz, M. L. et al., Gene 35:249-58 (1985); Tanese, N. et al., Proc. Natl. Acad. Sci. (USA):4944-48 (1985); Roth, M. J. et al. J. Biol. Chem. 260:9326-35 (1985); Michel, F. et al., Nature 316:641-43 (1985); Akins, R. A. et al., Cell 47:505-16 (1986), EMBO J. 4:1267-75 (1985); und Fawcett, D. F., Cell 47:1007-15 (1986) (die hier jeweils durch Bezugnahme in ihrer Gesamtheit aufgenommen sind).
  • Wildtyp-RT
  • Beispielhafte Enzyme zur Verwendung mit den hier offenbarten Prime Editoren können M-MLV-reverse-Transkriptase und RSV-reverse-Transkriptase beinhalten, sind aber nicht darauf beschränkt. Enzyme mit Reverse-Transkriptase-Aktivität sind im Handel erhältlich. In bestimmten Ausführungsformen wird die reverse Transkriptase in trans zu den anderen Komponenten des Prime-Editor(PE)-Systems bereitgestellt. Das heißt, die reverse Transkriptase wird als Einzelkomponente exprimiert oder anderweitig bereitgestellt, d. h. nicht als Fusionsprotein mit einem napDNAbp.
  • Der Fachmann wird erkennen, dass reverse Transkriptasen vom Wildtyp, einschließlich, aber nicht beschränkt auf das Moloney-Maus-Leukämie-Virus (M-MLV); reverse Transkriptase des humanen Immunschwäche-Virus (HIV) und reverse Transkriptase des aviären Leukosevirus (ASLV), einschließlich, aber nicht beschränkt auf reverse Transkriptase des Rous-Sarkom-Virus (RSV), reverse Transkriptase des aviären Myeloblastose-Virus (AMV), reverse Transkriptase des Helfervirus MCAV des aviären Erythroblastose-Virus(AEV), reverse Transkriptase des Helfervirus MCAV des aviären Myelozytomatose-Virus MC29, reverse Transkriptase des Helfervirus REV-A des aviären Reticuloendotheliose-Virus (REV-T), reverse Transkriptase des Helfervirus UR2AV des aviären Sarkom-Virus UR2, reverse Transkriptase des Helfervirus YAV des aviären Sarkom-Virus Y73, reverse Transkriptase des Rous-assozierten Virus (RAV) und reverse Transkriptase des Myeloblastose-assoziierten Virus (MAV), in geeigneter Weise in den hier beschriebenen Verfahren und Zusammensetzungen verwendet werden können.
  • Beispielhafte Wildtyp-RT-Enzyme sind wie folgt:
    Figure DE112020001339T5_0107
    Figure DE112020001339T5_0108
    Figure DE112020001339T5_0109
    Figure DE112020001339T5_0110
    Figure DE112020001339T5_0111
    Figure DE112020001339T5_0112
    Figure DE112020001339T5_0113
  • RT-Varianten undfehleranfällige RT
  • Reverse Transkriptasen sind essentiell für die Synthese von Strängen komplementärer DNA (cDNA) aus RNA-Templates. Reverse Transkriptasen sind Enzyme, die aus verschiedenen Domänen bestehen, die unterschiedliche biochemische Aktivitäten aufweisen. Die Enzyme katalysieren die Synthese von DNA aus einem RNA-Template wie folgt: In Gegenwart eines angelagerten Primers bindet die reverse Transkriptase an ein RNA-Template und initiiert die Polymerisationsreaktion. Die RNA-abhängige DNA-Polymeraseaktivität synthetisiert den komplementären DNA(cDNA)-Strang unter Einbeziehung von dNTP. Die RNase-H-Aktivität baut das RNA-Template des DNA:RNA-Komplexes ab. Reverse Transkriptasen umfassen somit (a) eine Bindungsaktivität, die ein RNA/DNA-Hybrid erkennt und an dieses bindet, (b) eine RNA-abhängige DNA-Polymeraseaktivität und (c) eine RNase-H-Aktivität. Darüber hinaus werden den reversen Transkriptasen im Allgemeinen verschiedene Eigenschaften zugeschrieben, darunter ihre Thermostabilität, Prozessivität (dNTP-Einbaurate) und Genauigkeit (oder Fehlerrate). Die hier betrachteten Varianten der reversen Transkriptase können alle Mutationen der reversen Transkriptase beinhalten, die eine oder mehrere dieser enzymatischen Aktivitäten (z. B. RNA-abhängige DNA-Polymeraseaktivität, RNase-H-Aktivität oder DNA/RNA-Hybrid-Bindungsaktivität) oder Enzymeigenschaften (z. B. Thermostabilität, Prozessivität oder Genauigkeit) beeinflussen oder verändern. Solche Varianten können im Stand der Technik öffentlich zugänglich sein, kommerziell erhältlich sein oder unter Verwendung bekannter Verfahren der Mutagenese, einschließlich gerichteter evolutionärer Prozesse (z. B. PACE oder PANCE), hergestellt werden.
  • In verschiedenen Ausführungsformen kann die reverse Transkriptase eine Variante der reversen Transkriptase sein. Wie hier verwendet, beinhaltet der Begriff „Variante der reversen Transkriptase“ jede natürlich vorkommende oder gentechnisch konstruierte Variante, die eine oder mehrere Mutationen (einschließlich singulärer Mutationen, Inversionen, Deletionen, Insertionen und Umlagerungen) im Vergleich zu einer Referenzsequenz (z. B. einer Referenz-Wildtyp-Sequenz) aufweist. RT weisen von Natur aus mehrere Aktivitäten auf, einschließlich einer RNA-abhängigen DNA-Polymeraseaktivität, einer Ribonuklease-H-Aktivität und einer DNAabhängigen DNA-Polymeraseaktivität. Zusammen ermöglichen diese Aktivitäten es dem Enzym, einzelsträngige RNA in doppelsträngige cDNA umzuwandeln. In Retroviren und Retrotransposons kann diese cDNA dann in das Wirtsgenom integriert werden, aus dem durch Transkription in der Wirtszelle neue RNA-Kopien hergestellt werden können. RT-Varianten können eine Mutation aufweisen, die sich auf eine oder mehrere dieser Aktivitäten auswirkt (die diese Aktivitäten entweder verringert oder verstärkt oder die diese Aktivitäten ganz ausschaltet). Darüber hinaus können RT-Varianten eine oder mehrere Mutationen aufweisen, die die RT mehr oder weniger stabil, weniger anfällig für Aggregation machen und die Reinigung und/oder die Detektion erleichtern und/oder andere Eigenschaften oder Merkmale verändern.
  • Der Fachmann wird erkennen, dass reverse Transkriptasen, die von anderen reversen Transkriptasen abgeleitet sind, einschließlich, aber nicht beschränkt auf das Moloney-Maus-Leukämie-Virus (M-MLV); reverse Transkriptase des humanen Immunschwäche-Virus (HIV) und reverse Transkriptase des aviären Leukosevirus (ASLV), einschließlich, aber nicht beschränkt auf reverse Transkriptase des Rous-Sarkom-Virus (RSV), reverse Transkriptase des aviären Myeloblastose-Virus (AMV), reverse Transkriptase des Helfervirus MCAV des aviären Erythroblastose-Virus(AEV), reverse Transkriptase des Helfervirus MCAV des aviären Myelozytomatose-Virus MC29, reverse Transkriptase des Helfervirus REV-A des aviären Reticuloendotheliose-Virus (REV-T), reverse Transkriptase des Helfervirus UR2AV des aviären Sarkom-Virus UR2, reverse Transkriptase des Helfervirus YAV des aviären Sarkom-Virus Y73, reverse Transkriptase des Rous-assozierten Virus (RAV) und reverse Transkriptase des Myeloblastose-assoziierten Virus (MAV), in geeigneter Weise in den hier beschriebenen Verfahren und Zusammensetzungen verwendet werden können.
  • Ein Verfahren, RT-Varianten herzustellen, ist durch genetische Modifikation (z. B. durch Modifizieren der DNA-Sequenz einer reversen Transkriptase vom Wildtyp). Im Stand der Technik ist eine Reihe von Verfahren bekannt, die sowohl die zufällige als auch die gezielte Mutation von DNA-Sequenzen erlaubt (siehe beispielsweise Ausubel et al., Short Protocols in Molecular Biology (1995) 3. sup.rd Ed. John Wiley & Sons, Inc.). Darüber hinaus gibt es eine Reihe im Handel erhältlicher Kits für die ortsspezifische Mutagenese, einschließlich sowohl konventioneller als auch PCR-basierter Verfahren. Beispiele sind die QuikChange Site-Directed Mutagenesis Kits (AGILENT®), das Q5® Site-Directed Mutagenesis Kit (NEW ENGLAND BIOLABS®) und das GeneArt™ Site-Directed Mutagenesis System (THERMOFISHER SCIENTIFIC®).
  • Darüber hinaus können mutierte reverse Transkriptasen durch insertionale Mutation oder Trunkation (N-terminale, interne oder C-terminale Insertionen oder Trunkationen) gemäß Verfahren erzeugt werden, die einem Fachmann bekannt sind. Der Begriff „Mutation“, wie er hier verwendet wird, bezieht sich auf eine Substitution eines Restes innerhalb einer Sequenz, z. B. einer Nukleinsäure- oder Aminosäuresequenz, durch einen anderen Rest oder eine Deletion oder Insertion eines oder mehrerer Reste innerhalb einer Sequenz. Mutationen werden hier typischerweise beschrieben, indem der ursprüngliche Rest identifiziert wird, gefolgt von der Position des Rests innerhalb der Sequenz und von der Identität des neu substituierten Rests. Verschiedene Verfahren zur Herstellung der hier bereitgestellten Aminosäuresubstitutionen (Mutationen) sind im Stand der Technik gut bekannt und werden beispielsweise durch Green und Sambrook, Molecular Cloning: A Laboratory Manual (4th ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N. Y. (2012)) bereitgestellt. Mutationen können eine Vielzahl von Kategorien beinhalten, wie etwa Einzelbasen-Polymorphismen, Mikroduplikationsregionen, Indel und Inversionen, und sollen in keiner Weise einschränkend sein. Mutationen können „Loss-of-Function“-Mutationen beinhalten, die das normale Ergebnis einer Mutation sind, die eine Proteinaktivität reduziert oder aufhebt. Die meisten Loss-of-Function-Mutationen sind rezessiv, da in einer Heterozygote die zweite Chromosomenkopie eine nicht mutierte Version des Gens trägt, die für ein voll funktionsfähiges Protein codiert, dessen Anwesenheit den Effekt der Mutation kompensiert. Mutationen umschließen auch „Gain-of-Function“-Mutationen, die einem Protein oder einer Zelle eine abnormale Aktivität verleihen, die ansonsten in einem normalen Zustand nicht vorhanden ist. Viele Gain-of-Function-Mutationen befinden sich eher in regulatorischen Sequenzen als in codierenden Regionen und können daher eine Reihe von Konsequenzen haben. Zum Beispiel könnte eine Mutation dazu führen, dass ein oder mehrere Gene in den falschen Geweben exprimiert werden und diese Gewebe Funktionen erhalten, die ihnen normalerweise fehlen. Aufgrund ihrer Natur sind Gain-of-Function-Mutationen normalerweise dominant.
  • Ältere Verfahren der ortsspezifischen Mutagenese, die im Stand der Technik bekannt sind, stützen sich auf das Subklonieren der zu mutierenden Sequenz in einen Vektor, wie etwa einen M13-Bakteriophagenvektor, der die Isolierung eines einzelsträngigen DNA-Templates ermöglicht. Bei diesen Verfahren wird ein mutagener Primer (d. h. ein Primer, der in der Lage ist, sich an die zu mutierende Stelle anzulagern, aber ein oder mehrere nicht übereinstimmende Nukleotide an der zu mutierenden Stelle trägt) an das einzelsträngige Template angelagert, und dann wird das Komplement des Templates ausgehend vom 3'-Ende des mutagenen Primers polymerisiert. Die resultierenden Duplexe werden dann in Wirtsbakterien umgewandelt, und Plaques werden auf die gewünschte Mutation gescreent.
  • In jüngerer Zeit wurden bei der ortsspezifischen Mutagenese PCR-Methoden eingesetzt, die den Vorteil haben, dass sie kein einzelsträngiges Template erfordern. Darüber hinaus wurden Verfahren entwickelt, die kein Subklonieren erfordern. Bei der Durchführung einer PCR-basierten ortsspezifischen Mutagenese müssen mehrere Probleme berücksichtigt werden. Erstens ist es bei diesen Verfahren wünschenswert, die Anzahl der PCR-Zyklen zu reduzieren, um eine Expansion unerwünschter Mutationen zu verhindern, die durch die Polymerase eingeführt werden. Zweitens muss eine Selektion durchgeführt werden, um die Anzahl der nicht mutierten Eltemmoleküle zu reduzieren, die in der Reaktion verbleiben. Drittens wird ein PCR-Verfahren mit größerer Länge bevorzugt, um die Verwendung eines einzelnen PCR-Primersatzes zu ermöglichen. Und viertens ist es aufgrund der nicht-Template-abhängigen terminalen Extensionsaktivität einiger thermostabiler Polymerasen häufig erforderlich, vor der Ligation des durch PCR erzeugten mutierten Produkts am stumpfen Ende einen Endpolierschritt in die Prozedur einzubauen.
  • Verfahren der Zufallsmutagenese, die zu einer Gruppe von Mutanten führen, die eine oder mehrere zufällig angeordnete Mutationen tragen, sind im Stand der Technik bekannt. Eine solche Gruppe von Mutanten kann dann auf diejenigen untersucht werden, die die gewünschten Eigenschaften aufweisen, zum Beispiel eine erhöhte Stabilität im Vergleich zu einer reversen Transkriptase vom Wildtyp.
  • Ein Beispiel für ein Verfahren der Zufallsmutagenese ist das sogenannte „fehleranfällige PCR-Verfahren“. Wie der Name schon sagt, amplifiziert das Verfahren eine vorgegebene Sequenz unter Bedingungen, bei denen die DNA-Polymerase einen hochgenauen Einbau nicht unterstützt. Obwohl die Bedingungen für einen fehleranfälligen Einbau für verschiedene DNA-Polymerasen unterschiedlich sind, kann ein Fachmann solche Bedingungen für ein vorgegebenes Enzym bestimmen. Eine Schlüsselgröße für viele DNA-Polymerasen bei der Amplifikationsgenauigkeit ist beispielsweise die Art und Konzentration des zweiwertigen Metallions im Puffer. Die Verwendung von Manganionen und/oder Variationen der Magnesium- oder Manganionenkonzentration können daher angewendet werden, um die Fehlerrate der Polymerase zu beeinflussen.
  • In verschiedenen Aspekten kann die RT der Prime Editoren eine „fehleranfällige“ Varianten der reversen Transkriptase sein. Fehleranfällige reverse Transkriptasen, die im Stand der Technik bekannt und/oder verfügbar sind, können verwendet werden. Es ist zu beachten, dass reverse Transkriptasen naturgemäß keine Proofreading-Funktion haben; daher ist die Fehlerrate der reversen Transkriptase im Allgemeinen höher als die von DNA-Polymerasen, die eine Proofreading-Funktion umfassen. Die Fehlerrate einer bestimmten reversen Transkriptase ist eine Eigenschaft der „Genauigkeit“ des Enzyms, die die Präzision der Template-gerichteten Polymerisation von DNA gegen ihr RNA-Template darstellt. Eine RT mit hoher Genauigkeit hat eine niedrige Fehlerrate. Umgekehrt hat eine RT mit niedriger Genauigkeit eine hohe Fehlerrate. Die Genauigkeit von M-MLV-basierten reversen Transkriptasen hat Berichten zufolge eine Fehlerrate im Bereich von einem Fehler auf 15.000 bis 27.000 synthetisierte Nukleotide. Siehe Boutabout et al., „DNA synthesis fidelity by the reverse transcriptase of the yeast retrotransposon Ty1“, Nucleic Acids Res, 2001, 29: 2217-2222, der durch Bezugnahme aufgenommen ist. Für die Zwecke dieser Anmeldung gelten daher diejenigen reversen Transkriptasen als „fehleranfällig“ oder mit einer „fehleranfälligen Genauigkeit“, die eine Fehlerrate von weniger als einem Fehler pro 15.000 synthetisierter Nukleotide aufweisen.
  • Fehleranfällige reverse Transkriptase kann auch durch Mutagenese eines Start-RT-Enzyms (z. B. einer M-MLV-RT vom Wildtyp) erzeugt werden. Das Verfahren der Mutagenese ist nicht beschränkt und kann auch gerichtete Evolutionsprozesse wie die phagengestützte kontinuierliche Evolution (PACE) oder die phagengestützte nichtkontinuierliche Evolution (PANCE) beinhalten. Der Begriff „phagengestützte kontinuierliche Evolution (PACE)“, wie er hier verwendet wird, bezieht sich auf eine kontinuierliche Evolution, die Phagen als virale Vektoren einsetzt. Das allgemeine Konzept der PACE-Technologie wurde beispielsweise beschrieben in der Internationalen PCT-Anmeldung PCT/US2009/056194 , eingereicht am 8.September 2009, veröffentlicht als WO 2010/028347 am 11. März 2010; der Internationalen PCT-Anmeldung PCT/US2011/066747 , eingereicht am 22. Dezember 2011, veröffentlicht als WO 2012/088381 am 28. Juni 2012; der US-Anmeldung, dem US-Patent Nr. 9.023.594 , erteilt am 5. Mai 2015, der Internationalen PCT-Anmeldung PCT/US2015/012022 , eingereicht am 20. Januar 2015, veröffentlicht als WO 2015/134121 am 11. September 2015, und der Internationalen PCT-Anmeldung PCT/US2016/027795 , eingereicht am 15. April 2016, veröffentlicht als WO 2016/168631 am 20. Oktober 2016, deren gesamter Inhalt hier durch Bezugnahme aufgenommen ist.
  • Fehleranfällige reverse Transkriptasen können auch durch phagengestützte nichtkontinuierliche Evolution (PANCE) erhalten werden, was sich, wie hier verwendet, auf nichtkontinuierliche Evolution bezieht, bei der Phagen als virale Vektoren eingesetzt werden. PANCE ist eine vereinfachte Technik für eine schnelle gerichtete In-vivo-Evolution unter Verwendung von seriellen Kolben-Transfers von sich entwickelnden „Selektionsphagen“ (SP), die ein zu entwickelndes Gen von Interesse enthalten, über frische E.-coli-Wirtszellen, sodass die Gene in den Wirts-E.-coli konstant gehalten werden können, während sich die in den SP enthaltenen Gene kontinuierlich weiterentwickeln. Serielle Kolben-Transfers haben lange als ein weithin zugänglicher Ansatz für die Laborevolution von Mikroben gedient, und in jüngerer Zeit wurden analoge Ansätze für die Bakteriophagen-Evolution entwickelt. Das PANCE-System verfügt über eine geringere Stringenz als das PACE-System.
  • Andere fehleranfällige reverse Transkriptasen wurden in der Literatur beschrieben, von denen jede für die Verwendung in den hier beschriebenen Verfahren und Zusammensetzungen in Betracht gezogen wird. Beispielsweise wurden fehleranfällige reverse Transkriptasen beschrieben in Bebenek et al., „Error-prone Polymerization by HIV-1 Reverse Transcriptase“, J Biol Chem, 1993, Bd. 268: 10324-10334, und Sebastian-Martin et al., „Transcriptional inaccuracy threshold attenuates differences in RNA-dependent DNA synthesis fidelity between retroviral reverse transcriptases“, Scientific Reports, 2018, Bd. 8: 627, die jeweils durch Bezugnahme aufgenommen sind. Darüber hinaus können reverse Transkriptasen, einschließlich fehleranfälliger reverser Transkriptasen, von einem kommerziellen Anbieter bezogen werden, darunter ProtoScript® (II) Reverse Transcriptase, AMV Reverse Transcriptase, WarmStart® Reverse Transcriptase und M-MuLV Reverse Transcriptase, jeweils von NEW ENGLAND BIOLABS®, oder AMV Reverse Transcriptase XL, SMARTScribe Reverse Transcriptase, GPR ultra-pure MMLV Reverse Transcriptase, jeweils von TAKARA BIO USA, INC. (ehemals CLONTECH).
  • Die vorliegende Offenbarung betrachtet auch reverse Transkriptasen mit Mutationen in der RNaseH-Domäne. Wie oben erwähnt, ist eine der intrinsischen Eigenschaften von reversen Transkriptasen die RNase-H-Aktivität, die das RNA-Template des RNA:cDNA-Hybrids gleichzeitig mit der Polymerisation spaltet. Die RNase-H-Aktivität kann für die Synthese langer cDNA unerwünscht sein, da das RNA-Template vor Abschluss der reversen Transkription der vollen Länge abgebaut werden kann. Die RNase-H-Aktivität kann auch die Effizienz der reversen Transkription verringern, vermutlich aufgrund ihrer Kompetition mit der Polymeraseaktivität des Enzyms. Somit werden in der vorliegenden Offenbarung alle Varianten reverser Transkriptase in Betracht gezogen, die eine modifizierte RNaseH-Aktivität umfassen.
  • Die vorliegende Offenbarung betrachtet auch reverse Transkriptasen mit Mutationen in der RNA-abhängigen DNA-Polymerase-Domäne. Wie oben erwähnt, ist eine der intrinsischen Eigenschaften von reversen Transkriptasen die RNA-abhängige DNA-Polymeraseaktivität, die die Nukleobasen in den naszierenden cDNA-Strang einbaut, wie sie durch den Template-RNA-Strang des RNA:cDNA-Hybrids codiert werden. Die RNA-abhängige DNA-Polymerase-Aktivität kann erhöht oder verringert werden (d. h. in Bezug auf ihre Einbaurate), um die Prozessivität des Enzyms entweder zu erhöhen oder zu verringern. Somit betrachtet die vorliegende Offenbarung alle Varianten reverser Transkriptase, die eine modifizierte RNA-abhängige DNA-Polymerase-Aktivität umfassen, sodass die Prozessivität des Enzyms im Vergleich mit einer unmodifizierten Version entweder erhöht oder verringert ist.
  • Hier werden auch Varianten reverser Transkriptase in Betracht gezogen, die veränderte Thermostabilitätseigenschaften aufweisen. Die Fähigkeit einer reversen Transkriptase, hohen Temperaturen standzuhalten, ist ein wichtiger Aspekt der cDNA-Synthese. Erhöhte Reaktionstemperaturen helfen, RNA mit starken Sekundärstrukturen und/oder hohem GC-Gehalt zu denaturieren, sodass reverse Transkriptasen die Sequenz durchlesen können. Folglich ermöglicht die reverse Transkription bei höheren Temperaturen die Synthese von cDNA in voller Länge und eine höhere Ausbeute, was zu einer verbesserten Erzeugung der 3'-Flap-ssDNA als Ergebnis des Prime-Editing-Prozesses führen kann. Die optimale Temperatur von reverser Transkriptase aus M-MLV vom Wildtyp liegt in der Regel im Bereich von 37-48 °C; es können jedoch Mutationen eingeführt werden, die eine reverse Transkriptionsaktivität bei höheren Temperaturen als 48 °C ermöglichen, einschließlich 49 °C, 50 °C, 51 °C, 52 °C, 53 °C, 54 °C, 55 °C, 56 °C, 57 °C, 58 °C, 59 °C, 60 °C, 61 °C, 62 °C, 63 °C, 64 °C, 65 °C, 66 °C und höher.
  • Die hier in Betracht gezogenen Varianten reverser Transkriptasen, einschließlich fehleranfälliger RT, thermostabiler RT, RT mit erhöhter Prozessivität, können durch verschiedene Routinestrategien, einschließlich Mutagenese oder evolutionärer Prozesse, konstruiert werden. In einigen Fällen können die Varianten durch Einführen einer einzelnen Mutation erzeugt werden. In anderen Fällen können die Varianten mehr als eine Mutation erfordern. Bei Mutanten, die mehr als eine Mutation umfassen, kann die Wirkung einer bestimmten Mutation bewertet werden, indem die identifizierte Mutation durch ortsspezifische Mutagenese isoliert von den anderen Mutationen, die von der jeweiligen Mutante getragen werden, in das Wildtyp-Gen eingeführt wird. Screening-Assays der so erzeugten Einzelmutante ermöglichen dann die Bestimmung der Wirkung dieser Mutation allein.
  • Die hier verwendeten RT-Enzymvarianten können auch andere „RT-Varianten“ beinhalten, die zu mindestens etwa 70 %, mindestens etwa 80 %, mindestens etwa 90 %, mindestens etwa 95 %, mindestens etwa 96 %, mindestens etwa 97 %, mindestens etwa 98 %, mindestens etwa 99 %, mindestens etwa 99,5 % oder mindestens etwa 99,9 % mit einem beliebigen Referenz-RT-Protein identisch sind, einschließlich einer Wildtyp-RT oder einer mutierten RT oder einer Fragment-RT oder einer anderen Variante von RT, die hier offenbart oder in Betracht gezogen ist oder im Stand der Technik bekannt ist.
  • In einigen Ausführungsformen kann eine RT-Variante 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 21, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50 oder bis zu 100 oder bis zu 200 oder bis zu 300 oder bis zu 400 oder bis zu 500 oder mehr Aminosäureänderungen im Vergleich zu einer Referenz-RT aufweisen. In einigen Ausführungsformen umfasst die RT-Variante ein Fragment einer Referenz-RT, sodass das Fragment zu mindestens etwa 70 %, zu mindestens etwa 80 %, zu mindestens etwa 90 %, zu mindestens etwa 95 %, zu mindestens etwa 96 %, zu mindestens etwa 97 %, zu mindestens etwa 98 %, zu mindestens etwa 99 %, zu mindestens etwa 99,5 % oder zu mindestens etwa 99,9 % mit dem entsprechenden Fragment der Referenz-RT identisch ist. In einigen Ausführungsformen weist das Fragment mindestens 30 %, mindestens 35 %, mindestens 40 %, mindestens 45 %, mindestens 50 %, mindestens 55 %, mindestens 60 %, mindestens 65 %, mindestens 70 %, mindestens 75 %, mindestens 80 %, mindestens 85 %, mindestens 90 %, mindestens 95 %, mindestens 96 %, mindestens 97 %, mindestens 98 %, mindestens 99 % oder mindestens 99,5 % der Aminosäurelänge einer entsprechenden Wildtyp-RT (reverse Transkriptase aus M-MLV) (z. B. SEQ ID NO: 89) oder einer der reversen Transkriptasen von SEQ ID NO: 90-100 auf.
  • In einigen Ausführungsformen kann die Offenbarung auch RT-Fragmente verwenden, die ihre Funktionalität behalten und die Fragmente eines hier offenbarten RT-Proteins sind. In einigen Ausführungsformen ist das RT-Fragment mindestens 100 Aminosäuren lang. In einigen Ausführungsformen weist das Fragment eine Länge von mindestens 100, 150, 200, 250, 300, 350, 400, 450, 500, 550 oder bis zu 600 oder mehr Aminosäuren auf.
  • In noch anderen Ausführungsformen kann die Offenbarung auch RT-Varianten verwenden, die am N-Terminus oder am C-Terminus oder an beiden durch eine bestimmte Anzahl von Aminosäuren trunkiert sind, was zu einer trunkierten Variante führt, die noch eine ausreichende Polymerasefunktion beibehält. In einigen Ausführungsformen weist die trunkierte RT-Variante eine Trunkierung von mindestens 1, mindestens 2, mindestens 3, mindestens 4, mindestens 5, mindestens 6, mindestens 7, mindestens 8, mindestens 9, mindestens 10, mindestens 11, mindestens 12, mindestens 13, mindestens 14, mindestens 15, mindestens 16, mindestens 17, mindestens 18, mindestens 19, mindestens 20, mindestens 21, mindestens 22, mindestens 23, mindestens 24, mindestens 25, mindestens 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 210, 220, 230, 240 oder 250 Aminosäuren am N-terminalen Ende des Proteins auf. In anderen Ausführungsformen weist die trunkierte RT-Variante eine Trunkierung von mindestens 1, mindestens 2, mindestens 3, mindestens 4, mindestens 5, mindestens 6, mindestens 7, mindestens 8, mindestens 9, mindestens 10, mindestens 11, mindestens 12, mindestens 13, mindestens 14, mindestens 15, mindestens 16, mindestens 17, mindestens 18, mindestens 19, mindestens 20, mindestens 21, mindestens 22, mindestens 23, mindestens 24, mindestens 25, mindestens 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 210, 220, 230, 240 oder 250 Aminosäuren am C-terminalen Ende des Proteins auf. In noch anderen Ausführungsformen weist die trunkierte RT-Variante am N-terminalen und am C-terminalen Ende eine Trunkierung auf, die gleich oder unterschiedlich lang sind.
  • Beispielsweise können die hier offenbarten Prime Editoren eine trunkierte Version der reversen Transkriptase aus M-MLV beinhalten. In dieser Ausführungsform enthält die reverse Transkriptase 4 Mutationen (D200N, T306K, W313F, T330P; zu beachten ist, dass die in PE2 vorhandene L603W-Mutation aufgrund der Trunkierung nicht mehr vorhanden ist). Die DNA-Sequenz, die für diesen verkürzten Editor codiert, ist 522 bp kleiner als PE2 und eignet sich daher für Anwendungen, bei denen die Einbringung der DNA-Sequenz aufgrund ihrer Größe schwierig ist (z. B. bei der Einbringung mittels Adeno-assoziierten Viren und Lentiviren). Diese Ausführungsform wird als MMLV-RT(trunc) bezeichnet und weist die folgende Aminosäuresequenz auf:
    MMLV-RT(TRUNC)
    Figure DE112020001339T5_0114
  • In verschiedenen Ausführungsformen können die hier offenbarten Prime Editoren eine der hier beschriebenen RT-Varianten oder eine RT-Variante davon, die zu mindestens etwa 70 % identisch, zu mindestens etwa 80 % identisch, zu mindestens etwa 90 % identisch, zu mindestens etwa 95 % identisch, zu mindestens etwa 96 % identisch, zu mindestens etwa 97 % identisch, zu mindestens etwa 98 % identisch, zu mindestens etwa 99 % identisch, zu mindestens etwa 99,5 % identisch oder zu mindestens etwa 99,9 % identisch mit beliebigen Referenz-Cas9-Varianten ist, umfassen.
  • In noch anderen Ausführungsformen können die vorliegenden Verfahren und Zusammensetzungen eine DNA-Polymerase verwenden, die zu einer reversen Transkriptase entwickelt wurde, wie in Effefson et al., „Synthetic evolutionary origin of a proofreading reverse transcriptase“, Science, 24. Juni 2016, Bd. 352: 1590-1593, beschrieben, dessen Inhalt hier durch Bezugnahme aufgenommen ist.
  • In bestimmten anderen Ausführungsformen ist die reverse Transkriptase als Komponente eines Fusionsproteins bereitgestellt, das ebenfalls ein napDNAbp umfasst. Mit anderen Worten, in einigen Ausführungsformen wird die reverse Transkriptase als Fusionsprotein zu einem napDNAbp fusioniert.
  • In verschiedenen Ausführungsformen können Varianten der reversen Transkriptasen aus teverser Transkriptase aus M-MLV vom Wildtyp konstruiert werden, wie sie durch SEQ ID NO: 89 dargestellt sind.
  • In verschiedenen Ausführungsformen können die hier beschriebenen Prime Editoren (wobei die RT entweder als Fusionspartner oder in trans bereitgestellt ist) eine RT-Variante beinhalten, die eine oder mehrere der folgenden Mutationen umfasst: P51L, S67K, E69K, L139P, T197A, D200N, H204R, F209N, E302K, E302R, T306K, F309N, W313F, T330P, L345G, L435G, N454K, D524G, E562Q, D583N, H594Q, L603W, E607K oder D653N in der RT aus M-MLV vom Wildtyp von SEQ ID NO: 89 oder an einer entsprechenden Aminosäureposition in einer anderen RT-Polypeptidsequenz vom Wildtyp.
  • Einige beispielhafte reverse Transkriptasen, die an napDNAbp-Proteine fusioniert oder als einzelne Proteine gemäß verschiedenen Ausführungsformen dieser Offenbarung bereitgestellt sein können, sind nachstehend aufgeführt. Beispielhafte reverse Transkriptasen beinhalten Varianten mit mindestens 80 %, mindestens 85 %, mindestens 90 %, mindestens 95 % oder mindestens 99 % Sequenzidentität mit den folgenden Wildtyp-Enzymen oder partiellen Enzymen:
    Figure DE112020001339T5_0115
    Figure DE112020001339T5_0116
    Figure DE112020001339T5_0117
    Figure DE112020001339T5_0118
    Figure DE112020001339T5_0119
    Figure DE112020001339T5_0120
    Figure DE112020001339T5_0121
    Figure DE112020001339T5_0122
    Figure DE112020001339T5_0123
    Figure DE112020001339T5_0124
  • In verschiedenen anderen Austührungstormen können die hier beschriebenen Prime Editoren (wobei die RT entweder als Fusionspartner oder in trans bereitgestellt wird) eine RT-Variante beinhalten, die eine oder mehrere der folgenden Mutationen umfasst: P5 IX, S67X, E69X, L139X, T197X, D200X, H204X, F209X, E302X, T306X, F309X, W313X, T330X, L345X, L435X, N454X, D524X, E562X, D583X, H594X, L603X, E607X oder D653X in der Wildtyp-M-MLV-RT der SEQ ID NO: 89 oder an einer entsprechenden Aminosäureposition in einer anderen Wildtyp-RT-Polypeptidsequenz, wobei „X“ eine beliebige Aminosäure sein kann.
  • In verschiedenen anderen Ausführungsformen können die hier beschriebenen Prime Editoren (wobei RT entweder als Fusionspartner oder in trans bereitgestellt wird) eine RT-Variante beinhalten, die eine P51X-Mutation in der Wildtyp-M-MLV-RT der SEQ ID NO: 89 oder an einer entsprechenden Aminosäureposition in einer anderen Wildtyp-RT-Polypeptidsequenz aufweist, wobei „X“ eine beliebige Aminosäure sein kann. In bestimmten Ausführungsformen ist X L.
  • In verschiedenen anderen Ausführungsformen können die hier beschriebenen Prime Editoren (wobei die RT entweder als Fusionspartner oder in trans bereitgestellt wird) eine RT-Variante beinhalten, die eine S67X-Mutation in der Wildtyp-M-MLV-RT der SEQ ID NO: 89 oder an einer entsprechenden Aminosäureposition in einer anderen Wildtyp-RT-Polypeptidsequenz aufweist, wobei „X“ eine beliebige Aminosäure sein kann. In bestimmten Ausführungsformen ist X K.
  • In verschiedenen anderen Ausführungsformen können die hier beschriebenen Prime Editoren (wobei die RT entweder als Fusionspartner oder in trans bereitgestellt wird) eine RT-Variante beinhalten, die eine E69X-Mutation in der Wildtyp-M-MLV-RT der SEQ ID NO: 89 oder an einer entsprechenden Aminosäureposition in einer anderen Wildtyp-RT-Polypeptidsequenz aufweist, wobei „X“ eine beliebige Aminosäure sein kann. In bestimmten Ausführungsformen ist X K.
  • In verschiedenen anderen Ausführungsformen können die hier beschriebenen Prime Editoren (wobei die RT entweder als Fusionspartner oder in trans bereitgestellt wird) eine RT-Variante beinhalten, die eine L139X-Mutation in der Wildtyp-M-MLV-RT der SEQ ID NO: 89 oder an einer entsprechenden Aminosäureposition in einer anderen Wildtyp-RT-Polypeptidsequenz aufweist, wobei „X“ eine beliebige Aminosäure sein kann. In bestimmten Ausführungsformen ist X P.
  • In verschiedenen anderen Ausführungsformen können die hier beschriebenen Prime Editoren (wobei die RT entweder als Fusionspartner oder in trans bereitgestellt wird) eine RT-Variante beinhalten, die eine T197X-Mutation in der Wildtyp-M-MLV-RT der SEQ ID NO: 89 oder an einer entsprechenden Aminosäureposition in einer anderen Wildtyp-RT-Polypeptidsequenz aufweist, wobei „X“ eine beliebige Aminosäure sein kann. In bestimmten Ausführungsformen ist X A.
  • In verschiedenen anderen Ausführungsformen können die hier beschriebenen Prime Editoren (wobei die RT entweder als Fusionspartner oder in trans bereitgestellt wird) eine RT-Variante beinhalten, die eine D200X-Mutation in der Wildtyp-M-MLV-RT der SEQ ID NO: 89 oder an einer entsprechenden Aminosäureposition in einer anderen Wildtyp-RT-Polypeptidsequenz aufweist, wobei „X“ eine beliebige Aminosäure sein kann. In bestimmten Ausführungsformen ist X N.
  • In verschiedenen anderen Ausführungsformen können die hier beschriebenen Prime Editoren (wobei die RT entweder als Fusionspartner oder in trans bereitgestellt wird) eine RT-Variante beinhalten, die eine H204X-Mutation in der Wildtyp-M-MLV-RT der SEQ ID NO: 89 oder an einer entsprechenden Aminosäureposition in einer anderen Wildtyp-RT-Polypeptidsequenz aufweist, wobei „X“ eine beliebige Aminosäure sein kann. In bestimmten Ausführungsformen ist X R.
  • In verschiedenen anderen Ausführungsformen können die hier beschriebenen Prime Editoren (wobei die RT entweder als Fusionspartner oder in trans bereitgestellt wird) eine RT-Variante beinhalten, die eine F209X-Mutation in der Wildtyp-M-MLV-RT der SEQ ID NO: 89 oder an einer entsprechenden Aminosäureposition in einer anderen Wildtyp-RT-Polypeptidsequenz aufweist, wobei „X“ eine beliebige Aminosäure sein kann. In bestimmten Ausführungsformen ist X N.
  • In verschiedenen anderen Ausführungsformen können die hier beschriebenen Prime Editoren (wobei die RT entweder als Fusionspartner oder in trans bereitgestellt wird) eine RT-Variante beinhalten, die eine E302X-Mutation in der Wildtyp-M-MLV-RT der SEQ ID NO: 89 oder an einer entsprechenden Aminosäureposition in einer anderen Wildtyp-RT-Polypeptidsequenz aufweist, wobei „X“ eine beliebige Aminosäure sein kann. In bestimmten Ausführungsformen ist X K.
  • In verschiedenen anderen Ausführungsformen können die hier beschriebenen Prime Editoren (wobei die RT entweder als Fusionspartner oder in trans bereitgestellt wird) eine RT-Variante beinhalten, die eine E302X-Mutation in der Wildtyp-M-MLV-RT der SEQ ID NO: 89 oder an einer entsprechenden Aminosäureposition in einer anderen Wildtyp-RT-Polypeptidsequenz aufweist, wobei „X“ eine beliebige Aminosäure sein kann. In bestimmten Ausführungsformen ist X R.
  • In verschiedenen anderen Ausführungsformen können die hier beschriebenen Prime Editoren (wobei die RT entweder als Fusionspartner oder in trans bereitgestellt wird) eine RT-Variante beinhalten, die eine T306X-Mutation in der Wildtyp-M-MLV-RT der SEQ ID NO: 89 oder an einer entsprechenden Aminosäureposition in einer anderen Wildtyp-RT-Polypeptidsequenz aufweist, wobei „X“ eine beliebige Aminosäure sein kann. In bestimmten Ausführungsformen ist X K.
  • In verschiedenen anderen Ausführungsformen können die hier beschriebenen Prime Editoren (wobei die RT entweder als Fusionspartner oder in trans bereitgestellt wird) eine RT-Variante beinhalten, die eine F309X-Mutation in der Wildtyp-M-MLV-RT der SEQ ID NO: 89 oder an einer entsprechenden Aminosäureposition in einer anderen Wildtyp-RT-Polypeptidsequenz aufweist, wobei „X“ eine beliebige Aminosäure sein kann. In bestimmten Ausführungsformen ist X N.
  • In verschiedenen anderen Ausführungsformen können die hier beschriebenen Prime Editoren (wobei die RT entweder als Fusionspartner oder in trans bereitgestellt wird) eine RT-Variante beinhalten, die eine W313X-Mutation in der Wildtyp-M-MLV-RT der SEQ ID NO: 89 oder an einer entsprechenden Aminosäureposition in einer anderen Wildtyp-RT-Polypeptidsequenz aufweist, wobei „X“ eine beliebige Aminosäure sein kann. In bestimmten Ausführungsformen ist X F.
  • In verschiedenen anderen Ausführungsformen können die hier beschriebenen Prime Editoren (wobei die RT entweder als Fusionspartner oder in trans bereitgestellt wird) eine RT-Variante beinhalten, die eine T330X-Mutation in der Wildtyp-M-MLV-RT der SEQ ID NO: 89 oder an einer entsprechenden Aminosäureposition in einer anderen Wildtyp-RT-Polypeptidsequenz aufweist, wobei „X“ eine beliebige Aminosäure sein kann. In bestimmten Ausführungsformen ist X P.
  • In verschiedenen anderen Ausführungsformen können die hier beschriebenen Prime Editoren (wobei die RT entweder als Fusionspartner oder in trans bereitgestellt wird) eine RT-Variante beinhalten, die eine L345X-Mutation in der Wildtyp-M-MLV-RT der SEQ ID NO: 89 oder an einer entsprechenden Aminosäureposition in einer anderen Wildtyp-RT-Polypeptidsequenz aufweist, wobei „X“ eine beliebige Aminosäure sein kann. In bestimmten Ausführungsformen ist X G.
  • In verschiedenen anderen Ausführungsformen können die hier beschriebenen Prime Editoren (wobei die RT entweder als Fusionspartner oder in trans bereitgestellt wird) eine RT-Variante beinhalten, die eine L435X-Mutation in der Wildtyp-M-MLV-RT der SEQ ID NO: 89 oder an einer entsprechenden Aminosäureposition in einer anderen Wildtyp-RT-Polypeptidsequenz aufweist, wobei „X“ eine beliebige Aminosäure sein kann. In bestimmten Ausführungsformen ist X G.
  • In verschiedenen anderen Ausführungsformen können die hier beschriebenen Prime Editoren (wobei die RT entweder als Fusionspartner oder in trans bereitgestellt wird) eine RT-Variante beinhalten, die eine N454X-Mutation in der Wildtyp-M-MLV-RT der SEQ ID NO: 89 oder an einer entsprechenden Aminosäureposition in einer anderen Wildtyp-RT-Polypeptidsequenz aufweist, wobei „X“ eine beliebige Aminosäure sein kann. In bestimmten Ausführungsformen ist X K.
  • In verschiedenen anderen Ausführungsformen können die hier beschriebenen Prime Editoren (wobei die RT entweder als Fusionspartner oder in trans bereitgestellt wird) eine RT-Variante beinhalten, die eine D524X-Mutation in der Wildtyp-M-MLV-RT der SEQ ID NO: 89 oder an einer entsprechenden Aminosäureposition in einer anderen Wildtyp-RT-Polypeptidsequenz aufweist, wobei „X“ eine beliebige Aminosäure sein kann. In bestimmten Ausführungsformen ist X G.
  • In verschiedenen anderen Ausführungsformen können die hier beschriebenen Prime Editoren (wobei die RT entweder als Fusionspartner oder in trans bereitgestellt wird) eine RT-Variante beinhalten, die eine E562X-Mutation in der Wildtyp-M-MLV-RT der SEQ ID NO: 89 oder an einer entsprechenden Aminosäureposition in einer anderen Wildtyp-RT-Polypeptidsequenz aufweist, wobei „X“ eine beliebige Aminosäure sein kann. In bestimmten Ausführungsformen ist X Q.
  • In verschiedenen anderen Ausführungsformen können die hier beschriebenen Prime Editoren (wobei die RT entweder als Fusionspartner oder in trans bereitgestellt wird) eine RT-Variante beinhalten, die eine D583X-Mutation in der Wildtyp-M-MLV-RT der SEQ ID NO: 89 oder an einer entsprechenden Aminosäureposition in einer anderen Wildtyp-RT-Polypeptidsequenz aufweist, wobei „X“ eine beliebige Aminosäure sein kann. In bestimmten Ausführungsformen ist X N.
  • In verschiedenen anderen Ausführungsformen können die hier beschriebenen Prime Editoren (wobei die RT entweder als Fusionspartner oder in trans bereitgestellt wird) eine RT-Variante beinhalten, die eine H594X-Mutation in der Wildtyp-M-MLV-RT der SEQ ID NO: 89 oder an einer entsprechenden Aminosäureposition in einer anderen Wildtyp-RT-Polypeptidsequenz aufweist, wobei „X“ eine beliebige Aminosäure sein kann. In bestimmten Ausführungsformen ist X Q.
  • In verschiedenen anderen Ausführungsformen können die hier beschriebenen Prime Editoren (wobei die RT entweder als Fusionspartner oder in trans bereitgestellt wird) eine RT-Variante beinhalten, die eine L603X-Mutation in der Wildtyp-M-MLV-RT der SEQ ID NO: 89 oder an einer entsprechenden Aminosäureposition in einer anderen Wildtyp-RT-Polypeptidsequenz aufweist, wobei „X“ eine beliebige Aminosäure sein kann. In bestimmten Ausführungsformen ist X W.
  • In verschiedenen anderen Ausführungsformen können die hier beschriebenen Prime Editoren (wobei die RT entweder als Fusionspartner oder in trans bereitgestellt wird) eine RT-Variante beinhalten, die eine E607X-Mutation in der Wildtyp-M-MLV-RT der SEQ ID NO: 89 oder an einer entsprechenden Aminosäureposition in einer anderen Wildtyp-RT-Polypeptidsequenz aufweist, wobei „X“ eine beliebige Aminosäure sein kann. In bestimmten Ausführungsformen ist X K.
  • In verschiedenen anderen Ausführungsformen können die hier beschriebenen Prime Editoren (wobei die RT entweder als Fusionspartner oder in trans bereitgestellt wird) eine RT-Variante beinhalten, die eine D653X-Mutation in der Wildtyp-M-MLV-RT der SEQ ID NO: 89 oder an einer entsprechenden Aminosäureposition in einer anderen Wildtyp-RT-Polypeptidsequenz aufweist, wobei „X“ eine beliebige Aminosäure sein kann. In bestimmten Ausführungsformen ist X N.
  • Einige beispielhafte reverse Transkriptasen, die an napDNAbp-Proteine fusioniert oder als einzelne Proteine gemäß verschiedenen Ausführungsformen dieser Offenbarung bereitgestellt sein können, sind nachstehend aufgeführt. Beispielhafte reverse Transkriptasen beinhalten Varianten mit mindestens 80 %, mindestens 85 %, mindestens 90 %, mindestens 95 % oder mindestens 99 % Sequenzidentität mit den folgenden Wildtyp-Enzymen oder partiellen Enzymen:
    Figure DE112020001339T5_0125
    Figure DE112020001339T5_0126
    Figure DE112020001339T5_0127
    Figure DE112020001339T5_0128
    Figure DE112020001339T5_0129
    Figure DE112020001339T5_0130
    Figure DE112020001339T5_0131
    Figure DE112020001339T5_0132
    Figure DE112020001339T5_0133
    Figure DE112020001339T5_0134
    Figure DE112020001339T5_0135
  • Das hier beschriebene Prime-Editor(PE)-System zieht jede öffentlich verfügbare reverse Transkriptase in Betracht, die in einem der folgenden US-Patente beschrieben oder offenbart ist (die jeweils in ihrer Gesamtheit durch Bezugnahme aufgenommen sind): US-Patent-Nr: 10,202,658 ; 10,189,831 ; 10,150,955 ; 9,932,567 ; 9,783,791 ; 9,580,698 ; 9,534,201 ; und 9,458,484 , und jede Variante davon, die mit bekannten Verfahren zum Einbauen von Mutationen oder bekannten Verfahren zur Entwicklung von Proteinen hergestellt werden kann. Die folgenden Quellen beschreiben reverse Transkriptasen im Stand der Technik. Jede ihrer Offenbarungen ist hier durch Bezugnahme in ihrer Gesamtheit aufgenommen.
    • Herzig, E., Voronin, N., Kucherenko, N. & Hizi, A. Novel Leu92 Mutant of HIV-1 Reverse Transcriptase with a Selective Deficiency in Strand Transfer Causes a Loss of Viral Replication. J. Virol. 89, 8119-8129 (2015).
    • Mohr, G. et al. A Reverse Transcriptase-Cas1 Fusion Protein Contains a Cas6 Domain Required for Both CRISPR RNA Biogenesis and RNA Spacer Acquisition. Mol. Cell 72, 700-714.e8 (2018).
    • Zhao, C., Liu, F. & Pyle, A. M. An ultraprocessive, accurate reverse transcriptase encoded by a metazoan group II intron. RNA 24, 183-195 (2018).
    • Zimmerly, S. & Wu, L. An Unexplored Diversity of Reverse Transcriptases in Bacteria. Microbiol Spectr 3, MDNA3-0058-2014 (2015).
    • Ostertag, E. M. & Kazazian Jr, H. H. Biology of Mammalian L1 Retrotransposons. Annual Review of Genetics 35, 501-538 (2001).
    • Perach, M. & Hizi, A. Catalytic Features of the Recombinant Reverse Transcriptase of Bovine Leukemia Virus Expressed in Bacteria. Virology 259, 176-189 (1999).
    • Lim, D. et al. Crystal structure of the moloney murine leukemia virus RNase H domain. J. Virol. 80, 8379-8389 (2006).
    • Zhao, C. & Pyle, A. M. Crystal structures of a group II intron maturase reveal a missing link in spliceosome evolution. Nature Structural & Molecular Biology 23, 558-565 (2016).
    • Griffiths, D. J. Endogenous retroviruses in the human genome sequence. Genome Biol. 2, REVIEWS1017 (2001).
    • Baranauskas A. et al. Generation and characterization of new highly thermostable and processive M-MuLV reverse transcriptase variants. Protein Eng Des Sel 25, 657-668 (2012).
    • Zimmerly, S., Guo, H., Perlman, P. S. & Lambowltz, A. M. Group II intron mobility occurs by target DNA-primed reverse transcription. Cell 82, 545-554 (1995).
    • Feng, Q., Moran, J. V., Kazazian, H. H. & Boeke, J. D. Human L1 retrotransposon encodes a conserved endonuclease required for retrotransposition. Cell 87, 905-916 (1996).
    • Berkhout, B., Jebbink, M. & Zsiros, J. Identification of an Active Reverse Transcriptase Enzyme Encoded by a Human Endogenous HERV-K Retrovirus. Journal of Virology 73, 2365-2375 (1999).
    • Kotewicz, M. L., Sampson, C. M., D'Alessio, J. M. & Gerard, G. F. Isolation of cloned Moloney murine leukemia virus reverse transcriptase lacking ribonuclease H activity. Nucleic Acids Res 16, 265-277 (1988).
    • Arezi, B. & Hogrefe, H. Novel mutations in Moloney Murine Leukemia Virus reverse transcriptase increase thermostability through tighter binding to template-primer. Nucleic Acids Res 37, 473-481 (2009).
    • Blain, S. W. & Goff, S. P. Nuclease activities of Moloney murine leukemia virus reverse transcriptase. Mutants with altered substrate specificities. J. Biol. Chem. 268, 23585-23592 (1993).
    • Xiong, Y. & Eickbush, T. H. Origin and evolution of retroelements based upon their reverse transcriptase sequences. EMBO J9, 3353-3362 (1990).
    • Herschhorn, A. & Hizi, A. Retroviral reverse transcriptases. Cell. Mol. Life Sci. 67, 2717-2747 (2010).
    • Taube, R., Loya, S., Avidan, O., Perach, M. & Hizi, A. Reverse transcriptase of mouse mammary tumour virus: expression in bacteria, purification and biochemical characterization. Biochem. J. 329 (Pt 3), 579-587 (1998).
    • Liu, M. et al. Reverse Transcriptase-Mediated Tropism Switching in Bordetella Bacteriophage. Science 295, 2091-2094 (2002).
    • Luan, D. D., Korman, M. H., Jakubczak, J. L. & Eickbush, T. H. Reverse transcription of R2Bm RNA is primed by a nick at the chromosomal target site: a mechanism for non-LTR retrotransposition. Cell72, 595-605 (1993).
    • Nottingham, R. M. et al. RNA-seq of human reference RNA samples using a thermostable group II intron reverse transcriptase. RNA 22, 597-613 (2016).
    • Telesnitsky, A. & Goff, S. P. RNase H domain mutations affect the interaction between Moloney murine leukemia virus reverse transcriptase and its primer-template. Proc. Natl. Acad. Sci. U. S. A. 90, 1276-1280 (1993).
    • Halvas, E. K., Svarovskaia, E. S. & Pathak, V. K. Role of Murine Leukemia Virus Reverse Transcriptase Deoxyribonucleoside Triphosphate-Binding Site in Retroviral Replication and In Vivo Fidelity. Journal of Virology 74, 10349-10358 (2000).
    • Nowak, E. et al. Structural analysis of monomeric retroviral reverse transcriptase in complex with an RNA/DNA hybrid. Nucleic Acids Res 41, 3874-3887 (2013).
    • Stamos, J. L., Lentzsch, A. M. & Lambowitz, A. M. Structure of a Thermostable Group II Intron Reverse Transcriptase with Template-Primer and Its Functional and Evolutionary Implications. Molecular Cell 68, 926-939.e4 (2017).
    • Das, D. & Georgiadis, M. M. The Crystal Structure of the Monomeric Reverse Transcriptase from Moloney Murine Leukemia Virus. Structure 12, 819-829 (2004).
    • Avidan, O., Meer, M. E., Oz, I. & Hizi, A. The processivity and fidelity of DNA synthesis exhibited by the reverse transcriptase of bovine leukemia virus. European Journal of Biochemistry 269, 859-867 (2002).
    • Gerard, G. F. et al. The role of template-primer in protection of reverse transcriptase from thermal inactivation. Nucleic Acids Res 30, 3118-3129 (2002).
    • Monot, C. et al. The Specificity and Flexibility of L1 Reverse Transcription Priming at Imperfect T-Tracts. PLOS Genetics 9, e1003499 (2013).
    • Mohr, S. et al. Thermostable group II intron reverse transcriptase fusion proteins and their use in cDNA synthesis and next-generation RNA sequencing. RNA 19, 958-970 (2013).
    • Alle oben genannten Quellen, die sich auf reverse Transkriptasen beziehen, sind, sofern nicht bereits erwähnt, hiermit vollständig durch Bezugnahme aufgenommen.
  • PE-Fusionsproteine
  • Das hier beschriebene Prime-Editor(PE)-System kann Fusionsproteine in Betracht ziehen, die ein napDNAbp und eine Polymerase (z. B. DNA-abhängige DNA-Polymerase oder RNA-abhängige DNA-Polymerase, wie etwa reverse Transkriptase) umfassen und gegebenenfalls durch einen Linker verbunden sind. Die Anmeldung zieht in Betracht, dass jedes geeignete napDNAbp und jede geeignete Polymerase (z. B. DNA-abhängige DNA-Polymerase oder RNA-abhängige DNA-Polymerase, wie etwa reverse Transkriptase) in einem einzelnen Fusionsprotein kombiniert werden können. Beispiele für napDNAbp und Polymerasen (z. B. DNA-abhängige DNA-Polymerase oder RNA-abhängige DNA-Polymerase, wie etwa reverse Transkriptase) sind jeweils hier definiert. Da Polymerasen im Stand der Technik gut bekannt sind und die Aminosäuresequenzen leicht verfügbar sind, soll diese Offenbarung in keiner Weise auf die hier identifizierten spezifischen Polymerasen beschränkt sein.
  • In verschiedenen Ausführungsformen können die Fusionsproteine jede geeignete strukturelle Konfiguration umfassen. Beispielsweise kann das Fusionsprotein in der Richtung vom N-Terminus zum C-Terminus ein napDNAbp umfassen, das an eine Polymerase fusioniert ist (z. B. DNA-abhängige DNA-Polymerase oder RNA-abhängige DNA-Polymerase, wie etwa reverse Transkriptase). In anderen Ausführungsformen kann das Fusionsprotein in der Richtung vom N-Terminus zum C-Terminus eine Polymerase (z. B. eine reverse Transkriptase) umfassen, die an ein napDNAbp fusioniert ist. Die fusionierte Domäne kann optional durch einen Linker, z. B. eine Aminosäuresequenz, verbunden sein. In anderen Ausführungsformen können die Fusionsproteine die Struktur NH2-[napDNAbp]-[ Polymerase]-COOH; oder NH2-[Polymerase]-[napDNAbp]-COOH umfassen, wobei jedes „]-[“ das Vorhandensein einer optionalen Linker-Sequenz anzeigt. In Ausführungsformen, bei denen die Polymerase eine reverse Transkriptase ist, können die Fusionsproteine die Struktur NH2-[napDNAbp]-[RT]-COOH; oder NH2-[RT]-[napDNAbp]-COOH umfassen, wobei jedes „]-[“ das Vorhandensein einer optionalen Linker-Sequenz anzeigt.
  • Ein beispielhaftes Fusionsprotein ist in 14 dargestellt, die ein Fusionsprotein zeigt, die eine MLV-Reverse-Transkriptase („MLV-RT“), die über eine Linker-Sequenz an ein Nickase-Cas9 („Cas9(H840A)“) fusioniert ist, umfasst. Dieses Beispiel soll nicht den Umfang von Fusionsproteinen einschränken, die für das hier beschriebene Prime Editor(PE)-System verwendet werden können.
  • In verschiedenen Ausführungsformen kann das Prime-Editor-Fusionsprotein die folgende Aminosäuresequenz (hier als „PE1“ bezeichnet) aufweisen, die eine Cas9-Variante beinhaltet, die eine H840A-Mutation (d. h. eine Cas9-Nickase) und eine M-MLV-RT vom Wildtyp sowie eine N-terminale NLS-Sequenz (19 Aminosäuren) und einen Aminosäure-Linker (32 Aminosäuren), der den C-Terminus der Cas9-Nickase-Domäne mit dem N-Terminus der RT-Domäne verbindet, umfasst. Das PE1-Fusionsprotein weist die folgende Struktur auf: [NLS]-[Cas9(H840A)]-[Linker]-[MMLV _RT(wt)]. Die Aminosäuresequenz von PE1 und seine einzelnen Komponenten sind wie folgt:
    Figure DE112020001339T5_0136
    Figure DE112020001339T5_0137
    Figure DE112020001339T5_0138
    Figure DE112020001339T5_0139
    Figure DE112020001339T5_0140
  • In einer anderen Ausführungsform kann das Prime-Editor-Fusionsprotein die folgende Aminosäuresequenz (hier als „PE2“ bezeichnet) aufweisen, die eine Cas9-Variante beinhaltet, die eine H840A-Mutation (d. h. eine Cas9-Nickase) und eine M-MLV-RT mit den Mutationen D200N, T330P, L603W, T306K und W313F sowie eine N-terminale NLS-Sequenz (19 Aminosäuren) und einen Aminosäure-Linker (33 Aminosäuren), der den C-Terminus der Cas9-Nickase-Domäne mit dem N-Terminus der RT-Domäne verbindet, umfasst. Das PE2-Fusionsprotein weist die folgende Struktur auf: [NLS]-[Cas9(H840A)]-[Linker]-
    [MMLV _RT(D200N)(T330P)(L603W)(T306K)(W313F)]. Die Aminosäuresequenz von PE2 ist wie folgt:
    Figure DE112020001339T5_0141
    Figure DE112020001339T5_0142
    Figure DE112020001339T5_0143
    Figure DE112020001339T5_0144
    Figure DE112020001339T5_0145
  • In noch anderen Ausführungsformen kann das Prime-Editor-Fusionsprotein die folgenden Aminosäuresequenzen aufweisen:
    Figure DE112020001339T5_0146
    Figure DE112020001339T5_0147
    Figure DE112020001339T5_0148
    Figure DE112020001339T5_0149
    Figure DE112020001339T5_0150
    Figure DE112020001339T5_0151
    Figure DE112020001339T5_0152
  • In anderen Ausführungsformen können die Prime-Editor-Fusionsproteine auf SaCas9- oder auf SpCas9-Nickasen mit veränderten PAM-Spezifitäten basieren, wie etwa auf den folgenden beispielhaften Sequenzen:
  • In noch weiteren Ausführungsformen können die hierin in Betracht gezogenen Prime-Editor-Fusionsproteine eine Cas9-Nickase (z. B. Cas9 (H840A)) einschließen, die mit einer trunkierten Version der reversen M-MLV-Transkriptase fusioniert ist. In dieser Ausführungsform enthält die reverse Transkriptase ebenfalls 4 Mutationen (D200N, T306K, W313F, T330P; dabei gilt zu beachten, dass die in PE2 vorhandene Mutation L603W aufgrund der Trunkierung nicht mehr vorhanden ist). Die DNA-Sequenz, die für diesen trunkierten Editor kodiert, ist 522 bp kleiner als PE2 und eignet sich daher möglicherweise für Anwendungen, bei denen die Übertragung der DNA-Sequenz aufgrund ihrer Größe schwierig ist (z. B. Übertragung von Adenoassoziierten Viren und Lentiviren). Diese Ausführungsform wird als Cas9(H840A)-MMLV-RT(trunc) oder „PE2-short“ oder „PE2-trunc“ bezeichnet und hat die folgende Aminosäuresequenz:
    Figure DE112020001339T5_0153
    Figure DE112020001339T5_0154
    Figure DE112020001339T5_0155
  • Siehe FIG. die ein Balkendiagramm bereitstellt, in dem die Effizienz (d. h. „% der gesamten Sequenzierungslesungen mit den angegebenen Eidt oder Indels“) von PE2, PE2-trunc, PE3 und PE3-trunc über verschiedene Target-Stellen in verschiedenen Zelllinien verglichen wird. Die Daten zeigen, dass die Prime Editors, welche die trunkierten RT-Varianten umfassen, etwa genauso effizient waren wie die Prime Editors, welche die nicht trunkierten RT-Proteine umfassen.
  • In verschiedenen Ausführungsformen können die hierin betrachteten Prime-Editor-Fusionsproteine auch beliebige Varianten der vorstehend offenbarten Sequenzen einschließen, die eine Aminosäuresequenz aufweisen, die zu mindestens etwa 70 % identisch, zu mindestens etwa 80 % identisch, zu mindestens etwa 90 % identisch, zu mindestens etwa 95 % identisch, zu mindestens etwa 96 % identisch, zu mindestens etwa 97 % identisch, zu mindestens etwa 98 % identisch, zu mindestens etwa 99 % identisch, zu mindestens etwa 99,5 % identisch oder zu mindestens etwa 99,9 % identisch mit PE1, PE2 oder einer der vorstehend angegebenen Prime-Editor-Fusionssequenzen ist.
  • In bestimmten Ausführungsformen können Linker verwendet werden, um eines der Peptide oder Peptiddomänen oder -einheiten der Erfindung zu verbinden (z. B. ein napDNAbp, das an eine reverse Transkriptase gebunden oder mit dieser fusioniert ist).
  • Linker und andere Domänen
  • Die PE-Fusionsproteine können neben der napDNAbp-Domäne (z. B. Cas9-Domäne) und der Polymerase-Domäne (z. B. RT-Domäne) verschiedene andere Domänen umfassen. Handelt es sich bei dem napDNAbp beispielsweise um ein Cas9 und bei der Polymerase um eine RT, können die PE-Fusionsproteine einen oder mehrere Linker umfassen, welche die Cas9-Domäne mit der RT-Domäne verbinden. Die Linker können auch andere funktionelle Domänen, wie Kernlokalisierungssequenzen (NLS) oder eine FEN1 (oder eine andere Flap-Endonuklease) mit den PE-Fusionsproteinen oder einer Domäne davon verbinden.
  • Darüber hinaus können in Ausführungsformen, die eine trans-Prime-Editierung beinhalten, Linker verwendet werden, um das tPERT-Rekrutierungsprotein mit einem Prime Editor zu verbinden, z. B. zwischen dem tPERt-Rekrutierungsprotein und dem napDNAbp. Siehe z. B. 3G für ein beispielhaftes Schema eines trans-Prime Editors (tPE), der Linker einschließt, um eine Polymerase-Domäne und eine Rekrutierungsprotein-Domäne getrennt an ein napDNAbp zu fusionieren.
  • A. Linker
  • Wie vorstehend definiert, bezieht sich der hierin verwendete Begriff „Linker“ auf eine chemische Gruppe oder ein Molekül, das zwei Moleküle oder Einheiten miteinander verbindet, z. B. eine Bindungsdomäne und eine Spaltungsdomäne einer Nuklease. In einigen Ausführungsformen verbindet ein Linker eine gRNA-Bindungsdomäne einer RNAprogrammierbaren Nuklease und die katalytische Domäne einer Polymerase (z. B. einer reversen Transkriptase). In einigen Ausführungsformen verbindet ein Linker ein dCas9 und eine reverse Transkriptase. In der Regel ist der Linker zwischen zwei Gruppen, Molekülen oder anderen Bestandteilen positioniert oder wird von diesen flankiert und ist mit diesen über eine kovalente Bindung verbunden, wodurch die beiden miteinander verbunden werden. In einigen Ausführungsformen ist der Linker eine Aminosäure oder eine Vielzahl von Aminosäuren (z. B. ein Peptid oder Protein). In einigen Ausführungsformen ist der Linker ein organisches Molekül, eine Gruppe, ein Polymer oder eine chemische Einheit. In einigen Ausführungsformen ist der Linker 5-100 Aminosäuren lang, zum Beispiel 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 30-35, 35-40, 40-45, 45-50, 50-60, 60-70, 70-80, 80-90, 90-100, 100-150 oder 150-200 Aminosäuren lang. Längere oder kürzere Linker sind ebenfalls denkbar.
  • Bei dem Linker kann es sich um eine einfache kovalente Bindung oder um einen polymeren Linker mit vielen Atomen Länge handeln. In bestimmten Ausführungsformen ist der Linker ein Polypeptid oder basiert auf Aminosäuren. In anderen Ausführungsformen ist der Linker nicht peptidartig. In bestimmten Ausführungsformen ist der Linker eine kovalente Bindung (z. B. eine Kohlenstoff-Kohlenstoff-Bindung, Disulfidbindung, Kohlenstoff-Heteroatom-Bindung usw.). In bestimmten Ausführungsformen ist der Linker eine Kohlenstoff-Stickstoff-Bindung oder eine Amidbindung. In bestimmten Ausführungsformen ist der Linker ein cyclischer oder acyclischer, substituierter oder unsubstituierter, verzweigter oder unverzweigter aliphatischer oder heteroaliphatischer Linker. In bestimmten Ausführungsformen ist der Linker ein Polymer (z. B. Polyethylen, Polyethylenglykol, Polyamid, Polyester usw.). In bestimmten Ausführungsformen umfasst der Linker ein Monomer, Dimer oder Polymer der Aminoalkansäure. In bestimmten Ausführungsformen umfasst der Linker eine Aminoalkansäure (z. B. Glycin, Ethansäure, Alanin, Beta-Alanin, 3-Aminopropansäure, 4-Aminobutansäure, 5-Pentansäure usw.). In bestimmten Ausführungsformen umfasst der Linker ein Monomer, Dimer oder Polymer der Aminohexansäure (Ahx). In bestimmten Ausführungsformen basiert der Linker auf einer carbocyclischen Einheit (z. B. Cyclopentan, Cyclohexan). In anderen Ausführungsformen umfasst der Linker eine Polyethylenglykol-Einheit (PEG). In anderen Ausführungsformen umfasst der Linker Aminosäuren. In bestimmten Ausführungsformen umfasst der Linker ein Peptid. In bestimmten Ausführungsformen umfasst der Linker eine Aryl- oder Heteroarylgruppe. In bestimmten Ausführungsformen basiert der Linker auf einem Phenylring. Der Linker kann funktionalisierte Reste einschließen, um die Bindung eines Nukleophils (z. B. Thiol, Amino) aus dem Peptid an den Linker zu erleichtern. Jedes Elektrophil kann als Teil des Linkers verwendet werden. Beispielhafte Elektrophile schließen, ohne darauf beschränkt zu sein, aktivierte Ester, aktivierte Amide, Michael-Akzeptoren, Alkylhalogenide, Arylhalogenide, Acylhalogenide und Isothiocyanate ein.
  • In einigen anderen Ausführungsformen umfasst der Linker die Aminosäuresequenz (GGGGS)n (SEQ ID NO: 165), (G)n (SEQ ID NO: 166), (EAAAK)n (SEQ ID NO: 167), (GGS)n (SEQ ID NO: 168), (SGGS)n (SEQ ID NO: 169), (XP)n (SEQ ID NO: 170), oder eine beliebige Kombination davon, wobei n unabhängig eine ganze Zahl zwischen 1 und 30 ist, und wobei X eine beliebige Aminosäure ist. In einigen Ausführungsformen umfasst der Linker die Aminosäuresequenz (GGS)N (SEQ ID NO: 176), wobei n 1, 3, oder 7 ist. In einigen Ausführungsformen umfasst der Linker die Aminosäuresequenz SGSETPGTSESATPES (SEQ ID NO: 171). In einigen Ausführungsformen umfasst der Linker die Aminosäuresequenz SGGSSGGSSGSETPGTSESATPESSGGSSGGS (SEQ ID NO: 172). In einigen Ausführungsformen umfasst der Linker die Aminosäuresequenz SGGSGGSGGS (SEQ ID NO: 173). In einigen Ausführungsformen umfasst der Linker die Aminosäuresequenz SGGS (SEQ ID NO: 174). In einigen Ausführungsformen umfasst der Linker die Aminosäuresequenz
  •  SGGSSGGSSGSETPGTSESATPESAGSYPYDVPDYAGSAAPAAKKKKLDGSGSGGSSGGS
     (SEQ ID NO: 175, 60AA).
  • In bestimmten Ausführungsformen können Linker verwendet werden, um eines der Peptide oder Peptiddomänen oder -einheiten der Erfindung zu verbinden (z. B. ein napDNAbp, das an eine reverse Transkriptase gebunden oder mit dieser fusioniert ist).
  • Wie vorstehend definiert, bezieht sich der hierin verwendete Begriff „Linker“ auf eine chemische Gruppe oder ein Molekül, das zwei Moleküle oder Einheiten miteinander verbindet, z. B. eine Bindungsdomäne und eine Spaltungsdomäne einer Nuklease. In einigen Ausführungsformen verbindet ein Linker eine gRNA-Bindungsdomäne einer RNAprogrammierbaren Nuklease und die katalytische Domäne einer Rekombinase. In einigen Ausführungsformen verbindet ein Linker ein dCas9 und eine reverse Transkriptase. In der Regel ist der Linker zwischen zwei Gruppen, Molekülen oder anderen Bestandteilen positioniert oder wird von diesen flankiert und ist mit diesen über eine kovalente Bindung verbunden, wodurch die beiden miteinander verbunden werden. In einigen Ausführungsformen ist der Linker eine Aminosäure oder eine Vielzahl von Aminosäuren (z. B. ein Peptid oder Protein). In einigen Ausführungsformen ist der Linker ein organisches Molekül, eine Gruppe, ein Polymer oder eine chemische Einheit. In einigen Ausführungsformen ist der Linker 5-100 Aminosäuren lang, zum Beispiel 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 30-35, 35-40, 40-45, 45-50, 50-60, 60-70, 70-80, 80-90, 90-100, 100-150 oder 150-200 Aminosäuren lang. Längere oder kürzere Linker sind ebenfalls denkbar.
  • Bei dem Linker kann es sich um eine einfache kovalente Bindung oder um einen polymeren Linker mit vielen Atomen Länge handeln. In bestimmten Ausführungsformen ist der Linker ein Polypeptid oder basiert auf Aminosäuren. In anderen Ausführungsformen ist der Linker nicht peptidartig. In bestimmten Ausführungsformen ist der Linker eine kovalente Bindung (z. B. eine Kohlenstoff-Kohlenstoff-Bindung, Disulfidbindung, Kohlenstoff-Heteroatom-Bindung usw.). In bestimmten Ausführungsformen ist der Linker eine Kohlenstoff-Stickstoff-Bindung oder eine Amidbindung. In bestimmten Ausführungsformen ist der Linker ein cyclischer oder acyclischer, substituierter oder unsubstituierter, verzweigter oder unverzweigter aliphatischer oder heteroaliphatischer Linker. In bestimmten Ausführungsformen ist der Linker ein Polymer (z. B. Polyethylen, Polyethylenglykol, Polyamid, Polyester usw.). In bestimmten Ausführungsformen umfasst der Linker ein Monomer, Dimer oder Polymer der Aminoalkansäure. In bestimmten Ausführungsformen umfasst der Linker eine Aminoalkansäure (z. B. Glycin, Ethansäure, Alanin, Beta-Alanin, 3-Aminopropansäure, 4-Aminobutansäure, 5-Pentansäure usw.). In bestimmten Ausführungsformen umfasst der Linker ein Monomer, Dimer oder Polymer von AminoHEXAnoinsäure (Ahx). In bestimmten Ausführungsformen basiert der Linker auf einer carbocyclischen Einheit (z. B. Cyclopentan, CycloHEXAne). In anderen Ausführungsformen umfasst der Linker eine Polyethylenglykol-Einheit (PEG). In anderen Ausführungsformen umfasst der Linker Aminosäuren. In bestimmten Ausführungsformen umfasst der Linker ein Peptid. In bestimmten Ausführungsformen umfasst der Linker eine Aryl- oder Heteroarylgruppe. In bestimmten Ausführungsformen basiert der Linker auf einem Phenylring. Der Linker kann funktionalisierte Reste einschließen, um die Bindung eines Nukleophils (z. B. Thiol, Amino) aus dem Peptid an den Linker zu erleichtern. Jedes Elektrophil kann als Teil des Linkers verwendet werden. Beispielhafte Elektrophile schließen, ohne darauf beschränkt zu sein, aktivierte Ester, aktivierte Amide, Michael-Akzeptoren, Alkylhalogenide, Arylhalogenide, Acylhalogenide und Isothiocyanate ein.
  • In einigen anderen Ausführungsformen umfasst der Linker die Aminosäuresequenz (GGGGS)n (SEQ ID NO: 165), (G)n (SEQ ID NO: 166), (EAAAK)n (SEQ ID NO: 167), (GGS)n (SEQ ID NO: 168), (SGGS)n (SEQ ID NO: 169), (XP)n (SEQ ID NO: 170), oder eine beliebige Kombination davon, wobei n unabhängig eine ganze Zahl zwischen 1 und 30 ist, und wobei X eine beliebige Aminosäure ist. In einigen Ausführungsformen umfasst der Linker die Aminosäuresequenz (GGS)N (SEQ ID NO: 176), wobei n 1, 3, oder 7 ist. In einigen Ausführungsformen umfasst der Linker die Aminosäuresequenz SGSETPGTSESATPES (SEQ ID NO: 171). In einigen Ausführungsformen umfasst der Linker die Aminosäuresequenz SGGSSGGSSGSETPGTSESATPESSGGSSGGS (SEQ ID NO: 172). In einigen Ausführungsformen umfasst der Linker die Aminosäuresequenz SGGSGGSGGS (SEQ ID NO: 173). In einigen Ausführungsformen umfasst der Linker die Aminosäuresequenz SGGS (SEQ ID NO: 174).
  • Insbesondere die folgenden Linker können in verschiedenen Ausführungsformen verwendet werden, um Prime-Editor-Domänen miteinander zu verbinden:
  •  GGS (SEQ ID NO: 767);
     GGSGGS (SEQ ID NO: 768);
     GGSGGSGGS (SEQ ID NO: 769);
     SGGSSGGSSGSETPGTSESATPESSGGSSGGSS (SEQ ID NO: 127);
     SGSETPGTSESATPES (SEQ ID NO: 171);
     SGGSSGGSSGSETPGTSESATPESAGSYPYDVPDYAGSAAPAAKKKKLDGSGSGGSSGG
     S (SEQ ID NO: 175).
  • B. Kernlokalisierunsssequenz (NLS)
  • In verschiedenen Ausführungsformen können die PE-Fusionsproteine eine oder mehrere Kernlokalisierungssequenzen (NLS) umfassen, welche die Translokation eines Proteins in den Zellkern unterstützen. Solche Sequenzen sind aus dem Stand der Technik bekannt und können die folgenden Beispiele einschließen:
    BESCHREIBUNG SEQUENZ SEQ ID NO:
    NLS VON SV40 LARGE T-AG PKKKRKV SEQ ID NO: 16
    NLS MKRTADGSEFESPKKKRKV SEQ ID NO: 124
    NLS MDSLLMNRRKFLYQFKNVRWAKGRRETY LC SEQ ID NO: 17
    NLS VON NUCLEOPLASMI N AVKRPAATKKAGQAKKKKLD SEQ ID NO: 190
    NLS VON EGL-13 MSRRRKANPTKLSENAKKLAKEVEN SEQ ID NO: 191
    NLS VON C-MYC PAAKRVKLD SEQ ID NO: 192
    NLS VOM TUS-PROTEIN KLKIKRPVK SEQ ID NO: 193
    NLS VON POLYOMA LARGE T-AG VSRKRPRP SEQ ID NO: 194
    NLS VON HEPATITIS-D-VIRUS-ANTIGEN EGAPPAKRAR SEQ ID NO: 195
    NLS VON MURINE P53 PPQPKKKPLDGE SEQ ID NO: 196
    NLS VON PE1 UND PE2 SGGSKRTADGSEFEPKKKRKV SEQ ID NO: 133
  • Die vorstehenden NLS-Beispiele sind nicht einschränkend. Die PE-Fusionsproteine können jede bekannte NLS-Sequenz umfassen, einschließlich der in Cokol et al. „Finding nuclear localization signals“, EMBO Rep., 2000, 1(5): 411-415 und Freitas et al. „Mechanisms and Signals for the Nuclear Import of Proteins“, Current Genomics, 2009, 10(8): 550-7 beschriebenen, die hierin durch Bezugnahme einbezogen werden.
  • In verschiedenen Ausführungsformen umfassen die hierin offenbarten Prime Editors und Konstrukte, die für die Prime Editors kodieren, außerdem ein oder mehrere, vorzugsweise mindestens zwei Kernlokalisierungssignale. In bestimmten Ausführungsformen umfassen die Prime Editors mindestens zwei NLSs. In Ausführungsformen mit mindestens zwei NLSs können die NLSs die gleichen NLSs sein oder sie können unterschiedliche NLSs sein. Außerdem können die NLS als Teil eines Fusionsproteins mit den verbleibenden Teilen der Prime Editors exprimiert werden. In einigen Ausführungsformen sind eine oder mehrere der NLSs bipartite NLSs („bpNLS“. In bestimmten Ausführungsformen umfassen die offenbarten Fusionsproteine zwei bipartite NLSs. In einigen Ausführungsformen umfassen die offenbarten Fusionsproteine mehr als zwei bipartite NLS.
  • Der Ort der NLS-Fusion kann am N-Terminus, am C-Terminus oder innerhalb einer Sequenz eines Prime Editors liegen (z. B. eingefügt zwischen der kodierten napDNAbp-Komponente (z. B. Cas9) und einer Polymerase-Domäne (z. B. einer Reverse-Transkriptase-Domäne).
  • Bei den NLS kann es sich um jede bekannte NLS-Sequenz handeln, die aus dem Stand der Technik bekannt ist. Bei den NLS kann es sich auch um beliebige, in der Zukunft entdeckte NLS für die Kernlokalisierung handeln. Bei den NLS kann es sich auch um jede natürlich vorkommende NLS oder eine nicht natürlich vorkommende NLS (z. B. eine NLS mit einer oder mehreren gewünschten Mutationen) handeln.
  • Der Begriff „Kernlokalisierungssequenz“ oder „NLS“ bezieht sich auf eine Aminosäuresequenz, die den Import eines Proteins in den Zellkern fördert, z. B. durch Kerntransport. Kernlokalisierungssequenzen sind aus dem Stand der Technik bekannt und für den Fachmann offensichtlich. NLS-Sequenzen werden zum Beispiel in der internationalen PCT-Anmeldung PCT/EP2000/011690 von Plank et al. beschrieben, die am 23. November 2000 eingereicht und am 31. Mai 2001 als WO/2001/038547 veröffentlicht wurde und deren Inhalt hierin durch Bezugnahme einbezogen wird. In einigen Ausführungsformen umfasst eine NLS die Aminosäuresequenz PKKKRKV (SEQ ID NO: 16), MDSLLMNRRKFLYQFKNVRWAKGRRETYLC (SEQ ID NO: 17), KRTADGSEFESPKKKRKV (SEQ ID NO: 3864), oder KRTADGSEFEPKKKRKV (SEQ ID NO: 13). In einigen Ausführungsformen umfasst NLS die Aminosäuresequenzen NLSKRPAAIKKAGQAKKKK (SEQ ID NO: 3865), PAAKRVKLD (SEQ ID NO: 192), RQRRNELKRSF (SEQ ID NO: 3866), NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY (SEQ ID NO: 3867).
  • In einem Gesichtspunkt der Offenbarung kann ein Prime Editor mit einem oder mehreren Kernlokalisierungssignalen (NLS), vorzugsweise mit mindestens zwei NLS, modifiziert werden. In bestimmten Ausführungsformen sind die Prime Editors mit zwei oder mehr NLS modifiziert. Die Offenbarung sieht die Verwendung jedes Kernlokalisierungssignals vor, das zum Zeitpunkt der Offenbarung aus dem Stand der Technik bekannt ist, oder jedes Kernlokalisierungssignal, das nach dem Zeitpunkt der Einreichung der vorliegenden Anmeldung identifiziert oder auf andere Weise im Stand der Technik verfügbar gemacht wird. Ein repräsentatives Kernlokalisierungssignal ist eine Peptidsequenz, die das Protein in den Kern der Zelle lenkt, in der die Sequenz exprimiert wird. Ein Kernlokalisierungssignal ist überwiegend basisch, kann fast überall in der Aminosäuresequenz eines Proteins positioniert werden und umfasst im Allgemeinen eine kurze Sequenz von vier Aminosäuren (Autieri & Agrawal, (1998) J. Biol. Chem. 273: 14731-37, hierin durch Bezugnahme einbezogen) bis acht Aminosäuren und ist typischerweise reich an Lysin- und Argininresten (Magin et al., (2000) Virology 274: 11-16, hierin durch Bezugnahme einbezogen). Kernlokalisierungssignale umfassen häufig Prolinreste. Es wurden eine Vielzahl von Kernlokalisierungssignalen identifiziert, die für den Transport biologischer Moleküle aus dem Zytoplasma in den Zellkern verwendet wurden. Siehe, z. B., Tinland et al., (1992) Proc. Natl. Acad. Sci. U.S.A. 89:7442-46; Moede et al., (1999) FEBS Lett. 461:229-34, hierin durch Bezugnahme einbezogen. Derzeit geht man davon aus, dass an der Translokation Kemporenproteine beteiligt sind.
  • Die meisten NLS lassen sich in drei allgemeine Gruppen einteilen: (i) ein monopartites NLS, wie das NLS des SV40 Large T-Antigens (PKKKRKV (SEQ ID NO: 16)); (ii) ein zweiteiliges Motiv, das aus zwei Basisdomänen besteht, die durch eine variable Anzahl von Spacer-Aminosäuren getrennt sind, und das durch das Xenopus-Nukleoplasmin NLS (KRXXXXXXXXXXKKKL (SEQ ID NO: 3868)); und (iii) nicht-kanonische Sequenzen wie M9 des hnRNP Al-Proteins, das Nukleoprotein NLS des Influenzavirus und das Hefe-Gal4-Protein NLS (Dingwall und Laskey 1991).
  • Kernlokalisierungssignale treten an verschiedenen Stellen in den Aminosäuresequenzen von Proteinen auf. NLS wurden am N-Terminus, am C-Terminus und in der zentralen Region von Proteinen identifiziert. Daher bietet die Offenbarung Prime Editors, die mit einem oder mehreren NLS am C-Terminus, am N-Terminus sowie im inneren Bereich des Prime Editors modifiziert werden können. Die Reste einer längeren Sequenz, die nicht als NLS-Reste fungieren, sollten so ausgewählt werden, dass sie das eigentliche Kernlokalisierungssignal nicht stören, zum Beispiel tonisch oder sterisch. Obwohl es also keine strengen Grenzen für die Zusammensetzung einer NLS-umfassenden Sequenz gibt, kann eine solche Sequenz in der Praxis in Länge und Zusammensetzung funktionell begrenzt sein.
  • Im Rahmen der vorliegenden Offenbarung sind alle geeigneten Mittel denkbar, um einen Prime Editor so zu modifizieren, dass er eine oder mehrere NLS einschließt. In einem Gesichtspunkt können die Prime Editors so manipuliert werden, dass sie ein Prime Editor-Protein exprimieren, das an seinem N-Terminus oder seinem C-Terminus (oder an beiden) translational mit einem oder mehreren NLSs fusioniert ist, d. h. ein Prime Editor-NLS-Fusionskonstrukt bildet. In anderen Ausführungsformen kann die für den Prime Editor kodierende Nukleotidsequenz gentechnisch so verändert werden, dass ein Leseraster, das für einen oder mehrere NLS kodiert, in eine interne Region des kodierten Prime Editors eingebaut wird. Darüber hinaus können die NLS verschiedene Aminosäure-Linker oder Spacer-Regionen einschließen, die zwischen dem Prime Editor und der N-terminalen, C-terminalen oder intern angefügten NLS-Aminosäuresequenz kodiert sind, z. B. in der zentralen Region von Proteinen. Somit sieht die vorliegende Offenbarung auch Nukleotidkonstrukte, Vektoren und Wirtszellen zur Expression von Fusionsproteinen vor, die einen Prime Editor und eine oder mehrere NLS umfassen.
  • Die hierin beschriebenen Prime Editors können auch Kernlokalisierungssignale umfassen, die über einen oder mehrere Linker, z. B. ein polymeres, Aminosäure-, Nukleinsäure-, Polysaccharid-, chemisches oder Nukleinsäure-Linkerelement, mit einem Prime Editor verknüpft sind. Die Linker im Rahmen der Offenbarung sollen keine Einschränkungen haben und können jede geeignete Art von Molekül sein (z. B. Polymer, Aminosäure, Polysaccharid, Nukleinsäure, Lipid oder eine beliebige synthetische chemische Linker-Domäne) und mit dem Prime Editor durch eine geeignete Strategie verbunden werden, welche die Bildung einer Bindung (z. B. kovalente Bindung, Wasserstoffbindung) zwischen dem Prime Editor und dem einen oder den mehreren NLSs bewirkt.
  • C. Flap-Endonukleasen (z. B. FEN1)
  • In verschiedenen Ausführungsformen können die PE-Fusionsproteine eine oder mehrere Flap-Endonukleasen (z. B. FEN1) umfassen, d. h. ein Enzym, das die Entfernung von 5'-Einzelstrang-DNA-Flaps katalysiert. Dabei handelt es sich um natürlich vorkommende Enzyme, welche die Entfernung von 5'-Flaps, die während zellulärer Prozesse, einschließlich der DNA-Replikation, entstehen, verarbeiten. Bei den hierin beschriebenen Prime-Editing-Verfahren können endogen bereitgestellte Flap-Endonukleasen oder solche, die in trans bereitgestellt werden, verwendet werden, um den 5'-Flap der endogenen DNA zu entfernen, der während des Prime Editing an der Target-Stelle gebildet wird. Flap-Endonukleasen sind aus dem Stand der Technik bekannt und können wie in Patel et al. beschrieben gefunden werden, „Flap endonucleases pass 5'-flaps through a flexible arch using a disorder-thread-order mechanism to confer specificity for free 5'-ends,“ Nucleic Acids Research, 2012, 40(10): 4507-4519 und Tsutakawa et al. „Human flap endonuclease structures, DNA double-base flipping, and a unified understanding of the FEN1 superfamily,“ Cell, 2011, 145(2): 198-211 (die hierin jeweils durch Bezugnahme einbezogen werden). Eine beispielhafte Flap-Endonuklease ist FEN1, die durch die folgende Aminosäuresequenz dargestellt werden kann:
    Beschreibung Sequenz SEQ ID NO:
    FEN1 Wildtyp (wt)
    Figure DE112020001339T5_0156
    SEQ ID NONr.: 198
    Figure DE112020001339T5_0157
  • Die Flap-Endonukleasen können auch jede FEN1-Variante, -Mutante oder andere orthologe, homologe oder Variante Flap-Endonuklease einschließen. Nicht einschränkende Beispiele für FEN1-Varianten sind wie folgt:
    Figure DE112020001339T5_0158
    Figure DE112020001339T5_0159
    Figure DE112020001339T5_0160
    Figure DE112020001339T5_0161
  • In verschiedenen Ausführungsformen können die hierin betrachteten Prime Editor-Fusionsproteine eine beliebige Flap-Endonuklease-Variante der vorstehend angegebenen Sequenzen mit einer Aminosäuresequenz einschließen, die mindestens zu etwa 70 %, mindestens zu etwa 80 %, mindestens zu etwa 90 %, mindestens zu etwa 95 %, mindestens zu etwa 96 %, mindestens zu etwa 97 %, mindestens zu etwa 98 %, mindestens zu etwa 99 %, mindestens zu etwa 99,5 % oder mindestens zu etwa 99,9 % mit einer der vorstehend genannten Sequenzen identisch ist.
  • Andere Endonukleasen, die in den vorliegenden Verfahren zur Erleichterung der Entfernung des 5'-Einzelstrang-DNA-Flaps verwendet werden können, schließen ein, sind aber nicht beschränkt auf (1) trex 2, (2) exo1-Endonuklease (z. B. Keijzers et al., Biosci Rep. 2015, 35(3): e00206)
  • Trex 2
  • 3' Three Prime Repair Exonuclease 2 (TREX2) - Mensch
  • Hinterlegungsnummer NM _080701
  •  MSEAPRAETFVFLDLEATGLPSVEPEIAELSLFAVHRSSLENPEHDESGALVLPRVLDKLT
     LCMCPERPFTAKASEITGLSSEGLARCRKAGFDGAVVRTLQAFLSRQAGPICLVAHNGF
     DYDFPLLCAELRRLGARLPRDTVCLDTLPALRGLDRAHSHGTRARGRQGYSLGSLFHRY
     FRAEPSAAHSAEGDVHTLLLIFLHRAAELLAWADEQARGWAHIEPMYLPPDDPSLEA
     (SEQ ID NO: 3865).
  • 3' Three Prime Repair Exonuclease 2 (TREX2) - Maus
  • Hinterlegungsnummer NM_011907
  • MSEPPRAETFVFLDLEATGLPNMDPEIAEISLFAVHRSSLENPERDDSGSLVLPRV
     LDKLTLCMCPERPFTAKASEITGLSSESLMHCGKAGFNGAVVRTLQGFLSRQEGPICLVA
     HNGFDYDFPLLCTELQRLGAHLPQDTVCLDTLPALRGLDRAHSHGTRAQGRKSYSLASL
     FHRYFQAEPSAAHSAEGDVHTLLLIFLHRAPELLAWADEQARSWAHIEPMYVPPDGPSL
     EA (SEQ ID NO: 3866).
  • 3' Three Prime Repair Exonuclease 2 (TREX2) - Ratte
  • Hinterlegungsnummer NM _001107580
  • MSEPLRAETFVFLDLEATGLPNMDPEIAEISLFAVHRSSLENPERDDSGSLVLPRV
     LDKLTLCMCPERPFTAKASEITGLSSEGLMNCRKAAFNDAVVRTLQGFLSRQEGPICLV
     AHNGFDYDFPLLCTELQRLGAHLPRDTVCLDTLPALRGLDRVHSHGTRAQGRKSYSLA
     SLFHRYFQAEPSAAHSAEGDVNTLLLIFLHRAPELLAWADEQARSWAHIEPMYVPPDGP
     SLEA (SEQ ID NO: 3867).
  • ExoI
  • Die menschliche Exonuklease 1 (EXO1) ist an vielen verschiedenen DNA-Stoffwechselprozessen beteiligt, darunter die DNA-Mismatch-Reparatur (MMR), die mikrovermittelte Endverbindung, die homologe Rekombination (HR) und die Replikation. Das menschliche EXO1 gehört zu einer Familie eukaryontischer Nukleasen, Rad2/XPG, die auch FEN1 und GEN1 einschließt. Die Rad2/XPG-Familie ist in der Nuklease-Domäne über alle Spezies hinweg konserviert, vom Phagen bis zum Menschen. Das EXO1-Genprodukt weist sowohl 5'-Exonuklease- als auch 5'-Flap-Aktivität auf. Darüber hinaus enthält EXO1 eine intrinsische 5'-RNase-H-Aktivität. Menschliches EXO1 hat eine hohe Affinität für die Verarbeitung von doppelsträngiger DNA (dsDNA), Nicks, Lücken und Pseudo-Y-Strukturen und kann Holliday-Verbindungen mit Hilfe der ihm eigenen Flap-Aktivität auflösen. Menschliches EXO1 ist an der MMR beteiligt und enthält konservierte Bindungsdomänen, die direkt mit MLH1 und MSH2 interagieren. Die nukleolytische Aktivität von EXO1 wird durch PCNA, MutSα (MSH2/MSH6-Komplex), 14-3-3, MRN und den 9-1-1-Komplex positiv stimuliert.
  • Exonuklease 1 (EXO1) Hinterlegungsnummer NM_003686 (Homo sapiens Exonuklease 1 (EXO1), Transkriptvariante 3) - Isoform A
  • MGIQGLLQFIKEASEPIHVRKYKGQWAVDTYCWLHKGAIACAEKLAKGEPTDRYVGF
     CMKFVNMLLSHGIKPILVFDGCTLPSKKEVERSRRERRQANLLKGKQLLREGKVSEARE
     CFTRSINITHAMAHKVIKAARSQGVDCLVAPYEADAQLAYLNKAGIVQAIITEDSDLLAF
     GCKKVILKMDQFGNGLEIDQARLGMCRQLGDVFTEEKFRYMCILSGCDYLSSLRGIGLA
     KACKVLRLANNPDIVKVIKKIGHYLKMNITVPEDYINGFIRANNTFLYQLVFDPIKRKLIP
     LNAYEDDVDPETLSYAGQYVDDSIALQIALGNKDINTFEQIDDYNPDTAMPAHSRSHSW
     DDKTCQKSANVSSIWHRNYSPRPESGTVSDAPQLKENPSTVGVERVISTKGLNLPRKSSI
     VKRPRSAELSEDDLLSQYSLSFTKKTKKNSSEGNKSLSFSEVFVPDLVNGPTNKKSVSTP
     PRTRNKFATFLQRKNEESGAWVPGTRSRFFCSSDSTDCVSNKVSIQPLDETAVTDKENN
     LHESEYGDQEGKRLVDTDVARNSSDDIPNNHIPGDHIPDKATVFTDEESYSFESSKFTRTI
     SPPTLGTLRSCFSWSGGLGDFSRTPSPSPSTALQQFRRKSDSPTSLPENNMSDVSQLKSEE
     SSDDESHPLREEACSSQSQESGEFSLQSSNASKLSQCSSKDSDSEESDCNIKLLDSQSDQT
     SKLRLSHFSKKDTPLRNKVPGLYKSSSADSLSTTKIKPLGPARASGLSKKPASIQKRKHH
     NAENKPGLQIKLNELWKNFGFKKF (SEQ ID NO: 3868).
  • Exonuklease 1 (EXO1) Hinterlegungsnummer NM_006027 (Homo sapiens Exonuklease 1 (EXO1), Transkriptvariante 3) - Isoform B
  • MGIQGLLQFIKEASEPIHVRKYKGQWAVDTYCWLHKGAIACAEKLAKGEPTDR
     YVGFCMKFVNMLLSHGIKPILVFDGCTLPSKKEVERSRRERRQANLLKGKQLLREGKVS
     EARECFTRSINITHAMAHKVIKAARSQGVDCLVAPYEADAQLAYLNKAGIVQAIITEDSD
     LLAFGCKKVILKMDQFGNGLEIDQARLGMCRQLGDVFTEEKFRYMCILSGCDYLSSLRG
     IGLAKACKVLRLANNPDIVKVIKKIGHYLKMNITVPEDYINGFIRANNTFLYQLVFDPIKR
     KLIPLNAYEDDVDPETLSYAGQYVDDSIALQIALGNKDINTFEQIDDYNPDTAMPAHSRS
     HSWDDKTCQKSANVSSIWHRNYSPRPESGTVSDAPQLKENPSTVGVERVISTKGLNLPR
     KSSIVKRPRSAELSEDDLLSQYSLSFTKKTKKNSSEGNKSLSFSEVFVPDLVNGPTNKKSV
     STPPRTRNKFATFLQRKNEESGAVVVPGTRSRFFCSSDSTDCVSNKVSIQPLDETAVTDK
     ENNLHESEYGDQEGKRLVDTDVARNSSDDIPNNHIPGDHIPDKATVFTDEESYSFESSKF
     TRTISPPTLGTLRSCFSWSGGLGDFSRTPSPSPSTALQQFRRKSDSPTSLPENNMSDVSQL
     KSEESSDDESHPLREEACSSQSQESGEFSLQSSNASKLSQCSSKDSDSEESDCNIKLLDSQS
     DQTSKLRLSHFSKKDTPLRNKVPGLYKSSSADSLSTTKIKPLGPARASGLSKKPASIQKR
     KHHNAENKPGLQIKLNELWKNFGFKKDSEKLPPCKKPLSPVRDNIQLTPEAEEDIFNKPE
     CGRVQRAIFQ (SEQ ID NO: 3869).
  • Exonuklease 1 (EXO1) Hinterlegungsnummer NM_001319224 (Homo sapiens Exonuklease 1 (EXO1), Transkriptvariante 4) - Isoform C
  • MGIQGLLQFIKEASEPIHVRKYKGQWAVDTYCWLHKGAIACAEKLAKGEPTDR
     YVGFCMKFVNMLLSHGIKPILVFDGCTLPSKKEVERSRRERRQANLLKGKQLLREGKVS
     EARECFTRSINITHAMAHKVIKAARSQGVDCLVAPYEADAQLAYLNKAGIVQAIITEDSD
     LLAFGCKKVILKMDQFGNGLEIDQARLGMCRQLGDVFTEEKFRYMCILSGCDYLSSLRG
     IGLAKACKVLRLANNPDIVKVIKKIGHYLKMNITVPEDYINGFIRANNTFLYQLVFDPIKR
     KLIPLNAYEDDVDPETLSYAGQYVDDSIALQIALGNKDINTFEQIDDYNPDTAMPAHSRS
     HSWDDKTCQKSANVSSIWHRNYSPRPESGTVSDAPQLKENPSTVGVERVISTKGLNLPR
     KSSIVKRPRSELSEDDLLSQYSLSFTKKTKKNSSEGNKSLSFSEVFVPDLVNGPTNKKSVS
     TPPRTRNKFATFLQRKNEESGAVVVPGTRSRFFCSSDSTDCVSNKVSIQPLDETAVTDKE
     NNLHESEYGDQEGKRLVDTDVARNSSDDIPNNHIPGDHIPDKATVFTDEESYSFESSKFT
     RTISPPTLGTLRSCFSWSGGLGDFSRTPSPSPSTALQQFRRKSDSPTSLPENNMSDVSQLK
     SEESSDDESHPLREEACSSQSQESGEFSLQSSNASKLSQCSSKDSDSEESDCNIKLLDSQSD
     QTSKLRLSHFSKKDTPLRNKVPGLYKSSSADSLSTTKIKPLGPARASGLSKKPASIQKRK
     HHNAENKPGLQIKLNELWKNFGFKKDSEKLPPCKKPLSPVRDNIQLTPEAEEDIFNKPEC
     GRVQRAIFQ (SEQ ID NO: 3870).
  • D. Inteine und Split-Inteine
  • Es versteht sich, dass es in einigen Ausführungsformen (z. B. Verabreichung eines Prime Editors in vivo unter Verwendung von AAV-Partikeln) vorteilhaft sein kann, ein Polypeptid (z. B. eine Deaminase oder ein napDNAbp) oder ein Fusionsprotein (z. B. einen Prime Editor) in eine N-terminale Hälfte und eine C-terminale Hälfte aufzuspalten, sie getrennt zu verabreichen und dann ihre Kolokalisierung zuzulassen, um das vollständige Protein (bzw. Fusionsprotein) innerhalb der Zelle neu zu bilden. Getrennte Hälften eines Proteins oder eines Fusionsproteins können jeweils einen Split-Intein-Tag umfassen, um die Neubildung des vollständigen Proteins oder Fusionsproteins durch den Mechanismus des Protein-Trans-Spleißens zu erleichtern.
  • Das Protein-Trans-Spleißen, das durch Split-Inteine katalysiert wird, stellt ein rein enzymatisches Verfahren zur Proteinbindung dar. Ein Split-Intein ist im Wesentlichen ein zusammenhängendes Intein (z. B. ein Mini-Intein), das in zwei Teile, das N-Intein und das C-Intein, aufgespalten wird. Das N-Intein und das C-Intein eines Split-Inteins können sich nicht-kovalent verbinden, um ein aktives Intein zu bilden und die Spleißreaktion im Wesentlichen auf die gleiche Weise zu katalysieren wie ein zusammenhängendes Intein. Split-Inteine wurden sowohl in der Natur gefunden als auch in Laboratorien hergestellt. Der hierin verwendete Begriff „Split-Intein“ bezieht sich auf jedes Intein, bei dem eine oder mehrere Peptidbindungen zwischen den N-terminalen und C-terminalen Aminosäuresequenzen gebrochen sind, sodass die N-terminalen und C-terminalen Sequenzen zu separaten Molekülen werden, die sich nicht-kovalent reassoziieren oder zu einem Intein rekonstituieren können, das für Trans-Spleißreaktionen funktionell ist. Jedes katalytisch aktive Intein oder Fragment davon kann verwendet werden, um ein Split-Intein zur Verwendung in den erfindungsgemäßen Verfahren abzuleiten. In einem Gesichtspunkt kann das Split-Intein zum Beispiel von einem eukaryotischen Intein abgeleitet werden. In einem anderen Gesichtspunkt kann das Split-Intein von einem bakteriellen Intein abgeleitet werden. In einem anderen Gesichtspunkt kann das Split-Intein von einem Archaeen-Intein abgeleitet werden. Vorzugsweise besitzt das so abgeleitete Split-Intein nur die Aminosäuresequenzen, die für die Katalyse von Trans-Spleißenreaktionen wesentlich sind.
  • Der hierin verwendete Begriff „N-terminales Split-Intein (In)“ bezieht sich auf jede Intein-Sequenz, die eine N-terminale Aminosäuresequenz umfasst, die für Trans-Spleißenreaktionen funktional ist. Ein In umfasst also auch eine Sequenz, die beim Trans-Spleißen ausgespleißt wird. Ein In kann eine Sequenz umfassen, die eine Modifikation des N-terminalen Teils einer natürlich vorkommenden Intein-Sequenz ist. Zum Beispiel kann ein In zusätzliche Aminosäurereste und/oder mutierte Reste umfassen, solange die Aufnahme dieser zusätzlichen und/oder mutierten Reste das In beim Trans-Spleißen nicht funktionsunfähig macht. Vorzugsweise verbessert oder steigert die Aufnahme der zusätzlichen und/oder mutierten Reste die Trans-Spleißen-Aktivität des In.
  • Der hierin verwendete Begriff „C-terminales Split-Intein (Ic)“ bezieht sich auf jede Intein-Sequenz, die eine C-terminale Aminosäuresequenz umfasst, die für Trans-Spleißenreaktionen funktional ist. In einem Gesichtspunkt umfasst das Ic 4 bis 7 zusammenhängende Aminosäurereste, von denen mindestens 4 Aminosäuren aus dem letzten β-Strang des Inteins stammen, von dem es abgeleitet wurde. Ein Ic umfasst also auch eine Sequenz, die beim Trans-Spleißen ausgespleißt wird. Ein Ic kann eine Sequenz umfassen, die eine Modifikation des C-terminalen Teils einer natürlich vorkommenden Intein-Sequenz ist. Zum Beispiel kann ein Ic zusätzliche Aminosäurereste und/oder mutierte Reste umfassen, solange die Aufnahme dieser zusätzlichen und/oder mutierten Reste das In beim Trans-Spleißen nicht funktionsunfähig macht. Vorzugsweise verbessert oder steigert die Aufnahme der zusätzlichen und/oder mutierten Reste die Trans-Spleißen-Aktivität des Ic.
  • In einigen Ausführungsformen der Erfindung kann ein an ein Ic oder ein In gebundenes Peptid eine zusätzliche chemische Einheit umfassen, die unter anderem Fluoreszenzgruppen, Biotin, Polyethylenglykol (PEG), Aminosäureanaloga, unnatürliche Aminosäuren, Phosphatgruppen, Glycosylgruppen, Radioisotopenmarker und pharmazeutische Moleküle einschließt. In anderen Ausführungsformen kann ein an ein Ic gebundenes Peptid eine oder mehrere chemisch reaktive Gruppen einschließen, darunter Keton, Aldehyd, Cys-Reste und Lys-Reste. Das N-Intein und das C-Intein eines Split-Inteins können sich nicht-kovalent verbinden, um ein aktives Intein zu bilden und die Spleißreaktion zu katalysieren, wenn ein „Intein-Spleiß-Polypeptid (ISP)“ vorhanden ist. Der hierin verwendete Begriff „Intein-Spleiß-Polypeptid (ISP)“ bezieht sich auf den Teil der Aminosäuresequenz eines Split-Inteins, der übrig bleibt, wenn das Ic, In oder beide aus dem Split-Intein entfernt werden. In bestimmten Ausführungsformen umfasst das In das ISP. In einer anderen Ausführungsform umfasst das Ic das ISP. In einer weiteren Ausführungsform ist das ISP ein separates Peptid, das weder an In noch an Ic kovalent gebunden ist.
  • Split-Inteine können aus zusammenhängenden Inteinen gebildet werden, indem eine oder mehrere Spaltstellen in die unstrukturierte Schleife oder die dazwischen liegende Aminosäuresequenz zwischen den 12 konservierten Beta-Strängen in der Struktur der Mini-Inteine eingebaut werden. Eine gewisse Flexibilität bei der Position der Spaltstelle innerhalb der Regionen zwischen den Beta-Strängen ist möglich, vorausgesetzt, dass die Struktur des Inteins, insbesondere die strukturierten Beta-Stränge, durch die Schaffung der Spaltstelle nicht so weit gestört wird, dass die Protein-Spleißaktivität verloren geht.
  • Beim Protein-Trans-Spleißen besteht ein Vorläuferprotein aus einem N-Extein-Teil, auf den das N-Intein folgt, ein anderes Vorläuferprotein besteht aus dem C-Intein, auf das ein C-Extein-Teil folgt, und eine Trans-Spleiß-Reaktion (die von den N- und C-Inteinen gemeinsam katalysiert wird) schneidet die beiden Intein-Sequenzen aus und verbindet die beiden Extein-Sequenzen mit einer Peptidbindung. Da es sich beim Protein-Trans-Spleißen um eine enzymatische Reaktion handelt, kann es mit sehr niedrigen (z. B. mikromolaren) Proteinkonzentrationen arbeiten und unter physiologischen Bedingungen durchgeführt werden.
  • Beispielhafte Sequenzen sind wie folgt:
    Figure DE112020001339T5_0162
    Figure DE112020001339T5_0163
    Figure DE112020001339T5_0164
  • Obwohl Inteine am häufigsten als zusammenhängende Domäne vorkommen, gibt es auch einige in einer natürlich gespaltenen Form. In diesem Fall werden die beiden Fragmente als getrennte Polypeptide exprimiert und müssen sich vor dem Spleißen zusammenschließen, das so genannte Protein-Trans-Spleißen.
  • Ein beispielhaftes Split-Intein ist das Ssp-DnaE-Intein, das zwei Untereinheiten umfasst, nämlich DnaE-N und DnaE-C. Die beiden unterschiedlichen Untereinheiten werden von separaten Genen kodiert, nämlich dnaE-n und dnaE-c, die für die Untereinheiten DnaE-N bzw. DnaE-C kodieren. DnaE ist ein natürlich vorkommendes Split-Intein in Synechocytis sp. PCC6803 und ist in der Lage, das Trans-Spleißen von zwei separaten Proteinen zu steuern, die jeweils eine Fusion mit entweder DnaE-N oder DnaE-C umfassen.
  • Weitere natürlich vorkommende oder künstlich hergestellte Split-Intein-Sequenzen sind aus dem Stand der Technik bekannt oder können aus den hierin beschriebenen oder aus dem Stand der Technik verfügbaren Ganz-Intein-Sequenzen hergestellt werden. Beispiele für Split-Intein-Sequenzen finden sich in Stevens et al. „A promiscuous split intein with expanded protein engineering applications“, PNAS, 2017, Vol. 114: 8538-8543; Iwai et al. „Highly efficient protein trans-splicing by a naturally split DnaE intein from Nostc punctiforme“, FEBS Lett, 580: 1853-1858, die hierin jeweils durch Bezugnahme einbezogen werden. Zusätzliche Split-Intein-Sequenzen finden sich beispielsweise in WO 2013/045632 , WO 2014/055782 , WO 2016/069774 und EP2877490 , deren Inhalt hierin durch Bezugnahme aufgenommen wird.
  • Darüber hinaus ist das Protein-Trans-Spleißen in vivo und in vitro beschrieben worden (Shingledecker, et al., Gene 207:187 (1998), Southworth, et al., EMBO J. 17:918 (1998); Mills, et al., Proc. Natl. Acad. Sci. USA, 95:3543-3548 (1998); Lew, et al., J. Biol. Chem., 273:15887-15890 (1998); Wu, et al., Biochim. Biophys. Acta 35732:1 (1998b), Yamazaki, et al., J. Am. Chem. Soc. 120:5591 (1998), Evans, et al., J. Biol. Chem. 275:9091 (2000); Otomo, et al., Biochemistry 38:16040-16044 (1999); Otomo, et al., J. Biolmol. NMR 14:105-114 (1999); Scott, et al., Proc. Natl. Acad. Sci. USA 96:13638-13643 (1999)) und bietet die Möglichkeit, ein Protein in zwei inaktiven Fragmenten zu exprimieren, die anschließend durch Ligation ein funktionelles Produkt bilden, z. B. wie in 66 und 67 im Hinblick auf die Bildung eines vollständigen PE-Fusionsproteins aus zwei getrennt exprimierten Hälften gezeigt.
  • E. RNA-Protein-Interaktionsdomäne
  • In verschiedenen Ausführungsformen können zwei getrennte Proteindomänen (z. B. eine Cas9-Domäne und eine Polymerase-Domäne) miteinander kolokalisiert werden, um einen funktionellen Komplex zu bilden (ähnlich der Funktion eines Fusionsproteins, das die beiden getrennten Proteindomänen umfasst), indem ein „RNA-Protein-Rekrutierungssystem“, wie die „MS2-Tagging-Technik“, verwendet wird. Solche Systeme markieren im Allgemeinen eine Proteindomäne mit einer „RNA-Protein-Interaktionsdomäne“ (auch „RNA-Protein-Rekrutierungsdomäne“ genannt) und die andere mit einem „RNA-bindenden Protein“, das die RNA-Protein-Interaktionsdomäne spezifisch erkennt und daran bindet, z. B. eine spezifische Haarnadelstruktur. Diese Arten von Systemen können zur Kolokalisierung der Domänen eines Prime Editors sowie zur Rekrutierung zusätzlicher Funktionalitäten für einen Prime Editor, wie z. B. einer UGI-Domäne, genutzt werden. In einem Beispiel basiert die MS2-Tagging-Technik auf der natürlichen Wechselwirkung des MS2-Bakteriophagenhüllproteins („MCP“ oder „MS2cp“) mit einer im Genom des Phagen vorhandenen Stammschleifen- oder Haarnadelstruktur, d. h. der „MS2-Haarnadel“. Im Falle der MS2-Haarnadel wird diese vom MS2-Bakteriophagenhüllprotein (MCP) erkannt und gebunden. So kann in einem beispielhaften Szenario eine Deaminase-MS2-Fusion eine Cas9-MCP-Fusion rekrutieren.
  • Eine Übersicht über andere modulare RNA-Protein-Interaktionsdomänen ist in der Fachliteratur beschrieben, z. B. in Johansson et al. „RNA recognition by the MS2 phage coat protein“, Sem Virol, 1997, Vol. 8(3): 176-185; Delebecque et al. Organization of intracellular reactions with rationally designed RNA assemblies, Science, 2011, Vol. 333: 470-474; Mali et al. „Cas9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering“, Nat. Biotechnol., 2013, Vol.31: 833-838; und Zalatan et al. „Engineering complex synthetic transcriptional programs with CRISPR RNA scaffolds“, Cell, 2015, Vol. 160: 339-350, die hierin jeweils durch Bezugnahme in ihrer Gesamtheit einbezogen werden. Andere Systeme schließen die PP7-Haarnadel, die speziell das PCP-Protein rekrutiert, und die „Com“-Haarnadel, die speziell das Com-Protein rekrutiert, ein. Siehe Zalatan et al.
  • Die Nukleotidsequenz der MS2-Haarnadel (oder gleichwertig als „MS2-Aptamer“ bezeichnet) ist: GCCAACATGAGGATCACCCATGTCTGCAGGGCC (SEQ ID NO: 3871).
  • Die Aminosäuresequenz des MCP oder MS2cp ist:
  •  GSASNFTQFVLVDNGGTGDVTVAPSNFANGVAEWISSNSRSQAYKVTCSVRQSSAQNR
     KYTIKVEVPKVATQTVGGEELPVAGWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDG
     NPIPSAIAANSGIY (SEQ ID NO: 3872).
  • F. UGI-Domäne
  • In anderen Ausführungsformen können die hierin beschriebenen Prime Editors eine oder mehrere Uracil-Glycosylase-Inhibitor-Domänen umfassen. Der hierin verwendte Begriff „Uracil-Glykosylase-Inhibitor (UGI)“ oder „UGI-Domäne“ bezieht sich auf ein Protein, das in der Lage ist, Uracil-DNA-Glykosylase-Basenexzisions-Reparaturenzym zu hemmen. In einigen Ausführungsformen umfasst eine UGI-Domäne einen Wildtyp-UGI oder einen UGI wie in SEQ ID NO: 3873. In einigen Ausführungsformen schließen die hierin bereitgestellten UGI-Proteine Fragmente von UGI und Proteine ein, die zu UGI oder einem UGI-Fragment homolog sind. Zum Beispiel umfasst in einigen Ausführungsformen eine UGI-Domäne ein Fragment der Aminosäuresequenz, die dargelegt ist in SEQ ID NO: 3873. In einigen Ausführungsformen umfasst ein UGI-Fragment eine Aminosäuresequenz, die mindestens 60 %, mindestens 65 %, mindestens 70 %, mindestens 75 %, mindestens 80 %, mindestens 85 %, mindestens 90 %, mindestens 95 %, mindestens 96 %, mindestens 97 %, mindestens 98 %, mindestens 99 % oder mindestens 99,5 % der Aminosäuresequenz umfasst, wie sie dargelegt ist in SEQ ID NO: 3873. In einigen Ausführungsformen umfasst ein UGI eine Aminosäuresequenz, die homolog zu der Aminosäuresequenz ist, die dargestellt ist in SEQ ID NO: 3873 oder eine Aminosäuresequenz, die homolog zu einem Fragment der Aminosäuresequenz, die dargestellt ist in SEQ ID NO: 3873. In einigen Ausführungsformen werden Proteine, die UGI oder Fragmente von UGI oder Homologe von UGI oder UGI-Fragmenten umfassen, als „UGI-Varianten“ bezeichnet. Eine UGI-Variante weist eine Homologie mit UGI oder einem Fragment davon auf. Zum Beispiel ist eine UGI-Variante zu mindestens 70 % identisch, zu mindestens 75 % identisch, zu mindestens 80 % identisch, zu mindestens 85 % identisch, zu mindestens 90 % identisch, zu mindestens 95 % identisch, zu mindestens 96 % identisch, zu mindestens 97 % identisch, zu mindestens 98 % identisch, zu mindestens 99 % identisch, zu mindestens 99,5 % identisch oder zu mindestens 99,9 % identisch mit einem Wildtyp-UGI oder einem UGI, wie er dargelegt ist in SEQ ID NO: 3873. In einigen Ausführungsformen umfasst die UGI-Variante ein Fragment vom UGI, sodass das Fragment mindestens 70 % identisch, mindestens 80 % identisch, mindestens 90 % identisch, mindestens 95 % identisch, mindestens 96 % identisch, mindestens 97 % identisch, mindestens 98 % identisch, mindestens 99 % identisch, mindestens 99,5 % identisch oder mindestens 99,9 % identisch mit dem entsprechenden Fragment vom Wildtyp-UGI oder einem UGI ist, wie er dargelegt ist in SEQ ID NO: 3873. In einigen Ausführungsformen umfasst der UGI die folgende Aminosäuresequenz:
    • Uracil-DNA-Glycosylase-Inhibitor:
    • >sp|P14739|UNGI_BPPB2
     MTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSD
     APEYKPWALVIQDSNGENKIKML (SEQ ID NO: 3873).
  • Die hierin beschriebenen Prime Editors können mehr als eine UGI-Domäne umfassen, die durch einen oder mehrere Linker, wie hierin beschrieben, getrennt sein können.
  • G. Zusätzliche PE-Elemente
  • In bestimmten Ausführungsformen können die hierin beschriebenen Prime Editors einen Inhibitor der Basenreparatur umfassen. Der Begriff „Inhibitor der Basenreparatur“ oder „IBR“ bezieht sich auf ein Protein, das in der Lage ist, die Aktivität eines Nukleinsäure-Reparaturenzyms, z. B. eines Basenexzisions-Reparaturenzyms, zu hemmen. In einigen Ausführungsformen ist die IBR ein Inhibitor der OGG-Basen-Exzisionsreparatur. In einigen Ausführungsformen ist der IBR ein Inhibitor der Basenexzisionsreparatur („iBER“). Exemplarische Inhibitoren der Basenexzisionsreparatur schließen Inhibitoren von APE1, Endo III, Endo IV, Endo V, Endo VIII, Fpg, hOGG1, hNEIL1, T7 Endol, T4PDG, UDG, hSMUG1 und hAAG ein. In einigen Ausführungsformen ist der IBR ein Inhibitor von Endo V oder hAAG. In einigen Ausführungsformen ist der IBR ein iBER, der eine katalytisch inaktive Glycosylase oder katalytisch inaktive Dioxygenase oder ein niedermolekularer oder peptidischer Inhibitor einer Oxidase oder Varianten davon sein kann. In einigen Ausführungsformen ist der IBR ein iBER, der ein TDG-Inhibitor, MBD4-Inhibitor oder ein Inhibitor eines AlkBH-Enzyms sein kann. In einigen Ausführungsformen ist der IBR ein iBER, der ein katalytisch inaktives TDG oder ein katalytisch inaktives MBD4 umfasst. Ein beispielhaftes katalytisch inaktives TDG ist eine N140A-Mutante von SEQ ID NO: 3872 (menschliches TDG).
  • Einige beispielhafte Glykosylasen sind nachfolgend aufgeführt. Die katalytisch inaktivierten Varianten dieser Glykosylase-Domänen sind iBERs, die mit der napDNAbp- oder Polymerase-Domäne der in dieser Offenbarung bereitgestellten Prime Editors fusioniert werden können.
  • OGG (Mensch)
  •   MPARALLPRRMGHRTLASTPALWASIPCPRSELRLDLVLPSGQSFRWREQSPAH
      WSGVLADQVWTLTQTEEQLHCTVYRGDKSQASRPTPDELEAVRKYFQLDVTLAQLYH
      HWGSVDSHFQEVAQKFQGVRLLRQDPIECLFSFICSSNNNIARITGMVERLCQAFGPRLI
      QLDDVTYHGFPSLQALAGPEVEAHLRKLGLGYRARYVSASARAILEEQGGLAWLQQLR
      ESSYEEAHKALCILPGVGTKVADCICLMALDKPQAVPVDVHMWHIAQRDYSWHPTTSQ
      AKGPSPQTNKELGNFFRSLWGPYAGWAQAVLFSADLRQSRHAQEPPAKRRKGSKGPEG
      (SEQ ID NO: 3869)
  • MPG (Mensch)
  • MVTPALQMKKPKQFCRRMGQKKQRPARAGQPHSSSDAAQAPAEQPHSSSDAA
     QAPCPRERCLGPPTTPGPYRSIYFSSPKGHLTRLGLEFFDQPAVPLARAFLGQVLVRRLPN
     GTELRGRIVETEAYLGPEDEAAHSRGGRQTPRNRGMFMKPGTLYVYIIYGMYFCMNISS
     QGDGACVLLRALEPLEGLETMRQLRSTLRKGTASRVLKDRELCSGPSKLCQALAINKSF
     DQRDLAQDEAVWLERGPLEPSEPAWAAARVGVGHAGEWARKPLRFYVRGSPWVSV
     VDRVAEQDTQA (SEQ ID NO: 3870)
  • MBD4 (Mensch)
  •  MGTTGLESLSLGDRGAAPTVTSSERLVPDPPNDLRKEDVAMELERVGEDEEQM
     MIKRSSECNPLLQEPIASAQFGATAGTECRKSVPCGWERVVKQRLFGKTAGRFDVYFISP
     QGLKFRSKSSLANYLHKNGETSLKPEDFDFTVLSKRGIKSRYKDCSMAALTSHLQNQSN
     NSNWNLRTRSKCKKDVFMPPSSSSELQESRGLSNFTSTHLLLKEDEGVDDVNFRKVRKP
     KGKVTILKGIPIKKTKKGCRKSCSGFVQSDSKRESVCNKADAESEPVAQKSQLDRTVCIS
     DAGACGETLSVTSEENSLVKKKERSLSSGSNFCSEQKTSGIINKFCSAKDSEHNEKYEDT
     FLESEEIGTKVEVVERKEHLHTDILKRGSEMDNNCSPTRKDFTGEKIFQEDTIPRTQIERR
     KTSLYFSSKYNKEALSPPRRKAFKKWTPPRSPFNLVQETLFHDPWKLLIATIFLNRTSGK
     MAIPVLWKFLEKYPSAEVARTADWRDVSELLKPLGLYDLRAKTIVKFSDEYLTKQWKY
     PIELHGIGKYGNDSYRIFCVNEWKQVHPEDHKLNKYHDWLWENHEKLSLS (SEQ ID NO:
     3871)
  • TDG (Mensch)
  • MEAENAGSYSLQQAQAFYTFPFQQLMAEAPNMAVVNEQQMPEEVPAPAPAQEP
     VQEAPKGRKRKPRTTEPKQPVEPKKPVESKKSGKSAKSKEKQEKITDTFKVKRKVDRFN
     GVSEAELLTKTLPDILTFNLDIVIIGINPGLMAAYKGHHYPGPGNHFWKCLFMSGLSEVQ
     LNHMDDHTLPGKYGIGFTNMVERTTPGSKDLSSKEFREGGRILVQKLQKYQPRIAVFNG
     KCIYEIFSKEVFGVKVKNLEFGLQPHKIPDTETLCYVMPSSSARCAQFPRAQDKVHYYIK
     LKDLRDQLKGIERNMDVQEVQYTFDLQLAQEDAKKMAVKEEKYDPGYEAAYGGAYG
     ENPCSSEPCGFSSNGLIESVELRGESAFSGIPNGQWMTQSFTDQIPSFSNHCGTQEQEEES
     HA (SEQ ID NO: 3872)
  • In einigen Ausführungsformen können die hierin beschriebenen Fusionsproteine eine oder mehrere heterologe Proteindomänen umfassen (z. B. etwa oder mehr als etwa 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 oder mehr Domänen zusätzlich zu den Prime Editor-Komponenten). Ein Fusionsprotein kann eine beliebige zusätzliche Proteinsequenz und gegebenenfalls eine Linker-Sequenz zwischen zwei beliebigen Domänen umfassen. Andere beispielhafte Merkmale, die vorhanden sein können, sind Lokalisierungssequenzen, wie z. B. zytoplasmatische Lokalisierungssequenzen, Exportsequenzen, wie z. B. Kernexportsequenzen, oder andere Lokalisierungssequenzen sowie Sequenzmarkierungen, die für die Solubilisierung, Reinigung oder den Nachweis der Fusionsproteine nützlich sind.
  • Beispiele für Proteindomänen, die mit einem Prime Editor oder einer Komponente davon (z. B. der napDNAbp-Domäne, der Polymerase-Domäne oder der NLS-Domäne) fusioniert werden können, schließen ohne Einschränkung Epitopmarkierungen und Reportergensequenzen ein. Nicht einschränkende Beispiele für Epitop-Tags schließen Histidin (His)-Tags, V5-Tags, FLAG-Tags, Influenza-Hämagglutinin (HA)-Tags, Myc-Tags, VSV-G-Tags und Thioredoxin (Trx)-Tags ein. Beispiele für Reportergene schließen ein, sind aber nicht beschränkt auf Glutathion-5-Transferase (GST), Meerrettichperoxidase (HRP), Chloramphenicol-Acetyltransferase (CAT), beta-Galaktosidase, beta-Glucuronidase, Luciferase, grün fluoreszierendes Protein (GFP), HcRed, DsRed, cyan fluoreszierendes Protein (CFP), gelb fluoreszierendes Protein (YFP) und autofluoreszierende Proteine einschließlich blau fluoreszierendes Protein (BFP). Ein Prime Editor kann mit einer Gensequenz fusioniert werden, die für ein Protein oder ein Fragment eines Proteins kodiert, das DNA-Moleküle bindet oder andere zelluläre Moleküle bindet, einschließlich, aber nicht beschränkt auf Maltose-Bindungsprotein (MBP), S-Tag, Lex-A-DNA-Bindungsdomänen (DBD)-Fusionen, GAL4-DNA-Bindungsdomänen-Fusionen und Herpes-Simplex-Virus (HSV)-BP16-Protein-Fusionen. Zusätzliche Domänen, die Teil eines Prime Editors sein können, sind in der US-Patentschrift Nr. 2011/0059502 beschrieben, die am 10. März 2011 veröffentlicht wurde und hierin durch Bezugnahme in ihrer Gesamtheit einbezogen ist.
  • In einem Gesichtspunkt der Offenbarung kann ein Reportergen, das Glutathion-5-Transferase (GST), Meerrettichperoxidase (HRP), Chloramphenicol-Acetyltransferase (CAT), Beta-Galactosidase, Beta-Glucuronidase, Luciferase, grün fluoreszierendes Protein (GFP), HcRed, DsRed cyan fluoreszierendes Protein (CFP), gelb fluoreszierendes Protein (YFP) und autofluoreszierende Proteine, einschließlich blau fluoreszierendem Protein (BFP), einschließt, aber nicht darauf beschränkt ist, in eine Zelle eingeschleust werden, um ein Genprodukt zu kodieren, das als Marker dient, mit dem die Veränderung oder Modifikation der Expression des Genprodukts gemessen werden kann. In bestimmten Ausführungsformen der Offenbarung ist das Genprodukt Luziferase. In einer weiteren Ausführungsform der Offenbarung ist die Expression des Genprodukts vermindert.
  • Geeignete Protein-Tags, die hierin bereitgestellt werden, schließen Biotin-Carboxylase-Trägerprotein (BCCP)-Tags, Myc-Tags, Calmodulin-Tags, FLAG-Tags, Hämagglutinin (HA)-Tags, Polyhistidin-Tags, auch Histidin-Tags oder His-Tags genannt, Maltose-Bindungsprotein (MBP)-Tags, Nus-Tags, Glutathion-S-Transferase (GST)-Tags, grün fluoreszierendes Protein (GFP)-Tags, Thioredoxin-Tags, S-Tags, Softags (z. g., Softag 1, Softag 3), Strep-Tags, Biotin-Ligase-Tags, FlAsH-Tags, V5-Tags und SBP-Tags, ein, ohne darauf beschränkt zu sein. Weitere geeignete Sequenzen sind für den Fachmann offensichtlich. In einigen Ausführungsformen umfasst das Fusionsprotein einen oder mehrere His-Tags.
  • In einigen Ausführungsformen der vorliegenden Offenbarung kann die Aktivität des Prime Editing-Systems zeitlich reguliert werden, indem die Verweilzeit, die Menge und/oder die Aktivität der exprimierten Komponenten des PE-Systems angepasst werden. Wie hierin beschrieben, kann das PE zum Beispiel mit einer Proteindomäne fusioniert werden, die in der Lage ist, die intrazelluläre Halbwertszeit des PE zu verändern. In bestimmten Ausführungsformen, bei denen zwei oder mehr Vektoren zum Einsatz kommen (z. B. ein Vektorsystem, bei dem die hierin beschriebenen Komponenten auf zwei oder mehr separaten Vektoren kodiert sind), kann die Aktivität des PE-Systems zeitlich reguliert werden, indem der Zeitpunkt, zu dem die Vektoren bereitgestellt werden, gesteuert wird. In einigen Ausführungsformen kann zum Beispiel ein Vektor, der für das Nuklease-System kodiert, das PE vor dem Vektor, der für das Template kodiert, liefern. In anderen Ausführungsformen kann der Vektor, der für die PEgRNA kodiert, den Guide vor dem Vektor liefern, der für das PE-System kodiert. In einigen Ausführungsformen werden die Vektoren, die für das PE-System und die PEgRNA kodieren, gleichzeitig bereitgestellt. In bestimmten Ausführungsformen liefern die gleichzeitig gelieferten Vektoren z. B. die PE-, PEgRNA- und/oder Zweitstrang-Guide-RNA-Komponenten zeitlich versetzt. In weiteren Ausführungsformen kann die RNA (wie z. B. das Nuklease-Transkript), die von der kodierenden Sequenz auf den Vektoren transkribiert wird, ferner mindestens ein Element umfassen, das in der Lage ist, die intrazelluläre Halbwertszeit der RNA zu modifizieren und/oder die Translationskontrolle zu modulieren. In einigen Ausführungsformen kann die Halbwertszeit der RNA erhöht werden. In einigen Ausführungsformen kann die Halbwertszeit der RNA verringert werden. In einigen Ausführungsformen kann das Element in der Lage sein, die Stabilität der RNA zu erhöhen. In einigen Ausführungsformen kann das Element in der Lage sein, die Stabilität der RNA zu verringern. In einigen Ausführungsformen kann sich das Element innerhalb der 3'-UTR der RNA befinden. In einigen Ausführungsformen kann das Element ein Polyadenylierungssignal (PA) einschließen. In einigen Ausführungsformen kann das Element eine Obergrenze einschließen, z. B. ein stromaufwärts gelegenes mRNA- oder PEgRNA-Ende. In einigen Ausführungsformen kann die RNA kein PA umfassen, sodass sie nach der Transkription einem schnelleren Abbau in der Zelle unterliegt. In einigen Ausführungsformen kann das Element mindestens ein AU-reiches Element (ARE) einschließen. Die AREs können von ARE-bindenden Proteinen (ARE-BPs) in einer Weise gebunden werden, die vom Gewebetyp, Zelltyp, Zeitpunkt, der zellulären Lokalisierung und der Umgebung abhängt. In einigen Ausführungsformen kann das destabilisierende Element den RNA-Zerfall fördern, die RNA-Stabilität beeinflussen oder die Translation aktivieren. In einigen Ausführungsformen kann das ARE eine Länge von 50 bis 150 Nukleotiden umfassen. In einigen Ausführungsformen kann das ARE mindestens eine Kopie der Sequenz AUUUA umfassen. In einigen Ausführungsformen kann mindestens ein ARE an die 3'-UTR der RNA angefügt werden. In einigen Ausführungsformen kann das Element ein Woodchuck Hepatitis Virus (WHP) sein.
  • Posttranskriptionelles regulatorisches Element (WPRE), das eine Tertiärstruktur zur Verstärkung der Expression des Transkripts erzeugt. In weiteren Ausführungsformen ist das Element eine modifizierte und/oder trunkierte WPRE-Sequenz, die in der Lage ist, die Expression des Transkripts zu verstärken, wie zum Beispiel beschrieben in Zufferey et al., J Virol, 73(4): 2886-92 (1999) und Flajolet et al., J Virol, 72(7): 6175-80 (1998). In einigen Ausführungsformen kann das WPRE oder ein gleichwertiges Element der 3'-UTR der RNA hinzugefügt werden. In einigen Ausführungsformen kann das Element aus anderen RNA-Sequenzmotiven ausgewählt werden, die entweder in schnell oder langsam abklingenden Transkripten angereichert sind.
  • In einigen Ausführungsformen kann der Vektor, der für das PE oder die PEgRNA kodiert, durch Spaltung einer auf dem Vektor vorhandenen Target-Sequenz durch das PE-System selbst zerstört werden. Die Spaltung kann die weitere Transkription eines PE oder einer PEgRNA aus dem Vektor verhindern. Obwohl die Transkription auf dem linearisierten Vektor eine gewisse Zeit lang stattfinden kann, haben die exprimierten Transkripte oder Proteine, die dem intrazellulären Abbau unterliegen, weniger Zeit, Off-Target-Effekte zu erzeugen, wenn sie nicht weiterhin durch die Expression der kodierenden Vektoren versorgt werden.
  • PEgRNAs
  • Das hierin beschriebene Prime-Editing-System berücksichtigt die Verwendung aller geeigneten PEgRNAs. Die Erfinder haben herausgefunden, dass der Mechanismus der Target-Primed Reverse Transkription (TPRT) für die Durchführung von präzisem und vielseitigem CRISPR/Cas-basiertem Genome Editing durch die Verwendung einer speziell konfigurierten Guide-RNA genutzt oder angepasst werden kann, die eine Reverse Transkription- (RT) Tenplate-Sequenz umfasst, die für die gewünschte Nukleotidänderung kodiert. In der Anmeldung wird diese speziell konfigurierte Guide-RNA als „erweiterte Guide-RNA“ oder „PEgRNA“ bezeichnet, da die RT-Template-Sequenz als Erweiterung eines Standard- oder herkömmlichen Guide-RNA-Moleküls bereitgestellt werden kann. In der Anmeldung wird jede geeignete Konfiguration oder Anordnung für die verlängerte Guide-RNA in Betracht gezogen.
  • PEgRNA-Architektur
  • 3A zeigt eine Ausführungsform einer verlängerten Guide-RNA, die in dem hierin offenbarten Prime Editing-System verwendet werden kann, wobei eine herkömmliche Guide-RNA (der grüne Teil) eine ~20-nt-Protospacer-Sequenz und eine gRNA-Kernregion einschließt, die sich mit dem napDNAbp verbindet. In dieser Ausführungsform schließt die Guide-RNA ein verlängertes RNA-Segment am 5'-Ende ein, d. h. eine 5'-Erweiterung. In dieser Ausführungsform schließt die 5'-Verlängerung eine Reverse-Transkriptions-Template-Sequenz, eine Reverse-Transkriptions-Primer-Bindungsstelle und eine optionale 5-20-Nukleotid-Linkersequenz ein. Wie in 1A-1B dargestellt, hybrisiert die RT-Primer-Bindungsstelle an das freie 3'-Ende, das nach der Bildung eines Nicks im Nicht-Target-Strang der R-Schleife gebildet wird, wodurch die reverse Transkriptase für die DNA-Polymerisation in 5'-3'-Richtung geprimt wird.
  • 3B zeigt eine weitere Ausführungsform einer verlängerten Guide-RNA, die in dem hierin offenbarten Prime Editing-System verwendet werden kann, wobei eine herkömmliche Guide-RNA (der grüne Teil) eine ~20-nt-Protospacer-Sequenz und einen gRNA-Kern einschließt, der sich mit dem napDNAbp verbindet. In dieser Ausführungsform schließt die Guide-RNA ein verlängertes RNA-Segment am 3'-Ende ein, d. h. eine 3'-Erweiterung. In dieser Ausführungsform schließt die 3'-Verlängerung eine Reverse-Transkriptions-Template-Sequenz und eine Reverse-Transkriptions-Primer-Bindungsstelle ein. Wie in 1C-1D dargestellt, hybrisiert die RT-Primer-Bindungsstelle an das freie 3'-Ende, das nach der Bildung eines Nicks im Nicht-Target-Strang der R-Schleife gebildet wird, wodurch die reverse Transkriptase für die DNA-Polymerisation in 5'-3'-Richtung geprimt wird.
  • 3C zeigt eine weitere Ausführungsform einer verlängerten Guide-RNA, die in dem hierin offenbarten Prime Editing-System verwendet werden kann, wobei eine herkömmliche Guide-RNA (der grüne Teil) eine ~20-nt-Protospacer-Sequenz und einen gRNA-Kern einschließt, der sich mit dem napDNAbp verbindet. In dieser Ausführungsform schließt die Guide-RNA ein verlängertes RNA-Segment an einer intermolekularen Position innerhalb des gRNA-Kerns ein, d. h. eine intramolekulare Verlängerung. In dieser Ausführungsform schließt die intramolekulare Verlängerung eine Reverse-Transkriptions-Template-Sequenz und eine Reverse-Transkriptions-Primer-Bindungsstelle ein. Die RT-Primer-Bindungsstelle hybrisiert an das freie 3'-Ende, das sich nach der Bildung eines Nicks im Nicht-Target-Strang der R-Schleife bildet, wodurch die reverse Transkriptase für die DNA-Polymerisation in 5'-3'-Richtung geprimt wird.
  • In einer Ausführungsform befindet sich die Position der intermolekularen RNA-Verlängerung nicht in der Protospacer-Sequenz der Guide-RNA. In einer anderen Ausführungsform befindet sich die Position der intermolekularen RNA-Erweiterung im gRNA-Kern. In einer weiteren Ausführungsform befindet sich die Position der intermolekularen RNA-Verlängerung an einer beliebigen Stelle des Guide-RNA-Moleküls, außer innerhalb der Protospacer-Sequenz, oder an einer Position, welche die Protospacer-Sequenz unterbricht.
  • In einer Ausführungsform wird die intermolekulare RNA-Erweiterung stromabwärts vom 3'-Ende der Protospacer-Sequenz eingefügt. In einer weiteren Ausführungsform wird die intermolekulare RNA-Verlängerung um mindestens 1 Nukleotid, mindestens 2 Nukleotide, mindestens 3 Nukleotide, mindestens 4 Nukleotide, mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide eingeführt, mindestens 13 Nukleotide, mindestens 14 Nukleotide, mindestens 15 Nukleotide, mindestens 16 Nukleotide, mindestens 17 Nukleotide, mindestens 18 Nukleotide, mindestens 19 Nukleotide, mindestens 20 Nukleotide, mindestens 21 Nukleotide, mindestens 22 Nukleotide, mindestens 23 Nukleotide, mindestens 24 Nukleotide, mindestens 25 Nukleotide stromabwärts vom 3'-Ende der Protospacer-Sequenz eingefügt.
  • In anderen Ausführungsformen wird die intermolekulare RNA-Erweiterung in die gRNA eingefügt, die sich auf den Teil der Guide-RNA bezieht, welcher der tracrRNA entspricht oder diese umfasst und der an das Cas9-Protein oder ein Äquivalent davon (d. h. ein anderes napDNAbp) bindet und/oder mit diesem interagiert. Vorzugsweise wird durch das Einfügen der intermolekularen RNA-Verlängerung die Wechselwirkung zwischen dem tracrRNA-Teil und dem napDNAbp nicht oder nur minimal gestört.
  • Die Länge der RNA-Verlängerung kann eine beliebige Länge aufweisen. In verschiedenen Ausführungsformen ist die RNA-Verlängerung mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide, mindestens 15 Nukleotide, mindestens 16 Nukleotide, mindestens 17 Nukleotide, mindestens 18 Nukleotide, mindestens 19 Nukleotide, mindestens 20 Nukleotide, mindestens 21 Nukleotide, mindestens 22 Nukleotide, mindestens 23 Nukleotide, mindestens 24 Nukleotide, mindestens 25 Nukleotide, mindestens 30 Nukleotide, mindestens 40 Nukleotide, mindestens 50 Nukleotide, mindestens 60 Nukleotide, mindestens 70 Nukleotide, mindestens 80 Nukleotide, mindestens 90 Nukleotide, mindestens 100 Nukleotide, mindestens 200 Nukleotide, mindestens 300 Nukleotide, mindestens 400 Nukleotide oder mindestens 500 Nukleotide lang.
  • Die RT-Template-Sequenz kann auch eine beliebige Länge haben. Zum Beispiel kann die RT-Template-Sequenz mindestens 3 Nukleotide, mindestens 4 Nukleotide, mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide, mindestens 15 Nukleotide, mindestens 16 Nukleotide, mindestens 17 Nukleotide betragen, mindestens 18 Nukleotide, mindestens 19 Nukleotide, mindestens 20 Nukleotide, mindestens 30 Nukleotide, mindestens 40 Nukleotide, mindestens 50 Nukleotide, mindestens 60 Nukleotide, mindestens 70 Nukleotide, mindestens 80 Nukleotide, mindestens 90 Nukleotide, mindestens 100 Nukleotide, mindestens 200 Nukleotide, mindestens 300 Nukleotide, mindestens 400 Nukleotide oder mindestens 500 Nukleotide lang sein.
  • In noch anderen Ausführungsformen, wobei die Reverse-Transkriptions-Primer-Bindungsstelle mindestens 3 Nukleotide, mindestens 4 Nukleotide, mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide, mindestens 15 Nukleotide, mindestens 16 Nukleotide beträgt, mindestens 17 Nukleotide, mindestens 18 Nukleotide, mindestens 19 Nukleotide, mindestens 20 Nukleotide, mindestens 30 Nukleotide, mindestens 40 Nukleotide, mindestens 50 Nukleotide, mindestens 60 Nukleotide, mindestens 70 Nukleotide, mindestens 80 Nukleotide, mindestens 90 Nukleotide, mindestens 100 Nukleotide, mindestens 200 Nukleotide, mindestens 300 Nukleotide, mindestens 400 Nukleotide oder mindestens 500 Nukleotide lang ist.
  • In anderen Ausführungsformen ist die optionale Linker- oder Spacer-Sequenz mindestens 3 Nukleotide, mindestens 4 Nukleotide, mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide, mindestens 15 Nukleotide, mindestens 16 Nukleotide, mindestens 17 Nukleotide, mindestens 18 Nukleotide, mindestens 19 Nukleotide, mindestens 20 Nukleotide, mindestens 30 Nukleotide, mindestens 40 Nukleotide, mindestens 50 Nukleotide, mindestens 60 Nukleotide, mindestens 70 Nukleotide, mindestens 80 Nukleotide, mindestens 90 Nukleotide, mindestens 100 Nukleotide, mindestens 200 Nukleotide, mindestens 300 Nukleotide, mindestens 400 Nukleotide oder mindestens 500 Nukleotide lang.
  • In bestimmten Ausführungsformen kodiert die RT-Template-Sequenz für ein Einzelstrang-DNA-Molekül, das homolog zum Nicht-Target-Strang (und damit komplementär zur entsprechenden Stelle des Target-Strangs) ist, aber eine oder mehrere Nukleotidänderungen einschließt. Die mindestens eine Nukleotidänderung kann eine oder mehrere Einzelbasen-Nukleotidänderungen, eine oder mehrere Deletionen und eine oder mehrere Insertionen einschließen.
  • Wie in FIG. IG dargestellt, ist das synthetisierte Einzelstrang-DNA-Produkt der RT-Template-Sequenz homolog zum Nicht-Target-Strang und enthält eine oder mehrere Nukleotidänderungen. Das Einzelstrang-DNA-Produkt der RT-Template-Sequenz hybridisiert im Gleichgewicht mit der komplementären Target-Strangsequenz, wodurch die homologe endogene Target-Strangsequenz verdrängt wird. Der verdrängte endogene Strang kann in einigen Ausführungsformen als endogene 5'-DNA-Flap-Spezies bezeichnet werden (siehe z. B. 1E). Diese endogene 5'-DNA-Flap-Spezies kann durch eine 5'-Flap-Endonuklease (z. B. FEN1) entfernt werden, und das Einzelstrang-DNA-Produkt, das nun mit dem endogenen Target-Strang hybridisiert ist, kann ligiert werden, wodurch eine Fehlpaarung zwischen der endogenen Sequenz und dem neu synthetisierten Strang entsteht. Die Fehlpaarung kann durch zelleigene DNA-Reparatur- und/oder Replikationsprozesse behoben werden.
  • In verschiedenen Ausführungsformen entspricht die Nukleotidsequenz der RT-Template-Sequenz der Nukleotidsequenz des Nicht-Target-Strangs, der als 5'-Flap-Spezies verdrängt wird und sich mit der zu editierenden Stelle überlappt.
  • In verschiedenen Ausführungsformen der erweiterten Guide-RNAs kann die Reverse-Transkriptions-Template-Sequenz für einen Einzelstrang-DNA-Flap kodieren, der komplementär zu einer endogenen DNA-Sequenz ist, die an eine Nick-Stelle angrenzt, wobei der Einzelstrang-DNA-Flap eine gewünschte Nukleotidänderung umfasst. Der Einzelstrang-DNA-Flap kann eine endogene Einzelstrang-DNA an der Nick-Stelle verdrängen. Die verdrängte endogene Einzelstrang-DNA an der Nick-Stelle kann ein 5'-Ende haben und einen endogenen Flap bilden, der von der Zelle ausgeschnitten werden kann. In verschiedenen Ausführungsformen kann der Ausschnitt des endogenen 5'-Flap zur Produktbildung beitragen, da das Entfernen des endogenen 5'-Flap die Hybridisierung des Einzelstrang-3'-DNA-Flap mit dem entsprechenden komplementären DNA-Strang und den Einbau oder die Assimilation der gewünschten Nukleotidänderung, welche der Einzelstrang-3'-DNA-Flap trägt, in die Target-DNA fördert.
  • In verschiedenen Ausführungsformen der verlängerten Guide -RNAs führt die zelluläre Reparatur des Einzelstrang-DNA-Flap zum Einbau der gewünschten Nukleotidänderung, wodurch ein gewünschtes Produkt entsteht.
  • In noch anderen Ausführungsformen wird die gewünschte Nukleotidänderung in einem Editierfenster eingebaut, das zwischen etwa -5 bis +5 der Nick-Stelle, oder zwischen etwa -10 bis +10 der Nick-Stelle, oder zwischen etwa -20 bis +20 der Nick-Stelle, oder zwischen etwa -30 bis +30 der Nick-Stelle, oder zwischen etwa -40 bis +40 der Nick-Stelle liegt, oder zwischen etwa - 50 bis +50 der Nick-Stelle, oder zwischen etwa -60 bis +60 der Nick-Stelle, oder zwischen etwa - 70 bis +70 der Nick-Stelle, oder zwischen etwa -80 bis +80 der Nick-Stelle, oder zwischen etwa - 90 bis +90 der Nick-Stelle, oder zwischen etwa -100 bis +100 der Nick-Stelle, oder zwischen etwa -200 bis +200 der Nick-Stelle befindet.
    In anderen Ausführungsformen wird die gewünschte Nukleotidänderung in einem Editierfenster installiert, das sich zwischen etwa +1 bis +2 von der Nick-Stelle oder etwa +1 bis +3, +1 bis +4, +1 bis +5, +1 bis +6, +1 bis +7 liegt, +1 bis +8, +1 bis +9, +1 bis +10, +1 bis +11, +1 bis +12, +1 bis +13, +1 bis +14, +1 bis +15, +1 bis +16, +1 bis +17, +1 bis +18, +1 bis +19, +1 bis +20, +1 bis +21, +1 bis +22, +1 bis +23, +1 bis +24, +1 bis +25, +1 bis +26, +1 bis +27, +1 bis +28, +1 bis +29, +1 bis +30, +1 bis +31, +1 bis +32, +1 bis +33, +1 bis +34, +1 bis +35, +1 bis +36, +1 bis +37, +1 bis +38, +1 bis +39, +1 bis +40, +1 bis +41, +1 bis +42, +1 bis +43, +1 bis +44, +1 bis +45, +1 bis +46, +1 bis +47, +1 bis +48, +1 bis +49, +1 bis +50, +1 bis +51, +1 bis +52, +1 bis +53, +1 bis +54, +1 bis +55, +1 bis +56, +1 bis +57, +1 bis +58, +1 bis +59, +1 bis +60, +1 bis +61, +1 bis +62, +1 bis +63, +1 bis +64, +1 bis +65, +1 bis +66, +1 bis +67, +1 bis +68, +1 bis +69, +1 bis +70, +1 bis +71, +1 bis +72, +1 bis +73, +1 bis +74, +1 bis +75, +1 bis +76, +1 bis +77, +1 bis +78, +1 bis +79, +1 bis +80, +1 bis +81, +1 bis +82, +1 bis +83, +1 bis +84, +1 bis +85, +1 bis +86, +1 bis +87, +1 bis +88, +1 bis +89, +1 bis +90, +1 bis +90, +1 bis +91, +1 bis +92, +1 bis +93, +1 bis +94, +1 bis +95, +1 bis +96, +1 bis +97, +1 bis +98, +1 bis +99, +1 bis +100, +1 bis +101, +1 bis +102, +1 bis +103, +1 bis +104, +1 bis +105, +1 bis +106, +1 bis +107, +1 bis +108, +1 bis +109, +1 bis +110, +1 bis +111, +1 bis +112, +1 bis +113, +1 bis +114, +1 bis +115, +1 bis +116, +1 bis +117, +1 bis +118, +1 bis +119, +1 bis +120, +1 bis +121, +1 bis +122, +1 bis +123, +1 bis +124 oder +1 bis +125 von der Nick-Stelle befindet.
  • In noch anderen Ausführungsformen wird die gewünschte Nukleotidänderung in einem Editierfenster installiert, das sich zwischen etwa +1 bis +2 von der Nick-Stelle oder etwa +1 bis +5, +1 bis +10, +1 bis +15, +1 bis +20, +1 bis +25, +1 bis +30, +1 bis +35, +1 bis +40, +1 bis +45, +1 bis +50, +1 bis +55 liegt, +1 bis +100, +1 bis +105, +1 bis +110, +1 bis +115, +1 bis +120, +1 bis +125, +1 bis +130, +1 bis +135, +1 bis +140, +1 bis +145, +1 bis +150, +1 bis +155, +1 bis +160, +1 bis +165, +1 bis +170, +1 bis +175, +1 bis +180, +1 bis +185, +1 bis +190, +1 bis +195, oder +1 bis +200, von der Nick-Stelle befindet.
  • In verschiedenen Gesichtspunkten handelt es sich bei den erweiterten Guide-RNAs um modifizierte Versionen einer Guide-RNA. Guide-RNAs können natürlich vorkommen, von einer kodierenden Nukleinsäure exprimiert oder chemisch synthetisiert werden. Verfahren zum Gewinnen oder anderweitigen Synthetisieren von Guide-RNAs und zum Bestimmen der geeigneten Sequenz der Guide-RNA, einschließlich der Protospacer-Sequenz, die mit dem Target-Strang einer genomischen Target-Stelle von Interesse wechselwirkt und hybridisiert, sind aus dem Stand der Technik bekannt.
  • In verschiedenen Ausführungsformen hängen die besonderen Design-Gesichtspunkte einer Guide-RNA-Sequenz von der Nukleotidsequenz einer genomischen Target-Stelle von Interesse (d. h. der gewünschten zu editierenden Stelle) und dem Typ des napDNAbp (z. B. Cas9-Protein) ab, der in den hierin beschriebenen Prime Editing-Systemen vorhanden ist, neben anderen Faktoren, wie z. B. PAM-Sequenzpositionen, prozentualer G/C-Gehalt in der Target-Sequenz, dem Grad der Mikrohomologie-Regionen, Sekundärstrukturen usw.
  • Im Allgemeinen ist eine Guide-Sequenz eine beliebige Polynukleotidsequenz, die eine ausreichende Komplementarität mit einer Target-Polynukleotidsequenz aufweist, um mit der Target-Sequenz zu hybridisieren und eine sequenzspezifische Bindung eines napDNAbp (z. B. eines Cas9, Cas9-Homologs oder einer Cas9-Variante) an die Target-Sequenz zu ermöglichen. In einigen Ausführungsformen beträgt der Grad der Komplementarität zwischen einer Guide-Sequenz und ihrer entsprechenden Target-Sequenz bei optimaler Ausrichtung unter Verwendung eines geeigneten Ausrichtungsalgorithmus etwa oder mehr als etwa 50 %, 60 %, 75 %, 80 %, 85 %, 90 %, 95 %, 97,5 %, 99 % oder mehr. Die optimale Ausrichtung kann mit jedem geeigneten Algorithmus für die Ausrichtung von Sequenzen bestimmt werden, wobei nicht einschränkende Beispiele den Smith-Waterman-Algorithmus, den Needleman-Wunsch-Algorithmus, Algorithmen auf der Grundlage der Burrows-Wheeler-Transformation (z. B, Burrows Wheeler Aligner), ClustalW, Clustal X, BLAT, Novoalign (Novocraft Technologies), ELAND (Illumina, San Diego, Calif.), SOAP (verfügbar unter soap.genomics.org.cn) und Maq (verfügbar unter maq.sourceforge.net) einschließen. In einigen Ausführungsformen ist eine Guide-Sequenz etwa 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 75 oder mehr Nukleotide lang.
  • In einigen Ausführungsformen ist eine Guide-Sequenz weniger als etwa 75, 50, 45, 40, 35, 30, 25, 20, 15, 12 oder weniger Nukleotide lang. Die Fähigkeit einer Guide-Sequenz, eine sequenzspezifische Bindung eines Prime Editors (PE) an eine Target-Sequenz zu bewirken, kann mit jedem geeigneten Assay bewertet werden. Zum Beispiel können die Komponenten eines Prime Editors (PE), einschließlich der zu testenden Guide-Sequenz, einer Wirtszelle mit der entsprechenden Target-Sequenz zugeführt werden, z. B. durch Transfektion mit Vektoren, die für die hierin offenbarten Komponenten eines Prime Editors (PE) kodieren, gefolgt von einer Bewertung der bevorzugten Spaltung innerhalb der Target-Sequenz, z. B. durch einen Surveyor-Assay, wie hierin beschrieben. In ähnlicher Weise kann die Spaltung einer Target-Polynukleotidsequenz in einem Reagenzglas bewertet werden, indem die Target-Sequenz, Komponenten eines Prime Editors (PE), einschließlich der zu testenden Guide-Sequenz und einer Kontroll-Guide-Sequenz, die sich von der Test-Guide-Sequenz unterscheidet, bereitgestellt werden und die Bindung oder Rate der Spaltung an der Target-Sequenz zwischen den Test- und Kontroll-Guide-Sequenzreaktionen verglichen wird. Andere Assays sind möglich und werden dem Fachmann bekannt vorkommen.
  • Eine Guide-Sequenz kann als Target für jede beliebige Target-Sequenz ausgewählt werden. In einigen Ausführungsformen ist die Target-Sequenz eine Sequenz innerhalb eines Genoms einer Zelle. Exemplarische Target-Sequenzen schließen solche ein, die im Target-Genom einzigartig sind. Zum Beispiel kann für S. pyogenes Cas9 eine einzigartige Target-Sequenz in einem Genom eine Cas9-Target-Stelle der Form MMMMMMMMNNNNNNNNNNNNNNNNXGG (SEQ ID NO: 204) einschließen, wobei NNNNNNNNNNNNNNXGG (SEQ ID NO: 205) (N ist A, G, T oder C; und X kann alles sein). Eine einzigartige Target-Sequenz in einem Genom kann eine S. pyogenes Cas9-Target-Stelle der Form MMMMMMMMMNNNNNNNNNNNNXGG (SEQ ID NO: 206) einschließen, wobei NNNNNNNNNNNXGG (SEQ ID NO: 207) (N ist A, G, T oder C; und X kann alles sein). Für S. thermophilus CRISPR1Cas9 kann eine einzigartige Target-Sequenz in einem Genom eine Cas9-Target-Stelle der Form MMMMMMMMNNNNNNNNNNNNNNNNXXAGAAW (SEQ ID NO: 208) einschließen, wobei NNNNNNNNNNNNXXAGAAW (SEQ ID NO: 209) (N ist A, G, T oder C; X kann alles sein; und W ist A oder T). Eine einzigartige Target-Sequenz in einem Genom kann eine S. thermophilus CRISPR 1 Cas9-Target-Stelle der Form MMMMMMMMMNNNNNNNNNNNNNXXAGAAW (SEQ ID NO: 210) einschließen, wobei NNNNNNNNNNNNNXXAGAAW (SEQ ID NO: 211) (N ist A, G, T oder C; X kann alles sein; und W ist A oder T). Für S. pyogenes Cas9 kann eine einzigartige Target-Sequenz in einem Genom eine Cas9-Target-Stelle der Form MMMMMMMMNNNNNNNNNNNNNNXGGXG (SEQ ID NO: 212) einschließen, wobei NNNNNNNNNNNNXGGXG (SEQ ID NO: 213) (N ist A, G, T oder C; und X kann alles sein). Eine einzigartige Target-Sequenz in einem Genom kann eine S. pyogenes Cas9-Target-Stelle der Form
    MMMMMMMMMNNNNNNNNNNNNXGGXG (SEQ ID NO: 214) einschließen, wobei NNNNNNNNNNNXGGXG (SEQ ID NO: 215) (N ist A, G, T oder C; und X kann alles sein). In jeder dieser Sequenzen kann „M“ A, G, T oder C sein und muss bei der Identifizierung einer Sequenz als einzigartig nicht berücksichtigt werden.
  • In einigen Ausführungsformen wird eine Guide-Sequenz ausgewählt, um den Grad der Sekundärstruktur innerhalb der Guide-Sequenz zu reduzieren. Die Sekundärstruktur kann mithilfe eines jeden geeigneten Algorithmus zur Faltung von Polynukleotiden bestimmt werden. Manche Programm beruhen auf der Berechnung der minimalen Gibbsschen freien Energie. Ein Beispiel für einen derartigen Algorithmus ist mFold, wie von Zuker und Stiegler beschrieben (Nucleic Acids Res. 9 (1981), 133-148). Ein anderer beispielhafter auf die Faltung bezogener Algorithmus ist der Online-Webserver RNAfold, entwickelt am Institut für Theoretische Chemie an der Universität Wien, unter Verwendung des Algorithmus zur Centroid-Struktur-Vorhersage (siehe z. B. A. R. Gruber et al., 2008, Cell 106(1): 23-24; und PA Carr und GM Church, 2009, Nature Biotechnology 27(12): 1151-62). Weitere Algorithmen finden sich in der US-Anmeldung mit der Serien-Nr. 61/836 080 ; Broad Reference BI-2013/004A); die durch Bezugnahme hierin aufgenommen ist.
  • Im Allgemeinen schließt eine tracr-Mate-Sequenz eine jede Sequenz ein, die eine hinreichende Komplementarität mit einer tracr-Sequenz besitzt, um eines oder mehrere der Folgenden zu fördern: (1) Ausschneiden einer Guide-Sequenz, die von tracr-Mate-Sequenzen flankiert wird, in einer Zelle, welche die entsprechende tracr-Sequenz enthält; und (2) Bildung eines Komplexes an einer Target-Sequenz, wobei der Komplex die tracr-Mate-Sequenz umfasst, die an die tracr-Sequenz hybridisiert ist. Der Komplementaritätsgrad wird im Allgemeinen bezogen auf das optimale Alignment der tracr-Mate-Sequenz und tracr-Sequenz angegeben, und zwar an der Länge der kürzeren der zwei Sequenzen. Das optimale Alignment kann mithilfe eines jeden geeigneten Alignment-Algorithmus bestimmt werden, und dabei können außerdem Sekundärstrukturen wie bspw. die Eigenkomplementarität entweder innerhalb der tracr-Sequenz oder der tracr-Mate-Sequenz berücksichtigt werden. In einigen Ausführungsformen beträgt der Komplementaritätsgrad zwischen der tracr-Sequenz und der tracr-Mate-Sequenz an der Länge der kürzeren der zwei bei optimalem Alignment 25 %, 30 %, 40 %, 50 %, 60 %, 70 %, 80 %, 90 %, 95 %, 97,5 %, 99 % oder mehr. In einigen Ausführungsformen weist die tracr-Sequenz eine Länge von etwa oder über etwa 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 40, 50 oder mehr Nukleotiden auf. In einigen Ausführungsformen sind die tracr-Sequenz und tracr-Mate-Sequenz innerhalb eines einzelnen Transkripts enthalten, sodass die Hybridisierung zwischen den beiden ein Transkript mit einer Sekundärstruktur hervorbringt, wie bspw. eine Haarnadel. Bevorzugte Schleifen bildende Sequenzen zur Verwendung bei Haarnadelstrukturen sind vier Nukleotide lang, besonders bevorzugt ist, dass sie die Sequenz GAAA aufweisen. Dabei können aber auch kürzere oder längere Schleifensequenzen verwendet werden, was auch für alternative Sequenzen gilt. Die Sequenzen beinhalten vorzugsweise ein Nukleotid-Triplett (zum Beispiel AAA) und ein zusätzliches Nukleotid (zum Beispiel C oder G). Zu Beispielen für Schleifen bildende Sequenzen zählen CAAA und AAAG. In einer erfindungsgemäßen Ausführungsform weist das Transkript oder die transkribierte Polynukleotidsequenz mindestens zwei oder mehr Haarnadeln auf. In bevorzugten Ausführungsformen weist das Transkript zwei, drei, vier oder fünf Haarnadeln auf. In einer weiteren Ausführungsform der Erfindung weist das Transkript höchstens fünf Haarnadeln auf. In einigen Ausführungsformen weist das einzelne Transkription ferner eine Transkriptionsterminationssequenz auf; dabei handelt es sich vorzugsweise um eine polyT-Sequenz, zum Beispiel sechs T-Nukleotide. Weitere nicht einschränkende Beispiele für einzelne Polynukleotide, die eine Guide-Sequenz, eine tracr-Mate-Sequenz und eine tracr-Sequenz umfassen, sind wie folgt (von 5' zu 3' aufgeführt), wobei „N“ für eine Base einer Guide-Sequenz steht, der erste Block der kleingeschriebenen Buchstaben die tracr-Mate-Sequenz darstellt, der zweite Block der kleingeschriebenen Buchstaben die tracr-Sequenz darstellt und die finale poly-T-Sequenz den Transkriptionsterminator repräsentiert:
    •  (1)NNNNNNNNGTTTTTGTACTCTCAAGATTTAGAAATAAATCTTGCAGAAGCTACAAA
       GATAAGGCTTCATGCCGAAATCAACACCCTGTCATTTTATGGCAGGGTGTTTTCGTTAT
       TTAATTTTTT (SEQ ID NO: 216);
    •   (2)NNNNNNNNNNNNNNNNNNGTTTTTGTACTCTCAGAAATGCAGAAGCTACA
        AAGATAAGGCTTCATGCCGAAATCAACACCCTGTCATTTTATGGCAGGGTGTTTTCGT
        TATTTAATTTTTT (SEQ ID NO: 217);
    •   (3)NNNNNNNNNNNNNNNNNNNNGTTTTTGTACTCTCAGAAATGCAGAAGCTA
        CAAAGATAAGGCTTCATGCCGAAATCAACACCCTGTCATTTTATGGCAGGGTGTTTTT
        T (SEQ ID NO: 218);
    •   (4)NNNNNNNNNNNNNNNNNNNNGTTTTAGAGCTAGAAATAGCAAGTTAAAAT
        AAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTT (SEQ ID
        NO: 219);
    •   (5)NNNNNNNNNNNNNNNNNNNNGTTTTAGAGCTAGAAATAGCAAGTTAAAAT
        AAGGCTAGTCCGTTATCAACTTGAAAAAGTGTTTTTTT (SEQ ID NO: 220); UND
    •  (6) NNNNNNNNNNNNNNNNNNNNGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCT
       AGTCCGTTATCATTTTTTTT (SEQ ID NO: 221).
  • In einigen Ausführungsformen werden die Sequenzen (1) bis (3) in Kombination mit Cas9 von S. thermophilus CRISPR1 verwendet. In einigen Ausführungsformen werden die Sequenzen (4) bis (6) in Kombination mit Cas9 von S. pyogenes verwendet. In einigen Ausführungsformen ist die tracr-Mate-Sequenz ein separates Transkript von einem Transkript, das die tracr-Mate-Sequenz umfasst.
  • Für Fachleute ergibt es sich, dass es typischerweise notwendig ist, das Fusionsprotein zusammen mit einer Guide-RNA, z. B. einer sgRNA, zu exprimieren, um ein beliebiges der Fusionsproteine, die eine Cas9-Domäne umfassen, und ein einzelsträngiges DNA bindendes Protein, wie vorliegend offenbart, anzuzielen, um eine Stelle, z. B. eine Stelle, die eine Punktmutation umfasst, die editiert werden soll, anzuzielen. Wie vorliegend an anderer Stelle eingehender erläutert, umfasst eine Guide-RNA typischerweise einen tracrRNA-Rahmen, der die Cas9-Bindung erlaubt, und eine Guide-Sequenz, welche dem Cas9:Nukleinsäure-Editierungsenzym/Domäne-Fusionsprotein Sequenzspezifität verleiht.
  • In einigen Ausführungsformen umfasst die Guide-RNA eine Struktur 5'-[Guide-Sequenz]-GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAAGGCUAGUCCGUUAUCAACUUG AAAAAGUGGCACCGAGUCGGUGCUUUUU-3' (SEQ ID NO: 222), wobei die Guide-Sequenz eine Sequenz umfasst, die komplementär zur Target-Sequenz ist. Die Guide-Sequenz ist typischerweise 20 Nukleotide lang. Die Sequenzen geeigneter Guide-RNAs zum Richten von Cas9:Nukleinsäure-Editierungsenzym/Domäne-Fusionsproteinen auf spezifische genomische Zielstellen erschließen sich Fachleuten auf der Grundlage der vorliegenden Offenbarung. Derartige geeignete Guide-RNA-Sequenzen umfassen typischerweise Guide-Sequenzen, die komplementär zu einer Nukleinsequenz innerhalb der 50 Nukleotide strangaufwärts oder strangabwärts des zu editierenden Zielnukleotids sind. Einige beispielhafte Guide-RNA-Sequenzen, die zum Richten beliebiger der bereitgestellten Fusionsproteine auf spezifische Target-Sequenzen geeignet sind, sind vorliegend bereitgestellt. Zusätzliche Guide-Sequenzen sind allgemein fachbekannt und können mit dem vorliegend beschriebenen Prime Editor (PE) verwendet werden.
  • In anderen Ausführungsformen beinhalten die PEgRNAs jene, die in 3D abgebildet sind.
  • In weiteren Ausführungsformen können die PEgRNAs jene beinhalten, die in 3E abgebildet sind.
  • 3D stellt die Struktur einer Ausführungsform einer PEgRNA dar, die in dieser Schrift vorgesehenen ist und die gemäß der in Beispiel 2 definierten Methodik gestaltet werden kann. Die PEgRNA umfasst folgende drei Hauptkomponentenelemente, die in 5'-3'-Richtung angeordnet sind: einen Spacer, einen gRNA-Kern und einen Verlängerungsarm am 3'-Ende. Der Verlängerungsarm lässt sich weiterhin in die folgenden Strukturelemente in 5'-3'-Richtung unterteilen: eine Primerbindungsstelle (A), eine Editiervorlage (B) und einen Homologiearm (C). Des Weiteren kann die PEgRNA eine optionale 3'-Ende-Modifizierregion (e1) und eine optionale 5'-Ende-Modifizierregion (e2) umfassen. Außerdem kann die PEgRNA ein Transkriptionsterminationssignal am 3'-Ende der PEgRNA (nicht abgebildet) umfassen. Diese Strukturelemente werden vorliegend weiter definiert. Die Abbildung der Struktur der PEgRNA ist nicht einschränkend gedacht und umfängt Variationen bei der Anordnung der Elemente. Beispielsweise könnten die optionalen Sequenzmodifizierer (e1) und (e2) innerhalb oder zwischen beliebigen der anderen gezeigten Regionen positioniert werden und sind nicht darauf beschränkt, am 3'- und 5'-Ende platziert zu werden.
  • 3E stellt die Struktur einer anderen Ausführungsform einer PEgRNA dar, die in dieser Schrift vorgesehenen ist und die gemäß der in Beispiel 2 definierten Methodik gestaltet werden kann. Die PEgRNA umfasst folgende drei Hauptkomponentenelemente, die in 5'-3'-Richtung angeordnet sind: einen Spacer, einen gRNA-Kern und einen Verlängerungsarm am 3'-Ende. Der Verlängerungsarm lässt sich weiterhin in die folgenden Strukturelemente in 5'-3'-Richtung unterteilen: eine Primerbindungsstelle (A), eine Editiervorlage (B) und einen Homologiearm (C). Des Weiteren kann die PEgRNA eine optionale 3'-Ende-Modifizierregion (e1) und eine optionale 5'-Ende-Modifizierregion (e2) umfassen. Außerdem kann die PEgRNA ein Transkriptionsterminationssignal am 3'-Ende der PEgRNA (nicht abgebildet) umfassen. Diese Strukturelemente werden vorliegend weiter definiert. Die Abbildung der Struktur der PEgRNA ist nicht einschränkend gedacht und umfängt Variationen bei der Anordnung der Elemente. Beispielsweise könnten die optionalen Sequenzmodifizierer (e1) und (e2) innerhalb oder zwischen beliebigen der anderen gezeigten Regionen positioniert werden und sind nicht darauf beschränkt, am 3'- und 5'-Ende platziert zu werden.
  • Verbesserungen für PEgRNA
  • Die PEgRNAs können auch zusätzliche Gestaltungsverbesserungen aufweisen, welche die Eigenschaften und/oder Charakteristika von PEgRNAs modifizieren und dadurch die Effizienz des Prime Editing verbessern können. In verschiedenen Ausführungsformen können diese Verbesserungen zu einer oder mehreren unter einigen verschiedenen Kategorien gehören, darunter: (1) Gestaltungen zum Ermöglichen einer effizienten Expression von funktioneller PEgRNAs aus Nicht-Polymerase-III(pol-III)Promotoren, was die Expression von längeren PEgRNAs ohne aufwändige Anforderungen in Bezug auf Sequenzen ermöglichen würde; (2) Verbesserungen für Kern, Cas9-bindendes PEgRNA-Gerüst, was die Effizienz verbessern könnte; (3) Modifikationen an der PEgRNA zur Verbesserung der RT-Prozessivität, was die Einfügung längerer Sequenzen an angezielten genomischen Stellen ermöglicht; und (4) Addition von RNA-Motiven an den 5'- oder 3'-Terminus der PEgRNA, welche die PEgRNA-Stabilität verbessern, die RT-Prozessivität steigern, Fehlfaltungen der PEgRNA verhindern oder zusätzliche Faktoren rekrutieren, die wichtig für die Genomeditierung sind.
  • In einer Ausführungsform könnte PEgRNA mit pol-III-Promotoren gestaltet werden, um die Expression von PEgRNA einer größeren Länge mit größeren Verlängerungsarmen zu verbessern. sgRNAs werden typischerweise aus dem U6-snRNA-Promotor exprimiert. Der Promotor rekrutiert pol III, um die verknüpfte RNA zu exprimieren, und ist für die Expression von kurzen RNAs nützlich, die im Inneren des Nucleus zurückgehalten werden. Allerdings ist pol III nicht sehr prozessiv und nicht in der Lage, RNAs, die mehr als ein paar hundert Nukleotide lang sind, in den Stärken zu exprimieren, die für eine effiziente Genomeditierung erforderlich sind. Außerdem kann pol III an Abschnitten von U steckenbleiben oder zum Stillstand kommen, was eventuell die Sequenzdiversität begrenzen könnte, die mithilfe einer PEgRNA eingeführt werden könnte. Andere Promotoren, die Polymerase II (etwa pCMV) oder Polymerase I (wie den U1-snRNA-Promotor) rekrutieren, wurden im Hinblick auf ihre Fähigkeit untersucht, längere sgRNAs zu exprimieren. Allerdings werden diese Promotoren typischerweise partiell transkribiert, was eine zusätzliche Sequenz 5' des Spacers in der exprimierten PEgRNA ergeben würde, was, wie gezeigt wurde, eine deutlich reduzierte Cas9:sgRNA-Aktivität in ortsabhängiger Art und Weise ergibt. Während mithilfe von pol III transkribierte PEgRNAs auf einer Strecke von 6-7 Us einfach enden können, würden des Weiteren von pol II oder pol I transkribierte PEgRNAs ein anderes Terminationssignal benötigen. Derlei Signale ergeben oft eine Polyadenylierung, was zu einem ungewünschten Transport der PEgRNA aus dem Nucleus führen würde. Dem ähnlich haben RNAs, die von pol-II-Promotoren wie bspw. pCMV exprimiert werden, typischerweise ein gekapptes 5'-Ende, was ebenfalls zu ihrem Export aus dem Nucleus führt.
  • Vorher haben Rinn und Kollegen viele verschiedene Expressionsplattformen im Hinblick auf die Produktion mit langer nichtcodierender RNA (IncRNA) markierter sgRNAs durchmustert183. Zu diesen Plattformen zählen RNAs, die aus pCMV exprimiert sind und die im ENE-Element aus der MALAT I-ncRNA von Menschen184, dem PAN-ENE-Element aus KSHV185 oder der 3'-Box von U1-snRNA186 enden. Insbesondere bilden die MALAT1-ncRNA und PAN-ENEs dreisträngige Helices, die den polyA-Schwanz schützen 184,187. Diese Konstrukte könnten auch die RNA-Stabilität steigern. Es ist vorgesehen, dass diese Expressionssysteme auch die Expression längerer PEgRNAs ermöglichen werden.
  • Des Weiteren wurde eine Reihe von Verfahren für die Abspaltung des Abschnitts des pol-II-Promotors gestaltet, der als Teil der PEgRNA transkribiert werden würde, wofür entweder ein selbstschneidendes Ribozym hinzugefügt wurde, etwa die als Hammerhead188, Pistol189, Hatchet189, Hairpin190, VS191, Twister192 oder Twister-Sister192 bezeichnete Ribozym, oder indem andere selbstschneidende Elemente hinzugefügt wurden, um die transkribierte Guide zu verarbeiten, oder eine Haarnadel, die von Csy4193 erkannt wird und ebenfalls zur Verarbeitung des Guide führt. Zudem wird vermutet, dass der Einbau mehrerer ENE-Motive eine verbesserte Element und Stabilität von PEgRNA ergeben könnte, wie zuvor für die KSHV-PAN-RNA und das entsprechende Element aufgezeigt185. Außerdem wird erwartet, dass die Zirkularisierung der PEgRNA in Form einer zirkulären intronischen RNA (ciRNA) ebenfalls zu einer gesteigerten RNA-Expression und -Stabilität wie auch zu einer nuklearen Lokalisierung führen könnte194.
  • In verschiedenen Ausführungsformen kann die PEgRNA verschiedene der vorgenannten Elemente beinhalten, wie durch die folgende Sequenz veranschaulicht.
  • Nicht einschränkendes Beispiel 1 - PEgRNA-Expressionsplattform, bestehend aus pCMV, Csy4-Hairpin, der PEgRNA und MALAT1-ENE
  •  TAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCG
     CGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCC
     ATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGAC
     GTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCA
     TATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTAT
     GCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCAT
     CGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTT
     GACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGC
     ACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAA
     TGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTGGTTTAGTGAACC
     GTCAGATCGTTCACTGCCGTATAGGCAGGGCCCAGACTGAGCACGTGAGTTTTAGAG
     CTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACC
     GAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGTTTTAGGGTCATGAAGGTTTTT
     CTTTTCCTGAGAAAACAACACGTATTGTTTTCTCAGGTTTTGCTTTTTGGCCTTTTTCT
     AGCTTAAAAAAAAAAAAAGCAAAAGATGCTGGTGGTTGGCACTCCTGGTTTCCAGG
     ACGGGGTTCAAATCCCTGCGGCGTCTTTGCTTTGACT (SEQ ID NO: 223)
  • Nicht einschränkendes Beispiel 2 - PEgRNA-Expressionsplattform, bestehend aus pCMV, Csy4-Hairpin, der PEgRNA und PAN-ENE
  •  TAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCG
     CGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCC
     ATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGAC
     GTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCA
     TATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTAT
     GCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCAT
     CGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTT
     GACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGC
     ACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAA
     TGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTGGTTTAGTGAACC
     GTCAGATCGTTCACTGCCGTATAGGCAGGGCCCAGACTGAGCACGTGAGTTTTAGAG
     CTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACC
     GAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGTTTTGTTTTGGCTGGGTTTTTC
     CTTGTTCGCACCGGACACCTCCAGTGACCAGACGGCAAGGTTTTTATCCCAGTGTATA
     TTGGAAAAACATGTTATACTTTTGACAATTTAACGTGCCTAGAGCTCAAATTAAACTA
     ATACCATAACGTAATGCAACTTACAACATAAATAAAGGTCAATGTTTAATCCATAAAAA
     AAAAAAAAAAAAAA (SEQ ID NO: 224)
  • Nicht einschränkendes Beispiel 3 - PEgRNA-Expressionsplattform, bestehend aus pCMV, Csy4-Hairpin, der PEgRNA und 3×PAN-ENE
  •  TAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCG
     CGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCC
     ATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGAC
     GTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCA
     TATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTAT
     GCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCAT
     CGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTT
     GACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGC
     ACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAA
     TGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTGGTTTAGTGAACC
     GTCAGATCGTTCACTGCCGTATAGGCAGGGCCCAGACTGAGCACGTGAGTTTTAGAG
     CTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACC
     GAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGTTTTGTTTTGGCTGGGTTTTTC
     CTTGTTCGCACCGGACACCTCCAGTGACCAGACGGCAAGGTTTTTATCCCAGTGTATA
     TTGGAAAAACATGTTATACTTTTGACAATTTAACGTGCCTAGAGCTCAAATTAAACTA
     ATACCATAACGTAATGCAACTTACAACATAAATAAAGGTCAATGTTTAATCCATAAAAA
     AAAAAAAAAAAAAAACACACTGTTTTGGCTGGGTTTTTCCTTGTTCGCACCGGACAC
     CTCCAGTGACCAGACGGCAAGGTTTTTATCCCAGTGTATATTGGAAAAACATGTTATA
     CTTTTGACAATTTAACGTGCCTAGAGCTCAAATTAAACTAATACCATAACGTAATGCAA
     CTTACAACATAAATAAAGGTCAATGTTTAATCCATAAAAAAAAAAAAAAAAAAATCTC
     TCTGTTTTGGCTGGGTTTTTCCTTGTTCGCACCGGACACCTCCAGTGACCAGACGGCA
     AGGTTTTTATCCCAGTGTATATTGGAAAAACATGTTATACTTTTGACAATTTAACGTGC
     CTAGAGCTCAAATTAAACTAATACCATAACGTAATGCAACTTACAACATAAATAAAGG
     TCAATGTTTAATCCATAAAAAAAAAAAAAAAAAAA (SEQ ID NO: 225)
  • Nicht einschränkendes Beispiel 4 - PEgRNA-Expressionsplattform, bestehend aus pCMV, Csy4-Hairpin, der PEgRNA und 3'-Box
  •  TAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCG
     CGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCC
     ATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGAC
     GTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCA
     TATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTAT
     GCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCAT
     CGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTT
     GACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGC
     ACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAA
     TGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTGGTTTAGTGAACC
     GTCAGATCGTTCACTGCCGTATAGGCAGGGCCCAGACTGAGCACGTGAGTTTTAGAG
     CTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACC
     GAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGTTTGTTTCAAAAGTAGACTGTA
     CGCTAAGGGTCATATCTTTTTTTGTTTGGTTTGTGTCTTGGTTGGCGTCTTAAA (SEQ ID
     NO: 226)
  • Nicht einschränkendes Beispiel 5 - PEgRNA-Expressionsplattform, bestehend aus pU1, Csy4-Hairpin, der PEgRNA und 3'-Box
  •  CTAAGGACCAGCTTCTTTGGGAGAGAACAGACGCAGGGGCGGGAGGGAAAAAGGG
     AGAGGCAGACGTCACTTCCCCTTGGCGGCTCTGGCAGCAGATTGGTCGGTTGAGTGG
     CAGAAAGGCAGACGGGGACTGGGCAAGGCACTGTCGGTGACATCACGGACAGGGC
     GACTTCTATGTAGATGAGGCAGCGCAGAGGCTGCTGCTTCGCCACTTGCTGCTTCACC
     ACGAAGGAGTTCCCGTGCCCTGGGAGCGGGTTCAGGACCGCTGATCGGAAGTGAGA
     ATCCCAGCTGTGTGTCAGGGCTGGAAAGGGCTCGGGAGTGCGCGGGGCAAGTGACC
     GTGTGTGTAAAGAGTGAGGCGTATGAGGCTGTGTCGGGGCAGAGGCCCAAGATCTCA
     GTTCACTGCCGTATAGGCAGGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAAT
     AGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGT
     CCTCTGCCATCAAAGCGTGCTCAGTCTGTTTCAGCAAGTTCAGAGAAATCTGAACTT
     GCTGGATTTTTGGAGCAGGGAGATGGAATAGGAGCTTGCTCCGTCCACTCCACGCAT
     CGACCTGGTATTGCAGTACCTCCAGGAACGGTGCACCCACTTTCTGGAGTTTCAAAA
     GTAGACTGTACGCTAAGGGTCATATCTTTTTTTGTTTGGTTTGTGTCTTGGTTGGCGTC
     TTAAA (SEQ ID NO: 227).
  • In verschiedenen anderen Ausführungsformen kann die PEgRNA verbessert werden, indem Verbesserungen in die Gerüst- oder Kernsequenzen eingebracht werden. Dies kann erfolgen durch Einführung bekannter
  • Der Kern, das Cas9 bindende PEgRNA-Gerüst können mit Wahrscheinlichkeit verbessert werden, um die Aktivität des PE zu steigern. Von derartigen Herangehensweisen wurden bereits mehrere aufgezeigt. Beispielsweise enthält das erste Paarbildungselement des Gerüsts (P1) ein GTTTT-AAAAC-Paarbildungselement. Wie gezeigt wurde, führen solche Strecken von Ts zur Pausierung von pol III und zur verfrühten Beendigung des RNA-Transkripts. Es ist gezeigt worden, dass eine überlegte Mutation eines der T-A-Paare in ein G-C-Paar in diesem Abschnitt des P1 die Aktivität von sgRNA steigert, was darauf hindeutet, dass diese Herangehensweise auch für PEgRNAs durchführbar wäre195. Außerdem ist gezeigt, dass eine Verlängerung des P1 die Faltung von sgRNA steigert und eine verbesserte Aktivität ergibt195 , wodurch sie als eine weitere Möglichkeit zur Verbesserung der Aktivität von PEgRNA in Frage kommt. Zu beispielhaften Verbesserungen am Kern zählen:
  • PEgRNA, eine Verlängerung von 6 nt am P1
  •  GGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGCTCATGAAAATGAGCTAGCAAGTT
     AAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCC
     ATCAAAGCGTGCTCAGTCTGTTTTTTT (SEQ ID NO: 228)
  • PEgRNA, enthaltend eine Mutation von T-A in G-C im P1
  •  GGCCCAGACTGAGCACGTGAGTTTGAGAGCTAGAAATAGCAAGTTTAAATAAGGCTA
     GTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGC
     TCAGTCTGTTTTTTT (SEQ ID NO: 229)
  • In verschiedenen anderen Ausführungsformen kann die PEgRNA verbessert werden, indem Modifikationen an der Region der Editiervorlage vorgenommen werden. Mit zunehmender Größe der Insertion, für welche die PEgRNA als Vorlage dient, steigt auch die Wahrscheinlichkeit, dass sie durch Endonuklease abgebaut, spontan hydrolysiert wird oder sich in Sekundärstrukturen faltet, für die eine reverse Transkription durch die RT nicht möglich ist oder die die Faltung des PEgRNA-Gerüsts und anschließende Cas9-RT-Bindung stören. Dementsprechend ist es wahrscheinlich, dass eine Modifikation der Vorlage der PEgRNA notwendig sein könnte, um einen Einfluss auf größere Insertionen wie bspw. die Insertion ganzer Gene zu haben. Zu einigen Strategien dafür zählt die Einarbeitung modifizierter Nukleotide in einer synthetischen oder halbsynthetischen PEgRNA, welche die RNA widerstandsfähiger gegenüber Abbau oder Hydrolyse macht oder die Wahrscheinlichkeit verringert, dass sie hemmende Sekundärstrukturen annimmt 196. Zu derartigen Modifikationen könnten zählen: 8-Aza-7-deazaguanosin, das die RNA-Sekundärstruktur in G-reichen Sequenzen reduzieren würde; verbrückte Nukleinsäuren (locked nucleic acids, LNA), die den Abbau verringern und bestimmte Arten von RNA-Sekundärstrukturen fördern; 2'-O-Methyl-, 2'-Fluor- oder 2'-O-Methoxyethoxymodifikationen, welche die Stabilität von RNA erhöhen. Derartige Modifikationen könnten auch an anderen Stellen in der PEgRNA eingeführt werden, um die Stabilität und Aktivität zu steigern. Alternativ oder zusätzlich könnte die Vorlage der PEgRNA derart gestaltet werden, dass sie sowohl für ein gewünschtes Proteinprodukt codiert als auch mit Wahrscheinlichkeit einfache Sekundärstrukturen annehmen wird, welche durch die RT entfaltet werden können. Derartige einfache Strukturen hätten die Wirkung einer thermodynamischen Senke, was die Wahrscheinlichkeit des Auftretens komplizierterer Strukturen verringert, welche die reverse Transkription verhindern würden. Schließlich könnte die Vorlage auch in zwei, separate PEgRNAs aufgespalten werden. Bei einer derartigen Gestaltung würde ein PE zum Initiieren der Transkription und auch zum Rekrutieren einer separaten Vorlagen-RNA zur angezielten Stelle über ein an Cas9 fusioniertes RNA-Bindungsprotein oder ein RNA-Erkennungselement an der PEgRNA an sich, etwa das MS2-Aptamer, verwendet werden. Die RT könnte entweder direkt an diese separate Vorlagen-RNA binden oder vor dem Wechsel zur zweiten Vorlage eine reverse Transkription an der ursprünglichen PEgRNA initiieren. Eine solche Herangehensweise könnte lange Insertionen ermöglichen, und zwar sowohl dadurch, dass eine Fehlfaltung der PEgRNA bei Addition der langen Vorlage verhindert wird, als auch dadurch, dass keine Dissoziation von Cas9 vom Genom erforderlich ist, damit lange Insertionen erfolgen können, durch die lange Insertionen auf Basis von PE möglicherweise gehemmt werden könnten.
  • In weiteren Ausführungsformen kann die PEgRNA verbessert werden, indem zusätzliche RNA-Motive an die 5'- und 3'-Termini der PEgRNAs oder sogar an Positionen dazwischen (z. B. in der gRNA-Kernregion oder dem Spacer) eingefügt werden. Mehrere solche Motive, etwa PAN ENE von KSHV und ENE von MALAT1, wurden vorstehend als mögliche Mittel zum Beenden der Expression längerer Promotor aus Nicht-pol-III-Promotoren erläutert. Diese Elemente aus dreisträngigen RNA-Helices, den polyA-Schwanz umgeben führen dazu, dass sie innerhalb des Nucleus zurückgehalten werden184, 187. Indem sie komplexe Strukturen am 3'-Terminus der PEgRNA bilden, die das endständige Nukleotid verdecken, würden diese Strukturen wahrscheinlich auch dazu beitragen, den durch Exonuklease vermittelten Abbau von PEgRNAs zu verhindern.
  • Andere Strukturelemente, die am 3'-Terminus eingefügt werden, könnten auch die Stabilität von RNA steigern, ohne aber die Beendigung von Nicht-pol-III-Promotoren zu ermöglichen. Solche Motive könnten u. a. sein: Haarnadeln oder RNA-Quadruplexe, die den 3'-Terminus verdecken würden197, oder selbstschneidende Ribozyme wie bspw. HDV, die zur Bildung eines cyclischen 2'-3'-Phosphats am 3'-Terminus führen und möglicherweise auch die Wahrscheinlichkeit verringern würden, dass die PEgRNA durch Exonukleasen abgebaut wird198. Das Induzieren der PEgRNA, über inkomplettes Spleißen zu cyclisieren - um eine ciRNA zu bilden - könnte die Stabilität von PEgRNA erhöhen und dazu führen, dass die PEgRNA im Nucleus zurückgehalten wird194.
  • Zusätzlich RNA-Motive könnten ebenfalls die RT-Prozessivität verbessern oder die Aktivität von PEgRNA erhöhen, indem sie RT-Bindung an den DNA-RNA-Duplex verstärkt wird. Die Addition der nativen Sequenz, die durch die RT in ihrem retroviralen Genom gleicher Abstammung gebunden wird, könnte die Aktivität von RT steigern199. Dazu könnten zählen: die native Primerbindungsstelle (PBS), der Polypurintrakt (PPT) oder Kissing Loops, die ein Rolle bei der Dimerisierung des retroviralen Genoms und der Transkriptionsinitiation spielen199.
  • Die Addition von Dimerisierungsmotiven - etwa Kissing Loops oder ein GNRA-Tetraschleife/Tetraschleife-Rezeptorpaar200 - am 5'- und 3'-Terminus der PEgRNA könnte euch eine effektive Zirkularisierung der PEgRNA führen, was die Stabilität verbessern würde. Des Weiteren wird in Erwägung gezogen, dass die Addition dieser Motive die physische Trennung des PEgRNA-Spacers und Primers, die Verhinderung der Verdeckung des Spacers ermöglichen könnte, was die PE-Aktivität behindern würde. Kurze 5'-Verlängerungen oder 3'-Verlängerungen der PEgRNA, die eine Haarnadel mit einem kleinen Ansatzpunkt in der Spacerregion oder entlang der Primerbindungsstelle bilden, könnten auch erfolgreich gegen das Anlagern von intrakomplementären Regionen entlang der PEgRNA konkurrieren, bspw. die Wechselwirkung zwischen dem Spacer und der Primerbindungsstelle, die auftreten kann. Letztlich könnten auch Kissing Loops verwendet werden, um andere Vorlagen-RNAs zur Genomstelle zu rekrutieren und den Wechsel der RT-Aktivität von einer RNA zur anderen zu ermöglichen. Als Ausführungsbeispiele für verschiedene Sekundärstrukturen werden bei der in den 3D und 3E abgebildeten PEgRNA einige sekundäre RNA-Strukturen aufgelistet, die in eine jede Region der PEgRNA eingebaut werden kann, wozu auch die terminalen Abschnitte des Verlängerungsarms (d. h. e1 und e2) gehören, wie gezeigt.
  • Zu beispielhaften Verbesserungen zählen unter anderem:
    • PEgRNA-HDV-Fusion
       GGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTA
       GTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGC
       TCAGTCTGGGCCGGCATGGTCCCAGCCTCCTCGCTGGCGCCGGCTGGGCAACATGCT
       TCGGCATGGCGAATGGGACTTTTTTT (SEQ ID NO: 230)
    • PEgRNA-MMLV-Kissing-Loop
       GGTGGGAGACGTCCCACCGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAG
       CAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCC
       TCTGCCATCAAAGCTTCGACCGTGCTCAGTCTGGTGGGAGACGTCCCACCTTTTTTT
       (SEQ ID NO: 231)
    • PEgRNA-VS-Ribozym-Kissing-Loop
       GAGCAGCATGGCGTCGCTGCTCACGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAG
       AAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGT
       CGGTCCTCTGCCATCAAAGCTTCGACCGTGCTCAGTCTCCATCAGTTGACACCCTGAG
       GTTTTTTT (SEQ ID NO: 232)
    • PEgRNA-GNRA-Tetraschleife/Tetraschleife-Rezeptor
       GCAGACCTAAGTGGUGACATATGGTCTGGGCCCAGACTGAGCACGTGAGTTTTAGAG
       CTAUACGTAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTUACGAAGTGGGACC
       GAGTCGGTCCTCTGCCATCAAAGCTTCGACCGTGCTCAGTCTGCATGCGATTAGAAAT
       AATCGCATGTTTTTTT (SEQ ID NO: 233)
    • PEgRNA-Vorlage mit Wechsel der sekundären RNA-HDV-Fusion
       TCTGCCATCAAAGCTGCGACCGTGCTCAGTCTGGTGGGAGACGTCCCACCGGCCGGC
       ATGGTCCCAGCCTCCTCGCTGGCGCCGGCTGGGCAACATGCTTCGGCATGGCGAATG
       GGACTTTTTTT (SEQ ID NO: 234)
  • Das PEgRNA-Gerüst könnte durch gerichtete Evolution weiter verbessert werden, analog dazu, wie SpCas9 und der Prime Editor (PE) verbessert worden sind. Die gerichtete Evolution könnte die Erkennung von PEgRNA durch Cas9 oder weiterentwickelte Cas9-Varianten steigern. Des Weiteren ist es wahrscheinlich, dass verschiedene PEgRNA-Gerüstsequenzen an verschiedenen genomischen Loci optimal wären, entweder durch Steigern der PE-Aktivität an der betreffenden Stelle, Reduzieren von Aktivität jenseits des Ziels oder beides. Schließlich würde die Weiterentwicklung von PEgRNA-Gerüsten, an die andere RNA-Motive hinzugefügt wurden, die Aktivität der fusionierten PEgRNA in Bezug auf die nicht weiterentwickelte Fusions-RNA nahezu sicher verbessern. Beispielsweise führte die Weiterentwicklung von allosterischen Ribozymen, die aus c-di-GMP-I-Aptameren und Hammerhead-Ribozymen bestehen, zu einer erheblich verbesserten Aktivität202, was darauf hindeutet, dass die Weiterentwicklung auch die Aktivität von Hammerhead-PEgRNA-Fusionen verbessern würde. Während Cas9 gegenwärtig im Allgemeinen keine 5'-Verlängerung der sgRNA toleriert, ist es des Weiteren wahrscheinlich, dass die gerichtete Evolution befähigende Mutationen hervorbringen wird, welche diese Intoleranz abschwächen, was es ermöglichen würde, zusätzliche RNA-Motive zu nutzen.
  • Die vorliegende Offenbarung beliebige solcher Möglichkeiten vor, um die Effizienz der vorliegend offenbarten Prime-Editing-Systeme weiter zu verbessern.
  • In verschiedenen Ausführungsformen kann es vorteilhaft sein, das Auftreten einer Abfolge aufeinanderfolgender Ts ab dem Verlängerungsarm zu begrenzen, da eine Reihe aufeinanderfolgender Ts das Vermögen der PEgRNA, transkribiert zu werden, begrenzen kann. Beispielsweise sollten Stränge aus mindestens drei aufeinanderfolgenden Ts, mindestens vier aufeinanderfolgenden Ts, mindestens fünf aufeinanderfolgenden Ts, mindestens sechs aufeinanderfolgenden Ts, mindestens sieben aufeinanderfolgenden Ts, mindestens acht aufeinanderfolgenden Ts, mindestens neun aufeinanderfolgenden Ts, mindestens zehn aufeinanderfolgenden Ts, mindestens elf aufeinanderfolgenden Ts, mindestens zwölf aufeinanderfolgenden Ts, mindestens dreizehn aufeinanderfolgenden Ts, mindestens vierzehn aufeinanderfolgenden Ts oder mindestens fünfzehn aufeinanderfolgenden Ts bei der Gestaltung der PEgRNA vermieden oder zumindest von der finalen gestalteten Sequenz entfernt werden. In einer Ausführungsform kann die Einbeziehung ungewollter Stränge aufeinanderfolgender Ts in PEgRNA-Verlängerungsarmen verhindert werden, wobei jedoch Zielstellen vermieden werden, die reich an aufeinanderfolgenden A:T-Nukleobasenpaaren sind.
  • Gestaltungen gespaltener PEgRNA für trans Prime Editing
  • Die vorliegende Offenbarung sieht auch trans Prime Editing vor, bei dem es sich um eine modifizierte Version des Prime Editing handelt, das durch Auftrennen der PEgRNA in zwei unterschiedliche Moleküle funktioniert: eine Guide-RNA und ein tPERT-Molekül. Das tPERT-Molekül ist dazu programmiert, sich an einer angezielten DNA-Stelle mit dem Prime-Editor-Komplex zu kolokalisieren, wodurch die Programm-Bindungsstelle und die Vorlage für die DNA-Synthese in trans zum Prime Editor gebracht werden. In 3G findet sich zum Beispiel eine Ausführungsform eines trans Prime Editors (tPE), der ein Zweikomponentensystem zeigt, umfassend (1) einen Rekrutierprotein(RP)-PE:gRNA-Komplex und (2) eine tPERT, die eine Primer-Bindungsstelle und eine Vorlage zur DNA-Synthese beinhaltet, angefügt an eine RNA-Proteinrekrutierdomäne (zum Beispiel Stamm-Schleife oder Haarnadel), wobei die Rekrutierproteinkomponente des RP-PE:gRNA-Komplexes die tPERT zu einer Zielstelle rekrutiert, die editiert werden soll, wodurch die PBS und die Vorlage zur DNA-Synthese in trans mit dem Prime Editor assoziiert werden. Anders formuliert, wird die tPERT derart konstruiert, dass sie den Verlängerungsarm einer PEgRNA (komplett oder in Teilen) enthält, der die Primer-Bindungsstelle und die Vorlage zur DNA-Synthese beinhaltet. Ein Vorteil dieser Herangehensweise besteht im Abtrennen des Verlängerungsarmt einer PEgRNA von der Guide-RNA, wodurch Anlagerungswechselwirkungen minimiert werden, die tendenziell zwischen der PBS des Verlängerungsarms und der Spacersequenz der Guide-RNA auftreten.
  • Ein wesentliches Merkmal des trans Prime Editing ist die Fähigkeit des trans Prime Editors, die tPERT zum Ort der DNA-Editierung zu rekrutieren; im Ergebnis werden alle der Funktionen einer PEgRNA am Ort des Prime Editing kolokalisiert. Die Rekrutierung kann durch Einbauen einer RNA-Proteinrekrutierdomäne wie bspw. eines Ms2-Aptamers in die tPERT und Fusionieren eines entsprechenden Rekrutierproteins an den Prime Editor (z. B. über einen Linker an das napDNAbp oder über einen Linker an die Polymerase) erreicht werden, der in der Lage ist, spezifisch an die RNA-Proteinrektrutierdomäne zu binden, wodurch das tPERT-Molekül zum Prime-Editor-Komplex rekrutiert wird. Wie bei dem in 3H beschriebenen Verfahren abgebildet, bindet der RP-PE:gRNA-Komplex an die Ziel-DNA-Sequenz und nimmt einen Nick an dieser vor. Daraufhin rekrutiert das Rekrutierprotein (RP) eine tPERT zur Kolokalisierung an den Prime-Editor-Komplex, der an die DNA-Zielstelle gebunden ist, was es ermöglicht, dass die Primer-Bindungsstelle, die sich an der tPERT befindet, an dem mit einem Nick versehenen Strang an die Primer-Sequenz zu binden, und was es daraufhin ermöglicht, dass die Polymerase (z. B. RT) einen einzelnen DNA-Strang im Abgleich mit der Vorlage für die DNA-Synthese synthetisiert, die sich an dem tPERT befindet, was bis zum 5'-Ende der tPERT erfolgt.
  • Der Darstellung in den 3G und 3H gemäß umfasst die tPERT zwar die PBS und die Vorlage zur DNA-Synthese am 5'-Ende der RNA-Proteinrekrutierdomäne, doch kann die tPERT in anderen Konfigurationen derart gestaltet sein, dass sich die PBS und die Vorlage für die DNA-Synthese am 3'-Ende der RNA-Proteinrekrutierdomäne befindet. Mit der 5'-Verlängerung besitzt die tPERT allerdings den Vorteil, dass die Synthese des einzelnen DNA-Strangs natürlicherweise am 5'-Ende der tPERT enden wird und somit kein Risiko besteht, dass ein Abschnitt der RNA-Proteinrekrutierdomäne während der Phase der DNA-Synthese des Prime Editing als Vorlage verwendet wird.
  • Verfahren zur PEgRNA-Gestaltung
  • Die vorliegende Offenbarung bezieht sich auch auf Verfahren zur Gestaltung von PEgRNAs.
  • In einem Gestaltungsaspekt kann bei dem Gestaltungsansatz die jeweilige Anwendung berücksichtigt werden, für welche das Prime Editing verwendet wird. Als Beispiel, und wie vorliegend veranschaulicht und erläutert, kann das Prime Editing u. a. verwendet werden zum (a) Einbringen mutationskorrigierender Veränderungen in eine Nukleotidsequenz, (b) Einbringen von Protein- und RNA-Tags, (c) Einbringen von Immunepitopen an interessierende Proteine, (d) Einbringen induzierbarer Dimerisierungsdomänen in Proteinen, (e) Einbringen oder Entfernen von Sequenzen, um jene Aktivität eines Biomoleküls abzuändern, (f) Einbringen von Rekombinasezielstellen zum Lenken spezifischer genetischer Veränderungen und (g) Mutagenes einer Target-Sequenz unter Verwendung einer fehleranfälligen RT. Zusätzlich zu diesen Verfahren, bei diesen im Allgemeinen Nukleotidsequenzen an interessierenden Zielstellen eingefügt, geändert oder deletiert werden, können Prime Editors auch zum Konstruieren stark programmierbarer Bibliotheken als auch zum Durchführen von Zelldatenaufzeichnungen und Studien zur Verfolgung von Zelllinien verwendet werden. Bei diesen unterschiedlichen Verwendungsmöglichkeiten kann es, wie vorliegend beschrieben, bestimmte Gestaltungsaspekte geben, welche die Herstellung einer PEgRNA betreffen und für eine jede beliebige dieser Anwendungen besonders nützlich ist.
  • In die Gestaltung einer PEgRNA für eine jeweilige Anwendung oder Verwendung des Prime Editing kann eine Reihe von Überlegungen einfließen, wozu unter anderem Folgende zählen:
    1. (a) die Target-Sequenz, d. h. die Nukleotidsequenz, in die man eine oder mehrere Nukleobasenmodifikationen mithilfe des Prime Editors einbringen will;
    2. (b) die Lage der Schnittstelle innerhalb der Target-Sequenz, d. h. die spezifische Nukleobasenposition, an welcher der Prime Editor einen Einzelstrang-Nick induzieren wird, um eine RT-Primer-Sequenz am 3'-Ende auf einer Seite des Nick und den endogenen Flap am 5'-Ende auf der anderen Seite des Nick zu erzeugen (der am Ende durch FEN1 oder ein Äquivalent davon entfernt und durch den ssDNA-Flap an 3' ersetzt wird. Die Schnittstelle ist zur „Editierposition“ analog, da eben dadurch die RT-Primer-Sequenz am 3'-Ende entsteht, welche durch die RT während der RNA-abhängigen DNA-Polymerisierung verlängert wird, um den ssDNA-Flap an 3' zu erzeugen, der die gewünschte Editierung enthält und dann den endogenen DNA-Flap an 5' in der Target-Sequenz ersetzt.
    3. (c) die verfügbaren PAM-Sequenzen (einschließlich der kanonischen SpCas9-PAM-Stellen wie auch nicht-kanonischen PAM-Stellen, die durch Cas9-Varianten und Äquivalente mit erweiterten oder abweichenden PAM-Spezifitäten erkannt werden);
    4. (d) die Beabstandung zwischen den verfügbaren PAM-Sequenzen und der Position der Schnittstelle in der Target-Sequenz;
    5. (e) das bzw. die jeweils verwendete Cas9, Cas9-Variante oder Cas9-Äquivalent des Prime Editors;
    6. (f) die Sequenz und Länge der Primer-Bindungsstelle;
    7. (g) die Sequenz und Länge der Editiervorlage;
    8. (h) die Sequenz und Länge des Homologiearms;
    9. (i) die Spacersequenz und -länge; und
    10. (j) die Kernsequenz.
  • In der vorliegenden Offenbarung werden diese vorgenannten Aspekte erläutert.
  • In einer Ausführungsform sind hiermit eine Herangehensweise zum Gestalten einer geeigneten PEgRNA und optional eine Gestaltungsanleitung für Nick-sgRNA zum Vornehmen von Zweitstellen-Nicks bereitgestellt. Diese Ausführungsform stellt eine Schritt für Schritt aufgebaute Reihe an Anweisungen zum Gestalten von PEgRNAs und Nick-sgRNAs zum Prime Editing bereit, bei der eine oder mehrere der vorstehenden Überlegungen Berücksichtigung finden. Die Schritte nehmen auf die Beispiele Bezug, die in den 70A-70I gezeigt werden.
    1. 1. Definieren der Target-Sequenz und der Editierung. Auffinden der Sequenz der Ziel-DNA-Region (~200 bp), die sich mittig an der Position der gewünschten Editierung (Punktmutation, Insertion, Deletion oder Kombination daraus) befindet. Siehe 70A.
    2. 2. Lokalisieren von Ziel-PAMs. PAMs in der Nähe zur gewünschten Editierposition identifizieren. PAMs können an jedem DNA-Strang, der sich in der Nähe der gewünschten Editierposition befindet, identifiziert werden. PAMs nahe der Editierposition sind zwar bevorzugt (d. h., wenn die Nick-Stelle weniger als 30 nt von der Editierposition oder weniger als 29 nt, 28 nt, 27 nt, 26 nt, 25 nt, 24 nt, 23 nt, 22 nt, 21 nt, 20 nt, 19 nt, 18 nt, 17 nt, 16 nt, 15 nt, 14 nt, 13 nt, 12 nt, 11 nt, 10 nt, 9 nt, 8 nt, 7 nt, 6 nt, 5 nt, 4 nt, 3 nt oder 2 nt von der Editierposition zur Nick-Stelle entfernt ist), doch ist es möglich, Editierungen unter Verwendung von Protospacem und PAMs einzubringen, durch welche die Nick-Stelle ≥ 30 nt von der Editierposition entfernt platziert wird. Siehe 70B.
    3. 3. Lokalisieren von Nick-Stellen. Für jedes in Betracht gezogene PAM: Identifizieren der entsprechenden Nick-Stelle und auf welchem Strang sie sich befindet. Im Falle von Sp-Cas9-H840A-Nickase erfolgt die Spaltung im PAM enthaltenden Strang zwischen der 3. und 4. Base 5' des NGG-PAM. Alle editierten Nukleotide müssen 3' der Nick-Stelle vorliegen, weshalb passende PAMs die Nick-Stelle 5' der Zieleditierung am PAM enthaltenden Strang platzieren müssen. Im weiter unten gezeigten Beispiel liegen zwei mögliche PAMs vor. Der Einfachheit halber wird in den verbleibenden Schritten die Gestaltung einer PEgRNA unter Verwendung von PAM 1 allein demonstriert. Siehe 70C.
    4. 4. Gestaltung der Spacersequenz. Der Protospacer von Sp Cas9 entspricht den 20 Nukleotiden 5' des NGG-PAM an dem PAM enthaltenden Strang. Für eine effiziente Initiierung der pol-III-Transkription ist es erforderlich, dass ein G das erste transkribierte Nukleotid ist. Wenn das erste Nukleotid des Protospacers ein G ist, ist die Spacersequenz für die PEgRNA einfach die Protospacersequenz. Ist das erste Nukleotid des Protospacers kein G, so ist die Spacersequenz der PEgRNA ein von der Protospacersequenz gefolgtes G. Siehe 70D.
    5. 5. Gestaltung einer Primer-Bindungsstelle (PBS). Identifizieren des DNA-Primers am PAM enthaltenden Strang unter Verwendung der Startallelsequenz. Das 3'-Ende des DNA-Primers ist das Nukleotid direkt strangaufwärts der Nick-Stelle (d. h. die 4. Base 5' zum NGG-PAM im Falle von Sp Cas9). Als allgemeines Gestaltungsprinzip zur Verwendung mit PE2 und PE3 kann eine PEgRNA-Primer-Bindungsstelle (PBS), die 12 bis 13 Nukleotide mit Komplementarität zum DNA-Primer enthält, für Sequenzen verwendet werden, die einen GC-Gehalt von -40-60 % aufweisen. Bei Sequenzen mit geringem GC-Gehalt sollten längere (14 bis 15 nt) PBS getestet werden. Bei Sequenzen mit höherem GC-Gehalt sollten kürzere (8 bis 11 nt) PBS getestet werden. Optimale PBS-Sequenzen sollten ungeachtet des GC-Gehalts empirisch bestimmt werden. Um eine PBS-Sequenz einer Länge p zu gestalten, wird das Umkehrkomplement der ersten p Nukleotide 5' der Nick-Stelle im PAM enthaltenden Strang unter Verwendung der Startallelsequenz hinzugezogen. Siehe 70E.
    6. 6. Gestaltung einer RT-Vorlage (oder Vorlage zur DNA-Synthese) Die RT-Vorlage (oder Vorlage zur DNA-Synthese, falls die Polymerase keine reverse Transkriptase ist) codiert die gestaltete Editierung und Homologie zur an die Editierung angrenzenden Sequenz. In einer Ausführungsform entsprechend diese Regionen der Vorlage zur DNA-Synthese in den 3D und 3E, wobei die Vorlage zur DNA-Synthese die „Editiervorlage“ und den „Homologiearm“ umfasst. Die optimale Länge für eine RT-Vorlage variiert je nach Zielstelle. Für Editierungen kurzer Strecken (Positionen +1 und +6) wird empfohlen, eine kurze (9 bis 12 nt), eine mittlere (13 bis 16 nt) und eine lange (17 bis 20 nt) RT-Vorlage zu testen. Für Editierungen langer Strecken (Positionen +7 und darüber hinaus) wird empfohlen, RT-Vorlagen zu verwenden, die sich um mindestens 5 nt (vorzugsweise 10 oder mehr nt) über die Position der Editierung hinaus erstrecken, um eine ausreichende Homologie mit dem DNA-Flap an 3' zu ermöglichen. Für Editierungen langer Strecken sollten mehrere RT-Vorlagen durchmustert werden, um funktionale Gestaltungen zu identifizieren. Für längere Insertionen und Deletionen (≥5 nt) wird die Einarbeitung einer größeren 3'-Homologie (~20 nt oder mehr) in die RT-Vorlage empfohlen. Die Effizienz der Editierung wird typischerweise beeinträchtigt, wenn die RT-Vorlage die Synthese eines G als letztes Nukleotid im revers transkribierten DNA-Produkt (das einem C in der RT-Vorlage der PEgRNA entspricht) codiert. Da viele RT-Vorlagen ein effizientes Prime Editing unterstützen, wird für die Gestaltung von RT-Vorlagen empfohlen, G als finales synthetisiertes Nukleotid zu vermeiden. Zum Gestalten einer RT-Vorlagen-Sequenz der Länge r wird die gewünschte Allelsequenz verwendet und das reverse Komplement der ersten r Nukleotide 3' der Nick-Stelle in dem Strang genommen, der ursprünglich das PAM enthalten hatte. Es sei darauf hingewiesen, dass Insertions- oder Deletionseditierungen unter Verwendung von RT-Vorlagen der gleichen Länge im Unterschied zu SNP-Editierungen keine identische Homologie enthalten werden. Siehe 70F.
    7. 7. Assemblieren der kompletten PEgRNA-Sequenz Verknüpfen der PEgRNA-Komponenten in der folgenden Reihenfolge ((5' zu 3'): Spacer, Gerüst, RT-Vorlage und PBS. Siehe 70G.
    8. 8. Gestaltung von Nick-sgRNAs für PE3. Identifizieren von PAMs am nicht editierten Strang strangaufwärts und strangabwärts der Editierung. Optimale Positionen für Einzelstrangbrüche sind sehr ortsabhängig und sollten empirisch bestimmt werden. Im Allgemeinen ergeben Einzelstrangbrüche bei 40 bis 90 Nukleotiden 5' zur Position gegenüber des PEgRNA-induzierten Nicks höhere Editierausbeuten und weniger Indels. Eine Nick-sgRNA weist eine Spacersequenz auf, die mit dem 20-nt-Protospacer im Startallel übereinstimmt, mit Addition eines 5'-G, falls der Protospacer nicht mit einem G beginnt. Siehe 70H.
    9. 9. Gestaltung von Nick-sgRNAs für PE3b. Wenn im komplementären Strang ein PAM vorliegt und sein entsprechender Protospacer die für die Editierung angezielte Sequenz überlappt, könnte diese Editierung ein Kandidat für das PE3b-System sein. Im PE3b-System stimmt die Spacersequenz der Nick-sgRNA mit der Sequenz des gewünschten editierten Allels, nicht jedoch des Startallels überein. Das PE3b-System funktioniert effizient, wenn das editierte Nukleotid bzw. die editierten Nukleotide in die Seed-Region (~10 nt angrenzend an das PAM) des Nick-sgRNA-Protospacers fällt. Dies verhindert Einzelstrangbrüche des komplementären Strangs bis nach der Einbringung des editierten Strangs, was einer Konkurrenz zwischen der PEgRNA und der sgRNA um die Bindung der Ziel-DNA vorbeugt. PE3b verhindert zudem die Erzeugung simultaner Nicks an beiden Strängen, was die Bildung von Indels signifikant verringert, während eine hohe Effizienz der Editierung aufrechterhalten wird. PE3b-sgRNAs sollten eine Spacersequenz aufweisen, die mit dem 20-nt-Protospacer im gewünschten Allel übereinstimmt, gegebenenfalls mit Addition eines 5' G. Siehe 70I.
  • Der vorstehende Schritt-für-Schritt-Prozess zum Gestalten einer geeigneten PEgRNA und einer Zweitstellen- Nick-sgRNA ist in keiner Weise einschränkend gedacht. Die Offenbarung sieht Variationen des vorbeschriebenen Schritt-für-Schritt-Prozesses vor, die von Durchschnittsfachmann daraus ableitbar wären.
  • [71 Anwendungen mit Prime Editing
  • Zusätzlich zur Entwicklung des vorliegend beschriebenen Prime-Editing-Systems als neue „Suchen-und-Ersetzen“-Technik für die Genomeditierung, die angestrebte Insertionen, Deletionen und alle 12 möglichen Base-zu-Base-Konversionen an angezielten Loci in menschlichen Zellen vermittelt, ohne dass doppelsträngige DNA-Brüche oder Donor-DNA-Vorlagen erforderlich sind, haben die Erfinder auch die Verwendung der Prime Editors in einer breiten Palette konkreter Anwendungen vorgesehen. Als Beispiel, und wie vorliegend veranschaulicht und erläutert, kann das Prime Editing verwendet werden zum (a) Einbringen mutationskorrigierender Veränderungen in eine Nukleotidsequenz, (b) Einbringen von Protein- und RNA-Tags, (c) Einbringen von Immunepitopen an interessierende Proteine, (d) Einbringen induzierbarer Dimerisierungsdomänen in Proteinen, (e) Einbringen oder Entfernen von Sequenzen, um jene Aktivität eines Biomoleküls abzuändern, (f) Einbringen von Rekombinasezielstellen zum Lenken spezifischer genetischer Veränderungen und (g) Mutagenes einer Target-Sequenz unter Verwendung einer fehleranfälligen RT. Zusätzlich zu diesen Verfahren, bei diesen im Allgemeinen Nukleotidsequenzen an interessierenden Zielstellen eingefügt, geändert oder deletiert werden, können Prime Editors auch zum Konstruieren stark programmierbarer Bibliotheken als auch zum Durchführen von Zelldatenaufzeichnungen und Studien zur Verfolgung von Zelllinien verwendet werden. Die Erfinder haben zudem zusätzliche Gestaltungsmerkmale von PEgRNAs vorgesehen, die im Hinblick auf eine Verbesserung der Effizienz des Prime Editing angestrebt werden. Darüber hinaus haben die Erfinder Verfahren für die erfolgreiche Abgabe von Prime Editors vorgesehen, in denen Vektorabgabesysteme verwendet werden und die ein Spalten des napDNAbp unter Verwendung von Intein-Domänen beinhalten.
  • Diese konkreten beispielhaften Verwendungsmöglichkeiten des Prime Editing sind in keiner Weise beschränkend gedacht. Die vorliegende Anmeldung sieht eine jede Verwendungsmöglichkeit für das Prime Editing vor, die im Allgemeinen eine Form der Einbringung, Entfernung und/oder Modifikation einer oder mehrerer Nukleobase an einer Zielstelle in einer Nukleotidsequenz, bspw. einer genomischen DNA, beinhaltet.
  • Für eine jede der beispielhaft genannten Verwendungsmöglichkeiten für das Prime Editing kann ein jeder vorliegend offenbarter Prime Editor verwendet werden, darunter PE1, PE2, PE3 und PE3b oder PE-short.
  • A. Prime-Editing-Mechanismus
  • In verschiedenen Ausführungsformen funktioniert das Prime Editing (oder „Prime Editing“) so, dass ein Ziel-DNA-Molekül (bei dem gewünscht ist, dass eine Änderung in die Nukleotidsequenz eingebracht wird) mit einem Nukleinsäure-programmierbaren DNA-Bindungsprotein (napDNAbp) in Kontakt gebracht wird, das mit einer verlängerten Guide-RNA komplexiert ist. Die verlängerte Guide-RNA, Bezug nehmend auf 1G, umfasst eine Verlängerung am 3'- oder 5 ‚-Ende der Guide-RNA oder an einer intramolekularen Stelle in der Guide-RNA und codiert die gewünschte Nukleotidänderung (z. B. eine einzelne Nukleotidänderung, Insertion oder Deletion). In Schritt (a) tritt der Komplex aus napDNAbp/verlängerter gRNA mit dem DNA-Molekül in Kontakt, und die verlängerte gRNA leitet das napDNAbp derart an, dass es an einen Ziellocus bindet. In Schritt (b) wird ein Nick in einem der DNA-Stränge des Ziellocus eingeführt (bspw. durch eine Nuklease oder ein chemisches Mittel), wodurch ein verfügbares 3‘-Ende in einem der Stränge des Ziellocus geschaffen wird. In bestimmten Ausführungsformen wird der Nick in dem DNA-Strang erzeugt, der dem R-Schleifen-Strang entspricht, d. h. dem Strang, der nicht an die Guide-RNA-Sequenz hybridisiert wird, sprich, dem „Nicht-Ziel-Strang“. Der Nick könnte dabei jedoch in einen jeden der Stränge eingeführt werden. Das heißt, der Nick könnte in den „Zielstrang“ der R-Schleife (also den Strang, der an die Protospacersequenz der verlängerten gRNA hybridisiert ist) oder den „Nicht-Ziel-Strang“ (also den Strang, der den einzelsträngigen Abschnitt der R-Schleife bildet und der komplementär zum Zielstrang ist) eingeführt werden. In Schritt (c) interagiert das 3'-Ende des DNA-Strangs (das durch den Nick gebildet wurde) mit dem verlängerten Abschnitt der Guide-RNA, um ein Priming an der reversen Transkription vorzunehmen (d. h. „Target-primierte RT“). In bestimmten Ausführungsformen hybridisiert der DNA-Strang am 3'-Ende an eine spezifische RT-Priming-Sequenz am verlängerten Abschnitt der Guide-RNA, d. h. der „reverse-Transkriptase-Priming-Sequenz“. In Schritt (d) wird eine reverse Transkriptase eingeführt (als Fusionsprotein mit dem napDNAbp oder in trans), die einen einzelnen DNA-Strang ab dem 3'-Ende der primierten Stelle hin zum 5'-Ende der verlängerten Guide-RNA synthetisiert. Dadurch wird ein Einzelstrang-DNA-Flap gebildet, der die gewünschte Nukleotidänderung (z. B. die einzelne Basenänderung, Insertion oder Deletion oder eine Kombination daraus) umfasst und ansonsten homolog zur endogenen DNA an oder neben der Nick-Stelle ist. In Schritt (e) werden das napDNAbp und die Guide-RNA freigesetzt. Die Schritte (f) und (g) betreffen die Auflösung des Einzelstrang-DNA-Flaps, derart, dass die gewünschte Nukleotidänderung in den Ziellocus eingearbeitet wird. Dieser Prozess kann zur Bildung des gewünschten Produkts hingeleitet werden, indem der entsprechende endogene DNA-Flap an 5' entfernt wird (z. B. durch FEN1 oder ein ähnliches Enzym, das in trans, als Fusion mit dem Prime Editor, oder endogen bereitgestellt wird), der sich bildet, sobald der Einzelstrang-DNA-Flap 3' die endogene DNA-Sequenz invadiert und daran hybridisiert. Ohne an eine Theorie gebunden zu sein, wird die DNA mit fehlender Übereinstimmung durch die Prozesse der Reparatur und Replikation endogener DNA der Zellen aufgelöst, um die Nukleotidänderung(en) einzuarbeiten und so das gewünschte abgeänderte Produkt zu bilden. Dieser Prozess kann auch zu einer Produktbildung mit „Zweitstrang-Nick“ hingeleitet werden, wie in 1G veranschaulicht, oder zu einem „zeitlichen Zweitstrang-Nick“, wie in 1I veranschaulicht und vorliegend erläutert.
  • Dieser Prozess des Prime Editing kann zumindest eine oder mehrere der folgenden genetischen Änderungen einbringen: Transversionen, Transitionen, Deletionen und Insertionen. Des Weiteren kann das Prime Editing für bestimmt Anwendungen umgesetzt werden. Als Beispiel, und wie vorliegend veranschaulicht und erläutert, kann das Prime Editing verwendet werden zum (a) Einbringen mutationskorrigierender Veränderungen in eine Nukleotidsequenz, (b) Einbringen von Protein- und RNA-Tags, (c) Einbringen von Immunepitopen an interessierende Proteine, (d) Einbringen induzierbarer Dimerisierungsdomänen in Proteinen, (e) Einbringen oder Entfernen von Sequenzen, um jene Aktivität eines Biomoleküls abzuändern, (f) Einbringen von Rekombinasezielstellen zum Lenken spezifischer genetischer Veränderungen und (g) Mutagenes einer Target-Sequenz unter Verwendung einer fehleranfälligen RT. Zusätzlich zu diesen Verfahren, bei diesen im Allgemeinen Nukleotidsequenzen an interessierenden Zielstellen eingefügt, geändert oder deletiert werden, können Prime Editors auch zum Konstruieren stark programmierbarer Bibliotheken als auch zum Durchführen von Zelldatenaufzeichnungen und Studien zur Verfolgung von Zelllinien verwendet werden. Die Erfinder haben zudem zusätzliche Gestaltungsmerkmale von PEgRNAs vorgesehen, die im Hinblick auf eine Verbesserung der Effizienz des Prime Editing angestrebt werden. Darüber hinaus haben die Erfinder Verfahren für die erfolgreiche Abgabe von Prime Editors vorgesehen, in denen Vektorabgabesysteme verwendet werden und die ein Spalten des napDNAbp unter Verwendung von Intein-Domänen beinhalten.
  • Der Begriff „Prime-Editing-System“ oder „Prime Editor (PE)“ bezeichnet die Zusammensetzungen, die in dem Verfahren der Genomeditierung unter Verwendung von Targetprimierter reverser Transkriptase (TPRT), wie vorliegend beschrieben, eine Rolle spielen, darunter die napDNAbps, reversen Transkriptasen, Fusionsproteine (z. B. napDNAbps und reverse Transkriptasen umfassend), verlängerte Guide-RNAs und Komplexe, die Fusionsproteine und verlängerte Guide-RNAs umfassen, wie auch Hilfselemente wie bspw. Zweitstrang- Nick-Komponenten und Endonukleasen zur Entfernung des endogenen DNA-Flaps 5' (z. B. FEN1), die zum Hinleiten des Prime-Editing-Prozesses hin zur Bildung des editierten Produkts unterstützen.
  • In einer anderen Ausführungsform bildet das Schema von 3F die Wechselwirkung einer typischen PEgRNA mit einer Zielstelle einer doppelsträngigen DNA und die begleitende Produktion eines Einzelstrang-DNA-Flaps 3' ab, der die interessierende genetische Änderung enthält. In der Darstellung sind der obere Strang der Doppelstrang-DNA von 3' zu 5' ausgerichtet, und der untere Strang verläuft in 3'-5'-Richtung. Der obere Strang umfasst den „Protospacer“ und die PAM-Sequenz und wird als „Zielstrang“ bezeichnet. Der komplementäre untere Strang wird als „Nicht-Ziel-Strang“ bezeichnet. Wenngleich dies nicht gezeigt ist, wäre die abgebildete PEgRNA mit einem Cas9 oder einem Äquivalent davon komplexiert. Wie in dem Schema gezeigt, lagert sich der Spacer der PEgRNA an eine komplementäre Region am Zielstrang an, die als Protospacer bezeichnet wird, sich strangaufwärts der PAM-Sequenz befindet und eine Länge von etwa 20 Nukleotiden aufweist. Diese Wechselwirkung bildet einen DNA/RNA-Hybrid zwischen der Spacer-RNA und der Protospacer-DNA und induziert die Bildung einer R-Schleife in der Region gegenüber dem Protospacer. Wie an anderer Stelle in dieser Schrift gelehrt, induziert das Cas9-Protein (nicht gezeigt) dann einen Nick im Nicht-Ziel-Strang, wie gezeigt. Dies führt dann zur Bildung zur ssDNA-Flapsregion 3', die, gemäß *z*, mit dem 3'-Ende der PEgRNA an der Primer-Bindungsstelle interagiert. Das 3'-Ende des ssDNA-Flaps (d. h. die Primer-Sequenz der reversen Transkriptase) lagert sich an die Primer-Bindungsstelle (A) an der PEgRNA an, wodurch die reverse Transkriptase primiert wird. Im Anschluss daran polymerisiert reverse Transkriptase (z. B. in trans bereitgestellt oder cis als Fusionsprotein bereitgestellt, angelagert an das Cas9-Konstrukt) einen einzelnen DNA-Strang, für den die Editiervorlage (B) und der Homologiearm (C) codieren. Die Polymerisierung setzt sich in Richtung des 5'-Endes des Verlängerungsarms fort. Der polymerisierte ssDNA-Strang bildet einen ssDNA-Flap am 3'-Ende, der, wie an anderer Stelle beschrieben (uns bspw. in 1G gezeigt), die endogene DNA invadiert und dabei den entsprechenden endogenen Strang verdrängt (der als 5'-DNA-Flap von endogener DNA entfernt wird) und die gewünschte Nukleotideditierung (einzelne Nukleotidbasenpaaränderung, Deletionen, Insertionen (einschließlich kompletter Gene) einbringt, was durch natürlich vorkommende Durchläufe der DNA-Reparatur/Replikation erfolgt.
  • Diese Anwendung des Prime Editing kann in Beispiel 1 weitergehend beschrieben werden.
  • B. Mutagenese unter Verwendung von Prime Editing mit fehleranfälliger RT
  • In verschiedenen Ausführungsformen kann das Prime-Editing-System (d. h. Prime-Editing-System) die Verwendung einer fehleranfälligen reversen Transkriptase beinhalten, um eine gezielte Mutagenese vorzunehmen, d. h. um nur einen gut definierten DNA-Abschnitt in einem Genom oder ein anderes DNA-Element in einer Zelle zu verändern. 22 stellt ein Schema eines beispielhaften Verfahrens zur Einführung des Vornehmens einer gezielten Mutagenese mit einer fehleranfälligen reversen Transkriptase an einem Ziellocus unter Verwendung eines Nukleinsäure-programmierbaren DNA-Bindungsproteins (napDNAbp) bereit, das mit einer verlängerten Guide-RNA komplexiert ist. Dieses Verfahren kann als eine Ausführungsform des Prime Editing zur gezielten Mutagenese bezeichnet werden. Die verlängerte Guide-RNA umfasst eine Verlängerung am 3'- oder 5'-Ende der Guide-RNA oder an einer intramolekularen Stelle in der Guide-RNA. In Schritt (a) tritt der Komplex aus napDNAbp/gRNA mit dem DNA-Molekül in Kontakt, und die gRNA leitet das napDNAbp derart an, dass es an den Ziellocus, an dem die Mutagenese vorgenommen werden soll, bindet. In Schritt (b) wird ein Nick in einem der DNA-Stränge des Ziellocus eingeführt (bspw. durch eine Nuklease oder ein chemisches Mittel), wodurch ein verfügbares 3'-Ende in einem der Stränge des Ziellocus geschaffen wird. In bestimmten Ausführungsformen wird der Nick in dem DNA-Strang erzeugt, der dem R-Schleifen-Strang entspricht, d. h. dem Strang, der nicht an die Guide-RNA-Sequenz hybridisiert wird. In Schritt (c) interagiert der 3'-Ende-DNA-Strang mit dem verlängerten Abschnitt der Guide-RNA, um ein Priming an der reversen Transkription vorzunehmen. In bestimmten Ausführungsformen hybridisiert der an 3' endständige DNA-Strang an eine spezifische RT-Priming-Sequenz am verlängerten Abschnitt der Guide-RNA. In Schritt (d) wird eine fehleranfällige reverse Transkriptase eingeführt, die einen per Mutagenese veränderten einzelnen DNA-Strang ab dem 3'-Ende der primierten Stelle hin zum 3'-Ende der Guide-RNA synthetisiert. Beispielhafte Mutationen sind mit einem Sternchen, „*“, gekennzeichnet. Dadurch wird ein Einzelstrang-DNA-Flap gebildet, der die gewünschte per Mutagenese veränderte Region umfasst. In Schritt (e) werden das napDNAbp und die Guide-RNA freigesetzt. Die Schritte (f) und (g) betreffen die Auflösung des Einzelstrang-DNA-Flaps (der die per Mutagenese veränderte Region umfasst), derart, dass die gewünschte per Mutagenese veränderte Region in den Ziellocus eingearbeitet wird. Dieser Prozess kann zur Bildung des gewünschten Produkts hingeleitet werden, indem der entsprechende endogene DNA-Flap an 5' entfernt wird, der sich bildet, sobald der Einzelstrang-DNA-Flap 3' die komplementäre Sequenz am anderen Strang invadiert und daran hybridisiert. Dieser Prozess kann auch zu einer Produktbildung mit Zweitstrang- Nick hingeleitet werden, wie in 1F veranschaulicht. Nach Prozessen der Reparatur und/oder Replikation endogener DNA wird die per Mutagenese veränderte Region in beide DNA-Stränge des DNA-Locus eingearbeitet.
  • Diese Anwendung des Prime Editing kann in Beispiel 2 weitergehend beschrieben werden.
  • Fehleranfällige oder mutagene RT-Enzyme sind fachbekannt. Im vorliegenden Zusammenhang ist mit dem Begriff „fehleranfällige“ reverse Transkriptase ein reverses Transkriptase-Enzym gemeint, das natürlich vorkommt oder von einer anderen reversen Transkriptase abgeleitet wurde (bspw. einer reversen Wildtyp-M-MLV-Transkriptase) und eine Fehlerrate aufweist, die geringer als die Fehlerrate von reverser Wildtyp-M-MLV-Transkriptase ist. Die Fehlerrate der reversen Wildtyp-M-MLV-Transkriptase liegt Berichten zufolge im Bereich von einem Fehler bei 15.000 bis 27.000 Nukleobase-Einschlüsse. Siehe Boutabout et al. (2001), „DNA synthesis fidelity by the reverse transcriptase of the yeast retrotransposon Ty1“, Nucleic Acids Res 29(11):2217-2222, das durch Bezugnahme hierin aufgenommen wird. Im Rahmen der vorliegenden Anmeldung bezieht sich der Begriff „fehleranfällig“ somit auf jene RT, die eine Fehlerrate aufweisen, die größer ist als ein Fehler bei 15.000 Nukleobase-Einschlüssen (6,7 × 10-5
    oder höher), z. B. 1 Fehler in 14.000 Nukleobasen (7,14 × 10-5 oder höher), 1 Fehler in 13.000 Nukleobasen oder weniger (7,7 × 10-5 oder höher), 1 Fehler in 12.000 Nukleobasen oder weniger (7,7 × 10-5 oder höher), 1 Fehler in 11.000 Nukleobasen oder weniger (9,1 × 10-5 oder höher), 1 Fehler in 10.000 Nukleobasen oder weniger (1 × 10-4 oder 0,0001 oder höher), 1 Fehler in 9.000 Nukleobasen oder weniger (0,00011 oder höher), 1 Fehler in 8.000 Nukleobasen oder weniger (0,00013 oder höher) 1 Fehler in 7.000 Nukleobasen oder weniger (0,00014 oder höher), 1 Fehler in 6.000 Nukleobasen oder weniger (0,00016 oder höher), 1 Fehler in 5.000 Nukleobasen oder weniger (0,0002 oder höher), 1 Fehler in 4.000 Nukleobasen oder weniger (0,00025 oder höher), 1 Fehler in 3.000 Nukleobasen oder weniger (0,00033 oder höher), 1 Fehler in 2,000 Nukleobasen oder weniger (0,00050 oder höher) oder 1 Fehler in 1.000 Nukleobasen oder weniger (0,001 oder höher) oder 1 Fehler in 500 Nukleobasen oder weniger (0,002 oder höher) oder 1 Fehler in 250 Nukleobasen oder weniger (0,004 oder höher).
  • Für die Erzeugung per Mutagenese veränderter Sequenzen unter Verwendung des Prime Editing ist eine Vielzahl mutagener RTs denkbar. Zwei solche Beispiele sind die mutagenen reversen Transkriptasen von Bordetella-Phage (siehe Handa, S., et al. Nucl Acids Res 9711-25 (2018), das durch Bezugnahme hierin aufgenommen wird) und Legionella pneumophila (siehe Arambula, D., et al. Proc Natl Acad Sci USA 8212-7 (2013), durch Bezugnahme hierin aufgenommen). Im Falle der RT des Bordetella-Phagen (brt) muss eventuell auch ein Hilfsprotein zu Cas9 hinzugefügt werden (bavd) - oder in trans abgegeben werden -, was auch für zusätzliche RNA-Sequenzen für die PEgRNA gilt, um die Bindung der mutagenen RT an die Zielstelle zu verbessern (siehe Handa, S., et al. Nucl Acids Res 9711-25 (2018)). Wenn mutagene RTs verwendet werden, könnte die Vorlagenregion der PEgRNA an Adenosinen oder AAY-Codonen angereichert werden, um die Diversität zu steigern.
  • Die Aminosäuresequenz der mutagenen RT des Bordetella-Phagen ist wie folgt bereitgestellt. So wie andere vorliegend offenbarte RTs kann das Brt-Protein an ein napDNAbp als ein Fusionsprotein fusioniert werden, um einen funktionsfähigen PE zu bilden.
    Name Sequenz
    brt mutagenic rt
    Figure DE112020001339T5_0165
  • Im Falle von Brt von Bodetella kann die PE-Fusion auch ein zusätzliches Hilfsprotein (Bavd) beinhalten. Das Hilfsprotein kann an das PE-Fusionsprotein fusioniert oder in trans bereitgestellt werden. Die Aminosäuresequenz des Bavd-Hilfsproteins ist wie folgt bereitgestellt:
    Name Sequenz
    bavd-Hilfsprotein an brt
    Figure DE112020001339T5_0166
  • Im Falle von Brt von Bodetella kann die PEgRNA eine zusätzliche Nukleotidsequenz umfassen, mit PEgRNA-Addition, bspw. an das 5'- oder 3'-Ende. Folgende ist eine beispielhafte Sequenz; sie stammt ursprünglich aus dem Genom des Bordetella-Phagen:
    Name Sequenz
    PEgRNA-Addition 1
    Figure DE112020001339T5_0167
  • Die PEgRNA-Additionssequenz kann verschiedenartig reduziert werden, um die Länge zu verringern. Beispielsweise könnte die Sequenz der PEgRNA-Addition 1 auf die beispielhaften alternativen Additionssequenzen reduziert werden:
    Name Sequenz
    PEgRNA-Addition 2
    Figure DE112020001339T5_0168
    PEgRNA-Addition 3
    Figure DE112020001339T5_0169
    PEgRNA-Addition 4
    Figure DE112020001339T5_0170
    PEgRNA-Addition 5
    Figure DE112020001339T5_0171
    PEgRNA-Addition 6
    Figure DE112020001339T5_0172
    PEgRNA-Addition 7
    Figure DE112020001339T5_0173
    PEgRNA-Addition 8
    Figure DE112020001339T5_0174
  • In anderen Ausführungsformen kann die PEgRNA-Additionssequenz auch mutiert werden. Beispielsweise könnte die Sequenz der PEgRNA-Addition 1 zur beispielhaften alternativen Additionssequenz mutiert werden:
    Name Sequenz
    PEgRNA-Addition 1, mutiert
    Figure DE112020001339T5_0175
  • In verschiedenen Ausführungsformen in Bezug auf die Verwendung von PE zum Einbringen von Mutationen können bestimmte Überlegungen zu PEgRNA einfließen. Als Beispiel und ohne an eine Theorie gebunden sein zu wollen, könnten die zusätzlichen vorbeschriebenen PEgRNA-Sequenzen erforderlich sein, um eine effiziente Mutagenese über mutagene RTs zu ermöglichen.
  • Mit den vorliegend offenbarten Prime Editors kann eine jede mutagene RT verwendet werden. Beispielsweise können die in den nachfolgenden Nachschlagewerken beschriebenen fehleranfälligen RT verwendet werden und werden durch Bezugnahme hierin aufgenommen:
  • Bebenek et al., „Error-prone polymerization by HIV-1 reverse transcriptase. Contribution of template-primer misalignment, miscoding, and termination probability to mutational hot spots.“, J. Biol Chem, 1993, 268: 10324-34; und
  • Menendez-Arias, „Mutation rates and instrinsic fidelity of retroviral reverse transcriptases“, 2009, Viruses, 1(3): 1137-1165.
  • Zu verschiedenen fehleranfälligen RTs können unter anderem die folgenden Enzyme gehören, die in Tabelle 1 bei Menendez-Arias et al. dargelegt sind (die Referenz darauf ist vollumfänglich aufgenommen), und zwar:
    Fehleranfällige RT Angegebene Änderung der Fehlerrate
    HIV-1 RT (Gruppe M, Subtyp B) 0,6 × 10-4 bis 2,0 × 10-4
    HIV-1 RT (Gruppe O) 5,5 × 10-5
    SIV AGM RT 2,9 × 10-5
    SIV MNE RT 1,6 × 10-5 bis 1,2 × 10-4
    PFV RT 1,7 × 10-4
    FIV RT 6,2 × 10-5
    AMV RT 5,9 × 10-5
    MO-MLV RT 2,7 × 10-5 bis 3,3 × 10-5
  • C. Verwendung des Prime Editing zur Behandlung von Trinukleotid-Repeat-Erkrankungen
  • Das vorliegend beschriebene Prime-Editing-System oder Prime-Editing(PE)-System kann verwendet werden, um Mutationen, die auf Wiederholungen von Trinukleotiden beruhen (oder Trinukleotid-Repeat-Erkrankungen) einzudämmen, um Pathologien wie bspw. Chorea Huntington und andere Trinukleotid-Repeat-Erkrankungen zu behandeln. Trinukleotid-Repeat-Erkrankungen sind komplexe, fortschreitende Erkrankungen, die einen Einfluss auf die Entwicklungsneurobiologie haben und sich oft auf die Kognition sowie sensorisch-motorische Funktionen auswirken. Bei diesen Störungen ist eine genetische Antizipation (d. h. ein zunehmender Schweregrade mit jeder Generation) zu beobachten. Die DNA-Expansionen oder - Kontraktionen geschehen zumeist meiotisch (d. h. während der Zeit der Gametogenese oder früh in der embryonalen Entwicklung) und haben eine Geschlechtstendenz, was bedeutet, dass manche Gene nur expandieren, wenn sie in der weiblichen Linie vererbt werden, und andere nur über die männliche Linie. Beim Menschen können Trinukleotid-Repeat-Erkrankungen ein Gen-Silencing entweder auf Ebene der Transkription oder der Translation verursachen, wodurch ein Gen in seiner Funktion im Wesentlichen abgeschaltet wird. Andernfalls können Trinukleotid-Repeat-Erkrankungen veränderte Proteine hervorrufen, die mit großen repetitiven Aminosäuresequenzen erzeugt werden, welche die Proteinfunktion entweder aufheben oder verändern, was oft dominantnegativ erfolgt (z. B. Krankheiten im Zusammenhang mit Polyglutamin).
  • Ohne an eine Theorie gebunden sein zu wollen, wird die Expansion von Basentripletts durch einen als Slippage bezeichneten Effekt während der DNA-Replikation oder während der DNA-Replikation oder während der DNA-Reparatur-Synthese verursacht. Da die Tandemwiederholungen untereinander sequenzidentisch sind, kann die Basenpaarung zwischen zwei DNA-Strängen an mehreren Punkten entlang der Sequenz erfolgen. Dies kann zur Bildung von „Schlaufen“ während der DNA-Replikation oder DNA-Reparatur-Synthese führen. Dies kann zu einem wiederholten Kopieren der wiederholten Sequenz führen, wodurch die Anzahl der Wiederholungen expandiert wird. Es wurden zusätzliche Mechanismen vorgeschlagen, bei denen hybride RNA:DNA-Zwischenprodukte eine Rolle spielen. Das Prime Editing kann zum Reduzieren oder Beseitigen dieser Regionen mit Basentriplettexpansionen verwendet werden, was durch Deletion eines oder mehrerer der sich wiederholenden Codetriplett, die am Ursprung des Problems stehen, erfolgt. In einer Ausführungsform dieser Verwendung stellt 23 ein Schema für eine PEgRNA-Gestaltung zum Eingrenzen oder Verringern von Trinukleotid-Repeat-Sequenzen bereit.
  • Das Prime Editing kann zum Eindämmen von Regionen mit Basentriplettexpansion umgesetzt werden, indem in einer Region strangaufwärts der betreffenden Region mit Basentriplettexpansion mithilfe des Prime Editors ein Nick vorgenommen wird, der eine PEgRNA umfasst, die in geeigneter Weise auf die Schnittstelle gerichtet ist. Der Prime Editor synthetisiert dann einen neuen DNA-Strang (ssDNA-Flap) auf der Grundlage der PEgRNA als Vorlage (d. h. der Editiervorlage davon), die für eine gesunde Anzahl an Triplettwiederholungen codiert (abhängig vom jeweiligen Gen und der jeweiligen Krankheit). Der neu synthetisierte ssDNA-Strang, der die gesunde Triplettwiederholungssequenz umfasst, wird zudem derart synthetisiert, dass er einen kurzen Homologiabschnitt (d. h. den Homologiarm) beinhaltet, der mit der Sequenz neben dem anderen Ende der Wiederholung (roter Strang) übereinstimmt. Die Invasion des neu synthetisierten Strangs und der darauffolgende Ersatz der endogenen DNA mit dem neu synthetisierten ssDNA-Flap ergibt ein kontrahiertes Wiederholungsallel.
  • Abhängig von der jeweiligen Trinukleotid-Repeat-Erkrankung können die Triplettexpansionen, die den Defekt hervorrufen, in „Trinukleotid-Repeat-Expansions-Proteinen“ auftreten. Trinukleotid-Repeat-Expansions-Proteine sind eine vielfältige Reihe von Proteinen, die mit der Neigung, eine Trinukleotid-Repeat-Erkrankung zu entwickeln, dem Vorliegen einer Trinukleotid-Repeat-Erkrankung, dem Schweregrad einer Trinukleotid-Repeat-Erkrankung oder einer beliebigen Kombination daraus assoziiert sind. Trinukleotid-Repeat-Erkrankungen werden in zwei Kategorien eingeteilt, die durch die Art der Wiederholung bestimmt werden. Die häufigste Wiederholung ist das Triplett CAG, das, wenn es in der codierenden Region eines Gens vorliegt, für die Aminosäure Glutamin (Q) codiert. Aus diesem Grunde werden diese Störungen als Polyglutamin(polQ)-Störungen bezeichnet und umfassend die folgenden Erkrankungen: Chorea Huntington (HD); Spinobulbäre Muskelatrophie (SBMA); Spinozerebelläre Ataxien (SCA Typen 1, 2, 3, 6, 7 und 17); und Dentatorubro-Pallidoluysische Atrophie (DRPLA). Bei den übrigen Trinukleotid-Repeat-Erkrankungen ist das CAG-Triplett entweder nicht beteiligt, oder das CAG-Triplett befindet sich nicht in der codierenden Region des Gens; deshalb werden sie als Nicht-Polyglutamin-Störungen bezeichnet. Die Nicht-Polyglutamin-Störungen umfassen Fragiles-X-Syndrom (FRAXA); Fragiles-XE-Syndrom (FRAXE); Friedreich-Ataxie (FRDA); Myotone Dystrophie (DM) und Spinozerebelläre Ataxien (SCA Typen 8 und 12).
  • Die mit Trinukleotid-Repeat-Erkrankungen assoziierten Proteine können auf der Grundlage einer Versuchsassoziation des mit einer Trinukleotid-Repeat-Erkrankung assoziierten Proteins mit einer Trinukleotid-Repeat-Erkrankung ausgewählt werden. Beispielsweise kann die Produktionsrate oder Konzentration eines Proteins im Kreislauf, das mit einer Trinukleotid-Repeat-Erkrankung assoziiert ist, in einer Population mit einer Trinukleotid-Repeat-Erkrankung im Vergleich zu einer Population, die die Trinukleotid-Repeat-Erkrankung nicht hat, erhöht oder gesenkt sein. Unterschiede im Proteinspiegel können unter Verwendung proteomischer Techniken, darunter Western Blot, immunhistochemische Färbung, Enzyme Linked Immunosorbent Assay (ELISA) und Massenspektrometrie, bewertet werden. Alternativ können die mit Trinukleotid-Repeat-Erkrankungen assoziierten Proteine identifiziert werden, indem die Genexpressionsprofile der Gene erlangt werden, welche die Proteine codieren, was unter Verwendung von Genomtechniken erfolgt, darunter DNA-Mikroarray-Analyse, Serial Analysis of Gene Expression (SAGE) und quantitative Echtzeit-Polymerase-Kettenreaktion (Q-PCR).
  • Zu nicht einschränkenden Beispielen für Proteine, die mit Trinukleotid-Repeat-Erkrankungen assoziiert sind, welche mittels Prime Editing korrigiert werden können, zählen AR (Androgenrezeptor), FMR1 (Fragile X Mental Retardation 1), HTT (Huntingtin), DMPK (Dystrophia-Myotonica-Proteinkinase), FXN (Frataxin), ATXN2 (Ataxin 2), ATN1 (Atrophin 1), FEN1 (strukturspezifische Flap-Endonuklease 1), TNRC6A (Trinucleotide Repeat Containing 6A), PABPN1 (poly(A)-Bindungsprotein, nukleär 1), JPH3 (Junctophilin 3), MED15 (Mediator Complex Subunit 15), ATXN1 (Ataxin 1), ATXN3 (Ataxin 3), TBP (TATA-Box-Bindungsprotein), CACNA1A (Calciumkanal, spannungsabhängig, Typ P/Q, Alpha-1A-Untereinheit), ATXN80S (ATXN8, gegenüberliegender Strang (nichtproteincodierend)), PPP2R2B (Protein-Phosphatase 2, regulatorische Untereinheit B, beta), ATXN7 (Ataxin 7), TNRC6B (Trinucleotide Repeat Containing 6B), TNRC6C (Trinucleotide Repeat Containing 6C), CELF3 (CUGBP, Elav-ähnliches Familienmitglied 3), MAB21L1 (mab-21-artig, 1 (C. elegans)), MSH2 (mutS-Homolog 2, Darmkrebs, non-polypös, Typ 1 (E. coli)), TMEM185A (Transmembranprotein 185A), SIX5 (SIX Homöobox 5), CNPY3 (Canopy-3-Homolog (Zebrafisch)), FRAXE (Fragile Site, Folie Acid Type, rare, fra(X)(q28) E), GNB2 (Guanin-Nukleotid-Bindungsprotein (G-Protein), beta-Polypeptid 2), RPL14 (ribosomales Protein L14), ATXN8 (Ataxin 8), INSR (Insulinrezeptor), TTR (Transthyretin), EP400 (E1A-Bindungsprotein p400), GIGYF2 (mit GRB10 interagierendes GYF-Protein 2), OGG1 (8-Oxoguanin-DNA-Glycosylase), STC1 (Stanniocalcin 1), CNDP1 (Carnosin-Dipeptidase 1 (Metallopeptidase-Familie M20)), C10orf2 (Chromosom 10, offener Leserahmen, 2), MAML3 Mastermind-like 3 (Drosophila), DKC1 (Dyskeratosis congenita 1, Dyskerin), PAXIP1 (mit PAX interagierendes (mit Transkriptionsaktivierungsdomäne) Protein 1), CASK (Calcium/Calmodulin-abhängige Serinproteinkinase (MAGUK-Familie)), MAPT (Mikrotubuli-assoziiertes Protein Tau), SP1 (Sp1-Transkriptionsfaktor), POLG (Polymerase (DNA-gerichtet), gamma), AFF2 (AF4/FMR2-Familie, Mitglied 2), THBS1 (Thrombospondin 1), TP53 (Tumorprotein p53), ESR1 (Östrogenrezeptor 1), CGGBP1 (CGG-Triplett-Repeat-Bindungsprotein 1), ABT1 (Aktivator der basalen Transkription 1), KLK3 (Kallikrein-related peptidase 3), PRNP (Prionenprotein), JUN (jun-Onkogen), KCNN3 (Potassium intermediate/small conductance calcium-activated channel, Unterfamilie N, Mitglied 3), BAX (BCL2-assoziiertes X-Protein), FRAXA (Fragile Site, Folie Acid Type, rare, fra(X)(q27.3) A (Makroorchidie, mentale Retardierung)), KBTBD10 (Kelch-Repeat- und BTB(POZ)-Domäne enthaltend 10), MBNL1 (Muscleblind-like (Drosophila)), RAD51 (RAD51-Homolog (RecA-Homolog, E. coli) (S. cerevisiae)), NCOA3 (Nuclear Receptor Coactivator 3), ERDA1 (Expanded Repeat Domain, CAG/CTG 1), TSC1 (tuberöse Sklerose 1), COMP (Cartilage Oligomeric Matrix Protein), GCLC (Glutamat-Cystein-Ligase, katalytische Untereinheit), RRAD (Ras-Related Associated with Diabetes), MSH3 (mutS-Homolog 3 (E. coli)), DRD2 (Dopaminrezeptor D2), CD44 (CD44-Molekül (Indische Blutgruppe)), CTCF (CCCTC-Bindungsfaktor (Zinkfingerprotein)), CCND1 (Cyclin D1), CLSPN (Claspin-Homolog (Xenopus laevis)), MEF2A (Myocyte Enhancer Factor 2A), PTPRU (Protein-Tyrosin-Phosphatase, Rezeptor-Typ, U), GAPDH (Glyceraldehyd-3-phosphat-dehydrogenase), TRIM22 (Tripartite motif-containing 22), WT1 (Wilms-Tumor 1), AHR (Aryl-Hydrocarbon-Rezeptor), GPX1 (Glutathion-Peroxidase 1), TPMT (Thiopurin-S-Methyltransferase), NDP (Norrie-Syndrom (Pseudogliom)), ARX (Aristaless-related homeobox), MUS81 (MUS81-Endonuklease-Homolog (S. cerevisiae)), TYR (Tyrosinase (Okulokutaner Albinismus IA)), EGR1 (Early Growth Response 1), UNG (Uracil-DNA-Glycosylase), NUMBL (numb homolog (Drosophila)-like), FABP2 (Fettsäure-Bindungsprotein 2, intestinal), EN2 (engrailed homeobox 2), CRYGC (kristallin, gamma C), SRP14 (Signalerkennungspartikel, 14 kDa (homologes Alu-RNA-Bindungsprotein)), CRYGB (kristallin, gamma B), PDCD1 (Programmed Cell Death 1), HOXA1 (Homöobox A1), ATXN2L (Ataxin-2-like), PMS2 (PMS2 Postmeiotic Segregation Increased 2 (S. cerevisiae)), GLA (Galactosidase, alpha), CBL (Cas-Br-M (murin) ecotrope retrovirale Transformationssequenz), FTH1 (Ferritin, Heavy Polypeptide 1), IL12RB2 (Interleukin-12-Rezeptor, beta 2), OTX2 (Orthodenticle-Homöobox 2), HOXA5 (Homöobox A5), POLG2 (Polymerase (DNA-gerichtet), gamma 2, akzessorische Untereinheit), DLX2 (Distal-less Homöobox 2), SIRPA (Signal-regulatorisches Protein alpha), OTX1 (Orthodenticle Homöobox 1), AHRR (Aryl-Hydrocarbon-Rezeptor-Repressor), MANF (Mesencephalic Astrocyte-Derived Neurotrophic Factor), TMEM158 (Transmembranprotein 158 (Gen/Pseudogen)) und ENSG00000078687.
  • Die vorliegend offenbarten Prime Editors können in einem jeden der vorgenannten krankheitsassoziierten Proteine zum Eindämmen von Regionen mit Triplettexpansionen verwendet werden, darunter Genen von Trinukleotid-Repeat-Erkrankungen folgend (welche die genaue Stelle der pathogenen Wiederholungen zeigen, die gänzlich oder teilweise mittels Prime Editing entfernt werden können):
    Mit Triplettexpansion assoziierte Erkrankung Betroffenes Gen Position der pathogenen Wiederholungen
    Dentatorubro-Pallidoluysische Atrophie ATN1 ATROPHIN-1 49-88
    CHOREA HUNTINGTON HTT GEN HUNTINGTIN 36-250
    SPINOBULBÄRE MUSKELATROPHIE AR ANDROGENREZEPTOR 38-62
    SPINOZEREBELLÄRE ATAXIE TYP 1 ATXN1 ATAXIN 1 49-88
    SPINOZEREBELLÄRE ATAXIE TYP 2 ATXN2 ATAXIN 2 33-77
    SPINOZEREBELLÄRE ATAXIE TYP 3 ATXN3 ATAXIN 3 55-86
    SPINOZEREBELLÄRE ATAXIE TYP 6 CACNA1A 21-30
    SPINOZEREBELLÄRE ATAXIE TYP 7 ATXN7 ATAXIN 7 38-120
    SPINOZEREBELLÄRE ATAXIE TYP 17 TBP TATA-BINDUNGSPROTEIN 47-63
  • Die vorliegend offenbarten Prime Editors können auch zum Eindämmen von Regionen mit Triplettexpansionen verwendet werden, die sich typischerweise in den folgenden Genen, die mit Nicht-Polyglutamin-Triplettexpansions-Erkrankungen verbunden sind, finden:
    Mit Triplettexpansion assoziierte Erkrankung Betroffenes Gen Position der pathogenen Wiederholungen
    FRAXA (FRAGILES-X-SYNDROM) FMR1 FRAGILE X MENTAL RETARDATION PROTEIN 230+
    FXTAS (FRAGILES-X-ASSOZIIERTES TREMOR-ATAXIE-SYNDROM) FMR1 55-200
    FRAXE (FRAGILES-XE-SYNDROM) AFF2 200+
    FRDA (FRIEDREICH-ATAXIE) FXN FRATAXIN 100+
    DM1 (MYOTONE DYSTROPHIE TYP 1) DMPK MYOTONIN-PROTEINKINASE 50+
    SCA8 (SPINOZEREBELLÄRE ATAXIE TYP 8) SCA8 ATAXIN 8 110-250
    SCA12 (SPINOZEREBELLÄRE ATAXIE TYP 12) PPP2R2B SERIN/THREONIN-PROTEINPHOSPHATASE 2A 66-78
  • Das Prime Editing kann umgesetzt werden, um Regionen mit Triplettexpansionen unter Verwendung einer PEgRNA mit einer Editiervorlage einzudämmen, die zum Deletieren zumindest eines Codons einer Region mit Triplettexpansion gestaltet ist. In anderen Ausführungsformen werden die PEgRNAs zur Verwendung beim Prime Editing verwendet, um mindestens 1 oder 2 oder 3 oder 4 oder 5 oder 6 oder 7 oder 8 oder 9 oder 10 oder 11 oder 12 oder 13 oder 14 oder 15 oder 16 oder 17 oder 18 oder 19 oder 20 oder 21 oder 22 oder 23 oder 24 oder 25 oder 26 oder 27 oder 28 oder 29 oder 30 oder 31 oder 32 oder 33 oder 34 oder 35 oder 36 oder 37 oder 38 oder 39 oder 40 oder 41 oder 42 oder 43 oder 44 oder 45 oder 46 oder 47 oder 48 oder 49 oder 50 oder 51 oder 52 oder 53 oder 54 oder 55 oder 56 oder 57 oder 58 oder 59 oder 60 oder 61 oder 62 oder 63 oder 64 oder 65 oder 66 oder 67 oder 68 oder 69 oder 70 oder 71 oder 72 oder 73 oder 74 oder 75 oder 76 oder 77 oder 78 oder 79 oder 80 oder 81 oder 82 oder 83 oder 84 oder 85 oder 86 oder 87 oder 88 oder 89 oder 90 oder 91 oder 92 oder 93 oder 94 oder 95 oder 96 oder 97 oder 98 oder 99 oder 100 oder mehr Codone aus einer Triplettexpansionsregion zu löschen, um eine gesunde Anzahl an Triplettwiederholungen (d. h. eine, die nicht damit assoziiert ist, dass sie die Erkrankung hervorbringt) zu erlangen.
  • In anderen Ausführungsformen werden die PEgRNAs zur Verwendung beim Prime Editing verwendet, um mindestens 1 oder 2 oder 3 oder 4 oder 5 oder 6 oder 7 oder 8 oder 9 oder 10 oder 11 oder 12 oder 13 oder 14 oder 15 oder 16 oder 17 oder 18 oder 19 oder 20 oder mehr Codone aus einer Triplettexpansionsregion zu löschen, um eine gesunde Anzahl an Triplettwiederholungen (d. h. eine, die nicht damit assoziiert ist, dass sie die Erkrankung hervorbringt) zu erlangen.
  • In anderen Ausführungsformen werden die PEgRNAs zur Verwendung beim Prime Editing verwendet, um mindestens 1 oder 2 oder 3 oder 4 oder 5 oder 6 oder 7 oder 8 oder 9 oder 10 oder 11 oder 12 oder 13 oder 14 oder 15 oder mehr Codone aus einer Triplettexpansionsregion zu löschen, um eine gesunde Anzahl an Triplettwiederholungen (d. h. eine, die nicht damit assoziiert ist, dass sie die Erkrankung hervorbringt) zu erlangen.
  • In anderen Ausführungsformen werden die PEgRNAs zur Verwendung beim Prime Editing verwendet, um mindestens 1 oder 2 oder 3 oder 4 oder 5 oder 6 oder 7 oder 8 oder 9 oder 10 oder mehr Codone aus einer Triplettexpansionsregion zu löschen, um eine gesunde Anzahl an Triplettwiederholungen (d. h. eine, die nicht damit assoziiert ist, dass sie die Erkrankung hervorbringt) zu erlangen.
  • Das Prime Editing kann zum Korrigieren einer jeden Triplettexpansionsregion ausgelegt werden, wie etwa jener, die beschrieben sind in Budworth et al., „A Brief History of Triplet Repeat Diseases“, Methods Mol Biol, 2013, 1010: 3-17, US 20011/00165540 A1 (Genome editing of genes associated with trinucleotide repeat expansion disorders in animals), US 2016/0355796 A1 (Compositions and methods of use of crispr-cas systems in nucleotide repeat disorders
  • In verschiedenen Ausführungsformen stellt die Offenbarung ein Prime-Editing-Konstrukt bereit, das zur Verwendung in einer Zelle mit einer Trinukleotidwiederholungsexpansionsregion in einem defekten Gen geeignet ist, umfassend (a) eine Prime-Editor-Fusion, die ein napDNAbp und eine reverse Transkriptase umfasst, (b) eine PEgRNA, die eine Spacersequenz, welche die Trinukleotidwiederholungsexpansionsregion anzielt, und einen Verlängerungsarm umfasst, der eine Editiervorlage umfasst, welche für die Entfernung der Trinukleotidwiederholungsexpansionsregion codiert.
  • In verschiedenen anderen Ausführungsformen stellt die Offenbarung ein Verfahren zum Deletieren der ganzen oder eines Teils der Trinukleotidwiederholungsexpansionsregion in einem defekten Gen in einer Zelle unter Verwendung des Prime Editing bereit, umfassend Inkontaktbringen der Zelle mit einer Prime-Editor-Fusion, die ein napDNAbp und eine reverse Transkriptase umfasst, und einer PEgRNA, die eine Spacersequenz, welche die Trinukleotidwiederholungsexpansionsregion anzielt, und einen Verlängerungsarm umfasst, der eine Editiervorlage umfasst, welche für die Entfernung der Trinukleotidwiederholungsexpansionsregion codiert.
  • In verschiedenen Ausführungsformen umfasst die Trinukleotidwiederholung ein Wiederholen der Trinukleotide CTG, CAG, CGG, CCG, GAA oder TTC.
  • In verschiedenen anderen Ausführungsformen die Tetranukleotidwiederholungen, Pentanukleotidwiederholungen oder Hexanukleotidwiederholungen.
  • D. Verwendung des Prime Editing zur Peptidmarkierung
  • In einem anderen Aspekt stellt die Offenbarung ein Verfahren zum Verwenden der vorliegend beschriebenen Prime Editors zum genetischen Aufpfropfen einer oder mehrerer Peptidmarkierungen an ein Protein mithilfe des Prime Editing. Insbesondere stellt die Offenbarung ein Verfahren zum genetischen Anbringen einer oder mehrerer Peptidmarkierungen an ein Protein bereit, umfassend: Inkontaktbringen einer das Protein codierenden Zielnukleotidsequenz mit einem Prime Editor, der dazu ausgelegt ist, eine zweite Nukleotidsequenz darin einzufügen, welche die eine oder mehrere Peptidmarkierungen codiert, um eine rekombinante Nukleotidsequenz zu ergeben, die ein Fusionsprotein, das das an die Proteinmarkierung fusionierte Protein umfasst, codiert.
  • In anderen Ausführungsformen stellt die Offenbarung ein Verfahren zur Herstellung eines Fusionsproteins, das ein interessierendes Peptid und eine oder mehrere Peptidmarkierungen umfasst, bereit, wobei das Verfahren umfasst: Inkontaktbringen einer das Protein codierenden Zielnukleotidsequenz mit einem Prime Editor, der dazu ausgelegt ist, eine zweite Nukleotidsequenz darin einzufügen, welche die eine oder mehrere Peptidmarkierungen codiert, um eine rekombinante Nukleotidsequenz zu ergeben, die das Fusionsprotein, das das an die Proteinmarkierung fusionierte Protein umfasst, codiert.
  • In verschiedenen Ausführungsformen handelt es sich bei der Zielnukleotidsequenz um ein spezifisches interessierendes Gen in einer genomischen DNA. Das interessierende Gen kann ein interessierendes Protein (z. B. einen Rezeptor, ein Enzym, ein therapeutisches Protein, ein Membranprotein, ein Transportprotein, ein Signaltransduktionsprotein oder ein immunologisches Protein usw.) codieren. Das interessierende Gen kann auch ein RNA-Molekül codieren, darunter Boten-RNA (mRNA), Transfer-RNA (tRNA), ribosomale RNA (rRNA), small nuclear RNA (snRNA), Antisense-RNA, Guide-RNA, microRNA (miRNA), small interfering RNA (siRNA) und zellfreie RNA (cfRNA).
  • Die Peptidmarkierung kann eine jede Peptidmarkierung oder Variante davon sein, die einem Protein bspw. zur Abtrennung, Reinigung, Visualisierung, Solubilisierung oder zum Nachweis eine oder mehrere Funktionen verleiht. Zu den Peptidmarkierungen können zählen: „Affinitätsmarkierungen“ (um die Proteinreinigung zu fördern), „Solubilisierungsmarkierungen“ (um die korrekte Faltung von Proteinen zu unterstützen), „Chromatographiemarkierungen“ (um chromatographische Eigenschaften von Proteinen zu verändern), „Epitopmarkierungen“ (um an hochaffine Antikörper zu binden) und „Fluoreszenzmarkierungen“ (um die Visualisierung von Proteinen in einer Zelle oder in vitro zu fördern). Beispiele für Peptidmarkierungen sind unter anderem die folgenden Markierungen:
    Bezeichnung Aminosäuresequenz SEQ ID NO:
    AviTagTM GLNDIFEAQKIEWHE SEQ ID NO: 245
    C-Tag EPEA SEQ ID NO: 246
    Calmodulin-Tag KRRWKKNFIAVSAANRFKKISSSGA L SEQ ID NO: 247
    Polyglutamat-Tag EEEEEE SEQ ID NO: 248
    E-Tag GAPVPYPDPLEPR SEQ ID NO: 249
    FLAG-Tag DYKDDDDK SEQ ID NO: 2
    HA-Tag YPYDVPDYA SEQ ID NO: 5
    His-Tag H (His1) HH (His2) HHH (His3) HHHH (His4) HHHHH (His5) HHHHHH (His6) HHHHHHH (His7) HHHHHHHH (His8) HHHHHHHHH (His9) HHHHHHHHHH (His10) HHHHHHHHHH...H...(HisN, wobei n = 1-25) SEQ ID NO: 252 SEQ ID NO: 253 SEQ ID NO: 254 SEQ ID NO: 255 SEQ ID NO: 256 SEQ ID NO: 257 SEQ ID NO: 258 SEQ ID NO: 259 SEQ ID NO: 260 SEQ ID NO: 261 SEQ ID NO: 262
    Myc-Tag EQKLISEEDL SEQ ID NO: 6
    NE-Tag TKENPRSNQEESYDDNES SEQ ID NO: 264
    Rho1D4-Tag TETSQVAPA SEQ ID NO: 265
    S-Tag KETAAAKFERQHMDS SEQ ID NO: 266
    SBP-Tag MDEKTTGWRGGHVVEGLAGELEQ LRARLEHHPQGQREP SEQ ID NO: 267
    Softag-1 SLAELLNAGLGGS SEQ ID NO: 268
    Softag-2 TQDPSRVG SEQ ID NO: 269
    Spot-Tag PDRVRAVSHWSS SEQ ID NO: 270
    Strep-Tag WSHPQFEK SEQ ID NO: 271
    TC-Tag CCPGCC SEQ ID NO: 272
    Ty-Tag EVHTNQDPLD SEQ ID NO: 273
    V5-Tag GKPIPNPLLGLDST SEQ ID NO: 3
    VSV-Tag YTDIEMNRLGK SEQ ID NO: 275
    Xpress-Tag DLYDDDDK SEQ ID NO: 276
  • Peptidmarkierungen können auch die folgenden Affinitätsmarkierungen sein (zur Trennung und/oder Reinigung von Proteinen) (wie beschrieben in Tabelle 9.9.1 von Kimple et al., „Overview of Affinity Tags for Protein Purification“, Curr Protoc Protein Sci, 2013, 73:Unit-9.9, das durch Bezugnahme hierin aufgenommen wird).
    BEZEICHNUNG AMINOSÄURESEQUENZ
    AU1-EPITOP DTYRYI SEQ ID NO: 278
    AU5-EPITOP TDFYLK SEQ ID NO: 279
    BAKTERIOPHAGE-T7-EPITOP (T7-MARKIERUNG) MASMTGGQQMG SEQ ID NO: 280
    BLAUZUNGENVIRUS-MARKIERUNG (B-MARKIERUNG) QYPALT SEQ ID NO: 281
    E2-EPITOP SSTSSDFRDR SEQ ID NO: 282
    HISTIDIN-AFFINITÄTS-MARKIERUNG (HAT) KDHLIHNVHKEFHAHAHNK SEQ ID NO: 283
    HSV-EPITOP QPELAPED SEQ ID NO: 284
    POLYARGININ (ARG-MARKIERUNG) RRRRR SEQ ID NO: 285
    POLYASPARTAT (ASP-MARKIERUNG) CCCC SEQ ID NO: 286
    POLYPHENYLALANIN (PHE-MARKIERUNG) FFFFFFFFFFF SEQ ID NO: 287
    S1 -TAG NANNPDWDF SEQ ID NO: 288
    S-TAG KETAAAKFERQHMDS SEQ ID NO: 266
    VSV-G YTDIEMNRLGK SEQ ID NO: 275
  • In bestimmten Ausführungsformen können zu den Peptidmarkierungen eine His6-Markierung, FLAG-Markierung, V5-Markierung, GCN4-Markierung, HA-Markierung, Myc-Markierung, FIAsH/ReAsH-Markierung, ein Sortasesubstrat, ein Pi-Clamp zählen.
  • In verschiedenen Ausführungsformen können die Peptidmarkierungen für Anwendungen verwendet werden, zu denen die Proteinfluoreszenzmarkierung, Immunpräzipitation, das Immunblotting, die Immunhistochemie, Proteinrekrutierung, induzierbare Proteindegrone und die genomweite Durchmusterung zählen.
  • In verschiedenen anderen Ausführungsformen kann die Peptidmarkierung eine Inteinsequenz einschließen, um eine Proteinselbstspleißfunktion einzubringen. Im vorliegenden Zusammenhang bezeichnet der Begriff „Intein“ selbstverarbeitende Polypeptiddomänen, sie sich in Organismen aller biologischer Domänen finden lassen. Ein Intein (intervenierendes Protein) führt einen einzigartiges Vorgang der Selbstverarbeitung aus, der als Proteinspleißen bezeichnet wird und bei dem es sich durch Spaltung von zwei Peptidbindungen selbst aus einem größeren Vorläuferpolypeptid herausschneidet und im Verlauf dessen die Sequenzen des flankierenden Exteins (externen Proteins) durch Bildung einer neuen Peptidbindung ligiert. Diese Umordnung erfolgt posttranslational (oder möglicherweise ko-translational), das sich Inteingene in demselben Rahmen in anderen proteincodierenden Genen eingebettet befinden. Außerdem geht das Inteinvermittelte Proteinspleißen spontan vonstatten; es ist kein äußerer Faktor und keine äußere Energiequelle dafür erforderlich, sondern nur die Faltung der Inteindomäne. Dieser Prozess wird auch als cis-Protein-Spleißen bezeichnet, im Gegensatz zum natürlichen Prozess des trans-Protein-Spleißens mit „Spleiß-Inteinen“. Inteine sind das Proteinäquivalent der selbstspleißenden RNA-Introns (siehe Perler et al., Nucleic Acids Res. 22:1125-1127 (1994)), die ihre eigene Exzision aus einem Vorläuferprotein mit begleitender Fusion der flankierenden Proteinsequenzen, bekannt als Exteine katalysieren (besprochen in Perler et al., Curr. Opin. Chem. Biol. 1:292-299 (1997); Perler, F. B. Cell 92(1):1-4 (1998); Xu et al., EMBO J. 15(19):5146-5153 (1996)).
  • Der Mechanismus des Vorgangs des Proteinspleißens ist detailliert untersucht worden (Chong, et al., J. Biol. Chem. 1996, 271, 22159-22168; Xu, M-Q & Perler, F. B. EMBO Journal, 1996, 15, 5146-5153), und an den Intein- und Extein-Spleißstellen wurden konservierte Aminosäuren gefunden (Xu, et al., EMBO Journal, 1994, 13 5517-522).
  • Inteine können auch als zwei Fragmente vorliegen, die durch zwei separat transkribierte und translatierte Gene codiert werden. Diese sogenannten Spleiß-Inteine assoziieren sich selbst und katalysieren die Proteinspleißaktivität in trans. Man hat Spleiß-Inteine in diversen Cyanobakterien und Archaeen gefunden (Caspi et al., Mol Microbiol. 50: 1569-1577 (2003); Choi J. et al, J Mol Biol. 556: 1093-1106 (2006.); Dassa B. et al, Biochemistry. 46:322-330 (2007.); Liu X. und Yang J., J Biol Chem. 275:26315-26318 (2003); Wu H. et al. Proc Natl Acad Sci USA. £5:9226-9231 (1998.); und Zettler J. et al, FEBS Letters. 553:909-914 (2009)); in Eukaryoten wurden sie bislang aber nicht gefunden. Kürzlich wurden in einer auf Bioinformatik fußenden Analyse metagenomischer Daten aus der Umwelt 26 verschiedene Loci mit einer neuen genomischen Anordnung entdeckt. An jedem Locus wird eine konservierte enzymcodierende Region von einem Spleiß-Intein unterbrochen, wobei ein freistehendes Endonukleasegen zwischen den Segmenten eingefügt ist, die für Intein-Unterdomänen codieren. Unter ihnen waren fünf Loci vollständig assembliert: DNA-Helikasen (gp41-1, gp41-8); Inosin-5'-Monophosphat-Dehydrogenase (IMPDH-1); und katalytische Untereinheiten der Ribonukleotidreduktase (NrdA-2 und NrdJ-1). Diese aufgebrochene Genorganisation scheint vornehmlich in Phagen vorzukommen (Dassa et al, Nucleic Acids Research. 57:2560-2573 (2009)).
  • In bestimmten Ausführungsformen können die vorliegend beschriebenen Prime Editors verwendet werden, um Spleiß-Intein-Markierungen in zwei verschiedene Proteine einzufügen, was bei Ko-Expression deren intrazelluläre Ligation bewirkt, um ein Fusionsprotein zu bilden. Beim Transspleißen von Proteinen besteht ein Vorläuferprotein aus einem N-Extein-Teil, auf den das N-Intein folgt, ein anderes Vorläuferprotein besteht aus dem C-Intein, auf das ein C-Extein-Teil folgt, und eine Reaktion des Transspleißens (durch das N- und C-Inein zusammen) schneidet die zwei Inteinsequenzen und verknüpft die zwei Exteinsequenzen mit einer Peptidbindung. Da es sich beim Transspleißen von Proteinen um eine enzymatische Reaktion handelt, kann es bei sehr geringen (z. B. mikromolaren) Konzentrationen von Proteinen funktionieren und unter physiologischen Bedingungen ausgeführt werden.
  • Wie festgestellt wurde, weist das Spleiß-Intein Npu-DnaE die höchste Rate auf, die für die Reaktion des Proteintransspleißens angegeben wurde. Des Weiteren wird die Spleißreaktion des Npu-DnaE-Proteins in Bezug auf andere Exteinsequenzen, bei Temperaturen von 6 bis 37 °C und dem Vorliegen von bis zu 6 M Harnstoff, als robust und eine hohe Ausbeute erzielend betrachtet (Zettler J. et al., FEBS Letters. 553:909-914 (2009); Iwai I. et al., FEBS Letters 550: 1853-1858 (2006)). Wie erwartet, wurde die anfängliche N- zu- S-Acyl-Verschiebung und damit das Proteinspleißen blockiert, als die Cysl-Ala-Mutation bei der N-Domäne dieser Inteine eingebracht wurde. Leider wurde auch die Spaltreaktion am C-Terminus fast vollständig gehemmt. Die Abhängigkeit der Asparagin-Cyclisierung an der C-terminalen Spleißstelle von der Acylverschiebung an der N-terminalen leicht spaltbaren Peptidbindung scheint eine einzigartige Eigenschaft der in natürlicher Weise gespaltenen DnaE-Intein-Allele zu sein (Zettler J. et al. FEBS Letters. 555:909-914 (2009)).
  • Das Transspleißen von Proteinen, das durch Spleiß-Inteine katalysiert wird, verschafft ein gänzlich enzymatisches Verfahren zur Proteinligation. Ein Spleiß-Intein ist im Wesentlichen ein zusammenhängendes Intein (z. B. ein Mini-Intein), das in zwei Teile gespleißt wird, welche jeweils als N-Intein und C-Intein bezeichnet werden. Das N-Intein und C-Intein eines gespleißten Inteins können eine nichtkovalent Verbindung eingehen, um ein aktives Intein zu bilden und die Spleißreaktion in im Wesentlichen gleicher Weise katalysieren, wie es durch ein zusammenhängendes Intein erfolgt. Gespleißte Inteine wurden in der Natur vorgefunden und auch in Labors konstruiert. Im hier verwendeten Sinne bezeichnet der Begriff „gespleißtes Intein“ ein jedes Intein, in dem zwischen der N-terminalen und C-terminalen Aminosäuresequenz ein oder mehrere gelöste Peptidbindungen vorliegen, sodass die N-terminale und C-terminale Aminosäuresequenz separate Moleküle werden, die sich nichtkovalent zu einem Intein neuverbinden, oder wiederherstellen, das für Transspleißreaktionen funktional ist. Ein jedes katalytisch aktives Intein, oder Fragment davon, kann verwendet werden, um ein gespleißtes Intein zur Verwendung in den erfindungsgemäßen Verfahren abzuleiten. In einem Aspekt kann das gespleißte Intein zum Beispiel von einem eukaryotischen Intein abgeleitet werden. In einem anderen Aspekt kann das gespleißte Intein von einem bakteriellen Intein abgeleitet werden. In einem anderen Aspekt kann das gespleißte Intein von einem Archaeen-Intein abgeleitet werden. Das derart abgeleitete gespleißte Intein besitzt vorzugsweise die Aminosäuresequenzen, die zum Katalysieren von Reaktionen des Transspleißens wesentlich sind.
  • Gespleißte Inteine können aus zusammenhängenden Inteinen erzeugt werden, indem eine oder mehrere Spleißstellen in der unstrukturierten Schleife oder zwischenliegenden Aminosäuresequenz zwischen den -12 konservierten Betasträngen konstruiert werden, die in der Struktur von Mini-Inteinen zu finden sind. Im Hinblick auf die Position der Spleißstelle innerhalb von Regionen zwischen den Betasträngen kann eine gewisse Flexibilität bestehen, vorausgesetzt, die Erzeugung der Aufspaltung unterbricht die Struktur des Inteins, insbesondere die strukturierten Betastränge, nicht in einem Maße, das genügen würde, um die Aktivität des Proteinspleißens einzubüßen.
  • Die vorliegend beschriebenen Prime Editors können Peptidmarkierungen (einschließlich Inteine) in das C-terminale Ende eines interessierenden Proteins einbauen. In anderen Ausführungsformen können die Peptidmarkierungen (einschließlich Inteine) in das N-terminale Ende eines interessierenden Proteins eingebaut werden. Die Peptidmarkierungen können auch ins Innere eines interessierenden Proteins eingebaut werden. Die dadurch entstehenden Fusionsproteine, die durch die vorliegend beschriebenen Prime Editors erzeugt werden, können die folgenden Strukturen aufweisen:
    • [interessierendes Protein] - [Peptidmarkierung];
    • [Peptidmarkierung] - [interessierendes Protein]; oder
    • [interessierendes Protein - N-terminale Region] - [Peptidmarkierung] - [interessierendes Protein - C-terminale Region].
  • Die Prinzipien der Gestaltung von Guide-RNA zur Verwendung bei der Peptidmarkierung allgemein können auf die Peptidmarkierung angewendet werden. Beispielsweise kann die PEgRNA-Struktur zur Peptidmarkierung in einer Ausführungsform die folgende Struktur aufweisen: 5'-[Spacersequenz]-[gRNA-Kern oder -Gerüst]-[Verlängerungsarm]-3', wobei der Verlängerungsarm in 5'-zu-3'-Richtung einen Homologiearm, eine Editiervorlage (welche die Sequenz umfasst, die die Peptidmarkierung codiert) und eine Primer-Bindungsstelle umfasst. Diese Konfiguration ist in 3D und in 24 abgebildet.
  • In einer anderen Ausführungsform kann die PEgRNA-Struktur zur Peptidmarkierung die folgende Struktur aufweisen: 5'-[Verlängerungsarm]-[Spacersequenz]-[gRNA-Kern oder - Gerüst]-3', wobei der Verlängerungsarm in 5'-zu-3'-Richtung einen Homologiearm, eine Editiervorlage (welche die Sequenz umfasst, die die Peptidmarkierung codiert) und eine Primer-Bindungsstelle umfasst. Diese Konfiguration ist in 3E abgebildet.
  • Ausführungsformen der Peptidmarkierung unter Verwendung des Prime Editing sind in 25 und 26 abgebildet und in Beispiel 4 beschrieben.
  • E. Verwendung von Prime Editing zur Vorbeugung oder Behandlung von Prionenerkrankungen
  • Prime Editing kann auch verwendet werden, um das Fortschreiten der Prionenerkrankung zu verhindern oder zu stoppen, indem eine oder mehrere schützende Mutationen in Prionenproteine (PRNP) eingebaut werden, die im Verlauf der Krankheit fehlgefaltet werden. Prionenkrankheiten oder übertragbare spongiforme Enzephalopathien (transmissible spongiform encephalopathies - TSE) sind eine Familie seltener progressiver neurodegenerativer Erkrankungen, die sowohl Menschen als auch Tiere betreffen. Sie zeichnen sich durch lange Inkubationszeiten, charakteristische spongiforme Veränderungen, die mit neuronalem Verlust verbunden sind, und ein Versagen, eine Entzündungsreaktion auszulösen, aus.
  • Beim Menschen umfasst die Prionerkrankung die Creutzfeldt-Jakob-Krankheit (Creutzfeldt-Jakob Disease - CJD), die Variante der Creutzfeldt-Jakob-Krankheit (Variant Creutzfeldt-Jakob Disease - vCJD), das Gerstmann-Straussler-Scheinker-Syndrom, die tödliche familiäre Schlaflosigkeit und Kuru. Bei Tieren umfasst die Prionenerkrankung die bovine spongiforme Enzephalopathie (BSE oder „Rinderwahnsinn“), die chronische Auszehrungskrankheit (Chronic Wasting Disease - CWD), Scrapie, die übertragbare Nerz-Enzephalopathie, die feline spongiforme Enzephalopathie und die ungulate spongiforme Enzephalopathie. Prime Editing kann verwendet werden, um schützende Punktmutationen in ein Prionenprotein zu installieren, um das Fortschreiten einer dieser Prionenkrankheiten zu verhindern oder zu stoppen.
  • Die klassische CJD ist eine menschliche Prionenerkrankung. Es handelt sich um eine neurodegenerative Erkrankung mit charakteristischen klinischen und diagnostischen Merkmalen. Diese Krankheit ist schnell fortschreitend und immer tödlich. Eine Infektion mit dieser Krankheit führt in der Regel innerhalb von 1 Jahr nach Krankheitsbeginn zum Tod. CJD ist eine schnell fortschreitende, ausnahmslos tödliche neurodegenerative Erkrankung, von der angenommen wird, dass sie durch eine abnormale Isoform eines zellulären Glykoproteins, das als Prionprotein bekannt ist, verursacht wird. CJD tritt weltweit auf und die geschätzte jährliche Inzidenz in vielen Ländern, einschließlich der Vereinigten Staaten, wird mit etwa einem Fall pro Million Einwohner angegeben. Die überwiegende Mehrheit der CJD-Patienten stirbt normalerweise innerhalb eines Jahres nach Krankheitsbeginn. CJD wird zusammen mit anderen Prionenerkrankungen, die bei Mensch und Tier vorkommen, als übertragbare spongiforme Enzephalopathie (TSE) klassifiziert. Bei etwa 85 % der Patienten tritt CJD als sporadische Erkrankung ohne erkennbares Übertragungsmuster auf. Ein geringerer Anteil der Patienten (5 bis 15 %) entwickelt CJD aufgrund von vererbten Mutationen des Prionprotein-Gens. Zu diesen Erbformen gehören das Gerstmann-Straussler-Scheinker-Syndrom und die tödliche familiäre Schlaflosigkeit. Derzeit ist keine Behandlung für CJD bekannt.
  • Die Variante Creutzfeldt-Jakob-Krankheit (vCJD) ist eine Prionenerkrankung, die erstmals 1996 im Vereinigten Königreich beschrieben wurde. Es gibt inzwischen starke wissenschaftliche Beweise dafür, dass der Erreger, der für den Ausbruch der Prionenerkrankung bei Kühen, der bovinen spongiformen Enzephalopathie (BSE oder „Rinderwahn“), derselbe Erreger ist, der für den Ausbruch der vCJD beim Menschen verantwortlich ist. Die Variante CJD (vCJD) ist nicht dieselbe Krankheit wie die klassische CJD (oft einfach CJD genannt). Sie hat andere klinische und pathologische Merkmale als die klassische CJD. Jede Erkrankung weist ebenso ein bestimmtes genetisches Profil des Prionprotein-Gens auf. Beide Erkrankungen sind ausnahmslos tödliche Hirnerkrankungen mit ungewöhnlich langen Inkubationszeiten, gemessen in Jahren, und werden durch einen unkonventionellen übertragbaren Erreger namens Prion verursacht. Derzeit ist keine Behandlung für vCJD bekannt.
  • BSE (bovine spongiforme Enzephalopathie oder „Rinderwahnsinn“) ist eine fortschreitende neurologische Erkrankung von Rindern, die aus einer Infektion mit einem ungewöhnlichen übertragbaren Erreger namens Prion resultiert. Die Natur des übertragbaren Mittels wird nicht gut verstanden. Derzeit ist die am meisten akzeptierte Theorie, dass der Wirkstoff eine modifizierte Form eines normalen Proteins ist, das als Prionprotein bekannt ist. Aus noch nicht verstandenen Gründen geht das normale Prionprotein in eine pathogene (schädliche) Form über, die dann das Zentralnervensystem von Rindern schädigt. Es gibt zunehmend Hinweise darauf, dass es verschiedene BSE-Stämme gibt: den typischen oder klassischen BSE-Stamm, der für den Ausbruch im Vereinigten Königreich verantwortlich ist, und zwei atypische Stämme (H- und L-Stämme) . Derzeit ist keine Behandlung für BSE bekannt.
  • Chronic Wasting Disease (CWD) ist eine Prionenkrankheit, die Hirsche, Elche, Rentiere, Sikahirsche und Elche befällt. Sie wurde in einigen Gebieten Nordamerikas entdeckt, darunter Kanada und die Vereinigten Staaten, Norwegen und Südkorea. Es kann über ein Jahr dauern, bis ein infiziertes Tier Symptome entwickelt, die drastischen Gewichtsverlust (Auszehrung), Stolpern, Antriebslosigkeit und andere neurologische Symptome umfassen können. CWD kann Tiere jeden Alters betreffen und einige infizierte Tiere können sterben, ohne die Krankheit jemals zu entwickeln. CWD ist für Tiere tödlich und es gibt keine Behandlungen oder Impfstoffe.
  • Als Erreger von TSE gelten Prionen. Der Begriff „Prionen“ bezieht sich auf abnormale, pathogene Erreger, die übertragbar und in der Lage sind, eine abnormale Faltung bestimmter normaler zellulärer Proteine, genannt Prionenproteine, die am häufigsten im Gehirn vorkommen, zu induzieren. Die Funktionen dieser normalen Prionenproteine werden noch nicht vollständig verstanden. Die abnormale Faltung der Prionenproteine führt zu Hirnschäden und den charakteristischen Anzeichen und Symptomen der Krankheit. Prionenerkrankungen sind gewöhnlich schnell fortschreitend und immer tödlich.
  • Wie hier verwendet, soll der Begriff „Prion“ ein infektiöses Partikel bedeuten, von dem bekannt ist, dass es bei Menschen und Tieren Krankheiten (spongiforme Enzephalopathien) verursacht. Der Begriff „Prion“ ist eine Kontraktion der Wörter „Protein“ und „Infektion“, und die Partikel bestehen größtenteils, wenn nicht ausschließlich, aus PRNPSc-Molekülen, die von einem PRNP-Gen kodiert werden, das PRNPC exprimiert, das seine Konformation ändert, um PRNPSc zu werden. Prionen unterscheiden sich von Bakterien, Viren und Viroiden. Bekannte Prionen umfassen solche, die Tiere infizieren, um Scrapie zu verursachen, eine übertragbare degenerative Erkrankung des Nervensystems von Schafen und Ziegen sowie bovine spongiforme Enzephalopathien (BSE) oder Rinderwahn und feline spongiforme Enzephalopathien bei Katzen. Vier Prionenerkrankungen, wie oben diskutiert, die bekanntermaßen den Menschen betreffen, sind (1) Kuru, (2) Creutzfeldt-Jakob-Krankheit (CJD), (3) Gerstmann-Strassler-Scheinker-Krankheit (GSS) und (4) tödliche familiäre Schlaflosigkeit (FFI). Wie hierin verwendet, schließt Prion alle Formen von Prionen ein, die alle oder irgendeine dieser Krankheiten oder andere bei allen verwendeten Tieren verursachen - und insbesondere bei Menschen und in domestizierten Nutztieren.
  • Im Allgemeinen und ohne an eine Theorie gebunden sein zu wollen, werden Vorerkrankungen durch Fehlfaltung von Prionenproteinen verursacht. Bei solchen Krankheiten - oft auch Ablagerungskrankheiten genannt - kann die Fehlfaltung der Prionenproteine wie folgt erklärt werden. Wenn A das normalerweise synthetisierte Genprodukt ist, das eine beabsichtigte physiologische Rolle in einem monomeren oder oligomeren Zustand ausübt, ist A* eine konformativ aktivierte Form von A, die kompetent ist, eine dramatische Konformationsänderung einzugehen, B ist der konformativ veränderte Zustand, der multimere Anordnungen (d. h. die fehlgefaltete Form, die Ablagerungen bildet) bevorzugt und Bn ist das multimere Material, das pathogen und relativ schwer zu recyceln ist. Bei den Prionenerkrankungen entsprechen PRNPC und PRNPSc den Zuständen A und Bn, wobei A weitgehend helixförmig und monomer und Bn β-reich und multimer ist.
  • Es ist bekannt, dass bestimmte Mutationen in Prionenproteinen mit einem erhöhten Risiko einer Vorerkrankung verbunden sein können. Umgekehrt können bestimmte Mutationen in Prionenproteinen schützender Natur sein. Siehe Bagynszky et al., „Characterization of mutations in PRNP (prion) gene and their possible roles in neurodegenerative disease“, Neuropsychiatr Dis Treat., 2018; 14: 2067-2085, deren Inhalt hierin durch Bezugnahme aufgenommen ist.
  • PRNP (NCBI RefSeq No. NP-000302.1 (Seq-ID-Nr: 291)) - das menschliche Prionenprotein - wird von einem 16 kb langen Gen kodiert, das sich auf Chromosom 20 (4686151-4701588) befindet. Es enthält zwei Exons, und das Exon 2 trägt den offenen Leserahmen, der das 253 Aminosäuren (AA) lange PrP-Protein codiert. Exon 1 ist ein nicht-kodierendes Exon, das als Transkriptionsinitiations-Site dienen kann. Die posttranslationalen Modifikationen führen zur Entfernung des ersten 22 AA N-terminalen Fragments (NTF) und des letzten 23 AA C-terminalen Fragments (CTF). Der NTF wird nach dem PrP-Transport zum endoplasmatischen Retikulum (ER) gespalten, während der CTF (Glycosylphosphatidylinositol [GPI] Signalpeptid [GPI-SP]) durch den GPI-Anker gespalten wird. GPI-Anker könnten am PrP-Proteintransport beteiligt sein. Sie können auch eine Rolle bei der Anheftung von Prionenprotein an die äußere Oberfläche der Zellmembran spielen. Normales PrP besteht aus einer langen N-terminalen Schleife (die die Octapeptid-Wiederholungsregion enthält), zwei kurzen β-Faltblättern, drei α-Helices und einer C-terminalen Region (die den GPI-Anker enthält). Die Spaltung von PrP führt zu einem 208 AA langen Glykoprotein, das in der Zellmembran verankert ist.
  • Die Aminosäuresequenz von PRNP (NP_000302.1) ist wie folgt:
  •  MANLGCWMLVLFVATWSDLGLCKKRPKPGGWNTGGSRYPGQGSPGGNRYPPQGGGGWGQPHGGG
     WGQPHGGGWGQPHGGGWGQPHGGGWGQGGGTHSQWNKPSKPKTNMKHMAGAAAAGAVVGGLGGY
     MLGSAMSRPIIHFGSDYEDRYYRENMHRYPNQVYYRPMDEYSNQNNFVHDCVNITIKQHTVTTT
     TKGENFTETDVKMMERVVEQMCITQYERESQAYYQRGSSMVLFSSPPVILLISFLIFLIVG
     (SEQ-ID-NR: 291).
  • Die Aminosäuresequenz von PRNP (NP_000302.1) wird durch die folgende Nukleotidsequenz (NCBI Ref. Seq No. NM_000311.5, „Homo Sapiens Prionenprotein (PRNP), Transkriptvariante 1, mRNA) wie folgt kodiert:
  •  GCGAACCTTGGCTGCTGGATGCTGGTTCTCTTTGTGGCCACATGGAGTGACCTGGGCCTCTGCA
     AGAAGCGCCCGAAGCCTGGAGGATGGAACACTGGGGGCAGCCGATACCCGGGGCAGGGCAGCCC
     TGGAGGCAACCGCTACCCACCTCAGGGCGGTGGTGGCTGGGGGCAGCCTCATGGTGGTGGCTGG
     GGGCAGCCTCATGGTGGTGGCTGGGGGCAGCCCCATGGTGGTGGCTGGGGACAGCCTCATGGTG
     GTGGCTGGGGTCAAGGAGGTGGCACCCACAGTCAGTGGAACAAGCCGAGTAAGCCAAAAACCAA
     CATGAAGCACATGGCTGGTGCTGCAGCAGCTGGGGCAGTGGTGGGGGGCCTTGGCGGCTACATG
     CTGGGAAGTGCCATGAGCAGGCCCATCATACATTTCGGCAGTGACTATGAGGACCGTTACTATC
     GTGAAAACATGCACCGTTACCCCAACCAAGTGTACTACAGGCCCATGGATGAGTACAGCAACCA
     GAACAACTTTGTGCACGACTGCGTCAATATCACAATCAAGCAGCACACGGTCACCACAACCACC
     AAGGGGGAGAACTTCACCGAGACCGACGTTAAGATGATGGAGCGCGTGGTTGAGCAGATGTGTA
     TCACCCAGTACGAGAGGGAATCTCAGGCCTATTACCAGAGAGGATCGAGCATGGTCCTCTTCTC
     CTCTCCACCTGTGATCCTCCTGATCTCTTTCCTCATCTTCCTGATAGTGGGATGAGGAAGGTCT
     TCCTGTTTTCACCATCTTTCTAATCTTTTTCCAGCTTGAGGGAGGCGGTATCCACCTGCAGCCC
     TTTTAGTGGTGGTGTCTCACTCTTTCTTCTCTCTTTGTCCCGGATAGGCTAATCAATACCCTTG
     GCACTGATGGGCACTGGAAAACATAGAGTAGACCTGAGATGCTGGTCAAGCCCCCTTTGATTGA
     GTTCATCATGAGCCGTTGCTAATGCCAGGCCAGTAAAAGTATAACAGCAAATAACCATTGGTTA
     ATCTGGACTTATTTTTGGACTTAGTGCAACAGGTTGAGGCTAAAACAAATCTCAGAACAGTCTG
     AAATACCTTTGCCTGGATACCTCTGGCTCCTTCAGCAGCTAGAGCTCAGTATACTAATGCCCTA
     TCTTAGTAGAGATTTCATAGCTATTTAGAGATATTTTCCATTTTAAGAAAACCCGACAACATTT
     CTGCCAGGTTTGTTAGGAGGCCACATGATACTTATTCAAAAAAATCCTAGAGATTCTTAGCTCT
     TGGGATGCAGGCTCAGCCCGCTGGAGCATGAGCTCTGTGTGTACCGAGAACTGGGGTGATGTTT
     TACTTTTCACAGTATGGGCTACACAGCAGCTGTTCAACAAGAGTAAATATTGTCACAACACTGA
     ACCTCTGGCTAGAGGACATATTCACAGTGAACATAACTGTAACATATATGAAAGGCTTCTGGGA
     CTTGAAATCAAATGTTTGGGAATGGTGCCCTTGGAGGCAACCTCCCATTTTAGATGTTTAAAGG
     ACCCTATATGTGGCATTCCTTTCTTTAAACTATAGGTAATTAAGGCAGCTGAAAAGTAAATTGC
     CTTCTAGACACTGAAGGCAAATCTCCTTTGTCCATTTACCTGGAAACCAGAATGATTTTGACAT
     ACAGGAGAGCTGCAGTTGTGAAAGCACCATCATCATAGAGGATGATGTAATTAAAAAATGGTCA
     GTGTGCAAAGAAAAGAACTGCTTGCATTTCTTTATTTCTGTCTCATAATTGTCAAAAACCAGAA
     TTAGGTCAAGTTCATAGTTTCTGTAATTGGCTTTTGAATCAAAGAATAGGGAGACAATCTAAAA
     AATATCTTAGGTTGGAGATGACAGAAATATGATTGATTTGAAGTGGAAAAAGAAATTCTGTTAA
     TGTTAATTAAAGTAAAATTATTCCCTGAATTGTTTGATATTGTCACCTAGCAGATATGTATTAC
     TTTTCTGCAATGTTATTATTGGCTTGCACTTTGTGAGTATTCTATGTAAAAATATATATGTATA
     TAAAATATATATTGCATAGGACAGACTTAGGAGTTTTGTTTAGAGCAGTTAACATCTGAAGTGT
     CTAATGCATTAACTTTTGTAAGGTACTGAATACTTAATATGTGGGAAACCCTTTTGCGTGGTCC
     TTAGGCTTACAATGTGCACTGAATCGTTTCATGTAAGAATCCAAAGTGGACACCATTAACAGGT
     CTTTGAAATATGCATGTACTTTATATTTTCTATATTTGTAACTTTGCATGTTCTTGTTTTGTTA
     TATAAAAAAATTGTAAATGTTTAATATCTGACTGAAATTAAACGAGCGAAGATGAGCACCA
     (SEQ-ID-NR: 292)
  • Mutations-Sitesn relativ zu PRNP (NP_000302.1), die mit CJD und FFI verknüpft sind, werden wie folgt beschrieben. Diese Mutationen können unter Verwendung der hierin offenbarten Prime Editoren entfernt oder installiert werden.
    Figure DE112020001339T5_0176
    Figure DE112020001339T5_0177
    Figure DE112020001339T5_0178
  • Mutations-Sitesn relativ zu PRNP (NP_000302.1) (Seq-ID-Nr: 291), die mit GSS verknüpft sind, werden wie folgt gemeldet:
    Figure DE112020001339T5_0179
    Figure DE112020001339T5_0180
    Figure DE112020001339T5_0181
  • Mutations-Sitesn relativ zu PRNP (NP_000302.1) (Seq-ID-Nr: 291), die mit einem möglichen Schutzcharakter gegen Prionenerkrankungen verbunden sind, wie folgt:
    Figure DE112020001339T5_0182
    Figure DE112020001339T5_0183
    Figure DE112020001339T5_0184
  • Somit kann in verschiedenen Ausführungsformen ein Prime Editing verwendet werden, um eine Mutation in PRNP zu entfernen, die mit einer Prionenerkrankung verbunden ist, oder eine Mutation in PRNP zu installieren, die als Schutz gegen eine Prionenerkrankung angesehen wird. Prime Editing kann beispielsweise verwendet werden, um eine D178N-, V180I-, T188K-, E196K-, E196A-, E200K-, E200G-, V203I-, R208H-, V210I-, E211Q-, 1215V- oder M232R-Mutation im PRNP-Protein (relativ zu PRNP von NP_000302.1) zu entfernen oder wiederherzustellen (Seq-ID-Nr: 291). In weiteren Ausführungen kann Prime Editing beispielsweise verwendet werden, um eine P102L-, P105L-, A117V-, G131V-, V176G-, H187R-, F198S-, D202N-, Q212P-, Q217R- oder M232T-Mutation im PRNP-Protein (relativ zu PRNP von NP_000302.1) zu entfernen oder wiederherzustellen (Seq-ID-Nr: 291). Durch Entfernen oder Korrigieren des Vorhandenseins solcher Mutationen in PRNP unter Verwendung von Prime Editing kann das Risiko einer Prionenerkrankung verringert oder eliminiert werden.
  • In anderen Ausführungsformen kann Prime Editing verwendet werden, um eine schützende Mutation in PRNP zu installieren, die mit einer schützenden Wirkung gegen eine oder mehrere Prionenerkrankungen verbunden ist. Beispielsweise kann Prime Editing beispielsweise verwendet werden, um eine schützende G127S-, G127V-, M129V-, D167G-, D167N-, N171S-, E219K oder P238S-Mutation im PRNP (relativ zu PRNP von NP_000302.1) zu installieren (Seq-ID-Nr: 291). In noch anderen Ausführungsformen kann die schützende Mutation jede alternative Aminosäure sein, die bei G127, G127, M129, D167, D167, N171, E219 oder P238 im PRNP installiert ist (relativ zu PRNP von NP_000302.1) (Seq-ID-Nr: 291) .
  • In bestimmten Ausführungsformen kann Prime Editing verwendet werden, um eine G127V-Schutzmutation in PRNP zu installieren, wie dargestellt in 27 und diskutiert in Beispiel 5.
  • In bestimmten Ausführungsformen kann Prime Editing verwendet werden, um eine E219K-Schutzmutation zu installieren, wie dargestellt in PRNP.
  • Das PRNP-Protein und die schützende Mutations-Site sind bei Säugetieren konserviert, so dass es neben der Behandlung von Krankheiten beim Menschen auch dazu verwendet werden könnte, Kühe und Schafe zu erzeugen, die gegen Prionenerkrankungen immun sind, oder sogar zur Heilung von Wildpopulationen von Tieren, die an Prionenerkrankungen leiden. Prime Editing wurde bereits verwendet, um ~25 % der Installation eines natürlich vorkommenden schützenden Allels in menschlichen Zellen zu erreichen, und frühere Mausexperimente haben gezeigt, dass diese Installation ausreichend ist, um eine Immunität gegen die meisten Prionenerkrankungen zu bewirken. Dieses Verfahren ist die erste und möglicherweise einzige gegenwärtige Möglichkeit, dieses Allel mit so hoher Effizienz in den meisten Zelltypen zu installieren. Eine andere mögliche Behandlungsstrategie besteht darin, Prime Editing zu verwenden, um die Expression von PRNP zu reduzieren oder zu eliminieren, indem ein frühes Stoppcodon in das Gen eingebaut wird.
  • Unter Verwendung der hierin beschriebenen Prinzipien für das PEgRNA-Design können geeignete PEgRNAs zum Installieren gewünschter schützender Mutationen oder zum Entfernen von Prionenerkrankung-assoziierten Mutationen aus PRNP entworfen werden. Beispielsweise kann die folgende Liste von PEgRNAs verwendet werden, um das G127V-Schutzallel und das E219K-Schutzallel in menschlichem PRNP sowie das G127V-Schutzallel in PRNP verschiedener Tiere zu installieren.
    Figure DE112020001339T5_0185
    Figure DE112020001339T5_0186
  • F. Verwendung von Prime Editing für RNA-Tagging
  • Prime Editing kann auch verwendet werden, um die Sequenzen von DNA, die RNA-Funktionen durch RNA-Tagging kodiert, zu manipulieren, zu verändern und anderweitig zu modifizieren, und stellt auf diese Weise ein Mittel bereit, um die Struktur und Funktion von RNA indirekt zu modifizieren. PE kann zum Beispiel verwendet werden, um Motive einzufügen, die auf RNA-Ebene funktionell sind (im Folgenden RNA-Motive), um nicht-kodierende RNAs oder mRNAs zu markieren oder anderweitig zu manipulieren. Diese Motive könnten dazu dienen, die Genexpression zu erhöhen, die Genexpression zu verringern, das Spleißen zu verändern, die posttranskriptionelle Modifikation zu verändern, die subzelluläre Lage der RNA zu beeinflussen, die Isolierung oder Bestimmung der intra- oder extrazellulären Lage der RNA zu ermöglichen (z. B. durch Verwendung fluoreszierender RNA-Aptamere wie Spinat, Spinat2, Baby-Spinat oder Brokkoli), endogene oder exogene Protein- oder RNA-Binder zu rekrutieren , sgRNAs einzuführen oder die Prozessierung der RNA entweder durch Selbstspaltung oder RNAsen zu induzieren (siehe 28B und Beispiel 6 für weitere Details).
  • Die folgenden RNA-Tags oder -Motive können in ein interessierendes Gen unter Verwendung von Prime Editing mit einer geeigneten PEgRNA (entworfen unter Verwendung der hier bereitgestellten Anleitung) eingefügt werden, um verschiedene Eigenschaften von RNA zu beeinflussen, einschließlich RNA-Transport, Expressionsniveau, Spleißen und Nachweis.
    Figure DE112020001339T5_0187
    Figure DE112020001339T5_0188
    Figure DE112020001339T5_0189
    Figure DE112020001339T5_0190
    Figure DE112020001339T5_0191
    Figure DE112020001339T5_0192
    Figure DE112020001339T5_0193
    Figure DE112020001339T5_0194
    Figure DE112020001339T5_0195
    Figure DE112020001339T5_0196
    Figure DE112020001339T5_0197
    Figure DE112020001339T5_0198
    Figure DE112020001339T5_0199
    Figure DE112020001339T5_0200
    Figure DE112020001339T5_0201
    Figure DE112020001339T5_0202
    Figure DE112020001339T5_0203
    Figure DE112020001339T5_0204
    Figure DE112020001339T5_0205
    Figure DE112020001339T5_0206
    Figure DE112020001339T5_0207
    Figure DE112020001339T5_0208
    Figure DE112020001339T5_0209
    Figure DE112020001339T5_0210
    Figure DE112020001339T5_0211
  • Die PEgRNAs der obigen Tabelle wurden entwickelt, um ortsspezifisch Beispiele der obigen Motive in das HEXA-Gen (defekt bei Tay-Sachs-Krankheit) einzufügen (z. B. GenBank Nr. KR710351.1 (Seq-ID-Nr: 369), was jedoch nur der Veranschaulichung dient. Die Verwendung von Prime Editing beim RNA-Tagging ist nicht auf das HEXA-Gen beschränkt und kann tatsächlich beliebig sein. Die HEXA-mRNA hat die folgende Nukleotidsequenz:
  •  GTTCGTTGCAACAAATTGATGAGCAATGCTTTTTTATAATGCCAACTTTGTACAAAAAAGTTGG
     CATGACAAGTTCCAGGCTTTGGTTTTCGCTGCTGCTGGCGGCAGCGTTCGCAGGACGGGCGACG
     GCCCTCTGGCCCTGGCCTCAGAACTTCCAAACCTCCGACCAGCGCTACGTCCTTTACCCGAACA
     ACTTTCAATTCCAGTACGATGTCAGCTCGGCCGCGCAGCCCGGCTGCTCAGTCCTCGACGAGGC
     CTTCCAGCGCTATCGTGACCTGCTTTTCGGTTCCGGGTCTTGGCCCCGTCCTTACCTCACAGGG
     AAACGGCATACACTGGAGAAGAATGTGTTGGTTGTCTCTGTAGTCACACCTGGATGTAACCAGC
     TTCCTACTTTGGAGTCAGTGGAGAATTATACCCTGACCATAAATGATGACCAGTGTTTACTCCT
     CTCTGAGACTGTCTGGGGAGCTCTCCGAGGTCTGGAGACTTTTAGCCAGCTTGTTTGGAAATCT
     GCTGAGGGCACATTCTTTATCAACAAGACTGAGATTGAGGACTTTCCCCGCTTTCCTCACCGGG
     GCTTGCTGTTGGATACATCTCGCCATTACCTGCCACTCTCTAGCATCCTGGACACTCTGGATGT
     CATGGCGTACAATAAATTGAACGTGTTCCACTGGCATCTGGTAGATGATCCTTCCTTCCCATAT
     GAGAGCTTCACTTTTCCAGAGCTCATGAGAAAGGGGTCCTACAACCCTGTCACCCACATCTACA
     CAGCACAGGATGTGAAGGAGGTCATTGAATACGCACGGCTCCGGGGTATCCGTGTGCTTGCAGA
     GTTTGACACTCCTGGCCACACTTTGTCCTGGGGACCAGGTATCCCTGGATTACTGACTCCTTGC
     TACCCTGGGTCTGAGCCCTCTGGCACCTTTGGACCAGTGAATCCCAGTCTCAATAATACCTATG
     AGTTCATGAGCACATTCTTCTTAGAAGTCAGCTCTGTCTTCCCAGATTTTTATCTTCATCTTGG
     AGGAGATGAGGTTGATTTCACCTGCTGGAAGTCCAACCCAGAGATCCAGGACTTTATGAGGAAG
     AAAGGCTTCGGTGAGGACTTCAAGCAGCTGGAGTCCTTCTACATCCAGACGCTGCTGGACATCG
     TCTCTTCTTATGGCAAGGGCTATGTGGTGTGGCAGGAGGTGTTTGATAATAAAGTAAAGATTCA
     GCCAGACACAATCATACAGGTGTGGCGAGAGGATATTCCAGTGAACTATATGAAGGAGCTGGAA
     CTGGTCACCAAGGCCGGCTTCCGGGCCCTTCTCTCTGCCCCCTGGTACCTGAACCGTATATCCT
     ATGGCCCTGACTGGAAGGATTTCTACGTAGTGGAACCCCTGGCATTTGAAGGTACCCCTGAGCA
     GAAGGCTCTGGTGATTGGTGGAGAGGCTTGTATGTGGGGAGAATATGTGGACAACACAAACCTG
     GTCCCCAGGCTCTGGCCCAGAGCAGGGGCTGTTGCCGAAAGGCTGTGGAGCAACAAGTTGACAT
     CTGACCTGACATTTGCCTATGAACGTTTGTCACACTTCCGCTGTGAGTTGCTGAGGCGAGGTGT
     CCAGGCCCAACCCCTCAATGTAGGCTTCTGTGAGCAGGAG
     TTTGAACAGACCTGCCCAACTTTCTTGTACAAAGTTGGCATTATAAGAAAGCATTGCTTATCAA
     TTTGTTGCAACGAAC (SEQ-ID-NR: 369).
  • Das entsprechende HEXA-Protein hat folgende Aminosäuresequenz:
  •  MTSSRLWFSLLLAAAFAGRATALWPWPQNFQTSDQRYVLYPNNFQFQYDVSSAAQPGCSVLDEA
     FQRYRDLLFGSGSWPRPYLTGKRHTLEKNVLVVSVVTPGCNQLPTLESVENYTLTINDDQCLLL
     SETVWGALRGLETFSQLVWKSAEGTFFINKTEIEDFPRFPHRGLLLDTSRHYLPLSSILDTLDV
     MAYNKLNVFHWHLVDDPSFPYESFTFPELMRKGSYNPVTHIYTAQDVKEVIEYARLRGIRVLAE
     FDTPGHTLSWGPGIPGLLTPCYPGSEPSGTFGPVNPSLNNTYEFMSTFFLEVSSVFPDFYLHLG
     GDEVDFTCWKSNPEIQDFMRKKGFGEDFKQLESFYIQTLLDIVSSYGKGYVVWQEVFDNKVKIQ
     PDTIIQVWREDIPVNYMKELELVTKAGFRALLSAPWYLNRISYGPDWKDFYWEPLAFEGTPEQ
     KALVIGGEACMWGEYVDNTNLVPRLWPRAGAVAERLWSNKLTSDLTFAYERLSHFRCELLRRGV
     QAQPLNVGFCEQEFEQT (SEQ-ID-NR: 370).
  • Bemerkenswerterweise würden die resultierenden RNA-Motive innerhalb der translatierten Region des HEXA-Gens enthalten sein, wodurch die Funktion des Protein-kodierenden Gens unterbrochen würde. Eingefügte Polyadenylierungsmotive würden zu einer vorzeitigen Transkripttermination führen. Diese Site ist lediglich illustrativ für die potentiellen PEgRNAs, die zur Insertion der aufgelisteten RNA-Motive der obigen Tabelle innerhalb einer genomischen Site führen könnten, die transkribiert wird und somit ein RNA-Produkt produzieren würde.
  • PEgRNAs zur Verwendung mit PE zum RNA-Tagging könnten von einem U6-Promotor exprimiert werden (in diesem Fall würde ein einzelnes Guanosin an das 5'-Ende der PEgRNA für Guides hinzugefügt, die Protospacer enthalten, die nicht mit einem G und 6-7 Thymin beginnen am 3'-Ende angefügt sind) oder ein pol II-Promotor wie pCMV (in diesem Fall könnte es notwendig sein, die intrinsisch transkribierte Sequenz dieses Promotors vom 5'-Ende der RNA über ein selbstspaltendes Element oder Csy4-Motiv zu entfernen, und ein Terminationsmotiv müsste an das 3'-Ende der RNA angefügt werden, das nicht zum Export der RNA aus dem Kern führt, wie das oben aufgeführte 3'-Box-Motiv. Beachten Sie, dass dieses Motiv aufgrund von PE nicht in das Genom eingefügt würde, da es 3' der Hybridisierungs-Region wäre). Das Kern-PEgRNA-Gerüst ist unterstrichen, die Homologie- und Hybridisierungs-Regionen sind kursiv gedruckt und die eingefügte Sequenz ist fett gedruckt. Beachten Sie, dass die eingefügte Sequenz das reverse Komplement der obigen Beispiele ist - wie unten beschrieben, weshalb diese PEgRNAs auf den kodierenden Strang gerichtet werden müssten.
  • Beachten Sie auch, dass andere selbstspaltende Ribozyme als HDV in einigen Ausführungsformen auf die gegebene Target-Site zugeschnitten werden müssen; das heißt, während HDV das kodierte Transkript sofort 5' zu sich selbst spaltet, befinden sich die Schnittstellen für alle anderen selbstspaltenden Ribozyme innerhalb des Ribozyms selbst. Daher wären die ersten und letzten ungefähr 5-10 Nukleotide (und in einigen Fällen möglicherweise mehr als 10) tatsächlich ein Teil der kodierten Sequenz. Beispielsweise würde, um die Sequenz 5'NNNNNTCATCCTGATAAACTGCAAA3' (SEQ-ID-NR: 371) nach den 5 Ns zu spalten, wobei N ein beliebiges Nukleotid ist, unter Verwendung eines selbstspaltenden Hammerhead-Ribozyms die folgende Sequenz eingefügt werden, wobei die unterstrichenen Sequenzen ein unvollkommenes RNA-Paarungselement bilden.
    Figure DE112020001339T5_0212
  • Hinsichtlich der Länge und Art dieses Paarungselements besteht eine erhebliche Flexibilität, und dies würde für jedes der in der ursprünglichen Einreichung aufgeführten selbstspaltenden Nicht-HDV-Ribozyme zutreffen. Um ein Hammerhead-Ribozym zu installieren, um die hexA-mRNA unter Verwendung einer PEgRNA mit dem gleichen Protospacer wie die oben aufgeführten Konstrukte zu spalten, könnte die folgende PEgRNA-Sequenz verwendet werden (Markierungen wie oben):
    Figure DE112020001339T5_0213
    Figure DE112020001339T5_0214
    (wobei das Kern-PEgRNA-Gerüst unterstrichen ist, die Homologie- und Hybridisierungs-Regionen kursiv sind und die eingefügte Sequenz fett gedruckt ist) (Seq-ID-Nr: 373).
  • Das Entwerfen anderer PEgRNA zur Insertion von RNA-Motiven kann dem hierin beschriebenen allgemeinen Prinzip folgen. Es ist jedoch anzumerken, dass viele der RNA-Motive potenziell stark strukturiert sind, was ihre Reverse-Transkribierung und Insertion in das Genom erschweren könnte. Obwohl für einige RNA-Sequenzen, wie beispielsweise einfache Haarnadeln, sowohl die RNA-Sequenz selbst als auch ihr Komplement strukturiert sind. Es ist jedoch unwahrscheinlich, dass dies für die oben genannten Sequenzen zutrifft. Daher wäre es beim Einfügen dieser Motive höchstwahrscheinlich am besten, wenn die PEgRNA das reverse Komplement dieser Sequenzen kodiert, was dazu führt, dass die DNA-Sequenz, die das Motiv tatsächlich kodiert, in das Genom eingefügt wird. In ähnlicher Weise würde die Aufnahme eines selbstspaltenden Ribozyms in die PEgRNA-Matrizenregion zu Prozessierung und ineffizienter Aktivität führen, während die Aufnahme seines reversen Komplements dies nicht würde. Somit müssen diese PEgRNAs wahrscheinlich auf den kodierenden Strang abzielen, wohingegen PEgRNAs, die andere Arten von Insertionen (wie therapeutische Korrektur) kodieren, theoretisch auf jeden Strang abzielen könnten.
  • Beachten Sie auch, dass für viele der eingefügten Motive die resultierende PEgRNA möglicherweise nicht vom U6-Promotor transkribiert werden kann, was die Verwendung anderer Promotoren wie pCMV erfordert. In ähnlicher Weise könnten auch längere PEgRNAs weniger stabil sein. Kürzere Motive wie m6A-Marker hätten diese Herausforderung nicht.
  • G. Verwendung von Prime Editing zur Generierung anspruchsvoller Genbibliotheken
  • Prime Editing kann auch verwendet werden, um ausgeklügelte Bibliotheken von Protein- oder RNA-kodierenden Genen mit definierten oder variablen Insertionen, Deletionen oder definierten Aminosäure/Nukleotid-Umwandlungen zu erzeugen, und ihre Verwendung beim Hochdurchsatz-Screening und der gerichteten Evolution wird hierin beschrieben. Diese Anwendung des Prime Editing kann in Beispiel 7 weiter beschrieben werden.
  • Die Erzeugung variabler genetischer Bibliotheken wurde am häufigsten durch mutagene PCR erreicht (siehe Cadwell RC und Joyce GF. PCR-Methods Appl. 1992). Dieses Verfahren beruht entweder auf der Verwendung von Reaktionsbedingungen, die die Genauigkeit der DNA-Polymerase verringern, oder auf der Verwendung modifizierter DNA-Polymerasen mit höheren Mutationsraten. Als solche spiegeln sich Verzerrungen in diesen Polymerasen im Bibliotheksprodukt wider (z. B. eine Bevorzugung von Übergangsmutationen gegenüber Transversionen). Eine inhärente Einschränkung dieses Ansatzes zur Bibliothekskonstruktion ist die relative Unfähigkeit, die Größe des zu variierenden Gens zu beeinflussen. Die meisten DNA-Polymerasen haben extrem niedrige Raten von Indel-Mutationen (Insertionen oder Deletionen), und die meisten davon führen zu Rasterverschiebungs-Mutationen in Protein-kodierenden Regionen, was es unwahrscheinlich macht, dass Mitglieder der Bibliothek eine nachgelagerte Selektion überstehen (siehe McInerney P, Adams P, und Hadi MZ. Mol Biol Int. 2014).
  • Darüber hinaus können Verzerrungen bei PCR und Klonierung es schwierig machen, einzelne Bibliotheken zu erstellen, die aus Genen unterschiedlicher Größe bestehen. Diese Beschränkungen können die Wirksamkeit der gerichteten Evolution zur Verbesserung bestehender oder zur Konstruktion neuer Proteinfunktionen stark einschränken. In der natürlichen Evolution sind große Veränderungen der Proteinfunktion oder -wirksamkeit typischerweise mit Insertions- und Deletionsmutationen verbunden, die während der kanonischen Bibliotheksgenerierung für die Mutagenese wahrscheinlich nicht auftreten. Darüber hinaus treten diese Mutationen am häufigsten in Regionen des fraglichen Proteins auf, von denen vorhergesagt wird, dass sie Schleifen bilden, im Gegensatz zum hydrophoben Kern. Daher sind die meisten unter Verwendung eines traditionellen unvoreingenommenen Ansatzes erzeugten Indels wahrscheinlich entweder schädlich oder ineffektiv.
  • Bibliotheken, die solche Mutationen auf die Sitesn innerhalb des Proteins verlagern könnten, wo sie am wahrscheinlichsten von Vorteil wären, z. B. Loop-Regionen, hätten einen erheblichen Vorteil gegenüber herkömmlichen Bibliotheken, da alle Bibliotheken nur auf einen Bruchteil des möglichen Mutationsraums zugreifen. Obwohl es schließlich möglich ist, genetische Bibliotheken mit ortsspezifischen Indel-Mutationen durch mehrstufige PCR und klonale Assemblierung unter Verwendung von NNK-Primern oder durch DNA-Shuffling zu generieren, können diese Bibliotheken in der kontinuierlichen Evolution keine zusätzlichen Runden der „Indelgenese“ durchlaufen. Kontinuierliche Evolution ist eine Art der gerichteten Evolution mit minimalem Benutzereingriff. Ein solches Beispiel ist PACE (siehe Esvelt KM, Carlson JC und Liu DR. Nature. 2011). Da eine kontinuierliche Evolution mit minimalem Benutzereingriff erfolgt, muss jede Erhöhung der Bibliotheksvielfalt während der Evolution unter Verwendung der nativen Replikationsmaschinerie erfolgen. Obwohl Genbibliotheken mit eingefügten oder entfernten Codons als spezifische Loki generiert und in PACE gescreent werden können, sind daher zusätzliche Runden der „Indelgenese“ nicht möglich.
  • Es ist vorgesehen, dass die Programmierbarkeit des Prime Editing (PE) genutzt werden kann, um hochentwickelte, programmierte genetische Bibliotheken zur Verwendung beim Hochdurchsatz-Screening und der gerichteten Evolution zu erzeugen (siehe 29A). PE kann definierte Nukleotidzahlen von spezifischen genetischen Loki unter Verwendung von Informationen einfügen, ändern oder entfernen, die in einer Prime Editing Guide-RNA (SgRNA) kodiert sind (siehe 29B). Dies ermöglicht die Erzeugung von gezielten Bibliotheken mit einer oder mehreren Aminosäuren, die in die Schleifenregionen eingefügt oder aus diesen entfernt sind, wobei Mutationen am wahrscheinlichsten zu Funktionsänderungen führen, ohne Hintergrundeinführung nichtfunktioneller Rasterverschiebungs-Mutationen (siehe 29C). PE kann verwendet werden, um spezifische Mutationssätze zu installieren, ohne Rücksicht auf Verzerrungen, die entweder der DNA-Polymerase oder der mutierten Sequenz inhärent sind.
  • Während beispielsweise die Umwandlung eines CCC-Codons in ein Stop-Codon über die Generierung einer kanonischen Bibliothek ein unwahrscheinliches Ereignis wäre, da es drei aufeinanderfolgende Mutationen, einschließlich zweier Transversionen, erfordern würde, könnte PE verwendet werden, um jedes gegebene, zielgerichtete Codon in ein TGA-Stopp-Codon in einem Schritt umzuwandeln. Sie könnten auch verwendet werden, um programmierte Diversität an gegebenen Positionen zu installieren, zum Beispiel durch Einbau von Codons, die jede hydrophobe Aminosäure an einer gegebenen Site kodieren, während sie keine anderen kodieren. Darüber hinaus könnten aufgrund der Programmierbarkeit von PE mehrere PEgRNAs verwendet werden, um mehrere unterschiedliche Editierungen an mehreren Sitesn gleichzeitig zu erzeugen, was die Erzeugung hochprogrammierter Bibliotheken ermöglicht (siehe 29D). Zusätzlich ist es möglich, Reverse Transkriptasen mit geringerer Genauigkeit zu verwenden, um Mutageneseregionen innerhalb einer ansonsten unveränderlichen Bibliothek zu erzeugen (wie die Reverse Transkriptase von HIV-I oder die Reverse Transkriptase des Bordetella-Phagen) (siehe Naorem SS, Hin J, Wang S, Lee WR , Heng X, Miller JF, Guo H. Proc Natl Acad Sci 2017 und Martinez MA, Vartanian JP, Wain-Hobson S. Proc Natl Acad Sci USA 1994).
  • Die Möglichkeit iterativer PE-Runden an derselben Site wird ebenfalls ins Auge gefasst, was zum Beispiel die wiederholte Insertion von Codons an einer einzelnen Site, z. B. in einer Schleifenregion, ermöglicht. Es ist auch vorgesehen, dass alle der oben beschriebenen Ansätze in eine kontinuierliche Evolution integriert werden können, was die Erzeugung neuer sich in situ entwickelnder Bibliotheken ermöglicht (siehe 30). Sie könnten auch verwendet werden, um diese Bibliotheken in anderen Zelltypen zu konstruieren, wo es sonst schwierig wäre, große Bibliotheken zusammenzustellen, beispielsweise in Säugetierzellen. Die Generierung von PE-kodierenden Bakterienstämmen, die für die gerichtete Evolution optimiert wurden, wäre ein nützliches zusätzliches Werkzeug zur Identifizierung von Proteinen und RNAs mit verbesserter oder neuartiger Funktionalität. Alle diese Verwendungen von PE sind aufgrund der neuartigen Natur von PE nicht offensichtlich. Zusammenfassend lässt sich sagen, dass die Generierung von Bibliotheken über PE ein sehr nützliches Werkzeug in der synthetischen Biologie und der gerichteten Evolution sowie für das Hochdurchsatz-Screening von kombinatorischen Protein- und RNA-Mutanten wäre.
  • Konkurriende Ansätze
  • Die Hauptmethode, mit der verschiedene Bibliotheken derzeit erzeugt werden, ist die mutagene PCR (siehe Cadwell RC und Joyce GF. PCR-Methods Appl. 1992), oben beschrieben. Insertionen oder Deletionen können über degenerierte NNK-Primer an definierten Sitesn während der PCR eingeführt werden, obwohl das Einführen solcher Mutationen an mehreren Sitesn mehrere Runden iterativer PCR und Klonierung erfordert, bevor eine vielfältigere Bibliothek über mutagene PCR konstruiert wird, was das Verfahren verlangsamt. Eine alternative, komplementäre Methode ist das DNA-Shuffling, bei dem Fragmente einer durch DNase-Behandlung erzeugten Genbibliothek ohne Primer in eine PCR-Reaktion eingeführt werden, was zur Hybridisierung verschiedener Fragmente aneinander und zur schnelleren Generierung diverserer Bibliotheken als über mutagene PCR allein führt (siehe Meyer AJ, Ellefson JW, Ellington AD. Curr Protoc Mol Biol. 2014). Obwohl dieser Ansatz theoretisch Indel-Mutationen erzeugen kann, führt er häufiger zu Frameshift-Mutationen, die die Genfunktion zerstören. Darüber hinaus erfordert das DNA-Shuffling ein hohes Maß an Homologie zwischen Genfragmenten.
  • Beide Verfahren müssen in vitro durchgeführt werden, wobei die resultierende Bibliothek in Zellen transformiert wird, während durch PE erzeugte Bibliotheken in situ konstruiert werden können, was ihre Verwendung in der kontinuierlichen Evolution ermöglicht. Während Bibliotheken in situ durch in-vivo-Mutagenese konstruiert werden können, beruhen diese Bibliotheken auf der zellulären Maschinerie des Wirts und zeigen Voreingenommenheit gegenüber Indels. Obwohl herkömmliche Klonierungsverfahren verwendet werden können, um ortsspezifische Mutationsprofile zu erzeugen, können sie in ähnlicher Weise nicht in situ verwendet werden und werden im Allgemeinen einzeln in vitro zusammengesetzt, bevor sie in Zellen transformiert werden. Die Effizienz und breite Funktionalität von PE sowohl in prokaryontischen als auch in eukaryontischen Zelltypen legt ferner nahe, dass diese Bibliotheken direkt in dem interessierenden Zelltyp konstruiert werden könnten, anstatt in einen Modellorganismus wie E. coli kloniert und dann in die interessierende Zelle oder Organismus transferiert zu werden. Ein weiterer konkurrierender Ansatz zur gezielten Diversifizierung ist das automatisierte Multiplex Genome Engineering oder MAGE, bei dem mehrere einzelsträngige DNA-Oligonukleotide in Replikationsgabeln eingebaut werden können und zu programmierbaren Mutationen führen7. MAGE erfordert jedoch eine signifikante Modifikation des Wirtsstamms und kann zu einer 100-fachen Zunahme von Off-Target- oder Hintergrundmutationen führen (siehe Nyerges Á et al. Proc Natl Acad Sci USA. 2016), während PE höher programmiert ist und voraussichtlich zu weniger Off-Target-Effekten führen wird. Außerdem wurde MAGE in einer Vielzahl von Zelltypen, einschließlich Säugetierzellen, nicht nachgewiesen.
  • Im Gegensatz dazu ist das Prime Editing eine neuartige und nicht offensichtliche ergänzende Technik zur Bibliothekserstellung.
  • Verwendung von PE zum Aufbau von Genbibliotheken
  • PE kann verwendet werden, um Genbibliotheken auf programmierbare Weise zu konstruieren.
  • In einem Beispiel kann PE in einem gerichteten Evolutionsexperiment verwendet werden, um Proteinvarianten in Genbibliotheken während eines kontinuierlichen Evolutionsexperiments unter Verwendung von PACE einzuführen, was eine iterative Akkumulation sowohl von Punktmutationen als auch von Indels auf eine Weise ermöglicht, die mit herkömmlichen Ansätzen nicht möglich ist.
  • Es wurde bereits gezeigt, dass PE ortsspezifisch und programmierbar Nukleotide in eine genetische Sequenz in E. coli einfügen kann. Die gerichtete Evolution kann verwendet werden, um Monobodies mit verbesserter Bindung an ein spezifisches Epitop über eine modifizierte Zwei-Hybrid-Protein:Protein-bindende PACE-Selektion zu identifizieren. Spezifische und hochvariable Schleifen innerhalb dieser Monobodies tragen wesentlich zur Affinität und Spezifität bei. Durch gezielte Variation der Länge und Zusammensetzung dieser Schleifen könnte eine verbesserte Monobody-Bindung bei PACE schnell erreicht werden. Die variierende Sequenzlänge ist jedoch keine etablierte Funktionalität von PACE. Während eine Bibliothek mit unterschiedlichen Schleifengrößen als Ausgangspunkt für PACE verwendet werden könnte, würden sich während der gesamten PACE-Selektion keine nachfolgenden Längenverbesserungen ergeben, was den Zugang zu vorteilhaften synergistischen Kombinationen von Punktmutationen und Indel-Mutationen ausschließt.
  • In verschiedenen Ausführungsformen kann PE verwendet werden, um die PACE-Auswahl zu verbessern, indem die in-situ-Erzeugung und -Entwicklung von Monobodies mit variierenden Schleifenlängen ermöglicht wird. Dazu kann der E. coli-Stamm PACE in ein zusätzliches PE-Plasmid eingeführt werden, das das PE-Enzym und eine oder mehrere PEgRNAs kodiert. Die Expression von PE-Enzym und PEgRNAs in E. coli würde unter der Kontrolle eines kleinen Moleküls stehen, das mit einer vom Experimentator ausgewählten Rate an die PACE-Lagune abgegeben wird.
  • In verschiedenen Ausführungsformen würden die PEgRNA-Komponenten einen Spacer enthalten, der das PE zu der interessierenden Site auf dem Selektionsphagen lenkt, und so gestaltet sein, dass ein Vielfaches von drei Nukleotiden an der Target-Site eingefügt werden könnte, so dass eine neue PEgRNA-Bindungs-Site eingeführt wäre, wodurch die iterative Insertion eines oder mehrerer Codons an der Target-Site ermöglicht wird.
  • Parallel dazu könnte ein anderer E. coli-Wirtsstamm PEgRNAs enthalten, die die Entfernung eines oder mehrerer Codons templatisieren würden, wodurch die Schleifengröße während der Evolution schrumpfen kann. Ein PACE-Experiment könnte eine Mischung beider Stämme verwenden oder die beiden abwechseln, um das langsame und kontrollierte Hinzufügen oder Entfernen von Schleifensequenzen zu ermöglichen.
  • Neben der Verwendung von PE und PACE zur Erstellung von Monobody-Bibliotheken kann diese Technik auch auf die Evolution von Antikörpern unter Verwendung von PE und PACE angewendet werden. Die Bindungsprinzipien für Antikörper sind denen für Monobodies sehr ähnlich: Die Länge der Schleifen der Antikörper-Komplementbestimmenden Region ist entscheidend für ihre Bindungsfunktion. Darüber hinaus haben sich längere Schleifenlängen als kritisch bei der Entwicklung seltener Antikörper mit allgemein schützender Aktivität gegen HIV-1 und andere Virusinfektionen erwiesen (siehe Mascola JR, Haynes BF. Immunol Rev. 2013). Die Anwendung von PE, wie oben beschrieben, auf einen Antikörper oder ein von einem Antikörper abgeleitetes Molekül würde die Erzeugung von Antikörpern mit unterschiedlicher Schleifenlänge und unterschiedlicher Schleifensequenz ermöglichen. In Kombination mit PACE würde ein solcher Ansatz eine verstärkte Bindung durch Schleifengeometrien ermöglichen, die für Standard-PACE nicht zugänglich sind, und somit die Evolution hochfunktioneller Antikörper ermöglichen.
  • Als nicht einschränkendes Beispiel könnten die folgenden PEgRNAs verwendet werden, um das Genom eines Bakteriophagen, der in einem kontinuierlichen Evolutionsexperiment verwendet wird, programmierbar zu modifizieren:
    Figure DE112020001339T5_0215
  • In verschiedenen Ausführungsformen kann die Verwendung von PE zum Konstruieren von Genbibliotheken die mutagene Aktivität von fehleranfälligen reversen Transkriptasen nutzen. Die Verwendung einer solchen mutagenen reversen Transkriptase kann die Erzeugung mutagenisierter programmierbarer Bibliotheken aufgrund der geringeren Genauigkeit der fehleranfälligen RTs erleichtern. Wie hier verwendet, bezieht sich der Begriff „fehleranfällige“ Reverse Transkriptase auf ein Enzym der reversen Transkriptase, das natürlich vorkommt oder von einer anderen reversen Transkriptase (z. B. einer Wildtyp-M-MLV-Reverse-Transkriptase) abgeleitet wurde, die eine Fehlerrate kleiner als die Fehlerrate der Wildtyp-M-MLV-reversen-Transkriptase aufweist. Es wird berichtet, dass die Fehlerrate der Wildtyp-M-MLV-reversen Transkriptase im Bereich von einem Fehler von 15.000 bis 27.000 Nukleobaseneinbauten liegt. siehe Boutabout et al. (2001) „DNA synthesis fidelity by the reverse transcriptase of the yeast retrotransposon Tyl,“ Nucleic Acids Res 29(11): 2217-2222, die hier durch Bezugnahme aufgenommen wird.
  • Für die Zwecke dieser Anmeldung bezieht sich der Begriff „fehleranfällig“ daher auf diejenigen RT, deren Fehlerrate größer als ein Fehler von 15,000 Nukleobaseneinbauten (6.7 x 10-5 oder höher) ist, z. B., 1 Fehler in 14,000 Nukleobasen (7.14 x 10-5 oder höher), 1 Fehler in 13,000 Nukleobasen oder weniger (7.7 x 10-5 oder höher), 1 Fehler in 12,000 Nukleobasen oder weniger (7.7 × 10-5 oder höher), 1 Fehler in 11,000 Nukleobasen oder weniger (9.1 × 10-5 oder höher), 1 Fehler in 10,000 Nukleobasen oder weniger (1 × 10-4 or 0.0001 oder höher), 1 Fehler bei 9.000 Nukleobasen oder weniger (0,00011 oder höher), 1 Fehler bei 8.000 Nukleobasen oder weniger (0.00013 oder höher) 1 Fehler bei 7.000 Nukleobasen oder weniger (0.00014 oder höher), 1 Fehler bei 6.000 Nukleobasen oder weniger (0.00016 oder höher), 1 Fehler bei 5.000 Nukleobasen oder weniger (0.0002 oder höher), 1 Fehler bei 4.000 Nukleobasen oder weniger (0,00025 oder höher), 1 Fehler bei 3.000 Nukleobasen oder weniger (0,00033 oder höher), 1 Fehler bei 2.000 Nukleobasen oder weniger (0,00050 oder höher) oder 1 Fehler bei 1.000 Nukleobasen oder weniger (0,001 oder höher) oder 1 Fehler bei 500 Nukleobasen oder weniger (0,002 oder höher) oder 1 Fehler bei 250 Nukleobasen oder weniger (0,004 oder höher).
  • Eine Vielzahl von mutagenen RTs könnte für die Erzeugung hochmutagenisierter programmierbarer Bibliotheken ins Auge gefasst werden. Zwei solcher Beispiele sind die mutagenen reversen Transkriptasen aus Bordetella-Phagen (siehe Handa, S., et al. Nucl Acids Res 9711-25 (2018), das hier durch Bezugnahme aufgenommen wird) and Legionella pneumophila (see Arambula, D., et al. Proc Natl Acad Sei USA 8212-7 (2013), das hier durch Bezugnahme aufgenommen wird). Im Fall der RT aus Bordetella-Phagen (Bordetella phage - brt) muss möglicherweise auch ein akzessorisches Protein (accessory protein - Bavd) zu Cas9 hinzugefügt - oder in trans abgegeben - sowie zusätzliche RNA-Sequenzen zur PEgRNA hinzugefügt werden, um die Bindung der mutagenen RT an die Target-Site zu verbessern (siehe Handa, S., et al. Nucl Acids Res 9711-25 (2018)). Bei der Verwendung mutagener RTs könnte die Template-Region der PEgRNA mit Adenosinen oder AAY-Codons angereichert werden, um die Diversität zu erhöhen.
  • Die Aminosäuresequenz der mutagenen RT aus Bordetella-Phagen wird wie folgt bereitgestellt. Wie andere hierin offenbarte RTs kann das Brt-Protein mit einem napDNAbp als Fusionsprotein fusioniert werden, um ein funktionelles PE zu bilden.
    Name Sequenz
    BRT-Mutagen-RT
    Figure DE112020001339T5_0216
    Figure DE112020001339T5_0217
  • Im Fall von Brt von Bodetella kann die PE-Fusion auch ein zusätzliches akzessorisches Protein (Bavd) enthalten. Das akzessorische Protein kann an das PE-Fusionsprotein fusioniert oder in trans bereitgestellt werden. Die Aminosäuresequenz von Bavd wird wie folgt bereitgestellt:
    Name Sequenz
    Bavd akzessorisches Protein an Brt
    Figure DE112020001339T5_0218
  • Im Fall von Brt von Bodetella kann die PEgRNA eine zusätzliche Nukleotidsequenz umfassen, an die eine PEgRNA angefügt ist, z. B. an das 5'- oder 3'-Ende. Die beispielhafte Sequenz ist wie folgt, welche ursprünglich aus dem Bordetella-Phagengenom stammt:
    NAME SEQUENZ
    PEGRNA-ADDITION 1
    Figure DE112020001339T5_0219
  • Diese PEgRNA-Additionssequenz kann auf verschiedene Weise reduziert werden, um die Länge zu verkürzen. Beispielsweise könnte die PEgRNA-Addition 1-Sequenz auf die folgenden beispielhaften alternativen Additionssequenzen reduziert werden:
    Figure DE112020001339T5_0220
    Figure DE112020001339T5_0221
  • In anderen Ausführungsformen kann die PEgRNA-Additionssequenz auch mutiert sein. Beispielsweise könnte die PEgRNA-Addition 1-Sequenz zu der folgenden beispielhaften alternativen Additionssequenzen mutiert werden:
    NAME SEQUENZ
    PEGRNA-ADDITION
    Figure DE112020001339T5_0222
    1 MUTIERT
    Figure DE112020001339T5_0223
  • In verschiedenen Ausführungsformen, die sich auf die Verwendung von PE zum Designen von Genbibliotheken beziehen, können spezielle Überlegungen zu PEgRNAs gelten. Ohne an eine Theorie gebunden sein zu wollen, könnten beispielsweise die oben beschriebenen zusätzlichen PEgRNA-Sequenzen benötigt werden, um eine effiziente Mutagenese über mutagene RTs zu ermöglichen. In einer anderen Ausführungsform kann die iterative Codon-Insertion unter Verwendung von PE spezifische PEgRNA-Designs erfordern. m beispielsweise ein GGG (Glycin)-Codon iterativ einzufügen, muss die gesamte Homologieregion der PEgRNA möglicherweise aus Gs bestehen, wie oben gezeigt. Dies würde bedeuten, dass nur bestimmte Sites iterativ eingefügt werden könnten. Außerdem könnte die PAM-Sequenz nicht durch das PE unterbrochen werden.
  • H. Verwendung von Prime Editing zum Einfügen von Immunepitopen
  • Prime Editoren können auch als Mittel verwendet werden, um bekannte Immunogenitäts-Epitope in endogene oder fremde genomische DNA einzufügen, was zu einer Modifikation der entsprechenden Proteine für therapeutische oder biotechnologische Anwendungen führt (siehe 31 und 32) Vor der Erfindung des Prime Editing konnten solche Einfügungen nur ineffizient und mit hohen Informationsraten von DSBs erreicht werden. Prime Editing löst das Problem der hohen Informationsdichte bei Insert-Edits und bietet im Allgemeinen eine höhere Effizienz als HDR. Diese niedrigere Rate der Indel-Bildung stellt einen Hauptvorteil des Prime Editing gegenüber HDR als Methode für gezielte DNA-Insertionen dar, insbesondere bei der beschriebenen Anwendung der Insertion von Immunogenitätsepitopen. Die Länge der Epitope liegt im Bereich von wenigen Basen bis zu Hunderten von Basen. Prime Editing ist ein effizienter Ansatz, um solche gezielten Insertionen in Säugetierzellen zu erreichen.
  • Das Schlüsselkonzept der Erfindung ist die Verwendung von Prime Editoren, um eine Nukleotidsequenz, die zuvor beschriebene Immunogenitätsepitope enthält, in endogene oder fremde genomische DNA zur Herunterregulierung und/oder Zerstörung ihrer Proteinprodukte und/oder exprimierenden Zelltypen einzufügen. Nukleotidsequenzen für die immunogene Epitopinsertion würden auf Gene in einer Weise gezielt werden, um Fusionsproteine des kodierten Proteins des Target-Gens und der entsprechenden Proteintranslation des eingefügten immunogenen Epitops zu produzieren. Das Immunsystem des Patienten wurde zuvor darauf trainiert, diese Epitope als Ergebnis einer vorherigen Standardimmunisierung von einer routinemäßigen Impfung beispielsweise gegen Tetanus oder Diphtherie oder Masern zu erkennen. Aufgrund der immunogenen Natur der fusionierten Epitope würde erwartet, dass das Immunsystem des Patienten das primeeditierte Protein (nicht nur das eingefügte Epitop) und möglicherweise die Zellen, aus denen es exprimiert wurde, erkennt und deaktiviert.
  • Präzise Genom-Targeting-Technologien unter Verwendung des CRISPR/Cas-Systems wurden kürzlich in einer Vielzahl von Anwendungen untersucht, einschließlich der Insertion von gentechnisch veränderten DNA-Sequenzen in gezielte genomische Loki. Zuvor wurde für diese Anwendung die homologiegerichtete Reparatur (homology-directed repair - HDR) verwendet, die ein ssDNA-Donor-Template und eine Reparaturinitiation mittels eines doppelsträngigen DNA-Bruchs (double-stranded DNA break - DSB) erforderte. Diese Strategie bietet das breiteste Spektrum möglicher Veränderungen in Zellen und ist die einzige verfügbare Methode, um große DNA-Sequenzen in Säugerzellen einzufügen. HDR wird jedoch durch unerwünschte zelluläre Nebenwirkungen behindert, die von seinem initiierenden DSB herrühren, wie z. B. hohe Indel-Bildung, DNA-Translokationen, große Deletionen und P53-Aktivierung. Zusätzlich zu diesen Nachteilen ist HDR in vielen Zelltypen durch eine geringe Effizienz eingeschränkt (T-Zellen sind eine bemerkenswerte Ausnahme von dieser Beobachtung). Zu den jüngsten Bemühungen, diese Nachteile zu überwinden, gehört die Fusion menschlicher Rad51-Mutanten mit einer Cas9-D10A-Nickase (RDN), was zu einem DSB-freien HDR-System führt, das verbesserte HDR-Produkt:Indel-Verhältnisse und eine geringere Off-Target-Editing aufweist, aber immer noch durch Zelltyp-Abhängigkeiten und nur bescheidene HDR-Editing-Effizienz behindert wird.
  • Kürzlich entwickelte Fusionen von Cas9 mit reversen Transkriptasen („Prime Editoren“) gekoppelt mit PEgRNAs stellen eine neuartige Genom-Editing-Technologie dar, die eine Reihe von Vorteilen gegenüber bestehenden Genom-Editing-Methoden bietet, einschließlich der Möglichkeit, jede einzelne Nukleotid-Substitution zu installieren und zu inserieren oder jeden kurzen Abschnitt von Nukleotiden (bis zu mindestens mehreren Dutzend Basen) auf ortsspezifische Weise zu löschen. Bemerkenswerterweise werden PE-Editsen mit im Allgemeinen geringen Raten unbeabsichtigter Indels erreicht. Als solches ermöglicht PE gezieltes, einfügebasiertes Editingsanwendungen, die zuvor unmöglich oder unpraktisch waren.
  • Dieser besondere Aspekt beschreibt ein Verfahren zur Verwendung von Prime Editing als Mittel zum Einfügen bekannter Immunogenitätsepitope in endogene oder fremde genomische DNA, was zu einer Modifikation der entsprechenden Proteine für therapeutische oder biotechnologische Anwendungen führt (siehe 31 und 32) Vor der Erfindung des Prime Editing konnten solche Einfügungen nur ineffizient und mit hohen Informationsraten von DSBs erreicht werden. Prime Editing löst das Problem der hohen Informationsdichte bei Insert-Edits und bietet im Allgemeinen eine höhere Effizienz als HDR. Diese niedrigere Rate der Indel-Bildung stellt einen Hauptvorteil des Prime Editing gegenüber HDR als Methode für gezielte DNA-Insertionen dar, insbesondere bei der beschriebenen Anwendung der Insertion von Immunogenitätsepitopen. Die Länge der Epitope liegt im Bereich von wenigen Basen bis zu Hunderten von Basen. Prime Editing ist die effizienteste und sauberste Technologie, um solche gezielten Insertionen in Säugetierzellen zu erreichen.
  • Das Schlüsselkonzept dieses Aspekts ist die Verwendung von Prime Editoren, um eine Nukleotidsequenz, die zuvor beschriebene Immunogenitätsepitope enthält, in endogene oder fremde genomische DNA zur Herunterregulierung und/oder Zerstörung ihrer Proteinprodukte und/oder exprimierenden Zelltypen einzufügen. Nukleotidsequenzen für die immunogene Epitopinsertion würden auf Gene in einer Weise gezielt werden, um Fusionsproteine des kodierten Proteins des Target-Gens und der entsprechenden Proteintranslation des eingefügten immunogenen Epitops zu produzieren. Das Immunsystem des Patienten wurde zuvor darauf trainiert, diese Epitope als Ergebnis einer vorherigen Standardimmunisierung von einer routinemäßigen Impfung beispielsweise gegen Tetanus oder Diphtherie oder Masern zu erkennen. Aufgrund der immunogenen Natur der fusionierten Epitope würde erwartet, dass das Immunsystem des Patienten das primeeditierte Protein (nicht nur das eingefügte Epitop) und möglicherweise die Zellen, aus denen es exprimiert wurde, erkennt und deaktiviert.
  • Fusionen mit Target-Genen würden nach Bedarf manipuliert, um sicherzustellen, dass die Translation des inserierten Epitopproteins für die Erkennung des Immunsystems exponiert wird. Dies könnte gezielte Nukleotidinsertionen umfassen, die zu Proteintranslationen führen, die C-terminale Fusionen von Immunogenitätsepitopen mit Target-Genen, N-terminale Fusionen von Immunogenitätsepitopen mit Zielgenen oder die Insertion von Nukleotiden in Gene ergeben, so dass Immunogenitätsepitope innerhalb oberflächenexponierter Regionen der Proteinstruktur kodiert werden.
  • Protein-Linker, die als Nukleotide kodiert werden, die zwischen der Zielgensequenz und der eingefügten Immunogenitätsepitop-Nukleotidsequenz eingefügt sind, müssen möglicherweise als Teil dieser Erfindung konstruiert werden, um die Erkennung des Immunsystems, den Zelltransport, die Proteinfunktion oder die Proteinfaltung des Zielgens zu erleichtern. Diese inserierten Nukleotid-kodierten Protein-Linker können (sind aber nicht beschränkt auf) variable Längen und Sequenzen des XTEN-Linkers oder variable Längen und Sequenzen von Glycin-Serin-Linkern umfassen. Diese konstruierten Linker wurden früher verwendet, um Proteinfusionen erfolgreich zu erleichtern. Beispielhafte Linker können jeden der hierin beschriebenen umfassen, einschließlich der Aminosäuresequenz (GGGGS)n (SEQ-ID-NR: 165), (G)n (SEQ-ID-NR:: 166), (EAAAK)n (SEQ-ID-NR:: 167), (GGS)n (SEQ-ID-NR:: 168), (SGGS)n (SEQ-ID-NR:: 169), (XP)n (SEQ-ID-NR:: 170), oder eine beliebige Kombination davon, wobei n unabhängig eine ganze Zahl zwischen 1 und 30 ist und wobei X eine beliebige Aminosäure ist. In einigen Ausführungsformen umfasst der Linker die Aminosäuresequenz (GGS)n (SEQ-ID-NR: 176), worin n 1, 3, or 7 ist. In einigen Ausführungsformen umfasst der Linker die Aminosäuresequenz SGSETPGTSESATPES (SEQ-ID-NR: 171). In einigen Ausführungsformen umfasst der Linker die Aminosäuresequenz SGGSSGGSSGSETPGTSESATPESSGGSSGGS (SEQ-ID-NR: 172). In einigen Ausführungsformen umfasst der Linker die Aminosäuresequenz SGGSGGSGGS (SEQ-ID-NR: 173). In einigen Ausführungsformen umfasst der Linker die Aminosäuresequenz SGGS (SEQ-ID-NR: 174).
  • Unterscheidungsmerkmale dieses Aspekts schließen die Fähigkeit ein, zuvor erworbene Immunantworten auf spezifische Aminosäuresequenzen als Mittel zu verwenden, um eine Immunantwort gegen ansonsten nicht immunogene Proteine zu induzieren. Ein weiteres Unterscheidungsmerkmal ist die Fähigkeit, die Nukleotidsequenzen dieser immunogenen Epitope auf eine Zielart zu inserieren, die keine hohen Mengen an unerwünschten Indels als Nebenprodukt-Editierung induziert und bei ihrer Insertion effizient ist. Diese spezifische Anwendung von PE hat die Fähigkeit, zelltypspezifische Abgabemethoden (wie AAV-Serotypen) zu kombinieren, um Epitope in Zelltypen zu inserieren, die für die Auslösung einer interessierenden Immunantwort sind.
  • Prime Editing als Mittel zum Einfügen immunogener Epitope in pathogene Gene könnte verwendet werden, um das Immunsystem des Patienten so zu programmieren, dass es eine Vielzahl von Krankheiten bekämpft (nicht beschränkt auf Krebs wie bei immunonkologischen Strategien). Eine unmittelbar relevante Anwendung dieser Technologie wäre als Krebstherapeutikum, da sie den Immun-Escape-Mechanismus eines Tumors untergraben könnte, indem sie eine Immunantwort auf ein relevantes Onkogen wie HER2 oder Wachstumsfaktoren wie EGFR auslöst. Ein solcher Ansatz könnte dem T-Zell-Engineering ähnlich erscheinen, aber ein neuer Fortschritt dieses Ansatzes besteht darin, dass er in vielen Zelltypen und für Krankheiten jenseits von Krebs eingesetzt werden kann, ohne dass manipulierte T-Zellen erzeugt und in Patienten eingeführt werden müssen.
  • Verwendung von PE zum Einfügen eines Immunogenitätsepitops, gegen das die meisten Menschen bereits geimpft sind (Tetanus, Keuchhusten, Diphtherie, Masern, Mumps, Röteln usw.) in ein fremdes oder endogenes Gen, das eine Krankheit verursacht, damit das Immunsystem des Patienten lernt, dieses Protein zu deaktivieren.
  • Krankheiten, die einen potentiellen therapeutischen Nutzen aus der oben genannten Strategie haben könnten, umfassen solche, die durch Aggregation toxischer Proteine verursacht werden, wie etwa bei tödlicher familiärer Schlaflosigkeit. Andere Krankheiten, die davon profitieren könnten, umfassen solche, die durch eine pathogene Überexpression eines ansonsten ungiftigen endogenen Proteins verursacht werden, und solche, die durch fremde Pathogene verursacht werden.
  • Zu den primären therapeutischen Indikationen gehören die oben erwähnten, wie Therapeutika für Krebs-, Prionen- und andere neurodegenerative Erkrankungen, Infektionskrankheiten und Präventivmedizin. Sekundäre therapeutische Indikationen können die vorbeugende Behandlung von Patienten mit spät einsetzenden genetischen Erkrankungen sein. Es wird erwartet, dass die aktuellen Standardmedikamente in Verbindung mit der Erstbehandlung bei einigen Krankheiten wie besonders aggressiven Krebsarten oder in Fällen verwendet werden, in denen Medikamente zur Linderung der Krankheitssymptome beitragen, bis die Krankheit vollständig geheilt ist. Unten befinden sich Beispiele für Immunepitope, die von den hierin offenbarten Prime Editoren in Gene eingefügt werden können:
    Figure DE112020001339T5_0224
    Figure DE112020001339T5_0225
    Figure DE112020001339T5_0226
    Figure DE112020001339T5_0227
    Figure DE112020001339T5_0228
    Figure DE112020001339T5_0229
    Figure DE112020001339T5_0230
    Figure DE112020001339T5_0231
    Figure DE112020001339T5_0232
  • Es können auch zusätzliche Immunepitope installiert werden, die dem Fachmann bekannt sind. Jedes der Immunepitope, die von der Immune Epitope Database and Analysis Resource (iedb.org/epitopedetails_v3.php) (deren Inhalt hierin durch Bezugnahme aufgenommen wird) verfügbar sind, kann von den hierin offenbarten Prime Editoren installiert werden.
  • In einigen Ausführungsformen können die Immunepitope, die von den hierin offenbarten Prime Editoren installiert werden können, eines der folgenden Epitope umfassen:
    NR . ERKRANKUNG EPITOPE AMINOSÄURESEQUENZ SEQ-ID-NR ZUGRIFF NR.
    1 TETANUSTOXOID QYIKANSKFIGITEL 396 NA
    2 DIPHTHERIE-TOXIN-MUTANTE CRM197 GADDVVDSSKSFVMENFSSYHGTKPGYV DSIQKGIQKPKSGTQGNYDDDWKEFYST DNKYDAAGYSVDNENPLSGKAGGVVKVT YPGLTKVLALKVDNAETIKKELGLSLTE PLMEQVGTEEFIKRFGDGASRVVLSLPF AEGSSSVEYINNWEQAKALSVELEINFE TRGKRGQDAMYEYMAQACAGNRVRRSVG SSLSCINLDWDVIRDKTKTKIESLKEHG PIKNKMSESPNKTVSEEKAKQYLEEFHQ TALEHPELSELKTVTGTNPVFAGANYAA 428 NA
    WAVNVAQVIDSETADNLEKTTAALSILP GIGSVMGIADGAVHHNTEEIVAQSIALS SLMVAQAIPLVGELVDIGFAAYNFVESI INLFQVVHNSYNRPAYSPGHKTQPFLHD GYAVSWNTVEDSIIRTGFQGESGHDIKI TAENTPLPIAGVLLPTIPGKLDVNKSKT HISVNGRKIRMRCRAIDGDVTFCRPKSP VYVGNGVHANLHVAFHRSSSEKIHSNEI SSDSIGVLGYQKTVDHTKVNSKLSLFFE IKS
    3 MUMPS GTYRLIPNARANLTA SEQ-ID-NR: 400 NA
    4 MUMPS PSKFFTISDSATFAPGPVSNA ; PSKLFIMLDNATFAPGPVVNA 402; 404 NA
    5 RÖTELNVIRUS (RV) TPPPYQVSCGGESDRASARVIDPAAQS 406 NA
    6 HÄMAGGLUTININ PEYAYKIVKNKKMEDGFLQGMVDGWYGH HSNEQGSGLMENERTLDKANPNNDLCSW SDHEASSNNTNQEDLLQRESRRKKRIGT STLNQRGNCNTKCQTEEARLKREEVSLV KSDQCSNGSLQCRANNSTEQVD 408 NA
    7 NEURAMINIDASE TKSTNSRSGGISGPDNEAPVGEAPSPYG DNPRPNDGNNIRIGSKGYNGIITDTIEE SCSCYPDAKVVKSVELDSTIWTSGSSPN QKIITIGWDPNGWTGTPMSPNGAYGTDG 410 NA
    PSNGQANQHQAESISAGNSSLCPIRDNW HGSNRSWSWPDGAE
    8 TAP (TRANSPORTANTI GENPRÄSENTATIO N) AUF H5N1-VIRUS-HÄMAGGLUTININ 412 NA
    9 TAP (TRANSPORTANTI GENPRÄSENTATIO N) AUF H5N1-VIRUS-NEURAMINIDASE 414 NA
    10 HÄMAGGLUTININ-EPITOPE ZU KLASSE I HLA 416 NA
    11 NEURAMINIDASE-EPITOPE ZU KLASSE I HLA 418 NA
    12 HÄMAGGLUTININ-EPITOPE ZU KLASSE II HLA 420 NA
    13 NEURAMINIDASE-EPITOPE ZU KLASSE II HLA 422 NA
    14 HÄMAGGLUTININ-EPITOP H5N1-GEBUNDENE KLASSE I UND KLASSE II HLA MEKIVLLLAEKIVLLLAMMVSLVKSDQC PYLGSPSFIGTSTLNQRKCQTPMGAIKA VDGVTNK 424 NA
    15 NEURAMINIDASE-EPITOP H5N1-GEBUNDENE KLASSE I UND KLASSE II HLA NPNQKIITIYNGIITDTICYPDAGEITI RPCFWVELRPCFWVELI 426 NA
    16 CORYNEBACTERIU M DIPHTHERIAE AACAGNRVRRSVGSSLKC 899 SRC28 0292
    17 MASERNVIRUSSTA MM EDMONSTON AADHCPVVEVNGVTI 900 P6935 3.1
    18 MASERNVIRUSSTA MM EDMONSTON AAHLPTGTPLDID 901 P0485 1.1
    19 BORDETELLA PERTUSSIS AALAVWAGLAVQ 902 Q0087 9.1
    20 MASERNVIRUSSTA MM EDMONSTON AALGVATAAQITAGI 903 P6935 3.1
    21 RÖTELNVIRUSSTA MM THERIEN AALLNTPPPYQVSCGGESDRATAR 904 P0756 6.1
    22 RÖTELNVIRUS AAQSFTGVVYGTHTT 905 BAA28 178.1
    23 RÖTELNVIRUS ACEVEPAFGHSDAAC 906 BAA28 178.1
    24 RÖTELNVIRUS ACTFWAVNAYSSGGY 907 BAA28 178.1
    25 RÖTELNVIRUS ADDPLLR 908 BAA19 893.1
    26 RÖTELNVIRUS ADDPLLRT 909 CAJ88 851.1
    27 MASERNVIRUSSTA MM EDMONSTON AEMICDIDTYIVEAG 910 P0485 1.1
    28 MASERNVIRUSSTA MM EDMONSTON AEMICDIDTYIVEAGLASFI 911 P0485 1.1
    29 MASERNVIRUSSTA MM EDMONSTON AEPLLSC 912 P0485 1.1
    30 BORDETELLA PERTUSSIS AFVSTSSSRRYTEVY 913 CAD44 970.1
    31 BORDETELLA PERTUSSIS AGFIYRETFCITTIYKTGQPAADHYYSK VTA 914 P0497 9.1
    32 RÖTELNVIRUS AGLLACCAKCLYYLR 915 BAA28 178.1
    33 RÖTELNVIRUS AHTTSDPWHPPG 916 BAA19 893.1
    34 MASERNVIRUSSTA MM EDMONSTON AIAKLEDAKELLESS 917 P6935 3.1
    35 MASERNVIRUSSTA MM EDMONSTON AIDNLRASLETTNQA 918 P6935 3.1
    36 BORDETELLA PERTUSSIS AKGVEFR 919 ACI16 088.1
    37 MASERNVIRUSSTA MM EDMONSTON AKWAVPTTRTDDKLR 920 P0836 2.1
    38 MASERNVIRUSSTA MM EDMONSTON ALAEVLKKPV 921 ABO69 699.1
    39 MASERNVIRUSSTA MM EDMONSTON ALGVINTLEWIPRFK 922 P0836 2.1
    40 MASERNVIRUSSTA MM EDMONSTON ALHQSMLNSQAIDNL 923 P6935 3.1
    41 MASERNVIRUSSTA MM EDMONSTON ALIGILSLFV 924 ABI54 110.1
    42 RÖTELNVIRUS ALLNTPPPYQVSCGGESDRA 925 CAJ88 851.1
    43 RÖTELNVIRUSSTA MM M33 ALLNTPPPYQVSCGGESDRASARV 926 CAJ88 851.1
    44 RÖTELNVIRUS ALVEGLAPGGGNCHL 927 BAA28 178.1
    45 BORDETELLA PERTUSSIS AMAAWSERAGEA 928 P0497 7.1
    46 MASERNVIRUSSTA MM EDMONSTON ANCASILCKCYTTGT 929 P6935 3.1
    47 BORDETELLA PERTUSSIS ANPNPYTSRRSV 930 P0497 7.1
    48 RÖTELNVIRUS APGPGEVW 931 CAJ88 851.1
    49 RÖTELNVIRUS APLPPHTTERIETRSARHPWRIR 932 ABD64 214.1
    50 RÖTELNVIRUS-IMPFSTAMM RA27/3 APPMPPQPPRAHGQHYGHHHHQLPFLG 933 CAA33 016.1
    51 RÖTELNVIRUSSTA MM THERIEN APPTLPQPPCAHGQHYGHHHHQLPFLG 934 P0756 6.1
    52 RÖTELNVIRUS APPTLPQPPRAHGQHYGHHHHQLPFLG 935 ABD64 214.1
    53 BORDETELLA PERTUSSIS APQPGPQPPQPPQPQPEAPAPQ 936 P1428 3.3
    54 RÖTELNVIRUS AQLASYFNPGGSYYK 937 BAA28 178.1
    55 MASERNVIRUSSTA MM EDMONSTON ARAAHLPTGTPLD 938 P0485 1.1
    56 MASERNVIRUSSTA MM EDMONSTON ARLVSEIAMHTTEDK 939 P0485 1.1
    57 MASERNVIRUSSTA MM EDMONSTON ARLVSEIAMHTTEDKISRAV 940 P0485 1.1
    58 MASERNVIRUSSTA MM EDMONSTON-B ASDVETAEGGEIHELLR 941 P0342 2.1
    59 MASERN-MORBILLIVIRUS ASDVETAEGGEIHELLRLQ 942 ABO69 699.1
    60 MASERNVIRUSSTA MM EDMONSTON-B ASDVETAEGGEIHELLRLQSR 943 P0342 2.1
    61 MASERN-MORBILLIVIRUS ASDVETAEGGEIHKLLRLQ 944 AAA63 285.1
    62 RÖTELNVIRUSSTA MM M33 ASDVLPGHWLQG 945 NP_74 0663. 1
    63 MASERNVIRUSSTA MM EDMONSTON ASELGITAEDARLVS 946 P0485 1.1
    64 MASERNVIRUSSTA MM EDMONSTON ASELGITAEDARLVSEIAMH 947 P0485 1.1
    65 MASERNVIRUSSTA MM EDMONSTON ASESSQDPQDSRR 948 P0485 1.1
    66 MASERNVIRUSSTA MM EDMONSTON ASILCKCYTTGTIIN 949 P6935 3.1
    67 RÖTELNVIRUS ASPVCQRHSPDCSRL 950 BAA28 178.1
    68 BORDETELLA PERTUSSIS ASQARWTGATRA 951 BAF35 031.1
    69 RÖTELNVIRUSSTA MM THERIEN ASYFNPGGSYYKQYHPTACEVEPAFGHS 952 P0756 6.1
    70 MASERNVIRUSSTA MM EDMONSTON ASYKVMTRSSHQSLV 953 P6935 3.1
    71 BORDETELLA PERTUSSIS ASYVKKPKEDVD 954 ACI16 088.1
    72 MASERNVIRUSSTA MM EDMONSTON ATAAQITAGIALHQS 955 P6935 3.1
    73 RÖTELNVIRUS ATPERPRL 956 CAJ88 851.1
    74 MASERNVIRUSSTA MM EDMONSTON AVCLGGLIGIPALIC 957 P6935 3.1
    75 MASERNVIRUSSTA MM EDMONSTON AVGPRQAQVSF 958 P0485 1.1
    76 RÖTELNVIRUS AVNAYSSGGYAQLAS 959 BAA28 178.1
    77 RÖTELNVIRUS AVSETRQTWAEWAAA 960 BAA28 178.1
    78 MASERNVIRUSSTA MM EDMONSTON AVTAPDTAADSELRR 961 P0485 1.1
    79 MASERNVIRUSSTA MM EDMONSTON AVTAPDTAADSELRRWIKYT 962 P0485 1.1
    80 BORDETELLA PERTUSSIS AYGGIIKDAPPGAGFIYRETFC 963 P0497 9.1
    81 RÖTELNVIRUS CALPLAGLLACCAKC 964 BAA28 178.1
    82 RÖTELNVIRUS CARIWNGTQRACTFW 965 BAA28 178.1
    83 MASERNVIRUSSTA MM EDMONSTON CARTLVSGSFGNRFI 966 P6935 3.1
    84 BORDETELLA PERTUSSIS CASPYEGRYRDMYDALRBRLLY 967 SRC28 0066
    85 BORDETELLA PERTUSSIS CAVFVRSGQPVIGA 968 AAA83 981.1
    86 RÖTELNVIRUS CCAKCLYYLRGAIAPR 969 BAA28 178.1
    87 MASERNVIRUSSTA MM EDMONSTON CCRGRCNKKGEQVGM 970 P6935 3.1
    88 RÖTELNVIRUS CEIPTDVSCEGLGAW 971 BAA28 178.1
    89 BORDETELLA PERTUSSIS CFGKDLKRPGSSPMEV 972 P0A3R 5.1
    90 MASERN-MORBILLIVIRUS CFQQACKGKIQALCE 973 P0683 0.1
    91 MASERN-MORBILLIVIRUS CFQQACKGKIQALCENPEWAPLKDNRIP S 974 AAR8 9 413.1
    92 RÖTELNVIRUS CGGESDRASARVIDP 975 BAA28 178.1
    93 BORDETELLA PERTUSSIS CITTIYKTGQPAADHYYSKVTA 976 P0497 9.1
    94 MASERN-MORBILLIVIRUS CKGKIQALCENPEWA 977 AAR8 9 413.1
    95 MASERNVIRUSSTA MM EDMONSTON CKPWQESRKNKAQ 978 P0485 1.1
    96 MASERNVIRUSSTA MM EDMONSTON CNKKGEQVGMSRPGL 979 P6935 3.1
    97 RÖTELNVIRUS CNVTTEHPFCNTPHG 980 BAA28 178.1
    98 BORDETELLA PERTUSSIS CQVGSSNSAF 981 P0497 7.1
    99 MASERN-MORBILLIVIRUS CSGPTTIRGQFS 982 P0836 2.1
    10 0 BORDETELLA PERTUSSIS CTSPYDGKYWSMYSRL 983 AAA83 981.1
    10 1 MASERNVIRUSSTA MM EDMONSTON CVLADSESGGHITHS 984 P0836 2.1
    10 2 MASERN-MORBILLIVIRUS CYTTGTIINQDPDKILTYIAADHC 985 AAF02 706.1
    10 3 RÖTELNVIRUS DADDPLLR 986 CAJ88 851.1
    10 4 MASERNVIRUSSTA MM EDMONSTON DARAAHLPTGTPLDI 987 P0485 1.1
    10 5 MASERNVIRUSSTA MM EDMONSTON DARAAHLPTGTPLDIDTASE 988 P0485 1.1
    10 6 MASERNVIRUSSTA MM EDMONSTON DCHAPTYLPAEVDGD 989 P0836 2.1
    10 7 RÖTELNVIRUS DCSRLVGATPERPRL 990 BAA28 178.1
    10 8 MASERNVIRUSSTA MM EDMONSTON DDKLRMETCFQQACK 991 P0836 2.1
    10 9 RÖTELNVIRUS DDPLLRTA 992 CAJ88 851.1
    11 0 RÖTELNVIRUS DDPLLRTAPGPGEVW 993 BAA28 178.1
    11 1 BORDETELLA PERTUSSIS DDPPATVYRYD 994 P0497 7.1
    11 2 BORDETELLA PERTUSSIS DDPPATVYRYDSRPPED 995 CAD44 970.1
    11 3 BORDETELLA PERTUSSIS DDPPATVYRYDSRPPEDV 996 ACI04 548.1
    11 4 MASERN-MORBILLIVIRUS DEVGLRTPQRFTDLV 997 P0683 0.1
    11 5 MASERNVIRUSSTA MM EDMONSTON DHCPVVEVNGVTIQV 998 P6935 3.1
    11 6 MASERNVIRUSSTA MM EDMONSTON DIDTASESSQDPQ 999 P0485 1.1
    11 7 MASERNVIRUSSTA MM EDMONSTON DINKVLEKLGYSGGD 1000 P6935 3.1
    11 8 BORDETELLA PERTUSSIS DLIAYKQ 1001 ACI16 088.1
    11 9 MASERNVIRUSSTA MM EDMONSTON DLIGQKLGLKLLRYY 1002 P6935 3.1
    12 0 RÖTELNVIRUS DLQKALEAQSRALRAELAA 1003 P0756 6.1
    12 1 MASERN-MORBILLIVIRUS DLQYVLATYDTSRVE 1004 P0683 0.1
    12 2 MASERNVIRUSSTA MM EDMONSTON DLSLRRFMV 1005 P0485 1.1
    12 3 MASERNVIRUSSTA MM EDMONSTON DLSNCMVALGELKLA 1006 P0836 2.1
    12 4 RÖTELNVIRUS DLVEYIMNYTGNQQSRWGLGSPNC 1007 CAJ88 851.1
    12 5 MASERN-MORBILLIVIRUS DLVKFISDKIKFLNP 1008 AAR8 9 413.1
    12 6 MASERN-MORBILLIVIRUS DLVKFISTKIKFLNP 1009 SRC28 0117
    12 7 MASERNVIRUSSTA MM EDMONSTON DLYKSNHNNV 1010 P0836 2.1
    12 8 BORDETELLA PERTUSSIS DNVLDHLTGR 1011 ACI04 548.1
    12 9 BORDETELLA PERTUSSIS DNVLDHLTGRSC 1012 P0497 7.1
    13 0 BORDETELLA PERTUSSIS DNVLDHLTGRSCQ 1013 P0497 7.1
    13 1 MASERN-MORBILLIVIRUS DPDKILTYIAA 1014 AAF02 706.1
    132 RÖTELNVIRUSSTA MM THERIEN DPGDLVEYIMNYTGNQQSR 1015 P0756 6.1
    13 3 RÖTELNVIRUS DPLLRTAP 1016 CAJ88 851.1
    13 4 RÖTELNVIRUS DPLLRTAPGPGEVWVTPVIGSQ 1017 CAJ88 851.1
    13 5 MASERNVIRUSSTA MM EDMONSTON DPQDSRRSAEPLL 1018 P0485 1.1
    13 6 MASERNVIRUSSTA MM EDMONSTON DPVIDRLYLSSHRGV 1019 P0836 2.1
    13 7 MASERNVIRUSSTA MM EDMONSTON DQILRSMKGLSSTSI 1020 P6935 3.1
    13 8 MASERN-MORBILLIVIRUS DQYCADVAAEELMNA 1021 P0683 0.1
    13 9 MASERNVIRUSSTA MM EDMONSTON DSESGGHITH 1022 P0836 2.1
    14 0 MASERNVIRUSSTA MM EDMONSTON DTASESSQDPQDS 1023 P0485 1.1
    14 1 RÖTELNVIRUS DTVMSVFALASYVQH 1024 BAA28 178.1
    14 2 BORDETELLA PERTUSSIS DVFQNGFTAWGNND 1025 P0497 7.1
    14 3 RÖTELNVIRUS DVGAVPPGKFVTAAL 1026 BAA28 178.1
    14 4 CORYNEBACTERIU M DIPHTHERIAE DVNKSKTHISVNGRKI 1027 CAE11 230.1
    14 5 RÖTELNVIRUS DVSCEGLGAWVPAAP 1028 BAA28 178.1
    14 6 RÖTELNVIRUSSTA MM THERIEN DWASPVCQRHSPDCSRLVGATPERPRL 1029 P0756 6.1
    14 7 MASERNVIRUSSTA MM EDMONSTON EARESYRETGPSR 1030 P0485 1.1
    14 8 BORDETELLA PERTUSSIS EAVEAERAGRGTG 1031 ACI04 548.1
    14 9 MASERNVIRUSSTA MM EDMONSTON EDAKELLESSDQILR 1032 P6935 3.1
    15 0 MASERNVIRUSSTA MM EDMONSTON EDRRVKQSRGEAR 1033 P0485 1.1
    15 1 MASERNVIRUSSTA MM EDMONSTON EDSITIPYQGSGKGV 1034 P0836 2.1
    15 2 RÖTELNVIRUS EEAFTYLCTAPGCAT 1035 BAA28 178.1
    15 3 MASERNVIRUSSTA MM EDMONSTON EGFNMILGTILAQIW 1036 P0485 1.1
    15 4 MASERNVIRUSSTA MM EDMONSTON EGFNMILGTILAQIWVLLAK 1037 P0485 1.1
    15 5 RÖTELNVIRUS EHPFCNTPHGQLEVQ 1038 BAA28 178.1
    15 6 MASERNVIRUSSTA MM EDMONSTON EISDIEVQDPEGFNM 1039 P0485 1.1
    15 7 MASERNVIRUSSTA MM EDMONSTON EISDIEVQDPEGFNMILGTI 1040 P0485 1.1
    15 8 MASERNVIRUSSTA MM EDMONSTON EKPNLSSKRSE 1041 P0836 2.1
    15 9 MASERNVIRUSSTA MM EDMONSTON ELKLAALCHGEDSIT 1042 P0836 2.1
    16 0 MASERN-MORBILLIVIRUS ELMNALVNSTLLETR 1043 P0683 0.1
    16 1 MASERNVIRUSSTA MM EDMONSTON ELPRL 1044 P0485 1.1
    16 2 MASERN-MORBILLIVIRUS ENPEWAPLKDNRIPSYGVLSVDL 1045 AAR8 9 413.1
    16 3 MASERNVIRUSSTA MM EDMONSTON EPIRDALNAMTQNIR 1046 P6935 3.1
    16 4 MASERNVIRUSSTA MM EDMONSTON EQVGMSRPGLKPDLT 1047 P6935 3.1
    16 5 RÖTELNVIRUS ERPRLRLV 1048 CAJ88 851.1
    16 6 RÖTELNVIRUS ERPRLRLVDADDPLL 1049 BAA28 178.1
    16 7 MEASLES VIRUS CAM/RB ESPGQLIQRITDDPDVS 1050 P0485 1.1
    16 8 MASERNVIRUSSTA MM EDMONSTON ESRGIKARITHVDTE 1051 P6935 3.1
    16 9 MASERNVIRUSSTA MM EDMONSTON ESSCTFMPEGTVCSQ 1052 P6935 3.1
    17 0 MASERNVIRUSSTA MM EDMONSTON ESSQDPQDSRRSA 1053 P0485 1.1
    17 1 MASERNVIRUSSTA MM EDMONSTON ETRTTNQFLAVSKGN 1054 P0836 2.1
    17 2 MASERNVIRUSSTA MM EDMONSTON EVDGDVKLSSNLVIL 1055 P0836 2.1
    17 3 MASERNVIRUSSTA MM EDMONSTON-B EVNGVTIQV 1056 P2603 1.1
    17 4 RÖTELNVIRUS EVWVTPVI 1057 CAJ88 851.1
    17 5 RÖTELNVIRUS EVWVTPVIGSQA 1058 BAA19 893.1
    17 6 RÖTELNVIRUS EWAAAHWWQLTLGAT 1059 BAA28 178.1
    17 7 MASERN-MORBILLIVIRUS EWIPRFKVSPYLFTV 1060 P0683 0.1
    17 8 BORDETELLA PERTUSSIS FEYVDTYGDNAG 1061 P0497 7.1
    17 9 MASERN-MORBILLIVIRUS FGPLITHGSGMDLYK 1062 P0683 0.1
    18 0 MASERNVIRUSSTA MM EDMONSTON FIFDALAEV 1063 ABK4 0 531.1
    18 1 MASERNVIRUSSTA MM EDMONSTON FISDKIKFL 1064 P0836 2.1
    18 2 MASERNVIRUSSTA MM EDMONSTON FKRNKDKPPITSGSG 1065 P0485 1.1
    18 3 MASERNVIRUSSTA MM EDMONSTON FKRNKDKPPITSGSGGAIRG 1066 P0485 1.1
    18 4 RÖTELNVIRUS FKTVRPVALPRTLAP 1067 BAA28 178.1
    18 5 MASERNVIRUSSTA MM EDMONSTON FLMDRHIIV 1068 ABK4 0 531.1
    18 6 MASERNVIRUSSTA MM EDMONSTON FMAVLLTLQTPTGQI 1069 P6935 3.1
    18 7 MASERNVIRUSSTA MM EDMONSTON FMPEGTVCSQNALYP 1070 P6935 3.1
    18 8 MASERN-MORBILLIVIRUS FMYMSLLGV 1071 AAN09 804.1
    18 9 MASERNVIRUSSTA MM EDMONSTON FNVPIKEAGEDCHAP 1072 P0836 2.1
    19 0 MASERN-MORBILLIVIRUS FRDLTWCINPPERIK 1073 AAC35 876.2
    19 1 MASERNVIRUSSTA MM EDMONSTON FSHDDPISSDQSRFG 1074 P0485 1.1
    19 2 MASERNVIRUSSTA MM EDMONSTON FSHDDPISSDQSRFGWFENK 1075 P0485 1.1
    19 3 MASERN-MORBILLIVIRUS FTDLVKFISDKIKFL 1076 P0683 0.1
    19 4 MASERN-MORBILLIVIRUS FTWDQKLWCRHFCVL 1077 P0683 0.1
    19 5 BORDETELLA PERTUSSIS FVRDGQSVIGACASPYEGRYRDLYDALR RLLY 1078 SRC28 0066
    19 6 BORDETELLA PERTUSSIS FVRSGQPVIGACTSPYDGKYWSILYSRL RKMLY 1079 SRC28 0066
    19 7 MASERN-MORBILLIVIRUS FYKDNPHPKGSRIVI 1080 P0683 0.1
    19 8 BORDETELLA PERTUSSIS GAASSYFEYVDTYG 1081 ACI04 548.1
    19 9 BORDETELLA PERTUSSIS GAFDLKTTFCIMTTRNTGQPA 1082 AAA83 981.1
    20 0 MASERNVIRUSSTA MM EDMONSTON GALIGILSLFVESPG 1083 P0485 1.1
    20 1 MASERNVIRUSSTA MM EDMONSTON GALIGILSLFVESPGQLIQR 1084 P0485 1.1
    20 2 RÖTELNVIRUS GATPERPR 1085 CAJ88 851.1
    20 3 BORDETELLA PERTUSSIS GAYGRCPNGTRALTVAELRGNAEL 1086 P0497 9.1
    20 4 RÖTELNVIRUS GCFAPWDLEATGACI 1087 BAA28 178.1
    20 5 MASERN-MORBILLIVIRUS GDINKVLEKLGYS 1088 BAB60 865.1
    20 6 MASERN-MORBILLIVIRUS GDINKVLEKLGYSGGDLLG 1089 AAL 2 9 688.1
    20 7 RUBELLA VIRUS GDLRAVHHRPVPA 1090 CAA28 880.1
    20 8 RÖTELNVIRUS GDLVEYIMNYTGNQQ 1091 BAA28 178.1
    20 9 MASERNVIRUSSTA MM EDMONSTON GDSSITTRSRLLDRL 1092 P0485 1.1
    21 0 MASERNVIRUSSTA MM EDMONSTON GDSSITTRSRLLDRLVRLIG 1093 P0485 1.1
    21 1 MASERN-MORBILLIVIRUS GEDCHAPTYLPAEVD 1094 P0683 0.1
    21 2 MASERNVIRUSSTA MM EDMONSTON GELSTLESLMNLYQQ 1095 P0485 1.1
    21 3 MASERNVIRUSSTA MM EDMONSTON GELSTLESLMNLYQQMGKPA 1096 P0485 1.1
    21 4 MUMPS-RUBULAVIRUS GEQARYLALLEA 1097 P2118 6.1
    21 5 RÖTELNVIRUS GEVWVT 1098 BAA19 893.1
    21 6 RÖTELNVIRUS GEVWVTPV 1099 CAJ88 851.1
    21 7 RÖTELNVIRUS GEVWVTPVIGSQAR 1100 BAA19 893.1
    21 8 BORDETELLA PERTUSSIS GEYGGVIKDGTPGGA 1101 AAA83 981.1
    21 9 RÖTELNVIRUS GFLSGVGPMRLRHGADT 1102 SRC26 5968
    22 0 MASERNVIRUSSTA MM EDMONSTON-B GFRASDVETAEGGEIHELLRLQ 1103 P0342 2.1
    22 1 BORDETELLA PERTUSSIS GGAVPGGAVPGGAVPGGFGPGGFGP 1104 P1428 3.3
    22 2 BORDETELLA PERTUSSIS GGAVPGGAVPGGFGPGGFGPGGFGP 1105 CAA09 475.1
    22 3 BORDETELLA PERTUSSIS GGAVPGGAVPGGFGPGGFGPGGFGPGGF GP 1106 CAA09 474.1
    22 4 MASERN-MORBILLIVIRUS GGHITHSGMVGMGVS 1107 P0683 0.1
    22 5 MASERN-MORBILLIVIRUS GILESRGIKARITHVDTESY 1108 P2603 2.1
    22 6 BORDETELLA PERTUSSIS GITGETTTTEYSNARYV 1109 CAD44 970.1
    22 7 MASERNVIRUSSTA MM EDMONSTON GKEDRRVKQSRGE 1110 P0485 1.1
    22 8 BORDETELLA PERTUSSIS GKVTNGS 1111 ACI16 088.1
    22 9 RÖTELNVIRUS GLGAWVPAAPCARIW 1112 BAA28 178.1
    23 0 MASERNVIRUSSTA MM EDMONSTON GLIGIPALICCCRGR 1113 P6935 3.1
    23 1 RÖTELNVIRUSSTA MM THERIEN GLLACCAKCLYYLRGAIAPR 1114 P0756 6.1
    23 2 MASERN-MORBILLIVIRUS GLLAIAGIRLHRAAI 1115 P0683 0.1
    23 3 RÖTELNVIRUS GLQPRADMAAPPTLPQ 1116 NP_74 0663. 1
    23 4 MASERN-MORBILLIVIRUS GMGVSCTVTREDGTNRR 1117 AAR89 413.1
    23 5 MASERN-MORBILLIVIRUS GMYGGTYLVEKP 1118 AAR89 413.1
    23 6 BORDETELLA PERTUSSIS GNAELQTYLRQITPGWSIYGLYDGTYLG 1119 P0497 9.1
    23 7 RÖTELNVIRUS GNCHLTVNGEDVGAV 1120 BAA28 178.1
    23 8 BORDETELLA PERTUSSIS GNNDNVLDHLTGR 1121 P0497 7.1
    23 9 BORDETELLA PERTUSSIS GNNDNVLDHLTGRSC 1122 P0497 7.1
    24 0 MASERNVIRUSSTA MM EDMONSTON GNRFILSQGNLIANC 1123 P6935 3.1
    24 1 RÖTELNVIRUS GNRGRGQRRDWSRAPPPPEERQETRSQT PAPKPS 1124 P0756 6.1
    24 2 RÖTELNVIRUS GPGEVWVT 1125 CAJ88 851.1
    24 3 RÖTELNVIRUSSTA MM THERIEN GPMRLRHGADTRCGRLI 1126 P0756 6.1
    24 4 BORDETELLA PERTUSSIS GPNHTKV 1127 ACI16 083.1
    24 5 MASERNVIRUSSTA MM HALLE GPRQAQVSF 1128 P1005 0.1
    24 6 MASERNVIRUSSTA MM EDMONSTON GPRQAQVSFLQGDQS 1129 P0485 1.1
    24 7 MASERNVIRUSSTA MM EDMONSTON GPRQAQVSFLQGDQSENELP 1130 P0485 1.1
    24 8 MASERN-MORBILLIVIRUS GRGYNVSSIVTMTSQ 1131 P0683 0.1
    24 9 BORDETELLA PERTUSSIS GRTPFII 1132 ACI16 083.1
    25 0 RÖTELNVIRUS GSPNCHGPDWASPVC 1133 BAA28 178.1
    25 1 RÖTELNVIRUS GSQARKCGLHIRAGP 1134 BAA28 178.1
    25 2 BORDETELLA PERTUSSIS GSSNSAFVSTSSSRR 1135 P0497 7.1
    25 3 MASERNVIRUSSTA MM EDMONSTON GSTKSCARTLVSGSF 1136 P6935 3.1
    25 4 RÖTELNVIRUS GSYYKQYHPTACEVE 1137 BAA28 178.1
    25 5 RÖTELNVIRUS GTHTTAVSETRQTWA 1138 BAA28 178.1
    25 6 MASERNVIRUSSTA MM EDMONSTON GTIINQDPDKILTYI 1139 P6935 3.1
    25 7 BORDETELLA PERTUSSIS GTLVRMAPVIG 1140 ADA85 124.1
    25 8 MASERNVIRUSSTA MM EDMONSTON GTPLDIDTASESS 1141 P0485 1.1
    25 9 BORDETELLA PERTUSSIS GTYLGQAYGGIIKDAPPGAGFIYRETFC 1142 P0497 9.1
    26 0 BORDETELLA PERTUSSIS GVATKGLGVHAKSSDWG 1143 P1531 8.2
    26 1 CORYNEBACTERIU M DIPHTHERIAE GVLLPTIPGKLDVNKSKTHI 1144 AAV70 486.1
    26 2 MASERN-MORBILLIVIRUS GVLSVDLSLTVELKI 1145 P0683 0.1
    26 3 MASERN-MORBILLIVIRUS GVPIELQVECFTWDQ 1146 P0683 0.1
    26 4 MASERNVIRUSSTA MM EDMONSTON GVSCTVTREDGTNRR 1147 P0836 2.1
    26 5 MASERNVIRUSSTA MM EDMONSTON GVSYNIGSQEWYTTV 1148 P6935 3.1
    26 6 MASERNVIRUSSTA MM EDMONSTON GYNVSSIVTMTSQGM 1149 P0836 2.1
    26 7 MASERN-MORBILLIVIRUS HFCVLADSESGGHIT 1150 P0683 0.1
    26 8 MASERN-MORBILLIVIRUS HGEDSITIPYQGSGK 1151 P0683 0.1
    26 9 RÖTELNVIRUS HGPDWASP 1152 BAA19 893.1
    27 0 RÖTELNVIRUS HGPDWASPVCQRHSP 1153 BAA28 178.1
    27 1 RÖTELNVIRUS HGPDWASPVCQRHSPDCSRLVG 1154 CAJ88 851.1
    27 2 RÖTELNVIRUSSTA MM M33 HGPDWASPVCQRHSPDCSRLVGATPERP RLRLV 1155 CAJ88 851.1
    27 3 MASERNVIRUSSTA MM EDMONSTON HITHSGMEGMGVSCT 1156 P0836 2.1
    27 4 MASERN-MORBILLIVIRUS HKSLSTNLDVTNSIE 1157 P0683 0.1
    27 5 MASERNVIRUSSTA MM EDMONSTON HLMIDRPYV 1158 P0836 2.1
    27 6 MASERNVIRUSSTA MM EDMONSTON HLPTGTPLDIDTA 1159 P0485 1.1
    277 MASERNVIRUSSTA MM EDMONSTON-B HLPTGTPLDIDTATESSQDPQDSR 1160 Q77M4 3.1
    278 MASERN-MORBILLIVIRUS HMTNYLEQPVSNDLS 1161 P0683 0.1
    279 MASERNVIRUSSTA MM EDMONSTON HQSLVIKLMPNITLL 1162 P6935 3.1
    280 MASERN-MORBILLIVIRUS HRAAIYTAEIHKSLS 1163 P0683 0.1
    281 BORDETELLA PERTUSSIS HRMQEAVEAERAGRGTGH 1164 P0497 7.1
    282 MASERNVIRUSSTA MM EDMONSTON HVDTESYFIVLSIAY 1165 P6935 3.1
    283 MASERNVIRUSSTA MM EDMONSTON HWGNLSKIGVVGIGS 1166 P6935 3.1
    284 RÖTELNVIRUS HWWQLTLGATCALPL 1167 BAA28 178.1
    285 RÖTELNVIRUS HYRNASDVLPGHWLQGGWGCYNL 1168 NP_74 0663. 1
    286 MASERNVIRUSSTA MM EDMONSTON IDLGPPISLERLDVG 1169 P6935 3.1
    287 MASERNVIRUSSTA MM EDMONSTON IEAIRQAGQEMILAV 1170 P6935 3.1
    288 RÖTELNVIRUSSTA MM M33 IETRSARHP 1171 CAA28 880.1
    289 MASERNVIRUSSTA MM EDMONSTON IGSQEWYTTVPKYVA 1172 P6935 3.1
    290 MASERNVIRUSSTA MM EDMONSTON IKGVIVHRLEGVSYN 1173 P6935 3.1
    291 MASERNVIRUSSTA MM EDMONSTON IKHIIIVPIPGDSSI 1174 P0485 1.1
    292 MASERNVIRUSSTA MM EDMONSTON IKHIIIVPIPGDSSITTRSR 1175 P0485 1.1
    293 BORDETELLA PERTUSSIS IKLKDCP 1176 ACI16 083.1
    294 MASERNVIRUSSTA MM EDMONSTON IKLMPNITLLNNCTR 1177 P6935 3.1
    295 MASERN-MORBILLIVIRUS ILLERLDVGT 1178 AAF85 664.1
    296 MASERN-MORBILLIVIRUS ILPGQDLQYV 1179 P0836 2.1
    297 MASERNVIRUSSTA MM EDMONSTON ILTYIAADHCPVVEV 1180 P6935 3.1
    298 MASERN-MORBILLIVIRUS INQDPDKILTY 1181 AAL 2 9 688.1
    299 MASERNVIRUSSTA MM EDMONSTON IPRFKVSPYLFNVPI 1182 P0836 2.1
    300 MASERNVIRUSSTA MM EDMONSTON IQALSYALGGDINKV 1183 P6935 3.1
    301 RÖTELNVIRUS IRAGPYGHATVEMPE 1184 BAA28 178.1
    302 BORDETELLA PERTUSSIS IRMGTDK 1185 ACI16 088.1
    303 MASERNVIRUSSTA MM EDMONSTON ISNFDESSCTFMPEG 1186 P6935 3.1
    304 MASERNVIRUSSTA MM EDMONSTON ITAGIALHQSMLNSQ 1187 P6935 3.1
    305 MASERNVIRUSSTA MM EDMONSTON ITDDPDVS IRLLEW 1188 P0485 1.1
    306 MASERNVIRUSSTA MM EDMONSTON ITDDPDVSIRLLEVVQSDQS 1189 P0485 1.1
    307 BORDETELLA PERTUSSIS ITTYV 1190 ACI16 083.1
    308 MASERNVIRUSSTA MM EDMONSTON IVEAGLASFILTIKF 1191 P0485 1.1
    309 MASERNVIRUSSTA MM EDMONSTON IVEAGLASFILTIKFGIETM 1192 P0485 1.1
    310 MASERNVIRUSSTA MM EDMONSTON IVEAGLASFILTIKFGIETMYPALG 1193 P0485 1.1
    311 RÖTELNVIRUS KALEAQSRALRAELAA 1194 P0756 6.1
    312 MASERNVIRUSSTA MM EDMONSTON KARITHVDTESYFIV 1195 P6935 3.1
    313 RÖTELNVIRUS KCGLHIRAGPYGHAT 1196 BAA28 178.1
    314 MASERNVIRUSSTA MM EDMONSTON KCYTTGTIINQDPDK 1197 P6935 3.1
    315 MASERNVIRUSSTA MM EDMONSTON KDNPHPKGSR 1198 P0836 2.1
    316 MASERNVIRUSSTA MM EDMONSTON KDNRIPSYGVLSVDL 1199 P0836 2.1
    317 MASERN-MORBILLIVIRUS KFLNPDREYDFRDLT 1200 AAC35 876.2
    318 RÖTELNVIRUS KFVTAALLN 1201 BAA28 178.1
    319 MASERNVIRUSSTA MM EDMONSTON KGNCSGPTTIR 1202 P0836 2.1
    320 MASERN-MORBILLIVIRUS KIKFLNPDREYDFRD 1203 P0683 0.1
    321 RÖTELNVIRUS KIVDGGCFAPWDLEA 1204 BAA28 178.1
    322 MASERNVIRUSSTA MM EDMONSTON KLGLKLLRYYTEILS 1205 P6935 3.1
    323 MASERNVIRUSSTA MM EDMONSTON KLGVWKSPTDMQSWV 1206 P0836 2.1
    324 BORDETELLA PERTUSSIS KLKECPQ 1207 ACI16 088.1
    325 MASERN-MORBILLIVIRUS KLLRYYTEI 1208 P2603 1.1
    326 MASERNVIRUSSTA MM EDMONSTON KLMPFSGDFV 1209 ABK40 531.1
    32 7 MASERN-MORBILLIVIRUS KLMPNITLL 1210 P2603 1.1
    32 8 MASERN-MORBILLIVIRUS KLRMETCFQQACKGKIQALCENPEWA 1211 AAR89 413.1
    32 9 MASERN-MORBILLIVIRUS KLWCRHFCV 1212 P0836 2.1
    33 0 MASERNVIRUSSTA MM EDMONSTON KLWCRHFCVL 1213 P0836 2.1
    33 1 MASERN-MORBILLIVIRUS KLWESPQEI 1214 BAB60 863.1
    33 2 MASERNVIRUSSTA MM EDMONSTON KMSSAVGFV 1215 ABO69 699.1
    33 3 MASERNVIRUSSTA MM EDMONSTON-B KMSSAVGFVPDTGPASR 1216 P0342 2.1
    33 4 BORDETELLA PERTUSSIS KMVYATN 1217 ACI16 083.1
    33 5 MASERNVIRUSSTA MM EDMONSTON KPDLTGTSKSYVRSL 1218 P6935 3.1
    33 6 MASERN-MORBILLIVIRUS KPNLSSKRSELSQLS 1219 P0836 2.1
    33 7 MASERNVIRUSSTA MM EDMONSTON KPNLSSKRSELSQLSMYRVF 1220 P0836 2.1
    33 8 MASERNVIRUSSTA MM EDMONSTON KQSRGEARESYRETG 1221 P0485 1.1
    33 9 MASERNVIRUSSTA MM EDMONSTON KQSRGEARESYRETGPSRAS 1222 P0485 1.1
    34 0 MASERNVIRUSSTA MM EDMONSTON KRFAGVVLAGAALGV 1223 P6935 3.1
    34 1 MASERNVIRUSSTA MM EDMONSTON KRTPGNKPRIAEMIC 1224 P0485 1.1
    34 2 MASERNVIRUSSTA MM EDMONSTON KRTPGNKPRIAEMICDIDTY 1225 P0485 1.1
    34 3 MASERN-MORBILLIVIRUS KSNHNNVYWLTIPPMKNLALGVINTL 1226 AAR89 413.1
    34 4 MASERN-MORBILLIVIRUS KVSPYLFNV 1227 P0836 2.1
    34 5 BORDETELLA PERTUSSIS KVVQLPKISKNALKANG 1228 ACI16 083.1
    34 6 BORDETELLA PERTUSSIS KVVQLPKISKNALRNDG 1229 ACI16 087.1
    34 7 BORDETELLA PERTUSSIS LAHRRIPPENIR 1230 P0497 7.1
    34 8 BORDETELLA PERTUSSIS LALALWAGFALS 1231 P1109 2.1
    34 9 RÖTELNVIRUS LAPGGGNCHLTVNGE 1232 BAA28 178.1
    35 0 MASERNVIRUSSTA MM EDMONSTON LAQIWVLLAKAVTAP 1233 P0485 1.1
    35 1 MASERNVIRUSSTA MM EDMONSTON LAQIWVLLAKAVTAPDTAAD 1234 P0485 1.1
    35 2 RÖTELNVIRUS LASYFNPGGSYYKQYHPTACEVEPAFGH S 1235 BAA19 893.1
    35 3 MASERN-MORBILLIVIRUS LAVSKGNCSGPTTIR 1236 P0683 0.1
    35 4 MASERNVIRUSSTA MM EDMONSTON LCENPEWAPLKDNRI 1237 P0836 2.1
    35 5 MASERN-MORBILLIVIRUS LDRLVRLIG 1238 ABI54 110.1
    35 6 CORYNEBACTERIU M DIPHTHERIAE LEEEGVTPL 1239 P3312 0.2
    35 7 BORDETELLA PERTUSSIS LEHRMQEAVEAERAGRGTGHFI 1240 CAD44 970.1
    35 8 MASERNVIRUSSTA MM EDMONSTON LEKLGYSGGDLLGIL 1241 P6935 3.1
    35 9 MASERNVIRUSSTA MM EDMONSTON LEQPVSNDLS 1242 P0836 2.1
    36 0 MASERNVIRUSSTA MM EDMONSTON LERKWLDVVRNIIAE 1243 P0485 1.1
    36 1 MASERNVIRUSSTA MM EDMONSTON LERKWLDVVRNIIAEDLSLR 1244 P0485 1.1
    36 2 MASERNVIRUSSTA MM EDMONSTON LFGPSLRDPISAEIS 1245 P6935 3.1
    36 3 MASERN-MORBILLIVIRUS LGELKLAALCHGEDS 1246 P0683 0.1
    36 4 MASERNVIRUSSTA MM EDMONSTON LGGKEDRRVKQSR 1247 P0485 1.1
    36 5 RÖTELNVIRUS LGHDGHHGGTLRVGQHHRNASDVL 1248 ABD64 214.1
    36 6 RÖTELNVIRUSSTA MM THERIEN LGSPNCHGPDWASPVCQRHS 1249 P0756 6.1
    36 7 RÖTELNVIRUSSTA MM THERIEN LGSPNCHGPDWASPVCQRHSPDCSRLV 1250 P0756 6.1
    36 8 RÖTELNVIRUS LHDPDTEAPTEACVTSWL 1251 ABD64 214.1
    36 9 MASERNVIRUSSTA MM EDMONSTON LIANCASILCKCYTT 1252 P6935 3.1
    37 0 MASERN-MORBILLIVIRUS LIGLLAIAGIRLHRAAIYTAEIHK 1253 AAR89 413.1
    37 1 MASERNVIRUSSTA MM EDMONSTON LIPSMNQLSCDLIGQ 1254 P6935 3.1
    37 2 MASERNVIRUSSTA MM EDMONSTON LKIKIASGFGPLITH 1255 P0836 2.1
    37 3 MASERN-MORBILLIVIRUS LKIKIASGFGPLITHGSGMDLYK 1256 AAR89 413.1
    37 4 BORDETELLA PERTUSSIS LKLYFEP 1257 ACI16 088.1
    37 5 MASERNVIRUSSTA MM EDMONSTON LLAVLFVMFL 1258 P0836 2.1
    37 6 MASERNVIRUSSTA MM EDMONSTON LLDRLVRLIGNPDVS 1259 P0485 1.1
    37 7 MASERNVIRUSSTA MM EDMONSTON LLDRLVRLIGNPDVSGPKLT 1260 P0485 1.1
    37 8 MASERNVIRUSSTA MM EDMONSTON LLESSDQILRSMKGL 1261 P6935 3.1
    37 9 MASERN-MORBILLIVIRUS LLETRTTNQFLAVSK 1262 P0683 0.1
    38 0 MASERNVIRUSSTA MM EDMONSTON LLEVVQSDQSQSGLT 1263 P0485 1.1
    38 1 MASERNVIRUSSTA MM EDMONSTON LLEVVQSDQSQSGLTFASR 1264 P0485 1.1
    38 2 MASERNVIRUSSTA MM EDMONSTON LLEVVQSDQSQSGLTFASRG 1265 P0485 1.1
    38 3 MASERN-MORBILLIVIRUS LLGILESRGIKARIT 1266 AAL 2 9 688.1
    38 4 RÖTELNVIRUS LLRTAPGP 1267 CAJ88 851.1
    38 5 MASERNVIRUSSTA MM EDMONSTON LLRYYTEILSLFGPS 1268 P6935 3.1
    38 6 RÖTELNVIRUSSTA MM THERIEN LLVPWVLIFMVCRRACRRRG 1269 P0756 6.1
    38 7 MASERNVIRUSSTA MM EDMONSTON LLWRSRCKIV 1270 ABK4 0 528.1
    38 8 MASERN-MORBILLIVIRUS LLWSYAMGV 1271 P0485 1.1
    38 9 MASERNVIRUSSTA MM EDMONSTON LLWSYAMGVGVELEN 1272 P0485 1.1
    39 0 MASERNVIRUSSTA MM EDMONSTON LLWSYAMGVGVELENSMGGL 1273 P0485 1.1
    39 1 MASERN-MORBILLIVIRUS LMIDRPYVL 1274 P0836 2.1
    39 2 MASERNVIRUSSTA MM EDMONSTON LNAMTQNIRPVQSVA 1275 P6935 3.1
    39 3 RÖTELNVIRUS LNTPPPYQVSCGGES 1276 BAA28 178.1
    39 4 MASERNVIRUSSTA MM EDMONSTON LRDPISAEISIQALS 1277 P6935 3.1
    39 5 BORDETELLA PERTUSSIS LRGSGDLQEYLRHVTR 1278 AAA83 981.1
    39 6 RÖTELNVIRUS LRLVDADD 1279 CAJ88 851.1
    39 7 RÖTELNVIRUS LRLVDADDPLLR 1280 BAA19 893.1
    39 8 RÖTELNVIRUS LRLVDADDPLLRTAPGPGEVWVTPVIGS QAR 1281 BAA19 893.1
    39 9 BORDETELLA PERTUSSIS LRRLLYMIYMSGLAVRVHVSKEEQYYDY 1282 P0497 9.1
    40 0 RÖTELNVIRUS LRTAPGPG 1283 CAJ88 851.1
    40 1 RÖTELNVIRUS LRVGQHYRNASDVLPGHWLQ 1284 NP_74 0663. 1
    40 2 BORDETELLA PERTUSSIS LRYLA 1285 ACI16 088.1
    40 3 MASERNVIRUSSTA MM EDMONSTON LSCKPWQESRKNK 1286 P0485 1.1
    40 4 MASERN-MORBILLIVIRUS LSEIKGVIVHRLEGV 1287 AAL 2 9 688.1
    40 5 MASERNVIRUSSTA MM EDMONSTON LSIAYPTLSEIKGVI 1288 P6935 3.1
    40 6 MASERNVIRUSSTA MM EDMONSTON LSLLDLYLGRGYNVS 1289 P0836 2.1
    40 7 MASERNVIRUSSTA MM EDMONSTON LSQGNLIANCASILC 1290 P6935 3.1
    40 8 MASERN-MORBILLIVIRUS LSSHRGVIADNQAKW 1291 P0683 0.1
    40 9 MASERNVIRUSSTA MM EDMONSTON LSVDLSLTVELKIKI 1292 P0836 2.1
    41 0 BORDETELLA PERTUSSIS LTGISICNPGSSLC 1293 AAA83 981.1
    41 1 MASERNVIRUSSTA MM EDMONSTON LTIKFGIETMYPALG 1294 P0485 1.1
    41 2 MASERNVIRUSSTA MM EDMONSTON LTIKFGIETMYPALGLHEFA 1295 P0485 1.1
    41 3 MASERNVIRUSSTA MM EDMONSTON LTLQTPTGQIHWGNL 1296 P6935 3.1
    41 4 RÖTELNVIRUS LVDADDPL 1297 CAJ88 851.1
    41 5 RÖTELNVIRUS LVDADDPLLR 1298 BAA19 893.1
    41 6 MASERNVIRUSSTA MM EDMONSTON LVEKPNLSSKRSELS 1299 P0836 2.1
    41 7 RÖTELNVIRUS LVGATPE 1300 BAA19 893.1
    41 8 RÖTELNVIRUS LVGATPER 1301 CAJ88 851.1
    41 9 MASERN-MORBILLIVIRUS LVKLGVWKSPTGMQS 1302 P0683 0.1
    42 0 MASERNVIRUSSTA MM EDMONSTON-B LVSGSFGNRFILSQGNLI 1303 P2603 1.1
    42 1 MASERNVIRUSSTA MM EDMONSTON LYKSNHNNVYWLTIP 1304 P0836 2.1
    42 2 MASERNVIRUSSTA MM EDMONSTON LYPMSPLLQECLRGSTKSCARTLVS 1305 P6935 3.1
    42 3 RÖTELNVIRUS MASTTPITMEDLQKALEA 1306 P0756 6.1
    42 4 RÖTELNVIRUS MASTTPITMEDLQKALEAQSR 1307 ABD64 200.1
    42 5 RÖTELNVIRUSSTA MM THERIEN MASTTPITMEDLQKALEAQSRALRAELA A 1308 P0756 6.1
    42 6 RÖTELNVIRUS MASTTPITMEDLQKALEAQSRALRAGLA A 1309 ABD64 200.1
    42 7 RÖTELNVIRUS-IMPFSTAMM RA27/3 MASTTPITMEDLQKALETQSRVLRAGLT A 1310 CAA33 016.1
    42 8 MASERNVIRUSSTA MM EDMONSTON MATLLRSLALFKRNK 1311 P0485 1.1
    42 9 MASERNVIRUSSTA MM EDMONSTON MATLLRSLALFKRNKDKPPI 1312 P0485 1.1
    43 0 MASERN-MORBILLIVIRUS MDLYKSNHNNVYWLT 1313 P0683 0.1
    43 1 RÖTELNVIRUS MEDLQKALEAQSRA 1314 P0756 6.1
    43 2 RÖTELNVIRUS MEDLQKALEAQSRALRAELAA 1315 P0756 6.1
    43 3 MASERNVIRUSSTA MM EDMONSTON MGLKVNVSAIFMAVL 1316 P6935 3.1
    43 4 MASERN-MORBILLIVIRUS MIDRPYVLLAVLFVM 1317 P0683 0.1
    43 5 MASERNVIRUSSTA MM EDMONSTON MILAVQGVQDYINNE 1318 P6935 3.1
    43 6 MASERNVIRUSSTA MM EDMONSTON MLNSQAIDNLRASLE 1319 P6935 3.1
    43 7 MASERNVIRUSSTA MM EDMONSTON MNALVNSTLLETRTT 1320 P0836 2.1
    43 8 RÖTELNVIRUS MNYTGNQQSRWGLGSPNCHGPDWASPVC QRHS 1321 BAA19 893.1
    43 9 MASERNVIRUSSTA MM EDMONSTON MQSWVPLSTDDPVID 1322 P0836 2.1
    44 0 MASERN-MORBILLIVIRUS MSLSLLDLYLGRGYN 1323 P0683 0.1
    44 1 MASERNVIRUSSTA MM EDMONSTON MSPLLQECLRGSTKS 1324 P6935 3.1
    44 2 MASERN-MORBILLIVIRUS MSPQRDRINAFYKDN 1325 P0683 0.1
    44 3 MASERN-MORBILLIVIRUS MYRVFEVSVIRNPGL 1326 P0683 0.1
    44 4 MASERNVIRUSSTA MM EDMONSTON NALYPMSPLLQECLR 1327 P6935 3.1
    44 5 RÖTELNVIRUSSTA MM THERIEN NCHGPDWASPVCQRHSPDCSRLVGAT 1328 P0756 6.1
    44 6 MASERNVIRUSSTA MM EDMONSTON NFGRSYFDPAYFRLG 1329 P0485 1.1
    44 7 MASERNVIRUSSTA MM EDMONSTON NFGRSYFDPAYFRLGQEMVR 1330 P0485 1.1
    44 8 RÖTELNVIRUS NGTQRACTFWAVNAY 1331 BAA28 178.1
    44 9 MASERNVIRUSSTA MM EDMONSTON NGVTIQVGSRRYPDA 1332 P6935 3.1
    45 0 MASERNVIRUSSTA MM EDMONSTON NIIAEDLSLRRFMVA 1333 P0485 1.1
    45 1 MASERNVIRUSSTA MM EDMONSTON NIIAEDLSLRRFMVALILDI 1334 P0485 1.1
    45 2 MASERNVIRUSSTA MM EDMONSTON NITLLNNCTRVEIAE 1335 P6935 3.1
    45 3 MASERN-MORBILLIVIRUS NLALGVINTLEWIPR 1336 P0683 0.1
    45 4 CORYNEBACTERIU M DIPHTHERIAE NLFQVVHWSYNRPAYSPG 1337 SRC28 0292
    45 5 MASERNVIRUSSTA MM EDMONSTON NLVILPGQDLQYVLA 1338 P0836 2.1
    45 6 MASERNVIRUSSTA MM EDMONSTON NLYQQMGKPAPYMVN 1339 P0485 1.1
    45 7 MASERNVIRUSSTA MM EDMONSTON NLYQQMGKPAPYMVNLENSI 1340 P0485 1.1
    45 8 MASERNVIRUSSTA MM EDMONSTON NNCTRVEIAEYRRLL 1341 P6935 3.1
    45 9 MASERNVIRUSSTA MM EDMONSTON NPDREYDFRD 1342 P0836 2.1
    46 0 MASERNVIRUSSTA MM HALLE NPDVSGPKL 1343 P1005 0.1
    46 1 MASERNVIRUSSTA MM EDMONSTON NPDVSGPKLTGALIG 1344 P0485 1.1
    46 2 MASERNVIRUSSTA MM EDMONSTON NPDVSGPKLTGALIGILSLF 1345 P0485 1.1
    46 3 MASERN-MORBILLIVIRUS NPPERIKLDYDQYCA 1346 P0683 0.1
    46 4 MASERN-MORBILLIVIRUS NQAKWAVPTTRTDDK 1347 P0683 0.1
    46 5 MASERN-MORBILLIVIRUS NQDPDKILTYIAADH 1348 AAF02 706.1
    46 6 MASERNVIRUSSTA MM EDMONSTON NQLSCDLIGQKLGLK 1349 P6935 3.1
    46 7 RÖTELNVIRUS NQQSRWGLGSPNCHGPDWASPVCQRHS 1350 ABD64 214.1
    46 8 MUMPS-RUBULAVIRUS NSTLGVKSAREF 1351 ABP48 111.1
    46 9 RÖTELNVIRUS NTPHGQLEVQVPPDP 1352 BAA28 178.1
    47 0 MASERNVIRUSSTA MM EDMONSTON NVSAIFMAVLLTLQT 1353 P6935 3.1
    47 1 MASERN-MORBILLIVIRUS PAEVDGDVKLSSNLV 1354 P0683 0.1
    47 2 RÖTELNVIRUS PAFGHSDAACWGFPT 1355 BAA28 178.1
    47 3 MASERNVIRUSSTA MM EDMONSTON PALICCCRGRCNKKG 1356 P6935 3.1
    47 4 MASERN-MORBILLIVIRUS PDKILTYIAADHC 1357 AAF02 706.1
    47 5 MASERNVIRUSSTA MM EDMONSTON PERIKLDYDQYCADV 1358 P0836 2.1
    47 6 RÖTELNVIRUS PERPRLRL 1359 CAJ88 851.1
    47 7 RÖTELNVIRUS PGCATQAPVPVRLAG 1360 BAA28 178.1
    47 8 RÖTELNVIRUS-IMPFSTAMM RA27/3 PGCATQAPVPVRLAGVRFESKIVDGGCF A 1361 CAJ88 851.1
    47 9 RÖTELNVIRUS PGEVWVTP 1362 CAJ88 851.1
    48 0 RÖTELNVIRUS PGEVWVTPVIGSQAR 1363 BAA28 178.1
    48 1 CORYNEBACTERIU M DIPHTHERIAE PGKLDVNKSKTHISVN 1364 CAE11 230.1
    48 2 MASERNVIRUSSTA MM EDMONSTON PGLGAPVFHMTNYLE 1365 P0836 2.1
    48 3 RÖTELNVIRUS PGPGEVWV 1366 CAJ88 851.1
    48 4 RÖTELNVIRUS PHKTVRVKFHTETRT 1367 BAA28 178.1
    48 5 MASERN-MORBILLIVIRUS PIELQVECFTWDQKL 1368 AAR89 413.1
    48 6 MASERNVIRUSSTA MM EDMONSTON-B PISLERLDVG 1369 P2603 1.1
    48 7 MASERNVIRUSSTA MM EDMONSTON PISLERLDVGTNLGN 1370 P6935 3.1
    48 8 BORDETELLA PERTUSSIS PKALFTQQGGAYGRC 1371 P0497 9.1
    48 9 MASERNVIRUSSTA MM EDMONSTON PKYVATQGYLISNFD 1372 P6935 3.1
    49 0 MASERNVIRUSSTA MM EDMONSTON PLDIDTASESSQD 1373 P0485 1.1
    49 1 RÖTELNVIRUS PLGLKFKTVRPVALP 1374 BAA28 178.1
    49 2 MASERNVIRUSSTA MM EDMONSTON PLITHGSGMDLYKSN 1375 P0836 2.1
    49 3 MASERN-MORBILLIVIRUS PLKDNRIPSYGVLSV 1376 P0683 0.1
    49 4 RÖTELNVIRUS PLLRTAPG 1377 CAJ88 851.1
    49 5 MASERNVIRUSSTA MM EDMONSTON PLLSCKPWQESRK 1378 P0485 1.1
    49 6 BORDETELLA PERTUSSIS PPATVYRYDSRPPE 1379 P0497 7.1
    49 7 MASERN-MORBILLIVIRUS PPISLERLDVGT 1380 AAL29 688.1
    49 8 RÖTELNVIRUS PPPPEERQETRSQTPAPKPS 1381 P0756 6.1
    49 9 BORDETELLA PERTUSSIS PQEQITQHGSPYGRC 1382 AAA83 981.1
    50 0 BORDETELLA PERTUSSIS PQEQITQHGSPYGRCANK 1383 AAA83 981.1
    50 1 BORDETELLA PERTUSSIS PQPGPQPPQPPQPQPEAPAPQPPAG 1384 P1428 3.3
    50 2 MASERNVIRUSSTA MM EDMONSTON PRLGGKEDRRVKQ 1385 P0485 1.1
    50 3 RÖTELNVIRUS PRLRLVDA 1386 CAJ88 851.1
    50 4 RÖTELNVIRUS PRNVRVTGCYQCGTP 1387 BAA28 178.1
    50 5 MASERNVIRUSSTA MM EDMONSTON PSRASDARAAHLP 1388 P0485 1.1
    50 6 MASERNVIRUSSTA MM EDMONSTON PTGQIHWGNLSKIGV 1389 P6935 3.1
    50 7 MASERNVIRUSSTA MM EDMONSTON PTGTPLDIDTASE 1390 P0485 1.1
    50 8 MASERNVIRUSSTA MM EDMONSTON PTLSEIKGVIVHRLE 1391 P6935 3.1
    50 9 MASERN-MORBILLIVIRUS PTTIRGQFSNMSLSL 1392 P0683 0.1
    51 0 MASERN-MORBILLIVIRUS PTTRTDDKLR 1393 AAR89 413.1
    51 1 MASERN-MORBILLIVIRUS PTTRTDDKLRMETCFQQACKG 1394 AAR89 413.1
    51 2 RÖTELNVIRUS PVALPRTLAPPRNVR 1395 BAA28 178.1
    51 3 CORYNEBACTERIU M DIPHTHERIAE PVFAGANYAAWAVNVAQVI 1396 AAV70 486.1
    51 4 RÖTELNVIRUS PVIGSQAR 1397 CAJ88 851.1
    51 5 MASERN-MORBILLIVIRUS PVVEVNGVTIQVGSR 1398 AAL29 688.1
    51 6 RÖTELNVIRUSSTA MM THERIEN PWELVVLTARPEDGWTCRGV 1399 P0756 6.1
    51 7 MASERNVIRUSSTA MM EDMONSTON PWQESRKNKAQTR 1400 P0485 1.1
    51 8 MASERNVIRUSSTA MM EDMONSTON PYMVNLENSIQNKFS 1401 P0485 1.1
    51 9 MASERNVIRUSSTA MM EDMONSTON PYMVNLENSIQNKFSAGSYP 1402 P0485 1.1
    52 0 MASERNVIRUSSTA MM EDMONSTON PYQGSGKGVS 1403 P0836 2.1
    52 1 RÖTELNVIRUS PYQVSCGGESDRASA 1404 BAA28 178.1
    52 2 MASERN-MORBILLIVIRUS QACKGKIQALCEN 1405 P0836 2.1
    52 3 MASERNVIRUSSTA MM EDMONSTON QAGQEMILAVQGVQD 1406 P6935 3.1
    52 4 MASERN-MORBILLIVIRUS QALCENPECVPLKDN 1407 P0683 0.1
    52 5 BORDETELLA PERTUSSIS QALGALK 1408 ACI16 088.1
    52 6 RÖTELNVIRUS QAPVPVRLAGVRFES 1409 BAA28 178.1
    52 7 RÖTELNVIRUS QCGTPALVEGLAPGG 1410 BAA28 178.1
    52 8 MASERNVIRUSSTA MM EDMONSTON QDPDKILTYIAADHC 1411 P6935 3.1
    52 9 MASERNVIRUSSTA MM EDMONSTON QECLRGSTKSCARTL 1412 P6935 3.1
    53 0 BORDETELLA PERTUSSIS QEQITQHGSPYGRC 1413 AAA83 981.1
    53 1 MASERNVIRUSSTA MM EDMONSTON QESRKNKAQTRTP 1414 P0485 1.1
    53 2 MASERNVIRUSSTA MM EDMONSTON QGDQSENELPRLGGK 1415 P0485 1.1
    53 3 MASERNVIRUSSTA MM EDMONSTON QGDQSENELPRLGGKEDRRV 1416 P0485 1.1
    53 4 CORYNEBACTERIU M DIPHTHERIAE QGESGHDIKITAENTPLPIA 1417 AAV70 486.1
    53 5 MASERN-MORBILLIVIRUS QGSGKGVSFQLVKLG 1418 P0683 0.1
    53 6 MASERNVIRUSSTA MM EDMONSTON QGVQDYINNELIPSM 1419 P6935 3.1
    53 7 RÖTELNVIRUS QLEVQVPPDPGDLVE 1420 BAA28 178.1
    53 8 MASERN-MORBILLIVIRUS QLPEATFMV 1421 ABK40 528.1
    53 9 RÖTELNVIRUS QLPFLGHDGHHGGTLRVGQHYRNAS 1422 NP_74 0663. 1
    54 0 MASERNVIRUSSTA MM EDMONSTON QLSMYRVFEV 1423 P0836 2.1
    54 1 BORDETELLA PERTUSSIS QLSNIT 1424 ACI16 083.1
    54 2 MASERNVIRUSSTA MM EDMONSTON QNIRPVQSVASSRRH 1425 P6935 3.1
    54 3 MASERNVIRUSSTA MM EDMONSTON QNKFSAGSYPLLWSY 1426 P0485 1.1
    54 4 MASERNVIRUSSTA MM EDMONSTON QNKFSAGSYPLLWSYAMGVG 1427 P0485 1.1
    54 5 MASERNVIRUSSTA MM EDMONSTON QNKFSAGSYPLLWSYAMGVGVELEN 1428 P0485 1.1
    54 6 MASERNVIRUSSTA MM EDMONSTON QQACKGKIQALCENP 1429 P0836 2.1
    54 7 MASERNVIRUSSTA MM EDMONSTON QQRRVVGEFRLERKW 1430 P0485 1.1
    54 8 MASERNVIRUSSTA MM EDMONSTON QQRRVVGEFRLERKWLDVVR 1431 P0485 1.1
    54 9 BORDETELLA PERTUSSIS QQTRANPNPYTSRRSVAS 1432 P0497 7.1
    55 0 RÖTELNVIRUS QRHSPDCSRLVGATP 1433 BAA28 178.1
    55 1 MASERNVIRUSSTA MM EDMONSTON QSGLTFASRGTNMED 1434 P0485 1.1
    55 2 MASERNVIRUSSTA MM EDMONSTON QSGLTFASRGTNMEDEADQY 1435 P0485 1.1
    55 3 CORYNEBACTERIU M DIPHTHERIAE QSIALSSLMVAQAIPLVGEL 1436 AAV70 486.1
    55 4 MASERNVIRUSSTA MM EDMONSTON QSRFGWFENKEISDI 1437 P0485 1.1
    55 5 MASERNVIRUSSTA MM EDMONSTON QSRFGWFENKEISDIEVQDP 1438 P0485 1.1
    55 6 MASERNVIRUSSTA MM EDMONSTON QSRGEAR 1439 P0485 1.1
    55 7 MASERNVIRUSSTA MM EDMONSTON QSRGEARESYRETGPSRA 1440 P0485 1.1
    55 8 RÖTELNVIRUSSTA MM THERIEN QTGRGGSAPRPELGPPTN 1441 P0756 6.1
    55 9 RÖTELNVIRUSSTA MM THERIEN QTPAPKPSRAPPQQPQPPRMQTGRG 1442 P0756 6.1
    56 0 MASERNVIRUSSTA MM EDMONSTON QVGSRRYPDAVYLHR 1443 P6935 3.1
    56 1 MASERNVIRUSSTA MM EDMONSTON QVSFLQGDQSENE 1444 P0485 1.1
    56 2 RÖTELNVIRUS QYHPTACEVEPAFGH 1445 BAA28 178.1
    56 3 MASERNVIRUSSTA MM EDMONSTON QYVLATYDTSRVEHA 1446 P0836 2.1
    56 4 BORDETELLA PERTUSSIS RANPNPYTSRRSV 1447 ACI04 548.1
    56 5 MASERNVIRUSSTA MM EDMONSTON RAS DARAAHL PTG 1448 P0485 1.1
    56 6 MASERNVIRUSSTA MM EDMONSTON RASLETTNQAIEAIR 1449 P6935 3.1
    56 7 RÖTELNVIRUSSTA MM THERIEN RCGRLICGLSTTAQYPPTRF 1450 P0756 6.1
    56 8 BORDETELLA PERTUSSIS RDGQSVIGACASPYEGRYR 1451 P0497 9.1
    56 9 MASERNVIRUSSTA MM EDMONSTON RESYRETGPSRAS 1452 P0485 1.1
    57 0 MASERNVIRUSSTA MM EDMONSTON RETGPSRASDARA 1453 P0485 1.1
    57 1 MUMPS-RUBULAVIRUS RFAKYQQQGRLEAR 1454 P2118 6.1
    57 2 RÖTELNVIRUSSTA MM THERIEN RFGAPQAFLAGLLLATVAVGTARA 1455 P0756 6.1
    57 3 MASERNVIRUSSTA MM EDMONSTON RFMVALILDIKRTPG 1456 P0485 1.1
    57 4 MASERNVIRUSSTA MM EDMONSTON RFMVALILDIKRTPGNKPRI 1457 P0485 1.1
    57 5 MASERNVIRUSSTA MM EDMONSTON RGEARESYRETGP 1458 P0485 1.1
    57 6 RÖTELNVIRUS RGTTPPAYG 1459 CAA28 880.1
    57 7 RÖTELNVIRUSSTA MM M33 RIETRSARH 1460 ABD64 214.1
    57 8 BORDETELLA PERTUSSIS RILAGALATYQ 1461 P0497 7.1
    57 9 BORDETELLA PERTUSSIS RIPPENIRRVT 1462 ACI04 548.1
    58 0 BORDETELLA PERTUSSIS RISNLND 1463 ACI16 083.1
    58 1 BORDETELLA PERTUSSIS RLANLNG 1464 ACI16 088.1
    58 2 MASERNVIRUSSTA MM EDMONSTON RLDVGTNLGNAIAKL 1465 P6935 3.1
    58 3 MASERNVIRUSSTA MM EDMONSTON RLERKWLDV 1466 P0485 1.1
    58 4 MASERNVIRUSSTA MM EDMONSTON RLGGKEDRRVKQSRG 1467 P0485 1.1
    58 5 MASERNVIRUSSTA MM EDMONSTON RLGGKEDRRVKQSRGEARES 1468 P0485 1.1
    58 6 MASERNVIRUSSTA MM EDMONSTON RLLDRLVRL 1469 ABI54 110.1
    58 7 RÖTELNVIRUS RLRLVDAD 1470 CAJ88 851.1
    58 8 RÖTELNVIRUS RLRLVDADDPLLR 1471 BAA19 893.1
    58 9 RÖTELNVIRUS RLRLVDADDPLLRTAPGPGEVWVTPVIG SQA 1472 BAA19 893.1
    59 0 RÖTELNVIRUS RLRLVQDADDPLLRIAPGPGEVWVTPVI GSQA 1473 SRC26 5968
    59 1 MASERNVIRUSSTA MM EDMONSTON RLSDNGYYTV 1474 ABK40 528.1
    59 2 RÖTELNVIRUS RLVDADDP 1475 CAJ88 851.1
    59 3 RÖTELNVIRUS RLVDADDPLLRTAPG 1476 BAA28 178.1
    59 4 RÖTELNVIRUS RLVGATPE 1477 CAJ88 851.1
    59 5 RÖTELNVIRUS RMQTGRGGSAPRPELGPPTNPFQAAVA 1478 ABD64 216.1
    59 6 MASERN-MORBILLIVIRUS RMSKGVFKV 1479 ABY21 184.1
    59 7 MASERN-MORBILLIVIRUS RNPGLGAPVFHMTNY 1480 P0683 0.1
    59 8 RÖTELNVIRUS RPRLRLVD 1481 CAJ88 851.1
    59 9 BORDETELLA PERTUSSIS RQAESSEAMAAWSERAGEA 1482 P0497 7.1
    60 0 RÖTELNVIRUS RQTWAEWAAAHWWQL 1483 BAA28 178.1
    60 1 MASERNVIRUSSTA MM EDMONSTON RRVKQSRGEARES 1484 P0485 1.1
    60 2 MASERN-MORBILLIVIRUS RRYPDAVYL 1485 ACA09 725.1
    60 3 MASERNVIRUSSTA MM EDMONSTON RRYPDAVYLHRIDLG 1486 P6935 3.1
    60 4 MASERNVIRUSSTA MM EDMONSTON RSAGKVSSTLASELG 1487 P0485 1.1
    60 5 MASERNVIRUSSTA MM EDMONSTON RSAGKVSSTLASELGITAED 1488 P0485 1.1
    60 6 MASERNVIRUSSTA MM EDMONSTON RSELSQLS 1489 P0836 2.1
    60 7 MASERNVIRUSSTA MM EDMONSTON RSELSQLSMYRVFEV 1490 P0836 2.1
    60 8 RÖTELNVIRUS RSQTPAPKPSRAPPQQPQPPRMQT 1491 ABD64 214.1
    60 9 RÖTELNVIRUS RTAPGPGE 1492 CAJ88 851.1
    61 0 RÖTELNVIRUS RTAPGPGEVWVTPVI 1493 BAA28 178.1
    61 1 MASERN-MORBILLIVIRUS RTDDKLRMETCFQQA 1494 P0683 0.1
    61 2 RÖTELNVIRUS RTLAPPRNVRVTGCY 1495 BAA28 178.1
    61 3 MASERNVIRUSSTA MM EDMONSTON RTVLEPIRDALNAMT 1496 P6935 3.1
    61 4 MASERNVIRUSSTA MM EDMONSTON RVEHAVVYYVYSPSR 1497 P0836 2.1
    61 5 MASERNVIRUSSTA MM EDMONSTON RVFEVGVIRNPGLGA 1498 P0836 2.1
    61 6 BORDETELLA PERTUSSIS RVHVSKEEQYYDYEDATFE 1499 P0497 8.2
    61 7 RÖTELNVIRUS RVIDPAAQ 1500 BAA28 178.1
    61 8 RÖTELNVIRUS RVKFHTETRTVWQLS 1501 BAA28 178.1
    61 9 BORDETELLA PERTUSSIS RVYHNGITGET 1502 ACI04 548.1
    62 0 BORDETELLA PERTUSSIS RYDSRPPEDVF 1503 ACI04 548.1
    62 1 MASERNVIRUSSTA MM EDMONSTON RYPDAVYLHRIDLGP 1504 P6935 3.1
    62 2 MASERNVIRUSSTA MM EDMONSTON SAEISIQALSYALGG 1505 P6935 3.1
    62 3 MASERNVIRUSSTA MM EDMONSTON SAEPLLSCKPWQESR 1506 P0485 1.1
    62 4 MASERNVIRUSSTA MM EDMONSTON SAEPLLSCKPWQESRKNKAQ 1507 P0485 1.1
    62 5 MASERN-MORBILLIVIRUS SAGKVSSTLASELG 1508 P0485 1.1
    62 6 MASERNVIRUSSTA MM EDMONSTON SAGKVSSTLASELGITAEDARLVS 1509 P0485 1.1
    62 7 MASERNVIRUSSTA MM EDMONSTON SCTVTREDGT 1510 P0836 2.1
    62 8 RÖTELNVIRUS SDAACWGFPTDTVMS 1511 BAA28 178.1
    62 9 MASERNVIRUSSTA MM EDMONSTON SDARAAHLPTGTP 1512 P0485 1.1
    63 0 RÖTELNVIRUSSTA MM THERIEN SDWHQGTHVCHTKHMDFWCVEHD 1513 P0756 6.1
    63 1 MASERNVIRUSSTA MM EDMONSTON SELRRWIKYTQQRRV 1514 P0485 1.1
    63 2 MASERNVIRUSSTA MM EDMONSTON SELRRWIKYTQQRRVVGEFR 1515 P0485 1.1
    63 3 MASERNVIRUSSTA MM EDMONSTON SELSQL 1516 P0836 2.1
    63 4 MASERNVIRUSSTA MM EDMONSTON SELSQLS 1517 P0836 2.1
    63 5 BORDETELLA PERTUSSIS SEYLAHRRIPPENIRRVTRV 1518 CAD44 970.1
    63 6 MASERNVIRUSSTA MM EDMONSTON SFLQGDQSENELP 1519 P0485 1.1
    63 7 MASERNVIRUSSTA MM EDMONSTON SGKGVSFQLVKLGVW 1520 P0836 2.1
    63 8 MASERNVIRUSSTA MM EDMONSTON SHRGVIADNQAKWAV 1521 P0836 2.1
    63 9 MASERNVIRUSSTA MM EDMONSTON SIEHQVKDVLTPLFK 1522 P0836 2.1
    64 0 MASERNVIRUSSTA MM EDMONSTON SKIGVVGIGSASYKV 1523 P6935 3.1
    64 1 MASERN-MORBILLIVIRUS SKRSELSQLSMYRVF 1524 P0683 0.1
    64 2 MASERN-MORBILLIVIRUS SLFVESPGQLIQRITDDPDVS 1525 ABI54 110.1
    64 3 MASERNVIRUSSTA MM EDMONSTON SLSTNLDVTNSIEHQ 1526 P0836 2.1
    64 4 MASERNVIRUSSTA MM EDMONSTON SLSTNLDVTNSIEHQVKDVLTPLFK 1527 P0836 2.1
    64 5 MASERNVIRUSSTA MM EDMONSTON SLWGSGLLML 1528 BAE98 296.1
    64 6 MASERNVIRUSSTA MM EDMONSTON SMKGLSSTSIVYILI 1529 P6935 3.1
    64 7 MASERN-MORBILLIVIRUS SMYRVFEVGV 1530 P0836 2.1
    64 8 MASERN-MORBILLIVIRUS SNDLSNCMVALGELK 1531 P0683 0.1
    64 9 MASERNVIRUSSTA MM HALLE SPGQLIQR 1532 P1005 0.1
    65 0 MASERNVIRUSSTA MM EDMONSTON SQDPQDSRRSAEP 1533 P0485 1.1
    65 1 MASERN-MORBILLIVIRUS SRIVINREHLMIDRP 1534 P0683 0.1
    65 2 MASERNVIRUSSTA MM EDMONSTON SRKNKAQTRTPLQ 1535 P0485 1.1
    65 3 RÖTELNVIRUS SRLVGATP 1536 CAJ88 851.1
    65 4 RÖTELNVIRUS SRLVGATPERPRLRLVDADDPLLR 1537 CAJ88 851.1
    65 5 MASERNVIRUSSTA MM EDMONSTON SRPGLKPDLTGTSKS 1538 P6935 3.1
    65 6 BORDETELLA PERTUSSIS SRRSVASIVGTLVRM 1539 CAD44 970.1
    65 7 RÖTELNVIRUS SRWGLGSPNCHGPDW 1540 BAA28 178.1
    65 8 BORDETELLA PERTUSSIS SSATK 1541 ACI16 088.1
    65 9 RÖTELNVIRUS SSGGYAQLASYFNPG 1542 BAA28 178.1
    66 0 BORDETELLA PERTUSSIS SSLGNGV 1543 ACI16 083.1
    66 1 MASERN-MORBILLIVIRUS SSNLVILPGQDLQYV 1544 P0683 0.1
    66 2 MASERNVIRUSSTA MM EDMONSTON SSQDPQDSRRSAEPL 1545 P0485 1.1
    66 3 MASERNVIRUSSTA MM EDMONSTON SSQDPQDSRRSAEPLLSCKP 1546 P0485 1.1
    66 4 MASERNVIRUSSTA MM EDMONSTON SSRRHKRFAGVVLAG 1547 P6935 3.1
    66 5 MASERNVIRUSSTA MM EDMONSTON SSTSIVYILIAVCLG 1548 P6935 3.1
    66 6 BORDETELLA PERTUSSIS STPGIVI 1549 AAA83 981.1
    66 7 BORDETELLA PERTUSSIS STPGIVIPPQEQITQHGSPYGRC 1550 AAA83 981.1
    66 8 BORDETELLA PERTUSSIS STSSSRRYTEVY 1551 P0497 7.1
    66 9 MASERNVIRUSSTA MM EDMONSTON SYFIVLSIAYPTLSE 1552 P6935 3.1
    67 0 MASERNVIRUSSTA MM EDMONSTON SYRETGPSRASDA 1553 P0485 1.1
    67 1 BORDETELLA PERTUSSIS SYVK 1554 ACI16 083.1
    67 2 RÖTELNVIRUS SYVQHPHKTVRVKFH 1555 BAA28 178.1
    67 3 RÖTELNVIRUS TAPGPGEV 1556 CAJ88 851.1
    67 4 BORDETELLA PERTUSSIS TATRLLSSTNSRLC 1557 AAA83 981.1
    67 5 MASERN-MORBILLIVIRUS TDDPVIDRLYLSSHR 1558 P0683 0.1
    67 6 MASERNVIRUSSTA MM EDMONSTON TEILSLFGPSLRDPI 1559 P6935 3.1
    67 7 RÖTELNVIRUS TETRTVWQLSVAGVS 1560 BAA28 178.1
    67 8 BORDETELLA PERTUSSIS TEVYLEHRMQEAVE 1561 P0497 7.1
    67 9 MASERNVIRUSSTA MM EDMONSTON TFMPEGTVCSQNALY 1562 P6935 3.1
    68 0 RÖTELNVIRUS TGACICEIPTDVSCE 1563 BAA28 178.1
    68 1 BORDETELLA PERTUSSIS TGDLRAY 1564 ACI16 083.1
    68 2 MASERN-MORBILLIVIRUS TGMQSWVPLSTDDPV 1565 P0683 0.1
    68 3 RÖTELNVIRUS TGNQQSRWGLGSPNC 1566 BAA28 178.1
    68 4 MASERNVIRUSSTA MM EDMONSTON TGPSRASDARAAH 1567 P0485 1.1
    68 5 MASERN-MORBILLIVIRUS TGTIINQDPDKILTY 1568 AAF02 706.1
    68 6 RÖTELNVIRUS TGWYGTHTTAVSET 1569 BAA28 178.1
    68 7 MASERNVIRUSSTA MM EDMONSTON TIRGQFSNMSLSLLD 1570 P0836 2.1
    68 8 RÖTELNVIRUS TLGATCALPLAGLLA 1571 BAA28 178.1
    68 9 MASERN-MORBILLIVIRUS TLLNNCTRV 1572 P2603 1.1
    69 0 MASERNVIRUSSTA MM EDMONSTON-B TLNVPPPPDPGR 1573 P0342 2.1
    69 1 MASERNVIRUSSTA MM EDMONSTON-B TLNVPPPPDPGRASTSGTPIKK 1574 P0342 2.1
    69 2 MASERN-MORBILLIVIRUS TMTSQGMYGGTYPVE 1575 P0683 0.1
    69 3 MASERNVIRUSSTA MM EDMONSTON TNLGNAIAKLEDAKE 1576 P6935 3.1
    69 4 MASERNVIRUSSTA MM EDMONSTON TNMEDEADQYFSHDD 1577 P0485 1.1
    69 5 MASERNVIRUSSTA MM EDMONSTON TNMEDEADQYFSHDDPISSD 1578 P0485 1.1
    69 6 RÖTELNVIRUSSTA MM M33 TNPFQAAVARGLRPP 1579 CAA28 880.1
    69 7 MASERN-MORBILLIVIRUS TNSIEHQVKDVLTPL 1580 P0683 0.1
    69 8 MASERNVIRUSSTA MM EDMONSTON TNYLEQPVSNDLSNC 1581 P0836 2.1
    69 9 MASERN-MORBILLIVIRUS TNYLEQPVSNDLSNCMVALGELKLAAL 1582 AAR89 413.1
    70 0 RÖTELNVIRUS TPERPRLR 1583 CAJ88 851.1
    70 1 RÖTELNVIRUSSTA MM THERIEN TPERPRLRLVDADDPLLRTA 1584 P0756 6.1
    70 2 MASERNVIRUSSTA MM HALLE TPGNKPRIA 1585 P1005 0.1
    70 3 MASERNVIRUSSTA MM EDMONSTON TPLDIDTASESSQDP 1586 P0485 1.1
    70 4 MASERNVIRUSSTA MM EDMONSTON TPLDIDTASESSQDPQDSRR 1587 P0485 1.1
    70 5 MASERNVIRUSSTA MM EDMONSTON TPLFKIIGDEVGLRT 1588 P0836 2.1
    70 6 MASERNVIRUSSTA MM EDMONSTON TPLQCTM 1589 P0485 1.1
    70 7 RÖTELNVIRUS TPVIGSQA 1590 CAJ88 851.1
    70 8 RÖTELNVIRUS TPVIGSQARK 1591 BAA19 893.1
    70 9 MASERNVIRUSSTA MM EDMONSTON TQGYLISNFDESSCT 1592 P6935 3.1
    71 0 BORDETELLA PERTUSSIS TRANPNPYTSRRSVASIVGTLVRM 1593 P0497 7.1
    71 1 RÖTELNVIRUS TRFGCAMRWGLPP 1594 NP_74 0663. 1
    71 2 BORDETELLA PERTUSSIS TRNTGQPATDHYYSNV 1595 AAA83 981.1
    71 3 MASERNVIRUSSTA MM EDMONSTON TRTPLQCTMTEIF 1596 P0485 1.1
    71 4 RÖTELNVIRUS TRWHRLLRMPVR 1597 ABD64 216.1
    71 5 MASERNVIRUSSTA MM EDMONSTON TSGSGGAIRGIKHII 1598 P0485 1.1
    71 6 MASERNVIRUSSTA MM EDMONSTON TSGSGGAIRGIKHIIIVPIP 1599 P0485 1.1
    71 7 MASERNVIRUSSTA MM EDMONSTON TSQGMYGGTYLVEKP 1600 P0836 2.1
    71 8 MASERN-MORBILLIVIRUS TSRVEHAVVYYVYSP 1601 P0683 0.1
    71 9 BORDETELLA PERTUSSIS TSSSRRYTEVYL 1602 ACI04 548.1
    72 0 BORDETELLA PERTUSSIS TSYVG 1603 ACI16 088.1
    72 1 MASERNVIRUSSTA MM EDMONSTON TTEDKISRAVGPRQA 1604 P0485 1.1
    72 2 MASERNVIRUSSTA MM EDMONSTON TTEDKISRAVGPRQAQVSFL 1605 P0485 1.1
    72 3 RÖTELNVIRUSSTA MM M33 TTERIETRSARHP 1606 ABD64 214.1
    72 4 MASERNVIRUSSTA MM EDMONSTON TTNQAIEAIRQAGQE 1607 P6935 3.1
    72 5 RÖTELNVIRUS TTSDPWHPPGPLGLK 1608 BAA28 178.1
    72 6 MASERNVIRUSSTA MM EDMONSTON TVCSQNALYPMSPLL 1609 P6935 3.1
    72 7 RÖTELNVIRUS TVNGEDVGAVPPGKF 1610 BAA28 178.1
    72 8 MASERN-MORBILLIVIRUS TYPVEKPNLSSKRSE 1611 P0683 0.1
    72 9 RÖTELNVIRUS VAGVSCNVTTEHPFC 1612 BAA28 178.1
    73 0 BORDETELLA PERTUSSIS VAPGIVIPPKALFTQQGGAYGRC 1613 P0497 9.1
    73 1 RÖTELNVIRUS VCHTKHMDFWCVEHDRPPPATPTPL 1614 NP_74 0663. 1
    73 2 RÖTELNVIRUS VCQRHSPDCSRLVGATPER 1615 BAA19 893.1
    73 3 RÖTELNVIRUS VDADDPLL 1616 CAJ88 851.1
    73 4 RÖTELNVIRUS VDADDPLLRTAPGPGEVWVT 1617 BAA19 893.1
    73 5 CORYNEBACTERIU M DIPHTHERIAE VDIGFAAYNFVESIINLFQV 1618 AAV70 486.1
    73 6 MASERNVIRUSSTA MM EDMONSTON VEIAEYRRLLRTVLE 1619 P6935 3.1
    73 7 MASERNVIRUSSTA MM EDMONSTON VELENSMGGLNFGRS 1620 P0485 1.1
    73 8 MASERNVIRUSSTA MM EDMONSTON VELENSMGGLNFGRSYFDPA 1621 P0485 1.1
    73 9 MASERN-MORBILLIVIRUS VELKIKIASGFGPLI 1622 P0683 0.1
    74 0 RÖTELNVIRUS VEMDEWIHAHTTSD 1623 SRC26 5968
    74 1 RÖTELNVIRUS VEMPEWIHAHTTSDP 1624 BAA28 178.1
    74 2 CORYNEBACTERIU M DIPHTHERIAE VERRLVKVL 1625 P3312 0.2
    74 3 MASERN-MORBILLIVIRUS VESPGQLI 1626 ABI54 110.1
    74 4 MASERNVIRUSSTA MM EDMONSTON VESPGQLIQRITDDP 1627 P0485 1.1
    74 5 MASERNVIRUSSTA MM EDMONSTON VESPGQLIQRITDDPDVSIR 1628 P0485 1.1
    74 6 RÖTELNVIRUS VFALASYVQHPHKTV 1629 BAA28 178.1
    74 7 RÖTELNVIRUS VGATPERP 1630 CAJ88 851.1
    74 8 RÖTELNVIRUS VGATPERPRL 1631 BAA19 893.1
    74 9 RÖTELNVIRUS VGATPERPRLRLVDA 1632 BAA28 178.1
    75 0 MASERNVIRUSSTA MM EDMONSTON VGIGSASYKVMTRSS 1633 P6935 3.1
    75 1 MASERNVIRUSSTA MM EDMONSTON VGLRTPQRFTDLVKF 1634 P0836 2.1
    75 2 CORYNEBACTERIU M DIPHTHERIAE VHHNTEEIVAQSIALSSLMV 1635 AAV70 486.1
    75 3 MASERNVIRUSSTA MM EDMONSTON VHRLEGVSYNIGSQE 1636 P6935 3.1
    75 4 RÖTELNVIRUS VIGSQARK 1637 CAJ88 851.1
    75 5 BORDETELLA PERTUSSIS VITGSI 1638 ACI16 088.1
    75 6 BORDETELLA PERTUSSIS VITGTI 1639 ACI16 083.1
    75 7 MASERNVIRUSSTA MM EDMONSTON VKQSRGEA 1640 P0485 1.1
    75 8 MASERNVIRUSSTA MM EDMONSTON VLFVMFLSLI 1641 P0836 2.1
    75 9 MASERN-MORBILLIVIRUS VLFVMFLSLIGLLAI 1642 P0683 0.1
    76 0 MASERN-MORBILLIVIRUS VLTPLFKIIGDEVGL 1643 P0683 0.1
    76 1 MASERNVIRUSSTA MM EDMONSTON VMTRSSHQSLVIKLM 1644 P6935 3.1
    76 2 RÖTELNVIRUS VPAAPCARIWNGTQR 1645 BAA28 178.1
    76 3 RÖTELNVIRUS VPPDPGDLVEYIMNY 1646 BAA28 178.1
    76 4 MASERNVIRUSSTA MM EDMONSTON VQSVASSRRHKRFAG 1647 P6935 3.1
    76 5 BORDETELLA PERTUSSIS VQTGGTSRTVTMRYLAS 1648 ACI16 083.1
    76 6 BORDETELLA PERTUSSIS VQVRI 1649 ACI16 083.1
    76 7 RÖTELNVIRUS VRAYNQPAGDV 1650 NP_74 0662. 1
    76 8 RÖTELNVIRUS VRFESKIVDGGCFAP 1651 BAA28 178.1
    76 9 RÖTELNVIRUS VRLAGVRFESKIVDG 1652 BAA28 178.1
    77 0 MASERNVIRUSSTA MM EDMONSTON VSGSFGNRFILSQGN 1653 P6935 3.1
    77 1 BORDETELLA PERTUSSIS VSKEEQYYDYEDAT 1654 AAA83 981.1
    77 2 MASERNVIRUSSTA MM EDMONSTON VSKGNCSGPTTIRGQ 1655 P0836 2.1
    77 3 RÖTELNVIRUS VTAALLNTPPPYQVS 1656 BAA28 178.1
    77 4 RÖTELNVIRUS VTGCYQCGTPALVEG 1657 BAA28 178.1
    77 5 RÖTELNVIRUS VTPVIGSQ 1658 CAJ88 851.1
    77 6 RÖTELNVIRUSSTA MM THERIEN VTTEHPFCNTPHGQLEVQVPPD 1659 P0756 6.1
    77 7 MASERNVIRUSSTA MM EDMONSTON VVLAGAALGVATAAQ 1660 P6935 3.1
    77 8 RÖTELNVIRUS VWQLSVAGVSCNVTT 1661 BAA28 178.1
    77 9 RÖTELNVIRUS VWVTPVIG 1662 CAJ88 851.1
    78 0 RÖTELNVIRUS VWVTPVIGSQAR 1663 BAA19 893.1
    78 1 MASERNVIRUSSTA MM EDMONSTON VYILIAVCLGGLIGI 1664 P6935 3.1
    78 2 MASERNVIRUSSTA MM EDMONSTON VYLHRIDLGPPISLE 1665 P6935 3.1
    78 3 BORDETELLA PERTUSSIS VYRYDSRP 1666 P0497 7.1
    78 4 BORDETELLA PERTUSSIS VYRYDSRPPEDV 1667 P0497 7.1
    78 5 MASERN-MORBILLIVIRUS VYWLTIPPMKNLALG 1668 P0683 0.1
    78 6 RÖTELNVIRUS WDLEATGACICEIPT 1669 BAA28 178.1
    78 7 MASERN-MORBILLIVIRUS WDQKLWCRHFCVLAD 1670 AAR89 413.1
    78 8 RÖTELNVIRUS WGFPTDTVMSVFALA 1671 BAA28 178.1
    78 9 RÖTELNVIRUS WHPPGPLGLKFKTVR 1672 BAA28 178.1
    79 0 RÖTELNVIRUS WIHAHTTSDPWHPPG 1673 BAA28 178.1
    79 1 MASERNVIRUSSTA MM EDMONSTON WLTIPPMKNLALGVI 1674 P0836 2.1
    79 2 MASERNVIRUSSTA MM EDMONSTON WQESRKNKAQTRTPLQCTMT 1675 P0485 1.1
    79 3 RÖTELNVIRUS WVCIFMVCRRACR 1676 SRC26 5968
    79 4 RÖTELNVIRUS WVTPVIGS 1677 CAJ88 851.1
    79 5 MASERNVIRUSSTA MM EDMONSTON WYTTVPKYVATQGYL 1678 P6935 3.1
    79 6 MASERNVIRUSSTA MM EDMONSTON YALGGDINKVLEKLG 1679 P6935 3.1
    79 7 MASERNVIRUSSTA MM EDMONSTON YAMGVGVELE 1680 P0485 1.1
    79 8 MASERN-MORBILLIVIRUS YAMGVGVELEN 1681 ABI54 110.1
    79 9 MASERN-MORBILLIVIRUS YCADVAAEELMNALV 1682 AAR89 413.1
    80 0 MASERN-MORBILLIVIRUS YDFRDLTWCINPPER 1683 P0683 0.1
    80 1 BORDETELLA PERTUSSIS YFEPGPT 1684 ACI16 083.1
    80 2 RÖTELNVIRUS YFNPGGSYYKQYHPT 1685 BAA28 178.1
    80 3 MASERNVIRUSSTA MM EDMONSTON YFRLGQEMVRRSAGK 1686 P0485 1.1
    80 4 MASERNVIRUSSTA MM EDMONSTON YFRLGQEMVRRSAGKVSSTL 1687 P0485 1.1
    80 5 MASERN-MORBILLIVIRUS YFYPFRLPIKGVPIE 1688 P0683 0.1
    80 6 BORDETELLA PERTUSSIS YGDNAGRILAGALAT 1689 P0497 7.1
    80 7 RUBELLA VIRUS YGHATVEMPEWIHAH 1690 BAA28 178.1
    80 8 RÖTELNVIRUS YIMNYTGNQQSRWGL 1691 BAA28 178.1
    80 9 MASERNVIRUSSTA MM EDMONSTON YINNELIPSMNQLSC 1692 P6935 3.1
    81 0 RÖTELNVIRUS YLCTAPGCATQAPVP 1693 BAA28 178.1
    81 1 MASERN-MORBILLIVIRUS YLFTVPIKEAGEDCH 1694 P0683 0.1
    81 2 MASERNVIRUSSTA MM EDMONSTON YLHDPEFNL 1695 ABK40 531.1
    81 3 MASERNVIRUSSTA MM EDMONSTON YLNMSRLFV 1696 ABK40 531.1
    81 4 MASERNVIRUSSTA MM HALLE YPALGLHEF 1697 P1005 0.1
    81 5 MASERN-MORBILLIVIRUS YPALGLHEFA 1698 ABI54 110.1
    81 6 MASERNVIRUSSTA MM EDMONSTON YPALGLHEFAGELST 1699 P0485 1.1
    81 7 MASERNVIRUSSTA MM EDMONSTON YPALGLHEFAGELSTLESLM 1700 P0485 1.1
    81 8 MASERNVIRUSSTA MM EDMONSTON YPFRLPIKGVPIELQ 1701 P0836 2.1
    81 9 MASERNVIRUSSTA MM HALLE YPLLWSYAM 1702 P1005 0.1
    82 0 MUMPS-RUBULAVIRUS YQQQGRL 1703 P2118 6.1
    82 1 BORDETELLA PERTUSSIS YQSEYLAHRR 1704 P0497 7.1
    82 2 MASERNVIRUSSTA MM EDMONSTON YRETGPSRASDARAA 1705 P0485 1.1
    82 3 MASERNVIRUSSTA MM EDMONSTON YRETGPSRASDARAAHLPTG 1706 P0485 1.1
    82 4 RÖTELNVIRUS YRNASDVLPGHWLQGGWGCYNLSDW 1707 NP_74 0663. 1
    82 5 MASERNVIRUSSTA MM EDMONSTON YRRLLRTVLEPIRDA 1708 P6935 3.1
    82 6 BORDETELLA PERTUSSIS YRYDSRPP 1709 P0497 7.1
    82 7 MASERNVIRUSSTA MM EDMONSTON YSGGDLLGILESRGI 1710 P6935 3.1
    82 8 BORDETELLA PERTUSSIS YSKVTATBLLASTNSRLCAVFVRDG 1711 SRC28 0066
    82 9 MASERNVIRUSSTA MM EDMONSTON YSPSRSFSYFYPFRL 1712 P0836 2.1
    83 0 RÖTELNVIRUSSTA MM THERIEN YTGNQQSRWGLGSPNCHGPDWASPV 1713 P0756 6.1
    83 1 MASERN-MORBILLIVIRUS YVLLAVLFV 1714 P0836 2.1
    83 2 MASERN-MORBILLIVIRUS YVYSPGRSFSYFYPF 1715 P0683 0.1
    83 3 BORDETELLA PERTUSSIS YYDYEDATFQTYALTGISLCNPAASIC 1716 P0497 9.1
    83 4 MASERN-MORBILLIVIRUS GDLLGILESRGIKAR 1717 AAF02 706.1
    83 5 MASERN-MORBILLIVIRUS TVPKYVATQGYLISN 1718 AAL29 688.1
    83 6 MASERN-MORBILLIVIRUS KPWDSPQEI 1719 P2603 5.1
    83 7 MASERN-MORBILLIVIRUS KPWESPQEI 1720 CAA34 579.1
    83 8 BORDETELLA PERTUSSIS ATYQSEYLAHRRIPP 1721 ACI04 548.1
    83 9 BORDETELLA PERTUSSIS CMARQAESSEAMAAWSERAGEAMVLVYY ESIAYSF 1722 ACI04 548.1
    84 0 BORDETELLA PERTUSSIS CQVGSSNSAFVSTSSSRRYTEVYL 1723 ACI04 548.1
    84 1 BORDETELLA PERTUSSIS DDPPATVYRYDSRPP 1724 ACI04 548.1
    84 2 BORDETELLA PERTUSSIS GALATYQSEYLAHRRIPP 1725 ACI04 548.1
    84 3 BORDETELLA PERTUSSIS MAAWSERAGEAMVLVYYESIAYSF 1726 ACI04 548.1
    84 4 BORDETELLA PERTUSSIS MVLVYYESIAYSF 1727 ACI04 548.1
    84 5 BORDETELLA PERTUSSIS PATVYRYDSRPPEDV 1728 ACI04 548.1
    84 6 BORDETELLA PERTUSSIS YDSRPPEDV 1729 ACI04 548.1
    84 7 BORDETELLA PERTUSSIS EPGITTNYDT 1730 ACI16 087.1
    84 8 BORDETELLA PERTUSSIS GDLRAYKMVYATNPQTQLSN 1731 ACI16 083.1
    84 9 BORDETELLA PERTUSSIS KNGDVEASAITTYVGFSVVYP 1732 ACI16 083.1
    85 0 BORDETELLA PERTUSSIS KVTNGSKSYTLRYLASYVK 1733 ACI16 088.1
    85 1 BORDETELLA PERTUSSIS QALGALKLYFEPGITTNYDTGDLIAYKQ TYNASGN 1734 ACI16 088.1
    85 2 BORDETELLA PERTUSSIS YATNPQTQLS 1735 ACI16 083.1
    85 3 CORYNEBACTERIU M DIPHTHERIAE DNENPLSGKAGGVVKVTYPGLTKV 1736 AAV70 486.1
    85 4 CORYNEBACTERIU M DIPHTHERIAE ENFSSYHGTKPGYVDSI 1737 AAV70 486.1
    85 5 CORYNEBACTERIU M DIPHTHERIAE KVDNAETIKKELGLSLTEP 1738 AAV70 486.1
    85 6 RÖTELNVIRUSSTA MM M33 MEDLQKALEAQSRALRAGLAA 1739 CAA28 880.1
    85 7 CORYNEBACTERIU M DIPHTHERIAE QKGIQKPKSGTQGNYDDDWKGFY 1740 AAV70 486.1
    85 8 RÖTELNVIRUSSTA MM M33 RTGAWQRKDWSRAPPPPEERQESRSQTP APKPSR 1741 CAA28 880.1
    85 9 RÖTELNVIRUS AAGASQSRRPRPPRHARAQHLPEMTPAV T 1742 SRC26 5968
    86 0 RÖTELNVIRUS CVTSWLWSEGEGAVFYRVDLHFINLGTP 1743 CAA28 880.1
    86 1 RÖTELNVIRUS FRVGGTRWHRLLRMPVRGLDGDTAPLP 1744 CAA28 880.1
    86 2 CORYNEBACTERIU M DIPHTHERIAE GRKIRMRCRAIDGDVTFCRPKSPVYVGN 1745 10072 16A
    86 3 RÖTELNVIRUS GTPPLDEDGRWDPALMYNPCGPEPPAHV 1746 CAA28 880.1
    86 4 CORYNEBACTERIU M DIPHTHERIAE GVHANLHVAFHRSSSEKIHSNEISSDSI GVLGYQKTVDHTKVNSKLSLFFEIKS 1747 AAV70 486.1
    86 5 RÖTELNVIRUS MASTTPITMEDLQKALEAQSRALRAGLA AG 1748 ABD64 200.1
    86 6 RÖTELNVIRUS PELGPPTNPFQAAVARGLRPPLHDPDTE APTEAC 1749 CAA28 880.1
    86 7 RÖTELNVIRUS PLPPHTTERIETRSARHPWRIRFGAP 1750 CAA28 880.1
    86 8 RÖTELNVIRUS SRAPPPPEERQESRSQTPAPKPSRAPP 1751 CAA28 880.1
    86 9 RÖTELNVIRUS SRAPPQQPQPPRMQTGRGGSAPRPELGP 1752 CAA28 880.1
    87 0 RÖTELNVIRUS TPAVTPEGPAPPRTGAWQRKDWSRAPP 1753 CAA28 880.1
    87 1 RÖTELNVIRUS VRAYNQPAGDVRGVWGKGERTYAEQDFR V 1754 CAA28 880.1
    87 2 RÖTELNVIRUS AFGHSDAACWGFPTDTVMSV 1755 CAA28 880.1
    87 3 RÖTELNVIRUS CARIWNGTQRACTFWAVNAYS 1756 CAA28 880.1
    87 4 RÖTELNVIRUS EEAFTYLCTAPGCATQTPVPVR 1757 CAA28 880.1
    87 5 RÖTELNVIRUS FAPWDLEATGACICEIPTDV 1758 CAA28 880.1
    87 6 RÖTELNVIRUS GEDVGAFPPGKFVTAAL 1759 CAA28 880.1
    87 7 RÖTELNVIRUS GEVWVTPVIGSQARKCGLHI 1760 CAA28 880.1
    87 8 RÖTELNVIRUS GQLEVQVPPDPGDLVEYIMN 1761 CAA28 880.1
    87 9 RÖTELNVIRUS GSYYKQYHPTACEVEPAFGH 1762 CAA28 880.1
    88 0 RÖTELNVIRUS IHAHTTSDPWHPPGPLGLKF 1763 CAA28 880.1
    88 1 RÖTELNVIRUS IMNYTGNQQSRWGLGSPNCH 1764 CAA28 880.1
    88 2 RÖTELNVIRUS LHIRAGPYGHATVEMPEWIH 1765 CAA28 880.1
    88 3 RÖTELNVIRUS LKFKTVRPVALPRALAPPRN 1766 CAA28 880.1
    88 4 RÖTELNVIRUS LNTPPPYQVSCGGESDRASAGH 1767 CAA28 880.1
    88 5 RÖTELNVIRUS NCHGPDWASPVCQRHSPDCS 1768 CAA28 880.1
    88 6 RÖTELNVIRUS PDCSRLVGATPERPRLRLVD 1769 CAA28 880.1
    88 7 RÖTELNVIRUS PRNVRVTGCYQCGTPALVEG 1770 CAA28 880.1
    88 8 RÖTELNVIRUS PTDVSCEGLGAWVPTAPCARI 1771 CAA28 880.1
    88 9 RÖTELNVIRUS RLVDADDPLLRTAPGPGEVW 1772 CAA28 880.1
    89 0 RÖTELNVIRUS SVFALASYVQHPHKTVRVKF 1773 CAA28 880.1
    89 1 RÖTELNVIRUS VEGLAPGGGNCHLTVNGEDV 1774 CAA28 880.1
    89 2 RÖTELNVIRUS VKFHTETRTVWQLSVAGVSC 1775 CAA28 880.1
    89 3 RÖTELNVIRUS VPVRLAGVGFESKIVDGGCF 1776 CAA28 880.1
    89 4 RÖTELNVIRUS VSCNVTTEHPFCNTPHGQLE 1777 CAA28 880.1
    89 5 BORDETELLA PERTUSSIS AAASSPDAHVPF 1778 AAA22 983.1
    89 6 BORDETELLA PERTUSSIS AASSPDA 1779 AAA22 983.1
    89 7 BORDETELLA PERTUSSIS AKLGAAASSPDA 1780 AAA22 983.1
    89 8 BORDETELLA PERTUSSIS AMKPYEVTPTRM 1781 AAA22 983.1
    89 9 BORDETELLA PERTUSSIS AMTHLSPALADVPYVLVKTNMVVTS 1782 AAA22 983.1
    90 0 BORDETELLA PERTUSSIS ASSPDAHVPFCF 1783 AAA22 983.1
    90 1 BORDETELLA PERTUSSIS ASSPDAHVPFCFGKDLKRPGSSPME 1784 AAA22 983.1
    90 2 BORDETELLA PERTUSSIS CFGKDLKRPGSS 1785 AAA22 983.1
    90 3 BORDETELLA PERTUSSIS CFGKDLKRPGSSPMEVMLRAVFMQQ 1786 AAA22 983.1
    90 4 BORDETELLA PERTUSSIS CGIAAKLGAAAS 1787 AAA22 983.1
    90 5 BORDETELLA PERTUSSIS CGIAAKLGAAASSPDAHVPFCFGKD 1788 AAA22 983.1
    90 6 BORDETELLA PERTUSSIS DAHVPFCFGKDL 1789 AAA22 983.1
    90 7 BORDETELLA PERTUSSIS DLKRPGSSPMEV 1790 AAA22 983.1
    90 8 BORDETELLA PERTUSSIS DVPYVLVKTNMV 1791 AAA22 983.1
    90 9 BORDETELLA PERTUSSIS DVPYVLVKTNMVVTSVAMKPYEVTPT 1792 AAA22 983.1
    91 0 BORDETELLA PERTUSSIS EVMLRAVFMQQR 1793 AAA22 983.1
    91 1 BORDETELLA PERTUSSIS FEGKPALELIRM 1794 AAA22 983.1
    91 2 BORDETELLA PERTUSSIS FLGPKQLTFEGK 1795 AAA22 983.1
    91 3 BORDETELLA PERTUSSIS FLGPKQLTFEGKPALELIRMVECSG 1796 AAA22 983.1
    91 4 BORDETELLA PERTUSSIS FMQQRPLRMFLGPKQLT 1797 AAA22 983.1
    91 5 BORDETELLA PERTUSSIS GKDLKRPGSSPM 1798 AAA22 983.1
    91 6 BORDETELLA PERTUSSIS GKDLKRPGSSPME 1799 AAA22 983.1
    91 7 BORDETELLA PERTUSSIS GKPALELIRMVE 1800 AAA22 983.1
    91 8 BORDETELLA PERTUSSIS GPKQLTFEGKPA 1801 AAA22 983.1
    91 9 BORDETELLA PERTUSSIS HVPFCFGKDLKR 1802 AAA22 983.1
    92 0 BORDETELLA PERTUSSIS IAAKLGAAASSP 1803 AAA22 983.1
    92 1 BORDETELLA PERTUSSIS KPYEVTPTRMLV 1804 AAA22 983.1
    92 2 BORDETELLA PERTUSSIS KQLTFEGKPALE 1805 AAA22 983.1
    92 3 BORDETELLA PERTUSSIS KRPGSSPMEVML 1806 AAA22 983.1
    92 4 BORDETELLA PERTUSSIS LELIRMVECSGK 1807 AAA22 983.1
    92 5 BORDETELLA PERTUSSIS LGAAASSPDAHV 1808 AAA22 983.1
    92 6 BORDETELLA PERTUSSIS LIRMVECSGKQD 1809 AAA22 983.1
    92 7 BORDETELLA PERTUSSIS LVCGIAAKLGAA 1810 AAA22 983.1
    92 8 BORDETELLA PERTUSSIS MKPYEVTPTRM 1811 AAA22 983.1
    92 9 BORDETELLA PERTUSSIS MLRAVFMQQRPL 1812 AAA22 983.1
    93 0 BORDETELLA PERTUSSIS MQQRPLRM 1813 AAA22 983.1
    93 1 BORDETELLA PERTUSSIS MQQRPLRMFLGP 1814 AAA22 983.1
    93 2 BORDETELLA PERTUSSIS MVVTSVAMKPYE 1815 AAA22 983.1
    93 3 BORDETELLA PERTUSSIS MVVTSVAMKPYEVTPTRMLVCGIAA 1816 AAA22 983.1
    93 4 BORDETELLA PERTUSSIS PALELIRMVECS 1817 AAA22 983.1
    93 5 BORDETELLA PERTUSSIS PALELIRMVECSGK 1818 AAA22 983.1
    93 6 BORDETELLA PERTUSSIS PFCFGKDLKRPG 1819 AAA22 983.1
    93 7 BORDETELLA PERTUSSIS PGSSPMEVMLRA 1820 AAA22 983.1
    93 8 BORDETELLA PERTUSSIS PGSSPMEVMLRAVF 1821 AAA22 983.1
    93 9 BORDETELLA PERTUSSIS PKQLTFEGK 1822 AAA22 983.1
    94 0 BORDETELLA PERTUSSIS PLRMFLGPKQLT 1823 AAA22 983.1
    94 1 BORDETELLA PERTUSSIS PTRMLVCGIAAK 1824 AAA22 983.1
    94 2 BORDETELLA PERTUSSIS PYVLVKTNMVVT 1825 AAA22 983.1
    94 3 BORDETELLA PERTUSSIS QLTFEGKPALELIRMVECSGKQDCP 1826 AAA22 983.1
    94 4 BORDETELLA PERTUSSIS QRPLRMFLGPKQ 1827 AAA22 983.1
    94 5 BORDETELLA PERTUSSIS RAVFMQQRPLRM 1828 AAA22 983.1
    94 6 BORDETELLA PERTUSSIS RMFLGPKQLTFE 1829 AAA22 983.1
    94 7 BORDETELLA PERTUSSIS RMLVCGIAAKLG 1830 AAA22 983.1
    94 8 BORDETELLA PERTUSSIS RMVECSGKQDCP 1831 AAA22 983.1
    94 9 BORDETELLA PERTUSSIS SPDAHVPFCFGK 1832 AAA22 983.1
    95 0 BORDETELLA PERTUSSIS SSPMEVMLRAVF 1833 AAA22 983.1
    95 1 BORDETELLA PERTUSSIS SSPMEVMLRAVFMQQRPLRMFLGPK 1834 AAA22 983.1
    95 2 BORDETELLA PERTUSSIS SVAMKPYEVTPT 1835 AAA22 983.1
    95 3 BORDETELLA PERTUSSIS VECSGKQDCP 1836 AAA22 983.1
    95 4 BORDETELLA PERTUSSIS VFMQQRPLRMFL 1837 AAA22 983.1
    95 5 BORDETELLA PERTUSSIS VFMQQRPLRMFLGPKQLTFEGKPAL 1838 AAA22 983.1
    95 6 BORDETELLA PERTUSSIS VKTNMVVTSVAM 1839 AAA22 983.1
    95 7 BORDETELLA PERTUSSIS VLVKTNMVVTSV 1840 AAA22 983.1
    95 8 BORDETELLA PERTUSSIS VTPTRMLVCGIA 1841 AAA22 983.1
    95 9 BORDETELLA PERTUSSIS VTSVAMKPYEVT 1842 AAA22 983.1
    96 0 BORDETELLA PERTUSSIS YEVTPTRMLVCG 1843 AAA22 983.1
    96 1 BORDETELLA PERTUSSIS YEVTPTRMLVCGIAAKLGAAASSPD 1844 AAA22 983.1
    96 2 BORDETELLA PERTUSSIS CASPYEGRYRDMYDALR 1845 P0497 9.1
    96 3 BORDETELLA PERTUSSIS CAVFVRDGQSV 1846 P0497 9.1
    96 4 BORDETELLA PERTUSSIS CITTIYKTG 1847 P0497 9.1
    96 5 BORDETELLA PERTUSSIS CPNGTRALTV 1848 P0497 9.1
    96 6 BORDETELLA PERTUSSIS DALRRLLYMIYMSG 1849 P0497 9.1
    96 7 RÖTELNVIRUSSTA MM THERIEN GNRGRGQRRDWSRAPPPPEERQETRS 1850 P0756 6.1
    96 8 BORDETELLA PERTUSSIS GQPAADHYYSKVT 1851 P0497 9.1
    96 9 RÖTELNVIRUS GSPNCHGPDWASPVCQRHS 1852 ABD64 214.1
    97 0 MASERNVIRUSSTA MM EDMONSTON HKSLSTNLDVTNSIEHQ 1853 P0836 2.1
    97 1 BORDETELLA PERTUSSIS LFTQQGGAYGRC 1854 P0497 9.1
    97 2 MASERNVIRUSSTA MM EDMONSTON LIGLLAIAGIRLHRAAIYTAEI 1855 P0836 2.1
    97 3 MASERN-MORBILLIVIRUS PDTAADSELRRWIKY 1856 ABI54 110.1
    97 4 RÖTELNVIRUSSTA MM THERIEN PNCHGPDWASPVCQRHS 1857 P0756 6.1
    97 5 RÖTELNVIRUS QTPAPKPSRAPPQQPQPPRMQTGR 1858 ABD64 216.1
    97 6 RÖTELNVIRUS-IMPFSTAMM RA27/3 RAGLTAGASQSRRPRPPR 1859 CAA33 016.1
    97 7 RÖTELNVIRUS-IMPFSTAMM RA27/3 RFGAPQAFLAGLLLAAVAVGTARA 1860 ABD64 214.1
    97 8 BORDETELLA PERTUSSIS RGNAELQTYLRQITPG 1861 P0497 9.1
    97 9 BORDETELLA PERTUSSIS RVHVSKEEQYYDYED 1862 P0497 9.1
    98 0 BORDETELLA PERTUSSIS SIYGLYDGTYL 1863 P0497 9.1
    98 1 BORDETELLA PERTUSSIS SKVTATRLLASTNS 1864 P0497 9.1
    98 2 BORDETELLA PERTUSSIS TQQGGAYGRCPNGTRA 1865 P0497 9.1
    98 3 BORDETELLA PERTUSSIS VAPGIVIPPKAL 1866 P0497 9.1
    98 4 BORDETELLA PERTUSSIS DSRPPEDVFQNGFTAWG 1867 ACI04 548.1
    98 5 BORDETELLA PERTUSSIS EHRMQEAVEAERAGR 1868 ACI04 548.1
    98 6 MASERNVIRUSSTA MM EDMONSTON ETCFQQACKGKIQALCENPEWA 1869 P0836 2.1
    98 7 BORDETELLA PERTUSSIS EYVDTYGDNAGRILAGALATYQ 1870 ACI04 548.1
    98 8 BORDETELLA PERTUSSIS HRRIPPENIRRVTR 1871 ACI04 548.1
    98 9 BORDETELLA PERTUSSIS MARQAESSE 1872 ACI04 548.1
    99 0 BORDETELLA PERTUSSIS MQEAVEAERAGR 1873 ACI04 548.1
    99 1 BORDETELLA PERTUSSIS SQQTRANPNPYTSRR 1874 ACI04 548.1
    99 2 BORDETELLA PERTUSSIS TRANPNPYTSRRSVASIVGTLVHG 1875 SRC28 0066
    99 3 BORDETELLA PERTUSSIS TVYRYDSRPPED 1876 ACI04 548.1
    99 4 MASERN-MORBILLIVIRUS NDRNLLD 1877 P1005 0.1
    99 5 MASERN-MORBILLIVIRUS NMEDEADQYFSHDDPISSDQSRFGWFEN K 1878 P0485 1.1
    99 6 MASERN-MORBILLIVIRUS SRASDARAAHLPTGTPLDID 1879 P0485 1.1
    99 7 BORDETELLA PERTUSSIS EDVFQNGFTAW 1880 ACI04 548.1
    99 8 CORYNEBACTERIU M DIPHTHERIAE AEGSSSVEYINNWEQAK 1881 AAV70 486.1
    99 9 CORYNEBACTERIU M DIPHTHERIAE GPIKNKMSESPNKT 1882 AAV70 486.1
    10 00 MASERNVIRUSSTA MM HALLE GPKLTGALIGILSLFVESPGQLIQRITD DPDV 1883 P1005 0.1
    10 01 CORYNEBACTERIU M DIPHTHERIAE GYQKTVDHTKVNSK 1884 AAV70 486.1
    10 02 CORYNEBACTERIU M DIPHTHERIAE KTVDH 1885 AAV70 486.1
    10 03 CORYNEBACTERIU M DIPHTHERIAE SESPNK 1886 AAV70 486.1
    10 04 CORYNEBACTERIU M DIPHTHERIAE AEGSSSVEYINNWEQAKALS 1887 AAV70 486.1
    10 05 CORYNEBACTERIU M DIPHTHERIAE AQAIPLVGELVDIGFAAYNF 1888 AAV70 486.1
    10 06 CORYNEBACTERIU M DIPHTHERIAE ASRVVLSLPFAEGSSSVEYI 1889 AAV70 486.1
    10 07 CORYNEBACTERIU M DIPHTHERIAE CINLDWDVIRDKTKTKIESL 1890 AAV70 486.1
    10 08 CORYNEBACTERIU M DIPHTHERIAE CRAIDGDVTFCRPKSPVYVG 1891 AAV70 486.1
    10 09 CORYNEBACTERIU M DIPHTHERIAE CRPKSPVYVGNGVHANLHVA 1892 AAV70 486.1
    10 10 CORYNEBACTERIU M DIPHTHERIAE DAAGYSVDNENPLSGKAGGV 1893 AAV70 486.1
    10 11 CORYNEBACTERIU M DIPHTHERIAE DKTKTKIESLKEHGPIKNKM 1894 AAV70 486.1
    10 12 CORYNEBACTERIU M DIPHTHERIAE EEFIKRFGDGASRVVLSLPF 1895 AAV70 486.1
    10 13 CORYNEBACTERIU M DIPHTHERIAE EKAKQYLEEFHQTALEHPEL 1896 AAV70 486.1
    10 14 CORYNEBACTERIU M DIPHTHERIAE FHRSSSEKIHSNEISSDSIG 1897 AAV70 486.1
    10 15 CORYNEBACTERIU M DIPHTHERIAE GADDVVDSSKSFVMENFSSY 1898 CAE11 230.1
    10 16 CORYNEBACTERIU M DIPHTHERIAE GKRGQDAMYEYMAQACAGNR 1899 AAV70 486.1
    10 17 CORYNEBACTERIU M DIPHTHERIAE GSVMGIADGAVHHNTEEIVA 1900 AAV70 486.1
    10 18 CORYNEBACTERIU M DIPHTHERIAE GTQGNYDDDWKGFYSTDNKY 1901 AAV70 486.1
    10 19 CORYNEBACTERIU M DIPHTHERIAE HDGYAVSWNTVEDSIIRTGF 1902 AAV70 486.1
    10 20 CORYNEBACTERIU M DIPHTHERIAE HGTKPGYVDSIQKGIQKPKS 1903 AAV70 486.1
    10 21 CORYNEBACTERIU M DIPHTHERIAE HQTALEHPELSELKTVTGTN 1904 AAV70 486.1
    10 22 CORYNEBACTERIU M DIPHTHERIAE IQKGIQKPKSGTQGNYDDDW 1905 AAV70 486.1
    10 23 CORYNEBACTERIU M DIPHTHERIAE KEHGPIKNKMSESPNKTVSE 1906 AAV70 486.1
    10 24 CORYNEBACTERIU M DIPHTHERIAE KGFYSTDNKYDAAGYSVDNE 1907 AAV70 486.1
    10 25 CORYNEBACTERIU M DIPHTHERIAE LDVNKSKTHISVNGRKIRMR 1908 AAV70 486.1
    10 26 RÖTELNVIRUS MASTIPITMEDLQKALEA 1909 SRC26 5968
    10 27 CORYNEBACTERIU M DIPHTHERIAE NGVHANLHVAFHRSSSEKIH 1910 AAV70 486.1
    10 28 CORYNEBACTERIU M DIPHTHERIAE NNWEQAKALSVELEINFETR 1911 AAV70 486.1
    10 29 CORYNEBACTERIU M DIPHTHERIAE NPLSGKAGGVVKVTYPGLTK 1912 AAV70 486.1
    10 30 CORYNEBACTERIU M DIPHTHERIAE PVFAGANYAAWAVNVAQVID 1913 AAV70 486.1
    10 31 CORYNEBACTERIU M DIPHTHERIAE SELKTVTGTNPVFAGANYAA 1914 AAV70 486.1
    10 32 CORYNEBACTERIU M DIPHTHERIAE SESPNKTVSEEKAKQYLEEF 1915 AAV70 486.1
    10 33 CORYNEBACTERIU M DIPHTHERIAE SETADNLEKTTAALSILPGI 1916 AAV70 486.1
    10 34 CORYNEBACTERIU M DIPHTHERIAE SFVMENFSSYHGTKPGYVDS 1917 AAV70 486.1
    10 35 CORYNEBACTERIU M DIPHTHERIAE SNEISSDSIGVLGYQKTVDH 1918 AAV70 486.1
    10 36 CORYNEBACTERIU M DIPHTHERIAE SPGHKTQPFLHDGYAVSWNT 1919 AAV70 486.1
    10 37 CORYNEBACTERIU M DIPHTHERIAE SVNGRKIRMRCRAIDGDVTF 1920 AAV70 486.1
    10 38 CORYNEBACTERIU M DIPHTHERIAE TAALSILPGIGSVMGIADGA 1921 AAV70 486.1
    10 39 CORYNEBACTERIU M DIPHTHERIAE TAENTPLPIAGVLLPTIPGK 1922 AAV70 486.1
    10 40 CORYNEBACTERIU M DIPHTHERIAE TEPLMEQVGTEEFIKRFGDG 1923 AAV70 486.1
    10 41 CORYNEBACTERIU M DIPHTHERIAE TIKKELGLSLTEPLMEQVGT 1924 AAV70 486.1
    10 42 CORYNEBACTERIU M DIPHTHERIAE TKVNSKLSLFFEIKS 1925 AAV70 486.1
    10 43 CORYNEBACTERIU M DIPHTHERIAE VEDSIIRTGFQGESGHDIKI 1926 AAV70 486.1
    10 44 CORYNEBACTERIU M DIPHTHERIAE VELEINFETRGKRGQDAMYE 1927 AAV70 486.1
    10 45 CORYNEBACTERIU M DIPHTHERIAE VESIINLFQVVHNSYNRPAY 1928 AAV70 486.1
    10 46 CORYNEBACTERIU M DIPHTHERIAE VHNSYNRPAYSPGHKTQPFL 1929 AAV70 486.1
    10 47 CORYNEBACTERIU M DIPHTHERIAE VKVTYPGLTKVLALKVDNAE 1930 AAV70 486.1
    10 48 CORYNEBACTERIU M DIPHTHERIAE VLALKVDNAETIKKELGLSL 1931 AAV70 486.1
    10 49 CORYNEBACTERIU M DIPHTHERIAE VLGYQKTVDHTKVNSKLSLF 1932 AAV70 486.1
    10 50 CORYNEBACTERIU M DIPHTHERIAE VRRSVGSSLSCINLDWDVIR 1933 AAV70 486.1
    10 51 CORYNEBACTERIU M DIPHTHERIAE WAVNVAQVIDSETADNLEKT 1934 AAV70 486.1
    10 52 CORYNEBACTERIU M DIPHTHERIAE YMAQACAGNRVRRSVGSSLS 1935 AAV70 486.1
    10 53 BORDETELLA PERTUSSIS AKAPPAPKPAPQPGP 1936 AB077 783.1
    10 54 BORDETELLA PERTUSSIS APKPAPQPGP 1937 AB077 783.1
    10 55 BORDETELLA PERTUSSIS APKPAPQPGPQPPQP 1938 AB077 783.1
    10 56 MASERNVIRUSSTA MM EDMONSTON AQTRTPLQCTMTEIF 1939 P0485 1.1
    10 57 MASERNVIRUSSTA MM EDMONSTON ASRGTNMEDEADQYFSHDD 1940 P0485 1.1
    10 58 BORDETELLA PERTUSSIS ATIRR 1941 AB077 783.1
    10 59 BORDETELLA PERTUSSIS DNRAG 1942 AB077 783.1
    10 60 BORDETELLA PERTUSSIS EAPAPQPPAGRELSA 1943 AB077 783.1
    10 61 MASERNVIRUSSTA MM EDMONSTON EMVRRSAGKVSSTLASELGI 1944 P0485 1.1
    10 62 BORDETELLA PERTUSSIS GASEL 1945 AB077 783.1
    10 63 BORDETELLA PERTUSSIS GDALAGGAVP 1946 AAA22 980.1
    10 64 BORDETELLA PERTUSSIS GDAPAGGAVP 1947 AB077 783.1
    10 65 BORDETELLA PERTUSSIS GDTWDDD 1948 AB077 783.1
    10 66 BORDETELLA PERTUSSIS GERQH 1949 AB077 783.1
    10 67 BORDETELLA PERTUSSIS GGAVP 1950 AB077 783.1
    10 68 BORDETELLA PERTUSSIS GGFGP 1951 P1428 3.3
    10 69 BORDETELLA PERTUSSIS GGFGPGGFGP 1952 BAF35 031.1
    10 70 BORDETELLA PERTUSSIS GGFGPVLDGW 1953 AB077 783.1
    10 71 MASERNVIRUSSTA MM EDMONSTON GGKEDRRVKQSRGEARESYR 1954 P0485 1.1
    10 72 BORDETELLA PERTUSSIS GILLEN 1955 AB077 783.1
    10 73 BORDETELLA PERTUSSIS GIRRFL 1956 AB077 783.1
    10 74 MASERNVIRUSSTA MM EDMONSTON HDDPISSDQSRFGWFENKEI 1957 P0485 1.1
    10 75 MASERNVIRUSSTA MM EDMONSTON HEFAGELSTLESLMNLY 1958 P0485 1.1
    10 76 BORDETELLA PERTUSSIS HLGGLAGY 1959 AB077 783.1
    10 77 MASERNVIRUSSTA MM EDMONSTON HTTEDKISRAVGPRQAQVSFL 1960 P0485 1.1
    10 78 MASERNVIRUSSTA MM EDMONSTON ICDIDTYIVEAGLASFILTI 1961 P0485 1.1
    10 79 MASERNVIRUSSTA MM EDMONSTON IIIVPIPGDSSITTRSRLLD 1962 P0485 1.1
    10 80 MASERNVIRUSSTA MM EDMONSTON ILDIKRTPGNKPRIAEMICD 1963 P0485 1.1
    10 81 BORDETELLA PERTUSSIS KALLYR 1964 AB077 783.1
    10 82 MASERNVIRUSSTA MM EDMONSTON KPPITSGSGGAIRGIKHIII 1965 P0485 1.1
    10 83 BORDETELLA PERTUSSIS LAGSGL 1966 AB077 783.1
    10 84 MASERNVIRUSSTA MM EDMONSTON LGITAEDARLVSEIAMHTTE 1967 P0485 1.1
    10 85 MASERNVIRUSSTA MM EDMONSTON LGTILAQIWVLLAKAVTA 1968 P0485 1.1
    10 86 MASERNVIRUSSTA MM EDMONSTON LPTGTPLDIDTASESSQD 1969 P0485 1.1
    10 87 MASERNVIRUSSTA MM EDMONSTON MATLLRSLALFKRNKDK 1970 P0485 1.1
    10 88 BORDETELLA PERTUSSIS PAPQPP 1971 AB077 783.1
    10 89 MASERNVIRUSSTA MM EDMONSTON PDTAADSELRRWIKYTQQRR 1972 P0485 1.1
    10 90 MASERNVIRUSSTA MM EDMONSTON PKLTGALIGILSLFVESPGQ 1973 P0485 1.1
    10 91 BORDETELLA PERTUSSIS PQP 1974 AB077 783.1
    10 92 BORDETELLA PERTUSSIS PQPGP 1975 AB077 783.1
    10 93 BORDETELLA PERTUSSIS PQPGPQPPQPPQPQP 1976 AB077 783.1
    10 94 MASERNVIRUSSTA MM EDMONSTON QDPQDSRRSAEPLLSCKPWQ 1977 P0485 1.1
    10 95 MASERNVIRUSSTA MM EDMONSTON QRRVVGEFRLERKWLDVVR 1978 P0485 1.1
    10 96 BORDETELLA PERTUSSIS RELSA 1979 AB077 783.1
    10 97 BORDETELLA PERTUSSIS RFAPQ 1980 AB077 783.1
    10 98 MASERNVIRUSSTA MM EDMONSTON SIQNKFSAGSYPLLWSYAMG 1981 P0485 1.1
    10 99 BORDETELLA PERTUSSIS SITLQAGAH 1982 AB077 783.1
    11 00 BORDETELLA PERTUSSIS SLQPED 1983 AB077 783.1
    11 01 BORDETELLA PERTUSSIS SNALSKRL 1984 AB077 783.1
    11 02 MASERNVIRUSSTA MM EDMONSTON SPGQLIQRITDDPDVSIRLL 1985 P0485 1.1
    11 03 BORDETELLA PERTUSSIS TELPSIPG 1986 AB077 783.1
    11 04 BORDETELLA PERTUSSIS TFTLANK 1987 AB077 783.1
    11 05 BORDETELLA PERTUSSIS TWDDD 1988 AB077 783.1
    11 06 MASERNVIRUSSTA MM EDMONSTON VSFLQGDQSENELPRLGGKE 1989 P0485 1.1
    11 07 MASERNVIRUSSTA MM EDMONSTON WQESRKNKAQTRTPLQC 1990 P0485 1.1
    11 08 MASERNVIRUSSTA MM EDMONSTON YAMGVGVELENSMGGLNFGR 1991 P0485 1.1
    11 09 MASERNVIRUSSTA MM EDMONSTON YQQMGKPAPYMVNLENSI 1992 P0485 1.1
    11 10 MASERNVIRUSSTA MM HALLE MTRSSHQSLVIKLMP 1993 P6935 5.1
    11 11 MASERNVIRUSSTA MM HALLE PIRDALNAMTQNIRP 1994 P6935 5.1
    11 12 RÖTELNVIRUSSTA MM M33 ALLNTPPPYQVSCGGESDRASAGH 1995 CAA28 880.1
    11 13 RÖTELNVIRUSSTA MM THERIEN GLGSPNCHGPDWASPVCQRHS 1996 P0756 6.1
    11 14 RÖTELNVIRUSSTA MM THERIEN GLGSPNCHGPDWASPVCQRHSPDCSRLV 1997 P0756 6.1
    11 15 RÖTELNVIRUSSTA MM THERIEN NYTGNQQSRWGLGSPNCHGPDWASPV 1998 P0756 6.1
    11 16 RÖTELNVIRUSSTA MM THERIEN TLPQPPCAHGQHYGHHHHQL 1999 P0756 6.1
    11 17 RÖTELNVIRUSSTA MM THERIEN TVRVKFHTETRTVWQLSVAGVSCNVT 2000 P0756 6.1
    11 18 RÖTELNVIRUS ASYFNPGGSYYKQYH 2001 BAA28 178.1
    11 19 RÖTELNVIRUS FALASYVQHPHKTVR 2002 BAA28 178.1
    11 20 RÖTELNVIRUS GGESDRASARVIDPAAQSFTG 2003 BAA28 178.1
    11 21 RÖTELNVIRUS GPGEVWVTPVIGSQARKC 2004 BAA28 178.1
    11 22 RÖTELNVIRUS GSQARKCGLHIRAG 2005 BAA28 178.1
    11 23 RÖTELNVIRUS LVGATPERPRLRLVDADDPLLRTAP 2006 BAA28 178.1
    11 24 RÖTELNVIRUS TAPGPGEVWVTPVI 2007 BAA28 178.1
    11 25 MASERN-MORBILLIVIRUS FIVLSIAYPTLSEIK 2008 AAL29 688.1
    11 26 MASERNVIRUSSTA MM EDMONSTON-ZAGREB ETCFQQACKGKIQALCENPEWAPLKDNR IPSY 2009 P0836 2.1
    11 27 MASERN-MORBILLIVIRUS LPRLGGKEDR 2010 P0485 1.1
    11 28 MASERN-MORBILLIVIRUS MSKTEWNASQ 2011 SRC28 0080
    11 29 MASERN-MORBILLIVIRUS SRFGWFENKE 2012 P0485 1.1
    11 30 RÖTELNVIRUS EACVTSWLWSEGEGAVFYRVDLHFINLG T 2013 CAA28 880.1
    11 31 RÖTELNVIRUS MDFWCVEHDRPPPATPTSLTT 2014 CAA33 016.1
    11 32 RÖTELNVIRUS PFLGHDGHHGGTLRVGQHHRNASDV 2015 CAA33 016.1
    11 33 RÖTELNVIRUS RVKFHTETRTVWQLSVAGVSC 2016 BAA19 893.1
    11 34 MASERN-MORBILLIVIRUS AEEQARHVKNGLE 2017 AB069 699.1
    11 35 MASERN-MORBILLIVIRUS ESPQEISKHQALG 2018 SRC28 0080
    11 36 MASERN-MORBILLIVIRUS GVGVELENSMGGLNF 2019 ABI54 110.1
    11 37 MASERN-MORBILLIVIRUS IKGANDLAKFHQMLMKIIMK 2020 ABO69 699.1
    11 38 MASERN-MORBILLIVIRUS MSKTLHAQLGFKKT 2021 ABK40 528.1
    11 39 MASERN-MORBILLIVIRUS NASGLSRPSPSAH 2022 BAE98 296.1
    11 40 MASERN-MORBILLIVIRUS VRVIDPSLGDRKDE 2023 SRC28 0148
    11 41 BORDETELLA PERTUSSIS DLSDGDLLV 2024 AAC31 207.1
    11 42 BORDETELLA PERTUSSIS EAERAGRGTG 2025 ACI04 548.1
    11 43 BORDETELLA PERTUSSIS YRYDSRPPEDV 2026 ACI04 548.1
    11 44 BORDETELLA PERTUSSIS YVDTYGDNAG 2027 ACI04 548.1
    11 45 MASERN-MORBILLIVIRUS SFSYFYPFR 2028 CAB43 772.1
    11 46 MUMPS-RUBULAVIRUS DIFIVSPR 2029 ADF49 557.1
    11 47 MASERN-MORBILLIVIRUS QDSRRSADALLRLQAMAGISEEQGSDTD TPIVYNDRN 2030 CAA59 302.1
    11 48 MASERN-MORBILLIVIRUS SAEALLRLQA 2031 BAH22 350.1
    11 49 MASERN-MORBILLIVIRUS RIVINREHL 2032 BAB39 835.1
    11 50 MASERNVIRUS GENOTYP A IPRFK 2033 BAB39 848.1
    11 51 BORDETELLA PERTUSSIS AAALSPMEI 2034 P1531 8.2
    11 52 BORDETELLA PERTUSSIS AAASVVGAPV 2035 P1531 8.2
    11 53 BORDETELLA PERTUSSIS AALGRQDSI 2036 P1531 8.2
    11 54 BORDETELLA PERTUSSIS AAQRLVHAIA 2037 P1531 8.2
    11 55 BORDETELLA PERTUSSIS AAVEAAEL 2038 P1531 8.2
    11 56 BORDETELLA PERTUSSIS AGANVLNGL 2039 P1531 8.2
    11 57 BORDETELLA PERTUSSIS AGYANAAD 2040 P1531 8.2
    11 58 BORDETELLA PERTUSSIS AGYEQFEFRV 2041 P1531 8.2
    11 59 BORDETELLA PERTUSSIS AITGNADNL 2042 P1531 8.2
    11 60 BORDETELLA PERTUSSIS AKEKNATLM 2043 P1531 8.2
    11 61 BORDETELLA PERTUSSIS AKGVFLSL 2044 P1531 8.2
    11 62 BORDETELLA PERTUSSIS APHEYGFGI 2045 P1531 8.2
    11 63 BORDETELLA PERTUSSIS ARQGNDLEI 2046 P1531 8.2
    11 64 BORDETELLA PERTUSSIS ASWGAPV 2047 P1531 8.2
    11 65 BORDETELLA PERTUSSIS ATLMFRLV 2048 P1531 8.2
    11 66 BORDETELLA PERTUSSIS AVAAAQRL 2049 P1531 8.2
    11 67 BORDETELLA PERTUSSIS DAGANVLNGL 2050 P1531 8.2
    11 68 BORDETELLA PERTUSSIS DALLAQLYR 2051 P1531 8.2
    11 69 BORDETELLA PERTUSSIS DANGVLKHSI 2052 P1531 8.2
    11 70 BORDETELLA PERTUSSIS DGDMNIGVI 2053 P1531 8.2
    11 71 BORDETELLA PERTUSSIS DHVKNIENL 2054 P1531 8.2
    11 72 BORDETELLA PERTUSSIS DIDMFAIM 2055 P1531 8.2
    11 73 BORDETELLA PERTUSSIS DMFAIMPHL 2056 P1531 8.2
    11 74 BORDETELLA PERTUSSIS DNVRNVENV 2057 P1531 8.2
    11 75 BORDETELLA PERTUSSIS DNVRNVENVI 2058 P1531 8.2
    11 76 BORDETELLA PERTUSSIS DTVDYSAM 2059 P1531 8.2
    11 77 BORDETELLA PERTUSSIS DTVDYSAMI 2060 P1531 8.2
    11 78 BORDETELLA PERTUSSIS DYLRQAGL 2061 P1531 8.2
    11 79 BORDETELLA PERTUSSIS DYYDNVRNV 2062 P1531 8.2
    11 80 BORDETELLA PERTUSSIS EFTTFVEI 2063 P1531 8.2
    11 81 BORDETELLA PERTUSSIS EFTTFVEIV 2064 P1531 8.2
    11 82 BORDETELLA PERTUSSIS EGYVFYEN 2065 P1531 8.2
    11 83 BORDETELLA PERTUSSIS ENVQYRHV 2066 P1531 8.2
    11 84 BORDETELLA PERTUSSIS EQLANSDGL 2067 P1531 8.2
    11 85 BORDETELLA PERTUSSIS FGVGYGHDTI 2068 P1531 8.2
    11 86 BORDETELLA PERTUSSIS FSPDVLETVP 2069 P1531 8.2
    11 87 BORDETELLA PERTUSSIS FSVDHVKNI 2070 P1531 8.2
    11 88 BORDETELLA PERTUSSIS GDDTYLFGV 2071 P1531 8.2
    11 89 BORDETELLA PERTUSSIS GDDVFLQDL 2072 P1531 8.2
    11 90 BORDETELLA PERTUSSIS GEDGNDIFL 2073 P1531 8.2
    11 91 BORDETELLA PERTUSSIS GERFNVRKQL 2074 P1531 8.2
    11 92 BORDETELLA PERTUSSIS GGAGNDTLV 2075 P1531 8.2
    11 93 BORDETELLA PERTUSSIS GGDDFEAV 2076 P1531 8.2
    11 94 BORDETELLA PERTUSSIS GKSEFTTFV 2077 P1531 8.2
    11 95 BORDETELLA PERTUSSIS GKSLFDDGL 2078 P1531 8.2
    11 96 BORDETELLA PERTUSSIS GNADNLKSV 2079 P1531 8.2
    11 97 BORDETELLA PERTUSSIS GQLVEVDTL 2080 P1531 8.2
    11 98 BORDETELLA PERTUSSIS GRSKFSPDV 2081 P1531 8.2
    11 99 BORDETELLA PERTUSSIS GSSAYDTV 2082 P1531 8.2
    12 00 BORDETELLA PERTUSSIS GTVEKWPAL 2083 P1531 8.2
    12 01 BORDETELLA PERTUSSIS GVDYYDNV 2084 P1531 8.2
    12 02 BORDETELLA PERTUSSIS GYEQFEFRV 2085 P1531 8.2
    12 03 BORDETELLA PERTUSSIS HAVGAQDVV 2086 P1531 8.2
    12 04 BORDETELLA PERTUSSIS IAAGRIGLGI 2087 P1531 8.2
    12 05 BORDETELLA PERTUSSIS IGDAQANTL 2088 P1531 8.2
    12 06 BORDETELLA PERTUSSIS IGLGILADL 2089 P1531 8.2
    12 07 BORDETELLA PERTUSSIS IGNAAGIPL 2090 P1531 8.2
    12 08 BORDETELLA PERTUSSIS IGTSMKDVL 2091 P1531 8.2
    12 09 BORDETELLA PERTUSSIS IGVITDFEL 2092 P1531 8.2
    12 10 BORDETELLA PERTUSSIS IPLTADIDM 2093 P1531 8.2
    12 11 BORDETELLA PERTUSSIS ISKSALEL 2094 P1531 8.2
    12 12 BORDETELLA PERTUSSIS ITGNADNL 2095 P1531 8.2
    12 13 BORDETELLA PERTUSSIS KIFVVSAT 2096 P1531 8.2
    12 14 BORDETELLA PERTUSSIS KQLNNANVYR 2097 P1531 8.2
    12 15 BORDETELLA PERTUSSIS KVIGNAAGI 2098 P1531 8.2
    12 16 BORDETELLA PERTUSSIS LAKVVSQL 2099 P1531 8.2
    12 17 BORDETELLA PERTUSSIS LANDYARKI 2100 P1531 8.2
    12 18 BORDETELLA PERTUSSIS LDYLRQAGL 2101 P1531 8.2
    12 19 BORDETELLA PERTUSSIS LGKGFASL 2102 P1531 8.2
    12 20 BORDETELLA PERTUSSIS LGKGFASLM 2103 P1531 8.2
    12 21 BORDETELLA PERTUSSIS LGVDYYDN 2104 P1531 8.2
    12 22 BORDETELLA PERTUSSIS LGVDYYDNV 2105 P1531 8.2
    12 23 BORDETELLA PERTUSSIS LKHSIKLDVI 2106 P1531 8.2
    12 24 BORDETELLA PERTUSSIS LQAGYIPV 2107 P1531 8.2
    12 25 BORDETELLA PERTUSSIS LQLTGGTVE 2108 P1531 8.2
    12 26 BORDETELLA PERTUSSIS LSAAVFGL 2109 P1531 8.2
    12 27 BORDETELLA PERTUSSIS LSLGKGFASL 2110 P1531 8.2
    12 28 BORDETELLA PERTUSSIS LSPMEIYGL 2111 P1531 8.2
    12 29 BORDETELLA PERTUSSIS NAHDNFLAGG 2112 P1531 8.2
    12 30 BORDETELLA PERTUSSIS NANVYREGV 2113 P1531 8.2
    12 31 BORDETELLA PERTUSSIS NDTLYGGL 2114 P1531 8.2
    12 32 BORDETELLA PERTUSSIS NGLAGNDVL 2115 P1531 8.2
    12 33 BORDETELLA PERTUSSIS NNANVYREGV 2116 P1531 8.2
    12 34 BORDETELLA PERTUSSIS NTVSYAAL 2117 P1531 8.2
    12 35 BORDETELLA PERTUSSIS NVLRNIENAV 2118 P1531 8.2
    12 36 BORDETELLA PERTUSSIS PALTFITPL 2119 P1531 8.2
    12 37 BORDETELLA PERTUSSIS PETSNVLRNI 2120 P1531 8.2
    12 38 BORDETELLA PERTUSSIS PMEIYGLV 2121 P1531 8.2
    12 39 BORDETELLA PERTUSSIS PQAYFEKNL 2122 P1531 8.2
    12 40 BORDETELLA PERTUSSIS PVNPNLSKL 2123 P1531 8.2
    12 41 BORDETELLA PERTUSSIS QAGWNASSV 2124 P1531 8.2
    12 42 BORDETELLA PERTUSSIS QAGWNASSVI 2125 P1531 8.2
    12 43 BORDETELLA PERTUSSIS QDAANAGNL 2126 P1531 8.2
    12 44 BORDETELLA PERTUSSIS QDAANAGNLL 2127 P1531 8.2
    12 45 BORDETELLA PERTUSSIS QDSGYDSL 2128 P1531 8.2
    12 46 BORDETELLA PERTUSSIS QQSHYADQL 2129 P1531 8.2
    12 47 BORDETELLA PERTUSSIS RALQGAQAV 2130 P1531 8.2
    12 48 BORDETELLA PERTUSSIS RGGLGLDTL 2131 P1531 8.2
    12 49 BORDETELLA PERTUSSIS RKQLNNANV 2132 P1531 8.2
    12 50 BORDETELLA PERTUSSIS RQDSGYDSL 2133 P1531 8.2
    12 51 BORDETELLA PERTUSSIS RQFRYDGDM 2134 P1531 8.2
    12 52 BORDETELLA PERTUSSIS RSKFSPDVL 2135 P1531 8.2
    12 53 BORDETELLA PERTUSSIS SAGAAAGAL 2136 P1531 8.2
    12 54 BORDETELLA PERTUSSIS SAHWGQRAL 2137 P1531 8.2
    12 55 BORDETELLA PERTUSSIS SAMIHPGRI 2138 P1531 8.2
    12 56 BORDETELLA PERTUSSIS SAMIHPGRIV 2139 P1531 8.2
    12 57 BORDETELLA PERTUSSIS SAYDTVSGI 2140 P1531 8.2
    12 58 BORDETELLA PERTUSSIS SAYGYEGD 2141 P1531 8.2
    12 59 BORDETELLA PERTUSSIS SGGAGDDVL 2142 P1531 8.2
    12 60 BORDETELLA PERTUSSIS SGLQVAGA 2143 P1531 8.2
    12 61 BORDETELLA PERTUSSIS SGYDSLDGV 2144 P1531 8.2
    12 62 BORDETELLA PERTUSSIS SLLTGALNGI 2145 P1531 8.2
    12 63 BORDETELLA PERTUSSIS SPMEIYGL 2146 P1531 8.2
    12 64 BORDETELLA PERTUSSIS SQMLTRGQL 2147 P1531 8.2
    12 65 BORDETELLA PERTUSSIS SSAYDTVSGI 2148 P1531 8.2
    12 66 BORDETELLA PERTUSSIS SSLAHGHTA 2149 P1531 8.2
    12 67 BORDETELLA PERTUSSIS SSVTSGDSV 2150 P1531 8.2
    12 68 BORDETELLA PERTUSSIS SVIGVQTTEI 2151 P1531 8.2
    12 69 BORDETELLA PERTUSSIS TNTVSYAAL 2152 P1531 8.2
    12 70 BORDETELLA PERTUSSIS TSLIAEGV 2153 P1531 8.2
    12 71 BORDETELLA PERTUSSIS TSLLTGAL 2154 P1531 8.2
    12 72 BORDETELLA PERTUSSIS TVPASPGL 2155 P1531 8.2
    12 73 BORDETELLA PERTUSSIS VAKEKNATL 2156 P1531 8.2
    12 74 BORDETELLA PERTUSSIS VAPHEYGFGI 2157 P1531 8.2
    12 75 BORDETELLA PERTUSSIS VAVVTSLL 2158 P1531 8.2
    12 76 BORDETELLA PERTUSSIS VFYENRAYG 2159 P1531 8.2
    12 77 BORDETELLA PERTUSSIS VFYENRAYGV 2160 P1531 8.2
    12 78 BORDETELLA PERTUSSIS VITDFELEV 2161 P1531 8.2
    12 79 BORDETELLA PERTUSSIS VNPHSTSL 2162 P1531 8.2
    12 80 BORDETELLA PERTUSSIS VNPHSTSLI 2163 P1531 8.2
    12 81 BORDETELLA PERTUSSIS VNPNLSKL 2164 P1531 8.2
    12 82 BORDETELLA PERTUSSIS VNPNLSKLF 2165 P1531 8.2
    12 83 BORDETELLA PERTUSSIS VQQPIIEKL 2166 P1531 8.2
    12 84 BORDETELLA PERTUSSIS VQYRHVEL 2167 P1531 8.2
    12 85 BORDETELLA PERTUSSIS VSIAAAASV 2168 P1531 8.2
    12 86 BORDETELLA PERTUSSIS VSIAAAASVV 2169 P1531 8.2
    12 87 BORDETELLA PERTUSSIS VTSLLTGAL 2170 P1531 8.2
    12 88 BORDETELLA PERTUSSIS VVLANASRI 2171 P1531 8.2
    12 89 BORDETELLA PERTUSSIS WPALNLFSV 2172 P1531 8.2
    12 90 BORDETELLA PERTUSSIS WVRKASAL 2173 P1531 8.2
    12 91 BORDETELLA PERTUSSIS YAVQYRRKGG 2174 P1531 8.2
    12 92 BORDETELLA PERTUSSIS YGGLGDDTL 2175 P1531 8.2
    12 93 BORDETELLA PERTUSSIS YGLVQQSHYA 2176 P1531 8.2
    12 94 BORDETELLA PERTUSSIS YGYEGDALL 2177 P1531 8.2
    12 95 BORDETELLA PERTUSSIS YIPVNPNL 2178 P1531 8.2
    12 96 BORDETELLA PERTUSSIS YSAMIHPGRI 2179 P1531 8.2
    12 97 BORDETELLA PERTUSSIS YSQTGAHAGI 2180 P1531 8.2
    12 98 CORYNEBACTERIU M DIPHTHERIAE AYNFVESIINLFQVVHNSYN 2181 CAE11 230.1
    12 99 BORDETELLA PERTUSSIS SGTTIK 2182 BAF35 031.1
    13 00 BORDETELLA PERTUSSIS RGHTLESAEGRKIFG 2183 AAA22 974.1
    13 01 BORDETELLA PERTUSSIS AGAMTVRDVAAAADLALQAGDA 2184 AAA22 974.1
    13 02 BORDETELLA PERTUSSIS AGAMTVRDVAAAADLALQAGDAL 2185 AAA22 974.1
    13 03 BORDETELLA PERTUSSIS ALAAVLVNPHIFTRIGAAQTSLADGAAG PA 2186 AAA22 974.1
    13 04 BORDETELLA PERTUSSIS ALSIDSMTALGA 2187 AAA22 974.1
    13 05 BORDETELLA PERTUSSIS DLSAARGADISGEGR 2188 AAA22 974.1
    13 06 BORDETELLA PERTUSSIS DQNRYEYIWGLY 2189 AAA22 974.1
    13 07 BORDETELLA PERTUSSIS DYTVSADAIALA 2190 AAA22 974.1
    13 08 BORDETELLA PERTUSSIS GPIVVEAGELVSHAGG 2191 AAA22 974.1
    13 09 BORDETELLA PERTUSSIS GRPEGLKIGAHSATSVSGSFDAL 2192 AAA22 974.1
    13 10 BORDETELLA PERTUSSIS ITVTSRGGFDNEGKMESNK 2193 AAA22 974.1
    13 11 BORDETELLA PERTUSSIS LDQNRYEYIWGLYP 2194 AAA22 974.1
    13 12 BORDETELLA PERTUSSIS LSAARGADISG 2195 AAA22 974.1
    13 13 BORDETELLA PERTUSSIS NKIRLMGPLQ 2196 AAA22 974.1
    13 14 BORDETELLA PERTUSSIS NKLGRIRAGEDM 2197 AAA22 974.1
    13 15 BORDETELLA PERTUSSIS NKLGRIRAGEDMHLDAPRIE 2198 AAA22 974.1
    13 16 BORDETELLA PERTUSSIS PHLRNTGQVVAG 2199 AAA22 974.1
    13 17 BORDETELLA PERTUSSIS QVDLHDLSAARGADISG 2200 AAA22 974.1
    13 18 BORDETELLA PERTUSSIS RDVAAAADLALQ 2201 AAA22 974.1
    13 19 BORDETELLA PERTUSSIS SAARGADISGEG 2202 AAA22 974.1
    13 20 BORDETELLA PERTUSSIS TKGEMQIAGKGGGSP 2203 AAA22 974.1
    13 21 BORDETELLA PERTUSSIS TVSADAIALAAQ 2204 AAA22 974.1
    13 22 BORDETELLA PERTUSSIS VVAGHDIHI 2205 AAA22 974.1
    13 23 BORDETELLA PERTUSSIS PSGPNHTKWQLPKISKNALKANG 2206 CAD12 823.1
    13 24 RÖTELNVIRUS LVGATPERPRLRLVDADDPLLRTAPGPG EVWVTPVIGSQAR 2207 BAA19 902.1
    13 25 RÖTELNVIRUS QQSRWGLGSPNCHGPDWASPVCQRHSP 2208 BAA19 902.1
    13 26 BORDETELLA PERTUSSIS AGEAMVLVYYESIAYSF 2209 ACI04 548.1
    13 27 BORDETELLA PERTUSSIS GGVGLASTLWYAESNALSKRLGEL 2210 AAZ74 322.1
    13 28 BORDETELLA PERTUSSIS GTLVRIAPVIGACMARQA 2211 ACI04 548.1
    13 29 BORDETELLA PERTUSSIS IRRVTRVYHNGITGETTT 2212 ACI04 548.1
    13 30 BORDETELLA PERTUSSIS IVKTGERQHGIHIQGSDP 2213 AAZ74 322.1
    13 31 BORDETELLA PERTUSSIS IVKTGERQHGIHIQGSDPGGVRTA 2214 AAZ74 338.1
    13 32 BORDETELLA PERTUSSIS LRDTNVTAVPASGAPAAVSVLGAS 2215 AAZ74 338.1
    13 33 BORDETELLA PERTUSSIS PEAPAPQPPAGRELSAAANAAVNT 2216 AAZ74 322.1
    13 34 BORDETELLA PERTUSSIS AAADFAHAE 2217 WP_01 92471 58.1
    13 35 BORDETELLA PERTUSSIS AAAEVAGAL 2218 WP_01 92492 48.1
    13 36 BORDETELLA PERTUSSIS AAESTFESY 2219 WP_01 92471 58.1
    13 37 BORDETELLA PERTUSSIS AAGFDPEVQ 2220 WP_01 92481 45.1
    13 38 BORDETELLA PERTUSSIS AALGRGHSL 2221 AGS56 996.1
    13 39 BORDETELLA PERTUSSIS AAMQGAVVH 2222 AGT50 936.1
    13 40 BORDETELLA PERTUSSIS AAPAAHADW 2223 AGS56 996.1
    13 41 BORDETELLA PERTUSSIS AAQATVVQR 2224 WP_01 92471 58.1
    13 42 BORDETELLA PERTUSSIS AARVAGDNY 2225 WP_01 92492 48.1
    13 43 BORDETELLA PERTUSSIS AAVALLNKL 2226 WP_01 92492 48.1
    13 44 BORDETELLA PERTUSSIS ADDPPATVY 2227 AAW72 734.1
    13 45 BORDETELLA PERTUSSIS AEAGRFKVL 2228 AGS56 996.1
    13 46 BORDETELLA PERTUSSIS AEATQLVTA 2229 WP_01 92471 58.1
    13 47 BORDETELLA PERTUSSIS AEGGATLGA 2230 WP_01 92492 48.1
    13 48 BORDETELLA PERTUSSIS AEHGEVSIQ 2231 WP_01 92492 48.1
    13 49 BORDETELLA PERTUSSIS AEIAFYPKE 2232 WP_01 92492 48.1
    13 50 BORDETELLA PERTUSSIS AEKVTTPAV 2233 WP_01 92471 58.1
    13 51 BORDETELLA PERTUSSIS AELQTYLRQ 2234 1BCP_ C
    13 52 BORDETELLA PERTUSSIS AEQSLIEVG 2235 WP_01 92492 48.1
    13 53 BORDETELLA PERTUSSIS AESNALSKR 2236 AGS56 996.1
    13 54 BORDETELLA PERTUSSIS AESSEAMAA 2237 AFK26 302.1
    13 55 BORDETELLA PERTUSSIS AEVKVGYRA 2238 WP_01 92471 58.1
    13 56 BORDETELLA PERTUSSIS AEVTDTSPS 2239 WP_01 92492 48.1
    13 57 BORDETELLA PERTUSSIS AGKSLKKKN 2240 WP_01 92471 58.1
    13 58 BORDETELLA PERTUSSIS AGLAGPSAV 2241 WP_01 92492 48.1
    13 59 BORDETELLA PERTUSSIS AIRVGRGAR 2242 AGT50 936.1
    13 60 BORDETELLA PERTUSSIS ALAAIASAA 2243 WP_01 92481 45.1
    13 61 BORDETELLA PERTUSSIS ALADVPYVL 2244 AAA22 983.1
    13 62 BORDETELLA PERTUSSIS ALANDGTIV 2245 WP_01 92486 58.1
    13 63 BORDETELLA PERTUSSIS ALGRGHSLY 2246 AGS56 996.1
    13 64 BORDETELLA PERTUSSIS ALILAASPV 2247 WP_01 92486 58.1
    13 65 BORDETELLA PERTUSSIS ALMLACTGL 2248 AAA22 974.1
    13 66 BORDETELLA PERTUSSIS AMQGAVVHL 2249 AGT50 936.1
    13 67 BORDETELLA PERTUSSIS AMTHLSPAL 2250 AAA22 983.1
    13 68 BORDETELLA PERTUSSIS AMYGKHITL 2251 WP_01 92492 48.1
    13 69 BORDETELLA PERTUSSIS ANEANALLW 2252 WP_01 92492 48.1
    13 70 BORDETELLA PERTUSSIS APLSITLQA 2253 AGT50 936.1
    13 71 BORDETELLA PERTUSSIS APNALAWAL 2254 AAA22 974.1
    13 72 BORDETELLA PERTUSSIS APPAPKPAP 2255 AGS56 996.1
    13 73 BORDETELLA PERTUSSIS APPGAGFIY 2256 1BCP_ C
    13 74 BORDETELLA PERTUSSIS APQAAPLSI 2257 AGT50 936.1
    13 75 BORDETELLA PERTUSSIS APRIENTAK 2258 WP_01 92492 48.1
    13 76 BORDETELLA PERTUSSIS AQGKALLYR 2259 AGT50 936.1
    13 77 BORDETELLA PERTUSSIS AQITSYVGF 2260 WP_01 92486 58.1
    13 78 BORDETELLA PERTUSSIS AQLEVRGQR 2261 WP_01 92492 48.1
    13 79 BORDETELLA PERTUSSIS AQQLKQADR 2262 WP_01 92476 99.1
    13 80 BORDETELLA PERTUSSIS AQVTVAGRY 2263 WP_01 92492 48.1
    13 81 BORDETELLA PERTUSSIS ARRSRVRAL 2264 NP_8 8 2284. 1
    13 82 BORDETELLA PERTUSSIS ASPRRARRA 2265 WP_01 92492 48.1
    13 83 BORDETELLA PERTUSSIS ASSPDAHVP 2266 AAA22 983.1
    13 84 BORDETELLA PERTUSSIS ASVSNPGTF 2267 WP_01 92492 48.1
    13 85 BORDETELLA PERTUSSIS ATWNFQSTY 2268 WP_01 92492 48.1
    13 86 BORDETELLA PERTUSSIS ATYIADSGF 2269 AGS56 996.1
    13 87 BORDETELLA PERTUSSIS AVAAPAVGA 2270 WP_01 92492 48.1
    13 88 BORDETELLA PERTUSSIS AVFMQQRPL 2271 AAA22 983.1
    13 89 BORDETELLA PERTUSSIS AVLVNPHIF 2272 WP_01 92492 48.1
    13 90 BORDETELLA PERTUSSIS CFGKDLKRP 2273 AAA22 983.1
    13 91 BORDETELLA PERTUSSIS CPSSLGNGV 2274 WP_01 92481 45.1
    13 92 BORDETELLA PERTUSSIS DAGHEHDTW 2275 AAA22 984.1
    13 93 BORDETELLA PERTUSSIS DAKHDLTVT 2276 WP_01 92492 48.1
    13 94 BORDETELLA PERTUSSIS DASGQHRLW 2277 AGS56 996.1
    13 95 BORDETELLA PERTUSSIS DATFETYAL 2278 YP 00 66280 18.1
    13 96 BORDETELLA PERTUSSIS DATFQTYAL 2279 1BCP_ C
    13 97 BORDETELLA PERTUSSIS DATLVGAKF 2280 WP_01 92471 58.1
    13 98 BORDETELLA PERTUSSIS DDEVDVSGR 2281 AAA22 974.1
    13 99 BORDETELLA PERTUSSIS DENGKPQTY 2282 WP_01 92471 58.1
    14 00 BORDETELLA PERTUSSIS DGPPSRPTT 2283 WP_01 92471 58.1
    14 01 BORDETELLA PERTUSSIS DHLTGRSCQ 2284 AAW72 734.1
    14 02 BORDETELLA PERTUSSIS DNEGKMESN 2285 WP_01 92492 48.1
    14 03 BORDETELLA PERTUSSIS DPPATVYRY 2286 AAW72 734.1
    14 04 BORDETELLA PERTUSSIS EATEGDATL 2287 WP_01 92471 58.1
    14 05 BORDETELLA PERTUSSIS EATQQAAGF 2288 WP_01 92481 45.1
    14 06 BORDETELLA PERTUSSIS ECSGKQDCP 2289 AAA22 983.1
    14 07 BORDETELLA PERTUSSIS EGGKLRGKD 2290 AAA22 974.1
    14 08 BORDETELLA PERTUSSIS EGKMESNKD 2291 WP_01 92492 48.1
    14 09 BORDETELLA PERTUSSIS EHRMQEAVE 2292 AAW72 734.1
    14 10 BORDETELLA PERTUSSIS EKRLDIDDA 2293 WP_01 92492 48.1
    14 11 BORDETELLA PERTUSSIS EPASANTLL 2294 AGS56 996.1
    14 12 BORDETELLA PERTUSSIS EPQAELAVF 2295 AGS56 996.1
    14 13 BORDETELLA PERTUSSIS EPVKLTLTG 2296 AGT50 936.1
    14 14 BORDETELLA PERTUSSIS ESAEGRKIF 2297 WP_01 92492 48.1
    14 15 BORDETELLA PERTUSSIS ESYSESHNF 2298 WP_01 92471 58.1
    14 16 BORDETELLA PERTUSSIS ETFCITTIY 2299 1BCP_ C
    14 17 BORDETELLA PERTUSSIS EVAGALELS 2300 WP_01 92492 48.1
    14 18 BORDETELLA PERTUSSIS EVAKVEVVP 2301 WP_01 92471 58.1
    14 19 BORDETELLA PERTUSSIS EVDGIIQEF 2302 WP_01 92492 48.1
    14 20 BORDETELLA PERTUSSIS EVRADNNFY 2303 WP_01 92483 44.1
    14 21 BORDETELLA PERTUSSIS FAILSSTTE 2304 WP_01 92471 58.1
    14 22 BORDETELLA PERTUSSIS FAISAYALK 2305 AAA22 984.1
    14 23 BORDETELLA PERTUSSIS FALYDGTYL 2306 AFK26 303.1
    14 24 BORDETELLA PERTUSSIS FDTMLGFAI 2307 AAA22 984.1
    14 25 BORDETELLA PERTUSSIS FEGKPALEL 2308 AAA22 983.1
    14 26 BORDETELLA PERTUSSIS FELGADHAV 2309 AGS56 996.1
    14 27 BORDETELLA PERTUSSIS FEPGITTNY 2310 WP_01 92486 58.1
    14 28 BORDETELLA PERTUSSIS FETYALTGI 2311 YP 00 66280 18.1
    14 29 BORDETELLA PERTUSSIS FIYRETFCI 2312 1BCP_ C
    14 30 BORDETELLA PERTUSSIS FPTRTTAPG 2313 NP_8 8 2284. 1
    14 31 BORDETELLA PERTUSSIS FQTYALTGI 2314 1BCP_ C
    14 32 BORDETELLA PERTUSSIS FTHADGWFL 2315 AGS56 996.1
    14 33 BORDETELLA PERTUSSIS FVRDGQSVI 2316 1BCP_ C
    14 34 BORDETELLA PERTUSSIS FVRSGQPVI 2317 YP 00 66280 18.1
    14 35 BORDETELLA PERTUSSIS FVWYVDTVI 2318 WP_01 92488 66.1
    14 36 BORDETELLA PERTUSSIS GAASSRQAL 2319 WP_01 92492 48.1
    14 37 BORDETELLA PERTUSSIS GAASSYFEY 2320 AAW72 734.1
    14 38 BORDETELLA PERTUSSIS GAFDLKTTF 2321 AFK26 303.1
    14 39 BORDETELLA PERTUSSIS GAPAAVSVL 2322 AGS56 996.1
    14 40 BORDETELLA PERTUSSIS GATRAVDSL 2323 AGS56 996.1
    14 41 BORDETELLA PERTUSSIS GAVPGGAVP 2324 AGT50 936.1
    14 42 BORDETELLA PERTUSSIS GEAMVLVYY 2325 AFK26 302.1
    14 43 BORDETELLA PERTUSSIS GEIALGDAT 2326 WP_01 92492 48.1
    14 44 BORDETELLA PERTUSSIS GELMAAQVA 2327 WP_01 92471 58.1
    14 45 BORDETELLA PERTUSSIS GGVPGGAVP 2328 AAZ74 338.1
    14 46 BORDETELLA PERTUSSIS GHEHDTWFD 2329 AAA22 984.1
    14 47 BORDETELLA PERTUSSIS GIGALKAGA 2330 WP_01 92492 48.1
    14 48 BORDETELLA PERTUSSIS GIVIPPKAL 2331 1BCP_ C
    14 49 BORDETELLA PERTUSSIS GKDLKRPGS 2332 AAA22 983.1
    14 50 BORDETELLA PERTUSSIS GKLPKPVTV 2333 WP_01 92471 58.1
    14 51 BORDETELLA PERTUSSIS GKSLKKKNQ 2334 WP_01 92471 58.1
    14 52 BORDETELLA PERTUSSIS GLDVQQGTV 2335 WP_01 92492 48.1
    14 53 BORDETELLA PERTUSSIS GLTDGVSRI 2336 WP_01 92492 48.1
    14 54 BORDETELLA PERTUSSIS GLYPTYTEW 2337 WP_01 92492 48.1
    14 55 BORDETELLA PERTUSSIS GLYQTYTEW 2338 YP_00 66264 70.1
    14 56 BORDETELLA PERTUSSIS GPPSRPTTP 2339 WP_01 92471 58.1
    14 57 BORDETELLA PERTUSSIS GPSAVAAPA 2340 WP_01 92492 48.1
    14 58 BORDETELLA PERTUSSIS GVAPTAQQL 2341 WP_01 92488 66.1
    14 59 BORDETELLA PERTUSSIS GVGLASTLW 2342 AGS56 996.1
    14 60 BORDETELLA PERTUSSIS GYEAGFSLG 2343 WP_01 92471 58.1
    14 61 BORDETELLA PERTUSSIS HADDGTIVI 2344 WP_01 92481 45.1
    14 62 BORDETELLA PERTUSSIS HADWNNQSI 2345 AGS56 996.1
    14 63 BORDETELLA PERTUSSIS HAEHEKDVR 2346 WP_01 92471 58.1
    14 64 BORDETELLA PERTUSSIS HANHYGTRI 2347 WP_01 92471 58.1
    14 65 BORDETELLA PERTUSSIS HAQGKALLY 2348 AGT50 936.1
    14 66 BORDETELLA PERTUSSIS HFIGYIYEV 2349 AAW72 734.1
    14 67 BORDETELLA PERTUSSIS HLSPALADV 2350 AAA22 983.1
    14 68 BORDETELLA PERTUSSIS HSLYASYEY 2351 AGS56 996.1
    14 69 BORDETELLA PERTUSSIS HVRGMLVPV 2352 AAA22 974.1
    14 70 BORDETELLA PERTUSSIS HVSKEEQYY 2353 YP 00 66280 18.1
    14 71 BORDETELLA PERTUSSIS HVTRGWSIF 2354 AFK26 303.1
    14 72 BORDETELLA PERTUSSIS IADSGFYLD 2355 AGS56 996.1
    14 73 BORDETELLA PERTUSSIS IAHRTELRG 2356 AGS56 996.1
    14 74 BORDETELLA PERTUSSIS IENTAKLSG 2357 WP_01 92492 48.1
    14 75 BORDETELLA PERTUSSIS IESKISQSV 2358 WP_01 92492 48.1
    14 76 BORDETELLA PERTUSSIS IETGGARRF 2359 AGT50 936.1
    14 77 BORDETELLA PERTUSSIS IIKDAPPGA 2360 1BCP_ C
    14 78 BORDETELLA PERTUSSIS IIQEFAADL 2361 WP_01 92492 48.1
    14 79 BORDETELLA PERTUSSIS ILAGALATY 2362 AAW72 734.1
    14 80 BORDETELLA PERTUSSIS ILLENPAAE 2363 AGS56 996.1
    14 81 BORDETELLA PERTUSSIS ILPILVLAL 2364 NP_88 2286. 1
    14 82 BORDETELLA PERTUSSIS IPFQRALRL 2365 WP_01 92481 45.1
    14 83 BORDETELLA PERTUSSIS ISVRVHVSK 2366 YP_00 66280 18.1
    14 84 BORDETELLA PERTUSSIS ITNETGKTY 2367 WP_01 92471 58.1
    14 85 BORDETELLA PERTUSSIS ITNKRAALI 2368 WP_01 92492 48.1
    14 86 BORDETELLA PERTUSSIS ITSYVGFSV 2369 WP_01 92486 58.1
    14 87 BORDETELLA PERTUSSIS ITVTSRGGF 2370 WP_01 92492 48.1
    14 88 BORDETELLA PERTUSSIS IVIPPKALF 2371 1BCP_ C
    14 89 BORDETELLA PERTUSSIS IVVEAGELV 2372 WP_01 92492 48.1
    14 90 BORDETELLA PERTUSSIS KAAKSVNLM 2373 WP_01 92471 58.1
    14 91 BORDETELLA PERTUSSIS KAAPLRRTT 2374 AGS56 996.1
    14 92 BORDETELLA PERTUSSIS KAGKLSATG 2375 WP_01 92492 48.1
    14 93 BORDETELLA PERTUSSIS KAGTIAAPW 2376 WP_01 92492 48.1
    14 94 BORDETELLA PERTUSSIS KAKSLTTEI 2377 WP_01 92492 48.1
    14 95 BORDETELLA PERTUSSIS KATVTTVQV 2378 WP_01 92471 58.1
    14 96 BORDETELLA PERTUSSIS KDYRDKDGG 2379 WP_01 92471 58.1
    14 97 BORDETELLA PERTUSSIS KEAATIVAA 2380 WP_01 92492 48.1
    14 98 BORDETELLA PERTUSSIS KEDVDAAQI 2381 WP_01 92486 58.1
    14 99 BORDETELLA PERTUSSIS KEVDGIIQE 2382 WP_01 92492 48.1
    15 00 BORDETELLA PERTUSSIS KGPKLAMPW 2383 AGS56 996.1
    15 01 BORDETELLA PERTUSSIS KLASGGGAV 2384 WP_01 92492 48.1
    15 02 BORDETELLA PERTUSSIS KLKGKNQEF 2385 AAA22 984.1
    15 03 BORDETELLA PERTUSSIS KLLHHILPI 2386 NP_88 2286. 1
    15 04 BORDETELLA PERTUSSIS KPAPQPGPQ 2387 AGS56 996.1
    15 05 BORDETELLA PERTUSSIS KPAPTAPPM 2388 WP_01 92492 48.1
    15 06 BORDETELLA PERTUSSIS KPAVSVKVA 2389 WP_01 92492 48.1
    15 07 BORDETELLA PERTUSSIS KPDRAARVA 2390 WP_01 92492 48.1
    15 08 BORDETELLA PERTUSSIS KPLADIAVI 2391 YP_00 66264 70.1
    15 09 BORDETELLA PERTUSSIS KPLADIAVV 2392 WP_01 92492 48.1
    15 10 BORDETELLA PERTUSSIS KPLPKPLPV 2393 WP_01 92471 58.1
    15 11 BORDETELLA PERTUSSIS KQADRDFVW 2394 WP_01 92476 99.1
    15 12 BORDETELLA PERTUSSIS KSLPGGKLP 2395 WP_01 92471 58.1
    15 13 BORDETELLA PERTUSSIS KSYTLRYLA 2396 WP_01 92486 58.1
    15 14 BORDETELLA PERTUSSIS KTNMVVTSV 2397 AAA22 983.1
    15 15 BORDETELLA PERTUSSIS KVLAPRLYL 2398 AAA22 974.1
    15 16 BORDETELLA PERTUSSIS KVLSTKTTL 2399 WP_01 92471 58.1
    15 17 BORDETELLA PERTUSSIS LAAGAGLTL 2400 WP_01 92492 48.1
    15 18 BORDETELLA PERTUSSIS LAAIASAAH 2401 WP_01 92481 45.1
    15 19 BORDETELLA PERTUSSIS LAANGNGQW 2402 AGS56 996.1
    15 20 BORDETELLA PERTUSSIS LAAQVTQRG 2403 WP_01 92492 48.1
    15 21 BORDETELLA PERTUSSIS LAARGDGAL 2404 AAA22 974.1
    15 22 BORDETELLA PERTUSSIS LAAVLVNPH 2405 WP_01 92492 48.1
    15 23 BORDETELLA PERTUSSIS LAGSGLFRM 2406 AGS56 996.1
    15 24 BORDETELLA PERTUSSIS LAKALSAAL 2407 WP_01 92492 48.1
    15 25 BORDETELLA PERTUSSIS LALQAGDAL 2408 WP_01 92492 48.1
    15 26 BORDETELLA PERTUSSIS LAMPWTFHA 2409 AGS56 996.1
    15 27 BORDETELLA PERTUSSIS LANDGTIVI 2410 WP_01 92486 58.1
    15 28 BORDETELLA PERTUSSIS LAPTVGVAF 2411 WP_01 92471 58.1
    15 29 BORDETELLA PERTUSSIS LASDGSVDF 2412 AGS56 996.1
    15 30 BORDETELLA PERTUSSIS LATYQSEYL 2413 AAW72 734.1
    15 31 BORDETELLA PERTUSSIS LAWALMLAC 2414 AAA22 974.1
    15 32 BORDETELLA PERTUSSIS LEAGRRFTH 2415 AGS56 996.1
    15 33 BORDETELLA PERTUSSIS LFTQQGGAY 2416 1BCP_ C
    15 34 BORDETELLA PERTUSSIS LKRPGSSPM 2417 AAA22 983.1
    15 35 BORDETELLA PERTUSSIS LLGSHVARA 2418 AFK2 6 303.1
    15 36 BORDETELLA PERTUSSIS LLHHILPIL 2419 NP_8 8 2286. 1
    15 37 BORDETELLA PERTUSSIS LLNAGGTLL 2420 WP_01 92492 48.1
    15 38 BORDETELLA PERTUSSIS LMGPLQVNA 2421 WP_01 92492 48.1
    15 39 BORDETELLA PERTUSSIS LNDSKITMG 2422 WP_01 92481 45.1
    15 40 BORDETELLA PERTUSSIS LPEPVKLTL 2423 AGT50 936.1
    15 41 BORDETELLA PERTUSSIS LPILVLALL 2424 NP_88 2286. 1
    15 42 BORDETELLA PERTUSSIS LPKISKNAL 2425 WP_01 92481 45.1
    15 43 BORDETELLA PERTUSSIS LPKPVTVKL 2426 WP_01 92471 58.1
    15 44 BORDETELLA PERTUSSIS LPLKANPMH 2427 NP_88 2285. 1
    15 45 BORDETELLA PERTUSSIS LPPRPVVAE 2428 WP_01 92471 58.1
    15 46 BORDETELLA PERTUSSIS LPSIPGTSI 2429 AGS56 996.1
    15 47 BORDETELLA PERTUSSIS LPTHLYKNF 2430 AAA22 984.1
    15 48 BORDETELLA PERTUSSIS LPVRGVALV 2431 WP_01 92492 48.1
    15 49 BORDETELLA PERTUSSIS LPVSLTALD 2432 WP_01 92492 48.1
    15 50 BORDETELLA PERTUSSIS LQGGNKVPV 2433 WP_01 92492 48.1
    15 51 BORDETELLA PERTUSSIS LSAALGADW 2434 WP_01 92492 48.1
    15 52 BORDETELLA PERTUSSIS LSDAGHEHD 2435 AAA22 984.1
    15 53 BORDETELLA PERTUSSIS LSGEVQRKG 2436 WP_01 92492 48.1
    15 54 BORDETELLA PERTUSSIS LSSPSAITV 2437 WP_01 92492 48.1
    15 55 BORDETELLA PERTUSSIS LTWLAILAV 2438 AAW72 734.1
    15 56 BORDETELLA PERTUSSIS LVFSHVRGM 2439 AAA22 974.1
    15 57 BORDETELLA PERTUSSIS LVSDAGADL 2440 WP_01 92492 48.1
    15 58 BORDETELLA PERTUSSIS LVYYESIAY 2441 AFK26 302.1
    15 59 BORDETELLA PERTUSSIS MAAESTFES 2442 WP_01 92471 58.1
    15 60 BORDETELLA PERTUSSIS MAAGHDATL 2443 WP_01 92492 48.1
    15 61 BORDETELLA PERTUSSIS MAAWSERAG 2444 AFK2 6 302.1
    15 62 BORDETELLA PERTUSSIS MALGALGAA 2445 AGS56 996.1
    15 63 BORDETELLA PERTUSSIS MAPVMGACM 2446 ADA85 123.1
    15 64 BORDETELLA PERTUSSIS MATKGEMQI 2447 WP_01 92492 48.1
    15 65 BORDETELLA PERTUSSIS MDAKGGTLL 2448 WP_01 92492 48.1
    15 66 BORDETELLA PERTUSSIS MESNKDIVI 2449 WP_01 92492 48.1
    15 67 BORDETELLA PERTUSSIS MEVMLRAVF 2450 AAA22 983.1
    15 68 BORDETELLA PERTUSSIS MEYFKTPLP 2451 WP_01 92492 48.1
    15 69 BORDETELLA PERTUSSIS MHTIASILL 2452 AAA22 984.1
    15 70 BORDETELLA PERTUSSIS MIYMSGLAV 2453 1BCP_ C
    15 71 BORDETELLA PERTUSSIS MLACTGLPL 2454 AAA22 974.1
    15 72 BORDETELLA PERTUSSIS MPIDRKTLC 2455 AFK2 6 303.1
    15 73 BORDETELLA PERTUSSIS MPKAPELDL 2456 WP_01 92492 48.1
    15 74 BORDETELLA PERTUSSIS MQRQAGLPL 2457 NP_88 2285. 1
    15 75 BORDETELLA PERTUSSIS NALAWALML 2458 AAA22 974.1
    15 76 BORDETELLA PERTUSSIS NITNKRAAL 2459 WP_01 92492 48.1
    15 77 BORDETELLA PERTUSSIS NLMAAESTF 2460 WP_01 92471 58.1
    15 78 BORDETELLA PERTUSSIS NNETMSGRQ 2461 WP_01 92492 48.1
    15 79 BORDETELLA PERTUSSIS NPGSLIAEV 2462 WP_01 92492 48.1
    15 80 BORDETELLA PERTUSSIS NPMHTIASI 2463 NP_88 2285. 1
    15 81 BORDETELLA PERTUSSIS NPQTQLSNI 2464 WP_01 92481 45.1
    15 82 BORDETELLA PERTUSSIS NPYTSRRSV 2465 AFK2 6 302.1
    15 83 BORDETELLA PERTUSSIS PAPTAPPMP 2466 WP_01 92492 48.1
    15 84 BORDETELLA PERTUSSIS PASANTLLL 2467 AGS56 996.1
    15 85 BORDETELLA PERTUSSIS PAVALPRPL 2468 WP_01 92492 48.1
    15 86 BORDETELLA PERTUSSIS PDAHVPFCF 2469 AAA22 983.1
    15 87 BORDETELLA PERTUSSIS PELGAAIRV 2470 AGT50 936.1
    15 88 BORDETELLA PERTUSSIS PFIIKLKDC 2471 WP_01 92481 45.1
    15 89 BORDETELLA PERTUSSIS PGPQPPQPP 2472 AGS56 996.1
    15 90 BORDETELLA PERTUSSIS PGPQPPQPQ 2473 AAZ74 338.1
    15 91 BORDETELLA PERTUSSIS PGPTTDYST 2474 WP_01 92481 45.1
    15 92 BORDETELLA PERTUSSIS PGTFTAGKD 2475 WP_01 92492 48.1
    15 93 BORDETELLA PERTUSSIS PGTPGDLLE 2476 AAA22 984.1
    15 94 BORDETELLA PERTUSSIS PKPKPKAER 2477 WP_01 92471 58.1
    15 95 BORDETELLA PERTUSSIS PKPKPKPKA 2478 WP_01 92471 58.1
    15 96 BORDETELLA PERTUSSIS PKPKPKPKP 2479 WP_01 92471 58.1
    15 97 BORDETELLA PERTUSSIS PLPPRPVVA 2480 WP_01 92471 58.1
    15 98 BORDETELLA PERTUSSIS PPAPKPAPQ 2481 AGS56 996.1
    15 99 BORDETELLA PERTUSSIS PPKPAPVAK 2482 WP_01 92471 58.1
    16 00 BORDETELLA PERTUSSIS PPRPVAAQV 2483 WP_01 92471 58.1
    16 01 BORDETELLA PERTUSSIS PPRPVVAEK 2484 WP_01 92471 58.1
    16 02 BORDETELLA PERTUSSIS PPSRPTTPP 2485 WP_01 92471 58.1
    16 03 BORDETELLA PERTUSSIS PRRARRALR 2486 WP_01 92492 48.1
    16 04 BORDETELLA PERTUSSIS QAAPLSITL 2487 AGT50 936.1
    16 05 BORDETELLA PERTUSSIS QADRDFVWY 2488 WP_01 92476 99.1
    16 06 BORDETELLA PERTUSSIS QAIVVGKDL 2489 WP_01 92492 48.1
    16 07 BORDETELLA PERTUSSIS QALGALKLY 2490 ACI16 088.1
    16 08 BORDETELLA PERTUSSIS QELALKLKG 2491 AAA22 984.1
    16 09 BORDETELLA PERTUSSIS QITQHGGPY 2492 NP_88 2283. 1
    16 10 BORDETELLA PERTUSSIS QITQHGSPY 2493 AFK26 303.1
    16 11 BORDETELLA PERTUSSIS QPLPPRPVA 2494 WP_01 92471 58.1
    16 12 BORDETELLA PERTUSSIS QPPAGRELS 2495 AGS56 996.1
    16 13 BORDETELLA PERTUSSIS QQLKQADRD 2496 WP_01 92476 99.1
    16 14 BORDETELLA PERTUSSIS QQVQVLQRQ 2497 WP_01 92471 58.1
    16 15 BORDETELLA PERTUSSIS QSIVEAPEL 2498 AGT50 936.1
    16 16 BORDETELLA PERTUSSIS QVGSSNSAF 2499 AAW72 734.1
    16 17 BORDETELLA PERTUSSIS RAGLSPATW 2500 WP_01 92492 48.1
    16 18 BORDETELLA PERTUSSIS RARRALRQD 2501 WP_01 92492 48.1
    16 19 BORDETELLA PERTUSSIS RASASRARI 2502 WP_01 92492 48.1
    16 20 BORDETELLA PERTUSSIS RELSAAANA 2503 AGS56 996.1
    16 21 BORDETELLA PERTUSSIS RETFCITTI 2504 1BCP_ C
    16 22 BORDETELLA PERTUSSIS RGFAQRQQL 2505 AGS56 996.1
    16 23 BORDETELLA PERTUSSIS RGSAATFTL 2506 WP_01 92482 95.1
    16 24 BORDETELLA PERTUSSIS RGWSIFALY 2507 AFK2 6 303.1
    16 25 BORDETELLA PERTUSSIS RKMLYLIYV 2508 YP_00 66280 18.1
    16 26 BORDETELLA PERTUSSIS RLRKMLYLI 2509 YP_00 66280 18.1
    16 27 BORDETELLA PERTUSSIS RPQITDAVT 2510 WP_01 92492 48.1
    16 28 BORDETELLA PERTUSSIS RPSVNGGRI 2511 WP_01 92492 48.1
    16 29 BORDETELLA PERTUSSIS RRFTHADGW 2512 AGS56 996.1
    16 30 BORDETELLA PERTUSSIS RSGARATSL 2513 AAA22 974.1
    16 31 BORDETELLA PERTUSSIS RSRVRALAW 2514 NP_88 2284. 1
    16 32 BORDETELLA PERTUSSIS RSRVRALSW 2515 YP_00 66280 19.1
    16 33 BORDETELLA PERTUSSIS RTHGVGASL 2516 AGS56 996.1
    16 34 BORDETELLA PERTUSSIS RTRGQARSG 2517 AAA22 974.1
    16 35 BORDETELLA PERTUSSIS RVAPPAVAL 2518 WP_01 92492 48.1
    16 36 BORDETELLA PERTUSSIS RVLPEPVKL 2519 AGT50 936.1
    16 37 BORDETELLA PERTUSSIS RVRALAWLL 2520 NP_8 8 2284. 1
    16 38 BORDETELLA PERTUSSIS RVRALSWLL 2521 YP 00 66280 19.1
    16 39 BORDETELLA PERTUSSIS RVTVSGGSL 2522 AGT50 936.1
    16 40 BORDETELLA PERTUSSIS SEAMAAWSE 2523 AFK26 302.1
    16 41 BORDETELLA PERTUSSIS SESHNFHAS 2524 WP_01 92471 58.1
    16 42 BORDETELLA PERTUSSIS SGEGRVNIG 2525 WP_01 92492 48.1
    16 43 BORDETELLA PERTUSSIS SGLAVRVHV 2526 1BCP_ C
    16 44 BORDETELLA PERTUSSIS SLADISLGA 2527 WP_01 92492 48.1
    16 45 BORDETELLA PERTUSSIS SLFAILSST 2528 WP_01 92471 58.1
    16 46 BORDETELLA PERTUSSIS SLFAPHGNV 2529 AAZ74 338.1
    16 47 BORDETELLA PERTUSSIS SLSIDNATW 2530 AGS56 996.1
    16 48 BORDETELLA PERTUSSIS SPMEVMLRA 2531 AAA22 983.1
    16 49 BORDETELLA PERTUSSIS SPQPIRATV 2532 WP_01 92471 58.1
    16 50 BORDETELLA PERTUSSIS SPRRARRAL 2533 WP_01 92492 48.1
    16 51 BORDETELLA PERTUSSIS SPSRLAGTL 2534 WP_01 92492 48.1
    16 52 BORDETELLA PERTUSSIS SSTPLGSLF 2535 WP_01 92471 58.1
    16 53 BORDETELLA PERTUSSIS STYELLDYL 2536 WP_01 92492 48.1
    16 54 BORDETELLA PERTUSSIS SVAMKPYEV 2537 AAA22 983.1
    16 55 BORDETELLA PERTUSSIS SVAPNALAW 2538 AAA22 974.1
    16 56 BORDETELLA PERTUSSIS SVKVAKKLF 2539 WP_01 92492 48.1
    16 57 BORDETELLA PERTUSSIS TAFMSGRSL 2540 AAA22 984.1
    16 58 BORDETELLA PERTUSSIS TAGATPFDI 2541 WP_01 92486 58.1
    16 59 BORDETELLA PERTUSSIS TAPVTSPAW 2542 AAW72 734.1
    16 60 BORDETELLA PERTUSSIS TARTGWLTW 2543 AAW72 734.1
    16 61 BORDETELLA PERTUSSIS TEAQGVQVR 2544 WP_01 92481 45.1
    16 62 BORDETELLA PERTUSSIS TEVYLEHRM 2545 AAW72 734.1
    16 63 BORDETELLA PERTUSSIS TFEGKPALE 2546 AAA22 983.1
    16 64 BORDETELLA PERTUSSIS TFTGKVTNG 2547 WP_01 92486 58.1
    16 65 BORDETELLA PERTUSSIS TGDGGGHTD 2548 AGS56 996.1
    16 66 BORDETELLA PERTUSSIS TLAKALSAA 2549 WP_01 92492 48.1
    16 67 BORDETELLA PERTUSSIS TLANVGDTW 2550 AGS56 996.1
    16 68 BORDETELLA PERTUSSIS TLNASNLTL 2551 WP_01 92492 48.1
    16 69 BORDETELLA PERTUSSIS TLSSAHGNV 2552 WP_01 92492 48.1
    16 70 BORDETELLA PERTUSSIS TPFDIKLKE 2553 WP_01 92486 58.1
    16 71 BORDETELLA PERTUSSIS TPFIIKLKD 2554 WP_01 92481 45.1
    16 72 BORDETELLA PERTUSSIS TPGWSIYGL 2555 1BCP_ C
    16 73 BORDETELLA PERTUSSIS TPLGSAATF 2556 AGS56 996.1
    16 74 BORDETELLA PERTUSSIS TPLGSLFAI 2557 WP_01 92471 58.1
    16 75 BORDETELLA PERTUSSIS TPLPVSLTA 2558 WP_01 92492 48.1
    16 76 BORDETELLA PERTUSSIS TRQGIMDQY 2559 YP 00 66268 73.1
    16 77 BORDETELLA PERTUSSIS TSKQDERNY 2560 WP_01 92471 58.1
    16 78 BORDETELLA PERTUSSIS TSPYDGKYW 2561 YP 00 66280 18.1
    16 79 BORDETELLA PERTUSSIS TSRRSVASI 2562 AFK26 302.1
    16 80 BORDETELLA PERTUSSIS TSRTVTMRY 2563 NP_87 9898. 1
    16 81 BORDETELLA PERTUSSIS TTEYPNARY 2564 ADA85 123.1
    16 82 BORDETELLA PERTUSSIS TTEYSNARY 2565 AFK26 302.1
    16 83 BORDETELLA PERTUSSIS TTLGLEQTF 2566 WP_01 92471 58.1
    16 84 BORDETELLA PERTUSSIS TVLAAGAGL 2567 WP_01 92492 48.1
    16 85 BORDETELLA PERTUSSIS TVQELALKL 2568 AAA22 984.1
    16 86 BORDETELLA PERTUSSIS TVVQRNKHW 2569 WP_01 92471 58.1
    16 87 BORDETELLA PERTUSSIS VAAAADLAL 2570 WP_01 92492 48.1
    16 88 BORDETELLA PERTUSSIS VALASQARW 2571 AGS56 996.1
    16 89 BORDETELLA PERTUSSIS VAMKPYEVT 2572 AAA22 983.1
    16 90 BORDETELLA PERTUSSIS VARLVKLQG 2573 WP_01 92492 48.1
    16 91 BORDETELLA PERTUSSIS VAVAGGRWH 2574 AGS56 996.1
    16 92 BORDETELLA PERTUSSIS VEASAITTY 2575 WP_01 92481 45.1
    16 93 BORDETELLA PERTUSSIS VEDIGGKNY 2576 WP_01 92471 58.1
    16 94 BORDETELLA PERTUSSIS VEVSSPPPV 2577 WP_01 92471 58.1
    16 95 BORDETELLA PERTUSSIS VGAGGYEAG 2578 WP_01 92471 58.1
    16 96 BORDETELLA PERTUSSIS VGGGEHGRW 2579 WP_01 92492 48.1
    16 97 BORDETELLA PERTUSSIS VHVSKEEQY 2580 YP_00 66280 18.1
    16 98 BORDETELLA PERTUSSIS VIDGQKVLA 2581 AAA22 974.1
    16 99 BORDETELLA PERTUSSIS VIGACTSPY 2582 YP_00 66280 18.1
    17 00 BORDETELLA PERTUSSIS VKLGGVYEA 2583 AAA22 974.1
    17 01 BORDETELLA PERTUSSIS VLAPRLYLT 2584 AAA22 974.1
    17 02 BORDETELLA PERTUSSIS VLVKTNMVV 2585 AAA22 983.1
    17 03 BORDETELLA PERTUSSIS VPASGAPAA 2586 AGS56 996.1
    17 04 BORDETELLA PERTUSSIS VPFCFGKDL 2587 AAA22 983.1
    17 05 BORDETELLA PERTUSSIS VPVSEHCTV 2588 AAA22 974.1
    17 06 BORDETELLA PERTUSSIS VPVTPPKVE 2589 WP_01 92471 58.1
    17 07 BORDETELLA PERTUSSIS VRTVSAMEY 2590 WP_01 92492 48.1
    17 08 BORDETELLA PERTUSSIS VSGGSLSAP 2591 AGT50 936.1
    17 09 BORDETELLA PERTUSSIS VSSATKAKG 2592 WP_01 92486 58.1
    17 10 BORDETELLA PERTUSSIS VSSPPPVSV 2593 WP_01 92471 58.1
    17 11 BORDETELLA PERTUSSIS VSVKVAKKL 2594 WP_01 92492 48.1
    17 12 BORDETELLA PERTUSSIS VTMRYLASY 2595 WP_01 92481 45.1
    17 13 BORDETELLA PERTUSSIS VTSVAMKPY 2596 AAA22 983.1
    17 14 BORDETELLA PERTUSSIS VVAEKVTTP 2597 WP_01 92471 58.1
    17 15 BORDETELLA PERTUSSIS VVDGPPSRP 2598 WP_01 92471 58.1
    17 16 BORDETELLA PERTUSSIS VVETAQPLP 2599 WP_01 92471 58.1
    17 17 BORDETELLA PERTUSSIS WLTWLAILA 2600 AAW72 734.1
    17 18 BORDETELLA PERTUSSIS WTFHAGYRY 2601 AGS56 996.1
    17 19 BORDETELLA PERTUSSIS WVMTDNSNV 2602 AGS56 996.1
    17 20 BORDETELLA PERTUSSIS YAEHGEVSI 2603 WP_01 92492 48.1
    17 21 BORDETELLA PERTUSSIS YAIDGTAAG 2604 WP_01 92492 48.1
    17 22 BORDETELLA PERTUSSIS YALKSRIAL 2605 AAA22 984.1
    17 23 BORDETELLA PERTUSSIS YATNPQTQL 2606 WP_01 92481 45.1
    17 24 BORDETELLA PERTUSSIS YDTGDLIAY 2607 WP_01 92486 58.1
    17 25 BORDETELLA PERTUSSIS YEAGFSLGS 2608 WP_01 92471 58.1
    17 26 BORDETELLA PERTUSSIS YEDATFETY 2609 YP_00 66280 18.1
    17 27 BORDETELLA PERTUSSIS YENKSSTPL 2610 WP_01 92471 58.1
    17 28 BORDETELLA PERTUSSIS YEVTPTRML 2611 AAA22 983.1
    17 29 BORDETELLA PERTUSSIS YEYIWGLYP 2612 WP_01 92492 48.1
    17 30 BORDETELLA PERTUSSIS YEYIWGLYQ 2613 YP 00 66264 70.1
    17 31 BORDETELLA PERTUSSIS YEYSKGPKL 2614 AGS56 996.1
    17 32 BORDETELLA PERTUSSIS YFEPGPTTD 2615 WP_01 92481 45.1
    17 33 BORDETELLA PERTUSSIS YIWGLYPTY 2616 WP_01 92492 48.1
    17 34 BORDETELLA PERTUSSIS YIWGLYQTY 2617 YP 00 66264 70.1
    17 35 BORDETELLA PERTUSSIS YLRQITPGW 2618 1BCP_ C
    17 36 BORDETELLA PERTUSSIS YMIYMSGLA 2619 1BCP_ C
    17 37 BORDETELLA PERTUSSIS YPALRAALI 2620 WP_01 92486 58.1
    17 38 BORDETELLA PERTUSSIS YPGTPGDLL 2621 AAA22 984.1
    17 39 BORDETELLA PERTUSSIS YPTYTEWSV 2622 WP_01 92492 48.1
    17 40 BORDETELLA PERTUSSIS YQTYTEWSV 2623 YP 00 66264 70.1
    17 41 BORDETELLA PERTUSSIS YSTGDLRAY 2624 WP_01 92481 45.1
    17 42 BORDETELLA PERTUSSIS YTLRYLASY 2625 WP_01 92486 58.1
    17 43 BORDETELLA PERTUSSIS YVLVKTNMV 2626 AAA22 983.1
    17 44 BORDETELLA PERTUSSIS YYDYEDATF 2627 YP 00 66280 18.1
    17 45 BORDETELLA PERTUSSIS 509 AAFIALYPNSQLAPT 2628 Q7VU0 5
    17 46 BORDETELLA PERTUSSIS 509 GGAEYNLALGQRRA 2629 Q7VU0 4
    17 47 BORDETELLA PERTUSSIS 509 GGAEYNLALGQRRADA 2630 Q7VU0 4
    17 48 BORDETELLA PERTUSSIS 509 IALYPNSQLAPT 2631 Q7VU0 5
    17 49 BORDETELLA PERTUSSIS 509 KPDQGEVVAVGPGKKTED 2632 P0A33 9.1
    17 50 BORDETELLA PERTUSSIS 509 KPDQGEVVAVGPGKKTEDG 2633 P0A33 9.1
    17 51 BORDETELLA PERTUSSIS 509 LAEVLDYHNFVLTQ 2634 Q7VWM 1.1
    17 52 CORYNEBACTERIU M DIPHTHERIAE QSIALSSLMVAQAIP 2635 AAV70 486.1
    17 53 CORYNEBACTERIU M DIPHTHERIAE SIGVLGYQKTVDHTKVNSKLSLF 2636 AAV70 486.1
    17 54 BORDETELLA PERTUSSIS AAHADWNNQSIVKT 2637 ABO77 783.1
    17 55 BORDETELLA PERTUSSIS AALGRG 2638 ABO77 783.1
    17 56 BORDETELLA PERTUSSIS AALGRGHSLYASYE 2639 ABO77 783.1
    17 57 BORDETELLA PERTUSSIS AAPLRRTTLAMALG 2640 ABO77 783.1
    17 58 BORDETELLA PERTUSSIS AAPLSITLQAGAHA 2641 ABO77 783.1
    17 59 BORDETELLA PERTUSSIS ADAQGDIVATELPS 2642 ABO77 783.1
    17 60 BORDETELLA PERTUSSIS ADSGFYLDATLRAS 2643 ABO77 783.1
    17 61 BORDETELLA PERTUSSIS AELA 2644 ABO77 783.1
    17 62 BORDETELLA PERTUSSIS AELAVFRAGGGAYR 2645 ABO77 783.1
    17 63 BORDETELLA PERTUSSIS AELQFRNGSVTSSG 2646 ABO77 783.1
    17 64 BORDETELLA PERTUSSIS AGGRWHLGGLAGYT 2647 ABO77 783.1
    17 65 BORDETELLA PERTUSSIS AGVAAMQGAVVHLQ 2648 ABO77 783.1
    17 66 BORDETELLA PERTUSSIS AGYTRGDRGFTGDG 2649 ABO77 783.1
    17 67 BORDETELLA PERTUSSIS ALASQARWTGATRA 2650 ABO77 783.1
    17 68 BORDETELLA PERTUSSIS AMPWTFHAGYRYSW 2651 ABO77 783.1
    17 69 BORDETELLA PERTUSSIS AMQGAVVHLQRATIRRGDAP 2652 ABO77 783.1
    17 70 BORDETELLA PERTUSSIS ANGLRVRDE 2653 ABO77 783.1
    17 71 BORDETELLA PERTUSSIS ANGLRVRDEGGSSV 2654 ABO77 783.1
    17 72 BORDETELLA PERTUSSIS ANKDGKVDIGTYRY 2655 ABO77 783.1
    17 73 BORDETELLA PERTUSSIS APAAVSVLGASELT 2656 ABO77 783.1
    17 74 BORDETELLA PERTUSSIS APPAPKPAPQPGPQ 2657 ABO77 783.1
    17 75 BORDETELLA PERTUSSIS AQGILLENPAAELQ 2658 ABO77 783.1
    17 76 BORDETELLA PERTUSSIS ARWTGATRAVDSLS 2659 ABO77 783.1
    17 77 BORDETELLA PERTUSSIS ASLEAGRRFTHADG 2660 ABO77 783.1
    17 78 BORDETELLA PERTUSSIS ASYEYSKGPKLAMP 2661 ABO77 783.1
    17 79 BORDETELLA PERTUSSIS ATFTLANKD 2662 AB077 783.1
    17 80 BORDETELLA PERTUSSIS ATFTLANKDGKVDI 2663 AB077 783.1
    17 81 BORDETELLA PERTUSSIS ATRAVDSLSIDNAT 2664 AB077 783.1
    17 82 BORDETELLA PERTUSSIS DDDGIALYVAGEQAQ 2665 AB077 783.1
    17 83 BORDETELLA PERTUSSIS DDGIALYVAGEQAQ 2666 AB077 783.1
    17 84 BORDETELLA PERTUSSIS DGGHITGGRAAGVA 2667 AB077 783.1
    17 85 BORDETELLA PERTUSSIS DGIRRFLGTVTVKAGK 2668 AB077 783.1
    17 86 BORDETELLA PERTUSSIS DGSVDFQQPAEAGR 2669 AB077 783.1
    17 87 BORDETELLA PERTUSSIS DGYAVKGKYRTHGV 2670 AB077 783.1
    17 88 BORDETELLA PERTUSSIS DIVATELPSIPGTS 2671 AB077 783.1
    17 89 BORDETELLA PERTUSSIS DKLVVMQDASGQHR 2672 AB077 783.1
    17 90 BORDETELLA PERTUSSIS DLGLSDKLWMQDA 2673 AB077 783.1
    17 91 BORDETELLA PERTUSSIS DNATWVMTDNSNVGA 2674 AB077 783.1
    17 92 BORDETELLA PERTUSSIS DNATWVMTDNSNVGALRLA 2675 AB077 783.1
    17 93 BORDETELLA PERTUSSIS DNRAGRRFDQKVAG 2676 AB077 783.1
    17 94 BORDETELLA PERTUSSIS EAGRFKVLTVNTLA 2677 AB077 783.1
    17 95 BORDETELLA PERTUSSIS ELAQSIVEAPELGA 2678 AB077 783.1
    17 96 BORDETELLA PERTUSSIS ELGAAIRVGRGARV 2679 AB077 783.1
    17 97 BORDETELLA PERTUSSIS ELGADHAVAVAGGR 2680 AB077 783.1
    17 98 BORDETELLA PERTUSSIS ELPSIPGTSIGPLD 2681 AB077 783.1
    17 99 BORDETELLA PERTUSSIS EPVKLTLTGGADAQ 2682 AB077 783.1
    18 00 BORDETELLA PERTUSSIS EQAQASIADSTLQG 2683 AB077 783.1
    18 01 BORDETELLA PERTUSSIS ERGANVTVQRSAIV 2684 AB077 783.1
    18 02 BORDETELLA PERTUSSIS ERQHGIHIQGSDPG 2685 AB077 783.1
    18 03 BORDETELLA PERTUSSIS EVGKRIELAGGRQV 2686 AB077 783.1
    18 04 BORDETELLA PERTUSSIS FDGAGTVHTNGIAH 2687 AB077 783.1
    18 05 BORDETELLA PERTUSSIS FQQPAEAGRFKVLT 2688 AB077 783.1
    18 06 BORDETELLA PERTUSSIS FRAGGGAYRAANGL 2689 AB077 783.1
    18 07 BORDETELLA PERTUSSIS GAHAQGKALLYRVL 2690 AB077 783.1
    18 08 BORDETELLA PERTUSSIS GARVTVSGGSLSAP 2691 AB077 783.1
    18 09 BORDETELLA PERTUSSIS GAYRAANGLRVRDE 2692 AB077 783.1
    18 10 BORDETELLA PERTUSSIS GDAPAGGAVPGGAV 2693 AB077 783.1
    18 11 BORDETELLA PERTUSSIS GGAVPGGAVPGGFG 2694 AB077 783.1
    18 12 BORDETELLA PERTUSSIS GGAVPGGFGPVLDG 2695 AB077 783.1
    18 13 BORDETELLA PERTUSSIS GGFGPVLDGWYGVD 2696 AB077 783.1
    18 14 BORDETELLA PERTUSSIS GGLHIGALQSLQPE 2697 AB077 783.1
    18 15 BORDETELLA PERTUSSIS GGVQIERGANVTVQ 2698 AB077 783.1
    18 16 BORDETELLA PERTUSSIS GHSLYASYEYSKGP 2699 AB077 783.1
    18 17 BORDETELLA PERTUSSIS GHTDSVHVGGYATY 2700 AB077 783.1
    18 18 BORDETELLA PERTUSSIS GIAHRTELRGTRAE 2701 AB077 783.1
    18 19 BORDETELLA PERTUSSIS GKALLYRVLPEPVK 2702 AB077 783.1
    18 20 BORDETELLA PERTUSSIS GLGMAAALGRGHSL 2703 AB077 783.1
    18 21 BORDETELLA PERTUSSIS GNVIETGGARRFAP 2704 AB077 783.1
    18 22 BORDETELLA PERTUSSIS GPLDVALASQARWT 2705 AB077 783.1
    18 23 BORDETELLA PERTUSSIS GQHRLWVRN 2706 AB077 783.1
    18 24 BORDETELLA PERTUSSIS GRGFAQRQQLDNRA 2707 AB077 783.1
    18 25 BORDETELLA PERTUSSIS GRLGLEVGKRIELA 2708 AB077 783.1
    18 26 BORDETELLA PERTUSSIS GRQVQPYIKASVLQ 2709 AB077 783.1
    18 27 BORDETELLA PERTUSSIS GRRFTHADGWFLEPQAELA 2710 AB077 783.1
    18 28 BORDETELLA PERTUSSIS GSEPASANTLLLVQ 2711 AB077 783.1
    18 29 BORDETELLA PERTUSSIS GSSVLGRLGLEVGK 2712 AB077 783.1
    18 30 BORDETELLA PERTUSSIS GTTIKVSGRQAQGI 2713 AB077 783.1
    18 31 BORDETELLA PERTUSSIS GTVTVKAGKLVADH 2714 AB077 783.1
    18 32 BORDETELLA PERTUSSIS HAVAVAGGRWHLGG 2715 AB077 783.1
    18 33 BORDETELLA PERTUSSIS IELAGGRQVQPYIK 2716 AB077 783.1
    18 34 BORDETELLA PERTUSSIS IHIQGSDPGGVRTA 2717 AB077 783.1
    18 35 BORDETELLA PERTUSSIS IRRFLGTVTVKAGK 2718 AB077 783.1
    18 36 BORDETELLA PERTUSSIS IRVGRGARVTVSGG 2719 AB077 783.1
    18 37 BORDETELLA PERTUSSIS ITLQAGAHA 2720 AB077 783.1
    18 38 BORDETELLA PERTUSSIS ITLQAGAHAQGKAL 2721 AB077 783.1
    18 39 BORDETELLA PERTUSSIS IVEAPELGAAIRVG 2722 AB077 783.1
    18 40 BORDETELLA PERTUSSIS IVKTGERQHGIHIQ 2723 AB077 783.1
    18 41 BORDETELLA PERTUSSIS KAGKLVADHATLAN 2724 AB077 783.1
    18 42 BORDETELLA PERTUSSIS KGKYRTHGVGASLE 2725 AB077 783.1
    18 43 BORDETELLA PERTUSSIS KPAPQPGPQPPQPP 2726 AB077 783.1
    18 44 BORDETELLA PERTUSSIS KVAGFELGADHAVA 2727 AB077 783.1
    18 45 BORDETELLA PERTUSSIS KVAGSDGYAVKGKY 2728 AB077 783.1
    18 46 BORDETELLA PERTUSSIS KVDIGTYRYRLAAN 2729 AB077 783.1
    18 47 BORDETELLA PERTUSSIS KVLTVNTLAGSGLF 2730 AB077 783.1
    18 48 BORDETELLA PERTUSSIS LAANGNGQWSLVGA 2731 AB077 783.1
    18 49 BORDETELLA PERTUSSIS LAMPWTFHAGYRYS 2732 AB077 783.1
    18 50 BORDETELLA PERTUSSIS LASTLWYAESNALS 2733 AB077 783.1
    18 51 BORDETELLA PERTUSSIS LENDFKVAGSDGYA 2734 AB077 783.1
    18 52 BORDETELLA PERTUSSIS LENPAAELQFRNGS 2735 AB077 783.1
    18 53 BORDETELLA PERTUSSIS LGAAPAAHADWNNQ 2736 AB077 783.1
    18 54 BORDETELLA PERTUSSIS LGGLAGYTRGDRGFTGDG 2737 AB077 783.1
    18 55 BORDETELLA PERTUSSIS LLENP 2738 AB077 783.1
    18 56 BORDETELLA PERTUSSIS LLVQTPLGSAATFT 2739 AB077 783.1
    18 57 BORDETELLA PERTUSSIS LPPSRVVLRDTNVT 2740 AB077 783.1
    18 58 BORDETELLA PERTUSSIS LQPEDLPPS 2741 AB077 783.1
    18 59 BORDETELLA PERTUSSIS LQPEDLPPSRVVLR 2742 AB077 783.1
    18 60 BORDETELLA PERTUSSIS LRASRLENDFKVAG 2743 AB077 783.1
    18 61 BORDETELLA PERTUSSIS LRLASDGSVDFQQP 2744 AB077 783.1
    18 62 BORDETELLA PERTUSSIS LSAAANAAVNTGGV 2745 AB077 783.1
    18 63 BORDETELLA PERTUSSIS LSAPHGNVIETGGA 2746 AB077 783.1
    18 64 BORDETELLA PERTUSSIS LSDDGIRRFLGTVT 2747 AB077 783.1
    18 65 BORDETELLA PERTUSSIS LVGAKAPPAPKPAP 2748 AB077 783.1
    18 66 BORDETELLA PERTUSSIS LYVAGEQAQASIAD 2749 AB077 783.1
    18 67 BORDETELLA PERTUSSIS MALGALGAAPAAHA 2750 AB077 783.1
    18 68 BORDETELLA PERTUSSIS MNMSLSRIVKAAPL 2751 AB077 783.1
    18 69 BORDETELLA PERTUSSIS MQDASGQHR 2752 AB077 783.1
    18 70 BORDETELLA PERTUSSIS MQGAVVHLQRATIR 2753 AB077 783.1
    18 71 BORDETELLA PERTUSSIS NAAVNTGGVGLAST 2754 AB077 783.1
    18 72 BORDETELLA PERTUSSIS NALSKRLGELRLNP 2755 AB077 783.1
    18 73 BORDETELLA PERTUSSIS NGQWSLVGAKAPPA 2756 AB077 783.1
    18 74 BORDETELLA PERTUSSIS NTLAGSGLFRMNVF 2757 AB077 783.1
    18 75 BORDETELLA PERTUSSIS PAGRELSAAANAAV 2758 AB077 783.1
    18 76 BORDETELLA PERTUSSIS PAPQPPAGRELSAA 2759 AB077 783.1
    18 77 BORDETELLA PERTUSSIS PGPQPPQPPQPQPE 2760 AB077 783.1
    18 78 BORDETELLA PERTUSSIS PGTSIGPLDVALAS 2761 AB077 783.1
    18 79 BORDETELLA PERTUSSIS PLGSAATFTLANKD 2762 AB077 783.1
    18 80 BORDETELLA PERTUSSIS PQPEAPAPQPPAGR 2763 AB077 783.1
    18 81 BORDETELLA PERTUSSIS PQPPQPQPEAPAPQ 2764 AB077 783.1
    18 82 BORDETELLA PERTUSSIS PYIKASVLQEFDGA 2765 AB077 783.1
    18 83 BORDETELLA PERTUSSIS RFAPQAAPLSITLQ 2766 AB077 783.1
    18 84 BORDETELLA PERTUSSIS RLGELRLNPDAGGA 2767 AB077 783.1
    18 85 BORDETELLA PERTUSSIS RLNPDAGGAWGRGF 2768 AB077 783.1
    18 86 BORDETELLA PERTUSSIS RNGSVTSSGQLSDD 2769 AB077 783.1
    18 87 BORDETELLA PERTUSSIS RRFDQKVAGFELGA 2770 AB077 783.1
    18 88 BORDETELLA PERTUSSIS RTTLAMALGALGAA 2771 AB077 783.1
    18 89 BORDETELLA PERTUSSIS SAIVDGGLHIGALQ 2772 AB077 783.1
    18 90 BORDETELLA PERTUSSIS SANTLLLVQTPLGS 2773 AB077 783.1
    18 91 BORDETELLA PERTUSSIS SDPGGVRTASGTTI 2774 AB077 783.1
    18 92 BORDETELLA PERTUSSIS SELTLDGGHITGGR 2775 AB077 783.1
    18 93 BORDETELLA PERTUSSIS SGLFRMNVF 2776 AB077 783.1
    18 94 BORDETELLA PERTUSSIS SGLFRMNVFADLGL 2777 AB077 783.1
    18 95 BORDETELLA PERTUSSIS SGSSVELAQSIVEA 2778 AB077 783.1
    18 96 BORDETELLA PERTUSSIS SIADSTLQGAGGVQ 2779 AB077 783.1
    18 97 BORDETELLA PERTUSSIS SKGPKLAMPWTFHA 2780 AB077 783.1
    18 98 BORDETELLA PERTUSSIS SNVGALRLASDGSV 2781 AB077 783.1
    18 99 BORDETELLA PERTUSSIS SRIVKAAPLRRTTL 2782 AB077 783.1
    19 00 BORDETELLA PERTUSSIS SVLGASELTLDGGH 2783 AB077 783.1
    19 01 BORDETELLA PERTUSSIS SVLQEFDGA 2784 AB077 783.1
    19 02 BORDETELLA PERTUSSIS SVLQEFDGAGTVHT 2785 AB077 783.1
    19 03 BORDETELLA PERTUSSIS TELR 2786 AB077 783.1
    19 04 BORDETELLA PERTUSSIS TELRGTRAELGLGM 2787 AB077 783.1
    19 05 BORDETELLA PERTUSSIS TGDGGGHTDSVHVG 2788 AB077 783.1
    19 06 BORDETELLA PERTUSSIS TGGARRFAPQAAPL 2789 AB077 783.1
    19 07 BORDETELLA PERTUSSIS TGGRAAGVAAMQGA 2790 AB077 783.1
    19 08 BORDETELLA PERTUSSIS TGGVGLASTLWYAE 2791 AB077 783.1
    19 09 BORDETELLA PERTUSSIS THGVGASLEAGRRF 2792 AB077 783.1
    19 10 BORDETELLA PERTUSSIS TIRRGDAPA 2793 AB077 783.1
    19 11 BORDETELLA PERTUSSIS TLANVGDTWDDDGI 2794 AB077 783.1
    19 12 BORDETELLA PERTUSSIS TLQGAGGVQIERGA 2795 AB077 783.1
    19 13 BORDETELLA PERTUSSIS TLTGGADAQGDIVA 2796 AB077 783.1
    19 14 BORDETELLA PERTUSSIS TNVTAVPASGAPAA 2797 AB077 783.1
    19 15 BORDETELLA PERTUSSIS TRAELGLGMAAALG 2798 AB077 783.1
    19 16 BORDETELLA PERTUSSIS TSSGQLSDDGIRRF 2799 AB077 783.1
    19 17 BORDETELLA PERTUSSIS TVHTNGIAHRTELR 2800 AB077 783.1
    19 18 BORDETELLA PERTUSSIS TYRYRLAANGNGQW 2801 AB077 783.1
    19 19 BORDETELLA PERTUSSIS VADHATLANVGDTW 2802 AB077 783.1
    19 20 BORDETELLA PERTUSSIS VHVGGYATYIADSG 2803 AB077 783.1
    19 21 BORDETELLA PERTUSSIS VLDGWYGVD 2804 AB077 783.1
    19 22 BORDETELLA PERTUSSIS VPASGAPAAVSVLG 2805 AB077 783.1
    19 23 BORDETELLA PERTUSSIS VRDEGGSSVLGRLG 2806 AB077 783.1
    19 24 BORDETELLA PERTUSSIS VRTASGTTIKVSGR 2807 AB077 783.1
    19 25 BORDETELLA PERTUSSIS VSGGSLSAPHGNVI 2808 AB077 783.1
    19 26 BORDETELLA PERTUSSIS VSGRQAQGILLENP 2809 AB077 783.1
    19 27 BORDETELLA PERTUSSIS VTVQRSAIVDGGLH 2810 AB077 783.1
    19 28 BORDETELLA PERTUSSIS VVLRDTNVTAVPAS 2811 AB077 783.1
    19 29 BORDETELLA PERTUSSIS WNNQSIVKTGERQH 2812 AB077 783.1
    19 30 BORDETELLA PERTUSSIS WVRNSGSEPASANT 2813 AB077 783.1
    19 31 BORDETELLA PERTUSSIS WYAESNALSKRLGE 2814 AB077 783.1
    19 32 BORDETELLA PERTUSSIS YATYIADSGFYLDA 2815 AB077 783.1
    19 33 BORDETELLA PERTUSSIS YGVDVSGSS 2816 AB077 783.1
    19 34 BORDETELLA PERTUSSIS YGVDVSGSSVELAQ 2817 AB077 783.1
    19 35 BORDETELLA PERTUSSIS YLDATLRASRLEND 2818 AB077 783.1
    19 36 BORDETELLA PERTUSSIS YRVLPEPVKLTLTG 2819 AB077 783.1
    19 37 BORDETELLA PERTUSSIS VKAQNITNKRAALIEA 2820 AAA22 974.1
    19 38 BORDETELLA PERTUSSIS YYSNVTATRLLSSTNS 2821 AAA83 981.1
    19 39 BORDETELLA PERTUSSIS SPNLTDERAAQAGVT 2822 CPP72 976.1
    19 40 MASERN-MORBILLIVIRUS SSRASDERAAHLPTS 2823 BAA33 867.1
    19 41 CORYNEBACTERIU M DIPHTHERIAE QVVHNSYNRPAYSPG 2824 10072 16A
    19 42 MASERNVIRUSSTA MM EDMONSTON-B AEGGEIHEL 2825 AAF85 692.1
    19 43 MASERNVIRUSSTA MM EDMONSTON-B AENLISNGIGKY 2826 AAF85 698.1
    19 44 MASERNVIRUSSTA MM EDMONSTON-B AEVDGDVKL 2827 CAB43 772.1
    19 45 MASERNVIRUSSTA MM EDMONSTON-B AIYTAEIHK 2828 AAF85 697.1
    19 46 MASERNVIRUSSTA MM EDMONSTON-B APVFHMTNY 2829 CAB43 772.1
    19 47 MASERNVIRUSSTA MM EDMONSTON-B APVFHMTNYLEQPVSN 2830 AAR8 9 413.1
    19 48 MASERNVIRUSSTA MM EDMONSTON-B AQRLNEIY 2831 AAF85 698.1
    19 49 MASERNVIRUSSTA MM EDMONSTON-B ARVPHAYSL 2832 AAF85 698.1
    19 50 MASERNVIRUSSTA MM EDMONSTON-B AVRDLERAM 2833 P0342 4.1
    19 51 MASERNVIRUSSTA MM EDMONSTON-B AVRDLERAMTTLK 2834 P0342 4.1
    19 52 MASERNVIRUSSTA MM EDMONSTON-B DALLRLQAM 2835 Q8993 3.1
    19 53 MASERNVIRUSSTA MM EDMONSTON-B DIKEKVINL 2836 AAF85 698.1
    19 54 MASERNVIRUSSTA MM EDMONSTON-B DQGLFKVL 2837 AAF85 695.1
    19 55 MASERNVIRUSSTA MM EDMONSTON-B DTGVDTRIW 2838 Q9EMA 9.1
    19 56 MASERNVIRUSSTA MM EDMONSTON-B EPIGSLAIEEAM 2839 AAF85 692.1
    19 57 MASERNVIRUSSTA MM EDMONSTON-B EPIRDALNAM 2840 P6935 4.1
    19 58 MASERNVIRUSSTA MM EDMONSTON-B FPKLGKTL 2841 AAF85 692.1
    19 59 MASERNVIRUSSTA MM EDMONSTON-B FRSVNAVAF 2842 AAF85 695.1
    19 60 MASERNVIRUSSTA MM EDMONSTON-B GKIIDNTEQL 2843 AAF85 695.1
    19 61 MASERNVIRUSSTA MM EDMONSTON-B GLNEKLVFY 2844 AAF85 695.1
    19 62 MASERNVIRUSSTA MM EDMONSTON-B GMYGGTYLVEK 2845 AAC35 876.2
    19 63 MASERNVIRUSSTA MM EDMONSTON-B GPPISLERLDVGTN 2846 P6935 4.1
    19 64 MASERNVIRUSSTA MM EDMONSTON-B GPRQAQVSFL 2847 Q8993 3.1
    19 65 MASERNVIRUSSTA MM EDMONSTON-B GRLVPQVRVID 2848 AAF85 695.1
    19 66 MASERNVIRUSSTA MM EDMONSTON-B GSAPISMGFR 2849 AAF85 692.1
    19 67 MASERNVIRUSSTA MM EDMONSTON-B HILAKSTAL 2850 AAF85 698.1
    19 68 MASERNVIRUSSTA MM EDMONSTON-B HYREVNLVY 2851 AAF85 698.1
    19 69 MASERNVIRUSSTA MM EDMONSTON-B IPPMKNLAL 2852 AAC35 876.2
    19 70 MASERNVIRUSSTA MM EDMONSTON-B IPYQGSGKGVSF 2853 CAB43 772.1
    19 71 MASERNVIRUSSTA MM EDMONSTON-B ISKESQHVY 2854 AAF85 698.1
    19 72 MASERNVIRUSSTA MM EDMONSTON-B IVSSHFFVY 2855 AAF85 698.1
    19 73 MASERNVIRUSSTA MM EDMONSTON-B KEIKETGRLF 2856 AAF85 698.1
    19 74 MASERNVIRUSSTA MM EDMONSTON-B KESQHVYYL 2857 AAF85 698.1
    19 75 MASERNVIRUSSTA MM EDMONSTON-B KIIDNTEQL 2858 AAF85 695.1
    19 76 MASERNVIRUSSTA MM EDMONSTON-B KKQINRQN 2859 AAA63 285.1
    19 77 MASERNVIRUSSTA MM EDMONSTON-B KKVDTNFIYQ 2860 AAF85 698.1
    19 78 MASERNVIRUSSTA MM EDMONSTON-B KLIDGFFPA 2861 AAF85 698.1
    19 79 MASERNVIRUSSTA MM EDMONSTON-B KPNLSSKRSEL 2862 BAB39 848.1
    19 80 MASERNVIRUSSTA MM EDMONSTON-B KVSPYLFTV 2863 AAR89 413.1
    19 81 MASERNVIRUSSTA MM EDMONSTON-B LETRTTNQFL 2864 CAB43 772.1
    19 82 MASERNVIRUSSTA MM EDMONSTON-B LLKEATEL 2865 AAF85 695.1
    19 83 MASERNVIRUSSTA MM EDMONSTON-B LLKKGNSLY 2866 AAF85 698.1
    19 84 MASERNVIRUSSTA MM EDMONSTON-B LPAPIGGMNY 2867 AAF85 698.1
    19 85 MASERNVIRUSSTA MM EDMONSTON-B MPEETLHQVM 2868 AAF85 698.1
    19 86 MASERNVIRUSSTA MM EDMONSTON-B PTTIRGQFS 2869 CAB43 772.1
    19 87 MASERNVIRUSSTA MM EDMONSTON-B QEISRHQALGY 2870 P0342 4.1
    19 88 MASERNVIRUSSTA MM EDMONSTON-B RITHVDTESY 2871 P6935 4.1
    19 89 MASERNVIRUSSTA MM EDMONSTON-B RPGLKPDL 2872 P6935 4.1
    19 90 MASERNVIRUSSTA MM EDMONSTON-B RPIYGLEV 2873 AAF85 698.1
    19 91 MASERNVIRUSSTA MM EDMONSTON-B RQAGQEMILAV 2874 P6935 4.1
    19 92 MASERNVIRUSSTA MM EDMONSTON-B SAVRIATVY 2875 AAF85 698.1
    19 93 MASERNVIRUSSTA MM EDMONSTON-B SLMPEETLHQV 2876 AAF85 698.1
    19 94 MASERNVIRUSSTA MM EDMONSTON-B SMIDLVTKF 2877 AAF85 698.1
    19 95 MASERNVIRUSSTA MM EDMONSTON-B SMLNSQAIDNLRA 2878 P6935 4.1
    19 96 MASERNVIRUSSTA MM EDMONSTON-B SMYRVFEV 2879 CAB43 772.1
    19 97 MASERNVIRUSSTA MM EDMONSTON-B SQQGMFHAY 2880 AAF85 698.1
    19 98 MASERNVIRUSSTA MM EDMONSTON-B TDTPIVYNDRNLLD 2881 Q8993 3.1
    19 99 MASERNVIRUSSTA MM EDMONSTON-B VIINDDQGLFKV 2882 AAF85 695.1
    20 00 MASERNVIRUSSTA MM EDMONSTON-B YESGVRIASL 2883 AAF85 698.1
    20 01 MASERNVIRUSSTA MM EDMONSTON-B YLKDKALA 2884 AAF85 698.1
    20 02 MASERNVIRUSSTA MM EDMONSTON-B YVYDHSGEAVK 2885 AAF85 692.1
    20 03 RÖTELNVIRUS ARVIDPAAQSFTGVV 2886 BAA28 178.1
    20 04 RÖTELNVIRUS SDRASARVIDPAAQS 2887 BAA28 178.1
    20 05 RÖTELNVIRUS VPPGKFVTAALLNTP 2888 BAA28 178.1
    20 06 RÖTELNVIRUS WVTPVIGSQARKCGL 2889 BAA28 178.1
    20 07 MUMPS-RUBULAVIRUS GTYRLIPNARANLTA 400 AGC97 176.1
  • I. Abgabe von Prime Editoren
  • In einem anderen Aspekt sieht die vorliegende Offenbarung die Abgabe von Prime Editoren in vitro und in vivo unter Verwendung verschiedener Strategien vor, einschließlich auf getrennten Vektoren unter Verwendung von gespaltenen Inteinen und sowie direkter Abgabestrategien des Ribonukleoproteinkomplexes (d. h. des Prime Editors komplexiert mit dem PEgRNA und/oder der Second-Site-gRNA) unter Verwendung von Techniken wie Elektroporation, Verwendung von kationischen Lipid-vermittelten Formulierungen und induzierten Endocytose-Verfahren unter Verwendung von Rezeptorliganden, die an die Ribonukleotproteinkomplexe fusioniert sind. Alle derartigen Verfahren werden hierin in Betracht gezogen.
  • Übersicht der Abgabe-Optionen
  • In einigen Aspekten stellt die Erfindung Verfahren bereit, umfassend die Abgabe eines oder mehrerer Prime Editor-kodierender Polynukleotide, so wie eines oder mehrerer Vektoren, wie hierin beschrieben, die eine oder mehrere Komponenten des hierin beschriebenen Prime-Editiersystems kodieren, ein oder mehrere Transkripte davon, und/oder eines oder davon transkribierte Proteine in eine Wirtszelle. In einigen Aspekten stellt die Erfindung ferner Zellen bereit, die durch solche Verfahren hergestellt werden, und Organismen (wie Tiere, Pflanzen oder Pilze), die solche Zellen umfassen oder daraus hergestellt werden. In einigen Ausführungsformen wird ein Prime Editor, wie hierin beschrieben, in Kombination mit (und optional komplexiert mit) einer Leitsequenz an eine Zelle geliefert. Herkömmliche Gentransferverfahren auf viraler und nicht-viraler Basis können verwendet werden, um Nukleinsäuren in Säugetierzellen oder Target-Gewebe einzuführen. Solche Verfahren können verwendet werden, um Nukleinsäuren, die Komponenten eines Prime Editors kodieren, an Zellen in Kultur oder in einem Wirtsorganismus zu verabreichen. Nicht-virale Vektorabgabesysteme umfassen DNA-Plasmide, RNA (z. B. ein Transkript eines hierin beschriebenen Vektors), nackte Nukleinsäure und Nukleinsäure, die mit einem Abgabevehikel, wie einem Liposom, komplexiert ist. Virale Vektorabgabesysteme umfassen DNA- und RNA-Viren, die nach Abgabe an die Zelle entweder episomale oder integrierte Genome aufweisen. Eine Übersicht über Gentherapieverfahren finden Sie unter Anderson, Science 256:808-813 (1992); Nabel & Felgner, TIBTECH 11:211-217 (1993); Mitani & Caskey, TIBTECH 11:162-166 (1993); Dillon, TIBTECH 11:167-175 (1993); Miller, Nature 357:455-460 (1992); Van Brunt, Biotechnology 6(10):1149-1154 (1988); Vigne, Restorative Neurology and Neuroscience 8:35-36 (1995); Kremer & Perricaudet, British Medical Bulletin 51(1):31-44 (1995); Haddada et al., in Current Topics in Microbiology and Immunology Doerfler and Bihm (eds) (1995); and Yu et al., Gene Therapy 1:13-26 (1994).
  • Verfahren zur nicht-viralen Abgabe von Nukleinsäuren umfassen Lipofektion, Nukleofektion, Mikroinjektion, Biolistik, Virosomen, Liposomen, Immunoliposomen, Polykation oder Lipid:Nukleinsäure-Konjugate, nackte DNA, künstliche Virionen und Wirkstoff-verstärkte Aufnahme von DNA. Die Lipofektion ist z. B. im US-Pat. Nos. 5,049,386, 4,946,787 ; and 4,897,355 ) beschrieben und Lipofektionsreagenzien werden kommerziell verkauft (z. B., Transfectam™ und Lipofectin™). ationische und neutrale Lipide, die für eine effiziente Rezeptor-Erkennungs-Lipofektion von Polynukleotiden geeignet sind, umfassen die von Feigner, WO 91/17424 ; WO 91/16024 . Die Abgabe kann an Zellen (z. B. in vitro- oder ex vivo-Verabreichung) oder Target-Gewebe (z. B. in vivo-Verabreichung) erfolgen.
  • Die Herstellung von Lipid:Nukleinsäure-Komplexen, einschließlich zielgerichteter Liposomen, wie Immunlipid-Komplexe, ist dem Fachmann gut bekannt (siehe z. B. Crystal, Science 270:404-410 (1995); Blaese et al., Cancer Gene Ther. 2:291-297 (1995); Behr et al., Bioconjugate Chem. 5:382-389 (1994); Remy et al., Bioconjugate Chem. 5:647-654 (1994); Gao et al., Gene Therapy 2:710-722 (1995); Ahmad et al., Cancer Res. 52:4817-4820 (1992); U.S. Pat. Nos. 4,186,183, 4,217,344, 4,235,871, 4,261,975, 4,485,054, 4,501,728, 4,774,085, 4,837,028 , and 4,946,787 ).
  • Die Verwendung von auf RNA- oder DNA-Viren basierenden Systemen zur Abgabe von Nukleinsäuren nutzt hochentwickelte Prozesse, um ein Virus auf spezifische Zellen im Körper zu richten und die virale Nutzlast zum Zellkern zu transportieren. Virale Vektoren können Patienten direkt (in vivo) verabreicht werden oder sie können verwendet werden, um Zellen in vitro zu behandeln, und die modifizierten Zellen können gegebenenfalls Patienten (ex vivo) verabreicht werden. Herkömmliche auf Viren basierende Systeme könnten retrovirale, Lentivirus-, adenovirale, adenoassoziierte und Herpes-simplex-Virusvektoren für den Gentransfer umfassen. Die Integration in das Wirtsgenom ist mit den Retrovirus-, Lentivirus- und Adeno-assoziierten Virus-Gentransferverfahren möglich, was oft zu einer Langzeitexpression des inserierten Transgens führt. Darüber hinaus wurden in vielen verschiedenen Zelltypen und Target-Geweben hohe Transduktionseffizienzen beobachtet.
  • Der Tropismus eines Virus kann durch den Einbau fremder Hüllproteine verändert werden, wodurch die potenzielle Target-Population von Targe-Zellen erweitert wird. Lentivirale Vektoren sind retrovirale Vektoren, die sich nicht teilende Zellen transduzieren oder infizieren können und typischerweise hohe Virustiter produzieren. Die Auswahl eines retroviralen Gentransfersystems würde daher vom Target-Gewebe abhängen. Retrovirale Vektoren bestehen aus cis-wirkenden langen terminalen Wiederholungen mit einer Verpackungskapazität für bis zu 6-10 kb Fremdsequenz. Die minimalen cis-wirkenden LTRs (long terminal repeats - LTR) reichen für die Replikation und Verpackung der Vektoren aus, die dann verwendet werden, um das therapeutische Gen in die Target-Zelle zu integrieren, um eine permanente Transgenexpression bereitzustellen. Weit verbreitete retrovirale Vektoren umfassen solche, die auf dem murinen Leukämievirus (murine leukemia virus - MuLV), dem Gibbonaffen-Leukämievirus (gibbon ape leukemia virus - GaLV), dem Simian-Immuno-Defizienzvirus (Simian Immuno deficiency virus - SIV), dem menschlichen Immunschwächevirus (human immuno deficiency virus - HIV) und Kombinationen davon basieren (siehe z. B. Buchscher et al ., J. Virol. 66:2731-2739 (1992); Johann et al., J. Virol. 66:1635-1640 (1992); Sommnerfelt et al., Virol. 176:58-59 (1990); Wilson et al., J. Virol. 63:2374-2378 (1989); Miller et al., J. Virol. 65:2220-2224 (1991); PCT/US94/05700 ). Bei Anwendungen, bei denen eine vorübergehende Expression bevorzugt wird, können auf Adenovirus basierende Systeme verwendet werden. Vektoren auf Adenovirusbasis sind in vielen Zelltypen zu einer sehr hohen Transduktionseffizienz fähig und erfordern keine Zellteilung. Mit solchen Vektoren wurden hohe Titer und Expressionsniveaus erhalten. Dieser Vektor kann in einem relativ einfachen System in großen Mengen hergestellt werden. Adeno-assoziierte Virus-(„AAV“)-Vektoren können auch verwendet werden, um Zellen mit Target-Nukleinsäuren zu transduzieren, z. B. in der in vitro-Produktion von Nukleinsäuren und Peptiden, und für in vivo und ex vivo Gentherapie-Verfahren (siehe z. B. West et al., Virology 160:38-47 (1987); US-Pat. No. 4,797,368 ; WO 93/24641 ; Kotin, Human Gene Therapy 5:793-801 (1994); Muzyczka, J. Clin. Invest. 94:1351 (1994). Die Konstruktion rekombinanter AAV-Vektoren wird in einer Reihe von Veröffentlichungen beschrieben, einschließlich US-Pat. No. 5,173,414 ; Tratschin et al., Mol. Cell. Biol. 5:3251-3260 (1985); Tratschin, et al., Mol. Cell. Biol. 4:2072-2081 (1984); Hermonat & Muzyczka, PNAS 81:6466-6470 (1984); und Samulski et al., J. Virol. 63:03822-3828 (1989).
  • Verpackungszellen werden typischerweise verwendet, um Viruspartikel zu bilden, die eine Wirtszelle infizieren können. Solche Zellen umfassen 293-Zellen, die Adenoviren verpacken, und ψ2Zellen oder PA317-Zellen, die Retroviren verpacken. Virale Vektoren, die in der Gentherapie verwendet werden, werden normalerweise durch die Herstellung einer Zelllinie erzeugt, die einen Nukleinsäurevektor in ein virales Partikel verpackt. Die Vektoren enthalten typischerweise die minimalen viralen Sequenzen, die für die Verpackung und die anschließende Integration in einen Wirt erforderlich sind, wobei andere virale Sequenzen durch eine Expressionskassette für das/die zu exprimierende(n) Polynukleotid(e) ersetzt werden. Die fehlenden viralen Funktionen werden typischerweise in trans von der Verpackungszellinie geliefert. Beispielsweise besitzen in der Gentherapie verwendete AAV-Vektoren typischerweise nur ITR-Sequenzen aus dem AAV-Genom, die für die Verpackung und Integration in das Wirtsgenom benötigt werden. Virale DNA wird in eine Zelllinie verpackt, die ein Helferplasmid enthält, das für die anderen AAV-Gene, nämlich rep und cap, kodiert, denen jedoch ITR-Sequenzen fehlen. Die Zelllinie kann auch mit dem Adenovirus als Helfer infiziert werden. Das Helfervirus fördert die Replikation des AAV-Vektors und die Expression von AAV-Genen aus dem Helferplasmid. Das Helferplasmid wird aufgrund fehlender ITR-Sequenzen nicht in signifikanten Mengen verpackt. Die Kontamination mit dem Adenovirus kann z. B. durch Hitzebehandlung, auf die Adenoviren empfindlicher sind als AAV, reduziert werden. Dem Fachmann sind zusätzliche Verfahren zur Abgabe von Nukleinsäuren an Zellen bekannt. Siehe zum Beispiel US20030087817 , hierin durch Bezugnahme aufgenommen.
  • In verschiedenen Ausführungsformen können die PE-Konstrukte (einschließlich der Split-Konstrukte) zur Abgabe in einem oder mehreren rAAV-Vektoren konstruiert werden. Ein rAAV in Bezug auf eines der hierin bereitgestellten Verfahren und Zusammensetzungen kann von jedem Serotyp sein, einschließlich jedes Derivats oder Pseudotyps (z. B. 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 2/1, 2/5, 2/8, 2/9, 3/1, 3/5, 3/8 oder 3/9). Ein rAAV kann eine genetische Ladung umfassen (d. h. einen rekombinanten Nukleinsäurevektor, der ein interessierendes Gen exprimiert, wie ein ganzes oder gespaltenes PE-Fusionsprotein, das von dem rAAV in eine Zelle getragen wird), die an eine Zelle abgegeben werden soll. Ein rAAV kann chimär sein.
  • Wie hierin verwendet, bezieht sich der Serotyp eines rAAV auf den Serotyp der Kapsidproteine des rekombinanten Virus. Nicht einschränkende Beispiele für Derivate und Pseudotypen umfassen rAAV2/1, rAAV2/5, rAAV2/8, rAAV2/9, AAV2-AAV3-Hybrid, AAVrh.10, AAVhu.14, AAV3a/3b, AAVrh32.33, AAV-HSC15, AAV-HSC17, AAVhu.37, AAVrh.8, CHt-P6, AAV2.5, AAV6.2, AAV2i8, AAV-HSC15/17, AAVM41, AAV9.45, AAV6(Y445F/Y731F), AAV2.5T, AAV-HAE1/2, AAV clone 32/83, AAVShH10, AAV2 (Y->F), AAV8 (Y733F), AAV2.15, AAV2.4, AAVM41, und AAVr3.45. Ein nicht einschränkendes Beispiel für Derivate und Pseudotypen, die chimäre VP1-Proteine aufweisen, ist rAAV2/5-1VP1u, das das Genom von AAV2, das Kapsid-Rückgrat von AAV5 und VPlu von AAV1 aufweist. Andere nicht einschränkende Beispiele für Derivate und Pseudotypen, die chimäre VP1-Proteine aufweisen, sind rAAV2/5-8VP1u, rAAV2/9-1VP1u und rAAV2/9-8VP1u.
  • AAV-Derivate/Pseudotypen und Verfahren zur Herstellung solcher Derivate/Pseudotypen sind im Stand der Technik bekannt (siehe z. B. Mol Ther. 2012 Apr;20(4):699-708. doi: 10.1038/mt.2011.287. Epub 2012 Jan 24. The AAV vector toolkit: poised at the clinical crossroads. Asokan A1, Schaffer DV, Samulski RJ.). Verfahren zur Herstellung und Verwendung pseudotypisierter rAAV-Vektoren sind im Stand der Technik bekannt (siehe, e.g., Duan et al., J. Virol., 75:7662-7671, 2001; Halbert et al., J. Virol., 74:1524-1532, 2000; Zolotukhin et al., Methods, 28:158-167, 2002; und Auricchio et al., Hum. Molec. Genet., 10:3075-3081, 2001).
  • Verfahren zur Herstellung oder Verpackung von rAAV-Partikeln sind im Stand der Technik bekannt und Reagenzien sind im Handel erhältlich (siehe z. B. Zolotukhin et al. Production and purification of serotype 1, 2, and 5 recombinant adeno-associated viral vectors. Methods 28 (2002) 158-167; und U.S. Patentveröffentlichungsnummern US20070015238 und US20120322861 , die hierin durch Bezugnahme aufgenommen sind; und Plasmide und Kits, erhältlich von ATCC und Cell Biolabs, Inc.). Beispielsweise kann ein Plasmid, das ein interessierendes Gen umfasst, mit einem oder mehreren Helferplasmiden kombiniert werden, die beispielsweise ein rep-Gen (das beispielsweise Rep78, Rep68, Rep52 und Rep40 kodiert) und ein cap-Gen (das VP1, VP2 und VP3 kodiert, einschließlich einer modifizierten VP2-Region, wie hierin beschrieben) enthalten und in rekombinante Zellen transfiziert werden, so dass das rAAV-Partikel verpackt und anschließend gereinigt werden kann.
  • Rekombinantes AAV kann einen Nukleinsäurevektor umfassen, der mindestens umfassen kann: (a) eine oder mehrere heterologe Nukleinsäureregionen, die eine Sequenz umfassen, die ein interessiendes Protein oder Polypeptid oder eine interessiernde RNA (z. B. eine siRNA oder microRNA) kodiert, und (b) eine oder mehrere Regionen, die Inverted Terminal Repeat (ITR)-Sequenzen umfassen (zB Wildtyp-ITR-Sequenzen oder manipulierte ITR-Sequenzen), die die eine oder mehreren Nukleinsäureregionen (z. B. heterologe Nukleinsäureregionen) flankieren. Hierin werden heterologe Nukleinsäureregionen, die eine Sequenz umfassen, die ein interessierendes Protein oder eine interessierende RNA codiert, als interessierende Gene bezeichnet.
  • Jedes der hierin bereitgestellten rAAV-Partikel kann Kapsidproteine aufweisen, die Aminosäuren unterschiedlicher Serotypen außerhalb der VP1u-Region aufweisen. In einigen Ausführungsformen unterscheidet sich der Serotyp des Rückgrats des VP1-Proteins vom Serotyp der ITRs und/oder des Rep-Gens. In einigen Ausführungsformen ist der Serotyp des Rückgrats des VP1-Kapsidproteins eines Partikels derselbe wie der Serotyp der ITRs. In einigen Ausführungsformen ist der Serotyp des Rückgrats des VP1-Kapsidproteins eines Partikels derselbe wie der Serotyp des Rep-Gens. In einigen Ausführungsformen umfassen Kapsidproteine von rAAV-Partikeln Aminosäuremutationen, die zu einer verbesserten Transduktionseffizienz führen.
  • In einigen Ausführungsformen umfasst der Nukleinsäurevektor eine oder mehrere Regionen, die eine Sequenz umfassen, die die Expression der Nukleinsäure (z. B. der heterologen Nukleinsäure) erleichtert, z. B. Expressionskontrollsequenzen, die operativ mit der Nukleinsäure verbunden sind. Im Stand der Technik sind zahlreiche solcher Sequenzen bekannt. Nicht einschränkende Beispiele für Expressionskontrollsequenzen umfassen Promotoren, Isolatoren, Silencer, Response-Elemente, Introns, Enhancer, Initiationsstellen, Terminationssignale und Poly(A)-Schwänze. Jede Kombination solcher Kontrollsequenzen wird hierin in Betracht gezogen (z. B. ein Promotor und ein Enhancer).
  • Endgültige AAV-Konstrukte können eine Sequenz enthalten, die für die PEgRNA kodiert. In anderen Ausführungsformen können die AAV-Konstrukte eine Sequenz enthalten, die die Second-Site-Nicking-Guide-RNA kodiert. In noch anderen Ausführungsformen können die AAV-Konstrukte eine Sequenz enthalten, die die Second-Site-Nicking-Guide-RNA kodiert, und eine Sequenz, die die PEgRNA kodiert.
  • In verschiedenen Ausführungsformen können die PEgRNAs und die Second-Site-Nicking-Guide-RNAs von einem geeigneten Promotor exprimiert werden, wie beispielsweise einem menschlichen U6 (hU6)-Promotor, einem Maus-U6 (mU6)-Promotor oder einem anderen geeigneten Promotor. Die PEgRNAs und die Second-Site-Nicking-Guide-RNAs können von denselben Promotoren oder unterschiedlichen Promotoren angetrieben werden.
  • In einigen Ausführungsformen werden rAAV-Konstrukte oder die hierin beschriebenen Zusammensetzungen einem Patienten enteral verabreicht. In einigen Ausführungsformen werden rAAV-Konstrukte oder die hierin beschriebenen Zusammensetzungen dem Subjekt parenteral verabreicht. In einigen Ausführungsformen werden ein rAAV-Partikel oder die hierin beschriebenen Zusammensetzungen einem Subjekt subkutan, intraokular, intravitreal, subretinal, intravenös (IV), intracerebroventrikulär, intramuskulär, intrathekal (IT), intrazisternal, intraperitoneal, durch Inhalation, topisch oder durch direkte Injektion in eine oder mehrere Zellen, Gewebe oder Organe verabreicht. In einigen Ausführungsformen werden ein rAAV-Partikel oder die hierin beschriebenen Zusammensetzungen dem Subjekt durch Injektion in die Leberarterie oder Pfortader verabreicht.
  • Split-PE-Vektor-basierte Strategien
  • In diesem Aspekt können die Prime Editoren an einer Split-Site geteilt und als zwei Hälften eines ganzen/vollständigen Prime Editors bereitgestellt werden. Die beiden Hälften können an Zellen abgegeben werden (z. B. als exprimierte Proteine oder auf separaten Expressionsvektoren) und sobald sie in der Zelle in Kontakt sind, bilden die beiden Hälften den vollständigen Prime Editor durch die selbstspleißende Wirkung der Inteine auf jeder Prime Editor-Hälfte
    • • Gespaltene Inteinsequenzen können in jede der Hälften des codierten Prime Editors eingebaut werden, um ihre Transplizierung innerhalb der Zelle und die gleichzeitige Wiederherstellung des vollständigen, funktionsfähigen PE zu erleichtern.
  • Diese Split-Intein-basierten Verfahren überwinden mehrere Barrieren für die in-vivo-Verabreichung. Zum Beispiel ist die DNA, die Prime Editoren kodiert, größer als die rAAV-Verpackungsgrenze und erfordert daher spezielle Lösungen. Eine solche Lösung besteht darin, den Editor zu formulieren, der fusioniert ist, um Intein-Paare zu spalten, die in zwei separate rAAV-Partikel verpackt sind, die, wenn sie gemeinsam an eine Zelle abgegeben werden, das funktionelle Editor-Protein rekonstituieren. Mehrere andere spezielle Überlegungen zur Berücksichtigung der einzigartigen Merkmale des Prime-Editings werden beschrieben, einschließlich der Optimierung von Second-Site-Nicking-Targets und der richtigen Verpackung von Prime Editoren in Virusvektoren, einschließlich Lentiviren und rAAV.
  • In diesem Aspekt können die Prime Editoren an einer Split-Site geteilt und als zwei Hälften eines ganzen/vollständigen Prime Editors bereitgestellt werden. Die beiden Hälften können an Zellen abgegeben werden (z. B. als exprimierte Proteine oder auf separaten Expressionsvektoren) und sobald sie in der Zelle in Kontakt sind, bilden die beiden Hälften den vollständigen Prime Editor durch die selbstspleißende Wirkung der Inteine auf jeder Prime Editor-Hälfte
    • • Gespaltene Inteinsequenzen können in jede der Hälften des codierten Prime Editors eingebaut werden, um ihre Transplizierung innerhalb der Zelle und die gleichzeitige Wiederherstellung des vollständigen, funktionsfähigen PE zu erleichtern.
  • 66 stellt eine Ausführungsform eines Prime Editors dar, der als zwei PE-Halbproteine bereitgestellt wird, die als ganzer Prime Editor durch die selbstspleißende Wirkung der Split-Intein-Hälften, die sich am Ende oder Anfang jedes der Prime Editor-Halbproteins befinden, regenerieren. Wie hierin verwendet, bezieht sich der Begriff „PE N-terminale Hälfte“ auf die N-terminale Hälfte eines vollständigen Prime Editors und umfasst das „N-Intein“ am C-terminalen Ende der PE-N-terminalen Hälfte (d. h. des N-terminalen Exteins) des kompletten Prime Editors. Das „N-Intein“ bezieht sich auf die N-terminale Hälfte einer vollständigen, vollständig gebildeten Split-Intein-Einheit. Wie hierin verwendet, bezieht sich der Begriff „PE-C-terminale Hälfte“ auf die C-terminale Hälfte eines vollständigen Prime Editors und umfasst das „C-Intein“ am N-terminalen Ende der C-terminalen Hälfte (d. h. des C-terminalen Exteins) des kompletten Prime Editors. Wenn die beiden Halbproteine, d. h. die N-terminale Hälfte von PE und die C-terminale Hälfte von PE, miteinander in Kontakt kommen, z. B. innerhalb der Zelle, durchlaufen das N-Intein und das C-Intein den gleichzeitigen Prozess der Selbstexzision und die Bildung einer Peptidbindung zwischen dem C-terminalen Ende der N-terminalen Hälfte von PE und dem N-terminalen Ende der C-terminalen Hälfte von PE, um das vollständige Prime Editor-Protein, das die vollständige napDNAbp-Domäne umfasst (z. B. Cas9-Nickase ) und die RT-Domäne zu reformieren. Obwohl in der Zeichnung nicht gezeigt, kann der Prime Editor auch zusätzliche Sequenzen umfassen, einschließlich NLS am N-Terminus und/oder C-Terminus, sowie Aminosäure-Linker-Sequenzen, die jede Domäne verbinden.
  • In verschiedenen Ausführungsformen können die Prime Editoren als zwei Halbproteine (d. h. eine PE-N-terminale Hälfte und eine PE-C-terminale Hälfte) konstruiert werden, indem der gesamte Prime Editor als eine „Split-Site“ „aufgeteilt“ wird. Die „Split-Site“ bezieht sich auf die Stelle der Insertion von Split-InteinSequenzen (d. h. das N-Intein und das C-Intein) zwischen zwei benachbarten Aminosäureresten im Prime Editor. Genauer gesagt bezieht sich die „Split-Site“ auf die Stelle, an der der gesamte Prime Editor in zwei separate Hälften geteilt wird, wobei er in jeder Hälfte an der Split-Site entweder mit dem N-Intein- oder dem C-Intein-Motiv fusioniert ist. Die Split-Site kann sich an jeder geeigneten Stelle im Prime Editor-Fusionsprotein befinden, aber vorzugsweise befindet sich die Split-Site an einer Position, die die Bildung von zwei Halbproteinen ermöglicht, die für die Abgabe geeignet bemessen sind (z. B. durch Expressionsvektor) und wobei die Inteine, die an den Split-Site-Termini mit jeder Proteinhälfte fusioniert sind, zur Verfügung stehen, um ausreichend miteinander zu interagieren, wenn eine Proteinhälfte mit der anderen Proteinhälfte in der Zelle in Kontakt kommt.
  • In einigen Ausführungsformen befindet sich die Split-Site in der napDNAbp-Domäne. In anderen Ausführungsformen befindet sich die Split-Site in der RT-Domäne. In anderen Ausführungsformen befindet sich die Split-Site in einem Linker, der die napDNAbp-Domäne und die RT-Domäne verbindet.
  • In verschiedenen Ausführungsformen erfordert das Split-Site-Design das Auffinden von Sites zum Aufspalten und Einfügen eines N- und C-terminalen Inteins, die beide strukturell permissiv sind, um die beiden halben Prime Editor-Domänen in zwei verschiedene AAV-Genome zu packen. Darüber hinaus können Inteinreste, die für das Trans-Spleißen notwendig sind, eingebaut werden, indem Reste am N-Terminus des C-terminalen Exteins mutiert werden oder Reste eingefügt werden, die eine Intein-„Narbe“ hinterlassen.
  • Beispielhafte Split-Konfigurationen von Split-Prime Editoren, die entweder die SpCas9-Nickase oder die SaCas9-Nickase umfassen, sind wie folgt.
    Figure DE112020001339T5_0233
    Figure DE112020001339T5_0234
    Figure DE112020001339T5_0235
    Figure DE112020001339T5_0236
  • In verschiedenen Ausführungsformen unter Verwendung von SpCas9-Nickase (Seq-ID-Nr: 18, 1368 Aminosäuren) als ein Beispiel, kann die Aufspaltung zwischen zwei beliebigen Aminosäuren zwischen 1 und 1368 erfolgen. Bevorzugte Aufspaltungen befinden sich jedoch zwischen der zentralen Region des Proteins, z. B. von den Aminosäuren 50-1250 oder von 100-1200 oder von 150-1150 oder von 200-1100 oder von 250-1050 oder von 300-1000 oder von 350-950 oder von 400-900 oder von 450-850 oder von 500-800 oder von 550-750 oder von 600-700 von Seq-ID-Nr: 18. In bestimmten beispielhaften Ausführungsformen kann die Aufspaltungsstelle zwischen 740/741 oder 801/802 oder 1010/1011 oder 1041/1042 liegen. In anderen Ausführungsformen kann die Aufspaltungssstelle zwischen 1/2, 2/3, 3/4, 4/5, 5/6, 6/7, 7/8, 8/9, 9/10, 10/11, 12/13, 14/15, 15/16, 17/18, 19/20, 20/21, 21/22, 22/23, 23/24, 24/25, 25/26, 26/27, 27/28 , 28/29, 29/30, 30/31, 31/32, 32/33, 33/34, 34/35, 35/36, 36/37, 38/39, 39/40, 41/42, 42 /43, 43/44, 44/45, 45/46, 46/47, 47/48, 48/49, 49/50, 51/52, 52/53, 53/54, 54/55, 55/56 , 56/57, 57/58, 58/59, 59/60, 61/62, 62/63, 63/64, 64/65, 65/66, 66/67, 67/68, 68/69, 69 /70, 71/72, 72/73, 73/74, 74/75, 75/76, 76/77, 77/78, 78/79, 79/80, 81/82, 82/83, 83/84 , 84/85, 85/86, 86/87, 87/88, 88/89, 89/90 oder zwischen zwei beliebigen Paaren benachbarter Reste zwischen 90-100, 100-150, 150-200, 200-250, 250-300, 300-350, 350-400, 450-500, 500-550, 550-600, 600-650, 650-700, 700-750, 750-800, 800-850, 850-900, 900- 950, 950-1000, 1000-1050, 1050-1100, 1100-1150, 1150-1200, 1200-1250, 1250-1300, 1300-1350 und 1350-1368, bezogen auf SpCas9 von Seq-ID-Nr: 18 liegen, zwischen zwei beliebigen entsprechenden Resten in einer Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 %, 99 % oder 99,9 % Sequenzidentität mit Seq-ID-Nr: 18, oder zwischen zwei beliebigen entsprechenden Resten in einer Variante oder einem Äquivalent von SpCas9 einer der Aminosäuresequenzen Seq-ID-Nrn. 19-88, oder einer Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 %, 99 % oder 99,9 % Sequenzidentität mit einer der Seq-ID-Nrn: 19-88.
  • In verschiedenen Ausführungsformen können die geteilten Inteinsequenzen durch die folgenden Inteinsequenzen konstruiert werden.
    Figure DE112020001339T5_0237
    Figure DE112020001339T5_0238
    Figure DE112020001339T5_0239
  • In verschiedenen anderen Ausführungsformen können die geteilten Inteinsequenzen wie folgt verwendet werden:
    Figure DE112020001339T5_0240
  • In verschiedenen Ausführungsformen können die gespaltenen Inteine verwendet werden, um getrennte Teile eines vollständigen PE-Fusionsproteins separat an eine Zelle abzugeben, die bei Expression in einer Zelle durch das Trans-Spleißen als vollständiges PE-Fusionsprotein rekonstituiert werden.
  • In einigen Ausführungsformen stellt die Offenbarung ein Verfahren zur Abgabe eines PE-Fusionsproteins an eine Zelle bereit, umfassend:
    1. (a) Konstruieren eines ersten Expressionsvektors, der ein N-terminales Fragment des PE-Fusionsproteins kodiert, das an eine erste geteilte Inteinsequenz fusioniert ist;
    2. (b) Konstruieren eines zweiten Expressionsvektors, der ein C-terminales Fragment des PE-Fusionsproteins kodiert, das an eine zweite geteilte Inteinsequenz fusioniert ist;
    3. (c) Abgeben des ersten und zweiten Expressionsvektors an eine Zelle,
    wobei das N-terminale und das C-terminale Fragment als das PE-Fusionsprotein in der Zelle rekonstituiert werden als Ergebnis der Trans-Splicing-Aktivität, die eine Selbstexzision der ersten und zweiten gespaltenen Inteinsequenzen verursacht.
  • Die Split-Site kann in einigen Ausführungsformen irgendwo in der Prime Editor-Fusion liegen, einschließlich der napDNAbp-Domäne, des Linkers oder der Reverse-Transkriptase-Domäne.
  • In anderen Ausführungsformen befindet sich die Split-Site in der napDNAbp-Domäne.
  • In noch anderen Ausführungsformen befindet sich die Split-Site in der reversen Transkriptase- oder Polymerase-Domäne.
  • In noch anderen Ausführungsformen befindet sich die Split-Site im Linker.
  • In verschiedenen Ausführungsformen stellt die vorliegende Offenbarung Prime Editoren bereit, die einen napDNAbp (z. B. eine Cas9-Domäne) und eine Reverse Transkriptase umfassen, wobei einer oder beide von napDNAbp und/oder der reversen Transkriptase ein Intein umfassen, beispielsweise ein ligandenabhängiges Intein. Typischerweise ist das Intein ein ligandenabhängiges Intein, das in Abwesenheit eines Liganden (z. B. kleine Moleküle wie 4-Hydroxytamoxifen, Peptide, Proteine, Polynukleotide, Aminosäuren und Nukleotide) keine oder nur eine minimale Proteinspleißaktivität zeigt. Ligandenabhängige Inteine sind bekannt und umfassen diejenigen, die in der US-Patentanmeldung U.S.S.N. 14/004,280 , veröffentlicht als US 2014/0065711 A1 , deren gesamter Inhalt hierin durch Bezugnahme aufgenommen ist. Darüber hinaus umfasst das Intein bei der Verwendung der Split-Cas9-Architektur in einigen Ausführungsformen eine Aminosäuresequenz ausgewählt aus der Gruppe bestehend aus Seq-ID-Nrn: 8-15, 447, 452, 462, und 472-479.
  • In verschiedenen Ausführungsformen sind die napDNAbp-Domänen kleinere napDNAbp-Domänen im Vergleich zur kanonischen SpCas9-Domäne von Seq- ID-Nr: 18.
  • Das kanonische SpCas9-Protein ist 1368 Aminosäuren lang und hat ein vorhergesagtes Molekulargewicht von 158 Kilodalton. Der Begriff „kleine Cas9-Variante“, wie hierin verwendet, bezieht sich auf jede Cas9-Variante - natürlich vorkommend, technisch hergestellt oder anderweitig - die weniger als mindestens 1300 Aminosäuren oder mindestens weniger als 1290 Aminosäuren oder weniger als 1280 Aminosäuren oder weniger als 1270 Aminosäuren oder weniger als 1260 Aminosäuren oder weniger als 1250 Aminosäuren oder weniger als 1240 Aminosäuren oder weniger als 1230 Aminosäuren oder weniger als 1220 Aminosäuren oder weniger als 1210 Aminosäuren oder weniger als 1200 Aminosäuren oder weniger als 1190 Aminosäuren oder weniger als 1180 Aminosäuren oder weniger als 1170 Aminosäuren oder weniger als 1160 Aminosäuren oder weniger als 1150 Aminosäuren oder weniger als 1140 Aminosäuren oder weniger als 1130 Aminosäuren oder weniger als 1120 Aminosäuren oder weniger als 1110 Aminosäuren oder weniger als 1100 Aminosäuren oder weniger als 1050 Aminosäuren oder weniger als 1000 Aminosäuren oder weniger als 950 Aminosäuren oder weniger als 900 Aminosäuren oder weniger als 850 Aminosäuren oder weniger als 800 Aminosäuren oder weniger als 75 0 Aminosäuren oder weniger als 700 Aminosäuren oder weniger als 650 Aminosäuren oder weniger als 600 Aminosäuren oder weniger als 550 Aminosäuren oder weniger als 500 Aminosäuren, aber mindestens mehr als etwa 400 Aminosäuren und die erforderlichen Funktionen des Cas9-Proteins beibehält.
  • In einer Ausführungsform, wie in Beispiel 20 dargestellt, umfasst die Spezifikation die folgenden Split-Intein-PE-Konstrukte, die zwischen den Resten 1024 und 1025 des kanonischen SpCas9 (Seq-ID-Nr: 18) gespalten sind (oder die als Reste 1023 bzw. 1024 bezeichnet werden können bezogen auf eine Met-Minus-Seq-ID-Nr: 18).
  • Zuerst ist die Aminosäuresequenz von Seq-ID-Nr: 18 wie folgt gezeigt, die die Position der Split-Site zwischen 1024 („K“) und 1025 („S“) Resten anzeigt:
    Figure DE112020001339T5_0241
    Figure DE112020001339T5_0242
  • In dieser Konfiguration ist die Aminosäuresequenz der N-terminalen Hälfte (Aminosäuren 1-1024) wie folgt:
    Figure DE112020001339T5_0243
  • In dieser Konfiguration ist die Aminosäuresequenz der N-terminalen Hälfte (Aminosäuren 1-1023) (wobei das Protein Met-Minus an Position 1 ist) wie folgt:
    Figure DE112020001339T5_0244
    Figure DE112020001339T5_0245
  • In dieser Konfiguration ist die Aminosäuresequenz der C-terminalen Hälfte (Aminosäuren 1024-1368 (oder gezählt als Aminosäuren 1023-1367 in einem Met-Minus-Cas9) wie folgt:
    Figure DE112020001339T5_0246
  • Wie in Beispiel 20 gezeigt, ist das PE2-Konstrukt (basierend auf SpCas9 von Seq-ID-Nr: 18) an Position 1023/1024 aufgespalten (relativ zu einer Met-Minus Seq-ID-Nr 18) in zwei separate Konstrukte, wie folgt
  • SpPE2-Split bei 1023/1024 N-Terminal-Hälfte
  • Figure DE112020001339T5_0247
    Figure DE112020001339T5_0248
  • Legende: NLS, Cas9, mutierte Reste, Linker, NpuN-Intein, NpuC-Intein, RT
  • SpPE2-Split bei 1023/1024, C-Terminal-Hälfte
  • Figure DE112020001339T5_0249
    Figure DE112020001339T5_0250
  • Legende: NLS, Cas9, mutierte Reste, Linker, NpuN-Intein, NpuC-Intein, RT
  • Die vorliegende Offenbarung erwägt auch Verfahren zum Abgeben von Split-Intein-Prime Editoren an Zellen und/oder Behandeln von Zellen mit Split-Intein-Prime Editoren.
  • In einigen Ausführungsformen stellt die Offenbarung ein Verfahren zur Abgabe eines PE-Fusionsproteins an eine Zelle bereit, umfassend:
    1. (a) Konstruieren eines ersten Expressionsvektors, der ein N-terminales Fragment des PE-Fusionsproteins kodiert, das an eine erste geteilte Inteinsequenz fusioniert ist;
    2. (b) Konstruieren eines zweiten Expressionsvektors, der ein C-terminales Fragment des PE-Fusionsproteins kodiert, das an eine zweite geteilte Inteinsequenz fusioniert ist;
    3. (c) Abgeben des ersten und zweiten Expressionsvektors an eine Zelle,
    wobei das N-terminale und das C-terminale Fragment als das PE-Fusionsprotein in der Zelle rekonstituiert werden als Ergebnis der Trans-Splicing-Aktivität, die eine Selbstexzision der ersten und zweiten gespaltenen Inteinsequenzen verursacht.
  • In bestimmten Ausführungsformen ist das N-terminale Fragment des PE-Fusionsproteins, das an eine erste geteilte Inteinsequenz fusioniert ist, Seq-ID-Nr: 3875, oder eine Aminosäuresequenz mit mindestens 80 %, mindestens 85 %, mindestens 90 %, mindestens 95 %, mindestens 98 % oder mindestens 99,9 % Sequenzidentität mit Seq-ID-Nr: 3875.
  • In anderen Ausführungsformen ist das C-terminale Fragment des PE-Fusionsproteins, das an eine erste geteilte Inteinsequenz fusioniert ist, Seq-ID-Nr: 3876, oder eine Aminosäuresequenz mit mindestens 80 %, mindestens 85 %, mindestens 90 %, mindestens 95 %, mindestens 98 % oder mindestens 99,9 % Sequenzidentität mit Seq-ID-Nr: 3876.
  • In anderen Ausführungsformen stellt die Offenbarung ein Verfahren zum Editing einer DNA-Sequenz innerhalb einer Zelle bereit, umfassend:
    1. (a) Konstruieren eines ersten Expressionsvektors, der ein N-terminales Fragment des PE-Fusionsproteins kodiert, das an eine erste geteilte Inteinsequenz fusioniert ist;
    2. (b) Konstruieren eines zweiten Expressionsvektors, der ein C-terminales Fragment des PE-Fusionsproteins kodiert, das an eine zweite geteilte Inteinsequenz fusioniert ist;
    3. (c) Abgeben des ersten und zweiten Expressionsvektors an eine Zelle,
    wobei das N-terminale und das C-terminale Fragment als das PE-Fusionsprotein in der Zelle rekonstituiert werden als Ergebnis der Trans-Splicing-Aktivität, die eine Selbstexzision der ersten und zweiten gespaltenen Inteinsequenzen verursacht.
  • In bestimmten Ausführungsformen ist das N-terminale Fragment des PE-Fusionsproteins, das an eine erste geteilte Inteinsequenz fusioniert ist, Seq-ID-Nr: 3875, oder eine Aminosäuresequenz mit mindestens 80 %, mindestens 85 %, mindestens 90 %, mindestens 95 %, mindestens 98 % oder mindestens 99,9 % Sequenzidentität mit Seq-ID-Nr: 3875.
  • In anderen Ausführungsformen ist das C-terminale Fragment des PE-Fusionsproteins, das an eine erste geteilte Inteinsequenz fusioniert ist, Seq-ID-Nr: 3876, oder eine Aminosäuresequenz mit mindestens 80 %, mindestens 85 %, mindestens 90 %, mindestens 95 %, mindestens 98 % oder mindestens 99,9 % Sequenzidentität mit Seq-ID-Nr: 3876.
  • Abgabe von PE-Ribonukleoprotein-Komplexen
  • In diesem Aspekt können die Prime Editoren durch nicht-virale Abgabestrategien angegeben werden, die die Abgabe eines mit einer PEgRNA (d. h. einem PE-Ribonukleoprotein-Komplex) komplexierten Prime Editors durch verschiedene Verfahren beinhalten, einschließlich Elektroporation und Lipid-Nanopartikel. Verfahren zur nicht-viralen Abgabe von Nukleinsäuren umfassen Lipofektion, Nukleofektion, Mikroinjektion, Biolistik, Virosomen, Liposomen, Immunoliposomen, Polykation oder Lipid:Nukleinsäure-Konjugate, nackte DNA, künstliche Virionen und Wirkstoff-verstärkte Aufnahme von DNA. Die Lipofektion ist z. B. im US-Pat. Nos. 5,049,386, 4,946,787 ; and 4,897,355 ) beschrieben und Lipofektionsreagenzien werden kommerziell verkauft (z. B., Transfectam™ und Lipofectin™). ationische und neutrale Lipide, die für eine effiziente Rezeptor-Erkennungs-Lipofektion von Polynukleotiden geeignet sind, umfassen die von Feigner, WO 91/17424 ; WO 91/16024 . Die Abgabe kann an Zellen (z. B. in vitro- oder ex vivo-Verabreichung) oder Target-Gewebe (z. B. in vivo-Verabreichung) erfolgen.
  • Die Herstellung von Lipid:Nukleinsäure-Komplexen, einschließlich zielgerichteter Liposomen, wie Immunlipid-Komplexe, ist dem Fachmann gut bekannt (siehe z. B. Crystal, Science 270:404-410 (1995); Blaese et al., Cancer Gene Ther. 2:291-297 (1995); Behr et al., Bioconjugate Chem. 5:382-389 (1994); Remy et al., Bioconjugate Chem. 5:647-654 (1994); Gao et al., Gene Therapy 2:710-722 (1995); Ahmad et al., Cancer Res. 52:4817-4820 (1992); U.S. Pat. Nos. 4,186,183, 4,217,344, 4,235,871, 4,261,975, 4,485,054, 4,501,728, 4,774,085, 4,837,028 , and 4,946,787 ).
  • Zusätzlich kann auf die folgenden Referenzen verwiesen werden, die Ansätze für die nicht-virale Abgabe von Ribonukleoproteinkomplexen diskutieren, von denen jede hierin durch Bezugnahme aufgenommen ist.
    • Chen, Sean, et al. „Highly efficient mouse genome editing by CRISPR ribonucleoprotein electroporation of zygotes.“ Journal of Biological Chemistry (2016): jbc-M116. PubMed
    • Zuris, John A., et al. „Cationic lipid-mediated delivery of proteins enables efficient protein-based genome editing in vitro and in vivo.“ Nature biotechnology 33.1 (2015): 73. PubMed
    • Rouet, Romain, et al. „Receptor-Mediated Delivery of CRISPR-Cas9 Endonuclease for Cell-Type-Specific Gene Editing.“ Journal of the American Chemical Society 140.21 (2018): 6596-6603. PubMed.
  • 68C stellt Daten bereit, die zeigen, dass verschiedene offenbarte PE-Ribonukleoproteinkomplexe (PE2 bei hoher Konzentration, PE3 bei hoher Konzentration und PE3 bei niedriger Konzentration) auf diese Weise abgegeben werden können.
  • Abgabe von PE durch mRNA
  • Ein weiteres Verfahren, das verwendet werden kann, um Prime Editoren und/oder PEgRNAs an Zellen abzugeben, in denen eine auf Prime-Editierung basierende Genom-Editierung erwünscht ist, besteht in der Verwendung von Boten-RNA-(mRNA)-Abgabemethoden und -technologien. Beispiele für mRNA-Abgabeverfahren und - Zusammensetzungen, die in der vorliegenden Offenbarung verwendet werden können, umfassen beispielsweise PCT/US2014/028330 , US8822663B2 , NZ700688A , ES2740248T3 , EP2755693A4 , EP2755986A4 , WO2014152940A1 , EP3450553B1 , BR112016030852A2 und EP3362461A1 , die hierin jeweils durch Bezugnahme in ihrer Gesamtheit enthalten sind. Eine zusätzliche Offenbarung, die hiermit durch Bezugnahme aufgenommen wird, findet sich in Kowalski et al., „Delivering the Messenger: Advances in Technologies for Therapeutic mRNA Delivery,“ Mol Therap., 2019; 27(4): 710-728.
  • Im Gegensatz zu DNA-Vektoren, die Prime Editoren kodieren, hat die Verwendung von RNA als Transportmittel für Prime Editoren den Vorteil, dass das genetische Material nicht in den Zellkern eindringen muss, um seine Funktion zu erfüllen. Die zugeführte mRNA kann direkt im Zytoplasma in das gewünschte Protein (z. B. Prime Editor-Fusionsprotein) und Nukleinsäureprodukte (z. B. PEgRNA) translatiert werden. Um jedoch stabiler zu sein (z. B. RNA-abbauenden Enzymen im Zytoplasma zu widerstehen), ist es in einigen Ausführungsformen notwendig, die mRNA zu stabilisieren, um die Abgabeeffizienz zu verbessern. Bestimmte Transportträger wie kationische Lipide oder polymere Transportträger können auch dazu beitragen, die transfizierte mRNA vor endogenen RNase-Enzymen zu schützen, die andernfalls die therapeutische mRNA abbauen könnten, die die gewünschten Prime Editor-Fusionsproteine kodiert. Darüber hinaus bleibt trotz der erhöhten Stabilität der modifizierten mRNA die Abgabe von mRNA, insbesondere von mRNA, die Protein in voller Länge kodiert, an Zellen in vivo auf eine Weise, die therapeutische Mengen an Proteinproduktion ermöglicht, eine Herausforderung.
  • Mit einigen Ausnahmen ist der intrazelluläre Transport von mRNA im Allgemeinen schwieriger als der von kleinen Oligonukleotiden und erfordert die Einkapselung in ein Transport-Nanopartikel, teilweise aufgrund der deutlich größeren Größe der mRNA-Moleküle (300-5.000 kDa, ~1-15 kb) im Vergleich zu anderen RNA-Typen (kleine interferierende RNAs [siRNAs], ~14 kDa; Antisense-Oligonukleotide [ASOs], 4-10 kDa).
  • mRNA muss die Zellmembran passieren, um das Zytoplasma zu erreichen. Die Zellmembran ist eine dynamische und gewaltige Barriere für die intrazelluläre Abgabe. Es besteht hauptsächlich aus einer Lipiddoppelschicht aus zwitterionischen und negativ geladenen Phospholipiden, wobei die polaren Köpfe der Phospholipide zur wässrigen Umgebung zeigen und die hydrophoben Schwänze einen hydrophoben Kern bilden.
  • In einigen Ausführungsformen umfassen die mRNA-Zusammensetzungen der Offenbarung mRNA (die einen Prime Editor und/oder PEgRNA codiert), ein Transportvehikel und optional ein Mittel, das den Kontakt mit der Target-Zelle und die anschließende Transfektion erleichtert.
  • In einigen Ausführungsformen kann die mRNA eine oder mehrere Modifikationen beinhalten, die der mRNA Stabilität verleihen (z. B. im Vergleich zur Wildtyp- oder nativen Version der mRNA) und an der damit verbundenen abnormalen Expression des Proteins beteiligt sind. Eine oder mehrere Modifikationen des Wildtyps, die den Defekt korrigieren, können ebenfalls enthalten sein. Zum Beispiel können die Nukleinsäuren der Erfindung Modifikationen einer oder beider einer 5'-untranslatierten Region oder einer 3'-untranslatierten Region umfassen. Solche Modifikationen können den Einschluss von Sequenzen umfassen, die eine Teilsequenz des Immediate-Early-1-(IE1)-Gens des Cytomegalovirus (CMV), des Poly-A-Schwanzes, der Cap1-Struktur oder des menschlichen Wachstumshormons (hGH) codieren. In einigen Ausführungsformen wird die mRNA modifiziert, um die mRNA-Immunogenität zu reduzieren.
  • In einer Ausführungsform kann die „Prime Editor“-mRNA in der Zusammensetzung der Erfindung in einem Liposomentransfervehikel formuliert werden, um die Abgabe an Target-Zellen zu erleichtern. In Betracht gezogene Transfervehikel können ein oder mehrere kationische Lipide, nicht-kationische Lipide und/oder PEG-modifizierte Lipide umfassen. Zum Beispiel kann das Transfervehikel mindestens eines der folgenden kationischen Lipide beinhalten: C12-200, DLin-KC2-DMA, DODAP, HGT4003, ICE, HGT5000 oder HGT5001. In Ausführungsformen umfasst das Transfervehikel Cholesterin (Chol) und/oder PEG-modifizierte Lipide. In einigen Ausführungsformen umfasst das Transfervehikel DMG-PEG2K. In bestimmten Ausführungsformen weist das Transfervehikel die folgende Lipidformulierung auf: C12-200, DOPE, chol, DMG-PEG2K; DODAP, DOPE, cholesterol, DMG-PEG2K; HGT5000, DOPE, chol, DMG-PEG2K, HGT5001, DOPE, chol, eines von DMG-PEG2K.
  • Die vorliegende Offenbarung stellt auch Zusammensetzungen und Verfahren bereit, die zum Erleichtern der Transfektion von Target-Zellen mit einem oder mehreren PE-kodierenden mRNA-Molekülen nützlich sind. Zum Beispiel erwägen die Zusammensetzungen und Verfahren der vorliegenden Erfindung die Verwendung von Targeting-Liganden, die die Affinität der Zusammensetzung für eine oder mehrere Target-Zellen erhöhen können. In einer Ausführungsform ist der Targeting-Ligand Apolipoprotein B oder Apolipoprotein E und die entsprechenden Targe-Zellen exprimieren Lipoproteinrezeptoren niedriger Dichte und fördern somit die Erkennung des Targeting-Liganden. Eine große Anzahl von Target-Zellen kann unter Verwendung der Methoden und Zusammensetzungen der vorliegenden Offenbarung bevorzugt ausgerichtet werden. Zu den in Betracht gezogenen Targe-Zellen gehören beispielsweise Hepatozyten, Epithelzellen, hämatopoetische Zellen, Epithelzellen, Endothelzellen, Lungenzellen, Knochenzellen, Stammzellen, Mesenchymzellen, Nervenzellen, Herzzellen, Adipozyten, vaskuläre, glatte Muskelzellen, Kardiomyozyten, Skelettmuskelzellen, Betazellen, Hypophysenzellen, Synovialschleimhautzellen, Eierstockzellen, Hodenzellen, Fibroblasten, B-Zellen, T-Zellen, Retikulozyten, Leukozyten, Granulozyten und Tumorzellen. Dies ist jedoch nicht darauf beschränkt.
  • In einigen Ausführungsformen kann die PE-kodierende mRNA optional chemische oder biologische Modifikationen aufweisen, die beispielsweise die Stabilität und/oder Halbwertszeit einer solchen mRNA verbessern oder die Proteinproduktion verbessern oder anderweitig erleichtern. Bei der Transfektion kann eine natürliche mRNA in den Zusammensetzungen der Erfindung mit einer Halbwertszeit zwischen 30 Minuten und mehreren Tagen zerfallen. Die mRNAs in den Zusammensetzungen der Offenbarung können zumindest eine gewisse Fähigkeit zur Translation beibehalten, wodurch ein funktionelles Protein oder Enzym hergestellt wird. Dementsprechend stellt die Erfindung Zusammensetzungen bereit, die eine stabilisierte mRNA umfassen und Verfahren zum Verabreichen. In einigen Ausführungsformen wird die Aktivität der mRNA über einen längeren Zeitraum verlängert. Zum Beispiel kann die Aktivität der mRNA verlängert werden, so dass die Zusammensetzungen der vorliegenden Offenbarung einem Subjekt auf halbwöchentlicher oder zweiwöchentlicher Basis oder bevorzugter auf einer monatlichen, zweimonatlichen, vierteljährlichen oder jährlichen Basis verabreicht werden. Die verlängerte oder verlängerte Aktivität der mRNA der vorliegenden Erfindung steht in direktem Zusammenhang mit der Menge an Protein oder Enzym, die aus einer solchen mRNA produziert wird. In ähnlicher Weise kann die Aktivität der Zusammensetzungen der vorliegenden Offenbarung durch Modifikationen, die vorgenommen werden, um die Translation der mRNA zu verbessern oder zu verstärken, weiter verlängert oder erweitert werden. Darüber hinaus ist die Menge an funktionellem Protein oder Enzym, die von der Targe-Zelle produziert wird, eine Funktion der Menge der an die Targe-Zellen abgegebenen mRNA und der Stabilität einer solchen mRNA. Soweit die Stabilität der mRNA der vorliegenden Erfindung verbessert oder erhöht werden kann, können die Halbwertszeit, die Aktivität des produzierten Proteins oder Enzyms und die Dosierungshäufigkeit der Zusammensetzung weiter verlängert werden.
  • Dementsprechend umfasst die mRNA in den Zusammensetzungen der Offenbarung in einigen Ausführungsformen mindestens eine Modifikation, die der Nukleinsäure eine erhöhte oder verbesserte Stabilität verleiht, einschließlich beispielsweise einer verbesserten Resistenz gegenüber Nukleaseverarbeitung in vivo. Wie hierin verwendet, umfassen die Begriffe „Modifikation“ und „modifiziert“, da sich diese Begriffe auf die hierin bereitgestellten Nukleinsäuren beziehen, mindestens eine Änderung, die vorzugsweise die Stabilität erhöht und die mRNA stabiler macht (z. B. resistenter gegen Nukleaseverdauung) als die Wild -Typ- oder natürlich vorkommende Version der mRNA. Wie hierin verwendet, beziehen sich die Begriffe „stabil“ und „Stabilität“ als solche Begriffe auf die Nukleinsäuren der vorliegenden Erfindung, und beziehen sich insbesondere in Bezug auf die mRNA, auf eine erhöhte oder verstärkte Widerstandsfähigkeit gegenüber einem Abbau durch beispielsweise Nukleasen (d. h. Endonukleasen oder Exonukleasen), die normalerweise in der Lage sind, solche mRNA abzubauen. Erhöhte Stabilität kann beispielsweise eine geringere Empfindlichkeit gegenüber Hydrolyse oder andere Zerstörung durch endogene Enzyme (z. B. Endonukleasen oder Exonukleasen) oder Bedingungen innerhalb der Targe-Zelle oder des Target-Gewebes umfassen, wodurch die Verweildauer solcher mRNA in der Targe-Zelle, dem Gewebe, Subjekt und/oder Zytoplasma erhöht oder verbessert wird. Die hier bereitgestellten stabilisierten mRNA-Moleküle zeigen längere Halbwertszeiten im Vergleich zu ihren natürlich vorkommenden, unmodifizierten Gegenstücken (z. B. der Wildtyp-Version der mRNA). Von den Begriffen „Modifikation“ und „modifiziert“ als solche Begriffe, die sich auf die mRNA der vorliegenden Erfindung beziehen, werden auch Veränderungen in Betracht gezogen, die die Translation von mRNA-Nukleinsäuren verbessern oder verstärken, einschließlich beispielsweise der Aufnahme von Sequenzen, die bei der Initiation von Proteintranslation wirken (z. B. die Kozak-Konsensussequenz). (Kozak, M., Nucleic Acids Res 15 (20): 8125-48 (1987)).
  • In einigen Ausführungsformen wurden die in den Zusammensetzungen der Offenbarung verwendeten mRNAs einer chemischen oder biologischen Modifikation unterzogen, um sie stabiler zu machen. Beispielhafte Modifikationen an einer mRNA umfassen die Verarmung einer Base (z. B. durch Deletion oder durch die Substitution eines Nukleotids durch ein anderes) oder die Modifikation einer Base, z. B. die chemische Modifikation einer Base. Der Ausdruck „chemische Modifikationen“, wie er hier verwendet wird, schließt Modifikationen ein, die Chemien einführen, die sich von denen in natürlich vorkommender mRNA unterscheiden, zum Beispiel kovalente Modifikationen wie die Einführung modifizierter Nukleotide (z. B. Nukleotidanaloga oder die Aufnahme von Seitengruppen, die in solchen mRNA-Molekülen nicht natürlich vorkommen).
  • Andere geeignete Polynukleotid-Modifikationen, die in die PE-kodierende mRNA eingebaut werden können, die in den Zusammensetzungen der Offenbarung verwendet wird, umfassen, sind aber nicht beschränkt auf 4'-Thio-modifizierte Basen: 4'-Thio-Adenosin, 4'-Thio-Guanosin, 4'-Thio-Cytidin, 4'-Thio-Uridin, 4'-Thio-5-Methyl-Cytidin, 4'-Thio-Pseudouridin und 4'- Thio-2-thiouridin, Pyridin-4-on-Ribonukleosid, 5-Aza-Uridin, 2-Thio-5-Aza-Uridin, 2-Thiouridin, 4-Thio-Pseudouridin, 2-Thio-Pseudouridin, 5-Hydroxyuridin, 3 -Methyluridin, 5-Carboxymethyl-Uridin, 1-Carboxymethyl-Pseudouridin, 5-Propinyl-Uridin, 1-Propinyl-Pseudouridin, 5-Taurinomethyluridin, 1-Taurinomethyl-Pseudouridin, 5-Taurinomethyl-2-thio-uridin, 1-Taurinomethyl -4-Thio-uridin, 5-Methyl-uridin, 1-Methyl-Pseudouridin, 4-Thio-1-Methyl-Pseudouridin, 2-Thio-1-Methyl-Pseudouridin, 1-Methyl-1-Deaza-Pseudouridin, 2 -Thio-1-methyl-1-deaza-pseudouridin, Dihydrouridin, Dihydropseudouridin, 2-Thio-dihydrouridin, 2-Thio-dihydropseudouridin, 2-Methoxyuridin, 2-Methoxy-4-thio-uridin, 4-Methoxy-pseudouridin, 4 -Methoxy-2-thio-pseudouridin, 5-Aza-Cytidin, Pseudoisocytidin, 3-Methyl-Cytidin, N4-Acetylcytidin, 5-Formylcytidin, N4-Methylcy Tidin, 5-Hydroxymethylcytidin, 1-Methyl-Pseudoisocytidin, Pyrrolo-Cytidin, Pyrrolo-Pseudoisocytidin, 2-Thio-Cytidin, 2-Thio-5-Methyl-Cytidin, 4-Thio-Pseudoisocytidin, 4-Thio-1-Methyl-Pseudoisocytidin, 4-Thio-1-Methyl-1-Deaza-Pseudoisocytidin, 1-Methyl-1-Deaza-Pseudoisocytidin, Zebularin, 5-Aza-Zebularin, 5-Methyl-Zebularin, 5-Aza-2-Thio-Zebularin, 2-Thio-Zebularin, 2-Methoxy-Cytidin, 2-Methoxy-5-Methyl-Cytidin, 4-Methoxy-Pseudoisocytidin, 4-Methoxy-1-Methyl-Pseudoisocytidin, 2-Aminopurin, 2,6-Diaminopurin, 7- Deaza-Adenin, 7-Deaza-8-Aza-Adenin, 7-Deaza-2-Aminopurin, 7-Deaza-8-Aza-2-Aminopurin, 7-Deaza-2,6-Diaminopurin, 7-Deaza-8- Aza-2,6-diaminopurin, 1-Methyladenosin, N6-Methyladenosin, N6-Isopentenyladenosin, N6-(cis-Hydroxyisopentenyl)adenosin, 2-Methylthio-N6-(cis-Hydroxyisopentenyl)adenosin, N6-Glycinylcarbamoyladenosin, N6-Threonyl, 2-Methylthio-N6-Threonylcarbamoyladenosin, N6,N6-Dimethyladenosin, 7-Methyladenin, 2-Methylthio -Adenin und 2-Methoxy-Adenin, Inosin, 1-Methyl-Inosin, Wyosin, Wybutosin, 7-Deaza-Guanosin, 7-Deaza-8-Aza-Guanosin, 6-Thio-Guanosin, 6-Thio-7- Deaza-Guanosin, 6-Thio-7-Deaza-8-Aza-Guanosin, 7-MethylGuanosin, 6-Thio-7-Methyl-Guanosin, 7-Methylinosin, 6-Methoxy-Guanosin, 1-Methylguanosin, N2- Methylguanosin, N2,N2-Dimethylguanosin, 8-Oxo-Guanosin, 7-Methyl-8-oxo-guanosin, 1-Methyl-6-thio-guanosin, N2-Methyl-6-thio-guanosin und N2,N2-dimethyl -6-Thioguanosin und Kombinationen davon. Der Begriff Modifikation umfasst beispielsweise auch den Einbau von Nicht-Nukleotid-Bindungen oder modifizierten Nukleotiden in die mRNA-Sequenzen der vorliegenden Erfindung (z. B. Modifikationen an einem oder beiden der 3'- und 5'-Enden eines mRNA-Moleküls, das ein funktionelles Protein oder Enzym). Solche Modifikationen umfassen das Hinzufügen von Basen zu einer mRNA-Sequenz (z. B. die Aufnahme eines Poly-A-Schwanzes oder eines längeren Poly-A-Schwanzes), die Veränderung der 3'-UTR oder der 5'-UTR, die Komplexierung der mRNA mit einem Agent (z. B.ein Protein oder ein komplementäres Nukleinsäuremolekül) und Einschluss von Elementen, die die Struktur eines mRNA-Moleküls verändern (z. B. die Sekundärstrukturen bilden).
  • In einigen Ausführungsformen umfassen PE-kodierende mRNAs eine 5'-Cap-Struktur. Ein 5'-Cap wird typischerweise wie folgt hinzugefügt: Zuerst entfernt eine RNA-terminale Phosphatase eine der terminalen Phosphatgruppen vom 5'-Nukleotid, wodurch zwei terminale Phosphate zurückbleiben; Guanosintriphosphat (GTP) wird dann über eine Guanylyltransferase zu den terminalen Phosphaten hinzugefügt, wodurch eine 5'5'5-Triphosphatbindung erzeugt wird; und der 7-Stickstoff von Guanin wird dann durch eine Methyltransferase methyliert. Beispiele für Kappenstrukturen umfassen, aber sind nicht beschränkt auf m7G(5')ppp (5'(A,G(5')ppp(5')A und G(5')ppp(5')G. Natürlich vorkommende Cap-Strukturen umfassen ein 7-Methylguanosin, das über eine Triphosphatbrücke mit dem 5'-Ende des ersten transkribierten Nukleotids verbunden ist, was zu einem Dinukleotid-Cap von m7G(5')ppp(5')N führt, wobei N irgendein Nukleosid ist. In vivo wird die Kappe enzymatisch hinzugefügt. Die Kappe wird im Zellkern hinzugefügt und durch das Enzym Guanylyltransferase katalysiert. Die Anfügung des Caps an das 5'-terminale Ende der RNA erfolgt unmittelbar nach Initiation der Transkription. Das terminale Nukleosid ist typischerweise ein Guanosin und hat die reverse Orientierung zu allen anderen Nukleotiden, d. h. G(5')ppp(5')GpNpNp.
  • Zusätzliche Cap-Analoga umfassen, sind aber nicht beschränkt auf chemische Strukturen, ausgewählt aus der Gruppe bestehend aus m7GpppG, m7GpppA, m7GpppC; unmethylierte Cap-Analoga (z. B. GpppG); dimethyliertes Cap-Analogon (z. B. m2,7GpppG), trimethyliertes Cap-Analogon (z. B. m2, 2, 7GpppG), dimethylierte symmetrische Cap-Analoga (z. B. m7Gpppm7G) oder Anti-Reverse-Cap-Analoga (z. B. ARCA; m7,2'OmeGpppG, m72'dGpppG, m7,3'OmeGpppG, m7,3'dGpppG und deren Tetraphosphat-Derivate) (siehe z. B. Jemieliity, J. et al., „Novel ‚anti-reverse‘ cap analogs with superior translational properties“, RNA, 9: 1108-1122 (2003)).
  • Typischerweise dient die Anwesenheit eines „Schwanzes“ dazu, die mRNA vor dem Abbau durch Exonuklease zu schützen. Es wird angenommen, dass ein Poly-A- oder Poly-U-Schwanz natürliche Botenstoffe und synthetische Sense-RNA stabilisiert. Daher kann in bestimmten Ausführungsformen ein langer Poly-A- oder Poly-U-Schwanz zu einem mRNA-Molekül hinzugefügt werden, wodurch die RNA stabiler wird. Poly-A- oder Poly-U-Schwänze können mit einer Vielzahl von anerkannten Techniken hinzugefügt werden. Zum Beispiel können lange Poly-A-Schwänze an synthetische oder in vitro transkribierte RNA unter Verwendung von Poly-A-Polymerase hinzugefügt werden (Yokoe et al. Nature Biotechnology. 1996; 14; 1252-1256). Ein Transkriptionsvektor kann auch lange Poly-A-Schwänze kodieren. Außerdem können Poly-A-Schwänze durch Transkription direkt aus PCR-Produkten hinzugefügt werden. Poly A kann auch mit RNA-Ligase an das 3'-Ende einer Sense-RNA ligiert werden (siehe z. B. Molecular Cloning A Laboratory Manual, 2nd Ed., ed. by Sambrook, Fritsch and Maniatis (Cold Spring Harbor Laboratory Press: 1991 edition)).
  • Typischerweise kann die Länge eines Poly-A- oder Poly-U-Schwanzes mindestens etwa 10, 50, 100, 200, 300, 400 oder mindestens 500 Nukleotide betragen. In einigen Ausführungsformen umfasst ein Poly-A-Schwanz am 3'-Terminus von mRNA typischerweise etwa 10 bis 300 Adenosinnukleotide (z. B. etwa 10 bis 200 Adenosinnukleotide, etwa 10 bis 150 Adenosinnukleotide, etwa 10 bis 100 Adenosinnukleotide, etwa 20 bis 70 Adenosinnukleotide oder etwa 20 bis 60 Adenosinnukleotide). In einigen Ausführungsformen umfassen mRNAs eine 3'-Poly(C)-Schwanzstruktur. Ein geeigneter Poly-C-Schwanz am 3'-Terminus der mRNA umfasst typischerweise etwa 10 bis 200 Cytosinnukleotide (z. B. etwa 10 bis 150 Cytosinnukleotide, etwa 10 bis 100 Cytosinnukleotide, etwa 20 bis 70 Cytosinnukleotide, etwa 20 bis 60 Cytosin Nukleotide oder etwa 10 bis 40 Cytosinnukleotide). Der Poly-C-Schwanz kann dem Poly-A-oder Poly-U-Schwanz hinzugefügt werden oder kann den Poly-A- oder Poly-U-Schwanz ersetzen.
  • PE-kodierende mRNAs gemäß der vorliegenden Offenbarung können gemäß einer Vielzahl bekannter Verfahren synthetisiert werden. Beispielsweise können mRNAs gemäß der vorliegenden Erfindung über In-vitro-Transkription (IVT) synthetisiert werden. Kurz gesagt wird IVT typischerweise mit einer linearen oder zirkulären DNA-Matrize durchgeführt, die einen Promotor, einen Pool von Ribonukleotidtriphosphaten, ein Puffersystem, das DTT und Magnesiumionen enthalten kann, und eine geeignete RNA-Polymerase (z. B. T3-, T7- oder SP6-RNA-Polymerase), DNAse I, Pyrophosphatase und/oder RNAse-Inhibitor enthält. Die genauen Bedingungen variieren je nach spezifischer Anwendung.
  • In Ausführungsformen, die die mRNA-Lieferung beinhalten, kann das Verhältnis der mRNA, die das PE-Fusionsprotein kodiert, zu der PEgRNA für ein effizientes Editieren wichtig sein. In bestimmten Ausführungsformen beträgt das Gewichtsverhältnis von mRNA (die das PE-Fusionsprotein codiert) zu PEgRNA 1:1. In bestimmten anderen Ausführungsformen beträgt das Gewichtsverhältnis von mRNA (die das PE-Fusionsprotein codiert) zu PEgRNA 2:1. In noch anderen Ausführungsformen beträgt das Gewichtsverhältnis von mRNA (die das PE-Fusionsprotein codiert) zu PEgRNA 1:2. In noch weiteren Ausführungsformen wird das Gewichtsverhältnis von mRNA (die das PE-Fusionsprotein kodiert) zu PEgRNA ausgewählt aus der Gruppe bestehend aus etwa 1:1000, 1:900; 1:800; 1:700; 1:600; 1:500; 1:400; 1:300; 1:200; 1:100; 1:90; 1:80; 1:70; 1:60; 1:50; 1:40; 1:30; 1:20; 1:10; und 1:1. In anderen Ausführungsformen wird das Gewichtsverhältnis von mRNA (die das PE-Fusionsprotein kodiert) zu PEgRNA ausgewählt aus der Gruppe bestehend aus etwa 1:1000, 1:900; 800:1; 700:1; 600:1; 500:1; 400:1; 300:1; 200:1; 100:1; 90:1; 80:1; 70:1; 60:1; 50:1; 40:1; 30:1; 20:1; 10:1; und 1:1.
  • J. Verwendung von Prime Editing zur unvoreingenommenen Identifizierung von Off-Target-Editing
  • Wie bei anderen Genom-Editoren besteht ein gewisses Risiko, dass PE seine programmierten genetischen Veränderungen an unbeabsichtigten Sitesn um das Genom herum einführt, d. h. an „Off-Target“-Sitesn. Derzeit gibt es jedoch keine beschriebenen Methoden, um mit Prime Editoren eine Off-Target-Editing zu erkennen. Solche Verfahren würden die Identifizierung potenzieller Sitesn von Off-Target-Editing unter Verwendung von Prime Editoren ermöglichen.
  • Das Schlüsselkonzept dieses Aspekts ist die Idee, Prime-Editing zu verwenden, um dieselbe Adaptersequenz und/oder Primer-Bindungs-Site an On-Target- und Off-Target--Sitesn zu inserieren, die von derselben PEgRNA Template-bestimmt werden, um die schnelle Identifizierung von genomischen Off-Target-Modifikations-Sitesn von napDNAbp-Nukleasen oder Prime Editoren zu ermöglichen. Dieses Verfahren unterscheidet sich von anderen Techniken, die Nuklease-Off-Target--Sitesn identifizieren, da die Adapter- und/oder Primer-Bindungssequenz im gleichen Ereignis wie die DNA-Bindung und das Nicking durch den napDNAbp eingefügt wird, was die nachgelagerte Verarbeitung vereinfacht.
  • 33 veranschaulicht das Grundprinzip der Off-Target-Identifikation. Die Abbildung ist ein Schema, das das PEgRNA-Design für Primer-Bindungssequenz-Insertionen und Primer-Bindungsinsertion in genomische DNA unter Verwendung von Prime-Editing zur Bestimmung von Off-Target-Editing zeigt. In dieser Ausführungsform wird das Prime-Editieren innerhalb einer lebenden Zelle, eines Gewebes oder eines Tiermodells durchgeführt. Als erster Schritt wird eine geeignete PEgRNA entworfen. Das obere Schema zeigt eine beispielhafte PEgRNA, die in diesem Aspekt verwendet werden kann. Der Spacer in der PEgRNA (bezeichnet als „Protospacer“) ist komplementär zu einem der Stränge des genomischen Targets. Der PE:PEgRNA-Komplex (d. h. der PE-Komplex) installiert einen einzelsträngigen 3'-Endlappen an der Nick--Site, die die kodierte Primer-Bindungssequenz und den Homologiebereich (kodiert durch den Homologiearm der PEgRNA), der komplementär zur Region direkt stromabwärts der Schnittstelle (in rot) liegt, umfasst. Durch Flap-Invasion und DNA-Reparatur-/Replikationsprozesse wird der synthetisierte Strang in die DNA eingebaut, wodurch die Primer-Bindungs-Site installiert wird. Dieser Prozess kann am gewünschten genomischen Target, aber auch an anderen genomischen Sites ablaufen, die mit der PEgRNA in einer Off-Target-Weise interagieren könnten (d. h. die PEgRNA leitet den PE-Komplex aufgrund der Komplementarität der Spacerregion zu anderen genomischen Sites, die nicht die beabsichtigte genomische Site sind, zu anderen Off-Target-Sites). Somit kann die Primer-Bindungssequenz nicht nur an dem gewünschten genomischen Target, sondern auch an anderen genomischen Sites außerhalb des Targets im Genom installiert werden. Um die Insertion dieser Primer-Bindungs-Sites sowohl an den beabsichtigten genomischen Target-Sites als auch an den genomischen Off-Target-Sites nachzuweisen, kann die genomische DNA (Post-PE) isoliert, fragmentiert und an Adapternukleotide ligiert werden (in rot dargestellt). Als nächstes kann PCR mit PCR-Oligonukleotiden durchgeführt werden, die an die Adapter und an die eingefügte Primer-Bindungssequenz anlagern, um genomische On-Target- und Off-Target-DNA-Bereiche zu amplifizieren, in die die Primer-Bindungs-Site durch PE inseriert wurde. Hochdurchsatz-Sequenzierung kann dann ebenso wie Sequenz-Alignments durchgeführt werden, um die Insertionspunkte von PE-inserierten Primer-Bindungssequenzen entweder an der On-Target-Site oder an der Off-Target-Site zu identifizieren.
  • Daher veranschaulicht 33 einen Aspekt bezüglich der Identifizierung von Off-Target-Editier-Sites beim Editieren innerhalb einer lebenden Zelle, in Gewebekultur oder Tiermodellen. Um diese Methode durchzuführen, wird eine PEgRNA erzeugt, die einen identischen Spacer zum endgültigen gewünschten Prime Editor hat (und, wenn Prime-Editing-Off-Targets betrachtet werden, eine identische Primer-Bindungsstellensequenz zum endgültigen gewünschten Editor aufweist), aber die notwendigen Sequenzen, um eine Adapter- oder Primer-Bindungs-Site nach reverser Transkription durch Prime-Editing zu installieren. In-vivo-Editing wird unter Verwendung eines Prime Editors oder einer RTfusionierten Nuklease durchgeführt und genomische DNA isoliert. Die genomische DNA wird durch enzymatische oder mechanische Mittel fragmentiert und hängt einen anderen Adapter an DNA-Fragmentierungsstellen an. PCR wird verwendet, um von einem Adapter zu dem über PEgRNA installierten Adapter zu amplifizieren. Das resultierende Produkt wird tief sequenziert, um alle modifizierten Sites zu identifizieren.
  • In einem anderen Aspekt kann die Bewertung von Off-Target-Editing durch PE in vitro durchgeführt werden. In diesem Aspekt kann PE während der In-vitro-Modifikation der genomischen DNA-Identifizierung von Off-Target-Editing-Sites unter Verwendung der In-vitro-Modifikation der genomischen DNA verwendet werden. Um dieses Verfahren durchzuführen, wird Ribonukleoprotein (RNP) aus gereinigtem Prime Editor-Fusionsprotein und einer PEgRNA (d. h. dem PE-Komplex) zusammengesetzt, die konfiguriert ist, um einen Adapter oder eine Primer-Bindungssequenz an einer Target-Site zu installieren, aber ansonsten die gleiche wie die interessierende PEgRNA ist. Dieser RNP (d. h. PE-Komplex) wird mit extrahierter genomischer DNA vor oder nach der Fragmentierung der DNA inkubiert. Nach der Fragmentierung werden verschiedene Adaptersequenzen an die Enden der Fragment-DNA ligiert. PCR wird verwendet, um diejenigen genomischen Sites zu amplifizieren, die die inserierte Adaptersequenz (d. h. durch EP inseriert) überspannen, und die Adapter werden an Fragmentenden ligiert. Hochdurchsatz-Sequenzierung zwischen den Adaptersequenzen kann genomische Modifikations-Sites identifizieren, die On-Target oder Off-Target sind. Dieses In-vitro-Editing-Verfahren sollte die Nachweisempfindlichkeit erhöhen, da die zelluläre DNA-Reparatur den vom Prime Editor hinzugefügten revers transkribierten DNA-Adapter nicht eliminiert.
  • Diese Verfahren könnten verwendet werden, um Off-Target-Editing für jeden Prime Editor oder jeden Genom-Editor zu identifizieren, der eine Leit-RNA verwendet, um eine Target-Schnittstelle (die meisten Cas-Nukleasen) zu erkennen.
  • Diese Verfahren könnten auf alle genetischen Krankheiten angewendet werden, für die Genom-Editoren für die Behandlung in Betracht gezogen werden.
  • Beispielhafte Adapter- und/oder Primer-Bindungssequenzen, die von PE installiert werden können, umfassen, sind aber nicht beschränkt auf:
    Figure DE112020001339T5_0251
    Figure DE112020001339T5_0252
  • Diese Adapter- und/oder Primer-Bindungssequenzen können auch im Ligationsschritt nach der genomischen DNA-Fragmentierung, wie oben beschrieben, verwendet werden.
  • Beispielhafte PEgRNA-Designs, die die Verwendung des hier beschriebenen Verfahrens zur Bewertung von Off-Target-Editing und ihren Edit-Target-Lokus veranschaulichen, sind wie folgt:
    Figure DE112020001339T5_0253
  • K. Verwendung von Prime Editing zur Insertion induzierbarer Dimerisierungsdomänen
  • Die hierin beschriebenen Prime Editoren können auch verwendet werden, um Dimerisierungsdomänen in ein oder mehrere Protein-Targets zu installieren. Die Dimerisierungsdomänen können die induzierbare Regulierung der Aktivität erleichtern, die mit der Dimerisierung des einen oder der mehreren Protein-Targets über eine verbindende Einheit (z. B. ein kleines Molekül, Peptid oder Protein) verbunden ist, die auf bispezifische Weise bindet. In verschiedenen Aspekten binden die Dimerisierungsdomänen, wenn sie auf unterschiedlichen Proteinen (z. B. dem gleichen Typ oder unterschiedlichen Proteinen) installiert sind, jeweils an dieselbe bispezifische Einheit (z. B. ein bispezifisches kleines Molekül, Peptid oder Polypeptid mit mindestens zwei Regionen, die getrennt an die Dimerisierungsdomänen binden), wodurch die Dimerisierung der Proteine durch ihre gemeinsame Wechselwirkung mit dem bispezifischen Liganden verursacht wird. Auf diese Weise fungiert der bispezifische Ligand als „Induktor“ der Dimerisierung zweier Proteine. In einigen Fällen weist der bispezifische Ligand oder die bispezifische Verbindung zwei gleiche Targeting-Einheiten auf. In einigen Fällen weist der bispezifische Ligand oder die bispezifische Verbindung zwei gleiche Targeting-Einheiten auf. Der bispezifische Ligand oder die bispezifische Verbindung mit den gleichen zwei Targeting-Einheiten wird in der Lage sein, auf die gleiche Dimerisierungsdomäne abzuzielen, die auf verschiedenen Protein-Targets installiert ist. Der bispezifische Ligand oder die bispezifische Verbindung mit den gleichen zwei Targeting-Einheiten wird in der Lage sein, auf die gleiche Dimerisierungsdomäne abzuzielen, die auf verschiedenen Protein-Targets installiert ist.
  • Der bispezifische Ligand oder die bispezifische Verbindung mit unterschiedlichen Targeting-Einheiten wird in der Lage sein, auf unterschiedliche Dimerisierungsdomänen abzuzielen, die auf unterschiedlichen Protein-Targets installiert sind. Eine „erste“ Dimerisierungsdomäne bindet an eine erste Bindungseinheit eines bispezifischen Liganden und eine „zweite“ Dimerisierungsdomäne bindet an eine zweite Bindungseinheit desselben bispezifischen Liganden. Wenn die erste Dimerisierungsdomäne an ein erstes Protein fusioniert ist (z. B. über PE, wie hierin diskutiert) und die zweite Dimerisierungsdomäne (z. B. über PE, wie hierin diskutiert) an ein zweites Protein fusioniert wird, dimerisieren das erste und das zweite Protein in Anwesenheit eines bispezifischen Liganden, wobei der bispezifische Ligand mindestens eine Einheit aufweist, die an die erste Dimerisierungsdomäne bindet, und mindestens eine andere Einheit, die an die zweite Dimerisierungsdomäne bindet.
  • Der Begriff „bispezifischer Ligand“ oder „bispezifische Einheit“, wie hierin verwendet, bezieht sich auf einen Liganden, der an zwei verschiedene Ligandenbindungsdomänen bindet. In verschiedenen Ausführungsformen ist die bispezifische Einheit selbst ein Dimer von zwei gleichen oder zwei unterschiedlichen chemischen Einheiten, wobei jede Einheit spezifisch und fest an eine Dimerisierungsdomäne bindet. In bestimmten Ausführungsformen ist der Ligand eine kleine Molekülverbindung oder ein Peptid oder ein Polypeptid. In anderen Ausführungsformen ist die Ligandenbindungsdomäne eine „Dimerisierungsdomäne“, die als Peptid-Tag auf einem Protein installiert werden kann. In verschiedenen Ausführungsformen können zwei Proteine, die jeweils die gleichen oder unterschiedliche Dimerisierungsdomänen umfassen, durch die Bindung jeder Dimerisierungsdomäne an den bispezifischen Liganden zur Dimerisierung induziert werden. Diese Moleküle können auch als „chemische Induktoren der Dimerisierung“ oder CIDs bezeichnet werden. Außerdem können die bispezifischen Liganden durch Koppeln (z. B. durch standardisierte chemische Bindungen) von zwei gleichen Einheiten oder zwei verschiedenen Einheiten zusammen hergestellt werden, wobei jede Einheit fest und spezifisch an eine Dimerisierungsdomäne bindet.
  • In verschiedenen Aspekten können die von PE installierten Dimerisierungsdomänen gleich oder unterschiedlich sein.
  • Die Dimerisierungsdomänen können beispielsweise FKBP12 sein, das die folgende Aminosäuresequenz aufweist:
    FKBP12
    Figure DE112020001339T5_0254
  • In einem anderen Beispiel kann die Dimerisierungsdomäne eine Mutante von FKBP12 sein, die als FKBP12-F36V bezeichnet wird, eine Mutante von FKBP12 mit einem konstruierten Loch, das ein synthetisches FK506-Mimetikum mit Höckern bindet (2, )107:
    FKBP12-F36V
    Figure DE112020001339T5_0255
  • In einem anderen Beispiel kann die Dimerisierungsdomäne wie folgt Cyclophilin sein:
    CYCLOPHILIN
    Figure DE112020001339T5_0256
  • In verschiedenen Ausführungsformen können die Aminosäuresequenzen dieser Dimerisierungsdomänen verändert werden, um die Bindung zu optimieren oder die Bindungsorthogonalität zu nativen Targets zu verbessern. Die Nukleinsäuresequenzen der Gene, die für niedermolekulare Bindungsproteine kodieren, können verändert werden, um die Effizienz des PE-Prozesses zu optimieren, beispielsweise durch Reduzieren der PEgRNA-Sekundärstruktur.
  • Andere Beispiele für geeignete Dimerisierungsdomänen und eine verwandte kleine Molekülverbindung, die daran bindet, werden wie folgt bereitgestellt. Beachten Sie, dass die verwandte Kleinmolekülverbindung (z. B. über einen chemischen Linker) an eine zweite Kleinmolekülverbindung (entweder die gleiche Verbindung oder eine andere Verbindung) gekoppelt werden könnte, um einen bispezifischen Liganden zu bilden, der zwei Dimerisierungsdomänen binden kann. In einigen Fällen, wie FK506 und Cyclosporin A, reduziert oder eliminiert die Dimerisierung von jedem (z. B. FK506-FK506 oder Cyclosporin A-Cyclosporin A) die immunsuppressive Aktivität der monomeren Verbindungen.
    Figure DE112020001339T5_0257
    Figure DE112020001339T5_0258
    Figure DE112020001339T5_0259
    Figure DE112020001339T5_0260
    Figure DE112020001339T5_0261
  • Andere Beispiele für natürlich vorkommende bifunktionelle Moleküle und ihre dualen Target-Rezeptoren sind wie folgt. Prime Editing kann verwendet werden, um die dualen Target-Rezeptoren in verschiedene Proteine einzubauen. Sobald die verschiedenen Proteine durch PE modifiziert sind, um einen bifunktionellen Molekülrezeptor zu enthalten, können die bifunktionellen Moleküle eingeführt werden, wodurch die Dimerisierung der modifizierten Proteine bewirkt wird, um die verschiedenen Dimerisierungsdomänen zu umfassen. Beispiele für Kopplungen von (1) einem biofunktionellen Molekül und (2) ihren dualen Target-Rezeptoren sind wie folgt:
    NATÜRLICH VORKOMMENDE BIOFUNKTIONELLE MOLEKÜLE TARGET-REZEPTOREN DES BIOFUNKTIONELLEN MOLEKÜLS
    Figure DE112020001339T5_0262
    Auxin
    Target-Rezeptor 1: Auxinrezeptor
    Target-Rezeptor 2: TIR1 E3-Ligase
    Figure DE112020001339T5_0263
    Methyljasmonat
    Target-Rezeptor 1: JAZ-Rezeptor
    Target-Rezeptor 2: Coli E3-Ligase
    Brefeldin A
    Figure DE112020001339T5_0264
    Target-Rezeptor 1: GBF1
    Target-Rezeptor 2: GTPase Arflp
    Abscisinsäure
    Figure DE112020001339T5_0265
    Target-Rezeptor 1: PYR-Rezeptor
    Target-Rezeptor 2: Phosphoproteinphosphatase 2C
    Forskolin
    Figure DE112020001339T5_0266
    Target-Rezeptor 1: Adenylylcyclase-Monomere
    Target-Rezeptor 2: Adenylylcyclase-Monomere
    Fusicoccin A
    Figure DE112020001339T5_0267
    Target-Rezeptor 1: 14-3-3-Proteine
    Target-Rezeptor 2: H+-ATPase
    Rapamycin Target-Rezeptor 1: FKBP12
    Target-Rezeptor 2: mTOR
    Figure DE112020001339T5_0268
    Sanglifehrin A
    Figure DE112020001339T5_0269
    Target-Rezeptor 1: Cyclophilin
    Target-Rezeptor 2: IMP Dehydrogenase 2
    Cyclosporin A
    Figure DE112020001339T5_0270
    Target-Rezeptor 1: Cyclophilin
    Target-Rezeptor 2: Calcineurin
  • Beispiele für andere bifunktionelle Moleküle, die mit diesem Aspekt des Prime Editing verwendet werden können, sind wie folgt:
  • Synstab A:
    Figure DE112020001339T5_0271
  • Paclitaxel:
    Figure DE112020001339T5_0272
  • Discodermolid:
    Figure DE112020001339T5_0273
  • GNE-0011
    Figure DE112020001339T5_0274
  • ARV-825, und
    Figure DE112020001339T5_0275
  • dBET1
    Figure DE112020001339T5_0276
  • Synstab A, Paclitaxel und Discodermolid sind Mikrotubuli-Stabilisatoren. Somit könnten diese Verbindungen verwendet werden, um durch PE modifizierte Proteine zu dimerisieren, um Mikrotubuli-Proteine zu umfassen. GNE-0011, ARV-825 und dBET1 umfassen ein BRD4-Bindungsmotiv und ein CRBN-Bindungsmotiv. Somit könnten diese Verbindungen verwendet werden, um Proteine zu dimerisieren, die durch PE modifiziert wurden, um diese Targeting-Domänen zu umfassen.
  • Die PEgRNAs zum Installieren von Dimerisierungsdomänen können die folgenden Strukturen umfassen (in Bezug auf 3D): 5'-[Spacer]-[gRNA-Kern]-[Verlängerungsarm]-3', wobei der Verlängerungsarm 5'-[Homologiearm]-[Template Editing]-[Primerbindungs-Site]-3' umfasst; oder
    5'-[Verlängerungsarm]-[Spacer]-[gRNA-Kern]-3', wobei der Verlängerungsarm 5'-[Homologiearm]-[Template Editing]-[Primer-Bindungs-Site]-3' umfasst, und wobei bei jeder Konfiguration „Template Editing“ eine Nukleotidsequenz einer Dimerisierungsdomäne umfasst.
  • In einem Beispiel die PEgRNA zur Insertion der FKBP12-Dimerisierungsdomäne am C-terminalen Ende des Humaninsulinrezeptors (Spacer unterstrichen, gRNA-Kern schlicht, Flap-Homologie fett, FKBP12-Insertion kursiv, Annealing-Region fett kursiv):
    PEGRNA ZUM INSTALLIEREN VON FKBP12 IN MENSCHLICHEN INSULINREZEPTOREN
    Figure DE112020001339T5_0277
    Figure DE112020001339T5_0278
  • In einem anderen Beispiel die PEgRNA zur Insertion der FKBP12-Dimerisierungsdomäne am HEK3-Lokus (zur Optimierung):
    PEGRNA ZUM INSTALLIEREN VON FKBP12 IN HEK3
    Figure DE112020001339T5_0279
  • Die Target-Proteine zum Installieren von Dimerisierungsdomänen sind nicht besonders beschränkt; es ist jedoch von Vorteil, dass ihre Dimerisierung (einmal durch PE modifiziert) in Gegenwart eines bispezifischen Liganden eine vorteilhafte biologische Wirkung hervorruft, z. B. einen Signalweg, eine verminderte Immunantwort usw. In verschiedenen Aspekten können die Target-Proteine, die durch die PE-abhängige Installation von Dimerisierungsdomänen dimerisiert werden sollen, das gleiche Protein oder verschiedene Proteine sein. Vorzugsweise lösen die Proteine, wenn sie dimerisiert sind, eine oder mehrere stromabwärtige biologische Kaskaden aus, z. B. eine Signaltransduktionskaskade, Phosphorylierung usw. Beispielhafte Target-Proteine, in welchen PE verwendet werden kann, um Dimerisierungsdomänen einzubauen, umfassen, sind aber nicht beschränkt auf:
    MEMBRANGEBUN DENER REZEPTOR KINASEDO MÄNE FUSIONIE RT MIT CID VERWENDE T SIGNALKASK ADE REFERENZ
    T-ZELLEN-REZEPTOR FKBP12 FK1012 (FK506-DIMER) T-ZELL-REZEPTOR-SIGNALISIE RUNG SCIENCE 262, 1019-24 (1993) CHEM. BIOL. 1, 163-172 (1994).
    FAS-RECEPTOR MURINES CYCLOPHI LLIN C CYCLOSPO RIN A-DIMER FAS-WEG ZUR APOPTOSE CHEM. BIOL. 3, 731-738 (1996).
    INSULINREZEPTOR FKBP12 FK1012 (FK506-DIMER) INSULIN-SIGNALISIE RUNG CURR. BIOL. 8, 11-18 (1998).
    THROMBOZYTEN ABGELEITETER WACHSTUMSFAK TOR (PLATELET-DERIVED GROWTH FACTOR - PDGF) BETA FKBP12 FK1012 (FK506-DIMER) SIGNALISIE RUNG DER PDGF-MESODERMBI LDUNG CURR. BIOL. 8, 11-18 (1998).
    ERYTHROPOIET IN-REZEPTOR (EPOR) FKBP12 FK1012 (FK506-DIMER) EPOR-VERMITTELT E PROLIFERAT IVE SIGNALÜBER TRAGUNG PROC. NATL. ACAD. SCI. 94, 3076-3081 (2002).
  • In einem Aspekt können hierin beschriebene Prime Editoren verwendet werden, um Sequenzen, die Dimerisierungsdomänen kodieren, in ein oder mehrere Gene zu installieren, die interessierende Target-Proteine in einer lebenden Zelle oder einem Patienten kodieren. Dies kann als „Prime Editing-CID-System“ bezeichnet werden, wobei das CID der bispezifische Ligand ist, der die Dimerisierung von Target-Proteinen induzierte, die jeweils an eine von PE installierte Dimerisierungsdomäne fusioniert sind. Das Editing allein sollte keine physiologische Wirkung haben. Bei Verabreichung eines bispezifischen Liganden, der typischerweise ein dimeres kleines Molekül ist, das gleichzeitig an zwei Dimerisierungsdomänen binden kann, von denen jede an eine Kopie des Target-Proteins fusioniert ist, verursacht der bispezifische Ligand eine Dimerisierung des Target-Proteins. Dieses Target-Protein-Dimerisierungsereignis induziert dann ein biologisches Signalereignis, wie beispielsweise Erythropoese oder Insulinsignalisierung. Ein neues Verfahren, um dimerisierungsinduzierte biologische Prozesse, wie beispielsweise die Rezeptorsignalisierung, unter die Kontrolle eines geeigneten niedermolekularen Arzneimittels (d. h. der bispezifische Ligand) durch die genomische Integration von Genen, die niedermolekulare Bindungsproteine (d. h. die Dimerisierungsdomänen) mit Prime Editing kodieren, zu stellen, wird hier beschrieben.
  • Die Proteindimerisierung ist ein allgegenwärtiger biologischer Prozess. Insbesondere ist bekannt, dass die Homodimerisierung vieler membrangebundener Rezeptoren Signalkaskaden mit oft tiefgreifenden biologischen Konsequenzen in Gang setzt. Eine Reihe von niedermolekularen Naturstoffen, die als Arzneimittel zugelassen sind, wirken als Teil ihres Wirkmechanismus als chemischer Induktor der Proteindimerisierung.92 Beispielsweise bindet FK506 fest an FKBP12, und der resultierende niedermolekulare Proteinkomplex bindet dann die Phosphatase Calcineurin, wodurch ein Schritt in der T-Zellen-Rezeptor-Signalisierung gehemmt wird.93 Ebenso induziert Cyclosporin A die Dimerisierung von Cyclophilin und Calcineurin, und Rapamycin induziert die Dimerisierung von FKBP und mTOR.93,94
  • In einer Ausführungsform wurden unter Nutzung der selektiven, hochaffinen Bindung der FK506:FKBP12- und Cyclosporin A:Cyclophilin-Kleinmolekül:Protein-Bindungsinteraktion auch synthetische chemische Induktoren der Dimerisierung entwickelt. In einem Beispiel wurde gezeigt, dass ein aus zwei Einheiten von FK506 bestehendes kleines Molekül, das als FK1012 bezeichnet wird, die Signalübertragung bewirkt, wenn die zytoplasmatischen Domänen von Signalrezeptoren mit FKBP12 markiert wurden.95 Chemische Dimerisierungsinduktoren (CIDs) werden seitdem verwendet, um Anzahl der Signalwegen zu kontrollieren.96-103
  • Synthetische CIDs sind zwar nützliche Werkzeuge zur Untersuchung biologischer Prozesse, eine Herausforderung für therapeutische Anwendungen besteht jedoch darin, dass die Einführung der FKBP12- oder Cyclophilin-Target-Proteinchimären in Patienten eine Herausforderung darstellt.
  • Die vorliegende Offenbarung führt zwei Konzepte zusammen, um einen zuvor unzugänglichen therapeutischen Prozess zu schaffen. Das erste Konzept ist das hier beschriebene Prime Editing, das eine präzises Genom-Editing, einschließlich gezielter Insertionen in lebende Zellen ermöglicht. Das zweite Konzept ist die chemisch induzierte Dimerisierung, ein leistungsstarkes Werkzeug, das die Kontrolle über Signal- und Oligomerisierungsprozesse in Zellkulturen durch kleine Moleküle ermöglicht hat.
  • Es wurden spezifische Fälle identifiziert, in denen die chemische Kontrolle der Proteindimerisierung eine vorteilhafte therapeutische Wirkung gehabt haben könnte.
  • Der Insulinrezeptor ist ein heterotetrameres Transmembranprotein, das auf die Insulinbindung an die extrazelluläre Domäne durch Phosphorylierung der zytoplasmatischen Kinasedomäne reagiert.104 Ein konstruiertes chimäres Protein bestehend aus einer Membranlokalisierungskomponente, der C-terminalen Kinasedomäne des Insulinrezeptors, und drei Kopien von FKBP12 reagieren auf FK1012 und initiieren die Insulinreaktion in Zellkulturen.99 In ähnlicher Weise wird erwartet, dass die Fusion von FKBP12 an das C-terminale Ende der Kinasedomäne des nativen Insulinrezeptors in Patientenzellen FK1012- abhängige Phosphorylierung und Initiierung der Insulin-Signalkaskade erlaubt. Dieses System könnte die Insulinanwendung bei Patienten ersetzen oder ergänzen, die kein Insulin herstellen können (z. B. Typ-1-Diabetiker) oder die schwach auf Insulin ansprechen (z. B. Typ-2-Diabetiker).
  • Darüber hinaus stimuliert Erythropoietin die Erythrozytenproliferation durch Bindung an den Erythropoietin-Rezeptor (EpoR), was entweder eine Dimerisierung oder eine Konformationsänderung in einem vorgebildeten Rezeptordimer induziert, was zur Aktivierung der Jak/STAT-Signalkaskade führt.105 Es wurde gezeigt, dass FK1012-induzierte Oligomerisierung der membranverankerten zytoplasmatischen Domäne von EpoR, die mit FKBP12 markiert ist, ausreicht, um die Jak/STAT-Signalkaskade zu initiieren und die Zellproliferation zu fördern.106 Es wird erwartet, dass die Fusion von FKBP12 mit nativem EpoR durch Prime-Editing in Patientenzellen die FK1012-induzierte Kontrolle der Erythrozytenproliferation erlaubt (Erythropoese). Dieses System könnte verwendet werden, um das Wachstum der roten Blutkörperchen bei anämischen Patienten auszulösen. FK1012-induzierbarer EpoR könnte auch als ein in vivo-selektierbarer Marker für Blutzellen verwendet werden, die einer ex vivo-Entwicklung unterzogen wurden.
  • Im Prinzip könnte jede Rezeptor-Tyrosin-Kinase ein brauchbares Target für ein Prime Editing-CID-Therapeutikum sein. Die folgende Tabelle enthält eine Liste aller Rezeptor-Tyrosin-Kinasen im menschlichen Genom.110
    Figure DE112020001339T5_0280
  • Das Prime Editing-CID-System bietet zahlreiche Vorteile. Ein solcher Vorteil besteht darin, dass es endogene Liganden, bei denen es sich typischerweise um Proteine handelt, die bei Herstellung, Kosten, Lieferung, Produktion oder Lagerung Komplikationen verursachen, durch arzneimittelähnliche kleine Moleküle ersetzen kann, die oral verabreicht werden können, anstatt sie durch IV oder Injektion zu verabreichen, die aus von der FDA zugelassenen Arzneimitteln fertiggestellt werden (oder selbst bereits Arzneimittel sind) und keine besonderen Produktions- oder Lagerkosten, die typischerweise mit Proteinarzneimitteln verbunden sind, verursachen. Ein weiterer Vorteil ist, dass das Editing allein keine physiologische Wirkung haben sollte. Das Ausmaß der Dimerisierung des Target-Proteins kann durch Dosierung des niedermolekularen CID kontrolliert werden. Außerdem ist die Dimerisierung des Target-Proteins durch Zugabe der monomeren Form des CID leicht und schnell reversibel. Ein weiterer Vorteil besteht darin, dass in Fällen, in denen ein einzelner Ligand auf mehrere Rezeptoren abzielt, Selektivität durch Prime-Editing nur eines Rezeptors erreicht werden kann. Schließlich kann es in Abhängigkeit von der für das Prime Editing verwendeten Abgabemethode auch möglich sein, das Editieren auf ein lokalisiertes Gewebe oder Organ zu beschränken, wodurch eine induzierbare Rezeptoraktivierung nur in bestimmten Bereichen ermöglicht wird.
  • Wenn die Editing-Effizienz beim Prime Editing hoch genug ist, dass zwei separate Editing-Ereignisse auf hohem Niveau auftreten könnten, wäre es auch möglich, zwei interessierende Proteine mit unterschiedlichen niedermolekularen Bindungsdomänen (wie FKBP und Cyclophilin) zu markieren und Heterodimerisierungen mit kleinen Molekülheterodimeren (wie ein FK506-Cyclosporin-A-Dimer) zu induzieren.
  • Die Fusion von FKBP12 oder anderen niedermolekularen Bindungsproteinen mit nativen Proteinen wurde im Allgemeinen durch Überexpression von Plasmid in Gewebekultur erreicht. Es wurde gezeigt, dass die anschließende chemisch induzierte Dimerisierung phänotypische Veränderungen an Zellen induziert, die die Fusionsproteine produzieren.
  • Die folgenden Referenzen sind oben in Abschnitt G zitiert und werden hier durch Bezugnahme aufgenommen.
    1. 1. Crabtree, G. R. & Schreiber, S. L. Three-part inventions: intracellular signaling and induced proximity. Trends Biochem. Sci. 21, 418-22 (1996).
    2. 2. Liu, J. et al. Calcineurin Is a Common Target of A and FKBP-FK506 Complexes. Cell 66, 807-815 (1991).
    3. 3. Keith, C. T. et al. A mammalian protein targeted by G1-arresting rapamycin-receptor complex. Nature 369, 756-758 (2003).
    4. 4. Spencer, D. M., Wandless, T. J., Schreiber, S. L. S. & Crabtree, G. R. Controlling signal transduction with synthetic ligands. Science 262, 1019-24 (1993).
    5. 5. Pruschy, M. N. et al. Mechanistic studies of a signaling pathway activated by the organic dimerizer FK1012. Chem. Biol. 1, 163-172 (1994) .
    6. 6. Spencer, D. M. et al. Functional analysis of Fas signaling in vivo using synthetic inducers of dimerization. Curr. Biol. 6, 839-847 (1996).
    7. 7. Belshaw, P. J., Spencer, D. M., Crabtree, G. R. & Schreiber, S. L. Controlling programmed cell death with a cyclophilincyclosporin-based chemical inducer of dimerization. Chem. Biol. 3, 731-738 (1996).
    8. 8. Yang, J. X., Symes, K., Mercola, M. & Schreiber, S. L. Smallmolecule control of insulin and PDGF receptor signaling and the role of membrane attachment. Curr. Biol. 8, 11-18 (1998).
    9. 9. Belshaw, P. J., Ho, S. N., Crabtree, G. R. & Schreiber, S. L. Controlling protein association and subcellular localization with a synthetic ligand that induces heterodimerization of proteins. Proc.Natl. Acad. Sci. 93, 4604-4607 (2002).
    10. 10. Stockwell, B. R. & Schreiber, S. L. Probing the role of homomeric and heteromeric receptor interactions in TGF-β signaling using small molecule dimerizers. Curr. Biol. 8, 761-773 (2004).
    11. 11. Spencer, D. M., Graef, I., Austin, D. J., Schreiber, S. L. & Crabtree, G. R. A general strategy for producing conditional alleles of Src-like tyrosine kinases. Proc. Natl. Acad. Sci. 92, 9805-9809 (2006).
    12. 12. Holsinger, L. J., Spencer, D. M., Austin, D. J., Schreiber, S. L. & Crabtree, G. R. Signal transduction in T lymphocytes using a conditional allele of Sos. Proc. Natl. Acad. Sci. 92, 9810-9814 (2006) .
    13. 13. Myers, M. G. Insulin Signal Transduction and the IRS Proteins. Annu. Rev. Pharmacol. Toxicol. 36, 615-658 (1996).
    14. 14. Watowich, S. S. The erythropoietin receptor: Molecular structure and hematopoietic signaling pathways. J. Investig. Med. 59, 1067-1072 (2011).
    15. 15. Blau, C. A., Peterson, K. R., Drachman, J. G. & Spencer, D. M. A proliferation switch for genetically modified cells. Proc. Natl. Acad. Sci. 94, 3076-3081 (2002).
    16. 16. Clackson, T. et al. Redesigning an FKBP-ligand interface to generate chemical dimerizers with novel specificity. Proc. Natl. Acad. Sci. 95, 10437-10442 (1998).
    17. 17. Diver, S. T. & Schreiber, S. L. Single-step synthesis of cellpermeable protein dimerizers that activate signal transduction and gene expression. J. Am. Chem. Soc. 119, 5106-5109 (1997).
    18. 18. Guo, Z. F., Zhang, R. & Liang, F. Sen. Facile functionalization of FK506 for biological studies by the thiol-ene ‚click‘ reaction. RSC Adv. 4, 11400-11403 (2014).
    19. 19. Robinson, D. R., Wu, Y.-M. & Lin, S.-F. The protein tyrosine kinase family of the human genome. Oncogene 19, 5548-5557 (2000).
  • L. Verwendung von Prime Editing für die Zelldatenaufzeichnung
  • Die Prime Editoren und die daraus resultierenden genomischen Modifikationen können auch verwendet werden, um zelluläre Prozesse und Entwicklung zu studieren und aufzuzeichnen. Zum Beispiel können die hierin beschriebenen Prime Editoren verwendet werden, um das Vorhandensein und die Dauer eines Stimulus für eine Zelle aufzuzeichnen, indem der Zelle eine erste Nukleinsäuresequenz bereitgestellt wird, die ein Fusionsprotein mit einem Nukleinsäure-programmierbaren DNA-Bindungsprotein (napDNAbp) und einer reversen Transkriptase kodiert und der Zelle mindestens eine zweite Nukleinsäuresequenz bereitstellt, die eine PEgRNA kodiert. Entweder die erste, die zweite oder beide Nukleinsäuresequenzen sind funktionsfähig mit induzierbaren Promotoren verbunden, die auf den Zellstimulus reagieren, so dass sie die Expression des Fusionsproteins und/oder der PEgRNA induzieren, wodurch die Modifikation einer Targetsequenz innerhalb der Zelle verursacht wird.
  • Die hierin beschriebenen Prime Editoren können auch für das zellulare Barcoding und die Abstammungsverfolgung verwendet werden. Zum Beispiel kann der Prime Editor durch die Strichcodierung jeder Zelle mit einem einzigartigen genomischen Strichcode helfen, die Zelllinienkarte aufzudecken, indem er die Konstruktion phylogenetischer Bäume basierend auf den in einer oder mehreren Targetsequenzen vorgenommenen Modifikationen ermöglicht. Ausgehend von Vorläuferzellen kann das Prime Editor-System die Erstellung einer Zell-Fate-karte für einzelne Zellen in einem ganzen Organismus ermöglichen, die durch Analyse der in einer oder mehreren Targetsequenzen vorgenommenen Modifikationen entschlüsselt werden kann. Das Verfahren zum Verfolgen der Zelllinie kann das Bereitstellen einer Nukleinsäure, die ein Fusionsprotein mit einem napDNAbp und einer reversen Transkriptase kodiert, und das Bereitstellen mindestens einer zweiten Nukleinsäure, die eine PEgRNA kodiert, umfassen. Ein einzigartiger zellulärer Barcode kann unter Verwendung des Fusionsproteins und der PEgRNA erzeugt werden, um eine oder mehrere Modifikationen in einer oder mehreren Targetsequenzen zu erzeugen, wodurch die Abstammung jeder Zelle, die aus der ersten Zelle hervorgeht, unter Verwendung des einzigartigen zellulären Barcodes verfolgt werden kann. Die Verwendung von Prime Editoren sowohl für die Zelldatenaufzeichnung als auch für die Abstammungsverfolgung wird in Beispiel 13 weiter beschrieben.
  • Die Prime Editoren können sowohl die Nachverfolgung der Abstammung als auch die Aufzeichnung von zellulären Signalen durchführen, indem sie genomische Targetsequenzen oder integrierte vorgefertigte Sequenzen modifizieren. Prime Editoren verwenden ein synthetisches Fusionsprotein, das ein Cas9-Nickase-Fragment (einschließlich, aber nicht beschränkt auf die SpCas9 H840A-Variante) und eine Reverse-Transkriptase-Domäne umfasst, zusammen mit einer konstruierten Prime Editing-Guide-RNA (PEgRNA). Zusammen zielen diese Komponenten auf eine bestimmte genomische Sequenz oder eine integrierte vorgefertigte Sequenz ab und installieren eine vordefinierte Bearbeitung. Da die PEgRNA sowohl die genomische Targetsequenz als auch das bearbeitete Ergebnis spezifiziert, kann eine hochspezifische und kontrollierte Genommodifikation gleichzeitig unter Verwendung mehrerer PEgRNA innerhalb derselben Zelle erreicht werden. Zugängliche Genommodifikationen umfassen alle einzelnen Nukleotidsubstitutionen, kleine bis mittelgroße Sequenzinsertionen und kleine bis mittelgroße Deletionen. Die Vielseitigkeit dieser Genom Editing-Technologie kann eine zeitlich gekoppelte, signalspezifische Aufzeichnung innerhalb von Zellen ermöglichen.
  • Die Verwendung von Prime Editoren für die Zelldatenaufzeichnung kann Zusammensetzungen (z. B. Nukleinsäuren), Zellen, Systeme, Kits und Verfahren zum Aufzeichnen der Stärke und/oder Dauer von endogenen oder exogenen Stimuli im Laufe der Lebensdauer einer Zelle umfassen. Das Zelldatenaufzeichnungssystem kann ein Fusionsprotein umfassen, das aus einem napDNAbp (z. B. einer Cas9-Domäne) und einer Reversen Transkriptase besteht, die operativ mit einem Promotor verbunden ist, der die Expression des Fusionsproteins induziert, um Veränderungen zu induzieren, indem gezielte und sequenzspezifische genomische Insertionen erzeugt werden , Deletionen oder Mutationen als Reaktion auf einen Stimulus oder eine Veränderung in der Zelle. Im Gegensatz zu digitalen Speichergeräten, die Informationen (z. B. das Vorhandensein oder Fehlen eines Stimulus) in einem von zwei verschiedenen Zuständen (d. h. „ein“ oder „aus“) speichern, können diese Zelldatenschreiber dauerhafte Markierungen in der zellulären DNA auf eine Weise induzieren, die sowohl die Stärke (d. h. Amplitude) als auch die Dauer eines oder mehrerer Stimuli widerspiegelt. Somit haben Zelldatenaufzeichnungssysteme in einigen Aspekten die Fähigkeit, gleichzeitig mehrere Zellzustände aufzuzeichnen, einschließlich beispielsweise der Exposition gegenüber einem kleinen Molekül, einem Protein, einem Peptid, einer Aminosäure, einem Metaboliten, einem anorganischen Molekül, einem metallorganischen Molekül, einem organischen Molekül, einem Medikament oder Medikamentenkandidat, einem Zucker, einem Lipid, einem Metall, einer Nukleinsäure, einem Molekül, das bei der Aktivierung einer endogenen oder exogenen Signalkaskade entsteht, Licht, Hitze, Schall, Druck, mechanischem Stress , Scherstress oder einem Virus oder einem anderen Mikroorganismus. Diese Zelldatenrekorder können Sequenzierungstechnologien (z. B. Hochdurchsatz-Sequenzierung) zum Messen des Auslesens (z. B. Veränderungen in der zellulären DNA) einsetzen und sind weder bei der Aufzeichnung eines Stimulus noch beim Auslesen der durch den Stimulus induzierten Veränderung (en) der zellulären DNA abhängig von großen Zellpopulationen.
  • Im Allgemeinen umfassen die hierin zur Verwendung in einer Zelle bereitgestellten Zelldatenaufzeichnungssysteme ein Fusionsprotein, das aus einem napDNAbp und einer Reversen Transkriptase besteht, wobei die Nukleinsäuresequenz, die das Fusionsplasmid kodiert, mit einem Promotor (z. B. einem induzierbaren Promotor oder einem konstitutiven Promoter) verbunden ist. Wenn ein Stimulus vorhanden ist oder eine Änderung des Zellzustands auftritt, induziert der Stimulus die Expression des Fusionsproteins. Ebenfalls in der Zelle vorhanden sind eine oder mehrere Nukleinsäuren, die mindestens eine PEgRNA kodieren, die dem napDNAbp zugeordnet sind und den napDNAbp oder das Fusionsprotein zu einer Targetsequenz lenken (d. h. die PEgRNA ist zu einer Targetsequenz komplementär). Die Nukleinsäure, die für PEgRNA kodiert, kann auch oder alternativ mit einem Promotor (z. B. einem induzierbaren Promotor oder einem konstitutiven Promotor) operativ verbunden sein. Unter dem richtigen Stimulus oder dem richtigen Satz von Stimuli werden sowohl das Fusionsprotein als auch die PEgRNA in der Zelle exprimiert, und die PEgRNA assoziiert mit dem Fusionsprotein, um es zu einer Targetsequenz zu lenken. Diese Targetsequenz zeichnet die Aktivität des Prime Editors auf, wodurch das Vorhandensein eines Stimulus oder einer Reihe von Stimuli oder eine Änderung des Zellzustands aufgezeichnet wird. Es kann auch mehr als eine PEgRNA-Sequenz in der Zelle vorhanden sein, und diese zusätzlichen PEgRNA-Sequenzen, die das Fusionsprotein zu unterschiedlichen Targetsequenzen lenken können, können jeweils operativ mit einem Promotor verbunden sein, der die Anwesenheit eines anderen Stimulus wahrnimmt, wodurch komplexe Zelldatenaufzeichnungssysteme für die geordnete Aufzeichnung des Vorhandenseins und der Dauer eines Stimulus oder einer Reihe von Stimuli konstruiert werden können. In einigen Fällen können eine oder mehrere der Komponenten des Zelldatenaufzeichnungssystems (z. B. Fusionsprotein und PEgRNA) in der Zelle konstitutiv exprimiert werden. Beispielhafte Komponenten des Zelldatenaufzeichnungssystems zur Verwendung mit den Zusammensetzungen werden hierin beschrieben. Zusätzliche geeignete Kombinationen von hierin bereitgestellten Komponenten werden einem Durchschnittsfachmann auf der Grundlage dieser Offenbarung und des Fachwissens auf diesem Gebiet offensichtlich sein und werden somit vom Umfang dieser Offenbarung umfasst.
  • Die wiederholte Modifikation eines DNA-Targets, das durch gezielte Amplikon-Sequenzierung und/oder RNA-Sequenzierung (was insbesondere für Einzelzellaufzeichnungsexperimente von Bedeutung ist) sequenziert werden kann, kann verwendet werden, um eine Vielzahl wichtiger biologischer Prozesse aufzuzeichnen, einschließlich der Aktivierung von Signalkaskaden, Stoffwechselzuständen und zellulärer Differenzierungsprogramme. Die Verbindung interner und externer zellulärer Signale mit Sequenzmodifikationen im Genom ist für jedes Signal möglich, für das ein auf ein Signal ansprechender Promotor existiert. In einigen Ausführungsformen ist der Promotor ein Promotor, der zur Verwendung in einem prokaryontischen System geeignet ist (d. h. ein bakterieller Promotor). In einigen Ausführungsformen ist der Promotor ein Promotor, der zur Verwendung in einem eukaryontischen System geeignet ist (d. h. ein eukaryontischer Promotor). In einigen Ausführungsformen ist der Promotor ein Promotor, der zur Verwendung in einem Säugetier- (z. B. menschlichen) System geeignet ist (d. h. ein Säugetier-Promotor). In einigen Ausführungsformen wird der Promotor durch einen Stimulus (d. h. einen induzierbaren Promotor) induziert. In einigen Ausführungsformen ist der Stimulus ein kleines Molekül, ein Protein, ein Peptid, eine Aminosäure, ein Metabolit, ein anorganisches Molekül, ein metallorganisches Molekül, ein organisches Molekül, ein Medikament oder Medikamentenkandidat, ein Zucker, ein Lipid, ein Metall , eine Nukleinsäure, ein Molekül, das während der Aktivierung einer endogenen oder exogenen Signalkaskade entsteht, Licht, Hitze, Schall, Druck, mechanischem Stress, Scherstress oder ein Virus oder ein anderer Mikroorganismus, pH-Änderung oder Oxidations-/ Reduktionszustand. In einigen Ausführungsformen ist der Stimulus ein Licht. In einigen Ausführungsformen ist der Stimulus ein Virus. In einigen Ausführungsformen ist der Stimulus ein Molekül. In einigen Ausführungsformen ist der Stimulus ein Antibiotikum. In einigen Ausführungsformen ist der Stimulus Anhydrotetracyclin oder Doxycyclin. In einigen Ausführungsformen ist der Stimulus ein Zucker. In einigen Ausführungsformen ist der Stimulus Arabinose, Rhamnose oder IPTG. In einigen Ausführungsformen ist der Stimulus ein Signalmolekül, das während einer aktivierten Signalkaskade produziert wird (z. B. Beta-Catenin, das während einer aktivierten Wnt-Signalkaskade produziert wird). Zusätzliche Promotoren, die Signalmoleküle detektieren, können erzeugt werden, um die Expression der Nukleinsäuresequenz zu induzieren, die funktionsfähig mit dem Promotor verbunden ist, zum Beispiel Promotoren, die einen endogenen Signalweg aufzeichnen, einschließlich einer Immunantwort (IL-2-Promotor), eines cAMPresponsiven Elements (CREB), NEκB-Signalisierung, Interferon-Antwort, P53 (DNA-Schädigung), Sox2, TGF-β-Signalisierung (SMAD), Erk (z. B. aus einer aktivierten Ras/Raf/Mek/Erk-Kaskade), PI3K/AKT (z. B. aus einer aktivierten Ras/PI3K/Akt-Kaskade), Hitzeschock, Notch-Signalisierung, Oct4, ein Aryl-Kohlenwasserstoff-Rezeptor oder ein AP-1-Transkriptionsfaktor. In einigen Ausführungsformen ist der Promotor ein konstitutiver Promotor. In einigen Ausführungsformen ist der Promotor ein in Tabelle 3 aufgeführter Promotor. Zusätzliche geeignete Promotoren zur Verwendung sowohl in prokaryontischen als auch in eukaryontischen Systemen werden dem Durchschnittsfachmann auf der Grundlage dieser Offenbarung und des Fachwissens auf diesem Gebiet offensichtlich sein und liegen im Umfang der vorliegenden Offenbarung.
  • Prime Editoren können auch verwendet werden, um zelluläre Abstammungslinien zu verfolgen. Wiederholte Sequenzmodifikationen können verwendet werden, um einzigartige zelluläre Barcodes zu erzeugen, um einzelne Zellen zu verfolgen. Die Arrays von Barcodes, ihre Reihenfolge und Größe können alle verwendet werden, um zelluläre Abstammung abzuleiten. Zum Beispiel scheint die Insertion von Homologiesequenzen (d. h. Sequenzen 3' von der Cas9-Nick-Position) und insbesondere von Homologiesequenzen mit assoziierten Strichcodes besonders nützliche Abstammungs-Prime Editor-Strategien zu sein. Diese Systeme können so gestaltet werden, dass aufeinanderfolgende Edittingrunden zum Einfügen eines Barcodes aus einer PEgRNA-Kassette führen, der nicht durch andere PEgRNA-Editing-Ereignisse in derselben Zelle modifiziert werden kann. Das Strichcodierungssystem kann mehrere Strichcodes verwenden, die einem gegebenen Stimulus zugeordnet werden können. Dieses System kann die Mehrheit der Target-Protospacer bewahren, aber die Saatsequenz, PAM und stromabwärts benachbarte Nukleotide verändern. Dies ermöglicht es, mehrere Signale mit einem Editing-Lokus zu verbinden, ohne dass die verwendeten PEgRNAs signifikant umgestaltet werden müssen. Die Strategie kann Multiplex-Barcode-Einfügungen als Reaktion auf eine große Anzahl zellulärer Stimuli (entweder intern oder extern) an einem einzigen Ort ermöglichen. Es könnte die Aufzeichnung von Intensität, Dauer und Reihenfolge von so vielen Signalen ermöglichen, wie es eindeutige Strichcodes gibt (die mit mehreren N-Nukleotiden entworfen werden können, um 4^N mögliche Strichcodes zu erzeugen, zum Beispiel würde ein 5-nt-Strichcode die Aufzeichnung von 4^5 oder 1024 eindeutigen Signalen gleichzeitig ermöglichen). Dieses System kann sowohl in vitro als auch in vivo verwendet werden.
  • M. Verwendung von Prime Editing zur Modulation der Biomolekülaktivität
  • Die hierin beschriebene Verwendung von Prime Editoren kann auch verwendet werden, um die subzelluläre Lokalisierung und Modifikationszustände von Biomolekülen, wie DNA, RNA und Proteinen, zu regulieren. Spezifische biologische Funktionen wie Transkriptionskontrolle, Zellstoffwechsel und Signaltransduktionskaskaden werden sorgfältig an bestimmten Stellen innerhalb der Zelle orchestriert. Die Fähigkeit, Proteine zu diesen und anderen einzigartigen Zellkompartimenten zu transportieren, könnte eine Möglichkeit bieten, eine Reihe biologischer Prozesse zu verändern.
  • Dementsprechend kann Prime Editing verwendet werden, um genetisch kodierte Handles zu installieren, die veränderte Modifikationszustände und den subzellulären Transport von Biomolekülen mit einem genetisch kodierten Signal (z. B. Proteine, Lipide, Zucker und Nukleinsäuren) ermöglichen. In verschiedenen Ausführungsformen sind die Target-Biomoleküle für die Prime Editor-vermittelte Medikation DNA. Zum Beispiel könnte DNA modifiziert werden, indem eine Reihe von DNA-Sequenzen installiert werden, die die Zugänglichkeit des Target-Lokus verändern, was entweder zu einer erhöhten oder verringerten Transkription gewünschter Sequenzen führen könnte. In verschiedenen Ausführungsformen sind die Target-Biomoleküle für die Prime Editor-vermittelte Medikation RNA. Zum Beispiel kann die Aktivität von RNA durch Änderung ihrer zellulären Lokalisation, Interaktionspartner, Strukturdynamik oder Thermodynamik der Faltung modifiziert werden. In verschiedenen Ausführungsformen sind die Target-Biomoleküle für die Prime Editor-vermittelte Medikation Protein. Proteine können modifiziert werden, um posttranslationale Modifikationen zu beeinflussen, Proteinmotive können installiert werden, um die subzelluläre Lokalisation des Proteins zu ändern, oder Proteine können modifiziert werden, um ihre Fähigkeit, innerhalb von Protein-Protein-Komplexierungsereignissen zu existieren, entweder zu erzeugen oder zu zerstören.
  • Diese Anwendung des Prime Editing kann in Beispiel 14 weiter beschrieben werden.
  • DNA-Modifikationen
  • Ein Target-Biomolekül für die Prime Editor-vermittelte Medikation ist DNA. DNA-Modifikationen könnten vorgenommen werden, um eine Reihe von DNA-Sequenzen zu installieren, die die Zugänglichkeit des Target-Lokus verändern. Die Zugänglichkeit von Chromatin kontrolliert die Gentranskriptionsausgabe. Die Installation von Markierungen, um Chromatin-kompaktierende Enzyme zu rekrutieren, sollte die Transkriptionsleistung benachbarter Gene verringern, während die Installation von Sequenzen, die mit der Chromatin-Öffnung verbunden sind, Regionen leichter zugänglich machen und wiederum die Transkription erhöhen sollte. Die Installation komplexerer Sequenzmotive, die native regulatorische Sequenzen widerspiegeln, sollte eine nuanciertere und biologisch empfindlichere Kontrolle bieten als die derzeit verfügbaren dCas9-Fusionen zu verschiedenen epigenetischen Reader-, Writer- oder Eraser-Enzymen - Werkzeuge, die typischerweise eine große Anzahl einer einzigen Art von Markierung installieren, die möglicherweise keinen besonderen biologischen Vorläufer haben. Die Installation von Sequenzen, die zwei Loki in enge Nachbarschaft bringen oder Loki mit der Kernmembran in Kontakt bringen, sollte auch die Transkriptionsausgabe dieser Loki verändern, wie auf dem aufstrebenden Gebiet der 3D-Genomarchitektur gezeigt wurde.
  • RNA-Modifikationen
  • Modifikationen an RNAs können auch vorgenommen werden, um ihre Aktivität zu verändern, indem ihre zelluläre Lokalisierung, Interaktionspartner, Strukturdynamik oder Thermodynamik der Faltung geändert wird. Die Installation von Motiven, die Translationspausen oder Rasterverschiebungen verursachen, könnte die Häufigkeit von mRNA-Spezies durch verschiedene mRNA-Prozessierungsmechanismen verändern. Die Modifikation von Konsensus-Spleißsequenzen würde auch die Häufigkeit und Prävalenz verschiedener RNA-Spezies verändern. Eine Änderung des relativen Verhältnisses verschiedener Spleißisoformen würde vorhersagbar zu einer Änderung des Verhältnisses der Proteintranslationsprodukte führen, und dies könnte verwendet werden, um viele biologische Wege zu verändern. Zum Beispiel würde eine Verschiebung des Gleichgewichts von mitochondrialen gegenüber nuklearen DNA-Reparaturproteinen die Widerstandsfähigkeit verschiedener Krebsarten gegenüber chemotherapeutischen Reagenzien verändern. Darüber hinaus könnten RNAs mit Sequenzen modifiziert werden, die eine Bindung an neue Proteinziele ermöglichen. Es wurden eine Reihe von RNA-Aptameren entwickelt, die mit hoher Affinität an zelluläre Proteine binden. Die Installation eines dieser Aptamere könnte verwendet werden, um entweder verschiedene RNA-Spezies durch Bindung an ein Protein-Target zu sequestrieren, das ihre Translation oder biologische Aktivität verhindert, oder um RNA-Spezies in spezifische subzelluläre Kompartimente zu bringen. Der Abbau von Biomolekülen ist eine weitere Klasse der Lokalisierungsmodifikation.
  • Beispielsweise wird die RNA-Methylierung verwendet, um RNAs innerhalb der Zelle zu regulieren. Konsensmotive für die Methylierung könnten mit PE in Target-RNA-Kodiersequenzen eingeführt werden. RNAs könnten auch modifiziert werden, um Sequenzen einzuschließen, die eine Nonsense-vermittelte Zerfallsmaschinerie oder andere Nukleinsäure-Stoffwechselwege zum Abbau der Target-RNA-Spezies steuern, die den RNA-Pool in einer Zelle verändern würden. Darüber hinaus könnten RNA-Spezies modifiziert werden, um ihren Aggregationszustand zu ändern. Sequenzen könnten auf einzelne interessierende RNAs oder mehrere RNAs installiert werden, um RNA-Tangles zu erzeugen, die sie zu unwirksamen Substraten für die Translation oder Signalübertragung machen würden.
  • Protein-Modifikationen
  • Modifikationen an Proteinen durch posttranslationale Modifikation (PTM) stellen ebenfalls eine wichtige Klasse der Manipulation von Biomolekülen dar, die mit PE durchgeführt werden kann. Wie bei RNA-Spezies ist die Veränderung der Proteinhäufigkeit in einer Zelle eine wichtige Fähigkeit von PE. Editing kann durchgeführt werden, um Stoppcodons in einem offenen Leseraster zu installieren - dies verhindert, dass das Produkt in voller Länge von der editierten DNA-Sequenz produziert wird. Alternativ können Peptidmotive installiert werden, die bewirken, dass die Geschwindigkeit des Proteinabbaus für ein Target-Protein verändert wird. Das Einbringen von Degradations-Tags in einen Genkörper könnte verwendet werden, um die Häufigkeit eines Proteins in einer Zelle zu verändern. Darüber hinaus könnte die Einführung von Degronen, die durch kleine Moleküle induziert werden, eine zeitliche Kontrolle über den Proteinabbau ermöglichen. Dies könnte sowohl für die Forschung als auch für die Therapie wichtige Auswirkungen haben, da die Forscher leicht beurteilen könnten, ob der durch kleine Moleküle vermittelte therapeutische Proteinabbau eines bestimmten Targets eine praktikable therapeutische Strategie ist. Proteinmotive könnten auch installiert werden, um die subzelluläre Lokalisation eines Proteins zu verändern. Aminosäuremotive können installiert werden, um Proteine bevorzugt zu einer Reihe von subzellulären Kompartimenten zu transportieren, einschließlich des Zellkerns, der Mitochondrien, der Zellmembran, des Peroxisoms, des Lysosoms, des Proteasoms, des Exosoms und anderer.
  • Das Installieren oder Zerstören von durch die PTM-Maschinerie modifizierten Motiven kann die posttranslationalen Proteinmodifikationen verändern. Phosphorylierung, Ubiquitylierung, Glykosylierung, Lipidierung (z. B. Farnesylierung, Myristoylierung, Palmitoylierung, Prenylierung, GPI-Anker), Hydroxylierung, Methylierung, Acetylierung, Crotonylierung, SUMOylierung, Disulfidbindungsbildung, Seitenkettenbindungsspaltungsereignisse, Polypeptidrückgratspaltungsereignisse (Proteolyse) und eine Reihe anderer Protein-PTMs wurden identifiziert. Diese PTMs verändern die Proteinfunktion, oft durch eine Veränderung der subzellulären Lokalisation. Tatsächlich aktivieren Kinasen häufig nachgeschaltete Signalkaskaden über Phosphorylierungsereignisse. Die Entfernung des Target-Phosphosits würde die Signaltransduktion verhindern. Die Fähigkeit, jedes PTM-Motiv ortsspezifisch zu entfernen oder zu installieren, während die Proteinexpression in voller Länge beibehalten wird, wäre ein wichtiger Fortschritt sowohl für die Grundlagenforschung als auch für die Therapeutik. Der Sequenzinstallationsbereich und das Target-Fenster von PE machen es gut geeignet für einen breiten PTM-Modifikationsraum.
  • Die Entfernung von Lipidierungsstellen sollte den Transport von Proteinen zu Zellmembranen verhindern. Eine wesentliche Einschränkung gegenwärtiger Therapeutika, die auf posttranslationale Modifikationsprozesse abzielen, ist ihre Spezifität. Farnesyl-Transferase-Inhibitoren wurden ausgiebig auf ihre Fähigkeit getestet, die KRAS-Lokalisierung an Zellmembranen zu eliminieren. Leider geht die globale Hemmung der Farnesylierung mit zahlreichen Off-Target-Effekten einher, die eine breite Anwendung dieser kleinen Moleküle verhindert haben. In ähnlicher Weise kann die spezifische Hemmung von Proteinkinasen mit kleinen Molekülen aufgrund der Größe des menschlichen Genoms und der Ähnlichkeiten zwischen verschiedenen Kinasen sehr schwierig sein. PE bietet eine mögliche Lösung für dieses Spezifitätsproblem, da es die Hemmung der Modifikation des Target-Proteins durch Ablation der Modifikationsstelle anstelle einer globalen Enzymhemmung ermöglicht. Beispielsweise wäre die Entfernung des lapidierten Peptidmotivs in KRAS ein gezielter Ansatz, der anstelle der Farnesyltransferase-Hemmung verwendet werden könnte. Dieser Ansatz ist die funktionelle Umkehrung der Hemmung einer Target-Proteinaktivität durch Installieren eines Lipid-Targeting-Motivs auf einem Protein, das nicht für eine Membranbindung ausgelegt ist.
  • PE kann auch verwendet werden, um Protein-Protein-Komplexierungsereignisse zu initiieren. Proteine funktionieren oft innerhalb von Komplexen, um ihre biologische Aktivität auszuführen. PE kann verwendet werden, um die Fähigkeit von Proteinen, innerhalb dieser Komplexe zu existieren, entweder zu erzeugen oder zu zerstören. Um Komplexbildungsereignisse zu eliminieren, könnten Aminosäuresubstitutionen oder -insertionen entlang der Protein:Protein-Schnittstelle installiert werden, um die Komplexierung zu begünstigen. SSX18 ist eine Proteinkomponente des BAF-Komplexes, eines wichtigen Histon-Remodeling-Komplexes. Mutationen in SSX18 führen zu Synovialsarkomen. PE könnte verwendet werden, um Seitenketten zu installieren, die verhindern, dass SSX18 an seine Proteinpartner im Komplex bindet, um seine onkogene Aktivität zu verhindern. PE könnte auch verwendet werden, um die pathogenen Mutationen zu entfernen, um die WT-Aktivität dieses Proteins wiederherzustellen. Alternativ könnte PE verwendet werden, um Proteine entweder in ihrem nativen Komplex zu halten oder sie hinzuziehen, an Interaktionen teilzunehmen, die nicht mit ihrer nativen Aktivität zusammenhängen, um ihre Aktivität zu hemmen. Die Bildung von Komplexen, die einen Interaktionszustand gegenüber einem anderen aufrechterhalten, könnte eine wichtige therapeutische Modalität darstellen. Verändern von Protein: Protein-Schnittstellen, um den Kd der Interaktion zu verringern, würden diese Proteine länger aneinander kleben lassen. Da Proteinkomplexe mehrere Signalkomplexe aufweisen können, wie n-myc, das Neuroblastom-Signalkaskaden bei Krankheiten antreibt, aber ansonsten an einer gesunden Transkriptionskontrolle in anderen Zellen beteiligt ist. PE könnte verwendet werden, um Mutationen zu installieren, die die n-myc-Assoziation mit gesunden Interaktionspartnern vorantreiben und seine Affinität für onkogene Interaktionspartner verringern.
  • In Abschnitt I zitierte Referenzen
  • Jede der folgenden Referenzen wird hierin durch Bezugnahme aufgenommen.
    1. 1. Selective Target Protein Degradation via Phthalimide Conjugation. Winter et al. Science. Autorenmanuskript; verfügbar in PMC 8. Juli 2016.
    2. 2. Reversible disruption of mSWI/SNF (BAF) complexes by the SS18-SSX oncogenic fusion in synovial sarcoma. Kadoch and Crabtree. Cell. 2013 Mar 28;153(1):71-85. doi: 10.1016/j.cell.2013.02.036.
    3. 3. Ribosomal frameshifting and transcriptional slippage: From genetic steganography and cryptography to adventitious use. Atkins et al. Nucleic Acids Research, Volume 44, Issue 15, 6 September 2016, Pages 7007-7078.
    4. 4. Transcriptional Regulation and its Misregulation in Disease. Lee and Young. Cell. Authorenmanuskript; verfügbar in PMC 14. März 2014.
    5. 5. Protein localization in disease and therapy. Mien-Chie Hung, Wolfgang Link Journal of Cell Science 2011 124: 3381-3392.
    6. 6. Loss of post-translational modification sites in disease. Li et al. Pac Symp Biocomput. 2010:337-47. PTMD: A Database of Human Disease-associated Post-translational Modifications. Xu et al. Genomics Proteomics Bioinformatics. 2018 Aug; 16 (4) :244-251. Epub 2018 Sep 21.
    7. 7. Post-transcriptional gene regulation by mRNA modifications. Zhao et al. Nature Reviews Molecular Cell Biology volume18, pages31-42 (2017).
  • N. Verbesserte Designaspekte von PEgRNAs für das Prime Editing
  • In anderen Ausführungsformen kann das Prime Editing-System die Verwendung von PEgRNA-Designs und -Strategien umfassen, die die Prime Editing-Effizienz verbessern können. Diese Strategien versuchen, einige Probleme zu überwinden, die aufgrund des mehrstufigen Prozesses bestehen, der für die Erstbearbeitung erforderlich ist. Beispielsweise können ungünstige RNA-Strukturen, die sich innerhalb der PEgRNA bilden können, dazu führen, dass DNA-Edits von der PEgRNA in den genomischen Lokus kopiert werden. Diese Einschränkungen könnten durch das Redesign und Engineering der PEgRNA-Komponente überwunden werden. Diese Neugestaltungen könnten die Effizienz des Prime Editors verbessern und die Installation längerer eingefügter Sequenzen in das Genom ermöglichen.
  • Dementsprechend können die PEgRNA-Designs in verschiedenen Ausführungsformen zu längeren PEgRNAs führen, indem sie eine effiziente Expression von funktionellen PEgRNAs von Nicht-Polymerase III (pol III)-Promotoren ermöglichen, was die Notwendigkeit von lästigen Sequenzanforderungen vermeiden würde. In anderen Ausführungsformen kann das Kern-, Cas9-bindende PEgRNA-Gerüst verbessert werden, um die Wirksamkeit des Systems zu verbessern. In noch anderen Ausführungsformen können Modifikationen an der PEgRNA vorgenommen werden, um die Prozessivität der Reversen Transkriptase (RT) zu verbessern, was die Insertion längerer Sequenzen an den Target-Genom-Loki ermöglichen würde. In anderen Ausführungsformen können RNA-Motive an die 5'- und/oder 3'-Termini der PEgRNA angefügt werden, um die Stabilität zu verbessern, die RT-Prozessivität zu erhöhen, eine Fehlfaltung der PEgRNA zu verhindern und/oder zusätzliche Faktoren zu rekrutieren, die für das Genom Editing wichtig sind. In noch einer anderen Ausführungsform wird eine Plattform für die Evolution von PEgRNAs für ein gegebenes Sequenz-Target bereitgestellt, die das PEgRNA-Gerüst verbessern und die Effizienz des Prime Editors erhöhen könnte. Diese Designs könnten verwendet werden, um jede PEgRNA zu verbessern, die von jedem Cas9 oder einer weiterentwickelten Variante davon erkannt wird.
  • Diese Anwendung des Prime Editing kann in Beispiel 15 weiter beschrieben werden.
  • Die PEgRNAs können zusätzliche Designverbesserungen beinhalten, die die Eigenschaften und/oder Eigenschaften von PEgRNAs modifizieren können, wodurch die Wirksamkeit des Prime Editing verbessert wird. In verschiedenen Ausführungsformen können diese Verbesserungen zu einer oder mehreren einer Reihe verschiedener Kategorien gehören, einschließlich, aber nicht beschränkt auf: (1) Designs, um eine effiziente Expression funktioneller PEgRNAs von Nicht-Polymerase III (pol III)-Promotoren zu ermöglichen, was die Expression längerer PEgRNAs ohne lästige Sequenzerfordernisse ermöglichen würde; (2) Verbesserungen am Kern, dem Cas9-bindenden PEgRNA-Gerüst, was die Wirksamkeit verbessern könnte; (3) Modifikationen an der PEgRNA, um die RT-Prozessivität zu verbessern, wodurch die Insertion längerer Sequenzen an gezielten genomischen Loki ermöglicht wird; und (4) Hinzufügen von RNA-Motiven an die 5'- oder 3'-Termini der PEgRNA, die die PEgRNA-Stabilität verbessern, die RT-Prozessivität erhöhen, eine Fehlfaltung der PEgRNA verhindern oder zusätzliche Faktoren rekrutieren, die für das Genom-Editing wichtig sind.
  • In einer Ausführungsform könnte PEgRNA mit polIII-Promotoren entworfen werden, um die Expression längerer PEgRNA mit größeren Verlängerungsarmen zu verbessern. sgRNAs werden typischerweise vom U6-snRNA-Promotor exprimiert. Dieser Promotor rekrutiert pol III, um die assoziierte RNA zu exprimieren, und ist nützlich für die Expression von kurzen RNAs, die im Kern zurückgehalten werden. Pol III ist jedoch nicht hoch prozessiv und ist nicht in der Lage, RNAs mit einer Länge von mehr als einigen hundert Nukleotiden in dem für ein effizientes Genom-Editing erforderlichen Niveau zu exprimieren. Darüber hinaus kann pol III an Abschnitten von U anhalten oder terminieren, was möglicherweise die Sequenzdiversität begrenzt, die mit einer PEgRNA eingefügt werden könnte. Andere Promotoren, die Polymerase II (wie pCMV) oder Polymerase I (wie der U1-snRNA-Promotor) rekrutieren, wurden auf ihre Fähigkeit untersucht, längere sgRNAs zu exprimieren. Diese Promotoren werden jedoch typischerweise teilweise transkribiert, was zu einer zusätzlichen Sequenz 5' des Spacers in der exprimierten PEgRNA führen würde, was nachweislich zu einer deutlich reduzierten Cas9:sgRNA-Aktivität in einer Site-abhängigen Weise führt. Während pol III-transkribierte PEgRNAs einfach in einem Lauf von 6-7 U terminieren können, benötigen PEgRNAs, die von pol II oder pol I transkribiert wurden, ein anderes Terminationssignal. Häufig führen solche Signale auch zu einer Polyadenylierung, die zu einem unerwünschten Transport der PEgRNA aus dem Zellkern führen würde. In ähnlicher Weise sind RNAs, die von pol II-Promotoren wie pCMV exprimiert werden, typischerweise 5'-verkappt, was ebenfalls zu ihrem Kernexport führt.
  • Zuvor haben Rinn und Mitarbeiter eine Vielzahl von Expressionsplattformen für die Produktion von langen, nicht kodierenden RNA- (IncRNA) markierten sgRNAs gescreent183. Diese Plattformen umfassen RNAs, die von pCMV exprimiert werden und die im ENE-Element der MALAT1-ncRNA von Menschen184, dem PAN-ENE-Element von KSHV185 oder der 3'-Box von U1-snRNA186 enden. Bemerkenswerterweise bilden die MALAT1-ncRNA und die PAN-ENE Tripelhelices, die den PolyA-Schwanz schützen 184, 187. Diese Konstrukte könnten auch die RNA-Stabilität erhöhen. Es wird erwogen, dass diese Expressionssysteme auch die Expression längerer PEgRNAs ermöglichen.
  • Darüber hinaus wurde eine Reihe von Methoden für die Spaltung des Teils des pol II-Promotors entwickelt, der als Teil der PEgRNA transkribiert werden würde, indem entweder ein selbstspaltendes Ribozym wie Hammerhead188, Pistol189, Hatchet189, Hairpin190, VS191, Twister192- oder Twister-Sister192-Ribozyme oder andere selbstspaltende Elemente hinzugefügt werden, um den transkribierten Leitfaden zu verarbeiten, oder eine Hairpin, das von Csy4193 erkannt wird und ebenfalls zur Verarbeitung des Leitfadens führt. Es wird auch vermutet, dass der Einbau mehrerer ENE-Motive zu einer verbesserten PEgRNA-Expression und -Stabilität führen könnte, wie zuvor für die KSHV PAN-RNA und das Element gezeigt185. Es wird auch erwartet, dass die Zirkularisierung der PEgRNA in Form einer zirkulären intronischen RNA (ciRNA) auch zu einer verbesserten RNA-Expression und -Stabilität sowie zu einer Kernlokalisation führen könnte194.
  • In verschiedenen Ausführungsformen kann die PEgRNA verschiedene obige Elemente umfassen, wie durch die folgende Sequenz beispielhaft dargestellt.
  • Nicht einschränkendes Beispiel 1 - PEgRNA-Expressionsplattform bestehend aus pCMV, Csy4-Hairpin, der PEgRNA und MALAT1 ENE
  • TAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTT
     ACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAA
     TAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTA
     TTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATT
     GACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTC
     CTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTA
     CATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTC
     AATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCC
     CATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTGGTTTAGT
     GAACCGTCAGATCGTTCACTGCCGTATAGGCAGGGCCCAGACTGAGCACGTGAGTTTTAGAGCT
     AGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTC
     CTCTGCCATCAAAGCGTGCTCAGTCTGTTTTAGGGTCATGAAGGTTTTTCTTTTCCTGAGAAAA
     CAACACGTATTGTTTTCTCAGGTTTTGCTTTTTGGCCTTTTTCTAGCTTAAAAAAAAAAAAAGC
     AAAAGATGCTGGTGGTTGGCACTCCTGGTTTCCAGGACGGGGTTCAAATCCCTGCGGCGTCTTT
     GCTTTGACT (SEQ-ID-NR: 501)
  • Nicht einschränkendes Beispiel 2 - PEgRNA-Expressionsplattform bestehend aus pCMV, Csy4-Hairpin, der PEgRNA und PAN ENE
  • TAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTT
     ACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAA
     TAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTA
     TTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATT
     GACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTC
     CTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTA
     CATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTC
     AATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCC
     CATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTGGTTTAGT
     GAACCGTCAGATCGTTCACTGCCGTATAGGCAGGGCCCAGACTGAGCACGTGAGTTTTAGAGCT
     AGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTC
     CTCTGCCATCAAAGCGTGCTCAGTCTGTTTTGTTTTGGCTGGGTTTTTCCTTGTTCGCACCGGA
     CACCTCCAGTGACCAGACGGCAAGGTTTTTATCCCAGTGTATATTGGAAAAACATGTTATACTT
     TTGACAATTTAACGTGCCTAGAGCTCAAATTAAACTAATACCATAACGTAATGCAACTTACAAC
     ATAAATAAAGGTCAATGTTTAATCCATAAAAAAAAAAAAAAAAAAA (SEQ-ID-NR: 502)
  • Nicht einschränkendes Beispiel 3 - PEgRNA-Expressionsplattform bestehend aus pCMV, Csy4-Hairpin, der PEgRNA und 3xPAN ENE
  • TAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTT
     ACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAA
     TAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTA
     TTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATT
     GACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTC
     CTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTA
     CATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTC
     AATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCC
     CATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTGGTTTAGT
     GAACCGTCAGATCGTTCACTGCCGTATAGGCAGGGCCCAGACTGAGCACGTGAGTTTTAGAGCT
     AGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTC
     CTCTGCCATCAAAGCGTGCTCAGTCTGTTTTGTTTTGGCTGGGTTTTTCCTTGTTCGCACCGGA
     CACCTCCAGTGACCAGACGGCAAGGTTTTTATCCCAGTGTATATTGGAAAAACATGTTATACTT
     TTGACAATTTAACGTGCCTAGAGCTCAAATTAAACTAATACCATAACGTAATGCAACTTACAAC
     ATAAATAAAGGTCAATGTTTAATCCATAAAAAAAAAAAAAAAAAAAACACACTGTTTTGGCTGG
     GTTTTTCCTTGTTCGCACCGGACACCTCCAGTGACCAGACGGCAAGGTTTTTATCCCAGTGTAT
     ATTGGAAAAACATGTTATACTTTTGACAATTTAACGTGCCTAGAGCTCAAATTAAACTAATACC
     ATAACGTAATGCAACTTACAACATAAATAAAGGTCAATGTTTAATCCATAAAAAAAAAAAAAAA
     AAAATCTCTCTGTTTTGGCTGGGTTTTTCCTTGTTCGCACCGGACACCTCCAGTGACCAGACGG
     CAAGGTTTTTATCCCAGTGTATATTGGAAAAACATGTTATACTTTTGACAATTTAACGTGCCTA
     GAGCTCAAATTAAACTAATACCATAACGTAATGCAACTTACAACATAAATAAAGGTCAATGTTT
     AATCCATAAAAAAAAAAAAAAAAAAA (SEQ-ID-NR: 503)
  • Nicht einschränkendes Beispiel 4 - PEgRNA-Expressionsplattform bestehend aus pCMV, Csy4-Hairpin, der PEgRNA und 3'-Box
  •  TAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTT
     ACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAA
     TAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTA
     TTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATT
     GACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTC
     CTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTA
     CATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTC
     AATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCC
     CATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTGGTTTAGT
     GAACCGTCAGATCGTTCACTGCCGTATAGGCAGGGCCCAGACTGAGCACGTGAGTTTTAGAGCT
     AGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTC
     CTCTGCCATCAAAGCGTGCTCAGTCTGTTTGTTTCAAAAGTAGACTGTACGCTAAGGGTCATAT
     CTTTTTTTGTTTGGTTTGTGTCTTGGTTGGCGTCTTAAA (SEQ-ID-NR: 504)
  • Nicht einschränkendes Beispiel 5 - PEgRNA-Expressionsplattform bestehend aus pU1, Csy4-Hairpin, der PEgRNA und 3'-Box
  •  CTAAGGACCAGCTTCTTTGGGAGAGAACAGACGCAGGGGCGGGAGGGAAAAAGGGAGAGGCAGA
     CGTCACTTCCCCTTGGCGGCTCTGGCAGCAGATTGGTCGGTTGAGTGGCAGAAAGGCAGACGGG
     GACTGGGCAAGGCACTGTCGGTGACATCACGGACAGGGCGACTTCTATGTAGATGAGGCAGCGC 
    
     AGAGGCTGCTGCTTCGCCACTTGCTGCTTCACCACGAAGGAGTTCCCGTGCCCTGGGAGCGGGT
     TCAGGACCGCTGATCGGAAGTGAGAATCCCAGCTGTGTGTCAGGGCTGGAAAGGGCTCGGGAGT
     GCGCGGGGCAAGTGACCGTGTGTGTAAAGAGTGAGGCGTATGAGGCTGTGTCGGGGCAGAGGCC
     CAAGATCTCAGTTCACTGCCGTATAGGCAGGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGA
     AATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTC
     TGCCATCAAAGCGTGCTCAGTCTGTTTCAGCAAGTTCAGAGAAATCTGAACTTGCTGGATTTTT
     GGAGCAGGGAGATGGAATAGGAGCTTGCTCCGTCCACTCCACGCATCGACCTGGTATTGCAGTA
     CCTCCAGGAACGGTGCACCCACTTTCTGGAGTTTCAAAAGTAGACTGTACGCTAAGGGTCATAT
     CTTTTTTTGTTTGGTTTGTGTCTTGGTTGGCGTCTTAAA (SEQ-ID-NR: 505)
  • In verschiedenen anderen Ausführungsformen kann die PEgRNA verbessert werden, indem Verbesserungen an den Gerüst- oder Kernsequenzen eingeführt werden. Dies kann durch die Einführung von Bekanntem getan werden
  • Der Kern, das Cas9-bindende PEgRNA-Gerüst, kann wahrscheinlich verbessert werden, um die PE-Aktivität zu erhöhen. Mehrere solcher Ansätze wurden bereits demonstriert. Zum Beispiel enthält das erste Paarungselement des Gerüsts (P1) ein GTTTT-AAAAC-Paarungselement. Es wurde gezeigt, dass solche Durchläufe von Ts zu einer pol III-Pausierung und einer vorzeitigen Beendigung des RNA-Transkripts führen. Es wurde gezeigt, dass die rationale Mutation eines der T-A-Paare zu einem G-C-Paar in diesem Teil von P1 die sgRNA-Aktivität erhöht, was darauf hindeutet, dass dieser Ansatz auch für PEgRNAs möglich wäre195. Darüber hinaus wurde auch gezeigt, dass die Verlängerung der P1-Länge die sgRNA-Faltung verbessert und zu einer verbesserten Aktivität führt195, was darauf hindeutet, dass dies ein weiterer Weg zur Verbesserung der PEgRNA-Aktivität ist. Beispiele für Verbesserungen am Kern können sein:
  • PEgRNA mit einer 6 nt-Verlängerung zu P1
  •  GGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGCTCATGAAAATGAGCTAGCAAGTTAAAATAA
     GGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTC
     AGTCTGTTTTTTT (SEQ-ID-NR: 228)
  • PEgRNA mit einer T-A-zu-G-C-Mutation innerhalb von P1
  •  GGCCCAGACTGAGCACGTGAGTTTGAGAGCTAGAAATAGCAAGTTTAAATAAGGCTAGTCCGTT
     ATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGTTTTTT
     T (SEQ-ID-NR: 229)
  • In verschiedenen anderen Ausführungsformen kann die PEgRNA durch Einführen von Modifikationen in die Edit-Matrizenregion verbessert werden. Wenn die Größe der von der PEgRNA gesteuerten Insertion zunimmt, ist es wahrscheinlicher, dass sie von Endonukleasen abgebaut wird, spontan hydrolysiert wird oder sich in Sekundärstrukturen faltet, die von der RT nicht revers transkribiert werden können oder die Faltung des PEgRNA-Gerüsts und nachfolgend die Cas9-RT-Bindung unterbrechen. Dementsprechend ist es wahrscheinlich, dass eine Modifikation der Matrize der PEgRNA notwendig sein könnte, um große Insertionen, wie die Insertion ganzer Gene, zu beeinflussen. Einige Strategien dazu umfassen den Einbau modifizierter Nukleotide in eine synthetische oder halbsynthetische PEgRNA, die die RNA resistenter gegen Abbau oder Hydrolyse machen oder weniger wahrscheinlich inhibitorische Sekundärstrukturen annehmen196. Solche Modifikationen könnten 8-Aza-7-Deazaguanosin einschließen, das die RNA-Sekundärstruktur in G-reichen Sequenzen reduzieren würde; Locked-Nucleinsäuren (LNA), die den Abbau reduzieren und bestimmte Arten der RNA-Sekundärstruktur verbessern; 2'-O-Methyl-, 2'-Fluor- oder 2'-O-Methoxyethoxy-Modifikationen, die die RNA-Stabilität erhöhen. Solche Modifikationen könnten auch an anderer Stelle in die PEgRNA aufgenommen werden, um die Stabilität und Aktivität zu erhöhen. Alternativ oder zusätzlich könnte das Template der PEgRNA so gestaltet werden, dass es sowohl für ein gewünschtes Proteinprodukt kodiert als auch eher einfache Sekundärstrukturen annimmt, die durch die RT entfaltet werden können. Solche einfachen Strukturen würden als thermodynamische Senke wirken, was es weniger wahrscheinlich macht, dass kompliziertere Strukturen auftreten, die eine Reverse Transkription verhindern würden. Schließlich könnte man die Matrize auch in zwei separate PEgRNAs aufteilen. In einem solchen Design würde ein PE verwendet, um die Transkription zu initiieren und auch eine separate Template-RNA über ein RNA-bindendes Protein, das an Cas9 fusioniert ist, oder ein RNA-Erkennungselement auf der PEgRNA selbst, wie das MS2-Aptamer, an die Target-Site zu rekrutieren. Die RT könnte entweder direkt an diese separate Matrizen-RNA binden oder die Reverse Transkription auf der ursprünglichen PEgRNA initiieren, bevor sie zur zweiten Matrize ausgetauscht wird. Ein solcher Ansatz könnte lange Insertionen ermöglichen, indem er sowohl eine Fehlfaltung der PEgRNA bei Zugabe der langen Matrize verhindert als auch keine Dissoziation von Cas9 vom Genom für lange Insertionen erfordert, was möglicherweise PE-basierte lange Insertionen hemmt.
  • In noch anderen Ausführungsformen kann die PEgRNA verbessert werden, indem zusätzliche RNA-Motive an den 5'- und 3'-Termini der PEgRNAs eingeführt werden. Mehrere solcher Motive - wie das PAN ENE von KSHV und das ENE von MALAT1 wurden oben als mögliche Mittel diskutiert, um die Expression längerer PEgRNAs von Nicht-pol III-Promotoren zu beenden. Diese Elemente bilden RNA-Tripelhelices, die den PolyA-Schwanz umhüllen, was dazu führt, dass sie im Kern zurückgehalten werden184,187. Durch die Bildung komplexer Strukturen am 3'-Terminus der PEgRNA, die das terminale Nukleotid verschließen, würden diese Strukturen jedoch wahrscheinlich auch dazu beitragen, den Exonuklease-vermittelten Abbau von PEgRNAs zu verhindern.
  • Andere am 3'-Terminus inserierte Strukturelemente könnten ebenfalls die RNA-Stabilität erhöhen, jedoch ohne die Termination von Nicht-pol III-Promotoren zu ermöglichen. Solche Motive könnten Hairpins oder RNA-Quadruplexe umfassen, die den 3'-Terminus verschließen197, oder selbstspaltende Ribozyme wie HDV, die zur Bildung eines 2'-3'-cyclischen Phosphats am 3'-Terminus führen und möglicherweise auch dazu führen, dassdie PEgRNA weniger wahrscheinlich durch Exonukleasen abgebaut wird198. Das Induzieren der PEgRNA durch unvollständiges Spleißen zur Zyklisierung - um eine ciRNA zu bilden - könnte auch die PEgRNA-Stabilität erhöhen und dazu führen, dass die PEgRNA im Zellkern verbleibt194.
  • Zusätzliche RNA-Motive könnten auch die RT-Prozessivität verbessern oder die PEgRNA-Aktivität steigern, indem sie die RT-Bindung an den DNA-RNA-Duplex verstärken. Die Zugabe der nativen Sequenz, die von der RT in ihrem verwandten retroviralen Genom gebunden wird, könnte die RT-Aktivität erhöhen199. Dies könnte die native Primerbindungsstelle (PBS), den Polypurintrakt („polypurine tract“ - PPT) oder Kissing Loops umfassen, die an der retroviralen Genomdimerisierung und Transkriptionsinitiation beteiligt sind199.
  • Das Hinzufügen von Dimerisierungsmotiven - wie Kissing Loops oder einem GNRA-Tetraloop/Tetraloop-Rezeptorpaar200 - an den 5'- und 3'-Termini der PEgRNA könnte auch zu einer effektiven Zirkularisierung der PEgRNA führen, was die Stabilität verbessert. Darüber hinaus wird in Betracht gezogen, dass die Zugabe dieser Motive die physikalische Trennung des PEgRNA-Spacers und des Primers ermöglichen könnte, wodurch eine Okklusion des Spacers verhindert wird, die die PE-Aktivität behindern würde. Kurze 5'- oder 3'-Verlängerungen der PEgRNA, die in der Spacer-Region eine kleinen Toehold-Hairpin bilden, könnten auch günstig gegen die Annealen-Region der den Spacer bindenden PEgRNA konkurrieren. Schließlich könnten Kissing Loops auch verwendet werden, um andere Template-RNAs an die genomische Site zu rekrutieren und den Austausch der RT-Aktivität von einer RNA zur anderen zu ermöglichen. Beispiele für Verbesserungen umfassen, sind aber nicht beschränkt auf:
  • PEgRNA-HDV-Fusion
  •  GGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTT
     ATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGGGCCGG
     CATGGTCCCAGCCTCCTCGCTGGCGCCGGCTGGGCAACATGCTTCGGCATGGCGAATGGGACTT
     TTTTT (SEQ-ID-NR: 230)
  • PEgRNA-MMLV-Kissing Loop
  •  GGTGGGAGACGTCCCACCGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTA
     AAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGC
     TTCGACCGTGCTCAGTCTGGTGGGAGACGTCCCACCTTTTTTT (SEQ-ID-NR: 231)
  • PEgRNA-VS-Ribozym-Kissing Loop
  •  GAGCAGCATGGCGTCGCTGCTCACGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGC
     AAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCAT
     CAAAGCTTCGACCGTGCTCAGTCTCCATCAGTTGACACCCTGAGGTTTTTTT (SEQ-ID-NR:
     232)
  • PEgRNA-GNRA-Tetraloop/Tetraloop-Rezeptor
  •  GCAGACCTAAGTGGUGACATATGGTCTGGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAUACG
     TAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTUACGAAGTGGGACCGAGTCGGTCCTCTG
     CCATCAAAGCTTCGACCGTGCTCAGTCTGCATGCGATTAGAAATAATCGCATGTTTTTTT
     (SEQ-ID-NR: 233)
  • PEgRNA-Template-Switching sekundäre RNA-HDV-Fusion
  •  TCTGCCATCAAAGCTGCGACCGTGCTCAGTCTGGTGGGAGACGTCCCACCGGCCGGCATGGTCC
     CAGCCTCCTCGCTGGCGCCGGCTGGGCAACATGCTTCGGCATGGCGAATGGGACTTTTTTT
     (SEQ-ID-NR: 234)
  • Das PEgRNA-Gerüst könnte durch gerichtete Evolution weiter verbessert werden, ähnlich wie SpCas9 und Prime Editor (PE) verbessert wurden. Die gerichtete Evolution könnte die Erkennung von PEgRNA durch Cas9 oder entwickelte Cas9-Varianten verbessern. Darüber hinaus ist es wahrscheinlich, dass unterschiedliche PEgRNA-Gerüstsequenzen an unterschiedlichen genomischen Loki optimal wären, indem sie entweder die PE-Aktivität an der fraglichen Site erhöhen, Off-Target-Aktivitäten reduzieren oder beides. Schließlich würde die Evolution von PEgRNA-Gerüsten, denen andere RNA-Motive hinzugefügt wurden, mit ziemlicher Sicherheit die Aktivität der fusionierten PEgRNA im Vergleich zur nicht entwickelten Fusions-RNA verbessern. Beispielsweise führte die Evolution allosterischer Ribozyme, die aus c-di-GMP-I-Aptameren und Hammerhead-Ribozymen bestehen, zu einer dramatisch verbesserten Aktivität202, was darauf hindeutet, dass die Evolution auch die Aktivität von Hammerhead-PEgRNA-Fusionen verbessern würde. Darüber hinaus wird, während Cas9 derzeit im Allgemeinen keine 5'-Erweiterung der sgRNA toleriert, die gerichtete Evolution wahrscheinlich Mutationen erzeugen, die diese Intoleranz mildern und die Verwendung zusätzlicher RNA-Motive ermöglichen.
  • Die vorliegende Offenbarung erwägt alle derartigen Möglichkeiten, die Wirksamkeit der hier offenbarten Prime Editing-Systeme weiter zu verbessern.
  • O. Nutzung von Prime Editing mit erweitertem Targeting-Umfang
  • Prime Editing (PE) mit Streptococcus pyogenes Cas9 (SpCas9) kann alle Einzelbasensubstitutionen, Insertionen, Deletionen und Kombinationen davon effizient an genomischen Loki installieren, wo es ein geeignet platziertes NGG-Protospacer-Nachbarmotiv (PAM) gibt, das SpCas9 effizient binden kann. In einem anderen Aspekt jedoch erweitern die hierin beschriebenen Verfahren die Targeting-Fähigkeit von PE durch Erweitern der zugänglichen PAMs und daher der zielbaren genomischen Loki, die für effizientes PE zugänglich sind. Prime Editoren, die andere RNA-gesteuerte DNA-bindende Proteine als SpCas9 verwenden, ermöglichen einen erweiterten Target-Bereich genomischer Loki, indem sie den Zugriff auf verschiedene PAMs ermöglichen. Darüber hinaus ermöglicht die Verwendung von RNA-gesteuerten DNA-bindenden Proteinen, die kleiner als SpCas9 sind, auch eine effizientere Virusübertragung. PE mit Cas-Proteinen oder anderen RNA-gesteuerten DNA-bindenden Proteinen jenseits von SpCas9 wird hocheffiziente therapeutische Bearbeitungen ermöglichen, die mit SpCas9-basiertem PE entweder nicht zugänglich oder ineffizient waren.
  • Dies wird voraussichtlich in Situationen verwendet, in denen SpCas9-basiertes PE entweder aufgrund eines nicht idealen Abstands eines Edits relativ zu einem NGG-PAM ineffizient ist oder die Gesamtgröße des SpCas9-basierten Konstrukts für die zelluläre Expression und/oder Abgabe untragbar ist . Spezifische krankheitsrelevante Loki wie das Huntingtin-Gen, das wenige und schlecht lokalisierte NGG-PAMs für SpCas9 in der Nähe der Zielregion aufweist, können mit verschiedenen Cas-Proteinen im PE-System wie SpCas9-VRQR, das ein NGA-PAM erkennt, leicht angesteuert werden. Kleinere Cas-Proteine werden verwendet, um kleinere PE-Konstrukte zu erzeugen, die effizienter in AAV-Vektoren verpackt werden können, was eine bessere Abgabe an Target-Gewebe ermöglicht. 61 zeigt die Reduktion auf die Praxis des Prime Editings unter Verwendung von Staphylococcus aureus CRISPR-Cas als das RNA-gesteuerte DNA-Bindungsprotein. NT ist eine unbehandelte Kontrolle.
  • 62A-62B demonstrieren die Bedeutung des Protospacers für die effiziente Installation eines gewünschten Edits an einer genauen Stelle mit Prime Editing. Dies unterstreicht die Bedeutung alternativer PAMs und Protospacer als neuartige Merkmale dieser Technologie. „n.d.“ in 62A ist „nicht erkannt“.
  • 63 zeigt die Reduktion auf die Praxis von PE unter Verwendung von SpCas9(H840A)-VRQR und SpCas9(H840A)-VRER als das RNA-gesteuerte DNA-Bindungsprotein in einem Prime Editor-System. Der SpCas9(H840A)-VRQR-napDNAbp wird hierin offenbart als Seq-ID-Nr: 87. Der SpCas9(H840A)-VRER-napDNAbp wird hierin offenbart als Seq-ID-Nr: 88. Das SpCas9(H840A)-VRER-MMLV-RT-Fusionsprotein wird hierin offenbart als Seq-ID-Nr: 516, wobei die MMLV-RT die D200N-, L603W-, T330P-, T306K- und W313F-Substitutionen relativ zur Wildtyp-MMLV-RT umfasst. Das SpCas9(H840A)-VRQR-MMLV-RT-Fusionsprotein wird hierin offenbart als Seq-ID-Nr: 515, wobei die MMLV-RT die D200N-, L603W-, T330P-, T306K- und W313F-Substitutionen relativ zur Wildtyp-MMLV-RT umfasst. Sieben verschiedene Loki im menschlichen Genom werden anvisiert: 4 mit dem SpCas9(H840A)-VRQR-MMLV RT Prime Editor-System und 3 mit dem SpCas9(H840A)-VRER-MMLV RT-System. Die Aminosäuresequenzen der getesteten Konstrukte sind wie folgt:
    Figure DE112020001339T5_0281
    Figure DE112020001339T5_0282
    Figure DE112020001339T5_0283
    Figure DE112020001339T5_0284
    Figure DE112020001339T5_0285
  • Wie in 63 gezeigt, war der SpCas9 (H840A) -VRQR-MMLV RT an PAM-Sites im Einsatz, die „AGAG“ und „GGAG“ umfassten, mit einigen Editing-Aktivitäten bei „GGAT“- und „AGAT“-PAM-Sequenzen. Der SpCas9(H840A)-VRER-MMLV-RT war an PAM-Sites im Einsatz, die „AGCG“ und „GGCG“ umfassten, mit einigen Editing-Aktivitäten bei „TGCG“.
  • Die Daten zeigen, dass ein Prime Editing unter Verwendung von napDNAbps durchgeführt werden kann, die unterschiedliche PAM-Spezifitäten tragen, wie die hierin beschriebenen Cas9-Varianten.
  • In verschiedenen Ausführungsformen umfasst der napDNAbp (z. B. Cas9) mit veränderten PAM-Spezifitäten eine Kombination von Mutationen, die Aktivität auf einer Targetsequenz aufweisen, die eine 5'-NAA-3' PAM-Sequenz an ihrem 3'-Ende umfasst. In einigen Ausführungsformen ist die Kombination von Mutationen in einem der in Tabelle 1 aufgeführten Klone vorhanden. In einigen Ausführungsformen sind die Mutationskombinationen konservative Mutationen der in Tabelle 1 aufgeführten Klone. In einigen Ausführungsformen umfasst das Cas9-Protein die Kombination von Mutationen eines der in Tabelle 1 aufgeführten Cas9-Klone. Tabelle 1 NAA PAM-Klone
    Mutationen von Wildtyp-SpCas9 (z. B. Seq-ID-Nr: 18)
    D177N, K218R, D614N, D1135N, P1137S, E1219V, A1320V, A1323D, R1333K
    D177N, K218R, D614N, D1135N, E1219V, Q1221H, H1264Y, A1320V, R1333K
    A10T, I322V, S409I, E427G, G715C, D1135N, E1219V, Q1221H, H1264Y, A1320V, R1333K
    A367T, K710E, R1114G, D1135N, P1137S, E1219V, Q1221H, H1264Y, A1320V, R1333K
    A10T, I322V, S409I, E427G, R753G, D861N, D1135N, K1188R, E1219V, Q1221H, H1264H, A1320V, R1333K
    A10T, I322V, S409I, E427G, R654L, V743I, R753G, M1021T, D1135N, D1180G, K1211R, E1219V, Q1221H, H1264Y, A1320V, R1333K
    A10T, I322V, S409I, E427G, V743I, R753G, E762G, D1135N, D1180G, K1211R, E1219V, Q1221H, H1264Y, A1320V, R1333K
    A10T, I322V, S409I, E427G, R753G, D1135N, D1180G, K1211R, E1219V, Q1221H, H1264Y, S1274R, A1320V, R1333K
    A10T, I322V, S409I, E427G, A589S, R753G, D1135N, E1219V, Q1221H, H1264H, A1320V, R1333K
    A10T, I322V, S409I, E427G, R753G, E757K, G865G, D1135N, E1219V, Q1221H, H1264Y, A1320V, R1333K
    A10T, I322V, S409I, E427G, R654L, R753G, E757K, D1135N, E1219V, Q1221H, H1264Y, A1320V, R1333K
    A10T, I322V, S409I, E427G, K599R, M631A, R654L, K673E, V743I, R753G, N758H, E762G, D1135N, D1180G, E1219V, Q1221H, Q1256R, H1264Y, A1320V, A1323D, R1333K
    A10T, I322V, S409I, E427G, R654L, K673E, V743I, R753G, E762G, N869S, N1054D, R1114G, D1135N, D1180G, E1219V, Q1221H, H1264Y, A1320V, A1323D, R1333K
    A10T, I322V, S409I, E427G, R654L, L727I, V743I, R753G, E762G, R859S, N946D, F1134L, D1135N, D1180G, E1219V, Q1221H, H1264Y, N1317T, A1320V, A1323D, R1333K
    A10T, I322V, S409I, E427G, R654L, K673E, V743I, R753G, E762G, N803S, N869S, Y1016D, G1077D, R1114G, F1134L, D1135N, D1180G, E1219V, Q1221H, H1264Y, V1290G, L1318S, A1320V, A1323D, R1333K
    A10T, I322V, S409I, E427G, R654L, K673E, V743I, R753G, E762G, N803S, N869S, Y1016D, G1077D, R1114G, F1134L, D1135N, K1151E, D1180G, E1219V, Q1221H, H1264Y, V1290G, L1318S, A1320V, R1333K
    A10T, I322V, S409I, E427G, R654L, K673E, V743I, R753G, E762G, N803S, N869S, Y1016D, G1077D, R1114G, F1134L, D1135N, D1180G, E1219V, Q1221H, H1264Y, V1290G, L1318S, A1320V, A1323D, R1333K
    A10T, I322V, S409I, E427G, R654L, K673E, F693L, V743I, R753G, E762G, N803S, N869S, L921P, Y1016D, G1077D, F1080S, R1114G, D1135N, D1180G, E1219V, Q1221H, H1264Y, L1318S, A1320V, A1323D, R1333K
    A10T, I322V, S409I, E427G, E630K, R654L, K673E, V743I, R753G, E762G, Q768H, N803S, N869S, Y1016D, G1077D, R1114G, F1134L, D1135N, D1180G, E1219V, Q1221H, H1264Y, L1318S, A1320V, R1333K
    A10T, I322V, S409I, E427G, R654L, K673E, F693L, V743I, R753G, E762G, Q768H, N803S, N869S, Y1016D, G1077D, R1114G, F1134L, D1135N, D1180G, E1219V, Q1221H, G1223S, H1264Y, L1318S, A1320V, R1333K
    A10T, I322V, S409I, E427G, R654L, K673E, F693L, V743I, R753G, E762G, N803S, N869S, L921P, Y1016D, G1077D, F1801S, R1114G, D1135N, D1180G, E1219V, Q1221H, H1264Y, L1318S, A1320V, A1323D, R1333K
    A10T, I322V, S409I, E427G, R654L, V743I, R753G, M1021T, D1135N, D1180G, K1211R, E1219V, Q1221H, H1264Y, A1320V, R1333K
    A10T, I322V, S409I, E427G, R654L, K673E, V743I, R753G, E762G, M673I, N803S, N869S, G1077D, R1114G, D1135N, V1139A, D1180G, E1219V, Q1221H, A1320V, R1333K
    A10T, I322V, S409I, E427G, R654L, K673E, V743I, R753G, E762G, N803S, N869S, R1114G, D1135N, E1219V, Q1221H, A1320V, R1333K
  • In einigen Ausführungsformen umfasst das Cas9-Protein eine Aminosäuresequenz, die zu mindestens 80 % identisch mit der Aminosäuresequenz eines Cas9-Proteins ist, wie es von einer der Varianten von Tabelle 1 bereitgestellt wird. In einigen Ausführungsformen umfasst das Cas9-Protein eine Aminosäuresequenz, die mindestens 85 %, mindestens 90 %, mindestens 92 %, mindestens 95 %, mindestens 96 %, mindestens 97 %, mindestens 98 %, mindestens 99% oder mindestens 99,5 % identisch mit der Aminosäuresequenz eines Cas9-Proteins ist, wie von einer der Varianten von Tabelle 1 bereitgestellt.
  • In einigen Ausführungsformen weist das Cas9-Protein eine erhöhte Aktivität auf einer Targetsequenz auf, die das kanonische PAM (5'-NGG-3') an seinem 3'-Ende nicht umfasst, im Vergleich zu Streptococcus pyogenes Cas9 gemäß Seq-ID-Nr: 18. In einigen Ausführungsformen weist das Cas9-Protein eine Aktivität auf einer Targetsequenz mit einem 3'-Ende auf, das nicht direkt an die kanonische PAM-Sequenz (5'-NGG-3') angrenzt, die mindestens 5-fach erhöht ist im Vergleich zur Aktivität von Streptococcus pyogenes Cas9 gemäß Seq-ID-Nr: 18 auf derselben Targetsequenz. In einigen Ausführungsformen weist das Cas9-Protein eine Aktivität auf einer Targetsequenz auf, die nicht direkt neben der kanonischen PAM-Sequenz (5'-NGG-3') liegt, die mindestens 10-fach, mindestens 50-fach, mindestens 100-fach, mindestens 500-fach, mindestens 1.000-fach, mindestens 5.000-fach, mindestens 10.000-fach, mindestens 50.000-fach, mindestens 100.000-fach, mindestens 500.000-fach oder mindestens 1.000.000- fach erhöht ist im Vergleich zur Aktivität von Streptococcus pyogenes gemäß Seq-ID-Nr: 2 auf derselben Targetsequenz. In einigen Ausführungsformen grenzt das 3'-Ende der Targetsequenz direkt an eine AAA-, GAA-, CAA- oder TAA-Sequenz. In einigen Ausführungsformen umfasst das Cas9-Protein eine Kombination von Mutationen, die Aktivität auf einer Targetsequenz aufweisen, die an ihrem 3'-Ende eine 5'-NAC-3'-PAM-Sequenz umfasst. In einigen Ausführungsformen ist die Kombination von Mutationen in einem der in Tabelle 2 aufgeführten Klone vorhanden. In einigen Ausführungsformen sind die Mutationskombinationen konservative Mutationen der in Tabelle 2 aufgeführten Klone. In einigen Ausführungsformen umfasst das Cas9-Protein die Kombination von Mutationen eines der in Tabelle 2 aufgeführten Cas9-Klone. Tabelle 2 NAC PAM-Klone
    MUTATIONEN VON WILDTYP-SPCAS9 (Z. B. SEQ-ID-NR: 18)
    T472I, R753G, K890E, D1332N, R1335Q, T1337N
    I1057S, D1135N, P1301S, R1335Q, T1337N
    T472I, R753G, D1332N, R1335Q, T1337N
    D1135N, E1219V, D1332N, R1335Q, T1337N
    T472I, R753G, K890E, D1332N, R1335Q, T1337N
    I1057S, D1135N, P1301S, R1335Q, T1337N
    T472I, R753G, D1332N, R1335Q, T1337N
    T472I, R753G, Q771H, D1332N, R1335Q, T1337N
    E627K, T638P, K652T, R753G, N803S, K959N, R1114G, D1135N, E1219V, D1332N, R1335Q, T1337N
    E627K, T638P, K652T, R753G, N803S, K959N, R1114G, D1135N, K1156E, E1219V, D1332N, R1335Q, T1337N
    E627K, T638P, V647I, R753G, N803S, K959N, G1030R, I1055E, R1114G, D1135N, E1219V, D1332N, R1335Q, T1337N
    E627K, E630G, T638P, V647A, G687R, N767D, N803S, K959N, R1114G, D1135N, E1219V, D1332G, R1335Q, T1337N
    E627K, T638P, R753G, N803S, K959N, R1114G, D1135N, E1219V, N1266H, D1332N, R1335Q, T1337N
    E627K, T638P, R753G, N803S, K959N, I1057T, R1114G, D1135N, E1219V, D1332N, R1335Q, T1337N
    E627K, T638P, R753G, N803S, K959N, R1114G, D1135N, E1219V, D1332N, R1335Q, T1337N
    E627K, M631I, T638P, R753G, N803S, K959N, Y1036H, R1114G, D1135N, E1219V, D1251G, D1332G, R1335Q, T1337N
    E627K, T638P, R753G, N803S, V875I, K959N, Y1016C, R1114G, D1135N, E1219V, D1251G, D1332G, R1335Q, T1337N, I1348V
    K608R, E627K, T638P, V647I, R654L, R753G, N803S, T804A, K848N, V922A, K959N, R1114G, D1135N, E1219V, D1332N, R1335Q, T1337N
    K608R, E627K, T638P, V647I, R753G, N803S, V922A, K959N, K1014N, V1015A, R1114G, D1135N, K1156N, E1219V, N1252D, D1332N, R1335Q, T1337N
    K608R, E627K, R629G, T638P, V647I, A711T, R753G, K775R, K789E, N803S, K959N, V1015A, Y1036H, R1114G, D1135N, E1219V, N1286H, D1332N, R1335Q, T1337N
    K608R, E627K, T638P, V647I, T740A, R753G, N803S, K948E, K959N, Y1016S, R1114G, D1135N, E1219V, N1286H, D1332N, R1335Q, T1337N
    K608R, E627K, T638P, V647I, T740A, N803S, K948E, K959N, Y1016S, R1114G, D1135N, E1219V, N1286H, D1332N, R1335Q, T1337N
    I670S, K608R, E627K, E630G, T638P, V647I, R653K, R753G, I795L, K797N, N803S, K866R, K890N, K959N, Y1016C, R1114G, D1135N, E1219V, D1332N, R1335Q, T1337N
    K608R, E627K, T638P, V647I, T740A, G752R, R753G, K797N, N803S, K948E, K959N, V1015A, Y1016S, R1114G, D1135N, E1219V, N1266H, D1332N, R1335Q, T1337N
    I570T, A589V, K608R, E627K, T638P, V647I, R654L, Q716R, R753G, N803S, K948E, K959N, Y1016S, R1114G, D1135N, E1207G, E1219V, N1234D, D1332N, R1335Q, T1337N
    K608R, E627K, R629G, T638P, V647I, R654L, Q740R, R753G, N803S, K959N, N990S, T995S, V1015A, Y1036D, R1114G, D1135N, E1207G, E1219V, N1234D, N1266H, D1332N, R1335Q, T1337N
    I562F, V565D, I570T, K608R, L625S, E627K, T638P, V647I, R654I, G752R, R753G, N803S, N808D, K959N, M1021L, R1114G, D1135N, N1177S, N1234D, D1332N, R1335Q, T1337N
    I562F, I570T, K608R, E627K, T638P, V647I, R753G, E790A, N803S, K959N, V1015A, Y1036H, R1114G, D1135N, D1180E, A1184T, E1219V, D1332N, R1335Q, T1337N
    I570T, K608R, E627K, T638P, V647I, R654H, R753G, E790A, N803S, K959N, V1015A, R1114G, D1127A, D1135N, E1219V, D1332N, R1335Q, T1337N
    I570T, K608R, L625S, E627K, T638P, V647I, R654I, T703P, R753G, N803S, N808D, K959N, M1021L, R1114G, D1135N, E1219V, D1332N, R1335Q, T1337N
    I570S, K608R, E627K, E630G, T638P, V647I, R653K, R753G, I795L, N803S, K866R, K890N, K959N, Y1016C, R1114G, D1135N, E1219V, D1332N, R1335Q, T1337N
    I570T, K608R, E627K, T638P, V647I, R654H, R753G, E790A, N803S, K959N, V1016A, R1114G, D1135N, E1219V, K1246E, D1332N, R1335Q, T1337N
    K608R, E627K, T638P, V647I, R654L, K673E, R753G, E790A, N803S, K948E, K959N, R1114G, D1127G, D1135N, D1180E, E1219V, N1286H, D1332N, R1335Q, T1337N
    K608R, L625S, E627K, T638P, V647I, R654I, I670T, R753G, N803S, N808D, K959N, M1021L, R1114G, D1135N, E1219V, N1286H, D1332N, R1335Q, T1337N
    E627K, M631V, T638P, V647I, K710E, R753G, N803S, N808D, K948E, M1021L, R1114G, D1135N, E1219V, D1332N, R1335Q, T1337N, S1338T, H1349R
  • In einigen Ausführungsformen umfasst das Cas9-Protein eine Aminosäuresequenz, die zu mindestens 80 % identisch mit der Aminosäuresequenz eines Cas9-Proteins ist, wie es von einer der Varianten von Tabelle 2 bereitgestellt wird. In einigen Ausführungsformen umfasst das Cas9-Protein eine Aminosäuresequenz, die mindestens 85 %, mindestens 90 %, mindestens 92 %, mindestens 95 %, mindestens 96 %, mindestens 97 %, mindestens 98 %, mindestens 99% oder mindestens 99,5 % identisch mit der Aminosäuresequenz eines Cas9-Proteins ist, wie von einer der Varianten von Tabelle 2 bereitgestellt.
  • In einigen Ausführungsformen weist das Cas9-Protein eine erhöhte Aktivität auf einer Targetsequenz auf, die das kanonische PAM (5'-NGG-3') an seinem 3'-Ende nicht umfasst, im Vergleich zu Streptococcus pyogenes Cas9 gemäß Seq-ID-Nr: 18. In einigen Ausführungsformen weist das Cas9-Protein eine Aktivität auf einer Targetsequenz mit einem 3'-Ende auf, das nicht direkt an die kanonische PAM-Sequenz (5'-NGG-3') angrenzt, die mindestens 5-fach erhöht ist im Vergleich zur Aktivität von Streptococcus pyogenes Cas9 gemäß Seq-ID-Nr: 18 auf derselben Targetsequenz. In einigen Ausführungsformen weist das Cas9-Protein eine Aktivität auf einer Targetsequenz auf, die nicht direkt neben der kanonischen PAM-Sequenz (5'-NGG-3') liegt, die mindestens 10-fach, mindestens 50-fach, mindestens 100-fach, mindestens 500-fach, mindestens 1.000-fach, mindestens 5.000-fach, mindestens 10.000-fach, mindestens 50.000-fach, mindestens 100.000-fach, mindestens 500.000-fach oder mindestens 1.000.000- fach erhöht ist im Vergleich zur Aktivität von Streptococcus pyogenes gemäß Seq-ID-Nr: 18 auf derselben Targetsequenz. In einigen Ausführungsformen grenzt das 3'-Ende der Targetsequenz direkt an eine AAC-, GAC-, CAC- oder TAC-Sequenz.
  • In einigen Ausführungsformen umfasst das Cas9-Protein eine Kombination von Mutationen, die Aktivität auf einer Targetsequenz aufweisen, die an ihrem 3'-Ende eine 5'-NAT-3'-PAM-Sequenz umfasst. In einigen Ausführungsformen ist die Kombination von Mutationen in einem der in Tabelle 3 aufgeführten Klone vorhanden. In einigen Ausführungsformen sind die Mutationskombinationen konservative Mutationen der in Tabelle 3 aufgeführten Klone. In einigen Ausführungsformen umfasst das Cas9-Protein die Kombination von Mutationen eines der in Tabelle 3 aufgeführten Cas9-Klone. Tabelle 3 NAT PAM-Klone
    MUTATIONEN VON WILDTYP-SPCAS9 (Z. B. SEQ-ID-NR: 18)
    K961E, H985Y, D1135N, K1191N, E1219V, Q1221H, A1320A, P1321S, R1335L
    D1135N, G1218S, E1219V, Q1221H, P1249S, P1321S, D1322G, R1335L
    V743I, R753G, E790A, D1135N, G1218S, E1219V, Q1221H, A1227V, P1249S, N1286K, A1293T, P1321S, D1322G, R1335L, T1339I
    F575S, M631L, R654L, V748I, V743I, R753G, D853E, V922A, R1114G D1135N, G1218S, E1219V, Q1221H, A1227V, P1249S, N1286K, A1293T, P1321S, D1322G, R1335L, T1339I
    F575S, M631L, R654L, R664K, R753G, D853E, V922A, R1114G D1135N, D1180G, G1218S, E1219V, Q1221H, P1249S, N1286K, P1321S, D1322G, R1335L
    M631L, R654L, R753G, K797E, D853E, V922A, D1012A, R1114G D1135N, G1218S, E1219V, Q1221H, P1249S, N1317K, P1321S, D1322G, R1335L
    F575S, M631L, R654L, R664K, R753G, D853E, V922A, R1114G, Y1131C, D1135N, D1180G, G1218S, E1219V, Q1221H, P1249S, P1321S, D1322G, R1335L
    F575S, M631L, R654L, R664K, R753G, D853E, V922A, R1114G, Y1131C, D1135N, D1180G, G1218S, E1219V, Q1221H, P1249S, P1321S, D1322G, R1335L
    F575S, D596Y, M631L, R654L, R664K, R753G, D853E, V922A, R1114G, Y1131C, D1135N, D1180G, G1218S, E1219V, Q1221H, P1249S, Q1256R, P1321S, D1322G, R1335L
    F575S, M631L, R654L, R664K, K710E, V750A, R753G, D853E, V922A, R1114G, Y1131C, D1135N, D1180G, G1218S, E1219V, Q1221H, P1249S, P1321S, D1322G, R1335L
    F575S, M631L, K649R, R654L, R664K, R753G, D853E, V922A, R1114G, Y1131C, D1135N, K1156E, D1180G, G1218S, E1219V, Q1221H, P1249S, P1321S, D1322G, R1335L
    F575S, M631L, R654L, R664K, R753G, D853E, V922A, R1114G, Y1131C, D1135N, D1180G, G1218S, E1219V, Q1221H, P1249S, P1321S, D1322G, R1335L
    F575S, M631L, R654L, R664K, R753G, D853E, V922A, I1057G, R1114G, Y1131C, D1135N, D1180G, G1218S, E1219V, Q1221H, P1249S, N1308D, P1321S, D1322G, R1335L
    M631L, R654L, R753G, D853E, V922A, R1114G, Y1131C, D1135N, E1150V, D1180G, G1218S, E1219V, Q1221H, P1249S, P1321S, D1332G, R1335L
    M631L, R654L, R664K, R753G, D853E, I1057V, Y1131C, D1135N, D1180G, G1218S, E1219V, Q1221H, P1249S, P1321S, D1332G, R1335L
    M631L, R654L, R664K, R753G, I1057V, R1114G, Y1131C, D1135N, D1180G, G1218S, E1219V, Q1221H, P1249S, P1321S, D1332G, R1335L
  • Jede der obigen Cas9-Varianten, die im Vergleich zum kanonischen SpCas9 unterschiedliche PAM-Spezifitäten aufweisen, kann in den hierin offenbarten PrimeEditoren verwendet werden.
  • P. Verwendung von Prime Editing zum Einfügen von Rekombinase-Target-Sites
  • In einem anderen Aspekt kann Prime Editing verwendet werden, um Rekombinase-Sites (oder „Rekombinase-Erkennungssequenzen“) in eine gewünschte genomische Site einzufügen. Die Insertion von Rekombinase-Sites stellt eine programmierte Site bereit, um ortsspezifische genetische Veränderungen in einem Genom zu bewirken. Solche genetischen Veränderungen können beispielsweise genomische Integration eines Plasmids, genomische Deletion oder Insertion, chromosomale Translokationen und Kassettenaustausch neben anderen genetischen Veränderungen umfassen. Diese beispielhaften Typen genetischer Veränderungen sind in dargestellt in 64(b)-(f). Die installierten Rekombinase-Erkennungssequenzen können dann verwendet werden, um eine ortsspezifische Rekombination an dieser Site durchzuführen, um eine Vielzahl von Rekombinationsergebnissen zu bewirken, wie beispielsweise Exzision, Integration, Inversion oder Austausch von DNA-Fragmenten. Zum Beispiel veranschaulicht 65 die Installation einer Rekombinase-Site, die dann verwendet werden kann, um eine DNA-Donor-Matrize zu integrieren, die einen GFP-Expressionsmarker umfasst. Zellen, die das integrierte GFP-Expressionssystem in der Rekombinase-Site enthalten, werden fluoreszieren.
  • Der Mechanismus des Einbaus einer Rekombinase-Site in das Genom ist analog zum Einbau anderer Sequenzen, wie etwa Peptid-/Protein- und RNA-Tags, in das Genom. Ein Schema, das die Installation einer Rekombinase-Targetsequenz beispielhaft darstellt, ist gezeigt in 64(a). Das Verfahren beginnt mit der Auswahl eines gewünschten Target-Lokus, in den die Rekombinase-Targetsequenz eingeführt wird. Als nächstes wird eine Prime Editor-Fusion bereitgestellt („RT-Cas9:gRNA“). Hier bezieht sich die „gRNA“ auf eine PEgRNA, die unter Verwendung der hierin beschriebenen Prinzipien entworfen werden kann. Die PEgRNA umfasst in verschiedenen Ausführungsformen eine Architektur entsprechend 3D (5'-[∼20-NT-Spacer]-[gRNA-Kern]-[Verlängerungsarm]-3', wobei der Verlängerungsarm in 3'- bis 5'-Richtung eine Primer-Bindungs-Site („A“), ein Edit-Template („B“) und einen Homologiearm („C“) umfasst. Das Edit-Templat („B“) umfasst eine Sequenz, die einer Rekombinase-Site entspricht, d. h. eine Einzelstrang-RNA der PEgRNA, die eine komplementäre Einzelstrang-DNA kodiert, die entweder der Sense- oder der Antisense-Strang der Rekombinase-Site ist und die durch den Prime Editing-Prozess in den genomischen DNA-Target-Lokus eingebaut wird.
  • In verschiedenen Aspekten sieht die vorliegende Offenbarung die Verwendung eines PE vor, um Rekombinase-Erkennungssequenzen an hochwertige Loki in menschlichen oder anderen Genomen einzuführen, die nach Exposition gegenüber ortsspezifischer Rekombinase(n) präzise und effiziente genomische Modifikationen lenken (64). In verschiedenen Ausführungsformen, gezeigt in 64 kann PE verwendet werden, um (b) ein einzelnes SSR-Target zur Verwendung als Site für die genomische Integration eines DNA-Donor-Template zu inserieren. (c) zu zeigen, wie eine Tandem-Insertion von SSR-Target-Sites verwendet werden kann, um einen Teil des Genoms zu löschen. (d) zu zeigen, wie eine Tandem-Insertion von SSR-Target-Sites verwendet werden kann, um einen Teil des Genoms zu invertieren. (e) zu zeigen, wie die Insertion von zwei SSR-Target-Sites an zwei distalen chromosomalen Regionen zu einer chromosomalen Translokation führen kann. (f) zu zeigen, wie die Insertion von zwei verschiedenen SSR-Target-Sites im Genom verwendet werden kann, um eine Kassette von einem DNA-Donor-Template auszutauschen. Jede der Arten von Genommodifikationen wird durch die Verwendung von PE zum Einfügen von SSR-Tagets ins Auge gefasst, aber diese Liste soll auch nicht einschränkend sein.
  • Die PE-vermittelte Einführung von Rekombinase-Erkennungssequenzen könnte besonders nützlich für die Behandlung genetischer Erkrankungen sein, die durch großräumige Genomdefekte verursacht werden, wie etwa Genverlust, Inversion oder Duplikation oder chromosomale Translokation1-7 (Tabelle 6). Das Williams-Beuren-Syndrom ist beispielsweise eine Entwicklungsstörung, die durch eine Deletion von 24 auf Chromosom 721 verursacht wird. Es gibt derzeit keine Technologie für die effiziente und gezielte Insertion mehrerer vollständiger Gene in lebende Zellen (das Potenzial von PE für eine solche vollständige Geninsertion wird derzeit untersucht, ist aber noch nicht etabliert); jedoch bietet die rekombinasevermittelte Integration an einem von PE inserierten Target einen Ansatz zur dauerhaften Heilung dieser und anderer Krankheiten. Darüber hinaus könnte die gezielte Einführung von Rekombinase-Erkennungssequenzen für Anwendungen, einschließlich der Erzeugung von transgenen Pflanzen, Tierforschungsmodellen, Bioproduktionszelllinien oder anderen kundenspezifischen eukaryotischen Zelllinien, sehr hilfreich sein. Beispielsweise könnte die rekombinasevermittelte genomische Umlagerung in transgenen Pflanzen an PE-spezifischen Targets einen der Engpässe bei der Erzeugung von Nutzpflanzen mit verbesserten Eigenschaften überwinden8,9.
  • Tabelle 6. Beispiele für genetische Erkrankungen im Zusammenhang mit groß angelegten genomischen Veränderungen, die durch die PE-basierte Installation von Rekombinase-Erkennungssequenzen repariert werden könnten.
    ERKRANKUNG URSACHE
    TRISOMIE 17P GENDUPLIKATION
    CHARCOT-MARIE-TOOTH-KRANKHEIT TYP I GENDUPLIKATION
    SMITH-MAGENIS-SYNDROM GENLÖSCHUNG
    WILLIAMS-BEUREN-SYNDROM GENLÖSCHUNG
    DE LA CHAPELLE-SYNDROM CHROMOSOMALE TRANSLOKATION
    DOWN-SYNDROM (EINIGE FORMEN) CHROMOSOMALE TRANSLOKATION
    HÄMOPHILIE A GENINVERSION
    HUNTER-SYNDROM GENINVERSION
  • Eine Reihe von Mitgliedern der SSR-Familie wurden charakterisiert und ihre Rekombinase-Erkennungssequenzen beschrieben, einschließlich natürlicher und manipulierter TyrosinRekombinasen (Tabelle 7), große Serin-Integrasen (Tabelle 8), Serin-Resolvasen (Tabelle 9) und Tyrosin-Integrasen (Tabelle 10). Modifizierte Targetsequenzen, die erhöhte Raten der genomischen Integration zeigen, wurden auch für mehrere SSRs22-30 beschrieben. Zusätzlich zu natürlichen Rekombinasen wurden programmierbare Rekombinasen mit unterschiedlichen Spezifitäten entwickelt31-40. Unter Verwendung von PE könnten eine oder mehrere dieser Erkennungssequenzen in Abhängigkeit von der gewünschten Anwendung an einer bestimmten Site in das Genom eingeführt werden, wie zum Beispiel an einem Safe-Harbor-Lokus 41-43.
  • Zum Beispiel würde die Einführung einer einzelnen Rekombinase-Erkennungssequenz in das Genom durch Prime Editing zu einer integrativen Rekombination mit einem DNA-Donor-Template führen (64b). Serinintegrasen, die in menschlichen Zellen robust funktionieren, können für die Genintegration besonders gut geeignet sein44, 45.
  • Außerdem könnte die Einführung von zwei Rekombinase-Erkennungssequenzen in Abhängigkeit von der Identität und Orientierung der Targets zu einer Deletion der intervenierenden Sequenz, einer Inversion der intervenierenden Sequenz, einer chromosomalen Translokation oder einem Kassettenaustausch führen (64c-f). Durch die Wahl endogener Sequenzen, die bereits Rekombinase-Targets sehr ähnlich sind, würde der Umfang des Editings, der erforderlich ist, um das vollständige Rekombinase-Target einzuführen, reduziert werden.
  • Schließlich wurde für mehrere Rekombinasen gezeigt, dass sie sich an nativ vorkommenden Pseudo-Sites46-64 in menschliche oder eukaryotische Genome integrieren. Die PE Editing könnte verwendet werden, um diese Loki zu modifizieren, um die Integrationsraten an diesen natürlichen Pseudo-Sites zu erhöhen, oder alternativ um Pseudo-Sites zu eliminieren, die als unerwünschte Off-TargetSequenzen dienen können.
  • Diese Offenbarung beschreibt eine allgemeine Methodik zum Einführen von Rekombinase-Targetsequenzen in eukaryontische Genome unter Verwendung von PE, deren Anwendungen nahezu unbegrenzt sind. Die Genom Editing-Reaktionen sind für die Verwendung mit dem „Prime Editor“ vorgesehen, einer chimären Fusion eines CRISPR/Cas9-Proteins und einer Reverse-Transkriptase-Domäne, die eine benutzerdefinierte Prime Editing-Guide-RNA (PEgRNA) verwendet. Als Erweiterung können Cas9-Werkzeuge und Homologie-gerichtete Reparatur (HDR)-Wege auch genutzt werden, um Rekombinase-Erkennungssequenzen durch DNA-Templates einzuführen, indem die Indel-Raten unter Verwendung verschiedener Techniken gesenkt werden65-67. Ein Proof-of-Concept-Experiment in menschlicher Zellkultur ist gezeigt in 65.
  • Die folgenden mehreren Tabellen werden in der obigen Beschreibung bezüglich der PE-gerichteten Installation von Rekombinase-Erkennungssequenzen zitiert und stellen eine Auflistung beispielhafter Rekombinasen, die verwendet werden können, und ihrer verwandten Rekombinase-Erkennungssequenzen, die von PE installiert werden können, bereit.
    Figure DE112020001339T5_0286
    Figure DE112020001339T5_0287
    Figure DE112020001339T5_0288
    Figure DE112020001339T5_0289
    Figure DE112020001339T5_0290
    Figure DE112020001339T5_0291
    Figure DE112020001339T5_0292
    Figure DE112020001339T5_0293
    Figure DE112020001339T5_0294
    Figure DE112020001339T5_0295
    Figure DE112020001339T5_0296
    Figure DE112020001339T5_0297
  • In verschiedenen anderen Aspekten betrifft die vorliegende Offenbarung Verfahren zur Verwendung von PE, um eine oder mehrere Rekombinase-Erkennungssequenzen zu installieren, und ihre Verwendung bei der Site-spezifischen Rekombination.
  • In einigen Ausführungsformen kann die Site-spezifische Rekombination eine Vielzahl von Rekombinationsergebnissen bewirken, wie beispielsweise Exzision, Integration, Inversion oder Austausch von DNA-Fragmenten.
  • In einigen Ausführungsformen sind die Verfahren zum Induzieren einer Rekombination von oder zwischen zwei oder mehr Regionen von zwei oder mehr Nukleinsäure-(z. B. DNA)-Molekülen nützlich. In anderen Ausführungsformen sind die Verfahren zum Induzieren einer Rekombination von oder zwischen zwei oder mehr Regionen in einem einzelnen Nukleinsäuremolekül (z. B. DNA) nützlich.
  • In einigen Ausführungsformen stellt die Offenbarung ein Verfahren zum Integrieren eines Donor-DNA-Templates durch ortsspezifische Rekombination bereit, umfassend: (a) Installieren einer Rekombinase-Erkennungssequenz an einem genomischen Lokus durch Prime Editing; (b) Kontaktieren des genomischen Lokus mit einem DNA-Donor-Template, das auch die Rekombinase-Erkennungssequenz in Gegenwart einer Rekombinase umfasst.
  • In anderen Ausführungsformen stellt die Offenbarung ein Verfahren zum Deletieren einer genomischen Region durch Site-spezifische Rekombination bereit, umfassend: (a) Installieren eines Paares von Rekombinase-Erkennungssequenzen an einem genomischen Lokus durch Prime Editing; (b) Kontaktieren des genomischen Lokus mit einer Rekombinase, wodurch die Deletion der genomischen Region zwischen dem Paar von Rekombinase-Erkennungssequenzen katalysiert wird.
  • In noch anderen Ausführungsformen stellt die Offenbarung ein Verfahren zum Invertieren einer genomischen Region durch Site-spezifische Rekombination bereit, umfassend: (a) Installieren einer Rekombinase-Erkennungssequenz an einem genomischen Lokus durch Prime Editing; (b) Kontaktieren des genomischen Lokus mit einer Rekombinase, wodurch die Inversion der genomischen Region zwischen dem Paar von Rekombinase-Erkennungssequenzen katalysiert wird.
  • In noch anderen Ausführungsformen stellt die Offenbarung ein Verfahren zum Induzieren einer chromosomalen Translokation zwischen einer ersten genomischen Site und einer zweiten genomischen Site bereit, umfassend: (a) Installieren einer ersten Rekombinase-Erkennungssequenz an einem ersten genomischen Lokus durch Prime Editing; (b) Installieren einer zweiten Rekombinase-Erkennungssequenz an einem zweiten genomischen Lokus durch Prime Editing; (c) Kontaktieren des ersten und des zweiten genomischen Loki mit einer Rekombinase, wodurch die chromosomale Translokation des ersten und zweiten genomischen Loki katalysiert wird.
  • In anderen Ausführungsformen stellt die Offenbarung ein Verfahren zum Induzieren eines Kassettenaustauschs zwischen einem genomischen Lokus und einer Donor-DNA bereit, die eine Kassette umfasst, umfassend: (a) Installieren einer ersten Rekombinase-Erkennungssequenz an einem ersten genomischen Lokus durch Prime Editing; (b) Installieren einer zweiten Rekombinase-Erkennungssequenz an einem zweiten genomischen Lokus durch Prime Editing; (c) Kontaktieren des ersten und des zweiten genomischen Loki mit einer Donor-DNA, umfassend eine Kassette, die von der ersten und zweiten Rekombinase-Erkennungssequenz und einer Rekombinase flankiert wird, wodurch der Austausch des flankierten genomischen Lokus und der Kassette im DNA-Donor katalysiert wird.
  • In verschiedenen Ausführungsformen, die die Insertion von mehr als einer Rekombinase-Erkennungssequenz in das Genom beinhalten, können die Rekombinase-Erkennungssequenzen gleich oder verschieden sein. In einigen Ausführungsformen sind die Rekombinase-Erkennungssequenzen gleich. In anderen Ausführungsformen sind diese Rekombinase-Erkennungssequenzen unterschiedlich.
  • In verschiedenen Ausführungsformen kann die Rekombinase eine Tyrosinrekombinase sein, wie Cre, Dre, Vcre, Scre, Flp, B2, B3, Kw, R, TD1-40, Vika, Nigri, Panto, Kd, Fre, Cre(ALSHG), Tre, Brec1, oder Cre-R3M3, wie in Tabelle 7 gezeigt. In solchen Ausführungsformen kann die Rekombinase-Erkennungssequenz ein RRS von Tabelle 7 sein, das der verwendeten Rekombinase entspricht.
  • In verschiedenen anderen Ausführungsformen kann die Rekombinase eine große Serin-Rekombinase sein, wie Bxb1, PhiC31, R4, phiBT1, MJ1, MR11, TP901-1, A118, V153, phiRV1, phi370.1, TG1, WB, BL3, SprA, phiJoe, phiK38, Int2, Int3, Int4, Int7, Int8, Int9, Int10, Int11, Int12, Int13, L1, peaches, Bxz2, oder SV1, wie in Tabelle 8 gezeigt. In solchen Ausführungsformen kann die Rekombinase-Erkennungssequenz ein RRS von Tabelle 8 sein, das der verwendeten Rekombinase entspricht.
  • In noch verschiedenen anderen Ausführungsformen kann die Rekombinase eine Serin-Rekombinase sein, wie Bxb1, PhiC31, R4, phiBT1, MJ1, MR11, TP901-1, A118, V153, phiRV1, phi370.1, TG1, WB, BL3, SprA, phiJoe, phiK38, Int2, Int3, Int4, Int7, Int8, Int9, Int10, Int11, Int12, Int13, L1, peaches, Bxz2, oder SV1, wie in Tabelle 8 gezeigt. In solchen Ausführungsformen kann die Rekombinase-Erkennungssequenz ein RRS von Tabelle 8 sein, das der verwendeten Rekombinase entspricht.
  • In anderen Ausführungsformen kann die Rekombinase eine Serinresolvase sein, wie Gin, Cin, Hin, Min oder Sin, wie in Tabelle 9 gezeigt. In solchen Ausführungsformen kann die Rekombinase-Erkennungssequenz ein RRS von Tabelle 9 sein, das der verwendeten Rekombinase entspricht.
  • In verschiedenen anderen Ausführungsformen kann die Rekombinase eine Tyrosin-Integrase sein, wie beispielsweise HK022, P22 oder L5, wie in Tabelle 10 gezeigt. In solchen Ausführungsformen kann die Rekombinase-Erkennungssequenz ein RRS von Tabelle 10 sein, das der verwendeten Rekombinase entspricht.
  • In einigen Ausführungsformen kann jedes der Verfahren zur Site-spezifischen Rekombination mit PE in vivo oder in vitro durchgeführt werden. In einigen Ausführungsformen wird jedes der Verfahren zur Site-spezifischen Rekombination in einer Zelle durchgeführt (z. B. rekombinieren genomischer DNA in einer Zelle). Die Zelle kann prokaryotisch oder eukaryotisch sein. Die Zelle, wie beispielsweise eine eukaryontische Zelle, kann sich in einem Individuum, wie beispielsweise einem Subjekt, wie hierin beschrieben, befinden (z. B. einem menschlichen Subjekt). Die hierin beschriebenen Verfahren sind nützlich für die genetische Modifikation von Zellen in vitro und in vivo, beispielsweise im Zusammenhang mit der Erzeugung transgener Zellen, Zelllinien oder Tieren, oder bei der Veränderung der genomischen Sequenz, z. B. der Korrektur eines genetischen Defekts in einer Zelle eines Subjekts.
  • In Abschnitt L zitierte Referenzen
  • Jede der folgenden Referenzen wird in Beispiel 17 zitiert, von denen jede hierin durch Bezugnahme aufgenommen wird.
    1. 1. Feuk, L. Inversion variants in the human genome: role in disease and genome architecture. Genome Med 2, 11 (2010).
    2. 2. Zhang, F., Gu, W., Hurles, M.E. & Lupski, J.R. Copy number variation in human health, disease, and evolution. Annu Rev Genomics Hum Genet 10, 451-481 (2009).
    3. 3. Shaw, C.J. & Lupski, J.R. Implications of human genome architecture for rearrangement-based disorders: the genomic basis of disease. Hum Mol Genet 13 Spec No 1, R57-64 (2004).
    4. 4. Carvalho, C.M., Zhang, F. & Lupski, J.R. Evolution in health and medicine Sackler colloquium: Genomic disorders: a window into human gene and genome evolution. Proc Natl Acad Sci USA 107 Suppl 1, 1765-1771 (2010) .
    5. 5. Rowley, J.D. Chromosome translocations: dangerous liaisons revisited. Nat Rev Cancer 1, 245-250 (2001).
    6. 6. Aplan, P.D. Causes of oncogenic chromosomal translocation. Trends Genet 22, 46-55 (2006).
    7. 7. McCarroll, S.A. & Altshuler, D.M. Copy-number variation and association studies of human disease. Nat Genet 39, S37-42 (2007).
  • Behandlungsmethoden
  • Die vorliegende Offenbarung stellt Verfahren zur Behandlung eines Subjekts bereit, bei dem eine Krankheit diagnostiziert wurde, die mit einer Punktmutation oder anderen Mutationen (z. B. Deletion, Insertion, Inversion, Duplikation usw.) verbunden ist oder durch diese verursacht wird, die durch das hier bereitgestellte Prime Editing-System korrigiert werden können, wie beispielhaft dargestellt, aber nicht beschränkt auf Prionenkrankheit (z. B. hierin Beispiel 5), Trinukleotid-Repeat-Expansionskrankheit (z. B. hierin Beispiel 3) oder CDKL5-Mangelstörung (CDD) (z. B. hierin Beispiel 23).
  • Praktisch jeder krankheitsverursachende genetische Defekt kann durch Prime Editing repariert werden, was die Auswahl eines geeigneten Prime-Editor-Fusionsproteins (einschließlich eines napDNAbp und einer Polymerase (z. B. einer Reversen Transkriptase) und das Entwickeln einer geeigneten PEgRNA beinhaltet, die entwickelt ist, um (a) auf die geeignete, eine Edit-Site umfassende Target-DNA abzuzielen und (b) ein Template für die Synthese eines DNA-Einzelstrangs vom 3'-Ende der Nick-Site bereitstellen, die die gewünschte Edit-Site enthält, die den endogenen Strang sofort stromabwärts der Nick-Site verdrängt und ersetzt. Prime Editing kann ohne Einschränkung verwendet werden, um (a) mutationskorrigierende Änderungen an einer Nukleotidsequenz zu installieren, (b) Protein- und RNA-Tags zu installieren, (c) Immunepitope auf interessierenden Proteinen zu installieren, (d) induzierbare Dimerisierungsdomänen in Proteine zu installieren, (e) Sequenzen zu installieren oder zu entfernen, um diese Aktivität eines Biomoleküls zu verändern, (f) Rekombinase-Zielstellen zu installieren, um spezifische genetische Veränderungen zu steuern, und (g) zur Mutagenese einer Zielsequenz unter Verwendung einer fehleranfälligen RT.
  • Das Verfahren zur Behandlung einer Störung kann in einem frühen Schritt das Design einer geeigneten PEgRNA und eines geeigneten Prime Editor-Fusionsproteins gemäß den hierin beschriebenen Verfahren beinhalten, die eine Reihe von Überlegungen beinhalten, die berücksichtigt werden können, wie zum Beispiel:
    1. (a) die Zielsequenz, d. h. die Nukleotidsequenz, in der eine oder mehrere Nukleobasenmodifikationen durch den Prime Editor installiert werden sollen;
    2. (b) die Position der Schnittstelle innerhalb der Targetsequenz, d. h. die spezifische Nukleobasenposition, an der der Prime Editor einen Single-Stand-Nick induziert, um eine 3'-Ende-RT-Primersequenz auf einer Seite des Nicks und den 5'-Ende-endogenen Flap auf der anderen Seite des Nicks (der schließlich durch FEN1 oder ein Äquivalent dazu entfernt und durch den 3'-ssDNA-Lappen ersetzt wird. Die Schnittstelle erzeugt die 3'-End-Primersequenz, die während der RNA-abhängigen DNA-Polymerisation durch die Polymerase des PE-Fusionsproteins (z. B. ein RT-Enzym) verlängert wird, um den 3'-ssDNA-Flap mit dem gewünschten Edit zu erzeugen, der dann den 5'-endogenen DNA-Flap in der Targetsequenz erzeugt.
    3. (c) die verfügbaren PAM-Sequenzen (einschließlich der kanonischen SpCas9-PAM-Sites sowie nicht-kanonischer PAM-Sites, die von Cas9-Varianten und Äquivalenten mit erweiterten oder unterschiedlichen PAM-Spezifitäten erkannt werden);
    4. (d) den Abstand zwischen den verfügbaren PAM-Sequenzen und die Lage der Schnittstelle im PAM-Strang;
    5. (e) das jeweilige Cas9, die Cas9-Variante oder das Cas9-Äquivalent des zur Verwendung verfügbaren Prime Editors (was teilweise durch das verfügbare PAM diktiert wird);
    6. (f) die Sequenz und Länge der Primer-Bindungsstelle;
    7. (g) die Reihenfolge und Länge des Edit-Templates;
    8. (h) die Sequenz und Länge des Homologiearms;
    9. (i) die Abstandshaltersequenz und -länge; und
    10. (j) die gRNA-Kernsequenz.
  • Eine geeignete PEgRNA und optional ein Nicking-sgRNA-Designleitfaden für Second-Site-Nicking kann mit Hilfe der folgenden beispielhaften Schritt-für-Schritt-Anleitung entworfen werden, die eine oder mehrere der obigen Überlegungen berücksichtigt. Die Schritte beziehen sich auf die gezeigten Beispiele in den 70A-70I.
    1. 1. Definieren der Targetsequenz und des Edits. Abrufen der Sequenz der Target-DNA-Region (~200bp) ab, die um den Ort des gewünschten Edits (Punktmutation, Insertion, Deletion oder Kombination davon) zentriert ist. Siehe 70A.
    2. 2. Lokalisieren der Target-PAMs. Identifizieren der PAMs in der Nähe der gewünschten Edit-Ortes. PAMs können auf jedem DNA-Strang in der Nähe dersgewünschten Edit-Ortes identifiziert werden. Während PAMs in der Nähe der Edit-Position bevorzugt werden (d. h. bei denen die Nick-Site weniger als 30 nt von der Edit-Position entfernt ist oder weniger als 29 nt, 28 nt, 27 nt, 26 nt, 25 nt, 24 nt, 23 nt, 22 nt, 21 nt, 20 nt, 19 nt, 18 nt, 17 nt, 16 nt, 15 nt, 14 nt, 13 nt, 12 nt, 11 nt, 10 nt, 9 nt, 8 nt, 7 nt, 6 nt, 5 nt, 4 nt, 3 nt, oder 2 nt von der Edit-Position zur Nick-Site), ist es möglich, Edits mit Protospacern und PAMs zu installieren, die den Nick ≥ 30 nt von der Edit-Position entfernt platzieren. Siehe 70B.
    3. 3. Lokalisieren der Nick-Sites. Identifizieren der entsprechenden Nick-Site und des Strangs für jede in Betracht gezogene PAM. Für Sp-Cas9 H840A Nickase erfolgt die Spaltung im PAM enthaltenden Strang zwischen der 3. und 4. Base 5' zur NGG PAM. Alle editierten Nukleotide müssen 3' von der Nick-Site existieren, daher müssen geeignete PAMs den Nick 5' zum Target-Edit auf dem PAM-enthaltenden Strang platzieren. Im unten gezeigten Beispiel gibt es zwei mögliche PAMs. Der Einfachheit halber demonstrieren die verbleibenden Schritte das Design einer PEgRNA, die nur PAM 1 verwendet. Siehe 70C.
    4. 4. Entwerfen der Abstandshaltersequenz. Der Protospacer von SpCas9 entspricht den 20 Nukleotiden 5' zum NGG-PAM auf dem PAM-enthaltenden Strang. Eine effiziente Pol III-Transkriptionsinitiation erfordert, dass ein G das erste transkribierte Nukleotid ist. Wenn das erste Nukleotid des Protospacers ein G ist, ist die Spacer-Sequenz für die PEgRNA einfach die Protospacersequenz. Wenn das erste Nukleotid des Protospacers kein G ist, ist die Spacer-Sequenz der PEgRNA G gefolgt von der Protospacersequenz. Siehe 70D.
    5. 5. Entwerfen einer Primer-Bindungsstelle (PBS). Identifizieren des DNA-Primer auf dem PAM-enthaltenden Strang mithilfe der Allel-Startsequenz. Das 3'-Ende des DNA-Primers ist das Nukleotid direkt stromaufwärts der Nick-Site (d. h. die 4. Base 5' von der NGG-PAM für Sp-Cas9). Als allgemeines Konstruktionsprinzip für die Verwendung mit PE2 und PE3 kann eine PEgRNA-Primer-Bindungsstelle (PBS) mit 12 bis 13 Nukleotiden komplementär zum DNA-Primer für Sequenzen verwendet werden, die ~40-60% GC-Gehalt enthalten. Bei Sequenzen mit geringem GC-Gehalt sollten längere (14- bis 15-nt) PBSs getestet werden. Bei Sequenzen mit höherem GC-Gehalt sollten kürzere (8- bis 11-nt) PBSs getestet werden. Optimale PBS-Sequenzen sollten unabhängig vom GC-Gehalt empirisch bestimmt werden. Um eine PBS-Sequenz der Länge p zu entwerfen, nehme man das reverse Komplement der ersten p-Nukleotide 5' von der Nick-Site in dem PAM-enthaltenden Strang unter Verwendung der Allel-Startsequenz. Siehe 70E.
    6. 6. Entwerfen eines RT-Templates (oder DNA-Synthese-Templates). Das RT-Template (oder DNA-Synthese-Template, bei der die Polymerase keine Reverse Transkriptase ist) kodiert das entworfene Edit und die Homologie zu der Sequenz neben dem Edit. In einer Ausführungsform entsprechen diese Regionen des DNA-Synthese-Templates von 3D und 3E, wobei das DNA-Synthese-Template das „Edit-Template“ und den „Homologiearm“ umfasst. Die optimale Länge des RT-Templates variiert je nach Target-Site. Für Short-Range-Edits (Positionen +1 bis +6) wird empfohlen, ein kurzes (9 bis 12 nt), ein mittleres (13 bis 16 nt) und ein langes (17 bis 20 nt) RT-Template zu testen. Für Long-Range-Edits (Positionen +7 und darüber hinaus) wird empfohlen, RT-Templates zu verwenden, die sich mindestens 5 nt (vorzugsweise 10 oder mehr nt) über die Position des Edits hinaus erstrecken, um eine ausreichende 3'-DNA-Flap-Homologie zu ermöglichen. Für Long-Range-Edits sollten mehrere RT-Templates überprüft werden, um funktionale Designs zu identifizieren. Für größere Insertionen und Deletionen (≥5 nt) wird der Einbau einer größeren 3'-Homologie (~20 nt oder mehr) in das RT-Template empfohlen. Die Editing-Effizienz wird typischerweise beeinträchtigt, wenn das RT-Template die Synthese eines G als letztes Nukleotid im revers transkribierten DNA-Produkt kodiert (entsprechend einem C im RT-Tamplate der PEgRNA) . Da viele RT-Templates ein effizientes Prime Editing unterstützen, wird beim Design von RT-Templates empfohlen, G als das endgültig synthetisierte Nukleotid zu vermeiden. Um eine RT-Template-Sequenz der Länge r zu entwerfen, verwenden Sie die gewünschte Allelsequenz und nehmen Sie das reverse Komplement der ersten r-Nukleotide 3' von der Nick-Site in dem Strang, der ursprünglich die PAM enthielt. Beachten Sie, dass im Vergleich zu SNP-Edits Insertions- oder Deletions-Edits unter Verwendung von RT-Templates derselben Länge keine identische Homologie enthalten. Siehe 70F.
    7. 7. Zusammenstellen der vollständigen PEgRNA-Sequenz. Verketten der PEgRNA-Komponenten in der folgenden Reihenfolge (5' bis 3') : Spacer, Gerüst, RT-Template und PBS. Siehe 70G.
    8. 8. Entwerfen von Nicking-sgRNAs für PE3. Identifizieren der PAMs auf dem nicht bearbeiteten Strang vor und nach dem Edit. Optimale Nicking-Positionen sind stark ortsabhängig und sollten empirisch bestimmt werden. Im Allgemeinen führen Nicks, die 40 bis 90 Nukleotide 5' von der Position gegenüber dem PEgRNA-induzierten Nick platziert werden, zu höheren Editing-Ausbeuten und weniger Indels. Eine Nicking-sgRNA hat eine Spacer-Sequenz, die mit dem 20-nt-Protospacer im Startallel übereinstimmt, mit dem Zusatz eines 5'-G, wenn der Protospacer nicht mit einem G beginnt. Siehe 70H.
    9. 9. Entwerfen von PE3b Nicking-sgRNAs. Wenn eine PAM im komplementären Strang existiert und ihr entsprechender Protospacer mit der zum Editieren anvisierten Sequenz überlappt, könnte diese Editierung ein Kandidat für das PE3b-System sein. Im PE3b-System stimmt die Spacer-Sequenz der Nicking-sgRNA mit der Sequenz des gewünschten editierten Allels überein, jedoch nicht mit dem Startallel. Das PE3b-System arbeitet effizient, wenn das (die) editierte(n) Nukleotid(e) in die Saatregion (~10 nt neben der PAM) des Nicking-sgRNA-Protospacers fällt. Dies verhindert das Nicken des komplementären Strangs bis nach der Installation des editierten Strangs, wodurch Konkurrenz zwischen der PEgRNA und der sgRNA um die Bindung der Ziel-DNA verhindert wird. PE3b vermeidet auch die Erzeugung simultaner Nicks auf beiden Strängen, wodurch die Informationsbildung erheblich reduziert wird, während eine hohe Editing-Effizienz beibehalten wird. PE3b-sgRNAs sollten eine Spacer-Sequenz aufweisen, die mit dem 20-nt-Protospacer im gewünschten Allel übereinstimmt, gegebenenfalls unter Hinzufügung eines 5'-G. Siehe 70I.
  • Das obige schrittweise Verfahren zum Entwerfen einer geeigneten PEgRNA und einer Second-Site-Nicking-sgRNA soll in keiner Weise einschränkend sein. Die Offenbarung erwägt Variationen des oben beschriebenen Schritt-für-Schritt-Verfahrens, die von einem Durchschnittsfachmann daraus abgeleitet werden können.
  • Sobald eine geeignete PEgRNA und ein geeignetes PE-Fusionsprotein ausgewählt/entworfen sind, können sie durch eine geeignete Methodik verabreicht werden, wie etwa durch vektorbasierte Transfektion (bei der ein oder mehrere Vektoren, die DNA umfassen, die für die PEgRNA und das PE-Fusionsprotein kodiert und innerhalb einer Zelle nach Transfektion mit den Vektoren exprimiert werden), direkte Abgabe des mit der PEgRNA komplexierten PE-Fusionsproteins (zB RNP-Abgabe) in einem Abgabeformat (z. B. Lipidpartikel, Nanopartikel) oder durch ein mRNA-basiertes Abgabesystem. Solche Verfahren werden hierin in der vorliegenden Offenbarung beschrieben und jedes bekannte Verfahren kann verwendet werden.
  • Die PEgRNA und das PE-Fusionsprotein (oder zusammen als PE-Komplex bezeichnet) können in einer therapeutisch wirksamen Menge an eine Zelle abgegeben werden, so dass bei Kontakt mit der interessierenden Target-DNA die gewünschte Bearbeitung darin installiert wird.
  • Es ist vorstellbar, dass jede Krankheit durch solche Verfahren behandelbar ist, solange die Abgabe an die geeigneten Zellen durchführbar ist. Der Durchschnittsfachmann wird in der Lage sein, eine PE-Abgabemethodik auszuwählen und/oder zu selektieren, die dem beabsichtigten Zweck und den beabsichtigten Target-Zellen entspricht.
  • Beispielsweise wird in einigen Ausführungsformen ein Verfahren bereitgestellt, das die Verabreichung einer wirksamen Menge des hierin beschriebenen Prime Editing-Systems, das die Punktmutation korrigiert, an ein Subjekt mit einer solchen Krankheit, z. B. einen Krebs, der mit einer Punktmutation wie oben beschrieben verbunden ist, umfasst oder eine desaktivierende Mutation in ein krankheitsassoziiertes Gen einführt, wie durch homologiegerichtete Reparatur in Gegenwart eines Donor-DNA-Moleküls, das die gewünschte genetische Veränderung umfasst, vermittelt wird. Beispielsweise wird in einigen Ausführungsformen ein Verfahren bereitgestellt, das die Verabreichung einer wirksamen Menge des hierin beschriebenen Prime Editing-Systems, das die Punktmutation korrigiert, an ein Subjekt mit einer solchen Krankheit, z. B. einen Krebs, der mit einer Punktmutation wie oben beschrieben verbunden ist, umfasst oder eine desaktivierende Mutation in ein krankheitsassoziiertes Gen einführt, wie durch homologiegerichtete Reparatur in Gegenwart eines Donor-Moleküls, das die gewünschte genetische Veränderung umfasst, vermittelt wird. In einigen Ausführungsformen ist die Krankheit eine proliferative Krankheit. In einigen Ausführungsformen ist die Krankheit eine genetische Krankheit. In einigen Ausführungsformen ist die Krankheit eine neoplastische Krankheit. In einigen Ausführungsformen ist die Krankheit eine metabolische Krankheit. In einigen Ausführungsformen ist die Krankheit eine lysosomale Speicherkrankheit. Andere Krankheiten, die durch Korrigieren einer Punktmutation oder Einführen einer deaktivierenden Mutation in ein krankheitsassoziiertes Gen behandelt werden können, sind dem Fachmann bekannt und die Offenbarung ist diesbezüglich nicht beschränkt.
  • Die vorliegende Offenbarung stellt Verfahren zur Behandlung zusätzlicher Krankheiten oder Störungen bereit, z. B. Krankheiten oder Störungen, die mit einer Punktmutation assoziiert oder verursacht werden, die durch TPRT-vermitteltes Gen-Editing korrigiert werden können. Einige dieser Krankheiten werden hierin beschrieben, und zusätzliche geeignete Krankheiten, die mit den hierin bereitgestellten Strategien und Fusionsproteinen behandelt werden können, werden Fachleuten auf der Grundlage der vorliegenden Offenbarung offensichtlich sein. Beispielhafte geeignete Krankheiten und Störungen sind unten aufgeführt. Es versteht sich, dass die Numerierung der spezifischen Positionen oder Reste in den jeweiligen Sequenzen von dem jeweiligen verwendeten Protein und Numerierungsschema abhängt. Die Nummerierung kann unterschiedlich sein, z. B. bei Vorläufern eines reifen Proteins und dem reifen Protein selbst, und Unterschiede in den Sequenzen von Spezies zu Spezies können die Nummerierung beeinflussen. Ein Fachmann wird in der Lage sein, den jeweiligen Rest in jedem homologen Protein und in der jeweiligen kodierenden Nukleinsäure durch im Fachgebiet wohlbekannte Verfahren zu identifizieren, z. B. durch Sequenz-Alignment und Bestimmung von homologen Resten. Beispielhafte geeignete Krankheiten und Störungen umfassen ohne Einschränkung: 2-Methyl-3-Hydroxybutterazidurie; 3-Beta-Hydroxysteroid-Dehydrogenase-Mangel; 3-Methylglutaconazidurie; 3-Oxo-5-Alpha-Steroid-Delta-4-Dehydrogenase-Mangel; 46,XY-Geschlechtsumkehr, Typ 1, 3 und 5; 5-Oxoprolinase-Mangel; 6-Pyruvoy-Tetrahydropterin-Synthase-Mangel; Aarskog-Syndrom; Aase-Syndrom; Achondrogenese Typ 2; Achromatopsie 2 und 7; Erworbenes langes QT-Syndrom; Akrokallosales Syndrom, Schinzel-Typ; Akrokapitofemorale Dysplasie; Akrodysostose 2, mit oder ohne Hormonresistenz; Akroerythrokeratodermie; Akromikrische Dysplasie; Acth-unabhängige makronoduläre Nebennierenhyperplasie 2; Aktiviertes PI3K-Delta-Syndrom; Akute intermittierende Porphyrie; Mangel der Acyl-CoA-Dehydrogenase-Familie, Mitglied 9; Adams-Oliver-Syndrom 5 und 6; Adenin-Phosphoribosyltransferase-Mangel; Adenylatkinase-Mangel; hämolytische Anämie aufgrund eines Adenylosuccinat-Lyase-Mangels; Nephronophthise bei Jugendlichen; Nieren-Hepatische-Pankreas-Dysplasie; Meckel-Syndrom Typ 7; Adrenoleukodystrophie; Epidermolysis bullosa der Epidermolyse bei Erwachsenen; Epidermolysis bullosa, junktional, localisata-Variante; Erwachsene neuronale Ceroid-Lipofuszinose; Erwachsene neuronale Ceroid-Lipofuszinose; Ataxie bei Erwachsenen mit okulomotorischer Apraxie; ERWACHSENEN-Syndrom; Afibrinogenämie und angeborene Afibrinogenämie; autosomal-rezessive Agammaglobulinämie 2; Altersbedingte Makuladegeneration 3, 6, 11 und 12; Aicardi-Goutieres-Syndrome 1, 4 und 5; Chilbain-Lupus 1; Alagille-Syndrome 1 und 2; Alexander-Krankheit; Alkaptonurie; Allan-Herndon-Dudley-Syndrom; angeborene Alopecia universalis; Alpers-Enzephalopathie; Alpha-1-Antitrypsin-Mangel; autosomal-dominante, autosomal-rezessive und X-chromosomal-rezessive Alport-Syndrome; Alzheimer-Krankheit, familiär, 3, mit spastischer Paraparese und Apraxie; Alzheimer-Krankheit, Typen 1, 3 und 4; Hypokalzifizierungstyp und Hyporeifungstyp, IIA1 Amelogenesis imperfecta; Aminoacylase-1-Mangel; Amish infantiles Epilepsie-Syndrom; amyloidogene Transthyretin-Amyloidose; Amyloid-Kardiomyopathie, Transthyretin-bezogen; Kardiomyopathie; Amyotrophe Lateralsklerose Typ 1, 6, 15 (mit oder ohne frontotemporaler Demenz), 22 (mit oder ohne frontotemporaler Demenz) und 10; Frontotemporale Demenz mit TDP43-Einschlüssen, TARDBP-bezogen; Andermann-Syndrom; Andersen-Tawil-Syndrom; Angeborenes langes QT-Syndrom; Anämie, nicht-sphärozytär hämolytisch, aufgrund von G6PD-Mangel; Angelman-Syndrom; Schwere neonatale Enzephalopathie mit Mikrozephalie; Anfälligkeit für Autismus, X-chromosomal 3; Angiopathie, erblich, mit Nephropathie, Aneurysmen und Muskelkrämpfen; Angiotensin-i-konvertierendes Enzym, gutartiger Serumanstieg; Aniridie, zerebelläre Ataxie und geistige Behinderung; Anonychie; Antithrombin-III-Mangel; Antley-Bixler-Syndrom mit Genitalanomalien und gestörter Steroidogenese; Aortenaneurysma, familiärer Brustkorb 4, 6 und 9; Thoraxaortenaneurysmen und Aortendissektionen; Multisystemisches Funktionsstörungssyndrom der glatten Muskulatur; Moyamoya-Krankheit 5; Aplastische Anämie; Scheinbarer Mineralocorticoid-Überschuss; Arginase-Mangel; Argininosuccinat-Lyase-Mangel; Aromatasemangel; Arrhythmogene rechtsventrikuläre Kardiomyopathie Typ 5, 8 und 10; Primäre familiäre hypertrophe Kardiomyopathie; Arthrogryposis multiplex congenita, distal, X-chromosomal; Arthrogrypose Nierenfunktionsstörung Cholestase-Syndrom; Arthrogrypose, Nierenfunktionsstörung und Cholestase 2; Asparagin-Synthetase-Mangel; Anomalie der neuronalen Migration; Ataxie mit Vitamin-E-Mangel; Ataxie, sensorisch, autosomal-dominant; Ataxie-Teleangiektasie-Syndrom; Hereditäres krebsprädisponierendes Syndrom; Atransferrinämie; Vorhofflimmern, familiär, 11, 12, 13 und 16; Vorhofseptumdefekte 2, 4 und 7 (mit oder ohne atrioventrikuläre Überleitungsdefekte); Vorhofstillstand 2; Atrioventrikulärer Septumdefekt 4; Atrophia bulborum hereditaria; ATR-X-Syndrom; Aurikulokondyläres Syndrom 2; Autoimmunerkrankung, Multisystem, infantiler Beginn; Autoimmunes lymphoproliferatives Syndrom, Typ 1a; autosomal-dominante hypohidrotische ektodermale Dysplasie; Autosomal-dominante progressive externe Ophthalmoplegie mit mitochondrialen DNA-Deletionen 1 und 3; Autosomal-dominante Torsionsdystonie 4; Autosomal-rezessive zentronukleäre Myopathie; autosomal-rezessive kongenitale Ichthyose 1, 2, 3, 4A und 4B; Autosomal-rezessive Cutis laxa Typ IA und 1B; Autosomalrezessives hypohidrotisches ektodermales Dysplasie-Syndrom; Ektodermale Dysplasie 11b; hypohidrotisch/Haar-/Zahntyp, autosomal-rezessiv; autosomal-rezessive hypophosphatämische Knochenerkrankung; Axenfeld-Rieger-Syndrom Typ 3; Bainbridge-Ropers-Syndrom; Bannayan-Riley-Ruvalcaba-Syndrom; PTEN-Hamartom-Tumorsyndrom; Baraitser-Winter-Syndrome 1 und 2; Barakat-Syndrom; Bardet-Biedl-Syndrome 1, 11, 16 und 19; Bare-Lymphozyten-Syndrom Typ 2, Komplementierungsgruppe E; Bartter-Syndrom vorgeburtlich Typ 2; Bartter-Syndrom Typ 3, 3 mit Hypokalziurie und 4; Basalganglienverkalkung, idiopathisch, 4; Perlenhaar; Gutartige familiäre Hämaturie; Gutartige familiäre neonatale Anfälle 1 und 2; Krampfanfälle, gutartige familiäre Neugeborenen, 1 und/oder Myokymie; Krampfanfälle, frühkindliche epileptische Enzephalopathie 7; Gutartige familiäre neonatalinfantile Anfälle; gutartige erbliche Chorea; Benigne scapuloperoneale Muskeldystrophie mit Kardiomyopathie; Bernard-Soulier-Syndrom, Typen A1 und A2 (autosomal-dominant); Bestrophinopathie, autosomal-rezessiv; Beta-Thalassämie; Bethlem-Myopathie und Bethlem-Myopathie 2; Bietti kristalline korneoretinale Dystrophie; Gallensäuresynthesedefekt, angeboren, 2; Biotinidase-Mangel; Birk Barel mentales Retardations-Dysmorphismus-Syndrom; Blepharophimose, Ptosis und Epikanthus inversus; Bloom-Syndrom; Borjeson-Forssman-Lehmann-Syndrom; Boucher-Neuhauser-Syndrom; Brachydaktylie-Typen A1 und A2; Brachydaktylie mit Bluthochdruck; Erkrankung der kleinen Gefäße des Gehirns mit Blutung; Mangel an verzweigtkettiger Ketosäure-Dehydrogenase-Kinase; Branchiootische Syndrome 2 und 3; Brustkrebs, früh einsetzend; Brust-Eierstock-Krebs, familiär 1, 2 und 4; Syndrom der spröden Hornhaut 2; Brody-Myopathie; Bronchiektasen mit oder ohne erhöhtem Schweißchlorid 3; Brown-Vialetto-Van-Laere-Syndrom und Brown-Vialetto-Van-Laere-Syndrom 2; Brugada-Syndrom; Brugada-Syndrom 1; Kammerflimmern; paroxysmales familiäres Kammerflimmern; Brugada-Syndrom und Brugada-Syndrom 4; Langes QT-Syndrom; Plötzlicher Herztod; Makuladystrophie des Bullenauges; Stargardt-Krankheit 4; Zapfen-Stäbchen-Dystrophie 12; Bullöse ichthyosiforme Erythrodermie; Burn-Mckeown-Syndrom; Candidiasis, familiär, 2, 5, 6 und 8; Kohlenhydrat-defizientes Glykoprotein-Syndrom Typ I und II; Carboanhydrase-VA-Mangel, Hyperammonämie aufgrund von; Dickdarmkarzinom; Herzrythmusstörung; Long-QT-Syndrom, LQT1-Subtyp; Kardioenzephalomyopathie, tödliche infantile, aufgrund eines Cytochrom-c-Oxidase-Mangels; Cardiofaciokutanes Syndrom; Kardiomyopathie; Danon-Krankheit; Hypertrophe Kardiomyopathie; linksventrikuläre Nichtkompaktationskardiomyopathie; Carnevale-Syndrom; Carney-Komplex, Typ 1; Carnitin-Acylcarnitin-Translokase-Mangel; Carnitinpalmitoyltransferase I, II, II (später Beginn) und II (infantile) Mangel; Katarakt 1, 4, autosomal-dominant, autosomal-dominant, multiple Typen, mit Mikrokornea, koppockartig, juvenil, mit Mikrokornea und Glukosurie, und nukleärer diffuser, nicht fortschreitender Katarakt; Katecholaminerge polymorphe ventrikuläre Tachykardie; Kaudales Regressionssyndrom; Cd8-Mangel, familiär; Zentrale Kernerkrankung; Zentromere Instabilität der Chromosomen 1,9 und 16 und Immunschwäche; Kleinhirn-Ataxie infantil mit progressiver externer Ophthalmoplegien und Kleinhirn-Ataxie, geistiger Retardierung und Dysgleichgewichtssyndrom 2; Zerebrale Amyloid-Angiopathie, APP-bezogen; Zerebrale autosomal-dominante und rezessive Arteriopathie mit subkortikalen Infarkten und Leukenzephalopathie; Zerebrale kavernöse Fehlbildungen 2; Zerebrookulofazioskelettales Syndrom 2; Zerebro-oculo-facioskelettales Syndrom; Zerebroretinale Mikroangiopathie mit Verkalkungen und Zysten; Ceroid-Lipofuszinose-Neuronen 2, 6, 7 und 10; Ch\xc3\xa9diak-Higashi-Syndrom, Chediak-Higashi-Syndrom, Erwachsenentyp; Charcot-Marie-Tooth-Krankheitstypen 1B, 2B2, 2C, 2F, 21, 2U (axonal), 1C (demyelinisierend), dominant intermediär C, rezessiv intermediär A, 2A2, 4C, 4D, 4H, IF, IVF und X; Scapuloperoneale spinale Muskelatrophie; Distale spinale Muskelatrophie, angeborene, nicht fortschreitend; Spinale Muskelatrophie, distal, autosomal-rezessiv, 5; CHARGE-Verbindung; Hypophosphatasie im Kindesalter; Hypophosphatasie bei Erwachsenen; Cholezystitis; Progressive familiäre intrahepatische Cholestase 3; Cholestase, intrahepatisch, der Schwangerschaft 3; Cholesterinspeicherkrankheit; Mangel an Cholesterinmonooxygenase (Seitenkettenspaltung); Chondrodysplasie Blomstrand-Typ; Chondrodysplasia punctata 1, X-chromosomal rezessiv und 2 x-chromosomal dominant; CHOPS-Syndrom; Chronische Granulomatose, autosomal-rezessiv Cytochrom b-positiv, Typ 1 und 2; Chudley-McCullough-Syndrom; Ziliardyskinesie, primär, 7, 11, 15, 20 und 22; Citrullinämie Typ I; Citrullinämie Typ I und II; Cleidokraniale Dysostose; C-ähnliches Syndrom; Cockayne-Syndrom Typ A, ; Coenzym Q10-Mangel, primär 1, 4 und 7; Sarg Siris/geistige Behinderung; Sarg-Lowry-Syndrom; Cohen-Syndrom, ; Kälteinduziertes Schwitzsyndrom 1; COLE-SCHREINER-SYNDROM 2; Kombinierte zelluläre und humorale Immundefekte mit Granulomen; Kombinierte d-2- und 1-2-Hydroxyglutarazidurie; Kombinierte Malon- und Methylmalonazidurie; Kombinierte oxidative Phosphorylierungsmängel 1, 3, 4, 12, 15 und 25; Kombinierter partieller und vollständiger 17-alpha-Hydroxylase/17,20-Lyase-Mangel; Häufige variable Immunschwäche 9; Komplement-Komponente 4, teilweiser Mangel an, aufgrund eines dysfunktionalen c1-Inhibitors; Komplementfaktor-B-Mangel; Kegelmonochromatismus; Zapfen-Stäbchen-Dystrophie 2 und 6; Zapfen-Stäbchen-Dystrophie amelogenesis imperfecta; Angeborene Nebennierenhyperplasie und angeborene Nebennierenhypoplasie, X-chromosomal; Angeborene amegakaryocytäre Thrombozytopenie; Angeborene Aniridie; Angeborene zentrale Hypoventilation; Hirschsprung-Krankheit 3; Angeborene kontrakturale Arachnodaktylie; Angeborene Kontrakturen der Gliedmaßen und des Gesichts, Hypotonie und Entwicklungsverzögerung; Angeborene Glykosylierungsstörung vom Typ 1B, 1D, 1G, 1H, 1J, 1K, 1N, 1P, 2C, 2J, 2K, IIm; Angeborene dyserythropoetische Anämie, Typ I und II; Angeborene ektodermale Dysplasie des Gesichts; Angeborene erythropoetische Porphyrie; Angeborene generalisierte Lipodystrophie Typ 2; Angeborene Herzfehler, mehrere Typen, 2; Angeborenen Herzfehler; Unterbrochener Aortenbogen; Angeborenes lipomatöses Wachstum, Gefäßfehlbildungen und epidermale Nävi; Nicht-kleinzelligem Lungenkrebs; Neoplasma des Eierstocks; Herzleitungsstörung, unspezifisch; Angeborene mikrovillöse Atrophie; Angeborene Muskeldystrophie; Angeborene Muskeldystrophie aufgrund eines partiellen LAMA2-Mangels; Angeborene Muskeldystrophie-Dystroglycanopathie mit Hirn- und Augenanomalien, Typen A2, A7, A8, A11 und A14; Angeborene Muskeldystrophie-Dystroglycanopathie mit geistiger Behinderung, Typen B2, B3, B5 und B15; Angeborene Muskeldystrophie-Dystroglycanopathie ohne geistige Behinderung, Typ B5; angeborenes Muskelhypertrophie-zerebrales Syndrom; Angeborenes myasthenisches Syndrom, auf Acetazolamid ansprechend; Angeborene Myopathie mit Fasertyp-Disproportion; angeborenes okuläres Kolobom; Angeborene stationäre Nachtblindheit, Typ 1A, 1B, 1C, 1E, 1F und 2A; Koproporphyrie; Cornea plana 2; Hornhautdystrophie, Fuchs-Endothel, 4; Hornhaut-Endotheldystrophie Typ 2; Hornhautzerbrechlichkeit Keratoglobus, blaue Sklerae und Gelenkhypermobilität; Cornelia-de-Lange-Syndrome 1 und 5; Koronare Herzkrankheit, autosomal-dominant 2; Koronare Herzerkrankung; Hyperalphalipoproteinämie 2; Kortikale Dysplasie, komplex, mit anderen Hirnfehlbildungen 5 und 6; Kortikale Fehlbildungen, Hinterhaupt; Mangel an Kortikosteroidbindendem Globulin; Corticosteron-Methyloxidase-Typ-2-Mangel; Costello-Syndrom; Cowden-Syndrom 1; Coxa plana; Kraniodiaphysäre Dysplasie, autosomal-dominant; Kraniosynostose 1 und 4; Kraniosynostose und Zahnanomalien; Kreatinmangel, X-chromosomal; Crouzon-Syndrom; Kryptophthalmus-Syndrom; Kryptorchismus, einseitig oder beidseitig; Cushing-Symphalangismus; Kutanes malignes Melanom 1; Cutis laxa mit Osteodystrophie und mit schweren Lungen-, Magen-Darm- und Harnwegsanomalien; Zyanose, vorübergehende neonatale und atypische nephropathische; Mukoviszidose; Cystinurie; Cytochrom-c-Oxidase-I-Mangel; Cytochrom-c-Oxidase-Mangel; D-2-Hydroxyglutarazidurie 2; Darier-Krankheit, segmental; Taubheit mit labyrinthischer Aplasie Mikrotie und Mikrodontie (LAMM); Taubheit, autosomal-dominant 3a, 4, 12, 13, 15, autosomal-dominant, nicht-syndromal sensorineural 17, 20 und 65; Taubheit, autosomal-rezessiv 1A, 2, 3, 6, 8, 9, 12, 15, 16, 18b, 22, 28, 31, 44, 49, 63, 77, 86 und 89; Taubheit, Cochlea, mit Myopie und intellektueller Beeinträchtigung, ohne vestibuläre Beteiligung, autosomal-dominant, X-chromosomal 2; Mangel an 2-Methylbutyryl-CoA-Dehydrogenase; Mangel an 3-Hydroxyacyl-CoA-Dehydrogenase; Mangel an Alpha-Mannosidase; Mangel an aromatischer L-Aminosäure-Decarboxylase; Mangel an Bisphosphoglycerat-Mutase; Mangel an Butyryl-CoA-Dehydrogenase; Mangel an Ferroxidase; Mangel an Galaktokinase; Mangel an Guanidinoacetat-Methyltransferase; Mangel an Hyaluronoglucosaminidase; Mangel an Ribose-5-Phosphat-Isomerase; Mangel an Steroid-11-beta-Monooxygenase; Mangel an UDP-Glucose-Hexose-1-Phosphat-Uridylyltransferase; Mangel an Xanthinoxidase; Dejerine-Sottas-Krankheit; Charcot-Marie-Tooth-Krankheit, Typen ID und IVF; Dejerine-Sottas-Syndrom, autosomal-dominant; Mangel an dendritischen Zellen, Monozyten, B-Lymphozyten und natürlichen Killer-Lymphozyten; Desbuquois-Dysplasie 2; Desbuquois-Syndrom; DFNA 2 Nicht-syndromaler Hörverlust; Diabetes mellitus und Insipidus mit Optikusatrophie und Taubheit; Diabetes mellitus Typ 2 und insulinabhängig 20; Diamond-Blackfan-Anämie 1, 5, 8 und 10; Durchfall 3 (sekretorisches Natrium, angeboren, syndromal) und 5 (mit Tufting-Enteropathie, angeboren); Dicarbonsäureaminoazidurie; Diffuse palmoplantare Keratodermie, Bottnischer Typ; Digitorenozerebrales Syndrom; Dihydropteridin-Reduktase-Mangel; Dilatative Kardiomyopathie 1A, 1AA, 1C, 1G, 1BB, 1DD, 1FF, 1HH, 1I, 1KK, 1N, 1S, 1Y und 3B; Linksventrikuläre Nichtverdichtung 3; Gestörte Steroidogenese aufgrund eines Cytochrom-p450-Oxidoreduktase-Mangels; Distale Arthrogrypose Typ 2B; Distale hereditäre motorische Neuronopathie Typ 2B; Distale Myopathie Markesbery-Griggs-Typ; Distale spinale Muskelatrophie, X-chromosomal 3; Distichiasis-Lymphödem-Syndrom; Dominante dystrophische Epidermolysis bullosa mit fehlender Haut; Dominante erbliche Optikusatrophie; Donnai-Barrow-Syndrom; Dopamin-Beta-Hydroxylase-Mangel; Dopaminrezeptor d2, reduzierte Hirndichte von; Dowling-Degos-Krankheit 4; Doyne-Waben-Netzhautdystrophie; Malattia leventinisch; Duane-Syndrom Typ 2; Dubin-Johnson-Syndrom; Duchenne-Muskeldystrophie; Becker-Muskeldystrophie; Dysfibrinogenämie; Dyskeratosis congenita autosomal-dominant und autosomal-dominant, 3; Dyskeratosis congenita, autosomal-rezessiv, 1, 3, 4 und 5; Dyskeratosis congenita X-chromosomal; Dyskinesie, familiär, mit Gesichtsmyokymie; Dysplasminogenämie; Dystonie 2 (Torsion, autosomal-rezessiv), 3 (Torsion, X-chromosomal), 5 (Doparesponsiver Typ), 10, 12, 16, 25, 26 (Myoklonisch); Anfälle, gutartige familiäre infantile, 2; Frühkindliche epileptische Enzephalopathie 2, 4, 7, 9, 10, 11, 13 und 14; Atypisches Rett-Syndrom; Frühe T-Zell-Vorläufer akute lymphoblastische Leukämie; Ektodermale Dysplasie Hautfragilitätssyndrom; Ektodermales Dysplasie-Syndaktylie-Syndrom 1; Ectopia lentis, isoliert autosomal-rezessiv und dominant; Ektrodaktylie, ektodermale Dysplasie und Lippen-Kiefer-Gaumen-Spalten-Syndrom 3; Ehlers-Danlos-Syndrom Typ 7 (autosomal-rezessiv), klassischer Typ, Typ 2 (Progeroid), Hydroxylysin-defizient, Typ 4, Typ-4-Variante und aufgrund von Tenascin-X-Mangel; Angeborene Muskeldystrophie vom Eichsfeld-Typ; Endokrine Zerebroosteodysplasie; Verstärktes S-Kegel-Syndrom; Vergrößertes vestibuläres Aquäduktsyndrom; Enterokinase-Mangel; Epidermodysplasie verruciformis; Epidermolysa bullosa simplex und Gliedergürtel-Muskeldystrophie, Simplex mit fleckiger Pigmentierung, Simplex mit Pylorusatresie, Simplex, autosomal-rezessiv und mit Pylorusatresie; epidermolytische palmoplantare Keratodermie; Familiäre Fieberkrämpfe 8; Epilepsie, Abwesenheit im Kindesalter 2, 12 (idiopathisch generalisiert, Anfälligkeit für) 5 (nächtlicher Frontallappen), nächtlicher Frontallappen Typ 1, partiell, mit variablen Herden, progressive myoklonische 3 und X-chromosomal, mit variablen Lernbehinderungen und Verhaltensstörungen; Epileptische Enzephalopathie, im Kindesalter beginnend, frühkindlich, 1, 19, 23, 25, 30 und 32; Epiphysäre Dysplasie, multiple, mit Myopie und konduktiver Taubheit; Episodische Ataxie Typ 2; Episodisches Schmerzsyndrom, familiär, 3; Epstein-Syndrom; Fechtner-Syndrom; erythropoetische Protoporphyrie; Östrogenresistenz; Exsudative Vitreoretinopathie 6; Morbus Fabry und Morbus Fabry, Herzvariante; Faktor H, VII, X, v und Faktor viii, kombinierter Mangel an 2, xiii, einer Untereinheit, Mangel; Familiäre adenomatöse Polyposis 1 und 3; familiäre Amyloidnephropathie mit Urtikaria und Taubheit; familiäre kalte Urtikaria; familiäre Aplasie des Vermis; familiärer gutartiger Pemphigus; familiärer Brustkrebs; Brustkrebs, Anfälligkeit für; Osteosarkom; Bauchspeicheldrüsenkrebs 3; familiäre Kardiomyopathie; Familiäres autoinflammatorisches Erkältungssyndrom 2; familiärer Darmkrebs; Familiäre exsudative Vitreoretinopathie, X-chromosomal; familiäre hemiplegische Migräne Typ 1 und 2; familiäre Hypercholesterinämie; Familiäre hypertrophe Kardiomyopathie 1, 2, 3, 4, 7, 10, 23 und 24; familiäre Hypokaliämie-Hypomagnesiämie; familiäre hypoplastische, glomerulozystische Niere; familiäre infantile Myasthenie; familiäre juvenile Gicht; Familiäres Mittelmeerfieber und Familiäres Mittelmeerfieber, autosomal dominant; familiäre Porenzephalie; Familiäre Porphyria cutanea tarda; familiäre pulmonale kapillare Hämangiomatose; familiäre renale Glukosurie; familiäre renale Hypourikämie; Familiäre restriktive Kardiomyopathie 1; familiäre Hyperlipoproteinämie Typ 1 und 3; Fanconi-Anämie, Komplementationsgruppe E, I, N und O; Fanconi-Bickel-Syndrom; Favismus, Anfälligkeit für; Fieberkrämpfe, familiär, 11; Feingold-Syndrom 1; fötaler Hämoglobin-Quantitativer Trait Locus 1; FG-Syndrom und FG-Syndrom 4; Fibrose der extraokularen Muskulatur, angeboren, 1, 2, 3a (mit oder ohne extraokulare Beteiligung), 3b; Fischaugenkrankheit; Fleck-Hornhautdystrophie; Floating-Harbor-Syndrom; Fokale Epilepsie mit Sprachstörung mit oder ohne geistige Behinderung; Fokale segmentale Glomerulosklerose 5; Defekte des Vorderhirns; Frank-Ter-Haar-Syndrom; Borrone Di Rocco Crovato-Syndrom; Frasier-Syndrom; Wilms-Tumor 1; Freeman-Sheldon-Syndrom; Frontometaphysäre Dysplasie 1 und 3; Frontotemporale Demenz; Frontotemporale Demenz und/oder amyotrophe Lateralsklerose 3 und 4; Frontotemporale Demenz Chromosom 3-verknüpft und Frontotemporale Demenz Ubiquitinpositiv; Fructose-Biphosphatase-Mangel; Fuhrmann-Syndrom; Gamma-Aminobuttersäure-Transaminase-Mangel; Gamstorp-Wohlfart-Syndrom; Gaucher-Krankheit Typ 1 und subakute neuronopathische; Blicklähmung, familiär horizontal, mit fortschreitender Skoliose; Generalisierte dominante dystrophische Epidermolysis bullosa; Generalisierte Epilepsie mit Fieberkrämpfen plus 3, Typ 1, Typ 2; Epileptische Enzephalopathie vom Lennox-Gastaut-Typ; Riesen-Axonale Neuropathie; Glanzmann-Thrombasthenie; Glaukom 1, offener Winkel, e, F und G; Glaukom 3, primär angeboren, d; Angeborenes Glaukom und angeborenes Glaukom, Kolobom; Glaukom, primärer offener Winkel, juveniler Beginn; Gliomanfälligkeit 1; Glukosetransporter-Typ-1-Mangelsyndrom; Glucose-6-Phosphat-Transportdefekt; GLUT1-Mangelsyndrom 2; Epilepsie, idiopathisch generalisiert, Anfälligkeit für, 12; Glutamat-Formiminotransferase-Mangel; Glutarazidämie IIA und IIB; Glutarazidurie, Typ 1; Gluthathion-Synthetase-Mangel; Glykogenspeicherkrankheit 0 (Muskel), II (adulte Form), IXa2, IXc, Typ 1A; Typ II, Typ IV, IV (kombiniert hepatisch und myopathisch), Typ V und Typ VI; Goldmann-Favre-Syndrom; Gordon-Syndrom; Gorlin-Syndrom; Holoprosenzephalie-Sequenz; Holoprosenzephalie 7; Granulomatöse Erkrankung, chronisch, X-chromosomal, Variante; Granulosazelltumor des Eierstocks; Syndrom der grauen Blutplättchen; Griscelli-Syndrom Typ 3; Hornhautdystrophie Groenouw Typ I; Wachstum und geistige Behinderung, mandibulofaziale Dysostose, Mikrozephalie und Gaumenspalte; Wachstumshormonmangel mit Hypophysenanomalien; Wachstumshormonunempfindlichkeit mit Immunschwäche; GTP-Cyclohydrolase-I-Mangel; Hajdu-Cheney-Syndrom; Hand-Fuß-Uterus-Syndrom; Schwerhörigkeit; Hämangiom, kapillares infantiles; Hämatologisches Neoplasma; Hämochromatose Typ 1, 2B und 3; Mikrovaskuläre Komplikationen von Diabetes 7; Transferrin-Serumspiegel Quantitativer Trait-Lokus 2; Hämoglobin-H-Krankheit, nicht-deletional; Hämolytische Anämie, nicht-sphärozytär, aufgrund von Glucosephosphat-Isomerase-Mangel; Hämophagozytische Lymphohistiozytose, familiär, 2; Hämophagozytische Lymphohistiozytose, familiär, 3; Heparin-Cofaktor-II-Mangel; Hereditäre Acrodermatitis enteropathica; erbliches Brust- und Eierstockkrebssyndrom; Ataxietelangiektasie-ähnliche Störung; Hereditärer diffuser Magenkrebs; Hereditäre diffuse Leukenzephalopathie mit Sphäroiden; Erbliche Faktoren II, IX, VIII Mangelkrankheit; Hereditäre hämorrhagische Teleangiektasie Typ 2; erbliche Schmerzunempfindlichkeit bei Anhidrose; Hereditäres Lymphödem Typ I; Hereditäre motorische und sensorische Neuropathie mit Optikusatrophie; Hereditäre Myopathie mit frühem Atemversagen; Hereditäre neuralgische Amyotrophie; Hereditäre nichtpolypöse kolorektale Neoplasien; Lynch-Syndrom I und II; erbliche Pankreatitis; Pankreatitis, chronisch, Anfälligkeit für; Hereditäre sensorische und autonome Neuropathie Typ IIB und IIA; Hereditäre sideroblastische Anämie; Hermansky-Pudlak-Syndrom 1, 3, 4 und 6; Heterotaxie, viszeral, 2, 4 und 6, autosomal; Heterotaxie, viszeral, X-gebunden; Heterotopie; histiozytäre medulläre Retikulose; Histiozytose-Lymphadenopathie plus Syndrom; Holocarboxylase-Synthetase-Mangel; Holoprosenzephalie 2, 3,7 und 9; Holt-Oram-Syndrom; Homocysteinämie aufgrund von MTHFR-Mangel, CBS-Mangel und Homocystinurie, auf Pyridoxin ansprechend; Homocystinurie-Megaloblastische Anämie aufgrund eines Defekts im Cobalamin-Stoffwechsel, cblE-Komplementationstyp; Howel-Evans-Syndrom; Hurler-Syndrom; Hutchinson-Gilford-Syndrom; Hydrozephalus; Hyperammonämie, Typ III; Hypercholesterinämie und Hypercholesterinämie, autosomal-rezessiv; Hyperekplexia 2 und Hyperekplexia erblich; Hyperferritinämie-Katarakt-Syndrom; Hyperglycinurie; Hyperimmunglobulin D mit periodischem Fieber; Mevalon-Azidurie; Hyperimmunglobulin-E-Syndrom; Hyperinsulinämische Hypoglykämie familiär 3, 4 und 5; Hyperinsulinismus-Hyperammonämie-Syndrom; Hyperlysinämie; Hypermanganesämie mit Dystonie, Polyzythämie und Zirrhose; Hyperornithinämie-Hyperammonämie-Homocitrullinurie-Syndrom; Hyperparathyreoidismus 1 und 2; Hyperparathyreoidismus, Neugeborene schwer; Hyperphenylalaninämie, bh4-defizient, a, aufgrund eines partiellen Pts-Mangels, BH4-defizient, D und nicht-pku; Hyperphosphatasie mit geistigem Retardationssyndrom 2, 3 und 4; hypertrichotische Osteochondrodysplasie; Hypobetalipoproteinämie, familiär, assoziiert mit Apob32; Hypokalzämie, autosomal-dominant 1; Hypokalziurie Hyperkalzämie, familiär, Typ 1 und 3; Hypochondrogenese; Hypochrome mikrozytäre Anämie mit Eisenüberladung; Hypoglykämie mit Mangel an Glykogensynthetase in der Leber; Hypogonadotroper Hypogonadismus 11 mit oder ohne Anosmie; Hypohidrotische ektodermale Dysplasie mit Immunschwäche; Hypohidrotische X-chromosomale ektodermale Dysplasie; Hypokaliämische periodische Paralyse 1 und 2; Hypomagnesiämie 1, Darm; Hypomagnesiämie, Krampfanfälle und geistige Behinderung; Hypomyelinisierende Leukodystrophie 7; Hypoplastisches Linksherzsyndrom; Atrioventrikulärer Septumdefekt und gemeinsamer atrioventrikulärer Übergang; Hypospadie 1 und 2, X-chromosomal; Hypothyreose, angeboren, nicht kropfig, 1; Hypotrichose 8 und 12; Hypotrichose-Lymphödem-Teleangiektasie-Syndrom; I Blutgruppensystem; Ichthyosis bullosa von Siemens; Ichthyosis exfoliativa; Ichthyose-Frühgeborenen-Syndrom; Idiopathische Basalganglienverkalkung 5; Idiopathische fibrosierende Alveolitis, chronische Form; Dyskeratosis congenita, autosomal-dominant, 2 und 5; Idiopathische Hyperkalzämie des Säuglingsalters; Immundysfunktion mit T-Zell-Inaktivierung durch Calcium-Eintrittsdefekt 2; Immunschwäche 15, 16, 19, 30, 31C, 38, 40, 8, aufgrund eines Defekts in cd3-zeta, mit Hyper-IgM Typ 1 und 2 und X-chromosomal, mit Magnesiumdefekt, Epstein-Barr-Virusinfektion und Neoplasie ; Immunschwäche-zentromerische Instabilität-Gesichtsanomalien-Syndrom 2; Einschlusskörpermyopathie 2 und 3; Nonaka-Myopathie; Infantile Krämpfe und paroxysmale Choreoathetose, familiär; infantile kortikale Hyperostose; Infantile GM1-Gangliosidose; infantile Hypophosphatasie; infantile Nephronophthise; Infantiler Nystagmus, X-chromosomal; Infantile Parkinsonismus-Dystonie; Unfruchtbarkeit im Zusammenhang mit mehrschwänzigen Spermatozoen und übermäßiger DNA; Insulinresistenz; insulinresistenter Diabetes mellitus und Acanthosis nigricans; insulinabhängiges sekretorisches Durchfallsyndrom von Diabetes mellitus; interstitielle Nephritis, karyomegalie; Intrauterine Wachstumsverzögerung, metaphysäre Dysplasie, Nebennierenhypoplasie congenita und Genitalanomalien; Iodtyrosyl-Kupplungsdefekt; IRAK4-Mangel; Iridogoniodysgenesis dominanter Typ und Typ 1; Eisenansammlung im Gehirn; ischiopatellare Dysplasie; Inselzellhyperplasie; Isolierter 17,20-Lyase-Mangel; isolierter Lutropinmangel; Isovaleryl-CoA-Dehydrogenase-Mangel; Jankovic Rivera-Syndrom; Jervell- und Lange-Nielsen-Syndrom 2; Joubert-Syndrom 1, 6, 7, 9/15 (digenic), 14, 16 und 17 und Orofaciodigital-Syndrom xiv; Junctionale Epidermolysis bullosa gravis von Herlitz; Juvenile GM>1< Gangliosidose; Juveniles Polyposis-Syndrom; Juvenile Polyposis/hereditäres hämorrhagisches Teleangiektasie-Syndrom; Juvenile Retinoschisis; Kabuki-Make-up-Syndrom; Kallmann-Syndrom 1, 2 und 6; verzögerte Pubertät; Kanzaki-Krankheit; Karak-Syndrom; Kartagener-Syndrom; Kenny-Caffey-Syndrom Typ 2; Keppen-Lubinsky-Syndrom; Keratokonus 1; Keratose follicularis; Keratosis palmoplantaris striata 1; Kindler-Syndrom; L-2-Hydroxyglutarazidurie; Larsen-Syndrom, dominanter Typ; Gitter-Hornhautdystrophie Typ III; Leber-Amaurose; Zellweger-Syndrom; Peroxisom-Biogenese-Störungen; Zellweger-Syndrom-Spektrum; Leber angeborene Amaurose 11, 12, 13, 16, 4, 7 und 9; Leber-Optik-Atrophie; Aminoglykosid-induzierte Taubheit; Taubheit, nicht-syndromale sensorineurale, mitochondriale; Linksventrikuläre Nichtverdichtung 5; Fehlbildungen der Links-Rechts-Achse; Leigh-Krankheit; Mitochondrialer kurzkettiger Enoyl-CoA-Hydratase-1-Mangel; Leigh-Syndrom aufgrund eines Mangels an mitochondrialem Komplex I; Leiner-Krankheit; Leri Weill Dyschondrosteose; Letales kongenitales Kontraktursyndrom 6; Leukozytenadhäsionsmangel Typ I und III; Leukodystrophie, hypomyelinisierend, 11 und 6; Leukoenzephalopathie mit Ataxie, mit Beteiligung des Hirnstamms und des Rückenmarks und Laktaterhöhung, mit verschwindender weißer Substanz und fortschreitend, mit Ovarialversagen; Leukonychia totalis; Lewy-Körper-Demenz; Lichtenstein-Knorr-Syndrom; Li-Fraumeni-Syndrom 1; Lig4-Syndrom; Gliedergürtel-Muskeldystrophie, Typ 1B, 2A, 2B, 2D, C1, C5, C9, C14; Angeborene Muskeldystrophie-Dystroglycanopathie mit Hirn- und Augenanomalien, Typ A14 und B14; Lipasemangel kombiniert; Lipidproteinose; Lipodystrophie, familiär partiell, Typ 2 und 3; Lissenzephalie 1, 2 (X-chromosomal), 3, 6 (mit Mikrozephalie), X-chromosomal; Subkortikale laminare Heterotopie, X-chromosomal; Leberversagen akut infantil; Loeys-Dietz-Syndrom 1, 2, 3; Long-QT-Syndrom 1, 2, 2/9, 2/5, (digenisch), 3, 5 und 5, erworben, Anfälligkeit für; Lungenkrebs; Lymphödem, erblich, id; Lymphödem, primär, mit Myelodysplasie; Lymphoproliferatives Syndrom 1, 1 (X-chromosomal) und 2; Mangel an lysosomaler saurer Lipase; Makrozephalie, Makrosomie, Gesichtsdysmorphismus-Syndrom; Makuladystrophie, vitelliform, im Erwachsenenalter beginnend; Anfälligkeit für maligne Hyperthermie Typ 1; Malignes Lymphom, Non-Hodgkin; malignes Melanom; Bösartiger Tumor der Prostata; mandibuloakrale Dysostose; Mandibuloakrale Dysplasie mit Lipodystrophie Typ A oder B, atypisch; Mandibulofaziale Dysostose, Treacher-Collins-Typ, autosomal-rezessiv; Mangel an Mannose-bindendem Protein; Ahornsirup-Urinkrankheit Typ 1A und Typ 3; Marden Walker-ähnliches Syndrom; Marfan-Syndrom; Marinesco-Sj\xc3\xb6gren-Syndrom; Martsolf-Syndrom; Altersdiabetes bei jungen Menschen, Typ 1, Typ 2, Typ 11, Typ 3 und Typ 9; May-Hegglin-Anomalie; MYH9-bezogene Störungen; Sebastian-Syndrom; McCune-Albright-Syndrom; somatotropes Adenom; Geschlechtsstrang-Stromatumor; Cushing-Syndrom; McKusick-Kaufman-Syndrom; McLeod-Neuroakanthozytose-Syndrom; Meckel-Gruber-Syndrom; Dehydrogenase-Mangel an mittelkettigem Acyl-Coenzym A; Medulloblastom; Megalenzephale Leukenzephalopathie mit subkortikalen Zysten 1 und 2a; Megalenzephalie cutis marmorata teleangiectatica angeboren; PIK3CA-bezogenes Überwucherungsspektrum; Megalenzephalie-Polymikrogyrie-Polydaktylie-Hydrozephalus-Syndrom 2; Megaloblastäre Anämie, auf Thiamin ansprechend, mit Diabetes mellitus und sensorineuraler Taubheit; Meier-Gorlin-Syndrome 1 und 4; Melnick-Nadel-Syndrom; Meningeom; Geistige Retardierung, X-chromosomal, 3, 21, 30 und 72; Geistige Retardierung und Mikrozephalie mit pontiner und zerebellärer Hypoplasie; Geistige Retardierung X-chromosomal Syndrom 5; Geistige Behinderung, vorderer Oberkiefervorsprung und Strabismus; Geistige Retardierung, autosomal-dominant 12, 13, 15, 24, 3, 30, 4, 5, 6 und 9; Geistige Behinderung, autosomal-rezessiv 15, 44, 46 und 5; Geistige Behinderung, stereotype Bewegungen, Epilepsie und/oder zerebrale Fehlbildungen; Geistige Retardierung, syndromal, Claes-Jensen-Typ, X-chromosomal; Geistige Retardierung, X-chromosomal, unspezifisch, syndromal, Hedera-Typ und syndromal, Wu-Typ; angeborene Muskeldystrophie mit Merosinmangel; Metachromatische Leukodystrophie juveniler, spätinfantiler und erwachsener Typ; Metachromatische Leukodystrophie; Metatrophe Dysplasie; Methämoglobinämie Typ I und 2; Methionin-Adenosyltransferase-Mangel, autosomal-dominant; Methylmalonazidämie mit Homocystinurie, ; Methylmalonazidurie vom Typ cblB, ; Methylmalonazidurie aufgrund von Methylmalonyl-CoA-Mutase-Mangel; METHYLMALON-ACIDURIE, mut(0)-TYP; Mikrozephaler osteodysplastischer primordialer Zwergwuchs Typ 2; Mikrozephalie mit oder ohne Chorioretinopathie, Lymphödem oder geistiger Behinderung; Mikrozephalie, Hiatushernie und nephrotisches Syndrom; Mikrozephalie; Hypoplasie des Corpus callosum; Spastische Paraplegie 50, autosomal-rezessiv; Globale Entwicklungsverzögerung; CNS-Hypomyelinisierung; Gehirnschwund; Mikrozephalie, normale Intelligenz und Immunschwäche; Mikrozephalie-kapillares Fehlbildungssyndrom; Mikrozytäre Anämie; Mikrophthalmie-Syndrom 5, 7 und 9; Mikrophthalmie, isoliert 3, 5, 6, 8 und mit Kolobom 6; Mikrosphärophakie; Migräne, familiärer Basilar; Miller-Syndrom; Minicore-Myopathie mit externer Ophthalmoplegie; Myopathie, angeboren mit Kernen; Mitchell-Riley-Syndrom; mitochondrialer 3-Hydroxy-3-methylglutaryl-CoA-Synthase-Mangel; Mangel an mitochondrialem Komplex I, II, III, III (Kerntyp 2, 4 oder 8); Mitochondriales DNA-Depletion-Syndrom 11, 12 (kardiomyopathischer Typ), 2, 4B (MNGIE-Typ), 8B (MNGIE-Typ); Mitochondriales DNA-Depletionssyndrom 3 und 7, hepato-zerebrale Typen und 13 (enzephalomyopathischer Typ); Mangel an mitochondrialen Phosphatträgern und Pyruvatträgern; Mitochondrialer trifunktionaler Proteinmangel; Mangel an langkettiger 3-Hydroxyacyl-CoA-Dehydrogenase; Miyoshi-Muskeldystrophie 1; Myopathie, distal, mit anteriorem Tibiabeginn; Mohr-Tranebjaerg-Syndrom; Mangel an Molybdän-Kofaktor, Komplementierungsgruppe A; Mowat-Wilson-Syndrom; Mukolipidose III Gamma; Mukopolysaccharidose Typ VI, Typ VI (schwer) und Typ VII; Mucopolysaccharidose, MPS-I-H/S, MPS-II, MPS-III-A, MPS-III-B, MPS-III-C, MPS-IV-A, MPS-IV-B; Retinitis pigmentosa 73; Gangliosidose GM1 Typ1 (mit Herzbeteiligung) 3; Multizentrische Osteolyse-Nephropathie; Multizentrische Osteolyse, Nodulose und Arthropathie; Mehrere angeborene Anomalien; Vorhofseptumdefekt 2; Multiple angeborene Anomalien-Hypotonie-Krampf-Syndrom 3; Multiple Haut- und Schleimhautvenenfehlbildungen; Multiple endokrine Neoplasie, Typ 1 und 4; Multiple epiphysäre Dysplasie 5 oder Dominant; Mehrere gastrointestinale Atresien; Multiples Pterygium-Syndrom Escobar-Typ; Multipler Sulfatase-Mangel; Multiple Synostosen-Syndrom 3; Muskel-AMP-Guaninoxidase-Mangel; Muskel-Augen-Hirn-Krankheit; Muskeldystrophie, angeboren, megakonialer Typ; Myasthenia, familiäre infantile, 1; Myasthenisches Syndrom, kongenital, 11, verbunden mit Acetylcholinrezeptormangel; Myasthenisches Syndrom, kongenital, 17, 2A (langsamer Kanal), 4B (schneller Kanal) und ohne tubuläre Aggregate; Myeloperoxidase-Mangel; MYH-assoziierte Polyposis; Endometriumkarzinom; Myokardinfarkt 1; Myoklonische Dystonie; Myoklonisch-Atonische Epilepsie; Myoklonus mit Epilepsie mit ausgefransten roten Fasern; Myofibrilläre Myopathie 1 und ZASPbezogen; Myoglobinurie, akut rezidivierend, autosomal-rezessiv; Myoneurales gastrointestinales Enzephalopathie-Syndrom; Kleinhirn-Ataxie infantil mit progressiver externer Ophthalmoplegie; Mitochondriales DNA-Depletion-Syndrom 4B, MNGIE-Typ; Myopathie, zentronukleär, 1, angeboren, mit Überschuss an Muskelspindeln, distal, 1, Laktatazidose und sideroblastische Anämie 1, mitochondrial progressiv mit angeborenem Katarakt, Hörverlust und Entwicklungsverzögerung und tubulärem Aggregat, 2; Kurzsichtigkeit 6; Myosklerose, autosomal-rezessiv; Angeborene Myotonie; Angeborene Myotonie, autosomal-dominante und rezessive Formen; Nagel-Patella-Syndrom; Nance-Horan-Syndrom; Nanophthalmus 2; Navajo-Neurohepatopathie; Nemalin-Myopathie 3 und 9; Neonatale Hypotonie; Beschränkter Intellekt; Anfälle; Verzögerte Sprach- und Sprachentwicklung; Geistige Behinderung, autosomal-dominant 31; Neugeborene intrahepatische Cholestase durch Citrinmangel; Nephrogener Diabetes insipidus, Nephrogener Diabetes insipidus, X-chromosomal; Nephrolithiasis/Osteoporose, hypophosphatämisch, 2; Nephronophthise 13, 15 und 4; Unfruchtbarkeit; Kleinhirn-okulorenales Syndrom (Nephronophthise, okulomotorische Apraxie und Kleinhirnanomalien); Nephrotisches Syndrom, Typ 3, Typ 5, mit oder ohne Augenanomalien, Typ 7 und Typ 9; Nestor-Guillermo-Progerie-Syndrom; Neu-Laxova-Syndrom 1; Neurodegeneration mit Eisenansammlung im Gehirn 4 und 6; Neuroferritinopathie; Neurofibromatose, Typ 1 und Typ 2; Neurofibrosarkom; Neurohypophysärer Diabetes insipidus; Neuropathie, hereditäre sensorische, Typ IC; Transportdefekt für neutrale 1 Aminosäure; Neutrale Lipidspeicherkrankheit mit Myopathie; Neutrophiles Immunschwächesyndrom; Nicolaides-Baraitser-Syndrom; Niemann-Pick-Krankheit Typ C1, C2, Typ A und Typ C1, adulte Form; nichtketotische Hyperglyzinämie; Noonan-Syndrom 1 und 4, LEOPARD-Syndrom 1; Noonan-Syndrom-ähnliche Erkrankung mit oder ohne juvenile myelomonozytäre Leukämie; Normokalämische periodische Lähmung, kaliumempfindlich; Norum-Krankheit; Epilepsie, Hörverlust und geistiges Retardationssyndrom; Geistige Retardierung, X-gebunden 102 und syndromal 13; Fettleibigkeit; Augenalbinismus, Typ I; Okulokutaner Albinismus Typ 1B, Typ 3 und Typ 4; Oculodentodigitale Dysplasie; Odontohypophosphatasie; Odontotrichomeles Syndrom; Oguchi-Krankheit; Oligodontie-Kolorektalkrebs-Syndrom; Opitz G/BBB-Syndrom; Optikusatrophie 9; Oral-Gesichts-Digital-Syndrom; Ornithin-Aminotransferase-Mangel; Orofaziale Spalte 11 und 7, Lippen-/Gaumenspalte-ektodermales Dysplasie-Syndrom; Orstavik-Lindemann-Solberg-Syndrom; Arthrose mit leichter Chondrodysplasie; Osteochondritis dissecans; Osteogenesis imperfecta Typ 12, Typ 5, Typ 7, Typ 8, Typ I, Typ III, mit normalen Skleren, dominante Form, rezessiv perinatal letal; Osteopathia striata mit Hirnsklerose; Osteopetrose autosomal-dominant Typ 1 und 2, rezessiv 4, rezessiv 1, rezessiv 6; Osteoporose mit Pseudogliom; Oto-palato-digitales Syndrom, Typ I und II; Ovarialdysgenesie 1; Ovarioleukodystrophie; Pachyonychia congenita 4 und Typ 2; Paget-Knochenkrankheit, familiär; Pallister-Hall-Syndrom; Palmoplantare Keratodermie, nicht-pidermolytisch, fokal oder diffus; Pankreas-Agenesie und angeborene Herzfehler; Papillon-Lef\xc3\xa8vre-Syndrom; Paragangliome 3; Paramyotonia congenita von Eulenburg; Nebenschilddrüsenkarzinom; Parkinson-Krankheit 14, 15, 19 (juvenil beginnend), 2, 20 (früh beginnend), 6, (autosomal-rezessiv, früh einsetzend, und 9; partieller Albinismus; partieller Hypoxanthin-Guanin-Phosphoribosyltransferase-Mangel; gemusterte Dystrophie des retinalen Pigmentepithels ; PC-K6a; Pelizaeus-Merzbacher-Krankheit; Pendred-Syndrom; Periphere demyelinisierende Neuropathie, zentrale Dysmyelinisierung; Morbus Hirschsprung; Permanenter neonataler Diabetes mellitus; Diabetes mellitus, permanenter Neugeborenen mit neurologischen Merkmalen; Neugeborener insulinabhängiger Diabetes mellitus; Altersdiabetes von junge, Typ 2; Peroxisom-Biogenesestörung 14B, 2A, 4A, 5B, 6A, 7A und 7B; Perrault-Syndrom 4; Perry-Syndrom; Persistierende hyperinsulinämische Hypoglykämie im Säuglingsalter; familiärer Hyperinsulinismus; Phänotypen; Phenylketonurie; Phäochromozytom; Hereditäres Paragangliom .-Phäochromozytom Syndrome; Paragangliome 1; Karzinoidtumor des Darms; Cowden-Syndrom 3; Phosphoglycerat-Dehydrogenase-Mangel; Phosphoglycerat-Kinase 1 de fizienz; Lichtempfindliche Trichothiodystrophie; Phytansäurespeicherkrankheit; Pick-Krankheit; Pierson-Syndrom; pigmentäre Netzhautdystrophie; Pigmentierte noduläre Nebennierenrindenerkrankung, primär, 1; Pilomatrixom; Pitt-Hopkins-Syndrom; Hypophysenabhängiger Hypercortisolismus; Hypophysenhormonmangel, kombiniert 1, 2, 3 und 4; Plasminogen-Aktivator-Inhibitor-Typ-1-Mangel; Plasminogenmangel, Typ I; Blutungsstörung vom Thrombozytentyp 15 und 8; Poikilodermie, erbliche Fibrose mit Sehnenkontrakturen, Myopathie und Lungenfibrose; Polyzystische Nierenerkrankung 2, adulter Typ und infantiler Typ; Polyzystische lipomembranöse Osteodysplasie mit sklerosierender Leukenzephalopathie; Polyglucosan-Körper-Myopathie 1 mit oder ohne Immunschwäche; Polymikrogyrie, asymmetrisch, bilateral frontoparietal; Polyneuropathie, Hörverlust, Ataxie, Retinitis pigmentosa und Katarakt; Pontozerebelläre Hypoplasie Typ 4; Popliteal-Pterygium-Syndrom; Porenzephalie 2; Porokeratose 8, disseminierter oberflächlicher aktinischer Typ; Porphobilinogen-Synthase-Mangel; Porphyria cutanea tarda; Ataxie der hinteren Säule mit Retinitis pigmentosa; Posteriorer Polarkatarakt Typ 2; Prader-Willi-ähnliches Syndrom; vorzeitiges Ovarialversagen 4, 5, 7 und 9; Primäre autosomal-rezessive Mikrozephalie 10, 2, 3 und 5; Primäre Ziliardyskinesie 24; Primäre dilatative Kardiomyopathie; Linksventrikuläre Nichtverdichtung 6; 4, linksventrikuläre Nichtverdichtung 10; paroxysmales Vorhofflimmern; Primäre Hyperoxalurie, Typ I, Typ und Typ III; Primäre hypertrophe Osteoarthropathie, autosomal-rezessiv 2; Primäre Hypomagnesiämie; Primäres Offenwinkelglaukom juveniler Beginn 1; Primäre pulmonale Hypertonie; Primel-Syndrom; Progressiver familiärer Herzblock Typ 1B; Progressive familiäre intrahepatische Cholestase 2 und 3; Progressive intrahepatische Cholestase; Progressive Myoklonus-Epilepsie mit Ataxie; Progressive pseudorheumatoide Dysplasie; Progressive sklerosierende Poliodystrophie; Prolidase-Mangel; Prolin-Dehydrogenase-Mangel; Schizophrenie 4; Properdin-Mangel, X-chromosomal; Propionische Wissenschaft; Proproteinkonvertase 1/3-Mangel; Prostatakrebs, erblich, 2; Protan-Defekt; Proteinurie; Finnisches angeborenes nephrotisches Syndrom; Proteus-Syndrom; Brust-Adenokarzinom; Pseudoachondroplastisches spondyloepiphysäres Dysplasie-Syndrom; Pseudohypoaldosteronismus Typ 1 autosomal dominant und rezessiv und Typ 2; Pseudohypoparathyreoidismus Typ 1A, Pseudopseudohypoparathyreoidismus; Pseudoneonatale Adrenoleukodystrophie; Pseudoprimärer Hyperaldosteronismus; Pseudoxanthoma elasticum; Generalisierte arterielle Verkalkung des Säuglingsalters 2; Pseudoxanthoma elasticum-ähnliche Erkrankung mit multiplem Gerinnungsfaktormangel; Psoriasis-Anfälligkeit 2; PTEN-Hamartom-Tumorsyndrom; Pulmonale arterielle Hypertonie im Zusammenhang mit hereditärer hämorrhagischer Teleangiektasie; Lungenfibrose und/oder Knochenmarkversagen, Telomer-bezogen, 1 und 3; Pulmonale Hypertonie, primär, 1 mit hereditärer hämorrhagischer Teleangiektasie; Purin-Nukleosid-Phosphorylase-Mangel; Pyruvat-Carboxylase-Mangel; Pyruvatdehydrogenase E1-alpha-Mangel; Pyruvatkinase-Mangel der roten Blutkörperchen; Raine-Syndrom; Rasopathie; Rezessive dystrophische Epidermolysis bullosa; Nagelstörung, nicht-syndromal angeboren, 8; Reifenstein-Syndrom; Nierenadysplasie; Nieren-Carnitin-Transportdefekt; Nieren-Kolobom-Syndrom; Nierendysplasie; Nierendysplasie, retinale Pigmentdystrophie, zerebelläre Ataxie und Skelettdysplasie; Nierentubuläre Azidose, distal, autosomal-rezessiv, mit spät einsetzendem sensorineuralem Hörverlust oder mit hämolytischer Anämie; Nierentubuläre Azidose, proximal, mit Augenanomalien und geistiger Behinderung; Netzhautzapfendystrophie 3B; Retinitis pigmentosa; Retinitis pigmentosa 10, 11, 12, 14, 15, 17 und 19; Retinitis pigmentosa 2, 20, 25, 35, 36, 38, 39, 4, 40, 43, 45, 48, 66, 7, 70, 72; Retinoblastom; Rett-Störung; Rhabdoides Tumorprädispositionssyndrom 2; Rhegmatogene Netzhautablösung, autosomal-dominant; Rhizomelische Chondrodysplasie punctata Typ 2 und Typ 3; Roberts-SC Phokomelie-Syndrom; Robinow-Sorauf-Syndrom; Robinow-Syndrom, autosomal-rezessiv, autosomal-rezessiv, mit Brachy-Syn-Polydaktylie; Rothmund-Thomson-Syndrom; Rapadilino-Syndrom; RRM2B-bedingte mitochondriale Erkrankung; Rubinstein-Taybi-Syndrom; Salla-Krankheit; Sandhoff-Krankheit, erwachsene und infantile Typen; Sarkoidose, früh einsetzend; Blau-Syndrom; Schindler-Krankheit, Typ 1; Schizenzephalie; Schizophrenie 15; Schneckenbecken-Dysplasie; Schwannomatose 2; Schwartz-Jampel-Syndrom Typ 1; Sklerocornea, autosomal-rezessiv; Sklerosteose; Sekundäre Hypothyreose; Segawa-Syndrom, autosomal-rezessiv; Senior-Loken-Syndrom 4 und 5, ; Sensorische ataktische Neuropathie, Dysarthrie und Ophthalmoparese; Sepiapterin-Reduktase-Mangel; SeSAME-Syndrom; Schwerer kombinierter Immundefekt aufgrund von ADA-Mangel, mit Mikrozephalie, Wachstumsverzögerung und Empfindlichkeit gegenüber ionisierender Strahlung, atypisch, autosomal-rezessiv, T-Zell-negativ, B-Zellpositiv, NK-Zell-negativ oder NK-positiv; schwere angeborene Neutropenie; Schwere angeborene Neutropenie 3, autosomal-rezessiv oder dominant; Schwere angeborene Neutropenie und 6, autosomal-rezessiv; Schwere myoklonische Epilepsie im Säuglingsalter; Generalisierte Epilepsie mit Fieberkrämpfen plus Typ 1 und 2; Schwere X-chromosomale myotubuläre Myopathie; Kurzes QT-Syndrom 3; Kleinwuchs mit unspezifischen Skelettanomalien; Kleinwuchs, Gehörgangsatresie, Unterkieferhypoplasie, Skelettanomalien; Kleinwuchs, Onychodysplasie, Gesichtsdysmorphie und Hypotrichose; Ursprünglicher Zwergwuchs; Kurzrippen-Thoraxdysplasie 11 oder 3 mit oder ohne Polydaktylie; Sialidose Typ I und II; Silberspastisches Paraplegie-Syndrom; Verlangsamte Nervenleitgeschwindigkeit, autosomal-dominant; Smith-Lemli-Opitz-Syndrom; Snyder-Robinson-Syndrom; somatotropes Adenom; Prolaktinom; familiäre, Hypophysenadenom-Veranlagung; Sotos-Syndrom 1 oder 2; Spastische Ataxie 5, autosomal-rezessiv, Charlevoix-Saguenay-Typ, 1,10 oder 11, autosomal-rezessiv; Amyotrophe Lateralsklerose Typ 5; Spastische Paraplegie 15, 2, 3, 35, 39, 4, autosomal-dominant, 55, autosomal-rezessiv und 5A; Gallensäuresynthesedefekt, angeboren, 3; Spermatogenes Versagen 11, 3 und 8; Sphärozytose Typ 4 und 5; Sphäroid-Körper-Myopathie; Spinale Muskelatrophie, untere Extremität überwiegend 2, autosomal-dominant; Spinale Muskelatrophie, Typ II; Spinozerebelläre Ataxie 14, 21, 35, 40 und 6; Spinozerebelläre Ataxie autosomal-rezessiv 1 und 16; Milzhypoplasie; Spondylokarpotarsales Synostose-Syndrom; Spondylocheirodysplasie, Ehlers-Danlos-Syndrom-ähnlich, mit Immundysregulation, Aggrecan-Typ, mit angeborenen Gelenkluxationen, kurzer Gliedmaßen-Hand-Typ, Sedaghatian-Typ, mit Zapfen-Stäbchen-Dystrophie und Kozlowski-Typ; Parastremmatischer Zwergwuchs; Stargardt-Krankheit 1; Kegel-Stäbchen-Dystrophie 3; Stickler-Syndrom Typ 1; Kniest-Dysplasie; Stickler-Syndrom, Typ 1 (nicht-syndromales Auge) und 4; Stichassoziierte Vaskulopathie, infantiler Beginn; Stormorken-Syndrom; Sturge-Weber-Syndrom, kapillare Fehlbildungen, angeboren, 1; Succinyl-CoA-Acetoacetat-Transferase-Mangel; Saccharase-Isomaltase-Mangel; Plötzlichen Kindstod; Sulfitoxidase-Mangel, isoliert; supravalvare Aortenstenose; Dysfunktion des Tensidstoffwechsels, pulmonal, 2 und 3; Symphalangismus, proximal, 1b; Syndaktylie Typ Cenani Lenz; Syndaktylie Typ 3; Syndromische X-chromosomale geistige Behinderung 16; Talipes Equinovarus; Tangier-Krankheit; TARP-Syndrom; Tay-Sachs-Krankheit, B1-Variante, Gm2-Gangliosidose (Erwachsene), Gm2-Gangliosidose (Erwachsenenbeginn); Temtamy-Syndrom; Tenorio-Syndrom; Terminale knöcherne Dysplasie; Testosteron-17-beta-Dehydrogenase-Mangel; Tetraamelie, autosomal-rezessiv; Fallot-Tetralogie; Hypoplastisches Linksherzsyndrom 2; Truncus arteriosus; Fehlbildung des Herzens und der großen Gefäße; Ventrikelseptumdefekt 1; Thiel-Behnke-Hornhautdystrophie; Thoraxaortenaneurysmen und Aortendissektionen; Marfanoider Habitus; Drei-M-Syndrom 2; Thrombozytopenie, Thrombozytendysfunktion, Hämolyse und unausgewogene Globinsynthese; Thrombozytopenie, X-chromosomal; Thrombophilie, erblich, aufgrund von Protein-C-Mangel, autosomal-dominant und rezessiv; Schilddrüsen-Agenesie; Schilddrüsenkrebs, follikulär; Schilddrüsenhormonstoffwechsel, abnormal; Schilddrüsenhormonresistenz, generalisiert, autosomal-dominant; Thyreotoxische periodische Paralyse und Thyreotoxische periodische Paralyse 2; Thyrotropin-Releasing-Hormon-Resistenz, generalisiert; Timothy-Syndrom; TNF-Rezeptor-assoziiertes periodisches Fiebersyndrom (TRAPS); Zahnagenesie, selektiv, 3 und 4; Torsades de pointes; Townes-Brocks-branchiootorenalähnliches Syndrom; Vorübergehende bullöse Dermolyse des Neugeborenen; Treacher-Collins-Syndrom 1; Trichomegalie mit geistiger Behinderung, Zwergwuchs und Pigmentdegeneration der Netzhaut; Trichorhinophalangeale Dysplasie Typ I; Trichorhinophalangeales Syndrom Typ 3; Trimethylaminurie; Syndrom der tuberösen Sklerose; Lymphangiomyomatose; Tuberöse Sklerose 1 und 2; Tyrosinase-negativer okulokutaner Albinismus; Tyrosinase-positiver okulokutaner Albinismus; Tyrosinämie Typ I; UDP-Glucose-4-Epimerase-Mangel; Ullrich angeborene Muskeldystrophie; Fehlen von Ulna und Fibula bei schwerem Gliedmaßenmangel; Upshaw-Schulman-Syndrom; Urocanathydratase-Mangel; Usher-Syndrom, Typ 1, 1B, 1D, 1G, 2A, 2C und 2D; Retinitis pigmentosa 39; UV-sensitives Syndrom; Van-der-Woude-Syndrom; Van-Maldergem-Syndrom 2; Hennekam-Lymphangiektasie-Lymphödem-Syndrom 2; Variegate-Porphyrie; Ventrikulomegalie mit zystischer Nierenerkrankung; Verheij-Syndrom; Mangel an sehr langkettiger Acyl-CoA-Dehydrogenase; vesikoureteraler Reflux 8; Viszerale Heterotaxie 5, autosomal; Viszerale Myopathie; Vitamin-D-abhängige Rachitis, Typ 1 und 2; Vitelliforme Dystrophie; von Willebrand-Krankheit Typ 2M und Typ 3; Waardenburg-Syndrom Typ 1, 4C und 2E (mit neurologischer Beteiligung); Klein-Waardenberg-Syndrom; angeborene Muskeldystrophie Walker-Warburg; Warburg-Mikrosyndrom 2 und 4; Warzen, Hypogammaglobulinämie, Infektionen und Myelokathexis; Weaver-Syndrom; Weill-Marchesani-Syndrom 1 und 3; Weill-Marchesani-ähnliches Syndrom; Weißenbacher-Zweymüller-Syndrom; Werdnig-Hoffmann-Krankheit; Charcot-Marie-Tooth-Krankheit; Werner-Syndrom; WFS1-bezogene Störungen; Wiedemann-Steiner-Syndrom; Wilson-Krankheit; Wolfram-ähnliches Syndrom, autosomal-dominant; Wert Krankheit; Van-Buchem-Krankheit Typ 2; Xeroderma pigmentosum, Komplementierungsgruppe b, Gruppe D, Gruppe E und Gruppe G; X-chromosomale Agammaglobulinämie; X-chromosomale hereditäre motorische und sensorische Neuropathie; X-chromosomale Ichthyose mit Steryl-Sulfatase-Mangel; X-chromosomale periventrikuläre Heterotopie; Oto-palato-digitales Syndrom, Typ I; X-chromosomal schwere kombinierte Immunschwäche; Zimmermann-Laband-Syndrom und Zimmermann-Laband-Syndrom 2; und Zonulärer pulverförmiger Katarakt 3.
  • Die Target-Nukleotidsequenz kann eine targetsequenz (z. B. eine Punktmutation) umfassen, die mit einer Krankheit, Störung oder einem Zustand verbunden ist. Die Targetsequenz kann eine T zu C- (oder A zu G-) Punktmutation umfassen, die mit einer Krankheit, Störung oder einem Zustand verbunden ist, und wobei die Desaminierung der mutierten C-Base zu einer durch Fehlpaarungsreparatur vermittelten Korrektur einer Sequenz führt, die nicht assoziiert ist mit einer Krankheit, Störung oder einem Zustand. Die Targetsequenz kann eine G zu A- (oder C zu T-) Punktmutation umfassen, die mit einer Krankheit, Störung oder einem Zustand verbunden ist, und wobei die Desaminierung der mutierten A-Base zu einer durch Fehlpaarungsreparatur vermittelten Korrektur einer Sequenz führt, die nicht assoziiert ist mit einer Krankheit, Störung oder einem Zustand. Die Targetsequenz kann ein Protein kodieren, und wobei die Punktmutation in einem Codon ist und zu einer Änderung der Aminosäure führt, die durch das mutierte Codon im Vergleich zu einem Wildtyp-Codon kodiert wird. Die Targetsequenz kann sich auch an einer Spleiß-Site befinden und die Punktmutation zu einer Änderung beim Spleißen eines mRNA-Transkripts im Vergleich zu einem Wildtyp-Transkript führen. Außerdem kann sich das Target an einer nicht-kodierenden Sequenz eines Gens befinden, wie beispielsweise einem Promotor, und die Punktmutation zu einer erhöhten oder verringerten Expression des Gens führen.
  • Somit führt in einigen Aspekten die Desaminierung einer Mutante C zu einer Änderung der Aminosäure, die durch das mutierte Codon kodiert wird, was in einigen Fällen zur Expression einer Wildtyp-Aminosäure führen kann. In anderen Aspekten führt die Desaminierung einer Mutante A zu einer Änderung der Aminosäure, die durch das mutierte Codon kodiert wird, was in einigen Fällen zur Expression einer Wildtyp-Aminosäure führen kann.
  • Die hierin beschriebenen Verfahren, die das Kontaktieren einer Zelle mit einer Zusammensetzung oder einem rAAV-Partikel beinhalten, können in vitro, ex vivo oder in vivo erfolgen. In bestimmten Ausführungsformen erfolgt der Schritt des Kontaktierens in einem Subjekt. In bestimmten Ausführungsformen wurde bei dem Subjekt eine Krankheit, Störung oder ein Zustand diagnostiziert.
  • In einigen Ausführungsformen beinhalten die hierin offenbarten Verfahren das Kontaktieren einer Säugetierzelle mit einer Zusammensetzung oder einem rAAV-Partikel. In bestimmten Ausführungsformen beinhalten die Verfahren das Kontaktieren einer Netzhautzelle, Kortikaliszelle oder Kleinhirnzelle.
  • Das Split-Cas9-Protein oder der Split-Prime Editor, der unter Verwendung der hierin beschriebenen Verfahren geliefert wird, weist vorzugsweise eine vergleichbare Aktivität im Vergleich zum ursprünglichen Cas9-Protein oder Prime Editor auf (d. h. ungeteiltes Protein, das an eine Zelle geliefert oder in einer Zelle als Ganzes exprimiert wird). Zum Beispiel erhält das Split-Cas9-Protein oder der Split-Prime Editor mindestens 50 % (z. B. mindestens 50 %, mindestens 60 %, mindestens 70 %, mindestens 80 %, mindestens 90 %, mindestens 95 %, mindestens 98%, mindestens 99% oder 100%) der Aktivität des ursprünglichen Cas9-Proteins oder Prime Editors. In einigen Ausführungsformen ist das Split-Cas9-Protein oder der Split-Prime Editor aktiver (z. B. 2-fach, 5-fach, 10-fach, 100-fach, 1000-fach oder mehr) als das eines ursprünglichen Cas9-Proteins oder -Prime Editors.
  • Die hierin beschriebenen Zusammensetzungen können einem Patienten, der diese benötigt, in einer therapeutisch wirksamen Menge verabreicht werden, um eine Krankheit oder Störung zu behandeln und/oder zu verhindern, an der der Patient leidet. Jede Krankheit oder Störung, die mit CRISPR/Cas9-basierter Genom Editing-Technologie behandelt und/oder verhindert werden kann, kann durch das hier beschriebene Split-Cas9-Protein oder den Split-Prime Editor behandelt werden. Es versteht sich, dass, wenn die Nukleotidsequenzen, die das Split-Cas9-Protein oder den Prime Editor kodieren, nicht weiter eine gRNA kodieren, ein separater Nukleinsäurevektor, der die gRNA kodiert, kann zusammen mit den hierin beschriebenen Zusammensetzungen verabreicht werden.
  • Beispielhafte geeignete Krankheiten, Störungen oder Zustände umfassen, ohne darauf beschränkt zu sein, die Krankheit oder Störung ausgewählt aus der Gruppe bestehend aus: Mukoviszidose, Phenylketonurie, epidermolytische Hyperkeratose (EHK), chronisch obstruktive Lungenerkrankung (chronic obstructive pulmonary disease - COPD), Charcot-Marie-Toot-Krankheit Typ 4J , Neuroblastom (NB), von Willebrand-Krankheit (von Willebrand disease - vWD), angeborene Myotonie, hereditäre renale Amyloidose, dilatative Kardiomyopathie, hereditäres Lymphödem, familiäre Alzheimer-Krankheit, Prionenerkrankung, chronisches infantiles neurologisches kutanes Gelenksyndrom (chronic infantile neurologic cutaneous articular syndrome - CINCA), angeborene Taubheit, Niemann-Pick-Krankheit Typ C (NPC) und Desmin-bedingte Myopathie (desmin-related myopathy - DRM). In bestimmten Ausführungsformen handelt es sich bei der Krankheit oder dem Zustand um die Niemann-Pick-Krankheit Typ C (NPC).
  • In einigen Ausführungsformen ist die Krankheit, Störung oder der Zustand mit einer Punktmutation in einem NPC-Gen, einem DNMT1-Gen, einem PCSK9-Gen oder einem TMC1-Gen verbunden. In bestimmten Ausführungsformen ist die Punktmutation eine T3182C-Mutation in NPC, die zu einer I1061T-Aminosäuresubstitution führt.
  • In bestimmten Ausführungsformen ist die Punktmutation eine A545G-Mutation in TMC1, die zu einer Y182C-Aminosäuresubstitution führt. TMC1 kodiert ein Protein, das mechanosensitive Ionenkanäle in sensorischen Haarzellen des Innenohrs bildet und für eine normale Hörfunktion benötigt wird. Die Aminosäuresubstitution Y182C ist mit angeborener Taubheit verbunden.
  • In einigen Ausführungsformen ist die Krankheit, Störung oder der Zustand mit einer Punktmutation verbunden, die ein Stopcodon erzeugt, beispielsweise ein vorzeitiges Stopcodon innerhalb der kodierenden Region eines Gens.
  • Zu weiteren beispielhaften Erkrankungen, Störungen und Zuständen gehören Mukoviszidose (siehe z. B. Schwank et al., Functional Repair of CFTR by CRISPR/Cas9 in intestinal stem cell organoids of cystic fibrosis patients). Cell stem cell. 2013; 13: 653-658; and Wu et. al., Correction of a genetic disease in mouse via use of CRISPR-Cas9. Cell stem cell. 2013; 13: 659-662, keines von beiden verwendet ein Desaminase-Fusionsprotein, um den genetischen Defekt zu korrigieren); Phenylketonurie - z. B., Phenylalanin-Serin-Mutation an Position 835 (Maus) oder 240 (Mensch) oder ein homologer Rest im Phenylalanin-Hydroxylase-Gen (T>C-Mutation) - siehe z. B., McDonald et al., Genomics. 1997; 39:402-405; Bernard-Soulier syndrome (BSS) - z. B., Mutation von Phenylalanin zu Serin an Position 55 oder einem homologen Rest oder Cystein zu Arginin an Rest 24 oder einem homologen Rest im Thrombozytenmembran-Glykoprotein IX (T>C-Mutation) - siehe, z. B., Noris et al., British Journal of Haematology. 1997; 97: 312-320, und Ali et al., Hematol. 2014; 93: 381-384; epidermolytische Hyperkeratose (EHK) - z. B. Leucin-zu-Prolin-Mutation an Position 160 oder 161 (bei Zählung des Initiator-Methionins) oder ein homologer Rest in Keratin 1 (T>C-Mutation) - siehe, z. B., Chipev et al., Cell. 1992; 70: 821-828, siehe auch Zugangsnummer P04264 in der UNIPROT-Datenbank unter www[dot]uniprot[dot]org; Chronisch obstruktive Lungenerkrankung (COPD) - z. B. Mutation von Leucin zu Prolin an Position 54 oder 55 (wenn das Initiator-Methionin gezählt wird) oder ein homologer Rest in prozessierter Form von α1-Antitrypsin oder Rest 78 in unprozessierter Form oder ein homologer Rest (T>C-Mutation) - siehe, z. B., Poller et al., Genomics. 1993; 17: 740-743, siehe auch Zugangsnummer P01011 in der UNIPROT-Datenbank; Charcot-Marie-Toot-Krankheit Typ 4J - z. B. Isoleucin-Threonin-Mutation an Position 41 oder ein homologer Rest in 4 (T>C-Mutation) - siehe, z. B., Lenk et al., PLoS Genetics. 2011; 7: e1002104; Neuroblastom (NB) - z. B. Leucin-zu-Prolin-Mutation an Position 197 oder ein homologer Rest in Caspase-9 (T>C-Mutation) - siehe, z. B., Kundu et al., 3 Biotech. 2013, 3:225-234; von-Willebrand-Krankheit (vWD) - z. B. Cystein-Arginin-Mutation an Position 509 oder ein homologer Rest in der prozessierten Form des von-Willebrand-Faktors oder an Position 1272 oder ein homologer Rest in der unprozessierten Form des von-Willebrand-Faktors (T>C-Mutation) - siehe, z. B., Lavergne et al., Br. J. Haematol. 1992, siehe auch Zugangsnummer P04275 in der UNIPROT-Datenbank; 82: 66-72; Angeborene Myotonie - z. B. Cystein-Arginin-Mutation an Position 277 oder ein homologer Rest im Muskelchloridkanal-Gen CLCN1 (T>C-Mutation) - siehe, z. B., Weinberger et al., The J. of Physiology. 2012; 590: 3449-3464; hereditäre renale Amyloidose - z. B. Stoppcodon-zu-Arginin-Mutation an Position 78 oder ein homologer Rest in der prozessierten Form von Apolipoprotein AII oder an Position 101 oder ein homologer Rest in der nicht prozessierten Form (T>C-Mutation) - siehe, z. B., Yazaki et al., Kidney Int. 2003; 64: 11-16; dilatative Kardiomyopathie (DCM) - z. B. Tryptophan-Arginin-Mutation an Position 148 oder ein homologer Rest im FOXD4-Gen (T>C-Mutation), siehe, z. B., Minoretti et. al., Int. J. of Mol. Med. 2007; 19: 369-372; hereditäres Lymphödem - z. B. Histidin-Arginin-Mutation an Position 1035 oder ein homologer Rest in der VEGFR3-Tyrosinkinase (A>G-Mutation), siehe, z. B., Irrthum et al., Am. J. Hum. Genet. 2000; 67: 295-301; familiäre Alzheimer-Krankheit - z. B. Isoleucin-zu-Valin-Mutation an Position 143 oder ein homologer Rest in Presenilin1 (A>G-Mutation), siehe, z. B., Gallo et. al., J. Alzheimer's disease. 2011; 25: 425-431; Prionenerkrankung - z. B. Methionin-zu-Valin-Mutation an Position 129 oder ein homologer Rest im Prionprotein (A>G-Mutation) - siehe, z. B., Lewis et. al., J. of General Virology. 2006; 87: 2443-2449; Chronisches infantiles neurologisches kutanes Gelenksyndrom (CINCA) - z. B. Tyrosin-Cystein-Mutation an Position 570 oder ein homologer Rest in Cryopyrin (A>G-Mutation) - siehe, z. B., Fujisawa et. al. Blood. 2007; 109: 2903-2911; und Desmin-bedingte Myopathie (DRM) - z. B. Arginin-zu-Glycin-Mutation an Position 120 oder ein homologer Rest in αβ-Kristallin (A>G-Mutation) - siehe, z. B., Kumar et al., J. Biol. Chem. 1999; 274: 24137-24141. Der gesamte Inhalt aller Referenzen und Datenbankeinträge wird hier durch Bezugnahme aufgenommen.
  • Trinukleotid-Repeat-Expansion-Krankheit
  • Die Trinukleotid-Repeat-Expansion wird mit einer Reihe von menschlichen Krankheiten in Verbindung gebracht, darunter die Huntington-Krankheit, das Fragile-X-Syndrom und die Friedreich-Ataxie. Das häufigste Trinukleotid-Repeat enthält CAG-Tripletts, obwohl auch GAA-Tripletts (Friedreich-Ataxie) und CGG-Tripletts (Fragile-X-Syndrom) vorkommen. Die Vererbung einer Veranlagung zur Expansion oder der Erwerb eines bereits expandierten elterlichen Allels erhöht die Wahrscheinlichkeit, die Krankheit zu erwerben. Pathogene Expansionen von Trinukleotid-Wiederholungen könnten hypothetisch unter Verwendung von Prime Editing korrigiert werden.
  • Eine Region stromaufwärts der Repeat-Region kann von einer RNA-gesteuerten Nuklease gespalten und dann verwendet werden, um die Synthese eines neuen DNA-Strangs zu starten, der eine gesunde Anzahl von Repeats enthält (die von dem jeweiligen Gen und der jeweiligen Krankheit abhängt), in Übereinstimmung mit den allgemeinen Mechanismus, der umrissen ist in 1G oder 22. Nach der Wiederholungssequenz wird ein kurzer Homologieabschnitt hinzugefügt, der mit der Identität der Sequenz neben dem anderen Ende der Wiederholung (roter Strang) übereinstimmt. Die Invasion des neu synthetisierten Strangs durch das TPRT-System und der anschließende Austausch der endogenen DNA durch den neu synthetisierten Flap führt zu einem kontrahierten Repeat-Allel. Der Begriff „kontrahiert“ bezieht sich auf eine Verkürzung der Länge der Nukleotid-Wiederholungsregion, was zu einer Reparatur der Trinukleotid-Wiederholungsregion führt.
  • Das hierin beschriebene Prime Editing-System oder Prime Editing-(PE)-System kann verwendet werden, um Trinukleotid-Repeat-Mutationen (oder „Triplett-Expansions-Erkrankungen“) zur Behandlung von Zuständen wie der Huntington-Krankheit und anderen Trinukleotid-Repeat-Erkrankungen zu kontrahieren. Trinukleotid-Repeat-Expansionsstörungen sind komplexe, fortschreitende Störungen, die die Entwicklungsneurobiologie betreffen und häufig die Kognition sowie sensomotorische Funktionen beeinträchtigen. Die Störungen zeigen eine genetische Antizipation (d. h. eine Zunahme des Schweregrades mit jeder Generation). Die DNA-Erweiterungen oder -Kontraktionen erfolgen normalerweise meiotisch (d. h. während der Gametogenese oder früh in der Embryonalentwicklung) und haben oft einen Sex-Bias, was bedeutet, dass einige Gene nur durch das Weibchen, andere nur durch das Männchen vererbt werden. Beim Menschen können Trinukleotid-Repeat-Expansionsstörungen entweder auf Transkriptions- oder Translationsebene Gen-Silencing verursachen, was die Genfunktion im Wesentlichen ausschaltet. Alternativ können Trinukleotid-Repeat-Expansionsstörungen veränderte Proteine verursachen, die mit großen repetitiven Aminosäuresequenzen erzeugt werden, die die Proteinfunktion entweder aufheben oder verändern, oft auf dominant-negative Weise (z. B. Polyglutamin-Erkrankungen).
  • Ohne an eine Theorie gebunden sein zu wollen, wird die Triplettexpansion durch Schlupf während der DNA-Replikation oder während der DNA-Reparatursynthese verursacht. Da die Tandem-Repeats untereinander identische Sequenzen aufweisen, kann die Basenpaarung zwischen zwei DNA-Strängen an mehreren Stellen entlang der Sequenz stattfinden. Dies kann zur Bildung von „Loop-out“-Strukturen während der DNA-Replikation oder DNA-Reparatursynthese führen. Dies kann zu einem wiederholten Kopieren der wiederholten Sequenz führen, wodurch die Anzahl der Wiederholungen erhöht wird. Zusätzliche Mechanismen, die hybride RNA:DNA-Zwischenprodukte beinhalten, wurden vorgeschlagen. Prime Editing kann verwendet werden, um diese Triplett-Expansionsregionen durch Deletion eines oder mehrerer der anstößigen Wiederholungscodontripletts zu reduzieren oder zu eliminieren. In einer Ausführungsform dieser Verwendung stellt 23 ein Schema eines PEgRNA-Designs zum Kontrahieren oder Reduzieren von Trinukleotid-Wiederholungssequenzen mit Prime Editing bereit.
  • Prime Editing kann implementiert werden, um Triplett-Expansionsregionen zu kontrahieren, indem man eine Region stromaufwärts der Triplett-Repeat-Region mit dem Prime Editor schneidet, der eine PEgRNA umfasst, die auf die Schnittstelle ausgerichtet ist. Der Prime Editor synthetisiert dann einen neuen DNA-Strang (ssDNA-Flap) basierend auf der PEgRNA als Template (d. h. das Edit-template davon), das eine gesunde Anzahl von Triplett-Wiederholungen kodiert (was von dem jeweiligen Gen und der jeweiligen Krankheit abhängt). Der neu synthetisierte ssDNA-Strang, der die gesunde Triplett-Wiederholungssequenz umfasst, wird auch so synthetisiert, dass er einen kurzen Homologieabschnitt (d. h. den Homologiearm) umfasst, der mit der Sequenz neben dem anderen Ende der Wiederholung (roter Strang) übereinstimmt. Die Invasion des neu synthetisierten Strangs und der anschließende Austausch der endogenen DNA durch den neu synthetisierten ssDNA-Flap führt zu einem kontrahierten Repeat-Allel.
  • Abhängig von der jeweiligen Trinukleotid-Expansionsstörung können die defektinduzierenden Triplett-Expansionen in „Trinukleotid-Repeat-Expansionsproteinen“ auftreten. Trinukleotid-Repeat-Expansionsproteine sind ein vielfältiger Satz von Proteinen, die mit der Anfälligkeit für die Entwicklung einer Trinukleotid-Repeat-Expansionsstörung, dem Vorliegen einer Trinukleotid-Repeat-Expansionsstörung, der Schwere einer Trinukleotid-Repeat-Expansionsstörung oder einer beliebigen Kombination davon verbunden sind. Trinukleotid-Repeat-Expansionsstörungen werden in zwei Kategorien unterteilt, die durch die Art der Wiederholung bestimmt werden. Die häufigste Wiederholung ist das Triplett CAG, das, wenn es in der kodierenden Region eines Gens vorhanden ist, die Aminosäure Glutamin (Q) kodiert. Daher werden diese Störungen als Polyglutamin (polyQ)-Störungen bezeichnet und umfassen die folgenden Krankheiten: Huntington-Krankheit (Huntington Disease - HD); Spinobulbäre Muskelatrophie (Spinobulbar Muscular Atrophy - SBMA); Spinozerebelläre Ataxien (Spinocerebellar Ataxias - SCA-Typen 1, 2, 3, 6, 7 und 17); und Dentatorubro-Pallidoluysian Atrophie (DRPLA). Die verbleibenden Trinukleotid-Repeat-Expansionsstörungen betreffen entweder nicht das CAG-Triplett oder das CAG-Triplett befindet sich nicht in der kodierenden Region des Gens und werden daher als Nicht-Polyglutamin-Störungen bezeichnet. Die Nicht-Polyglutamin-Störungen umfassen das Fragile-X-Syndrom (FRAXA); Fragile XE Mental Retardation (FRAXE); Friedreich-Ataxie (FRDA); Myotone Dystrophie (DM); und Spinozerebelläre Ataxien (SCA-Typen 8 und 12).
  • Die Proteine, die mit Trinukleotid-Repeat-Expansionsstörungen assoziiert sind, können basierend auf einer experimentellen Assoziation des Proteins, das mit einer Trinukleotid-Repeat-Expansionsstörung assoziiert ist, zu einer Trinukleotid-Repeat-Expansionsstörung ausgewählt werden. Zum Beispiel kann die Produktionsrate oder zirkulierende Konzentration eines Proteins, das mit einer Trinukleotid-Repeat-Expansionsstörung assoziiert ist, in einer Population mit einer Trinukleotid-Repeat-Expansionsstörung relativ zu einer Population, der die Trinukleotid-Repeat-Expansionsstörung fehlt, erhöht oder erniedrigt sein. Unterschiede in den Proteinspiegeln können unter Verwendung proteomischer Techniken bewertet werden, einschließlich, aber nicht beschränkt auf Western Blot, immunhistochemische Färbung, Enzyme-Linked Immunosorbent Assay (ELISA) und Massenspektrometrie. Alternativ können die Proteine, die mit Trinukleotid-Repeat-Expansionsstörungen assoziiert sind, identifiziert werden, indem Genexpressionsprofile der Gene, die die Proteine kodieren, unter Verwendung genomischer Techniken erhalten werden, einschließlich, aber nicht beschränkt auf DNA-Mikroarray-Analyse, serielle Analyse der Genexpression (SAGE) und quantitative Echtzeit Polymerase-Kettenreaktion (Q-PCR).
  • Nicht einschränkende Beispiele für Proteine, die mit Trinukleotid-Repeat-Expansionsstörungen assoziiert sind und durch Prime Editing korrigiert werden können, umfassen AR (Androgenrezeptor), FMR1 (fragile X mentale Retardation 1), HTT (Huntingtin), DMPK (Dystrophia myotonica-Proteinkinase), FXN (Frataxin), ATXN2 (Ataxin 2), MED15 (Mediatorkomplex-Untereinheit 15), ATXN1 (Ataxin 1), ATXN3 (Ataxin 3), TBP (TATA-Box-Bindungsprotein), CACNA1A (Calciumkanal, spannungsabhängig, P/Q-Typ, alpha 1A-Untereinheit), ATXN80S (ATXN8-Gegenstrang (nicht proteinkodierend)), PPP2R2B (Proteinphosphatase 2, regulatorische Untereinheit B, Beta), ATXN7 (Ataxin 7), TNRC6B (Trinukleotid-Wiederholung mit 6B), TNRC6C (Trinukleotid-Wiederholung mit 6C), CELF3 (CUGBP, Elav-ähnliches Familienmitglied 3), MAB21L1 (mab-21-like 1 (C. elegans)), MSH2 (mutS-Homolog 2, Dickdarmkrebs, nonpo Lyposis Typ 1 (E. coli)), TMEM185A (Transmembranprotein 185A), SIX5 (SIX Homöobox 5), CNPY3 (Canopy 3-Homolog (Zebrafisch)), FRAXE (fragile Stelle, Folsäuretyp, selten, fra(X) (q28) E), GNB2 (Guaninnukleotid-bindendes Protein (G-Protein), Beta-Polypeptid 2), RPL14 (ribosomales Protein L14), ATXN8 (Ataxin 8), INSR (Insulinrezeptor), TTR (Transthyretin), EP400 (E1A-bindendes Protein p400), GIGYF2 (GRB10 interagierendes GYF-Protein 2), OGG1 (8-Oxoguanin-DNA-Glykosylase), STC1 (Stanniocalcin 1), CNDP1 (Carnosindipeptidase 1 (Metallopeptidase M20-Familie)), C10orf2 (Chromosom 10 offener Leseraster 2), MAML3 Mastermind-like 3 (Drosophila .)), DKC1 (Dyskeratosis congenita 1, Dyskerin), PAXIP1 (PAX interagierendes (mit Transkriptions-Aktivierungsdomäne) Protein 1), CASK (Calcium/Calmodulinabhängige Serinproteinkinase (MAGUK-Familie)), MAPT (Mikrotubuliassoziiertes Protein Tau), SP1 (Sp1-Transkriptionsfaktor), POLG (Polymerase (DNA-gerichtet), Gamma), AFF2 (AF4/FMR2-Familie, Mitglied 2), THBS1 (Thrombospondin 1), TP53 (Tumo r-Protein p53), ESR1 (Östrogenrezeptor 1), CGGBP1 (CGG-Triplett-Repeat-Bindungsprotein 1), ABT1 (Aktivator der basalen Transkription 1), KLK3 (Kallikrein-related Peptidase 3), PRNP (Prionprotein), JUN (Jun Onkogen), KCNN3 (Kalium-Intermediat/Kalzium-aktivierter Kanal mit geringer Leitfähigkeit, Unterfamilie N, Mitglied 3), BAX (BCL2-assoziiertes X-Protein), FRAXA (fragile Stelle, FolsäureTyp, selten, fra(X) (q27. 3) A (Makroorchismus, geistige Behinderung)), KBTBD10 (Kelch-Repeat und BTB (POZ)-Domäne mit 10), MBNL1 (muskelblindartig (Drosophila)), RAD51 (RAD51-Homolog (RecA-Homolog, E. coli) (S. cerevisiae)), NCOA3 (nuklearer Rezeptor-Koaktivator 3), ERDA1 (erweiterte Wiederholungsdomäne, CAG/CTG 1), TSC1 (tuberöse Sklerose 1), COMP (Oligomeres Matrixprotein des Knorpels), GCLC (Glutamat-Cystein-Ligase, katalytische Untereinheit), RRAD (Ras-verwandt mit Diabetes), MSH3 (mutS-Homolog 3 (E. coli)), DRD2 (Dopaminrezeptor D2), CD44 (CD44-Molekül (indische Blutgruppe)), CTCF (CCCTC-bindender Faktor (Zinkfingerprotein) )), CCND1 (Cyclin D1), CLSPN (Claspin-Homolog (Xenopus laevis)), MEF2A (Myozyten-Enhancer-Faktor 2A), PTPRU (Protein-Tyrosin-Phosphatase, Rezeptortyp, U), GAPDH (Glyceraldehyd-3-Phosphat-Dehydrogenase), TRIM22 (dreiteiliges Motiv-enthaltend 22), WT1 (Wilms-Tumor 1), AHR (Aryl-Kohlenwasserstoff-Rezeptor), GPX1 (Glutathionperoxidase 1), TPMT (Thiopurin-S-Methyltransferase), NDP (Norrie-Krankheit (Pseudogliom)), ARX (aristaless related .) Homöobox), MUS81 (MUS81 Endonuklease-Homolog (S. cerevisiae)), TYR (Tyrosinase (okulokutaner Albinismus IA)), EGR1 (frühe Wachstumsreaktion 1), UNG (Uracil-DNA-Glykosylase), NUMBL (taubes Homolog (Drosophila)-like), FABP2 (Fettsäurebindendes Protein 2, intestinal), EN2 (engrailed homeobox 2), CRYGC (Crystallin, Gamma C), SRP14 (Signalerkennungspartikel 14 kDa (homologes Alu-RNA-Bindungsprotein)), CRYGB (Crystallin, Gamma B), PDCD1 (programmierter Zelltod 1), HOXA1 (Homöobox A1), ATXN2L (Ataxin 2-like), PMS2 (PMS2 postmeiotische Segregation erhöht 2 (S. cerevisiae)), GLA (Galactosidase, alpha), CBL (Cas-Br-M (murin) ecotropic retroviral transforming sequence), FTH1 (Ferritin, schweres Polypeptid 1), IL12RB2 (Interleukin-12-Rezeptor, Beta 2), OTX2 (Orthodentikel-Homöobox 2), HOXA5 (Homöobox A5), POLG2 (Polymerase (DNA-gerichtet), Gamma 2, akzessorische Untereinheit), DLX2 (distallose Homöobox 2), SIRPA (signalregulatorisches Protein alpha), OTX1 (orthodentikuläre Homöobox 1), AHRR (Aryl-Kohlenwasserstoff-Rezeptor-Repressor), MANF (Mesencephalic Astrocyte-derived neurotrophic factor), TMEM158 (Transmembranprotein 158 (Gen/Pseudogen)) und ENSG00000078687.
  • In einem besonderen Aspekt stellt die vorliegende Offenbarung TPRT-basierte Verfahren zur Behandlung eines Patienten bereit, bei dem eine Expansions-Repeat-Störung diagnostiziert wurde (auch bekannt als eine Repeat-Expansions-Störung oder eine Trinukleotid-Repeat-Störung). Expansions-Wiederholungsstörungen treten auf, wenn Mikrosatelliten-Wiederholungen über einen Schwellenwert hinaus expandieren. Derzeit wird angenommen, dass mindestens 30 genetische Krankheiten durch wiederholte Ausbreitung verursacht werden. Das wissenschaftliche Verständnis dieser vielfältigen Gruppe von Erkrankungen kam in den frühen 1990er Jahren mit der Entdeckung ans Licht, dass Trinukleotid-Wiederholungen mehreren wichtigen Erbkrankheiten zugrunde liegen, darunter Fragiles X, Spinale und Bulbäre Muskelatrophie, Myotone Dystrophie und Chorea Huntington (Nelson et al, „The unstable repeats - three evolving faces of neurological disease,“ Neuron, March 6, 2013, Vol.77; 825-843, which is incorporated herein by reference), sowie Haw-River-Syndrom, Jacobsen-Syndrom, Dentatorubral-Pallidoluysian-Atrophie (DRPLA), Machado-Joseph-Krankheit, Synpolydaktylie (SPD II), Hand-Fuß-Genitalsyndrom (HFGS), Kleidokranielle Dysplasie (CCD), Holoprosenzephalie-Erkrankung (HPE), Angeborenes zentrales Hypventilationssyndrom (CCHS), ARX-nicht-syndromale X-chromosomale geistige Behinderung (XLMR) und okulopharyngeale Muskeldystrophie (OPMD) (siehe. Es wurde festgestellt, dass die wiederholte Instabilität von Mikrosatelliten ein Kennzeichen dieser Bedingungen ist, ebenso wie die Antizipation - das Phänomen, bei dem mit jeder nachfolgenden Generation eine Wiederholungsexpansion auftreten kann, was zu einem schwereren Phänotyp und einem früheren Erkrankungsalter bei den Nachkommen führt. Es wird angenommen, dass wiederholte Expansionen über verschiedene Mechanismen Krankheiten verursachen. Expansionen können nämlich die zelluläre Funktion auf der Ebene des Gens, des mRNA-Transkripts und/oder des kodierten Proteins beeinträchtigen. Unter einigen Bedingungen wirken Mutationen über einen Funktionsverlustmechanismus, indem sie Wiederholungsgene stummschalten. In anderen Fällen resultieren die Erkrankungen aus Gain-of-Function-Mechanismen, bei denen entweder das mRNA-Transkript oder das Protein neue, abweichende Funktionen übernimmt.
  • In einer Ausführungsform ist ein Verfahren zur Behandlung einer Trinukleotid-Repeat-Störung dargestellt in 23. Im Allgemeinen beinhaltet der Ansatz die Verwendung von TPRT Genom Editing (d. h. Prime Editing) in Kombination mit einer erweiterten gRNA, die eine Region umfasst, die eine gewünschte und gesunde Ersatz-Trinukleotid-Wiederholungssequenz kodiert, die die endogene kranke Trinukleotid-Wiederholungssequenz durch den Mechanismus des Hauptbearbeitungsprozesses ersetzen soll. Ein Schema eines beispielhaften gRNA-Designs zum Kontrahieren von Trinukleotid-Repeat-Sequenzen und Trinukleotid-Repeat-Kontraktion mit TPRT-Genom-Editierung (d. h. Prime Editing) ist gezeigt in 23.
  • Prionenerkrankung
  • Prime Editing kann auch verwendet werden, um das Fortschreiten der Prionenerkrankung zu verhindern oder zu stoppen, indem eine oder mehrere schützende Mutationen in Prionenproteine (PRNP) eingebaut werden, die im Verlauf der Krankheit fehlgefaltet werden. Prionenerkrankungen oder übertragbare spongiforme Enzephalopathien (transmissible spongiform encephalopathies - TSE) sind eine Familie seltener progressiver neurodegenerativer Erkrankungen, die sowohl Menschen als auch Tiere betreffen. Sie zeichnen sich durch lange Inkubationszeiten, charakteristische spongiforme Veränderungen, die mit neuronalem Verlust verbunden sind, und ein Versagen, eine Entzündungsreaktion auszulösen, aus.
  • Beim Menschen umfasst die Prionerkrankung die Creutzfeldt-Jakob-Krankheit (Creutzfeldt-Jakob Disease - CJD), die Variante der Creutzfeldt-Jakob-Krankheit (Variant Creutzfeldt-Jakob Disease - vCJD), das Gerstmann-Straussler-Scheinker-Syndrom, die tödliche familiäre Schlaflosigkeit und Kuru. Bei Tieren umfasst die Prionenerkrankung die bovine spongiforme Enzephalopathie (BSE oder „Rinderwahnsinn“), die chronische Auszehrungskrankheit (Chronic Wasting Disease - CWD), Scrapie, die übertragbare Nerz-Enzephalopathie, die feline spongiforme Enzephalopathie und die ungulate spongiforme Enzephalopathie. Prime Editing kann verwendet werden, um schützende Punktmutationen in ein Prionenprotein zu installieren, um das Fortschreiten einer dieser Prionenkrankheiten zu verhindern oder zu stoppen.
  • Die klassische CJD ist eine menschliche Prionenerkrankung. Es handelt sich um eine neurodegenerative Erkrankung mit charakteristischen klinischen und diagnostischen Merkmalen. Diese Krankheit ist schnell fortschreitend und immer tödlich. Eine Infektion mit dieser Krankheit führt in der Regel innerhalb von 1 Jahr nach Krankheitsbeginn zum Tod. CJD ist eine schnell fortschreitende, ausnahmslos tödliche neurodegenerative Erkrankung, von der angenommen wird, dass sie durch eine abnormale Isoform eines zellulären Glykoproteins, das als Prionprotein bekannt ist, verursacht wird. CJD tritt weltweit auf und die geschätzte jährliche Inzidenz in vielen Ländern, einschließlich der Vereinigten Staaten, wird mit etwa einem Fall pro Million Einwohner angegeben. Die überwiegende Mehrheit der CJD-Patienten stirbt normalerweise innerhalb eines Jahres nach Krankheitsbeginn. CJD wird zusammen mit anderen Prionenerkrankungen, die bei Mensch und Tier vorkommen, als übertragbare spongiforme Enzephalopathie (TSE) klassifiziert. Bei etwa 85 % der Patienten tritt CJD als sporadische Erkrankung ohne erkennbares Übertragungsmuster auf. Ein geringerer Anteil der Patienten (5 bis 15 %) entwickelt CJD aufgrund von vererbten Mutationen des Prionprotein-Gens. Zu diesen Erbformen gehören das Gerstmann-Straussler-Scheinker-Syndrom und die tödliche familiäre Schlaflosigkeit. Derzeit ist keine Behandlung für CJD bekannt.
  • Die Variante Creutzfeldt-Jakob-Krankheit (vCJD) ist eine Prionenerkrankung, die erstmals 1996 im Vereinigten Königreich beschrieben wurde. Es gibt inzwischen starke wissenschaftliche Beweise dafür, dass der Erreger, der für den Ausbruch der Prionenerkrankung bei Kühen, der bovinen spongiformen Enzephalopathie (BSE oder „Rinderwahn“), derselbe Erreger ist, der für den Ausbruch der vCJD beim Menschen verantwortlich ist. Die variante CJD (vCJD) ist nicht dieselbe Krankheit wie die klassische CJD (oft einfach CJD genannt). Sie hat andere klinische und pathologische Merkmale als die klassische CJD. Jede Erkrankung weist ebenso ein bestimmtes genetisches Profil des Prionprotein-Gens auf. Beide Erkrankungen sind ausnahmslos tödliche Hirnerkrankungen mit ungewöhnlich langen Inkubationszeiten, gemessen in Jahren, und werden durch einen unkonventionellen übertragbaren Erreger namens Prion verursacht. Derzeit ist keine Behandlung für vCJD bekannt.
  • BSE (bovine spongiforme Enzephalopathie oder „Rinderwahnsinn“) ist eine fortschreitende neurologische Erkrankung von Rindern, die aus einer Infektion mit einem ungewöhnlichen übertragbaren Erreger namens Prion resultiert. Die Natur des übertragbaren Mittels wird nicht gut verstanden. Derzeit ist die am meisten akzeptierte Theorie, dass der Wirkstoff eine modifizierte Form eines normalen Proteins ist, das als Prionprotein bekannt ist. Aus noch nicht verstandenen Gründen geht das normale Prionprotein in eine pathogene (schädliche) Form über, die dann das Zentralnervensystem von Rindern schädigt. Es gibt zunehmend Hinweise darauf, dass es verschiedene BSE-Stämme gibt: den typischen oder klassischen BSE-Stamm, der für den Ausbruch im Vereinigten Königreich verantwortlich ist, und zwei atypische Stämme (H- und L-Stämme). Derzeit ist keine Behandlung für BSE bekannt.
  • Chronic Wasting Disease (CWD) ist eine Prionenkrankheit, die Hirsche, Elche, Rentiere, Sikahirsche und Elche befällt. Sie wurde in einigen Gebieten Nordamerikas entdeckt, darunter Kanada und die Vereinigten Staaten, Norwegen und Südkorea. Es kann über ein Jahr dauern, bis ein infiziertes Tier Symptome entwickelt, die drastischen Gewichtsverlust (Auszehrung), Stolpern, Antriebslosigkeit und andere neurologische Symptome umfassen können. CWD kann Tiere jeden Alters betreffen und einige infizierte Tiere können sterben, ohne die Krankheit jemals zu entwickeln. CWD ist für Tiere tödlich und es gibt keine Behandlungen oder Impfstoffe.
  • Als Erreger von TSE gelten Prionen. Der Begriff „Prionen“ bezieht sich auf abnormale, pathogene Erreger, die übertragbar und in der Lage sind, eine abnormale Faltung bestimmter normaler zellulärer Proteine, genannt Prionenproteine, die am häufigsten im Gehirn vorkommen, zu induzieren. Die Funktionen dieser normalen Prionenproteine werden noch nicht vollständig verstanden. Die abnormale Faltung der Prionenproteine führt zu Hirnschäden und den charakteristischen Anzeichen und Symptomen der Krankheit. Prionenerkrankungen sind gewöhnlich schnell fortschreitend und immer tödlich.
  • Wie hier verwendet, soll der Begriff „Prion“ ein infektiöses Partikel bedeuten, von dem bekannt ist, dass es bei Menschen und Tieren Krankheiten (spongiforme Enzephalopathien) verursacht. Der Begriff „Prion“ ist eine Kontraktion der Wörter „Protein“ und „Infektion“, und die Partikel bestehen größtenteils, wenn nicht ausschließlich, aus PRNPSc-Molekülen, die von einem PRNP-Gen kodiert werden, das PRNPC exprimiert, das seine Konformation ändert, um PRNPSc zu werden. Prionen unterscheiden sich von Bakterien, Viren und Viroiden. Bekannte Prionen umfassen solche, die Tiere infizieren, um Scrapie zu verursachen, eine übertragbare degenerative Erkrankung des Nervensystems von Schafen und Ziegen sowie bovine spongiforme Enzephalopathien (BSE) oder Rinderwahn und feline spongiforme Enzephalopathien bei Katzen. Vier Prionenerkrankungen, wie oben diskutiert, die bekanntermaßen den Menschen betreffen, sind (1) Kuru, (2) Creutzfeldt-Jakob-Krankheit (CJD), (3) Gerstmann-Strassler-Scheinker-Krankheit (GSS) und (4) tödliche familiäre Schlaflosigkeit (FFI). Wie hierin verwendet, schließt Prion alle Formen von Prionen ein, die alle oder irgendeine dieser Krankheiten oder andere bei allen verwendeten Tieren verursachen - und insbesondere bei Menschen und in domestizierten Nutztieren.
  • Im Allgemeinen und ohne an eine Theorie gebunden sein zu wollen, werden Vorerkrankungen durch Fehlfaltung von Prionenproteinen verursacht. Bei solchen Krankheiten - oft auch Ablagerungskrankheiten genannt - kann die Fehlfaltung der Prionenproteine wie folgt erklärt werden. Wenn A das normalerweise synthetisierte Genprodukt ist, das eine beabsichtigte physiologische Rolle in einem monomeren oder oligomeren Zustand ausübt, ist A* eine konformativ aktivierte Form von A, die kompetent ist, eine dramatische Konformationsänderung einzugehen, B ist der konformativ veränderte Zustand, der multimere Anordnungen (d. h. die fehlgefaltete Form, die Ablagerungen bildet) bevorzugt und Bn ist das multimere Material, das pathogen und relativ schwer zu recyceln ist. Bei den Prionenerkrankungen entsprechen PRNPC und PRNPSc den Zuständen A und Bn, wobei A weitgehend helixförmig und monomer und Bn β-reich und multimer ist.
  • Es ist bekannt, dass bestimmte Mutationen in Prionenproteinen mit einem erhöhten Risiko einer Vorerkrankung verbunden sein können. Umgekehrt können bestimmte Mutationen in Prionenproteinen schützender Natur sein. Siehe Bagynszky et al., „Characterization of mutations in PRNP (prion) gene and their possible roles in neurodegenerative disease“, Neuropsychiatr Dis Treat., 2018; 14: 2067-2085, deren Inhalt hierin durch Bezugnahme aufgenommen ist.
  • PRNP (NCBI RefSeq No. NP-000302.1 (Seq-ID-Nr: 291)) - das menschliche Prionenprotein - wird von einem 16 kb langen Gen kodiert, das sich auf Chromosom 20 (4686151-4701588) befindet. Es enthält zwei Exons, und das Exon 2 trägt den offenen Leserahmen, der das 253 Aminosäuren (AA) lange PrP-Protein codiert. Exon 1 ist ein nicht-kodierendes Exon, das als Transkriptionsinitiations-Site dienen kann. Die posttranslationalen Modifikationen führen zur Entfernung des ersten 22 AA N-terminalen Fragments (NTF) und des letzten 23 AA C-terminalen Fragments (CTF). Der NTF wird nach dem PrP-Transport zum endoplasmatischen Retikulum (ER) gespalten, während der CTF (Glycosylphosphatidylinositol [GPI] Signalpeptid [GPI-SP]) durch den GPI-Anker gespalten wird. GPI-Anker könnten am PrP-Proteintransport beteiligt sein. Sie können auch eine Rolle bei der Anheftung von Prionenprotein an die äußere Oberfläche der Zellmembran spielen. Normales PrP besteht aus einer langen N-terminalen Schleife (die die Octapeptid-Wiederholungsregion enthält), zwei kurzen β-Faltblättern, drei α-Helices und einer C-terminalen Region (die den GPI-Anker enthält). Die Spaltung von PrP führt zu einem 208 AA langen Glykoprotein, das in der Zellmembran verankert ist.
  • Die 253-Aminosäuresequenz von PRNP (NP_000302.1) ist wie folgt:
  •  MANLGCWMLVLFVATWSDLGLCKKRPKPGGWNTGGSRYPGQGSPGGNRYPPQGGGGWGQPHGGG
     WGQPHGGGWGQPHGGGWGQPHGGGWGQGGGTHSQWNKPSKPKTNMKHMAGAAAAGAVVGGLGGY
     MLGSAMSRPIIHFGSDYEDRYYRENMHRYPNQVYYRPMDEYSNQNNFVHDCVNITIKQHTVTTT
     TKGENFTETDVKMMERVVEQMCITQYERESQAYYQRGSSMVLFSSPPV (SEQ-ID-NR: 291).
  • Die 253-Aminosäuresequenz von PRNP (NP_000302.1) wird durch die folgende Nukleotidsequenz (NCBI Ref. Seq No. NM_000311.5, „Homo Sapiens Prionenprotein (PRNP), Transkriptvariante 1, mRNA) wie folgt kodiert:
  •  GCGAACCTTGGCTGCTGGATGCTGGTTCTCTTTGTGGCCACATGGAGTGACCTGGGCCTCTGCA
     AGAAGCGCCCGAAGCCTGGAGGATGGAACACTGGGGGCAGCCGATACCCGGGGCAGGGCAGCCC
     TGGAGGCAACCGCTACCCACCTCAGGGCGGTGGTGGCTGGGGGCAGCCTCATGGTGGTGGCTGG
     GGGCAGCCTCATGGTGGTGGCTGGGGGCAGCCCCATGGTGGTGGCTGGGGACAGCCTCATGGTG
     GTGGCTGGGGTCAAGGAGGTGGCACCCACAGTCAGTGGAACAAGCCGAGTAAGCCAAAAACCAA
     CATGAAGCACATGGCTGGTGCTGCAGCAGCTGGGGCAGTGGTGGGGGGCCTTGGCGGCTACATG
     CTGGGAAGTGCCATGAGCAGGCCCATCATACATTTCGGCAGTGACTATGAGGACCGTTACTATC
     GTGAAAACATGCACCGTTACCCCAACCAAGTGTACTACAGGCCCATGGATGAGTACAGCAACCA
     GAACAACTTTGTGCACGACTGCGTCAATATCACAATCAAGCAGCACACGGTCACCACAACCACC
     AAGGGGGAGAACTTCACCGAGACCGACGTTAAGATGATGGAGCGCGTGGTTGAGCAGATGTGTA
     TCACCCAGTACGAGAGGGAATCTCAGGCCTATTACCAGAGAGGATCGAGCATGGTCCTCTTCTC
     CTCTCCACCTGTGATCCTCCTGATCTCTTTCCTCATCTTCCTGATAGTGGGATGAGGAAGGTCT
     TCCTGTTTTCACCATCTTTCTAATCTTTTTCCAGCTTGAGGGAGGCGGTATCCACCTGCAGCCC
     TTTTAGTGGTGGTGTCTCACTCTTTCTTCTCTCTTTGTCCCGGATAGGCTAATCAATACCCTTG
     GCACTGATGGGCACTGGAAAACATAGAGTAGACCTGAGATGCTGGTCAAGCCCCCTTTGATTGA
     GTTCATCATGAGCCGTTGCTAATGCCAGGCCAGTAAAAGTATAACAGCAAATAACCATTGGTTA
     ATCTGGACTTATTTTTGGACTTAGTGCAACAGGTTGAGGCTAAAACAAATCTCAGAACAGTCTG
     AAATACCTTTGCCTGGATACCTCTGGCTCCTTCAGCAGCTAGAGCTCAGTATACTAATGCCCTA
     TCTTAGTAGAGATTTCATAGCTATTTAGAGATATTTTCCATTTTAAGAAAACCCGACAACATTT
     CTGCCAGGTTTGTTAGGAGGCCACATGATACTTATTCAAAAAAATCCTAGAGATTCTTAGCTCT
     TGGGATGCAGGCTCAGCCCGCTGGAGCATGAGCTCTGTGTGTACCGAGAACTGGGGTGATGTTT
     TACTTTTCACAGTATGGGCTACACAGCAGCTGTTCAACAAGAGTAAATATTGTCACAACACTGA
     ACCTCTGGCTAGAGGACATATTCACAGTGAACATAACTGTAACATATATGAAAGGCTTCTGGGA
     CTTGAAATCAAATGTTTGGGAATGGTGCCCTTGGAGGCAACCTCCCATTTTAGATGTTTAAAGG
     ACCCTATATGTGGCATTCCTTTCTTTAAACTATAGGTAATTAAGGCAGCTGAAAAGTAAATTGC
     CTTCTAGACACTGAAGGCAAATCTCCTTTGTCCATTTACCTGGAAACCAGAATGATTTTGACAT
     ACAGGAGAGCTGCAGTTGTGAAAGCACCATCATCATAGAGGATGATGTAATTAAAAAATGGTCA
     GTGTGCAAAGAAAAGAACTGCTTGCATTTCTTTATTTCTGTCTCATAATTGTCAAAAACCAGAA
     TTAGGTCAAGTTCATAGTTTCTGTAATTGGCTTTTGAATCAAAGAATAGGGAGACAATCTAAAA
     AATATCTTAGGTTGGAGATGACAGAAATATGATTGATTTGAAGTGGAAAAAGAAATTCTGTTAA
     TGTTAATTAAAGTAAAATTATTCCCTGAATTGTTTGATATTGTCACCTAGCAGATATGTATTAC
     TTTTCTGCAATGTTATTATTGGCTTGCACTTTGTGAGTATTCTATGTAAAAATATATATGTATA
     TAAAATATATATTGCATAGGACAGACTTAGGAGTTTTGTTTAGAGCAGTTAACATCTGAAGTGT
     CTAATGCATTAACTTTTGTAAGGTACTGAATACTTAATATGTGGGAAACCCTTTTGCGTGGTCC
     TTAGGCTTACAATGTGCACTGAATCGTTTCATGTAAGAATCCAAAGTGGACACCATTAACAGGT
     CTTTGAAATATGCATGTACTTTATATTTTCTATATTTGTAACTTTGCATGTTCTTGTTTTGTTA
     TATAAAAAAATTGTAAATGTTTAATATCTGACTGAAATTAAACGAGCGAAGATGAGCACCA
     (SEQ-ID-NR: 292)
  • Mutations-Sitesn relativ zu PRNP (NP_000302.1), die mit CJD und FFI verknüpft sind, werden wie folgt beschrieben. Diese Mutationen können unter Verwendung der hierin offenbarten Prime Editoren entfernt oder installiert werden.
    Figure DE112020001339T5_0298
    Figure DE112020001339T5_0299
  • Mutations-Sitesn relativ zu PRNP (NP_000302.1) (Seq-ID-Nr: 291), die mit GSS verknüpft sind, werden wie folgt gemeldet:
    Figure DE112020001339T5_0300
    Figure DE112020001339T5_0301
    Figure DE112020001339T5_0302
  • Mutations-Sitesn relativ zu PRNP (NP_000302.1) (Seq-ID-Nr: 291), die mit einem möglichen Schutzcharakter gegen Prionenerkrankungen verbunden sind, wie folgt:
    Figure DE112020001339T5_0303
    Figure DE112020001339T5_0304
  • Somit kann in verschiedenen Ausführungsformen ein Prime Editing verwendet werden, um eine Mutation in PRNP zu entfernen, die mit einer Prionenerkrankung verbunden ist, oder eine Mutation in PRNP zu installieren, die als Schutz gegen eine Prionenerkrankung angesehen wird. Prime Editing kann beispielsweise verwendet werden, um eine D178N-, V180I-, T188K-, E196K-, E196A-, E200K-, E200G-, V203I-, R208H-, V210I-, E211Q-, I215V- oder M232R-Mutation im PRNP-Protein (relativ zu PRNP von NP_000302.1) zu entfernen oder wiederherzustellen (Seq-ID-Nr: 291). In weiteren Ausführungen kann Prime Editing beispielsweise verwendet werden, um eine P102L-, P105L-, A117V-, G131V-, V176G-, H187R-, F198S-, D202N-, Q212P-, Q217R- oder M232R-Mutation im PRNP-Protein (relativ zu PRNP von NP-000302.1) zu entfernen oder wiederherzustellen (Seq-ID-Nr: 291). Durch Entfernen oder Korrigieren des Vorhandenseins solcher Mutationen in PRNP unter Verwendung von Prime Editing kann das Risiko einer Prionenerkrankung verringert oder eliminiert werden.
  • In anderen Ausführungsformen kann Prime Editing verwendet werden, um eine schützende Mutation in PRNP zu installieren, die mit einer schützenden Wirkung gegen eine oder mehrere Prionenerkrankungen verbunden ist. Beispielsweise kann Prime Editing beispielsweise verwendet werden, um eine schützende G127S-, G127V-, M129V-, D167G-, D167N-, N171S-, E219K oder P238S-Mutation im PRNP (relativ zu PRNP von NP-000302.1) zu installieren (Seq-ID-Nr: 291). In noch anderen Ausführungsformen kann die schützende Mutation jede alternative Aminosäure sein, die bei G127, G127, M129, D167, D167, N171, E219 oder P238 im PRNP installiert ist (relativ zu PRNP von NP_000302.1) (Seq-ID-Nr: 291) .
  • In bestimmten Ausführungsformen kann Prime Editing verwendet werden, um eine G127V-Schutzmutation in PRNP zu installieren, wie dargestellt in 27 und diskutiert in Beispiel 5.
  • In bestimmten Ausführungsformen kann Prime Editing verwendet werden, um eine E219K-Schutzmutation zu installieren, wie dargestellt in PRNP.
  • Das PRNP-Protein und die schützende Mutations-Site sind bei Säugetieren konserviert, so dass es neben der Behandlung von Krankheiten beim Menschen auch dazu verwendet werden könnte, Kühe und Schafe zu erzeugen, die gegen Prionenerkrankungen immun sind, oder sogar zur Heilung von Wildpopulationen von Tieren, die an Prionenerkrankungen leiden. Prime Editing wurde bereits verwendet, um ~25 % der Installation eines natürlich vorkommenden schützenden Allels in menschlichen Zellen zu erreichen, und frühere Mausexperimente haben gezeigt, dass diese Installation ausreichend ist, um eine Immunität gegen die meisten Prionenerkrankungen zu bewirken. Dieses Verfahren ist die erste und möglicherweise einzige gegenwärtige Möglichkeit, dieses Allel mit so hoher Effizienz in den meisten Zelltypen zu installieren. Eine andere mögliche Behandlungsstrategie besteht darin, Prime Editing zu verwenden, um die Expression von PRNP zu reduzieren oder zu eliminieren, indem ein frühes Stoppcodon in das Gen eingebaut wird.
  • Unter Verwendung der hierin beschriebenen Prinzipien für das PEgRNA-Design können geeignete PEgRNAs zum Installieren gewünschter schützender Mutationen oder zum Entfernen von Prionenerkrankung-assoziierten Mutationen aus PRNP entworfen werden. Beispielsweise kann die folgende Liste von PEgRNAs verwendet werden, um das G127V-Schutzallel und das E219K-Schutzallel in menschlichemem PRNP sowie das G127V-Schutzallel in PRNP verschiedener Tiere zu installieren.
  • Pharmazeutische Zusammensetzungen
  • Andere Aspekte der vorliegenden Offenbarung beziehen sich auf pharmazeutische Zusammensetzungen, die eine der verschiedenen Komponenten des hierin beschriebenen Prime Editing-Systems umfassen (z. B. einschließlich, aber nicht beschränkt auf die napDNAbps, Reverse Transkriptasen, Fusionsproteine (z. B. umfassend napDNAbps und reverse Transkriptasen) , Extended-Guide-RNAs und Komplexe, die Fusionsproteine und Extended-Guide-RNAs umfassen, sowie akzessorische Elemente, wie z. B. Zweitstrang-Nicking-Komponenten und endogene 5'-DNA-Flap-Entfernungsendonukleasen, um den Prime Editing-Prozess in Richtung der editierten Produktbildung voranzutreiben).
  • Der Begriff „pharmazeutische Zusammensetzung“, wie er hier verwendet wird, bezieht sich auf eine Zusammensetzung, die zur pharmazeutischen Verwendung formuliert ist. In einigen Ausführungsformen umfasst die pharmazeutische Zusammensetzung ferner einen pharmazeutisch annehmbaren Träger. In einigen Ausführungsformen umfasst die pharmazeutische Zusammensetzung zusätzliche Mittel (z. B. zur spezifischen Abgabe, Erhöhung der Halbwertszeit oder andere therapeutische Verbindungen).
  • Wie hier verwendet, bedeutet der Begriff „pharmazeutisch annehmbarer Träger“ ein pharmazeutisch annehmbares Material, eine Zusammensetzung oder ein pharmazeutisch annehmbares Vehikel, wie ein flüssiger oder fester Füllstoff, ein Verdünnungsmittel, ein Hilfsstoff, ein Herstellungshilfsmittel (z. B. Schmiermittel, Talkum Magnesium, Calcium- oder Zinkstearat, oder Sterinsäure) oder lösungsmittelverkapselndes Material, das am Tragen oder Transportieren der Verbindung von einer Stelle (z. B. der Abgabestelle) des Körpers zu einer anderen Stelle (z. B. Organ, Gewebe oder Körperteil) beteiligt ist. Ein pharmazeutisch annehmbarer Träger ist „annehmbar“ in dem Sinne, dass er mit den anderen Bestandteilen der Formulierung kompatibel ist und das Gewebe des Subjekts nicht schädigt (z. B. physiologisch kompatibel, steril, physiologischer pH-Wert usw.). Einige Beispiele für Materialien, die als pharmazeutisch verträgliche Träger dienen können, umfassen: (1) Zucker, wie Lactose, Glucose und Saccharose; (2) Stärken, wie Maisstärke und Kartoffelstärke; (3) Zellulose und deren Derivate, wie Natriumcarboxymethylzellulose, Methylzellulose, Ethylzellulose, mikrokristalline Zellulose und Zelluloseacetat; (4) pulverisierter Traganth; (5) Malz; (6) Gelatine; (7) Schmiermittel, wie Magnesiumstearat, Natriumlaurylsulfat und Talk; (8) Hilfsstoffe, wie Kakaobutter und Zäpfchenwachse; (9) Öle, wie Erdnussöl, Baumwollsamenöl, Distelöl, Sesamöl, Olivenöl, Maisöl und Sojabohnenöl; (10) Glykole, wie Propylenglykol; (11) Polyole, wie Glycerin, Sorbit, Mannit und Polyethylenglycol (PEG); (12) Ester, wie Ethyloleat und Ethyllaurat; (13) Agar; (14) Puffermittel, wie Magnesiumhydroxid und Aluminiumhydroxid; (15) Alginsäure; (16) pyrogenfreies Wasser; (17) isotonische Kochsalzlösung; (18) Ringer-Lösung; (19) Ethylalkohol; (20) pH-gepufferte Lösungen; (21) Polyester, Polycarbonate und/oder Polyanhydride; (22) Füllstoffe wie Polypeptide und Aminosäuren (23) Serumkomponente wie Serumalbumin, HDL und LDL; (22) C2-C12-Alkohole, wie Ethanol; und (23) andere nicht-toxische kompatible Substanzen, die in pharmazeutischen Rezepturen verwendet werden. Benetzungsmittel, Färbemittel, Trennmittel, Beschichtungsmittel, Süßungsmittel, Geschmacksstoffe, Duftstoffe, Konservierungsmittel und Antioxidantien können auch in der Rezeptur enthalten sein. Die Begriffe wie „Hilfsstoff“, „Träger“, „pharmazeutisch annehmbarer Träger“ oder dergleichen werden hier austauschbar verwendet.
  • In einigen Ausführungsformen wird die pharmazeutische Zusammensetzung zur Abgabe an ein Subjekt formuliert, z. B. für Gen Editing. Geeignete Verabreichungswege der hierin beschriebenen pharmazeutischen Zusammensetzung umfassen ohne Einschränkung: topisch, subkutan, transdermal, intradermal, intraläsional, intraartikulär, intraperitoneal, intravesikal, transmukosal, gingival, intradental, intracochlear, transtympanal, intraorganisch, epidural, intrathekal, intramuskulär, intravenös, intravaskuläre, intraossäre, periokuläre, intratumorale, intrazerebrale und intrazerebroventrikuläre Verabreichung.
  • In einigen Ausführungsformen wird die hierin beschriebene pharmazeutische Zusammensetzung lokal an eine erkrankte Stelle (z. B. eine Tumorstelle) verabreicht. In einigen Ausführungsformen wird die hierin beschriebene pharmazeutische Zusammensetzung einem Patienten durch Injektion, mittels eines Katheters, mittels eines Zäpfchens oder mittels eines Implantats verabreicht, wobei das Implantat aus einem porösen, nicht porösen oder gelatineartigen Material besteht , einschließlich einer Membran, wie einer sialastischen Membran, oder einer Faser.
  • In anderen Ausführungsformen wird die hierin beschriebene pharmazeutische Zusammensetzung in einem kontrollierten Freisetzungssystem abgegeben. In einer Ausführungsform kann eine Pumpe verwendet werden (siehe z. B., Langer, 1990, Science 249:1527-1533; Sefton, 1989, CRC Crit. Ref. Biomed. Eng. 14:201; Buchwald et al., 1980, Surgery 88:507; Saudek et al., 1989, N. Engl. J. Med. 321:574). In einer anderen Ausführungsform können Polymermaterialien verwendet werden. (Siehe, z. B., Medical Applications of Controlled Release (Langer and Wise eds., CRC Press, Boca Raton, Fla., 1974); Controlled Drug Bioavailability, Drug Product Design and Performance (Smolen and Ball eds., Wiley, New York, 1984); Ranger and Peppas, 1983, Macromol. Sci. Rev. Macromol. Chem. 23:61. Siehe auch Levy et al., 1985, Science 228:190; During et al., 1989, Ann. Neurol. 25:351; Howard et al., 1989, J. Neurosurg. 71:105). Andere kontrollierte Freisetzungssysteme werden beispielsweise in Langer, supra, diskutiert.
  • In einigen Ausführungsformen wird die pharmazeutische Zusammensetzung gemäß Routineverfahren als Zusammensetzung formuliert, die zur intravenösen oder subkutanen Verabreichung an ein Subjekt, z. B. einen Menschen, angepasst ist. In einigen Ausführungsformen sind pharmazeutische Zusammensetzungen zur Verabreichung durch Injektion Lösungen in sterilem isotonischem wässrigem Puffer. Falls erforderlich, kann das Arzneimittel auch ein löslichmachendes Mittel und ein Lokalanästhetikum wie Lignocain enthalten, um Schmerzen an der Injektionsstelle zu lindern. Im Allgemeinen werden die Inhaltsstoffe entweder getrennt oder zusammengemischt in Einheitsdosierungsform geliefert, zum Beispiel als trockenes lyophilisiertes Pulver oder wasserfreies Konzentrat in einem hermetisch verschlossenen Behälter, wie einer Ampulle oder einem Beutel, der die Wirkstoffmenge anzeigt. Wenn das Arzneimittel durch Infusion verabreicht werden soll, kann es mit einer Infusionsflasche abgegeben werden, die steriles Wasser oder Kochsalzlösung pharmazeutischer Qualität enthält. Wenn die pharmazeutische Zusammensetzung durch Injektion verabreicht wird, kann eine Ampulle mit sterilem Wasser zur Injektion oder Kochsalzlösung bereitgestellt werden, so dass die Inhaltsstoffe vor der Verabreichung gemischt werden können.
  • Eine pharmazeutische Zusammensetzung zur systemischen Verabreichung kann eine Flüssigkeit sein, z. B. sterile Kochsalzlösung, Ringer-Laktat- oder Hank-Lösung. Außerdem kann die pharmazeutische Zusammensetzung in fester Form vorliegen und unmittelbar vor der Verwendung wieder aufgelöst oder suspendiert werden. Lyophilisierte Formen werden ebenfalls in Betracht gezogen.
  • Die pharmazeutische Zusammensetzung kann in einem Lipidpartikel oder Vesikel enthalten sein, wie einem Liposom oder Mikrokristall, das auch für die parenterale Verabreichung geeignet ist. Die Partikel können jede geeignete Struktur aufweisen, wie unilamellar oder plurilamellar, solange Zusammensetzungen darin enthalten sind. Verbindungen können in „stabilisierten Plasmid-Lipid-Partikeln“ (SPLP) eingeschlossen werden, die das fusogene Lipid Dioleoylphosphatidylethanolamin (DOPE), geringe Mengen (5-10 Mol-%) an kationischem Lipid enthalten und durch eine Polyethylenglycol (PEG)-Beschichtung stabilisiert werden (Zhang YP et al., Gene Ther. 1999, 6:1438-47) . Besonders bevorzugt für solche Partikel und Vesikel sind positiv geladene Lipide wie N-[1-(2,3-Dioleoyloxi)propyl]-N,N,N-trimethyl-amoniummethylsulfat oder „DOTAP“. Die Herstellung solcher Lipidpartikel ist gut bekannt. Siehe z. B. US-Patent Nr. 4,880,635 ; 4.906.477 ; 4.911.928 ; 4.917.951 ; 4.920.016 ; und 4.921.757 ; von welchen jedes hierin durch Bezugnahme eingeschlossen ist.
  • Die hierin beschriebene pharmazeutische Zusammensetzung kann beispielsweise als Einheitsdosis verabreicht oder verpackt werden. Der Begriff „Einheitsdosis“, wenn er in Bezug auf eine pharmazeutische Zusammensetzung der vorliegenden Offenbarung verwendet wird, bezieht sich auf physikalisch diskrete Einheiten, die als Einheitsdosis für den Patienten geeignet sind, wobei jede Einheit eine vorbestimmte Menge an aktivem Material enthält, die berechnet wird, um die gewünschte therapeutische Wirkung in Verbindung mit das erforderliche Verdünnungsmittel zu produzieren; d. h. Träger oder Vehikel.
  • Weiterhin kann die pharmazeutische Zusammensetzung als pharmazeutischer Kit bereitgestellt werden, umfassend (a) einen Behälter, der eine Verbindung der Erfindung in lyophilisierter Form enthält, und (b) einen zweiten Behälter, der ein pharmazeutisch verträgliches Verdünnungsmittel (z. B. steriles Wasser) zur Injektion enthält. Das pharmazeutisch verträgliche Verdünnungsmittel kann zur Rekonstitution oder Verdünnung der lyophilisierten Verbindung der Erfindung verwendet werden. Optional mit einem oder mehreren solchen Behältern verbunden sein kann eine Mitteilung in der Form, wie sie von einer Regierungsbehörde vorgeschrieben ist, die die Herstellung, Verwendung oder den Verkauf von Arzneimitteln oder biologischen Produkten regelt, wobei die Mitteilung die Genehmigung der Herstellungs-, Verwendungs- oder Verkaufsstelle für die menschliche Verabreichung widerspiegelt.
  • In einem anderen Aspekt ist ein Herstellungsartikel enthalten, der Materialien enthält, die für die Behandlung der oben beschriebenen Krankheiten nützlich sind. In einigen Ausführungsformen umfasst der Herstellungsartikel einen Behälter und ein Etikett. Geeignete Behälter umfassen beispielsweise Flaschen, Ampullen, Spritzen und Teströhrchen. Die Behälter können aus einer Vielzahl von Materialien wie Glas oder Kunststoff gebildet sein. In einigen Ausführungsformen enthält der Behälter eine Zusammensetzung, die zur Behandlung einer hierin beschriebenen Krankheit wirksam ist und eine sterile Zugangsöffnung aufweisen kann. Zum Beispiel kann der Behälter ein Beutel mit intravenöser Lösung oder ein Fläschchen mit einem Stopfen sein, der mit einer Injektionsnadel durchstechbar ist. Der Wirkstoff in der Zusammensetzung ist eine erfindungsgemäße Verbindung. In einigen Ausführungsformen zeigt das Etikett auf oder in Verbindung mit dem Behälter an, dass die Zusammensetzung zur Behandlung der Krankheit der Wahl verwendet wird. Der Herstellungsartikel kann ferner einen zweiten Behälter umfassen, der einen pharmazeutisch verträglichen Puffer umfasst, wie beispielsweise phosphatgepufferte Kochsalzlösung, Ringer-Lösung oder Dextroselösung. Es kann ferner andere Materialien umfassen, die aus kommerzieller Sicht und vom Standpunkt des Benutzers wünschenswert sind, einschließlich anderer Puffer, Verdünnungsmittel, Filter, Nadeln, Spritzen und Packungsbeilagen mit Gebrauchsanweisungen.
  • [101 Kits, Zellen, Vektoren und Abgabe
  • Kits
  • Die Zusammensetzungen der vorliegenden Offenbarung können in Kits zusammengestellt werden. In einigen Ausführungsformen umfasst das Kit Nukleinsäurevektoren für die Expression der hier beschriebenen Prime Editors. In anderen Ausführungsformen umfasst das Kit außerdem geeignete Guide-Nukleotidsequenzen (z. B. PEgRNAs und gRNAs an einer zweiten Stelle) oder Nukleinsäurevektoren für die Expression solcher Guide-Nukleotidsequenzen, um das Cas9-Protein oder den Prime Editor zur gewünschten Zielsequenz zu lenken.
  • Das hier beschriebene Kit kann einen oder mehrere Behälter mit Komponenten zur Durchführung der hier beschriebenen Verfahren und optional Gebrauchsanweisungen enthalten. Jedes der hier beschriebenen Kits kann außerdem Komponenten umfassen, die zur Durchführung der Testverfahren benötigt werden. Jede Komponente der Kits kann (sofern zutreffend) in flüssiger Form (z. B. als Lösung) oder in fester Form (z. B. als Trockenpuder) bereitgestellt werden. In bestimmten Fällen können einige der Komponenten rekonstituierbar oder anderweitig verarbeitbar sein (z. B. in eine aktive Form), beispielsweise durch die Zugabe eines geeigneten Lösungsmittels oder anderen Lösungsarten (wie beispielsweise Wasser), die ggf. nicht mit dem Kit bereitgestellt werden.
  • In einigen Ausführungsformen können die Kits optional Anweisungen und/oder Werbung zur Verwendung der bereitgestellten Komponenten beinhalten. Der hier verwendete Begriff „Anweisungen“ kann eine Anweisungs- und/oder Werbekomponente bezeichnen und umfasst in der Regel schriftliche Anweisungen an oder verbunden mit der Verpackung der Offenbarung. Anweisungen können außerdem jegliche mündlichen oder elektronischen Anweisungen in jeglicher Form umfassen, die einen Anwender eindeutig erkennen lassen, dass die Anweisungen mit dem Kit in Verbindung stehen, beispielsweise audiovisuelle (z. B. Videoaufnahme, DVD usw.), Internet- und/oder webbasierte Kommunikationen usw. Die schriftlichen Anweisungen können in einer von einer staatlichen Behörde zur Regelung der Herstellung, Verwendung oder dem Verkauf von Pharmazeutika oder biologischen Produkten vorgegebenen Form erfolgen, die auch die Zulassung der Behörde zur Regelung der Herstellung, Verwendung oder dem Verkauf für die Verabreichung an Tiere miteinbeziehen kann. Der hier verwendete Begriff „beworben“ umfasst alle mit der Offenbarung verbundenen Geschäftsmethoden, einschließlich Methoden der Ausbildung, Krankenhaus- und andere klinische Anweisungen, wissenschaftliche Forschung, Entdeckung oder Entwicklung von Arzneimitteln, akademische Forschung, Tätigkeiten der pharmazeutischen Industrie, einschließlich Pharmavertrieb, sämtliche Werbe- oder andere Förderungsaktivitäten, einschließlich schriftlicher, mündlicher und elektronischer Kommunikationen in jeder Form. Außerdem können die Kits je nach der hier beschriebenen speziellen Anwendung weitere Komponenten enthalten.
  • Die Kits können einen oder mehrere der hier beschriebenen Komponenten in einem oder mehreren Behältern enthalten. Die Komponenten sind ggf. steril vorbereitet, in einer Spritze verpackt und werden gekühlt versendet. Alternativ können die Komponenten aber auch in Fläschchen oder anderen Behältern zur Lagerung enthalten sein. Ein zweiter Behälter kann andere steril zubereitete Komponenten enthalten. Alternativ können die Kits die aktiven Wirkstoffe vorgemischt zum Versand in einem Fläschchen, Röhrchen oder anderen Behälter enthalten.
  • Die Kits können verschiedene Formen haben, wie beispielsweise eine Blisterpackung, eine schrumpfverpackte Packung, ein vakuumdicht verschließbarer Beutel, eine verschließbare wärmegeformte Schale oder eine ähnliche Verpackungs- oder Schalenform, in der das Zubehör lose im Beutel, in einer oder mehreren Röhrchen, Behältern, einer Box oder Tasche verpackt ist. Die Kits werden ggf. nach Hinzufügen des Zubehörs sterilisiert, wodurch die einzelnen Zubehörteile im Behälter nicht weiter verpackt werden müssen. Die Kits können mit jedem angemessenen Sterilisationsverfahren, wie beispielsweise Strahlungssterilisation, Wärmesterilisation oder anderen im Stand der Technik bekannten Sterilisationsmethoden sterilisiert werden. Die Kits können außerdem je nach spezieller Anwendung weitere Komponenten enthalten, beispielsweise Behälter, Zellmedien, Salze, Puffer, Reagenzien, Spritzen, Kanülen, ein Tuch, wie beispielsweise Gaze zum Auftragen oder Entfernen eines Desinfektionsmittels, Einweg-Handschuhe, einen Ständer für die Wirkstoffe vor der Verabreichung usw. Einige Aspekte dieser Offenbarung stellen Kits bereit, die ein Nukleinsäurekonstrukt bestehend aus einer Nukleotidsequenz umfassen, die die verschiedenen Komponenten des hier beschriebenen Prime Editing-Systems codiert (d. h. u. a. napDNAbps, reverse Transkriptasen, Polymerasen, Fusionsproteine (z. B. bestehend aus napDNAbps und reversen Transkriptasen (oder im weiteren Sinne Polymerasen), verlängerte Guide-RNAs und Komplexe, die Fusionsproteine und erweiterte Guide RNAs umfassen, sowie Zubehörteile, wie beispielsweise Nicking-Komponenten des zweiten Strangs (z. B. Nicking-gRNA des zweiten Stranges) und endogene 5' DNA-Flap-Entfernungs-Endonukleasen, um das Prime Editing-Verfahren in Richtung der editierten Produktformation zu lenken). In einigen Ausführungsformen umfasst eine bzw. umfassen mehrere Nukleotidsequenzen einen heterologen Promotor (oder mehr als einen einzelnen Promotor), der die Expression der Prime Editing-Systemkomponenten steuert.
  • Andere Aspekte dieser Offenbarung stellen Kits bereit, die ein oder mehrere die verschiedenen hier beschriebenen Prime Editing-Systemkomponenten codierende Nukleinsäurekonstrukte umfassen, z. B. umfasst das eine die Prime Editing-Systemkomponenten codierende Nukleotidsequenz, wobei diese Komponenten in der Lage sind, eine DNA-Zielsequenz zu modifizieren. In einigen Ausführungsformen umfasst die Nukleotidsequenz einen heterologen Promotor, der die Expression der Prime Editing-Systemkomponenten steuert.
  • Einige Aspekte dieser Offenbarung stellen Kits bereit, die ein Nukleinsäurekonstrukt umfassen mit (a) einer Nukleotidsequenz, die ein an eine reverse Transkriptase gebundenes napDNAbp (z. B. eine Cas9-Domäne) codiert und (b) einem heterologen Promotor, der die Expression der Sequenz von (a) steuert.
  • Zellen
  • Zellen, die die hier beschriebenen Zusammensetzungen enthalten können, umfassen prokaryotische Zellen und eukaryotische Zellen. Die hier beschriebenen Verfahren werden eingesetzt, um ein Cas9-Protein oder einen Prime Editor in eine eukaryotische Zelle einzuführen (z. B. eine Säugerzelle, wie beispielsweise eine menschliche Zelle). In einigen Ausführungsformen wird eine in vitro-Zelle verwendet (d. h. eine kultivierte Zelle. In einigen Ausführungsformen wird eine in vivo-Zelle verwendet (d. h. in einem Probanden, beispielsweise einem menschlichen Probanden). In einigen Ausführungsformen wird eine ex vivo-Zelle verwendet (d. h. außerhalb eines Probanden, die wieder an den gleichen oder einen anderen Probanden verabreicht werden kann).
  • Säugerzellen der vorliegenden Offenbarung umfassen menschliche Zellen, Primatenzellen (z. B. Verozellen), Rattenzellen (z. B. GH3-Zellen, OC23-Zellen) oder Mauszellen (z. B. MC3T3-Zellen). Es gibt eine Vielzahl von menschlichen Zelllinien, u. a. menschliche embryonale Nierenzellen (HEK), HeLa-Zellen, Krebszellen von den 60 Krebszelllinien des National Cancer Institute (NCI60), DU145 (Prostatakrebs-) Zellen, Lncap (Prostatakrebs-) Zellen, MCF-7 (Brustkrebs-) Zellen, MDA-MB-438 (Brustkrebs-) Zellen, PC3 ((Prostatakrebs-) Zellen, T47D (Brustkrebs-) Zellen, THP-1 (akute myeloische Leukämie-) Zellen, U87 (Glioblastom-) Zellen, SHSY5Y menschliche Neuroblastom-Zellen (geklont von einem Myelom) und Saos-2 (Knochenkrebs-) Zellen. In einigen Ausführungsformen werden rAAV-Vektoren in menschliche embryonale Nierenzellen (HEK) (z. B. HEK 293- oder HEK 293T-Zellen) abgegeben. In einigen Ausführungsformen werden rAAV-Vektoren in Stammzellen (z. B. menschliche Stammzellen), wie beispielsweise pluripotente Stammzellen (z. B. menschliche pluripotente Stammzellen, einschließlich menschlich induzierter pluripotenter Stammzellen (hiPSCs)) abgegeben. Eine Stammzelle bezieht sich auf eine Zelle mit der Fähigkeit, sich für unbestimmte Zeit in Kultur zu teilen und spezialisierte Zellen zu produzieren. Eine pluripotente Stammzelle bezieht sich auf eine Art Stammzelle, die sich zu allen Geweben eines Organismus differenzieren kann, aber allein nicht in der Lage ist, die vollständige Entwicklung eines Organismus aufrechtzuerhalten. Eine menschlich induzierte Stammzelle bezieht sich auf eine somatische (z. B. reife oder erwachsene) Zelle, die in den Zustand einer embryonalen Stammzelle durch erzwungene Expression von Genen und Faktoren umprogrammiert wurde, die für die Erhaltung der prägenden Eigenschaften von embryonalen Stammzellen wichtig sind (siehe, z. B. Takahashi und Yamanaka, Cell 126 (4): 663-76, 2006, das durch Bezugnahme hierin angeführt wird). Menschlich induzierte pluripotente Stammzellen exprimieren Stammzellenmarker und sind in der Lage, Zellen zu erzeugen, die für alle drei Keimschichten (Ektoderm, Endoderm, Mesoderm) charakteristisch sind.
  • Zusätzliche nicht limitierende Beispiele von Zelllinien, die gemäß der vorliegenden Offenbarung verwendet werden können, umfassen 293-T, 293-T, 3T3, 4T1, 721, 9L, A-549, A172, A20, A253, A2780, A2780ADR, A2780cis, A431, ALC, B16, B35, BCP-1, BEAS-2B, bEnd.3, BHK-21, BR293, BxPC3, C2C12, C3H-10T1/2, C6, C6/36, Cal-27, CGR8, CHO, CML T1, CMT, COR-L23, COR-L23/5010, COR-L23/CPR, COR-L23/R23, COS-7, COV-434, CT26, D17, DH82, DU145, DuCaP, E14Tg2a, EL4, EM2, EM3, EMT6/AR1, EMT6/AR10.0, FM3, H1299, H69, HB54, HB55, HCA2, Hepalclc7, High-Five-Zellen, HL-60, HMEC, HT-29, HUVEC, J558L-Zellen, Jurkat, JY-Zellen, K562-Zellen, KCL22, KG1, Ku812, KYO1, LNCap, Ma-Mel 1, 2, 3....48, MC-38, MCF-10A, MCF-7, MDA-MB-231, MDA-MB-435, MDA-MB-468, MDCKII, MG63, MONO-MAC 6, MOR/0.2R, MRC5, MTD-1A, MyEnd, NALM-1, NCI-H69/CPR, NCI-H69/LX10, NCI-H69/LX20, NCI-H69/LX4, NIH-3T3, NW-145, OPCN/OPCT Peer, PNT-1A/PNT 2, PTK2, Raji, RBL-Zellen, RenCa, RIN-5F, RMA/RMAS, S2, Saos-2-Zellen, Sf21, Sf9, SiHa, SKBR3, SKOV-3, T-47D, T2, T84, THP1, U373, U87, U937, VCaP, WM39, WT-49, X63, YAC-1 und YAR-Zellen.
  • Einige Aspekte dieser Offenbarung stellen Zellen bereit, die aus irgendwelchen der hier offenbarten Konstrukten bestehen. In einigen Ausführungsformen wird eine Wirtszelle vorübergehend oder nicht vorübergehend mit einem oder mehreren der hier beschriebenen Vektoren transfiziert. In einigen Ausführungsformen wird eine Zelle transfiziert, wie es natürlich in einem Probanden erfolgt. In einigen Ausführungsformen wird eine transfizierte Zelle von einem Probanden entnommen. In einigen Ausführungsformen stammt die Zelle von Zellen, die von einem Probanden entnommenen wurden, wie beispielsweise eine Zelllinie. Im Stand der Technik sind eine Vielzahl von Zelllinien für die Gewebekultur bekannt. Beispiele von Zelllinien umfassen u. a. C8161, CCRF-CEM, MOLT, mIMCD-3, NHDF, HeLa-S3, Huhl, Huh4, Huh7, HUVEC, HASMC, HEKn, HEKa, MiaPaCell, Panel, PC-3, TF1, CTLL-2, C1R, Rat6, CV1, RPTE, A10, T24, J82, A375, ARH-77, Calul, SW480, SW620, SKOV3, SK-UT, CaCo2, P388D1, SEM-K2, WEHI-231, HB56, TIB55, Jurkat, J45.01, LRMB, Bcl-1, BC-3, IC21, DLD2, Raw264.7, NRK, NRK-52E, MRC5, MEF, Hep G2, HeLa B, HeLa T4, COS, COS-1, COS-6, COS-M6A, BS-C-1 Nierenepithelzellen von Affen, BALB/3T3 Fibroblasten von Mausembryos, 3T3 Swiss-Albino, 3T3-L1, 132-d5 menschliche fötale Fibroblasten; 10.1 Mausfibroblasten, 293-T, 3T3, 721, 9L, A2780, A2780ADR, A2780cis, A 172, A20, A253, A431, A-549, ALC, B16, B35, BCP-1 cells, BEAS-2B, bEnd.3, BHK-21, BR 293. BxPC3. C3H-10T1/2, C6/36, Cal-27, CHO, CHO-7, CHO-IR, CHO-K1, CHO-K2, CHO-T, CHO Dhfr -/-, COR-L23, COR-L23/CPR, COR-L23/5010, COR-L23/R23, COS-7, COV-434, CML T1, CMT, CT26, D17, DH82, DU145, DuCaP, EL4, EM2, EM3, EMT6/AR1, EMT6/AR10.0, FM3, H1299, H69, HB54, HB55, HCA2, HEK-293, HeLa, Hepalclc7, HL-60, HMEC, HT-29, Jurkat, JY cells, K562-Zellen, Ku812, KCL22, KG1, KYO1, LNCap, Ma-Mel 1-48, MC-38, MCF-7, MCF-10A, MDA-MB-231, MDA-MB-468, MDA-MB-435, MDCK II, MDCK 11, MOR/0.2R, MONO-MAC 6, MTD-1A, MyEnd, NCI-H69/CPR, NCI-H69/LX10, NCI-H69/LX20, NCI-H69/LX4, NIH-3T3, NALM-1, NW-145, OPCN/OPCT-Zelllinien, Peer, PNT-1A/PNT 2, RenCa, RIN-5F, RMA/RMAS, Saos-2-Zellen, Sf-9, SkBr3, T2, T-47D, T84, THP1-Zelllinie, U373, U87, U937, VCaP, Verozellen, WM39, WT-49, X63, YAC-1, YAR und transgene Arten davon.
  • Zelllinien sind von einer Vielzahl von den Fachkreisen bekannten Quellen verfügbar (siehe beispielsweise die American Type Culture Collection (ATCC) (Manassus, Va.)). In einigen Ausführungsformen wird eine mit einem oder mehreren der hier beschriebenen Vektoren transfizierte Zelle zur Erzeugung einer neuen Zelllinie bestehend aus einem oder mehreren von Vektoren abgeleiteten Sequenzen verwendet. In einigen Ausführungsformen wird eine mit den Komponenten eines CRISPR-Systems transient transfizierte (wie hier beschrieben, beispielsweise durch transiente Transfektion eines oder mehrerer Vektoren oder Transfektion mit RNA) und durch die Aktivität eines CRISPR-Komplexes modifizierte Zelle zur Erzeugung einer neuen Zelllinie bestehend aus Zellen mit der Modifikation, aber ohne jegliche andere exogene Sequenz, verwendet. In einigen Ausführungsformen werden mit einem oder mehreren Vektoren transient oder nicht transient transfizierte Zellen (wie hier beschrieben) oder von solchen Zellen abgeleitete Zelllinien zur Beurteilung von einer oder mehrerer Testsubstanzen verwendet.
  • Vektoren
  • Einige Aspekte der vorliegenden Offenbarung beziehen sich auf die Verwendung von rekombinanten Virusvektoren (z. B. Adeno-assoziierte Virusvektoren, Adeno-Virusvektoren oder Herpes-simplex-Virusvektoren) für die Abgabe der hier beschriebenen Prime Editors oder Komponenten davon, z. B. Prime Editors des gespaltenen Cas9-Proteins oder einer gespaltenen Nukleobase, in eine Zelle. Im Fall eines gespaltenen Prime Editor (PE)-Ansatzes werden der N-terminale Teil eines PE-Fusionsproteins und der C-terminale Teil einer PE-Fusion von separaten rekombinanten Virusvektoren (z. B. Adeno-assoziierte Virusvektoren, Adeno-Virusvektoren oder Herpes-simplex-Virusvektoren) in die gleiche Zelle abgegeben, da das Cas9-Protein oder die Prime Editors in voller Länge das Verpackungslimit der verschiedenen Virusvektoren, z. B. rAAV (-4,9 kb), überschreiten.
  • Daher zieht die Offenbarung in einer Ausführungsform Vektoren in Erwägung, die gespaltene Prime Editor-Fusionsproteine oder gespaltene Bestandteile davon zuführen können. In einigen Ausführungsformen wird eine Zusammensetzung zur Verabreichung des gespaltenen Cas9-Proteins oder gespaltenen Prime Editor in eine Zelle (z. B. eine Säugerzelle, eine menschliche Zelle) bereitgestellt. In einigen Ausführungsformen umfasst die Zusammensetzung der vorliegenden Offenbarung: (i) ein erstes rekombinantes Adeno-assoziiertes (rAAV) Viruspartikel bestehend aus einer ersten Nukleotidsequenz, die einen N-terminalen Teil eines an seinem C-Terminus an ein Intein-N fusioniertes Cas9-Proteins bzw. Prime Editors codiert; und (ii) ein zweites rekombinantes Adeno-assoziiertes (rAAV) Viruspartikel bestehend aus einer zweiten Nukleotidsequenz, die ein an den N-Terminus eines C-terminalen Teils des Cas9-Proteins oder Prime Editor fusioniertes Intein-C codiert. Die rAAV-Partikel der vorliegenden Offenbarung umfassen einen rAAV-Vektor (d. h. ein rekombinantes Genom des rAAV), der in die viralen Capsid-Proteine eingeschlossen ist.
  • In einigen Ausführungsformen umfasst der rAAV-Vektor: (1) eine heterologe Nukleinsäureregion umfassend die erste oder zweite Nukleotidsequenz, die den N-terminalen Teil oder den C-terminalen Teil eines gespaltenen Cas9-Proteins oder eines gespaltenen Prime Editors in jeglicher Form (wie hier beschrieben) codiert, (2) eine oder mehrere Nukleotidsequenzen umfassend eine Sequenz, die die Expression der heterologen Nukleinsäureregion (z. B. ein Promotor) ermöglicht; und (3) eine oder mehrere Nukleinsäureregionen umfassend eine Sequenz, die die Einbindung der heterologen Nukleinsäureregion (optional mit der einen oder den mehreren Nukleinsäureregionen umfassend einer Sequenz, die Expression ermöglicht) in das Genom einer Zelle ermöglicht. In einigen Ausführungsformen umfassen die eine Integration ermöglichenden Virensequenzen invertierte terminale Sequenzwiederholungen (ITR). In einigen Ausführungsformen ist die erste oder zweite den N-terminalen Teil oder C-terminalen Teil eines gespaltenen Cas9-Proteins oder eines gespaltenen Prime Editors codierende Nukleotidsequenz auf beiden Seiten von einer ITR-Sequenz flankiert. In einigen Ausführungsformen umfasst der Nukleinsäurevektor ferner eine Region, die ein AAV-Rep-Protein (wie hier beschrieben) entweder innerhalb der von ITRs flankierten Region oder außerhalb der Region codiert. Die ITR-Sequenzen können von jedem beliebigen AAV-Serotyp (z. B. 1, 2, 3, 4, 5, 6, 7, 8, 9 oder 10) abgeleitet werden. In einigen Ausführungsformen werden die ITR-Sequenzen von AAV2 oder AAV6 abgeleitet.
  • Daher umfassen die hier offenbarten rAAV-Partikel in einigen Ausführungsformen zumindest ein rAAV2-Partikel, rAAV6-Partikel, rAAV8-Partikel, rPHP.B-Partikel, rPHP.eB-Partikel oder rAAV9-Partikel oder eine Variante davon. In besonderen Ausführungsformen handelt es sich bei den offenbarten rAAV-Partikeln um rPHP.B-Partikel, rPHP.eB-Partikel, rAAV9-Partikel.
  • ITR-Sequenzen und ITR-Sequenzen enthaltende Plasmide sind im Stand der Technik bekannt und gewerblich erhältlich (siehe z. B. das Produkt- und Dienstleistungsangebot von Vector Biolabs, Philadelphia, Pennsylvania; Cellbiolabs, San Diego, Kalifornien; Agilent Technologies, Santa Clara, Kalifornien; und Addgene, Cambridge, Massachusetts; und der Genetransfer in den Skelettmuskel führt zu anhaltender Expression und systemischer Abgabe eines therapeutischen Proteins. Kessler PD, Podsakoff GM, Chen X, McQuiston SA, Colosi PC, Matelis LA, Kurtzman GJ, Byrne BJ. Proc Natl Acad Sci USA. 1996 Nov 26;93(24):14082-7; und Curtis A. Machida. Methods in Molecular Medicine™. Viral Vectors for Gene Therapy Methods and Protocols. 10.1385/1-59259-304-6:201 © Humana Press Inc. 2003. Kapitel 10. Targeted Integration by Adeno-Associated Virus. Matthew D. Weitzman, Samuel M. Young Jr., Toni Cathomen and Richard Jude Samulski; U.S. Pat. Nr. 5,139,941 und 5,962,313 , die alle hier durch Bezugnahme angeführt sind).
  • In einigen Ausführungsformen umfasst der rAAV-Vektor der vorliegenden Offenbarung ein oder mehrere Regulationselemente zur Steuerung der Expression der heterologen Nukleinsäureregion (z. B. Promotor, Transkriptionsterminatoren und/oder andere Regulationselemente). In einigen Ausführungsformen ist die erste und/oder zweite Nukleotidsequenz funktionsfähig an einen oder mehrere z. B. 1, 2, 3, 4, 5 oder mehr) Transkriptionsterminatoren gekoppelt. Nicht limitierende Beispiele von Transkriptionsterminatoren, die gemäß der vorliegenden Offenbarung verwendet werden können, umfassen Transkriptionsterminatoren des Rinderwachstumshormongens (bGH), des menschlichen Wachstumshormongens (hGH), SV40, CW3, Φ oder Kombinationen davon. Die Wirkungsgrade mehrerer Transkriptionsterminatoren wurden getestet, um deren jeweilige Leistung in Bezug auf die Expression des gespaltenen Cas9-Proteins oder des gespaltenen Prime Editors zu ermitteln. In einigen Ausführungsformen handelt es sich bei dem in der vorliegenden Offenbarung verwendeten Transkriptionsterminator um einen bGH-Transkriptionsterminator. In einigen Ausführungsformen umfasst der rAAV-Vektor ferner ein WPRE-Element (Woodchuck Hepatitis Virus Posttranscriptional Regulatory Element). In bestimmten Ausführungsformen ist das WPRE eine gekürzte WPRE-Sequenz, wie beispielsweise „W3“. In einigen Ausführungsformen ist der WPRE 5' vom Transkriptionsterminator eingefügt. Solche Sequenzen erzeugen bei der Transkription eine Tertiärstruktur, die die Expression insbesondere von Virusvektoren erhöht.
  • In einigen Ausführungsformen können die hier verwendeten Vektoren die PE-Fusionsproteine oder irgendwelche Bestandteile davon (z. B. napDNAbp, Linker oder Polymerasen) codieren. Außerdem können die hier verwendeten Vektoren die PEgRNAs und/oder die zusätzliche gRNA zur Einkerbung (Nicking) des zweiten Strangs codieren. Die Vektoren sind ggf. in der Lage, die Expression einer oder mehrerer Codierungssequenzen in einer Zelle zu steuern. In einigen Ausführungsformen kann es sich bei der Zelle um eine prokaryotische Zelle handeln, z. B. eine Bakterienzelle. In einigen Ausführungsformen kann es sich bei der Zelle um eine eukaryotische Zelle handeln, z. B. eine Hefe-, Pflanzen-, Insekten- oder Säugerzelle. In einigen Ausführungsformen kann die eukaryotische Zelle eine Säugerzelle sein. In einigen Ausführungsformen kann die eukaryotische Zelle eine Nagetierzelle sein. In einigen Ausführungsformen kann die eukaryotische Zelle eine menschliche Zelle sein. Geeignete Promotoren zur Steuerung der Expression in verschiedenen Zelltypen sind im Stand der Technik bekannt. In einigen Ausführungsformen kann der Promotor ein Wildtyp sein. In anderen Ausführungsformen kann der Promotor für eine effizientere oder wirkungsvollere Expression modifiziert werden. In noch weiteren Ausführungsformen kann der Promotor verkürzt sein, aber trotzdem seine Funktion beibehalten. So kann der Promotor beispielsweise von normaler oder reduzierter Größe sein, die zur ordnungsgemäßen Verpackung des Vektors in einen Virus geeigneter ist.
  • In einigen Ausführungsformen können die in den Prime Editor-Vektoren verwendbaren Promotoren konstitutiv, induzierbar oder gewebespezifisch sein. In einigen Ausführungsformen können die Promotoren konstitutiv Promotoren sein. Nicht limitierende beispielhafte konstitutive Promotoren umfassen den unmittelbar frühen Promotor des Zytomegalievirus (CMV), den Promotor des Simian Virus (SV40), den späten Promotor der Adenoviren (MLP), den Promotor des Rous-Sarkom-Virus (RSV), den Promotor des Maus-Gebärmutter-Tumorvirus (MMTV), den Phosphoglyceratkinase-Promotor (PGK), den Promotor eines Verlängerungsfaktors 1-a (Efla), Ubiquitin-Promotoren, Aktin-Promotoren, Tubulin-Promotoren, Immunoglobulin-Promotoren, ein funktionelles Fragment davon oder eine Kombination aus allen Vorgenannten. In einigen Ausführungsformen kann der Promotor ein CMV-Promotor sein. In einigen Ausführungsformen kann der Promotor ein verkürzter CMV-Promotor sein. In anderen Ausführungsformen kann der Promotor ein Ef1a-Promotor sein. In einigen Ausführungsformen kann der Promotor ein induzierbarer Promotor sein. Nicht limitierende beispielhafte induzierbare Promotoren umfassen solche, die mittels Hitzeschock, Licht, Chemikalien, Peptiden, Metallen, Steroiden, Antibiotika oder Alkohol induzierbar sind. In einigen Ausführungsformen kann der induzierbare Promotor einer mit einem niedrigen basalen (nicht induzierten) Expressionsniveau sein, wie beispielsweise der Tet-On® Promoter (Clontech). In einigen Ausführungsformen kann der Promotor gewebespezifisch sein. In einigen Ausführungsformen wird der gewebespezifische Promotor ausschließlich oder überwiegend in Lebergewebe exprimiert. Nicht limitierende beispielhafte gewebespezifische Promotoren umfassen den B29-Promotor, CD14-Promotor, CD43-Promotor, CD45-Promotor, CD68-Promotor, Desmin-Promotor, Elastase-1-Promotor, Endoglin-Promotor, Fibronektin-Promotor, Flt-1-Promotor, GFAP-Promotor, GPIIb-Promotor, ICAM- 2-Promotor, INF-ß-Promotor, Mb-Promotor, Nphsl-Promotor, OG-2-Promotor, SP-B-Promotor, SYN1-Promotor und WASP-Promotor.
  • In einigen Ausführungsformen können die Prime Editor-Vektoren (beispielsweise einschließlich aller das Prime Editor-Fusionsprotein und/oder die PEgRNAs und/oder die zusätzlichen Nicking-gRNAs des zweiten Strangs codierenden Vektoren) induzierbare Promotoren umfassen, um die Expression erst nach der Abgabe an eine Zielzelle zu starten. Nicht limitierende beispielhafte induzierbare Promotoren umfassen solche, die mittels Hitzeschock, Licht, Chemikalien, Peptiden, Metallen, Steroiden, Antibiotika oder Alkohol induzierbar sind. In einigen Ausführungsformen kann der induzierbare Promotor einer mit einem niedrigen basalen (nicht induzierten) Expressionsniveau sein, wie beispielsweise der Tet-On® Promoter (Clontech).
  • In zusätzlichen Ausführungsformen können die Prime Editor-Vektoren (beispielsweise einschließlich aller das Prime Editor-Fusionsprotein und/oder die PEgRNAs und/oder die zusätzlichen Nicking-gRNAs des zweiten Strangs codierenden Vektoren) gewebespezifische Promotoren umfassen, um die Expression erst nach der Abgabe in ein spezielles Gewebe zu starten. Nicht limitierende beispielhafte gewebespezifische Promotoren umfassen den B29-Promotor, CD14-Promotor, CD43-Promotor, CD45-Promotor, CD68-Promotor, Desmin-Promotor, Elastase-1-Promotor, Endoglin-Promotor, Fibronektin-Promotor, Flt-1-Promotor, GFAP-Promotor, GPIIb-Promotor, ICAM- 2-Promotor, INF-ß-Promotor, Mb-Promotor, Nphsl-Promotor, OG-2-Promotor, SP-B-Promotor, SYN1-Promotor und WASP-Promotor.
  • In einigen Ausführungsformen kann die die PEgRNA (oder irgendwelche im Zusammenhang mit Prime Editing verwendeten Guide-RNAs) codierende Nukleotidsequenz funktionsfähig an zumindest eine Transkriptions- oder Translationskontrollsequenz gekoppelt sein. In einigen Ausführungsformen kann die die Guide-RNA codierende Nukleotidsequenz funktionsfähig an zumindest einen Promotor gekoppelt sein. In einigen Ausführungsformen kann der Promotor mittels RNA-Polymerase III (Pol III) erkannt werden. Nicht limitierende Beispiele von Pol III-Promotoren umfassen U6-, HI- und tRNA-Promotoren. In einigen Ausführungsformen kann die die Guide-RNA codierende Nukleotidsequenz funktionsfähig an zumindest einen Maus- oder menschlichen U6-Promotor gekoppelt sein. In anderen Ausführungsformen kann die die Guide-RNA codierende Nukleotidsequenz funktionsfähig an zumindest einen Maus- oder menschlichen HI-Promotor gekoppelt sein. In einigen Ausführungsformen kann die die Guide-RNA codierende Nukleotidsequenz funktionsfähig an zumindest einen Maus- oder menschlichen tRNA-Promotor gekoppelt sein. In Ausführungsformen mit mehr als einer Guide-RNA können die die Expression steuernden Promotoren gleich oder unterschiedlich sein. In einigen Ausführungsformen kann die die crRNA der Guide-RNA codierende Nukleotidsequenz und die die tracr-RNA der Guide-RNA codierende Nukleotidsequenz auf dem gleichen Vektor bereitgestellt werden. In einigen Ausführungsformen können die die crRNA der Guide-RNA codierende Nukleotidsequenz und die die tracr-RNA codierende Nukleotidsequenz vom gleichen Promotor gesteuert werden. In einigen Ausführungsformen können die crRNA und tracr-RNA in ein einziges Transkript umgeschrieben werden. So können die crRNA und tracr-RNA beispielsweise von dem einzelnen Transkript verarbeitet werden, um eine Guide-RNA mit Doppelmolekül zu bilden. Alternativ können die crRNA und tracr-RNA in eine Guide-RNA mit einfachem Molekül transkribiert werden.
  • In einigen Ausführungsformen kann sich die die Guide-RNA codierende Nukleotidsequenz auf dem gleichen Vektor befinden, der die das PE-Fusionsprotein codierende Nukleotidsequenz umfasst. In einigen Ausführungsformen kann die Expression der Guide-RNA und des PE-Fusionsproteins von deren jeweiligen Promotoren gesteuert werden. In einigen Ausführungsformen kann die Expression der Guide-RNA von dem gleichen Promotor gesteuert werden, der die Expression des PE-Fusionsproteins steuert. In einigen Ausführungsformen kann das Transkript der Guide-RNA und des PE-Fusionsproteins in einem einzelnen Transkript enthalten sein. So kann die Guide-RNA beispielsweise innerhalb einer untranslatierten Region (UTR) des Cas9-Proteintranskripts liegen. In einigen Ausführungsformen kann die Guide-RNA innerhalb der 5'-UTR des PE-Fusionsproteintranskripts sein. In anderen Ausführungsformen kann die Guide-RNA innerhalb der 3'-UTR des PE-Fusionsproteintranskripts liegen. In einigen Ausführungsformen kann die intrazelluläre Halbwertszeit des PE-Fusionsproteintranskripts durch Zurückhalten der Guide-RNA innerhalb ihrer 3'-UTR reduziert sein und somit deren 3'-UTR in der Länge verkürzen. In weiteren Ausführungsformen kann die Guide-RNA innerhalb eines Introns des PE-Fusionsproteintranskripts sein. In einigen Ausführungsformen können geeignete Spleißstellen am Intron hinzugefügt werden, in dem sich die Guide-RNA befindet, so dass die Guide-RNA korrekt aus dem Transkript gespleißt wird. In einigen Ausführungsformen ermöglicht die Expression des Cas9-Proteins und der Guide-RNA in unmittelbarer Nähe auf dem gleichen Vektor ggf. eine effizientere Bildung des CRISPR-Komplexes.
  • Das Prime Editor-Vektorsystem kann einen Vektor oder zwei Vektoren oder drei Vektoren oder vier Vektoren oder fünf Vektoren oder mehr umfassen. In einigen Ausführungsformen kann das Vektorsystem einen einzelnen Vektor umfassen, der sowohl das PE-Fusionsprotein als auch die PEgRNA codiert. In anderen Ausführungsformen kann das Vektorsystem zwei Vektoren umfassen, wobei ein Vektor das PE-Fusionsprotein codiert und der andere die PEgRNA. In weiteren Ausführungsformen kann das Vektorsystem drei Vektoren umfassen, wobei der dritte Vektor die in den hier beschriebenen Verfahren verwendete, den zweiten Strang mit einem Nick versehende gRNA codiert.
  • In einigen Ausführungsformen umfasst die Zusammensetzung, die das rAAV-Partikel (in jeder hier in Erwägung gezogenen Form) enthält, außerdem einen pharmazeutisch akzeptablen Träger. In einigen Ausführungsformen ist die Zusammensetzung in geeigneten pharmazeutischen Vehikeln zur Verabreichung an menschliche oder tierische Probanden formuliert.
  • Einige Beispiele von Substanzen, die als pharmazeutisch akzeptable Träger dienen können, umfassen: (1) Zucker, wie beispielsweise Lactose, Glucose und Sucrose; (2) Stärke, wie beispielsweise Maisstärke und Kartoffelstärke; (3) Cellulose und Derivate davon, wie beispielsweise Natriumcarboxymethylcellulose, Methylcellulose, Ethylzellulose, mikrokristalline Cellulose und Celluloseacetat; (4) Tragacanth-Puder; (5) Malz; (6) Gelatine; (7) Schmiermittel, wie beispielsweise Magnesiumstearat, Natriumlaurylsulfat und Talk; (8) Trägerstoffe, wie beispielsweise Kakaobutter und Suppositoriumwachs; (9) Öle, wie beispielsweise Ernussöl, Baumwollsamenöl, Distelöl, Sesamöl, Olivenöl, Maisöl und Sojaöl; (10) Glycole, wie beispielsweise Propylenglykol; (11) Polyole, wie beispielsweise Glycerin, Sorbitol, Mannitol und Polyethylenglykol (PEG); (12) Ester, wie beispielsweise Ethyloleat und Ethyllaurat; (13) Agar; (14) Puffersubstanzen, wie beispielsweise Magnesiumhydroxid und Aluminiumhydroxid; (15) Alginsäure; (16) pyrogenfreies Wasser; (17) isotonische Salzlösung; (18) Ringer-Lösung; (19) Ethylalkohol; (20) pH-gepufferte Lösungen; (21) Polyester, Polycarbonate und/oder Polyanhydriden; (22) Füllstoffe, wie beispielsweise Polypeptide und Aminosäuren; (23) Serumbestandteil, wie beispielsweise Serumalbumin, HDL und LDL; (22) C2-C12-Alkohole, wie beispielsweise Ethanol und (23) andere nicht toxische verträgliche Substanzen, die in Arzneimittelformulierungen verwendet werden. Benetzungsmittel, Färbemittel, Trennmittel, Beschichtungsmittel, Süßmittel, Geschmacksstoffe, Duftstoffe, Konservierungsmittel und Antioxidants können in der Formulierung ebenfalls vorhanden sein. Begriffe wie „Trägerstoff“, „Träger“, „pharmazeutisch akzeptabler Träger“ oder Ähnliches werden hier synonym verwendet.
  • Abgabeverfahren
  • In einigen Aspekten stellt die Erfindung Verfahren bereit, die die Abgabe von einem oder mehreren Polynukleoitiden oder einem oder mehreren Vektoren wie hier beschrieben, einem oder mehreren Transkripten davon und/oder einem oder [mehreren] davon transkribierten Proteinen an eine Wirtszelle umfassen. In einigen Aspekten stellt die Erfindung außerdem mittels dieser Verfahren produzierte Zellen bereit sowie Organismen (wie beispielsweise tierisch, pflanzlich oder pilzartige), die solche Zellen enthalten oder aus solchen Zellen produziert wurden. In einigen Ausführungsformen wird ein Base Editor (wie hier beschrieben) zusammen mit (und optional komplexiert mit) einer Guide-Sequenz an eine Zelle übertragen.
  • Beispielhafte Abgabestrategien sind an anderer Stelle in dieser Offenbarung beschrieben, darunter vektorbasierte Strategien, Abgabe via PE-Ribonukleoprotein-Komplex und Abgabe von PE mittels mRNA-Verfahren.
  • In einigen Ausführungsformen umfasst das bereitgestellte Abgabeverfahren Nukleofektion, Mikroinjektion, Biolistik, Virosome, Liposome, Immunoliposome, Polykation oder Lipid:Nukleinsäurekonjugate, nackte DNA, künstliche Virionen und eine wirkstoffverstärkte DNA-Aufnahme.
  • Beispielhafte Verfahren zur Abgabe von Nukleinsäuren umfassen Lipofektion, Nukleofektion, Elektroporation, stabile Genomintegration (z. B. PiggyBac), Mikroinjektion, Biolistik, Virosome, Liposome, Immunoliposome, Polykation oder Lipid:Nukleinsäurekonjugate, nackte DNA, künstliche Virionen und eine wirkstoffverstärkte DNA-Aufnahme. Die Lipofektion wird beispielsweise in den US-Patenten Nr. 5,049,386, 4,946,787 ; und 4,897,355 ) beschrieben und Lipofektionsreagenzien sind gewerblich erhältlich (z. B. Transfectam™, Lipofectin™ und SF Cell Line 4D-Nucleofector X Kit™ (Lonza)). Kationische und neutrale Lipide, die für eine effiziente Rezeptor-erkennende Lipofektion von Polynukleotiden geeignet sind, umfassen die von Feigner, WO 91/17424 ; WO 91/16024 . Die Abgabe kann an Zellen (z. b. in vitro- oder ex vivo-Verabreichung) oder Zielgewebe (z. B. in vivo-Verabreichung) erfolgen. Die Abgabe kann durch den Einsatz von RNP-Komplexen erreicht werden.
  • Die Zubereitung von Lipid:Nukleinsäure-Komplexen, einschließlich Zielliposomen, wie beispielsweise Immunolipid-Komplexe, ist in Fachkreisen wohl bekannt (siehe z. B. Crystal, Science 270:404-410 (1995); Blaese et al., Cancer Gene Ther. 2:291-297 (1995); Behr et al., Bioconjugate Chem. 5:382-389 (1994); Remy et al., Bioconjugate Chem. 5:647-654 (1994); Gao et al., Gene Therapy 2:710-722 (1995); Ahmad et al., Cancer Res. 52:4817-4820 (1992); U.S. Pat. Nr. 4,186,183, 4,217,344, 4,235,871, 4,261,975, 4,485,054, 4,501,728, 4,774,085, 4,837,028 und 4,946,787 ).
  • In anderen Ausführungsformen handelt es sich bei dem hier bereitgestellten Abgabeverfahren und Vektor um einen RNP-Komplex. Die RNP-Abgabe von Fusionsproteinen erhöht deutlich die DNA-Spezifizität der Basenbearbeitung (Base Editing). Die RNP-Abgabe von Fusionsproteinen hat eine Entkopplung des On- und Off-Target-DNA-Editing zur Folge. Die RNP-Abgabe abladiert Off-Target Editing an sich nicht wiederholenden Stellen bei gleichzeitiger Beibehaltung der Vergleichbarkeit des On-Target Editing mit der Plasmidabgabe und reduziert das Off-Target-DNA-Editing erheblich, selbst an der hoch repetitiven VEGFA-Stelle 2. Siehe Rees, H.A. et al., Improving the DNA specificity and applicability of base editing through protein engineering and protein delivery, Nat. Commun. 8, 15790 (2017), US-Patentnr. 9,526,784 , ausgestellt am 27. Dezember 2016 und US-Patentnr. 9,737,604 , ausgestellt am 22. August 2017, die beide hier durch Bezugnahme angeführt sind.
  • Weitere Verfahren zur Abgabe von Nukleinsäuren an Zellen sind in Fachkreisen wohl bekannt. Siehe u. a. US 2003/0087817 , hier durch Bezugnahme angeführt.
  • Andere Aspekte der vorliegenden Offenlegung stellen Verfahren zur Abgabe des Prime Editor-Konstrukts in eine Zelle zur Bildung eines vollständigen und funktionsfähigen Prime Editor innerhalb einer Zelle bereit. So wird eine Zelle in einigen Ausführungsformen beispielsweise von einer hier beschriebenen Zusammensetzung kontaktiert (z. B. Zusammensetzungen mit Nukleotidsequenzen, die das gespaltene Cas9 oder den gespaltenen Prime Editor codieren, oder AAV-Partikel, die mit Nukleoitidsequenzen behaftete Nukleinsäurevektoren beinhalten). In einigen Ausführungsformen führt diese Kontaktierung zur Abgabe von diesen Nukleotidsquenzen in eine Zelle, wobei der N-terminale Teil des Cas9-Proteins oder der Prime Editor und der C-terminale Teil des Cas9-Proteins oder der Prime Editor in die Zelle exprimiert und verbunden werden, um ein vollständiges Cas9-Protein oder einen vollständigen Prime Editor zu bilden.
  • Es sollte anerkannt werden, dass jedes hier angegebene rAAV-Partikel, Nukleinsäuremolekül oder jede Zusammensetzung in geeigneter entweder stabiler oder transienter Weise in die Zelle eingeführt werden kann. In einigen Ausführungsformen können die offenbarten Proteine in die Zelle transfiziert werden. In einigen Ausführungsformen kann die Zelle mit einem Nukleinsäuremolekül transduziert oder transfiziert werden. So kann eine Zelle beispielsweise mit einem Nukleinsäuremolekül transduziert (z. B. mit einem ein gespaltenes Protein codierenden Virus) oder transfiziert (z. B. mit einem ein gespaltenes Protein codierenden Plasmid) werden, das ein gespaltenes Protein codiert, oder mit einem rAAV-Partikel bestehend aus einem Virusgenom, das ein oder mehrere Nukleinsäuremoleküle codiert. Eine solche Transduktion kann stabil oder transient sein. In einigen Ausführungsformen können Zellen, die ein gespaltenes Protein exprimieren oder ein gespaltenes Protein beinhalten, mit einer oder mehreren Guide-RNA-Sequenzen transduziert oder transfiziert werden, beispielsweise bei der Abgabe eines gespaltenen Cas9-Proteins (z. B. nCas9). In einigen Ausführungsformen kann ein ein gespaltenes Protein exprimierendes Plasmid durch Elektroporation, transiente (z. B. Lipofektion) und stabile GenomIntegration (z. B. PiggyBac) und virale Transduktion oder andere den Fachkreisen bekannte Verfahren in Zellen eingebracht werden.
  • In bestimmten Ausführungsformen umfassen die hier angegebenen Zusammensetzungen ein Lipid und/oder Polymer. In bestimmten Ausführungsformen ist das Lipid und/oder das Polymer kationisch. Die Herstellung solcher Lipidpartikel ist wohl bekannt. Siehe z. B. US-Patentnr. 4,880,635; 4,906,477; 4,911,928; 4,917,951; 4,920,016; 4,921,757 ; und 9,737,604 , die hier jeweils durch Bezugnahme angeführt sind.
  • Die Guide-RNA-Sequenz kann eine Länge von 15-100 Nukleotiden haben und eine Sequenz von mindestens 10, mindestens 15 oder mindestens 20 aufeinanderfolgenden Nukleotiden umfassen, was mit einer Zielnukleotidsequenz komplementär ist. Die Guide-RNA kann eine Sequenz von 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39 oder 40 aufeinanderfolgenden Nukleotiden umfassen, was mit einer Zielnukleotidsequenz komplementär ist. Die Guide-RNA kann eine Länge von 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49 oder 50 Nukleotiden aufweisen.
  • In einigen Ausführungsformen ist die Zielnukleotidsequenz eine DNA-Sequenz in einem Genom, z. B. einem eukaryotischen Genom. In bestimmten Ausführungsformen ist die Zielnukleotidsequenz in einem Säugergenom (z. B. einem menschlichen Genom).
  • Die Zusammensetzungen dieser Offenbarung können beispielsweise als Einzeldosis verpackt und verabreicht werden. Der Begriff „Einzeldosis“ bei Verwendung in Bezug auf eine pharmazeutische Zusammensetzung der vorliegenden Offenbarung bezieht sich auf physisch diskrete Einheiten, die als einheitliche Dosis für den Probanden geeignet sind, wobei jede Einheit eine vorgegebene Menge von aktivem Wirkstoff enthält, der zusammen mit dem erforderlichen Verdünnungsmittel, d. h. ein Trägerstoff oder Vehikel, auf die Erzielung der gewünschten therapeutischen Wirkung kalkuliert wurde.
  • Die Behandlung einer Erkrankung oder Störung umfasst die Verzögerung der Entwicklung oder des Fortschreitens der Krankheit oder Minderung des Schweregrads der Erkrankung. Die Behandlung der Erkrankung erfordert nicht unbedingt heilende Ergebnisse.
  • Im Sinne dieser Offenbarung bedeutet „Verzögerung“ der Entwicklung einer Krankheit, das Fortschreiten der Krankheit hinauszuschieben, aufzuhalten, zu verlangsamen, zurückzuhalten, zu stabilisieren und/oder aufzuschieben. Die Verzögerung kann von unterschiedlicher Länge sein, je nach Verlauf der Erkrankung und/oder behandelten Patienten. Ein Verfahren zur „Verzögerung“ oder Minderung der Entwicklung einer Erkrankung oder zur Verzögerung des Ausbruchs der Erkrankung ist ein Verfahren, dass die Wahrscheinlichkeit der Entwicklung eines oder mehrerer Symptome der Erkrankung in einem bestimmten Zeitraum und/oder das Ausmaß der Symptome in einem bestimmten Zeitraum im Vergleich zur Nichtverwendung des Verfahrens verringert. Solche Vergleiche basieren in der Regel auf klinischen Studien mit einer ausreichenden Anzahl von Teilnehmern, um statistisch signifikante Ergebnisse zu erhalten.
  • „Entwicklung“ oder „Fortschreiten“ einer Erkrankung bedeutet anfängliche Anzeichen und/oder darauffolgende Progression der Erkrankung. Die Entwicklung der Erkrankung kann unter Verwendung von in Fachkreisen wohlbekannten standardmäßigen klinischen Verfahren nachweisbar sein und beurteilt werden. Entwicklung bezieht sich jedoch auch auf eine Progression, die ggf. nicht feststellbar ist. Für den Zweck dieser Offenbarung bezieht sich Entwicklung oder Fortschreiten auf den biologischen Verlauf der Symptome. „Entwicklung“ umfasst Auftreten, Rückfall und Ausbruch.
  • Im Sinne dieser Offenbarung umfasst „Ausbruch“ oder „Auftreten“ einer Erkrankung den anfänglichen Ausbruch und/oder Rückfall. Konventionelle Verfahren, die in medizinischen Fachkreisen in der Regel bekannt sind, können eingesetzt werden, um das isolierte Polypeptid oder die pharmazeutische Zusammensetzung dem Patienten je nach Art der zu behandelnden Erkrankung und dem erkrankten Bereich zu verabreichen.
  • Ohne weitere Ausführungen wird davon ausgegangen, dass ein Fachmann die vorliegende Offenbarung basierend auf der vorstehenden Beschreibung in vollem Umfang nutzen kann. Die folgenden speziellen Ausführungsformen sind daher lediglich illustrativ zu verstehen und nicht in irgendeiner Weise limitativ in Bezug auf den Rest der Offenbarung. Alle hier zitierten Publikationen sind durch Bezugnahme für die hier genannten Zwecke oder Gegenstände angeführt.
  • BEISPIELE:
  • BEISPIEL 1. PRIME EDITING (PE) ZUR EINBINDUNG VON PRÄZISEN
  • NUKLEOTIDÄNDERUNGEN IM GENOM
  • Das Ziel ist, eine transformative Genombearbeitungstechnologie zum präzisen und generellen Einbau von einzelnen Nukleotidänderungen in Säugetiergenome zu entwickeln. Diese Technologie würde Prüfärzte befähigen, die Wirkungen von einzelnen Nukleotidvariationen in nahezu jedem Säugetiergenom zu untersuchen und potenziell therapeutische Interventionen zur Korrektur von pathogenen Punktmutationen bei menschlichen Patienten möglich machen.
  • Die Einführung des CRISPR-Systems (Clustered Regularly Interspaced Short Palindromic Repeats) zur Genombearbeitung hat die Biowissenschaften revolutioniert1-3. Obwohl die Gendisruption mittels CRISPR mittlerweile Routine geworden ist, bleibt der präzise Einbau von einzelnen Nukleotidänderungen immer noch eine große Herausforderung, obwohl er zur Untersuchung oder Korrektur einer Vielzahl von erkrankungsverursachenden Mutationen notwendig ist. Das als „Homology directed repair (HDR)“ bezeichnete Reparaturverfahren ist in der Lage, solche Änderungen zu erzielen, leidet jedoch unter geringer Effizienz (oft <5 %), der Anforderung von die Reparatur-Templates der Spender-DNA und nachteiligen Wirkungen der doppelsträngigen DNA-Bruchbildung (DSB). Vor Kurzem hat das Liu Labor die Basenbearbeitung (Base Editing) entwickelt, womit eine effiziente Bearbeitung eines einzelnen Nukleotids ohne DSBs erzielt werden kann. Base Editors (BEs) verbinden das CRISPR-System mit basenmodifizierenden Deaminase-Enzymen, um C•G- oder A•T-Zielbasenpaare zu A•T bzw. G•C zu konvertieren4-6. Obwohl sie bereits von Forschern weltweit breite Anwendung finden (> 5000 BE-Konstrukte aus dem Liu Labor vertrieben von Addgene), ermöglichen die gegenwärtigen BEs nur vier der zwölf möglichen Basenpaarkonvertierungen und sind nicht in der Lage, kleine Insertionen oder Deletionen zu korrigieren. Darüber hinaus ist der Zielbereich der Basenbearbeitung durch das Editing von nicht angezielten, an die Zielbase angrenzenden C- oder A-Basen begrenzt („Bystander-Editing“) und durch die Anforderung, dass eine PAM-Sequenz 15±2 bp von der Zielbase vorliegt. Die Überwindung dieser Einschränkungen würde deshalb die grundlegende Forschung und therapeutischen Anwendungen der Genombearbeitung deutlich erweitern.
  • In dieser Offenbarung wird die Entwicklung eines neuen Ansatzes zur präzisen Bearbeitung vorgeschlagen, der viele Vorteile des Base Editing bietet — und zwar die Vermeidung von Doppelstrangbrüchen und Reparaturvorlagen der Spender-DNA — und gleichzeitig dessen größte Einschränkungen überwindet. Zur Erreichung dieses ehrgeizigen Vorhabens wird auf einen direktem Einbau editierter DNA-Stränge an Zielstellen des Genoms mithilfe des TPRT-Mechanismus (Target-primed Reverse Transcription) abgezielt. In der hier dargelegten Ausführung wird CRISPR Guide-RNA (gRNA) so konstruiert, dass sie ausgelöst durch ein zugeordnetes reverses Transkriptaseenzym mit einer Template-codierenden mutagenen DNA-Strangsynthese behaftet ist. Die von der CRISPR-Nuklease (Cas9) mit einem Nick versehene DNA-Zielstelle dient als Primer für die reverse Transkription und ermöglicht die direkte Einbindung jeder gewünschten Nukleotidänderung.
  • Abschnitt 1
  • Etablierung einer Guide-RNA-templierten reversen Transkription von mutagenen DNA-Strängen. Vorherige Studien haben gezeigt, dass das Cas9 nach der DNA-Spaltung, aber vor der Komplexdissoziation den nicht angezielten DNA-Strang freisetzt, um ein freies 3'-Ende zu entblößen. Es wird angenommen, dass dieser DNA-Strang zur Verlängerung durch Polymeraseenzyme zugänglich ist und dass gRNAs durch die Verlängerung ihrer 5'- oder 3'-Enden so engineert werden können, dass sie als Templates für die DNA-Synthese dienen. In ersten in vitro-Studien wurde festgestellt, dass DNA-Strangbrüche innerhalb der Cas9:gRNA-gebundenen Komplexe in der Tat die reverse Transkription durch Nutzung der gebundenen gRNA als Template (transwirkendes RT-Enzym) primen können. Als Nächstes werden verschiedene gRNA-Linker, Primer-Bindungsstellen und Synthese-Templates betrachtet, um optimale Konzeptionsregeln in vitro festzulegen. Im Anschluss daran werden verschiedene transwirkende oder als Fusionen zu Cas9 wirkende RT-Enzyme in vitro beurteilt. Schließlich werden engineerte gRNA-Konstrukte identifiziert, die effiziente Bindungs- und Schneidetätigkeiten in Zellen aufrechterhalten. Die erfolgreiche Umsetzung dieses Ziels schafft eine Grundlage zur Durchführung von mutagenen Strangsynthesen in Zellen.
  • Abschnitt 2
  • Etablierung von Prime Editing in menschlichen Zellen. Basierend auf DNA-Verarbeitungs- und Reparaturmechanismen wird angenommen, dass mutagene DNA-Stränge (einzelsträngige Flaps) für die direkte, spezielle und wirksame Bearbeitung von Zielnukleotiden verwendet werden können. In ermutigenden ersten Studien wurde die Durchführbarkeit dieser Strategie durch Aufzeigen der Bearbeitung mit mutagene Flaps enthaltenen Plasmidsubstratmodellen nachgewiesen. Gleichzeitig mit Ziel 1 werden Reparaturergebnisse durch systematische Variation der Länge des mutagenen Flaps, der Sequenzzusammensetzung, der Identität des Zielnukleotids und des 3'-Terminus weiter evaluiert. Kleine 1 bis 3 Nukleotidinsertionen und -deletionen werden ebenfalls untersucht. Parallel dazu und auf Ziel 1 aufbauend werden die Cas9-RT-Architekturen, einschließlich Fusionsproteine und nicht kovalente Rekrutierungsstrategien, beurteilt. Die Cas9-RT-Architekturen und verlängerten gRNAs werden auf zelluläre Bearbeitung an mehreren Zielstellen im menschlichen Genom getestet und dann auf hohe Effizienz optimiert. Sofern erfolgreich, würde dieses Ziel umgehend die TPRT-Genombearbeitung (d. h. Prime Editing) für grundlegende wissenschaftliche Anwendungen etablieren.
  • Abschnitt 3
  • Umsetzung der stellenspezifischen Bearbeitung von pathogenen Mutationen in menschlichen Zellkulturen. Die potenzielle Allgemeingültigkeit dieser Technologie könnte die Bearbeitung von Transversionsmutationen und Indels ermöglichen, die gegenwärtig mit BEs nicht korrigierbar sind. Basierend auf den Ergebnissen von Ziel 1 und Ziel 2 werden pathogene Transversionsmutationen in menschlichen Zellkulturen angezielt, einschließlich der Gründermutation der Sichelzellkrankheit im Beta-globin-Gen (erfordert zur Korrektur eine Transversion von A•T zu T•A) und der häufigsten Morbus Wilson-Mutation im ATP7B-Gen (erfordert zur Korrektur eine Transversion von G•C zu T•A). Die Korrektur von kleinen Instertions- und Deletionsmutationen wird ebenfalls untersucht, einschließlich der 3-Nucleotid ΔF508-Deletion im CFTR-Gen, das Mukoviszidose verursacht. Sofern erfolgreich, würde dies den Grundstein zur Entwicklung leistungsvoller Therapiemethoden zur Bekämpfung dieser wichtigen bei Menschen auftretenden Erkrankungen legen.
  • Vorgehensweise
  • Das Ziel ist, eine Genombearbeitungsstrategie zu entwickeln, die Punktmutationen direkt an zielgerichteten Genomstellen einbaut. In der Entwicklungsphase der Technologie werden sich die Schwerpunkte auf das Protein- und RNA-Engineering konzentrieren, um die TPRT-Funktionalität in das CRISPR/Cas-System einzubinden. In-vitro-Assays werden eingesetzt, um die Funktion jedes TPRT-Schritts von Grund auf (Ziel 1) eingehend zu untersuchen. Der zweite Schwerpunktbereich beurteilt die Bearbeitungsergebnisse in Säugerzellen unter Verwendung einer Kombination aus Substratmodellen und speziell entwickelten CRISPR/Cas-Systemen (Ziel 2). In der Anwendungsphase wird schließlich das Verfahren eingesetzt, um Mutationen zu korrigieren, die bisher mit anderen Verfahren der Genombearbeitung unlösbar waren (Ziel 3).
  • Das allgemeine Bearbeitungskonzept ist in 1A-1B veranschaulicht. Cas9-Nickasen enthalten inaktivierende Mutationen für die HNH-Nukleasedomäne (Spy Cas9 H840A oder N863A) und begrenzen die DNA-Spaltung für den PAM-enthaltenen Strang (Nicht-Target-Strang). Guide-RNAs (gRNAs) werden so konstruiert, dass sie ein Template für die reverse Transkription enthalten (Designs sind auf Folie 5 ausführlich dargelegt). Gezeigt wird eine 5'-Verlängerung der gRNA, aber 3'-Verlängerungen sind ebenfalls möglich. Die Cas9-Nickase ist entweder am C-Terminus oder am N-Terminus mit einem reversen Transkriptase (RT)-Enzym fusioniert. Der gRNA:Cas9-RT-Komplex zielt die DNA-Region von Interesse an und bildet eine R-Schleife nach Verlagerung des Nicht-Target-Strangs. Cas9 versieht den Nicht-Target-DNA-Strang mit einem Nick. Die Freisetzung des mit einem Nick versehenen Strangs enthüllt ein freies 3'-OH-Ende, das in der Lage ist, eine reverse Transkription mithilfe der verlängerten gRNA als Template zu primen. Diese DNA-Synthesereaktion wird von dem fusionierten RT-Enzym ausgeführt. Das gRNA-Template codiert eine DNA-Sequenz, die homolog zum ursprünglichen DNA-Duplex ist, mit der Ausnahme des Nukleotids, auf das zur Bearbeitung abgezielt wird. Das Produkt der reversen Transkription ist ein einzelsträngiger DNA-Flap, der die gewünschte Änderung codiert. Dieser Flap, der ein freies 3'-Ende enthält, kann sich mit dem benachbarten DNA-Strang äquilibrieren und ein 5'-Flap ergeben. Von der letzteren Art wird angenommen, dass sie als effizientes Substrat für FEN1 (Flap-Endonuklease 1) dient, d. h. ein Enzym, das im Verlauf der DNA-Synthese im verzögerten Strang natürlich 5'-Flaps aus Okazaki-Fragmenten schneidet und 5'-Flaps nach der, während der Long Patch-Basen-Exzisions-Reparatur erfolgenden Strangverdrängungssynthese, entfernt. Die Ligatur des DNA-Bruchs ergibt ein nicht übereinstimmendes Basenpaar. Dieses Zwischenprodukt könnte entweder einer Reversion in das ursprüngliche Basenpaar oder einer Konvertierung in das gewünschte editierte Basenpaar mittels Mismatch-Reparatur-Prozessen (MMR) unterzogen werden. Alternativ könnte eine semikonservative DNA-Replikation jeweils eine Kopie der Reversion und der Änderung hervorbringen.
  • 1. Etablierung einer Guide-RNA-templierten reversen Transkription von mutagenen DNA-Strängen.
  • Hintergrund und Begründung
  • In der vorgeschlagenen Genombearbeitungsstrategie fungiert der von Cas9 mit einem Nick versehene Nicht-Target-DNA-Strang (PAM beinhaltender Strang, der die R-Schleife bildet) als Primer für die DNA-Synthese. Es wird angenommen, dass dies möglicherweise auf mehreren biochemischen und Strukturdatensätzen basiert. Nukleaseschutzexperimente32, kristallografische Untersuchungen33 und Base-Editing-Fenster4,24 haben ein hohes Maß an Flexibilität und Unordnung für die nicht angezielten Strangnukleotiden -20 bis -10 innerhalb der sogenannten R-Schleife des Cas9-gebundenen Komplexes gezeigt (die Nummerierung gibt die Distanz 5' vom ersten PAM-Nukleotid an). Ferner kann das distale PAM-Ende des gespaltenen Nicht-Target-Strangs von eng gebundenen ternären Komplexen verdrängt werden, wenn komplementäre ssDNA transwirkend20 hinzugefügt wird. Diese Studien bekräftigen, dass der Nicht-Target-Strang hoch flexibel und zugänglich für Enzyme ist und dass das 3'-Ende des distalen PAM-Fragments nach dem Nick vor der Cas9-Disassoziation freigelegt wird. Des Weiteren wird angenommen, dass gRNAs auf die Template-DNA-Synthese verlängert werden können. Vorherige Studien haben gezeigt, dass gRNAs für SpCas9, SaCas9 und LbCas12a (ehemals Cpfl) gRNA-Verlängerungen mit RNA-Aptameren34, Liganden induzierbaren selbstspaltenden Ribozymen35 und langen nicht codierenden RNAs36 tolerieren können. Die Literatur schafft einen Präzedenzfall für zwei wichtige Funktionen, die erschlossen werden. Bei der Beurteilung dieser Strategie werden mehrere CRISPR-Cas-Systeme zusammen mit 5' und 3' verlängerten gRNA-Designs unter Verwendung einer Kombination aus in vitro und zellulären Assays (2A-2C) evaluiert.
  • Konzepte für engineerte gRNAs für TRT-Editing sind in 3A-3B veranschaulicht. Die DNA-Synthese verläuft von 5' zu 3' und kopiert das RNA-Template somit in Richtung 3' zu 5'. Das Design für die 5'-Verlängerung enthält eine Linker-Region, eine Primer-Bindungsstelle, wo der mit einem Nick versehene DNA-Strang anlagert, und ein Template für die DNA-Synthese mittels reverser Transkription. Die 3'-verlängerte gRNA enthält eine Primer-Bindungsstelle und ein Template für die reverse Transkription. In einigen Fällen wird die 3'-Haarnadel-RNA des gRNA-Kerns modifiziert, um der DNA-Zielsequenz zu entsprechen, wie in vitro-Experimente gezeigt haben, dass die reverse Transkription ~3 Nukleotide in den gRNA-Kern für die 3'verlängerten gRNA-Konstrukte verlängert (die Modifizierung der Haarnadel-Sequenz scheint gut toleriert zu werden, solange kompensatorische Änderungen vorgenommen werden, die die Struktur der Haarnadel-RNA aufrechterhalten). Die DNA-Synthese verläuft von 5' zu 3', wobei Nukleotide zum 3'-OH des wachsenden DNA-Strangs hinzugefügt werden.
  • Erste Ergebnisse
  • Die von Cas9 mit einem Nick versehene DNA primt die reverse Transkription von gRNA-Templates. Zur Beurteilung der Zugänglichkeit des mit einem Nick versehenen DNA-Strangs wurden biochemische in vitro-Assays unter Verwendung der Cas9-Nuklease von S. pyogenes (SpCas9) und Cy5-fluoreszenzmarkierten doppelsträngigen DNA-Substraten (51 Basenpaare) durchgeführt. Zuerst wurde eine Reihe von 5'-Verlängerungen mit unterschiedlich langen Synthese-Templates enthaltenden gRNAs durch in vitro-Transkription vorbereitet (das gesamte Design ist in 2B veranschaulicht). EMSA-Assays (Electrophoresis Mobility Shift Assays) mit Nuklease-deaktiviertem Cas9 (dCas9) konnten nachweisen, dass 5'-verlängerte gRNAs die Zielbindung beibehalten (Daten nicht angegeben). Als Nächstes wurde die TPRT-Aktivität an vorher mit einem Nick versehenen, Cy5-markierten, doppelsträngigen DNA-Substraten unter Verwendung von dCas9, 5'-verlängerten gRNAs und reverser Transkriptase des Murinen Leukämievirus (M-MLV) (Superscript III) getestet. Nach 1 Stunde Inkubation bei 37 °C wurden die Produkte mittels Elektrophorese mit denaturierendem Polyacrylamidgel (PAGE) evaluiert und mit Cy5-Fluoreszenz abgebildet (4A). Jede 5'-verlängerte gRNA-Variante führte zu signifikanter Produktbildung, wobei die beobachteten DNA-Produktgrößen der Länge der Verlängerungsvorlage entsprachen (4B). Wichtig ist, dass bei Fehlen von dCas9 vorher mit einem Nick versehene Subtrate auf die volle Länge der 51 Basenpaare der DNA-Substrate verlängert wurden, was stark darauf hindeutet, dass der komplementäre DNA-Strang und nicht die gRNA als Template für die DNA-Synthese verwendet wurde, wenn kein dCas9 vorlag (4C). Beachtenswert ist außerdem die Konzeption des Systems einer Weise, dass der neu synthetisierte DNA-Strang ein Spiegelbild des Produkts ist, das zur Zielpunktbearbeitung erforderlich sein würde (ein homologer Strang mit einer einzigen Nukleotidänderung). Dieses Ergebnis konstatiert, dass die Cas9:gRNA-Bindung das 3'-Ende des mit einem Nick versehenen Nicht-Target-Strangs freisetzt und dass der Nicht-Target-Strang zur reversen Transkription zugänglich ist.
  • Als Nächstes wurden nicht mit einem Nick versehene dsDNA-Substrate mithilfe des Cas9(H840A)-Mutanten evaluiert, der den nicht angezielten DNA-Strang mit einem Nick versieht. Zunächst wurden zur Untersuchung der Cas9(H840A) Nickase-Aktivität mit 5'-verlängerten gRNAs in vitro-Spaltungsassays durchgeführt (wie vorher beschrieben37). Obwohl das Nicking im Vergleich zur Standard-gRNA beeinträchtigt war, wurden nennenswerte Spaltprodukte gebildet (4D). Zu beachten ist, dass RT-Produkte bei der Durchführung von TPRT-Reaktionen mit 5'verlängerten gRNAs und Cas9(H840A) ebenfalls beobachtet wurden, wenn auch in geringerem Umfang, was sich wahrscheinlich durch die verminderte Nicking-Aktivität erklären lässt ( 4D). Dieses Ergebnis zeigt, dass 5'-verlängerte gRNA:Cas9(H840A)-Komplexe die DNA mit einem Nick versehen und die reverse Transkription templieren können.
  • Schließlich wurden 3'-gRNA-Verlängerungen auf Cas9(H840A)-Nicking und TPRT evaluiert. Im Vergleich zu 5'-verlängerten gRNAs war die DNA-Spaltung durch 3'-verlängerte gRNAs in keinem erkennbaren Maß verglichen mit der Standard-gRNA beeinträchtigt. Bezeichnenderweise unterstützten 3'-verlängerte gRNA-Templates ebenfalls eine effiziente reverse Transkription von sowohl vorher mit einem Nick versehenen als auch intakten doppelsträngigen DNA-Substraten bei transwirkender Zuführung von M-MLV RT (4E). Überraschenderweise wurde nur ein einziges Produkt für 3'-verlängerte Templates beobachtet, was darauf hindeutet, dass die reverse Transkription an einem bestimmten Punkt entlang des gRNA-Gerüsts endet. Eine Homopolymer-Schwanzbildung des Produkts mit terminaler Transferase gefolgt von Klenow-Verlängerung und Sanger-Sequenzierung zeigte, dass die gesamte gRNA-Synthesevorlage zusätzlich zu den terminalen 3 Nukleotiden des gRNA-Kerns kopiert wurde. In Zukunft wird das Flap-Ende durch Modifizierung der terminalen gRNA-Sequenz umprogrammiert38,39. Dieses Ergebnis zeigt, das 3'-verlängerte gRNAs als effiziente Nuklease-Zielführungen und als Template für die reverse Transkription dienen können.
  • Cas9-TPRT verwendet mit einem Nick versehene DNA und gRNA cis-wirkend. Anhand von Experimenten mit zwei Farben wurde festgestellt, ob die RT-Reaktion vorzugsweise mit der gRNA cis-wirkend (an den gleichen Komplex gebunden) erfolgt (siehe 8). Zwei separate Experimente wurden durchgeführt für 5'-verlängerte und 3'-verlängerte gRNAs. Für ein bestimmtes Experiment wurden ternäre Komplexe von dCas9, gRNA und DNA-Substrat in separaten Röhrchen gebildet. In einem Röhrchen codiert die gRNA ein langes RT-Produkt und das DNA-Substrat wird mit Cy3 (rot) markiert; in dem anderen Röhrchen codiert die gRNA ein kurzes RT-Produkt und das DNA-Substrat wird mit Cy5 (blau) markiert. Nach kurzen Inkubationen wurden die Komplexe gemischt und dann mit RT-Enzym und dNTPs behandelt. Die Produkte wurden mit Harnstoff-Denaturierungs-PAGE getrennt und mittels Fluoreszenz in den Cy3- und Cy5-Kanälen visualisiert. Es wurde festgestellt, dass sich Reaktionsprodukte vorzugsweise unter Verwendung der gRNA-Vorlage bilden, die mit dem DNA-Substrat vorkomplexiert war, was darauf hindeutet, dass die RT-Reaktion wahrscheinlich cis-wirkend erfolgen kann. Dieses Ergebnis bekräftigt, dass ein einzelner Cas9:gRNA-Komplex eine DNA-Stelle und reverse Transkription der Vorlage eines mutagenen DNA-Strangs anzielen kann.
  • Tests von TPRT mit anderen Cas-Systemen
  • Ähnliche Experimente wie die im vorherigen Abschnitt dargestellten werden mithilfe von anderen Cas-Systemen, einschließlich Cas9 von S. aureus und Cas12a von L. bacterium durchgeführt (siehe 2A-2C). Wenn TRPT für diese Cas-Varianten ebenfalls nachgewiesen werden kann, würden sich der potenzielle Bearbeitungsumfang und die Wahrscheinlichkeit des Gesamterfolgs in Zellen erhöhen.
  • Tests von TPRT mit RT-Cas9-Fusionsproteinen
  • Eine Reihe von kommerziell erhältlichen oder reinigbaren RT-Enzymen wird zunächst transwirkend auf TPRT-Aktivität evaluiert. Zusätzlich zu der bereits getesteten RT von M-MLV wird die RT vom aviären Myeloblastose-Virus (AMV), dem Geobacillus stearothermophilus Intron der Gruppe II (GsI-IIC)41,42 und dem Eubacterium rectale Intron der Gruppe II (Eu.re.I2)43,44 beurteilt. Bezeichnenderweise führen die letzten zwei RTs TPRT in ihren natürlichen biologischen Kontexten aus. Soweit relevant, werden RNAse inaktivierende Mutationen und andere potenziell vorteilhafte RT-Enzymmodifikationen getestet. Sowie funktionale RTs bei transwirkender Zuführung identifiziert werden, wird jede als Fusionsprotein zu Cas9-Varianten evaluiert. Die Fusionsausrichtungen des N-Terminus und C-Terminus werden zusammen mit verschiedenen Linker-Längen und -Architekturen getestet. Anhand von kinetischen Zeitverlauf-Experimenten wird bestimmt, ob TPRT unter cis-wirkender Verwendung des RT-Enzyms erfolgen kann. Wenn eine RT-Cas9-Fusionsarchitektur konstruiert werden kann, die eine effiziente TPRT-Chemie ermöglicht, erhöht sich damit die Wahrscheinlichkeit der funktionalen Bearbeitung im Kontext einer Zelle erheblich.
  • Cas9-Targeting mit engineerten gRNAs in Zellen
  • Bestimmte speziell engineerte gRNAs, die in den vorstehenden Teilzielen entwickelt wurden, werden in Experimenten mit menschlichen Zellkulturen (HEK293) evaluiert, um die Targeting-Effizienz von Cas9 zu bestätigen. Unter Verwendung von bekannten Indel-Formationstests mit Wildtyp-SpCas945 werden engineerte gRNAs jeweils mit Standard-gRNAs an 5 oder mehr Stellen im menschlichen Genom verglichen. Die Effizienz der Genombearbeitung wird durch Amplicon-Sequenzierung im Multiplex-Modus unter Verwendung der im Labor verfügbaren Illumina MiSeq-Plattform charakterisiert. Es wird erwartet, dass die Ergebnisse dieses und der vorangehenden Abschnitte Erkenntnisse generieren, die in nachfolgende Iterationen des „Entwerfen-Erstellen-Testen“-Zyklus einfließen, wobei gRNAs sowohl für die Templierung der reversen Transkription als auch für ein effizientes Cas9-Targeting in Zellen optimiert werden können.
  • Die Ergebnisse der in vitro-Validierungen sind in 5-7 dargestellt. In vitro-Experimente haben gezeigt, dass der mit einem Nick versehene Nicht-Target-DNA-Strang flexibel ist und zum Primen der DNA-Synthese verfügbar ist und dass die gRNA-Verlängerung als Template für die reverse Transkription dienen kann (siehe 5). Diese Reihe von Experimenten verwendete 5'-verlängerte gRNAs (konzipiert wie in 3A-3B dargestellt) mit Synthese-Templates von unterschiedlicher Länge (links aufgeführt). Fluoreszenzmarkierte (Cy5) DNA-Zielpunkte werden als Substrate verwendet und wurden in dieser Reihe von Experimenten vorher mit einem Nick versehen. Bei dem in diesen Experimenten verwendeten Cas9 handelte es sich um katalytisch deaktiviertes Cas9 (dCas9), d. h. es kann die DNA nicht schneiden, aber sich weiterhin effizient binden. Superscript III, eine kommerziell erhältliche, vom Murinen Leukämievirus (M-MLV) abgeleitete RT, wurde transwirkend zugeführt. Zunächst wurden dCas9:gRNA-Komplexe aus gereinigten Komponenten gebildet. Das fluoreszenzmarkierte DNA-Substrat wurde dann zusammen mit dNTPs und dem RT-Enzym hinzugefügt. Nach einer Stunde Inkubation bei 37° C wurden die Reaktionsprodukte mittels Elektrophorese mit denaturierendem Polyacrylamidgel (PAGE) analysiert. Das Gelbild zeigt Verlängerungen des ursprünglichen DNA-Strangs auf Längen, die der Länge des Templates für die reverse Transkription entsprechen. Beachtenswert ist, dass die in Abwesenheit von dCas9 unabhängig von der verwendeten gRNA erfolgten Reaktionen DNA-Produkte mit einer Länge von 51 Nukleotiden erzeugten. Dieses Produkt entspricht der Verwendung eines komplementären DNA-Strangs als Template für die DNA-Synthese und nicht die RNA (Daten nicht angegeben). Demnach ist die Cas9-Bindung zur Ausrichtung der DNA-Synthese auf das RNA-Template erforderlich. Diese Reihe von in vitro-Experimenten stimmt weitgehend mit den in 5 gezeigten überein, mit der Ausnahme, dass das DNA-Substrat nicht vorher mit einem Nick versehen und eine Cas9-Nickase (SpyCas9 H840A-Mutant) verwendet wird. Wie im Gel zu sehen ist, erfolgt bei Verwendung der Standard-gRNA eine effiziente Spaltung des DNA-Strangs durch die Nickase (gRNA _0, Spur 3). Mehrere Spaltungsprodukte werden in Übereinstimmung mit vorherigen biochemischen Studien von SpyCas9 beobachtet. Die 5'-Verlängerung beeinträchtigt die Nicking-Aktivität (Spur 4-8), aber ein RT-Produkt wird trotzdem festgestellt. 7 zeigt, dass 3'-Verlängerungen die DNA-Synthese unterstützen und sich nicht besonders auf die Cas9-Nickase-Aktivität auswirken. Vorher mit einem Nick versehene Subtrate (schwarzer Pfeil) werden fast quantitativ in RT-Produkte umgewandelt, wenn entweder eine dCas9- oder Cas9-Nickase (Spur 4 und 5) verwendet wird. Mehr als 50 % Konvertierung des RT-Produkts (roter Pfeil) wird mit vollen Substraten beobachtet (Spur 3). Zur Ermittlung der Länge und Sequenz des RT-Produkts wurde das Produktband vom Gel exzidiert, extrahiert und sequenziert. Das zeigte, dass die RT 3 Nukleotiden in der 3'terminalen Haarnadel des gRNA-Kerns verlängert hat. Nachfolgende Experimente (nicht angezeigt) demonstrierten, dass diese drei Nukleotiden verändert werden konnten, um DNA-Zielsequenzen zu entsprechen, solange komplementäre Änderungen vorgenommen wurden, die die RNA-Haarnadel-Struktur beibehielten.
  • Potenzielle Schwierigkeiten und Alternativen
  • (1) RT agiert nicht als Fusion:molekulares Crowding und/oder ungünstige Geometrien können die Polymerase-Verlängerung durch Cas9-fusionierte RT-Enzyme behindern. Zunächst kann eine Linker-Optimierung getestet werden. Kreisförmig permutierte Varianten von Cas9, die die räumliche Beziehung zwischen dem DNA-Primer, der gRNA und dem RT-Enzym neu ausrichten können, werden evaluiert. Nicht kovalente RT-Rekrutierungsstrategien, wie sie in Ziel 2 ausführlich beschrieben wurden, können getestet werden. (2) Verringerte Cas-Targeting-Effizienz durch verlängerte gRNA-Varianten: dies wird höchstwahrscheinlich ein Problem für 5'verlängerte gRNAs sein. Basierend auf Strukturdaten24 können Cas9-Mutanten so konzipiert und selektiert werden, dass sie Varianten mit größerer Toleranz gegenüber gRNA-Verlängerungen identifizieren können. Außerdem könnten gRNA-Bibliotheken in Zellen auf Linker gescreent werden, die die Targeting-Aktivität verbessern.
  • Bedeutung
  • Diese ersten Ergebnisse zeigen, dass Cas9-Nickasen und verlängerte gRNAs eine zielprimierte reverse Transkription an gebundenen DNA-Targets mithilfe einer transwirkend zugeführten reversen Transkriptase einleiten können. Zu beachten ist, dass die Cas9-Bindung von entscheidender Bedeutung für die Produktbildung befunden wurde. Obwohl dies vielleicht kein absolutes Erfordernis für die Genombearbeitung in Zellen ist, würde die Weiterentwicklung eines Systems mit der Einbindung einer cis-wirksamen RT-Enzymfunktion die Wahrscheinlichkeit des Erfolgs in zellbasierten Anwendungen erheblich erhöhen. Die Erreichung der verbleibenden Aspekte dieses Ziels würde eine molekulare Grundlage zur Durchführung von präzisen Genombearbeitungen im Kontext des menschlichen Genoms schaffen.
  • 2. Etablierung von Prime Editing in menschlichen Zellen.
  • Hintergrund und Begründung
  • In der vorgeschlagenen Strategie führt ein engineerter RT-Cas9:gRNA-Komplex mutagene 3'-DNA-Flaps an genomischen Zielstellen ein. Es wird angenommen, dass mutagene 3'-DNA-Flaps mit einem einzigen Mismatch von der DNA-Reparaturmaschinerie durch energetisch zugängliche Äquilibrierung mit angrenzenden 5'-Flaps eingebunden werden, die vorzugsweise entfernt würden (1C-1D). Die DNA-Replikations- und -Reparaturmaschinerien treffen bei der Bearbeitung von Okazaki-Fragmenten46 und im Verlauf der Long Patch-Basen-Exzisions-Reparatur (LP-BER)47 auf 5'-ssDNA-Flaps. 5'-Flaps sind die bevorzugten Substrate für die breitflächig exprimierte Flap-Endonuklease FEN1, die vom homotrimerischen DNA-Klammer-Komplex des PCNA48 zur DNA-Reparaturstellen rekrutiert wird. Das PCNA dient außerdem als Gerüst für gleichzeitige Rekrutierungen von anderen Reparaturfaktoren, einschließlich der DNA-Ligase Lig149. Das als Werkzeuggürtel agierende PCNA beschleunigt die serielle Flap-Spaltung und -Ligation, die zur Verarbeitung der bei jeder Zellteilung50,51 generierten Millionen Okazaki-Fragmente von grundlegender Bedeutung sind. Basierend auf der Ähnlichkeit mit diesen natürlichen DNA-Zwischenprodukten wird angenommen, dass mutagene Stränge durch Äquilibrierung mit 5'-Flaps eingebunden werden, gefolgt von einer koordinierten Exzision und Ligation der 5'-Flaps. Eine Mismatch-Reparatur (MMR) sollte dann an beiden Strängen mit gleicher Wahrscheinlichkeit erfolgen und zur Editierung oder Reversion führen (1C-1D). Alternativ könnte zunächst eine DNA-Replikation erfolgen und direkt zur Einbindung der Änderung in den neu synthetisierten Tochterstrang führen. Obwohl die höchste zu erwartende Ausbeute von diesem Verfahren 50 % ist, könnten mehrere Substratbearbeitungsversuche aufgrund der Irreversibilität der Bearbeitung einer Reparatur die Vollendung der Reaktion vorantreiben.
  • Erste Ergebnisse
  • DNA-Flaps induzieren stellenspezifische Mutagenese in Plasmid-Modellsubstraten in Hefe- und HEK-Zellen. Zum Testen der vorgeschlagenen Bearbeitungsstrategie wurden Studien mit Plasmid-Modellsubstraten eingeleitet, die dem Produkt von TPRT ähnelnde mutagene 3'-Flaps enthielten. Ein Reporter mit zwei fluoreszierenden Proteinen wurde erzeugt, der ein Stop-Codon zwischen GFP und mCherry codiert. Mutagene Flaps codieren eine Korrektur am Stop-Codon (9A) und aktivieren die mCherry-Synthese. Auf diese Art lässt sich die Effizienz der Mutagenese durch GFP:mCherry-Verhältnisse quantifizieren. Plasmid-Substrate wurden in vitro vorbereitet und in Hefe- (S. Cerevisiae)) oder menschliche Zellen (HEK293) eingebracht. Eine hochfrequente Mutagenese wurde in beiden Systemen beobachtet (9B) und isolierte Hefekolonien enthielten entweder die revertierte Base, die mutierte Base oder eine Kombination aus beiden Produkten (9C). Die Erkennung der letzteren deutet daraufhin, dass die Plasmid-Replikation vor dem MMR in diesen Fällen erfolgte, und legt weiterhin nahe, dass die Flap-Exzision und -Ligation der MMR vorangehen. Dieses Ergebnis beweist die Durchführbarkeit der DNA-Bearbeitung unter Verwendung von 3'-mutagenen Strängen.
  • • Systematische Untersuchungen mit Flap-Modell-Substraten
  • Basierend auf den oben beschriebenen ersten Ergebnissen wird ein breiteres Spektrum von Flap-Substraten in HEK-Zellen evaluiert, um Grundsätze der effizienten Bearbeitung zu folgern. 3'-ssDNA-Flaps werden systematisch variiert, um den Einfluss von Mismatch-Paarungen, der Lage des mutagenen Nukleotids auf dem Flap und der Identität des terminalen Nukleotids zu bestimmen (9D). Einzelne Nukleotidinsertionen und -deletionen werden ebenfalls untersucht. Mittels Amplicon-Sequenzierung wird die Präzision der Bearbeitung analysiert. Diese Ergebnisse werden in die Konzipierung der reversen Transkriptionsvorlagen der gRNA einfließen.
  • Die In vitro-TPRT an Plasmid-Substraten führt zu effizienten Bearbeitungsergebnissen. Die bei Ziel 1 entstandenen TPRT-Reaktionen wurden verwendet, um Mutagenese in einem Plasmid-Substrat einzuleiten. Die Reaktion wurde auf kreisförmigen DNA-Plasmid-Substraten ausgeführt (siehe 10). Das schließt die Möglichkeit einer DNA-Strang-Disassoziation als Mechanismus für eine RT-Verlängerung in den vorherigen in vitro-Experimenten aus. Es ermöglicht außerdem die Untersuchung von DNA-Reparaturen von Flap-Substraten in Zellen. Ein doppelt fluoreszierendes Reporter-Plasmid wurde für die Hefe-Expression (S. Cerevisiae) konstruiert. Dieses Plasmid codiert GFP (grün fluoreszierendes Protein) und mCherry (rot fluoreszierendes Protein) mit einem eingreifenden Stop-Codon (TGA). Die Expression dieses Konstrukts in Hefe produziert nur GFP. Das Plasmid wurde als Substrat für die in vitro-TRT [Cas9(H840A)-Nickase, engineerte gRNA, MLV RT-Enzyme [dNTPS] verwendet. Die gRNA-Verlängerung codiert eine Mutation des Stop-Codons. Der Flap-Strang wird für die Reparatur des Stop-Codons verwendet und erwartungsgemäß ein Plasmid produzieren, dass sowohl GFP als auch mCherry als Fusionsprotein exprimiert. Mit Plasmid transformierte Hefezellen mit doppelten Fusionsproteinen sind in 10 veranschaulicht. Die Transformation eines übergeordneten Plasmids oder eines durch Cas9(H840A) mit einem Nick versehenen in vitro-Plasmids ergibt nur grünes GFP exprimierende Kolonien. Die TRT-Reaktion mit 5'-verlängerten oder 3'-verlängerten gRNAs erzeugt eine Mischung aus grünen und gelben Kolonien. Die letzteren exprimieren sowohl GFP als auch mCherry. Mit der 3'-verlängerten gRNA werden mehr gelbe Kolonien beobachtet. Eine positive Kontrolle mit keinem Stop-Codon ist ebenfalls aufgeführt.
  • Dieses Ergebnis weist nach, dass lange doppeltsträngige Substrate TPRT durchlaufen können und dass TPRT-Produkte die Bearbeitung in eukaryotischen Zellen induzieren.
  • Ein weiteres Experiment, ähnlich dem vorangehenden Prime Editing-Experiment, wurde durchgeführt, aber anstatt des Einbaus einer Punktmutation in das Stop-Codon, bewirkt das TRT-Editing eine einzelne Nukleotid-Insertion (links) oder -Deletion (rechts), die eine Frameshift-Mutation repariert und die Synthese des stromabwärtigen mCherry ermöglicht (siehe 11). In beiden Experimenten wurden 3'-verlängerte gRNAs verwendet. Einzelne Kolonien von den TRT-Transformationen wurden ausgewählt und mittels Sanger-Sequenzierung analysiert (12). Grüne Kolonien enthielten Plasmide mit der ursprünglichen DNA-Sequenz, während gelbe Kolonien die von der TRT-editierenden gRNA konzipierte exakte Mutation enthielten. Keine weiteren Punktmutationen oder Indels wurden nachgewiesen.
  • Etablierung von Prime Editing in HEK-Zellen unter Verwendung von RT-Cas9-Architekturen
  • Die optimierten Konstrukte der vorherigen Ziele werden für die Säugerexpression und zur Bearbeitung an Zielpunkten im menschlichen Genom angepasst. Mehrere RT-Enzyme und Fusionsarchitekturen werden zusätzlich zum angrenzenden Targeting mit sekundären gRNAs (verkürzt, um Nicking zu verhindern) untersucht. Die nichtkovalente RT-Rekrutierung wird mithilfe des Sun-Tag-Systems52 und des MS2-Aptamer-Systems53 ebenfalls evaluiert. Indel-Bildungsassays werden zur Beurteilung der Targeting-Effizienz mit Standard-gRNAs und RT-Cas9-Fusionen (wie oben) verwendet. Für jede Genomstelle werden danach verlängerte gRNAS und RT-Cas9-Paare auf die Bearbeitung von einzelnen Nukleotiden untersucht. Die Bearbeitungsergebnisse werden mit MiSeq. analysiert.
  • Erste Experimente in HEK-Zellen wurden unter Verwendung von Cas9-RT-Fusionen durchgeführt. Die Bearbeitung durch in Zellen exprimierte Komponenten erfordert eine Cas9(H840A)-Nickase, eine reverse Transkriptase (als Fusion exprimiert oder transwirkend zugeführt) und eine engineerte gRNA mit einer 3'-Verlängerung (siehe 14). Erste Untersuchungen ergaben, dass die Länge der Primer-Bindungsstelle innerhalb der gRNA-Verlängerung wichtig für die Erhöhung der Bearbeitungseffizienz in menschlichen Zellen war (siehe 15).
  • Optimierung der Prime Editing-Parameter in HEK-Zellen
  • Nach der Identifizierung der Cas9-RT-Architekturen, die Prime Editing in Zellen durchführen können, werden die Komponenten und das Konzept optimiert, um hocheffizientes Editing zu ermöglichen. Der Locus und die Nukleotid-Identität der codierten Punktmutation und die Gesamtlänge des neu synthetisierten DNA-Strangs werden variiert, um den Bearbeitungsumfang und potenzielle Beschränkungen zu evaluieren. Kurze Insertions- und Deletionsmutationen werden ebenfalls untersucht. Proteinexpressionskonstrukte werden codonoptimiert. Sofern erfolgreich, würde dies effizientes Prime Editing in Säugerzellen nachweisen.
  • Erstes Ergebnis. Zusätzliche gRNAs wurden konzipiert, um das RT-Enzym am Bearbeitungspunkt auf eine höhere lokale Konzentration zu bringen, sofern eine intramolekulare reverse Transkription durch das fusionierte RT-Enzym nicht möglich wäre. Diese zusätzlichen Guides sind am 5'-Ende (14-15 NT-Spacer) verkürzt, was zuvor nachweislich Cas9-Schnitte verhindert, aber die Bindung aufrechterhalten hat (siehe 16). Der HEK3-Locus wurde zur Prüfung dieser Strategie ausgewählt.
  • Potenzielle Schwierigkeiten und Alternativen
  • (1) gRNA-Zerfall in Zellen: Wenn verlängerte gRNA-Enden in Zellen verkürzt werden, könnten stabilisierende sekundäre Strukturen eingebaut oder synthetische gRNAs mit stabilisierenden Modifikationen getestet werden. (2) Kein nachweisliches Editing in menschlichen Zellen: Zusätzliche Strategien werden untersucht, einschließlich sekundäres Targeting von RT-Cas9-Fusionen an angrenzende Genomstellen54. Darüber hinaus könnten mögliche gezielte Evolutionsstrategien in E. coli oder S. cerevisiae analysiert werden.
  • Bedeutung
  • Wenn Prime Editing in experimentellen Zelllinien etabliert werden könnte, hätte dies aufgrund der Möglichkeit einer schnellen Erzeugung und Charakterisierung einer Vielzahl von Punktmutationen in menschlichen Genen unmittelbare Auswirkungen auf die biomedizinische Grundlagenforschung. Die Allgemeingültigkeit dieses Verfahrens und sein orthogonales Bearbeitungsfenster in Bezug auf Base Editors würde ein Konzept zum Einbau von vielen gegenwärtig unzugänglichen Mutationen bereitstellen. Ferner, wenn Prime Editing für hohe Effizienz und Produktreinheit optimiert werden könnte, wäre dessen potenzielle Anwendbarkeit zur Korrektur von Krankheitsmutationen in anderen menschlichen Zelltypen signifikant.
  • 3. Bewerkstelligung einer lagespezifischen Bearbeitung pathogener Mutationen in menschlichen Zellkulturen.
  • Hintergrund und Begründung.
  • Eine Vielzahl pathogener Mutationen kann aufgrund von PAM-Beschränkungen oder der Notwendigkeit von Transversions- oder Indel-Mutationskorrekturen mit den gegenwärtigen Base Editors nicht korrigiert werden. Mit Prime Editing sind theoretisch alle Transitionen und Transversionen sowie auch kleine Insertionen und Deletionen möglich. Des Weiteren unterscheidet sich das Prime Editing-Fenster (erwartungsgemäß -3 bis +4) im Verhältnis zum PAM von dem von Base Editors (-18 bis -12) (13). Gegenwärtig von Base Editors nicht korrigierbare Mendelsche Erkrankungen umfassen: (1) die Glu6Val-Gründermutation der Sichelzellkrankheit in Hämoglobin beta (erfordert eine Transversion von A•T zu T•A); (2) die häufigste His1069G1n-Variante des Morbus Wilson in ATP7B (erfordert eine Transversion von G•C zu T•A); und (3) die APhe508-Mutation in CFTR, die Mukoviszidose verursacht (erfordert eine 3-Nukleotid-Insertion). Jeder dieser Targets enthält ein entsprechend positioniertes PAM für das SpCas9-Targeting und Prime Editing.
  • Erste Ergebnisse.
  • • T zu A Editing in HEK3-Zellen ist mit dem gegenwärtigen Base Editing nicht durchführbar, jedoch mit TRPT Editing machbar (siehe FIG. 17A-17C).
  • 17A zeigt ein Diagramm mit der T zu A-Konvertierung in % am Ziel-Nukleotid nach der Transfektion der Komponenten in menschlichen embryonalen Nierenzellen (HEK). Diese Daten legen Ergebnisse unter Verwendung einer N-terminalen Fusion einer reversen Wildtyp-MLV-Transkriptase zur Cas9(H840A) Nickase (32-Aminosäure-Linker) vor. Die Bearbeitungseffizienz konnte durch eine Verlängerung der Primer-Bindungsstelle von 7 Nukleotiden auf 11 oder 12 Nukleotide merklich verbessert werden. Außerdem verbessert der zusätzliche Guide A, der sich gerade stromaufwärts von der Bearbeitungsstelle befindet, (siehe 16) die Bearbeitungsaktivität erheblich, insbesondere bei kürzeren Primer-Bindungsstellen. Die Bearbeitungseffizienz wurde mittels Amplicon-Sequenzierung unter Verwendung der Illumina MiSeq-Plattform quantifiziert. 17B zeigt ebenfalls die T zu A-Konvertierung in % am Ziel-Nukleotid nach der Transfektion der Komponenten in menschlichen embryonalen Nierenzellen (HEK), aber diese Daten legen Ergebnisse basierend auf einer C-terminalen Fusion des RT-Enzyms vor. Hierbei hat der zusätzliche Guide A eine nicht so signifikante Wirkung und die Bearbeitungseffizienz ist insgesamt höher. 17C zeigt Daten, die Ergebnisse unter Verwendung einer N-terminalen Fusion einer reversen Wildtyp-MLV-Transkriptase zur Cas9(H840A) Nickase vorlegen, ähnlich wie die in 17A verwendete; der Linker zwischen der MLV RT und Cas9 ist 60 anstatt 32 Aminosäuren lang.
  • • T zu A Editing an HEK3-Stellen durch TPRT-Ergebnisse zeigt hohe Reinheit.
  • 18 zeigt das Ergebnis der Sequenzierungsanalyse mittels Hochdurchsatz-Amplicon-Sequenzierung. Das Ergebnis weist die am häufigsten vorkommenden Genotypen von bearbeiteten Zellen auf. Beachtenswert ist, dass keine signifikanten Indel-Produkte produziert wurden und dass die gewünschte Punktmutation (T zu A) sauber ohne angrenzende Änderungen eingebracht werden konnte. Die erste Sequenz zeigt den Referenz-Genotyp. Die oberen beiden Produkte sind der einen endogenen Polymorphismus (G oder A) enthaltende Ausgangsgenotyp. Die unteren zwei Produkte repräsentieren die korrekt editierten Genotypen.
  • • MLV RT-Mutanten verbessern das Editing.
  • Mutante reverse Transkriptasen, wie sie von Baranauskas, et al (Ausgabedatum: 10.1093/protein/gzs034) beschrieben sind, wurden als C-terminale Fusionen an die Cas9(H840A)-Nickase für die Ziel-Nukleotidbearbeitung in menschlichen embryonalen Nierenzellen (HEK) untersucht. Das Cas9-RT-Editor-Plasmid wurde mit einem eine 3'-Prime Editing-Guide-RNA codierenden Plasmid cotransfiziert, wobei die Guide-RNA eine reverse Transkription templiert. Die Bearbeitungseffizienz am Ziel-Nukleotid (blaue Balken) wird zusammen mit Indel-Raten (orange Balken) in 19 dargestellt. WT bezieht sich auf das Wildtyp-MLV RT-Enzym. Die mutanten Enzyme (Ml bis M4) enthalten die rechts aufgeführten Mutationen. Die Bearbeitungsraten wurden mittels Hochdurchsatz-Sequenzierung von genomischen DNA-Amplicons quantifiziert.
  • Nicking im komplementären Strang mit einer zweiten gRNA verbessert die Bearbeitung.
  • Dieses Experiment evaluiert die Bearbeitungseffizienz des Ziel-Nukleotids, wenn ein einzelnes Strang-Nicking im komplementären DNA-Strang in der Nähe des Ziel-Nukleotids eingebracht wird, wobei angenommen wird, dass dies die Mismatch-Reparatur dazu anleitet, vorzugsweise das ursprüngliche Nukleotid zu entfernen und das Basenpaar zur gewünschten Änderung zu konvertieren. Das Cas9(H840A)-RT-Bearbeitungskonstrukt wurde mit zwei die Guide-RNA codierenden Plasmiden cotransfiziert, wobei eines davon die reverse Transkription templiert und das andere den komplementären DNA-Strang zum Nicking anzielt. Nicking in verschiedenen Abständen vom Ziel-Nukleotid wurde untersucht (orange Dreiecke) (siehe 20). Die Bearbeitungseffizienz am Ziel-Basenpaar (blaue Balken) wird zusammen mit der Indel-Bildungsrate (orange Balken) angezeigt. Das „Kein“-Beispiel umfasst keine einen komplementären Strang mit einem Nick versehende Guide-RNA. Die Bearbeitungsraten wurden mittels Hochdurchsatz-Sequenzierung von genomischen DNA-Amplicons quantifiziert.
  • 21 zeigt verarbeitete Hochdurchsatz-Sequenzierungsdaten in Bezug auf die gewünschte T zu A-Transversionsmutation und das generelle Fehlen von anderen besonderen Nebenprodukten der Genombearbeitung.
  • Anwendungsbereich. Der potenzielle Anwendungsbereich für die neue Bearbeitungstechnologie wird in 13 veranschaulicht und mit Deaminase-vermittelten Base Editor-Technologien verglichen. Zuvor entwickelte Base Editors zielen eine Region ~15 ± 2 Basenpaare stromaufwärts von PAM an. Durch die Konvertierung von C- oder A-Ziel-Nukleotiden zu T oder G ermöglichen die zuvor entwickelten Base Editors alle Transitionsmutationen (Konvertierungen von A:T zu G:C). Diese zuvor entwickelten Base Editors sind jedoch nicht in der Lage, Transitionsmutationen (A zu T, A zu C, G zu T, G zu C, T zu A, T zu G, C zu A, C zu G) einzubauen. Ferner können sich im Fall von mehreren Ziel-Nukleotiden im Bearbeitungsfenster zusätzliche unerwünschte Änderungen ergeben.
  • Die neue Prime Editing-Technologie könnte theoretisch jede Nukleotid- und Basenpaar-Konvertierung einbauen sowie auch geringfügige Insertions- und Deletionsänderungen. In Bezug auf PAM beginnen Prime Editing-Fenster an der Nick-Stelle der DNA (3 Basen stromaufwärts von PAM) und enden an einer bisher unbestimmten Stelle stromabwärts von PAM. Bemerkenswert ist, dass sich dieses Bearbeitungsfenster von dem von Deaminase-Base Editors unterscheidet. Weil das TPRT-System Bearbeitungen mittels DNA-Polymerase-Enzymen vornimmt, weist es potenziell alle diesbezüglichen Vorteile auf, einschließlich Allgemeingültigkeit, Präzision und Detailtreue.
  • Korrektur von pathogenen Mutationen in von Patienten abgeleiteten Zelllinien.
  • Relevante Mutationen beherbergende Zelllinien (Sichelzellenkrankheit: CD34+ hämatopoetische Stammzellen; Morbus Wilson, kultivierte Fibroblasten; Mukoviszidose; kultivierte Bronchialepithelien) werden von ATCC, der Biobank des Coriell Instituts oder Partnerlaboratorien von Harvard/Broad bezogen. Die Bearbeitungseffizienz wird mittels Hochdurchsatz-Sequenzierung evaluiert und die Wirksamkeit des korrigierten Genotyps mittels phänotypischen Assays (Hämoglobin HPLC, ATP7B Immunfärbung und CFTR-Membranpotential-Assays) getestet.
  • Charakterisierung von Off-Target-Bearbeitungsaktivitäten.
  • Potenzielles Off-Target-Editing wird mit bekannten Verfahren, wie beispielsweise GUIDE-seq55 und CIRCLE-seq56, unter Verwendung von mit Wildtyp-Cas9 gepaarten ZielgRNAs überprüft. Bei Feststellung potenzieller Off-Targets werden diese Stellen in TPRTeditierten Zellen untersucht, um tatsächliche Off-Target-Bearbeitungen zu identifizieren.
  • Potenzielle Schwierigkeiten und Alternativen.
  • (1) Geringe Bearbeitungseffizienz: Prime Editors (PEs) müssen ggf. für jeden Target optimiert werden. In diesem Fall können die gRNA-Bibliotheken untersucht werden, um die funktionsfähigsten Varianten für spezielle Anwendungen zu identifizieren. Die RT-Cas-Fusionsexpression und nukleare Lokalisierung können optimiert werden. Die liposomale Verabreichung von RNP könnte zur Beschränkung des Off-Target-Editing verwendet werden.
  • Anstehende Experimente.
  • Die Optimierung von gRNA-Konstrukten kann durch weitere Erforschung der Länge der Primer-Bindungsstelle und der Erweiterung des Synthese-Templates erzielt werden. Der Untersuchungsrahmen und die Allgemeingültigkeit werden verschiedene Nukleotid-Konvertierungen, kleine Insertionen und Deletionen sowie Bearbeitungsstellen in Bezug auf PAM und mehrere Bereiche im menschlichen Genom miteinbeziehen. Die Optimierung der RT-Komponente wird die Untersuchung von Mutationen in der MLV RT umfassen, um die Aktivität (Rnase H-Inaktivierung, Erhöhung der Bindungsaffinität des Primer-Templates, Anpassung der Prozessivität) zu erhöhen, und neue RT-Enzyme (Intron-RTs der Gruppe II, andere retrovirale Rts) miteinzubeziehen.
  • Bedeutung.
  • Unzählige genetische Erkrankungen ergeben sich infolge von Nukleotidänderungen in einzelnen Genen. Die Entwicklung der hier beschriebenen Genombearbeitungstechnologie und Anwendung in krankheitsrelevanten Zelltypen würde eine Grundlage für den Einsatz in der Klinik schaffen. Bei einigen Erkrankungen, wie beispielsweise der Sichelzellenkrankheit, repräsentiert eine einzelne Punktmutation den dominanten Genotyp innerhalb der Population. Bei vielen anderen Genstörungen wird jedoch eine große Heterogenität verschiedener Punktmutationen innerhalb eines einzelnen Gens in der gesamten Patientenpopulation beobachtet, wobei jedes einen ähnlichen Krankeitsphänotyp hervorruft. Daher könnte diese Technologie als allgemeines Genombearbeitungsverfahren, das theoretisch in der Lage ist, eine Vielzahl solcher Mutationen anzuvisieren, vielen dieser Patienten und deren Familien enorme potenzielle Vorteile bieten. Wenn der Machbarkeitsbeweis für diese Anwendungen in Zellen erbracht werden könnte, wäre damit die Grundlage für Studien mit Tiermodellen der Krankheit geschaffen.
  • Vorteile
  • Präzision: Die gewünschte Änderung wird mittels Nukleinsäuresequenz codiert. Allgemeingültigkeit: Theoretisch wäre jede beliebige Basenpaar-Konvertierung möglich, einschließlich Transversionsänderungen und kleiner Insertionen und Deletionen. Das Bearbeitungsfenster in Bezug auf die Cas9-PAM (Protospacer Adjacent Motif)-Sequenz unterscheidet sich deutlich von dem der Base Editors. Dieses Verfahren bewerkstelligt viele der Bearbeitungsfähigkeiten des als „Homology-directed Repair (HDR)“ bezeichneten Reparaturverfahrens, jedoch ohne die Beschränkungen der HDR (ineffizient bei den meisten Zelltypen und in der Regel begleitet von unerwünschten Nebenprodukten, wie beispielsweise Indels). Außerdem werden keine DNA-Doppelstrangbrüche vorgenommen (Doppelstrangbrüche, wenige Indels, Translokationen, große Deletionen, p53-Aktivierung usw.)
  • BEISPIEL 2 - FEHLERANFÄLLIGES PRIME EDITING (PE)
  • Die hier beschriebenen Prime Editing (PE)-Systeme können auch im Zusammenhang mit einem fehleranfälligen reversen Transkriptase-Enzym zum Einbau von Mutationen in ein Genom verwendet werden.
  • Eine Ausführungsform ist in 22 dargestellt. Zu sehen ist dabei eine schematische Darstellung eines beispielhaften Vorgangs zur Durchführung einer zielgerichteten Mutagenese mit einer fehleranfälligen reversen Transkriptase an einem Zielpunkt mithilfe eines eine Nukleinsäure programmierenden DNA-Bindungsproteins (napDNAbp), das mit einer verlängerten Guide-RNA komplexiert ist. Dieses Verfahren kann als Ausführungsform des Prime Editing für zielgerichtete Mutagenese bezeichnet werden. Die verlängerte Guide-RNA umfasst eine Verlängerung am 3'- oder 5'-Ende der Guide-RNA oder an einer intramolekularen Stelle in der Guide-RNA. In Schritt (a) kontaktiert der napDNA-Basenpaar/gRNA-Komplex das DNA-Molekül und die gRNA lenkt das napDNA-Basenpaar zur Bindung an den zu mutagenisierenden Zielort. In Schritt (b) wird ein Nick in einen der DNA-Stränge des Zielorts vorgenommen (d. h. durch Nuklease oder einen chemischen Wirkstoff) und erzeugt damit ein verfügbares 3'-Ende an einem der Stränge des Zielorts. Bei bestimmten Ausführungsformen wird der Nick in dem Strang der DNA erzeugt, der dem der R-Schleife entspricht, d. h. dem Strang, der nicht mit der Guide-RNA-Sequenz hybridisiert. In Schritt (c) interagiert der 3 ‚-terminale DNA-Strang mit dem verlängerten Abschnitt der Guide-RNA, um die reverse Transkription zu primen. In bestimmten Ausführungsformen hybridisiert der 3‘-terminale DNA-Strang mit einer speziellen RT-Priming-Sequenz am verlängerten Abschnitt der Guide-RNA. In Schritt (d) wird eine fehleranfällige reverse Transkriptase eingeschleust, die einen mutagenisierten Einzelstrang der DNA vom 3'-Ende der geprimten Stelle in Richtung 3'-Ende der Guide-RNA synthetisiert. Beispielhafte Mutationen sind mit einem Asterisk „*“ versehen. Dabei wird ein einzelsträngiger DNA-Flap gebildet, der den gewünschten mutagenisierten Bereich umfasst. In Schritt (e) werden das napDNA-Basenpaar und die Guide-RNA freigesetzt. Die Schritte (f) und (g) beziehen sich auf die Auflösung des einzelsträngigen DNA-Flaps (der die mutagenisierte Region umfasst), so dass die gewünschte mutagenisierte Region in den Zielort eingebunden wird. Dieses Verfahren kann durch Entfernen des entsprechenden 5'-endogenen DNA-Flaps, der sich nach dem Eindringen des 3'einzelsträngigen DNA-Flaps bildet und zur komplementären Sequenz am anderen Strang hybridisiert, bis zur gewünschten Produktbildung geführt werden. Dieses Verfahren kann außerdem zur Produktbildung mit Nicking des zweiten Strangs geführt werden, wie in 1F beispielhaft dargestellt. Nach dem endogenen DNA-Reparatur- und/oder -Replikationsverfahren wird die mutagenisierte Region in beide DNA-Stränge des DNA-Locus eingebunden.
  • BEISPIEL 3 - TRINUKLEOTID-REPEAT-KONTRAKTION MIT PE
  • Das hier beschriebene Prime Editing-System bzw. Prime Editing (PE)-System kann zur Kontraktion von Trinukleotid-Repeat-Mutationen (oder „Triplett-Expansionserkrankungen“) verwendet werden, um Krankheiten wie beispielsweise Morbus Huntington und andere Trinukleotid-Repeat-Erkrankungen zu behandeln. Ohne nur an Theorie gebunden sein zu wollen, wird die Triplett-Expansion durch Schlupf während der DNA-Replikation oder im Verlauf der DNA-Reparatursynthese ausgelöst. Da die Tandem-Wiederholungen eine identische Sequenz zueinander aufweisen, kann die Basenpaarung zwischen zwei DNA-Strängen an mehreren Stellen entlang der Sequenz erfolgen. Das kann zur Bildung von „Loop-out“-Strukturen während der DNA-Replikation oder der DNA-Reparatursynthese führen. Dies kann zu wiederholtem Kopieren der wiederholten Sequenz führen, wobei die Anzahl der Wiederholungen erhöht wird. Zusätzliche Mechanismen, an denen hybride RNA: DNA-Zwischenprodukte beteiligt sind, wurden vorgeschlagen. Prime Editing kann eingesetzt werden, um diese Triplett-Expansionsregionen durch Deletion eines oder mehrerer der störenden Repeat-Codon-Tripletts zur reduzieren oder zu beseitigen. Für eine Ausführungsform dieser Verwendung wird in 23 eine schematische Darstellung eines PEgRNA-Konstrukts zur Kontraktion oder Reduktion von Trinukleotid-Repeat-Sequenzen mit Prime Editing gezeigt.
  • Folglich könnte Prime Editing möglicherweise zur Korrektur jeder Trinukleotid-Repeat-Erkrankung, einschließlich Morbus Huntington, Fragile-X-Syndrom und Friedreich-Ataxie, eingesetzt werden.
  • Die am häufigsten auftretende Trinukleotid-Wiederholung enthält CAG-Tripletts, aber GAA-Tripletts (Friedreich-Ataxie) und CGG-Tripletts (Fragile-X-Syndrom) treten ebenfalls auf. Die CAG-Tripletts codieren für Glutamin (Q), daher führen CAG-Wiederholungen zu Polyglutamintrakten in den codierenden Regionen des erkrankten Proteins. Diese Sonderklasse der Trinukleotid-Repeat-Erkrankungen wird auch als „Polyglutamin-Erkrankungen (PolyQ)“ bezeichnet. Andere Trinukleotid-Wiederholungen können Veränderungen in der Genregulation hervorrufen und werden als „Nicht-Polyglutamin-Erkrankungen“ bezeichnet. Die Vererbung einer Veranlagung zur Expansion oder die Aneignung eines bereits erweiterten elterlichen Allels erhöht die Wahrscheinlichkeit für den Erwerb der Krankheit. Pathogene Expansionen von Trinukleotid-Wiederholungen könnten mithilfe von Prime Editing korrigiert werden.
  • Prime Editing kann eingesetzt werden, um Triplett-Expansionsregionen durch Nicking einer Region oberhalb der Triplett-Wiederholungsregion mit dem Prime Editor zu kontraktieren, der eine auf die Schnittstelle gezielt abgestimmte PEgRNA umfasst. Der Prime Editor synthetisiert dann basierend auf der PEgRNA als Template (d. h. der Bearbeitungsvorlage) einen neuen DNA-Strang (ssDNA-Flap), der für eine gesunde Anzahl von Triplett-Wiederholungen codiert (je nach dem speziellen Gen und der Erkrankung). Der neu synthetisierte, die gesunde Triplett-Wiederholungssequenz umfassende ssDNA-Strang wird ebenfalls synthetisiert, um einen kurzen Homologieabschnitt (d. h. einen Homologiearm) miteinzubeziehen, der mit der an das andere Ende der Wiederholung angrenzenden Sequenz übereinstimmt (roter Strang). Der Eingriff in den neu synthetisierten Strang und der darauf folgende Ersatz der endogenen DNA mit dem neu synthetisierten ssDNA-Flap führen zu einem kontraktierten Repeat-Allel.
  • BEISPIEL 4 - PEPTID-TAGGING MIT PE
  • Die hier beschriebenen Prime Editing-Systeme (d. h. PE-Systeme) können außerdem dazu verwendet werden, verschiedene Peptid-Markierungen in Protein-codierende Gene einzubringen. Diese Markierungen können HEXA-Histidin-Tags, FLAG-Tag, V5-Tag, GCN4-Tag, HA-Tag, Myc-Tag und andere umfassen. Ein solcher Ansatz kann bei Anwendungen, wie beispielsweise der Protein-Fluoreszenzmarkierung, Immunpräzipitation, Immunhistochemie, Proteinrekrutierung, induzierbaren Protein-Degrons und genomweitem Screening sinnvoll sein. Ausführungsformen werden in 25 und 26 dargestellt.
  • 25 ist eine schematische Darstellung eines gRNA-Konstrukts für Peptid-markierende Gene an endogenen Genstellen und Peptid-Tagging mit TPRT-Genom-Editing (d. h. Prime Editing). Die Markierungssysteme FlAsH und ReAsH umfassen zwei Komponenten: (1) eine Fluorophor-Biarsen-Sonde und (2) ein genetisch codiertes, Peptid enthaltendes Tetracystein-Motiv veranschaulicht durch die Sequenz FLNCCPGCCMEP (SEQ ID NO: 1). Bei der Expression innerhalb von Zellen können das Tetracystein-Motiv enthaltende Proteine mittels Fluorophor-Arsen-Sonden fluoreszenzmarkiert werden (siehe Verweis: J. Am. Chem. Soc., 2002, 124 (21), ff 6063-6076. Ausgabedatum: 10.1021/ja017687n). Das „Sortagging“-System verwendet bakterielle Sortase-Enzyme, die markierte Peptidsonden mit Proteinen konjugieren, die geeignete Peptidsubstrate enthalten (siehe Verweis: Nat. Chem. Biol. 2007 Nov;3(11):707-8. Ausgabedatum: 10.1038/nchembio.2007.31). Das FLAG-Tag (DYKDDDDK (SEQ ID NO: 2)), V5-Tag (GKPIPNPLLGLDST (SEQ-ID-NR: 3)), GCN4-Tag (EELLSKNYHLENEVARLKK (SEQ ID NO: 4)), HA-Tag (YPYDVPDYA (SEQ ID NO: 5)) und Myc-Tag (EQKLISEEDL (SEQ ID NO: 6)) werden üblicherweise als Epitop-Tags für Immunoassays verwendet. Die Pi-Klemme codiert eine Peptidsequenz (FCPF) (SEQ ID NO: 622), die mit einem aromatischen Pentafluor-Substrat markiert werden kann (Verweis: Nat. Chem. 2016 Feb;8(2): 120-8. Ausgabedatum: 10.1038/nchem.2413).
  • 26 zeigt den präzisen Einbau eines His6-Tags und eines FLAG-Tags in genomische DNA. Eine auf den HEK3-Locus gerichtete Guide-RNA wurde mit einem reversen Transkriptions-Template konzipiert, das entweder eine 18-nt His-Tag-Insertion oder eine 24-nt FLAG-Tag-Insertion codiert. Die Bearbeitungseffizienz in transfizierten HEK-Zellen wurde mittels Amplicon-Sequenzierung evaluiert. Zu beachten ist, dass die vollständige 24-nt Sequenz des FLAG-Tags außerhalb des Sichtrahmens liegt (die Sequenzierung bestätigte vollständige und präzise Insertion).
  • BEISPIEL 5 - VORBEUGUNG ODER BEHANDLUNG VON PRIONENKRANKHEIT MIT PE
  • Diese Erfindung könnte zur Bekämpfung der Prionenkrankheit bei Menschen, Nutztieren und Wildtieren beitragen. Keine zuvor beschriebene Bearbeitungsstrategie ist wirksam und sauber genug, um Schutzmutationen einzubauen oder das PRNP zuverlässig auszumerzen. Die Cas9-Nuklease und HDR können eingesetzt werden, erzeugen aber meistens eine Mischung aus PRNP-Indel-Varianten, von denen einige als pathogen vermutet werden. Darüber hinaus funktioniert HDR bei den meisten Zelltypen nicht. Prime Editing ist zuverlässig und effizient beim Einbau von beiden Arten von Mutationen, ohne übermäßig viele doppelsträngige DNA-Brüche oder daraus resultierende Indels zu erzeugen.
  • Diese Erfindung beschreibt, wie eine Schutzmutation in das PRNP eingebaut wird, um eine Progression der Prionenkrankheit zu verhindern oder aufzuhalten. Dieser Locus ist in Säugetieren konserviert, d. h. zusätzlich zur Behandlung der Erkrankung in Menschen, könnte das Verfahren auch eingesetzt werden, um Kühe und Schafe zu züchten, die immun gegen Prionenkrankheit sind, oder um Wildtierpopulationen zu heilen, die von der Prionenkrankheit befallen sind. Prime Editing wird bereits eingesetzt, um den Einbau von ~25 % eines natürlich vorkommenden Allels in menschliche Zellen zu erreichen, und vorherige Mausversuche deuten darauf hin, dass diese Einbaumenge ausreicht, um Immunität von den meisten Prionenkrankheiten zu erreichen. Dieses Verfahren ist der erste und potenziell einzige Weg, dieses Allel mit so hoher Effizienz in die meisten Zelltypen einzubauen. Eine weitere mögliche Strategie zur Behandlung ist der Einsatz von Prime Editing zur Reduzierung oder Eliminierung der Expression des PRNP durch den Einbau eines frühen Stop-Codons in das Gen. Viele Forscher prognostizieren, dass die Krankheit somit behandelt werden könnte.
  • Drei potenzielle therapeutische Strategien umfassen Prime Editing zur Reduzierung der PrP-Expression. Dieses Ziel kann durch die Einfügung von Mutationen umgesetzt werden, die ein frühzeitiges Stop-Codon im PRNP auslösen, das Start-Codon beseitigen, wichtige Aminosäure-Codons mutieren oder deletieren, Spleißstellen einfügen oder entfernen, um ein aberrantes Transkript zu erstellen, oder regulierende Elemente verändern, die Transkriptmengen reduzieren. Prime Editing zur Beseitigung von Krankheitsmutationen. Viele Varianten des PRNP wurden beschrieben (ncbi.nlm.nih.gov/pmc/articles/PMC6097508/#b154-ndt-14-2067), die zu einer erhöhten Erkrankungswahrscheinlichkeit führen. Jede bekannte Variante könnte mittels Prime Editing rückgängig gemacht werden, da mit Prime Editing alle möglichen Arten von Punktmutationen sowie lokale Insertionen und lokale Deletionen vorgenommen werden können. Prime Editing zum Einfügen einer oder mehrerer Schutzmutationen in das PRNP, die die Prionenbildung und/oder -transmission stören. So wurde beispielsweise nachgewiesen, dass G127V im menschlichen PRNP-Gen gegen viele Formen der Prionenkrankheit schützt (ncbi.nlm.nih.gov/pmc/articles/PMC4486072/). Diese Mutation wurde später als Störung der Prionenbildung durch die Verhinderung der Bildung von stabilen Beta-Faltblättern und -Dimeren beschrieben (ncbi.nlm.nih.gov/pubmed/30181558, ncbi.nlm.nih.gov/pubmed/26906032). Zusätzlich zum Einfügen einzelner Nukleotid-Polymorphismen könnte die Insertion oder Deletion von Sequenzen, die die Bildung von Prionen stören, in das bzw. von dem PRNP auch zum Schutz gegen oder zur Behandlung von Prionenkrankheit eingesetzt werden.
  • Die dritte therapeutische Strategie ist insbesondere dienlich, da das Einfügen von Schutzvarianten einen Vorteil gewähren könnte, selbst wenn die Änderung nur in wenigen Zellen erfolgt. Des Weiteren werden von der Einfügung von Schutzvarianten, insbesondere solcher, die in menschlichen Populationen natürlich vorkommen, wie G127V, keine nachteiligen Folgen erwartet, wobei die Reduzierung der Expression des Prionenproteins, wie in Strategie 1, schädliche Phänotypen zur Folge haben könnte, wie sie in PRNP Knock-out-Mäuse (ncbi.nlm.nih.gov/pmc/articles/PMC4601510/, ncbi.nlm.nih.gov/pmc/articles/PMC2634447/) dokumentiert sind.
  • Es wurde zuvor nachgewiesen, dass Mäuse, die das humane Wiltyp-Prionenprotein:die G127V-Schutzvariante des humanen Prionenproteins in einem Verhältnis von 2:1 exprimieren (ca. 33 % Expression der Schutzvariante), vollkommen immun gegen die am meisten untersuchten Formen der Prionenkrankheit waren und außerdem resistent gegenüber der Variante der Creutzfeldt-Jakob-Krankheit (vCJD), einer menschlichen Erkrankung, die von der Bovinen Spongiformen Enzephalopathie (BSE oder Rinderwahnsinn)91 übertragen wird. Mäuse, die nur die G127V-Schutzvariante exprimierten, waren vollkommen immun gegen alle getesteten Herausforderungen der Prionenkrankheit, einschließlich vCJD.
  • Es wird hier aufgezeigt, dass die G127V-Schutzmutation mittels Prime Editing effizient in menschliche Zellen in Gewebekulturen eingebaut werden kann (siehe 27).
  • Basierend auf diesen Ergebnissen werden drei Situationen beschrieben, bei denen PRNP Editing eingesetzt werden könnte. Ein Szenario, in dem PRNP Editing verwendet werden kann, ist Prime Editing bei menschlichen Patienten zur Vorbeugung bzw. Behandlung von Prionenkrankheit. Ein zweites Szenario zur Verwendung von PRNP Editing ist Prime Editing bei Nutztieren, um das Auftreten und eine Verbreitung der Prionenkrankheit zu verhindern. Sowohl bei Kühen als auch bei Schafen wurden sporadische Fälle von Prionenkrankheit beobachtet, die von dem vom PRNP-Gen generierten Protein ausgelöst wurden. Zusätzlich zu der von den Tieren erlittenen lähmenden und tödlichen Krankheit sind diese Fälle auch wirtschaftlich zum Teil aufgrund der notwendigen Maßnahmen zur Verhinderung einer Verbreitung dieser hoch ansteckenden Krankheit verheerend. Eine einzige Milchkuh im Staat Washington (USA) wurde im Dezember 2003 positiv auf BSE getestet, was eine Verlustprognose von 2,8 - 4,2 Millionen USD bei Rindfleischerzeugnissen im Folgejahr zur Folge hatte (bookstore.ksre.ksu.edu/pubs/MF2678.pdf). Das PRNP-Gen ist in Säugetieren hochkonserviert. Die Einfügung einer PRNP-Mutation, wie beispielsweise G 127V, in die Keimbahn von Nutztieren könnte das Auftreten von BSE oder Scrapie (Erscheinungsform der Prionenkrankheit in Schafen) verhindern. Ein drittes Szenario zur Verwendung von PRNP Editing ist Prime Editing, um gegen das Auftreten und die Verbreitung der Prionenkrankheit bei Wildtieren vorzubeugen. Gegenwärtig leiden Hirscharten, einschließlich Rotwild, Wapiti und Elche, in Nordamerika unter Chronic Wasting Disease (CWD), eine vom PNRP ausgelöste Erscheinungsform der Prionenkrankheit in dieser Gattung. Vorfälle bis zu 25 % wurden bei einigen Populationen beschrieben (cdc.gov/prions/cwd/occurrence.html). CWD wurde auch in Norwegen, Finnland und Südkorea berichtet. Es ist jedoch noch nicht bekannt, ob die Krankheit von diesen Arten an Menschen (cdc.gov/prions/cwd/transmission.html) oder Nutztiere übertragbar ist. Das Einfügen von PRNP-Mutationen, wie beispielsweise G127V, in die Keimbahn dieser Tiergattung könnte sie vor CWD schützen und die Gefahr der Übertragung an andere Arten, einschließlich Menschen, reduzieren.
  • Dieses Verfahren könnte zur Behandlung der Creutzfeldt-Jakob-Krankheit (CJD), Kuru, Morbus Gerstmann-Sträussler- Scheinker, der tödlichen familiären Schlaflosigkeit (FFI), Bovinen Spongiformen Enzephalopathie (BSE; Rinderwahnsinn), Scrapie (bei Schafen) und der Chronic Wasting Disease (CWD; bei Rotwild, Wapiti und Elchen) eingesetzt werden.
  • Das Verfahren müsste mit einer Verabreichungsmethode für Embryos oder adulten Nervenzellen, wie beispielsweise Mikroinjektion, Lipid-Nanopartikel oder AAV-Vektoren, verbunden werden.
  • BEISPIEL 6 - RNA-TAGGING UND -MANIPULATON MITTELS PE
  • Ein neues Verfahren für das Einfügen von Motiven in genetische Sequenzen, die die RNA in Säuger-, eukaryotischen und Bakterienzellen markieren oder anderweitig manipulieren, wird hier beschrieben. Trotz der Schätzung, dass nur 1 % des menschlichen Genoms Proteine codiert, wird nahezu das gesamte Genom zu einem gewissen Grad transkribiert. Es ist bisher noch ungeklärt, inwieweit die sich ergebende nicht codierende RNA (ncRNA) eine funktionelle Rolle spielt, ganz zu schweigen davon, welche Rolle die meisten dieser mutmaßlichen RNAs haben. Das „Tagging“ dieser RNA-Moleküle durch die Insertion einer neuen RNA-codierenden Sequenz mit einer nützlichen Eigenschaft in Gene von Interesse ist eine sinnvolle Methode zur Untersuchung der biologischen Funktionen von RNA-Molekülen in Zellen. Es kann außerdem auch sinnvoll sein, Protein codierende mRNAs mit Tags als Mittel zur Störung zu versehen und somit ein besseres Verständnis zu erlangen, wie mRNA-Modifikationen die Zellfunktion beeinflussen können. So wird beispielsweise ein ubiquitäres natürliches RNA-Tag — Polyadenylierung - von Zellen verwendet, um den Transport der mRNA in das Cytoplasma zu beeinflussen. Verschiedene Arten von Polyadenylierungssignalen ergeben unterschiedliche Transportraten und unterschiedliche mRNA-Lebensspannen und - somit - unterschiedliche Expressionsmengen des codierten Proteins.
  • Ein üblicher Ansatz zur Expression von markierten RNAs innerhalb von Zellen ist die exogene Einführung eines synthetischen Konstrukts entweder mittels (i) transienter Plasmidtransfektion, die einen kurzzeitigen Ausbruch der Gen-Expression oft auf supraphysiologischen Ebenen hervorruft; oder (ii) permanenter Integration der markierten RNA-Gene in das Genom (an willkürlichen Stellen) durch lentivirale Einbindung oder Transposone, wodurch eine verlängerte Expression ermöglicht wird. Beide dieser Strategien sind durch die Produktion veränderter Expressionsmengen und das Fehlen von natürlichen Mechanismen zur Regelung der Expression oder Aktivität der Gene beschränkt. Eine alternative Strategie ist, ein Gen von Interesse direkt an seinem ednogenen Lokus mit dem als „Homology-directed Repair (HDR)“ bezeichneten Reparaturverfahren der von Cas9 oder anderen zielgerichteten DNA-Nukleasen induzierten doppelsträngigen DNA-Brüche zu markieren. Obwohl diese Vorgehensweise die Erzeugung einer großen Bandbreite von endogen markierten Genen ermöglicht, ist HDR stark ineffizient und erfordert daher signifikantes Screening, um die gewünschte Klon-Population der Zellen zu identifiziert, die erfolgreich markiert wurden. Außerdem ist HDR in der Regel bei einer Vielzahl von Zelltypen, insbesondere bei postmiotischen Zellen, sehr ineffizient oder vollkommen inaktiv. Die geringe Effizienz von HDR wird weiterhin durch die Erzeugung von unerwünschten Indel-Produkten erschwert, was speziell im Fall der RNA-Gene problematisch sein könnte, da sie zur Produktion einer RNA führen könnten, deren Aktivitäten die Funktion normaler Allele stört. Und schließlich müssen Forscher oft verschiedene Tagging-Positionen innerhalb eines RNA-Moleküls untersuchen, um optimale Leistung zu erzielen. Die Kombination dieser drei Nachteile macht HDR zu einer weniger wünschenswerten Methode zum Einbau von Tags in die RNA.
  • Prime Editing ist eine neue Genom-Bearbeitungstechnologie, die ein gezieltes Editing der genomischen Loci mittels Transfer genetischer Informationen von der RNA zur DNA ermöglicht. Mit Prime Editing könnten RNA-Gene mit verschiedenen Komponenten, wie beispielsweise RNA-Aptamere, -Ribozyme oder anderen RNA-Motiven, markiert werden. Prime Editing ist im Vergleich zu den HDR-Strategien bei einer Vielzahl von Zelltypen potenziell schneller, kostengünstiger und effektiver. Von daher stellt die beschriebene Erfindung ein neuartiges, zweckmäßiges und nicht offensichtliches Instrument zur Untersuchung der Biologie von RNA-Genen im gesunden und erkrankten Zustand bereit. Ein neues Verfahren für die Insertion von RNA-Motiven in genetische Sequenzen, die die RNA mithilfe von Prime Editors (PE) markieren oder anderweitig manipulieren, wird hier beschrieben. PEs sind in der Lage, mehrere Nukleotide stellenspezifisch an einem gewünschten, von einem CRISPR/Cas-System ansteuerbaren genomischen Locus einzufügen, zu mutieren und/oder zu deletieren. PEs bestehen aus Fusionen zwischen Cas9-Nukleasedomänen und reversen Transkriptasedomänen. Sie werden zu ihren genomischen Zielpunkten durch engineerte PEgRNAs (Prime Editing Guide-RNAs) gelenkt, die ein führendes Distanzstück für das DNA-Targeting sowie ein Template für die die gewünschte Genomänderung codierende reverse Transkription enthalten (siehe 28A). Es wird davon ausgegangen, dass PE zur Einfügung von Motiven verwendet werden kann, die auf der RNA-Ebene funktionsfähig sind (nachfolgend als RNA-Motive bezeichnet), um nicht codierende RNAs oder mRNAs zu markieren oder anderweitig zu manipulieren. Diese Motive können zur Erhöhung der Gen-Expression, Verringerung der Gen-Expression, Änderung des Spleißens und der posttranskriptionellen Modifikation, zur Beeinflussung der subzellulären Lage der RNA, Ermöglichung der Trennung oder Ermittlung der intra- oder extrazellulären Lage der RNA (z. B. mittels fluoreszenten RNA-Aptameren wie Spinat, Spinat2, Babyspinat oder Broccoli), Rekrutierung endogener oder exogener Protein- oder RNA-Bindemittel, Einführung von sgRNAs oder zur Induzierung der RNA-Verarbeitung entweder durch Selbstspaltung oder RNAses dienen (siehe 28B). Aufgrund der Flexibilität des Prime Editing ist es nicht möglich, eine umfassende Liste der RNA-Motive bereitzustellen, die in ein Genom eingebaut werden können. Hier werden eine Reihe von Beispielen gezeigt, die den prognostizierten Umfang der durch PE eingebauten RNA-Motive, die zur Markierung von RNA-Genen verwendet werden können, weitgehend veranschaulichen. Es ist gegenwärtig nicht möglich, diese Änderungen effizient und relativ sauber in fast allen Zelltypen (einschließlich der vielen, die HDR nicht unterstützen) mit irgendeiner anderen berichteten Genom-Bearbeitungsmethode als PE vorzunehmen.
  • Die Genexpression könnte von der Codierung einer 3' untranslatierten Region (UTR) beeinflusst werden, was Änderungen im nuklearen Transport, der Retention oder der mRNA-Lebensdauer zur Folge hat. So weist der PolyA-Schwanz des Simian-Virus 40 (SV40) zusätzliche Helfersequenzen auf, die eine effiziente Transkriptionstermination ermöglichen und die Gen-Expression im Verhältnis zu anderen 3'-UTRs57,58 erhöhen können. Beispielhafte Sequenz eines SV40 PolyA-Schwanzes:
    SV40-POLYA-SCHWANZ
    Figure DE112020001339T5_0305
  • Posttranslationale Modifikationssignale, abgesehen von Polyadenilierungssignalen, könnten ebenfalls durch PE codiert werden. Dazu gehören Signale, die N6-Methyladenosin-, N1-Methyladenosin-, 5-Methylcytosin- und Pseudouridin-Modifikationen beinhalten59. Durch Verwendung von PE zum Aufnehmen von Sequenzen, die durch Enzyme gebunden sind, die diese Modifikationen innerhalb eines RNA-Transkripts schreiben oder entfernen, würde es möglich sein, deren Schreiben oder Löschen zu induzieren. Dies könnte als Werkzeug verwendet werden, um die Wirkungen dieser Marker zu untersuchen, um Zelldifferenzierung zu induzieren, Stressantworten zu beeinflussen oder, da die Funktion dieser Marker noch nicht ausreichend untersucht ist, Zielzellen anderweitig zu beeinflussen.
  • PE könnte Mutationen codieren, die eine subzelluläre Lokalisation beeinflussen. Beispielsweise kann eine Einbindung von tRNA-Lys innerhalb einer mRNA theoretisch zu einem Transport zu den Mitochondrien führen 60, während verschiedene 3' UTRs zu nuklearer Retention oder Transport führen können61.
  • Beispiele:
  • SV40-PolyA-Signal führt zu Transport.
    SV40-POLYA-SCHWANZ
    Figure DE112020001339T5_0306
  • U1-snRNA-3'-Box führt zu Retention.
    U1-SNRNA-3'-BOX
    Figure DE112020001339T5_0307
  • Eine Bestimmung der subzellulären Lokalisation von endogener RNA kann eine Herausforderung sein und erfordert die Zugabe von exogenen, fluoreszierend markierten Nukleotidsonden, wie im Fall von FISH, oder eine zeitraubende und möglicherweise ungenaue Zellfraktionierung gefolgt von einem RNA-Nachweis. Ein Codieren einer Sonde innerhalb der endogenen RNA würde viele dieser Probleme vermeiden. Ein Beispiel wäre ein Codieren eines fluoreszierenden RNA-Aptamers, wie zum Beispiel Spinat62 oder Brokkoli innerhalb einer endogenen RNA, wodurch das Vorhandensein dieser RNA durch Zugabe eines kleinmolekularen Proto-Fluorophors visualisiert wird.
  • Brokkoli-Aptamer:
    BROKKOLI-APTAMER
    Figure DE112020001339T5_0308
  • PE könnte Sequenzen einfügen oder entfernen, die RNA codieren, die von RNA-bindenden Proteinen erkannt werden, was Stabilität, Expression, Lokalisation oder Modifikation von RNA beeinflusst (siehe zum Beispiel in 63 aufgeführte Proteine).
  • PE könnte Sequenzen einfügen, die sgRNAs innerhalb des Genoms codieren, als Abwehrmechanismus gegen Viren oder Krebs. Gleichermaßen könnte es verwendet werden, um microRNAs (z. B. prä-microRNAs) einzufügen, um ein Ausschalten von Zielgenen zu lenken.
  • PE könnte Sequenzen einfügen, die zu einem Verarbeiten der RNA führen, entweder alleine oder durch externe Faktoren, entweder als Therapie oder Werkzeug zum Untersuchen der Funktion von verschiedenen Abschnitten der RNA. Beispielsweise führt das HDV-Ribozym64, wenn es in einer RNA-Sequenz enthalten ist, unmittelbar zu einem Verarbeiten der RNA 5' des Ribozyms, während das Hammerhead-Ribozym vor dem dritten Stamm innerhalb des Ribozyms spaltet65. Andere selbstspaltende Ribozyme beinhalten Pistol66, Hatchet66, Haarnadel67, Neuropora Varkud Satellite68, glmS69, Twister70 und Twister Sister66. Diese Sequenzen könnten Wildtyp- oder konstruierte oder weiterentwickelte Versionen von Ribozymen beinhalten. Der Großteil dieser Ribozyme könnte unterschiedliche Sequenzen aufweisen, abhängig von der RNA-Region, in die sie assoziiert waren, abhängig davon, wo sich die Ribozym-Schnittstelle befindet. Sequenzen, die die Verarbeitung der RNA durch externe Faktoren lenken würden, wie sequenzspezifische RNAsen71, RNAsen, die spezifische Strukturen erkennen72 - wie Dicer73 und Drosha74, könnten ebenfalls erzielt werden.
  • HDV-Ribozym:
    HDV-RIBOZYM
    Figure DE112020001339T5_0309
  • Literaturhinweise für Beispiel 6
  • Die folgenden Literaturhinweise sind hierin unter Bezugnahme in ihrer Gesamtheit aufgenommen.
    1. 1. Schek N, Cooke C, Alwine JC. Molecular and Cellular Biology. 1992.
    2. 2. Gil A, Proudfoot NJ. Cell. 1987.
    3. 3. Zhao, B.S., Roundtree, I.A., He, C. Nat Rev Mol Cell Biol. 2017.
    4. 4. Rubio, M.A.T., Hopper, A.K. Wiley Interdiscip Rev RNA 2011.
    5. 5. Shechner, D.M., Hacisuleyman E., Younger, S.T., Rinn, J.L. Nat Methods. 2015.
    6. 6. Paige, J.S., Wu, K.Y., Jaffrey, S.R. Science 2011.
    7. 7. Ray D., ... Hughes TR. Nature 2013.
    8. 8. Chadalavada, D. M., Cerrone-Szakal, A. L., Bevilacqua, P.C. RNA 2007.
    9. 9. Forster AC, Symons RH. Cell. 1987.
    10. 10. Weinberg Z, Kim PB, Chen TH, Li S, Harris KA, Lünse CE, Breaker RR. Nat. Chem. Biol. 2015.
    11. 11. Feldstein PA, Buzayan JM, Bruening G. Gene 1989.
    12. 12. Saville BJ, Collins RA. Cell. 1990.
    13. 13. Winkler WC, Nahvi A, Roth A, Collins JA, Breaker RR. Nature 2004.
    14. 14. Roth A, Weinberg Z, Chen AG, Kim PG, Ames TD, Breaker RR. Nat Chem Biol. 2013.
    15. 15. Choudhury R, Tsai YS, Dominguez D, Wang Y, Wang Z. Nat Commun. 2012.
    16. 16. MacRae IJ, Doudna JA. Curr Opin Struct Biol. 2007.
    17. 17. Bernstein E, Caudy AA, Hammond SM, Hannon GJ Nature 2001.
    18. 18. Filippov V, Solovyev V, Filippova M, Gill SS. Gene 2000.
  • BEISPIEL 7 - ERSTELLUNG VON GENBIBLIOTHEKEN MIT PE
  • Hierin wird ein neues Verfahren zur zellulären Generierung hochentwickelter Bibliotheken von Protein- oder RNA-codierenden Genen mit definierten oder variablen Insertionen, Deletionen oder definierten Aminosäure-/Nukleotid-Umwandlungen und ihre Verwendung beim Hochdurchsatz-Screening und der gerichteten Evolution beschrieben. Die im Beispiel zitierten Literaturhinweise beruhen auf der Literaturliste, die am Ende dieses Beispiels enthalten ist.
  • Die Erstellung von variablen genetischen Bibliotheken wurde am häufigsten durch mutagene PCR erreicht1. Dieses Verfahren beruht entweder auf einem Verwenden von Reaktionsbedingungen, die die Genauigkeit der DNA-Polymerase reduzieren, oder auf einem Verwenden von modifizierten DNA-Polymerasen mit höheren Mutationsraten. Als solche spiegeln sich Verzerrungen in diesen Polymerasen im Bibliotheksprodukt wider (z. B. eine Bevorzugung von Transitionsmutationen gegenüber Transversionen). Eine inhärente Einschränkung dieses Ansatzes zur Bibliothekskonstruktion ist eine relative Unfähigkeit, die Größe des zu variierenden Gens zu beeinflussen. Die meisten DNA-Polymerasen weisen extrem niedrige Raten von Indel-Mutationen2 (Insertionen oder Deletionen) auf, und die Mehrheit davon führt zu Rasterschubmutationen in proteincodierenden Bereichen, wodurch es unwahrscheinlich wird, dass Elemente der Bibliothek eine nachgelagerte Selektion bestehen. Darüber hinaus können Verzerrungen bei PCR und Klonierung es schwierig machen, einzelne Bibliotheken zu erstellen, die aus Genen unterschiedlicher Größe bestehen. Diese Einschränkungen können die Wirksamkeit von gerichteter Evolution zur Verbesserung bestehender oder zur Konstruktion neuer Proteinfunktionen stark einschränken. Bei natürlicher Evolution sind große Veränderungen der Proteinfunktion oder -wirksamkeit typischerweise mit Insertions- und Deletionsmutationen verbunden, bei denen unwahrscheinlich ist, dass sie während einer kanonischen Bibliothekserstellung für Mutagenese auftreten. Darüber hinaus treten diese Mutationen am häufigsten in Bereichen des fraglichen Proteins auf, von denen vorhergesagt wird, dass sie Schleifen bilden, im Gegensatz zum hydrophoben Kern. Daher sind die meisten unter Verwendung eines traditionellen Ansatzes ohne Verzerrung erzeugten Indels wahrscheinlich entweder schädlich oder ineffektiv.
  • Bibliotheken, die solche Mutationen auf die Stellen innerhalb des Proteins auslenken könnten, an denen sie am wahrscheinlichsten von Vorteil wären, d. h. auf Schleifenbereiche, würden einen wesentlichen Vorteil gegenüber traditionellen Bibliotheken aufweisen, da alle Bibliotheken nur auf einen Bruchteil des möglichen Mutationsraums zugreifen können. Schließlich, obwohl es zwar möglich ist, genetische Bibliotheken mit stellenspezifischen Indel-Mutationen durch mehrstufige PCR und klonale Assemblierung unter Verwendung von NNK-Primern oder über DNA-Shuffling zu erstellen, können diese Bibliotheken keine zusätzlichen Runden der ,Indelgenese‘ in kontinuierlicher Evolution durchlaufen. Kontinuierliche Evolution ist eine Art von gerichteter Evolution mit minimaler Benutzerintervention. Ein derartiges Beispiel ist PACE3. Da eine kontinuierliche Evolution mit minimaler Benutzerintervention stattfindet, muss jede Erhöhung der Vielfalt einer Bibliothek während der Evolution unter Verwendung der nativen Replikationsmaschinerie erfolgen. Als solche, obwohl Genbibliotheken mit eingefügten oder entfernten Codonen als spezifische Loci erzeugt und in PACE gescreent werden können, sind daher zusätzliche Runden der „Indelgenese“ nicht möglich.
  • Es wird in Betracht gezogen, dass die Programmierbarkeit des Prime Editing (PE) genutzt werden kann, um hochentwickelte, programmierte genetische Bibliotheken zur Verwendung bei Hochdurchsatz-Screening und bei gerichteter Evolution zu generieren (siehe 29A). PE kann definierte Anzahlen von Nukleotiden von spezifizierten genetischen Loci unter Verwendung von in einer Prime-Editing-Guide-RNA (PEgRNA) codierten Informationen einfügen, ändern oder entfernen (siehe 29B). Dies ermöglicht die Generierung von gezielten Bibliotheken mit einer oder mehreren Aminosäuren, die in die Schleifenregionen eingefügt oder aus diesen entfernt sind, wobei Mutationen am wahrscheinlichsten zu Funktionsänderungen führen, ohne Hintergrundeinführung von nichtfunktionellen Rasterschubmutationen (siehe 29C). PE kann verwendet werden, um spezifische Mutationssätze zu installieren, ohne Rücksicht auf Verzerrungen, die entweder in DNA-Polymerase oder der mutierten Sequenz inhärent sind.
  • Während beispielsweise ein Umwandeln eines CCC-Codons in ein Stopcodon über die Generierung einer kanonischen Bibliothek ein unwahrscheinliches Ereignis wäre, da es drei aufeinanderfolgende Mutationen erfordern würde, einschließlich zweier Transversionen, könnte PE verwendet werden, um ein beliebiges gegebenes Zielcodon in ein TGA-Stopcodon in einem Schritt umzuwandeln. Sie könnten auch verwendet werden, um programmierte Diversität an bestimmten Positionen zu installieren, zum Beispiel durch Einbau von Codonen, die eine beliebige hydrophobe Aminosäure an einer bestimmten Stelle codieren, während sie keine anderen codieren. Darüber hinaus könnten aufgrund der Programmierbarkeit von PE mehrere PEgRNAs verwendet werden, um mehrere unterschiedliche Editierungen an mehreren Stellen gleichzeitig zu generieren, was die Generierung hochprogrammierter Bibliotheken ermöglicht (29D). Außerdem ist es möglich, reverse Transkriptasen mit geringerer Genauigkeit zu verwenden, um Mutageneseregionen innerhalb einer ansonsten unveränderlichen Bibliothek zu generieren (wie die reverse Transkriptase von HIV-I4 oder die reverse Transkriptase von Bordetella-Phage5).
  • Die Möglichkeit iterativer Runden von PE an derselben Stelle wird ebenfalls ins Auge gefasst, was - beispielsweise - die wiederholte Insertion von Codonen an einer einzigen Stelle ermöglicht. Schließlich wird ins Auge gefasst, dass alle der oben beschriebenen Ansätze in eine kontinuierliche Evolution integriert werden können, was die Generierung neuartiger in situ evolvierender Bibliotheken ermöglicht (siehe 30). Sie könnten auch verwendet werden, um diese Bibliotheken innerhalb anderer Zelltypen zu konstruieren, wo es sonst schwierig wäre, große Bibliotheken zusammenzustellen, zum Beispiel in Säugerzellen. Eine Generierung von PEcodierenden Bakterienstämmen, die für die gerichtete Evolution optimiert wurden, wäre ein nützliches zusätzliches Werkzeug zur Identifizierung von Proteinen und RNAs mit verbesserter oder neuartiger Funktionalität. Alle diese Verwendungen von PE sind aufgrund der neuartigen Natur von PEs nicht naheliegend. Folglich wäre eine Generierung von Bibliotheken über PE ein sehr nützliches Werkzeug in der synthetischen Biologie und der gerichteten Evolution sowie für Hochdurchsatz-Screening von kombinatorischen Protein- und RNA-Mutanten.
  • Konkurrierende Ansätze
  • Das Hauptverfahren, mit dem verschiedene Bibliotheken gegenwärtig generiert werden, ist durch mutagene PCR1, oben beschrieben. Insertionen oder Deletionen können über degenerierte NNK-Primer an definierten Stellen während der PCR eingeführt werden, obwohl das Einführen derartiger Mutationen an mehreren Stellen mehrere Runden iterativer PCR und Klonierung erfordert, bevor eine vielfältigere Bibliothek über mutagene PCR konstruiert wird, was das Verfahren verlangsamt. Ein alternatives, komplementäres Verfahren ist das DNA-Shuffling, wobei Fragmente einer durch DNase-Behandlung generierten Genbibliothek ohne Primer in eine PCR-Reaktion eingeführt werden, was zum Annealing verschiedener Fragmente aneinander und zur schnellen Generierung diverserer Bibliotheken als über mutagene PCR allein führt6. Obwohl dieser Ansatz theoretisch Indel-Mutationen erzeugen kann, führt er häufiger zu Rasterschubmutation, die die Genfunktion zerstören. Darüber hinaus erfordert das DNA-Shuffling ein hohes Maß an Homologie zwischen Genfragmenten. Beide Verfahren müssen in vitro durchgeführt werden, wobei die resultierende Bibliothek in Zellen transformiert wird, während durch PE generierte Bibliotheken in situ konstruiert werden können, was ihre Verwendung bei kontinuierlicher Evolution ermöglicht. Während Bibliotheken in situ durch in-vivo-Mutagenese konstruiert werden können, beruhen diese Bibliotheken auf der zellulären Maschinerie des Wirts und zeigen Bias gegenüber Indels. Gleichermaßen, obwohl herkömmliche Klonierungsverfahren verwendet werden können, um stellenspezifische Mutationsprofile zu generieren, können sie nicht in situ verwendet werden und werden im Allgemeinen einzeln in vitro assembliert, bevor sie in Zellen transformiert werden. Die Effizienz und breite Funktionalität von PE sowohl in prokaryotischen als auch in eukaryotischen Zelltypen legt ferner nahe, dass diese Bibliotheken direkt in dem interessierenden Zelltyp konstruiert werden könnten, anstatt in einen Modellorganismus wie E. coli kloniert und dann in die interessierende Zelle oder den interessierenden Organismus transferiert zu werden. Ein weiterer konkurrierender Ansatz zur gezielten Diversifizierung ist das automatisierte Multiplex Genome Engineering oder MAGE, bei dem mehrere einzelsträngige DNA-Oligonukleotide in Replikationsgabeln eingebaut werden können und zu programmierbaren Mutationen führen7. MAGE erfordert jedoch eine signifikante Modifikation des Wirtsstamms und kann zu einer 100-fachen Zunahme von Off-Target- oder Hintergrund-Mutationen führen8, während PE höher programmiert ist und voraussichtlich zu weniger Off-Target-Wirkungen führt. Darüber hinaus ist MAGE nicht in einer breiten Vielfalt von Zelltypen, einschließlich Säugerzellen, nachgewiesen worden. Prime Editing ist eine neuartige und nicht offensichtliche ergänzende Technik zur Bibliotheksgenerierung.
  • Beispiele für PE bei gerichteter Evolution zum Aufbau von Genbibliotheken
  • In einem Beispiel kann PE in einem gerichteten Evolutionsexperiment verwendet werden, um Proteinvarianten in Genbibliotheken während eines kontinuierlichen Evolutionsexperiments unter Verwendung von PACE einzuführen, was eine iterative Akkumulation sowohl von Punktmutationen als auch von Indels auf eine Weise ermöglicht, die mit herkömmlichen Ansätzen nicht möglich ist. Es wurde bereits gezeigt, dass PE stellenspezifisch und programmierbar Nukleotide in eine genetische Sequenz in E. coli, einfügen kann. In der skizzierten gerichteten Evolution wird vorgeschlagen, Monobodies mit verbesserter Bindung an ein spezifisches Epitop über eine modifizierte Zwei-Hybrid-Protein:Protein-bindende PACE-Selektion zu identifizieren. Spezifische und hochvariable Schleifen innerhalb dieser Monobodies tragen wesentlich zur Affinität und Spezifität bei. Durch gezieltes Variieren der Länge und Zusammensetzung dieser Schleifen könnte eine verbesserte Monobody-Bindung bei PACE schnell erreicht werden. Die variierende Sequenzlänge ist jedoch keine etablierte Funktionalität von PACE. Während eine Bibliothek mit unterschiedlichen Schleifengrößen als Ausgangspunkt für PACE verwendet werden könnte, würden sich während der gesamten PACE-Selektion keine nachfolgenden Längenverbesserungen ergeben, was einen Zugang zu vorteilhaften synergistischen Kombinationen von Punktmutationen und Indel-Mutationen ausschließt. Die Einführung von PE in die PACE-Selektion würde die in-situ-Generierung und Evolution von Monobodies mit unterschiedlichen Schleifenlängen ermöglichen. Dazu ist die Einführung eines zusätzlichen PE-Plasmids in den E. coli-Wirtsstamm angedacht, das das PE-Enzym und eine oder mehrere PEgRNAs codiert. Eine Expression von PE-Enzym und PEgRNAs würde unter der Kontrolle eines kleinen Moleküls stehen, das mit einer vom Experimentator ausgewählten Rate an die PACE-Lagune abgegeben wird.
  • In verschiedenen Ausführungsformen würden die PEgRNA-Komponenten einen Spacer enthalten, der das PE zu der interessierenden Stelle auf dem Selektionsphagen lenkt, und so gestaltet sein, dass ein Vielfaches von drei Nukleotiden an der Zielstelle eingefügt werden könnte, sodass eine neue PEgRNA-Bindungsstelle eingeführt würde, was die iterative Insertion eines oder mehrerer Codonen an der Zielstelle ermöglicht.
  • Parallel dazu könnte ein anderer E. coli-Wirtsstamm PEgRNAs enthalten, die für die Entfernung eines oder mehrerer Codone als Matrize dienen würden, was ermöglicht, dass die Schleifengröße während der Evolution schrumpft. Ein PACE-Experiment könnte eine Mischung beider Stämme verwenden oder die beiden abwechseln, um das langsame und kontrollierte Hinzufügen oder Entfernen von Schleifensequenzen zu ermöglichen.
  • Es wird darauf hingewiesen, dass diese Technik auch auf die Evolution von Antikörpern angewendet werden kann. Die Bindungsprinzipien für Antikörper sind denen für Monobodies sehr ähnlich: Die Länge der Schleifen der Antikörper-Komplement-bestimmenden Region ist für ihre Bindungsfunktion entscheidend. Darüber hinaus haben sich längere Schleifenlängen als entscheidend für die Entwicklung seltener Antikörper mit allgemein schützender Aktivität gegen HIV-1 und andere Virusinfektionen erwiesen9. Die Anwendung von PE, wie oben beschrieben, auf einen Antikörper oder ein von einem Antikörper abgeleitetes Molekül würde die Erzeugung von Antikörpern mit unterschiedlicher Schleifenlänge und unterschiedlicher Schleifensequenz ermöglichen. In Kombination mit PACE würde ein solcher Ansatz eine verstärkte Bindung durch Schleifengeometrien ermöglichen, die für Standard-PACE nicht zugänglich sind, und somit eine Evolution hochfunktioneller Antikörper ermöglichen.
  • Experimente werden die Fähigkeit zur Verwendung von PE zeigen, um eine schädliche Mutation im Bakteriophagen M3 in der Phagen-unterstützten nicht kontinuierlichen Evolution (PANCE) zu korrigieren, ein notwendiger erster Schritt zur Verwendung von PE bei kontinuierlicher Evolution (siehe 69).
  • Literaturhinweise für Beispiel 7
  • Die folgenden Literaturhinweise sind hierin unter Bezugnahme in ihrer Gesamtheit aufgenommen.
    1. 1. Cadwell RC and Joyce GF. PCR Methods Appl. 1992.
    2. 2. McInerney P, Adams P, and Hadi MZ. Mol Biol Int. 2014.
    3. 3. Esvelt KM, Carlson JC, and Liu DR. Nature. 2011.
    4. 4. Naorem SS, Hin J, Wang S, Lee WR, Heng X, Miller JF, Guo H. Proc Natl Acad Sei USA 2017.
    5. 5. Martinez MA, Vartanian JP, Wain-Hobson S. Proc Natl Acad Sei USA 1994.
    6. 6. Meyer AJ, Ellefson JW, Ellington AD. Curr Protoc Mol Biol. 2014.
    7. 7. Wang HH, Isaacs FJ, Carr PA, Sun ZZ, Xu G, Forest CR, Church GM. Nature. 2009.
    8. 8. Nyerges Á et al. Proc Natl Acad Sei USA. 2016.
    9. 9. Mascola JR, Haynes BF. Immunol Rev. 2013.
  • BEISPIEL 8 - IMMUNOEPITOPINSERTION DURCH PE
  • Präzise Genom-Targeting-Technologien unter Verwendung des CRISPR/Cas-Systems wurden kürzlich in einer Vielzahl von Anwendungen untersucht, einschließlich der Insertion von gentechnisch veränderten DNA-Sequenzen in Genom-Zielloci. Zuvor wurde für diese Anwendung die homologiegerichtete Reparatur (HDR) verwendet, die eine ssDNA-Donor-Matrize und eine Reparaturinitiation mittels eines Doppelstrang-DNA-Bruchs (DSB) erforderte. Diese Strategie bietet das breiteste Spektrum möglicher Veränderungen, die in Zellen durchzuführen sind, und ist das einzige verfügbare Verfahren, um große DNA-Sequenzen in Säugerzellen einzufügen. HDR wird jedoch durch unerwünschte zelluläre Nebenwirkungen behindert, die von seinem auslösenden DSB herrühren, wie z. B. eine hohe Indelbildung, DNA-Translokationen, große Deletionen und P53-Aktivierung. Zusätzlich zu diesen Nachteilen ist HDR durch eine geringe Effizienz in vielen Zelltypen eingeschränkt (T-Zellen sind eine beachtenswerte Ausnahme von dieser Beobachtung). Jüngste Versuche, diese Nachteile zu überwinden, umfassen die Fusion menschlicher Rad51-Mutanten mit einer Cas9-D10A-Nickase (RDN), was zu einem DSB-freien HDR-System führt, das verbesserte HDR-Produkt:Indel-Verhältnisse und geringeres Off-Target-Editing aufweist, aber immer noch durch Abhängigkeiten vom Zelltyp und nur bescheidene HDR-Editingeffizienz behindert wird.
  • Kürzlich entwickelte Fusionen von Cas9 mit reversen Transkriptasen („Prime-Editoren“) gekoppelt mit PEgRNAs stellen eine neuartige Genome-Editing-Technologie dar, die gegenüber bestehenden Genome-Editing-Verfahren eine Reihe von Vorteilen bietet, einschließlich der Fähigkeit, eine beliebige einzelne Nukleotid-Substitution zu installieren und einen beliebigen kurzen Abschnitt von Nukleotiden (bis zu mindestens mehreren Dutzend Basen) auf stellenspezifische Weise einzufügen oder zu entfernen. Insbesondere werden PE-Editierungen mit im Allgemeinen geringen Raten unbeabsichtigter Indels erreicht. Als solches ermöglicht PE gezielte insertionsbasierte Editinganwendungen, die zuvor unmöglich oder unpraktisch waren.
  • Diese spezifische Erfindung beschreibt ein Verfahren zur Verwendung von Prime Editing als Mittel zum Einfügen bekannter Immunogenitätsepitope in endogene oder fremde genomische DNA, was zu einer Modifikation der entsprechenden Proteine für therapeutische oder biotechnologische Anwendungen führt (siehe 31 und 32). Vor der Erfindung von Prime Editing konnten derartige Insertionen nur ineffizient und mit hohen Raten von Indelbildung von DSBs erreicht werden. Prime Editing löst das Problem der starken Indelbildung bei Insert-Editierungen, während es im Allgemeinen eine höhere Effizienz als HDR bietet. Diese niedrigere Rate der Indelbildung stellt einen Hauptvorteil des Prime Editing gegenüber HDR als Verfahren für gezielte DNA-Insertionen dar, insbesondere bei der beschriebenen Anwendung der Insertion von Immunogenitätsepitopen. Die Länge der Epitope liegt im Bereich von wenigen Basen bis zu Hunderten von Basen. Ein Prime-Editor ist die effizienteste und sauberste Technologie, um derartige gezielte Insertionen in Säugerzellen zu erreichen.
  • Das Schlüsselkonzept der Erfindung ist die Verwendung von Prime-Editoren, um eine Nukleotidsequenz, die zuvor beschriebene Immunogenitätsepitope enthält, in endogene oder fremde genomische DNA zur Herunterregulierung und/oder Zerstörung ihrer Proteinprodukte und/oder exprimierenden Zelltypen einzufügen. Nukleotidsequenzen für die immunogene Epitopinsertion würden auf Gene in einer Weise gezielt werden, um Fusionsproteine des codierten Proteins des Zielgens und der entsprechenden Proteintranslation des eingefügten immunogenen Epitops zu erzeugen. Immunsysteme von Patienten werden zuvor darauf trainiert sein, diese Epitope als Ergebnis einer vorherigen Standardimmunisierung von einer routinemäßigen Impfung beispielsweise gegen Tetanus oder Diphtherie oder Masern zu erkennen. Als Ergebnis der immunogenen Natur der fusionierten Epitope würde erwartet, dass die Immunsysteme der Patienten das prime-editierte Protein (nicht nur das eingefügte Epitop) und möglicherweise die Zellen, aus denen es exprimiert wurde, erkennen und deaktivieren.
  • Fusionen mit Zielgenen würden nach Bedarf konstruiert, um sicherzustellen, dass die Translation des eingefügten Epitopproteins zur Immunsystemerkennung exponiert ist. Dies könnte gezielte Nukleotidinsertionen beinhalten, die zu Proteintranslationen führen, die C-terminale Fusionen von Immunogenitätsepitopen mit Zielgenen, N-terminale Fusionen von Immunogenitätsepitopen mit Zielgenen ergeben, oder die Insertion von Nukleotiden in Gene, sodass Immunogenitätsepitope innerhalb oberflächenexponierter Proteinstrukturbereiche codiert werden.
  • Proteinlinker, die als Nukleotide codiert werden, die zwischen der Zielgensequenz und der eingefügten Immunogenitätsepitop-Nukleotidsequenz eingefügt sind, müssen möglicherweise als Teil dieser Erfindung konstruiert werden, um eine Immunsystemerkennung, Zelltransport, Proteinfunktion oder Proteinfaltung des Zielgens zu ermöglichen. Diese eingefügten nukleotidcodierten Proteinlinker können (sind aber nicht beschränkt auf) variable Längen und Sequenzen des XTEN-Linkers oder variable Längen und Sequenzen von Glycin-Serin-Linkern aufweisen. Diese konstruierten Linker wurden früher verwendet, um Proteinfusionen erfolgreich zu ermöglichen.
  • Zu den Unterscheidungsmerkmalen dieser Erfindung gehört die Fähigkeit, zuvor erworbene Immunantworten auf spezifische Aminosäuresequenzen als Mittel zu verwenden, um eine Immunantwort gegen ansonsten nicht immunogene Proteine zu induzieren. Ein weiteres unterscheidendes Merkmal ist die Fähigkeit, die Nukleotidsequenzen dieser immunogenen Epitope auf eine Zielart einzufügen, die keine hohen Pegel an unerwünschten Indels als Nebenprodukt-Editierung induziert und bei ihrer Insertion effizient ist. Die hierin besprochene Erfindung hat auch die Fähigkeit, zelltypspezifische Abgabeverfahren (wie AAV-Serotypen) zu kombinieren, um Epitope in Zelltypen einzufügen, die zum Auslösen einer Immunantwort von Interesse sind.
  • Prime Editing als Mittel zum Einfügen immunogener Epitope in pathogene Gene könnte verwendet werden, um das Immunsystem des Patienten so zu programmieren, dass es eine bereite Vielfalt von Krankheiten bekämpft (nicht auf Krebs beschränkt wie bei immunonkologischen Strategien). Eine unmittelbar relevante Anwendung dieser Technologie wäre als Krebstherapeutikum, da sie den Immunevasionsmechanismus eines Tumors untergraben könnte, indem sie eine Immunantwort auf ein relevantes Onkogen wie HER2 oder Wachstumsfaktoren wie EGFR auslöst. Ein solcher Ansatz könnte der T-Zell-Konstruktion ähnlich erscheinen, aber ein neuartiger Fortschritt dieses Ansatzes besteht darin, dass er in vielen Zelltypen und für andere Krankheiten als Krebs eingesetzt werden kann, ohne dass manipulierte T-Zellen generiert und in Patienten eingeführt werden müssen.
  • Verwenden von PE zum Einfügen eines Immunogenitätsepitops, gegen das die meisten Menschen bereits geimpft sind (Tetanus, Pertussis, Diphtherie, Masern, Mumps, Röteln usw.), in ein fremdes oder ein endogenes Gen, das eine Krankheit antreibt, sodass das Immunsystem des Patienten lernt, dieses Protein zu deaktivieren.
  • Krankheiten, die einen potenziellen therapeutischen Nutzen aus der oben genannten Strategie aufweisen könnten, umfassen solche, die durch Aggregation toxischer Proteine verursacht werden, wie etwa bei tödlicher familiärer Schlaflosigkeit. Andere Krankheiten, die davon profitieren könnten, schließen solche ein, die durch pathogene Überexpression eines ansonsten nichttoxischen endogenen Proteins verursacht werden, und solche, die durch fremde Krankheitserreger verursacht werden.
  • Primäre therapeutische Indikationen beinhalten die oben erwähnten, wie Therapeutika für Krebs, Prionen und andere neurodegenerative Erkrankungen, Infektionskrankheiten und Präventivmedizin. Sekundäre therapeutische Indikationen können eine vorbeugende Behandlung von Patienten mit spät einsetzenden Erbkrankheiten einschließen. Es wird erwartet, dass die aktuellen Medikamente nach dem Pflegestandard in Verbindung mit Prime Editing bei einigen Krankheiten, wie besonders aggressiven Krebsarten, oder in Fällen verwendet werden können, bei denen Medikamente zur Linderung der Krankheitssymptome beitragen, bis die Krankheit vollständig geheilt ist.
  • Nachfolgend sind Beispiele für immunogene Epitope aufgeführt, die durch Prime Editing eingefügt werden können, um Folgendes zu erreichen:
    Figure DE112020001339T5_0310
    Figure DE112020001339T5_0311
    Figure DE112020001339T5_0312
    Figure DE112020001339T5_0313
    Figure DE112020001339T5_0314
    Figure DE112020001339T5_0315
  • Unten sind weitere Beispiele von Epitopen aufgeführt, die in ein Zielgen für Immunoepitop-Tagging integriert werden können:
  • In Beispiel 8 zitierte Literaturhinweise
  • Die folgenden Literaturhinweise sind unter Bezugnahme in ihrer Gesamtheit aufgenommen.
    1. 1. X. Wen, K. Wen, D. Cao, G. Li, R. W. Jones, J. Li, S. Szu, Y. Hoshino, L. Yuan, Inclusion of a universal tetanus toxoid CD4(+) T cell epitope P2 significantly enhanced the immunogenicity of recombinant rotavirus ΔVP8* subunit parenteral vaccines. Vaccine 32, 4420-4427 (2014).
    2. 2. G. Ada, D. Isaacs, Carbohydrate-protein conjugate vaccines. Clin Microbiol Infect 9, 79-85 (2003).
    3. 3. E. Malito, B. Bursulaya, C. Chen, P. L. Surdo, M. Picchianti, E. Balducci, M. Biancucci, A. Brock, F. Berti, M. J. Bottomley, M. Nissum, P. Costantino, R. Rappuoli, G. Spraggon, Structural basis for lack of toxicity of the diphtheria toxin mutant CRM197. Proceedings of the National Academy of Sciences 109, 5229 (2012).
    4. 4. J. de Wit, M. E. Emmelot, M. C. M. Poelen, J. Lanfermeijer, W. G. H. Han, C. van Eis, P. Kaaijk, The Human CD4(+) T Cell Response against Mumps Virus Targets a Broadly Recognized Nucleoprotein Epitope. J Virol 93, (2019).
    5. 5. M. May, C. A. Rieder, R. J. Rowe, Emergent lineages of mumps virus suggest the need for a polyvalent vaccine. Int J Infect Dis 66, 1-4 (2018).
    6. 6. M. Ramamurthy, P. Rajendiran, N. Saravanan, S. Sankar, S. Gopalan, B. Nandagopal, Identification of immunogenic B-cell epitope peptides of rubella virus E1 glycoprotein towards development of highly specific immunoassays and/or vaccine. Conference Abstract, (2019).
    7. 7. U. S. F. Tambunan, F. R. P. Sipahutar, A. A. Parikesit, D. Kerami, Vaccine Design for H5N1 Based on B- and T-cell Epitope Predictions. Bioinform Biol Insights 10, 27-35 (2016).
  • BEISPIEL 9-IN VIVO-ABGABE VON PE-AGENZIEN
  • Präzise Genom-Targeting-Technologien unter Verwendung des CRISPR/Cas9-Systems wurden kürzlich in einer Vielzahl von Anwendungen untersucht, einschließlich Gentherapie. Eine Haupteinschränkung für die Anwendung von Cas9 und Cas9-basierten Genom-Editing-Agenzien in der Gentherapie ist die Größe von Cas9 (> 4 kb), die seine effiziente Abgabe über rekombinantes adeno-assoziiertes Virus (rAAV) behindert. Kürzlich entwickelte Fusionen von Cas9 mit reversen Transkriptasen („Prime-Editoren“) stellen eine neuartige Genome-Editing-Technologie dar, die gegenüber bestehenden Genome-Editing-Verfahren eine Reihe von Vorteilen aufweist, einschließlich der Fähigkeit, eine beliebige einzelne Nukleotid-Substitution zu installieren und einen beliebig definierten kurzen (<~20) Abschnitt von Nukleotiden auf stellenspezifische Weise einzufügen oder zu entfernen. Als solches ermöglicht dieses Verfahren ein Editing von humanpathogenen Varianten, die zuvor einer Korrektur nicht zugänglich waren. Die Abgabe von Prime-Editing-Reagenzien könnte die Korrektur von genetischen Sequenzen ermöglichen, die menschliche Krankheiten verursachen, oder die Installation von krankheitsverhindernden Genvarianten ermöglichen.
  • Diese Erfindung beschreibt Verfahren zur Abgabe von Prime-Editoren in Zellen in vitro und in vivo. Prime-Editoren wurden ausschließlich in kultivierten Zellen entwickelt und charakterisiert. Kein bekanntes Verfahren kann Prime-Editoren in vivo abgeben. Die gegenwärtig offenbarten Verfahren zur Abgabe von Prime-Editoren über rAAV oder vorgefertigte Ribonukleoprotein (RNP)-Komplexe werden mehrere Barrieren für die in-vivo-Abgabe überwinden. Zum Beispiel ist die DNA, die Prime-Editoren codiert, größer als die rAAV-Packungsgrenze und erfordert daher spezielle Lösungen. Eine derartige Lösung besteht darin, den Editor fusioniert zu formulieren, um Intein-Paare zu spalten, die in zwei separate rAAV-Partikel gepackt sind, die, wenn sie gemeinsam an eine Zelle abgegeben werden, das funktionelle Editor-Protein rekonstituieren. Mehrere andere spezielle Überlegungen zur Berücksichtigung der einzigartigen Merkmale von Prime Editing werden beschrieben, einschließlich der Optimierung von zweitstelligen Nicking-Zielen und der richtigen Verpackung von Prime-Editoren in Virusvektoren, einschließlich Lentiviren und rAAV.
  • Zu den Unterscheidungsmerkmalen gehören die Verwendung von Ribonukleoprotein(RNP)-Abgaberezepturen, Prime-Editoren und nahe gelegene Nicking-Ziele können mit ihrer spezifischen sgRNA/PEgRNA vorkomplexiert werden. Dies wird den Bereich möglicher anvisierbarer Stellen erweitern und eine größere Optimierung der Editingeffizienz im Vergleich zu aktuellen Daten ermöglichen, die DNA-Abgabe verwendet haben. Unter Verwendung von entweder RNP- oder mRNA-Abgaberezepturen können variante Cas-Proteine verwendet werden, die jeweils mit ihrer eigenen Guide-RNA-Variante komplexieren. Dies wird auch eine größere Vielfalt potenzieller Nicking-Loci ermöglichen, sodass erwartet wird, dass eine Optimierung für eine größere Effizienz in einer beliebigen gegebenen Anwendung erreicht werden kann. Es wird auf Grundlage früherer Berichte über RNP (Rees et al., 2017) erwartet, dass die Verwendung von RNP die Editingspezifität erhöht. Dies würde das Off-Target-Prime-Editing reduzieren. Potenzielle Architekturen zum Aufteilen von Prime-Editoren in zwei AAV-Vektoren zur Abgabe in vivo oder ex vivo werden beschrieben. Das Packen eines Prime-Editors in ein duales AAV-System erfordert eine Optimierung von Designüberlegungen, einschließlich gespaltener Stellen, Rekonstitutionsverfahren (wie Inteins) und Leitexpressionsarchitektur. Unter Verwendung einer Mischung aus Virus und RNP für die Abgabe des Prime-Editors wird erwartet, dass das Editieren im Laufe der Zeit gesteuert wird, da RNP letztendlich in vivo abgebaut wird, was das Prime Editing anhält, nachdem kein RNP mehr bereitgestellt wird.
  • Prime-Editor-Ribonukleoprotein (RNP), mRNA mit Prime-Editor-Guide-RNA oder DNA können in Lipid-Nanopartikel, rAAV oder Lentivirus gepackt und injiziert, eingenommen oder inhaliert werden, um genomische DNA in vivo und ex vivo zu verändern, auch zum Zwecke einer Etablierung von Tiermodellen menschlicher Krankheiten, eines Testens therapeutischer und wissenschaftlicher Hypothesen in Tiermodellen menschlicher Krankheiten und einer Behandlung von Krankheiten beim Menschen.
  • Prime-Editoren könnten durchaus verwendet werden, um einen großen Teil aller Erbkrankheiten (~89 % von pathogenen humanen genetischen Varianten in Clinvar) zu korrigieren, falls geeignete Abgabewege in relevante Zelltypen in vivo entwickelt werden. Blutkrankheiten, Netzhauterkrankungen und Lebererkrankungen sind die wahrscheinlichsten ersten Anwendungen aufgrund etablierter Abgabesysteme für andere Reagenzien. AAV-Capside, andere entwickelte oder konstruierte virale Vektoren und Lipid-Nanopartikel-Formulierungen müssten in Kombination mit dieser Erfindung verwendet werden.
  • In bestimmten Ausführungsformen können eine oder mehrere der Prime-Editor-Domänen (z. B. die napDNAbp-Domäne oder die RT-Domäne) mit einer Inteinsequenz konstruiert werden.
  • BEISPIEL 10- VERWENDUNG VON PE ZUR IDENTIFIZIERUNG VON OFF-TARGET-EDITING
  • Es gibt derzeit keine beschriebenen Verfahren, um Off-Target-Editing mit Prime-Editoren zu erkennen (Prime-Editing selbst wurde noch nicht veröffentlicht). Diese Verfahren würden es Forschern ermöglichen, potenzielle Stellen von Off-Target-Editing unter Verwendung von Prime-Editoren zu identifizieren, was wichtige Erwägungen darstellen würde, wenn diese Technik zur Behandlung von Erbkrankheiten in Patienten verwendet würde.
  • Hier beschriebene Verfahren könnten auch zum Identifizieren von Off-Targets von Cas-Nukleases nützlich sein. Diese Off-Targets wurden zuvor unter Verwendung von BLESS, Guide-Seq, CIRCLE-Seq und Digenome-Seq identifiziert. Dieses Verfahren ist jedoch hinsichtlich der Empfindlichkeit und Einfachheit des Prozesses von Vorteil.
  • Das Schlüsselkonzept dieses Gesichtspunkts ist die Idee, Prime Editing zu verwenden, um eine Adaptersequenz oder Primer-Bindungsstelle einzufügen, aus einer PEgRNA als Matrize, um die schnelle Identifizierung von genomischen Off-Target-Modifikationsstellen von Cas-Nukleasen oder Prime-Editoren zu ermöglichen.
  • Es ist kein Verfahren bekannt, um auf unvoreingenommene Art und Weise Off-Target-Stellen für Prime Editing zu identifizieren. Dieses Verfahren unterscheidet sich von anderen Techniken, die Nuklease-Off-Target-Stellen identifizieren, da die Adaptersequenz im gleichen Ereignis wie DNA-Bindung und Nicking eingefügt wird, was die nachgelagerte Verarbeitung vereinfacht.
  • Die vorliegende Erfindung beinhaltet eine Identifizierung von Off-Target-Editierstellen beim Editieren innerhalb einer lebenden Zelle, in Gewebekulturen oder Tiermodellen (siehe 33). Um dieses Verfahren durchzuführen, wird eine PEgRNA generiert, die einen identischen Protospacer zum endgültigen gewünschten Editor aufweist (und, im Fall von Off-Targets bei Prime Editing, eine identische Primer-Bindungsstellen-Sequenz zum endgültigen gewünschten Editor), aber die notwendigen Sequenzen enthält, um einen Adapter oder eine Primer-Bindungsstelle nach reverser Transkription durch Prime Editing zu installieren. In-vivo-Editing wird unter Verwendung eines Prime-Editors oder einer RT-fusionierten Nuklease sowie isolierter genomischer DNA durchgeführt. Die genomische DNA wird enzymatisch oder mechanisch fragmentiert und es wird an DNA-Fragmentierungsstellen ein unterschiedlicher Adapter angefügt. PCR wird verwendet, um von einem Adapter zu dem über PEgRNA installierten Adapter zu amplifizieren. Das resultierende Produkt wird tief sequenziert, um alle modifizierten Stellen zu identifizieren.
  • Die Erfindung beinhaltet auch eine Identifizierung von Off-Target-Editierungsstellen unter Verwendung einer in-vitro-Modifikation von genomischer DNA (siehe 33). Um dieses Verfahren durchzuführen, wird RNP aus aufbereitetem Prime-Editor-Protein und eine PEgRNA zusammengesetzt, die eine Adapter- oder Primer-Bindungssequenz installiert, aber ansonsten der interessierenden PEgRNA gleicht. Dieses RNP wird mit extrahierter genomischer DNA vor oder nach der Fragmentierung der DNA und der Anheftung verschiedener Adapter an DNA-Bruchstellen inkubiert. PCR wird verwendet, um von der fragmentierten Stelle zum Adapter zu amplifizieren, der mit PE installiert wurde. Tiefensequenz zur Identifizierung von Modifikationsstellen. Dieses in-vitro-Editing-Verfahren sollte die Nachweisempfindlichkeit erhöhen, da die zelluläre DNA-Reparatur niemals den vom Prime-Editor hinzugefügten revers transkribierten DNA-Adapter eliminieren wird.
  • Diese Verfahren könnten verwendet werden, um Off-Target-Editing für einen beliebigen Prime-Editor oder einen beliebigen Genom-Editor zu identifizieren, der eine guideRNA verwendet, um eine Ziel-Schnittstelle (die meisten Cas-Nukleasen) zu erkennen.
  • Diese Verfahren könnten auf alle genetischen Krankheiten angewendet werden, für die Genom-Editoren für die Behandlung in Betracht gezogen werden.
  • BEISPIEL 11- VERWENDUNG VON PE ZUM ERMÖGLICHEN CHEMISCH INDUZIERTER DIMERISATION VON ZIELPROTEINEN IN VIVO
  • Die hierin beschriebenen Prime-Editoren können auch verwendet werden, um dimerisierungsinduzierte biologische Prozesse, wie beispielsweise Rezeptor-Signalgebung, unter Kontrolle durch ein geeignetes niedermolekulares Arzneimittel durch die genomische Integration von Genen, die niedermolekulare Bindungsproteine codieren, mit Prime Editing zu stellen, wie hierin beschrieben wird. Unter Verwendung der hierin beschriebenen Prime-Editoren kann die Gensequenz, die ein niedermolekulares Bindungsprotein codiert, in ein Gen eingefügt werden, das ein interessierendes Zielprotein in einer lebenden Zelle oder einem Patienten codiert. Diese Editierung allein sollte keinen physiologischen Effekt haben. Nach Verabreichung des niedermolekularen Arzneimittels, das typischerweise ein dimeres kleines Molekül ist, das gleichzeitig an zwei Arzneimittel bindende Proteindomänen binden kann, von denen jede mit einer Kopie des Zielproteins fusioniert ist, induziert das kleine Molekül eine Dimerisierung des Zielproteins. Dieses Zielprotein-Dimerisierungsereignis induziert dann ein biologisches Signalisierungsereignis, wie beispielsweise Erythropoese oder Insulinsignalisierung.
  • BEISPIEL 12 - PRIME EDITING: ÄUSSERST VIELSEITIGES UND PRÄZISES SUCHEN-UND-ERSETZEN-GENOME EDITING IN MENSCHLICHEN ZELLEN OHNE DOPPELSTRANG-DNA-BRÜCHE
  • Aktuelle Genome-Editing-Verfahren können Zielgene mit begleitenden Nebenprodukten von Doppelstrang-DNA-Brüchen unter Verwendung programmierbarer Nukleasen unterbrechen, löschen oder einfügen und die vier Transitionspunktmutationen an Zielloci unter Verwendung von Baseneditoren installieren. Kleine Insertionen, kleine Deletionen und die acht Transversionspunktmutationen repräsentieren jedoch zusammen die meisten pathogenen genetischen Varianten, können jedoch in den meisten Zelltypen nicht effizient und ohne einen Überschuss an Nebenprodukten korrigiert werden. Beschrieben wird hierin Prime Editing, ein äußerst vielseitiges und präzises Genome-Editing-Verfahren, das neue genetische Informationen direkt in eine bestimmte DNA-Stelle unter Verwendung von katalytisch beeinträchtigtem Cas9 schreibt, fusioniert mit einer konstruierten reverse Transkriptase, programmiert mit einer konstruierten Prime-Editing-Guide-RNA (PEgRNA), die sowohl die Zielstelle angibt und die gewünschte Editierung codiert. Es wurden mehr als 175 unterschiedliche Editierungen in menschlichen Zellen durchgeführt, um nachzuweisen, dass Prime Editing gezielte Insertionen, Deletionen, alle 12 möglichen Arten von Punktmutationen und Kombinationen davon effizient durchführen kann (typischerweise 20-60 %, bis zu 77 % in unsortierten Zellen) und mit geringen Nebenprodukten (typischerweise 1-10 %), ohne dass Doppelstrangbrüche oder Donor-DNA-Matrizen erforderlich sind. Prime Editing wurde in menschlichen Zellen angewendet, um die primären genetischen Ursachen der Sichelzellenanämie (was eine A•T-zu-T•A-Transversion in HBB erfordert) und der Tay-Sachs-Krankheit (was eine 4-Basen-Deletion in HEXA erfordert) zu korrigieren in beiden Fällen werden die pathogenen genomischen Allele mit minimalen Nebenprodukten effizient in Wildtyp umgewandelt. Prime Editing wurde auch verwendet, um menschliche Zelllinien mit diesen pathogenen HBB-Transversions- und HEXA-Insertionsmutationen zu erzeugen, um die G127V-Mutation in PRNP zu installieren, die Resistenz gegen Prionenkrankheit verleiht (was eine G•C-zu-T•A-Transversion erfordert) und um ein His6-Tag, ein FLAG-Epitop-Tag und eine erweiterte LoxP-Stelle effizient in Zielloci in menschlichen Zellen inserieren. Prime Editing bietet Vorteile bei Effizienz und Produktreinheit gegenüber HDR sowie ergänzende Stärken und Schwächen im Vergleich zum Base Editing. In Übereinstimmung mit seinem Suchen-und-Ersetzen-Mechanismus, der drei verschiedene Basenpaarungsereignisse erfordert, ist das Prime Editing viel weniger anfällig für eine Off-Target-DNA-Modifikation an bekannten Cas9-Off-Target-Stellen als Cas9. Prime Editing erweitert den Umfang und die Möglichkeiten des Genome Editing erheblich und kann im Prinzip ~89 % der bekannten pathogenen humanen genetischen Varianten korrigieren.
  • Die Fähigkeit, praktisch jede gezielte Veränderung des Genoms einer beliebigen lebenden Zelle oder eines beliebigen Lebewesens vornehmen zu können, ist ein langjähriges Ziel der Biowissenschaften. Trotz rascher Fortschritte bei Genome-Editing-Technologien kann die Mehrheit der > 75.000 bekannten menschlichen Genvarianten, die mit Krankheiten111 assoziiert sind, in den meisten therapeutisch relevanten Zellen nicht korrigiert oder installiert werden ( 38A). Programmierbare Nukleasen wie CRISPR-Cas9 stellen Doppelstrang-DNA-Brüche (DSBs) her, die Gene zerstören können, indem sie Mischungen von Insertionen und Deletionen (Indels) an den Zielstellen induzieren112-114. Nukleasen können auch verwendet werden, um Zielgene115,116 zu deletieren oder exogene Gene117-119 durch homologieunabhängige Prozesse einzufügen. Doppelstrang-DNA-Brüche sind jedoch auch mit unerwünschten Ergebnissen verbunden, einschließlich komplexer Produktmischungen, Translokationen120 und p53-Aktivierung121,122. Darüber hinaus unterscheidet sich die überwiegende Mehrheit von pathogenen Allelen von ihren nicht-pathogenen Gegenstücken durch kleine Insertionen, Deletionen oder Basensubstitutionen, deren Korrektur viel präzisere Editiertechnologien erfordert (38A). Eine homologiegerichtete Reparatur (HDR), die durch Nuklease-induzierte DSBs123 stimuliert wird, wurde häufig verwendet, um eine Vielfalt präziser DNA-Änderungen zu installieren. HDR beruht jedoch auf exogenen Donor-DNA-Reparaturmatrizen, erzeugt typischerweise einen Überschuss an Indel-Nebenprodukten aus der Endverbindungsreparatur von DSBs und ist in den meisten therapeutisch relevanten Zelltypen ineffizient (wobei T-Zellen und einige Stammzellen wichtige Ausnahmen sind)124,125. Während die Verbesserung der Effizienz und Präzision von DSB-vermitteltem Genome Editing im Fokus vielversprechender Bemühungen bleibt126-130, erfordern diese Herausforderungen die Erforschung alternativer Präzisions-Genome-Editing-Strategien.
  • Base Editing kann die vier Arten von Transitionsmutationen (C zu T, G zu A, A zu G und T zu C) effizient installieren oder korrigieren, ohne dass DSBs in einer breiten Vielfalt von Zelltypen und Organismen, einschließlich Säugetieren128-131, erforderlich sind, aber kann derzeit keine der acht Transversionsmutationen erreichen (C zu A, C zu G, G zu C, G zu T, A zu C, A zu T, T zu A und T zu G), wie beispielsweise die T•A-zu-A•T-Mutation, die erforderlich ist, um die häufigste Ursache der Sichelzellenanämie (HBB E6V) direkt zu korrigieren132. Darüber hinaus wurde über kein DSB-freies Verfahren zum Durchführen von Zieldeletionen, wie die Entfernung der 4-Basen-Duplikation, die die Tay-Sachs-Krankheit (HEXA 1278+TATC)133 verursacht, oder von gezielten Insertionen berichtet, wie die präzise 3- Basen-Insertion, die erforderlich ist, um die häufigste Ursache von Mukoviszidose direkt zu korrigieren (CFTR ΔF508)134. Zielgerichtete Transversionspunktmutationen, -insertionen und -deletionen sind daher in den meisten Zelltypen schwierig zu installieren oder effizient und ohne überschüssige Nebenprodukte zu korrigieren, obwohl sie zusammen die meisten bekannten pathogenen Allele ausmachen (38A).
  • Hierin wird die Entwicklung von Prime Editing beschrieben, einer neuen „Suchen-und-Ersetzen“-Technologie zum Genome Editing, die gezielte Insertionen, Deletionen und alle 12 möglichen Base-zu-Base-Konvertierungen an Zielloci in menschlichen Zellen vermittelt, ohne Doppelstrang-DNA-Brüche oder Donor-DNA-Matrizen zu erfordern. Prime-Editoren, anfangs durch PE1 beispielhaft dargestellt, verwenden eine reverse Transkriptase, die an eine programmierbare Nickase fusioniert ist, und eine Prime-Editing-Extended-Guide-RNA (PEgRNA), um genetische Informationen von der Erweiterung auf der PEgRNA direkt in den genomischen Ziellocus zu kopieren. Ein Prime-Editor (PE2) der zweiten Generation verwendet eine konstruierte reverse Transkriptase, um Editiereffizienzen mit minimaler (typischerweise <2 %) Indelbildung erheblich zu steigern, während ein PE3-System der dritten Generation eine zweite Guide-RNA hinzufügt, um den nicht editierten Strang zu zerschneiden, wodurch der Ersatz des nicht editierten Strangs begünstigt und die Editiereffizienz weiter erhöht wird, typischerweise auf etwa 20-50 % in menschlichen Zellen mit etwa 1-10 % Indelbildung. PE3 bietet weit weniger Nebenprodukte und eine höhere oder ähnliche Effizienz im Vergleich zu optimiertem Cas9-Nuklease-initiiertem HDR und bietet komplementäre Stärken und Schwächen im Vergleich zu Baseneditoren der aktuellen Generation.
  • PE3 wurde an genomischen Loci in humanen HEK293T-Zellen appliziert, um eine effiziente Umwandlung von HBB E6V in Wildtyp-HBB, Deletion des inserierten TATC zur Wiederherstellung von HEXA 1278+TATC in Wildtyp-HEXA, Installation der G127V-Mutation, die Resistenz gegenüber Prion-Krankheit135 verleiht (was eine G•C-zu-T•A-Transversion erfordert), in PNRP und gezielte Insertion eines His6-Tags (18 bp), FLAG-Epitop-Tags (24 bp) und einer erweiterten LoxP-Stelle für Cre-vermittelte Rekombination (44 bp) zu erreichen. Prime Editing war auch in drei anderen menschlichen Zelllinien sowie in postmitotischen primären kortikalen Neuronen der Maus mit unterschiedlicher Effizienz erfolgreich. Aufgrund eines hohen Maßes an Flexibilität in der Entfernung zwischen dem anfänglichen Nick und dem Ort der Editierung wird das Prime Editing nicht wesentlich durch die PAM-Anforderung von Cas9 eingeschränkt und kann im Prinzip auf die überwiegende Mehrheit der genomischen Loci abzielen. Off-Target-Prime Editing ist viel seltener als Off-Target-Cas9-Editierung an bekannten Cas9-Off-Target-Loci, wahrscheinlich aufgrund der Notwendigkeit von drei unterschiedlichen DNA-Basenpaarungsereignissen, damit ein produktives Prime Editing stattfinden kann. Durch die Ermöglichung präziser gezielter Insertionen, Deletionen und aller 12 möglichen Klassen von Punktmutationen an einer Vielzahl von genomischen Loci ohne die Notwendigkeit von DSBs oder Donor-DNA-Matrizen hat Prime Editing das Potenzial, die Untersuchung und Korrektur vieler Genvarianten voranzutreiben.
  • Ergebnisse
  • Strategie zur Übertragung von Informationen von einer verlängerten Guide-RNA in einen Ziel-DNA-Locus
  • Cas9 zielt auf DNA unter Verwendung einer Guide-RNA, die eine Spacer-Sequenz enthält, die an die Ziel-DNA-Stelle hybridisiert112-114,136,137. Ziel war es, Guide-RNAs zu entwickeln, um sowohl das DNA-Ziel wie in natürlichen CRISPR-Systemen zu spezifizieren138,139 als auch neue genetische Informationen aufzunehmen, die die entsprechenden DNA-Nukleotide am Ziellocus ersetzen. Der direkte Transfer genetischer Information von einer verlängerten Guide-RNA in eine spezifizierte DNA-Stelle, gefolgt von einem Ersatz der ursprünglichen, unbearbeiteten DNA, könnte im Prinzip ein allgemeines Mittel bereitstellen, um gezielte DNA-Sequenzänderungen in lebenden Zellen zu installieren, ohne von DSBs oder Donor-DNA-Matrizen abhängig zu sein. Um diesen direkten Informationstransfer zu erreichen, bestand das Ziel darin, genomische DNA, die an der Zielstelle mit einem Nick versehen wurde, um eine 3'-Hydroxylgruppe freizulegen, zu verwenden, um die reverse Transkription der genetischen Information von einer Erweiterung der konstruierten Guide-RNA (im Folgenden als Prime-Editing-Guide-RNA oder PEgRNA bezeichnet) direkt in die Zielstelle einzufügen (38A).
  • Diese anfänglichen Schritte des Nickings und der reversen Transkription, die Mechanismen ähneln, die von einigen natürlichen mobilen genetischen Elementen verwendet werden140, führen zu einem verzweigten Zwischenprodukt mit zwei redundanten einzelsträngigen DNA-Flaps an einem Strang: einem 5'-Flap, der die nicht editierte DNA-Sequenz enthält, und einem 3'-Flap, der die editierte Sequenz enthält, die von der PEgRNA kopiert wurde (38B). Um eine erfolgreiche Editierung zu erreichen, muss dieses verzweigte Zwischenprodukt aufgelöst werden, sodass der editierte 3'-Flap den nicht editierten 5'-Flap ersetzt. Während die Hybridisierung des 5'-Flap mit dem nicht editierten Strang wahrscheinlich thermodynamisch begünstigt ist, da der editierte 3'-Flap weniger Basenpaare mit dem nicht editierten Strang bilden kann, sind 5'-Flaps das bevorzugte Substrat für strukturspezifische Endonukleasen wie FEN1141, das 5'-Flaps ausschneidet, die während Folgestrang-DNA-Synthese und Basen-Exzisionsreparatur von großen Stücken generiert wurden. Es wurde argumentiert, dass eine bevorzugte 5'-Flap-Exzision und 3'-Flap-Ligation die Einbindung des editierten DNA-Strangs vorantreiben könnten, wodurch Heteroduplex-DNA erzeugt wird, die einen editierten Strang und einen nicht editierten Strang enthält (38B).
  • Eine dauerhafte Installation der Editierung könnte aus einer anschließenden DNA-Reparatur resultieren, die die Fehlpaarung zwischen den beiden DNA-Strängen auf eine Weise auflöst, die die Informationen in dem editierten Strang in den komplementären DNA-Strang kopiert (38C). Beruhend auf einer ähnlichen Strategie, die entwickelt wurde, um die Effizienz der DNA-Basen-Editierung zu maximieren131-133, wurde in Betracht gezogen, dass das Nicken des nicht editierten DNA-Strangs, das weit genug von der Stelle des ursprünglichen Nicks entfernt ist, um die Bildung von Doppelstrangbrüchen zu minimieren, die DNA-Reparatur beeinflussen könnte, um vorzugsweise den nicht editierten Strang zu ersetzen.
  • Validierung von Prime-Editing-Schritten in vitro und in Hefezellen
  • Nach der Spaltung des PAM-enthaltenden DNA-Strangs durch die RuvC-Nukleasedomäne von Cas9 kann das PAM-distale Fragment dieses Strangs von ansonsten stabilen Cas9:sgRNA:DNA-Komplexen dissoziieren143. Es wurde die Hypothese aufgestellt, dass das 3'-Ende dieses freigesetzten Strangs hinreichend zugänglich sein könnte, um die DNA-Polymerisation zu starten. Konstruktionsbemühungen von Guide-RNA144-146 und Kristallstrukturen von Cas9:sgRNA:DNA-Komplexen147-149 legen nahe, dass die 5'- und 3'-Termini der sgRNA verlängert werden können, ohne die Cas9:sgRNA-Aktivität aufzugeben. PEgRNAs wurden konstruiert, indem sgRNAs um zwei kritische Komponenten erweitert wurden: eine Primer-Bindungsstelle (PBS), die es dem 3'-Ende des genickten DNA-Strangs ermöglicht, an die PEgRNA zu hybridisieren, und eine Reverse-Transkriptase(RT)-Matrize, die die gewünschte Editierung enthält, die direkt in die genomische DNA-Stelle kopiert würde, da das 3'-Ende des genickten DNA-Strangs durch eine Polymerase über die RNA-Matrize verlängert wird (38C).
  • Diese Hypothesen wurden in vitro unter Verwendung von gereinigtem S. pyogenes Cas9-Protein getestet. Eine Reihe von PEgRNA-Kandidaten wurde konstruiert, indem sgRNAs an jedem Terminus mit einer PBS-Sequenz (5 bis 6 Nukleotide, nt) und einer RT-Matrize (7 bis 22 nt) verlängert wurden. Es wurde bestätigt, dass 5'-verlängerte PEgRNAs die Cas9-Bindung an Ziel-DNA steuern und dass sowohl 5'-verlängerte PEgRNAs als auch 3'-verlängerte PEgRNAs Cas9-vermitteltes Target-Nicking in vitro und DNA-Spaltungsaktivitäten in Säugerzellen unterstützen (44A-44C). Diese PEgRNA-Designkandidaten wurden unter Verwendung von vorgenickten 5'-Cy5-markierten dsDNA-Substraten, katalytisch totem Cas9 (dCas9) und einer kommerziellen Variante der reversen Transkriptase des Moloney-Maus-Leukämievirus (M-MLV) (44D) getestet. Wenn alle Komponenten vorhanden waren, wurde eine effiziente Umwandlung des fluoreszenzmarkierten DNA-Strangs in längere DNA-Produkte mit Gelmobilitäten beobachtet (38D, 44D-44E), die mit einer reversen Transkription entlang der RT-Matrize übereinstimmt. Produkte gewünschter Länge wurden entweder mit 5'verlängerten oder 3'-verlängerten PEgRNAs gebildet (38D-38E). Ein Weglassen von dCas9 führte zu Nick-Translationsprodukten, die von der reversen-Transkriptase-vermittelten DNA-Polymerisation auf der DNA-Matrize ohne PEgRNA-Informationstransfer abgeleitet wurden (38D). Es wurden keine DNA-Polymerisationsprodukte beobachtet, wenn die PEgRNA durch eine herkömmliche sgRNA ersetzt wurde, was die Notwendigkeit der PBS- und RT-Matrizenkomponenten der PEgRNA bestätigt (38D). Diese Ergebnisse zeigen, dass das Cas9-vermittelte DNA-Schmelzen eine einzelsträngige R-Schleife exponiert, die, wenn sie mit einem Nick versehen wird, fähig ist, die reverse Transkription von entweder einer 5'-verlängerten oder 3'-verlängerten PEgRNA zu starten.
  • Als Nächstes wurden nicht genickte dsDNA-Substrate mit einer Cas9-Nickase (H840A-Mutante) getestet, die ausschließlich den PAM-enthaltenden Strang schneidet112. Bei diesen Reaktionen erzeugten 5'-verlängerte PEgRNAs reverse Transkriptionsprodukte ineffizient, möglicherweise aufgrund von beeinträchtigter Cas9-Nickase-Aktivität (44F). 3'-verlängerte PEgRNAs ermöglichten jedoch ein robustes Cas9-Nicking und eine effiziente reverse Transkription (38E). Die Verwendung von 3'-verlängerten PEgRNAs erzeugte nur ein einziges ersichtliches Produkt, trotz des prinzipiellen Potenzials für die reverse Transkription, an einer beliebigen Stelle innerhalb des Rests der PEgRNA zu enden. Die DNA-Sequenzierung der Reaktionsprodukte mit Cas9-Nickase, RT und 3'-verlängerten PEgRNAs zeigte, dass die vollständige RT-Matrizensequenz revers in das DNA-Substrat transkribiert wurde (44G). Diese Experimente zeigten, dass 3'-verlängerte PEgRNAs bei reverser Transkription neuer DNA-Stränge als Matrize fungieren können, während sie die Fähigkeit behalten, die Cas9-Nickase-Aktivität zu steuern.
  • Um die Ergebnisse der eukaryotischen Zellen-DNA-Reparatur von 3'-Flaps zu bewerten, die von PEgRNA-programmierter reverser Transkription in vitro erzeugt wurde, wurden DNA-Nicking und reverse Transkription unter Verwendung von PEgRNAs, Cas9-Nickase und RT in vitro auf Reporterplasmidsubstraten durchgeführt und die Reaktionsprodukte wurden dann in Hefezellen (S. cerevisiae) transformiert (45A). Ermutigenderweise exprimierten 37 % der Hefetransformanten sowohl GFP- als auch mCherry-Proteine, wenn Plasmide mit 3'-verlängerten PEgRNAs editiert wurden, die eine T•A-zu-A•T-Transversion codieren, die das vorzeitige Stoppcodon korrigiert (38F, 45C). In Übereinstimmung mit den Ergebnissen in 38E und 44F ergaben in vitro durchgeführte Editierreaktionen mit 5'-verlängerten PEgRNAs weniger GFP- und mCherry-doppelt-positive Kolonien (9 %) als solche mit 3'-verlängerten PEgRNAs (38F und 45D). Produktives Editing wurde auch unter Verwendung von 3'verlängerten PEgRNAs beobachtet, die ein einzelnes Nukleotid (15 % doppelt-positive Transformanten) inserieren oder ein einzelnes Nukleotid (29 % doppelt-positive Transformanten) deletieren, um Rasterschubmutationen zu korrigieren (38F und 45E-45F). Eine DNA-Sequenzierung von editierten Plasmiden, die aus doppelt positiven Hefekolonien gewonnen wurden, bestätigte, dass die codierte Transversionseditierung an der gewünschten Sequenzposition auftrat (45G). Diese Ergebnisse zeigen, dass eine DNA-Reparatur in eukaryotischen Zellen 3'-DNA-Flaps auflösen kann, die durch Prime Editing entstehen, um präzise DNA-Editierungen einschließlich Transversionen, Insertionen und Deletionen einzubinden.
  • Design von Prime-Editor 1 (PE1)
  • Ermutigt durch die Ergebnisse in vitro und in Hefe wurde ein Prime-Editing-System mit einer minimalen Anzahl von Komponenten zur Entwicklung gesucht, das in der Lage ist, genomische DNA in Säugerzellen zu editieren. Es wurde die Hypothese aufgestellt, dass 3'verlängerte PEgRNAs (im Folgenden einfach als PEgRNAs bezeichnet, 39A) und direkte Fusionen von Cas9 H840A mit reverser Transkriptase über einen flexiblen Linker ein funktionelles Zweikomponenten-Prime-Editing-System bilden können. HEK293T-Zellen (immortalisierte humane embryonale Niere) wurden mit einem Plasmid, das eine Fusion von Wildtyp-M-MLV-Reverse-Transkriptase an einen der beiden Termini von Cas9 H840A-Nickase codiert, sowie mit einem zweiten Plasmid transfiziert, das eine PEgRNA codiert. Anfängliche Versuche führten zu keiner nachweisbaren T•A-zu-A•T-Umwandlung am HEK3-Locus.
  • Eine Verlängerung der PBS in der PEgRNA auf 8-15 Basen (39A) führte jedoch zu einer nachweisbaren T•A-zu-A•T-Editierung an der HEK3-Zielstelle (39B), mit höheren Effizienzen für Prime-Editor-Konstrukte, bei denen die RT an den C-Terminus der Cas9-Nickase fusioniert war (3,7 % maximale T•A-zu-A•T-Umwandlung mit PBS-Längen im Bereich von 8-15 nt) im Vergleich zu N-terminalen RT-Cas9-Nickase-Fusionen (1,3 % maximale T•A-zu-A•T-Umwandlung) (39B; alle Säugerzelldaten hierin geben Werte für die gesamte behandelte Zellpopulation an, ohne Selektion oder Sortierung, sofern nicht anders angegeben). Diese Ergebnisse legen nahe, dass an Cas9 fusionierte Wildtyp-M-MLV-RT längere PBS-Sequenzen für Genome Editing in menschlichen Zellen erfordert, verglichen mit dem, was in vitro unter Verwendung der kommerziellen Variante von M-MLV-RT erforderlich ist, die in trans geliefert wird. Diese mit dem C-Terminus der Cas9 H840A-Nickase fusionierte Wildtyp-M-MLV-Reverse-Transkriptase der ersten Generation wurde als PE1 bezeichnet.
  • Es wurde die Fähigkeit von PE1 getestet, Transversionspunktmutationen präzise an vier zusätzlichen genomischen Zielstellen einzuführen, die durch die PEgRNA spezifiziert sind ( 39C). Ähnlich wie beim Editieren am HEK3-Locus war die Effizienz an diesen genomischen Stellen von der PBS-Länge abhängig, wobei die maximalen Editierungseffizienzen im Bereich von 0,7-5,5 % lagen (39C). Indels von PE1 waren niedrig und betrugen im Durchschnitt 0,2 ± 0,1 % für die fünf Stellen unter Bedingungen, die die Editierungsseffizienz jeder Stelle maximierten (46A). PE1 konnte auch gezielte Insertionen und Deletionen installieren, am Beispiel einer Einzelnukleotid-Deletion (4,0 % Effizienz), einer Einzelnukleotid-Insertion (9,7 %) und einer Drei-Nukleotid-Insertion (17 %) am HEK3-Locus (39C). Diese Ergebnisse belegen die Fähigkeit von PE1, gezielte Transversionen, Insertionen und Deletionen direkt zu installieren, ohne dass Doppelstrang-DNA-Brüche oder DNA-Matrizen erforderlich sind.
  • Design von Prime-Editor 2 (PE2)
  • Während PE1 eine Vielzahl von Editierungen an mehreren Loci in HEK293T-Zellen installieren kann, waren die Editiereffizienzen im Allgemeinen gering (typischerweise ≤5 %) (39C). Es wurde die Hypothese aufgestellt, dass das Konstruieren der reversen Transkriptase in PE1 die Effizienz der DNA-Synthese innerhalb der einzigartigen Konformationsbeschränkungen des Prime-Editing-Komplexes verbessern könnte, was zu höheren Genome-Editing-Ausbeuten führt. Es wurde bereits über M-MLV-RT-Mutationen berichtet, die Enzym-Thermostabilität 110,151, Prozessivität150 und DNA:RNA-Heteroduplex-Substrataffinität152 erhöhen und die RNaseH-Aktivität inaktivieren153. Es wurden 19 PE1-Varianten konstruiert, die eine Vielzahl von Mutationen der reversen Transkriptase enthalten, um ihre Prime-Editing-Effizienz in menschlichen Zellen zu bewerten.
  • Zunächst wurde eine Reihe von M-MLV-RT-Varianten untersucht, die zuvor aufgrund ihrer Fähigkeit, die reverse Transkription bei erhöhten Temperaturen zu unterstützen, aus der Laborevolution hervorgegangen sind150. Die sukzessive Einführung von drei dieser Aminosäuresubstitutionen (D200N, L603W und T330P) in M-MLV RT, im Folgenden als M3 bezeichnet, führte zu einer 6,8-fachen durchschnittlichen Steigerung der Transversions- und Insertionsbearbeitungseffizienz über fünf genomische Loci in HEK293T-Zellen verglichen mit dem von PE1 (47A-47S).
  • Als Nächstes wurden in Kombination mit M3 zusätzliche Mutationen der reversen Transkriptase getestet, von denen zuvor gezeigt wurde, dass sie eine Bindung an den Matrize:PBS-Komplex, Enzymprozessivität und Thermostabilität152 verbessern. Unter den 14 zusätzlichen analysierten Mutanten verbesserte eine Variante mit T306K- und W313F-Substitutionen zusätzlich zu den M3-Mutationen die Editiereffizienz um zusätzlich das 1,3- bis 3,0-Fache im Vergleich zu M3 für sechs Transversions- oder Insertions-Editierungen an fünf genomischen Stellen in menschlichen Zellen (47A-47S). Diese Pentamutante der M-MLV-Reversen Transkriptase, die in die PE1-Architektur eingebaut ist (Cas9 H840A-M-MLV RT (D200N L603W T330P T306K W313F)) wird hierin nachfolgend als PE2 bezeichnet.
  • PE2 installiert Einzelnukleotid-Transversions-, Insertions- und Deletionsmutationen mit wesentlich höherer Effizienz als PE1 (39C) und ist mit kürzeren PBS-PEgRNA-Sequenzen (39C) kompatibel, was mit einer verbesserten Fähigkeit übereinstimmt, transiente genomische DNA:PBS-Komplexe produktiv einzubinden. Im Durchschnitt führte PE2 zu einer 1,6- bis 5,1-fachen Verbesserung der Punktmutationseffizienz bei Prime Editing gegenüber PE1 (39C) und in einigen Fällen verbesserte sich die Editierausbeute dramatisch bis zu 46-fach (47F und 47I). PE2 bewirkte auch gezielte Insertionen und Deletionen effizienter als PE1, wobei die gezielte Insertion des 24-bp-FLAG-Epitop-Tags am HEK3-Locus mit einer Effizienz von 4,5 % erreicht wurde, eine 15-fache Verbesserung gegenüber der Effizienz der Installation dieser Insertion mit PE1 (47D) und vermittelte eine 1-bp-Deletion in HEK3 mit 8,6 % Effizienz, 2,1-fach höher als die von PE1 (39C). Diese Ergebnisse belegen, dass PE2 ein effizienterer Prime-Editor ist als PE1.
  • Optimierung von PEgRNA-Merkmalen
  • Die Beziehung zwischen der PEgRNA-Architektur und der Effizienz von Prime Editing wurde systematisch an fünf genomischen Loci in HEK293T-Zellen mit PE2 untersucht ( 39C). Im Allgemeinen erforderten Priming-Stellen mit geringerem GC-Gehalt längere PBS-Sequenzen (EMX1 und RNF2 mit 40 % bzw. 30 % GC-Gehalt in den ersten 10 nt strangaufwärts vom Nick), wohingegen diejenigen mit größerem GC-Gehalt Prime Editing mit kürzeren PBS-Sequenzen unterstützten (HEK4 und FANCF, die 80 % bzw. 60 % GC-Gehalt in den ersten 10 nt strangaufwärts vom Nick enthalten) (39C), im Einklang mit den energetischen Anforderungen für die Hybridisierung des genickten DNA-Strangs an die PEgRNA-PBS. Keine PBS-Länge oder kein GC-Gehaltsniveau war streng prädiktiv für die Effizienz von Prime Editing, und andere Faktoren wie die Sekundärstruktur im DNA-Primer oder die PEgRNA-Extension können ebenfalls die Editierungsaktivität beeinflussen. Es wird empfohlen, für eine typische Zielsequenz mit einer PBS-Länge von ~13 nt zu beginnen und verschiedene PBS-Längen zu untersuchen, wenn die Sequenz von ~40-60 % GC-Gehalt abweicht. Bei Bedarf sollten optimale PBS-Sequenzen empirisch bestimmt werden.
  • Als Nächstes wurden die Leistungsdeterminanten des RT-Matrizenabschnitts der PEgRNA untersucht. PEgRNAs mit RT-Matrizen mit einer Länge von 10-20 nt wurden systemisch an fünf genomischen Zielstellen unter Verwendung von PE2 (39D) und mit längeren RT-Matrizen von bis zu 31 nt an drei genomischen Stellen (48A-48C) bewertet. Wie bei der PBS-Länge könnte auch die RT-Matrizenlänge variiert werden, um die Effizienz von Prime Editing zu maximieren, obwohl im Allgemeinen viele RT-Template-Längen von ≥ 10 nt Länge effizienteres Prime Editing unterstützen (39D). Da einige Zielstellen längere RT-Matrizen (>15 nt) bevorzugten, um höhere Editiereffizienzen zu erreichen (FANCF, EMX1), während andere Loci kurze RT-Matrizen (HEK3, HEK4) bevorzugten (39D), wird beim Optimieren einer PEgRNA empfohlen, dass sowohl kurze als auch lange RT-Matrizen getestet werden, beginnend mit ~10-­16 nt.
  • Wichtig ist, dass RT-Matrizen, die ein C als Nukleotid neben der terminalen Haarnadel des sgRNA-Gerüsts platzieren, im Allgemeinen zu einer geringeren Editiereffizienz im Vergleich zu anderen PEgRNAs mit RT-Matrizen ähnlicher Länge führten (48A-48C). Auf Grundlage der Struktur von an Cas9 gebundenen sgRNAs148,149 wurde spekuliert, dass die Anwesenheit eines C als erstes Nukleotid der 3'-Verlängerung einer kanonischen sgRNA die sgRNA-Gerüstfalte durch Paarung mit G81 zerstören kann, einem Nukleotid, das nativ einen pi-Stapel mit Tyr 1356 in Cas9 und einem nicht-kanonischen Basenpaar mit sgRNA A68 bildet. Da viele RT-Matrizen-Längen Prime Editing unterstützen, wird empfohlen, PEgRNAs zu wählen, bei denen die erste Base der 3'-Verlängerung (die letzte revers transkribierte Base der RT-Matrize) nicht C ist.
  • Design von Prime-Editor-3-Systemen (PE3 und PE3b)
  • Während PE2 genetische Informationen von der PEgRNA effizienter an den Ziellocus übertragen kann als PE1, bestimmt die Art und Weise, auf die die Zelle die resultierende Heteroduplex-DNA auflöst, die aus einem editierten Strang und einem nicht editierten Strang besteht, ob die Editierung dauerhaft ist. Eine frühere Entwicklung des Base Editing stand vor einer ähnlichen Herausforderung, da das Ausgangsprodukt von Cytosin- oder Adenin-Deaminierung Heteroduplex-DNA mit einem editierten und einem nicht editierten Strang ist. Um die Effizienz der Basen-Editierung zu erhöhen, wurde eine Cas9-D10A-Nickase verwendet, um einen Nick in den nicht editierten Strang einzuführen und die DNA-Reparatur zu diesem Strang zu lenken, wobei der editierte Strang als Matrize verwendet wurde129,130,142. Um dieses Prinzip auszunutzen, um die Effizienzen von Prime Editing zu verbessern, wurde eine ähnliche Strategie zum Nicking des nicht editierten Strangs unter Verwendung der bereits in PE2 vorhandenen Cas9 H840A-Nickase und einer einfachen sgRNA getestet, um den bevorzugten Ersatz des nicht editierten Strangs durch die Zelle (40A) zu induzieren. Da der editierte DNA-Strang auch genickt wurde, um Prime Editing zu initiieren, wurde eine Vielfalt von sgRNA-programmierten Nick-Orten auf dem nicht editierten Strang getestet, um die Produktion von Doppelstrang-DNA-Brüchen, die zu Indels führen, zu minimieren.
  • Diese PE3-Strategie wurde zuerst an fünf genomischen Stellen in HEK293T-Zellen getestet, indem sgRNAs gescreent wurden, die Nicks induzieren, die 14 bis 116 Basen von der Stelle des PEgRNA-induzierten Nicks entfernt, entweder 5' oder 3' der PAM, lokalisiert sind. In vier der fünf getesteten Stellen erhöhte das Nicking des nicht editierten Strangs die Menge an Indel-freien Prime-Editing-Produkten im Vergleich zum PE2-System um das 1,5- bis 4,2-Fache auf bis zu 55 % (40B). Während die optimale Nicking-Position in Abhängigkeit von der genomischen Stelle variierte, erzeugten Nicks, die 3' von PAM (positive Abstände in 40B) etwa 40-90bp von dem PEgRNA-induzierten Nick entfernt positioniert waren, im Allgemeinen günstige Steigerungen der Effizienz von Prime Editing (im Durchschnitt 41 %) ohne übermäßige Indelbildung (6,8 % durchschnittliche Indels für die sgRNA, was zu der höchsten Editiereffizienz für jede der fünf getesteten Stellen führt) (40B). Wie erwartet führte die Platzierung des nicht editierten Strang-Nicks innerhalb von 40 bp des PEgRNA-induzierten Nicks an einigen Stellen zu einem starken Anstieg der Indelbildung von bis zu 22 % (40B), vermutlich aufgrund der Bildung eines Doppelstrangbruchs durch Nicking beider Stränge nahe beieinander. An anderen Stellen produzierte Nicking jedoch nur 14 bp von dem PEgRNA-induzierten Nick entfernt nur 5 % Indels (40B), was darauf hindeutet, dass locusabhängige Faktoren die Umwandlung von proximalen dualen Nicks in Doppelstrang-DNA-Brüche kontrollieren. An einer getesteten Stelle (HEK4) boten komplementäre Strang-Nicks entweder keinen Nutzen oder führten zu Indel-Pegeln, die die Editiereffizienz (bis zu 26 %) übertrafen, selbst wenn sie in Abständen von >70 bp von dem PEgRNA-induzierten Nick platziert wurden, was mit einer ungewöhnlichen Neigung des editierten Strangs an dieser Stelle vereinbar ist, von der Zelle eingekerbt oder ineffizient ligiert zu werden. Es wird empfohlen, mit nicht editierten Strang-Nicks ungefähr 50 bp vom PEgRNAvermittelten Nick entfernt zu beginnen und alternative Nick-Stellen zu testen, wenn die Indel-Frequenzen akzeptable Werte überschreiten.
  • Dieses Modell dafür, wie das komplementäre Strang-Nicking die Effizienz von Prime Editing verbesserte (40A), sagte voraus, dass das Nicking des nicht editierten Strangs nur nach der Auflösung des editierten Strang-Flaps das Vorhandensein von gleichzeitigen Nicks minimieren könnte, wodurch die Häufigkeit von Doppelstrangbrüchen verringert wird, die daraufhin Indels bilden. Um eine zeitliche Kontrolle über das Nicking nicht editierter Stränge zu erreichen, wurden sgRNAs mit Spacer-Sequenzen entworfen, die dem editierten Strang, aber nicht dem ursprünglichen Allel entsprechen. Unter Verwendung dieser Strategie, die im Folgenden als PE3b bezeichnet wird, sollten Diskrepanzen zwischen dem Spacer und dem nicht editierten Allel ein Nicking durch die sgRNA benachteiligen, bis das Editierereignis auf dem PAM-Strang stattgefunden hat. Dieser PE3b-Ansatz wurde mit fünf verschiedenen Editierungen an drei genomischen Stellen in HEK293T-Zellen getestet und die Ergebnisse mit denen von PE2- und PE3-Systemen verglichen. In allen Fällen war PE3b im Vergleich zu PE3 mit wesentlich geringeren Indel-Werten verbunden (3,5- bis 30-fach, durchschnittlich 12-fach geringere Indels oder 0,85 %), ohne dass die Gesamteditiereffizienz im Vergleich zu PE3 offensichtlich abnahm (40C). Wenn die Editierung innerhalb eines zweiten Protospacers lag, konnte das PE3b-System daher Indels verringern, während die Editierungseffizienz im Vergleich zu PE2 immer noch verbessert wurde, oft auf Werte ähnlich denen von PE3 (40C).
  • Zusammen zeigten diese Ergebnisse, dass PE3-Systeme (Cas9-Nickase-optimierte reverse Transkriptase + PEgRNA + sgRNA) die Editiereffizienzen im Vergleich zu PE2 um das ~3-fache verbesserten (40B-40C). PE3 wurde von breiteren Indel-Bereichen begleitet als PE2, wie angesichts der zusätzlichen Nicking-Aktivität von PE3 erwartet. Die Verwendung von PE3 wird empfohlen, wenn die Effizienz von Prime Editing Priorität hat. Wenn die Minimierung von Indels kritisch ist, bietet PE2 ~10-mal niedrigere Indel-Häufigkeiten. Wenn es möglich ist, eine sgRNA zu verwenden, die die installierte Editierung erkennt, um den nicht editierten Strang zu nicken, kann das PE3b-System PE3-ähnliche Editierwerte erreichen und gleichzeitig die Indelbildung stark reduzieren.
  • Um den Targeting-Umfang und die Vielseitigkeit von Prime Editing mit PE3 zu demonstrieren, wurde die Installation aller möglichen Einzelnukleotid-Substitutionen über die Positionen +1 bis +8 (wobei die erste Base 3' des PEgRNA-induzierten Nicks als Position +1 gezählt wurde) der HEK3-Targetstelle unter Verwendung von PE3 und PEgRNAs mit 10-Nukleotid-RT-Matrizen (41A) untersucht. Zusammengenommen decken diese 24 unterschiedlichen Editierungen alle vier Transitionsmutationen und alle acht Transversionsmutationen ab und finden mit Editierungseffizienzen (ohne Indels) von durchschnittlich 33 ± 7,9 % (zwischen 14 % und 48 %) mit einem Durchschnitt von 7,5 ± 1,8 % Indels statt.
  • Nennenswerterweise könnten RT-Matrizen mit großen Entfernungen auch zu einem effizienten Prime Editing mit PE3 führen. Bei Verwendung von PE3 mit einer 34-nt-RT-Matrize wurden beispielsweise Punktmutationen an den Positionen +12, +14, +17, +20, +23, +24, +26, +30 und +33 (12 bis 33 Basen vom PEgRNA-induzierten Nick) im HEK3-Locus mit einer durchschnittlichen Effizienz von 36 ± 8,7 % und 8,6 ± 2,0 % Indels installiert (41B). Obwohl Editierungen über die +10-Position hinaus an anderen Loci nicht versucht wurden, unterstützen auch andere RT-Matrizen ≥30 nt an drei alternativen Stellen ein effizientes Editieren (48A-C). Die Viabilität langer RT-Matrizen ermöglichte ein effizientes Prime Editing für Dutzende von Nukleotiden von der anfänglichen Nick-Stelle. Da eine NGG-PAM auf jedem DNA-Strang im Durchschnitt alle ~8 bp auftritt, weit weniger als die maximalen Entfernungen zwischen der Editierung und der PAM, die effizientes Prime Editing unterstützen, ist Prime Editing nicht wesentlich durch die Verfügbarkeit einer nahegelegenen PAM-Sequenz eingeschränkt, im Gegensatz zu anderen Verfahren zur Präzisionsgenomeditierung125,142,154. Angesichts der vermuteten Beziehung zwischen RNA-Sekundärstruktur und Prime-Editing-Effizienz ist es beim Design von PEgRNAs für Langstreckenedits ratsam, RT-Matrizen unterschiedlicher Länge und bei Bedarf Sequenzzusammensetzungen (z. B. synonyme Codons) zu testen, um die Editiereffizienz zu optimieren.
  • Um den Umfang und die Beschränkungen des PE3-Systems zur Einführung von Transitions- und Transversionspunktmutationen weiter zu testen, wurden 72 zusätzliche Editierungen getestet, die alle 12 möglichen Typen von Punktmutationen an sechs zusätzlichen genomischen Zielstellen (41C-41H) abdecken. Insgesamt lag die Effizienz der indelfreien Editierung im Durchschnitt bei 25 ± 14 %, während die Indelbildung im Durchschnitt 8,3 ± 7,5 % betrug. Da die PEgRNA-RT-Matrize die PAM-Sequenz beinhaltete, könnte Prime Editing Änderungen an der PAM-Sequenz induzieren. In diesen Fällen wurden eine höhere Editiereffizienz (im Durchschnitt 39 ± 9,7 %) und eine geringere Indel-Generierung (im Durchschnitt 5,0 ± 2,9 %) beobachtet (41A-41K, Punktmutationen an den Positionen +5 oder +6). Diese Effizienzsteigerung und Abnahme der Indelbildung für PAM-Editierungen kann aus der Unfähigkeit der Cas9-Nickase herrühren, den editierten Strang vor der Reparatur des komplementären Strangs erneut zu binden und zu nicken. Da Prime Editing Kombinationseditierungen ohne offensichtlichen Verlust an Editierungseffizienz unterstützt, wird empfohlen, die PAM zusätzlich zu anderen gewünschten Änderungen, wenn möglich, zu editieren.
  • Als Nächstes wurden 14 gezielte kleine Insertionen und 14 gezielte kleine Deletionen an sieben genomischen Stellen unter Verwendung von PE3 (41I) durchgeführt. Gezielte 1-bp-Insertionen verliefen mit einer durchschnittlichen Effizienz von 32 ± 9,8 %, während 3-bp-Insertionen mit einer durchschnittlichen Effizienz von 39 ± 16 % installiert wurden. Gezielte 1-bp- und 3-bp-Deletionen waren ebenfalls effizient und verliefen mit einer durchschnittlichen Ergiebigkeit von 29 ± 14 % bzw. 32 ± 11 %. Die Indel-Generierung (über die gezielte Insertion oder Deletion hinaus) betrug durchschnittlich 6,8 ± 5,4 %. Da Insertionen und Deletionen zwischen den Positionen +1 und +6 die Position oder Struktur der PAM verändern, wurde spekuliert, dass Insertions- und Deletionseditierungen in diesem Bereich aufgrund der Unfähigkeit von Cas9-Nickase, den editierten DNA-Strang vor der Reparatur des komplementären Strangs erneut zu binden und zu nicken, effizienter sind, ähnlich wie Punktmutationen, die die PAM editieren.
  • PE3 wurde auch auf seine Fähigkeit getestet, größere präzise Deletionen von 5 bp bis 80 bp an der HEK3-Stelle zu vermitteln (41J). Sehr hohe Editiereffizienzen (52 bis 78 %) wurden für 5-, 10- bzw. 15-bp-Deletionen beobachtet, wenn eine 13-nt-PBS und eine RT-Matrize verwendet wurden, die jeweils 29, 24 oder 19 bp Homologie zum Ziellocus enthielt. Die Verwendung einer 26-nt-RT-Matrize unterstützte eine größere Deletion von 25 bp mit einer Effizienz von 72 ± 4,2 %, während eine 20-nt-RT-Matrize eine 80-bp-Deletion mit einer Effizienz von 52 ± 3,8 % ermöglichte. Diese gezielten Deletionen wurden von Indel-Frequenzen von durchschnittlich 11 ± 4,8 % begleitet (41J).
  • Schließlich wurde die Fähigkeit von PE3 getestet, 12 Kombinationen mehrerer Editierungen am gleichen Ziellocus, bestehend aus Insertionen und Deletionen, Insertionen und Punktmutationen, Deletionen und Punktmutationen, oder zwei Punktmutationen über drei genomische Stellen hinweg zu vermitteln. Diese Kombinationsbearbeitungen waren sehr effizient, durchschnittlich 55 % der Zieleditierung mit 6,4 % Indels (41K) und demonstrierten die Fähigkeit von Prime Editing, Kombinationen von präzisen Insertionen, Deletionen und Punktmutationen an einzelnen Zielstellen mit hoher Effizienz und niedrige Indel-Frequenzen zu erzeugen.
  • Zusammen repräsentieren die Beispiele in 41A-41K 156 verschiedene Transitions-, Transversions-, Insertions-, Deletions- und Kombinations-Editierungen über sieben humane genomische Loci. Diese Ergebnisse belegen die Vielseitigkeit, Präzision und Zielflexibilität von Prime Editing.
  • Prime Editing im Vergleich zu Base Editing
  • Cytidin-Basen-Editoren (CBEs) und Adenin-Basen-Editoren (ABEs) der aktuellen Generation können C•G-zu-T•A-Transitionsmutationen und A•T-zu-G•C-Transitionsmutationen mit hoher Effizienz und niedrigen Indels installieren129,130,142. Die Anwendung von Base Editing kann durch das Vorhandensein mehrerer Cytidin- oder Adenin-Basen innerhalb des Aktivitätsfensters von Base Editing (typischerweise ~5 bp breit), was zu unerwünschten Bystander-Edits führt129,130,142,155,, oder durch das Fehlen einer PAM, die ungefähr 15 ± 2 nt vom Zielnukleotid entfernt positioniert ist142,156, eingeschränkt werden. Es wurde erwartet, dass das Prime Editing für die präzise Installation von Transitionsmutationen ohne Bystander-Editierung besonders nützlich sein könnte, oder wenn das Fehlen geeignet positionierter PAMs eine günstige Positionierung des Zielnukleotids innerhalb des CBE- oder ABE-Aktivitätsfensters ausschließt.
  • Prime Editing und Cytosin-Base Editing wurden verglichen, indem drei genomische Loci, die mehrere Ziel-Cytidine enthalten, im kanonischen Base-Editing-Fenster (Protospacer-Positionen 4-8, Zählen der PAM als Positionen 21-23) unter Verwendung von optimierten CBEs157 ohne Nickase-Aktivität (BE2max) oder mit Nickase-Aktivität (BE4max) oder unter Verwendung der analogen PE2- und PE3-Prime-Editing-Systeme editiert wurden. Unter den insgesamt neun Ziel-Cytosinen innerhalb der Base-Editing-Fenster der drei Stellen ergab BE4max eine 2,2-fach höhere durchschnittliche Gesamt-C•G-zu-T•A-Umwandlung als PE3 für Basen in der Mitte des Base-Editing-Fensters (Protospacer-Positionen 5-7, 42A). Gleichermaßen übertraf BE2max ohne Nicking PE2 im Durchschnitt um das 1,4-Fache an diesen gut positionierten Basen (42A). Allerdings übertraf PE3 BE4max um das 2,7-Fache und PE2 übertraf BE2max um das 2,0-Fache für Cytosine jenseits der Mitte des Base-Editing-Fensters (durchschnittliche Editierung von 40 ± 17 % für PE3 im Vergleich zu 15 ± 18 % für BE4max und 22 ± 11 % für PE2 im Vergleich zu 11 ± 13 % für BE2max). Insgesamt waren die Indel-Frequenzen für PE2 sehr niedrig (im Durchschnitt 0,86 ± 0,47 %) und waren für PE3 ähnlich oder geringfügig höher als für BE4max (BE4max-Bereich: 2,5 % bis 14 %; PE3-Bereich: 2,5 % bis 21 %) (42B).
  • Beim Vergleich der Effizienz von Base Editing mit Prime Editing für die Installation von präzisen C•G-zu-T•A-Editierungen (ohne jegliches Bystander-Editing) übertraf die Effizienz von Prime Editing die des Base Editing an den oben genannten Stellen bei weitem, die wie die meisten genomische DNA-Stellen mehrere Cytosine innerhalb des ~5-bp-Base-Editing-Fensters enthalten (42C). An diesen Stellen, wie EMX1, das Cytosine an den Protospacer-Positionen C5, C6 und C7 enthält, erzeugte BE4max wenige Produkte, die nur die einzelne ZielbasenpaarUmwandlung ohne Bystander-Editierung enthielten. Im Gegensatz dazu könnte Prime Editing an dieser Stelle verwendet werden, um selektiv eine C•G-zu-T•A-Editierung an einer beliebigen Position oder Kombination von Positionen (C5, C6, C7, C5+C6, C6+C7, C5+C7 oder C5+C6+C7) zu installieren (42C). Alle präzisen einbasigen oder zweibasigen Editierungen (d. h. Editierungen, die keine anderen Basen in der Nähe verändern) waren mit PE3 oder PE2 viel effizienter als mit BE4max bzw. BE2, während die dreibasigen C•G-zu-T•A-Editierung mit BE4max effizienter war (42C), was die Neigung der Base-Editoren widerspiegelt, alle Zielbasen innerhalb des Aktivitätsfensters zu bearbeiten. Zusammengenommen zeigen diese Ergebnisse, dass Cytosin-Base-Editoren zu einem höheren Editierungssniveau an optimal positionierten Zielbasen führen können als PE2 oder PE3, aber Prime Editing kann Base Editing an nicht optimal positionierten Zielbasen übertreffen und mit viel höherer Präzision mit mehreren editierbaren Basen editieren.
  • A•T-zu-G•C-Editierung wurde an zwei genomischen Loci durch eine optimierte Nonnicking-ABE (ABEmax152 mit einer dCas9 anstelle einer Cas9-Nickase, im Folgenden als ABEdmax bezeichnet) mit PE2 und durch den optimierten Nicking-Adenin-Base-Editor ABEmax mit PE3 verglichen. An einer Stelle, die zwei Zieladenine im Base-Editing-Fenster (HEK3) enthält, waren ABEs für die Umwandlung von A5 effizienter als PE2 oder PE3, aber PE3 war für die Umwandlung von A8 effizienter, das am Rand des ABEmax-Editierfensters liegt (42D). Beim Vergleich der Effizienz von Präzisionseditierungen, bei denen nur ein einzelnes Adenin umgewandelt wird, übertraf PE3 ABEmax sowohl bei A5 als auch bei A8 (42E). Insgesamt produzierten ABEs bei HEK3 weit weniger Indels als Prime-Editoren (0,19 ± 0,02 % für ABEdmax im Vergleich zu 1,5 ± 0,46 % für PE2 und 0,53 ± 0,16 % für ABEmax im Vergleich zu 11 ± 2,3 % für PE3, 42F). Bei FANCF, bei dem nur ein einziges A im Base-Editing-Fenster vorhanden ist, übertrafen ABE2 und ABEmax ihre Prime-Editing-Gegenstücke bei der gesamten Zielbasenpaarumwandlung um das 1,8- bis 2,9-fache, wobei praktisch alle bearbeiteten Produkte sowohl aus Base Editing als auch Prime Editing nur die präzise Editierung enthielten (42D-42E). Wie bei der HEK3-Stelle produzierten ABEs viel weniger Indels an der FANCF-Stelle ( 42F).
  • Zusammengenommen weisen diese Ergebnisse darauf hin, dass Base Editing und Prime Editing komplementäre Stärken und Schwächen für die Herstellung gezielter Transitionsmutationen bieten. In Fällen, in denen ein einzelnes Zielnukleotid innerhalb des Base-Editing-Fensters vorhanden ist oder wenn Bystander-Editierungen akzeptabel sind, sind aktuelle Basen-Editoren typischerweise effizienter und führen zu weniger Indels als Prime-Editoren. Wenn mehrere Cytosine oder Adenine vorhanden sind und Bystander-Editierungen unerwünscht sind oder wenn Zielbasen für Base Editing relativ zu verfügbaren PAMs schlecht positioniert sind, bieten Prime-Editoren wesentliche Vorteile.
  • Off-Target Prime Editing
  • Um zu einem produktiven Editieren zu führen, erfordert Prime Editing Ziellocus:PEgRNA-Spacer, der komplementär zur Cas9-Domäne ist, um zu binden, Ziellocus:PEgRNA PBS-Komplementarität, damit PEgRNA-primierte reverse Transkription initiiert wird, und Ziellocus:reverse Transkriptase-Produktkomplementarität für die FlapAuflösung. Es wurde die Hypothese aufgestellt, dass diese drei unterschiedlichen DNA-Hybridisierungsanforderungen Off-Target-Prime-Editing im Vergleich zu anderen Genome-Editing-Verfahren minimieren können. Um diese Möglichkeit zu testen, wurden HEK293T-Zellen mit PE3 oder PE2 und 16 Gesamt-PEgRNAs behandelt, die konstruiert wurden, um auf vier genomische On-Target-Loci abzuzielen, wobei Cas9 und die vier entsprechenden sgRNAs auf dieselben Protospacer abzielen, oder mit Cas9 und denselben 16 PEgRNAs. Diese vier Zielloci wurden gewählt, weil jeder mindestens vier gut charakterisierte Off-Target-Stellen aufweist, für die bekannt ist, dass Cas9 und die entsprechende On-Target-sgRNA in HEK293T-Zellen eine wesentliche Off-Target-DNA-Modifikation verursachen118,159. Nach der Behandlung wurden die vier On-Target-Loci und die wichtigsten vier bekannten Cas9-Off-Target-Stellen für jeden On-Target-Spacer sequenziert, für insgesamt 16 Off-Target-Stellen (Tabelle 1).
  • In Übereinstimmung mit früheren Studien118 modifizierten Cas9 und die vier Ziel-sgRNAs alle 16 der zuvor gemeldeten Off-Target-Loci (42G). Die Cas9-Off-Target-Modifikationseffizienz unter den vier Off-Target-Stellen für den HEK3-Ziellocus betrug durchschnittlich 16 %. Cas9 und die auf HEK4 gerichtete sgRNA führten zu einer durchschnittlichen Modifikation von 60 % der vier getesteten bekannten Off-Target-Stellen. Gleichermaßen wurden Off-Target-Stellen für EMX1 und FANCF durch Cas9:sgRNA mit einer durchschnittlichen Häufigkeit von 48 % bzw. 4,3 % modifiziert (42G). Es wurde festgestellt, dass PEgRNAs mit Cas9-Nuklease On-Target-Stellen mit einer ähnlichen (1- bis 1,5-fach geringeren) Effizienz im Durchschnitt im Vergleich zu sgRNAs modifizierten, während PEgRNAs mit Cas9-Nuklease Off-Target-Stellen mit einer ~4-fach geringeren durchschnittlichen Effizienz modifizierten als sgRNAs.
  • Auffallenderweise führte PE3 oder PE2 mit den gleichen 16 getesteten PEgRNAs, die diese vier Ziel-Spacer enthielten, zu einem viel geringeren Off-Target-Editing (42H). Von den 16 Stellen, von denen bekannt ist, dass sie Off-Target-Editing durch Cas9+sgRNA durchlaufen, führten PE3+PEgRNAs oder PE2+PEgRNAs nur an 3 von 16 Off-Target-Stellen zu nachweisbarem Off-Target-Prime-Editing, wobei nur 1 von 16 eine Off-Target-Editiereffizienz ≥1 % zeigte (42H). Das durchschnittliche Off-Target-Prime-Editing für die PEgRNAs, die auf HEK3, HEK4, EMX1 und FANCF an diesen 16 bekannten Cas9-Off-Target-Stellen abzielen, betrug <0,1 %, <2,2 ± 5,2 %, <0,1 % bzw. <0,13 ± 0,11 % (42H). Insbesondere führt an der HEK4-Off-Target-3-Stelle, die Cas9+PEgRNA1 mit 97 % Effizienz editiert, PE2+PEgRNA1 nur zu 0,7 % Off-Target-Editierung, obwohl die gleiche Spacersequenz verwendet wird, was zeigt, wie die zwei zusätzlichen DNA-Hybridisierungsereignisse, die für Prime Editing im Vergleich zur Cas9-Editierung erforderlich sind, die Off-Target-Editierung stark reduzieren können. Zusammengenommen legen diese Ergebnisse nahe, dass PE3 und PEgRNAs in menschlichen Zellen eine viel geringere Off-Target-DNA-Editierung induzieren als Cas9 und sgRNAs, die auf dieselben Protospacer abzielen.
  • Die reverse Transkription von 3'-verlängerten PEgRNAs kann im Prinzip in das Guide-RNA-Gerüst erfolgen. Wenn der resultierende 3'-Flap trotz fehlender Komplementärfunktion an seinem 3'-Ende zum nicht editierten DNA-Strang in den Ziellocus eingebaut wird, führt dies zur Insertion von PEgRNA-Gerüstnukleotiden, was zur Indel-Frequenz beiträgt. Wir analysierten Sequenzierungsdaten aus 66 PE3-vermittelten Editierungsexperimenten an vier Loci in HEK293T-Zellen und beobachteten die PEgRNA-Gerüst-Insertion mit einer niedrigen Frequenz, im Durchschnitt 1,7 ± 1,5 % Gesamtinsertion einer beliebigen Anzahl von PEgRNA-Gerüstnukleotiden (56A-56D). Es wird spekuliert, dass die Unzugänglichkeit des Guide-RNA-Gerüsts für die reverse Transkriptase aufgrund der Cas9-Domänenbindung sowie die zelluläre Exzision während der Flapauflösung des fehlgepaarten 3'-Endes des 3'-Flaps, der aus der reversen Transkription des PEgRNA-Gerüsts resultiert, Produkte minimiert, die PEgRNA-Gerüstnukleotide enthalten. Obwohl solche Ereignisse selten sind, können zukünftige Bemühungen, PEgRNAs oder Prime-Editor-Proteine zu konstruieren, die den Einbau von PEgRNA-Gerüsten minimieren, die Indel-Häufigkeit weiter verringern.
  • Deaminasen in einigen Basen-Editoren können Cas9-unabhängig wirken, was zu einer geringen, aber weitverbreiteten Off-Target-DNA-Editierung bei CBEs der ersten Generation (aber nicht bei ABEs)160-162 und zu Off-Target-RNA-Editierung bei CBEs und ABEs der ersten Generation führt163-165, obwohl neuere CBE- und ABE-Varianten mit konstruierten Desaminasen die Cas9-unabhängige Off-Target-DNA- und RNA-Editierung stark reduzieren163-165. Prime-Editoren fehlen basenmodifizierende Enzyme wie Deaminasen und weisen daher keine inhärente Fähigkeit auf, DNA- oder RNA-Basen auf Cas9-unabhängige Weise zu modifizieren.
  • Während die Reverse-Transkriptase-Domäne in Prime-Editoren im Prinzip richtig geprimte RNA- oder DNA-Matrizen in Zellen verarbeiten könnte, wurde festgestellt, dass Retrotransposons wie die der LINE-1-Familie166,, endogene Retroviren167,168 und humane Telomerase alle aktive endogene humane reverse Transkriptasen bereitstellen. Ihre natürliche Anwesenheit in menschlichen Zellen legt nahe, dass die Aktivität der reversen Transkriptase selbst nicht wesentlich toxisch ist. Tatsächlich wurden keine PE3-abhängigen Unterschiede in der Lebensfähigkeit von HEK293T-Zellen im Vergleich zu Kontrollen beobachtet, die dCas9, Cas9 H840A-Nickase oder PE2 mit R110S+K103L (PE2-dRT)-Mutationen exprimieren, die die reverse Transkriptase inaktivieren169 (49A-49B).
  • Ungeachtet der oben genannten Daten und Analysen sind zusätzliche Studien erforderlich, um das Off-Target-Prime-Editing auf unvoreingenommene, genomweite Weise zu beurteilen und zu charakterisieren, inwieweit die reversen Transkriptase-Varianten in Prime-Editoren oder Prime-Editing-Zwischenprodukten Zellen beeinflussen können.
  • Prime Editing pathogener Transversions-, Insertions- und Deletionsmutationen in menschlichen Zellen
  • Die Fähigkeit von PE3, Transversions-, kleine Insertions- und kleine Deletionsmutationen, die genetische Krankheiten hervorrufen, direkt in menschliche Zellen einzubauen oder in solchen zu korrigieren, wurde getestet. Die Sichelzellenanämie wird am häufigsten durch eine A•T-zu-T•A-Transversionsmutation in HBB hervorgerufen, die zur Mutation von Glu6→Val in beta-Globin führt. Eine Behandlung von hämatopoetischen Stammzellen ex vivo mit Cas9-Nuklease und einem Donor-DNA-Template für HDR, gefolgt von einer Anreicherung von editierten Zellen, Transplantation und Engraftment ist eine vielversprechende potenzielle Strategie zur Behandlung der Sichelzellanämie170. Dieser Ansatz erzeugt jedoch neben dem korrekt editierten HBB-Allel noch viele Indel-haltige Nebenprodukte170-171. Während Basen-Editors im Allgemeinen weit weniger Indels produzieren, können sie derzeit die T•A-zu-A•T-Transversionsmutation nicht bewerkstelligen, die erforderlich ist, um die normale Sequenz von HBB direkt wiederherzustellen.
  • PE3 wurde zum Einbau der HBB-E6V-Mutation in HEK293T-Zellen mit 44% Effizienz und 4,8 % Indels verwendet (43A). Aus der Mischung von PE3-behandelten Zellen isolierten wir sechs HEK293T-Zelllinien, die homozygot (triploid) für das HBB-E6V-Allel sind (53A-53D), was die Fähigkeit von Prime Editing zur Erzeugung menschlicher Zelllinien mit pathogenen Mutationen aufzeigt. Um das HBB-E6V-Allel zu Wildtyp-HBB zu korrigieren, behandelten wir homozygote HBB-E6V-HEK293T-Zellen mit PE3 und einer PEgRNA, die programmiert war, die HBB-E6V-Mutation direkt in Wildtyp-HBB umzukehren. Insgesamt wurden 14 PEgRNA-Entwürfe getestet. Nach drei Tagen ergab eine DNA-Sequenzierung, dass alle 14 PEgRNAs in Kombination mit PE3 eine effiziente Korrektur von HBB-E6V zu Wildtyp-HBB (≥26 % Wildtyp-HBB ohne Indels) und Indel-Spiegel von durchschnittlich 2,8±0,70 % ergaben (50A). Die beste PEgRNA führte zu 52 % Korrektur von HBB-E6V zu Wildtyp mit 2,4 % Indels (43A). Eine Einführung einer stillen Mutation, die das von der PEgRNA erkannte PAM modifiziert, verbesserte die Editing-Effizienz und Produktreinheit geringfügig auf 58 % Korrektur mit 1,4 % Indels (43A). Diese Ergebnisse belegen, dass Prime Editing eine pathogene Transversionspunktmutation in eine menschliche Zelllinie mit hoher Effizienz und minimalen Nebenprodukten einbauen und in einer solchen korrigieren kann.
  • Die Tay-Sachs-Krankheit wird am häufigsten durch eine 4-bp-Insertion in das HEXA-Gen (HEXA 1278+TATC) hervorgerufen136. PE3 wurde zum Einbau dieser 4-bp-Insertion in HEK293T-Zellen mit 31 % Effizienz und 0,8 % Indels verwendet (43B), und es wurden zwei HEK293T-Zelllinien isoliert, die homozygot für das HEXA 1278+TATC-Allel sind (53A-53D). Diese Zellen wurden verwendet, um 43 PEgRNAs und drei Nicking-sgRNAs mit PE3- oder PE3b-Systemen zur Korrektur der pathogenen Insertion in HEXA zu testen (50B), entweder durch perfekte Umkehrung zum Wildtyp-Allel oder durch eine verschobene 4-bp-Deletion, die das PAM unterbricht und eine stille Mutation einbaut. Neunzehn der 43 getesteten PEgRNAs führten zu ≥20 % Editing. Eine perfekte Korrektur zu Wildtyp-HEXA mit PE3 oder PE3b und der besten PEgRNA verlief mit ähnlichen durchschnittlichen Effizienzen (30 % für PE3 vs. 33 % für PE3b), wobei jedoch das PE3b-System mit 5,3-fach weniger Indel-Produkten einherging (1,7 % für PE3 vs. 0,32 % für PE3b) (43B und 50B). Diese Ergebnisse zeigen die Fähigkeit des Prime Editings auf, präzise kleine Insertionen und Deletionen vorzunehmen, die ein pathogenes Allel in Säugerzellen effizient und mit einem Minimum an Nebenprodukten einbauen oder korrigieren.
  • Schließlich wurde der Einbau eines schützenden SNP in PRNP, das Gen, das für das humane Prionprotein (PrP) codiert, getestet. PrP-Fehlfaltung ruft eine progressive und tödliche neurodegenerative Prionenkrankheit hervor, die spontan, durch vererbte dominante Mutationen im PRNP-Gen oder durch Exposition gegenüber fehlgefaltetem PrP auftreten kann172. Ein natürlich vorkommendes mutiertes PRNP-G127V-Allel verleiht Menschen138 und Mäusen173 Resistenz gegen Prionenkrankheit. PE3 wurde zum Einbau von G127V in das menschliche PRNP-Allel in HEK293T-Zellen verwendet, was eine G•Czu-T•A-Transversion erfordert. Vier PEgRNAs und drei Nicking-sgRNAs wurden mit dem PE3-System untersucht. Nach drei Tagen Exposition gegenüber den wirksamsten der PE3s und PEgRNAs zeigte eine DNA-Sequenzierung 53±11 % Effizienz des Einbaus der G127V-Mutation und Indel-Spiegel von 1,7+0,7 % (43C). Zusammengenommen belegen diese Ergebnisse die Fähigkeit des Prime Editings in menschlichen Zellen, Transversions-, Insertions- oder Deletionsmutationen, die eine Krankheitsresistenz hervorrufen oder verleihen, effizient und mit einem Minimum an Nebenprodukten einzubauen oder zu korrigieren.
  • Prime Editing in verschiedenen menschlichen Zelllinien und primären Mausneuronen
  • Als nächstes wurde Prime Editing auf seine Fähigkeit getestet, endogene Stellen in drei weiteren menschlichen Zelllinien zu editieren. In K562-Zellen (leukämisches Knochenmark) wurde PE3 verwendet, um Transversions-Edits in den HEK3-, EMX1- und FANCF-Stellen sowie die 18-bp-Insertion eines 6xHis-Tags in HEK3 durchzuführen. Für jede dieser vier PE3-vermittelten Edits wurde eine durchschnittliche Editing-Effizienz von 15-30 % beobachtet, wobei Indels im Durchschnitt 0,85-2,2 % betrugen (43A). In U2OS-Zellen (Osteosarkom) wurden Transversionsmutationen in HEK3 und FANCF sowie eine 3-bp-Insertion und eine 6xHis-Tag-Insertion in HEK3 mit 7,9-22 % Editing-Effizienz eingebaut, wobei die Indel-Bildung um das 10- bis 76-Fache übertroffen wurde (43A). Schließlich wurde in HeLa-Zellen (Gebärmutterhalskrebs) eine 3-bp-Insertion in HEK3 mit einer durchschnittlichen Effizienz von 12 % und 1,3 % Indels durchgeführt (43A). Zusammenfassend deuten diese Daten darauf hin, dass außer HEK293T-Zellen mehrere Zelllinien ein Prime Editing unterstützen, obwohl die Editing-Effizienzen je nach Zelltyp variieren und im Allgemeinen weniger effizient als in HEK293T-Zellen sind. Editing:Indel-Verhältnisse blieben in allen getesteten menschlichen Zelllinien hoch.
  • Um festzustellen, ob Prime Editing in postmitotischen, terminal differenzierten Primärzellen möglich ist, wurden primäre kortikale Neuronen, die E18.5-Mäusen entnommen wurden, mit einem Dual-Split-PE3-Lentivirus-Abgabesystem transduziert, bei dem Split-Intein-Spleißen203 das PE2-Protein aus N-terminalen und C-terminalen Hälften rekonstituiert, die jeweils von einem separaten Virus kommen. Um das Editing auf postmitotische Neuronen zu beschränken, wurde der menschliche Synapsin-Promotor, der für reife Neuronen hochspezifisch ist204, verwendet, um die Expression beider PE2-Proteinkomponenten zu steuern. GFP wurde durch ein selbstspaltendes P2A-Peptid205 an die N-terminale Hälfte von PE2 fusioniert. Kerne aus Neuronen wurden zwei Wochen nach der dualen viralen Transduktion isoliert und wurden direkt sequenziert oder vor der Sequenzierung auf GFP-Expression sortiert. Es wurde ein durchschnittliches Prime Editing von 7,1±1,2 % zum Einbau einer Transversion am DNMT1-Locus mit im Durchschnitt 0,58±0,14 % Indels in sortierten Kernen beobachtet (43D). Cas9-Nuklease im gleichen Split-Intein-Dual-Lentivirus-System ergab 31±5,5 % Indels unter sortierten kortikalen Neuronenkernen (43D). Diese Daten deuten darauf hin, dass postmitotische, terminal differenzierte Primärzellen ein Prime Editing unterstützen können, und somit belegen, dass ein Prime Editing keine Zellreplikation erfordert.
  • Prime Editing im Vergleich zu Cas9-initiierter HDR
  • Die Leistung von PE3 wurde mit der von optimierter Cas9-initiierter HDR128, 125 in mitotischen Zelllinien, die HDR128 unterstützen, verglichen. HEK293T-, HeLa-, K562- und U2OS-Zellen wurden mit Cas9-Nuklease, einer sgRNA und einem ssDNA-Donor-Oligonukleotid-Template behandelt, die entworfen wurden, um eine Vielfalt von Transversions- und Insertions-Edits einzubauen (43E-43G und 51A-51F). Cas9-initiierte HDR baute in allen Fällen das gewünschte Edit erfolgreich ein, jedoch mit weitaus höheren Anteilen an Nebenprodukten (hauptsächlich Indels), wie von Behandlungen erwartet, die Doppelstrangbrüche hervorrufen. Unter Verwendung von PE3 in HEK293T-Zellen verlief der HBB-E6V-Einbau und die HBB-E6V-Korrektur mit einer durchschnittlichen Editing-Effizienz von 42 % bzw. 58 % mit durchschnittlich 2,6 % bzw. 1,4 % Indels (43E und 43G). Im Gegensatz dazu führten die gleichen Edits mit Cas9-Nuklease und einem HDR-Template zu einer durchschnittlichen Editing-Effizienz von 5,2 % bzw. 6,7 % mit einer durchschnittlichen Indel-Häufigkeit von 79 % bzw. 51 % (43E und 43G). In ähnlicher Weise baute PE3 PRNP-G127V mit 53 % Effizienz und 1,7 % Indels ein, wohingegen eine Cas9-initiierte HDR diese Mutation mit 6,9 % Effizienz und 53 % Indels einbaute (43E und 43G). Somit war das Verhältnis von Editing:Indels für einen HBB-E6V-Einbau, eine HBB-E6V-Korrektur und einen PRNP-G127V-Einbau im Durchschnitt 270-fach höher für PE3 als für Cas9-initiierte HDR.
  • Vergleiche zwischen PE3 und HDR in anderen menschlichen Zelllinien als HEK293T zeigten ähnliche Ergebnisse, allerdings mit geringeren PE3-Editing-Effizienzen. In K562-Zellen verlief beispielsweise die PE3-vermittelte 3-bp-Insertion in HEK3 mit 25 % Effizienz und 2,8 % Indels, verglichen mit 17 % Editing und 72 % Indels für Cas9-initiierte HDR, ein 40-facher Vorteil beim Editing:Indel-Verhältnis zugunsten von PE3 (43F-43G). In U2OS-Zellen führte PE3 diese 3-bp-Insertion mit 22 % Effizienz und 2,2 % Indels durch, während Cas9-initiierte HDR zu 15 % Editing mit 74 % Indels führte, einem 49-fach niedrigeren Editing:Indel-Verhältnis (43F-43G). In HeLa-Zellen führte PE3 diese Insertion mit 12 % Effizienz und 1,3 % Indels durch, gegenüber 3,0 % Editing und 69% Indels bei Cas9-initiierter HDR, einem 210-fachen Unterschied im Editing:Indel-Verhältnis- (43F-43G). Zusammengenommen deuten diese Daten darauf hin, dass HDR in den vier getesteten Zelllinien typischerweise zu ähnlichen oder niedrigeren Editing-Effizienzen und weitaus höheren Indels als PE3 führt (51A-51F).
  • Diskussion und zukünftige Ausrichtung
  • Die Fähigkeit, DNA-Sequenzen mit Einzelnukleotid-Präzision zu inserieren, ist eine besonders förderliche Fähigkeit des Prime Editings. Zum Beispiel wurde PE3 verwendet, um ein His6-Tag (18 bp, 65 % durchschnittliche Effizienz), ein FLAG-Epitop-Tag (24 bp, 18% durchschnittliche Effizienz) und eine erweiterte LoxP-Stelle (44 bp, 23 % durchschnittliche Effizienz), die das native Substrat für Cre-Rekombinase ist, präzise in den HEK3-Locus in HEK293T-Zellen zu inserieren. Die durchschnittlichen Indel-Werte lagen bei diesen Beispielen zwischen 3,0 % und 5,9 % (43H). Viele Anwendungen in Biotechnologie, synthetischer Biologie und Therapie sollten sich aus der Fähigkeit ergeben, neue DNA-Sequenzen effizient und präzise in interessierende Target-Stellen in lebenden Zellen einzuführen.
  • Zusammengenommen bauten die hier beschriebenen Prime-Editing-Versuche 18 Insertionen bis zu 44 bp, 22 Deletionen bis zu 80 bp, 113 Punktmutationen, einschließlich 77 Transversionen und 18 Kombinations-Edits über 12 endogene Loci im Genom von Mensch und Maus an Orten im Bereich von 3 bp stromaufwärts bis 29 bp stromabwärts des Starts eines PAM ein, ohne explizite Doppelstrang-DNA-Brüche zu machen. Diese Ergebnisse belegen das Prime Editing als ein bemerkenswert vielseitiges Verfahren zum Genom-Editing. Da die überwältigende Mehrheit (85-99 %) der Insertionen, Deletionen, Indels und Duplikationen in ClinVar ≤30 bp sind (52A-52D), kann das Prime Editing im Prinzip bis zu ~89 % der derzeit 75.122 bekannten pathogenen, humanen, genetischen Varianten in ClinVar (Transitionen, Transversionen, Insertionen, Deletionen, Indels und Duplikationen in 38A) korrigieren, mit zusätzlichem Potenzial, Krankheiten zu lindern, die durch Kopienzahlgewinn oder -verlust hervorgerufen werden.
  • Wichtig ist, dass die Flexibilität des Prime-Editings für jedes gewünschte Edit viele mögliche Auswahlmöglichkeiten von PEgRNA-induzierten Nick-Orten, sgRNAinduzierten Second-Nick-Orten, PBS-Längen, RT-Template-Längen und welcher Strang zuerst editiert wird, bietet, wie hier ausführlich aufgezeigt. Diese Flexibilität, die im Gegensatz zu eingeschränkteren Optionen steht, die typischerweise für andere Präzisionsgenom-Editing-Verfahren125, 142, 154 verfügbar sind, ermöglicht eine Optimierung der Editing-Effizienz, Produktreinheit, DNA-Spezifität oder anderer Parameter, um den Anforderungen einer gegebenen Anwendung gerecht zu werden, wie in den 50A-50B gezeigt, in denen das Testen von 14 bzw. 43 PEgRNAs, die eine Reihe von Prime-Editing-Strategien abdecken, die Korrektur von pathogenen HBB- bzw. HEXA-Allelen optimierte.
  • Es besteht nach wie vor ein Forschungsbedarf, um das Prime Editing weiter zu verstehen und zu verbessern. Zusätzliche Modifikationen von Prime Editor-Systemen sind erforderlich, um ihre Kompatibilität zu erweitern, um andere Zelltypen, wie etwa postmitotische Zellen, einzuschließen. Eine Verknüpfung von Prime Editing mit viralen und nicht-viralen In-vitro- und In-vivo-Abgabestrategien ist erforderlich, um das Potenzial des Prime Editings vollständig zu erforschen, um ein breites Anwendungsspektrum einschließlich der Untersuchung und Behandlung genetischer Krankheiten zu ermöglichen. Durch das Ermöglichen von hochpräzisen zielgerichteten Transitionen, Transversionen, kleinen Insertionen und kleinen Deletionen in den Genomen von Säugerzellen ohne dafür erforderliche Doppelstrangbrüche oder HDR bietet Prime Editing jedoch eine neue „Suchen-und-Ersetzen“-Funktion, die den Anwendungsbereich des Genom-Editings erheblich erweitert.
  • Verfahren
  • Allgemeine Verfahren
  • DNA-Amplifikation wurde durch PCR mit Phusion U Green Multiplex PCR Master Mix (ThermoFisher Scientific) oder Q5 Hot Start High-Fidelity 2x Master Mix (New England BioLabs) durchgeführt, sofern nicht anders angegeben. DNA-Oligonukleotide, einschließlich Cy5-markierter DNA-Oligonukleotide, dCas9-Protein und Cas9 H840A-Protein wurden von Integrated DNA Technologies erhalten. Hefe-Reporterplasmide stammten von zuvor beschriebenen Plasmiden64 und wurden nach dem Gibson-Assembly-Verfahren kloniert. Alle hier verwendeten Säuger-Editor-Plasmide wurden unter Verwendung des USER-Klonierungsverfahrens zusammengebaut, wie zuvor beschrieben175. Plasmide, die sgRNAs exprimieren, wurden durch Ligation von annealten Oligonukleotiden in einen BsmBl-verdauten Akzeptorvektor technisch aufgebaut. Plasmide, die PEgRNAs exprimieren, wurden durch Gibson-Assembly oder Golden-Gate-Assembly unter Verwendung eines benutzerdefinierten Akzeptorplasmids technisch aufgebaut (siehe ergänzende ,Golden-Gate-Assembly‘-Übersicht). Sequenzen von sgRNA- und PEgRNA-Konstrukten, die hier verwendet werden, sind in den Tabellen 2A-2C und Tabellen 3A-3R aufgelistet. Alle Vektoren für Säugerzellversuche wurden unter Verwendung von Plasmid Plus Midiprep-Kits (Qiagen) oder PureYield-Plasmid-Miniprep-Kits (Promega) gereinigt, die Endotoxin-Entfernungsschritte beinhalten. Alle Versuche mit lebenden Tieren wurden von Broad Institute Institutional and Animal Care and Use Committees genehmigt. Wildtyp-C57BL/6-Mäuse wurden von Charles River (#027) erhalten.
  • Biochemische In-vitro-Assays
  • PEgRNAs und sgRNAs wurden in vitro mit dem HiScribe T7 In-vitro-Transkriptionskit (New England Biolabs) von PCR-amplifizierten Templates, die eine T7-Promotorsequenz enthielten, transkribiert. RNA wurde durch denaturierende Harnstoff-PAGE gereinigt und vor der Verwendung durch ein analytisches Gel qualitätsgeprüft. 5'-Cy5-markierte DNA-Duplex-Substrate wurden unter Verwendung von zwei Oligonukleotiden (Cy5-AVA024 und AVA025; Verhältnis 1:1,1) für das nicht-genickte Substrat oder drei Oligonukleotiden (Cy5-AVA023, AVA025 und AVA026; 1:1,1:1,1) für das vorgenickte Substrat durch Erhitzen auf 95 °C für 3 Minuten, gefolgt von langsamem Abkühlen auf Raumtemperatur annealt (Tabellen 2A-2C). Spaltungsreaktionen und Reaktionen zur reversen Transkription von Cas9 wurden in 1x Spaltungspuffer205, ergänzt mit dNTPs (20 mM HEPES-K, pH 7,5; 100 mM KCl; 5 % Glycerin; 0,2 mM EDTA, pH 8,0; 3 mM MgCl2; 0,5 mM dNTP-Mix; 5 mM DTT) durchgeführt. dCas9 oder Cas9 H840A (5 µM Endkonzentration) und die sgRNA oder PEgRNA (5 µM Endkonzentration) wurden bei Raumtemperatur in 5 µl Reaktionsgemisch 10 Minuten lang vor dem Zusatz des Duplex-DNA-Substrats (400 nM Endkonzentration) vorinkubiert, gefolgt von dem Zusatz von Superscript III reverser Transkriptase (ThermoFisher Scientific), einer nicht offenbarten M-MLV RT-Variante, falls erforderlich. Reaktionen wurden 1 Stunde bei 37 °C durchgeführt, dann mit Wasser auf ein Volumen von 10 µl verdünnt, mit 0,2 µl Proteinase K-Lösung (20 mg/ml, ThermoFisher Scientific) behandelt und 30 Minuten bei Raumtemperatur inkubiert. Nach einer Hitzeinaktivierung bei 95 °C für 10 Minuten wurden die Reaktionsprodukte mit 2x Formamid-Gelladepuffer (90 % Formamid; 10 % Glycerin; 0,01 % Bromphenolblau) kombiniert, bei 95 °C 5 Minuten denaturiert und durch denaturierendes Harnstoff-PAGE-Gel (15 % TBE-Harnstoff, 55 °C, 200 V) getrennt. DNA-Produkte wurden durch das Cy5-Fluoreszenzsignal unter Verwendung eines biomolekularen Bildgebers Typhoon FLA 7000 sichtbar gemacht.
  • Elektrophoretische Mobility-Shift-Assays wurden in 1x Bindungspuffer (1x Spaltungspuffer + 10 µg/ml Heparin) mit vorinkubierten dCas9:sgRNA- oder dCas9:PEgRNA-Komplexen (Konzentrationsbereich zwischen 5 nM und 1 µM Endkonzentration) und Cy5-markierter Duplex-DNA (Cy5-AVA024 und AVA025; 20 nM Endkonzentration) durchgeführt. Nach 15-minütiger Inkubation bei 37 °C wurden die Proben mit nativem PAGE-Gel (10 % TBE) analysiert und hinsichtlich Cy5-Fluoreszenz abgebildet.
  • Für eine DNA-Sequenzierung von Produkten einer reversen Transkription wurden Fluoreszenzbanden ausgeschnitten und mittels Harnstoff-PAGE-Gelen aufgereinigt, dann 3' mit terminaler Transferase (TdT; New England Biolabs) in Gegenwart von dGTP oder dATP gemäß der Vorschrift des Herstellers getailt. Getailte DNA-Produkte wurden 10-fach mit Bindungspuffer (40 % gesättigtes wässriges Guanidiniumchlorid + 60 % Isopropanol) verdünnt und durch QIAquick-Spin-Säule (Qiagen) gereinigt, dann als Template für eine Primer-Extension durch Klenow-Fragment (New England Biolabs) unter Verwendung von Primer AVA134 (A-getailte Produkte) oder AVA135 (G-getailte Produkte) verwendet (Tabellen 2A-2C). Extensionen wurden durch PCR für 10 Zyklen unter Verwendung der Primer AVA110 und AVA122 amplifiziert, dann mit AVA037 unter Verwendung des Sanger-Verfahrens sequenziert (Tabellen 2A-2C).
  • Hefe-Fluoreszenz-Reporter-Assays
  • Dual fluoreszierende Reporterplasmide, die ein Stopcodon im Leserahmen, einen +1-Frameshift oder einen -1-Frameshift enthielten, wurden in vitro Prime-Editing-Reaktionen mit 5'-erweiterter PEgRNA oder 3'-erweiterter PEgRNA ausgesetzt, wie oben beschrieben. Nach 1-stündiger Inkubation bei 37 °C wurden die Reaktionen mit Wasser verdünnt und die Plasmid-DNA wurde mit 0,3 M Natriumacetat und 70 % Ethanol ausgefällt. Resuspendierte DNA wurde durch Elektroporation in S. cerevisiae transformiert, wie zuvor beschrieben67 und auf synthetischem Komplettmedium ohne Leucin (SC(Glucose), L-) ausplattiert. GFP- und mCherry-Fluoreszenzsignale wurden von Kolonien mit dem biomolekularen Imager Typhoon FLA 7000 visualisiert.
  • Allgemeine Bedingungen für Säugerzellkulturen
  • HEK293T-Zellen (ATCC CRL-3216), U2OS-Zellen (ATTC HTB-96), K562-Zellen (CCL-243) und HeLa-Zellen (CCL-2) wurden von ATCC bezogen und in Dulbecco's Modified Eagle Medium (DMEM) plus GlutaMAX (ThermoFisher Scientific), McCoy's 5A Medium (Gibco), RPMI Medium 1640 plus GlutaMAX (Gibco) bzw. Eagle's Minimal Essential Medium (EMEM, ATCC), jeweils ergänzt mit 10 % (Vol./Vol.) fötalem Rinderserum (Gibco, qualifiziert) und 1x Penicillin Streptomycin (Corning) kultiviert und passagiert. Alle Zelltypen wurden bei 37 °C mit 5 % CO2 inkubiert, gehalten und kultiviert. Zelllinien wurden von ihren jeweiligen Lieferanten authentifiziert und negativ auf Mykoplasma getestet.
  • HEK293T-Gewebekultur-Transfektionsvorschrift und Herstellung genomischer DNA
  • Gezüchtete HEK293T-Zellen wurden auf Poly-D-Lysin-beschichteten 48-Well-Platten (Corning) ausgesät. 16 bis 24 Stunden nach der Aussaat wurden die Zellen bei etwa 60 % Konfluenz mit 1 µl Lipofectamine 2000 (Thermo Fisher Scientific) gemäß den Vorschriften des Herstellers und 750 ng PE-Plasmid, 250 ng PEgRNA-Plasmid und 83 ng sgRNA-Plasmid (für PE3 und PE3b) transfiziert. Sofern nicht anders angegeben, wurden die Zellen nach der Transfektion 3 Tage kultiviert, wonach das Medium entfernt, die Zellen mit 1x PBS-Lösung (Thermo Fisher Scientific) gewaschen und die genomische DNA durch Zusatz von 150 µl frisch zubereiteten Lysepuffer (10 mM Tris-HCI, pH 7,5; 0,05 % SDS, 25 µg/ml Proteinase K (Thermo Fisher Scientific)) direkt in jede Vertiefung der Gewebekulturplatte extrahiert wurde. Die Mischung aus genomischer DNA wurde bei 37 °C 1 bis 2 Stunden inkubiert, gefolgt von einem 30-minütigen Enzym-Inaktivierungsschritt bei 80 °C. Primer, die für die Amplifikation der genomischen DNA von Säugerzellen verwendet wurden, sind in Tabelle 4 aufgeführt. Für HDR-Versuche in HEK293T-Zellen wurden 231 ng Nuklease-Expressionsplasmid, 69 ng sgRNA-Expressionsplasmid, 50 ng (1,51 pmol) 100-nt-ssDNA-Donor-Template (PAGE-gereinigt; Integrated DNA Technologies) mit 1,4 µl Lipofectamine 2000 (Thermo Fisher) pro Vertiefung lipofiziert. Genomische DNA aus allen HDR-Versuchen wurde mit dem Agencourt DNAdvance Kit (Beckman Coulter) gemäß der Vorschrift des Herstellers gereinigt.
  • Hochdurchsatz-DNA-Sequenzierung von Proben genomischer DNA
  • Interessierende Genomstellen wurden aus Proben genomischer DNA amplifiziert und auf einem Illumina MiSeq wie zuvor beschrieben mit den folgenden Modifikationen sequenziert129, 130. Kurz gesagt wurden Amplifikationsprimer, die Illumina-Vorwärts- und Rückwärts-Adapter (Tabelle 4) enthielten, für eine erste PCR-Runde (PCR 1) verwendet, in welcher der interessierende Genombereich amplifiziert wurde. 25 µl-PCR 1-Reaktionen wurden mit 0,5 µM von jedem Vorwärts- und Rückwärtsprimer, 1 µl Extrakt genomischer DNA und 12,5 µl Phusion U Green Multiplex PCR Master Mix durchgeführt. Die PCR-Reaktionen wurden wie folgt durchgeführt: 98 °C für 2 Minuten, dann 30 Zyklen von [98 °C für 10 Sekunden, 61 °C für 20 Sekunden und 72 °C für 30 Sekunden], gefolgt von einer abschließenden Extension bei 72 °C für 2 Minuten. Jeder Probe wurden in einer sekundären PCR-Reaktion (PCR 2) eindeutige Illumina-Barcoding-Primer-Paare zugesetzt. Genauer gesagt enthielten 25 µl einer gegebenen PCR 2-Reaktion 0,5 µM von jedem eindeutigen Vorwärts- und Rückwärts-Illumina-Barcoding-Primer-Paares, 1 µl ungereinigte PCR 1-Reaktionsmischung und 12,5 µl Phusion U Green Multiplex PCR 2x Master Mix. Die Barcoding-PCR 2-Reaktionen wurden wie folgt durchgeführt: 98 °C für 2 Minuten, dann 12 Zyklen von [98 °C für 10 Sekunden, 61 °C für 20 Sekunden und 72 °C für 30 Sekunden], gefolgt von einer abschließenden Extension bei 72 °C für 2 Minuten. PCR-Produkte wurden durch Elektrophorese auf einem 1,5 % Agarosegel analytisch ausgewertet. PCR 2-Produkte (gepoolt durch gemeinsame Amplikons) wurden durch Elektrophorese mit einem 1,5 % Agarosegel unter Verwendung eines QIAquick Gel Extraction Kit (Qiagen) gereinigt, wobei mit 40 µl Wasser eluiert wurde. Die DNA-Konzentration wurde durch fluorometrische Quantifizierung (Qubit, Thermo Fisher Scientific) oder qPCR (KAPA Library Quantification Kit - Illumina, KAPA Biosystems) gemessen und auf einem Illumina MiSeq-Gerät gemäß den Vorschriften des Herstellers sequenziert.
  • Sequenzierungs-Reads wurden mit MiSeq Reporter (Illumina) demultiplexiert. Die Ausrichtung von Amplikonsequenzen an einer Referenzsequenz wurde unter Verwendung von CRISPResso2 durchgeführt178. Zur Quantifizierung von Punktmutation-Editing wurde CRISPResso2 im Standardmodus mit „discard_indet_reads“ ON ausgeführt. Die Editing-Effizienz wurde wie folgt berechnet: (Häufigkeit der angegebenen Punktmutation bei nicht verworfenen Reads) × (Anzahl der nicht verworfenen Reads) ÷ Gesamtzahl der Reads. Für Insertions- oder Deletions-Edits wurde CRISPResso2 im HDR-Modus unter Verwendung des gewünschten Allels als erwartetes Allel (e-Flag) und mit „discard_indet_reads“ ON ausgeführt. Die Editing-Ausbeute wurde als die Anzahl der HDR-ausgerichteten Reads geteilt durch die Gesamtzahl der Reads berechnet. Für alle Edits wurden Indel-Ausbeuten als Anzahl der verworfenen Reads geteilt durch die Gesamtzahl der Reads berechnet.
  • Nukleofektion von U2OS-, K562- und HeLa-Zellen
  • Eine Nukleofektion wurde in allen Versuchen unter Verwendung von K562-, HeLa- und U2OS-Zellen durchgeführt. Für PE-Bedingungen in diesen Zelltypen wurden 800 ng Prime Editor-Expressionsplasmid, 200 ng PEgRNA-Expressionsplasmid und 83 ng Nicking-Plasmid in einem Endvolumen von 20 µl in einem 16 Well Nucleocuvette Strip (Lonza) nukleofiziert. Für HDR-Bedingungen in diesen drei Zelltypen wurden 350 ng Nuklease-Expressionsplasmid, 150 ng sgRNA-Expressionsplasmid und 200 pmol (6,6 µg) 100-nt-ssDNA-Donor-Template (PAGE-gereinigt; Integrated DNA Technologies) in einem Endvolumen von 20 µl pro Probe in einem 16 Well Nucleocuvette Strip (Lonza) nukleofiziert. K562-Zellen wurden unter Verwendung des SF Cell Line 4D-Nucleofector X-Kit (Lonza) mit 5 × 105 Zellen pro Probe (Programm FF-120) gemäß der Vorschrift des Herstellers nukleofiziert. U2OS-Zellen wurden unter Verwendung des SE Cell Line 4D-Nucleofector X Kit (Lonza) mit 3-4 × 105 Zellen pro Probe (Programm DN-100) gemäß der Vorschrift des Herstellers nukleofiziert. HeLa-Zellen wurden unter Verwendung des SE Cell Line 4D-Nucleofector X Kit (Lonza) mit 2 × 105 Zellen pro Probe (Programm CN-114) gemäß der Vorschrift des Herstellers nukleofiziert. Die Zellen wurden 72 Stunden nach der Nukleofektion zur genomischen DNA-Extraktion geerntet.
  • Extraktion genomischer DNA für HDR-Versuche
  • Genomische DNA aus allen HDR-Vergleichsversuchen in HEK293T-, HEK293T-HBB-E6V-, K562-, U2OS- und HeLa-Zellen wurde unter Verwendung des Agencourt DNAdvance Kit (Beckman Coulter) gemäß der Vorschrift des Herstellers gereinigt.
  • Vergleich zwischen PE2, PE3, BE2, BE4max, ABEdmax und ABEmax
  • HEK293T-Zellen wurden auf Poly-D-Lysin-beschichteten 48-Well-Platten (Corning) ausgesät. Nach 16 bis 24 Stunden wurden die Zellen bei etwa 60 % Konfluenz transfiziert. Zum Basen-Editing mit CBE- oder ABE-Konstrukten wurden Zellen mit 750 ng Basen-Editor-Plasmid, 250 ng sgRNA-Expressionsplasmid und 1 µl Lipofectamine 2000 (Thermo Fisher Scientific) transfiziert. PE-Transfektionen wurden wie oben beschrieben durchgeführt. Die Extraktion genomischer DNA für PE und BE wurde wie oben beschrieben durchgeführt.
  • Bestimmung der PE3-Aktivität an bekannten Cas9-Off-Target-Stellen
  • Zur Untersuchung der PE3-Off-Target-Editing-Aktivität an bekannten Cas9-Off-Target-Stellen wurde aus HEK293T-Zellen extrahierte genomische DNA 3 Tage nach Transfektion mit PE3 als Template für eine PCR-Amplifikation von 16 zuvor berichteten Cas9-Off-Target-Genomstellen verwendet118, 159 (die oberen vier Off-Target-Stellen jeweils für die HEK3-, EMX1-, FANCF- und HEK4-Spacer;Primer-Sequenzen sind in Tabelle 4 aufgeführt). Diese Proben genomischer DNA waren identisch mit denen, die zur Quantifizierung von On-Target-PE3-Editing-Aktivitäten verwendet wurden, die in den 41A-41K gezeigt sind; PEgRNA- und Nicking-sgRNA-Sequenzen sind in den Tabellen 3A-3R aufgeführt. Nach der PCR-Amplifikation von Off-Target-Stellen wurden die Amplikons auf der Illumina MiSeq-Plattform sequenziert, wie oben beschrieben (HTS-Analyse). Zur Bestimmung der Cas9-Nuklease-, Cas9 H840A-Nickase-, dCas9- und PE2-dRT-On-Target- und -Off-Target-Editing-Aktivität wurden HEK293T-Zellen mit 750 ng Editor-Plasmid (Cas9-Nuklease, Cas9 H840A-Nickase, dCas9 oder PE2-dRT), 250 ng PEGRNA oder sgRNA-Plasmid und 1 µl Lipofectamine 2000 transfiziert. Genomische DNA wurde aus Zellen 3 Tage nach der Transfektion isoliert, wie oben beschrieben. On-Target- und Off-Target-Genom-Loci wurden durch PCR unter Verwendung der Primer-Sequenzen in Tabelle 4 amplifiziert und auf einem Illumina MiSeq sequenziert.
  • Eine HTS-Datenanalyse wurde unter Verwendung von CRISPResso2178 durchgeführt. Die Editing-Effizienzen von Cas9-Nuklease, Cas9 H840A-Nickase und dCas9 wurden als Prozentsatz der gesamten Sequenzierungs-Reads, die Indels enthielten, quantifiziert. Zur Quantifizierung von PE3- und PE3-dRT-Off-Targets wurden ausgerichtete Sequenzierungs-Reads auf Punktmutationen, Insertionen oder Deletionen untersucht, die mit dem erwarteten Produkt der an der Cas9-Nick-Stelle initiierten reversen PEgRNA-Transkription übereinstimmten. Einzelnukleotidvariationen, die mit einer Gesamthäufigkeit von <0,1 % unter den gesamten Reads innerhalb einer Probe auftraten, wurden von der Analyse ausgeschlossen. Für Reads, die Einzelnukleotidvariationen enthielten, die sowohl mit Häufigkeiten ≥0,1 % auftraten und teilweise mit dem PEgRNA-codierten Edit übereinstimmten, wurden t-Tests (ungepaart, einseitig, α = 0,5) verwendet, um zu bestimmen, ob die Varianten bei signifikant höheren Niveaus auftraten als Proben, die mit PEgRNAs behandelt wurden, die denselben Spacer enthielten, jedoch für unterschiedliche Edits codierten. Um Unterschiede aufgrund von Sequenzierungsfehlern zu vermeiden, wurden Vergleiche zwischen Proben angestellt, die gleichzeitig während desselben MiSeq-Laufs sequenziert wurden. Varianten, welche das Kriterium p-Wert > 0,05 nicht erfüllten, wurden ausgeschlossen. Die Off-Target-PE3 Editing-Aktivität wurde dann als der Prozentsatz der gesamten Sequenzierungs-Reads berechnet, welche die obigen Kriterien erfüllten.
  • Erzeugung einer HEK293T-Zelllinie, welche die HBB-E6V-Mutation enthält, unter Verwendung von Cas9-initiierter HDR
  • HEK293T-Zellen wurden in eine 48-Well-Platte ausgesät und bei etwa 60 % Konfluenz mit 1,5 µl Lipofectamine 2000, 300 ng Cas9 D10A-Nickase-Plasmid, 100 ng sgRNA-Plasmid und 200 ng 100-mer-ssDNA-Donor-Template transfiziert (Tabelle 5). Drei Tage nach der Transfektion wurde das Medium gegen frisches Medium ausgetauscht. Vier Tage nach der Transfektion wurden die Zellen unter Verwendung von 30 µl TrypLE-Lösung dissoziiert und in 1,5 ml Medium suspendiert. Einzelne Zellen wurden durch Fluoreszenz-aktivierte Zellsortierung (FACS) (Beckman-Coulter Astrios) in einzelne Wells von zwei 96-Well-Platten isoliert. Siehe 53A-53B für repräsentative FACS-Sortierbeispiele. Die Zellen wurden vor der Sequenzierung der genomischen DNA 14 Tage expandiert, wie oben beschrieben. Von den isolierten Klon-Populationen erwies sich keine als homozygot für die HBB-E6V-Mutation, so dass eine zweite Editing-Runde durch Lipofektion, Sortierung und Auswachsen in einer teilweise editierten Zelllinie wiederholt wurde, was eine Zelllinie ergab, die für das E6V-Allel homozygot war.
  • Erzeugung einer HEK293T-Zelllinie, welche die HBB-E6V-Mutation enthält, unter Verwendung von PE3.
  • 2,5 × 104 HEK293T-Zellen, die ohne Antibiotikum gezüchtet wurden, wurden auf Poly-D-Lysin beschichteten 48-Well-Platten (Corning) ausgesät. 16 bis 24 Stunden nach der Aussaat wurden die Zellen bei etwa 70 % Konfluenz mit 1 µl Lipofectamine 2000 (Thermo Fisher Scientific) gemäß den Vorschriften des Herstellers und 750 ng PE2-P2A-GFP-Plasmid, 250 ng PEgRNA-Plasmid und 83 ng sgRNA-Plasmid transfiziert. 3 Tage nach der Transfektion wurden die Zellen mit phosphatgepufferter Kochsalzlösung (Gibco) gewaschen und unter Verwendung von TrypLE Express (Gibco) dissoziiert. Die Zellen wurden dann mit DMEM plus GlutaMax (Thermo Fisher Scientific), ergänzt mit 10 % (Vol./Vol.) FBS (Gibco) verdünnt und vor dem Sortieren durch ein 35-µm-Zellsieb (Corning) geleitet. Durchflusszytometrie wurde auf einem LE-MA900-Zellsortierer (Sony) durchgeführt. Die Zellen wurden 15 Minuten vor dem Sortieren mit 3 nM DAPI (BioLegend) behandelt. Nach dem Gating für einen Dublett-Ausschluss wurden einzelne DAPI-negative Zellen mit einer GFP-Fluoreszenz über der einer GFP-negativen Kontrollzellpopulation in 96-Well-Flachboden-Zellkulturplatten (Corning) sortiert, die mit vorgekühltem DMEM mit GlutaMax, ergänzt mit 10 % FBS befüllt waren. Siehe 53A-53B für repräsentative FACS-Sortierbeispiele. Die Zellen wurden vor der Extraktion der genomischen DNA und der Charakterisierung durch HTS 10 Tage kultiviert, wie oben beschrieben. Insgesamt wurden sechs klonale Zelllinien identifiziert, die homozygot für die E6V-Mutation in HBB waren.
  • Erzeugung einer HEK293T-Zelllinie, welche die HEXA 1278+TATC-Insertion enthält, unter Verwendung von PE3
  • HEK293T-Zellen, die das HEXA 1278+TATC-Allel enthielten, wurden gemäß der oben beschriebenen Vorschrift zur Erzeugung der HBB E6V-Zelllinie erzeugt; PEgRNA- und sgRNA-Sequenzen sind in den Tabellen 2A-2C unter der Zwischenüberschrift der 43A-43H aufgeführt. Nach Transfektion und Sortierung wurden die Zellen vor der Extraktion der genomischen DNA und der Charakterisierung durch HTS 10 Tage kultiviert, wie oben beschrieben. Zwei heterozygote Zelllinien, die 50 % HEXA 1278+TATC-Allele enthielten, wurden isoliert, und zwei homozygote Zelllinien, die 100 % HEXA 1278+TATC-Allele enthielten, wurden gewonnen.
  • Zelllebensfähigkeitsassays
  • HEK293T-Zellen wurden in 48-Well-Platten ausgesät und bei etwa 70 % Konfluenz mit 750 ng Editor-Plasmid (PE3, PE3 R110S K103L, Cas9 H840A-Nickase oder dCas9), 250 ng HEK3-Targeting-PEgRNA-Plasmid und 1 µl Lipofectamine 2000 transfiziert, wie oben beschrieben. Die Lebensfähigkeit der Zellen wurde alle 24 Stunden nach der Transfektion für 3 Tage unter Verwendung des CellTiter-Glo 2.0-Assays (Promega) gemäß der Vorschrift des Herstellers gemessen. Die Lumineszenz wurde in 96-Well-Polystyrol-Mikroplatten mit flachem Boden (Corning) unter Verwendung eines M1000 Pro-Mikroplattenlesegeräts (Tecan) mit einer Integrationszeit von 1 Sekunde gemessen.
  • Lentivirus-Produktion
  • Lentivirus wurde wie zuvor beschrieben produziert206. T-75-Kolben mit sich schnell teilenden HEK293T-Zellen (ATCC; Manassas, VA, USA) wurden mit den Lentivirus-Produktions-Helferplasmiden pVSV-G und psPAX2 in Kombination mit modifizierten lentiCRISPR_v2-Genomen mit Intein-Split-PE2-Editor unter Verwendung von FuGENE HD (Promega, Madison, WI, USA) nach Herstellerangaben transfiziert. Es wurden vier Split-Intein-Editor-Konstrukte entworfen: 1) ein virales Genom, das für eine U6-PEgRNA-Expressionskassette und den mit dem Npu N-Intein fusionierten N-terminalen Teil (1-573) der Cas9 H840A-Nickase, ein selbstspaltendes P2A-Peptid und GFP-KASH codiert; 2) ein virales Genom, das für das mit dem C-terminalen Rest von PE2 fusionierte Npu-C-Intein codiert; 3) ein virales Genom, das für das mit dem C-terminalen Rest von Cas9 für die Cas9-Steuerung fusionierte Npu-C-Intein codiert; und 4) eine Nicking-sgRNA für DNMT1. Das Split-Intein vermittelt ein Trans-Spleißen zur Verbindung der beiden Hälften von PE2 oder Cas9, während das P2A-GFP-KASH die cotranslationale Produktion eines in der Kernmembran lokalisierten GFP ermöglicht. Nach 48 Stunden wurde Überstand entnommen, bei 500 g 5 Minuten zentrifugiert, um Zelltrümmer zu entfernen, und unter Verwendung eines 0,45-µm-Filters filtriert. Der gefilterte Überstand wurde unter Verwendung von PEG-it-Virus Precipitation Solution (System Biosciences, Palo Alto, CA, USA) gemäß Herstellerangaben eingeengt. Das resultierende Pellet wurde in Opti-MEM (Thermo Fisher Scientific, Waltham, MA, USA) unter Verwendung von 1 % des ursprünglichen Medienvolumens resuspendiert. Das resuspendierte Pellet wurde schockgefroren und bis zur Verwendung bei -80 °C gelagert.
  • Präparation und Kultur von primären kortikalen Neuronen der Maus
  • Dissoziierte kortikale Kulturen von E18,5 wurden C57BL/6-Mäusen mit zeitlich festgelegter Trächtigkeit (Charles River) entnommen. Embryonen wurden von trächtigen Mäusen nach Einschläferung durch CO2 und anschließender Enthauptung entnommen. Kortikale Caps wurden in eiskaltem Hibernate-E, ergänzt mit Penicillin/Streptomycin (Life Technologies), seziert. Nach einer Spülung mit eiskaltem Hibernate-E wurde das Gewebe 8 Minuten bei 37 °C in Papain/DNase (Worthington/Sigma) verdaut. Das Gewebe wurde in NBActiv4 (BrainBits), ergänzt mit DNase, zerrieben. Die Zellen wurden gezählt und in 24-Well-Platten mit 100.000 Zellen pro Well ausplattiert. Die Hälfte des Mediums wurde zweimal pro Woche gewechselt.
  • Prime Editing in primären Neuronen und Kernisolation
  • Bei DIV 1 wurden 15 µl Lentivirus im Verhältnis N-terminal:C-terminal:nicking sgRNA von 10:10:1 zugesetzt. Bei DIV 14 wurden neuronale Kerne unter Verwendung des EZ-PREP-Puffers (Sigma D8938) gemäß der Vorschrift des Herstellers isoliert. Alle Schritte wurden auf Eis oder bei 4 °C durchgeführt. Das Medium wurde von dissoziierten Kulturen entfernt, und die Kulturen wurden mit eiskaltem PBS gewaschen. PBS wurde abgesaugt und durch 200 µl EZ-PREP-Lösung ersetzt. Nach einer 5-minütigen Inkubation auf Eis wurde EZ-PREP über die Oberfläche der Vertiefung pipettiert, um verbleibende Zellen zu lösen. Die Probe wurde 5 Minuten bei 500 g zentrifugiert, und der Überstand wurde entfernt. Die Proben wurden mit 200 µl EZ-PREP gewaschen und erneut 5 Minuten bei 500 g zentrifugiert. Die Proben wurden durch vorsichtiges Pipettieren in 200 µl eiskaltem Nuclei Suspension Buffer (NSB), bestehend aus 100 µg/ml BSA und 3,33 µM Vybrant DyeCycle Ruby (Thermo Fisher) in 1xPBS resuspendiert, dann bei 500 g 5 Minuten zentrifugiert. Der Überstand wurde entfernt, und die Kerne wurden in 100 µl NSB resuspendiert und in 100 µl Agencourt DNAdvance Lysepuffer unter Verwendung eines MoFlo Astrios (Beckman Coulter) in der Durchflusszytometrieanlage des Broad Institute sortiert. Genomische DNA wurde gemäß den Anweisungen des Herstellers bzgl. Agencourt DNAdvance gereinigt.
  • RNA-Sequenzierung und Datenanalyse
  • HEK293T-Zellen wurden mit PRNP-targeting oder HEXA-targeting PEgRNAs und PE2, PE2-dRT oder Cas9 H840A-Nickase cotransfiziert. 72 Stunden nach der Transfektion wurde Gesamt-RNA aus den Zellen unter Verwendung von TRIzol-Reagens (Thermo Fisher) entnommen und mit dem RNeasy Mini-Kit (Qiagen) einschließlich einer On-Column-DNasel-Behandlung gereinigt. Gesamt-RNA wurde aus Ribosomen unter Verwendung der rRNA-Entfernungsvorschrift des TruSeq Stranded Total RNA Library Prep Kit (Illumina) entfernt, und die Ribosomen wurden anschließend mit RNAClean XP-Beads (Beckman Coulter) gewaschen. Sequenzierungsbibliotheken wurden unter Verwendung von RNA, die aus Ribosomen entfernt wurde, auf einem SMARTer PrepX Apollo NGS-Bibliotheksherstellungssystem (Takara) gemäß der Vorschrift des Herstellers hergestellt. Die resultierenden Bibliotheken wurden auf einer 2200 TapeStation (Agilent Technologies) visualisiert, mit einem Qubit dsDNA HS Assay (Thermo Fisher) normalisiert und auf einem NextSeq 550 unter Verwendung einer Hochleistungs-v2-Flusszelle (Illumina) als 75-bp Paired-End-Reads sequenziert. Fastq-Dateien wurden mit bcl2fastq2 Version 2.20 erzeugt und mit TrimGalore Version 0.6.2 (https://github.com/FelixKrueger/TrimGalore) getrimmt, um Basen von geringer Qualität, ungepaarte Sequenzen und Adaptersequenzen zu entfernen. Getrimmte Reads wurden an eine Homo sapiens-Genomanordnung GRCh148 mit einem benutzerdefinierten Cas9 H840A-Geneintrag unter Verwendung von RSEM Version 1.3.1207 ausgerichtet. Das limma-voom208-Paket wurde verwendet, um die Genexpressionsniveaus zu normalisieren und eine differentielle Expressionsanalyse mit Batch-Effekt-Korrektur durchzuführen. Differentiell exprimierte Gene lagen bei FDR-korrigiertem p-Wert < 0,05 und Fold Change > 2 Cutoffs vor, und die Ergebnisse wurden in R visualisiert.
  • ClinVar-Analyse
  • Die Zusammenfassung der ClinVar-Varianten wurde vom NCBI heruntergeladen (Zugriff am 15. Juli 2019), und die darin enthaltenen Informationen wurden für alle nachfolgenden Analysen verwendet. Die Liste aller gemeldeten Varianten wurde nach Allel-ID gefiltert, um Duplikate zu entfernen, und nach klinischer Bedeutung, um die Analyse auf pathogene Varianten zu beschränken. Die Liste der pathogenen Varianten wurde sequentiell nach Variantentyp gefiltert, um den Anteil der pathogenen Varianten zu berechnen, bei denen es sich um Insertionen, Deletionen usw. handelt. Einzelnukleotidvarianten (SNVs) wurden basierend auf berichteten Referenz- und Alternativallelen in zwei Kategorien (Transitionen und Transversionen) aufgeteilt. SNVs, ohne berichtete Referenz- oder Alternativallele wurden von der Analyse ausgeschlossen.
  • Die Längen der berichteten Insertionen, Deletionen und Duplikationen wurden unter Verwendung von Referenz-/Alternativallelen, Start-/Stopp-Positionen der Varianten oder entsprechenden Identifizierungsinformationen im Variantennamen berechnet. Varianten ohne irgendwelche der oben genannten Informationen wurden von der Analyse ausgeschlossen. Die Längen der berichteten Indels (einzelne Varianten, die sowohl Insertionen als auch Deletionen relativ zum Referenzgenom beinhalten) wurden berechnet, indem die Anzahl der Fehlpaarungen oder Lücken in der besten paarweisen Ausrichtung zwischen den Referenz- und Alternativallelen bestimmt wurde. Häufigkeitsverteilungen von Variantenlängen wurden mit GraphPad Prism 8 berechnet.
  • Datenverfügbarkeit
  • Hochdurchsatz-Sequenzierungsdaten werden in der NCBI Sequence Read Archive-Datenbank hinterlegt. Plasmide, die für PE1-, PE2/PE3- und PEgRNA-Expressionsvektoren codieren, sind von Addgene erhältlich.
  • Code-Verfügbarkeit
  • Das zur Quantifizierung der PEgRNA-Gerüstinsertion verwendete Skript ist in den 60A-60B bereitgestellt.
  • Ergänzende Informationen: Tabellen und Sequenzen
  • Tabelle 1: Aktivitäten von Prime Editors, Cas9-Nuklease, Cas9 H840A-Nickase und PE2-dRT an HEK3-, HEK4-, EMX1- und FANCF-On-Target- und Off-Target-Sites. PE2/PE3-Editing ist als % Prime Editing neben % Indels (in Klammern) angegeben. % Indels ist für Cas9, Cas9 H840A-Nickase (nCas9) und PE2-dRT an den oberen vier zuvor charakterisierten Off-Target-Stellen angegeben179,180. sgRNA- und PEgRNA-Sequenzen sind in den Tabellen 3A-3R unter den Überschriften zu 42A-42H zu finden. Alle Werte sind der Durchschnitt von drei unabhängigen biologischen Replikaten.
    Figure DE112020001339T5_0316
  • Tabellen 2A-2C: Sequenzen der für In-vitro-Versuche verwendeten DNA-Oligonukleotide, PEgRNAs und sgRNAs.
    Figure DE112020001339T5_0317
    Figure DE112020001339T5_0318
    Figure DE112020001339T5_0319
    Figure DE112020001339T5_0320
    Figure DE112020001339T5_0321
    Figure DE112020001339T5_0322
  • Tabellen 3A-3R: Sequenzen von PEgRNAs und sgRNAs, die in Säugerzellversuchen verwendet wurden. Alle Sequenzen sind in 5'-nach-3'-Orientierung gezeigt. Zum Aufbau von PEgRNAs wurden die unten aufgelisteten Spacer-Sequenzen an das 5'-Ende des sgRNA-Gerüsts hinzugefügt und die unten aufgelisteten 3'-Extensions, welche die Primer-Bindungsstelle und das RT-Template enthalten, wurden an das 3'-Ende des sgRNA-Gerüsts hinzugefügt. Die sgRNA-Gerüstsequenz ist GTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAA AAAGTGGCACCGAGTCGGTGC (SEQ ID NO: 131). Tabelle 3A: PEGRNA von FIG. 39A-39D
    PEGRNA SPACER-SEQUENZ (SEQ ID NOS: 2890-2996) 3' EXTENSION (SEQ ID NOS:2997-3103) PBS-LÄNGE (NT) RT-TEMPLA TE-LÄNGE (NT)
    HEK3_2B-C_8 GGCCCAGACTGAG CACGTGA TCTGCCATCTCGTGCTCA 8 10
    HEK3_2B-C_9 GGCCCAGACTGAG CACGTGA TCTGCCATCTCGTGCTCA G 9 10
    HEK3_2B-C_10 GGCCCAGACTGAG CACGTGA TCTGCCATCTCGTGCTCA GT 10 10
    HEK3_2B-C_11 GGCCCAGACTGAG CACGTGA TCTGCCATCTCGTGCTCA GTC 11 10
    HEK3_2B-C_12 GGCCCAGACTGAG CACGTGA TCTGCCATCTCGTGCTCA GTCT 12 10
    HEK3_2B-C_13 GGCCCAGACTGAG CACGTGA TCTGCCATCTCGTGCTCA GTCTG 13 10
    HEK3_2B-C_14 GGCCCAGACTGAG CACGTGA TCTGCCATCTCGTGCTCA GTCTGG 14 10
    HEK3_2B-C_15 GGCCCAGACTGAG CACGTGA TCTGCCATCTCGTGCTCA GTCTGGG 15 10
    HEK3_2C_1 6 GGCCCAGACTGAG CACGTGA TCTGCCATCTCGTGCTCA GTCTGGGC 16 10
    HEK3_2C_1 7 GGCCCAGACTGAG CACGTGA TCTGCCATCTCGTGCTCA GTCTGGGCC 17 10
    EMX1_2C_ 9 GAGTCCGAGCAGA AGAAGAA ATGGGAGCACTTCTTCTT CTGC 9 13
    EMX1_2C_ 10 GAGTCCGAGCAGA AGAAGAA ATGGGAGCACTTCTTCTT CTGCT 10 13
    EMX 1_2C_ 11 GAGTCCGAGCAGA AGAAGAA ATGGGAGCACTTCTTCTT CTGCTC 11 13
    EMX1_2C_ 12 GAGTCCGAGCAGA AGAAGAA ATGGGAGCACTTCTTCTT CTGCTCG 12 13
    EMX1_2C_ 13 GAGTCCGAGCAGA AGAAGAA ATGGG AGC ACTTCTTCTT CTGCTCGG 13 13
    EMX1_2C_ 14 GAGTCCGAGCAGA AGAAGAA ATGGGAGCACTTCTTCTT CTGCTCGGA 14 13
    EMX1_2C_ 15 GAGTCCGAGCAGA AGAAGAA ATGGGAGCACTTCTTCTT CTGCTCGGAC 15 13
    EMX1_2C_ 16 GAGTCCGAGCAGA AGAAGAA ATGGGAGCACTTCTTCTT CTGCTCGGACT 16 13
    EMX1_2C_ 17 GAGTCCGAGCAGA AGAAGAA ATGGGAGCACTTCTTCTT CTGCTCGGACTC 17 13
    FANCF_2C _8 GGAATCCCTTCTGC AGCACC GGAAAAGCGATCAAGGT GCTGCAGA 8 17
    FANCF_2C _9 GGAATCCCTTCTGC AGCACC GGAAAAGCGATCAAGGT GCTGCAGAA 9 17
    FANCF_2C _10 GGAATCCCTTCTGC AGCACC GGAAAAGCGATCAAGGT GCTGCAGAAG 10 17
    FANCF_2C _11 GGAATCCCTTCTGC AGCACC GGAAAAGCGATCAAGGT GCTGCAGAAGG 11 17
    FANCF_2C _12 GGAATCCCTTCTGC AGCACC GGAAAAGCGATCAAGGT GCTGCAGAAGGG 12 17
    FANCF_2C _13 GGAATCCCTTCTGC AGCACC GGAAAAGCGATCAAGGT GCTGCAGAAGGGA 13 17
    FANCF_2C _14 GGAATCCCTTCTGC AGCACC GGAAAAGCGATCAAGGT GCTGCAGAAGGGAT 14 17
    FANCF_2C _15 GGAATCCCTTCTGC AGCACC GGAAAAGCGATCAAGGT GCTGCAGAAGGGATT 15 17
    FANCF_2C _16 GGAATCCCTTCTGC AGCACC GGAAAAGCGATCAAGGT GCTGCAGAAGGGATTC 16 17
    FANCF_2C _17 GGAATCCCTTCTGC AGCACC GGAAAAGCGATCAAGGT GCTGCAGAAGGGATTCC 17 17
    RNF2_2C_9 GTCATCTTAGTCAT TACCTG GAACACCTCATGTAATG ACT 9 11
    RNF2_2C_1 0 GTCATCTTAGTCAT TACCTG GAACACCTCATGTAATG ACTA 10 11
    RNF2_2C_1 1 GTCATCTTAGTCAT TACCTG GAACACCTCATGTAATG ACTAA 11 11
    RNF2_2C_1 2 GTCATCTTAGTCAT TACCTG GAACACCTCATGTAATG ACTAAG 12 11
    RNF2 2C 1 3 GTCATCTTAGTCAT TACCTG GAACACCTCATGTAATG ACTAAGA 13 11
    RNF2_2C_1 4 GTCATCTTAGTCAT TACCTG GAACACCTCATGTAATG ACTAAGAT 14 11
    RNF2_2C_1 5 GTCATCTTAGTCAT TACCTG GAACACCTCATGTAATG ACTAAGATC. 15 11
    RNF2_2C_1 6 GTCATCTTAGTCAT TACCTG GAACACCTCATGTAATG ACTAAGATGA 16 11
    RNF2_2C_1 7 GTCATCTTAGTCAT TACCTG GAACACCTCATGTAATG ACTAAGATGAC 17 11
    HEK4_2C_7 GGCACTGCGGCTG GAGGTGG GCTTTAACCCCAACCTC CAG 7 13
    HEK4_2C_8 GGCACTGCGGCTG GAGGTGG GCTTTAACCCCAACCTC CAGC 8 13
    HEK4_2C_9 GGCACTGCGGCTG GAGGTGG GCTTTAACCCCAACCTC CAGCC 9 13
    HEK4_2C_1 0 GGCACTGCGGCTG GAGGTGG GCTTTAACCCCAACCTC CAGCCG 10 13
    HEK4_2C_1 1 GGCACTGCGGCTG GAGGTGG GCTTTAACCCCAACCTC CAGCCGC 11 13
    HEK4_2C_1 2 GGCACTGCGGCTG GAGGTGG GCTTTAACCCCAACCTC CAGCCGCA 12 13
    HEK4_2C_1 3 GGCACTGCGGCTG GAGGTGG GCTTTAACCCCAACCTC CAGCCGCAG 13 13
    HEK4_2C_1 4 GGCACTGCGGCTG GAGGTGG GCTTTAACCCCAACCTC CAGCCGCAGT 14 13
    HEK4_2C 1 5 GGCACTGCGGCTG GAGGTGG GCTTTAACCCCAACCTC CAGCCGCAGTG 15 13
    HEK3_2C_1 TDEL GGCCCAGACTGAG CACGTGA TCTGCCATCCGTGCTCAG TCTG 13 10
    HEK3_2C_1 A1NS GGCCCAGACTGAG CACGTGA TCTGCCATCATCGTGCTC AGTCTG 13 10
    HEK3_2C_1 CTTINS GGCCCAGACTGAG CACGTGA TCTGCCATCAAAGCGTG CTCAGTCTG 13 10
    HEK3_2D_1 0 GGCCCAGACTGAG CACGTGA TCTGCCATCTCGTGCTCA GTCTG 13 10
    HEK3_2D_1 1 GGCCCAGACTGAG CACGTGA CTCTGCCATCTCGTGCTC AGTCTG 13 11
    HEK3_2D_1 2 GGCCCAGACTGAG CACGTGA CCTCTGCCATCTCGTGCT CAGTCTG 13 12
    HEK3_2D_1 3 GGCCCAGACTGAG CACGTGA TCCTCTGCCATCTCGTGC TCAGTCTG 13 13
    HEK3_2D_1 4 GGCCCAGACTGAG CACGTGA TTCCTCTGCCATCTCGTG CTCAGTCTG 13 14
    HEK3_2D_1 5 GGCCCAGACTGAG CACGTGA TTTCCTCTGCCATCTCGT GCTCAGTCTG 13 15
    HEK3_2D_1 6 GGCCCAGACTGAG CACGTGA CTTTCCTCTGCCATCTCG TGCTCAGTCTG 13 16
    HEK3_2D_1 7 GGCCCAGACTGAG CACGTGA CCTTTCCTCTGCCATCTC GTGCTCAGTCTG 13 17
    HEK3_2D_1 8 GGCCCAGACTGAG CACGTGA TCCTTTCCTCTGCCATCT CGTGCTCAGTCTG 13 18
    HEK3_2D_1 9 GGCCCAGACTGAG CACGTGA TTCCTTTCCTCTGCCATC TCGTGCTCAGTCTG 13 19
    HEK3_2D_2 0 GGCCCAGACTGAG CACGTGA CTTCCTTTCCTCTGCCAT CTCGTGCTCAGTCTG 13 20
    EMX1_2D_ 10 GAGTCCGAGCAGA AGAAGAA GGAGCCCTTGTTCTTCTG CTCGG 13 10
    EMX t-2D-11 GAGTCCGAGCAGA AGAAGAA GGGAGCCCTTGTTCTTCT GCTCGG 13 11
    EMX1_2D_ 12 GAGTCCGAGCAGA AGAAGAA TGGGAGCCCTTGTTCTTC TGCTCGG 13 12
    EMX1_2D_ 13 GAGTCCGAGCAGA AGAAGAA ATGGGAGCCCTTGTTCTT CTGCTCGG 13 13
    EMX1_2D_ 14 GAGTCCGAGCAGA AGAAGAA GATGGGAGCCCTTGTTC TTCTGCTCGG 13 14
    EMX1_2D_ 15 GAGTCCGAGCAGA AGAAGAA TGATGGGAGCCCTTGTT CTTCTGCTCGG 13 15
    EMX t_2D_ 16 GAGTCCGAGCAGA AGAAGAA GTGATGGGAGCCCTTGT TCTTCTGCTCGG 13 16
    EMX1_2D_ 17 GAGTCCGAGCAGA AGAAGAA TGTGATGGGAGCCCTTG TTCTTCTGCTCGG 13 17
    EMX1_2D_ 18 GAGTCCGAGCAGA AGAAGAA ATGTGATGGGAGCCCTT GTTCTTCTGCTCGG 13 18
    EMX1_2D_ 19 GAGTCCGAGCAGA AGAAGAA GATGTGATGGGAGCCCT TGTTCTTCTGCTCGG 13 19
    EMX1_2D_ 20 GAGTCCGAGCAGA AGAAGAA TGATGTGATGGGAGCCC TTGTTCTTCTGCTCGG 13 20
    FANCF_2D _10 GGAATCCCTTCTGC AGCACC CGATCAAGGTGCTGCAG AAGGGA 13 10
    FANCF _ 2D _11 GGAATCCCTTCTGC AGCACC GCGATCAAGGTGCTGCA GAAGGGA 13 11
    FANCF_2D _12 GGAATCCCTTCTGC AGCACC AGCGATCAAGGTGCTGC AGAAGGGA 13 12
    FANCF_2D _13 GGAATCCCTTCTGC AGCACC AAGCGATCAAGGTGCTG CAGAAGGGA 13 13
    FANCF_2D _14 GGAATCCCTTCTGC AGCACC AAAGCGATCAAGGTGCT GCAGAAGGGA 13 14
    FANCF_2D _15 GGAATCCCTTCTGC AGCACC AAAAGCGATCAAGGTGC TGCAGAAGGGA 13 15
    FANCF_2D _16 GGAATCCCTTCTGC AGCACC GAAAAGCGATCAAGGTG CTGCAGAAGGGA 13 16
    FANCF_2D _17 GGAATCCCTTCTGC AGCACC GGAAAAGCGATCAAGGT GCTGCAGAAGGGA 13 17
    FANCF_2D _18 GGAATCCCTTCTGC AGCACC CGGAAAAGCGATCAAGG TGCTGCAGAAGGGA 13 18
    FANCF 2D _19 GGAATCCCTTCTGC AGCACC TCGGAAAAGCGATCAAG GTGCTGCAGAAGGGA 13 19
    FANCF_2D _20 GGAATCCCTTCTGC AGCACC CTCGGAAAAGCGATCAA GGTGCTGCAGAAGGGA 13 20
    RNF2_2D_1 0 GTCATCTTAGTCAT TACCTG AACACCTCATGTAATGA CTAAGATG 15 10
    RNF2_2D_1 1 GTCATCTTAGTCAT TACCTG GAACACCTCATGTAATG ACTAAGATG 15 11
    RNF2_2D_1 2 GTCATCTTAGTCAT TACCTG CGAACACCTCATGTAAT GACTAAGATG 15 12
    RNF2_2D_1 3 GTCATCTTAGTCAT TACCTG ACGAACACCTCATGTAA TGACTAAGATG 15 13
    RNF2_2D_1 4 GTCATCTTAGTCAT TACCTG AACGAACACCTCATGTA ATGACTAAGATG 15 14
    RNF2_2D_1 5 GTCATCTTAGTCAT TACCTG CAACGAACACCTCATGT AATGACTAAGATG 15 15
    RNF2_2D_1 6 GTCATCTTAGTCAT TACCTG ACAACGAACACCTCATG TAATGACTAAGATG 15 16
    RNF2_2D_1 7 GTCATCTTAGTCAT TACCTG TACAACGAACACCTCAT GTAATGACTAAGATG 15 17
    RNF2_2D_1 8 GTCATCTTAGTCAT TACCTG TTACAACGAACACCTCA TGTAATGACTAAGATG 15 18
    RNF2_2D_1 9 GTCATCTTAGTCAT TACCTG GTTACAACGAACACCTC ATGTAATGACTAAGATG 15 19
    RNF2_2D_2 0 GTCATCTTAGTCAT TACCTG AGTTACAACGAACACCT CATGTAATGACTAAGATG 15 20
    HEK4_2D_7 GGCACTGCGGCTG GAGGTGG ACCCCAACCTCCAGCCG C 11 7
    HEK4_2D_8 GGCACTGCGGCTG GAGGTGG AACCCCAACCTCCAGCC GC 11 8
    HEK4_2D_9 GGCACTGCGGCTG GAGGTGG TAACCCCAACCTCCAGC CGC 11 9
    HEK4_2D_1 0 GGCACTGCGGCTG GAGGTGG TTAACCCCAACCTCCAG CCGC 11 10
    HEK4_2D_1 1 GGCACTGCGGCTG GAGGTGG TTTAACCCCAACCTCCA GCCGC 11 11
    HEK4_20_1 2 GGCACTGCGGCTG GAGGTGG CTTTAACCCCAACCTCC AGCCGC 11 12
    HEK4_2D_1 3 GGCACTGCGGCTG GAGGTGG GCTTTAACCCCAACCTC CAGCCGC 11 13
    HEK4_20_1 4 GGCACTGCGGCTG GAGGTGG CGCTTTAACCCCAACCT CCAGCCGC 11 14
    HEK4_2D_1 5 GGCACTGCGGCTG GAGGTGG CCGCTTTAACCCCAACC TCCAGCCGC 11 15
    HEK4_2D_1 6 GGCACTGCGGCTG GAGGTGG TCCGCTTTAACCCCAAC CTCCAGCCGC 11 16
    HEK4_2D_1 7 GGCACTGCGGCTG GAGGTGG CTCCGCTTTAACCCCAA CCTCCAGCCGC 11 17
    HEK4_2D_1 8 GGCACTGCGGCTG GAGGTGG CTCCGCTTTAACCCCAA CCTCCAGCCGC 11 18
    HEK4_2D_1 9 GGCACTGCGGCTG GAGGTGG CTCCGCTTTAACCCCAA CCTCCAGCCGC 11 19
    Tabelle 3B: PEGRNA von FIG. 40A-40C
    PEGRNA SPACER-SEQUENZ (SEQ ID NO: 3104-3112) 3' EXTENSION (SEQ ID NOS: 3113-3121) PBS-LÄNG E (NT) RT-TEMPL ATE-LÄNGE (NT)
    RNF2_3B GTCATCTTAGTCAT TACCTG AACGAACACCTCATGTA ATGACTAAGATG 15 14
    EMX1_3B GAGTCCGAGCAGA AGAAGAA ATGGGAGCACTTCTTCT TCTGCTCGGAC 15 13
    FANCF_3B GGAATCCCTTCTG CAGCACC GGAAAAGCGATCAAGGT GCTGCAGAAGGGATT 15 17
    HE3_3B GGCCCAGACTGAG CACGTGA TCTGCCATGACGTGCTC AGTCTG 13 10
    HEK4_3B GGCACTGCGGCTG GAGGTGG TTAACCCCAACCTCCAG CC 9 10
    RNF2 3C_4 ATOC GTCATCTTAGTCAT TACCTG AACGAACACCGCAGGTA ATGACTAAGATG 15 14
    RNF2_3C_4 ATOG GTCATCTTAGTCAT TACCTG AACGAACACCCCAGGTA ATGACTAAGATG 15 14
    FANCF_ 3C _ 5GTOT GGAATCCCTTCTG CAGCACC GGAAAAGCGATCAAGGT GCTGCAGAAGGGA 13 17
    FANCF_3C_ 7ATOC GGAATCCCTTCTG CAGCACC GGAAAAGCGAGCCAGG TGCTGCAGAAGGGAT 14 17
    Tabelle 3C: Nicking-sgRNA-Sequenzen von FIG. 40A-40C
    NICKING-SGRNA SPACER-SEQUENZ SEQ ID NO:
    RNF2_2B_+41 GTCAACCATTAAGCAAAACAT 3122
    RNF2_2B_+67 GTCTCAGGCTGTGCAGACAAA 3123
    EMX1_2B_-116 GGGGCACAGATGAGAAACTC 3124
    EMX1_2B_57 GCCGTTTGTACTTTGTCCTC 3125
    EMX1_2B_+14 GCGCCACCGGTTGATGTGAT 3126
    EMX1_2B_+27 GCTTCGTGGCAATGCGCCAC 3127
    EMX1_2JB_+53 GACATCGATGTCCTCCCCAT 3128
    EMX1_2B-+80 GTGGTTGCCCACCCTAGTCAT 3129
    FANCF_2B_-78 GCGACTCTCTGCGTACTGAT 3130
    FANCF_2B_-50 GCCCTACTTCCGCTTTCACCT 3131
    FANCF_2B_-27 GGATTCCATGAGGTGCGCGA 3132
    FANCF_2B_-17 GCTGCAGAAGGGATTCCATG 3133
    FANCF_2B_+21 GCTTGAGACCGCCAGAAGCT 3134
    FANCF_2B_+48 GGGGTCCCAGGTGCTGACGT 3135
    HEK3_2B_-108 GCAGAAATAGACTAATTGCA 3136
    HEK3_2B_-38 GGATTGACCCAGGCCAGGGC 3137
    HEK3_2B_+26 GACGCCCTCTGGAGGAAGCA 3138
    HEK3_2B_+37 GCTGTCCTGCGACGCCCTC 3139
    HEK3_2B_+63 GCACATACTAGCCCCTGTCT 3140
    HEK3_2B_+90 GTCAACCAGTATCCCGGTGC 3141
    HEK4_2B_-95 TCCCTTCCTTCCACCCAGCC 3142
    HEK4_2B_-51 CCCTGCCTGTCATCCTGCTT 3143
    HEK4_2B_-26 GCAGTGCCACCGGGGCGCCG 3144
    HEK4_2B_+52 GCGGGGGCTCAGAGAGGGCA 3145
    HEK4_2B_+74 GAGACACACACACAGGCCTGG 3146
    RNF2_2C_+41 GTCAACCATTAAGCAAAACAT 3147
    RNF2_2C_4ATOC_+5 GTGAGTTACAACGAACACCGC 3148
    RNF2_2C_4ATOG_+5 GTGAGTTACAACGAACACCCC 3149
    FANCF_2C_+48 GGGGTCCCAGGTGCTGACGT 3150
    FANCF_2C_5GTOT_+7 GAAGCTCGGAAAAGCGATCA 3151
    FANCF_2C_7ATOC_+7 GAAGCTCGGAAAAGCGAGCC 3152
    HEK3_2C_+90 GTCAACCAGTATCCCGGTGC 3153
    Tabelle 3D: PEGRNA von FIG. 41A-41K
    PEGRNA SPACER-SEQUENZ (SEQ ID NO: 3154-3304) 3' EXTENSION (SEQ ID NO: 3305-3455) PBS-LÄN GE (NT) RT-TEMPL ATE-LÄNGE (NT)
    HEK3 4A_ 1TTOA GGCCCAGACTGAG CACGTGA TCTGCCATCTCGTGCTCA GTCTG 13 10
    HEK3_4A_ TTOC GGCCCAGACTGAG CACGTGA TCTGCCATCGCGTGCTCA GTCTG 13 10
    HEK3_4A_ 1TTOG GGCCCAGACTGAG CACGTGA TCTGCCATCCCGTGCTCA GTCTG 13 10
    HEK3_4A_ 2GTOA GGCCCAGACTGAG CACGTGA TCTGCCATTACGTGCTCA GTCTG 13 10
    HEK3_4A_ 2GTOC GGCCCAGACTGAG CACGTGA TCTGCCATGACGTGCTCA GTCTG 13 10
    HEK3_4A_ 2GTOT GGCCCAGACTGAG CACGTGA TCTGCCATAACGTGCTCA GTCTG 13 10
    HEK3_4A_ 3ATOC GGCCCAGACTGAG CACGTGA TCTGCCAGCACGTGCTCA GTCTG 13 10
    HEK3_4A_ 3ATOG GGCCCAGACTGAG CACGTGA TCTGCCACCACGTGCTCA GTCTG 13 10
    HEK3_4A_ 3ATOT GGCCCAGACTGAG CACGTGA TCTGCCAACACGTGCTCA GTCTG 13 10
    HEK3_4A_ 4TTOA GGCCCAGACTGAG CACGTGA TCTGCCTTCACGTGCTCA GTCTG 13 10
    HEK3 4A_ 4TTOC GGCCCAGACTGAG CACGTGA TCTGCCGTCACGTGCTCA GTCTG 13 10
    HEK3_4A_ 4TTOG GGCCCAGACTGAG CACGTGA TCTGCCCTCACGTGCTCA GTCTG 13 10
    HEK3 _4A_ 5GTOA GGCCCAGACTGAG CACGTGA TCTGCTATCACGTGCTCA GTCTG 13 10
    HEK3_4A_ 5GTOC GGCCCAGACTGAG CACGTGA TCTGCGATCACGTGCTCA GTCTG 13 10
    HEK3_4A_ 5GTOT GGCCCAGACTGAG CACGTGA TCTGCAATCACGTGCTCA GTCTG 13 10
    HEK3_4A_ 6GTOA GGCCCAGACTGAG CACGTGA TCTGTCATCACGTGCTCA GTCTG 13 10
    HEK3_4A_ 6GTOC GGCCCAGACTGAG CACGTGA TCTGGCATCACGTGCTCA GTCTG 13 10
    HEK3_4A_ 6GTOT GGCCCAGACTGAG CACGTGA TCTGACATCACGTGCTCA GTCTG 13 10
    HEK3_4A_ 7CTOA GGCCCAGACTGAG CACGTGA TCTTCCATCACGTGCTCA GTCTG 13 10
    HEK3_4A_ 7CTOG GGCCCAGACTGAG CACGTGA TCTCCCATCACGTGCTCA GTCTG 13 10
    HEK3_4A_ 7CTOT GGCCCAGACTGAG CACGTGA TCTACCATCACGTGCTCA GTCTG 13 10
    HEK3_4A_ 8ATOC GGCCCAGACTGAG CACGTGA TCGGCCATCACGTGCTCA GTCTG 13 10
    HEK3_4A_ 8ATOG GGCCCAGACTGAG CACGTGA TCCGCCATCACGTGCTCA GTCTG 13 10
    HEK3_4A_ 8ATOT GGCCCAGACTGAG CACGTGA TCAGCCATCACGTGCTCA GTCTG 13 10
    HEK3_4B_ 1TTOA GGCCCAGACTGAG CACGTGA TGGAGGAAGCAGGGCTT CCTTTCCTCTGCCATCTC GTGCTCAGTCTG 13 34
    HEK3_4B_ 12GTOC GGCCCAGACTGAG CACGTGA TGGAGGAAGCAGGGCTT CCTTTGCTCTGCCATCAC GTGCTCAGTCTG 13 34
    HEK3_4B_ 14ATOT GGCCCAGACTGAG CACGTGA TGGAGGAAGCAGGGCTT CCTATCCTCTGCCATCAC GTGCTCAGTCTG 13 34
    HEK3 _4B_ 17GTOC GGCCCAGACTGAG CACGTGA TGGAGGAAGCAGGGCTT GCTTTCCTCTGCCATCAC GTGCTCAGTCTG 13 34
    HEK3_4B_ 20GTOC GGCCCAGACTGAG CACGTGA TGGAGGAAGCAGGGGTT CCTTTCCTCTGCCATCAC GTGCTCAGTCTG 13 34
    HEK3_4B_ 23CTOG GGCCCAGACTGAG CACGTGA TGGAGGAAGCACGGCTT CCTTTCCTCTGCCATCAC GTGCTCAGTCTG 13 34
    HEK3_4B_ 24TTOA GGCCCAGACTGAG CACGTGA TGGAGGAAGCTGGGCTT CCTTTCCTCTGCCATCAC GTGCTCAGTCTG 13 34
    HEK3_4B_ 26CTOG GGCCCAGACTGAG CACGTGA TGGAGGAACCAGGGCTT CCTTTCCTCTGCCATCAC GTGCTCAGTCTG 13 34
    HEK3_4B_ 30CTOG GGCCCAGACTGAG CACGTGA TGGACGAAGCAGGGCTT CCTTTCCTCTGCCATCAC GTGCTCAGTCTG 13 34
    HEK3_4B_ 33CTOG GGCCCAGACTGAG CACGTGA TCGAGGAAGCAGGGCTT CCTTTCCTCTGCCATCAC GTGCTCAGTCTG 13 34
    RNF2_4C_ 1CTOA GTCATCTTAGTCATT ACCTG AACGAACACCTCATGTAA TGACTAAGATG 15 14
    RNF2_4C_ 1CTOG GTCATCTTAGTCATT ACCTG AACGAACACCTCACGTA ATGACTAAGATG 15 14
    RNF2_4C_ 1CTOT GTCATCTTAGTCATT ACCTG AACGAACACCTCAAGTA ATGACTAAGATG 15 14
    RNF2 4C_ 2TTOA GTCATCTTAGTCATT ACCTG AACGAACACCTCTGGTA ATGACTAAGATG 15 14
    RNF2_4C_ 2TTOG GTCATCTTAGTCATT ACCTG AACGAACACCTCCGGTA ATGACTAAGATG 15 14
    RNF2_4C_ 3GTOC GTCATCTTAGTCATT ACCTG AACGAACACCTGAGGTA ATGACTAAGATG 15 14
    RNF2_4C_ 4ATOC GTCATCTTAGTCATT ACCTG AACGAACACCGCAGGTA ATGACTAAGATG 15 14
    RNF2 _4C_ 4ATOT GTCATCTTAGTCATT ACCTG AACGAACACCACAGGTA ATGACTAAGATG 15 14
    RNF2_4C_ 4ATOG GTCATCTTAGTCATT ACCTG AACGAACACCCCAGGTA ATGACTAAGATG 15 14
    RNF2_4C_ 5GTOT GTCATCTTAGTCATT ACCTG AACGAACACATCAGGTA ATGACTAAGATG 15 14
    RNF2_4C_ 6GTOA GTCATCTTAGTCATT ACCTG AACGAACATCTCAGGTA ATGACTAAGATG 15 14
    RNF2_4C_ 7TTOC GTCATCTTAGTCATT ACCTG AACGAACGCCTCAGGTA ATGACTAAGATG 15 14
    FANCF_4D _1ATOG GGAATCCCTTCTGC AGCACC GGAAAAGCGATCCAGGC GCTGCAGAAGGGAT 14 17
    FANCF_4D _1ATOT GGAATCCCTTCTGC AGCACC GGAAAAGCGATCCAGGA GCTGCAGAAGGGAT 14 17
    FANCF_4D _2CTOA GGAATCCCTTCTGC AGCACC GGAAAAGCGATCCAGTT GCTGCAGAAGGGAT 14 17
    FANCF_4D _3CTOG GGAATCCCTTCTGC AGCACC GGAAAAGCGATCCACGT GCTGCAGAAGGGAT 14 17
    FANCF_4D _3CTOT GGAATCCCTTCTGC AGCACC GGAAAAGCGATCCAAGT GCTGCAGAAGGGAT 14 17
    FANCF_4D _4TTOA GGAATCCCTTCTGC AGCACC GGAAAAGCGATCCTGGT GCTGCAGAAGGGAT 14 17
    FANCF_4D _4TTOG GGAATCCCTTCTGC AGCACC GGAAAAGCGATCCCGGT GCTGCAGAAGGGAT 14 17
    FANCF_4D _5GTOA GGAATCCCTTCTGC AGCACC GGAAAAGCGATCTAGGT GCTGCAGAAGGGAT 14 17
    FANCF_4D _6GTOC GGAATCCCTTCTGC AGCACC GGAAAAGCGATGCAGGT GCTGCAGAAGGGAT 14 17
    FANCF_4D _7ATOC GGAATCCCTTCTGC AGCACC GGAAAAGCGAGCCAGGT GCTGCAGAAGGGAT 14 17
    FANCF_4D _8TTOC GGAATCCCTTCTGC AGCACC GGAAAAGCGGTCCAGGT GCTGCAGAAGGGAT 14 17
    FANCF_4D _10GTOT GGAATCCCTTCTGC AGCACC GGAAAAGAGATCCAGGT GCTGCAGAAGGGAT 14 17
    EMXJ_4E_ 2ATOC GAGTCCGAGCAGA AGAAGAA GTGATGGGAGCCCTGCTT CTTCTGCTCGGA 14 16
    EMX1_4E 2ATOT GAGTCCGAGCAGA AGAAGAA GTGATGGGAGCCCTACTT CTTCTGCTCGGA 14 16
    EMX1_4E_ 3ATOG GAGTCCGAGCAGA AGAAGAA GTGATGGGAGCCCCTCTT CTTCTGCTCGGA 14 16
    EMX1_4E_ 4GTOC GAGTCCGAGCAGA AGAAGAA GTGATGGGAGCCGTTCTT CTTCTGCTCGGA 14 16
    EMX1_4E_ 5GTOA GAGTCCGAGCAGA AGAAGAA GTGATGGGAGCTCTTCTT CTTCTGCTCGGA 14 16
    EMX1_4E_ 5GTOT GAGTCCGAGCAGA AGAAGAA GTGATGGGAGCACTTCTT CTTCTGCTCGGA 14 16
    EMX1_4E_ 7CTOA GAGTCCGAGCAGA AGAAGAA GTGATGGGATCCCTTCTT CTTCTGCTCGGA 14 16
    EMX1_4E_ 8TTOA GAGTCCGAGCAGA AGAAGAA GTGATGGGTGCCCTTCTT CTTCTGCTCGGA 14 16
    EMXI_4E_ 8TTOC GAGTCCGAGCAGA AGAAGAA GTGATGGGGGCCCTTCTT CTTCTGCTCGGA 14 16
    EMX1_4E_ 8TTOG GAGTCCGAGCAGA AGAAGAA GTGATGGGCGCCCTTCTT CTTCTGCTCGGA 14 16
    EMX1_4E_ 9CTOG GAGTCCGAGCAGA AGAAGAA GTGATGGCAGCCCTTCTT CTTCTGCTCGGA 14 16
    EMX1_4E_ 9CTOT GAGTCCGAGCAGA AGAAGAA GTGATGGAAGCCCTTCTT CTTCTGCTCGGA 14 16
    RUNX1_4F _1CTOA GCATTTTCAGGAGG AAGCGA TGTCTGAAGCCATCTCTT CCTCCTGAAAAT 15 15
    RUNX1_4F _1CTOG GCATTTTCAGGAGG AAGCGA TGTCTGAAGCCATCCCTT CCTCCTGAAAAT 15 15
    RUNX1_4F _1CTOT GCATTTTCAGGAGG AAGCGA TGTCTGAAGCCATCACTT CCTCCTGAAAAT 15 15
    RUNX1_4F _2GTOA GCATTTTCAGGAGG AAGCGA TGTCTGAAGCCATTGCTT CCTCCTGAAAAT 15 15
    RUNX1_4F _3ATOC GCATTTTCAGGAGG AAGCGA TGTCTGAAGCCAGCGCTT CCTCCTGAAAAT 15 15
    RUNX1_4F _3ATOG GCATTTTCAGGAGG AAGCGA TGTCTGAAGCCACCGCTT CCTCCTGAAAAT 15 15
    RUNX 1_4F _3ATOT GCATTTTCAGGAGG AAGCGA TGTCTGAAGCCAACGCTT CCTCCTGAAAAT 15 15
    RUNX1_4F _4TTOA GCATTTTCAGGAGG AAGCGA TGTCTGAAGCCTTCGCTT CCTCCTGAAAAT 15 15
    RUNX1_4F _4TTOC GCATTTTCAGGAGG AAGCGA TGTCTGAAGCCGTCGCTT CCTCCTGAAAAT 15 15
    RUNXI_4F _4TTOG GCATTTTCAGGAGG AAGCGA TGTCTGAAGCCCTCGCTT CCTCCTGAAAAT 15 15
    RUNX 1_4F _5GTOT GCATTTTCAGGAGG AAGCGA TGTCTGAAGCAATCGCTT CCTCCTGAAAAT 15 15
    RUNX1_4F _6GTOC GCATTTTCAGGAGG AAGCGA TGTCTGAAGGCATCGCTT CCTCCTGAAAAT 15 15
    VEGFA_4G _1TTOA GATGTCTGCAGGCC AGATGA AATGTGCCATCTGGAGCC CTCTTCTGGCCTGCAGA 13 22
    VEGFA_4G _1TTOC GATGTCTGCAGGCC AGATGA AATGTGCCATCTGGAGCC CTCGTCTGGCCTGCAGA 13 22
    VEGFA_4G _ITTOG GATGTCTGCAGGCC AGATGA AATGTGCCATCTGGAGCC CTCCTCTGGCCTGCAGA 13 22
    VEGFA _4G _2GTOA GATGTCTGCAGGCC AGATGA AATGTGCCATCTGGAGCC CTTATCTGGCCTGCAGA 13 22
    VEGFA_4G _3ATOC GATGTCTGCAGGCC AGATGA AATGTGCCATCTGGAGCC CGCATCTGGCCTGCAGA 13 22
    VEGFA_4G _3ATOG GATGTCTGCAGGCC AGATGA AATGTGCCATCTGGAGCC CGCATCTGGCCTGCAGA 13 22
    VEGFA_4G _3ATOT GATGTCTGCAGGCC AGATGA AATGTGCCATCTGGAGCC CACATCTGGCCTGCAGA 13 22
    VEGFA_4G _5GTOT GATGTCTGCAGGCC AGATGA AATGTGCCATCTGGAGCA CTCATCTGGCCTGCAGA 13 22
    VEGFA 4G _6GTOC GATGTCTGCAGGCC AGATGA AATGTGCCATCTGGAGGC CTCATCTGGCCTGCAGA 13 22
    VEGFA_4G _7CTOA GATGTCTGCAGGCC AGATGA AATGTGCCATCTGGATCC CTCATCTGGCCTGCAGA 13 22
    VEGFA_4G _7CTOT GATGTCTGCAGGCC AGATGA AATGTGCCATCTGGAACC CTCATCTGGCCTGCAGA 13 22
    VEGFA _4G _9CTOG GATGTCTGCAGGCC AGATGA AATGTGCCATCTGCAGCC CTCATCTGGCCTGCAGA 13 22
    DNMT1_4 H_1ATOC GATTCCTGGTGCCA GAAACA GTCACCCCTGGTTCTGGC ACCAGG 13 11
    DNMT1_4 H_1ATOG GATTCCTGGTGCCA GAAACA GTCACCCCTGCTTCTGGC ACCAGG 13 11
    DNMTl_4 H_2CTOA GATTCCTGGTGCCA GAAACA GTCACCCCTTTTTCTGGC ACCAGG 13 11
    DNMT1_4 H_2CTOG GATTCCTGGTGCCA GAAACA GTCACCCCTCTTTCTGGC ACCAGG 13 11
    DNMTl_4 H_2CTOT GATTCCTGGTGCCA GAAACA GTCACCCCTATTTCTGGC ACCAGG 13 11
    DNMT1_4 H_3ATOT GATTCCTGGTGCCA GAAACA GTCACCCCAGTTTCTGGC ACCAGG 13 11
    DNMT1_4 H_4GTOA GATTCCTGGTGCCA GAAACA GTCACCCTTGTTTCTGGC ACCAGG 13 11
    DNMT1. 4 H_5GTOT GATTCCTGGTGCCA GAAACA GTCACCACTGTTTCTGGC ACCAGG 13 11
    DNMT1_4 H_6GTOC GATTCCTGGTGCCA GAAACA GTCACGCCTGTTTCTGGC ACCAGG 13 11
    DNMT1_4 H_8TTOA GATTCCTGGTGCCA GAAACA GCCCTCCCGTCTCCCCTG TTTCTGGCACCAGG 13 19
    DNMT1_4 H_8TTOC GATTCCTGGTGCCA GAAACA GCCCTCCCGTCGCCCCTG TTTCTGGCACCAGG 13 19
    DNMT1_4 H_8TTOG GATTCCTGGTGCCA GAAACA GCCCTCCCGTCCCCCCTG TTTCTGGCACCAGG 13 19
    HEK3_4J_ DEL1-5 GGCCCAGACTGAG CACGTGA TGGAGGAAGCAGGGCTT CCTTTCCTCTGCCGTGCT CAGTCTG 13 29
    HEK3_4J_ DEL1-10 GGCCCAGACTGAG CACGTGA TGGAGGAAGCAGGGCTT CCTTTCCCGTGCTCAGTC TG 13 24
    HEK3_4J_ DEL1-15 GGCCCAGACTGAG CACGTGA TGGAGGAAGCAGGGCTT CCCGTGCTCAGTCTG 13 19
    HEK3_4J_ DEL1-25 GGCCCAGACTGAG CACGTGA TGTCCTGCGACGCCCTCT GGAGGAAGCGTGCTCAG TCTG 13 26
    HEK3_4.)_ DEL1-30 GGCCCAGACTGAG CACGTGA TGTCCTGCGACGCCCTCT GGACGTGCTCAGTCTG 13 21
    HEK3 _4J_ DEL1-80 GGCCCAGACTGAG CACGTGA AGTATCCCGGTGCAGGA GCTCGTGCTCAGTCTG 13 20
    HEK3_4l_1 AINS GGCCCAGACTGAG CACGTGA TCTGCCATCATCGTGCTC AGTCTG 13 11
    HEK3_4I_1 CTTINS GGCCCAGACTGAG CACGTGA TCTGCCATCAAAGCGTGC TCAGTCTG 13 13
    HEK3 _4I_1 TDEL GGCCCAGACTGAG CACGTGA TCTGCCATCCGTCJCTCAG TCTG 13 9
    HEK3_41_1 -3TGADEL GGCCCAGACTGAG CACGTGA TGGAGGAAGCAGGGCTT CCTTTCCTCTGCCACGTG CTCAGTCTG 13 31
    RNF2_4I_1 TINS GTCATCTTAGTCATT ACCTG AACGAACACCTCAGAGT AATGACTAAGATG 15 15
    RNF2_4I_1 GTAINS GTCATCTTAGTCATT ACCTG AACGAACACCTCAGTAC GTAATGACTAAGATG 15 17
    RNF2_4I_4 ADEL GTCATCTTAGTCATT ACCTG AACGAACACCCAGGTAA TGACTAAGATG 15 13
    RNF2_4I_3 -5GAGDEL GTCATCTTAGTCATT ACCTG AACGAACACAGGTAATG ACTAAGATG 15 11
    FANCF_4I_ 3CINS GGAATCCCTTCTGC AGCACC GGAAAAGCGATCCAGGG TGCTGCAGAAGGGAT 14 18
    FANCF_4I_ 4GATINS GGAATCCCTTCTGC AGCACC GGAAAAGCGATCCAATC GGTGCTGCAGAAGGGAT 14 20
    FANCF_4I_ 6GDEL GGAATCCCTTCTGC AGCACC GGAAAAGCGATCAGGTG CTGCAGAAGGGAT 14 16
    FANCF_4I 5-7GGADEL GGAATCCCTTCTGC AGCACC GGAAAAGCGAAGGTGCT GCAGAAGGGAT 14 14
    EMX1_41_6 TINS GAGTCCGAGCAGA AGAAGAA GTGATGGGAGCACCTTCT TCTTCTGCTCGGA 14 17
    EMX1_41_1 TGCINS GAGTCCGAGCAGA AGAAGAA GTGATGGCiAGCCCTTCGC ATTCTTCTGCTCGGA 14 19
    EMX1_4I_5 GDEL GAGTCCGAGCAGA AGAAGAA GTGATGGGAGCCTTCTTC TTCTGCTCGGA 14 15
    EMX1_4I_4 -6GGGDEL GAGTCCGAGCAGA AGAAGAA GTGATGGGAGTTCTTCTT CTGCTCGGA 14 13
    RUNX1_4I _1CINS GCATTTTCAGGAGG AAGCGA TGTCTGAAGCCATCGGCT TCCTCCTGAAAAT 15 16
    RUNX1_ 4I _1ATGINS GCATTTTCAGGAGG AAGCGA TGTCTGAAGCCATCCATG CTTCCTCCTGAAAAT 15 18
    RUNX1_4I _2GDEL GCATTTTCAGGAGG AAGCGA TGTCTGAAGCCATGCTTC CTCCTGAAAAT 15 14
    RUNX1_4I _2-4GATDEL GCATTTTCAGGAGG AAGCGA TGTCTGAAGCCGCTTCCT CCTGAAAAT 15 12
    VEGFA _4I _4CINS GATGTCTGCAGGCC AGATGA AATGTGCCATCTGGAGCC GCTCATCTGGCCTGCAGA 13 23
    VEGFA_4I _2ACAINS GATGTCTGCAGGCC AGATGA AATGTGCCATCTGGAGCC CTTGTCATCTGGCCTGCA GA 13 25
    VEGFA_4I _3ADEL GATGTCTGCAGGCC AGATGA AATGTGCCATCTGGAGCC CCATCTGGCCTGCAGA 13 21
    VEGFA_4I _2-4GAGDEL GATGTCTGCAGGCC AGATGA AATGTGCCATCTGGAGCC ATCTGGCCTGCAGA 13 19
    DNMT1_4I _4CINS GATTCCTGGTGCCA GAAACA TCCCGTCACCCGCTGTTT CTGGCACCAGG 13 16
    DNMTI_4I _1TCAINS GATTCCTGGTGCCA GAAACA TCCCGTCACCCCTGTGAT TTCTGGCACCAGG 13 18
    DNMT1_4I _3ADEL GATTCCTGGTGCCA GAAACA TCCCGTCACCCCGTTTCT GGCACCAGG 13 14
    DNMT1_4I _3-5AGGDEL GATTCCTGGTGCCA GAAACA TCCCGTCACCGTTTCTGG CACCAGG 13 12
    HEK3_4K_ 1CTTINS_5 GDEL GGCCCAGACTGAG CACGTGA TGGAGGAAGCAGGGCTT CCTTTCCTCTGCATCAAA GCGTGCTCAGTCTG 13 36
    HEK3_4K_ 1CTTINS_2 GTOC GGCCCAGACTGAG CACGTGA TGGAGGAAGCAGGGCTT CCTTTCCTCTGCCATGAA AGCGTGCTCAGTCTG 13 37
    HEK3_4K_ 3TDEL_5G TOC GGCCCAGACTGAG CACGTGA TGGAGGAAGCAGGGCTT CCTTTCCTCTGCGATCCG TGCTCAGTCTG 13 33
    HEK3_4K_ 3GTOC_6G TOT GGCCCAGACTGAG CACGTGA TGGAGGAAGCAGGGCTT CCTTTCCTCTGACATGAC GTGCTCAGTCTG 13 34
    RNF2_4K_ 2AAINS_3-4GADEL GTCATCTTAGTCATT ACCTG AACGAACACCATTGGTA ATGACTAAGATG 15 14
    RNF2_4K_ 1AINS-5G TOC GTCATCTTAGTCATT ACCTG AACGAACACGTCAGTGT AATGACTAAGATG 15 15
    RNF2_4K_ 1-2CTDEL_6 GTOT GTCATCTTAGTCATT ACCTG AACGAACAACTCGTAAT GACTAAGATG 15 12
    RNF2_4K_ 1CTOA 5Cr TOT GTCATCTTAGTCATT ACCTG AACGAACACATCATGTAA TGACTAAGATG 15 14
    FANCF_4K _1TINS_3-4TGDEL GGAATCCCTTCTGC AGCACC GGAAAAGCGATCGGTAG CTGCAGAAGGGAT 14 16
    FANCF_4K _1TINS_6G TOA GGAATCCCTTCTGC AGCACC GGAAAAGCGATTCAGGT AGCTGCAGAAGGGAT 14 18
    FANCF_4K _2CDEL_5 GTOT GGAATCCCTTCTGC AGCACC GGAAAAGCGATCAAGTG CTGCAGAAGGGAT 14 16
    Tabelle 3E: Nicking-sgRNA von FIG. 41A-41K
    NICKING-SGRNA SPACER-SEQUENZ (SEQ ID NOS: 3456-3463)
    HEK3_4A_+90 GTCAACCAGTATCCCGGTGC
    HEK3_4B_+90 GTCAACCAGTATCCCGGTGC
    RNF2_4C_+41 GTCAACCATTAAGCAAAACAT
    FANCF_4D_+48 GGGGTCCCAGGTGCTGACGT
    EMX1_4E­_+53 GACATCGATGTCCTCCCCAT
    RUNX1_4F_+38 GATGAAGCACTGTGGGTACGA
    VEGFA_4G_+57 GATGTACAGAGAGCCCAGGGC
    DNN1T1_4H_+49 GCCCTTCAGCTAAAATAAAGG
    Tabelle 3F: PEgRNA von FIG. 42A-42H
    PEGRNA SPACER-SEQUENZ SEQ ID NOS: 3464-3478) 3' EXTENSION (SEQ ID NOS: 3479-3493) PBS-LÄN GE (NT) RT-TEMPL ATE-LÄNGE (NT)
    HEK3_5A_ C3 GGCCCAGACTGA GCACGTGA TCTGTCATCACGTGCTCAGT CTG 13 10
    HEK3_5A_ C4 GGCCCAGACTGA GCACGTGA TCTGCTATCACGTGCTCAGT CTG 13 10
    HEK3_5A_ C7 GGCCCAGACTGA GCACGTGA TCTGCCATTACGTGCTCAGT CTG 13 10
    FANCF_5A _C3 GGAATCCCTTCTG CAGCACC GGAAAAGTGATCCAGGTGC TGCAGAAGGGAT 14 17
    FANCF_5A _C7 GGAATCCCTTCTG CAGCACC GGAAAAGCGATTCAGGTGC TGCAGAAGGGAT 14 17
    FANCF_5A _C8 GGAATCCCTTCTG CAGCACC GGAAAAGCGATCTAGGTGC TGCAGAAGGGAT 14 17
    EMX1_5A_ C5 GAGTCCGAGCAG AAGAAGAA GTGATGGGAGTCCTTCTTCT TCTGCTCGGA 14 16
    EMX1_5A_ C6 GAGTCCGAGCAG AAGAAGAA GTGATGGGAGCTCTTCTTCT TCTGCTCGGA 14 16
    EMX1_5A_ C7 GAGTCCGAGCAG AAGAAGAA GTGATGGGAGCCTTTCTTCT TCTGCTCGGA 14 16
    EMX1_5C_ C5_6 GAGTCCGAGCAG AAGAAGAA GTGATGGGAGTTCTTCTTCT TCTGCTCGGA 14 16
    EMX1_5C_ C5_7 GAGTCCGAGCAG AAGAAGAA GTGATGGGAGTCTTTCTTCT TCTGCTCGGA 14 16
    EMX1_5C_ C6_7 GAGTCCGAGCAG AAGAAGAA GTGATGGGAGCTTTTCTTCT TCTGCTCGGA 14 16
    EMX1_5C_ C5_6_7 GAGTCCGAGCAG AAGAAGAA GTGATGGGAGTTTTTCTTCT TCTGCTCGGA 14 16
    HEK3_5D_ A5 GGCCCAGACTGA GCACGTGA TCTGCCGTCACGTGCTCAGT CTG 13 10
    HEK3_5D_ A8 GGCCCAGACTGA GCACGTGA TCTGCCATCGCGTGCTCAGT CTG 13 10
    Tabelle 3G: Nicking-sgRNA von FIG. 42A-42H
    NICKING- SGRNA MÖGLICHE SPACER-SEQUENZ (SEQ ID NOS: 616-618) MÖGLICHE SPACER-SEQUENZ (SEQ ID NOS: 619-621
    HEK3_5A-F_+90 GTCAACCAGTATCCCGGTGC GTCAACCAGTATCCCGGTGC
    FANCF_5A-F_+48 GGGGTCCCAGGTGCTGACGT GATGTACAGAGAGCCCAGGGC
    EMX1_5A-F_+57 GATGTACAGAGAGCCCAGGGC GGGGTCCCAGGTGCTGACGT
    Tabelle 3H: Basen-Editing-sgRNA FIG. 42A-42H
    BASEN-EDITING-SGRNA SPACER-SEQUENZ
    HEK3_5A-F_BE GTGCCATC ACGTGCTCAGTCT (SEQ ID NO: 455)
    FANCF_5A-F_BE GAGCGATCCAGGTGCTGCAGA (SEQ ID NO: 456)
    EMX1_5A-F_BE GGAGCCCTTCTTCTTCTGCT (SEQ ID NO: 455)
    Tabelle 3I: On-Target-sgRNA von FIG. 42A-42H
    ON-TARGET-SGRNA SPACER-SEQUENZ
    HEK3_5G GGCCCAGACTGAGCACGTGA (SEQ ID NO: 510)
    HEK4_5G GGCACTGCGGCTGGAGGTGG (SEQ ID NO: 511)
    EMX1_5G GAGTCCGAGCAGAAGAAGAA (SEQ ID NO: 512)
    FANCF_5G GGAATCCCTTCTGCAGCACC (SEQ ID NO: 513)
    Tabelle 3J: FIG. 42A-42H On-Target-PEgRNA
    ON-TARGET-PEGRNA SPACER-SEQUENZ (SEQ ID NO: 663-677) 3' EXTENSION (SEQ ID NO: 678-692) PBS-LÄN GE (NT) RT-TEMP LATE-LÄNG E (NT)
    HEK3_5G-H_PEGRNA_1 GGCCCAGACTGAGC ACGTGA TCTGCCATCTCGTGCTCA GTCTG 13 10
    HEK3_5G-H_PEGRNA_2 GGCCCAGACTGAGC ACGTGA TCTGCCATCAAAGCGTG CTCAGTCTG 13 13
    HEK3_5G-H_PEGRNA_3 GGCCCAGACTGAGC ACGTGA TCTGCCATCCGTGCTCA GTCTG 13 9
    HEK3_5G-H_PEGRNA_4 GGCCCAGACTGAGC ACGTGA TCTGCGATCACGTGCTC AGTCTG 13 10
    HEK4_5G-H PEGRNA 1 GGCACTGCGGCTGG AGGTGG TTAACGCCCACCTCCAG CC 9 10
    HEK4_5G-H_PEGRNA_2 GGCACTGCGGCTGG AGGTGG TTAACCCCCCCCTCCAG CC 9 10
    HEK4_5G-H_PEGRNA_3 GGCACTGCGGCTGG AGGTGG TTAACCCCTTACACCTCC AGCC 9 13
    HEK4_5G-H_PEGRNA_4 GGCACTGCGGCTGG AGGTGG TTAACCCCCCCTCCAGC C 9 9
    EMX1_5G-H PEGRNA 1 GAGTCCGAGCAGAA GAAGAA GTGATGGGAGCACTTCT TCTTCTGCTCGGA 14 16
    EMX1_5G-H_PEGRNA_2 GAGTCCGAGCAGAA GAAGAA GTGATGGGAGCCCTGCT TCTTCTGCTCGGA 14 16
    EMX1_5G-H_PEGRNA_3 GAGTCCGAGCAGAA GAAGAA GTGATGGGAGCCCTTCG CATTCTTCTGCTCGGA 14 19
    EMX1_5G-H_PEGRNA_4 GAGTCCGAGCAGAA GAAGAA GTGATGGGAGTTCTTCTT CTGCTCGGA 14 13
    FANCF_5G-H PEGRNA 1 GGAATCCCTTCTGCA GCACC GGAAAAGCGATGCAGGT GCTGCAGAAGGGAT 14 17
    FANCF_5G-H_PEGRNA_2 GGAATCCCTTCTGCA GCACC GGAAAAGCGATCCAGGC GCTGCAGAAGGGAT 14 17
    FANCF_5G-H_PEGRNA_3 GGAATCCCTTCTGCA GCACC GGAAAAGCGATCCAATC GGTGCTGCAGAAGGGAT 14 20
    Tabelle 3K: PEgRNA von FIG. 49A-49B
    PEGRNA SPACER-SEQUENZ (SEQ ID NO: 3494-3521) 3' EXTENSION (SEQ ID NO: 3522-3540) PBS-LÄNGE (NT) RT-TEMPL ATE-LÄNGE (NT)
    HEK3_6A_2G TOC GGCCCAGACTG AGCACGTGA TCTGCCATGACGTGCTC AGTCTG 13 10
    HEK3_6A_2G TOC GGCCCAGACTG AGCACGTGA
    EMX1_6A_3G TOC GAGTCCGAGCA GAAGAAGAA ATGGGAGCCCTTGTTCT TCTGCTCGG 13 13
    EMX1_6A_3G TOC GAGTCCGAGCA GAAGAAGAA
    FANCF_6A_5 GTOT GGAATCCCTTCT GCAGCACC AAAAGCGATCAAGGTGC TGCAGAAGGGA 13 15
    FANCF_6A_5 GTOT GGAATCCCTTCT GCAGCACC
    HEK3_6A_1H IS6INS GGCCCAGACTG AGCACGTGA TGGAGGAAGCAGGGCTT CCTTTCCTCTGCCATCAA TGATGGTGATGATGGTG CGTGCTCAGTCTG 13 52
    HEK3_6A_1H IS6INS GGCCCAGACTG AGCACGTGA
    HEK3_6A_5G TOT GGCCCAGACTG AGCACGTGA TCTGCAATCACGTGCTC AGTCTG 13 10
    HEK3_6A_5G TOT GGCCCAGACTG AGCACGTGA
    HEK3_6A_1C TTINS GGCCCAGACTG AGCACGTGA TCTGCCATCAAAGCGTG CTCAGTCTG 13 10
    HEK3_6A_1C TTINS GGCCCAGACTG AGCACGTGA
    HBB_6B_INS ALL GCATGGTGCAC CTGACTCCTG AGACTTCTCCACAGGAG TCAGGTGCAC 13 14
    HBB_6B_INS ALL GCATGGTGCAC CTGACTCCTG
    HBB_6B_COR RECT GCATGGTGCAC CTGACTCCTG AGACTTCTCCTCAGGAG TCAGGTGCAC 13 14
    HBB_6B_COR RECT GCATGGTGCAC CTGACTCCTG
    HBB_6B_COR RECT_W_SIL ENT GCATGGTGCAC CTGACTCCTG AGACTTCTCTTCAGGAG TCAGGTGCAC 13 14
    HBB_6B_COR RECT_W_SIL ENT GCATGGTGCAC CTGACTCCTG
    HEXA_6B_IN STALL GTACCTGAACC GTATATCCTA AGTCAGGGCCATAGGAT AGATATACGGTTC 12 14
    HEXA_6B_CO RRECT GATCCTTCCAGT CAGGGCCAT ACCTGAACCGTATATCCT ATGGCCCTGACTG 10 21
    HEXA_6B_CO RRECT_W_SI LENT GATCCTTCCAGT CAGGGCCAT GTACCTGAACCGTATATC TTATGGCCCTGACT 9 27
    PRNP_6C CCAGTOGTGGG GGGCCTTGG ATGTAGACGCCAAGGCC CCCCACC 12 12
    HEK3_6E-G_1TTOG GGCCCAGACTG AGCACGTGA TCTGCCATCCCGTGCTC AGTCTG 13 10
    HEK3_6E-G_1CTTINS GGCCCAGACTG AGCACGTGA TCTGCCATCAAAGCGTG CTCAGTCTG 13 10
    RNF2_6E-G_ICTOG GTCATCTTAGTC ATTACCTG AACGAACACCTCACGTA ATGACTAAGATG 15 14
    HBB_6E-G_4ATOT GCATGGTGCAC CTGACTCCTG AGACTTCTCCACAGGAG TCAGGTGCAC 13 14
    HEK3_6H_1H IS6INS GGCCCAGACTG AGCACGTGA TGGAGGAAGCAGGGCTT CCTTTCCTCTGCCATCAA TGATGGTGATGATGGTG CGTGCTCAGTCTG 13 52
    HEK3_6H_1F LAGINS GGCCCAGACTG AGCACGTGA TGGAGGAAGCAGGGCTT CCTTTCCTCTGCCATCAC TTATCGTCGTCATCCTTG TAATCCGTGCTCAGTCT G 13 58
    Tabelle 3L: PEgRNA von FIG. 47A-74D
    PEGRNA SPACER-SEQUENZ (SEQ ID NO: 3541-3547) 3' EXTENSION-SEQUENZ (SEQ ID NO: 3549-3556) PBS-LÄN GE (NT) RT-TEMPL ATE-LÄNGE (NT)
    HEK3_ED4B_1 TDEL GGCCCAGACTGAGC ACGTGA TCTGCCATCCGTGCTCAG TCTG 13 9
    HEK3_ED4B_1 AINS GGCCCAGACTGAGC ACGTGA TCTGCCATCATCGTGCTC AGTCTG 13 11
    HEK3_ED4B_1 CTTINS GGCCCAGACTGAGC ACGTGA TCTGCCATCAAAGCGTGC TCAGTCTG 13 13
    HEK3_ED4C_2 GTOC GCCCCAGACTGAGC ACGTGA TCTGCCATGACGTGCTCA GTCTG 13 10
    HEK3_FD4D_1 FLAGINS GGCCCAGACTGAGC ACGTGA TGGAGGAAGCAGGGCTT CCTTTCCTCTGCCATCAC TTATCGTCGTCATCCTTGT AATCCGTGCTCAGTCTG 13 58
    RNF2_ED4E_1 CTOA GTCATCTTAGTCATT ACCTG AACGAACACCTCATGTAA TGACTAAGATG 15 14
    EMX1_ED4F_1 GTOC GAGTCCGAGCAGAA GAAGAA ATGGGAGCCCTTGTTCTT CTGCTCGG 13 13
    HBB_ED4G_2T TOA GTAACGGCAGACTT CTCCTC ATCTGACTCCTGTGGAGA AGTCTGCC 12 14
    Tabelle 3M: PEgRNA von FIG. 48A-48C
    PEGRNA SPACER-SEQUENZ (SEQ ID NO: 3557-3627) 3' EXTENSION-SEQUENZ (SEQ ID NO: 3628-3698) PBS-LÄNGE (NT) RT-TEMPL ATE-LÄNGE (NT)
    VEGFA_ED 5A_31 GATGTCTGCAGGC CAGATGA CCCTCTGACAATGTGCCATC TGGAGCACTCATCTGGCCTG CAGA 13 31
    VEGFA_ED 5A_30 GATGTCTGCAGGC CAGATGA CCTCTGACAATGTGCCATCT GGAGCACTCATCTGGCCTGC AGA 13 30
    VEGFA_ED 5A_29 GATGTCTGCAGGC CAGATGA CTCTGACAATGTGCCATCTG GAGCACTCATCTGGCCTGCA GA 13 29
    VEGFA_ED 5A_28 GATGTCTGCAGGC CAGATGA TCTGACAATGTGCCATCTGG AGCACTCATCTGGCCTGCAG A 13 28
    VEGFA_ED 5A_27 GATGTCTGCAGGC CAGATGA CTGACAATGTGCCATCTGGA GCACTCATCTGGCCTGCAGA 13 27
    VEGFA_ED 5A_26 GATGTCTGCAGGC CAGATGA TGACAATGTGCCATCTGGAG CACTCATCTGGCCTGCAGA 13 26
    VEGFA_ED 5A_25 GATGTCTGCAGGC CAGATGA GACAATGTGCCATCTGGAGC ACTCATCTGGCCTGCAGA 13 25
    VEGFA_ED 5A_24 GATGTCTGCAGGC CAGATGA ACAATGTGCCATCTGGAGCA CTCATCTGGCCTGCAGA 13 24
    VEGFA_ED 5A_23 GATGTCTGCAGGC CAGATGA CAATGTGCCATCTGGAGCAC TCATCTGGCCTGCAGA 13 23
    VEGFA_ED 5A_22 GATGTCTGCAGGC CAGATGA AATGTGCCATCTGGAGCACT CATCTGGCCTGCAGA 13 22
    VEGFA_ED 5A_21 GATGTCTGCAGGC CAGATGA ATGTGCCATCTGGAGCACTC ATCTGGCCTGCAGA 13 21
    VEGFA_ED 5A_20 GATGTCTGCAGGC CAGATGA TGTGCCATCTGGAGCACTCA TCTGGCCTGCAGA 13 20
    VEGFA_ED 5A_19 GATGTCTGCAGGC CAGATGA GTGCCATCTGGAGCACTCAT CTGGCCTGCAGA 13 19
    VEGFA_ED 5A_18 GATGTCTGCAGGC CAGATGA TGCCATCTGGAGCACTCATC TGGCCTGCAGA 13 18
    VEGFA_ED 5A_17 GATGTCTGCAGGC CAGATGA GCCATCTGGAGCACTCATCT GGCCTGCAGA 13 17
    VEGFA_ED 5A_16 GATGTCTGCAGGC CAGATGA CCATCTGGAGCACTCATCTG GCCTGCAGA 13 16
    VEGFA_ED 5A_15 GATGTCTGCAGGC CAGATGA CATCTGGAGCACTCATCTGG CCTGCAGA 13 15
    VEGFA_ED 5A_14 GATGTCTGCAGGC CAGATGA ATCTGGAGCACTCATCTGC CTGCAGA 13 14
    VEGFA ED 5A_13 GATGTCTGCAGGC CAGATGA TCTGGAGCACTCATCTGGCC TGCAGA 13 13
    VEGFA ED 5A_12 GATGTCTGCAGGC CAGATGA CTGGAGCACTCATCTGGCCT GCAGA 13 12
    VEGFA ED 5A_11 GATGTCTGCAGGC CAGATGA TGGAGCACTCATCTGGCCTG CAGA 13 11
    VEGFA ED 5A_10 GATGTCTGCAGGC CAGATGA GGAGCACTCATCTGGCCTGC AGA 13 10
    VEGFA ED 5A_9 GATGTCTGCAGGC CAGATGA GAGCACTCATCTGGCCTGCA GA 13 9
    VEGFA ED 5A_8 GATGTCTGCAGGC CAGATGA AGCACTCATCTGGCCTGCAG A 13 8
    DNNITI_ED 5B_31 GATTCCTGGTGCC AGAAACA AGGACTAGTTCTGCCCTCCC GTCACCACTGTTTCTGGCAC CAGG 13 31
    DNMTI_ED 5B_30 GATTCCTGGTGCC AGAAACA GGACTAGTTCTGCCCTCCCG TCACCACTGTTTCTGGCACC AGG 13 30
    DNMT1_ED 5B_29 GATTCCTGGTGCC AGAAACA GACTAGTTCTGCCCTCCCGT CACCACTGTTTCTGGCACCA GG 13 29
    DNMTI_ED 5B_28 GATTCCTGGTGCC AGAAACA ACTAGTTCTGCCCTCCCGTC ACCACTGTTTCTGGCACCAG G 13 28
    DNMT1_ED 5B_27 GATTCCTGGTGCC AGAAACA CTAGTTCTGCCCTCCCGTCA CCACTGTTTCTGGCACCAGG 13 27
    DNMTI_ED 5B_26 GATTCCTGGTGCC AGAAACA TAGTTCTGCCCTCCCGTCAC CACTGTTTCTGGCACCAGG 13 26
    DNMT1_ED 5B_25 GATTCCTGGTGCC AGAAACA AGTTCTGCCCTCCCGTCACC ACTGTTTCTGGCACCAGG 13 25
    DNMT1_ED 5B_24 GATTCCTGGTGCC AGAAACA GTTCTGCCCTCCCGTCACCA CTGTTTCTGGCACCAGG 13 24
    DNMTI_ED 5B_23 GATTCCTGGTGCC AGAAACA TTCTGCCCTCCCGTCACCAC TGTTTCTGGCACCAGG 13 23
    DNMTI_ED 5B_22 GATTCCTGGTGCC AGAAACA TCTGCCCTCCCGTCACCACT GTTTCTGGCACCAGG 13 22
    DNMT1_ED 5B_21 GATTCCTGGTGCC AGAAACA CTGCCCTCCCGTCACCACTG TTTCTGGCACCAGG 13 21
    DNMT1_ED 5B_20 GATTCCTGGTGCC AGAAACA TGCCCTCCCGTCACCACTGT TTCTGGCACCAGG 13 20
    DNMTI_ED 5B_L9 GATTCCTGGTGCC AGAAACA GCCCTCCCGTCACCACTGTT TCTGGCACCAGG 13 19
    DNMT1_ED 5B_18 GATTCCTGGTGCC AGAAACA CCCTCCCGTCACCACTGTTT CTGGCACCAGG 13 18
    DNMT1_ED 5B_17 GATTCCTGGTGCC AGAAACA CCTCCCGTCACCACTGTTTC TGGCACCAGG 13 17
    DNMT1_ED 5B_16 GATTCCTGGTGCC AGAAACA CTCCCGTCACCACTGTTTCT GGCACCAGG 13 16
    DNMT1_ED 5B_15 GATTCCTGGTGCC AGAAACA TCCCGTCACCACTGTTTCTG GCACCAGG 13 15
    DNMT1_ED 5B_14 GATTCCTGGTGCC AGAAACA CCCGTCACCACTGTTTCTGG CACCAGG 13 14
    DNMT1_ED 5B_13 GATTCCTGGTGCC AGAAACA CCGTCACCACTGTTTCTGGC ACCAGG 13 13
    DNMT1_ED 5B_12 GATTCCTGGTGCC AGAAACA CGTCACCACTGTTTCTGGCA CCAGG 13 12
    DNMT1_ED 5B_11 GATTCCTGGTGCC AGAAACA GTCACCACTGTTTCTGGCAC CAGG 13 11
    DNMT1_ED 5B_10 GATTCCTGGTGCC AGAAACA TCACCACTGTTTCTGGCACC AGG 13 10
    DNMT1_ED 5B_9 GATTCCTGGTGCC AGAAACA CACCACTGTTTCTGGCACCA GG 13 9
    DNMT1_ED 5B_8 GATTCCTGGTGCC AGAAACA ACCACTGTTTCTGGCACCAG G 13 8
    RUNX1_ED 5C_31 GCATTTTCAGGAG GAAGCGA AATGACTCAAATATGCTGTC TGAAGCAATCGCTTCCTCCT GAAAAT 15 31
    RUNX1_ED 5C_30 GCATTTTCAGGAG GAAGCGA ATGACTCAAATATGCTGTCT GAAGCAATCGCTTCCTCCTG AAAAT 15 30
    RUNX1_ED 5C_29 GCATTTTCAGGAG GAAGCGA TGACTCAAATATGCTGTCTG AAGCAATCGCTTCCTCCTGA AAAT 15 29
    RUNX1_ED 5C_28 GCATTTTCAGGAG GAAGCGA GACTCAAATATGCTGTCTGA AGCAATCGCTTCCTCCTGAA AAT 15 28
    RUNX1_ED 5C_27 GCATTTTCAGGAG GAAGCGA ACTCAAATATGCTGTCTGAA GCAATCGCTTCCTCCTGAAA AT 15 27
    RUNX1_ED 5C_26 GCATTTTCAGGAG GAAGCGA CTCAAATATGCTGTCTGAAG CAATCGCTTCCTCCTGAAAA T 15 26
    RUNX1_ED 5C_25 GCATTTTCAGGAG GAAGCGA TCAAATATGCTGTCTGAAGC AATCGCTTCCTCCTGAAAAT 15 25
    RUNX 1 ED 5C_24 GCATTTTCAGGAG GAAGCGA CAAATATGCTGTCTGAAGCA ATCGCTTCCTCCTGAAAAT 15 24
    RUNX1_ED 5C_23 GCATTTTCAGGAG GAAGCGA AAATATGCTGTCTGAAGCAA TCGCTTCCTCCTGAAAAT 15 23
    RUNX1_ED 5C_22 GCATTTTCAGGAG GAAGCGA AATATGCTGTCTGAAGCAAT CGCTTCCTCCTGAAAAT 15 22
    RUNX1_ED 5C_21 GCATTTTCAGGAG GAAGCGA ATATGCTGTCTGAAGCAATC GCTTCCTCCTGAAAAT 15 21
    RUNX1_ED 5C_20 GCATTTTCAGGAG GAAGCGA TATGCTGTCTGAAGCAATCG CTTCCTCCTGAAAAT 15 20
    RUNX1_ED 5C_19 GCATTTTCAGGAG GAAGCGA ATGCTGTCTGAAGCAATCGC TTCCTCCTGAAAAT 15 19
    RUNX1_ED 5C_18 GCATTTTCAGGAG GAAGCGA TGCTGTCTGAAGCAATCGCT TCCTCCTGAAAAT 15 18
    RUNX1_ED 5C_17 GCATTTTCAGGAG GAAGCGA GCTGTCTGAAGCAATCGCTT CCTCCTGAAAAT 15 17
    RUNX1_ED 5C_16 GCATTTTCAGGAG GAAGCGA CTGTCTGAAGCAATCGCTTC CTCCTGAAAAT 15 16
    RUNX1_ED 5C_15 GCATTTTCAGGAG GAAGCGA TGTCTGAAGCAATCGCTTCC TCCTGAAAAT 15 15
    RUNX1_ED 5C_14 GCATTTTCAGGAG GAAGCGA GTCTGAAGCAATCGCTTCCT CCTGAAAAT 15 14
    RUNX1_ED 5C_13 GCATTTTCAGGAG GAAGCGA TCTGAAGCAATCGCTTCCTC CTGAAAAT 15 13
    RUNX1_ED 5C_12 GCATTTTCAGGAG GAAGCGA CTGAAGCAATCGCTTCCTCC TGAAAAT 15 12
    RUNX1_ED 5C_11 GCATTTTCAGGAG GAAGCGA TGAAGCAATCGCTTCCTCCT GAAAAT 15 11
    RUNX1_ED 5C_10 GCATTTTCAGGAG GAAGCGA GAAGCAATCGCTTCCTCCTG AAAAT 15 10
    RUNX1_ED 5C_9 GCATTTTCAGGAG GAAGCGA AAGCAATCGCTTCCTCCTGA AAAT 15 9
    Tabelle 3N: PEgRNA von FIG. 48A-48C
    PEGRNA SPACER-SEQUENZ 3'-EXTENSION-SEQUENZ PBS-LÄN GE (NT) RT-TEMPL ATE-LÄNGE (NT)
    HEK3_ED6_5 GTOA GGCCCAGACTGAGC ACGTGA (SEQ ID NO: 393) TCTGCTATCACGTGCT CAGTCTG (SEQ ID NO: 394) 13 10
    Tabelle 3O: Nicking-sgRNA von FIG. 48A-48C
    NICKING-SGRNA SPACER-SEQUENZ
    HEK3_ED6_+63 GCACATACTAGCCCCTGTCT (SEQ ID NO: 395)
    Tabelle 3P: PEgRNA von FIG. 50A-50B
    PEG RNA SPACER (SEQ ID NO: 3699-3754) 3' EXTENSION (5'ZU 3')(SEQ ID NO: 3755-3810) PBS-LÄN GE (NT) RT-TEMPL ATE-LÄNGE (NT)
    HBB 3.5 GTAACGGCAGAC TTCTCCAC AGACTTCTCCTCAGGAGTCAGGT GCAC 12 14
    HBB 3.7 GCATGGTGCACCT GACTCCTG AGACTTCTCTTCAGGAGTCAGGT GCAC 13 14
    HBB 5.2 GCATGGTGCACCT GACTCCTG TAACGGCAGACTTCTCCTCAGGA GTCAGGTGCAC 13 19
    HBB 5.3 GCATGGTGCACCT GACTCCTG ACGGCAGACTTCTCCTCAGGAGT CAGGTGCAC 13 17
    HBB 5.4 GCATGGTGCACCT GACTCCTG GGCAGACTTCTCCTCAGGAGTCA GGTGCAC 13 16
    HBB 5.5 GCATGGTGCACCT GACTCCTG GCAGACTTCTCCTCAGGAGTCAG GTGCAC 13 13
    HBB 5.6 GCATGGTGCACCT GACTCCTG GACTTCTCCTCAGGAGTCAGGTG CAC 13 12
    HBB 5.7 GCATGGTGCACCT GACTCCTG ACTTCTCCTCAGGAGTCAGGTGC AC 13 21
    HBB 5.8 GCATGGTGCACCT GACTCCTG TAACGGCAGACTTCTCCTCAGGA GTCAGGTGCA 12 19
    HBB 5.9 GCATGGTGCACCT GACTCCTG ACGGCAGACTTCTCCTCAGGAGT CAGGTGCA 12 17
    HBB 5.10 GCATGGTGCACCT GACTCCTG GGCAGACTTCTCCTCAGGAGTCA GGTGCA 12 16
    HBB 5.11 GCATGGTGCACCT GACTCCTG GCAGACTTCTCCTCAGGAGTCAG GTGCA 12 13
    HBB 5.12 GCATGGTGCACCT GACTCCTG GACTTCTCCTCAGGAGTCAGGTG CA 12 12
    HBB 5.13 GCATGGTGCACCT GACTCCTG ACTTCTCCTCAGGAGTCAGGTGC A 12 14
    HEX AS 1 ATCCTTCCAGTCA GGGCCAT ATATCTTATGGCCCTGACTGGAA 13 14
    HEX AS 2 ATCCTTCCAGTCA GGGCCAT TATATCTTATGGCCCTGACTGGAA 13 15
    HEX AS 3 ATCCTTCCAGTCA GGGCCAT GTATATCTTATGGCCCTGACTGGA A 13 16
    HEX AS 4 ATCCTTCCAGTCA GGGCCAT ACCGTATATCTTATGGCCCTGACT GGAA 13 19
    HEX AS 5 ATCCTTCCAGTCA GGGCCAT AACCGTATATCTTATGGCCCTGAC TGGAA 13 20
    HEX AS6 ATCCTTCCAGTCA GGGCCAT GAACCGTATATCTTATGGCCCTGA CTGGAA 13 21
    HEX AS 7 ATCCTTCCAGTCA GGGCCAT TGAACCGTATATCTTATGGCCCTG ACTGGAA 13 22
    HEX AS 8 ATCCTTCCAGTCA GGGCCAT ATATCTTATGGCCCTGACT 9 14
    HEX AS 9 ATCCTTCCAGTCA GGGCCAT TATATCTTATGGCCCTGACT 9 15
    HEX AS 10 ATCCTTCCAGTCA GGGCCAT GTATATCTTATGGCCCTGACT 9 16
    HEX AS 11 ATCCTTCCAGTCA GGGCCAT ACCGTATATCTTATGGCCCTGACT 9 19
    HEX AS 12 ATCCTTCCAGTCA GGGCCAT AACCGTATATCTTATGGCCCTGAC T 9 20
    HEX AS 13 ATCCTTCCAGTCA GGGCCAT GAACCGTATATCTTATGGCCCTGA CT 9 21
    HEX AS 14 ATCCTTCCAGTCA GGGCCAT TGAACCGTATATCTTATGGCCCTG ACT 9 22
    HEX AS 15 ATCCTTCCAGTCA GGGCCAT TGAACCGTATATCTTATGGCCCTG AC 8 22
    HEX AS 16 ATCCTTCCAGTCA GGGCCAT TGAACCGTATATCTTATGGCCCTG ACTG 10 22
    HEX AS 17 ATCCTTCCAGTCA GGGCCAT TGAACCGTATATCTTATGGCCCTG ACTGG 11 22
    HEX AS 18 ATCCTTCCAGTCA GGGCCAT TGAACCGTATATCTTATGGCCCTG ACTGGA 12 22
    HEX AS 19 ATCCTTCCAGTCA GGGCCAT TGAACCGTATATCTTATGGCCCTG ACTGGAA 13 22
    HEX AS 20 ATCCTTCCAGTCA GGGCCAT TGAACCGTATATCTTATGGCCCTG ACTGGAAG 14 22
    HEX AS 21 ATCCTTCCAGTCA GGGCCAT TGAACCGTATATCTTATGGCCCTG ACTGGAAGG 15 22
    HEX AS 22 ATCCTTCCAGTCA GGGCCAT ACCTGAACCGTATATCTTATGGCC CTGACT 9 25
    HEX AS 23 ATCCTTCCAGTCA GGGCCAT TACCTGAACCGTATATCTTATGGC CCTGACT 9 26
    HEX AS 24 ATCCTTCCAGTCA GGGCCAT GTACCTGAACCGTATATCTTATGG CCCTGACT 9 27
    HEX AS 25 ATCCTTCCAGTCA GGGCCAT GGTACCTGAACCGTATATCTTATG GCCCTGACT 9 28
    HEX AS 26 ATCCTTCCAGTCA GGGCCAT TGGTACCTGAACCGTATATCTTAT GGCCCTGACT 9 29
    HEX A 5 ATCCTTCCAGTCA GGGCCAT ACCTGAACCGTATATCCTATGGCC CTGACTGGAA 13 21
    HEX A6 ATCCTTCCAGTCA GGGCCAT ACCGTATATCCTATGGCCCTGACT GGAA 13 15
    HEX A 7 ATCCTTCCAGTCA GGGCCAT ACCTGAACCGTATATCCTATGGCC CTGACTGGAAGG 15 21
    HEX A 8 ATCCTTCCAGTCA GGGCCAT ACCTGAACCGTATATCCTATGGCC CTGACTGGAAG 14 21
    HEX A 9 ATCCTTCCAGTCA GGGCCAT ACCTGAACCGTATATCCTATGGCC CTGACTGGA 12 21
    HEX A 10 ATCCTTCCAGTCA GGGCCAT ACCTGAACCGTATATCCTATGGCC CTGACTGG 11 21
    HEX A 11 ATCCTTCCAGTCA GGGCCAT ACCTGAACCGTATATCCTATGGCC CTGACTG 10 21
    HEX A 12 ATCCTTCCAGTCA GGGCCAT AACCGTATATCCTATGGCCCTGAC TGGAA 13 16
    HEX A 13 ATCCTTCCAGTCA GGGCCAT TGAACCGTATATCCTATGGCCCTG ACTGGAA 13 18
    HEX A 14 ATCCTTCCAGTCA GGGCCAT TACCTGAACCGTATATCCTATGGC CCTGACTGGAA 13 22
    HEX A 15 ATCCTTCCAGTCA GGGCCAT TGGTACCTGAACCGTATATCCTAT GGCCCTGACTGGAA 13 25
    HEX A 16 ATCCTTCCAGTCA GGGCCAT GTACCTGAACCGTATATCCTATGG CCCTGACTGGAA 13 23
    HEX A 17 ATCCTTCCAGTCA GGGCCAT AACCGTATATCCTATGGCCCTGAC TG 10 16
    HEX A 18 ATCCTTCCAGTCA GGGCCAT TGAACCGTATATCCTATGGCCCTG ACTG 10 18
    HEX A 19 ATCCTTCCAGTCA GGGCCAT TACCTGAACCGTATATCCTATGGC CCTGACTG 10 22
    HEX A 20 ATCCTTCCAGTCA GGGCCAT TGGTACCTGAACCGTATATCCTAT GGCCCTGACTG 10 25
    Tabelle 3Q : FIG. 50A-50B Nicking-sgRNA
    NICKING-SGRNA SPACER-SEQUENZ
    HBB_ED7A_+72 GCCTTGATACCAACCTGCCCA (SEQ ID NO: 626)
    HEXA_ED7B_60 GCTGGAACTGGTCACCAAGGC(SEQ ID NO: 627)
    HEXA_ED7B_CORRECT_WT_PE3B GTACCTGAACCGTATATCCTA(SEQ ID NO: 628)
    HEXA_ED7B_CORRECT_SILENT_PE3B GTACCTGAACCGTATATCTTA(SEQ ID NO: 629)
    Tabelle 3R: PEgRNA von FIG. 51A-51F
    PEGRNA SPACER-SEOUENZ 3' EXTENSION (SEQ ID NO: (SEQ ID NO: 632-640) 641-649) PBS-LÄN GE (NT) RT-EMPLA TE-LÄNGE (NT)
    HEK3_ED8_1 TTOG GGCCCAGACTGAGC ACGTGA TCTGCCATCCCGTGCTCA GTCTG 13 10
    HEK3_ED8_3 ATOC GGCCCAGACTGAGC ACGTGA TCTGCCAGCACGTGCTCA GTCTG 13 10
    HEK3_ED8_3 ATOT GGCCCAGACTGAGC ACGTGA TCTGCCAACACGTGCTCA GTCTG 13 10
    HEK3_ED8_3 ATOT_5-6GGTOTT GGCCCAGACTGAGC ACGTGA TGGAGGAAGCAGGGCTTC CTTTCCTCTGAAAACACG TGCTCAGTCTG 13 34
    HEK3_ED8_1 CTTINS GGCCCAGACTGAGC ACGTGA TCTGCCATCAAAGCGTGC TCAGTCTG 13 10
    RNF2_ED8_1 CTOA GTCATCTTAGTCATT ACCTG AACGAACACCTCATGTAA TGACTAAGATG 15 14
    RNF2_ED8_1 CTOG GTCATCTTAGTCATT ACCTG AACGAACACCTCACGTAA TGACTAAGATG 15 14
    RNF2_ED8_1 GTAINS GTCATCTTAGTCATT ACCTG AACGAACACCTCAGTACG TAATGACTAAGATG 15 17
    HBB_ED8_4A TOT GCATGGTGCACCTG ACTCCTG AGACTTCTCCACAGGAGT CAGGTGCAC 13 14
  • Tabelle 4: Sequenzen von Primern, die für die Amplifikation und HTS von genomischer DNA von Säugerzellen verwendet wurden181.
    BESCHREIBUNG SEQUENZ (SEQ ID NOS: 3811-3863)
    HEK3 FWD ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNATGTG GGCTGCCTAGAAAGG
    HEK3 REV TGGAGTTCAGACGTGTGCTCTTCCGATCTCCCAGCCAAACTT GTCAACC
    RNF2 FWD ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNACGTC TCATATGCCCCTTGG
    RNF2 REV TGGAGTTCAGACGTGTGCTCTTCCGATCTACGTAGGAATTTT GGTGGGACA
    HEK4 FWD ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNGAACC CAGGTAGCCAGAGAC
    HEK4 REV TGGAGTTCAGACGTGTGCTCTTCCGATCTTCCTTTCAACCCG AACGGAG
    EMX1 FWD ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNCAGCT CAGCCTGAGTGTTGA
    EMX1 REV TGGAGTTCAGACGTGTGCTCTTCCGATCTCTCGTGGGTTTGT GGTTGC
    FANCF FWD ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNCATTG CAGAGAGGCGTATCA
    FANCF REV TGGAGTTCAGACGTGTGCTCTTCCGATCTGGGGTCCCAGGT GCTGAC
    HBB FWD ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNAGGGT TGGCCAATCTACTCCC
    HBB REV TGGAGTTCAGACGTGTGCTCTTCCGATCTGTCTTCTCTGTCT CCACATGCC
    PRNP FWD ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNGTCAG TGGAACAAGCCGAGT
    PRNP REV TGGAGTTCAGACGTGTGCTCTTCCGATCTACTTGGTTGGGGT AACGGTG
    HEXA FWD ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNCATAC AGGTGTGGCGAGAGG
    HEXA REV TGGAGTTCAGACGTGTGCTCTTCCGATCTCCAGCCTCCTTTG GTTAGCA
    RUNX1 FWD ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNTCACA AACAAGACAGGGAACTG
    RUNX1REV TGGAGTTCAGACGTGTGCTCTTCCGATCTAGATGTAGGGCTA GAGGGGTG
    VEGFA FWD ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNACTTG GTGCCAAATTCTTCTCC
    VEGFA REV TGGAGTTCAGACGTGTGCTCTTCCGATCTAAAGAGGGAATG GGCTTTGGA
    DNMT FWD ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNCACAA CAGCTTCATGTCAGCC
    DNMT REV TGGAGTTCACACGTGTGCTCTTCCGATCTACGTTAATGTTTC CTGATGGTCC
    HEK3 OFF-TARGET SITE 1 FWD ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNTCCCC TGTTGACCTGGAGAA
    HEK3 OFF-TARGET SITE 1 REV TGGAGTTCAGACGTGTGCTCTTCCGATCTCACTGTACTTGCC CTGACCA
    HEK3 OFF-TARGET SITE 2 FWD ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNTTGGT GTTGACAGGGAGCAA
    HEK3 OFF-TARGET SITE 2 REV TGGAGTTCAGACGTGTGCTCTTCCGATCTCTGAGATGTGGGC AGAAGGG
    HEK3 OFF-TARGET SITE 3 FWD ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNTGAGA GGGAACAGAAGGGCT
    HEK3 OFF-TARGET SITE 3 REV TGGAGTTCAGACGTGTGCTCTTCCGATCTGTCCAAAGGCCC AAGAACCT
    HEK3 OFF- TARGET SITE 4 FWD ACACTCTITCCCTACACGACGCTCTTCCGATCTNNNNTCCTA GCACTTTGGAAGGTCG
    HEK3 OFF-TARGET SITE 4 REV TGGAGTTCAGACGTGTGCTCTTCCGATCTGCTCATCTRAATCT GCTCAGCC
    HEK4 OFF-TARGET SITE 1 FWD ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNGGCAT GGCTTCTGAGACTCA
    HEK4 OFF-TARGET SITE 1 REV TGGAGTTCAGACGTGTGCTCTTCCGATCTGTCTCCCTTGCAC TCCCTGTCTTT
    HEK4 OFF-TARGET SITE 2 FWD ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNTTTGG CAATGGAGGCATTGG
    HEK4 OFF-TARGET SITE 2 REV TGGAGTTCAGACGTGTGCTCTTCCGATCTGAAGAGGCTGCC CATGAGAG
    HEK4 OFF-TARGET SITE 3 FWD ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNGGTCT GAGGCTCGAATCCTG
    HEK4 OFF-TARGET SITE 3 REV TGGAGTTCAGACGTGTGCTCTTCCGATCTCTGTGGCCTCCAT ATCCCTG
    HEK4 OFF-TARGET SITE 4 FWD ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNTTTCC ACCAGAACTCAGCCC
    HEK4 OFF-TARGET SITE 4 REV TGGAGTTCAGACGTGTGCTCTTCCGATCTCCTCGGTTCCTCC ACAACAC
    EMX 1 OFF-TARGET SITE 1 FWD ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNGTGGG GAGATTTGCATCTGTGGAGG
    EMX 1 OFF-TARGET SITE 1 REV TGGAGTTCAGACGTGTGCTCTTCCGATCTGCTTTTATACCATC TTGGGGTTACAG
    EMXI OFF-TARGET SITE 2 FWD ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNCAATG TGCTTCAACCCATCACGGC
    EMXI OFF-TARGET SITE 2 REV TGGAGTTCAGACGTGTGCTCTTCCGATCTCCATGAATTTGTG ATGGATGCAGTCTG
    EMXI OFF-TARGET SITE 3 FWD ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNGAGAA GGAGGTGCAGGAGCTAGAC
    EMXI OFF-TARGET SITE 3 REV TGGAGTTCAGACGTGTGCTCTTCCGATCTCATCCCGACCTTC ATCCCTCCTGG
    EMXI OFF-TARGET SITE 4 FWD ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNGTAGT TCTGACATTCCTCCTGAGGG
    EMXI OFF-TARGET SITE 4 REV TGGAGTTCAGACGTGTGCTCTTCCGATCTTCAAACAAGGTG CAGATACAGCA
    FANCF OFF-TARGET SITE 1 FWD ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNGCGGG CAGTGGCGTCTTAGTCG
    FANCF OFF-TARGET SITE 1 REV TGGAGTTCAGACGTGTGCTCTTCCGATCTCCCTGGGTTTGGT TGGCTGCTC
    FANCF OFF-TARGET SITE 2 FWD ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNCTCCT TGCCGCCCAGCCGGTC
    FANCF OFF-TARGET SITE 2 REV TGGAGTTCAGACGTGTGCTCTTCCGATCTCACTGGGGAAGA GGCGAGGACAC
    FANCF OFF-TARGET SITE 3 FWD ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNCCAGT GTTTCCCATCCCCAACAC
    FANCF OFF-TARGET SITE 3 REV TGGAGTTCAGACGTGTGCTCTTCCGATCTGAATGGATCCCCC CCTAGAGCTC
    FANCF OFF-TARGET SITE 4 FWD ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNCAGGC CCACAGGTCCTTCTGGA
  • Tabelle 5: Sequenzen von 100-mer-Einzelstrang-DNA-Oligonukleotid-Donor-Templates, die in HDR-Versuchen und bei der Herstellung der HBB E6V-HEK293T-Zelllinie verwendet wurden. Oligonukleotide sind 100-103 nt lang, wobei Homologiearme um die Stelle des Edits zentriert sind. Oligonukleotide stammten von Integrated DNA Technologies, gereinigt durch PAGE.
    HEK3 +3 A TOT GCTTCTCCAGCCCTGGCCTGGGTCAATCCTTGGGGCCCAG ACTGAGCACGTGTTGGCAGAGGAAAGGAAGCCGTGCTTC CTCCAGAGGGCGTCGCAGGAC (SEQ ID NO: 717)
    HEK3 +3 A TOT, +5,6 GG TOTT GCTTCTCCAGCCCTGGCCTGGGTCAATCCTTGGGGCCCAG ACTGAGCACGTGTTTTCAGAGGAAAGGAAGCCCTGCTTC CTCCAGAGGGCGTCGCAGGAC (SEQ ID NO: 718)
    HEK3 +1 TTOG GCTTCTCCAGCCCTGGCCTGGGTCAATCCTTGGGGCCCAG ACTGAGCACGGGATGGCAGAGGAAAGGAAGCCCTGCTTC CTCCAGAGGGCGTCGCAGGAC (SEQ ID NO: 719)
    HEK3 +3 ATOC GCTTCTCCAGCCCTGGCCTGGGTCAATCCTTGGGGCCCAG ACTGAGCACGTGCTGGCAGAGGAAAGGAAGCCCTGCTTC CTCCAGAGGGCGTCGCAGGAC (SEQ ID NO: 720)
    HEK3 +1 CTT INSERTION GCTTCTCCAGCCCTGGCCTGGGTCAATCCTTGGGGCCCAG ACTGAGCACGCTTTGATGGCAGAGGAAAGGAAGCCCTGC TTCCTCCAGAGGGCGTCGCAGGAC (SEQ ID NO: 721)
    RNF2 +1 CTOA CCCAGTTTACACGTCTCATATGCCCCTTGGCAGTCATCTTA GTCATTACATGAGGTGTTCGTTGTAACTCATATAAACTGAG TTCCCATGTTTTGCTTAA (SEQ ID NO: 722)
    RNF2 +1 CTOG CCCAGTTTACACGTCTCATATGCCCCTTGGCAGTCATCTTA GTCATTACGTGAGGTGTTCGTTGTAACTCATATAAACTGAG TTCCCATGTTTTGCTTAA (SEQ ID NO: 723)
    RNF2 +1 GTA INSERTION CAGTTTACACGTCTCATATGCCCCTTGGCAGTCATCTTAGT CATTACGTACTGAGGTGTTCGTTGTAACTCATATAAACTGA GTTCCCATGTTTTGCTTA (SEQ ID NO: 724)
    HBB E6V INSTALLATION (ALSO USED FOR CREATION OFTHE HBB E6V HEK293T CELL LINE) ACTTCATCCACGTTCACCTTGCCCCACAGGGCAGTAACGG CAGACTTCTCCACAGGAGTCAGATGCACCATGGTGTCTGT TTGAGGTTGCTAGTGAACAC (SEQ ID NO: 725)
    HBB E6V CORRECTION PROTOSPACER A ACTTCATCCACGTTCACCTTGCCCCACAGGGCAGTAACGG CAGACTTCTCCTCAGGAGTCAGGTGCACCATGGTGTCTGT TTGAGGTTGCTAGTGAACAC (SEQ ID NO: 726)
    HBB E6V CORRECTION PROTOSPACER B GTGTTCACTAGCAACCTCAAACAGACACCATGGTGCACCT GACTCCTGAGGAGAAGTCTGCCGTTACTGCCCTGTGGGGC AAGGTGAACGTGGATGAAGT (SEQ ID NO: 727)
    HBB E6V CORRECTION PROTOSPACER B, GTGTTCACTAGCAACCTCAAACAGACACCATGGTGCACCT GACTCCTGATGAGAAGTCTGCCGTTACTGCCCTGTGGGGC AAGGTGAACGTGGATGAAGT (SEQ ID NO: 723)
    SILENT PAM MUTATION
    PRNP G127V CACATGGCTGGTGCTGCAGCAGCTGGGGCAGTGGTGGGG GGCCTTGGCGTCTACATGCTGGGAAGTGCCATGAGCAGGC CCATCATACATTTCGGCAGTG (SEQ ID NO: 729)
  • Zusätzliche Sequenzen
  • Sequenzen der hier verwendeten dualen fluoreszierenden Reporterplasmide aus Hefe
    Figure DE112020001339T5_0323
    >
    Figure DE112020001339T5_0324
    Figure DE112020001339T5_0325
    Figure DE112020001339T5_0326
    Figure DE112020001339T5_0327
    Figure DE112020001339T5_0328
    Figure DE112020001339T5_0329
    Figure DE112020001339T5_0330
    Figure DE112020001339T5_0331
    Figure DE112020001339T5_0332
    Figure DE112020001339T5_0333
    Figure DE112020001339T5_0334
    Figure DE112020001339T5_0335
  • LEGENDE:
  • Offener Leserahmen mit GFP
    Linker mit Stopcodon +1 Frameshift oder -1 Frameshift
    Offener Leserahmen mit mCherry
    Plasmidrückgrat (enthält den GPD-Promotor, Leu2-Marker und AmpR)
    Protospacer (unterstrichen)
    PAM (fett gedruckt)
  • DNA-Sequenzen von Säuger-Prime Editor-Plasmiden und ein beispielhaftes PEgRNA-Plasmids:
    Figure DE112020001339T5_0336
  • Figure DE112020001339T5_0337
    Figure DE112020001339T5_0338
    Figure DE112020001339T5_0339
    Figure DE112020001339T5_0340
    Figure DE112020001339T5_0341
    Figure DE112020001339T5_0342
    Figure DE112020001339T5_0343
    Figure DE112020001339T5_0344
  • Figure DE112020001339T5_0345
  • N-terminales NLS + Cas9 H840A
    Flexibler Linker
  • Reverse Transkriptase von M-MLV + C-terminales NLS
  • Plasmidrückgrat (enthält CMV-Promotor und AmpR)
  • Figure DE112020001339T5_0346
  • U6-Promotorsequenz
    Spacer-Sequenz
  • sgRNA-Gerüst
  • 3'-Extension (enthält PBS- und RT-Template)
  • Rückgrat (enthält AmpR)
  • Figure DE112020001339T5_0347
    Figure DE112020001339T5_0348
    Figure DE112020001339T5_0349
    Figure DE112020001339T5_0350
    Figure DE112020001339T5_0351
  • U6-Promotor
  • PEgRNA
    hSynpromotor
    N-termPE2
    N-termNpu
  • P2A-GFP-KASH
  • Figure DE112020001339T5_0352
    Figure DE112020001339T5_0353
    Figure DE112020001339T5_0354
    Figure DE112020001339T5_0355
    Figure DE112020001339T5_0356
  • hSynpromotor
    C-termNpu
  • C-termwtCas9
  • Figure DE112020001339T5_0357
    Figure DE112020001339T5_0358
    Figure DE112020001339T5_0359
    Figure DE112020001339T5_0360
  • U6-Promotor
    sgRNA
  • Aminosäuresequenzen der hier verwendeten Varianten der reversen Transkriptase des Maloney-Maus-Leukämievirus (M-MLV RT).
    Figure DE112020001339T5_0361
    Figure DE112020001339T5_0362
  • Literaturstellen für Beispiel 12
  • Die folgenden Literaturstellen sind jeweils in Beispiel 12 zitiert und durch Bezugnahme hier aufgenommen.
    1. 1. Landrum, M. J. et al. ClinVar: public archive of interpretations of clinically relevant variants. Nucleic Acids Res. 44, D862-D868 (2016).
    2. 2. Jinek, M. et al. A Programmable Dual-RNA-Guided DNA Endonuclease in Adaptive Bacterial Immunity. Science 337, 816-821 (2012).
    3. 3. Cong, L. et al. Multiplex Genome Engineering Using CRISPR/Cas Systems. Science 339, 819- 823 (2013).
    4. 4. Mali, P. et al. RNA-Guided Human Genome Engineering via Cas9. Science 339, 823-826 (2013).
    5. 5. Yang. H. et al. One-Step Generation of Mice Carrying Reporter and Conditional Alleles by CRISPR/Cas-Mediated Genome Engineering. Cell 154, 1370-1379 (2013).
    6. 6. Kim, S., Kim, D., Cho, S. W., Kim, J. & Kim, J.-S. Highly efficient RNA-guided genome editing in human cells via delivery of purified Cas9 ribonucleoproteins. Genome Res. 24, 1012-1019 (2014).
    7. 7. Orlando. S. J. et al. Zinc-finger nuclease-driven targeted integration into mammalian genomes using donors with limited chromosomal homology. Nucleic Acids Res. 38, e152-e152 (2010).
    8. 8. Tsai. S. Q. et al. GUIDE-seq enables genome-wide profiling of off-target cleavage by CRISPRCas nucleases. Nat. Biotechnol. 33, 187-197 (2015).
    9. 9. Suzuki, K. et al. In vivo genome editing via CRISPR/Cas9 mediated homologyindependent targeted integration. Nature 540, 144-149 (2016).
    10. 10. Kosicki, M., Tomberg. K. & Bradley. A. Repair of double-strand breaks induced by CRISPR-Cas9 leads to large deletions and complex rearrangements. Nat. Biotechnol. 36. 765-771 (2018).
    11. 11. Haapaniemi, E., Botla. S.. Persson, J., Schmierer, B. & Taipalc, J. CRISPR-Cas9 genome editing induccs a p53-mediated DNA damage response. Nat. Med. 24, 927-930 (2018).
    12. 12. Ihry. R. J. et al. p53 inhibits CRISPR-Cas9 engineering in human pluripotent stem cells. Nat. Med. 24, 939-946 (2018).
    13. 13. Rouet, P., Smih, F. & Jasin. M. Expression of a site-specific endonuclease stimulates homologous recombination in mammalian cells. Proc. Natl. Acad. Sei. 91. 6064-6068 (1994).
    14. 14. Chapman, J. R., Taylor, M. R. G. & Boulton, S. J. Playing the end game: DNA douhlestrand break repair pathway choice. Mol. Cell 47, 497-510 (2012).
    15. 15. Cox. D. B. T., Platt. R. J. & Zhang, F. Therapeutic genome editing: prospects and challenges. Nat. Med. 21. 121-131 (2015).
    16. 16. Paquet, D. et al. Efficient introduction of specific homozygous and heterozygous mutations using CRISPR/Cas9. Nature 533, 125-129 (2016).
    17. 17. Chu. V. T. et al. Increasing the efficiency of homology-directed repair for CRISPR-Cas9-induced precise gene editing in mammalian cells. Nat. Biotechnol. 33. 543-548 (2015).
    18. 18. Maruyama. T. et al. Increasing the efficiency of precise genome editing with CRISPR-Cas9 by inhibition of nonhomologous end joining. Nat. Biotechnol. 33, 538-542 (2015).
    19. 19. Rees, H. A., Yeh, W.-H. & Liu, D. R. Development of hRad51-Cas9 nickase fusions that mediatc HDR without double-stranded breaks. Nat. Commun. 10. 1-12 (2019).
    20. 20. Shen, M. W. et al. Predictable and precise template-free CRISPR editing of pathogenic variants. Nature 563, 646-651 (2018).
    21. 21. Rees, H. A. & Liu, D. R. Base editing: precision chemistry on the genome and transcriptome of living cells. Nat. Rev. Genet. 19, 770 (2018).
    22. 22. Komor, A. C., Kim, Y. B., Packer, M. S., Zuris. J. A. & Liu, D. R. Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage. Nature 533, 420-424 (2016).
    23. 23. Gaudelli, N. M. et al. Programmable base editing of A•T to G•C in genomic DNA without DNA cleavage. Nature 551, 464-471 (2017).
    24. 24. Gao, X. et al. Treatment of autosomal dominant hearing loss by in vivo delivery of genome editing agents. Nature 553, 217-221 (2018).
    25. 25. Ingram, V. M. A specific chemical difference between the globins of normal human and sickle-cell anaemia haemoglobin. Nature 178, 792-794 (1956).
    26. 26. Myerowitz. R. & Costigan. F. C. The major defect in Ashkenazi Jews with Tay-Sachs disease is an insertion in the gene for the alpha-chain of beta-hexosaminidase. J. Biol. Chem. 263, 18587-18589 (1988).
    27. 27. Zielenski, J. Genotype and Phcnotype in Cystic Fibrosis. Respiration 67, 117-133 (2000).
    28. 28. Mead, S. et al. A Novel Protective Prion Protein Variant that Colocalizes with Kuru Exposure. N. Engl. J. Med. 361. 2056-2065 (2009).
    29. 29. Marraffini. L. A. & Sontheimer, E. J. CRISPR interference limits horizontal gene transfer in staphylococci by targeting DNA. Science 322, 1843-1845 (2008).
    30. 30. Barrangou, R. et al. CRISPR provides acquired resistance against viruses in prokaryotes. Science 315, 1709-1712 (2007).
    31. 31. Jiang. F. & Doudna. J. A. CRISPR-Cas9 Structures and Mechanisms. Annu. Rev. Biophys. 46. 505-529 (2017).
    32. 32. Hille. F. et al. The Biology of CRISPR-Cas: Backward and Forward. Cell 172, 1239-1259 (2018).
    33. 33. Luan. D. D., Korman, M. H., Jakubczak, J. L. & Eickhush. T. H. Reverse transcription of R2Bm RNA is primed by a nick at the chromosomal target site: a mechanism for non-LTR retrotransposition. Cell 72, 595-605 (1993).
    34. 34. Liu. Y.. Kao. H.-I. & Bambara, R. A. Flap endonuclease 1: a central component of DNA metabolism. Annu. Rev. Biochem. 73, 589-615 (2004).
    35. 35. Richardson, C. D., Ray, G. J., DeWitt. M. A., Curie, G. L. & Corn, J. E. Enhancing homology directed genome editing by catalytically active and inactivc CRISPR-Cas9 using asymmetric donor DNA. Nat. Biotechnol. 34, 339-344 (2016).
    36. 36. Qi. L. S. et al. Repurposing CRISPR as an RNA-Guided Platform for Sequence-Specific Control of Gene Expression. Cell 152. 1173-1183 (2013).
    37. 37. Shechner, D. M., Hacisuleyman, E., Younger, S. T. & Rinn, J. L. Multiplexable, locusspecific targcting of long RNAs with CRISPR-Display. Nat. Methods 12, 664-670 (2015).
    38. 38. Tang. W., Hu, J. H. & Liu, D. R. Aptazyme-embedded guide RNAs enable ligandresponsive genome editing and transcriptional activation. Nat. Commun. 8, 15939 (2017).
    39. 39. Jinek, M. et al. Structures of Cas9 Endonucleases Reveal RNA-Mediated Conformalional Activation. Science 343, 1247997 (2014).
    40. 40. Nishimasu, H. et al. Crystal Structure of Cas9 in Complex with Guide RNA and Target DNA. Cell 156, 935-949 (2014).
    41. 41. Jiang. F., Zhou, K.. Ma, L., Gressel. S. & Doudna, J. A. A Cas9-guide RNA complex preorganized for target DNA recognition. Science 348. 1477-1481 (2015).
    42. 42. Baranauskas, A. et al. Generation and characterization of new highly thermostable and processive M-MuLV reverse transcriptase variants. Protein Eng. Des. Sel. 25, 657-668 (2012).
    43. 43. Gerard, G. F. et al. The role of template-primer in protection of reverse transcriptase from thermal inactivation. Nucleic Acids Res. 30, 31 18-3129 (2002).
    44. 44. Arezi, B. & Hogrefe, H. Novel mutations in Moloney Murine Leukemia Virus reverse transcriptase increase thermostability through tighter binding to template-primer. Nucleic Acids Res. 37.473-481 (2009).
    45. 45. Kotewicz. M. L., Sampson, C. M., D'Alessio, J. M. & Gerard, G. F. Isolation of cloned Moloney murine leukemia virus reverse transcriptase lacking ribonuclease H activity. Nucleit Acids Res. 16, 265-277 (1988).
    46. 46. Thuronyi, B. W. et al. Continuous evolution of base editors with expanded target compatihility and improved activity. Nat. Biotechnol. (2019). doi:10.1038/s41587-019-0193-0
    47. 47. Kim. Y. B. et al. Increasing the genome-targeting scope and precision of base editing with engineered Cas9-cytidine deaminase fusions. Nat. Biotechnol. 35.371-376 (2017).
    48. 48. Koblan, L. W. et al. Improving cytidine and adenine base editors by expression optimization and ancestral reconstruction. Nat. Biotechnol. (2018). doi:10.1038/nbt.4172
    49. 49. Kleinstiver, B. P. et al. High-fidelity CRISPR-Cas9 nucleases with no detectable genome-wide off target effects. Nature 529, 490-495 (2016).
    50. 50. Zuo. E. et al. Cytosine base editor generates substantial off-target single-nucleotide variants in mouse embryos. Science 364, 289-292 (2019).
    51. 51. Jin. S. et al. Cytosine, but nol adenine, base editors induce genome-wide off-target mutations in rice. Science 364. 292-295 (2019).
    52. 52. Kim. D., Kim. D., Lee. G., Cho. S.-1. & Kim, J.-S. Genome-wide target specificity of CRISPR RNA guided adenine base editors. Nat. Biotechnol. 37,430-435 (2019).
    53. 53. Grunewald, J. et al. Transcriptome-wide off-target RNA editing induced by CRISPRguided DNA base editors. Nature 569,433-437 (2019).
    54. 54. Zhou, C. er al. Off-target RNA mutation induced by DNA base editing and its elimination by mutagenesis. Nature 571, 275-278 (2019).
    55. 55. Rees. H. A., Wilson. C.. Doman. J. L. & Liu. D. R. Analysis and minimization of cellular RNA editing by DNA adenine base editors. Sci. Adv. 5, caax5717 (2019).
    56. 56. Ostertag, E. M. & Kazazian Jr, H. H. Biology of Mammalian L1 Retrotransposons. Annu. Rev. Genet. 35. 501-538 (2001).
    57. 57. Griffiths. D. J. Endogenous retroviruses in the human genome sequence. Genome Biol. 2, REVIEWS 1017 (2001).
    58. 58. Berkhout, B., Jebbink, M. & Zsiros, J. Identification of an Active Reverse Transcriptase Enzyme Encoded by a Human Endogenous HERV-K Retrovirus. J. Virol. 73,2365-2375 (1999).
    59. 59. Halvas. E. K., Svarovskaia, E. S. & Pathak. V. K. Role of Murine Leukemia Virus Reverse Transcriptase Deoxyribonucleoside Triphosphate-Binding Site in Retroviral Replication and In Vivo Fidelity. J. Virol. 74. 10349-10358 (2000).
    60. 60. Dever. D. P. et al. CRISPR/Cas9 Beta-globin Gene Targeting in Human Hematopoietic Stem Cells. Nature 539, 384-389 (2016).
    61. 61. Park, S. H. et al. Highly efficient editing of the β-globin gene in patient-derived hematopoietic stem and progenitor cells to treat sickle cell disease. Nucleic Acids Res. doi: 10.1093/nar/gkz475
    62. 62. Collinge, J. Prion diseases of humans and animals: their causes and molecular basis. Annu. Rev. Neurosci. 24, 519-550 (2001).
    63. 63. Asante. E. A. et al. A naturally occurring variant of the human prion protein completely prevents prion disease. Nature 522, 478-481 (2015).
    64. 64. Zettler, J., Schutz, V. & Mootz, II. D. The naturally split Npu DnaE intein exhibits an extraordinarily high rate in the protein trans-splicing reaction. FEBS Lett. 583, 909-914 (2009).
    65. 65. Kugler, S.. Kilic, E. & Bahr. M. Human synapsin 1 gene promoter confers highly neuronspecific long-term transgene expression from an adenoviral vector in the adult rat brain depending on the transduced area. Gene Ther. 10, 337-347 (2003).
    66. 66. de Felipe, P.. Hughes, L. E., Ryan, M. D. & Brown, J. D. Co-translational, intraribosomal cleavageof polypeptides by the foot-and-mouth discase virus 2A peptide. J. Biol. Chem. 278, 11441-11448 (2003).
  • BEISPIEL 13 - ZELLDATENAUFZEICHNUNG UND ABSTAMMUNGSVERFOLGUNG DURCH PE
  • Hintergrund
  • Genommodifikation kann verwendet werden, um zelluläre Prozesse und die Entwicklung von Zellen zu untersuchen und aufzuzeichnen. Die Verknüpfung zellulärer Ereignisse, wie Zellteilung oder Signalkaskadenaktivierung, mit DNA-Sequenzmodifikationen speichert Zellgeschichten als interpretierbare DNA-Sequenzänderungen, die beschreiben, ob bestimmte zelluläre Ereignisse stattgefunden haben. Für diese Anwendungen ist DNA-Editing erforderlich, da DNA auf eine Weise von einer Zelle zur nächsten unverfälscht weitergegeben wird, wie dies bei RNA und Proteinen nicht der Fall ist. Informationen über den zellulären Zustand und die Abstammung gehen im Allgemeinen verloren, wenn Modifikationen an kurzlebigen Protein- und RNA-Molekülen vorgenommen werden. Die Aufzeichnung von zellulären Ereignissen innerhalb einer einzelnen Zelle ist eine leistungsstarke Methode, um zu verstehen, wie Krankheitszustände im Vergleich zu gesunden Kontrollen initiiert, aufrechterhalten und verändert werden. Die Fähigkeit, diese Fragen zu untersuchen, hat Auswirkungen auf das Verständnis der Entwicklung von Krebs, neurologischen Erkrankungen und einer Vielzahl anderer wichtiger Probleme der menschlichen Gesundheit. Prime Editing (PE) bietet ein System zum Erstellen zielgerichteter und sequenzspezifischer genomischer Insertionen, Deletionen oder Mutationen. Eine wiederholte Modifikation eines DNA-Targets, die durch zielgerichtete Amplikon-Sequenzierung und/oder RNA-Sequenzierung sequenziert werden kann (was insbesondere für Einzelzell-Aufzeichnungsversuche von Bedeutung ist), kann verwendet werden, um eine Vielzahl wichtiger biologischer Prozesse aufzuzeichnen, darunter die Aktivierung von Signalkaskaden, metabolische Zustände und zelluläre Differenzierungsprogramme. Eine Verbindung interner und externer zellulärer Signale mit Sequenzmodifikationen im Genom ist theoretisch für jedes Signal möglich, für das ein signalresponsiver Promotor existiert. Es wird angenommen, dass PE ein stark erweitertes Toolkit zur Sondierung der zellulären Abstammung und der Signalgeschichten von eukaryotischen und prokaryotischen Zellen sowohl unter Kulturbedingungen als auch in vivo ermöglicht.
  • Frühere Standards
  • Eine zielgerichtete Sequenzinsertion, -deletion oder -mutation kann verwendet werden, um eine Reihe wichtiger biologischer Fragen zu untersuchen, einschließlich der Abstammungsverfolgung und der Aufzeichnung zellulärer Stimuli. Das aktuelle Toolkit zur Erzeugung dieser Signaturen im Genom ist begrenzt. Eine Mutagenese von Target-Loci wurde bisher unter Verwendung sowohl von DNA-Nukleasen als auch von Basen-Editors entwickelt.
  • Das Schneiden von Target-Sequenzen durch CRISPR/Cas9-Nuklease erzeugt stochastische Sequenzänderungen, um eine große Anzahl von Insertions- oder Deletionsprodukten (Indel-Produkte) zu erzeugen. Die große Anzahl von Sequenzergebnissen, die sich aus dem Cas9-Schneiden ergeben, ermöglicht eine eindeutige Bestimmung von Sequenzen, die von der Nuklease geschnitten wurden. Die Fähigkeit, geschnittene von nicht geschnittenen Sequenzen zu unterscheiden, wurde vorwiegend auf zwei Arten genutzt.
  • Erstens wurde die Expression der Cas9-Nuklease und/oder ihrer Single Guide-RNA (sgRNA) mit zellulären Signalen in Verbindung gebracht. Darüber hinaus wurde aufgezeichnet, ob dieses Signal auf Grundlage von Sequenzmodifikationen des Genom-Locus, auf den Cas9 gerichtet ist, aufgetreten ist. Dieser Ansatz ist jedoch begrenzt, da jedes Signal einen eindeutigen Target-Locus erfordert, was die Verfolgung des relativen Timings mehrerer Signale schwierig zu interpretieren macht. Eine weitere Einschränkung dieses Ansatzes besteht darin, dass für eine bestimmte sgRNA mehrere Target-Loci erwünscht sind, da die Erzeugung eines Indels die zusätzliche Mutagenese des Target-Locus oft stark behindert; dies bedeutet oft, dass im Voraus festgelegte Target-Loci zum Editing in Zellen integriert werden, anstatt einer direkten Mutagenese endogener Loci.
  • Zweitens wurden Cas9-Indels verwendet, um zelluläre Abstammungen zu verfolgen. Wie hier beschrieben, ermöglicht die große Anzahl möglicher Indel-Zustände, die durch Cas9-Nuklease-Aktivität erzeugt werden, die Erzeugung von zellulären Entwicklungsbäumen, die darauf hindeuten, welche Zellen im Laufe der Zeit voneinander entstanden sind. Dieser Ansatz ist eine leistungsstarke Methode, um zu verstehen, wie Zellen aus einander entstehen, und wurde verwendet, um zur Identifizierung eindeutiger Zellzustände und -typen über die Entwicklungszeit hinweg beizutragen, indem eine RNA-Sequenzierung an ausgewählten Zell-Pools durchgeführt wurde. Dieser Ansatz kann nicht unabhängig über zelluläre Signalisierungsereignisse und ihre Reihenfolge berichten und seine Angaben zu Vorläuferzellzuständen gegenüber terminal differenzierten Zellzuständen können einseitig beeinflusst sein.
  • Cas9-Nuklease-vermittelte Abstammungsverfolgung und Signalaufzeichnung sind leistungsfähige Techniken, die mit einigen wichtigen Einschränkungen verbunden sind. Eine Signalaufzeichnung mit Cas9-Nuklease ist technisch oft sehr anspruchsvoll. Cas9-Schneiden erschöpft den Target-Locus (wiederholtes Schneiden ist schwierig, sobald ein Indel erzeugt wurde), was es schwierig macht, Langzeitstimuli auf Einzelzellebene aufzuzeichnen. Die Kinetik des Cas9-Schneidens kann abgestimmt werden, um längerfristige Aufzeichnungen zu ermöglichen, obwohl die Fähigkeit, die Reihenfolge, Intensität und Dauer mehrerer Stimuli zu integrieren, ein sehr anspruchsvolles technisches Problem bleibt, das mit diesem Tool möglicherweise nicht gelöst werden kann. Versuche zur Abstammungsverfolgung von Cas9 waren unglaublich leistungsstark, leiden jedoch unter kleineren technischen Herausforderungen eines Sequenzzusammenbruchs aufgrund gleichzeitiger Cas9-Schnitte an einem Target-Locus. Diese Versuche zur Abstammungsverfolgung erfordern ein Editing von im Voraus festgelegten Target-Loci, was die Flexibilität dieses Ansatzes einschränkt.
  • DNA-Basen-Editing wurde auch verwendet, um zelluläre Signalisierungsereignisse zu verfolgen. Ein Basen-Editing ist aufgrund der geringen Anzahl von Ergebniszuständen, die von einem Editing-Ereignis erzeugt werden, im Verhältnis zu der Anzahl von Zuständen, die von Cas9-Indels erzeugt werden, nicht gut für eine Abstammungsverfolgung geeignet; die Tatsache, dass die von einem Basen-Editor hergestellten Sequenzmodifikationen im Voraus festgelegt sind, ist jedoch für eine Verfolgung interner und externer zellulärer Stimuli besonders nützlich. Wie hier beschrieben, kann entweder ein Basen-Editor oder eine sgRNA-Expression mit einem bestimmten biologischen oder chemischen Stimulus verbunden sein. Basen-Editing-Aktivitäten wurde verwendet, um eine große Anzahl individueller Stimuli sowohl in Säuger- als auch in Bakterienzellen zu verfolgen. Dieser Ansatz wurde auch verwendet, um aufeinanderfolgende Stimuli zu verfolgen, bei denen ein erstes Editing-Ereignis erforderlich war, bevor ein zweiter Edit stattfinden konnte.
  • Eine Signalaufzeichnung beim Basen-Editing ist ein wichtiger erster Schritt für dieses Gebiet, weist jedoch eine Reihe von Einschränkungen auf. Eine solche Einschränkung besteht darin, dass ein Basen-Editing sein Target nach einem Editing erschöpft, wodurch der Dynamikbereich der Technik eingeschränkt wird. Dies bedeutet, dass eine Verwendung endogener Targets zur Aufzeichnung von Ereignissen oft schwierig ist und sich auf die Aufzeichnung von Massenaktivitäten anstelle von Aktivitäten auf Einzelzellebene beschränkt. Eine Alternative dazu ist die Einführung eines im Voraus festgelegten, sich wiederholenden Aufzeichnungs-Locus, wenngleich dies bisher nicht durchgeführt wurde. Es gibt auch Probleme mit der Zwei-Signal-Aufzeichnung. Diese Zwei-Signal-Aufzeichnungsversuche berichten nur über das Vorhandensein des zweiten Stimulus nach einem ersten; es gibt nicht an, welcher Stimulus zuerst aufgetreten ist oder wie lange die Stimuli vorhanden waren. Dies schränkt das aus dem Experiment gewonnene biologische Verständnis grundlegend ein.
  • Es wurde der Gedanke vorgebracht, dass eine PE-Abstammungsverfolgung sowohl eine Abstammungsverfolgung als auch eine zelluläre Signalisierungsaufzeichnung durch ein Modifizieren von sowohl Genom-Target-Sequenzen als auch integrierter, im Voraus festgelegter Sequenzen durchführen könnte. Bei PE wird ein synthetisches Fusionsprotein verwendet, das ein Cas9-Nickase-Fragment (häufig die SpCas9 H840A-Variante) und eine Reverse Transkriptase(RT)-Domäne umfasst, zusammen mit einer technisch entwickelten Prime Editing-Guide-RNA (PEgRNA). Zusammen zielen diese Komponenten auf eine bestimmte Genomsequenz ab und bauen ein vorgegebenes Edit ein. Da die PEgRNA sowohl die Target-Genomsequenz als auch das Editing-Ergebnis vorgibt, kann eine hochspezifische und kontrollierte Genommodifikation gleichzeitig unter Verwendung mehrerer PEgRNAs innerhalb derselben Zelle erreicht werden. Zu zugänglichen Genommodifikationen gehören alle Einzelnukleotidsubstitutionen, kleine bis mittelgroße Sequenzinsertionen und kleine bis mittelgroße Sequenzdeletionen. Die Vielseitigkeit dieser Genom-Editing-Technologie soll eine zeitlich gekoppelte, signalspezifische Aufzeichnung in Zellen ermöglichen.
  • Nützlichkeit einer Aufzeichnung der Abstammung und Zellsignalisierung durch PE
  • Ein Aufzeichnen zellulärer Signalisierung kann auf verschiedene Weise erreicht werden. Eine wichtige erste Anwendung dieses Ansatzes ist die Verbindung von DNA-Modifikationsereignissen mit Zellzyklus-assoziierten Signalen wie der Expression von Cyclinen, CDKs oder anderen Proteinen, die spezifisch für Phasen der zellulären Lebensspanne sind, um eine zelluläre Uhr zu erzeugen. Eine zelluläre Uhr ermöglicht es Forschern, die Reihenfolge verschiedener Signale zu verstehen, die von einzelnen Zellen empfangen und verarbeitet werden. Eine molekulare Uhr würde auch die Bestimmung von Langzeitsignalisierung gegenüber kurzfristigen Signalisierungsimpulsen ermöglichen. Die Verwendung von Prime-Editing-Komponenten, die nur zum einmaligen Editing eines Zellzyklus in der Lage sind, könnte auch zu einer molekularen Uhr führen. Wenn ein Editing nur einmal in einem Zellzyklus ohne fortgesetzte DNA-Modifikation erfolgen kann (vielleicht indem der nicht-editierte DNA-Strang nicht genickt wird), könnte man sich ein System vorstellen, das nur durch eine zweite Targeting-PEsgRNA in einer nachfolgenden Zellteilung editiert werden kann. PE ist als zelluläre Uhr besonders nützlich, da es wiederholt Loci auf vorbestimmte Weise inserieren, deletieren oder mutieren kann, wobei Insertionen besonders wertvoll sind, da wiederholte, regelmäßige Insertionen an einem beliebigen Target-Genom-Locus vorgenommen werden können.
  • Eine weitere wichtige Anwendung im Zusammenhang mit der Aufzeichnung zellulärer Signale ist die parallele Aufzeichnung einer großen Anzahl von zellulären Inputs. Die Verknüpfung von zellulären Signalisierungsereignissen mit DNA-Modifikation ermöglicht die Aufzeichnung, ob ein solches Signalisierungsereignis aufgetreten ist. Ähnlich wie bei Cas9-Nuklease-basierten oder Base-Editing-basierten Aufzeichnungssystemen kann eine Aufzeichnung zellulärer Ereignisse mit der gRNA- oder Editor-Expression verknüpft werden. Im Gegensatz zu diesen anderen Ansätzen sollte das Lineage-Prime-Editing in der Lage sein, die Reihenfolge, Intensität und Dauer von Signalisierungsereignissen aufzuzeichnen, ohne strenge Sequenzmotive für ein geordnetes Editing zu erfordern. Tatsächlich sollte das Lineage-Prime-Editing in der Lage sein, den oben beschriebenen zellulären Zähler mit signalspezifischen Insertionen, Deletionen oder Mutationen zu integrieren, um die Reihenfolge, Intensität und Dauer biologischer Signale zu untersuchen. Durch die Programmierbarkeit von Prime Editing kann dieser Ansatz an genomischen Loci erreicht werden, die bereits in der interessierenden Target-Zelle vorhanden sind (ob in Bakterien, Mäuse, Ratten, Affen, Schweinen, Menschen, Zebrabärbling, C. elegans usw.). Es ist ebenfalls wichtig zu beachten, dass eine Prime-Editing-Aufzeichnung Barcodes in Abhängigkeit von der Guide-RNA einbaut, die Anzahl der Inputs ist auf die Anzahl der Signale beschränkt, für die es zuverlässige signalspezifische Guide-RNA-Expressionskassetten gibt (die aufgrund der Fähigkeit, diese Expressionen mit der Aktivität von RNA-Pol II-Promotoren zu verknüpfen, sehr hoch sein sollte). Die Anzahl der aufzeichenbaren Signale skaliert linear mit der Anzahl der erforderlichen PEgRNAs.
  • PE kann auch verwendet werden, um zelluläre Abstammungslinien zu verfolgen. Wiederholte Sequenzmodifikation können verwendet werden, um eindeutige zelluläre Barcodes zu erzeugen, um einzelne Zellen zu verfolgen. Die Arrays von Barcodes, ihre Reihenfolge und Größe können alle verwendet werden, um zelluläre Abstammungen auf eine Weise abzuleiten, die zu der großen Anzahl von Indel-Zuständen, die von der Cas9-Nuklease erzeugt werden, komplementär sein kann.
  • Prime-Editing-Methodik für wiederholte Sequenzmodifikationen
  • Eine Reihe von unterschiedlichen Modalitäten für wiederholte Sequenzmodifikationen unter Verwendung von Prime Editing (PE) wurde ins Auge gefasst: DNA-Mutagenese; Sequenzdeletion; und Sequenzinsertion. Insbesondere können diese Anwendungen entweder auf bereits bestehende genomische DNA-Targets oder auf im Voraus festgelegte DNA-Sequenzen angewendet werden, die Forscher in Target-Zellen integrieren. Diese Techniken der seriellen Sequenzmodifikation sind zum Aufzeichnen von Informationen und zur kontinuierlichen, festgelegten oder stochastischen Modifikation von Target-Loci nützlich. Eine serielle zielgerichtete Locus-Modifikation kann besonders nützlich sein, um Bibliotheken von Varianten in verschiedenen Wirten zu erzeugen.
  • Wiederholte Sequenzmutationen können verwendet werden, um entweder genomische DNA oder im Voraus festgelegte integrierte DNA-Sequenzen auf iterative Weise zu ändern, um über zelluläre Signalisierungsereignisse zu berichten. In diesem Paradigma entsprechen Mutationen, die durch PE-gRNA-Aktivität eingebaut werden, dem Vorhandensein eines zellulären Signals. Diese Punktmutationen könnten PAM-Motive einbauen, die für serielle Editing-Ereignisse erforderlich sind, sowie Punktmutationen, die dem Vorhandensein spezifischer Signale entsprechen. Dieses System würde vor einer Verwendung ein gRNA-Design erfordern, da jede nachfolgende Guide-RNA einen neuen Protospacer verwenden wird; es könnte jedoch besonders leistungsfähig sein, um einzelne oder eine kleine Anzahl von Stimuli von besonderem Interesse zu untersuchen. Ein Einbau dieser Mutationen könnte von individuellen biologischen Stimuli abhängen oder mit konsistenten zellulären Prozessen verbunden sein, welche die zelluläre Zeit angeben würden. Die folgenden Sequenzen entsprechen den SEQ ID NOs: 743, 744, 744 und 745.
    Figure DE112020001339T5_0363
  • Ein weiteres ähnliches PE-Guide-RNA-intensives Verfahren ist die wiederholte Deletion von Target-Sequenzen. Die Entfernung einzelner Sequenzen von einem Target-Locus würde die Fähigkeit ermöglichen, Signalisierungsereignisse durch den Verlust von DNA-Motiven zu rekonstruieren. Das Design von PEgRNAs, die aufeinanderfolgende Sequenzen deletieren, würde die Verfolgung aufeinanderfolgender Signale ermöglichen. Dies würde es Forschern ermöglichen, Fälle zu identifizieren, in denen ein Signal einem anderen folgte, was es den Forschern ermöglichen würde, zu untersuchen, welche Signalisierungsereignisse in welcher Reihenfolge auftreten. Ein solches System wurde unter Verwendung von CAMERA getestet; dies erforderte jedoch eine Vorauswahl bestimmter Loci mit eindeutigen Sequenzanforderungen. Eine aufeinanderfolgende Sequenzdeletion unter Verwendung von PE würde die parallele Aufzeichnung von paarweisen Ereignissen in einzelnen Zellen ermöglichen, da keine spezifischen Sequenzdeterminanten erforderlich sind. Dies würde es Forschern ermöglichen, paarweise Signalisierungsereignisse in einer gemultiplexten Weise innerhalb einer beliebigen interessierenden Target-Zelle zu untersuchen. Die folgenden Sequenzen entsprechen den SEQ ID NOs: 746, 747 und 748.
  • Beispielhafte DNA-Target-Sequenz CGTATCGGTAACTGATCCGATGGAAAGCCAGTTCAGAACCG
    Target-Sequenz nach Edit Nr. 1 (Deletion von AAA) CGTATCGGTAACTGATCCGATGGGCCAGTTCAGAACCG
  • Target-Sequenz nach Edit Nr. 2 (Deletion von GCC) CGTATCGGTAACTGATCCGATGGAGTTCAGAACCG
  • Die Sequenzinsertion ist ein dritter Ansatz zur Verfolgung von zellulären Signalisierungsereignissen. Einige Varianten dieser Strategie sind weniger PEgRNAabhängig als Mutagenese oder Deletion. Es gibt eine Reihe verschiedener Insertionsstrategien - Insertion kurzer Sequenzen, Insertion von Protospacern, Insertion eines Protospacers und eines Barcodes Insertion neuer Homologiesequenzen und Insertion von Homologiesequenzen mit einem Barcode.
  • Die Insertion kurzer repetitiver Sequenzen ist eine Möglichkeit, die Größe einer Target-Sequenz inkrementell zu erhöhen, um den Ablauf der Zeit in einer Zelle zu messen. In diesem System kann eine Insertion von 5 oder mehr Nukleotiden einer sich wiederholenden Sequenz eine wiederholte Expansion in Verbindung mit entweder dem Ablauf der Zeit oder der fortgesetzten Anwesenheit eines vorbestimmten Stimulus hervorrufen. Der Locus-unabhängige Charakter von Lineage-PE-Linie ermöglicht wiederum eine parallele Verfolgung mehrerer eindeutiger Sequenzexpansionen in Verbindung mit diskreten biologischen Signalen. Dies sollte es ermöglichen, die Intensität mehrerer biologischer Signale über die Zellzeit in einzelnen Zellen zu messen. Die folgenden Sequenzen entsprechen den SEQ ID NOs: 749, 750 und 751.
    Beispielhafte Target-DNA- Sequenz
    genomische Sequenz- CGTATCGTATCGTATCGTATTGG-genomische Sequenz
    Target-Sequenz nach Edit Nr. 1 (Einbau von OGTAT)
    genomische Sequenz-CGTATCGTATCGTArCGTATCGTATTGG-genomische Sequenz
  • Target-Sequenz nach Edit Nr. 2 (Einbau von CGTAT)
    genomische Sequenz- CGTATCGTATCGTATCGTATCGTATOGTATTGG -genomische Sequenz
  • Eine Insertion verschiedener kurzer Sequenzen würde eine Handvoll PEgRNAs in ähnlicher Weise wie im Deletionsraum erfordern. Die Anzahl der aufgezeichneten Signale und die Größe der inserierten Sequenz würden die Anzahl der erforderlichen Kombinationen von PEgRNAs bestimmen. Eine Herausforderung bei der Aufzeichnung mehrerer Sequenzen in diesem System wäre die unterschiedliche Effizienz jeder PEgRNA beim Inserieren ihrer Cargo-Sequenz.
  • Eine Insertion von Protospacern als Indikatoren zellulärer Signale ist verlockend, wenngleich technische Herausforderungen die Effizienz dieses Ansatzes beeinträchtigen können. Die Verwendung einzelner PEgRNA-Systeme wird eine Herausforderung sein, da PEgRNA-Kassetten selbst Substrate wären, die Insertionen in die PEgRNA hervorrufen würden, welche die Effizienz und Genauigkeit aufeinanderfolgender Edits beeinträchtigen. Das gleiche Problem besteht bei zwei oder drei PEgRNA-Systemen, da jeder Guide ein Substrat für einen anderen ist, was eine Insertion anderer Sequenzen in die Guide-Kassette selbst ermöglicht, was zu einer unangemessenen Insertion von Protospacer-Sequenzen in Verbindung mit dem falschen Signal führen könnte. Diese Protospacer-Insertionssysteme sind auch mit der Einbeziehung von Barcode-Sequenzen schwer vorstellbar. Einzelne PEgRNA-Barcode-Systeme würden einfach die verwendeten Barcodes überschreiben und die bei dem ersten Edit gespeicherten Daten entfernen. Mehrfach-Guide-Systeme leiden wiederum unter Insertionen in andere PEgRNA-Expressionskonstrukte, was ihren Nutzen (insbesondere in vivo) einschränkt. Die folgenden Sequenzen entsprechen den SEQ ID NOs: 752, 752, 753, 754, 754, 755 und 756.
    Figure DE112020001339T5_0364
  • Eine Insertion von Homologiesequenzen (d.h. Sequenzen 3' vom Ort des Cas9-Nicks) und insbesondere Homologiesequenzen mit assoziierten Barcodes scheinen besonders nützliche Lineage-PE-Strategien zu sein. Dieses System vermeidet die mit der Protospacer-Insertion verbundenen Probleme, indem sichergestellt wird, dass aufeinanderfolgende Editing-Runden zur Insertion eines Barcodes aus einer PEgRNA-Kassette führen, die nicht durch andere PEgRNA-Editing-Ereignisse in derselben Zelle modifiziert werden kann. Das Barcoding-System ist nützlich, da mehrere Barcodes mit einem gegebenen Stimulus assoziiert sein können. Dieses System bewahrt den Großteil des Target-Protospacers, ändert jedoch die Seed-Sequenz, PAM und stromabwärts benachbarte Nukleotide. Dies ermöglicht es, dass mehrere Signale mit einem Editing-Locus verbunden sind, ohne dass die verwendeten PEgRNAs signifikant umgestaltet werden müssen. Diese Strategie würde eine Multiplex-Barcode-Insertion als Reaktion auf eine große Anzahl zellulärer Stimuli (entweder intern oder extern) an einem einzigen Locus ermöglichen. Es könnte ein Aufzeichnen von Intensität, Dauer und Reihenfolge von so vielen Signalen ermöglichen, wie es eindeutige Barcodes gibt (die mit mehreren N Nukleotiden ausgelegt sein können, um 4^N möglich Barcodes zu erzeugen, d.h. ein 5-nt Barcode würde es ermöglichen, von 4^5 oder 1024 eindeutige Signale auf einmal aufzunehmen). Dieses System könnte sowohl in vitro als auch in vivo verwendet werden.
  • In Beispiel 13 zitierte Literaturstellen
  • Jede der folgenden Literaturstellen ist hier durch Bezugnahme aufgenommen.
    1. 1. Recording development with single cell dynamic lineage tracing. Aaron McKenna, James A. Gagnon.
    2. 2. Whole-organism lineage tracing by combinatorial and cumulative genome editing.Mckenna et al. Science. 2016 Jul 29;353(6298):aaf7907. doi10.1 126/science.aaf7907. Epub 2016 May 26.
    3. 3. Molecular recording of mammalian embryogenesis. Chan et al. 2019. Nature. Jun;570(7759):77-82. doi: 10. 1038/s41586-019-1184-5. Epub 2019 May 13.
  • BEISPIEL 14 - MODULIERENDE BIOMOLEKÜLAKTIVITÄT UND/ODER LOKALISIERUNG DURCH PE
  • Die subzelluläre Lokalisation und die Modifikationszustände von Biomolekülen regulieren ihre Aktivitäten. Konkrete biologische Funktionen wie Transkriptionskontrolle, Zellstoffwechsel und Signaltransduktionskaskaden werden alle sorgfältig an bestimmten Orten innerhalb der Zelle orchestriert. Von daher stellt die Modulation der zellulären Lokalisation und der Modifikationszustände von Proteinen eine potenzielle therapeutische Strategie zur Behandlung von Krankheiten dar. Einige der verfügbaren Therapeutika wurden entwickelt, um die Lokalisierung von Target-Proteinen zu verändern. Farnesylierungsinhibitoren sind beispielsweise dazu ausgelegt, eine Lipidierung und Membran-Targeting wichtiger onkogener Proteine wie KRAS zu verhindern. Ebenso leitet die durch kleine Moleküle induzierte Ubiquitinierung von Target-Proteinen diese zum Abbau an das Proteasom. Die Fähigkeit, Proteine zu diesen und anderen eindeutigen Zellkompartimenten zu lenken, bietet eine Möglichkeit, eine Reihe biologischer Prozesse zu ändern. Es wird hier vorgeschlagen, Prime Editing (PE) zum Einbauen einer genetisch codierten Handhabe zum Ändern des Modifikationszustands und des subzellulären Traffickings von Biomolekülen mit einem genetisch codierten Signal (z.B. Proteine, Lipide, Zucker und Nukleinsäuren) für therapeutische Zwecke zu verwenden.
  • PE ist eine Genom-Editing-Technologie, welche den Einbau, die Deletion oder den Ersatz kurzer DNA-Sequenzen in jedem genomischen Locus ermöglicht, auf den mit einem Cas9-Enzym abgezielt werden kann. Mit dieser Technologie könnte man prinzipiell wichtige DNA-, RNA- oder Protein-codierende Sequenzen einbauen oder entfernen, welche die Aktivitäten dieser wichtigen Biomoleküle ändern. Genauer gesagt könnte Prime Editing verwendet werden, um Motive oder Signale einzubauen, welche die Lokalisierungs- oder Modifikationseigenschaften von Biomolekülen ändern. Einige Beispiele umfassen Modifikationen an: Protein-Aminosäuresequenzen; Motiven für posttranslationale Modifikationen; RNA-Motiven, welche die Faltung oder Lokalisierung ändern; und dem Einbau von DNA-Sequenzen, die den lokalen Chromatinzustand oder die Architektur der umgebenden DNA ändern.
  • Ein Target-Biomolekül für eine PE-vermittelte Modifikation ist DNA. DNA-Modifikationen könnten vorgenommen werden, um eine Reihe von DNA-Sequenzen einzubauen, welche die Zugänglichkeit des Target-Locus ändern. Die Zugänglichkeit von Chromatin kontrolliert den Output der Gentranskription. Der Einbau von Markierungen zur Rekrutierung von Chromatin-kompaktierenden Enzymen sollte den Transkriptions-Output benachbarter Gene verringern, während der Einbau von Sequenzen, die mit einer Chromatin-Öffnung assoziiert sind, Bereiche leichter zugänglich machen und dadurch die Transkription verstärken sollte. Ein Einbau komplexerer Sequenzmotive, die native regulatorische Sequenzen widerspiegeln, sollte eine nuanciertere und biologisch empfindlichere Kontrolle als die derzeit verfügbaren dCas9-Fusionen für verschiedene epigenetische Reader-, Writer- oder Eraser-Enzyme bieten - Werkzeuge, die typischerweise eine große Anzahl einer einzigen Art von Markierung einbauen, die möglicherweise keinen speziellen biologischen Vorläufer haben. Ein Einbau von Sequenzen, die zwei Loci in enge Nachbarschaft bringen oder Loci mit der Kernmembran in Kontakt bringen, sollte ebenfalls den Transkriptions-Output dieser Loci ändern, wie auf dem aufstrebenden Gebiet der 3D-Genomarchitektur aufgezeigt wurde.
  • Modifikationen an RNAs können auch vorgenommen werden, um ihre Aktivität zu ändern, indem ihre zelluläre Lokalisierung, Interaktionspartner, Strukturdynamik oder Thermodynamik der Faltung geändert wird. Ein Einbau von Motiven, die Translationspausen oder Frameshifting hervorrufen, könnte die Häufigkeit von mRNA-Spezies durch verschiedene mRNA-Prozessierungsmechanismen ändern. Ein Modifizieren von Konsensus-Spleißsequenzen würde ebenfalls die Häufigkeit und Prävalenz verschiedener RNA-Spezies ändern. Eine Änderung des relativen Verhältnisses verschiedener Spleißisoformen würde vorhersagbar zu einer Änderung des Verhältnisses der Proteintranslationsprodukte führen, und dies könnte verwendet werden, um viele biologische Signalwege zu ändern. Zum Beispiel würde eine Verschiebung des Verhältnisses von mitochondrialen zu nuklearen DNA-Reparaturproteinen die Widerstandsfähigkeit verschiedener Krebsarten gegenüber chemotherapeutischen Reagenzien ändern. Darüber hinaus könnten RNAs mit Sequenzen modifiziert werden, die eine Bindung an neue Protein-Targets ermöglichen. Es wurde eine Reihe von RNA-Aptameren entwickelt, die mit hoher Affinität an zelluläre Proteine binden. Ein Einbau eines dieser Aptamere könnte verwendet werden, um entweder verschiedene RNA-Spezies durch Bindung an ein Protein-Target zu sequestrieren, das ihre Translation oder biologische Aktivität verhindert, oder um RNA-Spezies in bestimmte subzelluläre Kompartimente zu bringen. Der Abbau von Biomolekülen ist eine weitere Klasse der Lokalisierungsmodifikation. Beispielsweise wird eine RNA-Methylierung verwendet, um RNAs innerhalb der Zelle zu regulieren. Konsensmotive für eine Methylierung könnten mit PE in Target-RNA-Codiersequenzen eingeführt werden. RNAs könnten auch modifiziert werden, um Sequenzen einzuschließen, die eine Nonsense-vermittelte Decay-Maschinerie oder andere Nukleinsäure-Stoffwechselwege zum Abbau der Target-RNA-Spezies steuern, die den RNA-Pool in einer Zelle ändern würden. Darüber hinaus könnten RNA-Spezies modifiziert werden, um ihren Aggregationszustand zu ändern. Sequenzen könnten in einzelne interessierende RNAs oder mehrere RNAs eingebaut werden, um RNA-Tangles zu erzeugen, die sie zu unwirksamen Substraten für eine Translation oder Signalisierung machen würden.
  • Modifikationen an Proteinen durch posttranslationale Modifikation (PTM) stellen ebenfalls eine wichtige Klasse der Bearbeitung von Biomolekülen dar, die mit PE durchgeführt werden kann. Wie bei RNA-Spezies ist das Ändern der Proteinhäufigkeit in einer Zelle eine wichtige Fähigkeit von PE. Ein Editieren kann durchgeführt werden, um Stopcodons in einen offenen Leserahmen einzubauen - dadurch wird die Produktion des Produkts voller Länge durch die editierte DNA-Sequenz verhindert. Alternativ können Peptidmotive eingebaut werden, die bewirken, dass die Rate des Proteinabbaus für ein Target-Protein geändert wird. Ein Einbau von Abbau-Tags in einen Genkörper könnte verwendet werden, um die Häufigkeit eines Proteins in einer Zelle zu ändern. Darüber hinaus könnte die Einführung von Degronen, die durch kleine Moleküle induziert werden, eine zeitliche Kontrolle über den Proteinabbau ermöglichen. Dies könnte sowohl für die Forschung als auch für die Therapie wichtige Auswirkungen haben, da Forscher ohne Weiteres beurteilen könnten, ob ein durch kleine Moleküle vermittelter therapeutischer Proteinabbau eines bestimmten Targets eine praktikable therapeutische Strategie ist. Proteinmotive könnten auch eingebaut werden, um die subzelluläre Lokalisation eines Proteins zu ändern. Aminosäuremotive können eingebaut werden, um Proteine bevorzugt zu einer Reihe von subzellulären Kompartimenten zu lenken, einschließlich des Zellkerns, der Mitochondrien, der Zellmembran, des Peroxisoms, des Lysosoms, des Proteasoms, des Exosoms und anderer.
  • Ein Einbauen oder Zerstören von durch die PTM-Maschinerie modifizierten Motiven kann posttranslationale Proteinmodifikationen ändern. Phosphorylierung, Ubiquitylierung, Glykosylierung, Lipidierung (z.B. Farnesylierung, Myristoylierung, Palmitoylierung, Prenylierung, GPI-Anker), Hydroxylierung, Methylierung, Acetylierung, Crotonylierung, SUMOylierung, Disulfidbindungsbildung, Seitenkettebindung-Spaltereignisse, Polypeptidrückgrat-spaltereignisse (Proteolyse) und eine Reihe anderer Protein-PTMs wurden identifiziert. Diese PTMs ändern die Proteinfunktion, häufig durch eine Änderung der subzellulären Lokalisation. Tatsächlich aktivieren Kinasen oft nachgeschaltete Signalkaskaden über Phosphorylierungsereignisse. Eine Entfernung des Target-Phosphosits würde eine Signaltransduktion verhindern. Die Fähigkeit, ein beliebiges PTM-Motiv ortsspezifisch zu entfernen oder einzubauen, während die Expression eines Proteins voller Länge beibehalten wird, wäre ein wichtiger Fortschritt sowohl für die Grundlagenforschung als auch für die Therapeutik. Der Sequenzeinbau-Anwendungsbereich und das Target-Fenster von PE zeigen dessen Eignung für einen breiten PTM-Modifikationsraum.
  • Eine Entfernung von Lipidierungsstellen sollte die Leitung von Proteinen zu Zellmembranen verhindern. Eine wesentliche Einschränkung gegenwärtiger Therapeutika, die auf posttranslationale Modifikationsprozesse abzielen, ist ihre Spezifität. Farnesyltransferase-Inhibitoren wurden ausgiebig auf ihre Fähigkeit getestet, die KRAS-Lokalisierung an Zellmembranen zu beseitigen. Leider geht die globale Hemmung der Farnesylierung mit zahlreichen Off-Target-Effekten einher, die eine breite Anwendung dieser kleinen Moleküle verhindert haben. In ähnlicher Weise kann eine spezifische Hemmung von Proteinkinasen mit kleinen Molekülen aufgrund der Größe des menschlichen Genoms und der Ähnlichkeiten zwischen verschiedenen Kinasen sehr schwierig sein. PE bietet eine mögliche Lösung für dieses Spezifitätsproblem, da es eine Hemmung der Modifikation des Target-Proteins durch Entfernung der Modifikationsstelle anstelle einer globalen Enzymhemmung ermöglicht. Beispielsweise wäre eine Entfernung des lapidierten Peptidmotivs in KRAS ein zielgerichteter Ansatz, der anstelle der Farnesyltransferase-Hemmung verwendet werden könnte. Dieser Ansatz ist die funktionelle Umkehrung der Hemmung einer Target-Proteinaktivität durch Einbauen eines Lipid-Targeting-Motivs auf einem Protein, das nicht für eine Membranbindung ausgelegt ist.
  • PE kann auch verwendet werden, um Protein-Protein-Komplexierungsereignisse auszulösen. Proteine entfalten ihre Funktion oft innerhalb von Komplexen, um ihre biologische Aktivität auszuführen. PE kann verwendet werden, um die Fähigkeit von Proteinen, innerhalb dieser Komplexe zu existieren, entweder zu erzeugen oder zu zerstören. Um Komplexbildungsereignisse zu beseitigen, könnten Aminosäuresubstitutionen oder -insertionen entlang der Protein:Protein-Schnittstelle eingebaut werden, um einer Komplexierung entgegenzuwirken. SSX18 ist eine Proteinkomponente des BAF-Komplexes, eines wichtigen Histon-Remodeling-Komplexes. Mutationen in SSX18 führen zu Synovialsarkomen. PE könnte verwendet werden, um Seitenketten zu installieren, die verhindern, dass SSX18 an seine Proteinpartner im Komplex bindet, um seine onkogene Aktivität zu verhindern. PE könnte auch verwendet werden, um die pathogenen Mutationen zu entfernen, um die WT-Aktivität dieses Proteins wiederherzustellen. Alternativ könnte PE verwendet werden, um Proteine entweder in ihrem nativen Komplex zu halten oder sie dazu zu bewegen, an Interaktionen teilzunehmen, die nicht mit ihrer nativen Aktivität zusammenhängen, um ihre Aktivität zu hemmen. Die Bildung von Komplexen, die einen Interaktionszustand gegenüber einem anderen aufrechterhalten, könnte eine wichtige therapeutische Modalität darstellen. Ein Ändern von Protein:Protein-Schnittstellen, um die Kd der Interaktion zu verringern, würden diese Proteine länger aneinander haften lassen. Proteinkomplexe können mehrere Signalisierungskomplexe haben, wie n-myc, das Neuroblastom-Signalisierungskaskaden bei Krankheiten antreibt, aber ansonsten an einer gesunden Transkriptionskontrolle in anderen Zellen beteiligt ist. PE könnte verwendet werden, um Mutationen einzubauen, welche eine Assoziation von n-myc mit gesunden Interaktionspartnern vorantreiben und dessen Affinität für onkogene Interaktionspartner verringern.
  • In Beispiel 14 zitierte Literaturstellen
  • Jede der folgenden Literaturstellen ist hier durch Bezugnahme aufgenommen.
    1. 1. Selective Target Protein Degradation via Phthalimide Conjugation. Winter et al. Science. Author manuscript; available in PMC 2016 Jul 8.
    2. 2. Reversible disruption of mSWI/SNF (BAF) complexes by the SS18-SSX oncogenic fusion in synovia) sarcoma. Kadoch and Crabtree. Cell. 2013 Mar 28;153(1):71-85. doi: 10.1016/j.cell.2013.02.036.
    3. 3. Ribosomal frameshifting and transcriptional slippage: From genetic steganography and cryptography to adventitious use. Atkins et al. Nucleic Acids Research, Volume 44, Issue 15, 6 September 2016, Pages 7007-7078.
    4. 4. Transcriptional Regulation and its Misregulation in Discase. Lee and Young. Cell. Author manuscript; available in PMC 2014 Mar 14.
    5. 5. Protein localization in disease and therapy. Mien-Chie Hung, Wolfgang Link Journal of Cell Science 2011 124: 3381-3392.
    6. 6. Loss of post-translational modification sites in disease. Li et al. Pac Symp Biocomput. 2010:337-47. PTMD: A Database of Human Disease-associated Post-translational Modifications. Xu et al. Genomics Proteomics Bioinformatics. 2018 Aug;16(4):244-251. Epub 2018 Sep 21.
    7. 7. Post-transcriptional gene regulation by mRNA modifications. Zhao et al. Nature Reviews Molecular Cell Biology volume 18, pages31-42 (2017).
  • BEISPIEL 15 - DESIGN UND TECHNISCHE ENTWICKLUNG VON PEgRNAS
  • Hier wird eine Reihe von PEgRNA-Designs und -Strategien beschrieben, welche die Effizienz des Prime Editings (PE) verbessern können.
  • Prime Editing (PE) ist eine Genom-Editing-Technologie, die definierte DNA-Sequenzen innerhalb eines anvisierten genetischen Locus ersetzen, inserieren oder entfernen kann, indem Informationen verwendet werden, die in einer Prime Editing-Guide-RNA (PEgRNA) codiert sind. Prime Editors (PEs) bestehen aus einem Sequenzprogrammierbaren DNA-Bindungsprotein mit Nukleaseaktivität (Cas9), das mit einem Reverse-Transkriptase-(RT)-Enzym fusioniert ist. PEs bilden Komplexe mit PEgRNAs, welche die Informationen für ein Targeting bestimmter DNA-Loci innerhalb ihrer Spacer-Sequenzen sowie Informationen zur Festlegung des gewünschten Edits in einer technisch entwickelten Erweiterung enthalten, die in ein Standard-sgRNA-Gerüst eingebaut ist. PE:PEgRNA-Komplexe binden und nicken den programmierten Target-DNA-Locus, wodurch eine Hybridisierung des genickten DNA-Strangs an die technisch entwickelte Primer-Bindungssequenz (PBS) der PEgRNA ermöglicht wird. Die Reverse-Transkriptase-Domäne kopiert dann die Edit-codierenden Informationen innerhalb des RT-Template-Abschnitts der PEgRNA, wobei die genickte genomische DNA als Primer für die DNA-Polymerisation verwendet wird. Nachfolgende DNA-Reparaturprozesse integrieren den neu synthetisierten, editierten DNA-Strang in den genomischen Locus. Wenngleich die Vielseitigkeit des Prime Editings als Forschungswerkzeug und potenzielles Therapeutikum vielversprechend ist, bestehen aufgrund des für ein Editing erforderlichen mehrstufigen Prozesses mehrere Einschränkungen in Bezug auf Effizienz und Anwendungsbereich. Beispielsweise können ungünstige RNA-Strukturen, die sich innerhalb der PEgRNA bilden, das Kopieren von DNA-Edits von der PEgRNA zum genomischen Locus hemmen. Ein möglicher Weg zur Verbesserung der PE-Technologie ist die Neugestaltung und technische Entwicklung der kritischen PEgRNA-Komponente. Verbesserungen am Design dieser PEgRNAs sind wahrscheinlich notwendig, um die PE-Effizienz zu verbessern und den Einbau längerer inserierter Sequenzen in das Genom zu ermöglichen.
  • Hier wird eine Reihe von PEgRNA-Designs beschrieben, welche die Wirksamkeit von PE verbessern sollten. Diese Designs nutzen eine Reihe von zuvor veröffentlichten Ansätzen zur Verbesserung der Wirksamkeit und/oder Stabilität von sgRNA und machen Gebrauch von einer Reihe neuer Strategien. Diese Verbesserungen können einer oder mehreren von verschiedenen Kategorien angehören:
    1. (1) Längere PEgRNAs. Diese Kategorie bezieht sich auf verbesserte Designs, die eine effiziente Expression funktioneller PEgRNAs von Nicht-Polymerase III(pol III)-Promotoren ermöglichen, was die Expression längerer PEgRNAs ohne lästige Sequenzanforderungen ermöglichen würde;
    2. (2) Kernverbesserungen. Diese Kategorie bezieht sich auf Verbesserungen am Kern, dem Cas9-bindenden PEgRNA-Gerüst, was die Wirksamkeit verbessern könnte;
    3. (3) RT-Prozessivität. Diese Kategorie bezieht sich auf Modifikationen an der PEgRNA, welche die RT-Prozessivität verbessern und die Insertion längerer Sequenzen an anvisierten genomischen Loci ermöglichen; und
    4. (4) Terminus-Motive. Diese Kategorie bezieht sich auf das Hinzufügen von RNA-Motiven an die 5'- und/oder 3'-Termini der PEgRNA, welche die PEgRNA-Stabilität verbessern, die RT-Prozessivität verstärken, eine Fehlfaltung der PEgRNA verhindern oder zusätzliche Faktoren rekrutieren, die für ein Genom-Editing wichtig sind.
  • Hier werden eine Reihe potenzieller solcher PEgRNA-Designs in jeder Kategorie beschrieben. Mehrere dieser Designs wurden zuvor zur Verbesserung der sgRNA-Aktivität mit Cas9 beschrieben und sind als solche angegeben. Hier ist auch eine Plattform für die Evolution von PEgRNAs für bestimmte Sequenz-Targets beschrieben, die das Aufpolieren des PEgRNA-Gerüsts ermöglichen und die PE-Aktivität verstärken würde (5). Bemerkenswerterweise könnten diese Designs auch ohne Weiteres angewendet werden, um PEgRNAs zu verbessern, die von irgendeiner Cas9 oder einer weiterentwickelten Variante davon erkannt werden.
  • (1) Längere PEgRNAs.
  • sgRNAs werden typischerweise von dem U6-snRNA-Promotor exprimiert. Dieser Promotor rekrutiert pol III, um die assoziierte RNA zu exprimieren, und ist für die Expression von kurzen RNAs nützlich, die im Kern zurückgehalten werden. Pol III ist jedoch nicht sonderlich prozessiv und ist nicht in der Lage, RNAs, die länger als einige hundert Nukleotide sind, in den Niveaus zu exprimieren, die für ein effizientes Genom-Editing erforderlich sind183. Darüber hinaus kann pol III an Abschnitten von mehreren Us anhalten oder terminieren, was möglicherweise die Sequenzdiversität begrenzt, die unter Verwendung einer PEgRNA inseriert werden könnte. Andere Promotoren, die Polymerase II (wie etwa pCMV) oder Polymerase I (wie etwa der U1-snRNA-Promotor) rekrutieren, wurden auf ihre Fähigkeit untersucht, längere sgRNAs zu exprimieren183. Diese Promotoren werden jedoch typischerweise teilweise transkribiert, was zu einer zusätzlichen Sequenz 5' des Spacers in der exprimierten PEgRNA führt, was nachweislich zu einer deutlich reduzierten Cas9:sgRNA-Aktivität in ortsabhängiger Weise führt. Während pol III-transkribierte PEgRNAs einfach an einem Abschnitt von 6-7 U terminieren können, würden PEgRNAs, die von pol II oder pol I transkribiert wurden, zusätzlich ein anderes Terminationssignal erfordern. Häufig führen solche Signale auch zu einer Polyadenylierung, die zu einem unerwünschten Transport der PEgRNA aus dem Zellkern führen würde. In ähnlicher Weise sind RNAs, die von pol II-Promotoren wie pCMV exprimiert werden, typischerweise 5'-verkappt, was ebenfalls zu ihrem Transport aus dem Kern führt.
  • Rinn und Mitarbeiter untersuchten bereits eine Vielfalt von Expressionsplattformen für die Produktion von sgRNAs, die mit langer nichtcodierender RNA (IncRNA) markiert sind183. Diese Plattformen beinhalten RNAs, die von pCMV exprimiert werden und die im ENE-Element von der MALAT1-ncRNA von Menschen184, dem PAN-ENE-Element von KSHV185 oder der 3'-Box von U1-snRNA186 terminieren. Bemerkenswerterweise bilden die MALAT1-ncRNA und PAN-ENEs Triple-Helices, die den PolyA-Schwanz schützen184,187. Es wird erwartet, dass diese Konstrukte zusätzlich zur Ermöglichung einer Expression von RNAs auch die RNA-Stabilität erhöhen könnten (siehe Abschnitt iv). Eine Verwendung des Promotors der U1-snRNA zur Ermöglichung einer Expression dieser längeren sgRNAs183 wurde ebenfalls untersucht. Es wird erwartet, dass diese Expressionssysteme auch die Expression längerer PEgRNAs ermöglichen. Darüber hinaus wurde eine Reihe von Verfahren für die Spaltung des Teils des pol II-Promotors entwickelt, der als Teil der PEgRNA transkribiert wird, wobei entweder ein selbstspaltendes Ribozym wie die Ribozyme Hammerhead188, Pistol189, Hatchet189, Hairpin90, VS191, Twister192 oder Twister-Sister192 oder andere selbstspaltende Elemente zur Prozessierung des transkribierten Guides, oder eine Haarnadel, die von Csy4193 erkannt wird und auch zur Prozessierung des Guides führt, hinzugefügt wird. Es wird auch vermutet, dass eine Aufnahme mehrerer ENE-Motive zu einer verbesserten PEgRNA-Expression und -Stabilität führen könnte, wie zuvor für KSHV PAN-RNA und - Element185 gezeigt wurde. Es wird auch erwartet, dass eine Zirkularisierung der PEgRNA in Form einer zirkulären intronischen RNA (ciRNA) auch zu einer verstärkten RNA-Expression und -Stabilität sowie zu einer Kernlokalisation führen könnte194.
  • PEgRNA-Expressionsplattform bestehend aus pCMV, Csy4-Hairpin, der PEgRNA und
    MALAT1 ENE
    Figure DE112020001339T5_0365
  • PEgRNA-Expressionsplattform bestehend aus pCMV, Csy4-Hairpin, der PEgRNA und PAN ENE
    Figure DE112020001339T5_0366
  • PEgRNA-Expressionsplattform bestehend aus pCMV, Csy4-Hairpin, der PEgRNA und 3xPAN ENE
    Figure DE112020001339T5_0367
  • PEgRNA-Expressionsplattform bestehend aus pCMV, Csy4-Hairpin, der PEgRNA und 3'-Box
    Figure DE112020001339T5_0368
  • PEgRNA-Expressionsplattform bestehend aus pUl, Csy4-Hairpin, der PEgRNA und 3'-Box
    Figure DE112020001339T5_0369
  • (2) Kernverbesserungen.
  • Der Kern, das Cas9-bindende PEgRNA-Gerüst, kann wahrscheinlich verbessert werden, um die PE-Aktivität zu verstärken. Mehrere solcher Ansätze wurden bereits aufgezeigt. Zum Beispiel enthält das erste Paarungselement des Gerüsts (P1) ein GTTTT-AAAAC-Paarungselement. Es wurde gezeigt, dass solche Abschnitte von Ts zu einer pol III-Pausierung und einer vorzeitigen Termination des RNA-Transkripts führen. Es wurde gezeigt, dass eine rationale Mutation eines der TA-Paare zu einem GC-Paar in diesem Teil von P1 die sgRNA-Aktivität erhöht, was nahelegt, dass dieser Ansatz auch für PEgRNAs möglich wäre195. Darüber hinaus wurde auch gezeigt, dass eine Erhöhung der Länge von P1 die sgRNA-Faltung verstärkt und zu einer verbesserten Aktivität führt195, was nahelegt, dass dies ein weiterer Weg zur Verbesserung der PEgRNA-Aktivität ist. Schließlich ist es wahrscheinlich, dass auch das Aufpolieren des PEgRNA-Gerüsts durch gerichtete Evolution von PEgRNAs auf einem bestimmten DNA-Target zu einer verbesserten Aktivität führen würde. Dies wird in Abschnitt (v) beschrieben.
  • PEgRNA enthaltend eine 6 nt Extension zu P1
    Figure DE112020001339T5_0370
  • PEgRNA enthaltend eine T-A-zu-G-C-Mutation innerhalb von P1
    Figure DE112020001339T5_0371
  • (iii) Verbesserung der RT-Prozessivität durch Modifikationen am Template-Bereich der PEgRNA
  • Mit zunehmender Größe der von der PEgRNA templatierten Insertion wird es wahrscheinlicher, dass sie durch Endonukleasen abgebaut wird, einer spontanen Hydrolyse unterliegt oder sich in Sekundärstrukturen faltet, die von der RT nicht revers transkribiert werden können oder welche eine Faltung des PEgRNA-Gerüsts und anschließende Cas9-RT-Bindung stören. Dementsprechend ist es wahrscheinlich, dass eine Modifikation am Template der PEgRNA erforderlich sein könnte, um einen Einfluss auf umfangreiche Insertionen, wie etwa die Insertion ganzer Gene, zu haben. Einige Strategien dazu beinhalten die Aufnahme modifizierter Nukleotide in einer synthetischen oder halbsynthetischen PEgRNA, welche die RNA resistenter gegen Abbau oder Hydrolyse machen oder weniger wahrscheinlich, inhibitorische Sekundärstrukturen anzunehmen196. Solche Modifikationen könnten 8-Aza-7-deazaguanosin beinhalten, das eine RNA-Sekundärstruktur in G-reichen Sequenzen reduzieren würde; Locked-Nukleinsäuren (LNA), die einen Abbau reduzieren und bestimmte Arten von RNA-Sekundärstrukturen verbessern; 2'-O-Methyl-, 2'-Fluor- oder 2'-O-Methoxyethoxy-Modifikationen, welche die RNA-Stabilität erhöhen. Solche Modifikationen könnten auch an anderer Stelle in die PEgRNA aufgenommen werden, um die Stabilität und Aktivität zu verstärken. Alternativ oder zusätzlich könnte das Template der PEgRNA so ausgelegt werden, dass es sowohl für ein gewünschtes Proteinprodukt codiert als auch eher einfache Sekundärstrukturen annimmt, die durch die RT entfaltet werden können. Solche einfachen Strukturen würden als thermodynamische Senke wirken, was es weniger wahrscheinlich macht, dass kompliziertere Strukturen auftreten, die eine reverse Transkription verhindern würden. Schließlich könnte man sich auch vorstellen, das Template in zwei separate PEgRNAs aufzuspalten. Bei einem solchen Design würde ein PE verwendet, um eine Transkription zu initiieren und auch eine separate Template-RNA über ein RNA-Bindungsprotein, das mit Cas9 fusioniert ist, oder ein RNA-Erkennungselement auf der PEgRNA selbst, wie das MS2-Aptamer, an die Target-Stelle zu rekrutieren. Die RT könnte entweder direkt an diese separate Template-RNA binden oder die reverse Transkription auf der ursprünglichen PEgRNA initiieren, bevor sie zum zweiten Template übergeht. Ein solcher Ansatz könnte lange Insertionen ermöglichen, indem er sowohl eine Fehlfaltung der PEgRNA bei Zusatz des langen Templates verhindert als auch keine Dissoziation von Cas9 vom Genom für lange Insertionen erfordert, was möglicherweise PE-basierte lange Insertionen hemmen könnte.
  • (iv) Einbau zusätzlicher RNA-Motive an den 5'- oder 3'-Termini
  • PEgRNA-Designs könnten auch durch den Einbau zusätzlicher Motive an beiden Enden des RNA-Terminus verbessert werden. Mehrere solcher Motive - wie PAN ENE von KSHV und ENE von MALAT1 wurden bereits in Teil (i)184-185 als mögliches Mittel erörtert, um die Expression längerer PEgRNAs von nicht-pol III-Promotoren zu beenden. Diese Elemente bilden RNA-Triple-Helices, die den polyA-Schwanz umhüllen, was dazu führt, dass sie im Zellkern zurückgehalten werden184, 187. Durch die Bildung komplexer Strukturen am 3'-Terminus der PEgRNA, die das terminale Nukleotid verdecken, würden diese Strukturen jedoch wahrscheinlich auch dazu beitragen, den Exonukleasevermittelten Abbau von PEgRNAs zu verhindern. Andere am 3'-Terminus inserierte Strukturelemente könnten ebenfalls die RNA-Stabilität erhöhen, wenn auch ohne eine Termination durch Nicht-Pol III-Promotoren zu ermöglichen. Solche Motive könnten Haarnadeln oder RNA-Quadruplexe, die den 3'-Terminus verdecken197, oder selbstspaltende Ribozyme wie etwa HDV beinhalten, die zur Bildung eines 2'-3'-cyclischen Phosphats am 3'-Terminus führen würden und potentiell auch einen Abbau der PEgRNA durch Exonucleasen weniger wahrscheinlich machen würden198. Ein Induzieren der PEgRNA, über unvollständiges Spleißen zu zyklisieren - um eine ciRNA zu bilden, - könnte ebenfalls die PEgRNA-Stabilität erhöhen und dazu führen, dass die PEgRNA im Zellkern zurückgehalten wird194.
  • Zusätzliche RNA-Motive könnten ebenfalls die RT-Prozessivität verbessern oder die PEgRNA-Aktivität verstärken, indem sie die RT-Bindung an die DNA-RNA-Duplex verstärken. Ein Hinzufügen der nativen Sequenz, die von der RT gebunden wird, in ihrem zugehörigen retroviralen Genom, könnte die RT-Aktivität verstärken199. Dies könnte die native Primer-Bindungsstelle (PBS), den Polypurintrakt (PPT) oder Kissing Loops beinhalten, die an der retroviralen Genomdimerisierung und der Initiation der Transkription beteiligt sind199. Ein Hinzufügen von Dimerisierungsmotiven - wie etwa Kissing Loops oder eines GNRA-Tetraloop/Tetraloop-Rezeptorpaars200 - an den 5'- und 3'-Termini der PEgRNA könnte ebenfalls zu einer effektiven Zirkularisierung der PEgRNA führen, was die Stabilität verbessert. Darüber hinaus soll ein Hinzufügen dieser Motive die physikalische Trennung des PEgRNA-Spacers und des Primers ermöglichen, wodurch eine Verdeckung des Spacers verhindert wird, welche die PE-Aktivität behindern würde. Kurze 5'-Extensionen der PEgRNA, die eine kleine Toehold-Haarnadel im Spacer-Bereich bilden, könnten auch günstig mit dem Annealing-Bereich der den Spacer bindenden PEgRNA konkurrieren. Schließlich könnten Kissing Loops auch verwendet werden, um andere Template-RNAs an die Genomstelle zu rekrutieren und den Übergang der RT-Aktivität von einer RNA zur anderen zu ermöglichen (Abschnitt iii).
  • PEgRNA-HDV-Fusion
    Figure DE112020001339T5_0372
  • PEgRNA-MMLV-Kissing Loop
    Figure DE112020001339T5_0373
  • PEgRNA-VS-Ribozym-Kissing Loop
    Figure DE112020001339T5_0374
  • PEgRNA-GNRA-Tetraloop/Tetraloop-Rezeptor
    Figure DE112020001339T5_0375
  • PEgRNA-Template, das sekundäre RNA-HDV-Fusion wechselt
    Figure DE112020001339T5_0376
  • (v) Evolution von PEgRNAs
  • Es ist wahrscheinlich, dass das PEgRNA-Gerüst durch gerichtete Evolution weiter verbessert werden kann, ähnlich wie SpCas9 und Basen-Editors verbessert wurden201. Die gerichtete Evolution könnte die Erkennung von PEgRNA durch Cas9 oder weiterentwickelte Cas9-Varianten verbessern. Darüber hinaus ist es wahrscheinlich, dass verschiedene PEgRNA-Gerüstsequenzen an verschiedenen Genom-Loci optimal wären, indem sie entweder die PE-Aktivität an der entsprechenden Stelle verstärken, Off-Target-Aktivitäten reduzieren oder beides. Schließlich würde eine Evolution von PEgRNA-Gerüsten, denen andere RNA-Motive hinzugefügt wurden, mit ziemlicher Sicherheit die Aktivität der fusionierten PEgRNA im Vergleich zu der Fusions-RNA ohne Evolution verbessern. Zum Beispiel führte eine Evolution allosterischer Ribozyme, die aus c-di-GMP-I-Aptameren und Hammerhead-Ribozymen bestehen, zu einer drastisch verbesserten Aktivität202, was nehelegt, dass eine Evolution die Aktivität von Hammerhead-PEgRNA-Fusionen ebenfalls verbessern würde. Wenngleich Cas9 derzeit eine 5'-Extension der sgRNA im Allgemeinen nicht toleriert, wird eine gerichtete Evolution darüber hinaus wahrscheinlich unterstützende Mutationen erzeugen, welche diese Intoleranz mildern und einen Einsatz zusätzlicher RNA-Motive ermöglichen.
  • Wie hier beschrieben wurde eine Reihe dieser Ansätze bereits für eine Verwendung mit Cas9:sgRNA-Komplexen beschrieben, jedoch wurden keine Designs zur Verbesserung der PEgRNA-Aktivität beschrieben. Weitere Strategien für den Einbau programmierbarer Mutationen in das Genom beinhalten Basen-Editing, Homologie-gerichtete Rekombination (HDR), präzises Mikrohomologie-vermitteltes End-Joining (MMEJ) oder Transposase-vermitteltes Editing. Alle diese Ansätze haben jedoch erhebliche Nachteile im Vergleich zu PEs. Gegenwärtige Basen-Editors können, obwohl sie effizienter als bestehende PEs sind, nur bestimmte Klassen von genomischen Mutationen einbauen und können an der interessierenden Stelle zu zusätzlichen, unerwünschten Nukleotidumwandlungen führen. HDR ist nur in einer sehr kleinen Minderheit von Zelltypen möglich und führt zu vergleichsweise hohen Raten an zufälligen Insertions- und Deletionsmutationen (Indels). Präzises MMEJ kann zu einer vorhersagbaren Reparatur von Doppelstrangbrüchen führen, ist aber weitgehend auf den Einbau von Deletionen beschränkt, ist sehr ortsabhängig und kann auch vergleichsweise hohe Raten an unerwünschten Indels aufweisen. Von dem Transposase-vermitteltes Editing konnte bisher nur gezeigt werden, dass es bei Bakterien funktioniert. Daher stellen Verbesserungen am PE möglicherweise den besten Weg zur therapeutischen Korrektur einer breiten Palette genomischer Mutationen dar.
  • In Beispiel 15 zitierte Literaturstellen
  • Jede der folgenden Literaturstellen wird in Beispiel 15 zitiert, von denen jede hier durch Bezugnahme aufgenommen ist.
    1. 1. Schcchner, DM, HacisuJeyman E., Younger ST, Rinn JL. Nat Methods 664-70 (2015).
    2. 2. Brown JA. et al. Nat Struct Mol Biol 633-40 (2014).
    3. 3. Conrad NA and Steitz JA. EMBO J 1831-41 (2005).
    4. 4. Bartlett JS, et al. Proc Natl Acad Sci USA 8852-7 (1996).
    5. 5. Mitton-Fry RM. DeGregorio SJ. Wang J, Steitz TA, Steitz JA. Science 1244-7 (2010).
    6. 6. Forster AC, Symons RH. Cell. 1987.
    7. 7. Weinberg Z. Kim PB, Chen TH, Li S, Harris KA, Lünse CE, Breaker RR. Nat. Chem. Biol. 2015.
    8. 8. Feldstein PA, Buzayan JM, Brucning G. Gene 1989.
    9. 9. Saville BJ, Collins RA. Cell. 1990.
    10. 10. Roth A, Weinberg Z, Chen AG, Kim PG, Ames TD, Breaker RR. Nat Chem Biol. 2013.
    11. 11. Borchardt EK, et al. RNA 1921-30(2015).
    12. 12. Zhang Y, et al. Mol Cell 792-806 (2013).
    13. 13. Dang Y, et al. Genome Biol 280 (2015).
    14. 14. Schaefer M. Kapoor U, and Jantsch MF. Open Biol 170077 (2017).
    15. 15. Nahar S, et al. Chem Comm 2377-80 (2018).
    16. 16. Gao Y and Zhao Y. J Integr Plant Biol 343-9 (2014).
    17. 17. Dubois N, Marquet R, Paillart J, Bernacchi S. Front Microbiol 527 (2018).
    18. 18. Costa M and Michel F. EMBO J 1276-85 (1995).
    19. 19. Hu JH, et al. Nature 57-63 (2018).
    20. 20. Furukawa K, Gu H, Breaker RR. Methods Mol Biol 209-20 (2014).
  • BEISPIEL 16 - ERWEITERUNG DES TARGETING-BEREICHS VON PE UNTER VERWENDUNG VON ANDEREN DNA-BINDUNGSPROTEINEN ALS SPCAS9
  • Prime Editing (PE) unter Verwendung von Streptococcus pyogenes Cas9 (SpCas9) kann effizient alle Einzelbasensubstitutionen, Insertionen, Deletionen und Kombinationen davon an Genom-Loci einbauen, wo es ein geeignet platziertes NGG-Protospacer-Nachbarmotiv (PAM) gibt, das SpCas9 effizient binden kann. Die hier beschriebenen Verfahren erweitern die Targeting-Fähigkeit von PE durch Erweitern der zugänglichen PAMs und daher der Genom-Loci, auf die abgezielt werden kann, die für effizientes PE zugänglich sind. Prime Editors, die andere RNA-guided DNA-Bindungsproteine als SpCas9 verwenden, ermöglichen einen erweiterten Targeting-Bereich von Genom-Loci, indem sie einen Zugriff auf andere PAMs ermöglichen. Darüber hinaus ermöglicht eine Verwendung von RNA-guided DNA-Bindungsproteinen, die kleiner als SpCas9 sind, auch eine effizientere Virusabgabe. PE mit Cas-Proteinen oder anderen RNA-guided DNA-Bindungsproteinen über SpCas9 hinaus wird hocheffiziente therapeutische Edits ermöglichen, die mit SpCas9-basiertem PE entweder nicht zugänglich oder ineffizient waren.
  • Man geht davon aus, dass dies in Situationen verwendet wird, in denen SpCas9-basiertes PE entweder aufgrund eines nicht idealen Abstands eines Edits relativ zu einem NGG-PAM ineffizient ist oder die Gesamtgröße des SpCas9-basierten Konstrukts einer zellulären Expression und/oder Abgabe nicht zuträglich ist. Bestimmte krankheitsrelevante Loci wie etwa das Huntingtin-Gen, das wenige und schlecht lokalisierte NGG-PAMs für SpCas9 in der Nähe des Target-Bereichs aufweist, kann unter Verwendung verschiedener Cas-Proteine im PE-System wie etwa SpCas9-VRQR, das ein NGA-PAM erkennt, leicht anvisiert werden. Kleinere Cas-Proteine werden verwendet, um kleinere PE-Konstrukte zu erzeugen, die effizienter in AAV-Vektoren verpackt werden können, was eine bessere Abgabe an Target-Gewebe ermöglicht. 61 zeigt die praktische Umsetzung des Prime Editings unter Verwendung von Staphylococcus aureus CRISPR-Cas als das RNA-guided DNA-Bindungsprotein. NT ist eine unbehandelte Kontrolle.
  • Die 62A-62B zeigen die Bedeutung des Protospacers für einen effizienten Einbau eines gewünschten Edits an einem genauen Ort mit Prime Editing auf. Dies unterstreicht die Bedeutung alternativer PAMs und Protospacer als neue Merkmale dieser Technologie, „nd“ in 62A bedeutet „nicht nachgewiesen“.
  • 63 zeigt die praktische Umsetzung von PE unter Verwendung von SpCas9(H840A)-VRQR und SpCas9(H840A)-VRER als das RNA-guided DNA-Bindungsprotein in einem Prime Editor-System. Das SpCas9(H840A)-VRQR-napDNAbp wird hier als SEQ ID NO: 87 offenbart. Das SpCas9(H840A)-VRER-napDNAbp wird hier als SEQ ID NO: 88 offenbart. Das SpCas9(H840A)-VRER-MMLV-RT-Fusionsprotein wird hier als SEQ ID NO: 516 offenbart, wobei die MMLV-RT die D200N-, L603W-, T330P-, T306K- und W313F-Substitutionen in Bezug auf die Wildtyp-MMLV-RT umfasst. Das SpCas9(H840A)-VRQR-MMLV-RT-Fusionsprotein wird hier als SEQ ID NO: 515 offenbart, wobei die MMLV-RT die D200N-, L603W-, T330P-, T306K- und W313F-Substitutionen in Bezug auf die Wildtyp-MMLV-RT umfasst. Sieben verschiedene Loci im menschlichen Genom werden anvisiert: 4 mit dem SpCas9(H840A)-VRQR-MMLV-RT-Prime Editor-System und 3 mit dem SpCas9(H840A)-VRER-MMLV-RT-System. Die Aminosäuresequenzen der getesteten Konstrukte sind wie folgt:
    Figure DE112020001339T5_0377
    Figure DE112020001339T5_0378
    Figure DE112020001339T5_0379
  • Wie in 63 gezeigt war die SpCas9(H840A)-VRQR-MMLV-RT an PAM-Stellen betriebsfähig, die „AGAG“ und „GGAG“ beinhalteten, mit etwas Editing-Aktivität bei „GGAT“- und „AGAT“-PAM-Sequenzen. Die SpCas9(H840A)-VRER-MMLV-RT war an PAM-Stellen betriebsfähig, die „AGCG“ und „GGCG“ beinhalteten, mit etwas Editing-Aktivität bei „TGCG“.
  • Die Daten zeigen auf, dass Prime Editing unter Verwendung von napDNAbps durchgeführt werden kann, die unterschiedliche PAM-Spezifitäten aufweisen, wie etwa die hier beschriebenen Cas9-Varianten.
  • BEISPIEL 17 - EINFÜHRUNG VON REKOMBINASE-TARGET-STELLEN MIT PE
  • Dieses Beispiel beschreibt ein Verfahren, um genetische Erkrankungen anzugehen oder maßgeschneiderte Tier- oder Pflanzenmodelle zu erzeugen, indem Prime Editing (PE) verwendet wird, um Rekombinase-Target-Stellen (SSR-Target-Stellen) in Säugetier- und andere Genome mit hoher Spezifität und Effizienz einzuführen.
  • Dieses Beispiel beschreibt eine Verwendung von PE, um Rekombinase-Erkennungssequenzen an hochwertigen Loci in menschlichen oder anderen Genomen einzuführen, die nach Exposition gegenüber ortsspezifischer/ortsspezifischen Rekombinase(n) präzise und effiziente genomische Modifikationen steuern (64). In verschiedenen Ausführungsformen, die in 64 gezeigt sind, kann PE verwendet werden, um (b) ein einzelnes SSR-Target zur Verwendung als Stelle für eine genomische Integration eines DNA-Donor-Templates zu inserieren. (c) zeigt, wie eine Tandem-Insertion von SSR-Target-Stellen verwendet werden kann, um einen Teil des Genoms zu deletieren. (d) zeigt, wie eine Tandem-Insertion von SSR-Target-Stellen verwendet werden kann, um einen Teil des Genoms zu invertieren. (e) zeigt, wie die Insertion von zwei SSR-Target-Stellen an zwei distalen chromosomalen Bereichen zu einer chromosomalen Translokation führen kann. (f) zeigt, wie die Insertion von zwei unterschiedlichen SSR-Target-Stellen im Genom genutzt werden kann, um eine Kassette von einem DNA-Donor-Template auszutauschen. Jede der Arten von Genommodifizierungen soll durch Verwendung von PE zum Inserieren von SSR-Targets erfolgen, wobei diese Liste jedoch nicht vollständig ist.
  • Viele umfangreiche Genomänderungen, wie Geninsertionen, -deletionen, - inversionen oder chromosomale Translokationen, sind an genetischen Krankheiten beteiligt1-7. Darüber hinaus ist eine spezifische und gezielte Bearbeitung eukaryotischer Genome wichtig für die Erforschung menschlicher Krankheiten sowie die Erzeugung transgener Pflanzen8,9 oder anderer biotechnologischer Produkte. Zum Beispiel können Mikrodeletionen von Chromosomen zu Krankheiten führen, und ein Ersatz dieser Deletionen durch Insertionen wichtiger DNA-Elemente könnte zu einer dauerhaften Besserung der Krankheit führen. Darüber hinaus könnten Krankheiten, die aus Inversionen, Änderungen der Genkopienzahl oder chromosomalen Translokationen hervorgehen, durch Wiederherstellung der vorherigen Genstruktur in betroffenen Zellen angegangen werden. Alternativ könnten in Pflanzen oder anderen hochwertigen eukaryotischen Organismen, die in der Industrie verwendet werden, eine Einführung von rekombinanter DNA oder gezielte Genomumlagerungen zu verbesserten Produkten führen, beispielsweise zu Nutzpflanzen, die weniger Ressourcen benötigen oder gegen Krankheitserreger resistent sind. Aktuelle Technologien zur Bewirkung von umfangreichen Genomveränderungen beruhen auf zufälligen oder stochastischen Prozessen, beispielsweise der Verwendung von Transposons oder Retroviren, während andere gewünschte Genommodifikationen nur durch homologe Rekombinationsstrategien erreicht wurden.
  • Eine attraktive Klasse von Proteinen zur Erzielung zielgerichteter und effizienter Genommodifikationen sind ortsspezifische Rekombinasen (SSRs). SSRs werden seit langem als Werkzeug zur Genommodifizierung verwendet10-13. SSRs gelten als vielversprechende Werkzeuge für die Gentherapie, da sie die präzise Spaltung, den präzisen Strangaustausch und die präzise Wiedervereinigung von DNA-Fragmenten an definierten Rekombinations-Targets14 katalysieren, ohne auf die endogene Reparatur von Doppelstrangbrüchen angewiesen zu sein, die Indels, Translokationen, andere DNA-Umlagerungen oder p53-Aktivierung induzieren können15-18. Die durch SSRs katalysierten Reaktionen können zum direkten Austausch, zur direkten Insertion oder zur direkten Deletion von Target-DNA-Fragmenten mit Effizienzen führen, welche die der homologiegerichteten Reparatur übersteigen14,19.
  • Obwohl SSRs viele Vorteile bieten, werden sie nicht häufig verwendet, da sie eine starke inhärente Präferenz für ihre zugehörige Target-Sequenz haben. Die Erkennungssequenzen von SSRs sind typischerweise ≥ 20 Basenpaare und daher im Genom von Menschen oder Modellorganismen unwahrscheinlich. Darüber hinaus lassen sich die nativen Substratpräferenzen von SSRs nicht leicht ändern, selbst mit umfangreicher Labortechnik oder Evolution20. Diese Einschränkung wird überwunden, indem PE verwendet wird, um Rekombinase-Targets direkt in das Genom einzuführen oder um endogene Genomsequenzen zu modifizieren, die von Natur aus Rekombinase-Targets ähneln. Die anschließende Exposition der Zelle gegenüber einem Rekombinase-Protein wird eine präzise und effiziente Genommodifizierung ermöglichen, die durch den Ort und die Orientierung des/der Rekombinase-Targets gesteuert wird (64).
  • Die PE-vermittelte Einführung von Rekombinase-Targets könnte für die Behandlung von genetischen Krankheiten besonders nützlich sein, die durch umfangreiche genomische Defekte wie Genverlust, Inversion oder Duplikation oder chromosomale Translokation hervorgerufen werden1-7 (Tabelle 6). Das Williams-Beuren-Syndrom ist beispielsweise eine Entwicklungsstörung, die durch eine Deletion von 24 auf Chromosom 721 hervorgerufen wird. Derzeit gibt es keine Technologie für die effiziente und zielgerichtete Insertion mehrerer vollständiger Gene in lebende Zellen (das Potenzial von PE, eine solche Insertion von Genen voller Länge zu erreichen, wird derzeit erforscht, ist aber noch nicht bestätigt worden); jedoch bietet eine Rekombinase-vermittelte Integration an einem Target, inseriert durch PE, einen Ansatz zur dauerhaften Heilung dieser und anderer Krankheiten. Darüber hinaus könnte die zielgerichtete Einführung von Rekombinase-Erkennungssequenzen für Anwendungen, einschließlich der Erzeugung von transgenen Pflanzen, Tierforschungsmodellen, Bioproduktionszelllinien oder anderen spezifischen eukaryotischen Zelllinien, sehr hilfreich sein. Beispielsweise könnte eine Rekombinase-vermittelte Genomumlagerung in transgenen Pflanzen an PEspezifischen Targets einen der Engpässe bei der Erzeugung von Nutzpflanzen mit verbesserten Eigenschaften überwinden 8, 9.
  • Eine Reihe von Mitgliedern der SSR-Familie wurden charakterisiert und ihre Target-Sequenzen beschrieben, einschließlich natürlicher und technisch veränderter Tyrosin-Rekombinasen (TABELLE 7), großer Serin-Integrasen (TABELLE 8), SerinResolvasen (TABELLE 9) und Tyrosin-Integrasen (TABELLE 10). Modifizierte Target-Sequenzen, die erhöhte Raten einer genomischen Integration zeigen, wurden ebenfalls für mehrere SSRs beschrieben22-30. Zusätzlich zu natürlichen Rekombinasen wurden programmierbare Rekombinasen mit unterschiedlichen Spezifitäten entwickelt31-40. Unter Verwendung von PE könnten je nach gewünschter Anwendung eine oder mehrere dieser Erkennungssequenzen in das Genom an einer angegebenen Stelle eingeführt werden, wie etwa einem Safe-Harbor-Locus41-43.
  • Beispielsweise würde eine Einführung eines einzelnen Rekombinase-Targets in das Genom zu einer integrativen Rekombination mit einem DNA-Donor-Template führen (64b). Serin-Integrasen, die in menschlichen Zellen ihre Arbeit sehr solide verrichten, sind für eine Genintegration möglicherweise besonders gut geeignet44, 45. Außerdem könnte eine Einführung von zwei Rekombinase-Targets in Abhängigkeit von der Identität und Orientierung der Targets zu einer Deletion der dazwischenliegenden Sequenz, einer Inversion der dazwischenliegenden Sequenz, einer chromosomalen Translokation oder einem Kassettenaustausch führen (64c-f). Durch die Wahl endogener Sequenzen, die Rekombinase-Targets bereits sehr ähnlich sind, würde der Umfang des Editings, der erforderlich ist, um das vollständige Rekombinase-Target einzuführen, reduziert werden.
  • Schließlich wurde für mehrere Rekombinasen gezeigt, dass sie sich an nativ vorkommenden Pseudostellen in menschliche oder eukaryotische Genome integrieren46-64. PE-Editing könnte verwendet werden, um diese Loci zu modifizieren, um die Integrationsraten an diesen natürlichen Pseudostellen zu erhöhen, oder alternativ, um Pseudostellen zu entfernen, die als unerwünschte Off-Target-Sequenzen dienen können.
  • Dieser Bericht beschreibt eine allgemeine Methodik zur Einführung von Rekombinase-Target-Sequenzen in eukaryotische Genome unter Verwendung von PE, dessen Anwendungen nahezu unbegrenzt sind. Die Genom-Editing-Reaktionen sind für eine Verwendung mit dem „Prime Editor“ vorgesehen, einer chimären Fusion eines CRISPR/Cas9-Proteins und einer Reverse-Transkriptase-Domäne, die eine spezifische Prime Editing-Guide-RNA (PEgRNA) verwendet. Als Erweiterung können Cas9-Werkzeuge und Homologie-gerichtete Reparatur(HDR)-Wege auch genutzt werden, um Rekombinase-Targete durch DNA-Template einzuführen, indem die Indel-Raten unter Verwendung verschiedener Techniken gesenkt werden65-67. Ein Proof-of-Concept-Versuch in einer Kultur menschlicher Zellen ist in 65 gezeigt. Tabelle 6. Beispiele für genetische Krankheiten im Zusammenhang mit umfangreichen Genommodifikationen.
    Krankheit Quelle Ursache
    Trisomie 17p 68 Gen-Verdoppelung
    Charcot-Marie-Tooth 69 Gen-Verdoppelung
    Smith-Magenis-Syndrom 70 Gen-Deletion
    Williams-Beuren 21 Gen-Deletion
    De la Chapelle-Syndrom 71 Chromosomale Translokation
    Down-Syndrom (einige 72 Chromosomale Translokation
    Hämophilie A 73 Gen-Inversion
    Hunter-Syndrom 74 Gen-Inversion
    Tabelle 7. Tyrosin-Rekombinasen und SSR-Target-Sequenzen.
    Recombinase Quelle Target Name
    Cre 75 ATAACTTCGTATAGCATACATTATACG AAGTTAT (SEQ ID NO: 517) loxP
    Dre 76 TAACTTTAAATAATGCCAATTATTTAA AGTTA (SEQ ID NO: 518) rox
    VCre 77 TCAATTTCTGAGAACTGTCATTCTCGG AAATTGA (SEQ ID NO: 519) loxV
    SCre 77 CTCGTGTCCGATAACTGTAATTATCGG ACATGAT (SEQ ID NO: 520) loxS
    Flp 78 GAAGTTCCTATTCTCTAGAAAGTATAG GAACTTC (SEQ ID NO: 521) FRT
    B2 79 GAGTTTCATTAAGGAATAACTAATTCC CTAATGAAACTC (SEQ ID NO: 522) loxB
    B3 79 GGTTGCTTAAGAATAAGTAATTCTTAA GCAACC (SEQ ID NO: 523) loxB3
    Kw 80 ACGAAAAATGGTAAGGAATAGACCAT TCCTTACCATTTTTGGT (SEQ ID NO: 524)
    R 81 TTGATGAAAGAATAACGTATTCTTTCA TCAA (SEQ ID NO: 525) RS
    TD 1-40 82 GTGCGTCAAATAATAACGTATTATTTG ACACTT (SEQ ID NO: 526) TDRS
    Vika 83 AATAGGTCTGAGAACGCCCATTCTCAG ACGTATT (SEQ ID NO: 527) vox
    Nigri 84 TGAATGTCCTATAATTACACTTATAGG nox ACATTCA (SEQ ID NO: 528) nox
    Panto 84 GAAACTTTAAATAATAAGTCTTATTTA AAGTTTC (SEQ ID NO: 259) pox
    Kd 79 AAACGATATCAGACATTTGTCTGATA ATGCTTCATTATCAGACAAATGTCTG ATATCGTTT (SEQ ID NO: 530) loxK
    Fre 85 ATATATACGTATATAGACATATATACG TATATAT (SEQ ID NO: 531) loxH
    CreALSHG 86 ATAACTCTATATAATGTATGCTATATA GAGTTAT (SEQ ID NO: 532) JoxM7
    Tre 87 ACAACATCCTATTACACCCTATATGCC AACATGG (SEQ ID NO: 533) loxLTR
    Brec1 12 AACCCACTGCTTAAGCCTCAATAAAGC TTGCCTT (SEQ ID NO: 534) JoxBTR
    Cre-R3M3 88 GATACAACGT AT AT ACCTTTCT AT ACG TTGTTTA (SEQ ID NO: 535) loxK2
    Tabelle 8. Große Serin-Integrasen und SSR-Target-Sequenzen.
    Inteprase (Quelle Linkes Target Rechtes
    Bxb1 89 GGTTTGTCTGGTCAACCACC GCGGTCTCAGTGGTGTACGG TACAAACC (SEQ ID NO: 536) GGCTTGTCGACGACGGCGG TCTCCGTCGTCAGGATCAT(S EQ ID NO: 537)
    phiC31 90 GTGCCCCAACTGGGGTAACC TTTGAGTTCTCTCAGTTGGG GG (SEQ ID NO: 538) TGCGGGTGCCAGGGCGTGC CCTTGGGCTCCCCGGGCGCG TACTCC (SEQ ID NO: 539)
    R4 91 TGTTCCCCAAAGCGATACCA CTTGAAGCAGTGGTACTGCT TGTGGGTACA (SEQ ID NO: 540) GCATGTTCCCCAAAGCGATA CCACTTGAAGCAGTGGTACT GCTTGTGGGTACACTCTGCG GGTG (SEQ ID NO: 541)
    phiBT1 92 GGTGCTGGGTTGTTGTCTCT GGACAGTGATCCATGGGAA ACTACTCAGCACC (SEQ ID NO: 542) CAGGTTTTTGACGAAAGTGA TCCAGATGATCCAG (SEQ ID NO: 543)
    MJ1 phiFC1) 93 ATTTIAGGTATATGATTTTGT TTATTAGTGTAAATAACACT ATGTACCTAAAAT (SEQ ID NO: 544) CAAAGGATCACTGAATCAA AAGTATTGCTCATCCACGCG AAA (SEQ ID NO: 545)
    MR11 94 TTTGTGCGGAACTACGAACA GTTCATTAATACGAAGTGTA CAAACTTCCATACAA (SEQ ID NO: 546) CGAAAATGTATGGAGGCAC TTGTATCAATATAGGATGTA TACCTTCGAAGACACTT (SEQ ID NO: 547)
    TP901-1 95 GAGTTTTTATTTCGTTTATTT CAATTAAGGTAACTAAAAA ACTCCTTTTAAGG (SEQ ID NO: 548) ATGCCAACACAATTAACATC TCAATCAAGGTAAATGCTTT TTGCTITTTTTGC (SEQ ID NO: 549)
    A118 96 TTCCTCGTTTTCTCTCGTTGG AAGAAGAAGAAACGAGAAA (SEQ ID NO: 550) TTTCGGATCAAGCTATGAAC. GACGCAAAGAGGGAACTAA A(SEQ ID NO: 551)
    -U153 97 TTCCTCGTTTTCTCTCGTTGG ACGGAAACGAATCGAGAAA (SEQ ID NO: 552) TTTCGGATCAAGCTATGAAG GACGCAAAGAGGGAACTAA A (SEQ ID NO: 553)
    phiRV1 98 GTAGTGTATCTCACAGGTCC ACGGTTGGCCGTGGACTGCT GAAGAACATTCC (SEQ ID NO: 554) GAAGGTGTTGGTGCGGGGT TGGCCGTGGTCGAGGTGGG GT (SEQ ID NO: 555)
    phi370.1 99 AAAAAAATACAGCGTTTTTC ATGTACAACTATACTAGTTG TAGTGCCTAAAA (SEQ ID NO: 556) TTGTAAAGGAGACTGATAA TGGCATGTACAACTATACTC GTCGGTAAAAAGGCA (SEQ ID NO: 557)
    TG1 100 TCCAGCCCAACAGTGTTAGT CTTTGCTCTTACCCAGTTGG GCGGGA (SEQ ID NO: 558) GATCAGCTCCGCGGGCAAG ACCTTTCTCCTTCACGGGGT GGAAGGTC (SEQ ID NO: 559)
    -WB 101 CTAGTTTTAAAGTTGGTTAT TAGTTACTGTGATATTTATC ACGGTACCCAATAACCAATG AAT (SEQ ID NO: 560) CGGAAGGTAGCGTCAACGA TAGGTGTAACTGTCGTGTTT GTAACGGTACTTCCAACAGC TGGCGCCGCCAC (SEQ ID NO: 561)
    BL3 102 CAATGAAAAACTAGGCATGT TTTCCACAGACAACTCACGT AGAAGTTGTTTGT (SEQ ID GGAGGTAGTCAC (SEQ ID NO: 562) NO: 563)
    SprA 103 TGTAGTAAGTATCTTAATAT ACAGCTTTATCTGTTTTTTAA GATACTTACTACTTT (SEQ ID NO: 564) CACCCATTGTGTTCACAGGA GATACAGCTTTATCTGTACT GATATTAATGACATGCTG (SEQ ID NO: 565)
    phiJoe 104 AGTTGTGGCCATGTGTCCAT CTGGGGGCAGATGGAGACG GGGTCACA (SEQ ID NO: 566) ATCTGGATGTGGGTGTCCAT CTGCGGGCAGACGCCGCAG TCGAAGCACGG (SEQ ID NO: 567)
    phiK38 105 CCCTAATACGCAAGTCGATA ACTCTCCTGGGAGCGTTGAC AACTTGCGCACCCTGATCTG (SEQ ID NO: 569) GAGCGCCGGATCAGGGAGT GGACGGCCTGGGAGCGCTA CACGCTGTGGCTGCGGTCGG TGC (SEQ ID NO: 570)
    Int2 105 GCTCATGTATGTGTCTACGC GAGATTCTCGCCCGAGAACT TCTGCAAGGCACTGCTCTTG GCT (SEQ ID NO: 571) GGACGGCGCAGAAGGGGAG TAGCTCTTCGCCGGACCGTC GACATACTGCTCAGCTCGTC (SEQ ID NO: 572)
    Int3 105 ATGGATAAAAAAATACAGC GTTTTTCATGTACAACTATA CTAGTTGTAGTGCCTAAATA GTTTGTAAAGGAGACTGAT AATGGCATGTACAACTATAC TCGTCGGTAAAAAGGCATCT
    ATGCTT (SEQ ID NO: 573) TAT (SEQ ID NO: 574)
    Int4 105 AAAAATTACAAAGTTTTCAA CCCTTGATTTGAATTAGCGG TCAAATAATTTGTAATTCGT TT (SEQ ID NO: 575) TTCCAAAGAGCGCCCAACG CGACCTGAAATTTGAATAA GACTGCTGCTTGTGTAAAGG CGATGATT (SEQ ID NO: 576)
    Int7 105 GTGTTATAAACCTGTGTGAG AGTTAAGTTTACATGCCTAA CCTTAACTTTTACGCAGGTT CAGCTT(SEQ ID NO: 577) AGACGAGAAACGTTCCGTC CGTCTGGGTCAGTTGGGCAA AGTTGATGACCGGGTCGTCC GTT (SEQ ID NO: 578)
    Int8 105 TTAATAAACTATGGAAGTAT GTACAGTCTTGCAATGTTGA GTGAACAAACTTCCATAATA AAAT (SEQ ID NO: 579) CAATCATCAGATAACTATGG CGGCACGTGCATTAACCAC GGTTGTATCCCGTCTAAAGT ACTCGT (SEQ ID NO: 580)
    Int9 105 GTGGTTGTTTTTGTTGGAAG TGTGTATCAGGTATCTGCAT AGTTATTCCGAACTTCCAAT TA (SEQ ID NO: 581) TTTATATTGCGAAAAATAAT TGGCGAACGAGGTAACTGG ATACCTCATCCGCCAATTAA AATTTG (SEQ ID NO: 582)
    Int10 105 GGAAAATATAAATAATTTTA GTAACCTACATCTCAATCAA GGATAGTAAAACTCTCACTC TT (SEQ ID NO: 583) AGCACGCTGATAATCAGCA AGACCACCAACATTTCCACC AATGTAAAAGCTTTAACCTT AGC (SEQ ID NO: 584)
    Int11 105 GTTTATATGTTTACTAATAA GACGCTCTCAACCCATAAAG TCTTATTAGTAAACATATTT CAACT (SEQ ID NO: 585) ATGGATTTTGCAGATTCCCA GATGCCCCTACAGAAAGAG GTACAAAACATTTATTGGAA TTAATT (SEQ ID NO: 586)
    Int12 105 TTTTTGTATGTTAGTTGTGTC ACTGGGTAGACCTAAATAGT GACACAACTGCTATTAAAAT TTAA (SEQ ID NO: 587) GTTCGTGGTAACTATGGGTG GTACAGGTGCCACATTAGTT GTACCATTTATGTTTATGTG GTTAAC (SEQ ID NO: 588)
    Int13 105 CAATAACGGTTGTATTTGTA GAACTTGACCAGTTGTTTTA GTAACATAAATACAACTCCG AATA (SEQ ID NO: 589) GCATACATTGTTGTTGTTTT TCCAGATCCAGTTGGTCCTG TAAATATAAGCAATCCATGT GAGT (SEQ ID NO: 590)
    LI 106 GTTTAGTATCTCGTTATCTCT CGTTGGAGGGAGAAGAAAC GGGATACCAAAA (SEQ ID NO: 591) TAACTTTTTCGGATCGAGTT ATGATGGACGTAAAGAGGG AACAAAGCATCTA (SEQ ID NO: 592)
    Peaches 107 TAGTTTCCAATGTTACAGGA ACTGCTGGCAGAATCCAACA CATTGGAAGTCG (SEQ ID NO: 593) CGGTCTCCATCGGGATCTGC TGATCGAGCAGCATGCCGA CCA (SEQ ID NO: 594)
    Bxz2 107 TAACCGCAAGTGTACATCCC TCGGCTGGCCGAGACAAGTA CAGTTGCGACAG (SEQ ID NO: 595) CGGTCTCCATCGGGATCTGC TGATCGAGCAGCATGCCGA CCA (SEQ ID NO: 596)
    SVL 108 ATGTGGTCCTTTAGATCCAC TGACGTGGGTCAGTGTCTCT AAAGGACTCGCG (SEQ ID NO: 597) CATCAGGGCGGTCAGGCCG TAGATGTGGAAGAAACGGC AGCACGGCGAGGACG (SEQ ID NO: 598)
    Tabelle 9. Serinresolvasen und SSR-Target-Sequenzen.
    Resolvase Quelle Linkes Target Rechtes
    Gin 109 CGTTTCCTGTAAACCGAGGT TTTGGATAAACA (SEQ ID NO: 599) CGTTTCCTGTAAACCGAGGT TTTGGATAATGG (SEQ ID NO: 600)
    Cin 110 GAGTTCTCTTAAACCAAGGT TTAGGATTGAAA (SEQ ID NO: 601) GAGTTCTCTTAAACCAAGGT ATTGGATAACAG (SEQ ID NO: 602)
    Hin 111 TGGTTCTTGAAAACCAAGGT TTTTGATAAAGC (SEQ ID NO: 603) AAATTTTCCTTTTTGGAAGG TTTTTGATAACCA (SEQ ID NO: 604)
    Min 112 GCCTTCCCCTAAACCAACGT TTTTATGCCGCC (SEQ ID NO: 605) GCCTTCCCCCAAACCAAGGT AATCAAGAACGC (SEQ ID NO: 606)
    Sin 113 TTGTGAAATTTGGGTACACC CTAATCATACAA (SEQ ID NO: 607) CGTATGATTAGGGTGTATAT TAATTT (SEQ ID NO: 608)
    Tabelle 10. Tyrosin-Integrasen und Target-Sequenzen.
    Integrase Quelle attP attB
    HK022 114 CAAATGATTTTATTTTGACTAATAA TGACCTACTTACATTAATTTACTGAT AATTAAAGAGATTTTAAATATACAA CTTATTCACCTAAAGGATGACAAAA (SEQ ID NO: 609) GCACTTTAGGTGA AAAAGGTT (SEQ ID NO: 610)
    P22 115 CTAAGTGGTTTGGGACAAAAATGGG ACATACAAATCTTTGCATCGGTTTG CAAGGCTTTGCATGTCTTTCGAAGA TGGGACGTGTGAGCGCAGGTATGAC GTGGTATGTGTTGACTTAAAAGGTA GTTCTTATAATTCGTAATGCGAAGG TCGTAGGTTCGACTCCTATTATCGG CACCAGTTAAATCAAATACTTACGT ATTATTCGTGCCTTCCTTATTTTTAC TGTGGGACATATTTGGGACAGAAGT ACCAAAAA (SEQ ID NO: 612) GCAGCGCATTCGT AATGCGAAGGTCG T (SEQ ID NO: 613)
    L5 116 GCGATCCCCATCCGCGACGTGCCAA GAGCGGGCGACG
    CTAGGTCTCCTCTCGTCGTGAACAA GGCTACCGGGTTGCAACTCCTGTGC AACTCTCAGGCTTCAACGCGCTTCT ACGACCTGCAATTTCTTTCCACTTA GAGGATGCAGCCGAGAGGGGTAAA AACCTATCTTGACCGGCCCATATGT GGTCGGCAGACACCCATTCTTCCAA ACTAGCTACGCGGGTTCGATTCCCG TCGCCCGCTCCGCTGGTCAGAGGGT GTTTTCGCCCTCTGGCCATTTITCTT TCCAGGGGTCTGCAACTCTTGTGCG ACTCTTCTGACCTGGGCATACGCGG TTGCAACGCATCCCTGATCTGGCTA CTTTCGATGCTGACAAACGAATAGA GCCCCCCGCCTGCGCGAACAGACG AGGGGCATTCACA (SEQ ID NO: 614) GGAATCGAACCCG CGTAGCTAGTTTG GAAGA (SEQ ID NO: 615)
  • In Beispiel 17 zitierte Literaturstellen
  • Jede der folgenden Literaturstellen wird in Beispiel 17 zitiert, von denen jede hier durch Bezugnahme aufgenommen ist.
    1. 1. Feuk, L. Inversion variants in the human genome: role in disease and genome architecture. Genome Med 2, 11 (2010).
    2. 2. Zhang, F., Gu, W., Hurles, M.E. & Lupski, J.R. Copy number Variation in human health, disease, and evolution. Annu Rev Genomics Hum Genet 10, 451-481 (2009).
    3. 3. Shaw, C.J. & Lupski, J.R. Implications of human genome architecture for rearrangementbased disorders: the genomic basis of disease. Hum Mol Genet 13 Spec No 1, R57-64 (2004).
    4. 4. Carvalho, C.M., Zhang, F. & Lupski, J.R. Evolution in health and medicine Sackler colloquium: Genomic disorders: a window into human gene and genome evolution. Proc Natl Acad Sci U S A 107 Suppl 1, 1765-1771 (2010).
    5. 5. Rowley, J.D. Chromosome translocations: dangerous liaisons revisited. Nat Rev Cancer 1, 245-250 (2001).
    6. 6. Aplan, P.D. Causes of oncogenic chromosomal translocation. Trends Genet 22. 46-55 (2006).
    7. 7. McCarroll, S.A. & Altshuler, D.M. Copy-number variation and association studies of human disease. Nat Genet 39, S37-42 (2007).
    8. 8. Wijnker, E. & de Jong, H. Managing meiotic recombination in plant breeding. Trends Plant Sci 13, 640-646 (2008).
    9. 9. Petolino, J.F., Srivastava, V. & Daniell, H. Editing Plant Genomes: a new era of crop improvement. Plant Biotechnol J 14,435-436 (2016).
    10. 10. Smith, M.C.M. Phage-encoded Serine Integrases and Other Large Serine Recombinases. Microbiol Spectr 3 (2015).
    11. 11. Meinke, G., Bohm, A., Hauber, J., Pisabarro, M.T. & Buchholz, F. Cre Recombinase and Other Tyrosine Recombinases. Chem Rev 116, 12785-12820 (2016).
    12. 12. Karpinski, J. et al. Directed evolution of a recombinase that excises the provirus of most HIV-1 primary isolates with high specificity. Nat Biotechnol 34,401-409 (2016).
    13. 13. Olorunniji, F.J., Rosser, S.J. & Stark, W.M. Site-specific recombinases: molecular machines for the Genetic Revolution. Biochem J 473, 673-684 (2016).
    14. 14. Grindley, N.D., Whiteson, K.L. & Rice, P.A. Mechanisms of site-specific recombination. Annu Rev Biochem 75, 567-605 (2006).
    15. 15. Lukacsovich, T., Yang, D. & Waldman, A.S. Repair of a specific double-strand break generated within a mammalian chromosome by yeast endonuclease 1-Scei. Nucleic Acids Res 22, 5649-5657 (1994).
    16. 16. Rouet. P., Smih. F. & Jasin, M. Introduction of double-strand breaks into the genome of mouse cells by expression of a rare-cutting endonuclease. Mol Cell Biol 14, 8096-8106 (1994).
    17. 17. Jeggo, P.A. DNA breakage and repair. Adv Genet 38, 185-218 (1998).
    18. 18. Haapaniemi, E.. Botla. S., Persson, J., Schmierer, B. & Taipale. J. CRISPR-Cas9 genome editing induccs a p53-mediated DNA damage response. Nat Med 24, 927-930 (2018).
    19. 19. Wang, B. et al. Highly efficient CRISPR/HDR-mediated knock-in for mouse embryonic stem cells and zygotes. Biotechniques 59, 201-202, 204, 206-208 (2015).
    20. 20. Bogdanove, A.J., Bohm. A., Miller. J.C., Morgan, R.D. & Stoddard, B.L. Engineering altered protein-DNA recognition specificity. Nucleic Acids Res 46. 4845-4871 (2018).
    21. 21. Tassabehji. M. Williams-Beuren syndrome: a challenge for genotype-phenotype correlations. Hum Mol Genet 12 Spec No 2, R229-237 (2003).
    22. 22. Araki, K., Araki, M. & Yamamura, K. Targeted integration of DNA using mutant lox sites in embryonic stem cells. Nucleic Acids Res 25, 868-872 (1997).
    23. 23. Araki, K., Okada, Y., Araki, M. & Yamamura, K. Comparative analysis of right element mutant lox sites on recombination efficiency in embryonic stern cells. BMC Biotechnol 10, 29 (2010).
    24. 24. Thomson, J.G., Rucker, E.B., 3rd & Piedrahita, J.A. Mutational analysis of IoxP sites for efficient Cre-mediated insertion into genomic DNA. Genesis 36. 162-167 (2003).
    25. 25. Jusiak, B. et al. Comparison of Integrases Identifies Bxbl-GA Mutant as the Most Efficient Site-Specific Integrase System in Mammalian Cells. ACS Synth Biol 8, 16-24 (2019).
    26. 26. Xie, F. et al. Adjusting the attB site in donor plasmid improves the efficiency of PhiC31 integrase system. DNA Cell Biol 31, 1335-1340 (2012).
    27. 27. Gupta, M., Till, R. & Smith, Nt.C. Sequences in attB that affect the ability of phiC31 integrase to synapse and to activate DNA cleavage. Nucleic Acids Res 35, 3407-3419 (2007).
    28. 28. Kolot, M.. Malchin. N., Elias, A., Gritsenko. N. & Yagil, E. Site promiscuity of coliphage HK022 integrase as tool for gene therapy. Gene Ther 22, 602 (2015).
    29. 29. Gaj, T., Mercer, A.C., Sirk, S.J., Smith, II.L. & Barbas, C.F., 3rd A compreheosive approach to zinc-finger recombinase customization enables genomic targeting in human cells. Nucleic Acids Res 41, 3937-3946 (2013).
    30. 30. Chuang, K., Nguyen, E., Sergeev, Y. & Badea, T.C. Novel Heterotypic Rox Sites for Combinatorial Dre Recombination Strategies. G3 (Bethesda) 6, 559-571 (2015).
    31. 31. Chaikind, B., Bessen. J.L., Thompson. D.B.. Hu, J.H. & Liu. D.R. A programmable Cas9-serine recombinase fusion protein that operates on DNA sequences in mammalian cells. Nucleic Acids Res 44, 9758-9770 (2016).
    32. 32. Gaj, T., Mercer, A.C., Gersbach, C.A., Gordley, R.M. & Barbas, C.F. Structure-guided reprogramming of serine recombinase DNA sequence specificity. P Natl Acad Sci USA 108. 498-503 (2011).
    33. 33. Gaj, T., Sirk, S.J. & Barbas, C.F., 3rd Expanding the scope of site-specific recombinases for genetic and metabolic engineering. Biotechnol Bioeng 111. 1- 15 (2014).
    34. 34. Akopian, A., He, J., Boocock, M.R. & Stark, W.M. Chimeric rccombinases with designcd DNA sequence recognition. Proc Natl Acad Sci USA 100, 8688-8691 (2003).
    35. 35. Prorocic, M.M. et al. Zinc-finger recombinase activities in vitro. Nucleic Acids Research 39, 9316-9328 (2011).
    36. 36. Gersbach, C.A., Gaj, T.. Gordley, R.M., Mercer, A.C. & Barbas, C.F. Targeted plasmid integration into the human genome by an engineered zinc-finger recombinase. Nucleic Acids Research 39, 7868-7878 (2011).
    37. 37. Sirk, S.J., Gaj, T., Jonsson, A., Mercer. A.C. & Barbas, C.F. Expanding the zinc-finger recombinase repertoire: directed evolution and mutational analysis of serine rccombinase specificity determinants. Nucleic Acids Research 42, 4755-4766 (2014).
    38. 38. Gaj, T. & Barbas, C.F., 3rd Genome engineering with custom recombinases. Methods Enzymol 546, 79-91 (2014).
    39. 39. Olorunniji, F.J., Rosser, S.J. & Marshall Stark, W. Purification and In Vitro Characterization of Zinc Finger Recombinases. Methods Mol Biol 1642. 229-245 (2017).
    40. 40. Proudfoot, C., McPherson. A.L.. Kolb, A.F. & Stark, W.M. Zinc finger recombinases with adaptable DNA sequence specificity. PLoS One 6, e19537 (2011).
    41. 41. Irion, S. et al. Identification and targeting of the ROSA26 locus in human embryonic stem cells. Nat Biotechnol 25. 1477-1482 (2007).
    42. 42. Sadelain. M.. Papapetrou, E.P. & Bushman, F.D. Safe harbours for the integration of new DNA in the human genome. Nat Rev Cancer 12, 51-58 (2012).
    43. 43. Pellenz, S. et al. New human chromosomal safe harbor sites for genome engineering with CRISPR/Cas9. TAL effector and homing endonucleases. bioRxiv (2019).
    44. 44. Brown, W.R., Lee, N.C., Xu, Z. & Smith, M.C. Serine recombinases as tools for genome engineering. Methods 53, 372-379 (2011).
    45. 45. Xu, Z. et al. Accuracy and efficiency define Bxb1 integrase as the best of fifteen candidate serine recombinases for the integration of DNA into the human genome. BMC Biotechnol 13, 87 (2013).
    46. 46. Thyagarajan, B., Guimaraes, M.J., Groth, A.C. & Calos, M.P. Mammalian genomes contain active recombinase recognition sites. Gene 244, 47-54 (2000).
    47. 47. Shultz, J.L., Voziyanova, E., Konieczka, J.H. & Voziyanov, Y. A genome-wide analysis of FRT-like sequences in the human genome. PLoS One 6, e18077 (2011).
    48. 48. Thyagarajan, B., Olivares, E.C., Hollis, R.P., Ginsburg, D.S. & Calos, M.P. Site-specific genomic integration in mammalian cells mediated by phage phiC31 integrase. Mol Cell Biol 21, 3926-3934 (2001).
    49. 49. Sivalingam, J. et al. Biosafety assessment of site-directed transgene integration in human umbilical cord-lining cells. Mol Ther 18, 1346-1356 (2010).
    50. 50. Ortiz-Urda, S. et al. Stable nonviral genetic correction of inherited human skin disease. Nat Med 8, 1166-1170 (2002).
    51. 51. Chalberg, T.W. et al. Integration specificity of phage phiC31 integrase in the human genome. J Mol Biol 357. 28-48 (2006).
    52. 52. Thyagarajan, B. et al. Creation of engineered human embryonic stem cell lines using phiC31 integrase. Stem Cells 26, 119-126 (2008).
    53. 53. Olivares, E.C. et al. Site-specific genomic integration produces therapeutic Factor IX levels in mice. Nat Biotechnol 20, 1124-1128 (2002).
    54. 54. Hollis, R.P. et al. Phage integrases for the construction and manipulation of transgenic mammals. Reprod Biol Endocrinol 1,79 (2003).
    55. 55. Held. P.K. et al. In vivo correction of murine hereditary tyrosinemia type I by phiC31 integrase-mediated gene delivery. Mol Ther 11, 399-408 (2005).
    56. 56. Ma, H. et al. PhiC31 integrase induces efficient site-specific recombination in the Capra hircus genome. DNA Cell Biol 33, 484-49J (2014).
    57. 57. Bi. Y. et al. Pseudo attP sites in favor of transgene integration and expression in cultured porcine cells identified by Streptomyces phage phiC31 integrase. BMC Mol Biol 14, 20 (2013).
    58. 58. Ma, Q.W. et al. Identification of pseudo attP sites for phage phiC31 integrase in bovine genome. Biochem Biophys Res Commun 345. 984-988 (2006).
    59. 59. Qu. L. et al. Global mapping of binding sites for phic31 integrase in transgenic madendarby bovine kidney cells using ChIP-seq. Hereditas 156, 3 (2019).
    60. 60. Ghahfarokhi. M.K., Dormiani, K., Mohammadi, A., Jafarpour, F. & Nasr-Esfahani, M.H. Blastocyst Formation Rate and Transgene Expression are Associated with Gene Insertion into Safe and Non-Safe Harbors in the Cattle Genome. Sci Rep 7. 15432 (2017).
    61. 61. Groth, A.C., Fish, M., Nusse, R. & Calos, M.P. Construction of transgenic Drosophila by using the site-specific integrase from phage phiC31. Genetics 166, 1775-1782 (2004).
    62. 62. Chalberg, T.W., Genise, H.L., Vollrath, D. & Calos, M.P. phiC31 integrase confers genomic integration and long-term transgene expression in rat retina. Invest Ophthalmol Vis Sci 46, 2140-2146 (2005).
    63. 63. Keravala, A. et al. A diversity of serine phagc integrases mediate site-specific recombination in mammalian cells. Mol Genet Genomics 276, 135-146 (2006).
    64. 64. Lei, X., Wang, L.. Zhao, G. & Ding, X. Site-specificity of serine integrase demonstrated by the attB sequence preference of BT1 integrase. FEBS Lett 592, 1389-1399 (2018).
    65. 65. Chu, V.T. et al. Increasing the efficiency of homology-directed repair for CRISPR-Cas9-induced precise gene editing in mammalian cells. Nat Biotechnol 33. 543-548 (2015).
    66. 66. Yu, C. et al. Small molecules enhance CRISPR genome editing in pluripotent stem cells. Cell Stem Cell 16, 142-147 (2015).
    67. 67. Paquet, D. et al. Efficient introduction of specific homozygous and heterozygous mutations using CRISPR/Cas9. Nature 533, 125 (2016).
    68. 68. Martsolf. J.T. et al. Complete trisomy 17p a relatively new syndrome. Ann Genet 31, 172-174 (1988).
    69. 69. Bird, T.D. in GeneReviews((R)). (eds. M.P. Adam et al.) (Scattle (WA); 1993).
    70. 70. Smith, A.C.M. et al. in GeneReviews((R)). (eds. M.P. Adam et al.) (Seattle (WA); 1993).
    71. 71. Dupuy. O. et al. [De La Chapelle syndrome]. Presse Med 30, 369-372 (2001).
    72. 72. Jyothy. A. et al. Translocation Down syndrome. Indian J Med Sei 56, 122-126 (2002).
    73. 73. Lakich, D., Kazazian, H.H., Jr., Antonarakis, S.E. & Gitschier, J. Inversions disrupting the factor VIII gene are a common cause of severe hacmophilia A. Nat Genet 5, 236-241 (1993).
    74. 74. Bondeson, M.L. et al. Inversion of the IDS gene resulting from recombination with IDSrelated sequences is a common cause of the Hunter syndrome. Hum Mol Genet 4. 615-621 (1995).
    75. 75. Abremski, K. & Hoess, R. Bacteriophage P1 site-specific recombination. Purification and properties of the Cre recombinase protein. J Biol Chem 259, 1509-1514 (1984).
    76. 76. Sauer, B. & McDermott, J. DNA recombination with a heterospecific Cre homolog identified from comparison of the pac-c1 regions of P1-related phages. Nucleic Acids Res 32, 6086-6095 (2004).
    77. 77. Suzuki, E. & Nakayama, M. VCre/VloxP and SCre/SloxP: new site-specific recombination systems for genome engineering. Nucleic Acids Res 39, e49 (2011).
    78. 78. Sadowski. P.D. The F7p recombinase of the 2-microns plasmid of Saccharomyces cerevisiae. Prog Nucleic Acid Res Mol Biol 51, 53-91 (1995).
    79. 79. Nern, A., Pfeiffer, B.D., Svoboda, K. & Rubin, G.M. Multiple new site-specific recombinases for use in manipulating animal genomes. Proc Natl Acad Sci U S A 108, 14198-14203 (2011).
    80. 80. Ringrose, L., Angrand, P.O. & Stewart. A.F. The Kw recombinase, an integrase from Kluyveromyces waltii. Eur J Biochem 248, 903-912 (1997).
    81. 81. Araki, H. et al. Site-specific recombinase, R. encoded by yeast plasmid pSR1. J Mol Biol 225,25-37 (1992).
    82. 82. Blaisonneau, J., Sor, F., Cheret, G., Yarrow, D. & Fukuhara. H. A circular plasmid from the yeast Torulaspora delbrueckii. Plasmid 38, 202-209 (1997).
    83. 83. Karimova, M. et al. Vika/vox. a novel efficient and specific Cre/loxP-like site-specific recombination system. Nucleic Acids Res 41, e37 (2013).
    84. 84. Karimova, M., Splith. V., Karpinski, J., Pisabarro, M.T. & Buchholz, F. Discovery of Nigri/nox and Panto/pox site-specific recombinase systems facilitates advanced genome engineering. Sci Rep 6, 30130 (2016).
    85. 85. Buchholz. F. & Stewart, A.F. Alteration of Cre recombinase site specificity by substratelinked protein evolution. Nat Biotechnol 19, 1047-1052 (2001).
    86. 86. Santoro, S.W. & Schultz, P.G. Directed evolution of the site specificity of Cre recombinase, Proc Natl Acad Sci USA 99, 4185-4190 (2002).
    87. 87. Sarkar, I., Hauber, I., Hauber, J. & Buchholz, F. HIV-1 proviral DNA excision using an evolved recombinase. Science 316. 1912-1915 (2007).
    88. 88. Rufer, A.W. & Sauer, B. Non-contact positions impose site selcctivity on Cre recombinase. Nucleic Acids Res 30, 2764-2771 (2002).
    89. 89. Kim, A.I. et al. Mycobacteriophage Bxb1 integrates into the Mycobacterium smegmatis groELl gene. Mol Microbiol 50,463-473 (2003).
    90. 90. Brown. D.P., Idler, K.B. & Katz. L. Characterization of the genetic elements required for site-specific integration of plasmid pSE21 1 in Saccharopolyspora erythraea. J Bacteriol 172, 1877-1888 (1990).
    91. 91. Matsuura. M. et al. A GENE ESSENTIAL FOR THE SITE-SPECIFIC EXCISION OF ACTINOPHAGE R4 PROPHAGE GENOME FROM THE CHROMOSOME OF A LYSOGEN. The Journal of General and Applied Microbiology 41. 53-61 (1995).
    92. 92. Gregory, M.A.. Till. R. & Smith. M.C. Integration site for Streptomyces phage phiBTl and development of site-specific integrating vectors. J Bacteriol 185, 5320-5323 (2003).
    93. 93. Yang. H.Y., Kim, Y.W. & Chang, H.I. Construction of an integration-proficient vector based on the site-specific recombination mechanism of enterococcal temperate phage phiFCl. J Bacteriol 184, 1859-1864 (2002).
    94. 94. Rashel, M. et al. A novel site-specific recombination system derived from bacteriophage phiMR11. Biochem Biophys Res Commun 368, 192-198 (2008).
    95. 95. Christiansen. B.. Johnsen, M.G.. Stenby. E., Vogensen, F.K. & Hammer, K. Characterization of the lactococcal temperate phage TP901-1 and its site-specific integration. J Bacteriol 176, 1069-1076 (1994).
    96. 96. Locssner, M.J., Inman, R.B., Lauer, P. & Calendar, R. Complete nucleotide sequence, molecular analysis and genome structure of bacteriophage A118 of Listeria monocytogenes: implications for phage evolution. Mol Microbiol 35, 324-340 (2000).
    97. 97. Lauer, P., Chow, M.Y., Loessner, M.J., Portnoy, D.A. & Calendar, R. Construction, characterization, and use of two Listeria monocytogenes site-specific phage integration vectors. J Bacteriol 184, 4177-4186 (2002).
    98. 98. Bibb. L.A., Hancox, M.I. & Hatfull, G.F. Integration and excision by the large serine recombinase phiRv1 integrase. Mol Microbiol 55, 1896-1910 (2005).
    99. 99. Canchaya, C. et al. Genome analysis of an inducible prophage and prophage remnants integrated in the Streptococcus pyogenes strain SF370. Virology 302, 245-258 (2002).
    100. 100. Morita, K. et al. The site-specific recombination system of actinophage TG1. FEMS Microbiol Lett 297, 234-240 (2009).
    101. 101. Fouts, D.E. et al. Sequencing Bacillus anthracis typing phages gamma and cherry reveals a common ancestry. J Bacteriol 188, 3402-3408 (2006).
    102. 102. Kilcher, S., Loessner. M.J. & Klumpp, J. Brochothrix thermosphacta bacteriophages feature heterogeneous and highly mosaic genomes and utilize unique prophage insertion sites. J Bacteriol 192, 5441-5453 (2010).
    103. 103. Lazarevic, V. et al. Nucleotide sequence of the Bacillus subtilis temperate bacteriophage SPbctac2. Microbiology 145 (Pt5), 1055-1067 (1999).
    104. 104. Fogg, P.C.M.. Haley, J.A.. Stark, W.M. & Smith, M.C.M. Genome Integration and Excision by a New Streptomyces Bacteriophage. varphiJoe. Appl Environ Microbiol 83 (2017).
    105. 105. Yang, L. et al. Permanent genetic memory with >1-hyte capacity. Nat Methods 11, 1261-1266 (2014).
    106. 106. Rulherford, K., Yuan. P., Perry, K.. Sharp. R. & Van Duyne, G.D. Attachment site recognition and regulation of directionality by the serine integrases. Nucleic Acids Res 41, 8341-8356 (2013).
    107. 107. Singh. S., Rockenbach. K., Dedrick. R.M., VanDemark. A.P. & Hatfull, G.F. Cross-talk between diverse serine integrases. J Mol Biol 426, 318-331 (2014).
    108. 108. Gupta, N. et al. Cross-talk between cognate and noncognate RpoE sigma factors and Zn(2+)-binding anti-sigma factors regulates photooxidative stress response in Azospirillum brasilense. Antioxid Redox Signal 20. 42-59 (2014).
    109. 109. Kahmann, R., Rudt. F., Koch, C. & Mertens. G. G inversion in bacteriophage Mu DNA is stimulatcd by a site within the invertase gene and a host factor. Cell 41, 771-780 (1985).
    110. 110. Iida, S., Meyer. J., Kennedy, K.E. & Arber, W. A site-specific, conservative recombination system carried by bacteriophage P1. Mapping the recombinase gene ein and the cross-over sites cix for the inversion of the C segment. EMBO J 1, 1445-1453 (1982).
    111. 111. Glasgow, A.C., Bruist. M.F. & Simon, M.I. DNA-binding properties of the Hin recombinase, J Biol Chem 264, 10072-10082 (1989).
    112. 112. Iida, S. et al. The Min DNA inversion enzyme of plasmid p 15B of Escherichia coli 15T-: a new member of the Din family of site-specific recombinases. Mol Microbiol 4, 991-997 (1990).
    113. 113. Rowland, S.J., Stark, W.M. & Boocock, M.R. Sin recombinase from Staphylococcus aureus: synaptic complex architecture and transposon targeting. Mol Microbiol 44. 607-619 (2002).
    114. 114. Kolot, M., Silberstein, N. & Yagil, E. Site-specific recombination in mammalian cells expressing the Int recombinase of bacteriophage HK022. Mol Biol Rep 26, 207-213 (1999).
    115. 115. Cho, E.H.. Nam. C.E.. Alcaraz. R.. Jr. & Gardner, J.F. Site-specific recombination of bacteriophage P22 does not require integration host factor. J Bacteriol 181. 4245-4249 (1999).
    116. 116. Lee, M.H., Pascopella, L., Jacobs, W.R., Jr. & Hatfull, G.F. Site-specific integration of mycobacteriophage L5: integration-proficient vectors for Mycobacterium smegmatis, Mycobacterium tuberculosis. and bacille Calmette-Guerin. Proc Nat1 Acad Sci U S A 88, 3111-3115 (1991).
  • BEISPIEL 18 - AUFNAHME VON 3'-TOE-LOOP IN DIE PRIMER-BINDUNGSSTELLE
  • (PBS) VERBESSERT PEgRNA-AKTIVITÄT
  • Um die PE-Aktivität weiter zu verbessern, erwogen die Erfinder, eine Toe-Loop-Sequenz am 3'-Ende einer PEgRNA mit einem 3'-Extension-Arm hinzuzufügen. 71A zeigt ein Beispiel für eine generische SpCas9-PEgRNA mit einem 3'-Extension-Arm (oberes Molekül). Der 3'-Extension-Arm umfasst wiederum ein RT-Template (welches das gewünschte Edit enthält) und eine Primer-Bindungsstelle (PBS) am 3'-Ende des Moleküls. Das Molekül endet mit einer Poly(U)-Sequenz, die drei U-Nukleobasen umfasst (d.h. 5'-UUU-3').
  • Im Gegensatz dazu zeigt der untere Teil von 71A das gleiche PEgRNA-Molekül wie der obere Teil von 71 A, wobei jedoch eine 9-Nukleobasen-Sequenz von 5'-GAAANNNNN-3' zwischen dem 3'-Ende der Primer-Bindungsstelle und dem 5'-Ende der terminalen Poly(U)-Sequenz inseriert wurde. Diese Struktur faltet sich um 180° auf sich selbst zurück, um eine „Toe-Loop“-RNA-Struktur zu bilden, wobei die Sequenzen von 5'-NNNNN-3' der 9-Nukleobasen-Insertion mit einer komplementären Sequenz in der Primer-Bindungsstelle annealen und wobei der 5'-GAAA-3'-Teil die 180°-Drehung bildet. Die Merkmale der in 71A dargestellten Toe-Loop-Sequenz sollen den Umfang möglicher Toe-Loops, die an ihrer Stelle verwendet werden könnten, nicht beschränken oder schmälern. Außerdem hängt die Sequenz der Toe-Loop von der komplementären Sequenz der Primer-Bindungsstelle ab. Im Wesentlichen kann die Toe-Loop-Sequenz jedoch in verschiedenen Ausführungsformen einen ersten Sequenzabschnitt, der eine 180° bildet, und einen zweiten Sequenzabschnitt aufweisen, der eine Sequenz aufweist, die zu einem Abschnitt der Primer-Bindungsstelle komplementär ist.
  • Ohne an eine Theorie gebunden zu sein, wird angenommen, dass die Toe-Loop-Sequenz der PEgRNA die Verwendung von PEgRNAs mit zunehmend längeren Primer-Bindungsstellen ermöglicht, als dies sonst möglich wäre. Von längeren PBS-Sequenzen wiederum wird angenommen, dass sie die PE-Aktivität verbessern. Die wahrscheinliche Funktion der PEgRNA, genauer gesagt der Toe-Loop, besteht darin, die Interaktion der PBS mit dem Spacer zu verhindern oder mindestens zu minimieren. Eine stabile Haarnadelbildung zwischen der PBS und dem Spacer kann zu einer inaktiven PEgRNA führen. Ohne eine Toe-Loop kann diese Interaktion eine Beschränkung der Länge der PBS erfordern. Ein Blockieren oder Minimieren der Interaktion zwischen dem Spacer und der PBS unter Verwendung einer 3'-Ende-Toe-Loop führt möglicherweise zu einer Verbesserung der PE-Aktivität.
  • BEISPIEL 19 - PRIME EDITING MIT ALTERNATIVEN NUKLEINSÄURE-TEMPLATES UND EDITOR-PROTEINKONSTRUKTEN
  • Vor diesem Beispiel wurde beschrieben, dass Prime Editing eine PEgRNA erfordert. Ausführungsbeispiele, die mögliche Konfigurationen geeigneter PEgRNA zur Verwendung beim Prime Editing beschreiben, sind in 3A (eine PEgRNA mit einem 5'-Extension-Arm), 3B (eine PEgRNA mit einem 3'-Extension-Arm), 3C (eine intern verlängerte PEgRNA), 3D (eine PEgRNA mit einem 3'-Extension-Arm und umfassend eine Primer-Bindungsstelle, ein Edit-Template, einen Homologiearm und optionale 3'- und 5'-Modifikatorbereiche und einen Bereich, der als das DNA-Synthese-Template angegeben ist) und 3E (eine PEgRNA mit einem 5'-Extension-Arm und umfassend eine Primer-Bindungsstelle, ein Edit-Template, einen Homologiearm und optionale 3'- und 5'-Modifikatorbereiche und einen Bereich, der als das DNA-Synthese-Template angegeben ist) dargestellt. Darüber hinaus werden die Struktur und Zusammensetzung von PEgRNA hier in der ausführlichen Beschreibung und überall sonst detailliert beschrieben.
  • Dieses Beispiel beschreibt zusätzliche Designvariationen von PEgRNAs - in einigen Fällen PEgRNAs, die ganz oder teilweise außerhalb der Zelle chemisch synthetisiert werden -, die in Verbindung mit den Prime Editors dieser Patentschrift funktionieren sollten. Solche alternativen Designs können verschiedene Aspekte des Prime Editings verbessern, einschließlich der Insertion längerer DNA-Sequenzen durch Prime-Editing, der Verwendung alternativer Polymerasen (d.h. Alternativen zur reversen Transkriptase), die möglicherweise mit erhöhter Effizienz und/oder Genauigkeit arbeiten, und der Verwendung oder Rekrutierung von alternativen und/oder zusätzlichen Prime Editor-Proteineffektorkomponenten, um das Prime Editing zu verstärken oder zu ergänzen. Darüber hinaus kann die Verwendung chemisch synthetisierter PEgRNAsPEgRNA möglicherweise zur Produktion von Molekülen führen, die stabiler sind und wünschenswerte Eigenschaften besitzen, welche die Effizienz und Fähigkeiten des Prime Editings verstärken.
  • PEgRNAPEgRNAPEgRNAA-PEgRNA dient als das Nukleinsäure-Template, das für die gewünschten editierten genetischen Informationen codiert, die in eine Target-Stelle aufgenommen werden sollen. In einem Aspekt wird eine PEgRNA geschaffen, indem ein Extension-Arm entweder an dem 5'-Ende oder dem 3'-Ende einer sgRNA hinzugefügt wird (z. B. wie in den Ausführungsformen von 3A, 3B, 3D oder 3E gezeigt) oder eine ähnliche Sequenz intern innerhalb einer sgRNA inseriert wird (z.B. wie in der Ausführungsform von 3C gezeigt), wobei der Extension-Arm ein DNA-Synthese-Template umfasst, das in der Lage ist, für ein ssDNA-Produkt durch eine Polymerase (z.B. eine reverse Transkriptase) zu codieren, und welches die editierten interessierenden genetischen Informationen enthält. Der Extension-Arm umfasst eine Primer-Bindungsstelle (PBS) zum Annealen mit dem napDNAbp-genickten genomischen DNA-Strang und ein DNA-Synthese-Template zum Codieren für den gewünschten editierten DNA-Strang, der durch Austausch des DNA-Strang-Gegenstücks in die endogene DNA-Target-Stelle aufgenommen wird. PEgRNA kann innerhalb von Zellen von Plasmid-DNA oder einer genomisch integrierten DNA-Kassette exprimiert werden, oder sie kann außerhalb von Zellen durch In-vitro-Transkription oder durch chemische Synthese hergestellt und anschließend in Zellen abgegeben werden. Die Herstellung von PEgRNAs außerhalb von Zellen, insbesondere durch chemische Synthese, bietet die Möglichkeit, die PEgRNAs wesentlich zu modifizieren. Diese Erfindung beschreibt alternative Designs für Prime Editing-Templates (72).
  • (A) DNA-Synthese-Template, exprimiert als getrennte Moleküle von Guide-RNAs (d.h. DNA-Synthese-Template in trans an den Prime Editor-Komplex (napDNAbp + Guide-RNA) bereitgestellt.
  • Bei verschiedenen hier beschriebenen Ausführungsformen verwendet Prime Editing eine einzelne PEgRNA, die sowohl als programmierbare Targeting-Moleküle als auch als Edit-codierendes Molekül dient. Diese Ausführungsform ist in 72(a) mit einer PEgRNA mit einem 3'-Extension-Arm dargestellt. In einigen Fällen könnte dies jedoch nachteilig sein, insbesondere bei komplexeren PEgRNA-Molekülen, wie etwa solchen, die für eine große Insertion codieren. Diese RNAs könnten eine umfangreiche Sekundärstruktur enthalten, welche die PEgRNA-Gerüststruktur und Interaktionen mit Cas9 stört. Alternativ kann ein Prime Editing durch Ersetzen einer PEgRNA durch zwei separate RNA-Moleküle durchgeführt werden: eine sgRNA und ein trans-Prime Editing-RNA-Template (tPERT), wie in 72(b) dargestellt. Die sgRNA dient dazu, Cas9 (oder allgemeiner das napDNAbp) zur gewünschten genomischen Target-Stelle zu lenken, während tPERT von der Polymerase (z.B. einer reversen Transkriptase) verwendet wird, um eine neue DNA-Sequenz in den Target-Locus zu schreiben.
  • Im Allgemeinen führt eine einfache Expression eines tPERT zu einer geringeren Editing-Effizienz im Vergleich zu einer PEgRNA. Die Effizienz eines trans-Prime Editings kann jedoch durch die Einführung eines oder mehrerer MS2-RNA-Aptamere in die tPERT-RNA zusammen mit einer Fusion des MS2-Hüllproteins (MS2cp) mit dem Prime Editor-Protein (um MS2cp-Cas9-RT herzustellen) verstärkt werden. Dies ermöglicht dem MS2-RNA-Aptamer, an das MS2cp zu binden, wodurch das tPERT (welches das DNA-Synthese-Template umfasst) an die Stelle des Editings durch den Prime Editor-Komplex colokalisiert wird. Das MS2-Aptamer wird vorzugsweise am 3'-Ende von tPERT platziert, um eine reverse Transkription der Aptamersequenz zu vermeiden.
  • Obwohl dieses Beispiel die MS2-Tagging-Technik verwendet (umfassend das MS2-RNA-Aptamer auf dem tPERT gepaart mit dem mit dem Prime Editor fusionierten MS2cp-Protein), können alternativ andere RNA-Protein-Rekrutierungssysteme verwendet werden. Das hier ins Auge gefasste allgemeine Konzept ist, dass das DNA-Synthese-Template des tPERT so modifiziert wird, dass es eine RNA-Rekrutierungs-Sekundärstruktur enthält (z. B. eine spezialisierte Haarnadel wie das MS2-Aptamer), sodass das tPERT durch ein modifiziertes Prime Editor-Fusionsprotein rekrutiert werden kann, das ferner ein RNA-Bindungsprotein umfasst, das spezifisch die RNA-Rekrutierungs-Sekundärstruktur auf dem tPERT-Molekül erkennt und daran bindet. Ein Überblick über andere RNA-Protein-Rekrutierungsdomänen ist auf dem Fachgebiet beispielsweise in Johansson et al., „RNA recognition by the MS2 phage coat protein,“ Sem Virol., 1997, Bd. 8(3): 176-185; Delebecque et al., „Organization of intracellular reactions with rationally designed RNA assemblies,“ Science, 2011, Bd. 333: 470-474; Mali et al., „Cas9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering,“ Nat. Biotechnol., 2013, Bd. 31: 833-838; und Zalatan et al., „Engineering complex synthetic transcriptional programs with CRISPR RNA scaffolds,“ Cell, 2015, Bd. 160: 339-350 beschrieben, die hier jeweils durch Bezugnahme in ihrer Gesamtheit aufgenommen sind. Andere Systeme beinhalten die PP7-Haarnadel, die spezifisch das PCP-Protein rekrutiert, und die „com“-Haarnadel, die spezifisch das Com-Protein rekrutiert. Siehe Zalatan et al. Jedes dieser wohlbekannten Rekrutierungssysteme kann mit trans-Prime Editing verwendet werden, wie hier beschrieben.
  • Die Effizienz des vorliegenden tPERT-trans-Prime Editing-Systems wurde getestet. Unter Verwendung eines tPERT, das ein einzelnes 3'-MS2-Aptamer, eine 13-nt-Primer-Bindungsstelle und ein RT-Template, das die Insertionssequenz und 34 nt Homologie zum Locus enthielt, enthielt, zusammen mit einem Editor, der das mit dem N-Terminus von PE2 fusionierte MS2cp enthielt, wurden bis zu 20 % Effizienz der His6-Insertion (18 bp) an der HEK3-Stelle in HEK293T-Zellen erreicht. Siehe 73. Die Strategie des trans-Prime Editings hat das Potenzial, mit dem PEgRNAPEgRNA-Design assoziierte Komplikationen anzugehen und könnte für längere RT-Templates besser geeignet sein, um größere Insertionen, Deletionen oder Edits in größeren Abständen von der Prime Editor-Nick-Stelle zu erreichen.
  • (B) Chemisch synthetisierte PEgRNAs mit RNA- und DNA-Synthese-Templates
  • Alternative Nukleinsäure-Templates können innerhalb chemisch synthetisierter PEgRNAs verwendet werden (72c). Beispielsweise kann eine synthetische PEgRNA als ein RNA/DNA-Hybrid konstruiert werden, wobei die Spacer-Sequenz und das sgRNA-Gerüst aus RNA-Nukleotiden bestehen und die Primer-Bindungsstelle und das Synthese-Template (in 72c als 3'-Extension gezeigt) aus DNA-Nukleotiden bestehen. Dies könnte eine Verwendung von DNA-abhängigen DNA-Polymerasen anstelle von reverser Transkriptase innerhalb von Prime Editors ermöglichen. Es könnte auch die Synthese von DNA verhindern, die von der sgRNA-Gerüstsequenz templatiert wird. In anderen Designs können chemische Linker, die aus nicht-templatierenden Nukleotiden oder anderen geeigneten Linker-Gruppierungen bestehen, verwendet werden, um das Nukleinsäure-Edit-Template (bestehend aus RNA oder DNA) an das sgRNA-Gerüst zu binden. Dies könnte eine fortgesetzte DNA-Polymerisation des sgRNA-Gerüsts verhindern und Flexibilität bei der Extension ermöglichen, wodurch eine effizientere templatierte Synthese ermöglicht wird. Schließlich kann die Direktionalität des Nukleinsäure-Synthese-Templates umgekehrt werden, so dass die DNA-Polymerisation vom sgRNA-Gerüst weg statt zu diesem hin erfolgt.
  • (C) Rekrutierung der in trans exprimierten DNA-Polymerase
  • In der Hauptausführungsform des Prime Editings wird die Polymerase (z.B. das Reverse-Transkriptase-Enzym) als Fusion mit dem napDNAbp (z.B. Cas9-Nickase) exprimiert. Alternativ kann die Polymerase (z.B. reverse Transkriptase) in trans exprimiert werden, und ihre Aktivität kann an die Edit-Stelle unter Verwendung von Rekrutierungssystemen wie etwa dem MS2-RNA-Aptamer und dem MS2-Hüllprotein oder anderen ähnlichen Rekrutierungssystemen, die auf dem Fachgebiet bekannt sind, lokalisiert werden. In diesem System wird die PEgRNA modifiziert, um ein MS2-Aptamer innerhalb einer der sgRNA-Gerüst-Haarnadeln einzuschließen, und die Polymerase (z.B. reverse Transkriptase) wird als Fusionsprotein mit MS2cp exprimiert. Das napDNAbp (z.B. Cas9-Nickase) wird auch als unabhängiges Polypeptid exprimiert. Dieses System wurde mit der Wildtyp-M-MLV-Reverse-Transkriptase (74) vorgeführt und sollte auf andere RT-Varianten anwendbar sein. Darüber hinaus könnten andere RNA-Protein-Interaktionen oder Protein-Protein-Interaktionen für eine RT-Rekrutierung verwendet werden.
  • Die folgenden Sequenzen sind für Beispiel 19 relevant:
  • Sequenzen von tPERTs:
  • MS2-Aptamer / RT-Template / PBS / Linker
  • 5'-MS2 13nt-PBS:
  •  5'GCCAACATGAGGATCACCCATGTCTGCAGGGCCTGGAGGAAGCAGGGCTTCC
     TTTCCTCTGCCATCAATGATGGTGATGATGGTGCGTGCTCAGTCTG - 3' (SEQ
     ID NO: 762)
  • 5'-MS2_17nt-PBS:
  •  5'GCCAACATGAGGATCACCCATGTCTGCAGGGCCTGGAGGAAGCAGGGCTTCC
     TTTCCTCTGCCATCAATGATGGTGATGATGGTGCGTGCTCAGTCTGGGCC - 3'
     (SEQ ID NO: 773)
  • 3'-MS2_13nt-PBS:
  •  5'GGAGGAAGCAGGGCTTCCTTTCCTCTGCCATCAATGATGGTGATGATGGT
     GCGTGCTCAGTCTGAAATTAACAAATCAAGCCAACATGAGGATCACCCATGTCT
     GC:AGGGC:C: - 3' (SEQ ID NO: 774)
  • 3'-MS2:17nt-PBS:
  •  5'GGAGGAAGCAGGGCTTCCTTTCCTCTGCCATCAATGATGGTGATGATGGT
     GCGTGCTCAGTCTGGGCCAAATTAACAAATCAAGCCAACATGAGGATCACCCAT
     GTCTGCAGGGCC - 3' (SEQ ID NO: 775)
  • Sequenzen von MS2-PEgRNAs:
  • Spacer / MS2-Aptamer / sgRNA-Gerüst / RT-Template / PBS
  • HEK3 _MS2 1
  •  5'GGCCCAGACTGAGCACGTGAG777T4CAGCTAGGCCAACATCAGGATCACCCA
     TGTGTGCAGGGCCTA GCAAG7IAAAA7AAGGCTAG7CCG17ACAACTTGAAAAAGTG
     GGACCGAGTCGGTCCTCTGCCATCTCGTGCTCAGTCT - 3' (SEQ ID NO: 776)
  • HEK3_MS2_2
  •  5'GGCCCACACTCAGCACCTGAG777TAGAGCTAGAAA TAGCAAGITAAAATAAGGC
     TAGTCCGTTATCAACIGGCCAACAGAGGATCACCCATGTCGCAGGGCCAAGTG
     GGACCGAGTCGGTCCTCTGCCA TCTCGTGCTCAGTCT - 3' (SEQ ID NO: 777)
  • Proteinsequenzen:
  • Figure DE112020001339T5_0380
    Figure DE112020001339T5_0381
  • BEISPIEL 20. SPLIT-INTEIN-ABGABE VON PRIME EDITORS
  • Dieses Beispiel zeigt auf, dass ein Prime Editor unter Verwendung von Inteinen getrennt werden kann, um den Prime Editor über separate Vektoren an Zellen abzugeben, wobei jeder Vektor für einen Teil des Prime Editor-Fusionsproteins codiert. Dieses Beispiel konzentriert sich auf ein PE-Fusionsprotein, welches das kanonische SpCas9 (SEQ ID NO: 18) umfasst. Die Split-Stellen für andere Cas9-Proteine können die entsprechende gleiche Stelle sein oder müssen möglicherweise für jedes andere Cas9-Protein optimiert werden. Im vorliegenden Beispiel wurde der Prime Editor zwischen den Resten 1023 und 1024 von SpCas9 (SEQ ID NO: 18) getrennt. Dies wird als „1023/1024“-Split-Stelle bezeichnet.
  • Prime Editors (PEs) überschreiten die AAV-Verpackungskapazität. Es wurde daher in Erwägung gezogen, das PE durch Insertion eines trans-spleißenden Npu-Inteins am S. pyogenes-Cas9-Rest 1024 in SEQ ID NO: 18 aufzutrennen, was eine Abgabe von Split-SpPEs als zwei separate Polypeptide ermöglicht, von denen für jedes von einem Dual-AAV-System codiert wird. Die Split-Stelle 1023/1024 wurde gewählt, weil (1) sie ein Verpacken in zwei AAVs ermöglicht und gleichzeitig Platz für eine oder mehrere Guide-Kassette(n) und minimale regulatorische Elemente bietet, (2) eine Mutation des nativen Serins zu Cystein relativ konservativ wäre, (3) die Stelle eine flexible Schleife in der Nähe der Peripherie von Cas9 ist, von der sterisch vorhergesagt wird, dass sie das Auftreten eines Spleißens zulässt, und (4) Cas9 in dieser Schleife erfolgreich durch zirkuläre Permutation geändert wurde (jedoch noch nicht an dieser konkreten Split-Stelle).
  • Um zu bestimmen, ob Npu-Split-Prime Editors aktiv sind, wurden HEK-Zellen mit Plasmiden transfiziert, die für Split-Editors codieren, wobei festgestellt wurde, dass sie die Aktivität von PE3 voller Länge wieder aufnehmen, wie durch Hochdurchsatz-Sequenzierung analysiert. Darüber hinaus ist bekannt, dass die drei nativen aminoterminalen Npu-Reste eines C-terminalen Exteins am effizientesten spleißen, sich jedoch von denen unterscheiden, die den Cas9-Rest 1024 nativ flankieren. Ein Ersatz dieser Cas9-Reste durch die nativen Npu-Reste ändert möglicherweise die Aktivität des Prime Editors. Es wurde daher bestimmt, ob eine Mutation von der Cas9-nativen „SEQ“-Sequenz in Richtung der Npu-Intein-„CFN“-Sequenz die Effizienz des Prime Editings ändert. Die „SEQ“-Reste ermöglichen ein Prime Editing mit ähnlicher Effizienz wie die Sequenz voller Länge, was nahelegt, dass die Intein-Split-PE-Hälften assoziieren und ein Prime Editing vermitteln können. Durch eine Mutation in Richtung „CFN“ wurde kein weiterer Anstieg beobachtet, was nahelegt, dass eine Assoziation allein für eine Split-PE-Aktivität ausreichen kann, wie wir bereits bei Intein-Split-Basen-Editors beobachtet haben.
  • Obwohl assoziierte, ungespleißte Editors aktiv sein können, können sterische Störungen des Prime Editors, die aus unvollständigem Spleißen während der Initiationsschritte resultieren, die Editing-Ergebnisse beeinflussen. Daher wurde 1024-CFN für weitere Studien ausgewählt, da es auch die Aktivität von PE3 voller Länge wieder aufnimmt.
  • Im Folgenden sind die Aminosäuresequenzen des 1023/1024-Splits aufgeführt.
  • SpPE2-Split bei 1023/1024, N-terminale Hälfte
    Figure DE112020001339T5_0382
  • Legende: NLS, Cas9, mutierte Reste, Linker, NpuN-Intein, NpuC-Intein, RT
  • SpPE2-Split bei 1023/1024, C-terminale Hälfte
  • Figure DE112020001339T5_0383
  • Legende: NLS, Cas9, mutierte Reste, Linker, NpuN-Intein, NpuC-Intein, RT
  • Prime Editor-Pakete in einem dualen AAV-System
  • Prime Editoren, die zwischen den Resten 1023 und 1024 mit Npu-transspleißendem Intein getrennt werden, werden innerhalb von AAV zu Paketen mit einem hohen Titer, der mit dem von Basen-Editors ähnlicher Genomgröße vergleichbar ist, die auf die gleiche Weise hergestellt werden.
  • Prime Editing in vivo
  • Split-SpPE3, das mit AAV9 durch intrazerebroventrikuläre Injektion an P0-Mäuse abgegeben wird, vermittelt in vivo ein Prime Editing im Hirngewebe. Eine Nukleotidsubstitution an Position +5 (d.h. 5 Nukleotidbasen stromabwärts der Nick-Stelle und innerhalb der PAM-Sequenz) von G zu T führt zum Einbau einer Pro>Glncodierenden Mutation nahe dem N-Terminus von DNMT1. Dieses Edit zeigt die Durchführbarkeit eines Prime Editings in vivo auf und es wird nicht angenommen, dass es einen Selektionsdruck auf editierte Zellen ausübt (wobei sich „+5“ auf die +5-Position stromabwärts der Nick-Stelle bezieht). Die getesteten AAV-Architekturen beinhalten eine MMLV-RT voller Länge sowie eine trunkierte Variante, der die RNAse H-Domäne fehlt. Das trunkierte posttranskriptionelle regulatorische Element W3 wurde ebenfalls analysiert, da gezeigt wurde, dass es die Expression aus viralen Kassetten in vivo erhöht, seine Bedeutung jedoch noch nicht im Kontext von Basen-Editors oder Prime Editors getestet wurde. Es wurde festgestellt, dass RT voller Länge trunkierte RT übertrifft und das Hinzufügen der W3-Sequenz die Aktivität verbessert. Die Zunahme der Editing-Aktivität, wenn W3 vorhanden ist, weist darauf hin, dass die Prime Editor-Expression in vivo limitiert ist und zeigt die besonderen Herausforderungen des Prime Editings in vivo gegenüber Zellkultur.
  • Literaturstellen
  • Oakes, B.L., Fellmann, C. et al. CRISPR-Cas9 Circular Permutants as Programmable Scaffolds for Genome Modification. Cell. 2019 Jan 10;176(1-2):254-267.e16. doi: 10.1016/j.cell.2018.11.052.
  • BEISPIEL21. LINKER-OPTIMIERUNG IM PE2-FORMAT
  • Dieses Beispiel konstruierte eine Reihe von Prime Editor-Varianten, die alle auf PE2 basierten. PE2 hat folgende Sequenz und Struktur:
  • Im hier verwendeten Sinne bezieht sich „PE2“ auf einen PE-Komplex, umfassend ein Fusionsprotein, das Cas9(H840A) und eine MMLV RT-Variante umfasst, mit der folgenden Struktur: [NLS]-[Cas9(H840A)]-[Linker]-[MMLV_RT(D200N)(T330P)(L603W)(T306K)(W313F)] + eine gewünschte PEgRNA, wobei die PE-Fusion die Aminosäuresequenz von SEQ ID NO: 134 aufweist, die wie folgt dargestellt ist:
    Figure DE112020001339T5_0384
  • LEGENDE:
  • KERNLOKALISIERUNGSSEQUENZ (NLS) OBEN: (SEQ ID NO: 124), UNTEN: (SEQ ID NO: 133)
    CAS9(H840A) (SEQ ID NO: 137)
    33-AMINOSÄURE-LINKER (SEQ ID NO: 127)
  • M-MLV Reverse Transkriptase (SEQ ID NO: 139).
  • Der PE2-Linker ist SGGSSGGSSGSETPGTSESATPESSGGSSGGSS (SEQ ID NO: 127).
  • In diesem Versuch wurde der Linker von PE2 durch einen der folgenden Ersatz-Linker ersetzt (oder in einem Fall kein Linker):
    Linker Name Nukleotidsequenz Aminosäuresequenz
    1x SGGS TCCGGAGGATCT (SEQ ID NO: 3880) SGGS (SEQ ID NO: 3887)
    2x SGGS TCCGGAGGATCTAGCGGAGGCTCC (SEQ ID NO: 3881) SGGSSGGS (SEQ ID NO: 3888)
    3x SGGS TCCGGAGGATCTAGCGGAGGCTCCA GCGGAGGCAGC (SEQ ID NO: 3882) SGGSSGGSSGGS (SEQ ID NO: 3889)
    1x XTEN TCTGGCTCTGAGACACCTGGCACAAG CGAGAGCGCAACACCTGAAAGC (SEQ ID NO: 3883) SGSETPGTSESATPES (SEQ ID NO: 3890)
    No linker
    1x Glv GGT G
    1x Pro CCC P
    1x EAAAK GAAGCAGCTGCTAAA (SEQ ID NO: 3884) EAAAK (SEQ ID NO: 3891)
    2x EAAAK GAAGCCGCTGCTAAAGAAGCTGCAG CTAAG (SEQ ID NO: 3885) EAAAKEAAAK (SEQ ID NO: 3892)
    3x EAAAK GAAGCCGCTGCTAAAGAGGCCGCTG CTAAAGAAGCTGCAGCTAAG (SEQ ID NO: 3886) EAAAKEAAAKEAAAK (SEQ ID NO: 3893)
  • 79 zeigt die Editing-Effizienz der Ersatz-Linker-Konstrukte. Insbesondere zeigen die Daten die Editing-Effizienz des PE2-Konstrukts mit dem aktuellen Linker (als PE2 gekennzeichnet - weiße Box) im Vergleich zu verschiedenen Versionen, bei denen der Linker durch eine Sequenz ersetzt wurde, wie an den HEK3-, EMX1-, FANCF-, RNF2-Loci für repräsentative PEgRNAs für Transitions-, Transversions-, Insertions- und Deletions-Edits angegeben. Die Ersatz-Linker werden als „1x SGGS“, „2x SGGS“, „3x SGGS“, „1x XTEN“, „kein Linker“, „1x Gly“, „1x Pro“, „1x EAAAK“, „2x EAAAK“ und „3x EAAAK“ bezeichnet. Die Editing-Effizienz wird im Balkendiagrammformat relativ zur „Kontroll“-Editing-Effizienz von PE2 gemessen. Der Linker von PE2 ist SGGSSGGSSGSETPGTSESATPESSGGSSGGSS (SEQ ID NO: 127). Das gesamte Editing wurde im Rahmen des PE3-Systems durchgeführt, d.h. in Bezug auf das PE2-Editing-Konstrukt plus die Hinzufügung des optimalen sekundären sgRNA-Nicking-Guides.
  • 80 zeigt, dass der 1x-XTEN-Linker eine Steigerung der Editing-Effizienz bot. Die durchschnittliche fache Wirksamkeit in Bezug auf PE2 ergibt das gezeigte Diagramm, das darauf hindeutet, dass eine Verwendung einer 1x-XTEN-Linker-Sequenz die Editing-Effizienz im Durchschnitt um das 1,14-Fache verbessert (n = 15).
  • BEISPIEL 22. PRIME EDITOR-GUIDE-RNAs MIT VERBESSERTEN AKTIVITÄTEN
  • In verschiedenen Ausführungsformen ist PEgRNA wahrscheinlich Target-DNA-Stelle-und Edit-abhängig. Das heißt, die Sequenz der PEgRNA hängt von der Target-DNA-Sequenz und dem konkreten Edit ab, das darin durch Prime Editing eingeführt wird (z.B. Deletion, Insertion, Inversion, Substitution). Zum Beispiel ist in bestimmten Ausführungsformen beim Anbringen eines Motivs 3' der Primer-Bindungsstelle (PBS) der PEgRNA ein Linker zwischen der PBS und dem Motiv bevorzugt, um einen sterischen Zusammenstoß mit der Polymerasedomäne (z. B. reverse Transkriptase) des PE-Fusionsproteins zu verhindern. Die Art dieses Linkers kann jedoch für jede Stelle unterschiedlich sein. Wenn beispielsweise derselbe Linker für jede Stelle verwendet würde, könnte er durch zufällige Paarung mit der Spacer-Sequenz künstlich eine 13 nt PBS zu einer 16 nt PBS machen. In ähnlicher Weise könnte der Linker mit der PBS selbst Basenpaare bilden, was zu seiner Verdeckung und möglicherweise zu einer Verringerung der Aktivität führt. Anders als bei proteinbasierten Editors, wie etwa PE oder BE4, ist eine einzelne Linker-Sequenzoption, die zwei Elemente verbindet, möglicherweise nicht in jedem Konstrukt wirksam, sondern hängt teilweise von der Sequenz der Target-DNA-Sequenz und dem interessierenden Edit ab.
  • Zum Teil aufbauend auf den in Beispiel 15 (Design und technische Entwicklung von PEgRNAs) präsentierten Informationen wurden in diesem Beispiel verschiedene strukturelle Modifikationen an PEgRNA konstruiert und dann unter anderen Aspekten die Auswirkungen dieser auf die Editing-Funktion getestet.
  • Expression von PEgRNAs von Nicht-polIII-Promotoren
  • Eine Vielfalt von PEgRNA-Expressionssystemen wurde auf ihre Fähigkeit zur Erzeugung von PEgRNAs getestet, wobei eine Insertion einer 102-Nukleotid-Sequenz aus FKBP als Ablesung verwendet wurde.
  • Die Transkription von PEgRNA kann durch einen typischen konstitutiven Promotor wie dem U6-Promotor gesteuert werden. Obwohl der U6-Promotor in den meisten Fällen die Transkription von PEgRNAs wirksam steuert, ist der U6-Promotor bei der Steuerung der Transkription von längeren PEgRNAs oder U-reichen RNAs nicht sehr wirksam. U-reiche RNA-Abschnitte verursachen eine vorzeitige Beendigung der Transkription. Dieses Beispiel verglich Editing-Ergebnisse von Guides, die vom CMV-Promotor oder U1-Promotor exprimiert wurden, mit dem U6-Promotor. Diese Promotoren erfordern eine andere Terminatorsequenz, wie etwa MASC ENE oder PAN ENE, wie unten angegeben. Mit dem pCMV/MASC-ENE-System wurde eine Zunahme des Editings beobachtet, jedoch führten diese Guides zu einer unvollständigen Insertion der Sequenz, während mit dem U6-Promotor eine vollständige Insertion bei niedrigeren Editing-Niveaus beobachtet wurde. Siehe 81. Die Daten legen die Wahrscheinlichkeit nahe, dass die alternativen Expressionssysteme möglicherweise für lange Insertionen nützlich sind.
  • Die Nukleotidsequenz der pCMV/MASC-ENE-Expressionssysteme lautet wie folgt (5'-nach-3'-Richtung) (mit dem Namen des Motivs in Fettdruck unmittelbar vor dem Bereich, auf den es sich bezieht):
  • -pCMV-Promotor-
    Figure DE112020001339T5_0385
    Figure DE112020001339T5_0386
    Figure DE112020001339T5_0387
  • Legende:
  • [pCMV-Promotor] - bindet pol II RNA-Polymerase
    [Csy4-Schleife] - gebunden durch Csy4-Protein, führt zur Spaltung 3' der Schleife. Erforderlich, weil ein Teil des [CMV-Promotors] transkribiert wird, und wenn diese Sequenz 5' der gRNA angebracht ist, verringert/eliminiert sie die Aktivität (bereits bekannt).
    [Spacer-Sequenz] von pegRNA
    [pegRNA-Gerüst]
    [DNA-Synthese-Template]
    [Insertions-Edit (108 nt von FKBP)]
    [Primer-Bindungsstelle]
    [Linker] (sehr variabel) - verbindet PBS und Terminatorelement
    [MASC ENE-Transkriptionsterminator] - eine Transkription dieses Elements führt zur Beendigung der Transkription; ein polyA-Schwanz wird codiert und dann vom ENE-Element sequestriert
    [unwichtige Sequenz]
    [Ubc-Promotor] - erforderlich für die Expression des Csy4-Proteins
    [Csy4-Protein und NLS] - erforderlich für die Prozessierung des 5'-Endes des Guides. Es könnten auch andere Strategien verwendet werden, die keine Expression eines großen Proteins erfordern (wie etwa die Ribozym-vermittelte Spaltung des Spacers), wobei diese jedoch eine individuellere Abstimmung für verschiedene Spacer-Sequenzen erfordern würden, also haben wir diese verwendet.
    [SV40-Terminator] - zur Termination des Csy4-Proteins.
  • Verbesserungen am PEgRNA-Gerüst
  • Es wurde auch eine Reihe von strukturellen Modifikationen am gRNA-Gerüst getestet, von denen keine eine signifikante Erhöhung der Editing-Aktivität zeigte (siehe 82 bei 3.30.13 bis 3.30.19 auf der X-Achse im Vergleich zu 3.30). Diese Daten haben jedoch zwei beachtenswerte Vorbehalte. Erstens hat dieser Guide bereits recht gut funktioniert, und ein weniger effektiver Guide wäre zum Testen besser gewesen. Zweitens ist die Transfektion in HEK-Zellen ziemlich effizient, und es wurde festgestellt, dass die Menge an transfizierter Guide-RNA im Vergleich zu dem, was benötigt wird, in großem Überschuss ist (eine Verringerung der Menge um das -4- bis 8-Fache hat keinen Einfluss auf das Editing). Diese Verbesserungen sind möglicherweise nur bei anderen Zelltypen zu sehen, bei denen die Transfektionseffizienz geringer ist oder mit weniger wirksamen Guides. Von vielen dieser Änderungen ist bereits bekannt, dass sie die sgRNA-Aktivität in anderen Zelllinien verbessern.
  • Die Sequenzen der Konstrukte von 82 sind wie folgt:
    Figure DE112020001339T5_0388
    Figure DE112020001339T5_0389
    Figure DE112020001339T5_0390
    Figure DE112020001339T5_0391
  • Man beachte, dass immer entweder kein terminales Motiv oder ein terminales Motiv, das nicht in einer Reihe von Us endet, vorliegt, Transkript mit dem folgenden HDV-Ribozym terminiert wurde:
  •  GGCCGGCAUGGUCCCAGCCUCCUCGCUGGCGCCGGCUGGGCAACAUGCUUCGG
     CAUGGCGAAUGGGAC [SEQ ID NO: 3923]
  • Zusätzliche RNA-Motive
  • Siehe 82 für Details zu bestimmten Motiven, wie etwa einem HDV-Ribozym 3' der PEgRNA oder G-Quadruplex-Insertion, P1-Extensions, Template-Haarnadeln und Tetraloop-Circ'd, die in eine PEgRNA eingeführt werden können, um ihre Leistung zu verbessern.
  • Dieses Beispiel testete insbesondere die Wirkung des Einbauens eines tRNA-Motivs 3' der Primer-Bindungsstelle. Dieses Element wurde aufgrund mehrerer potenzieller Funktionen gewählt:
  • (1) das tRNA-Motiv ist ein sehr stabiles RNA-Motiv und könnte daher potenziell den PEgRNA-Abbau verringern;
  • (2) die MMLV-RT verwendet eine Prolyl-tRNA als Primer bei der Umwandlung des viralen Genoms in DNA während der Transkription, daher wurde vermutet, dass dieselbe Cap von der RT gebunden werden könnte, was die Bindung der PEgRNA durch PE und die RNA-Stabilität verbessert und die PBS wieder in näher an die Genomstelle bringt, wodurch potenziell auch die Aktivität verbessert wird.
  • In diesen Konstrukten wurde das P1 der tRNA (siehe 84) verlängert. P1 bezieht sich auf das erste Stamm/Basenpaarungselement der tRNA (siehe 84). Dies wurde als notwendig erachtet, um eine RNAseP-vermittelte Spaltung der tRNA 5' von P1 zu verhindern, was zu dessen Entfernung von der PEgRNA führen würde.
  • In diesem Design wurde eine Prolyl-tRNA (Codon CGG) mit einem verlängerten P1 und einem kurzen 3 nt-Linker zwischen der tRNA und der PBS verwendet. Eine Vielfalt von tRNA-Designs wurde getestet, und die Editing-Effizienz wurde im Vergleich zu einer PEgRNA ohne tRNA-Cap getestet - siehe die Vergleichsdaten in 83 (Darstellung eines PE-Versuchs, der auf ein Editing des HEK3-Gens abzielte, insbesondere auf die Insertion einer 10 nt-Insertion an Position +1 in Bezug auf die Nick-Stelle und unter Verwendung von PE3); 85 (Darstellung eines PE-Versuchs, der auf ein Editing des FANCF-Gens abzielte, insbesondere auf eine G-zu-T-Umwandlung an Position +5 in Bezug auf die Nick-Stelle und unter Verwendung des PE3-Konstrukts) und 86 (Darstellung eines PE-Versuchs, der auf ein Editing des HEK3-Gens abzielte, insbesondere auf die Insertion einer 71 nt-FEAG-Tag-Insertion an Position +1 in Bezug auf die Nick-Stelle und unter Verwendung des PE3-Konstrukts). tRNA-modifizierte PEgRNAs wurden gegen eine nicht-modifizierte PEgRNA-Kontrolle getestet.
  • UGG/CGG bezieht sich auf das verwendete Codon, die Zahl bezieht sich auf die Länge der hinzugefügten P1-Extension, lang bezeichnet einen 8 nt-Linker, keine Bezeichnung einen 3 nt-Linker.
  • Die Daten legen nahe, dass der Einbau einer tRNA eine Verwendung kürzerer PBSs ermöglichen könnte, was wahrscheinlich zu zusätzlichen Aktivitätsverbesserungen führen würde. Im Fall von RNF2 ist es möglich/wahrscheinlich, dass der verwendete Linker zu einer verbesserten PBS-Bindung an den Spacer und der daraus resultierenden Aktivitätsminderung führte.
  • Einige verwendete Sequenzen:
  • HEK3 +1 FEAG-Tag-Insertion, Proly-tRNA{UGG} P1 Ext. 5 nt, Linker 3 nt
  •   GGCCCAGACUGAGCACGUGAGUUUUAGAGCUAGAAAUAGCAAGUUAAA
     AUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUGGA
     GGAAGCAGGGCUUCCUUUCCUCUGCCAUCACUUAUCGUCGUCAUCCUUGUAAU
     CCGUGCUCAGUCUGUCUGGCGGGGCUCGUUGGUCUAGGGGUAUGAUUCUCGCU
     UCGGGUGCGAGAGGUCCCGGGUUCAAAUCCCGGACGAGCCCCGCCUUUU [SEQ
     ID NO: 3902]
  • FANCF +5 G zu T Proly-tRNA{CGG} P1 Ext. 5 nt, Linker 3 nt
  •  GGAAUCCCUUCUGCAGCACCGUUUUAGAGCUAGAAAUAGCAAGUUAAA
     AUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCGGAA
     AAGCGAUCAAGGUGCUGCAGAAGGGAUCUGGCGGGGCUCGUUGGUCUAGGGG
     UAUGAUUCUCGCUUCGGGUGCGAGAGGUCCCGGGUUCAAAUCCCGGACGAGCC
     CCGCCUUUU [SEQ ID NO: 3903]
  • HEK3 ++1 10 nt-Insertion, Proly-tRNA{UGG} P1 Ext. 5 nt, Linker 3 nt
  •  GGCCCAGACUGAGCACGUGAGUUUUAGAGCUAGAAAUAGCAAGUUAAA
     AUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGGACCGAGUCGGUCCUCUG
     CCAUCAAAGCUUCGACCGUGCUCAGUCUUCUGCUCGAGGCGGGGCUCGUUGGU
     CUAGGGGUAUGAUUCUCGCUUCGGGUGCGAGAGGUCCCGGGUUCAAAUCCCGG
     ACGAGCCCCGCCUCGAGCUUUU [SEQ ID NO: 3904]
  • Die in den Daten von 85 und 86 berichteten Sequenzen sind wie folgt:
    Figure DE112020001339T5_0392
    Figure DE112020001339T5_0393
    Figure DE112020001339T5_0394
    Figure DE112020001339T5_0395
  • BEISPIEL 23. VERWENDUNG VON PRIME EDITING ZUR KORREKTUR VON CDKL5 und SICHELZELLANÄMIE
  • Verwendung von PE zum Design eines Mausmodells von CDKL5 mit 1412delA-Mutation
  • Das CDKL5-Mangel-Syndrom (CDD) ist eine neurodegenerative Krankheit, die am häufigsten durch spontane Mutationen im cyclinabhängigen Kinase-ähnlichen 5-Gen hervorgerufen wird. Die Symptome manifestieren sich in der frühen Kindheit und beinhalten Krampfanfälle, unregelmäßige Schlafmuster, Magen-Darm-Probleme und Entwicklungsverzögerungen. Einige Mutationen, die CDD hervorrufen, einschließlich 1412delA, können mit Base Editing nicht korrigiert werden. Das Prime Editing hat jedoch das Potenzial, alle Änderungen, Deletionen und Insertionen von Base-zu-Base präzise zu korrigieren. Mit Fokus auf die 1412delA-Mutation entwarf und testete dieses Beispiel pegRNAs, welche in der Lage waren, die Mutation inserieren können, in der Hoffnung, eine neuronale Zelllinie (N2A) der Maus zu etablieren, welche die Mutation trägt. Dies wird ein umfassendes Screening potenziell therapeutischer pegRNAs ermöglichen, welche die Mutation korrigieren. Das ultimative Ziel ist es, in ein CDD-Mausmodell mit der 1412delA-Mutation übergehen zu können, um therapeutische Wirkungen zu beurteilen. Keine aktuellen Mausmodelle von CDD weisen ein humanisiertes Allel auf, jedoch ist die Optimierung von pegRNAs auch in HEK293T-Zellen im Gange. 87 und 88 zeigen die Ergebnisse eines Pilot-Screenings in N2A-Zellen, wo die pegRNA 1412Adel einbaut, mit Details über die Länge der Primer-Bindungsstelle (PBS) und der Reverse Transkriptase(RT)-Template-Länge. (Gezeigt mit und ohne Indels)
  • Verwendung von PE zur Behandlung der Sichelzellenanämie (SCA)
  • Die Sichelzellanämie (SCA) ist eine rezessive Bluterkrankung, die durch eine Glutamat-zu-Valin-Mutation an Position 6 im β-Globin-Gen hervorgerufen wird. Das Ergebnis sind sichelförmige rote Blutkörperchen, die schlechte Sauerstofftransporter sind und zur Aggregation neigen. Die Symptome einer Aggregation können lebensbedrohlich sein. Das Labor von D. Liu konnte bereits sowohl den Einbau als auch die Korrektur des SCA-Locus in HEK293T-Zellen unter Verwendung von Prime Editing mittels DNA-Plasmid-Transfektion zeigen. Da hämatopoetische Stammzellen (HSCs) durch DNA-Plasmid-Transfektion schwer zu editieren sind, testete dieses Beispiel das PE3-System in HSCs mit Protein- und mRNA-Nukleofektion. 89 zeigt die Ergebnisse eines Editings an einem Proxy-Locus im β-Globin-Gen und an HEK3 in gesunden HSCs, wobei die Konzentration von Editor zu pegRNA und Nicking-gRNA variiert wurde.
  • mRNA-Nukleofektionsvorschrift:
  • Die Vorschrift wurde verbessert, indem das Verhältnis von Editor zu Guides angepasst wurde ([Editor]-zu-[Guide]-Verhältnis oder Editor:Guide-Verhältnis)
  • Die Nicking-Guide-Protospacer-Sequenz wCCTTGATACCAACCTGCCCA
  • Die pegRNA-Sequenz war:
  •  CATGGTGCACCTGACTCCTGGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGC
     TAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCAGACTTCTCTTCAG
     GAGTCAGGTGCACTTT
  • 1. CD34+-Zellen auftauen und in X-Vivo15-Medium mit Zytokinen (SCF, Flt3 und TPO) 24 h vorstimulieren. Aussaatdichte 1 Million Zellen/ml.
  • 2. Am nächsten Tag (nach 24 h) CD34+-Zellen (1 x 105) absaugen und einmal mit PBS waschen (zentrifugieren bei 300 g für 10 min bei RT) und in P3-Lösung (Lonza) (20 µl pro Bedingung) resuspendieren.
  • 3. Unter einem Abzug 2 g SpPE2-mRNA und 1 µg einer Kombination aus pegRNA und sgRNA in einem sterilen PCR-Streifen auf Eis kombinieren. Das Volumen auf 20 µl auffüllen (Zellen in P3-Lösung + mRNA & gRNA-Mix).
  • 4. Zellsuspension in 20 µl Lonza4D 16-Well-Streifen pipettieren und mit Programm DS 130 elektroporieren.
  • 5. Nach der Elektroporation 10 bis 15 min warten und 80 µl X-Vivo10+Zytokin-Medium der Zellsuspension zusetzen und in vorgewärmtes X-Vivo10 mit Zytokin-Medium überführen.
  • 6. Die Zellen 72 Stunden nach der Elektroporation ernten und die Zellgewinnung überprüfen und Genotypisierung in der Bulk-Population sowie in sortierten CD34+- und CD34+90+-Populationen durchführen.
  • Wildtyp-CDKL5-Protein (Zugangsnummer NP 001032420) (Isoform 1 - Mensch)
  • Figure DE112020001339T5_0396
  • Wildtyp-CDKL5-Protein (Zugangsnummer NP 001310218) (Isoform 2 - Mensch)
  • Figure DE112020001339T5_0397
  • BEISPIEL 24. VERWENDUNG VON PRIME EDITING ZUM ABZIELEN AUF PATHOGENE AOL1-ALLELE ALS BEHANDLUNG FÜR NICHT-DIABETISCHE CHRONISCHE NIERENKRANKHEIT
  • Dieses Beispiel entwarf PEgRNAs, die in der Lage sind, auf pathogene APOL1-Allele für eine Verwendung mit Prime Editing abzuzielen, um eine Nierenkrankheit zu behandeln oder die Wahrscheinlichkeit an einer solchen zu erkranken, zu verringern.
  • Nierenversagen im Endstadium (ESKD) ist ein wachsendes Problem, von dem mittlerweile über eine halbe Million Menschen in den Vereinigten Staaten betroffen sind. Die Kosten für die Versorgung von Patienten mit ESKD belaufen sich derzeit auf über 40 Milliarden Dollar pro Jahr. In den USA ist die Wahrscheinlichkeit, dass Personen afrikanischer Abstammung eine ESKD entwickeln, 4- bis 5-mal höher als bei Amerikanern ohne afrikanische Vorfahren. Diese Tatsachen spiegeln sich in der Diskrepanz zwischen den 12-13 % der US-Bevölkerung mit afrikanischer Abstammung und den 40 % der US-Dialysepatienten wider, die Afroamerikaner sind. Die Epidemie von Risikofaktoren für Nierenkrankheiten wie etwa Fettleibigkeit und metabolisches Syndrom legt nahe, dass das Ausmaß dieses Problems nur zunehmen wird.
  • Für die allermeisten progressiven Nierenkrankheiten gibt es keine speziellen Therapien. Einige Arten des Fortschreitens einer chronischen Nierenkrankheit können durch eine Blutdruckkontrolle mit bestimmten Wirkstoffen verlangsamt werden, aber Nephrologen können nicht genau vorhersagen, welche Patienten darauf ansprechen. Darüber hinaus verlangsamt eine erfolgreiche Behandlung typischerweise das Fortschreiten, verhindert jedoch weder die Krankheit noch stoppt sie das Fortschreiten der Krankheit.
  • Kürzlich wurde festgestellt, dass bestimmte genetische Varianten, welche die Proteinsequenz von APOlipoprotein-L1 (APOL1) ändern, mit einer progressiven Nierenkrankheit assoziiert sind. Überraschenderweise haben APOL1-Nierenkrankheitsvarianten einen großen Einfluss auf mehrere verschiedene Arten von Nierenkrankheiten, einschließlich der Hypertonie-assoziierten Nierenkrankheit im Endstadium (H-ESRD), der fokalen segmentalen Glomerulosklerose (FSGS) und der HIV-assoziierten Nephropathie (HIVAN). Personen mit diesen Varianten von APOL1-Allelen haben ein 7-30-fach erhöhtes Risiko für eine Nierenkrankheit. Aufgrund der hohen Häufigkeit dieser APOL1-Risikoallele haben wahrscheinlich mehr als 3,5 Millionen Afroamerikaner den Hochrisiko-APOL1-Genotyp. Afroamerikaner ohne den Hochrisiko-Genotyp haben im Vergleich zu Amerikanern europäischer Abstammung ein geringes zusätzliches Risiko.
  • Trotz Hinweise darauf, dass Varianten des APOL1-Gens Nierenkrankheiten hervorrufen, ist über die Biologie seines Produkts, APOL1 oder seine Rolle in der Niere nur sehr wenig bekannt. APOL1 spielt eine definierte Rolle bei der Resistenz gegen Trypanosomen, und die G1- und G2-Varianten scheinen in Afrika weit verbreitet zu sein, da sie Schutz gegen die Formen von Trypanosomen bieten, welche die Afrikanische Schlafkrankheit verursachen.
  • Es besteht immer noch ein Bedarf an Therapien für Nierenkrankheiten bei Patienten mit einem oder mehreren APOL1-Risikoallelen, die bei dieser und anderen betreffenden Populationen eine hohe Morbidität und Mortalität mit hohen wirtschaftlichen Auswirkungen verursachen.
  • Dieses Beispiel stellt drei exemplarische PEgRNA-Designoptionen bereit, die auf einer konkreten exemplarischen Target-Sequenz basieren, die mit Prime Editing verwendet werden kann, um APOL1-defekte Allele zu korrigieren.
  • PEgRNA 1
  • Design von PEgRNAs für das APOL1-Allel rs73885319 (p.S342G). Dies stellt eine G→A-Korrektur bei betroffenen Personen dar. Die Target-Sequenz ist
    Figure DE112020001339T5_0398
  • Der Protospacer (oben fettgedruckt) ist AAGCTCACGGATGTGGCCCC. Das gewählte PE umfasst ein SaCas9(D10A).
  • Die Primer-Bindungsstellen können sein:
    GTGGCCCC
    TGTGGCCCC
    ATGTGGCCCC
    GATGTGGCCCC
    GGATGTGGCCCC
    CGGATGTGGCCCC
    ACGGATGTGGCCCC
    CACGGATGTGGCCCC
    TCACGGATGTGGCCCC
    CTCACGGATGTGGCCCC.
  • Die RT-Templates können sein:
    AAGAAGCTTACA
    AAAGAAGCTTACA
    GAAAGAAGCTTACA
    AGAAAGAAGCTTACA
    AAGAAAGAAGCTTACA
    CAAGAAAGAAGCTTACA
    ACAAGAAAGAAGCTTACA
    CACAAGAAAGAAGCTTACA
    GCACAAGAAAGAAGCTTACA
    AGCACAAGAAAGAAGCTTACA
    CAGCACAAGAAAGAAGCTTACA
    CCAGCACAAGAAAGAAGCTTACA
    TCCAGCACAAGAAAGAAGCTTACA
    ATCCAGCACAAGAAAGAAGCTTACA.
  • Das Nicking-Template kann GCTTTGATTCGTACACGAGG sein.
  • PEgRNA 2
  • Design von PEgRNAs für das APOL1-Allel rs60910145. Dies stellt eine G→T-Korrektur bei betroffenen Personen dar.
  • Der Protospacer ist GCTGGAGGAGAAGCTAAACA. Das ausgewählte PE umfasst SpCas9(D10A)-NG.
  • Die Primer-Bindungsstellen können sein:
    GAAGCTAA
    AGAAGCTAA
    GAGAAGCTAA
    GGAGAAGCTAA
    AGGAGAAGCTAA
    GAGGAGAAGCTAA
    GGAGGAGAAGCTAA
    TGGAGGAGAAGCTAA
    CTGGAGGAGAAGCTAA
    GCTGGAGGAGAAGCTAA,
  • Das RT-Template kann sein (kann nicht mit C enden):
    AGAATGT
    GAGAATGT
    TGAGAATGT
    TTGAGAATGT
    GTTGAGAATGT
    TGTTGAGAATGT
    TTGTTGAGAATGT
    ATTGTTGAGAATGT
    TATTGTTGAGAATGT
    TTATTGTTGAGAATGT
    ATTATTGTTGAGAATGT
    AATTATTGTTGAGAATGT
    TAATTATTGTTGAGAATGT
    ATAATTATTGTTGAGAATGT.
  • Die Nicking-Templaten können sein:
    CCTGTGGTCACAGTTCTTGG
    CCACAGGGCAGGGCAGCCAC.
  • PEgRNA 3
  • Design von PEgRNAs für das APOL1-Allel rs71785313. Dies stellt eine Einfügung wie folgt dar: ATTCTCAACAA[Insert: TAATTA]TAAGATTC.
  • Der Protospacer kann sein: TCTCAACAATAAGATTCTGC
  • Das PE umfasst SaKKH-PE2.
  • Die Primer-Bindungsstelle kann sein:
    TTCTCAAC
    ATTCTCAAC
    CATTCTCAAC
    ACATTCTCAAC
    AACATTCTCAAC
    AAACATTCTCAAC
    TAAACATTCTCAAC
    CTAAACATTCTCAAC
    GCTAAACATTCTCAAC
    AGCTAAACATTCTCAAC.
  • Das RT-Template kann sein:
    AATCTTATAATTATT
    GAATCTTATAATTATT
    AGAATCTTATAATTATT
    CAGAATCTTATAATTATT
    GCAGAATCTTATAATTATT
    TGCAGAATCTTATAATTATT
    CTGCAGAATCTTATAATTATT
    CCTGCAGAATCTTATAATTATT
    GCCTGCAGAATCTTATAATTATT
    CGCCTGCAGAATCTTATAATTATT
    CCGCCTGCAGAATCTTATAATTATT
    TCCGCCTGCAGAATCTTATAATTATT
    GTCCGCCTGGAGAATCTTATAATTATT
    [16761 GGTCCGCCTGCAGAATCTTATAATTATT.
  • Die Nicking-Templates können sein:
    CCTGTGGTCACAGTTCTTGG
    CCACAGGGCAGGGCAGCCAC.
  • WEITERE IN DIESER OFFENBARUNG ERWÄHNTE LITERATURSTELLEN
  • Die folgenden Literaturstellen sind jeweils in ihrer Gesamtheit durch Bezugnahme hier aufgenommen.
    1. 1. Jinck, M. et al. A Programmable Dual-RNA-Guided DNA Endonuclease in Adaptive Bacterial Immunity. Science 337, 816-821 (2012).
    2. 2. Cong, L. et al. Multiplex Genome Engineering Using CRISPR/Cas Systems. Science 339. 819-823 (2013).
    3. 3. Komor, A. C., Badran, A. H. & Liu, D. R. CRISPR-Based Technologies for the Manipulation of Eukaryotic Genomes. Cell 168, 20-36 (2017).
    4. 4. Komor, A. C., Kim, Y. B., Packer, M. S.. Zuris, J. A. & Liu, D. R. Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage. Nature 533,420-424 (2016).
    5. 5. Nishida, K. et al. Targeted nucleotide editing using hybrid prokaryotic and vertebrate adaptive immune systems. Science 353, aaf8729 (2016).
    6. 6. Gaudelli, N. M. et al. Programmable base editing of A•T to G•C in genomic DNA without DNA cleavage. Nature 551. 464-471 (2017).
    7. 7. ClinVar, July 2019.
    8. 8. Dunbar, C. E. et al. Gene therapy comes of age. Science 359, eaan4672 (2018).
    9. 9. Cox. D. B. T.. Platt, R. J. & Zhang, F. Therapeutic genome editing: prospects and challenges. Nat. Med. 21, 121-131 (2015).
    10. 10. Adli, M. The CRISPR tool kit for genome editing and beyond. Nat. Commun. 9, 1911 (2018).
    11. 11. Kleinstiver, B. P. et al. Engineered CRISPR-Cas9 nucleases with altered PAM specificities. Nature 523, 481-485 (2015).
    12. 12. Kleinstiver, B. P. et al. High-fidelity CRISPR-Cas9 nucleases with no detectable genome-wide off-target effects. Nature 529,490-495 (2016).
    13. 13. Hu, J. H. et al. Evolved Cas9 variants with broad PAM compatihility and high DNA specificity. Nature 556, 57-63 (2018).
    14. 14. Nishimasu. H. et al. Engineered CRISPR-Cas9 nuclease with expanded targeting space. Science 361, 1259-1262 (2018).
    15. 15. Jasin, M. & Rothstein, R. Repair of strand breaks by homologous recombination. Cold Spring Harb. Perspect. Biol. 5, a012740 (20J 3).
    16. 16. Paquet, D. et al. Efficient introduction of specific homozygous and heterozygous mutations using CRISPR/Cas9. Nature 533, 125-129 (2016).
    17. 17. Kosicki, M., Tomberg, K. & Bradley, A. Repair of double-strand breaks induced by CRISPR-Cas9 leads to large deletions and complex rearrangements. Nat. Biotechnol. 36. 765-771 (2018).
    18. 18. Haapaniemi, E., Botla, S., Persson, J., Schmierer. B. & Taipale, J. CRISPR-Cas9 genome editing induces a p53-mediated DNA damage response. Nat. Med. 24, 927-930 (2018).
    19. 19. Ihry, R. J. et al. p53 inhibits CRISPR-Cas9 engineering in human pluripotent stem cells. Nat. Med. 24, 939-946 (2018).
    20. 20. Richardson, C. D., Ray, G. J., DeWitt, M. A., Curie, G. L. & Corn, J. E. Enhancing homology-directed genome editing by catalytically active and inactive CRISPR-Cas9 using asymmetric donor DNA. Nat. Biotechnol. 34, 339-344 (2016).
    21. 21. Srivastava, M. et al. An Inhibitor of Nonhomologous End-Joining Abrogates Double-Strand Break Repair and Impedes Cancer Progression. Cell 151, 1474-1487 (2012).
    22. 22. Chu, V. T. et al. Increasing the efficicncy of homology-directed repair for CRISPR-Cas9-induced precise gene editing in mammalian cells. Nat. Biotechnol. 33. 543-548 (2015).
    23. 23. Maruyama, T. et al. Increasing the efficiency of precise genome editing with CRISPR-Cas9 by inhibition of nonhomologous end joining. Nat. Biotechnol. 33, 538-542 (2015).
    24. 24. Kim. Y. B. et al. Increasing the genome-targeting scope and precision of base editing with engineered Cas9-cytidine deaminase fusions. Nat. Biotechnol. 35, 371-376 (2017).
    25. 25. Li, X. et al. Base editing with a Cpf1-cytidine deaminase fusion. Nat. Biotechnol. 36, 324-327 (2018).
    26. 26. Gehrke, J. M. et al. An APOBEC3A-Cas9 base editor with minimized hystander and off-target activities. Nat. Biotechnol. (2018). doi:10.1038/nht.4199
    27. 27. Rees, H. A. & Liu, D. R. Base editing: precision chemistry on the genome and transcriptome of living cells. Nat. Rev. Genet. 1 (2018). doi:10.1038/s41576-018-0059-1.
    28. 28. Ostertag, E. M. & Kazazian Jr. H. H. Biology of Mammalian L1 Retrotransposons. Annu. Rev. Genet. 35, 501-538 (2001).
    29. 29. Zimmerly, S., Guo, H., Perlman. P. S. & Lambowltz, A. M. Group II intron mobility occurs by target DNA- primed reverse transcription. Cell 82, 545-554 (1995).
    30. 30. Luan, D. D., Korman, M. H., Jakubczak. J. L. & Eickbush, T. H. Reverse transcription of R2Bm RNA is primed by a nick at the chromosomal target site: a mechanism for non-LTR retiotransposition. Cell 72, 595-605 (1993).
    31. 31. Feng, Q., Moran, J. V., Kazazian. H. H. & Boeke, J. D. Human L1 retrotransposon encodes a conserved endonuclease required for retrotransposition. Cell 87, 905-916 (1996).
    32. 32. Jinek, M. et al. Structures of Cas9 Endonucleases Revcal RNA-Mediated Conformational Activation. Science 343, 1247997 (2014).
    33. 33. Jiang, F. et al. Structures of a CRISPR-Cas9 R-loop complex primed for DNA cleavage. Science aad8282 (2016). doi: 10.1 1267seience.aad8282
    34. 34. Qi, L. S. et al. Repurposing CRISPR as an RNA-Guided Platform for Sequence-Specific Control of Gene Expression. Cell 152, 1173-1183 (2013).
    35. 35. Tang, W., Hu, J. H. & Liu, D. R. Aptazyme-embedded guide RNAs enable ligand-responsive genome editing and transcritional activation. Nat. Commun. 8, 15939 (2017).
    36. 36. Shechner, D. M., Hacisuleyman, E.. Younger, S. T. & Rinn, J. L. Multiplexable. Jocus-specific targeting of long RNAs with CRISPR-Display. Nat. Merhods 12, 664-670 (2015).
    37. 37. Anders, C. & Jinek, M. Chapter One - In vitro Enzymology of Cas9. in Methods in Enzymology (eds. Doudna, J. A. & Sontheimer, E. J.) 546, 1-20 (Academic Press, 2014).
    38. 38. Briner, A. E. et al. Guide RNA Functional Modules Direct Cas9 Activity and Orthogonality. Mol. Cell 56, 333-339 (2014).
    39. 39. Nowak. C. M., Lawson. S.. Zerez, M. & Bleris, L. Guide RNA engineering for versatile Cas9 functionality. Nucleic Acids Res. 44, 9555-9564 (2016).
    40. 40. Sternberg, S. H., Redding, S., Jinck, M., Greene, E. C. & Doudna, J. A. DNA interrogation by the CRISPR RNA-guided endonuclease Cas9. Nature 507, 62-67 (2014).
    41. 41. Mohr. S. et al. Thermostable group II intron reverse transcriptase fusion proteins and their use in cDNA synthesis and next-generation RNA sequencing. RNA 19. 958-970 (2013).
    42. 42. Stamos, J. L., Lentzsch, A. M. & Lamhowitz, A. M. Structure of a Thermostable Group II Intron Reverse Transcriptase with Template-Primer and Its Functional and Evolutionary Implications. Mol. Cell 68. 926- 939.e4 (2017).
    43. 43. Zhao, C. & Pyle, A. M. Crystal structures of a group II intron maturase reveal a missing link in splicensome evolution. Nat. Struct. Mol. Biol. 23,558-565 (2016).
    44. 44. Zhao, C., Liu, F. & Pyle, A. M. An ultraprocessive. accurate reverse transcriptase encoded by a metazoan group II intron. RNA 24, 183-195 (2018).
    45. 45. Ran, F. A. et al. Genome engineering using the CRISPR-Cas9 system. Nat. Protoc. 8, 2281-2308 (2013).
    46. 46. Liu, Y., Kao, H.-I. & Bamhata, R. A. Flap endonuclease 1: a central component of DNA metabolism Annu. Rev. Biochetn. 73,589-615 (2004).
    47. 47. Krokan, H. E. & Bjørås. M. Base Excision Repair. Cold Spring Harb. Perspect. Biol. 5.(2013).
    48. 48. Kelman, Z. PCNA: structure, functions and interactions. Oncogene 14, 629-640 (1997).
    49. 49. Choe, K. N. & Moldovan, G.-L. Forging Ahead through Darkness: PCNA, Still the Principal Conductor at the Replication Fork. Mol. Cell 65, 380-392 (2017).
    50. 50. Li, X., Li, J., Harrington, J., Lieber, M. R. & Burgers, P. M. Lagging strand DNA synthesis at the eukaryotic replication fork involves binding and stimulation of FEN-1 by proliferating cell nuclear antigen. J. Biol. Chem. 270, 22109-22112 (1995).
    51. 51. Tom, S.. Henricksen, L. A. & Bambara, R. A. Mechanism whereby proliferating cell nuclear antigen stimulates flap endonuclease 1.J. Biol. Chem. 275, 10498-10505 (2000).
    52. 52. Tanenbaum, M. E., Gilbert. L. A., Qi. L. S., Weissman. J. S. & Vale, R. D. A protein-tagging system for signal amplification in gene expression and fluorescence imaging. Cell 159. 635-646 (2014).
    53. 53. Bertrand, E. et al. Localization of ASHI mRNA particles in living yeast. Mol. Cell 2, 437-445 (1998).
    54. 54. Dahlman, J. E. et al. Orthogonal gene knockout and activation with a catalytically active Cas9 nuclease. Nat. Biotechnol. 33, 1159-1161 (2015).
    55. 55. Tsai. S. Q. et al. GUIDE-seq enables genome-wide profiling of off-target cleavage by CRISPR-Cas nucleases. Nat. Biotechnol. 33, 187-197 (2015).
    56. 56. Tsai, S. Q. et al. CIRCLE-scq: a highly sensitive in vitro screen for genome-wide CRISPR-Cas9 nuclease off-targets. Nat. Methods 14, 607-614 (2017).
    57. 57. Schek N, Cooke C, Alwine JC. Molecular and Cellular Biology. (1992).
    58. 58. Gil A, Proudfoot NJ. Cell. (1987).
    59. 59. Zhao, B.S., Roundtree, 1.A., He, C. Nat Rev Mol Cell Biol. (2017).
    60. 60. Rubio, M.A.T., Hopper. A.K. Wiley Interdiscip Rev RNA (2011).
    61. 61. Shechner. D.M., Hacisuleyman E., Younger, S.T., Rinn, J.L. Nat Methods. (2015).
    62. 62. Paige, J.S., Wu, K.Y., Jaffrey, S.R. Science (2011).
    63. 63. Ray D., ... Hughes TR. Nature (2013).
    64. 64. Chadalavada, D. M.. Cerrone-Szakal, A. L., Bevilacqua, P.C. RNA (2007).
    65. 65. Forster AC, Symons RH. Cell. (1987).
    66. 66. Weinberg Z, Kim PB, Chen TH. Li S. Harris KA, Lünse CE, Breaker RR. Nat. Chem. Biol. (2015).
    67. 67. Feldstein PA, Buzayan JM, Bruening G. Gene (1989).
    68. 68. Saville BJ, Collins RA. Cell. (1990).
    69. 69. Winkler WC. Nahvi A. Roth A, Collins JA, Breaker RR. Nature (2004).
    70. 70. Roth A, Weinberg Z. Chen AG. Kim PG, Ames TD, Breaker RR. Nat Chem Biol. (2013).
    71. 71. Choudhury R. Tsai YS. Dominguez D. Wang Y, Wang Z. Nat Commun. (2012).
    72. 72. MacRae IJ. Doudna JA. Curr Opin Struct Biol. (2007).
    73. 73. Bernstein E. Caudy AA, Hammond SM, Hannon GJ Nature (2001).
    74. 74. Filippov V, Solovyev V, Filippova M, Gill SS. Gene (2000).
    75. 75. Cadwell RC and Joyce GF. PCR Methods Appl. (1992).
    76. 76. McInerney P, Adams P, and Hadi MZ. Mol Biol Int. (2014).
    77. 77. Esvelt KM, Carlson JC. and Liu DR. Nature. (2011).
    78. 78. Naorem SS, Hin ,I, Wang S, Lee WR, Heng X, Miller JF, Guo H. Proc Natl Acad Sci USA (2017).
    79. 79. Martinez MA, Vartanjan JP. Wain-Hobson S. Proc Natl Acad Sci USA (1994).
    80. 80. Meyer AJ, Ellefson JW, Ellington AD. Curr Protoc Mol Biol. (2014).
    81. 81. Wang HH, Isaacs FJ, Carr PA, Sun ZZ, Xu G, Forest CR, Church GM. Nature. (2009).
    82. 82. Nyerges A et a1. Proc Natl Acad Sci USA. (2016).
    83. 83. Mascola JR, Haynes BF. Immunol Rev. (2013).
    84. 84. X. Wen, K. Wen. D. Cao, G. Li, R. W. Jones, J. Li, S. Szu. Y. Hoshino. L. Yuan. Inclusion of a universal tetanus toxoid CD4(+) T cell epitope P2 significantly enhanced the immunogenicity of recombinant rotavirus ΔVP8* subunit parenteral vaccines. Vaccine 32, 4420-4427 (2014).
    85. 85. G. Ada, D. Isaacs, Carbohydrate-protein conjugate vaccines. Clin Microbiol Infect 9, 79-85 (2003).
    86. 86. E. Malito, B. Bursulaya, C. Chen, P. L. Surdo. M. Picchianti, E. Balducci, M. Biancucci, A. Brock, F. Berti, M. J. Bottoinley, M. Nissum, P. Costantino, R. Rappuoli, G. Spraggon, Structural basis for lack of toxicity of the diphtheria toxin mutant CRM 197. Proceedings of the National Academy of Sciences 109, 5229 (2012).
    87. 87. J. de Wit. M. E. Emmelot, M. C. M. Poelen, J. Lanfermeijer, W. G. H. Han, C. van Els, P. Kaaijk, The Human CD4(+) T Cell Response against Mumps Virus Targets a Broadly Recognized Nucleoprotein Epitope. J Virol 93. (2019).
    88. 88. M. May, C. A. Rieder, R. J. Rowe, Emergent lineages of mumps virus suggest the need for a polyvalent vaccine. Int J Infect Dis 66, 1-4 (2018).
    89. 89. M. Ramamurthy, P. Rajendiran, N. Saravanan. S. Sankar. S. Gopalan. B. Nandagopal, Identification of immunogenic B-cell epitope peptides of rubella virus E1 glycoprotein towards development of highly specific immunoassays and/or vaccine. Conference Abstract, (2019).
    90. 90. U. S. F. Tambunati, F. R. P. Sipahutar, A. A. Parikesit. D. Kerami, Vaccine Design for H5N1 Based on B- and T-celJ Epitope Predictions. Bioinform Biol Insights 10, 27-35 (2016).
    91. 91. Asante, EA. et. al. „A naturally occurring variant of the human prion protein completely prevents prion discase“. Nature. (2015).
    92. 92. Crabtree, G. R. & Schreiber, S. L. Three-part inventions: intracellular signaling and induced proximity. Trends Biochem. Sci. 21, 418-22 (1996).
    93. 93. Liu, J. et al. Calcineurin Is a Common Target of A and FKBP-FK506 Complexes. Cell 66, 807-815 (1991).
    94. 94. Keith, C. T. et al. A mammalian protein targeted hy G1-arresting rapamycin-receptor complex. Nature 369. 756-758 (2003).
    95. 95. Spencer, D. M., Wandless, T. J., Schreiber, S. L. S. & Crabtree, G. R. Controlling signal transduction with synthetic ligands. Science 262, 1019-24 (1993).
    96. 96. Pruschy, M. N. et al. Mechanistic studies of a signaling pathway activated by the organic dimerizer FK1012. Chem. Biol. 1, 163-172 (1994).
    97. 97. Spencer, D. M. et al. Functional analysis of Fas signaling in vivo using synthetic inducers of dimerization. Curr. Biol. 6, 839-847 (1996).
    98. 98. Belshaw, P. J., Spencer, D. M.. Crabtree. G. R. & Schreiber, S. L. Controlling programmed cell death with a cyclophilin-cyclosporin-based chemical inducer of dimerization. Chem. Biol. 3, 731-738 (1996).
    99. 99. Yaug, J. X., Symes, K., Mercola, M. & Schreiber, S. L. Small-molecule control of insulin and PDGF receptor signaling and the role of membrane attachment. Curr. Biol. 8, 11-18 (1998).
    100. 100. Belshaw, P. J., Ho, S. N., Crabtree, G. R. & Schreiber, S. L. Controlling protein association and subcellular localization with a synthetic ligand that induces heterodimerization of proteins. Proc. Natt. Acad. Sci. 93. 4604-4607 (2002).
    101. 101. Stockwell, B. R. & Schreiber, S. L. Probing the role of homomeric and heteromeric receptor interactions in TGF-β signaling using small molecule dimerizers. Curr. Biol. 8.761-773 (2004).
    102. 102. Spencer, D. M.. Graef. I., Austin, D. J., Schreiber, S. L. & Crabtree. G. R. A general strategy for producing conditional alleles of Src-like tyrosine kinases. Proc. Natl. Acad. Sei. 92. 9805-9809 (2006).
    103. 103. Holsinger, L. J.. Spencer, D. M., Austin, D. J., Schreiber. S. L. & Crabtree, G. R. Signal transduction in T lymphocytes using a conditional allele of Sos. Proc. Natl. Acad. Sei. 92, 9810-9814 (2006).
    104. 104. Myers, M. G. Insulin Signal Transduction and the IRS Proteins. Annu. Rev. Pharmacol. Toxicol. 36,615-658 (1996).
    105. 105. Watowich. S. S. The erythropoietin receptor: Molecular structure and hematopoietic signaling pathways. J. Investig. Med, 59, 1067-1072 (2011).
    106. 106. Blau, C. A., Peterson, K. R., Drachman, J. G. & Spencer, D. M. A proliferation switch for genetically modified cells. Proc. Natl. Acad. Sci. 94, 3076-3081 (2002).
    107. 107. Clackson, T. et al. Redesigning an FKBP-ligand interface to generale chemtical dimerizers with novel specificity. Proc. Natl. Acad. Sei. 95. 10437-10442 (1998).
    108. 108. Diver. S. T. & Schreiber, S. L. Single-step synthesis of cell-permeable protein dimerizers that activate signal transduction and gene expression. J. Am. Chem. Soc. 119, 5106-5109(1997).
    109. 109. Guo. Z. F., Zhang, R. & Liang, F. Sen. Facile functionalization of FK506 for biological studies by the thiol-ene ‚dick‘ reaction. RSC Adv. 4. 11400-11403 (2014).
    110. 110. Robinson, D. R., Wu, Y.-M. & Lin, S.-F. The protein tyrosine kinase family of the human genome. Oncogene 19, 5548-5557 (2000).
    111. 111. Landrum, M. J. et al. ClinVar: public archive of interpretations of clinically relevant variants. Nucleic Acids Res. 44, D862-D868 (2016).
    112. 112. Jinek, M. et al. A Programmable Dual-RNA-Guided DNA Endonuclease in Adaptive Bacterial Immunity. Science 337. 816-821 (2012).
    113. 113. Cong. L. et al. Multiplex Genome Engineering Using CRISPR/Cas Systems. Science 339. 819-823 (2013).
    114. 114. Mali. P. et al. RNA-Guided Human Genome Engineering via Cas9. Science 339, 823-826 (2013).
    115. 115. Yang, H. et al. One-Step Generation of Mice Carrying Reporter and Conditional Alleles by CRISPR/Cas-Mediated Genome Engineering. Cell 154. 1370-1379 (2013).
    116. 116. Kim, S., Kim, D.. Cho, S. W., Kim, J. & Kim, J.-S. Highly efficient RNA-guided genome editing in human cells via delivery of purified Cas9 ribonucleoproteins. Genome Res. 24. 1012-1019 (2014).
    117. 117. Orlando, S. J. et al. Zinc-finger nuclease-driven targeted integration into mammalian genomes using donors with limited chromosomal homology. Nucleic Acids Res. 38, e152-e152 (2010).
    118. 118. Tsai, S. Q. et al. GUIDE-seq enables genome-wide profiling of off-target cleavage by CRISPR-Cas nuclcases. Nat. Biotechnol. 33, 187-197 (2015).
    119. 119. Suzuki, K. et al. In vivo genome editing via CRISPR/Cas9 mediated homologyindependent targeted integration. Nature 540, 144-149 (2016).
    120. 120. Kosicki, M., Tomherg, K. & Bradley, A. Repair of double-strand breaks induced by CRISPR-Cas9 leads to large deletions and complex rearrangements. Nat. Biotechnol. 36, 765-771 (2018).
    121. 121. Haapaniemi. E.. Botla, S., Persson. J., Schmierer. B. & Taipale, J. CRISPR-Cas9 genome editing induces a p53-mediated DNA damage response. Nat. Med. 24, 927-930 (2018).
    122. 122. Ihry, R. J. et al. p53 inhibits CRISPR-Cas9 engineering in human pluripotent stem cells. Nat. Med. 24, 939-946 (2018).
    123. 123. Chapman, J. R., Taylor. M. R. G. & Boulton, S. J. Playing the end game: DNA double- strand break repair pathway choice. Mol. Cell 47, 497-510 (2012).
    124. 124. Cox. D. B. T., Platt. R. J. & Zhang, F. Therapeutic genome editing: prospects and challenges. Nat. Med. 21, 121-131 (2015).
    125. 125. Paquet, D. et al. Efficient introduction of specific homozygous and heterozygous mutations using CRISPR/Cas9. Nature 533, 125-129 (2016).
    126. 126. Chu. V. T. et al. Increasing the efficiency of homology-directed repair for CRISPR-Cas9- induced precise gene editing in mammalian cells. Nat. Biotechnol. 33, 543-548 (2015).
    127. 127. Maruyama, T. et al. Increasing the efficiency of precise genome editing with CRISPR-Cas9 by inhibition of nonhomologous end joining. Nat. Biotechnol. 33, 538-542 (2015).
    128. 128. Rees, H. A., Ych, W.-H. & Liu, D. R. Development of hRad51-Cas9 nickase fusions that mediate HDR without double-stranded breaks. Nat. Commun. 10,1-12 (2019).
    129. 129. Komor, A. C., Kim, Y. B., Packer, M. S., Zuris, J. A. & Liu. D. R. Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage. Nature 533. 420- 424 (2016).
    130. 130. Gaudelli, N. M. et al. Programmable base editing of A*T to G·C in genomic DNA without DNA cleavage. Nature 551, 464-471 (2017).
    131. 131. Gao, X. et al. Treatment of autosomal dominant hearing loss by in vivo delivery of genome editing agents. Nature 553, 217-221 (2018).
    132. 132. Ingram, V. M. A specific chemical difference between the globins of normal human and sickle-cell anaemia haemoglobin. Nature 178, 792-794 (1956).
    133. 133. Myerowitz, R. & Costigan, F. C. The major defect in Ashkenazi Jews with Tay-Sachs disease is an insertion in the gene for the alpha-chain of beta-hexosaminidase. J. Biol. Chem. 263. 18587-18589 (1988).
    134. 134. Zielenski, J. Genotype and Phenotype in Cystic Fibrosis. Respiration 67, J 17-133 (2000).
    135. 135. Mead. S. et al. A Novel Protective Prion Protein Variant that Colocalizes with Kuru Exposure. N. Engl. J. Med. 361, 2056-2065 (2009).
    136. 136. Marraffini, L. A. & Sontheimer. E.J. CRISPR interference limits horizontal gene transfer in staphylococci by targeting DNA. Science 322, 1843-1845 (2008).
    137. 137. Barrangou, R. et al. CRISPR provides acquired resistance against viruses in prokaryotes. Science 315, 1709-1712 (2007).
    138. 138. Jiang, F. & Doudna,J. A. CRISPR-Cas9 Structures and Mechanisms. Annu. Rev. Biophys. 46, 505-529 (2017).
    139. 139. Hille. F. et al. The Biology of CRISPR-Cas: Backward and Forward. Cell 172, 1239-1259 (2018).
    140. 140. Luan. D. D., Korman, M. H.. Jakubczak, J. L. & Eickbush, T. H. Reverse transcription of R2Bm RNA is primed by a nick at the chromosomal target site: a mechanism for non- LTR retrotransposition. Cell 72, 595-605 (1993).
    141. 141. Liu, Y., Kao, H.-I. & Bambara, R. A. Flap endonuclease 1: a central component of DNA metabolism. Annu. Rev. Biochem. 73, 589-615 (2004).
    142. 142. Rees. H. A. & Liu. D. R. Base editing: precision chemistry on the genome and transcriptome of living cells. Nat. Rev. Genet. 19, 770 (2018).
    143. 143. Richardson. C. D., Ray, G. J., DeWitt, M. A., Curie, G. L. & Corn. J. E. Enhancing homology-directed genome editing by catalytically active and inactive CRISPR-Cas9 using asymmetric donor DNA. Nat. Biotechnol. 34. 339-344 (2016).
    144. 144. Qi, L. S. et al. Repurposing CRISPR as an RNA-Guided Platform for Sequence-Specific Control of Gene Expression. Cell 152, 1173-1183 (2013).
    145. 145. Shechner, D. M.. Hacisuleyman, E., Younger, S. T. & Rinn, J. L. Multiplexable, locusspecific targeting oflong RNAs with CRISPR-Display. Nat. Methods 12, 664-670 (2015).
    146. 146. Tang, W.. Hu, J. H. & Liu, D. R. Aptazyme-embedded guide RNAs enable ligand-responsive genome editing and transcriptional activation. Nat. Commun. 8, 15939 (2017).
    147. 147. Jinek, M. et al. Structures of Cas9 Endonucleases Reveal RNA-Mediated Conformational Activation. Science 343, 1247997 (2014).
    148. 148. Nishimasu. H. et al. Crystal Structure of Cas9 in Complex with Guide RNA and Target DNA. Cell 156, 935-949 (2014).
    149. 149. Jiang, F.. Zhou, K., Ma, L., Grassel, S. & Doudna, J. A. A Cas9-guide RNA complex preorganized for target DNA recognition. Science 348, 1477-1481 (2015).
    150. 150. Baranauskas, A. et al. Generation and characterization of new highly thermostable and processive M-MuLV reverse transcriptase variants. Protein Eng. Des. Sei. 25, 657-668 (2012).
    151. 151. Gerard, G. F. et al. The role of template-primer in protection of reverse transcriptase from thermal inactivation. Nucleic Acids Res. 30. 3118-3129 (2002).
    152. 152. Arezi, B. & Hogrefe, H. Novel mutations in Moloney Murine Leukemia Virus reverse transcriptase increase thennostability through tighter binding to template-primer. Nucleic Acids Res. 37,473-481 (2009).
    153. 153. Kotewicz, M. L., Sampson, C. M.. D'Alessio, J. M. & Gerard, G. F. Isolation of cloned Moloney murine leukemia virus reverse transcriptase lacking ribonuclease H activity. Nucleic Acids Res. 16, 265-277 (1988).
    154. 154. Shen, M. W. et al. Predictable and precise template-free CRISPR editing of pathogenic variants. Nature 563, 646-651 (2018).
    155. 155. Thuronyi, B. W. et al. Continuous evolution of base editors with expanded target compatibility and improved activity. Nat. Biotechnol. (2019). doi:10. 1038/s41587-019- 0193-0
    156. 156. Kim, Y. B. et al. Increasing the genome-targeting scope and precision of base editing with engineered Cas9-cytidine deaminase fusions. Nat. Biotechnol. 35, 371-376 (2017).
    157. 157. Koblan, L. W. et al. Improving cytidine and adenine base editors by expression optimization and ancestral reconstruction. Nat. Biotechnol. (2018). doi: 10.1038/nbl.4172
    158. 158. Komor, A. C. et al. Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity. Sei. Adv. 3, eaao4774 (2017).
    159. 159. Kleinstiver, B. P. et al. High-fidclity CRISPR-Cas9 nucleases with no detectable genome-wide off-target effects. Nature 529, 490-495 (2016).
    160. 160. Zuo, E. et al. Cytosine base editor generates substantial off-target single-nucleotide variants in mouse embryos. Science 364, 289-292 (2019).
    161. 161. Jin. S. et al. Cytosine. but not adenine, base editors induce genome-wide off-target mutations in rice. Science 364. 292-295 (2019).
    162. 162. Kim. D.. Kim. D., Lee, G., Cho, S.-I. & Kim, J.-S. Genome-wide target specificity of CRISPR RNA-guided adenine base editors. Nat. Biotechnol. 37, 430 435 (2019).
    163. 163. Grünewald. J. et al. Transcriptome-wide off-target RNA editing induced by CRISPRguided DNA base editors. Nature 569, 433-437 (2019).
    164. 164. Zhou, C. et al. Off-target RNA mutation induced by DNA base editing and its elimination by mutagenesis. Nature 571, 275-278 (2019).
    165. 165. Rees, II. A., Wilson, C., Doman, J. L. & Liu, D. R. Analysis and minimization of cellular RNA editing by DNA adenine base editors. Sei. Adv. 5, eaax5717 (2019).
    166. 166. Ostertag, E. M. & Kazazian Jr. H. H. Biology of Mammalian L1 Retrotransposons. Annu. Rev. Genet. 35, 501-538 (2001).
    167. 167. Griffiths. D. J. Endogenous retroviruses in the human genome sequence. Genome Biol. 2, REVIEWS 1017 (2001).
    168. 168. Berkhout, B., Jebbink, M. & Zsiros, J. Identification of an Active Reverse Transcriptase Enzyme Encoded by a Human Endogenous HERV-K Retrovirus. J. Virol. 73, 2365-2375 (1999).
    169. 169. Halvas, E. K., Svarovskaia, E. S. & Pathak, V. K. Role of Murine Leukemia Virus Reverse Transcriptase Deoxyribonucleoside Triphosphate-Binding Site in Retroviral Replication and In Vivo Fidelity. J. Virol. 74, 10349-10358 (2000).
    170. 170. Dever. D. P. et al. CRISPR/Cas9 Beta-globin Gene Targeting in Human Hematopoietic Stem Cells. Nature 539, 384-389 (2016).
    171. 171. Park, S. H. et al. Highly efficient editing of the β-globin gene in patient-derived hematopoietic stem and progenitor cells to treat sickle cell disease. Nucleic Acids Res. doi:10. 1093/nar/gkz475
    172. 172. Collinge, J. Prion diseases of humans and animals: their causes and molecular basis. Annu. Rev. Ncurosci. 24, 519-550 (2001).
    173. 173. Asante. E. A. et al. A naturally occurring variant of the human prion protein completely prevents prion disease. Nature 522, 478-481 (2015).
    174. 174. Anzalone, A. V., Lin, A. J., Zairis, S., Rabadan, R. & Cornish, V. W. Reprogramming eukaryotic translation with ligand-responsive synthetic RNA switches. Nat. Methods 13, 453-458 (2016).
    175. 175. Badran, A. H. et al. Continuous evolution of Bacillus thuringiensis toxins overcomes insect resistance. Nature 533, 58-63 (2016).
    176. 176. Anders, C. & Jinek, M. Chapter One - In Vitro Enzymology of Cas9. in Methods in Enzymology (eds. Doudna, J. A. & Sontheimer. E. J.) 546. 1-20 (Academic Press, 2014).
    177. 177. Pirakitikulr, N., Ostrov. N.. Peralta-Yahya, P. & Cornish, V. W. PCRless library mutagenesis via oligonucleotide recombination in yeast. Protein Sei. Publ. Protein Soc. 19, 2336-2346 (2010).
    178. 178. Clement, K. et al. CRISPResso2 provides accurate and rapid genome editing sequence analysis. Nat. Biotechnol. 37, 224-226 (2019).
    179. 179. Tsai, S. Q. et al. GUIDE-seq enables genome-wide profiling of off-target cleavage by CRISPR-Cas nucleases. Nat. Biotechnol. 33, 187-197 (2015).
    180. 180. Kleinstiver, B. P. et al. High-fidelity CRISPR-Cas9 nucleases with no detectable genome-wide off- target effects. Nature 529, 490-495 (2016).
    181. 181. Koblan, L. W. et al. Improving cytidine and adenine base editors by expression optimization and ancestral reconstruction. Nat. Biotechnol. (2018). doi:10.1038/nbt.4172
    182. 182. Baranauskas, A. et al. Generation and characterization of new highly thermostabte and processive M-MuLV reverse transcriptase variants. Protein Eng. Des. Sei. 25, 657-668 (2012).
    183. 183. Schechner. DM, Hacisuleyman E.. Youngcr ST, Rinn JL. Nat Methods 664-70 (2015).
    184. 184. Brown JA. et al. Nat Struct Mol Biol 633-40 (2014).
    185. 185. Conrad NA and Steitz JA. EMBO J 1831-41 (2005).
    186. 186. Bartlett JS. et al. Proc Natl Acad Sci USA 8852-7 (1996).
    187. 187. Mitton-Fry RM, DeGregorio SJ, Wang J, Steitz TA, Steitz JA. Science 1244-7 (2010).
    188. 188. Forster AC, Symons RH. Cell. 1987.
    189. 189. Weinberg Z, Kim PB, Chen TH, Li S, Harris KA, Lünse CE, Breaker RR. Nat. Chem. Biol. 2015.
    190. 190. Feldstein PA. Buzayan JM. Bruening G. Gene 1989.
    191. 191. Saville BJ, Collins RA. Cell. 1990.
    192. 192. Roth A, Weinberg Z. Chen AG. Kim PG. Ames TD, Breaker RR. Nat Chem Biol. 2013.
    193. 193. Borchardt EK, et al. RNA 1921-30 (2015).
    194. 194. Zhang Y, et al. Mol Cell 792-806 (2013).
    195. 195. Dang Y. et al. Genome Biol 280 (2015).
    196. 196. Schaefer M, Kapoor U, and Jantsch MF. Open Biol 170077 (2017).
    197. 197. Nahar S, et al. Chem Comm 2377-80 (2018).
    198. 198. Gao Y and Zhao Y. J Integr Plant Biol 343-9 (2014).
    199. 199. Dubois N. Marquet R. Paillart J, Bernacchi S. Front Microbiol 527 (2018).
    200. 200. Costa M and Michel F. EMBO J 1276-85 (1995).
    201. 201. Hu JH, et al. Nature 57-63 (2018).
    202. 202. Furukawa K, Gu H, Breaker RR. Methods Mol Biol 209-20 (2014).
    203. 203. Zettler. J., Schütz, V. & Mootz, H. D. The naturally split Npu DnaE intein exhibits an extraordinarily high rate in the protein trans-splicing reaction. FEBS Lett. 583, 909-914 (2009).
    204. 204. Kügler. S., Kilic. E. & Bähr. M. Human synapsin 1 gene promoter confers highly neuron-specific long-term transgene expression from an adenoviral vector in the adult rat brain depending on the transduced area. Gene Ther. 10. 337-347 (2003).
    205. 205. de Felipe. P.. Hughes, L. E.. Ryan, M. D. & Brown, J. D. Co-translational. intraribosomal cleavage of polypeptides by the fool-and-mouth disease virus 2A peptide. J. Biol. Chem. 278, 11441-11448 (2003).
    206. 206. Levy, J. M. & Nicoll, R. A. Membrane-associated guanylate kinase dynamics reveal regional and developmental specificily of synapse stability. J. Physiol. 595, 1699-1709 (2017).
    207. 207. Li. B. & Dewey, C. N. RSEM: accurate transcript quantification from RNA-Seq data with or without a reference genome. BMC Bioinfonnatics 12, 323 (2011).
    208. 208. Ritchie, M. E. et al. limma powers differential expression analyses for RNAsequencing and microarray studies. Nucleic Acids Res. 43, e47-e47 (2015).
  • AUSFÜHRUNGSFORMEN
  • Die folgenden Ausführungsformen liegen im Umfang der vorliegenden Offenbarung. Darüber hinaus umfasst die Offenbarung alle Variationen, Kombinationen und Permutationen dieser Ausführungsformen, in denen eine oder mehrere Beschränkungen, Elemente, Klauseln und beschreibende Begriffe aus einer oder mehreren der aufgelisteten Ausführungsformen in eine andere aufgelistete Ausführungsform in diesem Abschnitt eingeführt werden. Zum Beispiel kann jede aufgelistete Ausführungsform, die von einer anderen Ausführungsform abhängt, modifiziert werden, um eine oder mehrere Beschränkungen einzuschließen, die in einer beniebigen anderen aufgelisteten Ausführungsform in diesem Abschnitt gefunden werden, die von derselben Basisausführungsform abhängt. Wenn Elemente als Listen dargelegt werden, z. B. im Markush-Gruppenformat, wird jede Untergruppe der Elemente ebenfalls offenbartt, und jedes beliebige und alle Elemente können aus der Gruppe entfernt werden. Es versteht sich, dass im Allgemeinen, wenn die Offenbarung oder Aspekte der Offenbarung als bestimmte Elemente und/oder Merkmale umfassend bezeichnet wird/werden, bestimmte Ausführungsformen der Erfindung oder Aspekte der Erfindung aus solchen Elementen und/oder Merkmale bestehen oder im Wesentlichen daraus bestehen. Es sei auch darauf hingewiesen, dass die Begriffe „umfassend“ und „enthaltend“ offen sein sollen und die Aufnahme zusätzlicher Elemente oder Schritte zulassen. Wenn Bereiche angegeben sind, sind Endpunkte enthalten. Darüber hinaus können Werte, die als Bereiche ausgedrückt sind, in verschiedenen Ausführungsformen der Erfindung jeden bestimmten Wert oder Unterbereich innerhalb der angegebenen Bereiche auf das Zehntel der Einheit der unteren Grenze des Bereichs, sofern der Kontext nicht eindeutig etwas anderes vorschreibt, annehmen, sofern nicht anders angegeben oder aus dem Kontext und dem Verständnis eines Durchschnittsfachmanns ersichtlich ist.
  • GRUPPE 1. AUSFÜHRUNGSFORMEN 1-212
    1. 1. Ein Fusionsprotein, umfassend ein Nukleinsäure-programmierbares DNA-Bindungsprotein (napDNAbp) und eine reverse Transkriptase.
    2. 2. Das Fusionsprotein der Ausführungsform 1, wobei das Fusionsprotein in der Lage ist, Genome Editing durch Target-geprimte reverse Transkription in Gegenwart einer Guide-RNA mit Extension durchzuführen.
    3. 3. Das Fusionsprotein der Ausführungsform 1, wobei das napDNAbp eine Nickase-Aktivität aufweist.
    4. 4. Das Fusionsprotein der Ausführungsform 1, wobei das napDNAbp ein Cas9-Protein oder eine Variante davon ist.
    5. 5. Das Fusionsprotein der Ausführungsform 1, wobei das napDNAbp ein Nuklease-aktives Cas9, ein Nuklease-inaktives Cas9 (dCas9) oder eine Cas9-Nickase (nCas9) ist.
    6. 6. Das Fusionsprotein der Ausführungsform 1, wobei das napDNAbp Cas9-Nickase (nCas9) ist.
    7. 7. Das Fusionsprotein der Ausführungsform 1, wobei das napDNAbp aus der Gruppe ausgewählt ist, die aus Cas9, CasX, CasY, Cpf1, C2c1, C2c2, C2C3 und Argonaute besteht, und optional eine Nickase-Aktivität aufweist.
    8. 8. Das Fusionsprotein der Ausführungsform 1, wobei das Fusionsprotein, wenn es mit einer Guide-RNA mit Extension komplexiert ist, in der Lage ist, an eine Target-DNA-Sequenz zu binden.
    9. 9. Das Fusionsprotein der Ausführungsform 8, wobei die Target-DNA-Sequenz einen Target-Strang und einen komplementären Nicht-Target-Strang umfasst.
    10. 10. Das Fusionsprotein der Ausführungsform 8, wobei die Bindung des mit der Guide-RNA mit Extension komplexierten Fusionsproteins eine R-Schleife bildet.
    11. 11. Das Fusionsprotein der Ausführungsform 10, wobei die R-Schleife (i) ein RNA-DNA-Hybrid, das die Guide-RNA mit Extension und den Target-Strang umfasst, und (ii) den komplementären Nicht-Target-Strang umfasst.
    12. 12. Das Fusionsprotein der Ausführungsform 11, wobei der komplementäre Nicht-Target-Strang genickt ist, um eine Reverse-Transkriptase-Priming-Sequenz mit einem freien 3'-Ende zu bilden.
    13. 13. Das Fusionsprotein der Ausführungsform 2, wobei die Guide-RNA mit Extension (a) eine Guide-RNA und (b) eine RNA-Extension am 5'- oder 3'-Ende der Guide-RNA oder an einem intramolekularen Ort in der Guide-RNA umfasst.
    14. 14. Das Fusionsprotein der Ausführungsform 13, wobei die RNA-Extension (i) eine Reverse-Transkriptions-Template-Sequenz, die eine gewünschte Nukleotidänderung umfasst, (ii) eine Reverse-Transkriptions-Primer-Bindungsstelle und (iii) optional eine Linker-Sequenz umfasst.
    15. 15. Das Fusionsprotein der Ausführungsform 14, wobei die Reverse-Transkriptions-Template-Sequenz für einen Einzelstrang-DNA-Flap codiert, der komplementär zu einer endogenen DNA-Sequenz neben der Nick-Stelle ist, wobei der Einzelstrang-DNA-Flap die gewünschte Nukleotidänderung umfasst.
    16. 16. Das Fusionsprotein der Ausführungsform 13, wobei die RNA-Extension mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide, mindestens 15 Nukleotide, mindestens 16 Nukleotide, mindestens 17 Nukleotide, mindestens 18 Nukleotide, mindestens 19 Nukleotide, mindestens 20 Nukleotide, mindestens 21 Nukleotide, mindestens 22 Nukleotide, mindestens 23 Nukleotide, mindestens 24 Nukleotide oder mindestens 25 Nukleotide lang ist.
    17. 17. Das Fusionsprotein der Ausführungsform 15, wobei der Einzelstrang-DNA-Flap an die endogene DNA-Sequenz neben der Nick-Stelle hybridisiert, wodurch die gewünschte Nukleotidänderung eingebaut wird.
    18. 18. Das Fusionsprotein der Ausführungsform 15, wobei der Einzelstrang-DNA-Flap die endogene DNA-Sequenz neben der Nick-Stelle und die ein freies 5'-Ende aufweist verdrängt.
    19. 19. Das Fusionsprotein der Ausführungsform 18, wobei die endogene DNA-Sequenz mit dem 5'-Ende von der Zelle ausgeschnitten wird.
    20. 20. Das Fusionsprotein der Ausführungsform 18, wobei die zelluläre Reparatur des Einzelstrang-DNA-Flaps zum Einbau der gewünschten Nukleotidänderung führt, wodurch ein gewünschtes Produkt gebildet wird.
    21. 21. Das Fusionsprotein der Ausführungsform 14, wobei die gewünschte Nukleotidänderung in einem Editing-Fenster eingebaut ist, das zwischen etwa -4 bis +10 der PAM-Sequenz oder zwischen etwa -10 bis +20 der PAM-Sequenz oder zwischen etwa -20 bis +40 der PAM-Sequenz oder zwischen etwa -30 bis +100 der PAM-Sequenz liegt, oder wobei die gewünschte Nukleotidänderung mindestens 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 oder 100 Nukleotide stromabwärts der Nick-Stelle eingebaut ist.
    22. 22. Das Fusionsprotein der Ausführungsform 1, wobei das napDNAbp eine Aminosäuresequenz von SEQ ID NO: 2 oder eine Aminosäuresequenz umfasst, die zu mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % identisch mit der Aminosäuresequenz von SEQ ID NO: 2 ist.
    23. 23. Das Fusionsprotein der Ausführungsform 1, wobei das napDNAbp eine Aminosäuresequenz umfasst, die zu mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % identisch mit der Aminosäuresequenz einer beliebigen von SEQ ID NOs: 2-10 ist.
    24. 24. Das Fusionsprotein der Ausführungsform 1, wobei die reverse Transkriptase eine beliebige der Aminosäuresequenzen von SEQ ID NO: 11-17 umfasst.
    25. 25. Das Fusionsprotein der Ausführungsform 1, wobei die reverse Transkriptase eine Aminosäuresequenz umfasst, die zu mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % identisch mit der Aminosäuresequenz einer beliebigen von SEQ ID NO: 11-17 ist.
    26. 26. Das Fusionsprotein der Ausführungsform 1, wobei die reverse Transkriptase eine natürlich vorkommende reverse Transkriptase aus einem Retrovirus oder einem Retrotransposon ist.
    27. 27. Das Fusionsprotein einer der vorhergehenden Ausführungsformen, wobei das Fusionsprotein die Struktur NH2-[napDNAbp]-[reverse Transkriptase]-COOH; oder NH2-[reverse Transkriptase]-[napDNAbp]-COOH umfasst, wobei jedes Auftreten von „]-[“ das Vorhandensein einer optionalen Linker-Sequenz anzeigt.
    28. 28. Das Fusionsprotein der Ausführungsform 27, wobei die Linker-Sequenz eine Aminosäuresequenz von SEQ ID NOs: 37-47 umfasst.
    29. 29. Das Fusionsprotein der Ausführungsform 14, wobei die gewünschte Nukleotidänderung eine Einzelnukleotidänderung, eine Insertion eines oder mehrerer Nukleotide oder eine Deletion eines oder mehrerer Nukleotide ist.
    30. 30. Das Fusionsprotein der Ausführungsform 29, wobei das Insert oder die Deletion mindestens 1, mindestens 2, mindestens 3, mindestens 4, mindestens 5, mindestens 6, mindestens 7, mindestens 8, mindestens 9, mindestens 10, mindestens 11, mindestens 12, mindestens 13, mindestens 14, mindestens 15, mindestens 16, mindestens 17, mindestens 18, mindestens 19, mindestens 20, mindestens 21, mindestens 22, mindestens 23, mindestens 24, mindestens 25, mindestens 26, mindestens 27, mindestens 28, mindestens 29, mindestens 30, mindestens 31, mindestens 32, mindestens 33, mindestens 34, mindestens 35, mindestens 36, mindestens 37, mindestens 38, mindestens 39, mindestens 40, mindestens 41, mindestens 42, mindestens 43, mindestens 44, mindestens 45, mindestens 46, mindestens 47, mindestens 48, mindestens 49 oder mindestens 50 ist.
    31. 31. Eine Guide-RNA mit Extension, umfassend eine Guide-RNA und mindestens eine RNA-Extension.
    32. 32. Die Guide-RNA mit Extension der Ausführungsform 1, wobei die RNA-Extension am 3'- oder 5'-Ende der Guide-RNA oder an einer intramolekularen Position in der Guide-RNA positioniert ist.
    33. 33. Die Extended-Guide-RNA der Ausführungsform 31, wobei die Extended-Guide-RNA in der Lage ist, an ein napDNAbp zu binden und das napDNAbp an eine Target-DNA-Sequenz zu steuern.
    34. 34. Die Guide-RNA mit Extension der Ausführungsform 33, wobei die Target-DNA-Sequenz einen Target-Strang und einen komplementären Nicht-Target-Strang umfasst, wobei die Guide-RNA an den Target-Strang hybridisiert, um ein RNA-DNA-Hybrid und eine R-Schleife zu bilden.
    35. 35. Die Guide-RNA mit Extension der Ausführungsform 31, wobei die mindestens eine RNA-Extension (i) eine Reverse-Transkriptions-Template-Sequenz, (ii) eine Reverse-Transkriptions-Primer-Bindungsstelle und (iii) optional eine Linker-Sequenz umfasst.
    36. 36. Die Guide-RNA mit Extension der Ausführungsform 35, wobei die RNA-Extension mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide, mindestens 15 Nukleotide, mindestens 16 Nukleotide, mindestens 17 Nukleotide, mindestens 18 Nukleotide, mindestens 19 Nukleotide, mindestens 20 Nukleotide, mindestens 21 Nukleotide, mindestens 22 Nukleotide, mindestens 23 Nukleotide, mindestens 24 Nukleotide oder mindestens 25 Nukleotide lang ist.
    37. 37. Die Extended-Guide-RNA der Ausführungsform 35, wobei die Reverse-Transkriptions-Template-Sequenz mindestens 3 Nukleotide, mindestens 4 Nukleotide, mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide oder mindestens 15 Nukleotide lang ist.
    38. 38. Die Guide-RNA mit Extension der Ausführungsform 35, wobei die Sequenz der Reverse-Transkriptions-Primer-Bindungsstelle mindestens 3 Nukleotide, mindestens 4 Nukleotide, mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide oder mindestens 15 Nukleotide lang ist.
    39. 39. Die Guide-RNA mit Extension der Ausführungsform 35, wobei die optionale Linker-Sequenz mindestens 3 Nukleotide, mindestens 4 Nukleotide, mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide oder mindestens 15 Nukleotide lang ist.
    40. 40. Die Guide-RNA mit Extension der Ausführungsform 35, wobei die Reverse-Transkriptions-Template-Sequenz für einen Einzelstrang-DNA-Flap codiert, der komplementär zu einer endogenen DNA-Sequenz neben einer Nick-Stelle ist, wobei der Einzelstrang-DNA-Flap eine gewünschte Nukleotidänderung umfasst.
    41. 41. Die Guide-RNA mit Extension der Ausführungsform 40, wobei der Einzelstrang-DNA-Flap eine endogene Einzelstrang-DNA mit einem 5'-Ende in der Target-DNA-Sequenz, die genickt wurde, verdrängt, und wobei sich die endogene Einzelstrang-DNA stromabwärts und unmittelbar neben der Nick-Stelle befindet.
    42. 42. Die Guide-RNA mit Extension der Ausführungsform 41, wobei die endogene Einzelstrang-DNA mit dem freien 5'-Ende von der Zelle ausgeschnitten wird.
    43. 43. Die Guide-RNA mit Extension der Ausführungsform 41, wobei eine zelluläre Reparatur des Einzelstrang-DNA-Flaps zum Einbau der gewünschten Nukleotidänderung führt, wodurch ein gewünschtes Produkt gebildet wird.
    44. 44. Die Guide-RNA mit Extension der Ausführungsform 31, umfassend die Nukleotidsequenz von SEQ ID NOs: 18-36 oder eine Nukleotidsequenz mit mindestens 85 % oder mindestens 90 % oder mindestens 95 % oder mindestens 98 % oder mindestens 99 % Sequenzidentität mit einer beliebigen von SEQ ID NOs: 18-36.
    45. 45. Die Guide-RNA mit Extension der Ausführungsform 35, wobei die Reverse-Transkriptions-Template-Sequenz eine Nukleotidsequenz umfasst, die zu mindestens 80 % oder 85 % oder 90 % oder 95 % oder 99 % identisch mit dem endogenen DNA-Target ist.
    46. 46. Die Guide-RNA mit Extension der Ausführungsform 35, wobei die Reverse-Transkriptions-Primer-Bindungsstelle an ein freies 3'-Ende der geschnittenen DNA hybridisiert.
    47. 47. Die Guide-RNA mit Extension der Ausführungsform 35, wobei die optionale Linker-Sequenz mindestens 1 Nukleotid oder mindestens 2, mindestens 3, mindestens 4, mindestens 5, mindestens 6, mindestens 7, mindestens 8, mindestens 9, mindestens 10, mindestens 11, mindestens 12, mindestens 13, mindestens 14 oder mindestens 15 Nukleotide lang ist.
    48. 48. Ein Komplex, umfassend ein Umfassen eines Fusionsproteins einer beliebigen der Ausführungsformen 1-30 und einer Guide-RNA mit Extension.
    49. 49. Der Komplex der Ausführungsform 48, wobei die Guide-RNA mit Extension eine Guide-RNA und eine RNA-Extension am 3'- oder 5'-Ende der Guide-RNA oder an einer intramolekularen Position in der Guide-RNA umfasst.
    50. 50. Der Komplex der Ausführungsform 48, wobei die Guide-RNA mit Extension in der Lage ist, an ein napDNAbp zu binden und das napDNAbp an eine Target-DNA-Sequenz zu steuern.
    51. 51. Der Komplex der Ausführungsform 50, wobei die Target-DNA-Sequenz einen Target-Strang und einen komplementären Nicht-Target-Strang umfasst, wobei die Guide-RNA an den Target-Strang hybridisiert, um ein RNA-DNA-Hybrid und eine R-Schleife zu bilden.
    52. 52. Der Komplex der Ausführungsform 49, wobei die mindestens eine RNA-Extension (i) eine Reverse-Transkriptions-Template-Sequenz, (ii) eine Reverse-Transkriptions-Primer-Bindungsstelle und (iii) optional eine Linker-Sequenz umfasst.
    53. 53. Der Komplex der Ausführungsform 48, wobei die Guide-RNA mit Extension die Nukleotidsequenz von SEQ ID NOs: 18-36 oder eine Nukleotidsequenz mit mindestens 85 % oder mindestens 90 % oder mindestens 95 % oder mindestens 98 % oder mindestens 99 % Sequenzidentität mit einer beliebigen von SEQ ID NOs: 18-36 umfasst.
    54. 54. Der Komplex der Ausführungsform 52, wobei die Reverse-Transkriptions-Template-Sequenz eine Nukleotidsequenz mit mindestens 80 % oder 85 % oder 90 % oder 95 % oder 99 % Sequenzidentität mit dem endogenen DNA-Target umfasst.
    55. 55. Der Komplex der Ausführungsform 52, wobei die Reverse-Transkriptions-Primer-Bindungsstelle an ein freies 3'-Ende der geschnittenen DNA hybridisiert.
    56. 56. Ein Komplex, umfassend ein Umfassen eines napDNAbp und einer Guide-RNA mit Extension.
    57. 57. Der Komplex der Ausführungsform 56, wobei das napDNAbp eine Cas9-Nickase ist.
    58. 58. Der Komplex der Ausführungsform 56, wobei das napDNAbp eine Aminosäuresequenz von SEQ ID NO: 2 oder eine Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % Sequenzidentität mit SEQ ID NO: 2 umfasst.
    59. 59. Der Komplex der Ausführungsform 57, wobei das napDNAbp eine Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % Sequenzidentität mit der Aminosäuresequenz einer beliebigen von SEQ ID NOs: 2-10 umfasst.
    60. 60. Der Komplex der Ausführungsform 57, wobei die Guide-RNA mit Extension eine Guide-RNA und eine RNA-Extension am 3'- oder 5'-Ende der Guide-RNA oder an einer intramolekularen Position in der Guide-RNA umfasst.
    61. 61. Der Komplex der Ausführungsform 57, wobei die Guide-RNA mit Extension in der Lage ist, das napDNAbp an eine Target-DNA-Sequenz zu steuern.
    62. 62. Der Komplex der Ausführungsform 61, wobei die Target-DNA-Sequenz einen Target-Strang und einen komplementären Nicht-Target-Strang umfasst, wobei die Spacer-Sequenz an den Target-Strang hybridisiert, um ein RNA-DNA-Hybrid und eine R-Schleife zu bilden.
    63. 63. Der Komplex der Ausführungsform 61, wobei die RNA-Extension (i) eine Reverse-Transkriptions-Template-Sequenz, (ii) eine Reverse-Transkriptions-Primer-Bindungsstelle und (iii) optional eine Linker-Sequenz umfasst.
    64. 64. Der Komplex der Ausführungsform 57, wobei die Guide-RNA mit Extension die Nukleotidsequenz von SEQ ID NOs: 18-36 oder eine Nukleotidsequenz mit mindestens 85 % oder mindestens 90 % oder mindestens 95 % oder mindestens 98 % oder mindestens 99 % Sequenzidentität mit einer beliebigen von SEQ ID NOs: 18-36 umfasst.
    65. 65. Der Komplex der Ausführungsform 63, wobei die Reverse-Transkriptions-Template-Sequenz eine Nukleotidsequenz umfasst, die mindestens 80 % oder 85 % oder 90 % oder 95 % oder 99 % identisch mit dem endogenen DNA-Target ist.
    66. 66. Der Komplex der Ausführungsform 63, wobei die Reverse-Transkriptions-Primer-Bindungsstelle an ein freies 3'-Ende der geschnittenen DNA hybridisiert.
    67. 67. Der Komplex der Ausführungsform 63, wobei die optionale Linker-Sequenz mindestens 1 Nukleotid oder mindestens 2, mindestens 3, mindestens 4, mindestens 5, mindestens 6, mindestens 7, mindestens 8, mindestens 9, mindestens 10, mindestens 11, mindestens 12, mindestens 13, mindestens 14 oder mindestens 15 Nukleotide lang ist.
    68. 68. Ein Polynukleotid, das für das Fusionsprotein einer beliebigen der Ausführungsformen 1-30 codiert.
    69. 69. Ein Vektor, umfassend das Polynukleotid der Ausführungsform 68.
    70. 70. Eine Zelle, umfassend das Fusionsprotein einer beliebigen der Ausführungsformen 1-30 und eine an das napDNAbp des Fusionsproteins gebundene Guide-RNA mit Extension.
    71. 71. Eine Zelle, umfassend einen Komplex nach einer beliebigen der Ausführungsformen 48-67.
    72. 72. Eine pharmazeutische Zusammensetzung, umfassend: (i) ein Fusionsprotein einer der Ausführungsformen 1-30, den Komplex der Ausführungsformen 48-67, das Polynukleotid der Ausführungsform 68 oder den Vektor der Ausführungsform 69; und (ii) einen pharmazeutisch verträglichen Hilfsstoff.
    73. 73. Eine pharmazeutische Zusammensetzung, umfassend: (i) den Komplex der Ausführungsformen 48-67 (ii) eine reverse Transkriptase, bereitgestellt in trans; und (iii) einen pharmazeutisch verträglichen Hilfsstoff.
    74. 74. Ein Kit, das ein Nukleinsäurekonstrukt umfasst, umfassend: (i) eine Nukleinsäuresequenz, die für das Fusionsprotein einer beliebigen der Ausführungsformen 1-30 codiert; und (ii) einen Promotor, der eine Expression der Sequenz von (i) steuert.
    75. 75. Verfahren zum Einbauen einer gewünschten Nukleotidänderung in eine Doppelstrang-DNA-Sequenz, wobei das Verfahren Folgendes umfasst:
      1. (i) Inkontaktbringen der Doppelstrang-DNA-Sequenz mit einem Komplex, der ein Fusionsprotein und eine Guide-RNA mit Extension umfasst, wobei das Fusionsprotein ein napDNAbp und eine reverse Transkriptase umfasst und wobei die Guide-RNA mit Extension eine Reverse-Transkriptions-Template-Sequenz umfasst, welche die gewünschte Nukleotidänderung umfasst;
      2. (ii) Nicken der Doppelstrang-DNA-Sequenz auf dem Nicht-Target-Strang, wodurch eine freie Einzelstrang-DNA mit einem 3'-Ende erzeugt wird;
      3. (iii) Hybridisieren des 3'-Endes der freien Einzelstrang-DNA an die Reverse-Transkriptions-Template-Sequenz, wodurch die Reverse-Transkriptase-Domäne geprimt wird;
      4. (iv) Polymerisieren eines DNA-Strangs vom 3'-Ende, wodurch ein Einzelstrang-DNA-Flap erzeugt wird, der die gewünschte Nukleotidänderung umfasst;
      5. (v) Ersetzen eines endogenen DNA-Strangs neben der Schnittstelle durch den Einzelstrang-DNA-Flap, wodurch die gewünschte Nukleotidänderung in die Doppelstrang-DNA-Sequenz eingebaut wird.
    76. 76. Das Verfahren der Ausführungsform 75, wobei der Schritt (v) des Ersetzens umfasst: (i) Hybridisieren des Einzelstrang-DNA-Flaps an den endogenen DNA-Strang neben der Schnittstelle, um eine Sequenzfehlpaarung zu erzeugen; (ii) Ausschneiden des endogenen DNA-Strangs; und (iii) Reparieren der Fehlpaarung, um das gewünschte Produkt zu bilden, das die gewünschte Nukleotidänderung in beiden DNA-Strängen umfasst.
    77. 77. Das Verfahren der Ausführungsform 76, wobei die gewünschte Nukleotidänderung eine Einzelnukleotidsubstitution, eine Deletion oder eine Insertion ist.
    78. 78. Das Verfahren der Ausführungsform 77, wobei die Einzelnukleotidsubstitution eine Transition oder eine Transversion ist.
    79. 79. Das Verfahren der Ausführungsform 76, wobei die gewünschte Nukleotidänderung (1) eine G-zu-T-Substitution, (2) eine G-zu-A-Substitution, (3) eine G-zu-C-Substitution, (4) eine T-zu-G-Substitution, (5) eine T-zu-A-Substitution, (6) eine T-zu-C-Substitution, (7) eine C-zu-G-Substitution, (8) eine C-zu-T-Substitution, (9) eine C-zu-A-Substitution, (10) eine A-zu-T-Substitution, (11) eine A-zu-G-Substitution oder (12) eine A-zu-C-Substitution ist.
    80. 80. Das Verfahren der Ausführungsform 76, wobei die gewünschte Nukleotidänderung (1) ein G:C-Basenpaar in ein T:A-Basenpaar, (2) ein G:C-Basenpaar in ein A:T-Basenpaar, (3) ein G:C-Basenpaar in ein C:G-Basenpaar, (4) ein T:A-Basenpaar in ein G:C-Basenpaar, (5) ein T:A-Basenpaar in ein A:T-Basenpaar, (6) ein T:A-Basenpaar in ein C: G-Basenpaar, (7) ein C:G-Basenpaar in ein G:C-Basenpaar, (8) ein C:G-Basenpaar in ein T:A-Basenpaar, (9) ein C:G-Basenpaar in ein A:T-Basenpaar, (10) ein A:T-Basenpaar in ein T:A-Basenpaar, (11) ein A:T-Basenpaar in ein G:C-Basenpaar oder (12) ein A:T-Basenpaar in ein C:G-Basenpaar umwandelt.
    81. 81. Das Verfahren der Ausführungsform 76, wobei die gewünschte Nukleotidänderung eine Insertion oder Deletion von 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 oder 25 Nukleotiden ist.
    82. 82. Das Verfahren der Ausführungsform 76, wobei die gewünschte Nukleotidänderung ein krankheitsassoziiertes Gen korrigiert.
    83. 83. Das Verfahren der Ausführungsform 82, wobei das krankheitsassoziierte Gen mit einer monogenen Störung assoziiert ist, die aus der Gruppe ausgewählt ist, die aus Adenosindeaminase-Mangel (ADA-Mangel); Alpha-1 -Antitrypsin-Mangel; Mukoviszidose; Duchenne-Muskeldystrophie; Galaktosämie; Hämochromatose; Huntington-Krankheit; Ahornsirupkrankheit; Marfan-Syndrom; Neurofibromatose Typ 1; Pachyonychia congenita; Phenylketonurie; schwerem kombiniertem Immundefekt; Sichelzellenanämie; Smith-Lemli-Opitz-Syndrom; und Tay-Sachs-Krankheit besteht.
    84. 84. Das Verfahren der Ausführungsform 82, wobei das krankheitsassoziierte Gen mit einer polygenen Störung assoziiert ist, die aus der Gruppe ausgewählt ist, die aus Herzkrankheit; Bluthochdruck; Alzheimer-Krankheit; Arthritis; Diabetes; Krebs; und Fettleibigkeit besteht.
    85. 85. Das Verfahren der Ausführungsform 76, wobei das napDNAbp ein Nuklease-totes Cas9 (dCas9), eine Cas9-Nickase (nCas9) oder ein Nuklease-aktives Cas9 ist.
    86. 86. Das Verfahren der Ausführungsform 76, wobei das napDNAbp eine Aminosäuresequenz von SEQ ID NO: 2 umfasst.
    87. 87. Das Verfahren der Ausführungsform 76, wobei das napDNAbp eine Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % Sequenzidentität mit der Aminosäuresequenz einer beliebigen von SEQ ID NOs: 2-10 umfasst.
    88. 88. Das Verfahren der Ausführungsform 76, wobei die reverse Transkriptase eine beliebige der Aminosäuresequenzen von SEQ ID NO: 11-17 umfasst.
    89. 89. Das Verfahren der Ausführungsform 76, wobei die Reverse-Transkriptase-Domäne eine Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % Sequenzidentität mit der Aminosäuresequenz einer beliebigen von SEQ ID NO: 11 - 17 umfasst.
    90. 90. Das Verfahren der Ausführungsform 76, wobei die Guide-RNA mit Extension eine RNA-Extension an den 3'- oder 5'-Enden oder an einem intramolekularen Ort in der Guide-RNA umfasst, wobei die RNA-Extension die Reverse-Transkriptions-Template-Sequenz umfasst.
    91. 91. Das Verfahren der Ausführungsform 90, wobei die RNA-Extension mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide, mindestens 15 Nukleotide, mindestens 16 Nukleotide, mindestens 17 Nukleotide, mindestens 18 Nukleotide, mindestens 19 Nukleotide, mindestens 20 Nukleotide, mindestens 21 Nukleotide, mindestens 22 Nukleotide, mindestens 23 Nukleotide, mindestens 24 Nukleotide oder mindestens 25 Nukleotide lang ist.
    92. 92. Das Verfahren der Ausführungsform 76, wobei die Guide-RNA mit Extension eine Nukleotidsequenz aufweist, die aus der Gruppe ausgewählt ist, die aus SEQ ID NOs: 18-36 besteht.
    93. 93. Das Verfahren zum Einführen einer oder mehrerer Änderungen in die Nukleotidsequenz eines DNA-Moleküls an einem Target-Locus, umfassend:
      1. (i) Inkontaktbringen des DNA-Moleküls mit einem Nukleinsäure-programmierbaren DNA-Bindungsprotein (napDNAbp) und einer Guide-RNA, die das napDNAbp an den Target-Locus steuert, wobei die Guide-RNA eine Reverse Transkriptase(RT)-Template-Sequenz umfasst, die mindestens eine gewünschte Nukleotidänderung umfasst;
      2. (ii) Bilden eines freigesetzten 3'-Endes in einem DNA-Strang an dem Target-Locus;
      3. (iii) Hybridisieren des freigesetzten 3'-Endes an die RT-Template-Sequenz, um die reverse Transkription zu primen;
      4. (iv) Synthetisieren eines Einzelstrang-DNA-Flaps, der die mindestens eine gewünschte Nukleotidänderung umfasst, basierend auf der RT-Template-Sequenz durch reverse Transkriptase;
      5. (v) und Einbauen der mindestens einen gewünschten Nukleotidänderung in die entsprechende endogene DNA, wodurch eine oder mehrere Änderungen in die Nukleotidsequenz des DNA-Moleküls an dem Target-Locus eingeführt werden.
    94. 94. Das Verfahren der Ausführungsform 93, wobei die eine oder mehreren Änderungen in der Nukleotidsequenz eine Transition umfassen.
    95. 95. Das Verfahren der Ausführungsform 94, wobei die Transition aus der Gruppe ausgewählt ist, die aus (a) T zu C; (b) A zu G; (c) C zu T; und (d) G zu A besteht.
    96. 96. Das Verfahren der Ausführungsform 93, wobei die eine oder mehreren Änderungen in der Nukleotidsequenz eine Transversion umfassen.
    97. 97. Das Verfahren der Ausführungsform 96, wobei die Transversion aus der Gruppe ausgewählt ist, die aus (a) T zu A; (b) T zu G; (c) C zu G; (d) C zu A; (e) A zu T; (f) A zu C; (g) G zu C; und (h) G zu T besteht.
    98. 98. Das Verfahren der Ausführungsform 93, wobei die eine oder mehreren Änderungen in der Nukleotidsequenz ein Ändern (1) eines G:C-Basenpaars in ein T:A-Basenpaar, (2) eines G:C-Basenpaars in ein A:T-Basenpaar umfassen, (3) eines G:C-Basenpaars in ein C:G-Basenpaar, (4) eines T:A-Basenpaars in ein G:C-Basenpaar, (5) eines T:A-Basenpaars in ein A:T-Basenpaar, (6) eines T:A-Basenpaars in ein C:G-Basenpaar, (7) eines C:G-Basenpaars in ein G:C Basenpaar, (8) eines C:G-Basenpaars in ein T:A-Basenpaar, (9) eines C:G-Basenpaars in ein A:T-Basenpaar, (10) eines A:T-Basenpaars in ein T:A-Basenpaar, (11) eines A:T-Basenpaars in ein G:C-Basenpaar oder (12) eines A:T-Basenpaars in ein C:G-Basenpaar umfassen.
    99. 99. Das Verfahren der Ausführungsform 93, wobei die eine oder mehreren Änderungen in der Nukleotidsequenz eine Insertion oder Deletion von 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 oder 25 Nukleotiden umfassen.
    100. 100. Das Verfahren der Ausführungsform 93, wobei die eine oder mehreren Änderungen in der Nukleotidsequenz eine Korrektur an einem krankheitsassoziierten Gen umfassen.
    101. 101. Das Verfahren der Ausführungsform 100, wobei das krankheitsassoziierte Gen mit einer monogenen Störung assoziiert ist, die aus der Gruppe ausgewählt ist, die aus Adenosindeaminase-Mangel (ADA-Mangel); Alpha-1 -Antitrypsin-Mangel; Mukoviszidose; Duchenne-Muskeldystrophie; Galaktosämie; Hämochromatose; Huntington-Krankheit; Ahornsirupkrankheit; Marfan-Syndrom; Neurofibromatose Typ 1; Pachyonychia congenita; Phenylketonurie; schwerem kombiniertem Immundefekt; Sichelzellenanämie; Smith-Lemli-Opitz-Syndrom; und Tay-Sachs-Krankheit besteht.
    102. 102. Das Verfahren der Ausführungsform 100, wobei das krankheitsassoziierte Gen mit einer polygenen Störung assoziiert ist, die aus der Gruppe ausgewählt ist, die aus Herzkrankheit; Bluthochdruck; Alzheimer-Krankheit; Arthritis; Diabetes; Krebs; und Fettleibigkeit besteht.
    103. 103. Das Verfahren der Ausführungsform 93, wobei das napDNAbp ein Nuklease-aktives Cas9 oder eine Variante davon ist.
    104. 104. Das Verfahren der Ausführungsform 93, wobei das napDNAbp ein Nuklease-inaktives Cas9 (dCas9) oder Cas9-Nickase (nCas9) oder eine Variante davon ist.
    105. 105. Das Verfahren der Ausführungsform 93, wobei das napDNAbp eine Aminosäuresequenz von SEQ ID NO: 2 umfasst.
    106. 106. Das Verfahren der Ausführungsform 93, wobei das napDNAbp eine Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % Sequenzidentität mit der Aminosäuresequenz einer beliebigen von SEQ ID NOs: 2-10 umfasst.
    107. 107. Das Verfahren der Ausführungsform 93, wobei die reverse Transkriptase in trans eingeführt wird.
    108. 108. Das Verfahren der Ausführungsform 93, wobei das napDNAbp eine Fusion mit einer reverse Transkriptase umfasst.
    109. 109. Das Verfahren der Ausführungsform 93, wobei die reverse Transkriptase eine beliebige der Aminosäuresequenzen von SEQ ID NO: 11-17 umfasst.
    110. 110. Das Verfahren der Ausführungsform 93, wobei die reverse Transkriptase eine Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % Sequenzidentität mit der Aminosäuresequenz einer beliebigen von SEQ ID NOs: 11-17 umfasst.
    111. 111. Das Verfahren der Ausführungsform 93, wobei der Schritt des Bildens eines freigesetzten 3'-Endes in dem DNA-Strang an dem Target-Locus ein Nicken des DNA-Strangs mit einer Nuklease umfasst.
    112. 112. Das Verfahren der Ausführungsform 111, wobei die Nuklease das napDNAbp ist, als Fusionsdomäne von napDNAbp bereitgestellt wird oder in trans bereitgestellt wird.
    113. 113. Das Verfahren der Ausführungsform 93, wobei der Schritt des Bildens eines freigesetzten 3'-Endes in dem DNA-Strang an dem Target-Locus ein Inkontaktbringen des DNA-Strangs mit einem chemischen Mittel umfasst.
    114. 114. Das Verfahren der Ausführungsform 93, wobei der Schritt des Bildens eines freigesetzten 3'-Endes in dem DNA-Strang an dem Target-Locus ein Einführen eines Replikationsfehlers umfasst.
    115. 115. Das Verfahren der Ausführungsform 93, wobei der Schritt des Inkontaktbringens des DNA-Moleküls mit dem napDNAbp und der Guide-RNA eine R-Schleife bildet.
    116. 116. Das Verfahren der Ausführungsform 115, wobei sich der DNA-Strang, in dem das freigesetzte 3'-Ende gebildet wird, in der R-Schleife befindet.
    117. 117. Das Verfahren der Ausführungsform 93, wobei die Guide-RNA einen Extensionsabschnitt umfasst, der die Reverse Transkriptase(RT)-Template-Sequenz umfasst.
    118. 118. Das Verfahren der Ausführungsform 117, wobei sich der Extensionsabschnitt am 3'-Ende der Guide-RNA, am 5'- Ende der Guide-RNA oder an einer intramolekularen Position in der Guide-RNA befindet.
    119. 119. Das Verfahren der Ausführungsform 93, wobei die Guide-RNA ferner eine Primer-Bindungsstelle umfasst.
    120. 120. Das Verfahren der Ausführungsform 93, wobei die Guide-RNA ferner eine Spacer-Sequenz umfasst.
    121. 121. Das Verfahren der Ausführungsform 93, wobei die RT-Template-Sequenz homolog zu der entsprechenden endogenen DNA ist.
    122. 122. Ein Verfahren zum Einführen einer oder mehrerer Änderungen in die Nukleotidsequenz eines DNA-Moleküls an einem Target-Locus durch Target-geprimte reverse Transkription, wobei das Verfahren Folgendes umfasst: (a) Inkontaktbringen des DNA-Moleküls an dem Target-Locus mit (i) einem Fusionsprotein, das ein Nukleinsäure-programmierbares DNA-Bindungsprotein (napDNAbp) und eine reverse Transkriptase umfasst, und (ii) einer Guide-RNA, die ein RT-Template umfasst, das eine gewünschte Nukleotidänderung umfasst; (b) Ausführen einer Target-geprimten reversen Transkription des RT-Templates, um eine Einzelstrang-DNA zu erzeugen, welche die gewünschte Nukleotidänderung umfasst; und (c) Aufnehmen der gewünschten Nukleotidänderung in das DNA-Molekül an dem Target-Locus durch einen DNA-Reparatur- und/oder - Replikationsprozess.
    123. 123. Das Verfahren der Ausführungsform 122, wobei sich das RT-Template an dem 3'-Ende der Guide-RNA, dem 5'-Ende der Guide-RNA oder an einem intramolekularen Ort in der Guide-RNA befindet.
    124. 124. Das Verfahren der Ausführungsform 122, wobei die gewünschte Nukleotidänderung eine Transition, eine Transversion, eine Insertion oder eine Deletion oder eine beliebige Kombination davon umfasst.
    125. 125. Das Verfahren von Anspruch 122, wobei die gewünschte Nukleotidänderung eine Transition umfasst, die aus der Gruppe ausgewählt ist, die aus (a) T zu C; (b) A zu G; (c) C zu T; und (d) G zu A besteht.
    126. 126. Das Verfahren von Anspruch 122, wobei die gewünschte Nukleotidänderung eine Transversion umfasst, die aus der Gruppe ausgewählt ist, die aus (a) T zu A; (b) T zu G; (c) C zu G; (d) C zu A; (e) A zu T; (f) A zu C; (g) G zu C; und (h) G zu T besteht.
    127. 127. Das Verfahren der Ausführungsform 122, wobei die gewünschte Nukleotidänderung ein Ändern (1) eines G:C-Basenpaars in ein T:A-Basenpaar, (2) eines G:C-Basenpaars in ein A:T-Basenpaar, (3) eines G:C-Basenpaars in ein C:G-Basenpaar, (4) eines T:A-Basenpaars in ein G:C-Basenpaar, (5) eines T:A-Basenpaars in ein A:T-Basenpaar, (6) eines T:A-Basenpaars in ein C:G Basenpaar, (7) eines C:G-Basenpaars in ein G:C-Basenpaar, (8) eines C:G-Basenpaars in ein T:A Basenpaar, (9) eines C:G-Basenpaars in ein A:T-Basenpaar, (10) eines A:T-Basenpaars in ein T:A-Basenpaar, (11) eines A:T-Basenpaars in ein G:C-Basenpaar oder (12) eines A:T-Basenpaars in ein C:G-Basenpaar umfasst.
    128. 128. Ein Polynukleotid, das für die Guide-RNA mit Extension einer beliebigen der Ausführungsformen 31-47 codiert.
    129. 129. Ein Vektor, umfassend das Polynukleotid der Ausführungsform 128.
    130. 130. Eine Zelle, umfassend den Vektor der Ausführungsform 129.
    131. 131. Das Fusionsprotein einer beliebigen der Ausführungsformen 1-30, wobei die reverse Transkriptase eine fehleranfällige reverse Transkriptase ist.
    132. 132. Ein Verfahren zum Mutagenisieren eines DNA-Moleküls an einem Target-Locus durch Target-geprimte reverse Transkription, wobei das Verfahren Folgendes umfasst: (a) Inkontaktbringen des DNA-Moleküls an dem Target-Locus mit (i) einem Fusionsprotein, das ein Nukleinsäure-programmierbares DNA-Bindungsprotein (napDNAbp) und eine fehleranfällige reverse Transkriptase umfasst, und (ii) einer Guide-RNA, die ein RT-Template umfasst, das eine gewünschte Nukleotidänderung umfasst; (b) Ausführen einer Target-geprimten reversen Transkription des RT-Templates, um eine mutagenisierte Einzelstrang-DNA zu erzeugen; und (c) Aufnehmen der mutagenisierten Einzelstrang-DNA in das DNA-Molekül an dem Target-Locus durch einen DNA-Reparatur- und/oder -Replikationsprozess.
    133. 133. Das Verfahren der Ausführungsform 132, wobei das Fusionsprotein die Aminosäuresequenz von PE1, PE2 oder PE3 umfasst.
    134. 134. Das Verfahren der Ausführungsform 132, wobei das napDNAbp eine Cas9-Nickase (nCas9) ist.
    135. 135. Das Verfahren der Ausführungsform 132, wobei das napDNAbp die Aminosäuresequenz von SEQ ID NOs: 18-25 umfasst.
    136. 136. Das Verfahren der Ausführungsform 132, wobei die Guide-RNA SEQ ID NOs: 222 umfasst.
    137. 137. Das Verfahren der Ausführungsform 132, wobei der Schritt (b) des Ausführens einer Target-geprimten reversen Transkription ein Erzeugen einer 3'-Ende-Primer-Bindungssequenz an dem Target-Locus umfasst, die in der Lage ist, die reverse Transkription durch Annealing an eine Primer-Bindungsstelle auf der Guide-RNA zu primen.
    138. 138. Ein Verfahren zum Ersetzen einer Trinukleotid-Repeat-Expansionsmutation in einem Target-DNA-Molekül durch eine gesunde Sequenz, die eine gesunde Anzahl von Repeat-Trinukleotiden umfasst, wobei das Verfahren Folgendes umfasst: (a) Inkontaktbringen des DNA-Moleküls an dem Target-Locus mit (i) einem Fusionsprotein, das ein Nukleinsäure-programmierbares DNA-Bindungsprotein (napDNAbp) und eine reverse Transkriptase umfasst, und (ii) einer Guide-RNA, die ein RT-Template umfasst, das die Ersatzsequenz umfasst, wobei das Fusionsprotein intr; (b) Ausführen einer Target-geprimten reversen Transkription des RT-Templates, um eine Einzelstrang-DNA zu erzeugen, welche die Ersatzsequenz umfasst; und (c) Aufnehmen der Einzelstrang-DNA in das DNA-Molekül an dem Target-Locus durch einen DNA-Reparatur- und/oder - Replikationsprozess.
    139. 139. Das Verfahren der Ausführungsform 138, wobei das Fusionsprotein die Aminosäuresequenz von PE1, PE2 oder PE3 umfasst.
    140. 140. Das Verfahren der Ausführungsform 138, wobei das napDNAbp eine Cas9-Nickase (nCas9) ist.
    141. 141. Das Verfahren der Ausführungsform 138, wobei das napDNAbp die Aminosäuresequenz von SEQ ID NOs: 18-25 umfasst.
    142. 142. Das Verfahren der Ausführungsform 138, wobei die Guide-RNA SEQ ID NOs: 222 umfasst.
    143. 143. Das Verfahren der Ausführungsform 138, wobei der Schritt (b) des Ausführens einer Target-geprimten reversen Transkription ein Erzeugen einer 3'-Ende-Primer-Bindungssequenz an dem Target-Locus umfasst, die in der Lage ist, die reverse Transkription durch Annealing an eine Primer-Bindungsstelle auf der Guide-RNA zu primen.
    144. 144. Das Verfahren der Ausführungsform 138, wobei die Trinukleotid-Repeat-Expansionsmutation mit Huntington-Krankheit, Fragile-X-Syndrom oder Friedreich-Ataxie assoziiert ist.
    145. 145. Das Verfahren der Ausführungsform 138, wobei die Trinukleotid-Repeat-Expansionsmutation eine Repeat-Einheit von CAG-Tripletts umfasst.
    146. 146. Das Verfahren der Ausführungsform 138, wobei die Trinukleotid-Repeat-Expansionsmutation eine Repeat-Einheit von GAA-Tripletts umfasst.
    147. 147. Ein Verfahren zum Einbauen einer funktionellen Gruppierung in einem interessierenden Protein, für das von einer Target-Nukleotidsequenz codiert wird, durch Prime Editing, wobei das Verfahren Folgendes umfasst: (a) Inkontaktbringen der Target-Nukleotidsequenz mit (i) einem Prime Editor, der ein Nukleinsäure-programmierbares DNA-Bindungsprotein (napDNAbp) und eine reverse Transkriptase umfasst, und (ii) einer PEgRNA, die ein Edit-Template umfasst, das für die funktionelle Gruppierung codiert; (b) Polymerisieren einer Einzelstrang-DNA-Sequenz, die für die funktionelle Gruppierung codiert; und (c) Aufnehmen der Einzelstrang-DNA-Sequenz anstelle eines entsprechenden endogenen Strangs in die Target-Nukleotidsequenz durch einen DNA-Reparatur- und/oder -Replikationsprozess, wobei das Verfahren eine rekombinante Target-Nukleotidsequenz erzeugt, die für ein Fusionsprotein codiert, welches das interessierende Protein und die funktionelle Gruppierung umfasst.
    148. 148. Das Verfahren der Ausführungsform 147, wobei die funktionelle Gruppierung ein Peptid-Tag ist.
    149. 149. Das Verfahren der Ausführungsform 148, wobei das Peptid-Tag ein Affinitäts-Tag, ein Solubilisierungs-Tag, ein Chromatografie-Tag, ein Epitop-Tag oder ein Fluoreszenz-Tag ist.
    150. 150. Das Verfahren der Ausführungsform 148, wobei das Peptid-Tag aus der Gruppe ausgewählt ist, die aus AviTag (SEQ ID NO: 245); C-Tag (SEQ ID NO: 246); Calmodulin-Tag (SEQ ID NO: 247); Polyglutamat-Tag (SEQ ID NO: 248); E-Tag (SEQ ID NO: 249); FLAG-Tag (SEQ ID NO: 250); HA-Tag (SEQ ID NO: 251); His-Tag (SEQ ID NOs: 252-262); Myc-Tag (SEQ ID NO: 263); NE-Tag (SEQ ID NO: 264); Rho1D4-Tag (SEQ ID NO: 265); S-Tag (SEQ ID NO: 266); SBP-Tag (SEQ ID NO: 267); Softag-1 (SEQ ID NO: 268); Softag-2 (SEQ ID NO: 269); Spot-Tag (SEQ ID NO: 270); Strep-Tag (SEQ ID NO: 271); TC-Tag (SEQ ID NO: 272); Ty-Tag (SEQ ID NO: 273); V5-Tag (SEQ ID NO: 274); VSV-Tag (SEQ ID NO: 275); und Xpress-Tag (SEQ ID NO: 276) besteht.
    151. 151. Das Verfahren der Ausführungsform 148, wobei das Peptid-Tag aus der Gruppe ausgewählt ist, die aus AU1-Epitop (SEQ ID NO: 278); AU5-Epitop (SEQ ID NO: 279); Bakteriophagen-T7-Epitop (T7-Tag) (SEQ ID NO: 280); Blauzungenvirus-Tag (B-Tag) (SEQ ID NO: 281); E2-Epitop (SEQ ID NO: 282); Histidin-Affinitäts-Tag (HAT) (SEQ ID NO: 283); HSV-Epitop (SEQ ID NO: 284); Polyarginin (Arg-Tag) (SEQ ID NO: 285); Polyaspartat (Asp-Tag) (SEQ ID NO: 286); Polyphenylalanin (Phe-Tag) (SEQ ID NO: 287); S1-Tag (SEQ ID NO: 288); S-Tag (SEQ ID NO: 289); und VSV-G (SEQ ID NO: 290) besteht.
    152. 152. Das Verfahren der Ausführungsform 147, wobei die funktionelle Gruppierung ein Immunepitop ist.
    153. 153. Das Verfahren der Ausführungsform 152, wobei das Immunepitop aus der Gruppe ausgewählt ist, die aus Tetanustoxoid (SEQ ID NO: 396); Diphtherie-Toxin-Mutante CRM197 (SEQ ID NO: 398); Mumps-Immunepitop 1 (SEQ ID NO: 400); Mumps-Immunepitop 2 (SEQ ID NO: 402); Mumps-Immunepitop 3 (SEQ ID NO: 404); Rötelnvirus (SEQ ID NO: 406); Hämagglutinin (SEQ ID NO: 408); Neuraminidase (SEQ ID NO: 410); TAP1 (SEQ ID NO: 412); TAP2 (SEQ ID NO: 414); Hämagglutinin-Epitope für HLA der Klasse I (SEQ ID NO: 416); Neuraminidase-Epitope für HLA der Klasse I (SEQ ID NO: 418); Hämagglutinin-Epitope für HLA der Klasse II (SEQ ID NO: 420); Neuraminidase-Epitope für HLA der Klasse II (SEQ ID NO: 422); Hämagglutinin-Epitop H5N1-gebundenem HLA der Klasse I und Klasse II (SEQ ID NO: 424); und Neuraminidase-Epitop H5N1-gebundenem HLA der Klasse I und Klasse II (SEQ ID NO: 426) besteht.
    154. 154. Das Verfahren der Ausführungsform 147, wobei die funktionelle Gruppierung die Lokalisierung des interessierenden Proteins verändert.
    155. 155. Das Verfahren der Ausführungsform 147, wobei die funktionelle Gruppierung ein Abbau-Tag ist, so dass die Abbaurate des interessierenden Proteins verändert wird.
    156. 156. Das Verfahren der Ausführungsform 155, wobei das Abbau-Tag.
    157. 157. Das Verfahren der Ausführungsform 147, wobei die funktionelle Gruppierung eine Kleinmolekül-Bindungsdomäne ist.
    158. 158. Das Verfahren der Ausführungsform 157, wobei die Kleinmolekül-Bindungsdomäne FKBP12 von SEQ ID NO: 488 ist.
    159. 159. Das Verfahren der Ausführungsform 157, wobei die Kleinmolekül-Bindungsdomäne FKBP12-F36V von SEQ ID NO: 489 ist.
    160. 160. Das Verfahren der Ausführungsform 157, wobei die Kleinmolekül-Bindungsdomäne Cyclophilin der SEQ ID NOs: 492-494 ist.
    161. 161. Das Verfahren der Ausführungsform 157, wobei die Kleinmolekül-Bindungsdomäne in zwei oder mehr interessierenden Proteinen eingebaut wird.
    162. 162. Das Verfahren der Ausführungsform 161, wobei die zwei oder mehr interessierenden Proteine bei einem Inkontaktbringen mit einem kleinen Molekül dimerisieren können.
    163. 163. Das Verfahren der Ausführungsform 157, wobei das kleine Molekül ein Dimer eines kleinen Moleküls ist, das aus der Gruppe ausgewählt ist, die aus Folgendem besteht:
      Figure DE112020001339T5_0399
      Figure DE112020001339T5_0400
      Figure DE112020001339T5_0401
      Figure DE112020001339T5_0402
      Figure DE112020001339T5_0403
      und
      Figure DE112020001339T5_0404
    164. 164. Verfahren zum Einbauen eines Immunepitops in einem interessierenden Protein, für das von einer Target-Nukleotidsequenz codiert wird, durch Prime Editing, wobei das Verfahren Folgendes umfasst: (a) Inkontaktbringen der Target-Nukleotidsequenz mit (i) einem Prime Editor, der ein Nukleinsäure-programmierbares DNA-Bindungsprotein (napDNAbp) und eine reverse Transkriptase umfasst, und (ii) einer PEgRNA, die ein Edit-Template umfasst, das für die funktionelle Gruppierung codiert; (b) Polymerisieren einer Einzelstrang-DNA-Sequenz, die für das Immunepitop codiert; und (c) Aufnehmen der Einzelstrang-DNA-Sequenz anstelle eines entsprechenden endogenen Strangs in die Target-Nukleotidsequenz durch einen DNA-Reparatur- und/oder Replikationsprozess, wobei das Verfahren eine rekombinante Target-Nukleotidsequenz erzeugt, die für ein Fusionsprotein codiert, welches das interessierende Protein und das Immunepitop umfasst.
    165. 165. Das Verfahren der Ausführungsform 164, wobei das Immunepitop aus der Gruppe ausgewählt ist, die aus: Tetanustoxoid (SEQ ID NO: 396); Diphtherie-Toxin-Mutante CRM197 (SEQ ID NO: 398); Mumps-Immunepitop 1 (SEQ ID NO: 400); Mumps-Immunepitop 2 (SEQ ID NO: 402); Mumps-Immunepitop 3 (SEQ ID NO: 404); Rötelnvirus (SEQ ID NO: 406); Hämagglutinin (SEQ ID NO: 408); Neuraminidase (SEQ ID NO: 410); TAP1 (SEQ ID NO: 412); TAP2 (SEQ ID NO: 414); Hämagglutinin-Epitope für HLA der Klasse I (SEQ ID NO: 416); Neuraminidase-Epitope für HLA der Klasse I (SEQ ID NO: 418); Hämagglutinin-Epitope für HLA der Klasse II (SEQ ID NO: 420); Neuraminidase-Epitope für HLA der Klasse II (SEQ ID NO: 422); Hämagglutinin-Epitop H5N1-gebundenem HLA der Klasse I und Klasse II (SEQ ID NO: 424); und Neuraminidase-Epitop H5N1-gebundenem HLA der Klasse I und Klasse II (SEQ ID NO: 426) besteht.
    166. 166. Das Verfahren der Ausführungsform 164, wobei das Fusionsprotein die Aminosäuresequenz von PE1, PE2 oder PE3 umfasst.
    167. 167. Das Verfahren der Ausführungsform 164, wobei das napDNAbp eine Cas9-Nickase (nCas9) ist.
    168. 168. Das Verfahren der Ausführungsform 164, wobei das napDNAbp die Aminosäuresequenz von SEQ ID NOs: 18-25 umfasst.
    169. 169. Das Verfahren der Ausführungsform 164, wobei die Guide-RNA SEQ ID NOs: 222 umfasst.
    170. 170. Das Verfahren zum Einbauen einer Kleinmolekül-Dimerisierungsdomäne in einem interessierenden Protein, für das von einer Target-Nukleotidsequenz codiert wird, durch Prime-Editing, wobei das Verfahren Folgendes umfasst: (a) Inkontaktbringen der Target-Nukleotidsequenz mit (i) einem Prime Editor, der ein Nukleinsäure-programmierbares DNA-Bindungsprotein (napDNAbp) und eine reverse Transkriptase umfasst, und (ii) einer PEgRNA, die ein Edit-Template umfasst, das für die Kleinmolekül-Dimerisierungsdomäne codiert; (b) Polymerisieren einer Einzelstrang-DNA-Sequenz, die für das Immunepitop codiert; und (c) Aufnehmen der Einzelstrang-DNA-Sequenz anstelle eines entsprechenden endogenen Strangs in die Target-Nukleotidsequenz durch einen DNA-Reparatur- und/oder Replikationsprozess, wobei das Verfahren eine rekombinante Target-Nukleotidsequenz erzeugt, die für ein Fusionsprotein codiert, welches das interessierende Protein und die Kleinmolekül-Dimerisierungsdomäne umfasst.
    171. 171. Das Verfahren der Ausführungsform 170, ferner umfassend ein Ausführen des Verfahrens an einem zweiten interessierenden Protein.
    172. 172. Das Verfahren der Ausführungsform 171, wobei das erste interessierende Protein und das zweite interessierende Protein in Gegenwart eines kleinen Moleküls dimerisieren, das an die Dimerisierungsdomäne auf jedem der Proteine bindet.
    173. 173. Das Verfahren der Ausführungsform 170, wobei die Kleinmolekül-Bindungsdomäne FKBP12 von SEQ ID NO: 488 ist.
    174. 174. Das Verfahren der Ausführungsform 170, wobei die Kleinmolekül-Bindungsdomäne FKBP12-F36V von SEQ ID NO: 489 ist.
    175. 175. Das Verfahren der Ausführungsform 170, wobei die Kleinmolekül-Bindungsdomäne Cyclophilin der SEQ ID NOs: 492-494 ist.
    176. 176. Das Verfahren der Ausführungsform 170, wobei das kleine Molekül ein Dimer eines kleinen Moleküls ist, das aus der Gruppe ausgewählt ist, die aus Folgendem besteht:
      Figure DE112020001339T5_0405
      Figure DE112020001339T5_0406
      Figure DE112020001339T5_0407
      Figure DE112020001339T5_0408
      Figure DE112020001339T5_0409
      ;und
      Figure DE112020001339T5_0410
    177. 177. Das Verfahren der Ausführungsform 170, wobei das Fusionsprotein die Aminosäuresequenz von PE1, PE2 oder PE3 umfasst.
    178. 178. Das Verfahren der Ausführungsform 170, wobei das napDNAbp eine Cas9-Nickase (nCas9) ist.
    179. 179. Das Verfahren der Ausführungsform 170, wobei das napDNAbp die Aminosäuresequenz von SEQ ID NOs: 18-25 umfasst.
    180. 180. Das Verfahren der Ausführungsform 170, wobei die Guide-RNA SEQ ID NOs: 222 umfasst.
    181. 181. Ein Verfahren zum Einbauen eines Peptid-Tags oder Epitops auf einem Protein unter Verwendung von Prime Editing, umfassend: Inkontaktbringen einer Target-Nukleotidsequenz, die für das Protein codiert, mit einem Prime Editor-Konstrukt, das konfiguriert ist, um darin eine zweite Nukleotidsequenz zu inserieren, die für das Peptid-Tag codiert, um zu einer rekombinanten Nukleotidsequenz zu führen, so dass das Peptid-Tag und das Protein von der rekombinanten Nukleotidsequenz als ein Fusionsprotein exprimiert werden.
    182. 182. Das Verfahren der Ausführungsform 181, wobei das Peptid-Tag zur Reinigung und/oder Detektion des Proteins verwendet wird.
    183. 183. Das Verfahren der Ausführungsform 181, wobei das Peptid-Tag ein Polyhistidin (z.B. HHHHHH), FLAG (z.B. DYKDDDDK), V5 (z.B. GKPIPNPLLGLDST), GCN4, HA (z.B. YPYDVPDYA), Myc (z.B. EQKLISEED), GST .... usw. ist.
    184. 184. Das Verfahren der Ausführungsform 181, wobei das Peptid-Tag eine Aminosäuresequenz aufweist, die aus der Gruppe ausgewählt ist, die aus SEQ ID NO: 245-290 besteht.
    185. 185. Das Verfahren der Ausführungsform 181, wobei das Peptid-Tag durch einen Linker mit dem Protein fusioniert ist.
    186. 186. Das Verfahren der Ausführungsform 181, wobei das Fusionsprotein die folgende Struktur aufweist: [Protein]-[Peptid-Tag] oder [Peptid-Tag]-[Protein], wobei „]-[“ einen optionalen Linker darstellt.
    187. 187. Das Verfahren der Ausführungsform 181, wobei der Linker eine Aminosäuresequenz von SEQ ID NO: 127, 165-176, 446, 453 und 767-769 aufweist.
    188. 188. Das Verfahren der Ausführungsform 181, wobei das Prime Editor-Konstrukt eine PEgRNA umfasst, welche die Nukleotidsequenz von SEQ ID NOs: 18-25 umfasst.
    189. 189. Das Verfahren der Ausführungsform 181, wobei die PEgRNA einen Spacer, einen gRNA-Kern und einen Extension-Arm umfasst, wobei der Spacer komplementär zur Target-Nukleotidsequenz ist und der Extension-Arm ein Reverse-Transkriptase-Template umfasst, das für das Peptid-Tag codiert.
    190. 190. Das Verfahren der Ausführungsform 181, wobei die PEgRNA einen Spacer, einen gRNA-Kern und einen Extension-Arm umfasst, wobei der Spacer komplementär zur Target-Nukleotidsequenz ist und der Extension-Arm ein Reverse-Transkriptase-Template umfasst, das für das Peptid-Tag codiert.
    191. 191. Ein Verfahren zum Verhindern oder Anhalten des Fortschreitens einer Prionenkrankheit durch Einbauen einer oder mehrerer schützender Mutationen in PRNP, für das von einer Target-Nukleotidsequenz codiert wird, durch Prime Editing, wobei das Verfahren Folgendes umfasst: (a) Inkontaktbringen der Target-Nukleotidsequenz mit (i) einem Prime Editor, der ein Nukleinsäure-programmierbares DNA-Bindungsprotein (napDNAbp) und eine reverse Transkriptase umfasst, und (ii) einer PEgRNA, die ein Edit-Template umfasst, das für die funktionelle Gruppierung codiert; (b) Polymerisieren einer Einzelstrang-DNA-Sequenz, die für die schützende Mutation codiert; und (c) Aufnehmen der Einzelstrang-DNA-Sequenz anstelle eines entsprechenden endogenen Strangs in die Target-Nukleotidsequenz durch einen DNA-Reparatur- und/oder -Replikationsprozess, wobei das Verfahren eine rekombinante Target-Nukleotidsequenz erzeugt, die für ein PRNP codiert, das eine schützende Mutation umfasst, und das resistent gegen Fehlfaltung ist.
    192. 192. Das Verfahren der Ausführungsform 191, wobei die Prionenkrankheit eine Prionenkrankheit des Menschen ist.
    193. 193. Das Verfahren der Ausführungsform 191, wobei die Prionenkrankheit eine Prionenkrankheit bei Tieren ist.
    194. 194. Das Verfahren der Ausführungsform 192, wobei die Prionenkrankheit Creutzfeldt-Jakob-Krankheit (CJK), variante Creutzfeldt-Jakob-Krankheit (vCJK), Gerstmann-Straussler-Scheinker-Syndrom, letale familiäre Insomnie oder Kuru ist.
    195. 195. Das Verfahren der Ausführungsform 193, wobei die Prionenkrankheit spongiforme Enzephalopathie bei Rindern (BSE oder „Rinderwahnsinn“), chronische Auszehrkrankheit (CWD), Scrapie, übertragbare Enzephalopathie bei Nerzen, spongiforme Enzephalopathie bei Katzen und spongiforme Enzephalopathie bei Huftieren ist.
    196. 196. Das Verfahren der Ausführungsform 191, wobei die Wildtyp-PRNP-Aminosäuresequenz SEQ ID NOs: 291-292 ist.
    197. 197. Das Verfahren der Ausführungsform 191, wobei das Verfahren zu einer modifizierten PRNP-Aminosäuresequenz führt, die aus der Gruppe ausgewählt ist, die aus SEQ ID NOs: 293-323 besteht, wobei das modifizierte PRNP-Protein resistent gegen Fehlfaltung ist.
    198. 198. Das Verfahren der Ausführungsform 191, wobei das Fusionsprotein die Aminosäuresequenz von PE1, PE2 oder PE3 umfasst.
    199. 199. Das Verfahren der Ausführungsform 191, wobei das napDNAbp eine Cas9-Nickase (nCas9) ist.
    200. 200. Das Verfahren der Ausführungsform 191, wobei das napDNAbp die Aminosäuresequenz von SEQ ID NOs: 18-25 umfasst.
    201. 201. Das Verfahren der Ausführungsform 191, wobei die Guide-RNA SEQ ID NOs: 222 umfasst.
    202. 202. Ein Verfahren zum Einbauen eines Ribonukleotid-Motivs oder -Tags in eine interessierende RNA, für die von einer Target-Nukleotidsequenz codiert wird, durch Prime Editing, wobei das Verfahren Folgendes umfasst: (a) Inkontaktbringen der Target-Nukleotidsequenz mit (i) einem Prime Editor, der ein Nukleinsäure-programmierbares DNA-Bindungsprotein (napDNAbp) und eine reverse Transkriptase umfasst, und (ii) einer PEgRNA, die ein Edit-Template umfasst, das für das Ribonukleotid-Motiv oder -Tag codiert; (b) Polymerisieren einer Einzelstrang-DNA-Sequenz, die für das Ribonukleotid-Motiv oder -Tag codiert; und (c) Aufnehmen der Einzelstrang-DNA-Sequenz anstelle eines entsprechenden endogenen Strangs in die Target-Nukleotidsequenz durch einen DNA-Reparatur- und/oder -Replikationsprozess, wobei das Verfahren eine rekombinante Target-Nukleotidsequenz erzeugt, die für eine modifizierte interessierende RNA codiert, die das Ribonukleotid-Motiv oder -Tag umfasst.
    203. 203. Das Verfahren der Ausführungsform 202, wobei das Ribonukleotid-Motiv oder - Tag eine Detektionsgruppierung ist.
    204. 204. Das Verfahren der Ausführungsform 202, wobei das Ribonukleotid-Motiv oder - Tag das Expressionsniveau der interessierenden RNA beeinflusst.
    205. 205. Das Verfahren der Ausführungsform 202, wobei das Ribonukleotid-Motiv oder - Tag den Transport oder den subzelluläre Ort der interessierenden RNA beeinflusst.
    206. 206. Das Verfahren der Ausführungsform 202, wobei das Ribonukleotid-Motiv oder - Tag aus der Gruppe ausgewählt ist, die aus SV40 Typ 1, SV40 Typ 2, SV40 Typ 3, hGH, BGH, rbGlob, TK, MALAT1 ENE-mascRNA, KSHV PAN ENE, Smbox/U1 snRNA-Box, U1 snRNA 3'-Box, tRNA-Lysin, Brokkoli-Aptamer, Spinat-Aptamer, Mango-Aptamer, HDV-Ribozym und m6A besteht.
    207. 207. Das Verfahren der Ausführungsform 202, wobei die PEgRNA SEQ ID NOs: 18-25 umfasst.
    208. 208. Das Verfahren der Ausführungsform 202, wobei das Fusionsprotein die Aminosäuresequenz von PE1, PE2 oder PE3 umfasst.
    209. 209. Das Verfahren der Ausführungsform 202, wobei das napDNAbp eine Cas9-Nickase (nCas9) ist.
    210. 210. Das Verfahren der Ausführungsform 202, wobei das napDNAbp die Aminosäuresequenz von SEQ ID NOs: 18-25 umfasst.
    211. 211. Ein Verfahren zum Einbauen oder Deletieren einer funktionellen Gruppierung in ein interessierendes Protein, für das von einer Target-Nukleotidsequenz codiert wird, durch Prime-Editing, wobei das Verfahren Folgendes umfasst: (a) Inkontaktbringen der Target-Nukleotidsequenz mit (i) einem Prime Editor, der ein Nukleinsäureprogrammierbare DNA-Bindungsprotein (napDNAbp) und eine reverse Transkriptase umfasst, und (ii) einer PEgRNA, die ein Edit-Template umfasst, das für die funktionelle Gruppierung oder Deletion derselben codiert; (b) Polymerisieren einer Einzelstrang-DNA-Sequenz, die für die funktionelle Gruppierung oder Deletion derselben codiert; und (c) Aufnehmen der Einzelstrang-DNA-Sequenz anstelle eines entsprechenden endogenen Strangs in die Target-Nukleotidsequenz durch einen DNA-Reparatur- und/oder - Replikationsprozess, wobei das Verfahren eine rekombinante Target-Nukleotidsequenz erzeugt, die für ein modifiziertes Protein codiert, welches das interessierende Protein und die funktionelle Gruppierung oder die Entfernung derselben umfasst, wobei die funktionelle Gruppierung einen Modifikationszustand oder Lokalisierungszustand des Proteins ändert.
    212. 212. Das Verfahren der Ausführungsform 211, wobei die funktionelle Gruppierung den Phosphorylierungs-, Ubiquitylierungs-, Glykosylierungs-, Lipidierungs-, Hydroxylierungs- , Methylierungs-, Acetylierungs-, Crotonylierungs-, SUMOylierungszustand des interessierenden Proteins ändert.
  • GRUPPE 2. AUSFÜHRUNGSFORMEN 213-424
    • 213. Ein Fusionsprotein, umfassend ein Nukleinsäure-programmierbares DNA-Bindungsprotein (napDNAbp) und eine Polymerase.
    • 214. Das Fusionsprotein der Ausführungsform 213, wobei das Fusionsprotein in der Lage ist, ein Prime Editing in Gegenwart einer Prime Editing-Guide-RNA (PEgRNA) auszuführen.
    • 215. Das Fusionsprotein der Ausführungsform 213, wobei das napDNAbp eine Nickase-Aktivität aufweist.
    • 216. Das Fusionsprotein der Ausführungsform 213, wobei das napDNAbp ein Cas9-Protein oder eine Variante davon ist.
    • 217. Das Fusionsprotein der Ausführungsform 213, wobei das napDNAbp ein Nuklease-aktives Cas9, ein Nuklease-inaktives Cas9 (dCas9) oder eine Cas9-Nickase (nCas9) ist.
    • 218. Das Fusionsprotein der Ausführungsform 213, wobei das napDNAbp Cas9-Nickase (nCas9) ist.
    • 219. Das Fusionsprotein der Ausführungsform 213, wobei das napDNAbp aus der Gruppe ausgewählt ist, die aus Cas9, Cas12e, Cas12d, Cas12a, Cas12b1, Cas13a, Cas12c und Argonaute besteht, und optional eine Nickase-Aktivität aufweist.
    • 220. Das Fusionsprotein der Ausführungsform 213, wobei das Fusionsprotein, wenn es mit einer PEgRNA komplexiert ist, in der Lage ist, an eine Target-DNA-Sequenz zu binden.
    • 221. Das Fusionsprotein der Ausführungsform 220, wobei die Target-DNA-Sequenz einen Target-Strang und einen komplementären Nicht-Target-Strang umfasst.
    • 222. Das Fusionsprotein der Ausführungsform 220, wobei die Bindung des mit der PEgRNA komplexierten Fusionsproteins eine R-Schleife bildet.
    • 223. Das Fusionsprotein der Ausführungsform 222, wobei die R-Schleife (i) ein RNA-DNA-Hybrid, das die PEgRNA und den Target-Strang umfasst, und (ii) den komplementären Nicht-Target-Strang umfasst.
    • 224. Das Fusionsprotein der Ausführungsform 223, wobei der komplementäre Nicht-Target-Strang genickt ist, um eine Priming-Sequenz mit einem freien 3'-Ende zu bilden.
    • 225. Das Fusionsprotein der Ausführungsform 214, wobei die PEgRNA (a) eine Guide-RNA und (b) einen Extension-Arm am 5'- oder 3'-Ende der Guide-RNA oder an einem intramolekularen Ort in der Guide-RNA umfasst.
    • 226. Das Fusionsprotein der Ausführungsform 225, wobei der Extension-Arm (i) eine DNA-Synthese-Template-Sequenz, die eine gewünschte Nukleotidänderung umfasst, und (ii) eine Primer-Bindungsstelle umfasst.
    • 227. Das Fusionsprotein der Ausführungsform 226, wobei die DNA-Synthese-Template-Sequenz für einen Einzelstrang-DNA-Flap codiert, der komplementär zu einer endogenen DNA-Sequenz neben der Nick-Stelle ist, wobei der Einzelstrang-DNA-Flap die gewünschte Nukleotidänderung umfasst.
    • 228. Das Fusionsprotein der Ausführungsform 225, wobei der Extension-Arm mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide, mindestens 15 Nukleotide, mindestens 16 Nukleotide, mindestens 17 Nukleotide, mindestens 18 Nukleotide, mindestens 19 Nukleotide, mindestens 20 Nukleotide, mindestens 21 Nukleotide, mindestens 22 Nukleotide, mindestens 23 Nukleotide, mindestens 24 Nukleotide oder mindestens 25 Nukleotide lang ist.
    • 229. Das Fusionsprotein der Ausführungsform 227, wobei der Einzelstrang-DNA-Flap an die endogene DNA-Sequenz neben der Nick-Stelle hybridisiert, wodurch die gewünschte Nukleotidänderung eingebaut wird.
    • 230. Das Fusionsprotein der Ausführungsform 227, wobei der Einzelstrang-DNA-Flap die endogene DNA-Sequenz neben der Nick-Stelle und die ein freies 5'-Ende aufweist verdrängt.
    • 231. Das Fusionsprotein der Ausführungsform 230, wobei die endogene DNA-Sequenz mit dem 5'-Ende von der Zelle ausgeschnitten wird.
    • 232. Das Fusionsprotein der Ausführungsform 230, wobei die zelluläre Reparatur des Einzelstrang-DNA-Flaps zum Einbau der gewünschten Nukleotidänderung führt, wodurch ein gewünschtes Produkt gebildet wird.
    • 233. Das Fusionsprotein der Ausführungsform 226, wobei die gewünschte Nukleotidänderung in einem Editing-Fenster eingebaut ist, das zwischen etwa -4 bis +10 der PAM-Sequenz oder zwischen etwa -10 bis +20 der PAM-Sequenz oder zwischen etwa -20 bis +40 der PAM-Sequenz oder zwischen etwa -30 bis +100 der PAM-Sequenz liegt oder wobei die gewünschte Nukleotidänderung mindestens 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 oder 100 Nukleotide stromabwärts der Nick-Stelle eingebaut ist.
    • 234. Das Fusionsprotein der Ausführungsform 213, wobei das napDNAbp eine Aminosäuresequenz von SEQ ID NO: 2 oder eine Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % Sequenzidentität mit der Aminosäuresequenz von SEQ ID NO: 2 umfasst.
    • 235. Das Fusionsprotein der Ausführungsform 213, wobei das napDNAbp eine Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % Sequenzidentität mit der Aminosäuresequenz einer beliebigen von SEQ ID Nos: 2-10 umfasst.
    • 236. Das Fusionsprotein der Ausführungsform 213, wobei die Polymerase eine reverse Transkriptase ist, die eine beliebige der Aminosäuresequenzen von SEQ ID NO: 11-17 umfasst.
    • 237. Das Fusionsprotein der Ausführungsform 213, wobei die Polymerase eine reverse Transkriptase ist, die eine Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % Sequenzidentität mit der Aminosäuresequenz einer beliebigen von SEQ ID NOs: 11-17 umfasst.
    • 238. Das Fusionsprotein der Ausführungsform 213, wobei die Polymerase eine natürlich vorkommende reverse Transkriptase aus einem Retrovirus oder einem Retrotransposon ist.
    • 239. Das Fusionsprotein nach einer der vorhergehenden Ausführungsformen, wobei das Fusionsprotein die Struktur NH2-[napDNAbp]-[Polymerase]-COOH; oder NH2- [Polymerase]-[napDNAbp]-COOH umfasst, wobei jedes Auftreten von „]-[“ das Vorhandensein einer optionalen Linker-Sequenz anzeigt.
    • 240. Das Fusionsprotein der Ausführungsform 239, wobei die Linker-Sequenz eine Aminosäuresequenz von SEQ ID NOs: 37-47 umfasst.
    • 241. Das Fusionsprotein der Ausführungsform 226, wobei die gewünschte Nukleotidänderung eine Einzelnukleotidänderung, eine Insertion eines oder mehrerer Nukleotide oder eine Deletion eines oder mehrerer Nukleotide ist.
    • 242. Das Fusionsprotein der Ausführungsform 241, wobei das Insert oder die Deletion mindestens 1, mindestens 2, mindestens 3, mindestens 4, mindestens 5, mindestens 6, mindestens 7, mindestens 8, mindestens 9, mindestens 10, mindestens 11, mindestens 12, mindestens 13, mindestens 14, mindestens 15, mindestens 16, mindestens 17, mindestens 18, mindestens 19, mindestens 20, mindestens 21, mindestens 22, mindestens 23, mindestens 24, mindestens 25, mindestens 26, mindestens 27, mindestens 28, mindestens 29, mindestens 30, mindestens 31, mindestens 32, mindestens 33, mindestens 34, mindestens 35, mindestens 36, mindestens 37, mindestens 38, mindestens 39, mindestens 40, mindestens 41, mindestens 42, mindestens 43, mindestens 44, mindestens 45, mindestens 46, mindestens 47, mindestens 48, mindestens 49 oder mindestens 50 ist.
    • 243. Eine PEgRNA, umfassend eine Guide-RNA und mindestens einen Nukleinsäure-Extension-Arm, der ein DNA-Synthese-Template umfasst.
    • 244. Die PEgRNA der Ausführungsform 241, wobei der Nukleinsäure-Extension-Arm am 3'- oder 5'-Ende der Guide-RNA oder an einer intramolekularen Position in der Guide-RNA positioniert ist, und wobei der Nukleinsäure-Extension-Arm DNA oder RNA ist.
    • 245. Die PEgRNA der Ausführungsform 242, wobei die PEgRNA in der Lage ist, an ein napDNAbp zu binden und das napDNAbp an eine Target-DNA-Sequenz zu steuern.
    • 246. Die PEgRNA der Ausführungsform 245, wobei die Target-DNA-Sequenz einen Target-Strang und einen komplementären Nicht-Target-Strang umfasst, wobei die Guide-RNA an den Target-Strang hybridisiert, um ein RNA-DNA-Hybrid und eine R-Schleife zu bilden.
    • 247. Die PEgRNA der Ausführungsform 243, wobei der mindestens eine Nukleinsäure-Extension-Arm (i) ein DNA-Synthese-Template und (ii) eine Primer-Bindungsstelle umfasst.
    • 248. Die PEgRNA der Ausführungsform 247, wobei der Nukleinsäure-Extension-Arm mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide, mindestens 15 Nukleotide, mindestens 16 Nukleotide, mindestens 17 Nukleotide, mindestens 18 Nukleotide, mindestens 19 Nukleotide, mindestens 20 Nukleotide, mindestens 21 Nukleotide, mindestens 22 Nukleotide, mindestens 23 Nukleotide, mindestens 24 Nukleotide oder mindestens 25 Nukleotide lang ist.
    • 249. Die PEgRNA der Ausführungsform 247, wobei das DNA-Synthese-Template mindestens 3 Nukleotide, mindestens 4 Nukleotide, mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide oder mindestens 15 Nukleotide lang ist.
    • 250. Die PEgRNA der Ausführungsform 247, wobei die Primer-Bindungsstelle mindestens 3 Nukleotide, mindestens 4 Nukleotide, mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide oder mindestens 15 Nukleotide lang ist.
    • 251. Die PEgRNA der Ausführungsform 243, ferner umfassend mindestens eine zusätzliche Struktur, die aus der Gruppe ausgewählt ist, die aus einem Linker, einer Stammschleife, einer Haarnadel, einer Toe-Loop, einem Aptamer oder einer RNA-Protein-Rekrutierungsdomäne besteht.
    • 252. Die PEgRNA der Ausführungsform 247, wobei das DNA-Synthese-Template für einen Einzelstrang-DNA-Flap codiert, der komplementär zu einer endogenen DNA-Sequenz neben einer Nick-Stelle ist, wobei der Einzelstrang-DNA-Flap eine gewünschte Nukleotidänderung umfasst.
    • 253. Die PEgRNA der Ausführungsform 252, wobei der Einzelstrang-DNA-Flap eine endogene Einzelstrang-DNA mit einem 5'-Ende in der Target-DNA-Sequenz, die genickt wurde, verdrängt, und wobei sich die endogene Einzelstrang-DNA stromabwärts und unmittelbar neben der Nick-Stelle befindet.
    • 254. Die PEgRNA der Ausführungsform 253, wobei die endogene Einzelstrang-DNA mit dem freien 5'-Ende von der Zelle ausgeschnitten wird.
    • 255. Die PEgRNA der Ausführungsform 253, wobei die zelluläre Reparatur des Einzelstrang-DNA-Flaps zum Einbau der gewünschten Nukleotidänderung führt, wodurch ein gewünschtes Produkt gebildet wird.
    • 256. Die PEgRNA der Ausführungsform 243, umfassend die Nukleotidsequenz von SEQ ID NOs: 18-36 oder eine Nukleotidsequenz mit mindestens 85 % oder mindestens 90 % oder mindestens 95 % oder mindestens 98 % oder mindestens 99 % Sequenzidentität mit einer beliebigen von SEQ ID NOs: 18-36.
    • 257. Die PEgRNA der Ausführungsform 247, wobei das DNA-Synthese-Template eine Nukleotidsequenz umfasst, die zu mindestens 80 % oder 85 % oder 90 % oder 95 % oder 99 % identisch mit dem endogenen DNA-Target ist.
    • 258. Die PEgRNA der Ausführungsform 247, wobei die Primer-Bindungsstelle an ein freies 3'-Ende der geschnittenen DNA hybridisiert.
    • 259. Die PEgRNA der Ausführungsform 251, wobei sich die mindestens eine zusätzliche Struktur am 3'- oder 5'-Ende der PEgRNA befindet.
    • 260. Ein Komplex, umfassend ein Umfassen eines Fusionsproteins einer beliebigen der Ausführungsformen 213-242 und einer PEgRNA.
    • 261. Der Komplex der Ausführungsform 260, wobei die PEgRNA eine Guide-RNA und einen Nukleinsäure-Extension-Arm am 3'- oder 5'- Ende der Guide-RNA oder an einer intramolekularen Position in der Guide-RNA umfasst.
    • 262. Der Komplex der Ausführungsform 260, wobei die PEgRNA in der Lage ist, an ein napDNAbp zu binden und das napDNAbp an eine Target-DNA-Sequenz zu steuern.
    • 263. Der Komplex der Ausführungsform 262, wobei die Target-DNA-Sequenz einen Target-Strang und einen komplementären Nicht-Target-Strang umfasst, wobei die Guide-RNA an den Target-Strang hybridisiert, um ein RNA-DNA-Hybrid und eine R-Schleife zu bilden.
    • 264. Der Komplex der Ausführungsform 261, wobei der mindestens eine Nukleinsäure-Extension-Arm (i) ein DNA-Synthese-Template und (ii) eine Primer-Bindungsstelle umfasst.
    • 265. Der Komplex der Ausführungsform 260, wobei die PEgRNA die Nukleotidsequenz von SEQ ID NOs: 18-36 oder eine Nukleotidsequenz mit mindestens 85 % oder mindestens 90 % oder mindestens 95 % oder mindestens 98 % oder mindestens 99 % Sequenzidentität mit einer beliebigen von SEQ ID NOs: 18-36 umfasst.
    • 266. Der Komplex der Ausführungsform 264, wobei das DNA-Synthese-Template eine Nukleotidsequenz umfasst, die zu mindestens 80 % oder 85 % oder 90 % oder 95 % oder 99 % identisch mit dem endogenen DNA-Target ist.
    • 267. Der Komplex der Ausführungsform 264, wobei die Primer-Bindungsstelle an ein freies 3'-Ende der geschnittenen DNA hybridisiert.
    • 268. Ein Komplex, umfassend ein napDNAbp und eine PEgRNA.
    • 269. Der Komplex der Ausführungsform 268, wobei das napDNAbp eine Cas9-Nickase ist.
    • 270. Der Komplex der Ausführungsform 268, wobei das napDNAbp eine Aminosäuresequenz von SEQ ID NO: 2 umfasst.
    • 271. Der Komplex der Ausführungsform 268, wobei das napDNAbp eine Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % Sequenzidentität mit der Aminosäuresequenz von einer beliebigen von SEQ ID NOs: 2-10 umfasst.
    • 272. Der Komplex der Ausführungsform 268, wobei die PEgRNA eine Guide-RNA und einen Nukleinsäure-Extension-Arm am 3'- oder 5'-Ende der Guide-RNA oder an einer intramolekularen Position in der Guide-RNA umfasst.
    • 273. Der Komplex der Ausführungsform 268, wobei die PEgRNA in der Lage ist, das napDNAbp an eine Target-DNA-Sequenz zu steuern.
    • 274. Der Komplex der Ausführungsform 272, wobei die Target-DNA-Sequenz einen Target-Strang und einen komplementären Nicht-Target-Strang umfasst, wobei die Spacer-Sequenz der PEgRNA an den Target-Strang hybridisiert, um ein RNA-DNA-Hybrid und eine R-Schleife zu bilden.
    • 275. Der Komplex der Ausführungsform 273, wobei der Nukleinsäure-Extension-Arm (i) ein DNA-Synthese-Template und (ii) eine Primer-Bindungsstelle umfasst.
    • 276. Der Komplex der Ausführungsform 269, wobei die PEgRNA die Nukleotidsequenz von SEQ ID NOs: 18-36 oder eine Nukleotidsequenz mit mindestens 85 % oder mindestens 90 % oder mindestens 95 % oder mindestens 98 % oder mindestens 99 % Sequenzidentität mit einer beliebigen von SEQ ID NOs: 18-36 umfasst.
    • 277. Der Komplex der Ausführungsform 276, wobei das DNA-Synthese-Template eine Nukleotidsequenz umfasst, die zu mindestens 80 % oder 85 % oder 90 % oder 95 % oder 99 % identisch mit dem endogenen DNA-Target ist.
    • 278. Der Komplex der Ausführungsform 276, wobei die Primer-Bindungsstelle an ein freies 3'-Ende der geschnittenen DNA hybridisiert.
    • 279. Der Komplex der Ausführungsform 276, wobei die PEgRNA ferner mindestens eine zusätzliche Struktur umfasst, die aus der Gruppe ausgewählt ist, die aus einem Linker, einer Stammschleife, einer Haarnadel, einer Toe-Loop, einem Aptamer oder einer RNA-Protein-Rekrutierungsdomäne besteht.
    • 280. Ein Polynukleotid, das für das Fusionsprotein einer beliebigen der Ausführungsformen 213-242 codiert.
    • 281. Ein Vektor, umfassend das Polynukleotid der Ausführungsform 280.
    • 282. Eine Zelle, umfassend das Fusionsprotein einer beliebigen der Ausführungsformen 213-242 und eine an das napDNAbp des Fusionsproteins gebundene PEgRNA.
    • 283. Eine Zelle, umfassend einen Komplex einer beliebigen der Ausführungsformen 260-279.
    • 284. Eine pharmazeutische Zusammensetzung, umfassend: (i) ein Fusionsprotein einer beliebigen der Ausführungsformen 213-242, den Komplex der Ausführungsformen 260-279, das Polynukleotid der Ausführungsform 68 oder den Vektor der Ausführungsform 69; und (ii) einen pharmazeutisch verträglichen Hilfsstoff.
    • 285. Eine pharmazeutische Zusammensetzung, umfassend: (i) den Komplex der Ausführungsformen 260-279, (ii) eine Polymerase, die in trans bereitgestellt ist; und (iii) einen pharmazeutisch verträglichen Hilfsstoff.
    • 286. Ein Kit, das ein Nukleinsäurekonstrukt umfasst, umfassend: (i) eine Nukleinsäuresequenz, die für das Fusionsprotein einer beliebigen der Ausführungsformen 213-242 codiert; und (ii) einen Promotor, der die Expression der Sequenz von (i) steuert.
    • 287. Ein Verfahren zum Einbauen einer gewünschten Nukleotidänderung in eine Doppelstrang-DNA-Sequenz, wobei das Verfahren Folgendes umfasst:
      1. (i) Inkontaktbringen der Doppelstrang-DNA-Sequenz mit einem Komplex, der ein Fusionsprotein und eine PEgRNA umfasst, wobei das Fusionsprotein ein napDNAbp und eine Polymerase umfasst und wobei die PEgRNA ein DNA-Synthese-Template umfasst, das die gewünschte Nukleotidänderung und eine Primer-Bindungsstelle umfasst;
      2. (ii) Nicken der Doppelstrang-DNA-Sequenz, wodurch eine freie Einzelstrang-DNA mit einem 3'-Ende erzeugt wird;
      3. (iii) Hybridisieren des 3'-Endes der freien Einzelstrang-DNA an die Primer-Bindungsstelle, wodurch die Polymerase geprimt wird;
      4. (iv) Polymerisieren eines DNA-Strangs von dem 3'-Ende, das an die Primer-Bindungsstelle hybridisiert ist, wodurch ein Einzelstrang-DNA-Flap erzeugt wird, der die gewünschte Nukleotidänderung umfasst und der zu dem DNA-Synthese-Template komplementär ist;
      5. (v) Ersetzen eines endogenen DNA-Strangs neben der Schnittstelle mit dem Einzelstrang-DNA-Flap, wodurch die gewünschte Nukleotidänderung in die Doppelstrang-DNA-Sequenz eingebaut wird.
    • 288. Das Verfahren der Ausführungsform 287, wobei der Schritt (v) des Ersetzens Folgendes umfasst: (i) Hybridisieren des Einzelstrang-DNA-Flaps an den endogenen DNA-Strang neben der Schnittstelle, um eine Sequenzfehlpaarung zu erzeugen; (ii) Ausschneiden des endogenen DNA-Strangs; und (iii) Reparieren der Fehlpaarung, um das gewünschte Produkt zu bilden, das die gewünschte Nukleotidänderung in beiden DNA-Strängen umfasst.
    • 289. Das Verfahren der Ausführungsform 288, wobei die gewünschte Nukleotidänderung eine Einzelnukleotidsubstitution, eine Deletion oder eine Insertion ist.
    • 290. Das Verfahren der Ausführungsform 289, wobei die Einzelnukleotidsubstitution eine Transition oder eine Transversion ist.
    • 291. Das Verfahren der Ausführungsform 288, wobei die gewünschte Nukleotidänderung (1) eine G-zu-T-Substitution, (2) eine G-zu-A-Substitution, (3) eine G-zu-C-Substitution, (4) eine T-zu-G-Substitution, (5) eine T-zu-A-Substitution, (6) eine T-zu-C-Substitution, (7) eine C-zu-G-Substitution, (8) eine C-zu-T-Substitution, (9) eine C-zu-A-Substitution, (10) eine A-zu-T-Substitution, (11) eine A-zu-G-Substitution oder (12) eine A-zu-C-Substitution ist.
    • 292. Das Verfahren der Ausführungsform 288, wobei die gewünschte Nukleotidänderung (1) ein G:C-Basenpaar in ein T:A-Basenpaar, (2) ein G:C-Basenpaar in ein A:T-Basenpaar, (3) ein G:C-Basenpaar in ein C:G-Basenpaar, (4) ein T:A-Basenpaar in ein G:C-Basenpaar, (5) ein T:A-Basenpaar in ein A:T-Basenpaar, (6) ein T:A-Basenpaar in ein C:G-Basenpaar, (7) ein C:G-Basenpaar in ein G:C-Basenpaar, (8) ein C:G-Basenpaar in ein T:A-Basenpaar, ein C:G-Basenpaar in ein A:T-Basenpaar, (10) ein A:T-Basenpaar in ein T:A-Basenpaar, (11) ein A:T-Basenpaar in ein G:C-Basenpaar oder (12) ein A:T-Basenpaar in ein C:G-Basenpaar umwandelt.
    • 293. Das Verfahren der Ausführungsform 288, wobei die gewünschte Nukleotidänderung eine Insertion oder Deletion von 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 oder 25 Nukleotiden ist.
    • 294. Das Verfahren der Ausführungsform 288, wobei die gewünschte Nukleotidänderung ein krankheitsassoziiertes Gen korrigiert.
    • 295. Das Verfahren der Ausführungsform 294, wobei das krankheitsassoziierte Gen mit einer monogenen Störung assoziiert ist, die aus der Gruppe ausgewählt ist, die aus Adenosindeaminase-Mangel (ADA-Mangel); Alpha-1 -Antitrypsin-Mangel; Mukoviszidose; Duchenne-Muskeldystrophie; Galaktosämie; Hämochromatose; Huntington-Krankheit; Ahornsirupkrankheit; Marfan-Syndrom; Neurofibromatose Typ 1; Pachyonychia congenita; Phenylketonurie; schwerem kombiniertem Immundefekt; Sichelzellenanämie; Smith-Lemli-Opitz-Syndrom; einer Trinukleotid-Repeat-Störung; einer Prionenkrankheit; und Tay-Sachs-Krankheit besteht.
    • 296. Das Verfahren der Ausführungsform 294, wobei das krankheitsassoziierte Gen mit einer polygenen Störung assoziiert ist, die aus der Gruppe ausgewählt ist, die aus Herzkrankheit; Bluthochdruck; Alzheimer-Krankheit; Arthritis; Diabetes; Krebs; und Fettleibigkeit besteht.
    • 297. Das Verfahren der Ausführungsform 287, wobei das napDNAbp ein Nuklease-totes Cas9 (dCas9), eine Cas9-Nickase (nCas9) oder ein Nuklease-aktives Cas9 ist.
    • 298. Das Verfahren der Ausführungsform 287, wobei das napDNAbp eine Aminosäuresequenz von SEQ ID NO: 2 oder eine Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % Sequenzidentität mit der Aminosäuresequenz von SEQ ID NO: 2 umfasst.
    • 299. Das Verfahren der Ausführungsform 287, wobei das napDNAbp eine Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % Sequenzidentität mit der Aminosäuresequenz einer beliebigen von SEQ ID Nos: 2-10 umfasst.
    • 300. Das Verfahren der Ausführungsform 287, wobei die Polymerase eine reverse Transkriptase ist, die eine beliebige der Aminosäuresequenzen von SEQ ID NO: 11-17 umfasst.
    • 301. Das Verfahren der Ausführungsform 287, wobei die Polymerase eine reverse Transkriptase ist, die eine Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % Sequenzidentität mit der Aminosäuresequenz einer beliebigen von SEQ ID NOs: 11-17 umfasst.
    • 302. Das Verfahren der Ausführungsform 287, wobei die PEgRNA einen Nukleinsäure-Extension-Arm an den 3'- oder 5'-Enden oder an einem intramolekularen Ort in der Guide-RNA umfasst, wobei der Extension-Arm die DNA-Synthese-Template-Sequenz und die Primer-Bindungsstelle umfasst.
    • 303. Das Verfahren der Ausführungsform 302, wobei der Extension-Arm mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide, mindestens 15 Nukleotide, mindestens 16 Nukleotide, mindestens 17 Nukleotide, mindestens 18 Nukleotide, mindestens 19 Nukleotide, mindestens 20 Nukleotide, mindestens 21 Nukleotide, mindestens 22 Nukleotide, mindestens 23 Nukleotide, mindestens 24 Nukleotide oder mindestens 25 Nukleotide lang ist.
    • 304. Das Verfahren der Ausführungsform 287, wobei die PEgRNA eine Nukleotidsequenz aufweist, die aus der Gruppe ausgewählt ist, die aus SEQ ID NOs: 18-36 besteht.
    • 305. Verfahren zum Einführen einer oder mehrerer Änderungen in die Nukleotidsequenz eines DNA-Moleküls an einem Target-Locus, umfassend:
      1. (i) Inkontaktbringen des DNA-Moleküls mit einem Nukleinsäure-programmierbaren DNA-Bindungsprotein (napDNAbp) und einer PEgRNA, die das napDNAbp zu dem Target-Locus lenkt, wobei die PEgRNA eine Reverse Transkriptase(RT)-Template-Sequenz umfasst, die mindestens eine gewünschte Nukleotidänderung und eine Primer-Bindungsstelle umfasst;
      2. (ii) Bilden eines freigesetzten 3'-Endes in einem DNA-Strang an dem Target-Locus;
      3. (iii) Hybridisieren des freigesetzten 3'-Endes an die Primer-Bindungsstelle, um die reverse Transkription zu primen;
      4. (iv) Synthetisieren eines Einzelstrang-DNA-Flaps, der die mindestens eine gewünschte Nukleotidänderung umfasst, basierend auf der RT-Template-Sequenz durch reverse Transkriptase;
      5. (v) und Aufnehmen der mindestens einen gewünschten Nukleotidänderung in die entsprechende endogene DNA, wodurch eine oder mehrere Änderungen in die Nukleotidsequenz des DNA-Moleküls an dem Target-Locus eingeführt werden.
    • 306. Das Verfahren der Ausführungsform 305, wobei die eine oder mehreren Änderungen in der Nukleotidsequenz eine Transition umfassen.
    • 307. Das Verfahren der Ausführungsform 306, wobei die Transition aus der Gruppe ausgewählt ist, die aus (a) T zu C; (b) A zu G; (c) C zu T; und (d) G zu A besteht.
    • 308. Das Verfahren der Ausführungsform 305, wobei die eine oder mehreren Änderungen in der Nukleotidsequenz eine Transversion umfassen.
    • 309. Das Verfahren der Ausführungsform 308, wobei die Transversion aus der Gruppe ausgewählt ist, die aus (a) T zu A; (b) T zu G; (c) C zu G; (d) C zu A; (e) A zu T; (f) A zu C; (g) G zu C; und (h) G zu T besteht.
    • 310. Das Verfahren der Ausführungsform 305, wobei die eine oder mehreren Änderungen in der Nukleotidsequenz ein Ändern (1) eines G:C-Basenpaars in ein T:A-Basenpaar, (2) eines G:C-Basenpaars in ein A:T-Basenpaar, (3) eines G:C-Basenpaars in ein C:G-Basenpaar, (4) eines T:A-Basenpaars in ein G:C-Basenpaar, (5) eines T:A-Basenpaars in ein A:T-Basenpaar, (6) eines T:A-Basenpaars in ein C:G Basenpaar, (7) eines C:G-Basenpaars in ein G:C Basenpaar, (8) eines C:G Basenpaars in ein T:A Basenpaar, (9) eines C:G-Basenpaars in ein A:T-Basenpaar, (9) eines A:T-Basenpaars in ein T:A-Basenpaar, (11) eines A:T-Basenpaars in ein G:C-Basenpaar oder (12) eines A:T-Basenpaars in ein C:G-Basenpaar umfassen.
    • 311. Das Verfahren der Ausführungsform 305, wobei die eine oder mehreren Änderungen in der Nukleotidsequenz eine Insertion oder Deletion von 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 oder 25 Nukleotiden umfassen.
    • 312. Das Verfahren der Ausführungsform 305, wobei die eine oder mehreren Änderungen in der Nukleotidsequenz eine Korrektur an einem krankheitsassoziierten Gen umfassen.
    • 313. Das Verfahren der Ausführungsform 312, wobei das krankheitsassoziierte Gen mit einer monogenen Störung assoziiert ist, die aus der Gruppe ausgewählt ist, die aus Adenosindeaminase-Mangel (ADA-Mangel); Alpha-1 -Antitrypsin-Mangel; Mukoviszidose; Duchenne-Muskeldystrophie; Galaktosämie; Hämochromatose; Huntington-Krankheit; Ahornsirupkrankheit; Marfan-Syndrom; Neurofibromatose Typ 1; Pachyonychia congenita; Phenylketonurie; schwerem kombiniertem Immundefekt; Sichelzellenanämie; Smith-Lemli-Opitz-Syndrom; einer Trinukleotid-Repeat-Störung; einer Prionenkrankheit; und Tay-Sachs-Krankheit besteht.
    • 314. Das Verfahren der Ausführungsform 312, wobei das krankheitsassoziierte Gen mit einer polygenen Störung assoziiert ist, die aus der Gruppe ausgewählt ist, die aus Herzkrankheit; Bluthochdruck; Alzheimer-Krankheit; Arthritis; Diabetes; Krebs; und Fettleibigkeit besteht.
    • 315. Das Verfahren der Ausführungsform 305, wobei das napDNAbp ein Nuklease-aktives Cas9 oder eine Variante davon ist.
    • 316. Das Verfahren der Ausführungsform 305, wobei das napDNAbp ein Nuklease-inaktives Cas9 (dCas9) oder Cas9-Nickase (nCas9) oder eine Variante davon ist.
    • 317. Das Verfahren der Ausführungsform 305, wobei das napDNAbp eine Aminosäuresequenz von SEQ ID NO: 2 oder eine Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % Sequenzidentität mit SEQ ID NO: 2 umfasst.
    • 318. Das Verfahren der Ausführungsform 305, wobei das napDNAbp eine Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % Sequenzidentität mit der Aminosäuresequenz einer beliebigen von SEQ ID NOs: 2-10 umfasst.
    • 319. Das Verfahren der Ausführungsform 305, wobei die reverse Transkriptase in trans eingeführt wird.
    • 320. Das Verfahren der Ausführungsform 305, wobei das napDNAbp eine Fusion mit einer reversen Transkriptase umfasst.
    • 321. Das Verfahren der Ausführungsform 305, wobei die reverse Transkriptase eine beliebige der Aminosäuresequenzen von SEQ ID NO: 11-17 umfasst.
    • 322. Das Verfahren der Ausführungsform 305, wobei die reverse Transkriptase eine Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % Sequenzidentität mit der Aminosäuresequenz einer beliebigen von SEQ ID NOs: 11-17 umfasst.
    • 323. Das Verfahren der Ausführungsform 305, wobei der Schritt des Bildens eines freigesetzten 3'-Endes in dem DNA-Strang an dem Target-Locus ein Nicken des DNA-Strangs mit einer Nuklease umfasst.
    • 324. Das Verfahren der Ausführungsform 323, wobei die Nuklease in trans bereitgestellt wird.
    • 325. Das Verfahren der Ausführungsform 305, wobei der Schritt des Bildens eines freigesetzten 3'-Endes in dem DNA-Strang an dem Target-Locus ein Inkontaktbringen des DNA-Strangs mit einem chemischen Mittel umfasst.
    • 326. Das Verfahren der Ausführungsform 305, wobei der Schritt des Bildens eines freigesetzten 3'-Endes in dem DNA-Strang an dem Target-Locus ein Einführen eines Replikationsfehlers umfasst.
    • 327. Das Verfahren der Ausführungsform 305, wobei der Schritt des Inkontaktbringens des DNA-Moleküls mit dem napDNAbp und der Guide-RNA eine R-Schleife bildet.
    • 328. Das Verfahren der Ausführungsform 327, wobei sich der DNA-Strang, in dem das freigesetzte 3'-Ende gebildet wird, in der R-Schleife befindet.
    • 329. Das Verfahren der Ausführungsform 315, wobei die PEgRNA einen Extension-Arm umfasst, der die Reverse Transkriptase(RT)-Template-Sequenz und die Primer-Bindungsstelle umfasst.
    • 330. Das Verfahren der Ausführungsform 329, wobei sich der Extension-Arm an dem 3'-Ende der Guide-RNA, dem 5'-Ende der Guide-RNA oder an einer intramolekularen Position in der Guide-RNA befindet.
    • 331. Das Verfahren der Ausführungsform 305, wobei die PEgRNA ferner mindestens eine zusätzliche Struktur umfasst, die aus der Gruppe ausgewählt ist, die aus einem Linker, einer Stammschleife, einer Haarnadel, einer Toe-Loop, einem Aptamer oder einer RNA-Protein-Rekrutierungsdomäne besteht.
    • 332. Das Verfahren der Ausführungsform 305, wobei die PEgRNA ferner einen Homologiearm umfasst.
    • 333. Das Verfahren der Ausführungsform 305, wobei die RT-Template-Sequenz homolog zu der entsprechenden endogenen DNA ist.
    • 334. Ein Verfahren zum Einführen einer oder mehrerer Änderungen in der Nukleotidsequenz eines DNA-Moleküls an einem Target-Locus durch Target-geprimte reverse Transkription, wobei das Verfahren Folgendes umfasst: (a) Inkontaktbringen des DNA-Moleküls an dem Target-Locus mit (i) einem Fusionsprotein, das ein Nukleinsäure-programmierbares DNA-Bindungsprotein (napDNAbp) und eine reverse Transkriptase umfasst, und (ii) einer Guide-RNA, die ein RT-Template umfasst, das eine gewünschte Nukleotidänderung umfasst; (b) Ausführen einer Target-geprimten reversen Transkription des RT-Templates, um eine Einzelstrang-DNA zu erzeugen, welche die gewünschte Nukleotidänderung umfasst; und (c) Aufnehmen der gewünschten Nukleotidänderung in das DNA-Molekül an dem Target-Locus durch einen DNA-Reparatur- und/oder - Replikationsprozess.
    • 335. Das Verfahren der Ausführungsform 334, wobei sich das RT-Template an dem 3'-Ende der Guide-RNA, dem 5'-Ende der Guide-RNA oder an einem intramolekularen Ort in der Guide-RNA befindet.
    • 336. Das Verfahren der Ausführungsform 334, wobei die gewünschte Nukleotidänderung eine Transition, eine Transversion, eine Insertion oder eine Deletion oder eine beliebige Kombination davon umfasst.
    • 337. Das Verfahren der Ausführungsform 334, wobei die gewünschte Nukleotidänderung eine Transition umfasst, die aus der Gruppe ausgewählt ist, die aus (a) T zu C; (b) A zu G; (c) C zu T; und (d) G zu A besteht.
    • 338. Das Verfahren nach Anspruch 334, wobei die gewünschte Nukleotidänderung eine Transversion umfasst, die aus der Gruppe ausgewählt ist, die aus (a) T zu A; (b) T zu G; (c) C zu G; (d) C zu A; (e) A zu T; (f) A zu C; (g) G zu C; und (h) G zu T besteht.
    • 339. Das Verfahren der Ausführungsform 334, wobei die gewünschte Nukleotidänderung ein Ändern (1) eines G:C-Basenpaars in ein T:A-Basenpaar, (2) eines G:C-Basenpaars in ein A:T-Basenpaar, (3) eines G:C-Basenpaars in ein C:G-Basenpaar, (4) eines T:A-Basenpaars in ein G:C-Basenpaar, (5) eines T:A-Basenpaars in ein A:T-Basenpaar, (6) eines T:A-Basenpaars in ein C:G-Basenpaar, (7) eines C:G-Basenpaars in ein G:C-Basenpaar, (8) eines C:G-Basenpaars in ein T:A-Basenpaar, (9) eines C:G-Basenpaars in ein A:T-Basenpaar, (10) eines A:T-Basenpaars in ein T:A-Basenpaar, (11) eines A:T-Basenpaas in ein G:C-Basenpaar oder (12) eines A:T-Basenpaars in ein C:G-Basenpaar umfasst.
    • 340. Ein Polynukleotid, das für die PEgRNA einer beliebigen der Ausführungsformen 243-259 codiert.
    • 341. Ein Vektor, umfassend das Polynukleotid der Ausführungsform 340.
    • 342. Eine Zelle, umfassend den Vektor der Ausführungsform 341.
    • 343. Das Fusionsprotein der Ausführungsform 213, wobei die Polymerase eine fehleranfällige reverse Transkriptase ist.
    • 344. Ein Verfahren zum Mutagenisieren eines DNA-Moleküls an einem Target-Locus durch Target-geprimte reverse Transkription, wobei das Verfahren Folgendes umfasst:
      1. (a) Inkontaktbringen des DNA-Moleküls an dem Target-Locus mit (i) einem Fusionsprotein, das ein Nukleinsäure-programmierbares DNA-Bindungsprotein (napDNAbp) und eine fehleranfällige reverse Transkriptase umfasst, und (ii) einer Guide-RNA, die ein RT-Template umfasst, das eine gewünschte Nukleotidänderung umfasst; (b) Ausführen einer Target-geprimten reversen Transkription des RT-Templates, um eine mutagenisierte Einzelstrang-DNA zu erzeugen; und (c) Aufnehmen der mutagenisierten Einzelstrang-DNA in das DNA-Molekül an dem Target-Locus durch einen DNA-Reparatur- und/oder -Replikationsprozess.
    • 345. Das Verfahren von einer beliebigen vorhergehenden Ausführungsform, wobei das Fusionsprotein die Aminosäuresequenz von PE1, PE2 oder PE3 umfasst.
    • 346. Das Verfahren von einer beliebigen vorhergehenden Ausführungsform, wobei das napDNAbp eine Cas9-Nickase (nCas9) ist.
    • 347. Das Verfahren der Ausführungsform 344, wobei das napDNAbp die Aminosäuresequenz von SEQ ID NOs: 18-25 umfasst.
    • 348. Das Verfahren der Ausführungsform 344, wobei die Guide-RNA SEQ ID NOs: 26-36 umfasst.
    • 349. Das Verfahren der Ausführungsform 344, wobei der Schritt (b) des Ausführens einer Target-geprimten reversen Transkription ein Erzeugen einer 3'-Ende-Primer-Bindungssequenz an dem Target-Locus umfasst, die in der Lage ist, die reverse Transkription durch Annealing an eine Primer-Bindungsstelle auf der Guide-RNA zu primen.
    • 350. Ein Verfahren zum Ersetzen einer Trinukleotid-Repeat-Expansionsmutation in einem Target-DNA-Molekül durch eine gesunde Sequenz, die eine gesunde Anzahl von Repeat-Trinukleotiden umfasst, wobei das Verfahren Folgendes umfasst: (a) Inkontaktbringen des DNA-Moleküls an dem Target-Locus mit (i) einem Fusionsprotein, das ein Nukleinsäure-programmierbares DNA-Bindungsprotein (napDNAbp) und eine Polymerase umfasst, und (ii) einer PEgRNA, die ein DNA-Synthese-Template umfasst, das die Ersatzsequenz und eine Primer-Bindungsstelle umfasst; (b) Ausführen von Prime-Editing, um eine Einzelstrang-DNA zu erzeugen, welche die Ersatzsequenz umfasst; und (c) Aufnehmen der Einzelstrang-DNA in das DNA-Molekül an dem Target-Locus durch einen DNA-Reparatur- und/oder -Replikationsprozess.
    • 351. Das Verfahren der Ausführungsform 350, wobei das Fusionsprotein die Aminosäuresequenz von PE1, PE2 oder PE3 umfasst.
    • 352. Das Verfahren der Ausführungsform 350, wobei das napDNAbp eine Cas9-Nickase (nCas9) ist.
    • 353. Das Verfahren der Ausführungsform 350, wobei das napDNAbp die Aminosäuresequenz von SEQ ID NOs: 18-25 umfasst.
    • 354. Das Verfahren der Ausführungsform 350, wobei die Guide-RNA SEQ ID NOs: 26-36 umfasst.
    • 355. Das Verfahren der Ausführungsform 350, wobei der Schritt des (b) Ausführens von Prime Editing ein Erzeugen einer 3'-Ende-Primer-Bindungssequenz an dem Target-Locus umfasst, die in der Lage ist, Polymerase durch Annealing an die Primer-Bindungsstelle auf der Guide-RNA zu primen.
    • 356. Das Verfahren der Ausführungsform 350, wobei die Trinukleotid-Repeat-Expansionsmutation mit Huntington-Krankheit, Fragile-X-Syndrom oder Friedreich-Ataxie assoziiert ist.
    • 357. Das Verfahren der Ausführungsform 350, wobei die Trinukleotid-Repeat-Expansionsmutation eine Repeat-Einheit von CAG-Tripletts umfasst.
    • 358. Das Verfahren der Ausführungsform 350, wobei die Trinukleotid-Repeat-Expansionsmutation eine Repeat-Einheit von GAA-Tripletts umfasst.
    • 359. Ein Verfahren zum Einbauen einer funktionellen Gruppierung in ein interessierendes Protein, für das von einer Target-Nukleotidsequenz codiert wird, durch Prime Editing, wobei das Verfahren Folgendes umfasst: (a) Inkontaktbringen der Target-Nukleotidsequenz mit (i) einem Prime Editor, der ein Nukleinsäure-programmierbares DNA-Bindungsprotein (napDNAbp) und eine Polymerase umfasst, und (ii) einer PEgRNA, die ein DNA-Synthese-Template umfasst, das für die funktionelle Gruppierung codiert; (b) Polymerisieren einer Einzelstrang-DNA-Sequenz, die für die funktionelle Gruppierung codiert; und (c) Aufnehmen der Einzelstrang-DNA-Sequenz anstelle eines entsprechenden endogenen Strangs in die Target-Nukleotidsequenz durch einen DNA-Reparatur- und/oder Replikationsprozess, wobei das Verfahren eine rekombinante Target-Nukleotidsequenz erzeugt, die ein Fusionsprotein codiert, welches das interessierende Protein und die funktionelle Gruppierung umfasst.
    • 360. Das Verfahren der Ausführungsform 359, wobei die funktionelle Gruppierung ein Peptid-Tag ist.
    • 361. Das Verfahren der Ausführungsform 360, wobei das Peptid-Tag ein Affinitäts-Tag, ein Solubilisierungs-Tag, ein Chromatografie-Tag, ein Epitop- oder Immunepitop-Tag oder ein Fluoreszenz-Tag ist.
    • 362. Das Verfahren der Ausführungsform 360, wobei das Peptid-Tag aus der Gruppe ausgewählt ist, die aus AviTag (SEQ ID NO: 245); C-Tag (SEQ ID NO: 246); Calmodulin-Tag (SEQ ID NO: 247); Polyglutamat-Tag (SEQ ID NO: 248); E-Tag (SEQ ID NO: 249); FLAG-Tag (SEQ ID NO: 250); HA-Tag (SEQ ID NO: 251); His-Tag (SEQ ID NOs: 252-262); Myc-Tag (SEQ ID NO: 263); NE-Tag (SEQ ID NO: 264); Rho1D4-Tag (SEQ ID NO: 265); S-Tag (SEQ ID NO: 266); SBP-Tag (SEQ ID NO: 267); Softag-1 (SEQ ID NO: 268); Softag-2 (SEQ ID NO: 269); Spot-Tag (SEQ ID NO: 270); Strep-Tag (SEQ ID NO: 271); TC-Tag (SEQ ID NO: 272); Ty-Tag (SEQ ID NO: 273); V5-Tag (SEQ ID NO: 274); VSV-Tag (SEQ ID NO: 275); und Xpress-Tag (SEQ ID NO: 276) besteht.
    • 363. Das Verfahren der Ausführungsform 360, wobei das Peptid-Tag aus der Gruppe ausgewählt ist, die aus AU1-Epitop (SEQ ID NO: 278); AU5-Epitop (SEQ ID NO: 279); Bakteriophagen-T7-Epitop (T7-Tag) (SEQ ID NO: 280); Blauzungenvirus-Tag (B-Tag) (SEQ ID NO: 281); E2-Epitop (SEQ ID NO: 282); Histidin-Affinitäts-Tag (HAT) (SEQ ID NO: 283); HSV-Epitop (SEQ ID NO: 284); Polyarginin (Arg-Tag) (SEQ ID NO: 285); Polyaspartat (Asp-Tag) (SEQ ID NO: 286); Polyphenylalanin (Phe-Tag) (SEQ ID NO: 287); S1-Tag (SEQ ID NO: 288); S-Tag (SEQ ID NO: 289); und VSV-G (SEQ ID NO: 290) besteht.
    • 364. Das Verfahren der Ausführungsform 359, wobei die funktionelle Gruppierung ein Immunepitop ist.
    • 365. Das Verfahren der Ausführungsform 364, wobei das Immunepitop aus der Gruppe ausgewählt ist, die aus Tetanustoxoid (SEQ ID NO: 396); Diphtherie-Toxin-Mutante CRM197 (SEQ ID NO: 398); Mumps-Immunepitop 1 (SEQ ID NO: 400); Mumps-Immunepitop 2 (SEQ ID NO: 402); Mumps-Immunepitop 3 (SEQ ID NO: 404); Rötelnvirus (SEQ ID NO: 406); Hämagglutinin (SEQ ID NO: 408); Neuraminidase (SEQ ID NO: 410); TAP1 (SEQ ID NO: 412); TAP2 (SEQ ID NO: 414); Hämagglutinin-Epitope für HLA der Klasse I (SEQ ID NO: 416); Neuraminidase-Epitope für HLA der Klasse I (SEQ ID NO: 418); Hämagglutinin-Epitope für HLA der Klasse II (SEQ ID NO: 420); Neuraminidase-Epitope für HLA der Klasse II (SEQ ID NO: 422); Hämagglutinin-Epitop H5N1-gebundenem HLA der Klasse I und Klasse II (SEQ ID NO: 424); und Neuraminidase-Epitop H5N1-gebundenem HLA der Klasse I und Klasse II (SEQ ID NO: 426) besteht.
    • 366. Das Verfahren der Ausführungsform 359, wobei die funktionelle Gruppierung die Lokalisierung des interessierenden Proteins ändert.
    • 367. Das Verfahren der Ausführungsform 359, wobei die funktionelle Gruppierung ein Abbau-Tag ist, so dass die Abbaurate des interessierenden Proteins geändert wird.
    • 368. Das Verfahren der Ausführungsform 367, wobei das Abbau-Tag zur Eliminierung des getaggten Proteins führt.
    • 369. Das Verfahren der Ausführungsform 359, wobei die funktionelle Gruppierung eine Kleinmolekül-Bindungsdomäne ist.
    • 370. Das Verfahren der Ausführungsform 359, wobei die Kleinmolekül-Bindungsdomäne FKBP12 von SEQ ID NO: 488 ist.
    • 371. Das Verfahren der Ausführungsform 359, wobei die Kleinmolekül-Bindungsdomäne FKBP12-F36V von SEQ ID NO: 489 ist.
    • 372. Das Verfahren der Ausführungsform 359, wobei die Kleinmolekül-Bindungsdomäne Cyclophilin der SEQ ID NOs: 492-494 ist.
    • 373. Das Verfahren der Ausführungsform 359, wobei die Kleinmolekül-Bindungsdomäne in zwei oder mehr interessierende Proteine eingebaut wird.
    • 374. Das Verfahren der Ausführungsform 373, wobei die zwei oder mehr interessierenden Proteine bei Kontakt mit einem kleinen Molekül dimerisieren können.
    • 375. Das Verfahren der Ausführungsform 369, wobei das kleine Molekül ein Dimer eines kleinen Moleküls ist, das aus der Gruppe ausgewählt ist, die aus Folgendem besteht:
      Figure DE112020001339T5_0411
      Figure DE112020001339T5_0412
      Figure DE112020001339T5_0413
      Figure DE112020001339T5_0414
      Figure DE112020001339T5_0415
      und
      Figure DE112020001339T5_0416
    • 376. Ein Verfahren zum Einbauen eines Immunepitops in ein interessierendes Protein, für das von einer Target-Nukleotidsequenz codiert wird, durch Prime Editing, wobei das Verfahren Folgendes umfasst: (a) Inkontaktbringen der Target-Nukleotidsequenz mit (i) einem Prime Editor, der ein Nukleinsäure-programmierbares DNA-Bindungsprotein (napDNAbp) und eine Polymerase umfasst, und (ii) einer PEgRNA, die ein Edit-Template umfasst, das für die funktionelle Gruppierung codiert; (b) Polymerisieren einer Einzelstrang-DNA-Sequenz, die für das Immunepitop codiert; und (c) Aufnehmen der Einzelstrang-DNA-Sequenz anstelle eines entsprechenden endogenen Strangs in die Target-Nukleotidsequenz durch einen DNA-Reparatur- und/oder -Replikationsprozess, wobei das Verfahren eine rekombinante Target-Nukleotidsequenz erzeugt, die für ein Fusionsprotein codiert, welches das interessierende Protein und das Immunepitop umfasst.
    • 377. Das Verfahren der Ausführungsform 376, wobei das Immunepitop aus der Gruppe ausgewählt ist, die aus: Tetanustoxoid (SEQ ID NO: 396); Diphtherie-Toxin-Mutante CRM197 (SEQ ID NO: 398); Mumps-Immunepitop 1 (SEQ ID NO: 400); Mumps-Immunepitop 2 (SEQ ID NO: 402); Mumps-Immunepitop 3 (SEQ ID NO: 404); Rötelnvirus (SEQ ID NO: 406); Hämagglutinin (SEQ ID NO: 408); Neuraminidase (SEQ ID NO: 410); TAP1 (SEQ ID NO: 412); TAP2 (SEQ ID NO: 414); Hämagglutinin-Epitope für HLA der Klasse I (SEQ ID NO: 416); Neuraminidase-Epitope für HLA der Klasse I (SEQ ID NO: 418); Hämagglutinin-Epitope für HLA der Klasse II (SEQ ID NO: 420); Neuraminidase-Epitope für HLA der Klasse II (SEQ ID NO: 422); Hämagglutinin-Epitop H5N1-gebundenem HLA der Klasse I und Klasse II (SEQ ID NO: 424); und Neuraminidase-Epitop H5N1-gebundenem HLA der Klasse I und Klasse II (SEQ ID NO: 426) besteht.
    • 378. Das Verfahren der Ausführungsform 376, wobei das Fusionsprotein die Aminosäuresequenz von PE1, PE2 oder PE3 umfasst.
    • 379. Das Verfahren der Ausführungsform 376, wobei das napDNAbp eine Cas9-Nickase (nCas9) ist.
    • 380. Das Verfahren der Ausführungsform 376, wobei das napDNAbp die Aminosäuresequenz von SEQ ID NOs: 18-25 umfasst.
    • 381. Das Verfahren der Ausführungsform 376, wobei die PEgRNA SEQ ID NOs: 26-36 umfasst.
    • 382. Ein Verfahren zum Einbauen einer Kleinmolekül-Dimerisierungsdomäne in ein interessierendes Protein, für das von einer Target-Nukleotidsequenz codiert wird, durch Prime-Editing, wobei das Verfahren Folgendes umfasst: (a) Inkontaktbringen der Target-Nukleotidsequenz mit (i) einem Prime Editor, der ein Nukleinsäure-programmierbares DNA-Bindungsprotein (napDNAbp) und eine Polymerase umfasst, und (ii) einer PEgRNA, die ein Edit-Template umfasst, das für die Kleinmolekül-Dimerisierungsdomäne codiert; (b) Polymerisieren einer Einzelstrang-DNA-Sequenz, die für das Immunepitop codiert; und (c) Aufnehmen der Einzelstrang-DNA-Sequenz anstelle eines entsprechenden endogenen Strangs in die Target-Nukleotidsequenz durch einen DNA-Reparatur- und/oder Replikationsprozess, wobei das Verfahren eine rekombinante Target-Nukleotidsequenz erzeugt, die für ein Fusionsprotein codiert, welches das interessierende Protein und die Kleinmolekül-Dimerisierungsdomäne umfasst.
    • 383. Das Verfahren der Ausführungsform 382, ferner umfassend ein Ausführen des Verfahrens an einem zweiten interessierenden Protein.
    • 384. Das Verfahren der Ausführungsform 383, wobei das erste interessierende Protein und das zweite interessierende Protein in Gegenwart eines kleinen Moleküls dimerisieren, das an die Dimerisierungsdomäne auf jedem der Proteine bindet.
    • 385. Das Verfahren der Ausführungsform 382, wobei die Kleinmolekül-Bindungsdomäne FKBP12 von SEQ ID NO: 488 ist.
    • 386. Das Verfahren der Ausführungsform 382, wobei die Kleinmolekül-Bindungsdomäne FKBP12-F36V von SEQ ID NO: 489 ist.
    • 387. Das Verfahren der Ausführungsform 382, wobei die Kleinmolekül-Bindungsdomäne Cyclophilin der SEQ ID NOs: 492-494 ist.
    • 388. Das Verfahren der Ausführungsform 382, wobei das kleine Molekül ein Dimer eines kleinen Moleküls ist, das aus der Gruppe ausgewählt ist, die aus Folgendem besteht:
      Figure DE112020001339T5_0417
      Figure DE112020001339T5_0418
      Figure DE112020001339T5_0419
      Figure DE112020001339T5_0420
      Figure DE112020001339T5_0421
      ; und
      Figure DE112020001339T5_0422
    • 389. Das Verfahren der Ausführungsform 382, wobei das Fusionsprotein die Aminosäuresequenz von PE1, PE2 oder PE3 umfasst.
    • 390. Das Verfahren der Ausführungsform 382, wobei das napDNAbp eine Cas9-Nickase (nCas9) ist.
    • 391. Das Verfahren der Ausführungsform 382, wobei das napDNAbp die Aminosäuresequenz von SEQ ID NOs: 18-25 umfasst.
    • 392. Das Verfahren der Ausführungsform 382, wobei die PEgRNA SEQ ID NOs: 26-36 umfasst.
    • 393. Ein Verfahren zum Einbauen eines Peptid-Tags oder Epitops auf ein Protein unter Verwendung von Prime Editing, umfassend: Inkontaktbringen einer Target-Nukleotidsequenz, die für das Protein codiert, mit einem Prime Editor-Konstrukt, das konfiguriert ist, um darin eine zweite Nukleotidsequenz zu inserieren, die für das Peptid-Tag codiert, um zu einer rekombinanten Nukleotidsequenz zu führen, so dass das Peptid-Tag und das Protein von der rekombinanten Nukleotidsequenz als Fusionsprotein exprimiert werden.
    • 394. Das Verfahren der Ausführungsform 383, wobei der Peptid-Tag zur Reinigung und/oder Detektion des Proteins verwendet wird.
    • 395. Das Verfahren der Ausführungsform 383, wobei das Peptid-Tag ein Polyhistidin (z.B. HHHHHH), FLAG (z.B. DYKDDDDK), V5 (z.B. GKPIPNPLLGLDST), GCN4, HA (z.B. YPYDVPDYA), Myc (z.B. EQKLISEED) oder GST ist.
    • 396. Das Verfahren der Ausführungsform 383, wobei das Peptid-Tag eine Aminosäuresequenz aufweist, die aus der Gruppe ausgewählt ist, die aus SEQ ID NO: 245-290 besteht.
    • 397. Das Verfahren der Ausführungsform 383, wobei das Peptid-Tag durch einen Linker mit dem Protein fusioniert ist.
    • 398. Das Verfahren der Ausführungsform 383, wobei das Fusionsprotein die folgende Struktur aufweist: [Protein]-[Peptid-Tag] oder [Peptid-Tag]-[Protein], wobei „]-[“ einen optionalen Linker darstellt.
    • 399. Das Verfahren der Ausführungsform 383, wobei der Linker eine Aminosäuresequenz von SEQ ID NO: 37-47 aufweist.
    • 400. Das Verfahren der Ausführungsform 383, wobei das Prime Editor-Konstrukt eine PEgRNA umfasst, welche die Nukleotidsequenz von SEQ ID NOs: 18-25 umfasst.
    • 401. Das Verfahren der Ausführungsform 383, wobei die PEgRNA einen Spacer, einen gRNA-Kern und einen Extension-Arm umfasst, wobei der Spacer komplementär zur Target-Nukleotidsequenz ist und der Extension-Arm ein Reverse-Transkriptase-Template umfasst, das für das Peptid-Tag codiert.
    • 402. Das Verfahren der Ausführungsform 383, wobei die PEgRNA einen Spacer, einen gRNA-Kern und einen Extension-Arm umfasst, wobei der Spacer komplementär zur Target-Nukleotidsequenz ist und der Extension-Arm ein Reverse-Transkriptase-Template umfasst, das für das Peptid-Tag codiert.
    • 403. Ein Verfahren zum Verhindern oder Anhalten des Fortschreitens einer Prionenkrankheit durch Einbauen einer oder mehrerer schützender Mutationen in PRNP, für das von einer Target-Nukleotidsequenz codiert wird, durch Prime Editing, wobei das Verfahren Folgendes umfasst: (a) Inkontaktbringen der Target-Nukleotidsequenz mit (i) einem Prime Editor, der ein Nukleinsäure-programmierbares DNA-Bindungsprotein (napDNAbp) und eine Polymerase umfasst, und (ii) einer PEgRNA, die ein Edit-Template umfasst, das für die funktionelle Gruppierung codiert; (b) Polymerisieren einer Einzelstrang-DNA-Sequenz, die für die schützende Mutation codiert; und (c) Aufnehmen der Einzelstrang-DNA-Sequenz anstelle eines entsprechenden endogenen Strangs in die Target-Nukleotidsequenz durch einen DNA-Reparatur- und/oder -Replikationsprozess, wobei das Verfahren eine rekombinante Target-Nukleotidsequenz erzeugt, die für ein PRNP codiert, das eine schützende Mutation umfasst und gegen Fehlfaltung resistent ist.
    • 404. Das Verfahren der Ausführungsform 403, wobei die Prionenkrankheit eine Prionenkrankheit des Menschen ist.
    • 405. Das Verfahren der Ausführungsform 403, wobei die Prionenkrankheit eine Tierprionenkrankheit ist.
    • 406. Das Verfahren der Ausführungsform 404, wobei die Prionenkrankheit Creutzfeldt-Jakob-Krankheit (CJK), variante Creutzfeldt-Jakob-Krankheit (vCJK), Gerstmann-Straussler-Scheinker-Syndrom, letale familiäre Insomnie oder Kuru ist.
    • 407. Das Verfahren der Ausführungsform 403, wobei die Prionenkrankheit spongiforme Enzephalopathie bei Rindern (BSE oder „Rinderwahnsinn“), chronische Auszehrkrankheit (CWD), Scrapie, übertragbare Enzephalopathie bei Nerzen, spongiforme Enzephalopathie bei Katzen und spongiforme Enzephalopathie bei Huftieren ist.
    • 408. Das Verfahren der Ausführungsform 403, wobei die Wildtyp-PRNP-Aminosäuresequenz SEQ ID NOs: 291-292 ist.
    • 409. Das Verfahren der Ausführungsform 403, wobei das Verfahren zu einer modifizierten PRNP-Aminosäuresequenz führt, die aus der Gruppe ausgewählt ist, die aus SEQ ID NOs: 293-323 besteht, wobei das modifizierte PRNP-Protein resistent gegen Fehlfaltung ist.
    • 410. Das Verfahren der Ausführungsform 403, wobei das Fusionsprotein die Aminosäuresequenz von PE1, PE2 oder PE3 umfasst.
    • 411. Das Verfahren der Ausführungsform 403, wobei das napDNAbp eine Cas9-Nickase (nCas9) ist.
    • 412. Das Verfahren der Ausführungsform 403, wobei das napDNAbp die Aminosäuresequenz von SEQ ID NOs: 18-25 umfasst.
    • 413. Das Verfahren der Ausführungsform 403, wobei die PEgRNA SEQ ID NOs: 26-36 umfasst.
    • 414. Ein Verfahren zum Einbauen eines Ribonukleotid-Motivs oder -Tags in eine interessierende RNA, für die von einer Target-Nukleotidsequenz codiert wird, durch Prime Editing, wobei das Verfahren Folgendes umfasst: (a) Inkontaktbringen der Target-Nukleotidsequenz mit (i) einem Prime Editor, der ein Nukleinsäure-programmierbares DNA-Bindungsprotein (napDNAbp) und eine Polymerase umfasst, und (ii) einer PEgRNA, die ein Edit-Template umfasst, das für das Ribonukleotid-Motiv oder -Tag codiert; (b) Polymerisieren einer Einzelstrang-DNA-Sequenz, die für das Ribonukleotid-Motiv oder -Tag codiert; und (c) Einbauen der Einzelstrang-DNA-Sequenz anstelle eines entsprechenden endogenen Strangs in die Target-Nukleotidsequenz durch einen DNA-Reparatur- und/oder -Replikationsprozess, wobei das Verfahren eine rekombinante Target-Nukleotidsequenz erzeugt, die für eine modifizierte interessierende RNA codiert, die das Ribonukleotid-Motiv oder -Tag umfasst.
    • 415. Das Verfahren der Ausführungsform 414, wobei das Ribonukleotid-Motiv oder - Tag eine Detektionsgruppierung ist.
    • 416. Das Verfahren der Ausführungsform 414, wobei das Ribonukleotid-Motiv oder - Tag das Expressionsniveau der interessierenden RNA beeinflusst.
    • 417. Das Verfahren der Ausführungsform 414, wobei das Ribonukleotid-Motiv oder - Tag den Transport oder den subzellulären Ort der interessierenden RNA beeinflusst.
    • 418. Das Verfahren der Ausführungsform 414, wobei das Ribonukleotid-Motiv oder - Tag aus der Gruppe ausgewählt ist, die aus SV40 Typ 1, SV40 Typ 2, SV40 Typ 3, hGH, BGH, rbGlob, TK, MALAT1 ENE-mascRNA, KSHV PAN ENE, Smbox/U1 snRNA-Box, U1 snRNA 3'-Box, tRNA-Lysin, Brokkoli-Aptamer, Spinat-Aptamer, Mango-Aptamer, HDV-Ribozym und m6A besteht.
    • 419. Das Verfahren der Ausführungsform 414, wobei die PEgRNA SEQ ID NOs: 18-25 umfasst.
    • 420. Das Verfahren der Ausführungsform 414, wobei das Fusionsprotein die Aminosäuresequenz von PE1, PE2 oder PE3 umfasst.
    • 421. Das Verfahren der Ausführungsform 414, wobei das napDNAbp eine Cas9-Nickase (nCas9) ist.
    • 422. Das Verfahren der Ausführungsform 414, wobei das napDNAbp die Aminosäuresequenz von SEQ ID NOs: 18-25 umfasst.
    • 423. Ein Verfahren zum Einbauen oder Deletieren einer funktionellen Gruppierung in einem interessierenden Protein, für das von einer Target-Nukleotidsequenz codiert wird, durch Prime-Editing, wobei das Verfahren Folgendes umfasst: (a) Inkontaktbringen der Target-Nukleotidsequenz mit (i) einem Prime Editor, der ein Nukleinsäure-programmierbares DNA-Bindungsprotein (napDNAbp) und eine Polymerase umfasst, und (ii) einer PEgRNA, die ein Edit-Template umfasst, das für die funktionelle Gruppierung oder Deletion derselben codiert; (b) Polymerisieren einer Einzelstrang-DNA-Sequenz, die für die funktionelle Gruppierung oder Deletion derselben codiert; und (c) Aufnehmen der Einzelstrang-DNA-Sequenz anstelle eines entsprechenden endogenen Strangs in die Target-Nukleotidsequenz durch einen DNA-Reparatur- und/oder - Replikationsprozess, wobei das Verfahren eine rekombinante Target-Nukleotidsequenz erzeugt, die für ein modifiziertes Protein codiert, welches das interessierende Protein und die funktionelle Gruppierung oder die Entfernung derselben umfasst, wobei die funktionelle Gruppierung einen Modifikationszustand oder Lokalisierungszustand des Proteins ändert.
    • 424. Das Verfahren der Ausführungsform 423, wobei eine funktionelle Gruppierung den Phosphorylierungs-, Ubiquitylierungs-, Glykosylierungs-, Lipidierungs-, Hydroxylierungs-, Methylierungs-, Acetylierungs-, Crotonylierungs-, SUMOylierungszustand des interessierenden Proteins ändert.
  • GRUPPE A. FUSIONSPROTEINE, GUIDES UND VERFAHREN
  • Ausführungsform 1. Ein Fusionsprotein, umfassend ein Nukleinsäure-programmierbares DNA-Bindungsprotein (napDNAbp) und eine reverse Transkriptase.
  • Ausführungsform 2. Das Fusionsprotein der Ausführungsform 1, wobei das Fusionsprotein in der Lage ist, Genom-Editing durch Target-geprimte reverse Transkription in Gegenwart einer Guide-RNA mit Extension auszuführen.
  • Ausführungsform 3. Das Fusionsprotein der Ausführungsform 1, wobei das napDNAbp eine Nickase-Aktivität aufweist.
  • Ausführungsform 4. Das Fusionsprotein der Ausführungsform 1, wobei das napDNAbp ein Cas9-Protein oder eine Variante davon ist.
  • Ausführungsform 5. Das Fusionsprotein der Ausführungsform 1, wobei das napDNAbp ein Nuklease-aktives Cas9, ein Nuklease-inaktives Cas9 (dCas9) oder eine Cas9-Nickase (nCas9) ist.
  • Ausführungsform 6. Das Fusionsprotein der Ausführungsform 1, wobei das napDNAbp Cas9-Nickase (nCas9) ist.
  • Ausführungsform 7. Das Fusionsprotein der Ausführungsform 1, wobei das napDNAbp aus der Gruppe ausgewählt ist, die aus Cas9, CasX, CasY, Cpf1, C2c1, C2c2, C2C3 und Argonaute besteht, und optional eine Nickase-Aktivität aufweist.
  • Ausführungsform 8. Das Fusionsprotein der Ausführungsform 1, wobei das Fusionsprotein, wenn es mit einer Guide-RNA mit Extension komplexiert ist, in der Lage ist, an eine Target-DNA-Sequenz zu binden.
  • Ausführungsform 9. Das Fusionsprotein der Ausführungsform 8, wobei die Target-DNA-Sequenz einen Target-Strang und einen komplementären Nicht-Target-Strang umfasst.
  • Ausführungsform 10. Das Fusionsprotein der Ausführungsform 8, wobei die Bindung des mit der Guide-RNA mit Extension komplexierten Fusionsproteins eine R-Schleife bildet.
  • Ausführungsform 11. Das Fusionsprotein der Ausführungsform 10, wobei die R-Schleife (i) ein RNA-DNA-Hybrid, das die Guide-RNA mit Extension und den Target-Strang umfasst, und (ii) den komplementären Nicht-Target-Strang umfasst.
  • Ausführungsform 12. Das Fusionsprotein der Ausführungsform 11, wobei der komplementäre Nicht-Target-Strang genickt ist, um eine Reverse Transkriptase-Priming-Sequenz mit einem freien 3'-Ende zu bilden.
  • Ausführungsform 13. Das Fusionsprotein der Ausführungsform 2, wobei die Guide-RNA mit Extension (a) eine Guide-RNA und (b) eine RNA-Extension am 5'- oder 3'-Ende der Guide-RNA oder an einem intramolekularen Ort in der Guide-RNA umfasst.
  • Ausführungsform 14. Das Fusionsprotein der Ausführungsform 13, wobei die RNA-Extension (i) eine Reverse-Transkriptions-Template-Sequenz, die eine gewünschte Nukleotidänderung umfasst, (ii) eine Reverse-Transkriptions-Primer-Bindungsstelle und (iii) optional eine Linker-Sequenz umfasst.
  • Ausführungsform 15. Das Fusionsprotein der Ausführungsform 14, wobei die Reverse-Transkriptions-Template-Sequenz für einen Einzelstrang-DNA-Flap codiert, der komplementär zu einer endogenen DNA-Sequenz neben der Nick-Stelle ist, wobei der Einzelstrang-DNA-Flap die gewünschte Nukleotidänderung umfasst.
  • Ausführungsform 16. Das Fusionsprotein der Ausführungsform 13, wobei die RNA-Extension mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide, mindestens 15 Nukleotide, mindestens 16 Nukleotide, mindestens 17 Nukleotide, mindestens 18 Nukleotide, mindestens 19 Nukleotide, mindestens 20 Nukleotide, mindestens 21 Nukleotide, mindestens 22 Nukleotide, mindestens 23 Nukleotide, mindestens 24 Nukleotide oder mindestens 25 Nukleotide lang ist.
  • Ausführungsform 17. Das Fusionsprotein der Ausführungsform 15, wobei der Einzelstrang-DNA-Flap an die endogene DNA-Sequenz neben der Nick-Stelle hybridisiert, wodurch die gewünschte Nukleotidänderung eingebaut wird.
  • Ausführungsform 18. Das Fusionsprotein der Ausführungsform 15, wobei der Einzelstrang-DNA-Flap die endogene DNA-Sequenz neben der Nick-Stelle und die ein freies 5'-Ende aufweist verdrängt.
  • Ausführungsform 19. Das Fusionsprotein der Ausführungsform 18, wobei die endogene DNA-Sequenz mit dem 5'-Ende von der Zelle ausgeschnitten wird.
  • Ausführungsform 20. Das Fusionsprotein der Ausführungsform 18, wobei eine zelluläre Reparatur des Einzelstrang-DNA-Flaps zum Einbau der gewünschten Nukleotidänderung führt, wodurch ein gewünschtes Produkt gebildet wird.
  • Ausführungsform 21. Das Fusionsprotein der Ausführungsform 14, wobei die gewünschte Nukleotidänderung in einem Editing-Fenster eingebaut ist, das zwischen etwa -4 bis +10 der PAM-Sequenz oder zwischen etwa -10 bis +20 der PAM-Sequenz oder zwischen etwa -20 bis +40 der PAM-Sequenz oder zwischen etwa -30 bis +100 der PAM-Sequenz liegt, oder wobei die gewünschte Nukleotidänderung mindestens 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 oder 100 Nukleotide stromabwärts der Nick-Stelle eingebaut ist.
  • Ausführungsform 22. Das Fusionsprotein der Ausführungsform 1, wobei das napDNAbp eine Aminosäuresequenz von SEQ ID NO: 18 oder eine Aminosäuresequenz umfasst, die zu mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % identisch mit der Aminosäuresequenz von SEQ ID NO: 18 ist.
  • Ausführungsform 23. Das Fusionsprotein der Ausführungsform 1, wobei das napDNAbp eine Aminosäuresequenz umfasst, die zu mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % identisch mit der Aminosäuresequenz einer beliebigen von SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467 und 482-487 ist.
  • [0001] Das Fusionsprotein der Ausführungsform 1, wobei die reverse Transkriptase eine beliebige der Aminosäuresequenzen von SEQ ID NO: 89 umfasst.
  • Ausführungsform 24. Das Fusionsprotein der Ausführungsform 1, wobei die reverse Transkriptase eine beliebige der Aminosäuresequenzen von SEQ ID NO: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741 und 766 umfasst.
  • [0002] Das Fusionsprotein der Ausführungsform 1, wobei die reverse Transkriptase eine Aminosäuresequenz umfasst, die zu mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % identisch mit der Aminosäuresequenz einer beliebigen von SEQ ID NO: 89 ist.
  • Ausführungsform 25. Das Fusionsprotein der Ausführungsform 1, wobei die reverse Transkriptase eine Aminosäuresequenz umfasst, die zu mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % identisch mit der Aminosäuresequenz einer beliebigen von SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739- 741 und 766 ist.
  • Ausführungsform 26. Das Fusionsprotein der Ausführungsform 1, wobei die reverse Transkriptase eine natürlich vorkommende reverse Transkriptase aus einem Retrovirus oder einem Retrotransposon ist.
  • Ausführungsform 27. Das Fusionsprotein nach einer der vorherigen Ausführungsformen, wobei das Fusionsprotein die Struktur NH2-[napDNAbp]-[reverse Transkriptase]-COOH; oder NH2-[reverse Transkriptase]-[napDNAbp]-COOH umfasst, wobei jedes Auftreten von „]-[“ das Vorhandensein einer optionalen Linker-Sequenz anzeigt.
  • Ausführungsform 28. Das Fusionsprotein der Ausführungsform 27, wobei die Linker-Sequenz eine Aminosäuresequenz von SEQ ID NOs: 127, 165-176, 446, 453 und 767-769 umfasst.
  • Ausführungsform 29. Das Fusionsprotein der Ausführungsform 14, wobei die gewünschte Nukleotidänderung eine Einzelnukleotidänderung, eine Insertion eines oder mehrerer Nukleotide oder eine Deletion eines oder mehrerer Nukleotide ist.
  • Ausführungsform 30. Das Fusionsprotein der Ausführungsform 29, wobei das Insert oder die Deletion mindestens 1, mindestens 2, mindestens 3, mindestens 4, mindestens 5, mindestens 6, mindestens 7, mindestens 8, mindestens 9, mindestens 10, mindestens 11, mindestens 12, mindestens 13, mindestens 14, mindestens 15, mindestens 16, mindestens 17, mindestens 18, mindestens 19, mindestens 20, mindestens 21, mindestens 22, mindestens 23, mindestens 24, mindestens 25, mindestens 26, mindestens 27, mindestens 28, mindestens 29, mindestens 30, mindestens 31, mindestens 32, mindestens 33, mindestens 34, mindestens 35, mindestens 36, mindestens 37, mindestens 38, mindestens 39, mindestens 40, mindestens 41, mindestens 42, mindestens 43, mindestens 44, mindestens 45, mindestens 46, mindestens 47, mindestens 48, mindestens 49 oder mindestens 50 ist.
  • Ausführungsform 31. Eine Guide-RNA mit Extension, umfassend eine Guide-RNA und mindestens eine RNA-Extension.
  • Ausführungsform 32. Die Guide-RNA mit Extension der Ausführungsform 1, wobei die RNA-Extension am 3'- oder 5'-Ende der Guide-RNA oder an einer intramolekularen Position in der Guide-RNA positioniert ist.
  • Ausführungsform 33. Die Guide-RNA mit Extension der Ausführungsform 31, wobei die Guide-RNA mit Extension in der Lage ist, an ein napDNAbp zu binden, und das napDNAbp an eine Target-DNA-Sequenz zu steuern.
  • Ausführungsform 34. Die Guide-RNA mit Extension der Ausführungsform 33, wobei die Target-DNA-Sequenz einen Target-Strang und einen komplementären Nicht-Target-Strang umfasst, wobei die Guide-RNA an den Target-Strang hybridisiert, um ein RNA-DNA-Hybrid und eine R-Schleife zu bilden.
  • Ausführungsform 35. Die Guide-RNA mit Extension der Ausführungsform 31, wobei die mindestens eine RNA-Extension (i) eine Reverse-Transkriptions-Template-Sequenz, (ii) eine Reverse-Transkriptions-Primer-Bindungsstelle und (iii) optional eine Linker-Sequenz umfasst.
  • Ausführungsform 36. Die Guide-RNA mit Extension der Ausführungsform 35, wobei die RNA-Extension mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide, mindestens 15 Nukleotide, mindestens 16 Nukleotide, mindestens 17 Nukleotide, mindestens 18 Nukleotide, mindestens 19 Nukleotide, mindestens 20 Nukleotide, mindestens 21 Nukleotide, mindestens 22 Nukleotide, mindestens 23 Nukleotide, mindestens 24 Nukleotide oder mindestens 25 Nukleotide lang ist.
  • Ausführungsform 37. Die Guide-RNA mit Extension der Ausführungsform 35, wobei die Reverse-Transkriptions-Template-Sequenz mindestens 3 Nukleotide, mindestens 4 Nukleotide, mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide oder mindestens 15 Nukleotide lang ist.
  • Ausführungsform 38. Die Guide-RNA mit Extension der Ausführungsform 35, wobei die Reverse-Transkriptions-Primer-Bindungsstellen-Sequenz mindestens 3 Nukleotide, mindestens 4 Nukleotide, mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide oder mindestens 15 Nukleotide lang ist.
  • Ausführungsform 39. Die Guide-RNA mit Extension der Ausführungsform 35, wobei die optionale Linker-Sequenz mindestens 3 Nukleotide, mindestens 4 Nukleotide, mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide oder mindestens 15 Nukleotide lang ist.
  • Ausführungsform 40. Die Guide-RNA mit Extension der Ausführungsform 35, wobei die Reverse-Transkriptions-Template-Sequenz für einen Einzelstrang-DNA-Flap codiert, der komplementär zu einer endogenen DNA-Sequenz neben der Nick-Stelle ist, wobei der Einzelstrang-DNA-Flap eine gewünschte Nukleotidänderung umfasst.
  • Ausführungsform 41. Die Guide-RNA mit Extension der Ausführungsform 40, wobei der Einzelstrang-DNA-Flap eine endogene Einzelstrang-DNA mit einem 5'-Ende in der Target-DNA-Sequenz verdrängt, die genickt wurde, und wobei sich die endogene Einzelstrang-DNA stromabwärts und unmittelbar neben der Nick-Stelle befindet.
  • Ausführungsform 42. Die Guide-RNA mit Extension der Ausführungsform 41, wobei die endogene Einzelstrang-DNA mit dem freien 5'-Ende von der Zelle ausgeschnitten wird.
  • Ausführungsform 43. Die Guide-RNA mit Extension der Ausführungsform 41, wobei die zelluläre Reparatur des Einzelstrang-DNA-Flaps zum Einbau der gewünschten Nukleotidänderung führt, wodurch ein gewünschtes Produkt gebildet wird.
  • Ausführungsform 44. Die Guide-RNA mit Extension der Ausführungsform 31, umfassend die Nukleotidsequenz von SEQ ID NOs: 18-36 oder eine Nukleotidsequenz mit mindestens 85 % oder mindestens 90 % oder mindestens 95 % oder mindestens 98 % oder mindestens 99 % Sequenzidentität mit einer beliebigen von SEQ ID NOs: 394, 429-442, 641-649, 678-692, 2997-3103, 3113-3121, 3305-3455, 3479-3493, 3522-3556, 3628-3698 und 3755-3810.
  • Ausführungsform 45. Die Guide-RNA mit Extension der Ausführungsform 35, wobei die Reverse-Transkriptions-Template-Sequenz eine Nukleotidsequenz umfasst, die zu mindestens 80 % oder 85 % oder 90 % oder 95 % oder 99 % identisch mit dem endogenen DNA-Target ist.
  • Ausführungsform 46. Die Guide-RNA mit Extension der Ausführungsform 35, wobei die Reverse-Transkriptions-Primer-Bindungsstelle an ein freies 3'-Ende der geschnittenen DNA hybridisiert.
  • Ausführungsform 47. Die Guide-RNA mit Extension der Ausführungsform 35, wobei die optionale Linker-Sequenz mindestens 1 Nukleotid oder mindestens 2, mindestens 3, mindestens 4, mindestens 5, mindestens 6, mindestens 7, mindestens 8, mindestens 9, mindestens 10, mindestens 11, mindestens 12, mindestens 13, mindestens 14 oder mindestens 15 Nukleotide lang ist.
  • Ausführungsform 48. Ein Komplex, umfassend ein Fusionsprotein einer beliebigen der Ausführungsformen 1-30 und eine Guide-RNA mit Extension.
  • Ausführungsform 49. Der Komplex der Ausführungsform 48, wobei die Guide-RNA mit Extension eine Guide-RNA und eine RNA-Extension am 3'- oder 5'-Ende der Guide-RNA oder an einer intramolekularen Position in der Guide-RNA umfasst.
  • Ausführungsform 50. Der Komplex der Ausführungsform 48, wobei die Guide-RNA mit Extension in der Lage ist, an ein napDNAbp zu binden und das napDNAbp an eine Target-DNA-Sequenz zu steuern.
  • Ausführungsform 51. Der Komplex der Ausführungsform 50, wobei die Target-DNA-Sequenz einen Target-Strang und einen komplementären Nicht-Target-Strang umfasst, wobei die Guide-RNA an den Target-Strang hybridisiert, um ein RNA-DNA-Hybrid und eine R-Schleife zu bilden.
  • Ausführungsform 52. Der Komplex der Ausführungsform 49, wobei die mindestens eine RNA-Extension (i) eine Reverse-Transkriptions-Template-Sequenz, (ii) eine Reverse-Transkriptions-Primer-Bindungsstelle und (iii) optional eine Linker-Sequenz umfasst.
  • Ausführungsform 53. Der Komplex der Ausführungsform 48, wobei die Guide-RNA mit Extension die Nukleotidsequenz von SEQ ID NOs: 394, 429-442, 641-649, 678-692, 2997-3103, 3113-3121, 3305-3455, 3479-3493, 3522-3556, 3628-3698 und 3755-3810 oder eine Nukleotidsequenz mit mindestens 85 % oder mindestens 90 % oder mindestens 95 % oder mindestens 98 % oder mindestens 99 % Sequenzidentität mit einer beliebigen von SEQ ID NOs: 394, 429-442, 641-649, 678-692, 2997-3103, 3113-3121, 3305-3455, 3479-3493, 3522-3556, 3628-3698 und 3755-3810 umfasst.
  • Ausführungsform 54. Der Komplex der Ausführungsform 52, wobei die Reverse-Transkriptions-Template-Sequenz eine Nukleotidsequenz mit mindestens 80 % oder 85 % oder 90 % oder 95 % oder 99 % Sequenzidentität mit dem endogenen DNA-Target umfasst.
  • Ausführungsform 55. Der Komplex der Ausführungsform 52, wobei die Reverse-Transkriptions-Primer-Bindungsstelle an ein freies 3'-Ende der geschnittenen DNA hybridisiert.
  • Ausführungsform 56. Ein Komplex, umfassend ein napDNAbp und eine Guide-RNA mit Extension.
  • Ausführungsform 57. Der Komplex der Ausführungsform 56, wobei das napDNAbp eine Cas9-Nickase ist.
  • Ausführungsform 58. Der Komplex der Ausführungsform 56, wobei das napDNAbp eine Aminosäuresequenz von SEQ ID NO: 18 oder eine Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % Sequenzidentität mit SEQ ID NO: 18 umfasst.
  • Ausführungsform 59. Der Komplex der Ausführungsform 57, wobei das napDNAbp eine Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % Sequenzidentität mit der Aminosäuresequenz einer beliebigen von SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467 und 482-487 umfasst.
  • Ausführungsform 60. Der Komplex der Ausführungsform 57, wobei die Guide-RNA mit Extension eine Guide-RNA und eine RNA-Extension am 3'- oder 5'-Ende der Guide-RNA oder an einer intramolekularen Position in der Guide-RNA umfasst.
  • Ausführungsform 61. Der Komplex der Ausführungsform 57, wobei die Guide-RNA mit Extension in der Lage ist, das napDNAbp an eine Target-DNA-Sequenz zu Steuern.
  • Ausführungsform 62. Der Komplex der Ausführungsform 61, wobei die Target-DNA-Sequenz einen Target-Strang und einen komplementären Nicht-Target-Strang umfasst, wobei die Spacer-Sequenz an den Target-Strang hybridisiert, um ein RNA-DNA-Hybrid und eine R-Schleife zu bilden.
  • Ausführungsform 63. Der Komplex der Ausführungsform 61, wobei die RNA-Extension (i) eine Reverse-Transkriptions-Template-Sequenz, (ii) eine Reverse-Transkriptions-Primer-Bindungsstelle und (iii) optional eine Linker-Sequenz umfasst.
  • Ausführungsform 64. Der Komplex der Ausführungsform 57, wobei die Guide-RNA mit Extension die Nukleotidsequenz von SEQ ID NOs: 394, 429-442, 641-649, 678-692, 2997-3103, 3113-3121, 3305-3455, 3479-3493, 3522-3556, 3628-3698 und 3755-3810 oder eine Nukleotidsequenz mit mindestens 85 % oder mindestens 90 % oder mindestens 95 % oder mindestens 98 % oder mindestens 99 % Sequenzidentität mit einer beliebigen von SEQ ID NOs: 394, 429-442, 641-649, 678-692, 2997-3103, 3113-3121, 3305-3455, 3479-3493, 3522-3556, 3628-3698 und 3755-3810 umfasst.
  • Ausführungsform 65. Der Komplex der Ausführungsform 63, wobei die Reverse-Transkriptions-Template-Sequenz eine Nukleotidsequenz umfasst, die zu mindestens 80 % oder 85 % oder 90 % oder 95 % oder 99 % identisch mit dem endogenen DNA-Target ist.
  • Ausführungsform 66. Der Komplex der Ausführungsform 63, wobei die Reverse-Transkriptase-Primer-Bindungsstelle an ein freies 3'-Ende der geschnittenen DNA hybridisiert.
  • Ausführungsform 67. Der Komplex der Ausführungsform 63, wobei die optionale Linker-Sequenz mindestens 1 Nukleotid oder mindestens 2, mindestens 3, mindestens 4, mindestens 5, mindestens 6, mindestens 7, mindestens 8, mindestens 9, mindestens 10, mindestens 11, mindestens 12, mindestens 13, mindestens 14 oder mindestens 15 Nukleotide lang ist.
  • Ausführungsform 68. Ein Polynukleotid, das für das Fusionsprotein einer beliebigen der Ausführungsformen 1-30 codiert.
  • Ausführungsform 69. Ein Vektor, umfassend das Polynukleotid der Ausführungsform 68.
  • Ausführungsform 70. Eine Zelle, umfassend das Fusionsprotein einer beliebigen der Ausführungsformen 1-30 und eine an das napDNAbp des Fusionsproteins gebundene Guide-RNA mit Extension.
  • Ausführungsform 71. Eine Zelle, die einen Komplex einer beliebigen der Ausführungsformen 48-67 umfasst.
  • Ausführungsform 72. Eine pharmazeutische Zusammensetzung, umfassend: (i) ein Fusionsprotein einer beliebigen der Ausführungsformen 1-30, den Komplex der Ausführungsformen 48-67, das Polynukleotid der Ausführungsform 68 oder der Vektor der Ausführungsform 69; und (ii) einen pharmazeutisch verträglichen Hilfsstoff.
  • Ausführungsform 73. Eine pharmazeutische Zusammensetzung, umfassend: (i) den Komplex der Ausführungsformen 48-67 (ii) reverse Transkriptase, bereitgestellt in trans; und (iii) einen pharmazeutisch verträglichen Hilfsstoff.
  • Ausführungsform 74. Ein Kit, das ein Nukleinsäurekonstrukt umfasst, umfassend: (i) eine Nukleinsäuresequenz, die für das Fusionsprotein einer beliebigen der Ausführungsformen 1-30 codiert; und (ii) einen Promotor, der die Expression der Sequenz von (i) steuert.
  • Ausführungsform 75. Ein Verfahren zum Einbauen einer gewünschten Nukleotidänderung in einer Doppelstrang-DNA-Sequenz, wobei das Verfahren Folgendes umfasst:
  • (i) Inkontaktbringen der Doppelstrang-DNA-Sequenz mit einem Komplex, der ein Fusionsprotein und eine Guide-RNA mit Extension umfasst, wobei das Fusionsprotein ein napDNAbp und eine reverse Transkriptase umfasst und wobei die Guide-RNA mit Extension eine Reverse-Transkriptions-Template-Sequenz umfasst, welche die gewünschte Nukleotidänderung umfasst;
  • (ii) Nicken der Doppelstrang-DNA-Sequenz auf dem Nicht-Target-Strang, wodurch eine freie Einzelstrang-DNA mit einem 3'-Ende erzeugt wird;
  • (iii) Hybridisieren des 3'-Endes der freien Einzelstrang-DNA an die Reverse-Transkriptions-Template-Sequenz, wodurch die Reverse-Transkriptase-Domäne geprimt wird;
  • (iv) Polymerisieren eines DNA-Strangs vom 3'-Ende, wodurch ein Einzelstrang-DNA-Flap erzeugt wird, der die gewünschte Nukleotidänderung umfasst;
  • (v) Ersetzen eines endogenen DNA-Strangs neben der Schnittstelle mit dem Einzelstrang-DNA-Flap, wodurch die gewünschte Nukleotidänderung in die Doppelstrang-DNA-Sequenz eingebaut wird.
  • Ausführungsform 76. Das Verfahren der Ausführungsform 75, wobei der Schritt (v) des Ersetzens Folgendes umfasst: (i) Hybridisieren des Einzelstrang-DNA-Flaps an den endogenen DNA-Strang neben der Schnittstelle, um eine Sequenzfehlpaarung zu erzeugen; (ii) Ausschneiden des endogenen DNA-Strangs; und (iii) Reparieren der Fehlpaarung, um das gewünschte Produkt zu bilden, das die gewünschte Nukleotidänderung in beiden DNA-Strängen umfasst.
  • Ausführungsform 77. Das Verfahren der Ausführungsform 76, wobei die gewünschte Nukleotidänderung eine Einzelnukleotidsubstitution, eine Deletion oder eine Insertion ist.
  • Ausführungsform 78. Das Verfahren der Ausführungsform 77, wobei die Einzelnukleotidsubstitution eine Transition oder eine Transversion ist.
  • Ausführungsform 79. Das Verfahren der Ausführungsform 76, wobei die gewünschte Nukleotidänderung (1) eine G-zu-T-Substitution, (2) eine G-zu-A-Substitution, (3) eine G-zu-C-Substitution, (4) eine T-zu-G-Substitution, (5) eine T-zu-A-Substitution, (6) eine T-zu-C-Substitution, (7) eine C-zu-G-Substitution, (8) eine C-zu-T-Substitution, (9) eine C-zu-A-Substitution, (10) eine A-zu-T-Substitution, (11) eine A-zuG-Substitution oder (12) eine A-zu-C-Substitution ist.
  • Ausführungsform 80. Das Verfahren der Ausführungsform 76, wobei die gewünschte Nukleotidänderung (1) ein G:C-Basenpaar in ein T:A-Basenpaar, (2) ein G:C-Basenpaar in ein A:T-Basenpaar, (3) ein G:C-Basenpaar in ein C:G-Basenpaar, (4) ein T:A-Basenpaar in ein G:C-Basenpaar, (5) ein T:A-Basenpaar in ein A:T-Basenpaar, (6) ein T:A-Basenpaar in ein C:G-Basenpaar, (7) ein C:G-Basenpaar in ein G:C-Basenpaar, (8) ein C:G-Basenpaar in ein T:A-Basenpaar, (9) ein C:G-Basenpaar in ein A:T-Basenpaar, (10) ein A:T-Basenpaar in ein T:A-Basenpaar, (11) ein A:T-Basenpaar in ein G:C-Basenpaar oder (12) ein A:T-Basenpaar in ein C:G-Basenpaar umwandelt.
  • Ausführungsform 81. Das Verfahren der Ausführungsform 76, wobei die gewünschte Nukleotidänderung eine Insertion oder Deletion von 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 oder 25 Nukleotiden ist.
  • Ausführungsform 82. Das Verfahren der Ausführungsform 76, wobei die gewünschte Nukleotidänderung ein krankheitsassoziiertes Gen korrigiert.
  • Ausführungsform 83. Das Verfahren der Ausführungsform 82, wobei das krankheitsassoziierte Gen mit einer monogenen Störung assoziiert ist, die aus der Gruppe ausgewählt ist, die aus Adenosindeaminase-Mangel (ADA-Mangel); Alpha-1-Antitrypsin-Mangel; Mukoviszidose; Duchenne-Muskeldystrophie; Galaktosämie; Hämochromatose; Huntington-Krankheit; Ahornsirupkrankheit; Marfan-Syndrom; Neurofibromatose Typ 1; Pachyonychia congenita; Phenylketonurie; schwerem kombiniertem Immundefekt; Sichelzellenanämie; Smith-Lemli-Opitz-Syndrom; und Tay-Sachs-Krankheit besteht.
  • Ausführungsform 84. Das Verfahren der Ausführungsform 82, wobei das krankheitsassoziierte Gen mit einer polygenen Störung assoziiert ist, die aus der Gruppe ausgewählt ist, die aus Herzkrankheit; Bluthochdruck; Alzheimer-Krankheit; Arthritis; Diabetes; Krebs; und Fettleibigkeit besteht.
  • Ausführungsform 85. Das Verfahren der Ausführungsform 76, wobei das napDNAbp ein Nuklease-totes Cas9 (dCas9), eine Cas9-Nickase (nCas9) oder ein Nuklease-aktives Cas9 ist.
  • Ausführungsform 86. Das Verfahren der Ausführungsform 76, wobei das napDNAbp eine Aminosäuresequenz von SEQ ID NO: 18 umfasst.
  • Ausführungsform 87. Das Verfahren der Ausführungsform 76, wobei das napDNAbp eine Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % Sequenzidentität mit der Aminosäuresequenz einer beliebigen von SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467 und 482-487 umfasst.
  • Ausführungsform 88. Das Verfahren der Ausführungsform 76, wobei die reverse Transkriptase eine beliebige der Aminosäuresequenzen von SEQ ID NO: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741 und 766 umfasst.
  • Ausführungsform 89. Das Verfahren der Ausführungsform 76, wobei die Reverse-Transkriptase-Domäne eine Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % Sequenzidentität mit der Aminosäuresequenz einer beliebigen von SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741 und 766 umfasst.
  • Ausführungsform 90. Das Verfahren der Ausführungsform 76, wobei die Guide-RNA mit Extension eine RNA-Extension an den 3'- oder 5'-Enden oder an einem intramolekularen Ort in der Guide-RNA umfasst, wobei die RNA-Extension die Reverse-Transkriptions-Template-Sequenz umfasst.
  • Ausführungsform 91. Das Verfahren der Ausführungsform 90, wobei die RNA-Extension mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide, mindestens 15 Nukleotide, mindestens 16 Nukleotide, mindestens 17 Nukleotide, mindestens 18 Nukleotide, mindestens 19 Nukleotide, mindestens 20 Nukleotide, mindestens 21 Nukleotide, mindestens 22 Nukleotide, mindestens 23 Nukleotide, mindestens 24 Nukleotide oder mindestens 25 Nukleotide lang ist.
  • Ausführungsform 92. Das Verfahren der Ausführungsform 76, wobei die Guide-RNA mit Extension eine Nukleotidsequenz umfasst, die aus der Gruppe ausgewählt ist, die aus SEQ ID NOs: 394, 429-442, 641-649, 678-692, 2997-3103, 3113' -3121, 3305-3455, 3479-3493, 3522-3556, 3628-3698 und 3755-3810 besteht.
  • Ausführungsform 93. Ein Verfahren zum Einführen einer oder mehrerer Änderungen in die Nukleotidsequenz eines DNA-Moleküls an einem Target-Locus, umfassend:
  • (i) Inkontaktbringen des DNA-Moleküls mit einem Nukleinsäure-programmierbaren DNA-Bindungsprotein (napDNAbp) und einer Guide-RNA, die das napDNAbp zu dem Target-Locus lenkt, wobei die Guide-RNA eine Reverse-Transkriptase(RT)-Template-Sequenz umfasst, die mindestens eine gewünschte Nukleotidänderung umfasst;
  • (ii) Bilden eines freigesetzten 3'-Endes in einem DNA-Strang an dem Target-Locus;
  • (iii) Hybridisieren des freigesetzten 3'-Endes an die RT-Template-Sequenz, um eine reverse Transkription zu primen;
  • (iv) Synthetisieren eines Einzelstrang-DNA-Flaps, der die mindestens eine gewünschte Nukleotidänderung umfasst, basierend auf der RT-Template-Sequenz durch reverse Transkriptase;
  • (v) und Aufnehmen der mindestens einen gewünschten Nukleotidänderung in die entsprechende endogene DNA, wodurch eine oder mehrere Änderungen in die Nukleotidsequenz des DNA-Moleküls an dem Target-Locus eingeführt werden.
  • Ausführungsform 94. Das Verfahren der Ausführungsform 93, wobei die eine oder mehreren Änderungen in der Nukleotidsequenz eine Transition umfassen.
  • Ausführungsform 95. Das Verfahren von Ausführungsform 94, wobei die Transition aus der Gruppe ausgewählt ist, die aus (a) T zu C; (b) A zu G; (c) C zu T; und (d) G zu A besteht.
  • Ausführungsform 96. Das Verfahren der Ausführungsform 93, wobei die eine oder mehreren Änderungen in der Nukleotidsequenz eine Transversion umfassen.
  • Ausführungsform 97. Das Verfahren von Ausführungsform 96, wobei die Transversion aus der Gruppe ausgewählt ist, die aus (a) T zu A; (b) T zu G; (c) C zu G; (d) C zu A; (e) A zu T; (f) A zu C; (g) G zu C; und (h) G zu T besteht.
  • Ausführungsform 98. Das Verfahren der Ausführungsform 93, wobei die eine oder mehreren Änderungen in der Nukleotidsequenz ein Ändern (1) eines G:C-Basenpaars in ein T:A-Basenpaar, (2) eines G:C-Basenpaars in ein A:T-Basenpaar, (3) eines G:C-Basenpaars in ein C:G-Basenpaar, (4) eines T:A-Basenpaars in ein G:C-Basenpaar, (5) eines T:A-Basenpaars in ein A:T-Basenpaar, (6) eines T:A-Basenpaars in ein C:G-Basenpaar, (7) eines C:G-Basenpaars in ein G:C-Basenpaar, (8) eines C:G-Basenpaars in ein T:A-Basenpaar, (9) eines C:G-Basenpaars in ein A:T Basenpaar, (10) eines A:T-Basenpaars in ein T:A Basenpaar, (11) eines A:T-Basenpaars in ein G:C Basenpaar oder (12) eines A:T-Basenpaars in ein C:G-Basenpaar umfassen.
  • Ausführungsform 99. Das Verfahren der Ausführungsform 93, wobei die eine oder mehreren Änderungen in der Nukleotidsequenz eine Insertion oder Deletion von 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 oder 25 Nukleotiden umfassen.
  • Ausführungsform 100. Das Verfahren der Ausführungsform 93, wobei die eine oder mehreren Änderungen in der Nukleotidsequenz eine Korrektur an einem krankheitsassoziierten Gen umfassen.
  • Ausführungsform 101. Das Verfahren der Ausführungsform 100, wobei das krankheitsassoziierte Gen mit einer monogenen Störung assoziiert ist, die aus der Gruppe ausgewählt ist, die aus Adenosindeaminase-Mangel (ADA-Mangel); Alpha-1-Antitrypsin-Mangel; Mukoviszidose; Duchenne-Muskeldystrophie; Galaktosämie; Hämochromatose; Huntington-Krankheit; Ahornsirupkrankheit; Marfan-Syndrom; Neurofibromatose Typ 1; Pachyonychia congenita; Phenylketonurie; schwerem kombiniertem Immundefekt; Sichelzellenanämie; Smith-Lemli-Opitz-Syndrom; und Tay-Sachs-Krankheit besteht.
  • Ausführungsform 102. Das Verfahren der Ausführungsform 100, wobei das krankheitsassoziierte Gen mit einer polygenen Störung assoziiert ist, die aus der Gruppe ausgewählt ist, die aus Herzkrankheit; Bluthochdruck; Alzheimer-Krankheit; Arthritis; Diabetes; Krebs; und Fettleibigkeit besteht.
  • Ausführungsform 103. Das Verfahren der Ausführungsform 93, wobei das napDNAbp ein Nuklease-aktives Cas9 oder eine Variante davon ist.
  • Ausführungsform 104. Das Verfahren der Ausführungsform 93, wobei das napDNAbp ein Nuklease-inaktives Cas9 (dCas9) oder Cas9-Nickase (nCas9) oder eine Variante davon ist.
  • Ausführungsform 105. Das Verfahren der Ausführungsform 93, wobei das napDNAbp eine Aminosäuresequenz von SEQ ID NO: 18 umfasst.
  • Ausführungsform 106. Das Verfahren der Ausführungsform 93, wobei das napDNAbp eine Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % Sequenzidentität mit der Aminosäuresequenz einer beliebigen von SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467 und 482-487 umfasst.
  • Ausführungsform 107. Das Verfahren der Ausführungsform 93, wobei die reverse Transkriptase in trans eingeführt wird.
  • Ausführungsform 108. Das Verfahren der Ausführungsform 93, wobei das napDNAbp eine Fusion mit einer reversen Transkriptase umfasst.
  • Ausführungsform 109. Das Verfahren der Ausführungsform 93, wobei die reverse Transkriptase eine beliebige der Aminosäuresequenzen von SEQ ID NO: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741 und 766 umfasst.
  • Ausführungsform 110. Das Verfahren der Ausführungsform 93, wobei die reverse Transkriptase eine Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % Sequenzidentität mit der Aminosäuresequenz einer beliebigen von SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741 und 766 umfasst.
  • Ausführungsform 111. Das Verfahren der Ausführungsform 93, wobei der Schritt des Bildens eines freigesetzten 3'-Endes in dem DNA-Strang an dem Target-Locus ein Nicken des DNA-Strangs mit einer Nuklease umfasst.
  • Ausführungsform 112. Das Verfahren der Ausführungsform 111, wobei die Nuklease das napDNAbp ist, als eine Fusionsdomäne von napDNAbp bereitgestellt wird oder in trans bereitgestellt wird.
  • Ausführungsform 113. Das Verfahren der Ausführungsform 93, wobei der Schritt des Bildens eines freigesetzten 3'-Endes in dem DNA-Strang an dem Target-Locus ein Inkontaktbringen des DNA-Strangs mit einem chemischen Mittel umfasst.
  • Ausführungsform 114. Das Verfahren der Ausführungsform 93, wobei der Schritt des Bildens eines freigesetzten 3'-Endes in dem DNA-Strang an dem Target-Locus ein Einführen eines Replikationsfehlers umfasst.
  • Ausführungsform 115. Das Verfahren der Ausführungsform 93, wobei der Schritt des Inkontaktbringens des DNA-Moleküls mit dem napDNAbp und der Guide-RNA eine R-Schleife bildet.
  • Ausführungsform 116. Das Verfahren der Ausführungsform 115, wobei sich der DNA-Strang, in dem das freigesetzte 3'-Ende gebildet wird, in der R-Schleife befindet.
  • Ausführungsform 117. Das Verfahren der Ausführungsform 93, wobei die Guide-RNA einen Extension-Abschnitt umfasst, der die Reverse-Transkriptase(RT)-Template-Sequenz umfasst.
  • Ausführungsform 118. Das Verfahren der Ausführungsform 117, wobei sich der Extension-Abschnitt am 3'-Ende der Guide-RNA, am 5'- Ende der Guide-RNA oder an einer intramolekularen Position in der Guide-RNA befindet.
  • Ausführungsform 119. Das Verfahren der Ausführungsform 93, wobei die Guide-RNA ferner eine Primer-Bindungsstelle umfasst.
  • Ausführungsform 120. Das Verfahren der Ausführungsform 93, wobei die Guide-RNA ferner eine Spacer-Sequenz umfasst.
  • Ausführungsform 121. Das Verfahren der Ausführungsform 93, wobei die RT-Template-Sequenz homolog zu der entsprechenden endogenen DNA ist.
  • Ausführungsform 122. Ein Verfahren zum Einführen einer oder mehrerer Änderungen in die Nukleotidsequenz eines DNA-Moleküls an einem Target-Locus durch Target-geprimte reverse Transkription, wobei das Verfahren Folgendes umfasst: (a) Inkontaktbringen des DNA-Moleküls an dem Target-Locus mit (i) einem Fusionsprotein, das ein Nukleinsäure-programmierbares DNA-Bindungsprotein (napDNAbp) und eine reverse Transkriptase umfasst, und (ii) einer Guide-RNA, die ein RT-Template umfasst, das eine gewünschte Nukleotidänderung umfasst; (b) Ausführen einer Target-geprimten reversen Transkription des RT-Templates, um eine Einzelstrang-DNA zu erzeugen, welche die gewünschte Nukleotidänderung umfasst; und (c) Aufnehmen der gewünschten Nukleotidänderung in das DNA-Molekül an dem Target-Locus durch einen DNA-Reparatur- und/oder -Replikationsprozess.
  • Ausführungsform 123. Das Verfahren der Ausführungsform 122, wobei sich das RT-Template am 3'-Ende der Guide-RNA, am 5'-Ende der Guide-RNA oder an einem intramolekularen Ort in der Guide-RNA befindet.
  • Ausführungsform 124. Das Verfahren der Ausführungsform 122, wobei die gewünschte Nukleotidänderung eine Transition, eine Transversion, eine Insertion oder eine Deletion oder eine beliebige Kombination davon umfasst.
  • Ausführungsform 125. Das Verfahren von Anspruch 122, wobei die gewünschte Nukleotidänderung eine Transition umfasst, die aus der Gruppe ausgewählt ist, die aus (a) T zu C; (b) A zu G; (c) C zu T; und (d) G zu A besteht.
  • Ausführungsform 126. Das Verfahren nach Anspruch 122, wobei die gewünschte Nukleotidänderung eine Transversion umfasst, die aus der Gruppe ausgewählt ist, die aus (a) T zu A; (b) T zu G; (c) C zu G; (d) C zu A; (e) A zu T; (f) A zu C; (g) G zu C; und (h) G zu T besteht.
  • Ausführungsform 127. Das Verfahren der Ausführungsform 122, wobei die gewünschte Nukleotidänderung ein Ändern (1) eines G:C-Basenpaars in ein T:A-Basenpaar, (2) eines G:C-Basenpaars in ein A:T-Basenpaar, (3) eines G:C-Basenpaars in ein C:G-Basenpaar, (4) eines T:A-Basenpaars in ein G:C-Basenpaar, (5) eines T:A-Basenpaars in ein A:T-Basenpaar, (6) eines T:A-Basenpaars in ein C:G-Basenpaar, (7) eines C:G-Basenpaars in ein G:C Basenpaar, (8) eines C:G-Basenpaars in ein T:A-Basenpaar, (9) eines C:G-Basenpaars in ein A:T-Basenpaar, (10) eines A:T-Basenpaars in ein T:A-Basenpaar, (11) eines A:T-Basenpaars in ein G:C-Basenpaar oder (12) eines A:T-Basenpaars in ein C:G-Basenpaar umfasst.
  • Ausführungsform 128. Ein Polynukleotid, das für die Guide-RNA mit Extension einer beliebigen der Ausführungsformen 31-47 codiert.
  • Ausführungsform 129. Ein Vektor, umfassend das Polynukleotid der Ausführungsform 128.
  • Ausführungsform 130. Eine Zelle, umfassend den Vektor der Ausführungsform 129.
  • Ausführungsform 131. Das Fusionsprotein einer beliebigen der Ausführungsformen 1-30, wobei das reverse Transkriptase eine fehleranfällige reverse Transkriptase ist.
  • Ausführungsform 132. Ein Verfahren zum Mutagenisieren eines DNA-Moleküls an einem Target-Locus durch Target-geprimte reverse Transkription, wobei das Verfahren Folgendes umfasst: (a) Inkontaktbringen des DNA-Moleküls an dem Target-Locus mit (i) einem Fusionsprotein, das ein Nukleinsäure-programmierbares DNA-Bindungsprotein (napDNAbp) und eine fehleranfällige reverse Transkriptase umfasst, und (ii) einer Guide-RNA, die ein RT-Template umfasst, das eine gewünschte Nukleotidänderung umfasst; (b) Ausführen einer Target-geprimten reversen Transkription des RT-Templates, um eine mutagenisierte Einzelstrang-DNA zu erzeugen; und (c) Aufnehmen der mutagenisierten Einzelstrang-DNA in das DNA-Molekül an dem Target-Locus durch einen DNA-Reparatur- und/oder -Replikationsprozess.
  • Ausführungsform 133. Das Verfahren der Ausführungsform 132, wobei das Fusionsprotein die Aminosäuresequenz von PE1, PE2 oder PE3 umfasst.
  • Ausführungsform 134. Das Verfahren der Ausführungsform 132, wobei das napDNAbp eine Cas9-Nickase (nCas9) ist.
  • Ausführungsform 135. Das Verfahren der Ausführungsform 132, wobei das napDNAbp die Aminosäuresequenz von SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467 und 482-487 umfasst.
  • Ausführungsform 136. Das Verfahren der Ausführungsform 132, wobei die Guide-RNA SEQ ID NOs: 222 umfasst.
  • Ausführungsform 137. Das Verfahren der Ausführungsform 132, wobei der Schritt (b) des Ausführens einer Target-geprimten reversen Transkription ein Erzeugen einer 3'-Ende-Primer-Bindungssequenz an dem Target-Locus umfasst, die in der Lage ist, eine reverse Transkription durch Annealen an eine Primer Bindungsstelle auf der Guide-RNA zu primen.
  • Ausführungsform 138. Ein Verfahren zum Ersetzen einer Trinukleotid-Repeat-Expansionsmutation in einem Target-DNA-Molekül durch eine gesunde Sequenz, die eine gesunde Anzahl von Repeat-Trinukleotiden umfasst, wobei das Verfahren Folgendes umfasst: (a) Inkontaktbringen des DNA-Moleküls an dem Target-Locus mit (i) einem Fusionsprotein, das ein Nukleinsäure-programmierbares DNA-Bindungsprotein (napDNAbp) und eine reverse Transkriptase umfasst, und (ii) einer Guide-RNA, die ein RT-Template umfasst, das die Ersatzsequenz umfasst, wobei das Fusionsprotein intr; (b) Ausführen einer Target-geprimten reversen Transkription des RT-Templates, um eine Einzelstrang-DNA zu erzeugen, welche die Ersatzsequenz umfasst; und (c) Aufnehmen der Einzelstrang-DNA in das DNA-Molekül an dem Target-Locus durch einen DNA-Reparatur- und/oder -Replikationsprozess.
  • Ausführungsform 139. Das Verfahren der Ausführungsform 138, wobei das Fusionsprotein die Aminosäuresequenz von PE1, PE2 oder PE3 umfasst.
  • Ausführungsform 140. Das Verfahren der Ausführungsform 138, wobei das napDNAbp eine Cas9-Nickase (nCas9) ist.
  • Ausführungsform 141. Das Verfahren der Ausführungsform 138, wobei das napDNAbp die Aminosäuresequenz von SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467 und 482-487 umfasst.
  • Ausführungsform 142. Das Verfahren der Ausführungsform 138, wobei die Guide-RNA SEQ ID NOs: 222 umfasst.
  • Ausführungsform 143. Das Verfahren der Ausführungsform 138, wobei der Schritt (b) des Ausführens einer Target-geprimten reversen Transkription ein Erzeugen einer 3'-Ende-Primer-Bindungssequenz an dem Target-Locus umfasst, die in der Lage ist, die reverse Transkription durch Annealen an eine Primer-Bindungsstelle auf der Guide-RNA zu primen.
  • Ausführungsform 144. Das Verfahren der Ausführungsform 138, wobei die Trinukleotid-Repeat-Expansionsmutation mit Huntington-Krankheit, Fragile-X-Syndrom oder Friedreich-Ataxie assoziiert ist.
  • Ausführungsform 145. Das Verfahren der Ausführungsform 138, wobei die Trinukleotid-Repeat-Expansionsmutation eine Repeat-Einheit von CAG-Tripletts umfasst.
  • Ausführungsform 146. Das Verfahren der Ausführungsform 138, wobei die Trinukleotid-Repeat-Expansionsmutation eine Repeat-Einheit von GAA-Tripletts umfasst.
  • Ausführungsform 147. Ein Verfahren zum Einbauen einer funktionellen Gruppierung in ein interessierendes Protein, für das von einer Target-Nukleotidsequenz codiert wird, durch Prime Editing, wobei das Verfahren Folgendes umfasst: (a) Inkontaktbringen der Target-Nukleotidsequenz mit (i) einem Prime Editor, der ein Nukleinsäure-programmierbares DNA-Bindungsprotein (napDNAbp) und eine reverse Transkriptase umfasst, und (ii) einer PEgRNA, die ein Edit-Template umfasst, das für die funktionelle Gruppierung codiert; (b) Polymerisieren einer Einzelstrang-DNA-Sequenz, die für die funktionelle Gruppierung codiert; und (c) Aufnehmen der Einzelstrang-DNA-Sequenz anstelle eines entsprechenden endogenen Strangs in die Target-Nukleotidsequenz durch einen DNA-Reparatur- und/oder Replikationsprozess, wobei das Verfahren eine rekombinante Target-Nukleotidsequenz erzeugt, die für ein Fusionsprotein codiert, welches das interessierende Protein und die funktionelle Gruppierung umfasst.
  • Ausführungsform 148. Das Verfahren der Ausführungsform 147, wobei die funktionelle Gruppierung ein Peptid-Tag ist.
  • Ausführungsform 149. Das Verfahren der Ausführungsform 148, wobei das Peptid-Tag ein Affinitäts-Tag, ein Solubilisierungs-Tag, ein Chromatografie-Tag, ein Epitop-Tag oder ein Fluoreszenz-Tag ist.
  • Ausführungsform 150. Das Verfahren der Ausführungsform 148, wobei das Peptid-Tag aus der Gruppe ausgewählt ist, die aus AviTag (SEQ ID NO: 245); C-Tag (SEQ ID NO: 246); Calmodulin-Tag (SEQ ID NO: 247); Polyglutamat-Tag (SEQ ID NO: 248); E-Tag (SEQ ID NO: 249); FLAG-Tag (SEQ ID NO: 2); HA-Tag (SEQ ID NO: 5); His-Tag (SEQ ID NOs: 252-262); Myc-Tag (SEQ ID NO: 6); NE-Tag (SEQ ID NO: 264); Rho1 D4-Tag (SEQ ID NO: 265); S-Tag (SEQ ID NO: 266); SBP-Tag (SEQ ID NO: 267); Softag-1 (SEQ ID NO: 268); Softag-2 (SEQ ID NO: 269); Spot-Tag (SEQ ID NO: 270); Strep-Tag (SEQ ID NO: 271); TC-Tag (SEQ ID NO: 272); Ty-Tag (SEQ ID NO: 273); V5-Tag (SEQ ID NO: 3); VSV-Tag (SEQ ID NO: 275); und Xpress-Tag (SEQ ID NO: 276) besteht.
  • Ausführungsform 151. Das Verfahren der Ausführungsform 148, wobei das Peptid-Tag aus der Gruppe ausgewählt ist, die aus AU1-Epitop (SEQ ID NO: 278); AU5-Epitop (SEQ ID NO: 279); Bakteriophagen-T7-Epitop (T7-Tag) (SEQ ID NO: 280); Blauzungenvirus-Tag (B-Tag) (SEQ ID NO: 281); E2-Epitop (SEQ ID NO: 282); Histidin-Affinitäts-Tag (HAT) (SEQ ID NO: 283); HSV-Epitop (SEQ ID NO: 284); Polyarginin (Arg-Tag) (SEQ ID NO: 285); Polyaspartat (Asp-Tag) (SEQ ID NO: 286); Polyphenylalanin (Phe-Tag) (SEQ ID NO: 287); S1-Tag (SEQ ID NO: 288); S-Tag (SEQ ID NO: 266); und VSV-G (SEQ ID NO: 275) besteht.
  • Ausführungsform 152. Das Verfahren der Ausführungsform 147, wobei die funktionelle Gruppierung ein Immunepitop ist.
  • Ausführungsform 153. Das Verfahren der Ausführungsform 152, wobei das Immunepitop aus der Gruppe ausgewählt ist, die aus Tetanustoxoid (SEQ ID NO: 396); Diphtherie-Toxin-Mutante CRM197 (SEQ ID NO: 398); Mumps-Immunepitop 1 (SEQ ID NO: 400); Mumps-Immunepitop 2 (SEQ ID NO: 402); Mumps-Immunepitop 3 (SEQ ID NO: 404); Rötelnvirus (SEQ ID NO: 406); Hämagglutinin (SEQ ID NO: 408); Neuraminidase (SEQ ID NO: 410); TAP1 (SEQ ID NO: 412); TAP2 (SEQ ID NO: 414); Hämagglutinin-Epitope für HLA der Klasse I (SEQ ID NO: 416); Neuraminidase-Epitope für HLA der Klasse I (SEQ ID NO: 418); Hämagglutinin-Epitope für HLA der Klasse II (SEQ ID NO: 420); Neuraminidase-Epitope für HLA der Klasse II (SEQ ID NO: 422); Hämagglutinin-Epitop H5N1-gebundenem HLA der Klasse I und Klasse II (SEQ ID NO: 424); und Neuraminidase-Epitop H5N1-gebundenem HLA der Klasse I und Klasse II (SEQ ID NO: 426) besteht.
  • Ausführungsform 154. Das Verfahren der Ausführungsform 147, wobei die funktionelle Gruppierung die Lokalisierung des interessierenden Proteins ändert.
  • Ausführungsform 155. Das Verfahren der Ausführungsform 147, wobei die funktionelle Gruppierung ein Abbau-Tag ist, so dass die Abbaurate des interessierenden Proteins geändert wird.
  • Ausführungsform 156. Das Verfahren der Ausführungsform 155, wobei das Abbau-Tag eine Aminosäuresequenz umfasst, welche für die Abbau-Tags codiert, wie hier offenbart.
  • Ausführungsform 157. Das Verfahren der Ausführungsform 147, wobei die funktionelle Gruppierung eine Kleinmolekül-Bindungsdomäne ist.
  • Ausführungsform 158. Das Verfahren der Ausführungsform 157, wobei die Kleinmolekül-Bindungsdomäne FKBP12 von SEQ ID NO: 488 ist.
  • Ausführungsform 159. Das Verfahren der Ausführungsform 157, wobei die Kleinmolekül-Bindungsdomäne FKBP12-F36V von SEQ ID NO: 489 ist.
  • Ausführungsform 160. Das Verfahren der Ausführungsform 157, wobei die Kleinmolekül-Bindungsdomäne Cyclophilin der SEQ ID NOs: 492-494 ist.
  • Ausführungsform 161. Das Verfahren der Ausführungsform 157, wobei die Kleinmolekül-Bindungsdomäne in zwei oder mehr interessierende Proteine eingebaut wird.
  • Ausführungsform 162. Das Verfahren der Ausführungsform 161, wobei die zwei oder mehr interessierenden Proteine bei Kontakt mit einem kleinen Molekül dimerisieren können.
  • Ausführungsform 163. Das Verfahren der Ausführungsform 157, wobei das kleine Molekül ein Dimer eines kleinen Moleküls ist, das aus der Gruppe ausgewählt ist, die aus den in Ausführungsform 163 von Gruppe 1 offenbarten Verbindungen besteht.
  • Ausführungsform 164. Ein Verfahren zum Einbauen eines Immunepitops in ein interessierendes Protein, für das von einer Target-Nukleotidsequenz codiert wird, durch Prime Editing, wobei das Verfahren Folgendes umfasst: (a) Inkontaktbringen der Target-Nukleotidsequenz mit (i) einem Prime Editor, der ein Nukleinsäure-programmierbares DNA-Bindungsprotein (napDNAbp) und eine reverse Transkriptase umfasst, und (ii) einer PEgRNA, die ein Edit-Template umfasst, das für die funktionelle Gruppierung codiert; (b) Polymerisieren einer Einzelstrang-DNA-Sequenz, die für das Immunepitop codiert; und (c) Aufnehmen der Einzelstrang-DNA-Sequenz anstelle eines entsprechenden endogenen Strangs in die Target-Nukleotidsequenz durch einen DNA-Reparatur- und/oder -Replikationsprozess, wobei das Verfahren eine rekombinante Target-Nukleotidsequenz erzeugt, die für ein Fusionsprotein codiert, welches das interessierende Protein und das Immunepitop umfasst.
  • Ausführungsform 165. Das Verfahren der Ausführungsform 164, wobei das Immunepitop aus der Gruppe ausgewählt ist, die aus Tetanustoxoid (SEQ ID NO: 396); Diphtherie-Toxin-Mutante CRM197 (SEQ ID NO: 630); Mumps-Immunepitop 1 (SEQ ID NO: 400); Mumps-Immunepitop 2 (SEQ ID NO: 402); Mumps-Immunepitop 3 (SEQ ID NO: 404); Rötelnvirus (SEQ ID NO: 406); Hämagglutinin (SEQ ID NO: 408); Neuraminidase (SEQ ID NO: 410); TAP1 (SEQ ID NO: 412); TAP2 (SEQ ID NO: 414); Hämagglutinin-Epitope für HLA der Klasse I (SEQ ID NO: 416); Neuraminidase-Epitope für HLA der Klasse I (SEQ ID NO: 418); Hämagglutinin-Epitope für HLA der Klasse II (SEQ ID NO: 420); Neuraminidase-Epitope für HLA der Klasse II (SEQ ID NO: 422); Hämagglutinin-Epitop H5N1-gebundenem HLA der Klasse I und Klasse II (SEQ ID NO: 424); und Neuraminidase-Epitop H5N1-gebundenem HLA der Klasse I und Klasse II (SEQ ID NO: 426) besteht.
  • Ausführungsform 166. Das Verfahren der Ausführungsform 164, wobei das Fusionsprotein die Aminosäuresequenz von PE1, PE2 oder PE3 umfasst.
  • Ausführungsform 167. Das Verfahren der Ausführungsform 164, wobei das napDNAbp eine Cas9-Nickase (nCas9) ist.
  • Ausführungsform 168. Das Verfahren der Ausführungsform 164, wobei das napDNAbp die Aminosäuresequenz von SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467 und 482-487 umfasst.
  • Ausführungsform 169. Das Verfahren der Ausführungsform 164, wobei die Guide-RNA SEQ ID NOs: 222 umfasst.
  • Ausführungsform 170. Ein Verfahren zum Einbauen einer Kleinmolekül-Dimerisierungsdomäne in einem interessierenden Protein, für das von einer Target-Nukleotidsequenz codiert wird, durch Prime Editing, wobei das Verfahren Folgendes umfasst: (a) Inkontaktbringen der Target-Nukleotidsequenz mit (i) einem Prime Editor, der ein Nukleinsäure-programmierbares DNA-Bindungsprotein (napDNAbp) und eine reverse Transkriptase umfasst, und (ii) einer PEgRNA, die ein Edit-Template umfasst, das für die Kleinmolekül-Dimerisierungsdomäne codiert; (b) Polymerisieren einer Einzelstrang-DNA-Sequenz, die für das Immunepitop codiert; und (c) Aufnehmen der Einzelstrang-DNA-Sequenz anstelle eines entsprechenden endogenen Strangs in die Target-Nukleotidsequenz durch einen DNA-Reparatur- und/oder -Replikationsprozess, wobei das Verfahren eine rekombinante Target-Nukleotidsequenz erzeugt, die für ein Fusionsprotein codiert, welches das interessierende Protein und die Kleinmolekül-Dimerisierungsdomäne umfasst.
  • Ausführungsform 171. Das Verfahren der Ausführungsform 170, ferner umfassend ein Ausführen des Verfahrens an einem zweiten interessierenden Protein.
  • Ausführungsform 172. Das Verfahren der Ausführungsform 171, wobei das erste interessierende Protein und das zweite interessierende Protein in Gegenwart eines kleinen Moleküls dimerisieren, das an die Dimerisierungsdomäne auf jedem der Proteine bindet.
  • Ausführungsform 173. Das Verfahren der Ausführungsform 170, wobei die Kleinmolekül-Bindungsdomäne FKBP12 von SEQ ID NO: 488 ist.
  • Ausführungsform 174. Das Verfahren der Ausführungsform 170, wobei die Kleinmolekül-Bindungsdomäne FKBP12-F36V von SEQ ID NO: 489 ist.
  • Ausführungsform 175. Das Verfahren der Ausführungsform 170, wobei die Kleinmolekül-Bindungsdomäne Cyclophilin der SEQ ID NOs: 490 und 493-494 ist.
  • Ausführungsform 176. Das Verfahren der Ausführungsform 170, wobei das kleine Molekül ein Dimer eines kleinen Moleküls ist, das aus der Gruppe ausgewählt ist, die aus den in Ausführungsform 163 von Gruppe 1 offenbarten Verbindungen besteht.
  • Ausführungsform 177. Das Verfahren der Ausführungsform 170, wobei das Fusionsprotein die Aminosäuresequenz von PE1, PE2 oder PE3 umfasst.
  • Ausführungsform 178. Das Verfahren der Ausführungsform 170, wobei das napDNAbp eine Cas9-Nickase (nCas9) ist.
  • Ausführungsform 179. Das Verfahren der Ausführungsform 170, wobei das napDNAbp die Aminosäuresequenz von SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467 und 482-487 umfasst.
  • Ausführungsform 180. Das Verfahren der Ausführungsform 170, wobei die Guide-RNA SEQ ID NOs: 222 umfasst.
  • Ausführungsform 181. Ein Verfahren zum Einbauen eines Peptid-Tags oder Epitops auf einem Protein unter Verwendung von Prime Editing, umfassend: Inkontaktbringen einer Target-Nukleotidsequenz, die für das Protein codiert, mit einem Prime Editor-Konstrukt, das konfiguriert ist, um darin eine zweite Nukleotidsequenz zu inserieren, die für das Peptid-Tag codiert, um zu einer rekombinanten Nukleotidsequenz führen, so dass das Peptid-Tag und das Protein aus der rekombinanten Nukleotidsequenz als ein Fusionsprotein exprimiert werden.
  • Ausführungsform 182. Das Verfahren der Ausführungsform 181, wobei das Peptid-Tag zur Reinigung und/oder Detektion des Proteins verwendet wird.
  • Ausführungsform 183. Das Verfahren der Ausführungsform 181, wobei das Peptid-Tag ein Polyhistidin (z.B. HHHHHH) (SEQ ID NO: 252-262), FLAG (z.B. DYKDDDDK) (SEQ ID NO: 2), V5 (z.B. GKPIPNPLLGLDST) (SEQ ID NO: 3), GCN4, HA (z.B. YPYDVPDYA) (SEQ ID NO: 5), Myc (z.B. EQKLISEED) (SEQ ID NO: 6), GST .... usw. ist.
  • Ausführungsform 184. Das Verfahren der Ausführungsform 181, wobei das Peptid-Tag eine Aminosäuresequenz aufweist, die aus der Gruppe ausgewählt ist, die aus SEQ ID NO: 1-6, 245-249, 252-262, 264-273, 275-276, 281, 278-288 und 622 besteht.
  • Ausführungsform 185. Das Verfahren der Ausführungsform 181, wobei das Peptid-Tag durch einen Linker mit dem Protein fusioniert ist.
  • Ausführungsform 186. Das Verfahren der Ausführungsform 181, wobei das Fusionsprotein die folgende Struktur aufweist: [Protein]-[Peptid-Tag] oder [Peptid-Tag]-[Protein], wobei „]-[“ einen optionalen Linker darstellt.
  • Ausführungsform 187. Das Verfahren der Ausführungsform 181, wobei der Linker eine Aminosäuresequenz von SEQ ID NO: 127, 165-176, 446, 453 und 767-769 umfasst.
  • Ausführungsform 188. Das Verfahren der Ausführungsform 181, wobei das Prime Editor-Konstrukt eine PEgRNA umfasst, welche die Nukleotidsequenz von SEQ ID NOs: 101-104, 181-183, 223-244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777 umfasst.
  • Ausführungsform 189. Das Verfahren der Ausführungsform 181, wobei die PEgRNA einen Spacer, einen gRNA-Kern und einen Extension-Arm umfasst, wobei der Spacer komplementär zur Target-Nukleotidsequenz ist und der Extension-Arm ein Reverse-Transkriptase-Template umfasst, das für das Peptid-Tag codiert.
  • Ausführungsform 190. Das Verfahren der Ausführungsform 181, wobei die PEgRNA einen Spacer, einen gRNA-Kern und einen Extension-Arm umfasst, wobei der Spacer komplementär zur Target-Nukleotidsequenz ist und der Extension-Arm ein Reverse-Transkriptase-Template umfasst, das für das Peptid-Tag codiert.
  • Ausführungsform 191. Ein Verfahren zum Verhindern oder Anhalten des Fortschreitens einer Prionenkrankheit durch Einbauen einer oder mehrerer schützender Mutationen in PRNP, für das von einer Target-Nukleotidsequenz codiert wird, durch Prime Editing, wobei das Verfahren Folgendes umfasst: (a) Inkontaktbringen der Target-Nukleotidsequenz mit (i) einem Prime Editor, der ein Nukleinsäure-programmierbares DNA-Bindungsprotein (napDNAbp) und eine reverse Transkriptase umfasst, und (ii) einer PEgRNA, die ein Edit-Template umfasst, das für die funktionelle Gruppierung codiert; (b) Polymerisieren einer Einzelstrang-DNA-Sequenz, die für die schützende Mutation codiert; und (c) Aufnehmen der Einzelstrang-DNA-Sequenz anstelle eines entsprechenden endogenen Strangs in die Target-Nukleotidsequenz durch einen DNA-Reparatur- und/oder -Replikationsprozess, wobei das Verfahren eine rekombinante Target-Nukleotidsequenz erzeugt, die für ein PRNP codiert, das eine schützende Mutation umfasst, und das resistent gegen Fehlfaltung ist.
  • Ausführungsform 192. Das Verfahren der Ausführungsform 191, wobei die Prionenkrankheit eine Prionenkrankheit des Menschen ist.
  • Ausführungsform 193. Das Verfahren der Ausführungsform 191, wobei die Prionenkrankheit eine Prionenkrankheit bei Tieren ist.
  • Ausführungsform 194. Das Verfahren der Ausführungsform 192, wobei die Prionenkrankheit Creutzfeldt-Jakob-Krankheit (CJK), variante Creutzfeldt-Jakob-Krankheit (vCJK), Gerstmann-Straussler-Scheinker-Syndrom, letale familiäre Insomnie oder Kuru ist.
  • Ausführungsform 195. Das Verfahren der Ausführungsform 193, wobei die Prionenkrankheit spongiforme Enzephalopathie bei Rindern (BSE oder „Rinderwahnsinn“), chronische Auszehrkrankheit (CWD), Scrapie, übertragbare Enzephalopathie bei Nerzen, spongiforme Enzephalopathie bei Katzen und spongiforme Enzephalopathie bei Huftieren ist.
  • Ausführungsform 196. Das Verfahren der Ausführungsform 191, wobei die Wildtyp-PRNP-Aminosäuresequenz SEQ ID NOs: 291-292 ist.
  • Ausführungsform 197. Das Verfahren der Ausführungsform 191, wobei das Verfahren zu einer modifizierten PRNP-Aminosäuresequenz führt, die aus der Gruppe ausgewählt ist, die aus SEQ ID NOs: 293-309 und 311-323, wobei das modifizierte PRNP-Protein resistent gegen Fehlfaltung ist.
  • Ausführungsform 198. Das Verfahren der Ausführungsform 191, wobei das Fusionsprotein die Aminosäuresequenz von PE1, PE2 oder PE3 umfasst.
  • Ausführungsform 199. Das Verfahren der Ausführungsform 191, wobei das napDNAbp eine Cas9-Nickase (nCas9) ist.
  • Ausführungsform 200. Das Verfahren der Ausführungsform 191, wobei das napDNAbp die Aminosäuresequenz von SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467 und 482-487 umfasst.
  • Ausführungsform 201. Das Verfahren der Ausführungsform 191, wobei die Guide-RNA SEQ ID NOs: 222 umfasst.
  • Ausführungsform 202. Ein Verfahren zum Einbauen eines Ribonukleotid-Motivs oder -Tags in eine interessierende RNA, für die von einer Target-Nukleotidsequenz codiert wird, durch Prime Editing, wobei das Verfahren Folgendes umfasst: (a) Inkontaktbringen der Target-Nukleotidsequenz mit (i) einem Prime Editor, der ein Nukleinsäure-programmierbares DNA-Bindungsprotein (napDNAbp) und eine reverse Transkriptase umfasst, und (ii) einer PEgRNA, die ein Edit-Template umfasst, das für das Ribonukleotid-Motiv oder -Tag codiert; (b) Polymerisieren einer Einzelstrang-DNA-Sequenz, die für das Ribonukleotid-Motiv oder -Tag codiert; und (c) Aufnehmen der Einzelstrang-DNA-Sequenz anstelle eines entsprechenden endogenen Strangs in die Target-Nukleotidsequenz durch einen DNA-Reparatur- und/oder -Replikationsprozess, wobei das Verfahren eine rekombinante Target-Nukleotidsequenz erzeugt, die für eine modifizierte interessierende RNA codiert, die das Ribonukleotid-Motiv oder -Tag umfasst.
  • Ausführungsform 203. Das Verfahren der Ausführungsform 202, wobei das Ribonukleotid-Motiv oder -Tag eine Detektionsgruppierung ist.
  • Ausführungsform 204. Das Verfahren der Ausführungsform 202, wobei das Ribonukleotid-Motiv oder -Tag das Expressionsniveau der interessierenden RNA beeinflusst.
  • Ausführungsform 205. Das Verfahren der Ausführungsform 202, wobei das Ribonukleotid-Motiv oder -Tag den Transport oder den subzellulären Ort der interessierenden RNA beeinflusst.
  • Ausführungsform 206. Das Verfahren der Ausführungsform 202, wobei das Ribonukleotid-Motiv oder -Tag aus der Gruppe ausgewählt ist, die aus SV40 Typ 1, SV40 Typ 2, SV40 Typ 3, hGH, BGH, rbGlob, TK, MALAT1 ENE-mascRNA, KSHV PAN ENE, Smbox/U1 snRNA-Box, U1 snRNA 3'-Box, tRNA-Lysin, Brokkoli-Aptamer, Spinat-Aptamer, Mango-Aptamer, HDV-Ribozym und m6A besteht.
  • Ausführungsform 207. Das Verfahren der Ausführungsform 202, wobei die PEgRNA SEQ ID NOs: 101-104, 181-183, 223-244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777 umfasst.
  • Ausführungsform 208. Das Verfahren der Ausführungsform 202, wobei das Fusionsprotein die Aminosäuresequenz von PE1, PE2 oder PE3 umfasst.
  • Ausführungsform 209. Das Verfahren der Ausführungsform 202, wobei das napDNAbp eine Cas9-Nickase (nCas9) ist.
  • Ausführungsform 210. Das Verfahren der Ausführungsform 202, wobei das napDNAbp die Aminosäuresequenz von SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467 und 482-487 umfasst.
  • Ausführungsform 211. Ein Verfahren zum Einbauen oder Deletieren einer funktionellen Gruppierung in ein interessierendes Protein, für das von einer Target-Nukleotidsequenz codiert wird, durch Prime Editing, wobei das Verfahren Folgendes umfasst: (a) Inkontaktbringen der Target-Nukleotidsequenz mit (i) einem Prime Editor, der ein Nukleinsäure-programmierbares DNA-Bindungsprotein (napDNAbp) und eine reverse Transkriptase umfasst, und (ii) einer PEgRNA, die ein Edit-Template umfasst, das für die funktionelle Gruppierung oder Deletion derselben codiert; (b) Polymerisieren einer Einzelstrang-DNA-Sequenz, die für die funktionelle Gruppierung oder Deletion derselben codiert; und (c) Aufnehmen der Einzelstrang-DNA-Sequenz anstelle eines entsprechenden endogenen Strangs in die Target-Nukleotidsequenz durch einen DNA-Reparatur- und/oder -Replikationsprozess, wobei das Verfahren eine rekombinante Target-Nukleotidsequenz erzeugt, die für ein modifiziertes Protein codiert, welches das interessierende Protein und die funktionelle Gruppierung oder die Entfernung derselben umfasst, wobei die funktionelle Gruppierung einen Modifikationszustand oder Lokalisierungszustand des Proteins ändert.
  • Ausführungsform 212. Das Verfahren der Ausführungsform 211, wobei eine funktionelle Gruppierung den Phosphorylierungs-, Ubiquitylierungs-, Glykosylierungs-, Lipidierungs-, Hydroxylierungs-, Methylierungs-, Acetylierungs-, Crotonylierungs-, SUMOylierungszustand des interessierenden Proteins ändert.
  • Ausführungsform 213. Ein Fusionsprotein, umfassend ein Nukleinsäure-programmierbares DNA-Bindungsprotein (napDNAbp) und eine Polymerase.
  • Ausführungsform 214. Das Fusionsprotein der Ausführungsform 213, wobei das Fusionsprotein in der Lage ist, ein Prime Editing in Gegenwart einer Prime Editing-Guide-RNA (PEgRNA) auszuführen.
  • Ausführungsform 215. Das Fusionsprotein der Ausführungsform 213, wobei das napDNAbp eine Nickase-Aktivität aufweist.
  • Ausführungsform 216. Das Fusionsprotein der Ausführungsform 213, wobei das napDNAbp ein Cas9-Protein oder eine Variante davon ist.
  • Ausführungsform 217. Das Fusionsprotein der Ausführungsform 213, wobei das napDNAbp ein Nuklease-aktives Cas9, ein Nuklease-inaktives Cas9 (dCas9) oder eine Cas9-Nickase (nCas9) ist.
  • Ausführungsform 218. Das Fusionsprotein der Ausführungsform 213, wobei das napDNAbp Cas9-Nickase (nCas9) ist.
  • Ausführungsform 219. Das Fusionsprotein der Ausführungsform 213, wobei das napDNAbp aus der Gruppe ausgewählt ist, die aus Cas9, Cas12e, Cas12d, Cas12a, Cas12b1, Cas13a, Cas12c und Argonaute besteht, und optional eine Nickase-Aktivität aufweist.
  • Ausführungsform 220. Das Fusionsprotein der Ausführungsform 213, wobei das Fusionsprotein, wenn es mit einer PEgRNA komplexiert ist, in der Lage ist, an eine Target-DNA-Sequenz zu binden.
  • Ausführungsform 221. Das Fusionsprotein der Ausführungsform 220, wobei die Target-DNA-Sequenz einen Target-Strang und einen komplementären Nicht-Target-Strang umfasst.
  • Ausführungsform 222. Das Fusionsprotein der Ausführungsform 220, wobei die Bindung des mit der PEgRNA komplexierten Fusionsproteins eine R-Schleife bildet.
  • Ausführungsform 223. Das Fusionsprotein der Ausführungsform 222, wobei die R-Schleife (i) ein RNA-DNA-Hybrid, das die PEgRNA und den Target-Strang umfasst, und (ii) den komplementären Nicht-Target-Strang umfasst.
  • Ausführungsform 224. Das Fusionsprotein der Ausführungsform 223, wobei der komplementäre Nicht-Target-Strang genickt ist, um eine Priming-Sequenz mit einem freien 3'-Ende zu bilden.
  • Ausführungsform 225. Das Fusionsprotein der Ausführungsform 214, wobei die PEgRNA (a) eine Guide-RNA und (b) einen Extension-Arm am 5'- oder 3'-Ende der Guide-RNA oder an einem intramolekularen Ort in der Guide-RNA umfasst.
  • Ausführungsform 226. Das Fusionsprotein der Ausführungsform 225, wobei der Extension-Arm (i) eine DNA-Synthese-Template-Sequenz, die eine gewünschte Nukleotidänderung umfasst, und (ii) eine Primer-Bindungsstelle umfasst.
  • Ausführungsform 227. Das Fusionsprotein der Ausführungsform 226, wobei die DNA-Synthese-Template-Sequenz für einen Einzelstrang-DNA-Flap codiert, der komplementär zu einer endogenen DNA-Sequenz neben der Nick-Stelle ist, wobei der Einzelstrang-DNA-Flap die gewünschte Nukleotidänderung umfasst.
  • Ausführungsform 228. Das Fusionsprotein der Ausführungsform 225, wobei der Extension-Arm mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide, mindestens 15 Nukleotide, mindestens 16 Nukleotide, mindestens 17 Nukleotide, mindestens 18 Nukleotide, mindestens 19 Nukleotide, mindestens 20 Nukleotide, mindestens 21 Nukleotide, mindestens 22 Nukleotide, mindestens 23 Nukleotide, mindestens 24 Nukleotide oder mindestens 25 Nukleotide lang ist.
  • Ausführungsform 229. Das Fusionsprotein der Ausführungsform 227, wobei der Einzelstrang-DNA-Flap an die endogene DNA-Sequenz neben der Nick-Stelle hybridisiert, wodurch die gewünschte Nukleotidänderung eingebaut wird.
  • Ausführungsform 230. Das Fusionsprotein der Ausführungsform 227, wobei der Einzelstrang-DNA-Flap die endogene DNA-Sequenz neben der Nick-Stelle und die ein freies 5'-Ende aufweist verdrängt.
  • Ausführungsform 231. Das Fusionsprotein der Ausführungsform 230, wobei die endogene DNA-Sequenz mit dem 5'- Ende von der Zelle ausgeschnitten wird.
  • Ausführungsform 232. Das Fusionsprotein der Ausführungsform 230, wobei die zelluläre Reparatur des Einzelstrang-DNA-Flaps zum Einbau der gewünschten Nukleotidänderung führt, wodurch ein gewünschtes Produkt gebildet wird.
  • Ausführungsform 233. Das Fusionsprotein der Ausführungsform 226, wobei die gewünschte Nukleotidänderung in einem Editierfenster eingebaut ist, das zwischen etwa -4 bis +10 der PAM-Sequenz oder zwischen etwa -10 bis +20 der PAM-Sequenz oder zwischen etwa -20 bis +40 der PAM-Sequenz oder zwischen etwa -30 bis +100 der PAM-Sequenz liegt oder wobei die gewünschte Nukleotidänderung mindestens 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 oder 100 Nukleotide stromabwärts der Nick-Stelle eingebaut ist.
  • Ausführungsform 234. Das Fusionsprotein der Ausführungsform 213, wobei das napDNAbp eine Aminosäuresequenz von SEQ ID NO: 2 oder eine Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % Sequenzidentität mit der Aminosäuresequenz zu SEQ ID NO: 18 umfasst.
  • Ausführungsform 235. Das Fusionsprotein der Ausführungsform 213, wobei das napDNAbp eine Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % Sequenzidentität mit der Aminosäuresequenz eine beliebigen von SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467 und 482-487 umfasst.
  • Ausführungsform 236. Das Fusionsprotein der Ausführungsform 213, wobei die Polymerase eine reverse Transkriptase ist, die eine beliebige der Aminosäuresequenzen von SEQ ID NO: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741 und 766 umfasst.
  • Ausführungsform 237. Das Fusionsprotein der Ausführungsform 213, wobei die Polymerase eine reverse Transkriptase ist, die eine Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % Sequenzidentität mit der Aminosäuresequenz einer beliebigen von SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741 und 766 umfasst.
  • Ausführungsform 238. Das Fusionsprotein der Ausführungsform 213, wobei die Polymerase eine natürlich vorkommende reverse Transkriptase aus einem Retrovirus oder einem Retrotransposon ist.
  • Ausführungsform 239. Das Fusionsprotein nach einer der vorherigen Ausführungsformen, wobei das Fusionsprotein die Struktur NH2-[napDNAbp]-[Polymerase]-COOH; oder NH2-[Polymerase]-[napDNAbp]-COOH umfasst, wobei jedes Auftreten von „]-[“ das Vorhandensein einer optionalen Linker-Sequenz anzeigt.
  • Ausführungsform 240. Das Fusionsprotein der Ausführungsform 239, wobei die Linker-Sequenz eine Aminosäuresequenz von SEQ ID NOs: 127, 165-176, 446, 453 und 767-769 umfasst.
  • Ausführungsform 241. Das Fusionsprotein der Ausführungsform 226, wobei die gewünschte Nukleotidänderung eine Einzelnukleotidänderung, eine Insertion eines oder mehrerer Nukleotide oder eine Deletion eines oder mehrerer Nukleotide ist.
  • Ausführungsform 242. Das Fusionsprotein der Ausführungsform 241, wobei das Insert oder die Deletion mindestens 1, mindestens 2, mindestens 3, mindestens 4, mindestens 5, mindestens 6, mindestens 7, mindestens 8, mindestens 9, mindestens 10, mindestens 11, mindestens 12, mindestens 13, mindestens 14, mindestens 15, mindestens 16, mindestens 17, mindestens 18, mindestens 19, mindestens 20, mindestens 21, mindestens 22, mindestens 23, mindestens 24, mindestens 25, mindestens 26, mindestens 27, mindestens 28, mindestens 29, mindestens 30, mindestens 31, mindestens 32, mindestens 33, mindestens 34, mindestens 35, mindestens 36, mindestens 37, mindestens 38, mindestens 39, mindestens 40, mindestens 41, mindestens 42, mindestens 43, mindestens 44, mindestens 45, mindestens 46, mindestens 47, mindestens 48, mindestens 49 oder mindestens 50 ist.
  • Ausführungsform 243. Eine PEgRNA, umfassend eine Guide-RNA und mindestens einen Nukleinsäure-Extension-Arm, der ein DNA-Synthese-Template umfasst.
  • Ausführungsform 244. Die PEgRNA der Ausführungsform 241, wobei der Nukleinsäure-Extension-Arm am 3'- oder 5'-Ende der Guide-RNA oder an einer intramolekularen Position in der Guide-RNA positioniert ist, und wobei der Nukleinsäure-Extension-Arm DNA oder RNA ist.
  • Ausführungsform 245. Die PEgRNA der Ausführungsform 242, wobei die PEgRNA in der Lage ist, an ein napDNAbp zu binden und das napDNAbp an eine Target-DNA-Sequenz zu steuern.
  • Ausführungsform 246. Die PEgRNA der Ausführungsform 245, wobei die Target-DNA-Sequenz einen Target-Strang und einen komplementären Nicht-Target-Strang umfasst, wobei die Guide-RNA an den Target-Strang hybridisiert, um ein RNA-DNA-Hybrid und eine R-Schleife zu bilden.
  • Ausführungsform 247. Die PEgRNA der Ausführungsform 243, wobei der mindestens eine Nukleinsäure-Extension-Arm (i) ein DNA-Synthese-Template und (ii) eine Primer-Bindungsstelle umfasst.
  • Ausführungsform 248. Die PEgRNA der Ausführungsform 247, wobei der Nukleinsäure-Extension-Arm mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide, mindestens 15 Nukleotide, mindestens 16 Nukleotide, mindestens 17 Nukleotide, mindestens 18 Nukleotide, mindestens 19 Nukleotide, mindestens 20 Nukleotide, mindestens 21 Nukleotide, mindestens 22 Nukleotide, mindestens 23 Nukleotide, mindestens 24 Nukleotide oder mindestens 25 Nukleotide lang ist.
  • Ausführungsform 249. Die PEgRNA der Ausführungsform 247, wobei das DNA-Synthese-Template mindestens 3 Nukleotide, mindestens 4 Nukleotide, mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide oder mindestens 15 Nukleotide lang ist.
  • Ausführungsform 250. Die PEgRNA der Ausführungsform 247, wobei die Primer-Bindungsstelle mindestens 3 Nukleotide, mindestens 4 Nukleotide, mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide oder mindestens 15 Nukleotide lang ist.
  • Ausführungsform 251. Die PEgRNA der Ausführungsform 243, ferner umfassend mindestens eine zusätzliche Struktur, die aus der Gruppe ausgewählt ist, die aus einem Linker, einer Stammschleife, einer Haarnadel, einer Toe-Loop, einem Aptamer oder einer RNA-Protein-Rekrutierungsdomäne besteht.
  • Ausführungsform 252. Die PEgRNA der Ausführungsform 247, wobei das DNA-Synthese-Template für einen Einzelstrang-DNA-Flap codiert, der komplementär zu einer endogenen DNA-Sequenz neben einer Nick-Stelle ist, wobei der Einzelstrang-DNA-Flap eine gewünschte Nukleotidänderung umfasst.
  • Ausführungsform 253. Die PEgRNA der Ausführungsform 252, wobei der Einzelstrang-DNA-Flap eine endogene Einzelstrang-DNA mit einem 5'-Ende in der Target-DNA-Sequenz, die genickt wurde verdrängt, und wobei sich die endogene Einzelstrang-DNA stromabwärts und unmittelbar neben der Nick-Stelle befindet.
  • Ausführungsform 254. Die PEgRNA der Ausführungsform 253, wobei die endogene Einzelstrang-DNA mit dem freien 5'-Ende von der Zelle ausgeschnitten wird.
  • Ausführungsform 255. Die PEgRNA der Ausführungsform 253, wobei die zelluläre Reparatur des Einzelstrang-DNA-Flaps zum Einbau der gewünschten Nukleotidänderung führt, wodurch ein gewünschtes Produkt gebildet wird.
  • Ausführungsform 256. Die PEgRNA der Ausführungsform 243, umfassend die Nukleotidsequenz von SEQ ID NOs: 101-104, 181-183, 223-244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777 oder eine Nukleotidsequenz mit mindestens 85 % oder mindestens 90 % oder mindestens 95 % oder mindestens 98 % oder mindestens 99 % Sequenzidentität mit einer beliebigen von SEQ ID NOs: 101-104, 181-183, 223-244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777.
  • Ausführungsform 257. Die PEgRNA der Ausführungsform 247, wobei das DNA-Synthese-Template eine Nukleotidsequenz umfasst, die zu mindestens 80 % oder 85 % oder 90 % oder 95 % oder 99 % identisch mit dem endogenen DNA-Target ist.
  • Ausführungsform 258. Die PEgRNA der Ausführungsform 247, wobei die Primer-Bindungsstelle an ein freies 3'-Ende der geschnittenen DNA hybridisiert.
  • Ausführungsform 259. Die PEgRNA der Ausführungsform 251, wobei sich die mindestens eine zusätzliche Struktur am 3'- oder 5'-Ende der PEgRNA befindet.
  • Ausführungsform 260. Ein Komplex, umfassend ein Umfassen eines Fusionsproteins einer beliebigen der Ausführungsformen 213-242 und einer PEgRNA.
  • Ausführungsform 261. Der Komplex der Ausführungsform 260, wobei die PEgRNA eine Guide-RNA und einen Nukleinsäure-Extension-Arm am 3'- oder 5'-Ende der Guide-RNA oder an einer intramolekularen Position in der Guide-RNA umfasst.
  • Ausführungsform 262. Der Komplex der Ausführungsform 260, wobei die PEgRNA in der Lage ist, an ein napDNAbp zu binden und das napDNAbp an eine Target-DNA-Sequenz zu steuern.
  • Ausführungsform 263. Der Komplex der Ausführungsform 262, wobei die Target-DNA-Sequenz einen Target-Strang und einen komplementären Nicht-Target-Strang umfasst, wobei die Guide-RNA an den Target-Strang hybridisiert, um ein RNA-DNA-Hybrid und eine R-Schleife zu bilden.
  • Ausführungsform 264. Der Komplex der Ausführungsform 261, wobei der mindestens eine Nukleinsäure-Extension-Arm (i) ein DNA-Synthese-Template und (ii) eine Primer-Bindungsstelle umfasst.
  • Ausführungsform 265. Der Komplex der Ausführungsform 260, wobei die PEgRNA die Nukleotidsequenz von SEQ ID NOs: 101-104, 181-183, 223-244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777 oder eine Nukleotidsequenz mit mindestens 85 % oder mindestens 90 % oder mindestens 95 % oder mindestens 98 % oder mindestens 99 % Sequenzidentität mit einer beliebigen von SEQ ID NOs: 101-104, 181-183, 223-244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777 umfasst.
  • Ausführungsform 266. Der Komplex der Ausführungsform 264, wobei das DNA-Synthese-Template eine Nukleotidsequenz umfasst, die zu mindestens 80 % oder 85 % oder 90 % oder 95 % oder 99 % identisch mit dem endogenen DNA-Target ist.
  • Ausführungsform 267. Der Komplex der Ausführungsform 264, wobei die Primer-Bindungsstelle an ein freies 3'-Ende der geschnittenen DNA hybridisiert.
  • Ausführungsform 268. Ein Komplex, umfassend ein napDNAbp und eine PEgRNA.
  • Ausführungsform 269. Der Komplex der Ausführungsform 268, wobei das napDNAbp eine Cas9-Nickase ist.
  • Ausführungsform 270. Der Komplex der Ausführungsform 268, wobei das napDNAbp eine Aminosäuresequenz von SEQ ID NO: 18 umfasst.
  • Ausführungsform 271. Der Komplex der Ausführungsform 268, wobei das napDNAbp eine Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % Sequenzidentität mit der Aminosäuresequenz einer beliebigen von SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467 und 482-487 umfasst.
  • Ausführungsform 272. Der Komplex der Ausführungsform 268, wobei die PEgRNA eine Guide-RNA und einen Nukleinsäure-Extension-Arm am 3'- oder 5'-Ende der Guide-RNA oder an einer intramolekularen Position in der Guide-RNA umfasst.
  • Ausführungsform 273. Der Komplex der Ausführungsform 268, wobei die PEgRNA in der Lage ist, das napDNAbp an eine Target-DNA-Sequenz zu steuern.
  • Ausführungsform 274. Der Komplex der Ausführungsform 272, wobei die Target-DNA-Sequenz einen Target-Strang und einen komplementären Nicht-Target-Strang umfasst, wobei die Spacer-Sequenz der PEgRNA an den Target-Strang hybridisiert, um ein RNA-DNA-Hybrid und eine R-Schleife zu bilden.
  • Ausführungsform 275. Der Komplex der Ausführungsform 273, wobei der Nukleinsäure-Extension-Arm (i) ein DNA-Synthese-Template und (ii) eine Primer-Bindungsstelle umfasst.
  • Ausführungsform 276. Der Komplex der Ausführungsform 269, wobei die PEgRNA die Nukleotidsequenz von SEQ ID NOs: 101-104, 181-183, 223-244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777 oder eine Nukleotidsequenz mit mindestens 85 % oder mindestens 90 % oder mindestens 95 % oder mindestens 98 % oder mindestens 99 % Sequenzidentität mit einer beliebigen von SEQ ID NOs: 101-104, 181-183, 223 -244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777 umfasst.
  • Ausführungsform 277. Der Komplex der Ausführungsform 276, wobei das DNA-Synthese-Template eine Nukleotidsequenz umfasst, die zu mindestens 80 % oder 85 % oder 90 % oder 95 % oder 99 % identisch mit dem endogenen DNA-Target ist.
  • Ausführungsform 278. Der Komplex der Ausführungsform 276, wobei die Primer-Bindungsstelle an ein freies 3'-Ende der geschnittenen DNA hybridisiert.
  • Ausführungsform 279. Der Komplex der Ausführungsform 276, wobei die PEgRNA ferner mindestens eine zusätzliche Struktur umfasst, die aus der Gruppe ausgewählt ist, die aus einem Linker, einer Stammschleife, einer Haarnadel, einer Toe-Loop, einem Aptamer oder einer RNA-Protein-Rekrutierungsdomäne besteht.
  • Ausführungsform 280. Ein Polynukleotid, das für das Fusionsprotein einer beliebigen der Ausführungsformen 213-242 codiert.
  • Ausführungsform 281. Ein Vektor, umfassend das Polynukleotid der Ausführungsform 280.
  • Ausführungsform 282. Eine Zelle, umfassend das Fusionsprotein einer beliebigen der Ausführungsformen 213-242 und eine an das napDNAbp des Fusionsproteins gebundene PEgRNA.
  • Ausführungsform 283. Eine Zelle, umfassend einen Komplex einer beliebigen der Ausführungsformen 260-279.
  • Ausführungsform 284. Eine pharmazeutische Zusammensetzung, umfassend: (i) ein Fusionsprotein einer beliebigen der Ausführungsformen 213-242, den Komplex der Ausführungsformen 260-279, das Polynukleotid der Ausführungsform 68 oder den Vektor der Ausführungsform 69; und (ii) einen pharmazeutisch verträglichen Hilfsstoff.
  • Ausführungsform 285. Eine pharmazeutische Zusammensetzung, umfassend: (i) den Komplex der Ausführungsformen 260-279 (ii) eine Polymerase, die in trans bereitgestellt ist; und (iii) einen pharmazeutisch verträglichen Hilfsstoff.
  • Ausführungsform 286. Ein Kit, das ein Nukleinsäurekonstrukt umfasst, umfassend: (i) eine Nukleinsäuresequenz, die für das Fusionsprotein einer beliebigen der Ausführungsformen 213-242 codiert; und (ii) einen Promotor, der die Expression der Sequenz von (i) steuert.
  • Ausführungsform 287. Ein Verfahren zum Einbauen einer gewünschten Nukleotidänderung in eine Doppelstrang-DNA-Sequenz, wobei das Verfahren Folgendes umfasst:
  • (i) Inkontaktbringen der Doppelstrang-DNA-Sequenz mit einem Komplex, der ein Fusionsprotein und eine PEgRNA umfasst, wobei das Fusionsprotein ein napDNAbp und eine Polymerase umfasst und wobei die PEgRNA ein DNA-Synthese-Template umfasst, das die gewünschte Nukleotidänderung und eine Primer-Bindungsstelle umfasst;
  • (ii) Nicken der Doppelstrang-DNA-Sequenz, wodurch eine freie Einzelstrang-DNA mit einem 3' Ende erzeugt wird;
  • (iii) Hybridisieren des 3'-Endes der freien Einzelstrang-DNA an die Primer-Bindungsstelle, wodurch die Polymerase geprimt wird;
  • (iv) Polymerisieren eines DNA-Strangs von dem 3'-Ende, das an die Primer-Bindungsstelle hybridisiert ist, wodurch ein Einzelstrang-DNA-Flap erzeugt wird, der die gewünschte Nukleotidänderung umfasst und der zu dem DNA-Synthese-Template komplementär ist;
  • (v) Ersetzen eines endogenen DNA-Strangs neben der Schnittstelle mit dem Einzelstrang-DNA-Flap, wodurch die gewünschte Nukleotidänderung in die Doppelstrang-DNA-Sequenz eingebaut wird.
  • Ausführungsform 288. Das Verfahren der Ausführungsform 287, wobei der Schritt (v) des Ersetzens Folgendes umfasst: (i) Hybridisieren des Einzelstrang-DNA-Flaps an den endogenen DNA-Strang neben der Schnittstelle, um eine Sequenzfehlpaarung zu erzeugen; (ii) Ausschneiden des endogenen DNA-Strangs; und (iii) Reparieren der Fehlpaarung, um das gewünschte Produkt zu bilden, das die gewünschte Nukleotidänderung in beiden DNA-Strängen umfasst.
  • Ausführungsform 289. Das Verfahren der Ausführungsform 288, wobei die gewünschte Nukleotidänderung eine Einzelnukleotidsubstitution, eine Deletion oder eine Insertion ist.
  • Ausführungsform 290. Das Verfahren der Ausführungsform 289, wobei die Einzelnukleotidsubstitution eine Transition oder eine Transversion ist.
  • Ausführungsform 291. Das Verfahren der Ausführungsform 288, wobei die gewünschte Nukleotidänderung (1) eine G-zu-T-Substitution, (2) eine G-zu-A-Substitution, (3) eine G-zu-C-Substitution, (4) eine T-zu-G-Substitution, (5) eine T-zu-A-Substitution, (6) eine T-zu-C-Substitution, (7) eine C-zu-G-Substitution, (8) eine C-zu-T-Substitution, (9) eine C-zu-A-Substitution, (10) eine A-zu-T-Substitution, (11) eine A-zuG-Substitution oder (12) eine A-zu-C-Substitution ist.
  • Ausführungsform 292. Das Verfahren der Ausführungsform 288, wobei die gewünschte Nukleotidänderung (1) ein G:C-Basenpaar in ein T:A-Basenpaar, (2) ein G:C-Basenpaar in ein A:T-Basenpaar, (3) ein G:C-Basenpaar in ein C:G-Basenpaar, (4) ein T:A-Basenpaar in ein G:C-Basenpaar, (5) ein T:A-Basenpaar in ein A:T-Basenpaar, (6) ein T:A-Basenpaar in ein C:G-Basenpaar, (7) ein C:G-Basenpaar in ein G:C-Basenpaar, (8) ein C:G-Basenpaar in ein T:A-Basenpaar, ein C:G-Basenpaar in ein A:T-Basenpaar, (10) ein A:T-Basenpaar in ein T:A-Basenpaar, (11) ein A:T-Basenpaar in ein G:C-Basenpaar oder (12) ein A:T-Basenpaar in ein C:G-Basenpaar umwandelt..
  • Ausführungsform 293. Das Verfahren der Ausführungsform 288, wobei die gewünschte Nukleotidänderung eine Insertion oder Deletion von 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 oder 25 Nukleotiden ist.
  • Ausführungsform 294. Das Verfahren der Ausführungsform 288, wobei die gewünschte Nukleotidänderung ein krankheitsassoziiertes Gen korrigiert.
  • Ausführungsform 295. Das Verfahren der Ausführungsform 294, wobei das krankheitsassoziierte Gen mit einer monogenen Störung assoziiert ist, die aus der Gruppe ausgewählt ist, die aus Adenosindeaminase-Mangel (ADA-Mangel); Alpha-1-Antitrypsin-Mangel; Mukoviszidose; Duchenne-Muskeldystrophie; Galaktosämie; Hämochromatose; Huntington-Krankheit; Ahornsirupkrankheit; Marfan-Syndrom; Neurofibromatose Typ 1; Pachyonychia congenita; Phenylketonurie; schwerem kombiniertem Immundefekt; Sichelzellenanämie; Smith-Lemli-Opitz-Syndrom; einer Trinukleotid-Repeat-Störung; einer Prionenkrankheit; und Tay-Sachs-Krankheit besteht.
  • Ausführungsform 296. Das Verfahren der Ausführungsform 294, wobei das krankheitsassoziierte Gen mit einer polygenen Störung assoziiert ist, die aus der Gruppe ausgewählt ist, die aus Herzkrankheit; Bluthochdruck; Alzheimer-Krankheit; Arthritis; Diabetes; Krebs; und Fettleibigkeit besteht.
  • Ausführungsform 297. Das Verfahren der Ausführungsform 287, wobei das napDNAbp ein Nuklease-totes Cas9 (dCas9), eine Cas9-Nickase (nCas9) oder ein Nuklease-aktives Cas9 ist.
  • Ausführungsform 298. Das Verfahren der Ausführungsform 287, wobei das napDNAbp eine Aminosäuresequenz von SEQ ID NO: 18 oder eine Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % Sequenzidentität mit der Aminosäuresequenz von SEQ ID NO: 18 umfasst.
  • Ausführungsform 299. Das Verfahren der Ausführungsform 287, wobei das napDNAbp eine Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % Sequenzidentität mit der Aminosäuresequenz einer beliebigen von SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467 und 482-487 umfasst.
  • Ausführungsform 300. Das Verfahren der Ausführungsform 287, wobei die Polymerase eine reverse Transkriptase ist, die eine der Aminosäuresequenzen von SEQ ID NO: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741 und 766 umfasst.
  • Ausführungsform 301. Das Verfahren der Ausführungsform 287, wobei die Polymerase eine reverse Transkriptase ist, die eine Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % Sequenzidentität mit der Aminosäuresequenz einer beliebigen von SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741 und 766 umfasst.
  • Ausführungsform 302. Das Verfahren der Ausführungsform 287, wobei die PEgRNA einen Nukleinsäure-Extension-Arm an den 3'- oder 5'-Enden oder an einem intramolekularen Ort in der Guide-RNA umfasst, wobei der Extension-Arm die DNA-Synthese-Template-Sequenz umfasst und die Primer-Bindungsstelle umfasst.
  • Ausführungsform 303. Das Verfahren der Ausführungsform 302, wobei der Extension-Arm mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide, mindestens 15 Nukleotide, mindestens 16 Nukleotide, mindestens 17 Nukleotide, mindestens 18 Nukleotide, mindestens 19 Nukleotide, mindestens 20 Nukleotide, mindestens 21 Nukleotide, mindestens 22 Nukleotide, mindestens 23 Nukleotide, mindestens 24 Nukleotide oder mindestens 25 Nukleotide lang ist.
  • Ausführungsform 304. Das Verfahren der Ausführungsform 287, wobei die PEgRNA eine Nukleotidsequenz aufweist, die aus der Gruppe ausgewählt ist, die aus SEQ ID NOs: 101-104, 181-183, 223-244, 277, 325-334, 336, 338', 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777 besteht.
  • Ausführungsform 305. Ein Verfahren zum Einführen einer oder mehrerer Änderungen in der Nukleotidsequenz eines DNA-Moleküls an einem Target-Locus, umfassend:
  • (i) Inkontaktbringen des DNA-Moleküls mit einem Nukleinsäureprogrammierbaren DNA-Bindungsprotein (napDNAbp) und einer PEgRNA, die das napDNAbp zu dem Target-Locus lenkt, wobei die PEgRNA eine Reverse-Transkriptase(RT)-Template-Sequenz umfasst, die mindestens eine gewünschte Nukleotidänderung und eine Primer-Bindungsstelle umfasst;
  • (ii) Bilden eines freigesetzten 3'-Endes in einem DNA-Strang an dem Target-Locus;
  • (iii) Hybridisieren des freigesetzten 3'-Endes an die Primer-Bindungsstelle, um die reverse Transkription zu primen;
  • (iv) Synthetisieren eines Einzelstrang-DNA-Flaps, der die mindestens eine gewünschte Nukleotidänderung umfasst, basierend auf der RT-Template-Sequenz durch reverse Transkriptase;
  • (v) und Aufnehmen der mindestens einen gewünschten Nukleotidänderung in die entsprechende endogene DNA, wodurch eine oder mehrere Änderungen in die Nukleotidsequenz des DNA-Moleküls an dem Target-Locus eingeführt werden.
  • Ausführungsform 306. Das Verfahren der Ausführungsform 305, wobei die eine oder mehreren Änderungen in der Nukleotidsequenz einen Transition umfassen.
  • Ausführungsform 307. Das Verfahren der Ausführungsform 306, wobei die Transition aus der Gruppe ausgewählt ist, die aus (a) T zu C; (b) A zu G; (c) C zu T; und (d) G zu A besteht.
  • Ausführungsform 308. Das Verfahren der Ausführungsform 305, wobei die eine oder mehreren Änderungen in der Nukleotidsequenz eine Transversion umfassen.
  • Ausführungsform 309. Das Verfahren der Ausführungsform 308, wobei die Transversion aus der Gruppe ausgewählt ist, die aus (a) T zu A; (b) T zu G; (c) C zu G; (d) C zu A; (e) A zu T; (f) A zu C; (g) G zu C; und (h) G zu T besteht.
  • Ausführungsform 310. Das Verfahren der Ausführungsform 305, wobei die eine oder mehreren Änderungen in der Nukleotidsequenz ein Ändern (1) eines G:C-Basenpaars in ein T:A-Basenpaar, (2) eines G:C-Basenpaars in ein A:T-Basenpaar, (3) eines G:C-Basenpaars in ein C:G-Basenpaar, (4) eines T:A-Basenpaars in ein G:C-Basenpaar, (5) eines T:A-Basenpaars in ein A:T-Basenpaar, (6) eines T:A-Basenpaars in ein C:G Basenpaar, (7) eines C:G-Basenpaars in ein G:C Basenpaar, (8) eines C:G Basenpaars in ein T:A Basenpaar, (9) eines C:G-Basenpaars in ein A:T-Basenpaar, (9) eines A:T-Basenpaars in ein T:A-Basenpaar, (11) eines A:T-Basenpaars in ein G:C-Basenpaar oder (12) eines A:T-Basenpaars in ein C:G-Basenpaar umfassen.
  • Ausführungsform 311. Das Verfahren der Ausführungsform 305, wobei die eine oder mehreren Änderungen in der Nukleotidsequenz eine Insertion oder Deletion von 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 oder 25 Nukleotiden umfassen.
  • Ausführungsform 312. Das Verfahren der Ausführungsform 305, wobei die eine oder mehreren Änderungen in der Nukleotidsequenz eine Korrektur an einem krankheitsassoziierten Gen umfassen.
  • Ausführungsform 313. Das Verfahren der Ausführungsform 312, wobei das krankheitsassoziierte Gen mit einer monogenen Störung assoziiert ist, die aus der Gruppe ausgewählt ist, die aus Adenosindeaminase-Mangel (ADA-Mangel); Alpha-1-Antitrypsin-Mangel; Mukoviszidose; Duchenne-Muskeldystrophie; Galaktosämie; Hämochromatose; Huntington-Krankheit; Ahornsirupkrankheit; Marfan-Syndrom; Neurofibromatose Typ 1; Pachyonychia congenita; Phenylketonurie; schwerem kombiniertem Immundefekt; Sichelzellenanämie; Smith-Lemli-Opitz-Syndrom; einer Trinukleotid-Repeat-Störung; einer Prionenkrankheit; und Tay-Sachs-Krankheit besteht.
  • Ausführungsform 314. Das Verfahren der Ausführungsform 312, wobei das krankheitsassoziierte Gen mit einer polygenen Störung assoziiert ist, die aus der Gruppe ausgewählt ist, die aus Herzkrankheit; Bluthochdruck; Alzheimer-Krankheit; Arthritis; Diabetes; Krebs; und Fettleibigkeit besteht.
  • Ausführungsform 315. Das Verfahren der Ausführungsform 305, wobei das napDNAbp ein Nuklease-aktives Cas9 oder eine Variante davon ist.
  • Ausführungsform 316. Das Verfahren der Ausführungsform 305, wobei das napDNAbp ein Nuklease-inaktives Cas9 (dCas9) oder Cas9-Nickase (nCas9) oder eine Variante davon ist.
  • Ausführungsform 317. Das Verfahren der Ausführungsform 305, wobei das napDNAbp eine Aminosäuresequenz von SEQ ID NO: 18 oder eine Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % Sequenzidentität mit SEQ ID NO: 18 umfasst.
  • Ausführungsform 318. Das Verfahren der Ausführungsform 305, wobei das napDNAbp eine Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % Sequenzidentität mit der Aminosäuresequenz einer beliebigen von SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467 und 482-487 umfasst.
  • Ausführungsform 319. Das Verfahren der Ausführungsform 305, wobei die reverse Transkriptase in trans eingeführt wird.
  • Ausführungsform 320. Das Verfahren der Ausführungsform 305, wobei das napDNAbp eine Fusion mit einer reversen Transkriptase umfasst.
  • Ausführungsform 321. Das Verfahren der Ausführungsform 305, wobei die reverse Transkriptase eine beliebige der Aminosäuresequenzen von SEQ ID NO: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741 und 766 umfasst.
  • Ausführungsform 322. Das Verfahren der Ausführungsform 305, wobei die reverse Transkriptase eine Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % Sequenzidentität mit der Aminosäuresequenz einer beliebigen von SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741 und 766 umfasst.
  • Ausführungsform 323. Das Verfahren der Ausführungsform 305, wobei der Schritt des Bildens eines freigesetzten 3'-Endes in dem DNA-Strang an dem Target-Locus ein Nicken des DNA-Strangs mit einer Nuklease umfasst.
  • Ausführungsform 324. Das Verfahren der Ausführungsform 323, wobei die Nuklease in trans bereitgestellt wird.
  • Ausführungsform 325. Das Verfahren der Ausführungsform 305, wobei der Schritt des Bildens eines freigesetzten 3'-Endes in dem DNA-Strang an dem Target-Locus ein Inkontaktbringen des DNA-Strangs mit einem chemischen Mittel umfasst.
  • Ausführungsform 326. Das Verfahren der Ausführungsform 305, wobei der Schritt des Bildens eines freigesetzten 3'-Endes in dem DNA-Strang an dem Target-Locus ein Einführen eines Replikationsfehlers umfasst.
  • Ausführungsform 327. Das Verfahren der Ausführungsform 305, wobei der Schritt des Inkontaktbringens des DNA-Moleküls mit dem napDNAbp und der Guide-RNA eine R-Schleife bildet.
  • Ausführungsform 328. Das Verfahren der Ausführungsform 327, wobei sich der DNA-Strang, in dem das freigesetzte 3'-Ende gebildet wird, in der R-Schleife befindet.
  • Ausführungsform 329. Das Verfahren der Ausführungsform 315, wobei die PEgRNA einen Extension-Arm umfasst, der die Reverse-Transkriptase(RT)-Template-Sequenz und die Primer-Bindungsstelle umfasst.
  • Ausführungsform 330. Das Verfahren der Ausführungsform 329, wobei sich der Extension-Arm an dem 3'-Ende der Guide-RNA, dem 5'-Ende der Guide-RNA oder an einer intramolekularen Position in der Guide-RNA befindet.
  • Ausführungsform 331. Das Verfahren der Ausführungsform 305, wobei die PEgRNA ferner mindestens eine zusätzliche Struktur umfasst, die aus der Gruppe ausgewählt ist, die aus einem Linker, einer Stammschleife, einer Haarnadel, einer Toe-Loop, einem Aptamer oder einer RNA-Protein-Rekrutierungsdomäne besteht.
  • Ausführungsform 332. Das Verfahren der Ausführungsform 305, wobei die PEgRNA ferner einen Homologiearm umfasst.
  • Ausführungsform 333. Das Verfahren der Ausführungsform 305, wobei die RT-Template-Sequenz homolog zu der entsprechenden endogenen DNA ist.
  • Ausführungsform 334. Ein Verfahren zum Einführen einer oder mehrerer Änderungen in der Nukleotidsequenz eines DNA-Moleküls an einem Target-Locus durch Target-geprimte reverse Transkription, wobei das Verfahren Folgendes umfasst: (a) Inkontaktbringen des DNA-Moleküls an dem Target-Locus mit (i) einem Fusionsprotein, das ein Nukleinsäure-programmierbares DNA-Bindungsprotein (napDNAbp) und eine reverse Transkriptase umfasst, und (ii) einer Guide-RNA, die ein RT-Template umfasst, das eine gewünschte Nukleotidänderung umfasst; (b) Ausführen einer Target-geprimten reversen Transkription des RT-Templates, um eine Einzelstrang-DNA zu erzeugen, welche die gewünschte Nukleotidänderung umfasst; und (c) Aufnehmen der gewünschten Nukleotidänderung in das DNA-Molekül an dem Target-Locus durch einen DNA-Reparatur- und/oder -Replikationsprozess.
  • Ausführungsform 335. Das Verfahren der Ausführungsform 334, wobei sich das RT-Template an dem 3'-Ende der Guide-RNA, dem 5'-Ende der Guide-RNA oder an einem intramolekularen Ort in der Guide-RNA befindet.
  • Ausführungsform 336. Das Verfahren der Ausführungsform 334, wobei die gewünschte Nukleotidänderung eine Transition, eine Transversion, eine Insertion oder eine Deletion oder eine beliebige Kombination davon umfasst.
  • Ausführungsform 337. Das Verfahren der Ausführungsform 334, wobei die gewünschte Nukleotidänderung eine Transition umfasst, die aus der Gruppe ausgewählt ist, die aus (a) T zu C; (b) A zu G; (c) C zu T; und (d) G zu A besteht.
  • Ausführungsform 338. Das Verfahren nach Anspruch 334, wobei die gewünschte Nukleotidänderung eine Transversion umfasst, die aus der Gruppe ausgewählt ist, die aus (a) T zu A; (b) T zu G; (c) C zu G; (d) C zu A; (e) A zu T; (f) A zu C; (g) G zu C; und (h) G zu T besteht.
  • Ausführungsform 339. Das Verfahren der Ausführungsform 334, wobei die gewünschte Nukleotidänderung ein Ändern (1) eines G:C-Basenpaars in ein T:A-Basenpaar, (2) eines G:C-Basenpaars in ein A:T-Basenpaar, (3) eines G:C-Basenpaars in ein C:G-Basenpaar, (4) eines T:A-Basenpaars in ein G:C-Basenpaar, (5) eines T:A-Basenpaars in ein A:T-Basenpaar, (6) eines T:A-Basenpaars in ein C:G-Basenpaar, (7) eines C:G-Basenpaars in ein G:C-Basenpaar, (8) eines C:G-Basenpaars in ein T:A-Basenpaar, (9) eines C:G-Basenpaars in ein A:T-Basenpaar, (10) eines A:T-Basenpaars in ein T:A-Basenpaar, (11) eines A:T-Basenpaas in ein G:C-Basenpaar oder (12) eines A:T-Basenpaars in ein C:G-Basenpaar umfasst.
  • Ausführungsform 340. Ein Polynukleotid, das für die PEgRNA einer beliebigen der Ausführungsformen 243-259 codiert.
  • Ausführungsform 341. Ein Vektor, umfassend das Polynukleotid der Ausführungsform 340.
  • Ausführungsform 342. Eine Zelle, umfassend den Vektor der Ausführungsform 341.
  • Ausführungsform 343. Das Fusionsprotein der Ausführungsform 213, wobei die Polymerase eine fehleranfällige reverse Transkriptase ist.
  • Ausführungsform 344. Ein Verfahren zum Mutagenisieren eines DNA-Moleküls an einem Target-Locus durch Target-geprimte reverse Transkription, wobei das Verfahren Folgendes umfasst: (a) Inkontaktbringen des DNA-Moleküls an dem Target-Locus mit (i) einem Fusionsprotein, das ein Nukleinsäure-programmierbares DNA-Bindungsprotein (napDNAbp) und eine fehleranfällige reverse Transkriptase umfasst, und (ii) einer Guide-RNA, die ein RT-Template umfasst, das eine gewünschte Nukleotidänderung umfasst; (b) Ausführen einer Target-geprimten reversen Transkription des RT-Templates, um eine mutagenisierte Einzelstrang-DNA zu erzeugen; und (c) Aufnehmen der mutagenisierten Einzelstrang-DNA in das DNA-Molekül an dem Target-Locus durch einen DNA-Reparatur- und/oder -Replikationsprozess.
  • Ausführungsform 345. Das Verfahren einer beliebigen vorhergehenden Ausführungsform, wobei das Fusionsprotein die Aminosäuresequenz von PE1, PE2 oder PE3 umfasst.
  • Ausführungsform 346. Das Verfahren einer beliebigen vorhergehenden Ausführungsform, wobei das napDNAbp eine Cas9-Nickase (nCas9) ist.
  • Ausführungsform 347. Das Verfahren der Ausführungsform 344, wobei das napDNAbp die Aminosäuresequenz von SEQ ID NOs: 18-25 umfasst.
  • Ausführungsform 348. Das Verfahren der Ausführungsform 344, wobei die Guide-RNA SEQ ID NOs: 222 umfasst.
  • Ausführungsform 349. Das Verfahren der Ausführungsform 344, wobei der Schritt (b) des Ausführens einer Target-geprimten reversen Transkription ein Erzeugen einer 3'-Ende-Primer-Bindungssequenz an dem Target-Locus umfasst, die in der Lage ist, die reverse Transkription durch Annealing an eine Primer-Bindungsstelle auf der Guide-RNA zu primen.
  • Ausführungsform 350. Ein Verfahren zum Ersetzen einer Trinukleotid-Repeat-Expansionsmutation in einem Target-DNA-Molekül durch eine gesunde Sequenz, die eine gesunde Anzahl von Repeat-Trinukleotiden umfasst, wobei das Verfahren Folgendes umfasst: (a) Inkontaktbringen des DNA-Moleküls an dem Target-Locus mit (i) einem Fusionsprotein, das ein Nukleinsäure-programmierbares DNA-Bindungsprotein (napDNAbp) und eine Polymerase umfasst, und (ii) einer PEgRNA, die ein DNA-Synthese-Template umfasst, das die Ersatzsequenz und eine Primer-Bindungsstelle umfasst; (b) Ausführen von Prime-Editing, um eine Einzelstrang-DNA zu erzeugen, welche die Ersatzsequenz umfasst; und (c) Aufnehmen der Einzelstrang-DNA in das DNA-Molekül an dem Target-Locus durch einen DNA-Reparatur- und/oder - Replikationsprozess.
  • Ausführungsform 351. Das Verfahren der Ausführungsform 350, wobei das Fusionsprotein die Aminosäuresequenz von PE1, PE2 oder PE3 umfasst.
  • Ausführungsform 352. Das Verfahren der Ausführungsform 350, wobei das napDNAbp eine Cas9-Nickase (nCas9) ist.
  • Ausführungsform 353. Das Verfahren der Ausführungsform 350, wobei das napDNAbp die Aminosäuresequenz von SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467 und 482-487 umfasst.
  • Ausführungsform 354. Das Verfahren der Ausführungsform 350, wobei die Guide-RNA SEQ ID NOs: 222 umfasst.
  • Ausführungsform 355. Das Verfahren der Ausführungsform 350, wobei der Schritt (b) des Ausführens von Prime Editing ein Erzeugen einer 3'-Ende-Primer-Bindungssequenz an dem Target-Locus umfasst, die in der Lage ist, Polymerase durch Annealing an die Primer-Bindungsstelle auf der Guide-RNA zu primen.
  • Ausführungsform 356. Das Verfahren der Ausführungsform 350, wobei die Trinukleotid-Repeat-Expansionsmutation mit Huntington-Krankheit, Fragile-X-Syndrom oder Friedreich-Ataxie assoziiert ist.
  • Ausführungsform 357. Das Verfahren der Ausführungsform 350, wobei die Trinukleotid-Repeat-Expansionsmutation eine Repeat-Einheit von CAG-Tripletts umfasst.
  • Ausführungsform 358. Das Verfahren der Ausführungsform 350, wobei die Trinukleotid-Repeat-Expansionsmutation eine Repeat-Einheit von GAA-Tripletts umfasst.
  • Ausführungsform 359. Ein Verfahren zum Einbauen einer funktionellen Gruppierung in ein interessierendes Protein, für das von einer Target-Nukleotidsequenz codiert wird, durch Prime Editing, wobei das Verfahren Folgendes umfasst: (a) Inkontaktbringen der Target-Nukleotidsequenz mit (i) einem Prime Editor, der ein Nukleinsäure-programmierbares DNA-Bindungsprotein (napDNAbp) und eine Polymerase umfasst, und (ii) einer PEgRNA, die ein DNA-Synthese-Template umfasst, das für die funktionelle Gruppierung codiert; (b) Polymerisieren einer Einzelstrang-DNA-Sequenz, die für die funktionelle Gruppierung codiert; und (c) Aufnehmen der Einzelstrang-DNA-Sequenz anstelle eines entsprechenden endogenen Strangs in die Target-Nukleotidsequenz durch einen DNA-Reparatur- und/oder Replikationsprozess, wobei das Verfahren eine rekombinante Target-Nukleotidsequenz erzeugt, die ein Fusionsprotein codiert, welches das interessierende Protein und die funktionelle Gruppierung umfasst.
  • Ausführungsform 360. Das Verfahren der Ausführungsform 359, wobei die funktionelle Gruppierung ein Peptid-Tag ist.
  • Ausführungsform 361. Das Verfahren der Ausführungsform 360, wobei das Peptid-Tag ein Affinitätstags-Tag, ein Solubilisierungs-Tag, ein Chromatografie-Tag, ein Epitop- oder Immunepitop-Tag oder ein Fluoreszenz-Tag ist.
  • Ausführungsform 362. Das Verfahren der Ausführungsform 360, wobei das Peptid-Tag aus der Gruppe ausgewählt ist, die aus AviTag (SEQ ID NO: 245); C-Tag (SEQ ID NO: 246); Calmodulin-Tag (SEQ ID NO: 247); Polyglutamat-Tag (SEQ ID NO: 248); E-Tag (SEQ ID NO: 249); FLAG-Tag (SEQ ID NO: 2); HA-Tag (SEQ ID NO: 5); His-Tag (SEQ ID NOs: 252-262); Myc-Tag (SEQ ID NO: 6); NE-Tag (SEQ ID NO: 264); Rho1D4-Tag (SEQ ID NO: 265); S-Tag (SEQ ID NO: 266); SBP-Tag (SEQ ID NO: 267); Softag-1 (SEQ ID NO: 268); Softag-2 (SEQ ID NO: 269); Spot-Tag (SEQ ID NO: 270); Strep-Tag (SEQ ID NO: 271); TC-Tag (SEQ ID NO: 272); Ty-Tag (SEQ ID NO: 273); V5-Tag (SEQ ID NO: 3); VSV-Tag (SEQ ID NO: 275); und Xpress-Tag (SEQ ID NO: 276) besteht.
  • Ausführungsform 363. Das Verfahren der Ausführungsform 360, wobei das Peptid-Tag aus der Gruppe ausgewählt ist, die aus AU1-Epitop (SEQ ID NO: 278); AU5-Epitop (SEQ ID NO: 279); Bakteriophagen-T7-Epitop (T7-Tag) (SEQ ID NO: 280); Blauzungenvirus-Tag (B-Tag) (SEQ ID NO: 281); E2-Epitop (SEQ ID NO: 282); Histidin-Affinitäts-Tag (HAT) (SEQ ID NO: 283); HSV-Epitop (SEQ ID NO: 284); Polyarginin (Arg-Tag) (SEQ ID NO: 285); Polyaspartat (Asp-Tag) (SEQ ID NO: 286); Polyphenylalanin (Phe-Tag) (SEQ ID NO: 287); S1-Tag (SEQ ID NO: 288); S-Tag (SEQ ID NO: 266); und VSV-G (SEQ ID NO: 275) besteht.
  • Ausführungsform 364. Das Verfahren der Ausführungsform 359, wobei die funktionelle Gruppierung ein Immunepitop ist.
  • Ausführungsform 365. Das Verfahren der Ausführungsform 364, wobei das Immunepitop aus der Gruppe ausgewählt ist, die aus Tetanustoxoid (SEQ ID NO: 396); Diphtherie-Toxin-Mutante CRM197 (SEQ ID NO: 630); Mumps-Immunepitop 1 (SEQ ID NO: 400); Mumps-Immunepitop 2 (SEQ ID NO: 402); Mumps-Immunepitop 3 (SEQ ID NO: 404); Rötelnvirus (SEQ ID NO: 406); Hämagglutinin (SEQ ID NO: 408); Neuraminidase (SEQ ID NO: 410); TAP1 (SEQ ID NO: 412); TAP2 (SEQ ID NO: 414); Hämagglutinin-Epitope für HLA der Klasse I (SEQ ID NO: 416); Neuraminidase-Epitope für HLA der Klasse I (SEQ ID NO: 418); Hämagglutinin-Epitope für HLA der Klasse II (SEQ ID NO: 420); Neuraminidase-Epitope für HLA der Klasse II (SEQ ID NO: 422); Hämagglutinin-Epitop H5N1-gebundenem HLA der Klasse I und Klasse II (SEQ ID NO: 424); und Neuraminidase-Epitop H5N1-gebundenem HLA der Klasse I und Klasse II (SEQ ID NO: 426) besteht.
  • Ausführungsform 366. Das Verfahren der Ausführungsform 359, wobei die funktionelle Gruppierung die Lokalisierung des interessierenden Proteins ändert.
  • Ausführungsform 367. Das Verfahren der Ausführungsform 359, wobei die funktionelle Gruppierung ein Abbau-Tag ist, so dass die Abbaurate des interessierenden Proteins geändert wird.
  • Ausführungsform 368. Das Verfahren der Ausführungsform 367, wobei das Abbau-Tag zur Eliminierung des getaggten Proteins führt.
  • Ausführungsform 369. Das Verfahren der Ausführungsform 359, wobei die funktionelle Gruppierung eine Kleinmolekül-Bindungsdomäne ist.
  • Ausführungsform 370. Das Verfahren der Ausführungsform 359, wobei die Kleinmolekül-Bindungsdomäne FKBP12 von SEQ ID NO: 488 ist.
  • Ausführungsform 371. Das Verfahren der Ausführungsform 359, wobei die Kleinmolekül-Bindungsdomäne FKBP12-F36V von SEQ ID NO: 489 ist.
  • Ausführungsform 372. Das Verfahren der Ausführungsform 359, wobei die Kleinmolekül-Bindungsdomäne Cyclophilin der SEQ ID NOs: 490 und 493-494 ist.
  • Ausführungsform 373. Das Verfahren der Ausführungsform 359, wobei die Kleinmolekül-Bindungsdomäne in zwei oder mehr interessierende Proteine eingebaut wird.
  • Ausführungsform 374. Das Verfahren der Ausführungsform 373, wobei die zwei oder mehr interessierenden Proteine bei Kontakt mit einem kleinen Molekül dimerisieren können.
  • Ausführungsform 375. Das Verfahren der Ausführungsform 369, wobei das kleine Molekül ein Dimer eines kleinen Moleküls ist, die aus der Gruppe ausgewählt ist, die aus den in Ausführungsform 163 von Gruppe 1 offenbarten Verbindungen besteht.
  • Ausführungsform 376. Ein Verfahren zum Einbauen eines Immunepitops in ein interessierendes Protein, für das von einer Target-Nukleotidsequenz codiert wird, durch Prime Editing, wobei das Verfahren Folgendes umfasst: (a) Inkontaktbringen der Target-Nukleotidsequenz mit (i) einem Prime Editor, der ein Nukleinsäure-programmierbares DNA-Bindungsprotein (napDNAbp) und eine Polymerase umfasst, und (ii) einer PEgRNA, die ein Edit-Template umfasst, das für die funktionelle Gruppierung codiert; (b) Polymerisieren einer Einzelstrang-DNA-Sequenz, die für das Immunepitop codiert; und (c) Aufnehmen der Einzelstrang-DNA-Sequenz anstelle eines entsprechenden endogenen Strangs in die Target-Nukleotidsequenz durch einen DNA-Reparatur- und/oder -Replikationsprozess, wobei das Verfahren eine rekombinante Target-Nukleotidsequenz erzeugt, die für ein Fusionsprotein codiert, welches das interessierende Protein und das Immunepitop umfasst.
  • Ausführungsform 377. Das Verfahren der Ausführungsform 376, wobei das Immunepitop aus der Gruppe ausgewählt ist, die aus Tetanustoxoid (SEQ ID NO: 396); Diphtherie-Toxin-Mutante CRM197 (SEQ ID NO: 630); Mumps-Immunepitop 1 (SEQ ID NO: 400); Mumps-Immunepitop 2 (SEQ ID NO: 402); Mumps-Immunepitop 3 (SEQ ID NO: 404); Rötelnvirus (SEQ ID NO: 406); Hämagglutinin (SEQ ID NO: 408); Neuraminidase (SEQ ID NO: 410); TAP1 (SEQ ID NO: 412); TAP2 (SEQ ID NO: 414); Hämagglutinin-Epitope für HLA der Klasse I (SEQ ID NO: 416); Neuraminidase-Epitope für HLA der Klasse I (SEQ ID NO: 418); Hämagglutinin-Epitope für HLA der Klasse II (SEQ ID NO: 420); Neuraminidase-Epitope für HLA der Klasse II (SEQ ID NO: 422); Hämagglutinin-Epitop H5N1-gebundenem HLA der Klasse I und Klasse II (SEQ ID NO: 424); und Neuraminidase-Epitop H5N1-gebundenem HLA der Klasse I und Klasse II (SEQ ID NO: 426) besteht.
  • Ausführungsform 378. Das Verfahren der Ausführungsform 376, wobei das Fusionsprotein die Aminosäuresequenz von PE1, PE2 oder PE3 umfasst.
  • Ausführungsform 379. Das Verfahren der Ausführungsform 376, wobei das napDNAbp eine Cas9-Nickase (nCas9) ist.
  • Ausführungsform 380. Das Verfahren der Ausführungsform 376, wobei das napDNAbp die Aminosäuresequenz von SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467 und 482-487 umfasst.
  • Ausführungsform 381. Das Verfahren der Ausführungsform 376, wobei die PEgRNA SEQ ID NOs: 101-104, 181-183, 223-244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777 umfasst.
  • Ausführungsform 382. Ein Verfahren zum Einbauen einer Kleinmolekül-Dimerisierungsdomäne in ein interessierendes Protein, für das von einer Target-Nukleotidsequenz codiert wird, durch Prime-Editing, wobei das Verfahren Folgendes umfasst: (a) Inkontaktbringen der Target-Nukleotidsequenz mit (i) einem Prime Editor, der ein Nukleinsäure-programmierbares DNA-Bindungsprotein (napDNAbp) und eine Polymerase umfasst, und (ii) einer PEgRNA, die ein Edit-Template umfasst, das für die Kleinmolekül-Dimerisierungsdomäne codiert; (b) Polymerisieren einer Einzelstrang-DNA-Sequenz, die für das Immunepitop codiert; und (c) Aufnehmen der Einzelstrang-DNA-Sequenz anstelle eines entsprechenden endogenen Strangs in die Target-Nukleotidsequenz durch einen DNA-Reparatur- und/oder Replikationsprozess, wobei das Verfahren eine rekombinante Target-Nukleotidsequenz erzeugt, die für ein Fusionsprotein codiert, welches das interessierende Protein und die Kleinmolekül-Dimerisierungsdomäne umfasst.
  • Ausführungsform 383. Das Verfahren der Ausführungsform 382, ferner umfassend ein Ausführen des Verfahrens an einem zweiten interessierenden Protein.
  • Ausführungsform 384. Das Verfahren der Ausführungsform 383, wobei das erste interessierende Protein und das zweite interessierende Protein in Gegenwart eines kleinen Moleküls dimerisieren, das an die Dimerisierungsdomäne auf jedem der Proteine bindet.
  • Ausführungsform 385. Das Verfahren der Ausführungsform 382, wobei die Kleinmolekül-Bindungsdomäne FKBP12 von SEQ ID NO: 488 ist.
  • Ausführungsform 386. Das Verfahren der Ausführungsform 382, wobei die Kleinmolekül-Bindungsdomäne FKBP12-F36V von SEQ ID NO: 489 ist.
  • Ausführungsform 387. Das Verfahren der Ausführungsform 382, wobei die Kleinmolekül-Bindungsdomäne Cyclophilin der SEQ ID NOs: 490 und 493-494 ist.
  • Ausführungsform 388. Das Verfahren der Ausführungsform 382, wobei das kleine Molekül ein Dimer eines kleinen Moleküls ist, das aus der Gruppe ausgewählt ist, die aus den in Ausführungsform 163 von Gruppe 1 offenbarten Verbindungen besteht.
  • Ausführungsform 389. Das Verfahren der Ausführungsform 382, wobei das Fusionsprotein die Aminosäuresequenz von PE1, PE2 oder PE3 umfasst.
  • Ausführungsform 390. Das Verfahren der Ausführungsform 382, wobei das napDNAbp eine Cas9-Nickase (nCas9) ist.
  • Ausführungsform 391. Das Verfahren der Ausführungsform 382, wobei das napDNAbp die Aminosäuresequenz von SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467 und 482-487 umfasst.
  • Ausführungsform 392. Das Verfahren der Ausführungsform 382, wobei die PEgRNA SEQ ID NOs: 101-104, 181-183, 223-244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777 umfasst.
  • Ausführungsform 393. Ein Verfahren zum Einbauen eines Peptid-Tags oder Epitops auf ein Protein unter Verwendung von Prime Editing, umfassend: Inkontaktbringen einer Target-Nukleotidsequenz, die für das Protein codiert, mit einem Prime Editor-Konstrukt, das konfiguriert ist, um darin eine zweite Nukleotidsequenz zu inserieren, die für das Peptid-Tag codiert, um zu einer rekombinanten Nukleotidsequenz zu führen, so dass das Peptid-Tag und das Protein von der rekombinanten Nukleotidsequenz als Fusionsprotein exprimiert werden.
  • Ausführungsform 394. Das Verfahren der Ausführungsform 383, wobei das Peptid-Tag zur Reinigung und/oder Detektion des Proteins verwendet wird.
  • Ausführungsform 395. Das Verfahren der Ausführungsform 383, wobei das Peptid-Tag ein Polyhistidin (z.B. HHHHHH) (SEQ ID NO: 252-262), FLAG (z.B. DYKDDDDK) (SEQ ID NO: 2), V5 (z.B. GKPIPNPLLGLDST) (SEQ ID NO: 3), GCN4, HA (z.B. YPYDVPDYA) (SEQ ID NO: 5), Myc (z.B. EQKLISEED) (SEQ ID NO: 6) oder GST ist.
  • Ausführungsform 396. Das Verfahren der Ausführungsform 383, wobei das Peptid-Tag eine Aminosäuresequenz aufweist, die aus der Gruppe ausgewählt ist, die aus SEQ ID NO: 1-6, 245-249, 252-262, 264-273, 275-276, 281, 278-288 und 622 besteht.
  • Ausführungsform 397. Das Verfahren der Ausführungsform 383, wobei das Peptid-Tag durch einen Linker mit dem Protein fusioniert ist.
  • Ausführungsform 398. Das Verfahren der Ausführungsform 383, wobei das Fusionsprotein die folgende Struktur aufweist: [Protein]-[Peptid-Tag] oder [Peptid-Tag]-[Protein], wobei „]-[“ einen optionalen Linker darstellt.
  • Ausführungsform 399. Das Verfahren der Ausführungsform 383, wobei der Linker eine Aminosäuresequenz von SEQ ID NO: 127, 165-176, 446, 453 und 767-769 aufweist.
  • Ausführungsform 400. Das Verfahren der Ausführungsform 383, wobei das Prime Editor-Konstrukt eine PEgRNA umfasst, welche die Nukleotidsequenz von SEQ ID NOs: 101-104, 181-183, 223-244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777 umfasst.
  • Ausführungsform 401. Das Verfahren der Ausführungsform 383, wobei die PEgRNA einen Spacer, einen gRNA-Kern und einen Extension-Arm umfasst, wobei der Spacer komplementär zur Target-Nukleotidsequenz ist und der Extension-Arm ein Reverse-Transkriptase-Template umfasst, das für das Peptid-Tag codiert.
  • Ausführungsform 402. Das Verfahren der Ausführungsform 383, wobei die PEgRNA einen Spacer, einen gRNA-Kern und einen Extensionsarm umfasst, wobei der Spacer komplementär zur Target-Nukleotidsequenz ist und der Extension-Arm ein Reverse-Transkriptase-Template umfasst, das für das Peptid-Tag codiert.
  • Ausführungsform 403. Ein Verfahren zum Verhindern oder Anhalten des Fortschreitens einer Prionenkrankheit durch Einbauen einer oder mehrerer schützender Mutationen in PRNP, für das von einer Target-Nukleotidsequenz codiert wird, durch Prime Editing, wobei das Verfahren Folgendes umfasst: (a) Inkontaktbringen der Target-Nukleotidsequenz mit (i) einem Prime Editor, der ein Nukleinsäure-programmierbares DNA-Bindungsprotein (napDNAbp) und eine Polymerase umfasst, und (ii) einer PEgRNA, die ein Edit-Template umfasst, das für die funktionelle Gruppierung codiert; (b) Polymerisieren einer Einzelstrang-DNA-Sequenz, die für die schützende Mutation codiert; und (c) Aufnehmen der Einzelstrang-DNA-Sequenz anstelle eines entsprechenden endogenen Strangs in die Target-Nukleotidsequenz durch einen DNA-Reparatur- und/oder -Replikationsprozess, wobei das Verfahren eine rekombinante Target-Nukleotidsequenz erzeugt, die für ein PRNP codiert, das eine schützende Mutation umfasst und gegen Fehlfaltung resistent ist.
  • Ausführungsform 404. Verfahren der Ausführungsform 403, wobei die Prionenkrankheit eine Prionenkrankheit des Menschen ist
  • Ausführungsform 405. Das Verfahren der Ausführungsform 403, wobei die Prionenkrankheit eine Tierprionenkrankheit ist.
  • Ausführungsform 406. Das Verfahren der Ausführungsform 404, wobei die Prionenkrankheit Creutzfeldt-Jakob-Krankheit (CJK), variante Creutzfeldt-Jakob-Krankheit (vCJK), Gerstmann-Straussler-Scheinker-Syndrom, letale familiäre Insomnie oder Kuru ist.
  • Ausführungsform 407. Das Verfahren der Ausführungsform 403, wobei die Prionenkrankheit spongiforme Enzephalopathie bei Rindern (BSE oder „Rinderwahnsinn“), chronische Auszehrkrankheit (CWD), Scrapie, übertragbare Enzephalopathie bei Nerzen, spongiforme Enzephalopathie bei Katzen und spongiforme Enzephalopathie bei Huftieren ist.
  • Ausführungsform 408. Das Verfahren der Ausführungsform 403, wobei die Wildtyp-PRNP-Aminosäuresequenz SEQ ID NOs: 291-292 ist.
  • Ausführungsform 409. Das Verfahren der Ausführungsform 403, wobei das Verfahren zu einer modifizierten PRNP-Aminosäuresequenz führt, die aus der Gruppe ausgewählt ist, die aus SEQ ID NOs: 293-309, 311-323 besteht, wobei das modifizierte PRNP-Protein resistent gegen Fehlfaltung ist.
  • Ausführungsform 410. Das Verfahren der Ausführungsform 403, wobei das Fusionsprotein die Aminosäuresequenz von PE1, PE2 oder PE3 umfasst.
  • Ausführungsform 411. Das Verfahren der Ausführungsform 403, wobei das napDNAbp eine Cas9-Nickase (nCas9) ist.
  • Ausführungsform 412. Das Verfahren der Ausführungsform 403, wobei das napDNAbp die Aminosäuresequenz von SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467 und 482-487 umfasst.
  • Ausführungsform 413. Das Verfahren der Ausführungsform 403, wobei die PEgRNA SEQ ID NOs: 101-104, 181-183, 223-244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777 umfasst.
  • Ausführungsform 414. Ein Verfahren zum Einbauen eines Ribonukleotid-Motivs oder -Tags in eine interessierende RNA, für die von einer Target-Nukleotidsequenz codiert wird, durch Prime Editing, wobei das Verfahren Folgendes umfasst: (a) Inkontaktbringen der Target-Nukleotidsequenz mit (i) einem Prime Editor, der ein Nukleinsäure-programmierbares DNA-Bindungsprotein (napDNAbp) und eine Polymerase umfasst, und (ii) einer PEgRNA, die ein Edit-Template umfasst, das für das Ribonukleotid-Motiv oder -Tag codiert; (b) Polymerisieren einer Einzelstrang-DNA-Sequenz, die für das Ribonukleotid-Motiv oder -Tag codiert; und (c) Einbauen der Einzelstrang-DNA-Sequenz anstelle eines entsprechenden endogenen Strangs in die Target-Nukleotidsequenz durch einen DNA-Reparatur- und/oder -Replikationsprozess, wobei das Verfahren eine rekombinante Target-Nukleotidsequenz erzeugt, die für eine modifizierte interessierende RNA codiert, die das Ribonukleotid-Motiv oder -Tag umfasst.
  • Ausführungsform 415. Das Verfahren der Ausführungsform 414, wobei das Ribonukleotid-Motiv oder -Tag eine Detektionsgruppierung ist.
  • Ausführungsform 416. Das Verfahren der Ausführungsform 414, wobei das Ribonukleotid-Motiv oder -Tag das Expressionsniveau der interessierenden RNA beeinflusst.
  • Ausführungsform 417. Das Verfahren der Ausführungsform 414, wobei das Ribonukleotid-Motiv oder -Tag den Transport oder den subzellulären Ort der interessierenden RNA beeinflusst.
  • Ausführungsform 418. Das Verfahren der Ausführungsform 414, wobei das Ribonukleotid-Motiv oder -Tag aus der Gruppe ausgewählt ist, die aus SV40 Typ 1, SV40 Typ 2, SV40 Typ 3, hGH, BGH, rbGlob, TK, MALAT1 ENE-mascRNA, KSHV PAN ENE, Smbox/U1 snRNA-Box, U1 snRNA 3'-Box, tRNA-Lysin, Brokkoli-Aptamer, Spinat-Aptamer, Mango-Aptamer, HDV-Ribozym und m6A besteht.
  • Ausführungsform 419. Das Verfahren der Ausführungsform 414, wobei die PEgRNA SEQ ID NOs: 101-104, 181-183, 223-244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777 umfasst.
  • Ausführungsform 420. Das Verfahren der Ausführungsform 414, wobei das Fusionsprotein die Aminosäuresequenz von PE1, PE2 oder PE3 umfasst.
  • Ausführungsform 421. Das Verfahren der Ausführungsform 414, wobei das napDNAbp eine Cas9-Nickase (nCas9) ist.
  • Ausführungsform 422. Das Verfahren der Ausführungsform 414, wobei das napDNAbp die Aminosäuresequenz von SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467 und 482-487 umfasst.
  • Ausführungsform 423. Ein Verfahren zum Einbauen oder Deletieren einer funktionellen Gruppierung in einem interessierenden Protein, für das von einer Target-Nukleotidsequenz codiert wird, durch Prime-Editing, wobei das Verfahren Folgendes umfasst: (a) Inkontaktbringen der Target-Nukleotidsequenz mit (i) einem Prime Editor, der ein Nukleinsäure-programmierbares DNA-Bindungsprotein (napDNAbp) und eine Polymerase umfasst, und (ii) einer PEgRNA, die ein Edit-Template umfasst, das für die funktionelle Gruppierung oder Deletion derselben codiert; (b) Polymerisieren einer Einzelstrang-DNA-Sequenz, die für die funktionelle Gruppierung oder Deletion derselben codiert; und (c) Aufnehmen der Einzelstrang-DNA-Sequenz anstelle eines entsprechenden endogenen Strangs in die Target-Nukleotidsequenz durch einen DNA-Reparatur- und/oder -Replikationsprozess, wobei das Verfahren eine rekombinante Target-Nukleotidsequenz erzeugt, die für ein modifiziertes Protein codiert, welches das interessierende Protein und die funktionelle Gruppierung oder die Entfernung derselben umfasst, wobei die funktionelle Gruppierung einen Modifikationszustand oder Lokalisierungszustand des Proteins ändert.
  • Ausführungsform 424. Das Verfahren der Ausführungsform 423, wobei eine funktionelle Gruppierung den Phosphorylierungs-, Ubiquitylierungs-, Glykosylierungs-, Lipidierungs-, Hydroxylierungs-, Methylierungs-, Acetylierungs-, Crotonylierungs-, SUMOylierungszustand des interessierenden Proteins ändert.
  • Ausführungsform 425. Ein Fusionsprotein, umfassend eine Domäne eines Nukleinsäure-programmierbaren DNA-Bindungsproteins (napDNAbp-Domäne) und eine Domäne, die eine RNA-abhängige DNA-Polymeraseaktivität umfasst.
  • Ausführungsform 426. Das Fusionsprotein der Ausführungsform 425, wobei das Fusionsprotein in der Lage ist, ein Prime Editing in Gegenwart einer Prime Editing-Guide-RNA (PEgRNA) auszuführen, um eine gewünschte Nukleotidänderung in eine Target-Sequenz einzubauen.
  • Ausführungsform 427. Das Fusionsprotein der Ausführungsform 425, wobei die napDNAbp-Domäne eine Nickase-Aktivität aufweist.
  • Ausführungsform 428. Das Fusionsprotein der Ausführungsform 425, wobei die napDNAbp-Domäne ein Cas9-Protein oder eine Variante davon ist.
  • Ausführungsform 429. Das Fusionsprotein der Ausführungsform 425, wobei die napDNAbp-Domäne ein Nuklease-aktives Cas9, ein Nuklease-inaktives Cas9 (dCas9) oder eine Cas9-Nickase (nCas9) ist.
  • Ausführungsform 430. Das Fusionsprotein der Ausführungsform 425, wobei die napDNAbp-Domäne Cas9-Nickase (nCas9) ist.
  • Ausführungsform 431. Das Fusionsprotein der Ausführungsform 425, wobei die napDNAbp-Domäne aus der Gruppe ausgewählt ist, die aus Cas9, Cas12e, Cas12d, Cas12a, Cas12b1, Cas13a, Cas12c und Argonaute besteht, und optional eine Nickase-Aktivität aufweist.
  • Ausführungsform 432. Das Fusionsprotein der Ausführungsform 425, wobei die Domäne, die eine RNA-abhängige DNA-Polymeraseaktivität umfasst, eine reverse Transkriptase ist, die eine beliebige der Aminosäuresequenzen von SEQ ID NO: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741 und 766 umfasst.
  • Ausführungsform 433. Das Fusionsprotein der Ausführungsform 425, wobei die Domäne, die eine RNA-abhängige DNA-Polymeraseaktivität umfasst, eine reverse Transkriptase ist, die eine Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % Sequenzidentität mit der Aminosäuresequenz einer beliebigen von SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741 und 766 umfasst, und wobei optional die Domäne, die eine RNA-abhängige DNA-Polymerase umfasst, fehleranfällig ist.
  • Ausführungsform 434. Das Fusionsprotein der Ausführungsform 425, wobei die Domäne, die eine RNA-abhängige DNA-Polymeraseaktivität umfasst, eine natürlich vorkommende reverse Transkriptase aus einem Retrovirus oder einem Retrotransposon ist.
  • Ausführungsform 435. Das Fusionsprotein der Ausführungsform 425, wobei das Fusionsprotein, wenn es mit einer PEgRNA komplexiert ist, in der Lage ist, an eine Target-DNA-Sequenz zu binden.
  • Ausführungsform 436. Das Fusionsprotein der Ausführungsform 435, wobei die Target-DNA-Sequenz einen Target-Strang und einen komplementären Nicht-Target-Strang umfasst.
  • Ausführungsform 437. Das Fusionsprotein der Ausführungsform 435, wobei die Bindung des mit der PEgRNA komplexierten Fusionsproteins eine R-Schleife bildet.
  • Ausführungsform 438. Das Fusionsprotein der Ausführungsform 437, wobei die R-Schleife (i) ein RNA-DNA-Hybrid, das die PEgRNA und den Target-Strang umfasst, und (ii) den komplementären Nicht-Target-Strang umfasst.
  • Ausführungsform 439. Das Fusionsprotein der Ausführungsform 437, wobei der Target- oder der komplementäre Nicht-Target-Strang genickt ist, um eine Priming-Sequenz mit einem freien 3'-Ende zu bilden.
  • Ausführungsform 440. Das Fusionsprotein der Ausführungsform 439, wobei sich die Nick-Stelle stromaufwärts der PAM-Sequenz auf dem Target-Strang befindet.
  • Ausführungsform 441. Das Fusionsprotein der Ausführungsform 439, wobei sich die Nick-Stelle stromaufwärts der PAM-Sequenz auf dem Nicht-Target-Strang befindet.
  • Ausführungsform 442. Das Fusionsprotein der Ausführungsform 439, wobei die Nick-Stelle -1, -2, -3, -4, -5, -6, -7, -8 oder -9 relativ zum 5'-Ende der PAM-Sequenz.
  • Ausführungsform 443. Das Fusionsprotein der Ausführungsform 426, wobei die PEgRNA eine Guide-RNA und mindestens einen Nukleinsäure-Extension-Arm umfasst.
  • Ausführungsform 444. Das Fusionsprotein der Ausführungsform 443, wobei sich der Extension-Arm am 5'- oder 3'-Ende der Guide-RNA oder an einem intramolekularen Ort in der Guide-RNA befindet.
  • Ausführungsform 445. Das Fusionsprotein der Ausführungsform 443, wobei der Extension-Arm (i) eine DNA-Synthese-Template-Sequenz, die eine gewünschte Nukleotidänderung umfasst, und (ii) eine Primer-Bindungsstelle umfasst.
  • Ausführungsform 446. Das Fusionsprotein der Ausführungsform 445, wobei die DNA-Synthese-Template-Sequenz für einen Einzelstrang-DNA-Flap codiert, der komplementär zu einer endogenen DNA-Sequenz neben der Nick-Stelle ist, wobei der Einzelstrang-DNA-Flap die gewünschte Nukleotidänderung umfasst.
  • Ausführungsform 447. Das Fusionsprotein der Ausführungsform 443, wobei der Extension-Arm mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide, mindestens 15 Nukleotide, mindestens 16 Nukleotide, mindestens 17 Nukleotide, mindestens 18 Nukleotide, mindestens 19 Nukleotide, mindestens 20 Nukleotide, mindestens 21 Nukleotide, mindestens 22 Nukleotide, mindestens 23 Nukleotide, mindestens 24 Nukleotide, mindestens 25 Nukleotide, mindestens 26 Nukleotide, mindestens 27 Nukleotide, mindestens 28 Nukleotide, mindestens 29 Nukleotide, mindestens 30 Nukleotide, mindestens 31 Nukleotide, mindestens 32 Nukleotide, mindestens 33 Nukleotide, mindestens 34 Nukleotide, mindestens 35 Nukleotide, mindestens 36 Nukleotide, mindestens 37 Nukleotide, mindestens 38 Nukleotide, mindestens 39 Nukleotide, mindestens 40 Nukleotide, mindestens 41 Nukleotide, mindestens 42 Nukleotide, mindestens 43 Nukleotide, mindestens 44 Nukleotide, mindestens 45 Nukleotide, mindestens 46 Nukleotide, mindestens 47 Nukleotide, mindestens 48 Nukleotide, mindestens 49 Nukleotide oder mindestens 50 Nukleotide ist.
  • Ausführungsform 448. Das Fusionsprotein der Ausführungsform 443, wobei der Einzelstrang-DNA Flap an die endogene DNA-Sequenz neben der Nick-Stelle hybridisiert, wodurch die gewünschte Nukleotidänderung in dem Target-Strang eingebaut wird.
  • Ausführungsform 449. Das Fusionsprotein der Ausführungsform 443, wobei der Einzelstrang-DNA-Flap die endogene DNA-Sequenz neben der Nick-Stelle ersetzt und die ein freies 5'-Ende aufweist.
  • Ausführungsform 450. Das Fusionsprotein der Ausführungsform 446, wobei die endogene DNA-Sequenz mit dem 5'-Ende von der Zelle ausgeschnitten wird.
  • Ausführungsform 451. Das Fusionsprotein der Ausführungsform 446, wobei die endogene DNA-Sequenz mit dem 5'-Ende durch eine Flap-Endonuklease ausgeschnitten wird.
  • Ausführungsform 452. Das Fusionsprotein der Ausführungsform 448, wobei die zelluläre Reparatur des Einzelstrang-DNA-Flaps die gewünschte Nukleotidänderung in den Nicht-Target-Strang aufnimmt, wodurch ein gewünschtes Produkt gebildet wird.
  • Ausführungsform 453. Das Fusionsprotein der Ausführungsform 449, wobei die gewünschte Nukleotidänderung in einem Editing-Fenster eingebaut ist, das zwischen etwa -4 bis +10 der PAM-Sequenz oder zwischen etwa -10 bis +20 der PAM-Sequenz oder zwischen etwa -20 bis +40 der PAM-Sequenz oder zwischen etwa -30 bis +100 der PAM-Sequenz liegt.
  • Ausführungsform 454. Das Fusionsprotein der Ausführungsform 449, wobei die gewünschte Nukleotidänderung mindestens 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 oder 100 Nukleotide stromabwärts der Nick-Stelle eingebaut ist.
  • Ausführungsform 455. Das Fusionsprotein der Ausführungsform 425, wobei das napDNAbp eine Aminosäuresequenz von SEQ ID NO: 2 oder eine Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % Sequenzidentität mit der Aminosäuresequenz von SEQ ID NO: 18 umfasst.
  • Ausführungsform 456. Das Fusionsprotein der Ausführungsform 425, wobei das napDNAbp eine Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % Sequenzidentität mit der Aminosäuresequenz von SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467 und 482-487 umfasst.
  • Ausführungsform 457. Das Fusionsprotein nach einer der vorherigen Ausführungsformen, wobei das Fusionsprotein die Struktur NH2-[napDNAbp]-[Domäne, umfassend eine RNA-abhängige DNA-Polymeraseaktivität]-COOH; oder NH2-[Domäne, umfassend eine RNA-abhängige DNA-Polymeraseaktivität]-[napDNAbp]-COOH umfasst, wobei jedes Auftreten von „]-[“ das Vorhandensein einer optionalen Linker-Sequenz anzeigt.
  • Ausführungsform 458. Das Fusionsprotein der Ausführungsform 457, wobei die Linker-Sequenz eine Aminosäuresequenz von SEQ ID NOs: 127, 165-176, 446, 453 und 767-769 umfasst.
  • Ausführungsform 459. Das Fusionsprotein der Ausführungsform 425, wobei die gewünschte Nukleotidänderung eine Einzelnukleotidänderung, eine Insertion eines oder mehrerer Nukleotide oder eine Deletion eines oder mehrerer Nukleotide ist.
  • Ausführungsform 460. Das Fusionsprotein der Ausführungsform 459, wobei das Insert oder die Deletion mindestens 1, mindestens 2, mindestens 3, mindestens 4, mindestens 5, mindestens 6, mindestens 7, mindestens 8, mindestens 9, mindestens 10, mindestens 11, mindestens 12, mindestens 13, mindestens 14, mindestens 15, mindestens 16, mindestens 17, mindestens 18, mindestens 19, mindestens 20, mindestens 21, mindestens 22, mindestens 23, mindestens 24, mindestens 25, mindestens 26, mindestens 27, mindestens 28, mindestens 29, mindestens 30, mindestens 31, mindestens 32, mindestens 33, mindestens 34, mindestens 35, mindestens 36, mindestens 37, mindestens 38, mindestens 39, mindestens 40, mindestens 41, mindestens 42, mindestens 43, mindestens 44, mindestens 45, mindestens 46, mindestens 47, mindestens 48, mindestens 49 oder mindestens 50 ist.
  • Ausführungsform 461. Ein Komplex, umfassend ein Fusionsprotein nach einer beliebigen der Ausführungsformen 425-460 und eine PEgRNA, wobei die PEgRNA das Fusionsprotein zu einer Target-DNA-Sequenz zum Prime Editing steuert.
  • Ausführungsform 462. Der Komplex der Ausführungsform 461, wobei die PEgRNA eine Guide-RNA und einen Nukleinsäure-Extension-Arm am 3'- oder 5'-Ende der Guide-RNA oder an einer intramolekularen Position in der Guide-RNA umfasst.
  • Ausführungsform 463. Der Komplex der Ausführungsform 462, wobei die PEgRNA in der Lage ist, an ein napDNAbp zu binden und das napDNAbp an die Target-DNA-Sequenz zu steuern.
  • Ausführungsform 464. Der Komplex der Ausführungsform 463, wobei die Target-DNA-Sequenz einen Target-Strang und einen komplementären Nicht-Target-Strang umfasst, wobei die Guide-RNA an den Target-Strang hybridisiert, um ein RNA-DNA-Hybrid und eine R-Schleife zu bilden.
  • Ausführungsform 465. Der Komplex der Ausführungsform 464, wobei der mindestens eine Nukleinsäure-Extension-Arm (i) ein DNA-Synthese-Template und (ii) eine Primer-Bindungsstelle umfasst.
  • Ausführungsform 466. Der Komplex der Ausführungsform 464, wobei die PEgRNA die Nukleotidsequenz von SEQ ID NOs: 101-104, 181-183, 223-244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777 oder eine Nukleotidsequenz mit mindestens 85 % oder mindestens 90 % oder mindestens 95 % oder mindestens 98 % oder mindestens 99 % Sequenzidentität mit einer beliebigen von SEQ ID NOs: 101-104, 181-183, 223-244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777 umfasst.
  • Ausführungsform 467. Der Komplex der Ausführungsform 465, wobei das DNA-Synthese-Template eine Nukleotidsequenz umfasst, die zu mindestens 80 % oder 85 % oder 90 % oder 95 % oder 99 % identisch mit dem endogenen DNA-Target ist.
  • Ausführungsform 468. Der Komplex der Ausführungsform 465, wobei die Primer-Bindungsstelle an ein freies 3'-Ende der geschnittenen DNA hybridisiert.
  • Ausführungsform 469. Der Komplex der Ausführungsform 461, wobei das napDNAbp eine Cas9-Nickase ist.
  • Ausführungsform 470. Der Komplex der Ausführungsform 461, wobei das napDNAbp eine Aminosäuresequenz von SEQ ID NO: 18 oder eine Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % Sequenzidentität mit SEQ ID NO: 18 umfasst.
  • Ausführungsform 471. Der Komplex der Ausführungsform 461, wobei das napDNAbp eine Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % Sequenzidentität mit der Aminosäuresequenz einer beliebigen von SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467 und 482-487 umfasst.
  • Ausführungsform 472. Der Komplex der Ausführungsform 461, wobei die PEgRNA eine Guide-RNA und einen Nukleinsäure-Extension-Arm am 3'- oder 5'- Ende der Guide-RNA oder an einer intramolekularen Position in der Guide-RNA umfasst.
  • Ausführungsform 473. Der Komplex der Ausführungsform 465, wobei das DNA-Synthese-Template eine Nukleotidsequenz umfasst, die mindestens 80 % oder 85 % oder 90 % oder 95 % oder 99 % identisch mit dem endogenen DNA-Target ist.
  • Ausführungsform 474. Der Komplex der Ausführungsform 465, wobei die Primer-Bindungsstelle an ein freies 3'-Ende der geschnittenen DNA hybridisiert.
  • Ausführungsform 475. Der Komplex der Ausführungsform 462, wobei die PEgRNA ferner mindestens eine zusätzliche Struktur umfasst, die aus der Gruppe ausgewählt ist, die aus einem Linker, einer Stammschleife, einer Haarnadel, einer Toe-Loop, einem Aptamer oder einer RNA-Protein-Rekrutierungsdomäne besteht.
  • Ausführungsform 476. Ein Polynukleotid, das für das Fusionsprotein von einer beliebigen der Ausführungsformen 425-461 codiert.
  • Ausführungsform 477. Ein Polynukleotid, das für die PEgRNA von einer beliebigen der oben genannten Ausführungsformen codiert.
  • Ausführungsform 478. Ein Vektor, umfassend das Polynukleotid der Ausführungsform 476, wobei die Expression des Fusionsproteins unter der Kontrolle eines Promotors steht.
  • Ausführungsform 479. Ein Vektor, umfassend das Polynukleotid der Ausführungsform 477, wobei die Expression der PEgRNA unter der Kontrolle eines Promotors steht.
  • Ausführungsform 480. Der Vektor der Ausführungsform 479, wobei der Promotor ein U6-Promotor ist.
  • Ausführungsform 481. Der Vektor der Ausführungsform 479, wobei der Promotor ein CMV-Promotor ist.
  • Ausführungsform 482. Der Vektor der Ausführungsform 480, wobei die PEgRNA dazu konstruiert ist, einen oder mehrere Repeat-Cluster von T in dem Extension-Arm zu entfernen, um die Transkriptionseffizienz durch den U6-Promotor zu verbessern.
  • Ausführungsform 483. Der Vektor der Ausführungsform 482, wobei der eine oder die mehreren Repeat-Cluster von T, die entfernt werden, mindestens 3 T, mindestens 4 T, mindestens 5 T, mindestens 6 T, mindestens 7 T, mindestens 8 T, mindestens 9 T, mindestens 10 T, mindestens 11 T, mindestens 12 T, mindestens 13 T, mindestens 14 T, mindestens 15 T, mindestens 16 T, mindestens 17 T, mindestens 18 T, mindestens 19 T oder mindestens 20 T umfasst.
  • Ausführungsform 484. Eine Zelle, umfassend das Fusionsprotein von einer beliebigen der Ausführungsformen 425-460 und eine an das napDNAbp des Fusionsproteins gebundene PEgRNA.
  • Ausführungsform 485. Eine Zelle, die einen Komplex von einer beliebigen der Ausführungsformen 461-475 umfasst.
  • Ausführungsform 486. Eine pharmazeutische Zusammensetzung, umfassend: (i) ein Fusionsprotein einer beliebigen der Ausführungsformen 425-460, den Komplex von den Ausführungsformen 461-475, das Polynukleotid von den Ausführungsformen 476-477 oder den Vektor von den Ausführungsformen 478-483; und (ii) einen pharmazeutisch verträglichen Hilfsstoff.
  • Ausführungsform 487. Pharmazeutische Zusammensetzung, umfassend: (i) den Komplex von den Ausführungsformen 461-475 (ii) eine Polymerase, die in trans bereitgestellt ist; und (iii) einen pharmazeutisch verträglichen Hilfsstoff.
  • Ausführungsform 488. Ein Kit zum Prime Editing, umfassend: (i) ein Nukleinsäuremolekül, das für das Fusionsprotein von einer beliebigen der Ausführungsformen 425-460 codiert; und (ii) ein Nukleinsäuremolekül, das für eine PEgRNA codiert, die in der Lage ist, das Fusionsprotein an eine Target-DNA-Stelle zu steuern, wobei das Nukleinsäuremolekül von (i) und (ii) in einem einzelnen DNA-Konstrukt oder in separaten DNA-Konstrukten enthalten sein kann.
  • Ausführungsform 489. Das Kit der Ausführungsform 488, wobei das Nukleinsäuremolekül von (i) ferner einen Promotor umfasst, der die Expression des Fusionsproteins steuert.
  • Ausführungsform 490. Das Kit der Ausführungsform 488, wobei das Nukleinsäuremolekül von (ii) ferner einen Promotor umfasst, der die Expression der PEgRNA steuert.
  • Ausführungsform 491. Das Kit der Ausführungsform 490, wobei der Promotor ein U6-Promotor ist.
  • Ausführungsform 492. Das Kit der Ausführungsform 490, wobei der Promotor ein CMV-Promoter ist.
  • Ausführungsform 493. Das Fusionsprotein der Ausführungsform 457, wobei die Linker-Sequenz eine Aminosäuresequenz von SEQ ID Nos: 174 (1x SGGS), 3888 (2x SGGS), 3889 (3x SGGS), 3890 (1x XTEN), 3891 (1x EAAAK), 3892 (2x EAAAK) und 3893 (3x EAAAK) umfasst.
  • GRUPPE B. PE-GUIDES und KONSTRUKTIONSVERFAHREN
  • Ausführungsform 1. Eine PEgRNA, umfassend eine Guide-RNA und mindestens einen Nukleinsäure-Extension-Arm, der ein DNA-Synthese-Template umfasst.
  • Ausführungsform 2. Die PEgRNA der Ausführungsform 1, wobei der Nukleinsäure-Extension-Arm am 3'- oder 5'-Ende der Guide-RNA oder an einer intramolekularen Position in der Guide-RNA positioniert ist, und wobei der Nukleinsäure-Extension-Arm DNA oder RNA ist.
  • Ausführungsform 3. Die PEgRNA der Ausführungsform 1, wobei die PEgRNA in der Lage ist, an ein napDNAbp zu binden und das napDNAbp an eine Target-DNA-Sequenz zu steuern.
  • Ausführungsform 4. Die PEgRNA der Ausführungsform 3, wobei die Target-DNA-Sequenz einen Target-Strang und einen komplementären Nicht-Target-Strang umfasst.
  • Ausführungsform 5. Die PEgRNA der Ausführungsform 3, wobei die Guide-RNA an den Target-Strang hybridisiert, um ein RNA-DNA-Hybrid und eine R-Schleife zu bilden.
  • Ausführungsform 6. Die PEgRNA der Ausführungsform 1, wobei der mindestens eine Nukleinsäure-Extension-Arm ferner eine Primer-Bindungsstelle umfasst.
  • Ausführungsform 7. Die PEgRNA der Ausführungsform 1, wobei der Nukleinsäure-Extension-Arm mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide, mindestens 15 Nukleotide, mindestens 16 Nukleotide, mindestens 17 Nukleotide, mindestens 18 Nukleotide, mindestens 19 Nukleotide, mindestens 20 Nukleotide, mindestens 21 Nukleotide, mindestens 22 Nukleotide, mindestens 23 Nukleotide, mindestens 24 Nukleotide, mindestens 25 Nukleotide, mindestens 26 Nukleotide, mindestens 27 Nukleotide, mindestens 28 Nukleotide, mindestens 29 Nukleotide, mindestens 30 Nukleotide, mindestens 31 Nukleotide, mindestens 32 Nukleotide, mindestens 33 Nukleotide, mindestens 34 Nukleotide, mindestens 35 Nukleotide, mindestens 36 Nukleotide, mindestens 37 Nukleotide, mindestens 38 Nukleotide, mindestens 39 Nukleotide, mindestens 40 Nukleotide, mindestens 41 Nukleotide, mindestens 42 Nukleotide, mindestens 43 Nukleotide, mindestens 44 Nukleotide, mindestens 45 Nukleotide, mindestens 46 Nukleotide, mindestens 47 Nukleotide, mindestens 48 Nukleotide, mindestens 49 Nukleotide oder mindestens 50 Nukleotide ist.
  • Ausführungsform 8. Die PEgRNA der Ausführungsform 1, wobei das DNA-Synthese-Template mindestens 3 Nukleotide, mindestens 4 Nukleotide, mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide oder mindestens 15 Nukleotide lang ist.
  • Ausführungsform 9. Die PEgRNA der Ausführungsform 6, wobei die Primer-Bindungsstelle mindestens 3 Nukleotide, mindestens 4 Nukleotide, mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide oder mindestens 15 Nukleotide lang ist.
  • Ausführungsform 10. Die PEgRNA der Ausführungsform 1, ferner umfassend mindestens eine zusätzliche Struktur, die aus der Gruppe ausgewählt ist, die aus einer tRNA, einem Linker, einer Stammschleife, einer Haarnadel, einer Toe-Loop, einem Aptamer oder einer RNA-Protein-Rekrutierungsdomäne besteht.
  • Ausführungsform 11. Die PEgRNA der Ausführungsform 1, wobei das DNA-Synthese-Template für einen Einzelstrang-DNA-Flap codiert, der komplementär zu einer endogenen DNA-Sequenz neben einer Nick-Stelle ist, wobei der Einzelstrang-DNA-Flap eine gewünschte Nukleotidänderung umfasst.
  • Ausführungsform 12. Die PEgRNA der Ausführungsform 11, wobei der Einzelstrang-DNA-Flap eine endogene Einzelstrang-DNA mit einem 5'-Ende in der Target-DNA-Sequenz, die genickt wurde, verdrängt, und wobei sich die endogene Einzelstrang-DNA stromabwärts und unmittelbar neben der Nick-Stelle befindet.
  • Ausführungsform 13. Die PEgRNA der Ausführungsform 11, wobei die endogene Einzelstrang-DNA mit dem freien 5'-Ende von der Zelle ausgeschnitten wird.
  • Ausführungsform 14. Die PEgRNA der Ausführungsform 13, wobei die zelluläre Reparatur des Einzelstrang-DNA-Flaps zum Einbau der gewünschten Nukleotidänderung führt, wodurch ein gewünschtes Produkt gebildet wird.
  • Ausführungsform 15. Die PEgRNA der Ausführungsform 1, umfassend die Nukleotidsequenz von SEQ ID NOs: 101-104, 181-183, 223-244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777 oder eine Nukleotidsequenz mit mindestens 85 % oder mindestens 90 % oder mindestens 95 % oder mindestens 98 % oder mindestens 99 % Sequenzidentität mit einer beliebigen von SEQ ID NOs: 101-104, 181-183, 223-244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777.
  • Ausführungsform 16. Die PEgRNA der Ausführungsform 1, wobei das DNA-Synthese-Template eine Nukleotidsequenz umfasst, die zu mindestens 80 % oder 85 % oder 90 % oder 95 % oder 99 % identisch mit dem endogenen DNA-Target ist.
  • Ausführungsform 17. Die PEgRNA der Ausführungsform 6, wobei die Primer-Bindungsstelle an ein freies 3'-Ende der geschnittenen DNA hybridisiert.
  • Ausführungsform 18. Die PEgRNA der Ausführungsform 10, wobei sich die mindestens eine zusätzliche Struktur am 3'- oder 5'-Ende der PEgRNA befindet.
  • Ausführungsform 19. Die PEgRNA der Ausführungsform 10, wobei der Linker eine Nukleotidsequenz umfasst, die aus der Gruppe ausgewählt ist, die aus SEQ ID NOs: 127, 165-176, 446, 453 und 767-769 besteht.
  • Ausführungsform 20. Die PEgRNA der Ausführungsform 10, wobei die Stammschleife eine Nukleotidsequenz umfasst, die aus den hier beschriebenen Stammschleifen ausgewählt ist.
  • Ausführungsform 21. Die PEgRNA der Ausführungsform 10, wobei die Haarnadel eine Nukleotidsequenz umfasst, die aus den hier beschriebenen Haarnadeln ausgewählt ist.
  • Ausführungsform 22. Die PEgRNA der Ausführungsform 10, wobei die Toe-Loop eine Nukleotidsequenz umfasst, die aus den hier beschriebenen Toe-Loops ausgewählt ist.
  • Ausführungsform 23. Die PEgRNA der Ausführungsform 10, wobei das Aptamer eine Nukleotidsequenz umfasst, die aus den hier beschriebenen Aptameren ausgewählt ist.
  • Ausführungsform 24. Die PEgRNA der Ausführungsform 10, wobei die RNA-Protein-Rekrutierungsdomäne eine Nukleotidsequenz umfasst, die aus der hier beschriebenen RNA-Protein-Rekrutierungsdomäne ausgewählt ist.
  • Ausführungsform 25. Ein Verfahren zum Entwerfen einer PEgRNA zur Verwendung beim Prime Editing, um eine gewünschte Nukleotidänderung in eine Target-Nukleotidsequenz einzubauen, wobei die PEgRNA einen Spacer, einen gRNA-Kern und einen Extension-Arm umfasst, und wobei der Extension-Arm eine Primer-Bindungsstelle und ein DNA-Synthese-Template umfasst, wobei das Verfahren Folgendes umfasst:
    • (i) Auswählen einer gewünschten Target-Edit-Stelle in einer Target-Nukleotidsequenz;
    • (ii) Erhalten einer Kontext-Nukleotidsequenz stromaufwärts und stromabwärts der Target-Edit-Stelle;
    • (iii) Lokalisieren mutmaßlicher Protospacer-Nachbarmotiv(PAM)-Stellen in der Kontext-Nukleotidsequenz, die sich in der Nähe der gewünschten Target-Edit-Stelle befinden;
    • (iv) Identifizieren der entsprechenden Nick-Stellen für jede mutmaßliche PAM-Stelle;
    • (v) Entwerfen des Spacers;
    • (vi) Entwerfen des gRNA-Kerns;
    • (vii) Entwerfen des Extension-Arms; und
    • (viii) Konstruieren der vollständigen PEgRNA durch Verketten des Spacers, des gRNA-Kerns und des Extension-Arms.
  • Ausführungsform 26. Das Verfahren der Ausführungsform 25, wobei der Schritt (i) des Auswählens der gewünschten Target-Edit-Stelle ein Auswählen einer krankheitshervorrufenden Mutation umfasst.
  • Ausführungsform 27. Das Verfahren der Ausführungsform 26, wobei die krankheitshervorrufende Mutation mit einer Krankheit assoziiert ist, die aus der Gruppe ausgewählt ist, die aus Krebs, Autoimmunerkrankungen, neurologischen Störungen, Hautstörungen, Atemwegskrankheiten und Herzkrankheiten besteht.
  • Ausführungsform 28. Das Verfahren der Ausführungsform 25, wobei der Schritt (ii) des Erhaltens einer Kontext-Nukleotidsequenz stromaufwärts und stromabwärts der Target-Edit-Stelle ein Erhalten von etwa 50-55 Basenpaaren (bp), etwa 55-60 bp, etwa 60-65 bp, etwa 65-70 bp, etwa 70-75 bp, etwa 75-80 bp, etwa 80-85 bp, etwa 85-90 bp, etwa 90-95 bp, etwa 95-100 bp, etwa 100-105 bp, etwa 105-110 bp, etwa 110-125 bp, etwa 125-130 bp, etwa 130-135 bp, etwa 135-140 bp, etwa 140-145 bp, etwa 145-150 bp, etwa 150-155 bp, etwa 155-160 bp, etwa 160-165 bp, etwa 165-170 bp, etwa 170-175 bp, etwa 175-180 bp, etwa 180-185 bp, etwa 185-190 bp, etwa 190-195 bp, etwa 195-200 bp, etwa 200-205 bp, etwa 205-210 bp, etwa 210-215 bp, etwa 215-220 bp, etwa 220-225 bp, etwa 225-230 bp, etwa 230-235 bp, etwa 235-240 bp, etwa 240-245 bp oder etwa 245-250 bp eines Bereichs umfasst, der die gewünschte Target-Edit-Stelle umfasst.
  • Ausführungsform 29. Das Verfahren der Ausführungsform 28, wobei die gewünschte Target-Edit-Stelle ungefähr äquidistant von jedem Ende der Kontext-Nukleotidsequenz positioniert ist.
  • Ausführungsform 30. Das Verfahren der Ausführungsform 25, wobei in Schritt (iii) die mutmaßlichen PAM-Stellen nahe der gewünschten Target-Edit-Stelle sind.
  • Ausführungsform 31. Das Verfahren der Ausführungsform 25, wobei in Schritt (iii) die mutmaßlichen PAM-Stellen diejenigen mit assoziierten Nick-Stellen umfassen, die sich an einer Position weniger als 30 Nukleotide entfernt von der Target-Edit-Stelle oder weniger als 29, 28, 27, 26, 25, 24, 23, 22, 21, 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3 oder 2 Nukleotide entfernt von der Target-Edit-Stelle befinden.
  • Ausführungsform 32. Das Verfahren der Ausführungsform 25, wobei in Schritt (iii) die mutmaßlichen PAM-Stellen diejenigen mit assoziierten Nick-Stellen umfassen, die sich an einer Position mehr als 30 Nukleotide entfernt von der Target-Edit-Stelle oder mehr als 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 oder 100 Nukleotide entfernt von der Target-Edit-Stelle befinden.
  • Ausführungsform 33. Das Verfahren der Ausführungsform 25, wobei in Schritt (iii) die mutmaßlichen PAM-Stellen mit einem oder entsprechendem napDNAbp assoziiert sind, die an die PAM-Stellen binden.
  • Ausführungsform 34. Das Verfahren der Ausführungsform 33, wobei die mutmaßlichen PAM-Stellen und ihre entsprechenden napDNAbps aus einer beliebigen der folgenden Gruppierungen ausgewählt werden: (a) SpCas9 von SEQ ID NO: 18-25 und 87-88 und NGG; (b) Sp VQR nCas9; und (c) NGAN.
  • Ausführungsform 35. Das Verfahren der Ausführungsform 25, wobei der Schritt (v) des Entwerfens des Spacers ein Bestimmen der Komplement-Nukleotidsequenz der Protospacer-Sequenz, die mit jedem PAM assoziiert ist, umfasst.
  • Ausführungsform 36. Das Verfahren der Ausführungsform 25, wobei der Schritt (vi) des Entwerfens des gRNA-Kerns im Kontext jedes mutmaßlichen PAM ein Auswählen einer gRNA-Kernsequenz umfasst, die in der Lage ist, an ein napDNAbp zu binden, das mit jedem der mutmaßlichen PAMs assoziiert ist.
  • Ausführungsform 37. Das Verfahren der Ausführungsform 25, wobei der Schritt (vii) des Entwerfens des Extension-Arms ein Entwerfen (a) eines DNA-Synthese-Templates, welches das interessierende Edit umfasst, und (b) einer Primer-Bindungsstelle umfasst.
  • Ausführungsform 38. Das Verfahren der Ausführungsform 37, wobei das Entwerfen der Primer-Bindungsstelle (a) ein Identifizieren eines DNA-Primers auf dem PAM-enthaltenden Strang der Target-Nukleotidsequenz, wobei das 3'-Ende des DNA-Primers das erste Nukleotid stromaufwärts der Nick-Stelle ist, die mit der PAM-Stelle assoziiert ist, und (b) Entwerfen des Komplements des DNA-Primers, wobei das Komplement die Primer-Bindungsstelle bildet, umfasst.
  • Ausführungsform 39. Das Verfahren der Ausführungsform 38, wobei die Primer-Bindungsstelle 8 bis 15 Nukleotide lang ist.
  • Ausführungsform 40. Das Verfahren der Ausführungsform 38, wobei die Primer-Bindungsstelle 12-13 Nukleotide ist, wenn der DNA-Primer etwa 40-60 % GC-Gehalt enthält.
  • Ausführungsform 41. Das Verfahren der Ausführungsform 38, wobei die Primer-Bindungsstelle 14-15 Nukleotide ist, wenn der DNA-Primer weniger als etwa 40 % GC-Gehalt enthält.
  • Ausführungsform 42. Das Verfahren der Ausführungsform 38, wobei die Primer-Bindungsstelle 8-11 Nukleotide ist, wenn der DNA-Primer mehr als etwa 60 % GC-Gehalt enthält.
  • Ausführungsform 43. Ein Verfahren zum Prime Editing, umfassend ein Inkontaktbringen einer Target-DNA-Sequenz mit einer PEgRNA von einer beliebigen der Ausführungsformen 1-24 und einem Prime Editor-Fusionsprotein, das ein napDNAbp und eine Domäne mit einer RNA-abhängigen DNA-Polymerase-Aktivität umfasst.
  • Ausführungsform 44. Das Verfahren der Ausführungsform 43, wobei das napDNAbp eine Nickase-Aktivität aufweist.
  • Ausführungsform 45. Das Verfahren der Ausführungsform 43, wobei das napDNAbp ein Cas9-Protein oder eine Variante davon ist.
  • Ausführungsform 46. Das Verfahren der Ausführungsform 43, wobei das napDNAbp ein Nuklease-aktives Cas9, ein Nuklease-inaktives Cas9 (dCas9) oder eine Cas9-Nickase (nCas9) ist.
  • Ausführungsform 47. Das Verfahren der Ausführungsform 43, wobei das napDNAbp Cas9-Nickase (nCas9) ist.
  • Ausführungsform 48. Das Verfahren der Ausführungsform 43, wobei das napDNAbp aus der Gruppe ausgewählt ist, die aus Cas9, Cas12e, Cas12d, Cas12a, Cas12b1, Cas13a, Cas12c und Argonaute besteht, und optional eine Nickase-Aktivität aufweist.
  • Ausführungsform 49. Das Verfahren der Ausführungsform 43, wobei die Domäne, die eine RNA-abhängige DNA-Polymeraseaktivität umfasst, eine reverse Transkriptase ist, die eine beliebige der Aminosäuresequenzen von SEQ ID NO: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741 und 766 umfasst.
  • Ausführungsform 50. Das Verfahren der Ausführungsform 43, wobei die Domäne, die eine RNA-abhängige DNA-Polymeraseaktivität umfasst, eine reverse Transkriptase ist, die eine Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % Sequenzidentität mit der Aminosäuresequenz einer beliebigen von SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741 und 766 umfasst.
  • Ausführungsform 51. Das Verfahren der Ausführungsform 43, wobei die Domäne, die eine RNA-abhängige DNA-Polymeraseaktivität umfasst, eine natürlich vorkommende reverse Transkriptase aus einem Retrovirus oder einem Retrotransposon ist.
  • GRUPPE C. PE-KOMPLEXE
  • Ausführungsform 1. Ein Komplex zum Prime Editing, umfassend:
    • (i) Fusionsprotein, das ein Nukleinsäure-programmierbares DNA-Bindungsprotein (napDNAbp) und eine Domäne, die eine RNA-abhängige DNA-Polymeraseaktivität umfasst, umfasst; und
    • (ii) eine Prime Editing-Guide-RNA (PEgRNA).
  • Ausführungsform 2. Der Komplex der Ausführungsform 1, wobei das Fusionsprotein.
    in der Lage ist, ein Prime Editing in Gegenwart der Prime Editing-Guide-RNA (PEgRNA) auszuführen, um eine gewünschte Nukleotidänderung in eine Target-Sequenz einzubauen.
  • Ausführungsform 3. Der Komplex der Ausführungsform 11, wobei das napDNAbp eine Nickase-Aktivität aufweist.
  • Ausführungsform 4. Der Komplex der Ausführungsform 1, wobei das napDNAbp ein Cas9-Protein oder eine Variante davon ist.
  • Ausführungsform 5. Der Komplex der Ausführungsform 1, wobei das napDNAbp ein Nuklease-aktives Cas9, ein Nuklease-inaktives Cas9 (dCas9) oder eine Cas9-Nickase (nCas9) ist.
  • Ausführungsform 6. Der Komplex der Ausführungsform 1, wobei das napDNAbp Cas9-Nickase (nCas9) ist.
  • Ausführungsform 7. Der Komplex der Ausführungsform 1, wobei das napDNAbp aus der Gruppe ausgewählt ist, die aus Cas9, Cas12e, Cas12d, Cas12a, Cas12b1, Cas13a, Cas 12c und Argonaute besteht, und optional eine Nickase-Aktivität aufweist.
  • Ausführungsform 8. Der Komplex der Ausführungsform 1, wobei die Domäne, die eine RNA-abhängige DNA-Polymeraseaktivität umfasst, eine reverse Transkriptase ist, die eine beliebige der Aminosäuresequenzen von SEQ ID NO: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741 und 766 umfasst.
  • Ausführungsform 9. Der Komplex der Ausführungsform 1, wobei die Domäne, die eine RNA-abhängige DNA-Polymeraseaktivität umfasst, eine reverse Transkriptase ist, die eine Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % Sequenzidentität mit der Aminosäuresequenz einer beliebigen von SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741 und 766 umfasst.
  • Ausführungsform 10. Der Komplex der Ausführungsform 1, wobei die Domäne, die eine RNA-abhängige DNA-Polymerase-Aktivität umfasst, eine natürlich vorkommende reverse Transkriptase aus einem Retrovirus oder einem Retrotransposon ist.
  • Ausführungsform 11. Der Komplex der Ausführungsform 1, wobei das Fusionsprotein, wenn es mit einer PEgRNA komplexiert ist, in der Lage ist, an eine Target-DNA-Sequenz zu binden.
  • Ausführungsform 12. Der Komplex der Ausführungsform 1, wobei die PEgRNA eine Guide-RNA und mindestens einen Nukleinsäure-Extension-Arm umfasst, der ein DNA-Synthese-Template umfasst.
  • Ausführungsform 13. Der Komplex der Ausführungsform 12, wobei der Nukleinsäure-Extension-Arm am 3'- oder 5'-Ende der Guide-RNA oder an einer intramolekularen Position in der Guide-RNA positioniert ist, und wobei der Nukleinsäure-Extension-Arm DNA oder RNA ist.
  • Ausführungsform 14. Der Komplex der Ausführungsform 12, wobei die PEgRNA in der Lage ist, an ein napDNAbp zu binden und das napDNAbp an eine Target-DNA-Sequenz zu steuern.
  • Ausführungsform 15. Der Komplex der Ausführungsform 14, wobei die Target-DNA-Sequenz einen Target-Strang und einen komplementären Nicht-Target-Strang umfasst.
  • Ausführungsform 16. Der Komplex der Ausführungsform 12, wobei die Guide-RNA an den Target-Strang hybridisiert, um ein RNA-DNA-Hybrid und eine R-Schleife zu bilden.
  • Ausführungsform 17. Der Komplex der Ausführungsform 12, wobei der mindestens eine Nukleinsäure-Extension-Arm ferner eine Primer-Bindungsstelle umfasst.
  • Ausführungsform 18. Der Komplex der Ausführungsform 12, wobei der Nukleinsäure-Extension-Arm mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide, mindestens 15 Nukleotide, mindestens 16 Nukleotide, mindestens 17 Nukleotide, mindestens 18 Nukleotide, mindestens 19 Nukleotide, mindestens 20 Nukleotide, mindestens 21 Nukleotide, mindestens 22 Nukleotide, mindestens 23 Nukleotide, mindestens 24 Nukleotide, mindestens 25 Nukleotide, mindestens 26 Nukleotide, mindestens 27 Nukleotide, mindestens 28 Nukleotide, mindestens 29 Nukleotide, mindestens 30 Nukleotide, mindestens 31 Nukleotide, mindestens 32 Nukleotide, mindestens 33 Nukleotide, mindestens 34 Nukleotide, mindestens 35 Nukleotide, mindestens 36 Nukleotide, mindestens 37 Nukleotide, mindestens 38 Nukleotide, mindestens 39 Nukleotide, mindestens 40 Nukleotide, mindestens 41 Nukleotide, mindestens 42 Nukleotide, mindestens 43 Nukleotide, mindestens 44 Nukleotide, mindestens 45 Nukleotide, mindestens 46 Nukleotide, mindestens 47 Nukleotide, mindestens 48 Nukleotide, mindestens 49 Nukleotide oder mindestens 50 Nukleotide ist.
  • Ausführungsform 19. Der Komplex der Ausführungsform 12, wobei das DNA-Synthese-Template mindestens 3 Nukleotide, mindestens 4 Nukleotide, mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens umfasst 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide oder mindestens 15 Nukleotide lang ist.
  • Ausführungsform 20. Der Komplex der Ausführungsform 17, wobei die Primer-Bindungsstelle mindestens 3 Nukleotide, mindestens 4 Nukleotide, mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide oder mindestens 15 Nukleotide lang ist.
  • Ausführungsform 21. Der Komplex der Ausführungsform 12, wobei die PEgRNA ferner mindestens eine zusätzliche Struktur umfasst, die aus der Gruppe ausgewählt ist, die aus einem Linker, einer Stammschleife, einer Haarnadel, einer Toe-Loop, einem Aptamer oder einer RNA-Protein-Rekrutierungsdomäne besteht.
  • Ausführungsform 22. Der Komplex der Ausführungsform 12, wobei das DNA-Synthese-Template für einen Einzelstrang-DNA-Flap codiert, der komplementär zu einer endogenen DNA-Sequenz neben einer Nick-Stelle ist, wobei der Einzelstrang-DNA-Flap eine gewünschte Nukleotidänderung umfasst.
  • Ausführungsform 23. Der Komplex der Ausführungsform 22, wobei der Einzelstrang-DNA-Flap eine endogene Einzelstrang-DNA mit einem 5'-Ende in der Target-DNA-Sequenz, die genickt wurde, verdrängt und wobei sich die endogene Einzelstrang-DNA stromabwärts und unmittelbar neben der Nick-Stelle befindet.
  • Ausführungsform 24. Der Komplex der Ausführungsform 23, wobei die endogene Einzelstrang-DNA mit dem freien 5'-Ende von der Zelle ausgeschnitten wird.
  • Ausführungsform 25. Der Komplex der Ausführungsform 23, wobei die zelluläre Reparatur des Einzelstrang-DNA-Flaps zum Einbau der gewünschten Nukleotidänderung führt, wodurch ein gewünschtes Produkt gebildet wird.
  • Ausführungsform 26. Der Komplex der Ausführungsform 12, wobei die PEgRNA die Nukleotidsequenz von SEQ ID NOs: 18-36 oder eine Nukleotidsequenz mit mindestens 85 % oder mindestens 90 % oder mindestens 95 % oder mindestens 98 % oder mindestens 99 % Sequenzidentität mit einer beliebigen von SEQ ID NOs: 101-104, 181-183, 223-244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777 umfasst.
  • Ausführungsform 27. Der Komplex der Ausführungsform 12, wobei das DNA-Synthese-Template eine Nukleotidsequenz umfasst, die zu mindestens 80 % oder 85 % oder 90 % oder 95 % oder 99 % identisch mit dem endogenen DNA-Target ist.
  • Ausführungsform 28. Der Komplex der Ausführungsform 17, wobei die Primer-Bindungsstelle an ein freies 3'-Ende der geschnittenen DNA hybridisiert.
  • Ausführungsform 29. Der Komplex der Ausführungsform 21, wobei sich die mindestens eine zusätzliche Struktur am 3'- oder 5'-Ende der PEgRNA befindet.
  • Ausführungsform 30. Der Komplex der Ausführungsform 29, wobei der Linker eine Nukleotidsequenz umfasst, die aus der Gruppe ausgewählt ist, die aus SEQ ID NOs: 127, 165-176, 446, 453 und 767-769 besteht.
  • Ausführungsform 31. Der Komplex der Ausführungsform 29, wobei die Stammschleife eine Nukleotidsequenz umfasst, die aus den hier beschriebenen Stammschleifen ausgewählt ist.
  • Ausführungsform 32. Der Komplex der Ausführungsform 29, wobei die Haarnadel eine Nukleotidsequenz umfasst, die aus den hier beschriebenen Haarnadeln ausgewählt ist.
  • Ausführungsform 33. Der Komplex der Ausführungsform 29, wobei die Toe-Loop eine Nukleotidsequenz umfasst, die aus den hier beschriebenen Toe-Loops ausgewählt ist.
  • Ausführungsform 34. Der Komplex der Ausführungsform 29, wobei das Aptamer eine Nukleotidsequenz umfasst, die aus den hier beschriebenen Aptameren ausgewählt ist.
  • Ausführungsform 35. Der Komplex der Ausführungsform 29, wobei die RNA-Protein-Rekrutierungsdomäne eine Nukleotidsequenz umfasst, die aus den hier beschriebenen RNA-Protein-Rekrutierungsdomänen ausgewählt ist.
  • Ausführungsform 36. Der Komplex der Ausführungsform 1, wobei die Target-DNA-Sequenz einen Target-Strang und einen komplementären Nicht-Target-Strang umfasst.
  • Ausführungsform 37. Der Komplex der Ausführungsform 36, wobei die R-Schleife (i) ein RNA-DNA-Hybrid, das die PEgRNA und den Target-Strang umfasst, und (ii) den komplementären Nicht-Target-Strang umfasst.
  • Ausführungsform 38. Der Komplex der Ausführungsform 37, wobei der Target- oder der komplementäre Nicht-Target-Strang genickt ist, um eine Priming-Sequenz mit einem freien 3'-Ende zu bilden.
  • Ausführungsform 39. Der Komplex der Ausführungsform 38, wobei sich die Nick-Stelle stromaufwärts der PAM-Sequenz auf dem Target-Strang befindet.
  • Ausführungsform 40. Der Komplex der Ausführungsform 38, wobei sich die Nick-Stelle stromaufwärts der PAM-Sequenz auf dem Nicht-Target-Strang befindet.
  • Ausführungsform 41. Der Komplex der Ausführungsform 38, wobei die Nickstelle -1, -2, -3, -4, -5, -6, -7, -8 oder -9 relativ zum 5'-Ende der PAM-Sequenz.
  • Ausführungsform 42. Der Komplex der Ausführungsform 22, wobei der Einzelstrang-DNA-Flap an die endogene DNA-Sequenz neben der Nick-Stelle hybridisiert, wodurch die gewünschte Nukleotidänderung in den Target-Strang eingebaut wird.
  • Ausführungsform 43. Der Komplex der Ausführungsform 22, wobei der Einzelstrang-DNA-Flap die endogene DNA-Sequenz neben der Nick-Stelle und die ein freies 5'-Ende aufweist verdrängt.
  • Ausführungsform 44. Der Komplex der Ausführungsform 22, wobei die endogene DNA-Sequenz mit dem 5'-Ende von der Zelle ausgeschnitten wird.
  • Ausführungsform 45. Der Komplex der Ausführungsform 44, wobei die endogene DNA-Sequenz mit dem 5'-Ende durch eine Flap-Endonuklease ausgeschnitten wird.
  • Ausführungsform 46. Der Komplex der Ausführungsform 43, wobei die zelluläre Reparatur des Einzelstrang-DNA-Flaps die gewünschte Nukleotidänderung in den Nicht-Target-Strang aufnimmt, wodurch ein gewünschtes Produkt gebildet wird.
  • Ausführungsform 47. Der Komplex der Ausführungsform 46, wobei die gewünschte Nukleotidänderung in einem Editing-Fenster eingebaut ist, das zwischen etwa -4 bis +10 der PAM-Sequenz oder zwischen etwa -10 bis +20 der PAM-Sequenz oder zwischen etwa -20 bis +40 der PAM-Sequenz oder zwischen etwa -30 bis +100 der PAM-Sequenz liegt.
  • Ausführungsform 48. Der Komplex der Ausführungsform 47, wobei die gewünschte Nukleotidänderung mindestens 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 oder 100 Nukleotide stromabwärts der Nick-Stelle eingebaut ist.
  • Ausführungsform 49. Der Komplex nach einer der vorhergehenden Ausführungsformen, wobei das Fusionsprotein die Struktur NH2-[napDNAbp]-[Domäne, umfassend eine RNA-abhängige DNA-Polymeraseaktivität]-COOH; oder NH2-[Domäne, umfassend eine RNA-abhängige DNA-Polymeraseaktivität]-[napDNAbp]-COOH umfasst, wobei jedes Auftreten von „]-[“ das Vorhandensein einer optionalen Linker-Sequenz anzeigt.
  • Ausführungsform 50. Der Komplex der Ausführungsform 49, wobei die Linker-Sequenz eine Aminosäuresequenz von SEQ ID NOs: 127, 165-176, 446, 453 und 767-769 umfasst.
  • Ausführungsform 51. Der Komplex der Ausführungsform 1, wobei das Fusionsprotein ferner einen Linker, der das napDNAbp und die Domäne, die eine RNA-abhängige DNA-Polymeraseaktivität umfasst, verbindet.
  • Ausführungsform 52. Komplex der Ausführungsform 51, wobei die Linker-Sequenz eine Aminosäuresequenz von SEQ ID NOs. 3887 (1x SGGS), 3888 (2x SGGS), 3889 (3x SGGS), 3890 (1x XTEN), 3891 (1x EAAAK), 3892 (2x EAAAK) und 3893 (3x EAAAK) umfasst.
  • GRUPPE D. PE-VERFAHREN ZUR KORREKTUR VON MUTATIONEN
  • Ausführungsform 1. Ein Verfahren zum Einbauen einer gewünschten Nukleotidänderung in einer Doppelstrang-DNA-Sequenz, wobei das Verfahren Folgendes umfasst: Inkontaktbringen der Doppelstrang-DNA-Sequenz mit einem Komplex, der ein Fusionsprotein und eine PEgRNA umfasst, wobei das Fusionsprotein ein napDNAbp und eine Polymerase umfasst, und wobei die PEgRNA ein DNA-Synthese-Template umfasst, das die gewünschte Nukleotidänderung und eine Primer-Bindungsstelle umfasst;
  • dadurch Nicking der Doppelstrang-DNA-Sequenz, um dadurch eine freie Einzelstrang-DNA mit einem 3' Ende zu erzeugen;
  • dadurch Hybridisieren des 3'-Endes der freien Einzelstrang-DNA an die Primer-Bindungsstelle, wodurch die Polymerase geprimt wird;
  • dadurch Polymerisieren eines DNA-Strangs vom 3'-Ende, das an die Primer-Bindungsstelle hybridisiert ist, wodurch ein Einzelstrang-DNA-Flap erzeugt wird, der die gewünschte Nukleotidänderung umfasst und der zu dem DNA-Synthese-Template komplementär ist;
  • dadurch Ersetzen eines endogenen DNA-Strangs neben der Schnittstelle mit dem Einzelstrang-DNA-Flap, wodurch die gewünschte Nukleotidänderung in die Doppelstrang-DNA-Sequenz eingebaut wird.
  • Ausführungsform 2. Das Verfahren der Ausführungsform 1, wobei das Ersetzen eines endogenen DNA-Strangs Folgendes umfasst: (i) Hybridisieren des Einzelstrang-DNA-Flaps an den endogenen DNA-Strang neben der Schnittstelle, um eine Sequenzfehlpaarung zu erzeugen; (ii) Ausschneiden des endogenen DNA-Strangs; und (iii) Reparieren der Fehlpaarung, um das gewünschte Produkt zu bilden, das die gewünschte Nukleotidänderung in beiden DNA-Strängen umfasst.
  • Ausführungsform 3. Das Verfahren der Ausführungsform 1, wobei die gewünschte Nukleotidänderung eine Einzelnukleotidsubstitution, eine Deletion oder eine Insertion ist.
  • Ausführungsform 4. Das Verfahren der Ausführungsform 3, wobei die Einzelnukleotidsubstitution eine Transition oder eine Transversion ist.
  • Ausführungsform 5. Das Verfahren der Ausführungsform 1, wobei die gewünschte Nukleotidänderung (1) eine G-zu-T-Substitution, (2) eine G-zu-A-Substitution, (3) eine G-zu-C-Substitution, (4) eine T-zu-G-Substitution, (5) eine T-zu-A-Substitution, (6) eine T-zu-C-Substitution, (7) eine C-zu-G-Substitution, (8) eine C-zu-T-Substitution, (9) eine C-zu-A-Substitution, (10) eine A-zu-T-Substitution, (11) eine A-zu-G-Substitution oder (12) eine A-zu-C-Substitution ist.
  • Ausführungsform 6. Das Verfahren der Ausführungsform 1, wobei die gewünschte Nukleotidänderung (1) ein G:C-Basenpaar in ein T:A-Basenpaar, (2) ein G:C-Basenpaar in ein A:T-Basenpaar umwandelt, (3) ein G:C-Basenpaar in ein C:G-Basenpaar, (4) ein T:A-Basenpaar in ein G:C-Basenpaar, (5) ein T:A-Basenpaar in ein A:T-Basenpaar, (6) ein T:A-Basenpaar in ein C:G-Basenpaar, (7) ein C:G-Basenpaar in ein G:C-Basenpaar, (8) ein C:G-Basenpaar in ein T:A-Basenpaar, ein C:G-Basenpaar in ein A:T-Basenpaar, (10) ein A:T-Basenpaar in ein T:A-Basenpaar, (11) ein A:T-Basenpaar in ein G:C-Basenpaar oder (12) ein A:T-Basenpaar in ein C:G-Basenpaar umwandelt.
  • Ausführungsform 7. Das Verfahren der Ausführungsform 1, wobei die gewünschte Nukleotidänderung eine Insertion oder Deletion von 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 oder 25 Nukleotiden ist.
  • Ausführungsform 8. Das Verfahren der Ausführungsform 1, wobei die gewünschte Nukleotidänderung ein krankheitsassoziiertes Gen korrigiert.
  • Ausführungsform 9. Das Verfahren der Ausführungsform 8, wobei das krankheitsassoziierte Gen mit einer monogenen Störung assoziiert ist, die aus der Gruppe ausgewählt ist, die aus Adenosindeaminase-Mangel (ADA-Mangel); Alpha-1-Antitrypsin-Mangel; Mukoviszidose; Duchenne-Muskeldystrophie; Galaktosämie; Hämochromatose; Huntington-Krankheit; Ahornsirupkrankheit; Marfan-Syndrom; Neurofibromatose Typ 1; Pachyonychia congenita; Phenylketonurie; schwerem kombiniertem Immundefekt; Sichelzellenanämie; Smith-Lemli-Opitz-Syndrom; einer Trinukleotid-Repeat-Störung; einer Prionenkrankheit; und Tay-Sachs-Krankheit besteht.
  • Ausführungsform 10. Das Verfahren der Ausführungsform 8, wobei das krankheitsassoziierte Gen mit einer polygenen Störung assoziiert ist, die aus der Gruppe ausgewählt ist, die aus Herzkrankheit; Bluthochdruck; Alzheimer-Krankheit; Arthritis; Diabetes; Krebs; und Fettleibigkeit besteht.
  • Ausführungsform 11. Das Verfahren der Ausführungsform 1, wobei das napDNAbp ein Nuklease-totes Cas9 (dCas9), eine Cas9-Nickase (nCas9) oder ein Nuklease-aktives Cas9 ist.
  • Ausführungsform 12. Das Verfahren der Ausführungsform 1, wobei das napDNAbp eine Aminosäuresequenz von SEQ ID NO: 18 umfasst.
  • Ausführungsform 13. Das Verfahren der Ausführungsform 1, wobei das napDNAbp eine Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % Sequenzidentität mit der Aminosäuresequenz einer beliebigen von SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467 und 482-487 umfasst.
  • Ausführungsform 14. Das Verfahren der Ausführungsform 1, wobei die Polymerase eine reverse Transkriptase ist, die eine beliebige der Aminosäuresequenzen von SEQ ID NO: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741 und 766 umfasst.
  • Ausführungsform 15. Das Verfahren der Ausführungsform 1, wobei die Polymerase eine reverse Transkriptase ist, die eine Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % Sequenzidentität mit der Aminosäuresequenz einer beliebigen von SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741 und 766 umfasst.
  • Ausführungsform 16. Das Verfahren der Ausführungsform 1, wobei die PEgRNA einen Nukleinsäure-Extension-Arm an den 3'- oder 5'-Enden oder an einem intramolekularen Ort in der Guide-RNA umfasst, wobei der Extension-Arm die DNA-Synthese-Template-Sequenz und die Primer-Bindungsstelle umfasst.
  • Ausführungsform 17. Das Verfahren der Ausführungsform 16, wobei der Extension-Arm mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide, mindestens 15 Nukleotide, mindestens 16 Nukleotide, mindestens 17 Nukleotide, mindestens 18 Nukleotide, mindestens 19 Nukleotide, mindestens 20 Nukleotide, mindestens 21 Nukleotide, mindestens 22 Nukleotide, mindestens 23 Nukleotide, mindestens 24 Nukleotide oder mindestens 25 Nukleotide lang ist.
  • Ausführungsform 18. Das Verfahren der Ausführungsform 1, wobei die PEgRNA eine Nukleotidsequenz aufweist, die aus der Gruppe ausgewählt ist, die aus SEQ ID NOs: 101-104, 181-183, 223-244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777 besteht.
  • Ausführungsform 19. Verfahren zum Einführen einer oder mehrerer Änderungen in der Nukleotidsequenz eines DNA-Moleküls an einem Target-Locus, umfassend: Inkontaktbringen des DNA-Moleküls mit einem Nukleinsäure-programmierbaren DNA-Bindungsprotein (napDNAbp) und einer PEgRNA, die das napDNAbp zu dem Target-Locus leitet, wobei die PEgRNA eine Reverse Transkriptase(RT)-Template-Sequenz umfasst, die mindestens eine gewünschte Nukleotidänderung und eine Primer-Bindungsstelle umfasst;
    dadurch Bilden eines freigesetzten 3'-Endes in einem DNA-Strang an dem Target-Locus;
  • dadurch Hybridisieren des freigesetzten 3'-Endes an die Primer-Bindungsstelle hybridisiert, um eine reverse Transkription zu primen;
  • dadurch Synthetisieren eines Einzelstrang-DNA-Flaps, der die mindestens eine gewünschte Nukleotidänderung umfasst, basierend auf der RT-Template-Sequenz durch reverse Transkriptase;
    dadurch Aufnehmen der mindestens einen gewünschten Nukleotidänderung in die entsprechende endogene DNA, wodurch eine oder mehrere Änderungen in der Nukleotidsequenz des DNA-Moleküls an dem Target-Locus eingeführt werden.
  • Ausführungsform 20. Das Verfahren der Ausführungsform 19, wobei die eine oder mehreren Änderungen in der Nukleotidsequenz eine Transition umfassen.
  • Ausführungsform 21. Verfahren der Ausführungsform 19, wobei die Transition aus der Gruppe ausgewählt ist, die aus: (a) T zu C; (b) A zu G; (c) C zu T; und (d) G zu A besteht.
  • Ausführungsform 22. Das Verfahren der Ausführungsform 19, wobei die eine oder mehreren Änderungen in der Nukleotidsequenz eine Transversion umfassen.
  • Ausführungsform 23. Das Verfahren der Ausführungsform 22, wobei die Transversion aus der Gruppe ausgewählt ist, die aus (a) T zu A; (b) T zu G; (c) C zu G; (d) C zu A; (e) A zu T; (f) A zu C; (g) G zu C; und (h) G zu T besteht.
  • Ausführungsform 24. Das Verfahren der Ausführungsform 19, wobei die eine oder mehreren Änderungen in der Nukleotidsequenz ein Ändern (1) eines G:C-Basenpaars in ein T:A-Basenpaar, (2) eines G:C-Basenpaars in ein A:T-Basenpaar, (3) eines G:C-Basenpaars in ein C:G-Basenpaar, (4) eines T:A-Basenpaars in ein G:C-Basenpaar, (5) eines T:A-Basenpaars in ein A:T-Basenpaar, (6) eines T:A-Basenpaars in ein C:G-Basenpaar, (7) eines C:G-Basenpaars in ein G:C-Basenpaar, (8) eines C:G-Basenpaars in ein T:A-Basenpaar, (9) eines C:G Basenpaars in ein A:T-Basenpaar, (9) eines A:T-Basenpaars in ein T:A-Basenpaar, (11) eines A:T-Basenpaars in ein G:C-Basenpaar oder (12) eines A:T-Basenpaars in ein C:G-Basenpaar umfassen.
  • Ausführungsform 25. Das Verfahren der Ausführungsform 19, wobei die eine oder mehreren Änderungen in der Nukleotidsequenz eine Insertion oder Deletion von 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 oder 25 Nukleotiden umfassen.
  • Ausführungsform 26. Das Verfahren der Ausführungsform 19, wobei die eine oder mehreren Änderungen in der Nukleotidsequenz eine Korrektur an einem krankheitsassoziierten Gen umfassen.
  • Ausführungsform 27. Das Verfahren der Ausführungsform 26, wobei das krankheitsassoziierte Gen mit einer monogenen Störung assoziiert ist, die aus der Gruppe ausgewählt ist, die aus Adenosindeaminase-Mangel (ADA-Mangel); Alpha-1-Antitrypsin-Mangel; Mukoviszidose; Duchenne-Muskeldystrophie; Galaktosämie; Hämochromatose; Huntington-Krankheit; Ahornsirupkrankheit; Marfan-Syndrom; Neurofibromatose Typ 1; Pachyonychia congenita; Phenylketonurie; schwerem kombiniertem Immundefekt; Sichelzellenanämie; Smith-Lemli-Opitz-Syndrom; einer Trinukleotid-Repeat-Störung; einer Prionenkrankheit; und Tay-Sachs-Krankheit besteht.
  • Ausführungsform 28. Das Verfahren der Ausführungsform 26, wobei das krankheitsassoziierte Gen mit einer polygenen Störung assoziiert ist, die aus der Gruppe ausgewählt ist, die aus Herzkrankheit; Bluthochdruck; Alzheimer-Krankheit; Arthritis; Diabetes; Krebs; und Fettleibigkeit besteht.
  • Ausführungsform 29. Das Verfahren der Ausführungsform 19, wobei das napDNAbp ein Nuklease-aktives Cas9 oder eine Variante davon ist.
  • Ausführungsform 30. Das Verfahren der Ausführungsform 19, wobei das napDNAbp eine Nuklease-inaktives Cas9 (dCas9) oder Cas9-Nickase (nCas9) oder eine Variante davon ist.
  • Ausführungsform 31. Das Verfahren der Ausführungsform 19, wobei das napDNAbp eine Aminosäuresequenz von SEQ ID NO: 18 umfasst.
  • Ausführungsform 32. Das Verfahren der Ausführungsform 19, wobei das napDNAbp eine Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % Sequenzidentität mit der Aminosäuresequenz einer beliebigen von SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467 und 482-487 umfasst.
  • Ausführungsform 33. Das Verfahren der Ausführungsform 19, wobei die reverse Transkriptase in trans eingeführt wird.
  • Ausführungsform 34. Das Verfahren der Ausführungsform 19, wobei das napDNAbp eine Fusion mit einer reversen Transkriptase umfasst.
  • Ausführungsform 35. Das Verfahren der Ausführungsform 19, wobei die reverse Transkriptase eine beliebige der Aminosäuresequenzen von SEQ ID NO: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741 und 766 umfasst.
  • Ausführungsform 36. Das Verfahren der Ausführungsform 19, wobei die reverse Transkriptase eine Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % Sequenzidentität mit der Aminosäuresequenz einer beliebigen von SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741 und 766 umfasst.
  • Ausführungsform 37. Das Verfahren der Ausführungsform 19, wobei der Schritt des Bildens eines freigesetzten 3'-Endes in dem DNA-Strang an dem Target-Locus ein Nicken des DNA-Strangs mit einer Nuklease umfasst.
  • Ausführungsform 38. Das Verfahren der Ausführungsform 37, wobei die Nuklease das napDNAbp ist, als Fusionsdomäne von napDNAbp bereitgestellt ist oder in trans bereitgestellt ist.
  • Ausführungsform 39. Das Verfahren der Ausführungsform 19, wobei der Schritt des Bildens eines freigesetzten 3'-Endes in dem DNA-Strang an dem Target-Locus ein Inkontaktbringen des DNA-Strangs mit einem chemischen Mittel umfasst.
  • Ausführungsform 40. Das Verfahren der Ausführungsform 19, wobei der Schritt des Bildens eines freigesetzten 3'-Endes in dem DNA-Strang an dem Target-Locus ein Einführen eines Replikationsfehlers umfasst.
  • Ausführungsform 41. Das Verfahren der Ausführungsform 19, wobei der Schritt des Inkontaktbringens des DNA-Moleküls mit dem napDNAbp und der Guide-RNA eine R-Schleife bildet.
  • Ausführungsform 42. Das Verfahren der Ausführungsform 41, wobei sich der DNA-Strang, in dem das freigesetzte 3'-Ende gebildet wird, in der R-Schleife befindet.
  • Ausführungsform 43. Das Verfahren der Ausführungsform 19, wobei die PEgRNA einen Extension-Arm umfasst, der die Reverse Transkriptase(RT)-Template-Sequenz und die Primer-Bindungsstelle umfasst.
  • Ausführungsform 44. Das Verfahren der Ausführungsform 43, wobei sich der Extension-Arm an dem 3'-Ende der Guide-RNA, dem 5'-Ende der Guide-RNA oder an einer intramolekularen Position in der Guide-RNA befindet.
  • Ausführungsform 45. Das Verfahren der Ausführungsform 19, wobei die PEgRNA ferner mindestens eine zusätzliche Struktur umfasst, die aus der Gruppe ausgewählt ist, die aus einem Linker, einer Stammschleife, einer Haarnadel, einer Toe-Loop, einem Aptamer oder einer RNA-Protein-Rekrutierungsdomäne besteht.
  • Ausführungsform 46. Das Verfahren der Ausführungsform 19, wobei die PEgRNA ferner einen Homologiearm umfasst.
  • Ausführungsform 47. Das Verfahren der Ausführungsform 19, wobei die RT-Template-Sequenz homolog zu der entsprechenden endogenen DNA ist.
  • Ausführungsform 48. Ein Verfahren zum Einführen einer oder mehrerer Änderungen in der Nukleotidsequenz eines DNA-Moleküls an einem Target-Locus durch Target-geprimte reverse Transkription, wobei das Verfahren Folgendes umfasst: (a) Inkontaktbringen des DNA-Moleküls an dem Target-Locus mit (i) einem Fusionsprotein, das ein Nukleinsäure-programmierbares DNA-Bindungsprotein (napDNAbp) und eine reverse Transkriptase umfasst, und (ii) einer Guide-RNA, die ein RT-Template umfasst, das eine gewünschte Nukleotidänderung umfasst;
  • dadurch Ausführen einer Target-geprimten reversen Transkription des RT-Templates, um eine Einzelstrang-DNA zu erzeugen, welche die gewünschte Nukleotidänderung umfasst;
  • dadurch Einführen der gewünschten Nukleotidänderung in das DNA-Molekül an dem Target-Locus durch einen DNA-Reparatur- und/oder Replikationsprozess.
  • Ausführungsform 49. Das Verfahren der Ausführungsform 48, wobei sich das RT-Template an dem 3'-Ende der Guide-RNA, dem 5'-Ende der Guide-RNA oder an einem intramolekularen Ort in der Guide-RNA befindet.
  • Ausführungsform 50. Das Verfahren der Ausführungsform 48, wobei die gewünschte Nukleotidänderung eine Transition, eine Transversion, eine Insertion oder eine Deletion oder eine beliebige Kombination davon umfasst.
  • Ausführungsform 51. Das Verfahren der Ausführungsform 48, wobei die gewünschte Nukleotidänderung eine Transition umfasst, die aus der Gruppe ausgewählt ist, die aus (a) T zu C; (b) A zu G; (c) C zu T; und (d) G zu A besteht.
  • Ausführungsform 52. Das Verfahren der Ausführungsform 48, wobei die gewünschte Nukleotidänderung eine Transversion umfasst, die aus der Gruppe ausgewählt ist, die aus: (a) T zu A; (b) T zu G; (c) C zu G; (d) C zu A; (e) A zu T; (f) A zu C; (g) G zu C; und (h) G zu T besteht.
  • Ausführungsform 53. Das Verfahren der Ausführungsform 48, wobei die gewünschte Nukleotidänderung ein Ändern (1) eines G:C-Basenpaars in ein T:A-Basenpaar, (2) eines G:C-Basenpaars in ein A:T-Basenpaar, (3) eines G:C-Basenpaars in ein C:G-Basenpaar, (4) eines T:A-Basenpaars in ein G:C-Basenpaar, (5) eines T:A-Basenpaars in ein A:T-Basenpaar, (6) eines T:A-Basenpaars in ein C:G-Basenpaar, (7) eines C:G-Basenpaars in ein G:C-Basenpaar, (8) eines C:G Basenpaar in ein T:A-Basenpaar, (9) eines C:G-Basenpaars in ein A:T-Basenpaar, (10) eines A:T-Basenpaars in ein T:A-Basenpaar, (11) eines A:T-Basenpaars in ein G:C-Basenpaar oder (12) eines A:T-Basenpaars in ein C:G-Basenpaar umfasst.
  • Ausführungsform 54. Ein Verfahren zum Ersetzen einer Trinukleotid-Repeat-Expansionsmutation in einem Target-DNA-Molekül durch eine gesunde Sequenz, die eine gesunde Anzahl von Repeat-Trinukleotiden umfasst, wobei das Verfahren Folgendes umfasst: (a) Inkontaktbringen des DNA-Moleküls an dem Target-Locus mit (i) einem Fusionsprotein, das ein Nukleinsäure-programmierbares DNA-Bindungsprotein (napDNAbp) und eine Polymerase umfasst, und (ii) einer PEgRNA, die ein DNA-Synthese-Template umfasst, das die Ersatzsequenz und eine Primer-Bindungsstelle umfasst; (b) Ausführen eines Prime Editing, um eine Einzelstrang-DNA zu erzeugen, welche die Ersatzsequenz umfasst; und (c) Aufnehmen der Einzelstrang-DNA in das DNA-Molekül an dem Target-Locus durch einen DNA-Reparatur- und/oder - Replikationsprozess.
  • Ausführungsform 55. Das Verfahren der Ausführungsform 54, wobei das Fusionsprotein die Aminosäuresequenz von PE1, PE2 oder PE3 umfasst.
  • Ausführungsform 56. Das Verfahren der Ausführungsform 54, wobei das napDNAbp eine Cas9-Nickase (nCas9) ist.
  • Ausführungsform 57. Das Verfahren der Ausführungsform 54, wobei das napDNAbp die Aminosäuresequenz von SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467 und 482-487 umfasst.
  • Ausführungsform 58. Das Verfahren der Ausführungsform 54, wobei die Guide-RNA SEQ ID NOs: 222 umfasst.
  • Ausführungsform 59. Das Verfahren der Ausführungsform 54, wobei der Schritt des (b) Ausführens von Prime Editing ein Erzeugen einer 3'-Ende-Primer-Bindungssequenz an dem Target-Locus umfasst, die in der Lage ist, Polymerase durch Annealen an die Primer-Bindungsstelle auf der Guide-RNA zu primen.
  • Ausführungsform 60. Das Verfahren der Ausführungsform 54, wobei die Trinukleotid-Repeat-Expansionsmutation mit Huntington-Krankheit, Fragile-X-Syndrom oder Friedreich-Ataxie assoziiert ist.
  • Ausführungsform 61. Das Verfahren der Ausführungsform 54, wobei die Trinukleotid-Repeat-Expansionsmutation eine sich wiederholende Einheit von CAG-Tripletts umfasst.
  • Ausführungsform 62. Das Verfahren der Ausführungsform 54, wobei die Trinukleotid-Repeat-Expansionsmutation eine sich wiederholende Einheit von GAA-Tripletts umfasst.
  • Ausführungsform 63. Ein Verfahren zum Einführen einer oder mehrerer Änderungen in der Nukleotidsequenz eines DNA-Moleküls an einem Target-Locus durch Target-geprimte reverse Transkription, wobei das Verfahren Folgendes umfasst: (a) Inkontaktbringen des DNA-Moleküls an dem Target-Locus mit (i) einem Fusionsprotein, das ein Nukleinsäure-programmierbares DNA-Bindungsprotein (napDNAbp) und eine reverse Transkriptase umfasst, und (ii) einer Guide-RNA, die ein RT-Template umfasst, die eine gewünschte Nukleotidänderung umfasst;
    dadurch Ausführen einer Target-geprimten reversen Transkription des RT-Templates, um eine Einzelstrang-DNA zu erzeugen, welche die gewünschte Nukleotidänderung umfasst;
    dadurch Aufnehmen der gewünschten Nukleotidänderung in das DNA-Molekül an dem Target-Locus durch einen DNA-Reparatur- und/oder Replikationsprozess.
  • Ausführungsform 64. Das Verfahren der Ausführungsform 63, wobei sich das RT-Template an dem 3'-Ende der Guide-RNA, dem 5'-Ende der Guide-RNA oder an einem intramolekularen Ort in der Guide-RNA befindet.
  • Ausführungsform 65. Das Verfahren der Ausführungsform 63, wobei die gewünschte Nukleotidänderung eine Transition, eine Transversion, eine Insertion oder eine Deletion oder eine beliebige Kombination davon umfasst.
  • Ausführungsform 66. Das Verfahren der Ausführungsform 63, wobei die gewünschte Nukleotidänderung eine Transition umfasst, die aus der Gruppe ausgewählt ist, die aus (a) T zu C; (b) A zu G; (c) C zu T; und (d) G zu A besteht.
  • Ausführungsform 67. Das Verfahren der Ausführungsform 63, wobei die gewünschte Nukleotidänderung eine Transversion umfasst, die aus der Gruppe ausgewählt ist, die aus (a) T zu A; (b) T zu G; (c) C zu G; (d) C zu A; (e) A zu T; (f) A zu C; (g) G zu C; und (h) G zu T besteht.
  • Ausführungsform 68. Das Verfahren der Ausführungsform 63, wobei die gewünschte Nukleotidänderung ein Ändern (1) eines G:C-Basenpaars in ein T:A-Basenpaar, (2) eines G:C-Basenpaars in ein A:T-Basenpaar, (3) eines G:C-Basenpaars in ein C:G-Basenpaar, (4) eines T:A-Basenpaars in ein G:C-Basenpaar, (5) eines T:A-Basenpaars in ein A:T-Basenpaar, (6) eines T:A Basenpaars in ein C:G Basenpaar, (7) eines C:G-Basenpaars in ein G:C-Basenpaar, (8) eines C:G-Basenpaars in ein T:A-Basenpaar, (9) eines C:G Basenpaars in ein A:T-Basenpaar, (10) eines A:T-Basenpaars in ein T:A-Basenpaar, (11) eines A:T-Basenpaars in ein G:C-Basenpaar oder (12) eines A:T-Basenpaars in ein C:G-Basenpaar umfasst.
  • Ausführungsform 69. Ein Verfahren zum Verhindern oder Anhalten des Fortschreitens einer Prionenkrankheit durch Einbauen einer oder mehrerer schützender Mutationen in PRNP, das von einer Target-Nukleotidsequenz codiert wird, durch Prime Editing, wobei das Verfahren Folgendes umfasst: (a) Inkontaktbringen der Target-Nukleotidsequenz mit (i) einem Prime Editor, der ein Nukleinsäure-programmierbares DNA-Bindungsprotein (napDNAbp) und eine Polymerase umfasst, und (ii) einer PEgRNA, die ein Edit-Template umfasst, das für die funktionelle Gruppierung codiert;
    dadurch Polymerisieren einer Einzelstrang-DNA-Sequenz, die für die schützende Mutation codiert;
    dadurch Aufnehmen der Einzelstrang-DNA-Sequenz anstelle eines entsprechenden endogenen Strangs in die Target-Nukleotidsequenz durch einen DNA-Reparatur- und/oder Replikationsprozess;
    wobei das Verfahren eine rekombinante Target-Nukleotidsequenz erzeugt, die für ein PRNP codiert, das eine schützende Mutation umfasst und das gegen Fehlfaltung resistent ist.
  • Ausführungsform 70. Das Verfahren der Ausführungsform 69, wobei die Prionenkrankheit eine Prionenkrankheit des Menschen ist.
  • Ausführungsform 71. Das Verfahren der Ausführungsform 69, wobei die Prionenkrankheit eine tierische Prionenkrankheit ist.
  • Ausführungsform 72. Das Verfahren der Ausführungsform 69, wobei die Prionenkrankheit Creutzfeldt-Jakob-Krankheit (CJK), variante Creutzfeldt-Jakob-Krankheit (vCJK), Gerstmann-Straussler-Scheinker-Syndrom, letale familiäre Insomnie oder Kuru ist.
  • Ausführungsform 73. Das Verfahren der Ausführungsform 69, wobei die Prionenkrankheit spongiforme Enzephalopathie bei Rindern (BSE oder „Rinderwahnsinn“), chronische Auszehrkrankheit (CWD), Scrapie, übertragbare Enzephalopathie bei Nerzen, spongiforme Enzephalopathie bei Katzen und spongiforme Enzephalopathie bei Huftieren ist.
  • Ausführungsform 74. Das Verfahren der Ausführungsform 69, wobei die Wildtyp-PRNP-Aminosäuresequenz SEQ ID NOs: 291-292 ist.
  • Ausführungsform 75. Das Verfahren der Ausführungsform 69, wobei das Verfahren zu einer modifizierten PRNP-Aminosäuresequenz führt, die aus der Gruppe ausgewählt ist, die aus SEQ ID NOs: 293-309, 311-323 besteht, wobei das modifizierte PRNP-Protein resistent gegen Fehlfaltung ist.
  • Ausführungsform 76. Das Verfahren der Ausführungsform 69, wobei das Fusionsprotein die Aminosäuresequenz von PE1, PE2 oder PE3 umfasst.
  • Ausführungsform 77. Das Verfahren der Ausführungsform 69, wobei das napDNAbp eine Cas9-Nickase (nCas9) ist.
  • Ausführungsform 78. Das Verfahren der Ausführungsform 69, wobei das napDNAbp die Aminosäuresequenz von SEQ ID Nos: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467 und 482-487 umfasst.
  • Ausführungsform 79. Das Verfahren der Ausführungsform 69, wobei die PEgRNA SEQ ID Nos: 101-104, 181-183, 223-244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777 umfasst.
  • Ausführungsform 80. Ein Verfahren zum Behandeln der CDKL5-Mangelstörung durch Korrigieren einer Mutation im Cyclin-abhängigen Kinase-ähnlichen 5-Gen (CDKL5) in einer Target-Nukleotidsequenz durch Prime Editing, wobei das wobei das Verfahren Folgendes umfasst: (a) Inkontaktbringen der Target-Nukleotidsequenz mit (i) einem Prime Editor, der ein Nukleinsäure-programmierbares DNA-Bindungsprotein (napDNAbp) und eine Polymerase umfasst, und (ii) einer PEgRNA, die ein Edit-Template umfasst, das die Mutation in CDKL5 korrigiert;
    dadurch Polymerisieren einer Einzelstrang-DNA-Sequenz, die das Edit codiert;
    dadurch Aufnehmen der Einzelstrang-DNA-Sequenz anstelle eines entsprechenden endogenen Strangs in die Target-Nukleotidsequenz durch einen DNA-Reparatur- und/oder Replikationsprozess;
    wobei das Verfahren eine rekombinante Target-Nukleotidsequenz erzeugt, die für ein repariertes CDKL5-Gen codiert.
  • Ausführungsform 81. Das Verfahren der Ausführungsform D80, wobei die Mutation in CDKL5 1412delA ist.
  • GRUPPE E. PE-METHODEN ZUR MODIFIZIERUNG DER PROTEINSTRUKTUR/FUNKTION UND/ODER MUTAGENESE
  • Ausführungsform 1. Ein Verfahren zum Mutagenisieren eines DNA-Moleküls an einem Target-Locus durch Prime Editing, wobei das wobei das Verfahren Folgendes umfasst: (a) Inkontaktbringen des DNA-Moleküls an dem Target-Locus mit (i) einem Fusionsprotein, das ein Nukleinsäure-programmierbares DNA-Bindungsprotein (napDNAbp) und ein fehleranfälliges Polymer (z. B. fehleranfällige reverse Transkriptase) umfasst, und (ii) einer Guide-RNA, die ein Edit-Template umfasst, das eine gewünschte Nukleotidänderung umfasst; dadurch Polymerisieren einer Einzelstrang DNA, die von dem Edit-Template templatiert wird; und Aufnahme der Einzelstrang-DNA in das DNA-Molekül an dem Target-Locus durch einen DNA-Reparatur- und/oder - Replikationsprozess.
  • Ausführungsform 2. Das Verfahren einer beliebigen vorhergehenden Ausführungsform, wobei das Fusionsprotein die Aminosäuresequenz von PE1, PE2 oder PE3 umfasst.
  • Ausführungsform 3. Das Verfahren einer beliebigen vorhergehenden Ausführungsform, wobei das napDNAbp eine Cas9-Nickase (nCas9) ist.
  • Ausführungsform 4. Das Verfahren der Ausführungsform 1, wobei das napDNAbp die Aminosäuresequenz von SEQ ID Nos: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467 und 482-487 umfasst.
  • Ausführungsform 5. Das Verfahren der Ausführungsform 1, wobei die Guide-RNA SEQ ID Nos: 222 umfasst.
  • Ausführungsform 6. Verfahren zum Einbauen eines Immunepitops in ein interessierendes Protein, für das von einer Target-Nukleotidsequenz codiert wird, durch Prime Editing, wobei das wobei das Verfahren Folgendes umfasst: (a) Inkontaktbringen der Target-Nukleotidsequenz mit (i) einem Prime Editor, der ein Nukleinsäure-programmierbares DNA-Bindungsprotein (napDNAbp) und eine Polymerase umfasst, und (ii) einer PEgRNA, die ein Edit-Template umfasst, das für die funktionelle Gruppierung codiert;
    dadurch Polymerisieren einer Einzelstrang-DNA-Sequenz, die für das Immunepitop codiert;
    dadurch Aufnehmen der Einzelstrang-DNA-Sequenz anstelle eines entsprechenden endogenen Strangs in die Target-Nukleotidsequenz durch einen DNA-Reparatur- und/oder Replikationsprozess;
    wobei das Verfahren eine rekombinante Target-Nukleotidsequenz erzeugt, die für ein Fusionsprotein codiert, welches das interessierende Protein und das Immunepitop umfasst.
  • Ausführungsform 7. Das Verfahren der Ausführungsform 6, wobei das Immunepitop aus der Gruppe ausgewählt ist, die aus Tetanustoxoid (SEQ ID NO: 396); Diphtherie-Toxin-Mutante CRM197 (SEQ ID NO: 630); Mumps-Immunepitop 1 (SEQ ID NO: 400); Mumps-Immunepitop 2 (SEQ ID NO: 402); Mumps-Immunepitop 3 (SEQ ID NO: 404); Rötelnvirus (SEQ ID NO: 406); Hämagglutinin (SEQ ID NO: 408); Neuraminidase (SEQ ID NO: 410); TAP1 (SEQ ID NO: 412); TAP2 (SEQ ID NO: 414); Hämagglutinin-Epitope für HLA der Klasse I (SEQ ID NO: 416); Neuraminidase-Epitope für HLA der Klasse I (SEQ ID NO: 418); Hämagglutinin-Epitope für HLA der Klasse II (SEQ ID NO: 420); Neuraminidase-Epitope für HLA der Klasse II (SEQ ID NO: 422); Hämagglutinin-Epitop H5N1-gebundenem HLA der Klasse I und Klasse II (SEQ ID NO: 424); und Neuraminidase-Epitop H5N1-gebundenem HLA der Klasse I und Klasse II (SEQ ID NO: 426) besteht.
  • Ausführungsform 8. Das Verfahren der Ausführungsform 6, wobei das Fusionsprotein die Aminosäuresequenz von PE1, PE2 oder PE3 umfasst.
  • Ausführungsform 9. Das Verfahren der Ausführungsform 6, wobei das napDNAbp eine Cas9-Nickase (nCas9) ist.
  • Ausführungsform 10. Das Verfahren der Ausführungsform 6, wobei das napDNAbp die Aminosäuresequenz von SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467 und 482-487 umfasst.
  • Ausführungsform 11. Das Verfahren der Ausführungsform 6, wobei die PEgRNA SEQ ID NOs: 101-104, 181-183, 223-244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777 umfasst.
  • Ausführungsform 12. Ein Verfahren zum Einbauen einer Kleinmolekül-Dimerisierungsdomäne in einem interessierenden Protein, für das von einer Target-Nukleotidsequenz codiert wird, durch Prime Editing, wobei das wobei das Verfahren Folgendes umfasst: (a) Inkontaktbringen der Target-Nukleotidsequenz mit (i) einem Prime Editor, der ein Nukleinsäure-programmierbares DNA-Bindungsprotein (napDNAbp) und eine Polymerase umfasst, und (ii) einer PEgRNA, die ein Edit-Template umfasst, das für die Kleinmolekül-Dimerisierungsdomäne codiert;
    dadurch Polymerisieren einer Einzelstrang-DNA-Sequenz, die für das Immunepitop codiert;
    dadurch Aufnehmen der Einzelstrang-DNA-Sequenz anstelle eines entsprechenden endogenen Strangs in die Target-Nukleotidsequenz durch einen DNA-Reparatur- und/oder Replikationsprozess;
    wobei das Verfahren eine modifizierte Target-Nukleotidsequenz erzeugt, die für ein Fusionsprotein codiert, welches das interessierende Protein und die Kleinmolekül-Dimerisierungsdomäne umfasst.
  • Ausführungsform 13. Das Verfahren der Ausführungsform 12, ferner umfassend ein Ausführen des Verfahrens an einem zweiten interessierenden Protein.
  • Ausführungsform 14. Das Verfahren der Ausführungsform 13, wobei das erste interessierende Protein und das zweite interessierende Protein in Gegenwart eines kleinen Moleküls dimerisieren, das an die Dimerisierungsdomäne auf jedem der Proteine bindet.
  • Ausführungsform 15. Das Verfahren der Ausführungsform 12, wobei die Kleinmolekül-Bindungsdomäne FKBP12 von SEQ ID NO: 488 ist.
  • Ausführungsform 16. Das Verfahren der Ausführungsform 12, wobei die Kleinmolekül-Bindungsdomäne FKBP12-F36V von SEQ ID NO: 489 ist.
  • Ausführungsform 17. Das Verfahren der Ausführungsform 12, wobei die Kleinmolekül-Bindungsdomäne Cyclophilin von SEQ ID NOs: 490 und 493-494 ist.
  • Ausführungsform 18. Das Verfahren der Ausführungsform 12, wobei das kleine Molekül ein Dimer eines kleinen Moleküls ist, wie hier beschrieben.
  • Ausführungsform 19. Das Verfahren der Ausführungsform 12, wobei das Fusionsprotein die Aminosäuresequenz von PE1, PE2 oder PE3 umfasst.
  • Ausführungsform 20. Das Verfahren der Ausführungsform 12, wobei das napDNAbp eine Cas9-Nickase (nCas9) ist.
  • Ausführungsform 21. Das Verfahren der Ausführungsform 12, wobei das napDNAbp die Aminosäuresequenz von SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467 und 482-487 umfasst.
  • Ausführungsform 22. Das Verfahren der Ausführungsform 12, wobei die PEgRNA SEQ ID NOs: 101-104, 181-183, 223-244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777 umfasst.
  • Ausführungsform 23. Verfahren zum Einbauen eines Peptid-Tags oder Epitops auf ein Protein unter Verwendung von Prime Editing, umfassend: Inkontaktbringen einer Target-Nukleotidsequenz, die für das Protein codiert, mit einem Prime Editor-Konstrukt, das konfiguriert ist, um darin eine zweite Nukleotidsequenz zu inserieren, die für das Peptid-Tag codiert, um eine rekombinante Nukleotidsequenz zu ergeben, so dass das Peptid-Tag und das Protein aus der rekombinanten Nukleotidsequenz als Fusionsprotein exprimiert werden.
  • Ausführungsform 24. Das Verfahren der Ausführungsform 23, wobei das Peptid-Tag zur Reinigung und/oder Detektion des Proteins verwendet wird.
  • Ausführungsform 25. Das Verfahren der Ausführungsform 23, wobei das Peptid-Tag ein Polyhistidin (z.B. HHHHHH) (SEQ ID NO: 252-262), FLAG (z.B.
    DYKDDDDK) (SEQ ID NO: 2), V5 (z.B. GKPIPNPLLGLDST) (SEQ ID NO: 3), GCN4, HA (z.B. YPYDVPDYA) (SEQ ID NO: 5), Myc (z.B. EQKLISEED) (SEQ ID NO: 6) oder GST ist.
  • Ausführungsform 26. Das Verfahren der Ausführungsform 23, wobei das Peptid-Tag eine Aminosäuresequenz aufweist, die aus der Gruppe ausgewählt ist, die aus SEQ ID NO: 1-6, 245-249, 252-262, 264-273, 275-276, 281, 278-288 und 622 besteht.
  • Ausführungsform 27. Das Verfahren der Ausführungsform 23, wobei das Peptid-Tag über einen Linker mit dem Protein fusioniert ist.
  • Ausführungsform 28. Das Verfahren der Ausführungsform 23, wobei das Fusionsprotein die folgende Struktur aufweist: [Protein]-[Peptid-Tag] oder [Peptid-Tag]-[Protein], wobei „]-[“ einen optionalen Linker darstellt.
  • Ausführungsform 29. Das Verfahren der Ausführungsform 23, wobei der Linker eine Aminosäuresequenz von SEQ ID NO: 127, 165-176, 446, 453 und 767-769 aufweist.
  • Ausführungsform 30. Das Verfahren der Ausführungsform 23, wobei das Prime Editor-Konstrukt eine PEgRNA umfasst, welche die Nukleotidsequenz von SEQ ID NOs: 101-104, 181-183, 223-244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777 umfasst.
  • Ausführungsform 31. Das Verfahren der Ausführungsform 23, wobei die PEgRNA einen Spacer, einen gRNA-Kern und einen Extension-Arm umfasst, wobei der Spacer komplementär zu der Target-Nukleotidsequenz ist und der Extension-Arm ein Reverse-Transkriptase-Template umfasst, das für das Peptid-Tag codiert.
  • Ausführungsform 32. Das Verfahren der Ausführungsform 23, wobei die PEgRNA einen Spacer, einen gRNA-Kern und einen Extension-Arm umfasst, wobei der Spacer komplementär zu der Target-Nukleotidsequenz ist und der Extension-Arm ein Reverse-Transkriptase-Template umfasst, das für das Peptid-Tag codiert.
  • Ausführungsform 33. Ein Verfahren zum Einbauen oder Deletieren einer funktionellen Gruppierung in einem interessierenden Protein, für das von einer Target-Nukleotidsequenz codiert wird, durch Prime Editing, wobei das wobei das Verfahren Folgendes umfasst: (a) Inkontaktbringen der Target-Nukleotidsequenz mit (i) einem Prime Editor, der ein Nukleinsäure-programmierbares DNA-Bindungsprotein (napDNAbp) und eine Polymerase umfasst, und (ii) einer PEgRNA, die ein Edit-Template umfasst, das für die funktionelle Gruppierung oder Deletion derselben codiert; (b) Polymerisieren einer Einzelstrang-DNA-Sequenz, die für die funktionelle Gruppierung oder Deletion derselben codiert; und (c) Aufnehmen der Einzelstrang-DNA-Sequenz anstelle eines entsprechenden endogenen Strangs in die Target-Nukleotidsequenz durch einen DNA-Reparatur- und/oder -Replikationsprozess, wobei das Verfahren eine rekombinante Target-Nukleotidsequenz erzeugt, die für ein modifiziertes Protein codiert, welches das interessierende Protein und die funktionelle Gruppierung umfasst, oder die Entfernung derselben, wobei die funktionelle Gruppierung einen Modifikationszustand oder Lokalisierungszustand des Proteins ändert.
  • Ausführungsform 34. Das Verfahren der Ausführungsform 33, wobei eine funktionelle Gruppierung den Phosphorylierungs-, Ubiquitylierungs-, Glykosylierungs-, Lipidierungs-, Hydroxylierungs-, Methylierungs-, Acetylierungs-, Crotonylierungs- oder SUMOylierungszustand des interessierenden Proteins ändert.
  • GRUPPE F. PE-ABGABEVERFAHREN UND ZUSAMMENSETZUNGEN
  • Ausführungsform 1. Ein Polypeptid, das eine N-terminale Hälfte oder eine C-terminale Hälfte eines Prime Editor-Fusionsproteins umfasst.
  • Ausführungsform 2. Das Polypeptid der Ausführungsform 1, wobei das Prime Editor-Fusionsprotein eine Domäne eines Nukleinsäure-programmierbaren DNA-Bindungsproteins (napDNAbp-Domäne) und eine Polymerasedomäne umfasst.
  • Ausführungsform 3. Das Polypeptid der Ausführungsform 1, wobei das Prime Editor-Fusionsprotein in der Lage ist, ein Prime Editing in Gegenwart einer Prime Editing-Guide-RNA (PEgRNA) auszuführen.
  • Ausführungsform 4. Das Polypeptid der Ausführungsform 2, wobei das napDNAbp ein Cas9-Protein oder eine Variante davon ist.
  • Ausführungsform 5. Das Polypeptid der Ausführungsform 2, wobei das napDNAbp eine Nuklease mit Nickase-Aktivität ist.
  • Ausführungsform 6. Das Polypeptid der Ausführungsform 2, wobei das napDNAbp ein Nuklease-aktives Cas9, ein Nuklease-inaktives Cas9 (dCas9) oder eine Cas9-Nickase (nCas9) ist.
  • Ausführungsform 7. Das Polypeptid der Ausführungsform 2, wobei das napDNAbp aus der Gruppe ausgewählt ist, die aus Cas9, Cas12e, Cas12d, Cas12a, Cas12b1, Cas13a, Cas12c und Argonaute besteht, und optional eine Nickase-Aktivität aufweist.
  • Ausführungsform 8. Das Polypeptid der Ausführungsform 1, wobei das Polypeptid durch Spaltung eines Prime Editor-Fusionsproteins an einer Spaltstelle gebildet ist.
  • Ausführungsform 9. Das Polypeptid der Ausführungsform 8, wobei die Spaltstelle eine Peptidbindung in der napDNAbp-Domäne ist.
  • Ausführungsform 10. Das Polypeptid der Ausführungsform 8, wobei die Spaltstelle eine Peptidbindung in der Polymerasedomäne ist.
  • Ausführungsform 11. Das Polypeptid der Ausführungsform 8, wobei die Spaltstelle eine Peptidbindung in einem Linker zwischen der napDNAbp-Domäne und der Polymerasedomäne ist.
  • Ausführungsform 12. Das Polypeptid der Ausführungsform 9, wobei sich die Spaltstelle in der Peptidbindung zwischen den Resten 1 und 2, 2 und 3, 3 und 4, 4 und 5, 5 und 6, 6 und 7, 7 und 8, 8 und 9, 9 und 10, 10 und 11, 11 und 12, 12 und 13, 13 und 14, 14 und 15, 16 und 17, 17 und 18, 18 und 19, 19 und 20, 20 und 21, 21 und 22, 22 und 23, 23 und 24, 24 und 25, 25 und 26, 26 und 27, 27 und 28, 28 und 29, 29 und 30, 30 und 31, 31 und 32, 32 und 33, 33 und 34, 34 und 35, 35 und 36, 36 und 37, 37 und 38, 38 und 39, 39 und 40, 40 und 41, 41 und 42, 42 und 43, 43 und 44, 44 und 45, 45 und 46, 46 und 47, 47 und 48, 48 und 49, 49 und 50 oder zwischen zwei beliebigen Resten zwischen den Resten 50-100, 100-150, 150-200, 200-250, 250-300, 300-350, 350-400, 400-450, 450-500, 500-600, 600-700, 700-800, 800-900, 900-1000, 1000-1100, 1100-1200, 1200-1300 oder 1300-1368 von SEQ ID NO: 18 (kanonisches SpCas9) oder zwischen zwei beliebigen äquivalenten Aminosäureresten eines SpCas9-Homologs oder -Äquivalents von SEQ ID NO: 18 befindet.
  • Ausführungsform 13. Das Polypeptid der Ausführungsform 9, wobei sich die Spaltstelle in der Peptidbindung zwischen den Resten 1 und 2, 2 und 3, 3 und 4, 4 und 5, 5 und 6, 6 und 7, 7 und 8, 8 und 9, 9 und 10, 10 und 11, 11 und 12, 12 und 13, 13 und 14, 14 und 15, 16 und 17, 17 und 18, 18 und 19, 19 und 20, 20 und 21, 21 und 22, 22 und 23, 23 und 24, 24 und 25, 25 und 26, 26 und 27, 27 und 28, 28 und 29, 29 und 30, 30 und 31, 31 und 32, 32 und 33, 33 und 34, 34 und 35, 35 und 36, 36 und 37, 37 und 38, 38 und 39, 39 und 40, 40 und 41, 41 und 42, 42 und 43, 43 und 44, 44 und 45, 45 und 46, 46 und 47, 47 und 48, 48 und 49, 49 und 50 oder zwischen zwei beliebigen Resten zwischen den Resten 50-100, 100-150, 150-200, 200-250, 250-300, 300-350, 350-400, 400-450, 450-500, 500-600 oder 600-667 von SEQ ID NO: 89 (kanonische reverse Transkriptase, M-MLV RT) oder zwischen zwei beliebigen äquivalenten Aminosäureresten eines Reverse-Transkriptase-Homologs oder -Äquivalents von SEQ ID NO: 89 befindet.
  • Ausführungsform 14. Das Polypeptid der Ausführungsform 1, wobei das Polypeptid eine N-terminale Hälfte eines Prime Editor-Fusionsproteins ist.
  • Ausführungsform 15. Das Polypeptid der Ausführungsform 1, wobei das Polypeptid eine C-terminale Hälfte eines Prime Editor-Fusionsproteins ist.
  • Ausführungsform 16. Eine Nukleotidsequenz, die für ein Polypeptid einer der Ausführungsformen 1-15 und optional eine PEgRNA codiert.
  • Ausführungsform 17. Ein Virusgenom, das eine Nukleotidsequenz umfasst, die für ein Polypeptid einer der Ausführungsformen 1-15 und optional eine PEgRNA codiert.
  • Ausführungsform 18. Das Virusgenom der Ausführungsform 17, wobei die Nukleotidsequenz ferner eine Promotorsequenz umfasst, die zum Exprimieren des Polypeptids einer der Ausführungsformen 1-15 geeignet ist.
  • Ausführungsform 19. Das Virusgenom der Ausführungsform 17, wobei die Nukleotidsequenz ferner eine Sequenz umfasst, die für eine PEgRNA codiert.
  • Ausführungsform 20. Ein Viruspartikel, das ein Genom umfasst, das eine Nukleotidsequenz umfasst, die für ein Polypeptid einer der Ausführungsformen 1-15 und optional für eine PEgRNA codiert.
  • Ausführungsform 21. Das Viruspartikel der Ausführungsform 20, wobei das Viruspartikel ein Adenovirus-Partikel, ein Adeno-assoziiertes Viruspartikel oder ein Lentivirus-Partikel ist.
  • Ausführungsform 22. Das Viruspartikel der Ausführungsform 20, wobei das durch das Genom codierte Polypeptid eine N-terminale Hälfte eines Prime Editor-Fusionsproteins ist.
  • Ausführungsform 23. Das Viruspartikel der Ausführungsform 20, wobei das durch das Genom codierte Polypeptid eine C-terminale Hälfte eines Prime Editor-Fusionsproteins ist.
  • Ausführungsform 24. Eine pharmazeutische Zusammensetzung, die ein Viruspartikel einer der Ausführungsformen 20-23 und einen pharmazeutischen Hilfsstoff umfasst.
  • Ausführungsform 25. Eine pharmazeutische Zusammensetzung, die ein Viruspartikel der Ausführungsform 22 (das die N-terminale Hälfte codiert) und einen pharmazeutischen Hilfsstoff umfasst.
  • Ausführungsform 26. Eine pharmazeutische Zusammensetzung, die ein Viruspartikel der Ausführungsform 23 (das die C-terminale Hälfte codiert) und einen pharmazeutischen Hilfsstoff umfasst.
  • Ausführungsform 27. Ein Ribonukleoprotein-Komplex (RNP-Komplex), der eine Nukleotidsequenz umfasst, die für ein Polypeptid einer der Ausführungsformen 1-15 und optional für eine PEgRNA codiert.
  • Ausführungsform 28. Der Ribonukleoprotein-Komplex (RNP-Komplex) der Ausführungsform 27, wobei das durch das Genom codierte Polypeptid eine N-terminale Hälfte eines Prime Editor-Fusionsproteins ist.
  • Ausführungsform 29. Der Ribonukleoprotein-Komplex (RNP-Komplex) der Ausführungsform 27, wobei das durch das Genom codierte Polypeptid eine C-terminale Hälfte eines Prime Editor-Fusionsproteins ist.
  • Ausführungsform 30. Eine pharmazeutische Zusammensetzung, die einen Ribonukleoprotein-Komplex (RNP-Komplex) einer beliebigen der Ausführungsformen 27-29 und einen pharmazeutischen Hilfsstoff umfasst.
  • Ausführungsform 31. Eine pharmazeutische Zusammensetzung, die den Ribonukleoprotein-Komplex (RNP-Komplex) der Ausführungsform 28 (der für die N-terminale Hälfte codiert) und einen pharmazeutischen Hilfsstoff umfasst.
  • Ausführungsform 32. Eine pharmazeutische Zusammensetzung, die den Ribonukleoprotein-Komplex (RNP-Komplex) der Ausführungsform 29 (der für die C-terminale Hälfte codiert) und einen pharmazeutischen Hilfsstoff umfasst.
  • Ausführungsform 33. Eine pharmazeutische Zusammensetzung, die ein erstes AAV-Partikel und ein zweites AAV-Partikel umfasst, wobei der erste AAV-Vektor eine N-terminale Hälfte eines Prime Editor-Fusionsproteins exprimiert und der zweite AAV-Vektor eine C-terminale Hälfte eines Prime Editor-Fusionsproteins exprimiert, wobei die N-terminale Hälfte und die C-terminale Hälfte innerhalb der Zelle kombiniert werden, um den Prime Editor zu rekonstituieren.
  • Ausführungsform 34. Die pharmazeutische Zusammensetzung der Ausführungsform 33, wobei das erste oder zweite AAV-Partikel auch eine PEgRNA exprimiert, die den rekonstituierten Prime Editor zu einer Target-DNA-Stelle lenkt.
  • Ausführungsform 35. Die pharmazeutische Zusammensetzung der Ausführungsform 33, wobei das Prime Editor-Fusionsprotein eine Domäne eines Nukleinsäure-programmierbaren DNA-Bindungsproteins (napDNAbp-Domäne) und eine Polymerasedomäne umfasst.
  • Ausführungsform 36. Die pharmazeutische Zusammensetzung der Ausführungsform 33, wobei das Prime Editor-Fusionsprotein in der Lage ist, ein Prime Editing in Gegenwart einer Prime Editing-Guide-RNA (PEgRNA) auszuführen.
  • Ausführungsform 37. Die pharmazeutische Zusammensetzung der Ausführungsform 35, wobei das napDNAbp ein Cas9-Protein oder eine Variante davon ist.
  • Ausführungsform 38. Die pharmazeutische Zusammensetzung der Ausführungsform 35, wobei das napDNAbp eine Nuklease mit einer Nickase-Aktivität ist.
  • Ausführungsform 39. Die pharmazeutische Zusammensetzung der Ausführungsform 35, wobei das napDNAbp ein Nuklease-aktives Cas9, ein Nuklease-inaktives Cas9 (dCas9) oder eine Cas9-Nickase (nCas9) ist.
  • Ausführungsform 40. Die pharmazeutische Zusammensetzung der Ausführungsform 35, wobei das napDNAbp aus der Gruppe ausgewählt ist, die aus Cas9, Cas12e, Cas12d, Cas12a, Cas12b1, Cas13a, Cas12c und Argonaute besteht, und optional eine Nickase-Aktivität aufweist.
  • Ausführungsform 41. Die pharmazeutische Zusammensetzung der Ausführungsform 33, wobei N-terminale und C-terminale Hälften durch Spalten des Prime Editor-Fusionsproteins an einer Spaltstelle gebildet sind.
  • Ausführungsform 42. Die pharmazeutische Zusammensetzung der Ausführungsform 41, wobei die Spaltstelle eine Peptidbindung in einer napDNAbp-Domäne ist.
  • Ausführungsform 43. Die pharmazeutische Zusammensetzung der Ausführungsform 41, wobei die Spaltstelle eine Peptidbindung in einer Polymerasedomäne ist.
  • Ausführungsform 44. Die pharmazeutische Zusammensetzung der Ausführungsform 41, wobei die Spaltstelle eine Peptidbindung in einem Linker ist.
  • Ausführungsform 45. Die pharmazeutische Zusammensetzung der Ausführungsform 41, wobei sich die Spaltstelle in der Peptidbindung zwischen den Resten 1 und 2, 2 und 3, 3 und 4, 4 und 5, 5 und 6, 6 und 7, 7 und 8, 8 und 9, 9 und 10, 10 und 11, 11 und 12, 12 und 13, 13 und 14, 14 und 15, 16 und 17, 17 und 18, 18 und 19, 19 und 20, 20 und 21, 21 und 22, 22 und 23, 23 und 24, 24 und 25, 25 und 26, 26 und 27, 27 und 28, 28 und 29, 29 und 30, 30 und 31, 31 und 32, 32 und 33, 33 und 34, 34 und 35, 35 und 36, 36 und 37, 37 und 38, 38 und 39, 39 und 40, 40 und 41, 41 und 42, 42 und 43, 43 und 44, 44 und 45, 45 und 46, 46 und 47, 47 und 48, 48 und 49, 49 und 50 oder zwischen zwei beliebigen Resten zwischen den Resten 50-100, 100-150, 150-200, 200-250, 250-300, 300-350, 350-400, 400-450, 450-500, 500-600, 600-700, 700-800, 800-900, 900-1000, 1000-1100, 1100-1200, 1200-1300 oder 1300-1368 von SEQ ID NO: 18 (kanonisches SpCas9) oder zwischen zwei beliebigen äquivalenten Aminosäurenresten eines SpCas9-Homologs oder -Äquivalents von SEQ ID NO: 18 befindet.
  • Ausführungsform 46. Die pharmazeutische Zusammensetzung der Ausführungsform 41, wobei sich die Spaltstelle in der Peptidbindung zwischen den Resten 1 und 2, 2 und 3, 3 und 4, 4 und 5, 5 und 6, 6 und 7, 7 und 8, 8 und 9, 9 und 10, 10 und 11, 11 und 12, 12 und 13, 13 und 14, 14 und 15, 16 und 17, 17 und 18, 18 und 19, 19 und 20, 20 und 21, 21 und 22, 22 und 23, 23 und 24, 24 und 25, 25 und 26, 26 und 27, 27 und 28, 28 und 29, 29 und 30, 30 und 31, 31 und 32, 32 und 33, 33 und 34, 34 und 35, 35 und 36, 36 und 37, 37 und 38, 38 und 39, 39 und 40, 40 und 41, 41 und 42, 42 und 43, 43 und 44, 44 und 45, 45 und 46, 46 und 47, 47 und 48, 48 und 49, 49 und 50 oder zwischen zwei beliebigen Resten zwischen den Resten 50-100, 100-150, 150-200, 200-250, 250-300, 300-350, 350-400, 400-450, 450-500, 500-600 oder 600-667 von SEQ ID NO: 89 (kanonische reverse Transkriptase, M-MLV RT) oder zwischen zwei beliebigen äquivalenten Aminosäureresten eines Reverse-Transkriptase-Homologs oder -Äquivalents von SEQ-ID-NO: 89 befindet.
  • Ausführungsform 47. Die pharmazeutische Zusammensetzung der Ausführungsform 33, wobei die N-terminale Hälfte des Prime Editor-Fusionsproteins eine Aminosäuresequenz aufweist, die für die N-terminalen Prime Editor-Fusionsproteine codiert, wie hier beschrieben.
  • Ausführungsform 48. Die pharmazeutische Zusammensetzung der Ausführungsform 33, wobei die C-terminale Hälfte des Prime Editor-Fusionsproteins eine Aminosäuresequenz aufweist, die für die N-terminalen Prime Editor-Fusionsproteine codiert, wie hier beschrieben.
  • Ausführungsform 49. Ein Verfahren zum Abgeben eines Prime Editor-Fusionsproteins an eine Zelle, das ein Transfizieren der Zelle mit einem ersten AAV-Partikel und einem zweiten AAV-Partikel umfasst, wobei der erste AAV-Vektor eine N-terminale Hälfte eines Prime Editor-Fusionsproteins exprimiert und der zweite AAV-Vektor eine C-terminale Hälfte eines Prime Editor-Fusionsproteins exprimiert, wobei die N-terminale Hälfte und die C-terminale Hälfte innerhalb der Zelle kombiniert werden, um das Prime Editor-Fusionsprotein zu rekonstituieren.
  • Ausführungsform 50. Das Verfahren der Ausführungsform 49, wobei das erste oder zweite AAV-Partikel auch eine PEgRNA exprimiert, die den rekonstituierten Prime Editor zu einer Target-DNA-Stelle lenkt.
  • Ausführungsform 51. Das Verfahren der Ausführungsform 49, wobei das Prime Editor-Fusionsprotein eine Domäne eines Nukleinsäure-programmierbaren DNA-Bindungsproteins (napDNAbp-Domäne) und eine Polymerasedomäne umfasst.
  • Ausführungsform 52. Das Verfahren der Ausführungsform 49, wobei das Prime Editor-Fusionsprotein in der Lage ist, ein Prime Editing in Gegenwart einer Prime Editing-Guide-RNA (PEgRNA) auszuführen.
  • Ausführungsform 53. Das Verfahren der Ausführungsform 51, wobei das napDNAbp ein Cas9-Protein oder eine Variante davon ist.
  • Ausführungsform 54. Das Verfahren der Ausführungsform 53, wobei das napDNAbp eine Nuklease mit Nickase-Aktivität ist.
  • Ausführungsform 55. Das Verfahren der Ausführungsform 53, wobei das napDNAbp ein Nuklease-aktives Cas9, ein Nuklease-inaktives Cas9 (dCas9) oder eine Cas9-Nickase (nCas9) ist.
  • Ausführungsform 56. Das Verfahren der Ausführungsform 53, wobei das napDNAbp aus der Gruppe ausgewählt ist, die aus Cas9, Cas12e, Cas12d, Cas12a, Cas12b1, Cas13a, Cas12c und Argonaute besteht, und optional eine Nickase-Aktivität aufweist.
  • Ausführungsform 57. Das Verfahren der Ausführungsform 49, wobei N-terminale und C-terminale Hälften durch Spalten des Prime Editor-Fusionsproteins an einer Spaltstelle gebildet werden.
  • Ausführungsform 58. Das Verfahren der Ausführungsform 57, wobei die Spaltstelle eine Peptidbindung in einer napDNAbp-Domäne ist.
  • Ausführungsform 59. Das Verfahren der Ausführungsform 57, wobei die Spaltstelle eine Peptidbindung in einer Polymerasedomäne ist.
  • Ausführungsform 60. Das Verfahren der Ausführungsform 57, wobei die Spaltstelle eine Peptidbindung in einem Linker ist.
  • Ausführungsform 61. Das Verfahren der Ausführungsform 57, wobei sich die Spaltstelle in der Peptidbindung zwischen den Resten 1 und 2, 2 und 3, 3 und 4, 4 und 5, 5 und 6, 6 und 7, 7 und 8, 8 und 9, 9 und 10, 10 und 11, 11 und 12, 12 und 13, 13 und 14, 14 und 15, 16 und 17, 17 und 18, 18 und 19, 19 und 20, 20 und 21, 21 und 22, 22 und 23, 23 und 24, 24 und 25, 25 und 26, 26 und 27, 27 und 28, 28 und 29, 29 und 30, 30 und 31, 31 und 32, 32 und 33, 33 und 34, 34 und 35, 35 und 36, 36 und 37, 37 und 38, 38 und 39, 39 und 40, 40 und 41, 41 und 42, 42 und 43, 43 und 44, 44 und 45, 45 und 46, 46 und 47, 47 und 48, 48 und 49, 49 und 50 oder zwischen zwei beliebigen Resten zwischen den Resten 50-100, 100-150, 150-200, 200-250, 250-300, 300-350, 350-400, 400-450, 450-500, 500-600, 600-700, 700-800, 800-900, 900-1000, 1000-1100, 1100-1200, 1200-1300 oder 1300-1368 von SEQ ID NO: 18 (kanonisches SpCas9) oder zwischen zwei beliebigen äquivalenten Aminosäureresten eines SpCas9-Homologs oder -Äquivalents von SEQ ID NO: 18 befindet.
  • Ausführungsform 62. Das Verfahren der Ausführungsform 57, wobei sich die Spaltstelle in der Peptidbindung zwischen den Resten 1 und 2, 2 und 3, 3 und 4, 4 und 5, 5 und 6, 6 und 7, 7 und 8, 8 und 9, 9 und 10, 10 und 11, 11 und 12, 12 und 13, 13 und 14, 14 und 15, 16 und 17, 17 und 18, 18 und 19, 19 und 20, 20 und 21, 21 und 22, 22 und 23, 23 und 24, 24 und 25, 25 und 26, 26 und 27, 27 und 28, 28 und 29, 29 und 30, 30 und 31, 31 und 32, 32 und 33, 33 und 34, 34 und 35, 35 und 36, 36 und 37, 37 und 38, 38 und 39, 39 und 40, 40 und 41, 41 und 42, 42 und 43, 43 und 44, 44 und 45, 45 und 46, 46 und 47, 47 und 48, 48 und 49, 49 und 50 oder zwischen zwei beliebigen Resten zwischen den Resten 50-100, 100-150, 150-200, 200-250, 250-300, 300-350, 350-400, 400-450, 450-500, 500-600 oder 600-667 von SEQ ID NO: 89 (kanonische reverse Transkriptase, M-MLV RT) oder zwischen zwei beliebigen äquivalenten Aminosäureresten eines Reverse-Transkriptase-Homologs oder -Äquivalents von SEQ ID NO: 89 befindet.
  • Ausführungsform 63. Das Verfahren der Ausführungsform 49, wobei die N-terminale Hälfte des Prime Editor-Fusionsproteins eine Aminosäuresequenz aufweist, die für die N-terminalen Prime Editor-Fusionsproteine codiert, wie hier beschrieben.
  • Ausführungsform 64. Das Verfahren der Ausführungsform 49, wobei die C-terminale Hälfte des Prime Editor-Fusionsproteins eine Aminosäuresequenz aufweist, die für die C-terminalen Prime Editor-Fusionsproteine codiert, wie hier beschrieben.
  • Ausführungsform 65. Das Verfahren der Ausführungsform 49, wobei das erste AAV-Partikel ein rekombinantes AAV-Genom umfasst, das eine Nukleotidsequenz umfasst, die für die erste Prime Editor-Komponente codiert.
  • Ausführungsform 66. Das Verfahren der Ausführungsform 49, wobei das zweite AAV-Partikel ein rekombinantes AAV-Genom umfasst, das eine Nukleotidsequenz umfasst, die für die zweite Prime Editor-Komponente codiert.
  • Ausführungsform 67. Das Verfahren der Ausführungsform 49, wobei der Transfektionsschritt in vivo ausgeführt wird.
  • Ausführungsform 68. Das Verfahren der Ausführungsform 49, wobei der Transfektionsschritt ex vivo ausgeführt wird
  • Ausführungsform 69. Das Verfahren der Ausführungsform 50, wobei die Target-DNA-Stelle ein krankheitsassoziiertes Gen ist.
  • Ausführungsform 70. Das Verfahren der Ausführungsform 69, wobei das krankheitsassoziierte Gen mit einer monogenen Störung assoziiert ist, die aus der Gruppe ausgewählt ist, die aus Adenosindeaminase-Mangel (ADA-Mangel); Alpha-1-Antitrypsin-Mangel; Mukoviszidose; Duchenne-Muskeldystrophie; Galaktosämie; Hämochromatose; Huntington-Krankheit; Ahornsirupkrankheit; Marfan-Syndrom; Neurofibromatose Typ 1; Pachyonychia congenita; Phenylketonurie; schwerem kombiniertem Immundefekt; Sichelzellenanämie; Smith-Lemli-Opitz-Syndrom; einer Trinukleotid-Repeat-Störung; einer Prionenkrankheit; und Tay-Sachs-Krankheit besteht.
  • Ausführungsform 71. Das Verfahren der Ausführungsform 69, wobei das krankheitsassoziierte Gen mit einer polygenen Störung assoziiert ist, die aus der Gruppe ausgewählt ist, die aus Herzkrankheit; Bluthochdruck; Alzheimer-Krankheit; Arthritis; Diabetes; Krebs; und Fettleibigkeit besteht.
  • Ausführungsform 72. Das Verfahren der Ausführungsform 51, wobei die Domäne des programmierbaren DNA-Bindungsproteins (napDNAbp-Domäne).
  • Ausführungsform 73. Das Verfahren der Ausführungsform 51, wobei die Polymerasedomäne eine reverse Transkriptase ist.
  • Ausführungsform 74. Das Verfahren der Ausführungsform 73, wobei die reverse Transkriptase eine beliebige der Aminosäuresequenzen von SEQ ID NO: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741 und 766 umfasst.
  • Ausführungsform 75. Das Verfahren der Ausführungsform 73, wobei die reverse Transkriptase eine Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % Sequenzidentität mit der Aminosäuresequenz einer beliebigen von SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741 und 766 umfasst.
  • Ausführungsform 76. Das Verfahren der Ausführungsform 73, wobei das napDNAbp eine Aminosäuresequenz von SEQ ID NO: 18 umfasst.
  • Ausführungsform 77. Das Verfahren der Ausführungsform 73, wobei das napDNAbp eine Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % Sequenzidentität mit der Aminosäuresequenz einer beliebigen von SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467 und 482-487 umfasst.
  • Ausführungsform 78. Das Polypeptid der Ausführungsform 8, wobei sich die Spaltstelle zwischen 1023 und 1024 von SEQ ID NO: 18 oder an einer entsprechenden Position in einer Aminosäuresequenz mit mindestens 85 %, mindestens 90 %, mindestens 95 %, mindestens 99 % oder mindestens 99,5 % Sequenzidentität mit SEQ ID NO: 18 befindet.
  • GRUPPE G. PE-VERFAHREN ZUR MODIFIZIERUNG VON RNA-STRUKTUIN-FUNKTION
  • Ausführungsform 1. Ein Verfahren zum Einbauen eines Ribonukleotid-Motiv s oder -Tags in einer interessierenden RNA, für die von einer Target-Nukleotidsequenz codiert wird, durch Prime Editing, wobei das Verfahren Folgendes umfasst: (a) Inkontaktbringen der Target-Nukleotidsequenz mit (i) einem Prime Editor, der ein Nukleinsäure-programmierbares DNA-Bindungsprotein (napDNAbp) und eine Polymerase umfasst, und (ii) einer PEgRNA, die ein Edit-Template umfasst, das für das Ribonukleotid-Motiv oder -Tag codiert; dadurch Polymerisieren einer Einzelstrang-DNA-Sequenz, die für das Ribonukleotid-Motiv oder -Tag codiert; und Einbauen der Einzelstrang-DNA-Sequenz anstelle eines entsprechenden endogenen Strangs in die Target-Nukleotidsequenz durch einen DNA-Reparatur- und/oder -Replikationsprozess, wobei das Verfahren eine Target-Nukleotidsequenz erzeugt, die für eine modifizierte interessierende RNA codiert, die das Ribonukleotid-Motiv oder -Tag umfasst.
  • Ausführungsform 2. Das Verfahren der Ausführungsform 1, wobei das Ribonukleotid-Motiv oder -Tag eine Detektionsgruppierung ist.
  • Ausführungsform 3. Das Verfahren der Ausführungsform 1, wobei das Ribonukleotid-Motiv oder -Tag das Expressionsniveau der interessierenden RNA beeinflusst.
  • Ausführungsform 4. Das Verfahren der Ausführungsform 1, wobei das Ribonukleotid-Motiv oder -Tag den Transport oder die subzelluläre Lokalisierung der interessierenden RNA beeinflusst.
  • Ausführungsform 5. Das Verfahren der Ausführungsform 1, wobei das Ribonukleotid-Motiv oder -Tag aus der Gruppe ausgewählt ist, die aus SV40 Typ 1, SV40 Typ 2, SV40 Typ 3, hGH, BGH, rbGlob, TK, MALAT1 ENE-mascRNA, KSHV PAN ENE, Smbox/U1 snRNA-Box, U1 snRNA 3'-Box, tRNA-Lysin, Brokkoli-Aptamer, Spinat-Aptamer, Mango-Aptamer, HDV-Ribozym und m6A besteht.
  • Ausführungsform 6. Das Verfahren der Ausführungsform 1, wobei die PEgRNA SEQ ID NOs: 101-104, 181-183, 223-244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777 umfasst (siehe Tabelle).
  • Ausführungsform 7. Das Verfahren der Ausführungsform 1, wobei das Fusionsprotein die Aminosäuresequenz von PE1, PE2 oder PE3 umfasst.
  • Ausführungsform 8. Das Verfahren der Ausführungsform 1, wobei das napDNAbp eine Cas9-Nickase (nCas9) ist.
  • Ausführungsform 9. Das Verfahren der Ausführungsform 1, wobei das napDNAbp die Aminosäuresequenz von SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467 und 482-487 umfasst.
  • GRUPPE H. PE-VERFAHREN ZUR HERSTELLUNG VON GENBIBLIOTHEKEN
  • Ausführungsform 1. Ein Verfahren zum Konstruieren einer Genbibliothek programmierter Mutanten durch Prime Editing, wobei das Verfahren Folgendes umfasst:
    • (a) Inkontaktbringen einer Bibliothek von Target-Nukleotidsequenzen, die jeweils einen oder mehrere genetische Target-Loci umfassen, mit (i) einem Prime Editor, der ein Nukleinsäure-programmierbares DNA-Bindungsprotein (napDNAbp) und eine Polymerase umfasst, und (ii) einer PEgRNA, die ein Edit-Template umfasst, das eine Sequenz mit mindestens einer genetischen Änderung mit Bezug auf den einen oder die mehreren genetischen Target-Loci umfasst;
    • dadurch Polymerisieren einer Einzelstrang-DNA-Sequenz, die von dem Edit-Template templatiert wird; und
    • Einbauen der Einzelstrang-DNA-Sequenz anstelle des einen oder der mehreren genetischen Target-Loci durch einen DNA-Reparatur- und/oder Replikationsprozess, dadurch Aufnehmen der mindestens einen genetischen Änderung in die genetischen Target-Loci der Target-Nukleotidsequenzen der Bibliothek.
  • Ausführungsform 2. Das Verfahren der Ausführungsform 1, wobei die Bibliothek eine Plasmid-Bibliothek ist.
  • Ausführungsform 3. Das Verfahren der Ausführungsform 1, wobei die Bibliothek eine Phagen-Bibliothek ist.
  • Ausführungsform 4. Das Verfahren der Ausführungsform 1, wobei der eine oder die mehreren genetischen Target-Loci einen Bereich umfassen, der für Protein codiert.
  • Ausführungsform 5. Das Verfahren der Ausführungsform 1, wobei das eine oder die mehreren genetischen Target-Loci einen Bereich umfassen, der für ein Sekundärstrukturmotiv eines Proteins codiert.
  • Ausführungsform 6. Das Verfahren der Ausführungsform 5, wobei das Sekundärstrukturmotiv eine Alpha-Helix ist.
  • Ausführungsform 7. Das Verfahren der Ausführungsform 5, wobei das Sekundärstrukturmotiv ein Beta-Faltblatt ist.
  • Ausführungsform 8. Das Verfahren der Ausführungsform 1, wobei das napDNAbp ein Cas9-Protein oder eine Variante davon ist.
  • Ausführungsform 9. Das Verfahren der Ausführungsform 1, wobei das napDNAbp eine Nuklease mit Nickase-Aktivität ist.
  • Ausführungsform 10. Das Verfahren der Ausführungsform 1, wobei das napDNAbp ein Nuklease-aktives Cas9, ein Nuklease-inaktives Cas9 (dCas9) oder eine Cas9-Nickase (nCas9) ist.
  • Ausführungsform 11. Das Verfahren der Ausführungsform 1, wobei das napDNAbp eine Aminosäuresequenz von SEQ ID NO: 18 umfasst.
  • Ausführungsform 12. Das Verfahren der Ausführungsform 1, wobei das napDNAbp eine Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % Sequenzidentität mit der Aminosäuresequenz einer beliebigen von SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467 und 482-487 umfasst.
  • Ausführungsform 13. Das Verfahren der Ausführungsform 1, wobei die Polymerasedomäne eine reverse Transkriptase ist.
  • Ausführungsform 14. Das Verfahren der Ausführungsform 13, wobei die reverse Transkriptase eine beliebige der Aminosäuresequenzen von SEQ ID NO: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741 und 766 umfasst.
  • Ausführungsform 15. Das Verfahren der Ausführungsform 14, wobei die reverse Transkriptase eine Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % Sequenzidentität mit der Aminosäuresequenz einer beliebigen von SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741 und 766 umfasst.
  • Ausführungsform 16. Das Verfahren der Ausführungsform 1, wobei die mindestens eine genetische Änderung in dem Edit-Template eine Insertion ist.
  • Ausführungsform 17. Das Verfahren der Ausführungsform 1, wobei die mindestens eine genetische Änderung in dem Edit-Template eine Deletion ist.
  • Ausführungsform 18. Das Verfahren der Ausführungsform 1, wobei die mindestens eine genetische Änderung in dem Edit-Template eine Substitution ist.
  • Ausführungsform 19. Das Verfahren der Ausführungsform 1, wobei die mindestens eine genetische Änderung eine Insertion eines oder mehrerer Codons ist.
  • Ausführungsform 20. Das Verfahren der Ausführungsform 1, wobei die mindestens eine genetische Änderung eine Deletion eines oder mehrerer Codons ist.
  • Ausführungsform 21. Das Verfahren der Ausführungsform 1, wobei die mindestens eine genetische Änderung die Insertion eines Stopcodons ist.
  • Ausführungsform 22. Das Verfahren der Ausführungsform 1, wobei die mindestens eine genetische Änderung die Umwandlung eines Nicht-Stop-Codons in ein Stop-Codon ist.
  • Ausführungsform 23. Das Verfahren der Ausführungsform 1, wobei das Verfahren gleichzeitig mindestens 2 oder 3 oder 4 oder 5 oder 6 oder 7 oder 8 oder 9 oder 10 oder zwischen 10-100 oder zwischen 100-200 oder zwischen 200-300 oder zwischen 300-400 oder zwischen 400-500 genetische Target-Loci in jeder der Target-Nukleotidsequenzen der Bibliothek ausführt.
  • Ausführungsform 24. Das Verfahren der Ausführungsform 1, wobei das Verfahren während der PACE- oder PANCE-Evolution ausgeführt wird und wobei jeder Fall eines Einbauens der mindestens einen genetischen Änderung in die genetischen Target-Loci der Target-Nukleotidsequenzen der Bibliothek auch eine neue Target-Sequenz einbaut.
  • GRUPPE I. PE-METHODEN ZUR OFF-TARGET-ERKENNUNG
  • Ausführungsform 1. Ein Verfahren zum Untersuchen von Off-Target-Editing durch einen Prime Editor, wobei das wobei das Verfahren Folgendes umfasst:
    • (a) Inkontaktbringen einer Target-Nukleotidsequenz mit einer Edit-Stelle mit (i) einem Prime Editor-Fusionsprotein, das ein Nukleinsäure-programmierbares DNA-Bindungsprotein (napDNAbp) und eine Polymerase umfasst, und (ii) einer PEgRNA, die ein DNA-Synthese-Template umfasst, das für eine detektierbare Sequenz codiert;
    • wobei die PEgRNA mit dem Fusionsprotein komplexiert und das Fusionsprotein zu der Edit-Stelle und, falls vorhanden, zu einer oder mehreren Off-Target-Stellen führt;
    • und wobei das Prime Editor-Fusionsprotein die detektierbare Sequenz an der Edit-Stelle und, falls vorhanden, an der einen oder mehreren Off-Target-Stellen einbaut;
    • (b) Bestimmen der Nukleotidsequenz der Edit-Stelle und der einen oder mehreren Off-Target-Stellen.
  • Ausführungsform 2. Das Verfahren der Ausführungsform 1, wobei die Target-Nukleotidsequenz ein Genom ist.
  • Ausführungsform 3. Das Verfahren der Ausführungsform 1, wobei der Schritt des Inkontaktbringens in vitro erfolgt:
  • Ausführungsform 4. Das Verfahren der Ausführungsform 1, wobei der Schritt des Inkontaktbringens in vivo erfolgt.
  • Ausführungsform 5. Das Verfahren der Ausführungsform 1, wobei die Edit-Stelle eine Mutation in einem krankheitsassoziierten Gen ist.
  • Ausführungsform 6. Das Verfahren der Ausführungsform 5, wobei die Mutation eine Einzelbasen-Substitution, -Insertion, -Deletion oder -Inversion ist.
  • Ausführungsform 7. Das Verfahren der Ausführungsform 1, wobei das krankheitsassoziierte Gen mit einer monogenen Störung assoziiert ist, die aus der Gruppe ausgewählt ist, die aus Adenosindeaminase-Mangel (ADA-Mangel); Alpha-1-Antitrypsin-Mangel; Mukoviszidose; Duchenne-Muskeldystrophie; Galaktosämie; Hämochromatose; Huntington-Krankheit; Ahornsirupkrankheit; Marfan-Syndrom; Neurofibromatose Typ 1; Pachyonychia congenita; Phenylketonurie; schwerem kombiniertem Immundefekt; Sichelzellenanämie; Smith-Lemli-Opitz-Syndrom; und Tay-Sachs-Krankheit besteht.
  • Ausführungsform 8. Das Verfahren der Ausführungsform 1, wobei das krankheitsassoziierte Gen mit einer polygenen Störung assoziiert ist, die aus der Gruppe ausgewählt ist, die aus Herzkrankheit; Bluthochdruck; Alzheimer-Krankheit; Arthritis; Diabetes; Krebs; und Fettleibigkeit besteht.
  • Ausführungsform 9. Das Verfahren der Ausführungsform 1, wobei das Fusionsprotein eine Aminosäuresequenz von SEQ ID NOs: 101-104, 181-183, 223-244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777 oder eine Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % Sequenzidentität mit SEQ ID NOs: 101-104, 181-183, 223-244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777 aufweist.
  • Ausführungsform 10. Das Verfahren der Ausführungsform 1, wobei das napDNAbp Cas9, Cas12e, Cas12d, Cas12a, Cas12b1, Cas13a, Cas12c oder Argonaute oder eine Variante von Cas9, Cas12e, Cas12d, Cas12a, Cas12b1, Cas13a, Cas12c oder Argonaute ist.
  • Ausführungsform 11. Das Verfahren der Ausführungsform 1, wobei das napDNAbp ein Cas9 oder eine Variante davon ist.
  • Ausführungsform 12. Das Verfahren der Ausführungsform 1, wobei das napDNAbp ein Nuklease-aktives Cas9, ein Nuklease-inaktives Cas9 (dCas9) oder eine Cas9-Nickase (nCas9) ist.
  • Ausführungsform 13. Das Verfahren der Ausführungsform 1, wobei das napDNAbp Cas9-Nickase (nCas9) ist.
  • Ausführungsform 14. Das Verfahren der Ausführungsform 1, wobei das napDNAbp die Aminosäuresequenz von SEQ ID NO: 18 oder eine Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % Sequenzidentität mit SEQ ID NO: 18 umfasst.
  • Ausführungsform 15. Das Verfahren der Ausführungsform 1, wobei das napDNAbp SpCas9-Wildtyp oder eine Variante davon einer beliebigen der Aminosäuresequenzen 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467 und 482-487 oder eine Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % Sequenzidentität mit einer beliebigen von SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467 und 482-487 ist.
  • Ausführungsform 16. Das Verfahren der Ausführungsform 1, wobei das napDNAbp ein SpCas9-Ortholog ist.
  • Ausführungsform 17. Das Verfahren der Ausführungsform 1, wobei das napDNAbp eine beliebige der Aminosäuresequenzen 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467 und 482-487 oder eine Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % Sequenzidentität mit einer beliebigen der SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467 und 482-487 ist.
  • Ausführungsform 18. Das Verfahren der Ausführungsform 1, wobei das napDNAbp eine Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % Sequenzidentität mit der Aminosäuresequenz einer beliebigen von SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467 und 482-487 umfasst.
  • Ausführungsform 19. Das Verfahren der Ausführungsform 1, wobei die Polymerase eine RNA-abhängige DNA-Polymeraseaktivität umfasst.
  • Ausführungsform 20. Das Verfahren der Ausführungsform 1, wobei die Polymerase eine reverse Transkriptase umfasst.
  • Ausführungsform 21. Das Verfahren der Ausführungsform 1, wobei die reverse Transkriptase eine natürlich vorkommende reverse Transkriptase vom Wildtyp mit einer Aminosäuresequenz einer beliebigen von SEQ ID NOs: 89 oder einer Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % Sequenzidentität mit einer beliebigen von SEQ ID NOs: 89 ist.
  • Ausführungsform 22. Das Verfahren der Ausführungsform 1, wobei die reverse Transkriptase eine Variante der reversen Transkriptase mit einer Aminosäuresequenz einer beliebigen von SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741 und 766 oder einer Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % Sequenzidentität mit einer beliebigen von SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741 und 766 ist.
  • Ausführungsform 23. Das Verfahren der Ausführungsform 1, wobei die reverse Transkriptase eine beliebige der Aminosäuresequenzen von SEQ ID NO: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741 und 766 umfasst.
  • Ausführungsform 24. Das Verfahren der Ausführungsform 1, wobei die reverse Transkriptase eine Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % Sequenzidentität mit der Aminosäuresequenz einer beliebigen von SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741 und 766 umfasst.
  • Ausführungsform 25. Das Verfahren der Ausführungsform 1, wobei die detektierbare Sequenz eine Insertion von mindestens 1 oder mindestens 2 oder mindestens 3 oder mindestens 4 oder mindestens 5 oder mindestens 6 oder mindestens 7 oder mindestens 8 oder mindestens 9 oder mindestens 10 oder mindestens 11 oder mindestens 12 oder mindestens 13 oder mindestens 14 oder mindestens 15 oder mindestens 16 oder mindestens 17 oder mindestens 18 oder mindestens 19 oder mindestens 20 oder mindestens 21 oder mindestens 22 oder mindestens 23 oder mindestens 24 oder mindestens 25 oder mindestens 26 oder mindestens 27 oder mindestens 28 oder mindestens 29 oder mindestens 30 oder mindestens 31 oder mindestens 32 oder mindestens 33 oder mindestens 34 oder mindestens 35 oder mindestens 40 oder mindestens 50 oder mindestens 60 oder mindestens 70 oder mindestens 80 oder mindestens 90 oder mindestens 100 Nukleobasen ist.
  • Ausführungsform 26. Das Verfahren der Ausführungsform 1, wobei die detektierbare Sequenz eine Deletion von mindestens 1 oder mindestens 2 oder mindestens 3 oder mindestens 4 oder mindestens 5 oder mindestens 6 oder mindestens 7 oder mindestens 8 oder mindestens 9 oder mindestens 10 oder mindestens 11 oder mindestens 12 oder mindestens 13 oder mindestens 14 oder mindestens 15 oder mindestens 16 oder mindestens 17 oder mindestens 18 oder mindestens 19 oder mindestens 20 oder mindestens 21 oder mindestens 22 oder mindestens 23 oder mindestens 24 oder mindestens 25 oder mindestens 26 oder mindestens 27 oder mindestens 28 oder mindestens 29 oder mindestens 30 oder mindestens 31 oder mindestens 32 oder mindestens 33 oder mindestens 34 oder mindestens 35 oder mindestens 40 oder mindestens 50 oder mindestens 60 oder mindestens 70 oder mindestens 80 oder mindestens 90 oder mindestens 100 Nukleobasen ist.
  • Ausführungsform 27. Das Verfahren der Ausführungsform 1, wobei die detektierbare Sequenz eine Nukleobasensubstitution ist.
  • Ausführungsform 28. Das Verfahren der Ausführungsform 1, wobei die detektierbare Sequenz ist eine Transitionsmutation ist.
  • Ausführungsform 29. Das Verfahren der Ausführungsform 1, wobei die detektierbare Sequenz eine Transversionsmutation ist.
  • Ausführungsform 30. Das Verfahren der Ausführungsform 1, wobei die detektierbare Sequenz eine Einzelnukleotidsubstitution ist, die aus der Gruppe ausgewählt ist, die aus (1) einer G-zu-T-Substitution, (2) einer G-zu-A-Substitution, (3) einer G-zu-C-Substitution, (4) einer T-zu-G-Substitution, (5) einer T-zu-A-Substitution, (6) einer T-zu-C-Substitution, (7) einer C-zu-G-Substitution, (8) einer C-zu-T-Substitution, (9) einer C-zu-A-Substitution, (10) einer A-zu-T-Substitution, (11) einer A-zu-G-Substitution und (12) einer A-zu-C-Substitution besteht.
  • Ausführungsform 31. Das Verfahren der Ausführungsform 1, wobei die detektierbare Sequenz eine Einzelnukleotidsubstitution ist, die (1) ein G:C-Basenpaar in ein T:A-Basenpaar, (2) ein G:C-Basenpaar in ein A:T-Basenpaar, (3) ein G:C-Basenpaar in ein C:G-Basenpaar, (4) ein T:A-Basenpaar in ein G:C-Basenpaar, (5) ein T:A-Basenpaar in ein A:T-Basenpaar, (6) ein T:A-Basenpaar in ein C:G-Basenpaar, (7) ein C:G-Basenpaar in ein G:C-Basenpaar, (8) ein C:G-Basenpaar in ein T:A-Basenpaar, (9) C:G-Basenpaar in ein A:T-Basenpaar, (10) ein A:T-Basenpaar in ein T:A-Basenpaar, (11) ein A:T-Basenpaar in ein G:C-Basenpaar oder (12) ein A:T-Basenpaar in ein C:G-Basenpaar umwandelt.
  • Ausführungsform 32. Das Verfahren der Ausführungsform 1, wobei die detektierbare Sequenz eine Barcode-Sequenz ist.
  • Ausführungsform 33. Das Verfahren der Ausführungsform 1, wobei Schritt (d) des Bestimmens der Nukleotidsequenz an den On-Target- und Off-Target-Stellen (i) ein Fragmentieren der Target-Nukleotidsequenz zur Bildung von Fragmenten, (ii) ein Anbringen von Adapter-Sequenzen an die Enden der Fragmente, (iii) ein PCR-Amplifizieren eines Amplikons unter Verwendung eines Primer-Paares, wobei ein Primer an eine an einem Ende der Fragmente angebrachte Adaptersequenz annealt, und ein anderer Primer an eine durch Prime Editing inserierte Adaptersequenz, die sich innerhalb des Fragments befindet, annealt, und (iv) ein Sequenzieren des Amplikons zur Bestimmung des Orts des Edits umfasst.
  • GRUPPE J. PE-VERFAHREN ZUR ZELLDATENAUFZEICHNUNG
  • Ausführungsform 1. Ein Verfahren zum Aufzeichnen eines zellulären Ereignisses durch Prime Editing, wobei das Verfahren Folgendes umfasst: (A) Einführen eines oder mehrerer Konstrukte in eine Zelle, die für (i) ein Prime Editor-Fusionsprotein, das ein napDNAbp und eine RNA-abhängige DNA-Polymerase umfasst, und (ii) einer PEgRNA codieren, wobei die Expression des Fusionsproteins und/oder der PEgRNA durch das Auftreten eines zellulären Ereignisses induziert wird und wobei die Expression des Fusionsproteins und/oder der PEgRNA zu einem Prime Editing einer Target-Edit-Stelle in dem Genom der Zelle führt, um eine detektierbare Sequenz einzuführen, und (B) Identifizieren der detektierbaren Sequenz, wodurch das Auftreten des zellulären Ereignisses identifiziert wird.
  • Ausführungsform 2. Das Verfahren der Ausführungsform 1, wobei das Prime Editing von Schritt (A) gleichzeitig eine neue Target-Edit-Stelle einführt, so dass die Aufzeichnung des zellulären Ereignisses iterativ erfolgen kann.
  • Ausführungsform 3. Das Verfahren der Ausführungsform 1, wobei die PEgRNA ein Edit-Template umfasst, das für die detektierbare Sequenz codiert.
  • Ausführungsform 4. Das Verfahren der Ausführungsform 3, wobei das Edit-Template ferner für eine neue Target-Edit-Stelle codiert.
  • Ausführungsform 5. Das Verfahren der Ausführungsform 1, wobei die detektierbare Sequenz eine Insertion von mindestens 1 oder mindestens 2 oder mindestens 3 oder mindestens 4 oder mindestens 5 oder mindestens 6 oder mindestens 7 oder mindestens 8 oder mindestens 9 oder mindestens 10 oder mindestens 11 oder mindestens 12 oder mindestens 13 oder mindestens 14 oder mindestens 15 oder mindestens 16 oder mindestens 17 oder mindestens 18 oder mindestens 19 oder mindestens 20 oder mindestens 21 oder mindestens 22 oder mindestens 23 oder mindestens 24 oder mindestens 25 oder mindestens 26 oder mindestens 27 oder mindestens 28 oder mindestens 29 oder mindestens 30 oder mindestens 31 oder mindestens 32 oder mindestens 33 oder mindestens 34 oder mindestens 35 oder mindestens 40 oder mindestens 50 oder mindestens 60 oder mindestens 70 oder mindestens 80 oder mindestens 90 oder mindestens 100 Nukleobasen ist.
  • Ausführungsform 6. Das Verfahren der Ausführungsform 1, wobei die detektierbare Sequenz eine Deletion von mindestens 1 oder mindestens 2 oder mindestens 3 oder mindestens 4 oder mindestens 5 oder mindestens 6 oder mindestens 7 oder mindestens 8 oder mindestens 9 oder mindestens 10 oder mindestens 11 oder mindestens 12 oder mindestens 13 oder mindestens 14 oder mindestens 15 oder mindestens 16 oder mindestens 17 oder mindestens 18 oder mindestens 19 oder mindestens 20 oder mindestens 21 oder mindestens 22 oder mindestens 23 oder mindestens 24 oder mindestens 25 oder mindestens 26 oder mindestens 27 oder mindestens 28 oder mindestens 29 oder mindestens 30 oder mindestens 31 oder mindestens 32 oder mindestens 33 oder mindestens 34 oder mindestens 35 oder mindestens 40 oder mindestens 50 oder mindestens 60 oder mindestens 70 oder mindestens 80 oder mindestens 90 oder mindestens 100 Nukleobasen ist.
  • Ausführungsform 7. Das Verfahren der Ausführungsform 1, wobei die detektierbare Sequenz eine Nukleobasensubstitution ist.
  • Ausführungsform 8. Das Verfahren der Ausführungsform 1, wobei die detektierbare Sequenz eine Transitionsmutation ist.
  • Ausführungsform 9. Das Verfahren der Ausführungsform 1, wobei die detektierbare Sequenz eine Transversionsmutation ist.
  • Ausführungsform 10. Das Verfahren der Ausführungsform 1, wobei die detektierbare Sequenz eine Einzelnukleotidsubstitution ist, wobei die Einzelnukleotidsubstitution (1) eine G-zu-T-Substitution, (2) eine G-zu-A-Substitution, (3) eine G-zu-C-Substitution, (4) eine T-zu-G-Substitution, (5) eine T-zu-A-Substitution, (6) eine T-zu-C-Substitution, (7) eine C-zu-G-Substitution, (8) eine C-zu-T-Substitution, (9) eine C-zu-A-Substitution, (10) eine A-zu-T-Substitution, (11) eine A-zu-G-Substitution oder (12) eine A-zu-C-Substitution ist.
  • Ausführungsform 11. Das Verfahren der Ausführungsform 1, wobei die detektierbare Sequenz eine Einzelnukleotidsubstitution ist, die (1) ein G:C-Basenpaar in ein T:A-Basenpaar, (2) ein G:C-Basenpaar in ein A:T-Basenpaar, (3) ein G:C-Basenpaar in ein C:G-Basenpaar, (4) ein T:A-Basenpaar in ein G:C-Basenpaar, (5) ein T:A-Basenpaar in ein A:T-Basenpaar, (6) ein T:A-Basenpaar in ein C:G-Basenpaar, (7) ein C:G-Basenpaar in ein G:C-Basenpaar, (8) ein C:G-Basenpaar in ein T:A-Basenpaar, (9) ein C:G-Basenpaar in ein A:T-Basenpaar, (10) ein A:T-Basenpaar in ein T:A-Basenpaar, (11) ein A:T-Basenpaar in ein G:C-Basenpaar oder (12) ein A:T-Basenpaar in ein C:G-Basenpaar umwandelt.
  • Ausführungsform 12. Das Verfahren der Ausführungsform 1, wobei die detektierbare Sequenz eine Barcode-Sequenz ist.
  • Ausführungsform 13. Das Verfahren der Ausführungsform 1, wobei die Länge der detektierbaren Sequenz mit der Zeit als Ergebnis einer iterativen Insertion der detektierbaren Sequenz für jedes Auftreten des zellulären Ereignisses zunimmt.
  • Ausführungsform 14 Das Verfahren der Ausführungsform 1, wobei der Detektionsschritt ein Sequenzieren der editierten Target-Stelle oder ein Amplikon der editierten Target-Stelle umfasst.
  • Ausführungsform 15. Das Verfahren der Ausführungsform 1, wobei das napDNAbp Cas9, Cas12e, Cas12d, Cas12a, Cas12b1, Cas13a, Cas12c oder Argonaute oder eine Variante von Cas9, Cas12e, Cas12d, Cas12a, Cas12b1, Cas13a, Cas12c oder Argonaute ist.
  • Ausführungsform 16. Das Verfahren der Ausführungsform 1, wobei das napDNAbp ein Cas9 oder eine Variante davon ist.
  • Ausführungsform 17. Das Verfahren der Ausführungsform 1, wobei das napDNAbp ein Nuklease-aktives Cas9, ein Nuklease-inaktives Cas9 (dCas9) oder eine Cas9-Nickase (nCas9) ist.
  • Ausführungsform 18. Das Verfahren der Ausführungsform 1, wobei das napDNAbp Cas9-Nickase (nCas9) ist.
  • Ausführungsform 19. Das Verfahren der Ausführungsform 1, wobei das napDNAbp die Aminosäuresequenz von SEQ ID NO: 2 oder eine Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % Sequenzidentität mit SEQ ID NO: 18 umfasst.
  • Ausführungsform 20. Das Verfahren der Ausführungsform 1, wobei das napDNAbp SpCas9-Wildtyp oder eine Variante davon einer beliebigen der Aminosäuresequenzen 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467 und 482-487 oder eine Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % Sequenzidentität mit einer beliebigen von SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467 und 482-487 ist.
  • Ausführungsform 21. Das Verfahren der Ausführungsform 1, wobei das napDNAbp ein SpCas9-Ortholog ist.
  • Ausführungsform 22. Das Verfahren der Ausführungsform 1, wobei das napDNAbp eine beliebige der Aminosäuresequenzen 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467 und 482-487 oder eine Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % Sequenzidentität mit einer beliebigen von SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467 und 482-487 ist.
  • Ausführungsform 23. Das Verfahren der Ausführungsform 1, wobei die RNA-abhängige DNA-Polymerase eine reverse Transkriptase ist.
  • Ausführungsform 24. Das Verfahren der Ausführungsform 23, wobei die reverse Transkriptase eine natürlich vorkommende reverse Transkriptase vom Wildtyp mit einer Aminosäuresequenz einer beliebigen von SEQ ID NOs: 89 oder einer Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % Sequenzidentität mit einer beliebigen von SEQ ID NOs: 89 ist.
  • Ausführungsform 25. Das Verfahren der Ausführungsform 23, wobei die reverse Transkriptase eine Variante der reversen Transkriptase mit einer Aminosäuresequenz einer beliebigen von SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741 und 766 oder eine Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % Sequenzidentität mit einer beliebigen von SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741 und 766 ist.
  • Ausführungsform 26. Das Verfahren der Ausführungsform 1, wobei das Fusionsprotein eine Aminosäuresequenz einer beliebigen von SEQ ID NOs: 123 und 134 (PE1, PE2) oder eine Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % Sequenzidentität mit einer beliebigen von SEQ ID NOs: 123 und 134 (PE1, PE2) umfasst.
  • Ausführungsform 27. Das Verfahren der Ausführungsform 1, wobei das eine oder die mehreren Konstrukte, die für das Prime Editor-Fusionsprotein codieren, und/oder die PEgRNA ferner einen oder mehrere Promotoren umfassen, die induzierbar sind, wenn ein zelluläres Ereignis auftritt.
  • Ausführungsform 28. Das Verfahren der Ausführungsform 1, wobei das zelluläre Ereignis durch einen von der Zelle empfangenen Stimulus gekennzeichnet ist.
  • Ausführungsform 29. Das Verfahren der Ausführungsform 28, wobei der Stimulus ein kleines Molekül, ein Protein, ein Peptid, eine Aminosäure, ein Metabolit, ein anorganisches Molekül, ein metallorganisches Molekül, ein organisches Molekül, ein Arzneistoff oder ein Arzneistoffkandidat, ein Zucker, ein Lipid, ein Metall, eine Nukleinsäure, ein Molekül, das bei der Aktivierung einer endogenen oder einer exogenen Signalkaskade erzeugt wird, Licht, Wärme, Schall, Druck, mechanischer Stress, Scherstress oder ein Virus oder ein anderer Mikroorganismus, pH-Änderung oder Änderung des Oxidations-/Reduktionszustands ist.
  • Ausführungsform 30. Ein Zelldatenaufzeichnungsplasmid zum Aufzeichnen eines zellulären Ereignisses unter Verwendung von Prime Editing, umfassend:
    • i. ein Fusionsprotein, das (a) eine Nukleinsäuresequenz, die für ein Nukleinsäure-programmierbares DNA-Bindungsprotein (napDNAbp) codiert, und (b) eine RNA-abhängige DNA-Polymerase umfasst, wobei das Fusionsprotein funktionsfähig mit einem ersten Promotor verbunden ist;
    • ii. eine Nukleinsäuresequenz, die für eine Prime Editor-Guide-RNA (PEgRNA) codiert, die funktionsfähig mit einem zweiten Promotor verbunden ist, wobei die PEgRNA komplementär zu einer Target-Sequenz ist; und
    • iii. ein Replikationsursprung;
    • wobei mindestens einer der Promotoren ein induzierbarer Promotor ist und wobei die PEgRNA mit dem napDNAbp unter Bedingungen assoziiert, welche eine Expression der PEgRNA und eine Expression des napDNAbp ausreichend induzieren, um eine detektierbare Sequenz an einer Target-Edit-Stelle einzubauen.
  • Ausführungsform 31. Das Zelldatenaufzeichnungsplasmid der Ausführungsform 30, wobei der induzierbare Promotor durch das zelluläre Ereignis induziert wird.
  • Ausführungsform 32. Das Zelldatenaufzeichnungsplasmid der Ausführungsform 30, wobei das zelluläre Ereignis durch einen von der Zelle empfangenen Stimulus gekennzeichnet ist.
  • Ausführungsform 33. Das Zelldatenaufzeichnungsplasmid der Ausführungsform 32, wobei der Stimulus ein kleines Molekül, ein Protein, ein Peptid, eine Aminosäure, ein Metabolit, ein anorganisches Molekül, ein metallorganisches Molekül, ein organisches Molekül, ein Arzneistoff oder Arzneistoffkandidat, ein Zucker, ein Lipid, ein Metall, eine Nukleinsäure, ein Molekül, das bei der Aktivierung einer endogenen oder einer exogenen Signalkaskade erzeugt wird, Licht, Hitze, Schall, Druck, mechanischer Stress, Scherstress oder ein Virus oder ein anderer Mikroorganismus, pH-Änderung oder Änderung des Oxidations-/Reduktionszustands ist.
  • Ausführungsform 34. Das Zelldatenaufzeichnungsplasmid der Ausführungsform 30, wobei der erste und der zweite Promotor gleich sind.
  • Ausführungsform 35. Das Zelldatenaufzeichnungsplasmid der Ausführungsform 30, wobei der erste und der zweite Promotor verschieden sind.
  • Ausführungsform 36. Das Zelldatenaufzeichnungsplasmid der Ausführungsform 30, wobei der mindestens eine induzierbare Promotor ein Anhydrotetracyclin-induzierbarer Promotor, ein IPTG-induzierbarer Promotor, ein Rhamnose-induzierbarer Promotor oder ein Arabinose-induzierbarer Promotor ist.
  • Ausführungsform 37. Das Zelldatenaufzeichnungsplasmid der Ausführungsform 30, wobei der erste oder zweite Promotor ein konstitutiver Promotor ist.
  • Ausführungsform 38. Das Zelldatenaufzeichnungsplasmid der Ausführungsform 37, wobei der konstitutive Promotor ein Lac-Promotor, ein Cytomegalovirus(CMV)-Promotor, ein konstitutiver RNA-Polymerase III-Promotor oder ein UBC-Promotor ist.
  • Ausführungsform 39. Das Zelldatenaufzeichnungsplasmid der Ausführungsform 30, wobei der Replikationsursprung eine pSC101-, pMB1-, pBR322-, ColE1- oder p15A-Replikationsursprungssequenz umfasst.
  • Ausführungsform 40. Das Zelldatenaufzeichnungsplasmid der Ausführungsform 30, wobei die PEgRNA ein Edit-Template umfasst, das für die detektierbare Sequenz codiert.
  • Ausführungsform 41. Das Zelldatenaufzeichnungsplasmid der Ausführungsform 40, wobei das Edit-Template ferner für eine neue Target-Edit-Stelle codiert.
  • Ausführungsform 42. Das Zelldatenaufzeichnungsplasmid der Ausführungsform 30, wobei die detektierbare Sequenz eine Insertion von mindestens 1 oder mindestens 2 oder mindestens 3 oder mindestens 4 oder mindestens 5 oder mindestens 6 oder mindestens 7 oder mindestens 8 oder mindestens 9 oder mindestens 10 oder mindestens 11 oder mindestens 12 oder mindestens 13 oder mindestens 14 oder mindestens 15 oder mindestens 16 oder mindestens 17 oder mindestens 18 oder mindestens 19 oder mindestens 20 oder mindestens 21 oder mindestens 22 oder mindestens 23 oder mindestens 24 oder mindestens 25 oder mindestens 26 oder mindestens 27 oder mindestens 28 oder mindestens 29 oder mindestens 30 oder mindestens 31 oder mindestens 32 oder mindestens 33 oder mindestens 34 oder mindestens 35 oder mindestens 40 oder mindestens 50 oder mindestens 60 oder mindestens 70 oder mindestens 80 oder mindestens 90 oder mindestens 100 Nukleobasen ist.
  • Ausführungsform 43. Das Zelldatenaufzeichnungsplasmid der Ausführungsform 30, wobei die detektierbare Sequenz eine Deletion von mindestens 1 oder mindestens 2 oder mindestens 3 oder mindestens 4 oder mindestens 5 oder mindestens 6 oder mindestens 7 oder mindestens 8 oder mindestens 9 oder mindestens 10 oder mindestens 11 oder mindestens 12 oder mindestens 13 oder mindestens 14 oder mindestens 15 oder mindestens 16 oder mindestens 17 oder mindestens 18 oder mindestens 19 oder mindestens 20 oder mindestens 21 oder mindestens 22 oder mindestens 23 oder mindestens 24 oder mindestens 25 oder mindestens 26 oder mindestens 27 oder mindestens 28 oder mindestens 29 oder mindestens 30 oder mindestens 31 oder mindestens 32 oder mindestens 33 oder mindestens 34 oder mindestens 35 oder mindestens 40 oder mindestens 50 oder mindestens 60 oder mindestens 70 oder mindestens 80 oder mindestens 90 oder mindestens 100 Nukleobasen ist.
  • Ausführungsform 44. Das Zelldatenaufzeichnungsplasmid der Ausführungsform 30, wobei die detektierbare Sequenz eine Nukleobasensubstitution ist.
  • Ausführungsform 45. Das Zelldatenaufzeichnungsplasmid der Ausführungsform 30, wobei die detektierbare Sequenz eine Transitionsmutation ist.
  • Ausführungsform 46. Das Zelldatenaufzeichnungsplasmid der Ausführungsform 30, wobei die detektierbare Sequenz eine Transversionsmutation ist.
  • Ausführungsform 47. Das Zelldatenaufzeichnungsplasmid der Ausführungsform 30, wobei die detektierbare Sequenz eine Einzelnukleotidsubstitution ist, wobei die Einzelnukleotidsubstitution (1) eine G-zu-T-Substitution, (2) eine G-zu-A-Substitution, (3) eine G-zu-C-Substitution, (4) eine T-zu-G-Substitution, (5) eine T-zu-A-Substitution, (6) eine T-zu-C-Substitution, (7) eine C-zu-G-Substitution, (8) eine C-zu-T-Substitution, (9) eine C-zu-A-Substitution, (10) eine A-zu-T-Substitution, (11) eine A-zuG-Substitution oder (12) eine A-zu-C-Substitution ist.
  • Ausführungsform 48. Das Zelldatenaufzeichnungsplasmid der Ausführungsform 30, wobei die detektierbare Sequenz eine Einzelnukleotidsubstitution ist, die (1) ein G:C-Basenpaar in ein T:A-Basenpaar, (2) ein G:C-Basenpaar in ein A:T-Basenpaar, (3) ein G:C-Basenpaar in ein C:G-Basenpaar, (4) a T:A-Basenpaar in ein G:C-Basenpaar, (5) T:A-Basenpaar in ein A:T-Basenpaar, (6) T:A-Basenpaar in ein C:G-Basenpaar, (7) C:G-Basenpaar in ein G:C-Basenpaar, (8) ein C:G-Basenpaar in ein T:A-Basenpaar, (9) ein C:G-Basenpaar in ein A:T-Basenpaar, (10) ein A:T-Basenpaar in ein T:A-Basenpaar, (11) ein A:T-Basenpaar in ein G:C-Basenpaar oder (12) ein A:T-Basenpaar in ein C:G-Basenpaar umwandelt.
  • Ausführungsform 49. Das Zelldatenaufzeichnungsplasmid der Ausführungsform 30, wobei die detektierbare Sequenz eine Barcode-Sequenz ist.
  • Ausführungsform 50. Das Zelldatenaufzeichnungsplasmid der Ausführungsform 30, wobei die Länge der detektierbaren Sequenz mit der Zeit als Ergebnis einer iterativen Insertion der detektierbaren Sequenz für jedes Auftreten des zellulären Ereignisses zunimmt.
  • Ausführungsform 51. Das Zelldatenaufzeichnungsplasmid der Ausführungsform 30, wobei der Detektionsschritt ein Sequenzieren der editierten Target-Stelle oder ein Amplikon der editierten Target-Stelle umfasst.
  • Ausführungsform 52. Das Zelldatenaufzeichnungsplasmid der Ausführungsform 30, wobei das napDNAbp Cas9, Cas12e, Cas12d, Cas12a, Cas12b1, Cas13a, Cas12c oder Argonaute oder eine Variante von Cas9, Cas12e, Cas12d, Cas12a, Cas12b1 ist, Cas13a, Cas12c oder Argonaute ist.
  • Ausführungsform 53. Das Zelldatenaufzeichnungsplasmid der Ausführungsform 30, wobei das napDNAbp ein Cas9 oder eine Variante davon ist.
  • Ausführungsform 54. Das Zelldatenaufzeichnungsplasmid der Ausführungsform 30, wobei das napDNAbp ein Nuklease-aktives Cas9, ein Nuklease-inaktives Cas9 (dCas9) oder eine Cas9-Nickase (nCas9) ist.
  • Ausführungsform 55. Das Zelldatenaufzeichnungsplasmid der Ausführungsform 30, wobei das napDNAbp Cas9-Nickase (nCas9) ist.
  • Ausführungsform 56. Das Zelldatenaufzeichnungsplasmid der Ausführungsform 30, wobei das napDNAbp die Aminosäuresequenz von SEQ ID NO: 18 oder eine Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % Sequenzidentität mit SEQ ID NO: 18 umfasst.
  • Ausführungsform 57. Das Zelldatenaufzeichnungsplasmid der Ausführungsform 30, wobei das napDNAbp SpCas9-Wildtyp oder eine Variante davon einer beliebigen der Aminosäuresequenzen 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467 und 482-487 oder eine Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % Sequenzidentität mit einer beliebigen von SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467 und 482-487 ist.
  • Ausführungsform 58. Das Zelldatenaufzeichnungsplasmid der Ausführungsform 30, wobei das napDNAbp ein SpCas9-Ortholog ist.
  • Ausführungsform 59. Das Zelldatenaufzeichnungsplasmid der Ausführungsform 30, wobei das napDNAbp eine beliebige der Aminosäuresequenzen 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467 und 482-487 oder eine Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % Sequenzidentität mit einer beliebigen von SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467 und 482-487 ist.
  • Ausführungsform 60. Das Zelldatenaufzeichnungsplasmid der Ausführungsform 30, wobei die RNA-abhängige DNA-Polymerase eine reverse Transkriptase ist.
  • Ausführungsform 61. Das Zelldatenaufzeichnungsplasmid der Ausführungsform 30, wobei die reverse Transkriptase eine natürlich vorkommende reverse Transkriptase vom Wildtyp mit einer Aminosäuresequenz einer beliebigen von SEQ ID NOs: 89 oder einer Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % Sequenzidentität mit einer beliebigen von SEQ ID NOs: 89 ist.
  • Ausführungsform 62. Das Zelldatenaufzeichnungsplasmid der Ausführungsform 30, wobei die reverse Transkriptase eine Variante der reversen Transkriptase mit einer Aminosäuresequenz einer beliebigen von SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741 und 766 oder eine Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % Sequenzidentität mit einer beliebigen von SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741 und 766 ist.
  • Ausführungsform 63. Das Zelldatenaufzeichnungsplasmid der Ausführungsform 30, wobei die Fusionsprotein eine Aminosäuresequenz einer beliebigen von SEQ ID NOs: 123 und 134 (PE1, PE2) oder eine Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % Sequenzidentität mit einer beliebigen von SEQ ID NOs: 123 und 134 (PE1, PE2) umfasst.
  • Ausführungsform 64. Ein Kit zur Verwendung in einer Zelle, die das Zelldatenaufzeichnungsplasmid einer beliebigen der Ausführungsformen 30 63 umfasst.
  • Ausführungsform 65. Das Kit der Ausführungsform 64, wobei die Zelle eine prokaryotische Zelle ist.
  • Ausführungsform 66. Das Kit der Ausführungsform 64, wobei die Zelle eine eukaryotische Zelle ist.
  • Ausführungsform 67. Eine Zelle, die das Zelldatenaufzeichnungsplasmid von einer beliebigen der Ausführungsformen 30-63 umfasst.
  • Ausführungsform 68. Die Zelle der Ausführungsform 67, wobei die Zelle eine prokaryotische Zelle ist.
  • Ausführungsform 69. Die Zelle der Ausführungsform 67, wobei die Zelle eine eukaryotische Zelle ist.
  • Ausführungsform 70. Die Zelle der Ausführungsform 69, wobei die eukaryotische Zelle eine Säugerzelle ist.
  • Ausführungsform 71. Die Zelle der Ausführungsform 70, wobei die Säugerzelle eine menschliche Zelle ist
  • Ausführungsform 72. Ein Verfahren zum Aufzeichnen eines zellulären Ereignisses durch Prime Editing, wobei das Verfahren Folgendes umfasst: (A) Einführen eines Zelldatenaufzeichnungsplasmids einer beliebigen der Ausführungsformen 30-63 in eine Zelle, wobei das Fusionsprotein und/oder die PEgRNA durch das Auftreten eines zellulären Ereignisses induziert werden und wobei eine Expression des Fusionsproteins und /oder der PEgRNA zu einem Prime Editing einer Target-Edit-Stelle in dem Genom der Zelle führt, um eine detektierbare Sequenz einzuführen, und (B) Identifizieren der detektierbaren Sequenz, wodurch das Auftreten des zellulären Ereignisses identifiziert wird.
  • Ausführungsform 73. Das Verfahren der Ausführungsform 72, wobei der Schritt (A) des Einführens durch Transfektion oder Elektroporation erfolgt.
  • ÄQUIVALENTE UND UMFANG
  • In den Artikeln können „ein“ und „eine“ sowie „der“, „die“ und „das“ eins oder mehrere bedeuten, sofern nicht anders angegeben oder anderweitig aus dem Kontext ersichtlich. Ausführungsformen oder Beschreibungen, die „oder“ zwischen einem oder mehreren Elementen einer Gruppe enthalten, gelten als erfüllt, wenn ein, mehr als ein oder alle Gruppenelemente in einem bestimmten Produkt oder Verfahren vorhanden sind, darin eingesetzt werden oder anderweitig relevant für ein bestimmtes Produkt oder Verfahren sind, sofern nicht anders angegeben oder anderweitig aus dem Kontext ersichtlich. Die Erfindung schließt Ausführungsformen ein, in denen genau ein Element der Gruppe in einem gegebenen Produkt oder Verfahren vorhanden ist, darin eingesetzt wird oder anderweitig für dieses relevant ist. Die Erfindung schließt Ausführungsformen ein, in denen mehr als ein oder alle der Gruppenelemente in einem gegebenen Produkt oder Verfahren vorhanden sind, darin eingesetzt werden oder anderweitig für dieses relevant sind.
  • Darüber hinaus umfasst die Offenbarung alle Variationen, Kombinationen und Permutationen, in denen eine oder mehrere Einschränkungen, Elemente, Klauseln und beschreibende Begriffe aus einem oder mehreren der aufgeführten Ansprüche in einen anderen Anspruch eingeführt werden. Zum Beispiel kann jeder Anspruch, der von einem anderen Anspruch abhängig ist, modifiziert werden, um eine oder mehrere Einschränkungen einzuschließen, die in beliebigen anderen Ansprüchen gefunden werden, die von demselben Basisanspruch abhängig sind. Wenn Elemente als Listen präsentiert werden, z. B. im Markush-Gruppenformat, ist jede Untergruppe der Elemente ebenfalls offenbart, und ein oder mehrere beliebige Elemente können aus der Gruppe entfernt werden. Es versteht sich, dass im Allgemeinen, wenn die Erfindung oder Aspekte der Erfindung als bestimmte Elemente und/oder Merkmale umfassend bezeichnet wird/werden, bestimmte Ausführungsformen der Offenbarung oder Aspekte der Offenbarung aus solchen Elementen und/oder Merkmalen bestehen oder im Wesentlichen daraus bestehen. Der Einfachheit halber wurden diese Ausführungsformen hier nicht spezifisch in haec verba dargelegt. Es sei auch darauf hingewiesen, dass die Begriffe „umfassen“ und „enthalten“ offen sein sollen und die Aufnahme zusätzlicher Elemente oder Schritte zulassen. Wenn Bereiche angegeben sind, sind Endpunkte eingeschlossen. Sofern nicht anders angegeben oder aus dem Kontext und dem Verständnis eines Durchschnittsfachmanns ersichtlich ist, können darüber hinaus Werte, die als Bereiche ausgedrückt sind, jeden bestimmten Wert oder Unterbereich innerhalb der angegebenen Bereiche in verschiedenen Ausführungsformen der Erfindung auf das Zehntel der Einheit der unteren Grenze des Bereichs annehmen, sofern der Kontext nicht eindeutig etwas anderes vorschreibt.
  • Diese Anmeldung bezieht sich auf verschiedene erteilte Patente, veröffentlichte Patentanmeldungen, Zeitschriftenartikel und andere Veröffentlichungen, die alle hier durch Bezugnahme aufgenommen sind. Wenn ein Konflikt zwischen einer der aufgenommenen Literaturstellen und der vorliegenden Schrift besteht, hat die Schrift Vorrang. Außerdem kann jede bestimmte Ausführungsform der vorliegenden Erfindung, die in den Stand der Technik fällt, explizit von einer oder mehreren der Ausführungsformen ausgeschlossen werden. Da solche Ausführungsformen als dem Durchschnittsfachmann bekannt gelten, können sie auch dann ausgeschlossen werden, wenn der Ausschluss hier nicht ausdrücklich dargelegt wird. Jede beliebige Ausführungsform der Erfindung kann aus beliebigem Grund von einer beliebigen Ausführungsform ausgeschlossen werden, unabhängig davon, ob es sich auf den Stand der Technik bezieht oder nicht.
  • Fachleute werden viele Äquivalente zu den hier beschriebenen konkreten Ausführungsformen erkennen oder in der Lage sein, unter Verwendung von nicht mehr als RoutineVersuchen viele Äquivalente zu ermitteln. Der Umfang der vorliegenden Ausführungsformen, die hier beschrieben sind, soll nicht auf die obige Beschreibung beschränkt sein, sondern ist vielmehr, wie in den beigefügten Ausführungsformen dargelegt. Der Durchschnittsfachmann wird erkennen, dass verschiedene Änderungen und Modifikationen an dieser Beschreibung vorgenommen werden können, ohne vom Geist oder Umfang der vorliegenden Erfindung abzuweichen, wie sie in den folgenden Ausführungsformen definiert ist.
  • ZITATE ENTHALTEN IN DER BESCHREIBUNG
  • Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
  • Zitierte Patentliteratur
    • US 62/820813 [0002]
    • US 62/858958 [0002]
    • US 62/889996 [0002]
    • US 62/922654 [0002]
    • US 62/913553 [0002]
    • US 62/973558 [0002]
    • US 62/931195 [0002]
    • US 62/944231 [0002]
    • US 62/974537 [0002]
    • US 62/991069 [0002]
    • US 5496714 [0104]
    • US 5834247 [0104]
    • US 2014/0065711 A1 [0105, 0688]
    • EP 2000/011690 PCT [0117, 0411]
    • WO 2001/038547 [0117, 0411]
    • US 2009/056194 PCT [0155, 0274, 0340]
    • WO 2010/028347 [0155, 0274, 0340]
    • US 2011/066747 PCT [0155, 0274, 0340]
    • WO 2012/088381 [0155, 0274, 0340]
    • US 9023594 [0155, 0274, 0340]
    • US 2015/012022 PCT [0155, 0274, 0340]
    • WO 2015/134121 [0155, 0274, 0340]
    • US 2016/027795 PCT [0155, 0274, 0340]
    • WO 2016/168631 [0155, 0274, 0340]
    • WO 2013/045632 [0166, 0290, 0438]
    • WO 2014/055782 [0166, 0290, 0438]
    • WO 2016/069774 [0166, 0290, 0438]
    • EP 2877490 [0166, 0290, 0438]
    • US 12965590 [0307]
    • US 13426991 [0307]
    • US 8450471 [0307]
    • US 13427040 [0307]
    • US 8440431 [0307]
    • US 13427137 [0307]
    • US 8440432 [0307]
    • US 13738 [0307]
    • US 381 [0307]
    • WO 2015/027134 [0307]
    • US 9181535 [0307]
    • US 5436149 [0310]
    • US 4889818 [0310]
    • US 4965185 [0310]
    • US 5079352 [0310]
    • US 5614365 [0310]
    • US 5374553 [0310]
    • US 5270179 [0310]
    • US 5047342 [0310]
    • US 5512462 [0310]
    • WO 9206188 [0310]
    • WO 9206200 [0310]
    • WO 9610640 [0310]
    • US 5677152 [0322]
    • US 6479264 [0322]
    • US 6183998 [0322]
    • US 4663290 [0326]
    • US 10202658 [0384]
    • US 10189831 [0384]
    • US 10150955 [0384]
    • US 9932567 [0384]
    • US 9783791 [0384]
    • US 9580698 [0384]
    • US 9534201 [0384]
    • US 9458484 [0384]
    • US 2011/0059502 [0453]
    • US 61/836080 [0482]
    • US 20011/00165540 A1 [0557]
    • US 2016/0355796 A1 [0557]
    • US 5049386 [0656, 0706, 0955]
    • US 4946787 [0656, 0657, 0706, 0707, 0955, 0956]
    • US 4897355 [0656, 0706, 0955]
    • WO 9117424 [0656, 0706, 0955]
    • WO 9116024 [0656, 0706, 0955]
    • US 4186183 [0657, 0707, 0956]
    • US 4217344 [0657, 0707, 0956]
    • US 4235871 [0657, 0707, 0956]
    • US 4261975 [0657, 0707, 0956]
    • US 4485054 [0657, 0707, 0956]
    • US 4501728 [0657, 0707, 0956]
    • US 4774085 [0657, 0707, 0956]
    • US 4837028 [0657, 0707, 0956]
    • US 9405700 PCT [0659]
    • US 4797368 [0659]
    • WO 93/24641 [0659]
    • US 5173414 [0659]
    • US 20030087817 [0660]
    • US 20070015238 [0664]
    • US 20120322861 [0664]
    • US 14/004280 [0688]
    • US 2014028330 PCT [0710]
    • US 8822663 B2 [0710]
    • NZ 700688 A [0710]
    • ES 2740248 T3 [0710]
    • EP 2755693 A4 [0710]
    • EP 2755986 A4 [0710]
    • WO 2014152940 A1 [0710]
    • EP 3450553 B1 [0710]
    • BR 112016030852 A2 [0710]
    • EP 3362461 A1 [0710]
    • US 4880635 [0921, 0961]
    • US 4906477 [0921, 0961]
    • US 4911928 [0921, 0961]
    • US 4917951 [0921, 0961]
    • US 4920016 [0921, 0961]
    • US 4921757 [0921, 0961]
    • US 5139941 [0941]
    • US 5962313 [0941]
    • US 9526784 [0957]
    • US 9737604 [0957, 0961]
    • US 2003/0087817 [0958]

    Claims (52)

    1. Komplex zum Prime Editing, umfassend: (i) Fusionsprotein, umfassend ein Nukleinsäure-programmierbares DNA-Bindungsprotein (napDNAbp) und eine Domäne, die eine RNA-abhängige DNA-Polymeraseaktivität umfasst; und (ii) eine Prime Editing Guide RNA (PEgRNA).
    2. Komplex nach Anspruch 1, wobei das Fusionsprotein in der Lage ist, ein Prime Editing in Gegenwart der Prime Editing Guide RNA (PEgRNA) durchzuführen, um eine gewünschte Nukleotidänderung in einer Target-Sequenz einzubauen.
    3. Komplex nach Anspruch 11, wobei das napDNAbp eine Nickase-Aktivität aufweist.
    4. Komplex nach Anspruch 1, wobei das napDNAbp ein Cas9 Protein oder eine Variante davon ist.
    5. Komplex nach Anspruch 1, wobei das napDNAbp ein Nuklease-aktives Cas9, ein Nuklease-inaktives Cas9 (dCas9) oder eine Cas9-Nickase (nCas9 ist).
    6. Komplex nach Anspruch 1, wobei das napDNAbp Cas9-Nickase (nCas9) ist.
    7. Komplex nach Anspruch 1, wobei das napDNAbp aus der Gruppe ausgewählt ist, die aus Cas9, Cas12e, Cas12d, Cas12a, Cas12b1, Cas13a, Cas12c und Argonaute besteht, und optional eine Nickase-Aktivität aufweist.
    8. Komplex nach Anspruch 1, wobei die Domäne, die eine RNA-abhängige DNA-Polymeraseaktivität umfasst, eine reverse Transkriptase ist, die eine beliebige der Aminosäuresequenzen von SEQ ID Nos: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741 und 766 umfasst.
    9. Komplex nach Anspruch 1, wobei die Domäne, die eine RNA-abhängige DNA-Polymeraseaktivität umfasst, eine reverse Transkriptase ist, die eine Aminosäuresequenz mit mindestens 80 %, 85 %, 90 %, 95 %, 98 % oder 99 % Sequenzidentität mit der Aminosäuresequenz einer beliebigen von SEQ ID Nos: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741 und 766 umfasst.
    10. Komplex nach Anspruch 1, wobei die Domäne, die eine RNA-abhängige DNA-Polymeraseaktivität umfasst, eine natürlich vorkommende reverse Transkriptase aus einem Retrovirus oder einem Retrotransposon ist.
    11. Komplex nach Anspruch 1, wobei das Fusionsprotein, wenn es mit einer PEgRNA komplexiert ist, in der Lage ist, an eine Target-DNA-Sequenz zu binden.
    12. Komplex nach Anspruch 1, wobei die PEgRNA eine Guide-RNA und mindestens einen Nukleinsäure-Extension-Arm umfasst, der ein DNA-Synthese-Template umfasst.
    13. Komplex nach Anspruch 12, wobei der Nukleinsäure-Extension-Arm am 3'- oder 5'-Ende der Guide-RNA oder an einer intramolekularen Position in der Guide-RNA positioniert ist, und wobei der Nukleinsäure-Extension-Arm DNA oder RNA ist.
    14. Komplex nach Anspruch 12, wobei die PEgRNA in der Lage ist, an ein napDNAbp zu binden und das napDNAbp an eine Target-DNA-Sequenz zu lenken.
    15. Komplex nach Anspruch 14, wobei die Target-DNA-Sequenz einen Target-Strang und einen komplementären Nicht-Target-Strang umfasst.
    16. Komplex nach Anspruch 12, wobei die Guide-RNA mit dem Target-Strang hybridisiert, um ein RNA-DNA-Hybrid und eine R-Schleife zu bilden.
    17. Komplex nach Anspruch 12, wobei der mindestens eine Nukleinsäure-Extension-Arm ferner eine Primer-Bindungsstelle umfasst.
    18. Komplex nach Anspruch 12, wobei der Nukleinsäure-Extension-Arm aus mindestens 5 Nukleotiden, mindestens 6 Nukleotiden, mindestens 7 Nukleotiden, mindestens 8 Nukleotiden, mindestens 9 Nukleotiden, mindestens 10 Nukleotiden, mindestens 11 Nukleotiden, mindestens 12 Nukleotiden, mindestens 13 Nukleotiden, mindestens 14 Nukleotiden, mindestens 15 Nukleotiden, mindestens 16 Nukleotiden, mindestens 17 Nukleotiden, mindestens 18 Nukleotiden, mindestens 19 Nukleotiden, mindestens 20 Nukleotiden, mindestens 21 Nukleotiden, mindestens 22 Nukleotiden, mindestens 23 Nukleotiden, mindestens 24 Nukleotiden, mindestens 25 Nukleotiden, mindestens 26 Nukleotiden, mindestens 27 Nukleotiden, mindestens 28 Nukleotiden, mindestens 29 Nukleotiden, mindestens 30 Nukleotiden, mindestens 31 Nukleotiden, mindestens 32 Nukleotiden, mindestens 33 Nukleotiden, mindestens 34 Nukleotiden, mindestens 35 Nukleotiden, mindestens 36 Nukleotiden, mindestens 37 Nukleotiden, mindestens 38 Nukleotiden, mindestens 39 Nukleotiden, mindestens 40 Nukleotiden, mindestens 41 Nukleotiden, mindestens 42 Nukleotiden, mindestens 43 Nukleotiden, mindestens 44 Nukleotiden, mindestens 45 Nukleotiden, mindestens 46 Nukleotiden, mindestens 47 Nukleotiden, mindestens 48 Nukleotiden, mindestens 49 Nukleotiden oder mindestens 50 Nukleotiden besteht.
    19. Komplex nach Anspruch 12, wobei das DNA-Synthese-Template mindestens 3 Nukleotide, mindestens 4 Nukleotide, mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide oder mindestens 15 Nukleotide lang ist.
    20. Komplex nach Anspruch 17, wobei die Primer-Bindungsstelle mindestens 3 Nukleotide, mindestens 4 Nukleotide, mindestens 5 Nukleotide, mindestens 6 Nukleotide, mindestens 7 Nukleotide, mindestens 8 Nukleotide, mindestens 9 Nukleotide, mindestens 10 Nukleotide, mindestens 11 Nukleotide, mindestens 12 Nukleotide, mindestens 13 Nukleotide, mindestens 14 Nukleotide oder mindestens 15 Nukleotide lang ist.
    21. Komplex nach Anspruch 12, wobei die PEgRNA ferner mindestens eine zusätzliche Struktur umfasst, die aus der Gruppe ausgewählt ist, die aus einem Linker, einer Stammschleife, einer Haarnadel, einer Toe-Loop, einem Aptamer oder einer RNA-Protein-Rekrutierungsdomäne besteht.
    22. Komplex nach Anspruch 12, wobei das DNA-Synthese-Template für einen Einzelstrang-DNA-Flap codiert, das zu einer endogenen DNA-Sequenz neben zu einer Nick-Stelle komplementär ist, wobei der Einzelstrang-DNA-Flap eine gewünschte Nukleotidänderung umfasst.
    23. Komplex nach Anspruch 22, wobei der Einzelstrang-DNA-Flap eine endogene Einzelstrang-DNA mit einem 5'-Ende in der Target-DNA-Sequenz, die genickt wurde, verdrängt, und wobei sich die endogene Einzelstrang-DNA stromabwärts und unmittelbar neben der Nick-Site befindet.
    24. Komplex nach Anspruch 23, wobei die endogene Einzelstrang-DNA mit dem freien 5'-Ende von der Zelle ausgeschnitten wird.
    25. Komplex nach Anspruch 23, wobei die zelluläre Reparatur des Einzelstrang-DNA-Flaps zum Einbau der gewünschten Nukleotidänderung führt, wodurch ein gewünschtes Produkt gebildet wird.
    26. Komplex nach Anspruch 12, wobei die PEgRNA die Nukleotidsequenz von SEQ ID NOs: 18-36 oder eine Nukleotidsequenz mit mindestens 85 % oder mindestens 90 % oder mindestens 95 % oder mindestens 98 % oder mindestens 99 % Sequenzidentität mit einer beliebigen der SEQ ID Nos: 101-104, 181-183, 223-244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777 umfasst.
    27. Komplex nach Anspruch 12, wobei das DNA-Synthese-Template eine Nukleotidsequenz umfasst, die mindestens 80 % oder 85 % oder 90 % oder 95 % oder 99 % identisch mit dem endogenen DNA-Target ist.
    28. Komplex nach Anspruch 17, wobei die Primer-Bindungsstelle mit einem freien 3'-Ende der geschnittenen DNA hybridisiert.
    29. Komplex nach Anspruch 21, wobei sich die mindestens eine zusätzliche Struktur am 3'- oder 5'-Ende der PEgRNA befindet.
    30. Komplex nach Anspruch 29, wobei der Linker eine Nukleotidsequenz umfasst, die aus der Gruppe bestehend aus SEQ ID Nos: 127, 165-176, 446, 453 und 767-769 ausgewählt ist.
    31. Komplex nach Anspruch 29, wobei die Stammschleife eine Nukleotidsequenz umfasst, die aus den hier beschriebenen Stammschleifen ausgewählt ist.
    32. Komplex nach Anspruch 29, wobei die Haarnadel eine Nukleotidsequenz umfasst, die aus den hier beschriebenen Haarnadeln ausgewählt ist.
    33. Komplex nach Anspruch 29, wobei die Toe-Loop eine Nukleotidsequenz umfasst, die aus den hier beschriebenen Toe-Loops ausgewählt ist.
    34. Komplex nach Anspruch 29, wobei das Aptamer eine Nukleotidsequenz umfasst, die aus den hier beschriebenen Aptameren ausgewählt ist.
    35. Komplex nach Anspruch 29, wobei die RNA-Protein-Rekrutierungsdomäne eine Nukleotidsequenz umfasst, die aus den hier beschriebenen RNA-Protein-Rekrutierungsdomänen ausgewählt ist.
    36. Komplex nach Anspruch 1, wobei die Target-DNA-Sequenz einen Target-Strang und einen komplementären Nicht-Target-Strang umfasst.
    37. Komplex nach Anspruch 36, wobei die R-Schleife (i) ein RNA-DNA-Hybrid, das die PEgRNA und den Target-Strang umfasst, und (ii) den komplementären Nicht-Target-Strang umfasst.
    38. Komplex nach Anspruch 37, wobei der Target-Strang oder der komplementäre Nicht-Target-Strang genickt ist, um eine Priming-Sequenz mit einem freien 3'-Ende zu bilden.
    39. Komplex nach Anspruch 38, wobei die Nick-Stelle stromaufwärts der PAM-Sequenz auf dem Target-Strang liegt.
    40. Komplex nach Anspruch 38, wobei die Nick-Stelle stromaufwärts der PAM-Sequenz auf dem Nicht-Target-Strang liegt.
    41. Komplex nach Anspruch 38, mit der Nick-Stelle -1, -2, -3, -4, -5, -6, -7, -8 oder -9 relativ zum 5'-Ende der PAM-Sequenz.
    42. Komplex nach Anspruch 22, wobei der Einzelstrang-DNA-Flap mit der endogenen DNA-Sequenz neben der Nick-Stelle hybridisiert, wodurch die gewünschte Nukleotidänderung im Target-Strang eingebaut wird.
    43. Komplex nach Anspruch 22, wobei der Einzelstrang-DNA-Flap die endogene DNA-Sequenz neben der Nick-Stelle und die ein freies 5'-Ende aufweist verdrängt.
    44. Komplex nach Anspruch 22, wobei die endogene DNA-Sequenz mit dem 5'- Ende von der Zelle ausgeschnitten wird.
    45. Komplex nach Anspruch 44, wobei die endogene DNA-Sequenz mit dem 5'-Ende von einer Flap-Endonuklease ausgeschnitten wird.
    46. Komplex nach Anspruch 43, wobei die zelluläre Reparatur des Einzelstrang-DNA-Flaps die gewünschte Nukleotidänderung in dem Nicht-Target-Strang aufnimmt, wodurch ein gewünschtes Produkt gebildet wird.
    47. Komplex nach Anspruch 46, wobei die gewünschte Nukleotidänderung in einem Editing-Fenster eingebaut ist, das zwischen etwa -4 bis +10 der PAM-Sequenz oder zwischen etwa -10 bis +20 der PAM-Sequenz oder zwischen etwa -20 bis +40 der PAM-Sequenz oder zwischen etwa -30 bis +100 der PAM-Sequenz liegt.
    48. Komplex nach Anspruch 47, wobei die gewünschte Nukleotidänderung mindestens 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 oder 100 Nukleotide stromabwärts der Nick-Stelle eingebaut ist.
    49. Komplex nach einem der vorhergehenden Ansprüche, wobei das Fusionsprotein die Struktur NH2-[napDNAbp]-[Domäne, umfassend eine RNA-abhängige DNA-Polymeraseaktivität]-COOH; oder NH2-[Domäne, umfassend eine RNA-abhängige DNA-Polymeraseaktivität]-[napDNAbp]-COOH umfasst, wobei jedes Auftreten von „]-[“ das Vorhandensein einer optionalen Linker-Sequenz anzeigt.
    50. Komplex nach Anspruch 49, wobei die Linker-Sequenz eine Aminosäuresequenz von SEQ ID NOs: 127, 165-176, 446, 453 und 767-769 umfasst.
    51. Komplex nach Anspruch 1, wobei das Fusionsprotein ferner einen Linker umfasst, der das napDNAbp und die Domäne, die eine RNA-abhängige DNA-Polymeraseaktivität umfasst, verbindet.
    52. Komplex nach Anspruch 51, wobei die Linker-Sequenz eine Aminosäuresequenz von SEQ ID Nos: 3887 (1x SGGS), 3888 (2x SGGS), 3889 (3x SGGS), 3890 (1x XTEN), 3891 (1x EAAAK), 3892 (2x EAAAK) und 3893 (3x EAAAK) umfasst.
    DE112020001339.1T 2019-03-19 2020-03-19 Verfahren und zusammensetzung zum editing von nukleotidsequenzen Pending DE112020001339T5 (de)

    Applications Claiming Priority (23)

    Application Number Priority Date Filing Date Title
    US201962820813P 2019-03-19 2019-03-19
    US62/820,813 2019-03-19
    US201962858958P 2019-06-07 2019-06-07
    US62/858,958 2019-06-07
    US201962889996P 2019-08-21 2019-08-21
    US201962922654P 2019-08-21 2019-08-21
    US62/922,654 2019-08-21
    US62/889,996 2019-08-21
    US201962913553P 2019-10-10 2019-10-10
    US201962973558P 2019-10-10 2019-10-10
    US62/973,558 2019-10-10
    US62/913,553 2019-10-10
    US201962931195P 2019-11-05 2019-11-05
    US62/931,195 2019-11-05
    US201962944231P 2019-12-05 2019-12-05
    US201962974537P 2019-12-05 2019-12-05
    US62/944,231 2019-12-05
    US62/974,537 2019-12-05
    US202062991069P 2020-03-17 2020-03-17
    US202063100548P 2020-03-17 2020-03-17
    US62/991,069 2020-03-17
    US63/100,548 2020-03-17
    PCT/US2020/023713 WO2020191234A1 (en) 2019-03-19 2020-03-19 Methods and compositions for editing nucleotide sequences

    Publications (1)

    Publication Number Publication Date
    DE112020001339T5 true DE112020001339T5 (de) 2022-01-13

    Family

    ID=72519164

    Family Applications (3)

    Application Number Title Priority Date Filing Date
    DE112020001342.1T Pending DE112020001342T5 (de) 2019-03-19 2020-03-19 Verfahren und Zusammensetzungen zum Editing von Nukleotidsequenzen
    DE112020001306.5T Pending DE112020001306T5 (de) 2019-03-19 2020-03-19 Verfahren und zusammensetzungen zur editierung von nukleotidsequenzen
    DE112020001339.1T Pending DE112020001339T5 (de) 2019-03-19 2020-03-19 Verfahren und zusammensetzung zum editing von nukleotidsequenzen

    Family Applications Before (2)

    Application Number Title Priority Date Filing Date
    DE112020001342.1T Pending DE112020001342T5 (de) 2019-03-19 2020-03-19 Verfahren und Zusammensetzungen zum Editing von Nukleotidsequenzen
    DE112020001306.5T Pending DE112020001306T5 (de) 2019-03-19 2020-03-19 Verfahren und zusammensetzungen zur editierung von nukleotidsequenzen

    Country Status (14)

    Country Link
    US (9) US20230078265A1 (de)
    EP (4) EP3942043A2 (de)
    JP (4) JP2022531539A (de)
    KR (2) KR20210142210A (de)
    CN (4) CN114127285A (de)
    AU (2) AU2020240109A1 (de)
    BR (2) BR112021018606A2 (de)
    CA (2) CA3130488A1 (de)
    DE (3) DE112020001342T5 (de)
    GB (3) GB2601618A (de)
    IL (2) IL286335A (de)
    MX (2) MX2021011325A (de)
    SG (2) SG11202109882VA (de)
    WO (12) WO2020191243A1 (de)

    Families Citing this family (157)

    * Cited by examiner, † Cited by third party
    Publication number Priority date Publication date Assignee Title
    US20150044192A1 (en) 2013-08-09 2015-02-12 President And Fellows Of Harvard College Methods for identifying a target site of a cas9 nuclease
    US9340799B2 (en) 2013-09-06 2016-05-17 President And Fellows Of Harvard College MRNA-sensing switchable gRNAs
    US9840699B2 (en) 2013-12-12 2017-12-12 President And Fellows Of Harvard College Methods for nucleic acid editing
    EP3177718B1 (de) 2014-07-30 2022-03-16 President and Fellows of Harvard College Cas9-proteine mit ligandenabhängigen inteinen
    EP3365356B1 (de) 2015-10-23 2023-06-28 President and Fellows of Harvard College Nukleobaseeditoren und deren verwendungen
    GB2568182A (en) 2016-08-03 2019-05-08 Harvard College Adenosine nucleobase editors and uses thereof
    AU2017308889B2 (en) 2016-08-09 2023-11-09 President And Fellows Of Harvard College Programmable Cas9-recombinase fusion proteins and uses thereof
    US11542509B2 (en) 2016-08-24 2023-01-03 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
    KR102622411B1 (ko) 2016-10-14 2024-01-10 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 핵염기 에디터의 aav 전달
    WO2018119359A1 (en) 2016-12-23 2018-06-28 President And Fellows Of Harvard College Editing of ccr5 receptor gene to protect against hiv infection
    US11898179B2 (en) 2017-03-09 2024-02-13 President And Fellows Of Harvard College Suppression of pain by gene editing
    WO2018165629A1 (en) 2017-03-10 2018-09-13 President And Fellows Of Harvard College Cytosine to guanine base editor
    EP3601562A1 (de) 2017-03-23 2020-02-05 President and Fellows of Harvard College Nukleobasen-editoren mit nukleinsäureprogrammierbaren dna-bindenden proteinen
    WO2018209320A1 (en) 2017-05-12 2018-11-15 President And Fellows Of Harvard College Aptazyme-embedded guide rnas for use with crispr-cas9 in genome editing and transcriptional activation
    US9982279B1 (en) 2017-06-23 2018-05-29 Inscripta, Inc. Nucleic acid-guided nucleases
    PT3645719T (pt) 2017-06-30 2022-05-18 Inscripta Inc Métodos, módulos, instrumentos e sistemas automatizados de processamento de células
    US11732274B2 (en) 2017-07-28 2023-08-22 President And Fellows Of Harvard College Methods and compositions for evolving base editors using phage-assisted continuous evolution (PACE)
    EP3676376A2 (de) 2017-08-30 2020-07-08 President and Fellows of Harvard College Hocheffiziente baseneditoren mit gam
    WO2019051097A1 (en) 2017-09-08 2019-03-14 The Regents Of The University Of California RNA-GUIDED ENDONUCLEASE FUSION POLYPEPTIDES AND METHODS OF USING SAME
    KR20200121782A (ko) 2017-10-16 2020-10-26 더 브로드 인스티튜트, 인코퍼레이티드 아데노신 염기 편집제의 용도
    US10526598B2 (en) 2018-04-24 2020-01-07 Inscripta, Inc. Methods for identifying T-cell receptor antigens
    US10858761B2 (en) 2018-04-24 2020-12-08 Inscripta, Inc. Nucleic acid-guided editing of exogenous polynucleotides in heterologous cells
    BR112021018606A2 (pt) 2019-03-19 2021-11-23 Harvard College Métodos e composições para editar sequências de nucleotídeos
    US11001831B2 (en) 2019-03-25 2021-05-11 Inscripta, Inc. Simultaneous multiplex genome editing in yeast
    CN109913485A (zh) * 2019-03-25 2019-06-21 南京农业大学 一种制备、纯化hops复合物蛋白的方法
    CA3139122C (en) 2019-06-06 2023-04-25 Inscripta, Inc. Curing for recursive nucleic acid-guided cell editing
    WO2021072328A1 (en) 2019-10-10 2021-04-15 The Broad Institute, Inc. Methods and compositions for prime editing rna
    WO2021080922A1 (en) * 2019-10-21 2021-04-29 The Trustees Of Columbia University In The City Of New York Methods of performing rna templated genome editing
    CN115279898A (zh) * 2019-10-23 2022-11-01 成对植物服务股份有限公司 用于植物中rna模板化编辑的组合物和方法
    BR112022008468A2 (pt) * 2019-11-01 2022-07-19 Shanghai Bluecross Medical Science Inst Método para modificação direcionada de uma sequência de genoma de planta
    CN114901302A (zh) * 2019-11-05 2022-08-12 成对植物服务股份有限公司 Rna编码的dna置换等位基因的组合物和方法
    WO2021092204A1 (en) * 2019-11-05 2021-05-14 Spotlight Therapeutics Methods and compositions for nucleic acid-guided nuclease cell targeting screen
    US11203762B2 (en) 2019-11-19 2021-12-21 Inscripta, Inc. Methods for increasing observed editing in bacteria
    CA3157127A1 (en) 2019-12-18 2021-06-24 Aamir MIR Cascade/dcas3 complementation assays for in vivo detection of nucleic acid-guided nuclease edited cells
    US20230049737A1 (en) * 2019-12-30 2023-02-16 The Broad Institute, Inc. Genome editing using reverse transcriptase enabled and fully active crispr complexes
    EP4121522A1 (de) 2020-03-19 2023-01-25 Intellia Therapeutics, Inc. Verfahren und zusammensetzungen zur gerichteten genomeditierung
    US20210332388A1 (en) 2020-04-24 2021-10-28 Inscripta, Inc. Compositions, methods, modules and instruments for automated nucleic acid-guided nuclease editing in mammalian cells
    DE112021002672T5 (de) 2020-05-08 2023-04-13 President And Fellows Of Harvard College Vefahren und zusammensetzungen zum gleichzeitigen editieren beider stränge einer doppelsträngigen nukleotid-zielsequenz
    WO2022006042A1 (en) * 2020-06-29 2022-01-06 President And Fellows Of Harvard College Methods, compositions, and kits for nucleic acid barcoding of biomolecules
    WO2022007959A1 (zh) * 2020-07-10 2022-01-13 中国科学院动物研究所 一种编辑核酸的系统及方法
    WO2022026345A1 (en) * 2020-07-30 2022-02-03 Inscripta, Inc. Arrayed nucleic acid-guided nuclease or nickase fusion editing
    US20230295615A1 (en) * 2020-08-07 2023-09-21 The Jackson Laboratory Targeted Sequence Insertion Compositions and Methods
    WO2022036150A1 (en) 2020-08-13 2022-02-17 Sana Biotechnology, Inc. Methods of treating sensitized patients with hypoimmunogenic cells, and associated methods and compositions
    WO2022060749A1 (en) 2020-09-15 2022-03-24 Inscripta, Inc. Crispr editing to embed nucleic acid landing pads into genomes of live cells
    JP2023543803A (ja) * 2020-09-24 2023-10-18 ザ ブロード インスティテュート,インコーポレーテッド プライム編集ガイドrna、その組成物、及びその使用方法
    US20240018492A1 (en) * 2020-09-29 2024-01-18 Institute For Basic Science Prime editing using hiv reverse transcriptase and cas9 or variant thereof
    JP2023543602A (ja) * 2020-10-06 2023-10-17 キージーン ナムローゼ フェンノートシャップ 標的化された配列付加
    US11761020B2 (en) 2020-10-15 2023-09-19 Aavocyte, Inc. Recombinant adeno-associated virus vectors with CD14 promoter and use thereof
    EP4232583A1 (de) * 2020-10-21 2023-08-30 Massachusetts Institute of Technology Systeme, verfahren und zusammensetzungen für ortsspezifisches gen-engineering unter verwendung programmierbarer addition über ortsspezifische targeting-elemente (paste)
    KR20230111189A (ko) * 2020-10-23 2023-07-25 더 브로드 인스티튜트, 인코퍼레이티드 재프로그램 가능한 iscb 뉴클레아제 및 이의 용도
    US20240026381A1 (en) * 2020-11-03 2024-01-25 The Board Of Trustees Of The University Of Illinois Split prime editing platforms
    JP2023549125A (ja) * 2020-11-05 2023-11-22 ユニバーシティ オブ ワシントン プライム編集に基づく精密なゲノムの削除と置換方法
    AU2021374974A1 (en) * 2020-11-06 2023-05-25 Pairwise Plants Services, Inc. Compositions and methods for rna-encoded dna-replacement of alleles
    EP4244369A1 (de) * 2020-11-12 2023-09-20 Shanghaitech University Genomeditierung von verbesserter effizienz und genauigkeit
    CN114480330A (zh) * 2020-11-13 2022-05-13 广州达安基因股份有限公司 多突变位点的逆转录酶突变体
    EP4256040A1 (de) * 2020-12-07 2023-10-11 Inscripta, Inc. Grna-stabilisierung bei nukleinsäuregeführter nickase-editierung
    CN112626049B (zh) * 2020-12-14 2022-04-01 安徽省农业科学院水稻研究所 一种在水稻基因打靶中识别特异位点的SpCas9-NRRH突变体及其应用
    EP4271802A1 (de) 2021-01-04 2023-11-08 Inscripta, Inc. Mad-nukleasen
    CA3203876A1 (en) * 2021-01-11 2022-07-14 David R. Liu Prime editor variants, constructs, and methods for enhancing prime editing efficiency and precision
    CN112708605A (zh) * 2021-01-14 2021-04-27 中山大学 一个Cas9蛋白拆分得到的蛋白组及其应用
    CN117083379A (zh) * 2021-01-15 2023-11-17 4M基因组学公司 用于基因编辑的多肽融合体或缀合物
    WO2022158898A1 (ko) * 2021-01-21 2022-07-28 한국생명공학연구원 Francisella novicida cas9 모듈 기반의 역전사 효소를 사용한 유전체 치환 및 삽입 기술
    US20230374476A1 (en) * 2021-02-05 2023-11-23 University Of Massachusetts Prime editor system for in vivo genome editing
    WO2022173830A1 (en) * 2021-02-09 2022-08-18 The Broad Institute, Inc. Nuclease-guided non-ltr retrotransposons and uses thereof
    US11884924B2 (en) * 2021-02-16 2024-01-30 Inscripta, Inc. Dual strand nucleic acid-guided nickase editing
    WO2022182786A1 (en) * 2021-02-23 2022-09-01 University Of Massachusetts Genome editing for treating muscular dystrophy
    WO2022204476A1 (en) 2021-03-26 2022-09-29 The Board Of Regents Of The University Of Texas System Nucleotide editing to reframe dmd transcripts by base editing and prime editing
    WO2022212926A1 (en) * 2021-04-01 2022-10-06 Prime Medicine, Inc. Methods and compositions for editing nucleotide sequences
    CN115161316A (zh) * 2021-04-02 2022-10-11 上海科技大学 一种引导编辑工具、融合rna及其用途
    JP2024513087A (ja) * 2021-04-07 2024-03-21 アストラゼネカ・アクチエボラーグ 部位特異的改変のための組成物及び方法
    WO2022234051A1 (en) * 2021-05-06 2022-11-10 Universität Zürich Split prime editing enzyme
    CN118043457A (zh) * 2021-05-17 2024-05-14 武汉大学 用于插入和编辑大核酸片段的系统和方法
    EP4347805A1 (de) 2021-05-27 2024-04-10 Astrazeneca AB Cas9-effektorproteine mit erhöhter stabilität
    EP4349979A1 (de) 2021-05-27 2024-04-10 Institute Of Zoology, Chinese Academy Of Sciences Manipulierte cas12i-nuklease, effektorprotein und verwendung davon
    CN117642420A (zh) 2021-05-28 2024-03-01 萨那生物科技公司 含有截短的狒狒内源性逆转录病毒(BaEV)包膜糖蛋白的脂质颗粒及相关方法和用途
    AU2022284804A1 (en) * 2021-06-01 2023-12-07 Arbor Biotechnologies, Inc. Gene editing systems comprising a crispr nuclease and uses thereof
    EP4352230A2 (de) * 2021-06-03 2024-04-17 Prime Medicine, Inc. Genomeditierungszusammensetzungen und verfahren zur behandlung der wilson-krankheit
    WO2022261509A1 (en) 2021-06-11 2022-12-15 The Broad Institute, Inc. Improved cytosine to guanine base editors
    WO2022265965A1 (en) * 2021-06-14 2022-12-22 10X Genomics, Inc. Reverse transcriptase variants for improved performance
    WO2023283092A1 (en) * 2021-07-06 2023-01-12 Prime Medicine, Inc. Compositions and methods for efficient genome editing
    US20230052518A1 (en) 2021-07-12 2023-02-16 Labsimply, Inc. Nuclease cascade assay
    WO2023288332A2 (en) * 2021-07-16 2023-01-19 Prime Medicine, Inc. Genome editing compositions and methods for treatment of wilson's disease
    EP4373939A2 (de) * 2021-07-23 2024-05-29 Prime Medicine, Inc. Genomeditierungszusammensetzungen und verfahren zur behandlung von chronischer granulomatöser erkrankung
    WO2023015318A2 (en) * 2021-08-05 2023-02-09 Prime Medicine, Inc. Genome editing compositions and methods for treatment of cystic fibrosis
    AU2022325166A1 (en) * 2021-08-06 2024-02-08 President And Fellows Of Harvard College Improved prime editors and methods of use
    AU2022326565A1 (en) 2021-08-11 2024-02-08 Sana Biotechnology, Inc. Genetically modified cells for allogeneic cell therapy
    CA3227108A1 (en) 2021-08-11 2023-02-16 Xiaomeng HU Genetically modified primary cells for allogeneic cell therapy
    AU2022325955A1 (en) 2021-08-11 2024-02-08 Sana Biotechnology, Inc. Genetically modified cells for allogeneic cell therapy to reduce instant blood mediated inflammatory reactions
    AU2022325231A1 (en) 2021-08-11 2024-02-08 Sana Biotechnology, Inc. Genetically modified cells for allogeneic cell therapy to reduce complement-mediated inflammatory reactions
    AU2022334454A1 (en) * 2021-08-24 2024-03-14 Prime Medicine, Inc. Genome editing compositions and methods for treatment of retinopathy
    IL311218A (en) * 2021-09-08 2024-05-01 Flagship Pioneering Innovations Vi Llc PAH Modulating Compositions and Methods
    IL311225A (en) * 2021-09-08 2024-05-01 Flagship Pioneering Innovations Vi Llc Methods and compositions for genome modulation
    KR20240055811A (ko) 2021-09-10 2024-04-29 애질런트 테크놀로지스, 인크. 프라임 편집을 위한 화학적 변형을 갖는 가이드 rna
    WO2023049931A1 (en) * 2021-09-27 2023-03-30 The Trustees Of Columbia University In The City Of New York Methods and systems for modifying the crumbs homologue-1 (crb1) gene
    CA3232862A1 (en) * 2021-09-27 2023-03-30 Steven Petrou Compositions and methods for the treatment of pcdh19 related disorders
    GB202113933D0 (en) * 2021-09-29 2021-11-10 Genome Res Ltd Methods for gene editing
    WO2023070110A2 (en) * 2021-10-21 2023-04-27 Prime Medicine, Inc. Genome editing compositions and methods for treatment of retinitis pigmentosa
    WO2023070062A2 (en) * 2021-10-21 2023-04-27 Prime Medicine, Inc. Genome editing compositions and methods for treatment of usher syndrome type 3
    WO2023069790A1 (en) 2021-10-22 2023-04-27 Sana Biotechnology, Inc. Methods of engineering allogeneic t cells with a transgene in a tcr locus and associated compositions and methods
    WO2023076898A1 (en) * 2021-10-25 2023-05-04 The Broad Institute, Inc. Methods and compositions for editing a genome with prime editing and a recombinase
    CA3237300A1 (en) 2021-11-01 2023-05-04 Tome Biosciences, Inc. Single construct platform for simultaneous delivery of gene editing machinery and nucleic acid cargo
    WO2023081787A2 (en) * 2021-11-04 2023-05-11 Prime Medicine, Inc. Genome editing compositions and methods for treatment of fanconi anemia
    WO2023086805A2 (en) * 2021-11-09 2023-05-19 Sri International Platform using ipsc-derived cardiomyocytes carrying gene variants as models of cardiac disease and drug-response
    WO2023097224A1 (en) * 2021-11-23 2023-06-01 The Broad Institute, Inc. Reprogrammable isrb nucleases and uses thereof
    WO2023102538A1 (en) * 2021-12-03 2023-06-08 The Broad Institute, Inc. Self-assembling virus-like particles for delivery of prime editors and methods of making and using same
    WO2023102550A2 (en) 2021-12-03 2023-06-08 The Broad Institute, Inc. Compositions and methods for efficient in vivo delivery
    US20230279375A1 (en) 2021-12-13 2023-09-07 Labsimply, Inc. Signal boost cascade assay
    WO2023114052A1 (en) 2021-12-13 2023-06-22 Labsimply, Inc. Tuning cascade assay kinetics via molecular design
    WO2023114473A2 (en) * 2021-12-16 2023-06-22 10X Genomics, Inc. Recombinant reverse transcriptase variants for improved performance
    WO2023114992A1 (en) * 2021-12-17 2023-06-22 Massachusetts Institute Of Technology Programmable insertion approaches via reverse transcriptase recruitment
    WO2023115041A1 (en) 2021-12-17 2023-06-22 Sana Biotechnology, Inc. Modified paramyxoviridae attachment glycoproteins
    WO2023115039A2 (en) 2021-12-17 2023-06-22 Sana Biotechnology, Inc. Modified paramyxoviridae fusion glycoproteins
    WO2023122764A1 (en) 2021-12-22 2023-06-29 Tome Biosciences, Inc. Co-delivery of a gene editor construct and a donor template
    WO2023133595A2 (en) 2022-01-10 2023-07-13 Sana Biotechnology, Inc. Methods of ex vivo dosing and administration of lipid particles or viral vectors and related systems and uses
    WO2023141602A2 (en) 2022-01-21 2023-07-27 Renagade Therapeutics Management Inc. Engineered retrons and methods of use
    WO2023150518A1 (en) 2022-02-01 2023-08-10 Sana Biotechnology, Inc. Cd3-targeted lentiviral vectors and uses thereof
    WO2023150637A1 (en) * 2022-02-02 2023-08-10 Inscripta, Inc. Nucleic acid-guided nickase fusion proteins
    WO2023150647A1 (en) 2022-02-02 2023-08-10 Sana Biotechnology, Inc. Methods of repeat dosing and administration of lipid particles or viral vectors and related systems and uses
    WO2023150802A1 (en) * 2022-02-07 2023-08-10 Travin Bio, Inc. Methods and compositions for targeted delivery of intracellular biologics
    KR20230121565A (ko) * 2022-02-08 2023-08-18 주식회사 툴젠 프라임 에디팅 시스템을 이용한 게놈 편집의 과정에서 발생 가능한 오프 타겟을 예측하는 방법
    WO2023158836A1 (en) 2022-02-17 2023-08-24 Sana Biotechnology, Inc. Engineered cd47 proteins and uses thereof
    TW202342744A (zh) * 2022-03-01 2023-11-01 美商巴斯夫農業解決方案種子美國有限責任公司 Cas12a切口酶
    WO2023200406A2 (en) * 2022-04-14 2023-10-19 National University Of Singapore Method of detecting a polynucleotide analyte
    WO2023205708A1 (en) * 2022-04-20 2023-10-26 Massachusetts Institute Of Technology SITE SPECIFIC GENETIC ENGINEERING UTILIZING TRANS-TEMPLATE RNAs
    WO2023205687A1 (en) * 2022-04-20 2023-10-26 The Broad Institute, Inc. Improved prime editing methods and compositions
    WO2023205744A1 (en) 2022-04-20 2023-10-26 Tome Biosciences, Inc. Programmable gene insertion compositions
    WO2023212594A2 (en) * 2022-04-26 2023-11-02 University Of Massachusetts SINGLE pegRNA-MEDIATED LARGE INSERTIONS
    WO2023205844A1 (en) * 2022-04-26 2023-11-02 Peter Maccallum Cancer Institute Nucleic acids and uses thereof
    WO2023215831A1 (en) 2022-05-04 2023-11-09 Tome Biosciences, Inc. Guide rna compositions for programmable gene insertion
    WO2023225670A2 (en) 2022-05-20 2023-11-23 Tome Biosciences, Inc. Ex vivo programmable gene insertion
    WO2023232024A1 (en) * 2022-05-30 2023-12-07 Wuhan University System and methods for duplicating target fragments
    KR102472344B1 (ko) * 2022-05-31 2022-11-30 주식회사 엠케이바이오텍 프라임 편집을 이용한 개의 고관절 이형성증 치료용 조성물
    CN114958767B (zh) * 2022-06-02 2022-12-27 健颐生物科技发展(山东)有限公司 基于hiPSC细胞构建的神经干细胞制剂的制备方法
    WO2023250174A1 (en) * 2022-06-23 2023-12-28 Prime Medicine, Inc. Split prime editors
    CN115058451A (zh) * 2022-06-23 2022-09-16 五邑大学 一种用于同源重组和单碱基编辑的双报告质粒及其构建方法和应用
    WO2024006762A1 (en) * 2022-06-27 2024-01-04 The Uab Research Foundation Nucleic acid probes and their uses for the detection of prevotella bivia
    CN115148281B (zh) * 2022-06-29 2023-07-14 广州源井生物科技有限公司 一种基因编辑点突变方案自动设计方法及系统
    CN115093470B (zh) * 2022-06-30 2023-03-24 广州市乾相生物科技有限公司 内含肽Mtu RecA突变体及其在生产谷胱甘肽GSH中的应用
    WO2024020346A2 (en) 2022-07-18 2024-01-25 Renagade Therapeutics Management Inc. Gene editing components, systems, and methods of use
    WO2024020111A1 (en) * 2022-07-20 2024-01-25 Syntax Bio, Inc. Systems for cell programming and methods thereof
    CN115331736B (zh) * 2022-07-20 2023-07-25 佛山科学技术学院 基于文本匹配延伸高通量测序基因的拼接方法
    WO2024020587A2 (en) 2022-07-22 2024-01-25 Tome Biosciences, Inc. Pleiopluripotent stem cell programmable gene insertion
    CN116064517A (zh) * 2022-07-29 2023-05-05 之江实验室 一种先导编辑gRNA的产生方式及其用途
    WO2024038003A1 (en) * 2022-08-15 2024-02-22 Institut Pasteur Methods and systems for generating nucleic acid diversity in crispr-associated genes
    WO2024044655A1 (en) 2022-08-24 2024-02-29 Sana Biotechnology, Inc. Delivery of heterologous proteins
    WO2024042489A1 (en) 2022-08-25 2024-02-29 LifeEDIT Therapeutics, Inc. Chemical modification of guide rnas with locked nucleic acid for rna guided nuclease-mediated gene editing
    WO2024044723A1 (en) 2022-08-25 2024-02-29 Renagade Therapeutics Management Inc. Engineered retrons and methods of use
    WO2024064838A1 (en) 2022-09-21 2024-03-28 Sana Biotechnology, Inc. Lipid particles comprising variant paramyxovirus attachment glycoproteins and uses thereof
    WO2024076473A1 (en) 2022-10-02 2024-04-11 Vedabio, Inc. Dimerization screening assays
    WO2024077267A1 (en) 2022-10-07 2024-04-11 The Broad Institute, Inc. Prime editing methods and compositions for treating triplet repeat disorders
    WO2024081820A1 (en) 2022-10-13 2024-04-18 Sana Biotechnology, Inc. Viral particles targeting hematopoietic stem cells
    WO2024097315A2 (en) 2022-11-02 2024-05-10 Sana Biotechnology, Inc. Cell therapy products and methods for producing same
    WO2024095245A2 (en) 2022-11-04 2024-05-10 LifeEDIT Therapeutics, Inc. Evolved adenine deaminases and rna-guided nuclease fusion proteins with internal insertion sites and methods of use
    CN116286738B (zh) * 2023-02-03 2023-11-24 珠海舒桐医疗科技有限公司 Dsb-pe基因编辑系统及其应用
    CN117363588A (zh) * 2023-02-15 2024-01-09 中国农业科学院兰州兽医研究所 一种表达四半胱氨酸标签重组蓝舌病毒的制备方法及应用
    CN116501703B (zh) * 2023-06-27 2023-09-01 江铃汽车股份有限公司 一种对adams分析结果进行数据合并处理的方法及设备
    CN117535354A (zh) * 2023-09-28 2024-02-09 广州瑞风生物科技有限公司 一种修复hba2基因突变的方法、组合物及其应用

    Citations (81)

    * Cited by examiner, † Cited by third party
    Publication number Priority date Publication date Assignee Title
    US381A (en) 1837-09-12 Samuel nicolsonj of bo
    US13738A (en) 1855-10-30 eaton
    US4186183A (en) 1978-03-29 1980-01-29 The United States Of America As Represented By The Secretary Of The Army Liposome carriers in chemotherapy of leishmaniasis
    US4217344A (en) 1976-06-23 1980-08-12 L'oreal Compositions containing aqueous dispersions of lipid spheres
    US4235871A (en) 1978-02-24 1980-11-25 Papahadjopoulos Demetrios P Method of encapsulating biologically active materials in lipid vesicles
    US4261975A (en) 1979-09-19 1981-04-14 Merck & Co., Inc. Viral liposome particle
    US4485054A (en) 1982-10-04 1984-11-27 Lipoderm Pharmaceuticals Limited Method of encapsulating biologically active materials in multilamellar lipid vesicles (MLV)
    US4501728A (en) 1983-01-06 1985-02-26 Technology Unlimited, Inc. Masking of liposomes from RES recognition
    US4663290A (en) 1982-01-21 1987-05-05 Molecular Genetics, Inc. Production of reverse transcriptase
    US4774085A (en) 1985-07-09 1988-09-27 501 Board of Regents, Univ. of Texas Pharmaceutical administration systems containing a mixture of immunomodulators
    US4797368A (en) 1985-03-15 1989-01-10 The United States Of America As Represented By The Department Of Health And Human Services Adeno-associated virus as eukaryotic expression vector
    US4837028A (en) 1986-12-24 1989-06-06 Liposome Technology, Inc. Liposomes with enhanced circulation time
    US4880635A (en) 1984-08-08 1989-11-14 The Liposome Company, Inc. Dehydrated liposomes
    US4889818A (en) 1986-08-22 1989-12-26 Cetus Corporation Purified thermostable enzyme
    US4897355A (en) 1985-01-07 1990-01-30 Syntex (U.S.A.) Inc. N[ω,(ω-1)-dialkyloxy]- and N-[ω,(ω-1)-dialkenyloxy]-alk-1-yl-N,N,N-tetrasubstituted ammonium lipids and uses therefor
    US4906477A (en) 1987-02-09 1990-03-06 Kabushiki Kaisha Vitamin Kenkyusyo Antineoplastic agent-entrapping liposomes
    US4911928A (en) 1987-03-13 1990-03-27 Micro-Pak, Inc. Paucilamellar lipid vesicles
    US4917951A (en) 1987-07-28 1990-04-17 Micro-Pak, Inc. Lipid vesicles formed of surfactants and steroids
    US4920016A (en) 1986-12-24 1990-04-24 Linear Technology, Inc. Liposomes with enhanced circulation time
    US4921757A (en) 1985-04-26 1990-05-01 Massachusetts Institute Of Technology System for delayed and pulsed release of biologically active substances
    US4946787A (en) 1985-01-07 1990-08-07 Syntex (U.S.A.) Inc. N-(ω,(ω-1)-dialkyloxy)- and N-(ω,(ω-1)-dialkenyloxy)-alk-1-yl-N,N,N-tetrasubstituted ammonium lipids and uses therefor
    US4965185A (en) 1988-06-22 1990-10-23 Grischenko Valentin I Method for low-temperature preservation of embryos
    US5047342A (en) 1989-08-10 1991-09-10 Life Technologies, Inc. Cloning and expression of T5 DNA polymerase
    US5049386A (en) 1985-01-07 1991-09-17 Syntex (U.S.A.) Inc. N-ω,(ω-1)-dialkyloxy)- and N-(ω,(ω-1)-dialkenyloxy)Alk-1-YL-N,N,N-tetrasubstituted ammonium lipids and uses therefor
    WO1991016024A1 (en) 1990-04-19 1991-10-31 Vical, Inc. Cationic lipids for intracellular delivery of biologically active molecules
    WO1991017424A1 (en) 1990-05-03 1991-11-14 Vical, Inc. Intracellular delivery of biologically active substances by means of self-assembling lipid complexes
    US5079352A (en) 1986-08-22 1992-01-07 Cetus Corporation Purified thermostable enzyme
    WO1992006200A1 (en) 1990-09-28 1992-04-16 F. Hoffmann-La-Roche Ag 5' to 3' exonuclease mutations of thermostable dna polymerases
    WO1992006188A2 (en) 1990-10-05 1992-04-16 Barnes Wayne M Thermostable dna polymerase
    US5139941A (en) 1985-10-31 1992-08-18 University Of Florida Research Foundation, Inc. AAV transduction vectors
    US5173414A (en) 1990-10-30 1992-12-22 Applied Immune Sciences, Inc. Production of recombinant adeno-associated virus vectors
    WO1993024641A2 (en) 1992-06-02 1993-12-09 The United States Of America, As Represented By The Secretary, Department Of Health & Human Services Adeno-associated virus with inverted terminal repeat sequences as promoter
    US5270179A (en) 1989-08-10 1993-12-14 Life Technologies, Inc. Cloning and expression of T5 DNA polymerase reduced in 3'- to-5' exonuclease activity
    US5374553A (en) 1986-08-22 1994-12-20 Hoffmann-La Roche Inc. DNA encoding a thermostable nucleic acid polymerase enzyme from thermotoga maritima
    US5436149A (en) 1993-02-19 1995-07-25 Barnes; Wayne M. Thermostable DNA polymerase with enhanced thermostability and enhanced length and efficiency of primer extension
    US5496714A (en) 1992-12-09 1996-03-05 New England Biolabs, Inc. Modification of protein by use of a controllable interveining protein sequence
    WO1996010640A1 (en) 1994-09-30 1996-04-11 Life Technologies, Inc. Cloned dna polymerases from thermotoga neapolitana and mutants thereof
    US5512462A (en) 1994-02-25 1996-04-30 Hoffmann-La Roche Inc. Methods and reagents for the polymerase chain reaction amplification of long DNA sequences
    US5614365A (en) 1994-10-17 1997-03-25 President & Fellow Of Harvard College DNA polymerase having modified nucleotide binding site for DNA sequencing
    US5677152A (en) 1995-08-25 1997-10-14 Roche Molecular Systems, Inc. Nucleic acid amplification using a reersibly inactivated thermostable enzyme
    US5834247A (en) 1992-12-09 1998-11-10 New England Biolabs, Inc. Modified proteins comprising controllable intervening protein sequences or their elements methods of producing same and methods for purification of a target protein comprised by a modified protein
    US5962313A (en) 1996-01-18 1999-10-05 Avigen, Inc. Adeno-associated virus vectors comprising a gene encoding a lyosomal enzyme
    US6183998B1 (en) 1998-05-29 2001-02-06 Qiagen Gmbh Max-Volmer-Strasse 4 Method for reversible modification of thermostable enzymes
    WO2001038547A2 (en) 1999-11-24 2001-05-31 Mcs Micro Carrier Systems Gmbh Polypeptides comprising multimers of nuclear localization signals or of protein transduction domains and their use for transferring molecules into cells
    US6479264B1 (en) 1999-08-27 2002-11-12 Advanced Biotechnologies Limited Reversible inactivation enzymes
    US20030087817A1 (en) 1999-01-12 2003-05-08 Sangamo Biosciences, Inc. Regulation of endogenous gene expression in cells using zinc finger proteins
    US20070015238A1 (en) 2002-06-05 2007-01-18 Snyder Richard O Production of pseudotyped recombinant AAV virions
    WO2010028347A2 (en) 2008-09-05 2010-03-11 President & Fellows Of Harvard College Continuous directed evolution of proteins and nucleic acids
    US20110059502A1 (en) 2009-09-07 2011-03-10 Chalasani Sreekanth H Multiple domain proteins
    US20110165540A1 (en) 2009-10-23 2011-07-07 California Institute Of Technology Games having biotechnological content
    WO2012088381A2 (en) 2010-12-22 2012-06-28 President And Fellows Of Harvard College Continuous directed evolution
    US20120322861A1 (en) 2007-02-23 2012-12-20 Barry John Byrne Compositions and Methods for Treating Diseases
    WO2013045632A1 (en) 2011-09-28 2013-04-04 Era Biotech, S.A. Split inteins and uses thereof
    US8440431B2 (en) 2009-12-10 2013-05-14 Regents Of The University Of Minnesota TAL effector-mediated DNA modification
    US20140065711A1 (en) 2011-03-11 2014-03-06 President And Fellows Of Harvard College Small molecule-dependent inteins and uses thereof
    WO2014055782A1 (en) 2012-10-03 2014-04-10 Agrivida, Inc. Intein-modified proteases, their production and industrial applications
    EP2755986A1 (de) 2011-09-12 2014-07-23 Moderna Therapeutics, Inc. Manipulierte nukleinsäuren und anwendungsverfahren dafür
    EP2755693A2 (de) 2011-09-12 2014-07-23 Moderna Therapeutics, Inc. Manipulierte nukleinsäuren und anwendungsverfahren dafür
    US8822663B2 (en) 2010-08-06 2014-09-02 Moderna Therapeutics, Inc. Engineered nucleic acids and methods of use thereof
    WO2014152940A1 (en) 2013-03-14 2014-09-25 Shire Human Genetic Therapies, Inc. Mrna therapeutic compositions and use to treat diseases and disorders
    WO2015027134A1 (en) 2013-08-22 2015-02-26 President And Fellows Of Harvard College Engineered transcription activator-like effector (tale) domains and uses thereof
    EP2877490A2 (de) 2012-06-27 2015-06-03 The Trustees Of Princeton University Geteilte inteine, konjugate davon und verwendungen davon
    WO2015134121A2 (en) 2014-01-20 2015-09-11 President And Fellows Of Harvard College Negative selection and stringency modulation in continuous evolution systems
    US9181535B2 (en) 2012-09-24 2015-11-10 The Chinese University Of Hong Kong Transcription activator-like effector nucleases (TALENs)
    NZ700688A (en) 2009-12-01 2016-02-26 Shire Human Genetic Therapies Delivery of mrna for the augmentation of proteins and enzymes in human genetic diseases
    WO2016069774A1 (en) 2014-10-28 2016-05-06 Agrivida, Inc. Methods and compositions for stabilizing trans-splicing intein modified proteases
    US9405700B2 (en) 2010-11-04 2016-08-02 Sonics, Inc. Methods and apparatus for virtualization in an integrated circuit
    US9458484B2 (en) 2010-10-22 2016-10-04 Bio-Rad Laboratories, Inc. Reverse transcriptase mixtures with improved storage stability
    WO2016168631A1 (en) 2015-04-17 2016-10-20 President And Fellows Of Harvard College Vector-based mutagenesis system
    US20160355796A1 (en) 2013-12-12 2016-12-08 The Broad Institute Inc. Compositions and methods of use of crispr-cas systems in nucleotide repeat disorders
    US9526784B2 (en) 2013-09-06 2016-12-27 President And Fellows Of Harvard College Delivery system for functional nucleases
    US9534201B2 (en) 2007-04-26 2017-01-03 Ramot At Tel-Aviv University Ltd. Culture of pluripotent autologous stem cells from oral mucosa
    US9580698B1 (en) 2016-09-23 2017-02-28 New England Biolabs, Inc. Mutant reverse transcriptase
    US9783791B2 (en) 2005-08-10 2017-10-10 Agilent Technologies, Inc. Mutant reverse transcriptase and methods of use
    BR112016030852A2 (pt) 2014-07-02 2018-01-16 Shire Human Genetic Therapies encapsulação de rna mensageiro
    EP3362461A1 (de) 2015-10-16 2018-08-22 Modernatx, Inc. Mrna-cap-analoga mit modifizierter phosphatverbindung
    US10150955B2 (en) 2009-03-04 2018-12-11 Board Of Regents, The University Of Texas System Stabilized reverse transcriptase fusion proteins
    US10189831B2 (en) 2012-10-08 2019-01-29 Merck Sharp & Dohme Corp. Non-nucleoside reverse transcriptase inhibitors
    US10202658B2 (en) 2005-02-18 2019-02-12 Monogram Biosciences, Inc. Methods for determining hypersusceptibility of HIV-1 to non-nucleoside reverse transcriptase inhibitors
    EP3450553B1 (de) 2014-03-24 2019-12-25 Translate Bio, Inc. Mrna-therapie zur behandlung von augenerkrankungen
    ES2740248T3 (es) 2011-06-08 2020-02-05 Translate Bio Inc Composiciones de nanopartículas lipídicas y métodos para la administración ARNm

    Family Cites Families (1753)

    * Cited by examiner, † Cited by third party
    Publication number Priority date Publication date Assignee Title
    US4182449A (en) 1978-04-18 1980-01-08 Kozlow William J Adhesive bandage and package
    US4737323A (en) 1986-02-13 1988-04-12 Liposome Technology, Inc. Liposome extrusion method
    US5017492A (en) 1986-02-27 1991-05-21 Life Technologies, Inc. Reverse transcriptase and method for its production
    DE122007000007I1 (de) 1986-04-09 2007-05-16 Genzyme Corp Genetisch transformierte Tiere, die ein gewünschtes Protein in Milch absondern
    RO108522B1 (ro) 1987-04-23 1994-06-30 Fmc Corp Derivati de di(aril)-cilopropil substituiti si intermediari ai acestora
    US4873316A (en) 1987-06-23 1989-10-10 Biogen, Inc. Isolation of exogenous recombinant proteins from the milk of transgenic mammals
    RO114469B1 (ro) 1987-12-15 1999-04-30 Gene Shears Pty Ltd Compus oligoribonucleotidic, procedeu de preparare si metoda de inactivare
    US5244797B1 (en) 1988-01-13 1998-08-25 Life Technologies Inc Cloned genes encoding reverse transcriptase lacking rnase h activity
    US5223409A (en) 1988-09-02 1993-06-29 Protein Engineering Corp. Directed evolution of novel binding proteins
    JP3771253B2 (ja) 1988-09-02 2006-04-26 ダイアックス コープ. 新規な結合タンパク質の生成と選択
    EP0451221B1 (de) 1989-08-31 1994-10-12 City Of Hope Chimere dns-rns katalytische sequenzen
    US5427908A (en) 1990-05-01 1995-06-27 Affymax Technologies N.V. Recombinant library screening methods
    US5637459A (en) 1990-06-11 1997-06-10 Nexstar Pharmaceuticals, Inc. Systematic evolution of ligands by exponential enrichment: chimeric selex
    US5580737A (en) 1990-06-11 1996-12-03 Nexstar Pharmaceuticals, Inc. High-affinity nucleic acid ligands that discriminate between theophylline and caffeine
    PL169576B1 (pl) 1990-10-12 1996-08-30 Max Planck Gesellschaft Sposób wytwarzania czasteczki RNA o aktywnosci katalitycznej PL PL
    NZ314630A (en) 1991-01-17 2000-11-24 Harvard College Use of trans-splicing ribozymes for genetic modification and cell ablation in a host cell
    NZ241310A (en) 1991-01-17 1995-03-28 Gen Hospital Corp Trans-splicing ribozymes
    PT100379B (pt) 1991-04-10 1999-01-29 Scripps Research Inst Bibliotecas de receptores heterodimericos usando fagomideos
    DE4216134A1 (de) 1991-06-20 1992-12-24 Europ Lab Molekularbiolog Synthetische katalytische oligonukleotidstrukturen
    US6872816B1 (en) 1996-01-24 2005-03-29 Third Wave Technologies, Inc. Nucleic acid detection kits
    US5652094A (en) 1992-01-31 1997-07-29 University Of Montreal Nucleozymes
    JPH05274181A (ja) 1992-03-25 1993-10-22 Nec Corp ブレークポイント設定・解除方式
    US5434058A (en) 1993-02-09 1995-07-18 Arch Development Corporation Apolipoprotein B MRNA editing protein compositions and methods
    CN1127527A (zh) 1993-05-17 1996-07-24 加利福尼亚大学董事会 人免疫缺陷型病毒感染和艾滋病的核酶基因治疗方法
    US5651981A (en) 1994-03-29 1997-07-29 Northwestern University Cationic phospholipids for transfection
    US5449639A (en) 1994-10-24 1995-09-12 Taiwan Semiconductor Manufacturing Company Ltd. Disposable metal anti-reflection coating process used together with metal dry/wet etch
    US5767099A (en) 1994-12-09 1998-06-16 Genzyme Corporation Cationic amphiphiles containing amino acid or dervatized amino acid groups for intracellular delivery of therapeutic molecules
    US6057153A (en) 1995-01-13 2000-05-02 Yale University Stabilized external guide sequences
    US5795587A (en) 1995-01-23 1998-08-18 University Of Pittsburgh Stable lipid-comprising drug delivery complexes and methods for their production
    US5830430A (en) 1995-02-21 1998-11-03 Imarx Pharmaceutical Corp. Cationic lipids and the use thereof
    US5851548A (en) 1995-06-07 1998-12-22 Gen-Probe Incorporated Liposomes containing cationic lipids and vitamin D
    NO953680D0 (no) 1995-09-18 1995-09-18 Hans Prydz Cellesyklusenzymer
    WO1997044348A1 (en) 1996-05-17 1997-11-27 Thomas Jefferson University Ribozyme-mediated gene replacement
    US6887707B2 (en) 1996-10-28 2005-05-03 University Of Washington Induction of viral mutation by incorporation of miscoding ribonucleoside analogs into viral RNA
    GB9701425D0 (en) 1997-01-24 1997-03-12 Bioinvent Int Ab A method for in vitro molecular evolution of protein function
    US5981182A (en) 1997-03-13 1999-11-09 Albert Einstein College Of Medicine Of Yeshiva University Vector constructs for the selection and identification of open reading frames
    US20040203109A1 (en) 1997-06-06 2004-10-14 Incyte Corporation Human regulatory proteins
    US5849528A (en) 1997-08-21 1998-12-15 Incyte Pharmaceuticals, Inc.. Polynucleotides encoding a human S100 protein
    US6355415B1 (en) 1997-09-29 2002-03-12 Ohio University Compositions and methods for the use of ribozymes to determine gene function
    US6156509A (en) 1997-11-12 2000-12-05 Genencor International, Inc. Method of increasing efficiency of directed evolution of a gene using phagemid
    US6429301B1 (en) 1998-04-17 2002-08-06 Whitehead Institute For Biomedical Research Use of a ribozyme to join nucleic acids and peptides
    US8097648B2 (en) 1998-06-17 2012-01-17 Eisai R&D Management Co., Ltd. Methods and compositions for use in treating cancer
    AU1115300A (en) 1998-10-13 2000-05-01 Advanced Research And Technology Institute, Inc. Assays for identifying functional alterations in the p53 tumor suppressor
    EP2298728A1 (de) 1998-11-12 2011-03-23 Life Technologies Corporation Transfektionsreagenzien
    US6599692B1 (en) 1999-09-14 2003-07-29 Sangamo Bioscience, Inc. Functional genomics using zinc finger proteins
    US7013219B2 (en) 1999-01-12 2006-03-14 Sangamo Biosciences, Inc. Regulation of endogenous gene expression in cells using zinc finger proteins
    US6453242B1 (en) 1999-01-12 2002-09-17 Sangamo Biosciences, Inc. Selection of sites for targeting by zinc finger proteins and methods of designing zinc finger proteins to bind to preselected sites
    US20090130718A1 (en) 1999-02-04 2009-05-21 Diversa Corporation Gene site saturation mutagenesis
    CA2365601A1 (en) 1999-03-29 2000-10-05 Kansai Technology Licensing Organization Co., Ltd. Novel cytidine deaminase
    US6365410B1 (en) 1999-05-19 2002-04-02 Genencor International, Inc. Directed evolution of microorganisms
    DE60043158D1 (de) 1999-11-18 2009-11-26 Pharmexa Inc Heteroklitische analoga von klasse-i epitopen
    IL150069A0 (en) 1999-12-06 2002-12-01 Sangamo Biosciences Inc Methods of using randomized libraries of zinc finger proteins for the identification of gene function
    US6689558B2 (en) 2000-02-08 2004-02-10 Sangamo Biosciences, Inc. Cells for drug discovery
    US7378248B2 (en) 2000-03-06 2008-05-27 Rigel Pharmaceuticals, Inc. In vivo production of cyclic peptides for inhibiting protein-protein interaction
    US7078208B2 (en) 2000-05-26 2006-07-18 Invitrogen Corporation Thermostable reverse transcriptases and uses thereof
    US6573092B1 (en) 2000-10-10 2003-06-03 Genvec, Inc. Method of preparing a eukaryotic viral vector
    MXPA03003690A (es) 2000-10-27 2004-05-05 Chiron Spa Acidos nucleicos y proteinas de los grupos a y b de estreptococos.
    CN101317825A (zh) 2000-10-30 2008-12-10 欧罗赛铁克股份有限公司 控释氢可酮制剂
    US20040003420A1 (en) 2000-11-10 2004-01-01 Ralf Kuhn Modified recombinase
    US7067650B1 (en) 2000-11-22 2006-06-27 National Institute Of Advanced Industrial Science And Technology Ribozymes targeting bradeion transcripts and use thereof
    AU2002227882B2 (en) 2001-01-25 2007-06-28 Evolva Ltd Concatemers of differentially expressed multiple genes
    US20050222030A1 (en) 2001-02-21 2005-10-06 Anthony Allison Modified annexin proteins and methods for preventing thrombosis
    ATE398180T1 (de) 2001-02-27 2008-07-15 Univ Rochester Verfahren und zusammensetzungen zur modifikation der bearbeitung von apolipoprotein b-mrna
    US7807408B2 (en) 2001-03-19 2010-10-05 President & Fellows Of Harvard College Directed evolution of proteins
    US7476500B1 (en) 2001-03-19 2009-01-13 President And Fellows Of Harvard College In vivo selection system for enzyme activity
    DE60213826T3 (de) 2001-03-19 2013-10-17 President And Fellows Of Harvard College Entwicklung neuer molekularer funktionen
    AU2002257076A1 (en) 2001-03-19 2002-10-03 President And Fellows Of Harvard College Nucleic acid shuffling
    CA2444098C (en) 2001-04-19 2016-06-21 The Scripps Research Institute Methods and composition for the production of orthogonal trna-aminoacyltrna synthetase pairs
    AU2002330714A1 (en) 2001-05-30 2003-01-02 Biomedical Center In silico screening for phenotype-associated expressed sequences
    JP4473573B2 (ja) 2001-07-26 2010-06-02 ストラタジーン カリフォルニア 多部位突然変異誘発
    US20030167533A1 (en) 2002-02-04 2003-09-04 Yadav Narendra S. Intein-mediated protein splicing
    DK1506288T3 (da) 2002-05-10 2013-07-22 Medical Res Council Aktiveringsinduceret deaminase (aid)
    US9388459B2 (en) 2002-06-17 2016-07-12 Affymetrix, Inc. Methods for genotyping
    EP1578932A4 (de) 2002-07-12 2006-08-30 Affymetrix Inc Synthetische tag-gene
    WO2004016767A2 (en) 2002-08-19 2004-02-26 The President And Fellows Of Harvard College Evolving new molecular function
    JP2006500030A (ja) 2002-09-20 2006-01-05 イェール ユニバーシティ リボスイッチ、その使用方法、ならびにリボスイッチとともに用いるための組成物
    US8017323B2 (en) 2003-03-26 2011-09-13 President And Fellows Of Harvard College Free reactant use in nucleic acid-templated synthesis
    AU2004230592B2 (en) 2003-04-14 2007-10-04 Caliper Life Sciences, Inc. Reduction of migration shift assay interference
    WO2004113495A2 (en) 2003-05-23 2004-12-29 The President And Fellows Of Harvard College Rna-based transcriptional regulators
    US20050136429A1 (en) 2003-07-03 2005-06-23 Massachusetts Institute Of Technology SIRT1 modulation of adipogenesis and adipose function
    DE602004011789T2 (de) 2003-07-07 2009-02-12 The Scripps Research Institute, La Jolla Zusammensetzungen der orthogonalen Lysyl-tRNA und Aminoacyl-tRNA Synthetase Paaren und ihre Verwendungen
    ES2808687T3 (es) 2003-08-08 2021-03-01 Sangamo Therapeutics Inc Métodos y composiciones para escisión dirigida y recombinación
    US7670807B2 (en) 2004-03-10 2010-03-02 East Tennessee State Univ. Research Foundation RNA-dependent DNA polymerase from Geobacillus stearothermophilus
    WO2005098043A2 (en) 2004-03-30 2005-10-20 The President And Fellows Of Harvard College Ligand-dependent protein splicing
    US7595179B2 (en) 2004-04-19 2009-09-29 Applied Biosystems, Llc Recombinant reverse transcriptases
    US7919277B2 (en) 2004-04-28 2011-04-05 Danisco A/S Detection and typing of bacterial strains
    US7476734B2 (en) 2005-12-06 2009-01-13 Helicos Biosciences Corporation Nucleotide analogs
    CA2632216C (en) 2004-07-06 2013-11-12 Societe De Commercialisation Des Produits De La Recherche Appliquee Socpra Sciences Sante Et Humaines S.E.C. A target-dependent nucleic acid adapter
    US7851658B2 (en) 2004-08-17 2010-12-14 President And Fellows Of Harvard College Palladium-catalyzed carbon-carbon bond forming reactions
    US8728526B2 (en) 2004-08-19 2014-05-20 The United States of America, Represented by Secretary of Department of Health and Human Services, NIH Coacervate microparticles useful for the sustained release administration of therapeutic agents
    US9315862B2 (en) 2004-10-05 2016-04-19 California Institute Of Technology Aptamer regulated nucleic acids and uses thereof
    JP2006248978A (ja) 2005-03-10 2006-09-21 Mebiopharm Co Ltd 新規なリポソーム製剤
    EP1899465B1 (de) 2005-06-17 2010-03-24 The President and Fellows of Harvard College Iterierte verzweigende reaktionswege über nukleinsäure-vermittelte chemie
    WO2007011722A2 (en) 2005-07-15 2007-01-25 President And Fellows Of Harvard College Reaction discovery system
    AU2015252023B2 (en) 2005-08-26 2017-06-29 Dupont Nutrition Biosciences Aps Use
    DK3284833T3 (da) 2005-08-26 2022-02-07 Dupont Nutrition Biosci Aps Anvendelse af crispr-associerede gener (cas)
    AU2012244264B2 (en) 2005-08-26 2015-08-06 Dupont Nutrition Biosciences Aps Use
    JPWO2007037444A1 (ja) 2005-09-30 2009-04-16 国立大学法人 北海道大学 目的物質を核内又は細胞内に送達するためのベクター
    KR100784478B1 (ko) 2005-12-05 2007-12-11 한국과학기술원 기능요소의 동시 삽입에 의한 신기능을 갖는 단백질을제조하는 방법
    US20080051317A1 (en) 2005-12-15 2008-02-28 George Church Polypeptides comprising unnatural amino acids, methods for their production and uses therefor
    CA2651389C (en) 2006-05-05 2017-04-25 Molecular Transfer, Inc. Novel reagents for transfection of eukaryotic cells
    ES2373586T3 (es) 2006-05-19 2012-02-06 Danisco A/S Microorganismos marcados y métodos para marcar.
    CA2656298A1 (en) 2006-06-02 2007-12-13 President And Fellows Of Harvard College Protein surface remodeling
    US8129115B2 (en) 2006-06-06 2012-03-06 Panasonic Corporation Method of modifying nucleotide chain
    US7572618B2 (en) 2006-06-30 2009-08-11 Bristol-Myers Squibb Company Polynucleotides encoding novel PCSK9 variants
    WO2008005529A2 (en) 2006-07-07 2008-01-10 The Trustees Columbia University In The City Of New York Cell-mediated directed evolution
    BRPI0808704B1 (pt) 2007-03-02 2022-01-18 Dupont Nutrition Biosciences Aps Método para gerar uma cultura inicial compreendendo pelo menos duas cepas variantes resistentes a bacteriófagos, cultura iniciadora e método de fermentação
    FI7694U1 (fi) 2007-05-30 2007-11-30 Matti Koskinen Viehe
    WO2009002418A2 (en) 2007-06-21 2008-12-31 Merck & Co., Inc. T-cell peptide epitopes from carcinoembryonic antigen, immunogenic analogs, and uses thereof
    FR2919804B1 (fr) 2007-08-08 2010-08-27 Erytech Pharma Composition et vaccin therapeutique anti-tumoral
    WO2009029105A1 (en) 2007-08-31 2009-03-05 Vulano Group, Inc. Virtual aggregation processor for incorporating reverse path feedback into content delivered on a forward path
    WO2009033027A2 (en) 2007-09-05 2009-03-12 Medtronic, Inc. Suppression of scn9a gene expression and/or function for the treatment of pain
    EP2188384B1 (de) 2007-09-27 2015-07-15 Sangamo BioSciences, Inc. Schnelle in-vivo-identifizierung von biologisch aktiven nukleasen
    US20110014616A1 (en) 2009-06-30 2011-01-20 Sangamo Biosciences, Inc. Rapid screening of biologically active nucleases and isolation of nuclease-modified cells
    KR100949310B1 (ko) 2007-11-21 2010-03-23 한국과학기술연구원 세포 영상 기법을 이용한 hbv 캡시드 단백질과 표면단백질 간 상호작용 측정 방법과 이를 이용한 hbv 증식억제물질의 검색방법
    US9029524B2 (en) 2007-12-10 2015-05-12 California Institute Of Technology Signal activated RNA interference
    EP2087789A1 (de) 2008-02-06 2009-08-12 Heinrich-Heine-Universität Düsseldorf FTO-modifiziertes nichtmenschliches Säugetier
    WO2009100373A1 (en) 2008-02-08 2009-08-13 Sangamo Biosciences, Inc. Treatment of chronic pain with zinc finger proteins
    GB0806562D0 (en) * 2008-04-10 2008-05-14 Fermentas Uab Production of nucleic acid
    WO2009146179A1 (en) 2008-04-15 2009-12-03 University Of Iowa Research Foundation Zinc finger nuclease for the cftr gene and methods of use thereof
    CN102066405B (zh) 2008-04-28 2015-09-30 哈佛大学校长及研究员协会 用于细胞穿透的超荷电蛋白
    US8394604B2 (en) 2008-04-30 2013-03-12 Paul Xiang-Qin Liu Protein splicing using short terminal split inteins
    US8546553B2 (en) 2008-07-25 2013-10-01 University Of Georgia Research Foundation, Inc. Prokaryotic RNAi-like system and methods of use
    FR2934346B1 (fr) 2008-07-28 2010-09-03 Claude Benit Valve pour installation sanitaire et dispositif multifonction pour appareil sanitaire comprenant une telle valve
    JP2010033344A (ja) 2008-07-29 2010-02-12 Azabu Jui Gakuen 核酸構成塩基の偏在性を表す方法
    EP2159286A1 (de) 2008-09-01 2010-03-03 Consiglio Nazionale Delle Ricerche Verfahren zur Gewinnung von Oligonucleotid-Aptameren und Verwendungen damit
    US8790664B2 (en) 2008-09-05 2014-07-29 Institut National De La Sante Et De La Recherche Medicale (Inserm) Multimodular assembly useful for intracellular delivery
    US8636884B2 (en) 2008-09-15 2014-01-28 Abbott Diabetes Care Inc. Cationic polymer based wired enzyme formulations for use in analyte sensors
    US20100076057A1 (en) 2008-09-23 2010-03-25 Northwestern University TARGET DNA INTERFERENCE WITH crRNA
    US9404098B2 (en) 2008-11-06 2016-08-02 University Of Georgia Research Foundation, Inc. Method for cleaving a target RNA using a Cas6 polypeptide
    US10662227B2 (en) 2008-11-07 2020-05-26 Dupont Nutrition Biosciences Aps Bifidobacteria CRISPR sequences
    US20110016540A1 (en) 2008-12-04 2011-01-20 Sigma-Aldrich Co. Genome editing of genes associated with trinucleotide repeat expansion disorders in animals
    AU2009325069B2 (en) 2008-12-11 2015-03-19 Pacific Biosciences Of California, Inc. Classification of nucleic acid templates
    US9175338B2 (en) 2008-12-11 2015-11-03 Pacific Biosciences Of California, Inc. Methods for identifying nucleic acid modifications
    WO2010075424A2 (en) 2008-12-22 2010-07-01 The Regents Of University Of California Compositions and methods for downregulating prokaryotic genes
    WO2010091203A2 (en) * 2009-02-04 2010-08-12 Lucigen Corporation Rna-and dna-copying enzymes
    US20100305197A1 (en) 2009-02-05 2010-12-02 Massachusetts Institute Of Technology Conditionally Active Ribozymes And Uses Thereof
    WO2010091294A2 (en) 2009-02-05 2010-08-12 The Regents Of The University Of California New targeted antimicrobial moieties
    CN102421897B (zh) 2009-03-06 2015-12-16 合成基因组股份有限公司 用于克隆和操作基因组的方法
    EP2425023B1 (de) 2009-04-27 2015-12-23 Pacific Biosciences of California, Inc. Echtzeit-sequenzierungsverfahren und systeme
    WO2010129023A2 (en) 2009-04-28 2010-11-11 President And Fellows Of Harvard College Supercharged proteins for cell penetration
    WO2010132092A2 (en) 2009-05-12 2010-11-18 The Scripps Research Institute Cytidine deaminase fusions and related methods
    US9063156B2 (en) 2009-06-12 2015-06-23 Pacific Biosciences Of California, Inc. Real-time analytical methods and systems
    WO2011000106A1 (en) 2009-07-01 2011-01-06 Protiva Biotherapeutics, Inc. Improved cationic lipids and methods for the delivery of therapeutic agents
    NZ598457A (en) 2009-08-03 2014-06-27 Recombinetics Inc Methods and compositions for targeted gene modification
    WO2011017293A2 (en) 2009-08-03 2011-02-10 The General Hospital Corporation Engineering of zinc finger arrays by context-dependent assembly
    GB0913681D0 (en) 2009-08-05 2009-09-16 Glaxosmithkline Biolog Sa Immunogenic composition
    DK2494060T3 (en) 2009-10-30 2016-08-01 Synthetic Genomics Inc Coding of text for nucleic acid sequences
    SG10201912571XA (en) 2009-11-02 2020-02-27 Univ Washington Therapeutic nuclease compositions and methods
    US9175340B2 (en) 2009-11-04 2015-11-03 President And Fellows Of Harvard College Reactivity-dependent and interaction-dependent PCR
    US20110104787A1 (en) 2009-11-05 2011-05-05 President And Fellows Of Harvard College Fusion Peptides That Bind to and Modify Target Nucleic Acid Sequences
    US20110142886A1 (en) 2009-12-01 2011-06-16 Intezyne Technologies, Incorporated Pegylated polyplexes for polynucleotide delivery
    JP2013514779A (ja) 2009-12-18 2013-05-02 ボード オブ トラスティーズ オブ ザ レランド スタンフォード ジュニア ユニバーシティ 脱メチル化および細胞の再プログラミングを促進するためのシチジンデアミナーゼ関連薬剤の使用
    NZ600546A (en) 2010-01-22 2014-08-29 Dow Agrosciences Llc Excision of transgenes in genetically modified organisms
    WO2011090804A1 (en) 2010-01-22 2011-07-28 Dow Agrosciences Llc Targeted genomic alteration
    US9198983B2 (en) 2010-01-25 2015-12-01 Alnylam Pharmaceuticals, Inc. Compositions and methods for inhibiting expression of Mylip/Idol gene
    JP2013520989A (ja) 2010-03-05 2013-06-10 シンセティック ジェノミクス インコーポレーテッド ゲノムのクローニングおよび操作のための方法
    GB201004575D0 (en) 2010-03-19 2010-05-05 Immatics Biotechnologies Gmbh Composition of tumor associated peptides and related anti cancer vaccine for the treatment of gastric cancer and other cancers
    WO2011123830A2 (en) 2010-04-02 2011-10-06 Amunix Operating Inc. Alpha 1-antitrypsin compositions and methods of making and using same
    BR112012028805A2 (pt) 2010-05-10 2019-09-24 The Regents Of The Univ Of California E Nereus Pharmaceuticals Inc composições de endorribonuclease e métodos de uso das mesmas.
    CN103025344B (zh) 2010-05-17 2016-06-29 桑格摩生物科学股份有限公司 新型dna-结合蛋白及其用途
    GB201008267D0 (en) 2010-05-18 2010-06-30 Univ Edinburgh Cationic lipids
    BR112012030522A2 (pt) 2010-05-27 2020-10-13 Heinrich-Pette-Institut Leibniz-Institut Fur Experimentelle Virologie - Stiftung Burgerlichen Rechts Método para preparo de um vetor de expressão que codifica uma recombinase configurada, método para preparo de uma célula transformada, ácido nucleico, recombinase configurada codificada pelo ácido nucleico, célula transformada ecomposição farmacêutica"
    US8748667B2 (en) 2010-06-04 2014-06-10 Sirna Therapeutics, Inc. Low molecular weight cationic lipids for oligonucleotide delivery
    EP2392208B1 (de) 2010-06-07 2016-05-04 Helmholtz Zentrum München Deutsches Forschungszentrum für Gesundheit und Umwelt (GmbH) Fusionsproteine, die eine DNA-Bindungsdomäne eines TAL-Effektorproteins und eine unspezifische Spaltungsdomäne einer Restriktionsnuklease umfassen, und deren Verwendung
    US20110201118A1 (en) 2010-06-14 2011-08-18 Iowa State University Research Foundation, Inc. Nuclease activity of tal effector and foki fusion protein
    WO2012016186A1 (en) 2010-07-29 2012-02-02 President And Fellows Of Harvard College Macrocyclic kinase inhibitors and uses thereof
    WO2012020759A1 (ja) 2010-08-13 2012-02-16 国立大学法人京都大学 変異型逆転写酵素
    AU2011305572B2 (en) 2010-09-20 2016-08-04 Diane Goll Microencapsulation process and product
    AU2011312413A1 (en) 2010-09-29 2013-05-23 Sound Surgical Technologies Llc Power assisted lipoplasty
    DK2630156T3 (en) 2010-10-20 2018-12-17 Dupont Nutrition Biosci Aps CRISPR-CAS SEQUENCES OF LACTOCOCCUS
    EP2642985A4 (de) 2010-11-26 2014-05-07 Univ Witwatersrand Jhb Polymermatrix aus polymer-lipid-nanoteilchen als pharmazeutische darreichungsform
    KR101255338B1 (ko) 2010-12-15 2013-04-16 포항공과대학교 산학협력단 표적 세포에 대한 폴리뉴클레오티드 전달체
    ES2753198T5 (es) 2010-12-16 2023-05-31 Amgen Europe Gmbh Formas farmacéuticas orales de liberación controlada de fármacos poco solubles y sus usos
    US9499592B2 (en) 2011-01-26 2016-11-22 President And Fellows Of Harvard College Transcription activator-like effectors
    KR101818126B1 (ko) 2011-02-09 2018-01-15 (주)바이오니아 열안정성이 증가된 역전사효소
    US9528124B2 (en) 2013-08-27 2016-12-27 Recombinetics, Inc. Efficient non-meiotic allele introgression
    US9164079B2 (en) 2011-03-17 2015-10-20 Greyledge Technologies Llc Systems for autologous biological therapeutics
    US20120244601A1 (en) 2011-03-22 2012-09-27 Bertozzi Carolyn R Riboswitch based inducible gene expression platform
    JP2012210172A (ja) 2011-03-30 2012-11-01 Japan Science & Technology Agency 外部環境に応答して内部の物質組成を変えるリポソーム
    US8709466B2 (en) 2011-03-31 2014-04-29 International Business Machines Corporation Cationic polymers for antimicrobial applications and delivery of bioactive materials
    WO2012138927A2 (en) 2011-04-05 2012-10-11 Philippe Duchateau Method for the generation of compact tale-nucleases and uses thereof
    WO2012148953A1 (en) 2011-04-25 2012-11-01 Stc.Unm Solid compositions for pharmaceutical use
    CN103492578B (zh) 2011-04-27 2016-10-19 阿迈瑞斯公司 用于基因组修饰的方法
    WO2012158985A2 (en) 2011-05-17 2012-11-22 Transposagen Biopharmaceuticals, Inc. Methods for site-specific genetic modification in spermatogonial stem cells using zinc finger nuclease (zfn) for the creation of model organisms
    WO2012158986A2 (en) 2011-05-17 2012-11-22 Transposagen Biopharmaceuticals, Inc. Methods for site-specific genetic modification in stem cells using xanthomonas tal nucleases (xtn) for the creation of model organisms
    US8691750B2 (en) 2011-05-17 2014-04-08 Axolabs Gmbh Lipids and compositions for intracellular delivery of biologically active compounds
    US20140113376A1 (en) 2011-06-01 2014-04-24 Rotem Sorek Compositions and methods for downregulating prokaryotic genes
    CA2843853A1 (en) 2011-07-01 2013-01-10 President And Fellows Of Harvard College Macrocyclic insulin-degrading enzyme (ide) inhibitors and uses thereof
    EP2732038B1 (de) 2011-07-15 2018-09-05 The General Hospital Corporation Verfahren zur transkription einer aktivatorähnlichen effektoranordnung
    EP2734622B1 (de) 2011-07-19 2018-09-05 Vivoscript, Inc. Zusammensetzungen und verfahren zur umprogrammierung von zellen ohne genetische modifikation zur reparatur von knorpelschäden
    US10323236B2 (en) 2011-07-22 2019-06-18 President And Fellows Of Harvard College Evaluation and improvement of nuclease cleavage specificity
    DK2762569T3 (en) 2011-09-28 2018-08-27 Ribomic Inc NGF aptamer and its use.
    GB2496687A (en) 2011-11-21 2013-05-22 Gw Pharma Ltd Tetrahydrocannabivarin (THCV) in the protection of pancreatic islet cells
    US9228201B2 (en) 2011-11-25 2016-01-05 Rijk Zwaan Zaadteelt En Zaadhandel B.V. Lettuce variety 45-89 RZ, “caledonas”
    JP6132848B2 (ja) 2011-12-08 2017-05-31 サレプタ セラピューティクス, インコーポレイテッド ヒトlmnaを標的とするオリゴヌクレオチド類似体
    IN2014MN00974A (de) 2011-12-16 2015-04-24 Targetgene Biotechnologies Ltd
    MX2014007233A (es) 2011-12-16 2015-02-04 Moderna Therapeutics Inc Composiciones de nucleosidos, nucleotidos y acidos nucleicos modificados.
    GB201122458D0 (en) 2011-12-30 2012-02-08 Univ Wageningen Modified cascade ribonucleoproteins and uses thereof
    WO2013119602A1 (en) 2012-02-06 2013-08-15 President And Fellows Of Harvard College Arrdc1-mediated microvesicles (armms) and uses thereof
    RU2650811C2 (ru) 2012-02-24 2018-04-17 Фред Хатчинсон Кэнсер Рисерч Сентер Композиции и способы лечения гемоглобинопатии
    EP2820159B1 (de) 2012-02-29 2019-10-23 Sangamo Therapeutics, Inc. Verfahren und zusammensetzungen zur behandlung der huntington-krankheit
    JP2015512255A (ja) 2012-03-17 2015-04-27 ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア ざ瘡の高速診断および個人化された治療
    WO2013141680A1 (en) 2012-03-20 2013-09-26 Vilnius University RNA-DIRECTED DNA CLEAVAGE BY THE Cas9-crRNA COMPLEX
    US9637739B2 (en) 2012-03-20 2017-05-02 Vilnius University RNA-directed DNA cleavage by the Cas9-crRNA complex
    WO2013152359A1 (en) 2012-04-06 2013-10-10 The Regents Of The University Of California Novel tetrazines and method of synthesizing the same
    BR112014026203A2 (pt) 2012-04-23 2017-07-18 Bayer Cropscience Nv engenharia do genoma direcionado nas plantas
    KR102091298B1 (ko) 2012-05-02 2020-03-19 다우 아그로사이언시즈 엘엘씨 말산 탈수소효소의 표적화된 변형
    JP6559063B2 (ja) 2012-05-07 2019-08-14 サンガモ セラピューティクス, インコーポレイテッド 導入遺伝子のヌクレアーゼ媒介標的化組み込みのための方法および組成物
    WO2013169398A2 (en) 2012-05-09 2013-11-14 Georgia Tech Research Corporation Systems and methods for improving nuclease specificity and activity
    ES2960803T3 (es) 2012-05-25 2024-03-06 Univ California Métodos y composiciones para la modificación de ADN diana dirigida por RNA y para la modulación de la transcripción dirigida por RNA
    PL2855667T3 (pl) 2012-05-25 2024-03-25 Cellectis Sposoby uzyskiwania metodami inżynierii allogenicznych i opornych na immunosupresję limfocytów t do immunoterapii
    US20150017136A1 (en) 2013-07-15 2015-01-15 Cellectis Methods for engineering allogeneic and highly active t cell for immunotherapy
    US20140056868A1 (en) 2012-05-30 2014-02-27 University of Washington Center for Commercialization Supercoiled MiniVectors as a Tool for DNA Repair, Alteration and Replacement
    US9102936B2 (en) 2012-06-11 2015-08-11 Agilent Technologies, Inc. Method of adaptor-dimer subtraction using a CRISPR CAS6 protein
    CN104540382A (zh) 2012-06-12 2015-04-22 弗·哈夫曼-拉罗切有限公司 用于产生条件性敲除等位基因的方法和组合物
    EP2674501A1 (de) 2012-06-14 2013-12-18 Agence nationale de sécurité sanitaire de l'alimentation,de l'environnement et du travail Verfahren zur Erkennung und Identifikation von enterohämorragischen Escherichia coli
    US9688971B2 (en) 2012-06-15 2017-06-27 The Regents Of The University Of California Endoribonuclease and methods of use thereof
    EP2861737B1 (de) 2012-06-19 2019-04-17 Regents Of The University Of Minnesota Gen-targeting in pflanzen durch dns-viren
    US9267127B2 (en) 2012-06-21 2016-02-23 President And Fellows Of Harvard College Evolution of bond-forming enzymes
    CN104508130B (zh) 2012-06-29 2016-09-28 麻省理工学院 大规模并行组合遗传学
    US9125508B2 (en) 2012-06-30 2015-09-08 Seasons 4, Inc. Collapsible tree system
    EP2872154B1 (de) 2012-07-11 2017-05-31 Sangamo BioSciences, Inc. Verfahren und zusammensetzungen zur freisetzung von biologischen wirkstoffen
    EP3444342B1 (de) 2012-07-11 2020-05-27 Sangamo Therapeutics, Inc. Verfahren und zusammensetzungen zur behandlung von lysosomalen speicherkrankheiten
    CN116622704A (zh) 2012-07-25 2023-08-22 布罗德研究所有限公司 可诱导的dna结合蛋白和基因组干扰工具及其应用
    US10058078B2 (en) 2012-07-31 2018-08-28 Recombinetics, Inc. Production of FMDV-resistant livestock by allele substitution
    EP2879678B1 (de) 2012-07-31 2023-03-01 Yeda Research and Development Co. Ltd. Enoxacin zur behandlung von amyotropher lateralsklerose
    EP2880171B1 (de) 2012-08-03 2018-10-03 The Regents of The University of California Verfahren und zusammensetzungen zur kontrolle der genexpression durch rna-prozessierung
    KR102474010B1 (ko) 2012-08-29 2022-12-02 상가모 테라퓨틱스, 인코포레이티드 유전적 병태를 치료하기 위한 방법 및 조성물
    EP4148134A1 (de) 2012-09-04 2023-03-15 The Scripps Research Institute Chimäre polypeptide mit gerichteter bindungsspezifität
    ES2714523T3 (es) 2012-09-04 2019-05-28 Cellectis Receptor quimérico de antígenos multicatenario y usos del mismo
    WO2014039513A2 (en) 2012-09-04 2014-03-13 The Trustees Of The University Of Pennsylvania Inhibition of diacylglycerol kinase to augment adoptive t cell transfer
    UA118090C2 (uk) 2012-09-07 2018-11-26 ДАУ АГРОСАЙЄНСІЗ ЕлЕлСі Спосіб інтегрування послідовності нуклеїнової кислоти, що представляє інтерес, у ген fad2 у клітині сої та специфічний для локусу fad2 білок, що зв'язується, здатний індукувати спрямований розрив
    US9914930B2 (en) 2012-09-07 2018-03-13 Dow Agrosciences Llc FAD3 performance loci and corresponding target site specific binding proteins capable of inducing targeted breaks
    UA119135C2 (uk) 2012-09-07 2019-05-10 ДАУ АГРОСАЙЄНСІЗ ЕлЕлСі Спосіб отримання трансгенної рослини
    US20140075593A1 (en) 2012-09-07 2014-03-13 Dow Agrosciences Llc Fluorescence activated cell sorting (facs) enrichment to generate plants
    WO2014043143A1 (en) 2012-09-11 2014-03-20 Life Technologies Corporation Nucleic acid amplification
    GB201216564D0 (en) 2012-09-17 2012-10-31 Univ Edinburgh Genetically edited animal
    WO2014047103A2 (en) 2012-09-18 2014-03-27 The Translational Genomics Research Institute Isolated genes and transgenic organisms for producing biofuels
    JP6401704B2 (ja) 2012-10-10 2018-10-10 サンガモ セラピューティクス, インコーポレイテッド T細胞を修飾する化合物およびその使用
    EP2906602B1 (de) 2012-10-12 2019-01-16 The General Hospital Corporation Transkriptionsaktivator-like-effektor-lysinspezifische demethylase-1 (lsd1)-fusionsproteine
    ES2926021T3 (es) 2012-10-23 2022-10-21 Toolgen Inc Composición para escindir un ADN objetivo que comprende un ARN guía específico para el ADN objetivo y ácido nucleico codificador de proteína Cas o proteína Cas, y uso de la misma
    US20140115728A1 (en) 2012-10-24 2014-04-24 A. Joseph Tector Double knockout (gt/cmah-ko) pigs, organs and tissues
    JP2015533284A (ja) 2012-10-30 2015-11-24 リコンビネティクス・インコーポレイテッドRecombinetics,Inc. 動物における性成熟の制御
    BR112015009812A2 (pt) 2012-10-31 2017-08-22 Cellectis Método para a inserção genética específica em um genoma de planta, célula de planta transformada e seu uso, planta resistente a herbicidas, kit, vetor, e célula hospedeira
    WO2014068346A2 (en) 2012-10-31 2014-05-08 Mezögazdásagi Biotechnológiai Kutatóközpont Identification of a xanthomonas euvesicatoria resistance gene from pepper (capsicum annuum) and method for generating plants with resistance
    RU2019143431A (ru) 2012-11-01 2020-04-28 Фэктор Байосайенс Инк. Способы и продукты для экспрессии белков в клетках
    WO2014071235A1 (en) 2012-11-01 2014-05-08 Massachusetts Institute Of Technology Genetic device for the controlled destruction of dna
    US20140127752A1 (en) 2012-11-07 2014-05-08 Zhaohui Zhou Method, composition, and reagent kit for targeted genomic enrichment
    US9879227B2 (en) 2012-11-09 2018-01-30 Marco Archetti Diffusible factors and cancer cells
    WO2014081855A1 (en) 2012-11-20 2014-05-30 Universite De Montreal Methods and compositions for muscular dystrophies
    WO2014081730A1 (en) 2012-11-20 2014-05-30 Cold Spring Harbor Laboratory Mutations in solanaceae plants that modulate shoot architecture and enhance yield-related phenotypes
    KR20150085846A (ko) 2012-11-20 2015-07-24 제이.알.심프롯캄패니 Tal-매개 전이 DNA 삽입방법
    CN109554350B (zh) 2012-11-27 2022-09-23 儿童医疗中心有限公司 用于胎儿血红蛋白再诱导的靶向bcl11a远端调控元件
    WO2014085261A1 (en) 2012-11-29 2014-06-05 North Carolina State University Synthetic pathway for biological carbon dioxide sequestration
    DK2925866T3 (en) 2012-11-30 2018-10-29 Univ Aarhus CIRCULAR RNA FOR INHIBITING MICRO-RNA
    WO2014085830A2 (en) 2012-11-30 2014-06-05 The Parkinson's Institute Screening assays for therapeutics for parkinson's disease
    WO2014086494A1 (en) 2012-12-05 2014-06-12 Merz Pharma Gmbh & Co. Kgaa Novel recombinant clostridial neurotoxins with enhanced membrane localization
    AU2013355327A1 (en) 2012-12-05 2015-06-11 Sangamo Therapeutics, Inc. Methods and compositions for regulation of metabolic disorders
    EP3617309A3 (de) 2012-12-06 2020-05-06 Sigma Aldrich Co. LLC Crispr-basierte genommodifizierung und -regulierung
    ES2740648T3 (es) 2012-12-06 2020-02-06 Synthetic Genomics Inc Mutantes de algas que tienen un fenotipo aclimatado a alta luz bloqueado
    US9447422B2 (en) 2012-12-06 2016-09-20 Synthetic Genomics, Inc. Autonomous replication sequences and episomal DNA molecules
    US10272163B2 (en) 2012-12-07 2019-04-30 The Regents Of The University Of California Factor VIII mutation repair and tolerance induction
    US9914931B2 (en) 2012-12-07 2018-03-13 Synthetic Genomics, Inc. Nannochloropsis spliced leader sequences and uses therefor
    WO2014093479A1 (en) 2012-12-11 2014-06-19 Montana State University Crispr (clustered regularly interspaced short palindromic repeats) rna-guided control of gene regulation
    EP3144390B1 (de) 2012-12-12 2020-03-18 The Broad Institute, Inc. Herstellung von systemen, verfahren und optimierten führungszusammensetzungen zur sequenzmanipulation
    CN114634950A (zh) 2012-12-12 2022-06-17 布罗德研究所有限公司 用于序列操纵的crispr-cas组分系统、方法以及组合物
    EP2931899A1 (de) 2012-12-12 2015-10-21 The Broad Institute, Inc. Funktionale genomik unter verwendung von crispr-cas systemen, zusammensetzungen, verfahren, knockout-bibliotheken und anwendungen davon
    IL239344B1 (en) 2012-12-12 2024-02-01 Broad Inst Inc Systems engineering, methods and optimal guiding components for sequence manipulation
    SG10201912328UA (en) 2012-12-12 2020-02-27 Broad Inst Inc Delivery, Engineering and Optimization of Systems, Methods and Compositions for Sequence Manipulation and Therapeutic Applications
    ES2576128T3 (es) 2012-12-12 2016-07-05 The Broad Institute, Inc. Modificación por tecnología genética y optimización de sistemas, métodos y composiciones para la manipulación de secuencias con dominios funcionales
    WO2014093709A1 (en) 2012-12-12 2014-06-19 The Broad Institute, Inc. Methods, models, systems, and apparatus for identifying target sequences for cas enzymes or crispr-cas systems for target sequences and conveying results thereof
    CN113355357A (zh) 2012-12-12 2021-09-07 布罗德研究所有限公司 对用于序列操纵的改进的系统、方法和酶组合物进行的工程化和优化
    DK2825654T3 (en) 2012-12-12 2017-08-21 Broad Inst Inc SYSTEMS, PROCEDURES, AND COMPOSITIONS WITH CRISPR-CAS COMPONENTS FOR SEQUENCE MANIPULATION.
    US20140310830A1 (en) 2012-12-12 2014-10-16 Feng Zhang CRISPR-Cas Nickase Systems, Methods And Compositions For Sequence Manipulation in Eukaryotes
    US8697359B1 (en) 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
    RU2015128052A (ru) 2012-12-13 2017-01-19 Дау Агросайенсиз Ллс Точный таргетинг генов в отношении конкретного локуса кукурузы
    AU2013359146B2 (en) 2012-12-13 2017-12-07 Corteva Agriscience Llc DNA detection methods for site specific nuclease activity
    CN105144204B (zh) 2012-12-13 2018-02-27 麻省理工学院 基于重组酶的逻辑与存储系统
    IL308158A (en) 2012-12-17 2023-12-01 Harvard College RNA-guided human genome engineering
    US9708589B2 (en) 2012-12-18 2017-07-18 Monsanto Technology Llc Compositions and methods for custom site-specific DNA recombinases
    CN105120656A (zh) 2012-12-21 2015-12-02 塞尔克蒂斯股份有限公司 冷诱导甜味降低的马铃薯
    DK3491915T3 (da) 2012-12-27 2023-08-28 Keygene Nv Fremgangsmåde til at inducere en målrettet translokation i en plante
    WO2014110006A1 (en) 2013-01-10 2014-07-17 Ge Healthcare Dharmacon, Inc. Templates, libraries, kits and methods for generating molecules
    CN105142396A (zh) 2013-01-14 2015-12-09 重组股份有限公司 缺角家畜
    CN104995302B (zh) 2013-01-16 2021-08-31 爱默蕾大学 Cas9-核酸复合物及其相关用途
    CN103233028B (zh) 2013-01-25 2015-05-13 南京徇齐生物技术有限公司 一种无物种限制无生物安全性问题的真核生物基因打靶方法及螺旋结构dna序列
    AU2014215025B2 (en) 2013-02-05 2018-08-30 The United States Of America, As Represented By The Secretary, Department Of Health And Human Services Cell lines for virus production and methods of use
    WO2014124226A1 (en) 2013-02-07 2014-08-14 The Rockefeller University Sequence specific antimicrobials
    WO2014127287A1 (en) 2013-02-14 2014-08-21 Massachusetts Institute Of Technology Method for in vivo tergated mutagenesis
    ES2768291T3 (es) 2013-02-14 2020-06-22 Univ Osaka Método para aislar una región genómica específica utilizando una molécula que se une específicamente a una secuencia de ADN endógena
    MX2015010841A (es) 2013-02-20 2016-05-09 Regeneron Pharma Modificacion genetica de ratas.
    US20150353885A1 (en) 2013-02-21 2015-12-10 Cellectis Method to counter-select cells or organisms by linking loci to nuclease components
    ES2522765B2 (es) 2013-02-22 2015-03-18 Universidad De Alicante Método para dectectar inserciones de espaciadores en estructuras CRISPR
    JP6491113B2 (ja) 2013-02-25 2019-03-27 サンガモ セラピューティクス, インコーポレイテッド ヌクレアーゼ媒介性遺伝子破壊を増強するための方法および組成物
    EP2922393B2 (de) 2013-02-27 2022-12-28 Helmholtz Zentrum München - Deutsches Forschungszentrum für Gesundheit und Umwelt (GmbH) Genmanipulation in eizellen durch cas9-nukleasen
    WO2014138379A1 (en) 2013-03-06 2014-09-12 The Johns Hopkins University The telomerator-a tool for chromosome engineering
    WO2014143381A1 (en) 2013-03-09 2014-09-18 Agilent Technologies, Inc. Methods of in vivo engineering of large sequences using multiple crispr/cas selections of recombineering events
    US10329574B2 (en) 2013-03-12 2019-06-25 E I Du Pont De Nemours And Company Methods for the identification of variant recognition sites for rare-cutting engineered double-strand-break-inducing agents and compositions and uses thereof
    WO2014165177A1 (en) 2013-03-12 2014-10-09 Sangamo Biosciences, Inc. Methods and compositions for modification of hla
    EP2970923B1 (de) 2013-03-13 2018-04-11 President and Fellows of Harvard College Mutanten von cre-rekombinase
    AU2014235794A1 (en) 2013-03-14 2015-10-22 Caribou Biosciences, Inc. Compositions and methods of nucleic acid-targeting nucleic acids
    US20140283156A1 (en) 2013-03-14 2014-09-18 Cold Spring Harbor Laboratory Trans-splicing ribozymes and silent recombinases
    WO2014153118A1 (en) 2013-03-14 2014-09-25 The Board Of Trustees Of The Leland Stanford Junior University Treatment of diseases and conditions associated with dysregulation of mammalian target of rapamycin complex 1 (mtorc1)
    US10760064B2 (en) 2013-03-15 2020-09-01 The General Hospital Corporation RNA-guided targeting of genetic and epigenomic regulatory proteins to specific genomic loci
    WO2014144094A1 (en) 2013-03-15 2014-09-18 J.R. Simplot Company Tal-mediated transfer dna insertion
    US20140273235A1 (en) 2013-03-15 2014-09-18 Regents Of The University Of Minnesota ENGINEERING PLANT GENOMES USING CRISPR/Cas SYSTEMS
    US20140273230A1 (en) 2013-03-15 2014-09-18 Sigma-Aldrich Co., Llc Crispr-based genome modification and regulation
    WO2015099850A1 (en) 2013-12-26 2015-07-02 The General Hospital Corporation Multiplex guide rnas
    WO2014204578A1 (en) 2013-06-21 2014-12-24 The General Hospital Corporation Using rna-guided foki nucleases (rfns) to increase specificity for rna-guided genome editing
    US11332719B2 (en) 2013-03-15 2022-05-17 The Broad Institute, Inc. Recombinant virus and preparations thereof
    US20140349400A1 (en) * 2013-03-15 2014-11-27 Massachusetts Institute Of Technology Programmable Modification of DNA
    IL290273B2 (en) 2013-03-15 2024-03-01 Cibus Us Llc Methods and compositions for increasing the efficiency of targeted gene modification through the use of gene repair with oligonucleotides - mediators
    US9234213B2 (en) 2013-03-15 2016-01-12 System Biosciences, Llc Compositions and methods directed to CRISPR/Cas genomic engineering systems
    US20160046959A1 (en) 2013-03-15 2016-02-18 Carlisle P. Landel Reproducible method for testis-mediated genetic modification (tgm) and sperm-mediated genetic modification (sgm)
    US10119133B2 (en) 2013-03-15 2018-11-06 The General Hospital Corporation Using truncated guide RNAs (tru-gRNAs) to increase specificity for RNA-guided genome editing
    CA2906970C (en) 2013-03-21 2021-05-18 Ospedale San Raffaele Srl Targeted disruption of t cell receptor genes using engineered zinc finger protein nucleases
    WO2014161821A1 (en) 2013-04-02 2014-10-09 Bayer Cropscience Nv Targeted genome engineering in eukaryotes
    EP3789487A1 (de) 2013-04-03 2021-03-10 Memorial Sloan Kettering Cancer Center Wirksame erzeugung von tumorgerichteten, aus pluripotenten stammzellen gewonnenen t-zellen
    EP2981617B1 (de) 2013-04-04 2023-07-05 President and Fellows of Harvard College Therapeutische verwendungen einer genomänderung mit crispr-/cas-systemen
    CA2908253C (en) 2013-04-04 2024-01-09 Trustees Of Dartmouth College Compositions and methods for in vivo excision of hiv-1 proviral dna
    EP2981166B1 (de) 2013-04-05 2020-09-09 Dow AgroSciences LLC Verfahren und zusammensetzungen zur integration einer exogenen sequenz in das genom von pflanzen
    US20150056629A1 (en) 2013-04-14 2015-02-26 Katriona Guthrie-Honea Compositions, systems, and methods for detecting a DNA sequence
    DK2986729T3 (en) 2013-04-16 2018-10-29 Regeneron Pharma TARGETED MODIFICATION OF ROOT THROUGH
    EP2986709A4 (de) 2013-04-16 2017-03-15 University Of Washington Through Its Center For Commercialization Aktivierung eines alternativen signalwegs zur homologiegeführten reparatur zur stimulierung von zielgenkorrektur und genomengineering
    WO2014172470A2 (en) 2013-04-16 2014-10-23 Whitehead Institute For Biomedical Research Methods of mutating, modifying or modulating nucleic acid in a cell or nonhuman mammal
    US10053725B2 (en) 2013-04-23 2018-08-21 President And Fellows Of Harvard College In situ interaction determination
    EP2796558A1 (de) 2013-04-23 2014-10-29 Rheinische Friedrich-Wilhelms-Universität Bonn Verbessertes Gen-Targeting und Nucleinsäureträgermoleküle, insbesondere zur Verwendung bei Pflanzen
    CN103224947B (zh) 2013-04-28 2015-06-10 陕西师范大学 一种基因打靶系统
    CA2910427C (en) 2013-05-10 2024-02-20 Sangamo Biosciences, Inc. Delivery methods and compositions for nuclease-mediated genome engineering
    JP6599848B2 (ja) 2013-05-10 2019-10-30 ホワイトヘッド・インスティテュート・フォー・バイオメディカル・リサーチ ソルタギング可能なタンパク質を有する赤血球のinvitro生成
    FI2997141T3 (fi) 2013-05-13 2022-12-15 CD19-spesifinen kimeerinen antigeenireseptori ja sen käyttöjä
    CA2912375C (en) 2013-05-13 2023-03-14 Cellectis Methods for engineering highly active t cell for immunotherapy
    EP3730615A3 (de) 2013-05-15 2020-12-09 Sangamo Therapeutics, Inc. Verfahren und zusammensetzungen zur behandlung eines genetischen leidens
    WO2014186686A2 (en) 2013-05-17 2014-11-20 Two Blades Foundation Targeted mutagenesis and genome engineering in plants using rna-guided cas nucleases
    US20140349405A1 (en) 2013-05-22 2014-11-27 Wisconsin Alumni Research Foundation Rna-directed dna cleavage and gene editing by cas9 enzyme from neisseria meningitidis
    US11414695B2 (en) 2013-05-29 2022-08-16 Agilent Technologies, Inc. Nucleic acid enrichment using Cas9
    CA2913830C (en) 2013-05-29 2021-06-29 Cellectis Methods for engineering t cells for immunotherapy by using rna-guided cas nuclease system
    JP7065564B2 (ja) 2013-05-29 2022-05-12 セレクティス Cas9ニッカーゼ活性を用いて正確なdna切断をもたらすための方法
    US11685935B2 (en) 2013-05-29 2023-06-27 Cellectis Compact scaffold of Cas9 in the type II CRISPR system
    WO2014194190A1 (en) 2013-05-30 2014-12-04 The Penn State Research Foundation Gene targeting and genetic modification of plants via rna-guided genome editing
    US10000746B2 (en) 2013-05-31 2018-06-19 Cellectis LAGLIDADG homing endonuclease cleaving the T cell receptor alpha gene and uses thereof
    US20140359796A1 (en) 2013-05-31 2014-12-04 Recombinetics, Inc. Genetically sterile animals
    AU2014273089B2 (en) 2013-05-31 2018-02-22 Cellectis A LAGLIDADG homing endonuclease cleaving the C-C Chemokine Receptor Type-5 (CCR5) gene and uses thereof
    EP3603679B1 (de) 2013-06-04 2022-08-10 President and Fellows of Harvard College Rna-geführte transkriptionsregulation
    US9267135B2 (en) 2013-06-04 2016-02-23 President And Fellows Of Harvard College RNA-guided transcriptional regulation
    CA2914519A1 (en) 2013-06-05 2014-12-11 Duke University Rna-guided gene editing and gene regulation
    WO2014200659A1 (en) 2013-06-11 2014-12-18 Clontech Laboratories, Inc. Protein enriched microvesicles and methods of making and using the same
    US20150315252A1 (en) 2013-06-11 2015-11-05 Clontech Laboratories, Inc. Protein enriched microvesicles and methods of making and using the same
    WO2014201015A2 (en) 2013-06-11 2014-12-18 The Regents Of The University Of California Methods and compositions for target dna modification
    WO2014199358A1 (en) 2013-06-14 2014-12-18 Cellectis Methods for non-transgenic genome editing in plants
    EP3011035B1 (de) 2013-06-17 2020-05-13 The Broad Institute, Inc. Test zur quantitativen bewertung der zielstellenspaltung durch eine oder mehrere crispr-cas führungssequenzen
    CA2915845A1 (en) 2013-06-17 2014-12-24 The Broad Institute, Inc. Delivery, engineering and optimization of systems, methods and compositions for targeting and modeling diseases and disorders of post mitotic cells
    WO2014204725A1 (en) 2013-06-17 2014-12-24 The Broad Institute Inc. Optimized crispr-cas double nickase systems, methods and compositions for sequence manipulation
    EP3011034B1 (de) 2013-06-17 2019-08-07 The Broad Institute, Inc. Freisetzung, verwendung und therapeutische anwendungen der crispr-cas-systeme und zusammensetzungen zur abzielung auf störungen und erkrankungen mit viralen komponenten
    AU2014281028B2 (en) 2013-06-17 2020-09-10 Massachusetts Institute Of Technology Delivery and use of the CRISPR-Cas systems, vectors and compositions for hepatic targeting and therapy
    EP3725885A1 (de) 2013-06-17 2020-10-21 The Broad Institute, Inc. Funktionale genomik unter verwendung von crispr-cas-systemen, zusammensetzungen, verfahren, schirme und anwendungen davon
    WO2014204724A1 (en) 2013-06-17 2014-12-24 The Broad Institute Inc. Delivery, engineering and optimization of tandem guide systems, methods and compositions for sequence manipulation
    SG11201510297QA (en) 2013-06-19 2016-01-28 Sigma Aldrich Co Llc Targeted integration
    CA2915779A1 (en) 2013-06-25 2014-12-31 Cellectis Modified diatoms for biofuel production
    US20160369268A1 (en) 2013-07-01 2016-12-22 The Board Of Regents Of The University Of Texas System Transcription activator-like effector (tale) libraries and methods of synthesis and use
    JP2016528890A (ja) 2013-07-09 2016-09-23 プレジデント アンド フェローズ オブ ハーバード カレッジ CRISPR/Cas系を用いるゲノム編集の治療用の使用
    RU2764637C2 (ru) 2013-07-09 2022-01-19 Президент Энд Фэллоуз Оф Харвард Коллидж Мультиплексная геномная инженерия, направляемая рнк
    RU2016104064A (ru) 2013-07-10 2017-08-15 Новартис Аг Клетки мицелиальных грибов с множественной недостаточностью протеаз и способы их использования
    SG10201913015XA (en) 2013-07-10 2020-02-27 Harvard College Orthogonal cas9 proteins for rna-guided gene regulation and editing
    AU2014287250A1 (en) 2013-07-10 2016-02-18 EffStock, LLC Mrap2 knockouts
    JP7019233B2 (ja) 2013-07-11 2022-02-15 モデルナティエックス インコーポレイテッド CRISPR関連タンパク質をコードする合成ポリヌクレオチドおよび合成sgRNAを含む組成物ならびに使用方法
    CN106222197A (zh) 2013-07-16 2016-12-14 中国科学院上海生命科学研究院 植物基因组定点修饰方法
    US9663782B2 (en) 2013-07-19 2017-05-30 Larix Bioscience Llc Methods and compositions for producing double allele knock outs
    GB201313235D0 (en) 2013-07-24 2013-09-04 Univ Edinburgh Antiviral Compositions Methods and Animals
    US10563225B2 (en) 2013-07-26 2020-02-18 President And Fellows Of Harvard College Genome engineering
    CN103388006B (zh) 2013-07-26 2015-10-28 华东师范大学 一种基因定点突变的构建方法
    US10421957B2 (en) 2013-07-29 2019-09-24 Agilent Technologies, Inc. DNA assembly using an RNA-programmable nickase
    WO2015017866A1 (en) 2013-08-02 2015-02-05 Enevolv, Inc. Processes and host cells for genome, pathway, and biomolecular engineering
    ITTO20130669A1 (it) 2013-08-05 2015-02-06 Consiglio Nazionale Ricerche Vettore adeno-associato ricombinante muscolo-specifico e suo impiego nel trattamento di patologie muscolari
    US20150044772A1 (en) 2013-08-09 2015-02-12 Sage Labs, Inc. Crispr/cas system-based novel fusion protein and its applications in genome editing
    US20150044192A1 (en) 2013-08-09 2015-02-12 President And Fellows Of Harvard College Methods for identifying a target site of a cas9 nuclease
    WO2015024017A2 (en) 2013-08-16 2015-02-19 President And Fellows Of Harvard College Rna polymerase, methods of purification and methods of use
    WO2015021990A1 (en) 2013-08-16 2015-02-19 University Of Copenhagen Rna probing method and reagents
    CN105705640B (zh) 2013-08-20 2019-02-15 非营利性组织佛兰芒综合大学生物技术研究所 抑制lncRNA用于治疗黑素瘤
    AU2014308899B2 (en) 2013-08-22 2020-11-19 E. I. Du Pont De Nemours And Company Methods for producing genetic modifications in a plant genome without incorporating a selectable transgene marker, and compositions thereof
    GB201315321D0 (en) 2013-08-28 2013-10-09 Koninklijke Nederlandse Akademie Van Wetenschappen Transduction Buffer
    JP6588438B2 (ja) 2013-08-28 2019-10-09 サンガモ セラピューティクス, インコーポレイテッド Dna結合ドメインと切断ドメインとを連結するための組成物
    SG10201801658XA (en) 2013-08-29 2018-03-28 Univ Temple Methods and compositions for rna-guided treatment of hiv infection
    EP3041345B1 (de) 2013-09-04 2024-05-01 KWS SAAT SE & Co. KGaA Helminthosporium turcicum-resistente pflanze
    SG10201801782PA (en) 2013-09-04 2018-04-27 Csir Site-specific nuclease single-cell assay targeting gene regulatory elements to silence gene expression
    CA2922823C (en) 2013-09-04 2023-01-17 Dow Agrosciences Llc Rapid targeting analysis in crops for determining donor insertion
    US10760065B2 (en) 2013-09-05 2020-09-01 Massachusetts Institute Of Technology Tuning microbial populations with programmable nucleases
    US9340799B2 (en) 2013-09-06 2016-05-17 President And Fellows Of Harvard College MRNA-sensing switchable gRNAs
    US9388430B2 (en) 2013-09-06 2016-07-12 President And Fellows Of Harvard College Cas9-recombinase fusion proteins and uses thereof
    WO2015040075A1 (en) 2013-09-18 2015-03-26 Genome Research Limited Genomic screening methods using rna-guided endonucleases
    DE202014010413U1 (de) 2013-09-18 2015-12-08 Kymab Limited Zellen und Organismen
    WO2015042393A2 (en) 2013-09-20 2015-03-26 President And Fellows Of Harvard College Evolved sortases and uses thereof
    PT3049116T (pt) 2013-09-23 2019-04-03 Rensselaer Polytech Inst Distribuição genética mediada por nanopartículas, edição genómica e modificação direcionada a ligantes em várias populações celulares
    US20160237455A1 (en) 2013-09-27 2016-08-18 Editas Medicine, Inc. Crispr-related methods and compositions
    WO2015048690A1 (en) 2013-09-27 2015-04-02 The Regents Of The University Of California Optimized small guide rnas and methods of use
    US20160237451A1 (en) 2013-09-30 2016-08-18 Regents Of The University Of Minnesota Conferring resistance to geminiviruses in plants using crispr/cas systems
    CN105593375A (zh) 2013-09-30 2016-05-18 加利福尼亚大学董事会 新趋化因子受体cxcr8的鉴别
    US20160208214A1 (en) 2013-10-02 2016-07-21 Northeastern University Methods and compositions for generation of developmentally-incompetent eggs in recipients of nuclear genetic transfer
    JP5774657B2 (ja) 2013-10-04 2015-09-09 国立大学法人京都大学 エレクトロポレーションを利用した哺乳類の遺伝子改変方法
    CA2932581A1 (en) 2013-10-07 2015-04-16 Northeastern University Methods and compositions for ex vivo generation of developmentally competent eggs from germ line cells using autologous cell systems
    US20150098954A1 (en) 2013-10-08 2015-04-09 Elwha Llc Compositions and Methods Related to CRISPR Targeting
    DE102013111099B4 (de) 2013-10-08 2023-11-30 Eberhard Karls Universität Tübingen Medizinische Fakultät Permanente Genkorrektur mittels nukleotidmodifizierter messenger RNA
    JP2015076485A (ja) 2013-10-08 2015-04-20 株式会社ジャパンディスプレイ 表示装置
    WO2015052231A2 (en) 2013-10-08 2015-04-16 Technical University Of Denmark Multiplex editing system
    EP3055423B1 (de) 2013-10-11 2019-12-25 Cellectis Verfahren zum nachweis von bestimmten nukleinsäuresequenzen anhand eines talen proteins
    WO2015057671A1 (en) 2013-10-14 2015-04-23 The Broad Institute, Inc. Artificial transcription factors comprising a sliding domain and uses thereof
    JP6734774B2 (ja) 2013-10-15 2020-08-05 ザ スクリプス リサーチ インスティテュート ペプチドキメラ抗原受容体t細胞スイッチおよびその使用
    US20150238631A1 (en) 2013-10-15 2015-08-27 The California Institute For Biomedical Research Chimeric antigen receptor t cell switches and uses thereof
    CA2926078C (en) 2013-10-17 2021-11-16 Sangamo Biosciences, Inc. Delivery methods and compositions for nuclease-mediated genome engineering in hematopoietic stem cells
    CN105899665B (zh) 2013-10-17 2019-10-22 桑格摩生物科学股份有限公司 用于核酸酶介导的基因组工程改造的递送方法和组合物
    WO2015058047A2 (en) 2013-10-18 2015-04-23 President And Fellows Of Harvard College Fluorination of organic compounds
    CA2927965A1 (en) 2013-10-25 2015-04-30 Cellectis Design of rare-cutting endonucleases for efficient and specific targeting dna sequences comprising highly repetitive motives
    WO2015065964A1 (en) 2013-10-28 2015-05-07 The Broad Institute Inc. Functional genomics using crispr-cas systems, compositions, methods, screens and applications thereof
    US10584358B2 (en) 2013-10-30 2020-03-10 North Carolina State University Compositions and methods related to a type-II CRISPR-Cas system in Lactobacillus buchneri
    CA2926534A1 (en) 2013-11-04 2015-05-07 Dow Agrosciences Llc A universal donor system for gene targeting
    EP3066202B1 (de) 2013-11-04 2021-03-03 Dow AgroSciences LLC Optimale sojabohnen-loci
    TWI721478B (zh) 2013-11-04 2021-03-11 美商陶氏農業科學公司 最適玉米基因座(二)
    TWI659103B (zh) 2013-11-04 2019-05-11 陶氏農業科學公司 最適大豆基因座(二)
    EP3065540B1 (de) 2013-11-04 2021-12-15 Corteva Agriscience LLC Optimale maispflanzen
    WO2015069682A2 (en) 2013-11-05 2015-05-14 President And Fellows Of Harvard College Precise microbiota engineering at the cellular level
    WO2015070083A1 (en) 2013-11-07 2015-05-14 Editas Medicine,Inc. CRISPR-RELATED METHODS AND COMPOSITIONS WITH GOVERNING gRNAS
    WO2015077058A2 (en) 2013-11-08 2015-05-28 The Broad Institute, Inc. Compositions and methods for selecting a treatment for b-cell neoplasias
    WO2015070193A1 (en) 2013-11-11 2015-05-14 Liu Oliver Compositions and methods for targeted gene disruption in prokaryotes
    US10369201B2 (en) 2013-11-11 2019-08-06 Sangamo Therapeutics, Inc. Methods and compositions for treating Huntington's disease
    SI3068881T1 (sl) 2013-11-13 2019-05-31 Children's Medical Center Corporation Z nukleazo posredovano uravnavanje izražanja genov
    CA2930590C (en) 2013-11-15 2021-02-16 The United States Of America, As Represented By The Secretary, Department Of Health And Human Services Engineering neural stem cells using homologous recombination
    CN106103703A (zh) 2013-11-18 2016-11-09 耶鲁大学 使用转座子的组合物和方法
    JP2016537028A (ja) 2013-11-18 2016-12-01 クリスパー セラピューティクス アーゲー Crispr−casシステムの材料及び方法
    US10787684B2 (en) 2013-11-19 2020-09-29 President And Fellows Of Harvard College Large gene excision and insertion
    US9074199B1 (en) 2013-11-19 2015-07-07 President And Fellows Of Harvard College Mutant Cas9 proteins
    WO2015075056A1 (en) 2013-11-19 2015-05-28 Thermo Fisher Scientific Baltics Uab Programmable enzymes for isolation of specific dna fragments
    WO2015075154A2 (en) 2013-11-20 2015-05-28 Fondazione Telethon Artificial dna-binding proteins and uses thereof
    CN105765061A (zh) 2013-11-22 2016-07-13 塞勒克提斯公司 工程化耐受化疗药物的t-细胞用于免疫治疗的方法
    EP3071686B1 (de) 2013-11-22 2020-07-22 Cellectis SA Verfahren zur erzeugung von allogenen t-cell-batchen mit gemittelter wirksamkeit
    CA2930973A1 (en) 2013-11-22 2015-05-28 Pal SAERTROM C/ebp alpha short activating rna compositions and methods of use
    CN103642836A (zh) 2013-11-26 2014-03-19 苏州同善生物科技有限公司 一种基于crispr基因敲除技术建立脆性x综合症灵长类动物模型的方法
    CN103614415A (zh) 2013-11-27 2014-03-05 苏州同善生物科技有限公司 一种基于crispr基因敲除技术建立肥胖症大鼠动物模型的方法
    WO2015079056A1 (en) 2013-11-28 2015-06-04 Haplogen Genomics Gmbh Somatic human cell line mutations
    JP6535684B2 (ja) 2013-12-09 2019-06-26 サンガモ セラピューティクス, インコーポレイテッド ゲノム操作のための方法および組成物
    RU2685914C1 (ru) 2013-12-11 2019-04-23 Регенерон Фармасьютикалс, Инк. Способы и композиции для направленной модификации генома
    WO2015089427A1 (en) 2013-12-12 2015-06-18 The Broad Institute Inc. Crispr-cas systems and methods for altering expression of gene products, structural information and inducible modular cas enzymes
    CN111206032A (zh) 2013-12-12 2020-05-29 布罗德研究所有限公司 用于基因组编辑的crispr-cas系统和组合物的递送、用途和治疗应用
    US9840699B2 (en) 2013-12-12 2017-12-12 President And Fellows Of Harvard College Methods for nucleic acid editing
    EP3080271B1 (de) 2013-12-12 2020-02-12 The Broad Institute, Inc. Systeme, verfahren und zusammensetzungen zur sequenzmanipulation mit optimierten funktionellen crispr-cas-systemen
    WO2015089473A1 (en) 2013-12-12 2015-06-18 The Broad Institute Inc. Engineering of systems, methods and optimized guide compositions with new architectures for sequence manipulation
    WO2015089465A1 (en) 2013-12-12 2015-06-18 The Broad Institute Inc. Delivery, use and therapeutic applications of the crispr-cas systems and compositions for hbv and viral diseases and disorders
    CA2932475A1 (en) 2013-12-12 2015-06-18 The Broad Institute, Inc. Delivery, use and therapeutic applications of the crispr-cas systems and compositions for targeting disorders and diseases using particle delivery components
    WO2015089364A1 (en) 2013-12-12 2015-06-18 The Broad Institute Inc. Crystal structure of a crispr-cas system, and uses thereof
    EP3835419A1 (de) 2013-12-12 2021-06-16 The Regents of The University of California Verfahren und zusammensetzungen zur modifizierung einer einzelsträngigen zielnukleinsäure
    CA2933134A1 (en) 2013-12-13 2015-06-18 Cellectis Cas9 nuclease platform for microalgae genome engineering
    US20160312233A1 (en) 2013-12-13 2016-10-27 Cellectis New method of selection of algal-transformed cells using nuclease
    US20150191744A1 (en) 2013-12-17 2015-07-09 University Of Massachusetts Cas9 effector-mediated regulation of transcription, differentiation and gene editing/labeling
    AU2014368982B2 (en) 2013-12-19 2021-03-25 Amyris, Inc. Methods for genomic integration
    ES2818625T3 (es) 2013-12-30 2021-04-13 Univ Pittsburgh Commonwealth Sys Higher Education Genes de fusión asociados con el cáncer de próstata progresivo
    CN103668472B (zh) 2013-12-31 2014-12-24 北京大学 利用CRISPR/Cas9系统构建真核基因敲除文库的方法
    US9963689B2 (en) 2013-12-31 2018-05-08 The Regents Of The University Of California Cas9 crystals and methods of use thereof
    SG10201805815YA (en) 2014-01-08 2018-08-30 Harvard College Rna-guided gene drives
    CN106459996A (zh) 2014-01-14 2017-02-22 Lam疗法公司 诱变方法
    US10774338B2 (en) 2014-01-16 2020-09-15 The Regents Of The University Of California Generation of heritable chimeric plant traits
    GB201400962D0 (en) 2014-01-21 2014-03-05 Kloehn Peter C Screening for target-specific affinity binders using RNA interference
    WO2015109752A1 (en) 2014-01-21 2015-07-30 The Institute Of Genetics And Developmental Biology Chinese Academy Of Sciences Modified plants
    US9663770B2 (en) * 2014-01-22 2017-05-30 Life Technologies Corporation Reverse transcriptases for use in high temperature nucleic acid synthesis
    CA2936976A1 (en) 2014-01-24 2015-07-30 Children's Medical Center Corporation High-throughput mouse model for optimizing antibody affinities
    EP3097212A4 (de) 2014-01-24 2017-10-04 North Carolina State University Verfahren und zusammensetzungen für sequenzen zur führung von cas9-targeting
    WO2015113063A1 (en) 2014-01-27 2015-07-30 Georgia Tech Research Corporation Methods and systems for identifying crispr/cas off-target sites
    CN104805078A (zh) 2014-01-28 2015-07-29 北京大学 用于高效基因组编辑的rna分子的设计、合成及其应用
    US9850525B2 (en) 2014-01-29 2017-12-26 Agilent Technologies, Inc. CAS9-based isothermal method of detection of specific DNA sequence
    US10233456B2 (en) 2014-01-30 2019-03-19 The Board Of Trustees Of The University Of Arkansas Method, vectors, cells, seeds and kits for stacking genes into a single genomic site
    US20150291969A1 (en) 2014-01-30 2015-10-15 Chromatin, Inc. Compositions for reduced lignin content in sorghum and improving cell wall digestibility, and methods of making the same
    GB201401707D0 (en) 2014-01-31 2014-03-19 Sec Dep For Health The Adeno-associated viral vectors
    MX2016009771A (es) 2014-01-31 2016-11-14 Factor Bioscience Inc Metodos y productos para la produccion y administracion de acido nucleico.
    WO2015115903A1 (en) 2014-02-03 2015-08-06 Academisch Ziekenhuis Leiden H.O.D.N. Lumc Site-specific dna break-induced genome editing using engineered nucleases
    PL3102673T3 (pl) 2014-02-03 2020-11-02 Sangamo Therapeutics, Inc. Sposoby i kompozycje do leczenia talasemii beta
    DK3102722T3 (da) 2014-02-04 2020-11-16 Jumpcode Genomics Inc Genom fraktionering
    USRE48856E1 (en) 2014-02-07 2021-12-21 Vib Vzw Inhibition of NEAT1 for treatment of solid tumors
    EP3690044B1 (de) 2014-02-11 2024-01-10 The Regents of the University of Colorado, a body corporate Crispr-aktiviertes multiplexed-genom-engineering
    CA2939621C (en) 2014-02-13 2019-10-15 Takara Bio Usa, Inc. Methods of depleting a target molecule from an initial collection of nucleic acids, and compositions and kits for practicing the same
    EP3105317B1 (de) 2014-02-14 2018-09-19 Cellectis Manipulierte zellen für die immuntherapie zur abzielung auf antigen in immunzellen wie auch erregerzellen
    SG11201606819QA (en) 2014-02-18 2016-09-29 Univ Duke Compositions for the inactivation of virus replication and methods of making and using the same
    AU2015220765A1 (en) 2014-02-20 2016-09-01 Dsm Ip Assets B.V. Phage insensitive Streptococcus thermophilus
    JP6665102B2 (ja) 2014-02-21 2020-03-13 セレクティスCellectis 制御性t細胞をインサイチューで阻害するための方法
    CA2939942A1 (en) 2014-02-24 2015-08-27 Sangamo Biosciences, Inc. Methods and compositions for nuclease-mediated targeted integration
    WO2015127428A1 (en) 2014-02-24 2015-08-27 Massachusetts Institute Of Technology Methods for in vivo genome editing
    JP6521669B2 (ja) 2014-02-25 2019-05-29 国立研究開発法人農業・食品産業技術総合研究機構 標的dnaに変異が導入された植物細胞、及びその製造方法
    ES2898460T3 (es) 2014-02-27 2022-03-07 Monsanto Technology Llc Composiciones y procedimientos para la modificación genómica dirigida al sitio
    CN103820441B (zh) 2014-03-04 2017-05-17 黄行许 CRISPR‑Cas9特异性敲除人CTLA4基因的方法以及用于特异性靶向CTLA4基因的sgRNA
    CN103820454B (zh) 2014-03-04 2016-03-30 上海金卫生物技术有限公司 CRISPR-Cas9特异性敲除人PD1基因的方法以及用于特异性靶向PD1基因的sgRNA
    CN111471675A (zh) 2014-03-05 2020-07-31 国立大学法人神户大学 特异性转变靶向dna序列的核酸碱基的基因组序列的修饰方法、及其使用的分子复合体
    EP3114227B1 (de) 2014-03-05 2021-07-21 Editas Medicine, Inc. Verfahren im zusammenhang mit crispr/cas und verfahren zur behandlung des usher-syndroms und von retinitis pigmentosa
    WO2015138510A1 (en) 2014-03-10 2015-09-17 Editas Medicine., Inc. Crispr/cas-related methods and compositions for treating leber's congenital amaurosis 10 (lca10)
    WO2015136001A1 (en) 2014-03-11 2015-09-17 Cellectis Method for generating t-cells compatible for allogenic transplantation
    EP3116533B1 (de) 2014-03-12 2020-08-12 Precision Biosciences, Inc. Dystrophingenexondeletion mit manipulierten nukleasen
    WO2015138870A2 (en) 2014-03-13 2015-09-17 The Trustees Of The University Of Pennsylvania Compositions and methods for targeted epigenetic modification
    AU2015229095B2 (en) 2014-03-14 2022-01-27 Cibus Europe B.V. Methods and compositions for increasing efficiency of targeted gene modification using oligonucleotide-mediated gene repair
    WO2015138855A1 (en) 2014-03-14 2015-09-17 The Regents Of The University Of California Vectors and methods for fungal genome engineering by crispr-cas9
    WO2015143046A2 (en) 2014-03-18 2015-09-24 Sangamo Biosciences, Inc. Methods and compositions for regulation of zinc finger protein expression
    AU2015234204A1 (en) 2014-03-20 2016-10-06 Universite Laval CRISPR-based methods and products for increasing frataxin levels and uses thereof
    CN106460009A (zh) 2014-03-21 2017-02-22 小利兰·斯坦福大学托管委员会 无核酸酶的基因组编辑
    CA2942347C (en) 2014-03-24 2023-03-14 IMMCO Diagnostics, Inc. Improved anti-nuclear antibody detection and diagnostics for systemic and non-systemic autoimmune disorders
    EP3129484A1 (de) 2014-03-25 2017-02-15 Editas Medicine, Inc. Verfahren und zusammensetzungen im zusammenhang mit crispr/cas zur behandlung von hiv-infektionen und aids
    WO2015148680A1 (en) 2014-03-25 2015-10-01 Ginkgo Bioworks, Inc. Methods and genetic systems for cell engineering
    CN106459951A (zh) 2014-03-26 2017-02-22 马里兰大学派克分院 驯养的大型动物的受精卵中的靶向基因组编辑
    US9609415B2 (en) 2014-03-26 2017-03-28 Bose Corporation Headphones with cable management
    WO2015148863A2 (en) 2014-03-26 2015-10-01 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating sickle cell disease
    WO2015148860A1 (en) 2014-03-26 2015-10-01 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating beta-thalassemia
    AU2015237746B2 (en) 2014-03-28 2020-01-30 Aposense Ltd. Compounds and methods for trans-membrane delivery of molecules
    US9993563B2 (en) 2014-03-28 2018-06-12 Aposense Ltd. Compounds and methods for trans-membrane delivery of molecules
    EP3498845B1 (de) 2014-04-01 2022-06-22 Editas Medicine, Inc. Crispr-/cas-assoziierte verfahren und zusammensetzungen zur behandlung des herpes simplex virus typ 1 (hsv-1)
    WO2015153791A1 (en) 2014-04-01 2015-10-08 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating herpes simplex virus type 2 (hsv-2)
    WO2015153760A2 (en) 2014-04-01 2015-10-08 Sangamo Biosciences, Inc. Methods and compositions for prevention or treatment of a nervous system disorder
    US10507232B2 (en) 2014-04-02 2019-12-17 University Of Florida Research Foundation, Incorporated Materials and methods for the treatment of latent viral infection
    WO2015153780A1 (en) 2014-04-02 2015-10-08 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating primary open angle glaucoma
    WO2015153940A1 (en) 2014-04-03 2015-10-08 Massachusetts Institute Of Technology Methods and compositions for the production of guide rna
    CN103911376B (zh) 2014-04-03 2017-02-15 黄行许 CRISPR‑Cas9靶向敲除乙肝病毒cccDNA及其特异性sgRNA
    US11439712B2 (en) 2014-04-08 2022-09-13 North Carolina State University Methods and compositions for RNA-directed repression of transcription using CRISPR-associated genes
    EP3556858A3 (de) 2014-04-09 2020-01-22 Editas Medicine, Inc. Crispr/cas-assoziierte verfahren und zusammensetzungen zur behandlung von mukoviszidose
    US10253311B2 (en) 2014-04-10 2019-04-09 The Regents Of The University Of California Methods and compositions for using argonaute to modify a single stranded target nucleic acid
    JP2017513472A (ja) 2014-04-11 2017-06-01 セレクティスCellectis アルギニンおよび/またはトリプトファン枯渇微小環境に対して抵抗性を有する免疫細胞を作製するための方法
    ES2962509T3 (es) 2014-04-14 2024-03-19 Maxcyte Inc Métodos y composiciones para modificar ADN genómico
    CN103923911B (zh) 2014-04-14 2016-06-08 上海金卫生物技术有限公司 CRISPR-Cas9特异性敲除人CCR5基因的方法以及用于特异性靶向CCR5基因的sgRNA
    US20170037414A1 (en) 2014-04-14 2017-02-09 Nemesis Bioscience Ltd Therapeutic
    GB201406970D0 (en) 2014-04-17 2014-06-04 Green Biologics Ltd Targeted mutations
    GB201406968D0 (en) 2014-04-17 2014-06-04 Green Biologics Ltd Deletion mutants
    EP3800248A3 (de) 2014-04-18 2021-08-04 Editas Medicine, Inc. Crispr-cas-assoziierte verfahren, zusammensetzungen und komponenten für krebsimmuntherapie
    CN105039399A (zh) 2014-04-23 2015-11-11 复旦大学 多能干细胞-遗传性心肌病心肌细胞及其制备方法
    WO2015164748A1 (en) 2014-04-24 2015-10-29 Sangamo Biosciences, Inc. Engineered transcription activator like effector (tale) proteins
    KR20160145186A (ko) 2014-04-24 2016-12-19 보드 오브 리전츠, 더 유니버시티 오브 텍사스 시스템 입양 세포 요법 생성물을 생성하기 위한 유도 만능 줄기 세포의 응용
    KR101823661B1 (ko) 2014-04-24 2018-01-30 기초과학연구원 마이크로 상동 기반의 유전자 녹아웃을 위한 뉴클레아제 표적 서열을 확인하는 방법
    US20150307889A1 (en) 2014-04-28 2015-10-29 Dow Agrosciences Llc Haploid maize transformation
    CN111647627A (zh) 2014-04-28 2020-09-11 重组股份有限公司 多重基因编辑
    WO2015168158A1 (en) 2014-04-28 2015-11-05 Fredy Altpeter Targeted genome editing to modify lignin biosynthesis and cell wall composition
    WO2015167766A1 (en) 2014-04-29 2015-11-05 Seattle Children's Hospital (dba Seattle Children's Research Institute) Ccr5 disruption of cells expressing anti-hiv chimeric antigen receptor (car) derived from broadly neutralizing antibodies
    CN104178506B (zh) 2014-04-30 2017-03-01 清华大学 Taler蛋白通过空间位阻发挥转录抑制作用及其应用
    WO2015165276A1 (zh) 2014-04-30 2015-11-05 清华大学 利用tale转录抑制子在哺乳动物细胞中模块化构建合成基因线路的试剂盒
    WO2015168404A1 (en) 2014-04-30 2015-11-05 Massachusetts Institute Of Technology Toehold-gated guide rna for programmable cas9 circuitry with rna input
    US10563207B2 (en) 2014-04-30 2020-02-18 Tsinghua University Modular construction of synthetic gene circuits in mammalian cells using TALE transcriptional repressors
    WO2015168547A2 (en) 2014-05-01 2015-11-05 Andre Lieber In vivo gene engineering with adenoviral vectors
    GB201407852D0 (en) 2014-05-02 2014-06-18 Iontas Ltd Preparation of libraries od protein variants expressed in eukaryotic cells and use for selecting binding molecules
    WO2015171603A1 (en) 2014-05-06 2015-11-12 Two Blades Foundation Methods for producing plants with enhanced resistance to oomycete pathogens
    WO2015171932A1 (en) 2014-05-08 2015-11-12 Sangamo Biosciences, Inc. Methods and compositions for treating huntington's disease
    EP3140403A4 (de) 2014-05-09 2017-12-20 Université Laval Vorbeugung und behandlung von alzheimerkrankheit durch gemonänderung mithilfe eines crispr/cas-systems
    US20170266197A1 (en) 2014-05-09 2017-09-21 Indiana University Research And Technology Corporation Methods and compositions for treating hepatitis b virus infections
    US10487336B2 (en) 2014-05-09 2019-11-26 The Regents Of The University Of California Methods for selecting plants after genome editing
    WO2015175642A2 (en) 2014-05-13 2015-11-19 Sangamo Biosciences, Inc. Methods and compositions for prevention or treatment of a disease
    CN104004782B (zh) 2014-05-16 2016-06-08 安徽省农业科学院水稻研究所 一种延长水稻生育期的育种方法
    CN104017821B (zh) 2014-05-16 2016-07-06 安徽省农业科学院水稻研究所 定向编辑颖壳颜色决定基因OsCHI创制褐壳水稻材料的方法
    WO2015173436A1 (en) 2014-05-16 2015-11-19 Vrije Universiteit Brussel Genetic correction of myotonic dystrophy type 1
    CN103981212B (zh) 2014-05-16 2016-06-01 安徽省农业科学院水稻研究所 将黄色颖壳的水稻品种的颖壳颜色改为褐色的育种方法
    CN103981211B (zh) 2014-05-16 2016-07-06 安徽省农业科学院水稻研究所 一种创制闭颖授粉水稻材料的育种方法
    WO2015179540A1 (en) 2014-05-20 2015-11-26 Regents Of The University Of Minnesota Method for editing a genetic sequence
    CA2852593A1 (en) 2014-05-23 2015-11-23 Universite Laval Methods for producing dopaminergic neurons and uses thereof
    US10653123B2 (en) 2014-05-27 2020-05-19 Dana-Farber Cancer Institute, Inc. Methods and compositions for perturbing gene expression in hematopoietic stem cell lineages in vivo
    WO2015183025A1 (ko) 2014-05-28 2015-12-03 주식회사 툴젠 표적 특이적 뉴클레아제를 이용한 표적 dna의 민감한 검출 방법
    AU2015266770A1 (en) 2014-05-30 2016-12-08 The Board Of Trustees Of The Leland Stanford Junior University Compositions and methods of delivering treatments for latent viral infections
    US9970001B2 (en) 2014-06-05 2018-05-15 Sangamo Therapeutics, Inc. Methods and compositions for nuclease design
    WO2015188191A1 (en) 2014-06-06 2015-12-10 Wong Wilson W Dna recombinase circuits for logical control of gene expression
    CA2950178A1 (en) 2014-06-06 2015-12-10 The California Institute For Biomedical Research Methods of constructing amino terminal immunoglobulin fusion proteins and compositions thereof
    WO2015188135A1 (en) 2014-06-06 2015-12-10 The California Institute For Biomedical Research Constant region antibody fusion proteins and compositions thereof
    KR102374379B1 (ko) 2014-06-06 2022-03-17 리제너론 파마슈티칼스 인코포레이티드 표적화된 좌를 변형시키는 방법 및 조성물
    WO2015188094A1 (en) 2014-06-06 2015-12-10 President And Fellows Of Harvard College Methods for targeted modification of genomic dna
    CN104004778B (zh) 2014-06-06 2016-03-02 重庆高圣生物医药有限责任公司 含有CRISPR/Cas9系统的靶向敲除载体及其腺病毒和应用
    WO2015191693A2 (en) 2014-06-10 2015-12-17 Massachusetts Institute Of Technology Method for gene editing
    US11274302B2 (en) 2016-08-17 2022-03-15 Diacarta Ltd Specific synthetic chimeric Xenonucleic acid guide RNA; s(XNA-gRNA) for enhancing CRISPR mediated genome editing efficiency
    CA2951882A1 (en) 2014-06-11 2015-12-17 Tom E. HOWARD Factor viii mutation repair and tolerance induction and related cdnas, compositions, methods and systems
    ES2937642T3 (es) 2014-06-11 2023-03-30 Univ Duke Composiciones y métodos para el control de flujo rápido y dinámico usando válvulas metabólicas sintéticas
    US11584936B2 (en) 2014-06-12 2023-02-21 King Abdullah University Of Science And Technology Targeted viral-mediated plant genome editing using CRISPR /Cas9
    WO2015191911A2 (en) 2014-06-12 2015-12-17 Clontech Laboratories, Inc. Protein enriched microvesicles and methods of making and using the same
    WO2015195547A1 (en) 2014-06-16 2015-12-23 University Of Washington Methods for controlling stem cell potential and for gene editing in stem cells
    JP6930834B2 (ja) 2014-06-16 2021-09-01 ザ・ジョンズ・ホプキンス・ユニバーシティー H1プロモーターを用いるcrisprガイドrnaの発現のための組成物および方法
    AU2015277180A1 (en) 2014-06-17 2017-01-12 Poseida Therapeutics, Inc. A method for directing proteins to specific loci in the genome and uses thereof
    CA2952906A1 (en) 2014-06-20 2015-12-23 Cellectis Potatoes with reduced granule-bound starch synthase
    EP3155099B1 (de) 2014-06-23 2018-03-21 Regeneron Pharmaceuticals, Inc. Nuklease-vermittelte dna verknüpfung
    KR102598819B1 (ko) 2014-06-23 2023-11-03 더 제너럴 하스피탈 코포레이션 서열결정에 의해 평가된 DSB의 게놈 전체에 걸친 비편향된 확인 (GUIDE-Seq)
    WO2015200555A2 (en) 2014-06-25 2015-12-30 Caribou Biosciences, Inc. Rna modification to engineer cas9 activity
    ES2901074T3 (es) 2014-06-26 2022-03-21 Regeneron Pharma Métodos y composiciones para modificaciones genéticas objetivo y métodos de uso
    GB201411344D0 (en) 2014-06-26 2014-08-13 Univ Leicester Cloning
    CN106662033B (zh) 2014-06-30 2019-01-18 日产自动车株式会社 内燃机
    EP3162328B1 (de) 2014-06-30 2022-01-19 Kao Corporation Haftfolie zur kühlung
    US20180187172A1 (en) 2014-07-01 2018-07-05 Board Of Regents, The University Of Texas System Regulated gene expression from viral vectors
    WO2016007604A1 (en) 2014-07-09 2016-01-14 Gen9, Inc. Compositions and methods for site-directed dna nicking and cleaving
    EP2966170A1 (de) 2014-07-10 2016-01-13 Heinrich-Pette-Institut Leibniz-Institut für experimentelle Virologie-Stiftung bürgerlichen Rechts - HBV-Inaktivierung
    MX2017000422A (es) 2014-07-11 2017-05-01 Du Pont Composiciones y metodos para producir plantas resistentes al herbicida glifosato.
    BR112017000621B1 (pt) 2014-07-11 2024-03-12 Pioneer Hi-Bred International, Inc Método para melhorar um traço agronômico de uma planta de milho ou de soja
    CN104109687A (zh) 2014-07-14 2014-10-22 四川大学 运动发酵单胞菌CRISPR-Cas9系统的构建与应用
    WO2016011080A2 (en) 2014-07-14 2016-01-21 The Regents Of The University Of California Crispr/cas transcriptional modulation
    US10738278B2 (en) 2014-07-15 2020-08-11 Juno Therapeutics, Inc. Engineered cells for adoptive cell therapy
    US9944933B2 (en) 2014-07-17 2018-04-17 Georgia Tech Research Corporation Aptamer-guided gene targeting
    EP3193944B1 (de) 2014-07-17 2021-04-07 University of Pittsburgh - Of the Commonwealth System of Higher Education Verfahren zur behandlung von zellen mit fusionsgenen
    US20160053272A1 (en) 2014-07-18 2016-02-25 Whitehead Institute For Biomedical Research Methods Of Modifying A Sequence Using CRISPR
    US20160053304A1 (en) 2014-07-18 2016-02-25 Whitehead Institute For Biomedical Research Methods Of Depleting Target Sequences Using CRISPR
    US10975406B2 (en) 2014-07-18 2021-04-13 Massachusetts Institute Of Technology Directed endonucleases for repeatable nucleic acid cleavage
    EP3172237A2 (de) 2014-07-21 2017-05-31 Novartis AG Behandlung von krebs mithilfe von humanisiertem chimärem anti-bcma-antigenrezeptor
    CA3176503A1 (en) 2014-07-21 2016-01-28 Illumina, Inc Polynucleotide enrichment using crispr-cas systems
    JP6653420B2 (ja) 2014-07-22 2020-02-26 パナソニックIpマネジメント株式会社 複合磁性材料とこれを用いたコイル部品ならびに複合磁性材料の製造方法
    KR102234266B1 (ko) 2014-07-23 2021-04-02 삼성전자주식회사 반도체 장치 및 그 제조 방법
    DK3172315T3 (da) 2014-07-24 2020-12-21 Dsm Ip Assets Bv Fagresistente mælkesyrebakterier
    US20170211048A1 (en) 2014-07-25 2017-07-27 Boehringer Ingelheim International Gmbh Enhanced reprogramming to ips cells
    US9757420B2 (en) 2014-07-25 2017-09-12 Sangamo Therapeutics, Inc. Gene editing for HIV gene therapy
    WO2016014794A1 (en) 2014-07-25 2016-01-28 Sangamo Biosciences, Inc. Methods and compositions for modulating nuclease-mediated genome engineering in hematopoietic stem cells
    EP3194600B1 (de) 2014-07-26 2019-08-28 Consiglio Nazionale Delle Ricerche Zusammensetzungen und verfahren zur behandlung von muskeldystrophie
    EP3177718B1 (de) 2014-07-30 2022-03-16 President and Fellows of Harvard College Cas9-proteine mit ligandenabhängigen inteinen
    WO2016019144A2 (en) 2014-07-30 2016-02-04 Sangamo Biosciences, Inc. Gene correction of scid-related genes in hematopoietic stem and progenitor cells
    FR3024464A1 (fr) 2014-07-30 2016-02-05 Centre Nat Rech Scient Ciblage de vecteurs integratifs non-viraux dans les sequences d'adn nucleolaires chez les eucaryotes
    US9850521B2 (en) 2014-08-01 2017-12-26 Agilent Technologies, Inc. In vitro assay buffer for Cas9
    EP2982758A1 (de) 2014-08-04 2016-02-10 Centre Hospitalier Universitaire Vaudois (CHUV) Gemonänderung zur Behandlung von Morbus Huntington
    US20160076093A1 (en) 2014-08-04 2016-03-17 University Of Washington Multiplex homology-directed repair
    CN113789317B (zh) 2014-08-06 2024-02-23 基因工具股份有限公司 使用空肠弯曲杆菌crispr/cas系统衍生的rna引导的工程化核酸酶的基因编辑
    JP6598860B2 (ja) 2014-08-06 2019-10-30 カレッジ オブ メディシン ポチョン チャ ユニバーシティ インダストリー−アカデミック コーオペレイション ファウンデーション Hlaをコードする遺伝子のヌクレアーゼ媒介編集により作製される免疫適合性細胞
    WO2016022866A1 (en) 2014-08-07 2016-02-11 Agilent Technologies, Inc. Cis-blocked guide rna
    WO2016022931A1 (en) 2014-08-07 2016-02-11 The Rockefeller University Compositions and methods for transcription-based crispr-cas dna editing
    CA2959130A1 (en) 2014-08-11 2016-02-18 The Board Of Regents Of The University Of Texas System Prevention of muscular dystrophy by crispr/cas9-mediated gene editing
    US10513711B2 (en) 2014-08-13 2019-12-24 Dupont Us Holding, Llc Genetic targeting in non-conventional yeast using an RNA-guided endonuclease
    CN104178461B (zh) 2014-08-14 2017-02-01 北京蛋白质组研究中心 携带cas9的重组腺病毒及其应用
    US11071289B2 (en) 2014-08-14 2021-07-27 Biocytogen Boston Corp DNA knock-in system
    US9879270B2 (en) 2014-08-15 2018-01-30 Wisconsin Alumni Research Foundation Constructs and methods for genome editing and genetic engineering of fungi and protists
    WO2016028682A1 (en) 2014-08-17 2016-02-25 The Broad Institute Inc. Genome editing using cas9 nickases
    AU2015305570C1 (en) * 2014-08-19 2020-07-23 President And Fellows Of Harvard College RNA-guided systems for probing and mapping of nucleic acids
    WO2016028887A1 (en) 2014-08-19 2016-02-25 Pacific Biosciences Of California, Inc. Compositions and methods for enrichment of nucleic acids
    WO2016026444A1 (en) 2014-08-20 2016-02-25 Shanghai Institutes For Biological Sciences, Chinese Academy Of Sciences Biomarker and therapeutic target for triple negative breast cancer
    CA2957938A1 (en) 2014-08-25 2016-03-03 GeneWeave Biosciences, Inc. Non-replicative transduction particles and transduction particle-based reporter systems
    WO2016033230A1 (en) 2014-08-26 2016-03-03 The Regents Of The University Of California Hypersensitive aba receptors
    ES2730378T3 (es) 2014-08-27 2019-11-11 Caribou Biosciences Inc Procedimientos para incrementar la eficiencia de la modificación mediada por Cas9
    US10450584B2 (en) 2014-08-28 2019-10-22 North Carolina State University Cas9 proteins and guiding features for DNA targeting and genome editing
    US10570418B2 (en) 2014-09-02 2020-02-25 The Regents Of The University Of California Methods and compositions for RNA-directed target DNA modification
    WO2016035044A1 (en) 2014-09-05 2016-03-10 Vilnius University Programmable rna shredding by the type iii-a crispr-cas system of streptococcus thermophilus
    WO2016037157A2 (en) 2014-09-05 2016-03-10 The Johns Hopkins University Targeting capn9/capns2 activity as a therapeutic strategy for the treatment of myofibroblast differentiation and associated pathologies
    WO2016040594A1 (en) 2014-09-10 2016-03-17 The Regents Of The University Of California Reconstruction of ancestral cells by enzymatic recording
    CN108064129A (zh) 2014-09-12 2018-05-22 纳幕尔杜邦公司 玉米和大豆中复合性状基因座的位点特异性整合位点的产生和使用方法
    CN106715431A (zh) 2014-09-16 2017-05-24 吉利德科学公司 Toll样受体调节剂的固体形式
    EP3878948A1 (de) 2014-09-16 2021-09-15 Sangamo Therapeutics, Inc. Verfahren und zusammensetzungen für nukleasevermitteltes genom-engineering und korrektur bei hämotopoietischen stammzellen
    WO2016049024A2 (en) 2014-09-24 2016-03-31 The Broad Institute Inc. Delivery, use and therapeutic applications of the crispr-cas systems and compositions for modeling competition of multiple cancer mutations in vivo
    WO2016049163A2 (en) 2014-09-24 2016-03-31 The Broad Institute Inc. Use and production of chd8+/- transgenic animals with behavioral phenotypes characteristic of autism spectrum disorder
    WO2016049251A1 (en) 2014-09-24 2016-03-31 The Broad Institute Inc. Delivery, use and therapeutic applications of the crispr-cas systems and compositions for modeling mutations in leukocytes
    KR20230067694A (ko) 2014-09-24 2023-05-16 시티 오브 호프 고효율 게놈 편집을 위한 아데노-관련 바이러스 벡터 변이체 및 이의 방법
    WO2016049258A2 (en) 2014-09-25 2016-03-31 The Broad Institute Inc. Functional screening with optimized functional crispr-cas systems
    WO2016046635A1 (en) 2014-09-25 2016-03-31 Institut Pasteur Methods for characterizing human papillomavirus associated cervical lesions
    WO2016054225A1 (en) 2014-09-30 2016-04-07 Stc.Unm Plasmid delivery in the treatment of cancer and other disease states
    EP3845655A1 (de) 2014-10-01 2021-07-07 The General Hospital Corporation Verfahren zur erhöhung der effizienz von nucleaseinduzierter homologiegerichteter reparatur
    US9879283B2 (en) 2014-10-09 2018-01-30 Life Technologies Corporation CRISPR oligonucleotides and gene editing
    CA2963840A1 (en) 2014-10-09 2016-04-14 Seattle Children's Hospital (dba Seattle Children's Research Institute) Long poly(a) plasmids and methods for introduction of long poly(a) sequences into the plasmid
    EP3204496A1 (de) 2014-10-10 2017-08-16 Editas Medicine, Inc. Zusammensetzungen und verfahren zur förderung einer homologiegerichteten reparatur
    US10583201B2 (en) 2014-10-10 2020-03-10 Massachusetts Eye And Ear Infirmary Efficient delivery of therapeutic molecules in vitro and in vivo
    WO2016061073A1 (en) 2014-10-14 2016-04-21 Memorial Sloan-Kettering Cancer Center Composition and method for in vivo engineering of chromosomal rearrangements
    MX2017004890A (es) 2014-10-15 2018-02-12 Regeneron Pharma Metodos y composiciones para la generación o el mantenimiento de células pluripotentes.
    CN104342457A (zh) 2014-10-17 2015-02-11 杭州师范大学 一种将外源基因定点整合到靶标基因的方法
    CN107208086A (zh) 2014-10-17 2017-09-26 霍华德休斯医学研究所 基因组探针
    US10308947B2 (en) 2014-10-17 2019-06-04 The Penn State Research Foundation Methods and compositions for multiplex RNA guided genome editing and other RNA technologies
    BR112017008082A2 (pt) 2014-10-20 2017-12-26 Envirologix Inc composições e métodos para detectar um vírus de rna
    US10920208B2 (en) 2014-10-22 2021-02-16 President And Fellows Of Harvard College Evolution of proteases
    WO2016065364A1 (en) 2014-10-24 2016-04-28 Life Technologies Corporation Compositions and methods for enhancing homologous recombination
    WO2016069591A2 (en) 2014-10-27 2016-05-06 The Broad Institute Inc. Compositions, methods and use of synthetic lethal screening
    WO2016069912A1 (en) 2014-10-29 2016-05-06 Massachusetts Eye And Ear Infirmary Efficient delivery of therapeutic molecules in vitro and in vivo
    EP3212165B1 (de) 2014-10-30 2024-02-28 President and Fellows of Harvard College Freisetzung von negativ geladenen proteinen unter verwendung von kationischen lipiden
    MA40880A (fr) 2014-10-30 2017-09-05 Temple Univ Of The Commonwealth Éradication guidée par l'arn du virus jc humain et d'autres polyomavirus
    EP3215168B1 (de) 2014-10-31 2023-08-02 The Trustees of the University of Pennsylvania Änderung der genexpression in modifizierten t-zellen und verwendungen davon
    US9816080B2 (en) 2014-10-31 2017-11-14 President And Fellows Of Harvard College Delivery of CAS9 via ARRDC1-mediated microvesicles (ARMMs)
    TWI716367B (zh) 2014-10-31 2021-01-21 麻省理工學院 用於常間回文重複序列叢集(crispr)之大量平行組合性基因學
    CN104404036B (zh) 2014-11-03 2017-12-01 赛业(苏州)生物科技有限公司 基于CRISPR/Cas9技术的条件性基因敲除方法
    US10435697B2 (en) 2014-11-03 2019-10-08 Nanyang Technological University Recombinant expression system that senses pathogenic microorganisms
    CN104504304B (zh) 2014-11-03 2017-08-25 深圳先进技术研究院 一种成簇的规律间隔的短回文重复序列识别方法及装置
    EP3739047A1 (de) 2014-11-04 2020-11-18 National University Corporation Kobe University Verfahren zur modifizierung der genomsequenz zur einführung einer spezifischen mutation in eine gezielt ausgewählte dna-sequenz durch basenentfernungsreaktion und darin verwendeter molekularer komplex
    WO2016073559A1 (en) 2014-11-05 2016-05-12 The Regents Of The University Of California Methods for autocatalytic genome editing and neutralizing autocatalytic genome editing
    CN107406838A (zh) 2014-11-06 2017-11-28 纳幕尔杜邦公司 Rna引导的内切核酸酶向细胞中的肽介导的递送
    WO2016073990A2 (en) 2014-11-07 2016-05-12 Editas Medicine, Inc. Methods for improving crispr/cas-mediated genome-editing
    WO2016077273A1 (en) 2014-11-11 2016-05-19 Q Therapeutics, Inc. Engineering mesenchymal stem cells using homologous recombination
    CN114438174A (zh) 2014-11-11 2022-05-06 伊鲁米那股份有限公司 使用crispr-cas系统的多核苷酸扩增
    EP3219810B1 (de) 2014-11-14 2022-01-05 Institute for Basic Science Verfahren zur detektion einer off-target-stelle einer genetischen schere in einem genom
    WO2016075662A2 (en) 2014-11-15 2016-05-19 Zumutor Biologics, Inc. Dna-binding domain, non-fucosylated and partially fucosylated proteins, and methods thereof
    US11470826B2 (en) 2014-11-17 2022-10-18 National University Corporation Tokyo Medical And Dental University Method of conveniently producing genetically modified non-human mammal with high efficiency
    CN107109422B (zh) 2014-11-19 2021-08-13 基础科学研究院 使用由两个载体表达的拆分的Cas9的基因组编辑
    US11319555B2 (en) 2014-11-20 2022-05-03 Duke University Compositions, systems and methods for cell therapy
    NZ731962A (en) 2014-11-21 2022-07-01 Regeneron Pharma Methods and compositions for targeted genetic modification using paired guide rnas
    US10227661B2 (en) 2014-11-21 2019-03-12 GeneWeave Biosciences, Inc. Sequence-specific detection and phenotype determination
    WO2016086177A2 (en) 2014-11-25 2016-06-02 Drexel University Compositions and methods for hiv quasi-species excision from hiv-1-infected patients
    WO2016084088A1 (en) 2014-11-26 2016-06-02 Ramot At Tel-Aviv University Ltd. Targeted elimination of bacterial genes
    GB201421096D0 (en) 2014-11-27 2015-01-14 Imp Innovations Ltd Genome editing methods
    CA2968808A1 (en) 2014-11-27 2016-06-02 Danziger Innovations Ltd. Nucleic acid constructs for genome editing
    WO2016082135A1 (zh) 2014-11-27 2016-06-02 中国农业科学院北京畜牧兽医研究所 一种利用定点切割系统对猪h11位点定点插入的方法
    CN105695485B (zh) 2014-11-27 2020-02-21 中国科学院上海生命科学研究院 一种用于丝状真菌Crispr-Cas系统的Cas9编码基因及其应用
    US10479997B2 (en) 2014-12-01 2019-11-19 Novartis Ag Compositions and methods for diagnosis and treatment of prostate cancer
    WO2016089866A1 (en) 2014-12-01 2016-06-09 President And Fellows Of Harvard College Rna-guided systems for in vivo gene editing
    CN107250148B (zh) 2014-12-03 2021-04-16 安捷伦科技有限公司 具有化学修饰的指导rna
    CN104450774A (zh) 2014-12-04 2015-03-25 中国农业科学院作物科学研究所 一种大豆CRISPR/Cas9体系的构建及其在大豆基因修饰中的应用
    WO2016090385A1 (en) 2014-12-05 2016-06-09 Applied Stemcell, Inc. Site-directed crispr/recombinase compositions and methods of integrating transgenes
    CN104531704B (zh) 2014-12-09 2019-05-21 中国农业大学 利用CRISPR-Cas9系统敲除动物FGF5基因的方法
    CN104531705A (zh) 2014-12-09 2015-04-22 中国农业大学 利用CRISPR-Cas9系统敲除动物myostatin基因的方法
    WO2016094679A1 (en) 2014-12-10 2016-06-16 Regents Of The University Of Minnesota Genetically modified cells, tissues, and organs for treating disease
    US20170362580A1 (en) 2014-12-12 2017-12-21 James Zhu Methods and compositions for selectively eliminating cells of interest
    WO2016094880A1 (en) 2014-12-12 2016-06-16 The Broad Institute Inc. Delivery, use and therapeutic applications of crispr systems and compositions for genome editing as to hematopoietic stem cells (hscs)
    CN104480144B (zh) 2014-12-12 2017-04-12 武汉大学 用于艾滋病基因治疗的CRISPR/Cas9重组慢病毒载体及其慢病毒
    CA2969464A1 (en) 2014-12-12 2016-06-16 Tod M. Woolf Compositions and methods for editing nucleic acids in cells utilizing oligonucleotides
    WO2016094874A1 (en) 2014-12-12 2016-06-16 The Broad Institute Inc. Escorted and functionalized guides for crispr-cas systems
    WO2016094872A1 (en) 2014-12-12 2016-06-16 The Broad Institute Inc. Dead guides for crispr transcription factors
    EP3889260A1 (de) 2014-12-12 2021-10-06 The Broad Institute, Inc. Geschützte guide-rnas (pgrnas)
    AU2015362618B2 (en) 2014-12-16 2022-01-27 C3J Therapeutics, Inc. Compositions of and methods for in vitro viral genome engineering
    CN107667171A (zh) 2014-12-16 2018-02-06 丹尼斯科美国公司 真菌基因组修饰系统及使用方法
    PL3234134T3 (pl) 2014-12-17 2020-12-28 Proqr Therapeutics Ii B.V. Ukierunkowana edycja rna
    CA2969384A1 (en) 2014-12-17 2016-06-23 Cellectis Inhibitory chimeric antigen receptor (icar or n-car) expressing non-t cell transduction domain
    AU2015363113B2 (en) 2014-12-17 2021-03-11 E. I. Du Pont De Nemours And Company Compositions and methods for efficient gene editing in E. coli using guide RNA/Cas endonuclease systems in combination with circular polynucleotide modification templates
    WO2016097751A1 (en) 2014-12-18 2016-06-23 The University Of Bath Method of cas9 mediated genome engineering
    US9840702B2 (en) 2014-12-18 2017-12-12 Integrated Dna Technologies, Inc. CRISPR-based compositions and methods of use
    CN104745626B (zh) 2014-12-19 2018-05-01 中国航天员科研训练中心 一种条件性基因敲除动物模型的快速构建方法及应用
    WO2016100974A1 (en) 2014-12-19 2016-06-23 The Broad Institute Inc. Unbiased identification of double-strand breaks and genomic rearrangement by genome-wide insert capture sequencing
    CA2971444A1 (en) 2014-12-20 2016-06-23 Arc Bio, Llc Compositions and methods for targeted depletion, enrichment, and partitioning of nucleic acids using crispr/cas system proteins
    CN104560864B (zh) 2014-12-22 2017-08-11 中国科学院微生物研究所 利用CRISPR‑Cas9系统构建的敲除IFN‑β基因的293T细胞系
    US10190106B2 (en) 2014-12-22 2019-01-29 Univesity Of Massachusetts Cas9-DNA targeting unit chimeras
    WO2016106239A1 (en) 2014-12-23 2016-06-30 The Regents Of The University Of California Methods and compositions for nucleic acid integration
    WO2016106236A1 (en) 2014-12-23 2016-06-30 The Broad Institute Inc. Rna-targeting system
    CA2968939A1 (en) 2014-12-24 2016-06-30 The Johns Hopkins University Systems and methods for genome modification and regulation
    EP3237615B2 (de) 2014-12-24 2023-07-26 The Broad Institute, Inc. Crispr mit destabilisierungsdomänen oder mit destabilisierungsdomänenassoziierung
    CN104651398A (zh) 2014-12-24 2015-05-27 杭州师范大学 利用CRISPR-Cas9特异敲出microRNA基因家族的方法
    AU2015101792A4 (en) 2014-12-24 2016-01-28 Massachusetts Institute Of Technology Engineering of systems, methods and optimized enzyme and guide scaffolds for sequence manipulation
    JPWO2016104716A1 (ja) 2014-12-26 2017-10-05 国立研究開発法人理化学研究所 遺伝子のノックアウト方法
    WO2016108926A1 (en) 2014-12-30 2016-07-07 The Broad Institute Inc. Crispr mediated in vivo modeling and genetic screening of tumor growth and metastasis
    WO2016109255A1 (en) 2014-12-30 2016-07-07 University Of South Florida Methods and compositions for cloning into large vectors
    CN104498493B (zh) 2014-12-30 2017-12-26 武汉大学 CRISPR/Cas9特异性敲除乙型肝炎病毒的方法以及用于特异性靶向HBV DNA的gRNA
    WO2016109840A2 (en) 2014-12-31 2016-07-07 Synthetic Genomics, Inc. Compositions and methods for high efficiency in vivo genome editing
    CN104651399B (zh) 2014-12-31 2018-11-16 广西大学 一种利用CRISPR/Cas系统在猪胚胎细胞中实现基因敲除的方法
    ES2842151T3 (es) 2015-01-06 2021-07-13 Univ Yonsei Iacf Endonucleasa dirigida al gen del factor VIII de coagulación sanguínea y composición para el tratamiento de la hemofilia que comprende el mismo
    CN108064287A (zh) 2015-01-06 2018-05-22 帝斯曼知识产权资产管理有限公司 用于解脂酵母宿主细胞的crispr-cas系统
    US11396665B2 (en) 2015-01-06 2022-07-26 Dsm Ip Assets B.V. CRISPR-CAS system for a filamentous fungal host cell
    EP3242949B1 (de) 2015-01-06 2021-11-03 DSM IP Assets B.V. Crispr-cas-system für eine hefe-wirtszelle
    CN104651392B (zh) 2015-01-06 2018-07-31 华南农业大学 一种利用CRISPR/Cas9系统定点突变P/TMS12-1获得温敏不育系的方法
    CN104593422A (zh) 2015-01-08 2015-05-06 中国农业大学 一种抗蓝耳病克隆猪的制备方法
    WO2016112242A1 (en) * 2015-01-08 2016-07-14 President And Fellows Of Harvard College Split cas9 proteins
    EP3242938B1 (de) 2015-01-09 2020-01-08 Bio-Rad Laboratories, Inc. Nachweis von gemoneditierung
    WO2016114972A1 (en) 2015-01-12 2016-07-21 The Regents Of The University Of California Heterodimeric cas9 and methods of use thereof
    JP7278027B2 (ja) 2015-01-12 2023-05-19 マサチューセッツ インスティテュート オブ テクノロジー マイクロ流体送達による遺伝子編集
    WO2016112963A1 (en) 2015-01-13 2016-07-21 Riboxx Gmbh Delivery of biomolecules into cells
    MA41349A (fr) 2015-01-14 2017-11-21 Univ Temple Éradication de l'herpès simplex de type i et d'autres virus de l'herpès associés guidée par arn
    DK3244909T3 (da) 2015-01-14 2020-01-13 Univ Aix Marseille Proteasominhibitorer til at behandle en lidelse relateret til en akkumulering af ikke-degraderet unormalt protein eller en cancer
    CN107429263A (zh) 2015-01-15 2017-12-01 斯坦福大学托管董事会 调控基因组编辑的方法
    CN104611370A (zh) 2015-01-16 2015-05-13 深圳市科晖瑞生物医药有限公司 一种剔除β2-微球蛋白基因片段的方法
    AR103446A1 (es) 2015-01-19 2017-05-10 Inst Genetics & Dev Biolog Cas Método para modificar con precisión una planta a través de la expresión transitoria de genes
    CN104725626B (zh) 2015-01-22 2016-06-29 漳州亚邦化学有限公司 一种适用于人造石英石的不饱和树脂的制备方法
    CN105821072A (zh) 2015-01-23 2016-08-03 深圳华大基因研究院 用于DNA组装的CRISPR-Cas9系统及DNA组装方法
    WO2016123071A1 (en) 2015-01-26 2016-08-04 Cold Spring Harbor Laboratory Methods of identifying essential protein domains
    US10059940B2 (en) 2015-01-27 2018-08-28 Minghong Zhong Chemically ligated RNAs for CRISPR/Cas9-lgRNA complexes as antiviral therapeutic agents
    CN104561095B (zh) 2015-01-27 2017-08-22 深圳市国创纳米抗体技术有限公司 一种能够生产人神经生长因子的转基因小鼠的制备方法
    EP3250689B1 (de) 2015-01-28 2020-11-04 The Regents of The University of California Verfahren und zusammensetzungen zur markierung einer einzelsträngigen zielnukleinsäure
    NZ733702A (en) 2015-01-28 2022-04-29 Caribou Biosciences Inc Crispr hybrid dna/rna polynucleotides and methods of use
    AU2016211118B2 (en) 2015-01-29 2022-03-31 Centre National De La Recherche Scientifique Method for inducing targeted meiotic recombinations
    EP3250693B2 (de) 2015-01-30 2023-12-20 The Regents of The University of California Proteinfreisetzung in primären hämatopoetischen zellen
    BR112017016639A2 (pt) 2015-02-02 2018-06-19 Meiragtx Uk Ii Ltd regulação da expressão genética pela modulação mediada de aptâmero de espalhamento alternativo
    CN104593418A (zh) 2015-02-06 2015-05-06 中国医学科学院医学实验动物研究所 一种人源化大鼠药物评价动物模型建立的方法
    WO2016130600A2 (en) 2015-02-09 2016-08-18 Duke University Compositions and methods for epigenome editing
    KR101584933B1 (ko) 2015-02-10 2016-01-13 성균관대학교산학협력단 항생제 내성 억제용 재조합 벡터 및 이의 용도
    WO2016130697A1 (en) 2015-02-11 2016-08-18 Memorial Sloan Kettering Cancer Center Methods and kits for generating vectors that co-express multiple target molecules
    CN104928321B (zh) 2015-02-12 2018-06-01 中国科学院西北高原生物研究所 一种由Crispr/Cas9诱导的鳞片缺失斑马鱼模式及建立方法
    CN104726494B (zh) 2015-02-12 2018-10-23 中国人民解放军第二军医大学 CRISPR-Cas9技术构建染色体易位干细胞及动物模型的方法
    EP3256170B1 (de) 2015-02-13 2020-09-23 University of Massachusetts Zusammensetzungen und verfahren zur transitorischen freisetzung von polypeptiden
    US20160244784A1 (en) 2015-02-15 2016-08-25 Massachusetts Institute Of Technology Population-Hastened Assembly Genetic Engineering
    WO2016132122A1 (en) 2015-02-17 2016-08-25 University Of Edinburgh Assay construct
    JP6354100B2 (ja) 2015-02-19 2018-07-11 国立大学法人徳島大学 Cas9 mRNAを哺乳動物の受精卵にエレクトロポレーションにより導入する方法
    AU2016225179C1 (en) 2015-02-23 2022-11-03 Crispr Therapeutics Ag Materials and methods for treatment of hemoglobinopathies
    US20180200387A1 (en) 2015-02-23 2018-07-19 Crispr Therapeutics Ag Materials and methods for treatment of human genetic diseases including hemoglobinopathies
    US20180245073A1 (en) 2015-02-23 2018-08-30 Voyager Therapeutics, Inc. Regulatable expression using adeno-associated virus (aav)
    CN107406858A (zh) 2015-02-25 2017-11-28 先锋国际良种公司 用于指导rna/cas内切核酸酶复合物的调节型表达的组合物和方法
    US20160244829A1 (en) 2015-02-25 2016-08-25 University-Industry Foundation, Yonsei University Method for target dna enrichment using crispr system
    WO2016135507A1 (en) 2015-02-27 2016-09-01 University Of Edinburgh Nucleic acid editing systems
    CN104805099B (zh) 2015-03-02 2018-04-13 中国人民解放军第二军医大学 一种安全编码Cas9蛋白的核酸分子及其表达载体
    EP3858990A1 (de) 2015-03-03 2021-08-04 The General Hospital Corporation Manipulierte crispr-cas9-nukleasen mit veränderter pam-spezifität
    CN104651401B (zh) 2015-03-05 2019-03-08 东华大学 一种mir-505双等位基因敲除的方法
    CN104673816A (zh) 2015-03-05 2015-06-03 广东医学院 一种pCr-NHEJ载体及其构建方法及其用于细菌基因定点敲除的应用
    US20180271891A1 (en) 2015-03-11 2018-09-27 The Broad Institute Inc. Selective treatment of prmt5 dependent cancer
    US20160264934A1 (en) 2015-03-11 2016-09-15 The General Hospital Corporation METHODS FOR MODULATING AND ASSAYING m6A IN STEM CELL POPULATIONS
    GB201504223D0 (en) 2015-03-12 2015-04-29 Genome Res Ltd Biallelic genetic modification
    CN105969792A (zh) 2015-03-12 2016-09-28 中国科学院遗传与发育生物学研究所 一种提高植物对入侵的dna 病毒的抵御能力的方法
    EP3858992A1 (de) 2015-03-13 2021-08-04 The Jackson Laboratory Dreikomponentiges crispr/cas-komplexsystem und verwendungen davon
    CN106032540B (zh) 2015-03-16 2019-10-25 中国科学院上海生命科学研究院 CRISPR/Cas9核酸内切酶体系的腺相关病毒载体构建及其用途
    AR103926A1 (es) 2015-03-16 2017-06-14 Inst Genetics & Dev Biolog Cas Método para realizar modificaciones sitio dirigidas en el genoma de una planta usando materiales no heredables
    EP3271849B1 (de) 2015-03-17 2021-09-08 Bio-Rad Laboratories, Inc. Nachweis von genomeditierung
    WO2016149484A2 (en) 2015-03-17 2016-09-22 Temple University Of The Commonwealth System Of Higher Education Compositions and methods for specific reactivation of hiv latent reservoir
    EP3271461A1 (de) 2015-03-20 2018-01-24 Danmarks Tekniske Universitet Crispr/cas9-basiertes engineering von actinomycin-genomen
    MA41382A (fr) 2015-03-20 2017-11-28 Univ Temple Édition génique basée sur le système crispr/endonucléase à induction par tat
    CN104726449A (zh) 2015-03-23 2015-06-24 国家纳米科学中心 一种用于预防和/或治疗HIV的CRISPR-Cas9系统及其制备方法和用途
    CN106148416B (zh) 2015-03-24 2019-12-17 华东师范大学 Cyp基因敲除大鼠的培育方法及其肝微粒体的制备方法
    EP4019635A1 (de) 2015-03-25 2022-06-29 Editas Medicine, Inc. Crispr-/cas-verwandte verfahren, zusammensetzungen und komponenten
    EP3274453B1 (de) 2015-03-26 2021-01-27 Editas Medicine, Inc. Crispr/cas-vermittelte genumwandlung
    CA2981509A1 (en) 2015-03-30 2016-10-06 The Board Of Regents Of The Nevada System Of Higher Educ. On Behalf Of The University Of Nevada, La Compositions comprising talens and methods of treating hiv
    US20180080051A1 (en) 2015-03-31 2018-03-22 Exeligen Scientific, Inc. Cas 9 retroviral integrase and cas 9 recombinase systems for targeted incorporation of a dna sequence into a genome of a cell or organism
    WO2016161380A1 (en) 2015-04-01 2016-10-06 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating duchenne muscular dystrophy and becker muscular dystrophy
    EP3300507A4 (de) 2015-04-02 2019-03-13 Agenovir Corporation Genverabreichungsverfahren und zusammensetzungen
    CN106434737A (zh) 2015-04-03 2017-02-22 内蒙古中科正标生物科技有限责任公司 基于CRISPR/Cas9技术的单子叶植物基因敲除载体及其应用
    WO2016161446A1 (en) 2015-04-03 2016-10-06 Dana-Farber Cancer Institute, Inc. Composition and methods of genome editing of b-cells
    US20170166928A1 (en) 2015-04-03 2017-06-15 Whitehead Institute For Biomedical Research Compositions And Methods For Genetically Modifying Yeast
    KR102648489B1 (ko) 2015-04-06 2024-03-15 더 보드 어브 트러스티스 어브 더 리랜드 스탠포드 주니어 유니버시티 Crispr/cas-매개 유전자 조절을 위한 화학적으로 변형된 가이드 rna
    US11214779B2 (en) 2015-04-08 2022-01-04 University of Pittsburgh—of the Commonwealth System of Higher Education Activatable CRISPR/CAS9 for spatial and temporal control of genome editing
    US11390860B2 (en) 2015-04-13 2022-07-19 The University Of Tokyo Set of polypeptides exhibiting nuclease activity or nickase activity with dependence on light or in presence of drug or suppressing or activating expression of target gene
    US10155938B2 (en) 2015-04-14 2018-12-18 City Of Hope Coexpression of CAS9 and TREX2 for targeted mutagenesis
    GB201506509D0 (en) 2015-04-16 2015-06-03 Univ Wageningen Nuclease-mediated genome editing
    US10738290B2 (en) 2015-04-21 2020-08-11 Novartis Ag RNA-guided gene editing system and uses thereof
    CN104805118A (zh) 2015-04-22 2015-07-29 扬州大学 一种苏禽黄鸡胚胎干细胞特定基因进行靶向敲除方法
    CN104762321A (zh) 2015-04-22 2015-07-08 东北林业大学 基于CRISPR/Cas9系统靶向敲除KHV基因的敲除载体构建方法及其crRNA原件
    SG11201708653RA (en) 2015-04-24 2017-11-29 Editas Medicine Inc Evaluation of cas9 molecule/guide rna molecule complexes
    CN107614012A (zh) 2015-04-24 2018-01-19 加利福尼亚大学董事会 使用工程化的细胞检测、监测或治疗疾病或病况的系统及制备和使用它们的方法
    US11268158B2 (en) 2015-04-24 2022-03-08 St. Jude Children's Research Hospital, Inc. Assay for safety assessment of therapeutic genetic manipulations, gene therapy vectors and compounds
    WO2016174056A1 (en) 2015-04-27 2016-11-03 Genethon Compositions and methods for the treatment of nucleotide repeat expansion disorders
    WO2016176191A1 (en) 2015-04-27 2016-11-03 The Trustees Of The University Of Pennsylvania Dual aav vector system for crispr/cas9 mediated correction of human disease
    EP3087974A1 (de) 2015-04-29 2016-11-02 Rodos BioTarget GmbH Gezielte nanoträger zur gezielten verabreichung von therapeutika für die gentherapie
    EP3289080B1 (de) 2015-04-30 2021-08-25 The Trustees of Columbia University in the City of New York Gentherapie für autosomal dominante erkrankungen
    US20190002920A1 (en) 2015-04-30 2019-01-03 The Brigham And Women's Hospital, Inc. Methods and kits for cloning-free genome editing
    US20160346359A1 (en) 2015-05-01 2016-12-01 Spark Therapeutics, Inc. Adeno-associated Virus-Mediated CRISPR-Cas9 Treatment of Ocular Disease
    EP3289076B1 (de) 2015-05-01 2021-11-17 Precision Biosciences, Inc. Genaue deletion von chromosomalen sequenzen in vivo
    CN104894068A (zh) 2015-05-04 2015-09-09 南京凯地生物科技有限公司 一种利用CRISPR/Cas9制备CAR-T细胞的方法
    US11845928B2 (en) 2015-05-04 2023-12-19 Tsinghua University Methods and kits for fragmenting DNA
    WO2016177682A1 (en) 2015-05-06 2016-11-10 Snipr Technologies Limited Altering microbial populations & modifying microbiota
    GB2531454A (en) 2016-01-10 2016-04-20 Snipr Technologies Ltd Recombinogenic nucleic acid strands in situ
    WO2016182917A1 (en) 2015-05-08 2016-11-17 Children's Medical Center Corporation Targeting bcl11a enhancer functional regions for fetal hemoglobin reinduction
    WO2016182893A1 (en) 2015-05-08 2016-11-17 Teh Broad Institute Inc. Functional genomics using crispr-cas systems for saturating mutagenesis of non-coding elements, compositions, methods, libraries and applications thereof
    WO2016183236A1 (en) 2015-05-11 2016-11-17 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating hiv infection and aids
    JP7030522B2 (ja) 2015-05-11 2022-03-07 エディタス・メディシン、インコーポレイテッド 幹細胞における遺伝子編集のための最適化crispr/cas9システムおよび方法
    SG10202112057QA (en) 2015-05-12 2021-12-30 Sangamo Therapeutics Inc Nuclease-mediated regulation of gene expression
    KR101785847B1 (ko) 2015-05-12 2017-10-17 연세대학교 산학협력단 선형 이중가닥 DNA를 활용한 CRISPR/Cas9 시스템을 이용한 표적 유전체 교정
    CN108136047B (zh) 2015-05-13 2022-12-13 西雅图儿童医院(Dba西雅图儿童研究所) 提高原代细胞中基于核酸内切酶的基因编辑
    US10920221B2 (en) 2015-05-13 2021-02-16 President And Fellows Of Harvard College Methods of making and using guide RNA for use with Cas9 systems
    EP3294774A1 (de) 2015-05-13 2018-03-21 Zumutor Biologics, Inc. Afucosyliertes protein, dieses protein exprimierende zelle und zugehörige verfahren
    CN105886498A (zh) 2015-05-13 2016-08-24 沈志荣 CRISPR-Cas9特异性敲除人PCSK9基因的方法以及用于特异性靶向PCSK9基因的sgRNA
    CN107614680A (zh) 2015-05-14 2018-01-19 南加利福尼亚大学 利用重组核酸内切酶系统的最佳化基因编辑
    WO2016183438A1 (en) 2015-05-14 2016-11-17 Massachusetts Institute Of Technology Self-targeting genome editing system
    US20180142236A1 (en) 2015-05-15 2018-05-24 Ge Healthcare Dharmacon, Inc. Synthetic single guide rna for cas9-mediated gene editing
    CA2985506A1 (en) 2015-05-15 2016-11-24 Pioneer Hi-Bred International, Inc. Guide rna/cas endonuclease systems
    BR112017024514A2 (pt) 2015-05-16 2018-07-24 Genzyme Corporation edição genética de mutações intrônicas profundas
    WO2016185411A1 (en) 2015-05-18 2016-11-24 King Abdullah University Of Science And Technology Method of inhibiting plant virus pathogen infections by crispr/cas9-mediated interference
    CN104846010B (zh) 2015-05-18 2018-07-06 安徽省农业科学院水稻研究所 一种删除转基因水稻筛选标记基因的方法
    EP3095870A1 (de) 2015-05-19 2016-11-23 Kws Saat Se Verfahren zur in-planta-transformation von pflanzen und darauf basierte herstellungsverfahren und daraus erhältliche produkte
    CN106011104B (zh) 2015-05-21 2019-09-27 清华大学 利用拆分Cas系统进行基因编辑和表达调控方法
    US20160340622A1 (en) 2015-05-22 2016-11-24 Nabil Radi Abdou Bar Soap Anchoring Core
    CN105518135B (zh) 2015-05-22 2020-11-24 深圳市第二人民医院 CRISPR-Cas9特异性敲除猪CMAH基因的方法及用于特异性靶向CMAH基因的sgRNA
    WO2016187904A1 (zh) 2015-05-22 2016-12-01 深圳市第二人民医院 CRISPR-Cas9特异性敲除猪CMAH基因的方法及用于特异性靶向CMAH基因的sgRNA
    WO2016187717A1 (en) 2015-05-26 2016-12-01 Exerkine Corporation Exosomes useful for genome editing
    US20180148711A1 (en) 2015-05-28 2018-05-31 Coda Biotherapeutics, Inc. Genome editing vectors
    CN104894075B (zh) 2015-05-28 2019-08-06 华中农业大学 CRISPR/Cas9和Cre/lox系统编辑伪狂犬病毒基因组制备疫苗方法和应用
    CN105624146B (zh) 2015-05-28 2019-02-15 中国科学院微生物研究所 基于CRISPR/Cas9和酿酒酵母细胞内源的同源重组的分子克隆方法
    KR102451796B1 (ko) 2015-05-29 2022-10-06 노쓰 캐롤라이나 스테이트 유니버시티 크리스퍼 핵산을 사용하여 박테리아, 고세균, 조류 및 효모를 스크리닝하는 방법
    US20160346362A1 (en) 2015-05-29 2016-12-01 Agenovir Corporation Methods and compositions for treating cytomegalovirus infections
    JP2018516983A (ja) 2015-05-29 2018-06-28 アジェノビア コーポレーション ウイルス感染を処置するための組成物および方法
    JP2018516596A (ja) 2015-05-29 2018-06-28 アジェノビア コーポレーション 抗ウイルスの方法および組成物
    CA3000182A1 (en) 2015-05-29 2016-12-08 Agenovir Corporation Methods and compositions for treating cells for transplant
    US20160346360A1 (en) 2015-05-29 2016-12-01 Agenovir Corporation Compositions and methods for cell targeted hpv treatment
    EP3302556A4 (de) 2015-05-29 2018-12-05 Clark Atlanta University Menschliche zelllinienmutanten für zic2
    US10117911B2 (en) 2015-05-29 2018-11-06 Agenovir Corporation Compositions and methods to treat herpes simplex virus infections
    CA2987684A1 (en) 2015-06-01 2016-12-08 The Hospital For Sick Children Delivery of structurally diverse polypeptide cargo into mammalian cells by a bacterial toxin
    EA037359B1 (ru) 2015-06-01 2021-03-17 Тэмпл Юниверсити - Оф Зе Коммонвэлс Систем Оф Хайе Эдьюкейшн Способы и композиции для рнк-направляемого лечения инфекции, вызываемой вич
    CN105112445B (zh) 2015-06-02 2018-08-10 广州辉园苑医药科技有限公司 一种基于CRISPR-Cas9基因敲除技术的miR-205基因敲除试剂盒
    WO2016196655A1 (en) 2015-06-03 2016-12-08 The Regents Of The University Of California Cas9 variants and methods of use thereof
    WO2016196887A1 (en) 2015-06-03 2016-12-08 Board Of Regents Of The University Of Nebraska Dna editing using single-stranded dna
    US20180245074A1 (en) 2015-06-04 2018-08-30 Protiva Biotherapeutics, Inc. Treating hepatitis b virus infection using crispr
    US10626393B2 (en) 2015-06-04 2020-04-21 Arbutus Biopharma Corporation Delivering CRISPR therapeutics with lipid nanoparticles
    CN105039339B (zh) 2015-06-05 2017-12-19 新疆畜牧科学院生物技术研究所 一种以RNA介导的特异性敲除绵羊FecB基因的方法及其专用sgRNA
    US11279926B2 (en) 2015-06-05 2022-03-22 The Regents Of The University Of California Methods and compositions for generating CRISPR/Cas guide RNAs
    CN116334142A (zh) * 2015-06-09 2023-06-27 爱迪塔斯医药公司 用于改善移植的crispr/cas相关方法和组合物
    ES2961258T3 (es) 2015-06-10 2024-03-11 Firmenich & Cie Líneas celulares para el cribado de receptores de aroma y olor
    US20160362667A1 (en) 2015-06-10 2016-12-15 Caribou Biosciences, Inc. CRISPR-Cas Compositions and Methods
    ES2807440T3 (es) 2015-06-10 2021-02-23 Firmenich & Cie Procedimiento de identificación de compuestos de almizcle
    WO2016198500A1 (en) 2015-06-10 2016-12-15 INSERM (Institut National de la Santé et de la Recherche Médicale) Methods and compositions for rna-guided treatment of human cytomegalovirus (hcmv) infection
    WO2016197362A1 (zh) 2015-06-11 2016-12-15 深圳市第二人民医院 CRISPR-Cas9特异性敲除猪vWF基因的方法及用于特异性靶向vWF基因的sgRNA
    WO2016197360A1 (zh) 2015-06-11 2016-12-15 深圳市第二人民医院 CRISPR-Cas9特异性敲除猪GFRA1基因的方法及用于特异性靶向GFRA1基因的sgRNA
    CN105492608B (zh) 2015-06-11 2021-07-23 深圳市第二人民医院 CRISPR-Cas9特异性敲除猪PDX1基因的方法及用于特异性靶向PDX1基因的sgRNA
    CN105518134A (zh) 2015-06-11 2016-04-20 深圳市第二人民医院 CRISPR-Cas9特异性敲除猪SLA-2基因的方法及用于特异性靶向SLA-2基因的sgRNA
    CN105518139B (zh) 2015-06-11 2021-02-02 深圳市第二人民医院 CRISPR-Cas9特异性敲除猪FGL2基因的方法及用于特异性靶向FGL2基因的sgRNA
    CN106414740A (zh) 2015-06-11 2017-02-15 深圳市第二人民医院 CRISPR‑Cas9特异性敲除猪SLA‑3基因的方法及用于特异性靶向SLA‑3基因的sgRNA
    WO2016197361A1 (zh) 2015-06-11 2016-12-15 深圳市第二人民医院 CRISPR-Cas9特异性敲除猪GGTA1基因的方法及用于特异性靶向GGTA1基因的sgRNA
    CN105593367A (zh) 2015-06-11 2016-05-18 深圳市第二人民医院 CRISPR-Cas9特异性敲除猪SLA-1基因的方法及用于特异性靶向SLA-1基因的sgRNA
    WO2016197355A1 (zh) 2015-06-11 2016-12-15 深圳市第二人民医院 CRISPR-Cas9特异性敲除猪SALL1基因的方法及用于特异性靶向SALL1基因的sgRNA
    WO2016201138A1 (en) 2015-06-12 2016-12-15 The Regents Of The University Of California Reporter cas9 variants and methods of use thereof
    US20180187190A1 (en) 2015-06-12 2018-07-05 Erasmus University Medical Center Rotterdam New crispr assays
    GB201510296D0 (en) 2015-06-12 2015-07-29 Univ Wageningen Thermostable CAS9 nucleases
    CA2983874C (en) 2015-06-15 2022-06-21 North Carolina State University Methods and compositions for efficient delivery of nucleic acids and rna-based antimicrobials
    WO2016205623A1 (en) 2015-06-17 2016-12-22 North Carolina State University Methods and compositions for genome editing in bacteria using crispr-cas9 systems
    AU2016278959A1 (en) 2015-06-17 2018-01-18 The Uab Research Foundation CRISPR/Cas9 complex for introducing a functional polypeptide into cells of blood cell lineage
    EP3310932B1 (de) 2015-06-17 2023-08-30 The UAB Research Foundation Crispr/cas9-komplex für genomeditierung
    WO2016205728A1 (en) 2015-06-17 2016-12-22 Massachusetts Institute Of Technology Crispr mediated recording of cellular events
    WO2016205759A1 (en) 2015-06-18 2016-12-22 The Broad Institute Inc. Engineering and optimization of systems, methods, enzymes and guide scaffolds of cas9 orthologs and variants for sequence manipulation
    US9790490B2 (en) 2015-06-18 2017-10-17 The Broad Institute Inc. CRISPR enzymes and systems
    EP3800255A3 (de) 2015-06-18 2021-06-23 Robert D. Bowles Rna-geführte transkriptionsregulierung und verfahren zur verwendung davon zur behandlung von rückenschmerzen
    WO2016205749A1 (en) 2015-06-18 2016-12-22 The Broad Institute Inc. Novel crispr enzymes and systems
    WO2016205745A2 (en) 2015-06-18 2016-12-22 The Broad Institute Inc. Cell sorting
    CN109536474A (zh) 2015-06-18 2019-03-29 布罗德研究所有限公司 降低脱靶效应的crispr酶突变
    EP3430134B1 (de) 2015-06-18 2022-09-21 The Broad Institute, Inc. Neue crispr enzyme und systeme
    US9957501B2 (en) 2015-06-18 2018-05-01 Sangamo Therapeutics, Inc. Nuclease-mediated regulation of gene expression
    GB201511376D0 (en) 2015-06-29 2015-08-12 Ecolab Usa Inc Process for the treatment of produced water from chemical enhanced oil recovery
    US11279928B2 (en) 2015-06-29 2022-03-22 Massachusetts Institute Of Technology Compositions comprising nucleic acids and methods of using the same
    WO2017004261A1 (en) 2015-06-29 2017-01-05 Ionis Pharmaceuticals, Inc. Modified crispr rna and modified single crispr rna and uses thereof
    CA2986314C (en) 2015-06-30 2024-04-23 Cellectis Methods for improving functionality in nk cell by gene inactivation using specific endonuclease
    BR112017028201A2 (pt) 2015-07-02 2018-08-28 Univ Johns Hopkins tratamentos com base em crisp/cas9
    DK3320091T3 (da) 2015-07-06 2021-02-01 Dsm Ip Assets Bv Guide-rna-samlingsvektor
    US20170009242A1 (en) 2015-07-06 2017-01-12 Whitehead Institute For Biomedical Research CRISPR-Mediated Genome Engineering for Protein Depletion
    CN105132451B (zh) 2015-07-08 2019-07-23 电子科技大学 一种CRISPR/Cas9单一转录单元定向修饰骨架载体及其应用
    US20170014449A1 (en) 2015-07-13 2017-01-19 Elwha LLC, a limited liability company of the State of Delaware Site-specific epigenetic editing
    US20180200342A1 (en) 2015-07-13 2018-07-19 Institut Pasteur Improving sequence-specific antimicrobials by blocking dna repair
    CA2991301A1 (en) 2015-07-13 2017-01-19 Sangamo Therapeutics, Inc. Delivery methods and compositions for nuclease-mediated genome engineering
    EP3323890A4 (de) 2015-07-14 2019-01-30 Fukuoka University Verfahren zur induktion von ortsspezifischen rna-mutationen, im verfahren verwendete zieleditierungs-guide-rna und ziel-rna-zieleditierungs-guide-rna-komplex
    MA42895A (fr) 2015-07-15 2018-05-23 Juno Therapeutics Inc Cellules modifiées pour thérapie cellulaire adoptive
    CN108291218B (zh) 2015-07-15 2022-08-19 新泽西鲁特格斯州立大学 核酸酶非依赖性靶向基因编辑平台及其用途
    US20170020922A1 (en) 2015-07-16 2017-01-26 Batu Biologics Inc. Gene editing for immunological destruction of neoplasia
    WO2017015015A1 (en) 2015-07-17 2017-01-26 Emory University Crispr-associated protein from francisella and uses related thereto
    WO2017015101A1 (en) 2015-07-17 2017-01-26 University Of Washington Methods for maximizing the efficiency of targeted gene correction
    US10676735B2 (en) 2015-07-22 2020-06-09 Duke University High-throughput screening of regulatory element function with epigenome editing technologies
    WO2017015545A1 (en) 2015-07-22 2017-01-26 President And Fellows Of Harvard College Evolution of site-specific recombinases
    AU2016297167A1 (en) 2015-07-23 2018-02-22 Mayo Foundation For Medical Education And Research Editing mitochondrial DNA
    CA2993474A1 (en) 2015-07-25 2017-02-02 Habib FROST A system, device and a method for providing a therapy or a cure for cancer and other pathological states
    CN106399360A (zh) 2015-07-27 2017-02-15 上海药明生物技术有限公司 基于crispr技术敲除fut8基因的方法
    DK3329001T3 (da) 2015-07-28 2021-12-20 Danisco Us Inc Genomredigeringssystemer og anvendelsesfremgangsmåder
    CN105063061B (zh) 2015-07-28 2018-10-30 华南农业大学 一种水稻千粒重基因tgw6突变体及其制备方法与应用
    CN106701808A (zh) 2015-07-29 2017-05-24 深圳华大基因研究院 Dna聚合酶i缺陷型菌株及其构建方法
    US10612011B2 (en) 2015-07-30 2020-04-07 President And Fellows Of Harvard College Evolution of TALENs
    US10166255B2 (en) 2015-07-31 2019-01-01 Regents Of The University Of Minnesota Intracellular genomic transplant and methods of therapy
    US20200123533A1 (en) 2015-07-31 2020-04-23 The Trustees Of Columbia University In The City Of New York High-throughput strategy for dissecting mammalian genetic interactions
    WO2017023974A1 (en) 2015-08-03 2017-02-09 President And Fellows Of Harvard College Cas9 genome editing and transcriptional regulation
    WO2017024047A1 (en) 2015-08-03 2017-02-09 Emendobio Inc. Compositions and methods for increasing nuclease induced recombination rate in cells
    WO2017024318A1 (en) 2015-08-06 2017-02-09 Dana-Farber Cancer Institute, Inc. Targeted protein degradation to attenuate adoptive t-cell therapy associated adverse inflammatory responses
    BR112018002558A2 (pt) 2015-08-07 2018-09-25 Commw Scient Ind Res Org método para produção de um animal compreendendo uma modificação genética na linhagem germinativa
    US9580727B1 (en) 2015-08-07 2017-02-28 Caribou Biosciences, Inc. Compositions and methods of engineered CRISPR-Cas9 systems using split-nexus Cas9-associated polynucleotides
    CN104962523B (zh) 2015-08-07 2018-05-25 苏州大学 一种测定非同源末端连接修复活性的方法
    BR112018002600A2 (pt) 2015-08-11 2018-10-23 Cellectis células para imunoterapia modificadas para direcionamento ao antígeno cd38 e para inativação do gene cd38
    EP3334832A4 (de) 2015-08-14 2019-06-26 Institute Of Genetics And Developmental Biology, Chinese Academy Of Sciences Verfahren zur herstellung von glyphosatresistentem reis durch zielgerichtete nukleotidsubstitution
    CN105255937A (zh) 2015-08-14 2016-01-20 西北农林科技大学 一种真核细胞III型启动子表达CRISPR sgRNA的方法及其应用
    JP6986509B2 (ja) 2015-08-19 2021-12-22 アーク バイオ, エルエルシー 核酸ガイド化ヌクレアーゼをベースとした系を使用する核酸の捕捉
    CN107922953B (zh) 2015-08-20 2022-03-04 应用干细胞有限公司 提高基因编辑效率的核酸酶
    CN105112519A (zh) 2015-08-20 2015-12-02 郑州大学 一种基于crispr的大肠杆菌o157:h7菌株检测试剂盒及检测方法
    CN105177126B (zh) 2015-08-21 2018-12-04 东华大学 一种利用荧光pcr技术对小鼠的分型鉴定方法
    ES2929110T3 (es) 2015-08-25 2022-11-24 Univ Duke Composiciones y métodos para mejorar la especificidad en ingeniería genética usando endonucleasas guiadas por ARN
    CN106480083B (zh) 2015-08-26 2021-12-14 中国科学院分子植物科学卓越创新中心 CRISPR/Cas9介导的大片段DNA拼接方法
    US9512446B1 (en) 2015-08-28 2016-12-06 The General Hospital Corporation Engineered CRISPR-Cas9 nucleases
    US9926546B2 (en) 2015-08-28 2018-03-27 The General Hospital Corporation Engineered CRISPR-Cas9 nucleases
    WO2017040348A1 (en) 2015-08-28 2017-03-09 The General Hospital Corporation Engineered crispr-cas9 nucleases
    WO2017040709A1 (en) 2015-08-31 2017-03-09 Caribou Biosciences, Inc. Directed nucleic acid repair
    WO2017040511A1 (en) 2015-08-31 2017-03-09 Agilent Technologies, Inc. Compounds and methods for crispr/cas-based genome editing by homologous recombination
    CN105087620B (zh) 2015-08-31 2017-12-29 中国农业大学 一种过表达猪共刺激受体4‑1bb载体及其应用
    AU2016316027B2 (en) 2015-09-01 2022-04-07 Dana-Farber Cancer Institute Inc. Systems and methods for selection of gRNA targeting strands for Cas9 localization
    EP3344756A4 (de) 2015-09-02 2019-09-04 University of Massachusetts Nachweis von genloci mit crispr-arrayed-repeats und/oder polychromatischen single-guide-ribonukleinsäuren
    WO2017040786A1 (en) 2015-09-04 2017-03-09 Massachusetts Institute Of Technology Multilayer genetic safety kill circuits based on single cas9 protein and multiple engineered grna in mammalian cells
    CN105400810B (zh) 2015-09-06 2019-05-07 吉林大学 采用敲除技术建立低磷性佝偻病模型的方法
    WO2017044419A1 (en) 2015-09-08 2017-03-16 University Of Massachusetts Dnase h activity of neisseria meningitidis cas9
    CA2998087A1 (en) 2015-09-09 2017-03-16 National University Corporation Kobe University Method for modifying genome sequence that specifically converts nucleobase of targeted dna sequence, and molecular complex used in said method
    ES2938623T3 (es) 2015-09-09 2023-04-13 Univ Kobe Nat Univ Corp Método para convertir una secuencia del genoma de una bacteria gram-positiva mediante una conversión específica de una base de ácido nucleico de una secuencia de ADN seleccionada como diana y el complejo molecular utilizado en el mismo
    CN108291224A (zh) 2015-09-10 2018-07-17 优美佳生物技术有限公司 用于治疗青光眼的方法和组合物
    WO2017044776A1 (en) 2015-09-10 2017-03-16 Texas Tech University System Single-guide rna (sgrna) with improved knockout efficiency
    CN105274144A (zh) 2015-09-14 2016-01-27 徐又佳 通过CRISPR/Cas9技术得到敲除铁调素基因斑马鱼的制备方法
    US10109551B2 (en) 2015-09-15 2018-10-23 Intel Corporation Methods and apparatuses for determining a parameter of a die
    US10301613B2 (en) 2015-09-15 2019-05-28 Arizona Board Of Regents On Behalf Of Arizona State University Targeted remodeling of prokaryotic genomes using CRISPR-nickases
    CN105210981B (zh) 2015-09-15 2018-09-28 中国科学院生物物理研究所 建立可应用于人类疾病研究的雪貂模型的方法及其应用
    CN105112422B (zh) 2015-09-16 2019-11-08 中山大学 基因miR408和UCL在培育高产水稻中的应用
    WO2017049129A2 (en) 2015-09-18 2017-03-23 President And Fellows Of Harvard College Methods of making guide rna
    WO2017053312A1 (en) 2015-09-21 2017-03-30 The Regents Of The University Of California Compositions and methods for target nucleic acid modification
    CN105132427B (zh) 2015-09-21 2019-01-08 新疆畜牧科学院生物技术研究所 一种以RNA介导的特异性敲除双基因获得基因编辑绵羊的方法及其专用sgRNA
    US10369232B2 (en) 2015-09-21 2019-08-06 Arcturus Therapeutics, Inc. Allele selective gene editing and uses thereof
    EP3352776A4 (de) 2015-09-23 2019-03-13 Sangamo Therapeutics, Inc. Htt-repressoren und verwendungen davon
    EP3337909B1 (de) 2015-09-24 2020-03-18 Sigma Aldrich Co. LLC Verfahren und reagenzien für molekulare annäherungserkennung mit rna-geführten nukleinsäurebindenden proteine
    US11667911B2 (en) 2015-09-24 2023-06-06 Editas Medicine, Inc. Use of exonucleases to improve CRISPR/CAS-mediated genome editing
    WO2017064546A1 (en) 2015-09-24 2017-04-20 Crispr Therapeutics Ag Novel family of rna-programmable endonucleases and their uses in genome editing and other applications
    KR101795999B1 (ko) 2015-09-25 2017-11-09 전남대학교산학협력단 Crispr/cas9 시스템을 이용한 베타2-마이크로글로불린 유전자 제거용 시발체
    WO2017053729A1 (en) 2015-09-25 2017-03-30 The Board Of Trustees Of The Leland Stanford Junior University Nuclease-mediated genome editing of primary cells and enrichment thereof
    KR101745863B1 (ko) 2015-09-25 2017-06-12 전남대학교산학협력단 Crispr/cas9 시스템을 이용한 프로히비틴2 유전자 제거용 시발체
    EP3353309A4 (de) 2015-09-25 2019-04-10 Tarveda Therapeutics, Inc. Zusammensetzungen und verfahren zur genomeditierung
    EP3147363B1 (de) 2015-09-26 2019-10-16 B.R.A.I.N. Ag Aktivierung von geschmacksrezeptorgenen in säugetierzellen mit hilfe von crispr-cas-9
    EP3356521A4 (de) 2015-09-28 2019-03-13 Temple University - Of The Commonwealth System of Higher Education Verfahren und zusammensetzungen zur rna-geführten behandlung von hiv-infektionen
    US20170087225A1 (en) 2015-09-29 2017-03-30 Agenovir Corporation Compositions and methods for latent viral transcription regulation
    US20170088587A1 (en) 2015-09-29 2017-03-30 Agenovir Corporation Antiviral fusion proteins and genes
    CN105177038B (zh) 2015-09-29 2018-08-24 中国科学院遗传与发育生物学研究所 一种高效定点编辑植物基因组的CRISPR/Cas9系统
    CN108601883A (zh) 2015-09-29 2018-09-28 埃吉诺维亚公司 递送方法和组合物
    WO2017058791A1 (en) 2015-09-29 2017-04-06 Agenovir Corporation Compositions and methods for treatment of latent viral infections
    CN105331627B (zh) 2015-09-30 2019-04-02 华中农业大学 一种利用内源CRISPR-Cas系统进行原核生物基因组编辑的方法
    EP3356520B1 (de) 2015-10-02 2022-03-23 The U.S.A. as represented by the Secretary, Department of Health and Human Services Lentivirales protein übertragungssystem zum rna-vermittelten genomeditieren
    CA3004710A1 (en) 2015-10-06 2017-04-13 The Children's Hospital Of Philadelphia Compositions and methods for treating fragile x syndrome and related syndromes
    WO2017062754A1 (en) 2015-10-07 2017-04-13 New York University Compositions and methods for enhancing crispr activity by polq inhibition
    WO2017062886A1 (en) 2015-10-08 2017-04-13 Cellink Corporation Battery interconnects
    WO2017062723A1 (en) 2015-10-08 2017-04-13 President And Fellows Of Harvard College Multiplexed genome editing
    AU2016335572B2 (en) 2015-10-09 2022-12-08 The Children's Hospital Of Philadelphia Compositions and methods for treating Huntington's disease and related disorders
    WO2017062855A1 (en) 2015-10-09 2017-04-13 Monsanto Technology Llc Novel rna-guided nucleases and uses thereof
    WO2017066175A1 (en) 2015-10-12 2017-04-20 E. I. Du Pont De Nemours And Company Protected dna templates for gene modification and increased homologous recombination in cells and methods of use
    EP4089175A1 (de) 2015-10-13 2022-11-16 Duke University Genom-engineering mit typ-i-crispr-systemen in eukaryotischen zellen
    WO2017066707A1 (en) 2015-10-14 2017-04-20 Life Technologies Corporation Ribonucleoprotein transfection agents
    CN105400779A (zh) 2015-10-15 2016-03-16 芜湖医诺生物技术有限公司 嗜热链球菌CRISPR-Cas9系统识别的人CCR5基因的靶序列和sgRNA及其应用
    FR3042506B1 (fr) 2015-10-16 2018-11-30 IFP Energies Nouvelles Outil genetique de transformation de bacteries clostridium
    AU2016337408B2 (en) 2015-10-16 2022-11-03 Astrazeneca Ab Inducible modification of a cell genome
    CN108778343A (zh) 2015-10-16 2018-11-09 天普大学-联邦高等教育系统 利用cpf1进行rna向导的基因编辑的方法和组合物
    CN105331607A (zh) 2015-10-19 2016-02-17 芜湖医诺生物技术有限公司 嗜热链球菌CRISPR-Cas9系统识别的人CCR5基因的靶序列和sgRNA及其应用
    EP3365269A4 (de) 2015-10-19 2019-06-19 The Methodist Hospital Crispr-cas9-abgabe an schwer zu transfizierende zellen durch membranverformung
    WO2017068077A1 (en) 2015-10-20 2017-04-27 Institut National De La Sante Et De La Recherche Medicale (Inserm) Methods and products for genetic engineering
    CA2996326A1 (en) 2015-10-20 2017-04-27 Pioneer Hi-Bred International, Inc. Methods and compositions for marker-free genome modification
    CN105331608A (zh) 2015-10-20 2016-02-17 芜湖医诺生物技术有限公司 脑膜炎双球菌CRISPR-Cas9系统识别的人CXCR4基因的靶序列和sgRNA及其应用
    CN105316337A (zh) 2015-10-20 2016-02-10 芜湖医诺生物技术有限公司 嗜热链球菌CRISPR-Cas9系统识别的人CXCR4基因的靶序列和sgRNA及其应用
    CN105331609A (zh) 2015-10-20 2016-02-17 芜湖医诺生物技术有限公司 脑膜炎双球菌CRISPR-Cas9系统识别的人CCR5基因的靶序列和sgRNA及其应用
    CN105316324A (zh) 2015-10-20 2016-02-10 芜湖医诺生物技术有限公司 嗜热链球菌CRISPR-Cas9系统识别的人CXCR4基因的靶序列和sgRNA及其应用
    AU2016341919A1 (en) 2015-10-21 2018-04-19 Editas Medicine, Inc. CRISPR/CAS-related methods and compositions for treating hepatitis b virus
    CN105219799A (zh) 2015-10-22 2016-01-06 天津吉诺沃生物科技有限公司 一种基于CRISPR/Cas系统的多年生黑麦草的育种方法
    CN116814590A (zh) 2015-10-22 2023-09-29 布罗德研究所有限公司 Vi-b型crispr酶和系统
    DK3350327T3 (en) 2015-10-23 2019-01-21 Caribou Biosciences Inc CONSTRUCTED CRISPR CLASS-2-NUCLEIC ACID TARGETING-NUCLEIC ACID
    EP3159407A1 (de) 2015-10-23 2017-04-26 Silence Therapeutics (London) Ltd Guide-rnas, verfahren und verwendungen
    EP3365356B1 (de) 2015-10-23 2023-06-28 President and Fellows of Harvard College Nukleobaseeditoren und deren verwendungen
    TW201715041A (zh) 2015-10-26 2017-05-01 國立清華大學 細菌基因編輯方法
    US9988637B2 (en) 2015-10-26 2018-06-05 National Tsing Hua Univeristy Cas9 plasmid, genome editing system and method of Escherichia coli
    US10280411B2 (en) 2015-10-27 2019-05-07 Pacific Biosciences of California, In.c Methods, systems, and reagents for direct RNA sequencing
    KR20180091821A (ko) 2015-10-27 2018-08-16 리컴비네틱스 인코포레이티드 유전적 상보성에 의한 인간화 car t-세포 및 혈소판의 조작방법
    WO2017072590A1 (en) 2015-10-28 2017-05-04 Crispr Therapeutics Ag Materials and methods for treatment of duchenne muscular dystrophy
    US20180230489A1 (en) 2015-10-28 2018-08-16 Voyager Therapeutics, Inc. Regulatable expression using adeno-associated virus (aav)
    WO2017074526A1 (en) 2015-10-28 2017-05-04 Sangamo Biosciences, Inc. Liver-specific constructs, factor viii expression cassettes and methods of use thereof
    WO2017074962A1 (en) 2015-10-30 2017-05-04 Brandeis University Modified cas9 compositions and methods of use
    CN109312338B (zh) 2015-10-30 2022-09-27 爱迪塔斯医药公司 治疗单纯疱疹病毒的crispr/cas相关方法及组合物
    CN105238806B (zh) 2015-11-02 2018-11-27 中国科学院天津工业生物技术研究所 一种用于微生物的CRISPR/Cas9基因编辑载体的构建及其应用
    CN105316327B (zh) 2015-11-03 2019-01-29 中国农业科学院作物科学研究所 小麦TaAGO4a基因CRISPR/Cas9载体及其应用
    SG11201803701YA (en) 2015-11-04 2018-06-28 Univ Pennsylvania Methods and compositions for gene editing in hematopoietic stem cells
    WO2017079428A1 (en) 2015-11-04 2017-05-11 President And Fellows Of Harvard College Site specific germline modification
    ES2953925T3 (es) 2015-11-04 2023-11-17 Fate Therapeutics Inc Ingeniería genómica de células pluripotentes
    GB2544270A (en) 2015-11-05 2017-05-17 Fundació Centre De Regulació Genòmica Nucleic acids, peptides and methods
    EP3371300A1 (de) 2015-11-05 2018-09-12 Centro en Investigación Biomédica en Red Verfahren zum gen-editing von zellen, die aus einer person isoliert wurden, die an einer die erythroide lineage beeinflussenden stoffwechselerkrankung leidet, durch besagtes verfahren erhaltene zellen und verwendungen davon
    CA3004497A1 (en) 2015-11-06 2017-05-11 The Jackson Laboratory Large genomic dna knock-in and uses thereof
    WO2017078751A1 (en) 2015-11-06 2017-05-11 The Methodist Hospital Micoluidic cell deomailiy assay for enabling rapid and efficient kinase screening via the crispr-cas9 system
    WO2017081097A1 (en) 2015-11-09 2017-05-18 Ifom Fondazione Istituto Firc Di Oncologia Molecolare Crispr-cas sgrna library
    WO2017083722A1 (en) 2015-11-11 2017-05-18 Greenberg Kenneth P Crispr compositions and methods of using the same for gene therapy
    US11566052B2 (en) 2015-11-11 2023-01-31 Lonza Ltd. CRISPR-associated (Cas) proteins with reduced immunogenicity
    US10851367B2 (en) 2015-11-12 2020-12-01 Pfizer Inc. Tissue-specific genome engineering using CRISPR-Cas9
    US11306308B2 (en) 2015-11-13 2022-04-19 Massachusetts Institute Of Technology High-throughput CRISPR-based library screening
    US20170191047A1 (en) 2015-11-13 2017-07-06 University Of Georgia Research Foundation, Inc. Adenosine-specific rnase and methods of use
    KR101885901B1 (ko) 2015-11-13 2018-08-07 기초과학연구원 5' 말단의 인산기가 제거된 rna를 포함하는 리보핵산단백질 전달용 조성물
    JP7418957B2 (ja) 2015-11-16 2024-01-22 リサーチ インスティチュート アット ネイションワイド チルドレンズ ホスピタル タイチン系ミオパチー及び他のタイチノパチーの治療のための材料及び方法
    CN106893739A (zh) 2015-11-17 2017-06-27 香港中文大学 用于靶向基因操作的新方法和系统
    CN105602987A (zh) 2015-11-23 2016-05-25 深圳市默赛尔生物医学科技发展有限公司 一种高效的dc细胞xbp1基因敲除方法
    WO2017091630A1 (en) 2015-11-23 2017-06-01 The Regents Of The University Of California Tracking and manipulating cellular rna via nuclear delivery of crispr/cas9
    US20170145438A1 (en) 2015-11-24 2017-05-25 University Of South Carolina Viral Vectors for Gene Editing
    JP6500293B2 (ja) 2015-11-25 2019-04-17 国立大学法人群馬大学 Dnaメチル化編集用キットおよびdnaメチル化編集方法
    US10240145B2 (en) 2015-11-25 2019-03-26 The Board Of Trustees Of The Leland Stanford Junior University CRISPR/Cas-mediated genome editing to treat EGFR-mutant lung cancer
    US20180346940A1 (en) 2015-11-27 2018-12-06 The Regents Of The University Of California Compositions and methods for the production of hydrocarbons, hydrogen and carbon monoxide using engineered azotobacter strains
    CN105505979A (zh) 2015-11-28 2016-04-20 湖北大学 一种以CRISPR/Cas9基因编辑技术打靶Badh2基因获得香稻品系的方法
    CN106811479B (zh) 2015-11-30 2019-10-25 中国农业科学院作物科学研究所 利用CRISPR/Cas9系统定点修饰ALS基因获得抗除草剂水稻的系统及其应用
    KR101906491B1 (ko) 2015-11-30 2018-12-05 기초과학연구원 F. novicida 유래 Cas9을 포함하는 유전체 교정용 조성물
    CN105296518A (zh) 2015-12-01 2016-02-03 中国农业大学 一种用于CRISPR/Cas9技术的同源臂载体构建方法
    RU2634395C1 (ru) 2015-12-01 2017-10-26 Федеральное государственное автономное образовательное учреждение высшего профессионального образования "Балтийский Федеральный Университет имени Иммануила Канта" (БФУ им. И. Канта) Генетическая конструкция на основе системы редактирования генома crispr/cas9, кодирующая нуклеазу cas9, специфически импортируемую в митохондрии клеток человека
    WO2017096237A1 (en) 2015-12-02 2017-06-08 Ceres, Inc. Methods for genetic modification of plants
    EP3383409A4 (de) 2015-12-02 2019-10-02 The Regents of The University of California Zusammensetzungen und verfahren zur modifizierung einer zielnukleinsäure
    WO2017093370A1 (en) 2015-12-03 2017-06-08 Technische Universität München T-cell specific genome editing
    CN105779449B (zh) 2015-12-04 2018-11-27 新疆农业大学 一种棉花启动子GbU6-5PS及应用
    CN105779448B (zh) 2015-12-04 2018-11-27 新疆农业大学 一种棉花启动子GbU6-7PS及应用
    JP2018536436A (ja) 2015-12-04 2018-12-13 ノバルティス アーゲー 免疫腫瘍学のための組成物および方法
    CN105462968B (zh) 2015-12-07 2018-10-16 北京信生元生物医学科技有限公司 一种靶向apoCⅢ的CRISPR-Cas9系统及其应用
    CN106845151B (zh) 2015-12-07 2019-03-26 中国农业大学 CRISPR-Cas9系统sgRNA作用靶点的筛选方法及装置
    WO2017100431A2 (en) 2015-12-09 2017-06-15 Excision Biotherapeutics, Inc. Gene editing methods and compositions for eliminating risk of jc virus activation and pml (progressive multifocal leukoencephalopathy) during immunosuppresive therapy
    CN105463003A (zh) 2015-12-11 2016-04-06 扬州大学 一种消除卡那霉素耐药基因活性的重组载体及其构建方法
    EP3387134B1 (de) 2015-12-11 2020-10-14 Danisco US Inc. Verfahren und zusammensetzungen für verbesserte nukleasevermittelte genommodifizierung und verringerte off-target-nebenwirkungen
    CN105296537A (zh) 2015-12-12 2016-02-03 西南大学 一种基于睾丸内注射的基因定点编辑技术
    CN105400773B (zh) 2015-12-14 2018-06-26 同济大学 应用于大规模筛选癌症基因的CRISPR/Cas9富集测序方法
    WO2017105350A1 (en) 2015-12-14 2017-06-22 Cellresearch Corporation Pte Ltd A method of generating a mammalian stem cell carrying a transgene, a mammalian stem cell generated by the method and pharmaceuticals uses of the mammalian stem cell
    NO343153B1 (en) 2015-12-17 2018-11-19 Hydra Systems As A method of assessing the integrity status of a barrier plug
    CN105463027A (zh) 2015-12-17 2016-04-06 中国农业大学 一种高肌肉量及肥厚型心肌病模型克隆猪的制备方法
    WO2017106616A1 (en) 2015-12-17 2017-06-22 The Regents Of The University Of Colorado, A Body Corporate Varicella zoster virus encoding regulatable cas9 nuclease
    IL297018A (en) 2015-12-18 2022-12-01 Sangamo Therapeutics Inc Directed cleavage of cell mhc receptor
    WO2017106657A1 (en) 2015-12-18 2017-06-22 The Broad Institute Inc. Novel crispr enzymes and systems
    US11118194B2 (en) 2015-12-18 2021-09-14 The Regents Of The University Of California Modified site-directed modifying polypeptides and methods of use thereof
    JP2018537106A (ja) 2015-12-18 2018-12-20 ダニスコ・ユーエス・インク ポリメラーゼII(Pol−II)ベースのガイドRNA発現のための方法および組成物
    US11352631B2 (en) 2015-12-18 2022-06-07 Sangamo Therapeutics, Inc. Targeted disruption of the T cell receptor
    EP3390631B1 (de) 2015-12-18 2020-04-08 Danisco US Inc. Verfahren und zusammensetzungen zur t-rna-basierten guide-rna-expression
    JP6700306B2 (ja) 2015-12-18 2020-05-27 国立研究開発法人科学技術振興機構 受精前の卵細胞、受精卵、及び標的遺伝子の改変方法
    WO2017106767A1 (en) 2015-12-18 2017-06-22 The Scripps Research Institute Production of unnatural nucleotides using a crispr/cas9 system
    WO2017109134A1 (en) 2015-12-22 2017-06-29 Curevac Ag Method for producing rna molecule compositions
    WO2017112620A1 (en) 2015-12-22 2017-06-29 North Carolina State University Methods and compositions for delivery of crispr based antimicrobials
    AU2016376191A1 (en) 2015-12-23 2018-07-12 Crispr Therapeutics Ag Materials and methods for treatment of amyotrophic lateral sclerosis and/or frontal temporal lobular degeneration
    CN105543270A (zh) 2015-12-24 2016-05-04 中国农业科学院作物科学研究所 双抗性CRISPR/Cas9载体及应用
    CN105543266A (zh) 2015-12-25 2016-05-04 安徽大学 一种维吉尼亚链霉菌IBL14中的CRISPR-Cas系统及应用其进行基因编辑的方法
    CN105505976A (zh) 2015-12-25 2016-04-20 安徽大学 一种维吉尼亚链霉菌ibl14产青霉素重组菌株的构建方法
    JP2019500043A (ja) 2015-12-28 2019-01-10 ノバルティス アーゲー 異常ヘモグロビン症の治療用組成物および方法
    CN115216459A (zh) 2015-12-29 2022-10-21 孟山都技术公司 新型crispr相关转座酶及其用途
    CN105441451B (zh) 2015-12-31 2019-03-22 暨南大学 一种特异靶向人ABCB1基因的sgRNA导向序列及应用
    CN105567735A (zh) 2016-01-05 2016-05-11 华东师范大学 一种凝血因子基因突变的定点修复载体系统及方法
    EP3400296A1 (de) 2016-01-08 2018-11-14 Novozymes A/S Genomeditierung bei bacillus-wirtszellen
    US11441146B2 (en) 2016-01-11 2022-09-13 Christiana Care Health Services, Inc. Compositions and methods for improving homogeneity of DNA generated using a CRISPR/Cas9 cleavage system
    CN105647922A (zh) 2016-01-11 2016-06-08 中国人民解放军疾病预防控制所 基于一种新gRNA序列的CRISPR-Cas9系统在制备乙肝治疗药物中的应用
    US11427837B2 (en) 2016-01-12 2022-08-30 The Regents Of The University Of California Compositions and methods for enhanced genome editing
    CN108779471A (zh) 2016-01-14 2018-11-09 孟菲斯肉类公司 用于延长体细胞在离体培养过程中的复制能力的方法
    WO2017123910A1 (en) 2016-01-14 2017-07-20 The Brigham And Women's Hospital, Inc. Genome editing for treating glioblastoma
    EP3402327A1 (de) 2016-01-15 2018-11-21 The Jackson Laboratory Genetisch modifizierte nichtmenschliche säuger durch multizyklus-elektroporation des cas9-proteins
    CN105567734A (zh) 2016-01-18 2016-05-11 丹弥优生物技术(湖北)有限公司 一种基因组dna序列精准编辑方法
    WO2017126987A1 (ru) 2016-01-18 2017-07-27 Анатолий Викторович ЗАЗУЛЯ Эритроциты для направленного транспорта лекарственного средства
    CN105567738A (zh) 2016-01-18 2016-05-11 南开大学 使用基因组编辑技术CRISPR-Cas9诱导CCR5Δ32缺失的方法
    US20190264186A1 (en) 2016-01-22 2019-08-29 The Broad Institute Inc. Crystal structure of crispr cpf1
    CN105567689B (zh) 2016-01-25 2019-04-09 重庆威斯腾生物医药科技有限责任公司 CRISPR/Cas9靶向敲除人TCAB1基因及其特异性gRNA
    WO2018106268A1 (en) 2016-01-25 2018-06-14 Excision Biotherapeutics Rna guided eradication of human jc virus and other polyomaviruses
    CN105543228A (zh) 2016-01-25 2016-05-04 宁夏农林科学院 一种快速将水稻转化为香稻的方法
    CA3011874A1 (en) 2016-01-25 2017-08-03 Excision Biotherapeutics, Inc. Methods and compositions for rna-guided treatment of hiv infection
    EP3199632A1 (de) 2016-01-26 2017-08-02 ACIB GmbH Temperaturinduzierbares crispr-/cas-system
    CN105567688A (zh) 2016-01-27 2016-05-11 武汉大学 一种可用于艾滋病基因治疗的CRISPR/SaCas9系统
    ES2949163T3 (es) 2016-01-29 2023-09-26 Univ Princeton Inteínas divididas con actividad de corte y empalme excepcional
    JP6800171B2 (ja) 2016-01-30 2020-12-16 株式会社ボナック 人工単一ガイドrna及びその用途
    CN105647968B (zh) 2016-02-02 2019-07-23 浙江大学 一种CRISPR/Cas9工作效率快速测试系统及其应用
    CN107022562B (zh) 2016-02-02 2020-07-17 中国种子集团有限公司 利用CRISPR/Cas9系统对玉米基因定点突变的方法
    WO2017136794A1 (en) 2016-02-03 2017-08-10 Massachusetts Institute Of Technology Structure-guided chemical modification of guide rna and its applications
    CN105671083B (zh) 2016-02-03 2017-09-29 安徽柯顿生物科技有限公司 PD‑1基因重组病毒质粒及构建、重组逆转录病毒Lenti‑PD‑1‑Puro及包装与应用
    WO2017136520A1 (en) 2016-02-04 2017-08-10 President And Fellows Of Harvard College Mitochondrial genome editing and regulation
    US20190038780A1 (en) 2016-02-05 2019-02-07 Regents Of The University Of Minnesota Vectors and system for modulating gene expression
    WO2017139264A1 (en) 2016-02-09 2017-08-17 President And Fellows Of Harvard College Dna-guided gene editing and regulation
    EP3413908A4 (de) 2016-02-11 2019-09-25 The Regents of The University of California Verfahren und zusammensetzungen zur modifikation eines mutanten dystrophingens in einem zellgenom
    RU2016104674A (ru) 2016-02-11 2017-08-16 Анатолий Викторович Зазуля Устройство модификации эритроцита с механизмом направленного транспорта лекарственного средства для функций генной терапии crispr/cas9
    CN105647962A (zh) 2016-02-15 2016-06-08 浙江大学 运用CRISPR-Cas9系统敲除水稻MIRNA393b茎环序列的基因编辑方法
    WO2017142835A1 (en) 2016-02-15 2017-08-24 Temple University - Of The Commonwealth System Of Higher Education Excision of retroviral nucleic acid sequences
    US9896696B2 (en) 2016-02-15 2018-02-20 Benson Hill Biosystems, Inc. Compositions and methods for modifying genomes
    CN105594664B (zh) 2016-02-16 2018-10-02 湖南师范大学 一种基因敲除选育stat1a基因缺失型斑马鱼的方法
    JP2019508037A (ja) 2016-02-16 2019-03-28 イェール ユニバーシティーYale Universit 標的化遺伝子編集を増強するための組成物およびその使用方法
    CN105647969B (zh) 2016-02-16 2020-12-15 湖南师范大学 一种基因敲除选育stat1a基因缺失型斑马鱼的方法
    CN105624187A (zh) 2016-02-17 2016-06-01 天津大学 酿酒酵母基因组定点突变的方法
    US11326161B2 (en) 2016-02-18 2022-05-10 President And Fellows Of Harvard College Methods and systems of molecular recording by CRISPR-Cas system
    EP3420080B1 (de) 2016-02-22 2019-08-21 Caribou Biosciences, Inc. Verfahren zur modulation von dna-reparaturergebnissen
    US20170275665A1 (en) 2016-02-24 2017-09-28 Board Of Regents, The University Of Texas System Direct crispr spacer acquisition from rna by a reverse-transcriptase-cas1 fusion protein
    CN105646719B (zh) 2016-02-24 2019-12-20 无锡市妇幼保健院 一种高效定点转基因的工具及其应用
    WO2017147278A1 (en) 2016-02-25 2017-08-31 The Children's Medical Center Corporation Customized class switch of immunoglobulin genes in lymphoma and hybridoma by crispr/cas9 technology
    EP3420077A4 (de) 2016-02-25 2019-12-25 Agenovir Corporation Virale und onkovirale nukleasebehandlung
    US20170246260A1 (en) 2016-02-25 2017-08-31 Agenovir Corporation Modified antiviral nuclease
    US20170247703A1 (en) 2016-02-25 2017-08-31 Agenovir Corporation Antiviral nuclease methods
    KR20180110144A (ko) 2016-02-26 2018-10-08 란자테크 뉴질랜드 리미티드 C1-고정 박테리아에 대한 crispr/cas 시스템
    US10538750B2 (en) 2016-02-29 2020-01-21 Agilent Technologies, Inc. Methods and compositions for blocking off-target nucleic acids from cleavage by CRISPR proteins
    US11447768B2 (en) 2016-03-01 2022-09-20 University Of Florida Research Foundation, Incorporated Molecular cell diary system
    CN105671070B (zh) 2016-03-03 2019-03-19 江南大学 一种用于枯草芽孢杆菌基因组编辑的CRISPRCas9系统及其构建方法
    KR102587132B1 (ko) 2016-03-04 2023-10-11 에디타스 메디신, 인코포레이티드 암 면역요법을 위한 crispr-cpf1-관련 방법, 조성물 및 구성성분
    CN105821039B (zh) 2016-03-09 2020-02-07 李旭 联合免疫基因抑制HBV复制的特异性sgRNA、表达载体及其应用
    CN105821040B (zh) 2016-03-09 2018-12-14 李旭 联合免疫基因抑制高危型HPV表达的sgRNA、基因敲除载体及其应用
    CN107177591A (zh) 2016-03-09 2017-09-19 北京大学 利用CRISPR技术编辑CCR5基因的sgRNA序列及其用途
    CN105861547A (zh) 2016-03-10 2016-08-17 黄捷 身份证号码永久嵌入基因组的方法
    WO2017155717A1 (en) 2016-03-11 2017-09-14 Pioneer Hi-Bred International, Inc. Novel cas9 systems and methods of use
    WO2017160752A1 (en) 2016-03-14 2017-09-21 Intellia Therapeutics, Inc. Methods and compositions for gene editing
    KR102532663B1 (ko) 2016-03-14 2023-05-16 에디타스 메디신, 인코포레이티드 베타 이상헤모글로빈증의 치료를 위한 crispr/cas-관련 방법 및 조성물
    US11530394B2 (en) 2016-03-15 2022-12-20 University Of Massachusetts Anti-CRISPR compounds and methods of use
    CN108885048B (zh) 2016-03-15 2020-10-23 开利公司 冷藏销售柜
    EP3219799A1 (de) 2016-03-17 2017-09-20 IMBA-Institut für Molekulare Biotechnologie GmbH Bedingte crispr-sgrna-expression
    US20200291370A1 (en) 2016-03-18 2020-09-17 President And Fellows Of Harvard College Mutant Cas Proteins
    WO2017165862A1 (en) 2016-03-25 2017-09-28 Editas Medicine, Inc. Systems and methods for treating alpha 1-antitrypsin (a1at) deficiency
    US11597924B2 (en) 2016-03-25 2023-03-07 Editas Medicine, Inc. Genome editing systems comprising repair-modulating enzyme molecules and methods of their use
    CN106047803A (zh) 2016-03-28 2016-10-26 青岛市胶州中心医院 CRISPR/Cas9靶向敲除兔BMP2基因的细胞模型及其应用
    WO2017172644A2 (en) 2016-03-28 2017-10-05 The Charles Stark Draper Laboratory, Inc. Bacteria identification and antibiotic susceptibility profiling device
    EP3436578B1 (de) 2016-03-30 2022-01-19 F. Hoffmann-La Roche AG Verbesserte sortase
    KR102617874B1 (ko) 2016-03-30 2023-12-22 인텔리아 테라퓨틱스, 인크. Crispr/cas 성분을 위한 지질 나노입자 제제
    WO2017173004A1 (en) 2016-03-30 2017-10-05 Mikuni Takayasu A method for in vivo precise genome editing
    GB2565461B (en) 2016-03-31 2022-04-13 Harvard College Methods and compositions for the single tube preparation of sequencing libraries using Cas9
    WO2017173092A1 (en) 2016-03-31 2017-10-05 The Regents Of The University Of California Methods for genome editing in zygotes
    US10597586B2 (en) 2016-03-31 2020-03-24 Exxonmobil Chemical Patents Inc. Burner, furnace, and steam cracking processes using the same
    CN106167525B (zh) 2016-04-01 2019-03-19 北京康明百奥新药研发有限公司 筛选超低岩藻糖细胞系的方法和应用
    US10301619B2 (en) 2016-04-01 2019-05-28 New England Biolabs, Inc. Compositions and methods relating to synthetic RNA polynucleotides created from synthetic DNA oligonucleotides
    CN109072191B (zh) 2016-04-04 2024-03-22 苏黎世联邦理工学院 用于蛋白生产和文库产生的哺乳动物细胞系
    US20190093091A1 (en) 2016-04-06 2019-03-28 Temple University - Of The Commonwealth System Of Higher Education Compositions for eradicating flavivirus infections in subjects
    CN105802980A (zh) 2016-04-08 2016-07-27 北京大学 Gateway兼容性CRISPR/Cas9系统及其应用
    CN106399306B (zh) 2016-04-12 2019-11-05 西安交通大学第一附属医院 靶向人lncRNA-UCA1抑制膀胱癌的sgRNA、基因载体及其应用
    WO2017180694A1 (en) 2016-04-13 2017-10-19 Editas Medicine, Inc. Cas9 fusion molecules gene editing systems, and methods of use thereof
    WO2017180711A1 (en) 2016-04-13 2017-10-19 Editas Medicine, Inc. Grna fusion molecules, gene editing systems, and methods of use thereof
    US20190127713A1 (en) 2016-04-13 2019-05-02 Duke University Crispr/cas9-based repressors for silencing gene targets in vivo and methods of use
    EP3443085B1 (de) 2016-04-14 2022-09-14 BOCO Silicon Valley, Inc. Genomänderung von menschlichen neuronalen stammzellen unter verwendung von nukleasen
    EP3442596A1 (de) 2016-04-14 2019-02-20 Université de Lausanne Behandlung und/oder prävention von dna-triplett-wiederholungserkrankungen oder -störungen
    CN105821116A (zh) 2016-04-15 2016-08-03 扬州大学 一种绵羊mstn基因定向敲除及其影响成肌分化的检测方法
    US20200172935A1 (en) 2016-04-16 2020-06-04 Ohio State Innovation Foundation Modified cpf1 mrna, modified guide rna, and uses thereof
    US20190119678A1 (en) 2016-04-18 2019-04-25 Ruprecht-Karls-Universität Heidelberg Means and methods for inactivating therapeutic dna in a cell
    US20190134227A1 (en) 2016-04-18 2019-05-09 The Board Of Regents Of The University Of Texas System Generation of genetically engineered animals by crispr/cas9 genome editing in spermatogonial stem cells
    CA3026110A1 (en) 2016-04-19 2017-11-02 The Broad Institute, Inc. Novel crispr enzymes and systems
    CN106086062A (zh) 2016-04-19 2016-11-09 上海市农业科学院 一种获得番茄基因组定点敲除突变体的方法
    WO2017184768A1 (en) 2016-04-19 2017-10-26 The Broad Institute Inc. Novel crispr enzymes and systems
    CA3026112A1 (en) 2016-04-19 2017-10-26 The Broad Institute, Inc. Cpf1 complexes with reduced indel activity
    CN105886616B (zh) 2016-04-20 2020-08-07 广东省农业科学院农业生物基因研究中心 一种用于猪基因编辑的高效特异性sgRNA识别位点引导序列及其筛选方法
    CN105821075B (zh) 2016-04-22 2017-09-12 湖南农业大学 一种茶树咖啡因合成酶CRISPR/Cas9基因组编辑载体的构建方法
    CN107304435A (zh) 2016-04-22 2017-10-31 中国科学院青岛生物能源与过程研究所 一种Cas9/RNA系统及其应用
    CN105861552B (zh) 2016-04-25 2019-10-11 西北农林科技大学 一种T7 RNA聚合酶介导的CRISPR/Cas9基因编辑系统的构建方法
    US11248216B2 (en) 2016-04-25 2022-02-15 The Regents Of The University Of California Methods and compositions for genomic editing
    CN107326046A (zh) 2016-04-28 2017-11-07 上海邦耀生物科技有限公司 一种提高外源基因同源重组效率的方法
    EP3449000A1 (de) 2016-04-29 2019-03-06 Sarepta Therapeutics, Inc. Gegen humanes lmna gerichtete oligonukleotidanaloga
    CN105821049B (zh) 2016-04-29 2019-06-04 中国农业大学 一种Fbxo40基因敲除猪的制备方法
    KR20230038804A (ko) 2016-04-29 2023-03-21 바스프 플랜트 사이언스 컴퍼니 게엠베하 표적 핵산의 변형을 위한 개선된 방법
    CN105886534A (zh) 2016-04-29 2016-08-24 苏州溯源精微生物科技有限公司 一种抑制肿瘤转移的方法
    AU2017260714B2 (en) 2016-05-01 2023-10-05 Duane CHUNG Harnessing heterologous and endogenous CRISPR-Cas machineries for efficient markerless genome editing in clostridium
    WO2017192512A2 (en) 2016-05-02 2017-11-09 Massachusetts Institute Of Technology Amphiphilic nanoparticles for delivery of crispr based therapy
    CN105950639A (zh) 2016-05-04 2016-09-21 广州美格生物科技有限公司 金黄色葡萄球菌CRISPR/Cas9系统的制备及其在构建小鼠模型中的应用
    US11078247B2 (en) 2016-05-04 2021-08-03 Curevac Ag RNA encoding a therapeutic protein
    WO2017191210A1 (en) 2016-05-04 2017-11-09 Novozymes A/S Genome editing by crispr-cas9 in filamentous fungal host cells
    WO2017193029A2 (en) 2016-05-05 2017-11-09 Duke University Crispr/cas-related methods and compositions for treating duchenne muscular dystrophy
    CN106244591A (zh) 2016-08-23 2016-12-21 苏州吉玛基因股份有限公司 修饰crRNA在CRISPR/Cpf1基因编辑系统中的应用
    WO2017190664A1 (zh) 2016-05-05 2017-11-09 苏州吉玛基因股份有限公司 化学合成的crRNA和修饰crRNA在CRISPR/Cpf1基因编辑系统中的应用
    CN105907785B (zh) 2016-05-05 2020-02-07 苏州吉玛基因股份有限公司 化学合成的crRNA用于CRISPR/Cpf1系统在基因编辑中的应用
    WO2017192172A1 (en) 2016-05-05 2017-11-09 Temple University - Of The Commonwealth System Of Higher Education Rna guided eradication of varicella zoster virus
    CN105985985B (zh) 2016-05-06 2019-12-31 苏州大学 Crispr技术编辑并用igf优化的异体间充质干细胞的制备方法及在治疗心梗中应用
    US20190300872A1 (en) 2016-05-06 2019-10-03 Tod M. Woolf Improved Methods of Genome Editing with and without Programmable Nucleases
    US20190161743A1 (en) 2016-05-09 2019-05-30 President And Fellows Of Harvard College Self-Targeting Guide RNAs in CRISPR System
    CN105861554B (zh) 2016-05-10 2020-01-31 华南农业大学 一种基于对Rbmy基因进行编辑来实现动物性别控制的方法和应用
    US20190225956A1 (en) 2016-05-10 2019-07-25 United States Government As Represented By The Department Of Veterans Affairs Lentiviral delivery of crispr/cas constructs that cleave genes essential for hiv-1 infection and replication
    CN109152342A (zh) 2016-05-12 2019-01-04 布赖恩.P.汉利 Crispr和其他基因疗法安全递送到人类和动物中的大部分体细胞
    CN107365786A (zh) 2016-05-12 2017-11-21 中国科学院微生物研究所 一种将spacer序列克隆至CRISPR-Cas9系统中的方法及其应用
    WO2017197238A1 (en) * 2016-05-12 2017-11-16 President And Fellows Of Harvard College Aav split cas9 genome editing and transcriptional regulation
    KR101922989B1 (ko) 2016-05-13 2018-11-28 연세대학교 산학협력단 CRISPR/Retron 시스템을 이용한 유전체상의 치환 변이 생성과 추적 방법
    CN105907758B (zh) 2016-05-18 2020-06-05 世翱(上海)生物医药科技有限公司 CRISPR-Cas9引导序列及其引物、转基因表达载体及其构建方法
    CN106011171B (zh) 2016-05-18 2019-10-11 西北农林科技大学 一种利用CRISPR/Cas9技术基于SSA修复的基因无缝编辑方法
    CN105838733A (zh) 2016-05-18 2016-08-10 云南省农业科学院花卉研究所 Cas9 介导的香石竹基因编辑载体和应用
    CN106446600B (zh) 2016-05-20 2019-10-18 同济大学 一种基于CRISPR/Cas9的sgRNA的设计方法
    MX2018014172A (es) 2016-05-20 2019-08-22 Regeneron Pharma Métodos para romper la tolerancia inmunológica usando múltiples arn guías.
    US20190201551A1 (en) 2016-05-23 2019-07-04 Washington University Pulmonary targeted cas9/crispr for in vivo editing of disease genes
    US20190300867A1 (en) 2016-05-23 2019-10-03 The Trustees Of Columbia University In The City Of New York Bypassing the pam requirement of the crispr-cas system
    CN105950560B (zh) 2016-05-24 2019-07-23 苏州系统医学研究所 人源化pd-l1肿瘤细胞系及具有该细胞系的动物模型与应用
    CN106011167B (zh) 2016-05-27 2019-11-01 上海交通大学 雄性不育基因OsDPW2的应用及水稻育性恢复的方法
    WO2017207589A1 (en) 2016-06-01 2017-12-07 Kws Saat Se Hybrid nucleic acid sequences for genome engineering
    WO2017208247A1 (en) 2016-06-02 2017-12-07 Yissum Research Development Company Of The Hebrew University Of Jerusalem Ltd. Assay for the removal of methyl-cytosine residues from dna
    AU2017274145B2 (en) 2016-06-02 2020-07-23 Sigma-Aldrich Co Llc Using programmable DNA binding proteins to enhance targeted genome modification
    US11140883B2 (en) 2016-06-03 2021-10-12 Auburn University Gene editing of reproductive hormones to sterilize aquatic animals
    JP2019517503A (ja) 2016-06-03 2019-06-24 テンプル ユニバーシティー オブ ザ コモンウェルス システム オブ ハイヤー エデュケーション 遺伝子編集戦略によるhiv−1のネガティブフィードバック調節
    WO2017213898A2 (en) 2016-06-07 2017-12-14 Temple University - Of The Commonwealth System Of Higher Education Rna guided compositions for preventing and treating hepatitis b virus infections
    CN106119275A (zh) 2016-06-07 2016-11-16 湖北大学 基于CRISPR/Cas9技术将非糯性水稻株系改造成糯性株系的打靶载体和方法
    US10767175B2 (en) 2016-06-08 2020-09-08 Agilent Technologies, Inc. High specificity genome editing using chemically modified guide RNAs
    US11779657B2 (en) 2016-06-10 2023-10-10 City Of Hope Compositions and methods for mitochondrial genome editing
    CN106086008B (zh) 2016-06-10 2019-03-12 中国农业科学院植物保护研究所 烟粉虱MED隐种TRP基因的CRISPR/cas9系统及其应用
    CN109312317A (zh) 2016-06-14 2019-02-05 先锋国际良种公司 Cpf1内切核酸酶用于植物基因组修饰的用途
    CN106434752A (zh) 2016-06-14 2017-02-22 南通大学附属医院 敲除Wnt3a基因的过程及其验证方法
    CN106167821A (zh) 2016-06-16 2016-11-30 郑州大学 一种金黄色葡萄球菌crispr位点检测试剂盒及检测方法
    CN106167808A (zh) 2016-06-16 2016-11-30 郑州大学 一种基于CRISPR/Cas9技术消除mecA质粒的方法
    CN105950633B (zh) 2016-06-16 2019-05-03 复旦大学 基因OsARF4在控制水稻粒长和千粒重中的应用
    CN105950626B (zh) 2016-06-17 2018-09-28 新疆畜牧科学院生物技术研究所 基于CRISPR/Cas9获得不同毛色绵羊的方法及靶向ASIP基因的sgRNA
    US20190323038A1 (en) 2016-06-17 2019-10-24 Montana State Univesity Bidirectional targeting for genome editing
    KR20190019168A (ko) 2016-06-17 2019-02-26 더 브로드 인스티튜트, 인코퍼레이티드 제vi형 crispr 오솔로그 및 시스템
    US20190330603A1 (en) 2016-06-17 2019-10-31 Genesis Technologies Limited Crispr-cas system, materials and methods
    KR102555713B1 (ko) 2016-06-20 2023-07-14 키진 엔.브이. 식물 세포에서의 표적된 dna 변경 방법
    US20170362635A1 (en) 2016-06-20 2017-12-21 University Of Washington Muscle-specific crispr/cas9 editing of genes
    WO2017223107A1 (en) 2016-06-20 2017-12-28 Unity Biotechnology, Inc. Genome modifying enzyme therapy for diseases modulated by senescent cells
    CA3018430A1 (en) 2016-06-20 2017-12-28 Pioneer Hi-Bred International, Inc. Novel cas systems and methods of use
    CN106148370A (zh) 2016-06-21 2016-11-23 苏州瑞奇生物医药科技有限公司 肥胖症大鼠动物模型和构建方法
    JP2019522481A (ja) 2016-06-22 2019-08-15 アイカーン スクール オブ メディシン アット マウント サイナイ 自己切断リボザイムを利用したrnaのウイルス送達およびそのcrisprベースの適用
    AU2017281497B2 (en) 2016-06-22 2023-04-06 Proqr Therapeutics Ii B.V. Single-stranded RNA-editing oligonucleotides
    CN106047877B (zh) 2016-06-24 2019-01-11 中山大学附属第一医院 一种靶向敲除FTO基因的sgRNA及CRISPR/Cas9慢病毒系统与应用
    CN106119283A (zh) 2016-06-24 2016-11-16 广西壮族自治区水牛研究所 一种利用CRISPR‑Cas9靶向敲除MSTN基因的方法
    CN105925608A (zh) 2016-06-24 2016-09-07 广西壮族自治区水牛研究所 一种利用CRISPR-Cas9靶向敲除ALK6基因的方法
    EP3478840A1 (de) 2016-06-29 2019-05-08 Crispr Therapeutics AG Zusammensetzungen und verfahren zur geneditierung
    WO2018005691A1 (en) 2016-06-29 2018-01-04 The Regents Of The University Of California Efficient genetic screening method
    WO2018005873A1 (en) 2016-06-29 2018-01-04 The Broad Institute Inc. Crispr-cas systems having destabilization domain
    CN106148286B (zh) 2016-06-29 2019-10-29 牛刚 一种用于检测热原的细胞模型的构建方法和细胞模型及热原检测试剂盒
    US10927383B2 (en) 2016-06-30 2021-02-23 Ethris Gmbh Cas9 mRNAs
    US10892034B2 (en) 2016-07-01 2021-01-12 Microsoft Technology Licensing, Llc Use of homology direct repair to record timing of a molecular event
    CN109477130B (zh) 2016-07-01 2022-08-30 微软技术许可有限责任公司 通过迭代dna编辑的存储
    US20180004537A1 (en) 2016-07-01 2018-01-04 Microsoft Technology Licensing, Llc Molecular State Machines
    KR20190039703A (ko) 2016-07-05 2019-04-15 더 존스 홉킨스 유니버시티 Crispr/cas9-기반 조성물 및 망막 변성을 치료하기 위한 방법
    WO2018009520A1 (en) 2016-07-06 2018-01-11 Novozymes A/S Improving a microorganism by crispr-inhibition
    CN106191057B (zh) 2016-07-06 2018-12-25 中山大学 一种用于敲除人CYP2E1基因的sgRNA序列、CYP2E1基因缺失细胞株的构建方法及其应用
    CN106051058A (zh) 2016-07-07 2016-10-26 上海格昆机电科技有限公司 用于航天贮箱和粒子治疗仪的旋转机架及其传动机构
    WO2018009822A1 (en) 2016-07-08 2018-01-11 Ohio State Innovation Foundation Modified nucleic acids, hybrid guide rnas, and uses thereof
    CN107586777A (zh) 2016-07-08 2018-01-16 上海吉倍生物技术有限公司 人PDCD1基因sgRNA的用途及其相关药物
    CN106047930B (zh) 2016-07-12 2020-05-19 北京百奥赛图基因生物技术有限公司 一种PS1基因条件性敲除flox大鼠的制备方法
    KR102319845B1 (ko) 2016-07-13 2021-11-01 디에스엠 아이피 어셋츠 비.브이. 조류 숙주 세포에 대한 crispr-cas 시스템
    EP3485023B1 (de) 2016-07-15 2023-11-15 Salk Institute for Biological Studies Verfahren und zusammensetzungen zum genom-editieren von sich nichtteilenden zellen
    WO2018013990A1 (en) 2016-07-15 2018-01-18 Zymergen Inc. Scarless dna assembly and genome editing using crispr/cpf1 and dna ligase
    CN106191061B (zh) 2016-07-18 2019-06-18 暨南大学 一种特异靶向人ABCG2基因的sgRNA导向序列及其应用
    CN106191062B (zh) 2016-07-18 2019-06-14 广东华南疫苗股份有限公司 一种tcr-/pd-1-双阴性t细胞及其构建方法
    CN106190903B (zh) 2016-07-18 2019-04-02 华中农业大学 鸭疫里氏杆菌Cas9基因缺失突变株及其应用
    CN106434651B (zh) 2016-07-19 2021-05-18 广西大学 根癌农杆菌和CRISPR-Cas9介导的基因定点插入失活方法及其应用
    US20190151476A1 (en) 2016-07-19 2019-05-23 Duke University Therapeutic applications of cpf1-based genome editing
    KR20230088522A (ko) 2016-07-21 2023-06-19 맥스시티 인코포레이티드 게놈 dna를 변경하기 위한 방법 및 조성물
    CN106191107B (zh) 2016-07-22 2020-03-20 湖南农业大学 一种降低水稻籽粒落粒性的分子改良方法
    CN106191064B (zh) 2016-07-22 2019-06-07 中国农业大学 一种制备mc4r基因敲除猪的方法
    WO2018015444A1 (en) 2016-07-22 2018-01-25 Novozymes A/S Crispr-cas9 genome editing with multiple guide rnas in filamentous fungi
    EP3488001A1 (de) 2016-07-25 2019-05-29 Mayo Foundation for Medical Education and Research Behandlung von krebs
    CN106222193B (zh) 2016-07-26 2019-09-20 浙江大学 一种重组载体及无转基因基因编辑植株的筛选方法
    WO2018018979A1 (zh) 2016-07-26 2018-02-01 浙江大学 植物重组载体及无转基因成分的基因编辑植株的筛选方法
    WO2018022634A1 (en) 2016-07-26 2018-02-01 The General Hospital Corporation Variants of crispr from prevotella and francisella 1 (cpf1)
    CN106191099A (zh) 2016-07-27 2016-12-07 苏州泓迅生物科技有限公司 一种基于CRISPR‑Cas9系统的酿酒酵母基因组并行多重编辑载体及其应用
    CN106086061A (zh) 2016-07-27 2016-11-09 苏州泓迅生物科技有限公司 一种基于CRISPR‑Cas9系统的酿酒酵母基因组编辑载体及其应用
    WO2018021878A1 (ko) 2016-07-28 2018-02-01 주식회사 비엠티 옥외 배관용 히팅재킷
    CN106191113B (zh) 2016-07-29 2020-01-14 中国农业大学 一种mc3r基因敲除猪的制备方法
    CN106191124B (zh) 2016-07-29 2019-10-11 中国科学院重庆绿色智能技术研究院 一种利用鱼卵保存液提高CRISPR-Cas9基因编辑和传代效率的鱼类育种方法
    CN106191114B (zh) 2016-07-29 2020-02-11 中国科学院重庆绿色智能技术研究院 利用CRISPR-Cas9系统敲除鱼类MC4R基因的育种方法
    GB201613135D0 (en) 2016-07-29 2016-09-14 Medical Res Council Genome editing
    CN106434748A (zh) 2016-07-29 2017-02-22 中国科学院重庆绿色智能技术研究院 一种热激诱导型 Cas9 酶转基因斑马鱼的研制及应用
    EP3491134B1 (de) 2016-08-01 2023-10-11 University of Pittsburgh - of The Commonwealth System of Higher Education Menschliche induzierte pluripotente stammzellen zur hocheffizienten genmanipulation
    CN106434688A (zh) 2016-08-01 2017-02-22 云南纳博生物科技有限公司 一种水稻直立密穗dep1基因人工定点突变体及其应用
    CN106011150A (zh) 2016-08-01 2016-10-12 云南纳博生物科技有限公司 一种水稻穗粒数Gn1a基因人工定点突变体及其应用
    US11566263B2 (en) 2016-08-02 2023-01-31 Editas Medicine, Inc. Compositions and methods for treating CEP290 associated disease
    WO2018025206A1 (en) 2016-08-02 2018-02-08 Kyoto University Method for genome editing
    GB2568182A (en) 2016-08-03 2019-05-08 Harvard College Adenosine nucleobase editors and uses thereof
    CN106282241A (zh) 2016-08-05 2017-01-04 无锡市第二人民医院 通过CRISPR/Cas9得到敲除bmp2a基因的斑马鱼的方法
    AU2017308889B2 (en) 2016-08-09 2023-11-09 President And Fellows Of Harvard College Programmable Cas9-recombinase fusion proteins and uses thereof
    CN106222203A (zh) 2016-08-10 2016-12-14 云南纳博生物科技有限公司 利用CRISPR/Cas技术获得家蚕丝素重链基因突变体及突变方法和应用
    KR101710026B1 (ko) 2016-08-10 2017-02-27 주식회사 무진메디 Cas9 단백질 및 가이드 RNA의 혼성체를 함유하는 나노 리포좀 전달체 조성물
    CN106172238B (zh) 2016-08-12 2019-01-22 中南大学 miR-124基因敲除小鼠动物模型的构建方法和应用
    CN106222177B (zh) 2016-08-13 2018-06-26 江苏集萃药康生物科技有限公司 一种靶向人STAT6的CRISPR-Cas9系统及其用于治疗过敏性疾病的应用
    US20210166783A1 (en) 2016-08-17 2021-06-03 The Broad Institute, Inc. Methods for identifying class 2 crispr-cas systems
    WO2018035300A1 (en) 2016-08-17 2018-02-22 The Regents Of The University Of California Split trans-complementing gene-drive system for suppressing aedes aegypti mosquitos
    US11810649B2 (en) 2016-08-17 2023-11-07 The Broad Institute, Inc. Methods for identifying novel gene editing elements
    WO2018035503A1 (en) 2016-08-18 2018-02-22 The Regents Of The University Of California Crispr-cas genome engineering via a modular aav delivery system
    AU2017312132A1 (en) 2016-08-19 2019-03-21 Bluebird Bio, Inc. Genome editing enhancers
    KR102594051B1 (ko) 2016-08-20 2023-10-26 아벨리노 랩 유에스에이, 인크. 단일 가이드 RNA, CRISPR/Cas9 시스템, 및 이의 사용방법
    CN106191071B (zh) 2016-08-22 2018-09-04 广州资生生物科技有限公司 一种CRISPR-Cas9系统及其用于治疗乳腺癌疾病的应用
    CN106191116B (zh) 2016-08-22 2019-10-08 西北农林科技大学 基于CRISPR/Cas9的外源基因敲入整合系统及其建立方法和应用
    CN106244555A (zh) 2016-08-23 2016-12-21 广州医科大学附属第三医院 一种提高基因打靶的效率的方法及β‑球蛋白基因位点的碱基原位修复方法
    CN106086028B (zh) 2016-08-23 2019-04-23 中国农业科学院作物科学研究所 一种通过基因组编辑提高水稻抗性淀粉含量的方法及其专用sgRNA
    BR112019003327A2 (pt) 2016-08-24 2019-07-02 Sangamo Therapeutics Inc nucleases manipuladas de alvo específico
    CN106109417A (zh) 2016-08-24 2016-11-16 李因传 一种肝细胞膜仿生脂质体药物载体、制作方法及其应用
    US11542509B2 (en) 2016-08-24 2023-01-03 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
    IL264639B2 (en) 2016-08-24 2024-01-01 Sangamo Therapeutics Inc Regulation of globulin gene expression using transgenic nucleases with zinc neurites
    CN106244609A (zh) 2016-08-24 2016-12-21 浙江理工大学 一种调节pi3k‑akt信号通路的非编码基因的筛选系统及筛选方法
    KR101856345B1 (ko) 2016-08-24 2018-06-20 경상대학교산학협력단 CRISPR/Cas9 시스템을 이용하여 APOBEC3H 및 APOBEC3CH 이중-넉아웃 고양이를 제조하는 방법
    CN106544357B (zh) 2016-08-25 2018-08-21 湖南杂交水稻研究中心 一种培育镉低积累籼稻品种的方法
    CN107784200B (zh) 2016-08-26 2020-11-06 深圳华大生命科学研究院 一种筛选新型CRISPR-Cas系统的方法和装置
    CN106350540A (zh) 2016-08-26 2017-01-25 苏州系统医学研究所 一种由慢病毒介导的高效可诱导型CRISPR/Cas9基因敲除载体及其应用
    CN106318973B (zh) 2016-08-26 2019-09-13 深圳市第二人民医院 一种基于CRISPR-Cas9的基因调控装置及基因调控方法
    CN106244557B (zh) 2016-08-29 2019-10-25 中国农业科学院北京畜牧兽医研究所 定点突变ApoE基因与LDLR基因的方法
    CN106480097A (zh) 2016-10-13 2017-03-08 南京凯地生物科技有限公司 利用CRISPR/Cas9技术敲除人PD‑1基因构建可靶向MSLN新型CAR‑T细胞的方法及其应用
    CN106399367A (zh) 2016-08-31 2017-02-15 深圳市卫光生物制品股份有限公司 提高crispr介导的同源重组效率的方法
    CN106399375A (zh) 2016-08-31 2017-02-15 南京凯地生物科技有限公司 利用CRISPR/Cas9敲除人PD‑1基因构建靶向CD19CAR‑T细胞的方法
    CN107794272B (zh) 2016-09-06 2021-10-12 中国科学院上海营养与健康研究所 一种高特异性的crispr基因组编辑体系
    CN106399311A (zh) 2016-09-07 2017-02-15 同济大学 用于Chip‑seq全基因组结合谱的内源蛋白标记的方法
    US20180105806A1 (en) 2016-09-07 2018-04-19 Massachusetts Institute Of Technology Method for rna-guided endonuclease-based dna assembly
    WO2018049073A1 (en) 2016-09-07 2018-03-15 Flagship Pioneering, Inc. Methods and compositions for modulating gene expression
    CN106399377A (zh) 2016-09-07 2017-02-15 同济大学 一种基于CRISPR/Cas9高通量技术筛选药物靶点基因的方法
    CN106367435B (zh) 2016-09-07 2019-11-08 电子科技大学 一种水稻miRNA定向敲除的方法
    CN107574179B (zh) 2016-09-09 2018-07-10 康码(上海)生物科技有限公司 一种为克鲁维酵母优化的CRISPR/Cas9高效基因编辑系统
    EP3510151A4 (de) * 2016-09-09 2020-04-15 The Board of Trustees of the Leland Stanford Junior University Hochdurchsatz-präzisionsgenomeditierung
    US11485971B2 (en) 2016-09-14 2022-11-01 Yeda Research And Development Co. Ltd. CRISP-seq, an integrated method for massively parallel single cell RNA-seq and CRISPR pooled screens
    CN106318934B (zh) 2016-09-21 2020-06-05 上海交通大学 胡萝卜β(1,2)木糖转移酶的基因全序列及用于转染双子叶植物的CRISPR/CAS9的质粒构建
    US20180127786A1 (en) 2016-09-23 2018-05-10 Casebia Therapeutics Limited Liability Partnership Compositions and methods for gene editing
    WO2017216392A1 (en) 2016-09-23 2017-12-21 Dsm Ip Assets B.V. A guide-rna expression system for a host cell
    CN106957858A (zh) 2016-09-23 2017-07-18 西北农林科技大学 一种利用CRISPR/Cas9系统共同敲除绵羊MSTN、ASIP、BCO2基因的方法
    EP3497215B1 (de) 2016-09-28 2024-01-10 Cellivery Therapeutics, Inc. Zellpermeables (cp)-cas9-rekombinantes protein und verwendungen davon
    EP3523426A4 (de) 2016-09-30 2020-01-22 The Regents of The University of California Rna-geführte nukleinsäure-modifizierende enzyme und verfahren zur verwendung davon
    CN107880132B (zh) 2016-09-30 2022-06-17 北京大学 一种融合蛋白及使用其进行同源重组的方法
    CN106480027A (zh) 2016-09-30 2017-03-08 重庆高圣生物医药有限责任公司 CRISPR/Cas9 靶向敲除人PD‑1基因及其特异性gRNA
    EP3518656A4 (de) 2016-09-30 2020-09-30 Monsanto Technology LLC Verfahren zur auswahl von zielorten zur ortsspezifischen genommodifikation in pflanzen
    CN107881184B (zh) 2016-09-30 2021-08-27 中国科学院分子植物科学卓越创新中心 一种基于Cpf1的DNA体外拼接方法
    GB2569734B (en) 2016-09-30 2022-09-07 Univ California RNA-guided nucleic acid modifying enzymes and methods of use thereof
    EP3518981A4 (de) 2016-10-03 2020-06-10 President and Fellows of Harvard College Abgabe von therapeutischen rnas über arrdc1-vermittelte mikrovesikel
    WO2018067846A1 (en) 2016-10-05 2018-04-12 President And Fellows Of Harvard College Methods of crispr mediated genome modulation in v. natriegens
    US10669539B2 (en) 2016-10-06 2020-06-02 Pioneer Biolabs, Llc Methods and compositions for generating CRISPR guide RNA libraries
    CN110462034A (zh) 2016-10-07 2019-11-15 综合Dna技术公司 化脓链球菌cas9突变基因和由其编码的多肽
    CN106479985A (zh) 2016-10-09 2017-03-08 上海吉玛制药技术有限公司 病毒介导的Cpf1蛋白在CRISPR/Cpf1基因编辑系统中的应用
    WO2018071623A2 (en) 2016-10-12 2018-04-19 Temple University - Of The Commonwealth System Of Higher Education Combination therapies for eradicating flavivirus infections in subjects
    CN106434663A (zh) 2016-10-12 2017-02-22 遵义医学院 CRISPR/Cas9靶向敲除人ezrin基因增强子关键区的方法及其特异性gRNA
    IT201600102542A1 (it) 2016-10-12 2018-04-12 Univ Degli Studi Di Trento Plasmide e sistema lentivirale contenente un circuito autolimitante della Cas9 che ne incrementa la sicurezza.
    AU2017341926B2 (en) 2016-10-14 2022-06-30 The General Hospital Corporation Epigenetically regulated site-specific nucleases
    CN106434782B (zh) 2016-10-14 2020-01-10 南京工业大学 一种产顺式-4-羟脯氨酸的方法
    US20190330620A1 (en) 2016-10-14 2019-10-31 Emendobio Inc. Rna compositions for genome editing
    KR102622411B1 (ko) 2016-10-14 2024-01-10 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 핵염기 에디터의 aav 전달
    US11840694B2 (en) 2016-10-17 2023-12-12 Nanyang Technological University Truncated CRISPR-Cas proteins for DNA targeting
    US10640810B2 (en) 2016-10-19 2020-05-05 Drexel University Methods of specifically labeling nucleic acids using CRISPR/Cas
    WO2018081534A1 (en) 2016-10-28 2018-05-03 President And Fellows Of Harvard College Assay for exo-site binding molecules
    WO2018081535A2 (en) 2016-10-28 2018-05-03 Massachusetts Institute Of Technology Dynamic genome engineering
    EP3532616A1 (de) 2016-10-28 2019-09-04 Editas Medicine, Inc. Verfahren im zusammenhang mit crispr/cas und zusammensetzungen zur behandlung des herpes-simplex-virus
    WO2018080573A1 (en) 2016-10-28 2018-05-03 Massachusetts Institute Of Technology Crispr/cas global regulator screening platform
    WO2018079134A1 (ja) 2016-10-31 2018-05-03 株式会社江口高周波 リアクトル
    US11795453B2 (en) 2016-10-31 2023-10-24 Emendobio, Inc. Compositions for genome editing
    WO2018083606A1 (en) 2016-11-01 2018-05-11 Novartis Ag Methods and compositions for enhancing gene editing
    WO2018085288A1 (en) 2016-11-01 2018-05-11 President And Fellows Of Harvard College Inhibitors of rna guided nucleases and uses thereof
    GB201618507D0 (en) 2016-11-02 2016-12-14 Stichting Voor De Technische Wetenschappen And Wageningen Univ Microbial genome editing
    US11732258B2 (en) 2016-11-02 2023-08-22 President And Fellows Of Harvard College Engineered guide RNA sequences for in situ detection and sequencing
    CN106544353A (zh) 2016-11-08 2017-03-29 宁夏医科大学总医院 一种利用CRISPR‑Cas9清除鲍曼不动杆菌耐药性基因的方法
    EP3538561A4 (de) 2016-11-11 2020-10-21 The Regents of The University of California Rna-geführte polypeptidvarianten und verfahren zur verwendung
    CN106755088A (zh) 2016-11-11 2017-05-31 广东万海细胞生物科技有限公司 一种自体car‑t细胞制备方法及应用
    JP2019523011A (ja) 2016-11-14 2019-08-22 インスティテュート・オブ・ジェネティクス・アンド・ディヴェロプメンタル・バイオロジー、チャイニーズ・アカデミー・オブ・サイエンシズInstitute of Genetics and Developmental Biology, Chinese Academy of Sciences 植物における塩基編集のための方法
    CN106566838B (zh) 2016-11-14 2019-11-01 上海伯豪生物技术有限公司 一种基于CRISPR-Cas9技术的miR-126全长基因敲除试剂盒及其应用
    CN106554969A (zh) 2016-11-15 2017-04-05 陕西理工学院 基于抑菌杀菌的多靶点CRISPR/Cas9表达载体
    CN106754912B (zh) 2016-11-16 2019-11-08 上海交通大学 一类定向清除肝细胞中HBVcccDNA的质粒及制剂
    CN110139927A (zh) 2016-11-16 2019-08-16 加利福尼亚大学董事会 Crispr-cas9抑制剂
    US20180282722A1 (en) 2016-11-21 2018-10-04 Massachusetts Institute Of Technology Chimeric DNA:RNA Guide for High Accuracy Cas9 Genome Editing
    CN106480067A (zh) 2016-11-21 2017-03-08 中国农业科学院烟草研究所 烟草NtNAC096基因控制烟草衰老的应用
    JP2019535287A (ja) 2016-11-22 2019-12-12 インテグレイテツド・デイー・エヌ・エイ・テクノロジーズ・インコーポレイテツド Crispr/cpf1システム及び方法
    CN106755091A (zh) 2016-11-28 2017-05-31 中国人民解放军第三军医大学第附属医院 基因敲除载体,mh7a细胞nlrp1基因敲除方法
    MX2019006157A (es) 2016-11-28 2019-11-21 Univ Texas Prevención de la distrofia muscular mediante la edición de genes mediada por crispr/cpf1.
    CN106480036B (zh) 2016-11-30 2019-04-09 华南理工大学 一种具有启动子功能的dna片段及其应用
    CN106834323A (zh) 2016-12-01 2017-06-13 安徽大学 一种基于维吉尼亚链霉菌IBL14基因cas7‑5‑3的基因编辑方法
    CA3045335A1 (en) 2016-12-01 2018-06-07 Universite Laval Crispr-based treatment of friedreich ataxia
    CN107043779B (zh) 2016-12-01 2020-05-12 中国农业科学院作物科学研究所 一种CRISPR/nCas9介导的定点碱基替换在植物中的应用
    US9816093B1 (en) 2016-12-06 2017-11-14 Caribou Biosciences, Inc. Engineered nucleic acid-targeting nucleic acids
    WO2018103686A1 (zh) 2016-12-07 2018-06-14 中国科学院上海生命科学研究院 叶绿体基因组编辑方法
    CN106701830B (zh) 2016-12-07 2020-01-03 湖南人文科技学院 一种敲除猪胚胎p66shc基因的方法
    IL267024B2 (en) 2016-12-08 2023-12-01 Intellia Therapeutics Inc Adapted leader RNAs for genomic editing
    US11192929B2 (en) 2016-12-08 2021-12-07 Regents Of The University Of Minnesota Site-specific DNA base editing using modified APOBEC enzymes
    CN106544351B (zh) 2016-12-08 2019-09-10 江苏省农业科学院 CRISPR-Cas9体外敲除耐药基因mcr-1的方法及其专用细胞穿透肽
    WO2018107103A1 (en) 2016-12-09 2018-06-14 The Broad Institute, Inc. Crispr-systems for modifying a trait of interest in a plant
    SI3551753T1 (sl) 2016-12-09 2022-09-30 The Broad Institute, Inc. Diagnostika, temelječa na sistemu CRISPR EFFECTOR
    US11293022B2 (en) 2016-12-12 2022-04-05 Integrated Dna Technologies, Inc. Genome editing enhancement
    WO2018111946A1 (en) 2016-12-12 2018-06-21 Integrated Dna Technologies, Inc. Genome editing detection
    CN107893074A (zh) 2016-12-13 2018-04-10 广东赤萌医疗科技有限公司 一种用于敲除CXCR4基因的gRNA、表达载体、敲除系统、试剂盒
    US11242513B2 (en) 2016-12-14 2022-02-08 Wageningen Universiteit Thermostable Cas9 nucleases
    WO2018109101A1 (en) 2016-12-14 2018-06-21 Wageningen Universiteit Thermostable cas9 nucleases
    KR101748575B1 (ko) 2016-12-16 2017-06-20 주식회사 엠젠플러스 Ins 유전자 녹아웃 당뇨병 또는 당뇨병 합병증 동물모델 및 이의 제조방법
    WO2018112336A1 (en) 2016-12-16 2018-06-21 Ohio State Innovation Foundation Systems and methods for dna-guided rna cleavage
    CN106755026A (zh) 2016-12-18 2017-05-31 吉林大学 sgRNA表达载体的构建及牙釉质钙化不全模型的建立
    WO2018112446A2 (en) 2016-12-18 2018-06-21 Selonterra, Inc. Use of apoe4 motif-mediated genes for diagnosis and treatment of alzheimer's disease
    WO2018119359A1 (en) 2016-12-23 2018-06-28 President And Fellows Of Harvard College Editing of ccr5 receptor gene to protect against hiv infection
    GB2605925B (en) 2016-12-23 2023-02-22 Harvard College Gene editing of PCSK9
    CN106755424B (zh) 2016-12-26 2020-11-06 郑州大学 一种基于crispr的大肠杆菌st131系菌株检测引物、试剂盒及检测方法
    CN107354173A (zh) 2016-12-26 2017-11-17 浙江省医学科学院 基于crispr技术和水动力尾静脉注射建立肝脏特异性敲除小鼠模型的方法
    CN106834347A (zh) 2016-12-27 2017-06-13 安徽省农业科学院畜牧兽医研究所 一种山羊cdk2基因敲除载体及其构建方法
    CN106755097A (zh) 2016-12-27 2017-05-31 安徽省农业科学院畜牧兽医研究所 一种山羊tlr4基因敲除载体及其构建方法
    CN106597260B (zh) 2016-12-29 2020-04-03 合肥工业大学 基于连续小波分析和elm网络的模拟电路故障诊断方法
    CN106834341B (zh) 2016-12-30 2020-06-16 中国农业大学 一种基因定点突变载体及其构建方法和应用
    CN106755077A (zh) 2016-12-30 2017-05-31 华智水稻生物技术有限公司 利用crispr‑cas9技术对水稻cenh3基因定点突变的方法
    CN106701763B (zh) 2016-12-30 2019-07-19 重庆高圣生物医药有限责任公司 CRISPR/Cas9靶向敲除人乙肝病毒P基因及其特异性gRNA
    CN106868008A (zh) 2016-12-30 2017-06-20 重庆高圣生物医药有限责任公司 CRISPR/Cas9靶向敲除人Lin28A基因及其特异性gRNA
    CN106701818B (zh) 2017-01-09 2020-04-24 湖南杂交水稻研究中心 一种培育水稻普通核不育系的方法
    US20190352634A1 (en) 2017-01-11 2019-11-21 Oxford University Innovation Limited Crispr rna
    CN107012164B (zh) 2017-01-11 2023-03-03 电子科技大学 CRISPR/Cpf1植物基因组定向修饰功能单元、包含该功能单元的载体及其应用
    WO2018135838A2 (ko) 2017-01-17 2018-07-26 기초과학연구원 Dna 단일가닥 절단에 의한 염기 교정 비표적 위치 확인 방법
    US20180201921A1 (en) 2017-01-18 2018-07-19 Excision Biotherapeutics, Inc. CRISPRs
    CN106701823A (zh) 2017-01-18 2017-05-24 上海交通大学 生产无岩藻糖单克隆抗体的cho细胞系建立及其应用
    CN107058372A (zh) 2017-01-18 2017-08-18 四川农业大学 一种应用于植物上的CRISPR/Cas9载体的构建方法
    CN106801056A (zh) 2017-01-24 2017-06-06 中国科学院广州生物医药与健康研究院 一种sgRNA及其构建的慢病毒载体和应用
    JP2020505074A (ja) 2017-01-30 2020-02-20 カー・ヴェー・エス ザート エス・エー ウント コー. カー・ゲー・アー・アーKWS SAAT SE & Co. KGaA ゲノム工学のためのエンドヌクレアーゼに対する修復鋳型の結合
    TWI608100B (zh) 2017-02-03 2017-12-11 國立清華大學 Cas9表達質體、大腸桿菌基因剪輯系統及其方法
    TW201839136A (zh) 2017-02-06 2018-11-01 瑞士商諾華公司 治療血色素異常症之組合物及方法
    US10465187B2 (en) 2017-02-06 2019-11-05 Trustees Of Boston University Integrated system for programmable DNA methylation
    AU2018218280A1 (en) 2017-02-07 2019-08-29 The Regents Of The University Of California Gene therapy for haploinsufficiency
    US20190345501A1 (en) 2017-02-07 2019-11-14 Massachusetts Institute Of Technology Methods and compositions for rna-guided genetic circuits
    WO2018148647A2 (en) 2017-02-10 2018-08-16 Lajoie Marc Joseph Genome editing reagents and their use
    IT201700016321A1 (it) 2017-02-14 2018-08-14 Univ Degli Studi Di Trento Mutanti di cas9 ad alta specificita' e loro applicazioni.
    WO2018149915A1 (en) 2017-02-15 2018-08-23 Keygene N.V. Methods of targeted genetic alteration in plant cells
    US20200063127A1 (en) 2017-02-15 2020-02-27 Massachusetts Institute Of Technology Dna writers, molecular recorders and uses thereof
    CN106957855B (zh) 2017-02-16 2020-04-17 上海市农业科学院 使用CRISPR/Cas9技术靶向敲除水稻矮杆基因SD1的方法
    WO2018152418A1 (en) 2017-02-17 2018-08-23 Temple University - Of The Commonwealth System Of Higher Education Gene editing therapy for hiv infection via dual targeting of hiv genome and ccr5
    CA3053861A1 (en) 2017-02-20 2018-08-23 Institute Of Genetics And Developmental Biology, Chinese Academy Of Sciences Genome editing method
    US20200248168A1 (en) 2017-02-22 2020-08-06 Crispr Therapeutics Ag Compositions and methods for treatment of proprotein convertase subtilisin/kexin type 9 (pcsk9)-related disorders
    EP3585899A1 (de) 2017-02-22 2020-01-01 CRISPR Therapeutics AG Materialien und verfahren zur behandlung von primärer hyperoxalurie typ 1 (ph1) und anderen mit dem alanin-glyoxylataminotransferase (agxt)-gen assoziierten erkrankungen oder störungen
    EP3585896A1 (de) 2017-02-22 2020-01-01 CRISPR Therapeutics AG Materialien und verfahren zur behandlung von merosin-defizienter kongenitaler muskeldystrophie (mdcmd) und anderen mit laminin, alpha 2 (lama2)-gen verwandten leiden oder störungen
    WO2018156372A1 (en) 2017-02-22 2018-08-30 The Regents Of The University Of California Genetically modified non-human animals and products thereof
    JP2020508056A (ja) 2017-02-22 2020-03-19 クリスパー・セラピューティクス・アクチェンゲゼルシャフトCRISPR Therapeutics AG 遺伝子編集のための組成物および方法
    EP3585898A1 (de) 2017-02-22 2020-01-01 CRISPR Therapeutics AG Materialien und verfahren zur behandlung von spinozerebellärer ataxie typ 1 (sca1) und anderen mit dem gen des proteins von spinozerebellärer ataxie typ 1 (atxn1) assoziierten erkrankungen oder störungen
    US20200216857A1 (en) 2017-02-22 2020-07-09 Crispr Therapeutics Ag Materials and methods for treatment of spinocerebellar ataxia type 2 (sca2) and other spinocerebellar ataxia type 2 protein (atxn2) gene related conditions or disorders
    US20190365929A1 (en) 2017-02-22 2019-12-05 Crispr Therapeutics Ag Materials and methods for treatment of dystrophic epidermolysis bullosa (deb) and other collagen type vii alpha 1 chain (col7a1) gene related conditions or disorders
    US20200040061A1 (en) 2017-02-22 2020-02-06 Crispr Therapeutics Ag Materials and methods for treatment of early onset parkinson's disease (park1) and other synuclein, alpha (snca) gene related conditions or disorders
    US20190380314A1 (en) 2017-02-23 2019-12-19 President And Fellows Of Harvard College Methods of Genetic Modification of a Cell
    CN106868031A (zh) 2017-02-24 2017-06-20 北京大学 一种基于分级组装的多个sgRNA串联并行表达的克隆方法及应用
    WO2018161009A1 (en) 2017-03-03 2018-09-07 Yale University Aav-mediated direct in vivo crispr screen in glioblastoma
    US11111492B2 (en) 2017-03-06 2021-09-07 Florida State University Research Foundation, Inc. Genome engineering methods using a cytosine-specific Cas9
    US11898179B2 (en) 2017-03-09 2024-02-13 President And Fellows Of Harvard College Suppression of pain by gene editing
    CN110662556A (zh) 2017-03-09 2020-01-07 哈佛大学的校长及成员们 癌症疫苗
    WO2018165629A1 (en) * 2017-03-10 2018-09-13 President And Fellows Of Harvard College Cytosine to guanine base editor
    EP3595694A4 (de) 2017-03-14 2021-06-09 The Regents of The University of California Manipulation von crispr cas9-immuntarnung
    EP3596218B1 (de) 2017-03-15 2023-08-23 The Broad Institute, Inc. Auf crispr-effektorsystem basierende diagnostik für virusnachweis
    CN106978428A (zh) 2017-03-15 2017-07-25 上海吐露港生物科技有限公司 一种Cas蛋白特异结合靶标DNA、调控靶标基因转录的方法及试剂盒
    CN106906242A (zh) 2017-03-16 2017-06-30 重庆高圣生物医药有限责任公司 一种提高CRIPSR/Cas9靶向敲除基因产生非同源性末端接合效率的方法
    CA3057330A1 (en) 2017-03-21 2018-09-27 Anthony P. Shuber Treating cancer with cas endonuclease complexes
    EP3601562A1 (de) 2017-03-23 2020-02-05 President and Fellows of Harvard College Nukleobasen-editoren mit nukleinsäureprogrammierbaren dna-bindenden proteinen
    CN107012213A (zh) 2017-03-24 2017-08-04 南开大学 结直肠癌的生物标记物
    CN106947780A (zh) 2017-03-28 2017-07-14 扬州大学 一种兔mstn基因的编辑方法
    US10876101B2 (en) 2017-03-28 2020-12-29 Locanabio, Inc. CRISPR-associated (Cas) protein
    CN106906240A (zh) 2017-03-29 2017-06-30 浙江大学 运用CRISPR‑Cas9系统敲除大麦VE合成通路中的关键基因HPT的方法
    CA3058584A1 (en) 2017-03-30 2018-10-04 Kyoto University Method for inducing exon skipping by genome editing
    CN108660161B (zh) 2017-03-31 2023-05-09 中国科学院脑科学与智能技术卓越创新中心 基于CRISPR/Cas9技术的制备无嵌合基因敲除动物的方法
    CN107058358B (zh) 2017-04-01 2020-06-09 中国科学院微生物研究所 一种双spacer序列识别切割CRISPR-Cas9载体构建及其在疣孢菌中的应用
    US9938288B1 (en) 2017-04-05 2018-04-10 President And Fellows Of Harvard College Macrocyclic compound and uses thereof
    CN106967726B (zh) 2017-04-05 2020-12-29 华南农业大学 一种创建亚洲栽培稻与非洲栽培稻种间杂种亲和系的方法和应用
    CN107142282A (zh) 2017-04-06 2017-09-08 中山大学 一种利用CRISPR/Cas9在哺乳动物细胞中实现大片段DNA定点整合的方法
    CN107034229A (zh) 2017-04-07 2017-08-11 江苏贝瑞利生物科技有限公司 一种植物中高效筛选CRISPR/CAS9基因编辑系统候选sgRNA系统及应用
    CN110709513B (zh) 2017-04-11 2023-10-03 豪夫迈·罗氏有限公司 具有热稳定性增加的突变型逆转录酶以及涉及其的产物、方法和用途
    WO2018191388A1 (en) 2017-04-12 2018-10-18 The Broad Institute, Inc. Novel type vi crispr orthologs and systems
    CN107058320B (zh) 2017-04-12 2019-08-02 南开大学 Il7r基因缺失斑马鱼突变体的制备及其应用
    CN106916852B (zh) 2017-04-13 2020-12-04 上海科技大学 一种碱基编辑系统及其构建和应用方法
    CN108728476A (zh) 2017-04-14 2018-11-02 复旦大学 一种利用crispr系统产生多样性抗体文库的方法
    CN107298701B (zh) 2017-04-18 2020-10-30 上海大学 玉米转录因子ZmbZIP22及其应用
    WO2018195402A1 (en) 2017-04-20 2018-10-25 Egenesis, Inc. Methods for generating genetically modified animals
    CN106957844A (zh) 2017-04-20 2017-07-18 华侨大学 一种能有效敲除HTLV‑1病毒基因组的CRISPR/Cas9的gRNA序列
    US11591589B2 (en) 2017-04-21 2023-02-28 The General Hospital Corporation Variants of Cpf1 (Cas12a) with altered PAM specificity
    WO2018195555A1 (en) 2017-04-21 2018-10-25 The Board Of Trustees Of The Leland Stanford Junior University Crispr/cas 9-mediated integration of polynucleotides by sequential homologous recombination of aav donor vectors
    CN107043775B (zh) 2017-04-24 2020-06-16 中国农业科学院生物技术研究所 一种能促进棉花侧根发育的sgRNA及其应用
    EP3615665A1 (de) 2017-04-24 2020-03-04 DuPont Nutrition Biosciences ApS Neuartige anti-crispr-gene und proteine und verfahren zur verwendung
    US20180312822A1 (en) 2017-04-26 2018-11-01 10X Genomics, Inc. Mmlv reverse transcriptase variants
    CN206970581U (zh) 2017-04-26 2018-02-06 重庆威斯腾生物医药科技有限责任公司 一种用于辅助CRISPR/cas9基因敲除的试剂盒
    WO2018197020A1 (en) 2017-04-27 2018-11-01 Novozymes A/S Genome editing by crispr-cas9 using short donor oligonucleotides
    EP3619305A1 (de) 2017-05-03 2020-03-11 KWS SAAT SE & Co. KGaA Verwendung von crispr-cas-endonuklease zum pflanzengenom-engineering
    CN107012174A (zh) 2017-05-04 2017-08-04 昆明理工大学 CRISPR/Cas9技术在获得家蚕锌指蛋白基因突变体中的应用
    CN110785489A (zh) 2017-05-04 2020-02-11 宾夕法尼亚大学董事会 使用CRISPR/Cpf1在T细胞中进行基因编辑的组合物和方法
    CN107254485A (zh) 2017-05-08 2017-10-17 南京农业大学 一种能够快速构建植物基因定点敲除载体的新反应体系
    WO2018208755A1 (en) 2017-05-09 2018-11-15 The Regents Of The University Of California Compositions and methods for tagging target proteins in proximity to a nucleotide sequence of interest
    CN107129999A (zh) 2017-05-09 2017-09-05 福建省农业科学院畜牧兽医研究所 利用稳转CRISPR/Cas9系统对病毒基因组进行靶向编辑的方法
    EP3622070A2 (de) 2017-05-10 2020-03-18 Editas Medicine, Inc. Crispr/rna-geführte nukleasesysteme und -verfahren
    CN110869498A (zh) 2017-05-10 2020-03-06 加利福尼亚大学董事会 经由核递送crispr/cas9导向编辑细胞rna
    CN107130000B (zh) 2017-05-12 2019-12-17 浙江卫未生物医药科技有限公司 一种同时敲除KRAS基因和EGFR基因的CRISPR-Cas9系统及其应用
    WO2018209320A1 (en) 2017-05-12 2018-11-15 President And Fellows Of Harvard College Aptazyme-embedded guide rnas for use with crispr-cas9 in genome editing and transcriptional activation
    WO2018213351A1 (en) 2017-05-16 2018-11-22 The Regents Of The University Of California Thermostable rna-guided endonucleases and methods of use thereof
    CN106916820B (zh) 2017-05-16 2019-09-27 吉林大学 能有效编辑猪ROSA26基因的sgRNA及其应用
    CN106967697B (zh) 2017-05-16 2021-03-26 上海交通大学 一种Cas9核酸酶G915F及其用途
    CN107012250B (zh) 2017-05-16 2021-01-29 上海交通大学 一种适用于CRISPR/Cas9系统的基因组DNA片段编辑精准度的分析方法及应用
    CN106987570A (zh) 2017-05-16 2017-07-28 上海交通大学 一种Cas9核酸酶R780A及其用途
    CN106947750B (zh) 2017-05-16 2020-12-08 上海交通大学 一种Cas9核酸酶Q920P及其用途
    CN106957830B (zh) 2017-05-16 2020-12-25 上海交通大学 一种Cas9核酸酶ΔF916及其用途
    CN106957831B (zh) 2017-05-16 2021-03-12 上海交通大学 一种Cas9核酸酶K918A及其用途
    CN106939303B (zh) 2017-05-16 2021-02-23 上海交通大学 一种Cas9核酸酶R919P及其用途
    CN107326042A (zh) 2017-05-16 2017-11-07 上海交通大学 水稻tms10基因的定点敲除系统及其应用
    EP3625340A4 (de) 2017-05-18 2021-02-24 Cargill, Incorporated Genomeditiersystem
    WO2018213726A1 (en) 2017-05-18 2018-11-22 The Broad Institute, Inc. Systems, methods, and compositions for targeted nucleic acid editing
    EP3625359A4 (de) 2017-05-18 2021-03-03 Children's National Medical Center Zusammensetzungen mit aptameren und nukleinsäurenutzlasten und verfahren zu deren verwendung
    AU2018270088B2 (en) 2017-05-18 2024-05-16 Massachusetts Institute Of Technology Systems, methods, and compositions for targeted nucleic acid editing
    CN107043787B (zh) 2017-05-19 2017-12-26 南京医科大学 一种基于CRISPR/Cas9获得MARF1定点突变小鼠模型的构建方法和应用
    CN107236737A (zh) 2017-05-19 2017-10-10 上海交通大学 特异靶向拟南芥ILK2基因的sgRNA序列及其应用
    WO2018217852A1 (en) 2017-05-23 2018-11-29 Gettysburg College Crispr based tool for characterizing bacterial serovar diversity
    CN107034188B (zh) 2017-05-24 2018-07-24 中山大学附属口腔医院 一种靶向骨的外泌体载体、CRISPR/Cas9基因编辑系统及应用
    CN110997728A (zh) 2017-05-25 2020-04-10 通用医疗公司 二分型碱基编辑器(bbe)结构和ii-型-cas9锌指编辑
    CN107177625B (zh) 2017-05-26 2021-05-25 中国农业科学院植物保护研究所 一种定点突变的人工载体系统及定点突变方法
    WO2018217981A1 (en) 2017-05-26 2018-11-29 North Carolina State University Altered guide rnas for modulating cas9 activity and methods of use
    CN107287245B (zh) 2017-05-27 2020-03-17 南京农业大学 一种基于CRISPR/Cas9技术的Glrx1基因敲除动物模型的构建方法
    CN107142272A (zh) 2017-06-05 2017-09-08 南京金斯瑞生物科技有限公司 一种控制大肠杆菌中质粒复制的方法
    US20200140835A1 (en) 2017-06-06 2020-05-07 The General Hospital Corporation Engineered CRISPR-Cas9 Nucleases
    CN107034218A (zh) 2017-06-07 2017-08-11 浙江大学 用于猪APN基因编辑的靶向sgRNA、修饰载体及其制备方法和应用
    CN107119071A (zh) 2017-06-07 2017-09-01 江苏三黍生物科技有限公司 一种降低植物直链淀粉含量的方法及应用
    CN107177595A (zh) 2017-06-07 2017-09-19 浙江大学 用于猪CD163基因编辑的靶向sgRNA、修饰载体及其制备方法和应用
    CN106987757A (zh) 2017-06-12 2017-07-28 苏州双金实业有限公司 一种耐腐蚀型奥氏体镍基合金
    CN107236739A (zh) 2017-06-12 2017-10-10 上海捷易生物科技有限公司 CRISPR/SaCas9特异性敲除人CXCR4基因的方法
    CN107227352A (zh) 2017-06-13 2017-10-03 西安医学院 基于eGFP的GPR120基因表达的检测方法及应用
    CN107083392B (zh) 2017-06-13 2020-09-08 中国医学科学院病原生物学研究所 一种CRISPR/Cpf1基因编辑系统及其在分枝杆菌中的应用
    CN107245502B (zh) 2017-06-14 2020-11-03 中国科学院武汉病毒研究所 Cd2结合蛋白(cd2ap)和其相互作用蛋白
    CN107312798B (zh) 2017-06-16 2020-06-23 武汉大学 含特异靶向CCR5基因的gRNA序列的CRISPR/Cas9重组慢病毒载体及应用
    CN107099850B (zh) 2017-06-19 2018-05-04 东北农业大学 一种通过酶切基因组构建CRISPR/Cas9基因组敲除文库的方法
    CN107266541B (zh) 2017-06-20 2021-06-04 上海大学 玉米转录因子ZmbHLH167及其应用
    CN107446951B (zh) 2017-06-20 2021-01-08 温氏食品集团股份有限公司 一种通过CRISPR/Cas9系统快速筛选重组鸡痘病毒的方法及其应用
    CN107058328A (zh) 2017-06-22 2017-08-18 江苏三黍生物科技有限公司 一种提高植物直链淀粉含量的方法及应用
    US10011849B1 (en) 2017-06-23 2018-07-03 Inscripta, Inc. Nucleic acid-guided nucleases
    CN107099533A (zh) 2017-06-23 2017-08-29 东北农业大学 一种特异靶向猪IGFBP3基因的sgRNA导向序列及应用
    US9982279B1 (en) 2017-06-23 2018-05-29 Inscripta, Inc. Nucleic acid-guided nucleases
    CN107227307A (zh) 2017-06-23 2017-10-03 东北农业大学 一种特异靶向猪IRS1基因的sgRNA导向序列及其应用
    CN107119053A (zh) 2017-06-23 2017-09-01 东北农业大学 一种特异靶向猪MC4R基因的sgRNA导向序列及其应用
    CN107177631B (zh) 2017-06-26 2020-11-24 中国农业大学 利用CRISPR-CAS9技术敲除NRK细胞Slc22a2基因的方法
    CN111328290A (zh) 2017-06-26 2020-06-23 博德研究所 用于靶向核酸编辑的基于crispr/cas-腺嘌呤脱氨酶的组合物、系统和方法
    WO2019005886A1 (en) 2017-06-26 2019-01-03 The Broad Institute, Inc. CRISPR / CAS-CYTIDINE DEAMINASE COMPOSITIONS, SYSTEMS AND METHODS FOR TARGETED EDITING OF NUCLEIC ACIDS
    CN107217075B (zh) 2017-06-28 2021-07-02 西安交通大学医学院第一附属医院 一种构建epo基因敲除斑马鱼动物模型的方法及引物、质粒与制备方法
    CN107356793A (zh) 2017-07-01 2017-11-17 合肥东玖电气有限公司 一种防火电表箱
    CN107312793A (zh) 2017-07-05 2017-11-03 新疆农业科学院园艺作物研究所 Cas9介导的番茄基因编辑载体及其应用
    WO2019010384A1 (en) * 2017-07-07 2019-01-10 The Broad Institute, Inc. METHODS FOR DESIGNING GUIDE SEQUENCES FOR GUIDED NUCLEASES
    CN107190006A (zh) 2017-07-07 2017-09-22 南通大学附属医院 一种靶向IGF‑IR基因的sgRNA及其应用
    CN107236741A (zh) 2017-07-19 2017-10-10 广州医科大学附属第五医院 一种敲除野生型T细胞TCR alpha链的gRNA及方法
    CN107400677B (zh) 2017-07-19 2020-05-22 江南大学 一种基于CRISPR-Cas9系统的地衣芽孢杆菌基因组编辑载体及其制备方法
    CN107354156B (zh) 2017-07-19 2021-02-09 广州医科大学附属第五医院 一种敲除野生型T细胞TCR beta链的gRNA及方法
    CN107190008A (zh) 2017-07-19 2017-09-22 苏州吉赛基因测序科技有限公司 一种基于Crispr/cas9的捕获基因组目标序列的方法及其在高通量测序中的应用
    CN107446954A (zh) 2017-07-28 2017-12-08 新乡医学院 一种sd大鼠t细胞缺失遗传模型的制备方法
    CN107435051B (zh) 2017-07-28 2020-06-02 新乡医学院 一种通过CRISPR/Cas9系统快速获得大片段缺失的细胞系基因敲除方法
    CN107435069A (zh) 2017-07-28 2017-12-05 新乡医学院 一种细胞系CRISPR/Cas9基因敲除的快速检测方法
    CN107384922A (zh) 2017-07-28 2017-11-24 重庆医科大学附属儿童医院 CRISPR/Cas9靶向敲除人CNE9基因及其特异性gRNA
    US11732274B2 (en) 2017-07-28 2023-08-22 President And Fellows Of Harvard College Methods and compositions for evolving base editors using phage-assisted continuous evolution (PACE)
    CN107267515B (zh) 2017-07-28 2020-08-25 重庆医科大学附属儿童医院 CRISPR/Cas9靶向敲除人CNE10基因及其特异性gRNA
    CN107418974A (zh) 2017-07-28 2017-12-01 新乡医学院 一种利用单克隆细胞分选快速获得CRISPR/Cas9基因敲除稳定细胞株的方法
    CN107217042B (zh) 2017-07-31 2020-03-06 江苏东抗生物医药科技有限公司 一种生产无岩藻糖基化蛋白的基因工程细胞系及其建立方法
    CN107446922A (zh) 2017-08-03 2017-12-08 无锡市第二人民医院 一种敲除人成骨细胞株中hepcidin基因的gRNA序列及其使用方法
    CN107502618B (zh) 2017-08-08 2021-03-12 中国科学院微生物研究所 可控载体消除方法及易用型CRISPR-Cas9工具
    CN107312785B (zh) 2017-08-09 2019-12-06 四川农业大学 OsKTN80b基因在降低水稻株高方面的应用
    CN107384926B (zh) 2017-08-13 2020-06-26 中国人民解放军疾病预防控制所 一种靶向清除细菌耐药性质粒的CRISPR-Cas9系统及应用
    CN107365804B (zh) 2017-08-13 2019-12-20 中国人民解放军疾病预防控制所 一种使用温和噬菌体载体包装CRISPR-Cas9系统的方法
    CN107446923B (zh) 2017-08-13 2019-12-31 中国人民解放军疾病预防控制所 rAAV8-CRISPR-SaCas9系统及在制备乙肝治疗药物中的应用
    CN107815463A (zh) 2017-08-15 2018-03-20 西南大学 CRISPR/Cas9技术介导miR167前体序列编辑体系的建立方法
    CN108034656A (zh) 2017-08-16 2018-05-15 四川省农业科学院生物技术核技术研究所 与水稻红褐色颖壳性状有关的sgRNA、CRISPR/Cas9载体、载体构建、应用
    CN107446924B (zh) 2017-08-16 2020-01-14 中国科学院华南植物园 一种基于CRISPR-Cas9的猕猴桃基因AcPDS编辑载体及其构建方法和应用
    CN107384894B (zh) 2017-08-21 2019-10-22 华南师范大学 功能化氧化石墨烯高效运载CRISPR/Cas9用于基因编辑的方法
    CN107299114B (zh) 2017-08-23 2021-08-27 中国科学院分子植物科学卓越创新中心 一种高效的酵母菌染色体融合方法
    CN107557393B (zh) 2017-08-23 2020-05-08 中国科学院上海应用物理研究所 一种磁性纳米材料介导的CRISPR/Cas9 T细胞内递送系统及其制备方法和应用
    CN107312795A (zh) 2017-08-24 2017-11-03 浙江省农业科学院 运用CRISPR/Cas9系统创制粉色果实番茄的基因编辑方法
    EP3673059A4 (de) 2017-08-25 2021-09-01 President And Fellows Of Harvard College Entwicklung von bont-peptidasen
    CN107488649A (zh) 2017-08-25 2017-12-19 南方医科大学 一种Cpf1和p300核心结构域的融合蛋白、相应的DNA靶向激活系统和应用
    CN107460196A (zh) 2017-08-25 2017-12-12 同济大学 一种免疫缺陷小鼠动物模型的构建方法及应用
    CN107541525B (zh) 2017-08-26 2021-12-10 内蒙古大学 一种基于CRISPR/Cas9技术介导山羊Tβ4基因定点敲入的方法
    CN107446932B (zh) 2017-08-29 2020-02-21 江西省农业科学院 一个控制水稻雄性生殖发育基因及其应用
    EP3676376A2 (de) 2017-08-30 2020-07-08 President and Fellows of Harvard College Hocheffiziente baseneditoren mit gam
    CN107519492B (zh) 2017-09-06 2019-01-25 武汉迈特维尔生物科技有限公司 使用CRISPR技术敲除miR-3187-3p在冠状动脉粥样硬化性心脏病中的应用
    CN107362372B (zh) 2017-09-07 2019-01-11 佛山波若恩生物科技有限公司 使用crispr技术在冠状动脉粥样硬化性心脏病中的应用
    CN107641631A (zh) 2017-09-07 2018-01-30 浙江工业大学 一种由化学转化介导的基于CRISPR/Cas9系统敲除大肠杆菌基因的方法
    CN107502608B (zh) 2017-09-08 2020-10-16 中山大学 用于敲除人ALDH2基因的sgRNA、ALDH2基因缺失细胞株的构建方法及应用
    WO2019051097A1 (en) * 2017-09-08 2019-03-14 The Regents Of The University Of California RNA-GUIDED ENDONUCLEASE FUSION POLYPEPTIDES AND METHODS OF USING SAME
    CN107557455A (zh) 2017-09-15 2018-01-09 国家纳米科学中心 一种基于CRISPR‑Cas13a的特异性核酸片段的检测方法
    US11624130B2 (en) 2017-09-18 2023-04-11 President And Fellows Of Harvard College Continuous evolution for stabilized proteins
    CN107557390A (zh) 2017-09-18 2018-01-09 江南大学 一种筛选cho细胞系高表达位点的方法
    CN107475300B (zh) 2017-09-18 2020-04-21 上海市同济医院 Ifit3-eKO1基因敲除小鼠动物模型的构建方法和应用
    CN107630042A (zh) 2017-09-19 2018-01-26 安徽大学 一种源于I型Cas系统4个cas基因的原核生物基因编辑方法
    CN107557373A (zh) 2017-09-19 2018-01-09 安徽大学 一种基于I‑B型CRISPR‑Cas系统基因cas3的基因编辑方法
    CN107523583A (zh) 2017-09-19 2017-12-29 安徽大学 一种源于I型CRISPR‑Cas系统中基因cas5‑3的原核基因编辑方法
    CN107630041A (zh) 2017-09-19 2018-01-26 安徽大学 一种基于维吉尼亚链霉菌IBL14 I‑B型Cas系统的真核基因编辑方法
    CN107557378A (zh) 2017-09-19 2018-01-09 安徽大学 一种基于I型CRISPR‑Cas系统中基因cas7‑3的真核基因编辑方法
    CN107619837A (zh) 2017-09-20 2018-01-23 西北农林科技大学 利用Cas9切割核酸酶介导Ipr1定点插入获取转基因牛胎儿成纤维细胞的方法
    CN107513531B (zh) 2017-09-21 2020-02-21 无锡市妇幼保健院 用于内源性过表达lncRNA-XIST的gRNA靶点序列及其应用
    CN107686848A (zh) 2017-09-26 2018-02-13 中山大学孙逸仙纪念医院 转座子协同CRISPR/Cas9系统的稳定敲除单质粒载体及其应用
    CN107557394A (zh) 2017-09-29 2018-01-09 南京鼓楼医院 降低CRISPR/Cas9介导的胚胎基因编辑脱靶率的方法
    CN107760652A (zh) 2017-09-29 2018-03-06 华南理工大学 CRISPR/CAS9介导药物转运体靶向性敲除的caco‑2细胞模型及其方法
    CN107828794A (zh) 2017-09-30 2018-03-23 上海市农业生物基因中心 一种水稻耐盐基因OsRR22突变体、其编码的氨基酸序列、植株及该突变体的创制方法
    CN107760663A (zh) 2017-09-30 2018-03-06 新疆大学 油莎草pepc基因的克隆及表达载体的构建和应用
    CN107630006B (zh) 2017-09-30 2020-09-11 山东兴瑞生物科技有限公司 一种制备tcr与hla双基因敲除的t细胞的方法
    CN107604003A (zh) 2017-10-10 2018-01-19 南方医科大学 一种基于线性化crispr‑cas9慢病毒载体基因敲除试剂盒及其应用
    CN107557381A (zh) 2017-10-12 2018-01-09 南京农业大学 一种白菜CRISPR‑Cas9基因编辑体系的建立及其应用
    CN108102940B (zh) 2017-10-12 2021-07-13 中石化上海工程有限公司 一株利用CRISPR/Cas9系统敲除XKS1基因的工业酿酒酵母菌株及构建方法
    CN107474129B (zh) 2017-10-12 2018-10-19 江西汉氏联合干细胞科技有限公司 特异性增强crispr-cas系统基因编辑效率的方法
    CN108103586A (zh) 2017-10-13 2018-06-01 上海科技大学 一种CRISPR/Cas9随机文库及其构建和应用
    CN107619829B (zh) 2017-10-14 2018-08-24 南京平港生物技术有限公司 使用crispr-cas系统对间充质干细胞进行gins2基因敲除的方法
    CN107586779B (zh) 2017-10-14 2018-08-28 天津金匙生物科技有限公司 使用crispr-cas系统对间充质干细胞进行casp3基因敲除的方法
    KR20200121782A (ko) 2017-10-16 2020-10-26 더 브로드 인스티튜트, 인코퍼레이티드 아데노신 염기 편집제의 용도
    CN107523567A (zh) 2017-10-16 2017-12-29 遵义医学院 一种敲除人ezrin基因增强子的食管癌细胞株的构建方法
    CN107760715B (zh) 2017-10-17 2021-12-10 张业胜 一种转基因载体及其构建方法和应用
    CN107937427A (zh) 2017-10-20 2018-04-20 广东石油化工学院 一种基于CRISPR/Cas9体系的同源修复载体构建方法
    WO2019084062A1 (en) 2017-10-23 2019-05-02 The Broad Institute, Inc. SYSTEMS, METHODS AND COMPOSITIONS FOR TARGETED NUCLEIC ACID EDITION
    CN107893086B (zh) 2017-10-24 2021-09-03 中国科学院武汉植物园 快速构建配对sgRNA的Cas9双元表达载体文库的方法
    CN107760684B (zh) 2017-11-03 2018-09-25 上海拉德钫斯生物科技有限公司 使用crispr-cas系统对间充质干细胞进行rbm17基因敲除的方法
    US20200239379A1 (en) 2017-11-05 2020-07-30 Aveterra Corp Method and Apparatus for Automated Composting of Organic Wastes
    CN107858346B (zh) 2017-11-06 2020-06-16 天津大学 一种敲除酿酒酵母染色体的方法
    CN107794276A (zh) 2017-11-08 2018-03-13 中国农业科学院作物科学研究所 一种crispr介导快速有效的农作物定点基因片段或等位基因替换方法和体系
    US20200318086A1 (en) 2017-11-10 2020-10-08 Novozymes A/S Temperature-sensitive cas9 protein
    CN107630043A (zh) 2017-11-14 2018-01-26 吉林大学 采用敲除技术建立Gadd45a敲除兔模型的方法
    CN108441519A (zh) 2017-11-15 2018-08-24 中国农业大学 在crispr/cas9基因编辑中提高同源修复效率的方法
    CN107858373B (zh) 2017-11-16 2020-03-17 山东省千佛山医院 内皮细胞条件性敲除ccr5基因小鼠模型的构建方法
    CN108192956B (zh) 2017-11-17 2021-06-01 东南大学 一种基于Cas9核酸酶的DNA检测分析方法及其应用
    CN107893075A (zh) 2017-11-17 2018-04-10 和元生物技术(上海)股份有限公司 CRISPR‑Cas9靶向敲除人肠癌细胞RITA基因及其特异性的sgRNA
    CN107828874B (zh) 2017-11-20 2020-10-16 东南大学 一种基于crispr的dna检测和分型方法及其应用
    CN107653256A (zh) 2017-11-21 2018-02-02 云南省烟草农业科学研究院 一种烟草多酚氧化酶基因NtPPO1及其定点突变方法与应用
    CN107904261A (zh) 2017-11-21 2018-04-13 福州大学 CRISPR/Cas9纳米基因系统的制备及其在转染方面的应用
    CN107893076A (zh) 2017-11-23 2018-04-10 和元生物技术(上海)股份有限公司 CRISPR‑Cas9靶向敲除人乳腺癌细胞RASSF2基因及其特异性的sgRNA
    CN107937501A (zh) 2017-11-24 2018-04-20 安徽师范大学 一种快速简便的筛选CRISPR/Cas基因编辑阳性对象的方法
    CN107937432B (zh) 2017-11-24 2020-05-01 华中农业大学 一种基于crispr系统的基因组编辑方法及其应用
    CN107828738A (zh) 2017-11-28 2018-03-23 新乡医学院 一种dna甲基转移酶缺陷型cho细胞系及其制备方法及应用
    CN107988256B (zh) 2017-12-01 2020-07-28 暨南大学 人亨廷顿基因敲入用重组载体及其构建方法和在模型猪构建中的应用
    CN108148873A (zh) 2017-12-06 2018-06-12 南方医科大学 一种cav-1基因缺失斑马鱼及其制备方法
    CN108570479B (zh) 2017-12-06 2020-04-03 内蒙古大学 一种基于CRISPR/Cas9技术介导绒山羊VEGF基因定点敲入的方法
    CN107974466B (zh) 2017-12-07 2020-09-29 中国科学院水生生物研究所 一种鲟鱼CRISPR/Cas9基因编辑方法
    CN108251423B (zh) 2017-12-07 2020-11-06 嘉兴市第一医院 CRISPR-Cas9系统特异性靶向人RSPO2基因的sgRNA及激活方法和应用
    CN108315330B (zh) 2017-12-07 2020-05-19 嘉兴市第一医院 CRISPR-Cas9系统特异性靶向人RSPO2基因的sgRNA及敲除方法和应用
    CN108148835A (zh) 2017-12-07 2018-06-12 和元生物技术(上海)股份有限公司 CRISPR-Cas9靶向敲除SLC30A1基因及其特异性的sgRNA
    CN107828826A (zh) 2017-12-12 2018-03-23 南开大学 一种体外高效获得神经干细胞的方法
    CN108103090B (zh) 2017-12-12 2021-06-15 中山大学附属第一医院 靶向RNA甲基化的RNA Cas9-m6A修饰载体系统及其构建方法和应用
    WO2019118935A1 (en) 2017-12-14 2019-06-20 Casebia Therapeutics Limited Liability Partnership Novel rna-programmable endonuclease systems and their use in genome editing and other applications
    CN108103098B (zh) 2017-12-14 2020-07-28 华南理工大学 一种化合物皮肤致敏体外评估细胞模型及其构建方法
    WO2019118949A1 (en) 2017-12-15 2019-06-20 The Broad Institute, Inc. Systems and methods for predicting repair outcomes in genetic engineering
    CN107988268A (zh) 2017-12-18 2018-05-04 湖南师范大学 一种基因敲除选育tcf25基因缺失型斑马鱼的方法
    CN108018316A (zh) 2017-12-20 2018-05-11 湖南师范大学 一种基因敲除选育rmnd5b基因缺失型斑马鱼的方法
    WO2019123430A1 (en) 2017-12-21 2019-06-27 Casebia Therapeutics Llp Materials and methods for treatment of usher syndrome type 2a and/or non-syndromic autosomal recessive retinitis pigmentosa (arrp)
    CN108048466B (zh) 2017-12-21 2020-02-07 嘉兴市第一医院 CRISPR-Cas13a系统特异性靶向人RSPO2基因的crRNA及系统和应用
    RU2652899C1 (ru) 2017-12-28 2018-05-03 Федеральное бюджетное учреждение науки "Центральный научно-исследовательский институт эпидемиологии" Федеральной службы по надзору в сфере защиты прав потребителей и благополучия человека (ФБУН ЦНИИ Эпидемиологии Роспотребнадзора) РНК-проводники для подавления репликации вируса гепатита B и для элиминации вируса гепатита B из клетки-хозяина
    CN107893080A (zh) 2017-12-29 2018-04-10 江苏省农业科学院 一种靶向大鼠Inhba基因的sgRNA及其应用
    CN107988246A (zh) 2018-01-05 2018-05-04 汕头大学医学院 一种基因敲除载体及其斑马鱼胶质瘤模型
    CN107988229B (zh) 2018-01-05 2020-01-07 中国农业科学院作物科学研究所 一种利用CRISPR-Cas修饰OsTAC1基因获得分蘖改变的水稻的方法
    CN108103092B (zh) 2018-01-05 2021-02-12 中国农业科学院作物科学研究所 利用CRISPR-Cas系统修饰OsHPH基因获得矮化水稻的系统及其应用
    CN108559760A (zh) 2018-01-09 2018-09-21 陕西师范大学 基于CRISPR靶向基因组修饰技术建立荧光素酶knock-in细胞系的方法
    WO2019139951A1 (en) 2018-01-09 2019-07-18 The United States Of America As Represented By The Secretary Of The Department Of Health And Human Services Detecting protein interaction sites in nucleic acids
    US11268092B2 (en) 2018-01-12 2022-03-08 GenEdit, Inc. Structure-engineered guide RNA
    CN108559730B (zh) 2018-01-12 2021-09-24 中国人民解放军第四军医大学 利用CRISPR/Cas9技术构建Hutat2:Fc基因敲入单核细胞的实验方法
    CN108148837A (zh) 2018-01-12 2018-06-12 南京医科大学 ApoE-CRISPR/Cas9载体及其在敲除ApoE基因中的应用
    CN108251451A (zh) 2018-01-16 2018-07-06 西南大学 HTT的CRISPR/Cas9-gRNA打靶序列对、质粒及其应用
    CN108251452A (zh) 2018-01-17 2018-07-06 扬州大学 一种表达Cas9基因的转基因斑马鱼及其构建方法和应用
    JP7075170B2 (ja) 2018-01-23 2022-05-25 インスティチュート フォー ベーシック サイエンス 延長された単一ガイドrna及びその用途
    CN208034188U (zh) 2018-02-09 2018-11-02 衡阳市振洋汽车配件有限公司 一种快速定位的加工孔用夹具
    CN108359712B (zh) 2018-02-09 2020-06-26 广东省农业科学院农业生物基因研究中心 一种快速高效筛选SgRNA靶向DNA序列的方法
    CN108559745A (zh) 2018-02-10 2018-09-21 和元生物技术(上海)股份有限公司 基于CRISPR-Cas9技术提高B16F10细胞转染效率的方法
    CN108486145A (zh) 2018-02-12 2018-09-04 中国科学院遗传与发育生物学研究所 基于CRISPR/Cas9的植物高效同源重组方法
    CN108359691B (zh) 2018-02-12 2021-09-28 中国科学院重庆绿色智能技术研究院 利用mito-CRISPR/Cas9系统敲除异常线粒体DNA的试剂盒及方法
    EP3752647B1 (de) 2018-02-15 2022-05-25 The Broad Institute, Inc. Zellendatenschreiber und verwendungen davon
    CN109021111B (zh) 2018-02-23 2021-12-07 上海科技大学 一种基因碱基编辑器
    CN108396027A (zh) 2018-02-27 2018-08-14 和元生物技术(上海)股份有限公司 CRISPR-Cas9靶向敲除人肠癌细胞DEAF1基因及其特异性的sgRNA
    WO2019168953A1 (en) 2018-02-27 2019-09-06 President And Fellows Of Harvard College Evolved cas9 variants and uses thereof
    CN108486159B (zh) 2018-03-01 2021-10-22 南通大学附属医院 一种敲除GRIN2D基因的CRISPR-Cas9系统及其应用
    CN108342480B (zh) 2018-03-05 2022-03-01 北京医院 一种基因变异检测质控物及其制备方法
    CN108410906A (zh) 2018-03-05 2018-08-17 淮海工学院 一种适用于海洋甲壳类线粒体基因组的CRISPR/Cpf1基因编辑方法
    CN108410907B (zh) 2018-03-08 2021-08-27 湖南农业大学 一种基于CRISPR/Cas9技术实现HMGCR基因敲除的方法
    CN108410911B (zh) 2018-03-09 2021-08-20 广西医科大学 基于CRISPR/Cas9技术构建的LMNA基因敲除的细胞系
    CN108486108B (zh) 2018-03-16 2020-10-09 华南农业大学 一种敲除人hmgb1基因的细胞株及其应用
    CN108486146B (zh) 2018-03-16 2021-02-19 中国农业科学院作物科学研究所 LbCpf1-RR突变体用于CRISPR/Cpf1系统在植物基因编辑中的应用
    AU2019237541A1 (en) 2018-03-23 2020-10-08 Editas Medicine, Inc. CRISPR/Cas9-mediated exon-skipping approach for USH2A-associated Usher syndrome
    CN108384784A (zh) 2018-03-23 2018-08-10 广西医科大学 一种利用CRISPR/Cas9技术敲除Endoglin基因的方法
    CN108504685A (zh) 2018-03-27 2018-09-07 宜明细胞生物科技有限公司 一种利用CRISPR/Cas9系统同源重组修复IL-2RG缺陷基因的方法
    CN108410877A (zh) 2018-03-27 2018-08-17 和元生物技术(上海)股份有限公司 CRISPR-Cas9靶向敲除人细胞SANIL1基因及其特异性的sgRNA
    CN108424931A (zh) 2018-03-29 2018-08-21 内蒙古大学 CRISPR/Cas9技术介导山羊VEGF基因定点整合的方法
    CN108486234B (zh) 2018-03-29 2022-02-11 东南大学 一种crispr分型pcr的方法及其应用
    CN108504693A (zh) 2018-04-04 2018-09-07 首都医科大学附属北京朝阳医院 利用Crispr技术敲除T合酶基因构建的O-型糖基化异常的结肠癌细胞系
    CN108486111A (zh) 2018-04-04 2018-09-04 山西医科大学 CRISPR-Cas9靶向敲除人SMYD3基因的方法及其特异性sgRNA
    CN108441520B (zh) 2018-04-04 2020-07-31 苏州大学 利用CRISPR/Cas9系统构建的基因条件性敲除方法
    CN108753772B (zh) 2018-04-04 2020-10-30 南华大学 基于CRISPR/Cas技术敲除CAPNS1基因的人神经母细胞瘤细胞系的构建方法
    CN108486154A (zh) 2018-04-04 2018-09-04 福州大学 一种唾液酸酶基因敲除小鼠模型的构建方法及其应用
    CN108504657B (zh) 2018-04-12 2019-06-14 中南民族大学 利用crispr-cas9技术敲除hek293t细胞kdm2a基因的方法
    CN108753817A (zh) 2018-04-13 2018-11-06 北京华伟康信生物科技有限公司 增强细胞的抗癌能力的方法及采用该方法获得的增强型细胞
    CN108588182A (zh) 2018-04-13 2018-09-28 中国科学院深圳先进技术研究院 基于crispr-链取代的等温扩增及检测技术
    CN108823248A (zh) 2018-04-20 2018-11-16 中山大学 一种利用CRISPR/Cas9编辑陆川猪CD163基因的方法
    CN108753832A (zh) 2018-04-20 2018-11-06 中山大学 一种利用CRISPR/Cas9编辑大白猪CD163基因的方法
    CN108588071A (zh) 2018-04-25 2018-09-28 和元生物技术(上海)股份有限公司 CRISPR-Cas9靶向敲除人肠癌细胞CNR1基因及其特异性的sgRNA
    CN108546712B (zh) 2018-04-26 2020-08-07 中国农业科学院作物科学研究所 一种利用CRISPR/LbCpf1系统实现目的基因在植物中同源重组的方法
    CN108588128A (zh) 2018-04-26 2018-09-28 南昌大学 一种高效率大豆CRISPR/Cas9系统的构建方法及应用
    CN108707621B (zh) 2018-04-26 2021-02-12 中国农业科学院作物科学研究所 一种CRISPR/Cpf1系统介导的以RNA转录本为修复模板的同源重组方法
    CN108642053A (zh) 2018-04-28 2018-10-12 和元生物技术(上海)股份有限公司 CRISPR-Cas9靶向敲除人肠癌细胞PPP1R1C基因及其特异性的sgRNA
    CN108611364A (zh) 2018-05-03 2018-10-02 南京农业大学 一种非转基因crispr突变体的制备方法
    CN108588123A (zh) 2018-05-07 2018-09-28 南京医科大学 CRISPR/Cas9载体组合在制备基因敲除猪的血液制品中的应用
    US20220401530A1 (en) 2018-05-11 2022-12-22 Beam Therapeutics Inc. Methods of substituting pathogenic amino acids using programmable base editor systems
    CN108610399B (zh) 2018-05-14 2019-09-27 河北万玛生物医药有限公司 特异性增强crispr-cas系统在表皮干细胞中进行基因编辑效率的方法
    CN108546717A (zh) 2018-05-15 2018-09-18 吉林大学 反义lncRNA介导顺式调控抑制靶基因表达的方法
    CN108624622A (zh) 2018-05-16 2018-10-09 湖南艾佳生物科技股份有限公司 一种基于CRISPR-Cas9系统构建的能分泌小鼠白细胞介素-6的基因工程细胞株
    CN108546718B (zh) 2018-05-16 2021-07-09 康春生 crRNA介导的CRISPR/Cas13a基因编辑系统在肿瘤细胞中的应用
    CN108642055B (zh) 2018-05-17 2021-12-03 吉林大学 能有效编辑猪miR-17-92基因簇的sgRNA
    CN108642090A (zh) 2018-05-18 2018-10-12 中国人民解放军总医院 基于CRISPR/Cas9技术获得Nogo-B敲除模式小鼠的方法及应用
    CN108642077A (zh) 2018-05-18 2018-10-12 江苏省农业科学院 基于CRISPR/Cas9基因编辑技术选育绿豆不育突变体的方法及专用gRNA
    CN108642078A (zh) 2018-05-18 2018-10-12 江苏省农业科学院 基于CRISPR/Cas9基因编辑技术选育绿豆开花传粉突变体的方法及专用gRNA
    CN108559732A (zh) 2018-05-21 2018-09-21 陕西师范大学 基于CRISPR/Cas9靶向基因组修饰技术建立KI-T2A-luciferase细胞系的方法
    CN108707620A (zh) 2018-05-22 2018-10-26 西北农林科技大学 一种Gene drive载体及构建方法
    US20210198330A1 (en) 2018-05-23 2021-07-01 The Broad Institute, Inc. Base editors and uses thereof
    US11117812B2 (en) 2018-05-24 2021-09-14 Aqua-Aerobic Systems, Inc. System and method of solids conditioning in a filtration system
    CN108690844B (zh) 2018-05-25 2021-10-15 西南大学 HTT的CRISPR/Cas9-gRNA打靶序列对、质粒及HD细胞模型
    CN108707629A (zh) 2018-05-28 2018-10-26 上海海洋大学 斑马鱼notch1b基因突变体的制备方法
    CN108707628B (zh) 2018-05-28 2021-11-23 上海海洋大学 斑马鱼notch2基因突变体的制备方法
    CN108823249A (zh) 2018-05-28 2018-11-16 上海海洋大学 CRISPR/Cas9构建notch1a突变体斑马鱼的方法
    CN108753835A (zh) 2018-05-30 2018-11-06 中山大学 一种利用CRISPR/Cas9编辑猪BMP15基因的方法
    CN108707604B (zh) 2018-05-30 2019-07-23 江西汉氏联合干细胞科技有限公司 表皮干细胞中采用CRISPR-Cas系统进行CNE10基因敲除
    CN108753836B (zh) 2018-06-04 2021-10-12 北京大学 一种利用rna干扰机制的基因调控或编辑系统
    CA3102840A1 (en) 2018-06-05 2019-12-12 Lifeedit, Inc. Rna-guided nucleases and active fragments and variants thereof and methods of use
    CN108715850B (zh) 2018-06-05 2020-10-23 艾一生命科技(广东)有限公司 表皮干细胞中采用CRISPR-Cas系统进行GING2基因敲除
    CN108753813B (zh) 2018-06-08 2021-08-24 中国水稻研究所 获得无标记转基因植物的方法
    CN108753783A (zh) 2018-06-13 2018-11-06 上海市同济医院 Sqstm1全基因敲除小鼠动物模型的构建方法和应用
    WO2019241649A1 (en) 2018-06-14 2019-12-19 President And Fellows Of Harvard College Evolution of cytidine deaminases
    CN108728486A (zh) 2018-06-20 2018-11-02 江苏省农业科学院 一种茄子CRISPR/Cas9基因敲除载体的构建方法和应用
    CN108841845A (zh) 2018-06-21 2018-11-20 广东石油化工学院 一种带有筛选标记的CRISPR/Cas9载体及其构建方法
    CN108893529A (zh) 2018-06-25 2018-11-27 武汉博杰生物医学科技有限公司 一种基于CRISPR技术特异性检测人KRAS基因2号及3号外显子突变的crRNA
    CN108866093B (zh) 2018-07-04 2021-07-09 广东三杰牧草生物科技有限公司 一种利用CRISPR/Cas9系统对紫花苜蓿基因定点突变的方法
    CN108795902A (zh) 2018-07-05 2018-11-13 深圳三智医学科技有限公司 一种安全高效的CRISPR/Cas9基因编辑技术
    CN108913714A (zh) 2018-07-05 2018-11-30 江西省超级水稻研究发展中心 一种利用CRISPR/Cas9系统敲除BADH2基因创制香稻的方法
    EP3820495A4 (de) 2018-07-09 2022-07-20 The Broad Institute Inc. Rna-programmierbare epigenetische rna-modifikatoren und deren verwendungen
    CN108913691B (zh) 2018-07-16 2020-09-01 山东华御生物科技有限公司 表皮干细胞中采用CRISPR-Cas系统进行Card3基因敲除
    CN108913664B (zh) 2018-07-20 2020-09-04 嘉兴学院 一种CRISPR/Cas9基因编辑方法敲除卵巢癌细胞中CFP1基因的方法
    CN108823291B (zh) 2018-07-25 2022-04-12 领航医学科技(深圳)有限公司 基于crispr技术的特异性核酸片段定量检测方法
    CN108853133A (zh) 2018-07-25 2018-11-23 福州大学 一种PAMAM与CRISPR/Cas9系统重组质粒递送纳米粒的制备方法
    KR20210053898A (ko) 2018-07-31 2021-05-12 더 브로드 인스티튜트, 인코퍼레이티드 신규 crispr 효소 및 시스템
    CN108913717A (zh) 2018-08-01 2018-11-30 河南农业大学 一种利用CRISPR/Cas9系统对水稻PHYB基因定点突变的方法
    US20210277379A1 (en) 2018-08-03 2021-09-09 Beam Therapeutics Inc. Multi-effector nucleobase editors and methods of using same to modify a nucleic acid target sequence
    EP3841203A4 (de) 2018-08-23 2022-11-02 The Broad Institute Inc. Cas9-varianten mit nicht-kanonischen pam-spezifitäten und deren verwendungen
    JP2021534798A (ja) 2018-08-28 2021-12-16 フラッグシップ パイオニアリング イノベーションズ シックス,エルエルシー ゲノムを調節するための方法及び組成物
    WO2020051360A1 (en) 2018-09-05 2020-03-12 The Broad Institute, Inc. Base editing for treating hutchinson-gilford progeria syndrome
    WO2020086908A1 (en) 2018-10-24 2020-04-30 The Broad Institute, Inc. Constructs for improved hdr-dependent genomic editing
    US20220389395A1 (en) 2018-10-29 2022-12-08 The Broad Institute, Inc. Nucleobase editors comprising geocas9 and uses thereof
    US20220282275A1 (en) 2018-11-15 2022-09-08 The Broad Institute, Inc. G-to-t base editors and uses thereof
    CN109517841B (zh) 2018-12-05 2020-10-30 华东师范大学 一种用于核苷酸序列修饰的组合物、方法与应用
    WO2020154500A1 (en) 2019-01-23 2020-07-30 The Broad Institute, Inc. Supernegatively charged proteins and uses thereof
    JP2022523302A (ja) 2019-01-28 2022-04-22 プロキューアール セラピューティクス ツー ベスローテン フェンノートシャップ アッシャー症候群の処置のためのrna編集オリゴヌクレオチド
    EP3918070A1 (de) 2019-01-29 2021-12-08 University of Washington Verfahren zur editierung von genen
    EP3918077A4 (de) 2019-01-31 2023-03-29 Beam Therapeutics, Inc. Nukleobaseneditoren mit reduzierter off-target-deaminierung und verfahren zu deren verwendung zur modifizierung einer nukleobasenzielsequenz
    US20220177877A1 (en) 2019-03-04 2022-06-09 President And Fellows Of Harvard College Highly multiplexed base editing
    US20220170013A1 (en) 2019-03-06 2022-06-02 The Broad Institute, Inc. T:a to a:t base editing through adenosine methylation
    WO2020181178A1 (en) 2019-03-06 2020-09-10 The Broad Institute, Inc. T:a to a:t base editing through thymine alkylation
    WO2020181180A1 (en) 2019-03-06 2020-09-10 The Broad Institute, Inc. A:t to c:g base editors and uses thereof
    WO2020181202A1 (en) 2019-03-06 2020-09-10 The Broad Institute, Inc. A:t to t:a base editing through adenine deamination and oxidation
    WO2020181195A1 (en) 2019-03-06 2020-09-10 The Broad Institute, Inc. T:a to a:t base editing through adenine excision
    BR112021018606A2 (pt) 2019-03-19 2021-11-23 Harvard College Métodos e composições para editar sequências de nucleotídeos
    US20220204975A1 (en) 2019-04-12 2022-06-30 President And Fellows Of Harvard College System for genome editing
    WO2020214842A1 (en) 2019-04-17 2020-10-22 The Broad Institute, Inc. Adenine base editors with reduced off-target effects
    EP3973054A1 (de) 2019-05-20 2022-03-30 The Broad Institute Inc. Aav-abgabe von nukleobasen-editoren
    CA3139122C (en) 2019-06-06 2023-04-25 Inscripta, Inc. Curing for recursive nucleic acid-guided cell editing
    WO2020252455A1 (en) 2019-06-13 2020-12-17 The General Hospital Corporation Engineered human-endogenous virus-like particles and methods of use thereof for delivery to cells
    US20220259609A1 (en) 2019-07-30 2022-08-18 Pairwise Plants Services, Inc. Morphogenic regulators and methods of using the same
    WO2021025750A1 (en) 2019-08-08 2021-02-11 The Broad Institute, Inc. Base editors with diversified targeting scope
    WO2021030666A1 (en) 2019-08-15 2021-02-18 The Broad Institute, Inc. Base editing by transglycosylation
    US20220411777A1 (en) 2019-08-30 2022-12-29 The General Hospital Corporation C-to-G Transversion DNA Base Editors
    WO2021042062A2 (en) 2019-08-30 2021-03-04 Joung J Keith Combinatorial adenine and cytosine dna base editors
    WO2021072328A1 (en) 2019-10-10 2021-04-15 The Broad Institute, Inc. Methods and compositions for prime editing rna
    WO2021080922A1 (en) 2019-10-21 2021-04-29 The Trustees Of Columbia University In The City Of New York Methods of performing rna templated genome editing
    US11591607B2 (en) 2019-10-24 2023-02-28 Pairwise Plants Services, Inc. Optimized CRISPR-Cas nucleases and base editors and methods of use thereof
    CA3158897A1 (en) 2019-10-30 2021-05-06 Pairwise Plants Services, Inc. Type v crispr-cas base editors and methods of use thereof
    WO2021108717A2 (en) 2019-11-26 2021-06-03 The Broad Institute, Inc Systems and methods for evaluating cas9-independent off-target editing of nucleic acids
    US20230049737A1 (en) 2019-12-30 2023-02-16 The Broad Institute, Inc. Genome editing using reverse transcriptase enabled and fully active crispr complexes
    WO2021155065A1 (en) 2020-01-28 2021-08-05 The Broad Institute, Inc. Base editors, compositions, and methods for modifying the mitochondrial genome
    EP4100519A2 (de) 2020-02-05 2022-12-14 The Broad Institute, Inc. Adeninbaseneditoren und verwendungen davon
    US20230123669A1 (en) 2020-02-05 2023-04-20 The Broad Institute, Inc. Base editor predictive algorithm and method of use
    WO2021158999A1 (en) 2020-02-05 2021-08-12 The Broad Institute, Inc. Gene editing methods for treating spinal muscular atrophy
    AU2021230545A1 (en) 2020-03-04 2022-09-29 Flagship Pioneering Innovations Vi, Llc Improved methods and compositions for modulating a genome
    CN116209756A (zh) 2020-03-04 2023-06-02 旗舰先锋创新Vi有限责任公司 调控基因组的方法和组合物
    BR112022017713A2 (pt) 2020-03-04 2022-11-16 Flagship Pioneering Innovations Vi Llc Métodos e composições para modular um genoma
    WO2021178898A1 (en) 2020-03-05 2021-09-10 Flagship Pioneering Innovations Vi, Llc Host defense suppressing methods and compositions for modulating a genome
    US20230159913A1 (en) 2020-04-28 2023-05-25 The Broad Institute, Inc. Targeted base editing of the ush2a gene
    DE112021002672T5 (de) 2020-05-08 2023-04-13 President And Fellows Of Harvard College Vefahren und zusammensetzungen zum gleichzeitigen editieren beider stränge einer doppelsträngigen nukleotid-zielsequenz
    WO2022212926A1 (en) 2021-04-01 2022-10-06 Prime Medicine, Inc. Methods and compositions for editing nucleotide sequences
    EP4352230A2 (de) 2021-06-03 2024-04-17 Prime Medicine, Inc. Genomeditierungszusammensetzungen und verfahren zur behandlung der wilson-krankheit
    WO2023283092A1 (en) 2021-07-06 2023-01-12 Prime Medicine, Inc. Compositions and methods for efficient genome editing
    WO2023288332A2 (en) 2021-07-16 2023-01-19 Prime Medicine, Inc. Genome editing compositions and methods for treatment of wilson's disease
    EP4373939A2 (de) 2021-07-23 2024-05-29 Prime Medicine, Inc. Genomeditierungszusammensetzungen und verfahren zur behandlung von chronischer granulomatöser erkrankung

    Patent Citations (87)

    * Cited by examiner, † Cited by third party
    Publication number Priority date Publication date Assignee Title
    US13738A (en) 1855-10-30 eaton
    US381A (en) 1837-09-12 Samuel nicolsonj of bo
    US4217344A (en) 1976-06-23 1980-08-12 L'oreal Compositions containing aqueous dispersions of lipid spheres
    US4235871A (en) 1978-02-24 1980-11-25 Papahadjopoulos Demetrios P Method of encapsulating biologically active materials in lipid vesicles
    US4186183A (en) 1978-03-29 1980-01-29 The United States Of America As Represented By The Secretary Of The Army Liposome carriers in chemotherapy of leishmaniasis
    US4261975A (en) 1979-09-19 1981-04-14 Merck & Co., Inc. Viral liposome particle
    US4663290A (en) 1982-01-21 1987-05-05 Molecular Genetics, Inc. Production of reverse transcriptase
    US4485054A (en) 1982-10-04 1984-11-27 Lipoderm Pharmaceuticals Limited Method of encapsulating biologically active materials in multilamellar lipid vesicles (MLV)
    US4501728A (en) 1983-01-06 1985-02-26 Technology Unlimited, Inc. Masking of liposomes from RES recognition
    US4880635B1 (en) 1984-08-08 1996-07-02 Liposome Company Dehydrated liposomes
    US4880635A (en) 1984-08-08 1989-11-14 The Liposome Company, Inc. Dehydrated liposomes
    US4897355A (en) 1985-01-07 1990-01-30 Syntex (U.S.A.) Inc. N[ω,(ω-1)-dialkyloxy]- and N-[ω,(ω-1)-dialkenyloxy]-alk-1-yl-N,N,N-tetrasubstituted ammonium lipids and uses therefor
    US5049386A (en) 1985-01-07 1991-09-17 Syntex (U.S.A.) Inc. N-ω,(ω-1)-dialkyloxy)- and N-(ω,(ω-1)-dialkenyloxy)Alk-1-YL-N,N,N-tetrasubstituted ammonium lipids and uses therefor
    US4946787A (en) 1985-01-07 1990-08-07 Syntex (U.S.A.) Inc. N-(ω,(ω-1)-dialkyloxy)- and N-(ω,(ω-1)-dialkenyloxy)-alk-1-yl-N,N,N-tetrasubstituted ammonium lipids and uses therefor
    US4797368A (en) 1985-03-15 1989-01-10 The United States Of America As Represented By The Department Of Health And Human Services Adeno-associated virus as eukaryotic expression vector
    US4921757A (en) 1985-04-26 1990-05-01 Massachusetts Institute Of Technology System for delayed and pulsed release of biologically active substances
    US4774085A (en) 1985-07-09 1988-09-27 501 Board of Regents, Univ. of Texas Pharmaceutical administration systems containing a mixture of immunomodulators
    US5139941A (en) 1985-10-31 1992-08-18 University Of Florida Research Foundation, Inc. AAV transduction vectors
    US5079352A (en) 1986-08-22 1992-01-07 Cetus Corporation Purified thermostable enzyme
    US4889818A (en) 1986-08-22 1989-12-26 Cetus Corporation Purified thermostable enzyme
    US5374553A (en) 1986-08-22 1994-12-20 Hoffmann-La Roche Inc. DNA encoding a thermostable nucleic acid polymerase enzyme from thermotoga maritima
    US4920016A (en) 1986-12-24 1990-04-24 Linear Technology, Inc. Liposomes with enhanced circulation time
    US4837028A (en) 1986-12-24 1989-06-06 Liposome Technology, Inc. Liposomes with enhanced circulation time
    US4906477A (en) 1987-02-09 1990-03-06 Kabushiki Kaisha Vitamin Kenkyusyo Antineoplastic agent-entrapping liposomes
    US4911928A (en) 1987-03-13 1990-03-27 Micro-Pak, Inc. Paucilamellar lipid vesicles
    US4917951A (en) 1987-07-28 1990-04-17 Micro-Pak, Inc. Lipid vesicles formed of surfactants and steroids
    US4965185A (en) 1988-06-22 1990-10-23 Grischenko Valentin I Method for low-temperature preservation of embryos
    US5047342A (en) 1989-08-10 1991-09-10 Life Technologies, Inc. Cloning and expression of T5 DNA polymerase
    US5270179A (en) 1989-08-10 1993-12-14 Life Technologies, Inc. Cloning and expression of T5 DNA polymerase reduced in 3'- to-5' exonuclease activity
    WO1991016024A1 (en) 1990-04-19 1991-10-31 Vical, Inc. Cationic lipids for intracellular delivery of biologically active molecules
    WO1991017424A1 (en) 1990-05-03 1991-11-14 Vical, Inc. Intracellular delivery of biologically active substances by means of self-assembling lipid complexes
    WO1992006200A1 (en) 1990-09-28 1992-04-16 F. Hoffmann-La-Roche Ag 5' to 3' exonuclease mutations of thermostable dna polymerases
    WO1992006188A2 (en) 1990-10-05 1992-04-16 Barnes Wayne M Thermostable dna polymerase
    US5173414A (en) 1990-10-30 1992-12-22 Applied Immune Sciences, Inc. Production of recombinant adeno-associated virus vectors
    WO1993024641A2 (en) 1992-06-02 1993-12-09 The United States Of America, As Represented By The Secretary, Department Of Health & Human Services Adeno-associated virus with inverted terminal repeat sequences as promoter
    US5496714A (en) 1992-12-09 1996-03-05 New England Biolabs, Inc. Modification of protein by use of a controllable interveining protein sequence
    US5834247A (en) 1992-12-09 1998-11-10 New England Biolabs, Inc. Modified proteins comprising controllable intervening protein sequences or their elements methods of producing same and methods for purification of a target protein comprised by a modified protein
    US5436149A (en) 1993-02-19 1995-07-25 Barnes; Wayne M. Thermostable DNA polymerase with enhanced thermostability and enhanced length and efficiency of primer extension
    US5512462A (en) 1994-02-25 1996-04-30 Hoffmann-La Roche Inc. Methods and reagents for the polymerase chain reaction amplification of long DNA sequences
    WO1996010640A1 (en) 1994-09-30 1996-04-11 Life Technologies, Inc. Cloned dna polymerases from thermotoga neapolitana and mutants thereof
    US5614365A (en) 1994-10-17 1997-03-25 President & Fellow Of Harvard College DNA polymerase having modified nucleotide binding site for DNA sequencing
    US5677152A (en) 1995-08-25 1997-10-14 Roche Molecular Systems, Inc. Nucleic acid amplification using a reersibly inactivated thermostable enzyme
    US5962313A (en) 1996-01-18 1999-10-05 Avigen, Inc. Adeno-associated virus vectors comprising a gene encoding a lyosomal enzyme
    US6183998B1 (en) 1998-05-29 2001-02-06 Qiagen Gmbh Max-Volmer-Strasse 4 Method for reversible modification of thermostable enzymes
    US20030087817A1 (en) 1999-01-12 2003-05-08 Sangamo Biosciences, Inc. Regulation of endogenous gene expression in cells using zinc finger proteins
    US6479264B1 (en) 1999-08-27 2002-11-12 Advanced Biotechnologies Limited Reversible inactivation enzymes
    WO2001038547A2 (en) 1999-11-24 2001-05-31 Mcs Micro Carrier Systems Gmbh Polypeptides comprising multimers of nuclear localization signals or of protein transduction domains and their use for transferring molecules into cells
    US20070015238A1 (en) 2002-06-05 2007-01-18 Snyder Richard O Production of pseudotyped recombinant AAV virions
    US10202658B2 (en) 2005-02-18 2019-02-12 Monogram Biosciences, Inc. Methods for determining hypersusceptibility of HIV-1 to non-nucleoside reverse transcriptase inhibitors
    US9783791B2 (en) 2005-08-10 2017-10-10 Agilent Technologies, Inc. Mutant reverse transcriptase and methods of use
    US20120322861A1 (en) 2007-02-23 2012-12-20 Barry John Byrne Compositions and Methods for Treating Diseases
    US9534201B2 (en) 2007-04-26 2017-01-03 Ramot At Tel-Aviv University Ltd. Culture of pluripotent autologous stem cells from oral mucosa
    WO2010028347A2 (en) 2008-09-05 2010-03-11 President & Fellows Of Harvard College Continuous directed evolution of proteins and nucleic acids
    US9023594B2 (en) 2008-09-05 2015-05-05 President And Fellows Of Harvard College Continuous directed evolution of proteins and nucleic acids
    US10150955B2 (en) 2009-03-04 2018-12-11 Board Of Regents, The University Of Texas System Stabilized reverse transcriptase fusion proteins
    US20110059502A1 (en) 2009-09-07 2011-03-10 Chalasani Sreekanth H Multiple domain proteins
    US20110165540A1 (en) 2009-10-23 2011-07-07 California Institute Of Technology Games having biotechnological content
    NZ700688A (en) 2009-12-01 2016-02-26 Shire Human Genetic Therapies Delivery of mrna for the augmentation of proteins and enzymes in human genetic diseases
    US8440432B2 (en) 2009-12-10 2013-05-14 Regents Of The University Of Minnesota Tal effector-mediated DNA modification
    US8450471B2 (en) 2009-12-10 2013-05-28 Regents Of The University Of Minnesota TAL effector-mediated DNA modification
    US8440431B2 (en) 2009-12-10 2013-05-14 Regents Of The University Of Minnesota TAL effector-mediated DNA modification
    US8822663B2 (en) 2010-08-06 2014-09-02 Moderna Therapeutics, Inc. Engineered nucleic acids and methods of use thereof
    US9458484B2 (en) 2010-10-22 2016-10-04 Bio-Rad Laboratories, Inc. Reverse transcriptase mixtures with improved storage stability
    US9405700B2 (en) 2010-11-04 2016-08-02 Sonics, Inc. Methods and apparatus for virtualization in an integrated circuit
    WO2012088381A2 (en) 2010-12-22 2012-06-28 President And Fellows Of Harvard College Continuous directed evolution
    US20140065711A1 (en) 2011-03-11 2014-03-06 President And Fellows Of Harvard College Small molecule-dependent inteins and uses thereof
    ES2740248T3 (es) 2011-06-08 2020-02-05 Translate Bio Inc Composiciones de nanopartículas lipídicas y métodos para la administración ARNm
    EP2755986A1 (de) 2011-09-12 2014-07-23 Moderna Therapeutics, Inc. Manipulierte nukleinsäuren und anwendungsverfahren dafür
    EP2755693A2 (de) 2011-09-12 2014-07-23 Moderna Therapeutics, Inc. Manipulierte nukleinsäuren und anwendungsverfahren dafür
    WO2013045632A1 (en) 2011-09-28 2013-04-04 Era Biotech, S.A. Split inteins and uses thereof
    EP2877490A2 (de) 2012-06-27 2015-06-03 The Trustees Of Princeton University Geteilte inteine, konjugate davon und verwendungen davon
    US9181535B2 (en) 2012-09-24 2015-11-10 The Chinese University Of Hong Kong Transcription activator-like effector nucleases (TALENs)
    WO2014055782A1 (en) 2012-10-03 2014-04-10 Agrivida, Inc. Intein-modified proteases, their production and industrial applications
    US10189831B2 (en) 2012-10-08 2019-01-29 Merck Sharp & Dohme Corp. Non-nucleoside reverse transcriptase inhibitors
    WO2014152940A1 (en) 2013-03-14 2014-09-25 Shire Human Genetic Therapies, Inc. Mrna therapeutic compositions and use to treat diseases and disorders
    WO2015027134A1 (en) 2013-08-22 2015-02-26 President And Fellows Of Harvard College Engineered transcription activator-like effector (tale) domains and uses thereof
    US9737604B2 (en) 2013-09-06 2017-08-22 President And Fellows Of Harvard College Use of cationic lipids to deliver CAS9
    US9526784B2 (en) 2013-09-06 2016-12-27 President And Fellows Of Harvard College Delivery system for functional nucleases
    US20160355796A1 (en) 2013-12-12 2016-12-08 The Broad Institute Inc. Compositions and methods of use of crispr-cas systems in nucleotide repeat disorders
    WO2015134121A2 (en) 2014-01-20 2015-09-11 President And Fellows Of Harvard College Negative selection and stringency modulation in continuous evolution systems
    EP3450553B1 (de) 2014-03-24 2019-12-25 Translate Bio, Inc. Mrna-therapie zur behandlung von augenerkrankungen
    BR112016030852A2 (pt) 2014-07-02 2018-01-16 Shire Human Genetic Therapies encapsulação de rna mensageiro
    WO2016069774A1 (en) 2014-10-28 2016-05-06 Agrivida, Inc. Methods and compositions for stabilizing trans-splicing intein modified proteases
    WO2016168631A1 (en) 2015-04-17 2016-10-20 President And Fellows Of Harvard College Vector-based mutagenesis system
    EP3362461A1 (de) 2015-10-16 2018-08-22 Modernatx, Inc. Mrna-cap-analoga mit modifizierter phosphatverbindung
    US9932567B1 (en) 2016-09-23 2018-04-03 New England Biolabs, Inc. Mutant reverse transcriptase
    US9580698B1 (en) 2016-09-23 2017-02-28 New England Biolabs, Inc. Mutant reverse transcriptase

    Also Published As

    Publication number Publication date
    IL286324A (en) 2021-10-31
    WO2020191242A1 (en) 2020-09-24
    GB2601617A (en) 2022-06-08
    GB202114961D0 (en) 2021-12-01
    JP2022532470A (ja) 2022-07-15
    US20230078265A1 (en) 2023-03-16
    US11643652B2 (en) 2023-05-09
    AU2020242032A1 (en) 2021-10-07
    WO2020191234A1 (en) 2020-09-24
    BR112021018607A2 (pt) 2021-11-23
    GB2601618A (en) 2022-06-08
    KR20210142210A (ko) 2021-11-24
    US20230340466A1 (en) 2023-10-26
    JP2022531539A (ja) 2022-07-07
    JP2022527740A (ja) 2022-06-06
    US20230090221A1 (en) 2023-03-23
    DE112020001342T5 (de) 2022-01-13
    DE112020001306T5 (de) 2022-01-27
    GB2601617B (en) 2024-02-21
    WO2020191246A1 (en) 2020-09-24
    WO2020191153A3 (en) 2020-12-10
    CN114729365A (zh) 2022-07-08
    WO2020191241A1 (en) 2020-09-24
    EP3942041A1 (de) 2022-01-26
    CN113891937A (zh) 2022-01-04
    WO2020191243A1 (en) 2020-09-24
    WO2020191233A1 (en) 2020-09-24
    MX2021011325A (es) 2022-01-06
    EP3942042A1 (de) 2022-01-26
    AU2020240109A1 (en) 2021-09-30
    US20230340465A1 (en) 2023-10-26
    WO2020191153A2 (en) 2020-09-24
    GB2601619A (en) 2022-06-08
    WO2020191171A1 (en) 2020-09-24
    WO2020191248A1 (en) 2020-09-24
    IL286335A (en) 2021-10-31
    WO2020191153A9 (en) 2020-11-12
    CN114127285A (zh) 2022-03-01
    EP3942043A2 (de) 2022-01-26
    CA3130488A1 (en) 2020-09-24
    CN113891936A (zh) 2022-01-04
    WO2020191234A8 (en) 2021-10-21
    US11795452B2 (en) 2023-10-24
    KR20210143230A (ko) 2021-11-26
    US20230332144A1 (en) 2023-10-19
    GB202114960D0 (en) 2021-12-01
    US20220356469A1 (en) 2022-11-10
    SG11202109882VA (en) 2021-10-28
    CA3129988A1 (en) 2020-09-24
    US20230340467A1 (en) 2023-10-26
    US20230383289A1 (en) 2023-11-30
    WO2020191249A1 (en) 2020-09-24
    WO2020191248A8 (en) 2021-10-21
    GB202114958D0 (en) 2021-12-01
    JP2022526908A (ja) 2022-05-27
    MX2021011426A (es) 2022-03-11
    WO2020191245A1 (en) 2020-09-24
    WO2020191153A8 (en) 2020-12-30
    EP3942040A1 (de) 2022-01-26
    WO2020191171A9 (en) 2020-10-29
    WO2020191239A1 (en) 2020-09-24
    BR112021018606A2 (pt) 2021-11-23
    SG11202109679VA (en) 2021-10-28
    US11447770B1 (en) 2022-09-20

    Similar Documents

    Publication Publication Date Title
    US11447770B1 (en) Methods and compositions for prime editing nucleotide sequences
    US11912985B2 (en) Methods and compositions for simultaneous editing of both strands of a target double-stranded nucleotide sequence
    AU2021350835A2 (en) Prime editing guide rnas, compositions thereof, and methods of using the same
    JPWO2020191243A5 (de)
    JPWO2020191234A5 (de)
    JPWO2020191233A5 (de)