WO2021096391A1 - Применение cas9 бежа из бактерии pasteurella pneumotropica - Google Patents

Применение cas9 бежа из бактерии pasteurella pneumotropica Download PDF

Info

Publication number
WO2021096391A1
WO2021096391A1 PCT/RU2020/050145 RU2020050145W WO2021096391A1 WO 2021096391 A1 WO2021096391 A1 WO 2021096391A1 RU 2020050145 W RU2020050145 W RU 2020050145W WO 2021096391 A1 WO2021096391 A1 WO 2021096391A1
Authority
WO
WIPO (PCT)
Prior art keywords
dna
sequence
leu
protein
lys
Prior art date
Application number
PCT/RU2020/050145
Other languages
English (en)
French (fr)
Inventor
Константин Викторович СЕВЕРИНОВ
Сергей Анатольевич ШМАКОВ
Дарья Николаевна АРТАМОНОВА
Игнатий Игоревич ГОРЯНИН
Ольга Сергеевна МУШАРОВА
Юлия Валерьевна АНДРЕЕВА
Татьяна Игоревна ЗЮБКО
Яна Витальевна ФЁДОРОВА
Михаил Алексеевич ХОДОРКОВСКИЙ
Георгий Евгеньевич ПОБЕГАЛОВ
Анатолий Николаевич АРСЕНИЕВ
Полина Анатольевна СЕЛЬКОВА
Александра Андреевна ВАСИЛЬЕВА
Татьяна Олеговна АРТАМОНОВА
Марина Викторовна АБРАМОВА
Original Assignee
Закрытое Акционерное Общество "Биокад"
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to MA57032A priority Critical patent/MA57032A1/fr
Priority to MX2022005685A priority patent/MX2022005685A/es
Priority to CA3157898A priority patent/CA3157898A1/en
Priority to US17/775,626 priority patent/US20220403369A1/en
Priority to JP2022527121A priority patent/JP2023501524A/ja
Priority to EP20887900.7A priority patent/EP4056705A4/en
Priority to CN202080092630.XA priority patent/CN115397995A/zh
Priority to PE2022000763A priority patent/PE20230035A1/es
Application filed by Закрытое Акционерное Общество "Биокад" filed Critical Закрытое Акционерное Общество "Биокад"
Priority to KR1020227019785A priority patent/KR20220145324A/ko
Priority to BR112022009148A priority patent/BR112022009148A2/pt
Priority to AU2020384851A priority patent/AU2020384851A1/en
Publication of WO2021096391A1 publication Critical patent/WO2021096391A1/ru
Priority to ZA2022/05208A priority patent/ZA202205208B/en
Priority to CONC2022/0006156A priority patent/CO2022006156A2/es

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y301/00Hydrolases acting on ester bonds (3.1)

Definitions

  • the invention relates to biotechnology, namely, to new enzymes, Cas nucleases of the CRISPR-Cas systems, used for cutting DNA and editing the genome of various organisms.
  • This technology can be used in the future for gene therapy of hereditary human diseases, as well as for editing the genome of other organisms.
  • CRISPR-Cas systems artificial nuclease systems containing zinc finger domains, TALEN systems, and bacterial CRISPR-Cas systems.
  • the first two methods require laborious optimization of the amino acid sequence of the nuclease to recognize a specific DNA sequence.
  • the structures that recognize the target DNA are not proteins, but short guide RNAs.
  • Cutting a specific target DNA does not require de novo synthesis of nuclease or its gene, but is achieved through the use of guide RNAs complementary to the target sequence.
  • the technique allows one-time cutting of DNA in several regions using guide RNAs of different sequences. This approach is used, among other things, for the simultaneous change of several genes in eukaryotic organisms.
  • CRISPR-Cas systems are immune systems of prokaryotes, capable of highly specific breaks in the genetic material of viruses (Mojica FJ M. et a !. Intervening sequences of regularly spaced prokaryotic repeats derive from foreign genetic elements // Journal of molecular evolution. - 2005. - T. 60. - Ns. 2. - C. 174-182).
  • the abbreviation CRISPR-Cas stands for “Clustered Regularly Interspaced Short Palindromic Repeats and CRISPR associated genes” (Jansen R. et ai. Identification of genes that are associated with DNA repeats in prokaryotes // Molecular microbiology. - 2002. - T. 43. - Ns. 8.
  • CRISPR-Cas systems consist of CRISPR cassettes and genes encoding various Cas proteins (Jansen R. et al., Molecular microbiology. - 2002. - T. 43. - Ns 6 - S. 1565-1575).
  • CRISPR cassettes consist of spacer sequences, each of which has a unique nucleotide sequence, and repetitive palindromic repeats (Jansen R. et a !., Molecular microbiology. - 2002. - T. 43. - Ns. 6. - S. 1565- 1575).
  • CRISPR-Cas systems represented by a single effector protein, are divided into six different types (from I to VI), depending on the Cas proteins that make up the systems.
  • type II CRISPR-Cas9 system for editing the genomic DNA of human cells (Cong L, et al., Multiplex genome engineering using CRISPR / Cas systems. Science. 2013 Feb 15; 339 (6121) : 819-23).
  • the type II CRISPR-Cas9 system is distinguished by its simple composition and mechanism of operation: its functioning requires the formation of an effector complex consisting of only one Cas9 protein and two short RNAs: crRNA (crRNA) and tracer RNA (tracrRNA).
  • Tracer RNA complementarily pairs with a region of crRNA derived from the CRISPR repeat, forming a secondary structure necessary for the binding of guide RNAs to the Cas effector. Sequencing of guide RNAs is an important step in characterizing previously unexplored Cas orthologs.
  • the Cas9 effector protein is an RNA-dependent DNA endonuclease with two nuclease domains (HNH and RuvC) that make breaks in the complementary strands of the target DNA, thus forming a double-stranded DNA break (Deltcbeva E. et al. CRISPR RNA maturation by trans-encoded small RNA and host factor RNase ill // Nature. - 2011. - T. 471. - Ns. 7340. - C. 602).
  • CRISPR-Cas nucleases are known that are capable of targeting and specifically introducing double-stranded breaks in DNA.
  • CRISPR-Cas9 technology is one of the most modern and rapidly developing techniques for introducing breaks in the DNA of various organisms, ranging from bacterial strains to human cells, as well as in vitro (Song M. The CRISPR / Cas9 system: Their delivery, in vivo and ex vivo applications and clinical development by startups. Biotechnol Prog. 2017 Jul; 33 (4): 1035-1045).
  • the effector ribonucleic complex consisting of Cas9 and a duplex of crRNA and trarRNA, for recognition and subsequent hydrolysis of DNA, in addition to the complementary correspondence of the crRNA spacer and the protospacer, requires the presence of PAM (from the English “PAM” - protospacer adjusted motif) on the target DNA (Mojica FJ M. et al. 2009).
  • PAM is a strictly defined sequence of several nucleotides located in type II systems close to or in several nucleotides from the 3'-end of the protospacer on a non-targeted strand. In the absence of PAM, no hydrolysis of bonds in DNA with the formation of a double-stranded break occurs.
  • CRISPR-Cas proteins use different, original PAM sequences for their work.
  • the use of CRISPR-Cas proteins with a variety of new PAM sequences is necessary to ensure the possibility of changing any DNA region, both in vitro and in the genome of living organisms. Alteration of eukaryotic genomes also requires the use of small nucleases to ensure the delivery of CRISPR-Cas systems into cells via AAV viruses.
  • the objective of the present invention is to create new tools for changing the genomic DNA sequence of unicellular or multicellular organisms based on CRISPR-Cas9 systems.
  • CRISPR-Cas9 systems are of limited use due to the specific PAM sequence that must be present at the 3'-end of the DNA region undergoing modification.
  • the search for new Cas9 enzymes with other PAM sequences will expand the arsenal of available means for the formation of a double-stranded break in the necessary, strictly defined places in the DNA molecules of different organisms.
  • the authors characterized the previously predicted for the bacterium Pasteurella pneumotropica (P. pneumotropica) type II CRISPR nuclease PpCas9, which can be used to introduce targeted changes in the genome of both this and other organisms.
  • the essential features that distinguish the present invention are: (a) a short, different from other known PAM sequence; (b) the relatively small size of the characterized PpCas9 protein - 1055 amino acid residues (a.
  • This problem is solved by using a protein containing the amino acid sequence of SEQ ID NO: 1, or containing an amino acid sequence that is at least 95% identical to the amino acid sequence SEQ ID NO: 1 and differs from SEQ ID NO: 1 only in non-conserved amino acid residues, to form a double-stranded break in the DNA molecule, located immediately before the nucleotide sequence 5'-NNNN (A / G) TT-3 'in the specified DNA molecule.
  • this use is characterized in that the formation of a double-strand break in the DNA molecule occurs at a temperature from 35 ° C to 45 ° C.
  • this use is characterized in that the formation of a double-strand break occurs in the genomic DNA of a mammalian cell. In some embodiments of the invention, this use is characterized in that the formation of a double-strand break in the DNA molecule leads to a change in the genomic DNA of the specified mammalian cell.
  • This problem is also solved by creating a method for changing the sequence of genomic DNA in a cell of a unicellular or multicellular organism, comprising introducing into said cell of the body an effective amount of: a) a protein containing the amino acid sequence of SEQ ID NO: 1, or a nucleic acid encoding a protein containing the amino acid sequence SEQ ID NO: 1, and b) a guide RNA containing a sequence that forms a duplex with the nucleotide sequence of a region of the genomic DNA of an organism, immediately adjacent to the nucleotide sequence 5'-NNNN (A / G) TT-3 ', and interacting with the specified protein after the formation of a duplex, or DNA sequence encoding the specified guide RNA; the interaction of this protein with the guide RNA and the nucleotide sequence 5'-NNNN (A / G) TT-3 'leads to the formation of a double-stranded break in the genomic DNA sequence immediately adjacent to the sequence 5'-NNNN (A
  • the method is characterized in that it further comprises introducing an exogenous DNA sequence simultaneously with the guide RNA. In some embodiments, the method is characterized in that said cell is a mammalian cell.
  • a guide RNA As a guide RNA, a mixture of crRNA (crRNA) and tracer RNA (tracrRNA) can be used, which can form a complex with a region of the target DNA and the PpCas9 protein.
  • a fusion RNA constructed from crRNA and tracer RNA can be used as the guide RNA.
  • Methods for constructing hybrid guide RNA are known in the art (Hsu PD, et al., DNA targeting specificity of RNA-guided Cas9 nucleases. Nat Biotechnol. 2013 Sep; 31 (9): 827-32).
  • One embodiment for constructing a fusion RNA is disclosed in the Examples below.
  • the invention can be used both for cutting the target DNA in vitro and for modifying the genome of any living organism. Modification of genomic DNA can be carried out in a direct way - by cutting genomic DNA at the appropriate site, as well as by inserting an exogenous DNA sequence due to homologous repair.
  • any region of double-stranded or single-stranded DNA from the genome of an organism other than the organism used for introduction can be used as an exogenous DNA sequence, while this region (or a mixture of regions) is intended for integration at the site of a double-stranded break in the target DNA formed by the action of PpCas9 nuclease.
  • a double-stranded DNA region from the genomic DNA of an organism used when introducing the PpCas9 protein, but altered by mutations (nucleotide substitution), as well as insertions or deletions of one or more nucleotides can be used as an exogenous DNA sequence.
  • the technical result of the present invention is to increase the versatility of the available CRISPR-Cas9 systems, allowing the use of Cas9 nuclease to cut genomic or plasmid DNA at a greater number of specific sites and specific conditions.
  • the new nuclease can be used in the cells of bacteria, mammals, or other organisms.
  • FIG. 1 Diagram of the structure of the CRISPR PpCas9 system locus. DR - direct repeat, or direct repeat - a regularly repeated section that is part of the CRISPR cassette.
  • FIG. 2. PAM screening in vitro. Experiment scheme.
  • FIG. 3 PpCas9 nuclease cutting of 7N library fragments at different reaction temperatures.
  • FIG. 4. (A) Analysis of the results of in vitro screening of PpCas9 nuclease using the calculation of the logarithm of the change in the proportion of each specific nucleotide in each position of the PAM (FC). (B) PAM Logo PpCas9 nucleases. Frequencies of adenine, cytosine, thymine and guanine are indicated for each position. The height of the letters corresponds to the frequency of nucleotide representation at a given position of the PAM sequence.
  • FIG. 5 Testing the effect of single nucleotide substitutions in the first position of the PAM on the efficiency of PpCas9 nuclease cleavage of the target DNA.
  • FIG. 6. Checking the significance of nucleotide positions in the PAM sequence of PpCas9.
  • FIG. 7 Testing the effect of replacing A with G in the PAM position battle on the efficiency of PpCas9 nuclease cleavage of the target DNA.
  • FIG. 8 Testing the effect of single nucleotide substitutions in the 7th position of the PAM on the efficiency of PpCas9 nuclease cleavage of the target DNA.
  • FIG. 9 Cleavage of various DNA sites with the PpCas9 protein. Lanes 1 and 2 are positive controls.
  • FIG. 10 Verification of PpCas9 nuclease recognition of the PAM sequence CAGCATT. Lanes 1 and 2 are positive controls.
  • FIG. 11 Diagram of the tool for cutting DNA PpCas9.
  • FIG. 12 An experiment on cutting the target DNA. Hybrid RNA guides of different lengths were used.
  • FIG. 13 Alignment of amino acid sequences of PpCas9 and Cas9 proteins from Staphylococcus aureus using the NCBI BLASTp program (default parameters).
  • FIG. 14 Modification of genomic DNA of human cells using PpCas9.
  • A Schematic of an experiment to determine the efficiency of altering the genomic DNA of human cells using a plasmid carrying PpCas9.
  • B - Results of the analysis of insertions and deletions of nucleotides into the sequence of target sites of genomic DNA of human cells (above - the reaction products with T7 endonuclease I were applied to agarose gel electrophoresis, below - examples of insertions and deletions formed by PpCas9 in the EMX1 gene, determined with using high throughput sequencing)
  • the term "percent homology of two sequences” is equivalent to the term “percent identity of two sequences.”
  • the sequence identity is determined based on the reference sequence. Algorithms for sequence analysis are known in the art, such as BLAST described in Altschul et al., J. Mol. Biol., 215, pp. 403-10 (1990).
  • BLAST described in Altschul et al., J. Mol. Biol., 215, pp. 403-10 (1990).
  • a comparison of nucleotide and amino acid sequences using the Blast software package provided by the National Center for Biotechnology Information (http://www.ncbi.nl .nih .gov / blast) using the containing alignment breaks with standard options.
  • the percentage of identity of two sequences is determined by the number of positions of identical amino acids in the two sequences, taking into account the number of gaps and the length of each gap that must be entered for optimal alignment of the two sequences.
  • the percentage of identity is equal to the number of identical amino acids at given positions, taking into account the sequence alignment, divided by the total number of positions and multiplied by 100.
  • specifically hybridized refers to an association between two single-stranded nucleic acid molecules or sufficiently complementary sequences to permit such hybridization under predetermined conditions commonly used in the art.
  • double-stranded break located immediately in front of the PAM nucleotide sequence means that a double-strand break in the target DNA sequence will be made at a distance of 0 to 25 nucleotides in front of the PAM nucleotide sequence.
  • exogenous DNA sequence introduced simultaneously with a guide RNA should be understood as a DNA sequence prepared specifically for the specific modification of a double-stranded target DNA at the site of a break, determined by the specificity of the guide RNA. Such a modification can be, for example, the insertion or deletion of certain nucleotides at the break of the target DNA.
  • Exogenous DNA can be a piece of DNA from another organism, or a piece of DNA from the same organism as the target DNA.
  • a protein containing a specific amino acid sequence should be understood as a protein having an amino acid sequence composed of the specified amino acid sequence and, possibly, other sequences connected by peptide bonds to the specified amino acid sequence.
  • other sequences include the nuclear localization signal (NLS) sequence, or other sequences that provide increased functionality for the specified amino acid sequence.
  • NLS nuclear localization signal
  • exogenous DNA sequence introduced simultaneously with a guide RNA should be understood as a DNA sequence prepared specifically for the specific modification of a double-stranded target DNA at the site of a break, determined by the specificity of the guide RNA. Such a modification can be, for example, the insertion or deletion of certain nucleotides at the break of the target DNA.
  • Exogenous DNA can be a piece of DNA from another organism, or a piece of DNA from the same organism as the target DNA.
  • the effective amount of protein and RNA introduced into a cell should be understood as such an amount of protein and RNA that, upon entering the specified cell, will be able to form a functional complex, that is, a complex that will specifically bind to the target DNA and produce a double-strand break in it at the site defined guide RNA and PAM sequence on DNA.
  • the effectiveness of this process can be assessed by analyzing the target DNA isolated from the indicated cell using standard methods known to those skilled in the art.
  • RNA into the cell can be accomplished in various ways.
  • a protein can be delivered as a DNA plasmid that encodes a gene for this protein, as mRNA for translation of this protein in the cytoplasm of a cell, or as a ribonucleoprotein complex comprising this protein and a guide RNA. Delivery can be accomplished by various methods known to those skilled in the art.
  • the nucleic acid encoding the components of the system can be introduced into the cell, directly or indirectly: by transfection or transformation of cells by methods known to those skilled in the art, by using a recombinant virus, by manipulating the cell, such as DNA microinjection, and the like.
  • RNA Delivery of a ribonucleic complex consisting of nuclease and guide RNA and exogenous DNA can be carried out by transfection of the complexes into the cell or by mechanical introduction of the complex into the cell, for example, by microinjection.
  • a nucleic acid molecule encoding a protein to be introduced into a cell can be integrated into a chromosome or can be extrachromosomally replicating DNA.
  • a protein that has a sequence that is at least 95% identical to the amino acid sequence of SEQ ID NO: 1, and which is further modified at one or both ends by the addition of one or more signals of nuclear localization.
  • a nuclear localization signal from the SV40 virus can be used.
  • a spacer sequence for example, described in Shen B, et al.
  • the present invention encompasses the use of a P. pneumotropica protein homologous to previously characterized Cas9 proteins to introduce double-stranded breaks in DNA molecules at well-defined positions.
  • CRISPR nucleases to make targeted changes in the genome has several advantages. First, the specificity of the action of the system is determined by the crRNA sequence, which makes it possible to use one type of nuclease for all target loci. Secondly, the technique allows one to deliver several guide RNAs at once, complementary to different target genes, into the cell, which makes it possible to simultaneously change several genes at once.
  • Pasteurella pneumotropica (P. pneumotropica) CRISPR Cas9 system (hereinafter CRISPR PpCas9) refers to type IIC CRISPR Cas systems and consists of a CRISPR cassette carrying four direct repeats (DR) sequence
  • RNA-Cas protein complex of type IIC systems made it possible to predict the direction of transcription of the CRISPR cassette: pre-crRNA is transcribed in the opposite direction from the Cas genes (Fig. 1)
  • Double-stranded DNA libraries were fragments of 374 base pairs (bp) containing a protospacer sequence flanked by randomized seven nucleotides (5'-NNNNN-3 ') from the 3' end: 5'-cccg d d d taccacg d ad ad atg d tg d aaatcatctttctcg tggg catccttg atg d ccacctcg teg g aag tg cccacg ag g atg a garden caatg ccaatg ctg ggggg gctcttctg ag aacg ag ctctg ctg cctg acacg g ccagt gcca acg g ccaact ag catg ttaaatag g atcta catcacg
  • tracrRNA RNA of the following sequence was used to cut this target:
  • the crRNA sequence complementary to the protospacer is highlighted in bold.
  • 500 ⁇ l of the overnight culture was diluted in 500 ml of LB medium, and the cells were grown at 37 ° C until an optical density of 0.6 rel. Units was reached.
  • the synthesis of the target protein was induced by adding IPTG to a concentration of 1 mM, after which the cells were incubated at 20 ° C for 6 hours. Then the cells were centrifuged at a speed of 5000 g for 30 minutes, the resulting cell pellets were frozen at a temperature of -20 ° C.
  • the precipitates were thawed on ice for 30 minutes, resuspended in 15 ml of lysis buffer (Tris-HCI 50 mM pH 8, 500 mM NaCl, b-mercaptoethanol 1 mM, imidazole 10 mM) with the addition of 15 mg of lysozyme and again incubated on ice for 30 minutes ...
  • the cells were then disrupted by sonication for 30 minutes and centrifuged for 40 minutes at 16,000 g.
  • the resulting supernatant was passed through a 0.2 ⁇ m filter and loaded onto a HisTrap HP 1 mL column (GE Healthcare) at 1 mL / min.
  • Chromatography was performed using an AKTA FPLC chromatograph (GE Healthcare) at a rate of 1 ml / min.
  • the column with the applied protein was washed with 20 ml of lysis buffer supplemented with 30 mM imidazole, after which the protein was washed off with lysis buffer supplemented with 300 mM imidazole.
  • the protein fraction obtained during affinity chromatography was passed through a Superdex 200 10/300 GL gel filtration column (24 ml) equilibrated with the following buffer: Tris-HCI 50 mM pH 8, 500 mM NaCl, 1 mM DTT.
  • Tris-HCI 50 mM pH 8, 500 mM NaCl, 1 mM DTT Tris-HCI 50 mM pH 8, 500 mM NaCl, 1 mM DTT.
  • Amicon concentrator with a 30 kDa filter
  • fractions corresponding to the monomeric form of the PpCas9 protein were concentrated to 3 mg / ml, after which the purified protein was stored at -80 ° C in a buffer containing 10% glycerol.
  • the reaction of cutting linear PAM libraries was carried out in a volume of 20 ⁇ l under the following conditions.
  • the reaction mixture consisted of: 1X CutSmart buffer (NEB), 5 mM DTT, 100 nM PAM library, 2 ⁇ M tRNA / crRNA, 400 nM PpCas9 protein.
  • NEB CutSmart buffer
  • samples containing no RNA were prepared in a similar way. The samples were incubated at different temperatures and analyzed by gel electrophoresis in 2% agarose gel.
  • two DNA fragments of about 326 and 48 base pairs in length should be formed (see Fig. 2).
  • the results of the experiment showed that PpCas9 possesses nuclease activity and cleaves part of the fragments of the PAM library.
  • the temperature gradient (Fig. 3) showed that the protein is active in the temperature range 35 - 45 ° C. Later in the work, a temperature of 42 ° C was used as a working temperature.
  • the library cut reaction was repeated under the selected conditions. The reaction products were loaded onto a 1.5% agarose gel and subjected to electrophoresis. Uncut DNA fragments 374 bp in length. extracted from the gel and prepared for high efficiency sequencing using the NEB NextUltra II kit.
  • the incubation time is 30 minutes, the reaction temperature is 42 ° C.
  • PAM recognized by the PpCas9 nuclease corresponds to the following formula 5'-NNNN (A / G) TT-3 '.
  • the seventh position is less conservative.
  • Example 1 Testing the activity of the PpCas9 protein in cutting various target DNA.
  • a PCR fragment of the grin2b gene was used as a target, carrying recognition sites (Table 2), presumably recognized by PpCas9 in accordance with the PAM consensus 5'-NNNN (A / G) TT-3 '. To recognize these sequences were synthesized by crRNA directing PpCas9 to these sites.
  • FIG. 9 shows that the PpCas9 enzyme successfully cut three of the four targets with the appropriate PAM.
  • the target on the sixth lane had the PAM sequence CAGCATT, which is predicted to be efficiently recognized by the protein based on depletion analysis results. However, in this experiment, this fragment was not recognized.
  • the conducted research tests showed the presence of nuclease activity in PpCas9, and also made it possible to determine its PAM sequence and verify the sequence of guide RNAs.
  • the PpCas9 ribonucleoprotein complex specifically makes target breaks limited to the PAM 5'-NNNN (A / G) TT -3 'from the 5' end of the protospacer.
  • a schematic diagram of the PpCas9-RNA complex is shown in FIG. eleven.
  • sgRNA is a form of guide RNA that is fused together tracrRNA (tracer RNA) and crRNA.
  • tracrRNA tracer RNA
  • crRNA tracrRNA
  • RNA was synthesized in vitro and experiments were carried out with them for cutting the DNA target (Fig. 12)
  • RNA sequences were used as fusion RNAs:
  • the bold type indicates the 20-nucleotide sequence that provides pairing with the target DNA (variable part of sgRNA). Moreover, In the experiment, a control sample without RNA was made, as well as a positive control — cutting the target with crRNA + trRNA.
  • the site of recognition is in bold type, in capital letters PAM.
  • the reaction was carried out under the following conditions: concentration of DNA sequence containing PAM (CAASATT) - 20 nM, protein concentration - 400 nM, RNA concentration - 2 ⁇ M; incubation time - 30 minutes, incubation temperature - 37 ° ⁇ .
  • the matched sgRNAI and sgRNA2 were found to be as efficient as the native tracrRNA and crRNA sequences: cutting occurred in more than 80% of the target DNA (Fig. 12).
  • hybrid RNA variants can be used to cut any other target DNA by changing the sequence directly pairing with the target DNA.
  • Example 3 Cas9 proteins from closely related organisms related to P. pneumotropica.
  • the PpCas9 protein significantly differs in amino acid sequence from other Cas9 proteins studied to date.
  • the variant of the PpCas9 protein sequence obtained and characterized in this Description can be changed without altering the function of the protein itself (for example, by directed mutagenesis of amino acid residues that do not directly affect functional activity (Sambrook et al., Molecular Cloning: A Laboratory Manual, (1989), CSH Press, pp. 15.3-15.108)).
  • non-conservative amino acid residues can be changed without affecting the residues that determine the functionality of the protein (that determine its function or structure). Examples of such changes can be the replacement of non-conservative amino acid residues with homologous ones.
  • FIG. 12 Some of the regions containing non-conserved amino acid residues are shown in FIG. 12.
  • a protein comprising an amino acid sequence that is at least 95% identical to the amino acid sequence of SEQ ID NO: 1 and differs from SEQ ID NO: 1 only in non-conserved amino acid residues to form a double-stranded break in the DNA molecule, located immediately before the nucleotide sequence 5'-NNNN (A / G) TT-3 'in the specified DNA molecule.
  • Homologous proteins can be obtained by mutagenesis (eg, site-directed or PCR-mediated mutagenesis) of the corresponding nucleic acid molecules, followed by testing the encoded modified Cas9 protein to maintain its function in accordance with the functional assays described herein.
  • mutagenesis eg, site-directed or PCR-mediated mutagenesis
  • the PpCas9 nuclease gene was cloned into a eukaryotic plasmid vector under the regulation of the CMV promoter. At the 5 'and 3' ends of the PpCas9 gene were added sequences encoding nuclear localization signals that ensure the delivery of nuclease into the cell nucleus.
  • the sgRNA sequence was cloned into a vector under the regulation of the U6 promoter. To test the activity of the system, we used sgRNA with a sequence complementary to the target DNA of 20 and 24 nucleotides in length.
  • plasmids used As a positive control, a similar plasmid carrying the SpCas9-based genomic DNA alteration system known from the prior art was used. To evaluate the efficiency of transfection, the plasmids used also carried the gene for the green fluorescent protein GFP. The following regions of human genomic DNA were used as target DNA (Table 3).
  • EMX1.1 and EMX1.2 were two different sites of modification in the EMX1 gene; similarly, GRIN2B1 .1 and GRIN2B1.2 were two different sites of modification in the GRIN2B gene.
  • the target DNA was flanked at the 3 'end of the PAM by PpCas9 5'-NNNNRTT -3' or SpCas9 5'-NGG -3 '.
  • a nuclear localization signal from the T antigen of the SV40 virus (Lanford et al., Cell, 1986, 46: 575-582) can be used, linked to the PpCas9 sequence using the spacer sequence described in Shen B, et al. "Generation of gene-modified mice via Cas9 / RNA-mediated gene targeting", Cell Res. 2013 May; 23 (5): 720-3 or without.
  • the complete amino acid sequence of the nuclease transported into the nucleus of human cells is as follows:
  • the plasmid used in this experiment had the following sequence: g ag e e cctatttcccatg attccttcatatttg catatacg atacaag g ctg ttag ag ag ataattg g aattaatttg actg taaa cacaaag atattag tacaaaatacg tg acg tag aaag gatat tatatttatttg ctttatatatcttg tg g g aaag g acg aaacaccg XXXXXXXXXXXXXXXXXXGTT GT AGCT CCCTTTTT CATTT CGCG AAAGCG AAAT g AAAAACGTT GTT ACAAT AAG AG AT g AATTT CT CGCAAAGCT CT GCCT CTT g AAATTT CGGTTT CAAG AGGCAT CT
  • U6 promoter first region, capital letters
  • sequence complementary to protospacer (“XXX-XXX”)
  • conserved part of sgRNA third region, capital letters
  • PpCas9 gene in bold
  • GFP gene last section, capital letters
  • Plasmids with PpCas9 or SpCas9 were transfected into a human cell culture HEK293T using the lipofectamine 2000 reagent. After 72 hours after transfection, the cells were lysed and PCR was performed from the obtained lysates to generate regions containing target sites of genomic DNA alteration. The resulting PCR fragments were subjected to an in vitro reaction with T7 endonuclease I to determine the frequency of insertions and deletions in the target sites of genomic DNA. The reaction products were loaded onto an agarose gel and subjected to electrophoresis.
  • FIG. 14A shows that PpCas9 actively modifies the EMX1 and GRIN2b genes, with an efficiency similar to that of the prior art SpCas9 nuclease.
  • FIG. 14B shows examples of detectable changes in the nucleotide sequence of the EMX1 gene.
  • Delivery in the form of a ribonuclein complex can also be used to deliver NLS_PpCas9_NLS to human cells. It is performed by incubating the recombinant form of PpCas9 NLS with guide RNAs in CutSmart buffer (NEB). Recombinant protein is obtained from bacterial producing cells, purifying it with using affinity chromatography (NiNTA, Qiagen) separation by size (Superdex 200).
  • the protein is mixed with RNA in a 1: 2 ratio (PpCas9 NLS: sgRNA), incubated for 10 minutes at room temperature, then the mixture is transfected into cells.
  • the DNA extracted from them is analyzed for insertions at the target DNA site (as described above).
  • the PpCas9 nuclease from the Pasteure !! a pneum o tropica bacterium characterized in the present invention can be delivered for DNA modification into cells of various origins using standard approaches and methods known in the art.
  • PpCas9 has several advantages over previously characterized Cas9 proteins.
  • PpCas9 possesses a short, two-letter, distinct from other known PAM Cas nucleases motif, which is necessary for the system to function.
  • the invention has shown that the presence of a short PAM motif (RTT) located 4 nucleotides from the protospacer is sufficient for the successful functioning of PpCas9 in vivo.
  • PpCas9 The second advantage of PpCas9 is the small size of the protein (1055 aa). To date, this is the only studied small-size protein with a three-letter RTT PAM sequence.
  • PpCas9 is a new small-sized Cas nuclease with a short, easy-to-use PAM that differs from the currently known PAM sequences of other nucleases.
  • the PpCas9 protein cuts various DNA targets with high efficiency, including genomic DNA in human cells at 37 ° C, and may become the basis of a new genomic editing tool.
  • Leu Asn Asn Leu Arg lie Leu Glu Asn Gly Thr Glu Arg Ala Leu Asn 275 280 285 Asp Asn Glu Arg Phe Ala Leu Leu Glu Gin Pro Tyr Glu Lys Ser Lys 290 295 300
  • Lys Lys Ser Thr Glu Thr Thr Arg Leu Leu Pro Thr lie Pro Ala Asp 450 455 460
  • Val lie Asn Ala Val Val Arg Leu Tyr Gly Ser Pro Ala Arg lie His 485 490 495 lie Glu Thr Ala Arg Glu Val Gly Lys Ser Tyr Gin Asp Arg Lys Lys 500 505 510
  • Lys Asp lie Leu Lys Met Arg Leu Tyr Glu Leu Gin Gin Ala Lys Cys 545 550 555 560
  • Ala Lys Lys Gin Arg lie Leu Asn His Lys Leu Asp Glu Lys Gly Phe 645 650 655 lie Glu Arg Asn Leu Asn Asp Thr Arg Tyr Val Ala Arg Phe Leu Cys 660 665 670
  • Trp Asp lie Met Asp Glu Met Ala Thr Phe Gin Phe Ser Leu Cys Gin
  • Val Lys Leu Ala lie Ser Leu Glu Lys Tyr Gin Val Asp Glu Leu Gly
  • Lys Asn lie Arg Pro Cys Arg Pro Thr Lys Arg Gin His Val Arg

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Plant Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Immunology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

Настоящее изобретение описывает новую бактериальную нуклеазу системы CRISPR-Cas9 из бактерии P. pneumotropica, а также ее применение для образования строго специфичных двунитевых разрывов в молекуле ДНК. Данная нуклеаза обладает необычными свойствами и может быть использована для изменения последовательности геномной ДНК в клетке одноклеточного или многоклеточного организма. Таким образом, достигается повышение универсальности доступных систем CRISPR-Cas9, что позволит использовать различные варианты нуклеаз Cas9 для разрезания геномной или плазмидной ДНК в разных организмах, в большем количестве специфических сайтов и/или при различных условиях.

Description

ПРИМЕНЕНИЕ CAS9 БЕЖА ИЗ БАКТЕРИИ PASTEURELLA PNEUMOTROPICA
Область техники
Изобретение относится к биотехнологии, а именно, к новым ферментам, Cas нуклеазам систем CRISPR-Cas, применяемым для разрезания ДНК и редактирования генома различных организмов. Данная технология может применяться в будущем для генной терапии наследственных заболеваний человека, а также для редактирования генома других организмов.
Уровень техники
Изменение последовательности ДНК - одна из актуальных задач биотехнологии на сегодняшний день. Редактирование и изменение геномов эукариотических и прокариотических организмов, а также манипуляции с ДНК in vitro, требуют направленного внесения двунитевых разрывов в последовательности ДНК.
Для решения этой задачи в настоящее время используют следующие методики: искусственные нуклеазные системы, содержащей домены типа «цинковые пальцы», TALEN-системы и бактериальные CRISPR-Cas системы. Первые два метода требуют трудозатратой оптимизации аминокислотной последовательности нуклеазы для узнавания конкретной последовательности ДНК. В отличие от них в случае CRISPR-Cas систем структурами, узнающими ДНК мишень, являются не белки, а короткие направляющие РНК. Разрезание конкретной ДНК мишени не требует синтеза нуклеазы или ее гена de novo, а обеспечивается за счет использования направляющих РНК, комплементарных целевой последовательности. Это делает CRISPR Cas системы удобными и эффективными инструментами разрезания различных ДНК-последовательностей. Методика позволяет осуществлять единовременное разрезание ДНК в нескольких участках при использовании направляющих РНК разной последовательностей. Такой подход используется в том числе для одновременного изменения нескольких генов в эукариотических организмах.
По своей природе CRISPR-Cas системы являются иммунными системами прокариот, способными высоко специфично вносить разрывы в генетический материал вирусов (Mojica F. J. М. et a!. Intervening sequences of regularly spaced prokaryotic repeats derive from foreign genetic elements //Journal of molecular evolution. - 2005. - T. 60. - Ns. 2. - C. 174-182). Аббревиатура CRISPR-Cas расшифровывается как “Clustered Regularly Interspaced Short Palindromic Repeats and CRISPR associated genes” (Jansen R. et ai. identification of genes that are associated with DNA repeats in prokaryotes //Molecular microbiology. - 2002. - T. 43. - Ns. 8. - C. 1565-1575), что переводе с английского обозначает “короткие палиндромные повторы, регулярно расположенные группами, и ассоциированные с ними гены”. Все CRISPR-Cas системы состоят из CRISPR кассет и генов, кодирующих различные Cas белки (Jansen R. et al. , Molecular microbiology. - 2002. - T. 43. - Ns 6 - С. 1565-1575). CRISPR кассеты состоят из последовательностей-спейсеров, каждый из которых имеет уникальную нуклеотидную последовательность, и повторяющихся палиндромных повторов (Jansen R. et a!. , Molecular microbiology. - 2002. - T. 43. - Ns. 6. - С. 1565-1575). В результате транскрипции CRISPR кассет и их последующего процессинга образуются направляющие крРНК, которые вместе с Cas белками формируют эффекторный комплекс (Brouns S. J. J. et al. Small CRISPR RNAs guide antiviral defense in prokaryotes //Science. - 2008. - T. 321 . - Ns. 5891 . - C. 960-984). За счет комплементарного спаривания крРНК с целевым участком ДНК, именуемым протоспейсером, Cas-нуклеаза узнает ДНК-мишень и высоко специфично вносит в нее разрыв.
CRISPR-Cas системы, представленными одиночным белком-эффектором, разделяют на шесть различных типов (от I до VI) в зависимости от Cas белков, входящих в состав систем. В 2013 году впервые было предложено использовать систему CRISPR- Cas9, относящуюся к типу II, для редактирования геномной ДНК клеток человека (Cong L, et al., Multiplex genome engineering using CRISPR/Cas systems. Science. 2013 Feb 15;339(6121 ):819-23). Система CRISPR-Cas9 II типа отличается простотой состава и механизма работы: для ее функционирования необходимо формирование эффекторного комплекса, состоящего лишь из одного белка Cas9 и двух коротких РНК: крРНК (crRNA) и трейсерной РНК (tracrRNA). Трейсерная РНК комплементарно спаривается с участком крРНК, происходящим из CRISPR повтора, образуя вторичную структуру, необходимую для связывания направляющих РНК с Cas эффектором. Определение последовательности направляющих РНК является важным шагом в характеризации неизученных ранее Cas- ортологов. Эффекторный белок Cas9 является РНК-зависимой ДНК эндонуклеазой с двумя нуклеазными доменами (HNH и RuvC), вносящими разрывы в комплементарные нити целевой ДНК, таким образом образуя двунитевой разрыв ДНК (Deltcbeva Е. et al. CRISPR RNA maturation by trans-encoded small RNA and host factor RNase ill //Nature. - 2011. - T. 471 . - Ns. 7340. - C. 602).
На сегодняшний день известно несколько CRISPR-Cas нуклеаз, способных направлено и специфично вносить двунитевые разрывы в ДНК. Технология CRISPR-Cas9 является одной из самых современных и быстроразвивающихся методик внесения разрывов в ДНК различных организмов, начиная от бактериальных штаммов и заканчивая клетками человека, а также in vitro (Song М. The CRISPR/Cas9 system: Their delivery, in vivo and ex vivo applications and clinical development by startups. Biotechnol Prog. 2017 Jul;33(4):1035-1045).
Эффекторному рибонуклеиновому комплексу, состоящему из Cas9 и дуплекса крРНК и тракрРНК, для распознавания и последующего гидролиза ДНК помимо комплементарного соответствия спейсера крРНК и протоспейсера необходимо присутствие РАМ (от англ. “РАМ” - protospacer adjusted motif) на ДНК мишени (Mojica F. J. M. et al. 2009). РАМ представляет собой строго определенную последовательность из нескольких нуклеотидов, расположенных в системах типа II вплотную либо в нескольких нуклеотидах от З’-конца протоспейсера на нетаргетной цепи. При отсутствии РАМ гидролиза связей в ДНК с образованием двунитевого разрыва не происходит. Необходимость присутствия РАМ последовательности на мишени повышает специфичность узнавания, но в то же время накладывает ограничение в выборе целевых участков ДНК, в которые необходимо внести разрыв. Таким образом, наличие нужной РАМ последовательности, фланирующей ДНК-мишень с З'-конца, является характеристикой, ограничивающей применение CRISPR-Cas систем на любых участках ДНК.
Различные CRISPR-Cas белки используют для своей работы разные, оригинальные РАМ последовательности. Использование CRISPR-Cas белков с новыми разнообразными РАМ последовательностями необходимо для обеспечения возможности изменения любого участка ДНК, как in vitro, так и в геноме живых организмов. Изменение эукариотических геномов также требует использования нуклеаз малого размера для обеспечения доставки CRISPR-Cas систем в клетки посредством AAV вирусов.
Несмотря на известность ряда способов разрезания ДНК и изменения последовательности геномной ДНК, на сегодняшний день сохраняется потребность в новых эффективных инструментах для модификации ДНК в различных организмах и в строго определенных местах последовательности ДНК.
Сущность изобретения
Задачей настоящего изобретения является создание новых инструментов для изменения последовательности геномной ДНК одноклеточных или многоклеточных организмов на основе систем CRISPR-Cas9. Существующие в настоящее время системы имеют ограниченное применение из-за специфичной последовательности РАМ, которая должна присутствовать на З'-конце участка ДНК, подвергающегося модификации. Поиск новых ферментов Cas9 с другими РАМ последовательностями позволит расширить арсенал имеющихся средств для образования двунитевого разрыва в необходимых, строго определенных местах в молекулах ДНК разных организмов. Для решения этой задачи авторами была охарактеризована ранее предсказанная для бактерии Pasteurella pneumotropica (Р. pneumotropica) CRISPR нуклеаза II типа PpCas9, которая может быть применена для внесения направленных изменений в геном как этого, так и других организмов. Существенными признаками, отличающими настоящее изобретение, являются: (а) короткая, отличающаяся от других известных последовательность РАМ; (б) относительно малый размер охарактеризованного белка PpCas9 - 1055 аминокислотных остатков (а. о.).
Указанная задача решается путем применения белка, содержащего аминокислотную последовательность SEQ ID NO: 1 , или содержащего аминокислотную последовательность, которая по меньшей мере на 95% идентична аминокислотной последовательности SEQ ID NO: 1 и имеет отличия по сравнению с SEQ ID NO: 1 только в неконсервативных аминокислотных остатках, для образования двунитевого разрыва в молекуле ДНК, расположенного непосредственно перед нуклеотидной последовательностью 5’-NNNN(A/G)TT-3’ в указанной молекуле ДНК. В некоторых вариантах изобретения данное применение характеризуется тем, что образование двунитевого разрыва в молекуле ДНК происходит при температуре от 35 °С до 45 °С. В некоторых вариантах изобретения данное применение характеризуется тем, что образование двунитевого разрыва происходит в геномной ДНК клетки млекопитающего. В некоторых вариантах изобретения данное применение характеризуется тем, что образование двунитевого разрыва в молекуле ДНК приводит к изменению геномной ДНК указанной клетки млекопитающего.
Указанная задача также решается путем создания способа изменения последовательности геномной ДНК в клетке одноклеточного или многоклеточного организма, включающего введение в указанную клетку организма эффективного количества: а) белка, содержащего аминокислотную последовательность SEQ ID NO: 1, или нуклеиновой кислоты, кодирующей белок, содержащий аминокислотную последовательность SEQ ID NO: 1, и б) направляющей РНК, содержащей последовательность, образующую дуплекс с нуклеотидной последовательностью участка геномной ДНК организма, непосредственно примыкающей к нуклеотидной последовательности 5’-NNNN(A/G)TT-3’, и взаимодействующей с указанным белком после образования дуплекса, или последовательности ДНК, кодирующей указанную направляющую РНК; при этом взаимодействие указанного белка с направляющей РНК и нуклеотидной последовательностью 5’-NNNN(A/G)TT-3’ приводит к образованию двунитевого разрыва в последовательности геномной ДНК, непосредственно примыкающей к последовательности 5’-NNNN(A/G)TT-3’.
В некоторых вариантах изобретения данный способ характеризуется тем, что дополнительно включающий введение экзогенной последовательности ДНК одновременно с направляющей РНК. В некоторых вариантах изобретения данный способ характеризуется тем, что указанная клетка является клеткой млекопитающего.
В качестве направляющей РНК может быть использована смесь из крРНК (crRNA) и трейсерной РНК (tracrRNA), способных образовать комплекс с участком целевой ДНК и белком PpCas9. В предпочтительных вариантах изобретения в качестве направляющей РНК может быть использована гибридная РНК, сконструированная на основе крРНК и трейсерной РНК. Методы конструирования гибридной направляющей РНК известны специалистам (Hsu PD, et al., DNA targeting specificity of RNA-guided Cas9 nucleases. Nat Biotechnol. 2013 Sep;31 (9):827-32). Один из вариантов конструирования гибридной РНК раскрыт в Примерах ниже. Изобретение может быть использовано как для разрезания целевой ДНК in vitro, так и для модификации генома какого-либо живого организма. Модификация геномной ДНК может проводиться прямым способом - разрезанием геномной ДНК в соответствующем сайте, а также вставкой экзогенной последовательности ДНК за счет гомологичной репарации.
В качестве экзогенной последовательности ДНК может быть использован любой участок двунитевой или однонитевой ДНК из генома организма, отличного от организма, используемого при введении (или смесь таких участков между собой и с другими фрагментами ДНК), при этом этот участок (или смесь участков) предназначен для интеграции в место двуцепочечного разрыва в целевой ДНК, образованного под действием нуклеазы PpCas9. В некоторых вариантах изобретения в качестве экзогенной последовательности ДНК может быть использован участок двуцепочечной ДНК из геномной ДНК организма, используемого при введении белка PpCas9, но при этом измененный мутациями (заменой нуклеотидов), а также вставками или делециями одного или нескольких нуклеотидов.
Техническим результатом настоящего изобретения является повышение универсальности доступных систем CRISPR-Cas9, позволяющее использовать нуклеазу Cas9 для разрезания геномной или плазмидной ДНК в большем количестве специфических сайтов и специфических условий. Новая нуклеаза может быть использована в клетках бактерий, млекопитающих или других организмов.
Краткое описание фигур
Фиг. 1. Схема устройства локуса CRISPR PpCas9 системы. DR - direct repeat, или прямой повтор - регулярно повторяющийся участок, входящий в состав CRISPR кассеты.
Фиг. 2. РАМ скрининг in vitro. Схема эксперимента.
Фиг. 3. Разрезание нуклеазой PpCas9 фрагментов 7N библиотеки при разных температурах проведения реакции.
Фиг. 4. (А) Анализ результатов in vitro скрининга нуклеазы PpCas9 с использованием расчета логарифма изменения доли каждого конкретного нуклеотида в каждой позиции РАМ (FC). (Б) РАМ Logo нуклеазы PpCas9. Для каждой позиции обозначены частоты представленности аденина, цитозина, тимина и гуанина. Высота букв соответствует частоте представленности нуклеотида в данной позиции РАМ последовательности.
Фиг. 5. Проверка влияния однонуклеотидных замен в первой позиции РАМ на эффективность разрезания нуклеазой PpCas9 ДНК-мишени.
Фиг. 6. Проверка значимости нуклеотидных позиций в РАМ последовательности PpCas9. Фиг. 7. Проверка влияния замены А на G в бой позиции РАМ на эффективность разрезания нуклеазой PpCas9 ДНК-мишени.
Фиг. 8. Проверка влияния однонуклеотидных замен в 7ой позиции РАМ на эффективность разрезания нуклеазой PpCas9 ДНК-мишени.
Фиг. 9. Разрезание различных сайтов ДНК с помощью белка PpCas9. Дорожки 1 и 2 - положительный контроль.
Фиг. 10. Проверка распознавания нуклеазой PpCas9 РАМ последовательности CAGCATT. Дорожки 1 и 2 - положительный контроль.
Фиг. 11. Схема инструмента разрезания ДНК PpCas9.
Фиг. 12. Эксперимент по разрезанию ДНК -мишени. Использованы гибридные направляющие РНК разной длины.
Фиг. 13. Выравнивание аминокислотных последовательностей белков PpCas9 и Cas9 из Staphylococcus aureus при помощи программы NCBI BLASTp (default parameters).
Фиг. 14. Изменение геномной ДНК клеток человека с использованием PpCas9. (А) - схема эксперимента по определению эффективности изменения геномной ДНК клеток человека с использованием плазмиды, несущей PpCas9. (В) - Результаты анализа внесения вставок и делеций нуклеотидов в последовательность целевых сайтов геномной ДНК клеток человека (сверху - продукты реакции с Т7 эндонуклеазой I были нанесены на агарозный гель электрофорез, внизу - примеры вставок и делеций, образуемых PpCas9 в гене ЕМХ1, определенные с помощью высоко производительного секвенирования)
Подробное раскрытие изобретения
В описании данного изобретения термины «включает» и «включающий» интерпретируются как означающие «включает, помимо всего прочего». Указанные термины не предназначены для того, чтобы их истолковывали как «состоит только из». Если не определено отдельно, технические и научные термины в данной заявке имеют стандартные значения, общепринятые в научной и технической литературе.
Используемый здесь термин «процент гомологии двух последовательностей» эквивалентен термину «процент идентичности двух последовательностей». Идентичность последовательностей определяется на основании референсной последовательности. Алгоритмы для анализа последовательности известны в данной области, такие как BLAST, описанный в Altschul et al., J. Mol. Biol., 215, pp. 403-10 (1990). Для целей настоящего изобретения для определения уровня идентичности и сходства между нуклеотидными последовательностями и аминокислотными последовательностями может быть использовано сравнение нуклеотидных и аминокислотных последовательностей, производимое с помощью пакета программ Blast, предоставляемого National Center for Biotechnology Information (http://www.ncbi.nl .nih.gov/blast) с использованием содержащего разрывы выравнивания со стандартными параметрами. Процент идентичности двух последовательностей определяется числом положений идентичных аминокислот в этих двух последовательностях с учетом числа пробелов и длины каждого пробела, которые необходимо ввести для оптимального сопоставления двух последовательностей путем выравнивания. Процент идентичности равен числу идентичных аминокислот в данных положениях с учетом выравнивания последовательностей, разделенному на общее число положений и умноженному на 100.
Термин "специфически гибрид изуется" относится к ассоциации между двумя одноцепочечными молекулами нуклеиновых кислот или в достаточной степени комплементарными последовательностями, что разрешает такую гибридизацию в предопределенных условиях, обычно использующихся в данной области.
Фраза "двунитевой разрыв, расположенный непосредственно перед нуклеотидной последовательностью РАМ" означает, что двунитевой разрыв в целевой последовательности ДНК будет произведен на расстоянии от 0 до 25 нуклеотидов перед нуклеотидной последовательностью РАМ.
Под экзогенной последовательностью ДНК, вводимой одновременно с направляющей РНК, следует понимать последовательность ДНК, подготовленную специально для специфической модификации двуцепочечной целевой ДНК в месте разрыва, определяемого специфичностью направляющей РНК. Подобной модификацией может быть, например, вставка или делеция определенных нуклеотидов в месте разрыва целевой ДНК. Экзогенной ДНК может служить как участок ДНК из другого организма, так и участок ДНК из того же организма, что и целевая ДНК.
Под белком, содержащим определенную аминокислотную последовательность следует понимать белок, имеющий аминокислотную последовательность, составленную из указанной аминокислотной последовательности и, возможно, других последовательностей, соединённых пептидными связями с указанной аминокислотной последовательностью. Примером других последовательностей может служить последовательность сигнала ядерной локализации (NLS), или другие последовательности, обеспечивающие повышенную функциональность для указанной аминокислотной последовательности.
Под экзогенной последовательностью ДНК, вводимой одновременно с направляющей РНК, следует понимать последовательность ДНК, подготовленную специально для специфической модификации двуцепочечной целевой ДНК в месте разрыва, определяемого специфичностью направляющей РНК. Подобной модификацией может быть, например, вставка или делеция определенных нуклеотидов в месте разрыва целевой ДНК. Экзогенной ДНК может служить как участок ДНК из другого организма, так и участок ДНК из того же организма, что и целевая ДНК. Под эффективным количеством вводимых в клетку белка и РНК следует понимать такое количество белка и РНК, которое при попадании в указанную клетку будет способно образовать функциональный комплекс, то есть комплекс, который будет специфически связываться с целевой ДНК и производить в ней двунитевой разрыв в месте, определяемом направляющей РНК и РАМ последовательностью на ДНК. Эффективность этого процесса может быть оценена при помощи анализа целевой ДНК, выделенной из указанной клетки с помощью стандартных методов, известных специалистам.
Доставка белка и РНК в клетку может быть осуществлена различными способами. Например, белок может быть доставлен в виде ДНК-плазмиды, которая кодирует ген этого белка, как мРНК для трансляции этого белка в цитоплазме клетки, или как рибонуклеопротеидный комплекс, включающий этот белок и направляющую РНК. Доставка может быть осуществлена различными методами, известными специалистам.
Нуклеиновая кислота, кодирующая компоненты системы, может быть введена в клетку, непосредственно или опосредованно: за счет трансфекции или трансформации клеток известными специалистам способами, за счет использования рекомбинатного вируса, за счет манипуляций с клеткой, таких как микроинъекция ДНК и т.п.
Доставка рибонуклеинового комплекса, состоящего из нуклеазы и направляющих РНК и экзогенной ДНК (при необходимости) может осуществляться путем трансфекции комплексов в клетку или за счет механического введения комплекса внутрь клетки, например, микроинъекции.
Молекула нуклеиновой кислоты, кодирующая белок, который необходимо ввести в клетку, может быть интегрирована в хромосому или может представлять собой внехромосомно реплицирующуюся ДНК. В некоторых вариантах для обеспечения эффективной экспрессии гена белка с вводимой в клетку ДНК необходимо изменить последовательность этой ДНК в соответствии с типом клетки в целях оптимизации кодонов при экспрессии, обусловленное неравномерностью частот встречаемости синонимичных кодонов в кодирующих областях генома различных организмов. Оптимизация кодонов необходима для увеличения экспрессии в клетках животных, растений, грибов или микроорганизмов.
Для функционирования белка, имеющего последовательность, которая по меньшей мере на 95% идентична аминокислотной последовательности SEQ ID NO: 1, в эукариотической клетке необходимо, чтобы этот белок оказался в ядре этой клетки. Поэтому, в некоторых вариантах изобретения, для образования двунитевых разрывов в целевой ДНК используют белок, имеющий последовательность, которая по меньшей мере на 95% идентична аминокислотной последовательности SEQ ID NO: 1, и который дополнительно модифицирован с одного или с обоих концов добавлением одного или нескольких сигналов ядерной локализации. Например, может быть использован сигнал ядерной локализации из вируса SV40. Для эффективной доставки в ядро сигнал ядерной локализации может быть отделен от основной последовательности белка спейсерной последовательностью, например, описанной в Shen В, et al. "Generation of gene-modified mice via Cas9/RNA-mediated gene targeting", Cell Res. 2013 May;23(5):720-3. Также, в других вариантах осуществления, может быть использован другой сигнал ядерной локализации, или альтернативный метод доставки указанного белка в ядро клетки.
Настоящее изобретение охватывает применение белка из организма Р. pneumotropica, гомологичного ранее охарактеризованным белкам Cas9, для внесения двуцепочечных разрывов в молекулы ДНК в строго определенных положениях. Использование CRISPR нуклеаз для внесения направленных изменений в геном имеет ряд преимуществ. Во-первых, специфичность действия системы определяется последовательностью крРНК, что позволяет использовать один тип нуклеазы для всех локусов-мишеней. Во-вторых, методика позволяет доставить в клетку сразу несколько направляющих РНК, комплементарных разным генам-мишеням, что позволяет осуществлять единовременное изменение сразу нескольких генов.
PpCas9 - Cas нуклеаза, найденная в бактериях Pasteurella pneumotropica АТСС 35149, являющихся патогенами грызунов, обитающих в легких животных. Pasteurella pneumotropica (Р. pneumotropica) CRISPR Cas9 система (далее CRISPR PpCas9) относится к IIC типу CRISPR Cas систем и состоит из CRISPR кассеты, несущей четыре прямых повтора (direct repeats, DR) последовательностью
5’ATTATAGCACTGCGAAATGAAAAAGGGAGCTACAAC3’ разделенных последовательностями уникальных спейсеров. Ни один из спейсеров системы не совпадает по последовательности с известными на сегодня бактериофагами или плазмидами, что не позволяет определить требуемый PpCas9 РАМ биоинформатическим анализом. К CRISPR кассете прилегает ген эффекторного Cas9 белка PpCas9, а также гены белков Cas1 и Cas2, участвующих в адаптации, встраивании новых спейсеров. Рядом с Cas генами была обнаружена последовательность, частично комплементарная прямым повторам, складывающаяся в характерную вторичную структуру, - предполагаемая трейсерная РНК (tracrRNA) (Фиг. 1 )
Знание характерной архитектуры PHK-Cas белкового комплекса систем IIC типа позволила предсказать направление транскрипции CRISPR кассеты: пре-крРНК транскрибируется в противоположном от Cas генов направлении (Фиг.1 )
Таким образом, анализ последовательности локуса PpCas9 позволил предсказать последовательности трейсерной и направляющих РНК (Таблица 1).
Таблица 1. Определенные биоинформатическиими методами последовательности направляющих РНК системы CRISPR PpCas9. Жирным шрифтом обозначена последовательность прямого повтора DR.
Figure imgf000012_0001
Для проверки активности PpCas9 нуклеазы и определения требуемого PpCas9 РАМ мотива, были проведены эксперименты по воссозданию реакции разрезания ДНК in vitro. Для определения РАМ последовательности белка PpCas9 использовали in vitro разрезание двунитевых РАМ библиотек. Для этого необходимо было получить все компоненты эффекторного комплекса PpCas9: направляющие РНК и нуклеазу в рекомбинантной форме. Определение последовательности направляющих РНК позволило синтезировать in vitro молекулы crRNA и tracrRNA. Синтез осуществляли с помощью набора NEB HiScribe Т7 RNA synthesis. Двунитевые ДНК библиотеки представляли собой фрагменты размером 374 пар нуклеотидов (п.н.), содержащие последовательность протоспейсера, фланкированную рандомизированными семью нуклеотидами (5’-NNNNNNN-3’) с 3’ конца: 5’- cccg д д д taccacg д ад ад atg д tg д aaatcatctttctcg tggg catccttg atg д ccacctcg teg g aag tg cccacg ag g atg a сад caatg ccaatg ctg g g g g g gctcttctg ag aacg ag ctctg ctg cctg acacg g ccag g acg g ccaacaccaaccag aactt g g g ag aacag cactccg ctctg g g cttcatcttcaactcg teg actccctg caaacacaaag aaag ag catg ttaaaatag g atcta catcacg taacctg tcttag aag ag g ctag atactg caattcaag g accttatctcctttcattg agcacNNNNNNN aactccatcta ccagcctactctcttatctctggtatt -3’
Для разрезания этой мишени использовали направляющие РНК следующей последовательности: tracrRNA:
5’GCGAAATGAAAAACGUUGUUACAAUAAGAGAUGAAUUUCUCGCAAAGCTCUGCC
UCUUGAAAUUUCGGUUUCAAGAGGCAUCUUUUU и crRNA:
5’ uaucuccuuucauugagcacGUUGUAGCUCCCUUUUUCAUUUCGC.
Жирным шрифтом выделена последовательность crRNA, комплементарная протоспейсеру (целевой ДНК последовательности).
Для получения рекомбинантного белка PpCas9 его ген был клонирован в плазмиду рЕТ21 а. В качестве кодирующей ген ДНК, использовалась ДНК, синтезированная в компании Integrated DNA Technologies (ЮТ). Последовательность была кодон- оптимизирована для исключения редких кодонов, встречающихся в геноме Р. pneumotropica. Клетки E.coli Rosetta были трансформированы полученной плазмидой рЕТ21 a-6xHis-PpCas9.
500 мкл ночной культуры разводили в 500 мл среды LB, и растили клетки при температуре 37 °С до достижения оптической плотности 0.6 отн.ед. Синтез целевого белка индуцировали добавлением ИПТГ до концентрации 1 мМ, после чего клетки инкубировали при температуре 20 °С в течение 6 часов. Затем проводили центрифугирование клеток на скорости 5000 g в течение 30 минут, полученные осадки клеток замораживали при температуре -20 °С.
Осадки размораживали на льду в течение 30 минут, ресуспензировали в 15 мл лизисного буфера (Tris-HCI 50мМ pH 8, 500 мМ NaCI, b-меркаптоэтанол 1мМ, имидазол 10 мМ) с добавлением 15 мг лизоцима и снова инкубировали на льду в течение 30 минут. Затем клетки разрушали воздействием ультразвука в течение 30 минут и центрифугировали в течение 40 минут на скорости 16000 д. Полученный супернатант пропускали через фильтр 0,2 мкм и наносили на колонку HisTrap HP 1 mL (GE Healthcare) на скорости 1 мл/мин.
Хроматографию проводили при помощи FPLC хроматографа АКТА (GE Healthcare) на скорости 1 мл/мин. Колонку с нанесенным белком промывали 20 мл лизисного буфера с добавлением 30 мМ имидазола, после чего белок смывали лизисным буфером с добавлением 300 мМ имидазола.
Затем, фракцию белка, полученную в ходе афинной хроматографии, пропускали через гель-фильтрационную колонку Superdex 200 10/300 GL (24 мл), уравновешенную следующим буфером: Tris-HCI 50 мМ pH 8, 500 мМ NaCI, 1 мМ DTT. При помощи концентратора Amicon (с фильтром на 30 кДа) фракции, соответствующие мономерной форме белка PpCas9, сконцентрировали до 3 мг/мл, после чего очищенный белок хранили при температуре -80 °С в буфере, содержащем 10% глицерин.
In vitro реакцию порезки линейных РАМ библиотек проводили в объёме 20 мкл в следующих условиях. Реакционная смесь состояла из: 1Х CutSmart буфера (NEB), 5 мМ DTT, 100 нМ РАМ-библиотеки, 2 мкМ трРНК/крРНК, 400 нМ белка PpCas9. В качестве контроля аналогичным образом были приготовлены пробы, не содержащие РНК. Пробы инкубировали при различных температурах и анализировали методом гель-электрофореза в 2% агарозном геле. В случае правильного узнавания и специфического разрезания ДНК белком PpCas9 должны формироваться два фрагмента ДНК длиной порядка 326 и 48 пар оснований (см. Фиг. 2).
Результаты опыта показали, что PpCas9 обладает нуклеазной активностью и разрезает часть фрагментов РАМ библиотеки. Градиент температур (Фиг. 3) показал, что белок активен в диапазоне температур 35 - 45 °С. В дальнейшем в работе в качестве рабочей использовалась температура 42 °С. Реакцию разрезания библиотеки повторяли в подобранных условиях. Продукты реакции наносили на 1.5% агарозный гель и подвергали электрофорезу. Непорезанные фрагменты ДНК длиной 374 п.н. экстрагировали из геля и подготавливали для высокоэффективного секвенирования с помощью набора NEB NextUltra II. Образцы секвенировали на платформе lllumina и далее проводили анализ последовательностей биоформатическими методами: определяли разницу в представленности нуклеотидов в отдельных позициях РАМ (NNNNNNN) в сравнении с контрольным образцом с использованием подхода, описанного в (Maxwell CS, et al., A detailed cell-free transcription- translation-based assay to decipher CRISPR protospacer-adjacent motifs. Methods. 2018 Jul 1 ;143:48-57). Кроме того, для анализа результатов построили РАМ лого (Фиг. 4).
Оба подхода к анализу данных (Фиг. 4) указывают на значимость 5, 6 и 7 позиций РАМ. Таким образом, в результате in vitro анализа удалось установить предположительную РАМ последовательность для PpCas9: NNNNATT. Однако эта последовательность является лишь предположительной в силу неточности результатов, получаемых скрининговыми подходами к определению РАМ.
В связи с этим для уточнения последовательности была произведена проверка значимости отдельных позиций последовательности РАМ. Для этого проводили реакции in vitro разрезания ДНК фрагментов, содержащих ДНК-мишень 5’- atctcctttcattgagcac-3’, фланкированную РАМ последовательностью СААСАТТ (или ее производных): 5’- cccg д д д taccacg д ад ад atg д tg д aaatcatctttctcg tg д gcatccttg atg д ccacctcg teg д аад tg сссасд ад д atg а сад caatg ccaatg ctg д д д д д gctcttctg ад аасд ад ctctg ctg cctg асасд д ссад д асд д ссаасассаассад aactt д д д ад аасад cactccg ctctg д д cttcatcttcaactcg teg actccctg сааасасааад ааад ад catg ttaaaatag д atcta catcacg taacctg tcttag аад ад g ctag atactg caattcaag g accttatctcctttcattqaqcacCAACATT aactccatcta ccagcctactctcttatctctggtatt- 3’
Все реакции разрезания ДНК проводили в следующих условиях:
IxCutSmart буфер 400 нМ PpCas9 20 нМ ДНК 2 мкМ crRNA 2 мкМ tracrRNA
Время инкубации - 30 минут, температура проведения реакции - 42 °С.
Замена первой позиции РАМ на все четыре возможные варианта нуклеотидов не повлияла на эффективность работы белка (Фиг. 5).
Предсказанная значимость пятой и шестой была подтверждена экспериментально путем однонуклеотидных замен (пурин на пиримидин и наоборот) в каждой из позиций РАМ. При заменах в пятой и шестой позициях белок практически переставал работать. При замене в седьмой позиции эффективность работы PpCas9 снижалась в два раза, что отражает сниженные требования к нуклеотиду в этой позиции (Фиг. 6). Таким образом, согласно полученным результатам in vitro РАМ скрининга нуклеазы PpCas9, в пятой позиции РАМ наиболее вероятными нуклеотидами являются аденин или гуанин, что удалось подтвердить экспериментально (Фиг. 7). Замена А на G никак не снижала эффективность разрезания фрагмента.
Согласно результатам in vitro скрининга фрагменты с “Т” либо с “С” в седьмой позиции должны распознаваться более эффективно. Для окончательной проверки значимости нуклеотидов в этой позиции были проведены дополнительные эксперименты. Результаты проведенных in vitro тестов показали, что при замене нуклеотида “Т” в седьмой позиции на А или G эффективность разрезания снижается на 40-50% (Фиг. 8). Таким образом, седьмая позиция РАМ является менее консервативной в сравнении с пятой и шестой: пурины в седьмом положении снижают эффективность узнавания, но не препятствуют белку PpCas9 вносить двунитевые разрывы в ДНК.
В результате проведенных исследований удалось сделать следующий вывод: РАМ, распознаваемый нуклеазой PpCas9, соответствует следующей формуле 5’- NNNN(A/G)TT- 3’. Седьмая позиция менее консервативна.
Нижеследующие примеры осуществления способа приведены в целях раскрытия характеристик настоящего изобретения и их не следует рассматривать как каким-либо образом ограничивающие объем изобретения.
Пример 1. Тестирование активности белка PpCas9 в разрезании различных ДНК мишеней.
Для того, чтобы проверить способность PpCas9 узнавать различные последовательности ДНК, фланкированные 5’-NNNN(A/G)TT-3’ последовательностью, были проведены эксперименты по in vitro разрезанию ДНК-мишеней из последовательности гена grin2b человека (см. Таблицу 2).
Таблица 2. ДНК-мишени гена GRIN2B человека.
Figure imgf000015_0001
В реакции разрезания в качестве мишени использовался ПЦР фрагмент гена grin2b, несущий сайты узнавания (Таблица 2), предположительно распознаваемыми PpCas9 в соответствии с РАМ консенсусом 5’-NNNN(A/G)TT-3’. Для узнавания этих последовательностей были синтезированы крРНК, направляющие PpCas9 на данные сайты.
Реакции разрезания проводились в подобранных для PpCas9 условиях, результат представлен на Фиг. 9. Из Фиг. 9 видно, что фермент PpCas9 успешно порезал три из четырех мишеней с подходящим РАМ.
Мишень на шестой дорожке имела РАМ последовательность CAGCATT, которая согласно предсказаниям на основании результатов «depletion analysis» должна эффективно распознаваться белком. Однако в данном эксперименте узнавание данного фрагмента не произошло.
Поэтому была произведена дополнительная проверка РАМ CAGCATT на другой мишени-протоспейсере, ограниченной таким же РАМ (Фиг. 10). В этом случае РАМ эффективно распознавался, что приводило к порезке ДНК. Таким образом, белок имеет некие дополнительные предпочтения к последовательности ДНК мишени, возможно связанные со вторичной структурой ДНК.
Таким образом, проведенные исследовательские испытания показали наличие нуклеазной активности у PpCas9, а также позволили определить его РАМ последовательность и верифицировать последовательности направляющих РНК.
PpCas9 рибонуклеопротеиновый комплекс специфически вносит разрывы в мишени, ограниченные РАМ 5’-NNNN(A/G)TT -3’ с 5’ конца протоспейсера. Схема PpCas9- РНК комплекса представлена на Фиг. 11.
Пример 2. Использование гибридной направляющей РНК для разрезания ДНК мишени. sgRNA - форма направляющих РНК, которая представляет собой слитые воедино tracrRNA (трейсерная РНК) и crRNA. Для подбора отимальной sgRNA были сконструированы три варианта этой последовательности, отличающиеся длиной tracrRNA - crRNA дуплекса. РНК синтезировали in vitro и проводили с ними эксперименты по разрезанию ДНК -мишени (Фиг. 12)
В качестве гибридных РНК были использованы следующие РНК последовательности:
1 - sgRNAI 25DR:
UAUCUCCUUUCAUUGAGCACGUUGUAGCUCCCUUUUUCAUUUCGCGAAAGCGAAAUGA
AAAACGUUGUUACAAUAAGAGAUGAAUUUCUCGCAAAGCTCTGCCUCUUGAAAUUUCGG
UUUCAAGAGGCAUCUUUUU
2 - sgRNA236DR
UAUCUCCUUUCAUUGAGCACGUUGUAGCUCCCUUUUUUCAUUUCGCAGUGCUAUAAUG
AAAAUUAUAGCACUGCGAAAUGAAAAACGUUGUUACAAUAAGAGAUGAAUUUCUCGCAAA
GCUCUGCCUCUUGAAAUUUCGGUUUCAAGAGGCAUCUUUUU
Жирным шрифтом обозначена 20-нуклеотидная последовательность, обеспечивающая спаривание с ДНК -мишенью (вариабельная часть sgRNA). Кроме того, в эксперименте делали контрольную пробу без РНК, а также положительный контроль - порезка мишени с помощью crRNA+trRNA.
В качестве ДНК мишени использовалась последовательность, содержащая сайт узнавания 5’ tatctcctttcattgagcac 3’ с соответсвующим консенсусу РАМСААСАТТ : 5’- cccg д д д taccacg д ад ад atg д tg д aaatcatctttctcg tg д gcatccttg atg д ccacctcg teg д аад tg сссасд ад д atg а сад caatg ccaatg ctg д д д д д gctcttctg ад aacg agctctg ctg cctg асасд д ссад д асд д ссаасассаассад aactt д д д ад аасад cactccg ctctg д д cttcatcttcaactcg teg actccctg сааасасааад ааад ад catg ttaaaatag д atcta catcacgtaacctgtcttagaagaggctagatactgcaattcaaggaccttatctcctttcattgagcacCAACATTcaactccat ctaccagcctactctcttatctctggtatt - 3’
Жирным шрифтом обозначен сайт узнавания, заглавными буквами РАМ.
Реакцию проводили в следующих условиях: концентрация ДНК последовательности, содержащей РАМ (СААСАТТ) - 20 нМ, концентрация белка - 400 нМ, концентрация РНК - 2 мкМ; время инкубирования - 30 минут, температура инкубирования - 37 °С.
Подобранные sgRNAI и sgRNA2 оказались так же эффективны, как и нативные последовательности tracrRNA и crRNA: разрезание произошло в более 80% ДНК-мишенях (Фиг. 12).
Эти варианты гибридной РНК могут быть использованы для разрезания любой другой целевой ДНК при изменении последовательности, непосредственно спаривающейся с ДНК -мишенью.
Пример 3. Белки Cas9 из близкородственных организмов, относящихся к Р. pneumotropica.
На сегодняшний день в Р. pneumotropica не охарактеризовано ни одного фермента системы CRISPR-Cas9. Сравнимый по размерам белок Cas9 из Staphylococcus aureus идентичен PpCas9 на 28 % (Фиг. 13, степень идентичности была рассчитана по программе BLASTp, default parameters). Похожая степень идентичности существует и для других известных белков Cas9 (не показано).
Таким образом, белок PpCas9 существенно отличается по аминокислотной последовательности от других Cas9 белков, изученных на сегодняшний день.
Специалисту в области генетической инженерии очевидно, что полученный и охарактеризованный в данном Описании вариант последовательности белка PpCas9 может быть изменен без изменения функции самого белка (например, направленным мутагенезом аминокислотных остатков, напрямую не влияющих на функциональную активность (Sambrook et al., Molecular Cloning: A Laboratory Manual, (1989), CSH Press, pp. 15.3-15.108)). В частности, специалисту известно, что могут быть изменены неконсервативные аминокислотные остатки, не затрагивающие остатки, определяющие функциональность белка (определяющие его функцию или структуру). Примерами таких изменений могут служить замены неконсервативных аминокислотных остатков на гомологичные. Некоторые из участков, содержащих неконсервативные аминокислотные остатки, приведены на Фиг. 12. В некоторых вариантах осуществления изобретения возможно использование белка, содержащего аминокислотную последовательность, которая по меньшей мере на 95% идентична аминокислотной последовательности SEQ ID NO: 1 и имеет отличия по сравнению с SEQ ID NO: 1 только в неконсервативных аминокислотных остатках, для образования двунитевого разрыва в молекуле ДНК, расположенного непосредственно перед нуклеотидной последовательностью 5’- NNNN(A/G)TT-3’ в указанной молекуле ДНК. Гомологичные белки могут быть получены путем мутагенеза (например, сайт-направленного или ПЦР-опосредуемого мутагенеза) соответствующих молекул нуклеиновых кислот с последующим тестированием кодируемого модифицированного белка Cas9 на сохранение его функций в соответствии с описанными здесь функциональными анализами.
Пример 4. Изменение геномной ДНК клеток человека с помощью PpCas9.
Для изменения геномной ДНК клеток человека ген PpCas9 нуклеазы был клонирован в эукариотический плазмидный вектор под регуляцией CMV промотора. На 5’ и 3’ концы гена PpCas9 были добавлены последовательности, кодирующие сигналы ядерной локализации, обеспечивающие доставку нуклеазы в ядро клетки. Последовательность sgRNA была клонирована в вектор под регуляцией U6 промотора. Для проверки активности системы использовались sgRNA с последовательностью, комплементарной ДНК мишени длиной 20 и 24 нуклеотида. В качестве положительного контроля использовалась аналогичная плазмида, несущая систему изменения геномной ДНК на основе SpCas9, известная из уровня техники. Для оценки эффективности трансфекции используемые плазмиды также несли ген зеленого флуоресцентного белка GFP. В качестве ДНК мишеней использовались следующие участки геномной ДНК человека (Таблица 3).
Таблица 3. ДНК-мишени генов ЕМХ1 и GRIN2B человека.
Figure imgf000018_0001
Figure imgf000019_0001
EMX1.1 и EMX1.2 представляли собой два разных сайта модификации в гене ЕМХ1 ; аналогично, GRIN2B1 .1 и GRIN2B1.2 представляли собой два разных сайта модификации в гене GRIN2B.
ДНК мишени были фланкированы с 3’ конца РАМ последовательностями PpCas9 5’- NNNNRTT -3' или SpCas9 5’- NGG -3'.
Для эффективной работы нуклеазы PpCas9 в эукариотических клетках необходимо обеспечить импорт этого белка внутрь ядра эукариотической клетки. Для этого можно использовать сигнал ядерной локализации из Т-антигена вируса SV40 (Lanford et al., Cell, 1986, 46: 575-582), соединённый с последовательностью PpCas9 с помощью спейсерной последовательности, описанной в Shen В, et al. "Generation of gene-modified mice via Cas9/RNA-mediated gene targeting", Cell Res. 2013 May;23(5):720-3 или без нее.
В данном примере, полная аминокислотная последовательность нуклеазы, транспортируемой внутрь ядра клеток человека, представляла собой следующую последовательность:
MAPKKKRKVGIHGVPAAEQNNPLNYILGLDLGIASIGWAVVEIDEESSPIRLIDVGVRTFE
RAEVAKTGESLALSRRLARSSRRLIKRRAERLKKAKRLLKAEKILHSIDEKLPINVWQLRVKGLK
EKLERQEWAAVLLHLSKHRGYLSQRKNEGKSDNKELGALLSGIASNHQMLQSSEYRTPAEIAV
KKFQVEEGHIRNQRGSYTHTFSRLDLLAEMELLFQRQAELGNSYTSTTLLENLTALLMWQKPAL
AGDAILKMLGKCTFEPSEYKAAKNSYSAERFVWLTKLNNLRILENGTERALNDNERFALLEQPY
EKSKLTYAQVRAMLALSDNAIFKGVRYLGEDKKTVESKTTLIEMKFYHQIRKTLGSAELKKEWN
ELKGNSDLLDEIGTAFSLYKTDDDICRYLEGKLPERVLNALLENLNFDKFIQLSLKALHQILPLML
QGQRYDEAVSAIYGDHYGKKSTETTRLLPTIPADEIRNPVVLRTLTQARKVINAVVRLYGSPARI
HIETAREVGKSYQDRKKLEKQQEDNRKQRESAVKKFKEMFPHFVGEPKGKDILKMRLYELQQA
KCLYSGKSLELHRLLEKGYVEVDHALPFSRTWDDSFNNKVLVLANENQNKGNLTPYEWLDGK
NNSERWQHFVVRVQTSGFSYAKKQRILNHKLDEKGFIERNLNDTRYVARFLCNFIADNMLLVG
KGKRNVFASNGQITALLRHRWGLQKVREQNDRHHALDAVVVACSTVAMQQKITRFVRYNEGN
VFSGERIDRETGEIIPLHFPSPWAFFKENVEIRIFSENPKLELENRLPDYPQYNHEWVQPLFVSR
MPTRKMTGQGHMETVKSAKRLNEGLSVLKVPLTQLKLSDLERMVNRDREIALYESLKARLEQF GNDPAKAFAEPFYKKGGALVKAVRLEQTQKSGVLVRDGNGVADNASMVRVDVFTKGGKYFLV
PIYTWQVAKGILPNRAATQGKDENDWDIMDEMATFQFSLCQNDLIKLVTKKKTIFGYFNGLNRA
TSNINIKEHDLDKSKGKLGIYLEVGVKLAISLEKYQVDELGKNIRPCRPTKRQHVRFKRPAATKK
AGQAKKKK
Используемая в данном эксперименте плазмида имела следующую последовательность: g ag д д cctatttcccatg attccttcatatttg catatacg atacaag g ctg ttag ag ag ataattg g aattaatttg actg taaa cacaaag atattag tacaaaatacg tg acg tag aaag taataatttcttg g g tag tttg сад ttttaaaattatg ttttaaaatg g actatca tatg cttaccg taacttg aaag tatttcg atttcttg g ctttatatatcttg tg g aaag g acg aaacaccg XXXXXXXXXXXXXXX XXXXXXXXGTT GT AGCT CCCTTTTT CATTT CGCG AAAGCG AAAT G AAAAACGTT GTT ACAAT AAG AG AT G AATTT CT CGCAAAGCT CT GCCT CTT G AAATTT CGGTTT CAAG AGGCAT CTTTTTt gctT CT CAT GT CCAAT AT GACCGCCAT GTT G ACATT GATT ATT G ACT AGTT ATT AAT AGT AAT C AATT ACGGGGT CATT AGTT CAT AGCCCAT AT AT GG AGTT CCGCGTT acataacttacggtaaatggcc eg cctg g ctg accg cccaacg acccccg cccattg acg tcaataatg acg tatg ttcccatag taacg ccaatag g g actttccattg acgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtccgccccctattgacgtcaa tgacggtaaatggcccgcctggcattatgcccagtacatgaccttacgggactttcctacttggcagtacatctacgtattagtcatcgct attaccatg g tg atg eg g ttttg gcag tacaccaatg g g eg tg g atag eg g tttg actcacg g g g atttccaag tctccaccccattg ac g tcaatg g g ag tttg ttttg g caccaaaatcaacg g g actttccaaaatg teg taataaccccg ccccg ttg acg caaatg g g eg g tag gcgtgtacggtgggaggtctatataagcAG AGCT CGTTT AGT G AACCGT CAGAATT AATT CAG AT CG AT C T ACCaccgccaccAT GAT GGCCCCAAAG AAG AAGCGG AAGGT CGGT AT CCACGG AGT CCCAG CAGCCGAACAGAATAATCCGCTTAACTACATTCTTGGGCTGGATTTGGGAATTGCGAGTA TAGGCTGGGCGGTGGTTGAGATCGATGAAGAGAGTAGTCCGATACGCCTTATCGACGTT GGAGTTAGGACGTTCGAGAGGGCGGAGGTCGCCAAGACCGGTGAGAGCTTGGCCCTCA GCCGGCGGCTCGCTCGATCTAGTCGCAGGCTTATAAAGAGGAGGGCTGAGCGCCTTAA GAAAGCTAAGAGGCTCCTTAAGGCAGAAAAAATTCTGCATAGTATCGACGAAAAGCTGC CGATAAATGTTTGGCAGCTCCGAGTAAAAGGGCTGAAGGAAAAATTGGAAAGGCAGGA GTGGGCGGCGGTACTGCTTCATCTCTCCAAGCACCGGGGCTATCTGTCTCAGCGAAAAA ACGAAGGTAAGTCAGACAACAAGGAGCTGGGCGCACTTTTGTCCGGGATAGCGTCAAAT CATCAGATGCTCCAATCAAGTGAGTATCGGACCCCTGCGGAGATCGCCGTTAAAAAGTT TCAAGTTGAGGAGGGCCACATCAGAAATCAGAGGGGGTCTTACACCCATACGTTCTCTA GACTCGACCTCCTTGCGGAAATGGAACTCCTGTTTCAGCGCCAGGCGGAGCTTGGTAAC TCCTACACGTCCACTACCCTCCTGGAAAACCTGACAGCCCTGCTGATGTGGCAGAAGCC CGCTTTGGCGGGGGATGCCATCCTGAAGATGCTGGGTAAATGCACCTTTGAGCCGTCAG AATATAAAGCCGCCAAGAATAGTTACTCTGCGGAGCGATTTGTTTGGTTGACAAAGTTGA ATAACCTGCGCATCCTGGAGAACGGTACCGAGCGCGCACTCAATGATAATGAGCGCTTC GCCCTCCTGGAACAGCCCTACGAGAAGTCCAAGCTCACCTACGCCCAAGTCAGAGCCAT GCTGGCTCTTAGTGACAACGCGATTTTTAAGGGCGTGCGATACTTGGGCGAGGATAAGA AAACCGTAGAGTCAAAAACGACTCTGATCGAGATGAAATTCTATCACCAAATTAGAAAG
ACCCTCGGTTCTGCCGAGCTGAAAAAGGAATGGAACGAACTTAAGGGTAACAGCGACCT
GCTCGATGAAATCGGTACCGCATTTAGCCTTTATAAAACGGACGACGACATCTGCCGATA
TTTGGAGGGGAAGCTCCCAGAGCGAGTATTGAATGCACTCCTTGAGAACCTTAATTTTGA
CAAGTTCATTCAGCTGTCCCTCAAAGCACTGCATCAAATCCTCCCACTTATGCTGCAAGG
ACAACGATACGACGAAGCCGTCAGCGCGATATATGGAGATCATTACGGAAAAAAGTCCA
CCGAGACCACACGACTGCTTCCTACGATCCCCGCCGATGAGATCAGAAATCCCGTAGTC
CTTCGAACACTTACTCAGGCTAGGAAGGTGATTAATGCGGTAGTTAGGTTGTATGGATCT
CCGGCACGGATACATATAGAAACAGCTCGCGAAGTGGGTAAATCTTACCAAGACCGCAA
GAAATTGGAGAAACAACAGGAGGATAACCGAAAGCAACGAGAATCTGCCGTTAAAAAG
TTTAAGGAAATGTTTCCTCACTTTGTAGGAGAACCGAAGGGTAAAGATATCTTGAAAATG
CGGTTGTACGAGTTGCAGCAAGCTAAGTGTCTCTATAGCGGCAAGAGTTTGGAATTGCA
CCGCCTCCTGGAGAAAGGCTACGTGGAAGTAGACCATGCGCTCCCGTTTTCCCGAACCT
GGGATGATTCTTTCAATAACAAAGTCCTTGTGCTGGCAAATGAGAACCAGAACAAAGGA
AATCTGACTCCTTATGAGTGGTTGGATGGCAAGAATAATTCTGAGCGGTGGCAACATTTC
GTTGTCCGCGTCCAAACGTCAGGGTTCAGCTATGCTAAGAAACAAAGGATCCTCAATCA
CAAGCTCGACGAGAAAGGATTCATAGAACGAAATTTGAATGACACTAGGTATGTGGCTC
GATTTCTCTGCAATTTTATTGCTGACAATATGCTCCTCGTTGGGAAGGGAAAGCGGAATG
TTTTTGCATCAAATGGGCAGATAACGGCGCTCTTGAGACATAGATGGGGGCTGCAAAAG
GTGAGAGAGCAAAATGATAGACATCACGCCCTGGATGCCGTTGTAGTCGCCTGTTCAAC
GGTTGCGATGCAGCAAAAGATCACTCGGTTCGTTAGGTATAACGAAGGGAACGTTTTTA
GTGGAGAGCGCATAGATCGGGAAACAGGCGAAATCATCCCTTTGCATTTCCCAAGTCCT
TGGGCTTTTTTCAAAGAGAATGTGGAAATAAGGATATTCAGTGAAAACCCTAAGTTGGAG
CTTGAGAATCGGTTGCCCGATTATCCCCAGTACAATCATGAGTGGGTTCAACCGCTGTTC
GTATCCCGCATGCCAACCCGAAAGATGACCGGGCAGGGTCACATGGAGACTGTGAAAT
CTGCAAAGAGACTTAATGAGGGCCTGTCAGTGTTGAAGGTGCCCTTGACTCAACTGAAA
TTGAGCGACCTCGAGCGCATGGTAAACCGCGATAGAGAAATCGCACTTTATGAGAGTCT
GAAGGCGCGATTGGAACAATTCGGTAATGATCCGGCAAAGGCTTTCGCTGAGCCATTCT
ACAAGAAGGGTGGAGCGCTGGTTAAGGCTGTCCGACTCGAACAGACACAAAAGTCAGG
GGTCTTGGTCAGAGATGGTAACGGGGTTGCCGACAACGCCTCCATGGTACGAGTAGATG
TTTTCACGAAAGGAGGAAAATACTTTCTGGTACCTATCTATACCTGGCAAGTTGCCAAGG
GAATACTCCCGAATAGGGCGGCGACCCAGGGAAAGGATGAAAACGACTGGGATATAAT
GGATGAAATGGCTACGTTTCAGTTTAGCTTGTGCCAGAATGACCTCATAAAACTGGTAAC
CAAAAAAAAGACTATATTCGGGTATTTCAATGGCCTTAATCGGGCAACTTCCAATATCAA
CATCAAGGAACATGATCTGGATAAGAGCAAGGGAAAGCTTGGTATCTATCTCGAAGTTG
G AGTC AAGCTCGCT ATTTCCCTCG AG AAAT АТС AAGT AG ATG AACTGGG AAAG AAT AT AC
GGCCATGCCGGCCCACAAAAAGACAACACGTACGGTTCAAAAGGCCGGCGGCCACGAA
AAAGGCCGGCCAGGCAAAAAAG AAAAAGGG AT CCT ACCCAT ACG AT GTT CCAG ATT ACGC TT AT CCCT ACG ACGT GCCT GATT AT GC AT ACCCAT AT GAT GT CCCCG ACT AT GCCGGCGCA ACAAACTT CT CT CT GCT GAAACAAGCCGG AGAT GT CG AAG AG AAT CCT GG ACCGgtgagcaag g g eg ag g ag ctg ttcaccg g g g tg g tg cccatcctg g teg ag ctg g acg g eg acg taaacg g ccacaag ttcag eg tg tccg g eg agggcgagggcgatg ccacctacg g caagctg accctg aag ttcatctg caccaccg g caagctgcccg tg ccctg g cccaccct eg tg accaccctg acctacg gcg tg cag tg cttcag ccg ctaccccg accacatg aag cag cacg acttcttcaag tccg ccatgcc eg aag g ctacg tccag g ag cgcaccatcttcttcaag g acg acg g caactacaag acccg eg ccg ag g tg aag ttcg ag g g eg a caccctg g tg aaccg catcg ag ctg aag g g catcg acttcaag g ag g acg g caacatcctg g g g cacaagctg g ag tacaacta caacagccacaacg tctatatcatg gccg acaag cag aag aacg g catcaag g tg aacttcaag atccg ccacaacatcg ag g a eg g cagcg tg cag ctcg ccg accactaccagcag aacacccccatcg g eg acg g ccccg tg ctg ctg cccg acaaccactacct g ag cacccag tccg ccctg ag caaag accccaacg ag aag cgcg atcacatg g tcctg ctg g ag ttcg tg accg ccgccg g g at cactctcggcatggacgagctgtacaagT AA
В последовательности плазмиды выделены следующие части: U6 промотер (первый участок, прописные буквы), последовательность, комплиментарная протоспейсеру (“ХХХ-ХХХ”), консервативная часть sgRNA (третий участок, заглавные буквы), ген PpCas9 (выделен жирным шрифтом), ген GFP (последний участок, прописные буквы).
Плазмиды с PpCas9 или SpCas9 были трансфицированы в культуру клеток человека НЕК293Т с помощью реагента липофектамина 2000. По истечении 72 часов после трансфекции, клетки лизировали и с полученных лизатов проводилась ПЦР для наработки участков, включающих целевые сайты изменения геномной ДНК. Полученные ПЦР фрагменты подвергали in vitro реакции с Т7 эндонуклеазой I для определения частоты внесения вставок и делеций в целевых сайтах геномной ДНК. Продукты реакции наносили на агарозный гель и подвергали электрофорезу. На Фиг. 14А показано, что PpCas9 активно вносит изменения в генах ЕМХ1 и GRIN2b, с эффективностью, схожей с эффективностью работы описанной в уровне техники SpCas9 нуклеазы.
Данный экперимент показал, что для эффективного изменения геномной ДНК PpCas9 требует удлиненные sgRNA по сравнению с SpCas9: в приведенном примере эффективность генетических модификаций выше при использовании sgRNA с последовательностью комплементарной ДНК мишени длиной 24 нуклеотида (по сравнению с длиной в 20 нуклеотидов).
Высокопроизводительное секвенирование подтвердило внесение изменений в целевых сайтах ДНК. На Фиг. 14Б приведены примеры обнаруживаемых изменений в нуклеотидной последовательности гена ЕМХ1.
Для доставки NLS_PpCas9_NLS в клетки человека также может быть использована доставка в виде рибонуклеинового комплекса. Она осуществляется путем инкубации рекомбинантной формы PpCas9 NLS с направляющими РНК в CutSmart буфере (NEB). Рекомбинантный белок получают из бактериальных клеток-продуцентов, очищая его с помощью аффинной хроматографии (NiNTA, Qiagen) разделением по размеру (Superdex 200).
Белок смешивают с РНК в соотношении 1:2 (PpCas9 NLS : sgRNA), инкубируют в течение 10 минут на комнатной температуре, затем смесь трансфицируют в клетки.
Далее проводится анализ экстрагированной из них ДНК на предмет вставок- делеций в целевом ДНК сайте (как описано выше).
Охарактеризованная в настоящем изобретении нуклеаза PpCas9 из бактерии Pasteure!!a рпеит о tropica может быть доставлена для модификации ДНК в клетки различного происхождения с помощью стандартных подходов и методов, известных специалистам. PpCas9 имеет ряд преимуществ относительно ранее охарактеризованных Cas9 белков.
PpCas9 обладает коротким, двухбуквенным, отличным от других известных Cas нуклеаз РАМ мотивом, необходимым для функционирования системы. В изобретении было показано, что для успешного функционирования PpCas9 in vivo достаточно присутствия короткого РАМ мотива (RTT), расположенного в 4 нуклеотидах от протоспейсера.
Известные на сегодняшний день многие малоразмерные Cas нуклеазы, способные вносить двунитевые разрывы в ДНК, имеют сложные многобуквенные РАМ последовательности, ограничивающие выбор последовательностей, пригодных для разрезания. Среди изученных Cas нуклеаз, распознающих короткие РАМ, только PpCas9 может распознавать последовательности, фланкированные RTT мотивом.
Второе преимущество PpCas9 - малый размер белка (1055 а. о). На сегодняшний день это единственный изученный малоразмерный белок, обладающий трехбуквенной RTT РАМ последовательностью.
PpCas9 - новая малоразмерная Cas нуклеаза, имеющая короткий, простой в использовании РАМ, отличающийся от известных на сегодняшний день РАМ последовательностей других нуклеаз. Белок PpCas9 разрезает с высокой эффективностью различные ДНК-мишени, в том числе геномную ДНК в клетках человека при 37 °С, и может стать основой нового инструмента геномного редактирования.
Несмотря на то, что изобретение описано со ссылкой на раскрываемые варианты воплощения, для специалистов в данной области должно быть очевидно, что конкретные подробно описанные случаи приведены лишь в целях иллюстрирования настоящего изобретения, и их не следует рассматривать как каким-либо образом ограничивающие объем изобретения. Должно быть, понятно, что возможно осуществление различных модификаций без отступления от сути настоящего изобретения. ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙ
<110> Автономная некоммерческая образовательная организация высшего образования Сколковский институт науки технологий /Skolkovo Institute of Science and Technology
<120> ПРИМЕНЕНИЕ CAS9 БЕЛКА ИЗ БАКТЕРИИ PASTEURELLA PNEUMOTROPICA ДЛЯ МОДИФИКАЦИИ ГЕНОМНОЙ ДНК В КЛЕТКАХ
<130> 424316 <150> RU 2019136164 <151> 2019-11-11
<160> 2
<210> 1 <211> 1055 <212> PRT
<213> Pasteurella pneumotropica
<220>
<223> белок, гомологичный Cas9 <400> 1
Met Gin Asn Asn Pro Leu Asn Tyr lie Leu Gly Leu Asp Leu Gly lie 1 5 10 15
Ala Ser lie Gly Trp Ala Val Val Glu lie Asp Glu Glu Ser Ser Pro 20 25 30 lie Arg Leu lie Asp Val Gly Val Arg Thr Phe Glu Arg Ala Glu Val 35 40 45
Ala Lys Thr Gly Glu Ser Leu Ala Leu Ser Arg Arg Leu Ala Arg Ser 50 55 60
Ser Arg Arg Leu lie Lys Arg Arg Ala Glu Arg Leu Lys Lys Ala Lys 65 70 75 80
Arg Leu Leu Lys Ala Glu Lys lie Leu His Ser lie Asp Glu Lys Leu 85 90 95
Pro lie Asn Val Trp Gin Leu Arg Val Lys Gly Leu Lys Glu Lys Leu 100 105 110
Glu Arg Gin Glu Trp Ala Ala Val Leu Leu His Leu Ser Lys His Arg 115 120 125
Gly Tyr Leu Ser Gin Arg Lys Asn Glu Gly Lys Ser Asp Asn Lys Glu 130 135 140
Leu Gly Ala Leu Leu Ser Gly lie Ala Ser Asn His Gin Met Leu Gin 145 150 155 160
Ser Ser Glu Tyr Arg Thr Pro Ala Glu lie Ala Val Lys Lys Phe Gin 165 170 175
Val Glu Glu Gly His lie Arg Asn Gin Arg Gly Ser Tyr Thr His Thr 180 185 190
Phe Ser Arg Leu Asp Leu Leu Ala Glu Met Glu Leu Leu Phe Gin Arg 195 200 205
Gin Ala Glu Leu Gly Asn Ser Tyr Thr Ser Thr Thr Leu Leu Glu Asn 210 215 220
Leu Thr Ala Leu Leu Met Trp Gin Lys Pro Ala Leu Ala Gly Asp Ala 225 230 235 240 lie Leu Lys Met Leu Gly Lys Cys Thr Phe Glu Pro Ser Glu Tyr Lys 245 250 255
Ala Ala Lys Asn Ser Tyr Ser Ala Glu Arg Phe Val Trp Leu Thr Lys 260 265 270
Leu Asn Asn Leu Arg lie Leu Glu Asn Gly Thr Glu Arg Ala Leu Asn 275 280 285 Asp Asn Glu Arg Phe Ala Leu Leu Glu Gin Pro Tyr Glu Lys Ser Lys 290 295 300
Leu Thr Tyr Ala Gin Val Arg Ala Met Leu Ala Leu Ser Asp Asn Ala 305 310 315 320 lie Phe Lys Gly Val Arg Tyr Leu Gly Glu Asp Lys Lys Thr Val Glu 325 330 335
Ser Lys Thr Thr Leu lie Glu Met Lys Phe Tyr His Gin lie Arg Lys 340 345 350
Thr Leu Gly Ser Ala Glu Leu Lys Lys Glu Trp Asn Glu Leu Lys Gly 355 360 365
Asn Ser Asp Leu Leu Asp Glu lie Gly Thr Ala Phe Ser Leu Tyr Lys 370 375 380
Thr Asp Asp Asp lie Cys Arg Tyr Leu Glu Gly Lys Leu Pro Glu Arg 385 390 395 400
Val Leu Asn Ala Leu Leu Glu Asn Leu Asn Phe Asp Lys Phe lie Gin 405 410 415
Leu Ser Leu Lys Ala Leu His Gin lie Leu Pro Leu Met Leu Gin Gly 420 425 430
Gin Arg Tyr Asp Glu Ala Val Ser Ala lie Tyr Gly Asp His Tyr Gly 435 440 445
Lys Lys Ser Thr Glu Thr Thr Arg Leu Leu Pro Thr lie Pro Ala Asp 450 455 460
Glu lie Arg Asn Pro Val Val Leu Arg Thr Leu Thr Gin Ala Arg Lys 465 470 475 480
Val lie Asn Ala Val Val Arg Leu Tyr Gly Ser Pro Ala Arg lie His 485 490 495 lie Glu Thr Ala Arg Glu Val Gly Lys Ser Tyr Gin Asp Arg Lys Lys 500 505 510
Leu Glu Lys Gin Gin Glu Asp Asn Arg Lys Gin Arg Glu Ser Ala Val 515 520 525
Lys Lys Phe Lys Glu Met Phe Pro His Phe Val Gly Glu Pro Lys Gly 530 535 540
Lys Asp lie Leu Lys Met Arg Leu Tyr Glu Leu Gin Gin Ala Lys Cys 545 550 555 560
Leu Tyr Ser Gly Lys Ser Leu Glu Leu His Arg Leu Leu Glu Lys Gly 565 570 575
Tyr Val Glu Val Asp His Ala Leu Pro Phe Ser Arg Thr Trp Asp Asp 580 585 590
Ser Phe Asn Asn Lys Val Leu Val Leu Ala Asn Glu Asn Gin Asn Lys 595 600 605
Gly Asn Leu Thr Pro Tyr Glu Trp Leu Asp Gly Lys Asn Asn Ser Glu 610 615 620
Arg Trp Gin His Phe Val Val Arg Val Gin Thr Ser Gly Phe Ser Tyr 625 630 635 640
Ala Lys Lys Gin Arg lie Leu Asn His Lys Leu Asp Glu Lys Gly Phe 645 650 655 lie Glu Arg Asn Leu Asn Asp Thr Arg Tyr Val Ala Arg Phe Leu Cys 660 665 670
Asn Phe lie Ala Asp Asn Met Leu Leu Val Gly Lys Gly Lys Arg Asn 675 680 685
Val Phe Ala Ser Asn Gly Gin lie Thr Ala Leu Leu Arg His Arg Trp 690 695 700
Gly Leu Gin Lys Val Arg Glu Gin Asn Asp Arg His His Ala Leu Asp 705 710 715 720
Ala Val Val Val Ala Cys Ser Thr Val Ala Met Gin Gin Lys lie Thr 725 730 735
Arg Phe Val Arg Tyr Asn Glu Gly Asn Val Phe Ser Gly Glu Arg lie 740 745 750
Asp Arg Glu Thr Gly Glu lie lie Pro Leu His Phe Pro Ser Pro Trp 755 760 765 Ala Phe Phe Lys Glu Asn Val Glu lie Arg lie Phe Ser Glu Asn Pro 770 775 780
Lys Leu Glu Leu Glu Asn Arg Leu Pro Asp Tyr Pro Gin Tyr Asn His
785 790 795 800
Glu Trp Val Gin Pro Leu Phe Val Ser Arg Met Pro Thr Arg Lys Met
805 810 815
Thr Gly Gin Gly His Met Glu Thr Val Lys Ser Ala Lys Arg Leu Asn 820 825 830
Glu Gly Leu Ser Val Leu Lys Val Pro Leu Thr Gin Leu Lys Leu Ser 835 840 845
Asp Leu Glu Arg Met Val Asn Arg Asp Arg Glu lie Ala Leu Tyr Glu 850 855 860
Ser Leu Lys Ala Arg Leu Glu Gin Phe Gly Asn Asp Pro Ala Lys Ala
865 870 875 880
Phe Ala Glu Pro Phe Tyr Lys Lys Gly Gly Ala Leu Val Lys Ala Val
885 890 895
Arg Leu Glu Gin Thr Gin Lys Ser Gly Val Leu Val Arg Asp Gly Asn 900 905 910
Gly Val Ala Asp Asn Ala Ser Met Val Arg Val Asp Val Phe Thr Lys 915 920 925
Gly Gly Lys Tyr Phe Leu Val Pro lie Tyr Thr Trp Gin Val Ala Lys 930 935 940
Gly lie Leu Pro Asn Arg Ala Ala Thr Gin Gly Lys Asp Glu Asn Asp
945 950 955 960
Trp Asp lie Met Asp Glu Met Ala Thr Phe Gin Phe Ser Leu Cys Gin
965 970 975
Asn Asp Leu lie Lys Leu Val Thr Lys Lys Lys Thr lie Phe Gly Tyr 980 985 990
Phe Asn Gly Leu Asn Arg Ala Thr Ser Asn lie Asn lie Lys Glu His 995 1000 1005
Asp Leu Asp Lys Ser Lys Gly Lys Leu Gly lie Tyr Leu Glu Val Gly 1010 1015 1020
Val Lys Leu Ala lie Ser Leu Glu Lys Tyr Gin Val Asp Glu Leu Gly
1025 1030 1035 1040
Lys Asn lie Arg Pro Cys Arg Pro Thr Lys Arg Gin His Val Arg
1045 1050 1055
<210> 2 <211> 3168 <212> DNA
<213> Pasteurella pneumotropica
<220>
<223> белок, гомологичный Cas9 <400> 2 atgcaaaata atccattaaa ttacatttta gggttagatt taggcattgc ttctattggt 60 tgggcggttg tggaaattga tgaggagagt tcacctattc gcttaattga tgtgggcgtc 120 cgtacatttg aacgggctga agtcgctaaa accggcgaaa gtttagcatt gtctcgtcgt 180 ttagctcgtt catcacggcg attaattaaa cgccgagcag agcgattaaa aaaagcaaaa 240 cgtttattaa aagcagaaaa gattttacat tctattgatg aaaaattacc cattaatgtt 300 tggcagcttc gagtaaaagg attgaaggaa aaactcgaac gtcaggagtg ggcagcggtt 360 ttattacatt tgtcaaagca tcgtggctat ttatcacaac gtaaaaatga gggtaaaagt 420 gataataaag agctgggggc attactttca ggtatcgcaa gtaaccacca aatgttgcaa 480 tcctccgaat atcgtacccc tgcagaaatt gcagtcaaaa aatttcaagt agaagaagga 540 catattcgta atcaacgtgg atcttatacc cataccttta gccgtttgga tttgttggca 600 gaaatggaat tattatttca acgccaagct gagttaggca attcttacac gtccaccaca 660 ttattagaaa atttgacggc gttactaatg tggcaaaagc cagctcttgc gggtgatgcg 720 attttaaaaa tgttgggcaa gtgtaccttc gaacccagcg aatataaagc cgcaaaaaat 780 agttattctg ctgaacgttt tgtgtggtta accaagctga ataatttacg cattttagaa 840 aatggcacgg aaagagcttt aaatgacaat gaacgttttg ctttgcttga gcaaccgtat 900 gagaaatcaa aattaactta tgctcaagtg agagcaatgc ttgcgttatc tgataatgct 960 attttcaaag gggttcgtta tttaggcgaa gataaaaaaa cagtagagag caaaactacg 1020 ttgatagaaa tgaagtttta tcatcaaatc cgcaaaacat taggcagtgc agaattaaaa 1080 aaggaatgga atgagttaaa aggcaattcc gatttattag atgagattgg cacggcattt 1140 tcgttgtata aaacggatga tgatatttgc cgttatttag agggaaaact accagaaagg 1200 gtattaaatg cgttattgga aaatttaaat ttcgataaat ttattcaact ttcacttaaa 1260 gccttacacc aaattttacc attgatgctg caagggcaac gttatgatga ggcggtttct 1320 gcgatttatg gtgatcatta tggtaaaaaa tcgacagaaa caacccgctt gttgccgact 1380 attcctgccg atgaaatccg aaatcctgtg gtattacgca ccctgaccca agcccgtaaa 1440 gtgatcaatg cggtggtgcg gttatatggt tcgcctgccc gtattcatat tgaaacagcg 1500 agagaagtcg gcaaatctta ccaagatcgt aaaaaacttg aaaaacagca agaagataat 1560 cgtaagcaac gtgaaagtgc ggtcaaaaaa tttaaagaaa tgtttccgca ttttgtgggg 1620 gagccgaaag gtaaagatat tttaaaaatg cgattgtatg agttacaaca agcgaaatgt 1680 ttatattctg gaaaatcttt agaacttcat cgtttgcttg agaaggggta tgtagaagtg 1740 gatcacgctt tgccattttc tcgcacgtgg gatgatagct ttaataataa agtactggtg 1800 cttgccaacg agaaccaaaa taaaggcaat ttaacgcctt atgaatggtt agatggtaaa I860 aataacagtg agcgttggca acattttgtt gtacgagtac aaaccagcgg tttctcttat 1920 gctaaaaaac aacgcatttt gaaccataaa ttggatgaaa aagggtttat cgaacgtaat 1980 ttaaacgata ctcgctatgt agctcgtttc ttatgtaact ttattgccga taatatgttg 2040 ttggttggta aaggcaagcg aaacgtgttt gcttcaaacg ggcaaatcac ggcgttattg 2100 cggcatcgtt ggggcttaca aaaagtgcgt gaacagaatg atcgccacca cgcactggac 2160 gcggttgtgg tggcttgctc tactgtggca atgcaacaaa aaatcactcg atttgtgaga 2220 tataacgaag gaaatgtctt tagcggtgaa cgtatcgatc gtgaaactgg cgagattatt 2280 ccattacatt ttccaagccc ttgggctttt ttcaaagaga atgtggaaat tcgcattttt 2340 agtgaaaatc caaaattgga attagaaaat cgcctgcctg attatccgca atataatcac 2400 gaatgggtgc aaccattgtt tgtttcgaga atgccaaccc gaaaaatgac agggcaaggg 2460 catatggaaa cggtaaaatc cgcaaaacga ttaaatgaag gtttaagtgt gttaaaagtc 2520 cctttaacac aacttaaatt gagtgattta gaacgaatgg ttaatcgtga tcgtgaaatt 2580 gcattgtatg aatccttaaa agcacgttta gagcaatttg gtaacgaccc agccaaagcc 2640 tttgccgaac cattctataa aaagggtggg gcattagtca aagcagtccg attggaacaa 2700 acacaaaaat cgggggtatt agtacgtgat ggtaacggtg ttgcggataa tgcttcaatg 2760 gtacgggttg atgtttttac taaaggtgga aaatatttct tagtgccgat ttatacttgg 2820 caggtagcga aagggatttt accgaatagg gctgcgacac aaggtaaaga tgaaaatgat 2880 tgggatatta tggatgaaat ggctactttc caattttctc tatgtcaaaa tgatctaatt 2940 aaattagtta ccaaaaagaa aacaatcttt ggatatttta atggattaaa tagagctact 3000 agcaatataa atattaaaga gcatgatcta gataagtcta aagggaaatt aggtatttac 3060 ttagaagttg gtgtaaaact agctatttcc cttgaaaagt accaagtcga cgaactcggc 3120 aaaaatatcc gtccttgtcg tccgactaaa cgacagcacg tgcgttaa 3168

Claims

ФОРМУЛА ИЗОБРЕТЕНИЯ
1. Применение белка, содержащего аминокислотную последовательность SEQ ID NO: 1, или содержащего аминокислотную последовательность, которая по меньшей мере на 95% идентична аминокислотной последовательности SEQ ID NO: 1 и имеет отличия по сравнению с SEQ ID NO: 1 только в неконсервативных аминокислотных остатках, для образования двунитевого разрыва в молекуле ДНК, расположенного непосредственно перед нуклеотидной последовательностью 5’-NNNN(A/G)TT-3’ в указанной молекуле ДНК.
2. Применение по п. 1, характеризующееся тем, что образование двунитевого разрыва в молекуле ДНК происходит при температуре от 35 °С до 45 °С.
3. Применение белка по п. 1, где белок содержит аминокислотную последовательность SEQ ID NO: 1.
4. Применение по п. 1, характеризующееся тем, что образование двунитевого разрыва в молекуле ДНК происходит в геномной ДНК клетки млекопитающего.
5. Применение по п. 4, характеризующееся тем, что образование двунитевого разрыва в молекуле ДНК приводит к изменению геномной ДНК указанной клетки млекопитающего.
6. Способ изменения последовательности геномной ДНК в клетке одноклеточного или многоклеточного организма, содержащей геномную ДНК, включающий введение в указанную клетку организма эффективного количества: а) белка, содержащего аминокислотную последовательность SEQ ID NO: 1, или нуклеиновой кислоты, кодирующей белок, содержащий аминокислотную последовательность SEQ ID NO: 1, и б) направляющей РНК, содержащей последовательность, образующую дуплекс с нуклеотидной последовательностью участка геномной ДНК организма, непосредственно примыкающей к нуклеотидной последовательности 5’-NNNN(A/G)TT-3’, и взаимодействующей с указанным белком после образования дуплекса, или последовательности ДНК, кодирующей указанную направляющую РНК; при этом взаимодействие указанного белка с направляющей РНК и нуклеотидной последовательностью 5’-NNNN(A/G)TT-3’ приводит к образованию двунитевого разрыва в последовательности геномной ДНК, непосредственно примыкающей к последовательности 5’-NNNN(A/G)TT-3’.
7. Способ по п. 6, дополнительно включающий введение экзогенной последовательности ДНК одновременно с направляющей РНК.
8. Способ по п. 6, характеризующееся тем, что указанная клетка является клеткой млекопитающего.
PCT/RU2020/050145 2019-11-11 2020-07-02 Применение cas9 бежа из бактерии pasteurella pneumotropica WO2021096391A1 (ru)

Priority Applications (13)

Application Number Priority Date Filing Date Title
CN202080092630.XA CN115397995A (zh) 2019-11-11 2020-07-02 来自细菌嗜肺巴斯德杆菌的cas9蛋白的用途
CA3157898A CA3157898A1 (en) 2019-11-11 2020-07-02 Use of cas9 protein from the bacterium pasteurella pneumotropica
US17/775,626 US20220403369A1 (en) 2019-11-11 2020-07-02 Use of cas9 protein from the bacterium pasteurella pneumotropica
JP2022527121A JP2023501524A (ja) 2019-11-11 2020-07-02 細菌パスツレラ・ニューモトロピカ(Рasteurella pneumotropica)由来Cas9タンパク質の使用
EP20887900.7A EP4056705A4 (en) 2019-11-11 2020-07-02 USE OF CAS9 PROTEIN FROM THE BACTERIA PASTEURELLA PNEUMOTROPICA
MA57032A MA57032A1 (fr) 2019-11-11 2020-07-02 Utilisation de beige cas9 issu de bactérie pasteurella pneumotropica
PE2022000763A PE20230035A1 (es) 2019-11-11 2020-07-02 Uso de proteina cas9 de la bacteria pasteurella pneumotropica
MX2022005685A MX2022005685A (es) 2019-11-11 2020-07-02 Uso de proteina cas9 de la bacteria pasteurella pneumotropica.
KR1020227019785A KR20220145324A (ko) 2019-11-11 2020-07-02 세균 파스퇴렐라 뉴모트로피카 유래 cas9 단백질의 용도
BR112022009148A BR112022009148A2 (pt) 2019-11-11 2020-07-02 Uso de proteína cas9 da bactéria pasteurella pneumotropica e método para modificar uma sequência de dna genômico em uma célula de um organismo unicelular ou multicelular
AU2020384851A AU2020384851A1 (en) 2019-11-11 2020-07-02 Use of Cas9 protein from the bacterium pasteurella pneumotropica
ZA2022/05208A ZA202205208B (en) 2019-11-11 2022-05-11 Use of cas9 protein from the bacterium pasteurella pneumotropica
CONC2022/0006156A CO2022006156A2 (es) 2019-11-11 2022-05-11 Uso de proteína cas9 de la bacteria pasteurella pneumotropica

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
RU2019136164 2019-11-11
RU2019136164A RU2724470C1 (ru) 2019-11-11 2019-11-11 Применение cas9 белка из бактерии pasteurella pneumotropica для модификации геномной днк в клетках

Publications (1)

Publication Number Publication Date
WO2021096391A1 true WO2021096391A1 (ru) 2021-05-20

Family

ID=71136150

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/RU2020/050145 WO2021096391A1 (ru) 2019-11-11 2020-07-02 Применение cas9 бежа из бактерии pasteurella pneumotropica

Country Status (16)

Country Link
US (1) US20220403369A1 (ru)
EP (1) EP4056705A4 (ru)
JP (1) JP2023501524A (ru)
KR (1) KR20220145324A (ru)
CN (1) CN115397995A (ru)
AU (1) AU2020384851A1 (ru)
BR (1) BR112022009148A2 (ru)
CA (1) CA3157898A1 (ru)
CL (1) CL2022001220A1 (ru)
CO (1) CO2022006156A2 (ru)
MA (1) MA57032A1 (ru)
MX (1) MX2022005685A (ru)
PE (1) PE20230035A1 (ru)
RU (1) RU2724470C1 (ru)
WO (1) WO2021096391A1 (ru)
ZA (1) ZA202205208B (ru)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3755792A4 (en) * 2018-02-23 2021-12-08 Pioneer Hi-Bred International, Inc. NEW CAS9 ORTHOLOGIST
BR112022017713A2 (pt) * 2020-03-04 2022-11-16 Flagship Pioneering Innovations Vi Llc Métodos e composições para modular um genoma

Non-Patent Citations (17)

* Cited by examiner, † Cited by third party
Title
ALTSCHUL ET AL., J. MOL. BIOL., vol. 215, 1990, pages 403 - 10
BROUNS S. J. J. ET AL.: "Small CRISPR RNAs guide antiviral defense in prokaryotes", SCIENCE, vol. 321, pages 960 - 964, XP055401088, DOI: 10.1126/science.1159689
CONG L ET AL.: "Multiplex genome engineering using CRISPR/Cas systems", SCIENCE, vol. 339, no. 6121, 15 February 2013 (2013-02-15), pages 819 - 23, XP055400719, DOI: 10.1126/science.1231143
DELTCHEVA E. ET AL.: "CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III", NATURE, vol. 471, 2011, pages 602, XP055619637, DOI: 10.1038/nature09886
HSU PD ET AL.: "DNA targeting specificity of RNA-guided Cas9 nucleases", NAT BIOTECHNOL., vol. 31, no. 9, pages 827 - 32, XP055219426, DOI: 10.1038/nbt.2647
JANSEN R. ET AL., MOLECULAR MICROBIOLOGY, vol. 43, 2002, pages 1565 - 1575
JANSEN R. ET AL.: "Identification of genes that are associated with DNA repeats in prokaryotes", MOLECULAR MICROBIOLOGY, vol. 43, 2002, pages 1565 - 1575, XP002424877, DOI: 10.1046/j.1365-2958.2002.02839.x
KHLESTKINA E. K.; SHUMNY V. K.: "Prospects for application of breakthrough technologies in breeding: The CRISPR/Cas9 system for plant genome editing", RUSSIAN JOURNAL OF GENETICS, vol. 52, no. 7, 30 July 2016 (2016-07-30), RU , pages 676 - 687, XP036018512, ISSN: 1022-7954, DOI: 10.1134/S102279541607005X *
LANFORD ET AL., CELL, vol. 46, 1986, pages 575 - 582
MARTIN NEGIN R. ET AL.: "Ep masse lenti viral gene delivery to mouse fertilized eggs via laser perforation of zona pellucida", TRANSGENIC RESEARCH, vol. 27, no. 1, 2018, pages 39 - 49, XP036439454, DOI: 10.1007/s 11248-017-0056-8 *
MAXWELL CS ET AL.: "A detailed cell-free transcription-translation-based assay to decipher CRISPR protospacer-adjacent motifs", METHODS, vol. 143, 1 July 2018 (2018-07-01), pages 48 - 57, XP055698442, DOI: 10.1016/j.ymeth.2018.02.016
MOJICA F. J. M. ET AL.: "Intervening sequences of regularly spaced prokaryotic repeats derive from foreign genetic elements", JOURNAL OF MOLECULAR EVOLUTION, vol. 60, 2005, pages 174 - 182, XP019363173, DOI: 10.1007/s00239-004-0046-3
SAMBROOK ET AL.: "Molecular Cloning: A Laboratory Manual", 1989, CSH PRESS, pages: 3 - 108
See also references of EP4056705A4
SHEN B ET AL.: "Generation of gene-modified mice via Cas9/RNA-mediated gene targeting", CELL RES, vol. 23, no. 5, May 2013 (2013-05-01), pages 720 - 3, XP055141533, DOI: 10.1038/cr.2013.46
SONG M.: "The CRISPR/Cas9 system: Their delivery, in vivo and ex vivo applications and clinical development by startups", BIOTECHNOL PROG, vol. 33, no. 4, July 2017 (2017-07-01), pages 1035 - 1045
WENINGER ASTRID ET AL.: "Combinatorial optimization of CRISPR/Cas9 expression enables precision genome engineering in the methylotrophic yeast Pichia pastoris", JOURNAL OF BIOTECHNOLOGY, vol. 235, 2016, pages 139 - 149, XP029733267, DOI: 10.1016/j.jbiotec. 2016.03.02 7 *

Also Published As

Publication number Publication date
JP2023501524A (ja) 2023-01-18
CA3157898A1 (en) 2021-05-20
KR20220145324A (ko) 2022-10-28
BR112022009148A2 (pt) 2023-05-02
CL2022001220A1 (es) 2023-01-06
CN115397995A (zh) 2022-11-25
PE20230035A1 (es) 2023-01-10
RU2724470C1 (ru) 2020-06-23
EP4056705A1 (en) 2022-09-14
CO2022006156A2 (es) 2023-01-26
ZA202205208B (en) 2023-04-26
MX2022005685A (es) 2022-07-27
AU2020384851A1 (en) 2022-12-01
EP4056705A4 (en) 2023-12-27
US20220403369A1 (en) 2022-12-22
MA57032A1 (fr) 2023-01-31

Similar Documents

Publication Publication Date Title
JP7460178B2 (ja) CRISPR-Cas12j酵素およびシステム
RU2713328C2 (ru) Гибридные днк/рнк-полинуклеотиды crispr и способы применения
KR20190082318A (ko) Crispr/cpf1 시스템 및 방법
US20220290187A1 (en) Class ii, type v crispr systems
TW202134439A (zh) Rna導引之核酸酶及其活性片段與變體以及使用方法
WO2021096391A1 (ru) Применение cas9 бежа из бактерии pasteurella pneumotropica
RU2722934C1 (ru) Средство разрезания днк на основе cas9 белка из бактерии pasteurella pneumotropica
RU2788197C1 (ru) Средство разрезания ДНК на основе Cas9 белка из бактерии Streptococcus uberis NCTC3858
RU2722933C1 (ru) Средство разрезания днк на основе cas9 белка из бактерии demequina sediminicola
RU2778156C1 (ru) Средство разрезания ДНК на основе Cas9 белка из бактерии Capnocytophaga ochracea
RU2771626C1 (ru) Средство разрезания двунитевой ДНК с помощью Cas12d белка из Katanobacteria и гибридной РНК, полученной путем слияния направляющей CRISPR РНК и scout РНК
RU2791447C1 (ru) Средство разрезания ДНК на основе ScCas12a белка из бактерии Sedimentisphaera cyanobacteriorum
EA041935B1 (ru) СРЕДСТВО РАЗРЕЗАНИЯ ДНК НА ОСНОВЕ Cas9 БЕЛКА ИЗ БАКТЕРИИ Pasteurella Pneumotropica
RU2712492C1 (ru) Средство разрезания днк на основе cas9 белка из defluviimonas sp.
EA044419B1 (ru) Применение cas9 белка из бактерии pasteurella pneumotropica
OA20812A (en) Use of CAS9 protein from the bacterium pasteurella pneumotropica.
RU2804422C1 (ru) Система редактирования геномной днк эукариотической клетки на основе нуклеотидной последовательности, кодирующей белок sucas9nls
KR102497690B1 (ko) 신규한 crispr 연관 단백질 및 이의 용도
OA20443A (en) DNA-cutting agent based on CAS9 protein from the bacterium pasteurella pneumotropica
RU2712497C1 (ru) Средство разрезания ДНК на основе Cas9 белка из биотехнологически значимой бактерии Clostridium cellulolyticum
EA041933B1 (ru) Средство разрезания днк
OA20197A (en) DNA-cutting agent.
EA042517B1 (ru) Средство разрезания днк

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20887900

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 3157898

Country of ref document: CA

ENP Entry into the national phase

Ref document number: 2022527121

Country of ref document: JP

Kind code of ref document: A

ENP Entry into the national phase

Ref document number: 2020887900

Country of ref document: EP

Effective date: 20220511

REG Reference to national code

Ref country code: BR

Ref legal event code: B01A

Ref document number: 112022009148

Country of ref document: BR

NENP Non-entry into the national phase

Ref country code: DE

REG Reference to national code

Ref country code: BR

Ref legal event code: B01E

Ref document number: 112022009148

Country of ref document: BR

Free format text: COM BASE NA RESOLUCAO 405/2020, SOLICITA-SE QUE SEJA APRESENTADO, EM ATE 60 (SESSENTA) DIAS, NOVO CONTEUDO DE LISTAGEM DE SEQUENCIA NOS MOLDES DA PORTARIA 405 DE 21/12/2020, POIS O CONTEUDO DA LISTAGEM APRESENTADA NA PETICAO NO 870220040874 DE 11/05/2022 POSSUI O CAMPO 110 DIVERGENTE DO PEDIDO EM QUESTAO.

REG Reference to national code

Ref country code: BR

Ref legal event code: B01E

Ref document number: 112022009148

Country of ref document: BR

Free format text: EM ADITAMENTO A EXIGENCIA PUBLICADA NA RPI 2690 DE 26/07/2022, A RESPOSTA DE EXIGENCIA DEVE CONTER OS CAMPOS 140 / 141 , QUE SAO DISPENSADOS DE PREENCHIMENTO QUANDO A LISTAGEM DE SEQUENCIA E APRESENTADA JUNTAMENTE A PETICAO INICIAL, POREM DEVEM SER PREENCHIDOS EM PETICOES POSTERIORES QUANDO JA E DE CONHECIMENTO O NUMERO DO PEDIDO.

ENP Entry into the national phase

Ref document number: 2020384851

Country of ref document: AU

Date of ref document: 20200702

Kind code of ref document: A

REG Reference to national code

Ref country code: BR

Ref legal event code: B01E

Ref document number: 112022009148

Country of ref document: BR

Free format text: EM ADITAMENTO AS EXIGENCIAS PUBLICADAS NAS RPIS 2690 E 2693, SOLICITA-SE QUE SEJA APRESENTADO, EM ATE 60 (SESSENTA) DIAS, NOVO CONTEUDO DE LISTAGEM DE SEQUENCIA NOS MOLDES DA PORTARIA 405 DE 21/12/2020, COM O CAMPO 120 PREENCHIDO COM O TITULO CORRETO DA INVENCAO PARA A FASE NACIONAL.OBS: EM VISTA DE ITEM NAO TER SIDO APONTADO NAS EXIGENCIAS ANTERIORES, ESSA PODERA SER RESPONDIDA POR MEIO DA PETICAO 260, SEM CUSTO PARA O REQUERENTE.

REG Reference to national code

Ref country code: BR

Ref legal event code: ERR

Ref document number: 112022009148

Country of ref document: BR

Free format text: ANULADA A PUBLICACAO CODIGO 1.5 NA RPI NO 2718 DE 07/02/2023 POR APRESENTAR ERRO NO CONTEUDO DO DESPACHO.

REG Reference to national code

Ref country code: BR

Ref legal event code: B01E

Ref document number: 112022009148

Country of ref document: BR

Free format text: EM ADITAMENTO AS EXIGENCIAS PUBLICADAS NAS RPIS 2690 E 2693, SOLICITA-SE QUE SEJA APRESENTADO, EM ATE 60 (SESSENTA) DIAS, NOVO CONTEUDO DE LISTAGEM DE SEQUENCIA NOS MOLDES DA PORTARIA 405 DE 21/12/2020, COM O CAMPO 120 PREENCHIDO COM O TITULO CORRETO DA INVENCAO PARA A FASE NACIONAL.OBS: EM VISTA DE ITEM NAO TER SIDO APONTADO NAS EXIGENCIAS ANTERIORES, ESSA PODERA SER RESPONDIDA POR MEIO DA PETICAO 206, SEM CUSTO PARA O REQUERENTE.

ENP Entry into the national phase

Ref document number: 112022009148

Country of ref document: BR

Kind code of ref document: A2

Effective date: 20220511