WO2020111983A2 - Средство разрезания днк на основе cas9 белка из биотехнологически значимой бактерии clostridium cellulolyticum - Google Patents

Средство разрезания днк на основе cas9 белка из биотехнологически значимой бактерии clostridium cellulolyticum Download PDF

Info

Publication number
WO2020111983A2
WO2020111983A2 PCT/RU2019/050229 RU2019050229W WO2020111983A2 WO 2020111983 A2 WO2020111983 A2 WO 2020111983A2 RU 2019050229 W RU2019050229 W RU 2019050229W WO 2020111983 A2 WO2020111983 A2 WO 2020111983A2
Authority
WO
WIPO (PCT)
Prior art keywords
sequence
dna
protein
amino acid
cccas9
Prior art date
Application number
PCT/RU2019/050229
Other languages
English (en)
French (fr)
Other versions
WO2020111983A3 (ru
Inventor
Константин Викторович СЕВЕРИНОВ
Сергей Анатольевич ШМАКОВ
Дарья Николаевна АРТАМОНОВА
Игнатий Игоревич ГОРЯНИН
Ольга Сергеевна МУШАРОВА
Юлия Валерьевна ПИСКУНОВА
Яна Витальевна ФЁДОРОВА
Татьяна Игоревна ЗЮБКО
Михаил Алексеевич ХОДОРКОВСКИЙ
Георгий Евгеньевич ПОБЕГАЛОВ
Анатолий Николаевич АРСЕНИЕВ
Полина Анатольевна СЕЛЬКОВА
Александра Андреевна ВАСИЛЬЕВА
Татьяна Олеговна АРТАМОНОВА
Марина Викторовна АБРАМОВА
Original Assignee
Автономная некоммерческая образовательная организация высшего образования Сколковский институт науки и технологий
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to EP19888557.6A priority Critical patent/EP3889269A4/en
Priority to MA53577A priority patent/MA53577B1/fr
Priority to CA3121088A priority patent/CA3121088A1/en
Priority to US17/296,597 priority patent/US20220002692A1/en
Priority to KR1020217019947A priority patent/KR20210118069A/ko
Priority to EA202191504A priority patent/EA202191504A1/ru
Priority to BR112021010185A priority patent/BR112021010185A2/pt
Priority to MX2021006119A priority patent/MX2021006119A/es
Application filed by Автономная некоммерческая образовательная организация высшего образования Сколковский институт науки и технологий filed Critical Автономная некоммерческая образовательная организация высшего образования Сколковский институт науки и технологий
Priority to JP2021529802A priority patent/JP2022513642A/ja
Priority to PE2021000760A priority patent/PE20212079A1/es
Priority to AU2019388420A priority patent/AU2019388420A1/en
Priority to CN201980090346.6A priority patent/CN113785055A/zh
Publication of WO2020111983A2 publication Critical patent/WO2020111983A2/ru
Publication of WO2020111983A3 publication Critical patent/WO2020111983A3/ru
Priority to PH12021551198A priority patent/PH12021551198A1/en
Priority to CONC2021/0006938A priority patent/CO2021006938A2/es
Priority to ZA2021/03578A priority patent/ZA202103578B/en

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/111General methods applicable to biologically active non-coding nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites

Definitions

  • the invention relates to the field of molecular biology and microbiology, in particular, describes new bacterial nucleases of the CRISPR-Cas system.
  • the invention can be used as a tool for strictly specific DNA modification in various organisms.
  • Changing the DNA sequence is one of the urgent tasks of biotechnology today. Editing and modifying the genomes of eukaryotic and prokaryotic organisms, as well as manipulating DNA in vitro, require the introduction of double-strand breaks in the DNA sequence.
  • the following methods are currently used: artificial nuclease systems containing zinc finger domains, TALEN systems, and bacterial CRISPR-Cas systems.
  • the first two methods require the laborious optimization of the nuclease amino acid sequence to recognize a specific DNA sequence.
  • the structures recognizing the target DNA are not proteins, but short RNA guides.
  • Cutting a specific target DNA does not require the synthesis of a nuclease or its de novo gene, but is achieved through the use of RNA guides complementary to the target sequence.
  • the technique allows for simultaneous DNA cutting in several regions using guiding RNAs of different sequences. This approach is also used to simultaneously change several genes in eukaryotic organisms.
  • CRISPR-Cas systems are prokaryotic immune systems capable of introducing highly specific breaks into the genetic material of viruses (Mojica FJ M. et al. Intervening sequences of regularly spaced prokaryotic repeats derive from foreign genetic elements // Journal of molecular evolution - 2005. - T. 60. - Ns. 2. - C. 174-182).
  • the acronym CRISPR-Cas stands for “Clustered Regularly Interspaced Short Palindromic Repeats and CRISPR associated genes” (Jansen R. et al. Identification of genes that are associated with DNA repeats in prokaryotes // Molecular microbiology. - 2002. - T. 43. - Ns. 6. - C.
  • CRISPR-Cas systems consist of CRISPR cassettes and genes encoding various Cas proteins (Jansen R. et al., Molecular microbiology. - 2002. - T. 43. - Ns. 6. - P. 1565-1575).
  • CRISPR cassettes consist of spacer sequences, each of which has a unique nucleotide sequence, and repeating palindromic repeats (Jansen R. et al., Molecular microbiology. - 2002. - T. 43 - Ns. 6. - P. 1565-1575) .
  • CRISPR-Cas systems represented by a single effector protein, are divided into six different types (from I to VI) depending on the Cas proteins that make up the systems.
  • the CRISPR-Cas9 system of type II is distinguished by the simplicity of the composition and mechanism of operation: for its functioning, the formation of an effector complex consisting of only one Cas9 protein and two short RNAs: crRNA (crRNA) and tracer RNA (tracrRNA) is necessary.
  • crRNA crRNA
  • tracerRNA tracer RNA
  • Tracer RNA mates complementary to the cRRNA region derived from the CRISPR repeat, forming the secondary structure necessary for binding of the RNA guides to the Cas effector.
  • the Cas9 effector protein is an RNA-dependent DNA endonuclease with two nuclease domains (HNH and RuvC) that breaks the complementary strands of the target DNA, thereby forming a double-stranded DNA break (Deltcheva E. et al. CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III // Nature. - 201 1. - T. 471. - Ns. 7340. - C. 602).
  • HNH and RuvC RNA-dependent DNA endonuclease with two nuclease domains
  • CRISPR-Cas systems One of the main characteristics limiting the use of CRISPR-Cas systems is the PAM sequence, which flans the target DNA from the 3'-end, the presence of which is necessary for the correct recognition of Cas9 DNA by nuclease.
  • Different CRISPR-Cas proteins have different PAM sequences that limit the ability of nucleases to be used on any DNA site.
  • the use of CRISPR-Cas proteins with various new PAM sequences is necessary to ensure the possibility of changing any DNA region, both in vitro and in the genome of living organisms. Changing eukaryotic genomes also requires the use of small nucleases to ensure the delivery of CRISPR-Cas systems to cells via AAV viruses.
  • the basis of the invention is the CRSIRP Cas system found in the bacteria Clostridium cellulolyticum.
  • Anaerobic bacteria Clostridium cellulolyticum (C. cellulolyticum) are able to hydrolyze lignocellulose without adding commercial cellulases to form lactate, acetate and butanol as final products (Desvaux M. Clostridium cellulolyticum: model organism of mesophilic cellulolytic Clostridia. FEMS Microbi 29; 2005 Sep 29 Microbiol. (4): 741 -64). This ability of these microorganisms makes them promising candidates for the role of biofuel producers.
  • the use of bacteria-producers such as C.
  • cellulolyticum in biotechnological industries will help to organize the cycle of processing of raw materials more efficiently, increase efficiency and, ultimately, reduce the load on all components of the biosphere.
  • Using genetic engineering methods it is possible to significantly improve the metabolic parameters of microorganisms, and shift the balance in the direction of producing more butanol instead of lactate and acetate. So, for example, for a double gene mutant lactate dehydrogenase and maltate dehydrogenase shows the absence of lactate formation and increased production of butanol (Li Y, et al., Combined inactivation of the Clostridium cellulolyticum lactate and malate dehydrogenase genes substantially increases ethanol yield from cellulose and switchgrass fermentations.
  • the invention can be used to modify the genome of Clostridium cellulolyticum, as well as the genomes of other living organisms.
  • the present invention is the creation of new tools for changing the sequence of genomic DNA of unicellular or multicellular organisms based on CRISPR-Cas9 systems.
  • Current systems are of limited use due to the specific PAM sequence that must be present at the 3'-end of the DNA site undergoing modification.
  • the search for new Cas9 enzymes with other PAM sequences will expand the arsenal of available tools for the formation of double-strand breaks in the necessary, strictly defined places in the DNA molecules of different organisms.
  • C. cellulolyticum CRISPR nuclease II type CcCas9 which can be used to introduce targeted changes in the genome of this and other organisms.
  • the essential features that distinguish the present invention are: (a) a short, two-letter, different from other known sequence of RAM; (b) the small size of the characterized CcCas9 protein is 1030 amino acid residues (aa), which is 23 a. about.
  • this problem is solved by using a protein containing the amino acid sequence of SEQ ID NO: 1, or containing the amino acid sequence, which is at least 95% identical to the amino acid sequence of SEQ ID NO: 1 and differs compared to SEQ ID NO: 1 only in non-conservative amino acid residues, for the formation of double-strand break in the DNA molecule located immediately before the nucleotide sequence 5'-NNNNGNA-3 'in the specified DNA molecule.
  • N should be understood any of the nucleotides (A, G, C, T).
  • this application is characterized in that the formation of a double-strand break in the DNA molecule occurs at a temperature of from 37 ° C to 65 ° C.
  • this use is characterized in that the double-strand break in the DNA molecule occurs at a temperature of from 37 ° C to 55 ° C.
  • a method of changing the genomic DNA sequence of a unicellular or multicellular organism including the introduction into an at least one cell of this organism of an effective amount of: a) either a protein containing the amino acid sequence of SEQ ID NO: 1, or a nucleic acid encoding a protein, containing the amino acid sequence of SEQ ID NO: 1, and b) or an RNA guide containing a sequence that forms a duplex with the nucleotide sequence of a portion of the genomic DNA of the body directly adjacent to the nucleotide sequence of 5'-NNNNGNA-3 ', and interacts with the specified protein after the formation of the duplex or a DNA sequence encoding said RNA guide; however, the interaction of the indicated protein with the RNA guide and the 5’-NNNNGNA-3 ’nucleotide sequence leads to the formation of a double-strand gap in the genomic DNA sequence directly adjacent to the 5’-NNNNGNA-3’ sequence.
  • RNA guide A mixture of cRRNA (crRNA) and tracer RNA (tracrRNA) capable of complexing with the target DNA region and CcCas9 protein can be used as the RNA guide.
  • a hybrid RNA constructed on the basis of cRRNA and tracer RNA can be used as a guide RNA.
  • Methods for constructing a hybrid RNA guide are known to those skilled in the art (Hsu PD, et al., DNA targeting specificity of RNA-guided Cas9 nucleases. Nat Biotechnol. 2013 Sep; 31 (9): 827-32).
  • the invention can be used both for cutting the target DNA in vitro, and for modifying the genome of any living organism. Modification of the genome can be carried out in a direct way - by cutting the genome in the corresponding site, as well as by inserting an exogenous DNA sequence due to homologous repair.
  • any portion of double-stranded or single-stranded DNA from the genome of an organism other than the organism used during introduction can be used, while this section (or a mixture of sections) is intended for integration into the double-stranded gap in the target DNA formed by the action of CcCas9 nuclease.
  • a double-stranded DNA region from the body’s genome used when introducing CcCas9 protein, but modified by mutations (nucleotide substitution), as well as insertions or deletions of one or more nucleotides, can be used as an exogenous DNA sequence.
  • the technical result of the present invention is to increase the versatility of the available CRISPR-Cas9 systems, allowing the use of Cas9 nuclease to cut genomic or plasmid DNA in more specific places and at large temperature ranges.
  • FIG. 1 Scheme of CRISPR loci in Clostridium celluloliticum
  • FIG. 2. Determination of PAM in vitro methods. System development
  • FIG. 3. Checking the significance of individual positions of RAM.
  • FIG. 4. Verification of protein activity in cutting various DNA
  • FIG. 5 In vitro reactions of DNA cutting of the human gene fragment grin2b
  • FIG. 6 The study of the temperature range of activity of CcCas9.
  • FIG. 7 Scheme of interaction of the RNA guide with the site of the target DNA
  • FIG. 8 Sequence alignment of Cas9 proteins from organisms Staphylococcus aureus (SaCas9), Campylobacter jejuni (CjCas9) and CcCas9.
  • Non-conservative sequences of sequences are underlined below.
  • the term “percent homology of two sequences” is equivalent to the term “percent identity of two sequences”.
  • the identity of the sequences is determined based on the reference sequence. Algorithms for sequence analysis are known in the art, such as BLAST described in Altschul et al., J. Mol. Biol., 215, pp. 403-10 (1990).
  • BLAST described in Altschul et al., J. Mol. Biol., 215, pp. 403-10 (1990).
  • a comparison of nucleotide and amino acid sequences can be used using the Blast software package provided by the National Center for Biotechnology Information (http: //www.ncbi.nlm.nih .gov / blast) using breaks containing alignment with standard parameters.
  • the percentage of identity of two sequences is determined by the number of positions of identical amino acids in these two sequences, taking into account the number of spaces and the length of each space that must be entered for optimal comparison of the two sequences by alignment.
  • the percentage of identity is equal to the number of identical amino acids in these positions, taking into account sequence alignment, divided by the total number of positions and multiplied by 100.
  • double-stranded break immediately prior to the PAM nucleotide sequence means that a double-strand break in the target DNA sequence will occur between 0 and 25 nucleotides in front of the PAM nucleotide sequence.
  • a protein containing a specific amino acid sequence is meant a protein having an amino acid sequence made up of a specified amino acid sequence and possibly other sequences connected by peptide bonds to the specified amino acid sequence.
  • An example of other sequences may be a nuclear localization signal (NLS) sequence, or other sequences providing enhanced functionality for a specified amino acid sequence.
  • NLS nuclear localization signal
  • Exogenous DNA sequence By an exogenous DNA sequence introduced simultaneously with an RNA guide, one should understand a DNA sequence prepared specifically for the specific modification of double-stranded target DNA at the site of the break determined by the specificity of the RNA guide. Such a modification may, for example, be the insertion or deletion of certain nucleotides at the site of breakage of the target DNA.
  • Exogenous DNA can serve as a portion of DNA from another organism, or a portion of DNA from the same organism as the target DNA.
  • an effective amount of protein and RNA introduced into a cell should be understood to mean such an amount of protein and RNA that, when it enters the specified cell, it will be able to form a functional complex, that is, a complex that will specifically bind to the target DNA and produce a double-stranded break in it at the place determined guide RNA and PAM sequence on DNA.
  • the effectiveness of this process can be assessed by analyzing the target DNA isolated from the indicated cell using standard methods known to those skilled in the art.
  • RNA and RNA to the cell can be carried out in various ways.
  • a protein can be delivered in the form of a DNA plasmid that encodes a gene for this protein as mRNA to translate this protein into the cytoplasm of a cell, or as a ribonucleoprotein complex, including this protein and RNA directing. Delivery can be carried out by various methods known to those skilled in the art.
  • the nucleic acid encoding the components of the system can be introduced into the cell directly or indirectly: by transfection or transformation of cells by methods known to those skilled in the art, by using a recombinant virus, by manipulating the cell, such as microinjection of DNA, etc.
  • a ribonucleic complex consisting of nuclease and directing RNA and exogenous DNA (if necessary) can be accomplished by transfecting the complexes into the cell or by mechanically introducing the complex into the cell, for example, microinjection.
  • a nucleic acid molecule encoding a protein that must be introduced into a cell can be integrated into the chromosome or can be extrachromosomally replicating DNA.
  • a protein having a sequence that is at least 95% identical to the amino acid sequence of SEQ ID NO: 1 and which is further modified at one or both ends by adding one or more nuclear localization signals For example, a nuclear localization signal from the SV40 virus can be used.
  • a nuclear localization signal can be separated from the main protein sequence by a spacer sequence, for example as described in Shen B, et al. "Generation of gene-modified mice via Cas9 / RNA- mediated gene targeting ", Cell Res. 2013 May; 23 (5): 720-3.
  • another nuclear localization signal, or an alternative method for delivering the protein to the cell nucleus may be used.
  • the present invention encompasses the use of a protein from the organism of Clostridium cellulolyticum (C. cellulolyticum) homologous to the previously characterized Cas9 proteins for introducing double-stranded breaks in DNA molecules in strictly defined positions.
  • Clostridium cellulolyticum C. cellulolyticum
  • Genome-directed editing techniques such as recombination, group II intron retrotranspression, and allele exchange — have a number of significant limitations.
  • the procedure of recombination-dependent exchange of alleles is quite lengthy and has low efficiency (Heap J. T. et al. Integration of DNA info bacterial chromosomes from plasmids without a counter-selection marker // Nucleic acids research. - 2012. - T. 40 .- Ns. 8.- C. e59-e59).
  • the insertion of extended DNA fragments is difficult using existing tools for changing the genome, which require existing recombination sites and / or recombinases (Esveit K.M., Wang N.
  • CRISPR nucleases to introduce targeted changes in the genome has several advantages.
  • the specificity of the action of the system is determined by the cRRNA sequence, which allows one type of nuclease to be used for all target loci.
  • the technique allows you to deliver several directing RNAs complementary to different target genes into the cell at once, which allows for a one-time change of several genes at once.
  • the use of the native CRISPR-Cas9 system from the bacterium C. cellulolyticum will make the editing system of the genome of this organism easier and more efficient: the procedure will not require cells of foreign genes, their maintenance and expression. Instead, it is possible to develop a procedure for introducing guiding RNAs aimed at target genes into the bacterium: thanks to them, the host intracellular CRISPR-Cas9 system will be able to recognize the corresponding DNA targets of a biotechnologically significant bacterium and introduce double-strand breaks into them.
  • the CRISPR locus which encodes the main components of the system (genes of the CcCas9, cas1, cas2 proteins, as well as the CRISPR cassette and RNA guides), was cloned into the small copy bacterial vector pACYC184.
  • PAM protospacer adjusted motif
  • PAM is a strictly defined sequence of several nucleotides located in type II systems close to or several nucleotides from the 3’ end of the protospacer on a non-target chain. In the absence of PAM, hydrolysis of bonds in DNA with the formation of double-strand break does not occur. The need for the presence of the PAM sequence on the target increases the specificity of recognition, but at the same time imposes a limitation on the choice of target DNA regions into which a gap must be introduced.
  • RNA sequencing of E. coli DH5alpha bacteria carrying the pACYC184_CcCas9 construct was performed. Sequencing showed that the CRISPR cassette of the system is actively transcribed, as well as tracer RNA (Fig. 1). Sequence analysis of crRNA and tracrRNA suggested a possible formation of secondary structures recognized by CcCas9 nuclease.
  • the authors determined the PAM sequence of the CcCas9 protein using bacterial PAM screening.
  • E. coli DH5alpha cells carrying the pACYC184_CcCas9 plasmid were transformed a library of plasmids containing the sequence of the spacer 5'-
  • CRISPR of the CcCas9 system cassette flanked by a randomized seven-letter sequence with a 5’ or 3 ’end. Plasmids carrying the sequence corresponding to the PAM sequence of the CcCas9 system were degraded by the functioning CRISPR-Cas system, while the remaining plasmids of the library were effectively transformed into cells, giving them antibiotic resistance to ampicillin. After transformation and incubation of the cells on antibiotic plates, the colonies were washed off the surface of the agar and DNA was extracted from them using the Qiagen Plasmid Purification Midi kit.
  • RNA guides and nucpease in recombinant form RNA sequencing of the RNA guide sequence allowed the synthesis of crRNA and tracrRNA molecules in vitro. The synthesis was carried out using the NEB HiScribe T7 RNA synthesis kit.
  • the double-stranded DNA libraries were 374 bp fragments containing a protospacer sequence flanked by randomized seven nucleotides (5 ’NNNNN 3’) from the 3 ’end:
  • the crRNA sequence complementary to the protospacer (target DNA sequence) is shown in bold.
  • affinity chromatography NiNTA
  • the total reaction volume is 20 ⁇ l.
  • reaction products were applied to a 1.5% agarose gel and subjected to electrophoresis.
  • Non-cut DNA fragments 374 bp long extracted from the gel and prepared for highly efficient sequencing using the NEB NextUltra II kit.
  • Samples were sequenced on the lllumina platform and sequence analysis was carried out using bioformatics methods: the difference in the nucleotide representation at individual PAM positions (NNNNNNN) was determined in comparison with the control sample (Fig. 3).
  • the incubation time is 30 minutes, the reaction temperature is 45 ° C.
  • Example 1 Testing the activity of CcCas9 protein in cutting various target DNAs.
  • CcCas9 in combination with RNA guides is capable of recognizing various target DNAs containing the PAM sequence NNNNGNA (Fig. 5).
  • CcCas9 is tolerant of substitutions at the 7th position of the PAM sequence.
  • Example 2 The temperature range of activity of CcCas9.
  • the target DNA flanked by the PAG GAGAGTA sequence was subjected to cutting with the CcCas9 effector complex with the corresponding RNA guides at different temperatures (Fig. 6).
  • CcCas9 protein has a wide temperature range.
  • the maximum nuclease activity is achieved at a temperature of 45 ° C, while the protein is quite active in the range from 37 ° C to 55 ° C.
  • CcCas9 in combination with RNA guides is a new cutting tool (double-stranded breaks) in the DNA molecule, limited by the sequence 5’-NNNNGNA-3 ’, with a temperature range from 37 ° C to 55 ° C.
  • FIG. 7 A diagram of a complex of targeted DNA with cRRNA (crRNA) and tracer RNA (tracrRNA), together forming an RNA guide, is shown in FIG. 7.
  • Proteins Cas9 from closely related organisms related to Clostridium are Proteins Cas9 from closely related organisms related to Clostridium.
  • the Cas9 protein from this bacterium, Clostridium perfringens is 36% identical to CcCas9 protein (the degree of identity was calculated using the BLASTp program, default parameters).
  • a comparable Cas9 protein from Staphylococcus aureus is 28% identical to CcCas9 (BLASTp, default parameters).
  • the CcCas9 protein differs significantly in amino acid sequence from other Cas9 proteins studied to date, including proteins found in related organisms.
  • non-conservative amino acid residues can be changed that do not affect the residues that determine the functionality of the protein (determining its function or structure). Examples of such changes are the replacement of non-conservative amino acid residues with homologous ones.
  • a protein containing an amino acid sequence that is at least 95% identical to the amino acid sequence of SEQ ID NO: 1 and differs from SEQ ID NO: 1 only in non-conservative amino acid residues to form double-stranded a gap in the DNA molecule located immediately before the nucleotide sequence of 5'-NNNNGNA-3 'in the specified DNA molecule.
  • Homologous proteins can be obtained by mutagenesis (e.g., site-directed or PCR-mediated mutagenesis) of the corresponding nucleic acid molecules, followed by testing the encoded modified Cas9 protein to maintain its functions in accordance with the functional assays described here.
  • Example 4 The CcCas9 system described in the present invention in combination with RNA directors can be used to change the sequence of the genomic DNA of a multicellular organism, including a eukaryotic one.
  • RNA directors can be used to change the sequence of the genomic DNA of a multicellular organism, including a eukaryotic one.
  • various approaches known to those skilled in the art can be applied.
  • methods for delivering CRISPR-Cas9 systems to cells of organisms are disclosed in sources (Liu C et al., Delivery strategies of the CRISPR-Cas9 gene-editing system for therapeutic applications. J Control Release. 2017 Nov 28; 266: 17-26; Lino CA et al., Delivering CRISPR: a review of the challenges and approaches. Drug Deliv. 2018 Nov; 25 (1): 1234-1257), and in the sources disclosed within these sources.
  • CcCas9 nuclease For efficient expression of CcCas9 nuclease in eukaryotic cells, it will be desirable to optimize the codons for the amino acid sequence of the CcCas9 protein by methods known to those skilled in the art (e.g., IDT codon optimization tool).
  • a nuclear localization signal from the virus T antigen can be used.
  • SV40 (Lanford et al., Cell, 1986, 46: 575-582) linked to the CcCas9 sequence using the spacer sequence described in Shen B, et al. "Generation of gene-modified mice via Cas9 / RNA-mediated gene targeting", Cell Res. 2013 May; 23 (5): 720-3 or without.
  • CcCas9 NLS MAPKKKRKVGIHGVPAA-CcCas9-KRPAATKKAGQAKKKK
  • At least two approaches can be used to deliver a protein with the above amino acid sequence.
  • Gene delivery is by creating a plasmid carrying the CcCas9 NLS gene under the regulation of the promoter (e.g., CMV promoter) and a sequence encoding RNA guides under the regulation of the U6 promoter.
  • the DNA sequences used are DNA sequences flanked by 5’-NNNNGNA-3 ’, for example, the sequences of the human grin2b gene:
  • cRRNA expression cassette is as follows:
  • the cassette for the expression of tracer RNA is as follows:
  • the sequence of the U6 promoter is highlighted in bold, followed by the sequence encoding tracer RNA.
  • Plasmid DNA is purified and transfected into HEK293 human cells using Lipofectamine2000 reagent (Thermo Fisher Scientific). Cells are incubated for 72 hours, after which genomic DNA is isolated from them using genomic DNA purification columns (Thermo Fisher Scientific). Target The DNA site is analyzed by sequencing on the lllumina platform to determine the number of insertions-deletions in DNA occurring in the target site due to the directed double-strand break and its subsequent repair.
  • primers are used that flank the putative cleavage site, for example, for the above grin2b gene sites:
  • samples are prepared using the Ultra II DNA Library Prep Kit for lllumina (NEB) reagent protocol to prepare samples for high throughput sequencing. This is followed by sequencing on the lllumina 300cycles platform, direct reading. Sequencing results are analyzed by bioinformatics methods. An insertion or deletion of several nucleotides in the target DNA sequence is taken as a cut detection.
  • NEB Ultra II DNA Library Prep Kit for lllumina
  • Recombinant protein is obtained from bacterial producer cells by purification using affinity chromatography (NiNTA, Qiagen) by size separation (Superdex 200).
  • the protein is mixed with RNA in a ratio of 1: 2: 2 (CcCas9 NLS: crRNA
  • tracrRNA incubated for 10 minutes at room temperature, then the mixture was transfected into cells.
  • the CcCas9 nuclease described in the present invention from the bacterium Clostridium cellulolyticum has several advantages over the previously characterized Cas9 proteins.
  • CcCas9 has a short, two-letter, distinct from other known PAM Cas nuclease, necessary for the functioning of the system.
  • the authors showed that for CcCas9 a short PAM GNA located 4 nucleotides from the protospacer is sufficient.
  • G at the +5 position is strict, while the +7 position is less significant, and in vitro hydrolysis was detected not only in the presence of A or T, but also in the presence of C at the +7 position, albeit with a slightly lower efficiency.
  • Cas nucleases capable of introducing double-stranded DNA breaks have complex multi-letter RAMs. sequences that limit the choice of sequences suitable for cutting.
  • Cas nucleases studied that recognize short PAM only CcCas9 can recognize sequences limited to GNA nucleotides.
  • CcCas9 has a small protein size (1030 aa, which is 23 aa less than the size of SaCas9). To date, this is the only studied small protein that has a two-letter PAM sequence.
  • the third advantage of the CcCas9 system is its wide operating temperature range: nuclease is active at temperatures from 37 ° C to 65 ° C with an optimum of 45 ° C.

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medicinal Chemistry (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Cell Biology (AREA)
  • Mycology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

Настоящее изобретение описывает новую бактериальную нуклеазу системы CRISPR-Cas9 из бактерии Clostridium celluloliticum, а также ее применение для образования строго специфичных двунитевых разрывов в молекуле ДНК. Данная нуклеаза обладает необычными свойствами и может быть использована в качестве инструмента для внесения изменений в строго определенных местах в последовательности геномной ДНК одноклеточных или многоклеточных организмов. Таким образом, достигается повышение универсальности доступных систем CRISPR-Cas9, что позволит использовать нуклеазы Cas9 из различных организмов для разрезания геномной или плазмидной ДНК в большем количестве специфических мест и при больших диапазонах температур. Также, достигается упрощение редактирования генома биотехнологически значимой бактерии Clostridium celluloliticum.

Description

Средство разрезания ДНК на основе Cas9 белка из
биотехнологически значимой бактерии Clostridium cellulolyticum
Область техники
Изобретение относится к области молекулярной биологии и микробиологии, в частности, описывает новые бактериальные нуклеазы системы CRISPR-Cas. Изобретение может быть использовано в качестве инструмента для строго специфической модификации ДНК в различных организмах.
Уровень техники
Изменение последовательности ДНК - одна из актуальных задач биотехнологии на сегодняшний день. Редактирование и изменение геномов эукариотических и прокариотических организмов, а также манипуляции с ДНК in vitro, требуют направленного внесения двунитевых разрывов в последовательности ДНК. Для решения этой задачи в настоящее время используют следующие методики: искусственные нуклеазные системы, содержащей домены типа «цинковые пальцы», TALEN-системы и бактериальные CRISPR-Cas системы. Первые два метода требуют трудозатратой оптимизации аминокислотной последовательности нуклеазы для узнавания конкретной последовательности ДНК. В отличие от них в случае CRISPR-Cas систем структурами, узнающими ДНК мишень, являются не белки, а короткие направляющие РНК. Разрезание конкретной ДНК мишени не требует синтеза нуклеазы или ее гена de novo, а обеспечивается за счет использования направляющих РНК, комплементарных целевой последовательности. Это делает CRISPR-Cas системы удобными и эффективными инструментами разрезания различных ДНК-последовательностей. Методика позволяет осуществлять единовременное разрезание ДНК в нескольких участках при использовании направляющих РНК разной последовательностей. Такой подход используется в том числе для одновременного изменения нескольких генов в эукариотических организмах.
По своей природе CRISPR-Cas системы являются иммунными системами прокариот, способными высоко специфично вносить разрывы в генетический материал вирусов (Mojica F. J. М. et al. Intervening sequences of regularly spaced prokaryotic repeats derive from foreign genetic elements //Journal of molecular evolution - 2005. - T. 60. - Ns. 2. - C. 174-182). Аббревиатура CRISPR-Cas расшифровывается как“Clustered Regularly Interspaced Short Palindromic Repeats and CRISPR associated genes” (Jansen R. et al. Identification of genes that are associated with DNA repeats in prokaryotes //Molecular microbiology. - 2002. - T. 43. - Ns. 6. - C. 1565-1575), что переводе с английского обозначает “короткие палиндромные повторы, регулярно расположенные группами, и ассоциированные с ними гены”. Все CRISPR-Cas системы состоят из CRISPR кассет и генов, кодирующих различные Cas белки (Jansen R. et al. , Molecular microbiology. - 2002. - T. 43. - Ns. 6. - С. 1565-1575). CRISPR кассеты состоят из последовательностей-спейсеров, каждый из которых имеет уникальную нуклеотидную последовательность, и повторяющихся палиндромных повторов (Jansen R. et al. , Molecular microbiology. - 2002. - T. 43 - Ns. 6. - С. 1565-1575). В результате транскрипции CRISPR кассет и их последующего процессинга образуются направляющие крРНК, которые вместе с Cas белками формируют эффекторный комплекс (Brouns S. J. J. et al. Small CRISPR RNAs guide antiviral defense in prokaryotes //Science. - 2008. - T. 321 . - Ns. 5891 . - C. 960-964). За счет комплементарного спаривания крРНК с целевым участком ДНК, именуемым протоспейсером, Cas-нуклеаза узнает ДНК-мишень и высоко специфично вносит в нее разрыв.
CRISPR-Cas системы, представленными одиночным белком-эффектором, разделяют на шесть различных типов (от I до VI) в зависимости от Cas белков, входящих в состав систем. Система CRISPR-Cas9 II типа отличается простотой состава и механизма работы: для ее функционирования необходимо формирование эффекторного комплекса, состоящего лишь из одного белка Cas9 и двух коротких РНК: крРНК (crRNA) и трейсерной РНК (tracrRNA). Трейсерная РНК комплементарно спаривается с участком крРНК, происходящим из CRISPR повтора, образуя вторичную структуру, необходимую для связывания направляющих РНК с Cas эффектором. Эффекторный белок Cas9 является РНК- зависимой ДНК эндонуклеазой с двумя нуклеазными доменами (HNH и RuvC), вносящими разрывы в комплементарные нити целевой ДНК, таким образом образуя двунитевой разрыв ДНК (Deltcheva Е. et al. CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III //Nature. - 201 1 . - T. 471 . - Ns. 7340. - C. 602). На сегодняшний день известно несколько CRISPR-Cas нуклеаз, способных направлено и специфично вносить двунитевые разрывы в ДНК. Одной из основных характеристик, ограничивающих применение CRISPR-Cas систем является РАМ последовательность, фланирующая ДНК-мишень с З'-конца, наличие которой необходимо для правильного узнавания ДНК Cas9 нуклеазой. Различные CRISPR-Cas белки имеют разные РАМ последовательности, которые ограничивают возможности применения нуклеаз на любых участках ДНК. Использование CRISPR-Cas белков с новыми разнообразными РАМ последовательностями необходимо для обеспечения возможности изменения любого участка ДНК, как in vitro, так и в геноме живых организмов. Изменение эукариотических геномов также требует использования нуклеаз малого размера для обеспечения доставки CRISPR-Cas систем в клетки посредством AAV вирусов.
Несмотря на известность ряда способов разрезания ДНК и изменения последовательности геномной ДНК, на сегодняшний день сохраняется потребность в новых эффективных инструментах для модификации ДНК в различных организмах и в строго определенных местах последовательности ДНК. Данное изобретение обладает рядом свойств, необходимых для решения этой задачи.
Основой изобретения является CRSIRP Cas система, найденная в бактериях Clostridium cellulolyticum. Анаэробные бактерии Clostridium cellulolyticum (С. cellulolyticum) способны осуществлять гидролиз лигноцеллулозы без добавления коммерческих целлулаз с образованием в качестве конечных продуктов лактата, ацетата и бутанола (Desvaux М. Clostridium cellulolyticum: model organism of mesophilic cellulolytic Clostridia. FEMS Microbiol Rev. 2005 Sep;29(4):741 -64). Такая способность данных микроорганизмов делает их перспективными кандидатами на роль продуцентов биотоплива. Использование бактерий продуцентов таких как С. cellulolyticum в биотехнологических производствах поможет эффективнее организовать цикл переработки сырья, повысить эффективность и, в конечном итоге, приведет к снижению нагрузки на все компоненты биосферы. С помощью методов генетической инженерии возможно существенно улучшить метаболические показатели микроорганизмов, и сместить баланс в сторону наработки большего количества бутанола вместо лактата и ацетата. Так, например, для двойного мутанта по генам лактатдегирогеназы и мальтатдегидрогеназы показано отсутствие образования лактата и увеличенная продукция бутанола (Li Y, et al. , Combined inactivation of the Clostridium cellulolyticum lactate and malate dehydrogenase genes substantially increases ethanol yield from cellulose and switchgrass fermentations. Biotechnol Biofuels. 2012 Jan 4;5(1 ):2). До настоящего момента не удалось разработать эффективную процедуру получения штаммов С. cellulolyticum с мутациями в генах фосфотрансацетилазы и ацетаткиназы, что позволило бы снизить продукцию ацетата. Изобретение может использоваться для изменения генома Clostridium cellulolyticum, как и геномов других живых организмов.
Сущность изобретения
Задачей настоящего изобретения является создание новых инструментов для изменения последовательности геномной ДНК одноклеточных или многоклеточных организмов на основе систем CRISPR-Cas9. Существующие в настоящее время системы имеют ограниченное применение из-за специфичной последовательности РАМ, которая должна присутствовать на З'-конце участка ДНК, подвергающегося модификации. Поиск новых ферментов Cas9 с другими РАМ последовательностями позволит расширить арсенал имеющихся средств для образования двунитевого разрыва в необходимых, строго определенных местах в молекулах ДНК разных организмов.
Для решения этой задачи авторами была охарактеризована ранее предсказанная для С. cellulolyticum CRISPR нуклеаза II типа CcCas9, которая может быть применена для внесения направленных изменений в геном как этого, так и других организмов. Существенными признаками, отличающими настоящее изобретение, являются: (а) короткая, двухбуквенная, отличающаяся от других известных последовательность РАМ; (б) малый размер охарактеризованного белка CcCas9 - 1030 аминокислотных остатков (а. о.), что на 23 а. о. меньше, чем размер известного фермента Cas9 из Staphylococcus aureus (SaCas9); (в) широкий рабочий диапазон температур нуклеазы CcCas9, которая активна при температурах от 37 °С до 65 °С с оптимумом при 45 °С, что позволит использовать ее в организмах, имеющих различную температуру.
Указанная задача решается путем применения белка, содержащего аминокислотную последовательность SEQ ID NO: 1 , или содержащего аминокислотную последовательность, которая по меньшей мере на 95% идентична аминокислотной последовательности SEQ ID NO: 1 и имеет отличия по сравнению с SEQ ID NO: 1 только в неконсервативных аминокислотных остатках, для образования двунитевого разрыва в молекуле ДНК, расположенного непосредственно перед нуклеотидной последовательностью 5’- NNNNGNA-3’ в указанной молекуле ДНК. Под N следует понимать любой из нуклеотидов (A, G, С, Т). В некоторых вариантах изобретения данное применение характеризуется тем, что образование двунитевого разрыва в молекуле ДНК происходит при температуре от 37 °С до 65 °С. В предпочтительных вариантах изобретения данное применение характеризуется тем, что образование двунитевого разрыва в молекуле ДНК происходит при температуре от 37 °С до 55 °С.
Указанная задача также решается с помощью способа изменения последовательности геномной ДНК одноклеточного или многоклеточного организма, включающий введение в по меньшей мере одну клетку этого организма эффективного количества: а) либо белка, содержащего аминокислотную последовательность SEQ ID NO: 1 , либо нуклеиновой кислоты, кодирующей белок, содержащий аминокислотную последовательность SEQ ID NO: 1 , и б) либо направляющей РНК, содержащей последовательность, образующую дуплекс с нуклеотидной последовательностью участка геномной ДНК организма, непосредственно примыкающей к нуклеотидной последовательности 5’-NNNNGNA-3’, и взаимодействующей с указанным белком после образования дуплекса, либо последовательности ДНК, кодирующей указанную направляющую РНК; при этом взаимодействие указанного белка с направляющей РНК и нуклеотидной последовательностью 5’-NNNNGNA-3’ приводит к образованию двунитевого разрыва в последовательности геномной ДНК, непосредственно примыкающей к последовательности 5’-NNNNGNA-3’.
В качестве направляющей РНК может быть использована смесь из крРНК (crRNA) и трейсерной РНК (tracrRNA), способных образовать комплекс с участком таргетной ДНК и белком CcCas9. В предпочтительных вариантах изобретения в качестве направляющей РНК может быть использована гибридная РНК, сконструированная на основе крРНК и трейсерной РНК. Методы конструирования гибридной направляющей РНК известны специалистам (Hsu PD, et al., DNA targeting specificity of RNA-guided Cas9 nucleases. Nat Biotechnol. 2013 Sep;31 (9):827-32). Изобретение может быть использовано как для разрезания целевой ДНК in vitro, так и для модификации генома какого-либо живого организма. Модификация генома может проводиться прямым способом - разрезанием генома в соответствующем сайте, а также вставкой экзогенной последовательности ДНК за счет гомологичной репарации.
В качестве экзогенной последовательности ДНК может быть использован любой участок двунитевой или однонитевой ДНК из генома организма, отличного от организма, используемого при введении (или смесь таких участков между собой и с другими фрагментами ДНК), при этом этот участок (или смесь участков) предназначен для интеграции в место двуцепочечного разрыва в таргетной ДНК, образованного под действием нуклеазы CcCas9. В некоторых вариантах изобретения в качестве экзогенной последовательности ДНК может быть использован участок двуцепочечной ДНК из генома организма, используемого при введении белка CcCas9, но при этом измененный мутациями (заменой нуклеотидов), а также вставками или делециями одного или нескольких нуклеотидов.
Техническим результатом настоящего изобретения является повышение универсальности доступных систем CRISPR-Cas9, позволяющее использовать нуклеазу Cas9 для разрезания геномной или плазмид ной ДНК в большем количестве специфических мест и при больших диапазонах температур.
Краткое описание рисунков
Фиг. 1 . Схема CRISPR локусов в Clostridium celluloliticum
Фиг. 2. Определение РАМ in vitro методами. Разработка системы
порезки ДНК, ограниченной NNNNGNA последовательностью.
Фиг. 3. Проверка значимости отдельных позиций РАМ.
Фиг. 4. Проверка активности белка в разрезании различных ДНК
мишеней.
Фиг. 5. Реакции in vitro разрезания ДНК фрагмента гена человека grin2b
Фиг. 6. Исследование температурного диапазона активности CcCas9.
Фиг. 7. Схема взаимодействия направляющей РНК с участком целевой ДНК.
Фиг. 8. Выравнивание последовательностей белков Cas9 из организмов Staphylococcus aureus (SaCas9), Campylobacter jejuni (CjCas9) и CcCas9.
Подчеркнуты снизу неконсервативные участки последовательностей.
Подробное раскрытие изобретения
В описании данного изобретения термины «включает» и «включающий» интерпретируются как означающие «включает, помимо всего прочего». Указанные термины не предназначены для того, чтобы их истолковывали как «состоит только из». Если не определено отдельно, технические и научные термины в данной заявке имеют стандартные значения, общепринятые в научной и технической литературе.
Используемый здесь термин «процент гомологии двух последовательностей» эквивалентен термину «процент идентичности двух последовательностей». Идентичность последовательностей определяется на основании референсной последовательности. Алгоритмы для анализа последовательности известны в данной области, такие как BLAST, описанный в Altschul et al., J. Mol. Biol., 215, pp. 403-10 (1990). Для целей настоящего изобретения для определения уровня идентичности и сходства между нуклеотидными последовательностями и аминокислотными последовательностями может быть использовано сравнение нуклеотидных и аминокислотных последовательностей, производимое с помощью пакета программ Blast, предоставляемого National Center for Biotechnology Information (http://www.ncbi.nlm.nih.gov/blast) с использованием содержащего разрывы выравнивания со стандартными параметрами. Процент идентичности двух последовательностей определяется числом положений идентичных аминокислот в этих двух последовательностях с учетом числа пробелов и длины каждого пробела, которые необходимо ввести для оптимального сопоставления двух последовательностей путем выравнивания. Процент идентичности равен числу идентичных аминокислот в данных положениях с учетом выравнивания последовательностей, разделенному на общее число положений и умноженному на 100.
Термин "специфически гибрид изуется" относится к ассоциации между двумя одноцепочечными молекулами нуклеиновых кислот или в достаточной степени комплементарными последовательностями, что разрешает такую гибридизацию в предопределенных условиях, обычно использующихся в данной области.
Фраза "двунитевой разрыв, расположенный непосредственно перед нуклеотидной последовательностью РАМ" означает, что двунитевой разрыв в таргетной последовательности ДНК будет произведен на расстоянии от 0 до 25 нуклеотидов перед нуклеотидной последовательностью РАМ.
Под белком, содержащим определенную аминокислотную последовательность следует понимать белок, имеющий аминокислотную последовательность, составленную из указанной аминокислотной последовательности и, возможно, других последовательностей, соединённых пептидными связями с указанной аминокислотной последовательностью. Примером других последовательностей может служить последовательность сигнала ядерной локализации (NLS), или другие последовательности, обеспечивающие повышенную функциональность для указанной аминокислотной последовательности.
Под экзогенной последовательностью ДНК, вводимой одновременно с направляющей РНК, следует понимать последовательность ДНК, подготовленную специально для специфической модификации двуцепочечной целевой ДНК в месте разрыва, определяемого специфичностью направляющей РНК. Подобной модификацией может быть, например, вставка или делеция определенных нуклеотидов в месте разрыва целевой ДНК. Экзогенной ДНК может служить как участок ДНК из другого организма, так и участок ДНК из того же организма, что и целевая ДНК.
Под эффективным количеством вводимых в клетку белка и РНК следует понимать такое количество белка и РНК, которое при попадании в указанную клетку будет способно образовать функциональный комплекс, то есть комплекс, который будет специфически связываться с целевой ДНК и производить в ней двунитевой разрыв в месте, определяемом направляющей РНК и РАМ последовательностью на ДНК. Эффективность этого процесса может быть оценена при помощи анализа целевой ДНК, выделенной из указанной клетки с помощью стандартных методов, известных специалистам.
Доставка белка и РНК в клетку может быть осуществлена различными способами. Например, белок может быть доставлен в виде ДНК-плазмиды, которая кодирует ген этого белка, как мРНК для трансляции этого белка в цитоплазме клетки, или как рибонуклеопротеидный комплекс, включающий этот белок и направляющую РНК. Доставка может быть осуществлена различными методами, известными специалистам.
Нуклеиновая кислота, кодирующая компоненты системы, может быть введена в клетку, непосредственно или опосредованно: за счет трансфекции или трансформации клеток известными специалистам способами, за счет использования рекомбинатного вируса, за счет манипуляций с клеткой, таких как микроинъекция ДНК и т.п.
Доставка рибонуклеинового комплекса, состоящего из нуклеазы и направляющих РНК и экзогенной ДНК (при необходимости) может осуществляться путем трансфекции комплексов в клетку или за счет механического введения комплекса внутрь клетки, например, микроинъекции.
Молекула нуклеиновой кислоты, кодирующая белок, который необходимо ввести в клетку, может быть интегрирована в хромосому или может представлять собой внехромосомно реплицирующуюся ДНК. В некоторых вариантах для обеспечения эффективной экспрессии гена белка с вводимой в клетку ДНК необходимо изменить последовательность этой ДНК в соответствии с типом клетки в целях оптимизации кодонов при экспрессии, обусловленное неравномерностью частот встречаемости синонимичных кодонов в кодирующих областях генома различных организмов. Оптимизация кодонов необходима для увеличения экспрессии в клетках животных, растений, грибов или микроорганизмов.
Для функционирования белка, имеющего последовательность, которая по меньшей мере на 95% идентична аминокислотной последовательности SEQ ID
NO: 1 , в эукариотической клетке необходимо, чтобы этот белок оказался в ядре этой клетки. Поэтому, в некоторых вариантах изобретения, для образования двунитевых разрывов в целевой ДНК используют белок, имеющий последовательность, которая по меньшей мере на 95% идентична аминокислотной последовательности SEQ ID NO: 1 , и который дополнительно модифицирован с одного или с обоих концов добавлением одного или нескольких сигналов ядерной локализации. Например, может быть использован сигнал ядерной локализации из вируса SV40. Для эффективной доставки в ядро сигнал ядерной локализации может быть отделен от основной последовательности белка спейсерной последовательностью, например, описанной в Shen В, et al. "Generation of gene-modified mice via Cas9/RNA- mediated gene targeting", Cell Res. 2013 May;23(5):720-3. Также, в других вариантах осуществления, может быть использован другой сигнал ядерной локализации, или альтернативный метод доставки указанного белка в ядро клетки.
Настоящее изобретение охватывает применение белка из организма Clostridium cellulolyticum (С. cellulolyticum), гомологичного ранее охарактеризованным белкам Cas9, для внесения двуцепочечных разрывов в молекулы ДНК в строго определенных положениях.
Редактирование генома С. cellulolyticum для метаболической инженерии - сложная задача из-за отсутствия эффективных инструментов редактирования. Методы направленного редактирования генома - такие как рекомбинация, ретротранспрессия интрона II группы и обмен аллелями - имеют ряд существенных ограничений. Например, процедура рекомбинационного- зависимого обмена аллелями достаточно продолжительная и обладает низкой эффективностью (Heap J. Т. et al. Integration of DNA info bacterial chromosomes from plasmids without a counter-selection marker //Nucleic acids research. - 2012. - T. 40. - Ns. 8. - С. e59-e59). Вставка протяженных фрагментов ДНК (для, например, переноса метаболических путей) трудно осуществима при помощи имеющихся инструментов для изменения генома, которые требуют существующих сайтов рекомбинации и / или рекомбиназ (Esveit К. М., Wang Н.
Н. Genome-scale engineering for systems and synthetic biology //Molecular systems biology. - 2013. - T. 9. - Ns. 1. - C. 641 ). Для успешного манипулирования геномом микроорганизмов и получения мутантов с заданными свойствами, необходима простая и эффективная методика.
Использование CRISPR нуклеаз для внесения направленных изменений в геном имеет ряд преимуществ. Во-первых, специфичность действия системы определяется последовательностью крРНК, что позволяет использовать один тип нуклеазы для всех локусов-мишеней. Во-вторых, методика позволяет доставить в клетку сразу несколько направляющих РНК, комплементарных разным генам-мишеням, что позволяет осуществлять единовременное изменение сразу нескольких генов.
Кроме того, использование нативной системы CRISPR-Cas9 из бактерии С. cellulolyticum позволит сделать систему редактирования генома этого организма проще и эффективней: процедура не будет требовать внесения в клетки чужеродных генов, их поддержание и экспрессию. Вместо этого возможно разработать процедуру внесения направляющих РНК, направленных на целевые гены, в бактерию: благодаря им хозяйская внутриклеточная CRISPR-Cas9 система сможет распознавать соответствующие ДНК-мишени биотехнологически значимой бактерии и вносить в них двунитевые разрывы.
Для биохимической характеризации белка Cas9 из С. cellulolyticum НЮ локус CRISPR, кодирующий основные компоненты системы (гены белков CcCas9, cas1 , cas2, а также CRISPR кассету и направляющие РНК), был клонирован в малокопийный бактериальный вектор pACYC184. Эффекторному рибонуклеиновому комплексу, состоящему из Cas9 и дуплекса крРНК (crRNA) и трейсерной РНК (tracrRNA), для распознавания и последующего гидролиза ДНК помимо комплементарного соответствия спейсера крРНК и протоспейсера необходимо присутствие РАМ (от англ.“РАМ” - protospacer adjusted motif) на ДНК мишени (Mojica F. J. М. et a!. Short motif sequences determine the targets of the prokaryotic CRISPR defence system //Microbiology. - 2009. - T. 155. - Ns 3. - C. 733-740). РАМ представляет собой строго определенную последовательность из нескольких нуклеотидов, расположенных в системах типа II вплотную либо в нескольких нуклеотидах от З’-конца протоспейсера на нетаргетной цепи. При отсутствии РАМ гидролиза связей в ДНК с образованием двунитевого разрыва не происходит. Необходимость присутствия РАМ последовательности на мишени повышает специфичность узнавания, но в то же время накладывает ограничение в выборе целевых участков ДНК, в которые необходимо внести разрыв.
Для определения последовательностей направляющий РНК системы CRISPR-Cas9 было проведено РНК-секвенирование бактерий E.coli DH5alpha, несущих созданную конструкцию pACYC184_CcCas9. Секвенирование показало, что CRISPR кассета системы активно транскрибируется, также как и трейсерная РНК (Фиг. 1). Анализ последовательности crRNA и tracrRNA позволил предположить возможное формирование ими вторичных структур, распознаваемых CcCas9 нуклеазой.
Далее авторами было произведено определение РАМ последовательности белка CcCas9 при помощи бактериального РАМ скрининга. Для определения РАМ последовательности белка CcCas9 клетки E.coli DH5alpha, несущие плазмиду pACYC184_CcCas9, были трансформированы библиотекой плазмид, содержащих последовательность спейсера 5’-
TAAAAAATAAGCAAGCGATGATATGAATGC-3’ CRISPR кассеты CcCas9 системы, фланкированной рандомизированной семибуквенной последовательностью с 5’ или 3’ конца. Плазмиды, несущие последовательность, соответствующую последовательности РАМ системы CcCas9, подвергались деградации под действием функционирующей CRISPR-Cas системы, в то время как остальные плазмиды библиотеки эффективно трансформировались в клетки, придавая им устойчивость к антибиотику ампициллину. После трансформации и инкубации клеток на чашках с антибиотиком колонии смывались с поверхности агара и из них экстрагировали ДНК с помощью набора Qiagen Plasmid Purification Midi. Из выделенного пула плазмид амплифицировали при помощи ПЦР участки, включающие рандомизированную РАМ последовательность, которые затем подвергали высокоэффективному секвенированию на платформе lllumina. Полученные прочтения анализировали: сравнивали эффективность трансформации плазмид с уникальными РАМ, входящими в библиотеку, в клетки, несущие pACYC184_CcCas9 или в контрольные клетки, несущие пустой вектор расус184. Полученные результаты анализировали методами биоинформатики. В результате удалось выявить РАМ системы CcCas9 - двубуквенную последовательность NNNNGNA (Фиг. 2).
Далее было произведено дополнительное определение РАМ последовательности при помощи воссоздания реакции разрезания in vitro. Для определения РАМ последовательности белка CcCas9 использовали in vitro порезку двунитевых РАМ библиотек. Для этого было необходимо получить все компоненты CcCas9 эффекторного комплекса: направляющие РНК и нукпеазу в рекомбинантной форме. Определение РНК-секвенированием последовательности направляющих РНК позволило синтезировать in vitro молекулы crRNA и tracrRNA. Синтез осуществляли с помощью набора NEB HiScribe Т7 RNA synthesis. Двунитевые ДНК библиотеки представляли собой фрагменты размером 374 п.н, содержащие последовательность протоспейсера, фланкированную рандомизированными семью нуклеотидами (5’ NNNNNNN 3’) с 3’ конца:
5’cccggggtaccacggagagatggtggaaatcatctttctcgtgggcatccttgatggccacctcgtcggaa gtgcccacgaggatgacagcaatgccaatgctgggggggctcttctgagaacgagctctgctgcctgacacggcca ggacggccaacaccaaccagaacttgggagaacagcactccgctctgggcttcatcttcaactcgtcgactccctgc aaacacaaagaaagagcatgttaaaataggatctacatcacgtaacctgtcttagaagaggctagatactgcaattc aagg accttatctcctttcattgag cacN N N N N N N aactccatctaccag cctactctcttatctctg gtatt -3’
Для разрезания этой мишени использовали направляющие РНК следующей последовательности:
tracrRNA:
5’AUUAUGGCAUAUCGGAGCCUGAAUUGUUGCUAUAAUAAGGUGCUGGG
UUUAGCCCAGACCGCCAAGUUAACCCCGGCAUUUAUUGCUGGGGUAUCUUGU
UUU
и crRNA:
5’uaucuccuuucauugagcacGUUAUAGCUCCAAUUCAGGCUCCGAUAU
Жирным шрифтом выделена последовательность crRNA, комплементарная протоспейсеру (целевой ДНК последовательности).
Для получения рекомбинантного белка CcCas9 его ген был заклонирован в плазмиду рЕТ21 а. Клетки E.coli Rosetta были трансформированы полученной плазмидой CcCas9_pET21 a. Клетки, несущие плазмиду, наращивали до оптической плотности С _600=0.6, далее проводили индукцию экспрессии гена CcCas9 добавлением IPTG до концентрации 1 тМ. Клетки инкубировали в течение 4 часов на 25 °С, после чего проводили их лизис. Очистку рекомбинантного белка проводили двумя этапами: с помощью аффинной хроматографии (NiNTA) и разделением белков по размерам на колонке Superdex 200. Полученный белок концентрировали с помощью фильтров Am icon с размером пор ЗОкДа. После этого белок замораживали на минус 80 °С и использовали для проведения in vitro реакций.
In vitro реакцию порезки линейных РАМ библиотек проводили в следующих условиях:
IxCutSmart буфер
400 нМ CcCas9
100 нМ ДНК библиотека
2 мкМ crRNA
2 мкМ tracrRNA
Общий объем реакции 20 мкл.
Clostridium cellulolyticum НЮ обитает в компостах и имеет оптимальную температуру деления 45°С, в связи с этим реакции проводили на этой температуре в течение 30 минут. В результате порезки часть фрагментов библиотеки распадалась на две части длиной около 50 пар нуклеотидов (п.н.) и 324 п.н. В качестве контрольного образца использовали реакции без добавления crRNA, обязательного компонента эффекторного Cas комплекса.
Продукты реакции наносили на 1.5% агарозный гель и подвергали электрофорезу. Непорезанные фрагменты ДНК длиной 374 п.н. экстрагировали из геля и подготавливали для высокоэффективного секвенирования с помощью набора NEB NextUltra II. Образцы секвенировали на платформе lllumina и далее проводили анализ последовательностей биоформатическими методами: определяли разницу в представленности нуклеотидов в отдельных позициях РАМ (NNNNNNN) в сравнении с контрольным образцом (Фиг. 3).
В результате авторам удалось определить РАМ последовательность CcCas9 in vitro методами: NNNNGNA, что полностью повторило результат, полученный в экспериментах с бактериями.
Далее была произведена проверка значимости отдельных позиций последовательность РАМ. Для этого in vitro проводили реакции in vitro порезки ДНК фрагмента, содержащего ДНК-мишень 5’- gtgctcaatgaaaggagata-3’, фланкированную РАМ последовательностью GAGAGTA:
5’cccggggtaccacggagagatggtggaaatcatctttctcgtgggcatccttgatggccacctcgtcggaa gtgcccacgaggatgacagcaatgccaatgctgggggggctcttctgagaacgagctctgctgcctgacacggcca ggacggccaacaccaaccagaacttgggagaacagcactccgctctgggcttcatcttcaactcgtcgactccctgc aaacacaaagaaagagcatgttaaaataggatctacatcacgtaacctgtcttagaagaggctagatactgcaattc aaggaccttatctcctttcattgagcac GAGAGTA aactccatctaccagcctactctcttatctctggtatt 3’ Реакцию проводили в следующих условиях:
IxCutSmart буфер
400 нМ CcCas9
20 нМ ДНК
2 мкМ crRNA
2 мкМ tracrRNA
Время инкубации 30 минут, температура проведения реакции 45 °С.
Результаты эксперимента подтвердили последовательность РАМ для CcCas9 как NNNNGNA -3’. Наиболее консервативной оказалась позиция G в пятом положении (см. Фиг. 4).
Нижеследующие примеры осуществления способа приведены в целях раскрытия характеристик настоящего изобретения и их не следует рассматривать как каким-либо образом ограничивающие объем изобретения.
Пример 1. Тестирование активности белка CcCas9 в разрезании различных ДНК мишеней.
Для того, чтобы проверить способность CcCas9 узнавать различные последовательности ДНК, фланкированные NNNNGNA 3’ последовательностью, были проведены эксперименты по in vitro разрезанию ДНК-мишеней из последовательности гена grin2b человека (см. таблицу 1 ниже).
Таблица 1. ДНК-мишени, выделенные из гена grin2b человека.
Figure imgf000017_0001
Реакции in vitro разрезания ДНК проводили в условиях аналогичных описанным выше экспериментам. В качестве ДНК-мишени использовался фрагмент гена человека grin2b размером около 500 н.п:
ttgtctctgcctgtagctgccaatgactatagcaatagcaccttttattgccttgttcaaggatttctgaggcttttga aagtttcattttctctcattctgcagagcaaataccagagataagagagtaggctggtagatggagttgggtttggtgctc aatgaaaggagataaggtccttgaattgcagtatctagcctcttctaagacaggttacgtgatgtagatcctattttaacat gctctttctttgtgtttgcagggagtcgacgagttgaagatgaagcccagagcggagtgctgttctcccaagttctggttgg tgttggccgtcctggccgtgtcaggcagcagagctcgttctcagaagagcccccccagcattggcattgctgtcatcctc gtgggcacttccgacgaggtggccatcaaggatgcccacgagaaagatgatttccaccatctctccgtggtaccccg
99
Результаты эксперимента показывают, что CcCas9 в комплексе с направляющими РНК способен распознавать различные ДНК мишени, содержащие последовательность РАМ NNNNGNA (Фиг. 5). В случаях некоторых мишеней CcCas9 толерантен к заменам в 7 положении последовательности РАМ. Пример 2. Температурный диапазон активности CcCas9.
Для уточнения температурного диапазона работы белка CcCas9 были проведены эксперименты по in vitro разрезанию ДНК-мишени в различных температурных условиях.
Для этого ДНК-мишень, фланкированную последовательностью РАМ GAGAGTA, подвергали разрезанию эффекторным комплексом CcCas9 с соответствующими направляющими РНК при разных температурах (Фиг. 6).
Оказалось, что белок CcCas9 обладает широким температурным диапазоном работы. Максимум нуклеазной активности достигается при температуре в 45 °С, в то время как белок достаточно активен в диапазоне от 37 °С до 55 °С. Таким образом, CcCas9 в комплексе с направляющими РНК является новым инструментом разрезания (образования двунитевых разрывов) в молекуле ДНК, ограниченной последовательностью 5’-NNNNGNA-3’, с температурным диапазоном работы от 37 °С до 55 °С. Схема комплекса таргетной ДНК с крРНК (crRNA) и трейсерной РНК (tracrRNA), вместе образующей направляющую РНК, изображена на Фиг. 7.
Пример 3.
Белки Cas9 из близкородственных организмов, относящихся к Clostridium.
На сегодняшний день в клостридиях была найдена всего одна CRISPR Cas система второго класса -Cas9 CRISPR Cas система из Clostridium perfringens (Maikova A, et al., New Insights Into Functions and Possible Applications of Clostridium difficile CRISPR-Cas System. Front Microbiol. 2018 Jul 31 ;9:1740).
Cas9 белок из этой бактерии Clostridium perfringens идентичен на 36% белку CcCas9 (степень идентичности была рассчитана по программе BLASTp, default parameters). Сравнимый по размерам белок Cas9 из Staphylococcus aureus идентичен CcCas9 на 28% (BLASTp, default parameters).
Таким образом, белок CcCas9 существенно отличается по аминокислотной последовательности от других Cas9 белков, изученных на сегодняшний день, в том числе белков, найденных в родственных организмах.
Специалисту в области генетической инженерии очевидно, что полученный и охарактеризованный Заявителем вариант последовательности белка CcCas9 может быть изменен без изменения функции самого белка (например, направленным мутагенезом аминокислотных остатков, напрямую не влияющих на функциональную активность (Sambrook et al., Molecular Cloning: A
Laboratory Manual, (1989), CSH Press, pp. 15.3-15.108)). В частности, специалисту известно, что могут быть изменены неконсервативные аминокислотные остатки, не затрагивающие остатки, определяющие функциональность белка (определяющие его функцию или структуру). Примерами таких изменений могут служить замены неконсервативных аминокислотных остатков на гомологичные. Некоторые из участков, содержащих неконсервативные аминокислотные остатки, приведены на Фиг. 8. В некоторых вариантах осуществления изобретения возможно использование белка, содержащего аминокислотную последовательность, которая по меньшей мере на 95% идентична аминокислотной последовательности SEQ ID NO: 1 и имеет отличия по сравнению с SEQ ID NO: 1 только в неконсервативных аминокислотных остатках, для образования двунитевого разрыва в молекуле ДНК, расположенного непосредственно перед нуклеотидной последовательностью 5’-NNNNGNA-3’ в указанной молекуле ДНК. Гомологичные белки могут быть получены путем мутагенеза (например, сайт-направленного или ПЦР-опосредуемого мутагенеза) соответствующих молекул нуклеиновых кислот с последующим тестированием кодируемого модифицированного белка Cas9 на сохранение его функций в соответствии с описанными здесь функциональными анализами.
Пример 4. Описанная в настоящем изобретении система CcCas9 в комплексе с направляющими РНК может быть использована для изменения последовательности геномной ДНК многоклеточного организма, в том числе эукариотического. Для введения система CcCas9 в комплексе с направляющими РНК в клетки этого организма (во все клетки или в часть клеток) могут быть применены различные подходы, известные специалистам. Например, методы доставки CRISPR-Cas9 систем в клетки организмов раскрыты в источниках (Liu С et al., Delivery strategies of the CRISPR-Cas9 gene-editing system for therapeutic applications. J Control Release. 2017 Nov 28;266:17-26; Lino CA et al., Delivering CRISPR: a review of the challenges and approaches. Drug Deliv. 2018 Nov;25(1 ):1234-1257), и в источниках, раскрытых внутри этих источников.
Для эффективной экспрессии нуклеазы CcCas9 в эукариотических клетках будет желательно провести оптимизацию кодонов для аминокислотной последовательности белка CcCas9 методами, известными специалистам (например, IDT codon optimization tool).
Для эффективной работы нуклеазы CcCas9 в эукариотических клетках необходимо обеспечить импорт этого белка внутрь ядра эукариотической клетки.
Для этого можно использовать сигнал ядерной локализации из Т-антигена вируса SV40 (Lanford et al., Cell, 1986, 46: 575-582), соединённый c последовательностью CcCas9 с помощью спейсерной последовательности, описанной в Shen В, et al. "Generation of gene-modified mice via Cas9/RNA- mediated gene targeting", Cell Res. 2013 May;23(5):720-3 или без нее. Таким образом, полная аминокислотная последовательность нукпеазы транспортируемой внутрь ядра эукариотической клетки будет представлять собой следующую последовательность: MAPKKKRKVGIHGVPAA-CcCas9- KRPAATKKAGQAKKKK (далее CcCas9 NLS). Для доставки белка с приведенной выше аминокислотной последовательностью, могут быть использованы по меньшей мере два подхода.
Доставка в виде гена осуществляется путем создания плазмиды, несущей ген CcCas9 NLS под регуляцией промотора (например, CMV промотора) и последовательности, кодирующей направляющие РНК под регуляцией U6 промотора. В качестве ДНК- мишеней используются ДНК последовательности фланкированные 5’-NNNNGNA-3’, например, последовательности гена grin2b человека:
acggccaacaccaaccagaa
cgactccctgcaaacacaaa
Таким образом, кассета для экспрессии крРНК выглядит следующим образом:
Gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattgga attaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttg сад ttttaaaattatg ttttaaaatg д actatcatatg cttaccg taacttg aaag tatttcgatttcttg g ctttatat atcttg tg gaaag g acgaaacacc-acggccaa :ассаассаааа
GTT AT AGCT CCAATT CAGGCT CCG AT ATttttt
Жирным шрифтом выделена последовательность U6 промотора, далее последовательность, необходимая для узнавания целевой ДНК, а последовательность прямого повтора выделена заглавными буквами.
Кассета для экспрессии трейсерной РНК выглядит следующим образом:
Gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattgga attaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttg сад ttttaaaattatg ttttaaaatg д actatcatatg cttaccg taacttg aaag tatttcgatttcttg g ctttatat atcttgtggaaaggacgaaacaccATT ATGGCAT AT CGG AGCCT GAATT GTTGCT AT AAT AAGGTGCTGGGTTT AGCCCAG ACCGCCAAGTT AACCCCGGCATTT ATTGCTGG GGTATCTTTGtttt
Жирным шрифтом выделена последовательность U6 промотора, далее последовательность, кодирующая трейсерную РНК.
Плазмидную ДНК очищают и трансфицируют в клетки человека НЕК293 с помощью реагента Lipofectamine2000 (Thermo Fisher Scientific). Клетки инкубируют в течение 72 часов, после чего из них выделяется геномная ДНК с помощью колонок для очистки геномной ДНК (Thermo Fisher Scientific). Целевой ДНК сайт анализируется с помощью секвенирования на платформе lllumina с целью определения числа вставок-делеций в ДНК, происходящих в целевом сайте по причине направленного двунитевого разрыва и последующей его репарации.
Для амплификации целевых фрагментов используют праймеры, фланкирующие предположительное место внесения разрыва, например для указанных выше сайтов гена grin2b:
5’-GACT AT AGCAAT AGCAC-3’
5TCAACTCGTCGACTCCCTG-3’
После амплификации пробы готовятся по протоколу реагента Ultra II DNA Library Prep Kit for lllumina (NEB) для подготовки образцов к высокопроизводительному секвенированию. Затем проводится секвенирование на платформе lllumina 300cycles, прямое прочтение. Результаты секвенирования анализируются биоинформатическими методами. В качестве детекции разрезания принимается вставка или делеция нескольких нуклеотидов в целевой последовательности ДНК.
Доставка в виде рибонуклеинового комплекса осуществляется путем инкубации рекомбинантной формы CcCas9 NLS с направляющими РНК в CutSmart буфере (NEB). Рекомбинантный белок получают из бактериальных клеток-продуцентов, очищая его с помощью аффинной хроматографии (NiNTA, Qiagen) разделением по размеру (Superdex 200).
Белок смешивают с РНК в соотношении 1 :2:2 (CcCas9 NLS : crRNA
:tracrRNA), инкубируют в течение 10 минут на комнатной температуре, затем смесь трансфицируют в клетки.
Далее проводится анализ экстрагированной из них ДНК на предмет вставок-делеций в целевом ДНК сайте (как описано выше).
Охарактеризованная в настоящем изобретении CcCas9 нуклеаза из бактерии Clostridium cellulolyticum имеет ряд преимуществ относительно ранее охарактеризованных Cas9 белков.
CcCas9 обладает коротким, двухбуквенным, отличным от других известных РАМ Cas нуклеаз, необходимый для функционирования системы. Авторами было показано, что для CcCas9 достаточен короткий РАМ GNA, распложенный в 4 нуклеотидах от протоспейсера. При этом G в +5 позиции является строгой, в то время как +7 позиция имеет меньшую значимость, и in vitro гидролиз был детектирован не только в присутствии А или Т, но и в присутствии С в +7 позиции, хоть и с несколько меньшей эффективностью.
Известные на сегодняшний день большинство Cas нуклеаз, способных вносить двунитевые разрывы в ДНК, имеют сложные многобуквенные РАМ последовательности, ограничивающие выбор последовательности, пригодных для разрезания. Среди изученных Cas нуклеаз, распознающих короткие РАМ, только CcCas9 может распознавать последовательности, ограниченные GNA нуклеотидами.
Второе преимущество CcCas9 - малый размер белка (1030 а.о., что на 23 а. о. меньше, чем размер SaCas9). На сегодняшний день это единственный изученный малоразмерный белок, обладающий двухбуквенной РАМ последовательностью.
Третье преимущество CcCas9 системы - широкий рабочий диапазон температур: нуклеаза активна при температурах от 37 °С до 65 °С с оптимумом 45 °С.
Несмотря на то, что изобретение описано со ссылкой на раскрываемые варианты воплощения, для специалистов в данной области должно быть очевидно, что конкретные подробно описанные случаи приведены лишь в целях иллюстрирования настоящего изобретения, и их не следует рассматривать как каким-либо образом ограничивающие объем изобретения. Должно быть, понятно, что возможно осуществление различных модификаций без отступления от сути настоящего изобретения.

Claims

Формула изобретения
1. Применение белка, содержащего аминокислотную последовательность SEQ ID NO: 1 , или содержащего аминокислотную последовательность, которая по меньшей мере на 95% идентична аминокислотной последовательности SEQ ID NO: 1 и имеет отличия по сравнению с SEQ ID NO: 1 только в неконсервативных аминокислотных остатках, для образования двунитевого разрыва в молекуле ДНК, расположенного непосредственно перед нуклеотидной последовательностью 5'-NNNNGNA-3' в указанной молекуле ДНК.
2. Применение белка по п. 1 , характеризующееся тем, что образование двунитевого разрыва в молекуле ДНК происходит при температуре от 37 °С до 65 °С.
3. Применение белка по п. 1 , где белок содержит аминокислотную последовательность SEQ ID NO: 1.
4. Способ образования двунитевого разрыва в последовательности геномной ДНК одноклеточного или многоклеточного организма, непосредственно примыкающей к последовательности 5’-NNNNGNA-3’, включающий введение в по меньшей мере одну клетку этого организма эффективного количества: а) белка, содержащего аминокислотную последовательность SEQ ID NO: 1 , или нуклеиновой кислоты, кодирующей белок, содержащий аминокислотную последовательность SEQ ID NO: 1 , и б) направляющей РНК, содержащей последовательность, образующую дуплекс с нуклеотидной последовательностью участка геномной ДНК организма, непосредственно примыкающей к нуклеотидной последовательности 5’- NNNNGNA-3’, и взаимодействующей с указанным белком после образования дуплекса, или последовательности ДНК, кодирующей указанную направляющую РНК;
при этом взаимодействие указанного белка с указанной направляющей РНК и нуклеотидной последовательностью 5’-NNNNGNA-3’ приводит к образованию двунитевого разрыва в последовательности геномной ДНК, непосредственно примыкающей к последовательности 5’-NNNNGNA-3’.
5. Способ по п. 4, дополнительно включающий введение экзогенной последовательности ДНК одновременно с направляющей РНК.
PCT/RU2019/050229 2018-11-26 2019-11-26 Средство разрезания днк на основе cas9 белка из биотехнологически значимой бактерии clostridium cellulolyticum WO2020111983A2 (ru)

Priority Applications (15)

Application Number Priority Date Filing Date Title
JP2021529802A JP2022513642A (ja) 2018-11-26 2019-11-26 バイオテクノロジー的に重要な細菌、クロストリジウム・セルロリティクム(Clostridium cellulolyticum)由来のCas9タンパク質に基づく、DNAカット手段
MA53577A MA53577B1 (fr) 2018-11-26 2019-11-26 Moyen de découpage d'adn à base de la protéine cas9 sur la base d'une bactérie à valeur biotechnologique clostridium cellulolyticum
PE2021000760A PE20212079A1 (es) 2018-11-26 2019-11-26 Agente de corte de adn
KR1020217019947A KR20210118069A (ko) 2018-11-26 2019-11-26 Dna 절단 물질
EA202191504A EA202191504A1 (ru) 2018-11-26 2019-11-26 Средство разрезания днк
BR112021010185A BR112021010185A2 (pt) 2018-11-26 2019-11-26 Agente de corte de dna, seus métodos associados e usos
MX2021006119A MX2021006119A (es) 2018-11-26 2019-11-26 Agente de corte de adn.
EP19888557.6A EP3889269A4 (en) 2018-11-26 2019-11-26 MEDIUM FOR CUTTING DNA BASED ON CAS9 PROTEIN BASED ON BIOTECHNOLOGY VALUE BACTERIA CLOSTRIDIUM CELLULOLYTICUM
CA3121088A CA3121088A1 (en) 2018-11-26 2019-11-26 Dna cutting means based on cas9 protein from biotechnologically significant bacterium clostridium cellulolyticum
US17/296,597 US20220002692A1 (en) 2018-11-26 2019-11-26 DNA cutting means based on Cas9 protein from biotechnologically significant bacterium Clostridium cellulolyticum
AU2019388420A AU2019388420A1 (en) 2018-11-26 2019-11-26 DNA-cutting agent
CN201980090346.6A CN113785055A (zh) 2018-11-26 2019-11-26 Dna切割剂
PH12021551198A PH12021551198A1 (en) 2018-11-26 2021-05-25 Dna-cutting agent
CONC2021/0006938A CO2021006938A2 (es) 2018-11-26 2021-05-26 Agente de corte de adn
ZA2021/03578A ZA202103578B (en) 2018-11-26 2021-05-26 Dna-cutting agent

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
RU2018141524 2018-11-26
RU2018141524A RU2712497C1 (ru) 2018-11-26 2018-11-26 Средство разрезания ДНК на основе Cas9 белка из биотехнологически значимой бактерии Clostridium cellulolyticum

Publications (2)

Publication Number Publication Date
WO2020111983A2 true WO2020111983A2 (ru) 2020-06-04
WO2020111983A3 WO2020111983A3 (ru) 2020-07-23

Family

ID=69625021

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/RU2019/050229 WO2020111983A2 (ru) 2018-11-26 2019-11-26 Средство разрезания днк на основе cas9 белка из биотехнологически значимой бактерии clostridium cellulolyticum

Country Status (18)

Country Link
US (1) US20220002692A1 (ru)
EP (1) EP3889269A4 (ru)
JP (1) JP2022513642A (ru)
KR (1) KR20210118069A (ru)
CN (1) CN113785055A (ru)
AU (1) AU2019388420A1 (ru)
BR (1) BR112021010185A2 (ru)
CA (1) CA3121088A1 (ru)
CL (1) CL2021001382A1 (ru)
CO (1) CO2021006938A2 (ru)
EA (1) EA202191504A1 (ru)
MA (1) MA53577B1 (ru)
MX (1) MX2021006119A (ru)
PE (1) PE20212079A1 (ru)
PH (1) PH12021551198A1 (ru)
RU (1) RU2712497C1 (ru)
WO (1) WO2020111983A2 (ru)
ZA (1) ZA202103578B (ru)

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA3226329A1 (en) * 2011-12-16 2013-06-20 Targetgene Biotechnologies Ltd Compositions and methods for modifying a predetermined target nucleic acid sequence
US8697359B1 (en) * 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
CA2930877A1 (en) * 2013-11-18 2015-05-21 Crispr Therapeutics Ag Crispr-cas system materials and methods
AU2016263026A1 (en) * 2015-05-15 2017-11-09 Pioneer Hi-Bred International, Inc. Guide RNA/Cas endonuclease systems
GB201510296D0 (en) * 2015-06-12 2015-07-29 Univ Wageningen Thermostable CAS9 nucleases
EP3472310A1 (en) * 2016-06-20 2019-04-24 Pioneer Hi-Bred International, Inc. Novel cas systems and methods of use

Non-Patent Citations (19)

* Cited by examiner, † Cited by third party
Title
ALTSCHUL ET AL., J. MOL. BIOL., vol. 215, 1990, pages 403 - 10
BROUNS S. J. J. ET AL.: "Small CRISPR RNAs guide antiviral defense in prokaryotes", SCIENCE, vol. 321, no. 5891, 2008, pages 960 - 964, XP055401088, DOI: 10.1126/science.1159689
DELTCHEVA E. ET AL.: "CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III", NATURE, vol. 471, no. 7340, 2011, pages 602, XP055619637, DOI: 10.1038/nature09886
DESVAUX M: "Clostridium cellulolyticum: model organism of mesophilic cellulolytic clostridia", FEMS MICROBIOL REV., vol. 29, no. 4, September 2005 (2005-09-01), pages 741 - 64
ESVELT K. M.WANG H. H.: "Genome-scale engineering for systems and synthetic biology", MOLECULAR SYSTEMS BIOLOGY, vol. 9, no. 1, 2013, pages 641, XP055339996, DOI: 10.1038/msb.2012.66
HEAP J. T. ET AL.: "Integration of DNA into bacterial chromosomes from plasmids without a counter-selection marker", NUCLEIC ACIDS RESEARCH, vol. 40, no. 8, 2012, pages e59 - e59, XP055071637, DOI: 10.1093/nar/gkr1321
HSU PD ET AL.: "DNA targeting specificity of RNA-guided Cas9 nucleases", NAT BIOTECHNOL., vol. 31, no. 9, September 2013 (2013-09-01), pages 827 - 32, XP055219426, DOI: 10.1038/nbt.2647
JANSEN R. ET AL., MOLECULAR MICROBIOLOGY, vol. 43, no. 6, 2002, pages 1565 - 1575
JANSEN R. ET AL.: "Identification of genes that are associated with DNA repeats in prokaryotes", MOLECULAR MICROBIOLOGY, vol. 43, no. 6, 2002, pages 1565 - 1575, XP002424877, DOI: 10.1046/j.1365-2958.2002.02839.x
LANFORD ET AL., CELL, vol. 46, 1986, pages 575 - 582
LI Y ET AL.: "Combined inactivation of the Clostridium cellulolyticum lactate and malate dehydrogenase genes substantially increases ethanol yield from cellulose and switchgrass fermentations", BIOTECHNOL BIOFUELS, vol. 5, no. 1, 4 January 2012 (2012-01-04), pages 2, XP021094242, DOI: 10.1186/1754-6834-5-2
LINO CA ET AL.: "Delivering CRISPR: a review of the challenges and approaches", DRUG DELIV., vol. 25, no. 1, November 2018 (2018-11-01), pages 1234 - 1257, XP055573342, DOI: 10.1080/10717544.2018.1474964
LIU C ET AL.: "Delivery strategies of the CRISPR-Cas9 gene-editing system for therapeutic applications", J CONTROL RELEASE, vol. 266, 28 November 2017 (2017-11-28), pages 17 - 26, XP085292687, DOI: 10.1016/j.jconrel.2017.09.012
MAIKOVA A ET AL.: "New Insights Into Functions and Possible Applications of Clostridium difficile CRISPR-Cas System", FRONT MICROBIOL., vol. 9, 31 July 2018 (2018-07-31), pages 1740
MOJICA F. J. M. ET AL.: "Intervening sequences of regularly spaced prokaryotic repeats derive from foreign genetic elements", JOURNAL OF MOLECULAR EVOLUTION, vol. 60, no. 2, 2005, pages 174 - 182, XP019363173, DOI: 10.1007/s00239-004-0046-3
MOJICA F. J. M. ET AL.: "Short motif sequences determine the targets of the prokaryotic CRISPR defence system", MICROBIOLOGY, vol. 155, no. 3, 2009, pages 733 - 740, XP055118633, DOI: 10.1099/mic.0.023960-0
SAMBROOK ET AL.: "Molecular Cloning: A Laboratory Manual", 1989, CSH PRESS, pages: 15.3 - 15.108
See also references of EP3889269A4
SHEN B ET AL.: "Generation of gene-modified mice via Cas9/RNA- mediated gene targeting", CELL RES., vol. 23, no. 5, May 2013 (2013-05-01), pages 720 - 3, XP055141533, DOI: 10.1038/cr.2013.46

Also Published As

Publication number Publication date
MX2021006119A (es) 2021-07-07
JP2022513642A (ja) 2022-02-09
BR112021010185A2 (pt) 2021-12-28
PE20212079A1 (es) 2021-10-28
CO2021006938A2 (es) 2021-09-20
CA3121088A1 (en) 2020-06-04
MA53577A1 (fr) 2022-02-28
AU2019388420A1 (en) 2021-07-22
US20220002692A1 (en) 2022-01-06
WO2020111983A3 (ru) 2020-07-23
PH12021551198A1 (en) 2021-10-25
EP3889269A4 (en) 2022-08-31
MA53577B1 (fr) 2022-10-31
RU2712497C1 (ru) 2020-01-29
ZA202103578B (en) 2022-07-27
KR20210118069A (ko) 2021-09-29
EP3889269A2 (en) 2021-10-06
EA202191504A1 (ru) 2021-09-09
CL2021001382A1 (es) 2022-01-07
CN113785055A (zh) 2021-12-10

Similar Documents

Publication Publication Date Title
KR102210322B1 (ko) Rna-안내 게놈 편집의 특이성을 증가시키기 위한 rna-안내 foki 뉴클레아제(rfn)의 용도
US11713471B2 (en) Class II, type V CRISPR systems
WO2014204578A1 (en) Using rna-guided foki nucleases (rfns) to increase specificity for rna-guided genome editing
EP4159853A1 (en) Genome editing system and method
Dong et al. A single digestion, single-stranded oligonucleotide mediated PCR-independent site-directed mutagenesis method
RU2712497C1 (ru) Средство разрезания ДНК на основе Cas9 белка из биотехнологически значимой бактерии Clostridium cellulolyticum
RU2712492C1 (ru) Средство разрезания днк на основе cas9 белка из defluviimonas sp.
EA042517B1 (ru) Средство разрезания днк
RU2791447C1 (ru) Средство разрезания ДНК на основе ScCas12a белка из бактерии Sedimentisphaera cyanobacteriorum
RU2788197C1 (ru) Средство разрезания ДНК на основе Cas9 белка из бактерии Streptococcus uberis NCTC3858
OA20196A (en) DNA-cutting agent.
RU2778156C1 (ru) Средство разрезания ДНК на основе Cas9 белка из бактерии Capnocytophaga ochracea
RU2722933C1 (ru) Средство разрезания днк на основе cas9 белка из бактерии demequina sediminicola
US20220228134A1 (en) Dna-cutting agent based on cas9 protein from the bacterium pasteurella pneumotropica
EP4056705A1 (en) Use of cas9 protein from the bacterium pasteurella pneumotropica
EA041933B1 (ru) Средство разрезания днк
OA20197A (en) DNA-cutting agent.
EA041935B1 (ru) СРЕДСТВО РАЗРЕЗАНИЯ ДНК НА ОСНОВЕ Cas9 БЕЛКА ИЗ БАКТЕРИИ Pasteurella Pneumotropica
OA20443A (en) DNA-cutting agent based on CAS9 protein from the bacterium pasteurella pneumotropica
EA044419B1 (ru) Применение cas9 белка из бактерии pasteurella pneumotropica

Legal Events

Date Code Title Description
ENP Entry into the national phase

Ref document number: 3121088

Country of ref document: CA

ENP Entry into the national phase

Ref document number: 2021529802

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

REG Reference to national code

Ref country code: BR

Ref legal event code: B01A

Ref document number: 112021010185

Country of ref document: BR

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19888557

Country of ref document: EP

Kind code of ref document: A2

ENP Entry into the national phase

Ref document number: 2019888557

Country of ref document: EP

Effective date: 20210628

ENP Entry into the national phase

Ref document number: 2019388420

Country of ref document: AU

Date of ref document: 20191126

Kind code of ref document: A

REG Reference to national code

Ref country code: BR

Ref legal event code: B01E

Ref document number: 112021010185

Country of ref document: BR

Free format text: 1) APRESENTAR, EM ATE 60 (SESSENTA) DIAS, DOCUMENTOS COMPROBATORIOS QUE EXPLIQUEM E REGULARIZEM A DIVERGENCIA NO NOME DO INVENTOR CONSTANTE NA PUBLICACAO INTERNACIONAL WO/2020/111983 DE 04/06/2020 COMO POLINA ANATOLEVNA SELKOVA CONSTANTE NO FORMULARIO DA PETICAO INICIAL NO 870210047568 DE 26/05/2021 COMO SELKOVA, POLINA ANATOLEVNA; RES. UDMURTSKAYA UMA VEZ QUE NAO HOUVE ENVIO DE DOCUMENTO COMPROVANDO QUE OS NOME CORRETO DO INVENTOR E O DECLARADO NA ENTRADA NACIONAL. 2) APRESENTAR A TRADUCAO SIMPLES DA FOLHA DE ROSTO DA CERTIDAO DE DEPOSITO DA PRIORIDADE RU 2018141524 DE 26/11/2018 OU DECLARACAO CONTENDO, OBRIGATORIAMENTE, TODOS OS DADOS IDENTIFICADORES DESTA (DEPOSITANTE(S), INVENTOR(ES), N

REG Reference to national code

Ref country code: BR

Ref legal event code: B01Y

Ref document number: 112021010185

Country of ref document: BR

Free format text: ANULADA A PUBLICACAO CODIGO 1.5 NA RPI NO 2641 DE 17/08/2021 POR TER SIDO INDEVIDA. SERA PUBLICADA A EXIGENCIA CORRIGIDA NA PROXIMA REVISTA

REG Reference to national code

Ref country code: BR

Ref legal event code: B01E

Ref document number: 112021010185

Country of ref document: BR

Free format text: 1) APRESENTAR, EM ATE 60 (SESSENTA) DIAS, DOCUMENTOS COMPROBATORIOS QUE EXPLIQUEM E REGULARIZEM A DIVERGENCIA NO NOME DO INVENTOR CONSTANTE NA PUBLICACAO INTERNACIONAL WO/2020/111983 DE 04/06/2020 COMO POLINA ANATOLEVNA SELKOVA CONSTANTE NO FORMULARIO DA PETICAO INICIAL NO 870210047568 DE 26/05/2021 COMO SELKOVA, POLINA ANATOLEVNA; RES. UDMURTSKAYA UMA VEZ QUE NAO HOUVE ENVIO DE DOCUMENTO COMPROVANDO QUE OS NOME CORRETO DO INVENTOR E O DECLARADO NA ENTRADA NACIONAL. 2) COM BASE NA PORTARIA 405 DE 21/12/2020, SOLICITA-SE QUE SEJA APRESENTADO, EM ATE 60 (SESSENTA) DIAS, NOVO CONTEUDO DE LISTAGEM DE SEQUENCIA COM TITULO CORRETO.

REG Reference to national code

Ref country code: BR

Ref legal event code: B01E

Ref document number: 112021010185

Country of ref document: BR

Free format text: COM BASE NA PORTARIA 405 DE 21/12/2020, SOLICITA-SE QUE SEJA APRESENTADO, EM ATE 60 (SESSENTA) DIAS, NOVO CONTEUDO DE LISTAGEM DE SEQUENCIA POIS O CONTEUDO APRESENTADO NA PETICAO NO 870210096453 DE 19/10/2021 NAO POSSUI TODOS OS CAMPOS OBRIGATORIOS INFORMADOS, NAO CONSTANDO O CAMPO 140 / 141 .

ENP Entry into the national phase

Ref document number: 112021010185

Country of ref document: BR

Kind code of ref document: A2

Effective date: 20210526