WO2020184723A1 - Crisprタイプi-dシステムを利用した標的配列改変技術 - Google Patents

Crisprタイプi-dシステムを利用した標的配列改変技術 Download PDF

Info

Publication number
WO2020184723A1
WO2020184723A1 PCT/JP2020/011283 JP2020011283W WO2020184723A1 WO 2020184723 A1 WO2020184723 A1 WO 2020184723A1 JP 2020011283 W JP2020011283 W JP 2020011283W WO 2020184723 A1 WO2020184723 A1 WO 2020184723A1
Authority
WO
WIPO (PCT)
Prior art keywords
dna encoding
dna
sequence
vector
expression cassette
Prior art date
Application number
PCT/JP2020/011283
Other languages
English (en)
French (fr)
Inventor
敬史 刑部
祐里子 刑部
和田 直樹
Original Assignee
国立大学法人徳島大学
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 国立大学法人徳島大学 filed Critical 国立大学法人徳島大学
Priority to JP2021505164A priority Critical patent/JP7489112B2/ja
Publication of WO2020184723A1 publication Critical patent/WO2020184723A1/ja

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression

Definitions

  • the present invention relates to a method for specifically modifying a target nucleotide sequence using a CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) type ID system, and the Cas (CRISPR-associated) protein and crRNA (CRISPRRNA) used in the method. ) Containing the kit.
  • CRISPR Clustered Regularly Interspaced Short Palindromic Repeats
  • Cas CRISPR-associated protein and crRNA
  • the CRISPR-Cas system is an adaptive immune system found in bacteria and archaea that protects bacteria and archaea from viruses, plasmids and other foreign genetic elements.
  • the CRISPR-Cas system is divided into two classes, six different types (I-VI), and at least 16 subtypes, depending on the Cas proteins and molecular mechanisms that make up the system.
  • the complex of crRNA and Cas effector protein recognizes a short (typically 3-5 base length) sequence element called the protospacer flanking motif (PAM) in foreign DNA. To do. After PAM recognition, the complex of type I or II crRNA and Cas effector protein locally disrupts the DNA pair to form an R-loop structure, and the crRNA guide element base pairs with the complementary target strand. It forms and replaces non-target DNA strands. Binding and unwinding of double-stranded DNA targets by the crRNA-Cas complex is required for DNA cleavage and degradation by type-specific Cas effector nucleases such as Cas3, Cas9 and Cas12 nucleases.
  • type-specific Cas effector nucleases such as Cas3, Cas9 and Cas12 nucleases.
  • CRISPR type I there are various subtypes of CRISPR type I.
  • a target recognition module such as Cas5, Cas6, Cas7 and Cas8 called Cascade (CRISPR-associated-complex for antiviral defense) and a DNA cleavage module such as Cas3 (Non-Patent Document 1).
  • the Class 1 CRISPR system is less common than Class 2, but as a genome editing tool, with Cas9 and Cpf1, for example, a long region genome deletion and a variety of mutation profiles involving long gRNA sequences. It was suggested that it may have some advantages in comparison (Non-Patent Document 1).
  • Non-Patent Document 1 In the class 1 type IE CRISPR-Cas3 system studied so far, it has been reported that base deletions of 2-300b to 100 kb occur mainly on the 5'upstream side of the PAM sequence (Non-Patent Document 1). ..
  • Type ID (hereinafter referred to as "TiD") system.
  • the genomic locus was identified and found that the system contained five Cas proteins, Cas3d, Cas5d, Cas6d, Cas7d, and Cas10d (Patent Document 1).
  • Patent Document 1 it was unclear how the TiD system degrades DNA.
  • An object of the present invention is to elucidate the mechanism of action of the TiD system and thereby to develop a more efficient target sequence modification method using the TiD system.
  • the CRISPR TiD system contains a Cas3 effector protein (Cas3d), but the protein lacks a nuclease domain and instead Cas10d has a typical nuclease domain. It was. Cas10d is a TiD-specific effector protein not found in other CRISPR systems. Furthermore, they have found that the off-target effect of the TiD system can be reduced by selecting a target sequence that does not have a specific similarity sequence.
  • Cas3d Cas3 effector protein
  • a method of modifying a target nucleotide sequence in a cell wherein the cell is (I) A vector system or expression cassette system containing a DNA encoding Cas3d, a DNA encoding Cas5d, a DNA encoding Cas6d, a DNA encoding Cas7d, and a DNA encoding Cas10d, which are CRISPR type ID Cas proteins Cas3d. And (ii) a crRNA containing a sequence that forms a base pair with the target nucleotide sequence, or a DNA encoding the crRNA.
  • the vector system comprises a first vector and a second vector.
  • the expression cassette system includes a first expression cassette and a second expression cassette.
  • the first vector or the first expression cassette is selected from the group consisting of DNA encoding Cas3d, DNA encoding Cas5d, DNA encoding Cas6d, DNA encoding Cas7d, and DNA encoding Cas10d. Contains at least one DNA and a first regulatory element that regulates transcription of said DNA.
  • a method, wherein the second vector or the second expression cassette comprises at least one DNA selected from the group and a second regulatory element that regulates transcription of the DNA.
  • a nuclear localization signal is sent to the 5'end and / or 3'end side of the DNA encoding Cas3d, the DNA encoding Cas5d, the DNA encoding Cas6d, the DNA encoding Cas7d, and the DNA encoding Cas10d.
  • a DNA encoding Cas3d, a DNA encoding Cas5d, a DNA encoding Cas6d, a DNA encoding Cas7d, and a DNA encoding Cas10d are included in the vector system, and the first vector encodes Cas3d.
  • a DNA encoding Cas3d, a DNA encoding Cas5d, a DNA encoding Cas6d, a DNA encoding Cas7d, and a DNA encoding Cas10d are included in the vector system, and the first vector encodes Cas3d.
  • the second vector contains a DNA encoding Cas7d and encodes a monopartite nuclear localization signal linked in two or three tandems on the 5'end and / or 3'end side of the DNA.
  • the vector system further contains a third to fifth vector, and each of the DNA encoding Cas3d, the DNA encoding Cas5d, the DNA encoding Cas6d, the DNA encoding Cas7d, and the DNA encoding Cas10d are included.
  • the method according to any one of [1] to [8] which is separately contained in the first to fifth vectors.
  • a DNA encoding Cas3d, a DNA encoding Cas5d, a DNA encoding Cas6d, a DNA encoding Cas7d, and a DNA encoding Cas10d are included in the expression cassette system, and the first expression cassette is Cas3d.
  • the second expression cassette contains a DNA encoding Cas5d, a DNA encoding Cas7d, and a DNA encoding Cas10d
  • the first expression cassette contains a DNA encoding Cas6d and a DNA encoding Cas6d.
  • [15] The method according to any one of [1] to [14], wherein the modification is a deletion, insertion, or substitution of a base.
  • [16] The method of [15], wherein the modification is a deletion on a kilobase to tens of kilobases.
  • [17] A kit for modifying an intracellular target nucleotide sequence.
  • (I) A vector system or expression cassette system containing a DNA encoding Cas3d, a DNA encoding Cas5d, a DNA encoding Cas6d, a DNA encoding Cas7d, and a DNA encoding Cas10d, which are CRISPR type ID Cas proteins Cas3d.
  • the vector system comprises a first vector and a second vector.
  • the expression cassette system includes a first expression cassette and a second expression cassette.
  • the first vector or the first expression cassette is selected from the group consisting of DNA encoding Cas3d, DNA encoding Cas5d, DNA encoding Cas6d, DNA encoding Cas7d, and DNA encoding Cas10d.
  • a kit, wherein the second vector or the second expression cassette comprises at least one DNA selected from the group and a second regulatory element that regulates transcription of the DNA.
  • a DNA encoding Cas3d, a DNA encoding Cas5d, a DNA encoding Cas6d, a DNA encoding Cas7d, and a DNA encoding Cas10d are included in the vector system, and the vector system is the third to fifth.
  • the first to fifth vectors further include a vector, which further comprises a DNA encoding Cas3d, a DNA encoding Cas5d, a DNA encoding Cas6d, a DNA encoding Cas7d, and a DNA encoding Cas10d, respectively.
  • the kit [19] A DNA encoding Cas3d, a DNA encoding Cas5d, a DNA encoding Cas6d, a DNA encoding Cas7d, and a DNA encoding Cas10d are included in the expression cassette system, and the first expression cassette is Cas3d.
  • a method for specifically targeting an intracellular target nucleotide sequence wherein the cell is (I) CRISPR type ID Cas proteins Cas5d, Cas6d and Cas7d, or nucleic acids encoding these proteins, and (ii) a crRNA containing a sequence forming a base pair with the target nucleotide sequence, or the crRNA.
  • DNA to do Including the introduction of The target nucleotide sequence is any one base selected from the group consisting of 1, 6, 12, 18 and 24th bases from the 3'side of the PAM sequence with respect to the target nucleotide sequence, or the 24th and subsequent bases.
  • a method which is designed so that there are no similar sequences that differ in one or two bases.
  • a method of specifically modifying a target nucleotide sequence in a cell wherein the cell is (I) CRISPR type I-D Cas proteins Cas3d, Cas5d, Cas6d, Cas7d and Cas10d, or nucleic acids encoding these proteins, and (ii) crRNAs containing sequences that base pair with the target nucleotide sequence, or DNA encoding the crRNA Including the introduction of
  • the target nucleotide sequence is any one base selected from the group consisting of 1, 6, 12, 18 and 24th bases from the 3'side of the PAM sequence with respect to the target nucleotide sequence, or the 24th and subsequent bases.
  • the method is designed so that there are no similar sequences that differ in one or two bases, and [22] the target nucleotide sequence is 6 from the 3'side of the PAM sequence with respect to the target nucleotide sequence. , 12, 18 and 24th base is designed so that there is no one base selected from the group, or a similar sequence in which one or two bases after the 24th base are different. 20 or 21.
  • the present invention it is possible to efficiently induce site-specific mutations in cells, preferably animal and plant cells, by using a TiD system containing TiD crRNA engineered to target a particular DNA. it can.
  • the expression level of Cas effector protein in the TiD system can be improved, not only inducing insertion and / or deletion of short regions, but also on a kilobase to tens of kilobases. Deletions in long regions of the base and bi-directional base deletions can also be induced.
  • the TiD system is used to genetically transfer the desired phenotype in the resulting mutant transgenic organism to the next generation.
  • the methods of the invention result in specific targeting and modification of the target sequence with suppressed off-target effects. Therefore, the present invention provides a novel genome editing tool for organisms, especially eukaryotes, using the CRISPR effector module pathway of the TiD system.
  • gRNAs target the AAVS locus shown in Table 2.
  • the effect of gRNA target sequence length on TiD activity is shown.
  • the effect of the crRNA structure used in the TiD system is shown.
  • the results of a luc reporter assay performed using gRNA containing a 3-base mismatch at various positions of the gRNA sequence against the target sequence of AAVS GTC_70-107 (+) are shown.
  • the results of a luc reporter assay performed using a gRNA containing a 1-base mismatch at various positions of a 30b-long gRNA sequence against the target sequence of AAVS GTC_70-107 (+) are shown.
  • N-Cas-C-bpNLS N-Cas-C-bpNLS
  • bpNLS having both an N-terminal Myc tag and a C-terminal 6xHis tag in each of Cas3d, Cas5d, Cas6d, Cas7d, and Cas10d.
  • E. Is. ** P ⁇ 0.1 and ** P ⁇ 0.05 were determined by Student's t-test.
  • N-SV40NLS-Cas Cas3d, Cas5d, Cas6d, Cas7d, and Cas10d with SV40NLS with different tags added to the N-terminus. 2A; self-cleaving peptide. promoter; promoter. Ter; Terminator. Western blotting results of expression levels of Cas protein in HEK293T cells.
  • C Control without vector. EV; control of an empty vector (without gRNA). 1; Individual Cas expression cassettes were separated into individual vectors. 2; Cas3d and Cas10d were inserted into the same vector, Cas5d, Cas6d and Cas7d were inserted into the same vector and transfected into HEK293T cells as separate vectors.
  • Cas3d and Cas10d were inserted into the same vector, Cas5d, Cas6d, and Cas7d were inserted into separate vectors and transfected into HEK293T cells as separate vectors. 4; Cas3d and Cas10d were inserted into separate vectors, and Cas5d, Cas6d and Cas7d were inserted into the same vector and transfected into HEK293T cells as separate vectors. 5; An all-in-one vector containing an entire Cas expression cassette. Western blotting results of Cas5d and Cas6d expression levels using different promoters in HEK293T cells.
  • C Control without vector.
  • the distribution image of the deletion mutation is shown in FIG. 6c.
  • a long-chain region deletion mutation ( ⁇ 5235 nt and ⁇ 17902 nt + 87 nt insertion) is shown. Nucleotide positions from PAM are shown on the sequence.
  • the TiD expression vector for plants is shown. Luc reporter assay to determine the target of the SlIAA9 gene.
  • the gRNAs sequences are shown in Table 2. Structure of Cas expression vector cassette in tomato plants.
  • pTiDP1.2 is an all-in-one vector used in slIAA9 mutagenesis.
  • pMGTTiDP20 two Cas cassettes were arranged in the same vector under two promoters and used for slRIN mutagenesis.
  • AtU6-26 crRNA Arabidopsis U6 snRNA-26 promoter and gRNA sequence.
  • P35S CaMV35S promoter.
  • Pubi4 Parsley ubiquitin 4-2 promoter.
  • NptII Kanamycin resistance marker expression cassette.
  • RB Right border sequence of T-DNA.
  • LB Left boundary sequence of T-DNA.
  • Ter Terminator.
  • GFP Green fluorescent protein.
  • Plant genome editing using CRISPR TiD Detection of long-chain region deletion mutations in the SlIAA9 and SlRIN genes induced by CRISPR TiD. The gene structure, gRNA position, and various primer sets for mutation amplification are shown. The PCR amplified fragment separated on the agarose gel is shown. The numbers indicate the primer set.
  • the results of the long region deletion mutation analyzed by Sanger sequencing of cloned DNA derived from CRISPR TiD transgenic tomato callus are shown.
  • Nucleotide positions from PAM are shown on the sequence. Arrows indicate specific bands used for cloning and sequencing. Detection of long-chain region deletion mutations in the SlRIN gene induced by CRISPR TiD in tomato shoots (T0 generation). PCR-amplified fragments isolated on an agarose gel show long-chain region deletion mutations. WT; wild type. 1-12; transgenic shoot line (T0). Long chain region deletions were detected in strains # 4, 5, 6 and 12. The band of the same length as the wild type was a non-specific band. Arrows indicate specific bands. The bands indicated by the arrows were further subjected to sequencing analysis. The red arrow (upper band) indicates fragment 1 and the blue arrow (lower band) indicates fragment 2.
  • WT wild-type sequence.
  • the gRNA target sequence is indicated by a box and the PAM is indicated by a filled box.
  • the sequence frequency in the cloned PCR product is shown to the right of the sequence.
  • Genome editing using CRISPR TiD in commercially available tomato cultivated species.
  • WT wild-type sequence. Box
  • Off-target effect of CRISPR TiD in commercial tomato cultivated varieties is achieved in commercial tomato cultivated varieties.
  • Mi-seq for transgenic T0 shoots of Ailsa Craig (SlIAA9-tid_gRNA1 (+) AC T0s_ # 1, 2, and 4) and wild-type (WT) -derived off-target site cloned PCR products. It was calculated from the number of read counts in the deep amplicon according to.
  • the TiD system used in the present invention includes Cas3d, Cas5d, Cas6d, Cas7d and Cas10d, and TiD crRNA as Cas effector proteins among TiD Cas proteins.
  • Cas5d, Cas6d and Cas7d are known to constitute a target recognition module (Cascade), and Cas3d and Cas10d are known to constitute a polynucleotide cleavage module (Patent Document 1).
  • the TiD crRNA contains a sequence complementary to the target nucleotide sequence. The above five Cas proteins and TiD crRNA form a complex to target and modify the target nucleotide sequence.
  • Cas10d among the components of the cleavage module has a polynucleotide-degrading action (nuclease activity), and Cas3d is a nuclease. It was revealed that it has no activity. That is, in the TiD system, the TiD crRNA and the target recognition module target the target nucleotide sequence, guide the polynucleotide cleavage module to the vicinity of the target nucleotide sequence, and the target nucleotide sequence is cleaved by the action of Cas10d.
  • the present invention is used in a method of modifying a target nucleotide sequence in a target cell by introducing the TiD system into the target cell (hereinafter, also referred to as “the target sequence modification method of the present invention”), and the method.
  • Kit hereinafter, also referred to as “kit of the present invention”.
  • the present invention specifically targets a target sequence and specifically targets the target sequence by designing a target sequence in which a similar sequence containing a mutation at a specific position does not exist with respect to the target nucleotide sequence.
  • methods for modifying hereinafter, referred to as “target sequence targeting method in which the off-target effect of the present invention is suppressed” and “target sequence modification method in which the off-target effect of the present invention is suppressed”).
  • the cell may be either a prokaryotic cell or a eukaryotic cell, and is not particularly limited.
  • bacteria, paleontology, fungi (eg, filamentous fungi, yeast, etc.), plant cells, insect cells, animal cells (eg, human cells, non-human cells, non-mammalian vertebrate cells, invertebrate cells, etc.) Can be mentioned.
  • eukaryotic cells are used.
  • a "cell” is a cell isolated from an organism, a cell present in an organism (eg, in an animal or plant), or an organism (eg, animal, or plant). Includes any of the body).
  • the method of the present invention may be applied to cells isolated from a living body, cells existing in the living body, or cells in the living body. For example, it may be applied to cells existing in the body of a non-human animal or a non-human animal body.
  • Cas effector protein used in the present invention includes Cas3d, Cas5d, Cas6d, Cas7d, and Cas10d among the Cas proteins of TiD.
  • Cas3d, Cas5d, Cas6d, Cas7d, and Cas10d may be derived from any bacteria or archaea, for example, Microcystis aeruginosa, Acetohalobium arabaticum, Ammonifex degensii, Anabaena cylindrica, Anabaena variabilis, Caldicellulosiruptor lactoaceticus, Caldilinea aerophila, Bacteria epipsimmum, Cyanothece Sp.
  • Thermofilum pendens may be derived from a strain such as Thermofilum pendens.
  • the amino acid sequence and nucleotide sequence information of the Cas protein can be obtained from a public database such as NCBI GenBank.
  • NCBI GenBank a public database
  • BLAST program from the microbial genome data obtained by metagenomic analysis or the like, it is possible to acquire sequences from new microbial species.
  • a codon optimized for translation in the host cell into which the nucleic acid is introduced may be selected based on the amino acid sequence information and constructed by chemical synthesis or the like. Protein expression can be increased by using codons that are frequently used in host cells.
  • the nucleic acid include RNA such as mRNA or DNA.
  • the Cas proteins of Cas3d, Cas5d, Cas6d, Cas7d, and Cas10d or the nucleic acids encoding them are used as long as the effects of the present invention are achieved, that is, the complex of the Cas protein and crRNA targets the target sequence.
  • it may have one or more amino acid mutations or one or more nucleotide mutations as long as it is modified.
  • Cas3d SEQ ID NO: 1
  • Cas5d SEQ ID NO: 2
  • Cas6d SEQ ID NO: 3
  • Cas7d derived from Microcystis aeruginosa hereinafter referred to as M. aeruginosa
  • SEQ ID NO: 4 Cas10d
  • SEQ ID NO: 5 Cas10d
  • nucleic acid encoding Cas6d a nucleic acid containing a nucleotide sequence encoding a protein containing an amino acid sequence, a nucleic acid containing a nucleotide sequence encoding a protein containing the amino acid sequence shown in SEQ ID NO: 3 and a nucleic acid encoding Cas7d
  • a nucleic acid containing a nucleotide sequence encoding a protein containing the amino acid sequence shown in SEQ ID NO: 4 and a nucleotide sequence encoding a nucleic acid containing the amino acid sequence shown in SEQ ID NO: 5 as an example of a nucleic acid encoding Cas10d.
  • Nucleic acids contained include.
  • a nucleic acid containing a nucleotide sequence encoding a protein consisting of the amino acid sequence shown in SEQ ID NO: 1 and as an example of a nucleic acid encoding Cas5d, in SEQ ID NO: 2.
  • nucleic acid encoding Cas6d a nucleic acid containing a nucleotide sequence encoding a protein consisting of the indicated amino acid sequence, a nucleic acid containing a nucleotide sequence encoding a protein consisting of the amino acid sequence shown in SEQ ID NO: 3, a nucleic acid encoding Cas7d.
  • nucleic acid containing the nucleotide sequence encoding the protein consisting of the amino acid sequence shown in SEQ ID NO: 4 and as an example of the nucleic acid encoding Cas10d, the nucleotide sequence encoding the protein consisting of the amino acid sequence shown in SEQ ID NO: 5 Nucleic acid containing.
  • nucleic acid encoding Cas3d used in the present invention, a nucleic acid consisting of a nucleotide sequence encoding a protein consisting of the amino acid sequence shown in SEQ ID NO: 1 and a nucleic acid encoding Cas5d, SEQ ID NO: 2
  • a nucleic acid encoding Cas6d a nucleic acid consisting of a nucleotide sequence encoding a protein consisting of the amino acid sequence shown in, Cas7d, a nucleic acid consisting of a nucleotide sequence encoding a protein consisting of the amino acid sequence shown in SEQ ID NO: 3, is encoded.
  • nucleic acid a nucleic acid consisting of a nucleotide sequence encoding a protein consisting of the amino acid sequence shown in SEQ ID NO: 4, and as an example of a nucleic acid encoding Cas10d, a nucleotide encoding a protein consisting of the amino acid sequence shown in SEQ ID NO: 5. Nucleic acids consisting of sequences can be mentioned.
  • nucleic acid encoding the Cas protein used in the present invention 80% or more, preferably 80% or more, respectively, of SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, and SEQ ID NO: 5.
  • nucleic acid encoding the Cas protein used in the present invention 80% or more of each of SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, and SEQ ID NO: 5 is preferable. Consists of an amino acid sequence having a sequence identity of 90% or more, more preferably 95% or more, still more preferably 96% or more, still more preferably 97% or more, still more preferably 98% or more, or even more preferably 99% or more. Nucleic acids that contain a nucleotide sequence that encodes a protein can be mentioned.
  • nucleic acid encoding the Cas protein used in the present invention 80% or more of each of SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4 and SEQ ID NO: 5, respectively. From an amino acid sequence having sequence identity of preferably 90% or more, more preferably 95% or more, still more preferably 96% or more, still more preferably 97% or more, still more preferably 98% or more, or even more preferably 99% or more.
  • the Cas protein expressed from any of the above nucleic acids has the ability to target or modify the target sequence when complexed with the Cas protein and crRNA expressed from the other nucleic acids described above.
  • nucleotide sequence encoding a nuclear localization signal is preferably added to the end of the nucleic acid encoding the Cas protein.
  • the nuclear localization signal sequence is known in the art and can be appropriately selected depending on the species from which the cell to be introduced is derived. For example, a monopartite nuclear localization signal or a bipartite nuclear localization signal (bpNLS) may be used. Examples of monopartite nuclear localization signals include, but are not limited to, those containing the sequence set forth in KKKKRK (SEQ ID NO: 6).
  • examples of the vipertite-type nuclear localization signal include, but are not limited to, those containing the sequence represented by DPKRTADGSEFESPKKKRKVEGT (SEQ ID NO: 7).
  • nuclear localization signal sequences may be arranged in tandem and added to the nucleic acid encoding the Cas protein.
  • two or more, for example, two or three monopartite nuclear localization signal sequences are arranged in tandem and added to the nucleic acid encoding the Cas protein.
  • the nuclear localization signal sequence may be added to the 5'end or 3'end of the nucleic acid encoding the Cas protein, or both the 5'end and the 3'end.
  • At least one DNA selected from the group consisting of DNA encoding Cas3d, DNA encoding Cas5d, DNA encoding Cas6d, and DNA encoding Cas10d is located at the 5'end side.
  • a sequence encoding one monopartite nuclear localization signal may be added, or a sequence encoding a monopartite nuclear localization signal linked in two or three tandems may be added.
  • At least one DNA selected from the group consisting of DNA encoding Cas3d, DNA encoding Cas5d, DNA encoding Cas6d, and DNA encoding Cas10d is 5'terminal and A sequence encoding a vipertite-type nuclear localization signal may be added to both the 3'ends.
  • the DNA encoding Cas7d has a sequence encoding a monopartite nuclear localization signal linked to two or three tandems added to the 5'end and / or 3'end side. You may. These embodiments are preferred for introduction into animal cells.
  • the crRNA comprises one or more structural units (“repeat-spacer-repeat”) consisting of a repeat sequence derived from the CRISPR locus and a spacer sequence sandwiched between the repeat sequences.
  • the repeat sequence preferably comprises a palindrome-like sequence.
  • the crRNA contributes to target recognition of the CRISPR-Cas system by including an RNA sequence that binds to the target nucleotide sequence as a spacer sequence (ie, a protospacer sequence).
  • An RNA molecule containing a structure consisting of a repeat sequence of crRNA and a protospacer sequence sandwiched between the repeat sequences is also called a guide RNA (gRNA).
  • the crRNA is processed by the action of the Cas effector protein and its repeat sequence is cleaved to become a mature crRNA consisting of a partial sequence of the repeat sequence and a protospacer sequence sandwiched between the partial sequences of the repeat sequence.
  • the crRNA before it is processed is called a pre-mature crRNA.
  • the crRNA used in the present invention contains a repeat sequence derived from the CRISPR type ID locus and a sequence forming a base pair with the target nucleotide sequence as a protospacer sequence sandwiched between the repeat sequences.
  • the crRNA used in the present invention is preferably a pre-mature crRNA.
  • the pre-mature crRNA is processed by Cas6d before being incorporated into Cascade (complex of Cas5d, Cas6d, and Cas7d) to become a mature crRNA. If the pre-mature crRNA contains two or more "repeat-spacer-repeat" structural units, the pre-mature crRNA may contain two or more protospacer sequences. Premature crRNAs containing two or more protospacer sequences yield two or more mature crRNAs, which are then individually incorporated into Cascade.
  • the protospacer sequence contained in crRNA is a sequence that forms a base pair with the target nucleotide sequence.
  • the "sequence forming a base pair with a target nucleotide sequence” is, for example, a sequence complementary to an RNA sequence target nucleotide sequence or a sequence substantially complementary to an RNA sequence target nucleotide sequence.
  • substantially complementary includes sequences that are not completely complementary to the target sequence but can bind to the target sequence (base pair with the target sequence).
  • RNA sequences Substantially complementary sequences to target nucleotide sequences may contain mismatches to sequence target sequences as long as they base pair with the target sequence.
  • the repeat sequence portion of crRNA may have at least one hairpin structure.
  • the repeat sequence portion on the 5'end side of the protospacer sequence may have a hairpin structure
  • the repeat sequence portion on the 3'end side of the protospacer sequence may be single-strand.
  • crRNA preferably has one hairpin structure.
  • the repeat sequence derived from the CRISPR type ID locus can be found from the crRNA gene sequence region adjacent to the type ID gene group by using a tandem repeat search program.
  • the repeat sequence from the Type ID locus may be from any bacterium or archaea, eg, from the bacteria and archaea exemplified for the Cas effector protein described above. ..
  • the base length of the repeat sequence contained in crRNA is not particularly limited as long as the purpose of targeting the target nucleotide sequence by interacting with Cascade is achieved.
  • the repeat sequences before and after the protospacer sequence may each be about 10 to 70 bases long, for example, about 30 to 50 bases long, preferably about 35 to 45 bases long. May be good.
  • the crRNA used in the present invention can contain a protospacer sequence having a length of about 10 to 70 bases.
  • the protospacer sequence contained in the crRNA is preferably a sequence consisting of 20 to 50 bases, more preferably 25 to 45 bases, and further preferably a sequence consisting of 30 to 40 bases, for example, 31 bases and 32 bases. It is a sequence consisting of 33 bases, 34 bases, 35 bases, 36 bases, 37 bases, 38 bases, or 39 bases.
  • the longer the targetable sequence the greater the sequence specificity of target recognition by crRNA.
  • the longer the targetable sequence the higher the Tm value of the base pair formed between the crRNA and the target sequence, and the more stable the target recognition.
  • the length of the sequence that crRNA can target is about 20 to 24 bases, so in the present invention, the sequence is more specific than the conventional method. Excellent in sex and stability.
  • crRNA used in the present invention examples include those containing a repeat sequence of crRNA derived from aeruginosa.
  • a premature cRNA comprising a sequence represented by GUUCCAAUUAAUCUUAAGCCCUAUUAGGGAUUGAAACNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGUUCCAAUUAAUCUUAAGCCCUAUUAGGGAUUGAAAC (SEQ ID NO: 8; N is any nucleotide that constitutes a sequence that forms a base pair with the target nucleotide sequence).
  • the number of N may be changed in the range of 10 to 70, preferably 20 to 50, more preferably 25 to 45, and further preferably 30 to 40.
  • the crRNA may be introduced into cells as RNA or as DNA encoding crRNA.
  • the DNA encoding crRNA may be contained, for example, in a vector or expression cassette, and the DNA sequence is preferably operably linked to regulatory sequences such as promoters and terminators.
  • the vector and the regulatory sequence can be appropriately selected by those skilled in the art based on, for example, a host cell or the like.
  • a pol III promoter eg, SNR6, SNR52, SCR1, RPR1, U6, H1 promoter, etc.
  • a pol II promoter eg, a terminator (eg, T6 sequence), or a human U6 snRNA promoter.
  • the DNA encoding the crRNA may be contained in the same vector or in the same expression cassette as any of the DNA encoding the five Cas proteins, or is separate from any of the DNAs encoding the five Cas proteins. It may be contained in the vector of the above or in another expression cassette.
  • the target nucleotide sequence (also simply referred to as “target sequence” in the present specification) is a sequence of an arbitrary nucleic acid and is located in the vicinity of the protospacer proximity motif (PAM) of the TiD system. It is not particularly limited except that the located sequence is selected as the target sequence.
  • the target nucleotide sequence may be either a double-stranded DNA sequence, a single-stranded DNA sequence, or an RNA sequence. Examples of DNA include eukaryotic nuclear genomic DNA, mitochondrial DNA, plastide DNA, prokaryotic genomic DNA, phage DNA, plasmid DNA and the like.
  • the target nucleotide sequence is preferably a sequence on genomic DNA. Therefore, in the sense strand of the target nucleic acid, a sequence located near the PAM sequence, preferably a sequence located near the 3'downstream of the PAM sequence, and more preferably a sequence adjacent to the 3'downstream of the PAM sequence. Is selected as the target nucleotide sequence. Further, in the antisense strand of the target nucleic acid, the target nucleotide sequence is a sequence located near the PAM sequence, preferably a sequence located near the 5'side of the PAM sequence, and more preferably adjacent to the 5'side of the PAM sequence. It is selected from the array to be used.
  • located in the vicinity includes both being adjacent and being close to each other. Also, as used herein, the term “neighborhood” includes both adjacent and near positions. In addition, in this specification, unless otherwise specified, it is described based on the sense strand of nucleic acid.
  • the target nucleotide sequence may be a sequence located in the vicinity of the PAM sequence and existing in the intron, coding region, non-coding region, or control region of the target gene.
  • the target gene is an arbitrary gene and may be arbitrarily selected.
  • the length of the target nucleotide sequence is, for example, in the range of 10 to 70 bases, preferably 20 to 50 bases, more preferably 25 to 45 bases, and even more preferably 30 to 40 bases.
  • Target sequence modification method of the present invention a vector system or an expression cassette system containing DNA encoding the above five Cas proteins and a crRNA or DNA encoding crRNA are used in the above cells. It is characterized by being introduced inside.
  • the target sequence modification method of the present invention comprises specifically cleaving the target nucleotide sequence in the cell by the TiD system.
  • the target sequence modification method of the present invention may be carried out in vitro or in vivo.
  • modifications include deletion, insertion, or substitution of at least one nucleotide, or a combination thereof.
  • the DNA encoding the Cas protein is included in a vector system or an expression cassette system.
  • vector system and “expression cassette system” refer to a group containing two or more vectors (that is, a group containing a first vector and a second vector) and two or more expression cassettes, respectively. It means a group containing (that is, a group containing a first expression cassette and a second expression cassette).
  • the vector is an expression vector for carrying a DNA encoding a target protein into a target cell and expressing the target protein in the cell.
  • the expression cassette means a nucleic acid molecule that directs transcription of the DNA encoding the target protein and enables expression of the target protein.
  • the expression cassette may be included in the vector.
  • vector various vectors generally used in the art can be used, and the vector is not particularly limited and can be appropriately selected depending on the cell to be introduced or the method of introduction.
  • plasmid vectors viral vectors, retroviral vectors, phages, phagemids, cosmids, artificial / minichromas, transposons and the like can be mentioned.
  • the vector or expression cassette contains a regulatory element for regulating transcription of the DNA, and the DNA sequence is operably linked to the regulatory element.
  • Regulatory elements for regulating transcription include, for example, promoters, enhancers, terminators, internal ribosome entry sites (IRESs), polyadenylation signals, poly U sequences and the like.
  • the vector or expression cassette preferably comprises a promoter.
  • the vector or expression cassette may further contain other regulatory elements. Other adjusting elements include, for example, translation enhancers and the like.
  • the regulatory element is not particularly limited and can be appropriately selected by those skilled in the art based on, for example, a host cell or the like.
  • the promoter when the host is a plant cell, the promoter includes CaMV35S promoter, 2xCaMV35S promoter, CaMV19S promoter, NOS promoter and the like, and when the host is an animal cell, SR ⁇ promoter, SV40 promoter, LTR promoter, CMV promoter, RSV. Examples thereof include a promoter, MoMuLV LTR promoter, HSV-TS promoter, human translation elongation factor gene promoter, CAG chimeric synthesis promoter and the like.
  • the human translation elongation factor gene promoter, or CAG chimeric synthesis promoter is preferably used to introduce the DNA encoding the Cas protein into animal cells.
  • the vector system or expression cassette system includes a DNA encoding Cas3d, a DNA encoding Cas5d, a DNA encoding Cas6d, a DNA encoding Cas7d, and a DNA encoding Cas10d, wherein the first vector or expression cassette system is included.
  • the first expression cassette contains at least one DNA selected from the group consisting of DNA encoding Cas3d, DNA encoding Cas5d, DNA encoding Cas6d, DNA encoding Cas7d, and DNA encoding Cas10d.
  • the second vector or the second expression cassette is composed of a group consisting of a DNA encoding Cas3d, a DNA encoding Cas5d, a DNA encoding Cas6d, a DNA encoding Cas7d, and a DNA encoding Cas10d. Contains at least one DNA of choice.
  • Two or more or all of the DNA encoding the above five Cas proteins Cas3d, Cas5d, Cas6d, Cas7d and Cas10d may be contained in a single vector or expression cassette, or contained in separate vectors or expression cassettes. It may be. There are no restrictions on the number of vectors or expression cassettes, and the type and combination of Cas proteins encoded by the DNA incorporated into each vector or expression cassette.
  • these DNA sequences are mutually expressed so as to be polycistronically expressed, for example, via a sequence encoding a self-cleaving peptide. It may be connected to.
  • the order in which the two or more DNAs encoding the Cas protein are linked may be any order.
  • the second vector or the second expression cassette is a DNA encoding Cas3d, a DNA encoding Cas5d, a DNA encoding Cas6d, a DNA encoding Cas7d, and Cas10d. At least one DNA selected from the group consisting of DNAs encoding the above, including DNA not contained in the first vector or first expression cassette.
  • the vector system or expression cassette system may include a first to fifth vector or expression cassette, and encodes a DNA encoding Cas3d, a DNA encoding Cas5d, a DNA encoding Cas6d, and Cas7d.
  • the DNA and the DNA encoding Cas10d may be contained in separate vectors or expression cassettes.
  • the vector system comprises a first to fifth vector, a DNA encoding Cas3d, a DNA encoding Cas5d, a DNA encoding Cas6d, a DNA encoding Cas7d, and a DNA encoding Cas10d. May be contained in the above vectors separately. Such an embodiment is preferably used for introducing the DNA encoding the Cas protein into animal cells.
  • the first vector or expression cassette contains a DNA encoding Cas3d and a DNA encoding Cas6d
  • the second vector or expression cassette is a DNA encoding Cas5d, Cas7d.
  • the DNA encoding Cas10d and the DNA encoding Cas10d may be included.
  • the first expression cassette comprises DNA encoding Cas3d and DNA encoding Cas6d
  • the second expression cassette contains DNA encoding Cas5d, DNA encoding Cas7d, and Cas10d.
  • the DNA to be encoded may be contained, and the first expression cassette and the second expression cassette may be loaded in one vector.
  • Such an embodiment is preferably used for introducing the DNA encoding the Cas protein into plant cells.
  • a donor polynucleotide may be introduced into cells in addition to the vector system or expression cassette system containing the DNA encoding the Cas protein and the DNA encoding crRNA or crRNA.
  • the donor polynucleotide comprises at least one donor sequence containing the modification desired to be introduced at the target site.
  • the donor polynucleotide has a sequence that is highly homologous to the sequences upstream and downstream of the target sequence at both ends of the donor sequence (preferably, a sequence that is substantially identical to the sequences upstream and downstream of the target sequence. ) May be included.
  • the donor polynucleotide may be single-stranded or double-stranded DNA. Donor polynucleotides can be appropriately designed by those skilled in the art based on techniques known in the art.
  • cleavage in the target nucleotide sequence can be repaired by non-homologous end binding (NHEJ).
  • NHEJ non-homologous end binding
  • deletions, insertions, or substitutions of at least one nucleotide, or combinations thereof, can occur during repair of the cleavage.
  • the sequence is modified at the target sequence site, thereby inducing a frameshift or immature stop codon, inactivating or knocking out the expression of the gene encoded by the target sequence region.
  • the donor sequence of the donor polynucleotide is inserted into or inserted into the target sequence site by homologous recombination repair (HDR) of the cleaved target nucleotide sequence.
  • HDR homologous recombination repair
  • the vector system or expression cassette system containing the DNA encoding the Cas protein and the crRNA or the DNA encoding the crRNA can be introduced into cells by various means known in the art.
  • the donor polynucleotide may also be introduced into the cell by various means known in the art.
  • transfection for example, calcium phosphate-mediated transfection, electroporation, liposome transfection, etc., virus transduction, lipofection, gene gun, microinjection, Agrobacterium method, agroinfiltration method, PEG-calcium method, etc. Can be mentioned.
  • the vector system or expression cassette system containing the DNA encoding the Cas protein, and the crRNA or the DNA encoding the crRNA may be introduced into the cell simultaneously or continuously.
  • two or more vectors or expression cassettes contained in the above vector system or expression cassette system may be introduced into cells simultaneously or continuously.
  • the donor polynucleotide may be introduced into the cell simultaneously or continuously with the vector system or expression cassette system containing the DNA encoding the Cas protein and the DNA encoding crRNA or crRNA.
  • the cells Upon introduction of the vector system or expression cassette system containing the DNA encoding the Cas protein and the crRNA or the DNA encoding the crRNA into the cells, the cells are cultured under conditions suitable for cleavage at the target sequence site. Will be done. The cells are then cultured under conditions suitable for cell proliferation and maintenance. The same applies when introducing a donor polynucleotide.
  • the culture conditions may be any culture conditions suitable for the species from which the cells to be introduced are derived, and can be appropriately determined by those skilled in the art based on, for example, known cell culture techniques.
  • the site on the target nucleotide sequence is cleaved by the TiD system introduced into the cell, and the target sequence is modified when the cleaved sequence is repaired.
  • the method for modifying a target sequence of the present invention can be used for modifying a target nucleotide sequence on the genome, in which the double-stranded DNA on the genome is cleaved and the target site is modified.
  • the expression of the target gene can be suppressed by selecting at least a part of the sequence of the target gene as the target nucleotide sequence.
  • a method of suppressing the expression of a target gene in a cell which is used in the cell.
  • the vector system comprises a first vector and a second vector.
  • the expression cassette system includes a first expression cassette and a second expression cassette.
  • the first vector or the first expression cassette is selected from the group consisting of DNA encoding Cas3d, DNA encoding Cas5d, DNA encoding Cas6d, DNA encoding Cas7d, and DNA encoding Cas10d.
  • a method is provided in which the second vector or the second expression cassette comprises at least one DNA selected from the group and a second regulatory element that regulates transcription of the DNA.
  • the DNA encoding the above five Cas proteins is present in a vector system or an expression cassette system, that is, in two or more vectors or expression cassettes.
  • the Cas protein acts with the simultaneously introduced crRNA to specifically and efficiently modify the target nucleotide sequence.
  • the target sequence modification method of the present invention is a vector system or expression cassette system containing the above-mentioned first vector or expression cassette and a second vector or expression cassette, the second vector or expression cassette system.
  • the second expression cassette is at least one DNA selected from the group consisting of a DNA encoding Cas3d, a DNA encoding Cas5d, a DNA encoding Cas6d, a DNA encoding Cas7d, and a DNA encoding Cas10d.
  • a vector system or an expression cassette system containing DNA not contained in the first vector or the first expression cassette is used.
  • At least one DNA selected from the group consisting of a DNA encoding Cas3d, a DNA encoding Cas5d, a DNA encoding Cas6d, a DNA encoding Cas7d, and a DNA encoding Cas10d is the first DNA. It may be contained in both one vector or the first expression cassette and the second vector or the second expression cassette. As described above, when five DNAs encoding Cas3d, Cas5d, Cas6d, Cas7d and Cas10d are separately contained in two or more different vectors or expression cassettes, the TiD utilizing the vector or expression cassette is contained in the cell. It leads to higher levels of expression of Cas protein, resulting in a stronger target sequence modification effect.
  • the target sequence modification method of the present invention is preferably a vector system containing five vectors, in which the DNAs encoding the above five Cas proteins are contained in different vectors.
  • the vector comprises a human translational elongation factor gene promoter or a CAG chimeric synthesis promoter.
  • one monopartite nuclear localization is performed on the 5'terminal side of the DNA encoding Cas3d, the DNA encoding Cas5d, the DNA encoding Cas6d, and the DNA encoding Cas10d.
  • a sequence encoding a signal has been added, or a sequence encoding a monopartite nuclear localization signal linked in two or three tandems has been added.
  • a sequence encoding a monopartite nuclear localization signal linked in two or three tandems has been added.
  • both the 5'-terminal side and the 3'-terminal side of the DNA encoding Cas3d, the DNA encoding Cas5d, the DNA encoding Cas6d, and the DNA encoding Cas10d are A sequence encoding a vipertite-type nuclear localization signal has been added.
  • a sequence encoding a monopartite nuclear localization signal linked to two or three tandems is located on the 5'end and / or 3'end side of the DNA encoding Cas7d. It has been added.
  • the expression cassette system contains two expression cassettes, and the DNA encoding Cas3d and the DNA encoding Cas6d are contained in the first expression cassette, and the DNA encoding Cas5d.
  • the DNA encoding Cas7d and the DNA encoding Cas10d are included in the second expression cassette, and the first and second expression cassettes are loaded in one vector.
  • the target sequence modification method of the present invention not only the insertion and / or deletion of a short chain region of several bases to several tens of bases is introduced into the target sequence, but also a long chain of several kilobases to several tens of kilobases is introduced. Base deletions in the region can also be introduced.
  • the number of kilobases to several tens of kilobases is not limited, but is, for example, 1000 to 90,000 base length, preferably 2000 to 80,000 base length, more preferably 2000 to 70,000 base length, and further preferably 2000 to 60,000 base length. , 2000 to 50,000 base lengths, 2000 to 40,000 base lengths, 2000 to 30,000 base lengths, or 2000 to 20000 base lengths.
  • Deletions that are too long can result in deletions of non-intended sequences of the target gene (eg, sequences of other adjacent genes) or deletions of the required exon sequence adjacent as well as the target exon region.
  • the deletion is in a moderately long region of "several kilobases to several tens of kilobases" as in the present invention, only the long chain deletion of the gene of interest should be introduced. Can be done. Therefore, using the target sequence modification method of the present invention, it is possible to delete an entire locus by designing one guide RNA.
  • the target sequence modification method of the present invention it is possible to completely eliminate a specific exon even in the presence of a long intron such as an animal gene.
  • the target sequence modification method of the present invention it is possible to collectively delete a group of genes existing adjacent to each other.
  • the target sequence modification method of the present invention it is possible to result in base deletion in the upstream or downstream direction of the PAM sequence, or both upstream and downstream (that is, bidirectional) of the PAM sequence.
  • Kit of the present invention is a kit for use in the above-mentioned method for modifying a target sequence of the present invention, and is a vector system or an expression cassette system containing DNA encoding the above five Cas proteins. And the above crRNA or the DNA encoding the above crRNA.
  • the components of the kit of the present invention are as described in (2) to (5) above.
  • Target sequence targeting method in which the off-target effect of the present invention is suppressed is the above-mentioned target recognition module (Cas5d, Cas6d and Cas7d) or a nucleic acid encoding the Cas protein. And the introduction of the crRNA or the DNA encoding the crRNA into the cells, and from the bases 1, 6, 12, 18, and 24 from the 3'side of the PAM sequence with respect to the target sequence.
  • the target sequence is designed (or selected) so that there is no one base selected from the group, or a similar sequence in which one or two bases after the 24th base are different.
  • the target sequence is relatively short (eg, 30 bases or less), any one base selected from the group consisting of the 6, 12, 18 and 24th bases from the 3'side of the PAM sequence, or 24
  • the target sequence may be designed (or selected) so that there are no similar sequences in which one or two bases after the second are different.
  • the target sequence targeting method in which the off-target effect of the present invention is suppressed may be performed by either in vitro or in vivo.
  • crRNA, the target recognition module and crRNA form a complex, and at the same time, the crRNA forms a base pair with the target nucleotide sequence, and the target recognition module forms a base pair with the target nucleotide sequence.
  • the target nucleotide sequence is targeted in a sequence-specific manner.
  • the target recognition module may be introduced into the cell as an isolated complex containing Cas5d, Cas6d, and Cas7d, or each of Cas5d, Cas6d, and Cas7d alone in the cell as an isolated protein. May be introduced in.
  • the target recognition module may be introduced into cells as nucleic acids encoding the Cas proteins Cas5d, Cas6d, and Cas7d. Examples of the nucleic acid include RNA such as mRNA or DNA.
  • the DNA encoding the Cas protein may be contained, for example, in one or more vectors or expression cassettes, the DNA sequence being preferably operably linked to a regulatory element.
  • a nuclear localization signal sequence is preferably added to the DNA encoding the Cas protein.
  • Two or more or all of the DNAs encoding the Cas proteins Cas5d, Cas6d, and Cas7d may be contained in a single vector or expression cassette, or may be contained in separate vectors or expression cassettes. ..
  • DNA sequences encoding the Cas protein are contained in one vector or expression cassette, these DNA sequences are arranged so as to be polycistronically expressed, for example, via a sequence encoding a self-cleaving peptide. And may be interconnected.
  • the order in which the two or more DNAs encoding the Cas protein are linked may be any order.
  • the vector, expression cassette, regulatory element, nuclear localization signal sequence, etc. are as described in (5) above.
  • the crRNA is as described in (3) above.
  • the target recognition module and crRNA or DNA encoding crRNA can be introduced into cells by various means known in the art.
  • transfection for example, calcium phosphate-mediated transfection, electroporation, liposome transfection, etc., virus transduction, lipofection, gene gun, microinjection, Agrobacterium method, agroinfiltration method, PEG-calcium method, etc. Can be mentioned.
  • the target recognition module and the crRNA or the DNA encoding crRNA may be introduced into the cell simultaneously or continuously.
  • Cas5d, Cas6d, and Cas7d constituting the target recognition module, or nucleic acids encoding each of these Cas proteins may be introduced into cells simultaneously or continuously.
  • the Cas proteins Cas5d, Cas6d and Cas7d synthesized in in vitro or in vivo, respectively, and crRNA synthesized in in vitro or in vivo are incubated in in vitro to form a complex.
  • the complex can be introduced into the cell.
  • the cells Upon introduction of the target recognition module and the crRNA or DNA encoding the crRNA, the cells are cultured under conditions suitable for targeting the target nucleotide sequence. The cells are then cultured under conditions suitable for cell proliferation and maintenance.
  • the culture conditions may be any culture conditions suitable for the species from which the cells are derived, and can be appropriately determined by those skilled in the art based on, for example, known cell culture techniques.
  • Target sequence modification method that suppresses the off-target effect of the present invention comprises the above five Cas proteins or nucleic acids encoding the proteins, and the above crRNA or crRNA. Which of the following is selected from the group consisting of the 1, 6, 12, 18 and 24th bases from the 3'side of the PAM sequence with respect to the target sequence, which comprises introducing the DNA encoding the above into the cell. It is characterized in that the target sequence is designed (or selected) so that there is no similar sequence in which one base or one or two bases after the 24th base are different.
  • the target sequence is relatively short (eg, 30 bases or less), any one base selected from the group consisting of the 6, 12, 18 and 24th bases from the 3'side of the PAM sequence, or 24
  • the target sequence may be designed (or selected) so that there are no similar sequences in which one or two bases after the second are different.
  • modifications include deletion, insertion, or substitution of at least one nucleotide, or a combination thereof.
  • the target sequence modification method that suppresses the off-target effect of the present invention may be carried out by either in vitro or in vivo.
  • a donor polynucleotide may be introduced into cells in addition to the Cas protein and crRNA described above.
  • the donor polynucleotide is as described in (5) above.
  • the Cas protein may be introduced into cells as an isolated complex containing Cas5d, Cas6d, Cas7d, Cas3d, and Cas10d, or Cas5d, Cas6d, Cas7d, Cas3d, and Cas10d are each isolated. It may be introduced into cells alone as a protein. Alternatively, it may be introduced into cells as a nucleic acid encoding the Cas proteins Cas5d, Cas6d, Cas7d, Cas3d, and Cas10d. Examples of the nucleic acid include RNA such as mRNA or DNA.
  • the DNA encoding the Cas protein may be contained, for example, in one or more vectors or expression cassettes, the DNA sequence being preferably operably linked to a regulatory element.
  • a nuclear localization signal sequence is preferably added to the DNA encoding the Cas protein.
  • Two or more or all of the DNA encoding the Cas proteins Cas3d, Cas5d, Cas6d, Cas7d, and Cas10d may be contained in a single vector or expression cassette, or may be contained in separate vectors or expression cassettes. You may be.
  • DNA sequences encoding the Cas protein are contained in one vector or expression cassette, these DNA sequences are arranged so as to be polycistronically expressed, for example, via a sequence encoding a self-cleaving peptide. And may be interconnected.
  • the order in which the two or more DNAs encoding the Cas protein are linked may be any order.
  • the vector, expression cassette, regulatory element, nuclear localization signal sequence, etc. are as described in (5) above.
  • the crRNA is as described in (3) above.
  • the introduction of the Cas protein or the nucleic acid encoding the Cas protein, the crRNA or the DNA encoding the crRNA, and the donor polynucleotide into the cell can be performed by various means known in the art.
  • transfection for example, calcium phosphate-mediated transfection, electroporation, liposome transfection, etc., virus transduction, lipofection, gene gun, microinjection, Agrobacterium method, agroinfiltration method, PEG-calcium method, etc.
  • transfection for example, calcium phosphate-mediated transfection, electroporation, liposome transfection, etc.
  • virus transduction lipofection
  • gene gun microinjection
  • Agrobacterium method agroinfiltration method
  • PEG-calcium method etc.
  • the Cas protein or the nucleic acid encoding the Cas protein, the crRNA or the DNA encoding the crRNA, and the donor polynucleotide may be introduced into the cell simultaneously or continuously.
  • Cas3d, Cas5d, Cas6d, Cas7d, and Cas10d, which constitute the RNA-inducible endonuclease, or nucleic acids encoding each of these Cas proteins may be introduced into cells simultaneously or continuously.
  • the cells Upon introduction of the Cas protein or the nucleic acid encoding the Cas protein and the crRNA or the DNA encoding the crRNA, or the Cas protein or the nucleic acid encoding the Cas protein, the crRNA or the DNA encoding the crRNA, and the donor polynucleotide, the cells , Cultivated under conditions suitable for cleavage at the target sequence site. The cells are then cultured under conditions suitable for cell proliferation and maintenance.
  • the culture conditions may be any culture conditions suitable for the species from which the cells are derived, and can be appropriately determined by those skilled in the art based on, for example, known cell culture techniques.
  • M.I Genes derived from the TiD locus derived from aeruginosa (Cas3d, Cas5d, Cas6d, Cas7d, Cas10d) were cloned and used. M. Based on the amino acid sequence information (SEQ ID NOs: 1 to 5) of Cas3d, Cas5d, Cas6d, Cas7d, and Cas10d derived from aeruginosa, a DNA sequence encoding each Cas protein was artificially synthesized. For the processing and construction operation of the DNA sequence in the examples, any one of artificial gene chemical synthesis, PCR method, restriction enzyme treatment, ligation, and Gibson Assembly method was used. In addition, the Sanger method or the next-generation sequencing method was used to determine the base sequence.
  • the HA-tag was added to Cas3d
  • the Strep-tag was added to Cas5d
  • the Myc-tag was added to Cas6d
  • the FLAG-tag was added to Cas7d
  • the 6xHis-tag was added to Cas10d.
  • all Cas genes were combined in the all-in-one vector pEFs-All by fusion with a sequence encoding a 2A self-cleaving peptide.
  • a pEFs_Cas3d-Cas10d expression vector and a pEFs_Cas6d-Cas5d-Cas7d expression vector (two-set vector) were also constructed by linking to a 2A self-cleaving peptide.
  • the Cas10d gene fragment in the pEFs-Myc-bpNLS-Cas10d-bpNLS-6xHis vector was replaced with the Cas3d, Cas5d, Cas6d and Cas7d gene fragments, respectively, to replace pEFs-Myc-bpNLS-Cas3d-bpNLs-Cas3d-bpNLS-6xH -Cas5d-bpNLS-6xHis, pEFs-Myc-bpNLS-Cas7d-bpNLS-6xHis, and pEFs-Myc-bpNLS-Cas10d-bpNLS-6xHis were obtained.
  • H177A a mutant Cas10d (H177A) expression vector
  • a dCas10d (H177A) fragment was synthesized (IDT) and the wild-type Cas10d fragment pEFs-Myc-bpNLS-Cas10d-bpNLS-6xHis was replaced with dCas10d (H177A).
  • pEFs-myc-bpNLS-Cas (H177A) -bpNLS-6xHis was obtained.
  • the Myc-bpNLS-Cas7d-bpNLS-6xHis fragment in pEFs-Myc-bpNLS-Cas7d-bpNLS was replaced with a 6xHis-myc-Cas7d-bpNLS fragment to obtain pEFs-6xHis-MycCbpN.
  • a DNA fragment containing the repeat-spacer-repeat sequence (SEQ ID NO: 9) was artificially synthesized and cloned under the human U6 promoter in pEX-A2J1 (Eurofins Genomics) to obtain pAEX-hU6 crRNA. Obtained.
  • pAEX-hU6crRNA_mature the two repeat sequences were replaced with predicted processed repeat sequences (SEQ ID NO: 10).
  • two oligonucleotides containing the target sequence were annealed and cloned into a crRNA expression vector using a Golden Gate cloning with the restriction enzyme BsaI (NEB).
  • NLUxxUC_Block1 includes first 351bp and the multiple cloning site of NanoLUC TM (TM) gene (Promega Corp.) sequence. The XbaI site was added to the 5'end of the NanoLUC gene.
  • NLUxxUC_Block2 contains 465 bp at the 3'end of the NanoLUC gene. The XhoI site was added to the 3'end of the NanoLUC gene.
  • Each split-type NLUxxUC reporter was constructed by removing NLUxxUC_Block1 from the pCAG-NLUxxUC vector by XbaI and BamHI digestion and NLUxxUC_Block2 by XbaI and EcoRI digestion. Each digestion vector was assembled with a multicloning site to give pCAG-NLUxxUC_Block1 and pCAG-NLUxxUC_Block2.
  • a DNA fragment containing a repeat-spacer-repeat sequence was cloned under the Arabidopsis U6-26 snRNA promoter in pDONR P3-P2 to obtain pE (L3-L2) AtU6 crRNA. ..
  • the AtU6 promoter-repeat-spacer-repeat fragment in pE (L3-L2) AtU6crRNA was recloned into pEgP1.2-TiD to give pTiDP1.2.
  • intermediate vectors pE (L1-L4) P1.2-Cas3d-Cas6d-GFP and pE (R4-R3) Ppubi4-Cas10d-Cas5d-Cas7d for multisite gatorway assembly were constructed. ..
  • the Cas3d, Cas6d and GFP gene fragments driven by the 2xCaMV35S promoter, and the Arabidopsis HSP18.2 gene terminator were cloned into pDONR P1-P4 to give pE (L1-L4) P1.2-Cas3d-Cas6d-GFP. ..
  • the terminator was cloned into pDONR P4r-P3r to give pE (R4-R3) Ppubi4-Cas10d-Cas5d-Cas7d.
  • the Cas protein was eluted in a buffer (20 mM HEPES pH 7.5, 150 mM KCl, 1 mM DTT, 10% glycerol).
  • the nuclease reaction was performed in buffers [10 mM HEPES pH 7.5, 75 mM KCl, 0.5 mM DTT, 5% glycerol, 2 mM ATP, 100 ⁇ M NiCl 2 , 100 ⁇ M CoCl 2 , 1xCut Smart Buffer (New England Biolabs Japan, 4N, manufactured by New England Biolabs Japan). 0.75 ⁇ M Cas protein] at 37 ° C. for 30 minutes, 1 hour and 2 hours.
  • Chloroform was added to stop the reaction, and then chloroform extraction was performed.
  • the aqueous phase was separated, mixed with a gel loading die Purple (6X) (NEB) and then subjected to electrophoresis on a 1% agarose gel. DNA was visualized by staining with GelRed® Nucleic Acid Gel Stein (Biotium, USA). The experiment was independently repeated 3 times with similar results.
  • HEK293T cells were seeded on 96-well plates (Corning) at a density of 2.0x10 4 cells / well. Cells were transfected using TurboFect Transmission Regent (Thermo Fisher Scientific) according to the manufacturer's recommended protocol. For each well of the 96-well plate, (1) the pGL4.53 vector (Promega, USA) encoding the Fluc gene, (2) the pCAG-nLUxxUC vector with the target DNA fragment inserted, and (3) the TiD component were encoded. A total of 200 ng of plasmid DNA containing the plasmid DNA was used.
  • NanoLuc and Fluc luciferase activity was measured 3 days after transfection using the Nano-Glo® Dual-Luciferase® Reporter Assay System (Promega). Firefly (Fluc) activity was used as an internal control. The NanoLuc / Fluc ratio was calculated for each sample and compared to the NanoLuc / Fluc ratio of control samples transfected with untargeted gRNA. Relative NanoLuc / Fluc activity was used to assess gRNA activity. The experiment was independently repeated 3 times with similar results.
  • the extracted protein was quantified using PierceTM BCA Protein Assay Kit (Thermo Fisher Scientific). Samples were mixed with 4x Laemmli Sample buffer (Bio-Rad, USA) and 2.5% ⁇ -mercaptoethanol and then heat treated at 95 ° C. for 5 minutes. The denatured protein was loaded onto a 12% SDS-PAGE gel containing Tris-Glycine-SDS buffer [0.25M Tris, 1.92M glycine, 1% (w / v) SDS] and SDS-PAGE at 150V for 60 minutes. Separated by.
  • the protein was transferred onto an Immuno-P polyvinylidene fluoride (PVDF) membrane (Millipore, USA) at 50 V for 2 hours in a Tris-glycine-SDS buffer containing 20% methanol.
  • the blot was washed 3 times in 5 minutes with TTBS (25 mM Tris, 137 nM NaCl, 2.68 nM KCl) and blocked in Blocking One (Nacalai Tesque, Japan) for 60 minutes at room temperature.
  • the primary antibody reaction was carried out at room temperature for 60 minutes.
  • Anti-DDDDDK-tag mAb (1: 10,000) (MBL, Japan), anti-HA-tag mAb (1: 10,000) (MBL), anti-His-tag mAb (1: 10,000) ( MBL), anti-Myc-tag mAb (1: 10,000) (MBL), anti-Strept-tag mAb (1: 1000) (MBL), anti- ⁇ -actin mAb (1: 10000) (MBL).
  • the experiment was independently repeated 3 times with similar results.
  • Protein extraction was performed 48 hours after transfection according to the protocol described in Katoh et al., (2015) J. Cell Sci., 128, 2351-2362. Simply put, the medium is a lysis buffer (20 mM HEPES, 150 mM NaCl, 0.1% on) containing Protease Inhibitor Cocktail for Use with Mammalian Cell and Tissue Extracts (Nacalai Tesque). It was replaced with (w / v) glycerol) and incubated on ice for 5 minutes. Cell lysates were mixed by pipetting, transferred to 1.5 ml tubes and then incubated on ice for 15 minutes.
  • a lysis buffer (20 mM HEPES, 150 mM NaCl, 0.1% on) containing Protease Inhibitor Cocktail for Use with Mammalian Cell and Tissue Extracts (Nacalai Tesque). It was replaced with (w / v) glycerol) and incubated on ice for 5 minutes. Cell lysates were mixed by
  • Plant transformation Tomato plant (Solanum lycopersicum L.) cv. Micro-Tom and Ailsa Craig were used in site-specific mutagenesis experiments. The plants were grown in a growing chamber at 24 ° C. for 16 hours 4000-6000 lx irradiation / 8 hours dark conditions.
  • Transgenic tomato plants were prepared using a TiD vector for plants. Leaf discs derived from tomato cotyledons were transformed with the Agrobacterium tumefaciens GV2260 strain carrying the TiD vector. Transgenic callus and shoots were selected and regenerated according to the method of Ueta et al. (Supra) on MS medium containing 100 ⁇ g / mL kanamycin.
  • DNA Deletion Analysis by Long Range PCR In order to detect DNA deletion in HEK293T cells, long-chain DNA region PCR and a pool of long-chain DNA region PCR products were cloned. First, genomic DNA was extracted from HEK293T cells using the Genome Plus® Genomic DNA Exhibition Miniprep System (Biogene-BioTek, Taiwan). Next, nested PCR was performed to specifically amplify the long DNA region. First, several specific primer sets for long-chain DNA region PCR designed to amplify target DNA regions of various lengths (3.5 kb to 25 mb) using the extracted genomic DNA as a template. (Table 5) was used to amplify the target DNA region.
  • the first PCR reaction was performed using KOD ONE Master Mix (TOYOBO, Osaka, Japan) under the following conditions. 35 cycles of 10 seconds 98 ° C, 5 seconds 60 ° C and 50 seconds (amplicon: 15-20 kb) or 150 seconds (amplicon: 10-15 kb) or 200 seconds (amplicon: ⁇ 10 kb) 68 ° C.
  • the PCR product was then diluted 100-10,000 times and used as a template for nested PCR. Nested PCR was also performed under the same conditions as above. PCR products were separated by electrophoresis on a 1% agarose gel and visualized by staining with GelRed® Nucleic Acid Gel Stein (Biotium).
  • Nested PCR products were pooled and purified using Monofas® DNA purification Kit I (GL Sciences, Japan).
  • a purified mixture of PCR products was cloned into a pMD20-T vector using a Mighty TA-cloning Kit (Takara Bio, Japan).
  • 119 clones for AAVS-tid GTC_70-107 (+) and 20 clones for hEMX1-tid GTT_9 (-) were picked up and sanger sequenced using M13 Uni and M13 RV primers.
  • the results of Sanger sequencing were analyzed using a Blatná search and the ClustalW program to identify DNA deletions.
  • SlRIN GTC_4003 from 20 T0 transgenic TiD tomato calluses for SlIAA9 GTC_gRNA1 (+) and GTT + GTT_gRNA5 (-) (+) independently for mutation analysis by long-chain DNA region PCR in tomato plants.
  • SlIAA9 GTC_gRNA1 (+) and GTT + GTT_gRNA5 (-) (+) independently for mutation analysis by long-chain DNA region PCR in tomato plants.
  • -4238 (+) 30 T0 callus and 12 T0 shoots were isolated using NucleoSpin® Plant II (TaKaRa Bio).
  • TaKaRa Bio NucleoSpin® Plant II
  • a region of about 5-6 kbp containing the target site of each gRNA was subjected to PrimeSTAR GXL DNA Polymerase (TaKaRa Bio) and several primer sets for long DNA region PCR (Table 5).
  • Nested PCR was performed for SlIAA9 GTT + GTT_gRNA5 (-) (+) and SlRIN GTC_4003-4238 (+) transgenic callus, and only small DNA fragments separated on an agarose gel were extracted from the gel and purified for further analysis. ..
  • SlRIN GTC_4003-4238 (+) transgenic shoots nested PCR was performed twice using the same primer set and small DNA fragments were extracted after gel electrophoresis. Cloning of the extracted fragment was performed as described above. Each cloned plasmid was analyzed by Sanger sequencing. The number of clones for sequencing was different for each sample as described in the results.
  • the PCR amplicon was also cloned into a TA cloning vector (TaKaRa Bio) and sequenced by the Sanger method. Amplicon deep sequences for on-target and off-target mutation analysis were performed using Multiplex identifiers-labelled PCR (Ueta et al., 2017, supra). The PCR product was subjected to Truseq on the MiSeq platform (Illumina, USA). MiSeq data was analyzed using CLC Genomics Workbench software version 7.5.1 (CLC bio, Denmark). All primers for short-region PCR used in the mutation analysis are shown in Table 4.
  • Example 1 Identification of the nuclease module of the TiD system M.I.
  • the components of the Cas effector protein derived from aeruginosa and the crRNA sequence were evaluated using the BLAST program.
  • M. The CRISPR / Cas TiD locus of the aeruginosa PCC9808 strain spans 7.6 kb and consists of eight Cas genes: Cas1d, Cas2d, Cas3d, Cas4d, Cas5d, Cas6d, Cas7d, and Cas10d, followed by 36 repeat-spacer units. Become.
  • Cas3d did not have an HD domain that functions in DNA cleavage of CRISPR types I-A, B, C, E and F systems, but Cas10d has an HD-like nuclease domain in its N-terminal region.
  • ATP and metal ions Ni 2+ and Co 2+
  • An in vitro nuclease assay was performed in the presence. As a result, it was shown that Cas10d can cleave single-stranded DNA, and that Cas10d acts as a nuclease in the TiD system (Fig. 1).
  • Example 2 Biological activity of TiD as a genome editing tool in cells (1) Endonuclease activity of TiD Each single Cas expression vector and crRNA expression vector are infected with HEK293T cells, and Cas3d, by a pull-down assay, It was confirmed that Cas5d, Cas6d, Cas7d and Cas10d and crRNA form an in vivo complex.
  • a luciferase (luc) reporter assay using a luciferase single-strand annealing (SSA) recombination system was performed (Fig. 2a).
  • NanoLuc luciferase containing a human AAVS1 gene fragment containing a 300 bp homology arm separated by a stop codon and a TiD target site was used as the recombination reporter.
  • Each single Cas expression vector, TiD crRNA expression vector, and LUC reporter vector into which the target sequence was introduced were co-transfected into HEK293T cells, and endonuclease cleavage was detected by luminescence 72 hours after transfection.
  • the target sequences used are shown in Table 2.
  • a TiD Cas gene expression vector containing dCas10d having a mutation (H177A) in the wild-type Cas10d and the HD-like domain and gRNA AAVS1 GTC_70-170 (+) and AAVS1 GTC_159-196.
  • a luc reporter assay was performed using (+) and non-target gRNAs.
  • Cas10d actually has a nuclease activity that can be used for genome editing in cells.
  • Expression of TiD resulted in significantly higher (2-4 fold) activity in the luc reporter assay than non-target controls (FIGS. 2b-2e).
  • a TiD Cas gene other than Cas10d or Cas3d was transfected into HEK293T cells, the luciferase activity was comparable to that of the non-target control (Fig. 2c). This result indicates that Cas10d is essential for the activity of TiD in addition to Cas3d.
  • M. Specific genomic DNA was targeted at the original CRISPR locus of the aeruginosa PCC9808 strain using both 35 and 36 base protospacer sequences.
  • TiD activity was assessed using either 35 or 36 base gRNAs, both gRNAs functioning for genome editing in cells (Fig. 2d). TiD activity was also tested using either mature crRNA or pre-mature crRNA (Fig. 2e). As a result, it was found that the expression of premature crRNA is effective in TiD.
  • TiD target sequence design Furthermore, important nucleotides in the TiD target gRNA sequence required for genome editing were evaluated using a split-type vector and a luc reporter assay in HEK293T cells. Simply put, AAVS1 _ GTC _ 70-107 (+) target gRNAs with mutations at each position of the 35 base sequence adjacent to the PAM sequence were prepared, and TiD activity using each gRNA was measured by a luc reporter assay. .. The results are shown in FIG. 3a. As a result, TiD activity was retained even when there was a nucleotide mismatch at the 1, 6, 12, 18 or 24 nt position on the PAM sequence 3'side.
  • bpNLS functioned more effectively by adding to both the N- and C-termini of Cas3d, Cas5d, Cas6d, and Cas10d than to adding to the N-terminus or C-terminus alone (Fig. 4b).
  • bpNLS added to Cas7d was strongly expressed in the nucleus (Fig. 4d), it disrupted TiD activity (Fig. 4b).
  • SV40NLS functioned effectively by adding each Cas protein to the N-terminus (Fig. 4a).
  • Example 3 Optimization of TiD Expression Vectors in Animal Cells
  • the expression level of Cas protein in HEK293T cells was re-evaluated.
  • Several types of TiD Cas gene expression vectors [separate expression vectors for each Cas gene, two-set vectors containing three gene (Cas5-Cas6-Cas7) expression cassettes and two gene (Cas3-Cas10) expression cassettes, respectively. And an all-in-one vector containing a 5 gene (total Cas) expression cassette] was constructed (Fig. 5a).
  • Cas3 and Cas10 in the two-set vector, or Cas5, Cas6 and Cas7, and all Cas genes in the all-in-one vector are fused via a 2A self-cleaving peptide to yield a single transcript that is co-expressed.
  • SV40NLS with different tags was added to the N-terminus of each Cas gene.
  • Various combinations of each of the above Cas expression vectors and two-set vectors, or all-in-one vectors were transfected into HEK293T cells to measure the expression of each Cas protein in the cells. Expression levels were detected by Western blotting using antibodies specific for each tag fused to Cas (Fig. 5b).
  • the Cas protein expression level when the translation elongation factor 1 ⁇ promoter in the pEF vector and the chicken ⁇ -actin promoter in the pCAG were used was similarly detected (Fig. 5c).
  • Example 4 Inducing long-chain region deletion by a genome-editing TiD system induced by CRISPR TiD in animal cells was examined using the luciferase SSA assay.
  • targets hEMX1 GTT9 ( ⁇ ) for the human EMX1 gene and AAVS GTC_70-107 (+) for the AAVS gene were selected.
  • the above target sequence was integrated into a gRNA expression vector and transfected into HEK293T cells with each single Cas expression vector. DNA fragments were PCR amplified from the total DNA of HEK293T cells with a TiD system using several primer sets located on the flanks of hEMX1 and 5-19 kb near the AAVS target site (Table 5) (FIGS. 6a, 6b). , Clone and sequenced by Sanger method. The results are shown in FIGS. 6ac.
  • FIGS. 6c, 7a, b Sexual deletions were detected (FIGS. 6c, 7a, b). These characteristics were different from those after mutation by type IE (Non-Patent Document 1) and type II effectors (Cas9 and Cpf1). Microhomology and insertions were also observed at the TiD mutation site (FIGS. 6a, 7a, b). Mutation rates for long-chain region deletion by TiD in cloned DNA fragments were 55.0% and 57.1% for hEMX1 GTT_9 (-) and AAVS GTC_70-107 (+), respectively.
  • Example 5 Target mutagenesis by TiD in plants
  • a TiD vector containing a plant cell-specific promoter and crRNA for codon-optimized Cas gene expression was constructed to introduce site-specific mutagenesis into tomato plants. ..
  • As TiD vectors a vector containing 5 Cas genes in a single expression cassette (pTiDP1.2) and a vector containing 5 Cas genes divided into 2 expression cassettes (pMGTiDP20) were constructed (FIG. 8b).
  • the TiD gRNA was designed to target the 35 nucleotide sequences in the tomato IAA9 (SlIAA9) gene (important for parthenocarpy) and the tomato RIN (SlRIN) gene (involved in fruit maturation).
  • a luc reporter assay was performed to select GTT_gRNA5-A ( ⁇ ) and GTC_gRNA1 (+) (FIG. 8a). Both a single gRNA for GTC_gRNA1 (+) and multiple gRNAs for GTT_gRNA5-A (-) and GTT_gRNA5-B (+) (Table 2) were used for further analysis.
  • the designed gRNA-containing TiD vector was transformed into the tomato cultivar Micro-Tom or Ailsa Craig by Agrobacterium-mediated transformation. Mutations efficiently introduced by TiD in transgenic tomato curls were analyzed by Cel-1, PCR-RFLP, long DNA region PCR, and sequencing.
  • TiD allows for long-region chromosomal editing that allows simple and effective multi-gene function screening.
  • CRISPR toolbox As a new technology in the CRISPR toolbox, TiD opens up new possibilities in genome editing.
  • SEQ ID NO: 1 Microcystis aeruginosa Cas3d amino acid sequence SEQ ID NO: 2; Microcystis aeruginosa Cas5d amino acid sequence SEQ ID NO: 3; Microcystis aeruginosa Cas6d amino acid sequence SEQ ID NO: 4; Microcystis aeruginosa Cas7d amino acid sequence SEQ ID NO: 5; Microcystis aeruginosa Cas10d amino acid sequence SEQ ID NO: 6; Monopartite nuclear localizing signal (NLS) amino acid sequence SEQ ID NO: 7; Bipartite NLS amino acid sequence SEQ ID NO: 8; TiDcrRNA containing repeat (37b) and spacer (35b of N).
  • NLS nuclear localizing signal
  • N is any nucleotides a sequence that forms base pairs with a target nucleotide sequence SEQ ID NO: 9; DNA fragment for pre-mature crRNA SEQ ID NO: 10; DNA fragment for mature crRNA SEQ ID NO: 47; Primer SEQ ID NO: 48; Primer SEQ ID NO: 49; Primer SEQ ID NO: 50; Primer SEQ ID NO: 51; Primer SEQ ID NO: 52; Primer SEQ ID NO: 53; Primer SEQ ID NO: 54; Primer SEQ ID NO: 55; Primer SEQ ID NO: 56; Primer SEQ ID NO: 57; Primer SEQ ID NO: 58; Primer SEQ ID NO: 59; Primer SEQ ID NO: 60; Primer SEQ ID NO: 61; Primer SEQ ID NO: 62; Primer SEQ ID NO: 63; Primer SEQ ID NO: 64; Primer SEQ ID NO: 65; Primer SEQ ID NO: 66; Primer SEQ ID NO: 67; Primer SEQ ID

Landscapes

  • Genetics & Genomics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Chemical & Material Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Plant Pathology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

細胞内の標的ヌクレオチド配列を改変する方法であって、該細胞に、(iCas3d、Cas5d、Cas6d、Cas7d及びCas10dをコードするDNAを含むベクター系又は発現カセット系、及び(ii)前記標的ヌクレオチド配列と塩基対を形成する配列を含むcrRNA、又は前記crRNAをコードするDNAを導入することを含み、前記ベクター系が、第一のベクター及び第二のベクターを含み、前記発現カセット系が、第一の発現カセット及び第二の発現カセットを含み、前記第一のベクター又は前記第一の発現カセットが、Cas3dをコードするDNA、Cas5dをコードするDNA、Cas6dをコードするDNA、Cas7dをコードするDNA、及びCas10dをコードするDNAからなる群より選択される少なくとも1つのDNA、及び前記DNAの転写を調節する第一の調節エレメントを含み、前記第二のベクター又は前記第二の発現カセットが、前記群より選択される少なくとも1つのDNA、及び前記DNAの転写を調節する第二の調節エレメントを含む、方法等が提供される。

Description

CRISPRタイプI-Dシステムを利用した標的配列改変技術
 本発明は、CRISPR(Clustered Regularly Interspaced Short Palindromic Repeats)タイプI-Dシステムを利用した標的ヌクレオチド配列を特異的に改変する方法、および該方法に用いられるCas(CRISPR-associated)タンパク質およびcrRNA(CRISPR RNA)を含むキットに関する。
 CRISPR-Casシステムは、ウイルス、プラスミドおよびその他の外来遺伝子エレメントから細菌および古細菌を保護する、細菌および古細菌に見られる獲得免疫システムである。CRISPR-Casシステムは、該システムを構成しているCasタンパク質および分子メカニズムの違いによって、2つのクラス、6つの異なるタイプ(I~VI)、および少なくとも16種類のサブタイプに分類される。
 タイプIおよびIIシステムのメカニズムでは、crRNAとCasエフェクタータンパク質との複合体が、外来DNA中のプロトスペーサー隣接モチーフ(PAM)と呼ばれる短い(典型的には3~5塩基長の)配列エレメントを認識する。タイプIまたはII crRNAとCasエフェクタータンパク質との複合体は、PAM認識後、局所的にDNA対合を崩壊してR-ループ構造を形成し、crRNAガイドエレメントが相補的な標的鎖と塩基対を形成して非標的DNA鎖と置き換わる。該crRNA-Cas複合体による二本鎖DNA標的の結合および巻き戻しが、Cas3、Cas9およびCas12ヌクレアーゼなどのタイプ特異的CasエフェクターヌクレアーゼによるDNA切断および分解に必要とされる。
 CRISPRタイプIには、種々のサブタイプが存在する。クラス1システムには、Cascade(CRISPR-associated-complex for antiviral defense)と呼ばれる、Cas5、Cas6、Cas7およびCas8などの標的認識モジュールと、Cas3などのDNA切断モジュールが存在する(非特許文献1)。ゲノム編集技術において、クラス1 CRISPRシステムは、クラス2よりも一般的ではないが、ゲノム編集ツールとして、例えば長い領域のゲノム欠失および長いgRNA配列を包含する多様な変異プロフィールなど、Cas9およびCpf1と比べていくつかの利点を有する可能性が示唆された(非特許文献1)。今までに研究されたクラス1 タイプI-E CRISPR-Cas3システムでは、2-300bから100kbの塩基欠失が主にPAM配列の5’上流側に生じることが報告された(非特許文献1)。
 クラス1システム内のゲノム編集ツールの新たな候補を見出すために、発明者らは以前に、CRISPRクラス1タイプIのサブタイプ:タイプI-D(以下、「TiD」いう)システムをコードするCRISPRゲノム遺伝子座を同定し、該システムがCas3d、Cas5d、Cas6d、Cas7d、およびCas10dの5つのCasタンパク質を含むことを見出した(特許文献1)。しかしながら、TiDシステムがどのようにDNAを分解するのかは不明であった。
国際公開第2019/039417
Dolan, A.E. et al. Mol Cell 74, 936-950 (2019)
 本発明は、TiDシステムの作用機序を解明し、それにより、TiDシステムを利用した、より効率的な標的配列改変方法を開発することを目的とする。
 本発明者らは、鋭意研究の結果、CRISPR TiDシステムは、Cas3エフェクタータンパク質(Cas3d)を含有するが、該タンパク質はヌクレアーゼドメインを欠き、その代わり、Cas10dが典型的なヌクレアーゼドメインを有することを見出した。Cas10dは、他のCRISPRシステムでは見られないTiDに特有のエフェクタータンパク質である。さらに、特定の類似配列を有しない標的配列を選択することによって、TiDシステムのオフターゲット効果を減少させることができることを見出した。
 したがって、本発明は、下記の態様を提供する。
[1]細胞内の標的ヌクレオチド配列を改変する方法であって、該細胞に、
 (i)CRISPRタイプI-DのCasタンパク質 Cas3dをコードするDNA、Cas5dをコードするDNA、Cas6dをコードするDNA、Cas7dをコードするDNA、及びCas10dをコードするDNAを含むベクター系又は発現カセット系、及び
 (ii)前記標的ヌクレオチド配列と塩基対を形成する配列を含むcrRNA、又は前記crRNAをコードするDNA
を導入することを含み、
 前記ベクター系が、第一のベクター及び第二のベクターを含み、
 前記発現カセット系が、第一の発現カセット及び第二の発現カセットを含み、
 前記第一のベクター又は前記第一の発現カセットが、Cas3dをコードするDNA、Cas5dをコードするDNA、Cas6dをコードするDNA、Cas7dをコードするDNA、及びCas10dをコードするDNAからなる群より選択される少なくとも1つのDNA、及び前記DNAの転写を調節する第一の調節エレメントを含み、
 前記第二のベクター又は前記第二の発現カセットが、前記群より選択される少なくとも1つのDNA、及び前記DNAの転写を調節する第二の調節エレメントを含む、方法、
[2]細胞内の標的遺伝子の発現を抑制するための方法であって、前記標的ヌクレオチド配列が標的遺伝子の少なくとも一部のヌクレオチド配列である、[1]記載の方法、
[3]前記Cas3dをコードするDNA、Cas5dをコードするDNA、Cas6dをコードするDNA、Cas7dをコードするDNA、及びCas10dをコードするDNAの5’末端および/または3’末端側に核移行シグナルをコードする配列が付加されている、[1]または[2]記載の方法、
[4]前記核移行シグナルが、モノパータイト型核移行シグナルまたはバイパータイト型核移行シグナルである、[3]記載の方法、
[5]Cas3dをコードするDNA、Cas5dをコードするDNA、Cas6dをコードするDNA、Cas7dをコードするDNA、及びCas10dをコードするDNAがベクター系に含まれ、前記第一のベクターが、Cas3dをコードするDNA、Cas5dをコードするDNA、Cas6dをコードするDNA、及びCas10dをコードするDNAからなる群より選択される少なくとも1つのDNAを含み、該DNAの5’末端側に、1個のモノパータイト型核移行シグナルをコードする配列が付加されているか、あるいは2個又は3個のタンデムに連結したモノパータイト型核移行シグナルをコードする配列が付加されている、[4]記載の方法、
[6]Cas3dをコードするDNA、Cas5dをコードするDNA、Cas6dをコードするDNA、Cas7dをコードするDNA、及びCas10dをコードするDNAがベクター系に含まれ、前記第一のベクターが、Cas3dをコードするDNA、Cas5dをコードするDNA、Cas6dをコードするDNA、及びCas10dをコードするDNAからなる群より選択される少なくとも1つのDNAを含み、該DNAの5’末端側及び3’末端側の両方に、バイパータイト型核移行シグナルをコードする配列が付加されている、[4]記載の方法、
[7]前記第二のベクターがCas7dをコードするDNAを含み、該DNAの5’末端および/または3’末端側に、2個又は3個のタンデムに連結したモノパータイト型核移行シグナルをコードする配列が付加されている、[5]又は[6]記載の方法、
[8]前記第一の調節エレメントおよび/または前記第二の調節エレメントが、ヒト翻訳伸長因子遺伝子プロモーター又はCAGキメラ合成プロモーターである、[1]~[7]のいずれか1項記載の方法、
[9]前記ベクター系が第三ないし第五のベクターをさらに含み、Cas3dをコードするDNA、Cas5dをコードするDNA、Cas6dをコードするDNA、Cas7dをコードするDNA、及びCas10dをコードするDNAがそれぞれ別々に第一ないし第五のベクターに含まれる、[1]~[8]のいずれか1項記載の方法、
[10]Cas3dをコードするDNA、Cas5dをコードするDNA、Cas6dをコードするDNA、Cas7dをコードするDNA、及びCas10dをコードするDNAが発現カセット系に含まれ、前記第一の発現カセットが、Cas3dをコードするDNA及びCas6dをコードするDNAを含み、前記第二の発現カセットが、Cas5dをコードするDNA、Cas7dをコードするDNA、及びCas10dをコードするDNAを含み、かつ、前記第一の発現カセット及び前記第二の発現カセットが1つのベクターに搭載されている、[1]~[4]のいずれか1項記載の方法、
[11]前記crRNA又は前記crRNAをコードするDNAの細胞への導入がベクターを介して行われる、[1]~[10]のいずれか1項記載の方法、
[12]前記crRNAがプレ成熟型crRNAである、[1]~[11]のいずれか1項記載の方法、
[13]前記Cas3d、前記Cas5d、前記Cas6d、前記Cas7d及び前記Cas10dがM. aeruginosa由来のものである、[1]~[12]のいずれか1項記載の方法、
[14]前記細胞が真核細胞である、[1]~[13]のいずれか1項記載の方法、
[15]改変が塩基の欠失、挿入、又は置換である、[1]~[14]のいずれか1項記載の方法、
[16]改変が数キロベース~数十キロベースの欠失である、[15]記載の方法、
[17]細胞内の標的ヌクレオチド配列を改変するためのキットであって、
 (i)CRISPRタイプI-DのCasタンパク質 Cas3dをコードするDNA、Cas5dをコードするDNA、Cas6dをコードするDNA、Cas7dをコードするDNA、及びCas10dをコードするDNAを含むベクター系又は発現カセット系、及び
 (ii)前記標的ヌクレオチド配列と塩基対を形成する配列を含むcrRNA、又は前記crRNAをコードするDNA
を含み、
 前記ベクター系が、第一のベクター及び第二のベクターを含み、
 前記発現カセット系が、第一の発現カセット及び第二の発現カセットを含み、
 前記第一のベクター又は前記第一の発現カセットが、Cas3dをコードするDNA、Cas5dをコードするDNA、Cas6dをコードするDNA、Cas7dをコードするDNA、及びCas10dをコードするDNAからなる群より選択される少なくとも1つのDNA、及び前記DNAの転写を調節する第一の調節エレメントを含み、
 前記第二のベクター又は前記第二の発現カセットが、前記群より選択される少なくとも1つのDNA、及び前記DNAの転写を調節する第二の調節エレメントを含む、キット、
[18]Cas3dをコードするDNA、Cas5dをコードするDNA、Cas6dをコードするDNA、Cas7dをコードするDNA、及びCas10dをコードするDNAがベクター系に含まれ、前記ベクター系が第三ないし第五のベクターをさらに含み、Cas3dをコードするDNA、Cas5dをコードするDNA、Cas6dをコードするDNA、Cas7dをコードするDNA、及びCas10dをコードするDNAがそれぞれ別々に第一ないし第五のベクターに含まれる、[17]記載のキット、
[19]Cas3dをコードするDNA、Cas5dをコードするDNA、Cas6dをコードするDNA、Cas7dをコードするDNA、及びCas10dをコードするDNAが発現カセット系に含まれ、前記第一の発現カセットが、Cas3dをコードするDNA及びCas6dをコードするDNAを含み、前記第二の発現カセットが、Cas5dをコードするDNA、Cas7dをコードするDNA、及びCas10dをコードするDNAを含む、[17]記載のキット、
[20]細胞内の標的ヌクレオチド配列を特異的に標的化する方法であって、該細胞に、
 (i)CRISPRタイプI-DのCasタンパク質 Cas5d、Cas6d及びCas7d、又はこれらのタンパク質をコードする核酸、及び
 (ii)前記標的ヌクレオチド配列と塩基対を形成する配列を含むcrRNA、又は前記crRNAをコードするDNA
を導入することを含み、
 前記標的ヌクレオチド配列は、該標的ヌクレオチド配列に対して、PAM配列の3’側から1、6、12、18及び24番目の塩基からなる群から選ばれるいずれか1つの塩基、あるいは24番目以降の1つ又は2つの塩基が相違している類似配列が存在しないように設計される、方法、
[21]細胞内の標的ヌクレオチド配列を特異的に改変する方法であって、該細胞に、
 (i)CRISPRタイプI-DのCasタンパク質 Cas3d、Cas5d、Cas6d、Cas7d及びCas10d、又はこれらのタンパク質をコードする核酸、及び
 (ii)前記標的ヌクレオチド配列と塩基対を形成する配列を含むcrRNA、又は前記crRNAをコードするDNA
を導入することを含み、
 前記標的ヌクレオチド配列は、該標的ヌクレオチド配列に対して、PAM配列の3’側から1、6、12、18及び24番目の塩基からなる群から選ばれるいずれか1つの塩基、あるいは24番目以降の1つ又は2つの塩基が相違している類似配列が存在しないように設計される、方法、および
[22]前記標的ヌクレオチド配列は、該標的ヌクレオチド配列に対して、PAM配列の3’側から6、12、18及び24番目の塩基からなる群から選ばれるいずれか1つの塩基、あるいは24番目以降の1つ又は2つの塩基が相違している類似配列が存在しないように設計される、請求項20又は21記載の方法。
 本発明によれば、特定のDNAを標的化するように操作されたTiD crRNAを含むTiDシステムを用いることにより、細胞、好ましくは動物および植物細胞において効率的に部位特異的変異を誘導することができる。驚くべきことに、本発明によれば、TiDシステムのCasエフェクタータンパク質の発現量を向上させることができ、短い領域の挿入および/または欠失を誘導するだけでなく、数キロベースないし数十キロベースの長い領域の塩基欠失および二方向性(bi-directional)の塩基欠失も誘導することができる。さらに、TiDシステムを用いると、生じた変異トランスジェニック生物における所望の表現型が、次世代に遺伝的に伝達される。さらに、本発明の方法によれば、オフターゲット効果を抑制した、標的配列の特異的な標的化および改変がもたらされる。したがって、本発明は、TiDシステムのCRISPRエフェクターモジュール経路を用いる、生物、特に真核生物のための、新規なゲノム編集ツールを提供する。
イン・ビトロDNA切断アッセイにおけるCas10d活性の検出結果。Ctrl:Casタンパク質を用いないコントロールアッセイ。矢印:消化されていないDNA。 ヒトHEK293T細胞におけるゲノム編集を検出するために使用されたルシフェラーゼレポーターアッセイの概略図。 Cas10dのHDドメインの効果を示す。上図:白色バーは、野生型Cas10dを用いるTiDシステムのlucレポーターアッセイを示し、黒色バーは、HD-変異dCas10d(H177A)を用いるTiDシステムのlucレポーターアッセイを示す。データは、独立実験(n=4)の平均±S.E.である。アスタリスクは、スチューデントt検定によって決定された統計学的有意差を示す。*P<0.07。下図:N末(Myc)またはC末(His)融合タグに対する抗体によって検出されたCas10dおよびdCas10dの発現レベルを示す。Cas10dおよびdCas10dについて、pEFs-Myc-bpNLS-Cas10dまたはdCas10d(H177A)-bpNLS-6xHis、およびpEFs-SV40NLS HA-Cas3d、Strept-Cas5d、Myc-Cas6d、またはFLAG-Cas7dをlucレポーターアッセイに用いた。 Cas3dおよびCas10dの両方がTiD活性に必要とされることを示す。黒色バー:非標的gRNA。他のgRNAsは、表2に示されるAAVS遺伝子座を標的とする。データは、独立実験(n=3)の平均±S.E.である。スチューデントt検定によって決定された、*P<0.01および**P<0.05。 TiD活性に対するgRNA標的配列長の影響を示す。データは、独立実験(n=4)の平均±S.E.である。スチューデントt検定によって決定された、*P<0.005、**P<0.01、および***P<0.05。 TiDシステムに使用されるcrRNA構造の影響を示す。データは、独立実験(n=4)の平均±S.E.である。スチューデントt検定によって決定された、*P<0.01および**P<0.05。 TiDのゲノム編集活性における決定的なヌクレオチドの評価。上図;AAVS GTC_70-107(+)の標的配列に対し、gRNA配列の様々な位置に1塩基のミスマッチを含む各gRNAを用いて行ったlucレポーターアッセイの結果を示す。下図:AAVS GTC_70-107(+)の標的gRNA配列における決定的なヌクレオチドを示す。データは、独立実験(n=3)の平均±S.E.である。スチューデントt検定によって決定された、*P<0.001、**P<0.005、および***P<0.01。 標的に対して2塩基のミスマッチを含むgRNAによるTiDのゲノム編集活性の評価。AAVS GTC_70-107(+)の標的配列に対し、gRNA配列の様々な位置に2塩基のミスマッチを含むgRNAを用いて行ったlucレポーターアッセイの結果を示す。データは、独立実験(n=3)の平均±S.E.である。スチューデントt検定によって決定された、*P<0.001、**P<0.005、および***P<0.01。 標的に対して3塩基のミスマッチを含むgRNAによるTiDのゲノム編集活性の評価。AAVS GTC_70-107(+)の標的配列に対し、gRNA配列の様々な位置に3塩基のミスマッチを含むgRNAを用いて行ったlucレポーターアッセイの結果を示す。データは、独立実験(n=3)の平均±S.E.である。スチューデントt検定によって決定された、*P<0.001、**P<0.005、および***P<0.01。 標的に対して1塩基のミスマッチを含む30b長のgRNAによるTiDのゲノム編集活性の評価。AAVS GTC_70-107(+)の標的配列に対し、30b長のgRNA配列の様々な位置に1塩基のミスマッチを含むgRNAを用いて行ったlucレポーターアッセイの結果を示す。データは、独立実験(n=3)の平均±S.E.である。スチューデントt検定によって決定された、*P<0.001、**P<0.005、および***P<0.01。 TiD活性に対するCasタンパク質の核移行シグナルの影響を示す。左:Cas発現ベクターカセットの構造。N-SV40NLS-Cas;Cas3d、Cas5d、Cas6d、Cas7d、およびCas10dそれぞれにおける、異なるタグを有するN末端のSV40NLS。N-Cas-C-bpNLS;Cas3d、Cas5d、Cas6d、Cas7d、およびCas10dそれぞれにおける、N末端のMycタグおよびC末端の6xHisタグの両方を有するbpNLS。右:ヒトHEK293T細胞におけるlucレポーターアッセイによって決定された、AAVSの種々のgRNA標的に対するTiD活性における、Casタンパク質のNLSの影響を示す。データは、独立実験(n=4)の平均±S.E.である。*P<0.1および**P<0.05は、スチューデントt検定によって決定された。 左:各CasのN末端にSV40NLSを付加した場合と比べて、Cas3d、Cas5d、Cas6d、Cas10dのN末端およびC末端の両方に付加したbpNLSが有効に機能したことを示す。しかしながら、Cas7dに付加したbpNLSはTiD活性を破壊した。データは、Cas7dの不活性化が図4aにおけるTiD活性抑制に影響したことを示唆する。データは、独立実験(n=4)の平均±S.E.である。*P<0.01、**P<0.05、および***P<0.07は、スチューデントt検定によって決定された。右:ヒトHEK293T細胞におけるlucレポーターアッセイによって決定された、AAVSの種々のgRNA標的に対するTiD活性における、Cas7dのbpNLSの影響を示す。 lucレポーターアッセイにおいて使用されたヒトHEK293T細胞から抽出されたCas-NLSタンパク質のタンパク質ブロット分析を示す。C;サイトソルフラクション。N;核フラクション。 lucレポーターアッセイにおいて使用されたヒトHEK293T細胞から抽出されたCas-NLSタンパク質のタンパク質ブロット分析を示す。C;サイトソルフラクション。N;核フラクション。 ヒトHEK293T細胞のゲノム編集を用いるCas発現ベクターの構造を示す。N-SV40NLS-Cas;N末端に異なるタグを有するSV40NLSを付加した、Cas3d、Cas5d、Cas6d、Cas7d、およびCas10d。2A;自己切断ペプチド。promoter;プロモーター。Ter;ターミネーター。 HEK293T細胞中のCasタンパク質の発現レベルのウェスタンブロッティング結果。C;ベクター無しのコントロール。EV;空のベクター(gRNA無し)のコントロール。1;個々のCas発現カセットが個々のベクターに分けられた。2;Cas3dおよびCas10dが同じベクター中に挿入され、Cas5d、Cas6dおよびCas7dが同じベクター中に挿入されて、セパレート型ベクターとしてHEK293T細胞中にトランスフェクトされた。3;Cas3dおよびCas10dが同じベクター中に挿入され、Cas5d、Cas6d、およびCas7dがそれぞれ別々のベクター中に挿入されて、セパレート型ベクターとしてHEK293T細胞中にトランスフェクトされた。4;Cas3dおよびCas10dがそれぞれ別々のベクター中に挿入され、Cas5d、Cas6dおよびCas7dが同じベクター中に挿入されて、セパレート型ベクターとしてHEK293T細胞中にトランスフェクトされた。5;全Cas発現カセットを含むオールインワン型ベクター。 HEK293T細胞における異なるプロモーターを用いたCas5dおよびCas6d発現レベルのウェスタンブロッティング結果。C;ベクター無しのコントロール。 CRISPR TiDによって誘導されるhEMX1およびAAVS遺伝子における長鎖領域欠失変異の検出。上図;遺伝子構造、gRNA位置、および変異を増幅するための種々のプライマーセット。下図(左);アガロースゲル上で分離したPCR増幅フラグメント。数字は、遺伝子構造中に示されるプライマーセットを示す。下図(右);CRISPR TiD感染細胞由来のクローン化DNAのサンガー配列決定によって分析された長鎖領域欠失変異。PAMに相対的なヌクレオチド位置が配列上に示される。 CRISPR TiDによって誘導されるhEMX1およびAAVS遺伝子における長鎖領域欠失変異の検出。上図;遺伝子構造、gRNA位置、および変異を増幅するための種々のプライマーセット。下図(左);アガロースゲル上で分離したPCR増幅フラグメント。数字は、遺伝子構造中に示されるプライマーセットを示す。下図(右);CRISPR TiD感染細胞由来のクローン化DNAのサンガー配列決定によって分析された長鎖領域欠失変異。PAMに相対的なヌクレオチド位置が配列上に示される。 AAVS GTC_70-107(+)によって誘導された長鎖領域欠失パターン。図中の各バーは、PAMの5’上流領域の欠失およびPAMの3’下流領域の欠失を示す。欠失変異の分布は、図7に示す。 AAVS遺伝子におけるTiD変異誘発の変異プロフィール。AAVS GTC_70-107(+)によって誘導された長鎖欠失パターン。欠失変異の分布イメージは、図6cに示す。 長鎖領域欠失変異(Δ5235ntおよびΔ17902nt + 87nt挿入)を示す。PAMからのヌクレオチド位置を配列上に示す。 植物用TiD発現ベクターを示す。SlIAA9遺伝子の標的を決定するためのLucレポーターアッセイ。gRNAs配列は、表2に示される。 トマト植物におけるCas発現ベクターカセットの構造。N末端に異なるタグおよびSV40NLSを付加した、Cas3d、Cas5d、Cas6d、Cas7d、およびCas10dを、単一の転写産物を生じ、同時に発現するように、2A自己切断ぺプチドを介して融合した。pTiDP1.2は、SlIAA9変異誘発で使用されたオールインワン型ベクターである。pMGTTiDP20は、2つのCasカセットが2つのプロモーター下で、同じベクター中に並べられ、SlRIN変異誘発に用いられた。AtU6-26 crRNA:Arabidopsis U6 snRNA-26プロモーターおよびgRNA配列。P35S:CaMV35Sプロモーター。Pubi4:パセリユビキチン4-2プロモーター。2A:2A自己切断ペプチド。NptII:カナマイシン耐性マーカー発現カセット。RB:T-DNAの右境界配列。LB:T-DNAの左境界配列。Ter:ターミネーター。GFP:緑色蛍光タンパク質。 CRISPR TiDを用いる植物ゲノム編集。CRISPR TiDによって誘導されるSlIAA9およびSlRIN遺伝子における長鎖領域欠失変異の検出。遺伝子構造、gRNA位置、および変異増幅のための種々のプライマーセットを示す。アガロースゲル上で分離されたPCR増幅フラグメントを示す。数字は、プライマーセットを示す。CRISPR TiDトランスジェニックトマトカルス由来のクローン化DNAのサンガー配列決定によって分析された、長領域欠失変異の結果を示す。PAMからのヌクレオチド位置を配列上に示す。矢印は、クローニングおよびシークエンシングに使用された特異的なバンドを示す。 トマトシュート(T0世代)におけるCRISPR TiDによって誘導されたSlRIN遺伝子における長鎖領域欠失変異の検出。アガロースゲル上で分離されたPCR増幅フラグメントは、長鎖領域欠失変異を示す。WT;野生型。1-12;トランスジェニックシュート系統(T0)。長鎖領域欠失は、系統#4、5、6および12において検出された。野生型と同じ長さのバンドは、非特異的バンドであった。矢印は特異的バンドを示す。矢印によって示されるバンドをさらにシークエンシング分析に付した。赤い矢印(上のバンド)はフラグメント1を示し、青い矢印(下のバンド)はフラグメント2を示す。 トマトシュート(T0世代)におけるCRISPR TiDによって誘導されたSlRIN遺伝子における長鎖領域欠失変異の検出。CRISPR TiDトランスジェニックトマトシュート(T0;#4、5、6、および12)由来のクローン化DNAを用いるサンガー配列決定は、長鎖領域欠失変異が等しく起こったことを示したが、変異頻度は系統間で異なった。 トマトシュート(T0世代)におけるCRISPR TiDによって誘導されたSlRIN遺伝子における長鎖領域欠失変異の検出。図10a由来のクローン化DNAの変異配列。PAMからのヌクレオチド位置を配列上に示す。 サンガー法によって分析されたCRISPR TiDで形質転換されたMicro-Tomのトランスジェニックシュート(T0およびT1世代)における変異配列。WT;野生型配列。gRNA標的配列をボックスで示し、PAMを塗りつぶしたボックスで示す。クローン化PCR産物における配列頻度は、配列の右に示される。 市販トマト栽培種におけるCRISPR TiDを用いてゲノム編集。Mi-seq(Illumina)を用いるアンプリコンディープシークエンシングによって検出された、CRISPR TiDによって生じたトランスジェニックAilsa Craigシュート(T0世代)における変異配列。WT;野生型配列。ボックス;gRNA標的配列。塗りつぶしたボックス;PAM。ディープシークエンシングにおいてリードカウント数を配列の右に示す。 市販トマト栽培種におけるCRISPR TiDのオフターゲット効果。上図:SlIAA9 GTC_gRNA1(+)標的配列のオフターゲット配列。小文字;ミスマッチヌクレオチド。下図;Ailsa CraigのトランスジェニックT0シュート(SlIAA9-tid_gRNA1(+) AC T0s_#1、2、および4)および野生型(WT)由来のオフターゲット部位のクローン化PCR産物における変異頻度は、Mi-seqによるディープアンプリコンにおけるリードカウント数から算出された。
 本発明で使用されるTiDシステムは、具体的には、TiD Casタンパク質のうち、Casエフェクタータンパク質として、Cas3d、Cas5d、Cas6d、Cas7dおよびCas10dと、TiD crRNAとを含む。TiDシステムにおいて、Cas5d、Cas6dおよびCas7dは標的認識モジュール(Cascade)を構成し、Cas3dおよびCas10dはポリヌクレオチド切断モジュールを構成することが知られていた(特許文献1)。TiDシステムにおいて、TiD crRNAは、標的ヌクレオチド配列に相補的な配列を含む。上記5つのCasタンパク質とTiD crRNAは複合体を形成して、標的ヌクレオチド配列を標的化し、改変する。
 本発明によれば、TiDシステムの新規なCasエフェクタータンパク質の機能を探求した結果、驚くべきことに、切断モジュールの構成要素のうちCas10dがポリヌクレオチド分解作用(ヌクレアーゼ活性)を有し、Cas3dはヌクレアーゼ活性を有しないことが明らかにされた。すなわち、TiDシステムでは、TiD crRNAと標的認識モジュールとが標的ヌクレオチド配列を標的化して、ポリヌクレオチド切断モジュールを該標的ヌクレオチド配列付近に導き、Cas10dの作用により該標的ヌクレオチド配列が切断される。
 したがって、本発明は、TiDシステムを標的細胞に導入することにより、該細胞中の標的ヌクレオチド配列を改変する方法(以下、「本発明の標的配列改変方法」ともいう)、および該方法に使用されるキット(以下、「本発明のキット」ともいう)を提供する。
 さらに本発明では、TiDシステムのオフターゲット効果に関与する標的配列における塩基の位置を同定した。したがって、本発明は、標的ヌクレオチド配列に対して、特定の位置に変異を含む類似配列が存在しない標的配列を設計することにより、標的配列を特異的に標的化する方法および標的配列を特異的に改変する方法(以下、「本発明のオフターゲット効果を抑制した標的配列ターゲティング方法」および「本発明のオフターゲット効果を抑制した標的配列改変方法」という)を提供する。
(1)細胞
 本発明において、細胞は、原核細胞または真核細胞のいずれの細胞であってもよく、特に限定されない。例えば、細菌、古細菌、真菌類(例えば、糸状菌、酵母等)、植物細胞、昆虫細胞、動物細胞(例えば、ヒト細胞、非ヒト細胞、非哺乳動物脊椎動物細胞、無脊椎動物細胞等)が挙げられる。好ましくは、真核細胞が使用される。本明細書において使用される場合、「細胞」とは、生体から単離された細胞、生体内(例えば、動物体または植物の体内)に存在する細胞、または生体(例えば、動物体、または植物体)のいずれも包含する。本発明の方法は、生体から単離された細胞、生体内に存在する細胞、または生体のいずれの細胞に適用してもよい。例えば、ヒト以外の動物の体内に存在する細胞またはヒト以外動物体に適用してもよい。
(2)Casエフェクタータンパク質および該タンパク質をコードする核酸
 本発明で使用されるCasエフェクタータンパク質は、TiDのCasタンパク質のうち、Cas3d、Cas5d、Cas6d、Cas7d、およびCas10dを含む。Cas3d、Cas5d、Cas6d、Cas7d、およびCas10dは、いずれの細菌または古細菌由来のものであってもよく、例えば、Microcystis aeruginosa、Acetohalobium arabaticum、Ammonifex degensii、Anabaena cylindrica、Anabaena variabilis、Caldicellulosiruptor lactoaceticus、Caldilinea aerophila、Crinalium epipsammum、Cyanothece Sp.、Cylindrospermum stagnale、Haloquadratum walsbyi、Halorubrum lacusprofundi、Methanocaldococcus vulcanius、Methanospirillum hungatei、Natrialba asiatica、Natronomonas pharaonis、Nostoc punctiforme、Phormidesmis priestleyi、Oscillatoria acuminata、Picrophilus torridus、Spirochaeta thermophila、Stanieria cyanosphaera、Sulfolobus acidocaldarius、Sulfolobus islandicus、Synechocystis Sp.、Thermacetogenium phaeum、Thermofilum pendensなどの菌株由来のものであってもよい。上記Casタンパク質のアミノ酸配列およびヌクレオチド配列情報は、例えば、NCBI GenBank等の公開されたデータベースから入手可能である。また、メタゲノム解析などにより得られた微生物ゲノムデータからBLASTプログラムを利用することで、新規の微生物種からの配列取得も可能である。
 上記Casタンパク質をコードする核酸は、例えば、アミノ酸配列情報を基に、該核酸を導入する宿主細胞における翻訳に最適化されたコドンを選択し、化学合成等により構築してもよい。宿主細胞において使用頻度の高いコドンを使用することにより、タンパク質の発現量の増加させることができる。該核酸としては、例えば、mRNA等のRNA、またはDNAが挙げられる。
 Cas3d、Cas5d、Cas6d、Cas7d、およびCas10dの各Casタンパク質またはそれらをコードする核酸は、本発明の効果が達成されるかぎりにおいて、すなわち、上記Casタンパク質とcrRNAとの複合体が標的配列を標的化または改変するかぎりにおいて、1以上のアミノ酸変異または1以上のヌクレオチド変異を有していてもよい。
 例えば、上記Casタンパク質の例として、限定するものではないが、Microcystis aeruginosa(以下、M.aeruginosaという)由来のCas3d(配列番号1)、Cas5d(配列番号2)、Cas6d(配列番号3)、Cas7d(配列番号4)、およびCas10d(配列番号5)が挙げられる。したがって、本発明に用いられるCas3dをコードする核酸の例として、配列番号1で示されるアミノ酸配列を含むタンパク質をコードするヌクレオチド配列を含む核酸、Cas5dをコードする核酸の例として、配列番号2で示されるアミノ酸配列を含むタンパク質をコードするヌクレオチド配列を含む核酸、Cas6dをコードする核酸の例として、配列番号3で示されるアミノ酸配列を含むタンパク質をコードするヌクレオチド配列を含む核酸、Cas7dをコードする核酸の例として、配列番号4で示されるアミノ酸配列を含むタンパク質をコードするヌクレオチド配列を含む核酸、およびCas10dをコードする核酸の例として、配列番号5で示されるアミノ酸配列を含むタンパク質をコードするヌクレオチド配列を含む核酸が挙げられる。好ましくは、本発明に用いられるCas3dをコードする核酸の例として、配列番号1で示されるアミノ酸配列からなるタンパク質をコードするヌクレオチド配列を含む核酸、Cas5dをコードする核酸の例として、配列番号2で示されるアミノ酸配列からなるタンパク質をコードするヌクレオチド配列を含む核酸、Cas6dをコードする核酸の例として、配列番号3で示されるアミノ酸配列からなるタンパク質をコードするヌクレオチド配列を含む核酸、Cas7dをコードする核酸の例として、配列番号4で示されるアミノ酸配列からなるタンパク質をコードするヌクレオチド配列を含む核酸、およびCas10dをコードする核酸の例として、配列番号5で示されるアミノ酸配列からなるタンパク質をコードするヌクレオチド配列を含む核酸が挙げられる。さらに好ましくは、本発明に用いられるCas3dをコードする核酸の例として、配列番号1で示されるアミノ酸配列からなるタンパク質をコードするヌクレオチド配列からなる核酸、Cas5dをコードする核酸の例として、配列番号2で示されるアミノ酸配列からなるタンパク質をコードするヌクレオチド配列からなる核酸、Cas6dをコードする核酸の例として、配列番号3で示されるアミノ酸配列からなるタンパク質をコードするヌクレオチド配列からなる核酸、Cas7dをコードする核酸の例として、配列番号4で示されるアミノ酸配列からなるタンパク質をコードするヌクレオチド配列からなる核酸、およびCas10dをコードする核酸の例として、配列番号5で示されるアミノ酸配列からなるタンパク質をコードするヌクレオチド配列からなる核酸が挙げられる。
 また、本発明に用いられる上記Casタンパク質をコードする核酸のさらなる例として、配列番号1、配列番号2、配列番号3、配列番号4、および配列番号5に対してそれぞれ、80%以上、好ましくは90%以上、より好ましくは95%以上、さらに好ましくは96%以上、さらに好ましくは97%以上、さらに好ましくは98%以上、またはさらに好ましくは99%以上の配列同一性を有するアミノ酸配列を含むタンパク質をコードするヌクレオチド配列を含む核酸が挙げられる。好ましくは、本発明に用いられる上記Casタンパク質をコードする核酸のさらなる例として、配列番号1、配列番号2、配列番号3、配列番号4、および配列番号5に対してそれぞれ、80%以上、好ましくは90%以上、より好ましくは95%以上、さらに好ましくは96%以上、さらに好ましくは97%以上、さらに好ましくは98%以上、またはさらに好ましくは99%以上の配列同一性を有するアミノ酸配列からなるタンパク質をコードするヌクレオチド配列を含む核酸が挙げられる。さらに好ましくは、本発明に用いられる上記Casタンパク質をコードする核酸のさらなる例として、配列番号1、配列番号2、配列番号3、配列番号4、および配列番号5に対してそれぞれ、80%以上、好ましくは90%以上、より好ましくは95%以上、さらに好ましくは96%以上、さらに好ましくは97%以上、さらに好ましくは98%以上、またはさらに好ましくは99%以上の配列同一性を有するアミノ酸配列からなるタンパク質をコードするヌクレオチド配列からなる核酸が挙げられる。上記のいずれかの核酸から発現するCasタンパク質は、上記の他の核酸から発現するCasタンパク質およびcrRNAと複合体を形成した場合に標的配列を標的化または改変する能力を有するものである。
 TiDシステムを導入する細胞が真核細胞である場合、好ましくは、Casタンパク質をコードする核酸の末端に核移行シグナルをコードするヌクレオチド配列(以下、「核移行シグナル配列」という)が付加される。核移行シグナル配列は、当該分野で公知であり、導入対象の細胞が由来する生物種に応じて適宜選択することができる。例えば、モノパータイト型核移行シグナルまたはバイパータイト型核移行シグナル(bpNLS)を使用してもよい。モノパータイト型核移行シグナルの例として、限定するものではないが、KKKKRK(配列番号6)で示される配列を含むものが挙げられる。また、バイパータイト型核移行シグナルの例として、限定するものではないが、DPKRTADGSEFESPKKKRKVEGT(配列番号7)で示される配列を含むものが挙げられる。
 また、核移行シグナル配列は、2個以上をタンデムに並べてCasタンパク質をコードする核酸に付加してもよい。好ましくは、2個以上の、例えば、2個又は3個のモノパータイト型核移行シグナル配列をタンデムに並べて、Casタンパク質をコードする核酸に付加する。核移行シグナル配列は、Casタンパク質をコードする核酸の5’末端側または3’末端側、あるいは5’末端側および3’末端側の両方に付加されていてもよい。
 例えば、一の態様において、Cas3dをコードするDNA、Cas5dをコードするDNA、Cas6dをコードするDNA、およびCas10dをコードするDNAからなる群より選択される少なくとも1つのDNAは、5’末端側に、1個のモノパータイト型核移行シグナルをコードする配列が付加されているか、あるいは2個又は3個のタンデムに連結したモノパータイト型核移行シグナルをコードする配列が付加されていてもよい。例えば、また別の態様において、Cas3dをコードするDNA、Cas5dをコードするDNA、Cas6dをコードするDNA、およびCas10dをコードするDNAからなる群より選択される少なくとも1つのDNAは、5’末端側および3’末端側の両方に、バイパータイト型核移行シグナルをコードする配列が付加されていてもよい。例えば、また別の態様において、Cas7dをコードするDNAは、5’末端および/または3’末端側に、2個又は3個のタンデムに連結したモノパータイト型核移行シグナルをコードする配列が付加されていてもよい。これらの態様は、動物細胞への導入に好ましい。
(3)crRNA
 crRNAは、CRISPR遺伝子座に由来するリピート配列および該リピート配列に挟まれたスペーサー配列からなる1以上の構造単位(「リピート-スペーサー-リピート」)を含む。リピート配列は、好ましくは、パリンドローム様配列を含む。crRNAは、スペーサー配列として標的ヌクレオチド配列に結合するRNA配列(すなわち、プロトスペーサー配列)を含むことによって、CRISPR-Casシステムの標的認識に寄与する。crRNAのリピート配列および該リピート配列に挟まれたプロトスペーサー配列からなる構造を含むRNA分子は、ガイドRNA(gRNA)とも呼ばれる。crRNAは、Casエフェクタータンパク質の作用によりプロセッシングされてそのリピート配列が切断され、リピート配列の部分配列と該リピート配列の部分配列に挟まれたプロトスペーサー配列からなる成熟型(mature)crRNAになる。プロセッシングされる前のcrRNAはプレ成熟型(pre-mature)crRNAと呼ばれる。
 本発明で使用されるcrRNAは、CRISPRタイプI-D遺伝子座に由来するリピート配列と、該リピート配列に挟まれたプロトスペーサー配列として、標的ヌクレオチド配列と塩基対を形成する配列を含む。本発明で使用されるcrRNAは、好ましくは、プレ成熟型crRNAである。
 プレ成熟型crRNAは、Cascade(Cas5d、Cas6d、およびCas7dの複合体)に取り込まれる前にCas6dによるプロセッシングを受けて、成熟型crRNAとなる。プレ成熟型crRNAが2以上の「リピート-スペーサー-リピート」構造単位を含む場合、該プレ成熟型crRNAは、2種以上のプロトスペーサー配列を含んでいてもよい。2種以上のプロトスペーサー配列を含むプレ成熟型crRNAからは、2種以上の成熟型crRNAが生じ、次いで、これらの成熟型crRNAは個別にCascadeに取り込まれる。
 crRNAに含まれるプロトスペーサー配列は、標的ヌクレオチド配列と塩基対を形成する配列である。「標的ヌクレオチド配列と塩基対を形成する配列」は、例えば、RNA配列標的ヌクレオチド配列に相補的な配列、またはRNA配列標的ヌクレオチド配列に対し実質的に相補的な配列である。ここで、「実質的に相補的」とは、標的配列に対して完全に相補的ではないが、標的配列に結合できる(標的配列と塩基対を形成する)配列を包含する。RNA配列標的ヌクレオチド配列に対し実質的に相補的な配列は、標的配列と塩基対を形成するかぎりにおいて、配列標的配列に対しミスマッチを含んでいてもよい。
 crRNAのリピート配列部分は、少なくとも1つのヘアピン構造を有していてもよい。例えば、プロトスペーサー配列の5’末端側にあるリピート配列部分がヘアピン構造を有し、プロトスペーサー配列の3’末端側にあるリピート配列部分は一本鎖であってもよい。本発明において、crRNAは、好ましくは1つのヘアピン構造を有する。
 CRISPRタイプI-D遺伝子座に由来するリピート配列は、タイプI-D遺伝子群に隣接するcrRNA遺伝子配列領域から、タンデムリピート検索プログラムを利用して見出すことができる。タイプI-D遺伝子座に由来するリピート配列は、いずれの細菌または古細菌由来のものであってもよく、例えば、上記のCasエフェクタータンパク質に関して例示した細菌および古細菌由来のものであってもよい。
 crRNAに含まれるリピート配列の塩基長は、Cascadeと相互作用して標的ヌクレオチド配列を標的化するという目的が達成されるかぎり、特に限定されない。例えば、プロトスペーサー配列の前後のリピート配列は各々、約10~70塩基長であってもよく、例えば、約30~50塩基長であってもよく、好ましくは約35~45塩基長であってもよい。
 本発明で使用されるcrRNAは、約10塩基~70塩基長のプロトスペーサー配列を含むことができる。該crRNAに含まれるプロトスペーサー配列は、好ましくは20塩基~50塩基、より好ましくは25塩基~45塩基からなる配列、さらに好ましくは30塩基~40塩基からなる配列、例えば、31塩基、32塩基、33塩基、34塩基、35塩基、36塩基、37塩基、38塩基、または39塩基からなる配列である。標的化可能な配列が長いほど、crRNAによる標的認識の配列特異性が増す。また、標的化可能な配列が長いほど、crRNAと標的配列との間に形成される塩基対のTm値が高くなり、標的認識の安定性が増す。従来のゲノム編集技術に用いられるRNA誘導性エンドヌクレアーゼ(例えば、Cas9およびCpf1)ではcrRNAが標的化できる配列の長さは約20~24塩基であるので、本発明では、従来法よりも配列特異性および安定性が優れている。
 本発明で使用されるcrRNAの例として、限定するものではないが、M.aeruginosa由来のcrRNAのリピート配列を含むものが挙げられる。例えば、GUUCCAAUUAAUCUUAAGCCCUAUUAGGGAUUGAAACNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGUUCCAAUUAAUCUUAAGCCCUAUUAGGGAUUGAAAC(配列番号8;Nは、標的ヌクレオチド配列と塩基対を形成する配列を構成する任意のヌクレオチドである)で示される配列を含むプレ成熟型crRNAが挙げられる。上記crRNAの配列中、Nの数は10~70の範囲で変更してもよく、好ましくは20~50、より好ましくは25~45、さらに好ましくは30~40の範囲で変更してもよい。
 上記crRNAは、RNAとして、またはcrRNAをコードするDNAとして細胞中に導入されてもよい。crRNAをコードするDNAは、例えば、ベクターまたは発現カセットに含まれていてもよく、該DNA配列は、好ましくは、プロモーターおよびターミネーター等の調節配列に作動可能に連結される。ベクターおよび調節配列は、例えば宿主細胞等に基づいて、当業者が適宜選択することができる。例えば、限定するものではないが、pol III系のプロモーター(例えば、SNR6、SNR52、SCR1、RPR1、U6、H1プロモーター等)、pol II系のプロモーター、ターミネーター(例えばT6配列)、またはヒトU6 snRNAプロモーターを用いることができる。
 上記crRNAをコードするDNAは、上記5つのCasタンパク質をコードするDNAのいずれかと同じベクター中または同じ発現カセット中に含まれていてもよく、または上記5つのCasタンパク質をコードするDNAのいずれとも別のベクター中または別の発現カセット中に含まれていてもよい。
(4)標的ヌクレオチド配列
 本発明において、標的ヌクレオチド配列(本明細書において、単に「標的配列」ともいう)は、任意の核酸の配列であり、TiDシステムのプロトスペーサー近接モチーフ(PAM)の近傍に位置する配列を標的配列として選択することを除き、特に限定されない。標的ヌクレオチド配列は、二本鎖DNA配列、一本鎖DNA配列、またはRNA配列のいずれであってもよい。DNAとしては、例えば、真核生物核ゲノムDNA、ミトコンドリアDNA、プラスチドDNA、原核生物ゲノムDNA、ファージDNA、あるいはプラスミドDNA等が挙げられる。本発明において、標的ヌクレオチド配列は、好ましくは、ゲノムDNA上の配列である。したがって、標的とする核酸のセンス鎖において、PAM配列の近傍に位置する配列、好ましくはPAM配列の3’側下流の近傍に位置する配列、さらに好ましくはPAM配列の3’側下流に隣接する配列を標的ヌクレオチド配列として選択する。また、標的核酸のアンチセンス鎖において、標的ヌクレオチド配列は、PAM配列の近傍に位置する配列、好ましくはPAM配列の5’側の近傍に位置する配列、さらに好ましくはPAM配列の5’側に隣接する配列から選択される。なお、本明細書において、「近傍に位置する」とは、隣接すること、および近くにあることの両方を包含する。また、本明細書において、「近傍」とは、隣接する位置または近くの位置の両方を包含する。なお、本明細書においては、特記しないかぎり、核酸のセンス鎖に基づいて記載される。
 CRISPRシステムの標的認識に利用されるPAM配列は、CRISPRシステムの種類によって異なる。M.aeruginosaのTiDシステムを用いる発明者らの以前の研究により、TiDシステムのPAM配列は、標的とする核酸のセンス鎖において、5’-GTH-3’(H=A、CまたはT)であり、標的核酸のアンチセンス鎖において、5’-HTG-3’(H=A、CまたはT)であることが明らかにされた(特許文献1)。
 例えば、標的ヌクレオチド配列は、上記PAM配列の近傍に位置し、かつ、標的遺伝子のイントロン内、コーディング領域内、非コーディング領域内、または制御領域内に存在する配列であってもよい。標的遺伝子は、任意の遺伝子であり、随意に選択すればよい。
 標的ヌクレオチド配列の長さは、例えば、10~70塩基長、好ましくは20~50塩基長、より好ましくは25~45塩基長、さらに好ましくは30~40塩基長の範囲である。
(5)本発明の標的配列改変方法
 本発明の標的配列改変方法は、上記の5つのCasタンパク質をコードするDNAを含むベクター系または発現カセット系と、crRNAまたはcrRNAをコードするDNAとを上記細胞中に導入することを特徴とする。本発明の標的配列改変方法は、TiDシステムにより、細胞中の標的ヌクレオチド配列が特異的に切断されることを含む。本発明の標的配列改変方法は、イン・ビトロおよびイン・ビボのいずれで行ってもよい。本発明において、改変には、少なくとも1つのヌクレオチドの欠失、挿入、または置換、あるいはそれらの組み合わせが含まれる。
 上記Casタンパク質をコードするDNAは、ベクター系または発現カセット系に含まれる。本明細書において、「ベクター系」および「発現カセット系」とは、それぞれ、2以上のベクターを含む群(すなわち、第一のベクターおよび第二のベクターを含む群)および2以上の発現カセットを含む群(すなわち、第一の発現カセットおよび第二の発現カセットを含む群)を意味する。ここで、ベクターは、対象細胞中に目的タンパク質をコードするDNAを運び、該細胞中で該目的タンパク質を発現させるための発現ベクターである。発現カセットとは、目的タンパク質をコードするDNAの転写を指示して該目的タンパク質の発現を可能にする核酸分子を意味する。発現カセットは、ベクターに含まれていてもよい。ベクターとしては、当該分野において一般的に使用される種々のベクターを使用することができ、特に限定されず、導入される細胞又は導入方法に応じて適宜選択することができる。例えば、限定するものではないが、プラスミドベクター、ウイルスベクター、レトロウイルスベクター、ファージ、ファージミド、コスミド、人工/ミニ染色体、トランスポゾン等が挙げられる。
 上記ベクターまたは発現カセットは、上記Casタンパク質をコードするDNAのほかに、該DNAの転写を調節するための調節エレメントを含み、該DNA配列は該調節エレメントに作動可能に連結されている。転写を調節するための調節エレメントとしては、例えば、プロモーター、エンハンサー、ターミネーター、内部リボソーム侵入部位(IRES)、ポリアデニル化シグナル、ポリU配列等が包含される。上記ベクターまたは発現カセットは、好ましくはプロモーターを含む。上記ベクターまたは発現カセットは、さらに、他の調節エレメントを含んでいてもよい。他の調節エレメントとしては、例えば、翻訳エンハンサー等が挙げられる。調節エレメントは、特に限定されず、例えば宿主細胞等に基づき当業者が適宜選択することができる。例えば、プロモーターとして、宿主が植物細胞である場合、CaMV35Sプロモーター、2xCaMV35Sプロモーター、CaMV19Sプロモーター、NOSプロモーター等が挙げられ、宿主が動物細胞である場合、SRαプロモーター、SV40プロモーター、LTRプロモーター、CMVプロモーター、RSVプロモーター、MoMuLV LTRプロモーター、HSV-TSプロモーター、ヒト翻訳伸長因子遺伝子プロモーター、CAGキメラ合成プロモーター等が挙げられる。特に、ヒト翻訳伸長因子遺伝子プロモーター、またはCAGキメラ合成プロモーターは、好ましくは、上記Casタンパク質をコードするDNAを動物細胞へ導入するために使用される。
 上記ベクター系または発現カセット系は、Cas3dをコードするDNA、Cas5dをコードするDNA、Cas6dをコードするDNA、Cas7dをコードするDNA、およびCas10dをコードするDNAを含み、ここに、第一のベクターまたは第一の発現カセットは、Cas3dをコードするDNA、Cas5dをコードするDNA、Cas6dをコードするDNA、Cas7dをコードするDNA、およびCas10dをコードするDNAからなる群より選択される少なくとも1つのDNAを含み、また、上記第二のベクターまたは第二の発現カセットは、Cas3dをコードするDNA、Cas5dをコードするDNA、Cas6dをコードするDNA、Cas7dをコードするDNA、およびCas10dをコードするDNAからなる群より選択される少なくとも1つのDNAを含む。
 上記5つのCasタンパク質Cas3d、Cas5d、Cas6d、Cas7dおよびCas10dをコードするDNAの2以上または全てが単一のベクターまたは発現カセット中に含まれていてもよく、または別々のベクターまたは発現カセット中に含まれていてもよい。ベクターまたは発現カセットの数、ならびに各ベクターまたは発現カセットに組み込むDNAがコードするCasタンパク質の種類および組み合わせに制限はない。上記Casタンパク質をコードする2以上のDNAが一つのベクター中に含まれる場合、これらのDNA配列は、ポリシストロニックに発現するように、例えば自己開裂型ペプチドをコードする配列等を介して、相互に連結されていてもよい。なお、上記Casタンパク質をコードする2以上のDNAを連結する順番は、いずれであってもよい。
 好ましくは、上記ベクター系または発現カセット系において、第二のベクターまたは第二の発現カセットは、Cas3dをコードするDNA、Cas5dをコードするDNA、Cas6dをコードするDNA、Cas7dをコードするDNA、およびCas10dをコードするDNAからなる群より選択される少なくとも1つのDNAであって、第一のベクターまたは第一の発現カセットに含まれていないDNAを含む。
 例えば、上記ベクター系または発現カセット系は、第一ないし第五のベクターまたは発現カセットを含んでいてもよく、Cas3dをコードするDNA、Cas5dをコードするDNA、Cas6dをコードするDNA、Cas7dをコードするDNA、およびCas10dをコードするDNAがそれぞれ別々の上記ベクターまたは発現カセットに含まれていてもよい。
 例えば、一の態様において、ベクター系が第一ないし第五のベクターを含み、Cas3dをコードするDNA、Cas5dをコードするDNA、Cas6dをコードするDNA、Cas7dをコードするDNA、およびCas10dをコードするDNAがそれぞれ別々の上記ベクターに含まれていてもよい。かかる態様は、好ましくは、上記Casタンパク質をコードするDNAを動物細胞へ導入するために使用される。
 例えば、上記ベクター系または発現カセット系において、第一のベクターまたは発現カセットが、Cas3dをコードするDNAおよびCas6dをコードするDNAを含み、第二のベクターまたは発現カセットが、Cas5dをコードするDNA、Cas7dをコードするDNA、およびCas10dをコードするDNAを含んでいてもよい。
 例えば、一の態様において、第一の発現カセットが、Cas3dをコードするDNAおよびCas6dをコードするDNAを含み、第二の発現カセットが、Cas5dをコードするDNA、Cas7dをコードするDNA、およびCas10dをコードするDNAを含み、かつ、第一の発現カセットおよび第二の発現カセットが1つのベクターに搭載されていてもよい。かかる態様は、好ましくは、上記Casタンパク質をコードするDNAを植物細胞へ導入するために使用される。
 本発明の標的配列改変方法においては、上記Casタンパク質をコードするDNAを含むベクター系または発現カセット系およびcrRNAまたはcrRNAをコードするDNAに加えて、ドナーポリヌクレオチドを細胞中に導入してもよい。ドナーポリヌクレオチドは、標的部位に導入したい改変を含む少なくとも1つのドナー配列を含む。ドナーポリヌクレオチドは、ドナー配列に加えて、該ドナー配列の両端に標的配列の上流および下流の配列と相同性の高い配列(好ましくは、標的配列の上流および下流の配列と実質的に同一の配列)を含んでいてもよい。ドナーポリヌクレオチドは、一本鎖または二本鎖のDNAであってもよい。ドナーポリヌクレオチドは、当該分野で既知の技術に基づいて当業者が適宜設計することができる。
 本発明の標的配列改変方法においてドナーポリヌクレオチドが存在しない場合、標的ヌクレオチド配列における切断は、非相同末端結合(NHEJ)により修復されうる。NHEJはエラーが発生しやすいことが知られており、少なくとも1つのヌクレオチドの欠失、挿入、または置換、あるいはそれらの組み合わせが該切断の修復中に起こりうる。かくして、該配列は、標的配列部位において改変され、それにより、フレームシフトや未成熟終止コドンを誘発し、標的配列領域がコードしている遺伝子の発現が不活性化またはノックアウトされる。
 本発明の標的配列改変方法においてドナーポリヌクレオチドが存在する場合、ドナーポリヌクレオチドのドナー配列は、切断された標的ヌクレオチド配列の相同組換え修復(HDR)により、標的配列部位に挿入されるか、または標的配列部位がドナー配列に置換される。その結果、標的配列部位に所望の改変が導入される。
 上記Casタンパク質をコードするDNAを含むベクター系または発現カセット系およびcrRNAまたはcrRNAをコードするDNAの細胞中への導入は、当該分野で知られた種々の手段によって行うことができる。ドナーポリヌクレオチドを用いる場合、ドナーポリヌクレオチドもまた、当該分野で知られた種々の手段によって細胞中に導入すればよい。例えば、トランスフェクション、例えば、リン酸カルシウム仲介性トランスフェクション、エレクトロポレーション、リポソームトランスフェクション等、ウイルス形質導入、リポフェクション、遺伝子銃、マイクロインジェクション、アグロバクテリウム法、アグロインフィルトレーション法、PEG-カルシウム法等が挙げられる。
 上記Casタンパク質をコードするDNAを含むベクター系または発現カセット系、およびcrRNAまたはcrRNAをコードするDNAは、同時にまたは連続的に細胞中に導入すればよい。また、上記のベクター系または発現カセット系に含まれる2以上のベクターまたは発現カセットは、同時にまたは連続的に細胞中に導入すればよい。ドナーポリヌクレオチドを用いる場合、該ドナーポリヌクレオチドは、上記Casタンパク質をコードするDNAを含むベクター系または発現カセット系およびcrRNAまたはcrRNAをコードするDNAと同時にまたは連続的に細胞中に導入すればよい。
 上記Casタンパク質をコードするDNAを含むベクター系または発現カセット系、およびcrRNAまたはcrRNAをコードするDNAの細胞中への導入の際、該細胞は、標的配列部位での切断に適当な条件下で培養される。次いで、該細胞は、細胞増殖および維持に適当な条件下で培養される。ドナーポリヌクレオチドを導入する際も同様である。培養条件は、導入される細胞が由来する生物種に適切な培養条件であればよく、例えば、既知の細胞培養技術に基づいて当業者により適宜決定可能である。
 本発明の標的配列改変方法によれば、細胞中に導入されたTiDシステムにより標的ヌクレオチド配列上の部位が切断され、該切断配列の修復時に、標的配列が改変される。例えば、本発明の標的配列改変方法は、ゲノム上の標的ヌクレオチド配列の改変のために用いることができ、該方法によりゲノム上の二本鎖DNAが切断され、標的部位が改変される。
 さらに、本発明の標的配列改変方法において、標的ヌクレオチド配列として、標的遺伝子の配列の少なくとも一部の配列を選択することにより、当該標的遺伝子の発現を抑制することができる。かくして、本発明の標的配列改変方法のさらなる態様として、細胞内の標的遺伝子の発現を抑制する方法であって、該細胞に、
 (i)CRISPRタイプI-DのCasタンパク質 Cas3dをコードするDNA、Cas5dをコードするDNA、Cas6dをコードするDNA、Cas7dをコードするDNA、及びCas10dをコードするDNAを含むベクター系又は発現カセット系、及び
 (ii)前記標的遺伝子の少なくとも一部のヌクレオチド配列と塩基対を形成する配列を含むcrRNA、又は前記crRNAをコードするDNA
を導入することを含み、
 前記ベクター系が、第一のベクター及び第二のベクターを含み、
 前記発現カセット系が、第一の発現カセット及び第二の発現カセットを含み、
 前記第一のベクター又は前記第一の発現カセットが、Cas3dをコードするDNA、Cas5dをコードするDNA、Cas6dをコードするDNA、Cas7dをコードするDNA、及びCas10dをコードするDNAからなる群より選択される少なくとも1つのDNA、及び前記DNAの転写を調節する第一の調節エレメントを含み、
 前記第二のベクター又は前記第二の発現カセットが、前記群より選択される少なくとも1つのDNA、及び前記DNAの転写を調節する第二の調節エレメントを含む、方法が提供される。
 本発明の標的配列改変方法によれば、上記の5つのCasタンパク質をコードするDNAがベクター系または発現カセット系、すなわち、2以上のベクターまたは発現カセット中に存在していることを特徴とする。上記Casタンパク質は、該ベクター系または発現カセット系を介して細胞中で発現することにより、同時に導入されたcrRNAと共に作用して、標的ヌクレオチド配列を特異的かつ効率よく改変する。
 好ましい一の態様において、本発明の標的配列改変方法は、上記の第一のベクターまたは発現カセットおよび第二のベクターまたは発現カセットを含むベクター系または発現カセット系であって、第二のベクターまたは第二の発現カセットが、Cas3dをコードするDNA、Cas5dをコードするDNA、Cas6dをコードするDNA、Cas7dをコードするDNA、およびCas10dをコードするDNAからなる群より選択される少なくとも1つのDNAであって、第一のベクターまたは第一の発現カセットに含まれていないDNAを含む、ベクター系または発現カセット系を用いる。また別の態様において、Cas3dをコードするDNA、Cas5dをコードするDNA、Cas6dをコードするDNA、Cas7dをコードするDNA、およびCas10dをコードするDNAからなる群より選択される少なくとも1つのDNAは、第一のベクターまたは第一の発現カセットおよび第二のベクターまたは第二の発現カセットの両方に含まれていてもよい。このように、Cas3d、Cas5d、Cas6d、Cas7dおよびCas10dをそれぞれコードする5つのDNAが2以上の異なるベクターまたは発現カセットに別れて含まれる場合、該ベクターまたは発現カセットを利用するTiDは、細胞中でCasタンパク質のより高レベルの発現を導き、より強力な標的配列改変効果をもたらす。
 例えば、本発明の標的配列改変方法は、好ましくは、5つのベクターを含むベクター系であって、上記の5つのCasタンパク質をコードするDNAの各々が互いに異なるベクター中に含まれているベクター系を用いる。さらに好ましくは、上記ベクターは、ヒト翻訳伸長因子遺伝子プロモーターまたはCAGキメラ合成プロモーターを含む。また、本発明の方法において、好ましくは、Cas3dをコードするDNA、Cas5dをコードするDNA、Cas6dをコードするDNA、およびCas10dをコードするDNAの5’末端側には、1個のモノパータイト型核移行シグナルをコードする配列が付加されているか、あるいは2個または3個のタンデムに連結したモノパータイト型核移行シグナルをコードする配列が付加されている。あるいは、本発明の方法において、好ましくは、Cas3dをコードするDNA、Cas5dをコードするDNA、Cas6dをコードするDNA、およびCas10dをコードするDNAの5’末端側および3’末端側の両方には、バイパータイト型核移行シグナルをコードする配列が付加されている。さらに、本発明の方法において、好ましくは、Cas7dをコードするDNAの5’末端および/または3’末端側には、2個又は3個のタンデムに連結したモノパータイト型核移行シグナルをコードする配列が付加されている。また、本発明の方法において、好ましくは、上記発現カセット系が2つの発現カセットを含み、Cas3dをコードするDNAおよびCas6dをコードするDNAが第一の発現カセットに含まれ、Cas5dをコードするDNA、Cas7dをコードするDNA、およびCas10dをコードするDNA第二の発現カセットに含まれ、該第一および第二の発現カセットは1つのベクターに搭載されている。
 本発明の標的配列改変方法によれば、標的配列に、数塩基から数十塩基の短鎖領域の挿入および/または欠失を導入するだけでなく、数キロベースないし数十キロベースの長鎖領域の塩基欠失も導入することができる。数キロベースないし数十キロベースとしては、限定するものではないが、例えば1000~90000塩基長、好ましくは2000~80000塩基長、より好ましくは2000~70000塩基長、さらに好ましくは2000~60000塩基長、2000~50000塩基長、2000~40000塩基長、2000~30000塩基長、または2000~20000塩基長が挙げられる。あまりに長い欠失では、標的とする遺伝子の目的以外の配列(例えば、隣接する別の遺伝子の配列)の欠失を生じたり、標的とするエキソン領域のみならず隣接する必要なエキソン配列の欠失を生じたりすることもあるが、本発明のように「数キロベースないし数十キロベース」程度の適度に長い領域の欠失であれば、目的の遺伝子の長鎖欠失のみを導入することができる。したがって、本発明の標的配列改変方法を用いれば、1つのガイドRNAを設計するだけで、1遺伝子座全体を欠失させることが可能となる。また、本発明の標的配列改変方法を用いれば、動物の遺伝子のように長いイントロンが存在する場合でも、特定のエキソンを完全に欠落させることも可能である。さらに、本発明の標的配列改変方法を用いれば、隣接して存在する遺伝子群をまとめて欠落させることも可能である。
 本発明の標的配列改変方法によれば、PAM配列の上流方向または下流方向、あるいはPAM配列の上流および下流の両方(すなわち、二方向性)の塩基欠失をもたらすことができる。
(6)本発明のキット
 本発明のキットは、上記の本発明の標的配列改変方法に使用するためのキットであり、上記の5つのCasタンパク質をコードするDNAを含む上記ベクター系または発現カセット系と、上記crRNAまたは上記crRNAをコードするDNAを含む。本発明のキットの構成成分については、上記(2)~(5)に記載のとおりである。
(7)本発明のオフターゲット効果を抑制した標的配列ターゲティング方法
 本発明のオフターゲット効果を抑制した標的配列ターゲティング方法は、上記標的認識モジュール(Cas5d、Cas6dおよびCas7d)または該Casタンパク質をコードする核酸と、上記crRNAまたはcrRNAをコードするDNAとを上記細胞中に導入することを含み、かつ、標的配列に対して、PAM配列の3’側から1、6、12、18および24番目の塩基からなる群から選ばれるいずれか1つの塩基、あるいは24番目以降の1つまたは2つの塩基が相違している類似配列が存在しないように標的配列を設計(または選択)することを特徴とする。さらに、標的配列が比較的短い(例えば、30塩基長以下)場合は、PAM配列の3’側から6、12、18および24番目の塩基からなる群から選ばれるいずれか1つの塩基、あるいは24番目以降の1つまたは2つの塩基が相違している類似配列が存在しないように標的配列を設計(または選択)してもよい。このような標的配列を選択することにより、TiDの標的認識モジュールによるオフターゲット効果が抑制され、より効率的かつ特異的な標的配列の標的化(ターゲティング)が実現する。本発明のオフターゲット効果を抑制した標的配列ターゲティング方法は、イン・ビトロおよびイン・ビボのいずれで行ってもよい。本発明の標的配列ターゲティング方法によれば、crRNAと、上記標的認識モジュールとcrRNAが複合体を形成し、同時に、該crRNAが標的ヌクレオチド配列と塩基対を形成し、該標的認識モジュールが標的ヌクレオチド配列近傍のPAM配列を認識することにより、配列特異的に標的ヌクレオチド配列を標的化する。
 上記標的認識モジュールは、Cas5d、Cas6d、およびCas7dを含む単離された複合体として細胞中に導入されてもよく、またはCas5d、Cas6d、およびCas7dの各々が単離されたタンパク質として単独で細胞中に導入されてもよい。また、上記標的認識モジュールは、上記Casタンパク質Cas5d、Cas6d、およびCas7dをコードする核酸として細胞中に導入されてもよい。該核酸としては、例えば、mRNA等のRNA、またはDNAが挙げられる。
 上記Casタンパク質をコードするDNAは、例えば、1以上のベクターまたは発現カセット中に含まれていてもよく、該DNA配列は、好ましくは、調節エレメントに作動可能に連結されている。上記標的認識モジュールを導入する細胞が真核細胞である場合、好ましくは、上記Casタンパク質をコードするDNAに核移行シグナル配列が付加される。上記Casタンパク質Cas5d、Cas6d、およびCas7dをコードするDNAの2以上または全てが単一のベクターまたは発現カセット中に含まれていてもよく、または別々のベクターまたは発現カセット中に含まれていてもよい。上記Casタンパク質をコードする2以上のDNAが一つのベクターまたは発現カセット中に含まれる場合、これらのDNA配列は、ポリシストロニックに発現するように、例えば自己開裂型ペプチドをコードする配列等を介して、相互に連結されていてもよい。なお、上記Casタンパク質をコードする2以上のDNAを連結する順番は、いずれであってもよい。ベクター、発現カセット、調節エレメント、核移行シグナル配列等については、上記(5)に記載のとおりである。crRNAについては、上記(3)に記載のとおりである。
 上記標的認識モジュールおよびcrRNAまたはcrRNAをコードするDNAの細胞中への導入は、当該分野で知られた種々の手段によって行うことができる。例えば、トランスフェクション、例えば、リン酸カルシウム仲介性トランスフェクション、エレクトロポレーション、リポソームトランスフェクション等、ウイルス形質導入、リポフェクション、遺伝子銃、マイクロインジェクション、アグロバクテリウム法、アグロインフィルトレーション法、PEG-カルシウム法等が挙げられる。
 上記標的認識モジュールおよびcrRNAまたはcrRNAをコードするDNAは、同時にまたは連続的に細胞中に導入すればよい。また、上記標的認識モジュールを構成するCas5d、Cas6d、およびCas7d、またはこれらの各Casタンパク質をコードする核酸は、同時にまたは連続的に細胞中に導入すればよい。例えば、イン・ビトロまたはイン・ビボにおいてそれぞれ合成した上記Casタンパク質Cas5d、Cas6dおよびCas7dと、イン・ビトロまたはイン・ビボにおいて合成したcrRNAを、イン・ビトロにおいてインキュベートして複合体を形成させ、該複合体を細胞中に導入することができる。
 上記標的認識モジュールおよびcrRNAまたはcrRNAをコードするDNAの導入の際、細胞は、標的ヌクレオチド配列のターゲティングに適当な条件下で培養される。次いで、該細胞は、細胞増殖および維持に適当な条件下で培養される。培養条件は、該細胞が由来する生物種に適切な培養条件であればよく、例えば、既知の細胞培養技術に基づいて当業者により適宜決定可能である。
(8)本発明のオフターゲット効果を抑制した標的配列改変方法
 本発明のオフターゲット効果を抑制した標的配列改変方法は、上記の5つのCasタンパク質または該タンパク質をコードする核酸と、上記crRNAまたはcrRNAをコードするDNAとを上記細胞中に導入することを含み、かつ、標的配列に対して、PAM配列の3’側から1、6、12、18および24番目の塩基からなる群から選ばれるいずれか1つの塩基、あるいは24番目以降の1つまたは2つの塩基が相違している類似配列が存在しないように標的配列を設計(または選択)することを特徴とする。さらに、標的配列が比較的短い(例えば、30塩基長以下)場合は、PAM配列の3’側から6、12、18および24番目の塩基からなる群から選ばれるいずれか1つの塩基、あるいは24番目以降の1つまたは2つの塩基が相違している類似配列が存在しないように標的配列を設計(または選択)してもよい。このような標的配列を選択することにより、TiDのオフターゲット効果が抑制され、より効率的かつ特異的な標的配列の改変が実現する。本発明において、改変には、少なくとも1つのヌクレオチドの欠失、挿入、または置換、あるいはそれらの組み合わせが含まれる。本発明のオフターゲット効果を抑制した標的配列改変方法は、イン・ビトロおよびイン・ビボのいずれで行ってもよい。
 本発明のオフターゲット効果を抑制した標的配列改変方法においては、上記のCasタンパク質およびcrRNAに加えて、ドナーポリヌクレオチドを細胞中に導入してもよい。ドナーポリヌクレオチドについては、上記(5)に記載のとおりである。
 上記Casタンパク質は、Cas5d、Cas6d、Cas7d、Cas3d、およびCas10dを含む単離された複合体として細胞中に導入されてもよく、またはCas5d、Cas6d、Cas7d、Cas3d、およびCas10dの各々が単離されたタンパク質として単独で細胞中に導入されてもよい。あるいは、上記Casタンパク質Cas5d、Cas6d、Cas7d、Cas3d、およびCas10dをコードする核酸として細胞中に導入されてもよい。該核酸としては、例えば、mRNA等のRNA、またはDNAが挙げられる。
 上記Casタンパク質をコードするDNAは、例えば、1以上のベクターまたは発現カセット中に含まれていてもよく、該DNA配列は、好ましくは、調節エレメントに作動可能に連結されている。上記細胞が真核細胞である場合、好ましくは、上記Casタンパク質をコードするDNAに核移行シグナル配列が付加される。上記Casタンパク質Cas3d、Cas5d、Cas6d、Cas7d、およびCas10dをコードするDNAの2以上または全てが単一のベクターまたは発現カセット中に含まれていてもよく、または別々のベクターまたは発現カセット中に含まれていてもよい。上記Casタンパク質をコードする2以上のDNAが一つのベクターまたは発現カセット中に含まれる場合、これらのDNA配列は、ポリシストロニックに発現するように、例えば自己開裂型ペプチドをコードする配列等を介して、相互に連結されていてもよい。なお、上記Casタンパク質をコードする2以上のDNAを連結する順番は、いずれであってもよい。ベクター、発現カセット、調節エレメント、核移行シグナル配列等については、上記(5)に記載のとおりである。crRNAについては、上記(3)に記載のとおりである。
 上記Casタンパク質またはCasタンパク質をコードする核酸、crRNAまたはcrRNAをコードするDNA、およびドナーポリヌクレオチドの細胞中への導入は、当該分野で知られた種々の手段によって行うことができる。例えば、トランスフェクション、例えば、リン酸カルシウム仲介性トランスフェクション、エレクトロポレーション、リポソームトランスフェクション等、ウイルス形質導入、リポフェクション、遺伝子銃、マイクロインジェクション、アグロバクテリウム法、アグロインフィルトレーション法、PEG-カルシウム法等が挙げられる。
 上記Casタンパク質またはCasタンパク質をコードする核酸、crRNAまたはcrRNAをコードするDNA、およびドナーポリヌクレオチドは、同時にまたは連続的に細胞中に導入すればよい。また、上記RNA誘導性エンドヌクレアーゼを構成するCas3d、Cas5d、Cas6d、Cas7d、およびCas10d、またはこれらの各Casタンパク質をコードする核酸は、同時にまたは連続的に細胞中に導入すればよい。
 上記Casタンパク質またはCasタンパク質をコードする核酸およびcrRNAまたはcrRNAをコードするDNA、または上記Casタンパク質またはCasタンパク質をコードする核酸、crRNAまたはcrRNAをコードするDNA、およびドナーポリヌクレオチドの導入の際、細胞は、標的配列部位での切断に適当な条件下で培養される。次いで、該細胞は、細胞増殖および維持に適当な条件下で培養される。培養条件は、該細胞が由来する生物種に適切な培養条件であればよく、例えば、既知の細胞培養技術に基づいて当業者により適宜決定可能である。
 以下に、本発明の実施例を示した。ただし、本発明はこれらの実施例に限定されない。
 実施の一形態として、M.aeruginosa由来のTiD遺伝子座由来の遺伝子群(Cas3d、Cas5d、Cas6d、Cas7d、Cas10d)を、クローン化して用いた。M.aeruginosa由来のCas3d、Cas5d、Cas6d、Cas7d、およびCas10dのアミノ酸配列情報(配列番号1~5)を基に、各Casタンパク質をコードするDNA配列を人工合成した。実施例中のDNA配列の加工および構築操作には、人工遺伝子化学合成、PCR法、制限酵素処理、ライゲーション、Gibson Assembly法のいずれかを用いた。また、塩基配列の決定にはサンガー法あるいは次世代シーケンス法を用いた。
<方法>
(1)ベクターの構築
 遺伝子フラグメントのクローニングのためのPCR増幅は、PrimeSTAR Max(TaKaRa)を用いて行た。アセンブリングのためのクローニングは、Quick ligation kit(NEB)、NEBuilder HiFi DNA Assembly(NEB)、およびMultisite gateway Pro(Thermo Fisher Scientific)を用いて行った。
(1-1)哺乳動物ベクター
 ヒトコドンに最適化したCasエフェクター遺伝子(Cas3d、Cas5d、Cas6d、Cas7d、およびCas10d)をN末端のSV40核移行シグナル(NLS)(配列番号6)と共に合成し(gBlocks(登録商標))(IDT)、アセンブルし、pEFsベクター(Lopez-Perrote et al,(2016), Nucleic Acids Res, 44:1909-1923. doi:10.1093/nar/gkv1527)中に別々にクローン化して、pEFs-HA-SV40NLS-Cas3d、pEFs-Strept-SV40NLS-Cas5d、pEFs-myc-SV40NLS-Cas6d、pEFs-FLAG-SV40NLS-Cas7d、およびpEFs-6xHis-SV40NLS-Cas10dを得た(単一Cas発現ベクター)。各Casタンパク質に融合したタグは以下のとおりである。すなわち、HA-タグをCas3dに、Strep-タグをCas5dに、Myc-タグをCas6dに、FLAG-タグをCas7dに、6xHis-タグをCas10dに付加した。さらに、すべてのCas遺伝子を、2A自己切断ペプチドをコードしている配列との融合によって、オールインワンベクターpEFs-All中で組み合わせた。2A自己切断ペプチドに連結することによって、pEFs_Cas3d-Cas10d発現ベクターおよびpEFs_Cas6d-Cas5d-Cas7d発現ベクター(2セット型ベクター)も構築した。
 Cas5dおよびCas6dを発現するための異なるプロモーターを評価するために、pEFs-Strept-SV40NLS-Cas5dおよびpEFs-Myc-SV40NLS-Cas6dにおいてヒトEFsプロモーターをCAGプロモーターに置き換えて、pCAG-Strept-SV40NLS-Cas5dまたはpCAG-Myc-SV40NLS-Cas6dを得た。
 バイパータイトNLS(bpNLS)(配列番号7)を用いてCas-発現ベクターを構築するために、DNAフラグメント(myc-bpNLS-Cas10d-bpNLS-6xHis)をまず合成し(IDT)、pEFsベクター中にクローン化して、pEFs-Myc-bpNLS-Cas10d-bpNLS-6xHisベクターを得た。pEFs-Myc-bpNLS-Cas10d-bpNLS-6xHisベクター中のCas10d遺伝子フラグメントを、Cas3d、Cas5d、Cas6dおよびCas7d遺伝子フラグメントでそれぞれ置き換えて、pEFs-Myc-bpNLS-Cas3d-bpNLS-6xHis、pEFs-Myc-bpNLS-Cas5d-bpNLS-6xHis、pEFs-Myc-bpNLS-Cas7d-bpNLS-6xHis、およびpEFs-Myc-bpNLS-Cas10d-bpNLS-6xHisを得た。
 変異Cas10d(H177A)発現ベクターを構築するために、dCas10d(H177A)フラグメントを合成し(IDT)、野生型Cas10dフラグメントpEFs-Myc-bpNLS-Cas10d-bpNLS-6xHisをdCas10d(H177A)で置換して、pEFs-myc-bpNLS-Cas(H177A)-bpNLS-6xHisを得た。pEFs-Myc-bpNLS-Cas7d-bpNLS中のMyc-bpNLS-Cas7d-bpNLS-6xHisフラグメントを6xHis-myc-Cas7d-bpNLSフラグメントで置換して、pEFs-6xHis-myc-bpNLS-Cas7d-bpNLSを得た。
 crRNA発現ベクターのために、リピート-スペーサー-リピート配列(配列番号9)を含有するDNAフラグメントを人工合成し、pEX-A2J1(Eurofins Genomics)中、ヒトU6プロモーター下でクローン化して、pAEX-hU6crRNAを得た。pAEX-hU6crRNA_matureを構築するために、2つのリピート配列を予測されたプロセスリピート配列(predicted processed repeat sequences)(配列番号10)に置き換えた。gRNA配列の挿入のために、標的配列を含有する2つのオリゴヌクレオチドをアニールし、制限酵素BsaI(NEB)を用いるGolden Gateクローニングを用いて、crRNA発現ベクター中にクローン化した。
Figure JPOXMLDOC01-appb-T000001
(1-2)ルシフェラーゼレポーターアッセイプラスミド
 ルシフェラーゼ(luc)レポーターアッセイのために、NanoLUxxUC発現ベクターを構築した。まず、NLUxxUC_Block1およびNLUxxUC_Block2 DNAフラグメントを合成した(IDT社製)。NLUxxUC_Block1は、NanoLUCTM(登録商標)遺伝子(Promega社製)配列の最初の351bpおよびマルチクローニングサイトを含む。XbaI部位をNanoLUC遺伝子の5’末端に付加した。NLUxxUC_Block2は、NanoLUC遺伝子の3’末端の465bpを含む。XhoI部位をNanoLUC遺伝子の3’末端に付加した。これらのフラグメントをアセンブルし、pCAG-EGxxFPベクター(addgene、#50716)中にクローン化した。NLUxxUC_Block1をXbaIおよびBamHI消化によって、NLUxxUC_Block2をXbaIおよびEcoRI消化によって、pCAG-NLUxxUCベクターから除去することによって、各スプリットタイプNLUxxUCレポーターを構築した。各消化ベクターをマルチクローニングサイトと共にアセンブルし、pCAG-NLUxxUC_Block1およびpCAG-NLUxxUC_Block2を得た。
(1-3)植物ベクター
 トマトコドン最適化Casエフェクター遺伝子(Cas3d、Cas5d、Cas6d、Cas7d、およびCas10d)に対応する遺伝子フラグメントを、N末端の2xSV40核移行シグナル(NLS)と共に合成し(IDT社製)、アセンブルし、pNEB193(New England Biolabs Japan製)ベクター中にクローン化した。配列を確認後、5つのCas遺伝子を2A自己切断ペプチド配列を介して連結することによってリアセンブルし、Cas遺伝子発現カセットを、pEgP237-2A-GFP(Ueta et al., 2017, Sci. Rep, 7:507. doi: 0.1038/s41598-017-00501-4)の2xCaMV35SプロモーターとArabidopsis HSP18.2遺伝子ターミネーターとの間にクローン化して、pEgP1.2-TiDを得た。
 crRNA発現ベクターを構築するために、リピート-スペーサー-リピート配列を含有するDNAフラグメントを、pDONR P3-P2中のArabidopsis U6-26 snRNAプロモーター下にクローン化して、pE(L3-L2)AtU6crRNAを得た。pE(L3-L2)AtU6crRNA中のAtU6プロモーター-リピート-スペーサー-リピートフラグメントをpEgP1.2-TiD中に再クローン化して、pTiDP1.2を得た。
 pMGTiDP20を構築するために、マルチサイトゲータウェイアセンブリングのための中間ベクターpE(L1-L4)P1.2-Cas3d-Cas6d-GFPおよびpE(R4-R3)Ppubi4-Cas10d-Cas5d-Cas7dを構築した。2xCaMV35Sプロモーターによって駆動されるCas3d、Cas6dおよびGFP遺伝子フラグメント、およびArabidopsis HSP18.2遺伝子ターミネーターをpDONR P1-P4中にクローン化して、pE(L1-L4)P1.2-Cas3d-Cas6d-GFPを得た。pEgPubi4_237-2A-GFP由来のP.crispumユビキチン4-2プロモーター(Ppubi4)(Ueta et al. 2017 上掲)によって駆動されるCas10d、Cas5dおよびCas7d遺伝子フラグメント、およびArabidopsisリブロース-1,5-ビホスフェート カルボキシラーゼ/オキシゲナーゼ小サブユニット2b(rbc)ターミネーターをpDONR P4r-P3r中にクローン化して、pE(R4-R3)Ppubi4-Cas10d-Cas5d-Cas7dを得た。pE(L1-L4)P1.2-Cas3d-Cas6d-GFP、pE(R4-R3)Ppubi4-Cas10d-Cas5d-Cas7d、pE(L3-L2)AtU6crRNA、および目的のバイナリーベクターpTGW12を用いてマルチサイトゲータウェイLR反応を行って、pMGTiDP20を得た。
 gRNA配列の挿入のために、標的配列を含有する2つのオリゴヌクレオチドをアニールし、制限酵素BsaI(New England Biolabs Japan製)を用いてpTiDP1.2またはpMGTiDP20のスペーサー配列中にゴールデンゲータウェイクローニングすることによって、gRNA発現ベクター中にクローン化した。
(2)細胞培養およびトランスフェクション
 ヒト胚性腎細胞株293T(HEK293T,RIKEN BRC)を、10%胎仔ウシ血清(Thermo Fisher Scientific)、GlutalMAX(登録商標)サプリメント(Thermo Fisher Scientific)、100単位/mLペニシリン、および100μg/mLストレプトマイシンを補足したダルベッコ改変イーグル培地(DMEM)中、37℃で60分、5%COインキュベーションで培養した。トランスフェクションの前日にHEK293T細胞を6ウェルプレート(Corning, USA)に播種した。TurboFect Transfection Reagent(Thermo Fisher Scientific)を製造者の推奨プロトコルに従って用いて、細胞をトランスフェクトした。6ウェルプレートの各ウェルについて、NucleoSpin(登録商標)Plasmid Transfection-gradeキット(Macherey-Nagel, Germany)を用いて抽出された全4μgのプラスミドを用いた。変異分析のために、48時間後にトランスフェクト細胞を回収した。
(3)イン・ビトロ ヌクレアーゼアッセイ
 イン・ビトロ ヌクレアーゼアッセイは、Sinkunas et al. (2011) EMBO J., 30, 1335-42に記載のプロトコルにいくつか修正を加えて行った。M13mp18一本鎖DNA(New England Biolabs Japan製)を基質として用いた。Cas3dおよびCas10dタンパク質は、Unitech, Co.(Kashiwa, Japan)によって調製された。簡単に言うと、Cas3dおよびCas10dタンパク質を、各His-タグ付加したCasタンパク質を発現しているHEK293T細胞から、Ni-NTAアガロース(Qiagen,Germany)およびゲルろ過カラム(Superdex 200 増加 10/300 GLカラム)を用いて精製した。Casタンパク質をバッファー(20mM HEPES pH7.5、150mM KCl、1mM DTT、10%グリセロール)中で溶出させた。ヌクレアーゼ反応は、バッファー[10mM HEPES pH7.5、75mM KCl、0.5mM DTT、5%グリセロール、2mM ATP、100μM NiCl、100μM CoCl、1xCut Smart Buffer(New England Biolabs Japan製)、4nM M13mp18 ssDNA、0.75μM Casタンパク質]中、37℃で30分、1時間および2時間行った。クロロホルムを加えて反応を停止し、次いで、クロロホルム抽出を行った。水相を分離し、ゲルローディングダイPurple(6X)(NEB)と混合し、次いで、1%アガロースゲル上の電気泳動に付した。DNAは、GelRed(登録商標)Nucleic Acid Gel Stain(Biotium,USA)での染色によって可視化した。実験は独立して3回繰り返し、同様の結果を得た。
(4)ルシフェラーゼレポーターアッセイ
 トランスフェクションの前日に、HEK293T細胞を96ウェルプレート(Corning)に、密度2.0x10細胞/ウェルで播種した。TurboFect Transfection Reagent(Thermo Fisher Scientific)を製造者の推奨するプロトコルに従って用いて、細胞をトランスフェクトした。96ウェルプレートの各ウェルについて、(1)Fluc遺伝子をコードするpGL4.53ベクター(Promega,USA)、(2)標的DNA フラグメントを挿入したpCAG-nLUxxUCベクター、および(3)TiD成分をコードしているプラスミドDNAを含む全200ngのプラスミドDNAを用いた。NanoLucおよびFlucルシフェラーゼ活性は、トランスフェクションの3日後に、Nano-Glo(登録商標)Dual-Luciferase(登録商標)Reporter Assay System(Promega)を用いて測定した。ホタル(Fluc)活性を内部対照として用いた。NanoLuc/Fluc比を各サンプルについて計算し、非標的化gRNAでトランスフェクトした対照サンプルのNanoLuc/Fluc比と比較した。相対的NanoLuc/Fluc活性を用いて、gRNA活性を評価した。実験は独立して3回繰り返し、同様の結果を得た。
(5)ウェスタンブロッティング
 HEK293T細胞を6ウェルプレート中、4μgのプラスミドDNAでトランスフェクトした。トランスフェクションの2日後に、Protease Inhibitor Cocktail for Use with Mammalian Cell and Tissue Extracts(Nakalai Tesque, Japan)を補足したRIPA Lysis and Extraction Buffer(Thermo Scientific)を製造者のプロトコルに従って用いて、全タンパク質をHEK293T細胞から抽出した。核および細胞質タンパク質の単離について、NE-PER(登録商標)Nuclear and Cytoplasmic Extraction Reagents(Thermo Fisher Scientific)を用いた。
 抽出したタンパク質を、PierceTM BCA Protein Assay Kit(Thermo Fisher Scientific)を用いて定量した。サンプルを4x Laemmli Sample buffer(Bio-Rad,USA)および2.5%β-メルカプトエタノールと混合し、次いで、95℃で5分間熱処理した。変性タンパク質をTris-Glycine-SDSバッファー[0.25M Tris、1.92Mグリシン、1%(w/v)SDS]を含有する12%SDS-PAGEゲルにロードし、150Vで60分間のSDS-PAGEによって分離した。タンパク質を20%メタノールを含有するTris-グリシン-SDSバッファー中、50Vで2時間、Immobilon-P ポリビニリデンフルオリド(PVDF)膜(Millipore,USA)上に移した。TTBS(25mM Tris、137nM NaCl、2.68nM KCl)によって、5分で3回ブロットを洗浄し、室温にて、Blocking One(Nacalai Tesque,Japan)中で60分間ブロックした。一次抗体反応は、室温で60分間行った。膜をTTBSで5分間3回洗浄後、二次抗体 抗マウスIgG(H+L),HRPコンジュゲート(Promega社製、Blocking one中1:10000)を膜に加えた。室温で60分間インキュベーション後、膜をTTBSで5分間3回洗浄した。シグナルは、SuperSignal(登録商標)West Pico PLUS Chemiluminescent Substrate(Thermo Fisher Scientific)を用いて製造者のプロトコルに従って検出した。画像は、ImageQuant LAS4000 mini(GE Healthcare Bioscience, USA)を用いて得た。該実験で用いられた一次抗体は以下の通りである。抗-DDDDK-タグmAb(1:10,000)(MBL, Japan)、抗-HA-タグmAb(1:10,000)(MBL)、抗-His-タグmAb(1:10,000)(MBL)、抗-Myc-タグmAb(1:10,000)(MBL)、抗-Strep-タグmAb(1:1000)(MBL)、抗-β-アクチンmAb(1:10000)(MBL)。実験は独立して3回繰り返し、同様の結果を得た。
(6)免疫沈降
 HEK293T細胞を60mmディッシュ上で、TurboFect Transfection Reagent(Thermo Fisher Scientific)を用いて、1μgの各Cas発現ベクター(pEFs-FLAG-SV40NLS-Cas7d、pEFs-Myc-bpNLS-Cas3d-bpNLS-6xHis、pEFs-Myc-bpNLS-Cas5d-bpNLS-6xHis、pEFs-Myc-bpNLS-Cas6d-bpNLS-6xHis、pEFs-Myc-bpNLS-Cas7d-bpNLS-6xHis、pEFs-Myc-bpNLS-Cas10d-bpNLS-6xHis)およびgRNA発現ベクターでトランスフェクトした。タンパク質抽出は、Katoh et al., (2015) J. Cell Sci., 128, 2351-2362に記載のプロトコルに従って、トランスフェクションの48時間後に行った。簡単に言うと、培地をProtease Inhibitor Cocktail for Use with Mammalian Cell and Tissue Extracts(Nacalai Tesque)を含有する溶解バッファー(20mM HEPES、150mM NaCl、0.1%(w/v)Triton X-100、10%(w/v)グリセロール)に置換し、氷上で5分間インキュベートした。細胞ライゼートをピペッティングによって混合し、1.5mlチューブに移し、次いで、氷上で15分間インキュベートした。FLAG-NLS-Cas7dタンパク質を含有するCascade複合体の精製は、DDDDK-タグ付加したProtein Magnetic Purification Kit(MBL)を製造者のプロトコルに従って用いて行った。得られた溶出物を、以下の抗体:抗-His-タグmAb(1:10,000)(MBL)、抗-DDDDK-タグmAb(1:10,000)(MBL)、抗-β-アクチンmAb(1:10,000)(MBL)、抗-マウスIgG(H+L),HRPコンジュゲート(1:10,000)(Promega)を用いて、SDS-PAGEおよびウェスタンブロッティングによって分析した。実験は独立して3回繰り返し、同様の結果を得た。
(7)植物形質転換
 トマト植物(Solanum lycopersicum L.)cv. Micro-TomおよびAilsa Craigを部位特異的変異誘発実験に用いた。植物は、24℃で、16時間4000~6000lx照射/8時間暗所条件下、生育チャンバー中で生育させた。トランスジェニックトマト植物は、植物用TiDベクターを用いて作成した。トマト子葉由来の葉ディスクを、TiDベクターを有するAgrobacterium tumefaciens GV2260株で形質転換した。100μg/mLカナマイシンを含有するMS培地上で、Ueta et al.(上掲)の方法にしたがい、トランスジェニックカルスおよびシュートを選択し、再生させた。
(8)長鎖DNA領域(long range)PCRによるDNA欠失分析
 HEK293T細胞中のDNA欠失を検出するために、長鎖DNA領域PCRおよび長鎖DNA領域PCR産物のプールのクローニングを行った。最初に、Geno Plus(登録商標)Genomic DNA Extraction Miniprep System (Viogene-BioTek, Taiwan)を用いて、ゲノムDNAをHEK293T細胞から抽出した。次に、ネステッドPCRを行って、長鎖DNA領域を特異的に増幅した。まず、抽出したゲノムDNAを鋳型として用い、種々の長さ(3.5kb~25mb)の標的DNA領域を増幅するように設計された、長鎖DNA領域PCR用の何種類かの特異的プライマーセット(表5)を用いて、標的DNA領域を増幅した。最初のPCR反応は、KOD ONE Master Mix(TOYOBO, Osaka, Japan)を用いて、下記の条件下で行った。10秒98℃、5秒60℃および50秒(アンプリコン:15-20kb)または150秒(アンプリコン:10-15kb)または200秒(アンプリコン:<10kb)68℃を35サイクル。次いで、PCR産物を100~10,000倍に希釈し、ネステッドPCRの鋳型として用いた。ネステッドPCRは、また、上記と同じ条件下で行った。PCR産物を1%アガロースゲル上の電気泳動によって分離し、GelRed(登録商標)Nucleic Acid Gel Stain(Biotium)での染色によって視覚化した。ネステッドPCR産物をプールし、Monofas(登録商標)DNA purification Kit I(GL Sciences, Japan)を用いて精製した。PCR産物の精製混合物を、Mighty TA-cloning Kit(Takara Bio, Japan)を用いてpMD20-Tベクター中にクローン化した。AAVS-tid GTC_70-107(+)のための119クローン、およびhEMX1-tid GTT_9(-)のための20クローンをピックアップし、M13 UniおよびM13 RVプライマーを用いてサンガー配列決定した。サンガー配列決定の結果をBLATNサーチおよびClustalWプログラムを用いて分析して、DNA欠失を同定した。
 トマト植物における長鎖DNA領域PCRによる変異分析のために、ゲノムDNAを独立して、SlIAA9 GTC_gRNA1(+)およびGTT+GTT_gRNA5(-)(+)についてそれぞれ20個のT0トランスジェニックTiDトマトカルスから、SlRIN GTC_4003-4238(+)について30個のT0カルスおよび12個のT0シュートから、NucleoSpin(登録商標)Plant II(TaKaRa Bio)を用いて単離した。大きい欠失を分析するために、各gRNAの標的部位を含む約5~6kbpの領域を、PrimeSTAR GXL DNA Polymerase(TaKaRa Bio)および長鎖DNA領域PCRのための数種類のプライマーセット(表5)を用いて、SlIAA9 GTC_gRNA1(+)のための最初のPCRによって、およびSlIAA9 GTT+GTT_gRNA5(-)(+)およびSlRIN GTC_4003-4238(+)のためのネステッドPCRによって、下記の条件下で増幅した。10秒98℃、15秒60℃、および7分68℃を35サイクル。PCR産物を1%アガロースゲル電気泳動によって分析し、エチジウムブロマイドで染色した。SlIAA9 GTC_gRNA1(+)について最初のラウンドのPCR産物をプールし、哺乳動物DNAための方法において記載したようにクローニングのために精製した。SlIAA9 GTT+GTT_gRNA5(-)(+)およびSlRIN GTC_4003-4238(+)トランスジェニックカルスのためのネステッドPCRを行い、アガロースゲルで分離された小さいDNAフラグメントだけをさらなる分析のためにゲルから抽出し、精製した。SlRIN GTC_4003-4238(+)トランスジェニックシュートのために、ネステッドPCRを同じプライマーセットを用いて2回行い、小さいDNAフラグメントをゲル電気泳動後に抽出した。抽出フラグメントのクローニングは上記の通りに行った。各クローン化プラスミドをサンガーシークエンシングによって分析した。シークエンシング用のクローン数は、結果に記載するように各サンプルで異なった。
(9)短鎖DNA領域(short range)PCR産物における変異分析
 トランスフェクトされたヒト細胞およびトランスジェニックトマトカルスおよびシュートに導入された変異を分析するために、gRNAの標的座周辺の約400bpの領域を、上記のPCRキットを用いる短鎖DNA領域PCRによって増幅した。Cel-1アッセイにおいて、トランスフェクトされたヒト細胞およびトランスジェニック植物由来のPCR産物をSurveyor(登録商標)Mutation Detection Kit(IDT)を用いて消化した。PCR-RFLPにおいて、トランスジェニックトマト植物由来のPCR産物をAccIで消化した。変異および野生型DNAフラグメントを2~2.5%アガロースゲル電気泳動によって分離し、GelRedによって染色した。PCRアンプリコンは、また、TA cloning vector(TaKaRa Bio)中にクローン化して、サンガー法によってその配列を決定した。オンターゲットおよびオフターゲット変異分析のためのアンプリコンディープ配列を、Multiplex identifiers-labelled PCR(Ueta et al., 2017、上掲)を用いて行った。PCR産物をTruseq on the MiSeq platform(Illumina, USA)に付した。MiSeqデータを、CLC Genomics Workbench software version 7.5.1(CLC bio, Denmark)を用いて分析した。変異分析に用いられた短領域PCR用の全プライマーは、表4に示す。
Figure JPOXMLDOC01-appb-T000002
Figure JPOXMLDOC01-appb-T000003
Figure JPOXMLDOC01-appb-T000004
Figure JPOXMLDOC01-appb-T000005

Figure JPOXMLDOC01-appb-T000006

Figure JPOXMLDOC01-appb-T000007
実施例1:TiDシステムのヌクレアーゼモジュールの同定
 M.aeruginosa由来のCasエフェクタータンパク質の成分、およびcrRNA配列をBLASTプラグラムを用いて評価した。M.aeruginosa PCC9808株のCRISPR/Cas TiD遺伝子座は、7.6kbにわたり、8つのCas遺伝子:Cas1d、Cas2d、Cas3d、Cas4d、Cas5d、Cas6d、Cas7d、およびCas10d、次いで36個のリピート-スペーサー単位のアレイからなる。CRISPRタイプI-A、B、C、EおよびFシステムのDNA切断において機能するHDドメインは、Cas3dには無かったが、Cas10dがそのN末端領域にHD様ヌクレアーゼドメインを有することを見出した。該HD様ドメインがヌクレアーゼとして機能するかどうかを確認するために、イン・ビトロで合成したCas10dタンパク質および基質としてM13mp18一本鎖DNAを含有する反応ミックスにおいて、ATPおよび金属イオンNi2+およびCo2+の存在下でイン・ビトロ ヌクレアーゼアッセイを行った。その結果、Cas10dが一本鎖DNAを切断できることが示され、Cas10dがTiDシステムにおいてヌクレアーゼとして作用することが示された(図1)。
実施例2:細胞中でのゲノム編集ツールとしてのTiDの生物学的活性
(1)TiDのエンドヌクレアーゼ活性
 各単一Cas発現ベクターおよびcrRNA発現ベクターをHEK293T細胞に感染させ、プルダウンアッセイにより、Cas3d、Cas5d、Cas6d、Cas7dおよびCas10dとcrRNAとがイン・ビボで複合体を形成することを確認した。
 上記TiD複合体の生物学的ゲノム編集活性を評価するために、ルシフェラーゼ一本鎖アニーリング(SSA)組換えシステムを用いたルシフェラーゼ(luc)レポーターアッセイを行った(図2a)。終止コドンによって分離される300bp相同性アームならびにTiD標的部位を含有するヒトAAVS1遺伝子フラグメントを含有するNanoLucルシフェラーゼを組換えレポーターとして用いた。各単一Cas発現ベクター、TiD crRNA発現ベクター、および標的配列が導入されたLUCレポーターベクターをHEK293T細胞中に同時トランスフェクトし、トランスフェクション後72時間、ルミネッセンスによりエンドヌクレアーゼ切断を検出した。使用した標的配列を表2に示す。
 Cas10d HD様ドメインの機能を評価するために、野生型Cas10dおよびHD様ドメイン中に変異(H177A)を有するdCas10dを含むTiD Cas遺伝子発現ベクターと、gRNA AAVS1 GTC_70-170(+)およびAAVS1 GTC_159-196(+)、および非標的gRNAを用いるlucレポーターアッセイを行った。各単一Cas遺伝子の発現ベクターとして、pEFs-Myc-bpNLS-Cas10dまたはdCas10d(H177A)-bpNLS-6xHis、およびpEFs-SV40NLS HA-Cas3d、Strept-Cas5d、Myc-Cas6d、またはFLAG-Cas7dをlucレポーターアッセイに用いた。結果を図2bに示す。
 この結果により、Cas10dが実際に細胞におけるゲノム編集に利用できるヌクレアーゼ活性を有することが分かった。TiDの発現は、lucレポーターアッセイにおいて、非標的対照よりも顕著に高い(2~4倍)活性をもたらした(図2b~図2e)。Cas10dまたはCas3d以外のTiD Cas遺伝子をHEK293T細胞中にトランスフェクトした場合、ルシフェラーゼ活性は、非標的対照のそれに匹敵した(図2c)。この結果は、TiDの活性にはCas3dの他にCas10dが必須であることを示す。M.aeruginosa PCC9808株のもともとのCRISPR遺伝子座において、35塩基および36塩基の両方のプロトスペーサー配列を用いて特定のゲノムDNAを標的化した。TiD活性は、35塩基または36塩基gRNAのいずれかを用いて評価し、両方のgRNAが細胞におけるゲノム編集のために機能した(図2d)。また、成熟crRNAまたはプレ成熟crRNAのいずれかを用いてTiD活性を試験した(図2e)。その結果、TiDでは、プレ成熟crRNAの発現が有効であることが分かった。
(2)TiDの標的配列設計
 さらに、ゲノム編集に必要とされるTiDの標的gRNA配列における重要なヌクレオチドについて、スプリットタイプのベクターを用いて、HEK293T細胞におけるlucレポーターアッセイを用いて評価した。簡単に言うと、PAM配列に隣接する35塩基配列の各位置に変異を入れたAAVS1_GTC_70-107(+)標的gRNAを調製し、各gRNAを用いるTiD活性をlucレポーターアッセイによって測定した。結果を図3aに示す。その結果、PAM配列3’側の1、6、12、18または24nt位置にヌクレオチドのミスマッチがあった場合でも、TiD活性が保持されていた。すなわち、PAM配列3’側の1、6、12、18または24nt位置の1塩基ミスマッチに対するオフターゲット変異導入の可能性が高いことが判明した。しかし、PAM配列3’側の1、6、12、18または24nt位置に加えて、1~24nt位置にさらなる1つのミスマッチ、すなわち1~24nt位置に2つのミスマッチを持つ標的に対しては、TiD活性は有意に減少することが判明した(図3b)。さらには、標的配列に対していずれか3つのミスマッチが見いだされた場合は、その標的に対して、ほぼ完全にTiD活性を抑制することができ、3塩基のミスマッチを含む類似配列に対するオフターゲット変異導入を抑制できることが明らかとなった(図3c)。さらに、PAM配列3’側の24nt以降(例えば、24~35nt)の位置に1つまたは2つのミスマッチを持つ標的に対しては、TiD活性が保持されていた(図3aおよび図3b)。
 さらに、AAVS1_GTC_70-107(+)の5’側から1~30塩基配列を標的として、上記の35塩基配列の場合と同様に、PAM配列に隣接する30塩基配列の各位置に変異を入れたgRNAを調製し、各gRNAを用いるTiD活性をlucレポーターアッセイによって測定した。結果を図3dに示す。その結果、PAM配列3’側の6、12、18、24~30ntのいずれかの位置にヌクレオチドのミスマッチがあった場合に、TiD活性が保持されていた。したがって、標的配列が35塩基長である場合は、PAM配列の3’側の1、6、12、18、24~35番目のそれぞれの位置(16箇所)における1塩基ミスマッチがオフターゲット変異を引き起こすリスクがあるのに対して、標的配列が30塩基長である場合は、1塩基ミスマッチによるオフターゲット変異リスクが、PAM配列の3’側の6、12、18、24~30番目のそれぞれの位置(10箇所)へと低減した。
(3)Cas遺伝子へのNLSの付加の効果
 さらに、N末端および/またはC末端にモノパータイト型核NLS(SV40NLS)またはバイパータイト型NLS(bpNLS)を付加した各Cas遺伝子を含む発現カセット(図4a)をそれぞれ別々のベクターに搭載させ、標的配列が導入されたLUCレポーターベクターと共にHEK293T細胞にトランスフェクトし導入し、lucレポーターアッセイを行った。さらに、トランスフェクト細胞の抽出液(サイトソルおよび核)から各Cas-NLSタンパク質を各タグに対する抗体を用いて検出した(図4cおよび図4d)。その結果、興味深いことに、bpNLSは、Cas3d、Cas5d、Cas6d、Cas10dのN末端およびC末端の両方に付加することにより、N末端あるいはC末端に単独で付加するよりも効果的に機能した(図4b)。しかし、Cas7dに付加したbpNLSは、核内で強く発現したものの(図4d)、TiD活性を破壊した(図4b)。SV40NLSは各Casタンパク質のN末端への付加により効果的に機能した(図4a)。
実施例3:動物細胞におけるTiD発現ベクターの最適化
 TiD gRNA標的に対応する内在性ゲノムDNA領域を標的とするゲノム編集を行うため、まず、HEK293T細胞中におけるCasタンパク質の発現レベルを再評価した。いくつかの型のTiD Cas遺伝子発現ベクター[各Cas遺伝子について別々の発現ベクター、3遺伝子(Cas5-Cas6-Cas7)発現カセットおよび2遺伝子(Cas3-Cas10)発現カセットをそれぞれ含有する2セット型ベクター、および5遺伝子(全Cas)発現カセットを含有するオールインワン型ベクター]を構築した(図5a)。2セット型ベクター中のCas3およびCas10、またはCas5、Cas6およびCas7、およびオールインワン型ベクター中の全Cas遺伝子は、同時に発現する単一の転写産物を生じるように、2A自己切断型ペプチドを介して融合させた。各Cas遺伝子のN末端には異なるタグを有するSV40NLSを付加した。上記の各Cas発現ベクターおよび2セット型ベクターの種々の組み合わせ、またはオールインワン型ベクターをHEK293T細胞中にトランスフェクトして、細胞中での各Casタンパク質の発現を測定した。発現レベルは、Casに融合させた各タグに特異的な抗体を用いてウェスタンブロッティングによって検出した(図5b)。さらに、単一Cas発現ベクターにおいて、pEFベクター中の翻訳伸長因子1αプロモーター、およびpCAG中のチキンβアクチンプロモーターを用いた場合のCasタンパク質発現レベルを同様に検出した(図5c)。
 その結果、上記のベクターのうち、単一Cas遺伝子発現ベクターでのトランスフェクションが、ヒト細胞において最も高いCasタンパク質発現をもたらした。また、オールインワン型ベクターよりも、それぞれ1または2以上のCas遺伝子を含む2以上のCas発現ベクター(セパレート型ベクター)を用いた方が高いCasタンパク質発現をもたらすことが分かった。
実施例4:動物細胞におけるCRISPR TiDにより誘導されるゲノム編集
 TiDシステムにより長鎖領域欠失を誘導するか、ルシフェラーゼSSAアッセイを用いて調べた。標的として、ヒトEMX1遺伝子に関してhEMX1 GTT9(-)、およびAAVS遺伝子に関してAAVS GTC_70-107(+)を選択した。上記の標的配列をgRNA発現ベクター中に組み込み、各単一Cas発現ベクターと共に、HEK293T細胞中にトランスフェクトした。hEMX1およびAAVS標的部位付近の5-19kbの側面に位置する数種類のプライマーセットを用いて(表5)、TiDシステムを有するHEK293T細胞の全DNAから、DNAフラグメントをPCR増幅し(図6a、b)、クローン化し、サンガー法によって配列決定した。結果を図6a-cに示す。
 結果は、TiDが、両標的部位で5kbから19kbを超える長鎖領域欠失を導入したことを示した。興味深いことに、クローン化したPCR産物中の変異分布は標的によって異なった。すなわち、hEMX1 GTT_9(-)による変異は低モザイクを示したが、AAVS GTC_70-107(+)による変異はより変化した変異配列を示した(図6b、c)。AAVS GTC_70-107(+)範囲配列は、いくつかの特異的な特徴を共有した。すなわち、主要な長鎖領域欠失のサイズは、ランダムではなく、標的AAVS GTC_70-107(+)の場合、5.2-5.5kbおよび17kb欠失としていくつかの限定を示し、主として二方向性の欠失が検出された(図6c、図7a、b)。これらの特徴は、タイプI-E(非特許文献1)やタイプIIエフェクター(Cas9やCpf1)による変異後のものと異なっていた。また、マイクロホモロジーおよび挿入がTiD変異部位に観察された(図6a、図7a、b)。クローン化DNAフラグメントにおけるTiDによる長鎖領域欠失に関する変異率は、hEMX1 GTT_9(-)およびAAVS GTC_70-107(+)でそれぞれ、55.0%および57.1%であった。
実施例5:植物におけるTiDによる標的変異導入
 コドン最適化したCas遺伝子の発現のための植物細胞特異的プロモーターおよびcrRNAを含むTiDベクターを構築して、トマト植物中に部位特異的変異誘発を導入した。TiDベクターとして、5つのCas遺伝子を単一発現カセットに含むベクター(pTiDP1.2)、および5つのCas遺伝子を2つの発現カセットに分けて含むベクター(pMGTiDP20)を構築した(図8b)。TiDのgRNAは、トマトIAA9(SlIAA9)遺伝子(単為結実に重要)およびトマトRIN(SlRIN)遺伝子(果実成熟に関与)中の35塩基配列を標的化するように設計された。SlIAA9遺伝子について、lucレポーターアッセイを行ってGTT_gRNA5-A(-)およびGTC_gRNA1(+)を選択した(図8a)。GTC_gRNA1(+)のための単一のgRNA、およびGTT_gRNA5-A(-)およびGTT_gRNA5-B(+)のための複数のgRNA(表2)の両方を更なる分析に用いた。設計されたgRNAを含有するTiDベクターを、アグロバクテリウム媒介形質転換によってトマト栽培種Micro-TomまたはAilsa Craig中に形質転換した。トランスジェニックトマトのカルスにおけるTiDによって効率よく導入された変異を、Cel-1、PCR-RFLP、長鎖DNA領域PCR、およびシークエンシングによって分析した。
 pMGTiDP20ベクターを用いたトマト栽培種Micro-Tomのトランスジェニックトマトにおいて、長鎖領域欠失(図9、図10a-c)が検出された。長鎖領域欠失の向きおよび変異率は、配列分析によって決定された(図9)。トランスジェニックカルスにおいて、SlIAA9 GTC_gRNA1(+)によって導入されたいくつかの型の長鎖欠失がPCRによって検出され、クローン化DNAの配列決定により、1つのカルス系統において、6.7%の変異率(1/15シークエンシングクローン)を有する混合PCR産物から二方向性の欠失(Δ2463nt)が同定された(#5、図9、上左パネルレーン5)。対照的に、SlAA9 GTT+GTT_gRNA5-(-)(+)およびSlRIN GTC_4003-4238(+)を用いて、それぞれ1/20および1/30トランスジェニックカルスにおいて特異的欠失バンドが検出された(図9、真ん中の左パネルレーン3および下の左パネルレーン6)。これらの特異的バンドをアガロースゲルから精製し、配列分析した結果、それぞれΔ4305ntおよびΔ4930ntの二方向性欠失を有するこれらのクローンにおいて同じ100%変異フラグメントが示された(図9)。また、SlRIN GTC_4003-4238(+)について再生トマトシュートにおける変異を分析し、トランスジェニックシュート12個体中、4つが、長領域PCRによって特異的バンドを示した(図10a)。興味深いことに、2種類の長領域欠失(Δ4930ntおよびΔ7257nt)を有する同様のバンドパターンが検出され(図10c)、これにより、2対立遺伝子変異が示された。
 pTiDP1.2ベクターを用いたトマト栽培種Micro-TomまたはAilsa Craigのトランスジェニックトマトにおいて、短鎖領域の挿入および/または欠失が検出された。これらのトランスジェニックシュートは、100%変異DNAを含有していた(図11)。これらの結果は、トマトカルスからの再生の間にトランスフェクトトマトシュートにおいて変異率が増加したことを示唆した。該シュート由来の標的DNAでのクローン化PCR産物の配列分析は、TiDが2対立遺伝子変異をもたらしたことを示した。2対立遺伝子変異は、また、市販のトマト栽培種Ailsa Craigを用いても生じた(図11、図12)。成熟2対立遺伝子トマト植物は、明白な典型的なSlIAA9破壊表現型、すなわち、単為結実および葉形態における変化を示した。ホモ接合体変異体は、T0世代から有効に単離された(図11)。したがって、TiDによる変異植物のトランスジェニック世代における所望の表現型は、遺伝的に次世代に受け継がれることが分かった。
 次に、明らかなIAA9遺伝子ノックアウト表現型を示しているトマト植物Ailsa CraigのT0世代におけるオフターゲット変異を分析した。9~11個のミスマッチを有する3つの潜在的なオフターゲット部位を選択した(図13)。該オフターゲット部位付近のPCR産物を増幅し、次世代シークエンサー(MiSeq)を用いて配列決定した。標的配列上のいくつかの塩基位置に単一ミスマッチを有する種々のgRNAを用いてlucレポーターアッセイを行い、いくつかのミスマッチ位置でTiD活性が可能であったことを示されたが(図3a-d)、トマト植物のT0世代において、オフターゲット変異は皆無かそれに近かった(図13)。
 本発明のTiDシステムの、種々の範囲の長い欠失を単一の標的部位に生じさせる能力は、単純かつ効果的な多重遺伝子機能スクリーニングを可能とする長領域染色体編集を可能にする。CRISPRツールボックスにおける新規なテクノロジーとして、TiDはゲノム編集における新たな可能性に通ずる。
SEQ ID NO:1; Microcystis aeruginosa Cas3d amino acid sequence
SEQ ID NO:2; Microcystis aeruginosa Cas5d amino acid sequence
SEQ ID NO:3; Microcystis aeruginosa Cas6d amino acid sequence
SEQ ID NO:4; Microcystis aeruginosa Cas7d amino acid sequence
SEQ ID NO:5; Microcystis aeruginosa Cas10d amino acid sequence
SEQ ID NO:6; Monopartite nuclear localizing signal (NLS) amino acid sequence
SEQ ID NO:7; Bipartite NLS amino acid sequence
SEQ ID NO:8; TiDcrRNA containing repeat (37b) and spacer (35b of N).  N is any nucleotide constituting a sequence that forms base pairs with a target nucleotide sequence
SEQ ID NO:9; DNA fragment for pre-mature crRNA
SEQ ID NO:10; DNA fragment for mature crRNA
SEQ ID NO:47; Primer
SEQ ID NO:48; Primer
SEQ ID NO:49; Primer
SEQ ID NO:50; Primer
SEQ ID NO:51; Primer
SEQ ID NO:52; Primer
SEQ ID NO:53; Primer
SEQ ID NO:54; Primer
SEQ ID NO:55; Primer
SEQ ID NO:56; Primer
SEQ ID NO:57; Primer
SEQ ID NO:58; Primer
SEQ ID NO:59; Primer
SEQ ID NO:60; Primer
SEQ ID NO:61; Primer
SEQ ID NO:62; Primer
SEQ ID NO:63; Primer
SEQ ID NO:64; Primer
SEQ ID NO:65; Primer
SEQ ID NO:66; Primer
SEQ ID NO:67; Primer
SEQ ID NO:68; Primer
SEQ ID NO:69; Primer
SEQ ID NO:70; Primer
SEQ ID NO:71; Primer
SEQ ID NO:72; Primer
SEQ ID NO:73; Primer
SEQ ID NO:74; Primer
SEQ ID NO:75; Primer
SEQ ID NO:76; Primer
SEQ ID NO:77; Primer
SEQ ID NO:78; Primer
SEQ ID NO:79; Primer
SEQ ID NO:80; Primer
SEQ ID NO:81; Primer
SEQ ID NO:82; Primer
SEQ ID NO:83; Primer
SEQ ID NO:84; Primer
SEQ ID NO:85; Primer
SEQ ID NO:86; SlIAA9-tid gRNA on-target
SEQ ID NO:87; SlIAA9-tid gRNA off-target 1
SEQ ID NO:88; SlIAA9-tid gRNA off-target 2
SEQ ID NO:89; SlIAA9-tid gRNA off-target 3

Claims (22)

  1.  細胞内の標的ヌクレオチド配列を改変する方法であって、該細胞に、
     (i)CRISPRタイプI-DのCasタンパク質 Cas3dをコードするDNA、Cas5dをコードするDNA、Cas6dをコードするDNA、Cas7dをコードするDNA、及びCas10dをコードするDNAを含むベクター系又は発現カセット系、及び
     (ii)前記標的ヌクレオチド配列と塩基対を形成する配列を含むcrRNA、又は前記crRNAをコードするDNA
    を導入することを含み、
     前記ベクター系が、第一のベクター及び第二のベクターを含み、
     前記発現カセット系が、第一の発現カセット及び第二の発現カセットを含み、
     前記第一のベクター又は前記第一の発現カセットが、Cas3dをコードするDNA、Cas5dをコードするDNA、Cas6dをコードするDNA、Cas7dをコードするDNA、及びCas10dをコードするDNAからなる群より選択される少なくとも1つのDNA、及び前記DNAの転写を調節する第一の調節エレメントを含み、
     前記第二のベクター又は前記第二の発現カセットが、前記群より選択される少なくとも1つのDNA、及び前記DNAの転写を調節する第二の調節エレメントを含む、方法。
  2.  細胞内の標的遺伝子の発現を抑制するための方法であって、前記標的ヌクレオチド配列が標的遺伝子の少なくとも一部のヌクレオチド配列である、請求項1記載の方法。
  3.  前記Cas3dをコードするDNA、Cas5dをコードするDNA、Cas6dをコードするDNA、Cas7dをコードするDNA、及びCas10dをコードするDNAの5’末端および/または3’末端側に核移行シグナルをコードする配列が付加されている、請求項1または2記載の方法。
  4.  前記核移行シグナルが、モノパータイト型核移行シグナルまたはバイパータイト型核移行シグナルである、請求項3記載の方法。
  5.  Cas3dをコードするDNA、Cas5dをコードするDNA、Cas6dをコードするDNA、Cas7dをコードするDNA、及びCas10dをコードするDNAがベクター系に含まれ、前記第一のベクターが、Cas3dをコードするDNA、Cas5dをコードするDNA、Cas6dをコードするDNA、及びCas10dをコードするDNAからなる群より選択される少なくとも1つのDNAを含み、該DNAの5’末端側に、1個のモノパータイト型核移行シグナルをコードする配列が付加されているか、あるいは2個又は3個のタンデムに連結したモノパータイト型核移行シグナルをコードする配列が付加されている、請求項4記載の方法。
  6.  Cas3dをコードするDNA、Cas5dをコードするDNA、Cas6dをコードするDNA、Cas7dをコードするDNA、及びCas10dをコードするDNAがベクター系に含まれ、前記第一のベクターが、Cas3dをコードするDNA、Cas5dをコードするDNA、Cas6dをコードするDNA、及びCas10dをコードするDNAからなる群より選択される少なくとも1つのDNAを含み、該DNAの5’末端側及び3’末端側の両方に、バイパータイト型核移行シグナルをコードする配列が付加されている、請求項4記載の方法。
  7.  前記第二のベクターがCas7dをコードするDNAを含み、該DNAの5’末端および/または3’末端側に、2個又は3個のタンデムに連結したモノパータイト型核移行シグナルをコードする配列が付加されている、請求項5又は6項記載の方法。
  8.  前記第一の調節エレメントおよび/または前記第二の調節エレメントが、ヒト翻訳伸長因子遺伝子プロモーター又はCAGキメラ合成プロモーターである、請求項1~7のいずれか1項記載の方法。
  9.  前記ベクター系が第三ないし第五のベクターをさらに含み、Cas3dをコードするDNA、Cas5dをコードするDNA、Cas6dをコードするDNA、Cas7dをコードするDNA、及びCas10dをコードするDNAがそれぞれ別々に第一ないし第五のベクターに含まれる、請求項1~8のいずれか1項記載の方法。
  10.  Cas3dをコードするDNA、Cas5dをコードするDNA、Cas6dをコードするDNA、Cas7dをコードするDNA、及びCas10dをコードするDNAが発現カセット系に含まれ、前記第一の発現カセットが、Cas3dをコードするDNA及びCas6dをコードするDNAを含み、前記第二の発現カセットが、Cas5dをコードするDNA、Cas7dをコードするDNA、及びCas10dをコードするDNAを含み、かつ、前記第一の発現カセット及び前記第二の発現カセットが1つのベクターに搭載されている、請求項1~4のいずれか1項記載の方法。
  11.  前記crRNA又は前記crRNAをコードするDNAの細胞への導入がベクターを介して行われる、請求項1~10のいずれか1項記載の方法。
  12.  前記crRNAがプレ成熟型crRNAである、請求項1~11のいずれか1項記載の方法。
  13.  前記Cas3d、前記Cas5d、前記Cas6d、前記Cas7d及び前記Cas10dがM. aeruginosa由来のものである、請求項1~12のいずれか1項記載の方法。
  14.  前記細胞が真核細胞である、請求項1~13のいずれか1項記載の方法。
  15.  改変が塩基の欠失、挿入、又は置換である、請求項1~14のいずれか1項記載の方法。
  16.  改変が数キロベース~数十キロベースの欠失である、請求項15記載の方法。
  17.  細胞内の標的ヌクレオチド配列を改変するためのキットであって、
     (i)CRISPRタイプI-DのCasタンパク質 Cas3dをコードするDNA、Cas5dをコードするDNA、Cas6dをコードするDNA、Cas7dをコードするDNA、及びCas10dをコードするDNAを含むベクター系又は発現カセット系、及び
     (ii)前記標的ヌクレオチド配列と塩基対を形成する配列を含むcrRNA、又は前記crRNAをコードするDNA
    を含み、
     前記ベクター系が、第一のベクター及び第二のベクターを含み、
     前記発現カセット系が、第一の発現カセット及び第二の発現カセットを含み、
     前記第一のベクター又は前記第一の発現カセットが、Cas3dをコードするDNA、Cas5dをコードするDNA、Cas6dをコードするDNA、Cas7dをコードするDNA、及びCas10dをコードするDNAからなる群より選択される少なくとも1つのDNA、及び前記DNAの転写を調節する第一の調節エレメントを含み、
     前記第二のベクター又は前記第二の発現カセットが、前記群より選択される少なくとも1つのDNA、及び前記DNAの転写を調節する第二の調節エレメントを含む、キット。
  18.  Cas3dをコードするDNA、Cas5dをコードするDNA、Cas6dをコードするDNA、Cas7dをコードするDNA、及びCas10dをコードするDNAがベクター系に含まれ、前記ベクター系が第三ないし第五のベクターをさらに含み、Cas3dをコードするDNA、Cas5dをコードするDNA、Cas6dをコードするDNA、Cas7dをコードするDNA、及びCas10dをコードするDNAがそれぞれ別々に第一ないし第五のベクターに含まれる、請求項17記載のキット。
  19.  Cas3dをコードするDNA、Cas5dをコードするDNA、Cas6dをコードするDNA、Cas7dをコードするDNA、及びCas10dをコードするDNAが発現カセット系に含まれ、前記第一の発現カセットが、Cas3dをコードするDNA及びCas6dをコードするDNAを含み、前記第二の発現カセットが、Cas5dをコードするDNA、Cas7dをコードするDNA、及びCas10dをコードするDNAを含む、請求項17記載のキット。
  20.  細胞内の標的ヌクレオチド配列を特異的に標的化する方法であって、該細胞に、
     (i)CRISPRタイプI-DのCasタンパク質 Cas5d、Cas6d及びCas7d、又はこれらのタンパク質をコードする核酸、及び
     (ii)前記標的ヌクレオチド配列と塩基対を形成する配列を含むcrRNA、又は前記crRNAをコードするDNA
    を導入することを含み、
     前記標的ヌクレオチド配列は、該標的ヌクレオチド配列に対して、PAM配列の3’側から1、6、12、18及び24番目の塩基からなる群から選ばれるいずれか1つの塩基、あるいは24番目以降の1つ又は2つの塩基が相違している類似配列が存在しないように設計される、方法。
  21.  細胞内の標的ヌクレオチド配列を特異的に改変する方法であって、該細胞に、
     (i)CRISPRタイプI-DのCasタンパク質 Cas3d、Cas5d、Cas6d、Cas7d及びCas10d、又はこれらのタンパク質をコードする核酸、及び
     (ii)前記標的ヌクレオチド配列と塩基対を形成する配列を含むcrRNA、又は前記crRNAをコードするDNA
    を導入することを含み、
     前記標的ヌクレオチド配列は、該標的ヌクレオチド配列に対して、PAM配列の3’側から1、6、12、18及び24番目の塩基からなる群から選ばれるいずれか1つの塩基、あるいは24番目以降の1つ又は2つの塩基が相違している類似配列が存在しないように設計される、方法。
  22.  前記標的ヌクレオチド配列は、該標的ヌクレオチド配列に対して、PAM配列の3’側から6、12、18及び24番目の塩基からなる群から選ばれるいずれか1つの塩基、あるいは24番目以降の1つ又は2つの塩基が相違している類似配列が存在しないように設計される、請求項20又は21記載の方法。
PCT/JP2020/011283 2019-03-14 2020-03-13 Crisprタイプi-dシステムを利用した標的配列改変技術 WO2020184723A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2021505164A JP7489112B2 (ja) 2019-03-14 2020-03-13 Crisprタイプi-dシステムを利用した標的配列改変技術

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201962818450P 2019-03-14 2019-03-14
US62/818,450 2019-03-14

Publications (1)

Publication Number Publication Date
WO2020184723A1 true WO2020184723A1 (ja) 2020-09-17

Family

ID=72426781

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2020/011283 WO2020184723A1 (ja) 2019-03-14 2020-03-13 Crisprタイプi-dシステムを利用した標的配列改変技術

Country Status (2)

Country Link
JP (1) JP7489112B2 (ja)
WO (1) WO2020184723A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022075419A1 (ja) 2020-10-08 2022-04-14 国立大学法人徳島大学 Crisprタイプi-dシステムを利用した標的ヌクレオチド配列改変技術
WO2023177310A1 (en) * 2022-03-18 2023-09-21 Board Of Regents, The University Of Texas System Type i-d crispr-cas systems and uses thereof

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018225858A1 (ja) * 2017-06-08 2018-12-13 国立大学法人大阪大学 Dnaが編集された真核細胞を製造する方法、および当該方法に用いられるキット
WO2019039417A1 (ja) * 2017-08-21 2019-02-28 国立大学法人徳島大学 ヌクレオチド標的認識を利用した標的配列特異的改変技術

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018225858A1 (ja) * 2017-06-08 2018-12-13 国立大学法人大阪大学 Dnaが編集された真核細胞を製造する方法、および当該方法に用いられるキット
WO2019039417A1 (ja) * 2017-08-21 2019-02-28 国立大学法人徳島大学 ヌクレオチド標的認識を利用した標的配列特異的改変技術

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
MULEPATI, SABIN , ANNIE HÉROUX, SCOTT BAILEY: "Crystal structure of a CRISPR RNA-guided surveillance complex bound to a ssDNA target", SCIENCE, vol. 345, 2014, pages 1479 - 1484, XP055739231 *
RYAN N JACKSON , SARAH M GOLDEN , PAUL B G VAN ERP , JOSHUA CARTER , EDZE R WESTRA , STAN J J BROUNS , JOHN VAN DER OOST , THOMAS : "Crystal structure of the CRISPR RNA-guided surveillance complex from Escherichia coli", SCIENCE, vol. 345, 2014, pages 1473 - 1479, XP055739228 *
ZHAO HONGTU, SHENG GANG, WANG JIUYU, WANG MIN, BUNKOCZI GABOR, GONG WEIMIN, WEI ZHIYI, WANG YANLI: "Crystal structure of the RNA-guided immune surveillance Cascade complex in Escherichia coli", NATURE, vol. 515, 2014, pages 147 - 150, XP055739222 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022075419A1 (ja) 2020-10-08 2022-04-14 国立大学法人徳島大学 Crisprタイプi-dシステムを利用した標的ヌクレオチド配列改変技術
JPWO2022075419A1 (ja) * 2020-10-08 2022-04-14
JP7454881B2 (ja) 2020-10-08 2024-03-25 国立大学法人徳島大学 Crisprタイプi-dシステムを利用した標的ヌクレオチド配列改変技術
WO2023177310A1 (en) * 2022-03-18 2023-09-21 Board Of Regents, The University Of Texas System Type i-d crispr-cas systems and uses thereof

Also Published As

Publication number Publication date
JPWO2020184723A1 (ja) 2020-09-17
JP7489112B2 (ja) 2024-05-23

Similar Documents

Publication Publication Date Title
CN108513579B (zh) 新颖的rna导向性核酸酶及其用途
CN115216459B (zh) 新型crispr相关转座酶及其用途
US20080194029A1 (en) Method for Increasing the Ratio of Homologous to Non-Homologous Recombination
Ordon et al. Optimized Cas9 expression systems for highly efficient Arabidopsis genome editing facilitate isolation of complex alleles in a single generation
US20200080110A1 (en) Method for targeted alteration of duplex dna
KR102626503B1 (ko) 뉴클레오타이드 표적 인식을 이용한 표적 서열 특이적 개변 기술
CN110835629B (zh) 一种新型碱基转换编辑系统的构建方法及其应用
CN110835632B (zh) 新型碱基转换编辑系统用于基因治疗的应用
CN107722125B (zh) 一种人工转录激活因子dCas9-TV及其编码基因与应用
WO2019067322A1 (en) CRISPR / CAS SYSTEM AND METHOD FOR GENOME EDITING AND TRANSCRIPTION MODULATION
WO2020184723A1 (ja) Crisprタイプi-dシステムを利用した標的配列改変技術
WO2018115389A1 (en) Methods of targeted genetic alteration in plant cells
Shim et al. dsDNA and protein co-delivery in triticale microspores
JP7454881B2 (ja) Crisprタイプi-dシステムを利用した標的ヌクレオチド配列改変技術
Gudeta Genome editing: tools and application in plants
Mall et al. CRISPR/Cas-Mediated Genome Editing for Sugarcane Improvement
WO2019048618A1 (en) BALANCED INDELS
JP7452884B2 (ja) Dnaが編集された植物細胞を製造する方法、及びそれに用いるためのキット
WO2022181796A1 (ja) 植物における半合理的なゲノム進化工学手法
Pathak Analyzing Multigene Stacking and Genome Editing Strategies in Rice
CN116855532A (zh) 一种用于骨干载体的RNAi表达框及相应载体和应用
CN115413297A (zh) 启动子抑制
CN114835816A (zh) 一种调控植物基因组dna特定区域甲基化水平的方法
Schürmann Genetics of DNA replication and homologous recombination in arabidopsis

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20771090

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2021505164

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 20771090

Country of ref document: EP

Kind code of ref document: A1