WO2024053677A1 - 重複遺伝子のゲノム編集方法 - Google Patents

重複遺伝子のゲノム編集方法 Download PDF

Info

Publication number
WO2024053677A1
WO2024053677A1 PCT/JP2023/032542 JP2023032542W WO2024053677A1 WO 2024053677 A1 WO2024053677 A1 WO 2024053677A1 JP 2023032542 W JP2023032542 W JP 2023032542W WO 2024053677 A1 WO2024053677 A1 WO 2024053677A1
Authority
WO
WIPO (PCT)
Prior art keywords
sequence
genome editing
target sequence
mismatch
genome
Prior art date
Application number
PCT/JP2023/032542
Other languages
English (en)
French (fr)
Inventor
茂夫 菅野
玲花 長谷川
Original Assignee
国立研究開発法人産業技術総合研究所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 国立研究開発法人産業技術総合研究所 filed Critical 国立研究開発法人産業技術総合研究所
Publication of WO2024053677A1 publication Critical patent/WO2024053677A1/ja

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression

Definitions

  • the present invention relates to genome editing of duplicated genes.
  • Genome editing is a technology that introduces (edits) mutations into targeted locations in the genome of a target organism. Therefore, compared to existing mutagenesis methods such as radiation, the efficiency of obtaining the desired strain from a significantly smaller number of mutants is an advantage, and it is used for a variety of purposes.
  • CRISPR/Cas9 and CRISPR/Cas12a which are typical genome editing technologies
  • the sequences to be edited are mainly defined by sites called spacer sequences of the gRNAs or crRNAs that constitute them.
  • spacer sequence for gRNA or crRNA 20 to 24 bases are usually used as a target sequence that can be changed arbitrarily.
  • a base sequence of about 2 to 4 bases called a PAM sequence is required for the nucleases Cas9 and Cas12a to function. Therefore, genome editing is performed by specifically recognizing base sequences of about 22 to 28 bases in total, including the PAM sequence and spacer sequence. This recognition length is said to be long enough to specify a single region of the human genome.
  • Another method for editing multiple genes at the same time is to utilize the off-target effects of CRISPR.
  • This method utilizes the property of CRISPR/Cas9 gRNA or crRNA to cleave mismatched sequences.
  • CRISPR/Cas9 gRNA or crRNA to cleave mismatched sequences.
  • a gRNA sequence that targets 20 to 24 bases is designed to edit multiple different genes with 1 to 2 base mismatches
  • multiple genes can be edited simultaneously with a single gRNA or crRNA. be.
  • methods that utilize these off-target effects have the advantage that they require less effort to construct vectors because they can edit a large number of genes with fewer gRNAs or crRNAs. There is.
  • SpyCas9 Streptococcus pyogenes Cas9
  • Non-Patent Document 1 Nat Biotechnol. 2014 Mar; 32(3): 279-284. Therefore, currently, there is no choice but to choose between simultaneously editing the mismatched sequence by recognizing the PAM sequence + 20 bases, or simultaneously editing the homologous gene in which the PAM sequence + 17 bases completely match.
  • Non-patent document 2 Science (2020) 369, 333-337
  • Non-patent document 3 Nature Communications (2021) volume 12, Article number: 4476.
  • Reas ⁇ based on crystal structure analysis, and the reaction rate increases in vCas ⁇ in which positions 155 to 176, which correspond to the helix that is predicted to interact with the non-target chain, are deleted.
  • Non-Patent Document 4 Nature Structural & Molecular Biology (2021) vol.28, pp.652-661). Genome editing in plants using Cas ⁇ has also been reported (Non-Patent Document 5: Int. J. Mol. Sci. (2022), 23, 5755).
  • the inventors analyzed the genome sequence information of Arabidopsis thaliana, which is a typical example of a plant where functional redundancy is a problem, and analyzed the extent to which the sequences of genes with functional redundancy contiguously match each other. . As a result, it was found that nearly half of the genes had consecutive matching base sequences of less than 24 bases in length. Therefore, we found that CRISPR/Cas9 and CRISPR/Cas12a have problems in that the recognition length is too long or the off-target effect is too small in order to destroy homologous gene groups with functional redundancy.
  • the present invention was made to solve this problem, and aims to provide a technology for simultaneously editing a large number of genes with overlapping functions using a small number of gRNAs or crRNAs.
  • the invention therefore relates to: [1] A method for genome editing a duplicated gene in a cell, wherein the duplicated gene has only a 16 nucleotide long target sequence to be genome edited, or a 16 or 17 nucleotide long target sequence and the target.
  • the genome editing method according to item 1 wherein the Cas ⁇ protein includes an amino acid sequence having at least 80% sequence homology to an amino acid sequence selected from the group consisting of SEQ ID NOs: 1, 2, 3, and 4. .
  • the duplicated gene is a duplicated sequence with functional redundancy.
  • the duplicated gene includes a PAM sequence in the vicinity of the target sequence.
  • the spacer sequence is determined to completely match the target sequence.
  • the duplicated gene has a target sequence with a length of 16 or more nucleotides, and optionally a mismatch sequence containing a mismatch of 1 to 2 bases with respect to the target sequence. Genome editing methods described. [8] The genome according to any one of items 1 to 7, wherein the duplicated gene has a target sequence with a length of 17 or more nucleotides and a mismatch sequence containing a 1 to 2 base mismatch with the target sequence. How to edit. [9] The genome editing method according to any one of items 1 to 8, wherein the duplicated gene is present in 2 to 100 copies in the genome of the cell.
  • a kit for genome editing of a duplicated gene in a cell wherein the duplicated gene has only a 16 nucleotide long target sequence to be subjected to genome editing, or a 16 or 17 nucleotide long target sequence and the and a mismatch sequence containing a mismatch of 1 to 2 bases with respect to the target sequence, and the kit has; (a) an expression cassette for crRNA into which a spacer sequence targeting the target sequence and the mismatch sequence can be introduced; and (b) The kit is derived from a huge phage and includes an expression cassette for a Cas ⁇ protein capable of cleaving the target sequence and the mismatch sequence.
  • a large number of homologous genes can be edited simultaneously using a small number of crRNAs.
  • FIG. 1A shows a graph in which duplicated genes in Arabidopsis are divided into groups and classified according to the length of contiguous base sequences that match within each group. 1383 overlapping gene groups were extracted from PTGbase. The horizontal axis represents the length of matching continuous base sequences, and the vertical axis represents the number of groups.
  • FIG. 1B shows a graph in which the length of consecutive base sequences that match on the horizontal axis in FIG. 1A is enlarged from 1 to 60 residues. There are 818 groups of duplicated genes with consecutive matches of less than 30 bases, and when PAM is included, there is a low probability that many duplicated genes will be targeted simultaneously.
  • Figure 2A shows the vector map of pEX-35S-HPT.
  • FIG. 2B shows the vector map of pEX-CasPhi2-HPT.
  • FIG. 3 is a graph showing the editing efficiency when the nucleotide length of the spacer sequence is changed when genome editing is performed using Cas ⁇ 2 and vCas ⁇ .
  • FIG. 4 shows an analysis of the results of genome editing at the site where a gene was introduced by performing agroinfiltration on tobacco leaves.
  • FIG. 4(A) shows the mutations introduced when targeting NbPDS-1.
  • FIG. 4 shows an analysis of the results of genome editing at the site where a gene was introduced by performing agroinfiltration on tobacco leaves.
  • FIG. 4(B) shows the mutations introduced when targeting NbPDS-2.
  • FIG. 4 shows an analysis of the results of genome editing at the site where a gene was introduced by performing agroinfiltration on tobacco leaves.
  • FIG. 4(C) shows the mutations introduced when targeting NbRDR6-1.
  • FIG. 4 shows an analysis of the results of genome editing at the site where a gene was introduced by performing agroinfiltration on tobacco leaves.
  • FIG. 4(D) shows the mutations introduced when targeting NbRDR6-2.
  • FIG. 4 shows an analysis of the results of genome editing at the site where a gene was introduced by performing agroinfiltration on tobacco leaves.
  • FIG. 4(E) shows the mutations introduced when targeting NbSGS3-1.
  • FIG. 4 shows an analysis of the results of genome editing at the site where a gene was introduced by performing agroinfiltration on tobacco leaves.
  • FIG. 4(C) shows the mutations introduced when targeting NbRDR6-1.
  • FIG. 4 shows an analysis of the results of genome editing at the site where a gene was introduced by performing agroinfiltration on tobacco leaves
  • FIG. 5(A) shows the amino acid sequence of Cas ⁇ 2 (SEQ ID NO: 1).
  • FIG. 5(B) shows the amino acid sequence of Cas ⁇ 1 (SEQ ID NO: 2).
  • FIG. 5(C) shows the amino acid sequence of Cas ⁇ 3 (SEQ ID NO: 3).
  • FIG. 5(D) shows the DNA sequence (uppercase letters) of Arabidopsis thaliana codon-optimized Cas ⁇ 2 + the DNA sequence encoding the nuclear export signal and FLAG tag (SEQ ID NO: 9).
  • FIG. 5(E) shows the base sequence (SEQ ID NO: 10) of the coding region of Cas ⁇ 2 on the constructed plasmid.
  • FIG. 5(A) shows the amino acid sequence of Cas ⁇ 2 (SEQ ID NO: 1).
  • FIG. 5(B) shows the amino acid sequence of Cas ⁇ 1 (SEQ ID NO: 2).
  • FIG. 5(C) shows the amino acid sequence of Cas ⁇ 3 (SEQ ID NO: 3).
  • FIG. 5(F) shows the amino acid sequence (SEQ ID NO: 5) of the coding region of Cas ⁇ 2 on the constructed plasmid.
  • FIG. 5(G) shows the DNA sequence (uppercase letters) of Arabidopsis codon-optimized vCas ⁇ + the DNA sequence (lowercase letters) encoding the nuclear export signal and FLAG tag (SEQ ID NO: 11).
  • FIG. 5(H) shows the amino acid sequence (SEQ ID NO: 6) of the coding region of vCas ⁇ on the constructed plasmid.
  • FIG. 5(I) shows the crRNA sequences (SEQ ID NO: 12) of Cas ⁇ 2 and vCas ⁇ (uppercase letters indicate direct repeat sequence; spacer sequence is on the 3' side).
  • FIG. 5(J) shows the crRNA sequence (SEQ ID NO: 13) of Cas ⁇ 1 (uppercase letters indicate direct repeat sequence; spacer sequence is on the 3' side).
  • FIG. 5(K) shows the crRNA sequence (SEQ ID NO: 14) of Cas ⁇ 3 (uppercase letters indicate direct repeat sequence; spacer sequence is on the 3' side).
  • FIG. 5(L) shows the amino acid sequence of vCas ⁇ (SEQ ID NO: 4).
  • the duplicated gene to be edited in the duplicated gene genome editing method of the present invention has a 16 or 17 nucleotide long target sequence to be genome edited, and/or a 1 to 2 nucleotide long target sequence with respect to the target sequence. It is characterized by having a mismatched sequence containing a mismatch.
  • the genome editing method for a duplicated gene of the present invention provides a method for editing a cell containing such a duplicated gene by: (a) crRNA containing a spacer sequence targeting the target sequence and the mismatch sequence; (b) a Cas ⁇ protein derived from a huge phage and capable of cleaving the target sequence and the mismatch sequence;
  • the method includes the step of expressing in the cells.
  • crRNA and Cas ⁇ are expressed in cells, so that the target sequence of the duplicated gene can be recognized and cleaved, thereby making genome editing possible.
  • the method of the present invention is preferably used for cells of organisms that contain many duplicated genes. Such organisms include plants, animals, and fungi.
  • grasses such as rice, wheat, barley, oats, rye, millet, millet, millet, corn, and sugarcane
  • Legumes such as soybeans, Polygonaceae such as buckwheat, Cucurbitaceae such as cucumbers, watermelons, pumpkins, and zucchini, Solanaceae such as eggplants, tomatoes, potatoes, chili peppers, green peppers, and tobacco, Convolvulaceae such as sweet potatoes , Araceae plants such as taro and taro; Dioscoreaceae plants such as wild yam, yam, and Japanese yam; Cruciferae plants such as cabbage, Chinese cabbage, turnip, radish, and Arabidopsis; Lamiaceae plants such as perilla, basil, and rosemary; Sakura; Industrial plants include Rosaceae plants such as plums, peaches, strawberries, apples, and
  • a duplicate gene refers to two or more homologous genes contained in one genome.
  • Homologous genes refer to, for example, genes that are derived from the same ancestral gene and have the same structure and function.
  • overlapping genes can be defined as genes having nucleotide sequences having sequence homology (preferably sequence identity) of 60% or more, preferably 70% or more, more preferably 80% or more with each other. can.
  • a duplicate gene is defined as a gene that includes a common base sequence of a predetermined length or longer and/or a base sequence that has a mismatch of one or two bases with respect to a base sequence of a predetermined length or longer. You can also.
  • the predetermined length here may be selected as appropriate, and is, for example, 16 bases or more, 17 bases or more, or 18 bases or more.
  • Duplicate genes are preferably genes with functional redundancy.
  • a group containing multiple homologous genes is called a duplicate gene group.
  • Duplicated genes mainly exist repeatedly on one chromosome, but may also be translocated and exist on different chromosomes.
  • the group of duplicated genes to be genome edited includes a plurality of genes that share a target sequence and/or a mismatch sequence containing a 1 to 2 base mismatch with the target sequence. From the perspective of achieving genome editing in all duplicated gene groups targeted for genome editing in one round of genome editing, the target sequence and/or mismatch sequence must be shared among all genes included in the duplicated gene group.
  • the number of duplicated genes included in the group of duplicated genes to be genome edited is not particularly limited, but usually 2 to 100 copies may exist.
  • the number of duplicated genes included in the group of duplicated genes to be genome edited may be 3 or more copies, or 5 or more copies, as long as the duplicated genes originate from whole-genome duplication, and The number may be 50 copies or less, 20 copies or less, and more preferably 10 copies or less.
  • the genome editing method of the present invention causes cleavage in part or all of the target sequences and/or mismatched sequences of multiple genes in the overlapping gene group, making genome editing possible. It is desirable that the genes included in the group of duplicated genes to be genome edited have high sequence similarity to each other.
  • the target sequence is a sequence corresponding to the crRNA spacer sequence in the genome editing method of the present invention, and relates to a sequence that is cleaved and genome edited by the genome editing method of the present invention.
  • the target sequence is a common sequence included in duplicated genes in the duplicated gene group, and can be composed of a continuous sequence of 16 or 17 nucleotides in length.
  • a target sequence is a perfectly matched sequence within a group of overlapping genes.
  • a mismatch sequence containing one or two mismatches with respect to the target sequence can also be cleaved and genome edited by the genome editing method of the present invention.
  • the spacer sequence in crRNA needs to be set so that the PAM sequence is included in the vicinity of the target sequence, particularly on the 5' side.
  • the PAM sequence may be any PAM sequence recognized by Cas ⁇ , and examples thereof include TTN and NTN.
  • the target sequence and the mismatched sequence are cleaved by the genome editing method, making genome editing possible. Thereby, genome editing becomes possible for all or part of the target sequence and the mismatched sequence included in the duplicated gene group.
  • Arabidopsis has 1383 overlapping gene groups, of which 818 have consecutive matches of less than 30 bases (Fig. 1A). Therefore, when conventional Cas9 is used, it is difficult to perform genome editing with one crRNA spacer sequence for many duplicated genes.
  • Arabidopsis thaliana about 70% of the overlapped gene groups have a continuous common sequence of 16 or more nucleotides in length.
  • genome editing becomes possible with a spacer sequence of one crRNA for a gene group with over about 80% overlap.
  • about 65% of the overlapping gene groups have a contiguous common sequence of 17 or more nucleotides in length.
  • genome editing is possible with a spacer sequence of one crRNA for a gene group with over about 75% overlap.
  • the nucleotide length of the target sequence can vary depending on the Cas ⁇ used.
  • the target sequence may be set so that the duplicated gene group targeted for genome editing consists of genes containing only the target sequence, or may include mismatched sequences.
  • the target sequence may be set to further include the gene.
  • the target sequence is a 17 nucleotide long sequence
  • the target sequence should be set so that the duplicated gene group targeted for genome editing includes genes containing the target sequence and genes containing mismatched sequences. Can be done.
  • crRNA is RNA that includes a spacer sequence consisting of the same base sequence as the target sequence. crRNA forms a complex with Cas protein, guides it to the target sequence or mismatch sequence of genomic DNA, and can cleave the DNA between the target sequence or mismatch sequence and PAM by the action of Cas protein.
  • the crRNA sequence can be selected and used depending on the type of Cas protein used. Known crRNA sequences for Cas ⁇ protein can be used, but examples include SEQ ID NO: 12, SEQ ID NO: 13, and SEQ ID NO: 14 (RNA sequences SEQ ID NO: 167, SEQ ID NO: 168, and SEQ ID NO: 169). A sequence selected from the following can be used depending on the type of Cas ⁇ protein.
  • the arrangement of SEQ ID NO: 12 can be used.
  • the array of SEQ ID NO: 13 can be used.
  • the arrangement of SEQ ID NO: 14 can be used.
  • crRNA can be expressed transiently or constitutively using the expression cassettes described below.
  • Cas ⁇ protein is a Cas family protein derived from huge phage.
  • Cas ⁇ protein has the activity of cleaving a target sequence with a length of 16 or more nucleotides, as well as cleaving a mismatched sequence containing a 1 to 2 base mismatch with the target sequence.
  • the upper limit of the length of the target sequence to be cleaved by the Cas ⁇ protein is not particularly limited, but from the viewpoint of cleavage activity, it is usually 20 or less, preferably 18 or less, more preferably 17 or less.
  • Cas ⁇ may be selected from the group consisting of Cas ⁇ 1, Cas ⁇ 2, and Cas ⁇ 3, but it is particularly preferred to use Cas ⁇ 2 (also referred to as Cas12j2), particularly from the viewpoint of off-target activity.
  • Cas ⁇ may have amino acid sequence mutations (eg, substitutions, deletions, additions, etc.) as long as the activity is not completely impaired.
  • Cas ⁇ protein has an amino acid sequence selected from the group consisting of SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, and SEQ ID NO: 4, or 60% or more, 70% or more, 80% or more of the sequence.
  • Non-Patent Document 3 the rate of cleavage reaction is It is more preferable because it improves.
  • the "homology" of two amino acid sequences is the ratio at which the same or similar amino acid residues appear at each corresponding position when both amino acid sequences are aligned
  • the “homology” of two amino acid sequences is “Identity” is the ratio at which the same amino acid residue appears at each corresponding position when both amino acid sequences are aligned.
  • “homology” and “identity” between two amino acid sequences can be determined using, for example, the BLAST (Basic Local Alignment Search Tool) program (Altschul et al., J. Mol. Biol., (1990), 215(3): 403-10 etc.
  • Cas ⁇ proteins having sequences specified by sequence homology or identity are further specified by a desired cleavage activity.
  • Such cleavage activity can be specified by the cleavage activity of a target sequence of 16 nucleotides or more in length and a mismatched sequence containing a 1 to 2 base mismatch with the target sequence in vitro or in vivo.
  • the cleavage activity of Cas ⁇ protein can be evaluated in vitro according to known methods.
  • the RMSD value between the skeleton of Cas ⁇ 2 and the skeleton of Cas ⁇ 3 is less than 1.135A when calculated with PyMOL software align when using PDB_ID: 7odf (Cas ⁇ 3), 7lys (Cas ⁇ 2), and when nucleic acid is further included.
  • the Ca root mean square deviation (RMSD) between the backbone of at least one Cas protein selected from the group consisting of Cas ⁇ 1, Cas ⁇ 2, Cas ⁇ 3, and vCas ⁇ and the backbone of the mutant is less than 2.5A, preferably less than 1.5A. , more preferably less than 1A, it can be said that there is a high probability of producing an effect equivalent to that exerted by the original Cas protein.
  • the TM-score between the backbone of at least one Cas protein selected from the group consisting of Cas ⁇ 1, Cas ⁇ 2, Cas ⁇ 3, and vCas ⁇ and the backbone of the mutant is 0.8 or more, preferably 0.85 or more, more preferably When it is 0.9 or more, it can be said that there is a high probability that an effect equivalent to that exerted by the original Cas protein will be produced.
  • the Cas ⁇ protein may contain additional sequences such as a signal sequence, a tag sequence, a reporter sequence, etc., as long as the desired activity is not impaired. From the viewpoint of ensuring that the expressed protein acts in the nucleus, it is desirable that a nuclear localization signal be added to the signal sequence.
  • the nuclear localization signal may include one or more nuclear localization signals arranged in series.
  • the nuclear translocation signal can be appropriately selected depending on the plant species, and as an example, KRPAATKKAGQAKKKK (SEQ ID NO: 7) and/or GSDYKDHDGDYKDHDIDYKDDDDKPKKKRKV (SEQ ID NO: 8) can be used. As a result, the Cas ⁇ protein expressed within the cell can migrate into the nucleus and cleave the target sequence in cooperation with crRNA within the nucleus.
  • a crRNA or expression cassette usually includes a promoter sequence, and can be created by placing a sequence encoding the crRNA under the control of the promoter sequence.
  • the crRNA expression cassette may be contained on one polynucleotide or on different polynucleotides.
  • the crRNA may be used as a crRNA expression cassette by placing a sequence encoding a single-stranded guide RNA linked to multiple crRNAs under the control of a promoter sequence.
  • the Cas ⁇ protein can also be expressed transiently or permanently in cells according to standard methods.
  • a Cas ⁇ expression cassette is prepared by placing a polynucleotide of a Cas ⁇ protein-encoding sequence under the control of a promoter in an expression cassette containing a promoter sequence that allows transient or constant expression. Can be done. Placed under the control of a promoter refers to placed so that expression is controlled by the promoter, and placed an appropriate number of bases, for example, 10 to 200 bases, from the 3' end of the promoter. Good too.
  • the crRNA expression cassette and the Cas ⁇ expression cassette may be contained on one polynucleotide or on different polynucleotides. These expression cassettes may contain other elements as necessary. Such elements may include elements necessary for expression, such as terminators, and elements necessary for plasmid or vector preparation, such as multi-cloning sites, drug resistance genes, reporter genes, and origins of replication.
  • the promoter used in the crRNA expression cassette and the Cas ⁇ expression cassette can be appropriately selected depending on the species of organism to be expressed.
  • a pol II promoter can be used, but a pol III promoter is preferred from the viewpoint of more accurate transcription of relatively short RNAs.
  • pol II promoters include CaMV35S promoter, RPS5A promoter, UBQ promoter, DD45 promoter, NOS promoter, and the like.
  • Examples of the polIII promoter include U6-snRNA (eg, U6.1-snRNA, U6.26-snRNA, etc.) promoter, U3-snRNA promoter, and the like.
  • the terminator used in the crRNA expression cassette and the Cas ⁇ expression cassette terminates transcription from the Cas protein coding sequence (preferably, can further add a polyA sequence to the mRNA transcribed from the Cas protein coding sequence).
  • a polyT sequence can also be added to the guide RNA.
  • the termination signal include heat shock protein termination signal (HspT), NosT (Noparin synhase Terminator), 35sT (CaMV 35S Terminator), Pea3A (Pea Rubisco subunit 3A), and the like.
  • the present invention may relate to a method for producing a crRNA expression cassette, which includes a step of determining a target sequence in a group of overlapping genes to be genome edited.
  • the target sequence in the duplicated gene group may be selected from genome information such that in the duplicated gene group to be genome edited, a continuous sequence of 16 nucleotides in length near the PAM sequence of Cas ⁇ does not contain any mismatch, or Alternatively, it may be selected to allow two mismatches.
  • the target sequence in the duplicated gene group is determined from the genome information that in the duplicated gene group to be genome edited, there is a continuous sequence of 17 nucleotides in length near the PAM sequence of Cas ⁇ , and a sequence that does not contain a mismatch, or A mismatch sequence containing two mismatches is selected.
  • a crRNA sequence can be designed by using the determined target sequence as a spacer sequence and linking it with the remaining sequences.
  • a polynucleotide consisting of the crRNA sequence designed in this way can be easily created according to known genetic engineering techniques.
  • the polynucleotide consisting of the crRNA sequence or guide RNA sequence thus prepared is incorporated into a crRNA expression cassette using known genetic engineering methods, such as PCR, restriction enzyme treatment, DNA ligation, in vitro transcription technology, etc. Can be done.
  • kits for genome editing of duplicate genes in cells the duplicated gene to be genome edited has only a 16 nucleotide long target sequence, or a 16 or 17 nucleotide long target sequence and a mismatched sequence containing a 1 to 2 base mismatch with respect to the target sequence. It is characterized by having the following.
  • kits include: (a) an expression cassette for crRNA into which a spacer sequence targeting the target sequence and the mismatch sequence can be introduced; and (b) an expression cassette for a Cas ⁇ protein derived from a huge phage and capable of cleaving the target sequence and the mismatch sequence; including.
  • the crRNA expression cassette and the Cas ⁇ protein expression cassette are incorporated into a plasmid or a vector, and the genes are introduced into cells.
  • the genome editing kit according to the present invention may further contain other materials, reagents, instruments, etc. necessary for carrying out the genome editing method of the present invention, such as nucleic acid introduction reagents and buffer solutions, as necessary. good.
  • other materials necessary for carrying out the genome editing method of the present invention include a donor polynucleotide. By introducing the donor polynucleotide into the nucleus, it is possible to knock the donor polynucleotide into the cleavage site created by the CRISPR/Cas system.
  • the present invention may also relate to a method for genome editing a duplicated gene in a cell, which includes the step of introducing into a cell a Cas ⁇ expression cassette that encodes a Cas ⁇ protein capable of cleaving the cassette.
  • the crRNA expression cassette and the Cas ⁇ expression cassette may be introduced onto two polynucleotides separately or simultaneously, or may be introduced simultaneously onto one polynucleotide.
  • a donor polynucleotide In addition to introducing the expression cassette of crRNA and/or the expression cassette of Cas ⁇ protein into cells, it is possible to introduce a donor polynucleotide. By introducing the donor polynucleotide into the nucleus, it is possible to knock the donor polynucleotide into the cleavage site created by the CRISPR/Cas system.
  • Gene introduction can be performed using techniques known in the technical field.
  • the method of introduction is not particularly limited, and can be selected as appropriate depending on the type of substance to be introduced and the target to be introduced.
  • Introduction methods are broadly classified into direct methods and methods using viral vectors.
  • Direct methods that can be used include the PEG method that utilizes the phagocytosis of protoplasts from which the cell wall of plant cells has been removed, the electroporation method, the particle gun method in which gold particles are injected together, and the whisker method.
  • Methods using viral vectors include Agrobacterium, tobacco mosaic virus (TMV), plum pox virus (PPV), potato X virus (PVX), alfalfa mosaic virus (AIMV), and cucumber, depending on the host plant species.
  • CMV cowpea mosaic virus
  • ZYMV zucchini yellow mosaic virus
  • gemini virus etc.
  • the Agrobacterium method is preferred from the viewpoint of simplicity and safety.
  • vectors suitable for introduction into plants or plant cells such as the above-mentioned vectors
  • vectors for transferring the polynucleotide of the present invention to such vectors for example, Gateway (registered trademark)
  • Gateway registered trademark
  • Entry clone vector, etc. can also be mentioned as an example.
  • the cells to be introduced may be cells cultured in vitro or cells constituting a plant body.
  • introduction sites in plants include flowers (particularly egg cells, pollen, etc. within flowers), leaves, roots, seeds, embryos, and the like.
  • the target for introduction is preferably the shoot tip from the viewpoint of performing genome editing more efficiently in germ cells.
  • a method of obtaining a genome-edited individual by redifferentiating cells into which a gene has been introduced, or a method of obtaining a genome-edited individual by utilizing a gene that induces a shoot apex from somatic cells may be used.
  • Example 1 Preparation of vectors for Huge phage-derived Cas ⁇ 2 and vCas ⁇ (1) Preparation of Huge phage-derived Cas ⁇ 2 gene Based on the amino acid sequence information (SEQ ID NO: 1) derived from Huge phage, a codon-optimized vector for Arabidopsis was A DNA sequence encoding a C-terminal nuclear export signal sequence-FLAG tag was added to a DNA sequence encoding the Cas protein obtained by adding a DNA sequence encoding the FLAG tag (SEQ ID NO: 9). Sanger method or next generation sequencing method was used to determine the base sequence. The amino acid sequence of SEQ ID NO: 1 can be found in well-known databases such as GenBank of NCBI (National Center for Biotechnology Information).
  • coli DH5a was transformed with the obtained circular plasmid, and transformants were selected by culturing on LB agar plates containing 50 ⁇ g/mL ampicillin. Several colonies were picked up, a clone containing the circular plasmid of interest was selected, and the plasmid was purified. The base sequence (SEQ ID NO: 10) and amino acid sequence (SEQ ID NO: 5) of the Cas ⁇ coding sequence of the constructed vector are shown. Next, the vector was digested with BsaI and NruI to obtain linear DNA. At the same time, the following array: A double-stranded DNA annealed with an oligonucleotide having the following was prepared.
  • Each type of double-stranded DNA annealed with the cut vector was made into a circular plasmid using T4 DNA ligase.
  • a circular plasmid was purified using the procedure described above. This vector is designated as pEX_35S-Cas ⁇ 2_HPT ( Figure 2B).
  • coli DH5a was transformed with the obtained circular plasmid, and transformants were selected by culturing on LB agar plates containing 50 ⁇ g/mL ampicillin. Several colonies were picked up, a clone containing the circular plasmid of interest was selected, and the plasmid was purified.
  • the base sequence (SEQ ID NO: 11) and amino acid sequence (SEQ ID NO: 6) of the vCas ⁇ coding sequence of the constructed vector are shown, respectively. This vector is designated as pEX_35S-vCas ⁇ _HPT.
  • This vector is designated as pCA_35S-Cas ⁇ 2_HPT and pCA_35S-vCas ⁇ _HPT.
  • Example 2 Mutation introduction with Cas ⁇ 2 and vCas ⁇ in Arabidopsis protoplast cells (1) Preparation of plasmid for genome editing experiments of Arabidopsis genes The pEX_35S-Cas ⁇ 2_HPT vector or pEX_35S-vCas ⁇ _HPT vector was cut with BsaI-HF. First, in order to investigate whether genome editing is possible using these vectors, we used the following method to clone the spacer sequence of Cas ⁇ crRNA for genome editing experiments of the Arabidopsis-derived PDS3 gene (a single copy gene in the Arabidopsis genome).
  • a total of three types of double-stranded DNA were prepared by annealing oligonucleotides having the following for each set.
  • the PDS3 gene is the phytoene desaturase 3 gene, which is a carotenoid biosynthetic enzyme, and is known to cause whitening of plant cells when knocked out. This makes it possible to identify the location of the knockout in the plant.
  • Each type of double-stranded DNA annealed with the cut vector was made into a circular plasmid using T4 DNA ligase.
  • E. coli DH5a was transformed with the obtained circular plasmid, and transformants were selected by culturing on LB agar plates containing 50 ⁇ g/mL ampicillin. Several colonies were picked up, a clone containing the circular plasmid of interest was selected, and the plasmid was purified.
  • the protoplasts were filtered through a nylon filter with a pore size of 70 ⁇ m, collected in a 50 ml tube, centrifuged at 100 x g for 10 minutes to collect the protoplasts, the supernatant was discarded, and the mixture was incubated with 150 mM NaCl, 125 mM CaCl 2 , 5 mM KCl, 2 mM MES ( pH 5.7) buffer (W5 buffer).
  • W5 buffer 150 mM NaCl, 125 mM CaCl 2 , 5 mM KCl, 2 mM MES ( pH 5.7) buffer
  • W5 buffer 150 mM NaCl, 125 mM CaCl 2 , 5 mM KCl, 2 mM MES ( pH 5.7) buffer
  • W5 buffer 150 mM NaCl, 125 mM CaCl 2 , 5 mM KCl, 2 mM MES ( pH 5.7) buffer
  • the protoplasts were centrifuged at 100 ⁇ g for 5 minutes, and then resuspended in a 400 mM mannitol, 15 mM MgCl 2 , 4 mM MES (pH 5.7) buffer. After that, the protoplasts were collected by centrifugation at 100 x g for 5 minutes, and the cell concentration was adjusted to 2.0 to 3.0 x 10 5 cells/ml using the same buffer, and the protoplasts for transformation were suspended. I got the liquid.
  • Genomic DNA was recovered from the heat-treated protoplast suspension by isopropanol precipitation. The recovered genomic DNA was suspended in sterile water, and a DNA fragment of approximately 300 bp was amplified using a primer set with the sequence listed in Table 4 below.
  • FIG. 3 shows the results of analyzing the editing efficiency using CRISPResso2 software when the target sequence length was changed to 15, 16, and 18, respectively, when vCas ⁇ was introduced.
  • a group in which the fluorescent protein GFP expression vector was introduced was used as a control.
  • editing efficiency was investigated when SpyCas9 was used for a target sequence length of 18.
  • vCas ⁇ in FIG. 3 was used, gene editing was possible when the target sequence length was 16 and 18, but when the target sequence length was 15, genome editing did not occur.
  • the genome editing efficiency when using SpyCas9 was about 0.02, but when using vCas ⁇ , it was about 0.09 at maximum.
  • Example 3 Mutation introduction using vCas ⁇ in tobacco leaf cells (1) Preparation of plasmid for genome editing experiments of tobacco genes The pEX_35S-vCas ⁇ _HPT vector was cut with BsaI-HF. In order to clone a spacer sequence for forming Cas ⁇ crRNA for genome editing experiments of tobacco-derived PDS, RDR6, and SGS3 genes, oligonucleotides having the sequences listed in Table 5 below were annealed for each set. A total of 21 types of double-stranded DNA were prepared: The PDS gene is a phytoene desaturase gene, which is a carotenoid biosynthetic enzyme, and is known to cause whitening of plant cells when knocked out.
  • the RDR6 gene is an RNA-dependent RNA polymerase 6 that is involved in distinguishing between foreign RNA and normal mRNA, and is known to have the effect of reducing resistance to viruses when knocked out. There is. It is known that in tobacco there are two duplicate genes of the RDR6 gene.
  • the SGS3 gene is gene silencing suppressor 3, which cooperates with RDR6 and functions as a defense against viruses. It is known that when the SGS3 gene is knocked out, resistance to viruses is reduced. It is known that there are two duplicated SGS3 genes in tobacco.
  • E. coli DH5a was transformed with the obtained circular plasmid, and transformants were selected by culturing on LB agar plates containing 50 ⁇ g/mL spectinomycin. Several colonies were picked up, a clone containing the circular plasmid of interest was selected, and the plasmid was purified.
  • the purified plasmid was introduced into Agrobacterium GV3101 strain by electroporation, and the transformant was cultured on an LB agar plate containing 50 ⁇ g/mL spectinomycin, 50 ⁇ g/mL gendamicin, and 50 ⁇ g/mL rifampicillin. were selected.
  • the agroinfiltrated area of the plant is colored red.
  • the cultured bacterial solution was centrifuged at 3000 rpm for 20 minutes to collect bacteria, suspended in about 5 ml of infiltration buffer (composition: 10 mM MgCl 2 , 10 mM MES, 100 ⁇ M acetosyringone, pH 5.7), and adjusted to an OD600 of about 1. .
  • infiltration buffer composition: 10 mM MgCl 2 , 10 mM MES, 100 ⁇ M acetosyringone, pH 5.7

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

少数のgRNA又はcrRNAを用いて、機能重複している多数の遺伝子を同時に編集する技術を提供することを目的とする。ヒュージファージ由来のCasΦタンパク質が、16以上のヌクレオチド長であるターゲット配列、及び当該ターゲット配列に対して1~2塩基のミスマッチを含むミスマッチ配列を切断可能であることを見出し、斯かるCasΦタンパク質を用いた重複遺伝子のゲノム編集方法を提供する。

Description

重複遺伝子のゲノム編集方法
 本発明は、重複遺伝子のゲノム編集に関する。
 ゲノム編集は、対象生物のゲノムの狙った箇所に変異を導入する(編集する)技術である。そのため、放射線などの既存の変異導入方法に比べて圧倒的に少ない数の変異体から望みの株を取得できる効率性がメリットとなり、様々な用途に使用されている。
 典型的なゲノム編集技術であるCRISPR/Cas9やCRISPR/Cas12aでは、編集対象の配列はおもにそれらを構成するgRNAまたはcrRNAのスペーサー配列とよばれる部位によって規定される。gRNAまたはcrRNAのスペーサー配列としては、通常、20~24塩基を任意に変更可能な標的配列として使用する。このスペーサー配列に加えて、ヌクレアーゼであるCas9やCas12aが機能するには、PAM配列と呼ばれる2~4塩基程度の塩基配列が必要となる。したがって、PAM配列とスペーサー配列を合わせた総計22~28塩基ほどの塩基配列を特異的に認識してゲノム編集が行われている。この認識長は、ヒトゲノムのうちの単一の領域を指定するのに十分な長さであるとされる。
 しかしながら、植物をはじめとした多くの生物では、ゲノム中に存在する相同遺伝子が機能を補償する現象(機能冗長性)が存在するため、ひとつの遺伝子を破壊しただけでは、目的とした表現型が現れないことがある。したがって、目的とした表現型を発現させるには、配列類似性がある複数の相同遺伝子を同時に編集する必要がある場合が多い。
 複数の遺伝子を同時に編集するために、多くの場合、gRNA又はcrRNAを複数発現させて、それぞれのgRNA又はcrRNAで互いに異なる遺伝子を指定する、という方法がとられている。この方法では、編集対象の遺伝子が増えれば増えるほど、gRNA又はcrRNAを多数発現させる必要があるためにベクター構築などに労力がかかるという問題がある。
 複数の遺伝子を同時に編集する他の方法として、CRISPRのオフターゲット効果を利用するという手段がある。この方法では、CRISPR/Cas9のgRNA又はcrRNAがミスマッチ配列を切断する性質を利用する。すなわち、20~24塩基をターゲットするgRNAの配列を、異なる複数の遺伝子をそれぞれ1~2塩基ミスマッチで編集するように設計すれば、ひとつのgRNA又はcrRNAで複数の遺伝子を同時に編集できるというものである。こうしたオフターゲット効果を利用した方法には、ひとつの遺伝子にひとつのgRNA又はcrRNAを使用する方法に比べて、少ないgRNA又はcrRNAで多数の遺伝子を編集できるために、ベクター構築に労力がかからないというメリットがある。
 一方で、オフターゲット効果を利用する方法には、制約もあることが知られている。CRISPR/Cas9ではスペーサー配列を短くするほどオフターゲット効果が少なくなることが報告されている。ストレプトコッカス・ピオゲネス(Streptococcus pyogenes)のCas9(以下、SpyCas9と呼ぶ)においては、20塩基認識のスペーサー配列をもつgRNA又はcrRNAを使用すると、1-2ミスマッチの配列も切断するが、17塩基認識のスペーサー配列をもつgRNA又はcrRNAを使用するとミスマッチ配列を切断し、変異を入れる効率は劇的に低下する(非特許文献1:Nat Biotechnol. 2014 Mar; 32(3): 279-284)。したがって、現状では、PAM配列+20塩基の認識でミスマッチ配列も同時に編集するか、PAM配列+17塩基が完全に一致する相同遺伝子を同時に編集するか、どちらかの方法を選択せざるを得なかった。
 新たなCasとして、ヒュージファージが有するCasΦという小型のCasファミリーが存在することが報告されており、その中のCasΦ2が、試験管内の実験において、16残基という短いターゲット配列を切断することが報告された(非特許文献2:Science (2020)369, 333-337、非特許文献3:Nature Communications (2021) volume 12, Article number: 4476)。さらにCasΦについては、結晶構造解析に基づく研究が行われており、非標的鎖と相互作用することが予測されるヘリックスに対応する155位~176位を欠失させたvCasΦにおいて、反応速度が増大することが開示された(非特許文献4:Nature Structural & Molecular Biology (2021) vol.28, pp.652-661)。CasΦを用いた植物におけるゲノム編集についても報告されている(非特許文献5:Int. J. Mol. Sci. (2022), 23, 5755)。
Nat Biotechnol. 2014 Mar; 32(3): 279-284 Science (2020)369, 333-337 Nature Communications (2021) volume 12, Article number: 4476 Nature Structural & Molecular Biology (2021) vol. 28, pp. 652-661 Int. J. Mol. Sci. (2022), 23, 5755 Plant Biotechnology (2016) 33, 235-243
 上述した多数の遺伝子を同時に編集する技術、とくに、オフターゲットを活用する技術は、機能冗長性をもつ遺伝子同士がある程度の配列類似性を持つことを前提とする。しかしながら、実際には機能重複する遺伝子の配列類似度は十分に高くない、という問題があることが経験的に知られていた。
 発明者らは、とくに機能冗長性が問題となる植物の代表例であるシロイヌナズナのゲノム配列情報を解析し、機能冗長性を持つ遺伝子同士の配列がどの程度連続して一致しているかを解析した。その結果、塩基配列が連続して一致する長さが24塩基未満であるような遺伝子が、過半数に近いことが分かった。したがって、機能冗長性を有する相同遺伝子群を破壊するためには、CRISPR/Cas9やCRISPR/Cas12aでは認識長が長すぎるか、またはオフターゲット効果が少なすぎるという問題があることを見出した。
 そこで、本発明は、かかる問題を解決すべくなされたものであって、少数のgRNA又はcrRNAを用いて、機能重複している多数の遺伝子を同時に編集する技術を提供することを目的とする。
 本発明の上記目的を解決すべく鋭意研究を行ったところ、ヒュージファージ由来のCasΦタンパク質が、16以上のヌクレオチド長であり、0~2個のミスマッチを含むターゲット配列を、細胞内で切断可能であることを見出し、重複遺伝子のゲノム編集方法についての発明に至った。
 そこで本発明は以下に関する:
[1] 細胞の重複遺伝子のゲノム編集方法であって、前記重複遺伝子が、ゲノム編集の対象となる16ヌクレオチド長のターゲット配列のみを有するか、或いは16又は17ヌクレオチド長のターゲット配列と、当該ターゲット配列に対して1~2塩基のミスマッチを含むミスマッチ配列とを有し;ここで前記方法が、
 (a)前記ターゲット配列及びミスマッチ配列を標的とするスペーサー配列を含むcrRNA;及び、
 (b)ヒュージファージ由来であり、前記ターゲット配列及び前記ミスマッチ配列を切断可能なCasΦタンパク質;
を、前記細胞内で発現させる工程を含む、重複遺伝子のゲノム編集方法。
[2]前記CasΦタンパク質が、CasΦ1、CasΦ2、vCasΦ及びCasΦ3からなる群から選ばれる少なくとも1のタンパク質である、項目1に記載のゲノム編集方法。
[3] 前記CasΦタンパク質が、配列番号1、2、3及び4からなる群から選ばれるアミノ酸配列に対し、少なくとも80%の配列相同性を有するアミノ酸配列を含む、項目1に記載のゲノム編集方法。
[4] 前記重複遺伝子が、機能冗長性を有する重複配列である、項目1~3に記載のゲノム編集方法。
[5] 前記重複遺伝子が、ターゲット配列の近傍にPAM配列を含む、項目1~4のいずれか一項に記載のゲノム編集方法。
[6] 前記スペーサー配列が、前記ターゲット配列と、完全一致するように決定される、項目1~5のいずれか一項に記載のゲノム編集方法。
[7] 前記重複遺伝子が、16以上のヌクレオチド長のターゲット配列と、場合により当該ターゲット配列に対して1~2塩基のミスマッチを含むミスマッチ配列とを有する、項目1~6のいずれか一項に記載のゲノム編集方法。
[8]  前記重複遺伝子が、17以上のヌクレオチド長のターゲット配列と当該ターゲット配列に対して1~2塩基のミスマッチを含むミスマッチ配列とを有する、項目1~7のいずれか一項に記載のゲノム編集方法。
[9] 前記重複遺伝子が、前記細胞のゲノム中に2~100コピー存在する、項目1~8のいずれか一項に記載のゲノム編集方法。
[10] 前記細胞のゲノム中に含まれる重複遺伝子のうち、一部又は全ての重複遺伝子を編集する、項目1~9のいずれか一項に記載のゲノム編集方法。
[11] 前記細胞が、植物細胞である、項目1~10のいずれか一項に記載のゲノム編集方法。
[12] 前記crRNA及び/又は前記CasΦタンパク質を、発現ベクターにより前記細胞内に導入して発現させる、項目1~11のいずれか一項に記載のゲノム編集方法。
[13] 前記発現ベクターが、一過性又は恒常性発現ベクターである、項目12に記載のゲノム編集方法。
[14] 細胞の重複遺伝子のゲノム編集用キットであって、前記重複遺伝子が、ゲノム編集の対象となる16ヌクレオチド長のターゲット配列のみを有するか、或いは16又は17ヌクレオチド長のターゲット配列と、当該ターゲット配列に対して1~2塩基のミスマッチを含むミスマッチ配列とを有し、前記キットが;
 (a)前記ターゲット配列及び前記ミスマッチ配列を標的とするスペーサー配列を導入可能なcrRNAの発現カセット;及び、
 (b)ヒュージファージ由来であり、前記ターゲット配列及び前記ミスマッチ配列を切断可能なCasΦタンパク質の発現カセット
を含む、前記キット。
 本発明によれば、少数のcrRNAを用いて多数の相同な遺伝子を同時に編集することができる。
図1Aは、シロイヌナズナにおける重複遺伝子をグループ分けし、グループ内において一致する連続塩基配列の長さにより分類したグラフを示す。1383個の重複遺伝子群をPTGbaseより抽出した。横軸が一致する連続塩基配列の長さであり、縦軸がグループの数を表す。図1Bは、図1Aにおける横軸の一致する連続塩基配列の長さについて、1~60残基長を拡大して示したグラフを示す。連続一致が30塩基未満の重複遺伝子群は、818群であり、PAMを含めた場合に、多くの重複遺伝子では同時ターゲットができる蓋然性が低い。 図2Aは、pEX-35S-HPTのベクターマップを示す。 図2Bは、pEX-CasPhi2-HPTのベクターマップを示す。 図3は、CasΦ2及びvCasΦを用いてゲノム編集を行った場合の、スペーサー配列のヌクレオチド長を変えた場合の、編集効率を示すグラフである。 図4は、タバコの葉に対して、アグロインフィルトレーションを行い、遺伝子導入された箇所におけるゲノム編集の結果の解析を示す。図4(A)は、NbPDS-1をターゲットとした場合の、導入された変異を示す。 図4は、タバコの葉に対して、アグロインフィルトレーションを行い、遺伝子導入された箇所におけるゲノム編集の結果の解析を示す。図4(B)は、NbPDS-2をターゲットとした場合の、導入された変異を示す。 図4は、タバコの葉に対して、アグロインフィルトレーションを行い、遺伝子導入された箇所におけるゲノム編集の結果の解析を示す。図4(C)は、NbRDR6-1をターゲットとした場合の、導入された変異を示す。 図4は、タバコの葉に対して、アグロインフィルトレーションを行い、遺伝子導入された箇所におけるゲノム編集の結果の解析を示す。図4(D)は、NbRDR6-2をターゲットとした場合の、導入された変異を示す。 図4は、タバコの葉に対して、アグロインフィルトレーションを行い、遺伝子導入された箇所におけるゲノム編集の結果の解析を示す。図4(E)は、NbSGS3-1をターゲットとした場合の、導入された変異を示す。 図4は、タバコの葉に対して、アグロインフィルトレーションを行い、遺伝子導入された箇所におけるゲノム編集の結果の解析を示す。図4(F)は、NbSGS3-2をターゲットとした場合の、導入された変異を示す。 図5(A)は、CasΦ2のアミノ酸配列(配列番号1)を示す。図5(B)は、CasΦ1のアミノ酸配列(配列番号2)を示す。図5(C)は、CasΦ3のアミノ酸配列(配列番号3)を示す。 図5(D)は、シロイヌナズナコドン最適化を行ったCasΦ2のDNA配列(大文字)+核移行シグナルおよびFLAGタグをコードするDNA配列(配列番号9)を示す。 図5(E)は、作製したプラスミド上のCasΦ2のコード領域の塩基配列(配列番号10)を示す。 図5(F)は、作製したプラスミド上のCasΦ2のコード領域のアミノ酸配列(配列番号5)を示す。図5(G)は、シロイヌナズナコドン最適化を行ったvCasΦのDNA配列(大文字)+核移行シグナルおよびFLAGタグをコードするDNA配列(小文字)(配列番号11)を示す。 図5(H)は、作製したプラスミド上のvCasΦのコード領域のアミノ酸配列(配列番号6)を示す。図5(I)は、CasΦ2およびvCasΦのcrRNA配列(配列番号12)(大文字がdirect repeat配列;スペーサー配列は3’側につく)を示す。図5(J)は、CasΦ1のcrRNA配列(配列番号13)(大文字がdirect repeat配列;スペーサー配列は3’側につく)を示す。図5(K)は、CasΦ3のcrRNA配列(配列番号14)(大文字がdirect repeat配列;スペーサー配列は3’側につく)を示す。図5(L)は、vCasΦのアミノ酸配列(配列番号4)を示す。
 本発明の一の態様は、重複遺伝子のゲノム編集方法に関する。より具体的に、本発明の重複遺伝子のゲノム編集方法において編集される重複遺伝子は、ゲノム編集の対象となる16又は17ヌクレオチド長のターゲット配列、及び/又は当該ターゲット配列に対して1~2塩基のミスマッチを含むミスマッチ配列を有することにより特徴づけられる。本発明の重複遺伝子のゲノム編集方法は、かかる重複遺伝子を含む細胞に
 (a)前記ターゲット配列及びミスマッチ配列を標的とするスペーサー配列を含むcrRNA;及び、
 (b)ヒュージファージ由来であり、前記ターゲット配列及び前記ミスマッチ配列を切断可能なCasΦタンパク質;
を、前記細胞内で発現させる工程を含む。本発明の方法により、crRNAとCasΦとが細胞内で発現することにより、重複遺伝子のターゲット配列が認識されて切断が可能になり、それによりゲノム編集が可能になる。本発明の方法は、重複遺伝子を多く含む生物の細胞に対して使用されることが好ましい。そのような生物として、植物、動物、菌類が挙げられる。植物の中でも特に、穀物、園芸作物、観賞用植物、又は飼料植物において用いられることが好ましく、特にイネ、コムギ、オオムギ、カラスムギ、ライムギ、キビ、アワ、ヒエ、トウモロコシ、サトウキビなどのイネ科植物、ダイズなどのマメ科植物、そばなどのタデ科植物、キュウリ、スイカ、カボチャ、ズッキーニなどのウリ科植物、ナス、トマト、ジャガイモ、トウガラシ、ピーマン、タバコなどのナス科植物、サツマイモなどのヒルガオ科植物、タロイモ、サトイモなどのサトイモ科植物、自然薯、ヤマイモ、ナガイモなどのヤマノイモ科植物、キャベツ、ハクサイ、カブ、ダイコン、シロイヌナズナなどのアブラナ科植物、シソ、バジル、ローズマリーなどのシソ科植物、サクラ、ウメ、モモ、イチゴ、リンゴ、ナシなどのバラ科植物、ニンジン、セロリ、クミン、ミツバ、パセリなどのセリ科植物、タマネギ、ネギ、ニンニクなどのヒガンバナ科植物、キャッサバなどのトウダイクサ科植物など、産業上有用な任意の植物が挙げられる。
 一態様によれば、重複遺伝子とは、1つのゲノム内に2つ以上含まれる相同遺伝子のことをいう。相同遺伝子とは、例えば、同一の祖先遺伝子に由来し、同じ構造・機能を持つ遺伝子のことをいう。一態様によれば、重複遺伝子は、互いに60%以上、好ましくは70%以上、さらに好ましくは80%以上の配列相同性(好ましくは配列同一性)を有する塩基配列を有する遺伝子として定義することができる。一態様によれば、重複遺伝子は、所定長以上の共通する塩基配列を含むか、及び/又は所定長以上の塩基配列に対し、1塩基又は2塩基のミスマッチを有する塩基配列を含む遺伝子として定義することもできる。ここでいう所定長は、適宜選択されてよいが、一例として16塩基以上、17塩基以上、又は18塩基以上である。重複遺伝子は、好ましくは機能冗長性を有する遺伝子である。複数の相同遺伝子を含むグループを重複遺伝子群という。重複遺伝子は、主に1つの染色体上で繰り返し存在しているが、転座して異なる染色体上に存在していてもよい。ゲノム編集対象となる重複遺伝子群には、ターゲット配列、及び/又は当該ターゲット配列に対して1~2塩基のミスマッチを含むミスマッチ配列を共有する遺伝子が複数存在する。1回のゲノム編集でゲノム編集対象となる重複遺伝子群の全てにおいてゲノム編集を達成する観点からは、重複遺伝子群に含まれるすべての遺伝子において、ターゲット配列及び/又はミスマッチ配列が共有されていることが好ましい。ゲノム編集対象となる重複遺伝子群に含まれる重複遺伝子の数は、特に限定されないが、通常2~100コピー存在しうる。ゲノム編集対象となる重複遺伝子群に含まれる重複遺伝子の数は、全ゲノム重複を起源として持つ重複遺伝子であれば、3コピー以上であってもよいし、5コピー以上であってもよく、かつ50コピー以下であってもよいし、20コピー以下であってもよいし、10コピー以下がより好ましい。ターゲット配列を共有することにより、本発明のゲノム編集方法によって、重複遺伝子群内の複数の遺伝子のターゲット配列及び/又はミスマッチ配列の一部又は全てにおいて切断が生じ、ゲノム編集が可能になる。ゲノム編集対象となる重複遺伝子群に含まれる遺伝子は、互いに高い配列類似性を有することが望ましい。
 本発明において、ターゲット配列とは、本発明に係るゲノム編集方法におけるcrRNAのスペーサー配列に対応する配列であり、本発明に係るゲノム編集方法より切断されて、ゲノム編集される配列に関する。ターゲット配列は、重複遺伝子群内の重複遺伝子に含まれる共通する配列であって、16又は17ヌクレオチド長の連続する配列から構成されうる。ターゲット配列は、重複遺伝子群内で完全に一致する配列である。一方、ターゲット配列に対して、1又は2個のミスマッチが含まれているミスマッチ配列も、本発明に係るゲノム編集方法より切断されて、ゲノム編集されうる。crRNAにおけるスペーサー配列は、ターゲット配列の近傍、特に5’側に隣接してPAM配列が含まれるようにターゲット配列を設定することが必要となる。PAM配列としては、CasΦが認識するPAM配列であればよく、一例としてTTN、NTNが挙げられる。
 1つのcrRNAスペーサー配列により、ターゲット配列とミスマッチ配列とがゲノム編集方法により切断されて、ゲノム編集が可能になる。これにより、重複遺伝子群に含まれるターゲット配列とミスマッチ配列の全て又は一部について、ゲノム編集が可能になる。シロイヌナズナは1383個の重複遺伝子群を有しており、そのうち、30塩基未満の連続一致を有する重複遺伝子群は818個である(図1A)。したがって、従来のCas9を用いた場合には、多くの重複遺伝子では、1つのcrRNAスペーサー配列でゲノム編集を行うことは困難である。一方、シロイヌナズナにおいて16以上のヌクレオチド長の連続する共通配列を有する重複遺伝子群は、約70%となる。さらに、1又は2個のミスマッチを許容することで、約80%超の重複遺伝子群について、1つのcrRNAのスペーサー配列によって、ゲノム編集が可能になる。シロイヌナズナにおいて17以上のヌクレオチド長の連続する共通配列を有する重複遺伝子群は、約65%となる。さらに、1又は2個のミスマッチを許容することで、約75%超の重複遺伝子群について、1つのcrRNAのスペーサー配列によって、ゲノム編集が可能になる。ターゲット配列のヌクレオチド長は、使用するCasΦに応じて変化しうる。
 ターゲット配列が16ヌクレオチド長の配列である場合、ゲノム編集対象となる重複遺伝子群には、ターゲット配列のみを含む遺伝子から構成されるように、ターゲット配列を設定してもよいし、ミスマッチ配列を含む遺伝子をさらに含むようにターゲット配列を設定してもよい。
 一方、ターゲット配列が17ヌクレオチド長の配列である場合、ゲノム編集対象となる重複遺伝子群には、ターゲット配列を含む遺伝子と、ミスマッチ配列を含む遺伝子とが含まれるように、ターゲット配列を設定することができる。
 crRNAは、ターゲット配列と同一の塩基配列からなるスペーサー配列を含むRNAである。crRNAは、Casタンパク質と複合体を形成し、ゲノムDNAのターゲット配列又はミスマッチ配列に誘導し、Casタンパク質の作用によりターゲット配列又はミスマッチ配列とPAMとの間でDNAを切断することができる。crRNA配列は、利用するCasタンパク質の種類に応じて選択して使用することができる。CasΦタンパク質に対するcrRNA配列は公知のものを使用することができるが、一例として、配列番号12、配列番号13、及び配列番号14(RNA配列として配列番号167、配列番号168、及び配列番号169)からなる配列から選ばれる配列をCasΦタンパク質の種類に応じて、使用することができる。一例として、CasΦ2及びvCasを使用する場合には、配列番号12の配列を用いることができる。CasΦ1を用いる場合には、配列番号13の配列を用いることができる。CasΦ3を使用する場合には、配列番号14の配列を用いることができる。crRNAは、以下に説明する発現カセットを用いて、一過的又は恒常的で発現することができる。
 CasΦタンパク質とは、ヒュージファージ由来のCasファミリーのタンパク質である。CasΦタンパク質は、16以上のヌクレオチド長のターゲット配列を切断するとともに、当該ターゲット配列に対して1~2塩基のミスマッチを含むミスマッチ配列を切断する活性を有する。CasΦタンパク質が切断するターゲット配列の長さの上限は、特に限定されないが、切断活性の観点から、通常20以下、好ましくは18以下、さらに好ましくは17以下である。CasΦは、CasΦ1、CasΦ2、及びCasΦ3からなる群から選ばれうるが、特にオフターゲット活性の観点から特にCasΦ2(Cas12j2とも呼ばれる)を使用することが好ましい。CasΦに対しては、活性を完全に損なわない限りにおいて、アミノ酸配列の変異(例えば、置換、欠失、付加など)を有していてもよい。この観点から、CasΦタンパク質は、配列番号1、配列番号2、配列番号3、及び配列番号4からなる群から選ばれるアミノ酸配列、又は当該配列に対し、60%以上、70%以上、80%以上、90%以上、93%以上、95%以上、97%以上、98%以上、又は99%以上の配列相同性(好ましくは配列同一性)を有する配列を有しうる。特にCasΦ2において、非ターゲット鎖と相互作用するとされるヘリックス領域(配列番号1の155位~176位)を削除した変異型CasΦ2(vCasΦとも呼ばれる:アミノ酸配列:配列番号4)において、切断反応の速度が向上することから、より好ましい(非特許文献3)。
 なお、本明細書において、2つのアミノ酸配列の「相同性」とは、両アミノ酸配列をアラインメントした際に各対応箇所に同一又は類似のアミノ酸残基が現れる比率であり、2つのアミノ酸配列の「同一性」とは、両アミノ酸配列をアラインメントした際に各対応箇所に同一のアミノ酸残基が現れる比率である。なお、2つのアミノ酸配列の「相同性」及び「同一性」は、例えばBLAST(Basic Local Alignment Search Tool)プログラム(Altschul et al., J. Mol. Biol., (1990), 215(3):403-10)等を用いて求めることが可能である。
 配列相同性又は同一性により特定された配列を有するCasΦタンパク質は、さらに所望される切断活性により特定される。このような切断活性としては、インビトロ又はインビボにおける、16ヌクレオチド長以上のターゲット配列及び当該ターゲット配列に対して1~2塩基のミスマッチを含むミスマッチ配列の切断活性により特定されうる。CasΦタンパク質の切断活性については、in vitroにおいて公知の方法に従い評価することができる。CasΦ2の骨格と、CasΦ3の骨格との間でRMSD値は、PDB_ID:7odf(CasΦ3)、7lys(CasΦ2)を用いた場合に、PyMOLソフトウェアalignにて計算すると1.135A未満、核酸をさらに含めると0.97であることから、CasΦ2と、CasΦ3との間の構造はかなり類似している。加えて、および、独自ソフトウェアにてTM-score=0.85以上であったことからも、構造が類似していることが支持される。したがって、変異体については、配列同一性又は相同性で特定に加えて、又は代えてRMSD値により特定することができる。CasΦ1、CasΦ2、CasΦ3、vCasΦからなる群から選ばれる、少なくとも1のCasタンパク質の骨格と、変異体の骨格との間のCα平均二乗偏差(RMSD)が2.5A未満、好ましくは1.5A未満、さらに好ましくは1A未満である場合に、元のCasタンパク質が奏する作用と同等の作用を生じる蓋然性が高いといえる。あるいは、TM-score値により特定することができる。CasΦ1、CasΦ2、CasΦ3、vCasΦからなる群から選ばれる、少なくとも1のCasタンパク質の骨格と、変異体の骨格との間のTM-scoreが0.8以上、好ましくは0.85以上、さらに好ましくは0.9以上である場合に、元のCasタンパク質が奏する作用と同等の作用を生じる蓋然性が高いといえる。
 CasΦタンパク質には、所望される活性が損なわれない限りにおいて、シグナル配列、タグ配列、レポーター配列などの追加の配列が含まれてもよい。発現されたタンパク質が、核内で作用することを担保する観点から、シグナル配列としては、核移行シグナルが付加されていることが望ましい。核移行シグナルは、1つ又は複数の核移行シグナルを直列に配置してもよい。核移行シグナルとしては、植物種に応じて適宜選択することができ、一例として、KRPAATKKAGQAKKKK(配列番号7)、及び/又はGSDYKDHDGDYKDHDIDYKDDDDKPKKKRKV(配列番号8)を使用することができる。これにより細胞内で発現されたCasΦタンパク質は、核内に移行し、核内にてcrRNAと協働してターゲット配列を切断することができる。
 crRNA又は発現用カセットとしては、通常、プロモーター配列を含み、その制御下に、crRNAをコードする配列を配置することで作成することができる。crRNA発現用カセットは、1のポリヌクレオチド上に含まれてもよいし、異なるポリヌクレオチド上に含まれてもよい。crRNAとして、crRNAと複数連結して一本鎖としたガイドRNAをコードする配列をプロモーター配列の制御下に配置することで、crRNA発現用カセットとしてもよい。
 CasΦタンパク質についても、定法に従い、一過的又は恒常的に細胞内で発現させることができる。一例として、CasΦタンパク質をコードする配列のポリヌクレオチドを、一過的又は恒常的に発現を許容するプロモーター配列を含む発現カセット中に、プロモーターの制御下に配置してCasΦ発現用カセットを調製することができる。プロモーターの制御下に配置するとは、プロモーターにより発現が制御されるように配置されることを言い、プロモーターの3’末端から、適切な塩基数、例えば10bp~200bpの塩基数を空けて配置されてもよい。
 crRNA発現用カセットとCasΦ発現用カセットは、1のポリヌクレオチド上に含まれてもよいし、異なるポリヌクレオチド上に含まれてもよい。これらの発現用カセットは、必要に応じて他の要素を含んでもよい。このような要素としては、ターミネーターなど発現に必要な要素や、マルチクローニングサイト、薬剤耐性遺伝子、レポーター遺伝子、複製起点など、プラスミド又はベクターの調製に必要な要素が含まれていてもよい。
 crRNA発現用カセット及びCasΦ発現用カセットにおいて使用されるプロモーターとしては、発現させる生物種に応じて適宜選択することができる。植物において発現さ
せる場合、一例として、polII系プロモーターを使用することもできるが、比較的短いRNAの転写をより正確に行わせるという観点から、polIII系プロモーターが好ましい。polII系プロモーターとしては、例えばCaMV35Sプロモーター、RPS5Aプロモーター、UBQプロモーター、DD45プロモーター、NOSプロモーター等が挙げられる。polIII系プロモーターとしては、U6-snRNA(例えばU6.1-snRNA、U6.26-snRNA等)プロモーター、U3-snRNAプロモーター等が挙げられる。
 crRNA発現用カセット及びCasΦ発現用カセットにおいて使用されるターミネーターとしては、Casタンパク質コード配列からの転写を終結させ(好ましくは、さらにCasタンパク質コード配列から転写されるmRNAにpolyA配列を付加でき)ることができる塩基配列である限り特に制限されない。またガイドRNAについては、polyT配列を付加することもできる。終結シグナルとしては、例えば、ヒートショックタンパク質終結シグナル(HspT:Heat shock protein Terminator)、NosT(Noparin synhase Terminator)、35sT(CaMV 35S Terminator)、Pea3A(Pea Rubisco subunit 3A)等が挙げられる。
 別の態様では、本発明はゲノム編集対象となる重複遺伝子群におけるターゲット配列を決定する工程を含む、crRNA発現用カセットの製造方法に関してもよい。重複遺伝子群におけるターゲット配列は、ゲノム情報から、ゲノム編集対象となる重複遺伝子群において、CasΦのPAM配列近傍に16ヌクレオチド長の連続配列が、ミスマッチを含まないように選択されてもよいし、1又は2個のミスマッチを許容するように選択されてもよい。別の態様では、重複遺伝子群におけるターゲット配列は、ゲノム情報から、ゲノム編集対象となる重複遺伝子群において、CasΦのPAM配列近傍に17ヌクレオチド長の連続配列が、ミスマッチを含まない配列と、1又は2個のミスマッチを含むミスマッチ配列とから構成されるように選択される。決定されたターゲット配列をスペーサー配列とし、その余の配列と連結することで、crRNA配列を設計することができる。こうして設計されたcrRNA配列からなるポリヌクレオチドを、公知の遺伝子工学的手法に従って容易に作成することができる。こうして作製されたcrRNA配列又はガイドRNA配列からなるポリヌクレオチドを、公知の遺伝子工学的手法、例えばPCR、制限酵素処理、DNA連結、in vitro転写技術などを利用して、crRNA発現用カセットに組み込むことができる。
 本発明の別の態様では、細胞の重複遺伝子のゲノム編集用キットに関していてもよい。かかるキットにおいて、ゲノム編集される重複遺伝子は、16ヌクレオチド長のターゲット配列のみを有するか、或いは16又は17ヌクレオチド長のターゲット配列と、当該ターゲット配列に対して1~2塩基のミスマッチを含むミスマッチ配列とを有することを特徴とする。かかるキットは以下の:
 (a)前記ターゲット配列及び前記ミスマッチ配列を標的とするスペーサー配列を導入可能なcrRNAの発現カセット;及び、
 (b)ヒュージファージ由来であり、前記ターゲット配列及び前記ミスマッチ配列を切断可能なCasΦタンパク質の発現カセット;
を含む。crRNAの発現カセットとCasΦタンパク質の発現カセットは、一例としてプラスミドやベクターなどに組み込み、細胞へと遺伝子導入される。本発明に係るゲノム編集用キットには、さらに、必要に応じて核酸導入試薬、緩衝液等、本発明のゲノム編集方法の実施に必要な他の材料、試薬、器具等を適宜含んでいてもよい。本発明のゲノム編集方法の実施に必要な他の材料としては、crRNAの発現カセット及び/又はCasΦタンパク質の発現カセットに加えて、ドナーポリヌクレオチドが挙げられる。ドナーポリヌクレオチドを核内へと導入することにより、CRISPR/Casシステムにより生じた切断箇所に、ドナーポリヌクレオチドのノックインが可能となる。
 本発明の別の態様では、以下の:
 (a)crRNA発現用カセットの製造方法により製造されたcrRNA発現用カセットを細胞に導入する工程、及び
 (b)ヒュージファージ由来であり、前記ターゲット配列及び前記ミスマッチ配列を切断可能なCasΦタンパク質の発現カセットを切断可能なCasΦタンパク質をコードする、CasΦ発現用カセットを細胞に導入する工程
 を含む、細胞の重複遺伝子のゲノム編集方法に関してもよい。crRNA発現用カセット及びCasΦ発現用カセットは、2つのポリヌクレオチド上で別個に又は同時に導入されてもよいし、1のポリヌクレオチド上で同時に導入されてもよい。crRNAの発現カセット及び/又はCasΦタンパク質の発現カセットの細胞への導入に加えて、ドナーポリヌクレオチドを導入することが挙げられる。ドナーポリヌクレオチドを核内へと導入することにより、CRISPR/Casシステムにより生じた切断箇所に、ドナーポリヌクレオチドのノックインが可能となる。
 遺伝子導入は、本技術分野に公知の手法を用いて行うことができる。導入方法は、特に制限されず、導入する物の種類や導入対象に応じて、適宜選択することができる。導入方法としては、直接法とウイルスベクターを用いた方法とに大別される。直接法としては、植物細胞の細胞壁を取り除いたプロトプラストの貪食作用を利用するPEG法やエレクトロポレーション法、金粒子とともに打ち込むパーティクル・ガン法、ウイスカー法などが利用されうる。ウイルスベクターを用いた方法としては、宿主の植物種に応じて、アグロバクテリウム、タバコモザイクウイルス(TMV)、プラムポックスウイルス(PPV)、ジャガイモXウイルス(PVX)、アルファルファモザイクウイルス(AIMV)、キュウリモザイクウイルス(CMV)、カウピーモザイク ウイルス(CPMV)、ズッキーニイエローモザイクウイルス(ZYMV)、ジェミニウイルスなどをベクターとして使用することができる。これらの中でも、簡便性や安全性等の観点から、好ましくはアグロバクテリウム法が挙げられる。また、上記のベクターのように、植物体又は植物細胞への導入に適したベクター以外にも、このようなベクターに本発明のポリヌクレオチドを移し替えるためのベクター(例えば、ゲートウェイ(登録商標)のエントリークローンベクター等)も一例として挙げることができる。
 導入される細胞は、インビトロで培養された細胞であってもよいし、植物体を構成する細胞であってもよい。植物体における導入部位としては、例えば花(特に、花の中の、卵細胞、花粉等)、葉、根、種子、胚等が挙げられる。ゲノム編集による変異を次世代に伝えるべく、生殖細胞においてより効率的にゲノム編集を行うという観点から、導入対象としては、好ましくは茎頂が挙げられる。また、好ましくは、遺伝子導入した細胞から再分化を行ってゲノム編集個体を得る方法、もしくは、体細胞から茎頂を誘導する遺伝子を活用してゲノム編集個体を得る方法を用いてもよい。
 本明細書において言及される全ての文献はその全体が引用により本明細書に取り込まれる。
 以下、本発明を実施例に則して更に詳細に説明するが、これらの実施例はあくまでも説明のために便宜的に示す例に過ぎず、本発明は如何なる意味でもこれらの実施例に限定されるものではない。
実施例1:ヒュージファージ(Huge phage)由来CasΦ2、vCasΦのベクターの調製
(1)ヒュージファージ由来CasΦ2遺伝子の調製
 ヒュージファージ由来のアミノ酸配列情報(配列番号1)を基に、シロイヌナズナにコドン最適化されたCasタンパク質をコードするDNA配列に、C末端核移行シグナル配列-FLAGタグをコードするDNA配列を付加したものを人工合成した(配列番号9)。塩基配列の決定にはサンガー法あるいは次世代シーケンス法を用いた。配列番号1のアミノ酸配列はNCBI(国立バイオテクノロジー情報センター)のGenBankなどのよく知られたデータベースにおいて見出すことができる。
(2)植物における一過的CasΦ2発現用ベクターの構築
 核移行シグナル-FLAGタグを付与したシロイヌナズナコドン最適化CasΦ遺伝子(配列番号9)をpEX_35S_vector(ユーロフィンジェノミクス株式会社にて遺伝子合成:図2A)に組み込んだ。配列番号9の合成遺伝子断片と、NcoIとHindIIIで切断したリニア化pEX_35S_vectorを混合し、NEBuilder HiFi DNA Assembly Master Mixにより、DNA断片を環状プラスミド化した。得られた環状プラスミドで大腸菌DH5aを形質転換し、50μg/mLアンピシリンを含むLB寒天プレート上で培養することにより形質転換体を選択した。数個のコロニーをピックアップし、目的の環状プラスミドを有するクローンを選択し、プラスミドを精製した。作製されたベクターのCasΦコード配列の塩基配列(配列番号10)、アミノ酸配列(配列番号5)をそれぞれ示す。次に、そのベクターについて、BsaIとNruIで切断し、線状DNAを得た。同時に、以下の配列:
を有するオリゴヌクレオチドをアニーリングした2本鎖DNAを準備した。切断したベクターとアニーリングした2本鎖DNAを一種類ずつT4 DNA ligaseを用いて環状プラスミド化した。上記の手順で環状プラスミドを精製した。本ベクターはpEX_35S-CasΦ2_HPTと表記する(図2B)。
(3)植物における一過的vCasΦ発現用ベクターの構築
 核移行シグナル-FLAGタグを付与したシロイヌナズナコドン最適化CasΦ遺伝子(配列番号9)をPCRにて分割した。
以下の配列:
それぞれのプライマーセットをもちいて、配列番号9の合成遺伝子断片を鋳型としてPCR反応により増幅した。PCR反応により増幅できた2本のリニアDNAと、NcoIとHindIIIで切断したリニア化pEX_Cas9ベクターを混合し、NEBuilder HiFi DNA Assembly Master Mixにより、DNA断片を環状プラスミド化した。得られた環状プラスミドで大腸菌DH5aを形質転換し、50μg/mLアンピシリンを含むLB寒天プレート上で培養することにより形質転換体を選択した。数個のコロニーをピックアップし、目的の環状プラスミドを有するクローンを選択し、プラスミドを精製した。作製されたベクターのvCasΦコード配列の塩基配列(配列番号11)、アミノ酸配列(配列番号6)をそれぞれ示す。本ベクターはpEX_35S-vCasΦ_HPTと表記する。
(4)植物個体用CasΦ2,vCasΦベクターの構築
 pCAMBIA105.1R(コスモバイオ)をPmlIとAseIで切断して線状バイナリーベクターを取得した。同時に、pEX_35S-CasΦ2_HPT、pEX_35S-vCasΦ_HPTそれぞれをPaqCIで切断して線状DNAを取得した。それぞれのDNAを線状バイナリーベクターと混合し、NEBuilder HiFi DNA Assembly Master Mixにより、DNA断片を環状プラスミド化した。得られた環状プラスミドで大腸菌DH5aを形質転換し、50μg/mLアンピシリンを含むLB寒天プレート上で培養することにより形質転換体を選択した。数個のコロニーをピックアップし、目的の環状プラスミドを有するクローンを選択し、プラスミドを精製した。本ベクターはpCA_35S-CasΦ2_HPT、pCA_35S-vCasΦ_HPTと表記する。
実施例2:シロイヌナズナプロトプラスト細胞におけるCasΦ2、vCasΦによる変異導入
(1)シロイヌナズナ遺伝子のゲノム編集実験用のプラスミドの調整
 pEX_35S-CasΦ2_HPTベクターもしくはpEX_35S-vCasΦ_HPTベクターをBsaI-HFで切断した。まずは、これらのベクターによりゲノム編集が可能かを調べるために、シロイヌナズナ由来PDS3遺伝子(シロイヌナズナゲノム中にシングルコピーの遺伝子)のゲノム編集実験用のCasΦのcrRNAのスペーサー配列をクローニングするために、以下の表3に記載の配列:
 を有するオリゴヌクレオチドをそれぞれのSetごとにアニーリングした2本鎖DNAを合計3種類準備した。PDS3遺伝子は、カロテノイド生合成酵素である フィトエン不飽和化酵素(phytoene desaturase)3遺伝子であり、ノックアウトされると植物細胞が白化することが知られている。これにより、植物体でノックアウトされている箇所の特定が可能になる。切断したベクターとアニーリングした2本鎖DNAを一種類ずつT4 DNA ligaseを用いて環状プラスミド化した。得られた環状プラスミドで大腸菌DH5aを形質転換し、50μg/mLアンピシリンを含むLB寒天プレート上で培養することにより形質転換体を選択した。数個のコロニーをピックアップし、目的の環状プラスミドを有するクローンを選択し、プラスミドを精製した。
(2)シロイヌナズナプロトプラストの調製
 約20~30日間生育させたシロイヌナズナの葉を、セロハンテープにより表皮を剥ぎとり葉肉細胞を露出させた後、その葉を適量の1.0%セルラーゼ-オノズカR10(ヤクルト社製)、0.25%マセロザイム R-10(ヤクルト社製)、10mMメルカプトエタノール、400mMマンニトール、20mM KCl、10mM CaCl2、20mM MES(pH5.7)溶液に浸し、22℃、50rpmで振とうしながら、1時間インキュベートし、プロトプラストを遊離させた。プロトプラストは孔径70μmのナイロンフィルターで濾した後、50ml容チューブに集め、100×g、10分間遠心しプロトプラストを回収した後、上清を捨て、150mM NaCl、125mM CaCl2、5mM KCl、2mM MES(pH5.7)緩衝液(W5緩衝液)で再懸濁した。再懸濁したプロトプラストは18%スクロース溶液に重層し、400xg、5分遠心して、健全な細胞のみを濃縮した。濃縮した細胞は、W5緩衝液で再度懸濁した。W5緩衝液による洗浄を2度繰り返した後、4℃で10分間インキュベートした。インキュベート後のプロトプラストは、100×g、5分間遠心後、400mMマンニトール、15mM MgCl2、4mM MES(pH5.7)緩衝液で再懸濁した。その後、100×g、5分間遠心することでプロトプラストを回収した後、2.0~3.0×105cells/mlになるよう同緩衝液で細胞濃度を調製し、形質転換用プロトプラスト懸濁液を得た。
(3)シロイヌナズナプロトプラストへのプラスミドDNA導入
 得られた形質転換用プロトプラスト懸濁液35μLと10uMのプラスミド溶液10μLを混合後、40%(w/v)PEG4000、200mMマンニトール、100mMCaCl2溶液を45μLずつ、それぞれ96穴プレート(ヌンク社製、丸底)に入れ、900rpm、15秒間振とうし、溶液を混合した。混合液は10分間室温で静置した。静置後の混合液にW5緩衝液を200μL勢いよく加えることでプロトプラストを懸濁させた後、100×g、5分間遠心し、プロトプラスト細胞をプレート底に集め、上清を200μL捨てることで、プロトプラスト懸濁液を洗浄した。この作業を計4回行った後、各ウェルをパラフィルムでシールし、22℃で36時間静置した。
(4)ゲノムDNAのAmplicon-seq解析
 プラスミドDNAを導入後22℃で36時間静置したプロトプラスト懸濁液を200μL容チューブに回収し、ゲノム抽出バッファー(200mM Tris-HCl、pH7.5、250mM NaCl、25mM EDTA、0.5%SDS)と混合後、95℃で10分間インキュベートした後、氷上で5分間静置した。熱処理後のプロトプラスト懸濁液からイソプロパノール沈殿によりゲノムDNAを回収した。回収したゲノムDNAは滅菌水で懸濁し、以下の表4に記載の配列のプライマーセットを使用して増幅した約300bpのDNA断片を、iSeq100システム(Illmina社)によりAmplicon-seqを行い、ゲノム編集を検出した。vCasΦを導入した場合の、標的配列長をそれぞれ15、16、18と変化させた場合の編集の編集効率を、CRISPResso2ソフトで分析した結果を図3に示す。Controlは、蛍光タンパク質GFP発現ベクターの導入区を対照として用いた。さらにvCasΦのさらなる対照として、SpyCas9を標的配列長18に対して用いた場合の編集効率を調べた。図3のvCasΦを用いた場合、標的配列長が16及び18である場合に、遺伝子編集が可能であった一方で、標的配列長が15になると、ゲノム編集が生じなかった。SpyCas9を用いた場合のゲノム編集効率は0.02程度であったが、vCasΦを用いた場合は最大で0.09程度であった。
実施例3: タバコ葉細胞におけるvCasΦによる変異導入
(1)タバコ遺伝子のゲノム編集実験用のプラスミドの調整
pEX_35S-vCasΦ_HPTベクターをBsaI-HFで切断した。タバコ由来PDS、RDR6、SGS3遺伝子のゲノム編集実験用のCasΦのcrRNAを形成するためのスペーサー配列をクローニングするために、以下の表5に記載の配列を有するオリゴヌクレオチドをそれぞれのSetごとにアニーリングした2本鎖DNAを合計21種類準備した:
 PDS遺伝子は、カロテノイド生合成酵素であるフィトエン不飽和化酵素(phytoene desaturase)遺伝子であり、ノックアウトされると植物細胞が白化することが知られている。これにより、植物体でノックアウトされている箇所の特定が可能になる。タバコにおいて、PDS遺伝子の重複遺伝子が2個存在することが知られている。RDR6遺伝子は、RNA依存性RNAポリメラーゼ6であり、外来RNAと正常なmRNAとの識別に関与しており、ノックアウトされることで、ウイルスへの抵抗性が減じるという作用が生じることが知られている。タバコにおいて、RDR6遺伝子の重複遺伝子が2個存在することが知られている。SGS3遺伝子は、遺伝子サイレンシングサプレッサー3であり、RDR6と協働し、ウイルスに対する防御機能として機能する。SGS3遺伝子は、ノックアウトされると、ウイルスへの抵抗性が減じるという作用が生じることが知られている。タバコにおいて、SGS3遺伝子の重複遺伝子が2個存在することが知られている。切断したベクターとアニーリングした2本鎖DNAを一種類ずつT4 DNA ligaseを用いて環状プラスミド化した。得られた環状プラスミドで大腸菌DH5aを形質転換し、50μg/mLスペクチノマイシンを含むLB寒天プレート上で培養することにより形質転換体を選択した。数個のコロニーをピックアップし、目的の環状プラスミドを有するクローンを選択し、プラスミドを精製した。精製したプラスミドを、アグロバクテリウムGV3101株にエレクトロポレーション法で導入し、50μg/mLスペクチノマイシン、50μg/mLゲンダマイシン、50μg/mLリファンピシリンを含むLB寒天プレート上で培養することにより形質転換体を選抜した。
(2)タバコの葉へのアグロインフィルトレーション実験
 目的の環状プラスミドを有するアグロバクテリウムGV3101株(非特許文献6:Plant Biotechnology 33, 235-243 (2016)のMaterials and Methods 参照)のコロニーを、50μg/mLスペクチノマイシン、50μg/mLゲンダマイシン、50μg/mLリファンピシリンを含む液体LB培地に植菌し、28℃、2日間振盪培養した。導入後に赤色色素を発現するpDEST_35S_RUBY_HSP(Ab28) コンストラクトを有するGV3101株を培養した。pDEST_35S_RUBY_HSP(Ab28) コンストラクトを用いることで、アグロインフィルトレーションがされた植物体の領域が赤色に着色する。
 培養した菌液を3000rpm、20min遠心して集菌し、インフィルトレーションバッファー(組成:10mM MgCl2、10mM MES、100μMアセトシリンゴン、pH5.7)5ml程度に懸濁し、OD600=1程度に調整した。目的ゲノム編集ベクターを含有するアグロバクテリア溶液2ml、Ab28含有アグロバクテリア溶液0.5ml、インフィルトレーションバッファー2mlを混合し、アグロインフィルトレーション溶液とした。
 27℃、長日条件で生育させた播種後3週間目のタバコ植物体を用意し、1mlシリンジで、アグロインフィルトレーション溶液を吸い取り、葉の裏側に打ち込み、3日間ほど27℃、長日条件でインキュベートし、目的のプラスミドを発現させた(結果の一部を図4に示す)。
(3)ゲノムDNAのAmplicon-seq解析
 赤色色素が発現した領域から1cm角程度の切片を切り出して2ml容チューブに回収し、ゲノム抽出バッファー(200mM Tris-HCl、pH7.5、250mM NaCl、25mM EDTA、0.5%SDS)と混合して組織片を破砕したのち、95℃で5分間インキュベートした後、イソプロパノール沈殿によりゲノムDNAを回収した。回収したゲノムDNAは滅菌水で懸濁し、以下の表6に記載の配列のプライマーセットを使用して増幅した約300bpのDNA断片を、iSeq100システム(Illmina社)によりAmplicon-seqを行い、ゲノム編集を検出した。
 CRISPResso2ソフトで分析した結果を図4に示す。それぞれの結果を、各標的毎にまとめたのが以下の表7である。
 各標的遺伝子について、標的長16又は17のいずれでも編集がされており、またミスマッチを含んだ配列でも編集が生じることが示された。

Claims (14)

  1.  細胞の重複遺伝子のゲノム編集方法であって、前記重複遺伝子が、ゲノム編集の対象となる16ヌクレオチド長のターゲット配列のみを有するか、或いはゲノム編集の対象となる16又は17ヌクレオチド長のターゲット配列と、当該ターゲット配列に対して1~2塩基のミスマッチを含むミスマッチ配列とを有し;ここで前記方法が、
     (a)前記ターゲット配列及びミスマッチ配列を標的とするスペーサー配列を含むcrRNA;及び、
     (b)ヒュージファージ由来であり、前記ターゲット配列及び前記ミスマッチ配列を切断可能なCasΦタンパク質;
    を、前記細胞内で発現させる工程を含む、重複遺伝子のゲノム編集方法。
  2.  前記CasΦタンパク質が、CasΦ1、CasΦ2、vCasΦ及びCasΦ3からなる群から選ばれる少なくとも1のタンパク質である、請求項1に記載のゲノム編集方法。
  3.  前記CasΦタンパク質が、配列番号1、2、3及び4からなる群から選ばれるアミノ酸配列に対し、少なくとも80%の配列相同性を有するアミノ酸配列を含む、請求項1に記載のゲノム編集方法。
  4.  前記重複遺伝子が、機能冗長性を有する重複配列である、請求項1に記載のゲノム編集方法。
  5.  前記重複遺伝子が、ターゲット配列の近傍にPAM配列を含む、請求項1に記載のゲノム編集方法。
  6.  前記スペーサー配列が、前記ターゲット配列と完全一致するように決定される、請求項1に記載のゲノム編集方法。
  7.  前記重複遺伝子が、16以上のヌクレオチド長のターゲット配列のみを有するか、或いは16以上のヌクレオチド長のターゲット配列と、当該ターゲット配列に対して1~2塩基のミスマッチを含むミスマッチ配列とを有する、請求項1に記載のゲノム編集方法。
  8.  前記重複遺伝子が、17以上のヌクレオチド長のターゲット配列と、当該ターゲット配列に対して1~2塩基のミスマッチを含むミスマッチ配列とを有する、請求項1に記載のゲノム編集方法。
  9.  前記重複遺伝子が、前記細胞のゲノム中に2~100コピー存在する、請求項1に記載のゲノム編集方法。
  10.  前記細胞のゲノム中に含まれる重複遺伝子のうち、一部又は全ての重複遺伝子を編集する、請求項9に記載のゲノム編集方法。
  11.  前記細胞が、植物細胞である、請求項1に記載のゲノム編集方法。
  12.  前記crRNA及び/又は前記CasΦタンパク質を、発現ベクターにより前記細胞内に導入して発現させる、請求項1に記載のゲノム編集方法。
  13.  前記発現ベクターが、一過性又は恒常性発現ベクターである、請求項12に記載のゲノム編集方法。
  14.  細胞の重複遺伝子のゲノム編集用キットであって、前記重複遺伝子が、ゲノム編集の対象となる16ヌクレオチド長のターゲット配列のみを有するか、或いは16又は17ヌクレオチド長のターゲット配列と、当該ターゲット配列に対して1~2塩基のミスマッチを含むミスマッチ配列とを有し、前記キットが;
     (a)前記ターゲット配列及び前記ミスマッチ配列を標的とするスペーサー配列を導入可能なcrRNAの発現カセット;及び、
     (b)ヒュージファージ由来であり、前記ターゲット配列及び前記ミスマッチ配列を切断可能なCasΦタンパク質の発現カセット;
    を含む、前記キット。
PCT/JP2023/032542 2022-09-06 2023-09-06 重複遺伝子のゲノム編集方法 WO2024053677A1 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2022-141724 2022-09-06
JP2022141724A JP2024037076A (ja) 2022-09-06 2022-09-06 重複遺伝子のゲノム編集方法

Publications (1)

Publication Number Publication Date
WO2024053677A1 true WO2024053677A1 (ja) 2024-03-14

Family

ID=90191286

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2023/032542 WO2024053677A1 (ja) 2022-09-06 2023-09-06 重複遺伝子のゲノム編集方法

Country Status (2)

Country Link
JP (1) JP2024037076A (ja)
WO (1) WO2024053677A1 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021216512A1 (en) * 2020-04-20 2021-10-28 The Regents Of The University Of California Crispr systems in plants
WO2021236651A1 (en) * 2020-05-19 2021-11-25 The Regents Of The University Of California Compositions and methods of a nuclease chain reaction for nucleic acid detection

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021216512A1 (en) * 2020-04-20 2021-10-28 The Regents Of The University Of California Crispr systems in plants
WO2021236651A1 (en) * 2020-05-19 2021-11-25 The Regents Of The University Of California Compositions and methods of a nuclease chain reaction for nucleic acid detection

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
CAI QINAN, GUO DONGMEI, CAO YUJUN, LI YUAN, MA RUI, LIU WENPING: "Application of CRISPR/CasΦ2 System for Genome Editing in Plants", INTERNATIONAL JOURNAL OF MOLECULAR SCIENCES, MOLECULAR DIVERSITY PRESERVATION INTERNATIONAL (MDPI), BASEL, CH, vol. 23, no. 10, 20 May 2022 (2022-05-20), Basel, CH , pages 5755, XP093147813, ISSN: 1422-0067, DOI: 10.3390/ijms23105755 *
ISHIHARA, RYOSUKE ET AL.: "P-1711 Application of multiplex genome editing technology using RNA processing to plants", PROCEEDINGS OF THE 80TH ANNUAL MEETING OF THE BOTANICAL SOCIETY OF JAPAN, SEPTEMBER 16-19, 2016, BOTANICAL SOCIETY OF JAPAN, JP, 1 January 2016 (2016-01-01) - 19 September 2016 (2016-09-19), JP, pages 241, XP009553760 *
PAUSCH PATRICK, AL-SHAYEB BASEM, BISOM-RAPP EZRA, TSUCHIDA CONNOR A., LI ZHENG, CRESS BRADY F., KNOTT GAVIN J., JACOBSEN STEVEN E.: "CRISPR-CasΦ from huge phages is a hypercompact genome editor", SCIENCE, AMERICAN ASSOCIATION FOR THE ADVANCEMENT OF SCIENCE, US, vol. 369, no. 6501, 17 July 2020 (2020-07-17), US , pages 333 - 337, XP055862891, ISSN: 0036-8075, DOI: 10.1126/science.abb1400 *
PAUSCH PATRICK; SOCZEK KATARZYNA M.; HERBST DOMINIK A.; TSUCHIDA CONNOR A.; AL-SHAYEB BASEM; BANFIELD JILLIAN F.; NOGALES EVA; DOU: "DNA interference states of the hypercompact CRISPR–CasΦ effector", NATURE STRUCTURAL & MOLECULAR BIOLOGY, NATURE PUBLISHING GROUP US, NEW YORK, vol. 28, no. 8, 1 August 2021 (2021-08-01), New York , pages 652 - 661, XP037536569, ISSN: 1545-9993, DOI: 10.1038/s41594-021-00632-3 *

Also Published As

Publication number Publication date
JP2024037076A (ja) 2024-03-18

Similar Documents

Publication Publication Date Title
CN107164347B (zh) 控制水稻茎秆粗度、分蘖数、穗粒数、千粒重和产量的理想株型基因npt1及其应用
CN104846010B (zh) 一种删除转基因水稻筛选标记基因的方法
CN108130342A (zh) 基于Cpf1的植物基因组定点编辑方法
CN110891965A (zh) 植物中使用的抗crispr蛋白的方法和组合物
CN110283843B (zh) 一种基于CRISPRCas9介导CsWRKY22定点编辑提高柑橘溃疡病抗性的方法
US20210348179A1 (en) Compositions and methods for regulating gene expression for targeted mutagenesis
JP7011327B2 (ja) 植物ウイルスベクターを利用したゲノム編集植物の生産方法
CN108034671B (zh) 一种质粒载体及利用其建立植物群体的方法
CN115315516B (zh) 一种提高植物遗传转化和基因编辑效率的方法
CN110892074A (zh) 用于增加香蕉的保质期的组成物及方法
CN111902541A (zh) 增加细胞中感兴趣的核酸分子表达水平的方法
JPWO2019103034A1 (ja) ゲノム編集植物の生産方法
WO2024053677A1 (ja) 重複遺伝子のゲノム編集方法
CN112126652A (zh) 水稻OsAUX3基因在调控水稻种子粒长中的应用
KR102551064B1 (ko) 포도에서 분리된 신규 u6 프로모터 및 이의 용도
JP7353602B1 (ja) ゲノム編集方法およびゲノム編集用組成物
CN113462661B (zh) 从玉米中分离的siz1蛋白及其编码基因和在品种改良中的应用
WO2024040874A1 (zh) 突变的Cas12j蛋白及其应用
CN107022566B (zh) 一种表达载体及其在植物基因功能研究中的应用
Tang et al. Genome editing in rice and tomato with a small Un1Cas12f1 nuclease
KR101962902B1 (ko) 칠리잎말림바이러스를 접종할 수 있는 감염성 클론 및 이의 용도
KR101925466B1 (ko) 토마토잎말림방글라데시바이러스 베타 위성 dna를 접종할 수 있는 감염성 클론 및 이의 용도
JP2007529991A (ja) ポリヌクレオチド配列改変体
CN107709551A (zh) 无t‑dna整合的农杆菌介导的基因组修饰
CN117025661A (zh) 大豆花粉致死基因表达盒及其应用

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 23863215

Country of ref document: EP

Kind code of ref document: A1