WO2024080067A1 - ゲノム編集方法およびゲノム編集用組成物 - Google Patents

ゲノム編集方法およびゲノム編集用組成物 Download PDF

Info

Publication number
WO2024080067A1
WO2024080067A1 PCT/JP2023/033481 JP2023033481W WO2024080067A1 WO 2024080067 A1 WO2024080067 A1 WO 2024080067A1 JP 2023033481 W JP2023033481 W JP 2023033481W WO 2024080067 A1 WO2024080067 A1 WO 2024080067A1
Authority
WO
WIPO (PCT)
Prior art keywords
sequence
seq
cas protein
genome
nucleic acid
Prior art date
Application number
PCT/JP2023/033481
Other languages
English (en)
French (fr)
Inventor
輝彦 寺川
翼 矢野
展隆 光田
彰良 中村
茂夫 菅野
誠一郎 伊藤
洋一 牧野
Original Assignee
株式会社インプランタイノベーションズ
国立研究開発法人産業技術総合研究所
Toppanホールディングス株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社インプランタイノベーションズ, 国立研究開発法人産業技術総合研究所, Toppanホールディングス株式会社 filed Critical 株式会社インプランタイノベーションズ
Publication of WO2024080067A1 publication Critical patent/WO2024080067A1/ja

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)

Definitions

  • the present invention relates to the field of genetic engineering, and more specifically to the field of genome editing. More specifically, the present invention relates to a new genome editing method for site-specifically modifying a target DNA sequence in the genome of a eukaryotic cell, and a genome editing means, such as a genome editing composition, used in the method.
  • CRISPR/Cas Clustered Regularly Interspaced Short Palindromic Repeats-CRISPR associated proteins
  • Cas9 RNA-guided nuclease
  • Cas9 is generally used as a complex with a guide RNA.
  • target genes can be mutated in various animals and plants.
  • Cas9 functions as an active endonuclease by forming a complex with two RNAs called CRISPR RNA (crRNA) and transactivating crRNA (tracrRNA), cleaving foreign genetic elements in the invading phage or plasmid.
  • crRNA CRISPR RNA
  • tracrRNA transactivating crRNA
  • the CRISPR/Cas system can be used simply by synthesizing a short sgRNA with a sequence homologous to the target DNA sequence, and the type II CRISPR/Cas system in particular has the advantage that genome editing is possible using a single protein, Cas9.
  • Cas9 recognizes PAM (protospacer adjacent motif) sequences in DNA and cleaves double-stranded DNA upstream of the sequences to produce blunt ends.
  • the length and base sequence of the PAM sequence recognized by Cas9 varies depending on the bacterial species from which Cas9 is derived.
  • Cas9 derived from Streptococcus pyogenes (abbreviated as SpyCas9) recognizes the three bases 5'-NGG-3' as a PAM sequence, and can cleave upstream of a sequence with two guanines in a row (Patent Document 1) (Note that unless otherwise specified, "N" in the base sequences in this specification represents any base.).
  • Streptococcus thermophilus has two types of Cas9, each of which recognizes a 5-6 base sequence, 5'-NGGNG-3' or 5'-NNAGAA-3', as a PAM sequence (Patent Document 2).
  • the present invention has been made in consideration of the above problems, and its purpose is to provide a new genome editing method that can recognize new PAM sequences in the genome of a eukaryotic cell and modify the genome in a site-specific manner.
  • the present invention includes the following.
  • [Item 1] A method for site-specifically modifying a target DNA sequence in the genome of a eukaryotic cell, comprising: In said eukaryotic cell, (1) A Cas protein that recognizes a PAM (protospacer adjacent motif) sequence containing the base sequence 5'-NNACNN-3' (wherein each "N” means any one base independently selected from adenine, cytosine, thymine, and guanine) described in SEQ ID NO: 1, or a nucleic acid encoding the Cas protein; and (2) Modifying the genome of the eukaryotic cell at the target DNA sequence by introducing a guide RNA capable of hybridizing to the target DNA sequence in the genome and forming a complex with the Cas protein and directing sequence-specific binding of the complex to the target DNA sequence, or a nucleic acid encoding the guide RNA.
  • PAM protospacer adjacent motif
  • the Cas protein comprises a nuclear localization signal (NLS).
  • the Cas protein comprises an amino acid sequence having 80% or more, or 85% or more, or 90% or more, or 92% or more, or 95% or more, or 96% or more, or 97% or more, or 98% or more, or 99% or more sequence identity to the amino acid sequence set forth in SEQ ID NO:4.
  • [Item 5] The method according to any one of items 1 to 4, wherein the Cas protein has endonuclease activity.
  • the PAM sequence comprises the base sequence 5'-NNACGN-3' set forth in SEQ ID NO: 2 or the base sequence 5'-NNACAN-3' set forth in SEQ ID NO: 3.
  • the guide RNA is a single-stranded guide RNA (sgRNA) and includes crRNA and tracrRNA.
  • the crRNA comprises a stem loop of 12 to 36 nucleotides in length.
  • the eukaryotic cell is an animal cell, a plant cell, or a microbial cell.
  • the genome editing method of the present invention uses a Cas protein that recognizes a new PAM sequence, including 5'-NNACNN-3', making it possible to perform site-specific modification of a eukaryotic cell genome based on a new target DNA sequence.
  • FIG. 1 is a schematic diagram showing the configuration of a vector for producing the AalCas9 protein in Example 1.
  • FIG. 2 shows the base sequence (SEQ ID NO: 23) and configuration of sgRNA in Examples 2 and 3.
  • FIG. 3 is a graph showing the analysis results of the PAM domain in Example 2.
  • 4 is a set of photographs showing examples of electrophoretic results of reaction products from the in vitro DNA cleavage assay in Example 3. The photograph on the left shows the results when the reaction solution was incubated at 25° C. for 60 minutes, and the photograph on the right shows the results when the reaction solution was incubated at 37° C. for 60 minutes.
  • 5A and 5B are graphs showing the time course of AalCas9 activity by an in vitro DNA cleavage assay in Example 3.
  • FIG. 5A shows the results when the reaction solution was incubated at 25 ° C.
  • the graph in Fig. 5B shows the results when the reaction solution was incubated at 37 ° C.
  • 6A and 6B are diagrams showing the results of genomic DNA editing of Arabidopsis thaliana protoplast cells by AalCas9 in Example 4.
  • Fig. 6A shows the editing rate for each target DNA
  • Fig. 6B shows mutated DNA by a next-generation sequencer.
  • FIG. 7 shows the efficiency of genomic DNA editing of Arabidopsis thaliana plants by AalCas9 in Example 5.
  • FIG. 8 shows the genome editing efficiency of human cultured cells HEK293FT by AalCas9 in Example 6.
  • A means adenine
  • G means guanine
  • C means cytosine
  • T means thymine
  • N means any one base selected from the group consisting of adenine, cytosine, thymine, and guanine.
  • Genome editing method relates to a genome editing method for site-specifically modifying a target DNA sequence in the genome of a eukaryotic cell (hereinafter, appropriately abbreviated as the "genome editing method of the present invention” or the “method of the present invention”).
  • a Cas protein that recognizes a specific PAM sequence, or a nucleic acid encoding the Cas protein; and
  • the main feature is that it includes modifying the genome of the eukaryotic cell at the target DNA sequence by introducing a guide RNA or a nucleic acid encoding the guide RNA.
  • the cell may be either a prokaryotic cell or a eukaryotic cell, and is not particularly limited, but preferably a eukaryotic cell is used.
  • prokaryotic cells include bacteria and archaea.
  • eukaryotic cells include microbial cells, plant cells, and animal cells.
  • microbial cells include cells derived from various microorganisms such as yeast, fungi, and protozoa.
  • plant cells include cells derived from various plants such as seed plants, ferns, mosses, and algae.
  • animal cells include cells derived from various animals such as vertebrates (mammals, birds, reptiles, amphibians, fish, etc.), arthropods (insects, etc.), and mollusks.
  • mammalian cells include CHO cells, HeLa cells, HEK293 cells, and COS-1 cells.
  • the form of the cell is not particularly limited, and may be any of in vivo cells, cultured cells (in vitro), primary cultured cells (in vitro and ex vivo), transplanted cells, etc. Such various cells are commonly used in the technical field.
  • Genome editing refers to a technique for editing genomes by introducing desired modifications into target sites on the genome in various cells using site-specific DNA modification proteins or the like.
  • modification include, but are not limited to, cleaving a specific gene on the genome to destroy the gene, inserting or substituting a DNA fragment at a target site on the genome, and introducing point mutations with high efficiency to modify gene function.
  • target site refers to a specific site in the genome of a eukaryotic cell that is the subject of genome editing.
  • cleavage refers to cleavage of the covalent backbone of a nucleotide molecule.
  • the target site for genome editing can be appropriately selected depending on the type of site-specific DNA modifying protein described below.
  • a type of Cas protein as the site-specific DNA modifying protein, it is preferable that the target site for genome editing is a site on the genomic DNA consisting of a DNA strand (target strand) consisting of a PAM sequence and a sequence of a predetermined base length (e.g., about 20 bases) adjacent to the 5' side thereof and its complementary DNA strand (non-target strand).
  • the target site on the genome that is the subject of genome editing is not particularly limited, but examples include a part or all of a gene on the genome of a eukaryotic cell that is desired to be modified or destroyed, or a region that overlaps with or is adjacent to that gene.
  • genes that can be subject to genome editing include genes related to primary metabolism (amino acids, etc.), genes related to secondary metabolism (flavonoids, polyphenols, etc.), genes related to sugar metabolism, genes related to lipid metabolism, genes related to the production of useful substances (medicines, enzymes, pigments, aromatic components, etc.), genes related to yield (number, size, etc.), genes related to flowering, genes related to disease and pest resistance, and genes related to resistance to environmental stress (low temperature, high temperature, drought, salt, light damage, ultraviolet light), etc.
  • Cas protein refers to a protein belonging to the Cas protein family that constitutes the adaptive immune system that provides acquired resistance to invading foreign nucleic acids in bacteria and archaea, and is a target-specific endonuclease that recognizes a PAM sequence and cleaves double-stranded DNA upstream or downstream of it.
  • the Cas protein is an RNA-guided nuclease (RGN) that constitutes the CRISPR/Cas system together with a guide RNA (gRNA).
  • RGN RNA-guided nuclease
  • gRNA guide RNA
  • the guide RNA By introducing or constructing the CRISPR/Cas system into a target cell, the guide RNA binds to a target site in the genome, and the DNA at the target site can be cleaved by the Cas protein that has been called to the binding site.
  • the Cas protein used in the present invention is characterized by recognizing a specific PAM (protospacer adjacent motif) sequence that includes 5'-NNACNN-3' (SEQ ID NO: 1). Of these, it is preferable to recognize a specific PAM sequence that includes 5'-NNACGN-3' (SEQ ID NO: 2) or 5'-NNACAN-3' (SEQ ID NO: 3).
  • PAM protospacer adjacent motif
  • the Cas protein used in the present invention is not limited to a particular type, and any type of Cas protein can be used as long as it can recognize the specific PAM sequence described above, with Cas9 being preferred.
  • the Cas protein used in the present invention may be a natural protein or a recombinant protein.
  • the origin (derived) of the Cas protein used in the present invention is not limited, but a Cas protein derived from bacteria of the genus Abyssicoccus is preferred, and AalCas9, which is Cas9 derived from Abyssicoccus albus, is particularly preferred.
  • AalCas9 which is Cas9 derived from Abyssicoccus albus.
  • the amino acid sequence of wild-type AalCas9 is shown in SEQ ID NO:4.
  • AalCas9 When used in the present invention, it may be a wild-type AalCas9 having the amino acid sequence set forth in SEQ ID NO: 4, but it may also be a mutant AalCas9 having one or more mutations in the amino acid sequence set forth in SEQ ID NO: 4, so long as its activity (e.g., the endonuclease activity described below) is not impaired.
  • such a mutant AalCas9 is preferably a protein having an amino acid sequence in which one or more amino acids have been substituted, deleted, added, or inserted relative to the amino acid sequence of the wild-type AalCas9 set forth in SEQ ID NO: 4, and having activity equivalent to or greater than that of the AalCas9 protein (e.g., the endonuclease activity described below).
  • mutant AalCas9 proteins preferably have an amino acid sequence that has, for example, 80% or more, or 85% or more, or 90% or more, or 92% or more, or 95% or more, or 96% or more, or 97% or more, or 98% or more, or 99% or more sequence homology (preferably sequence identity) with the amino acid sequence of its parent wild-type AalCas9 described in SEQ ID NO: 4.
  • the "similarity" of two amino acid sequences is the ratio at which identical or similar (i.e., with similar physicochemical properties) amino acid residues appear in corresponding positions when the two amino acid sequences are aligned
  • the “identity” of two amino acid sequences is the ratio at which identical amino acid residues appear in corresponding positions when the two amino acid sequences are aligned.
  • the "homology” and “identity” of two amino acid sequences can be determined, for example, using the BLAST (Basic Local Alignment Search Tool) program (Altschul et al., J. Mol. Biol., (1990), 215(3):403-10).
  • the nucleic acid encoding the Cas protein used in the present invention is not limited as long as it has a base sequence corresponding to the amino acid sequence of the above-mentioned Cas protein and is capable of expressing the above-mentioned Cas protein in a eukaryotic cell.
  • Such a nucleic acid can be appropriately prepared based on the amino acid sequence information of the desired Cas protein.
  • the nucleic acid may also be prepared by chemical synthesis, etc.
  • the nucleic acid encoding the Cas protein used in the present invention includes a nucleic acid encoding the wild-type AalCas9 of SEQ ID NO: 4, and a nucleic acid containing a base sequence encoding a protein containing an amino acid sequence having, for example, 80% or more, 85% or more, 90% or more, 95% or more, 96% or more, 97% or more, 98% or more, or 99% or more sequence identity to the amino acid sequence of the wild-type AalCas9 of SEQ ID NO: 4.
  • the base sequence of the wild-type AalCas9 gene encoding the wild-type AalCas9 of SEQ ID NO: 4 in Abyssicoccus albus is shown in SEQ ID NO: 5.
  • the nucleic acid encoding the Cas protein used in the present invention may be one in which the codons are optimized to suit the translation system of the eukaryotic cell into which the nucleic acid is introduced.
  • the wild-type AalCas9 gene base sequence codon-optimized for Escherichia coli is shown in SEQ ID NO: 6
  • the base sequence codon-optimized for humans is shown in SEQ ID NO: 7
  • the base sequence codon-optimized for Arabidopsis thaliana is shown in SEQ ID NO: 8.
  • the nucleic acid encoding the Cas protein used in the present invention may also include a nucleic acid containing a base sequence that has, for example, 80% or more, 85% or more, 90% or more, 95% or more, 96% or more, 97% or more, 98% or more, or 99% or more sequence identity to the various base sequences described above, for example, the base sequences set forth in SEQ ID NO:5, SEQ ID NO:6, SEQ ID NO:7, or SEQ ID NO:8.
  • the nucleic acid encoding the Cas protein used in the present invention may contain a nuclear localization signal (NLS) sequence for transporting the protein or nucleic acid into the nucleus by nuclear transport in eukaryotic cells.
  • the NLS may be added to only one of the 5'-end or 3'-end of the nucleic acid encoding the Cas protein, or may be added to both the 5'-end and 3'-end.
  • the nucleic acid encoding the Cas protein used in the present invention may be incorporated into a vector in the form of an expression cassette operably linked to a regulatory sequence such as a promoter or terminator.
  • Endonuclease activity The Cas protein used in the present invention preferably has endonuclease activity.
  • "endonuclease” means an enzyme that cuts the middle of a nucleotide chain.
  • the Cas9 protein with endonuclease activity used in the present invention is preferably induced by guide RNA and has the enzyme activity of cutting the middle of a target DNA chain.
  • the Cas protein used in the present invention has activity of cleaving or modifying target DNA at temperatures, for example but not limited to, in the range of 10°C to 80°C, preferably in the range of 20°C to 50°C, and more preferably in the range of 25°C to 40°C.
  • PAM sequence The Cas protein used in the present invention recognizes a specific PAM sequence.
  • a "PAM sequence” protospacer adjacent motif sequence
  • the length and base sequence of the PAM sequence recognizable by the Cas protein vary depending on the type of Cas protein.
  • the Cas protein used in the present invention recognizes a specific PAM sequence that includes 5'-NNACNN-3' (SEQ ID NO: 1).
  • the Cas protein recognize a specific PAM sequence that includes 5'-NNACGN-3' (SEQ ID NO: 2) or 5'-NNACAN-3' (SEQ ID NO: 3).
  • Guide RNA is an RNA that has the function of guiding a site-specific DNA modification protein such as a Cas protein to a target site of a target nucleic acid on a genome.
  • the site-specific DNA modification protein usually binds to such a guide RNA to form a ribonucleoprotein or ribonucleoprotein (RNP).
  • RNP ribonucleoprotein
  • the guide RNA targets the target site on the genome, and the site-specific DNA modification protein such as a Cas protein cleaves the DNA of the target site on the genome, thereby changing or modifying the DNA sequence of the target site on the genome.
  • the structure of the guide RNA is usually selected depending on the type of site-specific DNA-modifying protein.
  • the guide RNA when a Cas protein is used as the site-specific DNA-modifying protein, the guide RNA usually contains a crRNA (CRISPR RNA) sequence involved in the activity of the CRISPR/Cas system and a tracrRNA (trans-activating crRNA) sequence that binds to a target site on the genome.
  • CRISPR RNA crRNA
  • tracrRNA trans-activating crRNA
  • the guide RNA may be a single-stranded RNA (sgRNA) containing a crRNA sequence and a tracrRNA sequence, or an RNA complex formed by complementary binding of an RNA containing a crRNA sequence and an RNA containing a tracrRNA sequence.
  • the crRNA sequence includes a repeat sequence and a spacer sequence.
  • the spacer sequence is a sequence that can form a double strand with a complementary strand or a substantially complementary strand (a sequence that does not completely match the target sequence but can bind to the target sequence) of the target DNA sequence. By including such a spacer sequence, the crRNA sequence can perform target recognition by the CRISPR/Cas system.
  • the length of the spacer sequence is not limited, but is preferably, for example, 15 to 30 nucleotides, 18 to 25 nucleotides, 19 to 23 nucleotides, or 20 to 22 nucleotides, particularly 20 nucleotides, 21 nucleotides, or 22 nucleotides.
  • the length of the crRNA sequence is not limited, but can be, for example, a sequence that includes a stem loop of about 12 to 36 bases.
  • the tracrRNA sequence contains a highly repeated region followed by one or more (preferably two or more) hairpin structures, and is capable of forming multiple stem loops.
  • the length of the tracrRNA sequence is not limited, but can be, for example, a sequence of about 50 to 100 bases long.
  • the configuration of the guide RNA used in the present invention is not particularly limited as long as it can hybridize to the target DNA sequence in the genome, form a complex with the Cas protein, and direct the sequence-specific binding of the complex to the target DNA sequence. It may be appropriately designed depending on the Cas protein used in the present invention and the PAM sequence it recognizes, as well as the target DNA sequence in the genome of the eukaryotic cell to be modified. There has been a lot of knowledge about the design of such guide RNA (for example, International Publication Nos. 2013/142578, 2013/176772, and 2014/093595, etc.), and a person skilled in the art can carry out the present invention by making any modifications while appropriately taking into consideration these knowledge.
  • the composition is not particularly limited.
  • Appropriate DNA may be designed depending on the sequence and composition of the guide RNA used in the present invention, as well as the type of eukaryotic cell to be modified.
  • the DNA encoding the crRNA sequence and the DNA encoding the tracrRNA sequence may be prepared as independent molecules, or an integrated DNA molecule encoding both the crRNA sequence and the tracrRNA sequence may be used.
  • the nucleic acid, such as DNA, encoding the guide RNA may be an independent molecule from the nucleic acid encoding the Cas protein, or may be an integral molecule with the nucleic acid encoding the Cas protein.
  • the nucleic acid encoding the guide RNA may be incorporated into a vector alone or together with the nucleic acid encoding the Cas protein in the form of an expression cassette operably linked to a regulatory sequence such as a promoter or terminator.
  • Target DNA sequence In general, the target DNA sequence that is the subject of site-specific modification in the CRISPR/Cas system is not limited, and may be any of double-stranded DNA sequence, single-stranded RNA sequence, or single-stranded DNA sequence.However, in the present invention, the double-stranded DNA sequence in the genome of eukaryotic cell is the target sequence.
  • the DNA sequence located near the PAM sequence recognized by Cas protein is usually selected as the target DNA sequence.
  • the method of the present invention is carried out by introducing the Cas protein or a nucleic acid encoding the same and the guide RNA or a nucleic acid encoding the same into a eukaryotic cell containing a target DNA sequence to be site-specifically modified in its genome, whereby the guide RNA binds to a target DNA site in the eukaryotic cell genome, and the Cas protein called to the binding site cleaves the genome of the eukaryotic cell at the target DNA site, thereby enabling site-specific modification of the genome.
  • the method for introducing the Cas protein or the nucleic acid encoding it, and the guide RNA or the nucleic acid encoding it into eukaryotic cells is not particularly limited. Examples include, but are not limited to, various methods known in the art, such as electroporation, liposomes, viral vectors, nanoparticles, whisker crystals, methods using PTD (protein translocation domain) fusion proteins, particle gun methods, and Agrobacterium methods.
  • the cell When the Cas protein or the nucleic acid encoding it and the guide RNA or the nucleic acid encoding it are introduced into a cell, the cell may be cultured under conditions suitable for cell growth.
  • the culture conditions may be suitable for the species of organism from which the cell is derived, and may be determined, for example, by a person skilled in the art based on known cell culture techniques.
  • a genome editing composition and a genome editing kit for use in the genome editing method of the present invention are provided.
  • the genome editing composition is a composition that contains at least the Cas protein or a nucleic acid encoding it, and optionally further contains the guide RNA or a nucleic acid encoding it.
  • the genome editing kit is a kit that includes a container that contains at least the Cas protein or a nucleic acid encoding it, and an instruction manual that describes how to use it, and optionally further contains the guide RNA or a nucleic acid encoding it. Details of such Cas protein or the nucleic acid encoding it, and guide RNA or the nucleic acid encoding it are as described above.
  • N refers to any one base selected from the group consisting of adenine, cytosine, thymine, and guanine.
  • linear DNA was amplified by PCR using the following primer 1 (sequence number 9) and primer 2 (sequence number 10) and the pET26b vector as a template.
  • Primer 1 (SEQ ID NO: 9): 5'-TCCTCCAGAGACTTTCCGCTTCTTCTTCTTTGGGGCTTTATGATTCATATGTATATCTCCTTCTTTAAAG-3'
  • Primer 2 (SEQ ID NO: 10): 5'-TCTGGCGGCTCAAAAGAACCGCCGGCAGCGCGAATTCGAGCCCAAGAAGAAGGGAAAGTCCTCGAGCACCACCAC-3'
  • a DNA fragment was prepared by attaching the following oligonucleotide A (N-terminal nuclear localization signal sequence, SEQ ID NO: 11) and oligonucleotide B (C-terminal nuclear localization signal sequence, SEQ ID NO: 12) to the 5' and 3' ends of the AalCas9 gene (SEQ ID NO: 6) that had been codon-optimized for E. coli.
  • Oligonucleotide A N-terminal nuclear localization signal sequence, SEQ ID NO: 11
  • Oligonucleotide B C-terminal nuclear localization signal sequence, SEQ ID NO: 12
  • the DNA fragment containing the E. coli codon-optimized AalCas9 gene obtained above was mixed with the PCR amplified product of the pET vector obtained earlier, and the DNA fragment was made into a circular plasmid using NEBuilder HiFi DNA Assembly Master Mix.
  • the obtained circular plasmid was used to transform E. coli DH5a, and transformants were selected by culturing on an LB agar plate containing 50 ⁇ g/mL kanamycin. Several colonies were picked, and the desired circular plasmid (pET-AalCas9) was prepared from among them as a vector for AalCas9 production.
  • AalCas9 The obtained plasmid vector pET-AalCas9 was introduced into E. coli ROSETTA2 (DE3) pLYSS strain by a conventional method.
  • the obtained recombinant strain was cultured in LB medium containing 50 ⁇ g / mL kanamycin, and when it was cultured until the OD value reached 0.8, isopropyl ⁇ -D-1-thiogalactopyranoside (IPTG) (final concentration 0.25 mM) was added as an expression inducer, and the strain was cultured at 20 ° C. for 20 hours. After the culture, the E. coli was collected by centrifugation (8,000 g, 10 minutes).
  • the collected cells were suspended in buffer A (50 mM Tris-HCl, pH 8.0, 500 mM NaCl, 5 mM MgCl 2 ) and ultrasonically disrupted.
  • the supernatant was collected by centrifugation (12,000 g, 30 min), and purified using a Ni-affinity column equilibrated with buffer A, then a Heparin affinity column, and then a gel filtration column equilibrated with buffer B (20 mM Tris-HCl, pH 7.5, 300 mM NaCl, 1 mM MgCl 2 , 10% glycerol).
  • the purified protein was concentrated using a centrifugal ultrafiltration filter unit (Merck Millipore) to obtain AalCas9.
  • the AalCas9 thus obtained was stored at -80°C.
  • plasmid library In order to identify the PAM sequence of the AalCas9 gene, a plasmid library was prepared by the following procedure.
  • a fragment obtained by cleaving commercially available pUC18 with the restriction enzymes BamH1 and EcoR1 was mixed with a double-stranded DNA fragment containing a portion of the known rice-derived PDS (phytoene desaturase) gene sequence (5'-GTTGGTCTTTGCTCCTGCAG-3') and annealed with the following oligonucleotide C (SEQ ID NO: 13) and oligonucleotide D (SEQ ID NO: 14), both of which have phosphorylated 5' ends, and ligated using Ligation mix (manufactured by TAKARA).
  • PDS phytoene desaturase
  • Oligonucleotide C (SEQ ID NO: 13): 5'-pGATCGTTGGTCTTTGCTCCTGCAGAGG-3' Oligonucleotide D (SEQ ID NO: 14): 5'-pAATTCCTCTGCAGGAGCAAAGACCAAC-3'
  • the resulting ligation solution was used to transform E. coli DH5 ⁇ using standard methods, and after selection on an LB agar plate containing 100 ⁇ g/mL ampicillin, the plasmid was purified from the clones carrying the desired recombinant plasmid (pUC18-OsPDS).
  • the first PCR reaction was carried out using the purified pUC18-OsPDS as a template and the following primer 3 (sequence number 15) and primer 4 (sequence number 16), and a first PCR amplification product containing an amplified DNA fragment was obtained.
  • Primer 3 (SEQ ID NO: 15) 5'-ACATCTGACGCTGCCGACGACAAGCTTGGCACTGGCCGTCG-3'
  • Primer 4 (SEQ ID NO: 16) 5'-CCGGAGCATAAAGTGTAAAGC-3'
  • a second PCR reaction was carried out using the following primer 5 (sequence number 17) and primer 6 (sequence number 18), which contain the adapter sequence used in NGS analysis, with the purified pUC18-OsPDS as a template, to obtain a second PCR amplification product containing the amplified DNA fragment.
  • Primer 5 (SEQ ID NO: 17) 5'-CTTGTCGTCGGCAGCGTCAGATGTGTATAAGAGACAGCATGCCTGCAGGTCGACTCGAGAGG-3'
  • Primer 6 (SEQ ID NO: 18) 5'-ACACTTTATGCTTCCGGGTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGCTCGTATGTTGTGTGGAATTG-3'
  • the first and second PCR amplification products were mixed, and the DNA fragments were made into a circular plasmid using NEBuilder HiFi DNA Assembly Master Mix.
  • E. coli DH5 ⁇ was transformed with the circularized plasmid, and the plasmid was selected on an LB agar plate containing 100 ⁇ g/mL ampicillin, after which the plasmid was purified from the clones carrying the desired recombinant plasmid (pUC18-NGS-OsPDS).
  • oligonucleotide F contains a random sequence consisting of seven N bases.
  • Oligonucleotide E (SEQ ID NO: 19): 5'-GGTCTTTGCTCCTGCAGG-3' Oligonucleotide F (SEQ ID NO: 20): 5'-AGCTATGACCATGATTACGAATTCNNNNNCTGCAGGAGCAAAGACC-3'
  • a PCR reaction was carried out using the purified pUC18-NGS-OsPDS as a template and the following primers 7 (sequence number 21) and 8 (sequence number 22), to obtain a PCR amplification product containing the amplified DNA fragment.
  • Primer 7 (SEQ ID NO:21): 5'-CTGCAGGAGCAAAGACC-3'
  • Primer 8 (SEQ ID NO: 22): 5'-GTAATCATGGTCATAGCTGTTTCC-3'
  • the PCR amplification product containing the obtained DNA fragment was mixed with the prepared double-stranded DNA fragment containing the random sequence, and the DNA fragment was converted into a circular plasmid using NEBuilder HiFi DNA Assembly Master Mix.
  • Escherichia coli DH5 ⁇ was transformed with the obtained circularized plasmid and selected on an LB agar plate containing 100 ⁇ g/mL ampicillin. Approximately 100,000 colonies containing the desired recombinant plasmid were then cultured together and the plasmid library pUC18-NGS-OsPDS-7N series was created using NucleoBond EXtra Midi Plus (Nihon Genetics).
  • AalCas9 sgRNA (SEQ ID NO: 23) for cleaving the plasmid library pUC18-NGS-OsPDS-7N was prepared by in vitro transcription using Guide-it TM sgRNA In Vitro Transcription Kit (manufactured by Takara Bio Inc.).
  • the structure of AalCas9 sgRNA is shown in FIG. 2, and the base sequence is shown in SEQ ID NO: 23.
  • the polyN at the 5' end is omitted.
  • This AalCas9 sgRNA was diluted with RNase-free Cas9 buffer (20 mM HEPES-Na, pH 7.5, 100 mM NaCl, 5 mM MgCl 2 , 0.1 mM EDTA) to 2.5 ⁇ M AalCas9 and 12.5 ⁇ M sgRNA, and left at 25° C. for 20 minutes to form a complex, preparing a first RNP solution.
  • AalCas9 sgRNA (SEQ ID NO: 23) 5'-GUUUUAGUACUCUGCGAAAUUUUAGUGAAACUAGAUUUCGCAGAAUCUAUUAAAACAAGGCUUUAUGCCGUAUUUAAACUCCAUCCUAUGGGUGGGGGUAUUUUU-3'
  • a PCR reaction was carried out using the purified uncleaved plasmid as a template and the following primers 9 (sequence number 24) and 10 (sequence number 25), and a PCR amplification product containing a double-stranded DNA fragment of approximately 370 bp containing a random sequence was obtained.
  • the PCR amplification product containing the double-stranded DNA fragment was diluted with Cas9 buffer to a concentration of 200 nM, and the first RNP solution described above in (2) was added and the enzyme reaction was carried out at 37°C for 30 minutes.
  • the reaction solution was subjected to agarose electrophoresis in the same manner as above, and the uncleaved double-stranded DNA fragment was purified.
  • the purified double-stranded DNA fragment was used as a sample for DNA sequence analysis by next-generation sequencer (NGS).
  • NGS next-generation sequencer
  • the purified double-stranded DNA fragments and the RNP-untreated plasmid library were subjected to NGS analysis using Hiseq (Illmina) to detect sequences contained in the random region.
  • the sequences contained in the random region of the purified double-stranded DNA fragments were compared with the sequences contained in the RNP-untreated plasmid library, and the PAM sequence of AalCas9 was identified as NNACGN by extracting a sequence common to the sequences whose detection frequency in the purified double-stranded DNA fragments was reduced to 1/10 (Figure 3).
  • Primer 11 (SEQ ID NO: 26) 5'-CGGATAACAATTTCACACAGGAAACAGCTATGACCATGATTACGAATTCTGCGTTACTGCAGGAGC-3'
  • Primer 12 (SEQ ID NO: 27) 5'-GCGATCGGTGCGGGCCTCTTCGCTATTACGC-3'
  • Primer 13 (SEQ ID NO: 28) 5'-CGGATAACAATTTCACACAGGAAACAGCTATGACCATGATTACGAATTCTTTCCCACTGCAGGAGC-3'
  • Primer 12 (SEQ ID NO: 27) 5'-GCGATCGGTGCGGGCCTCTTCGCTATTACGC-3'
  • AalCas9 sgRNA (SEQ ID NO: 23) for in vitro DNA cleavage activity was prepared by in vitro transcription using Guide-it TM sgRNA In Vitro Transcription Kit (Takara Bio Inc.). This AalCas9 sgRNA was used to dilute RNase-free Cas9 buffer (20 mM HEPES-Na, pH 7.5, 100 mM NaCl, 5 mM MgCl 2 , 0.1 mM EDTA) to 2 ⁇ M AalCas9 and 2 ⁇ M sgRNA, and left at 25 ° C. for 20 minutes to form a complex, and a second RNP solution was prepared.
  • RNase-free Cas9 buffer (20 mM HEPES-Na, pH 7.5, 100 mM NaCl, 5 mM MgCl 2 , 0.1 mM EDTA
  • Figure 4 is a photograph showing an example of the electrophoresis results of the reaction products in an in vitro DNA cleavage assay.
  • the photograph on the left shows the results when the reaction solution was incubated at 25°C for 60 minutes, and the photograph on the right shows the results when the reaction solution was incubated at 37°C for 60 minutes.
  • Figures 5A and B are graphs showing the time course of AalCas9 activity in an in vitro DNA cleavage assay.
  • the graph in Figure 5A shows the results when the reaction solution was incubated at 25°C
  • the graph in Figure 5B shows the results when the reaction solution was incubated at 37°C.
  • sgRNA for genome editing experiments in Arabidopsis protoplasts: The following known sgRNA (SEQ ID NO: 29) containing the PAM sequence ACGN on the Arabidopsis thaliana PDS3 gene was prepared by in vitro transcription using Guide-it TM sgRNA In Vitro Transcription Kit (Takara Bio). Using this sgRNA, 10 ⁇ M AalCas9, 20 ⁇ M sgRNA was diluted with RNase-free Cas9 buffer (20 mM HEPES-Na, pH 7.5, 100 mM NaCl, 5 mM MgCl 2 , 0.1 mM EDTA) to form a complex at 25 ° C. for 20 minutes to prepare a third RNP solution. In addition, in SEQ ID NO: 29, the poly N on the 5'-end side is omitted.
  • PDS3 sgRNA (SEQ ID NO: 29) 5'-GUAGCGAGUAAUCGUGAAGUAGAGAAACAGGGUUUUAGUACUCUGCGAAAUUUAGUGAAACUAGAUUUCGCAGAACUAUUUCAUUAAAACAAGGCUUUAUGCCGUAUUUAAAACUCCAUCCUAUGGGUGGGGGUAUUUUU-3'
  • SpyCas9 sgRNA (SEQ ID NO: 30) having the following known sequence was also prepared, and an RNP complex was formed in the same manner as AalCas9 to prepare a fourth RNP solution. Note that in SEQ ID NO: 30, the polyN on the 5' end is omitted.
  • SpyCas9 sgRNA (SEQ ID NO: 30) 5'-GGACUUUUGCCAGCCAUGGUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAAGUGGCACCGAGUCGGUGCUUUUU-3'
  • the protoplasts were filtered through a nylon filter with a pore size of 70 ⁇ m, collected in a 50 mL tube, and centrifuged at 100 ⁇ g for 10 minutes to recover the protoplasts. The supernatant was discarded, and the protoplasts were resuspended in 150 mM NaCl, 125 mM CaCl 2 , 5 mM KCl, and 2 mM MES (pH 5.7) buffer (W5 buffer). The resuspended protoplasts were centrifuged at 100 ⁇ g for 5 minutes, and then resuspended in the same buffer. After washing with this buffer twice, the protoplasts were incubated at 4° C. for 10 minutes.
  • the protoplasts were centrifuged at 100 ⁇ g for 5 minutes, and then resuspended in 400 mM mannitol, 15 mM MgCl 2 , and 4 mM MES (pH 5.7) buffer. Thereafter, the protoplasts were collected by centrifugation at 100 ⁇ g for 5 minutes, and the cell concentration was adjusted to 2.0-3.0 ⁇ 10 5 cells/mL with the same buffer to obtain a protoplast suspension for transformation.
  • the collected genomic DNA was suspended in sterile water, and a PCR reaction was carried out using a primer set consisting of the following primer 14 (SEQ ID NO: 31) and primer 15 (SEQ ID NO: 32) for AalCas9, and a primer set consisting of the following primer 16 (SEQ ID NO: 33) and primer 17 (SEQ ID NO: 34) for SpyCas9, to amplify a DNA fragment of about 300 bp.
  • the resulting DNA fragment of approximately 300 bp was subjected to next-generation sequencing analysis using the iSeq100 system (Illmina) to detect the presence or absence of genome editing.
  • Primer 16 (SEQ ID NO: 33) 5'-TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGGCAAAATAATTAAAGTTGTTGCTGTTGG-3'
  • Primer 17 (SEQ ID NO: 34) 5'-GTCTCGTGGGGCTCGGAGATGTGTATAAGAGACAGTAGCCTAACTTGCCTGCTTTTC-3'
  • Figures 6A and 6B show the results of genomic DNA editing of Arabidopsis thaliana protoplast cells using AalCas9.
  • Figure 6A shows the editing rate for each target DNA
  • Figure 6B shows mutated DNA analyzed by a next-generation sequencer.
  • sequence (SEQ ID NO: 37) in which the Arabidopsis U6 promoter sequence was added to the sgRNA of AalCas9 for Arabidopsis mutation introduction designed to easily introduce the target sequence was incorporated into pCA-NLS-AalCas9-NLS by a known method, to prepare pCA-NLS-AalCas9-NLS-U6-Bsa1-gRNA.
  • This pCA-NLS-AalCas9-NLS-U6-Bsa1-gRNA was cleaved with Bsa1, and the following oligonucleotide G (SEQ ID NO: 38) and oligonucleotide H (SEQ ID NO: 39) containing a part of the Arabidopsis-derived PDS3 gene sequence and its complementary sequence phosphorylated at the 5' end were mixed and ligated with a double-stranded DNA fragment annealed thereto.
  • the resulting ligation solution was transformed into Escherichia coli DH5 ⁇ , and the clones were selected on an LB agar plate containing 50 ⁇ g/mL spectinomycin, after which the plasmid was purified from the clones carrying the desired recombinant plasmid (pCA-NLS-AalCas9-NLS-U6-PDS3-gRNA).
  • the obtained bacteria were cultured for 2 days in LB medium containing 20 mL of antibiotics (50 ⁇ g/mL spectinomycin, 25 ⁇ g/mL gentamicin, and 50 ⁇ g/mL rifampicillin), and the bacteria were collected and suspended in 30 mL of infiltration medium.
  • antibiotics 50 ⁇ g/mL spectinomycin, 25 ⁇ g/mL gentamicin, and 50 ⁇ g/mL rifampicillin
  • Arabidopsis wild-type strain Col-0 was grown for 45-60 days until it flowered, and then grown for another 10 days after cutting the main stem before being used for transformation.
  • Arabidopsis was infected by dropping an infiltration medium containing a suspension of cells into which the transformation vector had been introduced, and grown as normal to harvest T1 seeds. The T1 seeds were then sterilized with 50% bleach and 0.02% Triton X-100 solution for 7 minutes, rinsed three times with sterile water, and sown on MS selection medium containing 25 ⁇ g/mL hygromycin.
  • the collected genomic DNA was suspended in sterile water, and a DNA fragment of about 300 bp amplified using a primer set consisting of the following primer 14 (SEQ ID NO: 31) and primer 15 (SEQ ID NO: 32) was subjected to NGS analysis using the iSeq100 system (Illmina Co., Ltd.) to detect genome editing.
  • Primer 14 (SEQ ID NO: 31) 5'-TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGGGAAAAGAATCATATGGTCATCAATTCG-3'
  • Primer 15 (SEQ ID NO: 32) 5'-GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGCGGACTTGAATTAAAGGGGCTATAGTAG-3'
  • Figure 7 shows the editing efficiency (maximum value 1) of each base in the PDS3 gene detected in each T1 individual number as a result of genomic DNA analysis of leaves of Arabidopsis thaliana T1 individuals transformed with pCA-NLS-AalCas9-NLS-U6-PDS3-gRNA using the above procedure.
  • a sequence (SEQ ID NO: 40) in which a human-derived U6 promoter sequence was added to the AalCas9 sgRNA designed to facilitate the introduction of the target sequence was inserted into pCMV-NLS-AalCas9-NLS using a known method to produce pCMV-NLS-AalCas9-NLS-U6-Bbs1-gRNA.
  • the resulting pCMV-NLS-AalCas9-NLS-U6-Bbs1-gRNA was cleaved with Bbs1, and a double-stranded DNA fragment annealed with the following oligonucleotide I (SEQ ID NO: 41) and oligonucleotide J (SEQ ID NO: 42), which contain a portion of the human-derived AAVS1 gene sequence and have phosphorylated 5' ends, was mixed and ligated to the resulting fragment.
  • Oligonucleotide I (SEQ ID NO:41): 5'-pCACCCTGCAGCACCAGGATCAGTG-3'
  • Oligonucleotide J (SEQ ID NO: 42): 5'-pAAACACTGATCCTGGTGCTGCAG-3'
  • the resulting ligation solution was transformed into Escherichia coli DH5 ⁇ , and the clones were selected on an LB agar plate containing 100 ⁇ g/mL ampicillin, after which the plasmid was purified from the clones carrying the desired recombinant plasmid (pCMV-NLS-AalCas9-NLS-U6-hAAVS1-gRNA).
  • AalCas9 expression vector into human cultured cells
  • the pCMV-NLS-AalCas9-NLS-U6-hAAVS1-gRNA prepared in (1) above was mixed with Lipofectamine 3000 (Thermo Fisher Scientific), transfected into HEK293FT cells (about 10 4 cells) cultured in a 96-well plate, and cultured for 3 days.
  • the transfected HEK293FT cells were collected and disrupted by mixing with 0.1 N NaOH.
  • NGS analysis of genomic DNA The HEK293FT cells cultured as described above were collected and disrupted by mixing with 0.1 N NaOH. A portion of the disrupted solution and a primer set consisting of primer 18 (SEQ ID NO: 43) and primer 19 (SEQ ID NO: 44) were used to amplified an approximately 300 bp DNA fragment. NGS analysis was performed using an iSeq100 system (Illmina) to detect genome editing due to deletion of the target sequence.
  • Illmina iSeq100 system
  • Primer 18 (SEQ ID NO:43): 5'-TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGAAACTGCTTCTCCTCTTGGGA-3'
  • Primer 19 (SEQ ID NO:44): 5'-GTCTCGTGGGGCTCGGAGATGTGTATAAGAGACAGCAGATTCCTTATCTGGTGACACA-3'
  • the Abyssicoccus albus-derived Cas9 of the present invention can be widely used in various industrial fields involving genome variants, such as agriculture, the pharmaceutical industry, and the enzyme industry.

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

真核細胞ゲノム内の新たなPAM配列を認識して当該ゲノムを部位特異的に改変することが可能な、新たなゲノム編集手段を提供する。本方法は、真核細胞のゲノム内の標的DNA配列を部位特異的に改変するための方法であって、前記真核細胞中に、 (1)配列番号1に記載の塩基配列5'-NNACNN-3'(ここで「N」は各々、アデニン、シトシン、チミン、およびグアニンから独立して選択される任意の1塩基を意味する。)を含むPAM(プロトスペーサー隣接モチーフ)配列を認識するCasタンパク質、または、当該Casタンパク質をコードする核酸、および、 (2)ゲノム内の前記標的DNA配列にハイブリダイズし得ると共に、前記Casタンパク質と複合体を形成し、前記複合体の前記標的DNA配列への配列特異的結合を指向することが可能なガイドRNA、または、当該ガイドRNAをコードする核酸 を導入することにより、前記真核細胞のゲノムを前記標的DNA配列において改変することを含む。

Description

ゲノム編集方法およびゲノム編集用組成物
 本発明は、遺伝子工学の分野に関し、さらに詳細にはゲノム編集の分野に関する。より具体的に、本発明は、真核細胞のゲノム内の標的DNA配列を部位特異的に改変するための新たなゲノム編集方法および当該方法に用いられるゲノム編集用組成物等のゲノム編集手段に関する。
 ゲノム編集技術として、部位特異的DNA修飾タンパク質を利用することが知られている。中でも近年では、CRISPR/Cas(Clustered Regularly Interspaced Short Palindromic Repeats-CRISPR associated proteins)システムをゲノム編集に応用する技術が盛んに開発され、利用されている。CRISPR/CasシステムにはI型、II型、およびIII型があるが、ゲノム編集で最も多く用いられているのはII型である。II型CRISPR/Casシステムでは、RNA誘導型ヌクレアーゼ(RNA-guided nuclease:RGN)RGNとして、Cas9と呼ばれるヌクレアーゼを用いる。Cas9は様々な真核細胞(例えば魚、植物、ヒト等)のゲノムを操作するのに使用されてきた(非特許文献1)。Cas9は、一般的にはガイドRNAとの複合体として用いられる。Cas9とガイドRNAとの複合体を細胞内に導入することにより、様々な動植物において標的遺伝子を変異させることができる。Cas9は、CRISPR RNA(crRNA)およびトランス活性化crRNA(tracrRNA)と呼ばれる2つのRNAと複合体を形成することにより、活性を有するエンドヌクレアーゼとして機能し、侵入したファージまたはプラスミド中の外来遺伝因子を切断する。このように、CRISPR/Casシステムは、標的DNA配列と相同な配列を有する短いsgRNAを合成するだけで利用可能である上に、特にII型CRISPR/Casシステムでは、単一のタンパク質であるCas9を用いてゲノム編集が可能であるという利点がある。
 Cas9は、DNA中のPAM(プロトスペーサー隣接モチーフ:protospacer adjacent motif)配列を認識し、その上流で二本鎖DNAを平滑末端になるように切断する。Cas9が認識するPAM配列の長さや塩基配列は、Cas9が由来する細菌種によってさまざまである。例えば、ストレプトコッカス・ピオゲネス(Streptococcus pyogenes)由来のCas9(略称SpyCas9)は、5’-NGG-3’という3つの塩基をPAM配列として認識するため、グアニンが2つ並んだ配列の上流を切断できる(特許文献1)(なお、別途明記しない限り、本明細書における塩基配列中の「N」は任意の塩基を表す。)。また、ストレプトコッカス・サーモフィルス(Streptococcus thermophilus)は2種類のCas9を有し、それぞれ5’-NGGNG-3’又は5’-NNAGAA-3’という5~6塩基の配列をPAM配列として認識する(特許文献2)。
国際公開第2014/093661号 特表2015-510778号公報
Charpentier and Doudna, Nature, 2013, 495:50-51
 このように、CRISPR/Casシステムは優れたゲノム編集手段ではあるが、その汎用性を高めるために、認識可能なPAM配列の多様化が求められている。
 本発明は上記課題に鑑みてなされたもので、その目的は、真核細胞ゲノム内の新たなPAM配列を認識して当該ゲノムを部位特異的に改変することが可能な、新たなゲノム編集手段を提供することである。
 本発明者らは、前述の課題解決のために鋭意検討を行なった結果、5’-NNACNN-3’を含む新たなPAM配列を認識するCasタンパク質を見出し、斯かるCasタンパク質をガイドRNAと共に、標的DNA配列をゲノム内に含む真核細胞内で発現させることで、新たな標的DNA配列に基づく真核細胞ゲノムの部位特異的な改変が可能となることを見出し、本発明を完成するに至った。
 すなわち、本発明は以下を包含する。
[項1]真核細胞のゲノム内の標的DNA配列を部位特異的に改変するための方法であって、
前記真核細胞中に、
(1)配列番号1に記載の塩基配列5’-NNACNN-3’(ここで「N」は各々、アデニン、シトシン、チミン、およびグアニンから独立して選択される任意の1塩基を意味する。)を含むPAM(プロトスペーサー隣接モチーフ)配列を認識するCasタンパク質、または、当該Casタンパク質をコードする核酸、および、
(2)ゲノム内の前記標的DNA配列にハイブリダイズし得ると共に、前記Casタンパク質と複合体を形成し、前記複合体の前記標的DNA配列への配列特異的結合を指向することが可能なガイドRNA、または、当該ガイドRNAをコードする核酸
を導入することにより、前記真核細胞のゲノムを前記標的DNA配列において改変することを含む方法。
[項2]前記Casタンパク質が、アビシコッカス(Abyssicoccus)属菌、好ましくはアビシコッカス・アルバス(Abyssicoccus albus)に由来する、項1に記載の方法。
[項3]前記Casタンパク質が、核局在化シグナル(NLS)を含む、項1または2に記載の方法
[項4]前記Casタンパク質が、配列番号4に記載のアミノ酸配列と80%以上、又は85%以上、又は90%以上、又は92%以上、又は95%以上、又は96%以上、又は97%以上、又は98%以上、又は99%以上の配列相同性を有するアミノ酸配列を含む、項1~3の何れか一項に記載の方法。
[項5]前記Casタンパク質が、エンドヌクレアーゼ活性を有する、項1~4の何れか一項に記載の方法。
[項6]前記PAM配列が、配列番号2に記載の塩基配列5’-NNACGN-3’または配列番号3に記載の塩基配列5’-NNACAN-3’を含む、項1~5の何れか一項に記載の方法。
[項7]前記ガイドRNAが、1本鎖ガイドRNA(sgRNA)であると共に、crRNAおよびtracrRNAを含む、項1~6の何れか一項に記載の方法。
[項8]前記crRNAが、標的DNA相補鎖と二本鎖を形成することが可能な15~30ヌクレオチド長のスペーサー配列を含む、項7に記載の方法。
[項9]前記crRNAが、12~36ヌクレオチド長のステムループを含む、項7又は8に記載の方法。
[項10]前記真核細胞が、動物細胞、植物細胞、又は微生物細胞である、項1~9の何れか一項に記載の方法。
[項11]前記Casタンパク質をコードする核酸のヌクレオチド配列が、動物細胞、植物細胞、又は微生物細胞における発現のためにコドン最適化されている、項1~10の何れか一項に記載の方法。
[項12]項1~11の何れか一項に記載の方法に使用するためのゲノム編集用組成物であって、前記のCasタンパク質、または、当該Casタンパク質をコードする核酸を含む組成物。
[項13]前記のガイドRNA、または、当該ガイドRNAをコードする核酸を更に含む、項12に記載の組成物。
 本発明のゲノム編集方法によれば、5’-NNACNN-3’を含む新たなPAM配列を認識するCasタンパク質を用いることにより、新たな標的DNA配列に基づく真核細胞ゲノムの部位特異的な改変が可能となる。
図1は、実施例1におけるAalCas9タンパク質生産用ベクターの構成を模式的に示す図である。 図2は、実施例2及び実施例3におけるsgRNAの塩基配列(配列番号23)及び構成を示す図である。 図3は、実施例2におけるPAMドメインの解析結果を示すグラフである。 図4は、実施例3におけるインビトロDNA切断アッセイによる反応産物の電気泳動結果の例を示す写真である。左の写真は、反応溶液を25℃で60分間インキュベートした場合の結果を、右の写真は、反応溶液を37℃で60分間インキュベートした場合の結果をそれぞれ示している。 図5A及びBは、実施例3におけるインビトロDNA切断アッセイによるAalCas9活性の経時変化を示すグラフである。図5Aのグラフは、反応溶液を25℃でインキュベートした場合の結果を、図5Bのグラフは、反応溶液を37℃でインキュベートした場合の結果をそれぞれ示す。 図6A及びBは、実施例4におけるAalCas9によるシロイヌナズナプロトプラスト細胞のゲノムDNA編集結果を示す図である。図6Aは、標的DNA毎の編集率を、図6Bは、次世代シーケンサーによる変異DNAをそれぞれ示している。 図7は、実施例5におけるAalCas9によるシロイヌナズナ植物体のゲノムDNA編効率を示す図である。 図8は、実施例6におけるAalCas9によるヒト培養細胞HEK293FTのゲノム編集効率を示す図である。
 以下、本発明を具体的な実施の形態に即して詳細に説明する。但し、本発明は以下の実施の形態に束縛されるものではなく、本発明の趣旨を逸脱しない範囲において、任意の形態で実施することが可能である。
 なお、本発明において引用される特許文献(特許出願公開公報および特許公報等)並びに非特許文献は、その全体があらゆる目的のために本明細書に組み込まれるものとする。
 また、本発明において使用される用語は、特に言及しない限り、当該分野で通常用いられる意味を有する。
 また、以下に説明するタンパク質または遺伝子のうち、公知のタンパク質または遺伝子の各配列に関する情報は、NCBI(国立バイオテクノロジー情報センター)のGenBankなどのよく知られたデータベースにおいて見出すことができる。
 また、別途記載する場合を除き、本明細書において、塩基配列中の「A」はアデニン、「G」はグアニン、「C」はシトシン、「T」はチミンをそれぞれ意味し、「N」は、アデニン、シトシン、チミン、およびグアニンからなる群から選択された任意の1塩基を意味する。
・ゲノム編集方法:
 本発明の一側面は、真核細胞のゲノム内の標的DNA配列を部位特異的に改変するためのゲノム編集方法(以下適宜「本発明のゲノム編集方法」又は「本発明の方法」と略称する。)に関する。本方法は、真核細胞中に、
(1)特定のPAM配列を認識するCasタンパク質、または、当該Casタンパク質をコードする核酸、および、
(2)ガイドRNA、または、当該ガイドRNAをコードする核酸
を導入することにより、前記真核細胞のゲノムを前記標的DNA配列において改変することを含むことを主な特徴とする。
・細胞:
 本明細書において、細胞は、原核細胞または真核細胞のいずれの細胞であってもよく、特に限定されないが、好ましくは真核細胞が使用される。原核細胞の例としては、細菌、古細菌が挙げられる。真核細胞の例としては、微生物細胞、植物細胞、動物細胞が挙げられる。微生物細胞としては、酵母、真菌、原生動物等の各種微生物に由来する細胞が挙げられる。植物細胞としては、種子植物、シダ・コケ類、藻類等の各種植物に由来する細胞が挙げられる。動物細胞としては、脊椎動物(哺乳類、鳥類、爬虫類、両生類、魚類等)、節足動物(昆虫等)、軟体動物等の各種動物に由来する細胞が挙げられる。特に哺乳動物細胞の具体例としては、CHO細胞、HeLa細胞、HEK293細胞、COS-1細胞等が挙げられる。細胞の態様も特に制限されず、生体内(インビボ)細胞、培養細胞(インビトロ)、初代培養細胞(インビトロおよびエクスビボ)、移植細胞等の何れの態様であってもよい。斯かる各種の細胞は、当該技術分野において一般的に使用される。
・ゲノム編集:
 本明細書において「ゲノム編集」とは、部位特異的DNA修飾タンパク質等を用いて、各種細胞内のゲノム上の標的部位に所望の改変を導入することにより、ゲノムを編集する技術を意味する。ここで「改変」の例としては、限定されるものではないが、ゲノム上の特定の遺伝子を切断して遺伝子を破壊すること、ゲノム上の標的部位のDNA断片を挿入又は置換すること、点変異を高効率に導入して遺伝子機能を改変すること等が挙げられる。ここで「標的部位」とは、ゲノム編集の対象となる真核細胞のゲノム内の所定の部位を意味する。ここで「切断」とは、ヌクレオチド分子の共有結合性の主鎖の切断を指す。
 ゲノム編集の標的部位は、後述する部位特異的DNA修飾タンパク質の種類に応じて適切に選択することが可能である。例えば、部位特異的DNA修飾タンパク質としてCasタンパク質の一種であるCas9を使用する場合、ゲノム編集の標的部位としては、PAM配列およびその5’側に隣接する所定塩基長(例えば20塩基程度)の配列からなるDNA鎖(標的鎖)とその相補DNA鎖(非標的鎖)からなる、ゲノムDNA上の部位とすることが好ましい。
 ゲノム編集の対象となるゲノム上の標的部位は特に限定されないが、例としては、真核細胞ゲノム上の遺伝子であって、その改変や破壊等が望まれる遺伝子の一部又は全部、或いはその遺伝子と重複又は隣接する領域等が挙げられる。
 ゲノム編集の対象となる遺伝子の具体例としては、1次代謝(アミノ酸等)関連遺伝子、2次代謝(フラボノイド、ポリフェノール等)関連遺伝子、糖代謝関連遺伝子、脂質代謝関連遺伝子、有用物質(医薬、酵素、色素、芳香成分等)生産関連遺伝子、収量性(数、大きさ等)、開花関連遺伝子、耐病虫性関連遺伝子、環境ストレス(低温、高温、乾燥、塩、光障害、紫外線)耐性関連遺伝子等が挙げられる。
・Casタンパク質:
 本明細書において「Casタンパク質」とは、細菌および古細菌において侵入外来核酸に対する獲得耐性を提供する適応免疫系を構成するCasタンパク質ファミリーに属するタンパク質であり、PAM配列を認識して、その上流又は下流で二本鎖DNAを切断する標的特異的エンドヌクレアーゼである。Casタンパク質は、RNA誘導型ヌクレアーゼ(RNA-guided nuclease:RGN)であり、ガイドRNA(gRNA)と共にCRISPR/Casシステムを構成する。該CRISPR/Casシステムを標的細胞内に導入又は構築することにより、ガイドRNAがゲノム内の標的部位に結合し、該結合部位に呼び込まれたCasタンパク質によって標的部位のDNAを切断することができる。
 本発明に使用されるCasタンパク質は、5’-NNACNN-3’(配列番号1)を含む特定のPAM(プロトスペーサー隣接モチーフ)配列を認識することを特徴とする。中でも、5’-NNACGN-3’(配列番号2)または5’-NNACAN-3’(配列番号3)を含む特定のPAM配列を認識することが好ましい。
 本発明に使用されるCasタンパク質は、上記の特定のPAM配列を認識できるものであれば、その種類は限定されるものではなく、任意の種類のCasタンパク質を使用可能であるが、中でもCas9であることが好ましい。
 本発明に使用されるCasタンパク質は、天然タンパク質であってもよいが、組換えタンパク質であってもよい。
 本発明に使用されるCasタンパク質の起源(由来)は、限定されるものではないが、アビシコッカス(Abyssicoccus)属の細菌に由来するCasタンパク質が好ましく、中でもアビシコッカス・アルバス(Abyssicoccus albus)に由来するCas9であるAalCas9が好ましい。野生型AalCas9のアミノ酸配列を配列番号4に示す。
 本発明にAalCas9を使用する場合、配列番号4に記載のアミノ酸配列を有する野生型AalCas9であってもよいが、その活性(例えば後述のエンドヌクレアーゼ活性)を損なわない限りにおいて、配列番号4に記載のアミノ酸配列に対して1又は2以上の変異を有する、変異型AalCas9であってもよい。具体的に、斯かる変異型AalCas9は、配列番号4に記載の野生型AalCas9のアミノ酸配列に対して、1又は2以上のアミノ酸が置換、欠失、付加、又は挿入されたアミノ酸配列を有すると共に、AalCas9タンパク質と同等又はそれ以上の活性(例えば後述のエンドヌクレアーゼ活性)を有するタンパク質であることが好ましい。中でも、斯かる変異型のAalCas9タンパク質は、その親となる配列番号4に記載の野生型AalCas9のアミノ酸配列と、例えば80%以上、又は85%以上、又は90%以上、又は92%以上、又は95%以上、又は96%以上、又は97%以上、又は98%以上、又は99%以上の配列相同性(好ましくは配列同一性)を有するアミノ酸配列を有することが好ましい。
 ここで、2つのアミノ酸配列の「相同性」(similarity)とは、両アミノ酸配列をアラインメントした際に各対応箇所に同一のアミノ酸残基又は類似の(すなわち、物理化学的性質が類似する)アミノ酸残基が現れる比率であり、2つのアミノ酸配列の「同一性」(identity)とは、両アミノ酸配列をアラインメントした際に各対応箇所に同一のアミノ酸残基が現れる比率である。なお、2つのアミノ酸配列の「相同性」及び「同一性」は、例えばBLAST(Basic Local Alignment Search Tool)プログラム(Altschul et al., J. Mol. Biol., (1990), 215(3):403-10)等を用いて求めることが可能である。
 本発明に使用されるCasタンパク質をコードする核酸は、上記Casタンパク質のアミノ酸配列に対応する塩基配列を有し、真核細胞内で上記Casタンパク質を発現することが可能な核酸であれば、制限されるものではない。斯かる核酸は、所望のCasタンパク質のアミノ酸配列情報を基に、適宜作製することが可能である。なお、当該核酸は化学合成等により作製してもよい。
 本発明に用いられるCasタンパク質をコードする核酸としては、配列番号4の野生型AalCas9をコードする核酸、及び、配列番号4の野生型AalCas9のアミノ酸配列に対して、例えば80%以上、又は85%以上、又は90%以上、又は95%以上、又は96%以上、又は97%以上、又は98%以上、又は99%以上の配列同一性を有するアミノ酸配列を含むタンパク質をコードする塩基配列を含む核酸が挙げられる。例として、アビシコッカス・アルバス(Abyssicoccus albus)において配列番号4の野生型AalCas9をコードする野生型AalCas9遺伝子の塩基配列を配列番号5に示す。
 本発明に用いられるCasタンパク質をコードする核酸は、当該核酸を導入する真核細胞の翻訳系に合わせてコドンが最適化されたものであってもよい。例として、野生型AalCas9遺伝子の塩基配列を大腸菌に合わせてコドン最適化した塩基配列を配列番号6に、ヒトに合わせてコドン最適化した塩基配列を配列番号7に、シロイヌナズナに合わせてコドン最適化した塩基配列を配列番号8にそれぞれ示す。
 本発明に用いられるCasタンパク質をコードする核酸としては、上記の各種の塩基配列、例えば配列番号5、配列番号6、配列番号7、または配列番号8に記載の塩基配列に対して、例えば80%以上、又は85%以上、又は90%以上、又は95%以上、又は96%以上、又は97%以上、又は98%以上、又は99%以上の配列同一性を有する塩基配列を含む核酸も挙げることができる。
 本発明に用いられるCasタンパク質をコードする核酸は、前記タンパク質または核酸を真核細胞において核輸送によって核中に輸送するための核局在化シグナル(NLS)配列を含むことができる。当該NLSは、Casタンパク質をコードする核酸の5’末端側または3’末端側の何れか一方のみに付加されていてもよく、あるいは5’末端側および3’末端側の両方に付加されてもよい。
 本発明に用いられるCasタンパク質をコードする核酸は、プロモーターやターミネーター等の調節配列と作用可能に連結された発現カセットの状態で、ベクターに組み込まれていてもよい。
・エンドヌクレアーゼ活性:
 本発明に用いられるCasタンパク質は、エンドヌクレアーゼ活性を有することが好ましい。本明細書において、「エンドヌクレアーゼ」とは、ヌクレオチド鎖の途中を切断する酵素を意味する。よって、本発明に用いられるエンドヌクレアーゼ活性を有するCas9タンパク質は、ガイドRNAにより誘導され、標的となるDNA鎖の途中を切断する酵素活性を有することが好ましい。
 本発明に用いられるCasタンパク質は、限定されるものではないが、例えば10℃から80℃の範囲の温度で、好ましくは20℃から50℃の範囲の温度で、さらに好ましくは25℃から40℃の範囲の温度で、標的DNAの切断または改変活性を有する。
・PAM配列:
 本発明に用いられるCasタンパク質は、特定のPAM配列を認識する。本明細書において、「PAM配列」(プロトスペーサー隣接モチーフ配列)とは、標的二本鎖ポリヌクレオチド中に存在し、Cas9タンパク質により認識可能な配列である。Casタンパク質が認識可能なPAM配列の長さや塩基配列は、Casタンパク質の種類によって異なる。
 前述のように、本発明に使用されるCasタンパク質は、5’-NNACNN-3’(配列番号1)を含む特定のPAM配列を認識する。中でも、5’-NNACGN-3’(配列番号2)または5’-NNACAN-3’(配列番号3)を含む特定のPAM配列を認識することが好ましい。
・ガイドRNA:
 ガイドRNAは、Casタンパク質等の部位特異的DNA修飾タンパク質をゲノム上の標的核酸の標的部位に誘導(ガイド)する機能を有するRNAである。部位特異的DNA修飾タンパク質は、通常は斯かるガイドRNAと結合して、リボ核タンパク質又はリボヌクレオタンパク質(RNP)を形成する。ここで、ガイドRNAがゲノム上の標的部位をターゲティングし、Casタンパク質等の部位特異的DNA修飾タンパク質がゲノム上の標的部位のDNAを開裂することで、ゲノム上の標的部位のDNA配列を変更又は改変することができる。
 ガイドRNAの構造は、通常は部位特異的DNA修飾タンパク質の種類に応じて選択される。例えば、部位特異的DNA修飾タンパク質としてCasタンパク質を使用する場合、ガイドRNAは通常、CRISPR/Casシステムの活性に関与するcrRNA(CRISPR RNA)配列と、ゲノム上の標的部位に結合するtracrRNA(trans-activating crRNA)配列とを含む。この場合、ガイドRNAは、crRNA配列とtracrRNA配列を含む一本鎖RNA(sgRNA)であってもよいし、crRNA配列を含むRNAとtracrRNA配列を含むRNAとが相補的に結合してなるRNA複合体であってもよい。
 crRNA配列は、リピート配列およびスペーサー配列を含む。スペーサー配列は、標的DNA配列の相補鎖または実質的な相補鎖(標的配列に対して完全に一致していないが、標的配列に結合できる配列)と2本鎖を形成できる配列である。crRNA配列は、斯かるスペーサー配列を含むことによって、CRISPR/Casシステムの標的認識を行うことができる。スペーサー配列の長さは、限定されるものではないが、例えば15~30ヌクレオチド長、18~25ヌクレオチド長、19~23ヌクレオチド長、20~22ヌクレオチド長、特に20ヌクレオチド、21ヌクレオチド、22ヌクレオチドであることが好ましい。crRNA配列の長さは制限されないが、例えば12~36塩基長程度のステムループを含む配列とすることができる。
 tracrRNA配列は、高繰り返し領域と、その後に続く1つまたは2つ以上(好ましくは2つ以上)のヘアピン構造とを含み、複数のステムループを形成可能な配列である。tracrRNA配列の長さは制限されないが、例えば50~100塩基長程度の配列とすることができる。
 本発明に用いられるガイドRNAの構成は、ゲノム内の前記標的DNA配列にハイブリダイズし得ると共に、前記Casタンパク質と複合体を形成し、前記複合体の前記標的DNA配列への配列特異的結合を指向することが可能であれば、特に制限されない。本発明に使用されるCasタンパク質及びそれが認識するPAM配列、並びに改変の対象となる真核細胞のゲノム内の標的DNA配列等に応じて、適切に設計すればよい。斯かるガイドRNAの設計については、これまで多くの知見が存在しており(一例を挙げれば、国際公開第2013/142578号、同第2013/176772号、及び同2014/093595号等)、当業者であればこれらの知見を適宜参酌しながら、本発明に任意の変更を加えて実施することが可能である。
 ガイドRNAをコードするDNA等の核酸を用いる場合、その構成も特に制限されない。本発明に使用されるガイドRNAの配列及び構成、並びに改変の対象となる真核細胞の種類等に応じて、適切なDNAを設計すればよい。特にcrRNA配列及びtracrRNA配列を含むガイドRNAをコードするDNAを用いる場合、crRNA配列をコードするDNAとtracrRNA配列をコードするDNAとを独立した分子として用意してもよく、crRNA配列及びtracrRNA配列の両方をコードする一体のDNA分子を用いてもよい。
 なお、ガイドRNAをコードするDNA等の核酸は、Casタンパク質をコードする核酸とは独立した分子であってもよく、Casタンパク質をコードする核酸と一体の分子となっていてもよい。また、ガイドRNAをコードする核酸が単独で、或いはCasタンパク質をコードする核酸と共に、プロモーターやターミネーター等の調節配列と作用可能に連結された発現カセットの状態で、ベクターに組み込まれてもいてもよい。
・標的DNA配列:
 一般に、CRISPR/Casシステムにおける部位特異的改変の対象となる標的DNA配列は制限されず、二本鎖DNA配列、一本鎖RNA配列、または一本鎖DNA配列のいずれであってよい。但し、本発明では、真核細胞のゲノム内の二本鎖DNA配列が標的配列となる。中でも通常は、ゲノム内のDNA配列のうち、Casタンパク質が認識するPAM配列の近傍に位置するDNA配列が、標的DNA配列として選択される。
・ゲノム編集の手順:
 本発明の方法は、部位特異的改変の対象となる標的DNA配列をゲノム内に含む真核細胞中に、前記のCasタンパク質またはそれをコードする核酸と、前記のガイドRNAまたはそれをコードする核酸とを導入することにより実施される。これにより、ガイドRNAが真核細胞ゲノム内の標的DNA部位に結合し、該結合部位に呼び込まれたCasタンパク質によって当該真核細胞のゲノムを標的DNA部位で切断し、当該ゲノムを部位特異的に改変することが可能となる。
 前記のCasタンパク質またはそれをコードする核酸と、前記のガイドRNAまたはそれをコードする核酸とを、真核細胞内に導入する手法は特に制限されない。例としては、これらに限定されるものではないが、エレクトロポレーション、リポソーム、ウイルスベクター、ナノ粒子、ウイスカー結晶、PTD(タンパク質転移ドメイン)融合タンパク質を使用した手法、パーティクルガン法、アグロバクテリウム法等、当該技術分野において既知の様々な方法が挙げられる。
 前記のCasタンパク質またはそれをコードする核酸と、前記のガイドRNAまたはそれをコードする核酸とを細胞に導入した際、当該細胞を細胞増殖に適した条件下で培養すればよい。当該培養条件は、細胞が由来する生物種に適した培養条件であればよく、例えば、当業者が既知の細胞培養技術に基づいて決定することができる。
・その他:
 以上、本発明のゲノム編集方法について説明したが、斯かるゲノム編集方法に使用される各種のゲノム編集手段、例えば前記のCasタンパク質またはそれをコードする核酸や、前記のガイドRNAまたはそれをコードする核酸も、本発明に含まれるものとする。
 また、本発明の一側面によれば、本発明のゲノム編集方法に使用するためのゲノム編集用組成物及びゲノム編集用キットも提供される。ゲノム編集用組成物は、少なくとも前記のCasタンパク質またはそれをコードする核酸を含むと共に、任意により更に前記のガイドRNAまたはそれをコードする核酸を含む組成物である。ゲノム編集用キットは、少なくとも前記のCasタンパク質またはそれをコードする核酸を含む容器と、その使用方法を記載した指示書を含むと共に、任意により更に前記のガイドRNAまたはそれをコードする核酸を含む容器を含むキットである。斯かるCasタンパク質またはそれをコードする核酸や、ガイドRNAまたはそれをコードする核酸の詳細は、上述したとおりである。
 なお、CRISPR/Casシステムを用いたゲノム編集については、これまで多くの知見が存在しており(一例を挙げれば、国際公開第2013/142578号、同第2013/176772号、及び同2014/093595号等)、当業者であればこれらの知見を適宜参酌しながら、本発明に任意の変更を加えて実施することが可能である。なお、前述したように、これらの特許文献はその全体があらゆる目的のために本明細書に組み込まれるものとする。
 以下、本発明を実施例に則して更に詳細に説明するが、これらの実施例はあくまでも説明のために便宜的に示す例に過ぎず、本発明は如何なる意味でもこれらの実施例に限定されるものではない。なお、上述のように「N」は、アデニン、シトシン、チミン、およびグアニンからなる群から選択された任意の1塩基を意味する。
[実施例1]アビシコッカス・アルバス由来Cas9タンパク質の作製:
(1)アビシコッカス・アルバス由来Cas9遺伝子の調製:
 配列番号4に記載のアビシコッカス・アルバス(Abyssicoccus albus)由来のアミノ酸配列の情報を基に、当該Casタンパク質をコードする配列番号5に記載のDNA配列を人工合成した。当該DNA配列はNCBI(国立バイオテクノロジー情報センター)のGenBankなどのよく知られたデータベースにおいて見出すことができる。また、斯かるアビシコッカス・アルバス由来Cas9遺伝子を、大腸菌コドンについて最適化したDNA配列(配列番号6)、ヒトコドンについて最適化したDNA配列(配列番号7)、及び、シロイヌナズナについて最適化したDNA配列(配列番号8)も、それぞれ合成した。塩基配列の決定にはサンガー法又は次世代シーケンス法を用いた。なお、AalCas9タンパク質は、SpyCas9(1368アミノ酸)などの他のCas9オルソログと比べて、比較的小さな(1059アミノ酸)であった。
(2)大腸菌発現用ベクターの構築
 以下に詳述する手順により、大腸菌コドンについて最適化した配列番号6のAalCas9遺伝子に、公知のN末端核移行シグナル配列、C末端核移行シグナル配列、およびHis-tagを付加し、pETベクターに組み込んだAalCas9生産用ベクターを構築した。当該ベクターの構成を図1に模式的に示す。
 まず、下記のプライマー1(配列番号9)およびプライマー2(配列番号10)を用い、pET26bベクターを鋳型として、PCR反応によりリニアDNAの増幅を行った。
・プライマー1(配列番号9):
5’-TCCTCCAGAGACTTTCCGCTTCTTCTTTGGGGCTTTATGATTCATATGTATATCTCCTTCTTAAAG-3’
・プライマー2(配列番号10):
5’-TCTGGCGGCTCAAAAAGAACCGCCGACGGCAGCGAATTCGAGCCCAAGAAGAAGAGGAAAGTCCTCGAGCACCACCAC-3’
 別途、大腸菌用にコドン最適化したAalCas9遺伝子(配列番号6)の5’末端および3’末端に対して、それぞれ以下のオリゴヌクレオチドA(N末端核移行シグナル配列、配列番号11)およびオリゴヌクレオチドB(C末端核移行シグナル配列、配列番号12)を付加したDNA断片を調製した。
・オリゴヌクレオチドA(N末端核移行シグナル配列、配列番号11):
5’-CGGAAAGTCTCTGGAGGA-3’
・オリゴヌクレオチドB(C末端核移行シグナル配列、配列番号12):
5’-GCGCTAAGAACGAGCGCG-3’
 上記得られた大腸菌コドン最適化AalCas9遺伝子を含むDNA断片を、先に得られたpETベクターのPCR増幅産物と混合し、NEBuilder HiFi DNA Assembly Master Mixを用いてDNA断片を環状プラスミド化した。
 得られた環状プラスミドを用いて大腸菌DH5aを形質転換し、50μg/mLカナマイシンを含むLB寒天プレート上で培養することにより形質転換体を選択した。数個のコロニーをピックアップし、その中から目的の環状プラスミド(pET-AalCas9)をAalCas9生産用ベクターとして作製した。
(3)AalCas9の調製:
 得られたプラスミドベクターpET-AalCas9を、常法により大腸菌ROSETTA2(DE3)pLYSS株に導入した。得られた組換株を50μg/mLカナマイシンを含むLB培地で培養し、OD値0.8になるまで培養した時点で、発現誘導剤としてイソプロピル-β-チオガラクトピラノシド(Isopropyl β-D-1-thiogalactopyranoside;IPTG)(終濃度0.25mM)を添加し、20℃で20時間培養した。培養後、当該大腸菌を遠心分離(8,000g、10分間)により回収した。回収した菌体を緩衝液A(50mM Tris-HCl、pH8.0、500mM NaCl、5mM MgCl)で懸濁し、超音波破砕した。遠心分離(12,000g、30分間)により上清を回収し、緩衝液Aで平衡化したNi-アフィニティカラム、次にHeparinアフィニティカラムを用いて精製した後、緩衝液B(20mM Tris-HCl、pH7.5、300mM NaCl、1mM MgCl、10% グリセロール)で平衡化したゲルろ過カラムにより精製した。精製したタンパク質は遠心式限外ろ過フィルターユニット(メルクミリポア)を用いて濃縮することにより、AalCas9を取得した。このようにして得られたAalCas9は-80℃で保存した。
[実施例2]PAM配列の同定:
(1)プラスミドライブラリーの作製:
 AalCas9遺伝子のPAM配列を同定するために、以下の手順でプラスミドライブラリーを作製した。
 まず、市販のpUC18を制限酵素BamH1とEcoR1で切断した断片に、公知のイネ由来PDS(phytoene desaturase)遺伝子配列の一部(5’-GTTGGTCTTTGCTCCTGCAG-3’)を含む5’末端をリン酸化した以下のオリゴヌクレオチドC(配列番号13)およびオリゴヌクレオチドD(配列番号14)をアニーリングした2本鎖DNAフラグメントを混合し、Ligation mix(TAKARA社製)を用いてライゲーションした。
・オリゴヌクレオチドC(配列番号13):
5’-pGATCGTTGGTCTTTGCTCCTGCAGAGG-3’
・オリゴヌクレオチドD(配列番号14):
5’-pAATTCCTCTGCAGGAGCAAAGACCAAC-3’
 得られたライゲーション溶液を用いて、常法により大腸菌DH5αを形質転換し、100μg/mLアンピシリンを含むLB寒天プレート上で選抜後、目的の組み換えプラスミドを有するクローンからプラスミドを精製した(pUC18-OsPDS)。
 精製したpUC18-OsPDSを鋳型とし、以下のプライマー3(配列番号15)およびプライマー4(配列番号16)を用いて第1のPCR反応を実施し、増幅されたDNA断片を含む第1のPCR増幅産物を取得した。
・プライマー3(配列番号15)
5’-ACATCTGACGCTGCCGACGACAAGCTTGGCACTGGCCGTCG-3’
・プライマー4(配列番号16)
5’-CCGGAAGCATAAAGTGTAAAGC-3’
 また、同じく精製したpUC18-OsPDSを鋳型とし、NGS解析に用いるアダプター配列を含む以下のプライマー5(配列番号17)およびプライマー6(配列番号18)を用いて第2のPCR反応を実施し、増幅されたDNA断片を含む第2のPCR増幅産物を取得した。
・プライマー5(配列番号17)
5’-CTTGTCGTCGGCAGCGTCAGATGTGTATAAGAGACAGCATGCCTGCAGGTCGACTCGAGAGG-3’
・プライマー6(配列番号18)
5’-ACACTTTATGCTTCCGGGTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGCTCGTATGTTGTGTGGAATTG-3’
 得られた第1および第2のPCR増幅産物を混合し、NEBuilder HiFi DNA Assembly Master Mixを用いて、DNA断片を環状プラスミド化した。環状化したプラスミドで大腸菌DH5αを形質転換し、100μg/mLアンピシリンを含むLB寒天プレート上で選抜後、目的の組み換えプラスミドを有するクローンからプラスミドを精製した(pUC18-NGS-OsPDS)。
 得られたプラスミドpUC18-NGS-OsPDSに、以下のオリゴヌクレオチドE(配列番号19)およびオリゴヌクレオチドF(配列番号20)を混合後、逆転写酵素ReverTra Ace(TOYOBO)を用いて2本鎖DNAフラグメントを調製した。なお、オリゴヌクレオチドFには、7つの塩基Nからなるランダム配列が含まれている。
・オリゴヌクレオチドE(配列番号19):
5’-GGTCTTTGCTCCTGCAG-3’
・オリゴヌクレオチドF(配列番号20):
5’-AGCTATGACCATGATTACGAATTCNNNNNNNCTGCAGGAGCAAAGACC-3’
 精製したpUC18-NGS-OsPDSを鋳型とし、以下のプライマー7(配列番号21)およびプライマー8(配列番号22)を用いてPCR反応を実施し、増幅されたDNA断片を含むPCR増幅産物を取得した。
・プライマー7(配列番号21):
5’-CTGCAGGAGCAAAGACC-3’
・プライマー8(配列番号22):
5’-GTAATCATGGTCATAGCTGTTTCC-3’
 得られたDNA断片を含むPCR増幅産物と、調製したランダム配列を含む2本鎖DNAフラグメントとを混合し、NEBuilder HiFi DNA Assembly Master Mixにより、DNA断片を環状プラスミド化した。
 得られた環状化プラスミドで大腸菌DH5αを形質転換し、100μg/mLアンピシリンを含むLB寒天プレート上で選抜後、目的の組み換えプラスミドを有する約10万コロニーをまとめて培養し、NucleoBond EXtra Midi Plus(日本ジェネティクス)を用いて、プラスミドライブラリーpUC18-NGS-OsPDS-7Nシリーズを作製した。
(2)プラスミドライブラリー切断用のRNPの調製:
 プラスミドライブラリーpUC18-NGS-OsPDS-7N切断用のAalCas9のsgRNA(配列番号23)を、Guide-itTM sgRNA In Vitro Transcription Kit(タカラバイオ社製)を用いて試験管内転写により調製した。AalCas9 sgRNAの構成を図2に、塩基配列を配列番号23に示す。なお、配列番号23では、5’末端側のポリNは省略して示している。このAalCas9 sgRNAを用いて、2.5μM AalCas9、12.5μM sgRNAとなるように、RNase-freeのCas9バッファー(20mM HEPES-Na、pH7.5、100mM NaCl、5mM MgCl、0.1mM EDTA)で希釈し、25℃で20分間放置して、複合体を形成させ、第1のRNP溶液を調製した。
・AalCas9 sgRNA(配列番号23)
5’-GUUUUAGUACUCUGCGAAAUUUAGUGAAAACUAGAUUUCGCAGAAUCUAUUAAAACAAGGCUUUAUGCCGUAUUUAACUCCAUCCUAUGGGUGGGGUAUUUUUU-3’
(3)NGS解析を用いたPAM配列の同定:
 上記(2)で調製した第1のRNP溶液に、濃度20nMとなるようにプラスミドライブラリーとCas9バッファーを加え、30℃で2時間酵素反応させた。反応溶液に、濃度60mMとなるようにEDTAを加え、60℃で5分間インキュベート後、アガロース電気泳動にて、未切断のプラスミドを精製した。
 精製した未切断プラスミドを鋳型として、以下のプライマー9(配列番号24)およびプライマー10(配列番号25)を用いてPCR反応を実施し、ランダム配列を含む約370bpの2本鎖DNAフラグメントを含むPCR増幅産物を取得した。
・プライマー9(配列番号24)
5’-GCGATCGGTGCGGGCCTCTTCGCTATTACGC-3’
・プライマー10(配列番号25)
5’-ATTAGGCACCCCAGGCTTTACACTTTATG-3’
 前記の2本鎖DNAフラグメントを含むPCR増幅産物を、濃度200nMとなるようにCas9バッファーで希釈し、上記(2)の第1のRNP溶液を加え、37℃で30分間酵素反応させた。反応溶液は上記と同様にアガロース電気泳動し、未切断の2本鎖DNAフラグメントを精製した。精製した2本鎖DNAフラグメントは次世代シーケンサ(NGS)によるDNA配列解析のサンプルとして使用した。
 精製した2本鎖DNAフラグメントおよびRNP未処理のプラスミドライブラリーは、Hiseq(Illmina社)によるNGS解析を行い、ランダム領域に含まれる配列を検出した。精製した2本鎖DNAフラグメントのランダム領域に含まれる配列とRNP未処理のプラスミドライブラリーに含まれる配列を比較し、精製した2本鎖DNAフラグメントで検出頻度が1/10に低下した配列に共通する配列を抽出することで、AalCas9のPAM配列をNNACGNと特定した(図3)。
[実施例3]インビトロでのDNA切断活性測定:
(1)基質DNAの調製:
 実施例2で作製したpUC18-NGS-OsPDS-7Nを鋳型に、AalCas9のPAM配列を含む以下のプライマー11(配列番号26)とプライマー12(配列番号27)からなるプライマーセット、又は、公知のSpyCas9のPAM配列を含む以下のプライマー13(配列番号28)とプライマー12(配列番号27)からなるプライマーセットを用いてPCR反応を実施し、各々約120bpのDNA断片を含むPCR増幅産物を調製した。調製したDNA断片はFastGene Gel/PCR エクストラクションキット(日本ジェネティクス)を用いて精製し、DNA切断活性測定の基質として用いた。
<AalCas9用>
・プライマー11(配列番号26)
5’-CGGATAACAATTTCACACAGGAAACAGCTATGACCATGATTACGAATTCTGCGTTACTGCAGGAGC-3’
・プライマー12(配列番号27)
5’-GCGATCGGTGCGGGCCTCTTCGCTATTACGC-3’
<SpyCas9用>
・プライマー13(配列番号28)
5’-CGGATAACAATTTCACACAGGAAACAGCTATGACCATGATTACGAATTCTTTCCCACTGCAGGAGC-3’
・プライマー12(配列番号27)
5’-GCGATCGGTGCGGGCCTCTTCGCTATTACGC-3’
(2)インビトロDNA切断活性測定用のRNPの調製:
 インビトロDNA切断活性用のAalCas9のsgRNA(配列番号23)を、Guide-itTM sgRNA In Vitro Transcription Kit(タカラバイオ社製)を用いて試験管内転写により調製した。このAalCas9 sgRNAを用いて、2μM AalCas9、2μM sgRNAとなるように、RNase-freeのCas9バッファー(20mM HEPES-Na、pH7.5、100mM NaCl、5mM MgCl、0.1mM EDTA)で希釈し、25℃で20分間放置して、複合体を形成させ、第2のRNP溶液を調製した。
(3)インビトロDNA切断活性測定:
 上記(2)の第2のRNP溶液に、濃度1μM RNP、10nM 基質DNAとなるように、基質DNAとCas9バッファーを加えた。反応溶液は25℃および37℃でインキュベートし、5分後、10分後、15分後、30分後に反応溶液の一部を回収し、濃度が50mMとなるようにEDTAを加え、65℃で5分間インキュベートすることで反応を停止させた。回収した反応液は、MultiNA(島津)を用いて未切断DNAと切断DNAを定量し、DNA切断活性を測定した。
 図4は、インビトロDNA切断アッセイによる反応産物の電気泳動結果の例を示す写真である。左の写真は、反応溶液を25℃で60分間インキュベートした場合の結果を、右の写真は、反応溶液を37℃で60分間インキュベートした場合の結果をそれぞれ示している。図5A及びBは、インビトロDNA切断アッセイによるAalCas9活性の経時変化を示すグラフである。図5Aのグラフは、反応溶液を25℃でインキュベートした場合の結果を、図5Bのグラフは、反応溶液を37℃でインキュベートした場合の結果をそれぞれ示す。これらの結果によれば、AalCas9は、37℃では15分後には80%以上の基質DNAを切断し、25℃では30分後には約50%の基質DNAを切断することが明らかになった。
[実施例4]植物細胞におけるAalCas9による変異導入:
(1)シロイヌナズナプロトプラストのゲノム編集実験用のRNP調製:
 下記の公知のシロイヌナズナ由来PDS3遺伝子上のPAM配列ACGNを含むsgRNA(配列番号29)を、Guide-itTM sgRNA In Vitro Transcription Kit(タカラバイオ社製)を用いて試験管内転写により調製した。このsgRNAを用いて、10μM AalCas9、20μM sgRNAとなるようにRNase-freeのCas9バッファー(20mM HEPES-Na、pH7.5、100mM NaCl、5mM MgCl、0.1mM EDTA)で希釈し、25℃で20分間放置して、複合体を形成させ、第3のRNP溶液を調製した。なお、配列番号29では、5’末端側のポリNは省略して示している。
・PDS3 sgRNA(配列番号29)
5’-GUAGCGAGUAAUCGUGAAGUAGAGAAACAGGGUUUUAGUACUCUGCGAAAUUUAGUGAAAACUAGAUUUCGCAGAAUCUAUUAAAACAAGGCUUUAUGCCGUAUUUAACUCCAUCCUAUGGGUGGGGUAUUUUUU-3’
 また、同様の手順にて、下記の公知の配列を有するSpyCas9のsgRNA(配列番号30)も調製し、AalCas9と同様にRNP複合体を形成させ、第4のRNP溶液を調製した。なお、配列番号30では、5’末端側のポリNは省略して示している。
・SpyCas9 sgRNA(配列番号30)
5’-GGACUUUUGCCAGCCAUGGUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU-3’
(2)シロイヌナズナプロトプラストの調製:
 30日間生育させたシロイヌナズナの葉より表皮を剥ぎとり葉肉細胞を露出させた後、その葉を1.0%セルラーゼ-オノズカR-10(ヤクルト社製)、0.25% マセロザイムR-10(ヤクルト社製)、10mM メルカプトエタノール、400mMマンニトール、20mM KCl、10mM CaCl、20mM MES(pH5.7)溶液に浸し、22℃、50rpmで振とうしながら、1時間インキュベートし、プロトプラストを遊離させた。プロトプラストは孔径70μmのナイロンフィルターで濾した後、50mL容チューブに集め、100×g、10分間遠心しプロトプラストを回収した後、上清を捨て、150mM NaCl、125mM CaCl、5mM KCl、2mM MES(pH5.7)緩衝液(W5緩衝液)で再懸濁した。再懸濁したプロトプラストは100×g、5分間遠心後、同緩衝液で再度懸濁した。この緩衝液による洗浄を2度繰り返した後、4℃で10分間インキュベートした。インキュベート後のプロトプラストは、100×g、5分間遠心後、400mMマンニトール、15mM MgCl、4mM MES(pH5.7)緩衝液で再懸濁した。その後、100×g、5分間遠心することでプロトプラストを回収した後、2.0~3.0×10細胞/mLになるよう同緩衝液で細胞濃度を調製し、形質転換用プロトプラスト懸濁液を得た。
(3)シロイヌナズナプロトプラストへのRNP導入:
 上記(2)で得られたプロトプラスト懸濁液35μLと前記第3又は第4のRNP溶液各10μLを混合後、40%(w/v)PEG4000、200mM マンニトール、100mM CaCl溶液を45μLずつ、それぞれ96穴プレート(ヌンク社製、丸底)に入れ、900rpm、15秒間振とうし、溶液を混合した。混合液は10分間室温で静置した。静置後の混合液にW5緩衝液200μLを勢いよく加えることでプロトプラストを懸濁させた後、100×g、5分間遠心し、プロトプラスト細胞をプレート底に集め、上清200μLを捨てることで、プロトプラスト懸濁液を洗浄した。この作業を計4回行った後、各ウェルをパラフィルムでシールし、22℃で18時間静置し、ゲノムDNAへの変異導入を行った。
(4)ゲノムDNAのNGS解析:
 上記(3)のRNP導入後、22℃で18時間静置したプロトプラスト懸濁液を200μL容チューブに回収し、ゲノム抽出バッファー(200mM Tris-HCl、pH7.5、250mM NaCl、25mM EDTA、0.5%SDS)と混合後、95℃で10分間インキュベートした後、氷上で5分間静置した。熱処理後のプロトプラスト懸濁液からイソプロパノール沈殿によりゲノムDNAを回収した。回収したゲノムDNAは滅菌水で懸濁し、AalCas9については以下のプライマー14(配列番号31)およびプライマー15(配列番号32)からなるプライマーセット、SpyCas9については以下のプライマー16(配列番号33)およびプライマー17(配列番号34)からなるプライマーセットを用いてPCR反応を実施し、約300bpのDNA断片を増幅した。得られた約300bpのDNA断片について、iSeq100システム(Illmina社)により次世代シーケンス解析を行い、ゲノム編集の有無を検出した。
<AalCas9用>
・プライマー14(配列番号31)
5’-TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGGGAAAAGAATCATATGGTCATCAATTCG-3’
・プライマー15(配列番号32)
5’-GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGCGGACTTGAATTAAAGGGGCTATAGTAG-3’
<SpyCas9用>
・プライマー16(配列番号33)
5’-TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGGCAAATAATTAAAGTTGTTGCTGTTGG-3’
・プライマー17(配列番号34)
5’-GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGTAGCCTACTTGCCTGCTTTTC-3’
 図6A及びBは、AalCas9によるシロイヌナズナプロトプラスト細胞のゲノムDNA編集結果を示す図である。図6Aは、標的DNA毎の編集率を、図6Bは、次世代シーケンサーによる変異DNAをそれぞれ示している。
 これらの結果によれば、AalCas9によるシロイヌナズナ細胞のゲノムDNA編集によれば、標的遺伝子においてヌクレオチドの短~長領域での欠失及び挿入が検出された。AalCas9による細胞当たりの変異率は25.6%であり、SpyCas9の場合よりも優れていた。
[実施例5]アグロバクテリウム法によるAalCas9を用いたシロイヌナズナ植物体のゲノム編集
(1)バイナリーベクターの構築
 ヒトコドンについて最適化されたAalCas9遺伝子(配列番号5)に、N末端核移行シグナル配列(配列番号35)及びC末端核移行シグナル配列(配列番号36)を付加した配列を、RPS5aプロモーター配列並びにHSPターミネーター配列及びPea3ターミネーター配列で発現制御されるバイナリーベクター(pCA)に公知の手法で組み込み、pCA-NLS-AalCas9-NLSを作製した。
 次に、ターゲット配列を導入しやすく設計したシロイヌナズナ変異導入用のAalCas9のsgRNAにシロイヌナズナU6プロモーター配列を付加した配列(配列番号37)を、pCA-NLS-AalCas9-NLSに公知の手法で組み込むことにより、pCA-NLS-AalCas9-NLS-U6-Bsa1-gRNAを作製した。このpCA-NLS-AalCas9-NLS-U6-Bsa1-gRNAをBsa1で切断した断片に、シロイヌナズナ由来PDS3遺伝子配列の一部(5’-TCGTGAAGTAGAGAAACAGG-3’)及びその相補配列を含む5’末端をリン酸化した以下のオリゴヌクレオチドG(配列番号38)およびオリゴヌクレオチドH(配列番号39)をアニーリングした2本鎖DNAフラグメントを混合しライゲーションした。
・オリゴヌクレオチドG(配列番号38):
5’-pATTGTCGTGAAGTAGAGAAACAGG-3’
・オリゴヌクレオチドH(配列番号39):
5’-pAAACCCTGTTTCTCTACTTCACGA-3’
 得られたライゲーション溶液で大腸菌DH5αを形質転換し、50μg/mLスペクチノマイシンを含むLB寒天プレート上で選抜した後、目的の組み換えプラスミドを有するクローンからプラスミドを精製した(pCA-NLS-AalCas9-NLS-U6-PDS3-gRNA)。
(2)フローラルディップ法を用いたpCA-NLS-AalCas9-NLS-U6-PDS3-gRNによるシロイヌナズナの形質転換
 上記(1)で作製したpCA-NLS-AalCas9-NLS-U6-PDS3-gRNAを、公知(Koncz et al, Mol. Gen. Genet., (1986), 204:383-396参照)のアグロバクテリウム・ツメファシエンス(Agrobacterium tumefaciens)GV3101 (C58C1 Rifr) pMP90 (Gmr)株に対して、エレクトロポレーション法で導入した。得られた菌を、20mLの抗生物質(50μg/mLスペクチノマイシン、25μg/mLゲンタマイシン、及び50μg/mLリファンピシリン)を含むLB培地で2日間培養し、菌体を回収し、30mLの浸潤培地(Infiltration medium)に懸濁した。
 シロイヌナズナ野生株Col-0を45~60日間育てて花を咲かせ、主茎を切った後にさらに10日間育ててから形質転換に用いた。形質転換は、前記の形質転換用ベクターを導入した菌体を懸濁させた浸潤培地をシロイヌナズナに滴下して感染させ、通常通り育成しT1種子を収穫した。その後、T1種子を50%ブリーチ、0.02%Triton X-100溶液で7分間滅菌し、滅菌水で3回リンスし、25μg/mLのハイグロマイシンを含むMS選択培地に播種した。
(3)ゲノムDNAのNGS解析
 上記(2)で2週間選抜したシロイヌナズナ個体から葉を回収し、ゲノム抽出バッファー(200mM Tris-HCl(pH7.5)、250mM NaCl、25 mM EDTA、0.5% SDS)と混合後、シェイクマスター(バイオメディカルサイエンス社製)で破砕し、イソプロパノール沈殿によりゲノムDNAを回収した。回収したゲノムDNAを滅菌水で懸濁し、以下のプライマー14(配列番号31)およびプライマー15(配列番号32)からなるプライマーセットを使用して増幅した約300bpのDNA断片を、iSeq100システム(Illmina社)によりNGS解析を行い、ゲノム編集を検出した。
・プライマー14(配列番号31)
5’-TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGGGAAAAGAATCATATGGTCATCAATTCG-3’
・プライマー15(配列番号32)
5’-GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGCGGACTTGAATTAAAGGGGCTATAGTAG-3’
 図7は、上記手順によりpCA-NLS-AalCas9-NLS-U6-PDS3-gRNAで形質転換したシロイヌナズナT1個体の葉のゲノムDNA分析の結果、各T1個体番号において検出されたPDS3遺伝子の各塩基の編集効率(最大値1)を示す図である。これらの結果によれば、AalCas9によるシロイヌナズナ植物体のゲノムDNA編集により、標的遺伝子においてヌクレオチドの欠失及び挿入がホモで導入されたゲノム編集個体が高効率で確認できた。
[実施例6]AalCas9を用いたヒト培養細胞のゲノム編集
(1)ベクターの構築
 ヒトコドンについて最適化されたAalCas9遺伝子(配列番号5)に、N末端核移行シグナル配列(配列番号35)及びC末端核移行シグナル配列(配列番号36)を付加した配列を、CMVプロモーター配列及びBGH polyA配列で発現制御されるプラスミド(pCMV)に公知の手法で組み込みpCMV-NLS-AalCas9-NLSを作製した。
 次に、ターゲット配列を導入しやすく設計したAalCas9のsgRNAにヒト由来U6プロモーター配列を付加した配列(配列番号40)を、pCMV-NLS-AalCas9-NLSに公知の手法で組み込みpCMV-NLS-AalCas9-NLS-U6-Bbs1-gRNAを作製した。作製したpCMV-NLS-AalCas9-NLS-U6-Bbs1-gRNAをBbs1で切断した断片に、ヒト由来AAVS1遺伝子配列の一部を含む5’末端をリン酸化した以下のオリゴヌクレオチドI(配列番号41)およびオリゴヌクレオチドJ(配列番号42)をアニーリングした2本鎖DNAフラグメントを混合しライゲーションした。
・オリゴヌクレオチドI(配列番号41):
5’-pCACCCTGCAGCACCAGGATCAGTG-3’
・オリゴヌクレオチドJ(配列番号42):
5’-pAAACCACTGATCCTGGTGCTGCAG-3’
 得られたライゲーション溶液で大腸菌DH5αを形質転換し、100μg/mLアンピシリンを含むLB寒天プレート上で選抜後、目的の組み換えプラスミドを有するクローンからプラスミドを精製した(pCMV-NLS-AalCas9-NLS-U6-hAAVS1-gRNA)。
(2)ヒト培養細胞へのAalCas9発現ベクターの導入
 上記(1)で作製したpCMV-NLS-AalCas9-NLS-U6-hAAVS1-gRNAをリポフェクタミン3000(サーモフィッシャーサイエンティフィック社)と混合し、96穴プレートで培養したHEK293FT細胞(約10細胞)へトランスフェクションし、3日間培養した。トランスフェクションしたHEK293FT細胞を回収し、0.1N NaOHと混合することで細胞を破砕した。
(3)ゲノムDNAのNGS解析
 上記で培養したHEK293FT細胞を回収し、0.1N NaOHと混合することで細胞を破砕し、破砕液の一部と以下のプライマー18(配列番号43)およびプライマー19(配列番号44)からなるプライマーセットを使用して増幅した約300bpのDNA断片を、iSeq100システム(Illmina社)によりNGS解析を行い、標的配列の欠失によるゲノム編集を検出した。
・プライマー18(配列番号43):
5’-TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGAAACTGCTTCTCCTCTTGGGA-3’
・プライマー19(配列番号44):
5’-GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGCAGATTCCTTATCTGGTGACACA-3’
 図8は、上記手順によりpCMV-NLS-AalCas9-NLS-U6-hAAVS1-gRNAで形質転換したHEK293FT細胞のゲノムDNAと元のヒトゲノムhAAVS1遺伝子の配列とを比較した結果、検出されたゲノムDNA配列(read数)及び編集割合(=編集が検出されたDNA数/分析した全DNA数)を示す図である。これらの結果によれば、AalCas9によるヒト培養細胞のゲノムDNA編集により、標的遺伝子のgRNA結合部位においてヌクレオチドの欠失が検出された。
 本発明のアビシコッカス・アルバス由来Cas9はゲノム変種が関与する農業、医薬産業、酵素産業等の種々の産業分野に幅広く利用可能である。

Claims (13)

  1.  真核細胞のゲノム内の標的DNA配列を部位特異的に改変するための方法であって、
    前記真核細胞中に、
    (1)配列番号1に記載の塩基配列5’-NNACNN-3’(ここで「N」は各々、アデニン、シトシン、チミン、およびグアニンから独立して選択される任意の1塩基を意味する。)を含むPAM(プロトスペーサー隣接モチーフ)配列を認識するCasタンパク質、または、当該Casタンパク質をコードする核酸、および、
    (2)ゲノム内の前記標的DNA配列にハイブリダイズし得ると共に、前記Casタンパク質と複合体を形成し、前記複合体の前記標的DNA配列への配列特異的結合を指向することが可能なガイドRNA、または、当該ガイドRNAをコードする核酸
    を導入することにより、前記真核細胞のゲノムを前記標的DNA配列において改変することを含む方法。
  2.  前記Casタンパク質が、アビシコッカス(Abyssicoccus)属菌、好ましくはアビシコッカス・アルバス(Abyssicoccus albus)に由来する、請求項1に記載の方法。
  3.  前記Casタンパク質が、核局在化シグナル(NLS)を含む、請求項1または2に記載の方法
  4.  前記Casタンパク質が、配列番号4に記載のアミノ酸配列と80%以上、又は85%以上、又は90%以上、又は92%以上、又は95%以上、又は96%以上、又は97%以上、又は98%以上、又は99%以上の配列相同性を有するアミノ酸配列を含む、請求項1~3の何れか一項に記載の方法。
  5.  前記Casタンパク質が、エンドヌクレアーゼ活性を有する、請求項1~4の何れか一項に記載の方法。
  6.  前記PAM配列が、配列番号2に記載の塩基配列5’-NNACGN-3’または配列番号3に記載の塩基配列5’-NNACAN-3’を含む、請求項1~5の何れか一項に記載の方法。
  7.  前記ガイドRNAが、1本鎖ガイドRNA(sgRNA)であると共に、crRNAおよびtracrRNAを含む、請求項1~6の何れか一項に記載の方法。
  8.  前記crRNAが、標的DNA相補鎖と二本鎖を形成することが可能な15~30ヌクレオチド長のスペーサー配列を含む、請求項7に記載の方法。
  9.  前記crRNAが、12~36ヌクレオチド長のステムループを含む、請求項7又は8に記載の方法。
  10.  前記真核細胞が、動物細胞、植物細胞、又は微生物細胞である、請求項1~9の何れか一項に記載の方法。
  11.  前記Casタンパク質をコードする核酸のヌクレオチド配列が、動物細胞、植物細胞、又は微生物細胞における発現のためにコドン最適化されている、請求項1~10の何れか一項に記載の方法。
  12.  請求項1~11の何れか一項に記載の方法に使用するためのゲノム編集用組成物であって、前記のCasタンパク質、または、当該Casタンパク質をコードする核酸を含む組成物。
  13.  前記のガイドRNA、または、当該ガイドRNAをコードする核酸を更に含む、請求項12に記載の組成物。
PCT/JP2023/033481 2022-10-14 2023-09-14 ゲノム編集方法およびゲノム編集用組成物 WO2024080067A1 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2022165722A JP7353602B1 (ja) 2022-10-14 2022-10-14 ゲノム編集方法およびゲノム編集用組成物
JP2022-165722 2022-10-14

Publications (1)

Publication Number Publication Date
WO2024080067A1 true WO2024080067A1 (ja) 2024-04-18

Family

ID=88198151

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2023/033481 WO2024080067A1 (ja) 2022-10-14 2023-09-14 ゲノム編集方法およびゲノム編集用組成物

Country Status (2)

Country Link
JP (2) JP7353602B1 (ja)
WO (1) WO2024080067A1 (ja)

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
GASIUNAS GIEDRIUS, YOUNG JOSHUA K., KARVELIS TAUTVYDAS, KAZLAUSKAS DARIUS, URBAITIS TOMAS, JASNAUSKAITE MONIKA, GRUSYTE MANTVYDA M: "A catalogue of biochemically diverse CRISPR-Cas9 orthologs", NATURE COMMUNICATIONS, vol. 11, no. 1, 1 December 2020 (2020-12-01), pages 1 - 10, XP055929454, DOI: 10.1038/s41467-020-19344-1 *

Also Published As

Publication number Publication date
JP2024058391A (ja) 2024-04-25
JP7353602B1 (ja) 2023-10-02
JP2024058554A (ja) 2024-04-25

Similar Documents

Publication Publication Date Title
JP7429057B2 (ja) Cas9ターゲッティングをガイドする配列に関する方法および組成物
CN106922154B (zh) 使用空肠弯曲杆菌crispr/cas系统衍生的rna引导的工程化核酸酶的基因编辑
CN113881652B (zh) 新型Cas酶和系统以及应用
KR20180002852A (ko) 가이드 RNA/Cas 엔도뉴클레아제 시스템
KR102626503B1 (ko) 뉴클레오타이드 표적 인식을 이용한 표적 서열 특이적 개변 기술
CN109072207A (zh) 用于修饰靶核酸的改进方法
CN107406858A (zh) 用于指导rna/cas内切核酸酶复合物的调节型表达的组合物和方法
CN110891965A (zh) 植物中使用的抗crispr蛋白的方法和组合物
CN110300802A (zh) 用于动物胚胎碱基编辑的组合物和碱基编辑方法
CN110699407B (zh) 一种长单链dna的制备方法
JP2022511508A (ja) ゲノム編集による遺伝子サイレンシング
EP4159853A1 (en) Genome editing system and method
US20220298494A1 (en) Enzymes with ruvc domains
WO2023098485A1 (zh) 一种基于c2c9核酸酶的新型基因组编辑系统及其应用
CN113166768A (zh) 用于真核宿主中真核mRNA生产、输出和翻译的工程细菌系统和方法
AU2021333586A1 (en) Systems and methods for transposing cargo nucleotide sequences
WO2021226369A1 (en) Enzymes with ruvc domains
WO2024080067A1 (ja) ゲノム編集方法およびゲノム編集用組成物
US20240247255A1 (en) Methods for modulating cas-effector activity
US20220333129A1 (en) A nucleic acid delivery vector comprising a circular single stranded polynucleotide
KR20220066111A (ko) Dna 염기 편집을 위한 방법 및 조성물
WO2024156085A1 (en) Mb2cas12a variants with enhanced efficiency
JP4336770B2 (ja) 致死遺伝子を用いた形質転換体選択用マーカー
WO2024158857A2 (en) Mb2cas12a variants with flexible pam spectrum
GB2617659A (en) Enzymes with RUVC domains

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 23877073

Country of ref document: EP

Kind code of ref document: A1