WO2022050377A1 - 標的dnaの編集方法、標的dnaが編集された細胞の製造方法、及びそれらに用いるdna編集システム - Google Patents

標的dnaの編集方法、標的dnaが編集された細胞の製造方法、及びそれらに用いるdna編集システム Download PDF

Info

Publication number
WO2022050377A1
WO2022050377A1 PCT/JP2021/032436 JP2021032436W WO2022050377A1 WO 2022050377 A1 WO2022050377 A1 WO 2022050377A1 JP 2021032436 W JP2021032436 W JP 2021032436W WO 2022050377 A1 WO2022050377 A1 WO 2022050377A1
Authority
WO
WIPO (PCT)
Prior art keywords
tale
sequence
target
dna
deaminase
Prior art date
Application number
PCT/JP2021/032436
Other languages
English (en)
French (fr)
Inventor
哲史 佐久間
卓 山本
奈穂子 西堀
忠彦 吉間
一彦 堀込
Original Assignee
国立大学法人広島大学
住友化学株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 国立大学法人広島大学, 住友化学株式会社 filed Critical 国立大学法人広島大学
Priority to EP21864429.2A priority Critical patent/EP4209588A1/en
Priority to JP2022546983A priority patent/JPWO2022050377A1/ja
Priority to US18/043,814 priority patent/US20230340455A1/en
Priority to AU2021338062A priority patent/AU2021338062A1/en
Priority to KR1020237010913A priority patent/KR20230058482A/ko
Priority to CN202180054310.XA priority patent/CN116157517A/zh
Publication of WO2022050377A1 publication Critical patent/WO2022050377A1/ja

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/78Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/80Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/111General methods applicable to biologically active non-coding nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]

Definitions

  • the present invention relates to a method for editing a target DNA, a method for producing a cell in which the target DNA has been edited, and a DNA editing system used for them. It relates to a method for producing cells and a combination used for them.
  • Non-Patent Document 1 A base editing method combining CRISPR-dCas9 / nCas9 with a nucleobase converting enzyme such as deaminase was first reported in 2016 ( Komor, A. et al., Nature 533,420-424 (2016), DOI: 10). Since 1038 / nature17946 (Non-Patent Document 1)), its use has spread rapidly due to its high editing efficiency and simplicity that does not require donor DNA, and examples in various organisms and cells have been reported. At the same time, many improved systems have been developed (Rees, HA and Liu, DR, Nat Rev Genet 19,770-788 (2016), DOI: 10.1038 / s41576-018-0059- 1 (Non-Patent Document 2), etc.).
  • Non-Patent Document 4 et al., Science 353, aaf8729 (2016), DOI: 10.1126 / science.aaf8729 (Non-Patent Document 4) is often used.
  • APOBEC3A, APOBEC3B, etc. can be used (Gehrke, J. et al., Nat Biotechnol 36, 977-982 (2016), DOI: 10.1038 / nbt.4199 (Non-patent document). 5); Martin, AS et al., Sci Rep 9,497 (2019), DOI: 10.1038 / s41598-018-36739-9 (Non-Patent Document 6)).
  • ABE Adenine Base Editor
  • Non-Patent Document 8 DNA-binding proteins such as ZF and TALE do not have the property of dissociating double-stranded DNA into single strands. The efficiency of base editing by the substrate deaminase is extremely low.
  • Patent Document 1 the efficiency of base editing by the system described in Patent Document 1 is about 1/3 of that of BE3 (Non-Patent Document 1), which is a conventional base editing system, even if the efficiency is the highest. It was considered that the decrease in activity was caused by.
  • the present invention has been made in view of the above-mentioned problems of the prior art, and is a method capable of specifically and efficiently editing a target DNA by a nucleobase converting enzyme, and genome editing is performed using the method. It is an object of the present invention to provide a method for producing cells and a DNA editing system used for them.
  • the present inventors have fused the nucleobase converting enzyme into TALE without converting it into a split, and the TALE-nucleobase converting enzyme fusion protein (preferably TALE-deaminase).
  • TALE-nucleobase converting enzyme fusion protein preferably TALE-deaminase
  • -UGI fusion protein dCas9 / guide RNA complex or nCas9 / guide RNA complex were both bound in the vicinity of the target site of the target DNA.
  • the structure that does not split the nucleobase converting enzyme is based on the previously reported highly active system AncBE4max, for example, in the case of deaminase, but this is not directly linked to dCas9 or nCas9, but is linked to TALE.
  • the present inventors have a spacer 1 between the TALE recognition sequence (or its complementary sequence) and the target site on the target DNA. And by examining the position of the RNA target sequence on the target DNA, it was demonstrated that the base editing efficiency equivalent to that of the conventional AncBE4max system could be achieved (maximum activity by the reporter assay), and the present invention was completed.
  • the aspects of the present invention obtained from such findings are as follows.
  • the TALE recognition sequence or its complementary sequence recognized by TALE in the fusion protein is present on the 5'side of the target site via a spacer 1 having a chain length of 7 to 31 bp, and
  • the guide RNA target sequence recognized by the guide RNA in the CRISPR-Cas9 system is present to contain the complementary base of the target site.
  • [2] A method of producing cells in which the target DNA has been edited.
  • Fusion proteins containing TALE and nucleobase converting enzymes and (2)
  • a CRISPR-Cas9 system containing a Cas9 protein having lost part or all of its nuclease activity and its guide RNA is introduced into a cell or expressed intracellularly and brought into contact with a target DNA to convert the nucleobase of the fusion protein. It comprises the step of editing the base of the target site of the target DNA by enzymatic activity.
  • the TALE recognition sequence or its complementary sequence recognized by TALE in the fusion protein is present on the 5'side of the target site via a spacer 1 having a chain length of 7 to 31 bp, and
  • the guide RNA target sequence recognized by the guide RNA in the CRISPR-Cas9 system is present to contain the complementary base of the target site.
  • nucleobase converting enzyme in the fusion protein is deaminase.
  • a DNA editing system for use in the method according to any one of [1] to [6].
  • Fusion proteins containing TALE and nucleobase converting enzymes and (2) A DNA editing system comprising a CRISPR-Cas9 system comprising a Cas9 protein having lost some or all of its nuclease activity and a guide RNA thereof.
  • nucleobase converting enzyme in the fusion protein is deaminase.
  • a method capable of specifically and efficiently editing a target DNA by a nucleobase converting enzyme, a method for producing a genome-edited cell using the method, and DNA editing used for them It becomes possible to provide a system.
  • TALE-deaminase activity value (ratio to the AncBE4max activity value) obtained in Test 4 and the length of linker 1.
  • It is a schematic diagram of the structure of NanoLuc expression reporter and one aspect of base editing by TALE-deaminase. It is a conceptual diagram which shows one aspect (A, B) of the structure of TALE-deaminase respectively.
  • It is a graph which shows the TALE-deaminase activity value (ratio to the AncBE4max activity value) obtained in test 5 ((A) BE4-TALE-WT: BE4-32-WT, BE4-135-WT, BE4-234-WT.
  • BE4-TALE-63 BE4-32-63, BE4-135-63, BE4-234-63). It is a graph which shows the TALE-deaminase activity value (the ratio to the AncBE4max activity value or the ABE8e activity value) obtained in the test 5 ((C) BE4-TALE-47: BE4-32-47, BE4-135-47, BE4 -234-47, (D) ABE8e-TALE-47: ABE8e-32-47, ABE8e-135-47, ABE8e-234-47).
  • Target region (AS5 (d), AS14 (e), AS6 (f), AS7 (g)) on endogenous DNA (CCR5, HBB), position of TALE recognition sequence and its complementary sequence, target sequence of guide RNA
  • A 1st base
  • B 10th base
  • sgRNA-AS3 11 of the complementary sequence of the target sequence of the guide RNA
  • the target DNA editing method of the present invention is It is a method of editing the target DNA, (1) Fusion proteins containing TALE and nucleobase converting enzymes, and (2) A CRISPR-Cas9 system containing a Cas9 protein having lost part or all of its nuclease activity and its guide RNA is brought into contact with the target DNA, and the nucleobase converting enzyme activity of the fusion protein causes the target site of the target DNA to be contacted.
  • the TALE recognition sequence or its complementary sequence recognized by TALE in the fusion protein is present on the 5'side of the target site via a spacer 1 having a chain length of 7 to 31 bp, and
  • the guide RNA target sequence recognized by the guide RNA in the CRISPR-Cas9 system is present to contain the complementary base of the target site.
  • the fusion protein according to the present invention is a fusion protein containing TALE and a nucleobase converting enzyme.
  • the fusion protein according to the present invention is, in some cases, referred to as "TALE-nucleobase converting enzyme fusion protein" or "TALE-nucleobase converting enzyme”.
  • the fusion protein may be bound in the order of TALE and nucleobase converting enzyme from the N-terminal, or may be bound in the order of nucleobase converting enzyme and TALE.
  • the fusion protein according to the present invention may contain two or more (preferably two) nucleobase converting enzymes, and in this case, the nucleobase converting enzyme may contain only one type or two types.
  • the fusion protein according to the present invention contains two nucleobase converting enzymes (first nucleobase converting enzyme, second nucleobase converting enzyme), these are the first nucleobase converting enzyme, TALE, the first. It may be bound in the order of 2 nucleobase converting enzymes. Among these, the fusion protein according to the present invention is preferably bound in the order of TALE and nucleobase converting enzyme from the N-terminal, or in the order of nucleic acid-based converting enzyme and TALE from the N-terminal.
  • TALE Transcription Activator-Like Effector
  • the "TALE” according to the present invention includes at least an N-terminal domain and a TALE repeat domain, and may further include a C-terminal domain.
  • the TALE repeat domain is composed of a plurality of TALE sequences forming a right-handed supercoil, for example, 10 to 30, preferably 13 to 25, and more preferably 15 to 20 tandem repeats (TALE repeats).
  • a typical TALE repeat unit (one TALE sequence) consists of 33 to 35 amino acids, and the DNA is identified by a variable residue (repeat variable awareness: RVD) consisting of the 12th and 13th amino acid residues. Recognize the base of. Examples of RVDs that specifically recognize bases include HD that recognizes C, NG that recognizes T, NI that recognizes A, G, or NN that recognizes A, and recognizes A, C, G, or T. NS and the like can be mentioned.
  • RVD receat variable awareness
  • the TALE sequence of TALE according to the present invention may be appropriately modified with respect to the natural amino acid sequence as long as the TALE repeat domain can recognize and bind to the TALE recognition sequence. ..
  • one or more amino acid residues other than RVD for example, 10 or less, 9 or less, 8 or less, 7) 4 or less, 6 or less, preferably 5 or less or 4 or less, more preferably 3 or less or 2 or less
  • Substitution, insertion, and / or deletion may be performed, and the 12th RVD.
  • the 13th 2 amino acid residue may be replaced with another amino acid residue in order to enhance the specificity for A, T, C and G.
  • the TALE repeat domain of TALE recognizes a base sequence or a complementary sequence thereof existing on the 5'side of the target site of the target DNA via a spacer 1 having a chain length of 7 to 31 bp.
  • the TALE recognition sequence recognized by TALE or its complementary sequence is designed to be a base sequence existing on the 5'side of the target site via a spacer 1 having a chain length of 7 to 31 bp.
  • Techniques for designing and producing such desired TALE are known (eg, Miller et al., Nat. Biotechnol., 29, 143-148 (2011); Sakuma et al., Scientific Rep., 3: 3379 (2013)), for example, Sakuma et al.
  • TALE having high binding activity to the base sequence can be produced.
  • a natural amino acid sequence for example, the amino acid sequence of the N-terminal domain contained in pTALETF_v2 (ID: 32185 to 32188) of Addgene
  • the present invention can be used.
  • the natural amino acid sequence may be appropriately modified. ..
  • one or more for example, 50 or less, 30 or less, 20 or less, 10 or less, 9 or less, 8 or less, 7 or less, 6 or less, preferably 5 or less or 4).
  • 3 or less or 2 or less amino acid residues may be substituted, inserted, and / or deleted. It may also contain a flag tag for purification or detection, a nuclear localization signal (NLS) for translocating a TALE-nucleobase converting enzyme to the cell nucleus, and the like.
  • NLS nuclear localization signal
  • the chain length of the N-terminal domain is preferably 49 to 287 amino acid residues, more preferably 80 to 200 amino acid residues, and 120 to 180 amino acid residues. Is even more preferable. If the chain length of the N-terminal domain is less than the lower limit, it tends to be unable to bind to the target DNA, while if it exceeds the upper limit, the expression efficiency of the fusion protein tends to decrease.
  • N-terminal domain of TALE include, for example, the amino acid sequence of the N-terminal domain contained in Addgene's ptCMV-136 / 63-VR-HD (ID: 50699) and Addgene's ptCMV-153 /. Examples thereof include, but are not limited to, the amino acid sequence of the N-terminal domain contained in 47-VR-HD (ID: 50703).
  • the amino acid sequence of the C-terminal domain contained in the natural amino acid sequence is also used as the C-terminal domain of the TALE.
  • the amino acid sequence of the C-terminal domain contained in the natural amino acid sequence is also used as the C-terminal domain of the TALE.
  • the above-mentioned natural amino acid sequence can be used. , May be appropriately modified.
  • one or more for example, 50 or less, 30 or less, 20 or less, 10 or less, 9 or less, 8 or less, 7 or less, 6 or less, preferably 5 or less or 4).
  • more preferably, 3 or less or 2 or less amino acid residues may be substituted, inserted, and / or deleted.
  • the C-terminal domain of the TALE may be a natural amino acid sequence in which a part of the amino acid sequence on the C-terminal side is removed.
  • the chain length of the C-terminal domain is preferably 1 to 180 amino acid residues, more preferably 20 to 100 amino acid residues, and 40 to 70 amino acid residues. Is even more preferable.
  • the chain length of the C-terminal domain exceeds the upper limit, the expression efficiency of the fusion protein tends to decrease when the fusion protein is expressed.
  • pTALETF_v2 32185 to 32188
  • pTALEN_v2 ID: 32189 to 32192
  • the nucleic acid base converting enzyme is a target without breaking the DNA strand by catalyzing a reaction of converting or dropping a substituent on the purine or pyrimidine ring of a DNA base to another group or atom.
  • the nucleobase converting enzyme is not particularly limited as long as it can catalyze the above reaction, and examples thereof include deaminase and glycosylase, and even if only one of these is used, two or more of them may be used. It may be a combination. Among these, deaminase is preferable as the nucleobase converting enzyme according to the present invention.
  • the deaminase is an enzyme that catalyzes a deamination reaction that converts an amino group of a base into a carbonyl group, and belongs to the nucleic acid / nucleotide deaminase superfamily.
  • Examples of such deaminase include cytosine deaminase capable of converting cytosine or 5-methylcytosine to uracil or thymine, adenosine deaminase capable of converting adenine to hypoxanthine, and guanosine deaminase capable of converting guanine to xanthine. It can be used properly according to the base substitution of.
  • the origin of the deaminase is not particularly limited, and examples thereof include lamprey; mammals such as humans, monkeys, pigs, cows, horses, rats, and mice.
  • cytidine deaminase for example, APOBEC (rAPOBEC1 derived from rat, hAPOBEC1, hAPOBEC2, hAPOBEC3 (hAPOBEC3A, 3B, 3C, 3D (3E), 3F, 3G, 3H), hAPOBEC4, etc. derived from human).
  • Anc689 which is an ancestral amino acid sequence of APOBEC; AID (Activation-induced cytidine deaminase (AICDA)) derived from mammals (eg, humans, pigs, cows, horses, monkeys, etc.); PmCDA1 derived from AID and lamprey.
  • AICDA Activity-induced cytidine deaminase
  • adenosine deaminase 1 (Petromyzon marinus cytosine deaminase 1) can be mentioned.
  • TadA derived from Escherichia coli
  • Each of the above deaminase contains a variant thereof (for example, TadA-8e, TadA7.10, and variants thereof, etc.).
  • the deaminase is preferably at least one selected from the group consisting of APOBEC, PmCDA1, Anc689, and TadA (each containing a variant thereof).
  • the fusion protein according to the present invention contains two or more deaminase
  • these combinations can be appropriately selected depending on the desired base substitution, for example, the same or different combination of cytidine deaminase, the same or different adenosine deaminase.
  • the combination of TadA and PmCDA1 is preferable as the combination of deaminase.
  • the base sequence and amino acid sequence of these deaminase are known and can be obtained from a public database (Genbank or the like).
  • deaminase activity As long as the deaminase has deamination activity (deaminase activity), it is modified (for example, substitution, insertion, and / or lack of amino acid residues) based on the base sequence and amino acid sequence of these known deaminase. It may be the one that has been introduced).
  • the presence or absence of deaminase activity can be confirmed by appropriately using a known method.
  • cytidine deaminase can be confirmed by performing an enzymatic reaction using cytidine as a substrate and detecting and quantifying uridine, which is a metabolite of cytidine.
  • the fusion protein according to the present invention preferably further contains linker 1.
  • linker 1 in the fusion protein according to the present invention, TALE and the nucleobase converting enzyme are linked by linker 1.
  • the number of linkers 1 is plural.
  • the fusion protein according to the present invention contains a plurality of linkers 1, these may be only one kind or a combination of two or more kinds.
  • the chain length of the linker 1 is not particularly limited, but is preferably 1 to 450 amino acid residues, and more preferably 5 to 250 amino acid residues. It is preferably 5 to 200 amino acid residues, more preferably 12 to 150 amino acid residues, and even more preferably 12 to 104 amino acid residues.
  • the chain length of the linker 1 exceeds the upper limit, the expression efficiency of the fusion protein tends to decrease when the fusion protein is expressed.
  • linker 1 for example, Yang L et al. , Nat Commun 7 13330 (2016), and Nishida, K. et al. et al. , Science 353, aaf8729 (2016), 104 amino acids, Kobran, L. et al. et al. , Nat Biotechnology 36, p. 843-846 (2016), 32 amino acids, Sun, N. et al. And Zhao, H. , Mol BioSystem 10, p. 446-453 (2014), Doi: 10.1039 / c3mb70412b), and examples thereof include, but are not limited to, the HTS95 amino acid sequence (95 amino acids) and its repetition.
  • the fusion protein of the present invention when the nucleobase converting enzyme is located on the C-terminal side of TALE, the TALE repeat domain and the nucleobase converting enzyme are separated from each other by 1 to 630 amino acid residues. Is preferable. Therefore, the fusion protein of the present invention preferably contains at least one of the C-terminal domain of TALE and linker 1.
  • the chain length between the TALE repeat domain and the nucleic acid-based converting enzyme (the amino acid residue adjacent to the C-terminal side of the C-terminal of the TALE repeat domain is set as the first residue, and the N-terminal of the nucleic acid-based converting enzyme is used as the first residue.
  • the number of amino acid residues up to the residue adjacent to the N-terminal side is more preferably 25 to 300 amino acid residues, and even more preferably 52 to 174 amino acid residues. If the chain length is less than the lower limit, the efficiency of base editing tends to decrease, while if the chain length exceeds the upper limit, the expression efficiency tends to decrease when the fusion protein is expressed.
  • the C-terminal residue of the TALE repeat domain is a TALE sequence (preferably N-terminal) located immediately before (N-terminal) the truncated last half-repeat (LHR) located on the C-terminal side of the TALE repeat domain.
  • LHR truncated last half-repeat
  • the N-terminal residue of the nucleobase converting enzyme is a typical amino acid sequence of a nucleobase converting enzyme that can be obtained from a known database (for example, NCBI) and a known method (for example, BLAST (NCBI)). It can be the starting residue (usually methionine) of an amino acid sequence having an identity of 85% or more (preferably 90% or more) in the homology search used.
  • the fusion protein according to the present invention further includes the C-terminal side, that is, the C-terminal of the nucleobase-converting enzyme (when the nucleobase-converting enzyme is located on the C-terminal side of TALE) or the C-terminal of TALE (the nucleobase).
  • the converting enzyme is located only on the N-terminal side of TALE
  • the number of the base excision repair inhibitor may be one per the fusion protein, or may be two or more (preferably two) via the linker 2. Further, in the case of a plurality of types, only one type or a combination of two or more types may be used, but one type is preferable.
  • the base excision repair inhibitor according to the present invention is not particularly limited as long as it inhibits base excision repair, but a DNA glycosylase inhibitor is preferable.
  • the DNA glycosylase inhibitor include a thymine DNA glycosylase inhibitor, a uracil DNA glycosylase inhibitor, an oxoguanine DNA glycosylase inhibitor, and an alkylguanine DNA glycosylase inhibitor.
  • a uracil DNA glycosylase inhibitor UGI
  • the presence of deaminase and UGI on one polypeptide further improves the efficiency of base editing.
  • uracil DNA glycosylase inhibitor examples include a uracil DNA glycosylase inhibitor (UGI) derived from PBS1 which is a Bacillus subtilis bacteriophage or a uracil DNA glycosylase inhibitor derived from PBS2 which is a Bacillus subtilis bacteriophage (Bacillus subtilis). UGI), but is not limited to these.
  • UGI uracil DNA glycosylase inhibitor
  • base sequences and amino acid sequences are known and can be obtained from public databases (Genbank, etc.).
  • the base excision repair inhibitor according to the present invention is modified (for example, substitution of amino acid residues) based on the base sequence and amino acid sequence of a known base excision repair inhibitor as long as it has the repair inhibitory activity of the above DNA mismatch. , Insertion, and / or introduction of deletion).
  • the fusion protein according to the present invention further contains the base excision repair inhibitor and there are a plurality of the base excision repair inhibitors
  • the fusion protein-linker 2-first base excision repair inhibitor-linker 2- can be linked via the linker 2 as in the second base excision repair inhibitor.
  • the plurality of linkers 2 at this time may be only one type or a combination of two or more types, but one type is preferable.
  • the linker 2 is not particularly limited, but the chain length is preferably 1 to 50 amino acid residues, more preferably 5 to 30 amino acid residues, and 8 to 15 amino acid residues. Is even more preferable. If the chain length of the linker 2 is less than the lower limit, the functionality of the base excision repair inhibitor tends to decrease, while if it exceeds the upper limit, the expression efficiency of the fusion protein decreases. There is a tendency.
  • linker 2 examples include, but are not limited to, the 10 amino acids described in pCMV_AncBE4max_P2A_GFP (ID: 112100) of Addgene.
  • the fusion protein according to the present invention includes a flag tag for purification and detection at the N-terminal and / or C-terminal, a nuclear localization signal (NLS) for transferring TALE-nucleobase converting enzyme to the cell nucleus, and the like. These may be contained in the N-terminal domain of TALE as described above, or may be added to the N-terminal and / or C-terminal of the fusion protein.
  • NLS nuclear localization signal
  • the fusion protein according to the present invention is, for example, transcribed and expressed as a whole with the above-mentioned TALE and nucleobase converting enzyme, and, if necessary, the linker 1, the base excision repair inhibitor, the linker 2, and other amino acid-encoding genes. It can be obtained by letting it. Further, the fusion protein according to the present invention can be produced by appropriately adopting and improving a conventionally known method, for example, a method of chemically synthesizing based on the amino acid sequence by a commercially available synthesizer, or the following.
  • the method for producing a cell in which the target DNA of the above is edited it can be obtained by a method of introducing a polynucleotide encoding a fusion protein or a vector expressing the fusion protein into the cell and expressing it.
  • the CRISPR-Cas9 system contains a Cas9 protein in which some or all of the nuclease activity is lost and a guide RNA thereof.
  • the Cas9 protein is a Cas9 protein that has lost a part of nuclease activity (referred to as “nCas9” in the present specification) or a Cas9 protein that has lost all of the nuclease activity. (In this specification, it is referred to as "dCas9”). That is, the Cas9 protein typically contains a domain involved in the cleavage of the target chain (RuvC domain) and a domain involved in the cleavage of the non-target chain (HNH domain), but the Cas9 protein according to the present invention includes. It is necessary that the nuclease activity of at least one domain is lost due to the introduction of a mutation or the like.
  • SpCas9 protein (Cas9 protein derived from S. pyogenes)
  • a mutation of the 10th amino acid (aspartic acid) from the N-terminal to alanin (D10A: mutation in the RuvC domain) for example, a mutation of the 10th amino acid (aspartic acid) from the N-terminal to alanin (D10A: mutation in the RuvC domain).
  • the amino acid sequence and base sequence of the Cas9 protein are registered in a public database, for example, Genbank (http://www.ncbi.nlm.nih.gov) (for example, accession number: KX151730.1). Etc.), these can be used in the present invention.
  • the Cas9 protein may be introduced with further mutations, for example, mutations for modifying the recognition of PAM sequences (Benjamin, P. et al., Nature 523, 481-485 (2015); Hirano). , S. et al., Molecular Cell 61, 886-894 (2016)), and a nuclear localization signal (NLS) for translocating to the cell nucleus may be added.
  • such a Cas9 protein may be one encoded by a sequence contained in a commercially available plasmid.
  • the following guide RNA is designed so that the guide RNA target sequence contains a complementary base at the target site of the target DNA.
  • the complementary base of the target site of the target DNA refers to the complementary base of the target site 1 base on the complementary strand of the strand in which the target site is present.
  • the guide RNA is a crRNA containing a base sequence (hereinafter, sometimes referred to as "targeted base sequence") complementary to a sequence on the target DNA (guide RNA target sequence). It is a combination of CRISPR RNA) and tracrRNA (trans-activating crRNA).
  • the crRNA further contains a base sequence capable of interacting (hybridizing) with tracrRNA on the 3'side.
  • tracrRNA contains a base sequence capable of interacting (hybridizing) with a part of the base sequence of crRNA on the 5'side, the guide RNA interacts with Cas9 protein by the interaction of these base sequences.
  • the guide RNA recognizes and binds to the guide RNA target sequence of the target DNA, induces the Cas9 protein forming a complex with the guide RNA to the target DNA, and the induced Cas9 protein is the induced Cas9 protein.
  • the helicase activity exposes the single-stranded DNA at the target site of the target DNA.
  • the guide RNA of the CRISPR-Cas9 system may be a single-molecule guide RNA (sgRNA) containing crRNA and tracrRNA, or a double-molecule guide RNA composed of a crRNA fragment and a tracrRNA fragment.
  • sgRNA single-molecule guide RNA
  • the target DNA editing of the base at the target site is performed on the complementarity of base pairing between the target base sequence of the guide RNA and the guide RNA target sequence and on the 3'side of the complementary strand of the guide RNA target sequence. It occurs at a position determined by both the existing PAM sequence and.
  • the guide RNA of the CRISPR-Cas9 system the guide RNA target sequence becomes a sequence containing a complementary base of the target site, and the Cas9 protein can recognize the PAM sequence on the 3'side of the target site. Designed to.
  • the target site is specifically exposed by the helicase activity that exposes the single-stranded DNA, and the editing efficiency by the nucleobase converting enzyme is improved.
  • E-CRISPR http://www.e-crisp.org/E-CRISPR.
  • Zifit Targeter http://zifit.partners.org/ZiFiT/) (Zing Finger Consortium)
  • CRISPRdirect http://crispr.dbcls.jp/) (Tokyo University)
  • CRISPR-P /Cbi.hzau.edu.cn/crispr/) China Agricultural University
  • Guide RNA Target Design Tool It can be determined by using (https://wwws.blueheronbio.com/external/tools/gRNASrc.jsp) (BlueHeronBiotech) and the like.
  • the CRISPR-Cas9 system according to the present invention is, for example, by simultaneously transcribing and expressing the above-mentioned Cas9 protein and the gene encoding the guide RNA, respectively, as described in the following method for producing a cell in which the target DNA is edited.
  • the Cas9 protein and guide RNA according to the present invention can be produced by appropriately adopting and improving conventionally known methods. For example, a polynucleotide encoding them or an expression vector containing the polynucleotide is applied to the cell. It can be obtained by the method of introduction and expression.
  • target DNA the DNA containing the target site to be the target of DNA editing
  • target DNA the DNA containing the target site to be the target of DNA editing
  • the target DNA according to the present invention is a double-stranded DNA, and for convenience, at least one of the strands has a TALE recognition sequence in order from the 5'side in order to show the correspondence with the above fusion protein and the CRISPR-Cas9 system. Or, it is assumed that the structure includes the complementary sequence thereof, the spacer 1, the target site, and the PAM sequence.
  • the inclusion of the complementary sequence of the TALE recognition sequence on the 5'side indicates that the complementary strand of the strand contains the TALE recognition sequence. That is, the TALE recognition sequence may be set on the same strand as the target site or on the complementary strand thereof.
  • the complementary strand of the strand contains a guide RNA target sequence so as to contain the complementary base of the target site.
  • An example of the configuration of the target DNA according to the present invention is shown in FIG. 2 below, but the present invention is not limited thereto.
  • the target site according to the present invention refers to one base targeted for editing by the nucleobase converting enzyme (preferably deamination with deaminase).
  • bases near both sides of the 1 base are further edited (deamination in the case of deaminase).
  • the TALE recognition sequence is a sequence recognized by the TALE.
  • the number of bases in the TALE recognition sequence is 10 to 30 bases, preferably 13 to 25 bases, and more preferably 15 to 20 bases.
  • the TALE recognition sequence is selected to be present on the 5'side of the target site via a spacer 1 having a chain length of 7 to 31 bp. When the chain length of the spacer 1 is within such a range, one base of the target site can be deaminated specifically and with high efficiency.
  • the chain length of the spacer 1 is the length from the base adjacent to the 5'side of the base of the target site to the base adjacent to the 3'side of the TALE recognition sequence as the first base.
  • the chain length of such a spacer 1 is more preferably 10 to 31 bp, further preferably 10 to 28 bp, and even more preferably 13 to 25 bp.
  • the PAM sequence is a sequence recognized by the Cas9 protein.
  • the PAM sequence depends on the type of Cas9 protein used. Typical PAM sequences include, for example, S. cerevisiae.
  • the PAM sequence corresponding to the Cas9 protein (type II) derived from pyogenes is 5'-NGG, and S. streptococcus pyogenes.
  • the PAM sequence corresponding to the Cas9 protein (IA1 type) derived from solfatalicus is 5'-CCN, and S.I.
  • the PAM sequence corresponding to the Cas9 protein (type I-A2) derived from solfatalicus is 5'-TCN, and H.I.
  • the PAM sequence corresponding to the Cas9 protein (type IB) derived from walsbyl is 5'-TTC, and E.I.
  • the PAM sequence corresponding to the Cas9 protein (type IE) derived from colli is 5'-AWG, and E.I.
  • the PAM sequence corresponding to the Cas9 protein (type IF) derived from coli is 5'-CC, and P.I.
  • the PAM sequence corresponding to the Cas9 protein (type IF) derived from aeruginosa is 5'-CC, and S. a.
  • the PAM sequence corresponding to the Cas9 protein (II-A type) derived from Thermophilus is 5'-NNAGAA.
  • the PAM sequence corresponding to the Cas9 protein (type II-A) derived from agalactiae is 5'-NGG, and S. a.
  • the PAM sequence corresponding to the Cas9 protein from aureus is 5'-NGRRT or 5'-NGRRN, N.I.
  • the PAM sequence corresponding to the Cas9 protein from meningitidis is 5'-NNNGATT, T.I.
  • the PAM sequence corresponding to the Cas9 protein from denticola is 5'-NAAAAC.
  • the PAM sequence exists on the 3'side of the target site, and the guide RNA target sequence recognized by the guide RNA is determined according to the position of the PAM sequence.
  • the position of the complementary base of the target site in the guide RNA target sequence is not particularly limited, but is preferably, for example, between the 1st and 50th positions, and the 1st to 30th positions. It is more preferably between 1st and 25th positions.
  • the position of the base in the guide RNA target sequence is the position from the base at the 3'end of the guide RNA target sequence to the complementary base of the base adjacent to the 5'side of the PAM sequence. ..
  • the upper and lower limits of the base position depend on the length of the guide RNA target sequence and can be adjusted by adjusting the length of the guide RNA.
  • the guide RNA target sequence recognized by the guide RNA is selected so as to be a sequence containing a complementary base of the target site. By selecting the position of the guide RNA target sequence in this way, one base of the target site can be edited specifically and with high efficiency.
  • the number of bases in the guide RNA target sequence according to the present invention is preferably 12 to 50 bases, more preferably 17 to 30 bases, and even more preferably 17 to 25 bases.
  • the base sequence of such a target DNA is not particularly limited, and the TALE recognition sequence or its complementary sequence, spacer 1, the complementary sequence of the guide RNA target sequence, the target site contained in the complementary sequence, and the PAM sequence are described above.
  • the targeting base sequences of TALE and guide RNA so as to satisfy the conditions, and modifying the recognition specificity of PAM as necessary, it can be targeted by the DNA editing method of the present invention.
  • the target DNA according to the present invention may be intracellular DNA (endogenous DNA) or extracellular DNA, depending on the purpose.
  • the DNA existing in the cell may be endogenous DNA or extrinsic DNA. Examples of the endogenous DNA include genomic DNA, and examples of the exogenous DNA include DNA introduced into cells.
  • the DNA existing outside the cell may be a DNA derived from a cell or a DNA amplified and synthesized extracellularly.
  • Target DNA editing method In the target DNA editing method of the present invention, the fusion protein and the CRISPR-Cas9 system are brought into contact with the target DNA, and the base of the target site of the target DNA is edited by the nucleobase converting enzyme activity of the fusion protein.
  • the TALE of the fusion protein recognizes and binds to the TALE recognition sequence on the target DNA, and the nucleobase converting enzyme linked to the TALE is attached to the target DNA.
  • the guide RNA of the CRISPR-Cas9 system recognizes and binds to the guide RNA target sequence on the target DNA, and induces the Cas9 protein that forms a complex with the guide RNA to the target DNA.
  • the Cas9 protein exposes the single-stranded DNA at the target site by helicase activity, so that the nucleobase converting enzyme can efficiently cause the substitution of the target base (for example, deamination of the base).
  • This causes a single base substitution at the target site (eg, C ⁇ U), and in cells, for example, due to a double-stranded DNA mismatch, the base on the opposite strand of the substituted strand is paired with the substituted base. It may be repaired to form (eg, G ⁇ A), replaced with another nucleotide during repair (eg, U ⁇ A, G), or result in a deletion or insertion of one or a dozen bases. Thereby, various mutations can be introduced.
  • deletion of one or more nucleotides, substitution with another one or more nucleotides, or 1 in the target site converted by the nucleobase converting enzyme and the vicinity containing the same. Includes the insertion of the above nucleotides or a combination of these mutations.
  • the target DNA editing method of the present invention may be performed intracellularly or in a cell-free system.
  • the "intracellular" field of the target DNA editing method of the present invention may be in eukaryotic cells or prokaryotic cells, preferably in eukaryotic cells.
  • the eukaryotic cell include animal cells (mammalian, fish, birds, reptiles, amphibians, insect cells, etc.), plant cells, algae cells, yeast, and examples of the prokaryotic cells include Escherichia coli. Examples include salmonella, bacillus, lactic acid, and highly thermophilic bacteria.
  • Animal cells include, for example, cells constituting an individual animal, cells constituting an organ / tissue excised from an animal, cultured cells derived from an animal tissue, and the like. Specifically, for example, germ cells such as egg mother cells and sperm; embryo cells of embryos at each stage (for example, 1-cell stage embryo, 2-cell stage embryo, 4-cell stage embryo, 8-cell stage embryo, 16-cell stage). Embryos, mulberry stage embryos, etc.); Stem cells such as induced pluripotent stem (iPS) cells and embryonic stem (ES) cells; fibroblasts, hematopoietic cells, neurons, muscle cells, bone cells, hepatocytes, pancreatic cells , Brain cells, somatic cells such as kidney cells and the like.
  • germ cells such as egg mother cells and sperm
  • embryo cells of embryos at each stage for example, 1-cell stage embryo, 2-cell stage embryo, 4-cell stage embryo, 8-cell stage embryo, 16-cell stage.
  • pre-fertilized and post-fertilized oocytes can be used, but a post-fertilized oocyte, that is, a fertilized egg is preferable.
  • the fertilized egg is from a pronuclear stage embryo. Oocytes can be thawed and used after being cryopreserved.
  • the "plant cell” includes, for example, cells constituting an individual plant, cells constituting an organ or tissue separated from a plant, cultured cells derived from a plant tissue, and the like.
  • plant organs and tissues include leaves, stems, shoot apex (growth point), roots, tubers, callus and the like.
  • the "cell-free system" which is the place of the target DNA editing method of the present invention refers to a system without living cells (the eukaryotic cells and prokaryotic cells).
  • the cell-free system according to the present invention is not particularly limited as long as it is a system in which the fusion protein and the CRISPR-Cas9 system can contact the target DNA, for example, in a buffer; the eukaryotic cell or prokaryote. Examples thereof include the inside of a cell crushed solution and the inside of a cell extract.
  • the method of contacting the fusion protein and the CRISPR-Cas9 system with the target DNA is not particularly limited.
  • the fusion protein and the CRISPR-Cas9 system are introduced into the cell containing the target DNA or a vector encoding the same, as in the method for producing a cell in which the target DNA is edited below. Examples thereof include a method of introducing the above into cells and expressing them.
  • a solution of the target DNA may be mixed with the fusion protein and the solution of the CRISPR-Cas9 system.
  • the solvent of these solutions is not particularly limited, but for example, a buffer solution such as a phosphate buffer solution, a Tris buffer solution, a Good's buffer solution, or a borate buffer solution is preferable.
  • the method for producing a cell in which the target DNA of the present invention has been edited is A method of producing cells in which the target DNA has been edited.
  • Fusion proteins containing TALE and nucleobase converting enzymes and (2) A CRISPR-Cas9 system containing a Cas9 protein having lost part or all of its nuclease activity and its guide RNA is introduced into a cell or expressed intracellularly and brought into contact with a target DNA to convert the nucleobase of the fusion protein. It comprises the step of editing the base of the target site of the target DNA by enzymatic activity.
  • the TALE recognition sequence or its complementary sequence recognized by TALE in the fusion protein is present on the 5'side of the target site via a spacer 1 having a chain length of 7 to 31 bp, and
  • the guide RNA target sequence recognized by the guide RNA in the CRISPR-Cas9 system is present to contain the complementary base of the target site. The method.
  • the fusion protein, the CRISPR-Cas9 system, and the target DNA are the above-mentioned target DNA editing methods of the present invention.
  • the target DNA in the production method of the present invention is genomic DNA, and the fusion protein and the CRISPR-Cas9 system can be designed according to the editing purpose of the genomic DNA.
  • the contact between the fusion protein and the CRISPR-Cas9 system and the target DNA in the cell is the introduction of the fusion protein and the CRISPR-Cas9 system into the cell in the form of a protein, into the cell. It is carried out by introduction in the form of a polynucleotide and / or introduction into a cell in the form of a polynucleotide or introduction in an expression vector to express the protein intracellularly.
  • the form of RNA or DNA (polynucleotide) encoding the protein is obtained. It may be introduced into cells and expressed intracellularly, or it may be introduced into cells in the form of a vector (expression vector) expressing the protein and expressed intracellularly.
  • the guide RNA may be introduced into cells in the form of RNA, or introduced into cells in the form of DNA (polynucleotide) encoding the RNA and expressed intracellularly. It may be introduced into a cell in the form of a vector (expression vector) expressing the RNA and expressed intracellularly.
  • fusion protein and the CRISPR-Cas9 system are introduced into cells in the form of an expression vector and expressed intracellularly, for example, a vector expressing the fusion protein, a vector expressing the Cas9 protein, and the guide RNA.
  • a vector expressing the above may be introduced into the cell, or a vector expressing a combination of two or more of these may be introduced into the cell.
  • the fusion protein and the CRISPR-Cas9 system are introduced into cells in the form of an expression vector and expressed intracellularly, the fusion protein and the polynucleotide encoding the Cas9 protein are independently introduced. It may be appropriately codon-optimized according to the cell.
  • the expression vector preferably contains a promoter and / or other control sequence operably linked to the polynucleotide to be expressed. Further, it is preferable that the expression vector is one that can stably express the encoding protein without being integrated into the host genome.
  • Such an expression vector can be appropriately prepared according to a conventionally known method.
  • a method for introducing a protein of the fusion protein and the CRISPR-Cas9 system, a polynucleotide encoding the protein, and a vector expressing the protein into cells a known method for introducing a protein, DNA, or RNA fragment into cells.
  • the method can be appropriately adopted depending on the type of cell, and examples of such a method include an electroporation method, a microinfection method, a particle gun method, a calcium phosphate method, and polyethyleneimine (PEI).
  • the fusion protein and the CRISPR-Cas9 system When the fusion protein and the CRISPR-Cas9 system are introduced into a cell or expressed intracellularly, the fusion protein and the CRISPR-Cas9 system come into contact with the target DNA in the cell, and the target DNA editing method of the present invention described above.
  • target DNA editing substitution of a target one-base base occurs at the target site, and as a result, it becomes possible to obtain a cell in which the target DNA has been edited.
  • the present invention also provides a method for producing a non-human individual containing a cell in which the target DNA has been edited.
  • This method comprises the step of producing a non-human individual from the cells obtained by the above-mentioned production method.
  • the non-human individual include non-human animals and plants.
  • the non-human animal include mammals (mouse, rat, guinea pig, hamster, rabbit, monkey, pig, cow, goat, sheep, etc.), fish, birds, reptiles, amphibians, and insects.
  • the mammal is preferably a rodent such as a mouse, rat, guinea pig, hamster, and particularly preferably a mouse.
  • the plant include cereals, oil crops, feed crops, fruits and vegetables. Specific crops include, for example, rice, corn, banana, peanut, sunflower, tomato, oilseed rape, tobacco, wheat, barley, potato, soybean, cotton, and carnation.
  • a known method can be used.
  • germ cells or pluripotent stem cells are usually utilized.
  • the fusion protein and the CRISPR-Cas9 system can be microinjected into oocytes and the resulting oocytes can be transplanted into the uterus of a pseudopregnant female non-human mammal to obtain offspring. can.
  • the fusion protein and the CRISPR-Cas9 system were microinjected into plant cells to obtain the same. By regenerating a plant from a plant cell, a plant with the desired DNA edited can be obtained.
  • progeny or clones in which the desired DNA is edited from the obtained non-human individuals.
  • Confirmation of the presence or absence of target DNA editing and determination of genotype can be performed based on conventionally known methods, and for example, PCR method, sequencing method, Southern blotting method and the like can be used.
  • the present invention is used in the above-mentioned method for editing a target DNA of the present invention, the method for producing a cell in which the target DNA of the present invention has been edited, or the above-mentioned method for producing a non-human individual of the present invention.
  • Fusion proteins containing TALE and nucleobase converting enzymes and (2) Provided is a DNA editing system including a CRISPR-Cas9 system containing a Cas9 protein having lost part or all of nuclease activity and a guide RNA thereof.
  • the fusion protein and the CRISPR-Cas9 system are as described in the above-mentioned target DNA editing method and production method of the present invention. These are independently in the form of a protein or RNA, in the form of a polynucleotide encoding the protein or RNA, or in the form of a vector (expression vector) expressing the protein or RNA. May be good.
  • the invention allows the user to design the fusion protein and the CRISPR-Cas9 system depending on the target site of the target DNA.
  • a vector containing a polynucleotide encoding a polynucleotide encoding TALE and a polynucleotide encoding a polynucleotide other than TALE of the fusion protein and
  • B A polynucleotide encoding a Cas9 protein that has lost part or all of its nuclease activity, or a vector containing the polynucleotide.
  • Each of the vectors (a) to (c) contains an expression unit that enables expression of each polynucleotide.
  • the DNA editing system of the present invention may be a combination including the fusion protein and the CRISPR-Cas9 system, respectively, or may be a kit containing the combination.
  • the kit may further include one or more additional reagents.
  • additional reagents include, but are limited to, for example, dilution buffers, reconstruction buffers, wash buffers, nucleic acid transfer reagents, protein transfer reagents, control reagents (eg, control deaminase). It's not a thing.
  • the kit may further include an instruction manual for carrying out the method of the present invention.
  • Each element included in the kit may be contained in a separate container or may be contained in the same container. Each element may be contained in a container for each single use, or a plurality of doses may be contained in one container. Each element may be contained in a container in a dry form, or may be contained in a container in a form dissolved in a suitable solvent (solvent containing a buffer solution, a stabilizer, a preservative, a preservative, etc.). ..
  • the BEtag sequence is a TALE recognition sequence (underlined in Table 1 (* 1): 5'-tACAGAAGCGGGCAAAGG-3'; lower letters indicate thymine recognized by the N-terminal domain of TALE), a target codon (underlined in Table 1 (underlined in Table 1). * 2): 5'-ACG-3') and the spacer 1 sequence between them are included, and the length of the spacer 1 sequence is 7 bp, 13 bp including the base (A) at 5'of the target codon. , 19bp, 25bp, or 31bp.
  • Each BEtag sequence (Betag-7 to 31bp: SEQ ID NOs: 1 to 5) was annealed with an oligonucleotide designed to allow the addition of NheI recognition sites and SbfI recognition sites at both ends, and treated with NheI and SbfI-. It was inserted into the M / A and used as pNLF-BEtag (pNLF-BEtag-7bp to 31bp).
  • the TALE recognition sequence is a Right TALE sequence of TALEN for the human adenomatous polyposis colli gene whose intracellular activity has been confirmed (Sakuma et al., "Repeating pattern of non-RVD binding DNA binding”. ", Sci. Rep., 3: 3379 (2013)).
  • the oligonucleotide of the sequence (PAM: SEQ ID NO: 6) containing the PAM portion shown in Table 1 below and its antisense sequence.
  • the oligonucleotide with 5'-TCGA-3'added to the 5'end of the above was annealed and inserted into each pNLF-BEtag treated with EcoRV and XhoI, and the reporter plasmids (pNLF-BEtag-7bp-PAM, pNLF-) were inserted.
  • Betag-13bp-PAM, pNLF-BEtag-19bp-PAM, pNLF-BEtag-25bp-PAM, pNLF-BEtag-31bp-PAM were prepared.
  • the complementary sequence of the guide RNA target sequence located on the 5'side of the PAM part is 3 bases at a time.
  • the position of the PAM sequence can be shifted downstream by one base, thereby setting eight PAM sequences (PAMs 1 to 8 in Table 7 below). be able to.
  • Table 1 below shows each sequence inserted into the pNLF-M / A plasmid.
  • FIG. 1 shows a conceptual diagram showing the structure of the completed reporter plasmid.
  • the sequence from the NheI recognition site to the XhoI recognition site containing the TALE recognition sequence, spacer 1, target site, PAM part, and guide RNA target sequence is shown in FIG.
  • the target codon is located at the site corresponding to the start codon of NanoLuc luciferase, and according to such reporter plasmid, ACG, which is the target codon, becomes ATG by TALE-deaminase bound to the TALE recognition sequence.
  • ACG which is the target codon
  • TALE vector set and TALE expression plasmid The sequence and composition of the TALE vector set are as described in 1. above for the TALE repeat unit. To correspond to the TALE recognition sequence of the reporter plasmid prepared in Sakuma et al. It was constructed according to (2013). First, a module sequence (non-repeat-variable di-reside (non) other than the sequence encoding four types of variable residues (RVD: HD, NG, NI, NN) composed of the 12th and 13th amino acids.
  • RVD non-repeat-variable di-reside
  • the number of amino acids in the C-terminal domain is 63 (63)
  • the number of amino acids in the C-terminal domain is 47 (47).
  • the sequence encoding "WT” is the sequence of the C-terminal domain contained in addgene's pTALETF_v2 (ID: 32185 to 32188), and the sequence encoding "63” is the sequence of Addgene's pTALEN_v2 (ID: 32189).
  • N-terminal domain of TALE the sequence of the N-terminal domain included in pTALETF_v2 (ID: 32185 to 32188) of WT: Addgene corresponding to these C-terminal domains; 63: ptCMV-136 / 63- of Addgene. Sequence of N-terminal domain contained in VR-HD (ID: 50699); 47: Sequence of N-terminal domain contained in Addgene's ptCMV-153 / 47-VR-HD (ID: 50703) is artificially referred to. DNA was synthesized. Using the array plasmid and destination vector prepared above, Sakuma et al. A TALE expression plasmid was prepared by the Golden Gate method according to the method described in (2013).
  • TALE-deaminase expression plasmid (1) 104 Amino Acid Linker Series First, the AncBE4max gene (Kobran et al., "Improving cytodine and adenine base editors by expression optimilysis, plasmid, plasmid, plasmid. 2018)) and the Target-AID gene (Nucleotide et al., "Targeted nucleotide editing using hybrid plasmid and vertebrate digital and vertebrate adaptibe imemuneSite3, s. AncBE4max expression plasmid and Genet-AID expression plasmid were prepared by inserting them between the recognition site and the site, respectively.
  • a TALE-deaminase expression plasmid having 104 amino acid linker 1 was prepared by the following method. That is, using the AncBE4max gene of the above AncBE4max expression plasmid as a template and the primers shown in Table 2 below, the Anc689 deaminase gene (Anc689 departure: primer SEQ ID NOs: 7 to 8), 10 amino acid linkers 2 and the UGI gene twice. Repeated sequences (10aa linker- ⁇ -plasmase: primer SEQ ID NOs: 11-12) were amplified by PCR, respectively.
  • the PmCDA1 deaminase gene (PmCDA1: primer SEQ ID NOs: 9 to 10) and 104 amino acid linker 1 are encoded.
  • the sequence (104aa linker: primer SEQ ID NOs: 13 to 17) was amplified by PCR.
  • a sequence (primer SEQ ID NOs: 22-25) containing ⁇ -lactamase to the sequence encoding the N-terminal domain (WT, 63, or 47) of TALE was amplified by PCR.
  • Table 2 below shows each primer used to construct the TALE-deaminase expression plasmid and its SEQ ID NO:.
  • Table 2 shows each primer used to construct the TALE-deaminase expression plasmid and its SEQ ID NO:.
  • the C-terminal domain of TALE is WT
  • the 104 amino acid linker 1 and Anc689 deaminase (BE4) are used in the "WT-104-BE4" below the for of 104aa linker. It is shown that it is a sequence encoding the linker 1 for TALE-deaminase containing.
  • "AID" does not indicate that deaminase is AID, but indicates that it is PmCDA1 derived from "Taget-AID”.
  • a sequence containing from ⁇ -plasmase prepared in 1 to a sequence encoding the N-terminal domain of TALE (WT, 63, or 47) and a downstream (3') encoding the C-terminal domain of TALE (WT, 63, or 47). Inserted between the side) sequence and the In-Fusion method (TaKaRa Bio Inc, Shiga, Japan), and in order from the N-terminal, TALE (N-terminal domain (WT, 63, or 47) -TALE repeat domain-C-terminal domain.
  • TALE-deaminase expression plasmid A conceptual diagram showing the structure of the TALE-deaminase is shown in FIG.
  • TALE-deaminase expression plasmid having a 12 amino acid linker 1 (12aa) instead of the 104 amino acid linker 1 was prepared by the following method. That is, first, the oligonucleotides shown in Table 3 below were annealed to prepare a sequence encoding the 12 amino acid linker 1. In Table 3, below the for of 12aa linker (SEQ ID NOs: 18 to 21), for example, in "TALE_WT-12-AID", the C-terminal domain of TALE is WT and the 12 amino acid linker 1 is described above.
  • PmCDA1 deaminase are shown to be sequences encoding linker 1 for TALE-deaminase.
  • a 12 amino acid linker 1 is described in Yang L et al. , "Engineering and optimizing deaminase fusions for genome editing.”, Nat Commun 7 13330 (2016).
  • the sequences other than the sequence encoding 104 amino acid linker 1 of the TALE-deaminase expression plasmid were amplified by inverse PCR using the primers (SEQ ID NOs: 9, 22 to 24) shown in Table 4 below.
  • the sequence encoding the 12 amino acid linker 1 was inserted by the In-Fusion method.
  • Table 3 below shows the sequence encoding the 12 amino acid linker 1 and its SEQ ID NO:
  • Table 4 shows the primers used for inverse PCR and their SEQ ID NOs.
  • sequences other than the sequences encoding the amino acids to be deleted in the above TALE-deaminase expression plasmid were amplified by inverse PCR using the primers (SEQ ID NOs: 9, 26 to 31) shown in Table 5 below, and In- It was produced by self-ligation by the Fusion method.
  • Table 5 below shows the primers used to prepare the amino acid linker 1 deletion mutant of TALE-47-104-AID and their SEQ ID NOs.
  • TALE-deaminase-NC expression plasmid As a negative control (NC) for TALE-deaminase, the above 1. Instead of the TALE recognition sequence of the reporter plasmid prepared in 1. In the same manner as described above, plasmids expressing TALE-deaminase-NC corresponding to each TALE-deaminase (TALE-deaminase-NC expression plasmid) were prepared.
  • TALE-deaminase and its negative control TALE-deaminase-NC
  • sequence numbers SEQ ID NOs of the base sequence and amino acid sequence
  • Cas9 expression plasmid pX330_BS was prepared by inserting it between the EcoRV recognition site and the BamHI recognition site by the In-Fusion method.
  • a site-specific mutagenesis method by PCR was performed on the Cas9 gene of pX330_BS to prepare a nickase-type nCas9 (D10A) expression plasmid and a dCas9 (D10A + H840A) expression plasmid having no cleavage activity.
  • oligonucleotide designed as described above was annealed and inserted into pX330_BS- ⁇ Cas9 by BpiI treatment and ligation to prepare a plasmid (guide RNA expression plasmids 1 to 8) expressing each guide RNA (sgRNA-1 to 8). .. Table 7 below shows the complementary sequence (underlined) of the target sequence of the guide RNA and the PAM sequence (underlined) of Cas9.
  • Transformation into HEK cells (1) HEK293T cells grown in DMEM medium containing 10% FBS were seeded in each well of a 96-well plate with 5 ⁇ 10 4 cells each. 75 ng of any of the TALE-deaminase expression plasmid and the TALE-deaminase-NC expression plasmid shown in Table 6; NCas9 expression plasmid or dCas9 expression plasmid 50 ng prepared in 1. above; 10 ng of any of the guide RNA expression plasmids 1 to 8 and pX330_BS- ⁇ Cas9 (without guide RNA) prepared in 1.
  • the reference plasmid is a plasmid that expresses firefly luciferase (Fluc).
  • the NanoLuc luciferase activity score for cells into which the TALE-deaminase-NC expression plasmid was introduced was measured.
  • the positive control cells into which the AncBE4max expression plasmid was introduced
  • the activity score of the cells into which the pX330_BS- ⁇ Cas9 expression plasmid was introduced was measured and the negative control (AncBE4max-). NC).
  • each NanoLuc luciferase activity score was standardized using the firefly luciferase activity score from the reference plasmid. Then, using the standardized activity score, the activity score of the cell into which the TALE-deaminase expression plasmid was introduced was subtracted from the activity score of the cell into which the TALE-deaminase expression plasmid was introduced, and the activity value of the TALE-deaminase activity was obtained. In addition, AncBE4max-NC was subtracted from the activity score of the cells into which the AncBE4max expression plasmid was introduced to obtain the AncBE4max activity value.
  • the TALE-deaminase activity value is shown as a relative activity when the AncBE4max activity value under the condition of PAM2 described later is set to 1. The test was repeated at least 3 times and graphed with a standard deviation added to the mean.
  • the position of the PAM sequence is set one base at a time. It was moved to the 3'side (downstream) (PAM1 to PAM8), and the base editing activity was examined.
  • the AncBE4max expression plasmid prepared in 1. above and 5.
  • the reporter plasmid (spacer 1: 19bp) prepared in 1. and the reference plasmid pGL4.54 were combined and introduced into HEK293T cells, and the above 7.
  • the AncBE4max activity value was obtained from each of the above.
  • pX330_BS- ⁇ Cas9 was used instead of the guide RNA expression plasmid.
  • Fig. 5 The results are shown in Fig. 5.
  • the guide RNA expression plasmid 2 that is, when the AncBE4max activity value at the time of PAM2 is 1.0
  • the guide RNA expression plasmids 1 to 8 that is, when the guide RNA expression plasmids 1 to 8 are used, that is, when PAM1 to 8 are used.
  • the AncBE4max activity value is shown. As shown in FIG. 5, it was found that the AncBE4max activity value showed the maximum activity at the time of PAM2. Therefore, the AncBE4max activity value at the time of PAM2 was defined as the following positive control for activity evaluation.
  • TALE-deaminase (BE4 series)
  • WT-104-BE4, 47-104-BE4 the C-terminal domain of TALE is WT or 47
  • the amino acid linker 1 is 104 amino acids
  • the deaminase is BE4 (Anc689).
  • the position of the PAM sequence was fixed at PAM2 and the effect of the length of the reporter spacer 1 on activity was investigated.
  • the length of the spacer 1 was 7 bp, 13 bp, 19 bp, 25 bp, and 31 bp.
  • nCas9 As Cas9 / guide RNA, nCas9 (D10A) and guide RNA are expressed (nCas9), dCas9 (D10A + H840A) and guide RNA are expressed (dCas9), nCas9 is expressed and guide RNA is not expressed (nCas9 /).
  • nCas9 As Cas9 / guide RNA, nCas9 (D10A) and guide RNA are expressed (nCas9), dCas9 (D10A + H840A) and guide RNA are expressed (dCas9), nCas9 is expressed and guide RNA is not expressed (nCas9 /).
  • the TALE-deaminase expression plasmid (WT-104-BE4 or 47-104-BE4) prepared in (1) or the corresponding TALE-deaminase-NC expression plasmid and the above 4.
  • the nCas9 expression plasmid or dCas9 expression plasmid prepared in the above 5.
  • Guide RNA expression plasmid 2 or pX330_BS- ⁇ Cas9 prepared in 1. above.
  • the reporter plasmid (spacer 1: 7 to 31 bp) prepared in 1. was combined with pGL4.54, which is a reference plasmid, and introduced into HEK293T cells.
  • the TALE-deaminase activity value (ratio to the AncBE4max activity value) was obtained.
  • Fig. 6 As shown in FIG. 6, no activity was observed in any of the TALE-deaminase (BE4) in the absence of guide RNA, that is, when nCas9 was not bound near the target base. In addition, the activity of using nCas9 to put a nick in the bottom strand was higher than that of using dCas9 to put a nick. Regarding the length of the spacer 1, particularly high activity was shown in the case of 13 bp and 25 bp, and even higher activity was shown in the case of 25 bp. Regarding the C-terminal domain of TALE, 47 (0.29 ⁇ 0.03) was more active than WT (for example, nCas9, spacer 1 length: 25 bp, 0.19 ⁇ 0.01).
  • TALE-deaminase Six types of TALE-deaminase (WT-104 / 12-AID,) in which the C-terminal domain of TALE is WT, 63, or 47, the amino acid linker 1 is 104 amino acids or 12 amino acids, and the deaminase is AID (PmCDA1). For 63-104 / 12-AID, 47-104 / 12-AID), the effect of the length of the spacer 1 of the reporter on the activity was investigated in the same manner as in BE4 above.
  • Fig. 7 As shown in FIG. 7, no activity was observed in any of the TALE-deaminases (AIDs) in the absence of guide RNA, that is, when nCas9 was not bound near the target base. Further, in WT-104-AID, 63-104-AID, WT-12-AID, 63-12-AID, it is better to nick the bottom strand using nCas9 as in the case where the deaminase is BE4. , The activity was higher than when nick did not enter with dCas9. On the other hand, in 47-104-AID and 47-12-AID, the effect of Nick was not so remarkable.
  • AIDs TALE-deaminases
  • TALE-deaminase (AID) showed high activity at 25 bp, and 63-104-AID and 47-12 AID showed high activity at 19 bp.
  • the activity is WT (eg, nCas9, spacer 1 length: 25bp, 0.09 ⁇ 0.00), 63 (0.16 ⁇ 0.01). 47 (0.4 ⁇ 0.03) (FIGS. 7-A, B, C); for 12 amino acid linker 1, the activity is WT (0.32 ⁇ 0.02), 63 (0.38 ⁇ 0.03). , 47 (0.57 ⁇ 0.02) (FIGS.
  • the length of the spacer 1 of the reporter is fixed, and the position of the PAM sequence is moved to the 3'side (downstream) one base at a time to obtain the PAM sequence.
  • the effect of position (ie, corresponding to the position of Cas9) on the activity of TALE-deaminase was investigated.
  • the TALE-deaminase expression plasmid (AID series: WT-104 / 12-AID, 63-104 / 12-AID, 47-104 / 12-AID) prepared in (2) or the corresponding TALE-deaminase. -NC expression plasmid and 4. above.
  • the nCas9 expression plasmid prepared in 1. above and 5.
  • Guide RNA expression plasmids 1 to 8 prepared in 1 above and 1.
  • the reporter plasmid spacer 1:13, 19, or 25bp
  • prepared in 1. was combined with pGL4.54, which is a reference plasmid, and introduced into HEK293T cells.
  • the TALE-deaminase activity value (ratio to the AncBE4max activity value) was obtained.
  • TALE-deaminase (AID series) other than 47-12-AID showed high activity when the spacer 1 length was 19 bp.
  • the positions of the PAM sequences include PAM6 (eg, 0.42 ⁇ 0.08 for spacer 1 length: 19bp) or PAM7 (0.38 ⁇ 0.05) (FIG. 8-A) for WT-104-AID.
  • PAM7 (0.39 ⁇ 0.00)
  • Fig. 8-B for 63-104-AID
  • PAM7 (0.90 ⁇ 0.10
  • Fig. 8-C for 47-104-AID, WT-12.
  • AID also showed high activity with PAM7 (0.91 ⁇ 0.04) (Fig.
  • the ones with the highest activity were the spacer 1 length of 47-104-AID: 19bp / PAM7 (0.90 ⁇ 0.10) and the spacer 1 length of WT-12-AID: 19bp / PAM7 (0.91). ⁇ 0.04), 47-12 AID spacer 1 length 13 bp / PAM7 (0.96 ⁇ 0.03).
  • the reporter plasmid (spacer 1: 25bp) prepared in 1. and the reference plasmid pGL4.54 were combined and introduced into HEK293T cells, and the above 7.
  • the TALE-deaminase activity value (ratio to the AncBE4max activity value) was obtained.
  • Fig. 9 The results are shown in Fig. 9.
  • the TALE-deaminase expression plasmid the above 3.
  • the results when the 47-104-AID prepared in (1), the 47-12-AID prepared in (2), or the corresponding TALE-deaminase-NC expression plasmid are also shown.
  • the activity of TALE-deaminase (AID) was slightly lower when the length of amino acid linker 1 was shortened to 12 amino acids, but the effect of the length of amino acid linker 1 on the activity was not so great. There was found.
  • TALE-deaminase expression plasmid (2) (1) BE4 series (BE4-TALE) (A) 32 amino acid linker series (BE4-32-TALE) TALE-deaminase (hereinafter, "BE4-32-TALE” in some cases) arranged in the order of Anc689 deaminase (BE4), linker 1 (32 amino acids), and TALE (C-terminal domain: WT, 63, or 47) from the N-terminal.
  • BE4 series A
  • 32 amino acid linker series (BE4-32-TALE) TALE-deaminase (hereinafter, "BE4-32-TALE” in some cases) arranged in the order of Anc689 deaminase (BE4), linker 1 (32 amino acids), and TALE (C-terminal domain: WT, 63, or 47) from the N-terminal.
  • the expression plasmid of) was prepared by the following method. That is, first, 3.
  • deaminase (Anc689 deaminase (BE4)), linker 1 (32 amino acids), and TALE (C-terminal domain: WT, 63, or 47) are arranged in this order from the N-terminal.
  • Destination vectors (BE4-32-WT, BE4-32-63, BE4-32-47) for expressing the BE4-32-TALE expression plasmid to be expressed were prepared. With these, 1. Array plasmid to which the TALE sequence prepared in 1. Using the array plasmid to which the NC sequence prepared in 1.
  • each TALE-deaminase expression plasmid or TALE-deaminase-NC expression plasmid was prepared by the Golden Gate method.
  • a conceptual diagram showing the structure of the TALE-deaminase is shown in FIG. 11 (A).
  • SEQ ID NOs base sequence sequence numbers, amino acid sequence SEQ ID NOs showing the composition of TALE-deaminase and its negative control (TALE-deaminase-NC) and their sequences in each prepared expression plasmid. It is shown in Table 12 of.
  • An expression plasmid (linker 1 length: 135 or 234 amino acids including the linkage sequence added before and after the HTS95 amino acid sequence) was prepared by the following method. That is, 8. (1) A 32-amino acid linker using the destination vectors of BE4-32-WT, BE4-32-63, and BE4-32-47 prepared in (a) as templates and the primers shown in Table 9 below. The 5'side (primer SEQ ID NOs: 25 and 80) including the sequence encoding 1 and the 3'side (primer SEQ ID NOs: 12, 81 to 82) after the sequence encoding each TALE were amplified by PCR, respectively. Table 9 below shows each primer used and its SEQ ID NO:.
  • HTS95 nucleotide sequence SEQ ID NO: 105, amino acid sequence SEQ ID NO: 106
  • deaminase (Anc689 deaminase (BE4)), linker 1 (135 amino acids or 234 amino acids), TALE (C-terminal domain: WT, 63, or 47) in order from the N-terminal.
  • BE4-135-TALE or destination vector for expressing BE4-234-TALE (BE4-135-WT, BE4-135-63, BE4-135-47, BE4-234-WT, etc. BE4-234-63, BE4-234-47) were prepared, respectively. With these, 1. Array plasmid to which the TALE sequence prepared in 1. Using the array plasmid to which the NC sequence prepared in 1.
  • each TALE-deaminase expression plasmid or TALE-deaminase-NC expression plasmid was prepared by the Golden Gate method.
  • the conceptual diagram showing the structure of the TALE-deaminase is the same as in FIG. 11 (a).
  • the following is a list of SEQ ID NOs (SEQ ID NOs of base sequence, sequence number of amino acid sequence) showing the composition and sequence of TALE-deaminase and its negative control (TALE-deaminase-NC) in each prepared expression plasmid. It is shown in Table 12 of.
  • ABE8e series (ABE8e-TALE) First, the ABEmax gene (Koblan et al., Nat Biotechnol, 36, p.843-846 (2016)) prepared by artificial DNA synthesis is inserted between the BamHI recognition site and the EcoRV recognition site of cDNA 3.1s, respectively. As a result, ABEmax expression plasmid 2 was prepared.
  • ABE8e V106W
  • An expression plasmid was prepared. That is, using the ABEmax expression plasmid 2 as a template and the primers shown in Table 10 below, the sequence encoding the N-terminal NLS of the 3'-ABEmax gene to the sequence encoding the C-terminal of the 32 amino acid linker 1-5. 'Was amplified by PCR (primer SEQ ID NOs: 83-84) to form an acceptor.
  • a primer was designed to contain mutations such as V106W, A109S, T111R, D119N, H122N, Y147D, F149Y, T166I, and D167N on the ABE7.10 gene, and two fragments using the ABEmax expression plasmid 2 as a template.
  • A primer SEQ ID NOs: 85-86
  • fragment B primer SEQ ID NOs: 87-88
  • Table 10 shows each primer used and its SEQ ID NO:. In each table below, "ABE8e” indicates that the deaminase is TadA-8e (V106W).
  • ABE deaminase ABE8e
  • linker 1 32 amino acids, 135 amino acids, or 234 amino acids
  • TALE C-terminal domain: 47
  • the 5'side including the sequence encoding the N-terminal NLS and the 3'side including the sequence encoding the C-terminal side from the 32 amino acid linker were amplified by PCR including the vector (primer SEQ ID NO: 89). ⁇ 90) It was used as an acceptor. Further, the ABE8e (TadA-8e (V106W)) gene portion amplified by PCR using the ABE8e (TadA-8e (V106W)) expression plasmid as a template (primer SEQ ID NO: Addition 91 to 92) was used as the acceptor by the In-Fusion method. To create a destination vector for expressing ABE8e-32-47, ABE8e-135-47, or ABE8e-234-47. Table 11 below shows each primer used and its SEQ ID NO:.
  • each destination vector and 1. Array plasmid to which the TALE sequence prepared in 1. Using the array plasmid to which the NC sequence prepared in 1. Similarly, each TALE-deaminase expression plasmid or TALE-deaminase-NC expression plasmid was prepared by the Golden Gate method.
  • a conceptual diagram showing the structure of the TALE-deaminase is shown in FIG. 11 (B).
  • SEQ ID NOs SEQ ID NOs of base sequence, sequence number of amino acid sequence
  • TALE-deaminase-NC negative control
  • TALE-deaminase expression plasmid targeting endogenous DNA (genomic DNA)
  • TALE recognition sequence the sequences on the eight types of endogenous DNA shown in Table 13 below are targeted.
  • An array plasmid in which the TALE sequence was ligated was prepared in the same manner as in the above.
  • endogenous DNA CCR5 and HBB in which highly homologous family genes (CCR2 and HBD) are present were set.
  • TALE-deaminase (AID) is arranged in the order of TALE (C-terminal domain: WT or 47), linker 1 (12 amino acids or 104 amino acids), and deaminase (AID) from the N-terminal by the Golden Gate method.
  • Expression plasmids (TALE-AID expression plasmids) of WT (*) -12-AID, 47 (*) -12-AID, 47 (*) -104-AID: * are targets) were prepared. In addition, except that each array plasmid was used, 8.
  • TALE is arranged in the order of deaminase (BE4 or ABE8e), linker 1 (32 amino acids or 135 amino acids), and TALE (C-terminal domain: 63 or 47) from the N-terminal by the Golden Gate method.
  • -Expression plasmids (BE4-TALE expression plasmid, ABE8e-TALE expression plasmid) of deaminase (BE4-32-47 (*), BE4-135-63 (*), ABE8e-135-47 (*): * are targets, respectively) ) was produced.
  • Table 13 below shows the target TALE recognition sequence
  • Table 14 shows the target, the composition of TALE-deaminase, and the sequence number (sequence number of the base sequence, amino acid sequence) in each prepared expression plasmid. A list of each of the sequence numbers) is shown.
  • reporter plasmids for BE4-TALE and ABE8e-TALE As reporters, 1. Insert the sequence shown in Table 15 below (N-CBE (for BE4-TALE) or N-ABE (for ABE8e-TALE)) into the pNLF-M / A prepared in 1 above, and insert it for BE4-TALE and ABE8e. -Reporter plasmids for TALE were prepared respectively.
  • the insertion sequence is a complementary sequence of the TALE recognition sequence (underlined (* 1) in Table 15: 5'-CCTTTGCCCGCTTCTGTa-3'; lower letters indicate the complementary base of thymine recognized by the N-terminal domain of TALE), target codon ( Underlined (* 2) in Table 15: 5'-ACG-3'or 5'-TAG-3'), and the spacer 1 sequence between them, the length of the spacer 1 is 5'of the target codon. 7 bp, 13 bp, 19 bp, 25 bp, or 31 bp including the bases in. Table 15 below shows each sequence inserted into the pNLF-M / A plasmid.
  • the target codon is located at the site corresponding to the start codon of Nano luciferase, and according to the reporter plasmid, the TALE-deaminase bound to the TALE recognition sequence at the target codon.
  • C which is a target base (target site)
  • TALE-deaminase bound to the TALE recognition sequence at the target codon.
  • the reporter plasmid for ABE8e-TALE the target codon is located at the position corresponding to the stop codon inserted upstream of NanoLuc luciferase, and according to the reporter plasmid, TALE- bound to the TALE recognition sequence.
  • TAG the target base (target site) A is replaced with G
  • NanoLuc luciferase is expressed.
  • Transformation into HEK cells (2) 10. When each reporter plasmid prepared in 1 is used as the target DNA, 6. It was performed in the same manner as shown in. That is, 8. 75 ng of either the BE4-TALE expression plasmid or the ABE8e-TALE expression plasmid prepared in 1. NCas9 expression plasmid or dCas9 expression plasmid 50 ng prepared in 1. Guide RNA expression plasmid 10 ng prepared in 10. 20 ng of any of the reporter plasmids prepared in 1; and pGL4.54 5 ng, which is a reference plasmid, were introduced into 5 ⁇ 10 4 HEK293T cells per well using Lipofectamine LTX and cultured for 24 hours.
  • 10 ng of the guide RNA expression plasmid prepared in the above was introduced into 3 ⁇ 10 4 HEK293T cells per well, and cultured for 48 hours. Further, as a control in this case, 30 ng of any of the Target-AID expression plasmid, the AncBE4max expression plasmid, and the ABE8e expression plasmid, and 11.
  • One of the combinations with the guide RNA expression plasmid 20 ng prepared in the above was introduced into HEK293T cells.
  • TALE-deaminase activity value (ratio to the AncBE4max activity value or the ABE8e activity value) was obtained.
  • BE4 series From N-terminal, Anc689 deaminase (BE4), linker 1 (32 amino acids, 135 amino acids, or 234 amino acids), TALE (C-terminal domain: WT, 63, or 47) are arranged in this order.
  • WT, BE4-TALE-63, BE4-TALE-47 the effect of the length of the spacer 1 of the reporter and the length of the linker 1 on the activity was investigated.
  • the length of the spacer 1 was 7 bp, 13 bp, 19 bp, 25 bp, and 31 bp.
  • nCas9 As Cas9 / guide RNA, nCas9 (D10A) and guide RNA are expressed (nCas9), dCas9 (D10A + H840A) and guide RNA are expressed (dCas9), nCas9 is expressed and guide RNA is not expressed (nCas9 /).
  • nCas9 As Cas9 / guide RNA, nCas9 (D10A) and guide RNA are expressed (nCas9), dCas9 (D10A + H840A) and guide RNA are expressed (dCas9), nCas9 is expressed and guide RNA is not expressed (nCas9 /).
  • the length of the spacer 1 particularly high activity was shown when the C-terminal domain of TALE was 25 bp in WT and 63, and when the C-terminal domain of TALE was 19 bp and 25 bp in 47, respectively.
  • the activity was particularly high when the C-terminal domain of TALE was 32 amino acids in WT and 47, and when the C-terminal domain of TALE was 135 amino acids in 63.
  • the combination with particularly high activity was when the C-terminal domain of TALE was WT, when the linker 1 length was 32 amino acids and the spacer 1 length was 25 bp (0.75 ⁇ 0.10), and when the C-terminal domain of TALE was 63.
  • the linker 1 length is 135 amino acids and the spacer 1 length is 25 bp (0.86 ⁇ 0.11)
  • the linker 1 length is 32 amino acids and the spacer 1 length is 19 bp and 25 bp (when the linker 1 length is 32 amino acids and the spacer 1 length is 19 bp and 25 bp). It was 0.80 ⁇ 0.14 and 0.85 ⁇ 0.13).
  • ABE8e series Also for TALE-deaminase (ABE8e-TALE-47) arranged in the order of ABE8e deaminase (ABE8e), linker 1 (32 amino acids, 135 amino acids, or 234 amino acids), and TALE (C-terminal domain: 47) from the N-terminal. Similar to the BE4 series, the effect of the length of the reporter spacer 1 and the length of the linker 1 on the activity was investigated.
  • the length of linker 1 is 135 amino acids (0.54 ⁇ 0.03) for nCas9, 32 amino acids (0.55 ⁇ 0.13) and 135 amino acids (0.57 ⁇ 0.09) for dCas9. Each showed particularly high activity.
  • TALE-AID (WT (*) -12-AID, 47) arranged in the order of TALE (C-terminal domain: WT or 47), linker 1 (12 amino acids or 104 amino acids), and deaminase (AID) from the N-terminal. 14 to 16 show the results when (*) -12-AID and 47 (*) -104-AID: * are targets).
  • the TALE recognition sequence is on AS3 (a), AS14 (b), S2 (c) shown in FIG. 13A, respectively.
  • FIG. 14 shows the ratio of T in the first base (A), the tenth base (B), and the eleventh base (C) of the complementary sequence of the target sequence of the guide RNA (sgRNA-AS3) on the target AS3 (that is,).
  • FIG. 15 shows the first base (A) and the fifth base (A) of the complementary sequence of the target sequence of the guide RNA (sgRNA-AS14) on the target AS14.
  • B) shows the proportion of T in the 6th base (C)
  • FIG. 16 shows the 1st base (A) and the 8th base of the complementary sequence of the target sequence of the guide RNA (sgRNA-S2) on the target S2.
  • B) shows the ratio of T in the 9th base (C).
  • TALE-AID showed the same or higher activity against the target CCR5 gene or HBB gene as compared with the existing Base editors Target-AID and AncBE4max.
  • Target-AID and AncBE4max showed base-editing activity against the non-target CCR2 gene or HBD gene, but TALE-AID showed almost no base-editing activity. Therefore, it was confirmed that TALE-AID has higher target specificity than the existing Target-AID and AncBE4max.
  • BE4 series BE4-TALE (BE4-32-47 (*), BE4) arranged in the order of deaminase (BE4), linker 1 (32 amino acids or 135 amino acids), and TALE (C-terminal domain: 47 or 63) from the N-terminal. -135-63 (*): * is the target), and the results are shown in FIGS. 17 to 20.
  • the TALE recognition sequence is on the complementary sequence of AS5 (d), AS14 (e), AS6 (f), AS7 (g) shown in FIG. 13B, respectively.
  • FIG. 17 shows the ratio of T in the 7th base (A) and the 8th base (B) of the complementary sequence of the target sequence of the guide RNA (sgRNA-AS5) on the target AS5, and FIG. 18 shows the ratio of T in the target.
  • the ratio of T in the first base (A), the fifth base (B), and the sixth base (C) of the complementary sequence of the target sequence of the guide RNA (sgRNA-AS14) on AS14 is shown, and FIG. 19 shows.
  • the ratio of T in the 5th base (A) and 6th base (B) of the complementary sequence of the target sequence of the guide RNA (sgRNA-AS6) on the target AS6 is shown
  • FIG. 20 shows the guide on the target AS7.
  • the ratio of T in the 6th base (A) and the 7th base (B) of the complementary sequence of the target sequence of RNA (sgRNA-AS7) is shown.
  • BE4-TALE showed approximately the same level of activity against the target CCR5 gene or HBB gene as compared with the existing Base editors Target-AID and AncBE4max.
  • Target-AID and AncBE4max showed base-editing activity against the non-target CCR2 gene or HBD gene, but BE4-TALE showed almost no base-editing activity. Therefore, it was confirmed that BE4-TALE has higher target specificity than the existing Target-AID and AncBE4max.
  • ABE8e series The results of using ABE8e-TALE (ABE8e-135-47) arranged in the order of ABE8e deaminase (ABE8e), linker 1 (135 amino acids), and TALE (C-terminal domain: 47) from the N-terminal are shown in FIGS. 21 to 21. It is shown in FIG. In each ABE8e-TALE, the TALE recognition sequence is on the complementary sequence of AS5 (d), AS6 (f), AS7 (g) shown in FIG. 13B, respectively. In FIG.
  • FIG. 21 shows the ratio of G in the third base (A) and the fourth base (B) of the complementary sequence of the target sequence of the guide RNA (sgRNA-AS5) on the target AS5 (that is, the base changes from A to G).
  • the edited ratio is shown, and FIG. 22 shows the ratio of G in the 4th base (A) and 7th base (B) of the complementary sequence of the target sequence of the guide RNA (sgRNA-AS6) on the target AS6.
  • FIG. 23 shows the ratio of G in the 4th base (A) and 8th base (B) of the complementary sequence of the target sequence of the guide RNA (sgRNA-AS7) on the target AS7.
  • ABE8e-TALE showed the same level of activity against the target CCR5 gene or HBB gene as compared with the existing Base editor ABE8e (TadA-8e (V106W)).
  • ABE8e (TadA-8e (V106W)) showed base editing activity against the non-target CCR2 gene or HBD gene, but ABE8e-TALE showed almost no base editing activity. Therefore, it was confirmed that ABE8e-TALE has higher target specificity than the existing ABE8e (TadA-8e (V106W)).
  • the present invention a method capable of specifically and efficiently editing a target DNA by a nucleobase converting enzyme, a method for producing a genome-edited cell using the method, And the DNA editing system used for them can be provided. Therefore, the present invention is expected to be utilized in fields such as gene editing therapy, which requires high editing efficiency and high safety.

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

標的DNAを編集する方法であり、 (1)TALE及び核酸塩基変換酵素を含む融合タンパク質、並びに、 (2)ヌクレアーゼ活性の一部又は全部を喪失したCas9タンパク質及びそのガイドRNAを含むCRISPR-Cas9システム を、標的DNAに接触させ、前記融合タンパク質の核酸塩基変換酵素活性により前記標的DNAの標的部位の塩基を編集する工程を含み、 前記融合タンパク質におけるTALEが認識するTALE認識配列又はその相補配列は、前記標的部位の5'側に7~31bpの鎖長のスペーサー1を介して存在し、かつ、 前記CRISPR-Cas9システムにおけるガイドRNAが認識するガイドRNA標的配列は、前記標的部位の相補塩基を含むように存在する、 方法。

Description

標的DNAの編集方法、標的DNAが編集された細胞の製造方法、及びそれらに用いるDNA編集システム
 本発明は、標的DNAの編集方法、標的DNAが編集された細胞の製造方法、及びそれらに用いるDNA編集システムに関し、より詳しくは、標的DNAを編集する方法、その方法を用いてゲノム編集された細胞を製造する方法、及びそれらに用いる組み合わせに関する。
 CRISPR-dCas9/nCas9とデアミナーゼ等の核酸塩基変換酵素とを組み合わせた塩基編集方法は、2016年に最初の報告(Komor,A.et al.,Nature 533,420-424(2016),DOI:10.1038/nature17946(非特許文献1))がなされて以降、その編集効率の高さとドナーDNAを必要としない簡便さとから、急速に利用が広まり、さまざまな生物や細胞での実施例が報告されると共に、改良システムも多数開発されている(Rees,H.A.and Liu,D.R.,Nat Rev Genet 19,770-788(2018),DOI:10.1038/s41576-018-0059-1(非特許文献2)等)。
 例えば、塩基CからTへの塩基編集(C→T(G→A))においては、ラットのAPOBEC1(rAPOBEC1)を利用したシステム(上記初出論文でのBE3から、現在ではAncBE4maxと呼ばれるシステムへと改良が進められている;Koblan,L.et al.,Nat Biotechnol 36,843-846(2018),DOI:10.1038/nbt.4172(非特許文献3))と、ヤツメウナギのCDA1(PmCDA1)を利用したシステム(Target-AID;Nishida,K.et al.,Science 353,aaf8729(2016),DOI:10.1126/science.aaf8729(非特許文献4))と、がよく用いられており、その他にAPOBEC3AやAPOBEC3Bなどが利用可能であることも報告されている(Gehrke,J.et al.,Nat Biotechnol 36,977-982(2018),DOI:10.1038/nbt.4199(非特許文献5);Martin,A.S.et al.,Sci Rep 9,497(2019),DOI: 10.1038/s41598-018-36739-9(非特許文献6))。また、例えば、塩基AからGへの塩基編集(A→G(T→C))システムとして、大腸菌に由来するTadAタンパク質をエンジニアリングして構築したAdenine Base Editor(ABE)システムも報告されている(Gaudelli,N.et al.,Nature 551,464-471(2017),DOI:10.1038/nature24644(非特許文献7))。
 しかしながら、これら全てのシステムにおいて、標的とするゲノム領域の特異性は、CRISPR-dCas9/nCas9の構成要素であるガイドRNA及びdCas9/nCas9が認識するPAM配列のみに依存している。他方で、ジンクフィンガー(ZF)やTALエフェクター(TALE)にデアミナーゼを融合したシステムも報告されている(Yang,L.et al.,Nat Commun 7,13330(2016),DOI:10.1038/ncomms13330(非特許文献8))が、ZFやTALEといったDNA結合タンパク質は、CRISPR-dCas9/nCas9と異なり、二本鎖DNAを一本鎖に乖離させる性質を有さないことから、一本鎖DNAを基質とするデアミナーゼによる塩基編集の効率は極めて低い。
 このような状況の中、デアミナーゼをN末ドメインとC末ドメインとに分割(split)し、ZFとnCas9とにそれぞれ融合させることで、ZF及びnCas9の両者の標的配列が近傍に存在するときに初めて塩基編集が施されるようなシステムが報告されている(国際公開第2018/218166号)。このようなシステムを用いれば、従来のCRISPR-dCas9/nCas9依存的システムと比較し、ZFの認識配列が加わる分、特異性を向上させることができると考えられる。
国際公開第2018/218166号
Komor,A.et al.,Nature 533,420-424(2016) Rees,H.A.and Liu,D.R.,Nat Rev Genet 19,770-788(2018) Koblan,L.et al.,Nat Biotechnol 36,843-846(2018) Nishida,K.et al.,Science 353,aaf8729(2016) Gehrke,J.et al.,Nat Biotechnol 36,977-982(2018) Martin,A.S.et al.,Sci Rep 9,497(2019) Gaudelli,N.et al.,Nature 551,464-471(2017) Yang,L.et al.,Nat Commun 7,13330(2016)
 しかしながら、特許文献1に記載のシステムによる塩基編集の効率は、最も高いものでも、従来の塩基編集システムであるBE3(非特許文献1)の1/3程度であり、これは、split化することによって活性の低下が引き起こされているものと考えられた。
 本発明は、上記従来技術の有する課題に鑑みてなされたものであり、特異的かつ効率的に、核酸塩基変換酵素による標的DNAの編集を行うことができる方法、その方法を用いてゲノム編集された細胞を製造する方法、及びそれらに用いるDNA編集システムを提供することを目的とする。
 本発明者らは、上記目的を達成すべく鋭意研究を重ねた結果、核酸塩基変換酵素をsplit化することなくTALEに融合しつつ、かかるTALE-核酸塩基変換酵素融合タンパク質(好ましくはTALE-デアミナーゼ-UGI融合タンパク質)と、dCas9/ガイドRNA複合体又はnCas9/ガイドRNA複合体と、の両者を標的DNAの標的部位の近傍に結合させるシステムを開発した。核酸塩基変換酵素をsplit化しない構造は、例えばデアミナーゼの場合には既報の高活性システムであるAncBE4maxに準拠しているが、これをdCas9やnCas9に直接連結するのではなく、TALEに連結させていることにより、TALE-核酸塩基変換酵素(デアミナーゼ)融合タンパク質のみが標的DNAに結合しても、基質となる一本鎖DNAが露出していないために塩基編集は殆ど起こらない。また、dCas9/ガイドRNA複合体のみや、nCas9/ガイドRNA複合体のみが標的DNAに結合しても、前記核酸塩基変換酵素が存在しないために、やはり塩基編集は起こらない。そのため、TALE-核酸塩基変換酵素融合タンパク質と、dCas9/ガイドRNA複合体又はnCas9/ガイドRNA複合体と、の両者が、標的部位を中心として、特定の距離を置いて標的DNAにそれぞれ結合したときに初めて塩基編集が起こり、高い特異性が担保されること、及び前記核酸塩基変換酵素をsplit化していないことにより高い編集効率を実現できること、を本発明者らは見出した。
 また、本発明者らは、上記のCRISPR-dCas9又はnCas9とTALE-核酸塩基変換酵素融合タンパク質との組み合わせにおいて、標的DNA上のTALE認識配列(又はその相補配列)~標的部位間のスペーサー1、及び標的DNA上のRNA標的配列の位置の検討により、従来のAncBE4maxシステムと同等の塩基編集効率を達成できることを実証し(レポーターアッセイによる最大活性)、本発明を完成するに至った。かかる知見により得られた本発明の態様は以下のとおりである。
 [1]
 標的DNAを編集する方法であり、
(1)TALE及び核酸塩基変換酵素を含む融合タンパク質、並びに、
(2)ヌクレアーゼ活性の一部又は全部を喪失したCas9タンパク質及びそのガイドRNAを含むCRISPR-Cas9システム
を、標的DNAに接触させ、前記融合タンパク質の核酸塩基変換酵素活性により前記標的DNAの標的部位の塩基を編集する工程を含み、
 前記融合タンパク質におけるTALEが認識するTALE認識配列又はその相補配列は、前記標的部位の5’側に7~31bpの鎖長のスペーサー1を介して存在し、かつ、
 前記CRISPR-Cas9システムにおけるガイドRNAが認識するガイドRNA標的配列は、前記標的部位の相補塩基を含むように存在する、
方法。
 [2]
 標的DNAが編集された細胞を製造する方法であり、
(1)TALE及び核酸塩基変換酵素を含む融合タンパク質、並びに、
(2)ヌクレアーゼ活性の一部又は全部を喪失したCas9タンパク質及びそのガイドRNAを含むCRISPR-Cas9システム
を、細胞に導入又は細胞内で発現させて標的DNAに接触させ、前記融合タンパク質の核酸塩基変換酵素活性により前記標的DNAの標的部位の塩基を編集する工程を含み、
 前記融合タンパク質におけるTALEが認識するTALE認識配列又はその相補配列は、前記標的部位の5’側に7~31bpの鎖長のスペーサー1を介して存在し、かつ、
 前記CRISPR-Cas9システムにおけるガイドRNAが認識するガイドRNA標的配列は、前記標的部位の相補塩基を含むように存在する、
方法。
 [3]
 前記融合タンパク質がさらに、TALEと前記核酸塩基変換酵素とを結合するリンカー1を含む、[1]又は[2]に記載の方法。
 [4]
 前記融合タンパク質がさらに、C末側にリンカー2を介して結合された塩基除去修復インヒビターを含む、[1]~[3]のうちのいずれか一項に記載の方法。
 [5]
 前記融合タンパク質における核酸塩基変換酵素がデアミナーゼである、[1]~[4]のうちのいずれか一項に記載の方法。
 [6]
 前記デアミナーゼが、APOBEC、PmCDA1、Anc689、及びTadAからなる群から選択される少なくとも1種である、[5]に記載の方法。
 [7]
 [1]~[6]のうちのいずれか一項に記載の方法に用いるためのDNA編集システムであり、
(1)TALE及び核酸塩基変換酵素を含む融合タンパク質、並びに、
(2)ヌクレアーゼ活性の一部又は全部を喪失したCas9タンパク質及びそのガイドRNAを含むCRISPR-Cas9システム
を含む、DNA編集システム。
 [8]
 前記融合タンパク質がさらに、TALEと前記核酸塩基変換酵素とを結合するリンカー1を含む、[7]に記載のDNA編集システム。
 [9]
 前記融合タンパク質がさらに、C末側にリンカー2を介して結合された塩基除去修復インヒビターを含む、[7]又は[8]に記載のDNA編集システム。
 [10]
 前記融合タンパク質における核酸塩基変換酵素がデアミナーゼである、[7]~[9]のうちのいずれか一項に記載の方法。
 [11]
 前記デアミナーゼが、APOBEC、PmCDA1、Anc689、及びTadAからなる群から選択される少なくとも1種である、[10]に記載のDNA編集システム。
 本発明によれば、特異的かつ効率的に、核酸塩基変換酵素による標的DNAの編集を行うことができる方法、その方法を用いてゲノム編集された細胞を製造する方法、及びそれらに用いるDNA編集システムを提供することが可能となる。
レポータープラスミドの構造を示す概念図である。 レポータープラスミドにおけるNheI認識サイトからXhoI認識サイトまでの配列の構造を示す概念図である。 NanoLuc発現レポーターの構造及びTALE-デアミナーゼによる塩基編集の一態様の模式図である。 TALE-デアミナーゼの構造の一態様を示す概念図である。 試験1で得られたAncBE4max活性値を示すグラフである。 試験2で得られたTALE-デアミナーゼ活性値(AncBE4max活性値に対する割合)を示すグラフである((A)WT-104-BE4、(B)47-104-BE4)。 試験2で得られたTALE-デアミナーゼ活性値(AncBE4max活性値に対する割合)を示すグラフである((A)WT-104-AID、(B)63-104-AID、(C)47-104-AID、(D)WT-12-AID、(E)63-12-AID、(F)47-12-AID)。 試験3で得られたTALE-デアミナーゼ活性値(AncBE4max活性値に対する割合)を示すグラフである((A)WT-104-AID、(B)63-104-AID、(C)47-104-AID、(D)WT-12-AID、(E)63-12-AID、(F)47-12-AID)。 試験4で得られたTALE-デアミナーゼ活性値(AncBE4max活性値に対する割合)とリンカー1の長さとの関係を示すグラフである。 NanoLuc発現レポーターの構造及びTALE-デアミナーゼによる塩基編集の一態様の模式図である。 TALE-デアミナーゼの構造の一態様(A、B)をそれぞれ示す概念図である。 試験5で得られたTALE-デアミナーゼ活性値(AncBE4max活性値に対する割合)を示すグラフである((A)BE4-TALE-WT:BE4-32-WT、BE4-135-WT、BE4-234-WT、(B)BE4-TALE-63:BE4-32-63、BE4-135-63、BE4-234-63)。 試験5で得られたTALE-デアミナーゼ活性値(AncBE4max活性値又はABE8e活性値に対する割合)を示すグラフである((C)BE4-TALE-47:BE4-32-47、BE4-135-47、BE4-234-47、(D)ABE8e-TALE-47:ABE8e-32-47、ABE8e-135-47、ABE8e-234-47)。 内因性DNA(CCR5、HBB)上のターゲット領域(AS3(a)、AS14(b)、S2(c))、TALE認識配列の位置、ガイドRNAの標的配列の相補配列の位置をそれぞれ示す概念図である。 内因性DNA(CCR5、HBB)上のターゲット領域(AS5(d)、AS14(e)、AS6(f)、AS7(g))、TALE認識配列及びその相補配列の位置、ガイドRNAの標的配列の相補配列の位置をそれぞれ示す概念図である。 試験6で得られた、TALE-AIDを用いたときの、ターゲットAS3上の、ガイドRNA(sgRNA-AS3)の標的配列の相補配列の1塩基目(A)、10塩基目(B)、11塩基目(C)におけるTの割合を示すグラフである。 試験6で得られた、TALE-AIDを用いたときの、ターゲットAS14上の、ガイドRNA(sgRNA-AS14)の標的配列の相補配列の1塩基目(A)、5塩基目(B)、6塩基目(C)におけるTの割合を示すグラフである。 試験6で得られた、TALE-AIDを用いたときの、ターゲットS2上の、ガイドRNA(sgRNA-S2)の標的配列の相補配列の1塩基目(A)、8塩基目(B)、9塩基目(C)におけるTの割合を示すグラフである。 試験6で得られた、BE4-TALEを用いたときの、ターゲットAS5上の、ガイドRNA(sgRNA-AS5)の標的配列の相補配列の7塩基目(A)、8塩基目(B)におけるTの割合を示すグラフである。 試験6で得られた、BE4-TALEを用いたときの、ターゲットAS14上の、ガイドRNA(sgRNA-AS14)の標的配列の相補配列の1塩基目(A)、5塩基目(B)、6塩基目(C)におけるTの割合を示すグラフである。 試験6で得られた、BE4-TALEを用いたときの、ターゲットAS6上の、ガイドRNA(sgRNA-AS6)の標的配列の相補配列の5塩基目(A)、6塩基目(B)におけるTの割合を示すグラフである。 試験6で得られた、BE4-TALEを用いたときの、ターゲットAS7上の、ガイドRNA(sgRNA-AS7)の標的配列の相補配列の6塩基目(A)、7塩基目(B)におけるTの割合を示すグラフである。 試験6で得られた、ABE8e-TALEを用いたときの、ターゲットAS5上の、ガイドRNA(sgRNA-AS5)の標的配列の相補配列の3塩基目(A)、4塩基目(B)におけるGの割合を示すグラフである。 試験6で得られた、ABE8e-TALEを用いたときの、ターゲットAS6上の、ガイドRNA(sgRNA-AS6)の標的配列の相補配列の4塩基目(A)、7塩基目(B)におけるGの割合を示すグラフである。 試験6で得られた、ABE8e-TALEを用いたときの、ターゲットAS7上の、ガイドRNA(sgRNA-AS7)の標的配列の相補配列の4塩基目(A)、8塩基目(B)におけるGの割合を示すグラフである。
 以下、本発明の好ましい実施形態を例に挙げてより具体的に説明するが、本発明はこれに限定されるものではない。
 <標的DNA編集方法>
 本発明の標的DNA編集方法は、
 標的DNAを編集する方法であり、
(1)TALE及び核酸塩基変換酵素を含む融合タンパク質、並びに、
(2)ヌクレアーゼ活性の一部又は全部を喪失したCas9タンパク質及びそのガイドRNAを含むCRISPR-Cas9システム
を、標的DNAに接触させ、前記融合タンパク質の核酸塩基変換酵素活性により前記標的DNAの標的部位の塩基を編集する工程を含み、
 前記融合タンパク質におけるTALEが認識するTALE認識配列又はその相補配列は、前記標的部位の5’側に7~31bpの鎖長のスペーサー1を介して存在し、かつ、
 前記CRISPR-Cas9システムにおけるガイドRNAが認識するガイドRNA標的配列は、前記標的部位の相補塩基を含むように存在する、
方法である。
 (融合タンパク質)
 本発明に係る融合タンパク質は、TALE及び核酸塩基変換酵素を含む融合タンパク質である。本明細書においては、前記本発明に係る融合タンパク質を、場合により、「TALE-核酸塩基変換酵素融合タンパク質」又は「TALE-核酸塩基変換酵素」という。前記融合タンパク質としては、N末から、TALE、核酸塩基変換酵素の順に結合されていても、核酸塩基変換酵素、TALEの順に結合されていてもよい。また、本発明に係る融合タンパク質としては、2以上(好ましくは2つ)の核酸塩基変換酵素を含んでいてもよく、この場合の核酸塩基変換酵素としては、1種のみであっても2種以上の組み合わせであってもよい。例えば、本発明に係る融合タンパク質が2つの核酸塩基変換酵素(第1の核酸塩基変換酵素、第2の核酸塩基変換酵素)を含む場合、これらは、第1の核酸塩基変換酵素、TALE、第2の核酸塩基変換酵素の順に結合されていてもよい。これらの中でも、本発明に係る融合タンパク質としては、N末から、TALE、核酸塩基変換酵素の順に結合されているか、N末から、核酸塩基変換酵素、TALEの順に結合されていることが好ましい。
 〔TALE〕
 TALE(Transcription Activator-Like Effector:転写活性化因子様エフェクター)は、Xanthomonas種プロテオバクテリアが分泌し宿主植物の遺伝子転写を活性化するタンパク質である。本発明に係る「TALE」は、少なくとも、N末ドメイン及びTALEリピートドメインを含み、C末ドメインをさらに含んでいてもよい。
 TALEリピートドメインは、右巻き超らせん(superhelical)を形成するTALE配列の、複数、例えば10~30、好ましくは13~25、より好ましくは15~20のタンデムリピート(TALEリピート)で構成される。典型的なTALEリピート1単位(1つのTALE配列)は、33~35アミノ酸からなり、その12番目と13番目の2アミノ酸残基からなる可変残基(repeat variable diresidue:RVD)によって、DNAの特定の塩基を認識する。塩基を特異的に認識するRVDの例としては、Cを認識するHD、Tを認識するNG、Aを認識するNI、G又はAを認識するNN、及びA、C、G又はTを認識するNS等が挙げられる。かかるTALEリピートドメインのDNA認識機構に基づき、特定の塩基を認識するTALE配列を人工的に連結することにより、DNA上の所望の塩基配列(TALE認識配列)を認識して結合できるTALEを作成することができる。
 本発明に係るTALEの前記TALE配列は、それぞれ、TALEリピートドメインがTALE認識配列を認識して結合できるものである限り、天然型のアミノ酸配列に対して、適宜改変されたものであってもよい。例えば、前記TALE配列においては、それぞれ独立に、RVDの位置が変更されていても、RVD以外のアミノ酸残基が1個又は複数個(例えば、10個以下、9個以下、8個以下、7個以下、6個以下、好ましくは5個以下又は4個以下、さらに好ましくは3個以下又2個以下)置換、挿入、及び/又は欠失していてもよく、また、RVDの12番目と13番目の2アミノ酸残基は、A、T、C及びGに対する特異性を増強するために他のアミノ酸残基に置換されてもよい。
 また、本発明に係るTALEのTALEリピートドメインは、標的DNAの標的部位の5’側に7~31bpの鎖長のスペーサー1を介して存在する塩基配列又はその相補配列を認識するように、すなわち、TALEが認識するTALE認識配列又はその相補配列が、前記標的部位の5’側に7~31bpの鎖長のスペーサー1を介して存在する塩基配列となるように、設計される。このような所望のTALEを設計、作製する技術は公知であり(例えば、Miller et al.,Nat. Biotechnol.,29,143-148(2011);Sakuma et al.,Sci.Rep.,3:3379(2013))、例えば、Sakuma et al.(2013)に記載のPlatinum Gateシステムによって、前記塩基配列に対する高い結合活性を有するTALEを作製することができる。
 本発明に係るTALEのN末ドメインとしては、天然型のアミノ酸配列(例えば、AddgeneのpTALETF_v2(ID:32185~32188)に含まれるN末ドメインのアミノ酸配列)を用いることができるが、本発明に係る融合タンパク質の機能(TALE認識配列への結合能、標的部位における編集能等)に負の影響を与えない限り、前記天然型のアミノ酸配列に対して、適宜改変されたものであってもよい。例えば、1個又は複数個(例えば、50個以下、30個以下、20個以下、10個以下、9個以下、8個以下、7個以下、6個以下、好ましくは5個以下又は4個以下、さらに好ましくは3個以下又2個以下)のアミノ酸残基が置換、挿入、及び/又は欠失していてもよい。また、精製や検出のためのフラグタグ、TALE-核酸塩基変換酵素を細胞核へ移行するための核局在化シグナル(NLS)等を含んでいてもよい。
 このようなN末ドメインとしては、N末ドメインの鎖長が、49~287アミノ酸残基であることが好ましく、80~200アミノ酸残基であることがより好ましく、120~180アミノ酸残基であることがさらに好ましい。前記N末ドメインの鎖長が前記下限未満であると、標的DNAに結合できなくなる傾向にあり、他方、前記上限を超えると、融合タンパク質を発現させる場合、その発現効率が低下する傾向にある。
 本発明に係るTALEのN末ドメインの具体例としては、例えば、AddgeneのptCMV-136/63-VR-HD(ID:50699)に含まれるN末ドメインのアミノ酸配列や、AddgeneのptCMV-153/47-VR-HD(ID:50703)に含まれるN末ドメインのアミノ酸配列が挙げられるが、これに限定されるものではない。
 本発明に係るTALEがC末ドメインをさらに含む場合、かかるTALEのC末ドメインとしても、天然型のアミノ酸配列(例えば、AddgeneのpTALETF_v2(ID:32185~32188)に含まれるC末ドメインのアミノ酸配列)を用いることができるが、本発明に係る融合タンパク質の機能(TALE認識配列への結合能、標的部位における編集能等)に負の影響を与えない限り、前記天然型のアミノ酸配列に対して、適宜改変されたものであってもよい。例えば、1個又は複数個(例えば、50個以下、30個以下、20個以下、10個以下、9個以下、8個以下、7個以下、6個以下、好ましくは5個以下又は4個以下、さらに好ましくは3個以下又2個以下)のアミノ酸残基が置換、挿入、及び/又は欠失していてもよい。
 本発明に係るTALEがC末ドメインをさらに含む場合、前記TALEのC末ドメインとしては、天然型のアミノ酸配列においてC末側の一部のアミノ酸配列が除去されたものであってもよい。このようなC末ドメインとしては、C末ドメインの鎖長が、1~180アミノ酸残基であることが好ましく、20~100アミノ酸残基であることがより好ましく、40~70アミノ酸残基であることがさらに好ましい。前記C末ドメインの鎖長が前記上限を超えると、融合タンパク質を発現させる場合、その発現効率が低下する傾向にある。
 前記C末ドメインの具体例としては、例えば、AddgeneのpTALETF_v2(ID:32185~32188)に含まれるC末ドメインのアミノ酸配列(WT:アミノ酸数=180)、AddgeneのpTALEN_v2(ID:32189~32192)に含まれるC末ドメインのアミノ酸配列(アミノ酸数=63)、AddgeneのptCMV-153/47-VR-NG(ID:50704)に含まれるC末ドメインのアミノ酸配列(アミノ酸数=47)が挙げられるが、これに限定されるものではない。
 〔核酸塩基変換酵素〕
 本発明において、核酸塩基変換酵素とは、DNA塩基のプリン又はピリミジン環上の置換基を他の基若しくは原子に変換、又は脱落させる反応を触媒することにより、DNA鎖を切断することなく、標的のヌクレオチドを他のヌクレオチドに変換又は脱落させ得る酵素を意味する。
 このような核酸塩基変換酵素としては、上記の反応を触媒し得るものであれば特に制限はなく、例えば、デアミナーゼ、グリコシラーゼが挙げられ、これらのうちの1種のみであっても2種以上の組み合わせであってもよい。これらの中でも、本発明に係る核酸塩基変換酵素としては、デアミナーゼが好ましい。
 (デアミナーゼ)
 前記デアミナーゼは、塩基のアミノ基をカルボニル基に変換する脱アミノ化反応を触媒する酵素であり、核酸/ヌクレオチドデアミナーゼスーパーファミリーに属する。このようなデアミナーゼとしては、シトシン又は5-メチルシトシンをそれぞれウラシル又はチミンに変換し得るシチジンデアミナーゼ、アデニンをヒポキサンチンに変換し得るアデノシンデアミナーゼ、グアニンをキサンチンに変換し得るグアノシンデアミナーゼが挙げられ、目的の塩基置換に応じて、使い分けることができる。
 前記デアミナーゼの由来としては特に制限されず、例えば、ヤツメウナギ;ヒト、サル、ブタ、ウシ、ウマ、ラット、マウス等の哺乳動物が挙げられる。
 このようなデアミナーゼとして、シチジンデアミナーゼとしては、例えば、APOBEC(ラット由来のrAPOBEC1、ヒト由来のhAPOBEC1、hAPOBEC2、hAPOBEC3(hAPOBEC3A、3B、3C、3D(3E)、3F、3G、3H)、hAPOBEC4等);APOBECの祖先アミノ酸配列であるAnc689;哺乳動物(例、ヒト、ブタ、ウシ、ウマ、サル等)由来のAID(Activation-induced cytidine deaminase(AICDA));AIDのファミリーであり、ヤツメウナギ由来のPmCDA1(Petromyzon marinus cytosine deaminase 1)が挙げられる。また、アデノシンデアミナーゼとしては、例えば、大腸菌由来のTadAが挙げられる。上記の各デアミナーゼには、それぞれ、その改変体(例えば、TadA-8e、TadA7.10、さらにこれらの改変体等)を含む。これらの中でも、前記デアミナーゼとしては、APOBEC、PmCDA1、Anc689、及びTadA(それぞれ、その改変体を含む)からなる群から選択される少なくとも1種であることが好ましい。
 また、本発明に係る融合タンパク質がデアミナーゼを2以上含む場合、これらの組み合わせは、目的の塩基置換に応じて適宜選択することができ、例えば、同一又は異なるシチジンデアミナーゼの組み合わせ、同一又は異なるアデノシンデアミナーゼの組み合わせ、同一又は異なるグアノシンデアミナーゼの組み合わせ、シチジンデアミナーゼとアデノシンデアミナーゼとの組み合わせ、シチジンデアミナーゼとグアノシンデアミナーゼとの組み合わせ、アデノシンデアミナーゼとグアノシンデアミナーゼとの組み合わせが挙げられる。これらの中でも、デアミナーゼの組み合わせとしては、TadAとPmCDA1との組み合わせが好ましい。なお、これらのデアミナーゼの塩基配列及びアミノ酸配列は公知であり、公共のデータベース(Genbank等)から取得することができる。
 また、前記デアミナーゼとしては、脱アミノ化活性(デアミナーゼ活性)を有する限り、これらの公知のデアミナーゼの塩基配列及びアミノ酸配列に基づいて、改変(例えば、アミノ酸残基の置換、挿入、及び/又は欠失の導入)がされたものであってもよい。デアミナーゼ活性の有無は、公知の方法を適宜用いて確認することができる。例えば、シチジンデアミナーゼでは、シチジンを基質として酵素反応を行い、シチジンの代謝産物であるウリジンを検出、定量することにより確認することができる。
 〔リンカー1〕
 本発明に係る融合タンパク質としては、リンカー1をさらに含むことが好ましい。この場合、本発明に係る融合タンパク質において、TALE及び前記核酸塩基変換酵素は、リンカー1により連結される。また、本発明に係る融合タンパク質が前記核酸塩基変換酵素を複数含む場合には、それに対応してリンカー1は複数であることが好ましい。本発明に係る融合タンパク質がリンカー1を複数含む場合、これらは、1種のみであっても2種以上の組み合わせであってもよい。
 本発明に係る融合タンパク質がリンカー1をさらに含む場合、リンカー1の鎖長としては、特に制限されないが、1~450アミノ酸残基であることが好ましく、5~250アミノ酸残基であることがより好ましく、5~200アミノ酸残基であることがより好ましく、12~150アミノ酸残基であることがより好ましく、12~104アミノ酸残基であることがさらに好ましい。前記リンカー1の鎖長が前記上限を超えると、融合タンパク質を発現させる場合、その発現効率が低下する傾向にある。
 本発明に係るリンカー1としては、例えば、Yang L et al.,Nat Commun 7 13330(2016)に記載の12アミノ酸、及びNishida,K.et al.,Science 353,aaf8729(2016)に記載の104アミノ酸、Koblan,L.et al.,Nat Biotechnol 36,p.843-846(2018)に記載の32アミノ酸、Sun,N. and Zhao,H.,Mol BioSyst 10,p.446-453(2014),Doi:10.1039/c3mb70412b)に記載のHTS95アミノ酸配列(95アミノ酸)及びその繰り返しが挙げられるが、これに限定されるものではない。
 また、本発明の融合タンパク質としては、前記核酸塩基変換酵素がTALEのC末側に位置する場合には、TALEリピートドメインと、前記核酸塩基変換酵素との間が、1~630アミノ酸残基離れていることが好ましい。そのため、本発明の融合タンパク質としては、前記TALEのC末ドメイン及びリンカー1のうちの少なくとも1種を含むことが好ましい。この場合のTALEリピートドメインと前記核酸塩基変換酵素との間の鎖長(TALEリピートドメインのC末端のC末側に隣接するアミノ酸残基を1残基目として、核酸塩基変換酵素のN末端のN末側に隣接する残基までのアミノ酸残基の数)としては、25~300アミノ酸残基であることがより好ましく、52~174アミノ酸残基であることがさらに好ましい。前記鎖長が前記下限未満であると、塩基編集の効率が低下する傾向にあり、他方、前記上限を超えると、融合タンパク質を発現させる場合、その発現効率が低下する傾向にある。
 なお、このときの前記TALEリピートドメインのC末端の残基は、前記TALEリピートドメインのC末側に位置するtruncated last half-repeat(LHR)の直前(N末側)に位置するTALE配列(好ましくは1単位:33~35アミノ酸)のC末端の残基(LHRが存在しない場合には前記TALEリピートドメインを構成する最後のTALE配列(好ましくは1単位:33~35アミノ酸)のC末端の残基)とすることができる。また、前記核酸塩基変換酵素のN末端の残基は、公知のデータベース(例えば、NCBI)から取得可能な典型的な核酸塩基変換酵素のアミノ酸配列と公知の手法(例えば、BLAST(NCBI))を用いた相同性検索で同一性が85%以上(好ましくは90%以上)であるアミノ酸配列の開始残基(通常はメチオニン)とすることができる。
 〔塩基除去修復インヒビター、リンカー2〕
 本発明に係る融合タンパク質としては、さらにC末側、すなわち、前記核酸塩基変換酵素のC末(前記核酸塩基変換酵素がTALEのC末側に位置する場合)又はTALEのC末(前記核酸塩基変換酵素がTALEのN末側のみに位置する場合)に、リンカー2を介して結合された塩基除去修復インヒビターを含むことが好ましい。塩基除去修復インヒビターをさらに含む場合、当該塩基除去修復インヒビターは、前記融合タンパク質あたり、1つであっても、さらにリンカー2を介して2以上(好ましくは2つ)であってもよい。また、複数である場合には、1種のみであっても2種以上の組み合わせであってもよいが、1種であることが好ましい。
 本発明に係る塩基除去修復インヒビターとしては、塩基除去修復を阻害するものであれば特に制限はないが、DNAグリコシラーゼ阻害剤が好ましい。前記DNAグリコシラーゼ阻害剤としては、チミンDNAグリコシラーゼ阻害剤、ウラシルDNAグリコシラーゼ阻害剤、オキソグアニンDNAグリコシラーゼ阻害剤、アルキルグアニンDNAグリコシラーゼの阻害剤が挙げられる。例えば、前記核酸塩基変換酵素としてデアミナーゼであるシチジンデアミナーゼを用いる場合には、変異により生じたDNAのU:G又はG:Uミスマッチの修復を阻害するため、ウラシルDNAグリコシラーゼ阻害剤(UGI)を用いることが適している。この場合、デアミナーゼとUGIとが一つのポリペプチド上に存在することにより、塩基編集の効率がさらに向上する。
 このようなウラシルDNAグリコシラーゼ阻害剤としては、例えば、枯草菌(Bacillus subtilis)バクテリオファージであるPBS1由来のウラシルDNAグリコシラーゼ阻害剤(UGI)又は枯草菌バクテリオファージであるPBS2由来のウラシルDNAグリコシラーゼ阻害剤(UGI)が挙げられるが、これらに制限されない。これらの塩基配列及びアミノ酸配列は公知であり、公共のデータベース(Genbank等)から取得することができる。また、本発明に係る塩基除去修復インヒビターとしては、上記DNAのミスマッチの修復阻害活性を有する限り、公知の塩基除去修復インヒビターの塩基配列及びアミノ酸配列に基づいて、改変(例えば、アミノ酸残基の置換、挿入、及び/又は欠失の導入)がされたものであってもよい。
 本発明に係る融合タンパク質が前記塩基除去修復インヒビターをさらに含む場合であって、前記塩基除去修復インヒビターが複数である場合には、融合タンパク質-リンカー2-第1の塩基除去修復インヒビター-リンカー2-第2の塩基除去修復インヒビター-・・・のように、リンカー2を介して連結することができる。このときの複数あるリンカー2としては、1種のみであっても2種以上の組み合わせであってもよいが、1種であることが好ましい。
 このようなリンカー2としては、特に制限されないが、鎖長が1~50アミノ酸残基であることが好ましく、5~30アミノ酸残基であることがより好ましく、8~15アミノ酸残基であることがさらに好ましい。前記リンカー2の鎖長が前記下限未満であると、前記塩基除去修復インヒビターの機能性が低下する傾向にあり、他方、前記上限を超えると、融合タンパク質を発現させる場合、その発現効率が低下する傾向にある。
 本発明に係るリンカー2としては、例えば、AddgeneのpCMV_AncBE4max_P2A_GFP(ID:112100)に記載の10アミノ酸が挙げられるが、これに限定されるものではない。
 〔その他〕
 本発明に係る融合タンパク質としては、さらに、N末及び/又はC末に、精製や検出のためのフラグタグ、TALE-核酸塩基変換酵素を細胞核へ移行するための核局在化シグナル(NLS)等を含んでいてもよく、これらは、上記のようにTALEのN末ドメインに含まれていても、融合タンパク質のN末及び/又はC末に付加されていてもよい。
 本発明に係る融合タンパク質は、例えば、上記のTALE及び核酸塩基変換酵素、並びに、必要に応じてリンカー1、前記塩基除去修復インヒビター、リンカー2、及びその他アミノ酸をコードする遺伝子を一体として転写・発現させることで得ることができる。また、本発明に係る融合タンパク質は、従来公知の方法を適宜採用、改良することによって生産することができ、例えば、そのアミノ酸配列に基づいて市販の合成機によって化学的に合成する方法や、下記の標的DNAが編集された細胞の製造方法において述べるように、融合タンパク質をコードするポリヌクレオチド又は該融合タンパク質を発現するベクターを前記細胞に導入して発現させる方法によって得ることができる。
 (CRISPR-Cas9システム)
 本発明に係るCRISPR-Cas9システムは、ヌクレアーゼ活性の一部又は全部を喪失したCas9タンパク質及びそのガイドRNAを含む。
 〔Cas9タンパク質〕
 本発明に係るCRISPR-Cas9システムにおいて、Cas9タンパク質としては、ヌクレアーゼ活性の一部を喪失しているCas9タンパク質(本明細書では「nCas9」という)、又はヌクレアーゼ活性の全部を喪失しているCas9タンパク質(本明細書では「dCas9」という)であることが必要である。すなわち、Cas9タンパク質は、典型的には、標的鎖の切断に関与するドメイン(RuvCドメイン)及び非標的鎖の切断に関与するドメイン(HNHドメイン)を含むが、本発明に係るCas9タンパク質としては、変異の導入等により、少なくとも一方のドメインのヌクレアーゼ活性が喪失していることが必要である。
 このような変異としては、SpCas9タンパク質(S.pyogenes由来のCas9タンパク質)の場合には、例えば、N末端から10番目のアミノ酸(アスパラギン酸)のアラニンへの変異(D10A:RuvCドメイン内の変異)、N末端から840番目のアミノ酸(ヒスチジン)のアラニンへの変異(H840A:HNHドメイン内の変異)、N末端から863番目のアミノ酸(アスパラギン)のアラニンへの変異(N863A:HNHドメイン内の変異)、N末端から762番目のアミノ酸(グルタミン酸)のアラニンへの変異(E762A:RuvCIIドメイン内の変異)、N末端から986番目のアミノ酸(アスパラギン酸)のアラニンへの変異(D986A:RuvCIIIドメイン内の変異)が挙げられる。その他、種々の由来のCas9タンパク質が公知であり(例えば、WO2014/131833)、それらのnCas9又はdCas9を利用することができるが、これらに限定されるものではない。
 なお、Cas9タンパク質のアミノ酸配列及び塩基配列は、公開されたデータベース、例えば、Genbank(http://www.ncbi.nlm.nih.gov)に登録されており(例えば、アクセッション番号:KX151730.1等)、本発明においてはこれらを利用することができる。また、前記Cas9タンパク質には、さらなる変異、例えば、PAM配列の認識を改変するための変異が導入されていてもよく(Benjamin,P.et al.,Nature 523,481-485(2015);Hirano,S.et al.,Molecular Cell 61,886-894(2016))、さらに、細胞核へ移行するための核局在化シグナル(NLS)等を付加したものであってもよい。また、このようなCas9タンパク質としては、市販の入手可能なプラスミド内に含まれる配列にコードされるものであってもよい。
 前記CRISPR-Cas9システムにおけるCas9タンパク質については、ガイドRNA標的配列が、前記標的DNAの標的部位の相補塩基を含むように、下記のガイドRNAが設計される。なお、本発明において、前記標的DNAの標的部位の相補塩基とは、前記標的部位が存在する鎖の相補鎖上の、前記標的部位1塩基の相補塩基を示す。これにより、二本鎖である標的DNAにおいて、一本鎖DNAを露出させるヘリカーゼ活性により標的部位を特異的に露出させ、前記核酸塩基変換酵素による編集効率を向上させる。
 〔ガイドRNA〕
 本発明に係るCRISPR-Cas9システムにおいて、ガイドRNAは、標的となるDNA上の配列(ガイドRNA標的配列)に相補的な塩基配列(以下、場合により「標的化塩基配列」という)を含むcrRNA(CRISPR RNA)と、tracrRNA(trans-activating crRNA)と、の組み合わせである。前記crRNAは、さらに、tracrRNAと相互作用(ハイブリダイズ)が可能な塩基配列を3’側に含む。一方、tracrRNAは、crRNAの一部の塩基配列と相互作用(ハイブリダイズ)が可能な塩基配列を5’側に含むため、前記ガイドRNAは、これら塩基配列の相互作用により、Cas9タンパク質と相互作用する二重鎖RNAを形成する。このため、前記ガイドRNAが、前記標的DNAのガイドRNA標的配列を認識して結合し、当該ガイドRNAと複合体を形成するCas9タンパク質を当該標的DNAに誘導し、誘導されたCas9タンパク質が、そのヘリカーゼ活性によって、当該標的DNAの標的部位において一本鎖DNAを露出する。
 本発明に係るCRISPR-Cas9システムのガイドRNAとしては、crRNA及びtracrRNAを含む一分子ガイドRNA(sgRNA)であっても、crRNA断片とtracrRNA断片とからなる二分子ガイドRNAであってもよい。
 前記標的DNAにおいて、標的部位の塩基の編集は、前記ガイドRNAの標的化塩基配列とガイドRNA標的配列との間の塩基対形成の相補性と、ガイドRNA標的配列の相補鎖の3’側に存在するPAM配列と、の両方によって決定される位置で起きる。本発明に係るCRISPR-Cas9システムのガイドRNAは、そのガイドRNA標的配列が、前記標的部位の相補塩基を含む配列となり、当該標的部位の3’側のPAM配列をCas9タンパク質が認識可能となるように設計される。これにより、二本鎖である標的DNAにおいて、一本鎖DNAを露出させるヘリカーゼ活性により標的部位を特異的に露出させ、前記核酸塩基変換酵素による編集効率を向上させる。
 このようなCas9タンパク質のPAM配列及びガイドRNA標的配列を設計する方法としては、種々の方法が知られており、例えば、E-CRISP(http://www.e-crisp.org/E-CRISP/)、Zifit Targeter(http://zifit.partners.org/ZiFiT/)(Zing Fingerコンソーシアム)、CRISPRdirect(http://crispr.dbcls.jp/)(東京大学)、CRISPR-P(http://cbi.hzau.edu.cn/crispr/)(華中農業大学)、Guide RNA Target Design Tool.(https://wwws.blueheronbio.com/external/tools/gRNASrc.jsp)(Blue Heron Biotech)などを利用して決定することができる。
 本発明に係るCRISPR-Cas9システムは、例えば、下記の標的DNAが編集された細胞の製造方法において述べるように、上記のCas9タンパク質、及びガイドRNAをコードする遺伝子をそれぞれ同時に転写・発現させることで得ることができる。本発明に係るCas9タンパク質、及びガイドRNAは、従来公知の方法を適宜採用、改良することによって生産することができ、例えば、これらをコードするポリヌクレオチド又は該ポリヌクレオチドを含む発現ベクターを前記細胞に導入して発現させる方法によって得ることができる。
 (標的DNA)
 本発明においては、目的とするDNA編集の対象となる標的部位を含むDNAを「標的DNA」という。本発明に係る標的DNAは二本鎖DNAであり、上記の融合タンパク質及びCRISPR-Cas9システムとの対応を示すために、便宜的に、少なくとも一方の鎖が、5’側から順に、TALE認識配列又はその相補配列、スペーサー1、前記標的部位、PAM配列、を含む構造であるものとする。5’側にTALE認識配列の相補配列を含むとは、当該鎖の相補鎖が、TALE認識配列を含むことを示す。すなわち、TALE認識配列は、前記標的部位と同じ鎖上に設定しても、その相補鎖上に設定してもよい。また、当該鎖の相補鎖が、前記標的部位の相補塩基を含むように、ガイドRNA標的配列を含むものとする。本発明に係る標的DNAの構成の一例を下記の図2に示すが、これに限定されるものではない。
 本発明に係る標的部位とは、前記核酸塩基変換酵素による編集(好ましくはデアミナーゼによる脱アミノ化)の標的とする1塩基を示す。ただし、当該1塩基の両側近傍の塩基(特に、デアミナーゼによる脱アミノ化の標的となる塩基が存在する場合。好ましくは、5’側及び3’側のそれぞれ1~10塩基、より好ましくは1~5塩基、さらに好ましくは1~2塩基)がさらに編集(デアミナーゼの場合には脱アミノ化)されることを否定するものではない。
 TALE認識配列は、前記TALEが認識する配列である。TALE認識配列の塩基数としては、10~30塩基、好ましくは13~25塩基、より好ましくは15~20塩基である。前記TALE認識配列は、前記標的部位の5’側に7~31bpの鎖長のスペーサー1を介して存在するように選択される。スペーサー1の鎖長がかかる範囲内にあることにより、特異的かつ高効率で前記標的部位の1塩基を脱アミノ化することができる。前記スペーサー1の鎖長は、標的部位の塩基の5’側に隣接する塩基を1塩基目として、前記TALE認識配列の3’側に隣接する塩基までの長さである。このようなスペーサー1の鎖長としては、10~31bpであることがより好ましく、10~28bpであることがさらに好ましく、13~25bpであることがさらにより好ましい。
 PAM配列は、前記Cas9タンパク質が認識する配列である。PAM配列は、利用するCas9タンパク質の種類によって異なる。典型的なPAM配列としては、例えば、S.pyogenes由来のCas9タンパク質(II型)に対応するPAM配列は5’-NGGであり、S.solfataricus由来のCas9タンパク質(I-A1型)に対応するPAM配列は5’-CCNであり、S.solfataricus由来のCas9タンパク質(I-A2型)に対応するPAM配列は5’-TCNであり、H.walsbyl由来のCas9タンパク質(I-B型)に対応するPAM配列は5’-TTCであり、E.coli由来のCas9タンパク質(I-E型)に対応するPAM配列は5’-AWGであり、E.coli由来のCas9タンパク質(I-F型)に対応するPAM配列は5’-CCであり、P.aeruginosa由来のCas9タンパク質(I-F型)に対応するPAM配列は5’-CCであり、S.Thermophilus由来のCas9タンパク質(II-A型)に対応するPAM配列は5’-NNAGAAであり、S.agalactiae由来のCas9タンパク質(II-A型)に対応するPAM配列は5’-NGGであり、S.aureus由来のCas9タンパク質に対応するPAM配列は、5’-NGRRT又は5’-NGRRNであり、N.meningitidis由来のCas9タンパク質に対応するPAM配列は、5’-NNNNGATTであり、T.denticola由来のCas9タンパク質に対応するPAM配列は、5’-NAAAACである。なお、上記のとおり、Cas9タンパク質を改変すること(例えば、変異の導入)により、PAM認識を改変することも可能である。これにより標的部位の選択肢を拡大することが可能である。
 本発明において、前記PAM配列は前記標的部位の3’側に存在し、前記ガイドRNAが認識するガイドRNA標的配列は、前記PAM配列の位置に応じて決定される。本発明において、前記ガイドRNA標的配列内における前記標的部位の相補塩基の位置は、特に限定されないが、例えば、第1位~第50位の間であることが好ましく、第1位~第30位の間であることがより好ましく、第1位~第25位の間であることがさらに好ましい。なお、前記ガイドRNA標的配列内における塩基の位置は、前記ガイドRNA標的配列の3’末端の塩基を第1位として、前記PAM配列の5’側に隣接する塩基の相補塩基までの位置である。前記塩基位置の上限及び下限は、前記ガイドRNA標的配列の長さに依存し、前記ガイドRNAの長さを調節することにより調整可能である。
 前記ガイドRNAが認識するガイドRNA標的配列は、前記標的部位の相補塩基を含む配列となるように選択される。ガイドRNA標的配列の位置をこのように選択することにより、特異的かつ高効率で前記標的部位の1塩基を編集することができる。本発明に係るガイドRNA標的配列の塩基数としては、好ましくは12~50塩基、より好ましくは17~30塩基、さらに好ましくは17~25塩基である。
 このような標的DNAの塩基配列としては、特に制限されず、TALE認識配列又はその相補配列、スペーサー1、ガイドRNA標的配列の相補配列、前記相補配列に含まれる標的部位、及びPAM配列が、上記条件を満たすように、TALE及びガイドRNAの標的化塩基配列を設計し、及び必要に応じてPAMの認識特異性を改変することにより、本発明のDNA編集方法の標的とすることができる。
 さらに、本発明に係る標的DNAとしては、目的に応じて、細胞内に存在するDNA(内在性DNA)又は細胞外に存在するDNAとすることができる。細胞内に存在するDNAとしては、内因性DNAであっても、外因性DNAであってもよい。内因性DNAとしてはゲノムDNAが挙げられ、外因性DNAとしては、例えば、細胞内に導入したDNAが挙げられる。細胞外に存在するDNAとしては、細胞に由来するDNAであっても、細胞外で増幅、合成したDNAであってもよい。
 (標的DNA編集方法)
 本発明の標的DNA編集方法では、前記融合タンパク質及び前記CRISPR-Cas9システムを、前記標的DNAに接触させ、前記融合タンパク質の核酸塩基変換酵素活性により、前記標的DNAの標的部位の塩基を編集する。
 前記融合タンパク質及び前記CRISPR-Cas9システムを標的DNAに接触させると、融合タンパク質のTALEが標的DNA上のTALE認識配列を認識して結合し、TALEに連結された核酸塩基変換酵素を当該標的DNAに誘導する。他方、CRISPR-Cas9システムのガイドRNAが標的DNA上のガイドRNA標的配列を認識して結合し、当該ガイドRNAと複合体を形成するCas9タンパク質を当該標的DNAに誘導する。これにより、標的部位において、Cas9タンパク質がヘリカーゼ活性によって一本鎖DNAを露出するため、前記核酸塩基変換酵素により、目的の塩基の置換(例えば、塩基の脱アミノ化)を効率的に起こすことができる。これにより、標的部位で1塩基の置換が起こり(例えば、C→U)、また、例えば細胞内では、二本鎖DNAのミスマッチにより、置換が起こった鎖の反対鎖の塩基が置換塩基と対形成するように修復されたり(例えば、G→A)、修復の際に他のヌクレオチドに置換されたり(例えば、U→A、G)、或いは1塩基又は十数塩基の欠失若しくは挿入を生じることにより、種々の変異が導入され得る。
 したがって、本発明に係るDNAの編集には、前記核酸塩基変換酵素で変換された標的部位及びそれを含む近傍における、1以上のヌクレオチドの欠失、他の1以上のヌクレオチドへの置換、若しくは1以上のヌクレオチドの挿入、又はこれらの変異の組み合わせを含む。
 本発明の標的DNA編集方法は、細胞内において行っても、無細胞系において行ってもよい。本発明の標的DNA編集方法の場となる「細胞内」としては、真核細胞内であっても原核細胞内であってもよく、好ましくは真核細胞内である。前記真核細胞としては、例えば、動物細胞(哺乳類、魚類、鳥類、爬虫類、両生類、昆虫類の細胞等)、植物細胞、藻細胞、酵母が挙げられ、前記原核細胞としては、例えば、大腸菌、サルモネラ菌、枯草菌、乳酸菌、高度好熱菌が挙げられる。
 「動物細胞」には、例えば、動物の個体を構成している細胞、動物から摘出された器官・組織を構成する細胞、動物の組織に由来する培養細胞などが含まれる。具体的には、例えば、卵母細胞や精子などの生殖細胞;各段階の胚の胚細胞(例えば、1細胞期胚、2細胞期胚、4細胞期胚、8細胞期胚、16細胞期胚、桑実期胚など);誘導多能性幹(iPS)細胞や胚性幹(ES)細胞などの幹細胞;線維芽細胞、造血細胞、ニューロン、筋細胞、骨細胞、肝細胞、膵臓細胞、脳細胞、腎細胞などの体細胞などが挙げられる。ゲノム編集動物の作成に用いられる卵母細胞としては、受精前及び受精後の卵母細胞を利用することができるが、好ましくは受精後の卵母細胞、すなわち受精卵である。特に好ましくは、受精卵は前核期胚のものである。卵母細胞は、凍結保存されたものを解凍して用いることができる。
 「植物細胞」には、例えば、植物の個体を構成している細胞、植物から分離した器官や組織を構成する細胞、植物の組織に由来する培養細胞などが含まれる。植物の器官や組織としては、例えば、葉、茎、茎頂(生長点)、根、塊茎、カルスなどが挙げられる。
 また、本発明の標的DNA編集方法の場となる「無細胞系」とは、生きた細胞(前記真核細胞、原核細胞)のない系を示す。本発明に係る無細胞系としては、前記融合タンパク質及び前記CRISPR-Cas9システムと、前記標的DNAとが接触可能な系であれば特に制限されず、例えば、緩衝液内;前記真核細胞又は原核細胞の細胞破砕液内、細胞抽出液内等が挙げられる。
 前記融合タンパク質及び前記CRISPR-Cas9システムと、前記標的DNAとを接触させる方法としては特に制限されない。細胞内においては、例えば、下記の標的DNAが編集された細胞の製造方法のように、前記標的DNAを含む細胞に対して前記融合タンパク質及び前記CRISPR-Cas9システムを導入する又はこれらをコードするベクター等を細胞に導入して発現させる方法が挙げられる。無細胞系においては、例えば、標的DNAの溶液と前記融合タンパク質及び前記CRISPR-Cas9システムの溶液とを混合すればよい。これらの溶液の溶媒としては、特に制限されないが、例えば、リン酸緩衝液、Tris緩衝液、グッド緩衝液、ホウ酸緩衝液等の緩衝液が好ましい。
 <標的DNAが編集された細胞の製造方法>
 本発明の標的DNAが編集された細胞の製造方法は、
 標的DNAが編集された細胞を製造する方法であり、
(1)TALE及び核酸塩基変換酵素を含む融合タンパク質、並びに、
(2)ヌクレアーゼ活性の一部又は全部を喪失したCas9タンパク質及びそのガイドRNAを含むCRISPR-Cas9システム
を、細胞に導入又は細胞内で発現させて標的DNAに接触させ、前記融合タンパク質の核酸塩基変換酵素活性により前記標的DNAの標的部位の塩基を編集する工程を含み、
 前記融合タンパク質におけるTALEが認識するTALE認識配列又はその相補配列は、前記標的部位の5’側に7~31bpの鎖長のスペーサー1を介して存在し、かつ、
 前記CRISPR-Cas9システムにおけるガイドRNAが認識するガイドRNA標的配列は、前記標的部位の相補塩基を含むように存在する、
方法である。
 本発明の標的DNAが編集された細胞の製造方法(以下、場合により単に「製造方法」という)において、前記融合タンパク質、CRISPR-Cas9システム、及び標的DNAは、上記の本発明の標的DNA編集方法で述べたとおりである。本発明の製造方法における標的DNAとしては、ゲノムDNAであり、当該ゲノムDNAの編集目的に応じて、前記融合タンパク質及びCRISPR-Cas9システムを設計することができる。
 また、本発明の製造方法において、融合タンパク質及びCRISPR-Cas9システムと細胞内の標的DNAとの接触は、前記融合タンパク質及びCRISPR-Cas9システムの、細胞へのタンパク質の形態での導入、細胞へのポリヌクレオチドの形態での導入、及び/又は、細胞へのポリヌクレオチドの形態での導入若しくは発現ベクターでの導入により細胞内で発現させることにより行う。したがって、前記融合タンパク質及びCRISPR-Cas9システムとしては、前記融合タンパク質及びCas9タンパク質を、それぞれ独立に、タンパク質の形態で細胞に導入しても、当該タンパク質をコードするRNAやDNA(ポリヌクレオチド)の形態で細胞に導入して細胞内で発現させても、当該タンパク質を発現するベクター(発現ベクター)の形態で細胞に導入して細胞内で発現させてもよい。また、これと独立して、前記ガイドRNAを、RNAの形態で細胞に導入しても、当該RNAをコードするDNA(ポリヌクレオチド)の形態で細胞に導入して細胞内で発現させても、当該RNAを発現するベクター(発現ベクター)の形態で細胞に導入して細胞内で発現させてもよい。
 前記融合タンパク質及びCRISPR-Cas9システムを発現ベクターの形態で細胞に導入して細胞内で発現させる場合には、例えば、前記融合タンパク質を発現するベクター、前記Cas9タンパク質を発現するベクター、及び前記ガイドRNAを発現するベクターをそれぞれ細胞内に導入してもよく、また、これらのうちの2種以上を組み合わせて発現するベクターを細胞内に導入してもよい。
 また、前記融合タンパク質及びCRISPR-Cas9システムを発現ベクターの形態で細胞に導入して細胞内で発現させる場合、前記融合タンパク質及び前記Cas9タンパク質をコードするポリヌクレオチドとしては、それぞれ独立して、導入する細胞に応じて適宜コドン最適化されたものであってもよい。また、当該発現ベクターとしては、発現させるべきポリヌクレオチドに作動可能に連結しているプロモーター及び/又はその他の制御配列を含むことが好ましい。さらに、当該発現ベクターとしては、宿主ゲノムに組み込まれることなく、コードするタンパク質を安定して発現することができるものであることが好ましい。このような発現ベクターは、適宜従来公知の方法に準じて作製することができる。
 前記融合タンパク質及び前記CRISPR-Cas9システムの、タンパク質、当該タンパク質をコードするポリヌクレオチド、当該タンパク質を発現するベクターを細胞に導入する方法としては、タンパク質やDNA、RNA断片を細胞に導入するための公知の方法を細胞の種類に応じて適宜採用することができ、このような方法としては、例えば、電気穿孔法(エレクトロポレーション法)、マイクロインジェクション法、パーティクルガン法、リン酸カルシウム法、ポリエチレンイミン(PEI)法、リポソーム法(リポフェクション法)、DEAE-デキストラン法、カチオン性脂質媒介トランスフェクション、ウイルス(アデノウイルス、レンチウイルス、アデノ随伴ウイルス、バキュロウィルス等)、アグロバクテリウム法、酢酸リチウム法、スフェロプラスト法、熱ショック法(塩化カルシウム法、塩化ルビジウム法)等が挙げられる。このような方法は、「Leonard G.Daviset al.,Basic methods in molecular biology,New York:Elsevier,1986」等、多くの標準的研究室マニュアルに記載されている。
 前記融合タンパク質及び前記CRISPR-Cas9システムが細胞に導入又は細胞内で発現すると、前記融合タンパク質及び前記CRISPR-Cas9システムと細胞内の標的DNAとが接触し、上記の本発明の標的DNA編集方法で述べた標的DNA編集により、標的部位で目的の1塩基の塩基の置換が起こり、その結果、標的DNAが編集された細胞を得ることが可能となる。
 本発明はまた、前記標的DNAの編集がされた細胞を含む非ヒト個体の作製方法を提供する。この方法は、上記の製造方法により得られた細胞から非ヒト個体を作製する工程を含む。前記非ヒト個体としては、例えば、非ヒト動物及び植物が挙げられる。前記非ヒト動物としては、哺乳類(マウス、ラット、モルモット、ハムスター、ウサギ、サル、ブタ、ウシ、ヤギ、ヒツジなど)、魚類、鳥類、爬虫類、両生類、昆虫類が挙げられる。モデル動物を作製する場合、哺乳動物は、好ましくは、マウス、ラット、モルモット、ハムスターなどのげっ歯類であり、特に好ましくはマウスである。前記植物としては、例えば、穀物類、油料作物、飼料作物、果物、野菜類が挙げられる。具体的な作物としては、例えば、イネ、トウモロコシ、バナナ、ピーナツ、ヒマワリ、トマト、アブラナ、タバコ、コムギ、オオムギ、ジャガイモ、ダイズ、ワタ、カーネーションを例示することができる。
 前記標的DNAの編集がされた細胞から非ヒト個体を作製する方法としては、公知の方法を利用することができる。動物において細胞から非ヒト個体を作製する場合、通常、生殖細胞又は多能性幹細胞が利用される。例えば、前記融合タンパク質及び前記CRISPR-Cas9システムを卵母細胞にマイクロインジェクションし、得られた卵母細胞を偽妊娠状態にした雌非ヒト哺乳動物の子宮に移植し、その後産仔を得ることができる。また、植物においては、古くから、その体細胞が分化全能性を有していることが知られており、例えば、前記融合タンパク質及び前記CRISPR-Cas9システムを植物細胞にマイクロインジェクションし、得られた植物細胞から植物体を再生することにより、所望のDNAが編集された植物体を得ることができる。また、得られた非ヒト個体からは、所望のDNAが編集された子孫やクローンを得ることもできる。
 標的DNA編集の有無の確認、及び遺伝子型の決定は、従来公知の手法に基づいて行うことができ、例えばPCR法、配列決定法、サザンブロッティング法等を利用することができる。
 <DNA編集システム>
 また、本発明は、上記本発明の標的DNA編集方法、本発明の標的DNAが編集された細胞の製造方法、又は上記本発明の非ヒト個体の作製方法に用いるための、
(1)TALE及び核酸塩基変換酵素を含む融合タンパク質、並びに、
(2)ヌクレアーゼ活性の一部又は全部を喪失したCas9タンパク質及びそのガイドRNAを含むCRISPR-Cas9システム
を含む、DNA編集システムを提供する。
 前記融合タンパク質、及びCRISPR-Cas9システムは、上記の本発明の標的DNA編集方法及び製造方法で述べたとおりである。これらはそれぞれ独立して、タンパク質又はRNAの形態であっても、当該タンパク質又はRNAをコードするポリヌクレオチドの形態であっても、当該タンパク質又はRNAを発現するベクター(発現ベクター)の形態であってもよい。
 また、ベクターの形態である場合、本発明は、標的DNAの標的部位に応じて、ユーザーが前記融合タンパク質及びCRISPR-Cas9システムを設計することができるように、
(a)TALEをコードするポリヌクレオチドの挿入部位と前記融合タンパク質のTALE以外をコードするポリヌクレオチドを含むベクター、並びに、
(b)ヌクレアーゼ活性の一部又は全部を喪失したCas9タンパク質をコードするポリヌクレオチド、又は、該ポリヌクレオチドを含むベクター、
(c)前記Cas9タンパク質のガイドRNAをコードするポリヌクレオチド、又は、該ポリヌクレオチドを含むベクター若しくは該ポリヌクレオチドの挿入部位を含むベクター、
を含む、DNA編集システムを提供する。なお、(a)~(c)の各ベクターは、それぞれ、各ポリヌクレオチドを発現可能にする発現ユニットを含むものである。
 本発明のDNA編集システムは、それぞれ、前記融合タンパク質及び前記CRISPR-Cas9システムを含む組み合わせからなる組み合わせ物としても、前記組み合わせを含むキットとしてもよい。キットとする場合、当該キットは、一つ又は複数の追加の試薬をさらに含んでいてもよい。このような追加の試薬としては、例えば、希釈緩衝液、再構成溶液、洗浄緩衝液、核酸導入試薬、タンパク質導入試薬、対照試薬(例えば、対照のデアミナーゼ)が挙げられるが、これらに制限されるものではない。また、当該キットは、本発明の方法を実施するための使用説明書をさらに含んでいてもよい。
 前記キットに含まれる各要素は、それぞれ別個の容器に収容されていてもよいし、同一の容器に収容されていてもよい。各要素は、一回の使用量ごとに容器に収容されていてもよいし、複数回分の量が一つの容器に収容されていてもよい。各要素は乾燥形態で容器に収容されていてもよいし、適当な溶媒(緩衝液、安定剤、保存剤、防腐剤等を含む溶媒)中に溶解した形態で容器に収容されていてもよい。
 以下、実施例に基づいて本発明をより具体的に説明するが、本発明は以下の実施例に限定されるものではない。
 1.レポータープラスミドの作製
 レポーターとして、pNLF1-C[CMV Hygro](PROMEGA社製,WI,USA)を用い、部位特異的変異導入法によって71番目と107番目のメチオニンコドン(ATG)をアラニンコドン(ATA)に変更してpNLF-M/Aとした。次いで、pNLF-M/Aに、先ず、下記の表1に示した配列(BEtag)を挿入した。BEtag配列は、TALE認識配列(表1中の下線(*1):5’-tACAGAAGCGGGCAAAGG-3’;小文字はTALEのN末ドメインが認識するチミンを示す)、ターゲットコドン(表1中の下線(*2):5’-ACG-3’)、及びこれらの間のスペーサー1配列を含み、スペーサー1配列の長さは、ターゲットコドンの5’にある塩基(A)を含めて、7bp、13bp、19bp、25bp、又は31bpとした。各BEtag配列(BEtag-7~31bp:配列番号1~5)には、両端にNheI認識サイト及びSbfI認識サイトを付加できるように設計したオリゴヌクレオチドをアニールして、NheI及びSbfIで処理したpNLF-M/Aに挿入し、pNLF-BEtag(pNLF-BEtag-7bp~31bp)とした。
 なお、前記TALE認識配列は、細胞内活性が確認されているhuman adenomatous polyposis coli遺伝子に対するTALENのRight TALE 配列(Sakuma et al.,”Repeating pattern of non-RVD variations in DNA-binding modules enhances TALEN activity.”,Sci.Rep.,3:3379(2013))である。
 さらに、pNLF-BEtagにPAM配列(5’-NGG-3’)を挿入するため、下記の表1に示したPAM部を含む配列(PAM:配列番号6)のオリゴヌクレオチドと、そのアンチセンス配列の5’末端に5’-TCGA-3’を付加したオリゴヌクレオチドとをアニールして、EcoRV及びXhoIで処理した各pNLF-BEtagに挿入し、レポータープラスミド(pNLF-BEtag-7bp-PAM、pNLF-BEtag-13bp-PAM、pNLF-BEtag-19bp-PAM、pNLF-BEtag-25bp-PAM、pNLF-BEtag-31bp-PAM)を作製した。
 PAM部(表1中の下線(*3))には、9個の連続した「G」が含まれるため、PAM部の5’側に位置するガイドRNA標的配列の相補配列が1塩基ずつ3’側にずれるようにガイドRNAを設計することにより、PAM配列の位置を1塩基ずつ下流にずらすことができ、これにより、8箇所のPAM配列(下記の表7のPAM1~8)を設定することができる。下記の表1に、pNLF-M/Aプラスミドに挿入した各配列を示す。
Figure JPOXMLDOC01-appb-T000001
 完成したレポータープラスミドの構造を示す概念図を図1に示す。また、TALE認識配列、スペーサー1、標的部位、PAM部、及びガイドRNA標的配列を含むNheI認識サイトからXhoI認識サイトまでの配列を図2に示す。このレポータープラスミドにおいて、ターゲットコドンは、NanoLucルシフェラーゼの開始コドンに相当する箇所に位置しており、かかるレポータープラスミドによれば、TALE認識配列に結合したTALE-デアミナーゼにより、ターゲットコドンであるACGがATGに変換される(ターゲット塩基(標的部位)であるCがTに置換される)と、NanoLucルシフェラーゼを発現する(図3)。
 2.TALEベクターセット及びTALE発現プラスミドの作製
 TALEベクターセットの配列及び構成は、TALEリピートユニットが上記1.で作製したレポータープラスミドのTALE認識配列に対応するように、Sakuma et al.(2013)にしたがって構築した。先ず、12番目と13番目の2アミノ酸で構成される可変残基の4種(RVD:HD、NG、NI、NN)をコードする配列以外のモジュール配列(non-repeat-variable di-residue(non-RVD))に改変(特に、4番目と32番目)を加え、さらにその両端に制限酵素BsAI認識サイトを付加した配列(モジュール配列)を人工DNA合成した(計16種:1HD~4HD、1NG~4NG、1NI~4NI、1NN~4NN)。次いで、これらモジュール配列をpEX-A2J2(Eurofins Genomics社製,Tokyo,Japan)に挿入して、モジュールプラスミドセット(計16種:pEX1HD~pEX4HD、pEX1NG~pEX4NG、pEX1NI~pEX4NI、及びpEX1NN~pEX4NN)を作製した。
 また、アレイプラスミドを構成するDNA配列FUS2_aXX(計7種:XX=1a、2a、2b、3a、3b、4a、4b)及びFUS2_b(1-4)(計4種)を人工DNA合成により作製した。これらをpCR8/GW/TOPO (Thermo Fisher Scientific社製,Waltham,MA,USA)に挿入して、pCR8_FUS2_aXX及びpCR8_FUS_b(1-4)を作製した。次いで、これをSakuma et al.(2013)に記載のPlatinum Gateシステムにおける最初のアセンブルステップ(ステップ1)の捕捉ベクターとして使用し、同文献に記載の方法にしたがって、TALE配列を連結したアレイプラスミドを作製した。
 次いで、pcDNA3.1(+)(Thermo Fisher Scientific社製)から薬剤耐性遺伝子発現ユニットを除去したpcDNA3.1sに、人工DNA合成により作製した、TALEのN末ドメインをコードする配列に加え、前記モジュール配列を1つと、この3’末に続くTALEのC末ドメインをコードする配列と、を挿入したデスティネーションベクター(TALE-WT、TALE-63、TALE-47)を作製した。TALEのC末ドメインとしては、野生型(WT:C末ドメインのアミノ酸数=180)、C末ドメインのアミノ酸数が63のもの(63)、C末ドメインのアミノ酸数が47のもの(47)、の3種を用い、「WT」をコードする配列はAddgeneのpTALETF_v2(ID:32185~32188)に含まれるC末ドメインの配列を、「63」をコードする配列はAddgeneのpTALEN_v2(ID:32189~32192)に含まれるC末ドメインの配列を、「47」をコードする配列はAddgeneのptCMV-153/47-VR-NG(Addgene ID:50704)に含まれるC末ドメインの配列を、それぞれ参照して人工DNA合成した。また、TALEのN末ドメインとしては、これらC末ドメインに対応させて、WT:AddgeneのpTALETF_v2(ID:32185~32188)に含まれるN末ドメインの配列;63:AddgeneのptCMV-136/63-VR-HD(ID:50699)に含まれるN末ドメインの配列;47:AddgeneのptCMV-153/47-VR-HD(ID:50703)に含まれるN末ドメインの配列を、それぞれ参照して人工DNA合成した。上記で作製したアレイプラスミド及びデスティネーションベクターを用いて、Sakuma et al.(2013)に記載の方法にしたがい、Golden Gate法によってTALE発現プラスミドを作製した。
 3.TALE-デアミナーゼ発現プラスミドの作製(1)
 (1)104アミノ酸リンカーシリーズ
 先ず、人工DNA合成により作製したAncBE4max遺伝子(Koblan et al.,”Improving cytidine and adenine base editors by expression optimization and ancestral reconstruction.”,Nat Biotechnol,36,p.843-846(2018))と、Target-AID遺伝子(Nishida et al.,”Targeted nucleotide editing using hybrid prokaryotic and vertebrate adaptive immune systems.”,Science 353,aaf8729(2016))と、をpcDNA3.1sのBamHI認識サイトとEcoRV認識サイトとの間にそれぞれ挿入することにより、AncBE4max発現プラスミド及びTarget-AID発現プラスミドを作製した。
 次いで、104アミノ酸リンカー1を有するTALE-デアミナーゼ発現プラスミドを以下の方法により作製した。すなわち、上記AncBE4max発現プラスミドのAncBE4max遺伝子を鋳型として、下記の表2に記載のプライマーを用いて、Anc689デアミナーゼ遺伝子(Anc689 deaminase:プライマー配列番号7~8)、10アミノ酸リンカー2及びUGI遺伝子の2回繰り返し配列(10aa linker-β-lactamase:プライマー配列番号11~12)をそれぞれPCRにより増幅した。また、上記Target-AID発現プラスミドのTarget-AID遺伝子を鋳型として、下記の表2に記載のプライマーを用いて、PmCDA1デアミナーゼ遺伝子(PmCDA1:プライマー配列番号9~10)、及び104アミノ酸リンカー1をコードする配列(104aa linker:プライマー配列番号13~17)をPCRにより増幅した。さらに、β-lactamaseからTALEのN末ドメイン(WT、63、又は47)をコードする配列までを含む配列(プライマー配列番号22~25)をPCRにより増幅した。下記の表2に、TALE-デアミナーゼ発現プラスミドを構築するために使用した各プライマー及びその配列番号を示す。表2中、104aa linkerのfor以下は、例えば、「WT-104-BE4」は、当該配列が、TALEのC末ドメインがWTであり、かつ、前記104アミノ酸リンカー1及びAnc689デアミナーゼ(BE4)を含むTALE-デアミナーゼ用のリンカー1をコードする配列であることを示す。なお、下記の各表中、「AID」は、デアミナーゼがAIDであることを示すものではなく、「Target-AID」に由来するPmCDA1であることを示す。
Figure JPOXMLDOC01-appb-T000002
 各デアミナーゼ、104アミノ酸リンカー1をコードする配列、及び10アミノ酸リンカー2及びUGI遺伝子の2回繰り返し配列を、上記2.で作製したβ-lactamaseからTALEのN末ドメイン(WT、63、又は47)をコードする配列までを含む配列と、TALEのC末ドメイン(WT、63、又は47)をコードする下流(3’側)配列との間にIn-Fusion法(TaKaRa Bio Inc,Shiga,Japan)により挿入し、N末から順に、TALE(N末ドメイン(WT、63、又は47)-TALEリピートドメイン-C末ドメイン(WT、63、又は47))、104アミノ酸リンカー1(104aa)、デアミナーゼ(Anc689デアミナーゼ(BE4)又はPmCDA1デアミナーゼ(AID))、10アミノ酸リンカー2(10aa)、UGI遺伝子(UGI)、10アミノ酸リンカー2(10aa)、及びUGI遺伝子(UGI)の順で結合されたTALE-デアミナーゼを発現するプラスミド(TALE-デアミナーゼ発現プラスミド)を作製した。前記TALE-デアミナーゼの構造を示す概念図を図4に示す。
 (2)12アミノ酸リンカーシリーズ
 また、前記104アミノ酸リンカー1に代えて、12アミノ酸リンカー1(12aa)を有するTALE-デアミナーゼ発現プラスミドは以下の方法で作製した。すなわち、先ず、下記の表3に記載のオリゴヌクレオチドをそれぞれアニーリングさせて12アミノ酸リンカー1をコードする配列を作製した。表3中、12aa linker(配列番号18~21)のfor以下は、例えば、「TALE_WT-12-AID」は、当該配列が、TALEのC末ドメインがWTであり、かつ、前記12アミノ酸リンカー1及びPmCDA1デアミナーゼ(AID)を含むTALE-デアミナーゼ用のリンカー1をコードする配列であることを示す。かかる12アミノ酸リンカー1は、Yang L et al.,”Engineering and optimising deaminase fusions for genome editing.”,Nat Commun 7 13330(2016)に記載の12アミノ酸からなる。次いで、上記TALE-デアミナーゼ発現プラスミドの104アミノ酸リンカー1をコードする配列以外を、下記の表4に示したプライマー(配列番号9、22~24)を用いて、それぞれ、インバースPCRにて増幅し、前記12アミノ酸リンカー1をコードする配列をIn-Fusion法により挿入した。下記の表3に、12アミノ酸リンカー1をコードする配列及びその配列番号を示し、表4に、インバースPCRに使用したプライマー及びその配列番号を示す。
Figure JPOXMLDOC01-appb-T000003
Figure JPOXMLDOC01-appb-T000004
 (3)アミノ酸長調整リンカーシリーズ
 さらに、TALE-47-104-AIDにおいて、104アミノ酸リンカー1に代えて、同104アミノ酸リンカー1のC末側から順にアミノ酸を欠失させ、アミノ酸長を12、24、36、48、60、又は84となるようにした各アミノ酸リンカー1をコードするTALE-デアミナーゼ発現プラスミドを以下の方法で作製した。すなわち、上記TALE-デアミナーゼ発現プラスミドの、欠失させるアミノ酸をコードする配列以外を、下記の表5に記載のプライマー(配列番号9、26~31)を用いてインバースPCRにて増幅し、In-Fusion法によりセルフライゲーションさせることで作製した。下記の表5に、TALE-47-104-AIDのアミノ酸リンカー1欠失変異体作製に使用したプライマー及びその配列番号を示す。
Figure JPOXMLDOC01-appb-T000005
 また、TALE-デアミナーゼのネガティブコントロール(NC)として、TALEリピートユニットがヒトゲノムに結合しないように、上記1.で作製したレポータープラスミドのTALE認識配列に代えて、次のNC配列:5’-tTGCGCGTATAGTCGCG-3’(配列番号:32)を認識して結合するように構築したTALE-デアミナーゼ-NCを発現するようにしたこと以外は上記と同様にして、各TALE-デアミナーゼに対応するTALE-デアミナーゼ-NCを発現するプラスミド(TALE-デアミナーゼ-NC発現プラスミド)をそれぞれ作製した。
 作製した各発現プラスミドにおける、TALE-デアミナーゼ、及びそのネガティブコントロール(TALE-デアミナーゼ-NC)の構成及びその配列を示す配列番号(塩基配列の配列番号、アミノ酸配列の配列番号)の一覧を下記の表6にそれぞれ示す。
Figure JPOXMLDOC01-appb-T000006
 4.Cas9発現プラスミドの作製
 先ず、pX330(Addgene,Cambridge,MA;Plasmid 42230)のU6プロモーターからBGHポリA付加配列までの領域を人工DNA合成し、pBlueScriptII(SK+)(Stratagene,La Jolla,CA,USA)のEcoRV認識サイトとBamHI認識サイトとの間にIn-Fusion法により挿入することでCas9発現プラスミドpX330_BSを作製した。次いで、pX330_BSのCas9遺伝子に対してPCRによる部位特異的変異導入法を行うことにより、ニッカーゼタイプのnCas9(D10A)発現プラスミド、及び切断活性のないdCas9(D10A+H840A)発現プラスミドをそれぞれ作製した。
 5.ガイドRNA発現プラスミドの作製(1)
 先ず、上記4.で作製したpX330_BSをXbaI及びNotIで処理してCas9遺伝子を除去し、フィルイン反応後、セルフライゲーションによりプラスミド(pX330_BS-ΔCas9)を作製した。次いで、下記の表7に示した、ガイドRNAの標的配列(表7には、ガイドRNAの標的配列(アンチセンス鎖上)の相補配列を示す)(表7の下線以外の配列)に対応するように設計したオリゴヌクレオチドをアニールさせ、BpiI処理とライゲーションとによってpX330_BS-ΔCas9に挿入して、各ガイドRNA(sgRNA-1~8)を発現するプラスミド(ガイドRNA発現プラスミド1~8)を作製した。下記の表7に、ガイドRNAの標的配列の相補配列(下線以外)及びCas9のPAM配列(下線)を示す。
Figure JPOXMLDOC01-appb-T000007
 6.HEK細胞への形質転換(1)
 10%FBSを含むDMEM培地で生育させたHEK293T細胞を5×10細胞ずつ96ウェルプレートの各ウェルに播種した。表6に記載のTALE-デアミナーゼ発現プラスミド、及びTALE-デアミナーゼ-NC発現プラスミドのうちのいずれか75ng;上記4.で作製したnCas9発現プラスミド又はdCas9発現プラスミド50ng;上記5.で作製したガイドRNA発現プラスミド1~8及びpX330_BS-ΔCas9(ガイドRNAなし)のうちのいずれか10ng;上記1.で作製したレポータープラスミドのうちのいずれか20ng;並びにリファレンスプラスミドであるpGL4.54(PROMEGA社製)5ng;をLipofectamine LTX(Thermo Fisher Scientific社製)を用いてHEK293T細胞に導入した。リファレンスプラスミドは、ホタルルシフェラーゼ(Fluc)を発現するプラスミドである。
 また、ポジティブコントロールとして、上記3.で作製したAncBE4max発現プラスミド75ng;上記5.で作製したガイドRNA発現プラスミド1~8及びpX330_BS-ΔCas9(ガイドRNAなし)のうちのいずれか10ng;上記1.で作製したレポータープラスミドのうちのいずれか20ng;pGL4.54 5ng;を組み合わせてHEK293T細胞に導入した。
 7.NanoLucルシフェラーゼ活性値の測定
 形質転換してから24時間培養後に培地を除去し、PBS(-)で洗浄後、Passive Lysis Buffer(PROMEGA社製)で処理して細胞を溶解し、細胞溶解液とした。前記細胞溶解液をDMEM培地で100倍に希釈し、Nano-Glo Dual-Luciferase Reporter Assay System(PROMEGA社製)を用いて、TriStar S LB942 プレートリーダー(Berthold Technologies社製,Bad Wildbad,Germany)でNanoLucルシフェラーゼ活性スコア及びホタルルシフェラーゼ活性スコアを測定した。
 各スコアのネガティブコントロールとしては、TALE-デアミナーゼ-NC発現プラスミドを導入した細胞についてのNanoLucルシフェラーゼ活性スコアを測定した。なお、ポジティブコントロール(AncBE4max発現プラスミドを導入した細胞)に対しては、pX330_BS-ΔCas9発現プラスミドを導入した細胞(ガイドRNAを発現させていない細胞)についての活性スコアを測定してネガティブコントロール(AncBE4max-NC)とした。
 活性の数値化は以下のように行った。先ず、リファレンスプラスミドによるホタルルシフェラーゼ活性スコアを用いて各NanoLucルシフェラーゼ活性スコアを標準化した。次いで、標準化された活性スコアを用い、TALE-デアミナーゼ発現プラスミドを導入した細胞の活性スコアからTALE-デアミナーゼ-NC発現プラスミドを導入した細胞の活性スコアを差し引き、TALE-デアミナーゼ活性の活性値とした。また、AncBE4maxの発現プラスミドを導入した細胞の活性スコアからAncBE4max-NCを差し引き、AncBE4max活性値とした。さらに、各試験間でTALE-デアミナーゼ活性を比較するために、TALE-デアミナーゼ活性値は、後述するPAM2の条件下でのAncBE4max活性値を1とした時の相対活性で示した。試験は少なくとも3回繰り返して行い、平均値に標準偏差を付与してグラフ化した。
 <試験1> Base editorの活性に及ぼすPAM配列の位置の影響
 ポジティブコントロールとして、既存のBase editorであるAncBE4maxが最も高い活性を示すPAM配列の位置を調べるために、PAM配列の位置を1塩基ずつ3’側(下流)に移動させ(PAM1~PAM8)、塩基編集活性を調べた。
 AncBE4maxでは、PAM配列の位置を標的DNA配列において21~23番目の位置とした場合、塩基編集活性の高いターゲット塩基の位置は同標的DNA配列の4~8番目となる関係であることが知られている(Rees,H.A. and Liu,D.R.,Nat Rev Genet 19,770-788(2018))。本研究で用いているレポーターでは、上記のようにガイドRNAの標的配列が変わるように設計することによりPAM配列の位置を表7に記載のPAM1からPAM8まで変更することができるため、それに応じてターゲット塩基の位置が変更されることになる。
 上記6.において、上記3.で作製したAncBE4max発現プラスミドと、上記5.で作製したガイドRNA発現プラスミド1~8のうちのいずれかと、上記1.で作製したレポータープラスミド(スペーサー1:19bp)と、リファレンスプラスミドであるpGL4.54と、を組み合わせてHEK293T細胞に導入し、上記7.によりAncBE4max活性値をそれぞれ取得した。また、ネガティブコントロールとしては、ガイドRNA発現プラスミドに代えてpX330_BS-ΔCas9を用いた。
 結果を図5に示す。図5では、ガイドRNA発現プラスミド2を用いたとき、すなわち、PAM2のときのAncBE4max活性値を1.0として、各ガイドRNA発現プラスミド1~8を用いたとき、すなわち、PAM1~8のときのAncBE4max活性値を示す。図5に示したように、AncBE4max活性値は、PAM2の時に最大活性を示すことがわかった。したがって、PAM2の時のAncBE4max活性値を以下の活性評価のためのポジティブコントロールと定めた。
 <試験2> TALE-デアミナーゼの活性に及ぼすスペーサー1長の影響
 (BE4シリーズ)
 TALEのC末ドメインがWT又は47であり、アミノ酸リンカー1が104アミノ酸であり、デアミナーゼがBE4(Anc689)である2種類のTALE-デアミナーゼ(WT-104-BE4、47-104-BE4)について、PAM配列の位置をPAM2に固定して、レポーターのスペーサー1の長さが活性に与える影響を調べた。スペーサー1の長さは、7bp、13bp、19bp、25bp、31bpとした。また、Cas9/ガイドRNAとしては、nCas9(D10A)及びガイドRNAの発現あり(nCas9)、dCas9(D10A+H840A)及びガイドRNAの発現あり(dCas9)、nCas9の発現あり及びガイドRNAの発現なし(nCas9/ガイドなし)の3条件について検討した。
 上記6.において、上記3.(1)で作製したTALE-デアミナーゼ発現プラスミド(WT-104-BE4又は47-104-BE4)又はこれに対応するTALE-デアミナーゼ-NC発現プラスミドと、上記4.で作製したnCas9発現プラスミド又はdCas9発現プラスミドと、上記5.で作製したガイドRNA発現プラスミド2又はpX330_BS-ΔCas9と、上記1.で作製したレポータープラスミド(スペーサー1:7~31bp)と、リファレンスプラスミドであるpGL4.54と、を組み合わせてHEK293T細胞に導入し、上記7.によりTALE-デアミナーゼ活性値(AncBE4max活性値に対する割合)をそれぞれ取得した。
 結果を図6に示す。図6に示したように、いずれのTALE-デアミナーゼ(BE4)においても、ガイドRNAが存在しない場合、すなわちnCas9がターゲット塩基付近に結合していない場合には活性が認められなかった。また、nCas9を用いてボトムストランドにニックを入れた方が、dCas9を用いてニックが入らない時よりも活性が高かった。スペーサー1の長さについては、13bp及び25bpの場合に特に高い活性を示し、25bpの場合にさらに高い活性を示した。TALEのC末ドメインについては、WT(例えば、nCas9、スペーサー1長:25bpでは、0.19±0.01)より47(0.29±0.03)の方が活性が高かった。
 (AIDシリーズ)
 TALEのC末ドメインがWT、63、又は47であり、アミノ酸リンカー1が104アミノ酸又は12アミノ酸であり、デアミナーゼがAID(PmCDA1)である6種類のTALE-デアミナーゼ(WT-104/12-AID、63-104/12-AID、47-104/12-AID)について、上記のBE4と同様にして、レポーターのスペーサー1の長さが活性に与える影響を調べた。
 結果を図7に示す。図7に示したように、いずれのTALE-デアミナーゼ(AID)においても、ガイドRNAが存在しない場合、すなわちnCas9がターゲット塩基付近に結合していない場合には活性が認められなかった。また、WT-104-AID、63-104-AID、WT-12-AID、63-12-AIDでは、デアミナーゼがBE4である場合と同様に、nCas9を用いてボトムストランドにニックを入れた方が、dCas9を用いてニックが入らない時よりも活性が高かった。一方、47-104-AID、47-12-AIDでは、ニックの効果がそれほど顕著ではなかった。
 スペーサー1の長さについては、全てのTALE-デアミナーゼ(AID)で25bpの場合に高い活性を示し、63-104-AID、47-12-AIDでは、19bpでも同様に高い活性を示した。TALEのC末ドメインについては、104アミノ酸リンカー1の場合、活性はWT(例えば、nCas9、スペーサー1長:25bpでは、0.09±0.00)、63(0.16±0.01)、47(0.4±0.03)(図7-A、B、C);12アミノ酸リンカー1では、活性はWT(0.32±0.02)、63(0.38±0.03)、47(0.57±0.02)(図7-D、E、F)となり、アミノ酸リンカー1の長さが同じ場合は47>63>WTの関係にあった。また、TALEのC末ドメインが同様のもので比較した場合には、12アミノ酸リンカー1の方が104アミノ酸リンカー1よりも活性が高かった。最も高い活性を示したTALE-デアミナーゼ(AID)は、47-12-AID(例えば、nCas9、スペーサー1長:19bpでは、0.57±0.2)であった。
 <試験3> TALE-デアミナーゼの活性に及ぼすPAM配列の位置の影響
 レポーターのスペーサー1の長さを固定し、PAM配列の位置を1塩基ずつ3’側(下流)に移動させて、PAM配列の位置(つまり、Cas9の位置に対応する)がTALE-デアミナーゼの活性に与える影響を調べた。スペーサー1長としては、試験2で活性評価を行った際に比較的活性が高かった13bp、19bp、25bpについて検討を行った。
 上記6.において、上記3.(1)(2)で作製したTALE-デアミナーゼ発現プラスミド(AIDシリーズ:WT-104/12-AID、63-104/12-AID、47-104/12-AID)又はこれに対応するTALE-デアミナーゼ-NC発現プラスミドと、上記4.で作製したnCas9発現プラスミドと、上記5.で作製したガイドRNA発現プラスミド1~8と、上記1.で作製したレポータープラスミド(スペーサー1:13、19、又は25bp)と、リファレンスプラスミドであるpGL4.54と、を組み合わせてHEK293T細胞に導入し、上記7.によりTALE-デアミナーゼ活性値(AncBE4max活性値に対する割合)をそれぞれ取得した。
 結果を図8に示す。図8に示したように、47-12-AID以外のTALE-デアミナーゼ(AIDシリーズ)では、スペーサー1長が19bpの時に高い活性を示した。PAM配列の位置としては、WT-104-AIDではPAM6(例えば、スペーサー1長:19bpでは、0.42±0.08)又はPAM7(0.38±0.05)(図8-A)、63-104-AIDではPAM7(0.39±0.00)(図8-B)、47-104-AIDでもPAM7(0.90±0.10)(図8-C)、WT-12-AIDでもPAM7(0.91±0.04)(図8-D)、63-12-AIDではPAM6(0.49±0.02)(図8-E)で、それぞれ高い活性を示した。一方、47-12-AIDでは、スペーサー1長が13bpの時にはPAM4(0.86±0.02)又はPAM7(0.96±0.03)で、スペーサー1長が19bpの時にはPAM1(0.79±0.05)で、スペーサー1長が25bpの時にはPAM6(0.74±0.13)で、それぞれ高い活性を示した(図8-F)。その中で活性が高かったのは、47-104-AIDのスペーサー1長:19bp/PAM7(0.90±0.10)、WT-12-AIDのスペーサー1長:19bp/PAM7(0.91±0.04)、47-12-AIDのスペーサー1長13bp/PAM7(0.96±0.03)であった。
 <試験4> TALE-デアミナーゼの活性に及ぼすアミノ酸リンカー1長の影響
 上記試験3から、アミノ酸リンカー1として、104アミノ酸よりも12アミノ酸の方が活性が高いことが判明したが、そのアミノ酸長自体については検討していない。そこで、上記3.(3)で作製したTALE-デアミナーゼ発現プラスミド(47-12’~84’-AID:アミノ酸リンカー1長:84アミノ酸、60アミノ酸、36アミノ酸、24アミノ酸、12アミノ酸)を用いて、アミノ酸リンカー1の長さの影響を調べた。
 上記6.において、上記3.(3)で作製した各TALE-デアミナーゼ発現プラスミド又はこれに対応するTALE-デアミナーゼ-NC発現プラスミドと、上記4.で作製したnCas9発現プラスミドと、上記5.で作製したガイドRNA発現プラスミド2と、上記1.で作製したレポータープラスミド(スペーサー1:25bp)と、リファレンスプラスミドであるpGL4.54と、を組み合わせてHEK293T細胞に導入し、上記7.によりTALE-デアミナーゼ活性値(AncBE4max活性値に対する割合)をそれぞれ取得した。
 結果を図9に示す。図9には、TALE-デアミナーゼ発現プラスミドとして、上記3.(1)で作製した47-104-AID若しくは(2)で作製した47-12-AID、又はこれに対応するTALE-デアミナーゼ-NC発現プラスミドを用いたときの結果も合わせて示す。図9に示したように、アミノ酸リンカー1の長さを12アミノ酸まで短くした場合のTALE-デアミナーゼ(AID)の活性が若干低かったものの、活性に対するアミノ酸リンカー1の長さの影響はあまりないことが判明した。
 8.TALE-デアミナーゼ発現プラスミドの作製(2)
 (1)BE4シリーズ(BE4-TALE)
 (a)32アミノ酸リンカーシリーズ(BE4-32-TALE)
 N末から、Anc689デアミナーゼ(BE4)、リンカー1(32アミノ酸)、TALE(C末ドメイン:WT、63、又は47)の順に配置されるTALE-デアミナーゼ(以下、場合により「BE4-32-TALE」という)の発現プラスミドを以下の方法により作製した。すなわち、先ず、3.(1)において作製したAncBE4max発現プラスミドを鋳型として、下記の表8に記載のプライマーを用いて、32アミノ酸リンカー1をコードする配列を含めて5’側(プライマー配列番号25、73~74)、10アミノ酸リンカー2及びUGIの2回繰り返しをコードする配列を含めて3’側(プライマー配列番号12、75~77)をそれぞれPCRにより増幅した。また、2.で作製したデスティネーションベクター(TALE-WT、TALE-63、TALE-47)をそれぞれ鋳型として、各TALEをコードする配列(プライマー配列番号22~24、78~79)をPCRにより増幅した。下記の表8に、BE4-32-TALE発現プラスミドを構築するために使用した各プライマー及びその配列番号を示す。
Figure JPOXMLDOC01-appb-T000008
 上記3断片を組み合わせて、3.(1)と同様に、In-Fusion法により、N末から順に、デアミナーゼ(Anc689デアミナーゼ(BE4))、リンカー1(32アミノ酸)、TALE(C末ドメイン:WT、63、又は47)の順に配置されるBE4-32-TALE発現プラスミドを発現するためのデスティネーションベクター(BE4-32-WT、BE4-32-63、BE4-32-47)をそれぞれ作製した。これらと、1.で作製したTALE配列を連結したアレイプラスミド、又は、3.で作製したNC配列を連結したアレイプラスミドとを用いて、2.と同様に、Golden Gate法により、各TALE-デアミナーゼ発現プラスミド、又は、TALE-デアミナーゼ-NC発現プラスミドを作製した。前記TALE-デアミナーゼの構造を示す概念図を図11の(A)に示す。また、作製した各発現プラスミドにおける、TALE-デアミナーゼ、及びそのネガティブコントロール(TALE-デアミナーゼ-NC)の構成及びその配列を示す配列番号(塩基配列の配列番号、アミノ酸配列の配列番号)の一覧を下記の表12にそれぞれ示す。
 (b)アミノ酸長調整リンカーシリーズ(BE4-135/234-TALE)
 次いで、デアミナーゼとTALEとの間のリンカー1長(32アミノ酸)をコードする配列の下流側に、既知のリンカー配列であるHTS95アミノ酸配列(Sun,N. and Zhao,H.,Mol BioSyst 10,p.446-453(2014),Doi:10.1039/c3mb70412b)をコードする配列又はその2回繰り返しをコードする配列を挿入したTALE-デアミナーゼ(以下、場合により「BE4-135-TALE」又は「BE4-234-TALE」という)の発現プラスミド(リンカー1長:HTS95アミノ酸配列の前後に付加した繋ぎ配列を含めて、135又は234アミノ酸)を以下の方法により作製した。すなわち、8.(1)(a)で作製したBE4-32-WT、BE4-32-63、BE4-32-47の各デスティネーションベクターを鋳型として、下記の表9に記載のプライマーを用いて、32アミノ酸リンカー1をコードする配列を含めて5’側(プライマー配列番号25、80)、各TALEをコードする配列以降の3’側(プライマー配列番号12、81~82)をそれぞれPCRにより増幅した。下記の表9に、使用した各プライマー及びその配列番号を示す。
Figure JPOXMLDOC01-appb-T000009
 また、合成したHTS95アミノ酸配列と前後の繋ぎ配列とをコードする配列(HTS95:塩基配列の配列番号105、アミノ酸配列の配列番号106)を含むプラスミドを制限酵素AleI及びPshAIで2重切断し、HTS95をコードする配列を含む目的DNA断片をアガロースゲル電気泳動により回収し、T4リガーゼによりライゲーションを行った後、制限酵素XmaI及びSacIIにより2重切断し、HTS95×2を含む目的DNA断片をアガロースゲル電気泳動により回収した。
 上記3断片を組み合わせて、3.(1)と同様に、In-Fusion法により、N末から順に、デアミナーゼ(Anc689デアミナーゼ(BE4))、リンカー1(135アミノ酸又は234アミノ酸)、TALE(C末ドメイン:WT、63、又は47)の順に配置されるBE4-135-TALE、又はBE4-234-TALEを発現するためのデスティネーションベクター(BE4-135-WT、BE4-135-63、BE4-135-47、BE4-234-WT、BE4-234-63、BE4-234-47)をそれぞれ作製した。これらと、1.で作製したTALE配列を連結したアレイプラスミド、又は、3.で作製したNC配列を連結したアレイプラスミドとを用いて、2.と同様に、Golden Gate法により、各TALE-デアミナーゼ発現プラスミド、又は、TALE-デアミナーゼ-NC発現プラスミドを作製した。前記TALE-デアミナーゼの構造を示す概念図は図11の(a)と同様である。また、作製した各発現プラスミドにおける、TALE-デアミナーゼ、及びそのネガティブコントロール(TALE-デアミナーゼ-NC)の構成及びその配列を示す配列番号(塩基配列の配列番号、アミノ酸配列の配列番号)の一覧を下記の表12にそれぞれ示す。
 (2)ABE8eシリーズ(ABE8e-TALE)
 先ず、人工DNA合成により作製したABEmax遺伝子(Koblan et al.,Nat Biotechnol,36,p.843-846(2018))を、pcDNA3.1sのBamHI認識サイトとEcoRV認識サイトとの間にそれぞれ挿入することにより、ABEmax発現プラスミド2を作製した。
 次いで、ABEmaxの改良型であるABE8e(V106W)(Richter,M.F., et al.,Nat Biotechnol 38,p.883-891(2020),Doi:10.1038/s41587-020-0453-z)発現プラスミドを作製した。すなわち、ABEmax発現プラスミド2を鋳型として、下記の表10に記載プライマーを用いて、3’-ABEmax遺伝子のN末のNLSをコードする配列~32アミノ酸リンカー1のC末迄をコードする配列-5’を、PCRにより増幅して(プライマー配列番号83~84)アクセプターとした。また、ABE7.10遺伝子上に、V106W、A109S、T111R、D119N、H122N、Y147D、F149Y、T166I、D167Nとなる変異を含むようにプライマーをデザインし、ABEmax発現プラスミド2を鋳型として、2個の断片A(プライマー配列番号85~86)と、断片B(プライマー配列番号87~88)とをPCRにより増幅した。次いで、2個の断片をIn-Fusion法により前記アクセプターに挿入し、ABE8e(TadA-8e(V106W))発現プラスミドを作製した。下記の表10に、使用した各プライマー及びその配列番号を示す。なお、下記の各表中、「ABE8e」は、デアミナーゼがTadA-8e(V106W)であることを示す。
Figure JPOXMLDOC01-appb-T000010
 次いで、N末から、ABEデアミナーゼ(ABE8e)、リンカー1(32アミノ酸、135アミノ酸、又は234アミノ酸)、TALE(C末ドメイン:47)の順に配置されるTALE-デアミナーゼ(以下、場合により「ABE8e-32-47」、「ABE8e-135-47」、又は「ABE8e-234-47という」)の発現プラスミドを以下の方法により作製した。すなわち、8.(1)(a)及び(b)で作製したBE4-32-47、BE4-135-47、BE4-234-47の各デスティネーションベクターを鋳型として、下記の表11に記載のプライマーを用いて、N末端のNLSをコードする配列を含めた5’側と、32アミノ酸リンカーからC末側をコードする配列を含めた3’側を、ベクターを含めてPCRにより増幅して(プライマー配列番号89~90)アクセプターとした。また、ABE8e(TadA-8e(V106W))発現プラスミドを鋳型としてPCRにより増幅した(プライマー配列番号追加91~92)、ABE8e(TadA-8e(V106W))遺伝子部分を、In-Fusion法により前記アクセプターに挿入し、ABE8e-32-47、ABE8e-135-47、又はABE8e-234-47を発現するためのデスティネーションベクターを作製した。下記の表11に、使用した各プライマー及びその配列番号を示す。
Figure JPOXMLDOC01-appb-T000011
 各デスティネーションベクターと、1.で作製したTALE配列を連結したアレイプラスミド、又は、3.で作製したNC配列を連結したアレイプラスミドとを用いて、2.と同様に、Golden Gate法により、各TALE-デアミナーゼ発現プラスミド、又は、TALE-デアミナーゼ-NC発現プラスミドを作製した。前記TALE-デアミナーゼの構造を示す概念図を図11の(B)に示す。また、作製した各発現プラスミドにおける、TALE-デアミナーゼ、及びそのネガティブコントロール(TALE-デアミナーゼ-NC)の構成及びその配列を示す配列番号(塩基配列の配列番号、アミノ酸配列の配列番号)の一覧を下記の表12にそれぞれ示す。
Figure JPOXMLDOC01-appb-T000012
 9.内因性DNA(ゲノムDNA)をターゲットとするTALE-デアミナーゼ発現プラスミドの作製
 TALE認識配列として、下記の表13に記載の8種類の内因性DNA上の配列がターゲットとなるように、2.と同様の方法でTALE配列を連結したアレイプラスミドを作製した。前記内因性DNAとしては、相同性の高いファミリー遺伝子(CCR2及びHBD)が存在するCCR5とHBBを設定した。
 上記各アレイプラスミドを用いたこと以外は、3.と同様にして、Golden Gate法により、N末から、TALE(C末ドメイン:WT、又は47)、リンカー1(12アミノ酸、又は104アミノ酸)、デアミナーゼ(AID)の順に配置されるTALE-デアミナーゼ(WT(*)-12-AID、47(*)-12-AID、47(*)-104-AID:*はそれぞれターゲット)の発現プラスミド(TALE-AID発現プラスミド)を作製した。また、各アレイプラスミドを用いたこと以外は、8.と同様にして、Golden Gate法により、N末から、デアミナーゼ(BE4、又はABE8e)、リンカー1(32アミノ酸、又は135アミノ酸)、TALE(C末ドメイン:63、又は47)の順に配置されるTALE-デアミナーゼ(BE4-32-47(*)、BE4-135-63(*)、ABE8e-135-47(*):*はそれぞれターゲット)の発現プラスミド(BE4-TALE発現プラスミド、ABE8e-TALE発現プラスミド)を作製した。下記の表13に、ターゲットとしたTALE認識配列を示し、表14に、作製した各発現プラスミドにおける、ターゲット、TALE-デアミナーゼの構成、及びその配列を示す配列番号(塩基配列の配列番号、アミノ酸配列の配列番号)の一覧をそれぞれ示す。
Figure JPOXMLDOC01-appb-T000013
Figure JPOXMLDOC01-appb-T000014
 10.BE4-TALE用及びABE8e-TALE用レポータープラスミドの作製
 レポーターとして、1.で作製したpNLF-M/Aに、下記の表15に示した配列(N-CBE(BE4-TALE用)又はN-ABE(ABE8e-TALE用))を挿入し、BE4-TALE用、及びABE8e-TALE用のレポータープラスミドをそれぞれ作製した。挿入配列は、TALE認識配列の相補配列(表15中の下線(*1):5’-CCTTTGCCCGCTTCTGTa-3’;小文字はTALEのN末ドメインが認識するチミンの相補塩基を示す)、ターゲットコドン(表15中の下線(*2):5’-ACG-3’又は5’-TAG-3’)、及びこれらの間のスペーサー1配列を含み、スペーサー1の長さは、ターゲットコドンの5’にある塩基を含めて、7bp、13bp、19bp、25bp、又は31bpとした。下記の表15に、pNLF-M/Aプラスミドに挿入した各配列を示す。
Figure JPOXMLDOC01-appb-T000015
 このBE4-TALE用のレポータープラスミドにおいて、ターゲットコドンは、Nanoルシフェラーゼの開始コドンに相当する箇所に位置しており、かかるレポータープラスミドによれば、TALE認識配列に結合したTALE-デアミナーゼにより、ターゲットコドンであるACGがATGに変換される(ターゲット塩基(標的部位)であるCがTに置換される)と、NanoLucルシフェラーゼを発現する(図10)。一方、ABE8e-TALE用のレポータープラスミドにおいて、ターゲットコドンは、NanoLucルシフェラーゼの上流に挿入された終始コドンに相当する箇所に位置しており、かかるレポータープラスミドによれば、TALE認識配列に結合したTALE-デアミナーゼにより、ターゲットコドンであるTAGがTGGに変換される(ターゲット塩基(標的部位)であるAがGに置換される)と、NanoLucルシフェラーゼを発現する。
 11.ガイドRNA発現プラスミドの作製(2)
 ガイドRNAを発現するプラスミドを、ガイドRNAの標的配列(表16には、ガイドRNAの標的配列(アンチセンス鎖上)の相補配列を示す)に対応するように設計したこと以外は、5.と同様にして、各ガイドRNAを発現するプラスミド(ガイドRNA発現プラスミド)を作製した。下記の表16に、ガイドRNAの標的配列の相補配列を示す。
Figure JPOXMLDOC01-appb-T000016
 12.HEK細胞への形質転換(2)
 上記10.で作製した各レポータープラスミドを標的DNAとした場合は、6.に示した方法と同様に行った。すなわち、8.で作製したBE4-TALE発現プラスミド又はABE8e-TALE発現プラスミドのうちのいずれか75ng;4.で作製したnCas9発現プラスミド又はdCas9発現プラスミド50ng;11.で作製したガイドRNA発現プラスミド10ng、10.で作製したレポータープラスミドのうちのいずれか20ng;並びにリファレンスプラスミドであるpGL4.54 5ngを、Lipofectamine LTXを用いて、各ウェルあたり5×10個のHEK293T細胞に導入し、24時間培養した。
 また、上記9.に記載の内因性DNAを標的DNAとした場合には、次のとおりとした。すなわち、デアミナーゼとしてAIDを用いる場合、9.で作製したTALE-AID発現プラスミドのうちのいずれか30ng;4.で作製したnCas9発現プラスミド又はdCas9発現プラスミド20ng;11.で作製したガイドRNA発現プラスミド5ngを、デアミナーゼとしてBE4又はABE8eを用いる場合、9.で作製したBE4-TALE発現プラスミド又はABE8e-TALE発現プラスミドのうちのいずれか60ng;4.で作製したnCas9発現プラスミド又はdCas9発現プラスミド40ng;11.で作製したガイドRNA発現プラスミド10ngを、それぞれ、各ウェルあたり3×10個のHEK293T細胞に導入し、48時間培養した。また、この場合のコントロールとして、Target-AID発現プラスミド、AncBE4max発現プラスミド、及びABE8e発現プラスミドのうちのいずれか30ngと、11.で作製したガイドRNA発現プラスミド10ngとの組み合わせ、又は、Target-AID発現プラスミド、AncBE4max発現プラスミド、及びABE8e発現プラスミドのうちのいずれか60ngと、11.で作製したガイドRNA発現プラスミド20ngとの組み合わせのいずれかをHEK293T細胞に導入した。
 13.塩基編集活性の解析
 形質転換してから48時間後に培地を除去し、PBS(-)で洗浄後、DNAzol(Molecular Research Center,INC,Ohio,USA)50μLを添加して細胞を溶解した。細胞溶解液をテンプレートにして、下記の表17に記載のプライマーを用いて、PrimeSTAR Max(Takara Bio Inc.,Siga,Japan)により、前記内因性DNAのターゲットサイトを含む領域を増幅した。得られたPCR産物を精製後、株式会社ファスマックにシークエンスを依頼した。EditR(Kluesner et al.,The CRISPR J 1,p.239-250(2018),DOI:10.1089/crispr.2018.0014)を用いてシークエンスデータを解析し、ターゲットサイトの塩基編集効率(T又はGの割合)を算出した。
Figure JPOXMLDOC01-appb-T000017
 <試験5> TALE-デアミナーゼ(N末融合体)の活性に及ぼすスペーサー1長及びリンカー1長の影響
 上記12.によりHEK細胞への形質転換を行い、上記7.によりTALE-デアミナーゼ活性値(AncBE4max活性値又はABE8e活性値に対する割合)をそれぞれ取得した。
 (BE4シリーズ)
 N末から、Anc689デアミナーゼ(BE4)、リンカー1(32アミノ酸、135アミノ酸、又は234アミノ酸)、TALE(C末ドメイン:WT、63、又は47)の順に配置されるTALE-デアミナーゼ(BE4-TALE-WT、BE4-TALE-63、BE4-TALE-47)について、レポーターのスペーサー1の長さ及びリンカー1の長さが活性に与える影響を調べた。スペーサー1の長さは、7bp、13bp、19bp、25bp、31bpとした。また、Cas9/ガイドRNAとしては、nCas9(D10A)及びガイドRNAの発現あり(nCas9)、dCas9(D10A+H840A)及びガイドRNAの発現あり(dCas9)、nCas9の発現あり及びガイドRNAの発現なし(nCas9/ガイドなし)の3条件について検討した。
 結果を図12Aの(A)(B)、及び図12Bの(C)にそれぞれ示す。いずれのBE4-TALEにおいても、ガイドRNAが存在しない場合、すなわちnCas9がターゲット塩基付近に結合していない場合には活性が認められなかった。一方、nCas9又はdCas9の存在下では活性が認められた。nCas9によるニックの活性促進効果については、TALE-デアミナーゼのC末融合体(C末側にデアミナーゼが配置)ほど顕著ではなかった。
 スペーサー1の長さについては、TALEのC末ドメインがWT及び63では25bpのときに、TALEのC末ドメインが47では19bp及び25bpのときに、それぞれ特に高い活性を示した。リンカー1の長さについては、TALEのC末ドメインがWT及び47では32アミノ酸のときに、TALEのC末ドメインが63では135アミノ酸のときに、それぞれ特に活性が高かった。活性が特に高かった組み合わせは、TALEのC末ドメインがWTでは、リンカー1長が32アミノ酸かつスペーサー1長が25bpのとき(0.75±0.10)、TALEのC末ドメインが63では、リンカー1長が135アミノ酸かつスペーサー1長が25bpのとき(0.86±0.11)、TALEのC末ドメインが47では、リンカー1長が32アミノ酸かつスペーサー1長が19bp及び25bpのとき(0.80±0.14及び0.85±0.13)であった。
 (ABE8eシリーズ)
 N末から、ABE8eデアミナーゼ(ABE8e)、リンカー1(32アミノ酸、135アミノ酸、又は234アミノ酸)、TALE(C末ドメイン:47)の順に配置されるTALE-デアミナーゼ(ABE8e-TALE-47)についても、上記BE4シリーズと同様にして、レポーターのスペーサー1の長さ及びリンカー1の長さが活性に与える影響を調べた。
 結果を図12Bの(D)にそれぞれ示す。いずれのABE8e-TALEにおいても、ガイドRNAが存在しない場合、すなわちnCas9がターゲット塩基付近に結合していない場合には活性が認められなかった。一方、nCas9又はdCas9の存在下では活性が認められた。なお、nCas9とdCas9との比較では,活性は同程度かむしろdCas9の方が高かった。
 スペーサー1の長さについては、19bpのときに特に高い活性を示した。リンカー1の長さについては、nCas9では135アミノ酸(0.54±0.03)で、dCas9では32アミノ酸(0.55±0.13)及び135アミノ酸(0.57±0.09)で、それぞれ特に高い活性を示した。
 <試験6> 内因性DNAにおける塩基編集活性
 上記で特に高い活性が得られたTALE-デアミナーゼについて、上記12.及び13.に記載の方法により、内因性DNAに対する塩基編集活性を調べた。前記内因性DNAとしては、相同性の高いファミリー遺伝子(CCR2及びHBD)が存在するCCR5とHBBを設定した。図13A及び図13Bに、前記内因性DNA(CCR5、HBB)上のターゲット領域(AS3(a:配列番号221)、AS14(b:配列番号222)(e:配列番号225)、S2(c:配列番号223)、AS5(d:配列番号224)、AS6(f:配列番号226)、AS7(g:配列番号227))、TALE認識配列又はその相補配列の位置、ガイドRNAの標的配列の相補配列の位置をそれぞれ示す。また、図13A及び図13Bには、(a)、(b)、(d)、(e)に示すCCR5と相同性の高いCCR2、(c)、(f)、(g)に示すHBBと相同性の高いHBDとのアラインメントとして、各領域の塩基と異なる塩基もそれぞれ示す。
 (AIDシリーズ)
 N末から、TALE(C末ドメイン:WT、又は47)、リンカー1(12アミノ酸、又は104アミノ酸)、デアミナーゼ(AID)の順に配置されるTALE-AID(WT(*)-12-AID、47(*)-12-AID、47(*)-104-AID:*はそれぞれターゲット)を用いたときの結果を図14~図16に示す。各TALE-AIDにおいて、TALE認識配列は、それぞれ、図13Aに示すAS3(a)、AS14(b)、S2(c)上にある。図14には、ターゲットAS3上の、ガイドRNA(sgRNA-AS3)の標的配列の相補配列の1塩基目(A)、10塩基目(B)、11塩基目(C)におけるTの割合(すなわち、塩基がCからTに編集された割合)を示し、図15には、ターゲットAS14上の、ガイドRNA(sgRNA-AS14)の標的配列の相補配列の1塩基目(A)、5塩基目(B)、6塩基目(C)におけるTの割合を示し、図16には、ターゲットS2上の、ガイドRNA(sgRNA-S2)の標的配列の相補配列の1塩基目(A)、8塩基目(B)、9塩基目(C)におけるTの割合を示す。
 TALE-AIDは、ターゲットであるCCR5遺伝子又はHBB遺伝子に対して、既存のBase editorであるTarget-AID及びAncBE4maxと比べて、同程度かそれ以上の活性を示した。一方、ターゲットではないCCR2遺伝子又はHBD遺伝子に対して、Target-AID及びAncBE4maxは塩基編集活性を示したが、TALE-AIDはほとんど塩基編集活性を示さなかった。したがって、TALE-AIDは、既存のTarget-AIDやAncBE4maxよりも、標的特異性が高いことが確認された。
 (BE4シリーズ)
 N末から、デアミナーゼ(BE4)、リンカー1(32アミノ酸、又は135アミノ酸)、TALE(C末ドメイン:47、又は63)の順に配置されるBE4-TALE(BE4-32-47(*)、BE4-135-63(*):*はそれぞれターゲット)を用いたときの結果を図17~図20に示す。各BE4-TALEにおいて、TALE認識配列は、それぞれ、図13Bに示すAS5(d)、AS14(e)、AS6(f)、AS7(g)の相補配列上にある。図17には、ターゲットAS5上の、ガイドRNA(sgRNA-AS5)の標的配列の相補配列の7塩基目(A)、8塩基目(B)におけるTの割合を示し、図18には、ターゲットAS14上の、ガイドRNA(sgRNA-AS14)の標的配列の相補配列の1塩基目(A)、5塩基目(B)、6塩基目(C)におけるTの割合を示し、図19には、ターゲットAS6上の、ガイドRNA(sgRNA-AS6)の標的配列の相補配列の5塩基目(A)、6塩基目(B)におけるTの割合を示し、図20には、ターゲットAS7上の、ガイドRNA(sgRNA-AS7)の標的配列の相補配列の6塩基目(A)、7塩基目(B)におけるTの割合を示す。
 BE4-TALEは、ターゲットであるCCR5遺伝子又はHBB遺伝子に対して、既存のBase editorであるTarget-AID及びAncBE4maxと比べて、概ね同程度の活性を示した。一方、ターゲットではないCCR2遺伝子又はHBD遺伝子に対して、Target-AID及びAncBE4maxは塩基編集活性を示したが、BE4-TALEはほとんど塩基編集活性を示さなかった。したがって、BE4-TALEは、既存のTarget-AIDやAncBE4maxよりも、標的特異性が高いことが確認された。
 (ABE8eシリーズ)
 N末から、ABE8eデアミナーゼ(ABE8e)、リンカー1(135アミノ酸)、TALE(C末ドメイン:47)の順に配置されるABE8e-TALE(ABE8e-135-47)を用いたときの結果を図21~図23に示す。各ABE8e-TALEにおいて、TALE認識配列は、それぞれ、図13Bに示すAS5(d)、AS6(f)、AS7(g)の相補配列上にある。図21には、ターゲットAS5上の、ガイドRNA(sgRNA-AS5)の標的配列の相補配列の3塩基目(A)、4塩基目(B)におけるGの割合(すなわち、塩基がAからGに編集された割合)を示し、図22には、ターゲットAS6上の、ガイドRNA(sgRNA-AS6)の標的配列の相補配列の4塩基目(A)、7塩基目(B)におけるGの割合を示し、図23には、ターゲットAS7上の、ガイドRNA(sgRNA-AS7)の標的配列の相補配列の4塩基目(A)、8塩基目(B)におけるGの割合を示す。
 ABE8e-TALEは、ターゲットであるCCR5遺伝子又はHBB遺伝子に対して、既存のBase editorであるABE8e(TadA-8e(V106W))と比べて、同程度の活性を示した。一方、ターゲットではないCCR2遺伝子又はHBD遺伝子に対して、ABE8e(TadA-8e(V106W))は塩基編集活性を示したが、ABE8e-TALEはほとんど塩基編集活性を示さなかった。したがって、ABE8e-TALEは、既存のABE8e(TadA-8e(V106W))よりも、標的特異性が高いことが確認された。
 以上説明したように、本発明によれば、特異的かつ効率的に、核酸塩基変換酵素による標的DNAの編集を行うことができる方法、その方法を用いてゲノム編集された細胞を製造する方法、及びそれらに用いるDNA編集システムを提供することが可能となる。そのため、本発明は、高い編集効率と共に高い安全性が求められる遺伝子編集治療などの分野での利活用が期待される。

Claims (11)

  1.  標的DNAを編集する方法であり、
    (1)TALE及び核酸塩基変換酵素を含む融合タンパク質、並びに、
    (2)ヌクレアーゼ活性の一部又は全部を喪失したCas9タンパク質及びそのガイドRNAを含むCRISPR-Cas9システム
    を、標的DNAに接触させ、前記融合タンパク質の核酸塩基変換酵素活性により前記標的DNAの標的部位の塩基を編集する工程を含み、
     前記融合タンパク質におけるTALEが認識するTALE認識配列又はその相補配列は、前記標的部位の5’側に7~31bpの鎖長のスペーサー1を介して存在し、かつ、
     前記CRISPR-Cas9システムにおけるガイドRNAが認識するガイドRNA標的配列は、前記標的部位の相補塩基を含むように存在する、
    方法。
  2.  標的DNAが編集された細胞を製造する方法であり、
    (1)TALE及び核酸塩基変換酵素を含む融合タンパク質、並びに、
    (2)ヌクレアーゼ活性の一部又は全部を喪失したCas9タンパク質及びそのガイドRNAを含むCRISPR-Cas9システム
    を、細胞に導入又は細胞内で発現させて標的DNAに接触させ、前記融合タンパク質の核酸塩基変換酵素活性により前記標的DNAの標的部位の塩基を編集する工程を含み、
     前記融合タンパク質におけるTALEが認識するTALE認識配列又はその相補配列は、前記標的部位の5’側に7~31bpの鎖長のスペーサー1を介して存在し、かつ、
     前記CRISPR-Cas9システムにおけるガイドRNAが認識するガイドRNA標的配列は、前記標的部位の相補塩基を含むように存在する、
    方法。
  3.  前記融合タンパク質がさらに、TALEと前記核酸塩基変換酵素とを結合するリンカー1を含む、請求項1又は2に記載の方法。
  4.  前記融合タンパク質がさらに、C末側にリンカー2を介して結合された塩基除去修復インヒビターを含む、請求項1~3のうちのいずれか一項に記載の方法。
  5.  前記融合タンパク質における核酸塩基変換酵素がデアミナーゼである、請求項1~4のうちのいずれか一項に記載の方法。
  6.  前記デアミナーゼが、APOBEC、PmCDA1、Anc689、及びTadAからなる群から選択される少なくとも1種である、請求項5に記載の方法。
  7.  請求項1~6のうちのいずれか一項に記載の方法に用いるためのDNA編集システムであり、
    (1)TALE及び核酸塩基変換酵素を含む融合タンパク質、並びに、
    (2)ヌクレアーゼ活性の一部又は全部を喪失したCas9タンパク質及びそのガイドRNAを含むCRISPR-Cas9システム
    を含む、DNA編集システム。
  8.  前記融合タンパク質がさらに、TALEと前記核酸塩基変換酵素とを結合するリンカー1を含む、請求項7に記載のDNA編集システム。
  9.  前記融合タンパク質がさらに、C末側にリンカー2を介して結合された塩基除去修復インヒビターを含む、請求項7又は8に記載のDNA編集システム。
  10.  前記融合タンパク質における核酸塩基変換酵素がデアミナーゼである、請求項7~9のうちのいずれか一項に記載の方法。
  11.  前記デアミナーゼが、APOBEC、PmCDA1、Anc689、及びTadAからなる群から選択される少なくとも1種である、請求項10に記載のDNA編集システム。
PCT/JP2021/032436 2020-09-04 2021-09-03 標的dnaの編集方法、標的dnaが編集された細胞の製造方法、及びそれらに用いるdna編集システム WO2022050377A1 (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
EP21864429.2A EP4209588A1 (en) 2020-09-04 2021-09-03 Method for editing target dna, method for producing cell having edited target dna, and dna edition system for use in said methods
JP2022546983A JPWO2022050377A1 (ja) 2020-09-04 2021-09-03
US18/043,814 US20230340455A1 (en) 2020-09-04 2021-09-03 Method for editing target dna, method for producing cell in which target dna is edited, and dna editing system for use in these
AU2021338062A AU2021338062A1 (en) 2020-09-04 2021-09-03 Method for editing target dna, method for producing cell having edited target dna, and dna edition system for use in said methods
KR1020237010913A KR20230058482A (ko) 2020-09-04 2021-09-03 표적 dna의 편집 방법, 표적 dna가 편집된 세포의 제조 방법, 및 그것들에 사용하는 dna 편집 시스템
CN202180054310.XA CN116157517A (zh) 2020-09-04 2021-09-03 目标dna的编辑方法、编辑了目标dna的细胞的制备方法及用于它们的dna编辑系统

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2020-148944 2020-09-04
JP2020148944 2020-09-04

Publications (1)

Publication Number Publication Date
WO2022050377A1 true WO2022050377A1 (ja) 2022-03-10

Family

ID=80491073

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2021/032436 WO2022050377A1 (ja) 2020-09-04 2021-09-03 標的dnaの編集方法、標的dnaが編集された細胞の製造方法、及びそれらに用いるdna編集システム

Country Status (7)

Country Link
US (1) US20230340455A1 (ja)
EP (1) EP4209588A1 (ja)
JP (1) JPWO2022050377A1 (ja)
KR (1) KR20230058482A (ja)
CN (1) CN116157517A (ja)
AU (1) AU2021338062A1 (ja)
WO (1) WO2022050377A1 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014131833A1 (en) 2013-02-27 2014-09-04 Helmholtz Zentrum München Deutsches Forschungszentrum Für Gesundheit Und Umwelt (Gmbh) Gene editing in the oocyte by cas9 nucleases
WO2018218166A1 (en) 2017-05-25 2018-11-29 The General Hospital Corporation Using split deaminases to limit unwanted off-target base editor deamination
JP2018537963A (ja) * 2015-10-23 2018-12-27 プレジデント アンド フェローズ オブ ハーバード カレッジ 遺伝子編集のための進化したCas9蛋白質
WO2020051562A2 (en) * 2018-09-07 2020-03-12 Beam Therapeutics Inc. Compositions and methods for improving base editing

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014131833A1 (en) 2013-02-27 2014-09-04 Helmholtz Zentrum München Deutsches Forschungszentrum Für Gesundheit Und Umwelt (Gmbh) Gene editing in the oocyte by cas9 nucleases
JP2018537963A (ja) * 2015-10-23 2018-12-27 プレジデント アンド フェローズ オブ ハーバード カレッジ 遺伝子編集のための進化したCas9蛋白質
WO2018218166A1 (en) 2017-05-25 2018-11-29 The General Hospital Corporation Using split deaminases to limit unwanted off-target base editor deamination
JP2020521446A (ja) * 2017-05-25 2020-07-27 ザ ジェネラル ホスピタル コーポレイション 二部塩基エディター(bbe)構造およびii型−c−cas9ジンクフィンガー編集
WO2020051562A2 (en) * 2018-09-07 2020-03-12 Beam Therapeutics Inc. Compositions and methods for improving base editing

Non-Patent Citations (17)

* Cited by examiner, † Cited by third party
Title
"Genbank", Database accession no. KX151730.1
BENJAMIN, P. ET AL., NATURE, vol. 523, 2015, pages 481 - 485
GAUDELLI, N. ET AL., NATURE, vol. 551, 2017, pages 464 - 471
GEHRKE, J. ET AL.: "Improving cytidine and adenine base editors by expression optimization and ancestral reconstruction.", NAT BIOTECHNOL, vol. 36, 2018, pages 843 - 846, XP036929657, DOI: 10.1038/nbt.4172
HIRANO, S. ET AL., MOLECULAR CELL, vol. 61, 2016, pages 886 - 894
KLUESNER ET AL., THE CRISPR J, vol. 1, 2018, pages 239 - 250
KOBLAN ET AL., NAT BIOTECHNOL, vol. 36, 2018, pages 843 - 846
KOMOR, A. ET AL., NATURE, vol. 533, 2016, pages 420 - 424
LEONARD G. DAVIS ET AL.: "Basic methods in molecular biology", 1986, ELSEVIER
MARTIN, A. S. ET AL., SCI REP, vol. 9, 2019, pages 497
MILLER ET AL., NAT. BIOTECHNOL., vol. 29, 2011, pages 143 - 148
NISHIDA, K. ET AL.: "Targeted nucleotide editing using hybrid prokaryotic and vertebrate adaptive immune systems.", SCIENCE, vol. 353, 2016, pages aaf8729, XP055482712, DOI: 10.1126/science.aaf8729
REES, H. A.LIU, D. R., NAT REV GENET, vol. 19, 2018, pages 770 - 788
RICHTER, M. F. ET AL., NAT BIOTECHNOL, vol. 38, 2020, pages 883 - 891
SAKUMA ET AL.: "Repeating pattern of non-RVD variations in DNA-binding modules enhances TALEN activity.", SCI. REP., vol. 3, 2013, pages 3379
SUN, N.ZHAO, H., MOL BIOSYST, vol. 10, 2014, pages 446 - 453
YANG, L. ET AL.: "Engineering and optimising deaminase fusions for genome editing.", NAT COMMUN, vol. 7, 2016, pages 13330, XP055415680, DOI: 10.1038/ncomms13330

Also Published As

Publication number Publication date
US20230340455A1 (en) 2023-10-26
JPWO2022050377A1 (ja) 2022-03-10
AU2021338062A1 (en) 2023-05-04
CN116157517A (zh) 2023-05-23
EP4209588A1 (en) 2023-07-12
KR20230058482A (ko) 2023-05-03

Similar Documents

Publication Publication Date Title
JP6480647B1 (ja) Dnaが編集された真核細胞を製造する方法、および当該方法に用いられるキット
JP6958917B2 (ja) 遺伝子ノックイン細胞の作製方法
US20190223417A1 (en) Genetically modified animals having increased heat tolerance
Ma et al. Building Cre knockin rat lines using CRISPR/Cas9
JP7426101B2 (ja) ゲノム編集された細胞を製造する方法
CN113646429A (zh) 敲入细胞的制作方法
WO2022050377A1 (ja) 標的dnaの編集方法、標的dnaが編集された細胞の製造方法、及びそれらに用いるdna編集システム
EP4242237A1 (en) Foki nuclease domain variant
JP2023131616A (ja) Dna編集システム、並びに、それを用いた標的dnaの編集方法及び標的dnaが編集された細胞の製造方法
WO2021171688A1 (ja) 遺伝子ノックイン方法、遺伝子ノックイン細胞作製方法、遺伝子ノックイン細胞、がん化リスク評価方法、がん細胞製造方法、及びこれらに用いるためのキット
EA040859B1 (ru) Способ получения эукариотических клеток с отредактированной днк и набор, используемый в этом способе

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 21864429

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2022546983

Country of ref document: JP

Kind code of ref document: A

ENP Entry into the national phase

Ref document number: 20237010913

Country of ref document: KR

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

ENP Entry into the national phase

Ref document number: 2021864429

Country of ref document: EP

Effective date: 20230404

ENP Entry into the national phase

Ref document number: 2021338062

Country of ref document: AU

Date of ref document: 20210903

Kind code of ref document: A