WO2024063538A1 - 식물세포 소기관 dna의 염기 교정 - Google Patents

식물세포 소기관 dna의 염기 교정 Download PDF

Info

Publication number
WO2024063538A1
WO2024063538A1 PCT/KR2023/014300 KR2023014300W WO2024063538A1 WO 2024063538 A1 WO2024063538 A1 WO 2024063538A1 KR 2023014300 W KR2023014300 W KR 2023014300W WO 2024063538 A1 WO2024063538 A1 WO 2024063538A1
Authority
WO
WIPO (PCT)
Prior art keywords
composition
dna
deaminase
terminus
cytosine deaminase
Prior art date
Application number
PCT/KR2023/014300
Other languages
English (en)
French (fr)
Inventor
김진수
홍성현
목영근
배수지
Original Assignee
기초과학연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 기초과학연구원 filed Critical 기초과학연구원
Publication of WO2024063538A1 publication Critical patent/WO2024063538A1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/78Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/80Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
    • C07K2319/81Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor containing a Zn-finger domain for DNA binding
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/04Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
    • C12Y305/04001Cytosine deaminase (3.5.4.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/04Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
    • C12Y305/04002Adenine deaminase (3.5.4.2)

Definitions

  • the present invention relates to a composition for base correction of plant cell organelle DNA, particularly to a composition and proofreading method for simultaneously proofreading adenine to guanine and cytosine to thymine in plant cell organelle DNA.
  • the fusion protein in which a DNA-binding protein and a deaminase are linked, does not generate DNA double-strand breaks (DSBs) and performs targeted nucleotide substitution or base editing in the genome, corrects point mutations that cause genetic disorders, or is used in prokaryotic cells. , enabling single nucleotide conversions in a targeted manner to introduce desired single nucleotide mutations into humans and other eukaryotic cells.
  • DLBs DNA double-strand breaks
  • ZFN zinc-finger nuclease
  • TALEN transcription activator-like effector nuclease
  • CRISPR clustered regularly interspaced short palindromic repeat
  • Cas9 CRISPR-related protein 9 variants and base deaminase proteins that are inefficient in nucleic acid degradation.
  • Program (setting) genome editing tools such as base editing technology have been developed for plant genetic research and crop trait improvement through changes in base sequence. However, these tools are not suitable for correcting the DNA sequences of plant organelles, including mitochondria and chloroplasts, mainly because it is difficult to deliver a guide RNA to the organelle or to express both compounds simultaneously in the organelle.
  • Plant cell organelles encode several essential genes required for photosynthesis and respiration.
  • Targeted mutations in the mitochondrial atp6 gene can cause male sterility, a reproductively useful trait, and specific point mutations in the 16S rRNA gene of the chloroplast genome can cause antibiotic resistance.
  • the bacterial toxin DddA tox is the enzymatic part of the bacterial toxin derived from Burkholderia cenocepacia and can deaminated cytosine in double-stranded DNA.
  • DddA tox is toxic to cells.
  • DddA tox is divided into two inactivated splits, each half capable of binding to DNA. It can be used as a functional DdCBE pair by linking to a DNA-binding protein designed to do so.
  • the object of the present invention is to provide a composition for base correction of plant cell organelle DNA containing DNA binding protein, cytosine deaminase or isolated form of cytosine deaminase and adenine deaminase or nucleic acid encoding the same. there is.
  • the purpose of the present invention is to provide a method for editing plant cell organelle DNA.
  • the present invention provides a DNA binding protein or a nucleic acid encoding the same; Cytosine deaminase or a first and second fragment derived from cytosine deaminase or a nucleic acid encoding the same; and adenine deaminase or a nucleic acid encoding the same. It provides a composition for base correction of plant cell organelle DNA.
  • the present invention also provides a method for correcting the bases of plant cell organelle DNA, comprising treating plant cells with the composition.
  • Figure 1 is a schematic diagram of DNA cloning for producing transgenic plants using Agrobacterium.
  • Figure 2 shows a transformant plant targeting the psaA gene.
  • a Base proofreading efficiency and location of each plant.
  • b Plant phenotype.
  • c Shows the results of changes in amino acid base sequence due to DNA base correction.
  • Figure 3 shows a transformant plant targeting the rbcL gene.
  • a Base proofreading efficiency and location of each plant.
  • b Shows the results of changes in amino acid base sequence due to DNA base correction.
  • Figure 4 shows the results of confirming the base correction efficiency and location of transgenic plants targeting the rrn16S gene.
  • Figure 5 shows the base correction efficiency and phenotype of the first generation transformant targeting the psaA , rbcL and rrn16S genes in the chloroplast of Arabidopsis thaliana.
  • a Base correction efficiency and location of psaA #1, 2, and 3. Base correction of adenine and cytosine occur simultaneously.
  • b Phenotype of psaA #3 showing green, chimeric, and pale green traits.
  • c Base proofreading efficiency, location and phenotype of rbcL #1 and 2.
  • d Shows the results of confirming the base correction efficiency of the first generation transformant targeting the rrn16S gene.
  • Figure 6 shows base correction efficiency and phenotype of second-generation transgenic plants. Phenotype and (a) of the second generation of psaA #3 transgenics, and base correction efficiency and location (b). Phenotype (c) and base correction efficiency and location (d) of the second generation of rrn16S transgenics resistant to spectinomycin. e, As a result of confirming the presence or absence of foreign genes introduced into the transgenic plants by PCR, it was confirmed that rrn16S #9-1 and 3 had no foreign genes.
  • Figure 7 shows the results of confirming the base correction location and efficiency of plants resistant and sensitive to Spectinomycin among rrn16S transgenic second generation plants.
  • Figure 8 shows the full-length chloroplast genomes of psaA #1 (a), psaA #3 chimeric (b), psaA #3 pale green (c), rrn16s #1 (d), 6 (e), and wild type Col-0 (f).
  • Off-target base mutations through analysis. No obvious off-target base mutations were observed in transgenic plants compared to wild type.
  • Figure 9 shows the efficiency of base correction of the lettuce mitochondrial gene atp6.
  • the inventors of the present application linked DddAtox cytosine deaminase and adenine deaminase to a TALE or ZFP protein that can bind to DNA to create a base editor that performs both A to G base correction and C to T base correction. Produced.
  • the present invention is a composition for base correction of plant cell organelle DNA, comprising: a DNA binding protein or a nucleic acid encoding the same; Cytosine deaminase or the first and second fragments derived from cytosine deaminase or nucleic acids encoding them; and adenine deaminase or a nucleic acid encoding the same, and is characterized in that it simultaneously corrects adenine into guanine and cytosine into thymine of the plant cell organelle DNA.
  • proofreading can be used interchangeably with “editing” and refers to a method of altering a nucleic acid sequence by selective deletion of a specific genomic target.
  • specific genomic targets include, but are not limited to, chromosomal regions, genes, promoters, open reading frames, or any nucleic acid sequence.
  • single base means one and only one nucleotide in a nucleic acid sequence. When used in the context of single base correction, this means that a base at a specific position within a nucleic acid sequence is replaced with a different base. Such substitutions can occur by many mechanisms, including but not limited to substitution or modification.
  • target or “target site” refers to a previously identified nuclear sequence of any composition and/or length. Such target sites include, but are not limited to, chromosomal regions, genes, promoters, open reading frames, or any nucleic acid sequence.
  • on-target refers to a subsequence of a specific genomic target that may be completely complementary to a programmable DNA binding region and/or a single guide RNA sequence.
  • off-target refers to a subsequence of a specific genomic target that may be partially complementary to a programmable DNA binding region and/or a single guide RNA sequence.
  • the present invention includes a first fragment and a second fragment derived from cytosine deaminase or a variant thereof, and the cytosine deaminase is bound to a DNA binding protein or the first fragment and the second fragment are each of the DNA. It has a form that binds to a binding protein.
  • the cytosine deaminase is a deamination enzyme that can convert cytosine (C) into uridine (U).
  • cytosine deaminase it may be the cytosine deaminase.
  • cytosine deaminase there are forms of cytosine deaminase such as APOBEC1 (apolipoprotein B editing complex 1) and AID (activation-induced deaminase), but most DNA deaminase acts only on single-stranded DNA and connects to DNA binding protein. Therefore, it may not be suitable for base correction.
  • the cytosine deaminase may be derived from a deaminase (DddA) that acts on double-stranded DNA or an orthologue thereof. More specifically, the cytosine deaminase may be a double-stranded DNA-specific bacterial cytosine deaminase.
  • the cytosine deaminase is in a split form, and the cytosine deaminase includes a separated first split body and a second split body, and each of the first split body and the second split body has no deaminase activity. will be.
  • the cytosine deaminase includes a first split body and a second split body, and each of the first split body and the second split body has no deaminase activity.
  • the first or second fragment of the cytosine deaminase is selected from the group consisting of G33, G44, A54, N68, G82, N98, and G108 at the N terminus of the sequence of SEQ ID NO: 1. It may contain up to one or more sequences.
  • the first or second fragment of the cytosine deaminase is a sequence of at least one selected from the group consisting of G34, P45, G55, N69, T83, A99, and A109 in the sequence of SEQ ID NO: 1 to the C-terminus. may include.
  • the cytosine deaminase includes the first fragment of SEQ ID NO: 2 (G1333-N) and the second fragment of SEQ ID NO: 3 (G1333-C), or the first fragment of SEQ ID NO: 4 (G1397) -N) and the second fragment of SEQ ID NO: 5 (G1397-C), or the first fragment of SEQ ID NO: 2 (G1333-N) and the second fragment of SEQ ID NO: 5 (G1397-C) Alternatively, it may include the first fragment of SEQ ID NO: 4 (G1397-N) and the second fragment of SEQ ID NO: 2 (G1333-C).
  • the inventors of the present application linked DddAtox cytosine deaminase and adenine deaminase to a TALE or ZFP protein that can bind to DNA to create a base editor that performs both A to G base correction and C to T base correction. Produced.
  • the present invention is a composition for base correction of plant cell organelle DNA, comprising: a DNA binding protein or a nucleic acid encoding the same; Cytosine deaminase or the first and second fragments derived from cytosine deaminase or nucleic acids encoding them; and adenine deaminase or a nucleic acid encoding the same, and is characterized in that it simultaneously corrects adenine into guanine and cytosine into thymine of the plant cell organelle DNA.
  • proofreading can be used interchangeably with “editing” and refers to a method of altering a nucleic acid sequence by selective deletion of a specific genomic target.
  • specific genomic targets include, but are not limited to, chromosomal regions, genes, promoters, open reading frames, or any nucleic acid sequence.
  • single base means one and only one nucleotide in a nucleic acid sequence. When used in the context of single base correction, this means that a base at a specific position within a nucleic acid sequence is replaced with a different base. Such substitutions can occur by many mechanisms, including but not limited to substitution or modification.
  • target or “target site” refers to a previously identified nuclear sequence of any composition and/or length. Such target sites include, but are not limited to, chromosomal regions, genes, promoters, open reading frames, or any nucleic acid sequence.
  • on-target refers to a subsequence of a specific genomic target that may be completely complementary to a programmable DNA binding region and/or a single guide RNA sequence.
  • off-target refers to a subsequence of a specific genomic target that may be partially complementary to a programmable DNA binding region and/or a single guide RNA sequence.
  • the present invention includes a first fragment and a second fragment derived from cytosine deaminase or a variant thereof, and the cytosine deaminase is bound to a DNA binding protein or the first fragment and the second fragment are each of the DNA. It has a form that binds to a binding protein.
  • the cytosine deaminase is a deamination enzyme that can convert cytosine (C) into uridine (U).
  • cytosine deaminase it may be the cytosine deaminase.
  • cytosine deaminase there are forms of cytosine deaminase such as APOBEC1 (apolipoprotein B editing complex 1) and AID (activation-induced deaminase), but most DNA deaminase acts only on single-stranded DNA and connects to DNA binding protein. Therefore, it may not be suitable for base correction.
  • the cytosine deaminase may be derived from a deaminase (DddA) that acts on double-stranded DNA or an orthologue thereof. More specifically, the cytosine deaminase may be a double-stranded DNA-specific bacterial cytosine deaminase.
  • the cytosine deaminase is in a split form, and the cytosine deaminase includes a separated first split body and a second split body, and each of the first split body and the second split body has no deaminase activity. will be.
  • the cytosine deaminase includes a first split body and a second split body, and each of the first split body and the second split body has no deaminase activity.
  • G1333N, G1333C, G1397N and G1397C can be combined and used as a split deaminase. Specifically, Left-G1333-N + Right-G133-C, Left-G1397-N + Right-G1397-C, Left-G1397-N + Right-G1333-C, or Left-G1333-N + Right-G1397- It can be used in the form of C.
  • the DNA binding protein may be, for example, a zinc finger protein, a transcription activator-like effector (TALE) array, or a combination thereof.
  • TALE transcription activator-like effector
  • the zinc finger motif of the zinc finger protein has a DNA binding domain, and the c-terminal portion of the finger specifically recognizes DNA sequences.
  • DNA binding proteins containing 3 to 6 zinc finger motifs recognize DNA sequences.
  • each of the first fragment of cytosine deaminase and the second fragment of cytosine deaminase may bind to the N-terminus or C-terminus of the zinc finger protein.
  • the C-terminus of the zinc finger protein (ZF-Left) binds to the N-terminus of the first segment of cytosine deaminase, and the zinc finger protein (ZF-Right) C is bound to the N-terminus of the second segment of cytosine deaminase.
  • ZF-Left The C-terminus of the zinc finger protein
  • ZF-Right the zinc finger protein
  • the N-terminus of the zinc finger protein (ZF-Left) is bound to the C-terminus of the first segment of cytosine deaminase, and the zinc finger protein (ZF-Right) C is bound to the N-terminus of the second segment of cytosine deaminase.
  • -Ends joined NC configuration
  • the C-terminus of the zinc finger protein (ZF-Left) binds to the N-terminus of the first segment of cytosine deaminase, and the zinc finger protein (ZF-Right) N binds to the C-terminus of the second segment of cytosine deaminase.
  • ZF-Left The C-terminus of the zinc finger protein
  • ZF-Right the zinc finger protein
  • the N-terminus of the zinc finger protein (ZF-Left) is bound to the C-terminus of the first segment of cytosine deaminase, and the zinc finger protein (ZF-Right) N is bound to the C-terminus of the second segment of cytosine deaminase.
  • the terminals can be combined (NN configuration).
  • the ZF-Left may include the sequence of SEQ ID NO: 6:
  • the ZF-Right may include the sequence of SEQ ID NO: 7:
  • the sequence of ZF may vary depending on the DNA target.
  • ZF can be customized according to the DNA target sequence. Since ZF recognizes 3 bp of DNA, usually 3 to 6 ZFs can be connected to create a ZF combination that recognizes 9 to 18 bp of DNA. For example, it can be produced using a library that includes modules such as GNN, TNN, CNN, or ANN.
  • the zinc finger protein may be connected to the deaminase through a linker.
  • the linker may be a peptide linker containing 2 to 40 amino acid residues.
  • the linker may be, for example, a linker with a length of 2aa, 5aa, 10aa, 16aa, 24aa or 32aa, but is not limited thereto.
  • the linker may include:
  • the split deaminase and the zinc finger protein may be linked through a linker, and the zinc finger protein is bound to the N-terminus of the half deaminase containing the first split body, and the second split body A zinc finger protein binds to the N-terminus of the half deaminase containing sieve.
  • a base conversion from C to T may occur in the spacer between the left and right ZFP attachment points. It was confirmed that both the left and right ZFPs showed high proofreading efficiency when linked to each of the half deaminase containing the first segment and the half deaminase containing the second segment through a 24 a.a linker.
  • the TAL effector (TALE) consists of 33 to 34 repeated amino acid sequences, and has about 9 repeated domain (RVD, Repeated variant domain). It can recognize one nucleotide per domain and can bind to a specific DNA sequence depending on the 12th-13th amino acid sequence (HD->Cytosine, NI->Adenine, NG -> Thymine, NN -> Guanine). TALE recognizes a single DNA strand within the target site. The distance between target sites can be 12-14 nucleotides.
  • the TALE domain refers to a protein domain that binds to a nucleotide in a sequence-specific manner by combining one or more TALE-Repeat. It includes, but is not limited to, at least one TALE-Repeat, specifically 1 to 30 TALE-Repeats. TALE-Repeat is a site that recognizes a specific nucleotide sequence within the TALE domain.
  • the TALE domain includes a TALE N-terminal containing region and a TALE C-terminal containing region as a backbone structure.
  • a single TALE array or a first TALE array and a second TALE array may each bind.
  • a first TALE may be bound to the first cleavage body of the cytosine deaminase (left TALE), and a second TALE (right TALE) may be bound to the second cleavage body of the cytosine deaminase.
  • They have the structures N’-TALE-First Split-C’ and N’-TALE-Second Split-C’, respectively.
  • TALE arrays can be customized according to the target DNA sequence.
  • TALE arrays are composed of modules consisting of 33 to 35 amino acid residues, which are repeatedly arranged. These are derived from the plant pathogen Xanthmonas, and each module recognizes one A, C, G, and T base and binds to DNA. The base specificity of each module is determined by the 12th and 13th amino acid residues, which are called RVD (repeat variable di-residue). For example, a module with an RVD of NN recognizes G, NI recognizes A, HD recognizes C, and NG recognizes T.
  • the TALE array consists of a minimum of 14 to a maximum of 18 modules and can be designed to recognize target DNA sequences of 15bp to 20bp.
  • It may contain a mutated form of Cas protein. It may mean mutated to lose endonuclease activity to cut DNA double strands, for example, target-specific nucleases and endonucleases mutated to lose endonuclease activity and have nickase activity. It may be one or more of the forms that have been mutated to lose both enzyme activity and nickase activity.
  • nickase activity In the case of one having nickase activity, the strand on which the base conversion occurred or the opposite strand (e.g., the strand on which the base conversion occurred) simultaneously with the base conversion (e.g., conversion of cytosine to uradine) by the cytosine deaminase or sequentially regardless of the order.
  • a nick may be introduced in the strand opposite to the strand on which the base conversion occurred (e.g., in the strand opposite to the strand where the PAM is located, between the 3rd and 4th nucleotides in the 5' end direction of the PAM sequence). nick is introduced).
  • mutations may occur in the catalytically active domain (eg, the RuvC catalytic domain in the case of Cas9).
  • mutations include catalytic aspartate residues (aspartic acid at position 10 (D10), etc.), glutamic acid at position 762 (E762), and histidine at position 840 (H840). ), asparagine at position 854 (N854), asparagine at position 863 (N863), aspartic acid at position 986 (D986), etc. It may include a mutation in which one or more amino acids are substituted with any other amino acid. . At this time, any other amino acid to be substituted may be alanine, but is not limited thereto.
  • one or more of the aspartic acid at position 1135 (D1135), the arginine at position 1335 (R1335), and the threonine at position 1337 (T1337) of the Cas9 protein from Streptococcus pyogenes, such as all three are different. It may be substituted with an amino acid and mutated to recognize NGA (N is any base selected from A, T, G, and C) that is different from the PAM sequence (NGG) of wild-type Cas9.
  • the 'other amino acids' include alanine, isoleucine, leucine, methionine, phenylalanine, proline, tryptophan, valine, aspartic acid, cysteine, glutamine, glycine, serine, threonine, tyrosine, aspartic acid, glutamic acid, arginine, histidine, lysine, and the above amino acids.
  • it refers to an amino acid selected from among amino acids excluding the amino acid that the wild-type protein has at the original mutation position.
  • the ‘other amino acid’ may be alanine, valine, glutamine, or arginine.
  • guide RNA may be additionally included.
  • the guide RNA may be one or more selected from the group consisting of CRISPR RNA (crRNA), trans-activating crRNA (tracrRNA), and single guide RNA (sgRNA).
  • crRNA and tracrRNA are It may be a double-stranded crRNA:tracrRNA complex linked to each other, or a single-stranded guide RNA (sgRNA) in which crRNA or part thereof and tracrRNA or part thereof are linked by an oligonucleotide linker.
  • the present invention includes adenine deaminase.
  • the adenine deaminase may be selected from the group consisting of, for example, APOBEC1 (apolipoprotein B editing complex 1), AID (activation-induced deaminase), and tadA (tRNA-specific adenosine deaminase), and specifically, tadA (tRNA-specific adenosine deaminase).
  • APOBEC1 apolipoprotein B editing complex 1
  • AID activation-induced deaminase
  • tadA tRNA-specific adenosine deaminase
  • tadA tRNA-specific adenosine deaminase
  • -specific adenosine deaminase adenine deaminase
  • the adenine deaminase may be deoxy-adenine deaminas
  • deoxy-adenine deaminase was used as a variant of E. coli TadA, and may specifically be TadA8e or ABE 8.0.
  • the cytosine deaminase is contained in a split form, the DNA binding protein is a zinc finger protein, and the N-terminus of the zinc finger protein (ZF-Left) is bound to the C-terminus of the first fragment of the cytosine deaminase, In the structure where the C-terminus of the zinc finger protein (ZF-Right) is bound to the N-terminus of the second segment of cytosine deaminase (NC configuration), adenine deaminase is connected to the C-terminus of the zinc finger protein (ZF-Left).
  • the N-terminus or C-terminus of the first fragment of cytosine deaminase can bind to the N-terminus or C-terminus of the first fragment of cytosine deaminase, the N-terminus of zinc finger protein (ZF-Right), and the N-terminus or C-terminus of the second fragment of cytosine deaminase.
  • Adenine deaminase binds the C-terminus of a zinc finger protein (ZF-Left) to the N-terminus of the first split of cytosine deaminase, and a zinc finger protein (ZF-Left) binds to the N-terminus of the second split of cytosine deaminase.
  • ZF-Right) C-terminus bonded (CC configuration) The C-terminus of the zinc finger protein (ZF-Left) binds to the N-terminus of the first segment of cytosine deaminase, and the zinc finger protein (ZF-Right) N binds to the C-terminus of the second segment of cytosine deaminase.
  • the N-terminus of the zinc finger protein (ZF-Left) is bound to the C-terminus of the first split fragment of cytosine deaminase, and the zinc finger protein (ZF-Right) is bound to the C-terminus of the second split fragment of cytosine deaminase.
  • the C terminus of the zinc finger protein (ZF-Left), the N terminus or C terminus of the first cleavage of cytosine deaminase, the N terminus of the zinc finger protein (ZF-Right), It can bind to the N-terminus or C-terminus of the second fragment of cytosine deaminase.
  • the first TALE is bound to the first split of the cytosine deaminase
  • the first TALE is bound to the second split of the cytosine deaminase.
  • 2 TALEs can be combined and have the structures N'-TALE-first split DDDA-C' and N'-TALE-second split DDDA-C', respectively.
  • Adenine deaminase may bind to the N-terminus or C-terminus of the first cleavage of cytosine deaminase or to the N-terminus or C-terminus of the second cleavage of cytosine deaminase.
  • the present invention relates to the A-to-G base of plant cell organelle DNA, including 1) DNA binding protein, 2) split double-stranded DNA-specific bacterial cytosine deaminase, and 3) deoxyadenin deaminase from E. coli TadA.
  • a proofreading composition (without uracil DNA-glycosylase inhibitor (UGI)), wherein the DNA binding protein is a zinc finger protein (ZFP) or a transcription activator-like effector (TALE) array; It is a composition that is DddAtox derived from Burkholderia cenocepacia, a split double-stranded DNA-specific bacterial cytosine deaminase.
  • the cytosine deaminase is contained in a split form, the DNA binding protein is a zinc finger protein, and the N-terminus of the zinc finger protein (ZF-Left) is bound to the C-terminus of the first fragment of the cytosine deaminase, In the structure where the C-terminus of the zinc finger protein (ZF-Right) is bound to the N-terminus of the second segment of cytosine deaminase (NC configuration), adenine deaminase is connected to the C-terminus of the zinc finger protein (ZF-Left).
  • the N-terminus or C-terminus of the first fragment of cytosine deaminase can bind to the N-terminus or C-terminus of the first fragment of cytosine deaminase, the N-terminus of zinc finger protein (ZF-Right), and the N-terminus or C-terminus of the second fragment of cytosine deaminase.
  • Adenine deaminase binds the C-terminus of a zinc finger protein (ZF-Left) to the N-terminus of the first split of cytosine deaminase, and a zinc finger protein (ZF-Left) binds to the N-terminus of the second split of cytosine deaminase.
  • ZF-Right) C-terminus bonded (CC configuration) The C-terminus of the zinc finger protein (ZF-Left) binds to the N-terminus of the first segment of cytosine deaminase, and the zinc finger protein (ZF-Right) N binds to the C-terminus of the second segment of cytosine deaminase.
  • the N-terminus of the zinc finger protein (ZF-Left) is bound to the C-terminus of the first split fragment of cytosine deaminase, and the zinc finger protein (ZF-Right) is bound to the C-terminus of the second split fragment of cytosine deaminase.
  • the C terminus of the zinc finger protein (ZF-Left), the N terminus or C terminus of the first cleavage of cytosine deaminase, the N terminus of the zinc finger protein (ZF-Right), It can bind to the N-terminus or C-terminus of the second fragment of cytosine deaminase.
  • the cytosine deaminase When the cytosine deaminase is contained in a split form and the DNA-binding protein is a TALE, the first TALE is bound to the first fragment of the cytosine deaminase, and the second TALE is bound to the second fragment of the cytosine deaminase.
  • 2 TALEs can be combined and have the structures N'-TALE-first split DDDA-C' and N'-TALE-second split DDDA-C', respectively.
  • Adenine deaminase may bind to the N-terminus or C-terminus of the first cleavage of cytosine deaminase or to the N-terminus or C-terminus of the second cleavage of cytosine deaminase.
  • the present invention is a composition for A-to-G base correction of plant cell organelles, wherein the DNA binding protein is a zinc finger protein, or TALE array, and the first cleavage body derived from the cytosine deaminase and the second split is derived from bacteria and is specific for double-stranded DNA.
  • the DNA binding protein is a zinc finger protein, or TALE array
  • the first cleavage body derived from the cytosine deaminase and the second split is derived from bacteria and is specific for double-stranded DNA.
  • the present invention is a composition for A-to-G base correction of plant cell organelles, wherein the DNA binding protein is a zinc finger protein or a TALE array, and the first fragment derived from the cytosine deaminase and The second split is derived from bacteria, is specific for double-stranded DNA, and has a DNA-binding protein bound to the N-terminus of the first split, and a DNA-binding protein is bound to the C-terminus of adenine deaminase. It's about.
  • the present invention is for A-to-G base proofreading of plant cell organelles, including 1) DNA binding protein, 2) split double-stranded DNA-specific bacterial cytosine deaminase, and 3) deoxyadenin deaminase from E. coli TadA.
  • the composition does not include a UGI, wherein the DNA binding protein is a zinc finger protein (ZFP) or transcription activator-like effector (TALE) array; It is a composition that is DddAtox derived from Burkholderia cenocepacia, a split double-stranded DNA-specific bacterial cytosine deaminase.
  • the present invention is a plant cell organelle A-to-G base correction method, which includes a DNA binding protein or a nucleic acid encoding the same; First and second fragments derived from cytosine deaminase or nucleic acids encoding them; And a step of treating plant cells with adenine deaminase or a nucleic acid encoding the same, wherein the DNA binding protein is a zinc finger protein, or a TALE array, and the cytosine deaminase-derived
  • the first and second splits are of bacterial origin and are specific for double-stranded DNA.
  • the present invention is a plant cell organelle A-to-G base correction method, which includes a DNA binding protein or a nucleic acid encoding the same; First and second fragments derived from cytosine deaminase or nucleic acids encoding them; And a step of treating plant cells with adenine deaminase or a nucleic acid encoding the same, wherein the DNA binding protein is a zinc finger protein, or a TALE array, and the cytosine deaminase-derived
  • the first and second splits are of bacterial origin and are specific for double-stranded DNA, and a DNA binding protein is bound to the N terminus of the first split, and a DNA binding protein is bound to the C terminus of adenine deaminase. It's about how things are done.
  • the present invention is a plant cell organelle A-to-G base correction method, which includes a DNA binding protein or a nucleic acid encoding the same; First and second fragments derived from cytosine deaminase or nucleic acids encoding them; And a step of treating plant cells with adenine deaminase or a nucleic acid encoding the same, 1) DNA binding protein 2) split double-stranded DNA-specific bacterial cytosine deaminase, and 3) deoxygenase derived from E. coli TadA.
  • ZFP zinc finger protein
  • TALE transcription activator-like effector
  • TALED which does not contain UGI, did not cause C-to-T editing in animal cell mitochondria, but only A-to-G editing.
  • the present invention may further include a chloroplast transit peptide or a mitochondrial targeting signal (MTS).
  • MTS mitochondrial targeting signal
  • Chloroplast Transit Peptide CTP
  • Mitochondrial Targeting Signal MTS
  • CTP Chloroplast Transit Peptide
  • MTS Mitochondrial Targeting Signal
  • polynucleotide With reference to the above nucleic acids, the terms “polynucleotide,” “nucleotide,” “nucleotide sequence,” and “oligonucleotide” are used interchangeably. It may include polymeric forms of nucleotides of any length, deoxyribonucleotides or ribonucleotides, or analogs thereof. Polynucleotides can have any three-dimensional structure and can perform any function, known or unknown. A polynucleotide may include one or more modified nucleotides, such as methylated nucleotides and nucleotide analogs. Modifications to the nucleotide structure may be possible before or after assembly of the polymer.
  • the polynucleotide may be an RNA sequence, a DNA sequence, or a combination thereof (RNA-DNA combination sequence).
  • known expression vectors such as plasmid vectors, cosmid vectors, and bacteriophage vectors can be used, and vectors can be easily prepared by those skilled in the art according to any known method using DNA recombination technology. You can.
  • the vector may be a plasmid vector or a viral vector, and the viral vector may specifically be an Adenovirus, Adeno-associated virus, Lentivirus, or Retrovirus vector. It is not limited to this.
  • a recombinant expression vector may contain a nucleic acid in a form suitable for expression of the nucleic acid in a host cell, which is selected based on the host cell such that the recombinant expression vector is used for expression, i.e., is operably linked to the nucleic acid sequence to be expressed. means that it contains one or more control elements that can be
  • operably linked means that the nucleotide sequence of interest is linked in a manner that allows expression of the nucleotide sequence (e.g., in an in vitro transcription/translation system or in a host cell if the vector is introduced into the host cell). ) means that it is connected to a regulatory element.
  • the recombinant expression vector may contain a form suitable for messenger RNA synthesis, including the T7 promoter, which allows for in situ mRNA synthesis, i.e., contains one or more regulatory elements that allow messenger RNA to be synthesized by T7 polymerase. It means that
  • Regulatory elements may include promoters, enhancers, internal ribosome entry sites (IRES), and other expression control elements (e.g., transcription termination signals such as polyadenylation signals and poly-U sequences). Regulatory elements include elements that direct the induction or constitutive expression of a nucleotide sequence in many types of host cells and elements that direct expression of a nucleotide sequence only in specific host cells (e.g., tissue-specific regulatory sequences). Tissue-specific promoters direct expression primarily in the desired tissue of interest, such as muscle, neurons, bone, skin, blood, specific organs (e.g., liver, pancreas), or specific cell types (e.g., lymphocytes). can do. Regulatory elements can also direct expression in a temporally-dependent manner, such as a cell-cycle dependent or developmental stage-dependent manner, which may or may not be tissue or cell-type specific.
  • the vector includes one or more pol III promoters, one or more pol II promoters, one or more pol I promoters, or combinations thereof.
  • pol III promoters include, but are not limited to, the U6 and H1 promoters.
  • pol II promoters include, but are not limited to, the retroviral Rous sarcoma virus (RSV) LTR promoter (optionally with an RSV enhancer), the cytomegalovirus (CMV) promoter (optionally with a CMV enhancer) (e.g., Boshart et al.
  • RSV Rous sarcoma virus
  • CMV cytomegalovirus
  • SV40 promoter dihydrofolate reductase promoter
  • ⁇ -actin promoter phosphoglycerol kinase (PGK) promoter
  • PGK phosphoglycerol kinase
  • Regulatory elements include enhancers such as WPRE; CMV enhancer; R-U5' segment in the LTR of HTLV-I; SV40 enhancer; and an intron sequence between exons 2 and 3 of rabbit ⁇ -globin.
  • a vector can be introduced into a host cell to produce a transcript, protein or peptide comprising a fusion protein or peptide encoded by a nucleic acid as described herein (e.g., clustered regularly spaced short palindromic repeats ( CRISPR) transcripts, proteins, enzymes, mutants thereof, fusion proteins, etc.).
  • Beneficial vectors include lentiviruses and adeno-associated viruses, and these types of vectors can also be selected to target specific types of cells.
  • the vectors can be administered through local injection (e.g., direct injection into lesions or target areas), electroporation, lipofection, viral vectors, nanoparticles, as well as PTD (Protein translocation domain) fusion protein methods. It can be delivered in vivo or intracellularly.
  • the nucleic acid is injected in the form of ribonucleic acid, for example, messenger ribonucleic acid (mRNA), enabling gene base correction in cells, for example, gene base correction without limitation in animal cells or plant cells.
  • ribonucleic acid for example, messenger ribonucleic acid (mRNA)
  • mRNA messenger ribonucleic acid
  • the nucleic acid according to the present invention may be in the form of mRNA, and when delivered in the form of mRNA, the initiation of gene editing can be faster because the transcription process into mRNA is not necessary compared to delivery in the form of a vector using DNA. There is a high possibility of transient protein expression.
  • the inventors of the present application found that when a cytosine base editor was injected into plant cells in the form of ribonucleic acid, for example, messenger ribonucleic acid, for gene editing of plant cell organelles, the off-target effect was reduced compared to delivery with a plasmid. was confirmed.
  • ribonucleic acid for example, messenger ribonucleic acid
  • the off-target effect was reduced compared to delivery with a plasmid. was confirmed.
  • editing the genes of plant cell organelles it was demonstrated for the first time that when a cytosine base corrector was transformed into plant cells in the form of mRNA, it had an advantage in off-target effects compared to plasmids.
  • the mRNA can be delivered directly or via a carrier.
  • the mRNA of the nucleic acid cleavage enzyme and/or cleavage factor may be chemically modified or directly delivered in the form of synthetic self-replicating RNA.
  • Methods that can deliver mRNA molecules to cells in vitro or in vivo can be considered, including methods of delivering mRNA to cells or delivering mRNA in vivo to cells of organisms such as humans and animals.
  • they contain lipids (e.g., liposomes, micelles, etc.), contain nanoparticles or nanotubes, contain cationic compounds (e.g., polyethyleneimine or PEI), or contain cationic compounds (e.g.
  • polyethyleneimine or PEI can be used to deliver mRNA molecules into cells.
  • ballistics methods such as gene guns or biolistic particle delivery systems, can be used to deliver mRNA to cells.
  • the carrier may include, for example, cell penetrating peptide (CPP), nanoparticles, or polymers, but is not limited thereto.
  • CPP cell penetrating peptide
  • nanoparticles or polymers, but is not limited thereto.
  • the CPP is a short peptide that facilitates cellular uptake of a variety of molecular cargo (from nanosized particles to small chemical molecules and large fragments of DNA).
  • the composition according to the present invention can be delivered via polymer nanoparticles, metal nanoparticles, metal/inorganic nanoparticles or lipid nanoparticles.
  • the polymer nanoparticles may be, for example, DNA nanoclews or thread-like DNA nanoparticles synthesized by rolling circle amplification.
  • DNA nanoclews and thread-like DNA nanoparticles can be loaded with mRNA and coated with PEI to improve endosomal escape ability. These complexes can bind to the cell membrane, be internalized, and then move to the nucleus through endosome escape, allowing them to be delivered.
  • gold particles can be connected to form a complex with a cationic endosomal escape polymer (endosomal disruptive polymer) and delivered to cells.
  • the cationic endosomal escape polymer (endosomal disruptive polymer) is, for example, polyethylene imine, poly(arginine), poly(lysine), poly(histidine), poly-[2- ⁇ (2-aminoethyl)amino ⁇ -ethyl -aspartamide] (pAsp(DET)), block co-polymer of poly(ethylene glycol) (PEG) and poly(arginine), block co-polymer of PEG and poly(lysine), or PEG and poly ⁇ N -[ N It may be a block co-polymer of -(2-aminoethyl)-2-aminoethyl]aspartamide ⁇ (PEG-pAsp(DET)).
  • mRNA can be encapsulated through ZIF-8 (zeolitic imidazolate framework-8).
  • the mRNA is negatively charged and can combine with cationic substances to form nanoparticles, which undergo receptor-mediated endocytosis into cells. It can penetrate through endocytosis or phagocytosis.
  • Cationic polymers include polyallylamine (PAH); polyethyleneimine (PEI); poly(L-lysine) (PLL); poly(L-arginine) (PLA); polyvinylamine homo- or copolymer; poly(vinylbenzyl-tri-C1-C4-alkylammonium salt); polymers of aliphatic or araliphatic dihalides and aliphatic N,N,N',N'-tetra-C1-C4-alkyl-alkylenediamines; poly(vinylpyridine) or poly(vinylpyridinium salt); poly(N,N-diallyl-N,N-di-C1-C4-alkyl-ammonium halide); Homo- or copolymers of quaternized di-C1-C4-alkyl-aminoethyl acrylates or methacrylates; POLYQUADTM; Polyaminoamide, etc. may be included.
  • Cationic lipids may include cationic liposome preparations.
  • the lipid bilayer of the liposome protects the encapsulated nucleic acid from degradation and can prevent specific neutralization by antibodies that can bind to the nucleic acid.
  • the endosomal membrane and liposomes fuse, allowing efficient endosomal escape of cationic lipid-nucleic acid cleavage enzymes.
  • Cationic lipids include polyethyleneimine, polyamidoamine (PAMAM) dendrite, lipofectin (combination of DOTMA and DOPE), lipofectase, LIPOFECTAMINE® (e.g.
  • Representative cationic liposomes are N-[1-(2,3-dioleoloxy)-propyl]-N,N,N-trimethylammonium chloride (DOTMA), N-[1-(2,3-dioleoloxy) -Propyl]-N,N,N-trimethylammonium methylsulfate (DOTAP), 3 ⁇ -[N-(N',N'-dimethylaminoethane)carbamoyl]cholesterol (DC-Chol), 2,3- Dioleyloxy-N-[2(sperminecarboxamido)ethyl]-N,N-dimethyl-1-propanaminium trifluoroacetate (DOSPA), 1,2-dimyristyloxypropyl-3 -dimethyl-hydroxyethyl ammonium bromide; or dimethyldioctadecylammonium bromide (DDAB).
  • DOTMA N-[1-(2,3
  • Liposomes are spherical vesicular structures composed of a single or multilamellar lipid bilayer surrounding an internal aqueous compartment and a relatively impermeable outer lipophilic phospholipid bilayer.
  • Liposomal formulations may primarily include natural phospholipids and lipids, such as 1,2-distearolyl-sn-glycero-3-phosphatidyl choline (DSPC), sphingomyelin, phosphatidylcholine, or monosialoganglioside.
  • DSPC 1,2-distearolyl-sn-glycero-3-phosphatidyl choline
  • sphingomyelin phosphatidylcholine
  • monosialoganglioside monosialoganglioside.
  • cholesterol or 1,2-dioleoyl-sn-glycero-3-phosphoethanolamine may be added to the lipid membrane to resolve instability in plasma.
  • the addition of cholesterol reduces the rapid release of the encapsulated bioactive compound into the plasma or 1,2-dioleoyl-sn-glycero-3-phosphoethanolamine (DOPE) increases its stability.
  • composition can be delivered to plant cells via:
  • the polynucleotide sequence encoding the fusion protein according to the present invention may be an RNA sequence, a DNA sequence, or a combination thereof (RNA-DNA combination sequence).
  • the nucleic acid can be delivered to plant cells via:
  • Agrobacterium such as Agrobacterium tumefaciens, Agrobacterium rhizogene, etc.
  • Viral vector Geminivirus, tobacco rattle virus (TRV), tomato mosaic virus (ToMV), foxtail mosaic virus (FoMV), barley yellow striate mosaic virus (BYSMV), Sonchus yellow net rhabdovirus (SYNV), etc.;
  • the virus is, for example, viral vector: Geminivirus, tobacco rattle virus (TRV), tomato mosaic virus (ToMV), foxtail mosaic virus (FoMV), barley yellow striate mosaic virus (BYSMV), Sonchus yellow net rhabdovirus (SYNV), etc.
  • TRV tobacco rattle virus
  • ToMV tomato mosaic virus
  • FoMV foxtail mosaic virus
  • BYSMV barley yellow striate mosaic virus
  • SYNV Sonchus yellow net rhabdovirus
  • the vectors can be administered through local injection (e.g., direct injection into lesions or target areas), electroporation, lipofection, viral vectors, nanoparticles, as well as PTD (Protein translocation domain) fusion protein methods. Can be delivered intracellularly.
  • the present invention relates to a method for correcting the bases of plant cell organelle DNA, comprising the step of treating plant cells with the composition.
  • the present invention relates to atrazine herbicide-resistant plants in which the base of the chloroplast psbA gene containing the GTTGAAAGC sequence has been corrected by the above method.
  • the present invention relates to spectinomycin-resistant plants in which the base of 16s rRNA containing the CGTCATCCTCA sequence has been corrected by the above method.
  • the present invention relates to plants in which the base of the atp6 gene has been corrected by the above method.
  • the present invention relates to a plant with an albino phenotype in which the base of the psaA gene including ATG has been corrected by the above method.
  • Phenylalanine By base-correcting Phenylalanine, the 295th amino acid of psbA in chloroplast DNA, to Serine, plants resistant to Atrazine, one of the herbicides, can be developed. Spectinomycin-resistant plants and albino-type plants can be developed through base correction of 16s rRNA and psaA, as well as psbA of chloroplasts.
  • the present invention relates to a plant in which the base of the chloroplast rubisco (ribulose bisphosphate carboxylase) coding gene has been corrected by the above method. Since base correction of the rubisco large unit involved in photosynthesis is possible, it is possible to increase plant production by controlling photosynthetic efficiency.
  • chloroplast rubisco ribulose bisphosphate carboxylase
  • the chloroplast base sequence has high homology between plants, so not only lettuce (Lactuca sativa cv. Cheongchima) used in the present invention, but also plants such as rice, wheat, potato, and tomato are resistant to atrazine. can be developed
  • the plasmid was delivered to lettuce protoplasts, and after 7 days, it was confirmed that the adenine base had been corrected at the target within the atp6 gene of mitochondrial DNA.
  • FIG. 1 A schematic diagram of DNA cloning for producing transgenic plants using Agrobacterium is shown in Figure 1.
  • RPS5A promoter-PTP-3xFlag-Left TALE-1397N and RPS5A promoter-PTP-3xFlag-Right TALE-1397C are placed in vectors with different Aat II and Pme I sites.
  • -ABE8.0 was cloned respectively.
  • Base correction efficiency and phenotype of first-generation transformants targeting psaA , rbcL , and rrn16S genes in Arabidopsis chloroplasts are shown.
  • a Base correction efficiency and location of psaA #1, 2, and 3 are shown. Base correction of adenine and cytosine occur simultaneously.
  • b The phenotype of psaA #3 can show green, chimeric, and pale green traits.
  • c Base proofreading efficiency, location and phenotype of rbcL #1 and 2.
  • d The base correction efficiency of the first generation transformant targeting the rrn16S gene is shown in Figure 5.
  • Figure 6 confirms that chloroplast base correction is passed on to the next generation, and in the case of b, it is confirmed that A to G and C to T base correction are passed on to the next generation.
  • chloroplasts of psaA #1 (a), psaA #3 chimeric (b), psaA #3 pale green (c), rrn16s #1 (d), 6 (e) and wild type Col-0 (f).
  • Off-target base mutations through whole-genome analysis. No obvious off-target base mutations were observed in the transgenic plants compared to the wild type.
  • a total of 30ug of -1397C-ABE8.0-Pea3A terminator, PcUBi promoter-MTS-3xFlag-Right TALE-1397N-Pea3A terminator were delivered at 15ug each, and the adenine base proofreading efficiency was measured after 7 days, A6 0.99%, A9 1.12 % base correction efficiency was shown.
  • the only base proofreading method for plant cell organelle DNA was deamination of cytosine to thymine using DddAtox.
  • the scope of DNA base correction in small organs has been expanded by correcting adenine to guanine. A to G base correction and C to T base correction can occur together.

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Cell Biology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Botany (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)

Abstract

본 발명은 식물세포 소기관 DNA의 염기 교정용 조성물, 특히 식물세포 소기관 DNA의 아데닌을 구아닌 및 시토신을 티민으로 교정하기 위한 조성물 및 교정방법에 관한 것이다.

Description

식물세포 소기관 DNA의 염기 교정
본 발명은 식물세포 소기관 DNA의 염기 교정용 조성물, 특히 식물세포 소기관 DNA의 아데닌을 구아닌 및 시토신을 티민으로 동시에 교정하기 위한 조성물 및 교정방법에 관한 것이다.
DNA 결합 단백질과 탈아미노효소가 연결된 융합단백질은 DNA 이중 가닥 절단 (DSBs)을 생성하지 않고 유전체에서 표적화된 뉴클레오타이드 치환 또는 염기 교정(base editing), 유전적 장애를 유발하는 점 돌연변이를 교정하거나 원핵세포, 인간 및 다른 진핵세포에 목적하는 단일 뉴클레오타이드 변이를 도입하도록 표적화된 방식(targeted manner)으로 단일 뉴클레오타이드 전환을 가능하게 한다.
ZFN (zinc-finger nuclease), TALEN (transcription activator-like effector nuclease), CRISPR (clustered regularly interspaced short palindromic repeat) 시스템 및 핵산분해 효율이 없는 크리스퍼 연관 단백질 9 (Cas9) 변이체와 염기 탈아미노효소 단백질의 염기 교정 기술 등의 프로그램 (설정) 유전체 교정 도구들은 염기 서열의 변화를 통하여 식물의 유전적 연구와 작물 형질 개선에 발전되어 왔다. 그러나 이러한 도구들은 미토콘드리아와 엽록체를 포함한 식물 기관의 DNA 서열을 교정하기에는 적합하지 않은데, 그 주된 이유는 가이드 RNA를 소기관으로 전달하거나, 두 화합물을 소기관에서 동시에 발현하는 것이 어렵기 때문이다. 식물세포 소기관은 광합성 및 호흡에 필요한 여러 필수적인 유전자를 암호화하고 있다. 이러한 소기관의 유전자를 교정하는 방법이나 도구는 이러한 유전자의 기능 연구나 작물 생산성과 형질 개선에 매우 필요하다. 예를 들어, 미토콘드리아 atp6 유전자의 표적 돌연변이는 번식에 유용한 특성인 웅성불임을 유발할 수 있고, 엽록체 게놈의 16S rRNA 유전자의 특정 점 돌연변이는 항생제 내성을 유발할 수 있다.
박테리아 독소 DddAtoxBurkholderia cenocepacia에서 유래된 박테리아 독소의 효소 기능을 맡는 부분으로, 이중 나선 DNA의 시토신을 탈아미노화 할 수 있다. 탈아미노효소의 예시로, DddAtox는 세포에 독성이 있기 때문에 숙주세포에서의 독성을 피하기 위해, DddAtox는 두 개의 비활성화된 분할체(split)로 나누어 사용하는데, 각각의 반체는 DNA에 결합할 수 있도록 고안된 DNA 결합 단백질에 연결하여 기능을 갖춘 DdCBE 쌍으로써 사용할 수 있다.
이러한 기술적 배경하에서, 식물세포 소기관 DNA의 A to G 염기 교정과 C to T 염기 교정이 같이 일어날 수 있음을 확인하고, 본 발명을 완성하였다.
발명의 요약
본 발명의 목적은 DNA 결합 단백질, 시토신 탈아미노효소 또는 분리된 형태의 시토신 탈아미노효소 (deaminase) 및 아데닌 탈아미노효소 또는 이를 코딩하는 핵산을 포함하는 식물세포 소기관 DNA의 염기 교정용 조성물을 제공하는데 있다.
본 발명의 목적은 식물세포 소기관 DNA를 교정하는 방법을 제공하는데 있다.
상기 목적을 달성하기 위하여, 본 발명은 DNA 결합 단백질 또는 이를 코딩하는 핵산; 시토신 탈아미노효소 (deaminase) 또는 시토신 탈아미노효소 유래의 제1분할체 및 제2분할체 또는 이를 코딩하는 핵산; 및 아데닌 탈아미노효소 또는 이를 코딩하는 핵산을 포함하는, 식물세포 소기관 DNA의 염기 교정용 조성물을 제공한다.
본 발명은 또한, 상기 조성물을 식물세포에 처리하는 단계를 포함하는 식물세포 소기관 DNA의 염기를 교정하는 방법을 제공한다.
도 1은 Agrobacterium을 이용한 형질전환 식물 제작을 위한 DNA cloning 모식도이다.
도 2는 psaA 유전자를 타겟하는 형질전화체 식물. a, 각 식물체의 염기 교정 효율과 위치. b, 식물의 표현형. c, DNA염기교정으로 인한 아미노산 염기 서열의 변화 결과를 나타낸 것이다.
도 3은 rbcL 유전자를 타겟하는 형질전화체 식물. a, 각 식물체의 염기 교정 효율과 위치. b, DNA염기교정으로 인한 아미노산 염기 서열의 변화 결과를 나타낸 것이다.
도 4는 rrn16S 유전자를 타겟하는 형질전환 식물의 염기 교정 효율과 위치 확인한 결과를 나타낸 것이다.
도 5는 애기 장대의 엽록체에 있는 psaA, rbcLrrn16S 유전자를 타겟 하는 1세대 형질전환체의 염기 교정 효율과 표현형. a, psaA #1, 2, 3의 염기 교정 효율과 위치. Adenine의 염기 교정뿐 아니라 Cytosine의 염기 교정이 동시에 일어남. b, psaA #3의 표현형으로 green, chimeric, pale green의 형질을 나타냄. c, rbcL #1, 2의 염기 교정 효율, 위치와 표현형. d, rrn16S 유전자를 타겟하는 1세대 형질전환체의 염기 교정 효율을 확인한 결과를 나타낸 것이다.
도 6은 형질전환 2세대 식물의 염기 교정 효율과 표현형. psaA #3의 형질전환 2세대의 표현형과 (a), 염기 교정 효율과 위치 (b). Spectinomycin에 저항성을 가지는 rrn16S 형질전환 2세대의 표현형 (c)과 염기 교정 효율과 위치 (d). e, 형질전환 식물에 도입된 외부 유전자의 유무를 PCR로 확인한 결과 rrn16S #9-1, 3은 외부 유전자가 없는 것을 확인하였다.
도 7은 rrn16S 형질전환 2세대 식물 중 Spectinomycin에 저항성과 민감성을 가지는 식물의 염기 교정 위치와 효율을 확인한 결과를 나타낸 것이다.
도 8은 psaA #1 (a), psaA #3 chimeric (b), psaA #3 pale green (c), rrn16s #1 (d), 6 (e)과 야생형 Col-0 (f)의 엽록체 전장 유전체 분석을 통한 표적 외 염기 변이. 야생형과 비교했을 때 형질전환 식물에서 뚜렷한 표적 외 염기 변이가 관찰되지 않음.
도 9는 상추 미토콘드리아 유전자 atp6의 염기교정을 효율을 나타낸 것이다.
발명의 상세한 설명 및 바람직한 구현예
다른 식으로 정의되지 않는 한, 본 명세서에서 사용된 모든 기술적 및 과학적 용어들은 본 발명이 속하는 기술분야에서 숙련된 전문가에 의해서 통상적으로 이해되는 것과 동일한 의미를 갖는다. 일반적으로, 본 명세서에서 사용된 명명법은 본 기술분야에서 잘 알려져 있고 통상적으로 사용되는 것이다.
식물세포의 소기관 DNA의 염기 교정은 DddAtox를 TALE과 결합하여 시토신을 티민으로 교정하는 방법만 존재하였다. 본 발명에 따른 기술적 과제인 DddAtox와 Adenine deaminase를 TALE에 결합하여 세포 소 기관 DNA의 염기를 교정하려 한다. 기존에는 불가능하였던 세포 소기관 DNA의 염기 교정함으로써 제초제 저항성을 가지는 식물 등 기능성 식물을 개발할 수 있다.
본 출원의 발명자들은 DNA에 결합할 수 있는 TALE 또는 ZFP 단백질에 DddAtox 시토신 탈아미노효소와 아데닌 탈아미노효소를 연결하여 A to G 염기 교정과 C to T 염기 교정이 같이 일어나는 염기 교정기 (base editor)를 제작하였다.
이를 바탕으로 일 관점에서, 본 발명은 식물세포 소기관 DNA의 염기 교정용 조성물로, DNA 결합 단백질 또는 이를 코딩하는 핵산; 시토신 탈아미노효소 또는 시토신 탈아미노효소 (deaminase) 유래의 제1분할체 및 제2분할체 또는 이를 코딩하는 핵산; 및 아데닌 탈아미노효소 또는 이를 코딩하는 핵산을 포함하며, 상기 식물세포 소기관 DNA의 아데닌을 구아닌으로, 시토신을 티민으로 동시에 교정하는 것을 특징으로 하는 조성물에 관한 것이다.
본 명세서에서 사용되는 “교정”은 “편집”과 상호 호환적으로 사용 가능하고, 특이적 게놈 표적의 선택적 결실에 의해서 핵산 서열을 변경시키는 방법을 의미한다. 이러한 특이적 게놈 표적은 염색체 영역, 유전자, 프로모터, 오픈 리딩 프레임 또는 임의의 핵산 서열을 포함하지만, 이에 제한되지 않는다.
본 명세서에서 사용되는 "단일 염기"는 핵산 서열 내 하나, 및 오직 하나의 뉴클레오티드를 의미한다. 단일 염기 교정의 맥락에서 사용될 때, 이것은 핵산 서열 내 특이적 위치의 염기가 상이한 염기로 치환되는 것을 의미한다. 이러한 치환은 제한없이 치환 또는 변형을 포함한, 많은 기전에 의해 일어날 수 있다.
본 명세서에서 사용되는 "표적" 또는 "표적 부위"는 임의 조성 및/또는 길이의 사전에 확인된 핵선 서열을 의미한다. 이러한 표적 부위는 염색체 영역, 유전자, 프로모터, 오픈 리딩 프레임 또는 임의의 핵산 서열을 포함하지만, 이에 제한되지 않는다.
본 명세서에서 사용되는 "온-타겟”은 프로그램 가능한 DNA 결합 영역 및/또는 단일 가이드 RNA 서열과 완전하게 상보성일 수 있는 특이적 게놈 표적의 하위 서열을 의미한다.
본 명세서에서 사용되는 “오프-타겟”은 프로그램 가능한 DNA 결합 영역 및/또는 단일 가이드 RNA 서열과 부분적으로 상보성일 수 있는 특이적 게놈 표적의 하위 서열을 의미한다.
본 발명에서 시토신 탈아미노효소 또는 이의 변이체 유래인 제1분할체 및 제2분할체를 포함하고, 상기 시토신 탈아미노효소가 DNA 결합 단백질에 결합되거나 상기 제1분할체 및 제2분할체가 각각 상기 DNA 결합 단백질에 결합되는 형태를 가진다.
상기 시토신 탈아미노효소는 아미노기 이탈 효소로, 시토신(C)을 우리딘(U)으로 전환시킬 수 있다.
상기 시토신 탈아미노효소일 수 있다. 상기 시토신 탈아미노효소로 예를 들어, APOBEC1 (apolipoprotein B editing complex 1), AID (activation-induced deaminase)의 형태가 존재하나, 대부분의 DNA 탈아미노효소들은 단일 가닥 DNA에만 작동해서 DNA 결합 단백질에 연결하여 염기 교정하는 데에는 적합하지 않을 수 있다. 구체적으로, 상기 시토신 탈아미노효소는 상기 시토신 탈아미노효소는 이중 가닥 DNA에 작용하는 탈아미노효소 (DddA) 또는 이의 오솔로그 (orthologue)에서 유래한 것일 수 있다. 더욱 구체적으로, 상기 시토신 탈아미노효소는 이중 가닥 DNA 특이적 박테리아 시토신 탈아미노효소일 수 있다.
상기 시토신 탈아미노효소는 분할된 형태로, 상기 시토신 탈아미노효소는 분리된 제1분할체 및 제2분할체를 포함하고, 상기 제1분할체와 제2분할체 각각은 탈아미노효소 활성이 없는 것이다.
전장 시토신 탈아미노효소 중 tox 분할체에 해당하는 서열번호 1의 서열을 포함할 수 있다. 상기 시토신 탈아미노효소는 제1분할체 및 제2분할체를 포함하고, 상기 제1분할체와 제2분할체 각각은 탈아미노효소 활성이 없다.
Figure PCTKR2023014300-appb-img-000001
하나의 실시예에서, 상기 시토신 탈아미노효소의 제1분할체 또는 제2분할체는 서열번호 1의 서열 중 N 말단에서 G33, G44, A54, N68, G82, N98, G108로 구성된 군에서 선택되는 하나 이상까지의 서열을 포함할 수 있다. 상기 시토신 탈아미노효소의 제1분할체 또는 제2분할체는 서열번호 1의 서열 중 G34, P45, G55, N69, T83, A99, A109로 구성된 군에서 선택되는 하나 이상에서 C-말단까지의 서열을 포함할 수 있다.
구체적으로, 상기 시토신 탈아미노효소는 서열번호 2의 제1분할체 (G1333-N) 및 서열번호 3의 제2분할체 (G1333-C)을 포함하거나, 서열번호 4의 제1분할체 (G1397-N) 및 서열번호 5의 제2분할체 (G1397-C)을 포함하거나, 서열번호 2의 제1분할체 (G1333-N) 및 서열번호 5의 제2분할체 (G1397-C)을 포함하거나, 서열번호 4의 제1분할체 (G1397-N) 및 서열번호 2의 제2분할체 (G1333-C)을 포함할 수 있다.
다른 식으로 정의되지 않는 한, 본 명세서에서 사용된 모든 기술적 및 과학적 용어들은 본 발명이 속하는 기술분야에서 숙련된 전문가에 의해서 통상적으로 이해되는 것과 동일한 의미를 갖는다. 일반적으로, 본 명세서에서 사용된 명명법은 본 기술분야에서 잘 알려져 있고 통상적으로 사용되는 것이다.
식물세포의 소기관 DNA의 염기 교정은 DddAtox를 TALE과 결합하여 시토신을 티민으로 교정하는 방법만 존재하였다. 본 발명에 따른 기술적 과제인 DddAtox와 Adenine deaminase를 TALE에 결합하여 세포 소 기관 DNA의 염기를 교정하려 한다. 기존에는 불가능하였던 세포 소기관 DNA의 염기 교정함으로써 제초제 저항성을 가지는 식물 등 기능성 식물을 개발할 수 있다.
본 출원의 발명자들은 DNA에 결합할 수 있는 TALE 또는 ZFP 단백질에 DddAtox 시토신 탈아미노효소와 아데닌 탈아미노효소를 연결하여 A to G 염기 교정과 C to T 염기 교정이 같이 일어나는 염기 교정기 (base editor)를 제작하였다.
이를 바탕으로 일 관점에서, 본 발명은 식물세포 소기관 DNA의 염기 교정용 조성물로, DNA 결합 단백질 또는 이를 코딩하는 핵산; 시토신 탈아미노효소 또는 시토신 탈아미노효소 (deaminase) 유래의 제1분할체 및 제2분할체 또는 이를 코딩하는 핵산; 및 아데닌 탈아미노효소 또는 이를 코딩하는 핵산을 포함하며, 상기 식물세포 소기관 DNA의 아데닌을 구아닌으로, 시토신을 티민으로 동시에 교정하는 것을 특징으로 하는 조성물에 관한 것이다.
본 명세서에서 사용되는 “교정”은 “편집”과 상호 호환적으로 사용 가능하고, 특이적 게놈 표적의 선택적 결실에 의해서 핵산 서열을 변경시키는 방법을 의미한다. 이러한 특이적 게놈 표적은 염색체 영역, 유전자, 프로모터, 오픈 리딩 프레임 또는 임의의 핵산 서열을 포함하지만, 이에 제한되지 않는다.
본 명세서에서 사용되는 "단일 염기"는 핵산 서열 내 하나, 및 오직 하나의 뉴클레오티드를 의미한다. 단일 염기 교정의 맥락에서 사용될 때, 이것은 핵산 서열 내 특이적 위치의 염기가 상이한 염기로 치환되는 것을 의미한다. 이러한 치환은 제한없이 치환 또는 변형을 포함한, 많은 기전에 의해 일어날 수 있다.
본 명세서에서 사용되는 "표적" 또는 "표적 부위"는 임의 조성 및/또는 길이의 사전에 확인된 핵선 서열을 의미한다. 이러한 표적 부위는 염색체 영역, 유전자, 프로모터, 오픈 리딩 프레임 또는 임의의 핵산 서열을 포함하지만, 이에 제한되지 않는다.
본 명세서에서 사용되는 "온-타겟”은 프로그램 가능한 DNA 결합 영역 및/또는 단일 가이드 RNA 서열과 완전하게 상보성일 수 있는 특이적 게놈 표적의 하위 서열을 의미한다.
본 명세서에서 사용되는 “오프-타겟”은 프로그램 가능한 DNA 결합 영역 및/또는 단일 가이드 RNA 서열과 부분적으로 상보성일 수 있는 특이적 게놈 표적의 하위 서열을 의미한다.
본 발명에서 시토신 탈아미노효소 또는 이의 변이체 유래인 제1분할체 및 제2분할체를 포함하고, 상기 시토신 탈아미노효소가 DNA 결합 단백질에 결합되거나 상기 제1분할체 및 제2분할체가 각각 상기 DNA 결합 단백질에 결합되는 형태를 가진다.
상기 시토신 탈아미노효소는 아미노기 이탈 효소로, 시토신(C)을 우리딘(U)으로 전환시킬 수 있다.
상기 시토신 탈아미노효소일 수 있다. 상기 시토신 탈아미노효소로 예를 들어, APOBEC1 (apolipoprotein B editing complex 1), AID (activation-induced deaminase)의 형태가 존재하나, 대부분의 DNA 탈아미노효소들은 단일 가닥 DNA에만 작동해서 DNA 결합 단백질에 연결하여 염기 교정하는 데에는 적합하지 않을 수 있다. 구체적으로, 상기 시토신 탈아미노효소는 상기 시토신 탈아미노효소는 이중 가닥 DNA에 작용하는 탈아미노효소 (DddA) 또는 이의 오솔로그 (orthologue)에서 유래한 것일 수 있다. 더욱 구체적으로, 상기 시토신 탈아미노효소는 이중 가닥 DNA 특이적 박테리아 시토신 탈아미노효소일 수 있다.
상기 시토신 탈아미노효소는 분할된 형태로, 상기 시토신 탈아미노효소는 분리된 제1분할체 및 제2분할체를 포함하고, 상기 제1분할체와 제2분할체 각각은 탈아미노효소 활성이 없는 것이다.
전장 시토신 탈아미노효소 중 tox 분할체에 해당하는 서열번호 1의 서열을 포함할 수 있다. 상기 시토신 탈아미노효소는 제1분할체 및 제2분할체를 포함하고, 상기 제1분할체와 제2분할체 각각은 탈아미노효소 활성이 없다.
Figure PCTKR2023014300-appb-img-000002
Figure PCTKR2023014300-appb-img-000003
상기 G1333N, G1333C, G1397N 및 G1397C가 조합되어 분할 형태의 탈아미노효소로 사용될 수 있다. 구체적으로, Left-G1333-N + Right-G133-C, Left-G1397-N + Right-G1397-C, Left-G1397-N + Right-G1333-C, 또는 Left-G1333-N + Right-G1397-C의 형태로 사용될 수 있다.
상기 DNA 결합 단백질은 예를 들어, 징크 핑커 단백질 (zinc finger protein), TALE (Transcription activator-like effector) 어레이 또는 이들의 조합일 수 있다.
상기 징크 핑커 단백질의 징크 핑거 모티프는 DNA 결합 도메인을 가지고, 핑거의 c-말단 부분은 DNA 서열을 특이적으로 인식한다. 3 ~ 6 개의 징크 핑거 모티프를 포함하는 DNA 결합 단백질이 DNA 서열을 인식한다.
하나의 실시예에서, 상기 시토신 탈아미노효소의 제1분할체 및 시토신 탈아미노효소의 제2분할체 각각은 징크 핑거 단백질의 N-말단 또는 C-말단에 결합할 수 있다.
시토신 탈아미노효소의 제1분할체 N-말단에 징크 핑거 단백질 (ZF-Left)의 C-말단이 결합하고 시토신 탈아미노효소의 제2분할체 N-말단에 징크 핑거 단백질 (ZF-Right) C-말단이 결합 (CC configuration);
시토신 탈아미노효소의 제1분할체 C-말단에 징크 핑거 단백질 (ZF-Left)의 N-말단이 결합하고 시토신 탈아미노효소의 제2분할체 N-말단에 징크 핑거 단백질 (ZF-Right) C-말단이 결합 (NC configuration);
시토신 탈아미노효소의 제1분할체 N-말단에 징크 핑거 단백질 (ZF-Left)의 C-말단이 결합하고 시토신 탈아미노효소의 제2분할체 C-말단에 징크 핑거 단백질 (ZF-Right) N-말단이 결합 (CN configuration); 또는
시토신 탈아미노효소의 제1분할체 C-말단에 징크 핑거 단백질 (ZF-Left)의 N-말단이 결합하고 시토신 탈아미노효소의 제2분할체 C-말단에 징크 핑거 단백질 (ZF-Right) N-말단이 결합 (NN configuration)할 수 있다.
상기 ZF-Left은 다음의 서열번호 6의 서열을 포함할 수 있다:
[서열번호 6]
Figure PCTKR2023014300-appb-img-000004
상기 ZF-Right는 다음의 서열번호 7의 서열을 포함할 수 있다:
[서열번호 7]
Figure PCTKR2023014300-appb-img-000005
ZF은 DNA 타겟에 따라 서열이 달라질 수 있다. ZF은 DNA 타겟 서열에 따라 맞춤형 제작될 수 있다. ZF는 DNA 3bp를 인식하기 때문에 보통 3~6개의 ZF를 이어 붙여 9~18bp DNA를 인식하는 ZF 조합을 제작할 수 있다. 예를 들어, GNN, TNN, CNN 또는 ANN 등의 모듈이 포함된 라이브러리를 이용하여 제작할 수 있다.
경우에 따라서, 상기 징크 핑거 단백질은 링커를 통해 탈아미노효소와 연결될 수 있다. 상기 링커는 2 내지 40개 아미노산 잔기를 포함하는 펩타이드 링커일 수 있다. 상기 링커는 예를 들어, 2aa, 5aa, 10aa, 16aa, 24aa 또는 32aa 길이의 링커 등일 수 있으나, 이에 제한되는 것은 아니다.
하나의 실시예에서, 상기 링커는 다음을 포함할 수 있다:
Figure PCTKR2023014300-appb-img-000006
본 발명에 따른 구체적 실시예에서, 분할 탈아미노효소와 징크 핑거 단백질이 링커를 통해 연결될 수 있고, 제1분할체를 포함하는 반쪽 탈아미노효소 N-말단에 징크 핑거 단백질이 결합하고, 제2분할체를 포함하는 반쪽 탈아미노효소 N-말단에 징크 핑거 단백질이 결합한다. 이 때, 왼쪽과 오른쪽 ZFP가 붙는 곳 사이인 스페이서에서 C에서 T로의 염기 전환이 일어날 수 있다. 왼쪽과 오른쪽 ZFP 모두 24 a.a 링커를 통해 제1분할체를 포함하는 반쪽 탈아미노효소 및 제2분할체를 포함하는 반쪽 탈아미노효소 각각과 연결되는 경우, 높은 교정 효율을 보임을 확인하였다.
상기 TAL 이펙터 (TALE)는 33개에서 34개의 반복된 아미노산 서열이 반복된 형태로 이루어져 있으며, 도메인(RVD, Repeated variant domain)이 약 9개 정도 반복된다. 도메인 하나당 한 개의 뉴클레오타이드를 인지 할 수 있으며, 12-13번째 아미노산 서열 에 따라 특이적인 DNA 서열과 결합 할 수 있다(HD->Cytosine, NI->Adenine, NG -> Thymine, NN -> Guanine). 탈이펙터(TALE)는 표적부위 내의 단일 DNA 가닥을 인식한다. 표적 부위 사이의 거리는 12-14 뉴클레오타이드일 수 있다.
상기 TALE 도메인은 하나 이상의 TALE-Repeat의 조합에 의해 서열-특이적 방식으로 뉴클레오티드에 결합하는 단백질 도메인을 의미한다. 적어도 하나 이상의 TALE-Repeat, 구체적으로 1 내지 30개의 TALE-Repeat를 포함하나 이에 한정되지 않는다. TALE-Repeat는 TALE 도메인 내 특정 뉴클레오티드 서열을 인식하는 부위이다.
상기 TALE 도메인에 백본 구조로 TALE의 N-말단 포함 영역 및 TALE의 C-말단 포함 영역이 포함된다.
Figure PCTKR2023014300-appb-img-000007
Figure PCTKR2023014300-appb-img-000008
절단 부위를 기준으로 상기 TALE 도메인이 결합하는 위치에 따라, 단일 TALE 어레이 (array) 또는 제 1 TALE 어레이 및 제 2 TALE 어레이가 각각 결합할 수 있다.
상기 시토신 탈아미노효소의 제1분할체에 제 1 TALE이 결합 (left TALE)되고, 상기 시토신 탈아미노효소의 제2분할체에 제 2 TALE (right TALE)이 결합될 수 있다. 각각 N’-TALE-제1분할체-C’ 및 N’-TALE-제2분할체-C’ 구조를 가진다.
TALE 어레이는 타겟 DNA 서열에 따라 맞춤 제작할 수 있다. TALE 어레이는 33~35 개의 아미노산 잔기로 구성된 모듈이 반복적으로 배열되어 구성되는 데 이들은 식물 병원균 Xanthmonas에서 유래한 것으로 모듈 하나가 A, C, G, T 염기 하나씩을 각각 인식하여 DNA에 결합한다. 각각의 모듈의 염기 특이성은 12, 13번째 아미노산 잔기에 의해 결정되는데 이들을 RVD (repeat variable di-residue)라고 한다. 예를 들어 RVD가 NN인 모듈은 G를 인식하고 NI는 A, HD는 C, NG는 T를 인식한다. TALE array는 최소 14 개에서 최대 18 개 이상의 모듈로 구성되어 타겟 DNA 서열 15bp~20bp를 인식할 수 있도록 설계할 수 있다.
변이된 형태의 Cas 단백질을 포함할 수 있다. DNA 이중 가닥을 절단하는 엔도뉴클레아제 활성을 상실하도록 변이된 것을 의미할 수 있으며, 예컨대, 엔도뉴클레아제 활성을 상실하고 니카아제 활성을 갖도록 변이된 변이 표적 특이적 뉴클레아제 및 엔도뉴클레아제 활성과 니카아제 활성을 모두 상실하도록 변이된 형태 중 1종 이상일 수 있다.
니카아제 활성을 갖는 것인 경우, 상기 시토신 탈아미노효소에 의한 염기변환(예컨대, 시토신이 우라딘으로 변환)과 동시 또는 순서와 무관하게 순차적으로, 상기 염기 변환이 일어난 가닥 또는 그 반대 가닥 (예컨대, 염기 변환이 일어난 가닥의 반대 가닥)에서 nick이 도입될 수 있다 (예컨대, PAM이 위치하는 가닥의 반대가닥에서, PAM 서열의 5' 말단 방향으로 3번째 뉴클레오타이드와 4번째 뉴클레오타이드 사이에 해당하는 위치에 nick이 도입됨). 이와 같은 변이 (예컨대, 아미노산 치환 등)는 촉매 활성 도메인 (예컨대, Cas9의 경우 RuvC 촉매 도메인)에서 일어나는 것일 수 있다. 스트렙토코커스 피요젠스 유래 Cas9의 경우 변이는 촉매 활성을 갖는 아스파르트산 잔기 (catalytic aspartate residue; 10번째 위치의 아스파르트산 (D10) 등), 762번째 위치의 글루탐산 (E762), 840번째 위치의 히스티딘 (H840), 854번째 위치의 아스파라긴 (N854), 863번째 위치의 아스파라긴 (N863), 986번째 위치의 아스파르트산 (D986) 등으로 이루어진 군에서 선택된 하나 이상 임의의 다른 아미노산으로 치환된 돌연변이를 포함할 수 있다. 이 때, 치환되는 임의의 다른 아미노산은 알라닌 (alanine)일 수 있지만, 이에 제한되지 않는다.
경우에 따라서, 스트렙토코커스 피요젠스 유래 Cas9 단백질의 1135번째 위치의 아스파르트산 (D1135), 1335번째 위치의 아르기닌 (R1335), 및 1337번째 위치의 트레오닌 (T1337) 중 하나 이상, 예컨대 3개 모두가 다른 아미노산으로 치환되어, 야생형 Cas9의 PAM 서열 (NGG)와 상이한 NGA (N은 A, T, G, 및 C 중에서 선택된 임의의 염기임)을 인식하도록 변이된 것일 수 있다.
예를 들어, 스트렙토코커스 피요젠스 유래 Cas9 단백질의 아미노산 서열 중,
(1) D10, H840, 또는 D10 + H840;
(2) D1135, R1335, T1337, 또는 D1135 + R1335 + T1337; 또는
(3) (1)과 (2) 잔기 모두에서 아미노산 치환이 일어난 것일 수 있다.
상기 '다른 아미노산'은, 알라닌, 이소류신, 류신, 메티오닌, 페닐알라닌, 프롤린, 트립토판, 발린, 아스파라긴산, 시스테인, 글루타민, 글리신, 세린, 트레오닌, 티로신, 아스파르트산, 글루탐산, 아르기닌, 히스티딘, 라이신, 상기 아미노산들의 공지된 모든 변형체 중에서, 야생형 단백질이 원래 변이 위치에 갖는 아미노산을 제외한 아미노산들 중에서 선택된 아미노산을 의미한다. 일 예에서, 상기 '다른 아미노산'은 알라닌, 발린, 글루타민, 또는 아르기닌일 수 있다.
경우에 따라서, 가이드 RNA를 추가로 포함할 수 있다. 상기 가이드 RNA는 예를 들어, CRISPR RNA (crRNA), trans-activating crRNA (tracrRNA), 및 단일 가이드 RNA (single guide RNA; sgRNA)로 이루어진 군에서 선택된 1종 이상일 수 있으며, 구체적으로 crRNA와 tracrRNA가 서로 결합된 이중 가닥 crRNA:tracrRNA 복합체, 또는 crRNA 또는 그 일부와 tracrRNA 또는 그 일부가 올리고뉴클레오타이드 링커로 연결된 단일 가닥 가이드 RNA (sgRNA)일 수 있다.
본 발명은 아데닌 탈아미노효소를 포함한다. 상기 아데닌 탈아미노효소는 예를 들어, APOBEC1 (apolipoprotein B editing complex 1), AID (activation-induced deaminase) 및 tadA (tRNA-specific adenosine deaminase)으로 구성된 군에서 선택될 수 있으며, 구체적으로는 tadA (tRNA-specific adenosine deaminase)일 수 있다. 상기 아데닌 탈아미노효소는 예를 들어, 대장균 TadA의 변이체로서 디옥시-아데닌 탈아미노효소 (deoxy-adenine deaminase)일 수 있다.
본 발명에 따른 구체적 실시예에서, 대장균 TadA의 변이체로서 디옥시-아데닌 탈아미노효소 (deoxy-adenine deaminase)를 사용하였고, 구체적으로 TadA8e 또는 ABE 8.0일 수 있다.
상기 시토신 탈아미노효소가 분할 형태로 포함되고, 상기 DNA 결합 단백질이 징크 핑거 단백질로, 시토신 탈아미노효소의 제1분할체 C-말단에 징크 핑거 단백질 (ZF-Left)의 N-말단이 결합하고 시토신 탈아미노효소의 제2분할체 N-말단에 징크 핑거 단백질 (ZF-Right) C-말단이 결합 (NC configuration)한 구조에서, 아데닌 탈아미노효소는 징크 핑거 단백질 (ZF-Left)의 C 말단, 시토신 탈아미노효소의 제1분할체의 N 말단 또는 C 말단, 징크 핑거 단백질 (ZF-Right)의 N 말단, 시토신 탈아미노효소의 제2분할체의 N 말단 또는 C 말단에 결합할 수 있다.
아데닌 탈아미노효소는 시토신 탈아미노효소의 제1분할체 N-말단에 징크 핑거 단백질 (ZF-Left)의 C-말단이 결합하고 시토신 탈아미노효소의 제2분할체 N-말단에 징크 핑거 단백질 (ZF-Right) C-말단이 결합 (CC configuration); 시토신 탈아미노효소의 제1분할체 N-말단에 징크 핑거 단백질 (ZF-Left)의 C-말단이 결합하고 시토신 탈아미노효소의 제2분할체 C-말단에 징크 핑거 단백질 (ZF-Right) N-말단이 결합 (CN configuration); 또는 시토신 탈아미노효소의 제1분할체 C-말단에 징크 핑거 단백질 (ZF-Left)의 N-말단이 결합하고 시토신 탈아미노효소의 제2분할체 C-말단에 징크 핑거 단백질 (ZF-Right) N-말단이 결합 (NN configuration)에서도 징크 핑거 단백질 (ZF-Left)의 C 말단, 시토신 탈아미노효소의 제1분할체의 N 말단 또는 C 말단, 징크 핑거 단백질 (ZF-Right)의 N 말단, 시토신 탈아미노효소의 제2분할체의 N 말단 또는 C 말단에 결합할 수 있다.
상기 시토신 탈아미노효소가 분할 형태로 포함되고, 상기 DNA 결합 단백질이 TALE인 경우 상기 시토신 탈아미노효소의 제1분할체에 제1 TALE 이 결합되고, 상기 시토신 탈아미노효소의 제2분할체에 제2 TALE이 결합될 수 있으며, 각각 N’-TALE-제1분할체DDDA-C’ 및 N’-TALE-제2분할체DDDA-C’ 구조를 가진다. 아데닌 탈아미노효소는 시토신 탈아미노효소의 제1분할체의 N 말단 또는 C 말단 또는 시토신 탈아미노효소의 제2분할체 N 말단 또는 C 말단에 결합할 수 있다.
본 발명은 1) DNA 결합 단백질 2) 분할된 이중 가닥 DNA 특이적 박테리아 시토신 탈아미노효소 및 3) E. coli TadA 유래 디옥시아데닌 탈아미노효소를 포함하는 식물세포 소기관 DNA의 A-to-G 염기 교정용 조성물(UGI (uracil DNA-glycosylase inhibitor) 없음)로, 상기 DNA 결합 단백질은 징크 핑거 단백질 (ZFP) 또는 전사 활성화 인자 유사 이펙터 (TALE) 어레이이고; 분할된 이중 가닥 DNA 특이적 박테리아 시토신 탈아미노효소 Burkholderia cenocepacia 유래 DddAtox인 조성물이다.
상기 시토신 탈아미노효소가 분할 형태로 포함되고, 상기 DNA 결합 단백질이 징크 핑거 단백질로, 시토신 탈아미노효소의 제1분할체 C-말단에 징크 핑거 단백질 (ZF-Left)의 N-말단이 결합하고 시토신 탈아미노효소의 제2분할체 N-말단에 징크 핑거 단백질 (ZF-Right) C-말단이 결합 (NC configuration)한 구조에서, 아데닌 탈아미노효소는 징크 핑거 단백질 (ZF-Left)의 C 말단, 시토신 탈아미노효소의 제1분할체의 N 말단 또는 C 말단, 징크 핑거 단백질 (ZF-Right)의 N 말단, 시토신 탈아미노효소의 제2분할체의 N 말단 또는 C 말단에 결합할 수 있다.
아데닌 탈아미노효소는 시토신 탈아미노효소의 제1분할체 N-말단에 징크 핑거 단백질 (ZF-Left)의 C-말단이 결합하고 시토신 탈아미노효소의 제2분할체 N-말단에 징크 핑거 단백질 (ZF-Right) C-말단이 결합 (CC configuration); 시토신 탈아미노효소의 제1분할체 N-말단에 징크 핑거 단백질 (ZF-Left)의 C-말단이 결합하고 시토신 탈아미노효소의 제2분할체 C-말단에 징크 핑거 단백질 (ZF-Right) N-말단이 결합 (CN configuration); 또는 시토신 탈아미노효소의 제1분할체 C-말단에 징크 핑거 단백질 (ZF-Left)의 N-말단이 결합하고 시토신 탈아미노효소의 제2분할체 C-말단에 징크 핑거 단백질 (ZF-Right) N-말단이 결합 (NN configuration)에서도 징크 핑거 단백질 (ZF-Left)의 C 말단, 시토신 탈아미노효소의 제1분할체의 N 말단 또는 C 말단, 징크 핑거 단백질 (ZF-Right)의 N 말단, 시토신 탈아미노효소의 제2분할체의 N 말단 또는 C 말단에 결합할 수 있다.
상기 시토신 탈아미노효소가 분할 형태로 포함되고, 상기 DNA 결합 단백질이 TALE인 경우 상기 시토신 탈아미노효소의 제1분할체에 제1 TALE 이 결합되고, 상기 시토신 탈아미노효소의 제2분할체에 제2 TALE이 결합될 수 있으며, 각각 N’-TALE-제1분할체DDDA-C’ 및 N’-TALE-제2분할체DDDA-C’ 구조를 가진다. 아데닌 탈아미노효소는 시토신 탈아미노효소의 제1분할체의 N 말단 또는 C 말단 또는 시토신 탈아미노효소의 제2분할체 N 말단 또는 C 말단에 결합할 수 있다.
본 발명은 식물세포 소기관 A-to-G 염기 교정용 조성물로, 상기 DNA 결합 단백질은 징크 핑커 단백질 (zinc finger protein), 또는 TALE 어레이이고, 상기 시토신 탈아미노효소 (deaminase) 유래의 제1분할체 및 제2분할체는 박테리아 유래이고, 이중 가닥 DNA 특이적인 것을 특징으로 하는 조성물에 관한 것이다.
본 발명은 식물세포 소기관 A-to-G 염기 교정용 조성물로, 상기 DNA 결합 단백질은 징크 핑커 단백질 (zinc finger protein) 또는 TALE 어레이이고, 상기 시토신 탈아미노효소 (deaminase) 유래의 제1분할체 및 제2분할체는 박테리아 유래이고, 이중 가닥 DNA 특이적인 것이며, 상기 제1분할체 N 말단에 DNA 결합 단백질이 결합되어 있고, 아데닌 탈아미노효소의 C 말단에 DNA 결합 단백질이 결합되어 있는, 조성물에 관한 것이다.
본 발명은 1) DNA 결합 단백질 2) 분할된 이중 가닥 DNA 특이적 박테리아 시토신 탈아미노효소 및 3) E. coli TadA 유래 디옥시아데닌 탈아미노효소를 포함하는 식물세포 소기관 A-to-G 염기 교정용 조성물로, UGI를 포함하지 않으며, 상기 DNA 결합 단백질은 징크 핑거 단백질 (ZFP) 또는 전사 활성화 인자 유사 이펙터 (TALE) 어레이 이고; 분할된 이중 가닥 DNA 특이적 박테리아 시토신 탈아미노효소 Burkholderia cenocepacia 유래 DddAtox인 조성물이다.
본 발명은 식물세포 소기관 A-to-G 염기 교정방법으로, DNA 결합 단백질 또는 이를 코딩하는 핵산; 시토신 탈아미노효소 (deaminase) 유래의 제1분할체 및 제2분할체 또는 이를 코딩하는 핵산; 및 아데닌 탈아미노효소 또는 이를 코딩하는 핵산을 식물세포에 처리하는 단계를 포함하고, 상기 DNA 결합 단백질은 징크 핑커 단백질 (zinc finger protein), 또는 TALE 어레이이고, 상기 시토신 탈아미노효소 (deaminase) 유래의 제1분할체 및 제2분할체는 박테리아 유래이고, 이중 가닥 DNA 특이적인 것을 특징으로 하는 방법에 관한 것이다.
본 발명은 식물세포 소기관 A-to-G 염기 교정방법으로, DNA 결합 단백질 또는 이를 코딩하는 핵산; 시토신 탈아미노효소 (deaminase) 유래의 제1분할체 및 제2분할체 또는 이를 코딩하는 핵산; 및 아데닌 탈아미노효소 또는 이를 코딩하는 핵산을 식물세포에 처리하는 단계를 포함하고, 상기 DNA 결합 단백질은 징크 핑커 단백질 (zinc finger protein), 또는 TALE 어레이이고, 상기 시토신 탈아미노효소 (deaminase) 유래의 제1분할체 및 제2분할체는 박테리아 유래이고, 이중 가닥 DNA 특이적인 것이며, 상기 제1분할체 N 말단에 DNA 결합 단백질이 결합되어 있고, 아데닌 탈아미노효소의 C 말단에 DNA 결합 단백질이 결합되어 있는, 방법에 관한 것이다.
본 발명은 식물세포 소기관 A-to-G 염기 교정방법으로, DNA 결합 단백질 또는 이를 코딩하는 핵산; 시토신 탈아미노효소 (deaminase) 유래의 제1분할체 및 제2분할체 또는 이를 코딩하는 핵산; 및 아데닌 탈아미노효소 또는 이를 코딩하는 핵산을 식물세포에 처리하는 단계를 포함하고, 1) DNA 결합 단백질 2) 분할된 이중 가닥 DNA 특이적 박테리아 시토신 탈아미노효소 및 3) E. coli TadA 유래 디옥시아데닌 탈아미노효소를 포함하는 식물세포 소기관 A-to-G 염기 교정용 조성물로, UGI를 포함하지 않으며, 상기 DNA 결합 단백질은 징크 핑거 단백질 (ZFP) 또는 전사 활성화 인자 유사 이펙터 (TALE) 어레이 이고; 분할된 이중 가닥 DNA 특이적 박테리아 시토신 탈아미노효소 Burkholderia cenocepacia 유래 DddAtox인 방법이다.
기존에는 UGI를 포함하지 않는 TALED가 동물세포 미토콘드리아에서 C-to-T 에디팅을 일으키지 않고 A-to-G 에디팅만 일으켰다.
본 발명은 엽록체 전달 펩타이드(chloroplast transit peptide) 또는 미토콘드리아 전달 단백질 (Mitochondrial Targeting Signal, MTS)을 추가로 포함할 수 있다.
예를 들어, 엽록체 전달 단백질 (Chloroplast Transit Peptide, CTP) 또는 미토콘드리아 전달 신호 단백질 (Mitochondrial Targeting Signal, MTS)이 결합하여 식물 세포 내 엽록체와 미토콘드리아에 전달된다. 엽록체와 미토콘드리아로 전달될 때 N-말단의 CTP 또는 MTS 단백질을 제외한 나머지 부분은 전-단백질 (preprotein) 형태로 엽록체와 미토콘드리아 내부로 전달된다. 엽록체와 미토콘드리아 내부로 진입 과정에서 전달 단백질 부분이 떨어져 나가게 되고 엽록체와 미토콘드리아를 타겟팅하여 특정 부분을 염기 교정할 수 있다.
상기 핵산과 관련하여, "폴리뉴클레오티드", "뉴클레오티드", "뉴클레오티드 서열", 및 "올리고뉴클레오티드"는 상호교환적으로 사용된다. 임의의 길이의 뉴클레오티드의 폴리머 형태, 데옥시리보뉴클레오티드 또는 리보뉴클레오티드, 또는 이들의 유사체를 포함할 수 있다. 폴리뉴클레오티드는 임의의 3차원 구조를 가질 수 있으며, 공지된 또는 비공지된 임의의 기능을 수행할 수 있다. 폴리뉴클레오티드는 하나 이상의 변형된 뉴클레오티드 예컨대, 메틸화된 뉴클레오티드 및 뉴클레오티드 유사체를 포함할 수 있다. 뉴클레오티드 구조에 대한 변형은 폴리머의 어셈블리 전 또는 후에 가능할 수 있다.
상기 폴리뉴클레오티드는 RNA 서열, DNA 서열, 또는 이의 조합(RNA-DNA 조합 서열)일 수 있다.
상기 융합단백질을 발현시키기 위한 수단으로서, 플라스미드 벡터, 코즈미드 벡터, 박테리오파아지 벡터 등 공지의 발현 벡터를 사용할 수 있으며, 백터는 DNA 재조합 기술을 이용한 임의의 공지된 방법에 따라 당업자가 용이하게 제조할 수 있다.
상기 벡터는 플라스미드 벡터 또는 바이러스 벡터일 수 있으며, 상기 바이러스 벡터는 구체적으로 아데노바이러스(Adenovirus), 아데노부속 바이러스(Adeno-associated virus), 렌티바이러스(Lentivirus), 레트로바이러스(Retrovirus) 벡터일 수 있으나, 이에 한정된 것은 아니다.
재조합 발현 벡터는 숙주세포에서 핵산의 발현에 적합한 형태로 핵산을 포함할 수 있으며, 이는 재조합 발현 벡터가 발현을 위해 사용되도록 즉, 발현될 핵산 서열에 작동 가능하게-연결되도록 숙주세포를 기반을 선택될 수 있는 하나 이상의 조절 요소를 포함함을 의미한다.
재조합 발현 벡터 내에서, "작동 가능하게 연결된"은 관심 뉴클레오티드 서열이 뉴클레오티드 서열의 발현을 허용하는 방식으로(예를 들어, 시험관내 전사/번역 시스템에서 또는 벡터가 숙주세포 내로 도입되는 경우 숙주세포에서) 조절 요소에 연결됨을 의미한다.
재조합 발현 벡터는 T7 promoter를 포함하여 메신저 RNA 합성에 적합한 형태를 포함할 수 있으며, 이는 기내에서 mRNA 합성을 할 수 있도록, 즉, T7 polymerase에 의해 메신저 RNA가 합성될 수 있는 하나 이상의 조절 요소를 포함함을 의미한다.
"조절 요소"는 프로모터, 인핸서, 내부 리보솜 진입 부위(IRES), 및 기타 발현 조정 요소(예를 들어, 전사 종결 신호 예컨대, 폴리아데닐화 신호 및 폴리-U 서열)을 포함할 수 있다. 조절 요소는 많은 유형의 숙주세포에서 뉴클레오티드 서열의 유도 또는 항상 발현을 지시하는 요소 및 특정 숙주세포에서만 뉴클레오티드 서열의 발현을 지시하는 요소(예를 들어, 조직-특이적 조절 서열)를 포함한다. 조직-특이적 프로모터는 요망되는 관심 조직 예컨대, 근육, 뉴런, 뼈, 피부, 혈액, 특정 기관(예를 들어, 간, 췌장), 또는 특정 세포 유형(예를 들어, 림프구)에서 주로 발현을 지시할 수 있다. 조절 요소는 또한 조직 또는 세포-유형 특이적일 수 있거나 아닐 수 있는 세포-주기 의존성 또는 발달 단계-의존적 방식과 같은 일시적-의존적 방식으로 발현을 지시할 수 있다.
경우에 따라서 벡터는 하나 이상의 pol III 프로모터, 하나 이상의 pol II 프로모터, 하나 이상의 pol I 프로모터, 또는 이들의 조합을 포함한다. pol III 프로모터의 예는 비제한적으로 U6 및 H1 프로모터를 포함한다. pol II 프로모터의 예는 비제한적으로, 레트로바이러스 라우스 육종 바이러스(RSV) LTR 프로모터(임의로 RSV 인핸서를 가짐), 사이토메갈로바이러스(CMV) 프로모터(선택적으로 CMV 인핸서를 가짐)(예를 들어, Boshart et al(1985) Cell 41:521-530), SV40 프로모터, 디하이드로폴레이트 환원효소 프로모터, β-액틴 프로모터, 포스포글리세롤 키나제(PGK) 프로모터 및 EF1α 프로모터를 포함한다.
"조절 요소"에는 인핸서 예를 들어, WPRE; CMV 인핸서; HTLV-I의 LTR에서 R-U5' 세그먼트; SV40 인핸서; 및 토끼 β-글로빈의 엑손 2 및 3 사이의 인트론 서열 등이 포함될 수 있다. 발현 벡터의 디자인은 형질전환될 숙주세포의 선택, 요망되는 발현 수준 등과 같은 인자에 좌우될 수 있음이 당업자에 의해 인식될 것이다. 벡터는 숙주세포 내로 도입되어 본원에 기재된 바와 같은 핵산에 의해 인코딩되는 융합 단백질 또는 펩티드를 포함하는 전사물, 단백질 또는 펩티드를 생성할 수 있다(예를 들어, 클러스터링된 규칙적 간격의 짧은 회문 반복부(CRISPR) 전사물, 단백질, 효소, 이의 돌연변이체, 이의 융합 단백질 등). 유익한 벡터는 렌티바이러스 및 아데노-관련 바이러스를 포함하고, 이러한 벡터의 유형은 또한 특정 유형의 세포를 표적화하기 위해 선택될 수 있다.
상기 벡터는 각각 국소주입법 (예컨대, 병변 또는 표적 부위 직접 주입), 전기천공법 (electroporation), 리포펙션, 바이러스 벡터, 나노파티클 (nanoparticles) 뿐만 아니라, PTD (Protein translocation domain) 융합 단백질 방법 등을 통해 생체 내 또는 세포 내로 전달될 수 있다.
상기 핵산은 리보핵산, 예를 들어 메신저 리보핵산 mRNA 형태로 주입하여 세포의 유전자 염기 교정, 예를 들어 동물세포 또는 식물세포에 제한없이 유전자 염기 교정이 가능하다.
본 발명에 따른 핵산은 mRNA 형태일 수 있고, mRNA 형태로 전달하는 경우 DNA를 이용한 벡터 형태로 전달하는 것에 비해, mRNA로의 전사 과정이 불필요하여 유전자 교정 개시가 빠를 수 있다. 일시적 단백질 발현 (transient protein expression) 가능성이 높다.
본 출원의 발명자들은 식물세포 소기관 유전자 교정을 위해 시토신 염기 교정기 (cytosine base editor)를 리보핵산, 예를 들어 메신저 리보핵산 형태로 식물 세포에 주입하였을 때 플라스미드로 전달하는 것에 비해 비표적 효과가 감소함을 확인하였다. 식물세포 소기관 유전자 교정에 있어 시토신 염기 교정기를 mRNA 형태로 식물세포에 형질전환 하였을 때, 플라스미드에 비해 비표적 효과에서 장점이 있음을 최초로 입증하였다.
상기 mRNA는 직접 전달되거나, 캐리어를 통해 전달될 수 있다. 경우에 따라서, 핵산절단효소 및/또는 절단인자의 mRNA를 화학변형 (chemical modification) 하거나, 합성 자기-복제 RNA (synthetic self-replicative RNA) 형태로 직접 전달할 수 있다.
세포로 mRNA를 전달하는 방법 또는 생체 내에서 mRNA를 인간, 동물과 같은 유기체의 세포로 전달하는 방법을 포함하여, 시험관 내 또는 생체 내에서 mRNA 분자를 세포로 전달할 수 있는 방법을 고려할 수 있다. 예를 들어, 지질(예를 들어, 리포좀, 마이셀 등)을 포함하거나, 나노파티클 또는 나노튜브를 포함하거나, 양이온성 화합물(예를 들어, 폴리에틸렌이민 또는 PEI)을 포함하거나, 양이온성 화합물(예를 들어, 폴리에틸렌이민 또는 PEI)을 포함하여, mRNA 분자를 세포로 전달할 수 있다. 경우에 따라서, mRNA를 세포로 전달하기 위해서 유전자 총 또는 바이오리스틱(biolistic) 입자 전달 시스템과 같은 볼리스틱 방법(bolistics method)을 사용할 수 있다.
상기 캐리어는 예를 들어, 세포 투과성 펩타이드(CPP), 나노입자, 또는 중합체를 포함할 수 있으나, 이에 제한되는 것은 아니다.
상기 CPP는 다양한 분자 카고(나노크기 입자로부터 작은 화학 분자 및 DNA의 큰 단편까지)의 세포 흡수를 용이하게 하는 짧은 펩타이드이다.
상기 나노입자와 관련하여, 본 발명에 따른 조성물은 고분자 나노입자, 금속 나노입자, 금속/무기 나노입자 또는 지질 나노입자를 통해 전달될 수 있다. 상기 고분자 나노입자는 예를 들어, 롤링 써클 증폭에 의해 합성된 DNA nanoclew, 실 유사 DNA 나노입자일 수 있다. DNA nanoclew, 실 유사 DNA 나노입자에 mRNA를 로딩하고, 엔도좀 탈출능을 향상시키기 위해 PEI를 코팅할 수 있다. 이러한 복합체가 세포막에 결합하여, 내재화된 다음 엔도좀 탈출을 통해 핵으로 이동하여, 전달되도록 할 수 있다.
상기 금속 나노입자와 관련하여, 금입자를 연결시키고 양이온성 엔도좀 탈출 폴리머 (endosomal disruptive polymer)와 복합체를 형성하여 세포에 전달할 수 있다. 상기 양이온성 엔도좀 탈출 폴리머 (endosomal disruptive polymer)는 예를 들어, polyethylene imine, poly(arginine), poly(lysine), poly(histidine), poly-[2-{(2-aminoethyl)amino}-ethyl-aspartamide] (pAsp(DET)), poly(ethylene glycol) (PEG)와 poly(arginine)의 block co-polymer, PEG와 poly(lysine)의 block co-polymer, 또는 PEG와 poly{N-[N-(2-aminoethyl)-2-aminoethyl]aspartamide} (PEG-pAsp(DET))의 block co-polymer일 수 있다.
상기 금속/무기 나노입자와 관련하여, 예를 들어 ZIF-8 (zeolitic imidazolate framework-8)를 통해 mRNA를 캡슐화할 수 있다.
경우에 따라서, 상기 mRNA는 음이온을 띠고(negatively charged), 양이온을 띠는(cationic) 물질들과 결합하여 나노입자 (nanoparticles)를 형성할 수 있고, 이는 세포로 수용체 매개 엔도사이토시스 (receptor-mediated endocytosis) 혹은 파고사이토시스 (phagocytosis) 등을 통해 침투할 수 있다.
양이온성 중합체로 폴리알릴아민 (PAH); 폴리에틸렌이민 (PEI); 폴리(L-리신) (PLL); 폴리(L-아르기닌) (PLA); 폴리비닐아민 단일- 또는 공중합체; 폴리(비닐벤질-트리-C1-C4-알킬암모늄염); 지방족 또는 방향지방족 디할로겐화물 및 지방족 N,N,N',N'-테트라-C1-C4-알킬-알킬렌디아민의 중합체; 폴리(비닐피리딘) 또는 폴리(비닐피리디늄염); 폴리(N,N-디알릴-N,N-디-C1-C4-알킬-암모늄할로겐화물); 4차화된 디-C1-C4-알킬-아미노에틸 아크릴레이트 또는 메타크릴레이트의 단일- 또는 공중합체; 폴리쿠아드(POLYQUAD)™; 폴리아미노아미드 등이 포함될 수 있다.
양이온성 지질로 양이온성 리포솜 제제를 포함할 수 있다. 리포솜의 지질 이중층은 캡슐화된 핵산을 분해로부터 보호하며, 핵산에 결합할 수 있는 항체에 의한 특이적 중화를 방지할 수 있다. 엔도좀 성숙 동안 엔도좀 멤브레인과 리포좀이 융합되어, 양이온성 지질-핵산절단효소의 효율적인 엔도좀 탈출이 가능하다. 양이온성 지질로 폴리에틸렌이민, 폴리아미도아민 (PAMAM) 성화 수지상체, 리포펙틴 (DOTMA와 DOPE의 조합), 리포펙타제, 리포펙타민(LIPOFECTAMINE)® (예컨대 리포펙타민® 2000, 리포펙타민® 3000, 리포펙타민® RNAiMAX, 리포펙타민® LTX), 세인트-레드(SAINT-RED) (시노볼룩스 세라퓨틱스(Synvolux Therapeutics)사, 네덜란드 그로닝겐 소재), DOPE, 시토펙틴 (길레드 사이언시즈(Gilead Sciences) 사, 캘리포니아 포스터 시티 소재), 및 유펙틴 (JBL사, 캘리포니아 산 루이스 오비스포 소재)가 포함될 수 있다. 대표적인 양이온성 리포솜은 N-[1-(2,3-디올레올옥시)-프로필]-N,N,N-트리메틸암모늄 클로라이드 (DOTMA), N-[1-(2,3-디올레올옥시)-프로필]-N,N,N-트리메틸암모늄 메틸술페이트 (DOTAP), 3β-[N-(N',N'-디메틸아미노에탄)카르바모일]콜레스테롤 (DC-Chol), 2,3-디올레일옥시-N-[2(스페르민카르복스아미도)에틸]-N,N-디메틸-1-프로판아미늄 트리플루오로아세테이트 (DOSPA), 1,2-디미리스틸옥시프로필-3-디메틸-히드록시에틸 암모늄 브로마이드; 또는 디메틸디옥타데실암모늄 브로마이드 (DDAB)으로부터 제조될 수 있다.
지질 나노입자와 관련하여, 캐리어로 리포좀을 이용하여 전달할 수 있다. 리포좀은 내부 수성 구획을 둘러싸는 단일 또는 다중 라멜라 지질 이중층 및 상대적으로 불투과성인 외측 친지성 인지질 이중층으로 구성된 구체 소낭 구조이다. 리포좀 제형은 주로 천연 인지질 및 지질, 예컨대 1,2-디스테아로릴-sn-글리세로-3-포스파티딜 콜린(DSPC), 스핑고미엘린, 포스파티딜콜린 또는 모노시알로강글리오사이드 등을 포함할 수 있다. 경우에 따라서, 혈장 내 불안정성을 해소하기 위하여, 지질막에 콜레스테롤 또는 1,2-디올레오일-sn-글리세로-3-포스포에탄올아민(DOPE)을 추가할 수 있다. 콜레스테롤의 첨가는 캡슐화된 생활성 화합물의 혈장 내로의 신속한 방출을 감소시키거나 또는 1,2-디올레오일-sn-글리세로-3-포스포에탄올아민(DOPE)은 안정성을 증가시킨다.
상기 조성물은 다음을 통해 식물세포에 전달될 수 있다:
Gene gun을 이용한 주입 (Bombardment);
PEG-매개 원형질체 형질감염 (Protoplast transfection, PEG-mediated);
전기천공에 의한 원형질체 형질감염 (Protoplast transfection, electroporation); 또는
미세주사에 의한 원형질체 주사 (Protoplast injection, microinjection).
본 발명에 따른 융합단백질을 코딩하는 폴리뉴클레오티드 서열은 RNA 서열, DNA 서열, 또는 이의 조합(RNA-DNA 조합 서열)일 수 있다.
상기 핵산은 다음을 통해 식물세포에 전달될 수 있다:
Agrobacterium, 예를 들어 Agrobacterium tumefaciens, Agrobacterium rhizogene 등을 이용한 형질전환
- binary vector,
- Viral vector: Geminivirus, tobacco rattle virus (TRV), tomato mosaic virus (ToMV), foxtail mosaic virus (FoMV), barley yellow striate mosaic virus (BYSMV), Sonchus yellow net rhabdovirus (SYNV) 등;
바이러스를 이용한 형질감염;
주입 (Bombardment, Gene gun);
PEG-매개 원형질체 형질감염 (Protoplast transfection, PEG-mediated);
전기천공에 의한 원형질체 형질감염 (Protoplast transfection, electroporation); 또는
미세주사에 의한 원형질체 주사 (Protoplast injection, microinjection).
상기 바이러스는 예를 들어, viral vector: Geminivirus, tobacco rattle virus (TRV), tomato mosaic virus (ToMV), foxtail mosaic virus (FoMV), barley yellow striate mosaic virus (BYSMV), Sonchus yellow net rhabdovirus (SYNV) 등을 예로 들 수 있다.
상기 벡터는 각각 국소주입법 (예컨대, 병변 또는 표적 부위 직접 주입), 전기천공법 (electroporation), 리포펙션, 바이러스 벡터, 나노파티클 (nanoparticles) 뿐만 아니라, PTD (Protein translocation domain) 융합 단백질 방법 등을 통해 세포내로 전달될 수 있다.
본 발명은 상기 조성물을 식물세포에 처리하는 단계를 포함하는 식물세포 소기관 DNA의 염기를 교정하는 방법에 관한 것이다.
본 발명은 상기 방법에 의해 GTTGAAAGC 서열을 포함하는 엽록체 psbA 유전자의 염기가 교정된, 아트라진 (Atrazine) 제초제 저항성 식물에 관한 것이다.
본 발명은 상기 방법에 의해 CGTCATCCTCA 서열을 포함하는 16s rRNA의 염기가 교정된 스펙티노마이신 (Spectinomycine) 저항성 식물에 관한 것이다.
본 발명은 상기 방법에 의해 atp6 유전자의 염기가 교정된 식물에 관한 것이다.
본 발명은 상기 방법에 의해 ATG를 포함하는 psaA 유전자의 염기가 교정된 알비노 표현형을 가지는 식물에 관한 것이다.
엽록체 DNA 중 psbA의 295번재 아미노산인 페닐알라닌 (Phenylalanine)을 세린 (Serine)으로 염기교정함으로 제초제 중 하나인 아트라진 (Atrazine)에 저항성을 가지는 식물을 개발할 수 있다. 엽록체의 psbA뿐 아니라 16s rRNA, psaA의 염기 교정을 통해 스펙티노마이신 (Spectinomycine) 저항성 식물, 알비노 형태의 식물을 개발할 수 있다.
광합성에 관여하는 rbcL (Rubisco large subunit) 유전자의 염기 교정이 가능 함으로 광합성 효율을 조절하여 식물의 생산량 증대 또는 이산화탄소 흡수의 효율이 높은 식물체 제작을 기대 할 수 있다.
본 발명은 상기 방법에 의해 엽록체 루비스코 (rubisco: ribulose bisphosphate carboxylase) 코딩 유전자의 염기가 교정된 식물에 관한 것이다. 광합성에 관여하는 루비스코 라지 유닛 (rubisco Large unit)의 염기 교정이 가능 함으로 광합성 효율을 조절하여 식물의 생산량 증대를 기대할 수 있다.
엽록체의 염기서열은 식물 간 상동관계 (homology)가 높아, 본 발명에 사용한 양상추 (Lactuca sativa cv. Cheongchima) 뿐만 아니라 벼, 밀, 감자, 토마토 등의 식물도 아트라진 (Atrazine)에 저항성을 가지는 식물을 개발할 수 있다.
상추 원형질체 (Lettuce protoplast)에 플라스미드를 전달하여 7일 후 미토콘드리아 DNA의 atp6 유전자 내 타겟에서 아데닌 염기 교정되었음을 확인하였다.
실시예
이하, 실시예를 통하여 본 발명을 더욱 상세히 설명하고자 한다. 이들 실시예는 오로지 본 발명을 예시하기 위한 것으로서, 본 발명의 범위가 이들 실시예에 의해 제한되는 것으로 해석되지는 않는 것은 당업계에서 통상의 지식을 가진 자에게 있어서 자명할 것이다.
실시예 1.
아그로박테리움 (agrobacterium)을 이용한 형질전환 식물 제작을 위한 DNA 클로닝 (cloning) 모식도를 도 1에 나타내었다. 염기서열이 반복되는 TALE 쌍을 하나의 벡터에 클로닝하기 위해 Aat II, Pme I site의 위치가 다른 벡터에 RPS5A promoter-PTP-3xFlag-Left TALE-1397N와 RPS5A promoter-PTP-3xFlag-Right TALE-1397C-ABE8.0을 각각 클로닝 하였다. 두개의 플라스미드 (plasmid)를 각각 Aat II, Pme I으로 digestion 후 Left TALE이 있는 플라스미드에 RPS5A promoter-PTP-3xFlag-Right TALE-1397C-ABE8.0-35S terminator를 ligation하여 하나의 플라스미드에 모두 클로닝 하였다. 위의 도 1은 모식도 일 뿐이고, Left TALE에 1397C-ABE8.0을, Right TALE에 1397N을 클로닝 할 수 있다.
아그로박테리움을 이용한 형질 전환을 통해, 애기 장대의 엽록체에 있는 psaA, rbcLrrn16S 유전자를 타겟하는 1세대 형질전환체를 각각 20개, 6개, 그리고 37개의 식물체를 확보하였다. psaA유전자를 타겟하는 형질전화체 식물. a, 각 식물체의 염기 교정 효율과 위치. b, 식물의 표현형. c, DNA염기교정으로 인한 아미노산 염기 서열의 변화를 도 2에 나타내었다. 도 2의 a에 따르면 염기서열 표시 중 C-12, C-11, C2 (표기는 G2로 되어 있음)이 교정되는 것을 확인할 수 있다.
rbcL 유전자를 타겟하는 형질전화체 식물. a, 각 식물체의 염기 교정 효율과 위치. b, DNA염기교정으로 인한 아미노산 염기 서열의 변화를 도 3에 나타내었다.
rrn16S 유전자를 타겟하는 형질전환 식물의 염기 교정 효율과 위치를 도 4에 나타내었다.
애기 장대의 엽록체에 있는 psaA, rbcLrrn16S 유전자를 타겟 하는 1세대 형질전환체의 염기 교정 효율과 표현형. a, psaA #1, 2, 3의 염기 교정 효율과 위치를 나타내었다. 아데닌의 염기 교정뿐 아니라 시토신의 염기 교정이 동시에 일어난다. b, psaA #3의 표현형으로 green, chimeric, pale green의 형질을 나타낼 수 있다. c, rbcL #1, 2의 염기 교정 효율, 위치와 표현형. d, rrn16S 유전자를 타겟 하는 1세대 형질전환체의 염기 교정 효율을 도 5에 나타내었다.
도 4의 C-2, 도 5의 a, d도 각각 C2, C-2가 교정되는 것을 확인할 수 있다.
도 6에 따르면, 형질전환 2세대 식물의 염기 교정 효율과 표현형을 나타내었다. psaA #3의 형질전환 2세대의 표현형과 (a), 염기 교정 효율과 위치 (b). Spectinomycin에 저항성을 가지는 rrn16S 형질전환 2세대의 표현형 (c)과 염기 교정 효율과 위치 (d). e, 형질전환 식물에 도입된 외부 유전자의 유무를 PCR로 확인한 결과 rrn16S #9-1, 3은 외부 유전자가 없는 것을 확인하였다.
도 6은 엽록체 염기 교정이 다음 세대로 전달되는 것을 확인한 것이고, b의 경우 A to G, C to T 염기 교정이 다음 세대로 같이 전달되는 것을 확인한 것이다.
이를 토대로 식물에서는 동물에서와 다르게 A to G 염기 교정과 C to T 염기 교정이 같이 일어나는 것을 확인하였다.
rrn16S 형질전환 2세대 식물 중 스펙티노마이신 (Spectinomycin)에 저항성과 민감성을 가지는 식물의 염기 교정 위치와 효율을 도 7에 나타내었다.
도 8에 따르면, psaA #1 (a), psaA #3 chimeric (b), psaA #3 pale green (c), rrn16s #1 (d), 6 (e)과 야생형 Col-0 (f) 의 엽록체 전장 유전체 분석을 통한 표적 외 염기 변이. 야생형과 비교했을 때 형질전환 식물에서 뚜렷한 표적 외 염기 변이가 관찰되지 않았다.
도 9에 따르면 상추 미토콘드리아 유전자 atp6의 염기교정을 효율을 나타내었다. 상추 원형질체 (Lettuce protoplast)에 PcUBi promoter-MTS-3xFlag-Left TALE-1397N-Pea3A terminator, PcUBi promoter-MTS-3xFlag-Right TALE-1397C-ABE8.0-Pea3A terminator과 PcUBi promoter-MTS-3xFlag-Left TALE-1397C-ABE8.0-Pea3A terminator, PcUBi promoter-MTS-3xFlag-Right TALE-1397N-Pea3A terminator을 각각 15ug 씩 총 30ug을 전달하여 7일 후 아데닌 염기 교정 효율을 측정하였고, A6 0.99%, A9 1.12%의 염기 교정 효율을 나타내었다.
실시예 중 사용된 각 구성에 대한 서열은 다음과 같다.
Figure PCTKR2023014300-appb-img-000009
Figure PCTKR2023014300-appb-img-000010
Figure PCTKR2023014300-appb-img-000011
Figure PCTKR2023014300-appb-img-000012
Figure PCTKR2023014300-appb-img-000013
Figure PCTKR2023014300-appb-img-000014
Figure PCTKR2023014300-appb-img-000015
Figure PCTKR2023014300-appb-img-000016
Figure PCTKR2023014300-appb-img-000017
Figure PCTKR2023014300-appb-img-000018
Figure PCTKR2023014300-appb-img-000019
Figure PCTKR2023014300-appb-img-000020
Figure PCTKR2023014300-appb-img-000021
Figure PCTKR2023014300-appb-img-000022
식물세포 소기관 DNA의 염기 교정은 DddAtox를 이용한 시토신을 티민으로 디아미네이션 (deamination)하는 염기 교정만 존재하였다. 이번 발명으로 아데닌을 구아닌으로 염기 교정함으로 소 기관 DNA 염기 교정의 범위가 넓어졌다. A to G 염기 교정과 C to T 염기 교정이 같이 일어날 수 있다.
이상으로 본 발명의 내용의 특정한 부분을 상세히 기술하였는바, 당업계의 통상의 지식을 가진 자에게 있어서, 이러한 구체적 기술은 단지 바람직한 실시양태일 뿐이며, 이에 의해 본 발명의 범위가 제한되는 것이 아닌 점은 명백할 것이다. 따라서, 본 발명의 실질적인 범위는 첨부된 청구항들과 그것들의 등가물에 의하여 정의된다고 할 것이다.
전자파일 첨부하였음.

Claims (18)

  1. 다음을 포함하는 식물세포 소기관 DNA의 염기 교정용 조성물로,
    DNA 결합 단백질 또는 이를 코딩하는 핵산;
    시토신 탈아미노효소 (deaminase) 또는 시토신 탈아미노효소 유래의 제1분할체 및 제2분할체 또는 이를 코딩하는 핵산; 및
    아데닌 탈아미노효소 또는 이를 코딩하는 핵산을 포함하고,
    상기 제1분할체 및 제2분할체는 각각 상기 DNA 결합 단백질에 결합되며,
    상기 식물세포 소기관 DNA의 아데닌을 구아닌으로, 시토신을 티민으로 동시에 교정하는 것을 특징으로 하는 조성물.
  2. 제1항에 있어서, 상기 제1분할체와 제2분할체 각각은 시토신 탈아미노효소 활성이 없는 것을 특징으로 하는, 조성물.
  3. 제1항에 있어서 상기 시토신 탈아미노효소는 이중 가닥 DNA에 작용하는 탈아미노효소 (DddA) 또는 이의 오솔로그 (orthologue)에서 유래된 것을 특징으로 하는 조성물.
  4. 제1항에 있어서, 상기 제1분할체는 서열번호 1의 서열 중 N 말단에서 G33, G44, A54, N68, G82, N98, G108로 구성된 군에서 선택되는 하나 이상까지의 서열을 포함하는 조성물.
  5. 제1항에 있어서, 상기 제2분할체는 서열번호 1의 서열 중 G34, P45, G55, N69, T83, A99, A109로 구성된 군에서 선택되는 하나 이상에서 C-말단까지의 서열을 포함하는 조성물.
  6. 제1항에 있어서, 상기 DNA 결합 단백질은 ZF 단백질 (zinc-finger protein), 또는 TALE 어레이 (transcription activator-like effector array)인 조성물.
  7. 제1항에 있어서, 상기 DNA 결합 단백질은 2 내지 40개 아미노산 잔기를 포함하는 펩타이드 링커를 통해 연결되는 것을 특징으로 하는 조성물.
  8. 제7항에 있어서, 상기 링커는 다음을 포함하는 조성물:
    2a.a 링커: GS
    5a.a 링커: TGEKQ
    10a.a 링커: SGAQGSTLDF
    16a.a 링커: SGSETPGTSESATPES;
    24 a.a 링커: SGTPHEVGVYTLSGTPHEVGVYTL; 또는
    32a.a 링커: GSGGSSGGSSGSETPGTSESATPESSGGSSGGS.
  9. 제1항에 있어서, 상기 DNA 결합 단백질은 징크 핑거 단백질이고, 상기 제1분할체 및 제2분할체 각각은 상기 징크 핑거 단백질의 N-말단 또는 C-말단에 결합되어 있는 형태인 조성물.
  10. 제1항에 있어서, 상기 DNA 결합 단백질은 TALE array이고 단일 TALE 어레이 (array)가 분할체의 일 말단에 결합 또는 제 1 TALE 어레이 및 제 2 TALE 어레이가 제1분할체 및 제2분할체에 결합된 형태인 조성물.
  11. 제1항에 있어서, 상기 아데닌 탈아미노효소는 DNA 결합 단백질 또는 시토신 탈아미노효소의 N 또는 C 말단에 결합된 조성물.
  12. 제1항에 있어서, 상기 아데닌 탈아미노효소는 TadA 유래 디옥시아데닌 탈아미노효소인 조성물.
  13. 제1항에 있어서, 엽록체 전달 펩타이드(chloroplast transit peptide) 또는 이를 코딩하는 핵산을 포함하는 조성물.
  14. 제1항에 있어서, 미토콘드리아 전달 단백질 (Mitochondrial Targeting Signal, MTS) 또는 이를 코딩하는 핵산을 포함하는 조성물.
  15. 제1항에 있어서, UGI(uracil DNA-glycosylase inhibitor)를 포함하지 않는 조성물.
  16. 제1항에 있어서, 다음을 통해 식물세포에 전달되는 것을 특징으로 하는 조성물:
    진건 (Gene gun)을 이용한 주입 (Bombardment);
    PEG-매개 원형질체 형질감염 (Protoplast transfection, PEG-mediated);
    전기천공에 의한 원형질체 형질감염 (Protoplast transfection, electroporation); 또는
    미세주사에 의한 원형질체 주사 (Protoplast injection, microinjection).
  17. 제1항에 있어서, 상기 핵산은 다음을 통해 식물세포에 전달되는 것을 특징으로 하는 조성물:
    Agrobacterium tumefaciens 또는 Agrobacterium rhizogene의 아그로박테리움을 이용한 형질전환;
    바이러스 형질감염;
    진건 (Gene gun)을 이용한 주입 (Bombardment);
    PEG-매개 원형질체 형질감염 (Protoplast transfection, PEG-mediated);
    전기천공에 의한 원형질체 형질감염 (Protoplast transfection, electroporation); 또는
    미세주사에 의한 원형질체 주사 (Protoplast injection, microinjection).
  18. 제1항 내지 제17항 중 어느 한 항의 조성물을 식물세포에 처리하는 단계를 포함하는 식물세포 소기관 DNA의 염기 교정방법.
PCT/KR2023/014300 2022-09-21 2023-09-20 식물세포 소기관 dna의 염기 교정 WO2024063538A1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20220119363 2022-09-21
KR10-2022-0119363 2022-09-21

Publications (1)

Publication Number Publication Date
WO2024063538A1 true WO2024063538A1 (ko) 2024-03-28

Family

ID=90454985

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2023/014300 WO2024063538A1 (ko) 2022-09-21 2023-09-20 식물세포 소기관 dna의 염기 교정

Country Status (2)

Country Link
KR (1) KR20240041835A (ko)
WO (1) WO2024063538A1 (ko)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190025565A (ko) * 2016-06-02 2019-03-11 시그마-알드리치 컴퍼니., 엘엘씨 프로그램가능한 dna 결합 단백질을 사용한, 표적화된 게놈 변형의 개선
KR20190034628A (ko) * 2016-08-03 2019-04-02 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 아데노신 핵염기 편집제 및 그의 용도
KR20190044157A (ko) * 2017-10-20 2019-04-30 경상대학교산학협력단 아데닌 또는 아데노신 탈아미노효소를 유효성분으로 포함하는 단일 염기 편집용 조성물 및 이의 용도
KR20210049124A (ko) * 2018-08-23 2021-05-04 상가모 테라퓨틱스, 인코포레이티드 조작된 표적 특이적 염기 편집기
WO2022060185A1 (ko) * 2020-09-18 2022-03-24 기초과학연구원 표적화된 탈아미노효소 및 이를 이용한 염기 교정

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190025565A (ko) * 2016-06-02 2019-03-11 시그마-알드리치 컴퍼니., 엘엘씨 프로그램가능한 dna 결합 단백질을 사용한, 표적화된 게놈 변형의 개선
KR20190034628A (ko) * 2016-08-03 2019-04-02 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 아데노신 핵염기 편집제 및 그의 용도
KR20190044157A (ko) * 2017-10-20 2019-04-30 경상대학교산학협력단 아데닌 또는 아데노신 탈아미노효소를 유효성분으로 포함하는 단일 염기 편집용 조성물 및 이의 용도
KR20210049124A (ko) * 2018-08-23 2021-05-04 상가모 테라퓨틱스, 인코포레이티드 조작된 표적 특이적 염기 편집기
WO2022060185A1 (ko) * 2020-09-18 2022-03-24 기초과학연구원 표적화된 탈아미노효소 및 이를 이용한 염기 교정

Also Published As

Publication number Publication date
KR20240041835A (ko) 2024-04-01

Similar Documents

Publication Publication Date Title
US20220170013A1 (en) T:a to a:t base editing through adenosine methylation
EP3365356B1 (en) Nucleobase editors and uses thereof
WO2019103442A2 (ko) CRISPR/Cpf1 시스템을 이용한 유전체 편집용 조성물 및 이의 용도
US20200140842A1 (en) Bipartite base editor (bbe) architectures and type-ii-c-cas9 zinc finger editing
WO2019042284A1 (en) FUSION PROTEINS FOR ENHANCED PRECISION IN THE BASIC EDITION
US20180265859A1 (en) Modification of the dystrophin gene and uses thereof
WO2022060185A1 (ko) 표적화된 탈아미노효소 및 이를 이용한 염기 교정
WO2016021973A1 (ko) 캄필로박터 제주니 crispr/cas 시스템 유래 rgen을 이용한 유전체 교정
US20150166981A1 (en) Methods for nucleic acid editing
JP2020516255A (ja) ゲノム編集のためのシステム及び方法
KR20190005801A (ko) 표적 특이적 crispr 변이체
WO2018156824A1 (en) Methods of genetic modification of a cell
WO2023182858A1 (ko) 식물세포 소기관 dna의 아데닌을 구아닌으로 염기 교정하는 방법
Bancroft et al. Characterization of an insertion sequence (IS891) of novel structure from the cyanobacterium Anabaena sp. strain M-131
WO2018231018A2 (ko) 간에서 목적하는 단백질 발현하기 위한 플랫폼
IL301139A (en) Enzymes from secondary DNA and active fragments and their variants and methods of use
EP4180460A1 (en) System and method for editing nucleic acid
JP2022512868A (ja) C2c1ヌクレアーゼに基づくゲノム編集のためのシステムおよび方法
WO2024063538A1 (ko) 식물세포 소기관 dna의 염기 교정
WO2021215827A1 (ko) Cas9 또는 cas9 변이체를 이용한 유전체 교정
WO2021125840A1 (ko) Cpf1 및 키메릭 dna-rna 가이드를 포함하는 유전체 교정 또는 발현 억제용 조성물
KR20180128864A (ko) 매칭된 5' 뉴클레오타이드를 포함하는 가이드 rna를 포함하는 유전자 교정용 조성물 및 이를 이용한 유전자 교정 방법
WO2024085674A1 (ko) Cas 단백질 및 박테리아 톡신을 포함하는 융합 단백질 및 이의 용도
WO2023008887A1 (ko) 염기 편집기 및 이의 용도
WO2024063273A1 (en) Novel adenine deaminase variants and a method for base editing using the same

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 23868590

Country of ref document: EP

Kind code of ref document: A1