KR20220032937A - 중금속 저감된 식물체 및 이의 제조방법 - Google Patents
중금속 저감된 식물체 및 이의 제조방법 Download PDFInfo
- Publication number
- KR20220032937A KR20220032937A KR1020200114891A KR20200114891A KR20220032937A KR 20220032937 A KR20220032937 A KR 20220032937A KR 1020200114891 A KR1020200114891 A KR 1020200114891A KR 20200114891 A KR20200114891 A KR 20200114891A KR 20220032937 A KR20220032937 A KR 20220032937A
- Authority
- KR
- South Korea
- Prior art keywords
- gene
- pcs
- plant
- sequence
- leu
- Prior art date
Links
- 229910001385 heavy metal Inorganic materials 0.000 title claims abstract description 42
- 230000002829 reductive effect Effects 0.000 title claims abstract description 33
- 238000000034 method Methods 0.000 title claims abstract description 24
- 238000002360 preparation method Methods 0.000 title description 2
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 184
- 101150068898 pcs gene Proteins 0.000 claims abstract description 91
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 49
- 230000014509 gene expression Effects 0.000 claims abstract description 46
- 230000000694 effects Effects 0.000 claims abstract description 44
- 239000013598 vector Substances 0.000 claims abstract description 31
- 108020005004 Guide RNA Proteins 0.000 claims abstract description 30
- 108010054010 glutathione gamma-glutamylcysteinyltransferase Proteins 0.000 claims abstract description 26
- 230000008685 targeting Effects 0.000 claims abstract description 18
- 238000010521 absorption reaction Methods 0.000 claims abstract description 15
- 238000004519 manufacturing process Methods 0.000 claims abstract description 8
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 claims abstract description 7
- 230000001131 transforming effect Effects 0.000 claims abstract description 4
- 241000196324 Embryophyta Species 0.000 claims description 119
- 108091033409 CRISPR Proteins 0.000 claims description 47
- 229910052793 cadmium Inorganic materials 0.000 claims description 41
- BDOSMKKIYDKNTQ-UHFFFAOYSA-N cadmium atom Chemical compound [Cd] BDOSMKKIYDKNTQ-UHFFFAOYSA-N 0.000 claims description 41
- 239000002773 nucleotide Substances 0.000 claims description 37
- 125000003729 nucleotide group Chemical group 0.000 claims description 37
- 244000061176 Nicotiana tabacum Species 0.000 claims description 26
- 235000002637 Nicotiana tabacum Nutrition 0.000 claims description 24
- 238000012228 RNA interference-mediated gene silencing Methods 0.000 claims description 9
- 230000009368 gene silencing by RNA Effects 0.000 claims description 9
- 238000010459 TALEN Methods 0.000 claims description 8
- 241000208136 Nicotiana sylvestris Species 0.000 claims description 7
- 108010017070 Zinc Finger Nucleases Proteins 0.000 claims description 7
- 108091027544 Subgenomic mRNA Proteins 0.000 claims description 6
- 241000208138 Nicotiana tomentosiformis Species 0.000 claims description 5
- PLUBXMRUUVWRLT-UHFFFAOYSA-N Ethyl methanesulfonate Chemical compound CCOS(C)(=O)=O PLUBXMRUUVWRLT-UHFFFAOYSA-N 0.000 claims description 4
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 claims description 4
- PXHVJJICTQNCMI-UHFFFAOYSA-N Nickel Chemical compound [Ni] PXHVJJICTQNCMI-UHFFFAOYSA-N 0.000 claims description 4
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 claims description 4
- VAYGXNSJCAHWJZ-UHFFFAOYSA-N dimethyl sulfate Chemical compound COS(=O)(=O)OC VAYGXNSJCAHWJZ-UHFFFAOYSA-N 0.000 claims description 4
- 229910052725 zinc Inorganic materials 0.000 claims description 4
- 239000011701 zinc Substances 0.000 claims description 4
- QSHDDOUJBYECFT-UHFFFAOYSA-N mercury Chemical compound [Hg] QSHDDOUJBYECFT-UHFFFAOYSA-N 0.000 claims description 3
- 229910052753 mercury Inorganic materials 0.000 claims description 3
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 2
- VYZAMTAEIAYCRO-UHFFFAOYSA-N Chromium Chemical compound [Cr] VYZAMTAEIAYCRO-UHFFFAOYSA-N 0.000 claims description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 claims description 2
- 101150005926 Pc gene Proteins 0.000 claims description 2
- ATJFFYVFTNAWJD-UHFFFAOYSA-N Tin Chemical compound [Sn] ATJFFYVFTNAWJD-UHFFFAOYSA-N 0.000 claims description 2
- 229910052787 antimony Inorganic materials 0.000 claims description 2
- WATWJIUSRGPENY-UHFFFAOYSA-N antimony atom Chemical compound [Sb] WATWJIUSRGPENY-UHFFFAOYSA-N 0.000 claims description 2
- 229910052785 arsenic Inorganic materials 0.000 claims description 2
- RQNWIZPPADIBDY-UHFFFAOYSA-N arsenic atom Chemical compound [As] RQNWIZPPADIBDY-UHFFFAOYSA-N 0.000 claims description 2
- 229910052788 barium Inorganic materials 0.000 claims description 2
- DSAJWYNOEDNPEQ-UHFFFAOYSA-N barium atom Chemical compound [Ba] DSAJWYNOEDNPEQ-UHFFFAOYSA-N 0.000 claims description 2
- 229910052797 bismuth Inorganic materials 0.000 claims description 2
- JCXGWMGPZLAOME-UHFFFAOYSA-N bismuth atom Chemical compound [Bi] JCXGWMGPZLAOME-UHFFFAOYSA-N 0.000 claims description 2
- 229910052804 chromium Inorganic materials 0.000 claims description 2
- 239000011651 chromium Substances 0.000 claims description 2
- 229910017052 cobalt Inorganic materials 0.000 claims description 2
- 239000010941 cobalt Substances 0.000 claims description 2
- GUTLYIVDDKVIGB-UHFFFAOYSA-N cobalt atom Chemical compound [Co] GUTLYIVDDKVIGB-UHFFFAOYSA-N 0.000 claims description 2
- 229910052802 copper Inorganic materials 0.000 claims description 2
- 239000010949 copper Substances 0.000 claims description 2
- 229910052742 iron Inorganic materials 0.000 claims description 2
- WPBNNNQJVZRUHP-UHFFFAOYSA-L manganese(2+);methyl n-[[2-(methoxycarbonylcarbamothioylamino)phenyl]carbamothioyl]carbamate;n-[2-(sulfidocarbothioylamino)ethyl]carbamodithioate Chemical compound [Mn+2].[S-]C(=S)NCCNC([S-])=S.COC(=O)NC(=S)NC1=CC=CC=C1NC(=S)NC(=O)OC WPBNNNQJVZRUHP-UHFFFAOYSA-L 0.000 claims description 2
- 229910052759 nickel Inorganic materials 0.000 claims description 2
- 229910052718 tin Inorganic materials 0.000 claims description 2
- 239000011135 tin Substances 0.000 claims description 2
- 229910052720 vanadium Inorganic materials 0.000 claims description 2
- LEONUFNNVUYDNQ-UHFFFAOYSA-N vanadium atom Chemical compound [V] LEONUFNNVUYDNQ-UHFFFAOYSA-N 0.000 claims description 2
- 238000010354 CRISPR gene editing Methods 0.000 claims 2
- 210000004027 cell Anatomy 0.000 abstract description 61
- 210000000130 stem cell Anatomy 0.000 abstract 2
- 108020004414 DNA Proteins 0.000 description 47
- 230000035772 mutation Effects 0.000 description 23
- 210000001519 tissue Anatomy 0.000 description 14
- 150000001413 amino acids Chemical group 0.000 description 13
- 241000589158 Agrobacterium Species 0.000 description 10
- 230000009466 transformation Effects 0.000 description 10
- 108091028113 Trans-activating crRNA Proteins 0.000 description 9
- 238000002296 dynamic light scattering Methods 0.000 description 9
- 238000010353 genetic engineering Methods 0.000 description 9
- 229920003258 poly(methylsilmethylene) Polymers 0.000 description 9
- 238000013061 process characterization study Methods 0.000 description 9
- 108091092584 GDNA Proteins 0.000 description 8
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 8
- 230000027455 binding Effects 0.000 description 8
- 238000011426 transformation method Methods 0.000 description 8
- 108091079001 CRISPR RNA Proteins 0.000 description 7
- 238000010367 cloning Methods 0.000 description 7
- 230000004069 differentiation Effects 0.000 description 7
- 239000002689 soil Substances 0.000 description 7
- 241000894007 species Species 0.000 description 7
- 238000003776 cleavage reaction Methods 0.000 description 6
- 210000003527 eukaryotic cell Anatomy 0.000 description 6
- 230000012010 growth Effects 0.000 description 6
- 230000033001 locomotion Effects 0.000 description 6
- 230000001404 mediated effect Effects 0.000 description 6
- 239000002609 medium Substances 0.000 description 6
- 108091033319 polynucleotide Proteins 0.000 description 6
- 102000040430 polynucleotide Human genes 0.000 description 6
- 239000002157 polynucleotide Substances 0.000 description 6
- 230000009467 reduction Effects 0.000 description 6
- 230000010076 replication Effects 0.000 description 6
- 230000007017 scission Effects 0.000 description 6
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 5
- 108091028043 Nucleic acid sequence Proteins 0.000 description 5
- 241000193996 Streptococcus pyogenes Species 0.000 description 5
- 230000003321 amplification Effects 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 5
- 230000007423 decrease Effects 0.000 description 5
- 238000012217 deletion Methods 0.000 description 5
- 230000037430 deletion Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 238000010362 genome editing Methods 0.000 description 5
- 238000003199 nucleic acid amplification method Methods 0.000 description 5
- PCIFXPRIFWKWLK-YUMQZZPRSA-N Ala-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N PCIFXPRIFWKWLK-YUMQZZPRSA-N 0.000 description 4
- WQKAQKZRDIZYNV-VZFHVOOUSA-N Ala-Ser-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WQKAQKZRDIZYNV-VZFHVOOUSA-N 0.000 description 4
- 108010042407 Endonucleases Proteins 0.000 description 4
- 102000004533 Endonucleases Human genes 0.000 description 4
- 102000004190 Enzymes Human genes 0.000 description 4
- 108090000790 Enzymes Proteins 0.000 description 4
- ZPDVKYLJTOFQJV-WDSKDSINSA-N Gln-Asn-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O ZPDVKYLJTOFQJV-WDSKDSINSA-N 0.000 description 4
- SHAUZYVSXAMYAZ-JYJNAYRXSA-N Gln-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N SHAUZYVSXAMYAZ-JYJNAYRXSA-N 0.000 description 4
- KRGZZKWSBGPLKL-IUCAKERBSA-N Glu-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N KRGZZKWSBGPLKL-IUCAKERBSA-N 0.000 description 4
- DZQMXBALGUHGJT-GUBZILKMSA-N Leu-Glu-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O DZQMXBALGUHGJT-GUBZILKMSA-N 0.000 description 4
- VTKPSXWRUGCOAC-GUBZILKMSA-N Met-Ala-Met Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCSC VTKPSXWRUGCOAC-GUBZILKMSA-N 0.000 description 4
- DINQYZRMXGWWTG-GUBZILKMSA-N Ser-Pro-Pro Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DINQYZRMXGWWTG-GUBZILKMSA-N 0.000 description 4
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 4
- HHSILIQTHXABKM-YDHLFZDLSA-N Val-Asp-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](Cc1ccccc1)C(O)=O HHSILIQTHXABKM-YDHLFZDLSA-N 0.000 description 4
- 238000003556 assay Methods 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 238000005520 cutting process Methods 0.000 description 4
- 238000010457 gene scissor Methods 0.000 description 4
- 230000009036 growth inhibition Effects 0.000 description 4
- 230000002779 inactivation Effects 0.000 description 4
- 230000001939 inductive effect Effects 0.000 description 4
- 239000007788 liquid Substances 0.000 description 4
- 229910021645 metal ion Inorganic materials 0.000 description 4
- 210000004940 nucleus Anatomy 0.000 description 4
- 230000030648 nucleus localization Effects 0.000 description 4
- 235000015097 nutrients Nutrition 0.000 description 4
- 108700028369 Alleles Proteins 0.000 description 3
- 108091026890 Coding region Proteins 0.000 description 3
- 108020004705 Codon Proteins 0.000 description 3
- QJVZSVUYZFYLFQ-CIUDSAMLSA-N Glu-Pro-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O QJVZSVUYZFYLFQ-CIUDSAMLSA-N 0.000 description 3
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 3
- 108700019146 Transgenes Proteins 0.000 description 3
- WTXQBCCKXIKKHB-JYJNAYRXSA-N Tyr-Arg-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WTXQBCCKXIKKHB-JYJNAYRXSA-N 0.000 description 3
- ZHQWPWQNVRCXAX-XQQFMLRXSA-N Val-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZHQWPWQNVRCXAX-XQQFMLRXSA-N 0.000 description 3
- 108010047495 alanylglycine Proteins 0.000 description 3
- GPRBEKHLDVQUJE-VINNURBNSA-N cefotaxime Chemical compound N([C@@H]1C(N2C(=C(COC(C)=O)CS[C@@H]21)C(O)=O)=O)C(=O)/C(=N/OC)C1=CSC(N)=N1 GPRBEKHLDVQUJE-VINNURBNSA-N 0.000 description 3
- 108010060199 cysteinylproline Proteins 0.000 description 3
- 238000001962 electrophoresis Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 235000013305 food Nutrition 0.000 description 3
- RWSXRVCMGQZWBV-WDSKDSINSA-N glutathione Chemical compound OC(=O)[C@@H](N)CCC(=O)N[C@@H](CS)C(=O)NCC(O)=O RWSXRVCMGQZWBV-WDSKDSINSA-N 0.000 description 3
- 108010089804 glycyl-threonine Proteins 0.000 description 3
- 108010015792 glycyllysine Proteins 0.000 description 3
- 238000003780 insertion Methods 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- 229930027917 kanamycin Natural products 0.000 description 3
- 229960000318 kanamycin Drugs 0.000 description 3
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 3
- 229930182823 kanamycin A Natural products 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 150000007523 nucleic acids Chemical class 0.000 description 3
- 108010051242 phenylalanylserine Proteins 0.000 description 3
- 238000004161 plant tissue culture Methods 0.000 description 3
- 239000013612 plasmid Substances 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 238000006467 substitution reaction Methods 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 2
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical class NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 2
- OFIYLHVAAJYRBC-HJWJTTGWSA-N Arg-Ile-Phe Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N[C@@H](Cc1ccccc1)C(O)=O OFIYLHVAAJYRBC-HJWJTTGWSA-N 0.000 description 2
- XKDYWGLNSCNRGW-WDSOQIARSA-N Arg-Lys-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCN=C(N)N)CCCCN)C(O)=O)=CNC2=C1 XKDYWGLNSCNRGW-WDSOQIARSA-N 0.000 description 2
- PCKRJVZAQZWNKM-WHFBIAKZSA-N Asn-Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O PCKRJVZAQZWNKM-WHFBIAKZSA-N 0.000 description 2
- JLNFZLNDHONLND-GARJFASQSA-N Asn-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N JLNFZLNDHONLND-GARJFASQSA-N 0.000 description 2
- HICVMZCGVFKTPM-BQBZGAKWSA-N Asp-Pro-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O HICVMZCGVFKTPM-BQBZGAKWSA-N 0.000 description 2
- ITGFVUYOLWBPQW-KKHAAJSZSA-N Asp-Thr-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O ITGFVUYOLWBPQW-KKHAAJSZSA-N 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 230000004544 DNA amplification Effects 0.000 description 2
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 2
- IKFZXRLDMYWNBU-YUMQZZPRSA-N Gln-Gly-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N IKFZXRLDMYWNBU-YUMQZZPRSA-N 0.000 description 2
- VDMABHYXBULDGN-LAEOZQHASA-N Gln-Val-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O VDMABHYXBULDGN-LAEOZQHASA-N 0.000 description 2
- PABVKUJVLNMOJP-WHFBIAKZSA-N Glu-Cys Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(O)=O PABVKUJVLNMOJP-WHFBIAKZSA-N 0.000 description 2
- FEUPVVCGQLNXNP-IRXDYDNUSA-N Gly-Phe-Phe Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 FEUPVVCGQLNXNP-IRXDYDNUSA-N 0.000 description 2
- WCORRBXVISTKQL-WHFBIAKZSA-N Gly-Ser-Ser Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WCORRBXVISTKQL-WHFBIAKZSA-N 0.000 description 2
- 206010020649 Hyperkeratosis Diseases 0.000 description 2
- QPRQGENIBFLVEB-BJDJZHNGSA-N Leu-Ala-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O QPRQGENIBFLVEB-BJDJZHNGSA-N 0.000 description 2
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 2
- WUFYAPWIHCUMLL-CIUDSAMLSA-N Leu-Asn-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O WUFYAPWIHCUMLL-CIUDSAMLSA-N 0.000 description 2
- WMTOVWLLDGQGCV-GUBZILKMSA-N Leu-Glu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N WMTOVWLLDGQGCV-GUBZILKMSA-N 0.000 description 2
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 2
- PTRKPHUGYULXPU-KKUMJFAQSA-N Leu-Phe-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O PTRKPHUGYULXPU-KKUMJFAQSA-N 0.000 description 2
- GOFJOGXGMPHOGL-DCAQKATOSA-N Leu-Ser-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(C)C GOFJOGXGMPHOGL-DCAQKATOSA-N 0.000 description 2
- LFXSPAIBSZSTEM-PMVMPFDFSA-N Leu-Trp-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CC=CC=C3)C(=O)O)N LFXSPAIBSZSTEM-PMVMPFDFSA-N 0.000 description 2
- DTUZCYRNEJDKSR-NHCYSSNCSA-N Lys-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN DTUZCYRNEJDKSR-NHCYSSNCSA-N 0.000 description 2
- OWRUUFUVXFREBD-KKUMJFAQSA-N Lys-His-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O OWRUUFUVXFREBD-KKUMJFAQSA-N 0.000 description 2
- WVJNGSFKBKOKRV-AJNGGQMLSA-N Lys-Leu-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVJNGSFKBKOKRV-AJNGGQMLSA-N 0.000 description 2
- ZCWWVXAXWUAEPZ-SRVKXCTJSA-N Lys-Met-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZCWWVXAXWUAEPZ-SRVKXCTJSA-N 0.000 description 2
- 108010047562 NGR peptide Proteins 0.000 description 2
- 239000002202 Polyethylene glycol Substances 0.000 description 2
- YKQNVTOIYFQMLW-IHRRRGAJSA-N Pro-Cys-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 YKQNVTOIYFQMLW-IHRRRGAJSA-N 0.000 description 2
- IIRBTQHFVNGPMQ-AVGNSLFASA-N Pro-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 IIRBTQHFVNGPMQ-AVGNSLFASA-N 0.000 description 2
- 230000004570 RNA-binding Effects 0.000 description 2
- QFBNNYNWKYKVJO-DCAQKATOSA-N Ser-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N QFBNNYNWKYKVJO-DCAQKATOSA-N 0.000 description 2
- VFWQQZMRKFOGLE-ZLUOBGJFSA-N Ser-Ser-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N)O VFWQQZMRKFOGLE-ZLUOBGJFSA-N 0.000 description 2
- FGBLCMLXHRPVOF-IHRRRGAJSA-N Ser-Tyr-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FGBLCMLXHRPVOF-IHRRRGAJSA-N 0.000 description 2
- ZVBCMFDJIMUELU-BZSNNMDCSA-N Ser-Tyr-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CO)N ZVBCMFDJIMUELU-BZSNNMDCSA-N 0.000 description 2
- 241000194017 Streptococcus Species 0.000 description 2
- LIXBDERDAGNVAV-XKBZYTNZSA-N Thr-Gln-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O LIXBDERDAGNVAV-XKBZYTNZSA-N 0.000 description 2
- QQWNRERCGGZOKG-WEDXCCLWSA-N Thr-Gly-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O QQWNRERCGGZOKG-WEDXCCLWSA-N 0.000 description 2
- MCDVZTRGHNXTGK-HJGDQZAQSA-N Thr-Met-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O MCDVZTRGHNXTGK-HJGDQZAQSA-N 0.000 description 2
- FQNUWOHNGJWNLM-QWRGUYRKSA-N Tyr-Cys-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CS)C(=O)NCC(O)=O FQNUWOHNGJWNLM-QWRGUYRKSA-N 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 2
- 108010087924 alanylproline Proteins 0.000 description 2
- 239000011324 bead Substances 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 238000012258 culturing Methods 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 239000013604 expression vector Substances 0.000 description 2
- 230000037406 food intake Effects 0.000 description 2
- 238000002290 gas chromatography-mass spectrometry Methods 0.000 description 2
- 239000011521 glass Substances 0.000 description 2
- 108010078144 glutaminyl-glycine Proteins 0.000 description 2
- 108010066198 glycyl-leucyl-phenylalanine Proteins 0.000 description 2
- 108010010147 glycylglutamine Proteins 0.000 description 2
- 239000001963 growth medium Substances 0.000 description 2
- 238000009396 hybridization Methods 0.000 description 2
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 2
- 108010057821 leucylproline Proteins 0.000 description 2
- 244000005700 microbiome Species 0.000 description 2
- 239000006870 ms-medium Substances 0.000 description 2
- 230000006780 non-homologous end joining Effects 0.000 description 2
- 210000004492 nuclear pore Anatomy 0.000 description 2
- 108020004707 nucleic acids Proteins 0.000 description 2
- 102000039446 nucleic acids Human genes 0.000 description 2
- 238000000053 physical method Methods 0.000 description 2
- 229920001223 polyethylene glycol Polymers 0.000 description 2
- 210000001236 prokaryotic cell Anatomy 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 239000012882 rooting medium Substances 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 239000000377 silicon dioxide Substances 0.000 description 2
- 239000000344 soap Substances 0.000 description 2
- 125000006850 spacer group Chemical group 0.000 description 2
- 230000009870 specific binding Effects 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- -1 that is Proteins 0.000 description 2
- 238000013518 transcription Methods 0.000 description 2
- 230000035897 transcription Effects 0.000 description 2
- 239000013603 viral vector Substances 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- SCPRYBYMKVYVND-UHFFFAOYSA-N 2-[[2-[[1-(2-amino-4-methylpentanoyl)pyrrolidine-2-carbonyl]amino]-4-methylpentanoyl]amino]-4-methylpentanoic acid Chemical compound CC(C)CC(N)C(=O)N1CCCC1C(=O)NC(CC(C)C)C(=O)NC(CC(C)C)C(O)=O SCPRYBYMKVYVND-UHFFFAOYSA-N 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- AAQGRPOPTAUUBM-ZLUOBGJFSA-N Ala-Ala-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O AAQGRPOPTAUUBM-ZLUOBGJFSA-N 0.000 description 1
- ZFXQNADNEBRERM-BJDJZHNGSA-N Ala-Ala-Pro-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 ZFXQNADNEBRERM-BJDJZHNGSA-N 0.000 description 1
- SDMAQFGBPOJFOM-GUBZILKMSA-N Ala-Arg-Arg Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SDMAQFGBPOJFOM-GUBZILKMSA-N 0.000 description 1
- YAXNATKKPOWVCP-ZLUOBGJFSA-N Ala-Asn-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O YAXNATKKPOWVCP-ZLUOBGJFSA-N 0.000 description 1
- XQJAFSDFQZPYCU-UWJYBYFXSA-N Ala-Asn-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N XQJAFSDFQZPYCU-UWJYBYFXSA-N 0.000 description 1
- ZIBWKCRKNFYTPT-ZKWXMUAHSA-N Ala-Asn-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O ZIBWKCRKNFYTPT-ZKWXMUAHSA-N 0.000 description 1
- PBAMJJXWDQXOJA-FXQIFTODSA-N Ala-Asp-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PBAMJJXWDQXOJA-FXQIFTODSA-N 0.000 description 1
- BUDNAJYVCUHLSV-ZLUOBGJFSA-N Ala-Asp-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O BUDNAJYVCUHLSV-ZLUOBGJFSA-N 0.000 description 1
- OMMDTNGURYRDAC-NRPADANISA-N Ala-Glu-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OMMDTNGURYRDAC-NRPADANISA-N 0.000 description 1
- NHLAEBFGWPXFGI-WHFBIAKZSA-N Ala-Gly-Asn Chemical compound C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N NHLAEBFGWPXFGI-WHFBIAKZSA-N 0.000 description 1
- LJFNNUBZSZCZFN-WHFBIAKZSA-N Ala-Gly-Cys Chemical compound N[C@@H](C)C(=O)NCC(=O)N[C@@H](CS)C(=O)O LJFNNUBZSZCZFN-WHFBIAKZSA-N 0.000 description 1
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 1
- OINVDEKBKBCPLX-JXUBOQSCSA-N Ala-Lys-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OINVDEKBKBCPLX-JXUBOQSCSA-N 0.000 description 1
- MDNAVFBZPROEHO-DCAQKATOSA-N Ala-Lys-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MDNAVFBZPROEHO-DCAQKATOSA-N 0.000 description 1
- RMAWDDRDTRSZIR-ZLUOBGJFSA-N Ala-Ser-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RMAWDDRDTRSZIR-ZLUOBGJFSA-N 0.000 description 1
- YYAVDNKUWLAFCV-ACZMJKKPSA-N Ala-Ser-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O YYAVDNKUWLAFCV-ACZMJKKPSA-N 0.000 description 1
- RTZCUEHYUQZIDE-WHFBIAKZSA-N Ala-Ser-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RTZCUEHYUQZIDE-WHFBIAKZSA-N 0.000 description 1
- WNHNMKOFKCHKKD-BFHQHQDPSA-N Ala-Thr-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O WNHNMKOFKCHKKD-BFHQHQDPSA-N 0.000 description 1
- IETUUAHKCHOQHP-KZVJFYERSA-N Ala-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)[C@@H](C)O)C(O)=O IETUUAHKCHOQHP-KZVJFYERSA-N 0.000 description 1
- GUBGYTABKSRVRQ-XLOQQCSPSA-N Alpha-Lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 1
- DBKNLHKEVPZVQC-LPEHRKFASA-N Arg-Ala-Pro Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O DBKNLHKEVPZVQC-LPEHRKFASA-N 0.000 description 1
- GIVATXIGCXFQQA-FXQIFTODSA-N Arg-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N GIVATXIGCXFQQA-FXQIFTODSA-N 0.000 description 1
- OTOXOKCIIQLMFH-KZVJFYERSA-N Arg-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N OTOXOKCIIQLMFH-KZVJFYERSA-N 0.000 description 1
- MUXONAMCEUBVGA-DCAQKATOSA-N Arg-Arg-Gln Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(N)=O)C(O)=O MUXONAMCEUBVGA-DCAQKATOSA-N 0.000 description 1
- OTCJMMRQBVDQRK-DCAQKATOSA-N Arg-Asp-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OTCJMMRQBVDQRK-DCAQKATOSA-N 0.000 description 1
- OSASDIVHOSJVII-WDSKDSINSA-N Arg-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCNC(N)=N OSASDIVHOSJVII-WDSKDSINSA-N 0.000 description 1
- AHPWQERCDZTTNB-FXQIFTODSA-N Arg-Cys-Cys Chemical compound C(C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)O)N)CN=C(N)N AHPWQERCDZTTNB-FXQIFTODSA-N 0.000 description 1
- QQJSJIBESHAJPM-IHRRRGAJSA-N Arg-Cys-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QQJSJIBESHAJPM-IHRRRGAJSA-N 0.000 description 1
- HPSVTWMFWCHKFN-GARJFASQSA-N Arg-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O HPSVTWMFWCHKFN-GARJFASQSA-N 0.000 description 1
- AUFHLLPVPSMEOG-YUMQZZPRSA-N Arg-Gly-Glu Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AUFHLLPVPSMEOG-YUMQZZPRSA-N 0.000 description 1
- YVTHEZNOKSAWRW-DCAQKATOSA-N Arg-Lys-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O YVTHEZNOKSAWRW-DCAQKATOSA-N 0.000 description 1
- RIIVUOJDDQXHRV-SRVKXCTJSA-N Arg-Lys-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O RIIVUOJDDQXHRV-SRVKXCTJSA-N 0.000 description 1
- BNYNOWJESJJIOI-XUXIUFHCSA-N Arg-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCN=C(N)N)N BNYNOWJESJJIOI-XUXIUFHCSA-N 0.000 description 1
- KZXPVYVSHUJCEO-ULQDDVLXSA-N Arg-Phe-Lys Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=CC=C1 KZXPVYVSHUJCEO-ULQDDVLXSA-N 0.000 description 1
- YFHATWYGAAXQCF-JYJNAYRXSA-N Arg-Pro-Phe Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YFHATWYGAAXQCF-JYJNAYRXSA-N 0.000 description 1
- VENMDXUVHSKEIN-GUBZILKMSA-N Arg-Ser-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VENMDXUVHSKEIN-GUBZILKMSA-N 0.000 description 1
- AMIQZQAAYGYKOP-FXQIFTODSA-N Arg-Ser-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O AMIQZQAAYGYKOP-FXQIFTODSA-N 0.000 description 1
- JPAWCMXVNZPJLO-IHRRRGAJSA-N Arg-Ser-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JPAWCMXVNZPJLO-IHRRRGAJSA-N 0.000 description 1
- LOVIQNMIPQVIGT-BVSLBCMMSA-N Arg-Trp-Phe Chemical compound C([C@H](NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CCCN=C(N)N)N)C(O)=O)C1=CC=CC=C1 LOVIQNMIPQVIGT-BVSLBCMMSA-N 0.000 description 1
- DXVMJJNAOVECBA-WHFBIAKZSA-N Asn-Gly-Asn Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O DXVMJJNAOVECBA-WHFBIAKZSA-N 0.000 description 1
- NLDNNZKUSLAYFW-NHCYSSNCSA-N Asn-Lys-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O NLDNNZKUSLAYFW-NHCYSSNCSA-N 0.000 description 1
- HGGIYWURFPGLIU-FXQIFTODSA-N Asn-Met-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CC(N)=O HGGIYWURFPGLIU-FXQIFTODSA-N 0.000 description 1
- UYCPJVYQYARFGB-YDHLFZDLSA-N Asn-Phe-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O UYCPJVYQYARFGB-YDHLFZDLSA-N 0.000 description 1
- MRQQMVZUHXUPEV-IHRRRGAJSA-N Asp-Arg-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MRQQMVZUHXUPEV-IHRRRGAJSA-N 0.000 description 1
- SVFOIXMRMLROHO-SRVKXCTJSA-N Asp-Asp-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SVFOIXMRMLROHO-SRVKXCTJSA-N 0.000 description 1
- DGKCOYGQLNWNCJ-ACZMJKKPSA-N Asp-Glu-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O DGKCOYGQLNWNCJ-ACZMJKKPSA-N 0.000 description 1
- GYWQGGUCMDCUJE-DLOVCJGASA-N Asp-Phe-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O GYWQGGUCMDCUJE-DLOVCJGASA-N 0.000 description 1
- FIAKNCXQFFKSSI-ZLUOBGJFSA-N Asp-Ser-Cys Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(O)=O FIAKNCXQFFKSSI-ZLUOBGJFSA-N 0.000 description 1
- PDIYGFYAMZZFCW-JIOCBJNQSA-N Asp-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N)O PDIYGFYAMZZFCW-JIOCBJNQSA-N 0.000 description 1
- XWKBWZXGNXTDKY-ZKWXMUAHSA-N Asp-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O XWKBWZXGNXTDKY-ZKWXMUAHSA-N 0.000 description 1
- 101150018129 CSF2 gene Proteins 0.000 description 1
- 101150069031 CSN2 gene Proteins 0.000 description 1
- 241000589875 Campylobacter jejuni Species 0.000 description 1
- 108091092236 Chimeric RNA Proteins 0.000 description 1
- AEJSNWMRPXAKCW-WHFBIAKZSA-N Cys-Ala-Gly Chemical compound SC[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O AEJSNWMRPXAKCW-WHFBIAKZSA-N 0.000 description 1
- LDIKUWLAMDFHPU-FXQIFTODSA-N Cys-Cys-Arg Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LDIKUWLAMDFHPU-FXQIFTODSA-N 0.000 description 1
- ISWAQPWFWKGCAL-ACZMJKKPSA-N Cys-Cys-Glu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(O)=O ISWAQPWFWKGCAL-ACZMJKKPSA-N 0.000 description 1
- HAYVLBZZBDCKRA-SRVKXCTJSA-N Cys-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CS)N HAYVLBZZBDCKRA-SRVKXCTJSA-N 0.000 description 1
- KXUKWRVYDYIPSQ-CIUDSAMLSA-N Cys-Leu-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O KXUKWRVYDYIPSQ-CIUDSAMLSA-N 0.000 description 1
- HKALUUKHYNEDRS-GUBZILKMSA-N Cys-Leu-Gln Chemical compound SC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O HKALUUKHYNEDRS-GUBZILKMSA-N 0.000 description 1
- SRIRHERUAMYIOQ-CIUDSAMLSA-N Cys-Leu-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SRIRHERUAMYIOQ-CIUDSAMLSA-N 0.000 description 1
- VXLXATVURDNDCG-CIUDSAMLSA-N Cys-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CS)N VXLXATVURDNDCG-CIUDSAMLSA-N 0.000 description 1
- NXQCSPVUPLUTJH-WHFBIAKZSA-N Cys-Ser-Gly Chemical compound SC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O NXQCSPVUPLUTJH-WHFBIAKZSA-N 0.000 description 1
- HJXSYJVCMUOUNY-SRVKXCTJSA-N Cys-Ser-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CS)N HJXSYJVCMUOUNY-SRVKXCTJSA-N 0.000 description 1
- NAPULYCVEVVFRB-HEIBUPTGSA-N Cys-Thr-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](N)CS NAPULYCVEVVFRB-HEIBUPTGSA-N 0.000 description 1
- VRJZMZGGAKVSIQ-SRVKXCTJSA-N Cys-Tyr-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O VRJZMZGGAKVSIQ-SRVKXCTJSA-N 0.000 description 1
- 241000701022 Cytomegalovirus Species 0.000 description 1
- 230000007018 DNA scission Effects 0.000 description 1
- 230000006820 DNA synthesis Effects 0.000 description 1
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 1
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 1
- 108700003861 Dominant Genes Proteins 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 101150106478 GPS1 gene Proteins 0.000 description 1
- AAOBFSKXAVIORT-GUBZILKMSA-N Gln-Asn-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O AAOBFSKXAVIORT-GUBZILKMSA-N 0.000 description 1
- LVNILKSSFHCSJZ-IHRRRGAJSA-N Gln-Gln-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N LVNILKSSFHCSJZ-IHRRRGAJSA-N 0.000 description 1
- SNLOOPZHAQDMJG-CIUDSAMLSA-N Gln-Glu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SNLOOPZHAQDMJG-CIUDSAMLSA-N 0.000 description 1
- KDXKFBSNIJYNNR-YVNDNENWSA-N Gln-Glu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KDXKFBSNIJYNNR-YVNDNENWSA-N 0.000 description 1
- PXAFHUATEHLECW-GUBZILKMSA-N Gln-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N PXAFHUATEHLECW-GUBZILKMSA-N 0.000 description 1
- KPNWAJMEMRCLAL-GUBZILKMSA-N Gln-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N KPNWAJMEMRCLAL-GUBZILKMSA-N 0.000 description 1
- ININBLZFFVOQIO-JHEQGTHGSA-N Gln-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N)O ININBLZFFVOQIO-JHEQGTHGSA-N 0.000 description 1
- ZFBBMCKQSNJZSN-AUTRQRHGSA-N Gln-Val-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZFBBMCKQSNJZSN-AUTRQRHGSA-N 0.000 description 1
- ATRHMOJQJWPVBQ-DRZSPHRISA-N Glu-Ala-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ATRHMOJQJWPVBQ-DRZSPHRISA-N 0.000 description 1
- CKRUHITYRFNUKW-WDSKDSINSA-N Glu-Asn-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CKRUHITYRFNUKW-WDSKDSINSA-N 0.000 description 1
- ZOXBSICWUDAOHX-GUBZILKMSA-N Glu-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O ZOXBSICWUDAOHX-GUBZILKMSA-N 0.000 description 1
- NKLRYVLERDYDBI-FXQIFTODSA-N Glu-Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKLRYVLERDYDBI-FXQIFTODSA-N 0.000 description 1
- CAVMESABQIKFKT-IUCAKERBSA-N Glu-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N CAVMESABQIKFKT-IUCAKERBSA-N 0.000 description 1
- LRPXYSGPOBVBEH-IUCAKERBSA-N Glu-Gly-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O LRPXYSGPOBVBEH-IUCAKERBSA-N 0.000 description 1
- ATVYZJGOZLVXDK-IUCAKERBSA-N Glu-Leu-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O ATVYZJGOZLVXDK-IUCAKERBSA-N 0.000 description 1
- OCJRHJZKGGSPRW-IUCAKERBSA-N Glu-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O OCJRHJZKGGSPRW-IUCAKERBSA-N 0.000 description 1
- GMAGZGCAYLQBKF-NHCYSSNCSA-N Glu-Met-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O GMAGZGCAYLQBKF-NHCYSSNCSA-N 0.000 description 1
- JZJGEKDPWVJOLD-QEWYBTABSA-N Glu-Phe-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JZJGEKDPWVJOLD-QEWYBTABSA-N 0.000 description 1
- 108010024636 Glutathione Proteins 0.000 description 1
- UGVQELHRNUDMAA-BYPYZUCNSA-N Gly-Ala-Gly Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)NCC([O-])=O UGVQELHRNUDMAA-BYPYZUCNSA-N 0.000 description 1
- GWCRIHNSVMOBEQ-BQBZGAKWSA-N Gly-Arg-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O GWCRIHNSVMOBEQ-BQBZGAKWSA-N 0.000 description 1
- JUGQPPOVWXSPKJ-RYUDHWBXSA-N Gly-Gln-Phe Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JUGQPPOVWXSPKJ-RYUDHWBXSA-N 0.000 description 1
- HFXJIZNEXNIZIJ-BQBZGAKWSA-N Gly-Glu-Gln Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HFXJIZNEXNIZIJ-BQBZGAKWSA-N 0.000 description 1
- JNGJGFMFXREJNF-KBPBESRZSA-N Gly-Glu-Trp Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O JNGJGFMFXREJNF-KBPBESRZSA-N 0.000 description 1
- KMSGYZQRXPUKGI-BYPYZUCNSA-N Gly-Gly-Asn Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(N)=O KMSGYZQRXPUKGI-BYPYZUCNSA-N 0.000 description 1
- INLIXXRWNUKVCF-JTQLQIEISA-N Gly-Gly-Tyr Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 INLIXXRWNUKVCF-JTQLQIEISA-N 0.000 description 1
- HPAIKDPJURGQLN-KBPBESRZSA-N Gly-His-Phe Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CNC=N1 HPAIKDPJURGQLN-KBPBESRZSA-N 0.000 description 1
- LPCKHUXOGVNZRS-YUMQZZPRSA-N Gly-His-Ser Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O LPCKHUXOGVNZRS-YUMQZZPRSA-N 0.000 description 1
- HKSNHPVETYYJBK-LAEOZQHASA-N Gly-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)CN HKSNHPVETYYJBK-LAEOZQHASA-N 0.000 description 1
- SCWYHUQOOFRVHP-MBLNEYKQSA-N Gly-Ile-Thr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SCWYHUQOOFRVHP-MBLNEYKQSA-N 0.000 description 1
- LIXWIUAORXJNBH-QWRGUYRKSA-N Gly-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)CN LIXWIUAORXJNBH-QWRGUYRKSA-N 0.000 description 1
- UHPAZODVFFYEEL-QWRGUYRKSA-N Gly-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN UHPAZODVFFYEEL-QWRGUYRKSA-N 0.000 description 1
- MXIULRKNFSCJHT-STQMWFEESA-N Gly-Phe-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 MXIULRKNFSCJHT-STQMWFEESA-N 0.000 description 1
- HFPVRZWORNJRRC-UWVGGRQHSA-N Gly-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN HFPVRZWORNJRRC-UWVGGRQHSA-N 0.000 description 1
- COZMNNJEGNPDED-HOCLYGCPSA-N Gly-Val-Trp Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O COZMNNJEGNPDED-HOCLYGCPSA-N 0.000 description 1
- IZVICCORZOSGPT-JSGCOSHPSA-N Gly-Val-Tyr Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IZVICCORZOSGPT-JSGCOSHPSA-N 0.000 description 1
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 1
- ZIMTWPHIKZEHSE-UWVGGRQHSA-N His-Arg-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O ZIMTWPHIKZEHSE-UWVGGRQHSA-N 0.000 description 1
- BXOLYFJYQQRQDJ-MXAVVETBSA-N His-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CN=CN1)N BXOLYFJYQQRQDJ-MXAVVETBSA-N 0.000 description 1
- YXXKBPJEIYFGOD-MGHWNKPDSA-N His-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CC2=CN=CN2)N YXXKBPJEIYFGOD-MGHWNKPDSA-N 0.000 description 1
- ZVKDCQVQTGYBQT-LSJOCFKGSA-N His-Pro-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O ZVKDCQVQTGYBQT-LSJOCFKGSA-N 0.000 description 1
- ILUVWFTXAUYOBW-CUJWVEQBSA-N His-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC1=CN=CN1)N)O ILUVWFTXAUYOBW-CUJWVEQBSA-N 0.000 description 1
- ZNTSGDNUITWTRA-WDSOQIARSA-N His-Trp-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C(C)C)C(O)=O ZNTSGDNUITWTRA-WDSOQIARSA-N 0.000 description 1
- DAKSMIWQZPHRIB-BZSNNMDCSA-N His-Tyr-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O DAKSMIWQZPHRIB-BZSNNMDCSA-N 0.000 description 1
- CGAMSLMBYJHMDY-ONGXEEELSA-N His-Val-Gly Chemical compound CC(C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CN=CN1)N CGAMSLMBYJHMDY-ONGXEEELSA-N 0.000 description 1
- 101100321817 Human parvovirus B19 (strain HV) 7.5K gene Proteins 0.000 description 1
- IDAHFEPYTJJZFD-PEFMBERDSA-N Ile-Asp-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N IDAHFEPYTJJZFD-PEFMBERDSA-N 0.000 description 1
- KBHYLOIVRVBBEB-JBDRJPRFSA-N Ile-Cys-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)O)N KBHYLOIVRVBBEB-JBDRJPRFSA-N 0.000 description 1
- YBGTWSFIGHUWQE-MXAVVETBSA-N Ile-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)CC)CC1=CN=CN1 YBGTWSFIGHUWQE-MXAVVETBSA-N 0.000 description 1
- DBXXASNNDTXOLU-MXAVVETBSA-N Ile-Leu-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N DBXXASNNDTXOLU-MXAVVETBSA-N 0.000 description 1
- IOVUXUSIGXCREV-DKIMLUQUSA-N Ile-Leu-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IOVUXUSIGXCREV-DKIMLUQUSA-N 0.000 description 1
- PXKACEXYLPBMAD-JBDRJPRFSA-N Ile-Ser-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PXKACEXYLPBMAD-JBDRJPRFSA-N 0.000 description 1
- DRCKHKZYDLJYFQ-YWIQKCBGSA-N Ile-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DRCKHKZYDLJYFQ-YWIQKCBGSA-N 0.000 description 1
- WRDTXMBPHMBGIB-STECZYCISA-N Ile-Tyr-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=C(O)C=C1 WRDTXMBPHMBGIB-STECZYCISA-N 0.000 description 1
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 1
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 1
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 1
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 1
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 1
- KSZCCRIGNVSHFH-UWVGGRQHSA-N Leu-Arg-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O KSZCCRIGNVSHFH-UWVGGRQHSA-N 0.000 description 1
- NFHJQETXTSDZSI-DCAQKATOSA-N Leu-Cys-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NFHJQETXTSDZSI-DCAQKATOSA-N 0.000 description 1
- VZBIUJURDLFFOE-IHRRRGAJSA-N Leu-His-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VZBIUJURDLFFOE-IHRRRGAJSA-N 0.000 description 1
- SEMUSFOBZGKBGW-YTFOTSKYSA-N Leu-Ile-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SEMUSFOBZGKBGW-YTFOTSKYSA-N 0.000 description 1
- KUIDCYNIEJBZBU-AJNGGQMLSA-N Leu-Ile-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O KUIDCYNIEJBZBU-AJNGGQMLSA-N 0.000 description 1
- LIINDKYIGYTDLG-PPCPHDFISA-N Leu-Ile-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LIINDKYIGYTDLG-PPCPHDFISA-N 0.000 description 1
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 1
- KPYAOIVPJKPIOU-KKUMJFAQSA-N Leu-Lys-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O KPYAOIVPJKPIOU-KKUMJFAQSA-N 0.000 description 1
- ZDBMWELMUCLUPL-QEJZJMRPSA-N Leu-Phe-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 ZDBMWELMUCLUPL-QEJZJMRPSA-N 0.000 description 1
- PJWOOBTYQNNRBF-BZSNNMDCSA-N Leu-Phe-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)O)N PJWOOBTYQNNRBF-BZSNNMDCSA-N 0.000 description 1
- VTJUNIYRYIAIHF-IUCAKERBSA-N Leu-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O VTJUNIYRYIAIHF-IUCAKERBSA-N 0.000 description 1
- JDBQSGMJBMPNFT-AVGNSLFASA-N Leu-Pro-Val Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O JDBQSGMJBMPNFT-AVGNSLFASA-N 0.000 description 1
- KIZIOFNVSOSKJI-CIUDSAMLSA-N Leu-Ser-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N KIZIOFNVSOSKJI-CIUDSAMLSA-N 0.000 description 1
- SBANPBVRHYIMRR-GARJFASQSA-N Leu-Ser-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N SBANPBVRHYIMRR-GARJFASQSA-N 0.000 description 1
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 1
- PPGBXYKMUMHFBF-KATARQTJSA-N Leu-Ser-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PPGBXYKMUMHFBF-KATARQTJSA-N 0.000 description 1
- ZJZNLRVCZWUONM-JXUBOQSCSA-N Leu-Thr-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O ZJZNLRVCZWUONM-JXUBOQSCSA-N 0.000 description 1
- BTEMNFBEAAOGBR-BZSNNMDCSA-N Leu-Tyr-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BTEMNFBEAAOGBR-BZSNNMDCSA-N 0.000 description 1
- BGGTYDNTOYRTTR-MEYUZBJRSA-N Leu-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC(C)C)N)O BGGTYDNTOYRTTR-MEYUZBJRSA-N 0.000 description 1
- FDBTVENULFNTAL-XQQFMLRXSA-N Leu-Val-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N FDBTVENULFNTAL-XQQFMLRXSA-N 0.000 description 1
- RVOMPSJXSRPFJT-DCAQKATOSA-N Lys-Ala-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVOMPSJXSRPFJT-DCAQKATOSA-N 0.000 description 1
- YIBOAHAOAWACDK-QEJZJMRPSA-N Lys-Ala-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YIBOAHAOAWACDK-QEJZJMRPSA-N 0.000 description 1
- ZTPWXNOOKAXPPE-DCAQKATOSA-N Lys-Arg-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N ZTPWXNOOKAXPPE-DCAQKATOSA-N 0.000 description 1
- GGAPIOORBXHMNY-ULQDDVLXSA-N Lys-Arg-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N)O GGAPIOORBXHMNY-ULQDDVLXSA-N 0.000 description 1
- SSJBMGCZZXCGJJ-DCAQKATOSA-N Lys-Asp-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O SSJBMGCZZXCGJJ-DCAQKATOSA-N 0.000 description 1
- KWUKZRFFKPLUPE-HJGDQZAQSA-N Lys-Asp-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWUKZRFFKPLUPE-HJGDQZAQSA-N 0.000 description 1
- GKFNXYMAMKJSKD-NHCYSSNCSA-N Lys-Asp-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O GKFNXYMAMKJSKD-NHCYSSNCSA-N 0.000 description 1
- PBIPLDMFHAICIP-DCAQKATOSA-N Lys-Glu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PBIPLDMFHAICIP-DCAQKATOSA-N 0.000 description 1
- RFQATBGBLDAKGI-VHSXEESVSA-N Lys-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCCCN)N)C(=O)O RFQATBGBLDAKGI-VHSXEESVSA-N 0.000 description 1
- NNKLKUUGESXCBS-KBPBESRZSA-N Lys-Gly-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O NNKLKUUGESXCBS-KBPBESRZSA-N 0.000 description 1
- KKFVKBWCXXLKIK-AVGNSLFASA-N Lys-His-Glu Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCCCN)N KKFVKBWCXXLKIK-AVGNSLFASA-N 0.000 description 1
- QKXZCUCBFPEXNK-KKUMJFAQSA-N Lys-Leu-His Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 QKXZCUCBFPEXNK-KKUMJFAQSA-N 0.000 description 1
- JPYPRVHMKRFTAT-KKUMJFAQSA-N Lys-Phe-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCCN)N JPYPRVHMKRFTAT-KKUMJFAQSA-N 0.000 description 1
- MIFFFXHMAHFACR-KATARQTJSA-N Lys-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CCCCN MIFFFXHMAHFACR-KATARQTJSA-N 0.000 description 1
- XGZDDOKIHSYHTO-SZMVWBNQSA-N Lys-Trp-Glu Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 XGZDDOKIHSYHTO-SZMVWBNQSA-N 0.000 description 1
- ZJSXCIMWLPSTMG-HSCHXYMDSA-N Lys-Trp-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZJSXCIMWLPSTMG-HSCHXYMDSA-N 0.000 description 1
- DRRXXZBXDMLGFC-IHRRRGAJSA-N Lys-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN DRRXXZBXDMLGFC-IHRRRGAJSA-N 0.000 description 1
- IKXQOBUBZSOWDY-AVGNSLFASA-N Lys-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N IKXQOBUBZSOWDY-AVGNSLFASA-N 0.000 description 1
- PWHULOQIROXLJO-UHFFFAOYSA-N Manganese Chemical compound [Mn] PWHULOQIROXLJO-UHFFFAOYSA-N 0.000 description 1
- HDNOQCZWJGGHSS-VEVYYDQMSA-N Met-Asn-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HDNOQCZWJGGHSS-VEVYYDQMSA-N 0.000 description 1
- TUSOIZOVPJCMFC-FXQIFTODSA-N Met-Asp-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O TUSOIZOVPJCMFC-FXQIFTODSA-N 0.000 description 1
- UROWNMBTQGGTHB-DCAQKATOSA-N Met-Leu-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O UROWNMBTQGGTHB-DCAQKATOSA-N 0.000 description 1
- ZIIMORLEZLVRIP-SRVKXCTJSA-N Met-Leu-Gln Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZIIMORLEZLVRIP-SRVKXCTJSA-N 0.000 description 1
- LBSWWNKMVPAXOI-GUBZILKMSA-N Met-Val-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O LBSWWNKMVPAXOI-GUBZILKMSA-N 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 101100219625 Mus musculus Casd1 gene Proteins 0.000 description 1
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 1
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 1
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 1
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 1
- 241000588650 Neisseria meningitidis Species 0.000 description 1
- 101100385413 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) csm-3 gene Proteins 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- 101150067405 PSC gene Proteins 0.000 description 1
- 108090000279 Peptidyltransferases Proteins 0.000 description 1
- 239000001888 Peptone Substances 0.000 description 1
- 108010080698 Peptones Proteins 0.000 description 1
- NOFBJKKOPKJDCO-KKXDTOCCSA-N Phe-Ala-Tyr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O NOFBJKKOPKJDCO-KKXDTOCCSA-N 0.000 description 1
- BIYWZVCPZIFGPY-QWRGUYRKSA-N Phe-Gly-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CO)C(O)=O BIYWZVCPZIFGPY-QWRGUYRKSA-N 0.000 description 1
- YTILBRIUASDGBL-BZSNNMDCSA-N Phe-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 YTILBRIUASDGBL-BZSNNMDCSA-N 0.000 description 1
- PEFJUUYFEGBXFA-BZSNNMDCSA-N Phe-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 PEFJUUYFEGBXFA-BZSNNMDCSA-N 0.000 description 1
- YTGGLKWSVIRECD-JBACZVJFSA-N Phe-Trp-Glu Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCC(O)=O)C(O)=O)C1=CC=CC=C1 YTGGLKWSVIRECD-JBACZVJFSA-N 0.000 description 1
- ZYNBEWGJFXTBDU-ACRUOGEOSA-N Phe-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CC=CC=C2)N ZYNBEWGJFXTBDU-ACRUOGEOSA-N 0.000 description 1
- VXCHGLYSIOOZIS-GUBZILKMSA-N Pro-Ala-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 VXCHGLYSIOOZIS-GUBZILKMSA-N 0.000 description 1
- OLTFZQIYCNOBLI-DCAQKATOSA-N Pro-Cys-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O OLTFZQIYCNOBLI-DCAQKATOSA-N 0.000 description 1
- BODDREDDDRZUCF-QTKMDUPCSA-N Pro-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@@H]2CCCN2)O BODDREDDDRZUCF-QTKMDUPCSA-N 0.000 description 1
- HFNPOYOKIPGAEI-SRVKXCTJSA-N Pro-Leu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 HFNPOYOKIPGAEI-SRVKXCTJSA-N 0.000 description 1
- FXGIMYRVJJEIIM-UWVGGRQHSA-N Pro-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FXGIMYRVJJEIIM-UWVGGRQHSA-N 0.000 description 1
- XYSXOCIWCPFOCG-IHRRRGAJSA-N Pro-Leu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XYSXOCIWCPFOCG-IHRRRGAJSA-N 0.000 description 1
- GNADVDLLGVSXLS-ULQDDVLXSA-N Pro-Phe-His Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC=N1)C(O)=O GNADVDLLGVSXLS-ULQDDVLXSA-N 0.000 description 1
- HOTVCUAVDQHUDB-UFYCRDLUSA-N Pro-Phe-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 HOTVCUAVDQHUDB-UFYCRDLUSA-N 0.000 description 1
- FDMKYQQYJKYCLV-GUBZILKMSA-N Pro-Pro-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 FDMKYQQYJKYCLV-GUBZILKMSA-N 0.000 description 1
- BXHRXLMCYSZSIY-STECZYCISA-N Pro-Tyr-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](Cc1ccc(O)cc1)NC(=O)[C@@H]1CCCN1)C(O)=O BXHRXLMCYSZSIY-STECZYCISA-N 0.000 description 1
- 241000169446 Promethis Species 0.000 description 1
- 101100047461 Rattus norvegicus Trpm8 gene Proteins 0.000 description 1
- 108020005091 Replication Origin Proteins 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- HQTKVSCNCDLXSX-BQBZGAKWSA-N Ser-Arg-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O HQTKVSCNCDLXSX-BQBZGAKWSA-N 0.000 description 1
- UBRXAVQWXOWRSJ-ZLUOBGJFSA-N Ser-Asn-Asp Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CO)N)C(=O)N UBRXAVQWXOWRSJ-ZLUOBGJFSA-N 0.000 description 1
- OHKLFYXEOGGGCK-ZLUOBGJFSA-N Ser-Asp-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OHKLFYXEOGGGCK-ZLUOBGJFSA-N 0.000 description 1
- FTVRVZNYIYWJGB-ACZMJKKPSA-N Ser-Asp-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FTVRVZNYIYWJGB-ACZMJKKPSA-N 0.000 description 1
- SNNSYBWPPVAXQW-ZLUOBGJFSA-N Ser-Cys-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)O)N)O SNNSYBWPPVAXQW-ZLUOBGJFSA-N 0.000 description 1
- MPPHJZYXDVDGOF-BWBBJGPYSA-N Ser-Cys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CO MPPHJZYXDVDGOF-BWBBJGPYSA-N 0.000 description 1
- SQBLRDDJTUJDMV-ACZMJKKPSA-N Ser-Glu-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQBLRDDJTUJDMV-ACZMJKKPSA-N 0.000 description 1
- YRBGKVIWMNEVCZ-WDSKDSINSA-N Ser-Glu-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O YRBGKVIWMNEVCZ-WDSKDSINSA-N 0.000 description 1
- SNVIOQXAHVORQM-WDSKDSINSA-N Ser-Gly-Gln Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O SNVIOQXAHVORQM-WDSKDSINSA-N 0.000 description 1
- UAJAYRMZGNQILN-BQBZGAKWSA-N Ser-Gly-Met Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O UAJAYRMZGNQILN-BQBZGAKWSA-N 0.000 description 1
- HMRAQFJFTOLDKW-GUBZILKMSA-N Ser-His-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O HMRAQFJFTOLDKW-GUBZILKMSA-N 0.000 description 1
- YIUWWXVTYLANCJ-NAKRPEOUSA-N Ser-Ile-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O YIUWWXVTYLANCJ-NAKRPEOUSA-N 0.000 description 1
- DLPXTCTVNDTYGJ-JBDRJPRFSA-N Ser-Ile-Cys Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CS)C(O)=O DLPXTCTVNDTYGJ-JBDRJPRFSA-N 0.000 description 1
- XNCUYZKGQOCOQH-YUMQZZPRSA-N Ser-Leu-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O XNCUYZKGQOCOQH-YUMQZZPRSA-N 0.000 description 1
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 1
- JWOBLHJRDADHLN-KKUMJFAQSA-N Ser-Leu-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JWOBLHJRDADHLN-KKUMJFAQSA-N 0.000 description 1
- HDBOEVPDIDDEPC-CIUDSAMLSA-N Ser-Lys-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O HDBOEVPDIDDEPC-CIUDSAMLSA-N 0.000 description 1
- WGDYNRCOQRERLZ-KKUMJFAQSA-N Ser-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)N WGDYNRCOQRERLZ-KKUMJFAQSA-N 0.000 description 1
- NQZFFLBPNDLTPO-DLOVCJGASA-N Ser-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CO)N NQZFFLBPNDLTPO-DLOVCJGASA-N 0.000 description 1
- HJAXVYLCKDPPDF-SRVKXCTJSA-N Ser-Phe-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N HJAXVYLCKDPPDF-SRVKXCTJSA-N 0.000 description 1
- XKFJENWJGHMDLI-QWRGUYRKSA-N Ser-Phe-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O XKFJENWJGHMDLI-QWRGUYRKSA-N 0.000 description 1
- GZGFSPWOMUKKCV-NAKRPEOUSA-N Ser-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO GZGFSPWOMUKKCV-NAKRPEOUSA-N 0.000 description 1
- OVQZAFXWIWNYKA-GUBZILKMSA-N Ser-Pro-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CO)N OVQZAFXWIWNYKA-GUBZILKMSA-N 0.000 description 1
- PPCZVWHJWJFTFN-ZLUOBGJFSA-N Ser-Ser-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPCZVWHJWJFTFN-ZLUOBGJFSA-N 0.000 description 1
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 1
- OZPDGESCTGGNAD-CIUDSAMLSA-N Ser-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CO OZPDGESCTGGNAD-CIUDSAMLSA-N 0.000 description 1
- OLKICIBQRVSQMA-SRVKXCTJSA-N Ser-Ser-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OLKICIBQRVSQMA-SRVKXCTJSA-N 0.000 description 1
- ZKOKTQPHFMRSJP-YJRXYDGGSA-N Ser-Thr-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZKOKTQPHFMRSJP-YJRXYDGGSA-N 0.000 description 1
- HAUVENOGHPECML-BPUTZDHNSA-N Ser-Trp-Val Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CO)=CNC2=C1 HAUVENOGHPECML-BPUTZDHNSA-N 0.000 description 1
- 241000191967 Staphylococcus aureus Species 0.000 description 1
- PXQUBKWZENPDGE-CIQUZCHMSA-N Thr-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)O)N PXQUBKWZENPDGE-CIQUZCHMSA-N 0.000 description 1
- OHAJHDJOCKKJLV-LKXGYXEUSA-N Thr-Asp-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O OHAJHDJOCKKJLV-LKXGYXEUSA-N 0.000 description 1
- DSLHSTIUAPKERR-XGEHTFHBSA-N Thr-Cys-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O DSLHSTIUAPKERR-XGEHTFHBSA-N 0.000 description 1
- XOWKUMFHEZLKLT-CIQUZCHMSA-N Thr-Ile-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O XOWKUMFHEZLKLT-CIQUZCHMSA-N 0.000 description 1
- FQPDRTDDEZXCEC-SVSWQMSJSA-N Thr-Ile-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O FQPDRTDDEZXCEC-SVSWQMSJSA-N 0.000 description 1
- FWTFAZKJORVTIR-VZFHVOOUSA-N Thr-Ser-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O FWTFAZKJORVTIR-VZFHVOOUSA-N 0.000 description 1
- BCYUHPXBHCUYBA-CUJWVEQBSA-N Thr-Ser-His Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O BCYUHPXBHCUYBA-CUJWVEQBSA-N 0.000 description 1
- AHERARIZBPOMNU-KATARQTJSA-N Thr-Ser-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O AHERARIZBPOMNU-KATARQTJSA-N 0.000 description 1
- VYVBSMCZNHOZGD-RCWTZXSCSA-N Thr-Val-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O VYVBSMCZNHOZGD-RCWTZXSCSA-N 0.000 description 1
- 241000283907 Tragelaphus oryx Species 0.000 description 1
- NXJZCPKZIKTYLX-XEGUGMAKSA-N Trp-Glu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N NXJZCPKZIKTYLX-XEGUGMAKSA-N 0.000 description 1
- FEZASNVQLJQBHW-CABZTGNLSA-N Trp-Gly-Ala Chemical compound C1=CC=C2C(C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O)=CNC2=C1 FEZASNVQLJQBHW-CABZTGNLSA-N 0.000 description 1
- CCZXBOFIBYQLEV-IHPCNDPISA-N Trp-Leu-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)Cc1c[nH]c2ccccc12)C(O)=O CCZXBOFIBYQLEV-IHPCNDPISA-N 0.000 description 1
- WHJVRIBYQWHRQA-NQCBNZPSSA-N Trp-Phe-Ile Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CC=CC=C1 WHJVRIBYQWHRQA-NQCBNZPSSA-N 0.000 description 1
- ADMHZNPMMVKGJW-BPUTZDHNSA-N Trp-Ser-Arg Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N ADMHZNPMMVKGJW-BPUTZDHNSA-N 0.000 description 1
- FBHHJGOJWXHGDO-TUSQITKMSA-N Trp-Trp-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC=3C4=CC=CC=C4NC=3)C(=O)N[C@@H](CC(C)C)C(O)=O)=CNC2=C1 FBHHJGOJWXHGDO-TUSQITKMSA-N 0.000 description 1
- CRWOSTCODDFEKZ-HRCADAONSA-N Tyr-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O CRWOSTCODDFEKZ-HRCADAONSA-N 0.000 description 1
- QKXAEWMHAAVVGS-KKUMJFAQSA-N Tyr-Pro-Glu Chemical compound N[C@@H](Cc1ccc(O)cc1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O QKXAEWMHAAVVGS-KKUMJFAQSA-N 0.000 description 1
- VXFXIBCCVLJCJT-JYJNAYRXSA-N Tyr-Pro-Pro Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N1CCC[C@H]1C(O)=O VXFXIBCCVLJCJT-JYJNAYRXSA-N 0.000 description 1
- JAQGKXUEKGKTKX-HOTGVXAUSA-N Tyr-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 JAQGKXUEKGKTKX-HOTGVXAUSA-N 0.000 description 1
- 241000700618 Vaccinia virus Species 0.000 description 1
- YODDULVCGFQRFZ-ZKWXMUAHSA-N Val-Asp-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O YODDULVCGFQRFZ-ZKWXMUAHSA-N 0.000 description 1
- SCBITHMBEJNRHC-LSJOCFKGSA-N Val-Asp-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N SCBITHMBEJNRHC-LSJOCFKGSA-N 0.000 description 1
- AEMPCGRFEZTWIF-IHRRRGAJSA-N Val-Leu-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O AEMPCGRFEZTWIF-IHRRRGAJSA-N 0.000 description 1
- BTWMICVCQLKKNR-DCAQKATOSA-N Val-Leu-Ser Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C([O-])=O BTWMICVCQLKKNR-DCAQKATOSA-N 0.000 description 1
- RWOGENDAOGMHLX-DCAQKATOSA-N Val-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N RWOGENDAOGMHLX-DCAQKATOSA-N 0.000 description 1
- MBGFDZDWMDLXHQ-GUBZILKMSA-N Val-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](C(C)C)N MBGFDZDWMDLXHQ-GUBZILKMSA-N 0.000 description 1
- DOFAQXCYFQKSHT-SRVKXCTJSA-N Val-Pro-Pro Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DOFAQXCYFQKSHT-SRVKXCTJSA-N 0.000 description 1
- DEGUERSKQBRZMZ-FXQIFTODSA-N Val-Ser-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DEGUERSKQBRZMZ-FXQIFTODSA-N 0.000 description 1
- UGFMVXRXULGLNO-XPUUQOCRSA-N Val-Ser-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O UGFMVXRXULGLNO-XPUUQOCRSA-N 0.000 description 1
- OFTXTCGQJXTNQS-XGEHTFHBSA-N Val-Thr-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N)O OFTXTCGQJXTNQS-XGEHTFHBSA-N 0.000 description 1
- 229920000358 [Glu(-Cys)]n-Gly Polymers 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 239000003570 air Substances 0.000 description 1
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 1
- 108010005233 alanylglutamic acid Proteins 0.000 description 1
- 108010070944 alanylhistidine Proteins 0.000 description 1
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 1
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 1
- 108010008355 arginyl-glutamine Proteins 0.000 description 1
- 108010009111 arginyl-glycyl-glutamic acid Proteins 0.000 description 1
- 108010062796 arginyllysine Proteins 0.000 description 1
- 108010047857 aspartylglycine Proteins 0.000 description 1
- 230000010165 autogamy Effects 0.000 description 1
- 239000013602 bacteriophage vector Substances 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 229940041514 candida albicans extract Drugs 0.000 description 1
- 235000021466 carotenoid Nutrition 0.000 description 1
- 150000001747 carotenoids Chemical class 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 101150055766 cat gene Proteins 0.000 description 1
- 229960004261 cefotaxime Drugs 0.000 description 1
- 210000003855 cell nucleus Anatomy 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 229930002875 chlorophyll Natural products 0.000 description 1
- 235000019804 chlorophyll Nutrition 0.000 description 1
- ATNHDLDRLWWWCB-AENOIHSZSA-M chlorophyll a Chemical compound C1([C@@H](C(=O)OC)C(=O)C2=C3C)=C2N2C3=CC(C(CC)=C3C)=[N+]4C3=CC3=C(C=C)C(C)=C5N3[Mg-2]42[N+]2=C1[C@@H](CCC(=O)OC\C=C(/C)CCC[C@H](C)CCC[C@H](C)CCCC(C)C)[C@H](C)C2=C5 ATNHDLDRLWWWCB-AENOIHSZSA-M 0.000 description 1
- 210000003763 chloroplast Anatomy 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 101150055601 cops2 gene Proteins 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 239000013601 cosmid vector Substances 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 239000012153 distilled water Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 239000003344 environmental pollutant Substances 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 235000012631 food intake Nutrition 0.000 description 1
- 239000012737 fresh medium Substances 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000005251 gamma ray Effects 0.000 description 1
- 238000003209 gene knockout Methods 0.000 description 1
- 238000012239 gene modification Methods 0.000 description 1
- 230000005017 genetic modification Effects 0.000 description 1
- 235000013617 genetically modified food Nutrition 0.000 description 1
- 238000003205 genotyping method Methods 0.000 description 1
- 229960003180 glutathione Drugs 0.000 description 1
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 1
- HPAIKDPJURGQLN-UHFFFAOYSA-N glycyl-L-histidyl-L-phenylalanine Natural products C=1C=CC=CC=1CC(C(O)=O)NC(=O)C(NC(=O)CN)CC1=CN=CN1 HPAIKDPJURGQLN-UHFFFAOYSA-N 0.000 description 1
- 108010019832 glycyl-asparaginyl-glycine Proteins 0.000 description 1
- 108010010096 glycyl-glycyl-tyrosine Proteins 0.000 description 1
- 108010038983 glycyl-histidyl-lysine Proteins 0.000 description 1
- 108010045126 glycyl-tyrosyl-glycine Proteins 0.000 description 1
- 108010077515 glycylproline Proteins 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 108010025306 histidylleucine Proteins 0.000 description 1
- 230000006801 homologous recombination Effects 0.000 description 1
- 238000002744 homologous recombination Methods 0.000 description 1
- 231100000003 human carcinogen Toxicity 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 230000008595 infiltration Effects 0.000 description 1
- 238000001764 infiltration Methods 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 239000008101 lactose Substances 0.000 description 1
- 108010083708 leucyl-aspartyl-valine Proteins 0.000 description 1
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 108010017391 lysylvaline Proteins 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 229910052748 manganese Inorganic materials 0.000 description 1
- 239000011572 manganese Substances 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 108010068488 methionylphenylalanine Proteins 0.000 description 1
- 210000003470 mitochondria Anatomy 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 230000000869 mutational effect Effects 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 230000017066 negative regulation of growth Effects 0.000 description 1
- 238000007857 nested PCR Methods 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 210000003463 organelle Anatomy 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 235000019319 peptone Nutrition 0.000 description 1
- 108010018625 phenylalanylarginine Proteins 0.000 description 1
- CGZITCMVSSNQPE-NAKRPEOUSA-N phytochelatin 2 Chemical compound OC(=O)[C@@H](N)CCC(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CCC(=O)N[C@@H](CS)C(=O)NCC(O)=O CGZITCMVSSNQPE-NAKRPEOUSA-N 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 231100000719 pollutant Toxicity 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 238000003752 polymerase chain reaction Methods 0.000 description 1
- 239000013641 positive control Substances 0.000 description 1
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 description 1
- 230000037452 priming Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 108010093296 prolyl-prolyl-alanine Proteins 0.000 description 1
- 108010031719 prolyl-serine Proteins 0.000 description 1
- 108010090894 prolylleucine Proteins 0.000 description 1
- 230000009145 protein modification Effects 0.000 description 1
- 210000001938 protoplast Anatomy 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000001177 retroviral effect Effects 0.000 description 1
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 1
- 108010026333 seryl-proline Proteins 0.000 description 1
- 108010071207 serylmethionine Proteins 0.000 description 1
- HBMJWWWQQXIZIP-UHFFFAOYSA-N silicon carbide Chemical compound [Si+]#[C-] HBMJWWWQQXIZIP-UHFFFAOYSA-N 0.000 description 1
- 229910010271 silicon carbide Inorganic materials 0.000 description 1
- 230000000391 smoking effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000005507 spraying Methods 0.000 description 1
- 230000001954 sterilising effect Effects 0.000 description 1
- 229960005322 streptomycin Drugs 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 108010061238 threonyl-glycine Proteins 0.000 description 1
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical class CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- 108010003137 tyrosyltyrosine Proteins 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 108010015385 valyl-prolyl-proline Proteins 0.000 description 1
- 235000013311 vegetables Nutrition 0.000 description 1
- 239000012138 yeast extract Substances 0.000 description 1
Images
Classifications
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01H—NEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
- A01H1/00—Processes for modifying genotypes ; Plants characterised by associated natural traits
- A01H1/06—Processes for producing mutations, e.g. treatment with chemicals or with radiation
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01H—NEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
- A01H6/00—Angiosperms, i.e. flowering plants, characterised by their botanic taxonomy
- A01H6/82—Solanaceae, e.g. pepper, tobacco, potato, tomato or eggplant
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01H—NEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
- A01H6/00—Angiosperms, i.e. flowering plants, characterised by their botanic taxonomy
- A01H6/82—Solanaceae, e.g. pepper, tobacco, potato, tomato or eggplant
- A01H6/823—Nicotiana, e.g. tobacco
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8201—Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
- C12N15/8202—Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation by biological means, e.g. cell mediated or natural vector
- C12N15/8205—Agrobacterium mediated transformation
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8201—Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
- C12N15/8213—Targeted insertion of genes into the plant genome by homologous recombination
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8261—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
- C12N15/8271—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1025—Acyltransferases (2.3)
- C12N9/104—Aminoacyltransferases (2.3.2)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y203/00—Acyltransferases (2.3)
- C12Y203/02—Aminoacyltransferases (2.3.2)
- C12Y203/02015—Glutathione gamma-glutamylcysteinyltransferase (2.3.2.15), i.e. phytochelatin synthase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Medicinal Chemistry (AREA)
- Cell Biology (AREA)
- Botany (AREA)
- Developmental Biology & Embryology (AREA)
- Environmental Sciences (AREA)
- Crystallography & Structural Chemistry (AREA)
- Natural Medicines & Medicinal Plants (AREA)
- Physiology (AREA)
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
모세포에 비하여 PCS (Phytochelatin synthase) 유전자 또는 상기 PCS 유전자에 의해 코딩되는 단백질의 발현 또는 활성이 감소된 식물 세포, 상기 식물 세포를 포함하는 중금속 흡수량이 저감된 식물, 식물체의 모세포에 비하여 PCS 유전자 또는 상기 PCS 유전자에 의해 코딩되는 단백질의 발현 또는 활성을 감소시키는 단계를 포함하는 식물체 내 중금속을 저감시키는 방법, PCS 유전자를 표적으로 하는 단일 가이드 RNA를 포함하는 크리스퍼-카스9 (CRISPR-Cas9) 재조합 벡터, 및 상기 재조합 벡터로 식물 세포를 형질전환시키는 단계를 포함하는 중금속이 저감된 식물체를 제조하는 방법에 관한 것이다.
Description
중금속 저감된 형질전환 식물체 및 이의 제조방법에 관한 것이다.
납, 카드뮴, 수은 등 중금속은 환경으로부터 유래된 오염물질로 식품, 물, 대기, 토양 등을 통해 노출된다. 일반인은 주로 식품을 통해서 중금속을 섭취하게 되며 체내로 흡수된 미량의 중금속은 뼈, 신장 등의 장기에 축적되며 건강에 악영향을 끼치는 것으로 알려져 있다. 식품의약품안전처에서 2010년부터 2015년까지 우리 국민의 체내 중금속 농도 변화를 추적조사하고, 식품 섭취나 생활 습관과의 관련성을 분석한 결과 음주와 흡연, 식습관이 체내 중금속 농도와 관련성이 있는 것으로 확인됐다. 흡연은 섭취를 통한 체내 흡수율보다 흡입을 통한 흡수율이 높기 때문에 담배 자체가 가지는 중금속 등 유해물질이 체내로 들어와 체내 중금속 농도를 높이는 것으로 알려져 있다. 따라서, 담배 식물체 내의 중금속 함량 또는 재배시 토양으로부터의 중금속 흡수율을 저감시킬 수 있는 담배 식물체의 개발이 요구되고 있다.
또한, 많은 중금속은 토양에 천연 상태로 존재하고, 식물에 상이한 정도로 흡수된다. 망간 또는 아연과 같은 일부 중금속은 효소 활성에 요구된 공동 인자를 나타내기 때문 식물에 대해 필수적이지만, 다른 중금속은 식물에 대해 필수적이지 않으므로, 중금속의 농도를 감소시키는 것이 유익하다. 예를 들어, 카드뮴(Cd)은 식물 또는 인간 발육에 있어 유익한 효과가 없는 중금속으로 보고된 바 있으며, 인간 발암 물질로서 분류된다. Cd가 식물에서 과하게 축적되는 경우, 잎 표면이 감소하고, 건중량, 물 함량, 엽록소 함량, 및 카로티노이드 함량이 감소하는 등의 유해한 효과를 나타낸다.
특히, 담배는 뿌리에서보다 순(shoot)에서 Cd를 4배 더 높은 수준으로 축적할 수 있는 능력을 특징으로 하는 식물 종이므로, 담배와 같은 식물체에서 Cd의 축적을 감소시키는 것이 바람직하다. 이와 관련하여, 카드뮴 축적이 감소된 담배 식물체로서, NtHMA 유전자의 감소된 발현 또는 활성을 갖는 돌연변이 식물체를 제조하는 방법이 알려져 있으나 (국내 특허공개공보 제10-2018-0107123호), 상기 방법에 의해 제조된 돌연변이 담배 식물체는 야생형 담배 식물체에 비해 정상적인 생육이 불가능하다는 문제점이 있다.
이러한 배경 하에, 본 발명자들은 담배 식물체의 파이토켈라틴 합성 효소 (NtPCS: phytochelatin synthase) 유전자에 돌연변이를 유발함으로써, 야생형 담배 식물체에 비해 중금속 함량 또는 중금속 흡수 정도가 현저히 저감되면서도, 우수한 생육 특성을 유지할 수 있음을 확인하여 본 발명을 완성하였다.
일 양상은 모세포에 비하여 PCS (Phytochelatin synthase) 유전자 또는 상기 PCS 유전자에 의해 코딩되는 단백질의 발현 또는 활성이 감소된 식물 세포를 제공한다.
다른 양상은 모세포에 비하여 PCS (Phytochelatin synthase) 유전자 또는 상기 PCS 유전자에 의해 코딩되는 단백질의 발현 또는 활성이 감소된 식물 세포를 포함하는 중금속 흡수량이 저감된 식물을 제공한다.
또 다른 양상은 식물체의 모세포에 비하여 PCS 유전자 또는 상기 PCS 유전자에 의해 코딩되는 단백질의 발현 또는 활성을 감소시키는 단계를 포함하는 식물체 내 중금속을 감소시키는 방법을 제공한다.
또 다른 양상은 PCS 유전자를 표적으로 하는 단일 가이드 RNA를 포함하는 크리스퍼-카스9 (CRISPR-Cas9) 재조합 벡터를 제공한다.
또 다른 양상은 PCS 유전자를 표적으로 하는 단일 가이드 RNA를 포함하는 크리스퍼-카스9 (CRISPR-Cas9) 재조합 벡터로 식물 세포를 형질전환시키는 단계를 포함하는 중금속 흡수량이 저감된 식물체를 제조하는 방법을 제공한다.
일 양상은 모세포에 비하여 PCS (Phytochelatin synthase) 유전자 또는 상기 PCS 유전자에 의해 코딩되는 단백질의 발현 또는 활성이 감소된 식물 세포를 제공하는 것이다.
본 명세서에서 사용되는 용어, “모세포”는 PCS 유전자 또는 상기 PCS 유전자에 의해 코딩되는 단백질의 발현 또는 활성이 감소되도록 인위적인 조작을 수행하지 않은 세포로서, 식물체에서 갓 분리된 세포 또는 이를 배양한 세포를 의미할 수 있다.
본 명세서에서 사용되는 용어, "파이토켈라틴 합성 효소 (PCS: phytochelatin synthase)"는 글루타티온 감마-글루타밀시스테이닐트랜스퍼라제 (glutathione gamma-glutamylcysteinyltransferase), 감마-글루타밀시스테인 디펩티딜 트랜스펩티다아제 (gamma-glutamylcysteine dipeptidyl transpeptidase)로도 불리는 효소로서, 글루타티온 및 [Glu(-Cys)]n-Gly의 2개 기질로 Gly 및 [Glu(-Cys)]n+1-Gly의 2개의 산물을 생성하는 효소이다. 담배 식물체 내에서는 세포 내의 금속 이온과 결합하여 저장 및 이동에 관여하는 단백질로서, 구체적으로 카드뮴, 아연 등을 포함한 중금속의 세포 내 원거리 이동에 관여할 것으로 예상되는 단백질이다.
상기 PCS 유전자는 실베스트리스 꽃담배 (Nicotiana sylvestris)로부터 유래된 PCS 유전자 (NtPCSs), 토멘토시포르미스 꽃담배 (Nicotiana tomentosiformis)로부터 유래된 PCS 유전자 (NtPCSt), 또는 이들의 조합(NtPCSst)일 수 있다.
상기 식물 세포는 PCS 유전자 또는 PCS 유전자에 의해 코딩되는 단백질의 발현 또는 활성이 감소되도록 유전적으로 조작되는 것일 수 있다. 본 명세서에서 용어 "유전적 조작 (genetic engineering)" 또는 "유전적으로 조작된 (genetically engineered)"은 세포에 대하여 하나 이상의 유전적 변형 (genetic modification)을 도입하는 행위 또는 그에 의하여 만들어진 세포를 의미할 수 있다.
상기 유전적 조작은 물리적인 방법에 의해 PCS 유전자의 염기 서열 내 변형으로 유도되는 것일 수 있다. 상기 물리적인 방법은 예를 들어, X-선 조사, 감마선 조사 등일 수 있다.
상기 유전적 조작은 화학적인 방법에 의해 PCS 유전자의 염기 서열 내 변형 또는 유전자의 발현의 변화로 유도되는 것일 수 있다. 상기 화학적 인 방법은 예를 들어, 에틸 메탄설포네이트(ethyl methanesulfonate) 처리, 다이메틸 설페이트(dimethyl sulfate) 처리 등일 수 있다.
상기 유전적 조작은 유전자 편집 시스템에 의해 PCS 유전자의 염기 서열 내 변형으로 유도되는 것일 수 있다. 상기 유전자 편집 시스템은 예를 들어, 메가뉴클레아제(Meganuclease) 시스템, 징크핑거 뉴클레아제(Zinc finger nuclease) 시스템, 탈렌(TALEN; Transcription Activator-Like Effector Nuclease) 시스템, CRISPR/Cas9 시스템 등일 수 있다. 예를 들어, 상기 유전적 조작은 RNA 간섭(RNAi; RNA interference) 시스템에 의해 PCS 유전자로부터 전사된 mRNA에 결합하여 유전자 발현의 변화로 유도되는 것일 수 있다.
일 구체예에 있어서, 상기 식물 세포는 CRISPR/Cas9 시스템에 의해 PCS 유전자 또는 PCS 유전자에 의해 코딩된 단백질의 발현 또는 활성을 감소시킬 수 있다.
용어 PCS 유전자 또는 PCS 유전자에 의해 코딩되는 단백질의 "발현 또는 활성이 감소" 또는 PCS 유전자의 "불활성화", PCS 단백질의 "발현 또는 활성이 감소" 또는 PCS 유전자의 "불활성화"된 유전적으로 조작된 식물 세포는 상기 PCS 유전자 또는 PCS 유전자에 의해 코딩되는 단백질이 비교 가능한 동일 종의 식물 세포 또는 그의 모세포에서 측정된 PCS 유전자 또는 PCS 유전자에 의해 코딩되는 단백질의 발현 또는 활성 수준보다 낮은 정도로 발현 또는 활성이 나타내거나 발현 또는 활성이 없는 것을 의미한다. 즉, 식물 세포에 있어서 PCS 유전자 또는 PCS 유전자에 의해 코딩되는 단백질의 발현 또는 활성이 본래 조작되지 않은 식물 세포의 발현 또는 활성보다 약 20% 이 상, 약 30% 이상, 약 40% 이상, 약 50% 이상, 약 55% 이상, 약 60% 이상, 약 70% 이상, 약 75% 이상, 약 80% 이상, 약 85% 이상, 약 90% 이상, 약 95% 이상, 또는 약 100% 감소된 것일 수 있다. PCS 유전자 또는 PCS 유전자에 의해 코딩되는 단백질의 발현 또는 활성이 감소된 유전적으로 조작된 식물 세포는 당업계에 공지된 임의의 방법을 사용하여 확인될 수 있다. 용어 "불활성화 (inactivation)"는 전혀 발현이 되지 않는 유전자 또는 발현이 되더라도 그 활성이 없는 단백질이 생성되는 것을 의미할 수 있다. 용어 "감소 (depression)"는 PCS 유전자가 조작되지 않은 식물 세포에 비하여 낮은 수준으로 발현되거나, 또는 PCS 유전자에 의해 코딩되는 단백질이 발현이 되더라도 그 활성이 낮은 것을 의미할 수 있다.
다른 양상은 상기 식물 세포를 포함하는 중금속 흡수량이 저감된 식물에 관한 것이다. 상기 식물 세포 등의 구체적인 내용은 전술한 바와 같다.
상기 식물은 재배담배(Nicotiana tabacum)일 수 있고, 구체적으로 황색종, 버어리종, 재래종, 흑담배 또는 오리엔트종일 수 있고, 보다 구체적으로는 버어리종 또는 황색종일 수 있다.
일 구체예에 있어서, 상기 식물은 PCS 유전자 또는 PCS 유전자에 의해 코딩되는 단백질의 발현 또는 활성을 감소시킨 식물 세포를 포함함으로써, 동일 세대뿐만 아니라 후 세대에서도 중금속 함량 또는 중금속 흡수량이 감소된 식물일 수 있고, 이에 따라 계속해서 중금속 저감화된 식물을 얻을 수 있다.
또 다른 양상은 식물체의 모세포에 비하여 PCS 유전자 또는 상기 PCS 유전자에 의해 코딩되는 단백질의 발현 또는 활성을 감소시키는 단계를 포함하는 식물체 내 중금속을 감소시키는 방법을 제공하는 것이다. 상기 모세포, PCS, 식물 세포, 발현 또는 활성의 감소 등의 구체적인 내용은 전술한 바와 같다.
상기 PCS 유전자 또는 PCS 단백질의 발현 또는 활성이 감소되는 것은 상기 PCS를 코딩하는 유전자의 일부 또는 전부가 변이, 치환, 삭제되거나 상기 유전자에 하나 이상의 염기가 삽입되는 것에 의한 것일 수 있으며, PCS 유전자 교정 수단에 의한 것일 수 있다.
상기 PCS 유전자 또는 PC 유전자에 의해 코딩되는 단백질의 발현 또는 활성을 감소시키는 단계에서 RNA 간섭(RNAi; RNA interference) 시스템, 메가뉴클레아제(Meganuclease) 시스템, 징크핑거 뉴클레아제(Zinc finger nuclease) 시스템, 탈렌(TALEN; Transcription Activator-Like Effector Nuclease) 시스템, CRISPR/Cas9 시스템, X-선 조사, 감마선 조사, 에틸 메탄설포네이트(ethyl methanesulfonate) 처리, 다이메틸 설페이트(dimethyl sulfate) 처리로 이루어진 군으로부터 선택되는 적어도 하나를 수행하는 것일 수 있다.
상기 PCS 유전자 또는 PCS 유전자에 의해 코딩된 단백질의 발현 또는 활성이 감소되도록 인위적으로 수행하는 유전자 조작은 PCS 유전자로부터 코딩되는 단백질이 본래의 기능을 갖는 단백질 형태로 발현되지 않도록 하는 것일 수 있다. 상기 유전자 조작은 다음 중 하나 이상에 의하여 유도된 것일 수 있다: 1) PCS 유전자의 전부 또는 일부 결실, 예컨대, PCS 유전자의 1bp 이상의 뉴클레오티드, 예컨대, 1 내지 30개, 1 내지 27개, 1 내지 25개, 1 내지 23개, 1 내지 20개, 1 내지 15개, 1 내지 10개, 1 내지 5개, 1 내지 3개, 또는 1개의 뉴클레오티드의 결실; 2) PCS 유전자의 1bp 이상의 뉴클레오티드, 예컨대, 1 내지 30개, 1 내지 27개, 1 내지 25개, 1 내지 23개, 1 내지 20개, 1 내지 15개, 1 내지 10개, 1 내지 5개, 1 내지 3개, 또는 1개의 뉴클레오티드의 원래(야생형)와 상이한 뉴클레오티드로의 치환; 3) 하나 이상의 뉴클레오티드, 예컨대, 1 내지 30개, 1 내지 27개, 1 내지 25개, 1 내지 23개, 1 내지 20개, 1 내지 15개, 1 내지 10개, 1 내지 5개, 1 내지 3개, 또는 1개의 뉴클레오티드 (각각 독립적으로 A, T, C 및 G 중에서 선택됨)의 타겟 유전자의 임의의 위치에의 삽입; 및 4) 상기 1) 내지 3) 중에서 선택된 2 가지 이상의 조합.
상기 PCS 유전자의 변형되는 일부 ('타겟 부위')는 상기 유전자 중의 1bp 이상, 3bp 이상, 5bp 이상, 7bp 이상, 10bp 이상, 12bp 이상, 15bp 이상, 17bp 이상, 20bp 이상, 예컨대, 1bp 내지 30bp, 3bp 내지 30bp, 5bp 내지 30bp, 7bp 내지 30bp, 10bp 내지 30bp, 12bp 내지 30bp, 15bp 내지 30bp, 17bp 내지 30bp, 20bp 내지 30bp, 1bp 내지 27bp, 3bp 내지 27bp, 5bp 내지 27bp, 7bp 내지 27bp, 10bp 내지 27bp, 12bp 내지 27bp, 15bp 내지 27bp, 17bp 내지 27bp, 20bp 내지 27bp, 1bp 내지 25bp, 3bp 내지 25bp, 5bp 내지 25bp, 7bp 내지 25bp, 10bp 내지 25bp, 12bp 내지 25bp, 15bp 내지 25bp, 17bp 내지 25bp, 20bp 내지 25bp, 1bp 내지 23bp, 3bp 내지 23bp, 5bp 내지 23bp, 7bp 내지 23bp, 10bp 내지 23bp, 12bp 내지 23bp, 15bp 내지 23bp, 17bp 내지 23bp, 20bp 내지 23bp, 1bp 내지 20bp, 3bp 내지 20bp, 5bp 내지 20bp, 7bp 내지 20bp, 10bp 내지 20bp, 12bp 내지 20bp, 15bp 내지 20bp, 17bp 내지 20bp, 21bp 내지 25bp, 18bp 내지 22bp, 또는 21bp 내지 23bp의 연속하는 염기 서열 부위일 수 있다.
또한, 일 예로, PCS 넉아웃 식물 세포를 제조하기 위하여 유전체 교정 기술로서 유전체 중 존재 비율이 매우 낮은 희귀 유전자 서열을 절단하는 희귀 절단 엔도뉴클레아제(rare-cutting endonuclease)를 포함하는 유전체 교정 시스템에 의하여 타겟된 유전자 내의 특정 부위의 단일가닥 또는 이중가닥 절단 (cleavage)을 촉매화하여 타겟된 유전자인 PCS 유전자를 발현을 감소시키는 것일 수 있다. 상기 희귀 절단 엔도뉴클라아제에 의하여 촉매되는 핵산가닥 손상 (breaks)은 상동 재조합 (homologous recombination) 또는 비상동 말단 연결 (NHEJ: non-homologous end joining) 등의 메커니즘들을 통하여 수선될 수 있다. 상기 희귀 절단 엔도뉴클레아제는 메가뉴클레아제(meganuclease), 징크핑거(Zinc finger) 뉴클레아제, CRISPR/Cas9 (Cas9 단백질), CRISPR-Cpf1 (Cpf1 단백질) 및 TALE-뉴클레아제로 이루어진 군에서 선택된 하나 이상일 수 있다.
상기 중금속은 카드뮴, 비소, 안티몬, 납, 수은, 크롬, 주석, 아연, 바륨, 비스무트, 니켈, 코발트, 망간, 철, 구리 및 바나듐으로 이루어진 군으로부터 선택된 하나 이상일 수 있다. 일 구체예에 있어서, PCS 유전자 또는 PCS 유전자에 의해 코딩된 단백질의 발현 또는 활성을 감소 시킴으로써, 식물체 내 카드뮴 함량 또는 카드뮴 흡수량을 감소시키는 것일 수 있다.
또 다른 양상은 PCS 유전자를 표적으로 하는 단일 가이드 RNA를 포함하는 크리스퍼-카스9 (CRISPR-Cas9) 재조합 벡터를 제공하는 것이다. 상기 PCS 유전자, 식물 세포 등의 구체적인 내용은 전술한 바와 같다.
본 명세서에서 사용되는 용어, "단일 가이드 RNA(sgRNA: single guide RNA)"는 "키메라 RNA", "키메라 가이드 RNA", "가이드 RNA", "단일 가이드 RNA(single guide RNA, sgRNA)" 및 "합성 가이드 RNA"는 상호 교환가능하게 사용될 수 있다. 가이드 서열, tracr 서열 및/또는 tracr 메이트 서열을 포함하는 폴리뉴클레오티드 서열을 지칭한다. 용어 "가이드 서열"은 표적 부위를 지정하는 가이드 RNA 내의 약 20bp 서열을 지칭하며, 용어 "가이드" 또는 "스페이서"와 상호교환가능하게 사용될 수 있다. 또한, 용어 "tracr 메이트 서열"은 용어 "직접 반복부 (들)"와 상호교환가능하게 사용될 수 있다. 상기 가이드 RNA는 두 개의 RNA, 즉, CRISPR RNA (crRNA) 및 트랜스 활성화 crRNA (transactivating crRNA, tracrRNA)로 이루어져 있는 것일 수 있으며, 또는 crRNA 및 tracrRNA의 부분을 포함하고 상기 표적 DNA와 혼성화하는 단일 사슬 RNA (single-chain RNA, sgRNA)일 수 있다.
상기 sgRNA가 표적으로 하는 PSC 유전자는 실베스트리스 꽃담배 (Nicotiana sylvestris)로부터 유래된 PCS 유전자 (NtPCSs), 또는 토멘토시포르미스 꽃담배 (Nicotiana tomentosiformis)로부터 유래된 PCS 유전자 (NtPCSt)일 수 있다.
상기 NtPCSs 유전자를 표적으로 하는 sgRNA는 서열번호 1 또는 서열번호 2의 염기서열로 이루어진 것일 수 있고, 상기 NtPCSt 유전자를 표적으로 하는 sgRNA는 서열번호 3 또는 서열번호 4의 염기서열로 이루어진 것일 수 있고, 상기 NtPCSs 유전자 및 NtPCSt 유전자 모두를 표적으로 하는 sgRNA는 서열번호 5 또는 서열번호 6의 염기서열로 이루어진 것일 수 있다.
일반적으로, 가이드 서열은 표적 서열과 혼성화하고, 표적 서열로의 CRISPR 복합체의 서열-특이적 결합을 유도하기에 충분한, 표적 폴리뉴클레오티드 서열과의 상보성을 갖는 임의의 폴리뉴클레오티드 서열이다. 또한 PCS 유전자 또는 PCS 유전자가 발현하는 단백질의 발현 또는 활성을 감소시키기 위한 유전자 조작에 이용할 수 있는 염기 서열이라면 제한 없이 가이드 RNA로 이용할 수 있으며, 예컨대 상기 염기 서열은 PCS 유전자와 혼성화할 수 있는 서열일 수 있다. 또한 상기 가이드 RNA의 기능을 변형/증진시키기 위하여 가이드 RNA 염기 서열의 일부분을 변형할 수 있다. 또한 일부 구현 예에서, 가이드 서열과 그의 상응하는 표적 서열 간의 상보성의 정도는 적절한 정렬 알고리즘을 사용하여 최적으로 정렬되는 경우, 약 50%, 60%, 75%, 80%, 85%, 90%, 95%, 97.5%, 99% 이상이다. 최적의 정렬은 서열을 정렬하기에 적절한 임의의 알고리즘의 사용으로 결정될 수 있으며, 그의 비제한적인 예는 스미스-워터만 (Smith-Waterman) 알고리즘, 니들만-분쉬 (Needleman-Wunsch) 알고리즘, 버로우즈-휠러 트랜스폼(Burrows-Wheeler Transform)에 기초한 알고리즘(예를 들어, 버로우즈 휠러 얼라이너(Burrows Wheeler Aligner)), ClustalW, Clustal X, BLAT, 노보얼라인(Novoalign)(노보크라 프트 테크놀로지즈(Novocraft Technologies), ELAND(일루미나(Illumina), 미국 캘 리포니아주 샌디에고), SOAP(soap.genomics.org.cn에서 이용가능) 및 Maq(maq.sourceforge.net에서 이용가능)를 포함한다.
일부 구현 예에서, 가이드 서열은 예컨대 약 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 75개 이상의 뉴클레오티드 길이일 수 있다. 일부 구현 예에서, 가이드 서열은 약 75, 50, 45, 40, 35, 30, 25, 20, 15, 12개 이하의 뉴클레오티드 길이일 수 있다. 표적 서열로의 CRISPR 복합체의 서열-특이적 결합을 유도하는 가이드 서열의 능력은 임의의 적절한 검정에 의해 평가될 수 있다. 예를 들어, 시험되는 가이드 서열을 포함하는 CRISPR 복합체를 형성하기에 충분한 CRISPR 시스템의 성분은 예를 들어, CRISPR 서열의 성분을 인코딩하는 벡터로의 트랜스펙션 후에, 예를 들어, 본원에 기술된 바와 같은 서베이어 검정에 의한 표적 서열 내의 우선적인 절단의 평가에 의해서와 같이, 상응하는 표적 서열을 갖는 숙주 세포로 제공될 수 있다. 유사하게, 표적 폴리뉴클레오티드 서열의 절단은 표적 서열, 시험되는 가이드 서열 및 시험 가이드 서열과 상이한 대조군 가이드 서열을 포함하는 CRISPR 복합체의 성분을 제공하고, 표적 서열에서 시험 및 대조군 가이드 서열 반응 간의 결합 또는 절단 비율을 비교함으로써 시험관에서 평가될 수 있다. 다른 검정이 가능하며, 당업자에게 용이하게 사용될 수 있을 것이다.
일 구체예에 있어서, sgRNA는 상기 식물 세포 내 적어도 하나의 대립유전자의 PCS 유전자에 결합되는 것일 수 있으며, 구체적으로 모든 대립유전자의 PCS 유전자에 결합되는 것일 수 있다. 모든 대립유전자의 PCS 유전자에 가이드 RNA가 결합하여 PCS 유전자를 넉아웃시키는 경우, 동일 세대 뿐만아니라 후 세대의 식물 세포에서도 중금속 흡수 및 이동이 억제될 수 있다.
일 구체예에 있어서, 상기 식물 세포에서 PCS 유전자를 넉아웃 시키기 위하여 사용한 타겟 시퀀스는 예컨대 PCS 유전자의 Exon 1 및 Exon 2 중 적어도 하나의 부위일 수 있다. 또한, 일 구체예에 있어서, 상기 식물 세포에서 PCS 유전자의 Exon 2를 표적으로 제작한 sgRNA가 돌연변이를 가장 많이 유발할 수 있음을 확인하였다.
일 구체예에 있어서, 상기 식물 세포는 sgRNA에 의해 PCS 유전자의 특정 타겟 부위가 절단되어 상기 유전자가 넉아웃된 식물 세포로서, 넉아웃에 의하면 식물 세포의 중금속 흡수 및 이동이 억제될 수 있다.
상기 유전자 넉아웃은 유전자의 전부 또는 일부 (예컨대, 하나 이상의 뉴클레오티드)의 결실, 치환, 및/또는 하나 이상의 뉴클레오티드의 삽입에 의한 유전자의 활성 조절, 예컨대, 불활성화를 의미하는 것일 수 있다. 상기 유전자 불활성화는 유전자의 발현 억제 또는 발현 감소 (downregulation) 또는 본래의 기능을 상실한 단백질을 코딩하도록 변형된 것을 의미한다. 또한 유전자 조절은 타겟 유전자의 하나 이상의 Exon을 둘러싸고 있는 양쪽 intron 부위를 동시에 타겟팅함으로 인한 Exon 부위의 결실로 인해 얻어지는 단백질의 구조 변형, Dominant negative 형태의 단백질 발현, soluble 형태로 분비되는 경쟁적 저해제 발현 등의 결과에 의한 유전자의 기능 변화를 의미하는 것일 수 있다.
본 명세서에서 사용되는 용어 "벡터(vector)"는 숙주 세포에서 목적 유전자를 발현시키기 위한 수단을 의미한다. 예를 들어, 플라스미드 벡터, 코즈미드 벡터 및 박테리오파아지 벡터, 아데노바이러스 벡터, 레트로바이러스 벡터 및 아데노-연관 바이러스 벡 터와 같은 바이러스 벡터를 포함한다. 상기 재조합 벡터로 사용될 수 있는 벡터는 당업계에서 종종 사용되는 플라스미드 (예를 들면, V1k_GE, pSC101, pGV1106, pACYC177, ColE1, pKT230, pME290, pBR322, pUC8/9, pUC6, pBD9, pHC79, pIJ61, pLAFR1, pHV14, pGEX 시리즈, pET 시리즈 및 pUC19 등), 파지 또는 바이러스 (예를 들면, SV40 등)를 조작하여 제작될 수 있다.
상기 벡터에서 상기 PCS 유전자에 결합하는 가이드 RNA를 코딩하는 유전자, 상기 Cas9 단백질을 코딩하는 유전자 및 상기 NLS를 코딩하는 유전자는 프로모터에 작동 가능하게 연결될 수 있다. 용어 "작동 가능하게 연결된(operatively linked)"은 뉴클레오타이드 발현 조절 서열(예를 들어, 프로모터 서열)과 다른 뉴클레오타이드 서열 사이의 기능적인 결합을 의미한다. 상기 조절 서열은 "작동 가능하게 연결(operatively linked)"됨으로써 다른 뉴클레오타이드 서열의 전사 및/또는 해독을 조절할 수 있다.
일 구체예에 있어서, 상기 벡터는 상기 PCS 유전자에 결합하는 가이드 RNA를 코딩하는 유전자의 5'-말단에 서열번호 43의 염기 서열로 이루어진 폴리뉴클레오티드 (P_U6)가 결합되어 있고, 3'-말단에 5개의 연속된 티민 (Thymine)이 결합되어 있는 경우, 불안정한 가이드 RNA가 안정화될 수 있다.
상기 벡터는, 전형적으로 클로닝을 위한 벡터 또는 발현을 위한 벡터로서 구축될 수 있다. 상기 발현용 벡터는 당업계에서 식물, 동물 또는 미생물에서 외래의 단백질을 발현하는 데 사용되는 통상의 것을 사용할 수 있다. 상기 벡터는 당업계에 공지된 다양한 방법을 통해 구축될 수 있다.
상기 벡터는 원핵 세포 또는 진핵 세포를 숙주로 하여 구축될 수 있다. 예를 들어, 사용되는 벡터가 발현 벡터이고, 원핵 세포를 숙주로 하는 경우에는, 전사를 진행시킬 수 있는 강력한 프로모터(예를 들어, CMV 프로모터, trp 프로모터, lac 프로모터, tac 프로모터, T7 프로모터 등), 해독의 개시를 위한 라이보 좀 결합 자리 및 전사/해독 종결 서열을 포함하는 것이 일반적이다. 진핵 세포를 숙주로 하는 경우에는, 벡터에 포함되는 진핵 세포에서 작동하는 복제원점은 f1 복제원점, SV40 복제원점, pMB1 복제원점, 아데노 복제원점, AAV 복제원점 및 BBV 복제원점 등을 포함하나, 이에 한정되는 것은 아니다. 또한, 포유동물 세포의 게놈으로부터 유래된 프로모터(예를 들어, 메탈로티오닌 프로모터) 또는 포유동물 바이러스로부터 유래된 프로모터(예를 들어, 아데노바이러스 후기 프로모터, 백시니아 바이러스 7.5K 프로모터, SV40 프로모터, 사이토메갈로바이러스 프로모터 및 HSV의 tk프로모터)가 이용될 수 있으며, 전사 종결 서열로서 폴리아데닐화 서열을 일반적으로 갖는다.
본 명세서에서 사용되는 용어, "CRISPR/Cas9 시스템"은 crRNA(CRISPR RNA) 및 tracrRNA(transactivating crRNA)를 포함하는 sgRNA(single guide RNA)를 포함할 수 있다. 또한, 상기 CRISPR/Cas9 시스템은 Cas9(CRISPR associated protein 9) 단백질 또는 Cas9 단백질을 코딩하는 유전자 및 NLS(Nuclear Localization Signal) 단백질 또는 NLS 단백질을 코딩하는 유전자를 포함할 수 있다.
일반적으로, 널리 알려진 유전자 교정 수단인 "CRISPR(Clustered Regularly Interspaced Short Palindromic Repeats) 시스템"은 집합적으로 Cas 유전자를 코딩하는 서열, tracr(트랜스-활성화 CRISPR) 서열(예를 들어, tracrRNA 또는 활성 부분 tracrRNA), tracr-메이트 서열(내인성 CRISPR 시스템의 맥락에서 "직접 반복부" 및 tracrRNA-가공 부분 직접 반복부 포함), 가이드 서열(내인성 CRISPR 시스템의 맥락에서 "스페이서"로도 지칭), 가이드 RNA 또는 CRISPR 유전자좌로부터의 기타 서열 및 전사물을 포함하는 CRISPR-관련(CRISPR-associated; 이하 Cas) 유전자의 발현에 수반되거나, 그의 활성을 유도하는 전사물 및 다른 요소를 지칭한다. 일부 구현 예에서, CRISPR 시스템의 하나 이상의 요소는 I형, II형 또는 III형 CRISPR 시스템으로부터 유래된다. 일부 구현 예에서, CRISPR 시스템의 하나 이상의 요소는 내인성 CRISPR 시스템을 포함하는 특정 유기체, 예를 들어, 스트렙토코커스 피요게네스(Streptococcus pyogenes)로부터 유래된다. 일반적으로, CRISPR 시스템은 표적 서열의 부위에서 CRISPR 복합체의 형성을 증진시키는 요소 (내인성 CRISPR 시스템의 맥락에서 프로토스페이서로도 지칭)를 특징으로 한다. CRISPR 복합체의 형성의 맥락에서, "표적 서열" 또는 "표적 유전자"는 가이드 서열 이 상보성을 갖도록 설계된 서열을 지칭하며, 여기서, 표적 서열과 가이드 서열 간의 혼성화는 CRISPR 복합체의 형성을 증진시킨다. 본질적으로 완전한 상보성이 필요하지 않지만, 혼성화를 야기하고, CRISPR 복합체의 형성을 증진시키는 충분한 상보성이 존재한다. 표적 서열은 임의의 폴리뉴클레오티드, 예를 들어, DNA 또는 RNA 폴리뉴클레오티드를 포함할 수 있다. 일부 구현 예에서, 표적 서열은 세포의 핵 또는 세포질 내에 위치한다. 일부 구현 예에서, 표적 서열은 진핵 세포의 세포기관, 예를 들어, 미토콘드리아 또는 엽록체 내에 존재할 수 있다.
상기 Cas 단백질은 CRISPR RNA(crRNA) 및 트랜스-활성화 crRNA(trans-activating crRNA, tracrRNA)로 불리는 두 RNA와 복합체를 형성할 때, 활성 엔도뉴클레아제 또는 니카아제(nickase)를 형성한다. 상기 Cas 단백질의 비제한적인 예는 Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9(Csn1 및 Csx12로도 알려짐), Cas10, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4, 그의 상동체 또는 그의 변형된 버전을 포함한다. 이들 효소가 알려져 있으며; 예를 들어, 스트렙토코커스 피오게네스 Cas9 단백질의 아미노산 서열은 수탁 번호 Q99ZW2 하에 스위스프로트(SwissProt) 데이터베이스에서 얻을 수 있다. 일부 구현 예에서, 비변형 CRISPR 효소, 예를 들어, Cas9는 DNA 절단 활성을 갖는다.
일부 구현 예에서, CRISPR 효소는 Cas9 단백질이며, 상기 Cas9 단백질은 스트렙토코커스 피요게네스 (Streptococcus pyogenes) 유래 Cas9 단백질, 캄필 로박터 제주니 (Campylobacter jejuni) 유래 Cas9 단백질, 스트렙토코커스 써모필러스 (Streptococcus thermophiles) 유래 Cas9 단백질, 스트렙토코커스 아우레우스 (Streptocuccus aureus) 유래 Cas9 단백질 및 네이세리아 메닝기디티스 (Neisseria meningitidis) 유래 Cas9 단백질로 이루어진 군에서 선택되는 적어도 하나의 Cas9 단백질일 수 있고, 구체적으로 스트렙토코커스 피요게네스 (Streptococcus pyogenes) 유래 Cas9 단백질일 수 있다. 일부 구현 예에서, Cas9 단백질은 진핵 세포에서의 발현을 위해 코돈-최적화되며, 상기 스트렙토코커스 피요게네스 (Streptococcus pyogenes) 유래 Cas9 단백질을 사용하는 경우, PCS 유전자 또는 PCS 유전자가 발현하는 단백질의 발현 또는 활성이 최대로 감소될 수 있다.
일부 구현 예에서, Cas9 단백질은 진핵 세포 내의 핵 내에 위치하기 위하여 Cas9 단백질의 5'- 또는 3'-, 또는 양 말단 부분에 NLS(nuclear localization sequence or signal)를 포함하는 것일 수 있으며, 상기 NLS는 하나 또는 그 이상일 수 있다.
본 명세서에서 사용되는 용어, “핵 위치화 서열 또는 신호(Nuclear localization sequence or signal, NLS)"는 특정물질(예컨대, 단백질)을 세포 핵 내로 운반하는 역할을 하는 아미노산 서열을 의미하며, 대체적으로 핵공(Nuclear Pore)을 통하여 세포 핵 내로 운반하는 작용을 한다. 상기 핵 위치화 서열은 진핵생물에서 CRISPR 복합체 활성에 필요하지 않지만, 이러한 서열을 포함하여, 시스템의 활성을 증진시켜, 특히 핵 내의 핵산 분자를 표적화하는 것으로 여겨진다.
또한 RNA 유전자 가위(RNA-guided CRISPR)(clustered regularly interspaced short palindrome repeats)-연관된 뉴클레아제 Cas9는 표적 유전자의 넉아웃, 전사 활성화 및 single guide RNA(sgRNA)(즉, crRNA-tracrRNA 융합 전사체)를 이용한 억제에 대한 획기적인 기술을 제공하며, 이 기술은 수많은 유전자 위치를 타겟팅하는 것으로 알려져 있다.
Cas9 (또는 Cpf1) 단백질은 CRISPR/Cas9 시스템에서 필수적인 단백질 요소를 의미하고, 상기 Cas9 (또는 Cpf1) 유전자 및 단백질의 정보는 국립생명공학정보센터(national center for biotechnology information, NCBI)의 GenBank에서 구할 수 있으나, 이에 제한되지 않는다. Cas (또는 Cpf1)단백질을 암호화하는 CRISPR-연관 유전자는 약 40 개 이상의 서로 다른 Cas (또는 Cpf1) 단백질 패밀리가 존재하는 것으로 알려져 있으며, cas 유전자 및 반복 구조(repeat structure)의 특정 조합에 따라 8개의 CRISPR 하위 유형 (Ecoli, Ypest, Nmeni, Dvulg, Tneap, Hmari, Apern, 및 Mtube)을 정의할 수 있다. 따라서 상기 각 CRISPR 하위 유형이 반복단위를 이루어 폴리리보뉴클레오티드-단백질 복합체를 형성할 수 있다.
상기 Cas9가 DNA로 암호화되어 개체 또는 세포로 전달되는 경우, 상기 DNA는 일반적으로 (그러나 필수적이지는 않음) 타겟 세포에서 작동 가능한 조절 요소 (예컨대, 프로모터)를 포함할 수 있다. 상기 Cas9 발현을 위한 프로모터는, 예컨대, CMV, EF-l a, EFS, MSCV, PGK, 또는 CAG 프로모터일 수 있다. gRNA 발현을 위한 프로모터는, 예컨대, HI, EF-la, tRNA 또는 U6 프로모터일 수 있다. 상기 프로모터는 조직 특이성 또는 세포 특이성을 갖는 것일 수 있다.
또 다른 양상은 PCS 유전자를 표적으로 하는 단일 가이드 RNA를 포함하는 크리스퍼-카스9 (CRISPR-Cas9) 재조합 벡터로 식물 세포를 형질전환시키는 단계를 포함하는 중금속 흡수량이 저감된 식물체를 제조하는 방법을 제공하는 것이다. 상기 PCS 유전자, 단일 가이드 RNA, 크리스퍼-카스9 시스템, 벡터, 식물 세포 등의 구체적인 내용은 전술한 바와 같다.
상기 형질전환시키는 단계에 있어서, 당업계에 주지된 형질전환 방법으로서 담배의 유전자의 형질전환이 가능한 방법이라면 특별히 제한되지 않는다. 예를 들어, 아그로박테리움-매개 형질전환법, 폴리에틸렌글리콜(Polyethylene glycol; PEG)-매개 프로토플라스트 형질전환법, 유전자총법, 전극(electrode) 형질전환법, 진공 침윤(Vacuum infiltration) 형질전환법 및 탄화규소 섬유-매개 형질전환법으로 이루어진 군에서 선택된 하나에 의해 수행되는 것일 수 있다.
일 구체예에 있어서, 담배의 특성 및 형질전환율 등을 고려할 때 아그로박테리움-매개 형질전환법 (Agrobacterium-mediated transformation)을 통해 PCS 유전자를 표적으로 하는 단일 가이드 RNA를 포함한 재조합 벡터를 식물 세포에 형질전환시킨 것일 수 있다.
일 양상에 따른 PCS (Phytochelatin synthase) 유전자 또는 상기 PCS 유전자에 의해 코딩되는 단백질의 발현 또는 활성이 감소된 식물 세포는 식물 세포 내의 중금속 이온과 결합하여 중금속 흡수, 저장 또는 이동시키는 경로가 저해되어, 식물 세포 또는 이를 포함하는 식물 내의 중금속 함량 또는 흡수량을 감소시킬 수 있는 효과가 있다.
다른 양상에 따른 PCS 유전자 또는 상기 PCS 유전자에 의해 코딩되는 단백질의 발현 또는 활성이 감소된 식물 세포는 기존의 중금속 저감 식물체의 한계점인 생육 저해 현상을 해결할 수 있다.
도 1은 공개된 레퍼런스 염기서열과 KB108의 NtHMA 유전자 염기서열의 일부를 정렬한 모습을 나타낸 도면이다. 구체적으로, (A) NtHMAα 유전자 내 exon 2 부위를 비교한 결과를 나타낸 도면 (gRNA_A4_e2: NtHMAα 유전자에 특이적인 부분으로 sgRNA가 결합하도록 디자인한 부위) 및 (B) NtHMAβ 유전자 내 exon 2 부위를 비교한 결과를 나타낸 도면 (gRNA_B4_e2: NtHMAβ 유전자에 특이적인 부분으로 sgRNA가 결합하도록 디자인한 부위)이다.
도 2는 sgRNA 2개가 포함된 유전자 가위 발현 운반체의 구조를 나타낸 도면이다.
도 3은 아그로박테리움 매개된 형질전환 방법으로 형질전환시킨 후 식물 조직 배양의 단계별 사진을 나타낸 도면이다. 구체적으로, (A) 잎 조직을 잘라 아그로박테리움과 함께 배양하여 형질전환시키는 단계, (B) 캘러스 분화 및 shoot 분화를 유도하는 단계, (C) root 분화를 유도하는 단계, (D) 분화가 완료된 소식물체 상태를 나타낸 도면이다.
도 4는 돌연변이 여부 및 양상을 확인하기 위하여 조직 배양체 24 개체의 gDNA를 대상으로 각 목표 유전자 부위를 증폭하여 전기영동한 결과를 나타낸 도면이다 (Lane M: 1kb DNA marker, lane 1~7: NtHMAα 부위 증폭 결과, lane 9~15: NtHMAβ 부위 증폭 결과, lane 17~21: NtPCSs 부위 증폭 결과, lane 23~27: NtPCSt 부위 증폭 결과, lane 8, 16, 22, 28: NTC (Non-template control))
도 5는 야생형 (wild type) KB108와 돌연변이체의 NtHMAβ 부위 염기서열 분석 결과를 나타낸 도면이다. 구체적으로, (A) KB108 염기서열 (B) 돌연변이체의 염기서열의 분석 결과를 나타낸 도면으로, 야생형 염기서열에 비해 아데닌 염기가 삽입된 부분을 빨간색 화살표로 표시하였음
도 6은 F1 식물체 내 도입 유전자 유전 여부를 확인하기 위한 유전자 증폭 반응 수행 후 전기영동 결과를 나타낸 도면이다.
도 7은 양액 재배시설에서 수행한 1차 및 2차 카드뮴 함량 분석 결과를 종합하여 대조군의 카드뮴 함량을 기준으로 한 상대값을 나타낸 그래프이다.
도 8은 온실 토양 환경에서 재배한 식물체의 카드뮴 함량을 분석한 결과이다.
도 9는 대조군 KB108 대비 NtHMAαβ 돌연변이체와 NtPCSst 돌연변이체의 생육 특성을 비교한 그래프이다 (Height: 식물체의 높이, # of leaves: 잎의 수, Weight: 잎의 중량).
도 10은 대조군 KB108 대비 NtHMAαβ 돌연변이체와 NtPCSst 돌연변이체의 생육 상태를 육안으로 비교한 사진이다.
도 2는 sgRNA 2개가 포함된 유전자 가위 발현 운반체의 구조를 나타낸 도면이다.
도 3은 아그로박테리움 매개된 형질전환 방법으로 형질전환시킨 후 식물 조직 배양의 단계별 사진을 나타낸 도면이다. 구체적으로, (A) 잎 조직을 잘라 아그로박테리움과 함께 배양하여 형질전환시키는 단계, (B) 캘러스 분화 및 shoot 분화를 유도하는 단계, (C) root 분화를 유도하는 단계, (D) 분화가 완료된 소식물체 상태를 나타낸 도면이다.
도 4는 돌연변이 여부 및 양상을 확인하기 위하여 조직 배양체 24 개체의 gDNA를 대상으로 각 목표 유전자 부위를 증폭하여 전기영동한 결과를 나타낸 도면이다 (Lane M: 1kb DNA marker, lane 1~7: NtHMAα 부위 증폭 결과, lane 9~15: NtHMAβ 부위 증폭 결과, lane 17~21: NtPCSs 부위 증폭 결과, lane 23~27: NtPCSt 부위 증폭 결과, lane 8, 16, 22, 28: NTC (Non-template control))
도 5는 야생형 (wild type) KB108와 돌연변이체의 NtHMAβ 부위 염기서열 분석 결과를 나타낸 도면이다. 구체적으로, (A) KB108 염기서열 (B) 돌연변이체의 염기서열의 분석 결과를 나타낸 도면으로, 야생형 염기서열에 비해 아데닌 염기가 삽입된 부분을 빨간색 화살표로 표시하였음
도 6은 F1 식물체 내 도입 유전자 유전 여부를 확인하기 위한 유전자 증폭 반응 수행 후 전기영동 결과를 나타낸 도면이다.
도 7은 양액 재배시설에서 수행한 1차 및 2차 카드뮴 함량 분석 결과를 종합하여 대조군의 카드뮴 함량을 기준으로 한 상대값을 나타낸 그래프이다.
도 8은 온실 토양 환경에서 재배한 식물체의 카드뮴 함량을 분석한 결과이다.
도 9는 대조군 KB108 대비 NtHMAαβ 돌연변이체와 NtPCSst 돌연변이체의 생육 특성을 비교한 그래프이다 (Height: 식물체의 높이, # of leaves: 잎의 수, Weight: 잎의 중량).
도 10은 대조군 KB108 대비 NtHMAαβ 돌연변이체와 NtPCSst 돌연변이체의 생육 상태를 육안으로 비교한 사진이다.
이하 실시예를 통하여 보다 상세하게 설명한다. 그러나, 이들 실시예는 예시적으로 설명하기 위한 것으로 본 발명의 범위가 이들 실시예에 한정되는 것은 아니다.
실시예 1. NtPCS 유전자를 타겟으로 한 CRISPR/Cas9 시스템을 이용한 카드뮴 저감 담배 생산
(1) 유전자 운반체 제작
(1.1) 중금속 관련 유전자 (NtHMA 및 NtPCS) 염기 서열 확인
뿌리에 흡수된 2가 금속 이온을 다른 조직으로 이동시킬 때 열리고 닫히는 관문 역할을 하는 단백질을 코딩하는 유전자인 NtHMAα 및 NtHMAβ; 및 세포 내의 금속 이온과 결합하여 금속 이온의 저장과 이동에 관여하는 단백질을 코딩하는 유전자인 NtPCS를 포함하는, 담배에서 카드뮴 흡수 및 이동에 관련된 2종의 유전자를 선정하였다.
연구 대상 식물체인 버어리(burley)종 담배 (KB108) 내 NtHMA 및 NtPCS 유전자 염기서열을 확인하기 위해, NCBI (National Center for Biotechnology Information) 데이터베이스에 공개된 염기 서열 정보를 바탕으로 각 유전자에 특이적인 프라이머를 제작하고, 유전자 증폭 반응 (PCR: Polymerase Chain Reaction)을 수행하였다. 각 유전자에 특이적인 프라이머의 서열 및 PCR 조건은 하기 표 1에 나타내었다.
프라이머 명칭 | 염기서열 (5'→3') | 증폭크기(bp) | PCR 조건 | 서열번호 | ||
Anealing Tmp | Extention time | Cycles | ||||
F_HMAα | GAAACAAAGAAGTTGAGCAAGAGCTATT | 2937 | 62 ℃ | 90 sec | 35 | 7 |
R_HMAα | AGCCTTAGTGAGATGATTTATAACACAA | 8 | ||||
F_HMAβ | GACACAAAGAATCTGAGCAAGAGCTATT | 2374 | 62 ℃ | 90 sec | 35 | 9 |
R_HMAβ | AGCTAGAGTAGGACCACACATTAATTCT | 10 | ||||
F_PCSs | AAATGGCGATGGCGGGTTTGTAT | 927 | 68 ℃ | 90 sec | 35 | 11 |
R_PCSs | GTCGGGAAGGATTAGAACACAAATTCAC | 12 | ||||
F_PCSt | AATGGCGATGGCGGGTTTATATC | 2731 | 68 ℃ | 90 sec | 35 | 13 |
R_PCSt | AGTCCGGAAGGATAGGAACACAGATT | 14 |
도 1에 나타낸 바와 같이, KB108 품종의 gDNA 영역을 증폭하여 염기 서열을 분석한 결과 공개된 염기서열과 대부분 일치하였다. 구체적으로, 공개된 레퍼런스 염기서열들 (Database accession No. HF675180.1, HF937054.1)과 KB108의 NtHMA 유전자 염기서열의 일부를 정렬하여 비교한 결과, NtHMAα 유전자 (A) 및 NtHMAβ 유전자 (B) 내 exon 2 부위를 각각 비교한 결과 대부분 일치함을 확인하였고, 각각의 유전자에 특이적인 부분으로 sgRNA가 결합하도록 디자인한 부위를 나타내었다.
KB108 품종의 NtPCSs 유전자 (단, 일부 서열), N. tabacum (TN90) 레퍼런스 지놈 염기서열 및 N. sylvestris 레퍼런스 지놈 염기서열 데이터의 상동성을 확인한 결과를 하기 표 2에, KB108 품종의 NtPCSt 유전자를 N. tabacum (TN90) 레퍼런스 지놈 염기서열 및 N. tometosiformis 레퍼런스 지놈 염기서열 데이터의 상동성을 확인한 결과를 하기 표 3에 나타내었다.
PCSs 유전자 상동성 비교 | PCSs_KB108 (KT&G) |
PCSs_TN90 (NW_015845165.1) |
PCSs_Nsyl (NW_009518934.1) |
PCSs_KB108(KT&G) | ID | 1.000 | 1.000 |
PCSs_TN90(NW_015845165.1) | 1.000 | ID | 1.000 |
PCSs_Nsyl(NW_009518934.1) | 1.000 | 1.000 | ID |
PCSt 유전자 상동성 비교 | PCSt_KB108 (KT&G) |
PCSt_TN90 (NW_015825368.1) |
PCSt_Ntom (NW_008939610.1) |
PCSt_KB108(KT&G) | ID | 1.000 | 0.986 |
PCSt_TN90(NW_015825368.1) | 1.000 | ID | 0.986 |
PCSt_Ntom(NW_008939610.1) | 0.986 | 0.986 | ID |
실베스트리스 꽃담배 (Nicotiana sylvestris)로부터 유래된 NtPCSs 유전자 및 토멘토시포르미스 꽃담배 (Nicotiana tomentosiformis)로부터 유래된 NtPCSt 유전자의 염기서열을 N. tabacum (TN90) 레퍼런스 지놈 염기서열과 비교한 결과 상기 표 2 및 3에서 확인한 바와 같이, 100% 일치함을 확인하였다. 또한, NtPCSs 유전자 (단, 일부 서열)는 N. sylvestris 레퍼런스 지놈 데이터와 100% 일치하고, NtPCSt 유전자는 N. tometosiformis 레퍼런스 지놈 데이터와는 약 98.6% 일치함을 확인하였다.
(1.2) 유전자 가위 블록 디자인 및 운반체 재조합
상기 실시예 1-(1)에서 확보된 NtHMAα, NtHMAβ, NtPCSs 및 NtPCSt 유전자의 염기 서열을 비교하여 각각의 유전자에 특이적인 부분을 유전자 가위 인솔자 (sgRNA)로 선정하였다. 식물에서 발현되는 유전자 운반체에 선정된 유전자 가위 발현 블록을 클로닝하여 총 5종의 재조합 운반체를 완성하였다.
NtHMAα 및 NtHMAβ 유전자에 특이적으로 결합할 수 있는 6개의 sgRNA를 각각 포함한 유전자 운반체 정보는 하기 표 4에 나타내었다.
벡터 | sgRNA | 표적 | 위치 | 서열 | 서열번호 |
Vlk_HMA_A6 | gRNA_A1 | HMAα | Exon 1 | TCTTTCTTACCAATTTGTTG | 15 |
gRNA_A2 | Intron 1 | TGTTTGTACAAGCTTTTAGA | 16 | ||
gRNA_A3 | Intron 1 | ATGGTAACTTCAATAATTATA | 17 | ||
gRNA_A4 | Exon 2 | AAGCAAGCATAAGAGTGAA | 18 | ||
gRNA_A5 | Exon 2 | CCACACCTCTAAAAATAAT | 19 | ||
gRNA_A6 | Intron 2 | TCATATAAATTGGGACAAA | 20 | ||
Vlk_HMA_B6 | gRNA_B1 | HMAβ | Exon 1 | CAATTTGTTGCTGAGAAATG | 21 |
gRNA_B2 | Intron 1 | AGTGGAGAAAAGATGAAGAA | 22 | ||
gRNA_B3 | Intron 1 | ATGGTAACTACAATAATTATA | 23 | ||
gRNA_B4 | Exon 2 | AAGCAAGTATAAGAGTGAA | 24 | ||
gRNA_B5 | Exon 2 | GATTCCTCCAATTATTTTT | 25 | ||
gRNA_B6 | Exon 2 | CCACACCCCTAAAAATAAT | 26 |
NtPCSs 및 NtPCSt 유전자에 특이적으로 결합할 수 있는 2개의 sgRNA를 각각 포함한 유전자 운반체 정보는 하기 표 5에 나타내었다.
벡터 | sgRNA | 표적 | 위치 | 서열 | 서열번호 |
Vlk_PCS_S | gRNA_S1 | PCSs | Exon 1 | AAGCGAAATCAACAGCCGGAG | 1 |
gRNA_S2 | Exon 2 | GGCATTCAAGACCATGGAA | 2 | ||
Vlk_PCS_T | gRNA_T1 | PCSt | Exon 1 | CGAGTTCTTCCGTCGCCTC | 3 |
gRNA_T2 | Exon 2 | GGCATTCAAGACCATAGAA | 4 | ||
Vlk_PCS_ST | gRNA_ST1 | PCSs PCSt |
Exon 1 | TAGAAGCGAAATCAACAGC | 5 |
gRNA_ST2 | Exon 2 | GCCATCCAGAATGGAACAA | 6 |
구체적으로, pBI121은 E. coli와 agrobacterium에서 복제 가능한 binary vector이며 식물 형질전환에 널리 쓰이고 있는 벡터로서, pBI121을 HindIII와 EcoRI으로 절단하여 CRISPR/Cas9 시스템에 필요한 GE_block을 클로닝할 수 있도록 준비하였다. GE_block은 차례대로 CaMV 35S promoter with dual enhancer (P_35Sd), Cas9 블록을 클로닝하기 위한 multi cloning site (MCS), CaMV 35S terminator (T_35S), linker sequence, 그리고 sgRNA 블록을 클로닝하기 위한 multi cloning site (MCS)로 구성되어 있으며 양 끝에는 HindIII와 EcoRI의 인식 염기서열이 추가되어 있다. GE_block의 각 블록들은 DNA 합성으로 준비되었으며 순차적으로 클로닝하여 완성하였다. HindIII와 EcoRI으로 절단된 pBI121과 GE_block을 ligation하여 재조합 운반체 (V1k_GE)를 제작하였다. CRISPR/Cas9_block은 Cas9 coding sequence (CDS), C-terminus nuclear localization sequence (NLS)로 구성되고, 양 말단에는 BamHI과 SacI 인식 염기서열이 추가된 블록 (Cas9_block); 및 sgRNA가 발현될 수 있는 블록(sgRNA_PMT)으로서 U6 promoter(P_U6, 서열번호 43)와 sgRNA, 그리고 poly T로 구성된 블록;으로 이루어져 있다. NtPCS 유전자 (NtPCSs 및/또는 NtPCSt 유전자)에 특이적으로 결합할 수 있는 2 종류의 sgRNA 블록을 overlap extension PCR 기법을 통해 하나의 연속된 DNA로 연결하여 sgRNA_PMT를 완성하였다. sgRNA_PMT의 양 끝에는 SalI, SpeI의 인식 염기서열이 존재한다.
도 2에 나타낸 바와 같이, BamHI과 SacI으로 절단된 V1k_GE와 CRISPR/Cas9_block을 ligation 반응을 통해 이어 붙인 후, SalI과 SpeI으로 절단하여 sgRNA_PMT를 삽입하여 유전자 운반체를 제작하였다.
(2) 유전자 전달 미생물 (Agrobacterium) 내 재조합 운반체 도입
동결-해동법 (Freeze-thaw method)으로 식물용 운반체를 아그로박테리움 LBA4404 균주에 형질전환시켰다.
구체적으로, 상기 아그로박테리움 균주를 YEP 액체 배지 (효모 추출물 10 g, Bacto™ peptone 10 g, NacCl 5 g)에 접종한 후, 16시간 동안 28℃, 250 rpm 조건으로 진탕 배양하였다. 배양액을 3,000 g의 속도 및 4℃ 조건으로 20분간 원심분리하여 세포를 분리하고, 20 mM CaCl2에 부유시켜서 수용성 세포 (competent cell)를 만들었다. 수용성 세포 100 μL에 플라스미드 DNA (식물용 운반체) 5 μL를 첨가한 후, 액체 질소에서 5분간, 37℃ 온도에서 5분간 배양하였다. YEP 액체배지 1 mL를 첨가하여 28℃, 250 rpm 조건으로 2시간 동안 진탕 배양하였다. 100 μL 배양액을 카나마이신 100 mg/L가 포함된 YEP 고체배지에 spreading 한 후, 28℃ 온도에서 3일 동안 배양하였다. 단일 콜로니들을 각각 계대배양한 후, 플라스미드 DNA가 형질전환되었는지 PCR을 통해 확인하였다.
(3) 식물 조직배양
(3.1) 식물 형질전환
상기 실시예 1-(2)에서 유전자 운반체의 형질전환이 확인된 아그로박테리움 균주를 YEP 액체 배지 (70 mg/L 카나마이신, 70 mg/L 스트렙토마이신 포함)에서 28℃ 조건에서 24시간 동안 배양하였다. 또한, 발아된지 1달된 식물체의 잎을 70% 에탄올과 락스로 멸균한 후, 3 mm X 3 mm 크기의 절편으로 자르고, MS 액체 배지가 5 ml 담겨 있는 페트리 디쉬에 절편을 올려 놓은 뒤, 아그로박테리움 균주 배양액 1 mL을 골고루 뿌려줌으로써 담배 잎 절편을 준비하였다. 이후 25℃, 암 조건에서 48 시간 동안 배양시켰다.
(3.2) 식물 조직배양
잎 절편을 멸균 증류수(200 ug/ml 세포탁심 (cefotaxim) 포함)에 4 회 세척한 후, shooting 배지(MS 배지, 2 mg/L BA, 0.1 mg/L NAA, 200 mg/L 세포탁심, 100 mg/L 카나마이신 포함)에 치상하여 25℃, 16시간/8시간 광주기 조건에서 배양하며, 2주 마다 새로운 배지로 계대배양함으로써 세척 및 선별 배지 치상을 수행하였다.
또한, 잎 절편에서 분화된 shoot을 절단하여 rooting 배지(MS 배지, 200 mg/L 세포탁심 포함)에 치상하여 25℃, 16시간/8시간 광주기 조건에서 배양함으로써 Rooting 배지 치상을 수행하였다.
그 결과, 도 3에 나타낸 바와 같이, 아그로박테리움 균주가 매개된 형질전환 (Agrobacterium mediated transformation) 방법으로 담배 잎 조직에 형질전환 시킨 후, 캘러스 분화, 잎 분화, 뿌리 분화가 차례로 잘 이루어졌음을 확인하였다. 조직배양을 통해 잎, 줄기, 뿌리를 갖춘 조직배양 소식물체 102 개체를 확보하였다.
(4) 돌연변이체 선별
(4.1) 목표 유전자 내 돌연변이 발생 여부 및 양상 확인
상기 실시예 1-(3)에서 확보된 조직 배양체의 잎 일부를 채취하여 gDNA를 추출한 후, 각 목표 유전자 부위를 PCR 반응을 통해 증폭하였다. 증폭된 유전자 산물에 대해 염기서열을 분석하여 NtHMA 유전자에 돌연변이가 발생한 조직배양체 50개와 NtPCS 유전자에 돌연변이가 일어난 조직배양체 60개를 선별하였다.
구체적으로, 건강한 잎 조직 100 mg을 샘플링하여 균일하게 분쇄한 후, silica column을 이용하는 상용화 키트 (예: Nucleospin 96 plant II, Macherey Nagel, 독일)를 이용하여 gDNA를 추출 및 정제하였다. 돌연변이 여부 및 양상을 확인하기 위하여 조직 배양체 24개체의 gDNA를 대상으로 각 목표 유전자 부위를 증폭하여 전기영동한 결과를 도 4에 나타내었다.
또한, 잎 조직에서 gDNA를 추출/정제한 후, PCR을 통해 목표 유전자 부위를 증폭하여 염기 서열 분석을 수행한 예시를 도 5에 나타내었다. 도 5에 나타낸 바와 같이, 야생형 KB108과 돌연변이체의 NtHMAβ 부위의 염기서열 분석 결과, 야생형 염기서열에 비해 아데닌 염기가 삽입된 돌연변이체임을 확인하였다.
NtHMA 유전자에 돌연변이가 일어난 패턴을 위치별로 분류해본 결과, 하기 표 6에 나타낸 바와 같이, exon 2를 표적으로 제작한 gRNA_HMA_A4 및 gRNA_HMA_B4의 위치에서 돌연변이 발생률이 44% 내지 48%로, NtHMA 유전자의 exon 2 위치에서 돌연변이가 가장 많이 일어나는 것으로 확인하였다.
표적 | 위치 | 돌연변이 수 | 조직배양체 수 | 돌연변이 발생율 (%) | |
gRNA_HMA_A1 | HMAα | Exon 1 | 1 | 25 | 4 |
gRNA_HMA_A2 | Intron 1 | 3 | 12 | ||
gRNA_HMA_A3 | Intron 1 | 0 | 0 | ||
gRNA_HMA_A4 | Exon 2 | 12 | 48 | ||
gRNA_HMA_A5 | Exon 2 | 2 | 8 | ||
gRNA_HMA_A6 | Intron 2 | 10 | 40 | ||
gRNA_HMA_B1 | HMAβ | Exon 1 | 5 | 25 | 20 |
gRNA_HMA_B2 | Intron 1 | 7 | 28 | ||
gRNA_HMA_B3 | Intron 1 | 0 | 0 | ||
gRNA_HMA_B4 | Exon 2 | 11 | 44 | ||
gRNA_HMA_B5 | Exon 2 | 5 | 20 | ||
gRNA_HMA_B6 | Exon 2 | 2 | 8 |
NtPCS 유전자에 돌연변이가 일어난 패턴을 위치별로 분류해본 결과, 하기 표 7에 나타낸 바와 같이, exon 2를 표적으로 제작한 gRNA_PCSs_e2, gRNA_PCSt_e2, 및 gRNA_PCSst_e2의 위치에서 돌연변이 발생률이 45% 내지 70%로, NtPCS 유전자의 exon 2 위치에서 돌연변이가 가장 많이 일어나는 것을 확인하였다.
표적 | 위치 | 돌연변이 수 | 조직배양체 수 | 돌연변이 발생율 (%) | |
gRNA_PCSs_e1 | PCSs | Exon 1 | 0 | 20 | 0 |
gRNA_PCSs_e2 | Exon 2 | 12 | 60 | ||
gRNA_PCSt_e1 | PCSt | Exon 1 | 0 | 20 | 0 |
gRNA_PCSt_e2 | Exon 2 | 14 | 70 | ||
gRNA_PCSst_e1 | PCSs PCSt |
Exon 1 | 0 | 20 | 0 |
gRNA_PCSst_e2 | Exon 2 | 9 | 45 |
(4.2) F
1
세대 종자 확보 및 도입 유전자 제거 식물체 선별
돌연변이가 확인된 NtHMA 유전자 돌연변이체 50 개체 및 NtPCS 유전자 돌연변이체 60 개체를 상토가 담긴 화분으로 이식하여 온실에서 재배하였다. CRISPR/Cas9 발현을 위해 도입된 유전자 블록을 제거하기 위하여 자가 수정을 통해 F1 세대 종자를 확보하였다. F1 세대 종자를 128구 트레이에 파종하여 30일 동안 기른 후, 잎을 채취하여 균일하게 분쇄한 후, silica column을 이용하여 상용화 키트 (예: Nucleospin 96 plant II, Macherey Nagel, 독일)를 이용하여 gDNA를 추출 및 정제하였다. 35S 프로모터와 Cas9 DNA 블록을 특이적으로 증폭하는 프라이머를 이용하여 PCR을 진행하였다. 프라이머의 서열은 하기 표 8에 나타내었다.
프라이머 | 서열 | PCR length | Note | 서열번호 |
F_C9 | GACCATCCTGGACTTCCTGAAGAGC | 420 bp | Cas 9 검출 | 27 |
R_C9 | TGCAGGTAGTACAGGTACAGCTTCTCG | 28 | ||
F_35S | GCTCCTACAAATGCCATCA | 195 bp | 35S 프로모터 검출 | 29 |
R_35S | GATAGTGGGATTGTGCGTCA | 30 |
그 결과, 도 6에 나타낸 바와 같이, 535S 프로모터와 Cas9 DNA 블록이 검출되지 않는 식물체를 선별하였다.
(4.3) 최종 선별 식물체의 유전형 정보
최종 선별한 F1 식물(108_PMTm_F1)은 도입 유전자를 포함하지 않으며, NtHMA 유전자 및 NtPCS 유전자들에 각각 동형접합 돌연변이(homozygous mutation)가 일어난 식물이었다. NtHMA 유전자 및 NtPCS 유전자 각각에 돌연변이가 유발된 최종 식물체의 유전형을 하기 표 9에 나타내었다.
표적 | 돌연변이 위치 | 돌연변이 양상 | |
A6_02 | HMAα | Exon 2 | GT del |
B6_02 | HMAβ | Exon 2 | T ins |
AB_01 | HMAα | Exon 2 | GTGA del |
HMAβ | Intron 1 | T del | |
Exon 2 | A ins | ||
Exon 2 | T ins | ||
T_05 | PCSt | Exon 2 | T ins |
ST_01 | PCSs | Exon 2 | A ins |
PCSt | Exon 2 | A ins |
또한, 대조군 식물체 (KB108), 및 NtPCSs 및 NtPCSt 유전자에 돌연변이가 유발된 식물체 (PCSst)의 PCSs 유전자 및 PCst 유전자의 gDNA 염기 서열, CDS 염기서열, 및 아미노산 서열을 하기 표 10에 정리하여 나타내었다.
식물체 | 종류 | 서열번호 | 약칭 |
KB108 | PCSs_gDNA | 31 | KB108_PCSs_gDNA |
PCSs_CDS | 32 | KB108_PCSs_CDS | |
PCSs_amino acid | 33 | KB108_PCSs_AA | |
PCSt_gDNA | 34 | KB108_PCSt_gDNA | |
PCSt_CDS | 35 | KB108_PCSt_CDS | |
PCSt_amino acid | 36 | KB108_PCSt_AA | |
PCSst | PCSs_gDNA | 37 | PCSst_PCSs_gDNA |
PCSs_CDS | 38 | PCSst_PCSs_CDS | |
PCSs_amino acid | 39 | PCSst_PCSs_AA | |
PCSt_gDNA | 40 | PCSst_PCSt_gDNA | |
PCSt_CDS | 41 | PCSst_PCSt_CDS | |
PCSt_amino acid | 42 | PCSst_PCSt_AA |
(아미노산 서열 중 *는 stop codon을 의미하며, 아미노산의 서열 중간에 존재하는 stop codon은 핵산 서열에 돌연변이가 존재하여 발생한 early stop codon을 의미하는 것이다.)
실시예 2. NtPCS 유전자에 돌연변이가 유발된 담배 식물체의 카드뮴 함량 분석
(1) 양액 재배시설을 이용한 카드뮴 함유량 분석
발아된 식물을 양액 재배 시설로 옮겨심은 후, 80일 동안 재배한 식물체의 꽃대를 자른 뒤, 2주 후에 식물체의 모든 잎을 수확하였고, 수확한 잎을 65℃ 드라이 오븐에서 48 시간 동안 건조시킨 후, 글라스 비드가 담긴 용기에 담아 gyro-shaker를 이용하여 분쇄하였다. 돌연변이 식물체의 확보 시기에 따라 1차 및 2차로 나누어 실험을 진행하였다. GC/MS 분석 기법으로 KB108 (야생형, 대조군)과 돌연변이체의 카드뮴 함량을 정량 분석하였다. 2회의 실험 결과를 대조군 식물체의 카드뮴 흡수량 대비 상대량으로 나타내었다.
그 결과, 도 7 및 하기 표 11에 나타낸 바와 같이, NtHMAα 유전자 또는 NtHMAβ 유전자에 돌연변이가 유발된 식물체는 대조군 대비 잎 내 카드뮴 함량이 25% 또는 2% 감소하였고, NtHMAα 유전자 및 NtHMAβ 유전자 모두에 돌연변이가 유발된 식물체는 대조군 대비 잎 내 카드뮴 함량이 64% 감소하였다. 특히, NtPCSs 유전자 및 NtPCSt 유전자 모두에 돌연변이가 유발된 식물체는 대조군 대비 잎 내 카드뮴 함량을 85% 감소시켜 현저한 카드뮴 저감 효과를 나타내었다. 이는 NtHMAα 유전자 및 NtHMAβ 유전자 모두에 돌연변이가 유발된 식물체에 비해서도 우수한 카드뮴 저감 효과를 나타내는 것이다.
식물체 | 카드뮴 (상대값) |
KB108 (대조군) | 1.00 |
NtHMAα | 0.75 |
NtHMAβ | 0.98 |
NtHMAαβ | 0.36 |
NtPCSt | 1.25 |
NtPCSst | 0.15 |
(2) 온실 환경에서의 카드뮴 함유량 분석
NtPCS 유전자에 돌연변이가 유발된 식물체의 카드뮴 흡수 저감 효과가 토양 환경에서도 유지되는지 확인하기 위하여, 온실 환경에서 카드뮴 흡수 실험을 수행하였다. 구체적으로, 발아된 식물을 온실 환경의 화분으로 옮겨 심은 후, 60일 동안 재배한 식물체의 꽃대를 자른 뒤, 2주 후에 식물체의 모든 잎 (하부 잎, 상부 잎, 또는 전체 잎)을 수확하였고, 수확한 잎을 65℃ 드라이 오븐에서 48 시간 동안 건조시킨 후, 글라스 비드가 담긴 용기에 담아 gyro-shaker를 이용하여 분쇄하였다. GC/MS 분석 기법으로 KB108 (야생형, 대조군)과 돌연변이체의 카드뮴 함량을 정량 분석하였다.
그 결과, 도 8 및 하기 표 12에 나타낸 바와 같이, 카드뮴 처리를 하지 않은 대조군 (KB108_NC)에서는 카드뮴이 거의 확인되지 않은 반면에, 카드뮴 처리를 한 대조군 (KB108_PC)에서는 분석법의 정량 한계 (LOQ) 이상으로 매우 높은 카드뮴 함량이 검출되었다. NtHMAα 유전자 또는 NtHMAβ 유전자에 돌연변이가 유발된 식물체는 대조군 대비 잎 내 카드뮴 함량이 약 26% 감소하였고, NtHMAα 유전자 및 NtHMAβ 유전자 모두에 돌연변이가 유발된 식물체는 대조군 대비 잎 내 카드뮴 함량이 약 77% 감소하였다. 특히, NtPCSs 유전자 및 NtPCSt 유전자 모두에 돌연변이가 유발된 식물체는 대조군 대비 잎 내 카드뮴 함량을 약 87% 감소시켜 현저한 카드뮴 저감 효과를 나타내었다. 이는 NtHMAα 유전자 및 NtHMAβ 유전자 모두에 돌연변이가 유발된 식물체에 비해서도 우수한 카드뮴 저감 효과를 나타내는 것이다.
식물체 | 하부 잎 카드뮴 함량 (㎍/g) |
상부 잎 카드뮴 함량 (㎍/g) |
전체 잎 카드뮴 함량 (㎍/g) |
KB108_NC (음성 대조군) |
0.08 | 0.04 | 0.13 |
KB108_PC (양성 대조군) |
2.44 | 2.13 | 4.57 |
NtHMAα | 1.05 | 2.27 | 3.31 |
NtHMAβ | 1.19 | 1.48 | 2.67 |
NtHMAαβ | 0.68 | 0.48 | 1.16 |
NtPCSst | 0.23 | 0.26 | 0.49 |
종합하면, NtPCSs 유전자 및 NtPCSt 유전자 모두에 돌연변이가 유발된 식물체의 잎 내 카드뮴 함량이 양액 환경에서는 대조군 대비 86% 감소되고, 토양 환경에서는 대조군 대비 87% 감소되어, 카드뮴 저감 효과가 가장 크게 나타났다.
실시예 3. NtPCS 유전자에 돌연변이가 유발된 담배 식물체의 생육 특성 확인
NtPCS 돌연변이 식물체가 NtHMA 돌연변이 식물체의 한계점인 생육 저해 현상을 해결할 수 있는지 확인하기 위해, NtHMAα 유전자 및/또는 NtHMAβ 유전자에 돌연변이가 유발된 식물체, 및 NtPCSs 유전자 및 NtPCSt 유전자 모두에 돌연변이가 유발된 식물체의 생육 특성을 대조군과 비교하였다. 구체적으로, 각각 식물체의 종류별로 5개 개체의 식물체 높이, 잎의 수, 및 잎의 중량을 측정하여 비교하였다.
그 결과, 도 9 및 하기 표 13에 나타낸 바와 같이, NtHMAα 유전자 및 NtHMAβ 유전자 모두에 돌연변이가 유발된 식물체는 대조군 대비 식물체 높이가 30% 감소하고, 잎의 수는 유의미한 차이는 없었으나 잎의 중량이 16% 감소하였다. 상기 결과로부터 NtHMAα 유전자 및 NtHMAβ 유전자에 돌연변이가 유발된 식물체는 생육 저해가 나타남을 알 수 있다. 이와 달리, NtPCSs 유전자 및 NtPCSt 유전자 모두에 돌연변이가 유발된 식물체는 대조군 대비 식물체 높이는 15% 감소하여 다소 낮아졌으나, 잎의 수 및 잎의 중량에 있어서 유의미한 변화를 나타내지 않아, 생육 저해가 나타나지 않음을 확인하였다.
번호 | 식물체 | 높이 (cm) | 잎 수 (개) | 잎 중량 (g) |
1 | KB108 (대조군) |
62 | 12 | 145.5 |
2 | 66 | 13 | 149.0 | |
3 | 63 | 13 | 142.0 | |
4 | 68 | 13 | 142.0 | |
5 | 67 | 12 | 129.0 | |
평균 | 65.2 | 12.6 | 141.5 | |
1 | NtHMAα 돌연변이체 |
45 | 13 | 146.0 |
2 | 55 | 13 | 167.0 | |
3 | 53 | 13 | 154.0 | |
4 | 52 | 13 | 156.0 | |
5 | 53 | 13 | 163.0 | |
평균 | 51.6 | 13 | 157.2 | |
1 | NtHMAβ 돌연변이체 |
58 | 12 | 144.6 |
2 | 51 | 14 | 169.0 | |
3 | 57 | 13 | 176.0 | |
4 | 58 | 14 | 172.0 | |
5 | 54 | 13 | 160.0 | |
평균 | 55.6 | 13.2 | 164.32 | |
1 | NtHMAαβ 돌연변이체 |
50 | 11 | 108.5 |
2 | 50 | 12 | 157.5 | |
3 | 40 | 14 | 123.0 | |
4 | 41 | 12 | 107.0 | |
5 | 47 | 13 | 99.0 | |
평균 | 45.6 | 12.4 | 117.0 | |
1 | NtPCSst 돌연변이체 |
61 | 13 | 145.0 |
2 | 60 | 13 | 158.0 | |
3 | 57 | 13 | 149.0 | |
4 | 54 | 13 | 142.0 | |
5 | 47 | 12 | 138.0 | |
평균 | 55.8 | 12.8 | 146.4 |
또한, 도 10에 나타낸 바와 같이, NtHMAαβ 돌연변이체는 대조군과 비교하여 육안으로 관찰되는 수준의 생육 저해를 나타낸 반면, NtPCSst 돌연변이체는 대조군과 비교하여 유의미한 생육 상태 차이를 나타내지 않았다.
<110> KT&G CORPORATION
<120> Trnasgenic plant with reduced heavy metals and methods for
preparation thereof
<130> PN134818
<160> 43
<170> KoPatentIn 3.0
<210> 1
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> gRNA S1 sequnce of Vlk_PCS_S
<400> 1
aagcgaaatc aacagccgga g 21
<210> 2
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> gRNA S2 sequnce of Vlk_PCS_S
<400> 2
ggcattcaag accatggaa 19
<210> 3
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> gRNA T1 sequnce of Vlk_PCS_T
<400> 3
cgagttcttc cgtcgcctc 19
<210> 4
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> gRNA T2 sequnce of Vlk_PCS_T
<400> 4
ggcattcaag accatagaa 19
<210> 5
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> gRNA_ST1 sequnce of Vlk_PCS_ST
<400> 5
tagaagcgaa atcaacagc 19
<210> 6
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> gRNA_ST2 sequnce of Vlk_PCS_ST
<400> 6
gccatccaga atggaacaa 19
<210> 7
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> F_HMA alpha primer sequence
<400> 7
gaaacaaaga agttgagcaa gagctatt 28
<210> 8
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> R_HMA alpha primer sequence
<400> 8
agccttagtg agatgattta taacacaa 28
<210> 9
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> F_HMA beta primer sequence
<400> 9
gacacaaaga atctgagcaa gagctatt 28
<210> 10
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> R_HMA beta primer sequence
<400> 10
agctagagta ggaccacaca ttaattct 28
<210> 11
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> F_PCSs primer sequence
<400> 11
aaatggcgat ggcgggtttg tat 23
<210> 12
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> R_PCSs primer sequence
<400> 12
gtcgggaagg attagaacac aaattcac 28
<210> 13
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> F_PCSt primer sequence
<400> 13
aatggcgatg gcgggtttat atc 23
<210> 14
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> R_PCSt primer sequence
<400> 14
agtccggaag gataggaaca cagatt 26
<210> 15
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> gRNA_A1 sequnce of Vlk_HMA_A6
<400> 15
tctttcttac caatttgttg 20
<210> 16
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> gRNA_A2 sequnce of Vlk_HMA_A6
<400> 16
tgtttgtaca agcttttaga 20
<210> 17
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> gRNA_A3 sequnce of Vlk_HMA_A6
<400> 17
atggtaactt caataattat a 21
<210> 18
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> gRNA_A4 of Vlk_HMA_A6
<400> 18
aagcaagcat aagagtgaa 19
<210> 19
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> gRNA_A5 sequnce of Vlk_HMA_A6
<400> 19
ccacacctct aaaaataat 19
<210> 20
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> gRNA_A6 sequnce of Vlk_HMA_A6
<400> 20
tcatataaat tgggacaaa 19
<210> 21
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> gRNA_B1 sequence of Vlk_HMA_B6
<400> 21
caatttgttg ctgagaaatg 20
<210> 22
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> gRNA_B2 sequence of Vlk_HMA_B6
<400> 22
agtggagaaa agatgaagaa 20
<210> 23
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> gRNA_B3 sequence of Vlk_HMA_B6
<400> 23
atggtaacta caataattat a 21
<210> 24
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> gRNA_B4 sequence of Vlk_HMA_B6
<400> 24
aagcaagtat aagagtgaa 19
<210> 25
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> gRNA_B5 sequence of Vlk_HMA_B6
<400> 25
gattcctcca attattttt 19
<210> 26
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> gRNA_B6 sequence of Vlk_HMA_B6
<400> 26
ccacacccct aaaaataat 19
<210> 27
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> F_C9 primer sequence
<400> 27
gaccatcctg gacttcctga agagc 25
<210> 28
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> R_C9 primer sequence
<400> 28
tgcaggtagt acaggtacag cttctcg 27
<210> 29
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> F_35S primer sequence
<400> 29
gctcctacaa atgccatca 19
<210> 30
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> R_35S primer sequence
<400> 30
gatagtggga ttgtgcgtca 20
<210> 31
<211> 914
<212> DNA
<213> Artificial Sequence
<220>
<223> PCSs_gDNA sequence of KB108
<400> 31
atggcgatgg cgggtttgta tcggcgagtt cttccgtccc ctccggctgt tgatttcgct 60
tctactgaag gaaaggcaag ttttagtgct actcttcctt tcttcccttt gaactgatgg 120
ttgaagacta gggttttagc cgtctttgtt tgttgttctg ttctattttg tcactgatga 180
atatggatta tatcataatg ttttaactct ttgtttacta gctggtacca atttgttaat 240
tggtttggac ttcagaggcg gattcagaat tttaaatctg tagttgtgct ttagtatttt 300
gccacaatgg ttgctaacta gtataagtat atagttaatg aaatacgcga tatctgcaat 360
tcaagctgaa cgtaattgat ttagtagagt cagcaagatc caggtgacca aagtgatcag 420
cagcttgatc tgctactcag ccttagggat tggcctatat gatacatgtt agataattgt 480
ttatcgtaaa ttgaccaatt cgctgtttat cgtaattgtt tgtccagacc ccatagtgag 540
aactgtggcc atggcagact taaaagaaaa tgtgataaaa ggaaatcagg aatctgttct 600
gttttacgtg aacttgtaaa tttcgctgtt cttaagggtt tgtagctatt tttgtgcttt 660
ccacatgaag catctgactt tcattttgta ctgattttta tgtgtttttt tggagctgca 720
gcaacttttc ttggaggcca tccagaatgg aacaatggaa ggatttttca agttgatctc 780
ttattttcag acacagtctg aaccggccta ttgtggtttg gctagccttt ccatggtctt 840
gaatgccctt gctattgatc caggaagaaa atggaaaggt aattctacta tcatcaagtg 900
aatttgtgtt ctaa 914
<210> 32
<211> 233
<212> DNA
<213> Artificial Sequence
<220>
<223> PCSs_CDS sequence of KB108
<400> 32
atggcgatgg cgggtttgta tcggcgagtt cttccgtccc ctccggctgt tgatttcgct 60
tctactgaag gaaagcaact tttcttggag gccatccaga atggaacaat ggaaggattt 120
ttcaagttga tctcttattt tcagacacag tctgaaccgg cctattgtgg tttggctagc 180
ctttccatgg tcttgaatgc ccttgctatt gatccaggaa gaaaatggaa agg 233
<210> 33
<211> 77
<212> PRT
<213> Artificial Sequence
<220>
<223> PCSs_amino acid sequence of KB108
<400> 33
Met Ala Met Ala Gly Leu Tyr Arg Arg Val Leu Pro Ser Pro Pro Ala
1 5 10 15
Val Asp Phe Ala Ser Thr Glu Gly Lys Gln Leu Phe Leu Glu Ala Ile
20 25 30
Gln Asn Gly Thr Met Glu Gly Phe Phe Lys Leu Ile Ser Tyr Phe Gln
35 40 45
Thr Gln Ser Glu Pro Ala Tyr Cys Gly Leu Ala Ser Leu Ser Met Val
50 55 60
Leu Asn Ala Leu Ala Ile Asp Pro Gly Arg Lys Trp Lys
65 70 75
<210> 34
<211> 6901
<212> DNA
<213> Artificial Sequence
<220>
<223> PCSt_gDNA sequence of KB108
<400> 34
atggcgatgg cgggtttata tcggcgagtt cttccgtcgc ctccggctgt tgatttcgct 60
tctactgaag gaaaggcaag ttttagtgct actctttcct ttttcgtttg tgctgagggt 120
taaagactag ggttttagcc gtctttggtt gttgttctat tttgtcacgg atgaatatgg 180
attatatcat aatcttttag ctatctgttt actagctggt accgatttgt taattggttt 240
ggactttatt cagaattttg aatctgtaat tgtgtcgtta ctatttggcc acaatggttg 300
ctaacttagt ataagtatat atattattaa aataattaaa ctgtgtctgt aattcagctg 360
aaggcaattg atttaataga gtcagcaaga tccaggtgac cacagtgatc aacaacttga 420
tcagctggtc agccttaggg attggcctat atgatacacg ttagataatt gtttattgta 480
agttgattta gacaccaatt cactgctaac tgtccagacc ccataacata tagtaccttt 540
tattcaaatt tgtccttgat gttccacatg gagaactttg gccatggcag tcttaaaaga 600
aaatgtgata aaaggaaatc aggaatctgt ttctttttga cgcggacttg taaattttgc 660
tgttcttaag gttttgtagc tatttttgtg ctttccacat tggagggcat ctgactttca 720
taaattctac tccttcctgc ttcaatgttt tgttgatata tttatttatg atgtacgata 780
tttttttttt ggcaattaac tgtcggtgtc tttgtctgta cttactttta catctacact 840
ttttaagtct taacatccca tttcttgcgg tatgccctta acttccagat actaaaatgt 900
gtgataatat tctagtttat tgtacttgct tgcccttggt ttaggtatca attcatctta 960
ttgttcggtt cgactgttaa ggtgtacatc tgaagttgat gtcattgtac agcctaatac 1020
agatttgctt gaatatcttt tttctccagt ttgatgctgt ttcatgaaat taaaatcctt 1080
tttgtcatta atatgaagag attgaatgca gttttctctg gctctttcca tacataattt 1140
tttatgcgta tctttttatt aaaaaaagtt gtcacataag attttgactt tccattgaag 1200
ttgaccttca gagaggaata gagaaaagga gttatattaa agtatccaag taaacatatg 1260
cttgacatca ttcatattct ttttactctt ctacatatct acagggatgg aatactcagg 1320
ccattaagtc tattacaatt gcgccaatac tctttatttc caagaactta ataagctttt 1380
tgtgccgaat tgctacagtg acattttccc cttcaacttc tgcacttgat tgaaggatga 1440
cttttgcctg ccatatgtaa aatgatatta atacgagatt aatgagttac cttttcccct 1500
ataggtcaaa gcgagaagag ctgcattcct catttgcagc cacagcctca ttgaggcaca 1560
tccctttgac tccttaccag cccaaacaac catatgctgc ttagctcaat tccatctgcc 1620
ttcagttaaa ttttctgctc agactagcca tacccaattc aaatgttgag caactattta 1680
ttagtctatc acattgtagc cttatacctc caatgaatac tcaacataat aatactcctt 1740
ggacgactgc tggtttcctc tgcagatttt tatctatgcc ctcccttcag atcacttgtc 1800
tggatccttg gctcctccca ccctttaagt tatgtcatta tggaagttga atcttttaat 1860
ggggaaagct ctcagttatt actgcaacca ttatcttaag gatctgtttc ggtttgcttt 1920
ctcactgatt gcctgagttt gatcatattg gtttatgata ggcttcctag ctgaaaaagg 1980
ggtagctgtc cctttccttt ttttcccaca atatttcact aggctactgt ggtatcgtat 2040
ggagaacatt gtagcttctc ttagactgag aaactataag aagataggtg tgccagtgac 2100
cgtgtatttg tgcagtgttt tgaatttcat aggaaacaat gttatttagg gagatcctta 2160
actttttcgg aaaaggttaa gtgacccttg cataaacctg gaatttgaag gtctgtctta 2220
cagagatacc tcaaatgccc gcctgatcaa atacaagcca ttcctacatt tatcttgaaa 2280
tgatactatt agatatcaaa ctaagtcttt tgttatatga actgaatgtt atatcaaaaa 2340
taaatttctt ctgtaaacat gaatttgttt tcatcagcat agactgcgtt ttaattagcc 2400
atacctcaga gaaaaaagga aatgcatgaa acggggtgga gggatgagaa agagatacaa 2460
tatctgatac tttgttcagt gactgttctt tttgtactga tttttgcgtg ttttttggag 2520
ctgcagcaac tttttttgga ggccatccag aatggaacaa tggaaggatt tttcaagttg 2580
atctcttatt ttcagacaca gtctgaaccg gcctattgtg gtttggctag cctttctatg 2640
gtcttgaatg cccttgctat tgatccagga agaaaatgga aaggtaactc tgctatcatc 2700
aagtgaatct gtgttcctat ccttccggac tatatcgatg attttgatct tcactttttc 2760
atggccttgc cttctgaatt gttaataagg tctcaggctc tttatatgtt tatttccttg 2820
atgaaggtct ttacatcttt attttccaat aatttcgcct atcccgacct gcccatgtta 2880
gttataagat atagcacaga gatgtgtagt tcactttgtt ttttattgtt gagatctcta 2940
ttaaaaaaaa taagttgatg ccttgtctgt gagctttgta agttaatctg atatgttgtg 3000
atgcattggc atgagtctga tatcatctgt tctcaacatg aatcctagcc actgttgctg 3060
gacaccttcc aaagatctaa actgctatat gtgcaactta atattttttc ttacctcatt 3120
tattgaaggt gtttattctc tggataattg ttcatcaaag ttgccgttct agtgcagttt 3180
tgcaaactta aggctttaac agattagacc tcggtaatat aattctgaga actcctttag 3240
agttaatatc tgtgtctgta tttcgttcca tttgcattta acagaaaagg gttcatgcat 3300
ctaggagctg ttgctctgag ttgcctcatg catattattt gttgatgtcc atttttccaa 3360
acttcatggt cacatgaaat cattcttatt gtcagtttct gtttccaatt tacatgaact 3420
agaaacatct tagataatat tttgtttcaa tgttcacatc ttaaaaactt gaaaaccttt 3480
tctttccacc aattaactta tatgttaggg tcatatcttg gtcaccaatg tctactgata 3540
ttaaagagtc agtttggaaa agaaggagct tggtgaggac agctttaacg ttcttagctt 3600
tcatcacctg aaactgtttg atgcttgtac gtttctcttt cgaacttggt tgttcatatc 3660
ctttttatag tctgcttgcg tcaatgagct tggagtttat tatcttatca gcttcaacaa 3720
actgtcaggg ccttggagat ggtttgatga atctatgttg gactgttgtg agcctctgga 3780
gaaggttaaa gctaaaggga tctcttttgg gaaagtggta tgtttggctc actgtgcagg 3840
agcgaaggta gaagcttttc gctctaatca tagtactatt gatgacttcc gtaaacaagt 3900
catggcctgc actactagtg ataattgtca tctgatctca tcatatcata gaggcctttt 3960
taagcaggta aatgtaaaca tagcttctct atccccatgc ttatgattgt gaagaagtat 4020
attgctgcat cgggagtttg accacacagg atctactgaa tcttatggca gacaggttcg 4080
ggccactttt cgcctattgg tggttatcac gtgggaaagg atatggcact gattctagat 4140
gttgcgaggt ttaaatatcc tcctcattgg gttcccctcc ctctcctttg ggaagccatg 4200
aacacaattg atgaagctac aggattacat agggggtatg cacttccagt tagctgtgct 4260
gtgatattga tattgatttt cataatggct atgagttgtt gcctgttagc atgctcttta 4320
ccttgaacag cgtctcgttc atgcttttta gctgtcaact gatactggct aagcatttag 4380
cttaaggaat ataaatatgt agaagaagta gttttactat gtgttttggt cttcctctta 4440
taattaagac taaaattgga aattaaatgc tgaactcttt cggcactgct tctggtcttc 4500
ttcaaacata actgtagatt ctcttcatta ttttctcttc ctattctcct tctgctcaaa 4560
tttagcggtc cgtctatatc catctcacac ttgatatatt tttatcattc tgcagcatgg 4620
atttcagtga cttatgtgca aaaacataat tttcaggttt atgctaatta ctaagcttca 4680
cagagctcct gcactgctat ataccctggt aaggtttaag tagctgctat tatgttattc 4740
gctttaaata taaactcctt cgaagttcga acaaactata agaagcaact tctattactg 4800
cttgtgagat cctttgctag ttgattcttt tcagtacacc agcttggtcg gatagttgtt 4860
aactactact ttacctacct tttacatgct ataacataat gataacatct ttgtcaaatg 4920
cttgggaatt gtggtcttag tgccaggtga ttagcttgga cttttgtttc aaaactatga 4980
tgtcattgca atatttatgg agtttaacaa cattggcctt tagaactatt taacgtgtaa 5040
ttttttatgt aaattttcta taataaagag ggaggaatgt actgtattga attactcctg 5100
gattttcttc tttctgcgac tagtcatgta ttttgaatgg tgaacttcta cagagctgta 5160
aacatgagag ttgggtcact atctcaaagc atttgatgga tgatcttcct gtcctgttaa 5220
gttctgagaa tgtgaagggc ataaaagatg ttctctctac tgttctttca aatctacctt 5280
caaattttgt tgaattcata aagtggatag cggaagttcg aaggcaagag gagaatggtc 5340
aaaatttgag tgacgaggag aaaggaaggc tagctatcaa ggtaaggtat ctgaagaaat 5400
ttagtaaata gaaagaaaaa aaagaaggct cctagaaatg gtcatgtaga tttgatcggg 5460
taacttgcag gataggtgat tatttatgag ttcagtaacc actcttacct tactttgcag 5520
gaagaggtat tgaaacaagt gcaggacact cctctttata agcatgtcac aagcatttta 5580
ttttcaaaaa attctatctg ccagtcaaaa gcagcatcag acagcagttt ggctaatgtt 5640
gccgcaaaca tttgctgcca aggagcaggt ctttttgcag gaagatctgg ttcatcggat 5700
aggttttgct gtctccaaac atgtgttaga tgctacagag ctaccggggg caattctgct 5760
acagtggtgt ctgggacagt tgtaaatggg aatggggagc agggggttga tgttctggtc 5820
cctacatctc tagcaaagac tagctgctgt ccctcagggc aagctggttg ctcgccaatg 5880
caccctgcaa gtaacgatgt gctgacagca ctattgctgg cattacctcc acatacatgg 5940
tctcgaataa aagatacgaa ggtcttgcag gaaatagaga accttgtctc agcagagaac 6000
ctgcctcctt tgctgcaaga agaggtatct ttgtacattt gtctcttatc acatttgctt 6060
tcttgtttta aaattcctct ttgttgtttg tgttgggaag cccagaactg gaggattgca 6120
gtaggttaag ggccagcaga aagctaggca attttatgat taatctaaca atattgaaat 6180
attggaaaga aaggagtcca aatagagtta aatggatgtc caggatttat atagcgaccc 6240
caactagctt aggattgagg cttttgtttt gttgttgtca ttttgtattg ggaaattcac 6300
atgagcactt agaatggcct tcataactat atcagagctt tctacctctt ttctaattgg 6360
tagttcttat tatggcccaa tagaagattt ttcctgccta agattatcta tttcactgca 6420
ctgcatattt tatgaaaaat agtctaatcc tcttgaagca ggttatcata tcataacagg 6480
cttaactgat ttttcatttc tagtctatct gaaggagcat ataactgata aatcttatgc 6540
ataatgagac ctaaggcgca taactctgtc ttctgcatgt tattcagccg tttaatgagt 6600
ttgtctctca tgctatgcat ctttgaccaa ttaacttagt tcaacggtat gagttatgaa 6660
attctgagat gtgtgctggg ttgatgaact agtagatacg ctctgagaat gcattttgtt 6720
ctaatgacta cttaaatctt tcacttggtt aaccattaaa catggtgtaa tatacttctg 6780
aatatccttt tgggcgactg cagattttgc acctgcgagg acagttcctc ctcctcaaga 6840
aatgcaagga taacaaggta gaagaagatt tagctgcacc tcccttctag ctttgctttc 6900
c 6901
<210> 35
<211> 1506
<212> DNA
<213> Artificial Sequence
<220>
<223> PCSt_CDS sequence of KB108
<400> 35
atggcgatgg cgggtttata tcggcgagtt cttccgtcgc ctccggctgt tgatttcgct 60
tctactgaag gaaagcaact ttttttggag gccatccaga atggaacaat ggaaggattt 120
ttcaagttga tctcttattt tcagacacag tctgaaccgg cctattgtgg tttggctagc 180
ctttctatgg tcttgaatgc ccttgctatt gatccaggaa gaaaatggaa agggccttgg 240
agatggtttg atgaatctat gttggactgt tgtgagcctc tggagaaggt taaagctaaa 300
gggatctctt ttgggaaagt ggtatgtttg gctcactgtg caggagcgaa ggtagaagct 360
tttcgctcta atcatagtac tattgatgac ttccgtaaac aagtcatggc ctgcactact 420
agtgataatt gtcatctgat ctcatcatat catagaggcc tttttaagca gacaggttcg 480
ggccactttt cgcctattgg tggttatcac gtgggaaagg atatggcact gattctagat 540
gttgcgaggt ttaaatatcc tcctcattgg gttcccctcc ctctcctttg ggaagccatg 600
aacacaattg atgaagctac aggattacat agggggttta tgctaattac taagcttcac 660
agagctcctg cactgctata taccctgagc tgtaaacatg agagttgggt cactatctca 720
aagcatttga tggatgatct tcctgtcctg ttaagttctg agaatgtgaa gggcataaaa 780
gatgttctct ctactgttct ttcaaatcta ccttcaaatt ttgttgaatt cataaagtgg 840
atagcggaag ttcgaaggca agaggagaat ggtcaaaatt tgagtgacga ggagaaagga 900
aggctagcta tcaaggaaga ggtattgaaa caagtgcagg acactcctct ttataagcat 960
gtcacaagca ttttattttc aaaaaattct atctgccagt caaaagcagc atcagacagc 1020
agtttggcta atgttgccgc aaacatttgc tgccaaggag caggtctttt tgcaggaaga 1080
tctggttcat cggataggtt ttgctgtctc caaacatgtg ttagatgcta cagagctacc 1140
gggggcaatt ctgctacagt ggtgtctggg acagttgtaa atgggaatgg ggagcagggg 1200
gttgatgttc tggtccctac atctctagca aagactagct gctgtccctc agggcaagct 1260
ggttgctcgc caatgcaccc tgcaagtaac gatgtgctga cagcactatt gctggcatta 1320
cctccacata catggtctcg aataaaagat acgaaggtct tgcaggaaat agagaacctt 1380
gtctcagcag agaacctgcc tcctttgctg caagaagaga ttttgcacct gcgaggacag 1440
ttcctcctcc tcaagaaatg caaggataac aaggtagaag aagatttagc tgcacctccc 1500
ttctag 1506
<210> 36
<211> 502
<212> PRT
<213> Artificial Sequence
<220>
<223> PCSt_amino acid sequence of KB108
<400> 36
Met Ala Met Ala Gly Leu Tyr Arg Arg Val Leu Pro Ser Pro Pro Ala
1 5 10 15
Val Asp Phe Ala Ser Thr Glu Gly Lys Gln Leu Phe Leu Glu Ala Ile
20 25 30
Gln Asn Gly Thr Met Glu Gly Phe Phe Lys Leu Ile Ser Tyr Phe Gln
35 40 45
Thr Gln Ser Glu Pro Ala Tyr Cys Gly Leu Ala Ser Leu Ser Met Val
50 55 60
Leu Asn Ala Leu Ala Ile Asp Pro Gly Arg Lys Trp Lys Gly Pro Trp
65 70 75 80
Arg Trp Phe Asp Glu Ser Met Leu Asp Cys Cys Glu Pro Leu Glu Lys
85 90 95
Val Lys Ala Lys Gly Ile Ser Phe Gly Lys Val Val Cys Leu Ala His
100 105 110
Cys Ala Gly Ala Lys Val Glu Ala Phe Arg Ser Asn His Ser Thr Ile
115 120 125
Asp Asp Phe Arg Lys Gln Val Met Ala Cys Thr Thr Ser Asp Asn Cys
130 135 140
His Leu Ile Ser Ser Tyr His Arg Gly Leu Phe Lys Gln Thr Gly Ser
145 150 155 160
Gly His Phe Ser Pro Ile Gly Gly Tyr His Val Gly Lys Asp Met Ala
165 170 175
Leu Ile Leu Asp Val Ala Arg Phe Lys Tyr Pro Pro His Trp Val Pro
180 185 190
Leu Pro Leu Leu Trp Glu Ala Met Asn Thr Ile Asp Glu Ala Thr Gly
195 200 205
Leu His Arg Gly Phe Met Leu Ile Thr Lys Leu His Arg Ala Pro Ala
210 215 220
Leu Leu Tyr Thr Leu Ser Cys Lys His Glu Ser Trp Val Thr Ile Ser
225 230 235 240
Lys His Leu Met Asp Asp Leu Pro Val Leu Leu Ser Ser Glu Asn Val
245 250 255
Lys Gly Ile Lys Asp Val Leu Ser Thr Val Leu Ser Asn Leu Pro Ser
260 265 270
Asn Phe Val Glu Phe Ile Lys Trp Ile Ala Glu Val Arg Arg Gln Glu
275 280 285
Glu Asn Gly Gln Asn Leu Ser Asp Glu Glu Lys Gly Arg Leu Ala Ile
290 295 300
Lys Glu Glu Val Leu Lys Gln Val Gln Asp Thr Pro Leu Tyr Lys His
305 310 315 320
Val Thr Ser Ile Leu Phe Ser Lys Asn Ser Ile Cys Gln Ser Lys Ala
325 330 335
Ala Ser Asp Ser Ser Leu Ala Asn Val Ala Ala Asn Ile Cys Cys Gln
340 345 350
Gly Ala Gly Leu Phe Ala Gly Arg Ser Gly Ser Ser Asp Arg Phe Cys
355 360 365
Cys Leu Gln Thr Cys Val Arg Cys Tyr Arg Ala Thr Gly Gly Asn Ser
370 375 380
Ala Thr Val Val Ser Gly Thr Val Val Asn Gly Asn Gly Glu Gln Gly
385 390 395 400
Val Asp Val Leu Val Pro Thr Ser Leu Ala Lys Thr Ser Cys Cys Pro
405 410 415
Ser Gly Gln Ala Gly Cys Ser Pro Met His Pro Ala Ser Asn Asp Val
420 425 430
Leu Thr Ala Leu Leu Leu Ala Leu Pro Pro His Thr Trp Ser Arg Ile
435 440 445
Lys Asp Thr Lys Val Leu Gln Glu Ile Glu Asn Leu Val Ser Ala Glu
450 455 460
Asn Leu Pro Pro Leu Leu Gln Glu Glu Ile Leu His Leu Arg Gly Gln
465 470 475 480
Phe Leu Leu Leu Lys Lys Cys Lys Asp Asn Lys Val Glu Glu Asp Leu
485 490 495
Ala Ala Pro Pro Phe ***
500
<210> 37
<211> 915
<212> DNA
<213> Artificial Sequence
<220>
<223> PCSs_gDNA sequence of PCSst
<400> 37
atggcgatgg cgggtttgta tcggcgagtt cttccgtccc ctccggctgt tgatttcgct 60
tctactgaag gaaaggcaag ttttagtgct actcttcctt tcttcccttt gaactgatgg 120
ttgaagacta gggttttagc cgtctttgtt tgttgttctg ttctattttg tcactgatga 180
atatggatta tatcataatg ttttaactct ttgtttacta gctggtacca atttgttaat 240
tggtttggac ttcagaggcg gattcagaat tttaaatctg tagttgtgct ttagtatttt 300
gccacaatgg ttgctaacta gtataagtat atagttaatg aaatacgcga tatctgcaat 360
tcaagctgaa cgtaattgat ttagtagagt cagcaagatc caggtgacca aagtgatcag 420
cagcttgatc tgctactcag ccttagggat tggcctatat gatacatgtt agataattgt 480
ttatcgtaaa ttgaccaatt cgctgtttat cgtaattgtt tgtccagacc ccatagtgag 540
aactgtggcc atggcagact taaaagaaaa tgtgataaaa ggaaatcagg aatctgttct 600
gttttacgtg aacttgtaaa tttcgctgtt cttaagggtt tgtagctatt tttgtgcttt 660
ccacatgaag catctgactt tcattttgta ctgattttta tgtgtttttt tggagctgca 720
gcaacttttc ttggaggcca tccagaatgg aaacaatgga aggatttttc aagttgatct 780
cttattttca gacacagtct gaaccggcct attgtggttt ggctagcctt tccatggtct 840
tgaatgccct tgctattgat ccaggaagaa aatggaaagg taattctact atcatcaagt 900
gaatttgtgt tctaa 915
<210> 38
<211> 234
<212> DNA
<213> Artificial Sequence
<220>
<223> PCSs_CDS sequence of PCSst
<400> 38
atggcgatgg cgggtttgta tcggcgagtt cttccgtccc ctccggctgt tgatttcgct 60
tctactgaag gaaagcaact tttcttggag gccatccaga atggaaacaa tggaaggatt 120
tttcaagttg atctcttatt ttcagacaca gtctgaaccg gcctattgtg gtttggctag 180
cctttccatg gtcttgaatg cccttgctat tgatccagga agaaaatgga aagg 234
<210> 39
<211> 78
<212> PRT
<213> Artificial Sequence
<220>
<223> PCSs_amino acid sequence of PCSst
<400> 39
Met Ala Met Ala Gly Leu Tyr Arg Arg Val Leu Pro Ser Pro Pro Ala
1 5 10 15
Val Asp Phe Ala Ser Thr Glu Gly Lys Gln Leu Phe Leu Glu Ala Ile
20 25 30
Gln Asn Gly Asn Asn Gly Arg Ile Phe Gln Val Asp Leu Leu Phe Ser
35 40 45
Asp Thr Val *** Thr Gly Leu Leu Trp Phe Gly *** Pro Phe His Gly
50 55 60
Leu Glu Cys Pro Cys Tyr *** Ser Arg Lys Lys Met Glu Arg
65 70 75
<210> 40
<211> 6902
<212> DNA
<213> Artificial Sequence
<220>
<223> PCSt_gDNA sequence of PCSst
<400> 40
atggcgatgg cgggtttata tcggcgagtt cttccgtcgc ctccggctgt tgatttcgct 60
tctactgaag gaaaggcaag ttttagtgct actctttcct ttttcgtttg tgctgagggt 120
taaagactag ggttttagcc gtctttggtt gttgttctat tttgtcacgg atgaatatgg 180
attatatcat aatcttttag ctatctgttt actagctggt accgatttgt taattggttt 240
ggactttatt cagaattttg aatctgtaat tgtgtcgtta ctatttggcc acaatggttg 300
ctaacttagt ataagtatat atattattaa aataattaaa ctgtgtctgt aattcagctg 360
aaggcaattg atttaataga gtcagcaaga tccaggtgac cacagtgatc aacaacttga 420
tcagctggtc agccttaggg attggcctat atgatacacg ttagataatt gtttattgta 480
agttgattta gacaccaatt cactgctaac tgtccagacc ccataacata tagtaccttt 540
tattcaaatt tgtccttgat gttccacatg gagaactttg gccatggcag tcttaaaaga 600
aaatgtgata aaaggaaatc aggaatctgt ttctttttga cgcggacttg taaattttgc 660
tgttcttaag gttttgtagc tatttttgtg ctttccacat tggagggcat ctgactttca 720
taaattctac tccttcctgc ttcaatgttt tgttgatata tttatttatg atgtacgata 780
tttttttttt ggcaattaac tgtcggtgtc tttgtctgta cttactttta catctacact 840
ttttaagtct taacatccca tttcttgcgg tatgccctta acttccagat actaaaatgt 900
gtgataatat tctagtttat tgtacttgct tgcccttggt ttaggtatca attcatctta 960
ttgttcggtt cgactgttaa ggtgtacatc tgaagttgat gtcattgtac agcctaatac 1020
agatttgctt gaatatcttt tttctccagt ttgatgctgt ttcatgaaat taaaatcctt 1080
tttgtcatta atatgaagag attgaatgca gttttctctg gctctttcca tacataattt 1140
tttatgcgta tctttttatt aaaaaaagtt gtcacataag attttgactt tccattgaag 1200
ttgaccttca gagaggaata gagaaaagga gttatattaa agtatccaag taaacatatg 1260
cttgacatca ttcatattct ttttactctt ctacatatct acagggatgg aatactcagg 1320
ccattaagtc tattacaatt gcgccaatac tctttatttc caagaactta ataagctttt 1380
tgtgccgaat tgctacagtg acattttccc cttcaacttc tgcacttgat tgaaggatga 1440
cttttgcctg ccatatgtaa aatgatatta atacgagatt aatgagttac cttttcccct 1500
ataggtcaaa gcgagaagag ctgcattcct catttgcagc cacagcctca ttgaggcaca 1560
tccctttgac tccttaccag cccaaacaac catatgctgc ttagctcaat tccatctgcc 1620
ttcagttaaa ttttctgctc agactagcca tacccaattc aaatgttgag caactattta 1680
ttagtctatc acattgtagc cttatacctc caatgaatac tcaacataat aatactcctt 1740
ggacgactgc tggtttcctc tgcagatttt tatctatgcc ctcccttcag atcacttgtc 1800
tggatccttg gctcctccca ccctttaagt tatgtcatta tggaagttga atcttttaat 1860
ggggaaagct ctcagttatt actgcaacca ttatcttaag gatctgtttc ggtttgcttt 1920
ctcactgatt gcctgagttt gatcatattg gtttatgata ggcttcctag ctgaaaaagg 1980
ggtagctgtc cctttccttt ttttcccaca atatttcact aggctactgt ggtatcgtat 2040
ggagaacatt gtagcttctc ttagactgag aaactataag aagataggtg tgccagtgac 2100
cgtgtatttg tgcagtgttt tgaatttcat aggaaacaat gttatttagg gagatcctta 2160
actttttcgg aaaaggttaa gtgacccttg cataaacctg gaatttgaag gtctgtctta 2220
cagagatacc tcaaatgccc gcctgatcaa atacaagcca ttcctacatt tatcttgaaa 2280
tgatactatt agatatcaaa ctaagtcttt tgttatatga actgaatgtt atatcaaaaa 2340
taaatttctt ctgtaaacat gaatttgttt tcatcagcat agactgcgtt ttaattagcc 2400
atacctcaga gaaaaaagga aatgcatgaa acggggtgga gggatgagaa agagatacaa 2460
tatctgatac tttgttcagt gactgttctt tttgtactga tttttgcgtg ttttttggag 2520
ctgcagcaac tttttttgga ggccatccag aatggaaaca atggaaggat ttttcaagtt 2580
gatctcttat tttcagacac agtctgaacc ggcctattgt ggtttggcta gcctttctat 2640
ggtcttgaat gcccttgcta ttgatccagg aagaaaatgg aaaggtaact ctgctatcat 2700
caagtgaatc tgtgttccta tccttccgga ctatatcgat gattttgatc ttcacttttt 2760
catggccttg ccttctgaat tgttaataag gtctcaggct ctttatatgt ttatttcctt 2820
gatgaaggtc tttacatctt tattttccaa taatttcgcc tatcccgacc tgcccatgtt 2880
agttataaga tatagcacag agatgtgtag ttcactttgt tttttattgt tgagatctct 2940
attaaaaaaa ataagttgat gccttgtctg tgagctttgt aagttaatct gatatgttgt 3000
gatgcattgg catgagtctg atatcatctg ttctcaacat gaatcctagc cactgttgct 3060
ggacaccttc caaagatcta aactgctata tgtgcaactt aatatttttt cttacctcat 3120
ttattgaagg tgtttattct ctggataatt gttcatcaaa gttgccgttc tagtgcagtt 3180
ttgcaaactt aaggctttaa cagattagac ctcggtaata taattctgag aactccttta 3240
gagttaatat ctgtgtctgt atttcgttcc atttgcattt aacagaaaag ggttcatgca 3300
tctaggagct gttgctctga gttgcctcat gcatattatt tgttgatgtc catttttcca 3360
aacttcatgg tcacatgaaa tcattcttat tgtcagtttc tgtttccaat ttacatgaac 3420
tagaaacatc ttagataata ttttgtttca atgttcacat cttaaaaact tgaaaacctt 3480
ttctttccac caattaactt atatgttagg gtcatatctt ggtcaccaat gtctactgat 3540
attaaagagt cagtttggaa aagaaggagc ttggtgagga cagctttaac gttcttagct 3600
ttcatcacct gaaactgttt gatgcttgta cgtttctctt tcgaacttgg ttgttcatat 3660
cctttttata gtctgcttgc gtcaatgagc ttggagttta ttatcttatc agcttcaaca 3720
aactgtcagg gccttggaga tggtttgatg aatctatgtt ggactgttgt gagcctctgg 3780
agaaggttaa agctaaaggg atctcttttg ggaaagtggt atgtttggct cactgtgcag 3840
gagcgaaggt agaagctttt cgctctaatc atagtactat tgatgacttc cgtaaacaag 3900
tcatggcctg cactactagt gataattgtc atctgatctc atcatatcat agaggccttt 3960
ttaagcaggt aaatgtaaac atagcttctc tatccccatg cttatgattg tgaagaagta 4020
tattgctgca tcgggagttt gaccacacag gatctactga atcttatggc agacaggttc 4080
gggccacttt tcgcctattg gtggttatca cgtgggaaag gatatggcac tgattctaga 4140
tgttgcgagg tttaaatatc ctcctcattg ggttcccctc cctctccttt gggaagccat 4200
gaacacaatt gatgaagcta caggattaca tagggggtat gcacttccag ttagctgtgc 4260
tgtgatattg atattgattt tcataatggc tatgagttgt tgcctgttag catgctcttt 4320
accttgaaca gcgtctcgtt catgcttttt agctgtcaac tgatactggc taagcattta 4380
gcttaaggaa tataaatatg tagaagaagt agttttacta tgtgttttgg tcttcctctt 4440
ataattaaga ctaaaattgg aaattaaatg ctgaactctt tcggcactgc ttctggtctt 4500
cttcaaacat aactgtagat tctcttcatt attttctctt cctattctcc ttctgctcaa 4560
atttagcggt ccgtctatat ccatctcaca cttgatatat ttttatcatt ctgcagcatg 4620
gatttcagtg acttatgtgc aaaaacataa ttttcaggtt tatgctaatt actaagcttc 4680
acagagctcc tgcactgcta tataccctgg taaggtttaa gtagctgcta ttatgttatt 4740
cgctttaaat ataaactcct tcgaagttcg aacaaactat aagaagcaac ttctattact 4800
gcttgtgaga tcctttgcta gttgattctt ttcagtacac cagcttggtc ggatagttgt 4860
taactactac tttacctacc ttttacatgc tataacataa tgataacatc tttgtcaaat 4920
gcttgggaat tgtggtctta gtgccaggtg attagcttgg acttttgttt caaaactatg 4980
atgtcattgc aatatttatg gagtttaaca acattggcct ttagaactat ttaacgtgta 5040
attttttatg taaattttct ataataaaga gggaggaatg tactgtattg aattactcct 5100
ggattttctt ctttctgcga ctagtcatgt attttgaatg gtgaacttct acagagctgt 5160
aaacatgaga gttgggtcac tatctcaaag catttgatgg atgatcttcc tgtcctgtta 5220
agttctgaga atgtgaaggg cataaaagat gttctctcta ctgttctttc aaatctacct 5280
tcaaattttg ttgaattcat aaagtggata gcggaagttc gaaggcaaga ggagaatggt 5340
caaaatttga gtgacgagga gaaaggaagg ctagctatca aggtaaggta tctgaagaaa 5400
tttagtaaat agaaagaaaa aaaagaaggc tcctagaaat ggtcatgtag atttgatcgg 5460
gtaacttgca ggataggtga ttatttatga gttcagtaac cactcttacc ttactttgca 5520
ggaagaggta ttgaaacaag tgcaggacac tcctctttat aagcatgtca caagcatttt 5580
attttcaaaa aattctatct gccagtcaaa agcagcatca gacagcagtt tggctaatgt 5640
tgccgcaaac atttgctgcc aaggagcagg tctttttgca ggaagatctg gttcatcgga 5700
taggttttgc tgtctccaaa catgtgttag atgctacaga gctaccgggg gcaattctgc 5760
tacagtggtg tctgggacag ttgtaaatgg gaatggggag cagggggttg atgttctggt 5820
ccctacatct ctagcaaaga ctagctgctg tccctcaggg caagctggtt gctcgccaat 5880
gcaccctgca agtaacgatg tgctgacagc actattgctg gcattacctc cacatacatg 5940
gtctcgaata aaagatacga aggtcttgca ggaaatagag aaccttgtct cagcagagaa 6000
cctgcctcct ttgctgcaag aagaggtatc tttgtacatt tgtctcttat cacatttgct 6060
ttcttgtttt aaaattcctc tttgttgttt gtgttgggaa gcccagaact ggaggattgc 6120
agtaggttaa gggccagcag aaagctaggc aattttatga ttaatctaac aatattgaaa 6180
tattggaaag aaaggagtcc aaatagagtt aaatggatgt ccaggattta tatagcgacc 6240
ccaactagct taggattgag gcttttgttt tgttgttgtc attttgtatt gggaaattca 6300
catgagcact tagaatggcc ttcataacta tatcagagct ttctacctct tttctaattg 6360
gtagttctta ttatggccca atagaagatt tttcctgcct aagattatct atttcactgc 6420
actgcatatt ttatgaaaaa tagtctaatc ctcttgaagc aggttatcat atcataacag 6480
gcttaactga tttttcattt ctagtctatc tgaaggagca tataactgat aaatcttatg 6540
cataatgaga cctaaggcgc ataactctgt cttctgcatg ttattcagcc gtttaatgag 6600
tttgtctctc atgctatgca tctttgacca attaacttag ttcaacggta tgagttatga 6660
aattctgaga tgtgtgctgg gttgatgaac tagtagatac gctctgagaa tgcattttgt 6720
tctaatgact acttaaatct ttcacttggt taaccattaa acatggtgta atatacttct 6780
gaatatcctt ttgggcgact gcagattttg cacctgcgag gacagttcct cctcctcaag 6840
aaatgcaagg ataacaaggt agaagaagat ttagctgcac ctcccttcta gctttgcttt 6900
cc 6902
<210> 41
<211> 1507
<212> DNA
<213> Artificial Sequence
<220>
<223> PCSt_CDS sequence of PCSst
<400> 41
atggcgatgg cgggtttata tcggcgagtt cttccgtcgc ctccggctgt tgatttcgct 60
tctactgaag gaaagcaact ttttttggag gccatccaga atggaaacaa tggaaggatt 120
tttcaagttg atctcttatt ttcagacaca gtctgaaccg gcctattgtg gtttggctag 180
cctttctatg gtcttgaatg cccttgctat tgatccagga agaaaatgga aagggccttg 240
gagatggttt gatgaatcta tgttggactg ttgtgagcct ctggagaagg ttaaagctaa 300
agggatctct tttgggaaag tggtatgttt ggctcactgt gcaggagcga aggtagaagc 360
ttttcgctct aatcatagta ctattgatga cttccgtaaa caagtcatgg cctgcactac 420
tagtgataat tgtcatctga tctcatcata tcatagaggc ctttttaagc agacaggttc 480
gggccacttt tcgcctattg gtggttatca cgtgggaaag gatatggcac tgattctaga 540
tgttgcgagg tttaaatatc ctcctcattg ggttcccctc cctctccttt gggaagccat 600
gaacacaatt gatgaagcta caggattaca tagggggttt atgctaatta ctaagcttca 660
cagagctcct gcactgctat ataccctgag ctgtaaacat gagagttggg tcactatctc 720
aaagcatttg atggatgatc ttcctgtcct gttaagttct gagaatgtga agggcataaa 780
agatgttctc tctactgttc tttcaaatct accttcaaat tttgttgaat tcataaagtg 840
gatagcggaa gttcgaaggc aagaggagaa tggtcaaaat ttgagtgacg aggagaaagg 900
aaggctagct atcaaggaag aggtattgaa acaagtgcag gacactcctc tttataagca 960
tgtcacaagc attttatttt caaaaaattc tatctgccag tcaaaagcag catcagacag 1020
cagtttggct aatgttgccg caaacatttg ctgccaagga gcaggtcttt ttgcaggaag 1080
atctggttca tcggataggt tttgctgtct ccaaacatgt gttagatgct acagagctac 1140
cgggggcaat tctgctacag tggtgtctgg gacagttgta aatgggaatg gggagcaggg 1200
ggttgatgtt ctggtcccta catctctagc aaagactagc tgctgtccct cagggcaagc 1260
tggttgctcg ccaatgcacc ctgcaagtaa cgatgtgctg acagcactat tgctggcatt 1320
acctccacat acatggtctc gaataaaaga tacgaaggtc ttgcaggaaa tagagaacct 1380
tgtctcagca gagaacctgc ctcctttgct gcaagaagag attttgcacc tgcgaggaca 1440
gttcctcctc ctcaagaaat gcaaggataa caaggtagaa gaagatttag ctgcacctcc 1500
cttctag 1507
<210> 42
<211> 502
<212> PRT
<213> Artificial Sequence
<220>
<223> PCSt_amino acid sequence of PCSst
<400> 42
Met Ala Met Ala Gly Leu Tyr Arg Arg Val Leu Pro Ser Pro Pro Ala
1 5 10 15
Val Asp Phe Ala Ser Thr Glu Gly Lys Gln Leu Phe Leu Glu Ala Ile
20 25 30
Gln Asn Gly Asn Asn Gly Arg Ile Phe Gln Val Asp Leu Leu Phe Ser
35 40 45
Asp Thr Val *** Thr Gly Leu Leu Trp Phe Gly *** Pro Phe Tyr Gly
50 55 60
Leu Glu Cys Pro Cys Tyr *** Ser Arg Lys Lys Met Glu Arg Ala Leu
65 70 75 80
Glu Met Val *** *** Ile Tyr Val Gly Leu Leu *** Ala Ser Gly Glu
85 90 95
Gly *** Ser *** Arg Asp Leu Phe Trp Glu Ser Gly Met Phe Gly Ser
100 105 110
Leu Cys Arg Ser Glu Gly Arg Ser Phe Ser Leu *** Ser *** Tyr Tyr
115 120 125
*** *** Leu Pro *** Thr Ser His Gly Leu His Tyr *** *** *** Leu
130 135 140
Ser Ser Asp Leu Ile Ile Ser *** Arg Pro Phe *** Ala Asp Arg Phe
145 150 155 160
Gly Pro Leu Phe Ala Tyr Trp Trp Leu Ser Arg Gly Lys Gly Tyr Gly
165 170 175
Thr Asp Ser Arg Cys Cys Glu Val *** Ile Ser Ser Ser Leu Gly Ser
180 185 190
Pro Pro Ser Pro Leu Gly Ser His Glu His Asn *** *** Ser Tyr Arg
195 200 205
Ile Thr *** Gly Val Tyr Ala Asn Tyr *** Ala Ser Gln Ser Ser Cys
210 215 220
Thr Ala Ile Tyr Pro Glu Leu *** Thr *** Glu Leu Gly His Tyr Leu
225 230 235 240
Lys Ala Phe Asp Gly *** Ser Ser Cys Pro Val Lys Phe *** Glu Cys
245 250 255
Glu Gly His Lys Arg Cys Ser Leu Tyr Cys Ser Phe Lys Ser Thr Phe
260 265 270
Lys Phe Cys *** Ile His Lys Val Asp Ser Gly Ser Ser Lys Ala Arg
275 280 285
Gly Glu Trp Ser Lys Phe Glu *** Arg Gly Glu Arg Lys Ala Ser Tyr
290 295 300
Gln Gly Arg Gly Ile Glu Thr Ser Ala Gly His Ser Ser Leu *** Ala
305 310 315 320
Cys His Lys His Phe Ile Phe Lys Lys Phe Tyr Leu Pro Val Lys Ser
325 330 335
Ser Ile Arg Gln Gln Phe Gly *** Cys Cys Arg Lys His Leu Leu Pro
340 345 350
Arg Ser Arg Ser Phe Cys Arg Lys Ile Trp Phe Ile Gly *** Val Leu
355 360 365
Leu Ser Pro Asn Met Cys *** Met Leu Gln Ser Tyr Arg Gly Gln Phe
370 375 380
Cys Tyr Ser Gly Val Trp Asp Ser Cys Lys Trp Glu Trp Gly Ala Gly
385 390 395 400
Gly *** Cys Ser Gly Pro Tyr Ile Ser Ser Lys Asp *** Leu Leu Ser
405 410 415
Leu Arg Ala Ser Trp Leu Leu Ala Asn Ala Pro Cys Lys *** Arg Cys
420 425 430
Ala Asp Ser Thr Ile Ala Gly Ile Thr Ser Thr Tyr Met Val Ser Asn
435 440 445
Lys Arg Tyr Glu Gly Leu Ala Gly Asn Arg Glu Pro Cys Leu Ser Arg
450 455 460
Glu Pro Ala Ser Phe Ala Ala Arg Arg Asp Phe Ala Pro Ala Arg Thr
465 470 475 480
Val Pro Pro Pro Gln Glu Met Gln Gly *** Gln Gly Arg Arg Arg Phe
485 490 495
Ser Cys Thr Ser Leu Leu
500
<210> 43
<211> 304
<212> DNA
<213> Artificial Sequence
<220>
<223> P_U6 sequence
<400> 43
agaaatctca aaattccggc agaacaattt tgaatctcga tccgtagaaa cgagacggtc 60
attgttttag ttccaccacg attatatttg aaatttacgt gagtgtgagt gagacttgca 120
taagaaaata aaatctttag ttgggaaaaa attcaataat ataaatgggc ttgagaagga 180
agcgagggat aggccttttt ctaaaatagg cccatttaag ctattaacaa tcttcaaaag 240
taccacagcg cttaggtaaa gaaagcagct gagtttatat atggttagag acgaagtagt 300
gatt 304
Claims (12)
- 모세포에 비하여 PCS (Phytochelatin synthase) 유전자 또는 상기 PCS 유전자에 의해 코딩되는 단백질의 발현 또는 활성이 감소된 식물 세포.
- 청구항 1에 있어서, 상기 PCS 유전자는 실베스트리스 꽃담배 (Nicotiana sylvestris)로부터 유래된 PCS 유전자 (NtPCSs), 토멘토시포르미스 꽃담배 (Nicotiana tomentosiformis)로부터 유래된 PCS 유전자 (NtPCSt), 또는 이들의 조합(NtPCSst)인 것인 식물 세포.
- 청구항 1에 있어서, RNA 간섭(RNAi; RNA interference) 시스템, 메가뉴클레아제(Meganuclease) 시스템, 징크핑거 뉴클레아제(Zinc finger nuclease) 시스템, 탈렌(TALEN; Transcription Activator-Like Effector Nuclease) 시스템, CRISPR/Cas9 시스템, X-선 조사, 감마선 조사, 에틸 메탄설포네이트(ethyl methanesulfonate) 처리, 다이메틸 설페이트(dimethyl sulfate) 처리로 이루어진 군으로부터 선택되는 적어도 하나에 의해 유전적으로 조작된 것인 식물 세포.
- 청구항 1에 있어서, 상기 식물은 재배담배 (Nicotiana tabacum)인 것인 식물 세포.
- 청구항 1 내지 4 중 어느 한 항의 식물 세포를 포함하는 중금속 흡수량이 저감된 식물.
- 식물체의 모세포에 비하여 PCS 유전자 또는 상기 PCS 유전자에 의해 코딩되는 단백질의 발현 또는 활성을 감소시키는 단계를 포함하는 식물체 내 중금속을 감소시키는 방법.
- 청구항 6에 있어서, 상기 PCS 유전자 또는 PC 유전자에 의해 코딩되는 단백질의 발현 또는 활성을 감소시키는 단계에서 RNA 간섭(RNAi; RNA interference) 시스템, 메가뉴클레아제(Meganuclease) 시스템, 징크핑거 뉴클레아제(Zinc finger nuclease) 시스템, 탈렌(TALEN; Transcription Activator-Like Effector Nuclease) 시스템, CRISPR/Cas9 시스템, X-선 조사, 감마선 조사, 에틸 메탄설포네이트(ethyl methanesulfonate) 처리, 다이메틸 설페이트(dimethyl sulfate) 처리로 이루어진 군으로부터 선택되는 적어도 하나를 수행하는 것인 방법.
- 청구항 6에 있어서, 상기 중금속은 카드뮴, 비소, 안티몬, 납, 수은, 크롬, 주석, 아연, 바륨, 비스무트, 니켈, 코발트, 망간, 철, 구리 및 바나듐으로 이루어진 군으로부터 선택된 하나 이상인 것인 방법.
- PCS 유전자를 표적으로 하는 단일 가이드 RNA를 포함하는 크리스퍼-카스9 (CRISPR-Cas9) 재조합 벡터.
- 청구항 9에 있어서, 상기 PCS 유전자는 실베스트리스 꽃담배 (Nicotiana sylvestris)로부터 유래된 PCS 유전자 (NtPCSs), 또는 토멘토시포르미스 꽃담배 (Nicotiana tomentosiformis)로부터 유래된 PCS 유전자 (NtPCSt)인 것인 재조합 벡터.
- 청구항 10에 있어서, 상기 NtPCSs 유전자를 표적으로 하는 sgRNA는 서열번호 1 또는 서열번호 2의 염기서열로 이루어진 것이고, NtPCSt 유전자를 표적으로 하는 sgRNA는 서열번호 3 또는 서열번호 4의 염기서열로 이루어진 것이고, 상기 NtPCSs 유전자 및 NtPCSt 유전자를 표적으로 하는 sgRNA는 서열번호 5 또는 서열번호 6의 염기서열로 이루어진 것인 재조합 벡터.
- 청구항 9 내지 11 중 어느 한 항의 재조합 벡터로 식물 세포를 형질전환시키는 단계를 포함하는 중금속 흡수량이 저감된 식물체를 제조하는 방법.
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200114891A KR102522125B1 (ko) | 2020-09-08 | 2020-09-08 | 중금속 저감된 식물체 및 이의 제조방법 |
PCT/KR2021/011059 WO2022055144A1 (ko) | 2020-09-08 | 2021-08-19 | 중금속 저감된 형질전환 식물체 및 이의 제조방법 |
US17/642,050 US20240052360A1 (en) | 2020-09-08 | 2021-08-19 | Transgenic plant with reduced heavy metals and methods for preparation thereof |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200114891A KR102522125B1 (ko) | 2020-09-08 | 2020-09-08 | 중금속 저감된 식물체 및 이의 제조방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20220032937A true KR20220032937A (ko) | 2022-03-15 |
KR102522125B1 KR102522125B1 (ko) | 2023-04-14 |
Family
ID=80630364
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020200114891A KR102522125B1 (ko) | 2020-09-08 | 2020-09-08 | 중금속 저감된 식물체 및 이의 제조방법 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20240052360A1 (ko) |
KR (1) | KR102522125B1 (ko) |
WO (1) | WO2022055144A1 (ko) |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10370675B2 (en) * | 2016-05-24 | 2019-08-06 | The Trustees Of The University Of Pennsylvania | Transgenic plants exhibiting enhanced phytochelatin-based heavy metal tolerance and methods of use thereof |
-
2020
- 2020-09-08 KR KR1020200114891A patent/KR102522125B1/ko active IP Right Grant
-
2021
- 2021-08-19 US US17/642,050 patent/US20240052360A1/en active Pending
- 2021-08-19 WO PCT/KR2021/011059 patent/WO2022055144A1/ko active Application Filing
Non-Patent Citations (3)
Title |
---|
Byoung Doo Lee, NtPCS1 plays important roles in cadmium and arsenic tolerance and in early plant development in tobacco, Plant Biotechnol Rep. (2015) 9, pp.107-114* * |
Maria De Benedictis, The Arabidopsis thaliana Knockout Mutant for cad1-3 Is Defective in Callose Deposition~But Shows an Increased Stem Lignification, Front. Plant Sci., 2018, vol9, article 19* * |
RAI, P. K. 등, 'Molecular mechanisms in phytoremediation of environmental contaminants and prospects of engineered transgenic plants/microbes', Science of the Total Environment, 2019, 705권, pp.1-24* * |
Also Published As
Publication number | Publication date |
---|---|
US20240052360A1 (en) | 2024-02-15 |
WO2022055144A1 (ko) | 2022-03-17 |
KR102522125B1 (ko) | 2023-04-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116157144A (zh) | 尿嘧啶稳定蛋白及其活性片段和变体以及使用方法 | |
CN111902541A (zh) | 增加细胞中感兴趣的核酸分子表达水平的方法 | |
WO2018115389A1 (en) | Methods of targeted genetic alteration in plant cells | |
CN116286742B (zh) | CasD蛋白、CRISPR/CasD基因编辑系统及其在植物基因编辑中的应用 | |
US11702670B2 (en) | Compositions and methods for improving crop yields through trait stacking | |
KR102522125B1 (ko) | 중금속 저감된 식물체 및 이의 제조방법 | |
US12024711B2 (en) | Methods and compositions for generating dominant short stature alleles using genome editing | |
KR102389358B1 (ko) | 신규한 니코틴 생합성 유전자 및 그의 용도 | |
EP4130262A1 (en) | Plant cells having engineered qpt gene and method for using same | |
KR102675540B1 (ko) | 유전자 교정을 이용한 병 저항성이 조절된 토마토 식물체의 제조방법 및 상기 제조방법에 의해 제조된 토마토 식물체 | |
CN115216488B (zh) | 创制水稻大长粒型新种质或大长粒型矮杆新种质的方法及其应用 | |
CN113846120B (zh) | 蛋白质TaTIN103在调控小麦分蘖中的应用 | |
US20220195450A1 (en) | Methods and compositions for generating dominant short stature alleles using genome editing | |
CN116063425A (zh) | TaGS蛋白质或生物材料在调控植物耐盐碱性、或植物育种中的应用 | |
KR20230048237A (ko) | 유전자 교정을 이용한 꼬투리 열개가 지연된 배추과 작물의 제조방법 및 상기 제조방법에 의해 제조된 배추과 작물 | |
CN116134143A (zh) | 多种抗病基因及其基因组堆叠件 | |
CN117384917A (zh) | 一种烟草果胶甲酯酶抑制子基因NtPMEI及其应用和方法 | |
WO2023230459A2 (en) | Compositions and methods for targeting donor polynucelotides in soybean genomic loci | |
KR20240031315A (ko) | 바나나 과실의 갈변 지연 또는 예방 | |
WO2023192855A2 (en) | Compositions and methods for enhancing corn traits and yield using genome editing | |
WO2023192860A2 (en) | Compositions and methods for enhancing corn traits and yield using genome editing | |
WO2023275245A1 (en) | Method for editing banana genes | |
KR20230089306A (ko) | 밀 수발아 내성 증진을 위한 유전자 편집용 조성물 및 이를 이용한 유전자 편집방법 | |
CN117866976A (zh) | 水稻OsOGG1基因在调控水稻对稻瘟病抗性中的应用 | |
CN117778457A (zh) | 蛋白ZmERF018及其编码基因在玉米干旱响应中的应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |