KR20240011835A - 재조합 단백질 생성 - Google Patents
재조합 단백질 생성 Download PDFInfo
- Publication number
- KR20240011835A KR20240011835A KR1020237045030A KR20237045030A KR20240011835A KR 20240011835 A KR20240011835 A KR 20240011835A KR 1020237045030 A KR1020237045030 A KR 1020237045030A KR 20237045030 A KR20237045030 A KR 20237045030A KR 20240011835 A KR20240011835 A KR 20240011835A
- Authority
- KR
- South Korea
- Prior art keywords
- ala
- thr
- sequence
- cys
- terminator
- Prior art date
Links
- 230000014616 translation Effects 0.000 title abstract description 25
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 title description 6
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 title description 6
- 230000014509 gene expression Effects 0.000 claims abstract description 90
- 239000013604 expression vector Substances 0.000 claims abstract description 62
- 238000000034 method Methods 0.000 claims abstract description 13
- 108090000623 proteins and genes Proteins 0.000 claims description 85
- 239000013598 vector Substances 0.000 claims description 59
- 102000004169 proteins and genes Human genes 0.000 claims description 51
- 241000196324 Embryophyta Species 0.000 claims description 45
- 239000012634 fragment Substances 0.000 claims description 28
- 239000011159 matrix material Substances 0.000 claims description 25
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 19
- 108700026244 Open Reading Frames Proteins 0.000 claims description 19
- 150000007523 nucleic acids Chemical group 0.000 claims description 18
- 241000207746 Nicotiana benthamiana Species 0.000 claims description 13
- 244000061176 Nicotiana tabacum Species 0.000 claims description 13
- 108700007698 Genetic Terminator Regions Proteins 0.000 claims description 10
- 230000030279 gene silencing Effects 0.000 claims description 10
- 108020004707 nucleic acids Proteins 0.000 claims description 10
- 102000039446 nucleic acids Human genes 0.000 claims description 10
- 229920001184 polypeptide Polymers 0.000 claims description 10
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 10
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 10
- 244000061456 Solanum tuberosum Species 0.000 claims description 9
- 241000219195 Arabidopsis thaliana Species 0.000 claims description 8
- 230000009977 dual effect Effects 0.000 claims description 8
- 230000010474 transient expression Effects 0.000 claims description 8
- 241000723792 Tobacco etch virus Species 0.000 claims description 7
- 108020003589 5' Untranslated Regions Proteins 0.000 claims description 6
- 108700001094 Plant Genes Proteins 0.000 claims description 6
- 235000002595 Solanum tuberosum Nutrition 0.000 claims description 6
- 241000208125 Nicotiana Species 0.000 claims description 5
- 101000875535 Nicotiana tabacum Extensin Proteins 0.000 claims description 4
- 241000700605 Viruses Species 0.000 claims description 4
- 101150037626 HSP18 gene Proteins 0.000 claims description 2
- 241001611556 Pluchea odorata Species 0.000 claims description 2
- 241001464837 Viridiplantae Species 0.000 claims description 2
- 230000010473 stable expression Effects 0.000 claims 1
- 230000001131 transforming effect Effects 0.000 claims 1
- 230000001105 regulatory effect Effects 0.000 abstract description 5
- 230000002708 enhancing effect Effects 0.000 abstract description 2
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 45
- 235000018102 proteins Nutrition 0.000 description 44
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 32
- OEVCHROQUIVQFZ-YTLHQDLWSA-N Ala-Thr-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](C)C(O)=O OEVCHROQUIVQFZ-YTLHQDLWSA-N 0.000 description 31
- 230000035882 stress Effects 0.000 description 30
- KUFVXLQLDHJVOG-SHGPDSBTSA-N Ala-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C)N)O KUFVXLQLDHJVOG-SHGPDSBTSA-N 0.000 description 28
- NDZYTIMDOZMECO-SHGPDSBTSA-N Thr-Thr-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O NDZYTIMDOZMECO-SHGPDSBTSA-N 0.000 description 28
- 108020004414 DNA Proteins 0.000 description 25
- IGROJMCBGRFRGI-YTLHQDLWSA-N Thr-Ala-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O IGROJMCBGRFRGI-YTLHQDLWSA-N 0.000 description 25
- 108010061238 threonyl-glycine Proteins 0.000 description 24
- CAJFZCICSVBOJK-SHGPDSBTSA-N Thr-Ala-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAJFZCICSVBOJK-SHGPDSBTSA-N 0.000 description 23
- COYHRQWNJDJCNA-NUJDXYNKSA-N Thr-Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O COYHRQWNJDJCNA-NUJDXYNKSA-N 0.000 description 23
- UWQJHXKARZWDIJ-ZLUOBGJFSA-N Ala-Ala-Cys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(O)=O UWQJHXKARZWDIJ-ZLUOBGJFSA-N 0.000 description 21
- 108010047495 alanylglycine Proteins 0.000 description 19
- TZQWJCGVCIJDMU-HEIBUPTGSA-N Thr-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)O)N)O TZQWJCGVCIJDMU-HEIBUPTGSA-N 0.000 description 16
- YFXFOZPXVFPBDH-VZFHVOOUSA-N Cys-Ala-Thr Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)CS)C(O)=O YFXFOZPXVFPBDH-VZFHVOOUSA-N 0.000 description 15
- 101710136061 Proteinase inhibitor type-2 Proteins 0.000 description 15
- TVYMKYUSZSVOAG-ZLUOBGJFSA-N Cys-Ala-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O TVYMKYUSZSVOAG-ZLUOBGJFSA-N 0.000 description 14
- SLUWOCTZVGMURC-BFHQHQDPSA-N Thr-Gly-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O SLUWOCTZVGMURC-BFHQHQDPSA-N 0.000 description 14
- DECCMEWNXSNSDO-ZLUOBGJFSA-N Ala-Cys-Ala Chemical compound C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O DECCMEWNXSNSDO-ZLUOBGJFSA-N 0.000 description 13
- 108010004073 cysteinylcysteine Proteins 0.000 description 13
- UZJDBCHMIQXLOQ-HEIBUPTGSA-N Thr-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O UZJDBCHMIQXLOQ-HEIBUPTGSA-N 0.000 description 12
- UQCNIMDPYICBTR-KYNKHSRBSA-N Thr-Thr-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UQCNIMDPYICBTR-KYNKHSRBSA-N 0.000 description 12
- OBVSBEYOMDWLRJ-BFHQHQDPSA-N Ala-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N OBVSBEYOMDWLRJ-BFHQHQDPSA-N 0.000 description 11
- PYTZFYUXZZHOAD-WHFBIAKZSA-N Gly-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)CN PYTZFYUXZZHOAD-WHFBIAKZSA-N 0.000 description 11
- 102100036705 Interleukin-23 subunit alpha Human genes 0.000 description 11
- KBBRNEDOYWMIJP-KYNKHSRBSA-N Thr-Gly-Thr Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KBBRNEDOYWMIJP-KYNKHSRBSA-N 0.000 description 11
- 108010016616 cysteinylglycine Proteins 0.000 description 11
- ZVFVBBGVOILKPO-WHFBIAKZSA-N Ala-Gly-Ala Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O ZVFVBBGVOILKPO-WHFBIAKZSA-N 0.000 description 10
- QSDKBRMVXSWAQE-BFHQHQDPSA-N Gly-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN QSDKBRMVXSWAQE-BFHQHQDPSA-N 0.000 description 10
- TVTZEOHWHUVYCG-KYNKHSRBSA-N Gly-Thr-Thr Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O TVTZEOHWHUVYCG-KYNKHSRBSA-N 0.000 description 10
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 9
- 241000701489 Cauliflower mosaic virus Species 0.000 description 9
- NAPULYCVEVVFRB-HEIBUPTGSA-N Cys-Thr-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](N)CS NAPULYCVEVVFRB-HEIBUPTGSA-N 0.000 description 9
- FFJQHWKSGAWSTJ-BFHQHQDPSA-N Gly-Thr-Ala Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O FFJQHWKSGAWSTJ-BFHQHQDPSA-N 0.000 description 9
- 108010079364 N-glycylalanine Proteins 0.000 description 9
- 238000009825 accumulation Methods 0.000 description 9
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 9
- SBGXWWCLHIOABR-UHFFFAOYSA-N Ala Ala Gly Ala Chemical compound CC(N)C(=O)NC(C)C(=O)NCC(=O)NC(C)C(O)=O SBGXWWCLHIOABR-UHFFFAOYSA-N 0.000 description 8
- NRVQLLDIJJEIIZ-VZFHVOOUSA-N Cys-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CS)N)O NRVQLLDIJJEIIZ-VZFHVOOUSA-N 0.000 description 8
- QWMPARMKIDVBLV-VZFHVOOUSA-N Thr-Cys-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O QWMPARMKIDVBLV-VZFHVOOUSA-N 0.000 description 8
- WYKJENSCCRJLRC-ZDLURKLDSA-N Thr-Gly-Cys Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N)O WYKJENSCCRJLRC-ZDLURKLDSA-N 0.000 description 8
- 210000004027 cell Anatomy 0.000 description 8
- 108010089804 glycyl-threonine Proteins 0.000 description 8
- 238000011144 upstream manufacturing Methods 0.000 description 8
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 7
- QKHWNPQNOHEFST-VZFHVOOUSA-N Ala-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C)N)O QKHWNPQNOHEFST-VZFHVOOUSA-N 0.000 description 7
- WNHNMKOFKCHKKD-BFHQHQDPSA-N Ala-Thr-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O WNHNMKOFKCHKKD-BFHQHQDPSA-N 0.000 description 7
- CVOZXIPULQQFNY-ZLUOBGJFSA-N Cys-Ala-Cys Chemical compound C[C@H](NC(=O)[C@@H](N)CS)C(=O)N[C@@H](CS)C(O)=O CVOZXIPULQQFNY-ZLUOBGJFSA-N 0.000 description 7
- JQFILXICXLDTRR-FBCQKBJTSA-N Gly-Thr-Gly Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)NCC(O)=O JQFILXICXLDTRR-FBCQKBJTSA-N 0.000 description 7
- 101100071586 Medicago sativa HSP18.2 gene Proteins 0.000 description 7
- XPNSAQMEAVSQRD-FBCQKBJTSA-N Thr-Gly-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)NCC(O)=O XPNSAQMEAVSQRD-FBCQKBJTSA-N 0.000 description 7
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 7
- 238000001764 infiltration Methods 0.000 description 7
- FTTZLFIEUQHLHH-BWBBJGPYSA-N Cys-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CS)N)O FTTZLFIEUQHLHH-BWBBJGPYSA-N 0.000 description 6
- YRNBANYVJJBGDI-VZFHVOOUSA-N Thr-Ala-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(=O)O)N)O YRNBANYVJJBGDI-VZFHVOOUSA-N 0.000 description 6
- 238000010367 cloning Methods 0.000 description 6
- 230000008595 infiltration Effects 0.000 description 6
- 238000011002 quantification Methods 0.000 description 6
- KRHRBKYBJXMYBB-WHFBIAKZSA-N Ala-Cys-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CS)C(=O)NCC(O)=O KRHRBKYBJXMYBB-WHFBIAKZSA-N 0.000 description 5
- UQJUGHFKNKGHFQ-VZFHVOOUSA-N Ala-Cys-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UQJUGHFKNKGHFQ-VZFHVOOUSA-N 0.000 description 5
- VGPWRRFOPXVGOH-BYPYZUCNSA-N Ala-Gly-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)NCC(O)=O VGPWRRFOPXVGOH-BYPYZUCNSA-N 0.000 description 5
- GVVKYKCOFMMTKZ-WHFBIAKZSA-N Gly-Cys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CS)NC(=O)CN GVVKYKCOFMMTKZ-WHFBIAKZSA-N 0.000 description 5
- DGOJNGCGEYOBKN-BWBBJGPYSA-N Thr-Cys-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)O)N)O DGOJNGCGEYOBKN-BWBBJGPYSA-N 0.000 description 5
- 239000003623 enhancer Substances 0.000 description 5
- 230000006698 induction Effects 0.000 description 5
- 239000013612 plasmid Substances 0.000 description 5
- LJFNNUBZSZCZFN-WHFBIAKZSA-N Ala-Gly-Cys Chemical compound N[C@@H](C)C(=O)NCC(=O)N[C@@H](CS)C(=O)O LJFNNUBZSZCZFN-WHFBIAKZSA-N 0.000 description 4
- 108020004705 Codon Proteins 0.000 description 4
- SMYXEYRYCLIPIL-ZLUOBGJFSA-N Cys-Cys-Cys Chemical compound SC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(O)=O SMYXEYRYCLIPIL-ZLUOBGJFSA-N 0.000 description 4
- ZJBWJHQDOIMVLM-WHFBIAKZSA-N Cys-Cys-Gly Chemical compound SC[C@H](N)C(=O)N[C@@H](CS)C(=O)NCC(O)=O ZJBWJHQDOIMVLM-WHFBIAKZSA-N 0.000 description 4
- CVLIHKBUPSFRQP-WHFBIAKZSA-N Cys-Gly-Ala Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](C)C(O)=O CVLIHKBUPSFRQP-WHFBIAKZSA-N 0.000 description 4
- 238000002965 ELISA Methods 0.000 description 4
- UQJNXZSSGQIPIQ-FBCQKBJTSA-N Gly-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)CN UQJNXZSSGQIPIQ-FBCQKBJTSA-N 0.000 description 4
- 108091029795 Intergenic region Proteins 0.000 description 4
- TYVAWPFQYFPSBR-BFHQHQDPSA-N Thr-Ala-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)NCC(O)=O TYVAWPFQYFPSBR-BFHQHQDPSA-N 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- RCQRKPUXJAGEEC-ZLUOBGJFSA-N Ala-Cys-Cys Chemical compound C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(O)=O RCQRKPUXJAGEEC-ZLUOBGJFSA-N 0.000 description 3
- VWEWCZSUWOEEFM-WDSKDSINSA-N Ala-Gly-Ala-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(=O)NCC(O)=O VWEWCZSUWOEEFM-WDSKDSINSA-N 0.000 description 3
- 101100332654 Arabidopsis thaliana ECA1 gene Proteins 0.000 description 3
- 244000105624 Arachis hypogaea Species 0.000 description 3
- 101000908384 Bos taurus Dipeptidyl peptidase 4 Proteins 0.000 description 3
- AEJSNWMRPXAKCW-WHFBIAKZSA-N Cys-Ala-Gly Chemical compound SC[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O AEJSNWMRPXAKCW-WHFBIAKZSA-N 0.000 description 3
- HYKFOHGZGLOCAY-ZLUOBGJFSA-N Cys-Cys-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O HYKFOHGZGLOCAY-ZLUOBGJFSA-N 0.000 description 3
- 101710089945 Defensin-like protein 14 Proteins 0.000 description 3
- 238000008157 ELISA kit Methods 0.000 description 3
- CCQOOWAONKGYKQ-BYPYZUCNSA-N Gly-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)CN CCQOOWAONKGYKQ-BYPYZUCNSA-N 0.000 description 3
- ZKJZBRHRWKLVSJ-ZDLURKLDSA-N Gly-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN)O ZKJZBRHRWKLVSJ-ZDLURKLDSA-N 0.000 description 3
- 235000010469 Glycine max Nutrition 0.000 description 3
- 244000068988 Glycine max Species 0.000 description 3
- HEFNNWSXXWATRW-UHFFFAOYSA-N Ibuprofen Chemical compound CC(C)CC1=CC=C(C(C)C(O)=O)C=C1 HEFNNWSXXWATRW-UHFFFAOYSA-N 0.000 description 3
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 3
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 3
- 239000004677 Nylon Substances 0.000 description 3
- 240000003768 Solanum lycopersicum Species 0.000 description 3
- 206010052428 Wound Diseases 0.000 description 3
- 208000027418 Wounds and injury Diseases 0.000 description 3
- 150000001413 amino acids Chemical group 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 238000000326 densiometry Methods 0.000 description 3
- 230000005284 excitation Effects 0.000 description 3
- 239000000499 gel Substances 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 230000001939 inductive effect Effects 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 239000012528 membrane Substances 0.000 description 3
- 229920001778 nylon Polymers 0.000 description 3
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 238000013518 transcription Methods 0.000 description 3
- 230000035897 transcription Effects 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- 238000001262 western blot Methods 0.000 description 3
- 108020005345 3' Untranslated Regions Proteins 0.000 description 2
- 101100063004 Arabidopsis thaliana PDF1.2A gene Proteins 0.000 description 2
- 235000011331 Brassica Nutrition 0.000 description 2
- 241000219198 Brassica Species 0.000 description 2
- 235000011299 Brassica oleracea var botrytis Nutrition 0.000 description 2
- 240000003259 Brassica oleracea var. botrytis Species 0.000 description 2
- 235000004977 Brassica sinapistrum Nutrition 0.000 description 2
- 241000723655 Cowpea mosaic virus Species 0.000 description 2
- 235000009852 Cucurbita pepo Nutrition 0.000 description 2
- KOHBWQDSVCARMI-BWBBJGPYSA-N Cys-Cys-Thr Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KOHBWQDSVCARMI-BWBBJGPYSA-N 0.000 description 2
- DZLQXIFVQFTFJY-BYPYZUCNSA-N Cys-Gly-Gly Chemical compound SC[C@H](N)C(=O)NCC(=O)NCC(O)=O DZLQXIFVQFTFJY-BYPYZUCNSA-N 0.000 description 2
- OXOQBEVULIBOSH-ZDLURKLDSA-N Cys-Gly-Thr Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O OXOQBEVULIBOSH-ZDLURKLDSA-N 0.000 description 2
- LKUCSUGWHYVYLP-GHCJXIJMSA-N Cys-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CS)N LKUCSUGWHYVYLP-GHCJXIJMSA-N 0.000 description 2
- ZOKPRHVIFAUJPV-GUBZILKMSA-N Cys-Pro-Arg Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CS)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O ZOKPRHVIFAUJPV-GUBZILKMSA-N 0.000 description 2
- LMPBBFWHCRURJD-LAEOZQHASA-N Gln-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)N)N LMPBBFWHCRURJD-LAEOZQHASA-N 0.000 description 2
- GQGAFTPXAPKSCF-WHFBIAKZSA-N Gly-Ala-Cys Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(=O)O GQGAFTPXAPKSCF-WHFBIAKZSA-N 0.000 description 2
- UGVQELHRNUDMAA-BYPYZUCNSA-N Gly-Ala-Gly Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)NCC([O-])=O UGVQELHRNUDMAA-BYPYZUCNSA-N 0.000 description 2
- 244000017020 Ipomoea batatas Species 0.000 description 2
- 235000002678 Ipomoea batatas Nutrition 0.000 description 2
- 235000003228 Lactuca sativa Nutrition 0.000 description 2
- 240000008415 Lactuca sativa Species 0.000 description 2
- 240000004658 Medicago sativa Species 0.000 description 2
- 102000008297 Nuclear Matrix-Associated Proteins Human genes 0.000 description 2
- 108010035916 Nuclear Matrix-Associated Proteins Proteins 0.000 description 2
- 240000007594 Oryza sativa Species 0.000 description 2
- 235000007164 Oryza sativa Nutrition 0.000 description 2
- 101710097966 Pathogenesis-related protein 1A Proteins 0.000 description 2
- 235000010582 Pisum sativum Nutrition 0.000 description 2
- 240000004713 Pisum sativum Species 0.000 description 2
- LYGKYFKSZTUXGZ-ZDLURKLDSA-N Thr-Cys-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)NCC(O)=O LYGKYFKSZTUXGZ-ZDLURKLDSA-N 0.000 description 2
- 235000021307 Triticum Nutrition 0.000 description 2
- 244000098338 Triticum aestivum Species 0.000 description 2
- 101150078570 WIN1 gene Proteins 0.000 description 2
- 240000008042 Zea mays Species 0.000 description 2
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 2
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 2
- 230000036579 abiotic stress Effects 0.000 description 2
- 235000001014 amino acid Nutrition 0.000 description 2
- 108010093581 aspartyl-proline Proteins 0.000 description 2
- 238000003766 bioinformatics method Methods 0.000 description 2
- 230000008827 biological function Effects 0.000 description 2
- 235000005822 corn Nutrition 0.000 description 2
- 108010069495 cysteinyltyrosine Proteins 0.000 description 2
- 101150060629 def gene Proteins 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 108010050848 glycylleucine Proteins 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 108010058731 nopaline synthase Proteins 0.000 description 2
- 210000000299 nuclear matrix Anatomy 0.000 description 2
- 239000002773 nucleotide Substances 0.000 description 2
- 125000003729 nucleotide group Chemical group 0.000 description 2
- 244000052769 pathogen Species 0.000 description 2
- 230000001717 pathogenic effect Effects 0.000 description 2
- 101150096397 pdf1 gene Proteins 0.000 description 2
- 235000020232 peanut Nutrition 0.000 description 2
- 239000000137 peptide hydrolase inhibitor Substances 0.000 description 2
- 235000012015 potatoes Nutrition 0.000 description 2
- 235000009566 rice Nutrition 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- 230000001052 transient effect Effects 0.000 description 2
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- WOJJIRYPFAZEPF-YFKPBYRVSA-N 2-[[(2s)-2-[[2-[(2-azaniumylacetyl)amino]acetyl]amino]propanoyl]amino]acetate Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)CNC(=O)CN WOJJIRYPFAZEPF-YFKPBYRVSA-N 0.000 description 1
- QMOQBVOBWVNSNO-UHFFFAOYSA-N 2-[[2-[[2-[(2-azaniumylacetyl)amino]acetyl]amino]acetyl]amino]acetate Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(O)=O QMOQBVOBWVNSNO-UHFFFAOYSA-N 0.000 description 1
- QWTLUPDHBKBULE-UHFFFAOYSA-N 2-[[2-[[2-[[2-[[2-[[2-[[2-[[2-[[2-[(2-aminoacetyl)amino]acetyl]amino]acetyl]amino]acetyl]amino]acetyl]amino]acetyl]amino]acetyl]amino]acetyl]amino]acetyl]amino]acetic acid Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(=O)NCC(=O)NCC(=O)NCC(=O)NCC(=O)NCC(=O)NCC(O)=O QWTLUPDHBKBULE-UHFFFAOYSA-N 0.000 description 1
- 240000004507 Abelmoschus esculentus Species 0.000 description 1
- RZVAJINKPMORJF-UHFFFAOYSA-N Acetaminophen Chemical compound CC(=O)NC1=CC=C(O)C=C1 RZVAJINKPMORJF-UHFFFAOYSA-N 0.000 description 1
- 235000009434 Actinidia chinensis Nutrition 0.000 description 1
- 235000009436 Actinidia deliciosa Nutrition 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- LSLIRHLIUDVNBN-CIUDSAMLSA-N Ala-Asp-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LSLIRHLIUDVNBN-CIUDSAMLSA-N 0.000 description 1
- SFNFGFDRYJKZKN-XQXXSGGOSA-N Ala-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C)N)O SFNFGFDRYJKZKN-XQXXSGGOSA-N 0.000 description 1
- FUSPCLTUKXQREV-ACZMJKKPSA-N Ala-Glu-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O FUSPCLTUKXQREV-ACZMJKKPSA-N 0.000 description 1
- WUHJHHGYVVJMQE-BJDJZHNGSA-N Ala-Leu-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WUHJHHGYVVJMQE-BJDJZHNGSA-N 0.000 description 1
- VHVVPYOJIIQCKS-QEJZJMRPSA-N Ala-Leu-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VHVVPYOJIIQCKS-QEJZJMRPSA-N 0.000 description 1
- QUIGLPSHIFPEOV-CIUDSAMLSA-N Ala-Lys-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O QUIGLPSHIFPEOV-CIUDSAMLSA-N 0.000 description 1
- BDQNLQSWRAPHGU-DLOVCJGASA-N Ala-Phe-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CS)C(=O)O)N BDQNLQSWRAPHGU-DLOVCJGASA-N 0.000 description 1
- YMIYZAOBQDRCPP-UHFFFAOYSA-N Ala-Thr-Cys-Cys Chemical compound CC(N)C(=O)NC(C(O)C)C(=O)NC(CS)C(=O)NC(CS)C(O)=O YMIYZAOBQDRCPP-UHFFFAOYSA-N 0.000 description 1
- AETQNIIFKCMVHP-UVBJJODRSA-N Ala-Trp-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AETQNIIFKCMVHP-UVBJJODRSA-N 0.000 description 1
- GCTANJIJJROSLH-GVARAGBVSA-N Ala-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C)N GCTANJIJJROSLH-GVARAGBVSA-N 0.000 description 1
- QRIYOHQJRDHFKF-UWJYBYFXSA-N Ala-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 QRIYOHQJRDHFKF-UWJYBYFXSA-N 0.000 description 1
- CLOMBHBBUKAUBP-LSJOCFKGSA-N Ala-Val-His Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N CLOMBHBBUKAUBP-LSJOCFKGSA-N 0.000 description 1
- 244000291564 Allium cepa Species 0.000 description 1
- 235000002732 Allium cepa var. cepa Nutrition 0.000 description 1
- 240000002234 Allium sativum Species 0.000 description 1
- 244000144725 Amygdalus communis Species 0.000 description 1
- 240000007087 Apium graveolens Species 0.000 description 1
- 235000015849 Apium graveolens Dulce Group Nutrition 0.000 description 1
- 235000010591 Appio Nutrition 0.000 description 1
- 235000010777 Arachis hypogaea Nutrition 0.000 description 1
- OTOXOKCIIQLMFH-KZVJFYERSA-N Arg-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N OTOXOKCIIQLMFH-KZVJFYERSA-N 0.000 description 1
- HKRXJBBCQBAGIM-FXQIFTODSA-N Arg-Asp-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N)CN=C(N)N HKRXJBBCQBAGIM-FXQIFTODSA-N 0.000 description 1
- GIVWETPOBCRTND-DCAQKATOSA-N Arg-Gln-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GIVWETPOBCRTND-DCAQKATOSA-N 0.000 description 1
- QBQVKUNBCAFXSV-ULQDDVLXSA-N Arg-Lys-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QBQVKUNBCAFXSV-ULQDDVLXSA-N 0.000 description 1
- 241000209134 Arundinaria Species 0.000 description 1
- SWLOHUMCUDRTCL-ZLUOBGJFSA-N Asn-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N SWLOHUMCUDRTCL-ZLUOBGJFSA-N 0.000 description 1
- PDQBXRSOSCTGKY-ACZMJKKPSA-N Asn-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N PDQBXRSOSCTGKY-ACZMJKKPSA-N 0.000 description 1
- RCENDENBBJFJHZ-ACZMJKKPSA-N Asn-Asn-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O RCENDENBBJFJHZ-ACZMJKKPSA-N 0.000 description 1
- RRVBEKYEFMCDIF-WHFBIAKZSA-N Asn-Cys-Gly Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)NCC(=O)O)N)C(=O)N RRVBEKYEFMCDIF-WHFBIAKZSA-N 0.000 description 1
- XWFPGQVLOVGSLU-CIUDSAMLSA-N Asn-Gln-Arg Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N XWFPGQVLOVGSLU-CIUDSAMLSA-N 0.000 description 1
- NNMUHYLAYUSTTN-FXQIFTODSA-N Asn-Gln-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O NNMUHYLAYUSTTN-FXQIFTODSA-N 0.000 description 1
- GIQCDTKOIPUDSG-GARJFASQSA-N Asn-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)N)N)C(=O)O GIQCDTKOIPUDSG-GARJFASQSA-N 0.000 description 1
- CDGHMJJJHYKMPA-DLOVCJGASA-N Asn-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CC(=O)N)N CDGHMJJJHYKMPA-DLOVCJGASA-N 0.000 description 1
- CBHVAFXKOYAHOY-NHCYSSNCSA-N Asn-Val-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O CBHVAFXKOYAHOY-NHCYSSNCSA-N 0.000 description 1
- WKGJGVGTEZGFSW-FXQIFTODSA-N Asp-Asn-Met Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O WKGJGVGTEZGFSW-FXQIFTODSA-N 0.000 description 1
- AKPLMZMNJGNUKT-ZLUOBGJFSA-N Asp-Asp-Cys Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CS)C(O)=O AKPLMZMNJGNUKT-ZLUOBGJFSA-N 0.000 description 1
- SNDBKTFJWVEVPO-WHFBIAKZSA-N Asp-Gly-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SNDBKTFJWVEVPO-WHFBIAKZSA-N 0.000 description 1
- PAYPSKIBMDHZPI-CIUDSAMLSA-N Asp-Leu-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PAYPSKIBMDHZPI-CIUDSAMLSA-N 0.000 description 1
- ZKAOJVJQGVUIIU-GUBZILKMSA-N Asp-Pro-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ZKAOJVJQGVUIIU-GUBZILKMSA-N 0.000 description 1
- 241001115066 Aureusvirus Species 0.000 description 1
- 235000007319 Avena orientalis Nutrition 0.000 description 1
- 244000075850 Avena orientalis Species 0.000 description 1
- 241000710149 Beet yellows virus Species 0.000 description 1
- 235000016068 Berberis vulgaris Nutrition 0.000 description 1
- 241000335053 Beta vulgaris Species 0.000 description 1
- 241000167854 Bourreria succulenta Species 0.000 description 1
- 235000014698 Brassica juncea var multisecta Nutrition 0.000 description 1
- 240000002791 Brassica napus Species 0.000 description 1
- 235000006008 Brassica napus var napus Nutrition 0.000 description 1
- 240000000385 Brassica napus var. napus Species 0.000 description 1
- 240000007124 Brassica oleracea Species 0.000 description 1
- 235000003899 Brassica oleracea var acephala Nutrition 0.000 description 1
- 235000011301 Brassica oleracea var capitata Nutrition 0.000 description 1
- 235000017647 Brassica oleracea var italica Nutrition 0.000 description 1
- 235000001169 Brassica oleracea var oleracea Nutrition 0.000 description 1
- 235000006618 Brassica rapa subsp oleifera Nutrition 0.000 description 1
- 235000002566 Capsicum Nutrition 0.000 description 1
- 235000009467 Carica papaya Nutrition 0.000 description 1
- 240000006432 Carica papaya Species 0.000 description 1
- 241001515826 Cassava vein mosaic virus Species 0.000 description 1
- 229920002101 Chitin Polymers 0.000 description 1
- 108010077544 Chromatin Proteins 0.000 description 1
- 235000007516 Chrysanthemum Nutrition 0.000 description 1
- 244000189548 Chrysanthemum x morifolium Species 0.000 description 1
- 244000045195 Cicer arietinum Species 0.000 description 1
- 235000010523 Cicer arietinum Nutrition 0.000 description 1
- 244000241235 Citrullus lanatus Species 0.000 description 1
- 235000012828 Citrullus lanatus var citroides Nutrition 0.000 description 1
- 235000008733 Citrus aurantifolia Nutrition 0.000 description 1
- 235000005979 Citrus limon Nutrition 0.000 description 1
- 244000131522 Citrus pyriformis Species 0.000 description 1
- 241000675108 Citrus tangerina Species 0.000 description 1
- 240000000560 Citrus x paradisi Species 0.000 description 1
- 241000723382 Corylus Species 0.000 description 1
- 235000007466 Corylus avellana Nutrition 0.000 description 1
- 241000219112 Cucumis Species 0.000 description 1
- 235000015510 Cucumis melo subsp melo Nutrition 0.000 description 1
- 235000009849 Cucumis sativus Nutrition 0.000 description 1
- 240000008067 Cucumis sativus Species 0.000 description 1
- 241000724253 Cucumovirus Species 0.000 description 1
- 235000009854 Cucurbita moschata Nutrition 0.000 description 1
- 240000001980 Cucurbita pepo Species 0.000 description 1
- 241000219104 Cucurbitaceae Species 0.000 description 1
- 241000612152 Cyclamen hederifolium Species 0.000 description 1
- UUERSUCTHOZPMG-SRVKXCTJSA-N Cys-Asn-Tyr Chemical compound SC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UUERSUCTHOZPMG-SRVKXCTJSA-N 0.000 description 1
- OABOXRPGTFRBFZ-IMJSIDKUSA-N Cys-Cys Chemical compound SC[C@H](N)C(=O)N[C@@H](CS)C(O)=O OABOXRPGTFRBFZ-IMJSIDKUSA-N 0.000 description 1
- DVKQPQKQDHHFTE-ZLUOBGJFSA-N Cys-Cys-Asn Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CS)N)C(=O)N DVKQPQKQDHHFTE-ZLUOBGJFSA-N 0.000 description 1
- ATPDEYTYWVMINF-ZLUOBGJFSA-N Cys-Cys-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O ATPDEYTYWVMINF-ZLUOBGJFSA-N 0.000 description 1
- UXUSHQYYQCZWET-WDSKDSINSA-N Cys-Glu-Gly Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O UXUSHQYYQCZWET-WDSKDSINSA-N 0.000 description 1
- KABHAOSDMIYXTR-GUBZILKMSA-N Cys-Glu-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CS)N KABHAOSDMIYXTR-GUBZILKMSA-N 0.000 description 1
- DZSICRGTVPDCRN-YUMQZZPRSA-N Cys-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CS)N DZSICRGTVPDCRN-YUMQZZPRSA-N 0.000 description 1
- ABLJDBFJPUWQQB-DCAQKATOSA-N Cys-Leu-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CS)N ABLJDBFJPUWQQB-DCAQKATOSA-N 0.000 description 1
- KCPOQGRVVXYLAC-KKUMJFAQSA-N Cys-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CS)N KCPOQGRVVXYLAC-KKUMJFAQSA-N 0.000 description 1
- ZHCCYSDALWJITB-SRVKXCTJSA-N Cys-Phe-Cys Chemical compound N[C@@H](CS)C(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CS)C(O)=O ZHCCYSDALWJITB-SRVKXCTJSA-N 0.000 description 1
- RESAHOSBQHMOKH-KKUMJFAQSA-N Cys-Phe-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CS)N RESAHOSBQHMOKH-KKUMJFAQSA-N 0.000 description 1
- DQUWSUWXPWGTQT-DCAQKATOSA-N Cys-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CS DQUWSUWXPWGTQT-DCAQKATOSA-N 0.000 description 1
- DQGIAOGALAQBGK-BWBBJGPYSA-N Cys-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CS)N)O DQGIAOGALAQBGK-BWBBJGPYSA-N 0.000 description 1
- ALNKNYKSZPSLBD-ZDLURKLDSA-N Cys-Thr-Gly Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O ALNKNYKSZPSLBD-ZDLURKLDSA-N 0.000 description 1
- IRKLTAKLAFUTLA-KATARQTJSA-N Cys-Thr-Lys Chemical compound C[C@@H](O)[C@H](NC(=O)[C@@H](N)CS)C(=O)N[C@@H](CCCCN)C(O)=O IRKLTAKLAFUTLA-KATARQTJSA-N 0.000 description 1
- 238000007702 DNA assembly Methods 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 235000002767 Daucus carota Nutrition 0.000 description 1
- 244000000626 Daucus carota Species 0.000 description 1
- 235000009355 Dianthus caryophyllus Nutrition 0.000 description 1
- 240000006497 Dianthus caryophyllus Species 0.000 description 1
- 244000252337 Epipremnum pinnatum Species 0.000 description 1
- 101710129170 Extensin Proteins 0.000 description 1
- 240000006927 Foeniculum vulgare Species 0.000 description 1
- 235000004204 Foeniculum vulgare Nutrition 0.000 description 1
- 240000009088 Fragaria x ananassa Species 0.000 description 1
- 241000208152 Geranium Species 0.000 description 1
- 241000735332 Gerbera Species 0.000 description 1
- UZMWDBOHAOSCCH-ACZMJKKPSA-N Gln-Cys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CCC(N)=O UZMWDBOHAOSCCH-ACZMJKKPSA-N 0.000 description 1
- ALUBSZXSNSPDQV-WDSKDSINSA-N Gln-Cys-Gly Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(=O)NCC(O)=O ALUBSZXSNSPDQV-WDSKDSINSA-N 0.000 description 1
- MFLMFRZBAJSGHK-ACZMJKKPSA-N Gln-Cys-Ser Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)O)N MFLMFRZBAJSGHK-ACZMJKKPSA-N 0.000 description 1
- QBEWLBKBGXVVPD-RYUDHWBXSA-N Gln-Phe-Gly Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N QBEWLBKBGXVVPD-RYUDHWBXSA-N 0.000 description 1
- OBIHEDRRSMRKLU-ACZMJKKPSA-N Glu-Cys-Asp Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N OBIHEDRRSMRKLU-ACZMJKKPSA-N 0.000 description 1
- ZZIFPJZQHRJERU-WDSKDSINSA-N Glu-Cys-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(=O)NCC(O)=O ZZIFPJZQHRJERU-WDSKDSINSA-N 0.000 description 1
- KVBPDJIFRQUQFY-ACZMJKKPSA-N Glu-Cys-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O KVBPDJIFRQUQFY-ACZMJKKPSA-N 0.000 description 1
- BFEZQZKEPRKKHV-SRVKXCTJSA-N Glu-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)O)N)C(=O)N[C@@H](CCCCN)C(=O)O BFEZQZKEPRKKHV-SRVKXCTJSA-N 0.000 description 1
- MRWYPDWDZSLWJM-ACZMJKKPSA-N Glu-Ser-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O MRWYPDWDZSLWJM-ACZMJKKPSA-N 0.000 description 1
- RGJKYNUINKGPJN-RWRJDSDZSA-N Glu-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCC(=O)O)N RGJKYNUINKGPJN-RWRJDSDZSA-N 0.000 description 1
- RJIVPOXLQFJRTG-LURJTMIESA-N Gly-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N RJIVPOXLQFJRTG-LURJTMIESA-N 0.000 description 1
- JVWPPCWUDRJGAE-YUMQZZPRSA-N Gly-Asn-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JVWPPCWUDRJGAE-YUMQZZPRSA-N 0.000 description 1
- NMROINAYXCACKF-WHFBIAKZSA-N Gly-Cys-Cys Chemical compound NCC(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(O)=O NMROINAYXCACKF-WHFBIAKZSA-N 0.000 description 1
- MQVNVZUEPUIAFA-WDSKDSINSA-N Gly-Cys-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)CN MQVNVZUEPUIAFA-WDSKDSINSA-N 0.000 description 1
- XXGQRGQPGFYECI-WDSKDSINSA-N Gly-Cys-Glu Chemical compound NCC(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CCC(O)=O XXGQRGQPGFYECI-WDSKDSINSA-N 0.000 description 1
- JMQFHZWESBGPFC-WDSKDSINSA-N Gly-Gln-Asp Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O JMQFHZWESBGPFC-WDSKDSINSA-N 0.000 description 1
- IDOGEHIWMJMAHT-BYPYZUCNSA-N Gly-Gly-Cys Chemical compound NCC(=O)NCC(=O)N[C@@H](CS)C(O)=O IDOGEHIWMJMAHT-BYPYZUCNSA-N 0.000 description 1
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 1
- FSPVILZGHUJOHS-QWRGUYRKSA-N Gly-His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CNC=N1 FSPVILZGHUJOHS-QWRGUYRKSA-N 0.000 description 1
- NNCSJUBVFBDDLC-YUMQZZPRSA-N Gly-Leu-Ser Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O NNCSJUBVFBDDLC-YUMQZZPRSA-N 0.000 description 1
- JJGBXTYGTKWGAT-YUMQZZPRSA-N Gly-Pro-Glu Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O JJGBXTYGTKWGAT-YUMQZZPRSA-N 0.000 description 1
- BMWFDYIYBAFROD-WPRPVWTQSA-N Gly-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN BMWFDYIYBAFROD-WPRPVWTQSA-N 0.000 description 1
- IRJWAYCXIYUHQE-WHFBIAKZSA-N Gly-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)CN IRJWAYCXIYUHQE-WHFBIAKZSA-N 0.000 description 1
- LLWQVJNHMYBLLK-CDMKHQONSA-N Gly-Thr-Phe Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LLWQVJNHMYBLLK-CDMKHQONSA-N 0.000 description 1
- GULGDABMYTYMJZ-STQMWFEESA-N Gly-Trp-Asp Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(O)=O)C(O)=O GULGDABMYTYMJZ-STQMWFEESA-N 0.000 description 1
- UMBDRSMLCUYIRI-DVJZZOLTSA-N Gly-Trp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)CN)O UMBDRSMLCUYIRI-DVJZZOLTSA-N 0.000 description 1
- 101800000653 Helper component proteinase Proteins 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- TVMNTHXFRSXZGR-IHRRRGAJSA-N His-Lys-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O TVMNTHXFRSXZGR-IHRRRGAJSA-N 0.000 description 1
- 240000005979 Hordeum vulgare Species 0.000 description 1
- 235000007340 Hordeum vulgare Nutrition 0.000 description 1
- 235000008694 Humulus lupulus Nutrition 0.000 description 1
- 244000025221 Humulus lupulus Species 0.000 description 1
- UKTUOMWSJPXODT-GUDRVLHUSA-N Ile-Asn-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N UKTUOMWSJPXODT-GUDRVLHUSA-N 0.000 description 1
- LDRALPZEVHVXEK-KBIXCLLPSA-N Ile-Cys-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N LDRALPZEVHVXEK-KBIXCLLPSA-N 0.000 description 1
- XLXPYSDGMXTTNQ-DKIMLUQUSA-N Ile-Phe-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CC(C)C)C(O)=O XLXPYSDGMXTTNQ-DKIMLUQUSA-N 0.000 description 1
- XLXPYSDGMXTTNQ-UHFFFAOYSA-N Ile-Phe-Leu Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(CC(C)C)C(O)=O)CC1=CC=CC=C1 XLXPYSDGMXTTNQ-UHFFFAOYSA-N 0.000 description 1
- ZLFNNVATRMCAKN-ZKWXMUAHSA-N Ile-Ser-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZLFNNVATRMCAKN-ZKWXMUAHSA-N 0.000 description 1
- ZYVTXBXHIKGZMD-QSFUFRPTSA-N Ile-Val-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ZYVTXBXHIKGZMD-QSFUFRPTSA-N 0.000 description 1
- BCISUQVFDGYZBO-QSFUFRPTSA-N Ile-Val-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O BCISUQVFDGYZBO-QSFUFRPTSA-N 0.000 description 1
- 241001495448 Impatiens <genus> Species 0.000 description 1
- 241000191398 Kalanchoe blossfeldiana Species 0.000 description 1
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 1
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 1
- CLVUXCBGKUECIT-HJGDQZAQSA-N Leu-Asp-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CLVUXCBGKUECIT-HJGDQZAQSA-N 0.000 description 1
- IASQBRJGRVXNJI-YUMQZZPRSA-N Leu-Cys-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)NCC(O)=O IASQBRJGRVXNJI-YUMQZZPRSA-N 0.000 description 1
- ORWTWZXGDBYVCP-BJDJZHNGSA-N Leu-Ile-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC(C)C ORWTWZXGDBYVCP-BJDJZHNGSA-N 0.000 description 1
- SYRTUBLKWNDSDK-DKIMLUQUSA-N Leu-Phe-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYRTUBLKWNDSDK-DKIMLUQUSA-N 0.000 description 1
- PPGBXYKMUMHFBF-KATARQTJSA-N Leu-Ser-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PPGBXYKMUMHFBF-KATARQTJSA-N 0.000 description 1
- CGHXMODRYJISSK-NHCYSSNCSA-N Leu-Val-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O CGHXMODRYJISSK-NHCYSSNCSA-N 0.000 description 1
- 241000209510 Liliopsida Species 0.000 description 1
- DKTNGXVSCZULPO-YUMQZZPRSA-N Lys-Gly-Cys Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CS)C(O)=O DKTNGXVSCZULPO-YUMQZZPRSA-N 0.000 description 1
- WLXGMVVHTIUPHE-ULQDDVLXSA-N Lys-Phe-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O WLXGMVVHTIUPHE-ULQDDVLXSA-N 0.000 description 1
- YTJFXEDRUOQGSP-DCAQKATOSA-N Lys-Pro-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O YTJFXEDRUOQGSP-DCAQKATOSA-N 0.000 description 1
- 102000007651 Macrophage Colony-Stimulating Factor Human genes 0.000 description 1
- 108010046938 Macrophage Colony-Stimulating Factor Proteins 0.000 description 1
- 244000070406 Malus silvestris Species 0.000 description 1
- 240000003183 Manihot esculenta Species 0.000 description 1
- 235000016735 Manihot esculenta subsp esculenta Nutrition 0.000 description 1
- 235000010624 Medicago sativa Nutrition 0.000 description 1
- 235000017587 Medicago sativa ssp. sativa Nutrition 0.000 description 1
- QAHFGYLFLVGBNW-DCAQKATOSA-N Met-Ala-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN QAHFGYLFLVGBNW-DCAQKATOSA-N 0.000 description 1
- DTICLBJHRYSJLH-GUBZILKMSA-N Met-Ala-Val Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O DTICLBJHRYSJLH-GUBZILKMSA-N 0.000 description 1
- NCVJJAJVWILAGI-SRVKXCTJSA-N Met-Gln-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N NCVJJAJVWILAGI-SRVKXCTJSA-N 0.000 description 1
- JACAKCWAOHKQBV-UWVGGRQHSA-N Met-Gly-Lys Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN JACAKCWAOHKQBV-UWVGGRQHSA-N 0.000 description 1
- 240000005561 Musa balbisiana Species 0.000 description 1
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 1
- 241000244206 Nematoda Species 0.000 description 1
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 1
- 241000207836 Olea <angiosperm> Species 0.000 description 1
- 235000000370 Passiflora edulis Nutrition 0.000 description 1
- 244000288157 Passiflora edulis Species 0.000 description 1
- 101710096342 Pathogenesis-related protein Proteins 0.000 description 1
- 241000182534 Pericallis hybrida Species 0.000 description 1
- 235000008673 Persea americana Nutrition 0.000 description 1
- 244000025272 Persea americana Species 0.000 description 1
- BBDSZDHUCPSYAC-QEJZJMRPSA-N Phe-Ala-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BBDSZDHUCPSYAC-QEJZJMRPSA-N 0.000 description 1
- XWBJLKDCHJVKAK-KKUMJFAQSA-N Phe-Arg-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N XWBJLKDCHJVKAK-KKUMJFAQSA-N 0.000 description 1
- ZBYHVSHBZYHQBW-SRVKXCTJSA-N Phe-Cys-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N ZBYHVSHBZYHQBW-SRVKXCTJSA-N 0.000 description 1
- 240000006285 Physalis pubescens Species 0.000 description 1
- 241000758706 Piperaceae Species 0.000 description 1
- 108090000051 Plastocyanin Proteins 0.000 description 1
- BNBBNGZZKQUWCD-IUCAKERBSA-N Pro-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H]1CCCN1 BNBBNGZZKQUWCD-IUCAKERBSA-N 0.000 description 1
- ORPZXBQTEHINPB-SRVKXCTJSA-N Pro-Arg-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H]1CCCN1)C(O)=O ORPZXBQTEHINPB-SRVKXCTJSA-N 0.000 description 1
- VOHFZDSRPZLXLH-IHRRRGAJSA-N Pro-Asn-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VOHFZDSRPZLXLH-IHRRRGAJSA-N 0.000 description 1
- GDXZRWYXJSGWIV-GMOBBJLQSA-N Pro-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 GDXZRWYXJSGWIV-GMOBBJLQSA-N 0.000 description 1
- DIFXZGPHVCIVSQ-CIUDSAMLSA-N Pro-Gln-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DIFXZGPHVCIVSQ-CIUDSAMLSA-N 0.000 description 1
- TYMBHHITTMGGPI-NAKRPEOUSA-N Pro-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@@H]1CCCN1 TYMBHHITTMGGPI-NAKRPEOUSA-N 0.000 description 1
- SEZGGSHLMROBFX-CIUDSAMLSA-N Pro-Ser-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O SEZGGSHLMROBFX-CIUDSAMLSA-N 0.000 description 1
- 235000009827 Prunus armeniaca Nutrition 0.000 description 1
- 244000018633 Prunus armeniaca Species 0.000 description 1
- 240000005809 Prunus persica Species 0.000 description 1
- 235000006029 Prunus persica var nucipersica Nutrition 0.000 description 1
- 235000006040 Prunus persica var persica Nutrition 0.000 description 1
- 244000017714 Prunus persica var. nucipersica Species 0.000 description 1
- 244000294611 Punica granatum Species 0.000 description 1
- 235000014360 Punica granatum Nutrition 0.000 description 1
- 241000220324 Pyrus Species 0.000 description 1
- 108700008625 Reporter Genes Proteins 0.000 description 1
- 108010003581 Ribulose-bisphosphate carboxylase Proteins 0.000 description 1
- 235000004789 Rosa xanthina Nutrition 0.000 description 1
- 241000109329 Rosa xanthina Species 0.000 description 1
- 241001092459 Rubus Species 0.000 description 1
- 240000000111 Saccharum officinarum Species 0.000 description 1
- 235000007201 Saccharum officinarum Nutrition 0.000 description 1
- 108010029987 Salivary Proteins and Peptides Proteins 0.000 description 1
- 102000001848 Salivary Proteins and Peptides Human genes 0.000 description 1
- 241000209056 Secale Species 0.000 description 1
- 235000007238 Secale cereale Nutrition 0.000 description 1
- PZZJMBYSYAKYPK-UWJYBYFXSA-N Ser-Ala-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O PZZJMBYSYAKYPK-UWJYBYFXSA-N 0.000 description 1
- RFBKULCUBJAQFT-BIIVOSGPSA-N Ser-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)[C@H](CO)N)C(=O)O RFBKULCUBJAQFT-BIIVOSGPSA-N 0.000 description 1
- MPPHJZYXDVDGOF-BWBBJGPYSA-N Ser-Cys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CO MPPHJZYXDVDGOF-BWBBJGPYSA-N 0.000 description 1
- MAWSJXHRLWVJEZ-ACZMJKKPSA-N Ser-Gln-Cys Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N MAWSJXHRLWVJEZ-ACZMJKKPSA-N 0.000 description 1
- XWCYBVBLJRWOFR-WDSKDSINSA-N Ser-Gln-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O XWCYBVBLJRWOFR-WDSKDSINSA-N 0.000 description 1
- YPUSXTWURJANKF-KBIXCLLPSA-N Ser-Gln-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YPUSXTWURJANKF-KBIXCLLPSA-N 0.000 description 1
- YRBGKVIWMNEVCZ-WDSKDSINSA-N Ser-Glu-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O YRBGKVIWMNEVCZ-WDSKDSINSA-N 0.000 description 1
- KDGARKCAKHBEDB-NKWVEPMBSA-N Ser-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CO)N)C(=O)O KDGARKCAKHBEDB-NKWVEPMBSA-N 0.000 description 1
- UPLYXVPQLJVWMM-KKUMJFAQSA-N Ser-Phe-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UPLYXVPQLJVWMM-KKUMJFAQSA-N 0.000 description 1
- 241000589324 Solanum quadriloculatum Species 0.000 description 1
- 235000000644 Solanum quadriloculatum Nutrition 0.000 description 1
- 240000003829 Sorghum propinquum Species 0.000 description 1
- 235000011684 Sorghum saccharatum Nutrition 0.000 description 1
- 108091081024 Start codon Proteins 0.000 description 1
- 241000271567 Struthioniformes Species 0.000 description 1
- 101710191442 Suppressor of RNA silencing Proteins 0.000 description 1
- 241000132145 Sweet potato mild mottle virus Species 0.000 description 1
- 101150088517 TCTA gene Proteins 0.000 description 1
- BIENEHRYNODTLP-HJGDQZAQSA-N Thr-Glu-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCSC)C(=O)O)N)O BIENEHRYNODTLP-HJGDQZAQSA-N 0.000 description 1
- JQAWYCUUFIMTHE-WLTAIBSBSA-N Thr-Gly-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JQAWYCUUFIMTHE-WLTAIBSBSA-N 0.000 description 1
- NDXSOKGYKCGYKT-VEVYYDQMSA-N Thr-Pro-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O NDXSOKGYKCGYKT-VEVYYDQMSA-N 0.000 description 1
- XKWABWFMQXMUMT-HJGDQZAQSA-N Thr-Pro-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O XKWABWFMQXMUMT-HJGDQZAQSA-N 0.000 description 1
- NBIIPOKZPUGATB-BWBBJGPYSA-N Thr-Ser-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N)O NBIIPOKZPUGATB-BWBBJGPYSA-N 0.000 description 1
- CSZFFQBUTMGHAH-UAXMHLISSA-N Thr-Thr-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O CSZFFQBUTMGHAH-UAXMHLISSA-N 0.000 description 1
- XGFYGMKZKFRGAI-RCWTZXSCSA-N Thr-Val-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N XGFYGMKZKFRGAI-RCWTZXSCSA-N 0.000 description 1
- 235000011941 Tilia x europaea Nutrition 0.000 description 1
- 240000006909 Tilia x europaea Species 0.000 description 1
- 241000702308 Tomato yellow leaf curl virus Species 0.000 description 1
- LHHDBONOFZDWMW-AAEUAGOBSA-N Trp-Asp-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)NCC(=O)O)N LHHDBONOFZDWMW-AAEUAGOBSA-N 0.000 description 1
- WQYPAGQDXAJNED-AAEUAGOBSA-N Trp-Cys-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CS)C(=O)NCC(=O)O)N WQYPAGQDXAJNED-AAEUAGOBSA-N 0.000 description 1
- VMBBTANKMSRJSS-JSGCOSHPSA-N Trp-Glu-Gly Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VMBBTANKMSRJSS-JSGCOSHPSA-N 0.000 description 1
- 241000714211 Turnip crinkle virus Species 0.000 description 1
- DXYWRYQRKPIGGU-BPNCWPANSA-N Tyr-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DXYWRYQRKPIGGU-BPNCWPANSA-N 0.000 description 1
- VTFWAGGJDRSQFG-MELADBBJSA-N Tyr-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O VTFWAGGJDRSQFG-MELADBBJSA-N 0.000 description 1
- DANHCMVVXDXOHN-SRVKXCTJSA-N Tyr-Asp-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DANHCMVVXDXOHN-SRVKXCTJSA-N 0.000 description 1
- ZAGPDPNPWYPEIR-SRVKXCTJSA-N Tyr-Cys-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O ZAGPDPNPWYPEIR-SRVKXCTJSA-N 0.000 description 1
- HDSKHCBAVVWPCQ-FHWLQOOXSA-N Tyr-Glu-Phe Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HDSKHCBAVVWPCQ-FHWLQOOXSA-N 0.000 description 1
- PMDWYLVWHRTJIW-STQMWFEESA-N Tyr-Gly-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PMDWYLVWHRTJIW-STQMWFEESA-N 0.000 description 1
- WPXKRJVHBXYLDT-JUKXBJQTSA-N Tyr-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CC=C(C=C2)O)N WPXKRJVHBXYLDT-JUKXBJQTSA-N 0.000 description 1
- VTCKHZJKWQENKX-KBPBESRZSA-N Tyr-Lys-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O VTCKHZJKWQENKX-KBPBESRZSA-N 0.000 description 1
- UPODKYBYUBTWSV-BZSNNMDCSA-N Tyr-Phe-Cys Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CS)C(O)=O)C1=CC=C(O)C=C1 UPODKYBYUBTWSV-BZSNNMDCSA-N 0.000 description 1
- TYGHOWWWMTWVKM-HJOGWXRNSA-N Tyr-Tyr-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 TYGHOWWWMTWVKM-HJOGWXRNSA-N 0.000 description 1
- 108090000848 Ubiquitin Proteins 0.000 description 1
- 102000044159 Ubiquitin Human genes 0.000 description 1
- AZSHAZJLOZQYAY-FXQIFTODSA-N Val-Ala-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O AZSHAZJLOZQYAY-FXQIFTODSA-N 0.000 description 1
- LABUITCFCAABSV-UHFFFAOYSA-N Val-Ala-Tyr Natural products CC(C)C(N)C(=O)NC(C)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LABUITCFCAABSV-UHFFFAOYSA-N 0.000 description 1
- DBOXBUDEAJVKRE-LSJOCFKGSA-N Val-Asn-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N DBOXBUDEAJVKRE-LSJOCFKGSA-N 0.000 description 1
- BMGOFDMKDVVGJG-NHCYSSNCSA-N Val-Asp-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BMGOFDMKDVVGJG-NHCYSSNCSA-N 0.000 description 1
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 1
- QRVPEKJBBRYISE-XUXIUFHCSA-N Val-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N QRVPEKJBBRYISE-XUXIUFHCSA-N 0.000 description 1
- HJSLDXZAZGFPDK-ULQDDVLXSA-N Val-Phe-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](C(C)C)N HJSLDXZAZGFPDK-ULQDDVLXSA-N 0.000 description 1
- GBIUHAYJGWVNLN-AEJSXWLSSA-N Val-Ser-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N GBIUHAYJGWVNLN-AEJSXWLSSA-N 0.000 description 1
- GBIUHAYJGWVNLN-UHFFFAOYSA-N Val-Ser-Pro Natural products CC(C)C(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O GBIUHAYJGWVNLN-UHFFFAOYSA-N 0.000 description 1
- PQSNETRGCRUOGP-KKHAAJSZSA-N Val-Thr-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(N)=O PQSNETRGCRUOGP-KKHAAJSZSA-N 0.000 description 1
- 235000010726 Vigna sinensis Nutrition 0.000 description 1
- 244000042314 Vigna unguiculata Species 0.000 description 1
- 241000219094 Vitaceae Species 0.000 description 1
- 101710114261 Wound-induced protein Proteins 0.000 description 1
- 208000020329 Zika virus infectious disease Diseases 0.000 description 1
- 108010031014 alanyl-histidyl-leucyl-leucine Proteins 0.000 description 1
- 235000020224 almond Nutrition 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 235000021016 apples Nutrition 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 108010068380 arginylarginine Proteins 0.000 description 1
- 108010062796 arginyllysine Proteins 0.000 description 1
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 1
- 108010038633 aspartylglutamate Proteins 0.000 description 1
- 108010047857 aspartylglycine Proteins 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 235000021015 bananas Nutrition 0.000 description 1
- 235000021028 berry Nutrition 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 230000004790 biotic stress Effects 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 235000019693 cherries Nutrition 0.000 description 1
- 210000003483 chromatin Anatomy 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 235000020971 citrus fruits Nutrition 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 229930186364 cyclamen Natural products 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 108010025198 decaglycine Proteins 0.000 description 1
- 230000004665 defense response Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000010494 dissociation reaction Methods 0.000 description 1
- 230000005593 dissociations Effects 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000001819 effect on gene Effects 0.000 description 1
- 108010048367 enhanced green fluorescent protein Proteins 0.000 description 1
- 241001233957 eudicotyledons Species 0.000 description 1
- 239000003337 fertilizer Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 235000004611 garlic Nutrition 0.000 description 1
- 230000004545 gene duplication Effects 0.000 description 1
- 238000012226 gene silencing method Methods 0.000 description 1
- 108010078144 glutaminyl-glycine Proteins 0.000 description 1
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 1
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 1
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 1
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 1
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 1
- 108010084389 glycyltryptophan Proteins 0.000 description 1
- 235000021021 grapes Nutrition 0.000 description 1
- 229910001385 heavy metal Inorganic materials 0.000 description 1
- 108010036413 histidylglycine Proteins 0.000 description 1
- 229930190166 impatien Natural products 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 1
- 238000011031 large-scale manufacturing process Methods 0.000 description 1
- 235000021374 legumes Nutrition 0.000 description 1
- 108010083708 leucyl-aspartyl-valine Proteins 0.000 description 1
- 108010012058 leucyltyrosine Proteins 0.000 description 1
- 239000004571 lime Substances 0.000 description 1
- 240000004308 marijuana Species 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000002887 multiple sequence alignment Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 235000021017 pears Nutrition 0.000 description 1
- 108010064486 phenylalanyl-leucyl-valine Proteins 0.000 description 1
- 108010051242 phenylalanylserine Proteins 0.000 description 1
- 235000021018 plums Nutrition 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000003259 recombinant expression Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 108010026333 seryl-proline Proteins 0.000 description 1
- 244000000000 soil microbiome Species 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 235000020354 squash Nutrition 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 235000021012 strawberries Nutrition 0.000 description 1
- 230000006354 stress signaling Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 1
- 239000003053 toxin Substances 0.000 description 1
- 231100000765 toxin Toxicity 0.000 description 1
- 108700012359 toxins Proteins 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 108010051110 tyrosyl-lysine Proteins 0.000 description 1
- 108010003137 tyrosyltyrosine Proteins 0.000 description 1
- 235000013311 vegetables Nutrition 0.000 description 1
- 230000035899 viability Effects 0.000 description 1
- 230000029812 viral genome replication Effects 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8216—Methods for controlling, regulating or enhancing expression of transgenes in plant cells
- C12N15/822—Reducing position variability, e.g. by the use of scaffold attachment region/matrix attachment region (SAR/MAR); Use of SAR/MAR to regulate gene expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8242—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
- C12N15/8257—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits for the production of primary gene products, e.g. pharmaceutical products, interferon
Landscapes
- Genetics & Genomics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Biomedical Technology (AREA)
- Organic Chemistry (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- Plant Pathology (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Cell Biology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Medicinal Chemistry (AREA)
- Pharmacology & Pharmacy (AREA)
- Peptides Or Proteins (AREA)
Abstract
조절 요소, 식물-기반 발현 시스템에서 단백질 생성을 향상시키기 위한 상기 조절 요소를 포함하는 발현 벡터, 및 이들의 생성 및 사용 방법이 개시된다.
Description
발명의 분야
본 발명은 식물-기반 발현 시스템을 사용하여 단백질 생성을 향상시키기 위한 상기 조절 요소를 포함하는 조절 요소 발현 벡터, 및 이들의 제조 및 사용 방법에 관한 것이다.
발명의 배경
식물에서 재조합 단백질 발현은 전체 식물 및 세포 배양물 둘 모두에서 안정한 형질전환된 계통 또는 일시적 발현을 생성함으로써 달성될 수 있다. 단백질 생성의 수율은 발현 플랫폼의 상업적 생존 가능성에 중요하다. pEAQ 플라스미드(Sainsbury et al., 2009) (Sainsbury Frank and Lomonossoff George Peter, 2010) 및 magnICON 벡터(Gleba et al., 2005)와 같은 높은 단백질 생산 수율을 달성하기 위해 여러 시스템이 개발되었다. 모든 시스템은 강력한 프로모터 및 전사 종결자를 포함하는 여러 핵심 특징에 의존한다. 바이러스 복제 및 침묵의 억제를 제공하기 위해 일부 시스템에는 추가 특징이 존재한다.
단백질 생성을 향상시키는 방법 중 하나는 종결인자 영역을 포함하는 발현 시스템을 개발하는 것이다. 이는 오픈 리딩 프레임(ORF)의 3'에 위치한 종결인자 영역을 포함하는 진핵 시스템과 일치한다. 종결인자 영역은 전사 및 번역 과정에서 다수의 역할을 수행하므로, 단백질 생산 수준은 상이한 종결인자 간에 상당히 다양하다. 종결인자의 효율을 결정하는 서열 요소는 잘 알려져 있지 않다. 식물 발현 벡터에서 가장 일반적으로 사용되는 종결인자 중 하나는 증가된 단백질 생성과 관련된 아그로박테리움 투메파시엔스(Agrobacterium tumefaciens) T-DNA 노팔린 신타제(Tnos)로부터의 종결인자이다(Depicker et al., 1982). 솔라눔 투베로섬(Solarium tuberosum) PINII (An et al., 1989), 아라비돕시스 탈리아나(Arabidopsis thaliana) HSP18.2(Nagaya et al., 2010), 니코티아나 타바쿰 익스텐신(Nicotiana tabacum extensin) (Rosenthal et al., 2018), N. 벤타미아나(N. benthamiana) ACT3(Diamos and Mason, 2018)과 같은 다른 식물 종결인자가 Tnos 종결인자와 비교하여 개선된 단백질 생성을 초래하는 것으로 확인되었다.
단백질 생성을 향상시키기 위한 또 다른 수단은 탠덤 종결인자의 첨가이다(Beyene et al., 2011; Fuo and Chen, 2007). 식물에서, 단백질 생성의 향상은 안정한 형질전환체 및 일시적 발현 둘 모두에서 관찰되었다. 탠덤 종결인자의 여러 조합, 예를 들어, pEAQ 발현 시스템에서 동부콩 모자이크 바이러스 RNA-2 종결인자와 Tnos의 조합(Sainsbury et al., 2009) 및 지금까지 보고된 가장 높은 단백질 생성을 발생시키는(Diamos and Mason, 2018) 인트론리스 익스텐신과 ACT3의 조합이 연구되었다.
향상된 발현 및 감소된 유전자 침묵은 또한 매트릭스 부착 영역(MAR, 스캐폴드 부착 영역으로도 알려져 있음)을 함유하는 발현 벡터에서 관찰되었다. 발현에 대한 영향은 식물에서 안정한 형질전환체 및 일시적 발현 둘 모두에서 보고되었다. MAR은 숙주, MAR의 유형 및 발현 카세트에 따라 향상되거나 억제될 수 있거나 유전자 발현에 영향을 미치지 않을 수 있다(Dolgova and Dolgov, 2019). N. 타바쿰(N. tabacum) RB7 MAR은 유전자 발현을 향상시키기 위해 가장 일반적으로 사용되며 다수의 발현 시스템에서 널리 사용되어 왔다(Hall et al., 1991).
식물에서 재조합 단백질의 발현은 재조합 단백질의 대규모 생산을 위한 대안적인 비용 효율적인 플랫폼을 제공한다. 그러나, 식물 기반-재조합 발현 시스템은 포유동물 발현 시스템과 비교하여 더 낮은 수율의 단백질 생성을 제공한다. 이러한 발전에 비추어, 단백질 생성을 향상시키기 위해 식물-기반 발현 시스템을 개선하기 위한 수단을 확인할 필요가 여전히 존재하는 것이 명백하다.
발명의 개요
본 발명은 식물에서 관심 유전자의 단백질 발현을 향상시키기 위해 벡터를 형성하는데 이용되는, 식물 스트레스 유도된 유전자, 아라비돕시스 탈리아나 ECA1 유전자간 영역으로부터 유래된 신규한 MAR 및 이들의 조합으로부터의 다수의 신규한 종결인자에 관한 것이다.
제1 양태에 따르면, 본 발명은 스트레스 유도된 식물 유전자 또는 상기 서열의 단편 또는 변이체로부터의 핵산 서열 종결인자를 제공한다. 종결인자는 스트레스 유도된 유전자 생성물의 오픈 리딩 프레임에 대해 자연적으로 3'에 위치한다("본 발명의 종결인자"). 추가 구체예에서, 종결인자는 하기 유전자의 종결인자가 아니다: 솔라눔 투베로섬(서열 ID No 5), 아라비돕시스 탈리아나 HSP18.2 및 니코티아나 타바쿰 익스텐신. 일 구체예에서, 스트레스 유도된 식물 유전자는 니코티아나 종, 예를 들어, N. 벤타미아나 또는 N. 타바쿰으로부터 유래된다.
일 구체예에서, 종결인자는 서열 ID No 1 내지 4의 서열, 종결인자 상동체, 또는 상기 서열 또는 상동체의 단편, 또는 상기 서열 ID No 1 내지 4, 종결인자 상동체 또는 단편에 대해 80% 서열 동일성을 갖는 상동체 또는 변이체이다. 종결인자 상동체는 상동성 유전자의 종결인자이고, 여기서 상동성 유전자 생성물은 서열 ID No 8, 9, 10 또는 11에 대해 적어도 30%, 40%, 50%, 60%, 70%, 80% 또는 90% 아미노산 서열 동일성을 갖는다. 바람직한 구체예에서, 상동성 유전자 생성물은 50% 초과의 서열 동일성을 갖는다. 다른 구체예에서, 상동체는 Genbank와 같은 적합한 식물 뉴클레오티드 데이터베이스의 BLASTN에 의해 반환된 1e-10 미만의 쌍별 비교 E-값을 갖는 것으로 확인된다(Sayers et al 2021 [DOI: 10.1093/nar/gkaal023]).
일부 양태에서, 본 발명은 매트릭스 부착 영역 또는 적어도 300, 400, 500, 600, 700, 800, 900, 1000개 염기쌍의 단편 또는 상기 영역 또는 단편에 대해 70% 동일성을 갖는 변이체("본 발명의 매트릭스 부착 영역")를 포함하는 서열 ID No 7의 핵산을 제공한다.
다른 양태에서, 본 발명은 서열 ID No 1 내지 4의 서열, 종결인자 상동체, 또는 상기 서열 또는 상동체의 단편, 또는 상기 서열 ID No 1 내지 4, 종결인자 상동체 또는 단편에 대해 80% 서열 동일성을 갖는 변이체를 포함하는 발현 벡터를 제공한다. 다른 구체예에서, 발현 벡터는 서열 ID No 7의 핵산 또는 이에 대해 70% 동일성을 갖는 변이체를 포함한다. 일 구체예에서, 발현 벡터는 제2 종결인자 서열을 포함하고, 여기서 발현 벡터는 서열 ID 1 내지 4로부터 선택된 서열을 갖는 종결인자를 적어도 포함한다. 일부 구체예에서, 발현 벡터는 서열 ID No 1 내지 6, 상기 서열 ID No 1 내지 6의 상동체, 변이체 및 단편, 및 상기 서열 ID No. 1 내지 6, 상동체, 변이체 및 단편에 대해 70, 80, 90% 동일성을 갖는 종결인자으로부터 선택된 2개의 종결인자 서열을 포함한다. 2개의 종결인자는 탠덤 종결인자로 지칭된다.
다른 양태에서, 본 발명은 본 발명의 종결인자 또는 본 발명의 탠덤 종결인자 및 본 발명의 매트릭스 부착 영역을 포함하는 발현 벡터를 제공한다. 적합한 종결인자는 스트레스 유도된 식물 유전자의 오픈 리딩 프레임에 대해 3'에 위치한 핵산 서열을 포함하는 종결인자 또는 상기 종결인자의 단편 또는 변이체이다. 스트레스 유도된 식물 유전자로부터의 핵산을 포함하는 본 발명의 벡터에 사용하기 위한 종결인자는 서열 ID NO 1 내지 4로 제공되는 종결인자, 이의 종결인자 상동체, 또는 상기 서열 또는 상기 상동체의 단편, 또는 서열 No 1 내지 4 또는 이의 종결인자 상동체 중 임의의 것에 대해 80% 서열 동일성을 갖는 변이체이다. 추가 구체예에서, 본 발명의 벡터에 사용하기 위한 종결인자는 서열 ID No 1 내지 6으로부터 선택된다. 핵산은 전형적으로 N. 벤타미아나 또는 N. 타바쿰과 같은 니코티아나 식물로부터 유래된다.
일 구체예에서, 매트릭스 부착 영역은 서열 ID No 7로부터 유래되거나, 이는 적어도 300 bp의 단편 또는 상기 영역 또는 단편에 대해 70% 동일성을 갖는 변이체일 수 있다. 일부 구체예에서, MAR은 아라비돕시스 탈리아나로부터의 At5g36340과 At5g36350 사이의 ECA1 유전자간 영역으로서 확인된다. 다른 구체예에서, 발현 벡터는 종결인자 및 2개의 매트릭스 부착 영역을 포함한다. 2개의 매트릭스 부착 영역은 서열 ID No 7 또는 서열 ID No 7의 적어도 300개 염기쌍의 단편 또는 상기 영역 또는 단편에 대해 70% 동일성을 갖는 변이체로부터 선택된다.
일 양태에서, 본 발명은 프로모터, 오픈 리딩 프레임을 인코딩하는 폴리펩티드, 서열 ID No 6의 종결인자, 서열 ID No 1의 서열의 종결인자, 및 서열 ID No 7의 매트릭스 부착 영역을 포함하는 발현 벡터를 제공한다.
본 발명에 따른 발현 벡터는 상기 식물 또는 식물 세포에서 원하는 단백질을 발현시키기 위해 식물 또는 식물 세포를 형질전환시키는데 사용된다. 일 구체예에서, 단백질의 발현은 일시적 발현이다. 서열 ID 1 내지 6의 스트레스 유도된 종결인자의 핵산은 안정한 식물 또는 식물 세포의 생성에 사용될 수 있거나, 식물을 형질전환시켜 관심 단백질을 발현시키는 데 사용될 수 있고, 여기서 발현은 일시적 발현이다.
발명의 상세한 설명
본원에서 사용되는 "종결인자"는 DNA로부터 RNA 폴리머라제의 해리를 야기하여 DNA의 메신저 RNA로의 전사를 종결시키는 DNA 서열이다. "종결인자"는 RNA 전사체의 부위-특이적 절단을 허용하고 전사체의 3' 말단에서 폴리A 테일의 형성을 가능하게 하는 DNA 서열을 함유한다. "종결인자"는 또한 메신저 RNA의 단백질 번역을 촉진하는 단백질에 결합하는 서열을 함유한다.
본원에서 사용되는 용어 "상동체"는 종결인자의 맥락에서 사용될 때 상동성 유전자가 공통 조상 DNA 서열로부터의 후손에 의해 제2 유전자와 관련된 유전자인 상동성 유전자의 종결인자를 지칭한다. 용어 상동체는 종분화의 사건에 의해 분리된 유전자 사이의 관계(이종상동유전자) 또는 유전자 중복의 사건에 의해 분리된 유전자 사이의 관계(동종상동유전자)에 적용될 수 있다. 상동성 유전자의 종결인자는 정지 코돈 직후 및 제2 유전자의 임의의 오픈 리딩 프레임의 시작 전에 1000개 염기 서열에 위치한다.
본원에서 사용되는 "변이체"는 참조 서열의 생물학적 활성을 유지하면서 참조 서열의 전체 길이에 걸쳐 70, 80, 90, 95, 99% 동일성을 갖는 핵산 서열이다.
본원에서 사용되는 바와 같은 서열 동일성은 바람직하게는 정렬된 서열에서 동일한 위치에 있는 동일한 뉴클레오티드 또는 아미노산의 수에 의해 결정된다. 아미노산 퍼센트 동일성은 BLOSUM62 치환 매트릭스, 11의 갭 존재 패널티, 및 1의 갭 확장 패널티를 사용하여 BLASTP 정렬을 사용하여 결정된다. DNA 퍼센트 동일성은 1의 일치 점수, -2의 불일치 점수, 7의 워드 크기, 5의 갭 존재 패널티, 및 2의 갭 확장 패널티를 사용한 BLASTN 정렬을 이용하여 결정된다.
본원에서 사용되는 "단편"은 참조 서열의 생물학적 기능을 유지하는 핵산의 일부이다.
본원에서 사용되는 "매트릭스 부착 영역" 또는 스캐폴드 부착 영역은 핵 매트릭스가 부착되는 진핵 염색체의 DNA 내의 서열이다. 본 발명의 맥락에서, 이러한 영역은 아라비돕시스 탈리아나로부터의 At5g36340과 At5g36350 사이의 ECA1 유전자간 영역으로부터 유래되고, 핵 내의 염색질의 구조적 조직을 매개하고 유전자 발현을 촉진한다. MARS는 핵 매트릭스에 결합함으로써 확인되거나 AT-풍부 DNA의 존재에 의해 예측될 수 있다(>70%). MARS는 또한 SMARTest(Frisch et al 2002 [doi: 10.1101/gr.206602]) 또는 MAR-파인더(Singh et al 1997 [doi: 10.1093/nar/25.7.1419])와 같은 컴퓨터 알고리즘을 사용하여 예측될 수 있다.
용어 "일시적 발현"은 핵산, 가장 빈번하게는 발현 카세트를 인코딩하는 플라스미드 DNA 또는 플라스미드 단편이 식물 세포에 도입된 후 짧은 시간, 최대 4주 동안 발현되고 많은 세대에 걸쳐 단백질의 발현을 가능하게 하는 안정한 발현과 대조되는 관심 단백질을 생성하기 위한 유전자의 일시적 발현을 나타낸다.
본원에서 사용되는 "발현 벡터"는 세포에서 유전자 발현을 위해 설계된 플라스미드 또는 바이러스이다. 발현 벡터는 특정 관심 유전자를 표적 세포에 도입하는데 사용되며, 유전자에 의해 인코딩된 단백질을 생성하기 위해 세포의 메카니즘을 지휘할 수 있다. 본원에서 사용되는 발현 벡터는 적어도 하나의 발현 카세트를 포함한다.
본원에서 사용되는 "발현 카세트"는 발현을 위한 조절 서열의 제어 하에 관심 유전자를 함유하는 발현 벡터의 성분을 지칭한다. 본원에 기재된 바와 같은 발현 카세트는 프로모터 서열, 5'UTR(5' 비번역 영역), 예컨대, 타바코 식각 바이러스 오메가 5'UTR, 오픈 리딩 프레임, 및 종결인자를 포함한다. CaMV 35S는 콜리플라워 모자이크 바이러스로부터 유래된 프로모터이다. 다른 적합한 프로모터는 카사바 정맥 모자이크 바이러스 프로모터, 리불로스 바이포스페이트 카르복실라제의 작은 서브유닛의 프로모터, 플라스토시아닌 프로모터, 단자엽 및 쌍자엽으로부터의 유비퀴틴 프로모터, 및 액틴 프로모터를 포함한다. 프로모터는 항시적, 유도성 또는 조직 특이적일 수 있다.
일부 구체예에서, 제2 프로모터는 제1의 다운스트림에 존재할 수 있다. 일 접근법에서, 이는 이중 CaMV 35S 프로모터일 수 있다.
본원에서 사용되는 "비리디플란태(Viridiplantae)"는 니코티아나 종(예를 들어, 타바코(N.타바쿰) 및 N. 벤타미아나 등), 당근, 콩과 식물(예를 들어, 동부콩, 알팔파/루체른, 콩, 병아리콩, 땅콩, 완두콩), 파파야, 감자, 유채/캐놀라, 사과, 식물성 브라시카(예를 들어, 비트, 양배추, 콜리플라워, 브로콜리 등), 쌀, 옥수수, 대두, 토마토, 포도, 장미, 카네이션, 감귤류(레몬/라임, 오렌지, 그레이프프루트, 귤 및 기타 포함), 수수, 사탕수수, 보리, 바나나, 카사바, 지팡이 베리(루부스), 커피, 조롱박(오이, 멜론, 스쿼시, 수박 및 기타 포함), 헤이즐넛, 홉, 상추, 오크라, 올리브, 땅콩, 호밀, 딸기, 고구마, 배, 시클라멘, 임파티엔스, 칼랑코에, 제라늄, 거베라, 카텔리아, 국화, 시네라리아, 회향, 종자 콩나물, 아보카도, 키위, 귀리, 완두콩, 석류 과일(예를 들어, 아몬드, 자두, 살구, 체리, 복숭아/넥타린 및 기타), 패션 프루트, 후추, 셀러리, 타바코, 밀, 양파/마늘, 및 대마초를 포함하나 이에 제한되지 않는다. 이들은 또한 상기 기재된 종의 식물 세포 현탁액을 포함할 수 있다. 바람직하게는, 숙주는 하기로부터 선택된다: 니코티아나 종(예를 들어, N. 타바쿰 및 N.벤타미아나), 감자, 브라시카스, 쌀, 옥수수, 대두, 토마토, 상추 및 밀.
본 발명에 따른 발현 벡터는 표준 방법을 사용하여 식물 또는 식물 부분에 도입되어 사용된다. 본 발명에서 사용되는 형질전환은 많은 식물 종에서 널리 사용된다. 아그로박테리움 투메파시엔스(A. 투메파시엔스)는 식물을 감염시키기 위한 전달 벡터로 사용되는 그람 음성 토양 박테리아이다.
발현 벡터는 적어도 하나의 발현 카세트를 포함한다. 발현 카세트는 단일 스트레스 유도된 종결인자 또는 탠덤 종결인자("이중 종결인자"로도 지칭됨)를 포함한다. 단일 스트레스 유도된 종결인자는 발현 카세트의 오픈 리딩 프레임의 3'에 위치한다.
본원에서 사용되는 "쌍별 비교 E-값"은 2개의 관심 서열의 비교가 수행될 때 생성된 E-값이다.
본 발명에 따른 "Pfam"은 UniProt 릴리스 2020_06에 기반한 데이터베이스 Pfam 버전 34.0이며, 각각 다수의 서열 정렬 및 은닉 Markov 모델(HMM)로 표시되는 단백질 패밀리의 대규모 컬렉션이다(Jaina Mistry, Sara Chuguransky , Lowri Williams, Matloob Qureshi, Gustavo A Salazar, Erik LL Sonnhammer, Silvio CE Tosatto, Lisanna Paladin, Shriya Raj, Lorna J Richardson, Robert D Finn, Alex Bateman, Pfam: The protein family database in 2021, Nucleic Acids Research, Volume 49, Issue D1, 8 January 2021, Pages D412-D419, https://doi.org/10.1093/nar/gkaa913). 단백질은 도메인으로 일반적으로 지칭되는 하나 이상의 기능성 영역으로 일반적으로 구성된다. 도메인의 다양한 조합은 자연에서 발견되는 다양한 범위의 단백질을 발생시킨다. 따라서, 단백질 내에서 발생하는 도메인의 확인은 이들의 기능에 대한 통찰력을 제공할 수 있다.
스트레스 유도된 종결인자는 식물에 대한 생물적 또는 비생물적 스트레스 신호의 적용에 의해 전사체 및/또는 단백질 풍부도가 증가되는 것들이다. 유의한 증가는 유도되지 않은 상태로부터 전사체 또는 단백질의 >2배 증가로 정의된다. 전형적으로, 유전자 유도는 스트레스 신호의 3-5시간에 검출될 수 있다. 생물학적 스트레스는 박테리아, 진균, 선충, 곤충 및 바이러스 유기체 또는 이들 유기체로부터 유래된 화학물질 또는 단백질을 포함한다. 생물학적 스트레스는 또한 초식성 또는 타액 단백질 또는 화학물질을 통해 유도될 수 있다. 비생물적 스트레스는 상처, 극한 온도, 염도, 물 과잉 또는 결핍, 광 또는 자외선, 및 화학 독소, 예컨대, 비료 및 중금속에 의해 유도될 수 있다. 스트레스 신호는 전사체 및 단백질 생성의 수를 변경하는 유전자 발현을 조절한다. 이러한 스트레스에 반응하기 위해, 식물은 종종 스트레스로부터 식물을 보호하는데 관여하는 특정 단백질의 신속하고 높은 수준의 유도를 필요로 하는 방어 반응을 개시한다. 이는 병원체 감염에 대한 반응으로 NtPR1a의 유도에 의해 예시되며, 여기서 유전자 유도는 병원체 인식 3시간 이내에 시작되어 NtPR1a 단백질의 고수준 축적을 초래한다.
본 발명에 따르면, 스트레스 유도된 종결인자는 바람직한 구체예에서, 스트레스 유도된 유전자, 예컨대, N. 타바쿰 병인-관련 단백질 la(NtPR1a로 지칭됨), N. 벤타미아나 프로테이나제 억제제 타입-2(NbPINII로 지칭됨), 상처-유도 단백질(NbWIN1로 지칭됨), 및 디펜신-유사 단백질 14(NbPDF1.2로 지칭됨)로부터 유래된다. 이러한 스트레스 유도된 유전자의 종결인자는 이종성 재조합 단백질의 향상된 발현을 발생시킨다.
당업자에게 이미 공지된 단백질 생성을 개선시키는 종결인자는 아그로박테리움 투메파시엔스 T-DNA 노팔린 신타제(Tnos)로부터의 종결인자를 포함한다. 이는 식물 발현 벡터에서 통상적으로 사용되는 종결인자이다(Depicker et al., 1982). 확인된 다른 종결인자는 솔라눔 투베로섬 PINII(An et ak, 1989), 아라비돕시스 탈리아나 HSP18.2(Nagaya et ak, 2010), 니코티아나 타바쿰 익스텐신(Rosenthal et ak, 2018), N. 벤타미아나 ACT3(Diamos and Mason, 2018)를 포함한다.
본 발명에 의해 확인된 신규한 스트레스 유도된 종결인자는 N. 타바쿰 병인-관련 단백질 1a(Gen bank ID: XI2737.1)(NtPR1a로 지칭됨)(SEQ ID No: 1) 종결인자, N. 벤타미아나 프로테이나제 억제제 타입-2(Nibenl01Scf07757g00001.1)(NbPINII로 지칭됨)(SEQ ID No:2) 종결인자, 상처-유도된 단백질(Nibenl01Scf01015g01002.1)(NbWIN1로 지칭됨)(SEQ ID No:3) 종결인자, 및 디펜신-유사 단백질 14(Nibenl01Scf00761g00006.1)(NbPDF1.2로 지칭됨)(SEQ ID No:4) 종결인자이다. 각각의 경우에 종결인자 서열은 오픈 리딩 프레임의 정지 코돈의 3'에 위치한다.
상기 기재된 바와 같은 종결인자는 본 발명에 따라 탠덤 종결인자 조합의 일부로서 사용될 수 있고, 추가로 StPINII(SEQ ID NO: 5) 종결인자, Tnos(SEQ ID NO: 6) 종결인자는 또한 본 발명의 신규한 스트레스 유도된 종결인자와 조합될 수 있다.
추가로 예시하기 위해, 하기는 본 발명에 의해 제공되는 스트레스 유도된 종결인자의 목록이다:
NtPR1a
NtPR1a에 대해 >70% 동일성을 갖는 단백질(서열 ID No: 8)을 함유하고/거나 E-값이 <0.01인 Pfam 도메인 PF00188(시스테인-풍부 분비 단백질 슈퍼패밀리)에 대한 상동성을 함유하는 유전자의 식물 종결인자.
NbPINII
NbPINII에 대해 >70% 동일성을 갖는 단백질(서열 ID No: 9)을 함유하고/거나 E-값이 <0.01인 Pfam 도메인 PF02428(감자 유형 II 프로테이나제 억제제 패밀리)에 대한 상동성을 함유하는 유전자의 식물 종결인자.
NbWIN1
NbWIN1에 대해 >70% 동일성을 갖는 단백질(서열 No: 10)을 함유하고/거나 E-값이 <0.01인 Pfam 도메인 PF00967(Barwin) 및 PF00187(키틴 결합 1)에 대한 상동성을 함유하는 유전자의 식물 종결인자.
NbPDF1.2
NbPDF1.2에 대해 >70% 동일성을 갖는 단백질(서열 ID No: 11)을 함유하고/거나 E-값이 <0.01인 Pfam 도메인 PF00304(감마-티오닌 패밀리)에 대한 상동성을 함유하는 유전자의 식물 종결인자.
상기 언급된 바와 같은 E-값은 매치의 통계적 유의성 파라미터이다. E-값이 낮을수록 일치가 더 유의하다. 본 발명에 따르면, le-10 미만의 쌍별 비교 E-값으로 다른 종결인자를 확인하는 것이 바람직하다.
탠덤 종결인자는 함께 융합된 2개의 종결인자이다. 2개의 종결인자는 링커 서열 없이 함께 융합되거나, 2개의 종결인자는 링커 서열을 통해 연결된다. 일 구체예에서, 링커 서열은 최대 200개의 염기쌍을 포함할 수 있다. 탠덤 종결인자는 StPINII + StPINII와 같은 함께 융합된 동일한 종결인자 중 2개일 수 있거나, 이는 StPINII + NtPR1a와 같은 2개의 상이한 종결인자의 조합일 수 있다. 탠덤 종결인자는 둘 모두 발현 카세트의 오픈 리딩 프레임의 3'에 위치한다. 제2 종결인자는 제1 종결인자의 3'에서 결합된다. S. 투베로섬 PINII, N. 벤타미아나 PINII, WIN1, PDF1.2 및 N. 타바쿰 PR1a 종결인자 중 임의의 것이 Tnos, S. 투베로섬 PINII, N. 벤타미아나 PINII, WIN1, PDF1.2 및 N. 타바쿰 PR1a 중 임의의 것과 융합될 수 있다. 바람직하게는, 탠덤 종결인자는 하기 군으로부터 선택된다: NbPDF1.2 + Tnos, NbPINII + Tnos, NbWIN1 + Tnos, StPINII + EU, StPINII + HSP18, StPINII + Tnos, StPINII + StPINII, StPINII + NtPR1a, NtPR1a, NtPR1a StPINII, 및 NtPR1a + NtPR1a. 전술한 종결인자 쌍은 상기 열거된 바와 같이 배열되며, 예를 들어, NbPDF1.2는 제2 종결인자 Tnos의 업스트림에 배열된 제1 종결인자이고, 이러한 배열은 "NbPDF1.2 + Tnos"로 표시된다. 다른 구체예에서, 쌍은 상이한 순서로 배열될 수 있다. 더욱 바람직하게는, StPINII + NtPR1a의 조합이 바람직하다.
발현 카세트는 매트릭스 부착 영역(MAR)을 추가로 포함한다. MAR은 종결인자를 포함하는 발현 벡터의 5'UTR 및/또는 3'UTR에 위치할 수 있다. 일부 구체예에서, MAR은 단일 또는 탠덤 종결인자(들)를 포함하는 발현 카세트의 업스트림이다. 다른 구체예에서, MAR은 단일 또는 탠덤 종결인자를 포함하는 발현 카세트의 다운스트림이다. 바람직한 구체예에서, MAR은 발현 카세트의 어느 한 쪽에 측접함으로써, 단일 또는 탠덤 종결인자(들)를 함유하는 발현 카세트의 업스트림 및 다운스트림에 있다. 다수의 발현 시스템에서 가장 일반적으로 사용되는 MAR은 N. 타바쿰 RB7 MAR로 알려져 있다(Hall et ah, 1991). 본 발명은 아라비돕시스 탈리아나 At5g36340 번역 시작 코돈과 At5g36350 번역 종결 코돈 사이의 유전자간 영역인 신규한 MAR을 확인하였다(AtMAR1a로 지칭됨; Genbank ID: 염기 14331550 내지 14333550로부터의 CP002688.1). 일 구체예에서, 발현 벡터는 발현 카세트의 업스트림에 있는 MAR 및 탠덤 종결인자를 포함한다. 일 구체예에서, 발현 벡터는 발현 카세트의 다운스트림에 있는 MAR 및 탠덤 종결인자를 포함한다. 다른 구체예에서, 발현 벡터는 탠덤 종결인자 및 2개의 MAR을 포함하며, 여기서 각각의 MAR은 발현 카세트의 어느 한 측에 측접하고, 즉, 제1 MAR은 발현 카세트의 업스트림에 있고, 제2 MAR은 발현 카세트의 다운스트림에 있다. 일 구체예에서, MAR은 AtMAR1a이고, 이는 이중 종결인자, 예를 들어, StPINII + NtPR1a 또는 StPINII + Tnos를 함유하는 발현 카세트의 업스트림에 있다. 일 구체예에서, MAR은 AtMAR1a이고, 이는 이중 종결인자, 예를 들어, StPINII + NtPR1a 또는 StPINII + Tnos를 함유하는 발현 카세트의 업스트림에 있다. 다른 구체예에서, MAR은 AtMAR1a이고, 이는 이중 종결인자, 예를 들어, StPINII + NtPR1a를 함유하는 발현 카세트의 업스트림 및 다운스트림에 있다.
추가의 구체예는 하기를 포함한다:
다음의 5'에서 3' 순서로 다음 성분을 포함하는 발현 벡터;
a. 프로모터 및 임의적으로 제2 프로모터
b. 오픈 리딩 프레임을 인코딩하는 폴리펩티드
c. 서열 ID No 6의 종결인자
d. 서열 ID No 1의 서열의 종결인자
e. 서열 ID No 7의 매트릭스 부착 영역
다음의 5'에서 3' 순서로 다음 성분을 포함하는 발현 벡터;
a. 프로모터 및 임의적으로 제2 프로모터
b. 오픈 리딩 프레임을 인코딩하는 폴리펩티드
c. 서열 ID No 5의 종결인자
d. 서열 ID No 6의 서열의 종결인자
e. 서열 ID No 7의 매트릭스 부착 영역
다음의 5'에서 3' 순서로 다음 성분을 포함하는 발현 벡터;
a. 프로모터 및 임의적으로 제2 프로모터
b. 오픈 리딩 프레임을 인코딩하는 폴리펩티드
c. 서열 ID No 5의 종결인자
d. 서열 ID No 6의 서열의 종결인자
e. 서열 ID No 7의 매트릭스 부착 영역
다음의 5'에서 3' 순서로 다음 성분을 포함하는 발현 벡터;
a. 이중 CaMV 35S 프로모터
b. 타바코 식각 바이러스 오메가 5'UTR(TEV 오메가)
c. 오픈 리딩 프레임을 인코딩하는 폴리펩티드
d. 서열 ID No 5의 종결인자
e. 서열 ID No 6의 서열의 종결인자
f. 서열 ID No 7의 매트릭스 부착 영역
선택된 단일 스트레스 유도된 종결인자 또는 탠덤 종결인자의 존재는 발현 벡터로부터의 단백질 생성을 증가시킨다. 이러한 효과는 본 발명의 MAR의 존재 하에 추가로 향상되었다. 증가된 단백질 생성은 형광 강도의 방출에 의해 결정되는 GFP의 향상된 발현에 의해 결정된다. 본원에서 사용되는 발현 벡터는 단일 또는 탠덤 종결인자(들) 및/또는 MAR(들)의 존재 하에 단백질 생성을 측정하기 위해 리포터 유전자 GFP를 포함한다. 단백질 생성의 증가는 1.3배, 5배 또는 10배 초과이다.
P19는 토마토 부시 스턴트 바이러스로부터 유래된 RNA 침묵의 억제인자이다. pEAQ-HT 벡터 백본은 P19를 포함한다(Sainsbury, F., Thuenemann, E.C. and Lomonossoff, G.P. (2009), pEAQ: versatile expression vectors for easy and quick transient expression of heterologous proteins in plants. Plant Biotechnology Journal, 7: 682-693. ttps://doi.org/10.1111/j.1467-7652.2009.00434.x). 본 발명의 특정 구체예에서, 발현 벡터는 P19 유전자를 추가로 포함한다. 다른 적합한 침묵 억제인자는 포토스 잠복 아우레우스바이러스( Pothos latent aureusvirus)(P14), 순무 크링클 바이러스(Turnip crinkle virus)(P38), 토마토 황엽 컬 바이러스(tomato yellow leaf curl virus)(V2), 토마토 스페르미 쿠쿠모바이러스(Tomato aspermy cucumovirus)(2b), 타바코 식각 바이러스(Tobacco etch virus)(HC-Pro), 비트 황색 바이러스(Beet yellows virus)(P21), 폴레로바이러스(poleroviruse)(P0) 및 고구마 마일드 반점 아이포모바이러스(Sweet potato mild mottle ipomovirus)(P1)를 포함하나 이에 제한되지 않는다.
비-단백질 코딩 서열에 대한 진화적 제약이 단백질 코딩 서열보다 유의하게 낮은 것을 고려하면 상동성 종결인자의 확인은 어렵다. 따라서, 이종상동성 단백질 코딩 유전자의 프로모터와 종결인자 사이의 서열 동일성 정도는 높은 정도의 서열 변이를 가질 수 있다. 그러나, 서열 동일성의 이러한 차이에도 불구하고, 이들은 여전히 동일한 생물학적 기능을 수행할 수 있어, 단백질 발현의 유도 또는 조직 특이성이 프로모터 및 종결인자 서열에 의해 유지된다. 본 발명에 따르면, 상동성 종결인자는 종결인자 자체의 서열 동일성에 의존하지 않고, 오히려 종결인자에 연결된 단백질의 동일성에 의존하는 방법을 사용하여 확인된다. 이 방법의 첫 번째 단계는 관련 단백질 서열을 확인하는 것이며, 이는 관심 단백질 서열을 갖는 식물 서열을 함유하는 단백질 데이터베이스에 대해 BLASTP를 포함하나 이에 제한되지 않는 여러 서열 상동성 방법에 의해 수행될 수 있다. 이 검색은 > 30%의 바람직한 서열 동일성을 갖는 상동성 서열을 드러낼 것이다. 상동성 서열은 또한 단백질 부류에서 발견되는 정의된 서열 모티프를 사용하여 확인될 수 있다. 모티프는 UniProt 릴리스 2020_06에 기반한 Pfam 버전 34.0과 같은 데이터베이스에 기술되어 있다. 상동성 단백질 서열은 표준 생물정보학 방법을 사용하여 이러한 서열 모티프의 존재에 의해 확인될 수 있다. 표적은 이 목록으로부터 선택될 수 있고, 종결인자를 함유하는 게놈 서열은 표준 생물정보학 방법을 사용하여 확인될 수 있다. 종결인자 서열은 유전자의 정지 코돈의 서열 3'이고, 이는 적어도 300-2000개의 염기쌍 길이를 포함할 것이다.
도면
도 1은 종결인자 벡터의 개략도이다. 도 1a는 35SΩ-eGFP-종결인자 발현 카세트를 포함하는 단일 종결인자 벡터를 예시한다. 도 1b는 서로 융합된 2개의 종결인자를 갖는 35SΩ-eGFP-종결인자 발현 카세트를 포함하는 탠덤 종결인자 벡터를 예시한다. 도 1c는 2x35SΩ-eGFP-종결인자 발현 카세트의 어느 한쪽에 측접된 2개의 AtMAR1a를 포함하는 AtMAR1a 벡터를 예시한다. 도 1d는 2x35SΩ, PINII 종결인자, NOS 종결인자(Tnos) 및 AtMAR1a를 최적화된 발현 카세트를 예시한다. 도 1e는 35S 프로모터, CPMV 5'UTR 및 3'UTR, NOS 종결인자 및 P19 침묵 억제인자를 포함하는 pEAQ-HIT 발현 카세트를 예시한다.
도 2a 및 2b는 Tnos 및 pEAQ-HT를 포함하는 벡터와 비교하여 StPINII, NtPR1a, NbPINII, NbWIN1, NbPDF1.2로부터 선택된 단일 스트레스 유도된 종결인자를 포함하는 벡터에 의해 방출되는 GFP 형광의 강도를 보여준다. 스트레스-유도된 종결인자는 향상된 발현을 발생시켰다.
도 3은 탠덤 종결인자의 조합(NbPINII + Tnos, NbPDF1.2+ Tnos, 및 NbWINl + Tnos)을 포함하는 벡터에 의해 방출된 GFP 형광의 강도가 단일 스트레스 유도된 종결인자 단독(NbPINII, NbPDF1.2 및 NbWIN1) 및 EU-ACT를 포함하는 벡터와 비교하여 향상된 eGFP 발현을 나타내었음을 보여준다.
도 4는 StPINII, Tnos, HSP18.2, EU, 또는 NtPR1a와 조합된 StPINII 종결인자뿐만 아니라 Tnos, StPINII 및 제2 NtPR1a와 조합된 NtPR1a 종결인자의 탠덤 종결인자 조합을 포함하는 벡터에 의해 방출되는 GFP 형광의 강도를 보여준다. 탠덤 종결인자는 단일 스트레스 유도된 종결인자 단독, pEAQ-HT 및 EU-ACT를 포함하는 벡터와 비교하여 향상된 eGFP 발현을 나타내었다.
도 5는 AtMAR1a를 포함하는 벡터, AtMAR1a가 없는 벡터, Tnos 및 pEAQ-HT를 포함하는 벡터에 의해 방출되는 GFP 형광의 강도를 보여준다. AtMAR1a를 갖는 벡터는 AtMAR1a, Tnos 및 pEAQ-HT가 없는 벡터와 비교하여 증가된 형광 강도를 발생시켰다.
도 6은 서로 융합된 2개의 종결인자를 포함하는 35SΩ-eGFP-종결인자 발현 카세트의 어느 한 쪽에 측접된 AtMAR1a를 포함하는 벡터, 서로 융합된 2개의 종결인자를 포함하는 35SΩ-eGFP-종결인자 발현 카세트의 3'에 AtMAR1a를 포함하는 벡터, Tnos 및 pEAQ-HT를 포함하는 벡터에 의해 방출된 GFP 형광 강도를 보여준다. AtMAR1a를 갖는 벡터는 AtMAR1a, Tnos 및 pEAQ-HT가 없는 벡터와 비교하여 증가된 형광 강도를 발생시켰다.
도 7은 pEAQ-HT와 비교하여 AtMAR1a의 3'에 측접된 2x35SQ, PINII 및 NOS 종결인자를 함유하는 벡터에 의한 ELISA 결정된 GFP 축적을 보여준다. GFP 축적은 pEAQ-HT에 의해 생성된 것보다 높다.
도 8은 Rb7 또는 AtMAR1a 매트릭스 부착 영역을 함유하는 벡터에 의해 방출된 GFP 형광을 보여준다. 벡터는 또한 2x35SO, PINII 및 NOS 종결인자를 함유한다. AtMAR1a는 Rb7과 비교하여 증가된 형광을 발생시킨다.
도 9는 웨스턴 블롯에 의해 결정된 바와 같은 pEAQ-HT 또는 최적화된 발현 카세트(2x35SO, PINII 및 NOS 종결인자, AtMAR1a에 의해 3'에 측접됨)를 사용하여 Zika NSl-6xHIS 태그의 축적을 보여준다. 샘플은 침윤 후(dpi) 3일 6일째에 수집하였다. 모든 작제물은 P19 침묵 억제인자의 존재하에 발현되었다. 총 단백질은 SDS-PAGE 겔에서 진행시키고, 나일론 막에 옮기고, 항-HIS 항체를 사용하여 웨스턴 블롯을 수행하였다. 농도계에 의한 단백질 축적의 정량화.
도 10은 웨스턴 블롯에 의해 결정된 바와 같은 pEAQ-HT 또는 최적화된 발현 카세트 중 어느 하나를 이용하여 아라키스 하이포가에아 Ara h6-6xHIS 태그의 축적을 보여준다. 샘플을 침윤 후(dpi) 3 및 6일째에 수집하였다. 모든 작제물은 P19 침묵 억제인자의 존재하에 발현되었다. 총 단백질은 SDS-PAGE 겔에서 진행시키고, 나일론 막에 옮기고, 항-HIs 항체를 사용하여 웨스턴 블롯을 수행하였다. 농도계에 의한 단백질 축적의 정량화.
도 11은 웨스턴 블롯에 의해 결정된 바와 같은 pEAQ-HT 또는 최적화된 발현 카세트 중 어느 하나를 이용하여 인간 대식세포 콜로니-자극 인자(M-CSF-β) 6xHIS 태그의 축적을 보여준다. 샘플을 침윤 후(dpi) 3 및 6일째에 수집하였다. 모든 작제물은 P19 침묵 억제인자의 존재하에 발현되었다. 총 단백질은 SDS-PAGE 겔에서 진행시키고, 나일론 막에 옮기고, 항-HIs 항체를 사용하여 웨스턴 블롯을 수행하였다. 농도계에 의한 단백질 축적의 정량화.
실시예
본 발명의 특정 양태 및 구체예는 이제 예로서 그리고 상기 설명된 도면을 참조하여 예시될 것이다.
실시예 1: 단일 종결인자를 포함하는 발현 벡터
종결인자의 합성
N. 타바쿰 병인-관련 단백질 1a [PR1a](NtPR1a, X12737.1) 종결인자를 화학적으로 합성하여 서열 ID No: 1을 산출하였다. N. 벤타미아나 종결인자 프로테이나제 억제제 타입-2 [PINII](NbPINII, Niben101Scf07757g00001.1), 상처-유도 단백질 [PR4](NbWIN1, Niben101Scf01015g01002.1) 및 디펜신-유사 단백질 14[PDF1.2](NbPDF1.2, Niben101Scf00761g00006.1)을 표 1에 열거된 프라이머를 사용하여 N. 벤타미아나 게놈 DNA로부터 PCR에 의해 증폭시켰다. S. 투베로섬 PINII(StPINII) 종결인자를 합성하여 서열 ID No:5를 산출하였다. Tnos를 합성하여 서열 ID 번호: 6을 산출하였다.
표 1: NbPINII, NbWIN1 및 NbPDF1.2의 증폭을 위한 프라이머
유전자 | 정방향 프라이머 | 역방향 프라이머 |
NbPINII | TGGACGAGCTGTACAAGTAATTATTTCTAATAAGTGATC | GGATCCCCGGGTACCGAGCTTCCTTTCTTTTCTTCTTTG |
NbWIN1 | GGATCCCCGGGTACCGAGCTAGTTGACAGTTAAGTTAA | TGGACGAGCTGTACAAGTAAGAAGCTATATACATATATA |
NbPDF1.2 | TGGACGAGCTGTACAAGTAATAATTGAAATTGGATTGAT | GGATCCCCGGGTACCGAGCTTGCTAGACTTAGATGTCAA |
단일 종결인자 발현 벡터의 생성
TEV 오메가 인핸서를 갖는 단일 CaMV 35S 프로모터로 구성된 프로모터를 포함하는 이원 벡터 플라스미드를 사용하여 발현 벡터를 생성하였다. eGFP를 pEAQ-HT에 클로닝하여 35SΩ-eGFP-종결인자 발현 벡터를 생성하였다. PR1a, PINII, NbPINII, NbWIN1, PDF1.2, StPINII 및 Tnos로부터 선택된 단일 종결인자를 개별 벡터로 클로닝하였다. 발현 벡터의 개략도는 도 1a에 도시되어 있다.
단일 종결인자 벡터로부터의 발현
P19가 벡터 상에 존재하는 pEAQ-HT 벡터를 제외하고, 종결인자를 갖는 이원 벡터를 함유하는 A. 투메파시엔스를 P19 침묵 억제인자를 운반하는 A. 투메파시엔스와 N. 벤타미아나 잎에 공동-침윤시켰다. 샘플을 채취하고 488 nm의 여기 및 507 nm의 방출을 갖는 형광 플레이트 리더를 사용하여 형광 측정에 의해 eGFP 발현이 모니터링되는 경우, 침윤 후 6일 동안 식물을 성장시켰다. eGFP의 ELISA 정량화는 제조 설명서에 따라 GFP ELISA 키트(Abcam)를 사용하여 수행하였다. 침윤 후(dpi) 6일째에, eGFP 발현을 상이한 종결인자 사이에서 비교하였다. StPINII, NtPR1a, NbPINII, NbWIN1, 및 NbPDF1.2 종결인자를 포함하는 벡터는 Tnos 또는 pEAQ-HT 벡터를 포함하는 벡터와 비교하여 증가된 형광 강도를 방출하였다(도 2a 및 도 2b). 증가된 형광 강도는 pEAQ-HT 및 Tnos를 포함하는 벡터와 각각 비교하여, 하기 종결인자 StPINII, NtPR1a, NbPINII, NbWIN1, 및 NbPDF1.2 중 하나를 포함하는 벡터에 의해 적어도 1.3배 및 적어도 1.5배 향상된 eGFP 발현을 입증한다 - 따라서, 단백질의 발현이 본 발명의 종결인자에 의해 향상됨을 입증한다.
실시예 2: 탠덤 종결인자를 포함하는 발현 벡터
탠덤 종결인자 발현 벡터의 생성
발현 벡터는 실시예 1에서 상기 기재된 바와 같이 생성되었다. NEB HiFi® DNA 어셈블리를 통해 제2 위치 종결인자에서 Tnos, HSP18.2, EU, StPINII 또는 NtPR1a와 스트레스 유도된 종결인자(NbPDF1.2, NbPINII, NbWIN1)의 융합에 의해 탠덤 종결인자를 생성하였다. 이러한 탠덤 종결인자를 콜리플라워 모자이크 바이러스(CaMV) 35S 프로모터, 및 eGFP를 갖는 이원 벡터 내에 클로닝하여 35SΩ-eGFP-종결인자 발현 카세트를 생성시켰다. 발현 벡터의 개략도는 도 1b에 도시되어 있다. eGFP를 pEAQ-HT에 클로닝하였다.
탠덤 종결인자를 함유하는 벡터로부터의 발현
P19가 벡터에 존재하는 A. 투메파시엔스 벡터. 샘플을 채취하고 488 nm의 여기 및 507 nm의 방출을 갖는 형광 플레이트 리더를 사용하여 형광 측정에 의해 eGFP 발현이 모니터링되는 경우, 침윤 후 6일 동안 식물을 성장시켰다. eGFP의 ELISA 정량화는 제조 설명서에 따라 GFP ELISA 키트(Abcam)를 사용하여 수행하였다. 단일 스트레스 유도된 종결인자를 포함하는 벡터와 탠덤 종결인자를 포함하는 벡터 사이에서 eGFP의 발현을 비교하였다. 스트레스 유도된 종결인자(NbPDF1.2, NbPINII, NbWIN1)와 제2 위치의 Tnos, HSP18.2, EU, StPINII 또는 NtPR1a의 탠덤 종결인자 조합의 다양한 조합이 생성되었다. EGFP의 발현을 6 dpi에서 pEAQ-HT 또는 최신 기술의 EU-ACT 탠덤 종결인자와 비교하였다(도 3).
탠덤 종결인자(NbPINII + Tnos, NbPDF1.2+ Tnos, 및 NbWIN1 + Tnos)을 포함하는 벡터는 단일 스트레스 유도된 종결인자 단독(NbPINII, NbPDF1.2 및 NbWIN1)을 포함하는 벡터와 비교하여 향상된 eGFP 발현을 나타내었다. NbPINII-Tnos, NbPDF1.2-Tnos 및 NbWIN1-Tnos로의 eGFP의 발현은 EU-ACT와 비교하여 동등하거나 향상되었다. NbPINII, NbPDF1.2 및 NbWIN1의 단일 및 탠덤 조합은 모두 pEAQ-HT보다 유의하게 더 높은 발현을 초래하였으며, 이는 본 발명의 벡터의 개선을 보여준다.
제2 위치에서 StPINII, Tnos, HSP18.2, EU, 또는 NtPR1a와 조합된 StPINII 종결인자를 벡터 내로 클로닝함으로써 탠덤 종결인자 조합을 생성하였다. 탠덤 종결인자 조합은 StPINII 종결인자 단독과 비교하여 eGFP의 증가된 발현을 발생시켰다(도 4). StPINII 또는 Tnos의 제2 복사체의 첨가에서는 유의한 향상이 관찰되지 않았다. StPINII 단독은 EU-ACT 및 pEAQ-HT 둘 모두에 비해 향상된 발현을 발생시켰다. 제2 위치에서 StPINII, Tnos 또는 NtPR1a와 조합된 NtPR1a 종결인자를 벡터 내로 클로닝함으로써 탠덤 종결인자 조합을 생성하였다. NtPR1a와의 탠덤 종결인자 조합은 NtPR1a 단독과 비교하여 발현을 유의하게 향상시키지 않았다(도 4).
실시예 3: MAR을 포함하는 발현 벡터
MAR의 합성
AtMAR1a를 아라비돕시스 탈리아나로부터 PCR에 의해 증폭시켜 서열 ID No: 6을 산출하였다.
MAR 및 탠덤 종결인자를 포함하는 발현 벡터의 생성
2개의 AtMAR1a를 표 2에 열거된 2세트의 프라이머(5'에서 클로닝하기 위한 프라이머 및 3'에서 클로닝하기 위한 프라이머)를 사용하여 클로닝하고, 이는 TEV 오메가 인핸서를 갖는 이중 인핸서 CaMV 35S 프로모터로 구성된 프로모터, eGFP 및 StPINII 및 Tnos를 포함하는 탠덤 종결인자를 함유하는 발현 카세트(2x35SΩ-eGFP-StPINII-Tnos)의 어느 한 측에 측접된다. 발현 벡터의 개략도는 도 1c에 도시되어 있다. 단일 AtMAR1a를 표 2에 열거된 단일 프라이머(3'에서 클로닝하기 위한 프라이머)를 사용하여 TEV 오메가 인핸서를 갖는 이중 인핸서 CaMV 35S 프로모터로 구성된 프로모터, eGFP 및 StPINII 및 Tnos를 포함하는 탠덤 종결인자를 함유하는 발현 카세트(2x35SΩ-eGFP-StPINII-Tnos)의 3'에서 클로닝하였다.
표 2: AtMAR1a 클로닝을 위한 프라이머
유전자 | 정방향 프라이머 | 역방향 프라이머 |
5'에서 AtMA1a | CAGCTATGACCATGATTACAGAGTTGCCGGTGCAAC | GCTCCACCATGTTGAGCTCTGATACATAGAACCGCTAG |
3'에서 AtMA1a | GAGTCGACCTGCAGGCATGCAGAGTTGCCGGTGCAAC | GTAAAACGACGGCCAGTGCCTGATACATAGAACCGCTAG |
MAR 함유 벡터에서의 발현
P19가 벡터 상에 존재하는 pEAQ-HT 벡터를 제외하고, 종결인자를 갖는 이원 벡터를 함유하는 A. 투메파시엔스를 N. 벤타미아나 잎에 P19 침묵 억제인자를 운반하는 A. 투메파시엔스와 공동-침윤시켰다. 샘플을 채취하고 488 nm의 여기 및 507 nm의 방출을 갖는 형광 플레이트 리더를 사용하여 형광 측정에 의해 eGFP 발현이 모니터링되는 경우, 침윤 후 6일 동안 식물을 성장시켰다. eGFP의 ELISA 정량화는 제조 설명서에 따라 GFP ELISA 키트(Abcam)를 사용하여 수행하였다. 2개의 AtMAR1a 또는 단일 AtMAR1a를 포함하는 벡터는 Tnos 종결인자 및 pEAQ-HT를 포함하는 벡터인 AtMAR1a가 없는 벡터와 비교하여 증가된 형광 강도를 발생시켰다(도 5 및 도 6). AtMAR1a의 첨가는 pEAQ-HT와 비교하여 발현에서 1.3배 초과의 증가 및 2.5배 초과의 증가를 초래하였다(도 5).
서열
SEQUENCE LISTING
<110> Leaf Expression Systems LTD
<120> Recombinant protein production
<130> P34850WO1
<160> 22
<170> PatentIn version 3.5
<210> 1
<211> 600
<212> DNA
<213> Artificial Sequence
<220>
<223> NtPR1a terminator DNA sequence
<400> 1
ttgaaacgac ctacgtccat ttcacgttaa tatgtatgga ttgttctgct tgatatcaag 60
aacttaaata attgctctaa aaagcaactt aaagtcaagt atatagtaat agtactatat 120
ttgtaatcct ctgaagtgga tctataaaaa gaccaagtgg tcataattaa ggggaaaaat 180
atgagttgat gatcagcttg atgtatgatc tgatattatt atgaacactt ttgtactcat 240
acgaatcatg tgttgatggt ctagctactt gcgatattac gagcaaaatt cttaactaca 300
tgccttagga acaagcttac acagttcata taatctacta gagggccaaa aacatgaaaa 360
ttaccaattt agatggtagg aggatattga aagtggagca gctagtttta ataactgacc 420
gttagtctta aaattgacgg tataaaaata tttacataat caggtcattt ataaggtaat 480
tataggtaaa tatttatgac gaattctcaa tagtaatctg aaaaaaaatt gtaactaacc 540
tattatacta aaactactat aataggttag attacattaa tcatgtcatt agaagatctt 600
<210> 2
<211> 600
<212> DNA
<213> Artificial Sequence
<220>
<223> NbPINII terminator DNA sequence
<400> 2
ttgaaacgac ctacgtccat ttcacgttaa tatgtatgga ttgttctgct tgatatcaag 60
aacttaaata attgctctaa aaagcaactt aaagtcaagt atatagtaat agtactatat 120
ttgtaatcct ctgaagtgga tctataaaaa gaccaagtgg tcataattaa ggggaaaaat 180
atgagttgat gatcagcttg atgtatgatc tgatattatt atgaacactt ttgtactcat 240
acgaatcatg tgttgatggt ctagctactt gcgatattac gagcaaaatt cttaactaca 300
tgccttagga acaagcttac acagttcata taatctacta gagggccaaa aacatgaaaa 360
ttaccaattt agatggtagg aggatattga aagtggagca gctagtttta ataactgacc 420
gttagtctta aaattgacgg tataaaaata tttacataat caggtcattt ataaggtaat 480
tataggtaaa tatttatgac gaattctcaa tagtaatctg aaaaaaaatt gtaactaacc 540
tattatacta aaactactat aataggttag attacattaa tcatgtcatt agaagatctt 600
<210> 3
<211> 634
<212> DNA
<213> Artificial Sequence
<220>
<223> NbWIN1 terminator DNA sequence
<400> 3
gaagctatat acatatatat ggccatgttt accctttgac ggcccaaata aaagtaaaag 60
aacgatatgt aaaaggaaaa agaaaataaa gttgctttga ttgggttatg caattccaat 120
atctattcaa gaattaatgt ctttcgtttg ggaagaatga ggtgaagtgt gtattatctt 180
tgtgatttta aataaaaaaa tcacagtggg acagtatttg tgattatatt aggttgctgt 240
tgttgtattt tagtagttat tccttttagt ttttacccaa caccccaatt tgcaaaggat 300
tgcacaagct gagttcacac ctgctacttc caaacacaaa atgtcatcta cataagacaa 360
ctaatgtata taaagcaaaa atagaactac catcttttgg aagagatgta actagaacta 420
gctaggaaat aataacttgg aatatcagaa gaatgtattc cctaggttcg atggatgttt 480
gtattattgc tagaacatat tacatagatt atgaatatta aaataagcgc aggcagattt 540
tgactgaaat tctgaatgga taggactctg gaacattctc aatagtgagg gagttctttt 600
tttttttttt ttttttttaa cttaactgtc aact 634
<210> 4
<211> 633
<212> DNA
<213> Artificial Sequence
<220>
<223> NbPDF1.2 terminator DNA sequence
<400> 4
taattgaaat tggattgatg ctatgtatgc ccaaaaaagg gagatatgtg aagtttgtta 60
taataaggcg agagatgtaa attacaccaa taggtgtaag acttctttat attctcggta 120
tgtataactt aaatcatcgt gatagtgcac tcaaactaag tctcttccat aagaataaca 180
aataaataaa taaataaata aaatcttttt ttctttttgt ccaagaaaat aaataaaaac 240
tccacatacg cgacacgatt gccttgacaa atggaagaat attgaaggta gcatgcatgt 300
gaggcaatct tgacgacttc aaaaacttct taagatgttg aatggcatca gaaataacat 360
tttagtatgt gtttacataa gtttcatcac tttgcctaaa aacaaggaag ttgtgagttc 420
gagtcattct aagagcaagg tggagagttc ttcaaaggaa gaatgtcggg gatctatttg 480
gaaacaacct atctacccta tgatacgggt aaggtttgcg tatacactat tcttccagat 540
cccactttta aaattatact agcttgttat tatatttaat tatgttataa atttaagtaa 600
ttaaagaaag acttttgaca tctaagtcta gca 633
<210> 5
<211> 535
<212> DNA
<213> Artificial Sequence
<220>
<223> StPINII terminator DNA sequence
<400> 5
ccctagactt gtccatcttc tggattggcc aacttaatta atgtatgaaa taaaaggatg 60
cacacatagt gacatgctaa tcactataat gtgggcatca aagttgtgtg ttatgtgtaa 120
ttactaatta tctgaataag agaaagagat catccatatt tcttatccta aatgaatgtc 180
acgtgtcttt ataattcttt gatgaaccag atgcatttta ttaaccaatt ccatatacat 240
ataaatatta atcatatata attaatatca attgggttag caaaacaaat ctagtctagg 300
tgtgttttgc taattattgg gggatagtgc aaaaagaaat ctacgttctc aataattcag 360
atagaaaact taataaagtg agataattta catagattgc ttttatcctt tgatatatgt 420
gaaaccatgc atgatataag gaaaatagat agagaaataa ttttttacat cgttgaatat 480
gtaaacaatt taattcaaga agctaggaat ataaatattg aggagtttat gatta 535
<210> 6
<211> 551
<212> DNA
<213> Artificial Sequence
<220>
<223> Tnos terminator DNA sequence
<400> 6
agaaggagtg cgtcgaagca gatcgttcaa acatttggca ataaagtttc ttaagattga 60
atcctgttgc cggtcttgcg atgattatca tataatttct gttgaattac gttaagcatg 120
taataattaa catgtaatgc atgacgttat ttatgagatg ggtttttatg attagagtcc 180
cgcaattata catttaatac gcgatagaaa acaaaatata gcgcgcaaac taggataaat 240
tatcgcgcgc ggtgtcatct atgttactag atcgatcaaa cttcggcact gtgtaatgac 300
gatgagcaat cgagaggctg actaacaaaa ggtatgccca aaaacaacct ctccaaactg 360
tttcgaattg gaagtttctg ctcatgccga caggcataac ttagatattc gcgggctatt 420
cccactaatt cgtcctgctg gtttgcgcca agataaatca gtgcatctcc ttacaagttc 480
ctctgtcttg tgaaatgaac tgctgactgc cccccaagaa agcctcctca tctcccagtt 540
ggcggcggct g 551
<210> 7
<211> 1922
<212> DNA
<213> Artificial Sequence
<220>
<223> AtMAR1a DNA sequence
<400> 7
agagttgccg gtgcaactcc tcccatacca aaatagtgtt ttatcttatt tttaaaatag 60
ataacttttt caacttattt gtttaaaatt ttagcttacg ttacatgtta taataataat 120
taaaaaaaga agaagatata gtaataacat ttgagaagtt gcatttgggt tccatgttta 180
tacattcttc acttctaatg aataacacct tgaaacatcg agtccataat tgaatttagt 240
cttacaatgt tacagacctt caaattgttt ccataaatct ttgaaatatg tcataacaca 300
aaatctgaga gtggtttata attttattag ataagactcg tccaaatatg ctggtgtgag 360
aaatgttgtg atgatataaa aattctaaat agtaatcggt atttttcaaa agaatatttc 420
aattatatac attccatata ccatgccttt actaattata tataatacgg gatttctcaa 480
agtataaaag aaagataaga caaggaaaac atacaacatc tataaaagac gcaccagaca 540
gagcctctca ttgaattttg tggtaaacga atagaactct gtaattgaga aaaaaataaa 600
atgaaataat attaagaaat aaaaagagag acatatttaa gttacaaaat tagaaaatat 660
taaatcacgt attaatattt ttctaaaaca aaatagggaa cttttacttc tgttttgaat 720
atataaacga tttttaatag aatttgttca atattttaat atagtaaata aaaaatttgt 780
atatatgaac tatttttttt acttgtgtat atatccgatg gggttatgaa atttttctat 840
attttgtttt ttaaaaatat agggttttgt gcaaaacacc catctaactc atctagtttt 900
gcaattttac cctatatctc taacaaacac atattaatct tatgaagtct aaaataatac 960
gcaatatgac ccttatacgt atattgtaaa cttttttaca ctcccataga ttagattttt 1020
aatatttcga aggtcgattt gaacttttcg tcgagaaagc ttcgattaaa catattaaat 1080
atcaatatct tacaaaatat tgtcgtagaa aaatgacgaa aaggggttaa attgcgtatt 1140
attttagact tcatcggata attatgcatt ttttggaggt ggagaataaa gatgcaaaaa 1200
tagatgagtt agagggtttt attttgcaca aaaccctaaa aataacaaaa tttgatttga 1260
taagggtgga tatttcacta ataaatttga cacgtgtcat gatcacgtga gttaacaatt 1320
ttgaaagccc aactttatgt agatatttgg cacatatatt ggattatgtt cattgttttc 1380
atgccagatc cgaactgctc ttcccaaccg tttaacccgc tatccagaaa ctcttctcct 1440
ctaagattag tgttaacaag tcatggagaa cctcattgta tagaagtttt acaaactaaa 1500
cctttagatt gattcaaata atttcacgaa gaaaatatta taaatcgatt tatttgttta 1560
aatttggaga tataaaccga tgattgatta attatgtgaa gccattttac ttttattttc 1620
tctttgtagt caatatttct tagttaatgt tacgtgtttc acacatggag tttcaactat 1680
attaaatttc taaaacggct aatcaaatac ctaattaacg tattcaaaga tgttaaatta 1740
aaaaaaatta atatgacagt ttcacatttc aatccatata aataagcaag gattttattg 1800
ttattcatca atcaaaaaca aacgaagcat taagcatata gttgctatac taagactttt 1860
tactcaattt ctcattatgt ctatcaaaaa tgtgttttca cttctagcgg ttctatgtat 1920
ca 1922
<210> 8
<211> 1922
<212> PRT
<213> Artificial Sequence
<220>
<223> NtPR1a protein sequence
<400> 8
Ala Gly Ala Gly Thr Thr Gly Cys Cys Gly Gly Thr Gly Cys Ala Ala
1 5 10 15
Cys Thr Cys Cys Thr Cys Cys Cys Ala Thr Ala Cys Cys Ala Ala Ala
20 25 30
Ala Thr Ala Gly Thr Gly Thr Thr Thr Thr Ala Thr Cys Thr Thr Ala
35 40 45
Thr Thr Thr Thr Thr Ala Ala Ala Ala Thr Ala Gly Ala Thr Ala Ala
50 55 60
Cys Thr Thr Thr Thr Thr Cys Ala Ala Cys Thr Thr Ala Thr Thr Thr
65 70 75 80
Gly Thr Thr Thr Ala Ala Ala Ala Thr Thr Thr Thr Ala Gly Cys Thr
85 90 95
Thr Ala Cys Gly Thr Thr Ala Cys Ala Thr Gly Thr Thr Ala Thr Ala
100 105 110
Ala Thr Ala Ala Thr Ala Ala Thr Thr Ala Ala Ala Ala Ala Ala Ala
115 120 125
Gly Ala Ala Gly Ala Ala Gly Ala Thr Ala Thr Ala Gly Thr Ala Ala
130 135 140
Thr Ala Ala Cys Ala Thr Thr Thr Gly Ala Gly Ala Ala Gly Thr Thr
145 150 155 160
Gly Cys Ala Thr Thr Thr Gly Gly Gly Thr Thr Cys Cys Ala Thr Gly
165 170 175
Thr Thr Thr Ala Thr Ala Cys Ala Thr Thr Cys Thr Thr Cys Ala Cys
180 185 190
Thr Thr Cys Thr Ala Ala Thr Gly Ala Ala Thr Ala Ala Cys Ala Cys
195 200 205
Cys Thr Thr Gly Ala Ala Ala Cys Ala Thr Cys Gly Ala Gly Thr Cys
210 215 220
Cys Ala Thr Ala Ala Thr Thr Gly Ala Ala Thr Thr Thr Ala Gly Thr
225 230 235 240
Cys Thr Thr Ala Cys Ala Ala Thr Gly Thr Thr Ala Cys Ala Gly Ala
245 250 255
Cys Cys Thr Thr Cys Ala Ala Ala Thr Thr Gly Thr Thr Thr Cys Cys
260 265 270
Ala Thr Ala Ala Ala Thr Cys Thr Thr Thr Gly Ala Ala Ala Thr Ala
275 280 285
Thr Gly Thr Cys Ala Thr Ala Ala Cys Ala Cys Ala Ala Ala Ala Thr
290 295 300
Cys Thr Gly Ala Gly Ala Gly Thr Gly Gly Thr Thr Thr Ala Thr Ala
305 310 315 320
Ala Thr Thr Thr Thr Ala Thr Thr Ala Gly Ala Thr Ala Ala Gly Ala
325 330 335
Cys Thr Cys Gly Thr Cys Cys Ala Ala Ala Thr Ala Thr Gly Cys Thr
340 345 350
Gly Gly Thr Gly Thr Gly Ala Gly Ala Ala Ala Thr Gly Thr Thr Gly
355 360 365
Thr Gly Ala Thr Gly Ala Thr Ala Thr Ala Ala Ala Ala Ala Thr Thr
370 375 380
Cys Thr Ala Ala Ala Thr Ala Gly Thr Ala Ala Thr Cys Gly Gly Thr
385 390 395 400
Ala Thr Thr Thr Thr Thr Cys Ala Ala Ala Ala Gly Ala Ala Thr Ala
405 410 415
Thr Thr Thr Cys Ala Ala Thr Thr Ala Thr Ala Thr Ala Cys Ala Thr
420 425 430
Thr Cys Cys Ala Thr Ala Thr Ala Cys Cys Ala Thr Gly Cys Cys Thr
435 440 445
Thr Thr Ala Cys Thr Ala Ala Thr Thr Ala Thr Ala Thr Ala Thr Ala
450 455 460
Ala Thr Ala Cys Gly Gly Gly Ala Thr Thr Thr Cys Thr Cys Ala Ala
465 470 475 480
Ala Gly Thr Ala Thr Ala Ala Ala Ala Gly Ala Ala Ala Gly Ala Thr
485 490 495
Ala Ala Gly Ala Cys Ala Ala Gly Gly Ala Ala Ala Ala Cys Ala Thr
500 505 510
Ala Cys Ala Ala Cys Ala Thr Cys Thr Ala Thr Ala Ala Ala Ala Gly
515 520 525
Ala Cys Gly Cys Ala Cys Cys Ala Gly Ala Cys Ala Gly Ala Gly Cys
530 535 540
Cys Thr Cys Thr Cys Ala Thr Thr Gly Ala Ala Thr Thr Thr Thr Gly
545 550 555 560
Thr Gly Gly Thr Ala Ala Ala Cys Gly Ala Ala Thr Ala Gly Ala Ala
565 570 575
Cys Thr Cys Thr Gly Thr Ala Ala Thr Thr Gly Ala Gly Ala Ala Ala
580 585 590
Ala Ala Ala Ala Thr Ala Ala Ala Ala Thr Gly Ala Ala Ala Thr Ala
595 600 605
Ala Thr Ala Thr Thr Ala Ala Gly Ala Ala Ala Thr Ala Ala Ala Ala
610 615 620
Ala Gly Ala Gly Ala Gly Ala Cys Ala Thr Ala Thr Thr Thr Ala Ala
625 630 635 640
Gly Thr Thr Ala Cys Ala Ala Ala Ala Thr Thr Ala Gly Ala Ala Ala
645 650 655
Ala Thr Ala Thr Thr Ala Ala Ala Thr Cys Ala Cys Gly Thr Ala Thr
660 665 670
Thr Ala Ala Thr Ala Thr Thr Thr Thr Thr Cys Thr Ala Ala Ala Ala
675 680 685
Cys Ala Ala Ala Ala Thr Ala Gly Gly Gly Ala Ala Cys Thr Thr Thr
690 695 700
Thr Ala Cys Thr Thr Cys Thr Gly Thr Thr Thr Thr Gly Ala Ala Thr
705 710 715 720
Ala Thr Ala Thr Ala Ala Ala Cys Gly Ala Thr Thr Thr Thr Thr Ala
725 730 735
Ala Thr Ala Gly Ala Ala Thr Thr Thr Gly Thr Thr Cys Ala Ala Thr
740 745 750
Ala Thr Thr Thr Thr Ala Ala Thr Ala Thr Ala Gly Thr Ala Ala Ala
755 760 765
Thr Ala Ala Ala Ala Ala Ala Thr Thr Thr Gly Thr Ala Thr Ala Thr
770 775 780
Ala Thr Gly Ala Ala Cys Thr Ala Thr Thr Thr Thr Thr Thr Thr Thr
785 790 795 800
Ala Cys Thr Thr Gly Thr Gly Thr Ala Thr Ala Thr Ala Thr Cys Cys
805 810 815
Gly Ala Thr Gly Gly Gly Gly Thr Thr Ala Thr Gly Ala Ala Ala Thr
820 825 830
Thr Thr Thr Thr Cys Thr Ala Thr Ala Thr Thr Thr Thr Gly Thr Thr
835 840 845
Thr Thr Thr Thr Ala Ala Ala Ala Ala Thr Ala Thr Ala Gly Gly Gly
850 855 860
Thr Thr Thr Thr Gly Thr Gly Cys Ala Ala Ala Ala Cys Ala Cys Cys
865 870 875 880
Cys Ala Thr Cys Thr Ala Ala Cys Thr Cys Ala Thr Cys Thr Ala Gly
885 890 895
Thr Thr Thr Thr Gly Cys Ala Ala Thr Thr Thr Thr Ala Cys Cys Cys
900 905 910
Thr Ala Thr Ala Thr Cys Thr Cys Thr Ala Ala Cys Ala Ala Ala Cys
915 920 925
Ala Cys Ala Thr Ala Thr Thr Ala Ala Thr Cys Thr Thr Ala Thr Gly
930 935 940
Ala Ala Gly Thr Cys Thr Ala Ala Ala Ala Thr Ala Ala Thr Ala Cys
945 950 955 960
Gly Cys Ala Ala Thr Ala Thr Gly Ala Cys Cys Cys Thr Thr Ala Thr
965 970 975
Ala Cys Gly Thr Ala Thr Ala Thr Thr Gly Thr Ala Ala Ala Cys Thr
980 985 990
Thr Thr Thr Thr Thr Ala Cys Ala Cys Thr Cys Cys Cys Ala Thr Ala
995 1000 1005
Gly Ala Thr Thr Ala Gly Ala Thr Thr Thr Thr Thr Ala Ala Thr
1010 1015 1020
Ala Thr Thr Thr Cys Gly Ala Ala Gly Gly Thr Cys Gly Ala Thr
1025 1030 1035
Thr Thr Gly Ala Ala Cys Thr Thr Thr Thr Cys Gly Thr Cys Gly
1040 1045 1050
Ala Gly Ala Ala Ala Gly Cys Thr Thr Cys Gly Ala Thr Thr Ala
1055 1060 1065
Ala Ala Cys Ala Thr Ala Thr Thr Ala Ala Ala Thr Ala Thr Cys
1070 1075 1080
Ala Ala Thr Ala Thr Cys Thr Thr Ala Cys Ala Ala Ala Ala Thr
1085 1090 1095
Ala Thr Thr Gly Thr Cys Gly Thr Ala Gly Ala Ala Ala Ala Ala
1100 1105 1110
Thr Gly Ala Cys Gly Ala Ala Ala Ala Gly Gly Gly Gly Thr Thr
1115 1120 1125
Ala Ala Ala Thr Thr Gly Cys Gly Thr Ala Thr Thr Ala Thr Thr
1130 1135 1140
Thr Thr Ala Gly Ala Cys Thr Thr Cys Ala Thr Cys Gly Gly Ala
1145 1150 1155
Thr Ala Ala Thr Thr Ala Thr Gly Cys Ala Thr Thr Thr Thr Thr
1160 1165 1170
Thr Gly Gly Ala Gly Gly Thr Gly Gly Ala Gly Ala Ala Thr Ala
1175 1180 1185
Ala Ala Gly Ala Thr Gly Cys Ala Ala Ala Ala Ala Thr Ala Gly
1190 1195 1200
Ala Thr Gly Ala Gly Thr Thr Ala Gly Ala Gly Gly Gly Thr Thr
1205 1210 1215
Thr Thr Ala Thr Thr Thr Thr Gly Cys Ala Cys Ala Ala Ala Ala
1220 1225 1230
Cys Cys Cys Thr Ala Ala Ala Ala Ala Thr Ala Ala Cys Ala Ala
1235 1240 1245
Ala Ala Thr Thr Thr Gly Ala Thr Thr Thr Gly Ala Thr Ala Ala
1250 1255 1260
Gly Gly Gly Thr Gly Gly Ala Thr Ala Thr Thr Thr Cys Ala Cys
1265 1270 1275
Thr Ala Ala Thr Ala Ala Ala Thr Thr Thr Gly Ala Cys Ala Cys
1280 1285 1290
Gly Thr Gly Thr Cys Ala Thr Gly Ala Thr Cys Ala Cys Gly Thr
1295 1300 1305
Gly Ala Gly Thr Thr Ala Ala Cys Ala Ala Thr Thr Thr Thr Gly
1310 1315 1320
Ala Ala Ala Gly Cys Cys Cys Ala Ala Cys Thr Thr Thr Ala Thr
1325 1330 1335
Gly Thr Ala Gly Ala Thr Ala Thr Thr Thr Gly Gly Cys Ala Cys
1340 1345 1350
Ala Thr Ala Thr Ala Thr Thr Gly Gly Ala Thr Thr Ala Thr Gly
1355 1360 1365
Thr Thr Cys Ala Thr Thr Gly Thr Thr Thr Thr Cys Ala Thr Gly
1370 1375 1380
Cys Cys Ala Gly Ala Thr Cys Cys Gly Ala Ala Cys Thr Gly Cys
1385 1390 1395
Thr Cys Thr Thr Cys Cys Cys Ala Ala Cys Cys Gly Thr Thr Thr
1400 1405 1410
Ala Ala Cys Cys Cys Gly Cys Thr Ala Thr Cys Cys Ala Gly Ala
1415 1420 1425
Ala Ala Cys Thr Cys Thr Thr Cys Thr Cys Cys Thr Cys Thr Ala
1430 1435 1440
Ala Gly Ala Thr Thr Ala Gly Thr Gly Thr Thr Ala Ala Cys Ala
1445 1450 1455
Ala Gly Thr Cys Ala Thr Gly Gly Ala Gly Ala Ala Cys Cys Thr
1460 1465 1470
Cys Ala Thr Thr Gly Thr Ala Thr Ala Gly Ala Ala Gly Thr Thr
1475 1480 1485
Thr Thr Ala Cys Ala Ala Ala Cys Thr Ala Ala Ala Cys Cys Thr
1490 1495 1500
Thr Thr Ala Gly Ala Thr Thr Gly Ala Thr Thr Cys Ala Ala Ala
1505 1510 1515
Thr Ala Ala Thr Thr Thr Cys Ala Cys Gly Ala Ala Gly Ala Ala
1520 1525 1530
Ala Ala Thr Ala Thr Thr Ala Thr Ala Ala Ala Thr Cys Gly Ala
1535 1540 1545
Thr Thr Thr Ala Thr Thr Thr Gly Thr Thr Thr Ala Ala Ala Thr
1550 1555 1560
Thr Thr Gly Gly Ala Gly Ala Thr Ala Thr Ala Ala Ala Cys Cys
1565 1570 1575
Gly Ala Thr Gly Ala Thr Thr Gly Ala Thr Thr Ala Ala Thr Thr
1580 1585 1590
Ala Thr Gly Thr Gly Ala Ala Gly Cys Cys Ala Thr Thr Thr Thr
1595 1600 1605
Ala Cys Thr Thr Thr Thr Ala Thr Thr Thr Thr Cys Thr Cys Thr
1610 1615 1620
Thr Thr Gly Thr Ala Gly Thr Cys Ala Ala Thr Ala Thr Thr Thr
1625 1630 1635
Cys Thr Thr Ala Gly Thr Thr Ala Ala Thr Gly Thr Thr Ala Cys
1640 1645 1650
Gly Thr Gly Thr Thr Thr Cys Ala Cys Ala Cys Ala Thr Gly Gly
1655 1660 1665
Ala Gly Thr Thr Thr Cys Ala Ala Cys Thr Ala Thr Ala Thr Thr
1670 1675 1680
Ala Ala Ala Thr Thr Thr Cys Thr Ala Ala Ala Ala Cys Gly Gly
1685 1690 1695
Cys Thr Ala Ala Thr Cys Ala Ala Ala Thr Ala Cys Cys Thr Ala
1700 1705 1710
Ala Thr Thr Ala Ala Cys Gly Thr Ala Thr Thr Cys Ala Ala Ala
1715 1720 1725
Gly Ala Thr Gly Thr Thr Ala Ala Ala Thr Thr Ala Ala Ala Ala
1730 1735 1740
Ala Ala Ala Ala Thr Thr Ala Ala Thr Ala Thr Gly Ala Cys Ala
1745 1750 1755
Gly Thr Thr Thr Cys Ala Cys Ala Thr Thr Thr Cys Ala Ala Thr
1760 1765 1770
Cys Cys Ala Thr Ala Thr Ala Ala Ala Thr Ala Ala Gly Cys Ala
1775 1780 1785
Ala Gly Gly Ala Thr Thr Thr Thr Ala Thr Thr Gly Thr Thr Ala
1790 1795 1800
Thr Thr Cys Ala Thr Cys Ala Ala Thr Cys Ala Ala Ala Ala Ala
1805 1810 1815
Cys Ala Ala Ala Cys Gly Ala Ala Gly Cys Ala Thr Thr Ala Ala
1820 1825 1830
Gly Cys Ala Thr Ala Thr Ala Gly Thr Thr Gly Cys Thr Ala Thr
1835 1840 1845
Ala Cys Thr Ala Ala Gly Ala Cys Thr Thr Thr Thr Thr Ala Cys
1850 1855 1860
Thr Cys Ala Ala Thr Thr Thr Cys Thr Cys Ala Thr Thr Ala Thr
1865 1870 1875
Gly Thr Cys Thr Ala Thr Cys Ala Ala Ala Ala Ala Thr Gly Thr
1880 1885 1890
Gly Thr Thr Thr Thr Cys Ala Cys Thr Thr Cys Thr Ala Gly Cys
1895 1900 1905
Gly Gly Thr Thr Cys Thr Ala Thr Gly Thr Ala Thr Cys Ala
1910 1915 1920
<210> 9
<211> 197
<212> PRT
<213> Artificial Sequence
<220>
<223> NbPINII protein sequence
<400> 9
Met Ala Val His Lys Val Ser Phe Leu Ala His Leu Leu Val Leu Gly
1 5 10 15
Ile Phe Leu Leu Leu Val Asp Ala Lys Ala Cys Thr Lys Glu Cys Gly
20 25 30
Asn Phe Ala Tyr Gly Arg Cys Pro Arg Ser Gln Gly Thr Pro Asp Asp
35 40 45
Pro Ile Cys Thr Ser Cys Cys Ala Gly Tyr Lys Gly Cys Asn Tyr Tyr
50 55 60
Asn Ala Asn Gly Thr Phe Ile Cys Glu Gly Leu Ser Asp Pro Arg Lys
65 70 75 80
Pro Asn Phe Cys Pro Leu Phe Cys Asp Pro Asp Ile Ala Tyr Ser Lys
85 90 95
Cys Pro Arg Ser Glu Gly Glu Thr Ile Ile Asn Pro Thr Gly Cys Thr
100 105 110
Thr Cys Cys Thr Gly Tyr Lys Gly Cys Tyr Tyr Phe Gly Gln Asp Gly
115 120 125
Lys Phe Val Cys Glu Gly Glu Ser Asp Glu Pro Lys Ser Cys Thr Thr
130 135 140
Glu Cys Asp Pro Arg Val Ala Tyr Ile Ser Cys Pro Ile Ser Gly Leu
145 150 155 160
Val Lys Ile Asn Gln Glu Cys Ile Asn Cys Cys Asn Ala Asp Lys Gly
165 170 175
Cys Glu Leu Tyr Asp Asn Asp Gly Ser Leu Ile Cys Thr Gly Gly Glu
180 185 190
Pro Gln Ser Ala Ala
195
<210> 10
<211> 208
<212> PRT
<213> Artificial Sequence
<220>
<223> NbWIN1 protein sequence
<400> 10
Met Gly Lys Leu Ser Thr Val Leu Leu Ala Leu Ile Leu Phe Ile Ile
1 5 10 15
Ala Ala Gly Ala Asn Ala Gln Gln Cys Gly Arg Gln Arg Gly Gly Ala
20 25 30
Leu Cys Gly Gly Asn Leu Cys Cys Ser Gln Phe Gly Trp Cys Gly Ser
35 40 45
Thr Pro Glu Tyr Cys Ser Pro Ser Gln Gly Cys Gln Ser Gln Cys Ser
50 55 60
Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Ser Ala Gln Asn Val
65 70 75 80
Arg Ala Thr Tyr His Ile Tyr Asn Pro Gln Asn Val Gly Trp Asp Leu
85 90 95
Tyr Ala Val Ser Ala Tyr Cys Ser Thr Trp Asp Gly Asn Lys Pro Leu
100 105 110
Ala Trp Arg Arg Lys Tyr Gly Trp Thr Ala Phe Cys Gly Pro Val Gly
115 120 125
Pro Arg Gly Arg Asp Ser Cys Gly Lys Cys Leu Arg Val Thr Asn Thr
130 135 140
Gly Thr Gly Ala Gln Thr Thr Val Arg Ile Val Asp Gln Cys Ser Asn
145 150 155 160
Gly Gly Leu Asp Leu Asp Val Asn Val Phe Arg Gln Leu Asp Thr Asp
165 170 175
Gly Arg Gly Asn Gln Arg Gly His Leu Ile Val Asn Tyr Glu Phe Val
180 185 190
Asn Cys Gly Asp Asn Met Asn Val Leu Val Ser Pro Val Asp Lys Glu
195 200 205
<210> 11
<211> 79
<212> PRT
<213> Artificial Sequence
<220>
<223> NbPDF1.2 protein sequence
<400> 11
Met Ala Lys Ser Gln Ile Gln Cys Ala Val Phe Leu Ala Leu Phe Phe
1 5 10 15
Cys Phe Leu Val Ala Ser Thr Glu Met Met Gln Lys Ala Glu Ala Leu
20 25 30
Gly Cys Glu Lys Pro Ser Thr Thr Trp Ser Gly Pro Cys Leu Phe Ser
35 40 45
Asp Asp Cys Asn Asn Gln Cys Ile Asn Trp Glu Gly Ala Val His Gly
50 55 60
Glu Cys Ser Phe Ala Leu Gly Pro Glu Cys Phe Cys Tyr Phe Cys
65 70 75
<210> 12
<211> 3937
<212> DNA
<213> Artificial Sequence
<220>
<223> Expression vector with StPINII-NtPR1a - AtMAR1a DNA sequence
<400> 12
caacatggtg gagcacgaca ctctcgtcta ctccaagaat atcaaagata cagtctcaga 60
agaccaaagg gctattgaga cttttcaaca aagggtaata tcgggaaacc tcctcggatt 120
ccattgccca gctatctgtc acttcatcaa aaggacagta gaaaaggaag gtggcaccta 180
caaatgccat cattgcgata aaggaaaggc tatcgttcaa gatgcctctg ccgacagtgg 240
tcccaaagat ggacccccac ccacgaggag catcgtggaa aaagaagacg ttccaaccac 300
gtcttcaaag caagtggatt gatgtgataa catggtggag cacgacactc tcgtctactc 360
caagaatatc aaagatacag tctcagaaga ccaaagggct attgagactt ttcaacaaag 420
ggtaatatcg ggaaacctcc tcggattcca ttgcccagct atctgtcact tcatcaaaag 480
gacagtagaa aaggaaggtg gcacctacaa atgccatcat tgcgataaag gaaaggctat 540
cgttcaagat gcctctgccg acagtggtcc caaagatgga cccccaccca cgaggagcat 600
cgtggaaaaa gaagacgttc caaccacgtc ttcaaagcaa gtggattgat gtgatatctc 660
cactgacgta agggatgacg cacaatccca ctatccttcg caagaccctt cctctatata 720
aggaagttca tttcatttgg agaggacacg ctgaaatcac cagtgtattt ttacaacaat 780
taccaacaac aacaaacaac aaacaacatt acaattacta tttacaatgg cgcgccccct 840
agacttgtcc atcttctgga ttggccaact taattaatgt atgaaataaa aggatgcaca 900
catagtgaca tgctaatcac tataatgtgg gcatcaaagt tgtgtgttat gtgtaattac 960
taattatctg aataagagaa agagatcatc catatttctt atcctaaatg aatgtcacgt 1020
gtctttataa ttctttgatg aaccagatgc attttattaa ccaattccat atacatataa 1080
atattaatca tatataatta atatcaattg ggttagcaaa acaaatctag tctaggtgtg 1140
ttttgctaat tattggggga tagtgcaaaa agaaatctac gttctcaata attcagatag 1200
aaaacttaat aaagtgagat aatttacata gattgctttt atcctttgat atatgtgaaa 1260
ccatgcatga tataaggaaa atagatagag aaataatttt ttacatcgtt gaatatgtaa 1320
acaatttaat tcaagaagct aggaatataa atattgagga gtttatgatt attgaaacga 1380
cctacgtcca tttcacgtta atatgtatgg attgttctgc ttgatatcaa gaacttaaat 1440
aattgctcta aaaagcaact taaagtcaag tatatagtaa tagtactata tttgtaatcc 1500
tctgaagtgg atctataaaa agaccaagtg gtcataatta aggggaaaaa tatgagttga 1560
tgatcagctt gatgtatgat ctgatattat tatgaacact tttgtactca tacgaatcat 1620
gtgttgatgg tctagctact tgcgatatta cgagcaaaat tcttaactac atgccttagg 1680
aacaagctta cacagttcat ataatctact agagggccaa aaacatgaaa attaccaatt 1740
tagatggtag gaggatattg aaagtggagc agctagtttt aataactgac cgttagtctt 1800
aaaattgacg gtataaaaat atttacataa tcaggtcatt tataaggtaa ttataggtaa 1860
atatttatga cgaattctca atagtaatct gaaaaaaaat tgtaactaac ctattatact 1920
aaaactacta taataggtta gattacatta atcatgtcat tagaagatct tagctcggta 1980
cccggggatc ctctagagtc gacctgcagg catgcagagt tgccggtgca actcctccca 2040
taccaaaata gtgttttatc ttatttttaa aatagataac tttttcaact tatttgttta 2100
aaattttagc ttacgttaca tgttataata ataattaaaa aaagaagaag atatagtaat 2160
aacatttgag aagttgcatt tgggttccat gtttatacat tcttcacttc taatgaataa 2220
caccttgaaa catcgagtcc ataattgaat ttagtcttac aatgttacag accttcaaat 2280
tgtttccata aatctttgaa atatgtcata acacaaaatc tgagagtggt ttataatttt 2340
attagataag actcgtccaa atatgctggt gtgagaaatg ttgtgatgat ataaaaattc 2400
taaatagtaa tcggtatttt tcaaaagaat atttcaatta tatacattcc atataccatg 2460
cctttactaa ttatatataa tacgggattt ctcaaagtat aaaagaaaga taagacaagg 2520
aaaacataca acatctataa aagacgcacc agacagagcc tctcattgaa ttttgtggta 2580
aacgaataga actctgtaat tgagaaaaaa ataaaatgaa ataatattaa gaaataaaaa 2640
gagagacata tttaagttac aaaattagaa aatattaaat cacgtattaa tatttttcta 2700
aaacaaaata gggaactttt acttctgttt tgaatatata aacgattttt aatagaattt 2760
gttcaatatt ttaatatagt aaataaaaaa tttgtatata tgaactattt tttttacttg 2820
tgtatatatc cgatggggtt atgaaatttt tctatatttt gttttttaaa aatatagggt 2880
tttgtgcaaa acacccatct aactcatcta gttttgcaat tttaccctat atctctaaca 2940
aacacatatt aatcttatga agtctaaaat aatacgcaat atgaccctta tacgtatatt 3000
gtaaactttt ttacactccc atagattaga tttttaatat ttcgaaggtc gatttgaact 3060
tttcgtcgag aaagcttcga ttaaacatat taaatatcaa tatcttacaa aatattgtcg 3120
tagaaaaatg acgaaaaggg gttaaattgc gtattatttt agacttcatc ggataattat 3180
gcattttttg gaggtggaga ataaagatgc aaaaatagat gagttagagg gttttatttt 3240
gcacaaaacc ctaaaaataa caaaatttga tttgataagg gtggatattt cactaataaa 3300
tttgacacgt gtcatgatca cgtgagttaa caattttgaa agcccaactt tatgtagata 3360
tttggcacat atattggatt atgttcattg ttttcatgcc agatccgaac tgctcttccc 3420
aaccgtttaa cccgctatcc agaaactctt ctcctctaag attagtgtta acaagtcatg 3480
gagaacctca ttgtatagaa gttttacaaa ctaaaccttt agattgattc aaataatttc 3540
acgaagaaaa tattataaat cgatttattt gtttaaattt ggagatataa accgatgatt 3600
gattaattat gtgaagccat tttactttta ttttctcttt gtagtcaata tttcttagtt 3660
aatgttacgt gtttcacaca tggagtttca actatattaa atttctaaaa cggctaatca 3720
aatacctaat taacgtattc aaagatgtta aattaaaaaa aattaatatg acagtttcac 3780
atttcaatcc atataaataa gcaaggattt tattgttatt catcaatcaa aaacaaacga 3840
agcattaagc atatagttgc tatactaaga ctttttactc aatttctcat tatgtctatc 3900
aaaaatgtgt tttcacttct agcggttcta tgtatca 3937
<210> 13
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> NbPINII Forward Primer
<400> 13
tggacgagct gtacaagtaa ttatttctaa taagtgatc 39
<210> 14
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> NbPINII Reverse Primer
<400> 14
ggatccccgg gtaccgagct tcctttcttt tcttctttg 39
<210> 15
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> NbWIN1 Forward Primer
<400> 15
ggatccccgg gtaccgagct agttgacagt taagttaa 38
<210> 16
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> NbWIN1 Reverse Primer
<400> 16
tggacgagct gtacaagtaa gaagctatat acatatata 39
<210> 17
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> NbPDF1.2 Forward Primer
<400> 17
tggacgagct gtacaagtaa taattgaaat tggattgat 39
<210> 18
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> NbPDF1.2 Reverse Primer
<400> 18
ggatccccgg gtaccgagct tgctagactt agatgtcaa 39
<210> 19
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> AtMA1a at the 5 Forward Primer
<400> 19
cagctatgac catgattaca gagttgccgg tgcaac 36
<210> 20
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> AtMA1a at the 5 Reverse Primer
<400> 20
gctccaccat gttgagctct gatacataga accgctag 38
<210> 21
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> AtMA1a at the 3 Forward Primer
<400> 21
gagtcgacct gcaggcatgc agagttgccg gtgcaac 37
<210> 22
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> AtMA1a at the 3 Reverse Primer
<400> 22
gtaaaacgac ggccagtgcc tgatacatag aaccgctag 39
Claims (27)
- 스트레스 유도된 식물 유전자 또는 이의 단편 또는 변이체로부터의 핵산 서열을 포함하는 종결인자로서, 단 종결인자는 유전자 솔라눔 투베로섬(Solanum tuberosum) (서열 ID No 5), 아라비돕시스 탈리아나(Arabidopsis thaliana) HSP18.2 및 니코티아나 타바쿰 익스텐신(Nicotiana tabacum extensin)의 종결인자가 아닌, 종결인자.
- 제1항에 있어서, 핵산 서열이 서열 ID No 1 내지 4의 서열, 이의 종결인자 상동체, 또는 상기 서열, 상동체의 단편, 또는 상기 서열 ID No 1 내지 4, 상동체 또는 단편에 대해 80% 서열 동일성을 갖는 변이체인, 종결인자.
- 제1항 또는 제2항에 있어서, 스트레스 유도된 식물 유전자가 니코티아나 종, 예를 들어, N. 벤타미아나(N. benthamiana) 또는 N.타바쿰(N.tabacum)으로부터 유래되는, 종결인자.
- 매트릭스 부착 영역 또는 적어도 300개 염기쌍의 단편 또는 상기 영역 또는 단편에 대해 70% 동일성을 갖는 변이체를 포함하는 서열 ID no 7의 핵산 서열.
- 제1항 내지 제4항 중 어느 한 항에 따른 핵산 서열을 포함하는 발현 벡터.
- 제5항에 있어서, 제2 종결인자 서열을 추가로 포함하는, 발현 벡터.
- 제5항에 있어서, 서열 ID No 1 내지 6, 상기 서열 ID No 1 내지 6의 상동체, 변이체 및 단편, 및 상기 서열 ID No. 1 내지 6, 상동체, 변이체 및 단편에 대해 80% 동일성을 갖는 종결인자로부터 선택된 2개의 종결인자 서열을 포함하는, 발현 벡터.
- 제1항 내지 제3항 중 어느 한 항의 종결인자 및 제4항의 매트릭스 부착 영역을 포함하는 발현 벡터.
- 제7항에 있어서, 서열 ID No 1 내지 6, 상기 서열 ID No 1 내지 6의 상동체, 변이체 및 단편, 및 상기 서열 ID No. 1 내지 6, 상동체, 변이체 및 단편에 대해 80% 동일성을 갖는 종결인자로부터 선택된 2개의 종결인자 서열을 포함하는, 발현 벡터.
- 제5항 내지 제9항 중 어느 한 항에 있어서, 2개의 매트릭스 부착 영역 서열을 포함하며, 상기 서열은 서열 ID No 7, 서열 ID no 7의 적어도 300개 염기쌍의 단편, 또는 상기 영역 또는 단편에 대해 70% 동일성을 갖는 변이체로부터 선택되는, 발현 벡터.
- 제5항 내지 제10항 중 어느 한 항에 있어서, 폴리펩티드를 인코딩하는 오픈 리딩 프레임 서열을 포함하는, 발현 벡터.
- 제11항에 있어서, 프로모터를 포함하는, 발현 벡터.
- 제5항 내지 제12항 중 어느 한 항에 있어서, P19와 같은 침묵 억제인자를 추가로 포함하는, 발현 벡터.
- 하기 성분을 하기 5' 내지 3' 순서로 포함하는 발현 벡터:
a. 프로모터 및 임의적으로, 제2 프로모터
b. 오픈 리딩 프레임을 인코딩하는 폴리펩티드
c. 서열 ID No 6의 종결인자
d. 서열 ID no 1의 서열의 종결인자
e. 서열 ID No 7의 매트릭스 부착 영역. - 하기 성분을 하기 5' 내지 3' 순서로 포함하는 발현 벡터:
a. 프로모터 및 임의적으로, 제2 프로모터
b. 오픈 리딩 프레임을 인코딩하는 폴리펩티드
c. 서열 ID No 5의 종결인자
d. 서열 ID no 6의 서열의 종결인자
e. 서열 ID No 7의 매트릭스 부착 영역. - 제13항에 있어서, 발현 벡터가 카세트의 5'에서 및 카세트의 3' 및 5' 말단 둘 모두에서 서열 ID No: 7의 매트릭스 부착 영역을 포함하는 발현 카세트를 추가로 포함하는, 발현 벡터.
- 제13항에 있어서, 발현 벡터가 카세트의 3'에서 서열 ID No: 7의 매트릭스 부착 영역을 포함하는 발현 카세트를 추가로 포함하는, 발현 벡터.
- 하기 성분을 하기 5' 내지 3' 순서로 포함하는 발현 벡터:
a. 프로모터 및 임의적으로, 제2 프로모터
b. 오픈 리딩 프레임을 인코딩하는 폴리펩티드
c. 서열 ID No 5의 종결인자
d. 서열 ID no 6의 서열의 종결인자
e. 서열 ID No 7의 매트릭스 부착 영역. - 하기 성분을 하기 5' 내지 3' 순서로 포함하는 발현 벡터:
a. 이중 CaMV 35S 프로모터
b. 타바코 식각 바이러스 오메가 5'UTR(TEV 오메가)
c. 오픈 리딩 프레임을 인코딩하는 폴리펩티드
d. 서열 ID No 5의 종결인자
e. 서열 ID no 6의 서열의 종결인자
f. 서열 ID No 7의 매트릭스 부착 영역. - 제1항 내지 제4항 중 어느 한 항의 핵산 서열을 함유하는 이종성 숙주.
- 제5항 내지 제19항 중 어느 한 항에 따른 벡터로 형질전환된 숙주.
- 제20항 또는 제21항에 있어서, 숙주가 비리디플란태(Viridiplantae)로부터 유래된, 숙주.
- 관심 단백질의 발현에서의 제1항 내지 제4항의 핵산 또는 제5항 내지 제19항의 벡터의 용도.
- 제23항에 있어서, 상기 발현이 일시적 또는 안정적 발현인, 용도.
- 안정한 식물 또는 식물 세포의 생산에서의 제1항 내지 제4항의 핵산 또는 제5항 내지 제19항의 벡터의 용도.
- 식물 또는 식물 세포에서 단백질을 발현시키는 방법으로서, 식물 숙주 세포를 제5항 내지 제19항 중 어느 한 항에 따른 벡터로 형질전환시키는 단계, 상기 단백질을 발현시키는 단계 및 상기 단백질을 수집하는 단계를 포함하는, 방법.
- 제24항에 있어서, 상기 발현이 일시적 발현인, 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB2107598.1 | 2021-05-27 | ||
GBGB2107598.1A GB202107598D0 (en) | 2021-05-27 | 2021-05-27 | Recombinant protein production |
PCT/GB2022/051350 WO2022248872A1 (en) | 2021-05-27 | 2022-05-26 | Recombinant protein production |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20240011835A true KR20240011835A (ko) | 2024-01-26 |
Family
ID=76741400
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237045030A KR20240011835A (ko) | 2021-05-27 | 2022-05-26 | 재조합 단백질 생성 |
Country Status (6)
Country | Link |
---|---|
EP (1) | EP4347843A1 (ko) |
KR (1) | KR20240011835A (ko) |
CA (1) | CA3221453A1 (ko) |
GB (1) | GB202107598D0 (ko) |
IL (1) | IL308822A (ko) |
WO (1) | WO2022248872A1 (ko) |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6750381B2 (en) * | 1996-03-25 | 2004-06-15 | National Institute Of Agrobiological Sciences | Pathogen-resistant plants transformed with a DNA encoding sarcotoxin 1A linked to a signal peptide and a method for production thereof |
BR112014002342A2 (pt) * | 2011-08-01 | 2020-11-17 | Basf Plant Science Company Gmbh | moléculas terminais, método de identificação e isolamento de moléculas terminais, método de produção de moléculas terminais recombinantes, método de produção de plantas ou suas partes com expressão amplificada, construção de expressão recombinante, vetor de expressão recombinante, célula transgênica, planta transgênica ou sua parte, cultivo de células transgênicas, sementes trasngênicas, partes ou material de propagação derivados de uma célula ou planta transgênica ou sua parte, uso da molécula terminal e método de produção de produto agrícola |
EP3083967A1 (en) * | 2013-12-20 | 2016-10-26 | BASF Plant Science Company GmbH | Isolation of terminator sequences causing enhanced transcription |
JP6850041B2 (ja) * | 2017-05-31 | 2021-03-31 | 国立大学法人 筑波大学 | 植物細胞でのタンパク質発現システム及びその使用 |
CN112119160A (zh) * | 2018-03-02 | 2020-12-22 | 亚利桑那州立大学董事会 | 用于在植物中生产重组蛋白的复制和非复制载体及其使用方法 |
-
2021
- 2021-05-27 GB GBGB2107598.1A patent/GB202107598D0/en not_active Ceased
-
2022
- 2022-05-26 CA CA3221453A patent/CA3221453A1/en active Pending
- 2022-05-26 KR KR1020237045030A patent/KR20240011835A/ko unknown
- 2022-05-26 EP EP22729754.6A patent/EP4347843A1/en active Pending
- 2022-05-26 WO PCT/GB2022/051350 patent/WO2022248872A1/en active Application Filing
- 2022-05-26 IL IL308822A patent/IL308822A/en unknown
Also Published As
Publication number | Publication date |
---|---|
IL308822A (en) | 2024-01-01 |
EP4347843A1 (en) | 2024-04-10 |
WO2022248872A1 (en) | 2022-12-01 |
GB202107598D0 (en) | 2021-07-14 |
CA3221453A1 (en) | 2022-12-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2734623B1 (en) | Plants resistant to insect pests | |
US10202612B2 (en) | Compositions, organisms, systems, and methods for expressing a gene product in plants | |
JPH05508555A (ja) | 新規なインベルターゼ遺伝子とその使用 | |
MX2014009113A (es) | Composiciones citricas resistentes a patogeno, organismos, sistemas y metodos. | |
Yevtushenko et al. | Transgenic expression of antimicrobial peptides in plants: strategies for enhanced disease resistance, improved productivity, and production of therapeutics | |
KR20110023485A (ko) | 번역 효율 증진용 dna 단편 및 이를 포함하는 재조합 벡터 | |
WO2001007635A1 (en) | Bs2 resistance gene | |
CA3150204A1 (en) | METHODS FOR IMPROVING SEED SIZE AND QUALITY | |
WO2021141082A1 (ja) | エンハンサー | |
EP0784421B1 (en) | Pest trap plants and crop protection | |
CN105585623B (zh) | 抗病转TaMYB-KW基因小麦的培育方法及相关生物材料与应用 | |
KR20240011835A (ko) | 재조합 단백질 생성 | |
CN105713079A (zh) | 蛋白质及其相关生物材料在提高植物产量中的应用 | |
US6025544A (en) | Processes for modifying plant flowering behavior | |
AU751370B2 (en) | Improvements relating to protein accumulation | |
KR20190031881A (ko) | 식물 호르몬 aba 유도성 최적화 프로모터 제작 방법 및 이의 용도 | |
CN103614385B (zh) | 一个基因kt525在提高植物耐逆性上的应用 | |
CN103031303B (zh) | 一种植物叶枕特异表达启动子ProCol1的鉴定和应用 | |
US11319552B2 (en) | Methods for improving transformation frequency | |
CN111217899A (zh) | 一个参与桃芳樟醇合成调控的转录因子PpbHLH1及其应用 | |
CN107513532B (zh) | 一个梨组成型表达启动子PbTMT4P及其应用 | |
CN114214342B (zh) | NtFBA1基因在调控烟草PVY抗性方面的应用 | |
CN102676457A (zh) | 一个花特异表达启动子kt631p的功能和应用 | |
Wu et al. | Isolation and evaluation of three novel native promoters in Brassica napus | |
CN114196644A (zh) | 一种蛋白棕榈酰化转移酶dhhc16及其在提高水稻耐盐方面的应用 |