KR20230112673A - 글리코시드 생성물 생합성 및 회수 - Google Patents
글리코시드 생성물 생합성 및 회수 Download PDFInfo
- Publication number
- KR20230112673A KR20230112673A KR1020237020932A KR20237020932A KR20230112673A KR 20230112673 A KR20230112673 A KR 20230112673A KR 1020237020932 A KR1020237020932 A KR 1020237020932A KR 20237020932 A KR20237020932 A KR 20237020932A KR 20230112673 A KR20230112673 A KR 20230112673A
- Authority
- KR
- South Korea
- Prior art keywords
- leu
- seq
- glu
- ala
- val
- Prior art date
Links
- 229930182470 glycoside Natural products 0.000 title claims abstract description 133
- 150000002338 glycosides Chemical class 0.000 title claims abstract description 81
- 238000011084 recovery Methods 0.000 title claims abstract description 34
- 230000015572 biosynthetic process Effects 0.000 title claims description 16
- 102000004190 Enzymes Human genes 0.000 claims abstract description 279
- 108090000790 Enzymes Proteins 0.000 claims abstract description 279
- 238000000034 method Methods 0.000 claims abstract description 260
- 230000001580 bacterial effect Effects 0.000 claims abstract description 158
- 239000000758 substrate Substances 0.000 claims abstract description 136
- 238000006206 glycosylation reaction Methods 0.000 claims abstract description 114
- 230000013595 glycosylation Effects 0.000 claims abstract description 109
- 238000006243 chemical reaction Methods 0.000 claims abstract description 58
- 230000008569 process Effects 0.000 claims abstract description 44
- XCCTYIAWTASOJW-XVFCMESISA-N Uridine-5'-Diphosphate Chemical compound O[C@@H]1[C@H](O)[C@@H](COP(O)(=O)OP(O)(O)=O)O[C@H]1N1C(=O)NC(=O)C=C1 XCCTYIAWTASOJW-XVFCMESISA-N 0.000 claims abstract description 20
- 230000001419 dependent effect Effects 0.000 claims abstract description 14
- 238000009629 microbiological culture Methods 0.000 claims abstract description 14
- 210000004027 cell Anatomy 0.000 claims description 221
- 235000019202 steviosides Nutrition 0.000 claims description 100
- 241000588724 Escherichia coli Species 0.000 claims description 91
- 239000004383 Steviol glycoside Substances 0.000 claims description 90
- 235000019411 steviol glycoside Nutrition 0.000 claims description 90
- 229930182488 steviol glycoside Natural products 0.000 claims description 90
- 150000008144 steviol glycosides Chemical class 0.000 claims description 90
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 claims description 85
- 230000000694 effects Effects 0.000 claims description 79
- 108010043934 Sucrose synthase Proteins 0.000 claims description 76
- 150000001413 amino acids Chemical group 0.000 claims description 72
- JLYBBRAAICDTIS-UHFFFAOYSA-N mogrol Natural products CC12C(O)CC3(C)C(C(CCC(O)C(C)(C)O)C)CCC3(C)C1CC=C1C2CCC(O)C1(C)C JLYBBRAAICDTIS-UHFFFAOYSA-N 0.000 claims description 69
- -1 terpenoid glycosides Chemical class 0.000 claims description 66
- 230000014509 gene expression Effects 0.000 claims description 62
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 claims description 57
- JLYBBRAAICDTIS-AYEHCKLZSA-N mogrol Chemical compound C([C@H]1[C@]2(C)CC[C@@H]([C@]2(C[C@@H](O)[C@]11C)C)[C@@H](CC[C@@H](O)C(C)(C)O)C)C=C2[C@H]1CC[C@H](O)C2(C)C JLYBBRAAICDTIS-AYEHCKLZSA-N 0.000 claims description 56
- 108090000623 proteins and genes Proteins 0.000 claims description 47
- 239000002028 Biomass Substances 0.000 claims description 46
- 125000003147 glycosyl group Chemical group 0.000 claims description 42
- 230000000813 microbial effect Effects 0.000 claims description 42
- 239000000284 extract Substances 0.000 claims description 39
- 238000006467 substitution reaction Methods 0.000 claims description 38
- 238000002425 crystallisation Methods 0.000 claims description 36
- 230000008025 crystallization Effects 0.000 claims description 36
- 239000013078 crystal Substances 0.000 claims description 34
- 238000012239 gene modification Methods 0.000 claims description 32
- 230000005017 genetic modification Effects 0.000 claims description 32
- 235000013617 genetically modified food Nutrition 0.000 claims description 32
- HELXLJCILKEWJH-NCGAPWICSA-N rebaudioside A Chemical compound O([C@H]1[C@H](O)[C@@H](CO)O[C@H]([C@@H]1O[C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O)O[C@]12C(=C)C[C@@]3(C1)CC[C@@H]1[C@@](C)(CCC[C@]1([C@@H]3CC2)C)C(=O)O[C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O)[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O HELXLJCILKEWJH-NCGAPWICSA-N 0.000 claims description 32
- 239000000463 material Substances 0.000 claims description 29
- 230000002829 reductive effect Effects 0.000 claims description 28
- 230000036252 glycation Effects 0.000 claims description 27
- 230000001965 increasing effect Effects 0.000 claims description 26
- 238000012217 deletion Methods 0.000 claims description 25
- 230000037430 deletion Effects 0.000 claims description 25
- QFVOYBUQQBFCRH-VQSWZGCSSA-N steviol Chemical compound C([C@@]1(O)C(=C)C[C@@]2(C1)CC1)C[C@H]2[C@@]2(C)[C@H]1[C@](C)(C(O)=O)CCC2 QFVOYBUQQBFCRH-VQSWZGCSSA-N 0.000 claims description 25
- 238000001953 recrystallisation Methods 0.000 claims description 23
- 239000000203 mixture Substances 0.000 claims description 22
- 239000000243 solution Substances 0.000 claims description 22
- 239000002904 solvent Substances 0.000 claims description 22
- QFVOYBUQQBFCRH-UHFFFAOYSA-N Steviol Natural products C1CC2(C3)CC(=C)C3(O)CCC2C2(C)C1C(C)(C(O)=O)CCC2 QFVOYBUQQBFCRH-UHFFFAOYSA-N 0.000 claims description 20
- 230000002779 inactivation Effects 0.000 claims description 20
- 238000004519 manufacturing process Methods 0.000 claims description 20
- 239000002609 medium Substances 0.000 claims description 20
- 229940032084 steviol Drugs 0.000 claims description 20
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 claims description 18
- 102000048175 UTP-glucose-1-phosphate uridylyltransferases Human genes 0.000 claims description 18
- 108700023183 UTP-glucose-1-phosphate uridylyltransferases Proteins 0.000 claims description 18
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 18
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 claims description 17
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 claims description 17
- 239000008103 glucose Substances 0.000 claims description 17
- 230000004048 modification Effects 0.000 claims description 17
- 238000012986 modification Methods 0.000 claims description 17
- 240000006365 Vitis vinifera Species 0.000 claims description 16
- 238000009295 crossflow filtration Methods 0.000 claims description 16
- 101150041954 galU gene Proteins 0.000 claims description 16
- 101150096208 gtaB gene Proteins 0.000 claims description 16
- 239000000419 plant extract Substances 0.000 claims description 16
- RPYRMTHVSUWHSV-CUZJHZIBSA-N rebaudioside D Chemical compound O([C@H]1[C@H](O)[C@@H](CO)O[C@H]([C@@H]1O[C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O)O[C@]12C(=C)C[C@@]3(C1)CC[C@@H]1[C@@](C)(CCC[C@]1([C@@H]3CC2)C)C(=O)O[C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O[C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O)[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O RPYRMTHVSUWHSV-CUZJHZIBSA-N 0.000 claims description 16
- 102220466509 Putative histone H2B type 2-C_S11E_mutation Human genes 0.000 claims description 13
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 claims description 13
- 229930006000 Sucrose Natural products 0.000 claims description 13
- 230000002255 enzymatic effect Effects 0.000 claims description 13
- 238000010979 pH adjustment Methods 0.000 claims description 13
- 239000005720 sucrose Substances 0.000 claims description 13
- 101100029558 Escherichia coli (strain K12) ycjU gene Proteins 0.000 claims description 12
- 230000012010 growth Effects 0.000 claims description 12
- 239000000376 reactant Substances 0.000 claims description 12
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 claims description 11
- 241000191025 Rhodobacter Species 0.000 claims description 11
- 239000011148 porous material Substances 0.000 claims description 11
- 230000009467 reduction Effects 0.000 claims description 11
- 241000186016 Bifidobacterium bifidum Species 0.000 claims description 10
- OMHUCGDTACNQEX-OSHKXICASA-N Steviolbioside Natural products O([C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1O[C@]12C(=C)C[C@@]3(C1)CC[C@@H]1[C@@](C)(CCC[C@]1([C@@H]3CC2)C)C(O)=O)[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O OMHUCGDTACNQEX-OSHKXICASA-N 0.000 claims description 10
- UEDUENGHJMELGK-HYDKPPNVSA-N Stevioside Chemical compound O([C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1O[C@]12C(=C)C[C@@]3(C1)CC[C@@H]1[C@@](C)(CCC[C@]1([C@@H]3CC2)C)C(=O)O[C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O)[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O UEDUENGHJMELGK-HYDKPPNVSA-N 0.000 claims description 10
- 229940002008 bifidobacterium bifidum Drugs 0.000 claims description 10
- 238000005119 centrifugation Methods 0.000 claims description 10
- JLPRGBMUVNVSKP-AHUXISJXSA-M chembl2368336 Chemical compound [Na+].O([C@H]1[C@@H](O)[C@H](O)[C@H](CO)O[C@H]1O[C@]12C(=C)C[C@@]3(C1)CC[C@@H]1[C@@](C)(CCC[C@]1([C@@H]3CC2)C)C([O-])=O)[C@@H]1O[C@@H](CO)[C@@H](O)[C@H](O)[C@@H]1O JLPRGBMUVNVSKP-AHUXISJXSA-M 0.000 claims description 10
- 238000003306 harvesting Methods 0.000 claims description 10
- OHHNJQXIOPOJSC-UHFFFAOYSA-N stevioside Natural products CC1(CCCC2(C)C3(C)CCC4(CC3(CCC12C)CC4=C)OC5OC(CO)C(O)C(O)C5OC6OC(CO)C(O)C(O)C6O)C(=O)OC7OC(CO)C(O)C(O)C7O OHHNJQXIOPOJSC-UHFFFAOYSA-N 0.000 claims description 10
- 229940013618 stevioside Drugs 0.000 claims description 10
- 235000000346 sugar Nutrition 0.000 claims description 10
- 101150047507 ushA gene Proteins 0.000 claims description 10
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 9
- 238000001914 filtration Methods 0.000 claims description 9
- 150000003505 terpenes Chemical class 0.000 claims description 9
- 241000589516 Pseudomonas Species 0.000 claims description 8
- 229930003827 cannabinoid Natural products 0.000 claims description 8
- 239000003557 cannabinoid Substances 0.000 claims description 8
- 229910052799 carbon Inorganic materials 0.000 claims description 8
- 238000003780 insertion Methods 0.000 claims description 8
- 230000037431 insertion Effects 0.000 claims description 8
- 229930001119 polyketide Natural products 0.000 claims description 8
- 235000013824 polyphenols Nutrition 0.000 claims description 8
- QSRAJVGDWKFOGU-WBXIDTKBSA-N rebaudioside c Chemical compound O[C@@H]1[C@H](O)[C@@H](O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](O[C@H]2[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O2)O)[C@H](O)[C@@H](CO)O[C@H]1O[C@]1(CC[C@H]2[C@@]3(C)[C@@H]([C@](CCC3)(C)C(=O)O[C@H]3[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O3)O)CC3)C(=C)C[C@]23C1 QSRAJVGDWKFOGU-WBXIDTKBSA-N 0.000 claims description 8
- 239000000725 suspension Substances 0.000 claims description 8
- 230000005526 G1 to G0 transition Effects 0.000 claims description 7
- 241000588902 Zymomonas mobilis Species 0.000 claims description 7
- 230000002018 overexpression Effects 0.000 claims description 7
- 230000009466 transformation Effects 0.000 claims description 7
- 241000193830 Bacillus <bacterium> Species 0.000 claims description 6
- 244000063299 Bacillus subtilis Species 0.000 claims description 6
- 235000014469 Bacillus subtilis Nutrition 0.000 claims description 6
- 241000954177 Bangana ariza Species 0.000 claims description 6
- 241000588722 Escherichia Species 0.000 claims description 6
- 241000191023 Rhodobacter capsulatus Species 0.000 claims description 6
- 240000004808 Saccharomyces cerevisiae Species 0.000 claims description 6
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 claims description 6
- 241001409321 Siraitia grosvenorii Species 0.000 claims description 6
- 102100020797 UMP-CMP kinase Human genes 0.000 claims description 6
- 241000588901 Zymomonas Species 0.000 claims description 6
- 125000002791 glucosyl group Chemical group C1([C@H](O)[C@@H](O)[C@H](O)[C@H](O1)CO)* 0.000 claims description 6
- 101150034999 otsA gene Proteins 0.000 claims description 6
- 238000012546 transfer Methods 0.000 claims description 6
- 102000005731 Glucose-6-phosphate isomerase Human genes 0.000 claims description 5
- 108010070600 Glucose-6-phosphate isomerase Proteins 0.000 claims description 5
- 239000002253 acid Substances 0.000 claims description 5
- 238000012258 culturing Methods 0.000 claims description 5
- 229930003935 flavonoid Natural products 0.000 claims description 5
- 150000002215 flavonoids Chemical class 0.000 claims description 5
- 235000017173 flavonoids Nutrition 0.000 claims description 5
- 230000002209 hydrophobic effect Effects 0.000 claims description 5
- 125000002887 hydroxy group Chemical group [H]O* 0.000 claims description 5
- 230000003993 interaction Effects 0.000 claims description 5
- 150000007524 organic acids Chemical class 0.000 claims description 5
- 229930000044 secondary metabolite Natural products 0.000 claims description 5
- NWUYHJFMYQTDRP-UHFFFAOYSA-N 1,2-bis(ethenyl)benzene;1-ethenyl-2-ethylbenzene;styrene Chemical compound C=CC1=CC=CC=C1.CCC1=CC=CC=C1C=C.C=CC1=CC=CC=C1C=C NWUYHJFMYQTDRP-UHFFFAOYSA-N 0.000 claims description 4
- 108090001003 Beta-phosphoglucomutases Proteins 0.000 claims description 4
- SRBFZHDQGSBBOR-IOVATXLUSA-N D-xylopyranose Chemical compound O[C@@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-IOVATXLUSA-N 0.000 claims description 4
- 229930186291 Dulcoside Natural products 0.000 claims description 4
- CANAPGLEBDTCAF-NTIPNFSCSA-N Dulcoside A Chemical compound O[C@@H]1[C@H](O)[C@@H](O)[C@H](C)O[C@H]1O[C@H]1[C@H](O[C@]23C(C[C@]4(C2)[C@H]([C@@]2(C)[C@@H]([C@](CCC2)(C)C(=O)O[C@H]2[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O2)O)CC4)CC3)=C)O[C@H](CO)[C@@H](O)[C@@H]1O CANAPGLEBDTCAF-NTIPNFSCSA-N 0.000 claims description 4
- CANAPGLEBDTCAF-QHSHOEHESA-N Dulcoside A Natural products C[C@@H]1O[C@H](O[C@@H]2[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]2O[C@]34CC[C@H]5[C@]6(C)CCC[C@](C)([C@H]6CC[C@@]5(CC3=C)C4)C(=O)O[C@@H]7O[C@H](CO)[C@@H](O)[C@H](O)[C@H]7O)[C@H](O)[C@H](O)[C@H]1O CANAPGLEBDTCAF-QHSHOEHESA-N 0.000 claims description 4
- 101100156625 Escherichia coli (strain K12) wcaJ gene Proteins 0.000 claims description 4
- 239000001512 FEMA 4601 Substances 0.000 claims description 4
- 239000001776 FEMA 4720 Substances 0.000 claims description 4
- 101150102398 Galt gene Proteins 0.000 claims description 4
- 239000004471 Glycine Substances 0.000 claims description 4
- 241000235058 Komagataella pastoris Species 0.000 claims description 4
- 241000235648 Pichia Species 0.000 claims description 4
- 239000004695 Polyether sulfone Substances 0.000 claims description 4
- 102220472879 Proteasomal ATPase-associated factor 1_S23D_mutation Human genes 0.000 claims description 4
- 241000589776 Pseudomonas putida Species 0.000 claims description 4
- HELXLJCILKEWJH-SEAGSNCFSA-N Rebaudioside A Natural products O=C(O[C@H]1[C@@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1)[C@@]1(C)[C@@H]2[C@](C)([C@H]3[C@@]4(CC(=C)[C@@](O[C@H]5[C@H](O[C@H]6[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O6)[C@@H](O[C@H]6[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O6)[C@H](O)[C@@H](CO)O5)(C4)CC3)CC2)CCC1 HELXLJCILKEWJH-SEAGSNCFSA-N 0.000 claims description 4
- 241000235070 Saccharomyces Species 0.000 claims description 4
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 claims description 4
- 238000001042 affinity chromatography Methods 0.000 claims description 4
- 239000003957 anion exchange resin Substances 0.000 claims description 4
- 229940065144 cannabinoids Drugs 0.000 claims description 4
- 239000003729 cation exchange resin Substances 0.000 claims description 4
- 210000000349 chromosome Anatomy 0.000 claims description 4
- 230000022811 deglycosylation Effects 0.000 claims description 4
- HELXLJCILKEWJH-UHFFFAOYSA-N entered according to Sigma 01432 Natural products C1CC2C3(C)CCCC(C)(C(=O)OC4C(C(O)C(O)C(CO)O4)O)C3CCC2(C2)CC(=C)C21OC(C1OC2C(C(O)C(O)C(CO)O2)O)OC(CO)C(O)C1OC1OC(CO)C(O)C(O)C1O HELXLJCILKEWJH-UHFFFAOYSA-N 0.000 claims description 4
- 229930182486 flavonoid glycoside Natural products 0.000 claims description 4
- 150000007955 flavonoid glycosides Chemical class 0.000 claims description 4
- 101150002054 galE gene Proteins 0.000 claims description 4
- 101150045500 galK gene Proteins 0.000 claims description 4
- 101150054547 galM gene Proteins 0.000 claims description 4
- 101150013858 glgC gene Proteins 0.000 claims description 4
- 239000012528 membrane Substances 0.000 claims description 4
- 101150095512 otsB gene Proteins 0.000 claims description 4
- 229920006393 polyether sulfone Polymers 0.000 claims description 4
- 229920001223 polyethylene glycol Polymers 0.000 claims description 4
- 125000000830 polyketide group Chemical group 0.000 claims description 4
- 150000008442 polyphenolic compounds Chemical class 0.000 claims description 4
- 235000019203 rebaudioside A Nutrition 0.000 claims description 4
- 239000011347 resin Substances 0.000 claims description 4
- 229920005989 resin Polymers 0.000 claims description 4
- 102200012976 rs35349917 Human genes 0.000 claims description 4
- 102200131511 rs59065411 Human genes 0.000 claims description 4
- 150000003436 stilbenoids Chemical class 0.000 claims description 4
- 102000002281 Adenylate kinase Human genes 0.000 claims description 3
- 108020000543 Adenylate kinase Proteins 0.000 claims description 3
- 229930091371 Fructose Natural products 0.000 claims description 3
- RFSUNEUAIZKAJO-ARQDHWQXSA-N Fructose Chemical compound OC[C@H]1O[C@](O)(CO)[C@@H](O)[C@@H]1O RFSUNEUAIZKAJO-ARQDHWQXSA-N 0.000 claims description 3
- 239000005715 Fructose Substances 0.000 claims description 3
- 229910019142 PO4 Inorganic materials 0.000 claims description 3
- 102000004160 Phosphoric Monoester Hydrolases Human genes 0.000 claims description 3
- 108090000608 Phosphoric Monoester Hydrolases Proteins 0.000 claims description 3
- 239000002202 Polyethylene glycol Substances 0.000 claims description 3
- GIPHUOWOTCAJSR-UHFFFAOYSA-N Rebaudioside A. Natural products C1CC2C3(C)CCCC(C)(C(=O)OC4C(C(O)C(O)C(CO)O4)O)C3CCC2(C2)CC(=C)C21OC1OC(CO)C(O)C(O)C1OC(C1O)OC(CO)C(O)C1OC1OC(CO)C(O)C(O)C1O GIPHUOWOTCAJSR-UHFFFAOYSA-N 0.000 claims description 3
- 102100029640 UDP-glucose 6-dehydrogenase Human genes 0.000 claims description 3
- 108030001662 UDP-glucose 6-dehydrogenases Proteins 0.000 claims description 3
- 101710100179 UMP-CMP kinase Proteins 0.000 claims description 3
- 101710119674 UMP-CMP kinase 2, mitochondrial Proteins 0.000 claims description 3
- 241000235013 Yarrowia Species 0.000 claims description 3
- 241000235015 Yarrowia lipolytica Species 0.000 claims description 3
- 239000000440 bentonite Substances 0.000 claims description 3
- 229910000278 bentonite Inorganic materials 0.000 claims description 3
- SVPXDRXYRYOSEX-UHFFFAOYSA-N bentoquatam Chemical compound O.O=[Si]=O.O=[Al]O[Al]=O SVPXDRXYRYOSEX-UHFFFAOYSA-N 0.000 claims description 3
- 239000013592 cell lysate Substances 0.000 claims description 3
- 125000002519 galactosyl group Chemical group C1([C@H](O)[C@@H](O)[C@@H](O)[C@H](O1)CO)* 0.000 claims description 3
- 125000000311 mannosyl group Chemical group C1([C@@H](O)[C@@H](O)[C@H](O)[C@H](O1)CO)* 0.000 claims description 3
- 150000007522 mineralic acids Chemical class 0.000 claims description 3
- 239000010452 phosphate Substances 0.000 claims description 3
- QRGRAFPOLJOGRV-UHFFFAOYSA-N rebaudioside F Natural products CC12CCCC(C)(C1CCC34CC(=C)C(CCC23)(C4)OC5OC(CO)C(O)C(OC6OCC(O)C(O)C6O)C5OC7OC(CO)C(O)C(O)C7O)C(=O)OC8OC(CO)C(O)C(O)C8O QRGRAFPOLJOGRV-UHFFFAOYSA-N 0.000 claims description 3
- HYLAUKAHEAUVFE-AVBZULRRSA-N rebaudioside f Chemical compound O([C@H]1[C@H](O)[C@@H](CO)O[C@H]([C@@H]1O[C@H]1[C@@H]([C@@H](O)[C@H](O)CO1)O)O[C@]12C(=C)C[C@@]3(C1)CC[C@@H]1[C@@](C)(CCC[C@]1([C@@H]3CC2)C)C(=O)O[C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O)[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O HYLAUKAHEAUVFE-AVBZULRRSA-N 0.000 claims description 3
- 102220222752 rs373957223 Human genes 0.000 claims description 3
- 125000000969 xylosyl group Chemical group C1([C@H](O)[C@@H](O)[C@H](O)CO1)* 0.000 claims description 3
- 210000005253 yeast cell Anatomy 0.000 claims description 3
- CHRJZRDFSQHIFI-UHFFFAOYSA-N 1,2-bis(ethenyl)benzene;styrene Chemical compound C=CC1=CC=CC=C1.C=CC1=CC=CC=C1C=C CHRJZRDFSQHIFI-UHFFFAOYSA-N 0.000 claims description 2
- OMLWNBVRVJYMBQ-YUMQZZPRSA-N Arg-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O OMLWNBVRVJYMBQ-YUMQZZPRSA-N 0.000 claims description 2
- 102220505519 Class E basic helix-loop-helix protein 40_P56A_mutation Human genes 0.000 claims description 2
- 102220558029 Glutathione hydrolase 5 proenzyme_L11I_mutation Human genes 0.000 claims description 2
- 102220491824 High mobility group protein B1_S42E_mutation Human genes 0.000 claims description 2
- HYXQKVOADYPQEA-CIUDSAMLSA-N Ile-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CCCN=C(N)N HYXQKVOADYPQEA-CIUDSAMLSA-N 0.000 claims description 2
- 239000000020 Nitrocellulose Substances 0.000 claims description 2
- 239000004677 Nylon Substances 0.000 claims description 2
- 239000002033 PVDF binder Substances 0.000 claims description 2
- 101710135451 Probable cytidylate kinase Proteins 0.000 claims description 2
- 102220537295 Protein NDRG2_V31P_mutation Human genes 0.000 claims description 2
- 101800000828 RNA-directed RNA polymerase 3D-POL Proteins 0.000 claims description 2
- 102220470058 Ribonucleoside-diphosphate reductase subunit M2_S20E_mutation Human genes 0.000 claims description 2
- 101710197404 Trehalose-phosphate phosphatase Proteins 0.000 claims description 2
- FJWGYAHXMCUOOM-QHOUIDNNSA-N [(2s,3r,4s,5r,6r)-2-[(2r,3r,4s,5r,6s)-4,5-dinitrooxy-2-(nitrooxymethyl)-6-[(2r,3r,4s,5r,6s)-4,5,6-trinitrooxy-2-(nitrooxymethyl)oxan-3-yl]oxyoxan-3-yl]oxy-3,5-dinitrooxy-6-(nitrooxymethyl)oxan-4-yl] nitrate Chemical compound O([C@@H]1O[C@@H]([C@H]([C@H](O[N+]([O-])=O)[C@H]1O[N+]([O-])=O)O[C@H]1[C@@H]([C@@H](O[N+]([O-])=O)[C@H](O[N+]([O-])=O)[C@@H](CO[N+]([O-])=O)O1)O[N+]([O-])=O)CO[N+](=O)[O-])[C@@H]1[C@@H](CO[N+]([O-])=O)O[C@@H](O[N+]([O-])=O)[C@H](O[N+]([O-])=O)[C@H]1O[N+]([O-])=O FJWGYAHXMCUOOM-QHOUIDNNSA-N 0.000 claims description 2
- 239000003463 adsorbent Substances 0.000 claims description 2
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 claims description 2
- 108010068380 arginylarginine Proteins 0.000 claims description 2
- 238000010923 batch production Methods 0.000 claims description 2
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 claims description 2
- 230000006696 biosynthetic metabolic pathway Effects 0.000 claims description 2
- 102220356983 c.173T>C Human genes 0.000 claims description 2
- 229920002301 cellulose acetate Polymers 0.000 claims description 2
- 238000004587 chromatography analysis Methods 0.000 claims description 2
- 230000029087 digestion Effects 0.000 claims description 2
- 239000001963 growth medium Substances 0.000 claims description 2
- 238000005342 ion exchange Methods 0.000 claims description 2
- 229920001220 nitrocellulos Polymers 0.000 claims description 2
- 229920001778 nylon Polymers 0.000 claims description 2
- 239000003960 organic solvent Substances 0.000 claims description 2
- 239000004810 polytetrafluoroethylene Substances 0.000 claims description 2
- 229920001343 polytetrafluoroethylene Polymers 0.000 claims description 2
- 229920002981 polyvinylidene fluoride Polymers 0.000 claims description 2
- 239000012429 reaction media Substances 0.000 claims description 2
- 102220038393 rs33958626 Human genes 0.000 claims description 2
- 102200025824 rs3743171 Human genes 0.000 claims description 2
- 239000007921 spray Substances 0.000 claims description 2
- 230000003068 static effect Effects 0.000 claims description 2
- 108010020589 trehalose-6-phosphate synthase Proteins 0.000 claims description 2
- 239000002699 waste material Substances 0.000 claims description 2
- 241000544066 Stevia Species 0.000 claims 8
- GOJUJUVQIVIZAV-UHFFFAOYSA-N 2-amino-4,6-dichloropyrimidine-5-carbaldehyde Chemical group NC1=NC(Cl)=C(C=O)C(Cl)=N1 GOJUJUVQIVIZAV-UHFFFAOYSA-N 0.000 claims 2
- 102220575066 ATP-binding cassette sub-family D member 2_Q244K_mutation Human genes 0.000 claims 1
- 241000186000 Bifidobacterium Species 0.000 claims 1
- 101100001670 Emericella variicolor andE gene Proteins 0.000 claims 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N adenyl group Chemical group N1=CN=C2N=CNC2=C1N GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 claims 1
- 239000007864 aqueous solution Substances 0.000 claims 1
- 102200016293 rs61752141 Human genes 0.000 claims 1
- 230000036983 biotransformation Effects 0.000 abstract description 18
- 239000000047 product Substances 0.000 description 117
- 125000003275 alpha amino acid group Chemical group 0.000 description 54
- GSGVXNMGMKBGQU-PHESRWQRSA-N rebaudioside M Chemical compound C[C@@]12CCC[C@](C)([C@H]1CC[C@@]13CC(=C)[C@@](C1)(CC[C@@H]23)O[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O[C@@H]2O[C@H](CO)[C@@H](O)[C@H](O)[C@H]2O)[C@H]1O[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O)C(=O)O[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O[C@@H]2O[C@H](CO)[C@@H](O)[C@H](O)[C@H]2O)[C@H]1O[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O GSGVXNMGMKBGQU-PHESRWQRSA-N 0.000 description 40
- 230000006872 improvement Effects 0.000 description 36
- HSCJRCZFDFQWRP-JZMIEXBBSA-N UDP-alpha-D-glucose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1OP(O)(=O)OP(O)(=O)OC[C@@H]1[C@@H](O)[C@@H](O)[C@H](N2C(NC(=O)C=C2)=O)O1 HSCJRCZFDFQWRP-JZMIEXBBSA-N 0.000 description 34
- HSCJRCZFDFQWRP-UHFFFAOYSA-N Uridindiphosphoglukose Natural products OC1C(O)C(O)C(CO)OC1OP(O)(=O)OP(O)(=O)OCC1C(O)C(O)C(N2C(NC(=O)C=C2)=O)O1 HSCJRCZFDFQWRP-UHFFFAOYSA-N 0.000 description 33
- 244000228451 Stevia rebaudiana Species 0.000 description 30
- 235000001014 amino acid Nutrition 0.000 description 27
- 108010049041 glutamylalanine Proteins 0.000 description 20
- 229930189775 mogroside Natural products 0.000 description 19
- 108010005233 alanylglutamic acid Proteins 0.000 description 16
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 15
- 239000012071 phase Substances 0.000 description 15
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 14
- 108010038320 lysylphenylalanine Proteins 0.000 description 14
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 13
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 13
- 108010012581 phenylalanylglutamate Proteins 0.000 description 13
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 12
- 108010050848 glycylleucine Proteins 0.000 description 12
- PPNPDKGQRFSCAC-CIUDSAMLSA-N Ser-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPNPDKGQRFSCAC-CIUDSAMLSA-N 0.000 description 11
- NLNCNKIVJPEFBC-DLOVCJGASA-N Val-Val-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O NLNCNKIVJPEFBC-DLOVCJGASA-N 0.000 description 11
- 235000003599 food sweetener Nutrition 0.000 description 11
- 108010036413 histidylglycine Proteins 0.000 description 11
- 108010057821 leucylproline Proteins 0.000 description 11
- 230000035772 mutation Effects 0.000 description 11
- AGVNTAUPLWIQEN-ZPFDUUQYSA-N Arg-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N AGVNTAUPLWIQEN-ZPFDUUQYSA-N 0.000 description 10
- VSLXGYMEHVAJBH-DLOVCJGASA-N His-Ala-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O VSLXGYMEHVAJBH-DLOVCJGASA-N 0.000 description 10
- UNLYPPYNDXHGDG-IHRRRGAJSA-N Phe-Gln-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 UNLYPPYNDXHGDG-IHRRRGAJSA-N 0.000 description 10
- 235000006092 Stevia rebaudiana Nutrition 0.000 description 10
- HXXFSFRBOHSIMQ-VFUOTHLCSA-N alpha-D-glucose 1-phosphate Chemical compound OC[C@H]1O[C@H](OP(O)(O)=O)[C@H](O)[C@@H](O)[C@@H]1O HXXFSFRBOHSIMQ-VFUOTHLCSA-N 0.000 description 10
- 230000002441 reversible effect Effects 0.000 description 10
- 239000003765 sweetening agent Substances 0.000 description 10
- 238000011282 treatment Methods 0.000 description 10
- TVTZEOHWHUVYCG-KYNKHSRBSA-N Gly-Thr-Thr Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O TVTZEOHWHUVYCG-KYNKHSRBSA-N 0.000 description 9
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 9
- YKNBJXOJTURHCU-DCAQKATOSA-N Leu-Asp-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKNBJXOJTURHCU-DCAQKATOSA-N 0.000 description 9
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 9
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 9
- 108010070944 alanylhistidine Proteins 0.000 description 9
- 108010093581 aspartyl-proline Proteins 0.000 description 9
- 229950010772 glucose-1-phosphate Drugs 0.000 description 9
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 9
- 108010015792 glycyllysine Proteins 0.000 description 9
- 108010000761 leucylarginine Proteins 0.000 description 9
- 239000013612 plasmid Substances 0.000 description 9
- 241000196324 Embryophyta Species 0.000 description 8
- AQNYKMCFCCZEEL-JYJNAYRXSA-N Glu-Lys-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AQNYKMCFCCZEEL-JYJNAYRXSA-N 0.000 description 8
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 8
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 8
- AQCUAZTZSPQJFF-ZKWXMUAHSA-N Ile-Ala-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O AQCUAZTZSPQJFF-ZKWXMUAHSA-N 0.000 description 8
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 8
- 108010079364 N-glycylalanine Proteins 0.000 description 8
- 108010013835 arginine glutamate Proteins 0.000 description 8
- 108010001271 arginyl-glutamyl-arginine Proteins 0.000 description 8
- 239000002158 endotoxin Substances 0.000 description 8
- 235000013305 food Nutrition 0.000 description 8
- 108010078144 glutaminyl-glycine Proteins 0.000 description 8
- 108010010147 glycylglutamine Proteins 0.000 description 8
- 108010081551 glycylphenylalanine Proteins 0.000 description 8
- 238000010438 heat treatment Methods 0.000 description 8
- 108010025306 histidylleucine Proteins 0.000 description 8
- 230000000670 limiting effect Effects 0.000 description 8
- ZIWWTZWAKYBUOB-CIUDSAMLSA-N Ala-Asp-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O ZIWWTZWAKYBUOB-CIUDSAMLSA-N 0.000 description 7
- BTYTYHBSJKQBQA-GCJQMDKQSA-N Ala-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N)O BTYTYHBSJKQBQA-GCJQMDKQSA-N 0.000 description 7
- OTZMRMHZCMZOJZ-SRVKXCTJSA-N Arg-Leu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OTZMRMHZCMZOJZ-SRVKXCTJSA-N 0.000 description 7
- HMQDRBKQMLRCCG-GMOBBJLQSA-N Asp-Arg-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HMQDRBKQMLRCCG-GMOBBJLQSA-N 0.000 description 7
- RQHLMGCXCZUOGT-ZPFDUUQYSA-N Asp-Leu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RQHLMGCXCZUOGT-ZPFDUUQYSA-N 0.000 description 7
- 240000001980 Cucurbita pepo Species 0.000 description 7
- RLFSBAPJTYKSLG-WHFBIAKZSA-N Gly-Ala-Asp Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O RLFSBAPJTYKSLG-WHFBIAKZSA-N 0.000 description 7
- COVXELOAORHTND-LSJOCFKGSA-N Gly-Ile-Val Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O COVXELOAORHTND-LSJOCFKGSA-N 0.000 description 7
- KIMHKBDJQQYLHU-PEFMBERDSA-N Ile-Glu-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KIMHKBDJQQYLHU-PEFMBERDSA-N 0.000 description 7
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 7
- PRZVBIAOPFGAQF-SRVKXCTJSA-N Leu-Glu-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O PRZVBIAOPFGAQF-SRVKXCTJSA-N 0.000 description 7
- SBANPBVRHYIMRR-GARJFASQSA-N Leu-Ser-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N SBANPBVRHYIMRR-GARJFASQSA-N 0.000 description 7
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 7
- KIEPQOIQHFKQLK-PCBIJLKTSA-N Phe-Asn-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KIEPQOIQHFKQLK-PCBIJLKTSA-N 0.000 description 7
- KUSYCSMTTHSZOA-DZKIICNBSA-N Phe-Val-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N KUSYCSMTTHSZOA-DZKIICNBSA-N 0.000 description 7
- 239000004743 Polypropylene Substances 0.000 description 7
- ICTZKEXYDDZZFP-SRVKXCTJSA-N Pro-Arg-Pro Chemical compound N([C@@H](CCCN=C(N)N)C(=O)N1[C@@H](CCC1)C(O)=O)C(=O)[C@@H]1CCCN1 ICTZKEXYDDZZFP-SRVKXCTJSA-N 0.000 description 7
- FKLSMYYLJHYPHH-UWVGGRQHSA-N Pro-Gly-Leu Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O FKLSMYYLJHYPHH-UWVGGRQHSA-N 0.000 description 7
- 235000002595 Solanum tuberosum Nutrition 0.000 description 7
- 244000061456 Solanum tuberosum Species 0.000 description 7
- XOWKUMFHEZLKLT-CIQUZCHMSA-N Thr-Ile-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O XOWKUMFHEZLKLT-CIQUZCHMSA-N 0.000 description 7
- XXWBHOWRARMUOC-NHCYSSNCSA-N Val-Lys-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)N)C(=O)O)N XXWBHOWRARMUOC-NHCYSSNCSA-N 0.000 description 7
- GBIUHAYJGWVNLN-UHFFFAOYSA-N Val-Ser-Pro Natural products CC(C)C(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O GBIUHAYJGWVNLN-UHFFFAOYSA-N 0.000 description 7
- 108010047495 alanylglycine Proteins 0.000 description 7
- 150000001875 compounds Chemical class 0.000 description 7
- 108010075431 glycyl-alanyl-phenylalanine Proteins 0.000 description 7
- 108010019832 glycyl-asparaginyl-glycine Proteins 0.000 description 7
- 108010018006 histidylserine Proteins 0.000 description 7
- 108010009298 lysylglutamic acid Proteins 0.000 description 7
- 238000010899 nucleation Methods 0.000 description 7
- 230000006911 nucleation Effects 0.000 description 7
- 230000020477 pH reduction Effects 0.000 description 7
- 108010084572 phenylalanyl-valine Proteins 0.000 description 7
- 229920001155 polypropylene Polymers 0.000 description 7
- 235000018102 proteins Nutrition 0.000 description 7
- 102000004169 proteins and genes Human genes 0.000 description 7
- 230000001105 regulatory effect Effects 0.000 description 7
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 7
- XVZCXCTYGHPNEM-IHRRRGAJSA-N (2s)-1-[(2s)-2-[[(2s)-2-amino-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O XVZCXCTYGHPNEM-IHRRRGAJSA-N 0.000 description 6
- NWVVKQZOVSTDBQ-CIUDSAMLSA-N Ala-Glu-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NWVVKQZOVSTDBQ-CIUDSAMLSA-N 0.000 description 6
- GGNHBHYDMUDXQB-KBIXCLLPSA-N Ala-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)N GGNHBHYDMUDXQB-KBIXCLLPSA-N 0.000 description 6
- FBHOPGDGELNWRH-DRZSPHRISA-N Ala-Glu-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O FBHOPGDGELNWRH-DRZSPHRISA-N 0.000 description 6
- LNNSWWRRYJLGNI-NAKRPEOUSA-N Ala-Ile-Val Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O LNNSWWRRYJLGNI-NAKRPEOUSA-N 0.000 description 6
- 241000219194 Arabidopsis Species 0.000 description 6
- POZKLUIXMHIULG-FDARSICLSA-N Arg-Trp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCCN=C(N)N)N POZKLUIXMHIULG-FDARSICLSA-N 0.000 description 6
- XEOXPCNONWHHSW-AVGNSLFASA-N Arg-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N XEOXPCNONWHHSW-AVGNSLFASA-N 0.000 description 6
- NCFJQJRLQJEECD-NHCYSSNCSA-N Asn-Leu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O NCFJQJRLQJEECD-NHCYSSNCSA-N 0.000 description 6
- RGKKALNPOYURGE-ZKWXMUAHSA-N Asp-Ala-Val Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O RGKKALNPOYURGE-ZKWXMUAHSA-N 0.000 description 6
- GGRSYTUJHAZTFN-IHRRRGAJSA-N Asp-Pro-Tyr Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)O)N)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O GGRSYTUJHAZTFN-IHRRRGAJSA-N 0.000 description 6
- SFJUYBCDQBAYAJ-YDHLFZDLSA-N Asp-Val-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SFJUYBCDQBAYAJ-YDHLFZDLSA-N 0.000 description 6
- 235000000832 Ayote Nutrition 0.000 description 6
- 235000009854 Cucurbita moschata Nutrition 0.000 description 6
- 235000009804 Cucurbita pepo subsp pepo Nutrition 0.000 description 6
- ATRHMOJQJWPVBQ-DRZSPHRISA-N Glu-Ala-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ATRHMOJQJWPVBQ-DRZSPHRISA-N 0.000 description 6
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 6
- BUAKRRKDHSSIKK-IHRRRGAJSA-N Glu-Glu-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 BUAKRRKDHSSIKK-IHRRRGAJSA-N 0.000 description 6
- DNPCBMNFQVTHMA-DCAQKATOSA-N Glu-Leu-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DNPCBMNFQVTHMA-DCAQKATOSA-N 0.000 description 6
- QNJNPKSWAHPYGI-JYJNAYRXSA-N Glu-Phe-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=CC=C1 QNJNPKSWAHPYGI-JYJNAYRXSA-N 0.000 description 6
- LPHGXOWFAXFCPX-KKUMJFAQSA-N Glu-Pro-Phe Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)O)N)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O LPHGXOWFAXFCPX-KKUMJFAQSA-N 0.000 description 6
- YYPFZVIXAVDHIK-IUCAKERBSA-N Gly-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN YYPFZVIXAVDHIK-IUCAKERBSA-N 0.000 description 6
- BUEFQXUHTUZXHR-LURJTMIESA-N Gly-Gly-Pro zwitterion Chemical compound NCC(=O)NCC(=O)N1CCC[C@H]1C(O)=O BUEFQXUHTUZXHR-LURJTMIESA-N 0.000 description 6
- COZMNNJEGNPDED-HOCLYGCPSA-N Gly-Val-Trp Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O COZMNNJEGNPDED-HOCLYGCPSA-N 0.000 description 6
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 6
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 6
- PBCHMHROGNUXMK-DLOVCJGASA-N Leu-Ala-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 PBCHMHROGNUXMK-DLOVCJGASA-N 0.000 description 6
- JQSXWJXBASFONF-KKUMJFAQSA-N Leu-Asp-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JQSXWJXBASFONF-KKUMJFAQSA-N 0.000 description 6
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 6
- VDIARPPNADFEAV-WEDXCCLWSA-N Leu-Thr-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O VDIARPPNADFEAV-WEDXCCLWSA-N 0.000 description 6
- DTUZCYRNEJDKSR-NHCYSSNCSA-N Lys-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN DTUZCYRNEJDKSR-NHCYSSNCSA-N 0.000 description 6
- VMTYLUGCXIEDMV-QWRGUYRKSA-N Lys-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCCCN VMTYLUGCXIEDMV-QWRGUYRKSA-N 0.000 description 6
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 6
- YRHRGNUAXGUPTO-PMVMPFDFSA-N Phe-Trp-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)N[C@@H](CCCCN)C(=O)O)N YRHRGNUAXGUPTO-PMVMPFDFSA-N 0.000 description 6
- FMLRRBDLBJLJIK-DCAQKATOSA-N Pro-Leu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FMLRRBDLBJLJIK-DCAQKATOSA-N 0.000 description 6
- RTQKBZIRDWZLDF-BZSNNMDCSA-N Pro-Pro-Trp Chemical compound C([C@H]1C(=O)N[C@@H](CC=2C3=CC=CC=C3NC=2)C(=O)O)CCN1C(=O)[C@@H]1CCCN1 RTQKBZIRDWZLDF-BZSNNMDCSA-N 0.000 description 6
- DNIAPMSPPWPWGF-UHFFFAOYSA-N Propylene glycol Chemical compound CC(O)CO DNIAPMSPPWPWGF-UHFFFAOYSA-N 0.000 description 6
- VUVCRYXYUUPGSB-GLLZPBPUSA-N Thr-Gln-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O VUVCRYXYUUPGSB-GLLZPBPUSA-N 0.000 description 6
- WVVOFCVMHAXGLE-LFSVMHDDSA-N Thr-Phe-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O WVVOFCVMHAXGLE-LFSVMHDDSA-N 0.000 description 6
- QYSBJAUCUKHSLU-JYJNAYRXSA-N Tyr-Arg-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O QYSBJAUCUKHSLU-JYJNAYRXSA-N 0.000 description 6
- DBOXBUDEAJVKRE-LSJOCFKGSA-N Val-Asn-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N DBOXBUDEAJVKRE-LSJOCFKGSA-N 0.000 description 6
- QHDXUYOYTPWCSK-RCOVLWMOSA-N Val-Asp-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)NCC(=O)O)N QHDXUYOYTPWCSK-RCOVLWMOSA-N 0.000 description 6
- GUIYPEKUEMQBIK-JSGCOSHPSA-N Val-Tyr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)NCC(O)=O GUIYPEKUEMQBIK-JSGCOSHPSA-N 0.000 description 6
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 6
- NTXGVHCCXVHYCL-RDQGWRCRSA-N all-trans-undecaprenyl diphosphate Chemical compound CC(C)=CCC\C(C)=C\CC\C(C)=C\CC\C(C)=C\CC\C(C)=C\CC\C(C)=C\CC\C(C)=C\CC\C(C)=C\CC\C(C)=C\CC\C(C)=C\CC\C(C)=C\COP(O)(=O)OP(O)(O)=O NTXGVHCCXVHYCL-RDQGWRCRSA-N 0.000 description 6
- 235000013399 edible fruits Nutrition 0.000 description 6
- 238000000855 fermentation Methods 0.000 description 6
- 230000004151 fermentation Effects 0.000 description 6
- 239000012467 final product Substances 0.000 description 6
- 108010050475 glycyl-leucyl-tyrosine Proteins 0.000 description 6
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 6
- 229920006008 lipopolysaccharide Polymers 0.000 description 6
- 238000001294 liquid chromatography-tandem mass spectrometry Methods 0.000 description 6
- 108010064235 lysylglycine Proteins 0.000 description 6
- 235000015136 pumpkin Nutrition 0.000 description 6
- 229930188195 rebaudioside Natural products 0.000 description 6
- 150000003384 small molecules Chemical class 0.000 description 6
- 108010005652 splenotritin Proteins 0.000 description 6
- 241001464929 Acidithiobacillus caldus Species 0.000 description 5
- FQNILRVJOJBFFC-FXQIFTODSA-N Ala-Pro-Asp Chemical compound C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N FQNILRVJOJBFFC-FXQIFTODSA-N 0.000 description 5
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 5
- IYKVSFNGSWTTNZ-GUBZILKMSA-N Ala-Val-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IYKVSFNGSWTTNZ-GUBZILKMSA-N 0.000 description 5
- QAODJPUKWNNNRP-DCAQKATOSA-N Arg-Glu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QAODJPUKWNNNRP-DCAQKATOSA-N 0.000 description 5
- YVTHEZNOKSAWRW-DCAQKATOSA-N Arg-Lys-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O YVTHEZNOKSAWRW-DCAQKATOSA-N 0.000 description 5
- CVXXSWQORBZAAA-SRVKXCTJSA-N Arg-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N CVXXSWQORBZAAA-SRVKXCTJSA-N 0.000 description 5
- XKDYWGLNSCNRGW-WDSOQIARSA-N Arg-Lys-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCN=C(N)N)CCCCN)C(O)=O)=CNC2=C1 XKDYWGLNSCNRGW-WDSOQIARSA-N 0.000 description 5
- UVTGNSWSRSCPLP-UHFFFAOYSA-N Arg-Tyr Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O UVTGNSWSRSCPLP-UHFFFAOYSA-N 0.000 description 5
- LXTGAOAXPSJWOU-DCAQKATOSA-N Asn-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)N)N LXTGAOAXPSJWOU-DCAQKATOSA-N 0.000 description 5
- WONGRTVAMHFGBE-WDSKDSINSA-N Asn-Gly-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N WONGRTVAMHFGBE-WDSKDSINSA-N 0.000 description 5
- SUEIIIFUBHDCCS-PBCZWWQYSA-N Asn-His-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SUEIIIFUBHDCCS-PBCZWWQYSA-N 0.000 description 5
- CBHVAFXKOYAHOY-NHCYSSNCSA-N Asn-Val-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O CBHVAFXKOYAHOY-NHCYSSNCSA-N 0.000 description 5
- ZSJFGGSPCCHMNE-LAEOZQHASA-N Asp-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N ZSJFGGSPCCHMNE-LAEOZQHASA-N 0.000 description 5
- PCJOFZYFFMBZKC-PCBIJLKTSA-N Asp-Phe-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PCJOFZYFFMBZKC-PCBIJLKTSA-N 0.000 description 5
- UAXIKORUDGGIGA-DCAQKATOSA-N Asp-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)O)N)C(=O)N[C@@H](CCCCN)C(=O)O UAXIKORUDGGIGA-DCAQKATOSA-N 0.000 description 5
- JJQGZGOEDSSHTE-FOHZUACHSA-N Asp-Thr-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O JJQGZGOEDSSHTE-FOHZUACHSA-N 0.000 description 5
- VCIIDXDOPGHMDQ-WDSKDSINSA-N Cys-Gly-Gln Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O VCIIDXDOPGHMDQ-WDSKDSINSA-N 0.000 description 5
- LBOLGUYQEPZSKM-YUMQZZPRSA-N Cys-Gly-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CS)N LBOLGUYQEPZSKM-YUMQZZPRSA-N 0.000 description 5
- FGYPOQPQTUNESW-IUCAKERBSA-N Gln-Gly-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)N)N FGYPOQPQTUNESW-IUCAKERBSA-N 0.000 description 5
- WIMVKDYAKRAUCG-IHRRRGAJSA-N Gln-Tyr-Glu Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O WIMVKDYAKRAUCG-IHRRRGAJSA-N 0.000 description 5
- CGYDXNKRIMJMLV-GUBZILKMSA-N Glu-Arg-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O CGYDXNKRIMJMLV-GUBZILKMSA-N 0.000 description 5
- QLPYYTDOUQNJGQ-AVGNSLFASA-N Glu-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N QLPYYTDOUQNJGQ-AVGNSLFASA-N 0.000 description 5
- QDMVXRNLOPTPIE-WDCWCFNPSA-N Glu-Lys-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QDMVXRNLOPTPIE-WDCWCFNPSA-N 0.000 description 5
- MZZSCEANQDPJER-ONGXEEELSA-N Gly-Ala-Phe Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MZZSCEANQDPJER-ONGXEEELSA-N 0.000 description 5
- GGEJHJIXRBTJPD-BYPYZUCNSA-N Gly-Asn-Gly Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GGEJHJIXRBTJPD-BYPYZUCNSA-N 0.000 description 5
- IWAXHBCACVWNHT-BQBZGAKWSA-N Gly-Asp-Arg Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IWAXHBCACVWNHT-BQBZGAKWSA-N 0.000 description 5
- QPDUVFSVVAOUHE-XVKPBYJWSA-N Gly-Gln-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)CN)C(O)=O QPDUVFSVVAOUHE-XVKPBYJWSA-N 0.000 description 5
- LYZYGGWCBLBDMC-QWHCGFSZSA-N Gly-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)CN)C(=O)O LYZYGGWCBLBDMC-QWHCGFSZSA-N 0.000 description 5
- 235000010469 Glycine max Nutrition 0.000 description 5
- 244000068988 Glycine max Species 0.000 description 5
- JWTKVPMQCCRPQY-SRVKXCTJSA-N His-Asn-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JWTKVPMQCCRPQY-SRVKXCTJSA-N 0.000 description 5
- BDHUXUFYNUOUIT-SRVKXCTJSA-N His-Asp-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BDHUXUFYNUOUIT-SRVKXCTJSA-N 0.000 description 5
- FZKFYOXDVWDELO-KBPBESRZSA-N His-Gly-Tyr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O FZKFYOXDVWDELO-KBPBESRZSA-N 0.000 description 5
- HYWZHNUGAYVEEW-KKUMJFAQSA-N His-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N HYWZHNUGAYVEEW-KKUMJFAQSA-N 0.000 description 5
- DGLAHESNTJWGDO-SRVKXCTJSA-N His-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N DGLAHESNTJWGDO-SRVKXCTJSA-N 0.000 description 5
- XGBVLRJLHUVCNK-DCAQKATOSA-N His-Val-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O XGBVLRJLHUVCNK-DCAQKATOSA-N 0.000 description 5
- WUEIUSDAECDLQO-NAKRPEOUSA-N Ile-Ala-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)O)N WUEIUSDAECDLQO-NAKRPEOUSA-N 0.000 description 5
- HLYBGMZJVDHJEO-CYDGBPFRSA-N Ile-Arg-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N HLYBGMZJVDHJEO-CYDGBPFRSA-N 0.000 description 5
- NYEYYMLUABXDMC-NHCYSSNCSA-N Ile-Gly-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)O)N NYEYYMLUABXDMC-NHCYSSNCSA-N 0.000 description 5
- PKGGWLOLRLOPGK-XUXIUFHCSA-N Ile-Leu-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PKGGWLOLRLOPGK-XUXIUFHCSA-N 0.000 description 5
- CZWANIQKACCEKW-CYDGBPFRSA-N Ile-Pro-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)O)N CZWANIQKACCEKW-CYDGBPFRSA-N 0.000 description 5
- JHNJNTMTZHEDLJ-NAKRPEOUSA-N Ile-Ser-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O JHNJNTMTZHEDLJ-NAKRPEOUSA-N 0.000 description 5
- WCNWGAUZWWSYDG-SVSWQMSJSA-N Ile-Thr-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)O)N WCNWGAUZWWSYDG-SVSWQMSJSA-N 0.000 description 5
- JCGMFFQQHJQASB-PYJNHQTQSA-N Ile-Val-His Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O JCGMFFQQHJQASB-PYJNHQTQSA-N 0.000 description 5
- TYYLDKGBCJGJGW-UHFFFAOYSA-N L-tryptophan-L-tyrosine Natural products C=1NC2=CC=CC=C2C=1CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 TYYLDKGBCJGJGW-UHFFFAOYSA-N 0.000 description 5
- WIDZHJTYKYBLSR-DCAQKATOSA-N Leu-Glu-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WIDZHJTYKYBLSR-DCAQKATOSA-N 0.000 description 5
- SEMUSFOBZGKBGW-YTFOTSKYSA-N Leu-Ile-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SEMUSFOBZGKBGW-YTFOTSKYSA-N 0.000 description 5
- JKSIBWITFMQTOA-XUXIUFHCSA-N Leu-Ile-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O JKSIBWITFMQTOA-XUXIUFHCSA-N 0.000 description 5
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 5
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 5
- VUBIPAHVHMZHCM-KKUMJFAQSA-N Leu-Tyr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 VUBIPAHVHMZHCM-KKUMJFAQSA-N 0.000 description 5
- KJIXWRWPOCKYLD-IHRRRGAJSA-N Lys-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N KJIXWRWPOCKYLD-IHRRRGAJSA-N 0.000 description 5
- SBQDRNOLGSYHQA-YUMQZZPRSA-N Lys-Ser-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SBQDRNOLGSYHQA-YUMQZZPRSA-N 0.000 description 5
- JOSAKOKSPXROGQ-BJDJZHNGSA-N Lys-Ser-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JOSAKOKSPXROGQ-BJDJZHNGSA-N 0.000 description 5
- IEIHKHYMBIYQTH-YESZJQIVSA-N Lys-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCCCN)N)C(=O)O IEIHKHYMBIYQTH-YESZJQIVSA-N 0.000 description 5
- SBSIKVMCCJUCBZ-GUBZILKMSA-N Met-Asn-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N SBSIKVMCCJUCBZ-GUBZILKMSA-N 0.000 description 5
- QZPXMHVKPHJNTR-DCAQKATOSA-N Met-Leu-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O QZPXMHVKPHJNTR-DCAQKATOSA-N 0.000 description 5
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 5
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 5
- 108010066427 N-valyltryptophan Proteins 0.000 description 5
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 5
- LWPMGKSZPKFKJD-DZKIICNBSA-N Phe-Glu-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O LWPMGKSZPKFKJD-DZKIICNBSA-N 0.000 description 5
- SMFGCTXUBWEPKM-KBPBESRZSA-N Phe-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 SMFGCTXUBWEPKM-KBPBESRZSA-N 0.000 description 5
- RYQWALWYQWBUKN-FHWLQOOXSA-N Phe-Phe-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O RYQWALWYQWBUKN-FHWLQOOXSA-N 0.000 description 5
- QTDBZORPVYTRJU-KKXDTOCCSA-N Phe-Tyr-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O QTDBZORPVYTRJU-KKXDTOCCSA-N 0.000 description 5
- IFMDQWDAJUMMJC-DCAQKATOSA-N Pro-Ala-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O IFMDQWDAJUMMJC-DCAQKATOSA-N 0.000 description 5
- GRIRJQGZZJVANI-CYDGBPFRSA-N Pro-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H]1CCCN1 GRIRJQGZZJVANI-CYDGBPFRSA-N 0.000 description 5
- XYSXOCIWCPFOCG-IHRRRGAJSA-N Pro-Leu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XYSXOCIWCPFOCG-IHRRRGAJSA-N 0.000 description 5
- NBUKGEFVZJMSIS-XIRDDKMYSA-N Ser-His-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC3=CN=CN3)NC(=O)[C@H](CO)N NBUKGEFVZJMSIS-XIRDDKMYSA-N 0.000 description 5
- FZXOPYUEQGDGMS-ACZMJKKPSA-N Ser-Ser-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O FZXOPYUEQGDGMS-ACZMJKKPSA-N 0.000 description 5
- 102220538564 TNF receptor-associated factor 2_S11D_mutation Human genes 0.000 description 5
- DWYAUVCQDTZIJI-VZFHVOOUSA-N Thr-Ala-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O DWYAUVCQDTZIJI-VZFHVOOUSA-N 0.000 description 5
- AKHDFZHUPGVFEJ-YEPSODPASA-N Thr-Val-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AKHDFZHUPGVFEJ-YEPSODPASA-N 0.000 description 5
- LGEPIBQBGZTBHL-SXNHZJKMSA-N Trp-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N LGEPIBQBGZTBHL-SXNHZJKMSA-N 0.000 description 5
- HVPPEXXUDXAPOM-MGHWNKPDSA-N Tyr-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 HVPPEXXUDXAPOM-MGHWNKPDSA-N 0.000 description 5
- QFXVAFIHVWXXBJ-AVGNSLFASA-N Tyr-Ser-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O QFXVAFIHVWXXBJ-AVGNSLFASA-N 0.000 description 5
- UUYCNAXCCDNULB-QXEWZRGKSA-N Val-Arg-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O UUYCNAXCCDNULB-QXEWZRGKSA-N 0.000 description 5
- CVUDMNSZAIZFAE-UHFFFAOYSA-N Val-Arg-Pro Natural products NC(N)=NCCCC(NC(=O)C(N)C(C)C)C(=O)N1CCCC1C(O)=O CVUDMNSZAIZFAE-UHFFFAOYSA-N 0.000 description 5
- LNYOXPDEIZJDEI-NHCYSSNCSA-N Val-Asn-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N LNYOXPDEIZJDEI-NHCYSSNCSA-N 0.000 description 5
- PTFPUAXGIKTVNN-ONGXEEELSA-N Val-His-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)NCC(=O)O)N PTFPUAXGIKTVNN-ONGXEEELSA-N 0.000 description 5
- NZGOVKLVQNOEKP-YDHLFZDLSA-N Val-Phe-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N NZGOVKLVQNOEKP-YDHLFZDLSA-N 0.000 description 5
- QIVPZSWBBHRNBA-JYJNAYRXSA-N Val-Pro-Phe Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O QIVPZSWBBHRNBA-JYJNAYRXSA-N 0.000 description 5
- GBIUHAYJGWVNLN-AEJSXWLSSA-N Val-Ser-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N GBIUHAYJGWVNLN-AEJSXWLSSA-N 0.000 description 5
- UQMPYVLTQCGRSK-IFFSRLJSSA-N Val-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N)O UQMPYVLTQCGRSK-IFFSRLJSSA-N 0.000 description 5
- AEFJNECXZCODJM-UWVGGRQHSA-N Val-Val-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C(=O)NCC([O-])=O AEFJNECXZCODJM-UWVGGRQHSA-N 0.000 description 5
- WBPFYNYTYASCQP-CYDGBPFRSA-N Val-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)N WBPFYNYTYASCQP-CYDGBPFRSA-N 0.000 description 5
- 108010044940 alanylglutamine Proteins 0.000 description 5
- 108010011559 alanylphenylalanine Proteins 0.000 description 5
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 5
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 5
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 5
- 230000008901 benefit Effects 0.000 description 5
- 235000013361 beverage Nutrition 0.000 description 5
- 230000008859 change Effects 0.000 description 5
- 238000009510 drug design Methods 0.000 description 5
- 239000000796 flavoring agent Substances 0.000 description 5
- 239000012535 impurity Substances 0.000 description 5
- 108010054155 lysyllysine Proteins 0.000 description 5
- 108010056582 methionylglutamic acid Proteins 0.000 description 5
- 239000002243 precursor Substances 0.000 description 5
- 108010079317 prolyl-tyrosine Proteins 0.000 description 5
- 108010029020 prolylglycine Proteins 0.000 description 5
- 238000000746 purification Methods 0.000 description 5
- 238000000926 separation method Methods 0.000 description 5
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 5
- 238000005406 washing Methods 0.000 description 5
- MKZCBYZBCINNJN-DLOVCJGASA-N Ala-Asp-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MKZCBYZBCINNJN-DLOVCJGASA-N 0.000 description 4
- NKJBKNVQHBZUIX-ACZMJKKPSA-N Ala-Gln-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKJBKNVQHBZUIX-ACZMJKKPSA-N 0.000 description 4
- ZKEHTYWGPMMGBC-XUXIUFHCSA-N Ala-Leu-Leu-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O ZKEHTYWGPMMGBC-XUXIUFHCSA-N 0.000 description 4
- AWNAEZICPNGAJK-FXQIFTODSA-N Ala-Met-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O AWNAEZICPNGAJK-FXQIFTODSA-N 0.000 description 4
- GFEDXKNBZMPEDM-KZVJFYERSA-N Ala-Met-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GFEDXKNBZMPEDM-KZVJFYERSA-N 0.000 description 4
- VRTOMXFZHGWHIJ-KZVJFYERSA-N Ala-Thr-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VRTOMXFZHGWHIJ-KZVJFYERSA-N 0.000 description 4
- IASNWHAGGYTEKX-IUCAKERBSA-N Arg-Arg-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(O)=O IASNWHAGGYTEKX-IUCAKERBSA-N 0.000 description 4
- RVDVDRUZWZIBJQ-CIUDSAMLSA-N Arg-Asn-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O RVDVDRUZWZIBJQ-CIUDSAMLSA-N 0.000 description 4
- KBBKCNHWCDJPGN-GUBZILKMSA-N Arg-Gln-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KBBKCNHWCDJPGN-GUBZILKMSA-N 0.000 description 4
- MZRBYBIQTIKERR-GUBZILKMSA-N Arg-Glu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MZRBYBIQTIKERR-GUBZILKMSA-N 0.000 description 4
- NKBQZKVMKJJDLX-SRVKXCTJSA-N Arg-Glu-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NKBQZKVMKJJDLX-SRVKXCTJSA-N 0.000 description 4
- NXDXECQFKHXHAM-HJGDQZAQSA-N Arg-Glu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NXDXECQFKHXHAM-HJGDQZAQSA-N 0.000 description 4
- FLYANDHDFRGGTM-PYJNHQTQSA-N Arg-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FLYANDHDFRGGTM-PYJNHQTQSA-N 0.000 description 4
- CLICCYPMVFGUOF-IHRRRGAJSA-N Arg-Lys-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O CLICCYPMVFGUOF-IHRRRGAJSA-N 0.000 description 4
- OVQJAKFLFTZDNC-GUBZILKMSA-N Arg-Pro-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O OVQJAKFLFTZDNC-GUBZILKMSA-N 0.000 description 4
- QJWLLRZTJFPCHA-STECZYCISA-N Arg-Tyr-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O QJWLLRZTJFPCHA-STECZYCISA-N 0.000 description 4
- SUMJNGAMIQSNGX-TUAOUCFPSA-N Arg-Val-Pro Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N1CCC[C@@H]1C(O)=O SUMJNGAMIQSNGX-TUAOUCFPSA-N 0.000 description 4
- BZMWJLLUAKSIMH-FXQIFTODSA-N Asn-Glu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BZMWJLLUAKSIMH-FXQIFTODSA-N 0.000 description 4
- SPCONPVIDFMDJI-QSFUFRPTSA-N Asn-Ile-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O SPCONPVIDFMDJI-QSFUFRPTSA-N 0.000 description 4
- XDGBFDYXZCMYEX-NUMRIWBASA-N Asp-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N)O XDGBFDYXZCMYEX-NUMRIWBASA-N 0.000 description 4
- CRNKLABLTICXDV-GUBZILKMSA-N Asp-His-Glu Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N CRNKLABLTICXDV-GUBZILKMSA-N 0.000 description 4
- XMKXONRMGJXCJV-LAEOZQHASA-N Asp-Val-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XMKXONRMGJXCJV-LAEOZQHASA-N 0.000 description 4
- AAOBFSKXAVIORT-GUBZILKMSA-N Gln-Asn-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O AAOBFSKXAVIORT-GUBZILKMSA-N 0.000 description 4
- NLKVNZUFDPWPNL-YUMQZZPRSA-N Glu-Arg-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O NLKVNZUFDPWPNL-YUMQZZPRSA-N 0.000 description 4
- KKCUFHUTMKQQCF-SRVKXCTJSA-N Glu-Arg-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O KKCUFHUTMKQQCF-SRVKXCTJSA-N 0.000 description 4
- GCYFUZJHAXJKKE-KKUMJFAQSA-N Glu-Arg-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O GCYFUZJHAXJKKE-KKUMJFAQSA-N 0.000 description 4
- AUTNXSQEVVHSJK-YVNDNENWSA-N Glu-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O AUTNXSQEVVHSJK-YVNDNENWSA-N 0.000 description 4
- QXDXIXFSFHUYAX-MNXVOIDGSA-N Glu-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O QXDXIXFSFHUYAX-MNXVOIDGSA-N 0.000 description 4
- IOUQWHIEQYQVFD-JYJNAYRXSA-N Glu-Leu-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IOUQWHIEQYQVFD-JYJNAYRXSA-N 0.000 description 4
- MRWYPDWDZSLWJM-ACZMJKKPSA-N Glu-Ser-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O MRWYPDWDZSLWJM-ACZMJKKPSA-N 0.000 description 4
- CQGBSALYGOXQPE-HTUGSXCWSA-N Glu-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O CQGBSALYGOXQPE-HTUGSXCWSA-N 0.000 description 4
- WKJKBELXHCTHIJ-WPRPVWTQSA-N Gly-Arg-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N WKJKBELXHCTHIJ-WPRPVWTQSA-N 0.000 description 4
- JVACNFOPSUPDTK-QWRGUYRKSA-N Gly-Asn-Phe Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JVACNFOPSUPDTK-QWRGUYRKSA-N 0.000 description 4
- LURCIJSJAKFCRO-QWRGUYRKSA-N Gly-Asn-Tyr Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LURCIJSJAKFCRO-QWRGUYRKSA-N 0.000 description 4
- DBUNZBWUWCIELX-JHEQGTHGSA-N Gly-Thr-Glu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DBUNZBWUWCIELX-JHEQGTHGSA-N 0.000 description 4
- PYFIQROSWQERAS-LBPRGKRZSA-N Gly-Trp-Gly Chemical compound C1=CC=C2C(C[C@H](NC(=O)CN)C(=O)NCC(O)=O)=CNC2=C1 PYFIQROSWQERAS-LBPRGKRZSA-N 0.000 description 4
- 108700023372 Glycosyltransferases Proteins 0.000 description 4
- PYNPBMCLAKTHJL-SRVKXCTJSA-N His-Pro-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O PYNPBMCLAKTHJL-SRVKXCTJSA-N 0.000 description 4
- OUUCIIJSBIBCHB-ZPFDUUQYSA-N Ile-Leu-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O OUUCIIJSBIBCHB-ZPFDUUQYSA-N 0.000 description 4
- VEPIBPGLTLPBDW-URLPEUOOSA-N Ile-Phe-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N VEPIBPGLTLPBDW-URLPEUOOSA-N 0.000 description 4
- ZRLUISBDKUWAIZ-CIUDSAMLSA-N Leu-Ala-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O ZRLUISBDKUWAIZ-CIUDSAMLSA-N 0.000 description 4
- CQGSYZCULZMEDE-UHFFFAOYSA-N Leu-Gln-Pro Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)N1CCCC1C(O)=O CQGSYZCULZMEDE-UHFFFAOYSA-N 0.000 description 4
- DZQMXBALGUHGJT-GUBZILKMSA-N Leu-Glu-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O DZQMXBALGUHGJT-GUBZILKMSA-N 0.000 description 4
- VZBIUJURDLFFOE-IHRRRGAJSA-N Leu-His-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VZBIUJURDLFFOE-IHRRRGAJSA-N 0.000 description 4
- QNTJIDXQHWUBKC-BZSNNMDCSA-N Leu-Lys-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QNTJIDXQHWUBKC-BZSNNMDCSA-N 0.000 description 4
- GZRABTMNWJXFMH-UVOCVTCTSA-N Leu-Thr-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZRABTMNWJXFMH-UVOCVTCTSA-N 0.000 description 4
- MWVUEPNEPWMFBD-SRVKXCTJSA-N Lys-Cys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CCCCN MWVUEPNEPWMFBD-SRVKXCTJSA-N 0.000 description 4
- PBIPLDMFHAICIP-DCAQKATOSA-N Lys-Glu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PBIPLDMFHAICIP-DCAQKATOSA-N 0.000 description 4
- NJNRBRKHOWSGMN-SRVKXCTJSA-N Lys-Leu-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O NJNRBRKHOWSGMN-SRVKXCTJSA-N 0.000 description 4
- QBHGXFQJFPWJIH-XUXIUFHCSA-N Lys-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN QBHGXFQJFPWJIH-XUXIUFHCSA-N 0.000 description 4
- TXTZMVNJIRZABH-ULQDDVLXSA-N Lys-Val-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 TXTZMVNJIRZABH-ULQDDVLXSA-N 0.000 description 4
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 4
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 4
- 240000007594 Oryza sativa Species 0.000 description 4
- 235000007164 Oryza sativa Nutrition 0.000 description 4
- VHWOBXIWBDWZHK-IHRRRGAJSA-N Phe-Arg-Asp Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 VHWOBXIWBDWZHK-IHRRRGAJSA-N 0.000 description 4
- ZKSLXIGKRJMALF-MGHWNKPDSA-N Phe-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CC=CC=C2)N ZKSLXIGKRJMALF-MGHWNKPDSA-N 0.000 description 4
- OLZVAVSJEUAOHI-UNQGMJICSA-N Phe-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N)O OLZVAVSJEUAOHI-UNQGMJICSA-N 0.000 description 4
- IDQFQFVEWMWRQQ-DLOVCJGASA-N Ser-Ala-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O IDQFQFVEWMWRQQ-DLOVCJGASA-N 0.000 description 4
- NLQUOHDCLSFABG-GUBZILKMSA-N Ser-Arg-Arg Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NLQUOHDCLSFABG-GUBZILKMSA-N 0.000 description 4
- QYSFWUIXDFJUDW-DCAQKATOSA-N Ser-Leu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QYSFWUIXDFJUDW-DCAQKATOSA-N 0.000 description 4
- UPLYXVPQLJVWMM-KKUMJFAQSA-N Ser-Phe-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UPLYXVPQLJVWMM-KKUMJFAQSA-N 0.000 description 4
- RHAPJNVNWDBFQI-BQBZGAKWSA-N Ser-Pro-Gly Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O RHAPJNVNWDBFQI-BQBZGAKWSA-N 0.000 description 4
- JNQZPAWOPBZGIX-RCWTZXSCSA-N Thr-Arg-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)O)CCCN=C(N)N JNQZPAWOPBZGIX-RCWTZXSCSA-N 0.000 description 4
- NKUGCYDFQKFVOJ-JYJNAYRXSA-N Tyr-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NKUGCYDFQKFVOJ-JYJNAYRXSA-N 0.000 description 4
- GQVZBMROTPEPIF-SRVKXCTJSA-N Tyr-Ser-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O GQVZBMROTPEPIF-SRVKXCTJSA-N 0.000 description 4
- PWKMJDQXKCENMF-MEYUZBJRSA-N Tyr-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O PWKMJDQXKCENMF-MEYUZBJRSA-N 0.000 description 4
- AZSHAZJLOZQYAY-FXQIFTODSA-N Val-Ala-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O AZSHAZJLOZQYAY-FXQIFTODSA-N 0.000 description 4
- DDNIHOWRDOXXPF-NGZCFLSTSA-N Val-Asp-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N DDNIHOWRDOXXPF-NGZCFLSTSA-N 0.000 description 4
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 4
- AEMPCGRFEZTWIF-IHRRRGAJSA-N Val-Leu-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O AEMPCGRFEZTWIF-IHRRRGAJSA-N 0.000 description 4
- YKZVPMUGEJXEOR-JYJNAYRXSA-N Val-Val-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N YKZVPMUGEJXEOR-JYJNAYRXSA-N 0.000 description 4
- 240000004922 Vigna radiata Species 0.000 description 4
- 108010077245 asparaginyl-proline Proteins 0.000 description 4
- 108010038633 aspartylglutamate Proteins 0.000 description 4
- 108010047857 aspartylglycine Proteins 0.000 description 4
- 230000002759 chromosomal effect Effects 0.000 description 4
- 235000009508 confectionery Nutrition 0.000 description 4
- 239000003623 enhancer Substances 0.000 description 4
- 238000001704 evaporation Methods 0.000 description 4
- 230000008020 evaporation Effects 0.000 description 4
- 108010084389 glycyltryptophan Proteins 0.000 description 4
- 108010037850 glycylvaline Proteins 0.000 description 4
- 108010028295 histidylhistidine Proteins 0.000 description 4
- 108010092114 histidylphenylalanine Proteins 0.000 description 4
- 108010047926 leucyl-lysyl-tyrosine Proteins 0.000 description 4
- 108010091871 leucylmethionine Proteins 0.000 description 4
- 108010044348 lysyl-glutamyl-aspartic acid Proteins 0.000 description 4
- 108010017391 lysylvaline Proteins 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 235000013615 non-nutritive sweetener Nutrition 0.000 description 4
- 230000000704 physical effect Effects 0.000 description 4
- 239000000843 powder Substances 0.000 description 4
- 108010004914 prolylarginine Proteins 0.000 description 4
- 101150006862 pyrH gene Proteins 0.000 description 4
- 238000004064 recycling Methods 0.000 description 4
- 230000008929 regeneration Effects 0.000 description 4
- 238000011069 regeneration method Methods 0.000 description 4
- 239000007790 solid phase Substances 0.000 description 4
- 230000007928 solubilization Effects 0.000 description 4
- 238000005063 solubilization Methods 0.000 description 4
- 241000894007 species Species 0.000 description 4
- 230000002269 spontaneous effect Effects 0.000 description 4
- 108010015666 tryptophyl-leucyl-glutamic acid Proteins 0.000 description 4
- DNIAPMSPPWPWGF-VKHMYHEASA-N (+)-propylene glycol Chemical compound C[C@H](O)CO DNIAPMSPPWPWGF-VKHMYHEASA-N 0.000 description 3
- YPFDHNVEDLHUCE-UHFFFAOYSA-N 1,3-propanediol Substances OCCCO YPFDHNVEDLHUCE-UHFFFAOYSA-N 0.000 description 3
- WQVFQXXBNHHPLX-ZKWXMUAHSA-N Ala-Ala-His Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O WQVFQXXBNHHPLX-ZKWXMUAHSA-N 0.000 description 3
- ZODMADSIQZZBSQ-FXQIFTODSA-N Ala-Gln-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZODMADSIQZZBSQ-FXQIFTODSA-N 0.000 description 3
- ROLXPVQSRCPVGK-XDTLVQLUSA-N Ala-Glu-Tyr Chemical compound N[C@@H](C)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O ROLXPVQSRCPVGK-XDTLVQLUSA-N 0.000 description 3
- NYDBKUNVSALYPX-NAKRPEOUSA-N Ala-Ile-Arg Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NYDBKUNVSALYPX-NAKRPEOUSA-N 0.000 description 3
- AJBVYEYZVYPFCF-CIUDSAMLSA-N Ala-Lys-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O AJBVYEYZVYPFCF-CIUDSAMLSA-N 0.000 description 3
- CHFFHQUVXHEGBY-GARJFASQSA-N Ala-Lys-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N CHFFHQUVXHEGBY-GARJFASQSA-N 0.000 description 3
- 241000219195 Arabidopsis thaliana Species 0.000 description 3
- UXJCMQFPDWCHKX-DCAQKATOSA-N Arg-Arg-Glu Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UXJCMQFPDWCHKX-DCAQKATOSA-N 0.000 description 3
- PNQWAUXQDBIJDY-GUBZILKMSA-N Arg-Glu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PNQWAUXQDBIJDY-GUBZILKMSA-N 0.000 description 3
- AQPVUEJJARLJHB-BQBZGAKWSA-N Arg-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N AQPVUEJJARLJHB-BQBZGAKWSA-N 0.000 description 3
- OQCWXQJLCDPRHV-UWVGGRQHSA-N Arg-Gly-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O OQCWXQJLCDPRHV-UWVGGRQHSA-N 0.000 description 3
- YQGZIRIYGHNSQO-ZPFDUUQYSA-N Arg-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YQGZIRIYGHNSQO-ZPFDUUQYSA-N 0.000 description 3
- LKDHUGLXOHYINY-XUXIUFHCSA-N Arg-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N LKDHUGLXOHYINY-XUXIUFHCSA-N 0.000 description 3
- LVMUGODRNHFGRA-AVGNSLFASA-N Arg-Leu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O LVMUGODRNHFGRA-AVGNSLFASA-N 0.000 description 3
- WMEVEPXNCMKNGH-IHRRRGAJSA-N Arg-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N WMEVEPXNCMKNGH-IHRRRGAJSA-N 0.000 description 3
- KZXPVYVSHUJCEO-ULQDDVLXSA-N Arg-Phe-Lys Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=CC=C1 KZXPVYVSHUJCEO-ULQDDVLXSA-N 0.000 description 3
- IZSMEUDYADKZTJ-KJEVXHAQSA-N Arg-Tyr-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IZSMEUDYADKZTJ-KJEVXHAQSA-N 0.000 description 3
- XYOVHPDDWCEUDY-CIUDSAMLSA-N Asn-Ala-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O XYOVHPDDWCEUDY-CIUDSAMLSA-N 0.000 description 3
- XHFXZQHTLJVZBN-FXQIFTODSA-N Asn-Arg-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N XHFXZQHTLJVZBN-FXQIFTODSA-N 0.000 description 3
- PNHQRQTVBRDIEF-CIUDSAMLSA-N Asn-Leu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(=O)N)N PNHQRQTVBRDIEF-CIUDSAMLSA-N 0.000 description 3
- TZFQICWZWFNIKU-KKUMJFAQSA-N Asn-Leu-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 TZFQICWZWFNIKU-KKUMJFAQSA-N 0.000 description 3
- KVMPVNGOKHTUHZ-GCJQMDKQSA-N Asp-Ala-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KVMPVNGOKHTUHZ-GCJQMDKQSA-N 0.000 description 3
- IXIWEFWRKIUMQX-DCAQKATOSA-N Asp-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(O)=O IXIWEFWRKIUMQX-DCAQKATOSA-N 0.000 description 3
- CUQDCPXNZPDYFQ-ZLUOBGJFSA-N Asp-Ser-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O CUQDCPXNZPDYFQ-ZLUOBGJFSA-N 0.000 description 3
- NBSCHQHZLSJFNQ-GASJEMHNSA-N D-Glucose 6-phosphate Chemical compound OC1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H](O)[C@H]1O NBSCHQHZLSJFNQ-GASJEMHNSA-N 0.000 description 3
- 108020004414 DNA Proteins 0.000 description 3
- VFRROHXSMXFLSN-UHFFFAOYSA-N Glc6P Natural products OP(=O)(O)OCC(O)C(O)C(O)C(O)C=O VFRROHXSMXFLSN-UHFFFAOYSA-N 0.000 description 3
- YJIUYQKQBBQYHZ-ACZMJKKPSA-N Gln-Ala-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YJIUYQKQBBQYHZ-ACZMJKKPSA-N 0.000 description 3
- RZSLYUUFFVHFRQ-FXQIFTODSA-N Gln-Ala-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O RZSLYUUFFVHFRQ-FXQIFTODSA-N 0.000 description 3
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 3
- FBEJIDRSQCGFJI-GUBZILKMSA-N Glu-Leu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FBEJIDRSQCGFJI-GUBZILKMSA-N 0.000 description 3
- SJJHXJDSNQJMMW-SRVKXCTJSA-N Glu-Lys-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O SJJHXJDSNQJMMW-SRVKXCTJSA-N 0.000 description 3
- OCJRHJZKGGSPRW-IUCAKERBSA-N Glu-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O OCJRHJZKGGSPRW-IUCAKERBSA-N 0.000 description 3
- JDUKCSSHWNIQQZ-IHRRRGAJSA-N Glu-Phe-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JDUKCSSHWNIQQZ-IHRRRGAJSA-N 0.000 description 3
- GUOWMVFLAJNPDY-CIUDSAMLSA-N Glu-Ser-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O GUOWMVFLAJNPDY-CIUDSAMLSA-N 0.000 description 3
- UMZHHILWZBFPGL-LOKLDPHHSA-N Glu-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O UMZHHILWZBFPGL-LOKLDPHHSA-N 0.000 description 3
- PMNHJLASAAWELO-FOHZUACHSA-N Gly-Asp-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PMNHJLASAAWELO-FOHZUACHSA-N 0.000 description 3
- JSNNHGHYGYMVCK-XVKPBYJWSA-N Gly-Glu-Val Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O JSNNHGHYGYMVCK-XVKPBYJWSA-N 0.000 description 3
- TWTPDFFBLQEBOE-IUCAKERBSA-N Gly-Leu-Gln Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O TWTPDFFBLQEBOE-IUCAKERBSA-N 0.000 description 3
- LLZXNUUIBOALNY-QWRGUYRKSA-N Gly-Leu-Lys Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN LLZXNUUIBOALNY-QWRGUYRKSA-N 0.000 description 3
- FXGRXIATVXUAHO-WEDXCCLWSA-N Gly-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN FXGRXIATVXUAHO-WEDXCCLWSA-N 0.000 description 3
- 241000202807 Glycyrrhiza Species 0.000 description 3
- 235000001453 Glycyrrhiza echinata Nutrition 0.000 description 3
- 235000006200 Glycyrrhiza glabra Nutrition 0.000 description 3
- 235000017382 Glycyrrhiza lepidota Nutrition 0.000 description 3
- FLUVGKKRRMLNPU-CQDKDKBSSA-N His-Ala-Phe Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O FLUVGKKRRMLNPU-CQDKDKBSSA-N 0.000 description 3
- HAPWZEVRQYGLSG-IUCAKERBSA-N His-Gly-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O HAPWZEVRQYGLSG-IUCAKERBSA-N 0.000 description 3
- YVCGJPIKRMGNPA-LSJOCFKGSA-N His-Met-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O YVCGJPIKRMGNPA-LSJOCFKGSA-N 0.000 description 3
- 240000005979 Hordeum vulgare Species 0.000 description 3
- 235000007340 Hordeum vulgare Nutrition 0.000 description 3
- PHIXPNQDGGILMP-YVNDNENWSA-N Ile-Glu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N PHIXPNQDGGILMP-YVNDNENWSA-N 0.000 description 3
- PNDMHTTXXPUQJH-RWRJDSDZSA-N Ile-Glu-Thr Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H]([C@H](O)C)C(=O)O PNDMHTTXXPUQJH-RWRJDSDZSA-N 0.000 description 3
- SLQVFYWBGNNOTK-BYULHYEWSA-N Ile-Gly-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N SLQVFYWBGNNOTK-BYULHYEWSA-N 0.000 description 3
- KFVUBLZRFSVDGO-BYULHYEWSA-N Ile-Gly-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O KFVUBLZRFSVDGO-BYULHYEWSA-N 0.000 description 3
- GAZGFPOZOLEYAJ-YTFOTSKYSA-N Ile-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N GAZGFPOZOLEYAJ-YTFOTSKYSA-N 0.000 description 3
- ADDYYRVQQZFIMW-MNXVOIDGSA-N Ile-Lys-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ADDYYRVQQZFIMW-MNXVOIDGSA-N 0.000 description 3
- GLYJPWIRLBAIJH-UHFFFAOYSA-N Ile-Lys-Pro Natural products CCC(C)C(N)C(=O)NC(CCCCN)C(=O)N1CCCC1C(O)=O GLYJPWIRLBAIJH-UHFFFAOYSA-N 0.000 description 3
- IBMVEYRWAWIOTN-UHFFFAOYSA-N L-Leucyl-L-Arginyl-L-Proline Natural products CC(C)CC(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O IBMVEYRWAWIOTN-UHFFFAOYSA-N 0.000 description 3
- 241000880493 Leptailurus serval Species 0.000 description 3
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 3
- IBMVEYRWAWIOTN-RWMBFGLXSA-N Leu-Arg-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(O)=O IBMVEYRWAWIOTN-RWMBFGLXSA-N 0.000 description 3
- UCOCBWDBHCUPQP-DCAQKATOSA-N Leu-Arg-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O UCOCBWDBHCUPQP-DCAQKATOSA-N 0.000 description 3
- GLBNEGIOFRVRHO-JYJNAYRXSA-N Leu-Gln-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GLBNEGIOFRVRHO-JYJNAYRXSA-N 0.000 description 3
- HQUXQAMSWFIRET-AVGNSLFASA-N Leu-Glu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HQUXQAMSWFIRET-AVGNSLFASA-N 0.000 description 3
- OGUUKPXUTHOIAV-SDDRHHMPSA-N Leu-Glu-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N OGUUKPXUTHOIAV-SDDRHHMPSA-N 0.000 description 3
- OMHLATXVNQSALM-FQUUOJAGSA-N Leu-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(C)C)N OMHLATXVNQSALM-FQUUOJAGSA-N 0.000 description 3
- PDQDCFBVYXEFSD-SRVKXCTJSA-N Leu-Leu-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PDQDCFBVYXEFSD-SRVKXCTJSA-N 0.000 description 3
- UBZGNBKMIJHOHL-BZSNNMDCSA-N Leu-Leu-Phe Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 UBZGNBKMIJHOHL-BZSNNMDCSA-N 0.000 description 3
- RTIRBWJPYJYTLO-MELADBBJSA-N Leu-Lys-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N RTIRBWJPYJYTLO-MELADBBJSA-N 0.000 description 3
- VCHVSKNMTXWIIP-SRVKXCTJSA-N Leu-Lys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O VCHVSKNMTXWIIP-SRVKXCTJSA-N 0.000 description 3
- ONPJGOIVICHWBW-BZSNNMDCSA-N Leu-Lys-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 ONPJGOIVICHWBW-BZSNNMDCSA-N 0.000 description 3
- JIHDFWWRYHSAQB-GUBZILKMSA-N Leu-Ser-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JIHDFWWRYHSAQB-GUBZILKMSA-N 0.000 description 3
- AIQWYVFNBNNOLU-RHYQMDGZSA-N Leu-Thr-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O AIQWYVFNBNNOLU-RHYQMDGZSA-N 0.000 description 3
- PNPYKQFJGRFYJE-GUBZILKMSA-N Lys-Ala-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O PNPYKQFJGRFYJE-GUBZILKMSA-N 0.000 description 3
- QUCDKEKDPYISNX-HJGDQZAQSA-N Lys-Asn-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QUCDKEKDPYISNX-HJGDQZAQSA-N 0.000 description 3
- ITWQLSZTLBKWJM-YUMQZZPRSA-N Lys-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCCN ITWQLSZTLBKWJM-YUMQZZPRSA-N 0.000 description 3
- MUXNCRWTWBMNHX-SRVKXCTJSA-N Lys-Leu-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O MUXNCRWTWBMNHX-SRVKXCTJSA-N 0.000 description 3
- SKRGVGLIRUGANF-AVGNSLFASA-N Lys-Leu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SKRGVGLIRUGANF-AVGNSLFASA-N 0.000 description 3
- OIQSIMFSVLLWBX-VOAKCMCISA-N Lys-Leu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OIQSIMFSVLLWBX-VOAKCMCISA-N 0.000 description 3
- SKUOQDYMJFUMOE-ULQDDVLXSA-N Lys-Met-Phe Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCCCN)N SKUOQDYMJFUMOE-ULQDDVLXSA-N 0.000 description 3
- TWPCWKVOZDUYAA-KKUMJFAQSA-N Lys-Phe-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O TWPCWKVOZDUYAA-KKUMJFAQSA-N 0.000 description 3
- ONGCSGVHCSAATF-CIUDSAMLSA-N Met-Ala-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O ONGCSGVHCSAATF-CIUDSAMLSA-N 0.000 description 3
- HUKLXYYPZWPXCC-KZVJFYERSA-N Met-Ala-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HUKLXYYPZWPXCC-KZVJFYERSA-N 0.000 description 3
- SODXFJOPSCXOHE-IHRRRGAJSA-N Met-Leu-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O SODXFJOPSCXOHE-IHRRRGAJSA-N 0.000 description 3
- KMSMNUFBNCHMII-IHRRRGAJSA-N Met-Leu-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN KMSMNUFBNCHMII-IHRRRGAJSA-N 0.000 description 3
- LNXGEYIEEUZGGH-JYJNAYRXSA-N Met-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CCSC)CC1=CC=CC=C1 LNXGEYIEEUZGGH-JYJNAYRXSA-N 0.000 description 3
- AUEJLPRZGVVDNU-UHFFFAOYSA-N N-L-tyrosyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 AUEJLPRZGVVDNU-UHFFFAOYSA-N 0.000 description 3
- GXDPQJUBLBZKDY-IAVJCBSLSA-N Phe-Ile-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GXDPQJUBLBZKDY-IAVJCBSLSA-N 0.000 description 3
- XNMYNGDKJNOKHH-BZSNNMDCSA-N Phe-Ser-Tyr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XNMYNGDKJNOKHH-BZSNNMDCSA-N 0.000 description 3
- 229920012266 Poly(ether sulfone) PES Polymers 0.000 description 3
- CQZNGNCAIXMAIQ-UBHSHLNASA-N Pro-Ala-Phe Chemical compound C[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O CQZNGNCAIXMAIQ-UBHSHLNASA-N 0.000 description 3
- VCYJKOLZYPYGJV-AVGNSLFASA-N Pro-Arg-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O VCYJKOLZYPYGJV-AVGNSLFASA-N 0.000 description 3
- FRKBNXCFJBPJOL-GUBZILKMSA-N Pro-Glu-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FRKBNXCFJBPJOL-GUBZILKMSA-N 0.000 description 3
- VZKBJNBZMZHKRC-XUXIUFHCSA-N Pro-Ile-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O VZKBJNBZMZHKRC-XUXIUFHCSA-N 0.000 description 3
- ULWBBFKQBDNGOY-RWMBFGLXSA-N Pro-Lys-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N2CCC[C@@H]2C(=O)O ULWBBFKQBDNGOY-RWMBFGLXSA-N 0.000 description 3
- OABLKWMLPUGEQK-JYJNAYRXSA-N Pro-Tyr-Met Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCSC)C(O)=O OABLKWMLPUGEQK-JYJNAYRXSA-N 0.000 description 3
- BNFVPSRLHHPQKS-WHFBIAKZSA-N Ser-Asp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O BNFVPSRLHHPQKS-WHFBIAKZSA-N 0.000 description 3
- MPPHJZYXDVDGOF-BWBBJGPYSA-N Ser-Cys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CO MPPHJZYXDVDGOF-BWBBJGPYSA-N 0.000 description 3
- QGAHMVHBORDHDC-YUMQZZPRSA-N Ser-His-Gly Chemical compound OC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CN=CN1 QGAHMVHBORDHDC-YUMQZZPRSA-N 0.000 description 3
- UGGWCAFQPKANMW-FXQIFTODSA-N Ser-Met-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O UGGWCAFQPKANMW-FXQIFTODSA-N 0.000 description 3
- WLJPJRGQRNCIQS-ZLUOBGJFSA-N Ser-Ser-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O WLJPJRGQRNCIQS-ZLUOBGJFSA-N 0.000 description 3
- 244000299461 Theobroma cacao Species 0.000 description 3
- HJOSVGCWOTYJFG-WDCWCFNPSA-N Thr-Glu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O HJOSVGCWOTYJFG-WDCWCFNPSA-N 0.000 description 3
- VRUFCJZQDACGLH-UVOCVTCTSA-N Thr-Leu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VRUFCJZQDACGLH-UVOCVTCTSA-N 0.000 description 3
- SAKLWFSRZTZQAJ-GQGQLFGLSA-N Trp-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N SAKLWFSRZTZQAJ-GQGQLFGLSA-N 0.000 description 3
- IELISNUVHBKYBX-XDTLVQLUSA-N Tyr-Ala-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 IELISNUVHBKYBX-XDTLVQLUSA-N 0.000 description 3
- NZFCWALTLNFHHC-JYJNAYRXSA-N Tyr-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NZFCWALTLNFHHC-JYJNAYRXSA-N 0.000 description 3
- QSFJHIRIHOJRKS-ULQDDVLXSA-N Tyr-Leu-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QSFJHIRIHOJRKS-ULQDDVLXSA-N 0.000 description 3
- VTCKHZJKWQENKX-KBPBESRZSA-N Tyr-Lys-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O VTCKHZJKWQENKX-KBPBESRZSA-N 0.000 description 3
- FMXFHNSFABRVFZ-BZSNNMDCSA-N Tyr-Lys-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O FMXFHNSFABRVFZ-BZSNNMDCSA-N 0.000 description 3
- XJPXTYLVMUZGNW-IHRRRGAJSA-N Tyr-Pro-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O XJPXTYLVMUZGNW-IHRRRGAJSA-N 0.000 description 3
- LVILBTSHPTWDGE-PMVMPFDFSA-N Tyr-Trp-Lys Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCCN)C(O)=O)C1=CC=C(O)C=C1 LVILBTSHPTWDGE-PMVMPFDFSA-N 0.000 description 3
- FOADDSDHGRFUOC-DZKIICNBSA-N Val-Glu-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N FOADDSDHGRFUOC-DZKIICNBSA-N 0.000 description 3
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 3
- 108010041407 alanylaspartic acid Proteins 0.000 description 3
- 239000012736 aqueous medium Substances 0.000 description 3
- 108010052670 arginyl-glutamyl-glutamic acid Proteins 0.000 description 3
- 108010060035 arginylproline Proteins 0.000 description 3
- 230000000295 complement effect Effects 0.000 description 3
- 230000006378 damage Effects 0.000 description 3
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 239000012530 fluid Substances 0.000 description 3
- 108010006664 gamma-glutamyl-glycyl-glycine Proteins 0.000 description 3
- 238000003209 gene knockout Methods 0.000 description 3
- 108010079547 glutamylmethionine Proteins 0.000 description 3
- 108010020688 glycylhistidine Proteins 0.000 description 3
- 239000008123 high-intensity sweetener Substances 0.000 description 3
- 108010045383 histidyl-glycyl-glutamic acid Proteins 0.000 description 3
- 239000004615 ingredient Substances 0.000 description 3
- 239000000543 intermediate Substances 0.000 description 3
- 108010034529 leucyl-lysine Proteins 0.000 description 3
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 3
- 229940010454 licorice Drugs 0.000 description 3
- 150000002632 lipids Chemical class 0.000 description 3
- 239000012452 mother liquor Substances 0.000 description 3
- 229920000166 polytrimethylene carbonate Polymers 0.000 description 3
- 108010070643 prolylglutamic acid Proteins 0.000 description 3
- 235000009566 rice Nutrition 0.000 description 3
- 108010026333 seryl-proline Proteins 0.000 description 3
- 238000003756 stirring Methods 0.000 description 3
- 230000032258 transport Effects 0.000 description 3
- 108010078580 tyrosylleucine Proteins 0.000 description 3
- IBIDRSSEHFLGSD-UHFFFAOYSA-N valinyl-arginine Natural products CC(C)C(N)C(=O)NC(C(O)=O)CCCN=C(N)N IBIDRSSEHFLGSD-UHFFFAOYSA-N 0.000 description 3
- 108010015385 valyl-prolyl-proline Proteins 0.000 description 3
- IMIZPWSVYADSCN-UHFFFAOYSA-N 4-methyl-2-[[4-methyl-2-[[4-methyl-2-(pyrrolidine-2-carbonylamino)pentanoyl]amino]pentanoyl]amino]pentanoic acid Chemical compound CC(C)CC(C(O)=O)NC(=O)C(CC(C)C)NC(=O)C(CC(C)C)NC(=O)C1CCCN1 IMIZPWSVYADSCN-UHFFFAOYSA-N 0.000 description 2
- WFPZSXYXPSUOPY-ROYWQJLOSA-N ADP alpha-D-glucoside Chemical compound C([C@H]1O[C@H]([C@@H]([C@@H]1O)O)N1C=2N=CN=C(C=2N=C1)N)OP(O)(=O)OP(O)(=O)O[C@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O WFPZSXYXPSUOPY-ROYWQJLOSA-N 0.000 description 2
- WFPZSXYXPSUOPY-UHFFFAOYSA-N ADP-mannose Natural products C1=NC=2C(N)=NC=NC=2N1C(C(C1O)O)OC1COP(O)(=O)OP(O)(=O)OC1OC(CO)C(O)C(O)C1O WFPZSXYXPSUOPY-UHFFFAOYSA-N 0.000 description 2
- 235000007754 Achillea millefolium Nutrition 0.000 description 2
- 240000000073 Achillea millefolium Species 0.000 description 2
- 241000251468 Actinopterygii Species 0.000 description 2
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 2
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 2
- JAMAWBXXKFGFGX-KZVJFYERSA-N Ala-Arg-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JAMAWBXXKFGFGX-KZVJFYERSA-N 0.000 description 2
- KIUYPHAMDKDICO-WHFBIAKZSA-N Ala-Asp-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KIUYPHAMDKDICO-WHFBIAKZSA-N 0.000 description 2
- YSMPVONNIWLJML-FXQIFTODSA-N Ala-Asp-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(O)=O YSMPVONNIWLJML-FXQIFTODSA-N 0.000 description 2
- BLGHHPHXVJWCNK-GUBZILKMSA-N Ala-Gln-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BLGHHPHXVJWCNK-GUBZILKMSA-N 0.000 description 2
- JPGBXANAQYHTLA-DRZSPHRISA-N Ala-Gln-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JPGBXANAQYHTLA-DRZSPHRISA-N 0.000 description 2
- NJPMYXWVWQWCSR-ACZMJKKPSA-N Ala-Glu-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NJPMYXWVWQWCSR-ACZMJKKPSA-N 0.000 description 2
- WKOBSJOZRJJVRZ-FXQIFTODSA-N Ala-Glu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WKOBSJOZRJJVRZ-FXQIFTODSA-N 0.000 description 2
- PAIHPOGPJVUFJY-WDSKDSINSA-N Ala-Glu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PAIHPOGPJVUFJY-WDSKDSINSA-N 0.000 description 2
- PUBLUECXJRHTBK-ACZMJKKPSA-N Ala-Glu-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O PUBLUECXJRHTBK-ACZMJKKPSA-N 0.000 description 2
- JDIQCVUDDFENPU-ZKWXMUAHSA-N Ala-His-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CNC=N1 JDIQCVUDDFENPU-ZKWXMUAHSA-N 0.000 description 2
- MFMDKJIPHSWSBM-GUBZILKMSA-N Ala-Lys-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFMDKJIPHSWSBM-GUBZILKMSA-N 0.000 description 2
- PMQXMXAASGFUDX-SRVKXCTJSA-N Ala-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CCCCN PMQXMXAASGFUDX-SRVKXCTJSA-N 0.000 description 2
- RAAWHFXHAACDFT-FXQIFTODSA-N Ala-Met-Asn Chemical compound CSCC[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CC(N)=O)C(O)=O RAAWHFXHAACDFT-FXQIFTODSA-N 0.000 description 2
- OEVCHROQUIVQFZ-YTLHQDLWSA-N Ala-Thr-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](C)C(O)=O OEVCHROQUIVQFZ-YTLHQDLWSA-N 0.000 description 2
- IOFVWPYSRSCWHI-JXUBOQSCSA-N Ala-Thr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C)N IOFVWPYSRSCWHI-JXUBOQSCSA-N 0.000 description 2
- HULHGJZIZXCPLD-FXQIFTODSA-N Arg-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N HULHGJZIZXCPLD-FXQIFTODSA-N 0.000 description 2
- HPSVTWMFWCHKFN-GARJFASQSA-N Arg-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O HPSVTWMFWCHKFN-GARJFASQSA-N 0.000 description 2
- NKNILFJYKKHBKE-WPRPVWTQSA-N Arg-Gly-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O NKNILFJYKKHBKE-WPRPVWTQSA-N 0.000 description 2
- NVCIXQYNWYTLDO-IHRRRGAJSA-N Arg-His-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCN=C(N)N)N NVCIXQYNWYTLDO-IHRRRGAJSA-N 0.000 description 2
- OFIYLHVAAJYRBC-HJWJTTGWSA-N Arg-Ile-Phe Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N[C@@H](Cc1ccccc1)C(O)=O OFIYLHVAAJYRBC-HJWJTTGWSA-N 0.000 description 2
- JEXPNDORFYHJTM-IHRRRGAJSA-N Arg-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCCN=C(N)N JEXPNDORFYHJTM-IHRRRGAJSA-N 0.000 description 2
- JEOCWTUOMKEEMF-RHYQMDGZSA-N Arg-Leu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JEOCWTUOMKEEMF-RHYQMDGZSA-N 0.000 description 2
- AFNHFVVOJZBIJD-GUBZILKMSA-N Arg-Met-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O AFNHFVVOJZBIJD-GUBZILKMSA-N 0.000 description 2
- UIUXXFIKWQVMEX-UFYCRDLUSA-N Arg-Phe-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O UIUXXFIKWQVMEX-UFYCRDLUSA-N 0.000 description 2
- SLQQPJBDBVPVQV-JYJNAYRXSA-N Arg-Phe-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O SLQQPJBDBVPVQV-JYJNAYRXSA-N 0.000 description 2
- WKPXXXUSUHAXDE-SRVKXCTJSA-N Arg-Pro-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O WKPXXXUSUHAXDE-SRVKXCTJSA-N 0.000 description 2
- NGYHSXDNNOFHNE-AVGNSLFASA-N Arg-Pro-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O NGYHSXDNNOFHNE-AVGNSLFASA-N 0.000 description 2
- VRTWYUYCJGNFES-CIUDSAMLSA-N Arg-Ser-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O VRTWYUYCJGNFES-CIUDSAMLSA-N 0.000 description 2
- PSUXEQYPYZLNER-QXEWZRGKSA-N Arg-Val-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O PSUXEQYPYZLNER-QXEWZRGKSA-N 0.000 description 2
- ULBHWNVWSCJLCO-NHCYSSNCSA-N Arg-Val-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N ULBHWNVWSCJLCO-NHCYSSNCSA-N 0.000 description 2
- FMYQECOAIFGQGU-CYDGBPFRSA-N Arg-Val-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FMYQECOAIFGQGU-CYDGBPFRSA-N 0.000 description 2
- YNDLOUMBVDVALC-ZLUOBGJFSA-N Asn-Ala-Ala Chemical compound C[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CC(=O)N)N YNDLOUMBVDVALC-ZLUOBGJFSA-N 0.000 description 2
- MFFOYNGMOYFPBD-DCAQKATOSA-N Asn-Arg-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O MFFOYNGMOYFPBD-DCAQKATOSA-N 0.000 description 2
- WVCJSDCHTUTONA-FXQIFTODSA-N Asn-Asp-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WVCJSDCHTUTONA-FXQIFTODSA-N 0.000 description 2
- ASCGFDYEKSRNPL-CIUDSAMLSA-N Asn-Glu-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O ASCGFDYEKSRNPL-CIUDSAMLSA-N 0.000 description 2
- DXVMJJNAOVECBA-WHFBIAKZSA-N Asn-Gly-Asn Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O DXVMJJNAOVECBA-WHFBIAKZSA-N 0.000 description 2
- PBSQFBAJKPLRJY-BYULHYEWSA-N Asn-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N PBSQFBAJKPLRJY-BYULHYEWSA-N 0.000 description 2
- OOWSBIOUKIUWLO-RCOVLWMOSA-N Asn-Gly-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O OOWSBIOUKIUWLO-RCOVLWMOSA-N 0.000 description 2
- NKLRWRRVYGQNIH-GHCJXIJMSA-N Asn-Ile-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O NKLRWRRVYGQNIH-GHCJXIJMSA-N 0.000 description 2
- BXUHCIXDSWRSBS-CIUDSAMLSA-N Asn-Leu-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BXUHCIXDSWRSBS-CIUDSAMLSA-N 0.000 description 2
- DJIMLSXHXKWADV-CIUDSAMLSA-N Asn-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(N)=O DJIMLSXHXKWADV-CIUDSAMLSA-N 0.000 description 2
- OOXUBGLNDRGOKT-FXQIFTODSA-N Asn-Ser-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OOXUBGLNDRGOKT-FXQIFTODSA-N 0.000 description 2
- WLVLIYYBPPONRJ-GCJQMDKQSA-N Asn-Thr-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O WLVLIYYBPPONRJ-GCJQMDKQSA-N 0.000 description 2
- PBVLJOIPOGUQQP-CIUDSAMLSA-N Asp-Ala-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O PBVLJOIPOGUQQP-CIUDSAMLSA-N 0.000 description 2
- QHAJMRDEWNAIBQ-FXQIFTODSA-N Asp-Arg-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O QHAJMRDEWNAIBQ-FXQIFTODSA-N 0.000 description 2
- SOYOSFXLXYZNRG-CIUDSAMLSA-N Asp-Arg-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O SOYOSFXLXYZNRG-CIUDSAMLSA-N 0.000 description 2
- FAEIQWHBRBWUBN-FXQIFTODSA-N Asp-Arg-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N)CN=C(N)N FAEIQWHBRBWUBN-FXQIFTODSA-N 0.000 description 2
- HOQGTAIGQSDCHR-SRVKXCTJSA-N Asp-Asn-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HOQGTAIGQSDCHR-SRVKXCTJSA-N 0.000 description 2
- RSMIHCFQDCVVBR-CIUDSAMLSA-N Asp-Gln-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N RSMIHCFQDCVVBR-CIUDSAMLSA-N 0.000 description 2
- DGKCOYGQLNWNCJ-ACZMJKKPSA-N Asp-Glu-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O DGKCOYGQLNWNCJ-ACZMJKKPSA-N 0.000 description 2
- JUWZKMBALYLZCK-WHFBIAKZSA-N Asp-Gly-Asn Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O JUWZKMBALYLZCK-WHFBIAKZSA-N 0.000 description 2
- HAFCJCDJGIOYPW-WDSKDSINSA-N Asp-Gly-Gln Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O HAFCJCDJGIOYPW-WDSKDSINSA-N 0.000 description 2
- YFSLJHLQOALGSY-ZPFDUUQYSA-N Asp-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N YFSLJHLQOALGSY-ZPFDUUQYSA-N 0.000 description 2
- RTXQQDVBACBSCW-CFMVVWHZSA-N Asp-Ile-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RTXQQDVBACBSCW-CFMVVWHZSA-N 0.000 description 2
- KYQNAIMCTRZLNP-QSFUFRPTSA-N Asp-Ile-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O KYQNAIMCTRZLNP-QSFUFRPTSA-N 0.000 description 2
- XLILXFRAKOYEJX-GUBZILKMSA-N Asp-Leu-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O XLILXFRAKOYEJX-GUBZILKMSA-N 0.000 description 2
- CTWCFPWFIGRAEP-CIUDSAMLSA-N Asp-Lys-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O CTWCFPWFIGRAEP-CIUDSAMLSA-N 0.000 description 2
- HJCGDIGVVWETRO-ZPFDUUQYSA-N Asp-Lys-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O)C(O)=O HJCGDIGVVWETRO-ZPFDUUQYSA-N 0.000 description 2
- WOPJVEMFXYHZEE-SRVKXCTJSA-N Asp-Phe-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O WOPJVEMFXYHZEE-SRVKXCTJSA-N 0.000 description 2
- GWIJZUVQVDJHDI-AVGNSLFASA-N Asp-Phe-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O GWIJZUVQVDJHDI-AVGNSLFASA-N 0.000 description 2
- ZKAOJVJQGVUIIU-GUBZILKMSA-N Asp-Pro-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ZKAOJVJQGVUIIU-GUBZILKMSA-N 0.000 description 2
- VNXQRBXEQXLERQ-CIUDSAMLSA-N Asp-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)O)N VNXQRBXEQXLERQ-CIUDSAMLSA-N 0.000 description 2
- XWKPSMRPIKKDDU-RCOVLWMOSA-N Asp-Val-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O XWKPSMRPIKKDDU-RCOVLWMOSA-N 0.000 description 2
- 241000208838 Asteraceae Species 0.000 description 2
- 240000007154 Coffea arabica Species 0.000 description 2
- 241000228025 Coffea eugenioides Species 0.000 description 2
- 241000272205 Columba livia Species 0.000 description 2
- 240000008067 Cucumis sativus Species 0.000 description 2
- SDWZYDDNSMPBRM-AVGNSLFASA-N Cys-Gln-Phe Chemical compound SC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SDWZYDDNSMPBRM-AVGNSLFASA-N 0.000 description 2
- RTZKZFJDLAIYFH-UHFFFAOYSA-N Diethyl ether Chemical compound CCOCC RTZKZFJDLAIYFH-UHFFFAOYSA-N 0.000 description 2
- 206010013911 Dysgeusia Diseases 0.000 description 2
- INKFLNZBTSNFON-CIUDSAMLSA-N Gln-Ala-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O INKFLNZBTSNFON-CIUDSAMLSA-N 0.000 description 2
- YNNXQZDEOCYJJL-CIUDSAMLSA-N Gln-Arg-Asp Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)CN=C(N)N YNNXQZDEOCYJJL-CIUDSAMLSA-N 0.000 description 2
- CKNUKHBRCSMKMO-XHNCKOQMSA-N Gln-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)N)N)C(=O)O CKNUKHBRCSMKMO-XHNCKOQMSA-N 0.000 description 2
- SXIJQMBEVYWAQT-GUBZILKMSA-N Gln-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N SXIJQMBEVYWAQT-GUBZILKMSA-N 0.000 description 2
- KZEUVLLVULIPNX-GUBZILKMSA-N Gln-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N KZEUVLLVULIPNX-GUBZILKMSA-N 0.000 description 2
- COYGBRTZEVWZBW-XKBZYTNZSA-N Gln-Cys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CCC(N)=O COYGBRTZEVWZBW-XKBZYTNZSA-N 0.000 description 2
- KDXKFBSNIJYNNR-YVNDNENWSA-N Gln-Glu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KDXKFBSNIJYNNR-YVNDNENWSA-N 0.000 description 2
- XWIBVSAEUCAAKF-GVXVVHGQSA-N Gln-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)N)N XWIBVSAEUCAAKF-GVXVVHGQSA-N 0.000 description 2
- QKWBEMCLYTYBNI-GVXVVHGQSA-N Gln-Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(N)=O QKWBEMCLYTYBNI-GVXVVHGQSA-N 0.000 description 2
- DRNMNLKUUKKPIA-HTUGSXCWSA-N Gln-Phe-Thr Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](Cc1ccccc1)NC(=O)[C@@H](N)CCC(N)=O)C(O)=O DRNMNLKUUKKPIA-HTUGSXCWSA-N 0.000 description 2
- HLRLXVPRJJITSK-IFFSRLJSSA-N Gln-Thr-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HLRLXVPRJJITSK-IFFSRLJSSA-N 0.000 description 2
- JKDBRTNMYXYLHO-JYJNAYRXSA-N Gln-Tyr-Leu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 JKDBRTNMYXYLHO-JYJNAYRXSA-N 0.000 description 2
- OACPJRQRAHMQEQ-NHCYSSNCSA-N Gln-Val-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O OACPJRQRAHMQEQ-NHCYSSNCSA-N 0.000 description 2
- RLZBLVSJDFHDBL-KBIXCLLPSA-N Glu-Ala-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RLZBLVSJDFHDBL-KBIXCLLPSA-N 0.000 description 2
- ITYRYNUZHPNCIK-GUBZILKMSA-N Glu-Ala-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O ITYRYNUZHPNCIK-GUBZILKMSA-N 0.000 description 2
- NCWOMXABNYEPLY-NRPADANISA-N Glu-Ala-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O NCWOMXABNYEPLY-NRPADANISA-N 0.000 description 2
- VPKBCVUDBNINAH-GARJFASQSA-N Glu-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O VPKBCVUDBNINAH-GARJFASQSA-N 0.000 description 2
- DYFJZDDQPNIPAB-NHCYSSNCSA-N Glu-Arg-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O DYFJZDDQPNIPAB-NHCYSSNCSA-N 0.000 description 2
- GZWOBWMOMPFPCD-CIUDSAMLSA-N Glu-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N GZWOBWMOMPFPCD-CIUDSAMLSA-N 0.000 description 2
- QJCKNLPMTPXXEM-AUTRQRHGSA-N Glu-Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O QJCKNLPMTPXXEM-AUTRQRHGSA-N 0.000 description 2
- QIQABBIDHGQXGA-ZPFDUUQYSA-N Glu-Ile-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QIQABBIDHGQXGA-ZPFDUUQYSA-N 0.000 description 2
- ZHNHJYYFCGUZNQ-KBIXCLLPSA-N Glu-Ile-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O ZHNHJYYFCGUZNQ-KBIXCLLPSA-N 0.000 description 2
- NJCALAAIGREHDR-WDCWCFNPSA-N Glu-Leu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NJCALAAIGREHDR-WDCWCFNPSA-N 0.000 description 2
- GJBUAAAIZSRCDC-GVXVVHGQSA-N Glu-Leu-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O GJBUAAAIZSRCDC-GVXVVHGQSA-N 0.000 description 2
- RBXSZQRSEGYDFG-GUBZILKMSA-N Glu-Lys-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O RBXSZQRSEGYDFG-GUBZILKMSA-N 0.000 description 2
- AOCARQDSFTWWFT-DCAQKATOSA-N Glu-Met-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O AOCARQDSFTWWFT-DCAQKATOSA-N 0.000 description 2
- DXVOKNVIKORTHQ-GUBZILKMSA-N Glu-Pro-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O DXVOKNVIKORTHQ-GUBZILKMSA-N 0.000 description 2
- ZAPFAWQHBOHWLL-GUBZILKMSA-N Glu-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N ZAPFAWQHBOHWLL-GUBZILKMSA-N 0.000 description 2
- SYAYROHMAIHWFB-KBIXCLLPSA-N Glu-Ser-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYAYROHMAIHWFB-KBIXCLLPSA-N 0.000 description 2
- IDEODOAVGCMUQV-GUBZILKMSA-N Glu-Ser-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IDEODOAVGCMUQV-GUBZILKMSA-N 0.000 description 2
- MXJYXYDREQWUMS-XKBZYTNZSA-N Glu-Thr-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O MXJYXYDREQWUMS-XKBZYTNZSA-N 0.000 description 2
- VHPVBPCCWVDGJL-IRIUXVKKSA-N Glu-Thr-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VHPVBPCCWVDGJL-IRIUXVKKSA-N 0.000 description 2
- UUTGYDAKPISJAO-JYJNAYRXSA-N Glu-Tyr-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 UUTGYDAKPISJAO-JYJNAYRXSA-N 0.000 description 2
- FGGKGJHCVMYGCD-UKJIMTQDSA-N Glu-Val-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FGGKGJHCVMYGCD-UKJIMTQDSA-N 0.000 description 2
- 108020004469 Glucose-1-phosphate thymidylyltransferase Proteins 0.000 description 2
- KKBWDNZXYLGJEY-UHFFFAOYSA-N Gly-Arg-Pro Natural products NCC(=O)NC(CCNC(=N)N)C(=O)N1CCCC1C(=O)O KKBWDNZXYLGJEY-UHFFFAOYSA-N 0.000 description 2
- GWCRIHNSVMOBEQ-BQBZGAKWSA-N Gly-Arg-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O GWCRIHNSVMOBEQ-BQBZGAKWSA-N 0.000 description 2
- XQHSBNVACKQWAV-WHFBIAKZSA-N Gly-Asp-Asn Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O XQHSBNVACKQWAV-WHFBIAKZSA-N 0.000 description 2
- QPTNELDXWKRIFX-YFKPBYRVSA-N Gly-Gly-Gln Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O QPTNELDXWKRIFX-YFKPBYRVSA-N 0.000 description 2
- ALOBJFDJTMQQPW-ONGXEEELSA-N Gly-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)CN ALOBJFDJTMQQPW-ONGXEEELSA-N 0.000 description 2
- UTYGDAHJBBDPBA-BYULHYEWSA-N Gly-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)CN UTYGDAHJBBDPBA-BYULHYEWSA-N 0.000 description 2
- UESJMAMHDLEHGM-NHCYSSNCSA-N Gly-Ile-Leu Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O UESJMAMHDLEHGM-NHCYSSNCSA-N 0.000 description 2
- PAWIVEIWWYGBAM-YUMQZZPRSA-N Gly-Leu-Ala Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O PAWIVEIWWYGBAM-YUMQZZPRSA-N 0.000 description 2
- CCBIBMKQNXHNIN-ZETCQYMHSA-N Gly-Leu-Gly Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CCBIBMKQNXHNIN-ZETCQYMHSA-N 0.000 description 2
- AFWYPMDMDYCKMD-KBPBESRZSA-N Gly-Leu-Tyr Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AFWYPMDMDYCKMD-KBPBESRZSA-N 0.000 description 2
- BXICSAQLIHFDDL-YUMQZZPRSA-N Gly-Lys-Asn Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O BXICSAQLIHFDDL-YUMQZZPRSA-N 0.000 description 2
- PDUHNKAFQXQNLH-ZETCQYMHSA-N Gly-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)NCC(O)=O PDUHNKAFQXQNLH-ZETCQYMHSA-N 0.000 description 2
- WDEHMRNSGHVNOH-VHSXEESVSA-N Gly-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)CN)C(=O)O WDEHMRNSGHVNOH-VHSXEESVSA-N 0.000 description 2
- NZOAFWHVAFJERA-OALUTQOASA-N Gly-Phe-Trp Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O NZOAFWHVAFJERA-OALUTQOASA-N 0.000 description 2
- ZZWUYQXMIFTIIY-WEDXCCLWSA-N Gly-Thr-Leu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O ZZWUYQXMIFTIIY-WEDXCCLWSA-N 0.000 description 2
- FFALDIDGPLUDKV-ZDLURKLDSA-N Gly-Thr-Ser Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O FFALDIDGPLUDKV-ZDLURKLDSA-N 0.000 description 2
- DNVDEMWIYLVIQU-RCOVLWMOSA-N Gly-Val-Asp Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O DNVDEMWIYLVIQU-RCOVLWMOSA-N 0.000 description 2
- SBVMXEZQJVUARN-XPUUQOCRSA-N Gly-Val-Ser Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O SBVMXEZQJVUARN-XPUUQOCRSA-N 0.000 description 2
- 102000051366 Glycosyltransferases Human genes 0.000 description 2
- RVKIPWVMZANZLI-UHFFFAOYSA-N H-Lys-Trp-OH Natural products C1=CC=C2C(CC(NC(=O)C(N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-UHFFFAOYSA-N 0.000 description 2
- 244000043261 Hevea brasiliensis Species 0.000 description 2
- FYVHHKMHFPMBBG-GUBZILKMSA-N His-Gln-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N FYVHHKMHFPMBBG-GUBZILKMSA-N 0.000 description 2
- VHHYJBSXXMPQGZ-AVGNSLFASA-N His-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CN=CN1)N VHHYJBSXXMPQGZ-AVGNSLFASA-N 0.000 description 2
- IIVZNQCUUMBBKF-GVXVVHGQSA-N His-Gln-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CN=CN1 IIVZNQCUUMBBKF-GVXVVHGQSA-N 0.000 description 2
- FIMNVXRZGUAGBI-AVGNSLFASA-N His-Glu-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O FIMNVXRZGUAGBI-AVGNSLFASA-N 0.000 description 2
- OEROYDLRVAYIMQ-YUMQZZPRSA-N His-Gly-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O OEROYDLRVAYIMQ-YUMQZZPRSA-N 0.000 description 2
- VTZYMXGGXOFBMX-DJFWLOJKSA-N His-Ile-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O VTZYMXGGXOFBMX-DJFWLOJKSA-N 0.000 description 2
- BRZQWIIFIKTJDH-VGDYDELISA-N His-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N BRZQWIIFIKTJDH-VGDYDELISA-N 0.000 description 2
- JENKOCSDMSVWPY-SRVKXCTJSA-N His-Leu-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O JENKOCSDMSVWPY-SRVKXCTJSA-N 0.000 description 2
- LJUIEESLIAZSFR-SRVKXCTJSA-N His-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N LJUIEESLIAZSFR-SRVKXCTJSA-N 0.000 description 2
- UROVZOUMHNXPLZ-AVGNSLFASA-N His-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 UROVZOUMHNXPLZ-AVGNSLFASA-N 0.000 description 2
- JUIOPCXACJLRJK-AVGNSLFASA-N His-Lys-Glu Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N JUIOPCXACJLRJK-AVGNSLFASA-N 0.000 description 2
- PZAJPILZRFPYJJ-SRVKXCTJSA-N His-Ser-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O PZAJPILZRFPYJJ-SRVKXCTJSA-N 0.000 description 2
- BRQKGRLDDDQWQJ-MBLNEYKQSA-N His-Thr-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O BRQKGRLDDDQWQJ-MBLNEYKQSA-N 0.000 description 2
- PFOUFRJYHWZJKW-NKIYYHGXSA-N His-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N)O PFOUFRJYHWZJKW-NKIYYHGXSA-N 0.000 description 2
- DQZCEKQPSOBNMJ-NKIYYHGXSA-N His-Thr-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DQZCEKQPSOBNMJ-NKIYYHGXSA-N 0.000 description 2
- FWWJVUFXUQOEDM-WDSOQIARSA-N His-Trp-Arg Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC3=CN=CN3)N FWWJVUFXUQOEDM-WDSOQIARSA-N 0.000 description 2
- YPWHUFAAMNHMGS-QSFUFRPTSA-N Ile-Ala-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N YPWHUFAAMNHMGS-QSFUFRPTSA-N 0.000 description 2
- SPQWWEZBHXHUJN-KBIXCLLPSA-N Ile-Glu-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O SPQWWEZBHXHUJN-KBIXCLLPSA-N 0.000 description 2
- IGJWJGIHUFQANP-LAEOZQHASA-N Ile-Gly-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N IGJWJGIHUFQANP-LAEOZQHASA-N 0.000 description 2
- UASTVUQJMLZWGG-PEXQALLHSA-N Ile-His-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)NCC(=O)O)N UASTVUQJMLZWGG-PEXQALLHSA-N 0.000 description 2
- YNMQUIVKEFRCPH-QSFUFRPTSA-N Ile-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)O)N YNMQUIVKEFRCPH-QSFUFRPTSA-N 0.000 description 2
- QZZIBQZLWBOOJH-PEDHHIEDSA-N Ile-Ile-Val Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(=O)O QZZIBQZLWBOOJH-PEDHHIEDSA-N 0.000 description 2
- HUORUFRRJHELPD-MNXVOIDGSA-N Ile-Leu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HUORUFRRJHELPD-MNXVOIDGSA-N 0.000 description 2
- PNTWNAXGBOZMBO-MNXVOIDGSA-N Ile-Lys-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N PNTWNAXGBOZMBO-MNXVOIDGSA-N 0.000 description 2
- CKRFDMPBSWYOBT-PPCPHDFISA-N Ile-Lys-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N CKRFDMPBSWYOBT-PPCPHDFISA-N 0.000 description 2
- IALVDKNUFSTICJ-GMOBBJLQSA-N Ile-Met-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)O)C(=O)O)N IALVDKNUFSTICJ-GMOBBJLQSA-N 0.000 description 2
- JZNVOBUNTWNZPW-GHCJXIJMSA-N Ile-Ser-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N JZNVOBUNTWNZPW-GHCJXIJMSA-N 0.000 description 2
- YBKKLDBBPFIXBQ-MBLNEYKQSA-N Ile-Thr-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)O)N YBKKLDBBPFIXBQ-MBLNEYKQSA-N 0.000 description 2
- DZMWFIRHFFVBHS-ZEWNOJEFSA-N Ile-Tyr-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N DZMWFIRHFFVBHS-ZEWNOJEFSA-N 0.000 description 2
- YWCJXQKATPNPOE-UKJIMTQDSA-N Ile-Val-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YWCJXQKATPNPOE-UKJIMTQDSA-N 0.000 description 2
- 240000007049 Juglans regia Species 0.000 description 2
- 235000009496 Juglans regia Nutrition 0.000 description 2
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 2
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 2
- CQQGCWPXDHTTNF-GUBZILKMSA-N Leu-Ala-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O CQQGCWPXDHTTNF-GUBZILKMSA-N 0.000 description 2
- FJUKMPUELVROGK-IHRRRGAJSA-N Leu-Arg-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N FJUKMPUELVROGK-IHRRRGAJSA-N 0.000 description 2
- XYUBOFCTGPZFSA-WDSOQIARSA-N Leu-Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 XYUBOFCTGPZFSA-WDSOQIARSA-N 0.000 description 2
- ULXYQAJWJGLCNR-YUMQZZPRSA-N Leu-Asp-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O ULXYQAJWJGLCNR-YUMQZZPRSA-N 0.000 description 2
- MYGQXVYRZMKRDB-SRVKXCTJSA-N Leu-Asp-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN MYGQXVYRZMKRDB-SRVKXCTJSA-N 0.000 description 2
- PVMPDMIKUVNOBD-CIUDSAMLSA-N Leu-Asp-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O PVMPDMIKUVNOBD-CIUDSAMLSA-N 0.000 description 2
- WCTCIIAGNMFYAO-DCAQKATOSA-N Leu-Cys-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O WCTCIIAGNMFYAO-DCAQKATOSA-N 0.000 description 2
- BOFAFKVZQUMTID-AVGNSLFASA-N Leu-Gln-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N BOFAFKVZQUMTID-AVGNSLFASA-N 0.000 description 2
- RVVBWTWPNFDYBE-SRVKXCTJSA-N Leu-Glu-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVVBWTWPNFDYBE-SRVKXCTJSA-N 0.000 description 2
- HPBCTWSUJOGJSH-MNXVOIDGSA-N Leu-Glu-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HPBCTWSUJOGJSH-MNXVOIDGSA-N 0.000 description 2
- QVFGXCVIXXBFHO-AVGNSLFASA-N Leu-Glu-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O QVFGXCVIXXBFHO-AVGNSLFASA-N 0.000 description 2
- ZFNLIDNJUWNIJL-WDCWCFNPSA-N Leu-Glu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZFNLIDNJUWNIJL-WDCWCFNPSA-N 0.000 description 2
- VGPCJSXPPOQPBK-YUMQZZPRSA-N Leu-Gly-Ser Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O VGPCJSXPPOQPBK-YUMQZZPRSA-N 0.000 description 2
- HYMLKESRWLZDBR-WEDXCCLWSA-N Leu-Gly-Thr Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HYMLKESRWLZDBR-WEDXCCLWSA-N 0.000 description 2
- POZULHZYLPGXMR-ONGXEEELSA-N Leu-Gly-Val Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O POZULHZYLPGXMR-ONGXEEELSA-N 0.000 description 2
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 2
- PTRKPHUGYULXPU-KKUMJFAQSA-N Leu-Phe-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O PTRKPHUGYULXPU-KKUMJFAQSA-N 0.000 description 2
- RGUXWMDNCPMQFB-YUMQZZPRSA-N Leu-Ser-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RGUXWMDNCPMQFB-YUMQZZPRSA-N 0.000 description 2
- ZJZNLRVCZWUONM-JXUBOQSCSA-N Leu-Thr-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O ZJZNLRVCZWUONM-JXUBOQSCSA-N 0.000 description 2
- ILDSIMPXNFWKLH-KATARQTJSA-N Leu-Thr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ILDSIMPXNFWKLH-KATARQTJSA-N 0.000 description 2
- VJGQRELPQWNURN-JYJNAYRXSA-N Leu-Tyr-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJGQRELPQWNURN-JYJNAYRXSA-N 0.000 description 2
- BGGTYDNTOYRTTR-MEYUZBJRSA-N Leu-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC(C)C)N)O BGGTYDNTOYRTTR-MEYUZBJRSA-N 0.000 description 2
- XZNJZXJZBMBGGS-NHCYSSNCSA-N Leu-Val-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XZNJZXJZBMBGGS-NHCYSSNCSA-N 0.000 description 2
- GFWLIJDQILOEPP-HSCHXYMDSA-N Lys-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCCCN)N GFWLIJDQILOEPP-HSCHXYMDSA-N 0.000 description 2
- XIZQPFCRXLUNMK-BZSNNMDCSA-N Lys-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCCCN)N XIZQPFCRXLUNMK-BZSNNMDCSA-N 0.000 description 2
- YKBSXQFZWFXFIB-VOAKCMCISA-N Lys-Thr-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCCN)C(O)=O YKBSXQFZWFXFIB-VOAKCMCISA-N 0.000 description 2
- WAAZECNCPVGPIV-RHYQMDGZSA-N Lys-Thr-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O WAAZECNCPVGPIV-RHYQMDGZSA-N 0.000 description 2
- PSVAVKGDUAKZKU-BZSNNMDCSA-N Lys-Tyr-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCCCN)N)O PSVAVKGDUAKZKU-BZSNNMDCSA-N 0.000 description 2
- NYTDJEZBAAFLLG-IHRRRGAJSA-N Lys-Val-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O NYTDJEZBAAFLLG-IHRRRGAJSA-N 0.000 description 2
- 240000003183 Manihot esculenta Species 0.000 description 2
- LMKSBGIUPVRHEH-FXQIFTODSA-N Met-Ala-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(N)=O LMKSBGIUPVRHEH-FXQIFTODSA-N 0.000 description 2
- QGQGAIBGTUJRBR-NAKRPEOUSA-N Met-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCSC QGQGAIBGTUJRBR-NAKRPEOUSA-N 0.000 description 2
- OSOLWRWQADPDIQ-DCAQKATOSA-N Met-Asp-Leu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OSOLWRWQADPDIQ-DCAQKATOSA-N 0.000 description 2
- KQBJYJXPZBNEIK-DCAQKATOSA-N Met-Glu-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KQBJYJXPZBNEIK-DCAQKATOSA-N 0.000 description 2
- RKIIYGUHIQJCBW-SRVKXCTJSA-N Met-His-Glu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O RKIIYGUHIQJCBW-SRVKXCTJSA-N 0.000 description 2
- ZEVPMOHYCQFWSE-NAKRPEOUSA-N Met-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCSC)N ZEVPMOHYCQFWSE-NAKRPEOUSA-N 0.000 description 2
- DBXMFHGGHMXYHY-DCAQKATOSA-N Met-Leu-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O DBXMFHGGHMXYHY-DCAQKATOSA-N 0.000 description 2
- 244000302512 Momordica charantia Species 0.000 description 2
- 235000009811 Momordica charantia Nutrition 0.000 description 2
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 2
- 108010055012 Orotidine-5'-phosphate decarboxylase Proteins 0.000 description 2
- 240000004371 Panax ginseng Species 0.000 description 2
- MDHZEOMXGNBSIL-DLOVCJGASA-N Phe-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N MDHZEOMXGNBSIL-DLOVCJGASA-N 0.000 description 2
- JNRFYJZCMHHGMH-UBHSHLNASA-N Phe-Ala-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 JNRFYJZCMHHGMH-UBHSHLNASA-N 0.000 description 2
- QMMRHASQEVCJGR-UBHSHLNASA-N Phe-Ala-Pro Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=CC=C1 QMMRHASQEVCJGR-UBHSHLNASA-N 0.000 description 2
- BRDYYVQTEJVRQT-HRCADAONSA-N Phe-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O BRDYYVQTEJVRQT-HRCADAONSA-N 0.000 description 2
- IWRZUGHCHFZYQZ-UFYCRDLUSA-N Phe-Arg-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 IWRZUGHCHFZYQZ-UFYCRDLUSA-N 0.000 description 2
- JIYJYFIXQTYDNF-YDHLFZDLSA-N Phe-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N JIYJYFIXQTYDNF-YDHLFZDLSA-N 0.000 description 2
- RJYBHZVWJPUSLB-QEWYBTABSA-N Phe-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N RJYBHZVWJPUSLB-QEWYBTABSA-N 0.000 description 2
- MGBRZXXGQBAULP-DRZSPHRISA-N Phe-Glu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 MGBRZXXGQBAULP-DRZSPHRISA-N 0.000 description 2
- NAXPHWZXEXNDIW-JTQLQIEISA-N Phe-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 NAXPHWZXEXNDIW-JTQLQIEISA-N 0.000 description 2
- APJPXSFJBMMOLW-KBPBESRZSA-N Phe-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 APJPXSFJBMMOLW-KBPBESRZSA-N 0.000 description 2
- KBVJZCVLQWCJQN-KKUMJFAQSA-N Phe-Leu-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O KBVJZCVLQWCJQN-KKUMJFAQSA-N 0.000 description 2
- YCCUXNNKXDGMAM-KKUMJFAQSA-N Phe-Leu-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YCCUXNNKXDGMAM-KKUMJFAQSA-N 0.000 description 2
- GZGPMBKUJDRICD-ULQDDVLXSA-N Phe-Pro-His Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O GZGPMBKUJDRICD-ULQDDVLXSA-N 0.000 description 2
- ODGNUUUDJONJSC-UFYCRDLUSA-N Phe-Pro-Tyr Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O ODGNUUUDJONJSC-UFYCRDLUSA-N 0.000 description 2
- XDMMOISUAHXXFD-SRVKXCTJSA-N Phe-Ser-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O XDMMOISUAHXXFD-SRVKXCTJSA-N 0.000 description 2
- IIEOLPMQYRBZCN-SRVKXCTJSA-N Phe-Ser-Cys Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O IIEOLPMQYRBZCN-SRVKXCTJSA-N 0.000 description 2
- GMWNQSGWWGKTSF-LFSVMHDDSA-N Phe-Thr-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O GMWNQSGWWGKTSF-LFSVMHDDSA-N 0.000 description 2
- KLYYKKGCPOGDPE-OEAJRASXSA-N Phe-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O KLYYKKGCPOGDPE-OEAJRASXSA-N 0.000 description 2
- 108091000080 Phosphotransferase Proteins 0.000 description 2
- 239000004372 Polyvinyl alcohol Substances 0.000 description 2
- OOLOTUZJUBOMAX-GUBZILKMSA-N Pro-Ala-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O OOLOTUZJUBOMAX-GUBZILKMSA-N 0.000 description 2
- SGCZFWSQERRKBD-BQBZGAKWSA-N Pro-Asp-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 SGCZFWSQERRKBD-BQBZGAKWSA-N 0.000 description 2
- YFNOUBWUIIJQHF-LPEHRKFASA-N Pro-Asp-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)O)C(=O)N2CCC[C@@H]2C(=O)O YFNOUBWUIIJQHF-LPEHRKFASA-N 0.000 description 2
- XJROSHJRQTXWAE-XGEHTFHBSA-N Pro-Cys-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XJROSHJRQTXWAE-XGEHTFHBSA-N 0.000 description 2
- WFHYFCWBLSKEMS-KKUMJFAQSA-N Pro-Glu-Phe Chemical compound N([C@@H](CCC(=O)O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C(=O)[C@@H]1CCCN1 WFHYFCWBLSKEMS-KKUMJFAQSA-N 0.000 description 2
- DMKWYMWNEKIPFC-IUCAKERBSA-N Pro-Gly-Arg Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O DMKWYMWNEKIPFC-IUCAKERBSA-N 0.000 description 2
- GSPPWVHVBBSPSY-FHWLQOOXSA-N Pro-His-Trp Chemical compound OC(=O)[C@H](Cc1c[nH]c2ccccc12)NC(=O)[C@H](Cc1cnc[nH]1)NC(=O)[C@@H]1CCCN1 GSPPWVHVBBSPSY-FHWLQOOXSA-N 0.000 description 2
- SMFQZMGHCODUPQ-ULQDDVLXSA-N Pro-Lys-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SMFQZMGHCODUPQ-ULQDDVLXSA-N 0.000 description 2
- WCNVGGZRTNHOOS-ULQDDVLXSA-N Pro-Lys-Tyr Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O WCNVGGZRTNHOOS-ULQDDVLXSA-N 0.000 description 2
- ZJXXCGZFYQQETF-CYDGBPFRSA-N Pro-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@@H]1CCCN1 ZJXXCGZFYQQETF-CYDGBPFRSA-N 0.000 description 2
- AUYKOPJPKUCYHE-SRVKXCTJSA-N Pro-Met-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@@H]1CCCN1 AUYKOPJPKUCYHE-SRVKXCTJSA-N 0.000 description 2
- VGVCNKSUVSZEIE-IHRRRGAJSA-N Pro-Phe-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O VGVCNKSUVSZEIE-IHRRRGAJSA-N 0.000 description 2
- SNGZLPOXVRTNMB-LPEHRKFASA-N Pro-Ser-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N2CCC[C@@H]2C(=O)O SNGZLPOXVRTNMB-LPEHRKFASA-N 0.000 description 2
- NBDHWLZEMKSVHH-UVBJJODRSA-N Pro-Trp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@@H]3CCCN3 NBDHWLZEMKSVHH-UVBJJODRSA-N 0.000 description 2
- YIPFBJGBRCJJJD-FHWLQOOXSA-N Pro-Trp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@@H]3CCCN3 YIPFBJGBRCJJJD-FHWLQOOXSA-N 0.000 description 2
- OFSZYRZOUMNCCU-BZSNNMDCSA-N Pro-Trp-Met Chemical compound N([C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCSC)C(O)=O)C(=O)[C@@H]1CCCN1 OFSZYRZOUMNCCU-BZSNNMDCSA-N 0.000 description 2
- YHUBAXGAAYULJY-ULQDDVLXSA-N Pro-Tyr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O YHUBAXGAAYULJY-ULQDDVLXSA-N 0.000 description 2
- VDHGTOHMHHQSKG-JYJNAYRXSA-N Pro-Val-Phe Chemical compound CC(C)[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O VDHGTOHMHHQSKG-JYJNAYRXSA-N 0.000 description 2
- 240000005809 Prunus persica Species 0.000 description 2
- QWZIOCFPXMAXET-CIUDSAMLSA-N Ser-Arg-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O QWZIOCFPXMAXET-CIUDSAMLSA-N 0.000 description 2
- KYKKKSWGEPFUMR-NAKRPEOUSA-N Ser-Arg-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KYKKKSWGEPFUMR-NAKRPEOUSA-N 0.000 description 2
- WDXYVIIVDIDOSX-DCAQKATOSA-N Ser-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N WDXYVIIVDIDOSX-DCAQKATOSA-N 0.000 description 2
- QGMLKFGTGXWAHF-IHRRRGAJSA-N Ser-Arg-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QGMLKFGTGXWAHF-IHRRRGAJSA-N 0.000 description 2
- BGOWRLSWJCVYAQ-CIUDSAMLSA-N Ser-Asp-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BGOWRLSWJCVYAQ-CIUDSAMLSA-N 0.000 description 2
- CRZRTKAVUUGKEQ-ACZMJKKPSA-N Ser-Gln-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CRZRTKAVUUGKEQ-ACZMJKKPSA-N 0.000 description 2
- RNMRYWZYFHHOEV-CIUDSAMLSA-N Ser-Gln-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RNMRYWZYFHHOEV-CIUDSAMLSA-N 0.000 description 2
- HVKMTOIAYDOJPL-NRPADANISA-N Ser-Gln-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O HVKMTOIAYDOJPL-NRPADANISA-N 0.000 description 2
- YRBGKVIWMNEVCZ-WDSKDSINSA-N Ser-Glu-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O YRBGKVIWMNEVCZ-WDSKDSINSA-N 0.000 description 2
- QKQDTEYDEIJPNK-GUBZILKMSA-N Ser-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CO QKQDTEYDEIJPNK-GUBZILKMSA-N 0.000 description 2
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 2
- CJINPXGSKSZQNE-KBIXCLLPSA-N Ser-Ile-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O CJINPXGSKSZQNE-KBIXCLLPSA-N 0.000 description 2
- QPPYAWVLAVXISR-DCAQKATOSA-N Ser-Pro-His Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CO)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O QPPYAWVLAVXISR-DCAQKATOSA-N 0.000 description 2
- BEBVVQPDSHHWQL-NRPADANISA-N Ser-Val-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BEBVVQPDSHHWQL-NRPADANISA-N 0.000 description 2
- LGIMRDKGABDMBN-DCAQKATOSA-N Ser-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N LGIMRDKGABDMBN-DCAQKATOSA-N 0.000 description 2
- 241000193985 Streptococcus agalactiae Species 0.000 description 2
- 241000193998 Streptococcus pneumoniae Species 0.000 description 2
- 102000003673 Symporters Human genes 0.000 description 2
- 108090000088 Symporters Proteins 0.000 description 2
- JHBHMCMKSPXRHV-NUMRIWBASA-N Thr-Asn-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O JHBHMCMKSPXRHV-NUMRIWBASA-N 0.000 description 2
- LMMDEZPNUTZJAY-GCJQMDKQSA-N Thr-Asp-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O LMMDEZPNUTZJAY-GCJQMDKQSA-N 0.000 description 2
- ODSAPYVQSLDRSR-LKXGYXEUSA-N Thr-Cys-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O ODSAPYVQSLDRSR-LKXGYXEUSA-N 0.000 description 2
- RJBFAHKSFNNHAI-XKBZYTNZSA-N Thr-Gln-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N)O RJBFAHKSFNNHAI-XKBZYTNZSA-N 0.000 description 2
- CQNFRKAKGDSJFR-NUMRIWBASA-N Thr-Glu-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O CQNFRKAKGDSJFR-NUMRIWBASA-N 0.000 description 2
- LGNBRHZANHMZHK-NUMRIWBASA-N Thr-Glu-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O LGNBRHZANHMZHK-NUMRIWBASA-N 0.000 description 2
- XOTBWOCSLMBGMF-SUSMZKCASA-N Thr-Glu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOTBWOCSLMBGMF-SUSMZKCASA-N 0.000 description 2
- XPNSAQMEAVSQRD-FBCQKBJTSA-N Thr-Gly-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)NCC(O)=O XPNSAQMEAVSQRD-FBCQKBJTSA-N 0.000 description 2
- IHAPJUHCZXBPHR-WZLNRYEVSA-N Thr-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N IHAPJUHCZXBPHR-WZLNRYEVSA-N 0.000 description 2
- IMDMLDSVUSMAEJ-HJGDQZAQSA-N Thr-Leu-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IMDMLDSVUSMAEJ-HJGDQZAQSA-N 0.000 description 2
- NCXVJIQMWSGRHY-KXNHARMFSA-N Thr-Leu-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O NCXVJIQMWSGRHY-KXNHARMFSA-N 0.000 description 2
- RVMNUBQWPVOUKH-HEIBUPTGSA-N Thr-Ser-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RVMNUBQWPVOUKH-HEIBUPTGSA-N 0.000 description 2
- ILUOMMDDGREELW-OSUNSFLBSA-N Thr-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O ILUOMMDDGREELW-OSUNSFLBSA-N 0.000 description 2
- PKUJMYZNJMRHEZ-XIRDDKMYSA-N Trp-Glu-Arg Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PKUJMYZNJMRHEZ-XIRDDKMYSA-N 0.000 description 2
- HXNVJPQADLRHGR-JBACZVJFSA-N Trp-Glu-Tyr Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)N HXNVJPQADLRHGR-JBACZVJFSA-N 0.000 description 2
- WNZRNOGHEONFMS-PXDAIIFMSA-N Trp-Ile-Tyr Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O WNZRNOGHEONFMS-PXDAIIFMSA-N 0.000 description 2
- VPRHDRKAPYZMHL-SZMVWBNQSA-N Trp-Leu-Glu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 VPRHDRKAPYZMHL-SZMVWBNQSA-N 0.000 description 2
- BGWSLEYVITZIQP-DCPHZVHLSA-N Trp-Phe-Ala Chemical compound C[C@H](NC(=O)[C@H](Cc1ccccc1)NC(=O)[C@@H](N)Cc1c[nH]c2ccccc12)C(O)=O BGWSLEYVITZIQP-DCPHZVHLSA-N 0.000 description 2
- RQKMZXSRILVOQZ-GMVOTWDCSA-N Trp-Tyr-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N RQKMZXSRILVOQZ-GMVOTWDCSA-N 0.000 description 2
- TVOGEPLDNYTAHD-CQDKDKBSSA-N Tyr-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 TVOGEPLDNYTAHD-CQDKDKBSSA-N 0.000 description 2
- IYHNBRUWVBIVJR-IHRRRGAJSA-N Tyr-Gln-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 IYHNBRUWVBIVJR-IHRRRGAJSA-N 0.000 description 2
- TWAVEIJGFCBWCG-JYJNAYRXSA-N Tyr-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N TWAVEIJGFCBWCG-JYJNAYRXSA-N 0.000 description 2
- HVHJYXDXRIWELT-RYUDHWBXSA-N Tyr-Glu-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O HVHJYXDXRIWELT-RYUDHWBXSA-N 0.000 description 2
- MVFQLSPDMMFCMW-KKUMJFAQSA-N Tyr-Leu-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O MVFQLSPDMMFCMW-KKUMJFAQSA-N 0.000 description 2
- KSCVLGXNQXKUAR-JYJNAYRXSA-N Tyr-Leu-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KSCVLGXNQXKUAR-JYJNAYRXSA-N 0.000 description 2
- OLYXUGBVBGSZDN-ACRUOGEOSA-N Tyr-Leu-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 OLYXUGBVBGSZDN-ACRUOGEOSA-N 0.000 description 2
- IEWKKXZRJLTIOV-AVGNSLFASA-N Tyr-Ser-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O IEWKKXZRJLTIOV-AVGNSLFASA-N 0.000 description 2
- MQGGXGKQSVEQHR-KKUMJFAQSA-N Tyr-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 MQGGXGKQSVEQHR-KKUMJFAQSA-N 0.000 description 2
- MJUTYRIMFIICKL-JYJNAYRXSA-N Tyr-Val-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MJUTYRIMFIICKL-JYJNAYRXSA-N 0.000 description 2
- YFOCMOVJBQDBCE-NRPADANISA-N Val-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N YFOCMOVJBQDBCE-NRPADANISA-N 0.000 description 2
- REJBPZVUHYNMEN-LSJOCFKGSA-N Val-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N REJBPZVUHYNMEN-LSJOCFKGSA-N 0.000 description 2
- CPTQYHDSVGVGDZ-UKJIMTQDSA-N Val-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N CPTQYHDSVGVGDZ-UKJIMTQDSA-N 0.000 description 2
- JXGWQYWDUOWQHA-DZKIICNBSA-N Val-Gln-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N JXGWQYWDUOWQHA-DZKIICNBSA-N 0.000 description 2
- XGJLNBNZNMVJRS-NRPADANISA-N Val-Glu-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O XGJLNBNZNMVJRS-NRPADANISA-N 0.000 description 2
- WDIGUPHXPBMODF-UMNHJUIQSA-N Val-Glu-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N WDIGUPHXPBMODF-UMNHJUIQSA-N 0.000 description 2
- CELJCNRXKZPTCX-XPUUQOCRSA-N Val-Gly-Ala Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O CELJCNRXKZPTCX-XPUUQOCRSA-N 0.000 description 2
- NXRAUQGGHPCJIB-RCOVLWMOSA-N Val-Gly-Asn Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O NXRAUQGGHPCJIB-RCOVLWMOSA-N 0.000 description 2
- BEGDZYNDCNEGJZ-XVKPBYJWSA-N Val-Gly-Gln Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O BEGDZYNDCNEGJZ-XVKPBYJWSA-N 0.000 description 2
- FTKXYXACXYOHND-XUXIUFHCSA-N Val-Ile-Leu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O FTKXYXACXYOHND-XUXIUFHCSA-N 0.000 description 2
- HGJRMXOWUWVUOA-GVXVVHGQSA-N Val-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N HGJRMXOWUWVUOA-GVXVVHGQSA-N 0.000 description 2
- LJSZPMSUYKKKCP-UBHSHLNASA-N Val-Phe-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 LJSZPMSUYKKKCP-UBHSHLNASA-N 0.000 description 2
- WMRWZYSRQUORHJ-YDHLFZDLSA-N Val-Phe-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N WMRWZYSRQUORHJ-YDHLFZDLSA-N 0.000 description 2
- WANVRBAZGSICCP-SRVKXCTJSA-N Val-Pro-Met Chemical compound CSCC[C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C)C(O)=O WANVRBAZGSICCP-SRVKXCTJSA-N 0.000 description 2
- DOFAQXCYFQKSHT-SRVKXCTJSA-N Val-Pro-Pro Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DOFAQXCYFQKSHT-SRVKXCTJSA-N 0.000 description 2
- AJNUKMZFHXUBMK-GUBZILKMSA-N Val-Ser-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N AJNUKMZFHXUBMK-GUBZILKMSA-N 0.000 description 2
- AYHNXCJKBLYVOA-KSZLIROESA-N Val-Trp-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N3CCC[C@@H]3C(=O)O)N AYHNXCJKBLYVOA-KSZLIROESA-N 0.000 description 2
- SSKKGOWRPNIVDW-AVGNSLFASA-N Val-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N SSKKGOWRPNIVDW-AVGNSLFASA-N 0.000 description 2
- 235000006582 Vigna radiata Nutrition 0.000 description 2
- 235000010721 Vigna radiata var radiata Nutrition 0.000 description 2
- 235000011469 Vigna radiata var sublobata Nutrition 0.000 description 2
- 235000014787 Vitis vinifera Nutrition 0.000 description 2
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 2
- 108010070783 alanyltyrosine Proteins 0.000 description 2
- 239000003963 antioxidant agent Substances 0.000 description 2
- 108010008355 arginyl-glutamine Proteins 0.000 description 2
- 210000004436 artificial bacterial chromosome Anatomy 0.000 description 2
- 210000001106 artificial yeast chromosome Anatomy 0.000 description 2
- 108010092854 aspartyllysine Proteins 0.000 description 2
- 108010068265 aspartyltyrosine Proteins 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 2
- 235000015895 biscuits Nutrition 0.000 description 2
- 238000006555 catalytic reaction Methods 0.000 description 2
- 210000004671 cell-free system Anatomy 0.000 description 2
- 230000019522 cellular metabolic process Effects 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- 229940112822 chewing gum Drugs 0.000 description 2
- 235000015218 chewing gum Nutrition 0.000 description 2
- 239000012141 concentrate Substances 0.000 description 2
- 238000001816 cooling Methods 0.000 description 2
- 239000002537 cosmetic Substances 0.000 description 2
- YSYKRGRSMLTJNL-URARBOGNSA-N dTDP-alpha-D-glucose Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)O[C@@H]2[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O2)O)[C@@H](O)C1 YSYKRGRSMLTJNL-URARBOGNSA-N 0.000 description 2
- 230000030609 dephosphorylation Effects 0.000 description 2
- 238000006209 dephosphorylation reaction Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 235000005911 diet Nutrition 0.000 description 2
- 230000037213 diet Effects 0.000 description 2
- 108010009297 diglycyl-histidine Proteins 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 239000003995 emulsifying agent Substances 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 235000019634 flavors Nutrition 0.000 description 2
- 235000013355 food flavoring agent Nutrition 0.000 description 2
- 235000011389 fruit/vegetable juice Nutrition 0.000 description 2
- 230000004545 gene duplication Effects 0.000 description 2
- 238000003167 genetic complementation Methods 0.000 description 2
- 238000010362 genome editing Methods 0.000 description 2
- 235000008434 ginseng Nutrition 0.000 description 2
- 229940045189 glucose-6-phosphate Drugs 0.000 description 2
- 108010085059 glutamyl-arginyl-proline Proteins 0.000 description 2
- 108010042598 glutamyl-aspartyl-glycine Proteins 0.000 description 2
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 2
- 102000045442 glycosyltransferase activity proteins Human genes 0.000 description 2
- 108700014210 glycosyltransferase activity proteins Proteins 0.000 description 2
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 2
- 108010072405 glycyl-aspartyl-glycine Proteins 0.000 description 2
- 108010051307 glycyl-glycyl-proline Proteins 0.000 description 2
- 108010048994 glycyl-tyrosyl-alanine Proteins 0.000 description 2
- 230000007407 health benefit Effects 0.000 description 2
- 108010085325 histidylproline Proteins 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 108010053037 kyotorphin Proteins 0.000 description 2
- 108010077158 leucinyl-arginyl-tryptophan Proteins 0.000 description 2
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 2
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 2
- 239000007791 liquid phase Substances 0.000 description 2
- 108010005942 methionylglycine Proteins 0.000 description 2
- 108020004707 nucleic acids Proteins 0.000 description 2
- 102000039446 nucleic acids Human genes 0.000 description 2
- 150000007523 nucleic acids Chemical class 0.000 description 2
- 230000009965 odorless effect Effects 0.000 description 2
- 235000005985 organic acids Nutrition 0.000 description 2
- 230000037361 pathway Effects 0.000 description 2
- 239000008188 pellet Substances 0.000 description 2
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 2
- 102000020233 phosphotransferase Human genes 0.000 description 2
- 108010025488 pinealon Proteins 0.000 description 2
- 229920002451 polyvinyl alcohol Polymers 0.000 description 2
- 108010053725 prolylvaline Proteins 0.000 description 2
- 230000019464 regulation of glucose import Effects 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- 235000013580 sausages Nutrition 0.000 description 2
- 235000014102 seafood Nutrition 0.000 description 2
- 230000028327 secretion Effects 0.000 description 2
- 239000008137 solubility enhancer Substances 0.000 description 2
- 235000013555 soy sauce Nutrition 0.000 description 2
- 229940031000 streptococcus pneumoniae Drugs 0.000 description 2
- 108010008005 sugar-phosphatase Proteins 0.000 description 2
- 150000008163 sugars Chemical class 0.000 description 2
- 239000006228 supernatant Substances 0.000 description 2
- 238000004448 titration Methods 0.000 description 2
- 108010084932 tryptophyl-proline Proteins 0.000 description 2
- 108010020532 tyrosyl-proline Proteins 0.000 description 2
- DRSKVOAJKLUMCL-MMUIXFKXSA-N u2n4xkx7hp Chemical compound O([C@H]1[C@H](O)[C@@H](CO)O[C@H]([C@@H]1O[C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O)O[C@]12C(=C)C[C@@]3(C1)CC[C@@H]1[C@@](C)(CCC[C@]1([C@@H]3CC2)C)C(O)=O)[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O DRSKVOAJKLUMCL-MMUIXFKXSA-N 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 235000013311 vegetables Nutrition 0.000 description 2
- 235000021419 vinegar Nutrition 0.000 description 2
- 239000000052 vinegar Substances 0.000 description 2
- GHBNZZJYBXQAHG-KUVSNLSMSA-N (2r,3r,4s,5s,6r)-2-[[(2r,3s,4s,5r,6r)-6-[[(3s,8s,9r,10r,11r,13r,14s,17r)-17-[(2r,5r)-5-[(2s,3r,4s,5s,6r)-4,5-dihydroxy-3-[(2r,3r,4s,5s,6r)-3,4,5-trihydroxy-6-(hydroxymethyl)oxan-2-yl]oxy-6-[[(2r,3r,4s,5s,6r)-3,4,5-trihydroxy-6-(hydroxymethyl)oxan-2-yl]oxy Chemical compound C([C@H]1O[C@H]([C@@H]([C@@H](O)[C@@H]1O)O[C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O)O[C@H](CC[C@@H](C)[C@@H]1[C@]2(C[C@@H](O)[C@@]3(C)[C@H]4C(C([C@@H](O[C@H]5[C@@H]([C@@H](O)[C@H](O)[C@@H](CO[C@H]6[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O6)O)O5)O)CC4)(C)C)=CC[C@H]3[C@]2(C)CC1)C)C(C)(C)O)O[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O GHBNZZJYBXQAHG-KUVSNLSMSA-N 0.000 description 1
- CVPYYBCSHSCXJQ-DXKBKAGUSA-N (2s,3r,4s,5s,6r)-2-[4-[(e)-2-(3,5-dihydroxyphenyl)ethenyl]-2-methoxyphenoxy]-6-(hydroxymethyl)oxane-3,4,5-triol Chemical compound C=1C=C(O[C@H]2[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O2)O)C(OC)=CC=1\C=C\C1=CC(O)=CC(O)=C1 CVPYYBCSHSCXJQ-DXKBKAGUSA-N 0.000 description 1
- YTKBWWKAVMSYHE-OALUTQOASA-N (3s)-3-[3-(3-hydroxy-4-methoxyphenyl)propylamino]-4-[[(2s)-1-methoxy-1-oxo-3-phenylpropan-2-yl]amino]-4-oxobutanoic acid Chemical compound C([C@@H](C(=O)OC)NC(=O)[C@H](CC(O)=O)NCCCC=1C=C(O)C(OC)=CC=1)C1=CC=CC=C1 YTKBWWKAVMSYHE-OALUTQOASA-N 0.000 description 1
- BNAIICFZMLQZKW-CYAIWNQHSA-N (6e,10e,14e,18e,22e,26e,30e,34e,38e)-3,7,11,15,19,23,27,31,35,39,43-undecamethyltetratetraconta-6,10,14,18,22,26,30,34,38,42-decaen-1-ol Chemical compound OCCC(C)CC\C=C(/C)CC\C=C(/C)CC\C=C(/C)CC\C=C(/C)CC\C=C(/C)CC\C=C(/C)CC\C=C(/C)CC\C=C(/C)CC\C=C(/C)CCC=C(C)C BNAIICFZMLQZKW-CYAIWNQHSA-N 0.000 description 1
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- HBEDSQVIWPRPAY-UHFFFAOYSA-N 2,3-dihydrobenzofuran Chemical compound C1=CC=C2OCCC2=C1 HBEDSQVIWPRPAY-UHFFFAOYSA-N 0.000 description 1
- DQVAZKGVGKHQDS-UHFFFAOYSA-N 2-[[1-[2-[(2-amino-4-methylpentanoyl)amino]-4-methylpentanoyl]pyrrolidine-2-carbonyl]amino]-4-methylpentanoic acid Chemical compound CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(=O)NC(CC(C)C)C(O)=O DQVAZKGVGKHQDS-UHFFFAOYSA-N 0.000 description 1
- MIDXCONKKJTLDX-UHFFFAOYSA-N 3,5-dimethylcyclopentane-1,2-dione Chemical compound CC1CC(C)C(=O)C1=O MIDXCONKKJTLDX-UHFFFAOYSA-N 0.000 description 1
- WBZFUFAFFUEMEI-UHFFFAOYSA-M Acesulfame k Chemical compound [K+].CC1=CC(=O)[N-]S(=O)(=O)O1 WBZFUFAFFUEMEI-UHFFFAOYSA-M 0.000 description 1
- 239000004394 Advantame Substances 0.000 description 1
- TWCMVXMQHSVIOJ-UHFFFAOYSA-N Aglycone of yadanzioside D Natural products COC(=O)C12OCC34C(CC5C(=CC(O)C(O)C5(C)C3C(O)C1O)C)OC(=O)C(OC(=O)C)C24 TWCMVXMQHSVIOJ-UHFFFAOYSA-N 0.000 description 1
- DVWVZSJAYIJZFI-FXQIFTODSA-N Ala-Arg-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O DVWVZSJAYIJZFI-FXQIFTODSA-N 0.000 description 1
- WXERCAHAIKMTKX-ZLUOBGJFSA-N Ala-Asp-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O WXERCAHAIKMTKX-ZLUOBGJFSA-N 0.000 description 1
- FUSPCLTUKXQREV-ACZMJKKPSA-N Ala-Glu-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O FUSPCLTUKXQREV-ACZMJKKPSA-N 0.000 description 1
- KXEVYGKATAMXJJ-ACZMJKKPSA-N Ala-Glu-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O KXEVYGKATAMXJJ-ACZMJKKPSA-N 0.000 description 1
- HXNNRBHASOSVPG-GUBZILKMSA-N Ala-Glu-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HXNNRBHASOSVPG-GUBZILKMSA-N 0.000 description 1
- NHLAEBFGWPXFGI-WHFBIAKZSA-N Ala-Gly-Asn Chemical compound C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N NHLAEBFGWPXFGI-WHFBIAKZSA-N 0.000 description 1
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 1
- OBVSBEYOMDWLRJ-BFHQHQDPSA-N Ala-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N OBVSBEYOMDWLRJ-BFHQHQDPSA-N 0.000 description 1
- 108010076441 Ala-His-His Proteins 0.000 description 1
- DPNZTBKGAUAZQU-DLOVCJGASA-N Ala-Leu-His Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N DPNZTBKGAUAZQU-DLOVCJGASA-N 0.000 description 1
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 1
- SUHLZMHFRALVSY-YUMQZZPRSA-N Ala-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)NCC(O)=O SUHLZMHFRALVSY-YUMQZZPRSA-N 0.000 description 1
- BLTRAARCJYVJKV-QEJZJMRPSA-N Ala-Lys-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](Cc1ccccc1)C(O)=O BLTRAARCJYVJKV-QEJZJMRPSA-N 0.000 description 1
- DHBKYZYFEXXUAK-ONGXEEELSA-N Ala-Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 DHBKYZYFEXXUAK-ONGXEEELSA-N 0.000 description 1
- DXTYEWAQOXYRHZ-KKXDTOCCSA-N Ala-Phe-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N DXTYEWAQOXYRHZ-KKXDTOCCSA-N 0.000 description 1
- KLALXKYLOMZDQT-ZLUOBGJFSA-N Ala-Ser-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(N)=O KLALXKYLOMZDQT-ZLUOBGJFSA-N 0.000 description 1
- MSWSRLGNLKHDEI-ACZMJKKPSA-N Ala-Ser-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O MSWSRLGNLKHDEI-ACZMJKKPSA-N 0.000 description 1
- YJHKTAMKPGFJCT-NRPADANISA-N Ala-Val-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O YJHKTAMKPGFJCT-NRPADANISA-N 0.000 description 1
- NLYYHIKRBRMAJV-AEJSXWLSSA-N Ala-Val-Pro Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N NLYYHIKRBRMAJV-AEJSXWLSSA-N 0.000 description 1
- 235000006667 Aleurites moluccana Nutrition 0.000 description 1
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 1
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 1
- 244000144725 Amygdalus communis Species 0.000 description 1
- 235000011446 Amygdalus persica Nutrition 0.000 description 1
- 241000192531 Anabaena sp. Species 0.000 description 1
- 244000099147 Ananas comosus Species 0.000 description 1
- 235000007119 Ananas comosus Nutrition 0.000 description 1
- YFWTXMRJJDNTLM-LSJOCFKGSA-N Arg-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YFWTXMRJJDNTLM-LSJOCFKGSA-N 0.000 description 1
- HJVGMOYJDDXLMI-AVGNSLFASA-N Arg-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCCNC(N)=N HJVGMOYJDDXLMI-AVGNSLFASA-N 0.000 description 1
- YUIGJDNAGKJLDO-JYJNAYRXSA-N Arg-Arg-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YUIGJDNAGKJLDO-JYJNAYRXSA-N 0.000 description 1
- NONSEUUPKITYQT-BQBZGAKWSA-N Arg-Asn-Gly Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N)CN=C(N)N NONSEUUPKITYQT-BQBZGAKWSA-N 0.000 description 1
- XVLLUZMFSAYKJV-GUBZILKMSA-N Arg-Asp-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O XVLLUZMFSAYKJV-GUBZILKMSA-N 0.000 description 1
- OTCJMMRQBVDQRK-DCAQKATOSA-N Arg-Asp-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OTCJMMRQBVDQRK-DCAQKATOSA-N 0.000 description 1
- PTVGLOCPAVYPFG-CIUDSAMLSA-N Arg-Gln-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O PTVGLOCPAVYPFG-CIUDSAMLSA-N 0.000 description 1
- JUWQNWXEGDYCIE-YUMQZZPRSA-N Arg-Gln-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O JUWQNWXEGDYCIE-YUMQZZPRSA-N 0.000 description 1
- OOIMKQRCPJBGPD-XUXIUFHCSA-N Arg-Ile-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O OOIMKQRCPJBGPD-XUXIUFHCSA-N 0.000 description 1
- FNXCAFKDGBROCU-STECZYCISA-N Arg-Ile-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FNXCAFKDGBROCU-STECZYCISA-N 0.000 description 1
- UHFUZWSZQKMDSX-DCAQKATOSA-N Arg-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UHFUZWSZQKMDSX-DCAQKATOSA-N 0.000 description 1
- GMFAGHNRXPSSJS-SRVKXCTJSA-N Arg-Leu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GMFAGHNRXPSSJS-SRVKXCTJSA-N 0.000 description 1
- BTJVOUQWFXABOI-IHRRRGAJSA-N Arg-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCNC(N)=N BTJVOUQWFXABOI-IHRRRGAJSA-N 0.000 description 1
- MTYLORHAQXVQOW-AVGNSLFASA-N Arg-Lys-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(O)=O MTYLORHAQXVQOW-AVGNSLFASA-N 0.000 description 1
- FKQITMVNILRUCQ-IHRRRGAJSA-N Arg-Phe-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O FKQITMVNILRUCQ-IHRRRGAJSA-N 0.000 description 1
- DPLFNLDACGGBAK-KKUMJFAQSA-N Arg-Phe-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N DPLFNLDACGGBAK-KKUMJFAQSA-N 0.000 description 1
- ATABBWFGOHKROJ-GUBZILKMSA-N Arg-Pro-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O ATABBWFGOHKROJ-GUBZILKMSA-N 0.000 description 1
- AWMAZIIEFPFHCP-RCWTZXSCSA-N Arg-Pro-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O AWMAZIIEFPFHCP-RCWTZXSCSA-N 0.000 description 1
- JOTRDIXZHNQYGP-DCAQKATOSA-N Arg-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N JOTRDIXZHNQYGP-DCAQKATOSA-N 0.000 description 1
- FRBAHXABMQXSJQ-FXQIFTODSA-N Arg-Ser-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O FRBAHXABMQXSJQ-FXQIFTODSA-N 0.000 description 1
- DDBMKOCQWNFDBH-RHYQMDGZSA-N Arg-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O DDBMKOCQWNFDBH-RHYQMDGZSA-N 0.000 description 1
- CGWVCWFQGXOUSJ-ULQDDVLXSA-N Arg-Tyr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O CGWVCWFQGXOUSJ-ULQDDVLXSA-N 0.000 description 1
- XMZZGVGKGXRIGJ-JYJNAYRXSA-N Arg-Tyr-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O XMZZGVGKGXRIGJ-JYJNAYRXSA-N 0.000 description 1
- ANAHQDPQQBDOBM-UHFFFAOYSA-N Arg-Val-Tyr Natural products CC(C)C(NC(=O)C(N)CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O ANAHQDPQQBDOBM-UHFFFAOYSA-N 0.000 description 1
- RZVVKNIACROXRM-ZLUOBGJFSA-N Asn-Ala-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N RZVVKNIACROXRM-ZLUOBGJFSA-N 0.000 description 1
- CIBWFJFMOBIFTE-CIUDSAMLSA-N Asn-Arg-Gln Chemical compound C(C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N CIBWFJFMOBIFTE-CIUDSAMLSA-N 0.000 description 1
- BHQQRVARKXWXPP-ACZMJKKPSA-N Asn-Asp-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N BHQQRVARKXWXPP-ACZMJKKPSA-N 0.000 description 1
- JRCASHGTXZYSPW-XIRDDKMYSA-N Asn-His-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC3=CN=CN3)NC(=O)[C@H](CC(=O)N)N JRCASHGTXZYSPW-XIRDDKMYSA-N 0.000 description 1
- ANPFQTJEPONRPL-UGYAYLCHSA-N Asn-Ile-Asp Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O ANPFQTJEPONRPL-UGYAYLCHSA-N 0.000 description 1
- ZMUQQMGITUJQTI-CIUDSAMLSA-N Asn-Leu-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ZMUQQMGITUJQTI-CIUDSAMLSA-N 0.000 description 1
- UBGGJTMETLEXJD-DCAQKATOSA-N Asn-Leu-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O UBGGJTMETLEXJD-DCAQKATOSA-N 0.000 description 1
- FTSAJSADJCMDHH-CIUDSAMLSA-N Asn-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N FTSAJSADJCMDHH-CIUDSAMLSA-N 0.000 description 1
- BKFXFUPYETWGGA-XVSYOHENSA-N Asn-Phe-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BKFXFUPYETWGGA-XVSYOHENSA-N 0.000 description 1
- VWADICJNCPFKJS-ZLUOBGJFSA-N Asn-Ser-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O VWADICJNCPFKJS-ZLUOBGJFSA-N 0.000 description 1
- JBDLMLZNDRLDIX-HJGDQZAQSA-N Asn-Thr-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O JBDLMLZNDRLDIX-HJGDQZAQSA-N 0.000 description 1
- JPPLRQVZMZFOSX-UWJYBYFXSA-N Asn-Tyr-Ala Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=C(O)C=C1 JPPLRQVZMZFOSX-UWJYBYFXSA-N 0.000 description 1
- KBQOUDLMWYWXNP-YDHLFZDLSA-N Asn-Val-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC(=O)N)N KBQOUDLMWYWXNP-YDHLFZDLSA-N 0.000 description 1
- GHWWTICYPDKPTE-NGZCFLSTSA-N Asn-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N GHWWTICYPDKPTE-NGZCFLSTSA-N 0.000 description 1
- XBQSLMACWDXWLJ-GHCJXIJMSA-N Asp-Ala-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XBQSLMACWDXWLJ-GHCJXIJMSA-N 0.000 description 1
- VPPXTHJNTYDNFJ-CIUDSAMLSA-N Asp-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N VPPXTHJNTYDNFJ-CIUDSAMLSA-N 0.000 description 1
- XYBJLTKSGFBLCS-QXEWZRGKSA-N Asp-Arg-Val Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CC(O)=O XYBJLTKSGFBLCS-QXEWZRGKSA-N 0.000 description 1
- YNQIDCRRTWGHJD-ZLUOBGJFSA-N Asp-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(O)=O YNQIDCRRTWGHJD-ZLUOBGJFSA-N 0.000 description 1
- ZELQAFZSJOBEQS-ACZMJKKPSA-N Asp-Asn-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZELQAFZSJOBEQS-ACZMJKKPSA-N 0.000 description 1
- VHQOCWWKXIOAQI-WDSKDSINSA-N Asp-Gln-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VHQOCWWKXIOAQI-WDSKDSINSA-N 0.000 description 1
- QCLHLXDWRKOHRR-GUBZILKMSA-N Asp-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N QCLHLXDWRKOHRR-GUBZILKMSA-N 0.000 description 1
- PDECQIHABNQRHN-GUBZILKMSA-N Asp-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(O)=O PDECQIHABNQRHN-GUBZILKMSA-N 0.000 description 1
- NHSDEZURHWEZPN-SXTJYALSSA-N Asp-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CC(=O)O)N NHSDEZURHWEZPN-SXTJYALSSA-N 0.000 description 1
- PYXXJFRXIYAESU-PCBIJLKTSA-N Asp-Ile-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PYXXJFRXIYAESU-PCBIJLKTSA-N 0.000 description 1
- UJGRZQYSNYTCAX-SRVKXCTJSA-N Asp-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UJGRZQYSNYTCAX-SRVKXCTJSA-N 0.000 description 1
- XWSIYTYNLKCLJB-CIUDSAMLSA-N Asp-Lys-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O XWSIYTYNLKCLJB-CIUDSAMLSA-N 0.000 description 1
- VSMYBNPOHYAXSD-GUBZILKMSA-N Asp-Lys-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O VSMYBNPOHYAXSD-GUBZILKMSA-N 0.000 description 1
- IOXWDLNHXZOXQP-FXQIFTODSA-N Asp-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N IOXWDLNHXZOXQP-FXQIFTODSA-N 0.000 description 1
- LKVKODXGSAFOFY-VEVYYDQMSA-N Asp-Met-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LKVKODXGSAFOFY-VEVYYDQMSA-N 0.000 description 1
- UCHSVZYJKJLPHF-BZSNNMDCSA-N Asp-Phe-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O UCHSVZYJKJLPHF-BZSNNMDCSA-N 0.000 description 1
- GPPIDDWYKJPRES-YDHLFZDLSA-N Asp-Phe-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O GPPIDDWYKJPRES-YDHLFZDLSA-N 0.000 description 1
- MNQMTYSEKZHIDF-GCJQMDKQSA-N Asp-Thr-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O MNQMTYSEKZHIDF-GCJQMDKQSA-N 0.000 description 1
- NAAAPCLFJPURAM-HJGDQZAQSA-N Asp-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O NAAAPCLFJPURAM-HJGDQZAQSA-N 0.000 description 1
- 108010011485 Aspartame Proteins 0.000 description 1
- PLMKQQMDOMTZGG-UHFFFAOYSA-N Astrantiagenin E-methylester Natural products CC12CCC(O)C(C)(CO)C1CCC1(C)C2CC=C2C3CC(C)(C)CCC3(C(=O)OC)CCC21C PLMKQQMDOMTZGG-UHFFFAOYSA-N 0.000 description 1
- 108700003860 Bacterial Genes Proteins 0.000 description 1
- 241000606125 Bacteroides Species 0.000 description 1
- 101710198694 Bactoprenol-linked glucose translocase Proteins 0.000 description 1
- 241001474374 Blennius Species 0.000 description 1
- 235000004936 Bromus mango Nutrition 0.000 description 1
- 238000010453 CRISPR/Cas method Methods 0.000 description 1
- 244000197813 Camelina sativa Species 0.000 description 1
- 235000014595 Camelina sativa Nutrition 0.000 description 1
- 241000769888 Canephora <angiosperm> Species 0.000 description 1
- 241000220270 Cephalotus Species 0.000 description 1
- 241000220271 Cephalotus follicularis Species 0.000 description 1
- 241000905957 Channa melasoma Species 0.000 description 1
- 244000223760 Cinnamomum zeylanicum Species 0.000 description 1
- 108091062157 Cis-regulatory element Proteins 0.000 description 1
- 235000008733 Citrus aurantifolia Nutrition 0.000 description 1
- 235000005979 Citrus limon Nutrition 0.000 description 1
- 244000131522 Citrus pyriformis Species 0.000 description 1
- 235000007460 Coffea arabica Nutrition 0.000 description 1
- 244000016593 Coffea robusta Species 0.000 description 1
- 235000002187 Coffea robusta Nutrition 0.000 description 1
- 235000016795 Cola Nutrition 0.000 description 1
- 241001634499 Cola Species 0.000 description 1
- 235000011824 Cola pachycarpa Nutrition 0.000 description 1
- 235000011777 Corchorus aestuans Nutrition 0.000 description 1
- 235000010862 Corchorus capsularis Nutrition 0.000 description 1
- 240000004792 Corchorus capsularis Species 0.000 description 1
- 229920000742 Cotton Polymers 0.000 description 1
- 235000009849 Cucumis sativus Nutrition 0.000 description 1
- 235000010799 Cucumis sativus var sativus Nutrition 0.000 description 1
- 235000009852 Cucurbita pepo Nutrition 0.000 description 1
- 235000019542 Cured Meats Nutrition 0.000 description 1
- UDIPTWFVPPPURJ-UHFFFAOYSA-M Cyclamate Chemical compound [Na+].[O-]S(=O)(=O)NC1CCCCC1 UDIPTWFVPPPURJ-UHFFFAOYSA-M 0.000 description 1
- UISYPAHPLXGLNH-ACZMJKKPSA-N Cys-Asn-Gln Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O UISYPAHPLXGLNH-ACZMJKKPSA-N 0.000 description 1
- WDQXKVCQXRNOSI-GHCJXIJMSA-N Cys-Asp-Ile Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WDQXKVCQXRNOSI-GHCJXIJMSA-N 0.000 description 1
- GCDLPNRHPWBKJJ-WDSKDSINSA-N Cys-Gly-Glu Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O GCDLPNRHPWBKJJ-WDSKDSINSA-N 0.000 description 1
- CIVXDCMSSFGWAL-YUMQZZPRSA-N Cys-Lys-Gly Chemical compound C(CCN)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CS)N CIVXDCMSSFGWAL-YUMQZZPRSA-N 0.000 description 1
- SAEVTQWAYDPXMU-KATARQTJSA-N Cys-Thr-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O SAEVTQWAYDPXMU-KATARQTJSA-N 0.000 description 1
- 101710088194 Dehydrogenase Proteins 0.000 description 1
- RPNUMPOLZDHAAY-UHFFFAOYSA-N Diethylenetriamine Chemical compound NCCNCCN RPNUMPOLZDHAAY-UHFFFAOYSA-N 0.000 description 1
- 239000004321 EU approved sweetener Substances 0.000 description 1
- 239000004386 Erythritol Substances 0.000 description 1
- UNXHWFMMPAWVPI-UHFFFAOYSA-N Erythritol Natural products OCC(O)C(O)CO UNXHWFMMPAWVPI-UHFFFAOYSA-N 0.000 description 1
- 101100422772 Escherichia coli (strain K12) ybiV gene Proteins 0.000 description 1
- 101100069728 Escherichia coli (strain K12) yfdG gene Proteins 0.000 description 1
- 101100338056 Escherichia coli (strain K12) yfdH gene Proteins 0.000 description 1
- 101100052715 Escherichia coli (strain K12) yfdI gene Proteins 0.000 description 1
- 239000001329 FEMA 3811 Substances 0.000 description 1
- WUAYFMZULZDSLB-ACZMJKKPSA-N Gln-Ala-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O WUAYFMZULZDSLB-ACZMJKKPSA-N 0.000 description 1
- MWLYSLMKFXWZPW-ZPFDUUQYSA-N Gln-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CCC(N)=O MWLYSLMKFXWZPW-ZPFDUUQYSA-N 0.000 description 1
- RMOCFPBLHAOTDU-ACZMJKKPSA-N Gln-Asn-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RMOCFPBLHAOTDU-ACZMJKKPSA-N 0.000 description 1
- LMPBBFWHCRURJD-LAEOZQHASA-N Gln-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)N)N LMPBBFWHCRURJD-LAEOZQHASA-N 0.000 description 1
- CYTSBCIIEHUPDU-ACZMJKKPSA-N Gln-Asp-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O CYTSBCIIEHUPDU-ACZMJKKPSA-N 0.000 description 1
- QYTKAVBFRUGYAU-ACZMJKKPSA-N Gln-Asp-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QYTKAVBFRUGYAU-ACZMJKKPSA-N 0.000 description 1
- UICOTGULOUGGLC-NUMRIWBASA-N Gln-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N)O UICOTGULOUGGLC-NUMRIWBASA-N 0.000 description 1
- CITDWMLWXNUQKD-FXQIFTODSA-N Gln-Gln-Asn Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CITDWMLWXNUQKD-FXQIFTODSA-N 0.000 description 1
- MCAVASRGVBVPMX-FXQIFTODSA-N Gln-Glu-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MCAVASRGVBVPMX-FXQIFTODSA-N 0.000 description 1
- DRDSQGHKTLSNEA-GLLZPBPUSA-N Gln-Glu-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DRDSQGHKTLSNEA-GLLZPBPUSA-N 0.000 description 1
- QQAPDATZKKTBIY-YUMQZZPRSA-N Gln-Gly-Met Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O QQAPDATZKKTBIY-YUMQZZPRSA-N 0.000 description 1
- GFLNKSQHOBOMNM-AVGNSLFASA-N Gln-His-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCC(=O)N)N GFLNKSQHOBOMNM-AVGNSLFASA-N 0.000 description 1
- JKGHMESJHRTHIC-SIUGBPQLSA-N Gln-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N JKGHMESJHRTHIC-SIUGBPQLSA-N 0.000 description 1
- YPMDZWPZFOZYFG-GUBZILKMSA-N Gln-Leu-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YPMDZWPZFOZYFG-GUBZILKMSA-N 0.000 description 1
- SFAFZYYMAWOCIC-KKUMJFAQSA-N Gln-Phe-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N SFAFZYYMAWOCIC-KKUMJFAQSA-N 0.000 description 1
- FNAJNWPDTIXYJN-CIUDSAMLSA-N Gln-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCC(N)=O FNAJNWPDTIXYJN-CIUDSAMLSA-N 0.000 description 1
- SDSMVVSHLAAOJL-UKJIMTQDSA-N Gln-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCC(=O)N)N SDSMVVSHLAAOJL-UKJIMTQDSA-N 0.000 description 1
- IYAUFWMUCGBFMQ-CIUDSAMLSA-N Glu-Arg-Cys Chemical compound C(C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)CN=C(N)N IYAUFWMUCGBFMQ-CIUDSAMLSA-N 0.000 description 1
- RDPOETHPAQEGDP-ACZMJKKPSA-N Glu-Asp-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RDPOETHPAQEGDP-ACZMJKKPSA-N 0.000 description 1
- PAQUJCSYVIBPLC-AVGNSLFASA-N Glu-Asp-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PAQUJCSYVIBPLC-AVGNSLFASA-N 0.000 description 1
- CKOFNWCLWRYUHK-XHNCKOQMSA-N Glu-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O CKOFNWCLWRYUHK-XHNCKOQMSA-N 0.000 description 1
- PVBBEKPHARMPHX-DCAQKATOSA-N Glu-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O PVBBEKPHARMPHX-DCAQKATOSA-N 0.000 description 1
- VFZIDQZAEBORGY-GLLZPBPUSA-N Glu-Gln-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VFZIDQZAEBORGY-GLLZPBPUSA-N 0.000 description 1
- LGYZYFFDELZWRS-DCAQKATOSA-N Glu-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O LGYZYFFDELZWRS-DCAQKATOSA-N 0.000 description 1
- KASDBWKLWJKTLJ-GUBZILKMSA-N Glu-Glu-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O KASDBWKLWJKTLJ-GUBZILKMSA-N 0.000 description 1
- PHONAZGUEGIOEM-GLLZPBPUSA-N Glu-Glu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PHONAZGUEGIOEM-GLLZPBPUSA-N 0.000 description 1
- OAGVHWYIBZMWLA-YFKPBYRVSA-N Glu-Gly-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)NCC(O)=O OAGVHWYIBZMWLA-YFKPBYRVSA-N 0.000 description 1
- CUXJIASLBRJOFV-LAEOZQHASA-N Glu-Gly-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CUXJIASLBRJOFV-LAEOZQHASA-N 0.000 description 1
- XIKYNVKEUINBGL-IUCAKERBSA-N Glu-His-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)NCC(O)=O XIKYNVKEUINBGL-IUCAKERBSA-N 0.000 description 1
- ZCOJVESMNGBGLF-GRLWGSQLSA-N Glu-Ile-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZCOJVESMNGBGLF-GRLWGSQLSA-N 0.000 description 1
- ZSWGJYOZWBHROQ-RWRJDSDZSA-N Glu-Ile-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZSWGJYOZWBHROQ-RWRJDSDZSA-N 0.000 description 1
- VSRCAOIHMGCIJK-SRVKXCTJSA-N Glu-Leu-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VSRCAOIHMGCIJK-SRVKXCTJSA-N 0.000 description 1
- OQXDUSZKISQQSS-GUBZILKMSA-N Glu-Lys-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O OQXDUSZKISQQSS-GUBZILKMSA-N 0.000 description 1
- ZGEJRLJEAMPEDV-SRVKXCTJSA-N Glu-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N ZGEJRLJEAMPEDV-SRVKXCTJSA-N 0.000 description 1
- MFNUFCFRAZPJFW-JYJNAYRXSA-N Glu-Lys-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MFNUFCFRAZPJFW-JYJNAYRXSA-N 0.000 description 1
- SOEPMWQCTJITPZ-SRVKXCTJSA-N Glu-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N SOEPMWQCTJITPZ-SRVKXCTJSA-N 0.000 description 1
- XEKAJTCACGEBOK-KKUMJFAQSA-N Glu-Met-Phe Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XEKAJTCACGEBOK-KKUMJFAQSA-N 0.000 description 1
- QOXDAWODGSIDDI-GUBZILKMSA-N Glu-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N QOXDAWODGSIDDI-GUBZILKMSA-N 0.000 description 1
- DMYACXMQUABZIQ-NRPADANISA-N Glu-Ser-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O DMYACXMQUABZIQ-NRPADANISA-N 0.000 description 1
- RGJKYNUINKGPJN-RWRJDSDZSA-N Glu-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCC(=O)O)N RGJKYNUINKGPJN-RWRJDSDZSA-N 0.000 description 1
- YQAQQKPWFOBSMU-WDCWCFNPSA-N Glu-Thr-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O YQAQQKPWFOBSMU-WDCWCFNPSA-N 0.000 description 1
- 102000030595 Glucokinase Human genes 0.000 description 1
- 108010021582 Glucokinase Proteins 0.000 description 1
- 101710179023 Glucose-1-phosphatase Proteins 0.000 description 1
- 108700023224 Glucose-1-phosphate adenylyltransferases Proteins 0.000 description 1
- MFVQGXGQRIXBPK-WDSKDSINSA-N Gly-Ala-Glu Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFVQGXGQRIXBPK-WDSKDSINSA-N 0.000 description 1
- XEJTYSCIXKYSHR-WDSKDSINSA-N Gly-Asp-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN XEJTYSCIXKYSHR-WDSKDSINSA-N 0.000 description 1
- JUGQPPOVWXSPKJ-RYUDHWBXSA-N Gly-Gln-Phe Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JUGQPPOVWXSPKJ-RYUDHWBXSA-N 0.000 description 1
- HMHRTKOWRUPPNU-RCOVLWMOSA-N Gly-Ile-Gly Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O HMHRTKOWRUPPNU-RCOVLWMOSA-N 0.000 description 1
- IUZGUFAJDBHQQV-YUMQZZPRSA-N Gly-Leu-Asn Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IUZGUFAJDBHQQV-YUMQZZPRSA-N 0.000 description 1
- ULZCYBYDTUMHNF-IUCAKERBSA-N Gly-Leu-Glu Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ULZCYBYDTUMHNF-IUCAKERBSA-N 0.000 description 1
- UUYBFNKHOCJCHT-VHSXEESVSA-N Gly-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN UUYBFNKHOCJCHT-VHSXEESVSA-N 0.000 description 1
- GMTXWRIDLGTVFC-IUCAKERBSA-N Gly-Lys-Glu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GMTXWRIDLGTVFC-IUCAKERBSA-N 0.000 description 1
- FJWSJWACLMTDMI-WPRPVWTQSA-N Gly-Met-Val Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O FJWSJWACLMTDMI-WPRPVWTQSA-N 0.000 description 1
- WZSHYFGOLPXPLL-RYUDHWBXSA-N Gly-Phe-Glu Chemical compound NCC(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CCC(O)=O)C(O)=O WZSHYFGOLPXPLL-RYUDHWBXSA-N 0.000 description 1
- DHNXGWVNLFPOMQ-KBPBESRZSA-N Gly-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)CN DHNXGWVNLFPOMQ-KBPBESRZSA-N 0.000 description 1
- GGLIDLCEPDHEJO-BQBZGAKWSA-N Gly-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)CN GGLIDLCEPDHEJO-BQBZGAKWSA-N 0.000 description 1
- HFPVRZWORNJRRC-UWVGGRQHSA-N Gly-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN HFPVRZWORNJRRC-UWVGGRQHSA-N 0.000 description 1
- VNNRLUNBJSWZPF-ZKWXMUAHSA-N Gly-Ser-Ile Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VNNRLUNBJSWZPF-ZKWXMUAHSA-N 0.000 description 1
- UIQGJYUEQDOODF-KWQFWETISA-N Gly-Tyr-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 UIQGJYUEQDOODF-KWQFWETISA-N 0.000 description 1
- AFMOTCMSEBITOE-YEPSODPASA-N Gly-Val-Thr Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AFMOTCMSEBITOE-YEPSODPASA-N 0.000 description 1
- 235000000554 Glycyrrhiza uralensis Nutrition 0.000 description 1
- 240000008917 Glycyrrhiza uralensis Species 0.000 description 1
- CVPYYBCSHSCXJQ-UHFFFAOYSA-N Gnetifolin E Natural products C=1C=C(OC2C(C(O)C(O)C(CO)O2)O)C(OC)=CC=1C=CC1=CC(O)=CC(O)=C1 CVPYYBCSHSCXJQ-UHFFFAOYSA-N 0.000 description 1
- 241000606790 Haemophilus Species 0.000 description 1
- CIWILNZNBPIHEU-DCAQKATOSA-N His-Arg-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O CIWILNZNBPIHEU-DCAQKATOSA-N 0.000 description 1
- UCDWNBFOZCZSNV-AVGNSLFASA-N His-Arg-Met Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O UCDWNBFOZCZSNV-AVGNSLFASA-N 0.000 description 1
- NQKRILCJYCASDV-QWRGUYRKSA-N His-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CN=CN1 NQKRILCJYCASDV-QWRGUYRKSA-N 0.000 description 1
- ORERHHPZDDEMSC-VGDYDELISA-N His-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N ORERHHPZDDEMSC-VGDYDELISA-N 0.000 description 1
- ZFDKSLBEWYCOCS-BZSNNMDCSA-N His-Phe-Lys Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CC=1NC=NC=1)C1=CC=CC=C1 ZFDKSLBEWYCOCS-BZSNNMDCSA-N 0.000 description 1
- XHQYFGPIRUHQIB-PBCZWWQYSA-N His-Thr-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CN=CN1 XHQYFGPIRUHQIB-PBCZWWQYSA-N 0.000 description 1
- MKWFGXSFLYNTKC-XIRDDKMYSA-N His-Trp-Asp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC3=CN=CN3)N MKWFGXSFLYNTKC-XIRDDKMYSA-N 0.000 description 1
- RNVUQLOKVIPNEM-BZSNNMDCSA-N His-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N)O RNVUQLOKVIPNEM-BZSNNMDCSA-N 0.000 description 1
- 101001138544 Homo sapiens UMP-CMP kinase Proteins 0.000 description 1
- 102000004157 Hydrolases Human genes 0.000 description 1
- 108090000604 Hydrolases Proteins 0.000 description 1
- WECYRWOMWSCWNX-XUXIUFHCSA-N Ile-Arg-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(C)C)C(O)=O WECYRWOMWSCWNX-XUXIUFHCSA-N 0.000 description 1
- IDAHFEPYTJJZFD-PEFMBERDSA-N Ile-Asp-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N IDAHFEPYTJJZFD-PEFMBERDSA-N 0.000 description 1
- NPROWIBAWYMPAZ-GUDRVLHUSA-N Ile-Asp-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N NPROWIBAWYMPAZ-GUDRVLHUSA-N 0.000 description 1
- QHGBCRCMBCWMBJ-UHFFFAOYSA-N Ile-Glu-Ala-Lys Natural products CCC(C)C(N)C(=O)NC(CCC(O)=O)C(=O)NC(C)C(=O)NC(C(O)=O)CCCCN QHGBCRCMBCWMBJ-UHFFFAOYSA-N 0.000 description 1
- TVSPLSZTKTUYLV-ZPFDUUQYSA-N Ile-Glu-Met Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCSC)C(=O)O TVSPLSZTKTUYLV-ZPFDUUQYSA-N 0.000 description 1
- WIZPFZKOFZXDQG-HTFCKZLJSA-N Ile-Ile-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O WIZPFZKOFZXDQG-HTFCKZLJSA-N 0.000 description 1
- GLYJPWIRLBAIJH-FQUUOJAGSA-N Ile-Lys-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N GLYJPWIRLBAIJH-FQUUOJAGSA-N 0.000 description 1
- MASWXTFJVNRZPT-NAKRPEOUSA-N Ile-Met-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(=O)O)N MASWXTFJVNRZPT-NAKRPEOUSA-N 0.000 description 1
- ZLFNNVATRMCAKN-ZKWXMUAHSA-N Ile-Ser-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZLFNNVATRMCAKN-ZKWXMUAHSA-N 0.000 description 1
- CNMOKANDJMLAIF-CIQUZCHMSA-N Ile-Thr-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O CNMOKANDJMLAIF-CIQUZCHMSA-N 0.000 description 1
- 108010065920 Insulin Lispro Proteins 0.000 description 1
- QLROSWPKSBORFJ-BQBZGAKWSA-N L-Prolyl-L-glutamic acid Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 QLROSWPKSBORFJ-BQBZGAKWSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- MJOZZTKJZQFKDK-GUBZILKMSA-N Leu-Ala-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(N)=O MJOZZTKJZQFKDK-GUBZILKMSA-N 0.000 description 1
- YOZCKMXHBYKOMQ-IHRRRGAJSA-N Leu-Arg-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOZCKMXHBYKOMQ-IHRRRGAJSA-N 0.000 description 1
- VCSBGUACOYUIGD-CIUDSAMLSA-N Leu-Asn-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VCSBGUACOYUIGD-CIUDSAMLSA-N 0.000 description 1
- OIARJGNVARWKFP-YUMQZZPRSA-N Leu-Asn-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O OIARJGNVARWKFP-YUMQZZPRSA-N 0.000 description 1
- DLFAACQHIRSQGG-CIUDSAMLSA-N Leu-Asp-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O DLFAACQHIRSQGG-CIUDSAMLSA-N 0.000 description 1
- KTFHTMHHKXUYPW-ZPFDUUQYSA-N Leu-Asp-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KTFHTMHHKXUYPW-ZPFDUUQYSA-N 0.000 description 1
- DLCOFDAHNMMQPP-SRVKXCTJSA-N Leu-Asp-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DLCOFDAHNMMQPP-SRVKXCTJSA-N 0.000 description 1
- XVSJMWYYLHPDKY-DCAQKATOSA-N Leu-Asp-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O XVSJMWYYLHPDKY-DCAQKATOSA-N 0.000 description 1
- VQPPIMUZCZCOIL-GUBZILKMSA-N Leu-Gln-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O VQPPIMUZCZCOIL-GUBZILKMSA-N 0.000 description 1
- VPKIQULSKFVCSM-SRVKXCTJSA-N Leu-Gln-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VPKIQULSKFVCSM-SRVKXCTJSA-N 0.000 description 1
- KAFOIVJDVSZUMD-UHFFFAOYSA-N Leu-Gln-Gln Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)NC(CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-UHFFFAOYSA-N 0.000 description 1
- DPWGZWUMUUJQDT-IUCAKERBSA-N Leu-Gln-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O DPWGZWUMUUJQDT-IUCAKERBSA-N 0.000 description 1
- CQGSYZCULZMEDE-SRVKXCTJSA-N Leu-Gln-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O CQGSYZCULZMEDE-SRVKXCTJSA-N 0.000 description 1
- PBGDOSARRIJMEV-DLOVCJGASA-N Leu-His-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O PBGDOSARRIJMEV-DLOVCJGASA-N 0.000 description 1
- KVOFSTUWVSQMDK-KKUMJFAQSA-N Leu-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(C)C)CC1=CN=CN1 KVOFSTUWVSQMDK-KKUMJFAQSA-N 0.000 description 1
- XBCWOTOCBXXJDG-BZSNNMDCSA-N Leu-His-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 XBCWOTOCBXXJDG-BZSNNMDCSA-N 0.000 description 1
- ZALAVHVPPOHAOL-XUXIUFHCSA-N Leu-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(C)C)N ZALAVHVPPOHAOL-XUXIUFHCSA-N 0.000 description 1
- CPONGMJGVIAWEH-DCAQKATOSA-N Leu-Met-Ala Chemical compound CSCC[C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](C)C(O)=O CPONGMJGVIAWEH-DCAQKATOSA-N 0.000 description 1
- WXZOHBVPVKABQN-DCAQKATOSA-N Leu-Met-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)O)C(=O)O)N WXZOHBVPVKABQN-DCAQKATOSA-N 0.000 description 1
- JVTYXRRFZCEPPK-RHYQMDGZSA-N Leu-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC(C)C)N)O JVTYXRRFZCEPPK-RHYQMDGZSA-N 0.000 description 1
- INCJJHQRZGQLFC-KBPBESRZSA-N Leu-Phe-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O INCJJHQRZGQLFC-KBPBESRZSA-N 0.000 description 1
- KTOIECMYZZGVSI-BZSNNMDCSA-N Leu-Phe-His Chemical compound C([C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CC=CC=C1 KTOIECMYZZGVSI-BZSNNMDCSA-N 0.000 description 1
- BMVFXOQHDQZAQU-DCAQKATOSA-N Leu-Pro-Asp Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N BMVFXOQHDQZAQU-DCAQKATOSA-N 0.000 description 1
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 1
- PWPBLZXWFXJFHE-RHYQMDGZSA-N Leu-Pro-Thr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O PWPBLZXWFXJFHE-RHYQMDGZSA-N 0.000 description 1
- IDGZVZJLYFTXSL-DCAQKATOSA-N Leu-Ser-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IDGZVZJLYFTXSL-DCAQKATOSA-N 0.000 description 1
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 1
- PPGBXYKMUMHFBF-KATARQTJSA-N Leu-Ser-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PPGBXYKMUMHFBF-KATARQTJSA-N 0.000 description 1
- SVBJIZVVYJYGLA-DCAQKATOSA-N Leu-Ser-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O SVBJIZVVYJYGLA-DCAQKATOSA-N 0.000 description 1
- ZDJQVSIPFLMNOX-RHYQMDGZSA-N Leu-Thr-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZDJQVSIPFLMNOX-RHYQMDGZSA-N 0.000 description 1
- UCRJTSIIAYHOHE-ULQDDVLXSA-N Leu-Tyr-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UCRJTSIIAYHOHE-ULQDDVLXSA-N 0.000 description 1
- HQVDJTYKCMIWJP-YUMQZZPRSA-N Lys-Asn-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HQVDJTYKCMIWJP-YUMQZZPRSA-N 0.000 description 1
- YEIYAQQKADPIBJ-GARJFASQSA-N Lys-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N)C(=O)O YEIYAQQKADPIBJ-GARJFASQSA-N 0.000 description 1
- MRWXLRGAFDOILG-DCAQKATOSA-N Lys-Gln-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MRWXLRGAFDOILG-DCAQKATOSA-N 0.000 description 1
- LLSUNJYOSCOOEB-GUBZILKMSA-N Lys-Glu-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O LLSUNJYOSCOOEB-GUBZILKMSA-N 0.000 description 1
- KZOHPCYVORJBLG-AVGNSLFASA-N Lys-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCCN)N KZOHPCYVORJBLG-AVGNSLFASA-N 0.000 description 1
- WGLAORUKDGRINI-WDCWCFNPSA-N Lys-Glu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGLAORUKDGRINI-WDCWCFNPSA-N 0.000 description 1
- ISHNZELVUVPCHY-ZETCQYMHSA-N Lys-Gly-Gly Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O ISHNZELVUVPCHY-ZETCQYMHSA-N 0.000 description 1
- NKKFVJRLCCUJNA-QWRGUYRKSA-N Lys-Gly-Lys Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN NKKFVJRLCCUJNA-QWRGUYRKSA-N 0.000 description 1
- OJDFAABAHBPVTH-MNXVOIDGSA-N Lys-Ile-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O OJDFAABAHBPVTH-MNXVOIDGSA-N 0.000 description 1
- OVAOHZIOUBEQCJ-IHRRRGAJSA-N Lys-Leu-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OVAOHZIOUBEQCJ-IHRRRGAJSA-N 0.000 description 1
- WRODMZBHNNPRLN-SRVKXCTJSA-N Lys-Leu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O WRODMZBHNNPRLN-SRVKXCTJSA-N 0.000 description 1
- WBSCNDJQPKSPII-KKUMJFAQSA-N Lys-Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O WBSCNDJQPKSPII-KKUMJFAQSA-N 0.000 description 1
- YDDDRTIPNTWGIG-SRVKXCTJSA-N Lys-Lys-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O YDDDRTIPNTWGIG-SRVKXCTJSA-N 0.000 description 1
- QQPSCXKFDSORFT-IHRRRGAJSA-N Lys-Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN QQPSCXKFDSORFT-IHRRRGAJSA-N 0.000 description 1
- MTBBHUKKPWKXBT-ULQDDVLXSA-N Lys-Met-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MTBBHUKKPWKXBT-ULQDDVLXSA-N 0.000 description 1
- BPDXWKVZNCKUGG-BZSNNMDCSA-N Lys-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCCCN)N BPDXWKVZNCKUGG-BZSNNMDCSA-N 0.000 description 1
- WGILOYIKJVQUPT-DCAQKATOSA-N Lys-Pro-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O WGILOYIKJVQUPT-DCAQKATOSA-N 0.000 description 1
- HKXSZKJMDBHOTG-CIUDSAMLSA-N Lys-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CCCCN HKXSZKJMDBHOTG-CIUDSAMLSA-N 0.000 description 1
- JMNRXRPBHFGXQX-GUBZILKMSA-N Lys-Ser-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JMNRXRPBHFGXQX-GUBZILKMSA-N 0.000 description 1
- MIFFFXHMAHFACR-KATARQTJSA-N Lys-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CCCCN MIFFFXHMAHFACR-KATARQTJSA-N 0.000 description 1
- VHTOGMKQXXJOHG-RHYQMDGZSA-N Lys-Thr-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O VHTOGMKQXXJOHG-RHYQMDGZSA-N 0.000 description 1
- ZVZRQKJOQQAFCF-ULQDDVLXSA-N Lys-Tyr-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ZVZRQKJOQQAFCF-ULQDDVLXSA-N 0.000 description 1
- HMZPYMSEAALNAE-ULQDDVLXSA-N Lys-Val-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O HMZPYMSEAALNAE-ULQDDVLXSA-N 0.000 description 1
- 235000014826 Mangifera indica Nutrition 0.000 description 1
- 240000007228 Mangifera indica Species 0.000 description 1
- 235000004456 Manihot esculenta Nutrition 0.000 description 1
- 235000016735 Manihot esculenta subsp esculenta Nutrition 0.000 description 1
- UYAKZHGIPRCGPF-CIUDSAMLSA-N Met-Glu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCSC)N UYAKZHGIPRCGPF-CIUDSAMLSA-N 0.000 description 1
- TZHFJXDKXGZHEN-IHRRRGAJSA-N Met-His-Leu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O TZHFJXDKXGZHEN-IHRRRGAJSA-N 0.000 description 1
- HWROAFGWPQUPTE-OSUNSFLBSA-N Met-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CCSC)N HWROAFGWPQUPTE-OSUNSFLBSA-N 0.000 description 1
- JCMMNFZUKMMECJ-DCAQKATOSA-N Met-Lys-Asn Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O JCMMNFZUKMMECJ-DCAQKATOSA-N 0.000 description 1
- WSPQHZOMTFFWGH-XGEHTFHBSA-N Met-Thr-Cys Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(O)=O WSPQHZOMTFFWGH-XGEHTFHBSA-N 0.000 description 1
- PNHRPOWKRRJATF-IHRRRGAJSA-N Met-Tyr-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 PNHRPOWKRRJATF-IHRRRGAJSA-N 0.000 description 1
- MFDDVIJCQYOOES-GUBZILKMSA-N Met-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCSC)N MFDDVIJCQYOOES-GUBZILKMSA-N 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 229920000881 Modified starch Polymers 0.000 description 1
- 108700005084 Multigene Family Proteins 0.000 description 1
- 240000005561 Musa balbisiana Species 0.000 description 1
- 235000018290 Musa x paradisiaca Nutrition 0.000 description 1
- 108010093901 N-(N-(3-(3-hydroxy-4-methoxyphenyl) propyl)-alpha-aspartyl)-L-phenylalanine 1-methyl ester Proteins 0.000 description 1
- 241000588652 Neisseria gonorrhoeae Species 0.000 description 1
- 239000004384 Neotame Substances 0.000 description 1
- 102000029785 Orotate phosphoribosyltransferase Human genes 0.000 description 1
- 102100037214 Orotidine 5'-phosphate decarboxylase Human genes 0.000 description 1
- 235000002789 Panax ginseng Nutrition 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 1
- 244000046052 Phaseolus vulgaris Species 0.000 description 1
- AJOKKVTWEMXZHC-DRZSPHRISA-N Phe-Ala-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 AJOKKVTWEMXZHC-DRZSPHRISA-N 0.000 description 1
- BKWJQWJPZMUWEG-LFSVMHDDSA-N Phe-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 BKWJQWJPZMUWEG-LFSVMHDDSA-N 0.000 description 1
- JEGFCFLCRSJCMA-IHRRRGAJSA-N Phe-Arg-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N JEGFCFLCRSJCMA-IHRRRGAJSA-N 0.000 description 1
- ZWJKVFAYPLPCQB-UNQGMJICSA-N Phe-Arg-Thr Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)Cc1ccccc1)C(O)=O ZWJKVFAYPLPCQB-UNQGMJICSA-N 0.000 description 1
- WMGVYPPIMZPWPN-SRVKXCTJSA-N Phe-Asp-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N WMGVYPPIMZPWPN-SRVKXCTJSA-N 0.000 description 1
- OYQBFWWQSVIHBN-FHWLQOOXSA-N Phe-Glu-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O OYQBFWWQSVIHBN-FHWLQOOXSA-N 0.000 description 1
- XMQSOOJRRVEHRO-ULQDDVLXSA-N Phe-Leu-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 XMQSOOJRRVEHRO-ULQDDVLXSA-N 0.000 description 1
- MGLBSROLWAWCKN-FCLVOEFKSA-N Phe-Phe-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MGLBSROLWAWCKN-FCLVOEFKSA-N 0.000 description 1
- MMPBPRXOFJNCCN-ZEWNOJEFSA-N Phe-Tyr-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MMPBPRXOFJNCCN-ZEWNOJEFSA-N 0.000 description 1
- 102000009569 Phosphoglucomutase Human genes 0.000 description 1
- IIXHQGSINFQLRR-UHFFFAOYSA-N Piceatannol Natural products Oc1ccc(C=Cc2c(O)c(O)c3CCCCc3c2O)cc1O IIXHQGSINFQLRR-UHFFFAOYSA-N 0.000 description 1
- WPQKSRHDTMRSJM-CIUDSAMLSA-N Pro-Asp-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 WPQKSRHDTMRSJM-CIUDSAMLSA-N 0.000 description 1
- NMELOOXSGDRBRU-YUMQZZPRSA-N Pro-Glu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(=O)O)NC(=O)[C@@H]1CCCN1 NMELOOXSGDRBRU-YUMQZZPRSA-N 0.000 description 1
- QGOZJLYCGRYYRW-KKUMJFAQSA-N Pro-Glu-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QGOZJLYCGRYYRW-KKUMJFAQSA-N 0.000 description 1
- HFNPOYOKIPGAEI-SRVKXCTJSA-N Pro-Leu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 HFNPOYOKIPGAEI-SRVKXCTJSA-N 0.000 description 1
- HATVCTYBNCNMAA-AVGNSLFASA-N Pro-Leu-Met Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O HATVCTYBNCNMAA-AVGNSLFASA-N 0.000 description 1
- RMODQFBNDDENCP-IHRRRGAJSA-N Pro-Lys-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O RMODQFBNDDENCP-IHRRRGAJSA-N 0.000 description 1
- DYMPSOABVJIFBS-IHRRRGAJSA-N Pro-Phe-Cys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N[C@@H](CS)C(=O)O DYMPSOABVJIFBS-IHRRRGAJSA-N 0.000 description 1
- AJBQTGZIZQXBLT-STQMWFEESA-N Pro-Phe-Gly Chemical compound C([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 AJBQTGZIZQXBLT-STQMWFEESA-N 0.000 description 1
- BUEIYHBJHCDAMI-UFYCRDLUSA-N Pro-Phe-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BUEIYHBJHCDAMI-UFYCRDLUSA-N 0.000 description 1
- GFHXZNVJIKMAGO-IHRRRGAJSA-N Pro-Phe-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O GFHXZNVJIKMAGO-IHRRRGAJSA-N 0.000 description 1
- XYAFCOJKICBRDU-JYJNAYRXSA-N Pro-Phe-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O XYAFCOJKICBRDU-JYJNAYRXSA-N 0.000 description 1
- KWMZPPWYBVZIER-XGEHTFHBSA-N Pro-Ser-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWMZPPWYBVZIER-XGEHTFHBSA-N 0.000 description 1
- HOJUNFDJDAPVBI-BZSNNMDCSA-N Pro-Trp-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@@H]3CCCN3 HOJUNFDJDAPVBI-BZSNNMDCSA-N 0.000 description 1
- SHTKRJHDMNSKRM-ULQDDVLXSA-N Pro-Tyr-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O SHTKRJHDMNSKRM-ULQDDVLXSA-N 0.000 description 1
- VEUACYMXJKXALX-IHRRRGAJSA-N Pro-Tyr-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O VEUACYMXJKXALX-IHRRRGAJSA-N 0.000 description 1
- QKWYXRPICJEQAJ-KJEVXHAQSA-N Pro-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@@H]2CCCN2)O QKWYXRPICJEQAJ-KJEVXHAQSA-N 0.000 description 1
- 235000003893 Prunus dulcis var amara Nutrition 0.000 description 1
- 235000006040 Prunus persica var persica Nutrition 0.000 description 1
- 101100084022 Pseudomonas aeruginosa (strain ATCC 15692 / DSM 22644 / CIP 104116 / JCM 14847 / LMG 12228 / 1C / PRS 101 / PAO1) lapA gene Proteins 0.000 description 1
- 235000014443 Pyrus communis Nutrition 0.000 description 1
- 240000001987 Pyrus communis Species 0.000 description 1
- RLLCWNUIHGPAJY-RYBZXKSASA-N Rebaudioside E Natural products O=C(O[C@H]1[C@H](O[C@H]2[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O2)[C@@H](O)[C@@H](O)[C@H](CO)O1)[C@]1(C)[C@@H]2[C@@](C)([C@@H]3[C@@]4(CC(=C)[C@@](O[C@@H]5[C@@H](O[C@@H]6[C@@H](O)[C@H](O)[C@@H](O)[C@H](CO)O6)[C@H](O)[C@@H](O)[C@H](CO)O5)(C4)CC3)CC2)CCC1 RLLCWNUIHGPAJY-RYBZXKSASA-N 0.000 description 1
- 241000589180 Rhizobium Species 0.000 description 1
- YWPVROCHNBYFTP-UHFFFAOYSA-N Rubusoside Natural products C1CC2C3(C)CCCC(C)(C(=O)OC4C(C(O)C(O)C(CO)O4)O)C3CCC2(C2)CC(=C)C21OC1OC(CO)C(O)C(O)C1O YWPVROCHNBYFTP-UHFFFAOYSA-N 0.000 description 1
- WTUJZHKANPDPIN-CIUDSAMLSA-N Ser-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N WTUJZHKANPDPIN-CIUDSAMLSA-N 0.000 description 1
- KNZQGAUEYZJUSQ-ZLUOBGJFSA-N Ser-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N KNZQGAUEYZJUSQ-ZLUOBGJFSA-N 0.000 description 1
- QPFJSHSJFIYDJZ-GHCJXIJMSA-N Ser-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CO QPFJSHSJFIYDJZ-GHCJXIJMSA-N 0.000 description 1
- YMAWDPHQVABADW-CIUDSAMLSA-N Ser-Gln-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O YMAWDPHQVABADW-CIUDSAMLSA-N 0.000 description 1
- GWMXFEMMBHOKDX-AVGNSLFASA-N Ser-Gln-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 GWMXFEMMBHOKDX-AVGNSLFASA-N 0.000 description 1
- BRGQQXQKPUCUJQ-KBIXCLLPSA-N Ser-Glu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BRGQQXQKPUCUJQ-KBIXCLLPSA-N 0.000 description 1
- GZBKRJVCRMZAST-XKBZYTNZSA-N Ser-Glu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZBKRJVCRMZAST-XKBZYTNZSA-N 0.000 description 1
- WBINSDOPZHQPPM-AVGNSLFASA-N Ser-Glu-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N)O WBINSDOPZHQPPM-AVGNSLFASA-N 0.000 description 1
- JFWDJFULOLKQFY-QWRGUYRKSA-N Ser-Gly-Phe Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JFWDJFULOLKQFY-QWRGUYRKSA-N 0.000 description 1
- ZFVFHHZBCVNLGD-GUBZILKMSA-N Ser-His-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZFVFHHZBCVNLGD-GUBZILKMSA-N 0.000 description 1
- IFPBAGJBHSNYPR-ZKWXMUAHSA-N Ser-Ile-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O IFPBAGJBHSNYPR-ZKWXMUAHSA-N 0.000 description 1
- MOINZPRHJGTCHZ-MMWGEVLESA-N Ser-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N MOINZPRHJGTCHZ-MMWGEVLESA-N 0.000 description 1
- UIPXCLNLUUAMJU-JBDRJPRFSA-N Ser-Ile-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O UIPXCLNLUUAMJU-JBDRJPRFSA-N 0.000 description 1
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 1
- GVMUJUPXFQFBBZ-GUBZILKMSA-N Ser-Lys-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GVMUJUPXFQFBBZ-GUBZILKMSA-N 0.000 description 1
- VXYQOFXBIXKPCX-BQBZGAKWSA-N Ser-Met-Gly Chemical compound CSCC[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N VXYQOFXBIXKPCX-BQBZGAKWSA-N 0.000 description 1
- AZWNCEBQZXELEZ-FXQIFTODSA-N Ser-Pro-Ser Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O AZWNCEBQZXELEZ-FXQIFTODSA-N 0.000 description 1
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 1
- VGQVAVQWKJLIRM-FXQIFTODSA-N Ser-Ser-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O VGQVAVQWKJLIRM-FXQIFTODSA-N 0.000 description 1
- DYEGLQRVMBWQLD-IXOXFDKPSA-N Ser-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CO)N)O DYEGLQRVMBWQLD-IXOXFDKPSA-N 0.000 description 1
- ZKOKTQPHFMRSJP-YJRXYDGGSA-N Ser-Thr-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZKOKTQPHFMRSJP-YJRXYDGGSA-N 0.000 description 1
- 241000589196 Sinorhizobium meliloti Species 0.000 description 1
- 108010073771 Soybean Proteins Proteins 0.000 description 1
- 235000009184 Spondias indica Nutrition 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 101100048058 Stevia rebaudiana UGT85C1 gene Proteins 0.000 description 1
- 101100048059 Stevia rebaudiana UGT85C2 gene Proteins 0.000 description 1
- 239000004376 Sucralose Substances 0.000 description 1
- 238000010459 TALEN Methods 0.000 description 1
- 235000009470 Theobroma cacao Nutrition 0.000 description 1
- 235000005764 Theobroma cacao ssp. cacao Nutrition 0.000 description 1
- 235000005767 Theobroma cacao ssp. sphaerocarpum Nutrition 0.000 description 1
- DDPVJPIGACCMEH-XQXXSGGOSA-N Thr-Ala-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DDPVJPIGACCMEH-XQXXSGGOSA-N 0.000 description 1
- KEGBFULVYKYJRD-LFSVMHDDSA-N Thr-Ala-Phe Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KEGBFULVYKYJRD-LFSVMHDDSA-N 0.000 description 1
- IRKWVRSEQFTGGV-VEVYYDQMSA-N Thr-Asn-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IRKWVRSEQFTGGV-VEVYYDQMSA-N 0.000 description 1
- PAOYNIKMYOGBMR-PBCZWWQYSA-N Thr-Asn-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O PAOYNIKMYOGBMR-PBCZWWQYSA-N 0.000 description 1
- UCCNDUPVIFOOQX-CUJWVEQBSA-N Thr-Cys-His Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 UCCNDUPVIFOOQX-CUJWVEQBSA-N 0.000 description 1
- WDFPMSHYMRBLKM-NKIYYHGXSA-N Thr-Glu-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O WDFPMSHYMRBLKM-NKIYYHGXSA-N 0.000 description 1
- BIENEHRYNODTLP-HJGDQZAQSA-N Thr-Glu-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCSC)C(=O)O)N)O BIENEHRYNODTLP-HJGDQZAQSA-N 0.000 description 1
- WBCCCPZIJIJTSD-TUBUOCAGSA-N Thr-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H]([C@@H](C)O)N WBCCCPZIJIJTSD-TUBUOCAGSA-N 0.000 description 1
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 1
- AMXMBCAXAZUCFA-RHYQMDGZSA-N Thr-Leu-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AMXMBCAXAZUCFA-RHYQMDGZSA-N 0.000 description 1
- HOVLHEKTGVIKAP-WDCWCFNPSA-N Thr-Leu-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O HOVLHEKTGVIKAP-WDCWCFNPSA-N 0.000 description 1
- UJQVSMNQMQHVRY-KZVJFYERSA-N Thr-Met-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O UJQVSMNQMQHVRY-KZVJFYERSA-N 0.000 description 1
- LVRFMARKDGGZMX-IZPVPAKOSA-N Thr-Tyr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=C(O)C=C1 LVRFMARKDGGZMX-IZPVPAKOSA-N 0.000 description 1
- OGOYMQWIWHGTGH-KZVJFYERSA-N Thr-Val-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O OGOYMQWIWHGTGH-KZVJFYERSA-N 0.000 description 1
- MNYNCKZAEIAONY-XGEHTFHBSA-N Thr-Val-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O MNYNCKZAEIAONY-XGEHTFHBSA-N 0.000 description 1
- 235000011941 Tilia x europaea Nutrition 0.000 description 1
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 235000008322 Trichosanthes cucumerina Nutrition 0.000 description 1
- KRCPXGSWDOGHAM-XIRDDKMYSA-N Trp-Lys-Asp Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O KRCPXGSWDOGHAM-XIRDDKMYSA-N 0.000 description 1
- OWSRIUBVJOQHNY-IHPCNDPISA-N Trp-Lys-His Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N OWSRIUBVJOQHNY-IHPCNDPISA-N 0.000 description 1
- OSYOKZZRVGUDMO-HSCHXYMDSA-N Trp-Lys-Ile Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OSYOKZZRVGUDMO-HSCHXYMDSA-N 0.000 description 1
- UUIYFDAWNBSWPG-IHPCNDPISA-N Trp-Lys-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N UUIYFDAWNBSWPG-IHPCNDPISA-N 0.000 description 1
- ZKVANNIVSDOQMG-HKUYNNGSSA-N Trp-Tyr-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)NCC(=O)O)N ZKVANNIVSDOQMG-HKUYNNGSSA-N 0.000 description 1
- NOOMDULIORCDNF-IRXDYDNUSA-N Tyr-Gly-Phe Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O NOOMDULIORCDNF-IRXDYDNUSA-N 0.000 description 1
- PJWCWGXAVIVXQC-STECZYCISA-N Tyr-Ile-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PJWCWGXAVIVXQC-STECZYCISA-N 0.000 description 1
- JJNXZIPLIXIGBX-HJPIBITLSA-N Tyr-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N JJNXZIPLIXIGBX-HJPIBITLSA-N 0.000 description 1
- GGXUDPQWAWRINY-XEGUGMAKSA-N Tyr-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 GGXUDPQWAWRINY-XEGUGMAKSA-N 0.000 description 1
- WTTRJMAZPDHPGS-KKXDTOCCSA-N Tyr-Phe-Ala Chemical compound C[C@H](NC(=O)[C@H](Cc1ccccc1)NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(O)=O WTTRJMAZPDHPGS-KKXDTOCCSA-N 0.000 description 1
- OKDNSNWJEXAMSU-IRXDYDNUSA-N Tyr-Phe-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)NCC(O)=O)C1=CC=C(O)C=C1 OKDNSNWJEXAMSU-IRXDYDNUSA-N 0.000 description 1
- AKKYBQGHUAWPJR-MNSWYVGCSA-N Tyr-Thr-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N)O AKKYBQGHUAWPJR-MNSWYVGCSA-N 0.000 description 1
- RVGVIWNHABGIFH-IHRRRGAJSA-N Tyr-Val-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O RVGVIWNHABGIFH-IHRRRGAJSA-N 0.000 description 1
- 101150114976 US21 gene Proteins 0.000 description 1
- 108030001452 Undecaprenyl-phosphate glucose phosphotransferases Proteins 0.000 description 1
- ASQFIHTXXMFENG-XPUUQOCRSA-N Val-Ala-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O ASQFIHTXXMFENG-XPUUQOCRSA-N 0.000 description 1
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 1
- PAPWZOJOLKZEFR-AVGNSLFASA-N Val-Arg-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N PAPWZOJOLKZEFR-AVGNSLFASA-N 0.000 description 1
- OGNMURQZFMHFFD-NHCYSSNCSA-N Val-Asn-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N OGNMURQZFMHFFD-NHCYSSNCSA-N 0.000 description 1
- AGKDVLSDNSTLFA-UMNHJUIQSA-N Val-Gln-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N AGKDVLSDNSTLFA-UMNHJUIQSA-N 0.000 description 1
- VCAWFLIWYNMHQP-UKJIMTQDSA-N Val-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N VCAWFLIWYNMHQP-UKJIMTQDSA-N 0.000 description 1
- WFENBJPLZMPVAX-XVKPBYJWSA-N Val-Gly-Glu Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O WFENBJPLZMPVAX-XVKPBYJWSA-N 0.000 description 1
- PIFJAFRUVWZRKR-QMMMGPOBSA-N Val-Gly-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O PIFJAFRUVWZRKR-QMMMGPOBSA-N 0.000 description 1
- SYOMXKPPFZRELL-ONGXEEELSA-N Val-Gly-Lys Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N SYOMXKPPFZRELL-ONGXEEELSA-N 0.000 description 1
- KZKMBGXCNLPYKD-YEPSODPASA-N Val-Gly-Thr Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O KZKMBGXCNLPYKD-YEPSODPASA-N 0.000 description 1
- CHWRZUGUMAMTFC-IHRRRGAJSA-N Val-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CNC=N1 CHWRZUGUMAMTFC-IHRRRGAJSA-N 0.000 description 1
- ZHQWPWQNVRCXAX-XQQFMLRXSA-N Val-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZHQWPWQNVRCXAX-XQQFMLRXSA-N 0.000 description 1
- YLRAFVVWZRSZQC-DZKIICNBSA-N Val-Phe-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YLRAFVVWZRSZQC-DZKIICNBSA-N 0.000 description 1
- ZXYPHBKIZLAQTL-QXEWZRGKSA-N Val-Pro-Asp Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N ZXYPHBKIZLAQTL-QXEWZRGKSA-N 0.000 description 1
- KSFXWENSJABBFI-ZKWXMUAHSA-N Val-Ser-Asn Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KSFXWENSJABBFI-ZKWXMUAHSA-N 0.000 description 1
- VIKZGAUAKQZDOF-NRPADANISA-N Val-Ser-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O VIKZGAUAKQZDOF-NRPADANISA-N 0.000 description 1
- UGFMVXRXULGLNO-XPUUQOCRSA-N Val-Ser-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O UGFMVXRXULGLNO-XPUUQOCRSA-N 0.000 description 1
- MNSSBIHFEUUXNW-RCWTZXSCSA-N Val-Thr-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N MNSSBIHFEUUXNW-RCWTZXSCSA-N 0.000 description 1
- VTIAEOKFUJJBTC-YDHLFZDLSA-N Val-Tyr-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VTIAEOKFUJJBTC-YDHLFZDLSA-N 0.000 description 1
- JSOXWWFKRJKTMT-WOPDTQHZSA-N Val-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N JSOXWWFKRJKTMT-WOPDTQHZSA-N 0.000 description 1
- 241000219977 Vigna Species 0.000 description 1
- 241000219094 Vitaceae Species 0.000 description 1
- 235000009754 Vitis X bourquina Nutrition 0.000 description 1
- 235000012333 Vitis X labruscana Nutrition 0.000 description 1
- TVXBFESIOXBWNM-UHFFFAOYSA-N Xylitol Natural products OCCC(O)C(O)C(O)CCO TVXBFESIOXBWNM-UHFFFAOYSA-N 0.000 description 1
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 1
- 241001247821 Ziziphus Species 0.000 description 1
- 244000126002 Ziziphus vulgaris Species 0.000 description 1
- 241000606834 [Haemophilus] ducreyi Species 0.000 description 1
- 235000010358 acesulfame potassium Nutrition 0.000 description 1
- 229960004998 acesulfame potassium Drugs 0.000 description 1
- 239000000619 acesulfame-K Substances 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 239000013543 active substance Substances 0.000 description 1
- 235000019453 advantame Nutrition 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 description 1
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 108010087924 alanylproline Proteins 0.000 description 1
- 125000003158 alcohol group Chemical group 0.000 description 1
- 235000013334 alcoholic beverage Nutrition 0.000 description 1
- 150000001299 aldehydes Chemical class 0.000 description 1
- VFRROHXSMXFLSN-KCDKBNATSA-N aldehydo-D-galactose 6-phosphate Chemical compound OP(=O)(O)OC[C@@H](O)[C@H](O)[C@H](O)[C@@H](O)C=O VFRROHXSMXFLSN-KCDKBNATSA-N 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000003698 anagen phase Effects 0.000 description 1
- 238000004873 anchoring Methods 0.000 description 1
- 230000003110 anti-inflammatory effect Effects 0.000 description 1
- 235000006708 antioxidants Nutrition 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 239000003125 aqueous solvent Substances 0.000 description 1
- 108010038850 arginyl-isoleucyl-tyrosine Proteins 0.000 description 1
- 108010062796 arginyllysine Proteins 0.000 description 1
- 239000000605 aspartame Substances 0.000 description 1
- 235000010357 aspartame Nutrition 0.000 description 1
- IAOZJIPTCAWIRG-QWRGUYRKSA-N aspartame Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)OC)CC1=CC=CC=C1 IAOZJIPTCAWIRG-QWRGUYRKSA-N 0.000 description 1
- 229960003438 aspartame Drugs 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 235000013405 beer Nutrition 0.000 description 1
- 238000011138 biotechnological process Methods 0.000 description 1
- 235000008429 bread Nutrition 0.000 description 1
- 239000004067 bulking agent Substances 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 235000001046 cacaotero Nutrition 0.000 description 1
- 235000013736 caramel Nutrition 0.000 description 1
- 150000001720 carbohydrates Chemical group 0.000 description 1
- 235000012174 carbonated soft drink Nutrition 0.000 description 1
- 235000021466 carotenoid Nutrition 0.000 description 1
- 150000001747 carotenoids Chemical class 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 230000006037 cell lysis Effects 0.000 description 1
- 230000003822 cell turnover Effects 0.000 description 1
- 235000013339 cereals Nutrition 0.000 description 1
- 235000019219 chocolate Nutrition 0.000 description 1
- 238000011210 chromatographic step Methods 0.000 description 1
- 235000019504 cigarettes Nutrition 0.000 description 1
- 235000017803 cinnamon Nutrition 0.000 description 1
- AGOYDEPGAOXOCK-KCBOHYOISA-N clarithromycin Chemical compound O([C@@H]1[C@@H](C)C(=O)O[C@@H]([C@@]([C@H](O)[C@@H](C)C(=O)[C@H](C)C[C@](C)([C@H](O[C@H]2[C@@H]([C@H](C[C@@H](C)O2)N(C)C)O)[C@H]1C)OC)(C)O)CC)[C@H]1C[C@@](C)(OC)[C@@H](O)[C@H](C)O1 AGOYDEPGAOXOCK-KCBOHYOISA-N 0.000 description 1
- 230000004186 co-expression Effects 0.000 description 1
- 235000013353 coffee beverage Nutrition 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000010924 continuous production Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 239000006071 cream Substances 0.000 description 1
- 235000021438 curry Nutrition 0.000 description 1
- 229940109275 cyclamate Drugs 0.000 description 1
- 108010016616 cysteinylglycine Proteins 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 235000014113 dietary fatty acids Nutrition 0.000 description 1
- 235000013325 dietary fiber Nutrition 0.000 description 1
- 108010054813 diprotin B Proteins 0.000 description 1
- 238000004090 dissolution Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 235000011869 dried fruits Nutrition 0.000 description 1
- 238000010410 dusting Methods 0.000 description 1
- 230000002526 effect on cardiovascular system Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 235000019414 erythritol Nutrition 0.000 description 1
- UNXHWFMMPAWVPI-ZXZARUISSA-N erythritol Chemical compound OC[C@H](O)[C@H](O)CO UNXHWFMMPAWVPI-ZXZARUISSA-N 0.000 description 1
- 229940009714 erythritol Drugs 0.000 description 1
- 150000002148 esters Chemical class 0.000 description 1
- 238000013401 experimental design Methods 0.000 description 1
- 239000013604 expression vector Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000003925 fat Substances 0.000 description 1
- 235000019210 fat mimetic Nutrition 0.000 description 1
- 229930195729 fatty acid Natural products 0.000 description 1
- 239000000194 fatty acid Substances 0.000 description 1
- 150000004665 fatty acids Chemical class 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 235000013332 fish product Nutrition 0.000 description 1
- 125000003709 fluoroalkyl group Chemical group 0.000 description 1
- 235000012041 food component Nutrition 0.000 description 1
- 235000019264 food flavour enhancer Nutrition 0.000 description 1
- 239000005417 food ingredient Substances 0.000 description 1
- 238000001640 fractional crystallisation Methods 0.000 description 1
- 239000003205 fragrance Substances 0.000 description 1
- 235000021022 fresh fruits Nutrition 0.000 description 1
- 235000013611 frozen food Nutrition 0.000 description 1
- 235000012055 fruits and vegetables Nutrition 0.000 description 1
- 229930182830 galactose Natural products 0.000 description 1
- FJEKYHHLGZLYAT-FKUIBCNASA-N galp Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC=1N=CNC=1)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(N)=O)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CO)C(O)=O)[C@@H](C)CC)[C@@H](C)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](NC(=O)[C@H]1N(CCC1)C(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)CNC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)CNC(=O)CNC(=O)[C@H](CCCNC(N)=N)NC(=O)CNC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC=1N=CNC=1)NC(=O)[C@H](C)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](C)N)[C@@H](C)O)C(C)C)C1=CNC=N1 FJEKYHHLGZLYAT-FKUIBCNASA-N 0.000 description 1
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 1
- 239000003349 gelling agent Substances 0.000 description 1
- 235000021474 generally recognized As safe (food) Nutrition 0.000 description 1
- 235000021473 generally recognized as safe (food ingredients) Nutrition 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 108010080575 glutamyl-aspartyl-alanine Proteins 0.000 description 1
- 150000004676 glycans Chemical class 0.000 description 1
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 1
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 1
- 108010089804 glycyl-threonine Proteins 0.000 description 1
- 108010077515 glycylproline Proteins 0.000 description 1
- 235000002532 grape seed extract Nutrition 0.000 description 1
- 235000021021 grapes Nutrition 0.000 description 1
- PFOARMALXZGCHY-UHFFFAOYSA-N homoegonol Natural products C1=C(OC)C(OC)=CC=C1C1=CC2=CC(CCCO)=CC(OC)=C2O1 PFOARMALXZGCHY-UHFFFAOYSA-N 0.000 description 1
- 230000006801 homologous recombination Effects 0.000 description 1
- 238000002744 homologous recombination Methods 0.000 description 1
- 235000015243 ice cream Nutrition 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 230000004941 influx Effects 0.000 description 1
- 229910052500 inorganic mineral Inorganic materials 0.000 description 1
- 235000021539 instant coffee Nutrition 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- 150000002540 isothiocyanates Chemical class 0.000 description 1
- 235000015110 jellies Nutrition 0.000 description 1
- 239000008274 jelly Substances 0.000 description 1
- 235000008960 ketchup Nutrition 0.000 description 1
- BJHIKXHVCXFQLS-PQLUHFTBSA-N keto-D-tagatose Chemical compound OC[C@@H](O)[C@H](O)[C@H](O)C(=O)CO BJHIKXHVCXFQLS-PQLUHFTBSA-N 0.000 description 1
- 238000004898 kneading Methods 0.000 description 1
- 150000002605 large molecules Chemical class 0.000 description 1
- 239000004571 lime Substances 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 108010045397 lysyl-tyrosyl-lysine Proteins 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 235000010746 mayonnaise Nutrition 0.000 description 1
- 239000008268 mayonnaise Substances 0.000 description 1
- 235000013372 meat Nutrition 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 229940127554 medical product Drugs 0.000 description 1
- HEBKCHPVOIAQTA-UHFFFAOYSA-N meso ribitol Natural products OCC(O)C(O)C(O)CO HEBKCHPVOIAQTA-UHFFFAOYSA-N 0.000 description 1
- 239000002207 metabolite Substances 0.000 description 1
- 239000011707 mineral Substances 0.000 description 1
- 235000010755 mineral Nutrition 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 235000019426 modified starch Nutrition 0.000 description 1
- TVJXHJAWHUMLLG-UHFFFAOYSA-N mogroside V Natural products CC(CCC(OC1OC(COC2OC(CO)C(O)C(O)C2OC3OC(CO)C(O)C(O)C3O)C(O)C(O)C1O)C(C)(C)O)C4CCC5(C)C6CC=C7C(CCC(OC8OC(COC9OC(CO)C(O)C(O)C9O)C(O)C(O)C8O)C7(C)C)C6(C)C(O)CC45C TVJXHJAWHUMLLG-UHFFFAOYSA-N 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 150000002772 monosaccharides Chemical class 0.000 description 1
- ITVGXXMINPYUHD-CUVHLRMHSA-N neohesperidin dihydrochalcone Chemical compound C1=C(O)C(OC)=CC=C1CCC(=O)C(C(=C1)O)=C(O)C=C1O[C@H]1[C@H](O[C@H]2[C@@H]([C@H](O)[C@@H](O)[C@H](C)O2)O)[C@@H](O)[C@H](O)[C@@H](CO)O1 ITVGXXMINPYUHD-CUVHLRMHSA-N 0.000 description 1
- 229940089953 neohesperidin dihydrochalcone Drugs 0.000 description 1
- 235000010434 neohesperidine DC Nutrition 0.000 description 1
- 108010070257 neotame Proteins 0.000 description 1
- 235000019412 neotame Nutrition 0.000 description 1
- HLIAVLHNDJUHFG-HOTGVXAUSA-N neotame Chemical compound CC(C)(C)CCN[C@@H](CC(O)=O)C(=O)N[C@H](C(=O)OC)CC1=CC=CC=C1 HLIAVLHNDJUHFG-HOTGVXAUSA-N 0.000 description 1
- 239000002773 nucleotide Substances 0.000 description 1
- 125000003729 nucleotide group Chemical group 0.000 description 1
- 239000002417 nutraceutical Substances 0.000 description 1
- 235000021436 nutraceutical agent Nutrition 0.000 description 1
- 235000016709 nutrition Nutrition 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- PXQPEWDEAKTCGB-UHFFFAOYSA-N orotic acid Chemical compound OC(=O)C1=CC(=O)NC(=O)N1 PXQPEWDEAKTCGB-UHFFFAOYSA-N 0.000 description 1
- 239000008194 pharmaceutical composition Substances 0.000 description 1
- 150000002989 phenols Chemical class 0.000 description 1
- 108010024607 phenylalanylalanine Proteins 0.000 description 1
- 108010073101 phenylalanylleucine Proteins 0.000 description 1
- 101150009573 phoA gene Proteins 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 108091000115 phosphomannomutase Proteins 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 239000003075 phytoestrogen Substances 0.000 description 1
- 229940068065 phytosterols Drugs 0.000 description 1
- CDRPUGZCRXZLFL-OWOJBTEDSA-N piceatannol Chemical compound OC1=CC(O)=CC(\C=C\C=2C=C(O)C(O)=CC=2)=C1 CDRPUGZCRXZLFL-OWOJBTEDSA-N 0.000 description 1
- 238000005554 pickling Methods 0.000 description 1
- 235000002378 plant sterols Nutrition 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 229920005862 polyol Polymers 0.000 description 1
- 150000003077 polyols Chemical class 0.000 description 1
- 229920001451 polypropylene glycol Polymers 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 230000003389 potentiating effect Effects 0.000 description 1
- 235000008476 powdered milk Nutrition 0.000 description 1
- 235000013406 prebiotics Nutrition 0.000 description 1
- 239000003755 preservative agent Substances 0.000 description 1
- 239000006041 probiotic Substances 0.000 description 1
- 235000018291 probiotics Nutrition 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 108010031719 prolyl-serine Proteins 0.000 description 1
- 108010090894 prolylleucine Proteins 0.000 description 1
- 230000006920 protein precipitation Effects 0.000 description 1
- 235000011962 puddings Nutrition 0.000 description 1
- 101150116440 pyrF gene Proteins 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- RLLCWNUIHGPAJY-SFUUMPFESA-N rebaudioside E Chemical compound O([C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1O[C@]12C(=C)C[C@@]3(C1)CC[C@@H]1[C@@](C)(CCC[C@]1([C@@H]3CC2)C)C(=O)O[C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O[C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O)[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O RLLCWNUIHGPAJY-SFUUMPFESA-N 0.000 description 1
- 238000003259 recombinant expression Methods 0.000 description 1
- 238000007670 refining Methods 0.000 description 1
- 101150052269 rfaJ gene Proteins 0.000 description 1
- 101150112345 rfbA gene Proteins 0.000 description 1
- 101150053136 rffH gene Proteins 0.000 description 1
- 101150099889 rmlA gene Proteins 0.000 description 1
- 102200044934 rs28931588 Human genes 0.000 description 1
- YWPVROCHNBYFTP-OSHKXICASA-N rubusoside Chemical compound O([C@]12C(=C)C[C@@]3(C1)CC[C@@H]1[C@@](C)(CCC[C@]1([C@@H]3CC2)C)C(=O)O[C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O)[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O YWPVROCHNBYFTP-OSHKXICASA-N 0.000 description 1
- 235000019204 saccharin Nutrition 0.000 description 1
- CVHZOJJKTDOEJC-UHFFFAOYSA-N saccharin Chemical compound C1=CC=C2C(=O)NS(=O)(=O)C2=C1 CVHZOJJKTDOEJC-UHFFFAOYSA-N 0.000 description 1
- 229940081974 saccharin Drugs 0.000 description 1
- 239000000901 saccharin and its Na,K and Ca salt Substances 0.000 description 1
- 229930182490 saponin Natural products 0.000 description 1
- 235000017709 saponins Nutrition 0.000 description 1
- 150000007949 saponins Chemical class 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 239000012047 saturated solution Substances 0.000 description 1
- 235000015067 sauces Nutrition 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 235000014214 soft drink Nutrition 0.000 description 1
- 238000001179 sorption measurement Methods 0.000 description 1
- 235000014347 soups Nutrition 0.000 description 1
- 229940001941 soy protein Drugs 0.000 description 1
- 238000005507 spraying Methods 0.000 description 1
- 239000003381 stabilizer Substances 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 235000019408 sucralose Nutrition 0.000 description 1
- BAQAVOSOZGMPRM-QBMZZYIRSA-N sucralose Chemical compound O[C@@H]1[C@@H](O)[C@@H](Cl)[C@@H](CO)O[C@@H]1O[C@@]1(CCl)[C@@H](O)[C@H](O)[C@@H](CCl)O1 BAQAVOSOZGMPRM-QBMZZYIRSA-N 0.000 description 1
- 150000005846 sugar alcohols Chemical class 0.000 description 1
- 235000019605 sweet taste sensations Nutrition 0.000 description 1
- 239000006188 syrup Substances 0.000 description 1
- 235000020357 syrup Nutrition 0.000 description 1
- 235000007586 terpenes Nutrition 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 239000002562 thickening agent Substances 0.000 description 1
- 150000003568 thioethers Chemical class 0.000 description 1
- 150000003573 thiols Chemical class 0.000 description 1
- 108010071097 threonyl-lysyl-proline Proteins 0.000 description 1
- 235000019505 tobacco product Nutrition 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 108010035534 tyrosyl-leucyl-alanine Proteins 0.000 description 1
- 108010051110 tyrosyl-lysine Proteins 0.000 description 1
- 238000010977 unit operation Methods 0.000 description 1
- 108091000036 uracil phosphoribosyltransferase Proteins 0.000 description 1
- 239000008371 vanilla flavor Substances 0.000 description 1
- 239000011782 vitamin Substances 0.000 description 1
- 235000013343 vitamin Nutrition 0.000 description 1
- 229930003231 vitamin Natural products 0.000 description 1
- 229940088594 vitamin Drugs 0.000 description 1
- 150000003722 vitamin derivatives Chemical class 0.000 description 1
- 235000013522 vodka Nutrition 0.000 description 1
- 108010027345 wheylin-1 peptide Proteins 0.000 description 1
- 235000014101 wine Nutrition 0.000 description 1
- 239000000811 xylitol Substances 0.000 description 1
- 235000010447 xylitol Nutrition 0.000 description 1
- HEBKCHPVOIAQTA-SCDXWVJYSA-N xylitol Chemical compound OC[C@H](O)[C@@H](O)[C@H](O)CO HEBKCHPVOIAQTA-SCDXWVJYSA-N 0.000 description 1
- 229960002675 xylitol Drugs 0.000 description 1
- 101150002814 yidA gene Proteins 0.000 description 1
- 101150042919 yigL gene Proteins 0.000 description 1
- 101150101338 yihX gene Proteins 0.000 description 1
- 235000008924 yoghurt drink Nutrition 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/44—Preparation of O-glycosides, e.g. glucosides
- C12P19/60—Preparation of O-glycosides, e.g. glucosides having an oxygen of the saccharide radical directly bound to a non-saccharide heterocyclic ring or a condensed ring system containing a non-saccharide heterocyclic ring, e.g. coumermycin, novobiocin
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/44—Preparation of O-glycosides, e.g. glucosides
- C12P19/56—Preparation of O-glycosides, e.g. glucosides having an oxygen atom of the saccharide radical directly bound to a condensed ring system having three or more carbocyclic rings, e.g. daunomycin, adriamycin
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1048—Glycosyltransferases (2.4)
- C12N9/1051—Hexosyltransferases (2.4.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1048—Glycosyltransferases (2.4)
- C12N9/1051—Hexosyltransferases (2.4.1)
- C12N9/1062—Sucrose synthase (2.4.1.13)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/90—Isomerases (5.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/18—Preparation of compounds containing saccharide radicals produced by the action of a glycosyl transferase, e.g. alpha-, beta- or gamma-cyclodextrins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y204/00—Glycosyltransferases (2.4)
- C12Y204/01—Hexosyltransferases (2.4.1)
- C12Y204/01017—Glucuronosyltransferase (2.4.1.17)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y503/00—Intramolecular oxidoreductases (5.3)
- C12Y503/01—Intramolecular oxidoreductases (5.3) interconverting aldoses and ketoses (5.3.1)
- C12Y503/01009—Glucose-6-phosphate isomerase (5.3.1.9)
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Biomedical Technology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Medicinal Chemistry (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Plant Pathology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Enzymes And Modification Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Saccharide Compounds (AREA)
Abstract
다양한 양태 및 구현예에서, 본 개시 내용은 당화 생성물의 제조 방법, 뿐만 아니라 이에 유용한 박테리아 세포 및 우리딘 디포스페이트(UDP)-의존성 당전이(UGT) 효소를 제공한다. 다른 양태 및 구현예에서, 본 개시 내용은 미생물 배양물 또는 무세포 반응물로부터 이러한 글리코시드 생성물을 고수율 및/또는 고순도로 회수하는 방법을 제공한다. 다양한 양태 및 구현예에서, 본 개시 내용은 원하는 기질의 당화 및/또는 당화 생성물의 고수율 및/또는 고순도 회수와 관련된 전세포 생물전환 공정을 제공한다.
Description
소분자의 당전이효소(Glycosyltransferase)는 식물계에서 큰 다중유전자 패밀리에 의해 암호화된다. 이 효소는 뉴클레오티드의 당으로부터 매우 다양한 2차 대사산물로 당을 전이시켜, 수용체 분자의 물리적 및 화학적 특성들을 변화시킨다. 예를 들어, 스테비올 글리코시드(steviol glycoside)는 남아메리카 특정 지역이 원산지인 엉거시과(Asteraceae)(국화과(Compositae))의 다년생 관목, 스테비아 레바우디아나 베르토니(Stevia Rebaudiana Bertoni)의 잎에서 발견된 화합물의 부류이다. 이들은 구조적으로 코어 테르페노이드(terpenoid), 스테비올을 갖는 특징이 있으며, 위치 C13 및 C19의 탄수화물 잔기의 존재에서 차이가 난다. 이들은 스테비아의 잎에 축적되며, 총 건조 중량의 대략 10% 내지 20%를 구성한다. 건조 중량 기준으로, 스테비아의 잎에서 발견된 4 개의 주요 글리코시드는 전형적으로 스테비오시드(stevioside), 레바우디오시드(rebaudioside) A, 레바우디오시드 C 및 둘코시드(dulcoside) A를 포함한다. 다른 스테비올 글리코시드들은 소량 또는 미량으로 존재하는데, 레바우디오시드 B, D, E, F, G, H, I, J, K, L, M 및 O, 둘코시드 B, 스테비올비오시드(steviolbioside) 및 루부소시드(rubusoside)를 포함한다.
소량의 당화 생성물(glycosylated product), 레바우디오시드 M(RebM)은 수크로스보다 약 200-350 배 더 강력한 것으로 추정되며, 뒷맛이 약간 쓰거나 감초(licorice)와 같은 가공된 깨끗한 단 맛으로 설명된다. 문헌[Prakash I. 등, Development of Next Generation Stevia Sweetener: Rebaudioside M, Foods 3(1), 162-175 (2014)]. RebM에 대해 전세계 식품 산업에서 큰 관심을 갖고 있지만, 스테비아 추출물 중 그 분포(prevalence)가 적어서 혁신적인 합성 공정이 필요하다.
다른 예로서, 모그로시드(mogroside)는 박과(Cucurbitaceae) 식물인 시라이티아 그로스베노리(Siraitia grosvenorii)(나한과 (monkfruit 또는 Luo Han Guo)로도 알려짐)의 과실에서 발견된 트리테르펜-계의 특수 2차 대사산물이다. 과실에서의 이들의 생합성은 아글리콘 모그롤(aglycone mogrol)의 수많은 연속 당화와 관련된다. 삭품 산업에서, 모그로시드 식물 추출물은 천연 비-당 식품 감미제로서 점점 더 많이 사용되고 있다. 예를 들어, 모그로시드 V(mog. V)는 수크로스의 ~250 배의 감미 능력을 갖는다(Kasai 등, Agric Biol Chem (1989)). 게다가, 모그로시드의 추가적인 건강상의 이점이 확인되기도 했었다(Li 등, Chin J Nat Med (2014)).
정제 Mog. V는 일본에서 고-강도 감미제로서 승인받았고, 그 추출물은 미국에서 비-영양성 감미제 및 향 개선제로서 GRAS 자격을 얻었다. 과일에서 모그로시드를 추출하면, 종종 원치않는 뒷맛을 수반한 순도한 다양한 생성물을 얻을 수 있다. 또한, 재배한 과실로부터의 모그로시드의 수율은, 낮은 식물 수율과 식물의 특정 재배 요건 때문에 제한된다. 모그로시드는 신선한 과일에는 약 1%로 존재하고, 건조 과일에는 약 4%로 존재한다. Mog. V는 건조 과일에서 0.5% 내지 1.4%의 함량을 갖는 주요 성분이다. 게다가, 정제의 어려움은 Mog. V의 순도에 제한을 두어, 식물 추출물로부터 얻은 상업적인 제품은 약 50%의 Mog. V를 갖도록 규격화된다. 순수한 Mog. V 제품은 블렌드보다 더 큰 상업적 성공을 거둘 것인데, 그 이유는 향이 날아갈 가능성이 낮고, 제품으로 제형화하기가 더 용이하며, 용해 가능성이 양호하기 때문이다. 따라서, 생물공학적 공정을 통해 달콤한 모그로시드 화합물을 생산하는 것이 유리하다.
천연 식물 추출물에서는 소량의 생성물인 것들을 포함한, 가치가 높은 글리코시드를 생산하기 위한 경제적 방법이 필요하다.
본 발명의 개요
다양한 양태 및 구현예에서, 본 개시 내용은 당화 생성물의 제조 방법, 뿐만 아니라 이에 유용한 박테리아 세포 및 우리딘 디포스페이트(UDP)-의존성 당전이(UGT) 효소를 제공한다. 다른 양태 및 구현예에서, 본 개시 내용은 미생물 배양물 또는 무세포 반응물로부터 글리코시드 생성물을 고수율 및/또는 고순도로 회수하는 방법을 제공한다. 다양한 양태 및 구현예에서, 본 개시 내용은 원하는 기질을 당화시킨 후, 당화 생성물을 고수율 및/또는 고순도로 회수하는 것과 관련된 전세포 생물전환(whole cell bioconsersion) 공정을 제공한다.
일 양태에서, 본 발명은 당화 생성물을 제조하기 위한 박테리아 세포 및 방법을 제공한다. 특히, 본 개시내용은 전세포의 생물전환 공정에 따라 원하는 기질을 당화시키기 위한 하나 이상의 UGT 효소를 발현하는 박테리아 세포를 제공한다. 일부 구현예에서, 박테리아 세포는 하나 이상의 재조합 수크로스 합성효소(synthase)를 발현한다. 수크로스 합성효소의 발현은 공급된 기질의 전세포 당화를 극적으로 향상시킬 수 있다. 대안적으로 또는 추가로, 미생물 세포에는 UDP-당의 이용가능성을 증가시키는 하나 이상의 유전자 변형이 포함된다. 박테리아 세포는 당화용 기질(substrate for glycosylation)의 존재 하에서 배양되고, 당화 생성물은 선택적으로 본원에 기재된 회수 공정을 사용하여 회수된다.
전세포 생물전환 시스템은 세포가 UDP-당 보조인자를 재생하므로, 무-세포 시스템에 비해 유리하다. 본 발명의 구현예에서, 촉매화(당화)는 살아있는 박테리아 세포에서 수행되며, UDP-포도당 보조인자의 재활용은 UDP-포도당 재생을 위한 효소를 공급하거나 값비싼 기질을 공급할 필요없이 세포 대사를 사용하여 일어난다. E. 콜리(coli)를 포함한 다양한 박테리아 종들이 본 개시 내용에 사용된다.
일부 구현예에서, 박테리아 세포는 재조합 수크로스 합성효소를 발현하고, 박테리아 세포는 수크로스의 존재 하에서 배양될 수 있다. 일부 구현예에서, 수크로스 합성효소는 서열 번호: 1 내지 12로부터 선택된 아미노산 서열과 적어도 약 70%의 서열 동일성을 갖는 아미노산 서열을 포함한다.
일부 구현예에서, 미생물 세포는 UDP-포도당의 이용가능성을 증가시키는 하나 이상의 유전자 변형, 예컨대 UDP-포도당을 소모하는 효소를 암호화하는 유전자의 결실, 불활성화, 또는 활성 또는 발현의 감소를 갖는다. 제거하거나 없앨 수 있는 다른 UDP-포도당 싱크(sink)는, 지질의 당화 및 LPS 생합성에 관여하는 유전자, 및 운데카프레닐-디포스페이트(UPP)를 당화시키는데 관여하는 유전자의 제거, 또는 활성 또는 발현의 감소를 포함한다. 이러한 구현예 및 다른 구현예에서, 박테리아 세포는 전구체를 UDP-포도당으로 소모하는 효소를 암호화하는 유전자의 결실, 불활성화, 또는 활성 또는 발현의 감소를 갖는다. 이러한 구현예 및 다른 구현예에서, 세포는 포도당-6-포스페이트를 UDP-포도당으로 전환시키는데 관여하는 효소를 암호화하는 하나 이상의 유전자의 과다 발현, 또는 이의 활성 증가를 갖는다. 대안적으로 또는 추가로, 미생물 세포에는 포도당의 수송을 증가시키는 유전자 변형이 하나 이상 있을 수 있다. 대안적으로 또는 추가로, 미생물 세포에는 UTP의 생산 및 재활용을 증가시키는 유전자 변형이 하나 이상 있을 수 있다. 대안적으로 또는 추가로, 미생물 세포에는 UDP 생산을 증가시키는 유전자 변형이 하나 이상 있다. 대안적으로 또는 추가로, 미생물 세포에는 포도당 흡수의 조절을 제거하거나 감소시키는 유전자 변형이 하나 이상 있다. 대안적으로 또는 추가로, 미생물 세포에는 포도당-1-포스페이트의 탈인산화를 감소시키는 유전자 변형이 하나 이상 있다. 대안적으로 또는 추가로, 미생물 세포에는 포도당-1-포스페이트의 TDP-포도당으로의 전환을 감소시키는 유전자 변형이 하나 이상 있다. 대안적으로 또는 추가로, 미생물 세포에는 포도당-1-포스페이트로부터 ADP-포도당으로의 전환을 감소시키는 유전자 변형이 하나 이상 있다.
다양한 구현예에서, 당화용 기질은 식물 추출물 또는 이의 분획으로 제공되거나, 합성이나 생합성 공정에 의해 생산된다. 예시적인 기질은 다양한 2차 대사산물, 예컨대 테르페노이드 또는 테르페노이드 글리코시드, 플라보노이드 또는 플라보노이드 글리코시드, 칸나비노이드 또는 칸나비노이드 글리코시드, 폴리케티드 또는 폴리케티드 글리코시드, 스틸베노이드 또는 스틸베노이드 글리코시드, 및 폴리페놀 또는 폴리페놀 글리코시드로부터 선택된 것들을 포함한다. 식물 추출물은 분획화되거나, 아니면 원하는 기질이 풍부할 수 있다. 일부 구현예에서, 기질은 테르페노이드 글리코시드, 예컨대 스테비올 또는 스테비올 글리코시드, 또는 모그롤 또는 모그롤 글리코시드를 포함한다. UGT 효소뿐만 아니라 (원하는 기질이 풍부한 분획으로 포함된) 관련 기질을 선택하여, 원하는 당화 생성물을 생산할 수 있다. 일부 구현예에서, 당화 생성물은 그 중에서도 하나 이상의 스테비올 글리코시드, 예컨대 RebM, RebE, RebD, RebB 및/또는 RebI, 또는 모그롤 글리코시드, 예컨대 mog. IV, mog. IVA, mog. V, mog. VI, isomog. V 및/또는 시아메노시드를 포함한다.
다른 양태 및 구현예에서, 본 발명은 테르페노이드 글리코시드 기질을 포함한, 본원에 기재된 박테리아 세포 및 방법과 관련된 기질의 당화 생산성이 높은 조작된 UDP-의존성 당전이(UGT) 효소를 제공한다. 일부 구현예에서, 상기 조작된 UGT 효소는 서열 번호: 13과 적어도 약 70%의 서열 동일성을 갖고, 테르페노이드 글리코시드 기질(예를 들어, 스테비올 글리코시드 기질)에 대한 당화 활성을 개선시키는 아미노산 치환을 하나 이상 갖는 아미노산 서열을 포함한다. 다른 구현예에서, 상기 UGT 효소는 서열 번호: 14와 적어도 약 70%의 서열 동일성을 갖고, 테르페노이드 글리코시드 기질(예를 들어, 스테비올 글리코시드 기질)에 대한 당화 활성을 개선시키는 아미노산 치환을 하나 이상 갖는 아미노산 서열을 포함한다. 또 다른 구현예에서, 상기 UGT 효소는 서열 번호: 15와 적어도 약 70%의 서열 동일성을 갖고, 테르페노이드 글리코시드 기질(예를 들어, 스테비올 글리코시드 기질)에 대한 당화 활성을 개선시키는 아미노산 치환을 하나 이상 갖는 아미노산 서열을 포함한다.
다른 양태 및 구현예에서, 본 발명은 모그롤 또는 모그롤 글리코시드 기질의 당화를 위한 UGT 효소(이를 발현하는 미생물 세포 포함)를 제공한다. 이러한 양태 및 구현예에서, 상기 방법은 기질을 UDP-당의 존재 하에 UGT 효소와 접촉시키는 단계를 포함한다. UGT 효소는 이하의 것들로부터 선택된 아미노산 서열과 적어도 약 80%의 서열 동일성을 갖는 아미노산 서열을 포함한다: 서열 번호: 84, 서열 번호: 80, 서열 번호: 46, 서열 번호: 83, 서열 번호: 82, 서열 번호: 73, 서열 번호: 72, 서열 번호: 78, 서열 번호: 54, 서열 번호: 74, 서열 번호: 75, 서열 번호: 76, 서열 번호: 13, 서열 번호: 14, 서열 번호: 15, 서열 번호: 16, 서열 번호: 29 및 서열 번호: 79. 이러한 구현예에서, 모그롤 또는 모그롤 글리코시드 기질은 식물 추출물 또는 이의 분획, 예컨대 나한과 추출물 또는 이의 분획으로 제공될 수 있다. 예를 들어, 기질은 모그롤, mog. I-A, mog. I-E, mog. II-A, mog. II-E, mog III, mog IVA, mog. IV 및 시아메노시드로부터 선택된 기질을 하나 이상 포함하거나, 또는 이것이 풍부할 수 있다. 일부 구현예에서, 당화 생성물은 mog. IV, mog. IVA, mog. V, mog. VI, isomog V 및 시아메노시드 중 하나 이상을 포함할 수 있다. 다양한 구현예에서, UGT 효소는 모그롤 코어의 C3 및 C24 하이드록실에서의 1 차 당화와, C3 및/또는 C24 1 차 글리코실 기의 1-2 및 1-6 분지형 당화가 가능할 수 있다.
모그롤 글리코시드의 생산에 대한 일부 구현예에서, 기질은 UGT 효소를 발현하는 세포와 함께 배양된다. 예시적인 미생물 세포는 본원에 기재된 전세포 생물전환 공정에 맞게 조작된 박테리아 세포를 포함한다. 다른 구현예에서, 미생물 세포는 효모 세포이다. 그러나, 또 다른 구현예에서, 기질은 UGT 효소를 포함한 세포 용해물과 함께 인큐베이션되거나, 공지의 기술에 의해 정제된 재조합 UGT 효소와 함께 인큐베이션된다.
일부 양태에서, 본 발명은 글리코시드 생성물의 생산 및 회수 방법을 제공한다. 이러한 구현예에서, 상기 방법은 무-세포 반응물 또는 미생물 배양물에서, 하나 이상의 당 모이어티의 효소적 전이에 의해 당화용 기질을 목표 글리코시드 생성물로 전환시키는 단계를 포함하는데, 이는 선택적으로 본원에 기재된 방법, UGT 효소 및/또는 미생물 균주를 이용할 수 있다. 상기 방법은 반응 및 배양물으로부터 글리코시드 생성물을 회수하는 단계를 추가로 포함하되, 상기 회수 단계는 반응물 또는 배양물의 pH를 약 pH 5 미만으로 또는 pH 10 초과로 조절하는 단계, 온도를 적어도 약 50℃까지 상승시키는 단계, 및 하나 이상의 글리코시드 가용화제를 첨가하는 단계 중 하나 이상; 및 이후의 효소 또는 바이오매스의 제거 단계를 포함한다.
기존에, 바이오매스의 제거는 큰 세포 찌꺼기를 제거하고, 하류의 정제를 복잡하게 만들 세포의 파괴를 피하기 위한 회수의 제1 단계이다. 그러나, 본 발명의 구현예에 의하면, 배양 물질은 점도가 매우 높아서, 처리에 어려움이 있다. 바이오매스 또는 효소를 제거하기 전에 본원에 기재된 배양 물질을 처리함으로써, 고순도의 글리코시드 생성물, 매력적인 색상, 용이한 가용화, 무취 및/또는 높은 회수 수율을 포함한 바람직한 품질을 갖는 생성물을 생산하는 것이 가능하다. 예를 들어, 배양물에 대한 초기의 pH 및 온도 조절은 배지의 유체 특징을 변화시킬 수 있고, 디스크 스택 분리기(disc stack separator)의 바이오매스 제거 효율을 증가시킬 수 있다. 또한, 글리코시드 생성물의 용해도 및 나아가 수율은 pH 및/또는 온도 조절, 및/또는 글리코시드 가용화제의 첨가에 의해 실질적으로 증가할 수 있다.
본 발명의 다른 양태 및 구현예는 이하의 상세한 개시 내용과 실시예로부터 명백할 것이다.
도 1은 UGT 효소를 발현하는 조작된 E. 콜리 세포의 2 개의 염색체 변형 ((1) ΔotsA-otsB; (2) ΔotsA-otsB, ugpA의 삽입)에 의한 스테비올 글리코시드 생물전환의 개선을 나타낸다. 개선 배수는 전체 스테비올 글리코시드의 전환율에 대한 것이다.
도 2는 UGT 효소를 발현하는 조작된 E. 콜리 세포에서, 과다 발현된 유전자에 의한 스테비올 글리코시드 생물전환의 개선을 나타낸다. 유전자는 플라스미드 상에서 보완되었다. 개선 배수는 전체 스테비올 글리코시드의 전환율에 대한 것이다. 보완된 유전자는 좌측에서 우측으로 이하와 같다: (1) 대조군(빈 플라스미드), (2) pgm (서열 번호: 92) 및 galU (서열 번호: 93), (3) pgm (서열 번호: 92), (4) galU (서열 번호: 93), (5) ugpA (서열 번호: 95), (6) ycjU (서열 번호: 94), (7) adk(서열 번호: 96), (8) ndk(서열 번호: 97), (9) pyrH, (10) cmk(서열 번호: 98).
도 3은 UGT 효소를 발현하는 조작된 E. 콜리 세포와 과다 발현된 수크로스 합성효소에 의한 스테비올 글리코시드 생물전환의 개선을 나타낸다. 유전자는 플라스미드 상에서 보완되었다. 개선 배수는 전체 스테비올 글리코시드의 전환율에 대한 것이다. 보완된 유전자는 좌측에서 우측으로 이하와 같다: (1) 대조군(빈 플라스미드), (2) StSus1(서열 번호: 1), (3) StSus2(서열 번호: 2), (4) StSus2_S11E(서열 번호: 3), (5) AcSuSy(서열 번호: 4), (6) AcSuSy_L637M-T640V(서열 번호: 5), (7) AtSus1(서열 번호: 6), (8) AtSus3(서열 번호: 7), (9) VrSS1(서열 번호: 8), (10) VrSS1_S11E(서열 번호: 9), (11) GmSS(서열 번호: 10), (12) GmSS_S11E(서열 번호: 11), (13) AtSusA(서열 번호: 12).
도 4는 UGT 효소를 발현하는 조작된 E. 콜리 세포와 다양한 유전자 녹아웃에 의한 스테비올 글리코시드 생물전환의 개선을 나타낸다. 개선 배수는 전체 스테비올 글리코시드의 전환율에 대한 것이다. 결실은 (좌측에서 우측으로) 이하와 같다: (1) ΔotsA, (2) Δugd, (3) ΔrfaQPSBIJ, (4) ΔyfdGHI, (5) ΔwcaJ 및 (6) ΔglgC.
도 5은 서열 번호: 14 (MbUGT1,2.3)에 의해 정의된 UGT 효소를 발현하는 조작된 E. 콜리 세포에 의한 스테비올 글리코시드 생물전환의 개선을 나타낸다. 개선 배수는 모 UGT 효소(서열 번호: 13)의 스테비올 글리코시드의 전환율 %에 대한 것이다.
도 6은 서열 번호: 15 (MbUGT1,2.4)에 의해 정의된 UGT 효소를 발현하는 조작된 E. 콜리 세포에 의한 스테비올 글리코시드 생물전환의 개선을 나타낸다. 개선 배수는 모 UGT 효소(서열 번호: 14)의 스테비올 글리코시드의 전환율 %에 대한 것이다.
도 7은 서열 번호: 16 (MbUGT1,2.5)에 의해 정의된 UGT 효소를 발현하는 조작된 E. 콜리 세포에 의한 스테비올 글리코시드 생물전환의 개선을 나타낸다. 개선 배수는 모 UGT 효소(서열 번호: 15)의 스테비올 글리코시드의 전환율 %에 대한 것이다.
도 8은 조작된 E. 콜리 생물전환 균주에서, 서열 번호: 15 (MbUGT1,2.4)의 UGT 효소의 발현에 의한 스테비아 잎 추출물로부터 레바우디오시드 E와 레바우디오시드 D의 혼합물로의 생물전환, 및 서열 번호: 25 (MbUGT1-3.3)의 UGT 효소의 발현에 의한 스테비아 잎 추출물로부터 레바우디오시드 I로의 생물전환을 나타낸다.
도 9는 조작된 E. 콜리 생물전환 균주에서, 서열 번호: 31 및 서열 번호: 99의 UGT 효소의 발현에 의한 스테비아 잎 추출물로부터 레바우디오시드 B와 스테비올비오시드의 혼합물로의 생물전환을 나타낸다.
도 10은 스테비올 글리코시드의 회수를 위한 종래의 공정을 나타내는 흐름도이다. 전형적으로, 먼저 바이오매스를 제거하여 큰 세포 찌꺼기, 효소 및 온전한 전세포를 제거하고, 원하는 생성물의 정제를 용이하게 한다.
도 11은 본 발명의 구현예에 의한 글리코시드 생성물의 회수에 대한 예시적인 공정을 나타내는 흐름도인데. 바이오매스를 제거하기에 앞서 pH 및/또는 온도의 조절 및/또는 가용화제의 첨가를 이용하여, 공정을 위한 배양 물질의 물리적 특성을 개선시킨 다음, 바이오매스의 제거는 용이하면서도 글리코시드 생성물의 수율을 증가시킨다.
도 12는 원심분리 후 수성 배지로부터의 바이오매스의 제거에 대한 다양한 처리의 효과를 나타낸다. 펠렛의 치밀도와 상청액의 투명도는 바이오매스의 제거의 용이함을 나타내는 지표로서 작용한다. 튜브는 좌측에서 우측으로 이하와 같다: (1) 22℃ (실온), pH 6.64; (2) 22℃ (실온), 에탄올; (3) 22℃ (실온), pH 3.78, + 에탄올; (4) 22℃ (실온), pH 3.78; (5) 70℃, pH 6.64; (6) 70℃, 에탄올; (7) 70℃, pH 3.78, + 에탄올; 및 (8) 70℃, pH 3.78.
도 13은 재결정화 전의 용액의 여과가 순도에 영향을 주고, 필터 물질의 선택이 최종 생성물의 품질에 유의한 영향을 미친다는 것을 나타낸다. 도 13은 재결정화 전에 용액을 여과하기 위한 폴리프로필렌(PP)(좌측) 및 폴리에테르술폰(PES)(우측) 물질의 사용을 비교한다. 고순도(>98%) RebM 최종 생성물은 프로필렌 글리콜에 10 wt%의 농도로 용해된다. PP 필터를 사용한 경우 매우 뿌연 용액을 얻지만, PES 필터 물질의 사용 시 투명한 용액을 얻는다.
도 14는 용해도(아래 곡선) 및 준안정성 제한 곡선(윗쪽 곡선)을 나타내는데, 이는 물 중 RebM에 대해 결정할 때 준안정성 영역(metastable zone)의 너비를 정의하여 결정 성장을 조절할 수 있게 한다.
도 15a, 15b는 용해도(아래 곡선) 및 준안정성 제한 곡선(윗쪽 곡선)을 나타내는데, 이는 pH 7의 67% 물/33% 에탄올에서 RebM에 대해 결정할 때, 준안정성 영역의 너비를 정의하여 용매계에서의 결정 성장을 조절할 수 있게 한다. 도 15a는 0% 글리세롤이나, 도 15b는 0.5% 글리세롤을 포함한다.
도 16a, 16b는 용해도(아래 곡선) 및 준안정성 제한 곡선(윗쪽 곡선)을 나타내는데, 이는 pH 11의 67% 물/33% 에탄올 중 RebM에 대해 결정할 때, 준안정성 영역의 너비를 정의하여, 이 용매계에서의 결정 성장을 조절할 수 있게 한다. 도 16a는 0% 글리세롤이나, 도 16b는 0.5% 글리세롤을 포함한다.
도 17a는 효소 1(서열 번호: 71) 또는 효소 2(서열 번호: 33) 중 하나를 발현하는 조작된 E. 콜리 균주를 사용한, 모그롤로부터 모그로시드 화합물(mog IIE, mog-IE, 및 mog-IA)로의 생물전환을 나타낸다. 도 17b는 효소 1(서열 번호: 71), 효소 3(서열 번호: 81), 효소 4(서열 번호: 82) 및 효소 5(서열 번호: 83)를 발현하는 조작된 E. 콜리 균주를 사용한, 모그롤로부터 모그로시드-IA로의 생물전환을 나타낸다.
도 18a 및 도 18b는 효소 1(서열 번호: 84), 효소 2(서열 번호: 71) 또는 효소 3(서열 번호: 33) 중 하나를 발현하는 조작된 E. 콜리 균주를 사용한, mog-IA(도 18a) 또는 mog-IE(도 18b)로부터 mog-IIE로의 생물전환을 나타낸다.
도 19는 효소 1(서열 번호: 72), 효소 2(서열 번호: 54) 또는 효소 3(서열 번호: 13)을 발현하는 조작된 E. 콜리 균주에 의한, Mog II-E로부터 Mog-III 또는 시아메노시드의 생산을 나타낸다.
도 20은 효소 1(서열 번호: 73)을 발현하는 E. 콜리 세포에 의한 MogII-A2의 시험관내 생산을 나타낸다.
도 21은 스테비올 및 스테비올 글리코시드 중간생성물에 대한 UGT 효소의 작용으로 생산된 당화 생성물을 나타낸다.
도 22는 Mog. V에 대한 당화 경로를 나타낸다. 버블 구조는 상이한 모그로시드들을 나타낸다. 백색의 4-환 코어는 모그롤을 나타낸다. 각 구조 아래의 숫자는 구체적인 당화 모그로시드를 가리킨다. 검정색 원은 C3 또는 C24 당화를 나타낸다. 암회색의 수직 원은 1,6-당화를 나타낸다. 담회색의 수평 원은 1,2-당화를 나타낸다. 약칭: Mog, 모그롤; sia, 시아메노시드.
도 2는 UGT 효소를 발현하는 조작된 E. 콜리 세포에서, 과다 발현된 유전자에 의한 스테비올 글리코시드 생물전환의 개선을 나타낸다. 유전자는 플라스미드 상에서 보완되었다. 개선 배수는 전체 스테비올 글리코시드의 전환율에 대한 것이다. 보완된 유전자는 좌측에서 우측으로 이하와 같다: (1) 대조군(빈 플라스미드), (2) pgm (서열 번호: 92) 및 galU (서열 번호: 93), (3) pgm (서열 번호: 92), (4) galU (서열 번호: 93), (5) ugpA (서열 번호: 95), (6) ycjU (서열 번호: 94), (7) adk(서열 번호: 96), (8) ndk(서열 번호: 97), (9) pyrH, (10) cmk(서열 번호: 98).
도 3은 UGT 효소를 발현하는 조작된 E. 콜리 세포와 과다 발현된 수크로스 합성효소에 의한 스테비올 글리코시드 생물전환의 개선을 나타낸다. 유전자는 플라스미드 상에서 보완되었다. 개선 배수는 전체 스테비올 글리코시드의 전환율에 대한 것이다. 보완된 유전자는 좌측에서 우측으로 이하와 같다: (1) 대조군(빈 플라스미드), (2) StSus1(서열 번호: 1), (3) StSus2(서열 번호: 2), (4) StSus2_S11E(서열 번호: 3), (5) AcSuSy(서열 번호: 4), (6) AcSuSy_L637M-T640V(서열 번호: 5), (7) AtSus1(서열 번호: 6), (8) AtSus3(서열 번호: 7), (9) VrSS1(서열 번호: 8), (10) VrSS1_S11E(서열 번호: 9), (11) GmSS(서열 번호: 10), (12) GmSS_S11E(서열 번호: 11), (13) AtSusA(서열 번호: 12).
도 4는 UGT 효소를 발현하는 조작된 E. 콜리 세포와 다양한 유전자 녹아웃에 의한 스테비올 글리코시드 생물전환의 개선을 나타낸다. 개선 배수는 전체 스테비올 글리코시드의 전환율에 대한 것이다. 결실은 (좌측에서 우측으로) 이하와 같다: (1) ΔotsA, (2) Δugd, (3) ΔrfaQPSBIJ, (4) ΔyfdGHI, (5) ΔwcaJ 및 (6) ΔglgC.
도 5은 서열 번호: 14 (MbUGT1,2.3)에 의해 정의된 UGT 효소를 발현하는 조작된 E. 콜리 세포에 의한 스테비올 글리코시드 생물전환의 개선을 나타낸다. 개선 배수는 모 UGT 효소(서열 번호: 13)의 스테비올 글리코시드의 전환율 %에 대한 것이다.
도 6은 서열 번호: 15 (MbUGT1,2.4)에 의해 정의된 UGT 효소를 발현하는 조작된 E. 콜리 세포에 의한 스테비올 글리코시드 생물전환의 개선을 나타낸다. 개선 배수는 모 UGT 효소(서열 번호: 14)의 스테비올 글리코시드의 전환율 %에 대한 것이다.
도 7은 서열 번호: 16 (MbUGT1,2.5)에 의해 정의된 UGT 효소를 발현하는 조작된 E. 콜리 세포에 의한 스테비올 글리코시드 생물전환의 개선을 나타낸다. 개선 배수는 모 UGT 효소(서열 번호: 15)의 스테비올 글리코시드의 전환율 %에 대한 것이다.
도 8은 조작된 E. 콜리 생물전환 균주에서, 서열 번호: 15 (MbUGT1,2.4)의 UGT 효소의 발현에 의한 스테비아 잎 추출물로부터 레바우디오시드 E와 레바우디오시드 D의 혼합물로의 생물전환, 및 서열 번호: 25 (MbUGT1-3.3)의 UGT 효소의 발현에 의한 스테비아 잎 추출물로부터 레바우디오시드 I로의 생물전환을 나타낸다.
도 9는 조작된 E. 콜리 생물전환 균주에서, 서열 번호: 31 및 서열 번호: 99의 UGT 효소의 발현에 의한 스테비아 잎 추출물로부터 레바우디오시드 B와 스테비올비오시드의 혼합물로의 생물전환을 나타낸다.
도 10은 스테비올 글리코시드의 회수를 위한 종래의 공정을 나타내는 흐름도이다. 전형적으로, 먼저 바이오매스를 제거하여 큰 세포 찌꺼기, 효소 및 온전한 전세포를 제거하고, 원하는 생성물의 정제를 용이하게 한다.
도 11은 본 발명의 구현예에 의한 글리코시드 생성물의 회수에 대한 예시적인 공정을 나타내는 흐름도인데. 바이오매스를 제거하기에 앞서 pH 및/또는 온도의 조절 및/또는 가용화제의 첨가를 이용하여, 공정을 위한 배양 물질의 물리적 특성을 개선시킨 다음, 바이오매스의 제거는 용이하면서도 글리코시드 생성물의 수율을 증가시킨다.
도 12는 원심분리 후 수성 배지로부터의 바이오매스의 제거에 대한 다양한 처리의 효과를 나타낸다. 펠렛의 치밀도와 상청액의 투명도는 바이오매스의 제거의 용이함을 나타내는 지표로서 작용한다. 튜브는 좌측에서 우측으로 이하와 같다: (1) 22℃ (실온), pH 6.64; (2) 22℃ (실온), 에탄올; (3) 22℃ (실온), pH 3.78, + 에탄올; (4) 22℃ (실온), pH 3.78; (5) 70℃, pH 6.64; (6) 70℃, 에탄올; (7) 70℃, pH 3.78, + 에탄올; 및 (8) 70℃, pH 3.78.
도 13은 재결정화 전의 용액의 여과가 순도에 영향을 주고, 필터 물질의 선택이 최종 생성물의 품질에 유의한 영향을 미친다는 것을 나타낸다. 도 13은 재결정화 전에 용액을 여과하기 위한 폴리프로필렌(PP)(좌측) 및 폴리에테르술폰(PES)(우측) 물질의 사용을 비교한다. 고순도(>98%) RebM 최종 생성물은 프로필렌 글리콜에 10 wt%의 농도로 용해된다. PP 필터를 사용한 경우 매우 뿌연 용액을 얻지만, PES 필터 물질의 사용 시 투명한 용액을 얻는다.
도 14는 용해도(아래 곡선) 및 준안정성 제한 곡선(윗쪽 곡선)을 나타내는데, 이는 물 중 RebM에 대해 결정할 때 준안정성 영역(metastable zone)의 너비를 정의하여 결정 성장을 조절할 수 있게 한다.
도 15a, 15b는 용해도(아래 곡선) 및 준안정성 제한 곡선(윗쪽 곡선)을 나타내는데, 이는 pH 7의 67% 물/33% 에탄올에서 RebM에 대해 결정할 때, 준안정성 영역의 너비를 정의하여 용매계에서의 결정 성장을 조절할 수 있게 한다. 도 15a는 0% 글리세롤이나, 도 15b는 0.5% 글리세롤을 포함한다.
도 16a, 16b는 용해도(아래 곡선) 및 준안정성 제한 곡선(윗쪽 곡선)을 나타내는데, 이는 pH 11의 67% 물/33% 에탄올 중 RebM에 대해 결정할 때, 준안정성 영역의 너비를 정의하여, 이 용매계에서의 결정 성장을 조절할 수 있게 한다. 도 16a는 0% 글리세롤이나, 도 16b는 0.5% 글리세롤을 포함한다.
도 17a는 효소 1(서열 번호: 71) 또는 효소 2(서열 번호: 33) 중 하나를 발현하는 조작된 E. 콜리 균주를 사용한, 모그롤로부터 모그로시드 화합물(mog IIE, mog-IE, 및 mog-IA)로의 생물전환을 나타낸다. 도 17b는 효소 1(서열 번호: 71), 효소 3(서열 번호: 81), 효소 4(서열 번호: 82) 및 효소 5(서열 번호: 83)를 발현하는 조작된 E. 콜리 균주를 사용한, 모그롤로부터 모그로시드-IA로의 생물전환을 나타낸다.
도 18a 및 도 18b는 효소 1(서열 번호: 84), 효소 2(서열 번호: 71) 또는 효소 3(서열 번호: 33) 중 하나를 발현하는 조작된 E. 콜리 균주를 사용한, mog-IA(도 18a) 또는 mog-IE(도 18b)로부터 mog-IIE로의 생물전환을 나타낸다.
도 19는 효소 1(서열 번호: 72), 효소 2(서열 번호: 54) 또는 효소 3(서열 번호: 13)을 발현하는 조작된 E. 콜리 균주에 의한, Mog II-E로부터 Mog-III 또는 시아메노시드의 생산을 나타낸다.
도 20은 효소 1(서열 번호: 73)을 발현하는 E. 콜리 세포에 의한 MogII-A2의 시험관내 생산을 나타낸다.
도 21은 스테비올 및 스테비올 글리코시드 중간생성물에 대한 UGT 효소의 작용으로 생산된 당화 생성물을 나타낸다.
도 22는 Mog. V에 대한 당화 경로를 나타낸다. 버블 구조는 상이한 모그로시드들을 나타낸다. 백색의 4-환 코어는 모그롤을 나타낸다. 각 구조 아래의 숫자는 구체적인 당화 모그로시드를 가리킨다. 검정색 원은 C3 또는 C24 당화를 나타낸다. 암회색의 수직 원은 1,6-당화를 나타낸다. 담회색의 수평 원은 1,2-당화를 나타낸다. 약칭: Mog, 모그롤; sia, 시아메노시드.
상세한 설명
다양한 양태 및 구현예에서, 본 개시 내용은 당화 생성물의 제조 방법, 뿐만 아니라 이에 유용한 박테리아 세포 및 우리딘 디포스페이트(UDP)-의존성 당전이(UGT) 효소를 제공한다. 다른 양태 및 구현예에서, 본 개시 내용은 미생물 배양물 또는 무세포 반응물로부터 글리코시드 생성물을 고수율 및/또는 고순도로 회수하는 방법을 제공한다. 다양한 양태 및 구현예에서, 본 개시 내용은 원하는 기질을 당화시킨 후, 당화 생성물을 고수율 및/또는 고순도로 회수하는 것과 관련된 전세포 생물전환 공정을 제공한다.
일 양태에서, 본 발명은 당화 생성물을 제조하기 위한 박테리아 세포 및 방법을 제공한다. 상기 박테리아 세포는 원하는 기질을 당화시키기 위해 하나 이상의 UGT 효소를 발현한다. 일부 구현예에서, 상기 박테리아 세포는 하나 이상의 재조합 수크로스 합성효소를 추가로 발현한다. 수크로스 합성효소의 발현은 공급된 기질의 전세포 당화를 극적으로 향상시킬 수 있다(도 3 참고). 대안적으로 또는 추가로, 상기 박테리아 세포에는 UDP-당의 이용가능성을 증가시키는 하나 이상의 유전자 변형이 포함된다. 상기 박테리아 세포는 당화용 기질의 존재 하에서 배양되고, 당화 생성물은 선택적으로 본원에 기재된 회수 공정을 사용하여 회수된다.
전세포 생물전환 시스템은 세포가 UDP-포도당 보조인자를 재생하므로 당화 반응에 대해 무-세포 시스템보다 유리하다. 이것은 세포 용해로부터 생성된 효소 또는 세포 외부로의 분비를 사용하는 공정과 반대인데, 이 공정은 외인성 UDP-포도당의 공급, 또는 UDP-포도당 전구체 또는 UDP-포도당의 재생 기작, 또는 UDP-포도당 재생 효소계가 필요하다. 본 발명의 구현예에서, 촉매화(당화)는 살아있는 박테리아 세포에서 수행되며, UDP-포도당 보조인자의 재활용은 UDP-포도당 재생을 위한 효소의 공급이나 값비싼 기질의 공급이 없이도 세포 대사를 사용하여 일어난다. 에스체리쉬아(Escherichia), 바실러스(Bacillus), 로도박터(Rhodobacter), 자이모모나스(Zymomonas) 또는 슈도모나스(Pseudomonas) 종을 포함한 다양한 박테리아 종이 본 개시 내용에서 사용될 수 있다. 일부 구현예에서, 박테리아 세포는 에스체리쉬아 콜리(Escherichia coli), 바실러스 서브틸리스(Bacillus subtilis), 로도박터 캅슐라투스(Rhodobacter capsulatus), 로도박터 스패로이데스(Rhodobacter sphaeroides), 자이모모나스 모빌리스(Zymomonas mobilis) 또는 슈도모나스 푸티다(Pseudomonas putida)이다. 예시적인 구현예에서, 박테리아 세포는 E. 콜리이다.
일부 구현예에서, 박테리아 세포는 재조합 수크로스 합성효소를 발현한다. 일부 구현예에서, 수크로스 합성효소를 발현하는 박테리아 세포는 수크로스의 존재 하에서 배양된다. 일부 구현예에서, 수크로스 합성효소는 서열 번호: 1 내지 12로부터 선택된 아미노산 서열과 적어도 약 70%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 도 3에 도시된 바와 같이, 박테리아 세포에서의 수크로스 합성효소의 발현은 전세포에 공급된 기질의 당화를 극적으로 개선시킨다. 다양한 구현예에서, 수크로스 합성효소는 서열 번호: 1 내지 12로부터 선택된 아미노산 서열과 적어도 약 80%, 또는 적어도 약 85%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함한다.
일부 구현예에서, 수크로스 합성효소는 서열 번호: 2와 적어도 약 80%, 또는 적어도 약 85%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 구현예에서, 수크로스 합성효소는 서열 번호: 2에 대한 S11E 또는 S11D 치환을 포함한다.
일부 구현예에서, 수크로스 합성효소는 서열 번호: 3과 적어도 약 80%, 또는 적어도 약 85%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 구현예에서, 수크로스 합성효소는 서열 번호: 3의 아미노산 서열에 대해, L637(예를 들어, (L637M) 및 T640(예를 들어, T640V, T640L, T640I, 또는 T640A) 중 하나 이상에서 아미노산 치환을 포함한다.
일부 구현예에서, 수크로스 합성효소는 서열 번호: 5와 적어도 약 80%, 또는 적어도 약 85%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함한다.
일부 구현예에서, 수크로스 합성효소는 서열 번호: 6과 적어도 약 80%, 또는 적어도 약 85%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함한다.
일부 구현예에서, 수크로스 합성효소는 서열 번호: 7과 적어도 약 80%, 또는 적어도 약 85%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 구현예에서, 수크로스 합성효소는 서열 번호: 7에 대한 S11E 또는 S11D 치환을 포함한다.
일부 구현예에서, 수크로스 합성효소는 서열 번호: 8과 적어도 약 80%, 또는 적어도 약 85%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 구현예에서, 수크로스 합성효소는 서열 번호: 8에 대한 S11E 또는 S11D 치환을 포함한다.
일부 구현예에서, 수크로스 합성효소는 서열 번호: 9와 적어도 약 80%, 또는 적어도 약 85%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함한다.
일부 구현예에서, 수크로스 합성효소는 서열 번호: 10과 적어도 약 80%, 또는 적어도 약 85%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 구현예에서, 수크로스 합성효소는 서열 번호: 10에 대한 S11E 또는 S11D 치환을 포함한다.
일부 구현예에서, 수크로스 합성효소는 서열 번호: 11과 적어도 약 80%, 또는 적어도 약 85%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함한다.
효소의 3-차원 구조와, 관련 활성 부위, 기질-결합 부위 및 다른 상호작용 부위의 위치에 대한 지식이 있으면, 유도체를 합리적으로 설계하고, 특정 변화의 표현형에 대한 기계적인 퉁찰력을 제공할 수 있다. 식물의 수크로스 합성효소는 매우 보존된 S11 및 유사 위치가 인산화될 때, 활성이 증가하는 것으로 보였다. 일부 구현예에서, 수크로스 합성효소는 S11E 또는 S11D 돌연변이를 포함하는데, 이는 음전하의 포스페이트가 발견될 곳에 음전하를 위치시켜, 인산화를 모방한다. 수크로스 합성효소에 대한 다른 변형은 공공의 이용가능한 구조, 예컨대 문헌[Stein O. and Granot D., An Overview of Sucrose Synthases in Plants, Front Plant Sci. 2019; 10: 95]에 기재되거나, 이에 참조된 것들에 의해 안내될 수 있다.
대안적으로 또는 추가로, 박테리아 세포는 UDP-당(예를 들어, UDP-포도당)의 이용가능성을 개선시키는 유전자 변형을 하나 이상 포함하는데, 이는 도 1, 2 및 4에 나타난 바와 같이, 원하는 기질을 당화시키기 위한 전세포 생물전환을 개선시킨다. 대수 성장기의 E. 콜리에서 야생형 UDP-포도당의 수준은 약 2.5 mM이다 (Bennett BD, Kimball EH, Gao M, Osterhout R, Van dien SJ, Rabinowitz JD. Absolute metabolite concentrations and implied enzyme active site occupancy in Escherichia coli. Nat Chem Biol. 2009;5(8):593-9.). 일부 구현예에서, 숙주 세포에 대한 유전자 변형은 (예를 들어, UGT 효소의 재조합 발현이 없는) 대수 성장기의 세포에서 UDP-포도당을 예를 들어 적어도 약 5 mM, 또는 적어도 약 10 mM로 증가시키도록 조작된다.
일부 구현예에서, 미생물 세포는 UDP-포도당을 소모하는 효소를 암호화하는 유전자의 결실, 불활성화, 또는 활성 또는 발현의 감소를 갖는다. 예를 들어, 박테리아 세포는 ushA (UDP-당 하이드로라제(hydrolase) 및/또는 (UDP-포도당으로부터 UDP-갈락토스의 생합성에 관여하는) galE, galT, galK 및 galM 중 하나 이상, 또는 박테리아 종에서의 이의 병렬상동체(ortholog)의 결실, 불활성화, 또는 활성 또는 발현의 감소를 가질 수 있다. 일부 구현예에서, galETKM 유전자는 불활성화되거나, 결실되거나, 발현 또는 활성이 실질적으로 감소된다. 대안적으로 또는 추가로, 박테리아 세포는 E. 콜리 otsA (트레할로스-6-포스페이트 합성효소) 또는 박테리아 종에서의 이의 병렬상동체의 결실, 불활성화, 또는 활성 또는 발현의 감소를 갖는다. 대안적으로 또는 추가로, 미생물 세포는 E. 콜리 ugd (UDP-포도당 6-탈수소화효소(dehydrogenase)) 또는 박테리아 종에서의 이의 병렬상동체의 결실, 불활성화, 또는 활성 또는 발현의 감소를 갖는다. otsA 및 ugd의 활성의 감소 또는 제거는 각각 트레할로스 또는 UDP-글루쿠로니데이트로의 UDP-포도당의 싱크를 없애거나, 감소시킬 수 있다.
제거하거나 없앨 수 있는 다른 UDP-포도당의 싱크는, 지질의 당화 및 LPS 생합성에 관여하는 유전자, 및 운데카프레닐-디포스페이트(UPP)을 당화하는데 관여하는 유전자의 제거, 또는 활성 또는 발현의 감소를 포함한다. 지질의 당화 또는 LPS 생합성에 관여하는 유전자는, E. 콜리 waaG (지질다당류 당전이효소 1), E. 콜리 waaO (UDP-D-포도당:(글리코실)LPS α-1,3-당전이효소)), 및 E. 콜리 waaJ (UDP-포도당:(글리코실)LPS α-1,2-당전이효소))를 포함한다. 운데카프레닐-디포스페이트 (UPP)의 당화에 관여하는 유전자는, E. 콜리 yfdG (잠정적인 박토프레놀-연결 포도당 트랜스로카제(translocase)), E. 콜리 yfdH (박토프레놀 당전이효소), E. 콜리 yfdI (혈청형 특이적인 당전이효소), 및 E. 콜리 wcaJ (운데카프레닐-포스페이트 포도당 포스포트랜스퍼라제(phosphotransferase))를 포함한다. 이러한 하나 이상의 유전자 산물 (또는 박테리아 세포에서의 상응하는 병렬상동체)의 결실, 불활성화, 또는 활성 또는 발현의 감소는, UDP-포도당의 이용가능성을 증가시킬 수 있다.
이러한 또는 다른 구현예에서, 박테리아 세포는 전구체를 UDP-포도당으로 소모하는 효소를 암호화하는 유전자의 결실, 불활성화, 또는 활성 또는 발현의 감소를 갖는다. 예를 들어, 일부 구현예에서, 박테리아 세포는 pgi (포도당-6 포스페이트 이소머라제), 또는 숙주 세포의 박테리아 종에서의 이의 병렬상동체의 결실, 불활성화, 또는 활성 또는 발현의 감소를 갖는다.
이러한 또는 다른 구현예에서, 세포는 포도당-6-포스페이트를 UDP-포도당으로 전환시키는데 관여하는 효소를 암호화하는 하나 이상의 유전자의 과다 발현, 또는 이의 활성 증가를 갖는다. 예를 들어, pgm (포스포글루코뮤타제(phosphoglucomutase)) 및/또는 galU (UTP-포도당-1-포스페이트 우리딜릴트랜스퍼라제(uridylyltransferase) (또는 이들의 병렬상동체나 유도체)는 과다 발현되거나, 효소의 생산성을 증가시키도록 변형될 수 있다. 대안적으로 또는 추가로, 포도당-6-포스페이트를 포도당-1-포스페이트로 전환시키는 E. 콜리 ycjU (β-포스포글루코뮤타제), 및 포도당-1-포스페이트를 UDP-포도당으로 전환시키는 비피도박테리움 비피둠(Bifidobacterium bifidum) ugpA, 또는 이 효소의 병렬상동체나 유도체는, 과다 발현되거나, 효소의 생산성을 증가시키도록 변형될 수 있다.
대안적으로 또는 추가로, 미생물 세포에는 포도당의 수송을 증가시키는 유전자 변형이 하나 이상 있다. 이러한 변형은 E. 콜리 galP (갈락토스:H+ 공동 수송체(symporter)) 및 E. 콜리 glk (글루코키나제(glucokinase))의 발현이나 활성의 증가, 또는 대안적으로 자이모모나스 모빌리스 glf 및 E. 콜리 glk, 또는 병렬상동체, 또는 이러한 유전자들의 조작된 유도체의 발현 증가를 포함한다.
대안적으로 또는 추가로, 미생물 세포에는 UTP 생산 및 재활용을 증가시키는 유전자 변형이 하나 이상 있다. 이러한 변형은 E. 콜리 adk (아데닐레이트 키나제), 또는 E. 콜리 ndk (뉴클레오시드 디포스페이트 키나제), 또는 이러한 효소의 병렬상동체, 또는 조작된 유도체의 발현 또는 활성의 증가를 포함한다.
대안적으로 또는 추가로, 미생물 세포에는 UDP 생산을 증가시키는 유전자 변형이 하나 이상 있다. 이러한 변형은 E. 콜리 upp (우라실 포스포리보실트랜스퍼라제(phosphoribosyltransferase)), E. 콜리 dctA (C4 디카르복실레이트/오로테이트:H+공동 수송체), E. 콜리 pyrE (오로테이트 포스포리보실트랜스퍼라제), E. 콜리 pyrF (오로티딘-5'-포스페이트 디카르복실라제), E. 콜리 pyrH (UMP 키나제), 및 E. 콜리 cmk (시티딜레이트 키나제) 중 하나 이상의 과다 발현 또는 활성의 증가를 포함하며, 여기에는 이들의 병렬상동체 또는 조작된 유도체도 포함된다. 예를 들어, 일부 구현예에서, 미생물 세포는 upp, pyrH 및 cmk, 또는 이들의 병렬상동체 또는 조작된 유도체를 과다 발현하거나, 또는 이의 활성을 증가시킨다. 대안적으로, 미생물 세포는 dctA, pyre, pyrH 및 cmk, 또는 이들의 병렬상동체 또는 조작된 유도체를 과다 발현하거나, 또는 이의 활성을 증가시킨다.
대안적으로 또는 추가로, 미생물 세포에는 포도당 흡수의 조절을 제거하거나 감소시키는 유전자 변형이 하나 이상 있다. 예를 들어, 미생물 세포는 E. 콜리의 작은 조절 RNA인 sgrS를 결실시키거나, 불활성화시키거나, 또는 이의 발현을 감소시킬 수 있다.
대안적으로 또는 추가로, 미생물 세포에는 포도당-1-포스페이트의 탈인산화를 감소시키는 유전자 변형이 하나 이상 있다. 예시적인 변형은 E. 콜리 agp (포도당-1-포스파타제), E. 콜리 yihX (α-D-포도당-1-포스페이트 포스파타제), E. 콜리 ybiV (당 포스파타제), E. 콜리 yidA (당 포스파타제), E. 콜리 yigL (인당(phosphosugar) 포스파타제) 및 E. 콜리 phoA (알칼라인 포스파타제) 중 하나 이상, 또는 박테리아 세포에서의 이들의 병렬상동체의 결실, 불활성화, 또는 발현이나 활성의 감소를 포함한다.
대안적으로 또는 추가로, 박테리아 세포는 포도당-1-포스페이트로부터 TDP-포도당으로의 전환을 감소시키는 하나 이상의 유전자 변형을 가질 수 있다. 예시적인 변형은 E. 콜리 rffH (dTDP-포도당 피로포스포릴라제(pyrophosphorylase)), 및 E. 콜리 rfbA (dTDP 포도당 피로포스포릴라제), 또는 박테리아 세포에서의 이들의 병렬상동체의 결실, 불활성화, 또는 발현이나 활성의 감소를 포함한다.
대안적으로 또는 추가로, 박테리아 세포는 포도당-1-포스페이트로부터 ADP-포도당으로의 전환을 감소시키는 유전자 변형을 하나 이상 가질 수 있다. 예시적인 변형은 E. 콜리 glgC (포도당-1-포스페이트 아데닐릴트랜스퍼라제 (adenylyltransferase)), 또는 박테리아 세포에서의 이의 병렬상동체의 결실, 불활성화, 또는 발현이나 활성의 감소를 포함한다.
예를 들어, 일부 구현예에서, ushA (UDP-당 디포스파타제) 및 galETKM 또는 이들의 병렬상동체는 결실되거나, 불활성화되거나, 발현 또는 활성이 감소되고; pgi (포도당-6-포스페이트 이소머라제) 또는 이의 병렬상동체는 결실되거나, 불활성화되거나, 발현 또는 활성이 감소되고; E. 콜리 pgm (서열 번호: 92) 및/또는 ycjU (서열 번호: 94) 또는 병렬상동체는 과다 발현되거나, 야생형 효소에 비해 활성이 증가된 이의 유도체가 발현되고; E. 콜리 galU (서열 번호: 93) 및/또는 비피도박테리움 비피둠 ugpA (서열 번호: 95) 또는 병렬상동체는 과다 발현되거나, 야생형 효소에 비해 활성이 증가된 이의 유도체가 발현된다.
박테리아 균주가 E. 콜리 pgm (서열 번호: 92) 및/또는 ycjU (서열 번호: 94) 또는 이들의 병렬상동체를 과다발현하거나, 또는 야생형 효소보다 활성이 높은 유도체를 발현하거나; 또는 E. 콜리 galU (서열 번호: 93)를 과다발현하거나, 또는 비피도박테리움 비피둠 ugpA (서열 번호: 95) 또는 이의 병렬상동체나 (예를 들어, 야생형 효소보다 활성이 높은) 유도체를 발현하는 다양한 구현예에서, 보완 유전자들은 각각 서열 번호: 92, 서열 번호: 94, 서열 번호: 93, 또는 서열 번호: 95와 적어도 약 50%, 또는 적어도 약 60%, 또는 적어도 약 70%, 또는 적어도 약 80%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97% 동일한 아미노산 서열을 포함할 수 있다.
예를 들어, 일부 구현예에서, 박테리아 세포는 pgm 또는 이의 병렬상동체나 유도체(예를 들어, 야생형보다 활성이 높은 유도체), 및 선택적으로 galU 또는 이의 병렬상동체나 유도체(예를 들어, 야생형보다 활성이 높은 유도체)의 과다 발현을 포함한다. 다른 일부 구현예에서, 박테리아 세포는 ushA 또는 이의 병렬상동체, 및/또는 galE, galT, galK 및 galM 중 어느 하나, 또는 이들의 병렬상동체(들)의 결실, 불활성화, 또는 활성 또는 발현의 감소를 갖는다. 예를 들어, galETKM 또는 이의 병렬상동체는 불활성화되거나, 결실되거나, 발현 또는 활성이 감소될 수 있다. 일부 구현예에서, pgi (포도당-6-포스페이트 이소머라제) 또는 이의 병렬상동체는 결실되거나, 불활성화되거나, 발현 또는 활성이 감소된다.
대안적으로 또는 추가로, 박테리아 세포는 otsA (트레할로스-6-포스페이트 합성효소) 또는 이들의 병렬상동체 및/또는 otsB (트레할로스-포스페이트 포스파타제) 또는 이들의 병렬상동체의 결실, 불활성화, 또는 활성 또는 발현의 감소를 갖는다.
대안적으로 또는 추가로, 박테리아 세포는 ugd (UDP-포도당 6-탈수소화 효소) 또는 이의 병렬상동체; rfaQ-G-P-S-B-I-J 또는 이의 병렬상동체(들); yfdG-H-I 또는 이의 병렬상동체(들); wcaJ 또는 이의 병렬상동체; 및 glgC 또는 이의 병렬상동체 중 하나 이상의 결실, 불활성화, 또는 활성 또는 발현의 감소를 갖는다.
예시적인 구현예에서, 박테리아 세포는 E. 콜리 ycjU (β-포스포글루코뮤타제)(서열 번호: 94) 또는 이의 병렬상동체 또는 유도체, 비피도박테리움 비피둠 ugpA (UTP-포도당-1-포스페이트 우리딜릴트랜스퍼라제)(서열 번호: 95) 또는 이의 병렬상동체 또는 유도체, E. 콜리 adk (아데닐레이트 키나제)(서열 번호: 96) 또는 이의 병렬상동체 또는 유도체, E. 콜리 ndk (뉴클레오시드 디포스페이트 키나제)(서열 번호: 97) 또는 이의 병렬상동체 또는 유도체, 및 E. 콜리 cmk (시티딘 모노포스페이트 키나제)(서열 번호: 98) 또는 이의 병렬상동체 또는 유도체 중 하나 이상의 과다 발현, 또는 활성 또는 발현의 증가를 갖는다. 다양한 구현예에서, 유도체 효소는 야생형 효소보다 활성이 더 높도록 조작될 수 있다. 보완 효소는 각각 서열 번호: 94, 서열 번호: 95, 서열 번호: 96, 서열 번호: 97, 또는 서열 번호: 98과 적어도 약 50%, 또는 적어도 약 60%, 적어도 약 70%, 또는 적어도 약 80%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97% 동일한 아미노산 서열을 포함한다.
UDP-당의 이용가능성을 개선시키는 박테리아 세포에 대한 다른 변형은, US 2020/0087692에 기재되어 있으며, 상기 문헌은 전문이 본원에 참조로서 포함된다.
다양한 구현예에서, 당화용 기질은 식물 추출물 또는 이의 분획으로 제공되거나, 합성 또는 생합성 공정에 의해 생산된다. 예시적인 기질은 다양한 2차 대사산물, 예컨대 테르페노이드 또는 테르페노이드 글리코시드, 플라보노이드 또는 플라보노이드 글리코시드, 칸나비노이드 또는 칸나비노이드 글리코시드, 폴리케티드 또는 폴리케티드 글리코시드, 스틸베노이드 또는 스틸베노이드 글리코시드, 및 폴리페놀 또는 폴리페놀 글리코시드로부터 선택된 것들을 포함한다. 식물 추출물은 분획화되거나, 아니면 원하는 기질이 풍부할 수 있다.
일부 구현예에서, 기질은 테르페노이드 및/또는 테르페노이드 글리코시드, 예컨대 스테비올 또는 스테비올 글리코시드, 또는 모그롤 또는 모그롤 글리코시드("모그로시드")를 포함한다. 일부 구현예에서, 기질은 대개 0 내지 약 4 개의 글리코실 기를 가지며, 글루코실, 갈락토실, 만노실, 자일로실 및/또는 람노실 기를 포함할 수 있다. 다양한 구현예에서, 글리코실 기는 주로 글루코실이다. 전세포 생물전환 후, 다양한 구현예에서, 당화 생성물은 적어도 4 개, 적어도 5 개, 적어도 6 개, 또는 적어도 7 개의 글리코실 기(예를 들어, 글루코실 기)를 가질 것이다. 다양한 구현예에서, 전세포 생물전환은 박테리아 세포에 의한 기질의 적어도 2 회의 당화 반응에 관한 것이다. 일부 구현예에서는, (UGT에 의해 촉매화된 역반응의 경우) 전세포 생물전환으로 인해 기질이 단일 당화되거나 또는 탈당화된다.
다양한 구현예에서, 기질은 스테비아 추출물 또는 이의 분획으로 제공될 수 있는데, 이는 목표 기질이 풍부할 수 있다. 예를 들어, 스테비아 잎 추출물은 스테비올, 스테비오시드, 스테비올비오시드, 레바우디오시드 A, 둘코시드 A, 둘코시드 B, 레바우디오시드 C, 및 레바우디오시드 F 중 하나 이상을 포함하거나, 이들이 풍부할 수 있다. 일부 구현예에서, 상기 추출물 또는 이의 분획 내 스테비올 글리코시드의 적어도 약 20%, 또는 적어도 약 30%, 또는 적어도 약 40%, 또는 적어도 약 50%, 또는 적어도 약 75%는 스테비오시드, 스테비올비오시드 및 레바우디오시드 A 중 하나 이상을 포함한다.
UGT 효소뿐만 아니라 (원하는 기질이 풍부한 식물 추출물의 분획으로 포함된) 관련 기질을 선택하여, 원하는 당화 생성물을 생산할 수 있다. 일부 구현예에서, 적어도 하나의 UGT 효소는, 서열 번호: 13 내지 84, 및 99 중 어느 하나와 적어도 약 70%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 다양한 구현예에서, 적어도 하나의 UGT 효소는 서열 번호: 13 내지 84, 99 중 어느 하나와 적어도 약 80%, 또는 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 본 개시 내용의 구현예에 의하면, UGT 효소는 분비 또는 수송 신호 없이 발현되고, 막 고정(anchoring) 도메인을 함유하지 않는다.
효소의 3-차원 구조와, 관련 활성 부위, 기질-결합 부위 및 다른 상호작용 부위의 위치에 대한 지식이 있으면, 유도체를 합리적으로 설계하고, 특정 변화의 표현형에 대한 기계적 통찰력을 제공할 수 있다. 식물 UGT는 매우 보존된 2 차 및 3차 구조를 공유하지만, 아미노산 서열의 동일성이 비교적 낮다. 문헌[Osmani 등, Substrate specificity of plant UDP-dependent glycosyltransferases predicted from crystal structures and homology modeling, Phytochemistry 70 (2009) 325-347]. UGT의 당 수용체 및 당 공여체는 N-말단 도메인과 C-말단 도메일 사이에 형성된 갈라진 틈(cleaft)에 수용된다. 1 차 서열의 몇몇 영역은 구조적으로 보존된 도메인뿐만 아니라 아미노산 서열 및 서열 길이가 둘 다 다른 루프 영역도 포함하는 기질 결합 포켓을 형성하는 데에도 기여한다.
일부 구현예에서, 기질은 테르페노이드 글리코시드이고, 일부 구현예에서는 스테비올 글리코시드 또는 모그로시드를 포함할 수 있다. 테르페노이드 또는 테르페노이드 글리코시드 스캐폴드에 대한 당전이효소 활성을 갖는 다양한 UGT 효소가 본원에 기재되어 있는데, 여기에는 서열 번호: 13 내지 39, 46, 54, 60, 71 내지 84, 및 99에 의해 정의된 UGT 효소가 포함된다. 표 1, 8 및 9를 참고한다.
예를 들어, 일부 구현예에서, 당화 생성물은 레바우디오시드 (스테비올 글리코시드)이다. 이러한 구현예에서, UGT 효소는 스테비올 코어의 C13 및/또는 C19 하이드록실에서의 1 차 당화; C13 및/또는 C19 1 차 글리코실 기의 1-2 분지형 당화; 및 C13 및/또는 C19 1 차 글리코실 기의 1-3 분지형 당화 중 하나 이상이 가능하다. 도 21를 참고한다. 일부 구현예에서, UGT 효소는 서열 번호: 13 내지 32 및 84 중 하나와 적어도 약 70%의 서열 동일성 (또는 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%의 서열 동일성)을 갖는 아미노산 서열을 포함하는 효소로부터 선택된다.
스테비올 및 스테비올 글리코시드의 당화(RebM의 생합성 포함)를 위한 UGT 효소는 US 2017/0332673 및 2020/0087692에 개시되어 있는데, 상기 문헌은 전문이 본원에 참고로서 포함된다. 예시적인 UGT 효소는 이하의 표 1에 나열되어 있다:
표 1: 스테비올 글리코시드 생산을 위한 예시적인 UGT 효소
일부 구현예에서, 당화 생성물은 모그로시드이다. 다양한 구현예에서, UGT 효소는 모그롤 코어의 C3 및/또는 C24 하이드록실에서의 1 차 당화와, C3 및/또는 C24 1 차 글리코실 기의 1-2 분지형 당화; 및/또는 C3 및/또는 C24 1 차 글리코실 기의 1-6 분지형 당화가 가능하다. 이러한 구현예에 유용한 UGT 효소는 표 8 및 9에 나타나 있다. 일부 구현예에서, UGT 효소는 서열 번호: 13 내지 17, 29, 33 내지 39, 46, 54, 60, 71 내지 80, 및 82 내지 84 중 하나와 적어도 약 70%의 서열 동일성 (또는 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%의 서열 동일성)을 갖는 아미노산 서열을 포함하는 효소로부터 선택된다.
효소의 아미노산 서열이 변하면, 활성이 바뀌거나, 또는 측정가능한 효과가 없어질 수 있다. 측정가능한 효과가 없는 침묵적인 변화(Silent change)는 종종 활성 부위 및 기질-결합 부위로부터 떨어진 위치에 있는 용매-노출 표면의 보존적 치환, 및 작은 삽입 또는 결실이다. 반대로, 효소 활성은 비-보존적 치환, 큰 삽입 또는 결실, 및 활성 부위, 기질-결합 부위, 및 단백질의 폴딩 또는 형태(conformation)에 중요한 파묻힌 위치(buried position) 내의 변화에 의해 영향을 받을 가능성이 더욱 크다. 효소 활성을 바꾸는 변화는 반응 속도를 증가시키거나, 감소시킬 수 있으며, 또는 특정 기질에 대한 친화성 또는 특이성을 증가시키거나 감소시킬 수 있다. 예를 들어, 기질-결합 부위의 크기를 증가시키는 변화로 인해 효소가 더 큰 기질에서도 작용할 수 있게 되고, 촉매적 아미노산 측쇄를 기질의 표적 부위에 더욱 가까이 두는 변화로 인해 효소의 속도가 증가할 수 있다.
일부 구현예에서, "합리적인 설계"는 효소에 대한 특정 돌연변이를 구축하는 것에 관한 것이다. 합리적인 설계라는 것은, 효소 또는 관련 효소에 대한 지식, 예컨대 이의 반응 열역학 및 속도론, 3-차원 구조, 활성 부위(들), 기질(들) 및/또는 효소와 기질 간의 상호작용을 특정 돌연변이의 설계에 도입하는 것을 말한다. 합리적인 설계의 접근에 기초하여, 효소에 돌연변이를 생성할 수 있으며, 이후 이를 대조 수준에 비해 테르펜 또는 테르페노이드의 생산이 증가되었는지에 대해 스크리닝할 수 있다. 일부 구현예에서, 돌연변이는 상동성 모델링에 기초하여 합리적으로 설계될 수 있다. 본원에 사용된 "상동성 모델링"이라는 것은, 관련된 상동성 단백질의 아미노산 서열과 3-차원 구조로부터 하나의 단백질의 원자 분해능 모델(atomic resolution model)을 구축하는 공정을 말한다.
아미노산 서열의 동일성, 즉 서열 동일성의 백분율은 서열 정렬을 통해 결정될 수 있다. 이러한 정렬은 문헌[Karlin and Altschul (Karlin & Altschul (1993) Proc. Natl. Acad. Sci. USA 90: 5873-5877)]에 기재된 것과 같은 몇몇 공지의 알고리즘, hmmalign (HMMER 패키지), 또는 CLUSTAL 알고리즘 (Thompson, J. D., Higgins, D. G. & Gibson, T. J. (1994) Nucleic Acids Res. 22, 4673-80)에 의해 수행될 수 있다. 서열 동일성(서열 매칭)의 등급은 예를 들어, BLAST, BLAT 또는 BlastZ (또는 BlastX)을 사용하여 계산할 수 있다. 유사한 알고리즘은 문헌[Altschul 등 (1990) J. Mol. Biol. 215: 403-410]의 BLASTN 및 BLASTP 프로그램에 포함되어 있다. BLAST 단백질 정렬은 BLASTP 프로그램에서 스코어 = 50, 워드 길이(word length) = 3으로 수행할 수 있다. 비교의 목적으로 갭을 둔 채로 정렬을 하기 위해, 문헌[Altschul 등 (1997) Nucleic Acids Res. 25: 3389-3402]에 기재된 바와 같은 갭(Gapped) BLAST를 이용한다. BLAST 및 갭 BLAST 프로그램을 이용할 때, 각 프로그램의 디폴트 변수가 사용된다.
UGT 효소 또는 다른 발현된 효소는 미생물 세포의 염색체로 통합될 수 있거나, 또는 대안적으로 염색체 외에서 발현된다. 예를 들어, UGT 효소는 박테리아 인공 염색체(BAC) 또는 효모 인공 염색체(YAC)로부터 발현될 수 있다.
하나 이상의 UGT 효소 (또는 다른 발현된 효소)의 아미노산 서열에서, 선택적으로 위치 2에 알라닌이 삽입되거나 또는 치환되어, 세포의 교체율(turnover)을 감소시킬 수 있다. 다양한 구현예에서, 하나 이상의 UGT 효소는 위치 2에서 알라닌 잔기가 삽입되거나 또는 치환되어, 생체 내의 추가 안정성을 제공한다.
효소의 발현은 예를 들어 유전자 모듈(예를 들어, 오페론) 또는 효소의 독립적인 발현을 사용하여, 최적 활성을 얻도록 조정될 수 있다. 예를 들어, 유전자 또는 오페론의 발현은 강도가 다른(예를 들어, 강한, 중간, 약한) 프로모터, 예컨대 유도성 또는 항시성 프로모터의 선택을 통하여 조절될 수 있다. 강도가 다른 프로모터의 몇몇 비-제한적인 예는, Trc, T5 및 T7을 포함한다. 추가로, 유전자 또는 오페론의 발현은 세포 내 유전자 또는 오페론의 카피수를 조작함으로써 조절될 수도 있다. 일부 구현예에서, 세포는 단일 카피의 각 UGT 효소를 발현한다. 일부 구현예에서, 유전자 또는 오페론의 발현은 한 모듈 내에서 유전자들의 순서를 조작하여 조절될 수 있는데, 일반적으로 먼저 전사된 유전자가 더 많이 발현된다. 일부 구현예에서, 유전자 또는 오페론의 발현은 하나 이상의 유전자 또는 오페론을 염색체에 통합시켜 조절된다.
발현의 최적화는 또한 적절한 프로모터와 리보솜 결합 부위를 선택하여 이루어질 수도 있다. 일부 구현예에서, 이는 높은-카피수의 플라스미드, 또는 단일-, 저- 또는 중간-카피수의 플라스미드의 선택을 포함할 수 있다. 전사 종결의 단계는 또한 스템-루프와 같은 구조의 도입이나 제거를 통해, 유전자 발현을 조절하는 것을 목적으로 할 수도 있다.
발현에 대한 모든 필수 요소를 함유한 발현 벡터는 시판되고 있으며, 당업계의 숙련자들에게 알려져 있다. 예를 들어, 문헌[Sambrook 등, Molecular Cloning: A Laboratory Manual, 2판, Cold Spring Harbor Laboratory Press, 1989]를 참고한다. 이종 DNA를 세포로 도입하여, 세포를 유전자 조작한다. 이종 DNA는 전사 요소의 작용가능한 조절을 받으므로, 숙주 세포에서 이종 DNA의 발현이 가능해진다.
일부 구현예에서, 내인성 유전자는 유전자 상보성과는 반대로 편집된다. 편집(Editing)은 내인성 프로모터, 리보솜 결합 부위 서열 또는 다른 발현 조절 서열을 변형시킬 수 있고/거나, 일부 구현예에서는 유전자 조절 시 트랜스(trans)-작용 및/또는 시스(cis)-작용 인자를 변형시킨다. 게놈 편집은 CRISPR/Cas 게놈 편집 기술, 또는 아연 핑거 뉴클레아제 및 TALEN을 이용한 유사 기술을 사용하여 실시될 수 있다. 일부 구현예에서, 내인성 유전자는 상동 재조합에 의해 대체된다.
일부 구현예에서, 편리하게는 유전자는 적어도 부분적으로는 유전자 카피수를 조절함으로써 과다발현된다. 유전자 카피 수는 다양한 카피 수를 갖는 플라스미드를 사용하여 조절할 수 있으나, 유전자 중복(gene duplication) 및 염색체 통합도 또한 이용할 수 있다. 예를 들어, 유전적으로 안정한 텐덤 유전자(tandem) 중복을 위한 공정은 US 2011/0236927에 기재되어 있는데, 상기 문헌은 전문이 본원에 참조로서 포함된다.
일부 구현예에서, 당화 생성물은 RebM을 포함한다. 이러한 구현예에서, UGT 효소는 스테비올 코어의 C13 및 C19 하이드록실에서의 1 차 당화; C13 및 C19 1 차 글리코실 기의 1-2 분지형 당화; 및 C13 및 C19 1 차 글리코실 기의 1-3 분지형 당화가 가능하다. 도 21를 참고한다. 일부 구현예에서, UGT 효소는 서열 번호: 13 내지 32, 및 84 중 하나와 적어도 약 70%의 서열 동일성 (또는 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%의 서열 동일성)을 갖는 아미노산 서열을 포함하는 효소로부터 선택된다. 일부 구현예에서, 본 개시 내용에 의해 회수된 당화 생성물은 총 스테비올 글리코시드 성분에 대해 적어도 약 50%의 RebM, 또는 적어도 약 75%의 RebM, 또는 적어도 약 85%의 RebM, 또는 적어도 약 90%의 RebM, 또는 적어도 약 95%의 RebM이다.
일부 구현예에서, 당화 생성물은 RebE 및/또는 RebD를 포함한다. 이러한 구현예에서, 박테리아 세포는 스테비올 C13 및 C19 1 차 글리코실 기의 1-2 당화가 가능한 하나 이상의 UGT 효소를 발현할 수 있다. 일부 구현예에서, 당화용 기질은 RebA 및 스테비오시드를 주요 성분으로 포함한다 (예를 들어, 기질의 스테비올 글리코시드 조성의 적어도 약 20%, 또는 적어도 약 30%, 또는 적어도 약 50%, 또는 적어도 약 70%). 일부 구현예에서, UGT 효소는 서열 번호: 13 내지 16, 및 26 내지 29 중 하나와 적어도 약 70%의 서열 동일성 (또는 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%의 서열 동일성)을 갖는 효소로부터 선택된다. 일부 구현예에서, 본 개시 내용에 의해 회수된 당화 생성물은 총 스테비올 글리코시드 성분에 대해 적어도 약 50%의 RebE 및/또는 RebD, 또는 적어도 약 75%의 RebE 및/또는 RebD, 또는 적어도 약 85%의 RebE 및/또는 RebD, 또는 적어도 약 90%의 RebE 및/또는 RebD, 또는 적어도 약 95%의 RebE 및/또는 RebD이다.
일부 구현예에서, 당화 생성물은 RebB를 포함한다. 이러한 구현예에서, 박테리아 세포는 스테비올 C19 1 차 글리코실 기를 탈당화시킬 수 있는 하나 이상의 UGT 효소를 발현한다. 일부 구현예에서, 당화용 기질은 RebA를 주요 성분으로 포함한다 (기질의 레바우디오시드 조성의 예를 들어, 적어도 약 20%, 또는 적어도 약 30%, 또는 적어도 약 50%, 또는 적어도 약 70%). 일부 구현예에서, UGT 효소는 서열 번호: 18, 30, 31 및 99 중 하나와 적어도 약 70%의 서열 동일성 (또는 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%의 서열 동일성)을 갖는 효소로부터 선택된다. 일부 구현예에서, 박테리아 세포는 서열 번호: 31 또는 서열 번호: 99와 적어도 약 70%의 서열 동일성 (또는 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%의 서열 동일성)을 갖는 UGT 효소를 발현한다. 이러한 구현예에서, 본 개시 내용에 의해 회수된 당화 생성물은 총 스테비올 글리코시드 성분에 대해 적어도 약 50%의 RebB, 또는 적어도 약 75%의 RebB, 또는 적어도 약 85%의 RebB, 또는 적어도 약 90%의 RebB, 또는 적어도 약 95%의 RebB이다.
일부 구현예에서, 당화 생성물은 RebI를 포함한다. 이러한 구현예에서, 박테리아 세포는 스테비올 C19 1 차 글리코실 기의 1-3 당화가 가능한 하나 이상의 UGT 효소를 발현한다. 일부 구현예에서, 당화용 기질은 RebA를 주요 성분으로 포함한다 (기질의 스테비올 글리코시드 조성의 예를 들어, 적어도 약 20%, 또는 적어도 약 30%, 또는 적어도 약 50%, 또는 적어도 약 70%, 또는 적어도 약 80%). 일부 구현예에서, UGT 효소는 서열 번호: 19 내지 25 중 하나와 적어도 약 70% (또는 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%)의 서열 동일성을 갖는 효소로부터 선택된다. 이러한 구현예에서, 본 개시 내용에 의해 회수된 당화 생성물은 총 스테비올 글리코시드 성분에 대해 적어도 약 50%의 RebI, 또는 적어도 약 75%의 RebI, 또는 적어도 약 85%의 RebI, 또는 적어도 약 90%의 RebI, 또는 적어도 약 95%의 RebI이다.
일부 구현예에서, 기질은 나한과 추출물 또는 이의 분획으로, 또는 생합성에 의해 생산된 모그롤 또는 모그롤 글리코시드로서 제공된다. 예를 들어, 기질은 모그롤, mog. I-A, mog. I-E, mog. II-A, mog. II-E, mog III, mog IVA, mog. IV 및 시아메노시드로부터 선택된 기질을 하나 이상 포함한다. 당화 생성물은 mog. IV, mog. IVA, mog. V, mog. VI, isomog. V 및 시아메노시드 중 하나 이상을 포함할 수 있다. 도 18를 참고한다. 다양한 구현예에서, UGT 효소는 모그롤 코어의 C3 및/또는 C24 하이드록실에서의 1 차 당화와, C3 및/또는 C24 1 차 글리코실 기의 1-2 분지형 당화; C3 및/또는 C24 1 차 글리코실 기의 1-6 분지형 당화 중 하나 이상이 가능하다. 일부 구현예에서, 당화 생성물은 mog. V 또는 시아메노시드이다. 다양한 구현예에서, UGT 효소는 서열 번호: 13 내지 17, 29, 33 내지 39, 46, 54, 60, 71 내지 80, 및 82 내지 84 중 하나와 적어도 약 70% (또는 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%)의 서열 동일성을 갖는 아미노산 서열을 포함하는 효소로부터 선택된다. 표 8 및 9를 참고한다. 다양한 구현예에서, 상기 방법에 의해 기질이 당화 생성물로 (회수된 조성물의 총 모그롤 글리코시드 성분에 대해) 적어도 약 40% 전환되거나, 기질이 당화 생성물로 적어도 약 50% 전환되거나, 기질이 당화 생성물로 적어도 약 75% 전환되거나, 기질이 당화 생성물로 적어도 약 90% 전환되거나, 기질이 당화 생성물로 적어도 약 95% 전환된다.
다양한 구현예에서, 복합 배지 또는 최소 배지에서의 성장에 의해 박테리아 세포의 바이오매스가 생성된다. 이후, 박테리아 세포는 하나 이상의 탄소원을 갖는 당화용 기질의 존재 하에서 배양된다. 일부 구현예에서, 상기 탄소원은 포도당, 수크로스, 과당, 자일로스 및 글리세롤 중 하나 이상을 포함한다. 일부 구현예에서, 상기 탄소원은 수크로스와, 글리세롤 및 포도당 중 하나 이상을 포함한다. 일반적으로, 적합한 탄소원은 C1 내지 C6의 탄소원을 포함한다. 배양 조건은 호기성, 미세호기성 및 혐기성으로부터 선택될 수 있다. 배양은 배치, 연속 또는 반-연속 공정으로 수행될 수 있다. 예를 들어, 일부 구현예에서, 상기 방법은 유가(fed batch) 공정으로 수행된다.
일부 구현예에서, 기질은 박테리아 세포와 함께 약 72 시간 이하, 또는 약 48 시간 이하 동안 인큐베이션된다. 특정 구현예에서, 기질은 박테리아 세포와 함께 1 내지 3 시간 동안, 예를 들어 교반 탱크 발효기를 사용하여 인큐베이션된다. 다양한 구현예에서, 글리코시드 생성물은 본원의 다른 부분에 기재된 것과 같이 회수된다. 예를 들어, 회수는 배양물의 pH를 약 pH 5 미만까지 낮추거나, 또는 pH를 약 pH 9 초과까지 상승시키는 단계, 온도를 적어도 약 50℃까지 상승시키는 단계, 및 하나 이상의 글리코시드 용해도 개선제의 첨가 단계 중 하나 이상; 및 이후의 효소 또는 바이오매스의 제거 단계를 포함할 수 있다.
다른 양태 및 구현예에서, 본 발명은 테르페노이드 글리코시드 기질을 포함하는 기질의 당화 생산성이 높은 조작된 UDP-의존성 당전이(UGT) 효소를 제공하며, 이는 본원에 기재된 박테리아 세포 및 방법과 관련된다. 일부 구현예에서, 조작된 UGT 효소는 서열 번호: 13과 적어도 약 70%의 서열 동일성 (또는 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%의 서열 동일성)을 갖고, 테르페노이드 글리코시드 기질(예를 들어, 스테비올 글리코시드 기질)에 대한 당화 활성을 개선시키는 아미노산 서열을 포함한다. 일부 구현예에서, 아미노산 변형은 서열 번호: 13에 대해 V397S, V397C, G5N, S20E, S23D, R45Y, H59P, G94S, K97E, M150L, I185F, A206P, G210E, Q237R, M250K, A251E, C252L, G259E, Q263Y, I287M, C288F, V336I, F338L, D351E, F186I, F186M, F186T, L418F, A451T, A451L, T453K, T453R, V456S, V456W, V456T, V456M로부터 선택된 하나 이상 (예를 들어, 적어도 2, 3, 4, 5, 6, 7, 8, 9 또는 10 개)의 아미노산 치환을 포함한다. 표 2를 참고한다. 대안적으로 또는 추가로, 아미노산 변형은 서열 번호: 13의 잔기 270 내지 281이, 주로 글리신과 세린 아미노산으로 구성된 5 내지 15 개의 아미노산으로 치환된 것을 포함한다. 대안적으로 또는 추가로, 아미노산 변형은 서열 번호: 13에 대한 위치 3에 1 개 또는 2 개의 아미노산이 삽입되고/거나, 서열 번호: 13의 C-말단에 하나의 아미노산이 첨가된 것을 포함한다.
일부 구현예에서, UGT 효소는 서열 번호: 13의 아미노산 270 내지 281이 서열 GGSGGS(서열 번호: 85)로 대체된다. 이러한 구현예 또는 다른 구현예에서, UGT 효소는 서열 번호: 13의 위치 3에 Arg이 삽입되거나, 위치 2와 3 사이에 Ile-Arg이 삽입된다. 이러한 구현예 또는 다른 구현예에서, UGT 효소는 서열 번호: 13에 대해 G5N, F186T 및 V397S로부터 선택된 하나 이상의 (또는 모든) 치환을 포함한다. 이 양태의 예시적인 UGT 효소는 서열 번호: 14의 아미노산 서열을 포함한다. 도 5를 참고한다.
또 다른 구현예에서, UGT 효소는 서열 번호: 14와 적어도 약 70% (또는 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%)의 서열 동일성을 갖고, 테르페노이드 글리코시드 기질(예를 들어, 스테비올 글리코시드 기질)에 대한 당화 활성을 개선시키는 아미노산 서열을 포함한다. 예를 들어, 아미노산 변성은 이하의 것들로부터 선택된 하나 이상(예를 들어, 적어도 2, 3, 4, 5, 6, 7, 8, 9 또는 10 개)의 아미노산 치환을 포함할 수 있다: 서열 번호: 14에 대한 V395A, Q263Y, D269R, K97E, Q262E, H59P, G259E, M150L, Y267H, T3R, V95Q, A238E, S308Q, Q237R, R45Y, E254D, L203I, S151R, S123D, D351E, T453M, G94T, T186M, V336I, L58S, F338L, F51W, C252L, M250D, A251E, C252V, A79P, W401F, S323A, A251E, A130D, S42E, H400Y, S266R, S23D, P56A, A206P, M250K, A143W, V456T, G94S, I427F, T186I, T453F, C252R, V38F, R45F, T37S, Q244K, L11I, I287M, V31P, T43D 및 P39T. 표 3을 참고한다. 대안적으로 또는 추가로, 아미노산 변형은 주로 글리신과 세린 아미노산으로 구성된 5 내지 15 개의 아미노산의 링커에 의한 서열 번호: 14의 잔기 270 내지 281의 결실을 포함한다. 대안적으로 또는 추가로, UGT 효소는 서열 번호: 14에 대한 위치 3에 1 개 또는 2 개의 아미노산이 삽입되고, 서열 번호: 14의 C-말단에 하나의 아미노산이 첨가된 것을 포함한다.
일부 구현예에서, UGT 효소는 서열 번호: 14의 아미노산 270 내지 281이, 주로 Ser 및 Gly로 구성된 6 내지 12 개의 아미노산의 링커 서열로 치환된다. 이 구현예 또는 다른 구현예에서, UGT 효소는 서열 번호: 14에 대해 H59P, A238E 및 L417F로부터 선택된 하나 이상의 치환 (또는 모든 치환)을 포함한다. 이러한 구현예 또는 다른 구현예에서, UGT 효소는 서열 번호: 14의 A2와 T3 사이에 삽입 또는 Arg-Arg를 포함한다. 이 구현예에 의한 예시적인 UGT 효소는 서열 번호: 15의 아미노산 서열을 포함한다. 도 9를 참고한다.
또 다른 구현예에서, UGT 효소는 서열 번호: 15와 적어도 약 70% (또는 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%)의 서열 동일성을 갖고, 테르페노이드 글리코시드 기질(예를 들어, 스테비올 글리코시드 기질)에 대한 당화 활성을 개선시키는 아미노산 치환을 하나 이상 갖는 아미노산 서열을 포함한다. 이러한 아미노산 치환은 서열 번호: 15에 대한 위치 125, 152, 153 및 442로부터 선택된 위치에 있을 수 있다. 일부 구현예에서, UGT 효소는 서열 번호: 15에 대해 M152A, S153A, P442D 및 S125V로부터 선택된 하나 이상의 (또는 모든) 아미노산 치환을 포함한다. 표 4를 참고한다. 이 구현예에 의한 예시적인 UGT 효소는 서열 번호: 16의 아미노산 서열을 포함한다. 도 7를 참고한다.
다른 양태 및 구현예에서, 본 발명은 모그롤 또는 모그롤 글리코시드 기질의 당화를 위한 UGT 효소(이를 발현하는 박테리아 세포 포함)를 제공한다. 이러한 구현예에서, 상기 방법은 기질을 UDP-당(예를 들어, UDP-포도당)의 존재 하에 UGT 효소와 접촉시키는 단계를 포함한다. UGT 효소는 이하의 것들로부터 선택된 아미노산 서열과 적어도 약 80% (또는 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%)의 서열 동일성을 갖는 아미노산 서열을 포함할 수 있다: 서열 번호: 84, 서열 번호: 80, 서열 번호: 46, 서열 번호: 83, 서열 번호: 82, 서열 번호: 73, 서열 번호: 72, 서열 번호: 78, 서열 번호: 54, 서열 번호: 74, 서열 번호: 75, 서열 번호: 76, 서열 번호: 13, 서열 번호: 14, 서열 번호: 15, 서열 번호: 16, 서열 번호: 29, 및 서열 번호: 79. 표 8 및 9를 참고한다.
다양한 구현예에서, 기질은 서열 번호: 84, 서열 번호: 80, 서열 번호: 83, 서열 번호: 73, 서열 번호: 72, 서열 번호: 54, 및 서열 번호: 13과 적어도 약 80% (또는 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%)의 서열 동일성을 갖는 아미노산 서열을 포함하는 UGT 효소와 접촉된다.
이러한 구현예에서, 모그롤 또는 모그롤 글리코시드 기질은 식물 추출물 또는 이의 분획, 예컨대 나한과 추출물 또는 이의 분획으로 제공될 수 있다. 예를 들어, 기질은 모그롤, mog. I-A, mog. I-E, mog. II-A, mog. II-E, mog III, mog IVA, mog. IV 및 시아메노시드로부터 선택된 기질을 하나 이상 포함하거나, 또는 이것이 풍부할 수 있다. 이러한 구현예에서, 당화 생성물은 mog. IV, mog. IVA, mog. V, mog. VI, isomog V 및 시아메노시드 중 하나 이상을 포함할 수 있다. 예를 들어, UGT 효소는 모그롤 코어의 C3 및/또는 C24 하이드록실에서의 1 차 당화, 및/또는 C3 및/또는 C24 1 차 글리코실 기의 1-2 및/또는 1-6 분지형 당화 중 하나 이상이 가능하다. 본 구현예에 의한 예시적인 생성물은 mog. V이다. (mog. IV, mog. VI, 및 시아메노시드를 포함하는) 다른 모그로시드 생성물이 제조될 수 있으며, UGT 효소는 당화 활성에 의해 선택될 수 있다.
모그롤 글리코시드의 생산에 대한 일부 구현예에서, 기질은 UGT 효소를 발현하는 세포와 함께 배양된다. 예시적인 미생물 세포는 박테리아 세포, 예컨대 에스체리쉬아, 바실러스, 로도박터, 자이모모나스 또는 슈도모나스 종을 포함한다. 예시적인 박테리아 세포는 에스체리쉬아 콜리, 바실러스 서브틸리스, 로도박터 캅슐라투스, 로도박터 스패로이데스, 자이모모나스 모빌리스 또는 슈도모나스 푸티다이다. 일부 구현예에서, 박테리아 세포는 E. 콜리이다. 다양한 구현예에서, 박테리아 세포는 본원에 기재된 전세포 생물전환 공정을 위해, 예를 들어 UDP-당의 이용가능성을 증가시키는 유전자 변형을 하나 이상 갖고/거나 본원의 다른 부분에 기재된 수크로스 합성효소를 발현하도록 조작된다.
다른 구현예에서, 미생물 세포는 선택적으로 사카로마이세스 세르비시애, 피키아 파스토리스 및 야로우위아 리포리티카를 포함하는, 사카로마이세스, 피키아 또는 야로우위아로부터 선택된 효모 세포이다.
그러나, 또 다른 구현예에서, 기질은 UGT 효소를 포함한 세포 용해물과 함께 인큐베이션되거나, 공지의 기술에 의해 정제된 재조합 UGT 효소와 함께 인큐베이션된다. 당화 반응을 지원하기 위한 UDP-당은 외부에서 첨가될 수 있다.
다양한 구현예에서, 당화 생성물은 이하에 기재된 방법에 의해 회수된다. 이러한 방법은 반응 및 배양물의 pH를 약 pH 5 미만까지 낮추거나, 또는 반응물 또는 배양물의 pH를 약 pH 9 초과까지 상승시키는 단계, 온도를 적어도 약 50℃까지 상승시키는 단계, 및 하나 이상의 글리코시드 용해도 개선제를 첨가하는 단계 중 하나 이상; 및 이후의 효소 또는 바이오매스의 제거 단계를 포함할 수 있다.
일부 양태에서, 본 발명은 글리코시드 생성물의 생산 및 회수 방법을 제공한다. 이러한 구현예에서, 상기 방법은 무-세포 반응물 또는 미생물 배양물에서, 하나 이상의 당 모이어티의 효소적 전이에 의해 당화용 기질을 목표 글리코시드 생성물로 전환시키는 단계를 포함하는데, 이는 선택적으로 본원에 기재된 방법, UGT 효소 및/또는 박테리아 세포를 이용할 수 있다. 상기 방법은 반응 및 배양물으로부터 당화 생성물을 회수하되, 상기 회수는 반응물 또는 배양물의 pH를 약 pH 5 미만까지 낮추거나, 반응물 또는 배양물의 pH를 약 pH 9 초과까지 상승시키는 단계, 온도를 적어도 약 50℃까지 상승시키는 단계, 및 하나 이상의 글리코시드 가용화제를 첨가하는 단계 중 하나 이상; 및 이후의 효소 또는 바이오매스의 제거 단계를 추가로 포함한다.
종래에, 바이오매스의 제거는 큰 세포 찌꺼기를 제거하고, 하류에서 정제를 복잡하게 만들 세포의 추가 파괴를 피하기 위한 회수의 제1 단계이다. 그러나, 본 발명의 일부 구현예에 의하면, 배양 물질은 매우 점도가 높아서, 처리에 어려움이 있다. 예를 들어, 원심분리에 의한 바이오매스 제거의 효율은 수확된 배양 물질의 물리적 성질에 의해 제한될 수 있다. 바이오매스 또는 효소를 제거하기 전에 본원에 기재된 배양 물질을 처리함으로써, 고순도의 글리코시드 생성물, 백색 색상, 용이한 가용화, 무취 및 높은 회수 수율을 포함한 바람직한 품질을 갖는 생성물을 생산할 수 있다. 특히, 배양물에 대한 초기의 pH 및 온도 조절은 배지의 유체 특징을 변화시키고, 디스크 스택 분리기의 바이오매스 제거의 효율을 증가시킬 수 있다. 또한, 글리코시드 생성물의 용해도 및 이에 의한 수율은 pH 및 온도의 조절에 의해 실질적으로 증가하여, 고체 상의 글리코시드 생성물의 유의한 손실을 피한다.
다양한 구현예에서, 당화 생성물은 테르페노이드 글리코시드, 예컨대 (예를 들어, 본원에서 논의된 바와 같은) RebM, RebE, RebD, RebB 및 RebI 중 하나 이상이다. 일부 구현예에서, 당화 생성물은 RebM이다. 다른 구현예에서, 당화 생성물은 (상기에 기재된 바와 같이) mog. IV, mog. IVA, mog. V, mog. VI, isomog. V 및 시아메노시드 중 하나 이상을 포함한다. 예시적인 모그로시드 생성물은 mog. V이다.
일부 구현예에서, 효소적 전이는 미생물 배양물에서 일어나는데, 상기 미생물 배양물은 하나 이상의 UGT 효소를 발현하는 미생물 균주를 포함한다(예를 들어, 공급된 기질을 사용한 전세포 생물전환). 다른 구현예에서, 미생물 균주는 당화용 기질(예를 들어, 스테비올 또는 모그롤)을 생산하는 생합성 경로를 추가로 발현하고, 기질의 당화를 위한 하나 이상의 UGT 효소를 발현한다. 예를 들어, 미국 특허 제10,463,062호 및 WO 2019/169027를 참고하는데, 상기 문헌은 전문이 본원에 전문이 참조로서 포함된다. 다양한 구현예에서, 효소적 전이는 효모 균주, 예컨대 사카로마이세스 세레비시애, 피키아 파스토리스 및 야로우 리포라이티카를 포함하는 사카로마이세스, 피키아 또는 야로우로부터 선택된 것들의 미생물 배양에 의한다. 다른 구현예에서, 효소적 전이는 본원에 기재된 박테리아 세포의 미생물 배양에 의하며, 여기에는 일부 구현예에서 전세포 생물전환을 위해 조작된 (예를 들어, 기재한 바와 같이, 하나 이상의 수크로스 합성효소를 발현하고/거나, UDP-당의 이용가능성을 개선시키는 본원에 기재된 하나 이상의 유전자 변형을 포함하는) E. 콜리 세포가 포함된다. 예를 들어, 박테리아 세포는 이하의 유전자 변형을 포함할 수 있는데: ushA 및 galETKM, 또는 이들의 병렬상동체는 결실되거나, 불활성화되거나, 발현 또는 활성이 감소됨; pgi 또는 이의 병렬상동체는 결실되거나, 불활성화되거나, 발현 또는 활성이 감소됨; E. 콜리 pgm (서열 번호: 92) 및/또는 ycjU (서열 번호: 94), 또는 이들의 병렬상동체 또는 유도체(예를 들어, 야생형 효소보다 활성이 높은 유도체)는 과다 발현됨; 및/또는 E. 콜리 galU (서열 번호: 93) 및/또는 비피도박테리움 비피둠 ugpA (서열 번호: 95), 또는 이들의 병렬상동체 또는 유도체(예를 들어, 야생형 효소보다 활성이 높은 유도체)는 과다 발현됨.
일부 구현예에서, 효소적 전이는 부피가 적어도 약 10,000 L, 또는 적어도 약 50,000 L, 또는 적어도 약 100,000 L, 또는 적어도 약 150,000 L, 또는 적어도 약 200,000 L, 또는 적어도 약 500,000 L인 생물반응기에서 일어난다. 다양한 구현예에서, 배양 물질은 글리코시드 회수를 위해 배치, 연속 또는 반-연속 방식으로 수확될 수 있다.
일부 구현예에서, 수확된 배양 물질은 pH가 예를 들어 약 pH 2 내지 약 pH 5의 범위 내로 조절된다. 일부 구현예에서, pH는 약 2 내지 약 4 범위의 pH, 또는 약 2 내지 약 3.5 범위의 pH, 또는 약 2.5 내지 약 4 범위의 pH로 조절된다. 특정 구현예에서, pH는 약 2.5, 약 3.0 또는 약 3.5로 조절된다. 또 다른 구현예에서, pH는 염기성 pH 범위, 예컨대 약 9 내지 약 12의 범위 내, 또는 약 9.5 내지 약 12, 또는 약 10 내지 12의 범위 내(예를 들어, 약 11, 약 11.5 또는 약 12)의 pH로 조절된다. 다양한 구현예에서, pH 조절은 글리코시드 용해도를 개선시키고/거나, 수확된 물질의 물리적 특성을 개선시켜서, 생성물의 큰 손실없이도 바이오매스 및/또는 효소가 더욱 용이하게 제거된다. pH 조절은 공지의 방법에 의하면, 유기산이나 무기산, 또는 하이드록시드 이온의 첨가 또는 적정에 의할 수 있다.
대안적으로 또는 추가로, 수확된 배양 물질의 온도는 약 50℃ 내지 약 90℃, 예컨대 약 50℃ 내지 약 80℃의 온도로 조절된다. 예를 들어, 일부 구현예에서, 온도는 약 55℃ 내지 약 75℃ 범위의 온도, 또는 약 65℃ 내지 약 75℃ 범위의 온도로 조절된다. 일부 구현예에서, 온도는 약 70℃로 조절된다. 다양한 구현예에서, 온도 조절은 글리코시드 용해도를 개선시키고/거나, 수확된 물질의 물리적 특성을 개선시켜, 바이오매스 및/또는 효소가 생성물의 큰 손실없이도 더욱 용이하게 제거된다. 일부 구현예에서, 온도 조절은 반응 배지 또는 배양물을 예열된 하베스트 탱크로 전달함으로써 일어난다. 일부 구현예에서, 온도 조절은 직렬로, 예를 들어, 보유 루프(retention loop)를 통과하여 다음 유닛 가동으로 보냄으로써 일어난다.
일부 구현예에서, 수확된 반응물 또는 배양 배지는 pH 및/또는 온도 조절을 위해 반응 탱크로부터 하베스트 탱크로 전달되며, 이는 동일한 하베스트 탱크 또는 상이한 하베스트 탱크에서 일어날 수 있다. 일부 구현예에서. pH 및/또는 온도 조절은 연속 유닛 가동에서와 같이 직렬로 일어난다. 온도 및 pH 조절은 임의의 순서로 또는 동시에 일어날 수 있다. 일부 구현예에서, pH 조절은 온도 조절에 앞서 일어난다. 다른 구현예에서, 온도 조절은 pH 조절에 앞서 일어난다. 또 다른 구현예에서, pH 조절과 온도 조절은 실질적으로 동시에 일어난다.
대안적으로 또는 추가로, 상기 방법은 하나 이상의 글리코시드 용해도 개선제를 첨가하는 단계를 포함한다. 예시적인 용해도 개선제는 (유기산 및 중합체를 포함하는) 알콜 관능기가 있는 화학 시약 및/또는 (에테르, 에스테르, 알데히드 및 케톤 관능기가 있는 것들을 포함하는) 극성 시약을 포함하며, 여기에는 다른 것들 중에서도 글리세롤, 1,3-프로판디올, 폴리비닐 알콜, 폴리에틸렌 글리콜이 포함된다. 다른 예시적인 용해도 개선제는 유기산, 단당류 및 다당류를 포함한다. 다른 용해도 개선제는, US 2020/0268026에 기재되어 있으며, 상기 문헌은 전문이 본원에 참조로서 포함된다. 글리코시드 용해도가 개선되면, 생성물의 큰 손실없이도 용이하게 바이오매스 및/또는 효소를 제거할 수 있다. 일반적으로, 용해도 개선제는 수확된 배양 물질에 약 0.1 wt% 내지 약 2 wt%의 범위, 예컨대 약 0.1 wt% 내지 약 1 wt%의 범위(예를 들어, 약 0.5 wt%)로 첨가될 수 있다.
이후, 바이오매스 및/또는 효소가 원심분리에 의해 제거되어, 정화된 배지가 제조된다. 바이오매스의 제거를 위한 예시적인 공정은 디스크 스택 원심분리를 이용하여, 액체 상과 고체 상을 분리한다. 정화된 배지(액체 상)는 글리코시드 생성물의 정화를 위한 추가 공정에 사용하기 위해 회수된다. 분리된 바이오매스(고체 상)은 추가 글리코시드 생성물의 회수를 위해 재가공될 수 있거나, 또는 대안적으로 폐기물로 처리된다.
일부 구현예에서, 글리코시드는 정화된 배지로부터 결정화된다. 일부 구현예에서, 상기 공정은 1 개, 2 개 또는 3 개의 결정화 단계를 포함한다. 일부 구현예에서, 글리코시드 생성물은 여과, 이온 교환, 활성탄, 벤토나이트, 친화성 크로마토그래피 및 소화로부터 선택된 하나 이상의 공정을 사용하여 정화된 배지로부터 정제되며, 이는 선택적으로 결정화 이전 및/또는 재결정화 이전에 수행될 수 있다. 이 공정은 고순도의 생성물, 매력적인 색상(RebM의 경우, 백색), 손쉬운 용해, 무취 및 높은 회수 수율을 얻도록 선택될 수 있다. 일부 구현예에서, 상기 방법은 친화성 크로마토그래피, 예컨대 스티렌-디비닐벤젠 흡착성 수지, 강산성 양이온 교환 수지, 약산성 양이온 교환 수지, 강염기성 음이온 교환 수지, 약염기성 음이온 교환 수지 및 소수성 상호작용 수지 중 하나 이상에 의한 것을 이용한다. 다른 구현예에서, 상기 공정은 미국 특허 제10,213,707호에 기재된 시뮬레이션 이동층 크로마토그래피를 이용하며, 상기 문헌은 전문이 본원에 참조로서 포함된다. 또 다른 구현예에서, 회수 공정은 비-크로마토그래피성이어서(즉, 크로마토그래피 단계가 없어서), 상당한 비용적인 장점을 제공한다. 예를 들어, 바이오매스 제거 후의 회수 공정은 여과 및 결정화 단계를 본질적으로 포함하거나, 또는 이로서 이루어질 수 있다. 일부 구현예에서, 회수 공정은 유기 용매(예를 들어, 에탄올)를 이용하나, 다른 구현예에서, 상기 공정은 전적으로 수성 용매에 의한다. 일부 구현예에서, 2 개의 결정화 단계가 이용된다.
일부 구현예에서, 회수 공정은 하나 이상의 접선 유동 여과(TFF) 단계를 포함할 것이다. 예를 들어, 약 5 kD의 기공 크기를 갖는 필터에 의한 TFF에 의해, 내독소, 큰 단백질 및 다른 세포 찌꺼기를 제거할 수 있으며, 최종 분말 생성물의 용해도도 개선시킬 수 있다. 일부 구현예에서, 글리코시드 생성물은 초기 결정화에 앞서, 선택적으로 약 5 kD의 막 기공 크기를 갖는 접선 유동 여과에 의해 정제된다. 또한, 하류에서 기공 크기가 약 0.5 kD인 필터에 의한 TFF를 이용하여, 소분자의 불순물 및 염을 제거하고/거나, 재결정화를 위한 모액(mother liquor)을 농축할 수도 있다. 일부 구현예에서, 재결정화에 앞서, 약 0.5 kD의 기공 크기에 의한 TFF를 이용한다.
각각의 경우, 결정화 단계는 정적 결정화, 교반 결정화 및 증발 결정화 중 하나 이상의 상을 포함할 수 있다. 예를 들어, 결정화 단계는 정지 상 및 이후의 교반 상을 포함하여, 결정의 형태를 조절할 수 있다. 정지 상은 결정성 도메인의 정도가 심한 큰 결정으로 자랄 수 있다. 결정화 공정은 결정을 분주하는 공정을 포함할 수 있거나, 또는 일부 구현예에서는 결정의 분주 공정과 관계 없다(즉, 결정은 자발적으로 형성된다). 다양한 구현예에서, 결정화 용매는 물 또는 물/에탄올을 포함한다. 예시적인 결정화 용매는 물과 함께, 선택적으로 약 5 부피% 내지 약 50 부피%의 에탄올, 또는 약 25 부피% 내지 약 50 부피%의 에탄올(예를 들어, 약 30 부피% 내지 약 40 부피%의 에탄올)을 포함한다. 일부 구현예에서, 정지 상 동안 결정을 분주한 후, 교반 상에서는 결정이 신속히 자라서, 무정형 도메인의 정도가 높아질 것이다. 이 공정을 이용하면, 생성된 결정의 최종 용해도가 더욱 양호해지고, 고순도의 글리코시드 생성물을 가질 수 있으며, 회수 및 세척이 더욱 용이해질 수 있다.
다양한 구현예에서, 글리코시드 생성물은 재결정화에 앞서, 용매(예컨대, 물 및/또는 에탄올이나, 이에 제한되지 않음)에 재가용화되며; 이는 용매 및 글리코시드 생성물의 용액 또는 현탁액의 pH를 약 pH 5 미만으로 낮추거나, 또는 용액 또는 현탁액의 pH를 약 pH 9 초과까지 상승시키는 단계, 적어도 약 50℃까지 가열하는 단계, 및 하나 이상의 글리코시드 가용화제를 첨가하는 단계 중 하나 이상을 이용할 수 있다. pH, 온도, 글리코시드 가용화제 농도에 대한 목표 값은 대안적으로 바이오매스의 제거에 이용된 것과 같을 수 있다. 예를 들어, 글리코시드 생성물의 용액 또는 현탁액은 pH가 약 2 내지 약 5의 범위 내로 조절될 수 있다. 다른 구현예에서, pH는 염기성 pH 범위, 예컨대 약 9 내지 약 12의 범위 내, 또는 약 9.5 또는 약 10 내지 약 12의 범위 내의 pH로 조절된다. pH 조절은 공지의 방법에 따라 유기산 또는 무기산 또는 하이드록시드 이온의 첨가 또는 적정에 의할 수 있다. 또 다른 구현예에서, 재결정화는 약 4 내지 약 12의 pH에서 수행된다. 대안적으로 또는 추가로, 용액 또는 현탁액의 온도는 약 50℃ 내지 약 90℃, 예컨대 약 50℃ 내지 약 80℃의 온도로 조절된다. 예시적인 재결정화 용매는 물과 함께, 선택적으로 약 5 부피% 내지 약 50 부피%의 에탄올, 또는 약 25 부피% 내지 약 50 부피%의 에탄올(예를 들어, 약 30 부피% 내지 약 40 부피%의 에탄올)을 포함한다. 대안적으로 또는 추가로, 용해도 개선제는 기재한 바와 같이, 용액/현탁액에 약 0.1 wt% 내지 약 2 wt%의 범위, 예컨대 약 0.1 wt% 내지 약 1 wt%의 범위(예를 들어, 약 0.5 wt%)로 첨가될 수 있다. 예시적인 용해도 개선제는 글리세롤을 포함한다.
일부 구현예에서, 결정화 이후, 생성된 결정을 예를 들어 바스켓 원심분리 또는 벨트 필터를 사용하여 단리함으로써, 글리코시드의 습윤 케이크(예를 들어, 스테비올 글리코시드 또는 모그롤 글리코시드의 습윤 케이크)가 단리된다. 바스켓 원심분리 단계에서, 세척은 물에 의한 세척을 이용할 수 있거나, 또는 대안적으로 다른 헹굼(예를 들어, 냉수/에탄올)을 이용할 수 있다. 일부 구현예에서, 케이크는 용해되거나, 재결정화된다. 재결정화에 의한 습윤 케이크는 선택적으로 벨트 건조기, 패들 건조기 또는 스프레이 건조기를 사용하여 이후 건조될 수 있다. 건조된 케이크는 분쇄되어, 포장될 수 있다.
재결정화에 앞서, 글리코시드 용액(예를 들어, RebM 및 다른 스테비올 글리코시드)를 여과하여, 불순물을 제거할 수 있다. 필터는 약 0.2 마이크론의 필터일 수 있다. 대안적으로, 다른 기공 크기, 예컨대 약 0.45 마이크론의 필터 및 약 1.2 마이크론의 필터도 이용할 수 있다. 구현예에 의하면, 필터의 물질은 불순물을 예컨대 흡착에 의해 추가로 제거하도록 선택될 수 있다. 예를 들어, 친수성 물질, 예컨대 폴리에테르술폰(PES)은 폴리프로필렌과 같은 더욱 소수성인 물질에 비해 유의한 장점이 있다. 다른 예시적인 친수성 필터 물질은, 나일론, 셀룰로스 아세테이트, 셀룰로스 니트레이트, 및 통상 친수성 물질을 생성하도록 기능화된 소수성 물질(예컨대, 플루오로알킬 말단 폴리에틸렌 글리콜에 의해 코팅된 PTFE 또는 PVDF)을 포함한다.
다양한 구현예에서, 회수 공정에서 목표 글리코시드의 고순도 조성물이 생성된다. 예를 들어, 일부 구현예에서, 목표 글리코시드 생성물은 회수된 조성물의 적어도 약 75 중량%이다. 일부 구현예에서, 목표 글리코시드 생성물은 회수된 조성물의 적어도 약 80 중량%, 또는 적어도 약 90 중량%, 또는 적어도 약 95 중량%이다. 예시적인 구현예에서, 당화 생성물의 수율은 배양물 또는 반응물의 리터당 적어도 약 25 그램의 생성물(g/L), 또는 적어도 약 50 g/L, 또는 적어도 약 75 g/L, 또는 적어도 약 100 g/L, 또는 적어도 약 125 g/L, 또는 적어도 약 150 g/L, 또는 적어도 약 200 g/L이다.
일부 양태에서, 본 발명은 당화 생성물, 예컨대 스테비올 글리코시드 또는 모그롤 글리코시드를 포함하는 생성물(예를 들어, RebM 또는 mog. V)의 제조 방법을 제공한다. 상기 방법은 (본 개시 내용에 의해 생산된) 글리코시드 생성물을 식품, 음료, 구강 케어 제품, 감미료, 착향제와 같은 제품 또는 다른 제품에 혼입시키는 단계를 포함한다. 본 발명에 의해 제조된 정제 글리코시드는 식품, 음료, 결착제(texturant)(예를 들어, 전분, 섬유, 검, 지방 및 지방 모사체 및 유화제), 약학적 조성물, 담배 제품, 영양 조성물, 구강 위생 조성물, 및 화장품 조성물을 포함하나, 이에 제한되지 않는 다양한 제품들에서 사용될 수 있다. 글리코시드들의 조합이 이용될 수 있는 향의 비-제한적인 예로는, 라임, 레몬, 오렌지, 과일, 바나나, 포도, 배, 파인애플, 망고, 쓴 편도(bitter almond), 콜라, 시나몬, 설탕, 솜사탕 및 바닐라 향을 포함한다. 다른 식품 성분의 비-제한적인 예는, 향, 산미료, 및 아미노산, 착색제, 증량제, 변형 전분, 검, 텍스처화제(texturizer), 보존제, 항산화제, 유화제, 안정화제, 증점제 및 겔화제를 포함한다.
일부 양태에서, 본 발명은 여러가지 고-강도 감미료들을 포함한 감미료 제품의 제조 방법을 제공하는데, 상기 여러가지 감미료는 스테비올 글리코시드(예를 들어, RebM, RebE, RebD, RebI 또는 RebB), 모그로시드(예를 들어, mog. IV, mog. IVA, mog. V, mog. VI 또는 isomog. V), 수크랄로스, 아스파르탐(aspartame), 네오탐(neotame), 아드반탐(advantame), 아세술팜(acesulfame) 포타슘, 사카린, 당 알콜(예를 들어, 에리트리톨 또는 자일리톨), 타가토스(tagatose), 사이클라메이트(cyclamate), 네오헤스페리딘 디하이드로칼콘(neohesperidin dihydrochalcone), 네티폴린(gnetifolin) E 및/또는 피세아탄놀(piceatannol) 4'-O-β-D-글루코피라노시드 중 둘 이상을 포함한다. 상기 방법은 감미료 제품을 식품, 음료, 구강 케어 제품, 감미료, 착향제, 또는 상기 기재된 것들을 포함하는 다른 제품에 혼입시키는 단계를 추가로 포함할 수 있다.
목표 글리코시드(들), 예컨대 RebM 또는 mog. V, 및 이를 포함하는 감미료 조성물은, 다양한 생리 활성 물질 또는 기능성 성분과 조합하여 사용될 수 있다. 기능성 성분은 일반적으로 카로테노이드, 식이 섬유, 지방산, 사포닌(saponin), 항산화제, 건강기능성 식품(nutraceutical), 플라보노이드, 이소티오시아네이트, 페놀, 식물 스테롤 및 스타놀(stanol)(파이토스테롤(phytosterol) 및 파이토스타놀(phytotsAnol)); 폴리올; 프리바이오틱스(prebiotics), 프로바이오틱스(probiotics); 파이토에스트로겐(phytoestrogen); 대두 단백질; 술파이드/티올; 아미노산; 단백질; 비타민; 및 미네랄과 같은 카테고리로 분류된다. 기능성 성분은 또한 건강적인 이점에 기초하여 심혈관성, 콜레스테롤-감소성 및 항염증성으로 분류될 수도 있다.
추가로, 목표 글리코시드(들), 예컨대 RebM 및 mog. V와 본 발명에 의해 얻은 감미료 조성물은, 고-강도 감미료로서 적용되어, 맛 특징이 개선된 제로 칼로리, 칼로리 감소 또는 다이어트 식음료 제품을 생산할 수 있다. 이는 또한 드링크, 식품류(foodstuff), 약, 및 설탕을 사용할 수 없는 다른 제품들에도 사용될 수 있다. 추가로, 감미료 조성물은 드링크, 식품류, 및 다른 인간 전용 제품뿐만 아니라 맛 특징이 개선된 동물의 먹이 및 사료를 위한 감미료로 사용될 수 있다.
목표 글리코시드(들)과 감미료 조성물이 사용될 수 있는 제품의 예에는, 보드카, 와인, 맥주, 독주(liquor) 및 사케 등과 같은 알콜 음료; 천연 주스; 청량 음료; 탄산 소프트 드링크; 다이어트 드링크; 제로 칼로리 드링크; 칼로리 감소 드링크 및 식품; 요거트 드링크; 인스턴트 주스; 인스턴트 커피; 분말형 인스턴트 음료; 통조림 제품; 시럽; 된장; 간장; 식초; 드레싱; 마요네즈; 케첩; 카레; 수프; 인스턴트 부용(bouillon); 간장 분말; 식초 분말; 비스킷류; 쌀 비스킷; 크래커; 빵; 초콜릿; 카라멜; 사탕; 추잉검; 젤리; 푸딩; 보존처리된 과채류; 생크림; 잼; 마말레이드; 꽃 향; 분유; 아이스크림; 셔벳; 채소 및 과일 병조림; 삶은 콩 통조림; 달콤한 소스를 넣고 조린 고기와 식품; 농산가공 채소 식품; 해산물; 햄; 소시지; 어묵; 어육 소시지; 생선 페이스트; 바싹 튀긴 생선 제품; 분말 해산물 제품; 냉동 식품 제품; 보존처리된 해초; 보존처리된 고기; 담배; 의료 제품; 및 많은 기타 제품이 포함되나, 이에 제한되지 않는다.
식품류, 드링크, 약, 화장료, 테이블탑 제품(tabletop product) 및 추잉검과 같은 제품을 제조하는 동안, 종래의 방법, 예컨대 혼합, 반죽, 용해, 절임(pickling), 침투, 삼출, 살포, 분무, 주입 및 다른 방법들이 사용될 수 있다.
본원에 사용된 "약(about)"이라는 용어는, 관련 수치값의 ±10%를 의미한다.
본 발명의 다른 양태 및 구현예는 이하의 실시예로부터 명백할 것이다.
실시예
실시예 1: 생물전환 샤시 균주(chassis strain)의 조작
UGT 효소를 발현하는 조작된 E. 콜리 균주를 사용한 스테비올 글리코시드 중간물질의 생물전환(당화)이 US 2020/0087692에 기재되어 있는데, 상기 문헌은 본원에 참조로서 포함된다. US 2020/0087692는 UGT 효소에 대한 중요 기질인 UDP-포도당으로의 자연적인 유입을 증가시키는 박테리아 유전자 변형에 대해 기재한다. UDP-포도당으로의 자연적인 유입이 많을수록, UGT에 이용가능한 기질의 양을 증가시킴으로써 UGT 성능이 더욱 커진다. 상기 유전자 변형에 의해, 공급 기질을 레바우디오시드 및 모그로시드와 같지만, 이에 제한되지 않는 당화 생성물로 전환시키는 세포의 능력이 발생된다. 당화를 위한 다른 기질은 본원에 기재되어 있다. 유전자 변형은 이하의 것들을 포함한다: UDP-포도당을 소모하는 효소의 결실 또는 불활성화(ushA, galETKM); UDP-포도당의 전구체인 포도당-6-포스페이트(G6P)를 소모하는 효소의 결실 또는 불활성화(예를 들어, pgi); 및 G6P를 포도당-1-포스페이트(G1P)를 통해 UDP-포도당으로 전환시키는 효소의 과다 발현(예를 들어, pgm, galU). 변형 ΔushA, ΔgalETKM, Δpgi 및 pgm과 galU의 보완을 받는 E. 콜리 균주를, 아래에서 "샤시 균주"라고 한다
추가 염색체 변형들에 대해, 생물전환이 샤시 균주에 비해 개선되었는지 시험하였다. 도 1은 2 개의 추가 염색체 변형에 의한 스테비올 글리코시드 생물전환의 개선을 나타낸다. 개선 배수는 전체 스테비올 글리코시드의 전환율에 대한 것이다. 스테비아 잎 추출물, 수크로스 및 포도당을, 서열 번호: 15 및 25의 UGT 효소 및 서열 번호: 11의 수크로스 합성효소를 발현하는 생물전환 균주에 공급하였다. 생물전환은 37℃에서 48 시간 동안 일어났다. 역상 LC DAD에 의해 데이터를 정량화하여, 스테비올 글리코시드의 전환을 정량화하였다. 도 1에서 1로 나타난 바와 같이, otsA 및 otsB의 결실 시, 스테비올 글리코시드의 생물전환이 샤시 균주에 비해 개선된 것으로 나타났다. 또한, (도 1에서 2로 나타난) ugpA의 과다 발현은, 전체 스테비올 글리코시드의 생물전환을 추가로 개선시켰다.
다른 박테리아 유전자들도 과다 발현되었고, 서열 번호: 14 및 24의 UGT 효소를 발현하는 샤시 균주와 비교하여 생물전환을 시험하였다. 도 2는 플라스미드에서 보완된 일련의 과다 발현 유전자들에 의한 스테비올 글리코시드 생물전환의 개선을 나타낸다. 개선 배수는 전체 스테비올 글리코시드의 전환율에 대한 것이다. 스테비아 잎 추출물과 포도당을 생물전환 균주에 공급하였다. 생물전환은 37℃에서 48 시간 동안 일어났다. 역상 LC DAD에 의해 데이터를 정량화하여, 스테비올 글리코시드의 전환을 정량화하였다. 나타난 바와 같이, E. 콜리 pgm (서열 번호: 92), galU (서열 번호: 93), pgm-galU (서열 번호: 92 및 93), ugpA (서열 번호: 95), ycjU (서열 번호: 94), adk (서열 번호: 96), ndk (서열 번호: 97) 및 cmk (서열 번호: 98)에 의한 보완을 포함한 몇몇 유전자 보완은 전체 당화를 개선시켰다.
후보 수크로스 합성효소를 발현하는 균주가 생성되었는데, 이는 수크로스를 공급할 때 UDP-포도당의 이용가능성을 개선시킬 수 있다. 수크로스 합성효소가 발현되면, 수크로스가 과당과 포도당으로 분리된다. 포도당은 UDP-포도당 생합성 쪽으로 갈 수 있다. 그러나, 세포가 탄소원으로서의 글리세롤 또는 포도당에서 성장할 때에도, 유사한 성장 및 UDP-포도당의 이용가능성을 보인다. 도 3은 서열 번호: 15 및 25의 UGT 효소를 발현하는 생물전환 샤시 균주에서 보완된 수크로스 합성효소에 의한 스테비올 글리코시드 생물전환의 개선을 나타낸다. 유전자는 플라스미드 상에서 보완되었다. 개선 배수는 전체 스테비올 글리코시드의 전환율에 대한 것이다. 스테비아 잎 추출물, 수크로스 및 포도당을 생물전환 균주에 공급하였다. 생물전환은 37℃에서 48 시간 동안 일어났다. 역상 LC DAD에 의해 데이터를 정량화하여, 스테비올 글리코시드의 전환을 정량화하였다. 서열 번호: 2, 3, 5, 6, 7, 8, 9, 10 및 11에 의해 나타난 효소를 포함한 몇몇 수크로스 합성효소는 당화를 극적으로 개선시켰다.
도 4는 서열 번호: 14 및 서열 번호: 24의 UGT 효소를 발현하는 생물전환 샤시 균주와 다양한 유전자 녹아웃에 의한 스테비올 글리코시드 생물전환의 개선을 나타낸다. 개선 배수는 전체 스테비올 글리코시드의 전환율에 대한 것이다. 스테비아 잎 추출물과 포도당을 생물전환 균주에 공급하였다. 생물전환은 37℃에서 48 시간 동안 일어났다. 역상 LC DAD에 의해 데이터를 정량화하여, 스테비올 글리코시드의 전환을 정량화하였다. 몇몇 유전자 녹아웃에 의해 생물전환의 개선을 확인하였다.
실시예 2: UGT 조작 및 표적 스테비올 글리코시드의 생산
MbUGT1,2라고 지칭된 UGT 효소는 미국 특허 제10,743,567호에 기재되어 있으며, 상기 문헌은 본원에 전문이 참조로서 포함된다. MbUGT1,2의 조작된 버전(서열 번호: 13)은 US 2020/0087692에 기재되어 있으며, 상기 문헌은 전문이 본원에 참조로서 포함된다. 서열 번호: 13의 UGT 효소는 스테비올 글리코시드의 생물전환의 활성을 개선시키도록 추가로 조작되었다. 도 5는 서열 번호: 14의 조작된 버전에 의한 스테비올 글리코시드 생물전환의 개선을 나타낸다. 개선 배수는 모 UGT 효소(서열 번호: 13)의 스테비올 글리코시드의 전환율 %에 대한 것이다. 서열 번호: 14는 서열 번호: 13에 대해 이하의 돌연변이를 갖는다: G5N, F186T, V397S. 스테비아 잎 추출물과 포도당을 생물전환 균주에 공급하였다. 생물전환은 37℃에서 48 시간 동안 일어났다. 역상 LC DAD에 의해 데이터를 정량화하여, 스테비올 글리코시드의 전환을 정량화하였다.
표 2는 개별 돌연변이로부터 서열 번호: 13의 UGT 효소로의 스테비올 글리코시드 생물전환의 개선을 나타낸다. 개선 배수(FI)는 스테비올 글리코시드의 전환율 %에 대한 것이다.
표 2
*l6은 GGSGGS 링커(서열 번호: 85)를 갖는다. 링커는 서열 번호: 13의 잔기 270-281를 대체한다.
도 6은 추가 조작 버전인 서열 번호: 15에 의한 스테비올 글리코시드 생물전환의 개선을 나타낸다. 개선 배수는 서열 번호: 14의 모 UGT 효소의 스테비올 글리코시드의 전환율 %에 대한 것이다. 서열 번호: 15의 UGT 효소는 서열 번호: 14로부터 이하의 돌연변이를 갖는다: ins_A2_T3_RR, H59P, A238E, L417F. 스테비아 잎 추출물과 포도당을 생물전환 균주에 공급하였다. 생물전환은 37℃에서 48 시간 동안 일어났다. 역상 LC DAD에 의해 데이터를 정량화하여, 스테비올 글리코시드의 전환을 정량화하였다.
표 3는 개별 돌연변이에 의한 서열 번호: 14의 UGT 효소로의 스테비올 글리코시드 생물전환의 개선을 나타낸다. 개선 배수(FI)는 스테비올 글리코시드의 전환율 %에 대한 것이다.
표 3
도 7은 추가 조작 버전인 서열 번호: 16에 의한 스테비올 글리코시드 생물전환의 개선을 나타낸다. 개선 배수는 서열 번호: 15의 모 UGT 효소의 스테비올 글리코시드의 전환율 %에 대한 것이다. 서열 번호: 16은 서열 번호: 15로부터의 이하의 돌연변이를 갖는다: M152A, S153A. 스테비아 잎 추출물과 포도당을 생물전환 균주에 공급하였다. 생물전환은 37℃에서 48 시간 동안 일어났다. 역상 LC DAD에 의해 데이터를 정량화하여, 스테비올 글리코시드의 전환을 정량화하였다.
표 4는 서열 번호: 15에 대한 개별 돌연변이에 의한 스테비올 글리코시드 생물전환의 개선을 나타낸다. 개선 배수(FI)는 스테비올 글리코시드의 전환율 %에 대한 것이다.
표 4
다양한 구현예에서, 4 개의 UGT 효소(도 21 참고)의 공동-발현에 의한 RebM의 생산 외에도, 더 적은 UGT의 발현에 의해 및/또는 기질로서 특정 레바우디오시드를 이용함으로써, 다른 목표 스테비올 글리코시드도 생산할 수 있다. 예를 들어, 특정 스테비아 잎의 추출물은 다량의 RebA 및 스테비오시드를 함유할 수 있다. 1-2 분지화 UGT 효소(예를 들어, 서열 번호: 13-16 중 하나)가 발현되면, 추출물의 레바우디오시드 함량에 따라, RebE와 RebD의 혼합물이 생산될 것이다. 1-3 분지화 UGT 효소(예를 들어, 서열 번호: 19-25)가 발현되면, 실질적으로 RebI가 생산될 것이다. 또한, UGTC19의 발현은 스테비올비오시드 및 RebB에 대한 탈당화에 유리하다.
도 8는 서열 번호: 15의 UGT 효소를 사용한 스테비아 잎 추출물로부터 RebE와 RebD의 혼합물로의 생물전환, 및 서열 번호: 25의 UGT 효소를 사용한 스테비아 잎 추출물로부터 RebI으로의 전환을 나타낸다. (주로 스테비오시드와 RebA를 함유한) 스테비아 잎 추출물, 수크로스 및 포도당을 생물전환 균주에 공급하였다. 생물전환은 37℃에서 48 시간 동안 일어났다. 역상 LC DAD에 의해 데이터를 정량화하여, 스테비올 글리코시드의 전환을 정량화하였다.
도 9는 서열 번호: 31 및 서열 번호: 99의 UGT 효소를 사용한, 스테비아 잎 추출물로부터 RebB와 스테비올비오시드의 혼합물로의 생물전환을 나타낸다. 스테비아 잎 추출물, UDP 및 포도당을 생물전환 균주에 공급하였다. 생물전환은 37℃에서 48 시간 동안 일어났다. 역상 LC DAD에 의해 데이터를 정량화하여, 스테비올 글리코시드의 전환을 정량화하였다.
실시예 3: 스테비올 글리코시드의 회수
종래에, (발효 또는 전세포/용해물 생물전환 공정의 경우) 바이오매스 또는 (정제 효소에 의한 생물전환의 경우) 효소를 먼저 배양물에서 제거하여, 스테비올 글리코시드 (또는 다른 글리코시드 생성물)을 회수 및 정제할 것이다. 종래에는 회수의 초기 단계로서 미생물 세포의 파괴를 최소화하기 위해 바이오매스를 제거하는 것이 선호되는데, 그렇게 하지 않으면 세포 찌꺼기 (크고 작은 분자 모두)로 인해 정제 공정이 복잡해질 것이다. 스테비올 글리코시드의 회수를 위한 종래의 공정은 도 10에 요약되어 있다. 그러나, 본 발명의 구현예에 의하면, 생물전환 균주에 의해 생산된 배지는 점도가 매우 높을 것이며, 이는 바이오매스를 제거하고 스테비올 글리코시드를 회수하는데 어려움이 있다는 것을 나타낸다.
바이오매스의 제거에 앞서, 온도, pH 조절 및/또는 글리코시드 용해도 개선제의 첨가는, 이러한 어려움을 실질적으로 감소시킨다. 예를 들어, 이러한 처리로 인해 배양 물질의 점도를 낮출 수 있어서, 단백질의 침전뿐만 아니라 글리코시드의 가용화가 가능하여, 이후 바이오매스의 제거 및 회수가 용이해진다. 도 11에 개략된 공정에서, ≥95%의 스테비올 글리코시드를 갖는 최종 생성물(예를 들어, RebM)이 생성될 수 있다. 예를 들어, pH를 (시작 시 약 pH 7에서) 약 pH 2 내지 4의 범위로 낮추면, RebM의 용해도가 상당히 향상된다. 대안적으로, (처음에 약 pH 7에서) > pH 11로 pH를 증가시켜도, 용해도를 향상시킬 수 있다. 본 개시 내용에 의하면, pH 조절 및 용해도 개선제에 의해 >100 g/L 또는 >150 g/L 농도의 고순도 스테비올 글리코시드를 얻는 것이 가능하다. 예시적인 용해도 개선제는 글리세롤(예를 들어, 약 0.5 wt%) 및 1,3-프로판디올(예를 들어, 약 0.5 wt%)을 포함한다. 다른 용해도 개선제는 본원에 기재된 다른 것들 외에도, 폴리비닐 알콜, 폴리에틸렌 글리콜 및 폴리프로필렌 글리콜을 포함한다.
도 12는 원심분리 후 수성 배지로부터 바이오매스를 제거하는데 대한 다양한 처리의 효과를 나타낸다. 펠렛의 치밀도와 상청액의 투명도는 바이오매스 제거의 용이함을 나타내는 지표로서 작용한다. 간략히, 30 ml의 발효 배지에 이하의 처리를 단독으로 또는 조합하여 실시하였다: 30 분간 70℃로 가열, pH 3.78으로 산성화, 또는 15% v/v 에탄올의 첨가. 이후, 배지를 3000 rpm으로 5분 동안 원심분리하여, 분리 효율을 결정하였다. 그 결과, 분리에 대한 가열 및 산성화의 긍정적인 효과가 나타난다. 8 번 튜브는 가장 분리가 잘 되었다고 나타나는데, 70℃로 가열하고, pH를 3.78로 조절하였다. 7 번 튜브는 에탄올을 추가하여 pH를 3.78로 조절하였는데, 이 또한 분리가 양호한 것으로 나타났다.
표 5는 가열(70℃, 30 분) 및 산성화(pH 3.6)가 바이오매스의 제거에 필요한 공정 시간에 미치는 영향을 나타낸다. 간략히, 처리 및 비처리된 발효 배지를 GEA Westfalia SB7 분리기를 통과시켜, 바이오매스가 제거되었는지 시험한다. 비처리된 배지에 대해, 각각 L당 0.44 분의 공정 시간으로 SB7를 개별적으로 3 회 통과시킨 후, L당 2.2 분의 공정 시간으로 접선 유동 여과(TFF)를 실시하여, 하류 단계에서 바이오매스를 충분히 제거할 필요가 있다. 가열 및 산성화 처리를 하면, SB7를 단 1 회의 통과하는 것만으로도 충분한 바이오매스의 분리가 가능하여, 공정 시간이 8-배 넘게 빨라진다.
표 5
표 6은 RebM의 정량화 및 회수에 대한 가열과 산성화의 영향을 나타낸다. 간략히, 수성 배지 중의 RebM 농도는 가열(70℃, 15 분)과 산성화(pH 2.5)를 둘 다 처리하기 전과 후에 측정하였다. 처리 시, RebM 회수율이 비처리 조건에 비해 120 - 173% 개선되었다(7 개의 개별 샘플에서 평균 140% 개선됨).
표 6
표 7은 가열과 산 또는 염기 첨가의 조합, 및/또는 소분자 개선제의 첨가가 RebM의 용해도에 미치는 영향을 나타낸다. 발효 배지를 70℃의 일정한 온도로 유지하고, 여기에 표 7에 기재된 바와 같이 처리를 달리 하였다. RebM을 일정하게 교반하면서 천천히 첨가하여, RebM의 최대 용해도를 결정하였다. 배지의 산성화는 RebM 용해도를 증가시켰고, 소분자 개선제(글리세롤, 1,3-프로판디올)의 첨가도 마찬가지였다. 일부 경우, 개선제의 첨가에 더하여 pH의 변화(염기 첨가)로 인해, RebM 용해도가 추가로 증가하였다.
표 7
여기에 기재된 공정은 이하의 것들을 포함하는 바람직한 품질의 생성물을 생산할 수 있다: ≥95%의 글리코시드(예를 들어, RebM 또는 mog.V) 순도, 매력적인 백색 색상, 용이한 가용화, 무취 및 높은 회수 수율. 특히, 배양물에 대해 pH 및 온도를 먼저 조절하면, 배지의 유체 특징을 변화시킬 수 있고, 디스크 스택 분리기의 바이오매스 제거 효율도 증가시킬 수 있다. 또한, 글리코시드의 용해도 및 나아가 수율은 pH 및 온도 조절에 의해 실질적으로 증가하여, (고체 상의 글리코시드 생성물의 실질적인 손실을 피한다).
상기 공정은 하나 이상의 결정화 단계를 이용할 수 있다. 결정화 공정은 정지 상 후, 교반 상, 및 선택적으로 증발상을 포함하여, 결정의 형태를 조절할 수 있다. 정지상은 결정성 도메인의 정도가 심한 큰 결정으로 자랄 수 있다. 결정화는 결정을 분주하는 공정을 포함하거나, 또는 걸정의 분주와 관계없는 시스템을 사용할 수 있다(즉, 결정은 자발적으로 형성된다). 예를 들어, 결정의 분주 공정을 사용하는 경우, 정지 상에서 결정을 분주한 후, 교반 상에서 결정이 신속하게 성장하여, 무정형 도메인의 정도가 커질 것이다. 이 공정을 사용하면, 생성된 결정은 최종 용해도가 양호해질 수 있다. 생성된 결정은 고순도의 스테비올 글리코시드(예를 들어, RebM)를 가질 것이고, 회수와 세척이 더욱 용이할 것이다. 재결정화에서, 에시적인 재결정화 용액계는 물을 포함할 수 있거나, 또는 일부 구현예에서는 에탄올(예를 들어, 1:2 EtOH:H2O)를 포함한다. 일부 구현예에서, 재결정화 용액은 (예를 들어, 최대 2%의) 글리세롤을 추가로 포함한다. 재결정화를 위한 용액의 pH는 예컨대 약 4.0에서 약 12.0으로 달라질 수 있다.
재결정화에 앞서, 용액을 여과할 수 있다. 추가로, 필터 물질의 선택은 최종 생성물의 품질에 유의한 영향을 미칠 수 있다. 예를 들어, 도 13은 재결정화에 앞서 용액을 여과하기 위한 소수성 필터 물질, 예컨대 폴리프로필렌(PP) 및 비교적 친수성인 물질, 예컨대 폴리에테르술폰(PES)의 이용을 비교한다(둘 다 0.2-마이크론의 기공 크기를 갖는다). RebM 최종 생성물(>98%)을 프로필렌 글리콜에 10 wt%의 농도로 용해한다. 도 13에 도시된 바와 같이, PP 필터를 사용한 경우 매우 뿌연 용액이 생성되지만(좌측), PES 필터 물질을 사용할 때에는 투명한 용액이 생성된다(우측). 따라서, PES 필터 물질 및 유사한 친수성 물질은 아마도 불순물을 흡착함으로써 유의한 장점을 제공한다.
결정화 시스템의 열역학과 속도론을 이해하는 것이 산업 공정을 적절히 설계하는데 매우 중요하다. 예를 들어, 열역학적 용해도는 소정의 온도에서 용매가 도달할 수 있는 최대 농도(포화도 또는 용해도)를 나타낸다. 이 용해도 곡선 위의 영역(예를 들어, 도 14 참고)은 과포화 상태이고, 아래의 영역은 불포화상태이다. 결정화가 진행되려면, 용액이 과포화되어야 한다. 과포화를 이루는 한 가지 방법은, 포화 용액의 온도를 감소시키는 것이다. 그러나, 이 맥락에서 결정화는 바로 개시되지 않으며; 오히려, 시스템은 특정 너비를 갖는 과포화 공간의 준안정성 구역으로 들어간다. 이 구역에서는, 자발적인 핵화가 없으나, 시드 결정을 첨가함으로써 결정화가 시작될 수 있다. 냉각 중에 시드를 첨가하지 않은 경우, 시스템은 준안정성 구역의 가장자리에 도달하여, 자발적 점 핵화가 일어날 지점을 지나친다. 과포화 정도가 클수록 핵화 속도가 빨라질 것이어서, 입자 크기 및 결정 성장률에 유의한 영향을 미칠 것이다. 또한, 용해도 및 준안정성 구역의 너비에 대한 지식이 있다면, 바람직한 결정 크기 분포(CSD)를 갖고, 또한 실용적인 속도로 진행하는 산업적 결정화 공정을 설계할 수 있다. 비분주형 결정화의 경우, (예를 들어, 매우 작은 결정을 생산하는) 과다한 자발적 핵화의 부정적인 영향 없이 결정화가 시작되려면, 준안정성 구역의 가장자리에 도달하여 이를 약간 넘어서야 한다. 공정이 진행함에 따라, 농도가 떨어져서 준안정성 구역으로 돌아가며, 이후 전체 결정화 기간 동안 (냉각, 증발 등에 의해) 과포화를 유지할 필요가 있다. 분주형 결정화의 경우, 자발적인 핵화를 피하기 위해 준안정성 구역을 넘지 않는 것이 중요하고, 시드는 용액이 포화된 후에 첨가되어야 하며, 따라서 시드 결정이 용해되지 않고 핵화를 개시한다. 분주형 및 비분주형 결정화의 경우 둘 다에서, 시스템의 열역학과 속도론을 이해하면, 결정화 공정의 상승 속도 (또는 증발 속도) 뿐만 아니라 핵화점을 설계할 수 있다.
상이한 용매계에서 RebM의 용해도를 이해하고, 용해도 향상의 효과를 탐구하는 연구에 착수하여, 결정 형성 및 성장을 위한 분주 및 온도 경사의 하강 전략을 수립하였다. 이러한 연구에서, Technobis Crystallization system의 Crystal 16 시스템(Crystalline Series)을 사용하여, (용해도에 대한 대용물로서) 온도 경사가 상승하는 동안의 투명점(Clear Point)과, (준안정성 구역의 너비에 대한 대용물로서) 경사가 감소하는 동안의 혼탁점(Cloud Point)을 생성하였다. 다양한 용매계들을 평가하였다.
표 8: 재결정화 단계에 대한 실험 설계
도 14는 용해도 (아래 곡선) 및 준안정성 제한 곡선(윗쪽 곡선)을 나타내는데, 이는 물 중 RebM (pH 7.0, 0% 글리세롤)에서 결정할 때, 준안정성 영역의 너비를 지정하여 이 용매계에서의 결정 성장을 조절할 수 있게 한다.
도 15a, 15b는 용해도(아래 곡선) 및 준안정성 제한 곡선(윗쪽 곡선)을 나타내는데, 이는 pH 7의 67% 물/33% 에탄올 중 RebM에 대해 결정할 때, 준안정성 영역의 너비를 지정하여 결정 성장을 조절할 수 있게 한다. 도 15a는 0% 글리세롤이나, 도 15b는 0.5% 글리세롤을 포함한다.
도 16a, 16b는 용해도(아래 곡선) 및 준안정성 제한 곡선(윗쪽 곡선)을 나타내는데, 이는 pH 11의 67% 물/33% 에탄올 중 RebM에서 결정할 때, 준안정성 영역의 너비를 지정하여, 이 용매계에서 결정 성장을 조절할 수 있게 한다. 도 16a는 0% 글리세롤이나, 도 16b는 0.5% 글리세롤을 포함한다.
일부 구현예에서, 회수 공정은 하나 이상의 접선 유동 여과(TFF) 단계를 포함할 것이다. 예를 들어, 약 5 kD의 기공 크기를 갖는 필터에 의한 TFF는 내독소, 큰 단백질 및 다른 세포 찌꺼기를 제거할 수 있으나, 최종 분말 생성물의 용해도도 개선시킬 수 있다. 또한, 기공 크기가 약 0.5 kD인 필터에 의한 TFF를 하류에서 이용하여, 소분자의 불순물 및 염을 제거하고/거나, 재결정화를 위한 모액을 농축할 수도 있다.
바스켓 원심분리 단계에서, 세척은 물에 의한 세척을 이용할 수 있거나, 대안적으로 다른 헹굼을 이용할 수 있다. 예를 들어, 냉수/에탄올(예를 들어, 15% 에탄올)은 케이크의 품질을 개선시킬 수 있다. 모액은 세척수로 이용될 수 있거나, 또는 재활용할 수 있다.
이용할 수 있는 다른 공정은, 활성탄 처리, 벤토나이트 처리, 이온 교환 크로마토그래피 및 증발에 의한 농축을 포함한다. 특히, 습윤된 케이크를 EtOH:H2O에 용해시킨 후 활성탄을 처리하면, 최종 생성물의 색상이 개선될 수 있다.
실시예 4: 모그롤 또는 모그롤 글리코시드 전구체의 생물전환
본원에 기재된 조작된 박테리아 균주는, 테르페노이드 글리코시드를 포함하나 이에 제한되지 않는 다양한 기질들의 당화에 사용될 수 있다. 일부 양태에서, 본 발명은 모그롤 또는 모그로시드 스캐폴드에 대해 활성을 갖는 UGT 효소를 식별한다. 다양한 모그로시드들의 생산을 위한 당화 경로는 도 22에 제공되어 있다. 도 17a 및 b는 모그롤로부터 모그로시드 중간물질로의 생물전환을 나타낸다. UGT 효소를 발현하는 조작된 E. 콜리 균주(샤시 균주)를 96-웰에서 모그롤과 함께 인큐베이션하였다. 생성물의 형성은 48 시간 후에 평가하였다. 기록된 값은 과잉의 빈 벡터 대조군에서의 값이다. 생성물은 LC-MS/MS에서 인증 기준에 의해 측정하였다. 도 17a에 나타난 바와 같이, 효소 1(서열 번호: 71) 및 효소 2(서열 번호: 33)의 UGT 효소는 둘 다 주로 모그롤로부터 Mog.IA를 생산하며, Mog.IE 및/또는 Mog.IIE는 더욱 소량으로 형성한다. 도 17b는 효소 1(서열 번호: 71), 효소 3(서열 번호: 33), 효소 4(서열 번호: 82) 및 효소 5(서열 번호: 83)를 발현하는 조작된 E. 콜리 균주를 사용한, 모그롤로부터 모그로시드-IA로의 생물전환을 나타낸다.
도 18a 및 도 18b는 Mog. IA(도 18a) 또는 Mog. IE(도 18b)로부터 Mog. IIE로의 생물전환을 나타낸다. 실험에서, UGT 효소인 서열 번호: 84, 서열 번호: 71 또는 서열 번호: 33을 발현하는 조작된 E. 콜리 샤시 균주를, 37℃에서 96-웰 플레이트 내의 Mog. IA(도 18a) 또는 Mog. IE(도 18b)를 함유한 발효액에서 인큐베이션하였다. 생성물의 형성은 48 시간 후에 평가하였다. 생성물은 LC-MS/MS에서 인증 기준에 의해 측정하였다. 과잉의 빈 벡터 대조군에서 Mog.IIE 수준의 값을 계산하였다. 도 18a에 나타난 바와 같이, 서열 번호: 84 및 서열 번호: 71은 Mog.IA로부터 Mog.IIE로의 생물전환을 촉매화할 수 있다. 유사하게, 도 18b에 나타난 바와 같이, 서열 번호: 84, 서열 번호: 71 및 서열 번호: 33은 Mog.IE로부터 Mog.IIE로의 생물전환을 촉매화할 수 있다.
도 19는 Mog.II-E로부터 Mog.III 또는 시아메노시드의 생산을 나타낸다. 실험에서, UGT 효소인 서열 번호: 72, 서열 번호: 54 또는 서열 번호: 13을 발현하는 조작된 E. 콜리 균주를, 37℃에서 48 시간 동안 Mog.II-E를 함유한 발효액에서 키웠다. 생성물은 LCMS/MS에서 각 화합물의 인증 기준에 의해 정량화하였다. 도 19에 나타난 바와 같이, 모든 균주들은 Mog. IIE로부터 Mog.III로의 생물전환을 촉매화할 수 있다. 또한, 서열 번호: 13의 효소는 상당한 양의 시아메노시드도 생산하는 것으로 나타났다.
도 20은 Mog. II-A2의 생산을 나타낸다. Mog. I-E를 시험관 내에서 공급하였다. 실험에서, UGT 효소인 서열 번호: 73을 발현하는 조작된 E. 콜리 균주(샤시 균주)를, 37℃에서 48 시간 동안 인큐베이션하였다. 생성물은 LC-MS/MS에서 각 화합물의 인증 기준에 의해 정량화하였다. 도 20에 나타난 바와 같이, 서열 번호: 73은 Mog. IE로부터 Mog. II-A2로의 생물전환을 촉매화할 수 있다.
모그롤의 C3 및 C24 하이드록실에서 관찰된 1 차 당화 반응에 대한 요약은 표 8에 제공되어 있다. 특히, 다양한 UGT 효소를 발현하는 세포에 모그롤을 공급하였다. 반응물을 37℃에서 48 시간 동안 인큐베이션하였다. 생성물을 LCMS/MS에서 각 화합물의 인증 기준에 의해 정량화하였다.
표 8
분지형 당화 반응에 대한 요약은 표 9에 제공되어 있다. Mog. IIE 또는 Mog. IE를, 다양한 UGT 효소를 발현하는 세포에 공급하였다. 반응물을 37℃에서 48 시간 동안 인큐베이션하였다. 생성물은 LC-MS/MS에서 각 화합물의 인증 기준에 의해 정량화되었다. "간접" 증거는 기질의 소모가 관찰된다는 것을 의미한다.
표 9
본 발명의 구현예는 지금부터 첨부된 청구 범위에 대해 정의될 것이다.
서열
수크로스 합성효소
서열 번호: 1: 감자( Solanum tuberosum ) (StSus1)
MAERVLTRVHSLRERVDATLAAHRNEILLFLSRIESHGKGILKPHELLAEFDAIRQDDKNKLNEHAFEELLKSTQEAIVLPPWVALAIRLRPGVWEYIRVNVNALVVEELSVPEYLQFKEELVDGASNGNFVLELDFEPFTASFPKPTLTKSIGNGVEFLNRHLSAKMFHDKESMTPLLEFLRAHHYKGKTMMLNDRIQNSNTLQNVLRKAEEYLIMLPPETPYFEFEHKFQEIGLEKGWGDTAERVLEMVCMLLDLLEAPDSCTLEKFLGRIPMVFNVVILSPHGYFAQENVLGYPDTGGQVVYILDQVPALEREMLKRIKEQGLDIIPRILIVTRLLPDAVGTTCGQRIEKVYGAEHSHILRVPFRTEKGIVRKWISRFEVWPYMETFIEDVAKEISAELQAKPDLIIGNYSEGNLAASLLAHKLGVTQCTIAHALEKTKYPDSDIYWKKFDEKYHFSSQFTADLIAMNHTDFIITSTFQEIAGSKDTVGQYESHMAFTMPGLYRVVHGINVFDPKFNIVSPGADINLYFSYSETEKRLTAFHPEIDELLYSDVENDEHLCVLKDRTKPILFTMARLDRVKNLTGLVEWYAKNPRLRGLVNLVVVGGDRRKESKDLEEQAEMKKMYELIETHNLNGQFRWISSQMNRVRNGELYRYIADTKGAFVQPAFYEAFGLTVVEAMTCGLPTFATNHGGPAEIIVHGKSGFHIDPYHGEQAADLLADFFEKCKKDPSHWETISMGGLKRIEEKYTWQIYSESLLTLAAVYGFWKHVSKLDRLEIRRYLEMFYALKYRKMAEAVPLAAE
서열 번호: 2: 감자 (StSus2)
MAERVLTRVHSLRERLDATLAAHRNEILLFLSRIESHGKGILKPHQLLAEFESIHKEDKDKLNDHAFEEVLKSTQEAIVLPPWVALAIRLRPGVWEYVRVNVNALIVEELTVPEFLQFKEELVNGTSNDNFVLELDFEPFTASFPKPTLTKSIGNGVEFLNRHLSAKMFHDKESMTPLLEFLRVHHYKGKTMMLNDRIQNLYTLQKVLRKAEEYLTTLSPETSYSAFEHKFQEIGLERGWGDTAERVLEMICMLLDLLEAPDSCTLEKFLGRIPMVFNVVILSPHGYFAQENVLGYPDTGGQVVYILDQVPALEREMLKRIKEQGLDIKPRILIVTRLLPDAVGTTCGQRLEKVFGTEHSHILRVPFRTEKGIVRKWISRFEVWPYMETFIEDVGKEITAELQAKPDLIIGNYSEGNLAASLLAHKLGVTQCTIAHALEKTKYPDSDIYLNKFDEKYHFSAQFTADLIAMNHTDFIITSTFQEIAGSKDTVGQYESHMAFTMPGLYRVVHGIDVFDPKFNIVSPGADVNLYFPYSEKEKRLTTFHPEIEDLLFSDVENEEHLCVLKDRNKPIIFTMARLDRVKNLTGLVEWYAKNPRLRELVNLVVVGGDRRKESKDLEEQAEMKKMYELIKTHNLNGQFRWISSQMNRVRNGELYRYIADTRGAFVQPAFYEAFGLTVVEAMSCGLPTFATNQGGPAEIIVHGKSGFQIDPYHGEQAADLLADFFEKCKVDPSHWEAISEGGLKRIQEKYTWQIYSDRLLTLAAVYGFWKHVSKLDRLEIRRYLEMFYALKFRKLAQLVPLAVE
서열 번호: 3: 감자 (StSus2_S11E)
MAERVLTRVHELRERLDATLAAHRNEILLFLSRIESHGKGILKPHQLLAEFESIHKEDKDKLNDHAFEEVLKSTQEAIVLPPWVALAIRLRPGVWEYVRVNVNALIVEELTVPEFLQFKEELVNGTSNDNFVLELDFEPFTASFPKPTLTKSIGNGVEFLNRHLSAKMFHDKESMTPLLEFLRVHHYKGKTMMLNDRIQNLYTLQKVLRKAEEYLTTLSPETSYSAFEHKFQEIGLERGWGDTAERVLEMICMLLDLLEAPDSCTLEKFLGRIPMVFNVVILSPHGYFAQENVLGYPDTGGQVVYILDQVPALEREMLKRIKEQGLDIKPRILIVTRLLPDAVGTTCGQRLEKVFGTEHSHILRVPFRTEKGIVRKWISRFEVWPYMETFIEDVGKEITAELQAKPDLIIGNYSEGNLAASLLAHKLGVTQCTIAHALEKTKYPDSDIYLNKFDEKYHFSAQFTADLIAMNHTDFIITSTFQEIAGSKDTVGQYESHMAFTMPGLYRVVHGIDVFDPKFNIVSPGADVNLYFPYSEKEKRLTTFHPEIEDLLFSDVENEEHLCVLKDRNKPIIFTMARLDRVKNLTGLVEWYAKNPRLRELVNLVVVGGDRRKESKDLEEQAEMKKMYELIKTHNLNGQFRWISSQMNRVRNGELYRYIADTRGAFVQPAFYEAFGLTVVEAMSCGLPTFATNQGGPAEIIVHGKSGFQIDPYHGEQAADLLADFFEKCKVDPSHWEAISEGGLKRIQEKYTWQIYSDRLLTLAAVYGFWKHVSKLDRLEIRRYLEMFYALKFRKLAQLVPLAVE
서열 번호: 4: 아시디티오바실러스 칼두스(
Acidithiobacillus caldus
)(AcSuSy)
MAIEALRQQLLDDPRSWYAFLRHLVASQRDSWLYTDLQRACADFREQLPEGYAEGIGPLEDFVAHTQEVIFRDPWMVFAWRPRPGRWIYVRIHREQLALEELSTDAYLQAKEGIVGLGAEGEAVLTVDFRDFRPVSRRLRDESTIGDGLTHLNRRLAGRIFSDLAAGRSQILEFLSLHRLDGQNLMLSNGNTDFDSLRQTVQYLGTLPRETPWAEIREDMRRRGFAPGWGNTAGRVRETMRLLMDLLDSPSPAALESFLDRIPMISRILIVSIHGWFAQDKVLGRPDTGGQVVYILDQARALEREMRNRLRQQGVDVEPRILIATRLIPESDGTTCDQRLEPVVGAENVQILRVPFRYPDGRIHPHWISRFKIWPWLERYAQDLEREVLAELGSRPDLIIGNYSDGNLVATLLSERLGVTQCNIAHALEKSKYLYSDLHWRDHEQDHHFACQFTADLIAMNAADIIVTSTYQEIAGNDREIGQYEGHQDYTLPGLYRVENGIDVFDSKFNIVSPGADPRFYFSYARTEERPSFLEPEIESLLFGREPGADRRGVLEDRQKPLLLSMARMDRIKNLSGLAELYGRSSRLRGLANLVIIGGHVDVGNSRDAEEREEIRRMHEIMDHYQLDGQLRWVGALLDKTVAGELYRVVADGRGVFVQPALFEAFGLTVIEAMSSGLPVFATRFGGPLEIIEDGVSGFHIDPNDHEATAERLADFLEAARERPKYWLEISDAALARVAERYTWERYAERLMTIARIFGFWRFVLDRESQVMERYLQMFRHLQWRPLAHAVPME
서열 번호: 5:
아시디티오바실러스 칼두스
(AcSuSy_L637M-T640V)
MAIEALRQQLLDDPRSWYAFLRHLVASQRDSWLYTDLQRACADFREQLPEGYAEGIGPLEDFVAHTQEVIFRDPWMVFAWRPRPGRWIYVRIHREQLALEELSTDAYLQAKEGIVGLGAEGEAVLTVDFRDFRPVSRRLRDESTIGDGLTHLNRRLAGRIFSDLAAGRSQILEFLSLHRLDGQNLMLSNGNTDFDSLRQTVQYLGTLPRETPWAEIREDMRRRGFAPGWGNTAGRVRETMRLLMDLLDSPSPAALESFLDRIPMISRILIVSIHGWFAQDKVLGRPDTGGQVVYILDQARALEREMRNRLRQQGVDVEPRILIATRLIPESDGTTCDQRLEPVVGAENVQILRVPFRYPDGRIHPHWISRFKIWPWLERYAQDLEREVLAELGSRPDLIIGNYSDGNLVATLLSERLGVTQCNIAHALEKSKYLYSDLHWRDHEQDHHFACQFTADLIAMNAADIIVTSTYQEIAGNDREIGQYEGHQDYTLPGLYRVENGIDVFDSKFNIVSPGADPRFYFSYARTEERPSFLEPEIESLLFGREPGADRRGVLEDRQKPLLLSMARMDRIKNLSGLAELYGRSSRLRGLANLVIIGGHVDVGNSRDAEEREEIRRMHEIMDHYQLDGQLRWVGALMDKVVAGELYRVVADGRGVFVQPALFEAFGLTVIEAMSSGLPVFATRFGGPLEIIEDGVSGFHIDPNDHEATAERLADFLEAARERPKYWLEISDAALARVAERYTWERYAERLMTIARIFGFWRFVLDRESQVMERYLQMFRHLQWRPLAHAVPME
서열 번호: 6: 애기 장대(
Arabidopsis thaliana
) (AtSus1)
MANAERMITRVHSQRERLNETLVSERNEVLALLSRVEAKGKGILQQNQIIAEFEALPEQTRKKLEGGPFFDLLKSTQEAIVLPPWVALAVRPRPGVWEYLRVNLHALVVEELQPAEFLHFKEELVDGVKNGNFTLELDFEPFNASIPRPTLHKYIGNGVDFLNRHLSAKLFHDKESLLPLLKFLRLHSHQGKNLMLSEKIQNLNTLQHTLRKAEEYLAELKSETLYEEFEAKFEEIGLERGWGDNAERVLDMIRLLLDLLEAPDPCTLETFLGRVPMVFNVVILSPHGYFAQDNVLGYPDTGGQVVYILDQVRALEIEMLQRIKQQGLNIKPRILILTRLLPDAVGTTCGERLERVYDSEYCDILRVPFRTEKGIVRKWISRFEVWPYLETYTEDAAVELSKELNGKPDLIIGNYSDGNLVASLLAHKLGVTQCTIAHALEKTKYPDSDIYWKKLDDKYHFSCQFTADIFAMNHTDFIITSTFQEIAGSKETVGQYESHTAFTLPGLYRVVHGIDVFDPKFNIVSPGADMSIYFPYTEEKRRLTKFHSEIEELLYSDVENKEHLCVLKDKKKPILFTMARLDRVKNLSGLVEWYGKNTRLRELANLVVVGGDRRKESKDNEEKAEMKKMYDLIEEYKLNGQFRWISSQMDRVRNGELYRYICDTKGAFVQPALYEAFGLTVVEAMTCGLPTFATCKGGPAEIIVHGKSGFHIDPYHGDQAADTLADFFTKCKEDPSHWDEISKGGLQRIEEKYTWQIYSQRLLTLTGVYGFWKHVSNLDRLEARRYLEMFYALKYRPLAQAVPLAQDD
서열 번호: 7: 애기 장대 (AtSus3)
MANPKLTRVLSTRDRVQDTLSAHRNELVALLSRYVDQGKGILQPHNLIDELESVIGDDETKKSLSDGPFGEILKSAMEAIVVPPFVALAVRPRPGVWEYVRVNVFELSVEQLTVSEYLRFKEELVDGPNSDPFCLELDFEPFNANVPRPSRSSSIGNGVQFLNRHLSSVMFRNKDCLEPLLDFLRVHKYKGHPLMLNDRIQSISRLQIQLSKAEDHISKLSQETPFSEFEYALQGMGFEKGWGDTAGRVLEMMHLLSDILQAPDPSSLEKFLGMVPMVFNVVILSPHGYFGQANVLGLPDTGGQVVYILDQVRALETEMLLRIKRQGLDISPSILIVTRLIPDAKGTTCNQRLERVSGTEHTHILRVPFRSEKGILRKWISRFDVWPYLENYAQDAASEIVGELQGVPDFIIGNYSDGNLVASLMAHRMGVTQCTIAHALEKTKYPDSDIYWKDFDNKYHFSCQFTADLIAMNNADFIITSTYQEIAGTKNTVGQYESHGAFTLPGLYRVVHGIDVFDPKFNIVSPGADMTIYFPYSEETRRLTALHGSIEEMLYSPDQTDEHVGTLSDRSKPILFSMARLDKVKNISGLVEMYSKNTKLRELVNLVVIAGNIDVNKSKDREEIVEIEKMHNLMKNYKLDGQFRWITAQTNRARNGELYRYIADTRGAFAQPAFYEAFGLTVVEAMTCGLPTFATCHGGPAEIIEHGLSGFHIDPYHPEQAGNIMADFFERCKEDPNHWKKVSDAGLQRIYERYTWKIYSERLMTLAGVYGFWKYVSKLERRETRRYLEMFYILKFRDLVKTVPSTADD
서열 번호: 8: 녹두(
Vigna radiate
) (VrSS1)
MATDRLTRVHSLRERLDETLSANRNEILALLSRIEGKGKGILQHHQVIAEFEEIPEESRQKLTDGAFGEVLRSTQEAIVLPPWVALAVRPRPGVWEYLRVNVHALVVEVLQPAEYLRFKEELVDGSSNGNFVLELDFEPFTASFPRPTLNKSIGNGVQFLNRHLSAKLFHDKESLHPLLEFLRLHSVKGKTLMLNDRIQNPDALQHVLRKAEEYLGTVPPETPYSAFEHKFQEIGLERGWGDNAERVLESIQLLLDLLEAPDPCTLETFLGRIPMVFNVVILSPHGYFAQDNVLGYPDTGGQVVYILDQVRALENEMLHRIKQQGLDIVPRILIITRLLPDAVGTTCGQRLEKVFGTEHSHILRVPFRTENGIVRKWISRFEVWPYLETYTEDVAHELAKELQGKPDLIVGNYSDGNIVASLLAHKLGVTQCTIAHALEKTKYPESDIYWKKLEERYHFSCQFTADLFAMNHTDFIITSTFQEIAGSKDTVGQYESHTAFTLPGLYRVVHGIDVFDPKFNIVSPGADQTIYFPHTETSRRLTSFHTEIEELLYSSVENEEHICVLKDRSKPIIFTMARLDRVKNITGLVEWYGKNAKLRELVNLVVVAGDRRKESKDLEEKAEMKKMYSLIETYKLNGQFRWISSQMNRVRNGELYRVIADTKGAFVQPAVYEAFGLTVVEAMTCGLPTFATCNGGPAEIIVHGKSGFHIDPYHGDRAADLLVEFFEKVKVDPSHWDKISQAGLQRIEEKYTWQIYSQRLLTLTGVYGFWKHVSNLDRRESRRYLEMFYALKYRKLAESVPLAVE
서열 번호: 9: 녹두 (VrSS1_S11E)
MATDRLTRVHELRERLDETLSANRNEILALLSRIEGKGKGILQHHQVIAEFEEIPEESRQKLTDGAFGEVLRSTQEAIVLPPWVALAVRPRPGVWEYLRVNVHALVVEVLQPAEYLRFKEELVDGSSNGNFVLELDFEPFTASFPRPTLNKSIGNGVQFLNRHLSAKLFHDKESLHPLLEFLRLHSVKGKTLMLNDRIQNPDALQHVLRKAEEYLGTVPPETPYSAFEHKFQEIGLERGWGDNAERVLESIQLLLDLLEAPDPCTLETFLGRIPMVFNVVILSPHGYFAQDNVLGYPDTGGQVVYILDQVRALENEMLHRIKQQGLDIVPRILIITRLLPDAVGTTCGQRLEKVFGTEHSHILRVPFRTENGIVRKWISRFEVWPYLETYTEDVAHELAKELQGKPDLIVGNYSDGNIVASLLAHKLGVTQCTIAHALEKTKYPESDIYWKKLEERYHFSCQFTADLFAMNHTDFIITSTFQEIAGSKDTVGQYESHTAFTLPGLYRVVHGIDVFDPKFNIVSPGADQTIYFPHTETSRRLTSFHTEIEELLYSSVENEEHICVLKDRSKPIIFTMARLDRVKNITGLVEWYGKNAKLRELVNLVVVAGDRRKESKDLEEKAEMKKMYSLIETYKLNGQFRWISSQMNRVRNGELYRVIADTKGAFVQPAVYEAFGLTVVEAMTCGLPTFATCNGGPAEIIVHGKSGFHIDPYHGDRAADLLVEFFEKVKVDPSHWDKISQAGLQRIEEKYTWQIYSQRLLTLTGVYGFWKHVSNLDRRESRRYLEMFYALKYRKLAESVPLAVE
서열 번호: 10: 대두(
Glycine Max
) (GmSS)
MATDRLTRVHSLRERLDETLTANRNEILALLSRIEAKGKGILQHHQVIAEFEEIPEENRQKLTDGAFGEVLRSTQEAIVLPPWVALAVRPRPGVWEYLRVNVHALVVEELQPAEYLHFKEELVDGSSNGNFVLELDFEPFNAAFPRPTLNKSIGNGVQFLNRHLSAKLFHDKESLHPLLEFLRLHSVKGKTLMLNDRIQNPDALQHVLRKAEEYLGTVPPETPYSEFEHKFQEIGLERGWGDNAERVLESIQLLLDLLEAPDPCTLETFLGRIPMVFNVVILSPHGYFAQDNVLGYPDTGGQVVYILDQVRALENEMLHRIKQQGLDIVPRILIITRLLPDAVGTTCGQRLEKVFGTEHSHILRVPFRTEKGIVRKWISRFEVWPYLETYTEDVAHELAKELQGKPDLIVGNYSDGNIVASLLAHKLGVTQCTIAHALEKTKYPESDIYWKKLEERYHFSCQFTADLFAMNHTDFIITSTFQEIAGSKDTVGQYESHTAFTLPGLYRVVHGIDVFDPKFNIVSPGADQTIYFPHTETSRRLTSFHPEIEELLYSSVENEEHICVLKDRSKPIIFTMARLDRVKNITGLVEWYGKNAKLRELVNLVVVAGDRRKESKDLEEKAEMKKMYGLIETYKLNGQFRWISSQMNRVRNGELYRVICDTRGAFVQPAVYEAFGLTVVEAMTCGLPTFATCNGGPAEIIVHGKSGFHIDPYHGDRAADLLVDFFEKCKLDPTHWDKISKAGLQRIEEKYTWQIYSQRLLTLTGVYGFWKHVSNLDRRESRRYLEMFYALKYRKLAESVPLAAE
서열 번호: 11: 대두 (GmSS_S11E)
MATDRLTRVHELRERLDETLTANRNEILALLSRIEAKGKGILQHHQVIAEFEEIPEENRQKLTDGAFGEVLRSTQEAIVLPPWVALAVRPRPGVWEYLRVNVHALVVEELQPAEYLHFKEELVDGSSNGNFVLELDFEPFNAAFPRPTLNKSIGNGVQFLNRHLSAKLFHDKESLHPLLEFLRLHSVKGKTLMLNDRIQNPDALQHVLRKAEEYLGTVPPETPYSEFEHKFQEIGLERGWGDNAERVLESIQLLLDLLEAPDPCTLETFLGRIPMVFNVVILSPHGYFAQDNVLGYPDTGGQVVYILDQVRALENEMLHRIKQQGLDIVPRILIITRLLPDAVGTTCGQRLEKVFGTEHSHILRVPFRTEKGIVRKWISRFEVWPYLETYTEDVAHELAKELQGKPDLIVGNYSDGNIVASLLAHKLGVTQCTIAHALEKTKYPESDIYWKKLEERYHFSCQFTADLFAMNHTDFIITSTFQEIAGSKDTVGQYESHTAFTLPGLYRVVHGIDVFDPKFNIVSPGADQTIYFPHTETSRRLTSFHPEIEELLYSSVENEEHICVLKDRSKPIIFTMARLDRVKNITGLVEWYGKNAKLRELVNLVVVAGDRRKESKDLEEKAEMKKMYGLIETYKLNGQFRWISSQMNRVRNGELYRVICDTRGAFVQPAVYEAFGLTVVEAMTCGLPTFATCNGGPAEIIVHGKSGFHIDPYHGDRAADLLVDFFEKCKLDPTHWDKISKAGLQRIEEKYTWQIYSQRLLTLTGVYGFWKHVSNLDRRESRRYLEMFYALKYRKLAESVPLAAE
서열 번호: 12:
아나베나 종
(
Anabaena sp.
) (AsSusA)
MASELMQAILDSEEKHDLRGFISELRQQDKNYLLRNDILNVYAEYCSKCQKPETSYKFSNLSKLIYYTQEIIPEDSNFCFIIRPKIAAQEVYRLTADLDVEPMTVQELLDLRDRLVNKFHPYEGDILELDFGPFYDYTPTIRDPKNIGKGVQYLNRYLSSKLFQDSQQWLESLFNFLRLHNYNGIQLLINHQIQSQQQLSQQVKNALNFVSDRPNDEPYEQFRLQLQTMGFEPGWGNTASRVRDTLNILDELIDSPDPQTLEAFISRIPMIFRIVLVSAHGWFGQEGVLGRPDTGGQVVYVLDQAKNLEKQLQEDAILAGLEVLNVQPKVIILTRLIPNSDGTLCNQRLEKVYGTENAWILRVPLREFNPKMTQNWISRFEFWPYLETFAIDSERELLAEFQGRPDLIVGNYTDGNLVAFLLTRRMKVTQCNIAHALEKSKYLFSNLYWQDLEEKYHFSLQFTADLIAMNAANFVISSTYQEIVGTPDSIGQYESYKCFTMPELYHVVNGIELFSPKFNVVPPGVNENSYFPYTQTQNRIESDRDRLEEMLFTLEDSSQIFGKLDDPNKRPIFSMARLDRIKNLTGLAECFGQSQELQERCNLILVAGKLRIEESEDNEEKDEIVKLYRIIDEYNLHGKIRWLGVRLSKNDSGEIYRVICDRQGIFVQPALFEAFGLTILESMISGLPTFATQFGGPLEIIQDKINGFYINPTHLEETATKILDFVTKCEQNPNYWNIISEKAIDRVYSTYTWKIHTTKLLTLARIYGFWNFTSKEKREDLLRYLESLFYLIYKPRAQQLLEQHKYR
우리딘 디포스페이트-의존성 당전이효소(UGT)
서열 번호: 13: 합성 서열 (MbUGT1,2.2)
MATKGSSGMSLAERFWLTLSRSSLVVGRSCVEFEPETVPLLSTLRGKPITFLGLMPPLHEGRREDGEDATVRWLDAQPAKSVVYVALGSEVPLGVEKVHELALGLELAGTRFLWALRKPTGVSDADLLPAGFEERTRGRGVVATRWVPQMSILAHAAVGAFLTHCGWNSTIEGLMFGHPLIMLPIFGDQGPNARLIEAKNAGLQVARNDGDGSFDREGVAAAIRAVAVEEESSKVFQAKAKKLQEIVADMACHERYIDGFIQQLRSYKDDSGYSSSYAAAAGMHVVICPWLAFGHLLPCLDLAQRLASRGHRVSFVSTPRNISRLPPVRPALAPLVAFVALPLPRVEGLPDGAESTNDVPHDRPDMVELHRRAFDGLAAPFSEFLGTACADWVIVDVFHHWAAAAALEHKVPCAMMLLGSAEMIASIADERLEHAETESPAAAGQGRPAAAPTFEVARMKLIR
서열 번호: 14: 합성 서열 (MbUGT1,2.3)
MATKNSSGMSLAERFWLTLSRSSLVVGRSCVEFEPETVPLLSTLRGKPITFLGLMPPLHEGRREDGEDATVRWLDAQPAKSVVYVALGSEVPLGVEKVHELALGLELAGTRFLWALRKPTGVSDADLLPAGFEERTRGRGVVATRWVPQMSILAHAAVGAFLTHCGWNSTIEGLMFGHPLIMLPITGDQGPNARLIEAKNAGLQVARNDGDGSFDREGVAAAIRAVAVEEESSKVFQAKAKKLQEIVADMACHERYIDGFIQQLRSYKDDSGYSSSYAAAAGMHVVICPWLAFGHLLPCLDLAQRLASRGHRVSFVSTPRNISRLPPVRPALAPLVAFVALPLPRVEGLPDGAESTNDVPHDRPDMVELHRRAFDGLAAPFSEFLGTACADWVIVDSFHHWAAAAALEHKVPCAMMLLGSAEMIASIADERLEHAETESPAAAGQGRPAAAPTFEVARMKLIR
서열 번호: 15: 합성 서열 (MbUGT1,2.4)
MARRTKNSSGMSLAERFWLTLSRSSLVVGRSCVEFEPETVPLLSTLRGKPITFLGLMPPLPEGRREDGEDATVRWLDAQPAKSVVYVALGSEVPLGVEKVHELALGLELAGTRFLWALRKPTGVSDADLLPAGFEERTRGRGVVATRWVPQMSILAHAAVGAFLTHCGWNSTIEGLMFGHPLIMLPITGDQGPNARLIEAKNAGLQVARNDGDGSFDREGVAAAIRAVAVEEESSKVFQEKAKKLQEIVADMACHERYIDGFIQQLRSYKDDSGYSSSYAAAAGMHVVICPWLAFGHLLPCLDLAQRLASRGHRVSFVSTPRNISRLPPVRPALAPLVAFVALPLPRVEGLPDGAESTNDVPHDRPDMVELHRRAFDGLAAPFSEFLGTACADWVIVDSFHHWAAAAALEHKVPCAMMFLGSAEMIASIADERLEHAETESPAAAGQGRPAAAPTFEVARMKLIR
서열 번호: 16: 합성 서열 (MbUGT1,2.5)
MARRTKNSSGMSLAERFWLTLSRSSLVVGRSCVEFEPETVPLLSTLRGKPITFLGLMPPLPEGRREDGEDATVRWLDAQPAKSVVYVALGSEVPLGVEKVHELALGLELAGTRFLWALRKPTGVSDADLLPAGFEERTRGRGVVATRWVPQAAILAHAAVGAFLTHCGWNSTIEGLMFGHPLIMLPITGDQGPNARLIEAKNAGLQVARNDGDGSFDREGVAAAIRAVAVEEESSKVFQEKAKKLQEIVADMACHERYIDGFIQQLRSYKDDSGYSSSYAAAAGMHVVICPWLAFGHLLPCLDLAQRLASRGHRVSFVSTPRNISRLPPVRPALAPLVAFVALPLPRVEGLPDGAESTNDVPHDRPDMVELHRRAFDGLAAPFSEFLGTACADWVIVDSFHHWAAAAALEHKVPCAMMFLGSAEMIASIADERLEHAETESPAAAGQGRPAAAPTFEVARMKLIR
서열 번호: 17: SrUGT85C2 (
스테비아 레바우디아나
)
MDAMATTEKKPHVIFIPFPAQSHIKAMLKLAQLLHHKGLQITFVNTDFIHNQFLESSGPHCLDGAPGFRFETIPDGVSHSPEASIPIRESLLRSIETNFLDRFIDLVTKLPDPPTCIISDGFLSVFTIDAAKKLGIPVMMYWTLAACGFMGFYHIHSLIEKGFAPLKDASYLTNGYLDTVIDWVPGMEGIRLKDFPLDWSTDLNDKVLMFTTEAPQRSHKVSHHIFHTFDELEPSIIKTLSLRYNHIYTIGPLQLLLDQIPEEKKQTGITSLHGYSLVKEEPECFQWLQSKEPNSVVYVNFGSTTVMSLEDMTEFGWGLANSNHYFLWIIRSNLVIGENAVLPPELEEHIKKRGFIASWCSQEKVLKHPSVGGFLTHCGWGSTIESLSAGVPMICWPYSWDQLTNCRYICKEWEVGLEMGTKVKRDEVKRLVQELMGEGGHKMRNKAKDWKEKARIAIAPNGSSSLNIDKMVKEITVLARN
서열 번호: 18: SrUGT74G1 (
스테비아 레바우디아나
)
MAEQQKIKKSPHVLLIPFPLQGHINPFIQFGKRLISKGVKTTLVTTIHTLNSTLNHSNTTTTSIEIQAISDGCDEGGFMSAGESYLETFKQVGSKSLADLIKKLQSEGTTIDAIIYDSMTEWVLDVAIEFGIDGGSFFTQACVVNSLYYHVHKGLISLPLGETVSVPGFPVLQRWETPLILQNHEQIQSPWSQMLFGQFANIDQARWVFTNSFYKLEEEVIEWTRKIWNLKVIGPTLPSMYLDKRLDDDKDNGFNLYKANHHECMNWLDDKPKESVVYVAFGSLVKHGPEQVEEITRALIDSDVNFLWVIKHKEEGKLPENLSEVIKTGKGLIVAWCKQLDVLAHESVGCFVTHCGFNSTLEAISLGVPVVAMPQFSDQTTNAKLLDEILGVGVRVKADENGIVRRGNLASCIKMIMEEERGVIIRKNAVKWKDLAKVAVHEGGSSDNDIVEFVSELIKA
서열 번호: 19: SrUGT76G1 (
스테비아 레바우디아나
)
MENKTETTVRRRRRIILFPVPFQGHINPILQLANVLYSKGFSITIFHTNFNKPKTSNYPHFTFRFILDNDPQDERISNLPTHGPLAGMRIPIINEHGADELRRELELLMLASEEDEEVSCLITDALWYFAQSVADSLNLRRLVLMTSSLFNFHAHVSLPQFDELGYLDPDDKTRLEEQASGFPMLKVKDIKSAYSNWQILKEILGKMIKQTKASSGVIWNSFKELEESELETVIREIPAPSFLIPLPKHLTASSSSLLDHDRTVFQWLDQQPPSSVLYVSFGSTSEVDEKDFLEIARGLVDSKQSFLWVVRPGFVKGSTWVEPLPDGFLGERGRIVKWVPQQEVLAHGAIGAFWTHSGWNSTLESVCEGVPMIFSDFGLDQPLNARYMSDVLKVGVYLENGWERGEIANAIRRVMVDEEGEYIRQNARVLKQKADVSLMKGGSSYESLESLVSYISSL
서열 번호: 20: 합성 서열 (MbUGT1-3)
MANWQILKEILGKMIKQTKASSGVIWNSFKELEESELETVIREIPAPSFLIPLPKHLTASSSSLLDHDRTVFQWLDQQPPSSVLYVSFGSTSEVDEKDFLEIARGLVDSKQSFLWVVRPGFVKGSTWVEPLPDGFLGERGRIVKWVPQQEVLAHGAIGAFWTHSGWNSTLESVCEGVPMIFSDFGLDQPLNARYMSDVLKVGVYLENGWERGEIANAIRRVMVDEEGEYIRQNARVLKQKADVSLMKGGSSYESLESLVSYISSLENKTETTVRRRRRIILFPVPFQGHINPILQLANVLYSKGFSITIFHTNFNKPKTSNYPHFTFRFILDNDPQDERISNLPTHGPLAGMRIPIINEHGADELRRELELLMLASEEDEEVSCLITDALWYFAQSVADSLNLRRLVLMTSSLFNFHAHVSLPQFDELGYLDPDDKTRLEEQASGFPMLKVKDIKSAYS
서열 번호: 21: UGT76G1_L200A (
스테비아 레바우디아나
, L200A)
MAENKTETTVRRRRRIILFPVPFQGHINPILQLANVLYSKGFSITIFHTNFNKPKTSNYPHFTFRFILDNDPQDERISNLPTHGPLAGMRIPIINEHGADELRRELELLMLASEEDEEVSCLITDALWYFAQSVADSLNLRRLVLMTSSLFNFHAHVSLPQFDELGYLDPDDKTRLEEQASGFPMLKVKDIKSAYSNWQIAKEILGKMIKQTKASSGVIWNSFKELEESELETVIREIPAPSFLIPLPKHLTASSSSLLDHDRTVFQWLDQQPPSSVLYVSFGSTSEVDEKDFLEIARGLVDSKQSFLWVVRPGFVKGSTWVEPLPDGFLGERGRIVKWVPQQEVLAHGAIGAFWTHSGWNSTLESVCEGVPMIFSDFGLDQPLNARYMSDVLKVGVYLENGWERGEIANAIRRVMVDEEGEYIRQNARVLKQKADVSLMKGGSSYESLESLVSYISSL
서열 번호: 22: 합성 서열 (MbUGT1-3_0)
MAKQSFLWVVRPGFVKGSTWVEPLPDGFLGERGRIVKWVPQQEVLAHGAIGAFWTHSGWNSTLESVCEGVPMIFSDFGLDQPLNARYMSDVLKVGVYLENGWERGEIANAIRRVMVDEEGEYIRQNARVLKQKADVSLMKGGSSYESLESLVSYISSLENKTETTVRRRRRIILFPVPFQGHINPILQLANVLYSKGFSITIFHTNFNKPKTSNYPHFTFRFILDNDPQDERISNLPTHGPLAGMRIPIINEHGADELRRELELLMLASEEDEEVSCLITDALWYFAQSVADSLNLRRLVLMTSSLFNFHAHVSLPQFDELGYLDPDDKTRLEEQASGFPMLKVKDIKSAYSNWQIAKEILGKMIKQTKASSGVIWNSFKELEESELETVIREIPAPSFLIPLPKHLTASSSSLLDHDRTVFQWLDQQPPSSVLYVSFGSTSEVDEKDFLEIARGLVDS
서열 번호: 23: 합성 서열 (MbUGT1-3_1)
MAFLWVVRPGFVKGSTWVEPLPDGFLGERGRIVKWVPQQEVLAHGAIGAFWTHGGWNSTLESVCEGVPMIFSDFGLDQPLNARYMSDVLKVGVYLENGWERGEIANAIRRLMVDEEGEYIRQNARVLKQKADVSLMKGGSSYESLESLVSYISSLGSGGSGGSGRRRRIILFPVPFQGHINPMLQLANVLYSKGFSITIFHTNFNKPKTSNYPHFTFRFILDNDPQDERISNLPTHGPLAGMRIPIINEHGADELRRELELLMLASEEDEEVSCLITDALWYFAQSVADSLNLRRLVLMTSSLFNFHAHVSLPQFDELGYLDPDDKTRLEEQASGFPMLKVKDIKSAYSNWQIAKEILGKMIKQTKASSGVIWNSFKELEESELETVIREIPAPSFLIPLPKHLTASSSSLLDHDRTVFQWLDQQPPSSVLYVSFGSTSEVDEKDFLEIARGLVDSQS
서열 번호: 24: 합성 서열 (MbUGT1-3_2)
MAFLWVVRPGFVKGSTWVEPLPDGFLGERGRIVKWVPQQEVLAHGAIGAFWTHGGWNSTLESVCEGVPMIFSDFGLDQPLNARYMSDVLKVGVYLENGWERGEIANAIRRLMVDEEGEYIRQNARVLKQKADVSLMKGGSSYESLESLVSYISSLGSGGSGRRRRIILFPVPFQGHINPMLQLANVLYSKGFSITIFHTNFNKPKTSNYPHFTFRFILDNDPQDERISNLPTHGPLAGMRIPIINEHGADELRRELELQMLASEEDEEVSCLITDALWYFAQSVADSLNLPRLVLMTSSLFNFHAHVSLPQFDELGYLDPDDKTRLEEQASGFPMLKVKDIKSAYSNWQIAKEILGKMIKQTKASSGVIWNSFKELEESELETVIREIPAPSFLIPLPKHLTASSSSLLEHDRTVFQWLDQQPPSSVLYVSFGSTSEVDEKDFLEIARGLVDSQS
서열 번호: 25: 합성 서열 (MbUGT1-3_3)
MAFLWVVRPGFVKGSTWVEPLPDGFLGERGRIVKWVPQQEVLAHGAIGAFWTHGGWNSTLESVCEGVPMIFQDFGLDQPLNARYMSDVLKVGVYLENGWERGEIANAIRRLMVDEEGEYIRQNARVLKQKADVSLMKGGSSYESLESLVSYISSLGSGGSGRRRRIILFPVPFQGHINPMLQLANVLYSKGFSITIFHTNFNKPKTSNYPHFTFRFILDNDPQDHGPLAGMRIPIINEHGADELRRELELQMLASEEDEEVSCLITDALWYFAQSVADSLNLPRLVLMTSSLFNFHCHVSLPQFDELGYLDPDDKTRLEEQASGFPMLKVKDIKSAFSNWQIAKEILGKMIKQTKASSGVIWNSFKELEESELETVIREIPAPSFLIPLPKHLTASSSSLLEHDRTVFQWLDQQPPSSVIYVSFGSTSEVDEKDFLEIARGLVDSQS
서열 번호: 26: SrUGT91D1 (
스테비아 레바우디아나
)
MYNVTYHQNSKAMATSDSIVDDRKQLHVATFPWLAFGHILPFLQLSKLIAEKGHKVSFLSTTRNIQRLSSHISPLINVVQLTLPRVQELPEDAEATTDVHPEDIQYLKKAVDGLQPEVTRFLEQHSPDWIIYDFTHYWLPSIAASLGISRAYFCVITPWTIAYLAPSSDAMINDSDGRTTVEDLTTPPKWFPFPTKVCWRKHDLARMEPYEAPGISDGYRMGMVFKGSDCLLFKCYHEFGTQWLPLLETLHQVPVVPVGLLPPEIPGDEKDETWVSIKKWLDGKQKGSVVYVALGSEALVSQTEVVELALGLELSGLPFVWAYRKPKGPAKSDSVELPDGFVERTRDRGLVWTSWAPQLRILSHESVCGFLTHCGSGSIVEGLMFGHPLIMLPIFCDQPLNARLLEDKQVGIEIPRNEEDGCLTKESVARSLRSVVVENEGEIYKANARALSKIYNDTKVEKEYVSQFVDYLEKNARAVAIDHES
서열 번호: 27: SrUGT91D2 (
스테비아 레바우디아나
)
MATSDSIVDDRKQLHVATFPWLAFGHILPYLQLSKLIAEKGHKVSFLSTTRNIQRLSSHISPLINVVQLTLPRVQELPEDAEATTDVHPEDIPYLKKASDGLQPEVTRFLEQHSPDWIIYDYTHYWLPSIAASLGISRAHFSVTTPWAIAYMGPSADAMINGSDGRTTVEDLTTPPKWFPFPTKVCWRKHDLARLVPYKAPGISDGYRMGLVLKGSDCLLSKCYHEFGTQWLPLLETLHQVPVVPVGLLPPEVPGDEKDETWVSIKKWLDGKQKGSVVYVALGSEVLVSQTEVVELALGLELSGLPFVWAYRKPKGPAKSDSVELPDGFVERTRDRGLVWTSWAPQLRILSHESVCGFLTHCGSGSIVEGLMFGHPLIMLPIFGDQPLNARLLEDKQVGIEIPRNEEDGCLTKESVARSLRSVVVEKEGEIYKANARELSKIYNDTKVEKEYVSQFVDYLEKNTRAVAIDHES
서열 번호: 28: SrUGT91D2e (
스테비아 레바우디아나
)
MATSDSIVDDRKQLHVATFPWLAFGHILPYLQLSKLIAEKGHKVSFLSTTRNIQRLSSHISPLINVVQLTLPRVQELPEDAEATTDVHPEDIPYLKKASDGLQPEVTRFLEQHSPDWIIYDYTHYWLPSIAASLGISRAHFSVTTPWAIAYMGPSADAMINGSDGRTTVEDLTTPPKWFPFPTKVCWRKHDLARLVPYKAPGISDGYRMGLVLKGSDCLLSKCYHEFGTQWLPLLETLHQVPVVPVGLLPPEIPGDEKDETWVSIKKWLDGKQKGSVVYVALGSEVLVSQTEVVELALGLELSGLPFVWAYRKPKGPAKSDSVELPDGFVERTRDRGLVWTSWAPQLRILSHESVCGFLTHCGSGSIVEGLMFGHPLIMLPIFGDQPLNARLLEDKQVGIEIPRNEEDGCLTKESVARSLRSVVVEKEGEIYKANARELSKIYNDTKVEKEYVSQFVDYLEKNARAVAIDHES
서열 번호: 29: OsUGT1-2 (벼 (
Oryza sativa
))
MDSGYSSSYAAAAGMHVVICPWLAFGHLLPCLDLAQRLASRGHRVSFVSTPRNISRLPPVRPALAPLVAFVALPLPRVEGLPDGAESTNDVPHDRPDMVELHRRAFDGLAAPFSEFLGTACADWVIVDVFHHWAAAAALEHKVPCAMMLLGSAHMIASIADRRLERAETESPAAAGQGRPAAAPTFEVARMKLIRTKGSSGMSLAERFSLTLSRSSLVVGRSCVEFEPETVPLLSTLRGKPITFLGLMPPLHEGRREDGEDATVRWLDAQPAKSVVYVALGSEVPLGVEKVHELALGLELAGTRFLWALRKPTGVSDADLLPAGFEERTRGRGVVATRWVPQMSILAHAAVGAFLTHCGWNSTIEGLMFGHPLIMLPIFGDQGPNARLIEAKNAGLQVARNDGDGSFDREGVAAAIRAVAVEEESSKVFQAKAKKLQEIVADMACHERYIDGFIQQLRSYKD
서열 번호: 30: 합성 서열 (MbUGTC19)
MAECMNWLDDKPKESVVYVAFGSLVKHGPEQVEEITRALIDSDVNFLWVIKHKEEGKLPENLSEVIKTGKGLIVAWCKQLDVLAHESVGCFVTHCGFNSTLEAISLGVPVVAMPQFSDQTTNAKLLDEILGVGVRVKADENGIVRRGNLASCIKMIMEEERGVIIRKNAVKWKDLAKVAVHEGGSSDNDIVEFVSELIKAGSGEQQKIKKSPHVLLIPFPLQGHINPFIQFGKRLISKGVKTTLVTTIHTLNSTLNHSNTTTTSIEIQAISDGCDEGGFMSAGESYLETFKQVGSKSLADLIKKLQSEGTTIDAIIYDSMTEWVLDVAIEFGIDGGSFFTQACVVNSLYYHVHKGLISLPLGETVSVPGFPVLQRWETPLILQNHEQIQSPWSQMLFGQFANIDQARWVFTNSFYKLEEEVIEWTRKIWNLKVIGPTLPSMYLDKRLDDDKDNGFNLYKANHH
서열 번호: 31: 합성 서열 (MbUGTC19-2)
MANHHECMNWLDDKPKESVVYVAFGSLVKHGPEQVEEITRALIDSDVNFLWVIKHKEEGKLPENLSEVIKTGKGLIVAWCKQLDVLAHESVGCFVTHCGFNSTLEAISLGVPVVAMPQFSDQTTNAKLLDEILGVGVRVKADENGIVRRGNLASCIKMIMEEERGVIIRKNAVKWKDLAKVAVHEGGSSDNDIVEFVSELIKAGSGEQQKIKKSPHVLLIPFPLQGHINPFIQFGKRLISKGVKTTLVTTIHTLNSTLNHSNTTTTSIEIQAISDGCDEGGFMSAGESYLETFKQVGSKSLADLIKKLQSEGTTIDAIIYDSMTEWVLDVAIEFGIDGGSFFTQACVVNSLYYHVHKGLISLPLGETVSVPGFPVLQRWETPLILQNHEQIQSPWSQMLFGQFANIDQARWVFTNSFYKLEEEVIEWTRKIWNLKVIGPTLPSMYLDKRLDDDKDNGFNLYKA
서열 번호: 32: MbUGTC13 (
스테비아 레바우디아나
UGT85C2, P215T)
MADAMATTEKKPHVIFIPFPAQSHIKAMLKLAQLLHHKGLQITFVNTDFIHNQFLESSGPHCLDGAPGFRFETIPDGVSHSPEASIPIRESLLRSIETNFLDRFIDLVTKLPDPPTCIISDGFLSVFTIDAAKKLGIPVMMYWTLAACGFMGFYHIHSLIEKGFAPLKDASYLTNGYLDTVIDWVPGMEGIRLKDFPLDWSTDLNDKVLMFTTEATQRSHKVSHHIFHTFDELEPSIIKTLSLRYNHIYTIGPLQLLLDQIPEEKKQTGITSLHGYSLVKEEPECFQWLQSKEPNSVVYVNFGSTTVMSLEDMTEFGWGLANSNHYFLWIIRSNLVIGENAVLPPELEEHIKKRGFIASWCSQEKVLKHPSVGGFLTHCGWGSTIESLSAGVPMICWPYSWDQLTNCRYICKEWEVGLEMGTKVKRDEVKRLVQELMGEGGHKMRNKAKDWKEKARIAIAPNGSSSLNIDKMVKEITVLARN
서열 번호: 33: SgUGT720-269-1 (
시라이티아 그로스베노리
)
MEDRNAMDMSRIKYRPQPLRPASMVQPRVLLFPFPALGHVKPFLSLAELLSDAGIDVVFLSTEYNHRRISNTEALASRFPTLHFETIPDGLPPNESRALADGPLYFSMREGTKPRFRQLIQSLNDGRWPITCIITDIMLSSPIEVAEEFGIPVIAFCPCSARYLSIHFFIPKLVEEGQIPYADDDPIGEIQGVPLFEGLLRRNHLPGSWSDKSADISFSHGLINQTLAAGRASALILNTFDELEAPFLTHLSSIFNKIYTIGPLHALSKSRLGDSSSSASALSGFWKEDRACMSWLDCQPPRSVVFVSFGSTMKMKADELREFWYGLVSSGKPFLCVLRSDVVSGGEAAELIEQMAEEEGAGGKLGMVVEWAAQEKVLSHPAVGGFLTHCGWNSTVESIAAGVPMMCWPILGDQPSNATWIDRVWKIGVERNNREWDRLTVEKMVRALMEGQKRVEIQRSMEKLSKLANEKVVRGINLHPTISLKKDTPTTSEHPRHEFENMRGMNYEMLVGNAIKSPTLTKK
서열 번호: 34: SgUGT94-289-3 (
시라이티아 그로스베노리
)
MTIFFSVEILVLGIAEFAAIAMDAAQQGDTTTILMLPWLGYGHLSAFLELAKSLSRRNFHIYFCSTSVNLDAIKPKLPSSFSDSIQFVELHLPSSPEFPPHLHTTNGLPPTLMPALHQAFSMAAQHFESILQTLAPHLLIYDSLQPWAPRVASSLKIPAINFNTTGVFVISQGLHPIHYPHSKFPFSEFVLHNHWKAMYSTADGASTERTRKRGEAFLYCLHASCSVILINSFRELEGKYMDYLSVLLNKKVVPVGPLVYEPNQDGEDEGYSSIKNWLDKKEPSSTVFVSFGSEYFPSKEEMEEIAHGLEASEVNFIWVVRFPQGDNTSGIEDALPKGFLERAGERGMVVKGWAPQAKILKHWSTGGFVSHCGWNSVMESMMFGVPIIGVPMHVDQPFNAGLVEEAGVGVEAKRDPDGKIQRDEVAKLIKEVVVEKTREDVRKKAREMSEILRSKGEEKFDEMVAEISLLLKI
서열 번호: 35: SgUGT74-345-2 (
시라이티아 그로스베노리
)
MDETTVNGGRRASDVVVFAFPRHGHMSPMLQFSKRLVSKGLRVTFLITTSATESLRLNLPPSSSLDLQVISDVPESNDIATLEGYLRSFKATVSKTLADFIDGIGNPPKFIVYDSVMPWVQEVARGRGLDAAPFFTQSSAVNHILNHVYGGSLSIPAPENTAVSLPSMPVLQAEDLPAFPDDPEVVMNFMTSQFSNFQDAKWIFFNTFDQLECKKQSQVVNWMADRWPIKTVGPTIPSAYLDDGRLEDDRAFGLNLLKPEDGKNTRQWQWLDSKDTASVLYISFGSLAILQEEQVKELAYFLKDTNLSFLWVLRDSELQKLPHNFVQETSHRGLVVNWCSQLQVLSHRAVSCFVTHCGWNSTLEALSLGVPMVAIPQWVDQTTNAKFVADVWRVGVRVKKKDERIVTKEELEASIRQVVQGEGRNEFKHNAIKWKKLAKEAVDEGGSSDKNIEEFVKTIA
서열 번호: 36: SgUGT75-281-2 (
시라이티아 그로스베노리
)
MGDNGDGGEKKELKENVKKGKELGRQAIGEGYINPSLQLARRLISLGVNVTFATTVLAGRRMKNKTHQTATTPGLSFATFSDGFDDETLKPNGDLTHYFSELRRCGSESLTHLITSAANEGRPITFVIYSLLLSWAADIASTYDIPSALFFAQPATVLALYFYYFHGYGDTICSKLQDPSSYIELPGLPLLTSQDMPSFFSPSGPHAFILPPMREQAEFLGRQSQPKVLVNTFDALEADALRAIDKLKMLAIGPLIPSALLGGNDSSDASFCGDLFQVSSEDYIEWLNSKPDSSVVYISVGSICVLSDEQEDELVHALLNSGHTFLWVKRSKENNEGVKQETDEEKLKKLEEQGKMVSWCRQVEVLKHPALGCFLTHCGWNSTIESLVSGLPVVAFPQQIDQATNAKLIEDVWKTGVRVKANTEGIVEREEIRRCLDLVMGSRDGQKEEIERNAKKWKELARQAIGEGGSSDSNLKTFLWEIDLEI
서열 번호: 37: SgUGT720-269-4 (
시라이티아 그로스베노리
)
MAEQAHDLLHVLLFPFPAEGHIKPFLCLAELLCNAGFHVTFLNTDYNHRRLHNLHLLAARFPSLHFESISDGLPPDQPRDILDPKFFISICQVTKPLFRELLLSYKRISSVQTGRPPITCVITDVIFRFPIDVAEELDIPVFSFCTFSARFMFLYFWIPKLIEDGQLPYPNGNINQKLYGVAPEAEGLLRCKDLPGHWAFADELKDDQLNFVDQTTASSRSSGLILNTFDDLEAPFLGRLSTIFKKIYAVGPIHSLLNSHHCGLWKEDHSCLAWLDSRAAKSVVFVSFGSLVKITSRQLMEFWHGLLNSGKSFLFVLRSDVVEGDDEKQVVKEIYETKAEGKWLVVGWAPQEKVLAHEAVGGFLTHSGWNSILESIAAGVPMISCPKIGDQSSNCTWISKVWKIGLEMEDRYDRVSVETMVRSIMEQEGEKMQKTIAELAKQAKYKVSKDGTSYQNLECLIQDIKKLNQIEGFINNPNFSDLLRV
서열 번호: 38: SgUGT94-289-2 (
시라이티아 그로스베노리
)
MDAQQGHTTTILMLPWVGYGHLLPFLELAKSLSRRKLFHIYFCSTSVSLDAIKPKLPPSISSDDSIQLVELRLPSSPELPPHLHTTNGLPSHLMPALHQAFVMAAQHFQVILQTLAPHLLIYDILQPWAPQVASSLNIPAINFSTTGASMLSRTLHPTHYPSSKFPISEFVLHNHWRAMYTTADGALTEEGHKIEETLANCLHTSCGVVLVNSFRELETKYIDYLSVLLNKKVVPVGPLVYEPNQEGEDEGYSSIKNWLDKKEPSSTVFVSFGTEYFPSKEEMEEIAYGLELSEVNFIWVLRFPQGDSTSTIEDALPKGFLERAGERAMVVKGWAPQAKILKHWSTGGLVSHCGWNSMMEGMMFGVPIIAVPMHLDQPFNAGLVEEAGVGVEAKRDSDGKIQREEVAKSIKEVVIEKTREDVRKKAREMDTKHGPTYFSRSKVSSFGRLYKINRPTTLTVGRFWSKQIKMKRE
서열 번호: 39: SgUGT94-289-1 (
시라이티아 그로스베노리
)
MDAQRGHTTTILMFPWLGYGHLSAFLELAKSLSRRNFHIYFCSTSVNLDAIKPKLPSSSSSDSIQLVELCLPSSPDQLPPHLHTTNALPPHLMPTLHQAFSMAAQHFAAILHTLAPHLLIYDSFQPWAPQLASSLNIPAINFNTTGASVLTRMLHATHYPSSKFPISEFVLHDYWKAMYSAAGGAVTKKDHKIGETLANCLHASCSVILINSFRELEEKYMDYLSVLLNKKVVPVGPLVYEPNQDGEDEGYSSIKNWLDKKEPSSTVFVSFGSEYFPSKEEMEEIAHGLEASEVHFIWVVRFPQGDNTSAIEDALPKGFLERVGERGMVVKGWAPQAKILKHWSTGGFVSHCGWNSVMESMMFGVPIIGVPMHLDQPFNAGLAEEAGVGVEAKRDPDGKIQRDEVAKLIKEVVVEKTREDVRKKAREMSEILRSKGEEKMDEMVAAISLFLKI
서열 번호: 40: McUGT1 (여주 (
Momordica charantia
))
MAQPQTQARVLVFPYPTVGHIKPFLSLAELLADGGLDVVFLSTEYNHRRIPNLEALASRFPTLHFDTIPDGLPIDKPRVIIGGELYTSMRDGVKQRLRQVLQSYNDGSSPITCVICDVMLSGPIEAAEELGIPVVTFCPYSARYLCAHFVMPKLIEEGQIPFTDGNLAGEIQGVPLFGGLLRRDHLPGFWFVKSLSDEVWSHAFLNQTLAVGRTSALIINTLDELEAPFLAHLSSTFDKIYPIGPLDALSKSRLGDSSSSSTVLTAFWKEDQACMSWLDSQPPKSVIFVSFGSTMRMTADKLVEFWHGLVNSGTRFLCVLRSDIVEGGGAADLIKQVGETGNGIVVEWAAQEKVLAHRAVGGFLTHCGWNSTMESIAAGVPMMCWQIYGDQMINATWIGKVWKIGIERDDKWDRSTVEKMIKELMEGEKGAEIQRSMEKFSKLANDKVVKGGTSFENLELIVEYLKKLKPSN
서열 번호: 41: McUGT2 (여주)
MAQPRVLLFPFPAMGHVKPFLSLAELLSDAGVEVVFLSTEYNHRRIPDIGALAARFPTLHFETIPDGLPPDQPRVLADGHLYFSMLDGTKPRFRQLIQSLNGNPRPITCIINDVMLSSPIEVAEEFGIPVIAFCPCSARFLSVHFFMPNFIEEAQIPYTDENPMGKIEEATVFEGLLRRKDLPGLWCAKSSNISFSHRFINQTIAAGRASALILNTFDELESPFLNHLSSIFPKIYCIGPLNALSRSRLGKSSSSSSALAGFWKEDQAYMSWLESQPPRSVIFVSFGSTMKMEAWKLAEFWYGLVNSGSPFLFVFRPDCVINSGDAAEVMEGRGRGMVVEWASQEKVLAHPAVGGFLTHCGWNSTVESIVAGVPMMCCPIVADQLSNATWIHKVWKIGIEGDEKWDRSTVEMMIKELMESQKGTEIRTSIEMLSKLANEKVVKGGTSLNNFELLVEDIKTLRRPYT
서열 번호: 42: McUGT3 (여주)
MEQSDSNSDDHQHHVLLFPFPAKGHIKPFLCLAQLLCGAGLQVTFLNTDHNHRRIDDRHRRLLATQFPMLHFKSISDGLPPDHPRDLLDGKLIASMRRVTESLFRQLLLSYNGYGNGTNNVSNSGRRPPISCVITDVIFSFPVEVAEELGIPVFSFATFSARFLFLYFWIPKLIQEGQLPFPDGKTNQELYGVPGAEGIIRCKDLPGSWSVEAVAKNDPMNFVKQTLASSRSSGLILNTFEDLEAPFVTHLSNTFDKIYTIGPIHSLLGTSHCGLWKEDYACLAWLDARPRKSVVFVSFGSLVKTTSRELMELWHGLVSSGKSFLLVLRSDVVEGEDEEQVVKEILESNGEGKWLVVGWAPQEEVLAHEAIGGFLTHSGWNSTMESIAAGVPMVCWPKIGDQPSNCTWVSRVWKVGLEMEERYDRSTVARMARSMMEQEGKEMERRIAELAKRVKYRVGKDGESYRNLESLIRDIKITKSSN
서열 번호: 43: McUGT4 (여주)
MDAHQQAEHTTTILMLPWVGYGHLTAYLELAKALSRRNFHIYYCSTPVNIESIKPKLTIPCSSIQFVELHLPSSDDLPPNLHTTNGLPSHLMPTLHQAFSAAAPLFEEILQTLCPHLLIYDSLQPWAPKIASSLKIPALNFNTSGVSVIAQALHAIHHPDSKFPLSDFILHNYWKSTYTTADGGASEKTRRAREAFLYCLNSSGNAILINTFRELEGEYIDYLSLLLNKKVIPIGPLVYEPNQDEDQDEEYRSIKNWLDKKEPCSTVFVSFGSEYFPSNEEMEEIAPGLEESGANFIWVVRFPKLENRNGIIEEGLLERAGERGMVIKEWAPQARILRHGSIGGFVSHCGWNSVMESIICGVPVIGVPMRVDQPYNAGLVEEAGVGVEAKRDPDGKIQRHEVSKLIKQVVVEKTRDDVRKKVAQMSEILRRKGDEKIDEMVALISLLPKG
서열 번호: 44: McUGT5 (여주)
MDARQQAEHTTTILMLPWVGYGHLSAYLELAKALSRRNFHIYYCSTPVNIESIKPKLTIPCSSIQFVELHLPFSDDLPPNLHTTNGLPSHLMPALHQAFSAAAPLFEAILQTLCPHLLIYDSLQPWAPQIASSLKIPALNFNTTGVSVIARALHTIHHPDSKFPLSEIVLHNYWKATHATADGANPEKFRRDLEALLCCLHSSCNAILINTFRELEGEYIDYLSLLLNKKVTPIGPLVYEPNQDEEQDEEYRSIKNWLDKKEPYSTIFVSFGSEYFPSNEEMEEIARGLEESGANFIWVVRFHKLENGNGITEEGLLERAGERGMVIQGWAPQARILRHGSIGGFVSHCGWNSVMESIICGVPVIGVPMGLDQPYNAGLVEEAGVGVEAKRDPDGKIQRHEVSKLIKQVVVEKTRDDVRKKVAQMSEILRRKGDEKIDEMVALISLLLKG
서열 번호: 45 (오이 (
Cucumis sativus
))
MGLSPTDHVLLFPFPAKGHIKPFFCLAHLLCNAGLRVTFLSTEHHHQKLHNLTHLAAQIPSLHFQSISDGLSLDHPRNLLDGQLFKSMPQVTKPLFRQLLLSYKDGTSPITCVITDLILRFPMDVAQELDIPVFCFSTFSARFLFLYFSIPKLLEDGQIPYPEGNSNQVLHGIPGAEGLLRCKDLPGYWSVEAVANYNPMNFVNQTIATSKSHGLILNTFDELEVPFITNLSKIYKKVYTIGPIHSLLKKSVQTQYEFWKEDHSCLAWLDSQPPRSVMFVSFGSIVKLKSSQLKEFWNGLVDSGKAFLLVLRSDALVEETGEEDEKQKELVIKEIMETKEEGRWVIVNWAPQEKVLEHKAIGGFLTHSGWNSTLESVAVGVPMVSWPQIGDQPSNATWLSKVWKIGVEMEDSYDRSTVESKVRSIMEHEDKKMENAIVELAKRVDDRVSKEGTSYQNLQRLIEDIEGFKLN
서열 번호: 46: CmaUGT1 (서양 호박 (
Cucurbita maxima
))
MELSHTHHVLLFPFPAKGHIKPFFSLAQLLCNAGLRVTFLNTDHHHRRIHDLNRLAAQLPTLHFDSVSDGLPPDEPRNVFDGKLYESIRQVTSSLFRELLVSYNNGTSSGRPPITCVITDVMFRFPIDIAEELGIPVFTFSTFSARFLFLIFWIPKLLEDGQLRYPEQELHGVPGAEGLIRWKDLPGFWSVEDVADWDPMNFVNQTLATSRSSGLILNTFDELEAPFLTSLSKIYKKIYSLGPINSLLKNFQSQPQYNLWKEDHSCMAWLDSQPRKSVVFVSFGSVVKLTSRQLMEFWNGLVNSGMPFLLVLRSDVIEAGEEVVREIMERKAEGRWVIVSWAPQEEVLAHDAVGGFLTHSGWNSTLESLAAGVPMISWPQIGDQTSNSTWISKVWRIGLQLEDGFDSSTIETMVRSIMDQTMEKTVAELAERAKNRASKNGTSYRNFQTLIQDITNIIETHI
서열 번호: 47: (복숭아 (
Prunus persica
))
MAMKQPHVIIFPFPLQGHMKPLLCLAELLCHAGLHVTYVNTHHNHQRLANRQALSTHFPTLHFESISDGLPEDDPRTLNSQLLIALKTSIRPHFRELLKTISLKAESNDTLVPPPSCIMTDGLVTFAFDVAEELGLPILSFNVPCPRYLWTCLCLPKLIENGQLPFQDDDMNVEITGVPGMEGLLHRQDLPGFCRVKQADHPSLQFAINETQTLKRASALILDTVYELDAPCISHMALMFPKIYTLGPLHALLNSQIGDMSRGLASHGSLWKSDLNCMTWLDSQPSKSIIYVSFGTLVHLTRAQVIEFWYGLVNSGHPFLWVMRSDITSGDHQIPAELENGTKERGCIVDWVSQEEVLAHKSVGGFLTHSGWNSTLESIVAGLPMICWPKLGDHYIISSTVCRQWKIGLQLNENCDRSNIESMVQTLMGSKREEIQSSMDAISKLSRDSVAEGGSSHNNLEQLIEYIRNLQHQN
서열 번호: 48: (카카오 (
Theobroma cacao
))
MRQPHVLVLPFPAQGHIKPMLCLAELLCQAGLRVTFLNTHHSHRRLNNLQDLSTRFPTLHFESVSDGLPEDHPRNLVHFMHLVHSIKNVTKPLLRDLLTSLSLKTDIPPVSCIIADGILSFAIDVAEELQIKVIIFRTISSCCLWSYLCVPKLIQQGELQFSDSDMGQKVSSVPEMKGSLRLHDRPYSFGLKQLEDPNFQFFVSETQAMTRASAVIFNTFDSLEAPVLSQMIPLLPKVYTIGPLHALRKARLGDLSQHSSFNGNLREADHNCITWLDSQPLRSVVYVSFGSHVVLTSEELLEFWHGLVNSGKRFLWVLRPDIIAGEKDHNQIIAREPDLGTKEKGLLVDWAPQEEVLAHPSVGGFLTHCGWNSTLESMVAGVPMLCWPKLPDQLVNSSCVSEVWKIGLDLKDMCDRSTVEKMVRALMEDRREEVMRSVDGISKLARESVSHGGSSSSNLEMLIQELET
서열 번호: 49: CmaUGT2 (서양 호박)
MDAQKAVDTPPTTVLMLPWIGYGHLSAYLELAKALSRRNFHVYFCSTPVNLDSIKPNLIPPPSSIQFVDLHLPSSPELPPHLHTTNGLPSHLKPTLHQAFSAAAQHFEAILQTLSPHLLIYDSLQPWAPRIASSLNIPAINFNTTAVSIIAHALHSVHYPDSKFPFSDFVLHDYWKAKYTTADGATSEKIRRGAEAFLYCLNASCDVVLVNSFRELEGEYMDYLSVLLKKKVVSVGPLVYEPSEGEEDEEYWRIKKWLDEKEALSTVLVSFGSEYFPSKEEMEEIAHGLEESEANFIWVVRFPKGEESCRGIEEALPKGFVERAGERAMVVKKWAPQGKILKHGSIGGFVSHCGWNSVLESIRFGVPVIGVPMHLDQPYNAGLLEEAGIGVEAKRDADGKIQRDQVASLIKRVVVEKTREDIWKTVREMREVLRRRDDDMIDEMVAEISVVLKI
서열 번호: 50: CmoUGT2 (서양 호박)
MDAQKAVDTPPTTVLMLPWIGYGHLSAYLELAKALSRRNFHVYFCSTPVNLDSIKPNLIPPPPSIQFVDLHLPSSPELPPHLHTTNGLPSHLKPTLHQAFSAAAQHFEAILQTLSPHLLIYDSLQPWAPRIASSLNIPAINFNTTAVSIIAHALHSVHYPDSKFPFSDFVLHDYWKAKYTTADGATSEKTRRGVEAFLYCLNASCDVVLVNSFRELEGEYMDYLSVLLKKKVVSVGPLVYEPSEGEEDEEYWRIKKWLDEKEALSTVLVSFGSEYFPPKEEMEEIAHGLEESEANFIWVVRFPKGEESSSRGIEEALPKGFVERAGERAMVVKKWAPQGKILKHGSIGGFVSHCGWNSVLESIRFGVPVIGAPMHLDQPYNAGLLEEAGIGVEAKRDADGKIQRDQVASLIKQVVVEKTREDIWKKVREMREVLRRRDDDDMMIDEMVAVISVVLKI
서열 번호: 51: CmaUGT3 (서양 호박)
MSSNLFLKISIPFGRLRDSALNCSVFHCKLHLAIAIAMDAQQAANKSPTATTIFMLPWAGYGHLSAYLELAKALSTRNFHIYFCSTPVSLASIKPRLIPSCSSIQFVELHLPSSDEFPPHLHTTNGLPSRLVPTFHQAFSEAAQTFEAFLQTLRPHLLIYDSLQPWAPRIASSLNIPAINFFTAGAFAVSHVLRAFHYPDSQFPSSDFVLHSRWKIKNTTAESPTQAKLPKIGEAIGYCLNASRGVILTNSFRELEGKYIDYLSVILKKRVFPIGPLVYQPNQDEEDEDYSRIKNWLDRKEASSTVLVSFGSEFFLSKEETEAIAHGLEQSEANFIWGIRFPKGAKKNAIEEALPEGFLERAGGRAMVVEEWVPQGKILKHGSIGGFVSHCGWNSAMESIVCGVPIIGIPMQVDQPFNAGILEEAGVGVEAKRDSDGKIQRDEVAKLIKEVVVERTREDIRNKLEKINEILRSRREEKLDELATEISLLSRN
서열 번호: 52: CmoUGT3 (서양 호박)
MDAQQAANKSPTASTIFMLPWVGYGHLSAYLELAKALSTRNFHVYFCSTPVSLASIKPRLIPSCSSIQFVELHLPSSDEFPPHLHTTNGLPAHLVPTIHQAFAAAAQTFEAFLQTLRPHLLIYDSLQPWAPRIASSLNIPAINFFTAGAFAVSHVLRAFHYPDSQFPSSDFVLHSRWKIKNTTAESPTQVKIPKIGEAIGYCLNASRGVILTNSFRELEGKYIDYLSVILKKRVLPIGPLVYQPNQDEEDEDYSRIKNWLDRKEASSTVLVSFGSEFFLSKEETEAIAHGLEQSEANFIWGIRFPKGAKKNAIEEALPEGFLERVGGRAMVVEEWVPQGKILKHGNIGGFVSHCGWNSAMESIMCGVPVIGIPMQVDQPFNAGILEEAGVGVEAKRDSDGKIQRDEVAKLIKEVVVERTREDIRNKLEEINEILRTRREEKLDELATEISLLCKN
서열 번호: 53: (황마 (
Crchorus capsularis
))
MDSKQKKMSVLMFPWLAYGHISPFLELAKKLSKRNFHTFFFSTPINLNSIKSKLSPKYAQSIQFVELHLPSLPDLPPHYHTTNGLPPHLMNTLKKAFDMSSLQFSKILKTLNPDLLVYDFIQPWAPLLALSNKIPAVHFLCTSAAMSSFSVHAFKKPCEDFPFPNIYVHGNFMNAKFNNMENCSSDDSISDQDRVLQCFERSTKIILVKTFEELEGKFMDYLSVLLNKKIVPTGPLTQDPNEDEGDDDERTKLLLEWLNKKSKSSTVFVSFGSEYFLSKEEREEIAYGLELSKVNFIWVIRFPLGENKTNLEEALPQGFLQRVSERGLVVENWAPQAKILQHSSIGGFVSHCGWSSVMESLKFGVPIIAIPMHLDQPLNARLVVDVGVGLEVIRNHGSLEREEIAKLIKEVVLGNGNDGEIVRRKAREMSNHIKKKGEKDMDELVEELMLICKMKPNSCHLS
서열 번호: 54: (대추 (
Ziziphus jujube
))
MMERQRSIKVLMFPWLAHGHISPFLELAKRLTDRNFQIYFCSTPVNLTSVKPKLSQKYSSSIKLVELHLPSLPDLPPHYHTTNGLALNLIPTLKKAFDMSSSSFSTILSTIKPDLLIYDFLQPWAPQLASCMNIPAVNFLSAGASMVSFVLHSIKYNGDDHDDEFLTTELHLSDSMEAKFAEMTESSPDEHIDRAVTCLERSNSLILIKSFRELEGKYLDYLSLSFAKKVVPIGPLVAQDTNPEDDSMDIINWLDKKEKSSTVFVSFGSEYYLTNEEMEEIAYGLELSKVNFIWVVRFPLGQKMAVEEALPKGFLERVGEKGMVVEDWAPQMKILGHSSIGGFVSHCGWSSLMESLKLGVPIIAMPMQLDQPINAKLVERSGVGLEVKRDKNGRIEREYLAKVIREIVVEKARQDIEKKAREMSNIITEKGEEEIDNVVEELAKLCGM
서열 번호: 55: (흑자색 포도 (
Vitis vinifera
))
MDARQSDGISVLMFPWLAHGHISPFLQLAKKLSKRNFSIYFCSTPVNLDPIKGKLSESYSLSIQLVKLHLPSLPELPPQYHTTNGLPPHLMPTLKMAFDMASPNFSNILKTLHPDLLIYDFLQPWAPAAASSLNIPAVQFLSTGATLQSFLAHRHRKPGIEFPFQEIHLPDYEIGRLNRFLEPSAGRISDRDRANQCLERSSRFSLIKTFREIEAKYLDYVSDLTKKKMVTVGPLLQDPEDEDEATDIVEWLNKKCEASAVFVSFGSEYFVSKEEMEEIAHGLELSNVDFIWVVRFPMGEKIRLEDALPPGFLHRLGDRGMVVEGWAPQRKILGHSSIGGFVSHCGWSSVMEGMKFGVPIIAMPMHLDQPINAKLVEAVGVGREVKRDENRKLEREEIAKVIKEVVGEKNGENVRRKARELSETLRKKGDEEIDVVVEELKQLCSY
서열 번호: 56: (호두 나무 (
Juglans regia
))
MDTARKRIRVVMLPWLAHGHISPFLELSKKLAKRNFHIYFCSTPVNLSSIKPKLSGKYSRSIQLVELHLPSLPELPPQYHTTKGLPPHLNATLKRAFDMAGPHFSNILKTLSPDLLIYDFLQPWAPAIAASQNIPAINFLSTGAAMTSFVLHAMKKPGDEFPFPEIHLDECMKTRFVDLPEDHSPSDDHNHISDKDRALKCFERSSGFVMMKTFEELEGKYINFLSHLMQKKIVPVGPLVQNPVRGDHEKAKTLEWLDKRKQSSAVFVSFGTEYFLSKEEMEEIAYGLELSNVNFIWVVRFPEGEKVKLEEALPEGFLQRVGEKGMVVEGWAPQAKILMHPSIGGFVSHCGWSSVMESIDFGVPIVAIPMQLDQPVNAKVVEQAGVGVEVKRDRDGKLEREEVATVIREVVMGNIGESVRKKEREMRDNIRKKGEEKMDGVAQELVQLYGNGIKNV
서열 번호: 57: (파라 고무 나무 (
Hevea brasiliensis
))
METLQRRKISVLMFPWLAHGHLSPFLELSKKLNKRNFHVYFCSTPVNLDSIKPKLSAEYSFSIQLVELHLPSSPELPLHYHTTNGLPPHLMKNLKNAFDMASSSFFNILKTLKPDLLIYDFIQPWAPALASSLNIPAVNFLCTSMAMSCFGLHLNNQEAKFPFPGIYPRDYMRMKVFGALESSSNDIKDGERAGRCMDQSFHLILAKTFRELEGKYIDYLSVKLMKKIVPVGPLVQDPIFEDDEKIMDHHQVIKWLEKKERLSTVFVSFGTEYFLSTEEMEEIAYGLELSKAHFIWVVRFPTGEKINLEESLPKRYLERVQERGKIVEGWAPQQKILRHSSIGGFVSHCGWSSIMESMKFGVPIIAMPMNLDQPVNSRIVEDAGVGIEVRRNKSGELEREEIAKTIRKVVVEKDGKNVSRKAREMSDTIRKKGEEEIDGVVDELLQLCDVKTNYLQ
서열 번호: 58: (카사바 (
Manihot esculenta
))
MATAQTRKISVLMFPWLAHGHLSPFLELSKKLANRNFHVYFCSTPVNLDSIKPKLSPEYHFSIQFVELHLPSSPELPSHYHTTNGLPPHLMKTLKKAFDMASSSFFNILKTLNPDLLIYDFLQPWAPALASSLNIPAVNFLCSSMAMSCFGLNLNKNKEIKFLFPEIYPRDYMEMKLFRVFESSSNQIKDGERAGRCIDQSFHVILAKTFRELEGKYIDYVSVKCNKKIVPVGPLVEDTIHEDDEKTMDHHHHHHDEVIKWLEKKERSTTVFVSFGSEYFLSKEEMEEIAHGLELSKVNFIWVVRFPKGEKINLEESLPEGYLERIQERGKIVEGWAPQRKILGHSSIGGFVSHCGWSSIMESMKLGVPIIAMPMNLDQPINSRIVEAAGVGIEVSRNQSGELEREEMAKTIRKVVVEREGVYVRRKAREMSDVLRKKGEEEIDGVVDELVQLCDMKTNYL
서열 번호: 59: (세팔로투스 (
Cephalotus follicularis
))
MDLKRRSIRVLMLPWLAHGHISPFLELAKKLTNRNFLIYFCSTPINLNSIKPKLSSKYSFSIQLVELHLPSLPELPPHYHTTNGLPLHLMNTLKTAFDMASPSFLNILKTLKPDLLICDHLQPWAPSLASSLNIPAIIFPTNSAIMMAFSLHHAKNPGEEFPFPSININDDMVKSINFLHSASNGLTDMDRVLQCLERSSNTMLLKTFRQLEAKYVDYSSALLKKKIVLAGPLVQVPDNEDEKIEIIKWLDSRGQSSTVFVSFGSEYFLSKEEREDIAHGLELSKVNFIWVVRFPVGEKVKLEEALPNGFAERIGERGLVVEGWAPQAMILSHSSIGGFVSHCGWSSMMESMKFGVPIIAMPMHIDQPLNARLVEDVGVGLEIKRNKDGRFEREELARVIKEVLVYKNGDAVRSKAREMSEHIKKNGDQEIDGVADALVKLCEMKTNSLNQD
서열 번호: 60: UGT_1,6 (코페아 아라비카 (
Coffea Arabica
))
MENHATFNVLMLPWLAHGHVSPYLELAKKLTARNFNVYLCSSPATLSSVRSKLTEKFSQSIHLVELHLPKLPELPAEYHTTNGLPPHLMPTLKDAFDMAKPNFCNVLKSLKPDLLIYDLLQPWAPEAASAFNIPAVVFISSSATMTSFGLHFFKNPGTKYPYGNAIFYRDYESVFVENLTRRDRDTYRVINCMERSSKIILIKGFNEIEGKYFDYFSCLTGKKVVPVGPLVQDPVLDDEDCRIMQWLNKKEKGSTVFVSFGSEYFLSKKDMEEIAHGLEVSNVDFIWVVRFPKGENIVIEETLPKGFFERVGERGLVVNGWAPQAKILTHPNVGGFVSHCGWNSVMESMKFGLPIIAMPMHLDQPINARLIEEVGAGVEVLRDSKGKLHRERMAETINKVMKEASGESVRKKARELQEKLELKGDEEIDDVVKELVQLCATKNKRNGLHYY
서열 번호: 61: CmoUGT1 (서양 호박)
MELSPTHHLLLFPFPAKGHIKPFFSLAQLLCNAGARVTFLNTDHHHRRIHDLDRLAAQLPTLHFDSVSDGLPPDESRNVFDGKLYESIRQVTSSLFRELLVSYNNGTSSGRPPITCVITDCMFRFPIDIAEELGIPVFTFSTFSARFLFLFFWIPKLLEDGQLRYPEQELHGVPGAEGLIRCKDLPGFLSDEDVAHWKPINFVNQILATSRSSGLILNTFDELEAPFLTSLSKIYKKIYSLGPINSLLKNFQSQPQYNLWKEDHSCMAWLDSQPPKSVVFVSFGSVVKLTNRQLVEFWNGLVNSGKPFLLVLRSDVIEAGEEVVRENMERKAEGRWMIVSWAPQEEVLAHDAVGGFLTHSGWNSTLESLAAGVPMISWTQIGDQTSNSTWVSKVWRIGLQLEDGFDSFTIETMVRSVMDQTMEKTVAELAERAKNRASKNGTSYRNFQTLIQDITNIIETH
서열 번호: 62: (애기 장대)
MGSISEMVFETCPSPNPIHVMLVSFQGQGHVNPLLRLGKLIASKGLLVTFVTTELWGKKMRQANKIVDGELKPVGSGSIRFEFFDEEWAEDDDRRADFSLYIAHLESVGIREVSKLVRRYEEANEPVSCLINNPFIPWVCHVAEEFNIPCAVLWVQSCACFSAYYHYQDGSVSFPTETEPELDVKLPCVPVLKNDEIPSFLHPSSRFTGFRQAILGQFKNLSKSFCVLIDSFDSLEREVIDYMSSLCPVKTVGPLFKVARTVTSDVSGDICKSTDKCLEWLDSRPKSSVVYISFGTVAYLKQEQIEEIAHGVLKSGLSFLWVIRPPPHDLKVETHVLPQELKESSAKGKGMIVDWCPQEQVLSHPSVACFVTHCGWNSTMESLSSGVPVVCCPQWGDQVTDAVYLIDVFKTGVRLGRGATEERVVPREEVAEKLLEATVGEKAEELRKNALKWKAEAEAAVAPGGSSDKNFREFVEKLGAGVTKTKDNGY
서열 번호: 63: (애기 장대)
MGSHVAQKQHVVCVPYPAQGHINPMMKVAKLLYAKGFHITFVNTVYNHNRLLRSRGPNAVDGLPSFRFESIPDGLPETDVDVTQDIPTLCESTMKHCLAPFKELLRQINARDDVPPVSCIVSDGCMSFTLDAAEELGVPEVLFWTTSACGFLAYLYYYRFIEKGLSPIKDESYLTKEHLDTKIDWIPSMKNLRLKDIPSFIRTTNPDDIMLNFIIREADRAKRASAIILNTFDDLEHDVIQSMKSIVPPVYSIGPLHLLEKQESGEYSEIGRTGSNLWREETECLDWLNTKARNSVVYVNFGSITVLSAKQLVEFAWGLAATGKEFLWVIRPDLVAGDEAMVPPEFLTATADRRMLASWCPQEKVLSHPAIGGFLTHCGWNSTLESLCGGVPMVCWPFFAEQQTNCKFSRDEWEVGIEIGGDVKREEVEAVVRELMDEEKGKNMREKAEEWRRLANEATEHKHGSSKLNFEMLVNKVLLGE
서열 번호: 64: ClUGT1 (바위 비둘기 (
Columba livia
))
MIHCGKKHICAFVTCILISASILMYSWKDPQLQNNITRKIFQATSALPASQLCRGKPAQNVITALEDNRTFIISPYFDDRESKVTRVIGIVHHEDVKQLYCWFCCQPDGKIYVARAKIDVHSDRFGFPYGAADIVCLEPENCNPTHVSIHQSPHANIDQLPSFKIKNRKSETFSVDFTVCISAMFGNYNNVLQFIQSVEMYKILGVQKVVIYKNNCSQLMEKVLKFYMEEGTVEIIPWPINSHLKVSTKWHFSMDAKDIGYYGQITALNDCIYRNMQRSKFVVLNDADEIILPLKHLDWKAMMSSLQEQNPGAGIFLFENHIFPKTVSTPVFNISSWNRVPGVNILQHVHREPDRKEVFNPKKMIIDPRQVVQTSVHSVLRAYGNSVNVPADVALVYHCRVPLQEELPRESLIRDTALWRYNSSLITNVNKVLHQTVL
서열 번호: 65: (헤모필루스 듀크레이 (
Haemophilus ducreyi
))
MPTLTVAMIVKNEAQDLAECLKTVDGWVDEIVIVDSGSTDDTLKIATQFNAKVYVNSDWQGFGPQRQFAQQYVTSDYVLWLDADERVTPELKASILQAVQHNQKNTVYKVSRLSEIFGKEIRYSGWYPDYVVRLYPTYLAKYGDELVHEKVHYPADSRVEKLQGDLLHFTYKNIHHYLVKSASYAKAWAMQRAKAGKKASLLDGVTHAIACFLKMYLFKAGFLDGKQGFLLAVLSAHSTFVKYADLWDRTRS
서열 번호: 66: (임질균 (
Neisseria gonorrhoeae
))
MKKVSVLIVAKNEANHIRECIESCRFDKEVIVIDDHSADNTAEIAEGLGAKVFRRHLNGDFGAQKTFAIEQAGGEWVFLIDADERCTPELSDEISKIVRTGDYAAYFVERRNLFPNHPATHGAMRPDSVCRLMPKKGGSVQGKVHETVQTPYPERRLKHFMYHYTYDNWEQYFNKFNKYTSISAEKYREQGKPVSFVRDIILRPIWGFFKIYILNKGFLDGKMGWIMSVNHSYYTMIKYVKLYYLYKSGGKF
서열 번호: 67: (리조비움 멜리로티 (
Rhizobium meliloti
), 균주 1021)
MPNETLHIDIGVCTYRRPELAETLRSLAAMNVPERARLRVIVADNDAEPSARALVEGLRPEMPFDILYVHCPHSNISIARNCCLDNSTGDFLAFLDDDETVSGDWLTRLLETARTTGAAAVLGPVRAHYGPTAPRWMRSGDFHSTLPVWAKGEIRTGYTCNALLRRDAASLLGRRFKLSLGKSGGEDTDFFTGMHCAGGTIAFSPEAWVHEPVPENRASLAWLAKRRFRSGQTHGRLLAEKAHGLRQAWNIALAGAKSGFCATAAVLCFPSAARRNRFALRAVLHAGVISGLLGLKEIEQYGAREVTSA
서열 번호: 68: (리조비움 라디오박터 (
Rhizobium radiobacter
))
MCRCGRAVRSRPVCRPGQLVVRRSPRPRSRNHSRCRPLRLSVFPRPHRRVRHHCQRDLRWEPGRWIAVRWKAARSHRRFRRCPFPRQLVWPVRERHRDAGDRRNQRERRRRDAYHEISEPKFRTRKRTESFWMNKAITVIVWLLVSLCVLAIITMPVSLQTHLVATAISLILLATIKSFNGQGAWRLVALGFGTAIVLRYVYWRTTSTLPPVNQLENFIPGFLLYLAEMYSVVMLGLSLVIVSMPLPSRKTRPGSPDYRPTVDVFVPSYNEDAELLANTLAAAKNMDYPADRFTVWLLDDGGSVQKRNAANIVEAQAAQRRHEELKKLCEDLDVRYLTRERNVHAKAGNLNNGLAHSTGELVTVFDADHAPARDFLLETVGYFDEDPRLFLVQTPHFFVNPDPIERNLRTFETMPSENEMFYGIIQRGLDKWNGAFFCGSAAVLRREALQDSDGFSGVSITEDCETALALHSRGWNSVYVDKPLIAGLQPATFASFIGQRSRWAQGMMQILIFRQPLFKRGLSFTQRLCYMSSTLFWLFPFPRTIFLFAPLFYLFFDLQIFVASGGEFLAYTAAYMLVNLMMQNYLYGSFRWPWISELYEYVQTVHLLPAVVSVIFNPGKPTFKVTAKDESIAEARLSEISRPFFVIFALLLVAMAFAVWRIYSEPYKADVTLVVGGWNLLNLIFAGCALGVVSERGDKSASRRITVKRRCEVQLGGSDTWVPASIDNVSVHGLLINIFDSATNIEKGATAIVKVKPHSEGVPETMPLNVVRTVRGEGFVSIGCTFSPQRAVDHRLIADLIFANSEQWSEFQRVRRKKPGLIRGTAIFLAIALFQTQRGLYYLVRARRPAPKSAKPVGAVK
서열 번호: 69: (스트렙토코쿠스 아갈락티애 (
Streptococcus agalactiae
))
MIKKIEKDLISVIVPIYNVEDYLVECIESLIVQTYRNIEILLINDGSTDNCATIAKEFSERDCRVIYIEKSNGGLSEARNYGIYHSKGKYLTFVDSDDKVSSDYIANLYNAIQKHDSSIAIGGYLEFYERHNSIRNYEYLDKVIPVEEALLNMYDIKTYGSIFITAWGKLFHKSIFNDLEFALNKYHEDEFFNYKAYLKANSITYIDKPLYHYRIRVGSIMNNSDNVIIARKKLDVLSALDERIKLITSLRKYSVFLQKTEIFYVNQYFRTKKFLKQQSVMFKEDNYIDAYRMYGRLLRKVKLVDKLKLIKNRFF
서열 번호: 70 (스트렙토코쿠스 뉴모니아 (
Streptococcus pneumonia
))
MYTFILMLLDFFQNHDFHFFMLFFVFILIRWAVIYFHAVRYKSYSCSVSDEKLFSSVIIPVVDEPLNLFESVLNRISRHKPSEIIVVINGPKNERLVKLCHDFNEKLENNMTPIQCYYTPVPGKRNAIRVGLEHVDSQSDITVLVDSDTVWTPRTLSELLKPFVCDKKIGGVTTRQKILDPERNLVTMFANLLEEIRAEGTMKAMSVTGKVGCLPGRTIAFRNIVERVYTKFIEETFMGFHKEVSDDRSLTNLTLKKGYKTVMQDTSVVYTDAPTSWKKFIRQQLRWAEGSQYNNLKMTPWMIRNAPLMFFIYFTDMILPMLLISFGVNIFLLKILNITTIVYTASWWEIILYVLLGMIFSFGGRNFKAMSRMKWYYVFLIPVFIIVLSIIMCPIRLLGLMRCSDDLGWGTRNLTE
서열 번호: 71: AtUGT73C3 (애기 장대)
MATEKTHQFHPSLHFVLFPFMAQGHMIPMIDIARLLAQRGVTITIVTTPHNAARFKNVLNRAIESGLAINILHVKFPYQEFGLPEGKENIDSLDSTELMVPFFKAVNLLEDPVMKLMEEMKPRPSCLISDWCLPYTSIIAKNFNIPKIVFHGMGCFNLLCMHVLRRNLEILENVKSDEEYFLVPSFPDRVEFTKLQLPVKANASGDWKEIMDEMVKAEYTSYGVIVNTFQELEPPYVKDYKEAMDGKVWSIGPVSLCNKAGADKAERGSKAAIDQDECLQWLDSKEEGSVLYVCLGSICNLPLSQLKELGLGLEESRRSFIWVIRGSEKYKELFEWMLESGFEERIKERGLLIKGWAPQVLILSHPSVGGFLTHCGWNSTLEGITSGIPLITWPLFGDQFCNQKLVVQVLKAGVSAGVEEVMKWGEEDKIGVLVDKEGVKKAVEELMGDSDDAKERRRRVKELGELAHKAVEKGGSSHSNITLLLQDIMQLAQFKN
서열 번호: 72: HvUGT B1 (재배 보리 (
Hordeum vulgare subsp. Vulgare
))
MAQAESERMRVVMFPWLAHGHINPYLELAKRLIASASGDHHLDVVVHLVSTPANLAPLAHHQTDRLRLVELHLPSLPDLPPALHTTKGLPARLMPVLKRACDLAAPRFGALLDELCPDILVYDFIQPWAPLEAEARGVPAFHFATCGAAATAFFIHCLKTDRPPSAFPFESISLGGVDEDAKYTALVTVREDSTALVAERDRLPLSLERSSGFVAVKSSADIERKYMEYLSQLLGKEIIPTGPLLVDSGGSEEQRDGGRIMRWLDGEEPGSVVFVSFGSEYFMSEHQMAQMARGLELSGVPFLWVVRFPNAEDDARGAARSMPPGFEPELGLVVEGWAPQRRILSHPSCGAFLTHCGWSSVLESMAAGVPMVALPLHIDQPLNANLAVELGAAAARVKQERFGEFTAEEVARAVRAAVKGKEGEAARRRARELQEVVARNNGNDGQIATLLQRMARLCGKDQAVPN
서열 번호: 73: HvUGT_B3 (재배 보리)
MAEANDGGKMHVVMLPWLAFGHVLPFTEFAKRVARQGHRVTLLSAPRNTRRLIDIPPGLAGLIRVVHVPLPRVDGLPEHAEATIDLPSDHLRPCLRRAFDAAFERELSRLLQEEAKPDWVLVDYASYWAPTAAARHGVPCAFLSLFGAAALSFFGTPETLLGIGRHAKTEPAHLTVVPEYVPFPTTVAYRGYEARELFEPGMVPDDSGVSEGYRFAKTIEGCQLVGIRSSSEFEPEWLRLLGELYRKPVIPVGLFPPAPQDDVAGHEATLRWLDGQAPSSVVYAAFGSEVKLTGAQLQRIALGLEASGLPFIWAFRAPTSTETGAASGGLPEGFEERLAGRGVVCRGWVPQVKFLAHASVGGFLTHAGWNSIAEGLAHGVRLVLLPLVFEQGLNARNIVDKNIGVEVARDEQDGSFAAGDIAAALRRVMVEDEGEGFGAKVKELAKVFGDDEVNDQCVREFLMHLSDHSKKNQGQD
서열 번호: 74: CcUGT_1,6 (코페아 카네포라 (
Coffea canephora
))
MAENHATFNVLMLPWLAHGHVSPYLELAMKLTARNFNVYLCSSPATLSSVRSKLTEKFSQSIHLVELHLPKLPELPAEYHTTNGLPPHLMPTLKDAFDMAKPNFCNVLKSLKPDLLIYDLLQPWAPEAASAFNIPAVVFISSSATMTSFGLHFFKNPGTKYPYGNTIFYRDYESVFVENLKKRDRDTYRVVNCMERSSKIILIKGFKEIEGKYFDYFSCLTGKKVVPVGPLVQDPVLDDEDCRIMQWLNKKEKGSTVFVSFGSEYFLSKEDMEEIAHGLELSNVDFIWVVRFPKGENIVIEETLPKGFFERVGERGLVVNGWAPQAKILTHPNVGGFVSHCGWNSVMESMKFGLPIVAMPMHLDQPINARLIEEVGAGVEVLRDSKGKLHRERMAETINKVTKEASGEPARKKARELQEKLELKGDEEIDDVVKELVQLCATKNKRNGLHCYN
서열 번호: 75: CeUGT_1,6 (코페아 유게니오이데스 (
Coffea eugenioides
))
MAENHATFNVLMLPWLAHGHVSPYLELAKKLTARNFNVYLCSSPATLSSVRSKLTEKFSQSIHLVELHLPKLPELPAEYHTTNGLPPHLMPTLKDAFDMAEPNFCNVLKSLKPDLLIYDLLQPWAPEAASAFNIPAVVFISSSATMTSFGLHFFKNPGTKYPYGNTIFYRDYESVFVENLKRRDRDTYRVVNCMERSSKIILIKGFKEIEGKYFDYFSCLTGKKVVPVGPLVQDPVLDDEDCRIMQWLNKKEKGSTVFVSFGSEYFLSKEDMEEIAHGLELSNVDFIWVVRFPKGENIVIEETLPKGFFERVGERGLVVNGWAPQAKILTHPNVGGFVSHCGWNSVMESMKFGLPIIAMPMHLDQPINARLIEEVGAGVEVLRDSKGKLHRERMAETINKVTKEASGESVRKKARELQEKLELKGDEEIDDVVKELVQLCATKNKRNGLHYN
서열 번호: 76: CeUGT_1,6.2 (
코페아 유게니오이데스
)
MAENHATFNVLMLPWLAHGHVSPYLELAKKLTARNFNVYLCSSPATLSSVRSKLTEKFSQSIHLVELHLPKLPELPAEYHTTNGLPPHLMPTLKDAFDMAKPNFCNVLKSLKPDLLIYDLLQPWAPEAASAFNIPAVVFISSSATMTSFGLHFFKNPGTKYPYGNAIFYRDYESVFVENLTRRDRDTYRVINCMERSSKIILIKGFNEIEGKYFDYFSCLTGKKVVPVGPLVQDPVLDDEDCEIMQWLNKKEKVSTVFVSFGSEYFLSKKDMEEIAHGLELSNVDFIWVVRFPKGENIVIEETLPKGFFERVGERGLVVNGWAPQAKILTHPNVGGFVSHCGWNSVMESMKFGLPIIAMPMHLDQPINARLIEEVGAGVEVLRDSKGKLHRERMAETINKVMKEASGESVRKKARELQEKMDLKGDEEIDDVVKELVQLCATKNKRNGLHYY
서열 번호: 77: SgUGT94-289-3.2 (
시라이티아 그로스베노리
)
MADAAQQGDTTTILMLPWLGYGHLSAFLELAKSLSRRNFHIYFCSTSVNLDAIKPKLPSSFSDSIQFVELHLPSSPEFPPHLHTTNGLPPTLMPALHQAFSMAAQHFESILQTLAPHLLIYDSLQPWAPRVASSLKIPAINFNTTGVFVISQGLHPIHYPHSKFPFSEFVLHNHWKAMYSTADGASTERTRKRGEAFLYCLHASCSVILINSFRELEGKYMDYLSVLLNKKVVPVGPLVYEPNQDGEDEGYSSIKNWLDKKEPSSTVFVSFGSEYFPSKEEMEEIAHGLEASEVNFIWVVRFPQGDNTSGIEDALPKGFLERAGERGMVVKGWAPQAKILKHWSTGGFVSHCGWNSVMESMMFGVPIIGVPMHVDQPFNAGLVEEAGVGVEAKRDPDGKIQRDEVAKLIKEVVVEKTREDVRKKAREMSEILRSKGEEKFDEMVAEISLLLKI
서열 번호: 78: OsJUGT_1, 6 (벼) (OsJUGT_1, 6)
MAQAERERLRVLMFPWLAHGHINPYLELATRLTTTSSSQIDVVVHLVSTPVNLAAVAHRRTDRISLVELHLPELPGLPPALHTTKHLPPRLMPALKRACDLAAPAFGALLDELSPDVVLYDFIQPWAPLEAAARGVPAVHFSTCSAAATAFFLHFLDGGGGGGGRGAFPFEAISLGGAEEDARYTMLTCRDDGTALLPKGERLPLSFARSSEFVAVKTCVEIESKYMDYLSKLVGKEIIPCGPLLVDSGDVSAGSEADGVMRWLDGQEPGSVVLVSFGSEYFMTEKQLAEMARGLELSGAAFVWVVRFPQQSPDGDEDDHGAAAARAMPPGFAPARGLVVEGWAPQRRVLSHRSCGAFLTHCGWSSVMESMSAGVPMVALPLHIDQPVGANLAAELGVAARVRQERFGEFEAEEVARAVRAVMRGGEALRRRATELREVVARRDAECDEQIGALLHRMARLCGKGTGRAAQLGH
서열 번호: 79: PgUGT94_B1 (인삼 (
Panax ginseng
))
MADNQNGRISIALLPFLAHGHISPFFELAKQLAKRNCNVFLCSTPINLSSIKDKDSSASIKLVELHLPSSPDLPPHYHTTNGLPSHLMLPLRNAFETAGPTFSEILKTLNPDLLIYDFNPSWAPEIASSHNIPAVYFLTTAAASSSIGLHAFKNPGEKYPFPDFYDNSNITPEPPSADNMKLLHDFIACFERSCDIILIKSFRELEGKYIDLLSTLSDKTLVPVGPLVQDPMGHNEDPKTEQIINWLDKRAESTVVFVCFGSEYFLSNEELEEVAIGLEISTVNFIWAVRLIEGEKKGILPEGFVQRVGDRGLVVEGWAPQARILGHSSTGGFVSHCGWSSIAESMKFGVPVIAMARHLDQPLNGKLAAEVGVGMEVVRDENGKYKREGIAEVIRKVVVEKSGEVIRRKARELSEKMKEKGEQEIDRALEELVQICKKKKDEQ
서열 번호: 80: 선택적인 His 태그를 갖는 SrUGT73E1 (스테비아 레바우디아나)
MAHHHHHHVGTGSNDDDDKSPDPNWASTSELVFIPSPGAGHLPPTVELAKLLLHRDQRLSVTIIVMNLWLGPKHNTEARPCVPSLRFVDIPCDESTMALISPNTFISAFVEHHKPRVRDIVRGIIESDSVRLAGFVLDMFCMPMSDVANEFGVPSYNYFTSGAATLGLMFHLQWKRDHEGYDATELKNSDTELSVPSYVNPVPAKVLPEVVLDKEGGSKMFLDLAERIRESKGIIVNSCQAIERHALEYLSSNNNGIPPVFPVGPILNLENKKDDAKTDEIMRWLNEQPESSVVFLCFGSMGSFNEKQVKEIAVAIERSGHRFLWSLRRPTPKEKIEFPKEYENLEEVLPEGFLKRTSSIGKVIGWAPQMAVLSHPSVGGFVSHCGWNSTLESMWCGVPMAAWPLYAEQTLNAFLLVVELGLAAEIRMDYRTDTKAGYDGGMEVTVEEIEDGIRKLMSDGEIRNKVKDVKEKSRAAVVEGGSSYASIGKFIEHVSNVTI
서열 번호: 81: (양구슬냉이 (
Camelina sativa
))
MASEKTLQVHPPLHFVLFPFMAQGHMIPMVDIARLLAQRGATVTIVTTRYNAGRFENVLSRAVESGLPINIVHVKFPYEEVGLPKGKENIDSLDSMELMVPFFKAVNMLQDPVVKLMEEMESRPSCIISDLLLPYTSKIAKKFNIPKIVFHGISCFCLLCVHVLRRNLEILTNLKSDKEYFLVPSFPDRVEFTKPQVTVETNASGDWKEFLDEMVEAEDTSYGVIINTFEELEPAYVKDYKDARAGNVWSIGPVSLCNKAGVDKAERGNKATIDQDECLKWLDSKEEGSVLYVCLGSICNLPLVQLKELGLGLEESQRPFIWVIRGWEKYNELSEWMVESGFEERIRERGLLIRGWAPQVLILSHPSVGGFLTHCGWNSTVEGITSGVPLITWPLFGDQFCNQTLVVQVLKAGVSVGVEEVMKWGEEEKIGVLVDKEGVKKAVEDLMGESDDAKERTKRVKELGGLAHKAVEEGGSSHSNITLFLQDIRQVQSV
서열 번호: 82: UGT73F24 (감초 (
Glycyrrhiza uralensis
)(UGT73F24)
MADVAEEQPLKIYFIPYLAAGHMIPLCDIATLFASRGHHVTIITTPSNAQTLRESHHFRVQTIQFPSQEVGLPAGVQNLTAVTNLDDSYKIYHATMLLRKHIEDFVERDPPDCIVADFLFPWVDDVATKLHIPRLVFNGFTLFTICAMESHKAHPLPVDAASGSFVIPDFPHHVTINSTPPKRTKEFVDPLLTEAFKSHGFLINSFVELDGEECVEHYERITGGHKAWHLGPAFLVHRTAQDRGEKSVVSTQECLSWLDSKRDNSVLYICFGTICYFPDKQLYEIASAIEASGHEFIWVVPEKRGNADESEEEKEKWLPKGFEERNNGKKGMIIRGWAPQVAILGHPAVGGFLTHCGWNSTVEAVSAGVPMITWPVHSDQYFNEKLITQVRGIGVEVGAEEWIVTAFRETEKLVGRDRIERAVRRVMDGGDEAVQIRRRARELGEMARQAVQEGGSSHTNLTALINDLKRWRDSKQLN
서열 번호: 83: UGT73C33 (감초)
MAVFQANQPHFVLFPLMAQGHIIPMIDIARLLAQRGAIVTIFTTPKNASRFTSVLSRAVSSGLQIRLVHLHFPSKEAGLPEGCENLDMVASHDMICNIFQAIRMLQKQAEELFETLTPKPSCIISDFCIPWTTQVAEKHHIPRISFHGFSCFCLHCMLKIHTSKVLEGITSESEYFTVPGIPDQIQVTKQQVPGPMIDEMKEFGEQMRDAEIRSYGVIINTFEELEKAYVNDYKKERNGKVWCIGPVSLCNKDGLDKAQRGNKASISEHHCLEWLDLQQPNSVIYVCLGSLCNLTPPQLMELALGLEATKRPFIWVIREGNKFEELEKWISEEGFEERIKGRGLIIRGWAPQVLILSHPSIGGFLTHCGWNSTLEGVTAGVPMVTWPLFADQFLNEKLVTQVLRIGVSLGVDVPLKWGEEEKVGVQVKKEGIEKAICMVMDEGEESKERRERAKELSEMAKRAVEKDGSSHLNMTMLIQDIMQQSSSKVET
서열 번호: 84: UGT85C1 (
스테비아 레바우디아나
)
MDQMAKIDEKKPHVVFIPFPAQSHIKCMLKLARILHQKGLYITFINTDTNHERLVASGGTQWLENAPGFWFKTVPDGFGSAKDDGVKPTDALRELMDYLKTNFFDLFLDLVLKLEVPATCIICDGCMTFANTIRAAEKLNIPVILFWTMAACGFMAFYQAKVLKEKEIVPVKDETYLTNGYLDMEIDWIPGMKRIRLRDLPEFILATKQNYFAFEFLFETAQLADKVSHMIIHTFEELEASLVSEIKSIFPNVYTIGPLQLLLNKITQKETNNDSYSLWKEEPECVEWLNSKEPNSVVYVNFGSLAVMSLQDLVEFGWGLVNSNHYFLWIIRANLIDGKPAVMPQELKEAMNEKGFVGSWCSQEEVLNHPAVGGFLTHCGWGSIIESLSAGVPMLGWPSIGDQRANCRQMCKEWEVGMEIGKNVKRDEVEKLVRMLMEGLEGERMRKKALEWKKSATLATCCNGSSSLDVEKLANEIKKLSRN
서열 번호: 99: At75D1 (애기 장대)
MANNNSNSPTGPHFLFVTFPAQGHINPSLELAKRLAGTISGARVTFAASISAYNRRMFSTENVPETLIFATYSDGHDDGFKSSAYSDKSRQDATGNFMSEMRRRGKETLTELIEDNRKQNRPFTCVVYTILLTWVAELAREFHLPSALLWVQPVTVFSIFYHYFNGYEDAISEMANTPSSSIKLPSLPLLTVRDIPSFIVSSNVYAFLLPAFREQIDSLKEEINPKILINTFQELEPEAMSSVPDNFKIVPVGPLLTLRTDFSSRGEYIEWLDTKADSSVLYVSFGTLAVLSKKQLVELCKALIQSRRPFLWVITDKSYRNKEDEQEKEEDCISSFREELDEIGMVVSWCDQFRVLNHRSIGCFVTHCGWNSTLESLVSGVPVVAFPQWNDQMMNAKLLEDCWKTGVRVMEKKEEEGVVVVDSEEIRRCIEEVMEDKAEEFRGNATRWKDLAAEAVREGGSSFNHLKAFVDEHM
링커
서열 번호: 85: GGSGGS (L6)
서열 번호: 86: GGSGGSG (L7)
서열 번호: 87: GGSGGSGG (L8)
서열 번호: 88: GGSGGSGGS (L9)
서열 번호: 89: GGSGGSGGSG (L10)
서열 번호: 90: GGSGGSGGSGG (L11)
서열 번호: 91: GGSGGSGGSGGS (L12)
보완 효소
서열 번호: 92:
E. 콜리
pgm
MAIHNRAGQPAQQSDLINVAQLTAQYYVLKPEAGNAEHAVKFGTSGHRGSAARHSFNEPHILAIAQAIAEERAKNGITGPCYVGKDTHALSEPAFISVLEVLAANGVDVIVQENNGFTPTPAVSNAILVHNKKGGPLADGIVITPSHNPPEDGGIKYNPPNGGPADTNVTKVVEDRANALLADGLKGVKRISLDEAMASGHVKEQDLVQPFVEGLADIVDMAAIQKAGLTLGVDPLGGSGIEYWKRIGEYYNLNLTIVNDQVDQTFRFMHLDKDGAIRMDCSSECAMAGLLALRDKFDLAFANDPDYDRHGIVTPAGLMNPNHYLAVAINYLFQHRPQWGKDVAVGKTLVSSAMIDRVVNDLGRKLVEVPVGFKWFVDGLFDGSFGFGGEESAGASFLRFDGTPWSTDKDGIIMCLLAAEITAVTGKNPQEHYNELAKRFGAPSYNRLQAAATSAQKAALSKLSPEMVSASTLAGDPITARLTAAPGNGASIGGLKVMTDNGWFAARPSGTEDAYKIYCESFLGEEHRKQIEKEAVEIVSEVLKNA
서열 번호: 93:
E. 콜리
galU
MAAINTKVKKAVIPVAGLGTRMLPATKAIPKEMLPLVDKPLIQYVVNECIAAGITEIVLVTHSSKNSIENHFDTSFELEAMLEKRVKRQLLDEVQSICPPHVTIMQVRQGLAKGLGHAVLCAHPVVGDEPVAVILPDVILDEYESDLSQDNLAEMIRRFDETGHSQIMVEPVADVTAYGVVDCKGVELAPGESVPMVGVVEKPKADVAPSNLAIVGRYVLSADIWPLLAKTPPGAGDEIQLTDAIDMLIEKETVEAYHMKGKSHDCGNKLGYMQAFVEYGIRHNTLGTEFKAWLEEEMGIKK
서열 번호: 94:
E. 콜리
ycjU
MKLQGVIFDLDGVITDTAHLHFQAWQQIAAEIGISIDAQFNESLKGISRDESLRRILQHGGKEGDFNSQERAQLAYRKNLLYVHSLRELTVNAVLPGIRSLLADLRAQQISVGLASVSLNAPTILAALELREFFTFCADASQLKNSKPDPEIFLAACAGLGVPPQACIGIEDAQAGIDAINASGMRSVGIGAGLTGAQLLLPSTESLTWPRLSAFWQNV
서열 번호: 95:
비피도박테리움 비피둠
ugpA
MAFAEDLKRTEKMTVDDVFEQSAQKMREQGMSEIAISQFRHAYHVWASEKESAWIREDTVEPLHGVRSFHDVYKTIDHDKAVHAFAKTAFLKLNGGLGTSMGLQCAKSLLPVRRHKARQMRFLDIILGQVLTARTRLNVPLPVTFMNSFRTSDDTMKALRHQRKFKQTDIPLEIIQHQEPKIDAATGAPASWPANPDLEWCPPGHGDLFSTLRESGLLDTLLEHGFEYLFISNSDNLGARPSRTLAQYFEDTGAPFMVEVANRTYADRKGGHIVRDTATGRLILREMSQVHPDDKDAAQDIAKHPYFNTNNIWVRIDVLRDMLAEHDGVLPLPVIINNKTVDPIDPQSPAVVQLETAMGAAIGLFEGAICVQVDRMRFLPVKTTNDLFIMRSDRFHLTDSYEMEDGNYIFPNVDLDPRYYKNIEDFNERFPYNVPSLAAANSVSIKGDWTFGRDVIMFADARLEDRNEPSYVPNGEYVGPMGIEPGDWV
서열 번호: 96:
E. 콜리
adk
MRIILLGAPGAGKGTQAQFIMEKYGIPQISTGDMLRAAVKSGSELGKQAKDIMDAGKLVTDELVIALVKERIAQEDCRNGFLLDGFPRTIPQADAMKEAGINVDYVLEFDVPDELIVDRIVGRRVHAPSGRVYHVKFNPPKVEGKDDVTGEELTTRKDDQEETVRKRLVEYHQMTAPLIGYYSKEAEAGNTKYAKVDGTKPVAEVRADLEKILG
서열 번호: 97:
E. 콜리
ndk
MAIERTFSIIKPNAVAKNVIGNIFARFEAAGFKIVGTKMLHLTVEQARGFYAEHDGKPFFDGLVEFMTSGPIVVSVLEGENAVQRHRDLLGATNPANALAGTLRADYADSLTENGTHGSDSVESAAREIAYFFGEGEVCPRTR
서열 번호: 98:
E. 콜리
cmk
MTAIAPVITIDGPSGAGKGTLCKAMAEALQWHLLDSGAIYRVLALAALHHHVDVASEDALVPLASHLDVRFVSTNGNLEVILEGEDVSGEIRTQEVANAASQVAAFPRVREALLRRQRAFRELPGLIADGRDMGTVVFPDAPVKIFLDASSEERAHRRMLQLQEKGFSVNFERLLAEIKERDDRDRNRAVAPLVPAADALVLDSTTLSIEQVIEKALQYARQKLALA
SEQUENCE LISTING
<110> Manus Bio Inc.
KUMARAN, Ajikumar Parayil
Santos, Christine Nicole
Donald, Jason
Love, Aaron
ZHENG, Yiying
GHADERI, Adel
SHASTRY, Vineet
Chen, Lu
Toomey, Christopher
LYNCH, Hannah
NIEMINEN, Eric
<120> GLYCOSIDE PRODUCT BIOSYNTHESIS AND RECOVERY
<130> MAN-027PC/107590-5026
<140> PCT/US21/60722
<141> 2021-11-24
<160> 99
<170> PatentIn version 3.5
<210> 1
<211> 805
<212> PRT
<213> Solanum tuberosum
<400> 1
Met Ala Glu Arg Val Leu Thr Arg Val His Ser Leu Arg Glu Arg Val
1 5 10 15
Asp Ala Thr Leu Ala Ala His Arg Asn Glu Ile Leu Leu Phe Leu Ser
20 25 30
Arg Ile Glu Ser His Gly Lys Gly Ile Leu Lys Pro His Glu Leu Leu
35 40 45
Ala Glu Phe Asp Ala Ile Arg Gln Asp Asp Lys Asn Lys Leu Asn Glu
50 55 60
His Ala Phe Glu Glu Leu Leu Lys Ser Thr Gln Glu Ala Ile Val Leu
65 70 75 80
Pro Pro Trp Val Ala Leu Ala Ile Arg Leu Arg Pro Gly Val Trp Glu
85 90 95
Tyr Ile Arg Val Asn Val Asn Ala Leu Val Val Glu Glu Leu Ser Val
100 105 110
Pro Glu Tyr Leu Gln Phe Lys Glu Glu Leu Val Asp Gly Ala Ser Asn
115 120 125
Gly Asn Phe Val Leu Glu Leu Asp Phe Glu Pro Phe Thr Ala Ser Phe
130 135 140
Pro Lys Pro Thr Leu Thr Lys Ser Ile Gly Asn Gly Val Glu Phe Leu
145 150 155 160
Asn Arg His Leu Ser Ala Lys Met Phe His Asp Lys Glu Ser Met Thr
165 170 175
Pro Leu Leu Glu Phe Leu Arg Ala His His Tyr Lys Gly Lys Thr Met
180 185 190
Met Leu Asn Asp Arg Ile Gln Asn Ser Asn Thr Leu Gln Asn Val Leu
195 200 205
Arg Lys Ala Glu Glu Tyr Leu Ile Met Leu Pro Pro Glu Thr Pro Tyr
210 215 220
Phe Glu Phe Glu His Lys Phe Gln Glu Ile Gly Leu Glu Lys Gly Trp
225 230 235 240
Gly Asp Thr Ala Glu Arg Val Leu Glu Met Val Cys Met Leu Leu Asp
245 250 255
Leu Leu Glu Ala Pro Asp Ser Cys Thr Leu Glu Lys Phe Leu Gly Arg
260 265 270
Ile Pro Met Val Phe Asn Val Val Ile Leu Ser Pro His Gly Tyr Phe
275 280 285
Ala Gln Glu Asn Val Leu Gly Tyr Pro Asp Thr Gly Gly Gln Val Val
290 295 300
Tyr Ile Leu Asp Gln Val Pro Ala Leu Glu Arg Glu Met Leu Lys Arg
305 310 315 320
Ile Lys Glu Gln Gly Leu Asp Ile Ile Pro Arg Ile Leu Ile Val Thr
325 330 335
Arg Leu Leu Pro Asp Ala Val Gly Thr Thr Cys Gly Gln Arg Ile Glu
340 345 350
Lys Val Tyr Gly Ala Glu His Ser His Ile Leu Arg Val Pro Phe Arg
355 360 365
Thr Glu Lys Gly Ile Val Arg Lys Trp Ile Ser Arg Phe Glu Val Trp
370 375 380
Pro Tyr Met Glu Thr Phe Ile Glu Asp Val Ala Lys Glu Ile Ser Ala
385 390 395 400
Glu Leu Gln Ala Lys Pro Asp Leu Ile Ile Gly Asn Tyr Ser Glu Gly
405 410 415
Asn Leu Ala Ala Ser Leu Leu Ala His Lys Leu Gly Val Thr Gln Cys
420 425 430
Thr Ile Ala His Ala Leu Glu Lys Thr Lys Tyr Pro Asp Ser Asp Ile
435 440 445
Tyr Trp Lys Lys Phe Asp Glu Lys Tyr His Phe Ser Ser Gln Phe Thr
450 455 460
Ala Asp Leu Ile Ala Met Asn His Thr Asp Phe Ile Ile Thr Ser Thr
465 470 475 480
Phe Gln Glu Ile Ala Gly Ser Lys Asp Thr Val Gly Gln Tyr Glu Ser
485 490 495
His Met Ala Phe Thr Met Pro Gly Leu Tyr Arg Val Val His Gly Ile
500 505 510
Asn Val Phe Asp Pro Lys Phe Asn Ile Val Ser Pro Gly Ala Asp Ile
515 520 525
Asn Leu Tyr Phe Ser Tyr Ser Glu Thr Glu Lys Arg Leu Thr Ala Phe
530 535 540
His Pro Glu Ile Asp Glu Leu Leu Tyr Ser Asp Val Glu Asn Asp Glu
545 550 555 560
His Leu Cys Val Leu Lys Asp Arg Thr Lys Pro Ile Leu Phe Thr Met
565 570 575
Ala Arg Leu Asp Arg Val Lys Asn Leu Thr Gly Leu Val Glu Trp Tyr
580 585 590
Ala Lys Asn Pro Arg Leu Arg Gly Leu Val Asn Leu Val Val Val Gly
595 600 605
Gly Asp Arg Arg Lys Glu Ser Lys Asp Leu Glu Glu Gln Ala Glu Met
610 615 620
Lys Lys Met Tyr Glu Leu Ile Glu Thr His Asn Leu Asn Gly Gln Phe
625 630 635 640
Arg Trp Ile Ser Ser Gln Met Asn Arg Val Arg Asn Gly Glu Leu Tyr
645 650 655
Arg Tyr Ile Ala Asp Thr Lys Gly Ala Phe Val Gln Pro Ala Phe Tyr
660 665 670
Glu Ala Phe Gly Leu Thr Val Val Glu Ala Met Thr Cys Gly Leu Pro
675 680 685
Thr Phe Ala Thr Asn His Gly Gly Pro Ala Glu Ile Ile Val His Gly
690 695 700
Lys Ser Gly Phe His Ile Asp Pro Tyr His Gly Glu Gln Ala Ala Asp
705 710 715 720
Leu Leu Ala Asp Phe Phe Glu Lys Cys Lys Lys Asp Pro Ser His Trp
725 730 735
Glu Thr Ile Ser Met Gly Gly Leu Lys Arg Ile Glu Glu Lys Tyr Thr
740 745 750
Trp Gln Ile Tyr Ser Glu Ser Leu Leu Thr Leu Ala Ala Val Tyr Gly
755 760 765
Phe Trp Lys His Val Ser Lys Leu Asp Arg Leu Glu Ile Arg Arg Tyr
770 775 780
Leu Glu Met Phe Tyr Ala Leu Lys Tyr Arg Lys Met Ala Glu Ala Val
785 790 795 800
Pro Leu Ala Ala Glu
805
<210> 2
<211> 805
<212> PRT
<213> Solanum tuberosum
<400> 2
Met Ala Glu Arg Val Leu Thr Arg Val His Ser Leu Arg Glu Arg Leu
1 5 10 15
Asp Ala Thr Leu Ala Ala His Arg Asn Glu Ile Leu Leu Phe Leu Ser
20 25 30
Arg Ile Glu Ser His Gly Lys Gly Ile Leu Lys Pro His Gln Leu Leu
35 40 45
Ala Glu Phe Glu Ser Ile His Lys Glu Asp Lys Asp Lys Leu Asn Asp
50 55 60
His Ala Phe Glu Glu Val Leu Lys Ser Thr Gln Glu Ala Ile Val Leu
65 70 75 80
Pro Pro Trp Val Ala Leu Ala Ile Arg Leu Arg Pro Gly Val Trp Glu
85 90 95
Tyr Val Arg Val Asn Val Asn Ala Leu Ile Val Glu Glu Leu Thr Val
100 105 110
Pro Glu Phe Leu Gln Phe Lys Glu Glu Leu Val Asn Gly Thr Ser Asn
115 120 125
Asp Asn Phe Val Leu Glu Leu Asp Phe Glu Pro Phe Thr Ala Ser Phe
130 135 140
Pro Lys Pro Thr Leu Thr Lys Ser Ile Gly Asn Gly Val Glu Phe Leu
145 150 155 160
Asn Arg His Leu Ser Ala Lys Met Phe His Asp Lys Glu Ser Met Thr
165 170 175
Pro Leu Leu Glu Phe Leu Arg Val His His Tyr Lys Gly Lys Thr Met
180 185 190
Met Leu Asn Asp Arg Ile Gln Asn Leu Tyr Thr Leu Gln Lys Val Leu
195 200 205
Arg Lys Ala Glu Glu Tyr Leu Thr Thr Leu Ser Pro Glu Thr Ser Tyr
210 215 220
Ser Ala Phe Glu His Lys Phe Gln Glu Ile Gly Leu Glu Arg Gly Trp
225 230 235 240
Gly Asp Thr Ala Glu Arg Val Leu Glu Met Ile Cys Met Leu Leu Asp
245 250 255
Leu Leu Glu Ala Pro Asp Ser Cys Thr Leu Glu Lys Phe Leu Gly Arg
260 265 270
Ile Pro Met Val Phe Asn Val Val Ile Leu Ser Pro His Gly Tyr Phe
275 280 285
Ala Gln Glu Asn Val Leu Gly Tyr Pro Asp Thr Gly Gly Gln Val Val
290 295 300
Tyr Ile Leu Asp Gln Val Pro Ala Leu Glu Arg Glu Met Leu Lys Arg
305 310 315 320
Ile Lys Glu Gln Gly Leu Asp Ile Lys Pro Arg Ile Leu Ile Val Thr
325 330 335
Arg Leu Leu Pro Asp Ala Val Gly Thr Thr Cys Gly Gln Arg Leu Glu
340 345 350
Lys Val Phe Gly Thr Glu His Ser His Ile Leu Arg Val Pro Phe Arg
355 360 365
Thr Glu Lys Gly Ile Val Arg Lys Trp Ile Ser Arg Phe Glu Val Trp
370 375 380
Pro Tyr Met Glu Thr Phe Ile Glu Asp Val Gly Lys Glu Ile Thr Ala
385 390 395 400
Glu Leu Gln Ala Lys Pro Asp Leu Ile Ile Gly Asn Tyr Ser Glu Gly
405 410 415
Asn Leu Ala Ala Ser Leu Leu Ala His Lys Leu Gly Val Thr Gln Cys
420 425 430
Thr Ile Ala His Ala Leu Glu Lys Thr Lys Tyr Pro Asp Ser Asp Ile
435 440 445
Tyr Leu Asn Lys Phe Asp Glu Lys Tyr His Phe Ser Ala Gln Phe Thr
450 455 460
Ala Asp Leu Ile Ala Met Asn His Thr Asp Phe Ile Ile Thr Ser Thr
465 470 475 480
Phe Gln Glu Ile Ala Gly Ser Lys Asp Thr Val Gly Gln Tyr Glu Ser
485 490 495
His Met Ala Phe Thr Met Pro Gly Leu Tyr Arg Val Val His Gly Ile
500 505 510
Asp Val Phe Asp Pro Lys Phe Asn Ile Val Ser Pro Gly Ala Asp Val
515 520 525
Asn Leu Tyr Phe Pro Tyr Ser Glu Lys Glu Lys Arg Leu Thr Thr Phe
530 535 540
His Pro Glu Ile Glu Asp Leu Leu Phe Ser Asp Val Glu Asn Glu Glu
545 550 555 560
His Leu Cys Val Leu Lys Asp Arg Asn Lys Pro Ile Ile Phe Thr Met
565 570 575
Ala Arg Leu Asp Arg Val Lys Asn Leu Thr Gly Leu Val Glu Trp Tyr
580 585 590
Ala Lys Asn Pro Arg Leu Arg Glu Leu Val Asn Leu Val Val Val Gly
595 600 605
Gly Asp Arg Arg Lys Glu Ser Lys Asp Leu Glu Glu Gln Ala Glu Met
610 615 620
Lys Lys Met Tyr Glu Leu Ile Lys Thr His Asn Leu Asn Gly Gln Phe
625 630 635 640
Arg Trp Ile Ser Ser Gln Met Asn Arg Val Arg Asn Gly Glu Leu Tyr
645 650 655
Arg Tyr Ile Ala Asp Thr Arg Gly Ala Phe Val Gln Pro Ala Phe Tyr
660 665 670
Glu Ala Phe Gly Leu Thr Val Val Glu Ala Met Ser Cys Gly Leu Pro
675 680 685
Thr Phe Ala Thr Asn Gln Gly Gly Pro Ala Glu Ile Ile Val His Gly
690 695 700
Lys Ser Gly Phe Gln Ile Asp Pro Tyr His Gly Glu Gln Ala Ala Asp
705 710 715 720
Leu Leu Ala Asp Phe Phe Glu Lys Cys Lys Val Asp Pro Ser His Trp
725 730 735
Glu Ala Ile Ser Glu Gly Gly Leu Lys Arg Ile Gln Glu Lys Tyr Thr
740 745 750
Trp Gln Ile Tyr Ser Asp Arg Leu Leu Thr Leu Ala Ala Val Tyr Gly
755 760 765
Phe Trp Lys His Val Ser Lys Leu Asp Arg Leu Glu Ile Arg Arg Tyr
770 775 780
Leu Glu Met Phe Tyr Ala Leu Lys Phe Arg Lys Leu Ala Gln Leu Val
785 790 795 800
Pro Leu Ala Val Glu
805
<210> 3
<211> 805
<212> PRT
<213> Solanum tuberosum
<400> 3
Met Ala Glu Arg Val Leu Thr Arg Val His Glu Leu Arg Glu Arg Leu
1 5 10 15
Asp Ala Thr Leu Ala Ala His Arg Asn Glu Ile Leu Leu Phe Leu Ser
20 25 30
Arg Ile Glu Ser His Gly Lys Gly Ile Leu Lys Pro His Gln Leu Leu
35 40 45
Ala Glu Phe Glu Ser Ile His Lys Glu Asp Lys Asp Lys Leu Asn Asp
50 55 60
His Ala Phe Glu Glu Val Leu Lys Ser Thr Gln Glu Ala Ile Val Leu
65 70 75 80
Pro Pro Trp Val Ala Leu Ala Ile Arg Leu Arg Pro Gly Val Trp Glu
85 90 95
Tyr Val Arg Val Asn Val Asn Ala Leu Ile Val Glu Glu Leu Thr Val
100 105 110
Pro Glu Phe Leu Gln Phe Lys Glu Glu Leu Val Asn Gly Thr Ser Asn
115 120 125
Asp Asn Phe Val Leu Glu Leu Asp Phe Glu Pro Phe Thr Ala Ser Phe
130 135 140
Pro Lys Pro Thr Leu Thr Lys Ser Ile Gly Asn Gly Val Glu Phe Leu
145 150 155 160
Asn Arg His Leu Ser Ala Lys Met Phe His Asp Lys Glu Ser Met Thr
165 170 175
Pro Leu Leu Glu Phe Leu Arg Val His His Tyr Lys Gly Lys Thr Met
180 185 190
Met Leu Asn Asp Arg Ile Gln Asn Leu Tyr Thr Leu Gln Lys Val Leu
195 200 205
Arg Lys Ala Glu Glu Tyr Leu Thr Thr Leu Ser Pro Glu Thr Ser Tyr
210 215 220
Ser Ala Phe Glu His Lys Phe Gln Glu Ile Gly Leu Glu Arg Gly Trp
225 230 235 240
Gly Asp Thr Ala Glu Arg Val Leu Glu Met Ile Cys Met Leu Leu Asp
245 250 255
Leu Leu Glu Ala Pro Asp Ser Cys Thr Leu Glu Lys Phe Leu Gly Arg
260 265 270
Ile Pro Met Val Phe Asn Val Val Ile Leu Ser Pro His Gly Tyr Phe
275 280 285
Ala Gln Glu Asn Val Leu Gly Tyr Pro Asp Thr Gly Gly Gln Val Val
290 295 300
Tyr Ile Leu Asp Gln Val Pro Ala Leu Glu Arg Glu Met Leu Lys Arg
305 310 315 320
Ile Lys Glu Gln Gly Leu Asp Ile Lys Pro Arg Ile Leu Ile Val Thr
325 330 335
Arg Leu Leu Pro Asp Ala Val Gly Thr Thr Cys Gly Gln Arg Leu Glu
340 345 350
Lys Val Phe Gly Thr Glu His Ser His Ile Leu Arg Val Pro Phe Arg
355 360 365
Thr Glu Lys Gly Ile Val Arg Lys Trp Ile Ser Arg Phe Glu Val Trp
370 375 380
Pro Tyr Met Glu Thr Phe Ile Glu Asp Val Gly Lys Glu Ile Thr Ala
385 390 395 400
Glu Leu Gln Ala Lys Pro Asp Leu Ile Ile Gly Asn Tyr Ser Glu Gly
405 410 415
Asn Leu Ala Ala Ser Leu Leu Ala His Lys Leu Gly Val Thr Gln Cys
420 425 430
Thr Ile Ala His Ala Leu Glu Lys Thr Lys Tyr Pro Asp Ser Asp Ile
435 440 445
Tyr Leu Asn Lys Phe Asp Glu Lys Tyr His Phe Ser Ala Gln Phe Thr
450 455 460
Ala Asp Leu Ile Ala Met Asn His Thr Asp Phe Ile Ile Thr Ser Thr
465 470 475 480
Phe Gln Glu Ile Ala Gly Ser Lys Asp Thr Val Gly Gln Tyr Glu Ser
485 490 495
His Met Ala Phe Thr Met Pro Gly Leu Tyr Arg Val Val His Gly Ile
500 505 510
Asp Val Phe Asp Pro Lys Phe Asn Ile Val Ser Pro Gly Ala Asp Val
515 520 525
Asn Leu Tyr Phe Pro Tyr Ser Glu Lys Glu Lys Arg Leu Thr Thr Phe
530 535 540
His Pro Glu Ile Glu Asp Leu Leu Phe Ser Asp Val Glu Asn Glu Glu
545 550 555 560
His Leu Cys Val Leu Lys Asp Arg Asn Lys Pro Ile Ile Phe Thr Met
565 570 575
Ala Arg Leu Asp Arg Val Lys Asn Leu Thr Gly Leu Val Glu Trp Tyr
580 585 590
Ala Lys Asn Pro Arg Leu Arg Glu Leu Val Asn Leu Val Val Val Gly
595 600 605
Gly Asp Arg Arg Lys Glu Ser Lys Asp Leu Glu Glu Gln Ala Glu Met
610 615 620
Lys Lys Met Tyr Glu Leu Ile Lys Thr His Asn Leu Asn Gly Gln Phe
625 630 635 640
Arg Trp Ile Ser Ser Gln Met Asn Arg Val Arg Asn Gly Glu Leu Tyr
645 650 655
Arg Tyr Ile Ala Asp Thr Arg Gly Ala Phe Val Gln Pro Ala Phe Tyr
660 665 670
Glu Ala Phe Gly Leu Thr Val Val Glu Ala Met Ser Cys Gly Leu Pro
675 680 685
Thr Phe Ala Thr Asn Gln Gly Gly Pro Ala Glu Ile Ile Val His Gly
690 695 700
Lys Ser Gly Phe Gln Ile Asp Pro Tyr His Gly Glu Gln Ala Ala Asp
705 710 715 720
Leu Leu Ala Asp Phe Phe Glu Lys Cys Lys Val Asp Pro Ser His Trp
725 730 735
Glu Ala Ile Ser Glu Gly Gly Leu Lys Arg Ile Gln Glu Lys Tyr Thr
740 745 750
Trp Gln Ile Tyr Ser Asp Arg Leu Leu Thr Leu Ala Ala Val Tyr Gly
755 760 765
Phe Trp Lys His Val Ser Lys Leu Asp Arg Leu Glu Ile Arg Arg Tyr
770 775 780
Leu Glu Met Phe Tyr Ala Leu Lys Phe Arg Lys Leu Ala Gln Leu Val
785 790 795 800
Pro Leu Ala Val Glu
805
<210> 4
<211> 794
<212> PRT
<213> Acidithiobacillus caldus
<400> 4
Met Ala Ile Glu Ala Leu Arg Gln Gln Leu Leu Asp Asp Pro Arg Ser
1 5 10 15
Trp Tyr Ala Phe Leu Arg His Leu Val Ala Ser Gln Arg Asp Ser Trp
20 25 30
Leu Tyr Thr Asp Leu Gln Arg Ala Cys Ala Asp Phe Arg Glu Gln Leu
35 40 45
Pro Glu Gly Tyr Ala Glu Gly Ile Gly Pro Leu Glu Asp Phe Val Ala
50 55 60
His Thr Gln Glu Val Ile Phe Arg Asp Pro Trp Met Val Phe Ala Trp
65 70 75 80
Arg Pro Arg Pro Gly Arg Trp Ile Tyr Val Arg Ile His Arg Glu Gln
85 90 95
Leu Ala Leu Glu Glu Leu Ser Thr Asp Ala Tyr Leu Gln Ala Lys Glu
100 105 110
Gly Ile Val Gly Leu Gly Ala Glu Gly Glu Ala Val Leu Thr Val Asp
115 120 125
Phe Arg Asp Phe Arg Pro Val Ser Arg Arg Leu Arg Asp Glu Ser Thr
130 135 140
Ile Gly Asp Gly Leu Thr His Leu Asn Arg Arg Leu Ala Gly Arg Ile
145 150 155 160
Phe Ser Asp Leu Ala Ala Gly Arg Ser Gln Ile Leu Glu Phe Leu Ser
165 170 175
Leu His Arg Leu Asp Gly Gln Asn Leu Met Leu Ser Asn Gly Asn Thr
180 185 190
Asp Phe Asp Ser Leu Arg Gln Thr Val Gln Tyr Leu Gly Thr Leu Pro
195 200 205
Arg Glu Thr Pro Trp Ala Glu Ile Arg Glu Asp Met Arg Arg Arg Gly
210 215 220
Phe Ala Pro Gly Trp Gly Asn Thr Ala Gly Arg Val Arg Glu Thr Met
225 230 235 240
Arg Leu Leu Met Asp Leu Leu Asp Ser Pro Ser Pro Ala Ala Leu Glu
245 250 255
Ser Phe Leu Asp Arg Ile Pro Met Ile Ser Arg Ile Leu Ile Val Ser
260 265 270
Ile His Gly Trp Phe Ala Gln Asp Lys Val Leu Gly Arg Pro Asp Thr
275 280 285
Gly Gly Gln Val Val Tyr Ile Leu Asp Gln Ala Arg Ala Leu Glu Arg
290 295 300
Glu Met Arg Asn Arg Leu Arg Gln Gln Gly Val Asp Val Glu Pro Arg
305 310 315 320
Ile Leu Ile Ala Thr Arg Leu Ile Pro Glu Ser Asp Gly Thr Thr Cys
325 330 335
Asp Gln Arg Leu Glu Pro Val Val Gly Ala Glu Asn Val Gln Ile Leu
340 345 350
Arg Val Pro Phe Arg Tyr Pro Asp Gly Arg Ile His Pro His Trp Ile
355 360 365
Ser Arg Phe Lys Ile Trp Pro Trp Leu Glu Arg Tyr Ala Gln Asp Leu
370 375 380
Glu Arg Glu Val Leu Ala Glu Leu Gly Ser Arg Pro Asp Leu Ile Ile
385 390 395 400
Gly Asn Tyr Ser Asp Gly Asn Leu Val Ala Thr Leu Leu Ser Glu Arg
405 410 415
Leu Gly Val Thr Gln Cys Asn Ile Ala His Ala Leu Glu Lys Ser Lys
420 425 430
Tyr Leu Tyr Ser Asp Leu His Trp Arg Asp His Glu Gln Asp His His
435 440 445
Phe Ala Cys Gln Phe Thr Ala Asp Leu Ile Ala Met Asn Ala Ala Asp
450 455 460
Ile Ile Val Thr Ser Thr Tyr Gln Glu Ile Ala Gly Asn Asp Arg Glu
465 470 475 480
Ile Gly Gln Tyr Glu Gly His Gln Asp Tyr Thr Leu Pro Gly Leu Tyr
485 490 495
Arg Val Glu Asn Gly Ile Asp Val Phe Asp Ser Lys Phe Asn Ile Val
500 505 510
Ser Pro Gly Ala Asp Pro Arg Phe Tyr Phe Ser Tyr Ala Arg Thr Glu
515 520 525
Glu Arg Pro Ser Phe Leu Glu Pro Glu Ile Glu Ser Leu Leu Phe Gly
530 535 540
Arg Glu Pro Gly Ala Asp Arg Arg Gly Val Leu Glu Asp Arg Gln Lys
545 550 555 560
Pro Leu Leu Leu Ser Met Ala Arg Met Asp Arg Ile Lys Asn Leu Ser
565 570 575
Gly Leu Ala Glu Leu Tyr Gly Arg Ser Ser Arg Leu Arg Gly Leu Ala
580 585 590
Asn Leu Val Ile Ile Gly Gly His Val Asp Val Gly Asn Ser Arg Asp
595 600 605
Ala Glu Glu Arg Glu Glu Ile Arg Arg Met His Glu Ile Met Asp His
610 615 620
Tyr Gln Leu Asp Gly Gln Leu Arg Trp Val Gly Ala Leu Leu Asp Lys
625 630 635 640
Thr Val Ala Gly Glu Leu Tyr Arg Val Val Ala Asp Gly Arg Gly Val
645 650 655
Phe Val Gln Pro Ala Leu Phe Glu Ala Phe Gly Leu Thr Val Ile Glu
660 665 670
Ala Met Ser Ser Gly Leu Pro Val Phe Ala Thr Arg Phe Gly Gly Pro
675 680 685
Leu Glu Ile Ile Glu Asp Gly Val Ser Gly Phe His Ile Asp Pro Asn
690 695 700
Asp His Glu Ala Thr Ala Glu Arg Leu Ala Asp Phe Leu Glu Ala Ala
705 710 715 720
Arg Glu Arg Pro Lys Tyr Trp Leu Glu Ile Ser Asp Ala Ala Leu Ala
725 730 735
Arg Val Ala Glu Arg Tyr Thr Trp Glu Arg Tyr Ala Glu Arg Leu Met
740 745 750
Thr Ile Ala Arg Ile Phe Gly Phe Trp Arg Phe Val Leu Asp Arg Glu
755 760 765
Ser Gln Val Met Glu Arg Tyr Leu Gln Met Phe Arg His Leu Gln Trp
770 775 780
Arg Pro Leu Ala His Ala Val Pro Met Glu
785 790
<210> 5
<211> 794
<212> PRT
<213> Acidithiobacillus caldus
<400> 5
Met Ala Ile Glu Ala Leu Arg Gln Gln Leu Leu Asp Asp Pro Arg Ser
1 5 10 15
Trp Tyr Ala Phe Leu Arg His Leu Val Ala Ser Gln Arg Asp Ser Trp
20 25 30
Leu Tyr Thr Asp Leu Gln Arg Ala Cys Ala Asp Phe Arg Glu Gln Leu
35 40 45
Pro Glu Gly Tyr Ala Glu Gly Ile Gly Pro Leu Glu Asp Phe Val Ala
50 55 60
His Thr Gln Glu Val Ile Phe Arg Asp Pro Trp Met Val Phe Ala Trp
65 70 75 80
Arg Pro Arg Pro Gly Arg Trp Ile Tyr Val Arg Ile His Arg Glu Gln
85 90 95
Leu Ala Leu Glu Glu Leu Ser Thr Asp Ala Tyr Leu Gln Ala Lys Glu
100 105 110
Gly Ile Val Gly Leu Gly Ala Glu Gly Glu Ala Val Leu Thr Val Asp
115 120 125
Phe Arg Asp Phe Arg Pro Val Ser Arg Arg Leu Arg Asp Glu Ser Thr
130 135 140
Ile Gly Asp Gly Leu Thr His Leu Asn Arg Arg Leu Ala Gly Arg Ile
145 150 155 160
Phe Ser Asp Leu Ala Ala Gly Arg Ser Gln Ile Leu Glu Phe Leu Ser
165 170 175
Leu His Arg Leu Asp Gly Gln Asn Leu Met Leu Ser Asn Gly Asn Thr
180 185 190
Asp Phe Asp Ser Leu Arg Gln Thr Val Gln Tyr Leu Gly Thr Leu Pro
195 200 205
Arg Glu Thr Pro Trp Ala Glu Ile Arg Glu Asp Met Arg Arg Arg Gly
210 215 220
Phe Ala Pro Gly Trp Gly Asn Thr Ala Gly Arg Val Arg Glu Thr Met
225 230 235 240
Arg Leu Leu Met Asp Leu Leu Asp Ser Pro Ser Pro Ala Ala Leu Glu
245 250 255
Ser Phe Leu Asp Arg Ile Pro Met Ile Ser Arg Ile Leu Ile Val Ser
260 265 270
Ile His Gly Trp Phe Ala Gln Asp Lys Val Leu Gly Arg Pro Asp Thr
275 280 285
Gly Gly Gln Val Val Tyr Ile Leu Asp Gln Ala Arg Ala Leu Glu Arg
290 295 300
Glu Met Arg Asn Arg Leu Arg Gln Gln Gly Val Asp Val Glu Pro Arg
305 310 315 320
Ile Leu Ile Ala Thr Arg Leu Ile Pro Glu Ser Asp Gly Thr Thr Cys
325 330 335
Asp Gln Arg Leu Glu Pro Val Val Gly Ala Glu Asn Val Gln Ile Leu
340 345 350
Arg Val Pro Phe Arg Tyr Pro Asp Gly Arg Ile His Pro His Trp Ile
355 360 365
Ser Arg Phe Lys Ile Trp Pro Trp Leu Glu Arg Tyr Ala Gln Asp Leu
370 375 380
Glu Arg Glu Val Leu Ala Glu Leu Gly Ser Arg Pro Asp Leu Ile Ile
385 390 395 400
Gly Asn Tyr Ser Asp Gly Asn Leu Val Ala Thr Leu Leu Ser Glu Arg
405 410 415
Leu Gly Val Thr Gln Cys Asn Ile Ala His Ala Leu Glu Lys Ser Lys
420 425 430
Tyr Leu Tyr Ser Asp Leu His Trp Arg Asp His Glu Gln Asp His His
435 440 445
Phe Ala Cys Gln Phe Thr Ala Asp Leu Ile Ala Met Asn Ala Ala Asp
450 455 460
Ile Ile Val Thr Ser Thr Tyr Gln Glu Ile Ala Gly Asn Asp Arg Glu
465 470 475 480
Ile Gly Gln Tyr Glu Gly His Gln Asp Tyr Thr Leu Pro Gly Leu Tyr
485 490 495
Arg Val Glu Asn Gly Ile Asp Val Phe Asp Ser Lys Phe Asn Ile Val
500 505 510
Ser Pro Gly Ala Asp Pro Arg Phe Tyr Phe Ser Tyr Ala Arg Thr Glu
515 520 525
Glu Arg Pro Ser Phe Leu Glu Pro Glu Ile Glu Ser Leu Leu Phe Gly
530 535 540
Arg Glu Pro Gly Ala Asp Arg Arg Gly Val Leu Glu Asp Arg Gln Lys
545 550 555 560
Pro Leu Leu Leu Ser Met Ala Arg Met Asp Arg Ile Lys Asn Leu Ser
565 570 575
Gly Leu Ala Glu Leu Tyr Gly Arg Ser Ser Arg Leu Arg Gly Leu Ala
580 585 590
Asn Leu Val Ile Ile Gly Gly His Val Asp Val Gly Asn Ser Arg Asp
595 600 605
Ala Glu Glu Arg Glu Glu Ile Arg Arg Met His Glu Ile Met Asp His
610 615 620
Tyr Gln Leu Asp Gly Gln Leu Arg Trp Val Gly Ala Leu Met Asp Lys
625 630 635 640
Val Val Ala Gly Glu Leu Tyr Arg Val Val Ala Asp Gly Arg Gly Val
645 650 655
Phe Val Gln Pro Ala Leu Phe Glu Ala Phe Gly Leu Thr Val Ile Glu
660 665 670
Ala Met Ser Ser Gly Leu Pro Val Phe Ala Thr Arg Phe Gly Gly Pro
675 680 685
Leu Glu Ile Ile Glu Asp Gly Val Ser Gly Phe His Ile Asp Pro Asn
690 695 700
Asp His Glu Ala Thr Ala Glu Arg Leu Ala Asp Phe Leu Glu Ala Ala
705 710 715 720
Arg Glu Arg Pro Lys Tyr Trp Leu Glu Ile Ser Asp Ala Ala Leu Ala
725 730 735
Arg Val Ala Glu Arg Tyr Thr Trp Glu Arg Tyr Ala Glu Arg Leu Met
740 745 750
Thr Ile Ala Arg Ile Phe Gly Phe Trp Arg Phe Val Leu Asp Arg Glu
755 760 765
Ser Gln Val Met Glu Arg Tyr Leu Gln Met Phe Arg His Leu Gln Trp
770 775 780
Arg Pro Leu Ala His Ala Val Pro Met Glu
785 790
<210> 6
<211> 808
<212> PRT
<213> Arabidopsis thaliana
<400> 6
Met Ala Asn Ala Glu Arg Met Ile Thr Arg Val His Ser Gln Arg Glu
1 5 10 15
Arg Leu Asn Glu Thr Leu Val Ser Glu Arg Asn Glu Val Leu Ala Leu
20 25 30
Leu Ser Arg Val Glu Ala Lys Gly Lys Gly Ile Leu Gln Gln Asn Gln
35 40 45
Ile Ile Ala Glu Phe Glu Ala Leu Pro Glu Gln Thr Arg Lys Lys Leu
50 55 60
Glu Gly Gly Pro Phe Phe Asp Leu Leu Lys Ser Thr Gln Glu Ala Ile
65 70 75 80
Val Leu Pro Pro Trp Val Ala Leu Ala Val Arg Pro Arg Pro Gly Val
85 90 95
Trp Glu Tyr Leu Arg Val Asn Leu His Ala Leu Val Val Glu Glu Leu
100 105 110
Gln Pro Ala Glu Phe Leu His Phe Lys Glu Glu Leu Val Asp Gly Val
115 120 125
Lys Asn Gly Asn Phe Thr Leu Glu Leu Asp Phe Glu Pro Phe Asn Ala
130 135 140
Ser Ile Pro Arg Pro Thr Leu His Lys Tyr Ile Gly Asn Gly Val Asp
145 150 155 160
Phe Leu Asn Arg His Leu Ser Ala Lys Leu Phe His Asp Lys Glu Ser
165 170 175
Leu Leu Pro Leu Leu Lys Phe Leu Arg Leu His Ser His Gln Gly Lys
180 185 190
Asn Leu Met Leu Ser Glu Lys Ile Gln Asn Leu Asn Thr Leu Gln His
195 200 205
Thr Leu Arg Lys Ala Glu Glu Tyr Leu Ala Glu Leu Lys Ser Glu Thr
210 215 220
Leu Tyr Glu Glu Phe Glu Ala Lys Phe Glu Glu Ile Gly Leu Glu Arg
225 230 235 240
Gly Trp Gly Asp Asn Ala Glu Arg Val Leu Asp Met Ile Arg Leu Leu
245 250 255
Leu Asp Leu Leu Glu Ala Pro Asp Pro Cys Thr Leu Glu Thr Phe Leu
260 265 270
Gly Arg Val Pro Met Val Phe Asn Val Val Ile Leu Ser Pro His Gly
275 280 285
Tyr Phe Ala Gln Asp Asn Val Leu Gly Tyr Pro Asp Thr Gly Gly Gln
290 295 300
Val Val Tyr Ile Leu Asp Gln Val Arg Ala Leu Glu Ile Glu Met Leu
305 310 315 320
Gln Arg Ile Lys Gln Gln Gly Leu Asn Ile Lys Pro Arg Ile Leu Ile
325 330 335
Leu Thr Arg Leu Leu Pro Asp Ala Val Gly Thr Thr Cys Gly Glu Arg
340 345 350
Leu Glu Arg Val Tyr Asp Ser Glu Tyr Cys Asp Ile Leu Arg Val Pro
355 360 365
Phe Arg Thr Glu Lys Gly Ile Val Arg Lys Trp Ile Ser Arg Phe Glu
370 375 380
Val Trp Pro Tyr Leu Glu Thr Tyr Thr Glu Asp Ala Ala Val Glu Leu
385 390 395 400
Ser Lys Glu Leu Asn Gly Lys Pro Asp Leu Ile Ile Gly Asn Tyr Ser
405 410 415
Asp Gly Asn Leu Val Ala Ser Leu Leu Ala His Lys Leu Gly Val Thr
420 425 430
Gln Cys Thr Ile Ala His Ala Leu Glu Lys Thr Lys Tyr Pro Asp Ser
435 440 445
Asp Ile Tyr Trp Lys Lys Leu Asp Asp Lys Tyr His Phe Ser Cys Gln
450 455 460
Phe Thr Ala Asp Ile Phe Ala Met Asn His Thr Asp Phe Ile Ile Thr
465 470 475 480
Ser Thr Phe Gln Glu Ile Ala Gly Ser Lys Glu Thr Val Gly Gln Tyr
485 490 495
Glu Ser His Thr Ala Phe Thr Leu Pro Gly Leu Tyr Arg Val Val His
500 505 510
Gly Ile Asp Val Phe Asp Pro Lys Phe Asn Ile Val Ser Pro Gly Ala
515 520 525
Asp Met Ser Ile Tyr Phe Pro Tyr Thr Glu Glu Lys Arg Arg Leu Thr
530 535 540
Lys Phe His Ser Glu Ile Glu Glu Leu Leu Tyr Ser Asp Val Glu Asn
545 550 555 560
Lys Glu His Leu Cys Val Leu Lys Asp Lys Lys Lys Pro Ile Leu Phe
565 570 575
Thr Met Ala Arg Leu Asp Arg Val Lys Asn Leu Ser Gly Leu Val Glu
580 585 590
Trp Tyr Gly Lys Asn Thr Arg Leu Arg Glu Leu Ala Asn Leu Val Val
595 600 605
Val Gly Gly Asp Arg Arg Lys Glu Ser Lys Asp Asn Glu Glu Lys Ala
610 615 620
Glu Met Lys Lys Met Tyr Asp Leu Ile Glu Glu Tyr Lys Leu Asn Gly
625 630 635 640
Gln Phe Arg Trp Ile Ser Ser Gln Met Asp Arg Val Arg Asn Gly Glu
645 650 655
Leu Tyr Arg Tyr Ile Cys Asp Thr Lys Gly Ala Phe Val Gln Pro Ala
660 665 670
Leu Tyr Glu Ala Phe Gly Leu Thr Val Val Glu Ala Met Thr Cys Gly
675 680 685
Leu Pro Thr Phe Ala Thr Cys Lys Gly Gly Pro Ala Glu Ile Ile Val
690 695 700
His Gly Lys Ser Gly Phe His Ile Asp Pro Tyr His Gly Asp Gln Ala
705 710 715 720
Ala Asp Thr Leu Ala Asp Phe Phe Thr Lys Cys Lys Glu Asp Pro Ser
725 730 735
His Trp Asp Glu Ile Ser Lys Gly Gly Leu Gln Arg Ile Glu Glu Lys
740 745 750
Tyr Thr Trp Gln Ile Tyr Ser Gln Arg Leu Leu Thr Leu Thr Gly Val
755 760 765
Tyr Gly Phe Trp Lys His Val Ser Asn Leu Asp Arg Leu Glu Ala Arg
770 775 780
Arg Tyr Leu Glu Met Phe Tyr Ala Leu Lys Tyr Arg Pro Leu Ala Gln
785 790 795 800
Ala Val Pro Leu Ala Gln Asp Asp
805
<210> 7
<211> 809
<212> PRT
<213> Arabidopsis thaliana
<400> 7
Met Ala Asn Pro Lys Leu Thr Arg Val Leu Ser Thr Arg Asp Arg Val
1 5 10 15
Gln Asp Thr Leu Ser Ala His Arg Asn Glu Leu Val Ala Leu Leu Ser
20 25 30
Arg Tyr Val Asp Gln Gly Lys Gly Ile Leu Gln Pro His Asn Leu Ile
35 40 45
Asp Glu Leu Glu Ser Val Ile Gly Asp Asp Glu Thr Lys Lys Ser Leu
50 55 60
Ser Asp Gly Pro Phe Gly Glu Ile Leu Lys Ser Ala Met Glu Ala Ile
65 70 75 80
Val Val Pro Pro Phe Val Ala Leu Ala Val Arg Pro Arg Pro Gly Val
85 90 95
Trp Glu Tyr Val Arg Val Asn Val Phe Glu Leu Ser Val Glu Gln Leu
100 105 110
Thr Val Ser Glu Tyr Leu Arg Phe Lys Glu Glu Leu Val Asp Gly Pro
115 120 125
Asn Ser Asp Pro Phe Cys Leu Glu Leu Asp Phe Glu Pro Phe Asn Ala
130 135 140
Asn Val Pro Arg Pro Ser Arg Ser Ser Ser Ile Gly Asn Gly Val Gln
145 150 155 160
Phe Leu Asn Arg His Leu Ser Ser Val Met Phe Arg Asn Lys Asp Cys
165 170 175
Leu Glu Pro Leu Leu Asp Phe Leu Arg Val His Lys Tyr Lys Gly His
180 185 190
Pro Leu Met Leu Asn Asp Arg Ile Gln Ser Ile Ser Arg Leu Gln Ile
195 200 205
Gln Leu Ser Lys Ala Glu Asp His Ile Ser Lys Leu Ser Gln Glu Thr
210 215 220
Pro Phe Ser Glu Phe Glu Tyr Ala Leu Gln Gly Met Gly Phe Glu Lys
225 230 235 240
Gly Trp Gly Asp Thr Ala Gly Arg Val Leu Glu Met Met His Leu Leu
245 250 255
Ser Asp Ile Leu Gln Ala Pro Asp Pro Ser Ser Leu Glu Lys Phe Leu
260 265 270
Gly Met Val Pro Met Val Phe Asn Val Val Ile Leu Ser Pro His Gly
275 280 285
Tyr Phe Gly Gln Ala Asn Val Leu Gly Leu Pro Asp Thr Gly Gly Gln
290 295 300
Val Val Tyr Ile Leu Asp Gln Val Arg Ala Leu Glu Thr Glu Met Leu
305 310 315 320
Leu Arg Ile Lys Arg Gln Gly Leu Asp Ile Ser Pro Ser Ile Leu Ile
325 330 335
Val Thr Arg Leu Ile Pro Asp Ala Lys Gly Thr Thr Cys Asn Gln Arg
340 345 350
Leu Glu Arg Val Ser Gly Thr Glu His Thr His Ile Leu Arg Val Pro
355 360 365
Phe Arg Ser Glu Lys Gly Ile Leu Arg Lys Trp Ile Ser Arg Phe Asp
370 375 380
Val Trp Pro Tyr Leu Glu Asn Tyr Ala Gln Asp Ala Ala Ser Glu Ile
385 390 395 400
Val Gly Glu Leu Gln Gly Val Pro Asp Phe Ile Ile Gly Asn Tyr Ser
405 410 415
Asp Gly Asn Leu Val Ala Ser Leu Met Ala His Arg Met Gly Val Thr
420 425 430
Gln Cys Thr Ile Ala His Ala Leu Glu Lys Thr Lys Tyr Pro Asp Ser
435 440 445
Asp Ile Tyr Trp Lys Asp Phe Asp Asn Lys Tyr His Phe Ser Cys Gln
450 455 460
Phe Thr Ala Asp Leu Ile Ala Met Asn Asn Ala Asp Phe Ile Ile Thr
465 470 475 480
Ser Thr Tyr Gln Glu Ile Ala Gly Thr Lys Asn Thr Val Gly Gln Tyr
485 490 495
Glu Ser His Gly Ala Phe Thr Leu Pro Gly Leu Tyr Arg Val Val His
500 505 510
Gly Ile Asp Val Phe Asp Pro Lys Phe Asn Ile Val Ser Pro Gly Ala
515 520 525
Asp Met Thr Ile Tyr Phe Pro Tyr Ser Glu Glu Thr Arg Arg Leu Thr
530 535 540
Ala Leu His Gly Ser Ile Glu Glu Met Leu Tyr Ser Pro Asp Gln Thr
545 550 555 560
Asp Glu His Val Gly Thr Leu Ser Asp Arg Ser Lys Pro Ile Leu Phe
565 570 575
Ser Met Ala Arg Leu Asp Lys Val Lys Asn Ile Ser Gly Leu Val Glu
580 585 590
Met Tyr Ser Lys Asn Thr Lys Leu Arg Glu Leu Val Asn Leu Val Val
595 600 605
Ile Ala Gly Asn Ile Asp Val Asn Lys Ser Lys Asp Arg Glu Glu Ile
610 615 620
Val Glu Ile Glu Lys Met His Asn Leu Met Lys Asn Tyr Lys Leu Asp
625 630 635 640
Gly Gln Phe Arg Trp Ile Thr Ala Gln Thr Asn Arg Ala Arg Asn Gly
645 650 655
Glu Leu Tyr Arg Tyr Ile Ala Asp Thr Arg Gly Ala Phe Ala Gln Pro
660 665 670
Ala Phe Tyr Glu Ala Phe Gly Leu Thr Val Val Glu Ala Met Thr Cys
675 680 685
Gly Leu Pro Thr Phe Ala Thr Cys His Gly Gly Pro Ala Glu Ile Ile
690 695 700
Glu His Gly Leu Ser Gly Phe His Ile Asp Pro Tyr His Pro Glu Gln
705 710 715 720
Ala Gly Asn Ile Met Ala Asp Phe Phe Glu Arg Cys Lys Glu Asp Pro
725 730 735
Asn His Trp Lys Lys Val Ser Asp Ala Gly Leu Gln Arg Ile Tyr Glu
740 745 750
Arg Tyr Thr Trp Lys Ile Tyr Ser Glu Arg Leu Met Thr Leu Ala Gly
755 760 765
Val Tyr Gly Phe Trp Lys Tyr Val Ser Lys Leu Glu Arg Arg Glu Thr
770 775 780
Arg Arg Tyr Leu Glu Met Phe Tyr Ile Leu Lys Phe Arg Asp Leu Val
785 790 795 800
Lys Thr Val Pro Ser Thr Ala Asp Asp
805
<210> 8
<211> 805
<212> PRT
<213> Vigna radiata
<400> 8
Met Ala Thr Asp Arg Leu Thr Arg Val His Ser Leu Arg Glu Arg Leu
1 5 10 15
Asp Glu Thr Leu Ser Ala Asn Arg Asn Glu Ile Leu Ala Leu Leu Ser
20 25 30
Arg Ile Glu Gly Lys Gly Lys Gly Ile Leu Gln His His Gln Val Ile
35 40 45
Ala Glu Phe Glu Glu Ile Pro Glu Glu Ser Arg Gln Lys Leu Thr Asp
50 55 60
Gly Ala Phe Gly Glu Val Leu Arg Ser Thr Gln Glu Ala Ile Val Leu
65 70 75 80
Pro Pro Trp Val Ala Leu Ala Val Arg Pro Arg Pro Gly Val Trp Glu
85 90 95
Tyr Leu Arg Val Asn Val His Ala Leu Val Val Glu Val Leu Gln Pro
100 105 110
Ala Glu Tyr Leu Arg Phe Lys Glu Glu Leu Val Asp Gly Ser Ser Asn
115 120 125
Gly Asn Phe Val Leu Glu Leu Asp Phe Glu Pro Phe Thr Ala Ser Phe
130 135 140
Pro Arg Pro Thr Leu Asn Lys Ser Ile Gly Asn Gly Val Gln Phe Leu
145 150 155 160
Asn Arg His Leu Ser Ala Lys Leu Phe His Asp Lys Glu Ser Leu His
165 170 175
Pro Leu Leu Glu Phe Leu Arg Leu His Ser Val Lys Gly Lys Thr Leu
180 185 190
Met Leu Asn Asp Arg Ile Gln Asn Pro Asp Ala Leu Gln His Val Leu
195 200 205
Arg Lys Ala Glu Glu Tyr Leu Gly Thr Val Pro Pro Glu Thr Pro Tyr
210 215 220
Ser Ala Phe Glu His Lys Phe Gln Glu Ile Gly Leu Glu Arg Gly Trp
225 230 235 240
Gly Asp Asn Ala Glu Arg Val Leu Glu Ser Ile Gln Leu Leu Leu Asp
245 250 255
Leu Leu Glu Ala Pro Asp Pro Cys Thr Leu Glu Thr Phe Leu Gly Arg
260 265 270
Ile Pro Met Val Phe Asn Val Val Ile Leu Ser Pro His Gly Tyr Phe
275 280 285
Ala Gln Asp Asn Val Leu Gly Tyr Pro Asp Thr Gly Gly Gln Val Val
290 295 300
Tyr Ile Leu Asp Gln Val Arg Ala Leu Glu Asn Glu Met Leu His Arg
305 310 315 320
Ile Lys Gln Gln Gly Leu Asp Ile Val Pro Arg Ile Leu Ile Ile Thr
325 330 335
Arg Leu Leu Pro Asp Ala Val Gly Thr Thr Cys Gly Gln Arg Leu Glu
340 345 350
Lys Val Phe Gly Thr Glu His Ser His Ile Leu Arg Val Pro Phe Arg
355 360 365
Thr Glu Asn Gly Ile Val Arg Lys Trp Ile Ser Arg Phe Glu Val Trp
370 375 380
Pro Tyr Leu Glu Thr Tyr Thr Glu Asp Val Ala His Glu Leu Ala Lys
385 390 395 400
Glu Leu Gln Gly Lys Pro Asp Leu Ile Val Gly Asn Tyr Ser Asp Gly
405 410 415
Asn Ile Val Ala Ser Leu Leu Ala His Lys Leu Gly Val Thr Gln Cys
420 425 430
Thr Ile Ala His Ala Leu Glu Lys Thr Lys Tyr Pro Glu Ser Asp Ile
435 440 445
Tyr Trp Lys Lys Leu Glu Glu Arg Tyr His Phe Ser Cys Gln Phe Thr
450 455 460
Ala Asp Leu Phe Ala Met Asn His Thr Asp Phe Ile Ile Thr Ser Thr
465 470 475 480
Phe Gln Glu Ile Ala Gly Ser Lys Asp Thr Val Gly Gln Tyr Glu Ser
485 490 495
His Thr Ala Phe Thr Leu Pro Gly Leu Tyr Arg Val Val His Gly Ile
500 505 510
Asp Val Phe Asp Pro Lys Phe Asn Ile Val Ser Pro Gly Ala Asp Gln
515 520 525
Thr Ile Tyr Phe Pro His Thr Glu Thr Ser Arg Arg Leu Thr Ser Phe
530 535 540
His Thr Glu Ile Glu Glu Leu Leu Tyr Ser Ser Val Glu Asn Glu Glu
545 550 555 560
His Ile Cys Val Leu Lys Asp Arg Ser Lys Pro Ile Ile Phe Thr Met
565 570 575
Ala Arg Leu Asp Arg Val Lys Asn Ile Thr Gly Leu Val Glu Trp Tyr
580 585 590
Gly Lys Asn Ala Lys Leu Arg Glu Leu Val Asn Leu Val Val Val Ala
595 600 605
Gly Asp Arg Arg Lys Glu Ser Lys Asp Leu Glu Glu Lys Ala Glu Met
610 615 620
Lys Lys Met Tyr Ser Leu Ile Glu Thr Tyr Lys Leu Asn Gly Gln Phe
625 630 635 640
Arg Trp Ile Ser Ser Gln Met Asn Arg Val Arg Asn Gly Glu Leu Tyr
645 650 655
Arg Val Ile Ala Asp Thr Lys Gly Ala Phe Val Gln Pro Ala Val Tyr
660 665 670
Glu Ala Phe Gly Leu Thr Val Val Glu Ala Met Thr Cys Gly Leu Pro
675 680 685
Thr Phe Ala Thr Cys Asn Gly Gly Pro Ala Glu Ile Ile Val His Gly
690 695 700
Lys Ser Gly Phe His Ile Asp Pro Tyr His Gly Asp Arg Ala Ala Asp
705 710 715 720
Leu Leu Val Glu Phe Phe Glu Lys Val Lys Val Asp Pro Ser His Trp
725 730 735
Asp Lys Ile Ser Gln Ala Gly Leu Gln Arg Ile Glu Glu Lys Tyr Thr
740 745 750
Trp Gln Ile Tyr Ser Gln Arg Leu Leu Thr Leu Thr Gly Val Tyr Gly
755 760 765
Phe Trp Lys His Val Ser Asn Leu Asp Arg Arg Glu Ser Arg Arg Tyr
770 775 780
Leu Glu Met Phe Tyr Ala Leu Lys Tyr Arg Lys Leu Ala Glu Ser Val
785 790 795 800
Pro Leu Ala Val Glu
805
<210> 9
<211> 805
<212> PRT
<213> Vigna radiata
<400> 9
Met Ala Thr Asp Arg Leu Thr Arg Val His Glu Leu Arg Glu Arg Leu
1 5 10 15
Asp Glu Thr Leu Ser Ala Asn Arg Asn Glu Ile Leu Ala Leu Leu Ser
20 25 30
Arg Ile Glu Gly Lys Gly Lys Gly Ile Leu Gln His His Gln Val Ile
35 40 45
Ala Glu Phe Glu Glu Ile Pro Glu Glu Ser Arg Gln Lys Leu Thr Asp
50 55 60
Gly Ala Phe Gly Glu Val Leu Arg Ser Thr Gln Glu Ala Ile Val Leu
65 70 75 80
Pro Pro Trp Val Ala Leu Ala Val Arg Pro Arg Pro Gly Val Trp Glu
85 90 95
Tyr Leu Arg Val Asn Val His Ala Leu Val Val Glu Val Leu Gln Pro
100 105 110
Ala Glu Tyr Leu Arg Phe Lys Glu Glu Leu Val Asp Gly Ser Ser Asn
115 120 125
Gly Asn Phe Val Leu Glu Leu Asp Phe Glu Pro Phe Thr Ala Ser Phe
130 135 140
Pro Arg Pro Thr Leu Asn Lys Ser Ile Gly Asn Gly Val Gln Phe Leu
145 150 155 160
Asn Arg His Leu Ser Ala Lys Leu Phe His Asp Lys Glu Ser Leu His
165 170 175
Pro Leu Leu Glu Phe Leu Arg Leu His Ser Val Lys Gly Lys Thr Leu
180 185 190
Met Leu Asn Asp Arg Ile Gln Asn Pro Asp Ala Leu Gln His Val Leu
195 200 205
Arg Lys Ala Glu Glu Tyr Leu Gly Thr Val Pro Pro Glu Thr Pro Tyr
210 215 220
Ser Ala Phe Glu His Lys Phe Gln Glu Ile Gly Leu Glu Arg Gly Trp
225 230 235 240
Gly Asp Asn Ala Glu Arg Val Leu Glu Ser Ile Gln Leu Leu Leu Asp
245 250 255
Leu Leu Glu Ala Pro Asp Pro Cys Thr Leu Glu Thr Phe Leu Gly Arg
260 265 270
Ile Pro Met Val Phe Asn Val Val Ile Leu Ser Pro His Gly Tyr Phe
275 280 285
Ala Gln Asp Asn Val Leu Gly Tyr Pro Asp Thr Gly Gly Gln Val Val
290 295 300
Tyr Ile Leu Asp Gln Val Arg Ala Leu Glu Asn Glu Met Leu His Arg
305 310 315 320
Ile Lys Gln Gln Gly Leu Asp Ile Val Pro Arg Ile Leu Ile Ile Thr
325 330 335
Arg Leu Leu Pro Asp Ala Val Gly Thr Thr Cys Gly Gln Arg Leu Glu
340 345 350
Lys Val Phe Gly Thr Glu His Ser His Ile Leu Arg Val Pro Phe Arg
355 360 365
Thr Glu Asn Gly Ile Val Arg Lys Trp Ile Ser Arg Phe Glu Val Trp
370 375 380
Pro Tyr Leu Glu Thr Tyr Thr Glu Asp Val Ala His Glu Leu Ala Lys
385 390 395 400
Glu Leu Gln Gly Lys Pro Asp Leu Ile Val Gly Asn Tyr Ser Asp Gly
405 410 415
Asn Ile Val Ala Ser Leu Leu Ala His Lys Leu Gly Val Thr Gln Cys
420 425 430
Thr Ile Ala His Ala Leu Glu Lys Thr Lys Tyr Pro Glu Ser Asp Ile
435 440 445
Tyr Trp Lys Lys Leu Glu Glu Arg Tyr His Phe Ser Cys Gln Phe Thr
450 455 460
Ala Asp Leu Phe Ala Met Asn His Thr Asp Phe Ile Ile Thr Ser Thr
465 470 475 480
Phe Gln Glu Ile Ala Gly Ser Lys Asp Thr Val Gly Gln Tyr Glu Ser
485 490 495
His Thr Ala Phe Thr Leu Pro Gly Leu Tyr Arg Val Val His Gly Ile
500 505 510
Asp Val Phe Asp Pro Lys Phe Asn Ile Val Ser Pro Gly Ala Asp Gln
515 520 525
Thr Ile Tyr Phe Pro His Thr Glu Thr Ser Arg Arg Leu Thr Ser Phe
530 535 540
His Thr Glu Ile Glu Glu Leu Leu Tyr Ser Ser Val Glu Asn Glu Glu
545 550 555 560
His Ile Cys Val Leu Lys Asp Arg Ser Lys Pro Ile Ile Phe Thr Met
565 570 575
Ala Arg Leu Asp Arg Val Lys Asn Ile Thr Gly Leu Val Glu Trp Tyr
580 585 590
Gly Lys Asn Ala Lys Leu Arg Glu Leu Val Asn Leu Val Val Val Ala
595 600 605
Gly Asp Arg Arg Lys Glu Ser Lys Asp Leu Glu Glu Lys Ala Glu Met
610 615 620
Lys Lys Met Tyr Ser Leu Ile Glu Thr Tyr Lys Leu Asn Gly Gln Phe
625 630 635 640
Arg Trp Ile Ser Ser Gln Met Asn Arg Val Arg Asn Gly Glu Leu Tyr
645 650 655
Arg Val Ile Ala Asp Thr Lys Gly Ala Phe Val Gln Pro Ala Val Tyr
660 665 670
Glu Ala Phe Gly Leu Thr Val Val Glu Ala Met Thr Cys Gly Leu Pro
675 680 685
Thr Phe Ala Thr Cys Asn Gly Gly Pro Ala Glu Ile Ile Val His Gly
690 695 700
Lys Ser Gly Phe His Ile Asp Pro Tyr His Gly Asp Arg Ala Ala Asp
705 710 715 720
Leu Leu Val Glu Phe Phe Glu Lys Val Lys Val Asp Pro Ser His Trp
725 730 735
Asp Lys Ile Ser Gln Ala Gly Leu Gln Arg Ile Glu Glu Lys Tyr Thr
740 745 750
Trp Gln Ile Tyr Ser Gln Arg Leu Leu Thr Leu Thr Gly Val Tyr Gly
755 760 765
Phe Trp Lys His Val Ser Asn Leu Asp Arg Arg Glu Ser Arg Arg Tyr
770 775 780
Leu Glu Met Phe Tyr Ala Leu Lys Tyr Arg Lys Leu Ala Glu Ser Val
785 790 795 800
Pro Leu Ala Val Glu
805
<210> 10
<211> 805
<212> PRT
<213> Glycine max
<400> 10
Met Ala Thr Asp Arg Leu Thr Arg Val His Ser Leu Arg Glu Arg Leu
1 5 10 15
Asp Glu Thr Leu Thr Ala Asn Arg Asn Glu Ile Leu Ala Leu Leu Ser
20 25 30
Arg Ile Glu Ala Lys Gly Lys Gly Ile Leu Gln His His Gln Val Ile
35 40 45
Ala Glu Phe Glu Glu Ile Pro Glu Glu Asn Arg Gln Lys Leu Thr Asp
50 55 60
Gly Ala Phe Gly Glu Val Leu Arg Ser Thr Gln Glu Ala Ile Val Leu
65 70 75 80
Pro Pro Trp Val Ala Leu Ala Val Arg Pro Arg Pro Gly Val Trp Glu
85 90 95
Tyr Leu Arg Val Asn Val His Ala Leu Val Val Glu Glu Leu Gln Pro
100 105 110
Ala Glu Tyr Leu His Phe Lys Glu Glu Leu Val Asp Gly Ser Ser Asn
115 120 125
Gly Asn Phe Val Leu Glu Leu Asp Phe Glu Pro Phe Asn Ala Ala Phe
130 135 140
Pro Arg Pro Thr Leu Asn Lys Ser Ile Gly Asn Gly Val Gln Phe Leu
145 150 155 160
Asn Arg His Leu Ser Ala Lys Leu Phe His Asp Lys Glu Ser Leu His
165 170 175
Pro Leu Leu Glu Phe Leu Arg Leu His Ser Val Lys Gly Lys Thr Leu
180 185 190
Met Leu Asn Asp Arg Ile Gln Asn Pro Asp Ala Leu Gln His Val Leu
195 200 205
Arg Lys Ala Glu Glu Tyr Leu Gly Thr Val Pro Pro Glu Thr Pro Tyr
210 215 220
Ser Glu Phe Glu His Lys Phe Gln Glu Ile Gly Leu Glu Arg Gly Trp
225 230 235 240
Gly Asp Asn Ala Glu Arg Val Leu Glu Ser Ile Gln Leu Leu Leu Asp
245 250 255
Leu Leu Glu Ala Pro Asp Pro Cys Thr Leu Glu Thr Phe Leu Gly Arg
260 265 270
Ile Pro Met Val Phe Asn Val Val Ile Leu Ser Pro His Gly Tyr Phe
275 280 285
Ala Gln Asp Asn Val Leu Gly Tyr Pro Asp Thr Gly Gly Gln Val Val
290 295 300
Tyr Ile Leu Asp Gln Val Arg Ala Leu Glu Asn Glu Met Leu His Arg
305 310 315 320
Ile Lys Gln Gln Gly Leu Asp Ile Val Pro Arg Ile Leu Ile Ile Thr
325 330 335
Arg Leu Leu Pro Asp Ala Val Gly Thr Thr Cys Gly Gln Arg Leu Glu
340 345 350
Lys Val Phe Gly Thr Glu His Ser His Ile Leu Arg Val Pro Phe Arg
355 360 365
Thr Glu Lys Gly Ile Val Arg Lys Trp Ile Ser Arg Phe Glu Val Trp
370 375 380
Pro Tyr Leu Glu Thr Tyr Thr Glu Asp Val Ala His Glu Leu Ala Lys
385 390 395 400
Glu Leu Gln Gly Lys Pro Asp Leu Ile Val Gly Asn Tyr Ser Asp Gly
405 410 415
Asn Ile Val Ala Ser Leu Leu Ala His Lys Leu Gly Val Thr Gln Cys
420 425 430
Thr Ile Ala His Ala Leu Glu Lys Thr Lys Tyr Pro Glu Ser Asp Ile
435 440 445
Tyr Trp Lys Lys Leu Glu Glu Arg Tyr His Phe Ser Cys Gln Phe Thr
450 455 460
Ala Asp Leu Phe Ala Met Asn His Thr Asp Phe Ile Ile Thr Ser Thr
465 470 475 480
Phe Gln Glu Ile Ala Gly Ser Lys Asp Thr Val Gly Gln Tyr Glu Ser
485 490 495
His Thr Ala Phe Thr Leu Pro Gly Leu Tyr Arg Val Val His Gly Ile
500 505 510
Asp Val Phe Asp Pro Lys Phe Asn Ile Val Ser Pro Gly Ala Asp Gln
515 520 525
Thr Ile Tyr Phe Pro His Thr Glu Thr Ser Arg Arg Leu Thr Ser Phe
530 535 540
His Pro Glu Ile Glu Glu Leu Leu Tyr Ser Ser Val Glu Asn Glu Glu
545 550 555 560
His Ile Cys Val Leu Lys Asp Arg Ser Lys Pro Ile Ile Phe Thr Met
565 570 575
Ala Arg Leu Asp Arg Val Lys Asn Ile Thr Gly Leu Val Glu Trp Tyr
580 585 590
Gly Lys Asn Ala Lys Leu Arg Glu Leu Val Asn Leu Val Val Val Ala
595 600 605
Gly Asp Arg Arg Lys Glu Ser Lys Asp Leu Glu Glu Lys Ala Glu Met
610 615 620
Lys Lys Met Tyr Gly Leu Ile Glu Thr Tyr Lys Leu Asn Gly Gln Phe
625 630 635 640
Arg Trp Ile Ser Ser Gln Met Asn Arg Val Arg Asn Gly Glu Leu Tyr
645 650 655
Arg Val Ile Cys Asp Thr Arg Gly Ala Phe Val Gln Pro Ala Val Tyr
660 665 670
Glu Ala Phe Gly Leu Thr Val Val Glu Ala Met Thr Cys Gly Leu Pro
675 680 685
Thr Phe Ala Thr Cys Asn Gly Gly Pro Ala Glu Ile Ile Val His Gly
690 695 700
Lys Ser Gly Phe His Ile Asp Pro Tyr His Gly Asp Arg Ala Ala Asp
705 710 715 720
Leu Leu Val Asp Phe Phe Glu Lys Cys Lys Leu Asp Pro Thr His Trp
725 730 735
Asp Lys Ile Ser Lys Ala Gly Leu Gln Arg Ile Glu Glu Lys Tyr Thr
740 745 750
Trp Gln Ile Tyr Ser Gln Arg Leu Leu Thr Leu Thr Gly Val Tyr Gly
755 760 765
Phe Trp Lys His Val Ser Asn Leu Asp Arg Arg Glu Ser Arg Arg Tyr
770 775 780
Leu Glu Met Phe Tyr Ala Leu Lys Tyr Arg Lys Leu Ala Glu Ser Val
785 790 795 800
Pro Leu Ala Ala Glu
805
<210> 11
<211> 805
<212> PRT
<213> Glycine max
<400> 11
Met Ala Thr Asp Arg Leu Thr Arg Val His Glu Leu Arg Glu Arg Leu
1 5 10 15
Asp Glu Thr Leu Thr Ala Asn Arg Asn Glu Ile Leu Ala Leu Leu Ser
20 25 30
Arg Ile Glu Ala Lys Gly Lys Gly Ile Leu Gln His His Gln Val Ile
35 40 45
Ala Glu Phe Glu Glu Ile Pro Glu Glu Asn Arg Gln Lys Leu Thr Asp
50 55 60
Gly Ala Phe Gly Glu Val Leu Arg Ser Thr Gln Glu Ala Ile Val Leu
65 70 75 80
Pro Pro Trp Val Ala Leu Ala Val Arg Pro Arg Pro Gly Val Trp Glu
85 90 95
Tyr Leu Arg Val Asn Val His Ala Leu Val Val Glu Glu Leu Gln Pro
100 105 110
Ala Glu Tyr Leu His Phe Lys Glu Glu Leu Val Asp Gly Ser Ser Asn
115 120 125
Gly Asn Phe Val Leu Glu Leu Asp Phe Glu Pro Phe Asn Ala Ala Phe
130 135 140
Pro Arg Pro Thr Leu Asn Lys Ser Ile Gly Asn Gly Val Gln Phe Leu
145 150 155 160
Asn Arg His Leu Ser Ala Lys Leu Phe His Asp Lys Glu Ser Leu His
165 170 175
Pro Leu Leu Glu Phe Leu Arg Leu His Ser Val Lys Gly Lys Thr Leu
180 185 190
Met Leu Asn Asp Arg Ile Gln Asn Pro Asp Ala Leu Gln His Val Leu
195 200 205
Arg Lys Ala Glu Glu Tyr Leu Gly Thr Val Pro Pro Glu Thr Pro Tyr
210 215 220
Ser Glu Phe Glu His Lys Phe Gln Glu Ile Gly Leu Glu Arg Gly Trp
225 230 235 240
Gly Asp Asn Ala Glu Arg Val Leu Glu Ser Ile Gln Leu Leu Leu Asp
245 250 255
Leu Leu Glu Ala Pro Asp Pro Cys Thr Leu Glu Thr Phe Leu Gly Arg
260 265 270
Ile Pro Met Val Phe Asn Val Val Ile Leu Ser Pro His Gly Tyr Phe
275 280 285
Ala Gln Asp Asn Val Leu Gly Tyr Pro Asp Thr Gly Gly Gln Val Val
290 295 300
Tyr Ile Leu Asp Gln Val Arg Ala Leu Glu Asn Glu Met Leu His Arg
305 310 315 320
Ile Lys Gln Gln Gly Leu Asp Ile Val Pro Arg Ile Leu Ile Ile Thr
325 330 335
Arg Leu Leu Pro Asp Ala Val Gly Thr Thr Cys Gly Gln Arg Leu Glu
340 345 350
Lys Val Phe Gly Thr Glu His Ser His Ile Leu Arg Val Pro Phe Arg
355 360 365
Thr Glu Lys Gly Ile Val Arg Lys Trp Ile Ser Arg Phe Glu Val Trp
370 375 380
Pro Tyr Leu Glu Thr Tyr Thr Glu Asp Val Ala His Glu Leu Ala Lys
385 390 395 400
Glu Leu Gln Gly Lys Pro Asp Leu Ile Val Gly Asn Tyr Ser Asp Gly
405 410 415
Asn Ile Val Ala Ser Leu Leu Ala His Lys Leu Gly Val Thr Gln Cys
420 425 430
Thr Ile Ala His Ala Leu Glu Lys Thr Lys Tyr Pro Glu Ser Asp Ile
435 440 445
Tyr Trp Lys Lys Leu Glu Glu Arg Tyr His Phe Ser Cys Gln Phe Thr
450 455 460
Ala Asp Leu Phe Ala Met Asn His Thr Asp Phe Ile Ile Thr Ser Thr
465 470 475 480
Phe Gln Glu Ile Ala Gly Ser Lys Asp Thr Val Gly Gln Tyr Glu Ser
485 490 495
His Thr Ala Phe Thr Leu Pro Gly Leu Tyr Arg Val Val His Gly Ile
500 505 510
Asp Val Phe Asp Pro Lys Phe Asn Ile Val Ser Pro Gly Ala Asp Gln
515 520 525
Thr Ile Tyr Phe Pro His Thr Glu Thr Ser Arg Arg Leu Thr Ser Phe
530 535 540
His Pro Glu Ile Glu Glu Leu Leu Tyr Ser Ser Val Glu Asn Glu Glu
545 550 555 560
His Ile Cys Val Leu Lys Asp Arg Ser Lys Pro Ile Ile Phe Thr Met
565 570 575
Ala Arg Leu Asp Arg Val Lys Asn Ile Thr Gly Leu Val Glu Trp Tyr
580 585 590
Gly Lys Asn Ala Lys Leu Arg Glu Leu Val Asn Leu Val Val Val Ala
595 600 605
Gly Asp Arg Arg Lys Glu Ser Lys Asp Leu Glu Glu Lys Ala Glu Met
610 615 620
Lys Lys Met Tyr Gly Leu Ile Glu Thr Tyr Lys Leu Asn Gly Gln Phe
625 630 635 640
Arg Trp Ile Ser Ser Gln Met Asn Arg Val Arg Asn Gly Glu Leu Tyr
645 650 655
Arg Val Ile Cys Asp Thr Arg Gly Ala Phe Val Gln Pro Ala Val Tyr
660 665 670
Glu Ala Phe Gly Leu Thr Val Val Glu Ala Met Thr Cys Gly Leu Pro
675 680 685
Thr Phe Ala Thr Cys Asn Gly Gly Pro Ala Glu Ile Ile Val His Gly
690 695 700
Lys Ser Gly Phe His Ile Asp Pro Tyr His Gly Asp Arg Ala Ala Asp
705 710 715 720
Leu Leu Val Asp Phe Phe Glu Lys Cys Lys Leu Asp Pro Thr His Trp
725 730 735
Asp Lys Ile Ser Lys Ala Gly Leu Gln Arg Ile Glu Glu Lys Tyr Thr
740 745 750
Trp Gln Ile Tyr Ser Gln Arg Leu Leu Thr Leu Thr Gly Val Tyr Gly
755 760 765
Phe Trp Lys His Val Ser Asn Leu Asp Arg Arg Glu Ser Arg Arg Tyr
770 775 780
Leu Glu Met Phe Tyr Ala Leu Lys Tyr Arg Lys Leu Ala Glu Ser Val
785 790 795 800
Pro Leu Ala Ala Glu
805
<210> 12
<211> 807
<212> PRT
<213> Anabaena sp. 54
<400> 12
Met Ala Ser Glu Leu Met Gln Ala Ile Leu Asp Ser Glu Glu Lys His
1 5 10 15
Asp Leu Arg Gly Phe Ile Ser Glu Leu Arg Gln Gln Asp Lys Asn Tyr
20 25 30
Leu Leu Arg Asn Asp Ile Leu Asn Val Tyr Ala Glu Tyr Cys Ser Lys
35 40 45
Cys Gln Lys Pro Glu Thr Ser Tyr Lys Phe Ser Asn Leu Ser Lys Leu
50 55 60
Ile Tyr Tyr Thr Gln Glu Ile Ile Pro Glu Asp Ser Asn Phe Cys Phe
65 70 75 80
Ile Ile Arg Pro Lys Ile Ala Ala Gln Glu Val Tyr Arg Leu Thr Ala
85 90 95
Asp Leu Asp Val Glu Pro Met Thr Val Gln Glu Leu Leu Asp Leu Arg
100 105 110
Asp Arg Leu Val Asn Lys Phe His Pro Tyr Glu Gly Asp Ile Leu Glu
115 120 125
Leu Asp Phe Gly Pro Phe Tyr Asp Tyr Thr Pro Thr Ile Arg Asp Pro
130 135 140
Lys Asn Ile Gly Lys Gly Val Gln Tyr Leu Asn Arg Tyr Leu Ser Ser
145 150 155 160
Lys Leu Phe Gln Asp Ser Gln Gln Trp Leu Glu Ser Leu Phe Asn Phe
165 170 175
Leu Arg Leu His Asn Tyr Asn Gly Ile Gln Leu Leu Ile Asn His Gln
180 185 190
Ile Gln Ser Gln Gln Gln Leu Ser Gln Gln Val Lys Asn Ala Leu Asn
195 200 205
Phe Val Ser Asp Arg Pro Asn Asp Glu Pro Tyr Glu Gln Phe Arg Leu
210 215 220
Gln Leu Gln Thr Met Gly Phe Glu Pro Gly Trp Gly Asn Thr Ala Ser
225 230 235 240
Arg Val Arg Asp Thr Leu Asn Ile Leu Asp Glu Leu Ile Asp Ser Pro
245 250 255
Asp Pro Gln Thr Leu Glu Ala Phe Ile Ser Arg Ile Pro Met Ile Phe
260 265 270
Arg Ile Val Leu Val Ser Ala His Gly Trp Phe Gly Gln Glu Gly Val
275 280 285
Leu Gly Arg Pro Asp Thr Gly Gly Gln Val Val Tyr Val Leu Asp Gln
290 295 300
Ala Lys Asn Leu Glu Lys Gln Leu Gln Glu Asp Ala Ile Leu Ala Gly
305 310 315 320
Leu Glu Val Leu Asn Val Gln Pro Lys Val Ile Ile Leu Thr Arg Leu
325 330 335
Ile Pro Asn Ser Asp Gly Thr Leu Cys Asn Gln Arg Leu Glu Lys Val
340 345 350
Tyr Gly Thr Glu Asn Ala Trp Ile Leu Arg Val Pro Leu Arg Glu Phe
355 360 365
Asn Pro Lys Met Thr Gln Asn Trp Ile Ser Arg Phe Glu Phe Trp Pro
370 375 380
Tyr Leu Glu Thr Phe Ala Ile Asp Ser Glu Arg Glu Leu Leu Ala Glu
385 390 395 400
Phe Gln Gly Arg Pro Asp Leu Ile Val Gly Asn Tyr Thr Asp Gly Asn
405 410 415
Leu Val Ala Phe Leu Leu Thr Arg Arg Met Lys Val Thr Gln Cys Asn
420 425 430
Ile Ala His Ala Leu Glu Lys Ser Lys Tyr Leu Phe Ser Asn Leu Tyr
435 440 445
Trp Gln Asp Leu Glu Glu Lys Tyr His Phe Ser Leu Gln Phe Thr Ala
450 455 460
Asp Leu Ile Ala Met Asn Ala Ala Asn Phe Val Ile Ser Ser Thr Tyr
465 470 475 480
Gln Glu Ile Val Gly Thr Pro Asp Ser Ile Gly Gln Tyr Glu Ser Tyr
485 490 495
Lys Cys Phe Thr Met Pro Glu Leu Tyr His Val Val Asn Gly Ile Glu
500 505 510
Leu Phe Ser Pro Lys Phe Asn Val Val Pro Pro Gly Val Asn Glu Asn
515 520 525
Ser Tyr Phe Pro Tyr Thr Gln Thr Gln Asn Arg Ile Glu Ser Asp Arg
530 535 540
Asp Arg Leu Glu Glu Met Leu Phe Thr Leu Glu Asp Ser Ser Gln Ile
545 550 555 560
Phe Gly Lys Leu Asp Asp Pro Asn Lys Arg Pro Ile Phe Ser Met Ala
565 570 575
Arg Leu Asp Arg Ile Lys Asn Leu Thr Gly Leu Ala Glu Cys Phe Gly
580 585 590
Gln Ser Gln Glu Leu Gln Glu Arg Cys Asn Leu Ile Leu Val Ala Gly
595 600 605
Lys Leu Arg Ile Glu Glu Ser Glu Asp Asn Glu Glu Lys Asp Glu Ile
610 615 620
Val Lys Leu Tyr Arg Ile Ile Asp Glu Tyr Asn Leu His Gly Lys Ile
625 630 635 640
Arg Trp Leu Gly Val Arg Leu Ser Lys Asn Asp Ser Gly Glu Ile Tyr
645 650 655
Arg Val Ile Cys Asp Arg Gln Gly Ile Phe Val Gln Pro Ala Leu Phe
660 665 670
Glu Ala Phe Gly Leu Thr Ile Leu Glu Ser Met Ile Ser Gly Leu Pro
675 680 685
Thr Phe Ala Thr Gln Phe Gly Gly Pro Leu Glu Ile Ile Gln Asp Lys
690 695 700
Ile Asn Gly Phe Tyr Ile Asn Pro Thr His Leu Glu Glu Thr Ala Thr
705 710 715 720
Lys Ile Leu Asp Phe Val Thr Lys Cys Glu Gln Asn Pro Asn Tyr Trp
725 730 735
Asn Ile Ile Ser Glu Lys Ala Ile Asp Arg Val Tyr Ser Thr Tyr Thr
740 745 750
Trp Lys Ile His Thr Thr Lys Leu Leu Thr Leu Ala Arg Ile Tyr Gly
755 760 765
Phe Trp Asn Phe Thr Ser Lys Glu Lys Arg Glu Asp Leu Leu Arg Tyr
770 775 780
Leu Glu Ser Leu Phe Tyr Leu Ile Tyr Lys Pro Arg Ala Gln Gln Leu
785 790 795 800
Leu Glu Gln His Lys Tyr Arg
805
<210> 13
<211> 463
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 13
Met Ala Thr Lys Gly Ser Ser Gly Met Ser Leu Ala Glu Arg Phe Trp
1 5 10 15
Leu Thr Leu Ser Arg Ser Ser Leu Val Val Gly Arg Ser Cys Val Glu
20 25 30
Phe Glu Pro Glu Thr Val Pro Leu Leu Ser Thr Leu Arg Gly Lys Pro
35 40 45
Ile Thr Phe Leu Gly Leu Met Pro Pro Leu His Glu Gly Arg Arg Glu
50 55 60
Asp Gly Glu Asp Ala Thr Val Arg Trp Leu Asp Ala Gln Pro Ala Lys
65 70 75 80
Ser Val Val Tyr Val Ala Leu Gly Ser Glu Val Pro Leu Gly Val Glu
85 90 95
Lys Val His Glu Leu Ala Leu Gly Leu Glu Leu Ala Gly Thr Arg Phe
100 105 110
Leu Trp Ala Leu Arg Lys Pro Thr Gly Val Ser Asp Ala Asp Leu Leu
115 120 125
Pro Ala Gly Phe Glu Glu Arg Thr Arg Gly Arg Gly Val Val Ala Thr
130 135 140
Arg Trp Val Pro Gln Met Ser Ile Leu Ala His Ala Ala Val Gly Ala
145 150 155 160
Phe Leu Thr His Cys Gly Trp Asn Ser Thr Ile Glu Gly Leu Met Phe
165 170 175
Gly His Pro Leu Ile Met Leu Pro Ile Phe Gly Asp Gln Gly Pro Asn
180 185 190
Ala Arg Leu Ile Glu Ala Lys Asn Ala Gly Leu Gln Val Ala Arg Asn
195 200 205
Asp Gly Asp Gly Ser Phe Asp Arg Glu Gly Val Ala Ala Ala Ile Arg
210 215 220
Ala Val Ala Val Glu Glu Glu Ser Ser Lys Val Phe Gln Ala Lys Ala
225 230 235 240
Lys Lys Leu Gln Glu Ile Val Ala Asp Met Ala Cys His Glu Arg Tyr
245 250 255
Ile Asp Gly Phe Ile Gln Gln Leu Arg Ser Tyr Lys Asp Asp Ser Gly
260 265 270
Tyr Ser Ser Ser Tyr Ala Ala Ala Ala Gly Met His Val Val Ile Cys
275 280 285
Pro Trp Leu Ala Phe Gly His Leu Leu Pro Cys Leu Asp Leu Ala Gln
290 295 300
Arg Leu Ala Ser Arg Gly His Arg Val Ser Phe Val Ser Thr Pro Arg
305 310 315 320
Asn Ile Ser Arg Leu Pro Pro Val Arg Pro Ala Leu Ala Pro Leu Val
325 330 335
Ala Phe Val Ala Leu Pro Leu Pro Arg Val Glu Gly Leu Pro Asp Gly
340 345 350
Ala Glu Ser Thr Asn Asp Val Pro His Asp Arg Pro Asp Met Val Glu
355 360 365
Leu His Arg Arg Ala Phe Asp Gly Leu Ala Ala Pro Phe Ser Glu Phe
370 375 380
Leu Gly Thr Ala Cys Ala Asp Trp Val Ile Val Asp Val Phe His His
385 390 395 400
Trp Ala Ala Ala Ala Ala Leu Glu His Lys Val Pro Cys Ala Met Met
405 410 415
Leu Leu Gly Ser Ala Glu Met Ile Ala Ser Ile Ala Asp Glu Arg Leu
420 425 430
Glu His Ala Glu Thr Glu Ser Pro Ala Ala Ala Gly Gln Gly Arg Pro
435 440 445
Ala Ala Ala Pro Thr Phe Glu Val Ala Arg Met Lys Leu Ile Arg
450 455 460
<210> 14
<211> 463
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 14
Met Ala Thr Lys Asn Ser Ser Gly Met Ser Leu Ala Glu Arg Phe Trp
1 5 10 15
Leu Thr Leu Ser Arg Ser Ser Leu Val Val Gly Arg Ser Cys Val Glu
20 25 30
Phe Glu Pro Glu Thr Val Pro Leu Leu Ser Thr Leu Arg Gly Lys Pro
35 40 45
Ile Thr Phe Leu Gly Leu Met Pro Pro Leu His Glu Gly Arg Arg Glu
50 55 60
Asp Gly Glu Asp Ala Thr Val Arg Trp Leu Asp Ala Gln Pro Ala Lys
65 70 75 80
Ser Val Val Tyr Val Ala Leu Gly Ser Glu Val Pro Leu Gly Val Glu
85 90 95
Lys Val His Glu Leu Ala Leu Gly Leu Glu Leu Ala Gly Thr Arg Phe
100 105 110
Leu Trp Ala Leu Arg Lys Pro Thr Gly Val Ser Asp Ala Asp Leu Leu
115 120 125
Pro Ala Gly Phe Glu Glu Arg Thr Arg Gly Arg Gly Val Val Ala Thr
130 135 140
Arg Trp Val Pro Gln Met Ser Ile Leu Ala His Ala Ala Val Gly Ala
145 150 155 160
Phe Leu Thr His Cys Gly Trp Asn Ser Thr Ile Glu Gly Leu Met Phe
165 170 175
Gly His Pro Leu Ile Met Leu Pro Ile Thr Gly Asp Gln Gly Pro Asn
180 185 190
Ala Arg Leu Ile Glu Ala Lys Asn Ala Gly Leu Gln Val Ala Arg Asn
195 200 205
Asp Gly Asp Gly Ser Phe Asp Arg Glu Gly Val Ala Ala Ala Ile Arg
210 215 220
Ala Val Ala Val Glu Glu Glu Ser Ser Lys Val Phe Gln Ala Lys Ala
225 230 235 240
Lys Lys Leu Gln Glu Ile Val Ala Asp Met Ala Cys His Glu Arg Tyr
245 250 255
Ile Asp Gly Phe Ile Gln Gln Leu Arg Ser Tyr Lys Asp Asp Ser Gly
260 265 270
Tyr Ser Ser Ser Tyr Ala Ala Ala Ala Gly Met His Val Val Ile Cys
275 280 285
Pro Trp Leu Ala Phe Gly His Leu Leu Pro Cys Leu Asp Leu Ala Gln
290 295 300
Arg Leu Ala Ser Arg Gly His Arg Val Ser Phe Val Ser Thr Pro Arg
305 310 315 320
Asn Ile Ser Arg Leu Pro Pro Val Arg Pro Ala Leu Ala Pro Leu Val
325 330 335
Ala Phe Val Ala Leu Pro Leu Pro Arg Val Glu Gly Leu Pro Asp Gly
340 345 350
Ala Glu Ser Thr Asn Asp Val Pro His Asp Arg Pro Asp Met Val Glu
355 360 365
Leu His Arg Arg Ala Phe Asp Gly Leu Ala Ala Pro Phe Ser Glu Phe
370 375 380
Leu Gly Thr Ala Cys Ala Asp Trp Val Ile Val Asp Ser Phe His His
385 390 395 400
Trp Ala Ala Ala Ala Ala Leu Glu His Lys Val Pro Cys Ala Met Met
405 410 415
Leu Leu Gly Ser Ala Glu Met Ile Ala Ser Ile Ala Asp Glu Arg Leu
420 425 430
Glu His Ala Glu Thr Glu Ser Pro Ala Ala Ala Gly Gln Gly Arg Pro
435 440 445
Ala Ala Ala Pro Thr Phe Glu Val Ala Arg Met Lys Leu Ile Arg
450 455 460
<210> 15
<211> 465
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 15
Met Ala Arg Arg Thr Lys Asn Ser Ser Gly Met Ser Leu Ala Glu Arg
1 5 10 15
Phe Trp Leu Thr Leu Ser Arg Ser Ser Leu Val Val Gly Arg Ser Cys
20 25 30
Val Glu Phe Glu Pro Glu Thr Val Pro Leu Leu Ser Thr Leu Arg Gly
35 40 45
Lys Pro Ile Thr Phe Leu Gly Leu Met Pro Pro Leu Pro Glu Gly Arg
50 55 60
Arg Glu Asp Gly Glu Asp Ala Thr Val Arg Trp Leu Asp Ala Gln Pro
65 70 75 80
Ala Lys Ser Val Val Tyr Val Ala Leu Gly Ser Glu Val Pro Leu Gly
85 90 95
Val Glu Lys Val His Glu Leu Ala Leu Gly Leu Glu Leu Ala Gly Thr
100 105 110
Arg Phe Leu Trp Ala Leu Arg Lys Pro Thr Gly Val Ser Asp Ala Asp
115 120 125
Leu Leu Pro Ala Gly Phe Glu Glu Arg Thr Arg Gly Arg Gly Val Val
130 135 140
Ala Thr Arg Trp Val Pro Gln Met Ser Ile Leu Ala His Ala Ala Val
145 150 155 160
Gly Ala Phe Leu Thr His Cys Gly Trp Asn Ser Thr Ile Glu Gly Leu
165 170 175
Met Phe Gly His Pro Leu Ile Met Leu Pro Ile Thr Gly Asp Gln Gly
180 185 190
Pro Asn Ala Arg Leu Ile Glu Ala Lys Asn Ala Gly Leu Gln Val Ala
195 200 205
Arg Asn Asp Gly Asp Gly Ser Phe Asp Arg Glu Gly Val Ala Ala Ala
210 215 220
Ile Arg Ala Val Ala Val Glu Glu Glu Ser Ser Lys Val Phe Gln Glu
225 230 235 240
Lys Ala Lys Lys Leu Gln Glu Ile Val Ala Asp Met Ala Cys His Glu
245 250 255
Arg Tyr Ile Asp Gly Phe Ile Gln Gln Leu Arg Ser Tyr Lys Asp Asp
260 265 270
Ser Gly Tyr Ser Ser Ser Tyr Ala Ala Ala Ala Gly Met His Val Val
275 280 285
Ile Cys Pro Trp Leu Ala Phe Gly His Leu Leu Pro Cys Leu Asp Leu
290 295 300
Ala Gln Arg Leu Ala Ser Arg Gly His Arg Val Ser Phe Val Ser Thr
305 310 315 320
Pro Arg Asn Ile Ser Arg Leu Pro Pro Val Arg Pro Ala Leu Ala Pro
325 330 335
Leu Val Ala Phe Val Ala Leu Pro Leu Pro Arg Val Glu Gly Leu Pro
340 345 350
Asp Gly Ala Glu Ser Thr Asn Asp Val Pro His Asp Arg Pro Asp Met
355 360 365
Val Glu Leu His Arg Arg Ala Phe Asp Gly Leu Ala Ala Pro Phe Ser
370 375 380
Glu Phe Leu Gly Thr Ala Cys Ala Asp Trp Val Ile Val Asp Ser Phe
385 390 395 400
His His Trp Ala Ala Ala Ala Ala Leu Glu His Lys Val Pro Cys Ala
405 410 415
Met Met Phe Leu Gly Ser Ala Glu Met Ile Ala Ser Ile Ala Asp Glu
420 425 430
Arg Leu Glu His Ala Glu Thr Glu Ser Pro Ala Ala Ala Gly Gln Gly
435 440 445
Arg Pro Ala Ala Ala Pro Thr Phe Glu Val Ala Arg Met Lys Leu Ile
450 455 460
Arg
465
<210> 16
<211> 465
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 16
Met Ala Arg Arg Thr Lys Asn Ser Ser Gly Met Ser Leu Ala Glu Arg
1 5 10 15
Phe Trp Leu Thr Leu Ser Arg Ser Ser Leu Val Val Gly Arg Ser Cys
20 25 30
Val Glu Phe Glu Pro Glu Thr Val Pro Leu Leu Ser Thr Leu Arg Gly
35 40 45
Lys Pro Ile Thr Phe Leu Gly Leu Met Pro Pro Leu Pro Glu Gly Arg
50 55 60
Arg Glu Asp Gly Glu Asp Ala Thr Val Arg Trp Leu Asp Ala Gln Pro
65 70 75 80
Ala Lys Ser Val Val Tyr Val Ala Leu Gly Ser Glu Val Pro Leu Gly
85 90 95
Val Glu Lys Val His Glu Leu Ala Leu Gly Leu Glu Leu Ala Gly Thr
100 105 110
Arg Phe Leu Trp Ala Leu Arg Lys Pro Thr Gly Val Ser Asp Ala Asp
115 120 125
Leu Leu Pro Ala Gly Phe Glu Glu Arg Thr Arg Gly Arg Gly Val Val
130 135 140
Ala Thr Arg Trp Val Pro Gln Ala Ala Ile Leu Ala His Ala Ala Val
145 150 155 160
Gly Ala Phe Leu Thr His Cys Gly Trp Asn Ser Thr Ile Glu Gly Leu
165 170 175
Met Phe Gly His Pro Leu Ile Met Leu Pro Ile Thr Gly Asp Gln Gly
180 185 190
Pro Asn Ala Arg Leu Ile Glu Ala Lys Asn Ala Gly Leu Gln Val Ala
195 200 205
Arg Asn Asp Gly Asp Gly Ser Phe Asp Arg Glu Gly Val Ala Ala Ala
210 215 220
Ile Arg Ala Val Ala Val Glu Glu Glu Ser Ser Lys Val Phe Gln Glu
225 230 235 240
Lys Ala Lys Lys Leu Gln Glu Ile Val Ala Asp Met Ala Cys His Glu
245 250 255
Arg Tyr Ile Asp Gly Phe Ile Gln Gln Leu Arg Ser Tyr Lys Asp Asp
260 265 270
Ser Gly Tyr Ser Ser Ser Tyr Ala Ala Ala Ala Gly Met His Val Val
275 280 285
Ile Cys Pro Trp Leu Ala Phe Gly His Leu Leu Pro Cys Leu Asp Leu
290 295 300
Ala Gln Arg Leu Ala Ser Arg Gly His Arg Val Ser Phe Val Ser Thr
305 310 315 320
Pro Arg Asn Ile Ser Arg Leu Pro Pro Val Arg Pro Ala Leu Ala Pro
325 330 335
Leu Val Ala Phe Val Ala Leu Pro Leu Pro Arg Val Glu Gly Leu Pro
340 345 350
Asp Gly Ala Glu Ser Thr Asn Asp Val Pro His Asp Arg Pro Asp Met
355 360 365
Val Glu Leu His Arg Arg Ala Phe Asp Gly Leu Ala Ala Pro Phe Ser
370 375 380
Glu Phe Leu Gly Thr Ala Cys Ala Asp Trp Val Ile Val Asp Ser Phe
385 390 395 400
His His Trp Ala Ala Ala Ala Ala Leu Glu His Lys Val Pro Cys Ala
405 410 415
Met Met Phe Leu Gly Ser Ala Glu Met Ile Ala Ser Ile Ala Asp Glu
420 425 430
Arg Leu Glu His Ala Glu Thr Glu Ser Pro Ala Ala Ala Gly Gln Gly
435 440 445
Arg Pro Ala Ala Ala Pro Thr Phe Glu Val Ala Arg Met Lys Leu Ile
450 455 460
Arg
465
<210> 17
<211> 481
<212> PRT
<213> Stevia rebaudiana
<400> 17
Met Asp Ala Met Ala Thr Thr Glu Lys Lys Pro His Val Ile Phe Ile
1 5 10 15
Pro Phe Pro Ala Gln Ser His Ile Lys Ala Met Leu Lys Leu Ala Gln
20 25 30
Leu Leu His His Lys Gly Leu Gln Ile Thr Phe Val Asn Thr Asp Phe
35 40 45
Ile His Asn Gln Phe Leu Glu Ser Ser Gly Pro His Cys Leu Asp Gly
50 55 60
Ala Pro Gly Phe Arg Phe Glu Thr Ile Pro Asp Gly Val Ser His Ser
65 70 75 80
Pro Glu Ala Ser Ile Pro Ile Arg Glu Ser Leu Leu Arg Ser Ile Glu
85 90 95
Thr Asn Phe Leu Asp Arg Phe Ile Asp Leu Val Thr Lys Leu Pro Asp
100 105 110
Pro Pro Thr Cys Ile Ile Ser Asp Gly Phe Leu Ser Val Phe Thr Ile
115 120 125
Asp Ala Ala Lys Lys Leu Gly Ile Pro Val Met Met Tyr Trp Thr Leu
130 135 140
Ala Ala Cys Gly Phe Met Gly Phe Tyr His Ile His Ser Leu Ile Glu
145 150 155 160
Lys Gly Phe Ala Pro Leu Lys Asp Ala Ser Tyr Leu Thr Asn Gly Tyr
165 170 175
Leu Asp Thr Val Ile Asp Trp Val Pro Gly Met Glu Gly Ile Arg Leu
180 185 190
Lys Asp Phe Pro Leu Asp Trp Ser Thr Asp Leu Asn Asp Lys Val Leu
195 200 205
Met Phe Thr Thr Glu Ala Pro Gln Arg Ser His Lys Val Ser His His
210 215 220
Ile Phe His Thr Phe Asp Glu Leu Glu Pro Ser Ile Ile Lys Thr Leu
225 230 235 240
Ser Leu Arg Tyr Asn His Ile Tyr Thr Ile Gly Pro Leu Gln Leu Leu
245 250 255
Leu Asp Gln Ile Pro Glu Glu Lys Lys Gln Thr Gly Ile Thr Ser Leu
260 265 270
His Gly Tyr Ser Leu Val Lys Glu Glu Pro Glu Cys Phe Gln Trp Leu
275 280 285
Gln Ser Lys Glu Pro Asn Ser Val Val Tyr Val Asn Phe Gly Ser Thr
290 295 300
Thr Val Met Ser Leu Glu Asp Met Thr Glu Phe Gly Trp Gly Leu Ala
305 310 315 320
Asn Ser Asn His Tyr Phe Leu Trp Ile Ile Arg Ser Asn Leu Val Ile
325 330 335
Gly Glu Asn Ala Val Leu Pro Pro Glu Leu Glu Glu His Ile Lys Lys
340 345 350
Arg Gly Phe Ile Ala Ser Trp Cys Ser Gln Glu Lys Val Leu Lys His
355 360 365
Pro Ser Val Gly Gly Phe Leu Thr His Cys Gly Trp Gly Ser Thr Ile
370 375 380
Glu Ser Leu Ser Ala Gly Val Pro Met Ile Cys Trp Pro Tyr Ser Trp
385 390 395 400
Asp Gln Leu Thr Asn Cys Arg Tyr Ile Cys Lys Glu Trp Glu Val Gly
405 410 415
Leu Glu Met Gly Thr Lys Val Lys Arg Asp Glu Val Lys Arg Leu Val
420 425 430
Gln Glu Leu Met Gly Glu Gly Gly His Lys Met Arg Asn Lys Ala Lys
435 440 445
Asp Trp Lys Glu Lys Ala Arg Ile Ala Ile Ala Pro Asn Gly Ser Ser
450 455 460
Ser Leu Asn Ile Asp Lys Met Val Lys Glu Ile Thr Val Leu Ala Arg
465 470 475 480
Asn
<210> 18
<211> 460
<212> PRT
<213> Stevia rebaudiana
<400> 18
Met Ala Glu Gln Gln Lys Ile Lys Lys Ser Pro His Val Leu Leu Ile
1 5 10 15
Pro Phe Pro Leu Gln Gly His Ile Asn Pro Phe Ile Gln Phe Gly Lys
20 25 30
Arg Leu Ile Ser Lys Gly Val Lys Thr Thr Leu Val Thr Thr Ile His
35 40 45
Thr Leu Asn Ser Thr Leu Asn His Ser Asn Thr Thr Thr Thr Ser Ile
50 55 60
Glu Ile Gln Ala Ile Ser Asp Gly Cys Asp Glu Gly Gly Phe Met Ser
65 70 75 80
Ala Gly Glu Ser Tyr Leu Glu Thr Phe Lys Gln Val Gly Ser Lys Ser
85 90 95
Leu Ala Asp Leu Ile Lys Lys Leu Gln Ser Glu Gly Thr Thr Ile Asp
100 105 110
Ala Ile Ile Tyr Asp Ser Met Thr Glu Trp Val Leu Asp Val Ala Ile
115 120 125
Glu Phe Gly Ile Asp Gly Gly Ser Phe Phe Thr Gln Ala Cys Val Val
130 135 140
Asn Ser Leu Tyr Tyr His Val His Lys Gly Leu Ile Ser Leu Pro Leu
145 150 155 160
Gly Glu Thr Val Ser Val Pro Gly Phe Pro Val Leu Gln Arg Trp Glu
165 170 175
Thr Pro Leu Ile Leu Gln Asn His Glu Gln Ile Gln Ser Pro Trp Ser
180 185 190
Gln Met Leu Phe Gly Gln Phe Ala Asn Ile Asp Gln Ala Arg Trp Val
195 200 205
Phe Thr Asn Ser Phe Tyr Lys Leu Glu Glu Glu Val Ile Glu Trp Thr
210 215 220
Arg Lys Ile Trp Asn Leu Lys Val Ile Gly Pro Thr Leu Pro Ser Met
225 230 235 240
Tyr Leu Asp Lys Arg Leu Asp Asp Asp Lys Asp Asn Gly Phe Asn Leu
245 250 255
Tyr Lys Ala Asn His His Glu Cys Met Asn Trp Leu Asp Asp Lys Pro
260 265 270
Lys Glu Ser Val Val Tyr Val Ala Phe Gly Ser Leu Val Lys His Gly
275 280 285
Pro Glu Gln Val Glu Glu Ile Thr Arg Ala Leu Ile Asp Ser Asp Val
290 295 300
Asn Phe Leu Trp Val Ile Lys His Lys Glu Glu Gly Lys Leu Pro Glu
305 310 315 320
Asn Leu Ser Glu Val Ile Lys Thr Gly Lys Gly Leu Ile Val Ala Trp
325 330 335
Cys Lys Gln Leu Asp Val Leu Ala His Glu Ser Val Gly Cys Phe Val
340 345 350
Thr His Cys Gly Phe Asn Ser Thr Leu Glu Ala Ile Ser Leu Gly Val
355 360 365
Pro Val Val Ala Met Pro Gln Phe Ser Asp Gln Thr Thr Asn Ala Lys
370 375 380
Leu Leu Asp Glu Ile Leu Gly Val Gly Val Arg Val Lys Ala Asp Glu
385 390 395 400
Asn Gly Ile Val Arg Arg Gly Asn Leu Ala Ser Cys Ile Lys Met Ile
405 410 415
Met Glu Glu Glu Arg Gly Val Ile Ile Arg Lys Asn Ala Val Lys Trp
420 425 430
Lys Asp Leu Ala Lys Val Ala Val His Glu Gly Gly Ser Ser Asp Asn
435 440 445
Asp Ile Val Glu Phe Val Ser Glu Leu Ile Lys Ala
450 455 460
<210> 19
<211> 458
<212> PRT
<213> Stevia rebaudiana
<400> 19
Met Glu Asn Lys Thr Glu Thr Thr Val Arg Arg Arg Arg Arg Ile Ile
1 5 10 15
Leu Phe Pro Val Pro Phe Gln Gly His Ile Asn Pro Ile Leu Gln Leu
20 25 30
Ala Asn Val Leu Tyr Ser Lys Gly Phe Ser Ile Thr Ile Phe His Thr
35 40 45
Asn Phe Asn Lys Pro Lys Thr Ser Asn Tyr Pro His Phe Thr Phe Arg
50 55 60
Phe Ile Leu Asp Asn Asp Pro Gln Asp Glu Arg Ile Ser Asn Leu Pro
65 70 75 80
Thr His Gly Pro Leu Ala Gly Met Arg Ile Pro Ile Ile Asn Glu His
85 90 95
Gly Ala Asp Glu Leu Arg Arg Glu Leu Glu Leu Leu Met Leu Ala Ser
100 105 110
Glu Glu Asp Glu Glu Val Ser Cys Leu Ile Thr Asp Ala Leu Trp Tyr
115 120 125
Phe Ala Gln Ser Val Ala Asp Ser Leu Asn Leu Arg Arg Leu Val Leu
130 135 140
Met Thr Ser Ser Leu Phe Asn Phe His Ala His Val Ser Leu Pro Gln
145 150 155 160
Phe Asp Glu Leu Gly Tyr Leu Asp Pro Asp Asp Lys Thr Arg Leu Glu
165 170 175
Glu Gln Ala Ser Gly Phe Pro Met Leu Lys Val Lys Asp Ile Lys Ser
180 185 190
Ala Tyr Ser Asn Trp Gln Ile Leu Lys Glu Ile Leu Gly Lys Met Ile
195 200 205
Lys Gln Thr Lys Ala Ser Ser Gly Val Ile Trp Asn Ser Phe Lys Glu
210 215 220
Leu Glu Glu Ser Glu Leu Glu Thr Val Ile Arg Glu Ile Pro Ala Pro
225 230 235 240
Ser Phe Leu Ile Pro Leu Pro Lys His Leu Thr Ala Ser Ser Ser Ser
245 250 255
Leu Leu Asp His Asp Arg Thr Val Phe Gln Trp Leu Asp Gln Gln Pro
260 265 270
Pro Ser Ser Val Leu Tyr Val Ser Phe Gly Ser Thr Ser Glu Val Asp
275 280 285
Glu Lys Asp Phe Leu Glu Ile Ala Arg Gly Leu Val Asp Ser Lys Gln
290 295 300
Ser Phe Leu Trp Val Val Arg Pro Gly Phe Val Lys Gly Ser Thr Trp
305 310 315 320
Val Glu Pro Leu Pro Asp Gly Phe Leu Gly Glu Arg Gly Arg Ile Val
325 330 335
Lys Trp Val Pro Gln Gln Glu Val Leu Ala His Gly Ala Ile Gly Ala
340 345 350
Phe Trp Thr His Ser Gly Trp Asn Ser Thr Leu Glu Ser Val Cys Glu
355 360 365
Gly Val Pro Met Ile Phe Ser Asp Phe Gly Leu Asp Gln Pro Leu Asn
370 375 380
Ala Arg Tyr Met Ser Asp Val Leu Lys Val Gly Val Tyr Leu Glu Asn
385 390 395 400
Gly Trp Glu Arg Gly Glu Ile Ala Asn Ala Ile Arg Arg Val Met Val
405 410 415
Asp Glu Glu Gly Glu Tyr Ile Arg Gln Asn Ala Arg Val Leu Lys Gln
420 425 430
Lys Ala Asp Val Ser Leu Met Lys Gly Gly Ser Ser Tyr Glu Ser Leu
435 440 445
Glu Ser Leu Val Ser Tyr Ile Ser Ser Leu
450 455
<210> 20
<211> 459
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 20
Met Ala Asn Trp Gln Ile Leu Lys Glu Ile Leu Gly Lys Met Ile Lys
1 5 10 15
Gln Thr Lys Ala Ser Ser Gly Val Ile Trp Asn Ser Phe Lys Glu Leu
20 25 30
Glu Glu Ser Glu Leu Glu Thr Val Ile Arg Glu Ile Pro Ala Pro Ser
35 40 45
Phe Leu Ile Pro Leu Pro Lys His Leu Thr Ala Ser Ser Ser Ser Leu
50 55 60
Leu Asp His Asp Arg Thr Val Phe Gln Trp Leu Asp Gln Gln Pro Pro
65 70 75 80
Ser Ser Val Leu Tyr Val Ser Phe Gly Ser Thr Ser Glu Val Asp Glu
85 90 95
Lys Asp Phe Leu Glu Ile Ala Arg Gly Leu Val Asp Ser Lys Gln Ser
100 105 110
Phe Leu Trp Val Val Arg Pro Gly Phe Val Lys Gly Ser Thr Trp Val
115 120 125
Glu Pro Leu Pro Asp Gly Phe Leu Gly Glu Arg Gly Arg Ile Val Lys
130 135 140
Trp Val Pro Gln Gln Glu Val Leu Ala His Gly Ala Ile Gly Ala Phe
145 150 155 160
Trp Thr His Ser Gly Trp Asn Ser Thr Leu Glu Ser Val Cys Glu Gly
165 170 175
Val Pro Met Ile Phe Ser Asp Phe Gly Leu Asp Gln Pro Leu Asn Ala
180 185 190
Arg Tyr Met Ser Asp Val Leu Lys Val Gly Val Tyr Leu Glu Asn Gly
195 200 205
Trp Glu Arg Gly Glu Ile Ala Asn Ala Ile Arg Arg Val Met Val Asp
210 215 220
Glu Glu Gly Glu Tyr Ile Arg Gln Asn Ala Arg Val Leu Lys Gln Lys
225 230 235 240
Ala Asp Val Ser Leu Met Lys Gly Gly Ser Ser Tyr Glu Ser Leu Glu
245 250 255
Ser Leu Val Ser Tyr Ile Ser Ser Leu Glu Asn Lys Thr Glu Thr Thr
260 265 270
Val Arg Arg Arg Arg Arg Ile Ile Leu Phe Pro Val Pro Phe Gln Gly
275 280 285
His Ile Asn Pro Ile Leu Gln Leu Ala Asn Val Leu Tyr Ser Lys Gly
290 295 300
Phe Ser Ile Thr Ile Phe His Thr Asn Phe Asn Lys Pro Lys Thr Ser
305 310 315 320
Asn Tyr Pro His Phe Thr Phe Arg Phe Ile Leu Asp Asn Asp Pro Gln
325 330 335
Asp Glu Arg Ile Ser Asn Leu Pro Thr His Gly Pro Leu Ala Gly Met
340 345 350
Arg Ile Pro Ile Ile Asn Glu His Gly Ala Asp Glu Leu Arg Arg Glu
355 360 365
Leu Glu Leu Leu Met Leu Ala Ser Glu Glu Asp Glu Glu Val Ser Cys
370 375 380
Leu Ile Thr Asp Ala Leu Trp Tyr Phe Ala Gln Ser Val Ala Asp Ser
385 390 395 400
Leu Asn Leu Arg Arg Leu Val Leu Met Thr Ser Ser Leu Phe Asn Phe
405 410 415
His Ala His Val Ser Leu Pro Gln Phe Asp Glu Leu Gly Tyr Leu Asp
420 425 430
Pro Asp Asp Lys Thr Arg Leu Glu Glu Gln Ala Ser Gly Phe Pro Met
435 440 445
Leu Lys Val Lys Asp Ile Lys Ser Ala Tyr Ser
450 455
<210> 21
<211> 459
<212> PRT
<213> Stevia rebaudiana
<400> 21
Met Ala Glu Asn Lys Thr Glu Thr Thr Val Arg Arg Arg Arg Arg Ile
1 5 10 15
Ile Leu Phe Pro Val Pro Phe Gln Gly His Ile Asn Pro Ile Leu Gln
20 25 30
Leu Ala Asn Val Leu Tyr Ser Lys Gly Phe Ser Ile Thr Ile Phe His
35 40 45
Thr Asn Phe Asn Lys Pro Lys Thr Ser Asn Tyr Pro His Phe Thr Phe
50 55 60
Arg Phe Ile Leu Asp Asn Asp Pro Gln Asp Glu Arg Ile Ser Asn Leu
65 70 75 80
Pro Thr His Gly Pro Leu Ala Gly Met Arg Ile Pro Ile Ile Asn Glu
85 90 95
His Gly Ala Asp Glu Leu Arg Arg Glu Leu Glu Leu Leu Met Leu Ala
100 105 110
Ser Glu Glu Asp Glu Glu Val Ser Cys Leu Ile Thr Asp Ala Leu Trp
115 120 125
Tyr Phe Ala Gln Ser Val Ala Asp Ser Leu Asn Leu Arg Arg Leu Val
130 135 140
Leu Met Thr Ser Ser Leu Phe Asn Phe His Ala His Val Ser Leu Pro
145 150 155 160
Gln Phe Asp Glu Leu Gly Tyr Leu Asp Pro Asp Asp Lys Thr Arg Leu
165 170 175
Glu Glu Gln Ala Ser Gly Phe Pro Met Leu Lys Val Lys Asp Ile Lys
180 185 190
Ser Ala Tyr Ser Asn Trp Gln Ile Ala Lys Glu Ile Leu Gly Lys Met
195 200 205
Ile Lys Gln Thr Lys Ala Ser Ser Gly Val Ile Trp Asn Ser Phe Lys
210 215 220
Glu Leu Glu Glu Ser Glu Leu Glu Thr Val Ile Arg Glu Ile Pro Ala
225 230 235 240
Pro Ser Phe Leu Ile Pro Leu Pro Lys His Leu Thr Ala Ser Ser Ser
245 250 255
Ser Leu Leu Asp His Asp Arg Thr Val Phe Gln Trp Leu Asp Gln Gln
260 265 270
Pro Pro Ser Ser Val Leu Tyr Val Ser Phe Gly Ser Thr Ser Glu Val
275 280 285
Asp Glu Lys Asp Phe Leu Glu Ile Ala Arg Gly Leu Val Asp Ser Lys
290 295 300
Gln Ser Phe Leu Trp Val Val Arg Pro Gly Phe Val Lys Gly Ser Thr
305 310 315 320
Trp Val Glu Pro Leu Pro Asp Gly Phe Leu Gly Glu Arg Gly Arg Ile
325 330 335
Val Lys Trp Val Pro Gln Gln Glu Val Leu Ala His Gly Ala Ile Gly
340 345 350
Ala Phe Trp Thr His Ser Gly Trp Asn Ser Thr Leu Glu Ser Val Cys
355 360 365
Glu Gly Val Pro Met Ile Phe Ser Asp Phe Gly Leu Asp Gln Pro Leu
370 375 380
Asn Ala Arg Tyr Met Ser Asp Val Leu Lys Val Gly Val Tyr Leu Glu
385 390 395 400
Asn Gly Trp Glu Arg Gly Glu Ile Ala Asn Ala Ile Arg Arg Val Met
405 410 415
Val Asp Glu Glu Gly Glu Tyr Ile Arg Gln Asn Ala Arg Val Leu Lys
420 425 430
Gln Lys Ala Asp Val Ser Leu Met Lys Gly Gly Ser Ser Tyr Glu Ser
435 440 445
Leu Glu Ser Leu Val Ser Tyr Ile Ser Ser Leu
450 455
<210> 22
<211> 459
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 22
Met Ala Lys Gln Ser Phe Leu Trp Val Val Arg Pro Gly Phe Val Lys
1 5 10 15
Gly Ser Thr Trp Val Glu Pro Leu Pro Asp Gly Phe Leu Gly Glu Arg
20 25 30
Gly Arg Ile Val Lys Trp Val Pro Gln Gln Glu Val Leu Ala His Gly
35 40 45
Ala Ile Gly Ala Phe Trp Thr His Ser Gly Trp Asn Ser Thr Leu Glu
50 55 60
Ser Val Cys Glu Gly Val Pro Met Ile Phe Ser Asp Phe Gly Leu Asp
65 70 75 80
Gln Pro Leu Asn Ala Arg Tyr Met Ser Asp Val Leu Lys Val Gly Val
85 90 95
Tyr Leu Glu Asn Gly Trp Glu Arg Gly Glu Ile Ala Asn Ala Ile Arg
100 105 110
Arg Val Met Val Asp Glu Glu Gly Glu Tyr Ile Arg Gln Asn Ala Arg
115 120 125
Val Leu Lys Gln Lys Ala Asp Val Ser Leu Met Lys Gly Gly Ser Ser
130 135 140
Tyr Glu Ser Leu Glu Ser Leu Val Ser Tyr Ile Ser Ser Leu Glu Asn
145 150 155 160
Lys Thr Glu Thr Thr Val Arg Arg Arg Arg Arg Ile Ile Leu Phe Pro
165 170 175
Val Pro Phe Gln Gly His Ile Asn Pro Ile Leu Gln Leu Ala Asn Val
180 185 190
Leu Tyr Ser Lys Gly Phe Ser Ile Thr Ile Phe His Thr Asn Phe Asn
195 200 205
Lys Pro Lys Thr Ser Asn Tyr Pro His Phe Thr Phe Arg Phe Ile Leu
210 215 220
Asp Asn Asp Pro Gln Asp Glu Arg Ile Ser Asn Leu Pro Thr His Gly
225 230 235 240
Pro Leu Ala Gly Met Arg Ile Pro Ile Ile Asn Glu His Gly Ala Asp
245 250 255
Glu Leu Arg Arg Glu Leu Glu Leu Leu Met Leu Ala Ser Glu Glu Asp
260 265 270
Glu Glu Val Ser Cys Leu Ile Thr Asp Ala Leu Trp Tyr Phe Ala Gln
275 280 285
Ser Val Ala Asp Ser Leu Asn Leu Arg Arg Leu Val Leu Met Thr Ser
290 295 300
Ser Leu Phe Asn Phe His Ala His Val Ser Leu Pro Gln Phe Asp Glu
305 310 315 320
Leu Gly Tyr Leu Asp Pro Asp Asp Lys Thr Arg Leu Glu Glu Gln Ala
325 330 335
Ser Gly Phe Pro Met Leu Lys Val Lys Asp Ile Lys Ser Ala Tyr Ser
340 345 350
Asn Trp Gln Ile Ala Lys Glu Ile Leu Gly Lys Met Ile Lys Gln Thr
355 360 365
Lys Ala Ser Ser Gly Val Ile Trp Asn Ser Phe Lys Glu Leu Glu Glu
370 375 380
Ser Glu Leu Glu Thr Val Ile Arg Glu Ile Pro Ala Pro Ser Phe Leu
385 390 395 400
Ile Pro Leu Pro Lys His Leu Thr Ala Ser Ser Ser Ser Leu Leu Asp
405 410 415
His Asp Arg Thr Val Phe Gln Trp Leu Asp Gln Gln Pro Pro Ser Ser
420 425 430
Val Leu Tyr Val Ser Phe Gly Ser Thr Ser Glu Val Asp Glu Lys Asp
435 440 445
Phe Leu Glu Ile Ala Arg Gly Leu Val Asp Ser
450 455
<210> 23
<211> 458
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 23
Met Ala Phe Leu Trp Val Val Arg Pro Gly Phe Val Lys Gly Ser Thr
1 5 10 15
Trp Val Glu Pro Leu Pro Asp Gly Phe Leu Gly Glu Arg Gly Arg Ile
20 25 30
Val Lys Trp Val Pro Gln Gln Glu Val Leu Ala His Gly Ala Ile Gly
35 40 45
Ala Phe Trp Thr His Gly Gly Trp Asn Ser Thr Leu Glu Ser Val Cys
50 55 60
Glu Gly Val Pro Met Ile Phe Ser Asp Phe Gly Leu Asp Gln Pro Leu
65 70 75 80
Asn Ala Arg Tyr Met Ser Asp Val Leu Lys Val Gly Val Tyr Leu Glu
85 90 95
Asn Gly Trp Glu Arg Gly Glu Ile Ala Asn Ala Ile Arg Arg Leu Met
100 105 110
Val Asp Glu Glu Gly Glu Tyr Ile Arg Gln Asn Ala Arg Val Leu Lys
115 120 125
Gln Lys Ala Asp Val Ser Leu Met Lys Gly Gly Ser Ser Tyr Glu Ser
130 135 140
Leu Glu Ser Leu Val Ser Tyr Ile Ser Ser Leu Gly Ser Gly Gly Ser
145 150 155 160
Gly Gly Ser Gly Arg Arg Arg Arg Ile Ile Leu Phe Pro Val Pro Phe
165 170 175
Gln Gly His Ile Asn Pro Met Leu Gln Leu Ala Asn Val Leu Tyr Ser
180 185 190
Lys Gly Phe Ser Ile Thr Ile Phe His Thr Asn Phe Asn Lys Pro Lys
195 200 205
Thr Ser Asn Tyr Pro His Phe Thr Phe Arg Phe Ile Leu Asp Asn Asp
210 215 220
Pro Gln Asp Glu Arg Ile Ser Asn Leu Pro Thr His Gly Pro Leu Ala
225 230 235 240
Gly Met Arg Ile Pro Ile Ile Asn Glu His Gly Ala Asp Glu Leu Arg
245 250 255
Arg Glu Leu Glu Leu Leu Met Leu Ala Ser Glu Glu Asp Glu Glu Val
260 265 270
Ser Cys Leu Ile Thr Asp Ala Leu Trp Tyr Phe Ala Gln Ser Val Ala
275 280 285
Asp Ser Leu Asn Leu Arg Arg Leu Val Leu Met Thr Ser Ser Leu Phe
290 295 300
Asn Phe His Ala His Val Ser Leu Pro Gln Phe Asp Glu Leu Gly Tyr
305 310 315 320
Leu Asp Pro Asp Asp Lys Thr Arg Leu Glu Glu Gln Ala Ser Gly Phe
325 330 335
Pro Met Leu Lys Val Lys Asp Ile Lys Ser Ala Tyr Ser Asn Trp Gln
340 345 350
Ile Ala Lys Glu Ile Leu Gly Lys Met Ile Lys Gln Thr Lys Ala Ser
355 360 365
Ser Gly Val Ile Trp Asn Ser Phe Lys Glu Leu Glu Glu Ser Glu Leu
370 375 380
Glu Thr Val Ile Arg Glu Ile Pro Ala Pro Ser Phe Leu Ile Pro Leu
385 390 395 400
Pro Lys His Leu Thr Ala Ser Ser Ser Ser Leu Leu Asp His Asp Arg
405 410 415
Thr Val Phe Gln Trp Leu Asp Gln Gln Pro Pro Ser Ser Val Leu Tyr
420 425 430
Val Ser Phe Gly Ser Thr Ser Glu Val Asp Glu Lys Asp Phe Leu Glu
435 440 445
Ile Ala Arg Gly Leu Val Asp Ser Gln Ser
450 455
<210> 24
<211> 455
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 24
Met Ala Phe Leu Trp Val Val Arg Pro Gly Phe Val Lys Gly Ser Thr
1 5 10 15
Trp Val Glu Pro Leu Pro Asp Gly Phe Leu Gly Glu Arg Gly Arg Ile
20 25 30
Val Lys Trp Val Pro Gln Gln Glu Val Leu Ala His Gly Ala Ile Gly
35 40 45
Ala Phe Trp Thr His Gly Gly Trp Asn Ser Thr Leu Glu Ser Val Cys
50 55 60
Glu Gly Val Pro Met Ile Phe Ser Asp Phe Gly Leu Asp Gln Pro Leu
65 70 75 80
Asn Ala Arg Tyr Met Ser Asp Val Leu Lys Val Gly Val Tyr Leu Glu
85 90 95
Asn Gly Trp Glu Arg Gly Glu Ile Ala Asn Ala Ile Arg Arg Leu Met
100 105 110
Val Asp Glu Glu Gly Glu Tyr Ile Arg Gln Asn Ala Arg Val Leu Lys
115 120 125
Gln Lys Ala Asp Val Ser Leu Met Lys Gly Gly Ser Ser Tyr Glu Ser
130 135 140
Leu Glu Ser Leu Val Ser Tyr Ile Ser Ser Leu Gly Ser Gly Gly Ser
145 150 155 160
Gly Arg Arg Arg Arg Ile Ile Leu Phe Pro Val Pro Phe Gln Gly His
165 170 175
Ile Asn Pro Met Leu Gln Leu Ala Asn Val Leu Tyr Ser Lys Gly Phe
180 185 190
Ser Ile Thr Ile Phe His Thr Asn Phe Asn Lys Pro Lys Thr Ser Asn
195 200 205
Tyr Pro His Phe Thr Phe Arg Phe Ile Leu Asp Asn Asp Pro Gln Asp
210 215 220
Glu Arg Ile Ser Asn Leu Pro Thr His Gly Pro Leu Ala Gly Met Arg
225 230 235 240
Ile Pro Ile Ile Asn Glu His Gly Ala Asp Glu Leu Arg Arg Glu Leu
245 250 255
Glu Leu Gln Met Leu Ala Ser Glu Glu Asp Glu Glu Val Ser Cys Leu
260 265 270
Ile Thr Asp Ala Leu Trp Tyr Phe Ala Gln Ser Val Ala Asp Ser Leu
275 280 285
Asn Leu Pro Arg Leu Val Leu Met Thr Ser Ser Leu Phe Asn Phe His
290 295 300
Ala His Val Ser Leu Pro Gln Phe Asp Glu Leu Gly Tyr Leu Asp Pro
305 310 315 320
Asp Asp Lys Thr Arg Leu Glu Glu Gln Ala Ser Gly Phe Pro Met Leu
325 330 335
Lys Val Lys Asp Ile Lys Ser Ala Tyr Ser Asn Trp Gln Ile Ala Lys
340 345 350
Glu Ile Leu Gly Lys Met Ile Lys Gln Thr Lys Ala Ser Ser Gly Val
355 360 365
Ile Trp Asn Ser Phe Lys Glu Leu Glu Glu Ser Glu Leu Glu Thr Val
370 375 380
Ile Arg Glu Ile Pro Ala Pro Ser Phe Leu Ile Pro Leu Pro Lys His
385 390 395 400
Leu Thr Ala Ser Ser Ser Ser Leu Leu Glu His Asp Arg Thr Val Phe
405 410 415
Gln Trp Leu Asp Gln Gln Pro Pro Ser Ser Val Leu Tyr Val Ser Phe
420 425 430
Gly Ser Thr Ser Glu Val Asp Glu Lys Asp Phe Leu Glu Ile Ala Arg
435 440 445
Gly Leu Val Asp Ser Gln Ser
450 455
<210> 25
<211> 447
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 25
Met Ala Phe Leu Trp Val Val Arg Pro Gly Phe Val Lys Gly Ser Thr
1 5 10 15
Trp Val Glu Pro Leu Pro Asp Gly Phe Leu Gly Glu Arg Gly Arg Ile
20 25 30
Val Lys Trp Val Pro Gln Gln Glu Val Leu Ala His Gly Ala Ile Gly
35 40 45
Ala Phe Trp Thr His Gly Gly Trp Asn Ser Thr Leu Glu Ser Val Cys
50 55 60
Glu Gly Val Pro Met Ile Phe Gln Asp Phe Gly Leu Asp Gln Pro Leu
65 70 75 80
Asn Ala Arg Tyr Met Ser Asp Val Leu Lys Val Gly Val Tyr Leu Glu
85 90 95
Asn Gly Trp Glu Arg Gly Glu Ile Ala Asn Ala Ile Arg Arg Leu Met
100 105 110
Val Asp Glu Glu Gly Glu Tyr Ile Arg Gln Asn Ala Arg Val Leu Lys
115 120 125
Gln Lys Ala Asp Val Ser Leu Met Lys Gly Gly Ser Ser Tyr Glu Ser
130 135 140
Leu Glu Ser Leu Val Ser Tyr Ile Ser Ser Leu Gly Ser Gly Gly Ser
145 150 155 160
Gly Arg Arg Arg Arg Ile Ile Leu Phe Pro Val Pro Phe Gln Gly His
165 170 175
Ile Asn Pro Met Leu Gln Leu Ala Asn Val Leu Tyr Ser Lys Gly Phe
180 185 190
Ser Ile Thr Ile Phe His Thr Asn Phe Asn Lys Pro Lys Thr Ser Asn
195 200 205
Tyr Pro His Phe Thr Phe Arg Phe Ile Leu Asp Asn Asp Pro Gln Asp
210 215 220
His Gly Pro Leu Ala Gly Met Arg Ile Pro Ile Ile Asn Glu His Gly
225 230 235 240
Ala Asp Glu Leu Arg Arg Glu Leu Glu Leu Gln Met Leu Ala Ser Glu
245 250 255
Glu Asp Glu Glu Val Ser Cys Leu Ile Thr Asp Ala Leu Trp Tyr Phe
260 265 270
Ala Gln Ser Val Ala Asp Ser Leu Asn Leu Pro Arg Leu Val Leu Met
275 280 285
Thr Ser Ser Leu Phe Asn Phe His Cys His Val Ser Leu Pro Gln Phe
290 295 300
Asp Glu Leu Gly Tyr Leu Asp Pro Asp Asp Lys Thr Arg Leu Glu Glu
305 310 315 320
Gln Ala Ser Gly Phe Pro Met Leu Lys Val Lys Asp Ile Lys Ser Ala
325 330 335
Phe Ser Asn Trp Gln Ile Ala Lys Glu Ile Leu Gly Lys Met Ile Lys
340 345 350
Gln Thr Lys Ala Ser Ser Gly Val Ile Trp Asn Ser Phe Lys Glu Leu
355 360 365
Glu Glu Ser Glu Leu Glu Thr Val Ile Arg Glu Ile Pro Ala Pro Ser
370 375 380
Phe Leu Ile Pro Leu Pro Lys His Leu Thr Ala Ser Ser Ser Ser Leu
385 390 395 400
Leu Glu His Asp Arg Thr Val Phe Gln Trp Leu Asp Gln Gln Pro Pro
405 410 415
Ser Ser Val Ile Tyr Val Ser Phe Gly Ser Thr Ser Glu Val Asp Glu
420 425 430
Lys Asp Phe Leu Glu Ile Ala Arg Gly Leu Val Asp Ser Gln Ser
435 440 445
<210> 26
<211> 485
<212> PRT
<213> Stevia rebaudiana
<400> 26
Met Tyr Asn Val Thr Tyr His Gln Asn Ser Lys Ala Met Ala Thr Ser
1 5 10 15
Asp Ser Ile Val Asp Asp Arg Lys Gln Leu His Val Ala Thr Phe Pro
20 25 30
Trp Leu Ala Phe Gly His Ile Leu Pro Phe Leu Gln Leu Ser Lys Leu
35 40 45
Ile Ala Glu Lys Gly His Lys Val Ser Phe Leu Ser Thr Thr Arg Asn
50 55 60
Ile Gln Arg Leu Ser Ser His Ile Ser Pro Leu Ile Asn Val Val Gln
65 70 75 80
Leu Thr Leu Pro Arg Val Gln Glu Leu Pro Glu Asp Ala Glu Ala Thr
85 90 95
Thr Asp Val His Pro Glu Asp Ile Gln Tyr Leu Lys Lys Ala Val Asp
100 105 110
Gly Leu Gln Pro Glu Val Thr Arg Phe Leu Glu Gln His Ser Pro Asp
115 120 125
Trp Ile Ile Tyr Asp Phe Thr His Tyr Trp Leu Pro Ser Ile Ala Ala
130 135 140
Ser Leu Gly Ile Ser Arg Ala Tyr Phe Cys Val Ile Thr Pro Trp Thr
145 150 155 160
Ile Ala Tyr Leu Ala Pro Ser Ser Asp Ala Met Ile Asn Asp Ser Asp
165 170 175
Gly Arg Thr Thr Val Glu Asp Leu Thr Thr Pro Pro Lys Trp Phe Pro
180 185 190
Phe Pro Thr Lys Val Cys Trp Arg Lys His Asp Leu Ala Arg Met Glu
195 200 205
Pro Tyr Glu Ala Pro Gly Ile Ser Asp Gly Tyr Arg Met Gly Met Val
210 215 220
Phe Lys Gly Ser Asp Cys Leu Leu Phe Lys Cys Tyr His Glu Phe Gly
225 230 235 240
Thr Gln Trp Leu Pro Leu Leu Glu Thr Leu His Gln Val Pro Val Val
245 250 255
Pro Val Gly Leu Leu Pro Pro Glu Ile Pro Gly Asp Glu Lys Asp Glu
260 265 270
Thr Trp Val Ser Ile Lys Lys Trp Leu Asp Gly Lys Gln Lys Gly Ser
275 280 285
Val Val Tyr Val Ala Leu Gly Ser Glu Ala Leu Val Ser Gln Thr Glu
290 295 300
Val Val Glu Leu Ala Leu Gly Leu Glu Leu Ser Gly Leu Pro Phe Val
305 310 315 320
Trp Ala Tyr Arg Lys Pro Lys Gly Pro Ala Lys Ser Asp Ser Val Glu
325 330 335
Leu Pro Asp Gly Phe Val Glu Arg Thr Arg Asp Arg Gly Leu Val Trp
340 345 350
Thr Ser Trp Ala Pro Gln Leu Arg Ile Leu Ser His Glu Ser Val Cys
355 360 365
Gly Phe Leu Thr His Cys Gly Ser Gly Ser Ile Val Glu Gly Leu Met
370 375 380
Phe Gly His Pro Leu Ile Met Leu Pro Ile Phe Cys Asp Gln Pro Leu
385 390 395 400
Asn Ala Arg Leu Leu Glu Asp Lys Gln Val Gly Ile Glu Ile Pro Arg
405 410 415
Asn Glu Glu Asp Gly Cys Leu Thr Lys Glu Ser Val Ala Arg Ser Leu
420 425 430
Arg Ser Val Val Val Glu Asn Glu Gly Glu Ile Tyr Lys Ala Asn Ala
435 440 445
Arg Ala Leu Ser Lys Ile Tyr Asn Asp Thr Lys Val Glu Lys Glu Tyr
450 455 460
Val Ser Gln Phe Val Asp Tyr Leu Glu Lys Asn Ala Arg Ala Val Ala
465 470 475 480
Ile Asp His Glu Ser
485
<210> 27
<211> 473
<212> PRT
<213> Stevia rebaudiana
<400> 27
Met Ala Thr Ser Asp Ser Ile Val Asp Asp Arg Lys Gln Leu His Val
1 5 10 15
Ala Thr Phe Pro Trp Leu Ala Phe Gly His Ile Leu Pro Tyr Leu Gln
20 25 30
Leu Ser Lys Leu Ile Ala Glu Lys Gly His Lys Val Ser Phe Leu Ser
35 40 45
Thr Thr Arg Asn Ile Gln Arg Leu Ser Ser His Ile Ser Pro Leu Ile
50 55 60
Asn Val Val Gln Leu Thr Leu Pro Arg Val Gln Glu Leu Pro Glu Asp
65 70 75 80
Ala Glu Ala Thr Thr Asp Val His Pro Glu Asp Ile Pro Tyr Leu Lys
85 90 95
Lys Ala Ser Asp Gly Leu Gln Pro Glu Val Thr Arg Phe Leu Glu Gln
100 105 110
His Ser Pro Asp Trp Ile Ile Tyr Asp Tyr Thr His Tyr Trp Leu Pro
115 120 125
Ser Ile Ala Ala Ser Leu Gly Ile Ser Arg Ala His Phe Ser Val Thr
130 135 140
Thr Pro Trp Ala Ile Ala Tyr Met Gly Pro Ser Ala Asp Ala Met Ile
145 150 155 160
Asn Gly Ser Asp Gly Arg Thr Thr Val Glu Asp Leu Thr Thr Pro Pro
165 170 175
Lys Trp Phe Pro Phe Pro Thr Lys Val Cys Trp Arg Lys His Asp Leu
180 185 190
Ala Arg Leu Val Pro Tyr Lys Ala Pro Gly Ile Ser Asp Gly Tyr Arg
195 200 205
Met Gly Leu Val Leu Lys Gly Ser Asp Cys Leu Leu Ser Lys Cys Tyr
210 215 220
His Glu Phe Gly Thr Gln Trp Leu Pro Leu Leu Glu Thr Leu His Gln
225 230 235 240
Val Pro Val Val Pro Val Gly Leu Leu Pro Pro Glu Val Pro Gly Asp
245 250 255
Glu Lys Asp Glu Thr Trp Val Ser Ile Lys Lys Trp Leu Asp Gly Lys
260 265 270
Gln Lys Gly Ser Val Val Tyr Val Ala Leu Gly Ser Glu Val Leu Val
275 280 285
Ser Gln Thr Glu Val Val Glu Leu Ala Leu Gly Leu Glu Leu Ser Gly
290 295 300
Leu Pro Phe Val Trp Ala Tyr Arg Lys Pro Lys Gly Pro Ala Lys Ser
305 310 315 320
Asp Ser Val Glu Leu Pro Asp Gly Phe Val Glu Arg Thr Arg Asp Arg
325 330 335
Gly Leu Val Trp Thr Ser Trp Ala Pro Gln Leu Arg Ile Leu Ser His
340 345 350
Glu Ser Val Cys Gly Phe Leu Thr His Cys Gly Ser Gly Ser Ile Val
355 360 365
Glu Gly Leu Met Phe Gly His Pro Leu Ile Met Leu Pro Ile Phe Gly
370 375 380
Asp Gln Pro Leu Asn Ala Arg Leu Leu Glu Asp Lys Gln Val Gly Ile
385 390 395 400
Glu Ile Pro Arg Asn Glu Glu Asp Gly Cys Leu Thr Lys Glu Ser Val
405 410 415
Ala Arg Ser Leu Arg Ser Val Val Val Glu Lys Glu Gly Glu Ile Tyr
420 425 430
Lys Ala Asn Ala Arg Glu Leu Ser Lys Ile Tyr Asn Asp Thr Lys Val
435 440 445
Glu Lys Glu Tyr Val Ser Gln Phe Val Asp Tyr Leu Glu Lys Asn Thr
450 455 460
Arg Ala Val Ala Ile Asp His Glu Ser
465 470
<210> 28
<211> 473
<212> PRT
<213> Stevia rebaudiana
<400> 28
Met Ala Thr Ser Asp Ser Ile Val Asp Asp Arg Lys Gln Leu His Val
1 5 10 15
Ala Thr Phe Pro Trp Leu Ala Phe Gly His Ile Leu Pro Tyr Leu Gln
20 25 30
Leu Ser Lys Leu Ile Ala Glu Lys Gly His Lys Val Ser Phe Leu Ser
35 40 45
Thr Thr Arg Asn Ile Gln Arg Leu Ser Ser His Ile Ser Pro Leu Ile
50 55 60
Asn Val Val Gln Leu Thr Leu Pro Arg Val Gln Glu Leu Pro Glu Asp
65 70 75 80
Ala Glu Ala Thr Thr Asp Val His Pro Glu Asp Ile Pro Tyr Leu Lys
85 90 95
Lys Ala Ser Asp Gly Leu Gln Pro Glu Val Thr Arg Phe Leu Glu Gln
100 105 110
His Ser Pro Asp Trp Ile Ile Tyr Asp Tyr Thr His Tyr Trp Leu Pro
115 120 125
Ser Ile Ala Ala Ser Leu Gly Ile Ser Arg Ala His Phe Ser Val Thr
130 135 140
Thr Pro Trp Ala Ile Ala Tyr Met Gly Pro Ser Ala Asp Ala Met Ile
145 150 155 160
Asn Gly Ser Asp Gly Arg Thr Thr Val Glu Asp Leu Thr Thr Pro Pro
165 170 175
Lys Trp Phe Pro Phe Pro Thr Lys Val Cys Trp Arg Lys His Asp Leu
180 185 190
Ala Arg Leu Val Pro Tyr Lys Ala Pro Gly Ile Ser Asp Gly Tyr Arg
195 200 205
Met Gly Leu Val Leu Lys Gly Ser Asp Cys Leu Leu Ser Lys Cys Tyr
210 215 220
His Glu Phe Gly Thr Gln Trp Leu Pro Leu Leu Glu Thr Leu His Gln
225 230 235 240
Val Pro Val Val Pro Val Gly Leu Leu Pro Pro Glu Ile Pro Gly Asp
245 250 255
Glu Lys Asp Glu Thr Trp Val Ser Ile Lys Lys Trp Leu Asp Gly Lys
260 265 270
Gln Lys Gly Ser Val Val Tyr Val Ala Leu Gly Ser Glu Val Leu Val
275 280 285
Ser Gln Thr Glu Val Val Glu Leu Ala Leu Gly Leu Glu Leu Ser Gly
290 295 300
Leu Pro Phe Val Trp Ala Tyr Arg Lys Pro Lys Gly Pro Ala Lys Ser
305 310 315 320
Asp Ser Val Glu Leu Pro Asp Gly Phe Val Glu Arg Thr Arg Asp Arg
325 330 335
Gly Leu Val Trp Thr Ser Trp Ala Pro Gln Leu Arg Ile Leu Ser His
340 345 350
Glu Ser Val Cys Gly Phe Leu Thr His Cys Gly Ser Gly Ser Ile Val
355 360 365
Glu Gly Leu Met Phe Gly His Pro Leu Ile Met Leu Pro Ile Phe Gly
370 375 380
Asp Gln Pro Leu Asn Ala Arg Leu Leu Glu Asp Lys Gln Val Gly Ile
385 390 395 400
Glu Ile Pro Arg Asn Glu Glu Asp Gly Cys Leu Thr Lys Glu Ser Val
405 410 415
Ala Arg Ser Leu Arg Ser Val Val Val Glu Lys Glu Gly Glu Ile Tyr
420 425 430
Lys Ala Asn Ala Arg Glu Leu Ser Lys Ile Tyr Asn Asp Thr Lys Val
435 440 445
Glu Lys Glu Tyr Val Ser Gln Phe Val Asp Tyr Leu Glu Lys Asn Ala
450 455 460
Arg Ala Val Ala Ile Asp His Glu Ser
465 470
<210> 29
<211> 462
<212> PRT
<213> Oryza sativa
<400> 29
Met Asp Ser Gly Tyr Ser Ser Ser Tyr Ala Ala Ala Ala Gly Met His
1 5 10 15
Val Val Ile Cys Pro Trp Leu Ala Phe Gly His Leu Leu Pro Cys Leu
20 25 30
Asp Leu Ala Gln Arg Leu Ala Ser Arg Gly His Arg Val Ser Phe Val
35 40 45
Ser Thr Pro Arg Asn Ile Ser Arg Leu Pro Pro Val Arg Pro Ala Leu
50 55 60
Ala Pro Leu Val Ala Phe Val Ala Leu Pro Leu Pro Arg Val Glu Gly
65 70 75 80
Leu Pro Asp Gly Ala Glu Ser Thr Asn Asp Val Pro His Asp Arg Pro
85 90 95
Asp Met Val Glu Leu His Arg Arg Ala Phe Asp Gly Leu Ala Ala Pro
100 105 110
Phe Ser Glu Phe Leu Gly Thr Ala Cys Ala Asp Trp Val Ile Val Asp
115 120 125
Val Phe His His Trp Ala Ala Ala Ala Ala Leu Glu His Lys Val Pro
130 135 140
Cys Ala Met Met Leu Leu Gly Ser Ala His Met Ile Ala Ser Ile Ala
145 150 155 160
Asp Arg Arg Leu Glu Arg Ala Glu Thr Glu Ser Pro Ala Ala Ala Gly
165 170 175
Gln Gly Arg Pro Ala Ala Ala Pro Thr Phe Glu Val Ala Arg Met Lys
180 185 190
Leu Ile Arg Thr Lys Gly Ser Ser Gly Met Ser Leu Ala Glu Arg Phe
195 200 205
Ser Leu Thr Leu Ser Arg Ser Ser Leu Val Val Gly Arg Ser Cys Val
210 215 220
Glu Phe Glu Pro Glu Thr Val Pro Leu Leu Ser Thr Leu Arg Gly Lys
225 230 235 240
Pro Ile Thr Phe Leu Gly Leu Met Pro Pro Leu His Glu Gly Arg Arg
245 250 255
Glu Asp Gly Glu Asp Ala Thr Val Arg Trp Leu Asp Ala Gln Pro Ala
260 265 270
Lys Ser Val Val Tyr Val Ala Leu Gly Ser Glu Val Pro Leu Gly Val
275 280 285
Glu Lys Val His Glu Leu Ala Leu Gly Leu Glu Leu Ala Gly Thr Arg
290 295 300
Phe Leu Trp Ala Leu Arg Lys Pro Thr Gly Val Ser Asp Ala Asp Leu
305 310 315 320
Leu Pro Ala Gly Phe Glu Glu Arg Thr Arg Gly Arg Gly Val Val Ala
325 330 335
Thr Arg Trp Val Pro Gln Met Ser Ile Leu Ala His Ala Ala Val Gly
340 345 350
Ala Phe Leu Thr His Cys Gly Trp Asn Ser Thr Ile Glu Gly Leu Met
355 360 365
Phe Gly His Pro Leu Ile Met Leu Pro Ile Phe Gly Asp Gln Gly Pro
370 375 380
Asn Ala Arg Leu Ile Glu Ala Lys Asn Ala Gly Leu Gln Val Ala Arg
385 390 395 400
Asn Asp Gly Asp Gly Ser Phe Asp Arg Glu Gly Val Ala Ala Ala Ile
405 410 415
Arg Ala Val Ala Val Glu Glu Glu Ser Ser Lys Val Phe Gln Ala Lys
420 425 430
Ala Lys Lys Leu Gln Glu Ile Val Ala Asp Met Ala Cys His Glu Arg
435 440 445
Tyr Ile Asp Gly Phe Ile Gln Gln Leu Arg Ser Tyr Lys Asp
450 455 460
<210> 30
<211> 463
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 30
Met Ala Glu Cys Met Asn Trp Leu Asp Asp Lys Pro Lys Glu Ser Val
1 5 10 15
Val Tyr Val Ala Phe Gly Ser Leu Val Lys His Gly Pro Glu Gln Val
20 25 30
Glu Glu Ile Thr Arg Ala Leu Ile Asp Ser Asp Val Asn Phe Leu Trp
35 40 45
Val Ile Lys His Lys Glu Glu Gly Lys Leu Pro Glu Asn Leu Ser Glu
50 55 60
Val Ile Lys Thr Gly Lys Gly Leu Ile Val Ala Trp Cys Lys Gln Leu
65 70 75 80
Asp Val Leu Ala His Glu Ser Val Gly Cys Phe Val Thr His Cys Gly
85 90 95
Phe Asn Ser Thr Leu Glu Ala Ile Ser Leu Gly Val Pro Val Val Ala
100 105 110
Met Pro Gln Phe Ser Asp Gln Thr Thr Asn Ala Lys Leu Leu Asp Glu
115 120 125
Ile Leu Gly Val Gly Val Arg Val Lys Ala Asp Glu Asn Gly Ile Val
130 135 140
Arg Arg Gly Asn Leu Ala Ser Cys Ile Lys Met Ile Met Glu Glu Glu
145 150 155 160
Arg Gly Val Ile Ile Arg Lys Asn Ala Val Lys Trp Lys Asp Leu Ala
165 170 175
Lys Val Ala Val His Glu Gly Gly Ser Ser Asp Asn Asp Ile Val Glu
180 185 190
Phe Val Ser Glu Leu Ile Lys Ala Gly Ser Gly Glu Gln Gln Lys Ile
195 200 205
Lys Lys Ser Pro His Val Leu Leu Ile Pro Phe Pro Leu Gln Gly His
210 215 220
Ile Asn Pro Phe Ile Gln Phe Gly Lys Arg Leu Ile Ser Lys Gly Val
225 230 235 240
Lys Thr Thr Leu Val Thr Thr Ile His Thr Leu Asn Ser Thr Leu Asn
245 250 255
His Ser Asn Thr Thr Thr Thr Ser Ile Glu Ile Gln Ala Ile Ser Asp
260 265 270
Gly Cys Asp Glu Gly Gly Phe Met Ser Ala Gly Glu Ser Tyr Leu Glu
275 280 285
Thr Phe Lys Gln Val Gly Ser Lys Ser Leu Ala Asp Leu Ile Lys Lys
290 295 300
Leu Gln Ser Glu Gly Thr Thr Ile Asp Ala Ile Ile Tyr Asp Ser Met
305 310 315 320
Thr Glu Trp Val Leu Asp Val Ala Ile Glu Phe Gly Ile Asp Gly Gly
325 330 335
Ser Phe Phe Thr Gln Ala Cys Val Val Asn Ser Leu Tyr Tyr His Val
340 345 350
His Lys Gly Leu Ile Ser Leu Pro Leu Gly Glu Thr Val Ser Val Pro
355 360 365
Gly Phe Pro Val Leu Gln Arg Trp Glu Thr Pro Leu Ile Leu Gln Asn
370 375 380
His Glu Gln Ile Gln Ser Pro Trp Ser Gln Met Leu Phe Gly Gln Phe
385 390 395 400
Ala Asn Ile Asp Gln Ala Arg Trp Val Phe Thr Asn Ser Phe Tyr Lys
405 410 415
Leu Glu Glu Glu Val Ile Glu Trp Thr Arg Lys Ile Trp Asn Leu Lys
420 425 430
Val Ile Gly Pro Thr Leu Pro Ser Met Tyr Leu Asp Lys Arg Leu Asp
435 440 445
Asp Asp Lys Asp Asn Gly Phe Asn Leu Tyr Lys Ala Asn His His
450 455 460
<210> 31
<211> 463
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 31
Met Ala Asn His His Glu Cys Met Asn Trp Leu Asp Asp Lys Pro Lys
1 5 10 15
Glu Ser Val Val Tyr Val Ala Phe Gly Ser Leu Val Lys His Gly Pro
20 25 30
Glu Gln Val Glu Glu Ile Thr Arg Ala Leu Ile Asp Ser Asp Val Asn
35 40 45
Phe Leu Trp Val Ile Lys His Lys Glu Glu Gly Lys Leu Pro Glu Asn
50 55 60
Leu Ser Glu Val Ile Lys Thr Gly Lys Gly Leu Ile Val Ala Trp Cys
65 70 75 80
Lys Gln Leu Asp Val Leu Ala His Glu Ser Val Gly Cys Phe Val Thr
85 90 95
His Cys Gly Phe Asn Ser Thr Leu Glu Ala Ile Ser Leu Gly Val Pro
100 105 110
Val Val Ala Met Pro Gln Phe Ser Asp Gln Thr Thr Asn Ala Lys Leu
115 120 125
Leu Asp Glu Ile Leu Gly Val Gly Val Arg Val Lys Ala Asp Glu Asn
130 135 140
Gly Ile Val Arg Arg Gly Asn Leu Ala Ser Cys Ile Lys Met Ile Met
145 150 155 160
Glu Glu Glu Arg Gly Val Ile Ile Arg Lys Asn Ala Val Lys Trp Lys
165 170 175
Asp Leu Ala Lys Val Ala Val His Glu Gly Gly Ser Ser Asp Asn Asp
180 185 190
Ile Val Glu Phe Val Ser Glu Leu Ile Lys Ala Gly Ser Gly Glu Gln
195 200 205
Gln Lys Ile Lys Lys Ser Pro His Val Leu Leu Ile Pro Phe Pro Leu
210 215 220
Gln Gly His Ile Asn Pro Phe Ile Gln Phe Gly Lys Arg Leu Ile Ser
225 230 235 240
Lys Gly Val Lys Thr Thr Leu Val Thr Thr Ile His Thr Leu Asn Ser
245 250 255
Thr Leu Asn His Ser Asn Thr Thr Thr Thr Ser Ile Glu Ile Gln Ala
260 265 270
Ile Ser Asp Gly Cys Asp Glu Gly Gly Phe Met Ser Ala Gly Glu Ser
275 280 285
Tyr Leu Glu Thr Phe Lys Gln Val Gly Ser Lys Ser Leu Ala Asp Leu
290 295 300
Ile Lys Lys Leu Gln Ser Glu Gly Thr Thr Ile Asp Ala Ile Ile Tyr
305 310 315 320
Asp Ser Met Thr Glu Trp Val Leu Asp Val Ala Ile Glu Phe Gly Ile
325 330 335
Asp Gly Gly Ser Phe Phe Thr Gln Ala Cys Val Val Asn Ser Leu Tyr
340 345 350
Tyr His Val His Lys Gly Leu Ile Ser Leu Pro Leu Gly Glu Thr Val
355 360 365
Ser Val Pro Gly Phe Pro Val Leu Gln Arg Trp Glu Thr Pro Leu Ile
370 375 380
Leu Gln Asn His Glu Gln Ile Gln Ser Pro Trp Ser Gln Met Leu Phe
385 390 395 400
Gly Gln Phe Ala Asn Ile Asp Gln Ala Arg Trp Val Phe Thr Asn Ser
405 410 415
Phe Tyr Lys Leu Glu Glu Glu Val Ile Glu Trp Thr Arg Lys Ile Trp
420 425 430
Asn Leu Lys Val Ile Gly Pro Thr Leu Pro Ser Met Tyr Leu Asp Lys
435 440 445
Arg Leu Asp Asp Asp Lys Asp Asn Gly Phe Asn Leu Tyr Lys Ala
450 455 460
<210> 32
<211> 482
<212> PRT
<213> Stevia rebaudiana
<400> 32
Met Ala Asp Ala Met Ala Thr Thr Glu Lys Lys Pro His Val Ile Phe
1 5 10 15
Ile Pro Phe Pro Ala Gln Ser His Ile Lys Ala Met Leu Lys Leu Ala
20 25 30
Gln Leu Leu His His Lys Gly Leu Gln Ile Thr Phe Val Asn Thr Asp
35 40 45
Phe Ile His Asn Gln Phe Leu Glu Ser Ser Gly Pro His Cys Leu Asp
50 55 60
Gly Ala Pro Gly Phe Arg Phe Glu Thr Ile Pro Asp Gly Val Ser His
65 70 75 80
Ser Pro Glu Ala Ser Ile Pro Ile Arg Glu Ser Leu Leu Arg Ser Ile
85 90 95
Glu Thr Asn Phe Leu Asp Arg Phe Ile Asp Leu Val Thr Lys Leu Pro
100 105 110
Asp Pro Pro Thr Cys Ile Ile Ser Asp Gly Phe Leu Ser Val Phe Thr
115 120 125
Ile Asp Ala Ala Lys Lys Leu Gly Ile Pro Val Met Met Tyr Trp Thr
130 135 140
Leu Ala Ala Cys Gly Phe Met Gly Phe Tyr His Ile His Ser Leu Ile
145 150 155 160
Glu Lys Gly Phe Ala Pro Leu Lys Asp Ala Ser Tyr Leu Thr Asn Gly
165 170 175
Tyr Leu Asp Thr Val Ile Asp Trp Val Pro Gly Met Glu Gly Ile Arg
180 185 190
Leu Lys Asp Phe Pro Leu Asp Trp Ser Thr Asp Leu Asn Asp Lys Val
195 200 205
Leu Met Phe Thr Thr Glu Ala Thr Gln Arg Ser His Lys Val Ser His
210 215 220
His Ile Phe His Thr Phe Asp Glu Leu Glu Pro Ser Ile Ile Lys Thr
225 230 235 240
Leu Ser Leu Arg Tyr Asn His Ile Tyr Thr Ile Gly Pro Leu Gln Leu
245 250 255
Leu Leu Asp Gln Ile Pro Glu Glu Lys Lys Gln Thr Gly Ile Thr Ser
260 265 270
Leu His Gly Tyr Ser Leu Val Lys Glu Glu Pro Glu Cys Phe Gln Trp
275 280 285
Leu Gln Ser Lys Glu Pro Asn Ser Val Val Tyr Val Asn Phe Gly Ser
290 295 300
Thr Thr Val Met Ser Leu Glu Asp Met Thr Glu Phe Gly Trp Gly Leu
305 310 315 320
Ala Asn Ser Asn His Tyr Phe Leu Trp Ile Ile Arg Ser Asn Leu Val
325 330 335
Ile Gly Glu Asn Ala Val Leu Pro Pro Glu Leu Glu Glu His Ile Lys
340 345 350
Lys Arg Gly Phe Ile Ala Ser Trp Cys Ser Gln Glu Lys Val Leu Lys
355 360 365
His Pro Ser Val Gly Gly Phe Leu Thr His Cys Gly Trp Gly Ser Thr
370 375 380
Ile Glu Ser Leu Ser Ala Gly Val Pro Met Ile Cys Trp Pro Tyr Ser
385 390 395 400
Trp Asp Gln Leu Thr Asn Cys Arg Tyr Ile Cys Lys Glu Trp Glu Val
405 410 415
Gly Leu Glu Met Gly Thr Lys Val Lys Arg Asp Glu Val Lys Arg Leu
420 425 430
Val Gln Glu Leu Met Gly Glu Gly Gly His Lys Met Arg Asn Lys Ala
435 440 445
Lys Asp Trp Lys Glu Lys Ala Arg Ile Ala Ile Ala Pro Asn Gly Ser
450 455 460
Ser Ser Leu Asn Ile Asp Lys Met Val Lys Glu Ile Thr Val Leu Ala
465 470 475 480
Arg Asn
<210> 33
<211> 523
<212> PRT
<213> Siraitia grosvenorii
<400> 33
Met Glu Asp Arg Asn Ala Met Asp Met Ser Arg Ile Lys Tyr Arg Pro
1 5 10 15
Gln Pro Leu Arg Pro Ala Ser Met Val Gln Pro Arg Val Leu Leu Phe
20 25 30
Pro Phe Pro Ala Leu Gly His Val Lys Pro Phe Leu Ser Leu Ala Glu
35 40 45
Leu Leu Ser Asp Ala Gly Ile Asp Val Val Phe Leu Ser Thr Glu Tyr
50 55 60
Asn His Arg Arg Ile Ser Asn Thr Glu Ala Leu Ala Ser Arg Phe Pro
65 70 75 80
Thr Leu His Phe Glu Thr Ile Pro Asp Gly Leu Pro Pro Asn Glu Ser
85 90 95
Arg Ala Leu Ala Asp Gly Pro Leu Tyr Phe Ser Met Arg Glu Gly Thr
100 105 110
Lys Pro Arg Phe Arg Gln Leu Ile Gln Ser Leu Asn Asp Gly Arg Trp
115 120 125
Pro Ile Thr Cys Ile Ile Thr Asp Ile Met Leu Ser Ser Pro Ile Glu
130 135 140
Val Ala Glu Glu Phe Gly Ile Pro Val Ile Ala Phe Cys Pro Cys Ser
145 150 155 160
Ala Arg Tyr Leu Ser Ile His Phe Phe Ile Pro Lys Leu Val Glu Glu
165 170 175
Gly Gln Ile Pro Tyr Ala Asp Asp Asp Pro Ile Gly Glu Ile Gln Gly
180 185 190
Val Pro Leu Phe Glu Gly Leu Leu Arg Arg Asn His Leu Pro Gly Ser
195 200 205
Trp Ser Asp Lys Ser Ala Asp Ile Ser Phe Ser His Gly Leu Ile Asn
210 215 220
Gln Thr Leu Ala Ala Gly Arg Ala Ser Ala Leu Ile Leu Asn Thr Phe
225 230 235 240
Asp Glu Leu Glu Ala Pro Phe Leu Thr His Leu Ser Ser Ile Phe Asn
245 250 255
Lys Ile Tyr Thr Ile Gly Pro Leu His Ala Leu Ser Lys Ser Arg Leu
260 265 270
Gly Asp Ser Ser Ser Ser Ala Ser Ala Leu Ser Gly Phe Trp Lys Glu
275 280 285
Asp Arg Ala Cys Met Ser Trp Leu Asp Cys Gln Pro Pro Arg Ser Val
290 295 300
Val Phe Val Ser Phe Gly Ser Thr Met Lys Met Lys Ala Asp Glu Leu
305 310 315 320
Arg Glu Phe Trp Tyr Gly Leu Val Ser Ser Gly Lys Pro Phe Leu Cys
325 330 335
Val Leu Arg Ser Asp Val Val Ser Gly Gly Glu Ala Ala Glu Leu Ile
340 345 350
Glu Gln Met Ala Glu Glu Glu Gly Ala Gly Gly Lys Leu Gly Met Val
355 360 365
Val Glu Trp Ala Ala Gln Glu Lys Val Leu Ser His Pro Ala Val Gly
370 375 380
Gly Phe Leu Thr His Cys Gly Trp Asn Ser Thr Val Glu Ser Ile Ala
385 390 395 400
Ala Gly Val Pro Met Met Cys Trp Pro Ile Leu Gly Asp Gln Pro Ser
405 410 415
Asn Ala Thr Trp Ile Asp Arg Val Trp Lys Ile Gly Val Glu Arg Asn
420 425 430
Asn Arg Glu Trp Asp Arg Leu Thr Val Glu Lys Met Val Arg Ala Leu
435 440 445
Met Glu Gly Gln Lys Arg Val Glu Ile Gln Arg Ser Met Glu Lys Leu
450 455 460
Ser Lys Leu Ala Asn Glu Lys Val Val Arg Gly Ile Asn Leu His Pro
465 470 475 480
Thr Ile Ser Leu Lys Lys Asp Thr Pro Thr Thr Ser Glu His Pro Arg
485 490 495
His Glu Phe Glu Asn Met Arg Gly Met Asn Tyr Glu Met Leu Val Gly
500 505 510
Asn Ala Ile Lys Ser Pro Thr Leu Thr Lys Lys
515 520
<210> 34
<211> 473
<212> PRT
<213> Siraitia grosvenorii
<400> 34
Met Thr Ile Phe Phe Ser Val Glu Ile Leu Val Leu Gly Ile Ala Glu
1 5 10 15
Phe Ala Ala Ile Ala Met Asp Ala Ala Gln Gln Gly Asp Thr Thr Thr
20 25 30
Ile Leu Met Leu Pro Trp Leu Gly Tyr Gly His Leu Ser Ala Phe Leu
35 40 45
Glu Leu Ala Lys Ser Leu Ser Arg Arg Asn Phe His Ile Tyr Phe Cys
50 55 60
Ser Thr Ser Val Asn Leu Asp Ala Ile Lys Pro Lys Leu Pro Ser Ser
65 70 75 80
Phe Ser Asp Ser Ile Gln Phe Val Glu Leu His Leu Pro Ser Ser Pro
85 90 95
Glu Phe Pro Pro His Leu His Thr Thr Asn Gly Leu Pro Pro Thr Leu
100 105 110
Met Pro Ala Leu His Gln Ala Phe Ser Met Ala Ala Gln His Phe Glu
115 120 125
Ser Ile Leu Gln Thr Leu Ala Pro His Leu Leu Ile Tyr Asp Ser Leu
130 135 140
Gln Pro Trp Ala Pro Arg Val Ala Ser Ser Leu Lys Ile Pro Ala Ile
145 150 155 160
Asn Phe Asn Thr Thr Gly Val Phe Val Ile Ser Gln Gly Leu His Pro
165 170 175
Ile His Tyr Pro His Ser Lys Phe Pro Phe Ser Glu Phe Val Leu His
180 185 190
Asn His Trp Lys Ala Met Tyr Ser Thr Ala Asp Gly Ala Ser Thr Glu
195 200 205
Arg Thr Arg Lys Arg Gly Glu Ala Phe Leu Tyr Cys Leu His Ala Ser
210 215 220
Cys Ser Val Ile Leu Ile Asn Ser Phe Arg Glu Leu Glu Gly Lys Tyr
225 230 235 240
Met Asp Tyr Leu Ser Val Leu Leu Asn Lys Lys Val Val Pro Val Gly
245 250 255
Pro Leu Val Tyr Glu Pro Asn Gln Asp Gly Glu Asp Glu Gly Tyr Ser
260 265 270
Ser Ile Lys Asn Trp Leu Asp Lys Lys Glu Pro Ser Ser Thr Val Phe
275 280 285
Val Ser Phe Gly Ser Glu Tyr Phe Pro Ser Lys Glu Glu Met Glu Glu
290 295 300
Ile Ala His Gly Leu Glu Ala Ser Glu Val Asn Phe Ile Trp Val Val
305 310 315 320
Arg Phe Pro Gln Gly Asp Asn Thr Ser Gly Ile Glu Asp Ala Leu Pro
325 330 335
Lys Gly Phe Leu Glu Arg Ala Gly Glu Arg Gly Met Val Val Lys Gly
340 345 350
Trp Ala Pro Gln Ala Lys Ile Leu Lys His Trp Ser Thr Gly Gly Phe
355 360 365
Val Ser His Cys Gly Trp Asn Ser Val Met Glu Ser Met Met Phe Gly
370 375 380
Val Pro Ile Ile Gly Val Pro Met His Val Asp Gln Pro Phe Asn Ala
385 390 395 400
Gly Leu Val Glu Glu Ala Gly Val Gly Val Glu Ala Lys Arg Asp Pro
405 410 415
Asp Gly Lys Ile Gln Arg Asp Glu Val Ala Lys Leu Ile Lys Glu Val
420 425 430
Val Val Glu Lys Thr Arg Glu Asp Val Arg Lys Lys Ala Arg Glu Met
435 440 445
Ser Glu Ile Leu Arg Ser Lys Gly Glu Glu Lys Phe Asp Glu Met Val
450 455 460
Ala Glu Ile Ser Leu Leu Leu Lys Ile
465 470
<210> 35
<211> 460
<212> PRT
<213> Siraitia grosvenorii
<400> 35
Met Asp Glu Thr Thr Val Asn Gly Gly Arg Arg Ala Ser Asp Val Val
1 5 10 15
Val Phe Ala Phe Pro Arg His Gly His Met Ser Pro Met Leu Gln Phe
20 25 30
Ser Lys Arg Leu Val Ser Lys Gly Leu Arg Val Thr Phe Leu Ile Thr
35 40 45
Thr Ser Ala Thr Glu Ser Leu Arg Leu Asn Leu Pro Pro Ser Ser Ser
50 55 60
Leu Asp Leu Gln Val Ile Ser Asp Val Pro Glu Ser Asn Asp Ile Ala
65 70 75 80
Thr Leu Glu Gly Tyr Leu Arg Ser Phe Lys Ala Thr Val Ser Lys Thr
85 90 95
Leu Ala Asp Phe Ile Asp Gly Ile Gly Asn Pro Pro Lys Phe Ile Val
100 105 110
Tyr Asp Ser Val Met Pro Trp Val Gln Glu Val Ala Arg Gly Arg Gly
115 120 125
Leu Asp Ala Ala Pro Phe Phe Thr Gln Ser Ser Ala Val Asn His Ile
130 135 140
Leu Asn His Val Tyr Gly Gly Ser Leu Ser Ile Pro Ala Pro Glu Asn
145 150 155 160
Thr Ala Val Ser Leu Pro Ser Met Pro Val Leu Gln Ala Glu Asp Leu
165 170 175
Pro Ala Phe Pro Asp Asp Pro Glu Val Val Met Asn Phe Met Thr Ser
180 185 190
Gln Phe Ser Asn Phe Gln Asp Ala Lys Trp Ile Phe Phe Asn Thr Phe
195 200 205
Asp Gln Leu Glu Cys Lys Lys Gln Ser Gln Val Val Asn Trp Met Ala
210 215 220
Asp Arg Trp Pro Ile Lys Thr Val Gly Pro Thr Ile Pro Ser Ala Tyr
225 230 235 240
Leu Asp Asp Gly Arg Leu Glu Asp Asp Arg Ala Phe Gly Leu Asn Leu
245 250 255
Leu Lys Pro Glu Asp Gly Lys Asn Thr Arg Gln Trp Gln Trp Leu Asp
260 265 270
Ser Lys Asp Thr Ala Ser Val Leu Tyr Ile Ser Phe Gly Ser Leu Ala
275 280 285
Ile Leu Gln Glu Glu Gln Val Lys Glu Leu Ala Tyr Phe Leu Lys Asp
290 295 300
Thr Asn Leu Ser Phe Leu Trp Val Leu Arg Asp Ser Glu Leu Gln Lys
305 310 315 320
Leu Pro His Asn Phe Val Gln Glu Thr Ser His Arg Gly Leu Val Val
325 330 335
Asn Trp Cys Ser Gln Leu Gln Val Leu Ser His Arg Ala Val Ser Cys
340 345 350
Phe Val Thr His Cys Gly Trp Asn Ser Thr Leu Glu Ala Leu Ser Leu
355 360 365
Gly Val Pro Met Val Ala Ile Pro Gln Trp Val Asp Gln Thr Thr Asn
370 375 380
Ala Lys Phe Val Ala Asp Val Trp Arg Val Gly Val Arg Val Lys Lys
385 390 395 400
Lys Asp Glu Arg Ile Val Thr Lys Glu Glu Leu Glu Ala Ser Ile Arg
405 410 415
Gln Val Val Gln Gly Glu Gly Arg Asn Glu Phe Lys His Asn Ala Ile
420 425 430
Lys Trp Lys Lys Leu Ala Lys Glu Ala Val Asp Glu Gly Gly Ser Ser
435 440 445
Asp Lys Asn Ile Glu Glu Phe Val Lys Thr Ile Ala
450 455 460
<210> 36
<211> 486
<212> PRT
<213> Siraitia grosvenorii
<400> 36
Met Gly Asp Asn Gly Asp Gly Gly Glu Lys Lys Glu Leu Lys Glu Asn
1 5 10 15
Val Lys Lys Gly Lys Glu Leu Gly Arg Gln Ala Ile Gly Glu Gly Tyr
20 25 30
Ile Asn Pro Ser Leu Gln Leu Ala Arg Arg Leu Ile Ser Leu Gly Val
35 40 45
Asn Val Thr Phe Ala Thr Thr Val Leu Ala Gly Arg Arg Met Lys Asn
50 55 60
Lys Thr His Gln Thr Ala Thr Thr Pro Gly Leu Ser Phe Ala Thr Phe
65 70 75 80
Ser Asp Gly Phe Asp Asp Glu Thr Leu Lys Pro Asn Gly Asp Leu Thr
85 90 95
His Tyr Phe Ser Glu Leu Arg Arg Cys Gly Ser Glu Ser Leu Thr His
100 105 110
Leu Ile Thr Ser Ala Ala Asn Glu Gly Arg Pro Ile Thr Phe Val Ile
115 120 125
Tyr Ser Leu Leu Leu Ser Trp Ala Ala Asp Ile Ala Ser Thr Tyr Asp
130 135 140
Ile Pro Ser Ala Leu Phe Phe Ala Gln Pro Ala Thr Val Leu Ala Leu
145 150 155 160
Tyr Phe Tyr Tyr Phe His Gly Tyr Gly Asp Thr Ile Cys Ser Lys Leu
165 170 175
Gln Asp Pro Ser Ser Tyr Ile Glu Leu Pro Gly Leu Pro Leu Leu Thr
180 185 190
Ser Gln Asp Met Pro Ser Phe Phe Ser Pro Ser Gly Pro His Ala Phe
195 200 205
Ile Leu Pro Pro Met Arg Glu Gln Ala Glu Phe Leu Gly Arg Gln Ser
210 215 220
Gln Pro Lys Val Leu Val Asn Thr Phe Asp Ala Leu Glu Ala Asp Ala
225 230 235 240
Leu Arg Ala Ile Asp Lys Leu Lys Met Leu Ala Ile Gly Pro Leu Ile
245 250 255
Pro Ser Ala Leu Leu Gly Gly Asn Asp Ser Ser Asp Ala Ser Phe Cys
260 265 270
Gly Asp Leu Phe Gln Val Ser Ser Glu Asp Tyr Ile Glu Trp Leu Asn
275 280 285
Ser Lys Pro Asp Ser Ser Val Val Tyr Ile Ser Val Gly Ser Ile Cys
290 295 300
Val Leu Ser Asp Glu Gln Glu Asp Glu Leu Val His Ala Leu Leu Asn
305 310 315 320
Ser Gly His Thr Phe Leu Trp Val Lys Arg Ser Lys Glu Asn Asn Glu
325 330 335
Gly Val Lys Gln Glu Thr Asp Glu Glu Lys Leu Lys Lys Leu Glu Glu
340 345 350
Gln Gly Lys Met Val Ser Trp Cys Arg Gln Val Glu Val Leu Lys His
355 360 365
Pro Ala Leu Gly Cys Phe Leu Thr His Cys Gly Trp Asn Ser Thr Ile
370 375 380
Glu Ser Leu Val Ser Gly Leu Pro Val Val Ala Phe Pro Gln Gln Ile
385 390 395 400
Asp Gln Ala Thr Asn Ala Lys Leu Ile Glu Asp Val Trp Lys Thr Gly
405 410 415
Val Arg Val Lys Ala Asn Thr Glu Gly Ile Val Glu Arg Glu Glu Ile
420 425 430
Arg Arg Cys Leu Asp Leu Val Met Gly Ser Arg Asp Gly Gln Lys Glu
435 440 445
Glu Ile Glu Arg Asn Ala Lys Lys Trp Lys Glu Leu Ala Arg Gln Ala
450 455 460
Ile Gly Glu Gly Gly Ser Ser Asp Ser Asn Leu Lys Thr Phe Leu Trp
465 470 475 480
Glu Ile Asp Leu Glu Ile
485
<210> 37
<211> 485
<212> PRT
<213> Siraitia grosvenorii
<400> 37
Met Ala Glu Gln Ala His Asp Leu Leu His Val Leu Leu Phe Pro Phe
1 5 10 15
Pro Ala Glu Gly His Ile Lys Pro Phe Leu Cys Leu Ala Glu Leu Leu
20 25 30
Cys Asn Ala Gly Phe His Val Thr Phe Leu Asn Thr Asp Tyr Asn His
35 40 45
Arg Arg Leu His Asn Leu His Leu Leu Ala Ala Arg Phe Pro Ser Leu
50 55 60
His Phe Glu Ser Ile Ser Asp Gly Leu Pro Pro Asp Gln Pro Arg Asp
65 70 75 80
Ile Leu Asp Pro Lys Phe Phe Ile Ser Ile Cys Gln Val Thr Lys Pro
85 90 95
Leu Phe Arg Glu Leu Leu Leu Ser Tyr Lys Arg Ile Ser Ser Val Gln
100 105 110
Thr Gly Arg Pro Pro Ile Thr Cys Val Ile Thr Asp Val Ile Phe Arg
115 120 125
Phe Pro Ile Asp Val Ala Glu Glu Leu Asp Ile Pro Val Phe Ser Phe
130 135 140
Cys Thr Phe Ser Ala Arg Phe Met Phe Leu Tyr Phe Trp Ile Pro Lys
145 150 155 160
Leu Ile Glu Asp Gly Gln Leu Pro Tyr Pro Asn Gly Asn Ile Asn Gln
165 170 175
Lys Leu Tyr Gly Val Ala Pro Glu Ala Glu Gly Leu Leu Arg Cys Lys
180 185 190
Asp Leu Pro Gly His Trp Ala Phe Ala Asp Glu Leu Lys Asp Asp Gln
195 200 205
Leu Asn Phe Val Asp Gln Thr Thr Ala Ser Ser Arg Ser Ser Gly Leu
210 215 220
Ile Leu Asn Thr Phe Asp Asp Leu Glu Ala Pro Phe Leu Gly Arg Leu
225 230 235 240
Ser Thr Ile Phe Lys Lys Ile Tyr Ala Val Gly Pro Ile His Ser Leu
245 250 255
Leu Asn Ser His His Cys Gly Leu Trp Lys Glu Asp His Ser Cys Leu
260 265 270
Ala Trp Leu Asp Ser Arg Ala Ala Lys Ser Val Val Phe Val Ser Phe
275 280 285
Gly Ser Leu Val Lys Ile Thr Ser Arg Gln Leu Met Glu Phe Trp His
290 295 300
Gly Leu Leu Asn Ser Gly Lys Ser Phe Leu Phe Val Leu Arg Ser Asp
305 310 315 320
Val Val Glu Gly Asp Asp Glu Lys Gln Val Val Lys Glu Ile Tyr Glu
325 330 335
Thr Lys Ala Glu Gly Lys Trp Leu Val Val Gly Trp Ala Pro Gln Glu
340 345 350
Lys Val Leu Ala His Glu Ala Val Gly Gly Phe Leu Thr His Ser Gly
355 360 365
Trp Asn Ser Ile Leu Glu Ser Ile Ala Ala Gly Val Pro Met Ile Ser
370 375 380
Cys Pro Lys Ile Gly Asp Gln Ser Ser Asn Cys Thr Trp Ile Ser Lys
385 390 395 400
Val Trp Lys Ile Gly Leu Glu Met Glu Asp Arg Tyr Asp Arg Val Ser
405 410 415
Val Glu Thr Met Val Arg Ser Ile Met Glu Gln Glu Gly Glu Lys Met
420 425 430
Gln Lys Thr Ile Ala Glu Leu Ala Lys Gln Ala Lys Tyr Lys Val Ser
435 440 445
Lys Asp Gly Thr Ser Tyr Gln Asn Leu Glu Cys Leu Ile Gln Asp Ile
450 455 460
Lys Lys Leu Asn Gln Ile Glu Gly Phe Ile Asn Asn Pro Asn Phe Ser
465 470 475 480
Asp Leu Leu Arg Val
485
<210> 38
<211> 473
<212> PRT
<213> Siraitia grosvenorii
<400> 38
Met Asp Ala Gln Gln Gly His Thr Thr Thr Ile Leu Met Leu Pro Trp
1 5 10 15
Val Gly Tyr Gly His Leu Leu Pro Phe Leu Glu Leu Ala Lys Ser Leu
20 25 30
Ser Arg Arg Lys Leu Phe His Ile Tyr Phe Cys Ser Thr Ser Val Ser
35 40 45
Leu Asp Ala Ile Lys Pro Lys Leu Pro Pro Ser Ile Ser Ser Asp Asp
50 55 60
Ser Ile Gln Leu Val Glu Leu Arg Leu Pro Ser Ser Pro Glu Leu Pro
65 70 75 80
Pro His Leu His Thr Thr Asn Gly Leu Pro Ser His Leu Met Pro Ala
85 90 95
Leu His Gln Ala Phe Val Met Ala Ala Gln His Phe Gln Val Ile Leu
100 105 110
Gln Thr Leu Ala Pro His Leu Leu Ile Tyr Asp Ile Leu Gln Pro Trp
115 120 125
Ala Pro Gln Val Ala Ser Ser Leu Asn Ile Pro Ala Ile Asn Phe Ser
130 135 140
Thr Thr Gly Ala Ser Met Leu Ser Arg Thr Leu His Pro Thr His Tyr
145 150 155 160
Pro Ser Ser Lys Phe Pro Ile Ser Glu Phe Val Leu His Asn His Trp
165 170 175
Arg Ala Met Tyr Thr Thr Ala Asp Gly Ala Leu Thr Glu Glu Gly His
180 185 190
Lys Ile Glu Glu Thr Leu Ala Asn Cys Leu His Thr Ser Cys Gly Val
195 200 205
Val Leu Val Asn Ser Phe Arg Glu Leu Glu Thr Lys Tyr Ile Asp Tyr
210 215 220
Leu Ser Val Leu Leu Asn Lys Lys Val Val Pro Val Gly Pro Leu Val
225 230 235 240
Tyr Glu Pro Asn Gln Glu Gly Glu Asp Glu Gly Tyr Ser Ser Ile Lys
245 250 255
Asn Trp Leu Asp Lys Lys Glu Pro Ser Ser Thr Val Phe Val Ser Phe
260 265 270
Gly Thr Glu Tyr Phe Pro Ser Lys Glu Glu Met Glu Glu Ile Ala Tyr
275 280 285
Gly Leu Glu Leu Ser Glu Val Asn Phe Ile Trp Val Leu Arg Phe Pro
290 295 300
Gln Gly Asp Ser Thr Ser Thr Ile Glu Asp Ala Leu Pro Lys Gly Phe
305 310 315 320
Leu Glu Arg Ala Gly Glu Arg Ala Met Val Val Lys Gly Trp Ala Pro
325 330 335
Gln Ala Lys Ile Leu Lys His Trp Ser Thr Gly Gly Leu Val Ser His
340 345 350
Cys Gly Trp Asn Ser Met Met Glu Gly Met Met Phe Gly Val Pro Ile
355 360 365
Ile Ala Val Pro Met His Leu Asp Gln Pro Phe Asn Ala Gly Leu Val
370 375 380
Glu Glu Ala Gly Val Gly Val Glu Ala Lys Arg Asp Ser Asp Gly Lys
385 390 395 400
Ile Gln Arg Glu Glu Val Ala Lys Ser Ile Lys Glu Val Val Ile Glu
405 410 415
Lys Thr Arg Glu Asp Val Arg Lys Lys Ala Arg Glu Met Asp Thr Lys
420 425 430
His Gly Pro Thr Tyr Phe Ser Arg Ser Lys Val Ser Ser Phe Gly Arg
435 440 445
Leu Tyr Lys Ile Asn Arg Pro Thr Thr Leu Thr Val Gly Arg Phe Trp
450 455 460
Ser Lys Gln Ile Lys Met Lys Arg Glu
465 470
<210> 39
<211> 453
<212> PRT
<213> Siraitia grosvenorii
<400> 39
Met Asp Ala Gln Arg Gly His Thr Thr Thr Ile Leu Met Phe Pro Trp
1 5 10 15
Leu Gly Tyr Gly His Leu Ser Ala Phe Leu Glu Leu Ala Lys Ser Leu
20 25 30
Ser Arg Arg Asn Phe His Ile Tyr Phe Cys Ser Thr Ser Val Asn Leu
35 40 45
Asp Ala Ile Lys Pro Lys Leu Pro Ser Ser Ser Ser Ser Asp Ser Ile
50 55 60
Gln Leu Val Glu Leu Cys Leu Pro Ser Ser Pro Asp Gln Leu Pro Pro
65 70 75 80
His Leu His Thr Thr Asn Ala Leu Pro Pro His Leu Met Pro Thr Leu
85 90 95
His Gln Ala Phe Ser Met Ala Ala Gln His Phe Ala Ala Ile Leu His
100 105 110
Thr Leu Ala Pro His Leu Leu Ile Tyr Asp Ser Phe Gln Pro Trp Ala
115 120 125
Pro Gln Leu Ala Ser Ser Leu Asn Ile Pro Ala Ile Asn Phe Asn Thr
130 135 140
Thr Gly Ala Ser Val Leu Thr Arg Met Leu His Ala Thr His Tyr Pro
145 150 155 160
Ser Ser Lys Phe Pro Ile Ser Glu Phe Val Leu His Asp Tyr Trp Lys
165 170 175
Ala Met Tyr Ser Ala Ala Gly Gly Ala Val Thr Lys Lys Asp His Lys
180 185 190
Ile Gly Glu Thr Leu Ala Asn Cys Leu His Ala Ser Cys Ser Val Ile
195 200 205
Leu Ile Asn Ser Phe Arg Glu Leu Glu Glu Lys Tyr Met Asp Tyr Leu
210 215 220
Ser Val Leu Leu Asn Lys Lys Val Val Pro Val Gly Pro Leu Val Tyr
225 230 235 240
Glu Pro Asn Gln Asp Gly Glu Asp Glu Gly Tyr Ser Ser Ile Lys Asn
245 250 255
Trp Leu Asp Lys Lys Glu Pro Ser Ser Thr Val Phe Val Ser Phe Gly
260 265 270
Ser Glu Tyr Phe Pro Ser Lys Glu Glu Met Glu Glu Ile Ala His Gly
275 280 285
Leu Glu Ala Ser Glu Val His Phe Ile Trp Val Val Arg Phe Pro Gln
290 295 300
Gly Asp Asn Thr Ser Ala Ile Glu Asp Ala Leu Pro Lys Gly Phe Leu
305 310 315 320
Glu Arg Val Gly Glu Arg Gly Met Val Val Lys Gly Trp Ala Pro Gln
325 330 335
Ala Lys Ile Leu Lys His Trp Ser Thr Gly Gly Phe Val Ser His Cys
340 345 350
Gly Trp Asn Ser Val Met Glu Ser Met Met Phe Gly Val Pro Ile Ile
355 360 365
Gly Val Pro Met His Leu Asp Gln Pro Phe Asn Ala Gly Leu Ala Glu
370 375 380
Glu Ala Gly Val Gly Val Glu Ala Lys Arg Asp Pro Asp Gly Lys Ile
385 390 395 400
Gln Arg Asp Glu Val Ala Lys Leu Ile Lys Glu Val Val Val Glu Lys
405 410 415
Thr Arg Glu Asp Val Arg Lys Lys Ala Arg Glu Met Ser Glu Ile Leu
420 425 430
Arg Ser Lys Gly Glu Glu Lys Met Asp Glu Met Val Ala Ala Ile Ser
435 440 445
Leu Phe Leu Lys Ile
450
<210> 40
<211> 472
<212> PRT
<213> Momordica charantia
<400> 40
Met Ala Gln Pro Gln Thr Gln Ala Arg Val Leu Val Phe Pro Tyr Pro
1 5 10 15
Thr Val Gly His Ile Lys Pro Phe Leu Ser Leu Ala Glu Leu Leu Ala
20 25 30
Asp Gly Gly Leu Asp Val Val Phe Leu Ser Thr Glu Tyr Asn His Arg
35 40 45
Arg Ile Pro Asn Leu Glu Ala Leu Ala Ser Arg Phe Pro Thr Leu His
50 55 60
Phe Asp Thr Ile Pro Asp Gly Leu Pro Ile Asp Lys Pro Arg Val Ile
65 70 75 80
Ile Gly Gly Glu Leu Tyr Thr Ser Met Arg Asp Gly Val Lys Gln Arg
85 90 95
Leu Arg Gln Val Leu Gln Ser Tyr Asn Asp Gly Ser Ser Pro Ile Thr
100 105 110
Cys Val Ile Cys Asp Val Met Leu Ser Gly Pro Ile Glu Ala Ala Glu
115 120 125
Glu Leu Gly Ile Pro Val Val Thr Phe Cys Pro Tyr Ser Ala Arg Tyr
130 135 140
Leu Cys Ala His Phe Val Met Pro Lys Leu Ile Glu Glu Gly Gln Ile
145 150 155 160
Pro Phe Thr Asp Gly Asn Leu Ala Gly Glu Ile Gln Gly Val Pro Leu
165 170 175
Phe Gly Gly Leu Leu Arg Arg Asp His Leu Pro Gly Phe Trp Phe Val
180 185 190
Lys Ser Leu Ser Asp Glu Val Trp Ser His Ala Phe Leu Asn Gln Thr
195 200 205
Leu Ala Val Gly Arg Thr Ser Ala Leu Ile Ile Asn Thr Leu Asp Glu
210 215 220
Leu Glu Ala Pro Phe Leu Ala His Leu Ser Ser Thr Phe Asp Lys Ile
225 230 235 240
Tyr Pro Ile Gly Pro Leu Asp Ala Leu Ser Lys Ser Arg Leu Gly Asp
245 250 255
Ser Ser Ser Ser Ser Thr Val Leu Thr Ala Phe Trp Lys Glu Asp Gln
260 265 270
Ala Cys Met Ser Trp Leu Asp Ser Gln Pro Pro Lys Ser Val Ile Phe
275 280 285
Val Ser Phe Gly Ser Thr Met Arg Met Thr Ala Asp Lys Leu Val Glu
290 295 300
Phe Trp His Gly Leu Val Asn Ser Gly Thr Arg Phe Leu Cys Val Leu
305 310 315 320
Arg Ser Asp Ile Val Glu Gly Gly Gly Ala Ala Asp Leu Ile Lys Gln
325 330 335
Val Gly Glu Thr Gly Asn Gly Ile Val Val Glu Trp Ala Ala Gln Glu
340 345 350
Lys Val Leu Ala His Arg Ala Val Gly Gly Phe Leu Thr His Cys Gly
355 360 365
Trp Asn Ser Thr Met Glu Ser Ile Ala Ala Gly Val Pro Met Met Cys
370 375 380
Trp Gln Ile Tyr Gly Asp Gln Met Ile Asn Ala Thr Trp Ile Gly Lys
385 390 395 400
Val Trp Lys Ile Gly Ile Glu Arg Asp Asp Lys Trp Asp Arg Ser Thr
405 410 415
Val Glu Lys Met Ile Lys Glu Leu Met Glu Gly Glu Lys Gly Ala Glu
420 425 430
Ile Gln Arg Ser Met Glu Lys Phe Ser Lys Leu Ala Asn Asp Lys Val
435 440 445
Val Lys Gly Gly Thr Ser Phe Glu Asn Leu Glu Leu Ile Val Glu Tyr
450 455 460
Leu Lys Lys Leu Lys Pro Ser Asn
465 470
<210> 41
<211> 466
<212> PRT
<213> Momordica charantia
<400> 41
Met Ala Gln Pro Arg Val Leu Leu Phe Pro Phe Pro Ala Met Gly His
1 5 10 15
Val Lys Pro Phe Leu Ser Leu Ala Glu Leu Leu Ser Asp Ala Gly Val
20 25 30
Glu Val Val Phe Leu Ser Thr Glu Tyr Asn His Arg Arg Ile Pro Asp
35 40 45
Ile Gly Ala Leu Ala Ala Arg Phe Pro Thr Leu His Phe Glu Thr Ile
50 55 60
Pro Asp Gly Leu Pro Pro Asp Gln Pro Arg Val Leu Ala Asp Gly His
65 70 75 80
Leu Tyr Phe Ser Met Leu Asp Gly Thr Lys Pro Arg Phe Arg Gln Leu
85 90 95
Ile Gln Ser Leu Asn Gly Asn Pro Arg Pro Ile Thr Cys Ile Ile Asn
100 105 110
Asp Val Met Leu Ser Ser Pro Ile Glu Val Ala Glu Glu Phe Gly Ile
115 120 125
Pro Val Ile Ala Phe Cys Pro Cys Ser Ala Arg Phe Leu Ser Val His
130 135 140
Phe Phe Met Pro Asn Phe Ile Glu Glu Ala Gln Ile Pro Tyr Thr Asp
145 150 155 160
Glu Asn Pro Met Gly Lys Ile Glu Glu Ala Thr Val Phe Glu Gly Leu
165 170 175
Leu Arg Arg Lys Asp Leu Pro Gly Leu Trp Cys Ala Lys Ser Ser Asn
180 185 190
Ile Ser Phe Ser His Arg Phe Ile Asn Gln Thr Ile Ala Ala Gly Arg
195 200 205
Ala Ser Ala Leu Ile Leu Asn Thr Phe Asp Glu Leu Glu Ser Pro Phe
210 215 220
Leu Asn His Leu Ser Ser Ile Phe Pro Lys Ile Tyr Cys Ile Gly Pro
225 230 235 240
Leu Asn Ala Leu Ser Arg Ser Arg Leu Gly Lys Ser Ser Ser Ser Ser
245 250 255
Ser Ala Leu Ala Gly Phe Trp Lys Glu Asp Gln Ala Tyr Met Ser Trp
260 265 270
Leu Glu Ser Gln Pro Pro Arg Ser Val Ile Phe Val Ser Phe Gly Ser
275 280 285
Thr Met Lys Met Glu Ala Trp Lys Leu Ala Glu Phe Trp Tyr Gly Leu
290 295 300
Val Asn Ser Gly Ser Pro Phe Leu Phe Val Phe Arg Pro Asp Cys Val
305 310 315 320
Ile Asn Ser Gly Asp Ala Ala Glu Val Met Glu Gly Arg Gly Arg Gly
325 330 335
Met Val Val Glu Trp Ala Ser Gln Glu Lys Val Leu Ala His Pro Ala
340 345 350
Val Gly Gly Phe Leu Thr His Cys Gly Trp Asn Ser Thr Val Glu Ser
355 360 365
Ile Val Ala Gly Val Pro Met Met Cys Cys Pro Ile Val Ala Asp Gln
370 375 380
Leu Ser Asn Ala Thr Trp Ile His Lys Val Trp Lys Ile Gly Ile Glu
385 390 395 400
Gly Asp Glu Lys Trp Asp Arg Ser Thr Val Glu Met Met Ile Lys Glu
405 410 415
Leu Met Glu Ser Gln Lys Gly Thr Glu Ile Arg Thr Ser Ile Glu Met
420 425 430
Leu Ser Lys Leu Ala Asn Glu Lys Val Val Lys Gly Gly Thr Ser Leu
435 440 445
Asn Asn Phe Glu Leu Leu Val Glu Asp Ile Lys Thr Leu Arg Arg Pro
450 455 460
Tyr Thr
465
<210> 42
<211> 482
<212> PRT
<213> Momordica charantia
<400> 42
Met Glu Gln Ser Asp Ser Asn Ser Asp Asp His Gln His His Val Leu
1 5 10 15
Leu Phe Pro Phe Pro Ala Lys Gly His Ile Lys Pro Phe Leu Cys Leu
20 25 30
Ala Gln Leu Leu Cys Gly Ala Gly Leu Gln Val Thr Phe Leu Asn Thr
35 40 45
Asp His Asn His Arg Arg Ile Asp Asp Arg His Arg Arg Leu Leu Ala
50 55 60
Thr Gln Phe Pro Met Leu His Phe Lys Ser Ile Ser Asp Gly Leu Pro
65 70 75 80
Pro Asp His Pro Arg Asp Leu Leu Asp Gly Lys Leu Ile Ala Ser Met
85 90 95
Arg Arg Val Thr Glu Ser Leu Phe Arg Gln Leu Leu Leu Ser Tyr Asn
100 105 110
Gly Tyr Gly Asn Gly Thr Asn Asn Val Ser Asn Ser Gly Arg Arg Pro
115 120 125
Pro Ile Ser Cys Val Ile Thr Asp Val Ile Phe Ser Phe Pro Val Glu
130 135 140
Val Ala Glu Glu Leu Gly Ile Pro Val Phe Ser Phe Ala Thr Phe Ser
145 150 155 160
Ala Arg Phe Leu Phe Leu Tyr Phe Trp Ile Pro Lys Leu Ile Gln Glu
165 170 175
Gly Gln Leu Pro Phe Pro Asp Gly Lys Thr Asn Gln Glu Leu Tyr Gly
180 185 190
Val Pro Gly Ala Glu Gly Ile Ile Arg Cys Lys Asp Leu Pro Gly Ser
195 200 205
Trp Ser Val Glu Ala Val Ala Lys Asn Asp Pro Met Asn Phe Val Lys
210 215 220
Gln Thr Leu Ala Ser Ser Arg Ser Ser Gly Leu Ile Leu Asn Thr Phe
225 230 235 240
Glu Asp Leu Glu Ala Pro Phe Val Thr His Leu Ser Asn Thr Phe Asp
245 250 255
Lys Ile Tyr Thr Ile Gly Pro Ile His Ser Leu Leu Gly Thr Ser His
260 265 270
Cys Gly Leu Trp Lys Glu Asp Tyr Ala Cys Leu Ala Trp Leu Asp Ala
275 280 285
Arg Pro Arg Lys Ser Val Val Phe Val Ser Phe Gly Ser Leu Val Lys
290 295 300
Thr Thr Ser Arg Glu Leu Met Glu Leu Trp His Gly Leu Val Ser Ser
305 310 315 320
Gly Lys Ser Phe Leu Leu Val Leu Arg Ser Asp Val Val Glu Gly Glu
325 330 335
Asp Glu Glu Gln Val Val Lys Glu Ile Leu Glu Ser Asn Gly Glu Gly
340 345 350
Lys Trp Leu Val Val Gly Trp Ala Pro Gln Glu Glu Val Leu Ala His
355 360 365
Glu Ala Ile Gly Gly Phe Leu Thr His Ser Gly Trp Asn Ser Thr Met
370 375 380
Glu Ser Ile Ala Ala Gly Val Pro Met Val Cys Trp Pro Lys Ile Gly
385 390 395 400
Asp Gln Pro Ser Asn Cys Thr Trp Val Ser Arg Val Trp Lys Val Gly
405 410 415
Leu Glu Met Glu Glu Arg Tyr Asp Arg Ser Thr Val Ala Arg Met Ala
420 425 430
Arg Ser Met Met Glu Gln Glu Gly Lys Glu Met Glu Arg Arg Ile Ala
435 440 445
Glu Leu Ala Lys Arg Val Lys Tyr Arg Val Gly Lys Asp Gly Glu Ser
450 455 460
Tyr Arg Asn Leu Glu Ser Leu Ile Arg Asp Ile Lys Ile Thr Lys Ser
465 470 475 480
Ser Asn
<210> 43
<211> 450
<212> PRT
<213> Momordica charantia
<400> 43
Met Asp Ala His Gln Gln Ala Glu His Thr Thr Thr Ile Leu Met Leu
1 5 10 15
Pro Trp Val Gly Tyr Gly His Leu Thr Ala Tyr Leu Glu Leu Ala Lys
20 25 30
Ala Leu Ser Arg Arg Asn Phe His Ile Tyr Tyr Cys Ser Thr Pro Val
35 40 45
Asn Ile Glu Ser Ile Lys Pro Lys Leu Thr Ile Pro Cys Ser Ser Ile
50 55 60
Gln Phe Val Glu Leu His Leu Pro Ser Ser Asp Asp Leu Pro Pro Asn
65 70 75 80
Leu His Thr Thr Asn Gly Leu Pro Ser His Leu Met Pro Thr Leu His
85 90 95
Gln Ala Phe Ser Ala Ala Ala Pro Leu Phe Glu Glu Ile Leu Gln Thr
100 105 110
Leu Cys Pro His Leu Leu Ile Tyr Asp Ser Leu Gln Pro Trp Ala Pro
115 120 125
Lys Ile Ala Ser Ser Leu Lys Ile Pro Ala Leu Asn Phe Asn Thr Ser
130 135 140
Gly Val Ser Val Ile Ala Gln Ala Leu His Ala Ile His His Pro Asp
145 150 155 160
Ser Lys Phe Pro Leu Ser Asp Phe Ile Leu His Asn Tyr Trp Lys Ser
165 170 175
Thr Tyr Thr Thr Ala Asp Gly Gly Ala Ser Glu Lys Thr Arg Arg Ala
180 185 190
Arg Glu Ala Phe Leu Tyr Cys Leu Asn Ser Ser Gly Asn Ala Ile Leu
195 200 205
Ile Asn Thr Phe Arg Glu Leu Glu Gly Glu Tyr Ile Asp Tyr Leu Ser
210 215 220
Leu Leu Leu Asn Lys Lys Val Ile Pro Ile Gly Pro Leu Val Tyr Glu
225 230 235 240
Pro Asn Gln Asp Glu Asp Gln Asp Glu Glu Tyr Arg Ser Ile Lys Asn
245 250 255
Trp Leu Asp Lys Lys Glu Pro Cys Ser Thr Val Phe Val Ser Phe Gly
260 265 270
Ser Glu Tyr Phe Pro Ser Asn Glu Glu Met Glu Glu Ile Ala Pro Gly
275 280 285
Leu Glu Glu Ser Gly Ala Asn Phe Ile Trp Val Val Arg Phe Pro Lys
290 295 300
Leu Glu Asn Arg Asn Gly Ile Ile Glu Glu Gly Leu Leu Glu Arg Ala
305 310 315 320
Gly Glu Arg Gly Met Val Ile Lys Glu Trp Ala Pro Gln Ala Arg Ile
325 330 335
Leu Arg His Gly Ser Ile Gly Gly Phe Val Ser His Cys Gly Trp Asn
340 345 350
Ser Val Met Glu Ser Ile Ile Cys Gly Val Pro Val Ile Gly Val Pro
355 360 365
Met Arg Val Asp Gln Pro Tyr Asn Ala Gly Leu Val Glu Glu Ala Gly
370 375 380
Val Gly Val Glu Ala Lys Arg Asp Pro Asp Gly Lys Ile Gln Arg His
385 390 395 400
Glu Val Ser Lys Leu Ile Lys Gln Val Val Val Glu Lys Thr Arg Asp
405 410 415
Asp Val Arg Lys Lys Val Ala Gln Met Ser Glu Ile Leu Arg Arg Lys
420 425 430
Gly Asp Glu Lys Ile Asp Glu Met Val Ala Leu Ile Ser Leu Leu Pro
435 440 445
Lys Gly
450
<210> 44
<211> 450
<212> PRT
<213> Momordica charantia
<400> 44
Met Asp Ala Arg Gln Gln Ala Glu His Thr Thr Thr Ile Leu Met Leu
1 5 10 15
Pro Trp Val Gly Tyr Gly His Leu Ser Ala Tyr Leu Glu Leu Ala Lys
20 25 30
Ala Leu Ser Arg Arg Asn Phe His Ile Tyr Tyr Cys Ser Thr Pro Val
35 40 45
Asn Ile Glu Ser Ile Lys Pro Lys Leu Thr Ile Pro Cys Ser Ser Ile
50 55 60
Gln Phe Val Glu Leu His Leu Pro Phe Ser Asp Asp Leu Pro Pro Asn
65 70 75 80
Leu His Thr Thr Asn Gly Leu Pro Ser His Leu Met Pro Ala Leu His
85 90 95
Gln Ala Phe Ser Ala Ala Ala Pro Leu Phe Glu Ala Ile Leu Gln Thr
100 105 110
Leu Cys Pro His Leu Leu Ile Tyr Asp Ser Leu Gln Pro Trp Ala Pro
115 120 125
Gln Ile Ala Ser Ser Leu Lys Ile Pro Ala Leu Asn Phe Asn Thr Thr
130 135 140
Gly Val Ser Val Ile Ala Arg Ala Leu His Thr Ile His His Pro Asp
145 150 155 160
Ser Lys Phe Pro Leu Ser Glu Ile Val Leu His Asn Tyr Trp Lys Ala
165 170 175
Thr His Ala Thr Ala Asp Gly Ala Asn Pro Glu Lys Phe Arg Arg Asp
180 185 190
Leu Glu Ala Leu Leu Cys Cys Leu His Ser Ser Cys Asn Ala Ile Leu
195 200 205
Ile Asn Thr Phe Arg Glu Leu Glu Gly Glu Tyr Ile Asp Tyr Leu Ser
210 215 220
Leu Leu Leu Asn Lys Lys Val Thr Pro Ile Gly Pro Leu Val Tyr Glu
225 230 235 240
Pro Asn Gln Asp Glu Glu Gln Asp Glu Glu Tyr Arg Ser Ile Lys Asn
245 250 255
Trp Leu Asp Lys Lys Glu Pro Tyr Ser Thr Ile Phe Val Ser Phe Gly
260 265 270
Ser Glu Tyr Phe Pro Ser Asn Glu Glu Met Glu Glu Ile Ala Arg Gly
275 280 285
Leu Glu Glu Ser Gly Ala Asn Phe Ile Trp Val Val Arg Phe His Lys
290 295 300
Leu Glu Asn Gly Asn Gly Ile Thr Glu Glu Gly Leu Leu Glu Arg Ala
305 310 315 320
Gly Glu Arg Gly Met Val Ile Gln Gly Trp Ala Pro Gln Ala Arg Ile
325 330 335
Leu Arg His Gly Ser Ile Gly Gly Phe Val Ser His Cys Gly Trp Asn
340 345 350
Ser Val Met Glu Ser Ile Ile Cys Gly Val Pro Val Ile Gly Val Pro
355 360 365
Met Gly Leu Asp Gln Pro Tyr Asn Ala Gly Leu Val Glu Glu Ala Gly
370 375 380
Val Gly Val Glu Ala Lys Arg Asp Pro Asp Gly Lys Ile Gln Arg His
385 390 395 400
Glu Val Ser Lys Leu Ile Lys Gln Val Val Val Glu Lys Thr Arg Asp
405 410 415
Asp Val Arg Lys Lys Val Ala Gln Met Ser Glu Ile Leu Arg Arg Lys
420 425 430
Gly Asp Glu Lys Ile Asp Glu Met Val Ala Leu Ile Ser Leu Leu Leu
435 440 445
Lys Gly
450
<210> 45
<211> 471
<212> PRT
<213> Cucumis sativus
<400> 45
Met Gly Leu Ser Pro Thr Asp His Val Leu Leu Phe Pro Phe Pro Ala
1 5 10 15
Lys Gly His Ile Lys Pro Phe Phe Cys Leu Ala His Leu Leu Cys Asn
20 25 30
Ala Gly Leu Arg Val Thr Phe Leu Ser Thr Glu His His His Gln Lys
35 40 45
Leu His Asn Leu Thr His Leu Ala Ala Gln Ile Pro Ser Leu His Phe
50 55 60
Gln Ser Ile Ser Asp Gly Leu Ser Leu Asp His Pro Arg Asn Leu Leu
65 70 75 80
Asp Gly Gln Leu Phe Lys Ser Met Pro Gln Val Thr Lys Pro Leu Phe
85 90 95
Arg Gln Leu Leu Leu Ser Tyr Lys Asp Gly Thr Ser Pro Ile Thr Cys
100 105 110
Val Ile Thr Asp Leu Ile Leu Arg Phe Pro Met Asp Val Ala Gln Glu
115 120 125
Leu Asp Ile Pro Val Phe Cys Phe Ser Thr Phe Ser Ala Arg Phe Leu
130 135 140
Phe Leu Tyr Phe Ser Ile Pro Lys Leu Leu Glu Asp Gly Gln Ile Pro
145 150 155 160
Tyr Pro Glu Gly Asn Ser Asn Gln Val Leu His Gly Ile Pro Gly Ala
165 170 175
Glu Gly Leu Leu Arg Cys Lys Asp Leu Pro Gly Tyr Trp Ser Val Glu
180 185 190
Ala Val Ala Asn Tyr Asn Pro Met Asn Phe Val Asn Gln Thr Ile Ala
195 200 205
Thr Ser Lys Ser His Gly Leu Ile Leu Asn Thr Phe Asp Glu Leu Glu
210 215 220
Val Pro Phe Ile Thr Asn Leu Ser Lys Ile Tyr Lys Lys Val Tyr Thr
225 230 235 240
Ile Gly Pro Ile His Ser Leu Leu Lys Lys Ser Val Gln Thr Gln Tyr
245 250 255
Glu Phe Trp Lys Glu Asp His Ser Cys Leu Ala Trp Leu Asp Ser Gln
260 265 270
Pro Pro Arg Ser Val Met Phe Val Ser Phe Gly Ser Ile Val Lys Leu
275 280 285
Lys Ser Ser Gln Leu Lys Glu Phe Trp Asn Gly Leu Val Asp Ser Gly
290 295 300
Lys Ala Phe Leu Leu Val Leu Arg Ser Asp Ala Leu Val Glu Glu Thr
305 310 315 320
Gly Glu Glu Asp Glu Lys Gln Lys Glu Leu Val Ile Lys Glu Ile Met
325 330 335
Glu Thr Lys Glu Glu Gly Arg Trp Val Ile Val Asn Trp Ala Pro Gln
340 345 350
Glu Lys Val Leu Glu His Lys Ala Ile Gly Gly Phe Leu Thr His Ser
355 360 365
Gly Trp Asn Ser Thr Leu Glu Ser Val Ala Val Gly Val Pro Met Val
370 375 380
Ser Trp Pro Gln Ile Gly Asp Gln Pro Ser Asn Ala Thr Trp Leu Ser
385 390 395 400
Lys Val Trp Lys Ile Gly Val Glu Met Glu Asp Ser Tyr Asp Arg Ser
405 410 415
Thr Val Glu Ser Lys Val Arg Ser Ile Met Glu His Glu Asp Lys Lys
420 425 430
Met Glu Asn Ala Ile Val Glu Leu Ala Lys Arg Val Asp Asp Arg Val
435 440 445
Ser Lys Glu Gly Thr Ser Tyr Gln Asn Leu Gln Arg Leu Ile Glu Asp
450 455 460
Ile Glu Gly Phe Lys Leu Asn
465 470
<210> 46
<211> 462
<212> PRT
<213> Cucurbita maxima
<400> 46
Met Glu Leu Ser His Thr His His Val Leu Leu Phe Pro Phe Pro Ala
1 5 10 15
Lys Gly His Ile Lys Pro Phe Phe Ser Leu Ala Gln Leu Leu Cys Asn
20 25 30
Ala Gly Leu Arg Val Thr Phe Leu Asn Thr Asp His His His Arg Arg
35 40 45
Ile His Asp Leu Asn Arg Leu Ala Ala Gln Leu Pro Thr Leu His Phe
50 55 60
Asp Ser Val Ser Asp Gly Leu Pro Pro Asp Glu Pro Arg Asn Val Phe
65 70 75 80
Asp Gly Lys Leu Tyr Glu Ser Ile Arg Gln Val Thr Ser Ser Leu Phe
85 90 95
Arg Glu Leu Leu Val Ser Tyr Asn Asn Gly Thr Ser Ser Gly Arg Pro
100 105 110
Pro Ile Thr Cys Val Ile Thr Asp Val Met Phe Arg Phe Pro Ile Asp
115 120 125
Ile Ala Glu Glu Leu Gly Ile Pro Val Phe Thr Phe Ser Thr Phe Ser
130 135 140
Ala Arg Phe Leu Phe Leu Ile Phe Trp Ile Pro Lys Leu Leu Glu Asp
145 150 155 160
Gly Gln Leu Arg Tyr Pro Glu Gln Glu Leu His Gly Val Pro Gly Ala
165 170 175
Glu Gly Leu Ile Arg Trp Lys Asp Leu Pro Gly Phe Trp Ser Val Glu
180 185 190
Asp Val Ala Asp Trp Asp Pro Met Asn Phe Val Asn Gln Thr Leu Ala
195 200 205
Thr Ser Arg Ser Ser Gly Leu Ile Leu Asn Thr Phe Asp Glu Leu Glu
210 215 220
Ala Pro Phe Leu Thr Ser Leu Ser Lys Ile Tyr Lys Lys Ile Tyr Ser
225 230 235 240
Leu Gly Pro Ile Asn Ser Leu Leu Lys Asn Phe Gln Ser Gln Pro Gln
245 250 255
Tyr Asn Leu Trp Lys Glu Asp His Ser Cys Met Ala Trp Leu Asp Ser
260 265 270
Gln Pro Arg Lys Ser Val Val Phe Val Ser Phe Gly Ser Val Val Lys
275 280 285
Leu Thr Ser Arg Gln Leu Met Glu Phe Trp Asn Gly Leu Val Asn Ser
290 295 300
Gly Met Pro Phe Leu Leu Val Leu Arg Ser Asp Val Ile Glu Ala Gly
305 310 315 320
Glu Glu Val Val Arg Glu Ile Met Glu Arg Lys Ala Glu Gly Arg Trp
325 330 335
Val Ile Val Ser Trp Ala Pro Gln Glu Glu Val Leu Ala His Asp Ala
340 345 350
Val Gly Gly Phe Leu Thr His Ser Gly Trp Asn Ser Thr Leu Glu Ser
355 360 365
Leu Ala Ala Gly Val Pro Met Ile Ser Trp Pro Gln Ile Gly Asp Gln
370 375 380
Thr Ser Asn Ser Thr Trp Ile Ser Lys Val Trp Arg Ile Gly Leu Gln
385 390 395 400
Leu Glu Asp Gly Phe Asp Ser Ser Thr Ile Glu Thr Met Val Arg Ser
405 410 415
Ile Met Asp Gln Thr Met Glu Lys Thr Val Ala Glu Leu Ala Glu Arg
420 425 430
Ala Lys Asn Arg Ala Ser Lys Asn Gly Thr Ser Tyr Arg Asn Phe Gln
435 440 445
Thr Leu Ile Gln Asp Ile Thr Asn Ile Ile Glu Thr His Ile
450 455 460
<210> 47
<211> 474
<212> PRT
<213> Prunus persica
<400> 47
Met Ala Met Lys Gln Pro His Val Ile Ile Phe Pro Phe Pro Leu Gln
1 5 10 15
Gly His Met Lys Pro Leu Leu Cys Leu Ala Glu Leu Leu Cys His Ala
20 25 30
Gly Leu His Val Thr Tyr Val Asn Thr His His Asn His Gln Arg Leu
35 40 45
Ala Asn Arg Gln Ala Leu Ser Thr His Phe Pro Thr Leu His Phe Glu
50 55 60
Ser Ile Ser Asp Gly Leu Pro Glu Asp Asp Pro Arg Thr Leu Asn Ser
65 70 75 80
Gln Leu Leu Ile Ala Leu Lys Thr Ser Ile Arg Pro His Phe Arg Glu
85 90 95
Leu Leu Lys Thr Ile Ser Leu Lys Ala Glu Ser Asn Asp Thr Leu Val
100 105 110
Pro Pro Pro Ser Cys Ile Met Thr Asp Gly Leu Val Thr Phe Ala Phe
115 120 125
Asp Val Ala Glu Glu Leu Gly Leu Pro Ile Leu Ser Phe Asn Val Pro
130 135 140
Cys Pro Arg Tyr Leu Trp Thr Cys Leu Cys Leu Pro Lys Leu Ile Glu
145 150 155 160
Asn Gly Gln Leu Pro Phe Gln Asp Asp Asp Met Asn Val Glu Ile Thr
165 170 175
Gly Val Pro Gly Met Glu Gly Leu Leu His Arg Gln Asp Leu Pro Gly
180 185 190
Phe Cys Arg Val Lys Gln Ala Asp His Pro Ser Leu Gln Phe Ala Ile
195 200 205
Asn Glu Thr Gln Thr Leu Lys Arg Ala Ser Ala Leu Ile Leu Asp Thr
210 215 220
Val Tyr Glu Leu Asp Ala Pro Cys Ile Ser His Met Ala Leu Met Phe
225 230 235 240
Pro Lys Ile Tyr Thr Leu Gly Pro Leu His Ala Leu Leu Asn Ser Gln
245 250 255
Ile Gly Asp Met Ser Arg Gly Leu Ala Ser His Gly Ser Leu Trp Lys
260 265 270
Ser Asp Leu Asn Cys Met Thr Trp Leu Asp Ser Gln Pro Ser Lys Ser
275 280 285
Ile Ile Tyr Val Ser Phe Gly Thr Leu Val His Leu Thr Arg Ala Gln
290 295 300
Val Ile Glu Phe Trp Tyr Gly Leu Val Asn Ser Gly His Pro Phe Leu
305 310 315 320
Trp Val Met Arg Ser Asp Ile Thr Ser Gly Asp His Gln Ile Pro Ala
325 330 335
Glu Leu Glu Asn Gly Thr Lys Glu Arg Gly Cys Ile Val Asp Trp Val
340 345 350
Ser Gln Glu Glu Val Leu Ala His Lys Ser Val Gly Gly Phe Leu Thr
355 360 365
His Ser Gly Trp Asn Ser Thr Leu Glu Ser Ile Val Ala Gly Leu Pro
370 375 380
Met Ile Cys Trp Pro Lys Leu Gly Asp His Tyr Ile Ile Ser Ser Thr
385 390 395 400
Val Cys Arg Gln Trp Lys Ile Gly Leu Gln Leu Asn Glu Asn Cys Asp
405 410 415
Arg Ser Asn Ile Glu Ser Met Val Gln Thr Leu Met Gly Ser Lys Arg
420 425 430
Glu Glu Ile Gln Ser Ser Met Asp Ala Ile Ser Lys Leu Ser Arg Asp
435 440 445
Ser Val Ala Glu Gly Gly Ser Ser His Asn Asn Leu Glu Gln Leu Ile
450 455 460
Glu Tyr Ile Arg Asn Leu Gln His Gln Asn
465 470
<210> 48
<211> 468
<212> PRT
<213> Theobroma cacao
<400> 48
Met Arg Gln Pro His Val Leu Val Leu Pro Phe Pro Ala Gln Gly His
1 5 10 15
Ile Lys Pro Met Leu Cys Leu Ala Glu Leu Leu Cys Gln Ala Gly Leu
20 25 30
Arg Val Thr Phe Leu Asn Thr His His Ser His Arg Arg Leu Asn Asn
35 40 45
Leu Gln Asp Leu Ser Thr Arg Phe Pro Thr Leu His Phe Glu Ser Val
50 55 60
Ser Asp Gly Leu Pro Glu Asp His Pro Arg Asn Leu Val His Phe Met
65 70 75 80
His Leu Val His Ser Ile Lys Asn Val Thr Lys Pro Leu Leu Arg Asp
85 90 95
Leu Leu Thr Ser Leu Ser Leu Lys Thr Asp Ile Pro Pro Val Ser Cys
100 105 110
Ile Ile Ala Asp Gly Ile Leu Ser Phe Ala Ile Asp Val Ala Glu Glu
115 120 125
Leu Gln Ile Lys Val Ile Ile Phe Arg Thr Ile Ser Ser Cys Cys Leu
130 135 140
Trp Ser Tyr Leu Cys Val Pro Lys Leu Ile Gln Gln Gly Glu Leu Gln
145 150 155 160
Phe Ser Asp Ser Asp Met Gly Gln Lys Val Ser Ser Val Pro Glu Met
165 170 175
Lys Gly Ser Leu Arg Leu His Asp Arg Pro Tyr Ser Phe Gly Leu Lys
180 185 190
Gln Leu Glu Asp Pro Asn Phe Gln Phe Phe Val Ser Glu Thr Gln Ala
195 200 205
Met Thr Arg Ala Ser Ala Val Ile Phe Asn Thr Phe Asp Ser Leu Glu
210 215 220
Ala Pro Val Leu Ser Gln Met Ile Pro Leu Leu Pro Lys Val Tyr Thr
225 230 235 240
Ile Gly Pro Leu His Ala Leu Arg Lys Ala Arg Leu Gly Asp Leu Ser
245 250 255
Gln His Ser Ser Phe Asn Gly Asn Leu Arg Glu Ala Asp His Asn Cys
260 265 270
Ile Thr Trp Leu Asp Ser Gln Pro Leu Arg Ser Val Val Tyr Val Ser
275 280 285
Phe Gly Ser His Val Val Leu Thr Ser Glu Glu Leu Leu Glu Phe Trp
290 295 300
His Gly Leu Val Asn Ser Gly Lys Arg Phe Leu Trp Val Leu Arg Pro
305 310 315 320
Asp Ile Ile Ala Gly Glu Lys Asp His Asn Gln Ile Ile Ala Arg Glu
325 330 335
Pro Asp Leu Gly Thr Lys Glu Lys Gly Leu Leu Val Asp Trp Ala Pro
340 345 350
Gln Glu Glu Val Leu Ala His Pro Ser Val Gly Gly Phe Leu Thr His
355 360 365
Cys Gly Trp Asn Ser Thr Leu Glu Ser Met Val Ala Gly Val Pro Met
370 375 380
Leu Cys Trp Pro Lys Leu Pro Asp Gln Leu Val Asn Ser Ser Cys Val
385 390 395 400
Ser Glu Val Trp Lys Ile Gly Leu Asp Leu Lys Asp Met Cys Asp Arg
405 410 415
Ser Thr Val Glu Lys Met Val Arg Ala Leu Met Glu Asp Arg Arg Glu
420 425 430
Glu Val Met Arg Ser Val Asp Gly Ile Ser Lys Leu Ala Arg Glu Ser
435 440 445
Val Ser His Gly Gly Ser Ser Ser Ser Asn Leu Glu Met Leu Ile Gln
450 455 460
Glu Leu Glu Thr
465
<210> 49
<211> 454
<212> PRT
<213> Cucurbita maxima
<400> 49
Met Asp Ala Gln Lys Ala Val Asp Thr Pro Pro Thr Thr Val Leu Met
1 5 10 15
Leu Pro Trp Ile Gly Tyr Gly His Leu Ser Ala Tyr Leu Glu Leu Ala
20 25 30
Lys Ala Leu Ser Arg Arg Asn Phe His Val Tyr Phe Cys Ser Thr Pro
35 40 45
Val Asn Leu Asp Ser Ile Lys Pro Asn Leu Ile Pro Pro Pro Ser Ser
50 55 60
Ile Gln Phe Val Asp Leu His Leu Pro Ser Ser Pro Glu Leu Pro Pro
65 70 75 80
His Leu His Thr Thr Asn Gly Leu Pro Ser His Leu Lys Pro Thr Leu
85 90 95
His Gln Ala Phe Ser Ala Ala Ala Gln His Phe Glu Ala Ile Leu Gln
100 105 110
Thr Leu Ser Pro His Leu Leu Ile Tyr Asp Ser Leu Gln Pro Trp Ala
115 120 125
Pro Arg Ile Ala Ser Ser Leu Asn Ile Pro Ala Ile Asn Phe Asn Thr
130 135 140
Thr Ala Val Ser Ile Ile Ala His Ala Leu His Ser Val His Tyr Pro
145 150 155 160
Asp Ser Lys Phe Pro Phe Ser Asp Phe Val Leu His Asp Tyr Trp Lys
165 170 175
Ala Lys Tyr Thr Thr Ala Asp Gly Ala Thr Ser Glu Lys Ile Arg Arg
180 185 190
Gly Ala Glu Ala Phe Leu Tyr Cys Leu Asn Ala Ser Cys Asp Val Val
195 200 205
Leu Val Asn Ser Phe Arg Glu Leu Glu Gly Glu Tyr Met Asp Tyr Leu
210 215 220
Ser Val Leu Leu Lys Lys Lys Val Val Ser Val Gly Pro Leu Val Tyr
225 230 235 240
Glu Pro Ser Glu Gly Glu Glu Asp Glu Glu Tyr Trp Arg Ile Lys Lys
245 250 255
Trp Leu Asp Glu Lys Glu Ala Leu Ser Thr Val Leu Val Ser Phe Gly
260 265 270
Ser Glu Tyr Phe Pro Ser Lys Glu Glu Met Glu Glu Ile Ala His Gly
275 280 285
Leu Glu Glu Ser Glu Ala Asn Phe Ile Trp Val Val Arg Phe Pro Lys
290 295 300
Gly Glu Glu Ser Cys Arg Gly Ile Glu Glu Ala Leu Pro Lys Gly Phe
305 310 315 320
Val Glu Arg Ala Gly Glu Arg Ala Met Val Val Lys Lys Trp Ala Pro
325 330 335
Gln Gly Lys Ile Leu Lys His Gly Ser Ile Gly Gly Phe Val Ser His
340 345 350
Cys Gly Trp Asn Ser Val Leu Glu Ser Ile Arg Phe Gly Val Pro Val
355 360 365
Ile Gly Val Pro Met His Leu Asp Gln Pro Tyr Asn Ala Gly Leu Leu
370 375 380
Glu Glu Ala Gly Ile Gly Val Glu Ala Lys Arg Asp Ala Asp Gly Lys
385 390 395 400
Ile Gln Arg Asp Gln Val Ala Ser Leu Ile Lys Arg Val Val Val Glu
405 410 415
Lys Thr Arg Glu Asp Ile Trp Lys Thr Val Arg Glu Met Arg Glu Val
420 425 430
Leu Arg Arg Arg Asp Asp Asp Met Ile Asp Glu Met Val Ala Glu Ile
435 440 445
Ser Val Val Leu Lys Ile
450
<210> 50
<211> 457
<212> PRT
<213> Cucurbita moschata
<400> 50
Met Asp Ala Gln Lys Ala Val Asp Thr Pro Pro Thr Thr Val Leu Met
1 5 10 15
Leu Pro Trp Ile Gly Tyr Gly His Leu Ser Ala Tyr Leu Glu Leu Ala
20 25 30
Lys Ala Leu Ser Arg Arg Asn Phe His Val Tyr Phe Cys Ser Thr Pro
35 40 45
Val Asn Leu Asp Ser Ile Lys Pro Asn Leu Ile Pro Pro Pro Pro Ser
50 55 60
Ile Gln Phe Val Asp Leu His Leu Pro Ser Ser Pro Glu Leu Pro Pro
65 70 75 80
His Leu His Thr Thr Asn Gly Leu Pro Ser His Leu Lys Pro Thr Leu
85 90 95
His Gln Ala Phe Ser Ala Ala Ala Gln His Phe Glu Ala Ile Leu Gln
100 105 110
Thr Leu Ser Pro His Leu Leu Ile Tyr Asp Ser Leu Gln Pro Trp Ala
115 120 125
Pro Arg Ile Ala Ser Ser Leu Asn Ile Pro Ala Ile Asn Phe Asn Thr
130 135 140
Thr Ala Val Ser Ile Ile Ala His Ala Leu His Ser Val His Tyr Pro
145 150 155 160
Asp Ser Lys Phe Pro Phe Ser Asp Phe Val Leu His Asp Tyr Trp Lys
165 170 175
Ala Lys Tyr Thr Thr Ala Asp Gly Ala Thr Ser Glu Lys Thr Arg Arg
180 185 190
Gly Val Glu Ala Phe Leu Tyr Cys Leu Asn Ala Ser Cys Asp Val Val
195 200 205
Leu Val Asn Ser Phe Arg Glu Leu Glu Gly Glu Tyr Met Asp Tyr Leu
210 215 220
Ser Val Leu Leu Lys Lys Lys Val Val Ser Val Gly Pro Leu Val Tyr
225 230 235 240
Glu Pro Ser Glu Gly Glu Glu Asp Glu Glu Tyr Trp Arg Ile Lys Lys
245 250 255
Trp Leu Asp Glu Lys Glu Ala Leu Ser Thr Val Leu Val Ser Phe Gly
260 265 270
Ser Glu Tyr Phe Pro Pro Lys Glu Glu Met Glu Glu Ile Ala His Gly
275 280 285
Leu Glu Glu Ser Glu Ala Asn Phe Ile Trp Val Val Arg Phe Pro Lys
290 295 300
Gly Glu Glu Ser Ser Ser Arg Gly Ile Glu Glu Ala Leu Pro Lys Gly
305 310 315 320
Phe Val Glu Arg Ala Gly Glu Arg Ala Met Val Val Lys Lys Trp Ala
325 330 335
Pro Gln Gly Lys Ile Leu Lys His Gly Ser Ile Gly Gly Phe Val Ser
340 345 350
His Cys Gly Trp Asn Ser Val Leu Glu Ser Ile Arg Phe Gly Val Pro
355 360 365
Val Ile Gly Ala Pro Met His Leu Asp Gln Pro Tyr Asn Ala Gly Leu
370 375 380
Leu Glu Glu Ala Gly Ile Gly Val Glu Ala Lys Arg Asp Ala Asp Gly
385 390 395 400
Lys Ile Gln Arg Asp Gln Val Ala Ser Leu Ile Lys Gln Val Val Val
405 410 415
Glu Lys Thr Arg Glu Asp Ile Trp Lys Lys Val Arg Glu Met Arg Glu
420 425 430
Val Leu Arg Arg Arg Asp Asp Asp Asp Met Met Ile Asp Glu Met Val
435 440 445
Ala Val Ile Ser Val Val Leu Lys Ile
450 455
<210> 51
<211> 492
<212> PRT
<213> Cucurbita maxima
<400> 51
Met Ser Ser Asn Leu Phe Leu Lys Ile Ser Ile Pro Phe Gly Arg Leu
1 5 10 15
Arg Asp Ser Ala Leu Asn Cys Ser Val Phe His Cys Lys Leu His Leu
20 25 30
Ala Ile Ala Ile Ala Met Asp Ala Gln Gln Ala Ala Asn Lys Ser Pro
35 40 45
Thr Ala Thr Thr Ile Phe Met Leu Pro Trp Ala Gly Tyr Gly His Leu
50 55 60
Ser Ala Tyr Leu Glu Leu Ala Lys Ala Leu Ser Thr Arg Asn Phe His
65 70 75 80
Ile Tyr Phe Cys Ser Thr Pro Val Ser Leu Ala Ser Ile Lys Pro Arg
85 90 95
Leu Ile Pro Ser Cys Ser Ser Ile Gln Phe Val Glu Leu His Leu Pro
100 105 110
Ser Ser Asp Glu Phe Pro Pro His Leu His Thr Thr Asn Gly Leu Pro
115 120 125
Ser Arg Leu Val Pro Thr Phe His Gln Ala Phe Ser Glu Ala Ala Gln
130 135 140
Thr Phe Glu Ala Phe Leu Gln Thr Leu Arg Pro His Leu Leu Ile Tyr
145 150 155 160
Asp Ser Leu Gln Pro Trp Ala Pro Arg Ile Ala Ser Ser Leu Asn Ile
165 170 175
Pro Ala Ile Asn Phe Phe Thr Ala Gly Ala Phe Ala Val Ser His Val
180 185 190
Leu Arg Ala Phe His Tyr Pro Asp Ser Gln Phe Pro Ser Ser Asp Phe
195 200 205
Val Leu His Ser Arg Trp Lys Ile Lys Asn Thr Thr Ala Glu Ser Pro
210 215 220
Thr Gln Ala Lys Leu Pro Lys Ile Gly Glu Ala Ile Gly Tyr Cys Leu
225 230 235 240
Asn Ala Ser Arg Gly Val Ile Leu Thr Asn Ser Phe Arg Glu Leu Glu
245 250 255
Gly Lys Tyr Ile Asp Tyr Leu Ser Val Ile Leu Lys Lys Arg Val Phe
260 265 270
Pro Ile Gly Pro Leu Val Tyr Gln Pro Asn Gln Asp Glu Glu Asp Glu
275 280 285
Asp Tyr Ser Arg Ile Lys Asn Trp Leu Asp Arg Lys Glu Ala Ser Ser
290 295 300
Thr Val Leu Val Ser Phe Gly Ser Glu Phe Phe Leu Ser Lys Glu Glu
305 310 315 320
Thr Glu Ala Ile Ala His Gly Leu Glu Gln Ser Glu Ala Asn Phe Ile
325 330 335
Trp Gly Ile Arg Phe Pro Lys Gly Ala Lys Lys Asn Ala Ile Glu Glu
340 345 350
Ala Leu Pro Glu Gly Phe Leu Glu Arg Ala Gly Gly Arg Ala Met Val
355 360 365
Val Glu Glu Trp Val Pro Gln Gly Lys Ile Leu Lys His Gly Ser Ile
370 375 380
Gly Gly Phe Val Ser His Cys Gly Trp Asn Ser Ala Met Glu Ser Ile
385 390 395 400
Val Cys Gly Val Pro Ile Ile Gly Ile Pro Met Gln Val Asp Gln Pro
405 410 415
Phe Asn Ala Gly Ile Leu Glu Glu Ala Gly Val Gly Val Glu Ala Lys
420 425 430
Arg Asp Ser Asp Gly Lys Ile Gln Arg Asp Glu Val Ala Lys Leu Ile
435 440 445
Lys Glu Val Val Val Glu Arg Thr Arg Glu Asp Ile Arg Asn Lys Leu
450 455 460
Glu Lys Ile Asn Glu Ile Leu Arg Ser Arg Arg Glu Glu Lys Leu Asp
465 470 475 480
Glu Leu Ala Thr Glu Ile Ser Leu Leu Ser Arg Asn
485 490
<210> 52
<211> 455
<212> PRT
<213> Cucurbita moschata
<400> 52
Met Asp Ala Gln Gln Ala Ala Asn Lys Ser Pro Thr Ala Ser Thr Ile
1 5 10 15
Phe Met Leu Pro Trp Val Gly Tyr Gly His Leu Ser Ala Tyr Leu Glu
20 25 30
Leu Ala Lys Ala Leu Ser Thr Arg Asn Phe His Val Tyr Phe Cys Ser
35 40 45
Thr Pro Val Ser Leu Ala Ser Ile Lys Pro Arg Leu Ile Pro Ser Cys
50 55 60
Ser Ser Ile Gln Phe Val Glu Leu His Leu Pro Ser Ser Asp Glu Phe
65 70 75 80
Pro Pro His Leu His Thr Thr Asn Gly Leu Pro Ala His Leu Val Pro
85 90 95
Thr Ile His Gln Ala Phe Ala Ala Ala Ala Gln Thr Phe Glu Ala Phe
100 105 110
Leu Gln Thr Leu Arg Pro His Leu Leu Ile Tyr Asp Ser Leu Gln Pro
115 120 125
Trp Ala Pro Arg Ile Ala Ser Ser Leu Asn Ile Pro Ala Ile Asn Phe
130 135 140
Phe Thr Ala Gly Ala Phe Ala Val Ser His Val Leu Arg Ala Phe His
145 150 155 160
Tyr Pro Asp Ser Gln Phe Pro Ser Ser Asp Phe Val Leu His Ser Arg
165 170 175
Trp Lys Ile Lys Asn Thr Thr Ala Glu Ser Pro Thr Gln Val Lys Ile
180 185 190
Pro Lys Ile Gly Glu Ala Ile Gly Tyr Cys Leu Asn Ala Ser Arg Gly
195 200 205
Val Ile Leu Thr Asn Ser Phe Arg Glu Leu Glu Gly Lys Tyr Ile Asp
210 215 220
Tyr Leu Ser Val Ile Leu Lys Lys Arg Val Leu Pro Ile Gly Pro Leu
225 230 235 240
Val Tyr Gln Pro Asn Gln Asp Glu Glu Asp Glu Asp Tyr Ser Arg Ile
245 250 255
Lys Asn Trp Leu Asp Arg Lys Glu Ala Ser Ser Thr Val Leu Val Ser
260 265 270
Phe Gly Ser Glu Phe Phe Leu Ser Lys Glu Glu Thr Glu Ala Ile Ala
275 280 285
His Gly Leu Glu Gln Ser Glu Ala Asn Phe Ile Trp Gly Ile Arg Phe
290 295 300
Pro Lys Gly Ala Lys Lys Asn Ala Ile Glu Glu Ala Leu Pro Glu Gly
305 310 315 320
Phe Leu Glu Arg Val Gly Gly Arg Ala Met Val Val Glu Glu Trp Val
325 330 335
Pro Gln Gly Lys Ile Leu Lys His Gly Asn Ile Gly Gly Phe Val Ser
340 345 350
His Cys Gly Trp Asn Ser Ala Met Glu Ser Ile Met Cys Gly Val Pro
355 360 365
Val Ile Gly Ile Pro Met Gln Val Asp Gln Pro Phe Asn Ala Gly Ile
370 375 380
Leu Glu Glu Ala Gly Val Gly Val Glu Ala Lys Arg Asp Ser Asp Gly
385 390 395 400
Lys Ile Gln Arg Asp Glu Val Ala Lys Leu Ile Lys Glu Val Val Val
405 410 415
Glu Arg Thr Arg Glu Asp Ile Arg Asn Lys Leu Glu Glu Ile Asn Glu
420 425 430
Ile Leu Arg Thr Arg Arg Glu Glu Lys Leu Asp Glu Leu Ala Thr Glu
435 440 445
Ile Ser Leu Leu Cys Lys Asn
450 455
<210> 53
<211> 462
<212> PRT
<213> Corchorus capsularis
<400> 53
Met Asp Ser Lys Gln Lys Lys Met Ser Val Leu Met Phe Pro Trp Leu
1 5 10 15
Ala Tyr Gly His Ile Ser Pro Phe Leu Glu Leu Ala Lys Lys Leu Ser
20 25 30
Lys Arg Asn Phe His Thr Phe Phe Phe Ser Thr Pro Ile Asn Leu Asn
35 40 45
Ser Ile Lys Ser Lys Leu Ser Pro Lys Tyr Ala Gln Ser Ile Gln Phe
50 55 60
Val Glu Leu His Leu Pro Ser Leu Pro Asp Leu Pro Pro His Tyr His
65 70 75 80
Thr Thr Asn Gly Leu Pro Pro His Leu Met Asn Thr Leu Lys Lys Ala
85 90 95
Phe Asp Met Ser Ser Leu Gln Phe Ser Lys Ile Leu Lys Thr Leu Asn
100 105 110
Pro Asp Leu Leu Val Tyr Asp Phe Ile Gln Pro Trp Ala Pro Leu Leu
115 120 125
Ala Leu Ser Asn Lys Ile Pro Ala Val His Phe Leu Cys Thr Ser Ala
130 135 140
Ala Met Ser Ser Phe Ser Val His Ala Phe Lys Lys Pro Cys Glu Asp
145 150 155 160
Phe Pro Phe Pro Asn Ile Tyr Val His Gly Asn Phe Met Asn Ala Lys
165 170 175
Phe Asn Asn Met Glu Asn Cys Ser Ser Asp Asp Ser Ile Ser Asp Gln
180 185 190
Asp Arg Val Leu Gln Cys Phe Glu Arg Ser Thr Lys Ile Ile Leu Val
195 200 205
Lys Thr Phe Glu Glu Leu Glu Gly Lys Phe Met Asp Tyr Leu Ser Val
210 215 220
Leu Leu Asn Lys Lys Ile Val Pro Thr Gly Pro Leu Thr Gln Asp Pro
225 230 235 240
Asn Glu Asp Glu Gly Asp Asp Asp Glu Arg Thr Lys Leu Leu Leu Glu
245 250 255
Trp Leu Asn Lys Lys Ser Lys Ser Ser Thr Val Phe Val Ser Phe Gly
260 265 270
Ser Glu Tyr Phe Leu Ser Lys Glu Glu Arg Glu Glu Ile Ala Tyr Gly
275 280 285
Leu Glu Leu Ser Lys Val Asn Phe Ile Trp Val Ile Arg Phe Pro Leu
290 295 300
Gly Glu Asn Lys Thr Asn Leu Glu Glu Ala Leu Pro Gln Gly Phe Leu
305 310 315 320
Gln Arg Val Ser Glu Arg Gly Leu Val Val Glu Asn Trp Ala Pro Gln
325 330 335
Ala Lys Ile Leu Gln His Ser Ser Ile Gly Gly Phe Val Ser His Cys
340 345 350
Gly Trp Ser Ser Val Met Glu Ser Leu Lys Phe Gly Val Pro Ile Ile
355 360 365
Ala Ile Pro Met His Leu Asp Gln Pro Leu Asn Ala Arg Leu Val Val
370 375 380
Asp Val Gly Val Gly Leu Glu Val Ile Arg Asn His Gly Ser Leu Glu
385 390 395 400
Arg Glu Glu Ile Ala Lys Leu Ile Lys Glu Val Val Leu Gly Asn Gly
405 410 415
Asn Asp Gly Glu Ile Val Arg Arg Lys Ala Arg Glu Met Ser Asn His
420 425 430
Ile Lys Lys Lys Gly Glu Lys Asp Met Asp Glu Leu Val Glu Glu Leu
435 440 445
Met Leu Ile Cys Lys Met Lys Pro Asn Ser Cys His Leu Ser
450 455 460
<210> 54
<211> 448
<212> PRT
<213> Ziziphus jujube
<400> 54
Met Met Glu Arg Gln Arg Ser Ile Lys Val Leu Met Phe Pro Trp Leu
1 5 10 15
Ala His Gly His Ile Ser Pro Phe Leu Glu Leu Ala Lys Arg Leu Thr
20 25 30
Asp Arg Asn Phe Gln Ile Tyr Phe Cys Ser Thr Pro Val Asn Leu Thr
35 40 45
Ser Val Lys Pro Lys Leu Ser Gln Lys Tyr Ser Ser Ser Ile Lys Leu
50 55 60
Val Glu Leu His Leu Pro Ser Leu Pro Asp Leu Pro Pro His Tyr His
65 70 75 80
Thr Thr Asn Gly Leu Ala Leu Asn Leu Ile Pro Thr Leu Lys Lys Ala
85 90 95
Phe Asp Met Ser Ser Ser Ser Phe Ser Thr Ile Leu Ser Thr Ile Lys
100 105 110
Pro Asp Leu Leu Ile Tyr Asp Phe Leu Gln Pro Trp Ala Pro Gln Leu
115 120 125
Ala Ser Cys Met Asn Ile Pro Ala Val Asn Phe Leu Ser Ala Gly Ala
130 135 140
Ser Met Val Ser Phe Val Leu His Ser Ile Lys Tyr Asn Gly Asp Asp
145 150 155 160
His Asp Asp Glu Phe Leu Thr Thr Glu Leu His Leu Ser Asp Ser Met
165 170 175
Glu Ala Lys Phe Ala Glu Met Thr Glu Ser Ser Pro Asp Glu His Ile
180 185 190
Asp Arg Ala Val Thr Cys Leu Glu Arg Ser Asn Ser Leu Ile Leu Ile
195 200 205
Lys Ser Phe Arg Glu Leu Glu Gly Lys Tyr Leu Asp Tyr Leu Ser Leu
210 215 220
Ser Phe Ala Lys Lys Val Val Pro Ile Gly Pro Leu Val Ala Gln Asp
225 230 235 240
Thr Asn Pro Glu Asp Asp Ser Met Asp Ile Ile Asn Trp Leu Asp Lys
245 250 255
Lys Glu Lys Ser Ser Thr Val Phe Val Ser Phe Gly Ser Glu Tyr Tyr
260 265 270
Leu Thr Asn Glu Glu Met Glu Glu Ile Ala Tyr Gly Leu Glu Leu Ser
275 280 285
Lys Val Asn Phe Ile Trp Val Val Arg Phe Pro Leu Gly Gln Lys Met
290 295 300
Ala Val Glu Glu Ala Leu Pro Lys Gly Phe Leu Glu Arg Val Gly Glu
305 310 315 320
Lys Gly Met Val Val Glu Asp Trp Ala Pro Gln Met Lys Ile Leu Gly
325 330 335
His Ser Ser Ile Gly Gly Phe Val Ser His Cys Gly Trp Ser Ser Leu
340 345 350
Met Glu Ser Leu Lys Leu Gly Val Pro Ile Ile Ala Met Pro Met Gln
355 360 365
Leu Asp Gln Pro Ile Asn Ala Lys Leu Val Glu Arg Ser Gly Val Gly
370 375 380
Leu Glu Val Lys Arg Asp Lys Asn Gly Arg Ile Glu Arg Glu Tyr Leu
385 390 395 400
Ala Lys Val Ile Arg Glu Ile Val Val Glu Lys Ala Arg Gln Asp Ile
405 410 415
Glu Lys Lys Ala Arg Glu Met Ser Asn Ile Ile Thr Glu Lys Gly Glu
420 425 430
Glu Glu Ile Asp Asn Val Val Glu Glu Leu Ala Lys Leu Cys Gly Met
435 440 445
<210> 55
<211> 446
<212> PRT
<213> Vitis vinifera
<400> 55
Met Asp Ala Arg Gln Ser Asp Gly Ile Ser Val Leu Met Phe Pro Trp
1 5 10 15
Leu Ala His Gly His Ile Ser Pro Phe Leu Gln Leu Ala Lys Lys Leu
20 25 30
Ser Lys Arg Asn Phe Ser Ile Tyr Phe Cys Ser Thr Pro Val Asn Leu
35 40 45
Asp Pro Ile Lys Gly Lys Leu Ser Glu Ser Tyr Ser Leu Ser Ile Gln
50 55 60
Leu Val Lys Leu His Leu Pro Ser Leu Pro Glu Leu Pro Pro Gln Tyr
65 70 75 80
His Thr Thr Asn Gly Leu Pro Pro His Leu Met Pro Thr Leu Lys Met
85 90 95
Ala Phe Asp Met Ala Ser Pro Asn Phe Ser Asn Ile Leu Lys Thr Leu
100 105 110
His Pro Asp Leu Leu Ile Tyr Asp Phe Leu Gln Pro Trp Ala Pro Ala
115 120 125
Ala Ala Ser Ser Leu Asn Ile Pro Ala Val Gln Phe Leu Ser Thr Gly
130 135 140
Ala Thr Leu Gln Ser Phe Leu Ala His Arg His Arg Lys Pro Gly Ile
145 150 155 160
Glu Phe Pro Phe Gln Glu Ile His Leu Pro Asp Tyr Glu Ile Gly Arg
165 170 175
Leu Asn Arg Phe Leu Glu Pro Ser Ala Gly Arg Ile Ser Asp Arg Asp
180 185 190
Arg Ala Asn Gln Cys Leu Glu Arg Ser Ser Arg Phe Ser Leu Ile Lys
195 200 205
Thr Phe Arg Glu Ile Glu Ala Lys Tyr Leu Asp Tyr Val Ser Asp Leu
210 215 220
Thr Lys Lys Lys Met Val Thr Val Gly Pro Leu Leu Gln Asp Pro Glu
225 230 235 240
Asp Glu Asp Glu Ala Thr Asp Ile Val Glu Trp Leu Asn Lys Lys Cys
245 250 255
Glu Ala Ser Ala Val Phe Val Ser Phe Gly Ser Glu Tyr Phe Val Ser
260 265 270
Lys Glu Glu Met Glu Glu Ile Ala His Gly Leu Glu Leu Ser Asn Val
275 280 285
Asp Phe Ile Trp Val Val Arg Phe Pro Met Gly Glu Lys Ile Arg Leu
290 295 300
Glu Asp Ala Leu Pro Pro Gly Phe Leu His Arg Leu Gly Asp Arg Gly
305 310 315 320
Met Val Val Glu Gly Trp Ala Pro Gln Arg Lys Ile Leu Gly His Ser
325 330 335
Ser Ile Gly Gly Phe Val Ser His Cys Gly Trp Ser Ser Val Met Glu
340 345 350
Gly Met Lys Phe Gly Val Pro Ile Ile Ala Met Pro Met His Leu Asp
355 360 365
Gln Pro Ile Asn Ala Lys Leu Val Glu Ala Val Gly Val Gly Arg Glu
370 375 380
Val Lys Arg Asp Glu Asn Arg Lys Leu Glu Arg Glu Glu Ile Ala Lys
385 390 395 400
Val Ile Lys Glu Val Val Gly Glu Lys Asn Gly Glu Asn Val Arg Arg
405 410 415
Lys Ala Arg Glu Leu Ser Glu Thr Leu Arg Lys Lys Gly Asp Glu Glu
420 425 430
Ile Asp Val Val Val Glu Glu Leu Lys Gln Leu Cys Ser Tyr
435 440 445
<210> 56
<211> 456
<212> PRT
<213> Juglans regia
<400> 56
Met Asp Thr Ala Arg Lys Arg Ile Arg Val Val Met Leu Pro Trp Leu
1 5 10 15
Ala His Gly His Ile Ser Pro Phe Leu Glu Leu Ser Lys Lys Leu Ala
20 25 30
Lys Arg Asn Phe His Ile Tyr Phe Cys Ser Thr Pro Val Asn Leu Ser
35 40 45
Ser Ile Lys Pro Lys Leu Ser Gly Lys Tyr Ser Arg Ser Ile Gln Leu
50 55 60
Val Glu Leu His Leu Pro Ser Leu Pro Glu Leu Pro Pro Gln Tyr His
65 70 75 80
Thr Thr Lys Gly Leu Pro Pro His Leu Asn Ala Thr Leu Lys Arg Ala
85 90 95
Phe Asp Met Ala Gly Pro His Phe Ser Asn Ile Leu Lys Thr Leu Ser
100 105 110
Pro Asp Leu Leu Ile Tyr Asp Phe Leu Gln Pro Trp Ala Pro Ala Ile
115 120 125
Ala Ala Ser Gln Asn Ile Pro Ala Ile Asn Phe Leu Ser Thr Gly Ala
130 135 140
Ala Met Thr Ser Phe Val Leu His Ala Met Lys Lys Pro Gly Asp Glu
145 150 155 160
Phe Pro Phe Pro Glu Ile His Leu Asp Glu Cys Met Lys Thr Arg Phe
165 170 175
Val Asp Leu Pro Glu Asp His Ser Pro Ser Asp Asp His Asn His Ile
180 185 190
Ser Asp Lys Asp Arg Ala Leu Lys Cys Phe Glu Arg Ser Ser Gly Phe
195 200 205
Val Met Met Lys Thr Phe Glu Glu Leu Glu Gly Lys Tyr Ile Asn Phe
210 215 220
Leu Ser His Leu Met Gln Lys Lys Ile Val Pro Val Gly Pro Leu Val
225 230 235 240
Gln Asn Pro Val Arg Gly Asp His Glu Lys Ala Lys Thr Leu Glu Trp
245 250 255
Leu Asp Lys Arg Lys Gln Ser Ser Ala Val Phe Val Ser Phe Gly Thr
260 265 270
Glu Tyr Phe Leu Ser Lys Glu Glu Met Glu Glu Ile Ala Tyr Gly Leu
275 280 285
Glu Leu Ser Asn Val Asn Phe Ile Trp Val Val Arg Phe Pro Glu Gly
290 295 300
Glu Lys Val Lys Leu Glu Glu Ala Leu Pro Glu Gly Phe Leu Gln Arg
305 310 315 320
Val Gly Glu Lys Gly Met Val Val Glu Gly Trp Ala Pro Gln Ala Lys
325 330 335
Ile Leu Met His Pro Ser Ile Gly Gly Phe Val Ser His Cys Gly Trp
340 345 350
Ser Ser Val Met Glu Ser Ile Asp Phe Gly Val Pro Ile Val Ala Ile
355 360 365
Pro Met Gln Leu Asp Gln Pro Val Asn Ala Lys Val Val Glu Gln Ala
370 375 380
Gly Val Gly Val Glu Val Lys Arg Asp Arg Asp Gly Lys Leu Glu Arg
385 390 395 400
Glu Glu Val Ala Thr Val Ile Arg Glu Val Val Met Gly Asn Ile Gly
405 410 415
Glu Ser Val Arg Lys Lys Glu Arg Glu Met Arg Asp Asn Ile Arg Lys
420 425 430
Lys Gly Glu Glu Lys Met Asp Gly Val Ala Gln Glu Leu Val Gln Leu
435 440 445
Tyr Gly Asn Gly Ile Lys Asn Val
450 455
<210> 57
<211> 456
<212> PRT
<213> Hevea brasiliensis
<400> 57
Met Glu Thr Leu Gln Arg Arg Lys Ile Ser Val Leu Met Phe Pro Trp
1 5 10 15
Leu Ala His Gly His Leu Ser Pro Phe Leu Glu Leu Ser Lys Lys Leu
20 25 30
Asn Lys Arg Asn Phe His Val Tyr Phe Cys Ser Thr Pro Val Asn Leu
35 40 45
Asp Ser Ile Lys Pro Lys Leu Ser Ala Glu Tyr Ser Phe Ser Ile Gln
50 55 60
Leu Val Glu Leu His Leu Pro Ser Ser Pro Glu Leu Pro Leu His Tyr
65 70 75 80
His Thr Thr Asn Gly Leu Pro Pro His Leu Met Lys Asn Leu Lys Asn
85 90 95
Ala Phe Asp Met Ala Ser Ser Ser Phe Phe Asn Ile Leu Lys Thr Leu
100 105 110
Lys Pro Asp Leu Leu Ile Tyr Asp Phe Ile Gln Pro Trp Ala Pro Ala
115 120 125
Leu Ala Ser Ser Leu Asn Ile Pro Ala Val Asn Phe Leu Cys Thr Ser
130 135 140
Met Ala Met Ser Cys Phe Gly Leu His Leu Asn Asn Gln Glu Ala Lys
145 150 155 160
Phe Pro Phe Pro Gly Ile Tyr Pro Arg Asp Tyr Met Arg Met Lys Val
165 170 175
Phe Gly Ala Leu Glu Ser Ser Ser Asn Asp Ile Lys Asp Gly Glu Arg
180 185 190
Ala Gly Arg Cys Met Asp Gln Ser Phe His Leu Ile Leu Ala Lys Thr
195 200 205
Phe Arg Glu Leu Glu Gly Lys Tyr Ile Asp Tyr Leu Ser Val Lys Leu
210 215 220
Met Lys Lys Ile Val Pro Val Gly Pro Leu Val Gln Asp Pro Ile Phe
225 230 235 240
Glu Asp Asp Glu Lys Ile Met Asp His His Gln Val Ile Lys Trp Leu
245 250 255
Glu Lys Lys Glu Arg Leu Ser Thr Val Phe Val Ser Phe Gly Thr Glu
260 265 270
Tyr Phe Leu Ser Thr Glu Glu Met Glu Glu Ile Ala Tyr Gly Leu Glu
275 280 285
Leu Ser Lys Ala His Phe Ile Trp Val Val Arg Phe Pro Thr Gly Glu
290 295 300
Lys Ile Asn Leu Glu Glu Ser Leu Pro Lys Arg Tyr Leu Glu Arg Val
305 310 315 320
Gln Glu Arg Gly Lys Ile Val Glu Gly Trp Ala Pro Gln Gln Lys Ile
325 330 335
Leu Arg His Ser Ser Ile Gly Gly Phe Val Ser His Cys Gly Trp Ser
340 345 350
Ser Ile Met Glu Ser Met Lys Phe Gly Val Pro Ile Ile Ala Met Pro
355 360 365
Met Asn Leu Asp Gln Pro Val Asn Ser Arg Ile Val Glu Asp Ala Gly
370 375 380
Val Gly Ile Glu Val Arg Arg Asn Lys Ser Gly Glu Leu Glu Arg Glu
385 390 395 400
Glu Ile Ala Lys Thr Ile Arg Lys Val Val Val Glu Lys Asp Gly Lys
405 410 415
Asn Val Ser Arg Lys Ala Arg Glu Met Ser Asp Thr Ile Arg Lys Lys
420 425 430
Gly Glu Glu Glu Ile Asp Gly Val Val Asp Glu Leu Leu Gln Leu Cys
435 440 445
Asp Val Lys Thr Asn Tyr Leu Gln
450 455
<210> 58
<211> 461
<212> PRT
<213> Manihot esculenta
<400> 58
Met Ala Thr Ala Gln Thr Arg Lys Ile Ser Val Leu Met Phe Pro Trp
1 5 10 15
Leu Ala His Gly His Leu Ser Pro Phe Leu Glu Leu Ser Lys Lys Leu
20 25 30
Ala Asn Arg Asn Phe His Val Tyr Phe Cys Ser Thr Pro Val Asn Leu
35 40 45
Asp Ser Ile Lys Pro Lys Leu Ser Pro Glu Tyr His Phe Ser Ile Gln
50 55 60
Phe Val Glu Leu His Leu Pro Ser Ser Pro Glu Leu Pro Ser His Tyr
65 70 75 80
His Thr Thr Asn Gly Leu Pro Pro His Leu Met Lys Thr Leu Lys Lys
85 90 95
Ala Phe Asp Met Ala Ser Ser Ser Phe Phe Asn Ile Leu Lys Thr Leu
100 105 110
Asn Pro Asp Leu Leu Ile Tyr Asp Phe Leu Gln Pro Trp Ala Pro Ala
115 120 125
Leu Ala Ser Ser Leu Asn Ile Pro Ala Val Asn Phe Leu Cys Ser Ser
130 135 140
Met Ala Met Ser Cys Phe Gly Leu Asn Leu Asn Lys Asn Lys Glu Ile
145 150 155 160
Lys Phe Leu Phe Pro Glu Ile Tyr Pro Arg Asp Tyr Met Glu Met Lys
165 170 175
Leu Phe Arg Val Phe Glu Ser Ser Ser Asn Gln Ile Lys Asp Gly Glu
180 185 190
Arg Ala Gly Arg Cys Ile Asp Gln Ser Phe His Val Ile Leu Ala Lys
195 200 205
Thr Phe Arg Glu Leu Glu Gly Lys Tyr Ile Asp Tyr Val Ser Val Lys
210 215 220
Cys Asn Lys Lys Ile Val Pro Val Gly Pro Leu Val Glu Asp Thr Ile
225 230 235 240
His Glu Asp Asp Glu Lys Thr Met Asp His His His His His His Asp
245 250 255
Glu Val Ile Lys Trp Leu Glu Lys Lys Glu Arg Ser Thr Thr Val Phe
260 265 270
Val Ser Phe Gly Ser Glu Tyr Phe Leu Ser Lys Glu Glu Met Glu Glu
275 280 285
Ile Ala His Gly Leu Glu Leu Ser Lys Val Asn Phe Ile Trp Val Val
290 295 300
Arg Phe Pro Lys Gly Glu Lys Ile Asn Leu Glu Glu Ser Leu Pro Glu
305 310 315 320
Gly Tyr Leu Glu Arg Ile Gln Glu Arg Gly Lys Ile Val Glu Gly Trp
325 330 335
Ala Pro Gln Arg Lys Ile Leu Gly His Ser Ser Ile Gly Gly Phe Val
340 345 350
Ser His Cys Gly Trp Ser Ser Ile Met Glu Ser Met Lys Leu Gly Val
355 360 365
Pro Ile Ile Ala Met Pro Met Asn Leu Asp Gln Pro Ile Asn Ser Arg
370 375 380
Ile Val Glu Ala Ala Gly Val Gly Ile Glu Val Ser Arg Asn Gln Ser
385 390 395 400
Gly Glu Leu Glu Arg Glu Glu Met Ala Lys Thr Ile Arg Lys Val Val
405 410 415
Val Glu Arg Glu Gly Val Tyr Val Arg Arg Lys Ala Arg Glu Met Ser
420 425 430
Asp Val Leu Arg Lys Lys Gly Glu Glu Glu Ile Asp Gly Val Val Asp
435 440 445
Glu Leu Val Gln Leu Cys Asp Met Lys Thr Asn Tyr Leu
450 455 460
<210> 59
<211> 452
<212> PRT
<213> Cephalotus follicularis
<400> 59
Met Asp Leu Lys Arg Arg Ser Ile Arg Val Leu Met Leu Pro Trp Leu
1 5 10 15
Ala His Gly His Ile Ser Pro Phe Leu Glu Leu Ala Lys Lys Leu Thr
20 25 30
Asn Arg Asn Phe Leu Ile Tyr Phe Cys Ser Thr Pro Ile Asn Leu Asn
35 40 45
Ser Ile Lys Pro Lys Leu Ser Ser Lys Tyr Ser Phe Ser Ile Gln Leu
50 55 60
Val Glu Leu His Leu Pro Ser Leu Pro Glu Leu Pro Pro His Tyr His
65 70 75 80
Thr Thr Asn Gly Leu Pro Leu His Leu Met Asn Thr Leu Lys Thr Ala
85 90 95
Phe Asp Met Ala Ser Pro Ser Phe Leu Asn Ile Leu Lys Thr Leu Lys
100 105 110
Pro Asp Leu Leu Ile Cys Asp His Leu Gln Pro Trp Ala Pro Ser Leu
115 120 125
Ala Ser Ser Leu Asn Ile Pro Ala Ile Ile Phe Pro Thr Asn Ser Ala
130 135 140
Ile Met Met Ala Phe Ser Leu His His Ala Lys Asn Pro Gly Glu Glu
145 150 155 160
Phe Pro Phe Pro Ser Ile Asn Ile Asn Asp Asp Met Val Lys Ser Ile
165 170 175
Asn Phe Leu His Ser Ala Ser Asn Gly Leu Thr Asp Met Asp Arg Val
180 185 190
Leu Gln Cys Leu Glu Arg Ser Ser Asn Thr Met Leu Leu Lys Thr Phe
195 200 205
Arg Gln Leu Glu Ala Lys Tyr Val Asp Tyr Ser Ser Ala Leu Leu Lys
210 215 220
Lys Lys Ile Val Leu Ala Gly Pro Leu Val Gln Val Pro Asp Asn Glu
225 230 235 240
Asp Glu Lys Ile Glu Ile Ile Lys Trp Leu Asp Ser Arg Gly Gln Ser
245 250 255
Ser Thr Val Phe Val Ser Phe Gly Ser Glu Tyr Phe Leu Ser Lys Glu
260 265 270
Glu Arg Glu Asp Ile Ala His Gly Leu Glu Leu Ser Lys Val Asn Phe
275 280 285
Ile Trp Val Val Arg Phe Pro Val Gly Glu Lys Val Lys Leu Glu Glu
290 295 300
Ala Leu Pro Asn Gly Phe Ala Glu Arg Ile Gly Glu Arg Gly Leu Val
305 310 315 320
Val Glu Gly Trp Ala Pro Gln Ala Met Ile Leu Ser His Ser Ser Ile
325 330 335
Gly Gly Phe Val Ser His Cys Gly Trp Ser Ser Met Met Glu Ser Met
340 345 350
Lys Phe Gly Val Pro Ile Ile Ala Met Pro Met His Ile Asp Gln Pro
355 360 365
Leu Asn Ala Arg Leu Val Glu Asp Val Gly Val Gly Leu Glu Ile Lys
370 375 380
Arg Asn Lys Asp Gly Arg Phe Glu Arg Glu Glu Leu Ala Arg Val Ile
385 390 395 400
Lys Glu Val Leu Val Tyr Lys Asn Gly Asp Ala Val Arg Ser Lys Ala
405 410 415
Arg Glu Met Ser Glu His Ile Lys Lys Asn Gly Asp Gln Glu Ile Asp
420 425 430
Gly Val Ala Asp Ala Leu Val Lys Leu Cys Glu Met Lys Thr Asn Ser
435 440 445
Leu Asn Gln Asp
450
<210> 60
<211> 451
<212> PRT
<213> Coffea arabica
<400> 60
Met Glu Asn His Ala Thr Phe Asn Val Leu Met Leu Pro Trp Leu Ala
1 5 10 15
His Gly His Val Ser Pro Tyr Leu Glu Leu Ala Lys Lys Leu Thr Ala
20 25 30
Arg Asn Phe Asn Val Tyr Leu Cys Ser Ser Pro Ala Thr Leu Ser Ser
35 40 45
Val Arg Ser Lys Leu Thr Glu Lys Phe Ser Gln Ser Ile His Leu Val
50 55 60
Glu Leu His Leu Pro Lys Leu Pro Glu Leu Pro Ala Glu Tyr His Thr
65 70 75 80
Thr Asn Gly Leu Pro Pro His Leu Met Pro Thr Leu Lys Asp Ala Phe
85 90 95
Asp Met Ala Lys Pro Asn Phe Cys Asn Val Leu Lys Ser Leu Lys Pro
100 105 110
Asp Leu Leu Ile Tyr Asp Leu Leu Gln Pro Trp Ala Pro Glu Ala Ala
115 120 125
Ser Ala Phe Asn Ile Pro Ala Val Val Phe Ile Ser Ser Ser Ala Thr
130 135 140
Met Thr Ser Phe Gly Leu His Phe Phe Lys Asn Pro Gly Thr Lys Tyr
145 150 155 160
Pro Tyr Gly Asn Ala Ile Phe Tyr Arg Asp Tyr Glu Ser Val Phe Val
165 170 175
Glu Asn Leu Thr Arg Arg Asp Arg Asp Thr Tyr Arg Val Ile Asn Cys
180 185 190
Met Glu Arg Ser Ser Lys Ile Ile Leu Ile Lys Gly Phe Asn Glu Ile
195 200 205
Glu Gly Lys Tyr Phe Asp Tyr Phe Ser Cys Leu Thr Gly Lys Lys Val
210 215 220
Val Pro Val Gly Pro Leu Val Gln Asp Pro Val Leu Asp Asp Glu Asp
225 230 235 240
Cys Arg Ile Met Gln Trp Leu Asn Lys Lys Glu Lys Gly Ser Thr Val
245 250 255
Phe Val Ser Phe Gly Ser Glu Tyr Phe Leu Ser Lys Lys Asp Met Glu
260 265 270
Glu Ile Ala His Gly Leu Glu Val Ser Asn Val Asp Phe Ile Trp Val
275 280 285
Val Arg Phe Pro Lys Gly Glu Asn Ile Val Ile Glu Glu Thr Leu Pro
290 295 300
Lys Gly Phe Phe Glu Arg Val Gly Glu Arg Gly Leu Val Val Asn Gly
305 310 315 320
Trp Ala Pro Gln Ala Lys Ile Leu Thr His Pro Asn Val Gly Gly Phe
325 330 335
Val Ser His Cys Gly Trp Asn Ser Val Met Glu Ser Met Lys Phe Gly
340 345 350
Leu Pro Ile Ile Ala Met Pro Met His Leu Asp Gln Pro Ile Asn Ala
355 360 365
Arg Leu Ile Glu Glu Val Gly Ala Gly Val Glu Val Leu Arg Asp Ser
370 375 380
Lys Gly Lys Leu His Arg Glu Arg Met Ala Glu Thr Ile Asn Lys Val
385 390 395 400
Met Lys Glu Ala Ser Gly Glu Ser Val Arg Lys Lys Ala Arg Glu Leu
405 410 415
Gln Glu Lys Leu Glu Leu Lys Gly Asp Glu Glu Ile Asp Asp Val Val
420 425 430
Lys Glu Leu Val Gln Leu Cys Ala Thr Lys Asn Lys Arg Asn Gly Leu
435 440 445
His Tyr Tyr
450
<210> 61
<211> 461
<212> PRT
<213> Cucurbita moschata
<400> 61
Met Glu Leu Ser Pro Thr His His Leu Leu Leu Phe Pro Phe Pro Ala
1 5 10 15
Lys Gly His Ile Lys Pro Phe Phe Ser Leu Ala Gln Leu Leu Cys Asn
20 25 30
Ala Gly Ala Arg Val Thr Phe Leu Asn Thr Asp His His His Arg Arg
35 40 45
Ile His Asp Leu Asp Arg Leu Ala Ala Gln Leu Pro Thr Leu His Phe
50 55 60
Asp Ser Val Ser Asp Gly Leu Pro Pro Asp Glu Ser Arg Asn Val Phe
65 70 75 80
Asp Gly Lys Leu Tyr Glu Ser Ile Arg Gln Val Thr Ser Ser Leu Phe
85 90 95
Arg Glu Leu Leu Val Ser Tyr Asn Asn Gly Thr Ser Ser Gly Arg Pro
100 105 110
Pro Ile Thr Cys Val Ile Thr Asp Cys Met Phe Arg Phe Pro Ile Asp
115 120 125
Ile Ala Glu Glu Leu Gly Ile Pro Val Phe Thr Phe Ser Thr Phe Ser
130 135 140
Ala Arg Phe Leu Phe Leu Phe Phe Trp Ile Pro Lys Leu Leu Glu Asp
145 150 155 160
Gly Gln Leu Arg Tyr Pro Glu Gln Glu Leu His Gly Val Pro Gly Ala
165 170 175
Glu Gly Leu Ile Arg Cys Lys Asp Leu Pro Gly Phe Leu Ser Asp Glu
180 185 190
Asp Val Ala His Trp Lys Pro Ile Asn Phe Val Asn Gln Ile Leu Ala
195 200 205
Thr Ser Arg Ser Ser Gly Leu Ile Leu Asn Thr Phe Asp Glu Leu Glu
210 215 220
Ala Pro Phe Leu Thr Ser Leu Ser Lys Ile Tyr Lys Lys Ile Tyr Ser
225 230 235 240
Leu Gly Pro Ile Asn Ser Leu Leu Lys Asn Phe Gln Ser Gln Pro Gln
245 250 255
Tyr Asn Leu Trp Lys Glu Asp His Ser Cys Met Ala Trp Leu Asp Ser
260 265 270
Gln Pro Pro Lys Ser Val Val Phe Val Ser Phe Gly Ser Val Val Lys
275 280 285
Leu Thr Asn Arg Gln Leu Val Glu Phe Trp Asn Gly Leu Val Asn Ser
290 295 300
Gly Lys Pro Phe Leu Leu Val Leu Arg Ser Asp Val Ile Glu Ala Gly
305 310 315 320
Glu Glu Val Val Arg Glu Asn Met Glu Arg Lys Ala Glu Gly Arg Trp
325 330 335
Met Ile Val Ser Trp Ala Pro Gln Glu Glu Val Leu Ala His Asp Ala
340 345 350
Val Gly Gly Phe Leu Thr His Ser Gly Trp Asn Ser Thr Leu Glu Ser
355 360 365
Leu Ala Ala Gly Val Pro Met Ile Ser Trp Thr Gln Ile Gly Asp Gln
370 375 380
Thr Ser Asn Ser Thr Trp Val Ser Lys Val Trp Arg Ile Gly Leu Gln
385 390 395 400
Leu Glu Asp Gly Phe Asp Ser Phe Thr Ile Glu Thr Met Val Arg Ser
405 410 415
Val Met Asp Gln Thr Met Glu Lys Thr Val Ala Glu Leu Ala Glu Arg
420 425 430
Ala Lys Asn Arg Ala Ser Lys Asn Gly Thr Ser Tyr Arg Asn Phe Gln
435 440 445
Thr Leu Ile Gln Asp Ile Thr Asn Ile Ile Glu Thr His
450 455 460
<210> 62
<211> 490
<212> PRT
<213> Arabidopsis thaliana
<400> 62
Met Gly Ser Ile Ser Glu Met Val Phe Glu Thr Cys Pro Ser Pro Asn
1 5 10 15
Pro Ile His Val Met Leu Val Ser Phe Gln Gly Gln Gly His Val Asn
20 25 30
Pro Leu Leu Arg Leu Gly Lys Leu Ile Ala Ser Lys Gly Leu Leu Val
35 40 45
Thr Phe Val Thr Thr Glu Leu Trp Gly Lys Lys Met Arg Gln Ala Asn
50 55 60
Lys Ile Val Asp Gly Glu Leu Lys Pro Val Gly Ser Gly Ser Ile Arg
65 70 75 80
Phe Glu Phe Phe Asp Glu Glu Trp Ala Glu Asp Asp Asp Arg Arg Ala
85 90 95
Asp Phe Ser Leu Tyr Ile Ala His Leu Glu Ser Val Gly Ile Arg Glu
100 105 110
Val Ser Lys Leu Val Arg Arg Tyr Glu Glu Ala Asn Glu Pro Val Ser
115 120 125
Cys Leu Ile Asn Asn Pro Phe Ile Pro Trp Val Cys His Val Ala Glu
130 135 140
Glu Phe Asn Ile Pro Cys Ala Val Leu Trp Val Gln Ser Cys Ala Cys
145 150 155 160
Phe Ser Ala Tyr Tyr His Tyr Gln Asp Gly Ser Val Ser Phe Pro Thr
165 170 175
Glu Thr Glu Pro Glu Leu Asp Val Lys Leu Pro Cys Val Pro Val Leu
180 185 190
Lys Asn Asp Glu Ile Pro Ser Phe Leu His Pro Ser Ser Arg Phe Thr
195 200 205
Gly Phe Arg Gln Ala Ile Leu Gly Gln Phe Lys Asn Leu Ser Lys Ser
210 215 220
Phe Cys Val Leu Ile Asp Ser Phe Asp Ser Leu Glu Arg Glu Val Ile
225 230 235 240
Asp Tyr Met Ser Ser Leu Cys Pro Val Lys Thr Val Gly Pro Leu Phe
245 250 255
Lys Val Ala Arg Thr Val Thr Ser Asp Val Ser Gly Asp Ile Cys Lys
260 265 270
Ser Thr Asp Lys Cys Leu Glu Trp Leu Asp Ser Arg Pro Lys Ser Ser
275 280 285
Val Val Tyr Ile Ser Phe Gly Thr Val Ala Tyr Leu Lys Gln Glu Gln
290 295 300
Ile Glu Glu Ile Ala His Gly Val Leu Lys Ser Gly Leu Ser Phe Leu
305 310 315 320
Trp Val Ile Arg Pro Pro Pro His Asp Leu Lys Val Glu Thr His Val
325 330 335
Leu Pro Gln Glu Leu Lys Glu Ser Ser Ala Lys Gly Lys Gly Met Ile
340 345 350
Val Asp Trp Cys Pro Gln Glu Gln Val Leu Ser His Pro Ser Val Ala
355 360 365
Cys Phe Val Thr His Cys Gly Trp Asn Ser Thr Met Glu Ser Leu Ser
370 375 380
Ser Gly Val Pro Val Val Cys Cys Pro Gln Trp Gly Asp Gln Val Thr
385 390 395 400
Asp Ala Val Tyr Leu Ile Asp Val Phe Lys Thr Gly Val Arg Leu Gly
405 410 415
Arg Gly Ala Thr Glu Glu Arg Val Val Pro Arg Glu Glu Val Ala Glu
420 425 430
Lys Leu Leu Glu Ala Thr Val Gly Glu Lys Ala Glu Glu Leu Arg Lys
435 440 445
Asn Ala Leu Lys Trp Lys Ala Glu Ala Glu Ala Ala Val Ala Pro Gly
450 455 460
Gly Ser Ser Asp Lys Asn Phe Arg Glu Phe Val Glu Lys Leu Gly Ala
465 470 475 480
Gly Val Thr Lys Thr Lys Asp Asn Gly Tyr
485 490
<210> 63
<211> 481
<212> PRT
<213> Arabidopsis thaliana
<400> 63
Met Gly Ser His Val Ala Gln Lys Gln His Val Val Cys Val Pro Tyr
1 5 10 15
Pro Ala Gln Gly His Ile Asn Pro Met Met Lys Val Ala Lys Leu Leu
20 25 30
Tyr Ala Lys Gly Phe His Ile Thr Phe Val Asn Thr Val Tyr Asn His
35 40 45
Asn Arg Leu Leu Arg Ser Arg Gly Pro Asn Ala Val Asp Gly Leu Pro
50 55 60
Ser Phe Arg Phe Glu Ser Ile Pro Asp Gly Leu Pro Glu Thr Asp Val
65 70 75 80
Asp Val Thr Gln Asp Ile Pro Thr Leu Cys Glu Ser Thr Met Lys His
85 90 95
Cys Leu Ala Pro Phe Lys Glu Leu Leu Arg Gln Ile Asn Ala Arg Asp
100 105 110
Asp Val Pro Pro Val Ser Cys Ile Val Ser Asp Gly Cys Met Ser Phe
115 120 125
Thr Leu Asp Ala Ala Glu Glu Leu Gly Val Pro Glu Val Leu Phe Trp
130 135 140
Thr Thr Ser Ala Cys Gly Phe Leu Ala Tyr Leu Tyr Tyr Tyr Arg Phe
145 150 155 160
Ile Glu Lys Gly Leu Ser Pro Ile Lys Asp Glu Ser Tyr Leu Thr Lys
165 170 175
Glu His Leu Asp Thr Lys Ile Asp Trp Ile Pro Ser Met Lys Asn Leu
180 185 190
Arg Leu Lys Asp Ile Pro Ser Phe Ile Arg Thr Thr Asn Pro Asp Asp
195 200 205
Ile Met Leu Asn Phe Ile Ile Arg Glu Ala Asp Arg Ala Lys Arg Ala
210 215 220
Ser Ala Ile Ile Leu Asn Thr Phe Asp Asp Leu Glu His Asp Val Ile
225 230 235 240
Gln Ser Met Lys Ser Ile Val Pro Pro Val Tyr Ser Ile Gly Pro Leu
245 250 255
His Leu Leu Glu Lys Gln Glu Ser Gly Glu Tyr Ser Glu Ile Gly Arg
260 265 270
Thr Gly Ser Asn Leu Trp Arg Glu Glu Thr Glu Cys Leu Asp Trp Leu
275 280 285
Asn Thr Lys Ala Arg Asn Ser Val Val Tyr Val Asn Phe Gly Ser Ile
290 295 300
Thr Val Leu Ser Ala Lys Gln Leu Val Glu Phe Ala Trp Gly Leu Ala
305 310 315 320
Ala Thr Gly Lys Glu Phe Leu Trp Val Ile Arg Pro Asp Leu Val Ala
325 330 335
Gly Asp Glu Ala Met Val Pro Pro Glu Phe Leu Thr Ala Thr Ala Asp
340 345 350
Arg Arg Met Leu Ala Ser Trp Cys Pro Gln Glu Lys Val Leu Ser His
355 360 365
Pro Ala Ile Gly Gly Phe Leu Thr His Cys Gly Trp Asn Ser Thr Leu
370 375 380
Glu Ser Leu Cys Gly Gly Val Pro Met Val Cys Trp Pro Phe Phe Ala
385 390 395 400
Glu Gln Gln Thr Asn Cys Lys Phe Ser Arg Asp Glu Trp Glu Val Gly
405 410 415
Ile Glu Ile Gly Gly Asp Val Lys Arg Glu Glu Val Glu Ala Val Val
420 425 430
Arg Glu Leu Met Asp Glu Glu Lys Gly Lys Asn Met Arg Glu Lys Ala
435 440 445
Glu Glu Trp Arg Arg Leu Ala Asn Glu Ala Thr Glu His Lys His Gly
450 455 460
Ser Ser Lys Leu Asn Phe Glu Met Leu Val Asn Lys Val Leu Leu Gly
465 470 475 480
Glu
<210> 64
<211> 438
<212> PRT
<213> Columba livia
<400> 64
Met Ile His Cys Gly Lys Lys His Ile Cys Ala Phe Val Thr Cys Ile
1 5 10 15
Leu Ile Ser Ala Ser Ile Leu Met Tyr Ser Trp Lys Asp Pro Gln Leu
20 25 30
Gln Asn Asn Ile Thr Arg Lys Ile Phe Gln Ala Thr Ser Ala Leu Pro
35 40 45
Ala Ser Gln Leu Cys Arg Gly Lys Pro Ala Gln Asn Val Ile Thr Ala
50 55 60
Leu Glu Asp Asn Arg Thr Phe Ile Ile Ser Pro Tyr Phe Asp Asp Arg
65 70 75 80
Glu Ser Lys Val Thr Arg Val Ile Gly Ile Val His His Glu Asp Val
85 90 95
Lys Gln Leu Tyr Cys Trp Phe Cys Cys Gln Pro Asp Gly Lys Ile Tyr
100 105 110
Val Ala Arg Ala Lys Ile Asp Val His Ser Asp Arg Phe Gly Phe Pro
115 120 125
Tyr Gly Ala Ala Asp Ile Val Cys Leu Glu Pro Glu Asn Cys Asn Pro
130 135 140
Thr His Val Ser Ile His Gln Ser Pro His Ala Asn Ile Asp Gln Leu
145 150 155 160
Pro Ser Phe Lys Ile Lys Asn Arg Lys Ser Glu Thr Phe Ser Val Asp
165 170 175
Phe Thr Val Cys Ile Ser Ala Met Phe Gly Asn Tyr Asn Asn Val Leu
180 185 190
Gln Phe Ile Gln Ser Val Glu Met Tyr Lys Ile Leu Gly Val Gln Lys
195 200 205
Val Val Ile Tyr Lys Asn Asn Cys Ser Gln Leu Met Glu Lys Val Leu
210 215 220
Lys Phe Tyr Met Glu Glu Gly Thr Val Glu Ile Ile Pro Trp Pro Ile
225 230 235 240
Asn Ser His Leu Lys Val Ser Thr Lys Trp His Phe Ser Met Asp Ala
245 250 255
Lys Asp Ile Gly Tyr Tyr Gly Gln Ile Thr Ala Leu Asn Asp Cys Ile
260 265 270
Tyr Arg Asn Met Gln Arg Ser Lys Phe Val Val Leu Asn Asp Ala Asp
275 280 285
Glu Ile Ile Leu Pro Leu Lys His Leu Asp Trp Lys Ala Met Met Ser
290 295 300
Ser Leu Gln Glu Gln Asn Pro Gly Ala Gly Ile Phe Leu Phe Glu Asn
305 310 315 320
His Ile Phe Pro Lys Thr Val Ser Thr Pro Val Phe Asn Ile Ser Ser
325 330 335
Trp Asn Arg Val Pro Gly Val Asn Ile Leu Gln His Val His Arg Glu
340 345 350
Pro Asp Arg Lys Glu Val Phe Asn Pro Lys Lys Met Ile Ile Asp Pro
355 360 365
Arg Gln Val Val Gln Thr Ser Val His Ser Val Leu Arg Ala Tyr Gly
370 375 380
Asn Ser Val Asn Val Pro Ala Asp Val Ala Leu Val Tyr His Cys Arg
385 390 395 400
Val Pro Leu Gln Glu Glu Leu Pro Arg Glu Ser Leu Ile Arg Asp Thr
405 410 415
Ala Leu Trp Arg Tyr Asn Ser Ser Leu Ile Thr Asn Val Asn Lys Val
420 425 430
Leu His Gln Thr Val Leu
435
<210> 65
<211> 252
<212> PRT
<213> Haemophilus ducreyi
<400> 65
Met Pro Thr Leu Thr Val Ala Met Ile Val Lys Asn Glu Ala Gln Asp
1 5 10 15
Leu Ala Glu Cys Leu Lys Thr Val Asp Gly Trp Val Asp Glu Ile Val
20 25 30
Ile Val Asp Ser Gly Ser Thr Asp Asp Thr Leu Lys Ile Ala Thr Gln
35 40 45
Phe Asn Ala Lys Val Tyr Val Asn Ser Asp Trp Gln Gly Phe Gly Pro
50 55 60
Gln Arg Gln Phe Ala Gln Gln Tyr Val Thr Ser Asp Tyr Val Leu Trp
65 70 75 80
Leu Asp Ala Asp Glu Arg Val Thr Pro Glu Leu Lys Ala Ser Ile Leu
85 90 95
Gln Ala Val Gln His Asn Gln Lys Asn Thr Val Tyr Lys Val Ser Arg
100 105 110
Leu Ser Glu Ile Phe Gly Lys Glu Ile Arg Tyr Ser Gly Trp Tyr Pro
115 120 125
Asp Tyr Val Val Arg Leu Tyr Pro Thr Tyr Leu Ala Lys Tyr Gly Asp
130 135 140
Glu Leu Val His Glu Lys Val His Tyr Pro Ala Asp Ser Arg Val Glu
145 150 155 160
Lys Leu Gln Gly Asp Leu Leu His Phe Thr Tyr Lys Asn Ile His His
165 170 175
Tyr Leu Val Lys Ser Ala Ser Tyr Ala Lys Ala Trp Ala Met Gln Arg
180 185 190
Ala Lys Ala Gly Lys Lys Ala Ser Leu Leu Asp Gly Val Thr His Ala
195 200 205
Ile Ala Cys Phe Leu Lys Met Tyr Leu Phe Lys Ala Gly Phe Leu Asp
210 215 220
Gly Lys Gln Gly Phe Leu Leu Ala Val Leu Ser Ala His Ser Thr Phe
225 230 235 240
Val Lys Tyr Ala Asp Leu Trp Asp Arg Thr Arg Ser
245 250
<210> 66
<211> 252
<212> PRT
<213> Neisseria gonorrhoeae
<400> 66
Met Lys Lys Val Ser Val Leu Ile Val Ala Lys Asn Glu Ala Asn His
1 5 10 15
Ile Arg Glu Cys Ile Glu Ser Cys Arg Phe Asp Lys Glu Val Ile Val
20 25 30
Ile Asp Asp His Ser Ala Asp Asn Thr Ala Glu Ile Ala Glu Gly Leu
35 40 45
Gly Ala Lys Val Phe Arg Arg His Leu Asn Gly Asp Phe Gly Ala Gln
50 55 60
Lys Thr Phe Ala Ile Glu Gln Ala Gly Gly Glu Trp Val Phe Leu Ile
65 70 75 80
Asp Ala Asp Glu Arg Cys Thr Pro Glu Leu Ser Asp Glu Ile Ser Lys
85 90 95
Ile Val Arg Thr Gly Asp Tyr Ala Ala Tyr Phe Val Glu Arg Arg Asn
100 105 110
Leu Phe Pro Asn His Pro Ala Thr His Gly Ala Met Arg Pro Asp Ser
115 120 125
Val Cys Arg Leu Met Pro Lys Lys Gly Gly Ser Val Gln Gly Lys Val
130 135 140
His Glu Thr Val Gln Thr Pro Tyr Pro Glu Arg Arg Leu Lys His Phe
145 150 155 160
Met Tyr His Tyr Thr Tyr Asp Asn Trp Glu Gln Tyr Phe Asn Lys Phe
165 170 175
Asn Lys Tyr Thr Ser Ile Ser Ala Glu Lys Tyr Arg Glu Gln Gly Lys
180 185 190
Pro Val Ser Phe Val Arg Asp Ile Ile Leu Arg Pro Ile Trp Gly Phe
195 200 205
Phe Lys Ile Tyr Ile Leu Asn Lys Gly Phe Leu Asp Gly Lys Met Gly
210 215 220
Trp Ile Met Ser Val Asn His Ser Tyr Tyr Thr Met Ile Lys Tyr Val
225 230 235 240
Lys Leu Tyr Tyr Leu Tyr Lys Ser Gly Gly Lys Phe
245 250
<210> 67
<211> 309
<212> PRT
<213> Rhizobium meliloti
<400> 67
Met Pro Asn Glu Thr Leu His Ile Asp Ile Gly Val Cys Thr Tyr Arg
1 5 10 15
Arg Pro Glu Leu Ala Glu Thr Leu Arg Ser Leu Ala Ala Met Asn Val
20 25 30
Pro Glu Arg Ala Arg Leu Arg Val Ile Val Ala Asp Asn Asp Ala Glu
35 40 45
Pro Ser Ala Arg Ala Leu Val Glu Gly Leu Arg Pro Glu Met Pro Phe
50 55 60
Asp Ile Leu Tyr Val His Cys Pro His Ser Asn Ile Ser Ile Ala Arg
65 70 75 80
Asn Cys Cys Leu Asp Asn Ser Thr Gly Asp Phe Leu Ala Phe Leu Asp
85 90 95
Asp Asp Glu Thr Val Ser Gly Asp Trp Leu Thr Arg Leu Leu Glu Thr
100 105 110
Ala Arg Thr Thr Gly Ala Ala Ala Val Leu Gly Pro Val Arg Ala His
115 120 125
Tyr Gly Pro Thr Ala Pro Arg Trp Met Arg Ser Gly Asp Phe His Ser
130 135 140
Thr Leu Pro Val Trp Ala Lys Gly Glu Ile Arg Thr Gly Tyr Thr Cys
145 150 155 160
Asn Ala Leu Leu Arg Arg Asp Ala Ala Ser Leu Leu Gly Arg Arg Phe
165 170 175
Lys Leu Ser Leu Gly Lys Ser Gly Gly Glu Asp Thr Asp Phe Phe Thr
180 185 190
Gly Met His Cys Ala Gly Gly Thr Ile Ala Phe Ser Pro Glu Ala Trp
195 200 205
Val His Glu Pro Val Pro Glu Asn Arg Ala Ser Leu Ala Trp Leu Ala
210 215 220
Lys Arg Arg Phe Arg Ser Gly Gln Thr His Gly Arg Leu Leu Ala Glu
225 230 235 240
Lys Ala His Gly Leu Arg Gln Ala Trp Asn Ile Ala Leu Ala Gly Ala
245 250 255
Lys Ser Gly Phe Cys Ala Thr Ala Ala Val Leu Cys Phe Pro Ser Ala
260 265 270
Ala Arg Arg Asn Arg Phe Ala Leu Arg Ala Val Leu His Ala Gly Val
275 280 285
Ile Ser Gly Leu Leu Gly Leu Lys Glu Ile Glu Gln Tyr Gly Ala Arg
290 295 300
Glu Val Thr Ser Ala
305
<210> 68
<211> 861
<212> PRT
<213> Rhizobium radiobacter
<400> 68
Met Cys Arg Cys Gly Arg Ala Val Arg Ser Arg Pro Val Cys Arg Pro
1 5 10 15
Gly Gln Leu Val Val Arg Arg Ser Pro Arg Pro Arg Ser Arg Asn His
20 25 30
Ser Arg Cys Arg Pro Leu Arg Leu Ser Val Phe Pro Arg Pro His Arg
35 40 45
Arg Val Arg His His Cys Gln Arg Asp Leu Arg Trp Glu Pro Gly Arg
50 55 60
Trp Ile Ala Val Arg Trp Lys Ala Ala Arg Ser His Arg Arg Phe Arg
65 70 75 80
Arg Cys Pro Phe Pro Arg Gln Leu Val Trp Pro Val Arg Glu Arg His
85 90 95
Arg Asp Ala Gly Asp Arg Arg Asn Gln Arg Glu Arg Arg Arg Arg Asp
100 105 110
Ala Tyr His Glu Ile Ser Glu Pro Lys Phe Arg Thr Arg Lys Arg Thr
115 120 125
Glu Ser Phe Trp Met Asn Lys Ala Ile Thr Val Ile Val Trp Leu Leu
130 135 140
Val Ser Leu Cys Val Leu Ala Ile Ile Thr Met Pro Val Ser Leu Gln
145 150 155 160
Thr His Leu Val Ala Thr Ala Ile Ser Leu Ile Leu Leu Ala Thr Ile
165 170 175
Lys Ser Phe Asn Gly Gln Gly Ala Trp Arg Leu Val Ala Leu Gly Phe
180 185 190
Gly Thr Ala Ile Val Leu Arg Tyr Val Tyr Trp Arg Thr Thr Ser Thr
195 200 205
Leu Pro Pro Val Asn Gln Leu Glu Asn Phe Ile Pro Gly Phe Leu Leu
210 215 220
Tyr Leu Ala Glu Met Tyr Ser Val Val Met Leu Gly Leu Ser Leu Val
225 230 235 240
Ile Val Ser Met Pro Leu Pro Ser Arg Lys Thr Arg Pro Gly Ser Pro
245 250 255
Asp Tyr Arg Pro Thr Val Asp Val Phe Val Pro Ser Tyr Asn Glu Asp
260 265 270
Ala Glu Leu Leu Ala Asn Thr Leu Ala Ala Ala Lys Asn Met Asp Tyr
275 280 285
Pro Ala Asp Arg Phe Thr Val Trp Leu Leu Asp Asp Gly Gly Ser Val
290 295 300
Gln Lys Arg Asn Ala Ala Asn Ile Val Glu Ala Gln Ala Ala Gln Arg
305 310 315 320
Arg His Glu Glu Leu Lys Lys Leu Cys Glu Asp Leu Asp Val Arg Tyr
325 330 335
Leu Thr Arg Glu Arg Asn Val His Ala Lys Ala Gly Asn Leu Asn Asn
340 345 350
Gly Leu Ala His Ser Thr Gly Glu Leu Val Thr Val Phe Asp Ala Asp
355 360 365
His Ala Pro Ala Arg Asp Phe Leu Leu Glu Thr Val Gly Tyr Phe Asp
370 375 380
Glu Asp Pro Arg Leu Phe Leu Val Gln Thr Pro His Phe Phe Val Asn
385 390 395 400
Pro Asp Pro Ile Glu Arg Asn Leu Arg Thr Phe Glu Thr Met Pro Ser
405 410 415
Glu Asn Glu Met Phe Tyr Gly Ile Ile Gln Arg Gly Leu Asp Lys Trp
420 425 430
Asn Gly Ala Phe Phe Cys Gly Ser Ala Ala Val Leu Arg Arg Glu Ala
435 440 445
Leu Gln Asp Ser Asp Gly Phe Ser Gly Val Ser Ile Thr Glu Asp Cys
450 455 460
Glu Thr Ala Leu Ala Leu His Ser Arg Gly Trp Asn Ser Val Tyr Val
465 470 475 480
Asp Lys Pro Leu Ile Ala Gly Leu Gln Pro Ala Thr Phe Ala Ser Phe
485 490 495
Ile Gly Gln Arg Ser Arg Trp Ala Gln Gly Met Met Gln Ile Leu Ile
500 505 510
Phe Arg Gln Pro Leu Phe Lys Arg Gly Leu Ser Phe Thr Gln Arg Leu
515 520 525
Cys Tyr Met Ser Ser Thr Leu Phe Trp Leu Phe Pro Phe Pro Arg Thr
530 535 540
Ile Phe Leu Phe Ala Pro Leu Phe Tyr Leu Phe Phe Asp Leu Gln Ile
545 550 555 560
Phe Val Ala Ser Gly Gly Glu Phe Leu Ala Tyr Thr Ala Ala Tyr Met
565 570 575
Leu Val Asn Leu Met Met Gln Asn Tyr Leu Tyr Gly Ser Phe Arg Trp
580 585 590
Pro Trp Ile Ser Glu Leu Tyr Glu Tyr Val Gln Thr Val His Leu Leu
595 600 605
Pro Ala Val Val Ser Val Ile Phe Asn Pro Gly Lys Pro Thr Phe Lys
610 615 620
Val Thr Ala Lys Asp Glu Ser Ile Ala Glu Ala Arg Leu Ser Glu Ile
625 630 635 640
Ser Arg Pro Phe Phe Val Ile Phe Ala Leu Leu Leu Val Ala Met Ala
645 650 655
Phe Ala Val Trp Arg Ile Tyr Ser Glu Pro Tyr Lys Ala Asp Val Thr
660 665 670
Leu Val Val Gly Gly Trp Asn Leu Leu Asn Leu Ile Phe Ala Gly Cys
675 680 685
Ala Leu Gly Val Val Ser Glu Arg Gly Asp Lys Ser Ala Ser Arg Arg
690 695 700
Ile Thr Val Lys Arg Arg Cys Glu Val Gln Leu Gly Gly Ser Asp Thr
705 710 715 720
Trp Val Pro Ala Ser Ile Asp Asn Val Ser Val His Gly Leu Leu Ile
725 730 735
Asn Ile Phe Asp Ser Ala Thr Asn Ile Glu Lys Gly Ala Thr Ala Ile
740 745 750
Val Lys Val Lys Pro His Ser Glu Gly Val Pro Glu Thr Met Pro Leu
755 760 765
Asn Val Val Arg Thr Val Arg Gly Glu Gly Phe Val Ser Ile Gly Cys
770 775 780
Thr Phe Ser Pro Gln Arg Ala Val Asp His Arg Leu Ile Ala Asp Leu
785 790 795 800
Ile Phe Ala Asn Ser Glu Gln Trp Ser Glu Phe Gln Arg Val Arg Arg
805 810 815
Lys Lys Pro Gly Leu Ile Arg Gly Thr Ala Ile Phe Leu Ala Ile Ala
820 825 830
Leu Phe Gln Thr Gln Arg Gly Leu Tyr Tyr Leu Val Arg Ala Arg Arg
835 840 845
Pro Ala Pro Lys Ser Ala Lys Pro Val Gly Ala Val Lys
850 855 860
<210> 69
<211> 315
<212> PRT
<213> Streptococcus agalactiae
<400> 69
Met Ile Lys Lys Ile Glu Lys Asp Leu Ile Ser Val Ile Val Pro Ile
1 5 10 15
Tyr Asn Val Glu Asp Tyr Leu Val Glu Cys Ile Glu Ser Leu Ile Val
20 25 30
Gln Thr Tyr Arg Asn Ile Glu Ile Leu Leu Ile Asn Asp Gly Ser Thr
35 40 45
Asp Asn Cys Ala Thr Ile Ala Lys Glu Phe Ser Glu Arg Asp Cys Arg
50 55 60
Val Ile Tyr Ile Glu Lys Ser Asn Gly Gly Leu Ser Glu Ala Arg Asn
65 70 75 80
Tyr Gly Ile Tyr His Ser Lys Gly Lys Tyr Leu Thr Phe Val Asp Ser
85 90 95
Asp Asp Lys Val Ser Ser Asp Tyr Ile Ala Asn Leu Tyr Asn Ala Ile
100 105 110
Gln Lys His Asp Ser Ser Ile Ala Ile Gly Gly Tyr Leu Glu Phe Tyr
115 120 125
Glu Arg His Asn Ser Ile Arg Asn Tyr Glu Tyr Leu Asp Lys Val Ile
130 135 140
Pro Val Glu Glu Ala Leu Leu Asn Met Tyr Asp Ile Lys Thr Tyr Gly
145 150 155 160
Ser Ile Phe Ile Thr Ala Trp Gly Lys Leu Phe His Lys Ser Ile Phe
165 170 175
Asn Asp Leu Glu Phe Ala Leu Asn Lys Tyr His Glu Asp Glu Phe Phe
180 185 190
Asn Tyr Lys Ala Tyr Leu Lys Ala Asn Ser Ile Thr Tyr Ile Asp Lys
195 200 205
Pro Leu Tyr His Tyr Arg Ile Arg Val Gly Ser Ile Met Asn Asn Ser
210 215 220
Asp Asn Val Ile Ile Ala Arg Lys Lys Leu Asp Val Leu Ser Ala Leu
225 230 235 240
Asp Glu Arg Ile Lys Leu Ile Thr Ser Leu Arg Lys Tyr Ser Val Phe
245 250 255
Leu Gln Lys Thr Glu Ile Phe Tyr Val Asn Gln Tyr Phe Arg Thr Lys
260 265 270
Lys Phe Leu Lys Gln Gln Ser Val Met Phe Lys Glu Asp Asn Tyr Ile
275 280 285
Asp Ala Tyr Arg Met Tyr Gly Arg Leu Leu Arg Lys Val Lys Leu Val
290 295 300
Asp Lys Leu Lys Leu Ile Lys Asn Arg Phe Phe
305 310 315
<210> 70
<211> 416
<212> PRT
<213> Streptococcus pneumoniae
<400> 70
Met Tyr Thr Phe Ile Leu Met Leu Leu Asp Phe Phe Gln Asn His Asp
1 5 10 15
Phe His Phe Phe Met Leu Phe Phe Val Phe Ile Leu Ile Arg Trp Ala
20 25 30
Val Ile Tyr Phe His Ala Val Arg Tyr Lys Ser Tyr Ser Cys Ser Val
35 40 45
Ser Asp Glu Lys Leu Phe Ser Ser Val Ile Ile Pro Val Val Asp Glu
50 55 60
Pro Leu Asn Leu Phe Glu Ser Val Leu Asn Arg Ile Ser Arg His Lys
65 70 75 80
Pro Ser Glu Ile Ile Val Val Ile Asn Gly Pro Lys Asn Glu Arg Leu
85 90 95
Val Lys Leu Cys His Asp Phe Asn Glu Lys Leu Glu Asn Asn Met Thr
100 105 110
Pro Ile Gln Cys Tyr Tyr Thr Pro Val Pro Gly Lys Arg Asn Ala Ile
115 120 125
Arg Val Gly Leu Glu His Val Asp Ser Gln Ser Asp Ile Thr Val Leu
130 135 140
Val Asp Ser Asp Thr Val Trp Thr Pro Arg Thr Leu Ser Glu Leu Leu
145 150 155 160
Lys Pro Phe Val Cys Asp Lys Lys Ile Gly Gly Val Thr Thr Arg Gln
165 170 175
Lys Ile Leu Asp Pro Glu Arg Asn Leu Val Thr Met Phe Ala Asn Leu
180 185 190
Leu Glu Glu Ile Arg Ala Glu Gly Thr Met Lys Ala Met Ser Val Thr
195 200 205
Gly Lys Val Gly Cys Leu Pro Gly Arg Thr Ile Ala Phe Arg Asn Ile
210 215 220
Val Glu Arg Val Tyr Thr Lys Phe Ile Glu Glu Thr Phe Met Gly Phe
225 230 235 240
His Lys Glu Val Ser Asp Asp Arg Ser Leu Thr Asn Leu Thr Leu Lys
245 250 255
Lys Gly Tyr Lys Thr Val Met Gln Asp Thr Ser Val Val Tyr Thr Asp
260 265 270
Ala Pro Thr Ser Trp Lys Lys Phe Ile Arg Gln Gln Leu Arg Trp Ala
275 280 285
Glu Gly Ser Gln Tyr Asn Asn Leu Lys Met Thr Pro Trp Met Ile Arg
290 295 300
Asn Ala Pro Leu Met Phe Phe Ile Tyr Phe Thr Asp Met Ile Leu Pro
305 310 315 320
Met Leu Leu Ile Ser Phe Gly Val Asn Ile Phe Leu Leu Lys Ile Leu
325 330 335
Asn Ile Thr Thr Ile Val Tyr Thr Ala Ser Trp Trp Glu Ile Ile Leu
340 345 350
Tyr Val Leu Leu Gly Met Ile Phe Ser Phe Gly Gly Arg Asn Phe Lys
355 360 365
Ala Met Ser Arg Met Lys Trp Tyr Tyr Val Phe Leu Ile Pro Val Phe
370 375 380
Ile Ile Val Leu Ser Ile Ile Met Cys Pro Ile Arg Leu Leu Gly Leu
385 390 395 400
Met Arg Cys Ser Asp Asp Leu Gly Trp Gly Thr Arg Asn Leu Thr Glu
405 410 415
<210> 71
<211> 496
<212> PRT
<213> Arabidopsis thaliana
<400> 71
Met Ala Thr Glu Lys Thr His Gln Phe His Pro Ser Leu His Phe Val
1 5 10 15
Leu Phe Pro Phe Met Ala Gln Gly His Met Ile Pro Met Ile Asp Ile
20 25 30
Ala Arg Leu Leu Ala Gln Arg Gly Val Thr Ile Thr Ile Val Thr Thr
35 40 45
Pro His Asn Ala Ala Arg Phe Lys Asn Val Leu Asn Arg Ala Ile Glu
50 55 60
Ser Gly Leu Ala Ile Asn Ile Leu His Val Lys Phe Pro Tyr Gln Glu
65 70 75 80
Phe Gly Leu Pro Glu Gly Lys Glu Asn Ile Asp Ser Leu Asp Ser Thr
85 90 95
Glu Leu Met Val Pro Phe Phe Lys Ala Val Asn Leu Leu Glu Asp Pro
100 105 110
Val Met Lys Leu Met Glu Glu Met Lys Pro Arg Pro Ser Cys Leu Ile
115 120 125
Ser Asp Trp Cys Leu Pro Tyr Thr Ser Ile Ile Ala Lys Asn Phe Asn
130 135 140
Ile Pro Lys Ile Val Phe His Gly Met Gly Cys Phe Asn Leu Leu Cys
145 150 155 160
Met His Val Leu Arg Arg Asn Leu Glu Ile Leu Glu Asn Val Lys Ser
165 170 175
Asp Glu Glu Tyr Phe Leu Val Pro Ser Phe Pro Asp Arg Val Glu Phe
180 185 190
Thr Lys Leu Gln Leu Pro Val Lys Ala Asn Ala Ser Gly Asp Trp Lys
195 200 205
Glu Ile Met Asp Glu Met Val Lys Ala Glu Tyr Thr Ser Tyr Gly Val
210 215 220
Ile Val Asn Thr Phe Gln Glu Leu Glu Pro Pro Tyr Val Lys Asp Tyr
225 230 235 240
Lys Glu Ala Met Asp Gly Lys Val Trp Ser Ile Gly Pro Val Ser Leu
245 250 255
Cys Asn Lys Ala Gly Ala Asp Lys Ala Glu Arg Gly Ser Lys Ala Ala
260 265 270
Ile Asp Gln Asp Glu Cys Leu Gln Trp Leu Asp Ser Lys Glu Glu Gly
275 280 285
Ser Val Leu Tyr Val Cys Leu Gly Ser Ile Cys Asn Leu Pro Leu Ser
290 295 300
Gln Leu Lys Glu Leu Gly Leu Gly Leu Glu Glu Ser Arg Arg Ser Phe
305 310 315 320
Ile Trp Val Ile Arg Gly Ser Glu Lys Tyr Lys Glu Leu Phe Glu Trp
325 330 335
Met Leu Glu Ser Gly Phe Glu Glu Arg Ile Lys Glu Arg Gly Leu Leu
340 345 350
Ile Lys Gly Trp Ala Pro Gln Val Leu Ile Leu Ser His Pro Ser Val
355 360 365
Gly Gly Phe Leu Thr His Cys Gly Trp Asn Ser Thr Leu Glu Gly Ile
370 375 380
Thr Ser Gly Ile Pro Leu Ile Thr Trp Pro Leu Phe Gly Asp Gln Phe
385 390 395 400
Cys Asn Gln Lys Leu Val Val Gln Val Leu Lys Ala Gly Val Ser Ala
405 410 415
Gly Val Glu Glu Val Met Lys Trp Gly Glu Glu Asp Lys Ile Gly Val
420 425 430
Leu Val Asp Lys Glu Gly Val Lys Lys Ala Val Glu Glu Leu Met Gly
435 440 445
Asp Ser Asp Asp Ala Lys Glu Arg Arg Arg Arg Val Lys Glu Leu Gly
450 455 460
Glu Leu Ala His Lys Ala Val Glu Lys Gly Gly Ser Ser His Ser Asn
465 470 475 480
Ile Thr Leu Leu Leu Gln Asp Ile Met Gln Leu Ala Gln Phe Lys Asn
485 490 495
<210> 72
<211> 466
<212> PRT
<213> Hordeum vulgare
<400> 72
Met Ala Gln Ala Glu Ser Glu Arg Met Arg Val Val Met Phe Pro Trp
1 5 10 15
Leu Ala His Gly His Ile Asn Pro Tyr Leu Glu Leu Ala Lys Arg Leu
20 25 30
Ile Ala Ser Ala Ser Gly Asp His His Leu Asp Val Val Val His Leu
35 40 45
Val Ser Thr Pro Ala Asn Leu Ala Pro Leu Ala His His Gln Thr Asp
50 55 60
Arg Leu Arg Leu Val Glu Leu His Leu Pro Ser Leu Pro Asp Leu Pro
65 70 75 80
Pro Ala Leu His Thr Thr Lys Gly Leu Pro Ala Arg Leu Met Pro Val
85 90 95
Leu Lys Arg Ala Cys Asp Leu Ala Ala Pro Arg Phe Gly Ala Leu Leu
100 105 110
Asp Glu Leu Cys Pro Asp Ile Leu Val Tyr Asp Phe Ile Gln Pro Trp
115 120 125
Ala Pro Leu Glu Ala Glu Ala Arg Gly Val Pro Ala Phe His Phe Ala
130 135 140
Thr Cys Gly Ala Ala Ala Thr Ala Phe Phe Ile His Cys Leu Lys Thr
145 150 155 160
Asp Arg Pro Pro Ser Ala Phe Pro Phe Glu Ser Ile Ser Leu Gly Gly
165 170 175
Val Asp Glu Asp Ala Lys Tyr Thr Ala Leu Val Thr Val Arg Glu Asp
180 185 190
Ser Thr Ala Leu Val Ala Glu Arg Asp Arg Leu Pro Leu Ser Leu Glu
195 200 205
Arg Ser Ser Gly Phe Val Ala Val Lys Ser Ser Ala Asp Ile Glu Arg
210 215 220
Lys Tyr Met Glu Tyr Leu Ser Gln Leu Leu Gly Lys Glu Ile Ile Pro
225 230 235 240
Thr Gly Pro Leu Leu Val Asp Ser Gly Gly Ser Glu Glu Gln Arg Asp
245 250 255
Gly Gly Arg Ile Met Arg Trp Leu Asp Gly Glu Glu Pro Gly Ser Val
260 265 270
Val Phe Val Ser Phe Gly Ser Glu Tyr Phe Met Ser Glu His Gln Met
275 280 285
Ala Gln Met Ala Arg Gly Leu Glu Leu Ser Gly Val Pro Phe Leu Trp
290 295 300
Val Val Arg Phe Pro Asn Ala Glu Asp Asp Ala Arg Gly Ala Ala Arg
305 310 315 320
Ser Met Pro Pro Gly Phe Glu Pro Glu Leu Gly Leu Val Val Glu Gly
325 330 335
Trp Ala Pro Gln Arg Arg Ile Leu Ser His Pro Ser Cys Gly Ala Phe
340 345 350
Leu Thr His Cys Gly Trp Ser Ser Val Leu Glu Ser Met Ala Ala Gly
355 360 365
Val Pro Met Val Ala Leu Pro Leu His Ile Asp Gln Pro Leu Asn Ala
370 375 380
Asn Leu Ala Val Glu Leu Gly Ala Ala Ala Ala Arg Val Lys Gln Glu
385 390 395 400
Arg Phe Gly Glu Phe Thr Ala Glu Glu Val Ala Arg Ala Val Arg Ala
405 410 415
Ala Val Lys Gly Lys Glu Gly Glu Ala Ala Arg Arg Arg Ala Arg Glu
420 425 430
Leu Gln Glu Val Val Ala Arg Asn Asn Gly Asn Asp Gly Gln Ile Ala
435 440 445
Thr Leu Leu Gln Arg Met Ala Arg Leu Cys Gly Lys Asp Gln Ala Val
450 455 460
Pro Asn
465
<210> 73
<211> 476
<212> PRT
<213> Hordeum vulgare
<400> 73
Met Ala Glu Ala Asn Asp Gly Gly Lys Met His Val Val Met Leu Pro
1 5 10 15
Trp Leu Ala Phe Gly His Val Leu Pro Phe Thr Glu Phe Ala Lys Arg
20 25 30
Val Ala Arg Gln Gly His Arg Val Thr Leu Leu Ser Ala Pro Arg Asn
35 40 45
Thr Arg Arg Leu Ile Asp Ile Pro Pro Gly Leu Ala Gly Leu Ile Arg
50 55 60
Val Val His Val Pro Leu Pro Arg Val Asp Gly Leu Pro Glu His Ala
65 70 75 80
Glu Ala Thr Ile Asp Leu Pro Ser Asp His Leu Arg Pro Cys Leu Arg
85 90 95
Arg Ala Phe Asp Ala Ala Phe Glu Arg Glu Leu Ser Arg Leu Leu Gln
100 105 110
Glu Glu Ala Lys Pro Asp Trp Val Leu Val Asp Tyr Ala Ser Tyr Trp
115 120 125
Ala Pro Thr Ala Ala Ala Arg His Gly Val Pro Cys Ala Phe Leu Ser
130 135 140
Leu Phe Gly Ala Ala Ala Leu Ser Phe Phe Gly Thr Pro Glu Thr Leu
145 150 155 160
Leu Gly Ile Gly Arg His Ala Lys Thr Glu Pro Ala His Leu Thr Val
165 170 175
Val Pro Glu Tyr Val Pro Phe Pro Thr Thr Val Ala Tyr Arg Gly Tyr
180 185 190
Glu Ala Arg Glu Leu Phe Glu Pro Gly Met Val Pro Asp Asp Ser Gly
195 200 205
Val Ser Glu Gly Tyr Arg Phe Ala Lys Thr Ile Glu Gly Cys Gln Leu
210 215 220
Val Gly Ile Arg Ser Ser Ser Glu Phe Glu Pro Glu Trp Leu Arg Leu
225 230 235 240
Leu Gly Glu Leu Tyr Arg Lys Pro Val Ile Pro Val Gly Leu Phe Pro
245 250 255
Pro Ala Pro Gln Asp Asp Val Ala Gly His Glu Ala Thr Leu Arg Trp
260 265 270
Leu Asp Gly Gln Ala Pro Ser Ser Val Val Tyr Ala Ala Phe Gly Ser
275 280 285
Glu Val Lys Leu Thr Gly Ala Gln Leu Gln Arg Ile Ala Leu Gly Leu
290 295 300
Glu Ala Ser Gly Leu Pro Phe Ile Trp Ala Phe Arg Ala Pro Thr Ser
305 310 315 320
Thr Glu Thr Gly Ala Ala Ser Gly Gly Leu Pro Glu Gly Phe Glu Glu
325 330 335
Arg Leu Ala Gly Arg Gly Val Val Cys Arg Gly Trp Val Pro Gln Val
340 345 350
Lys Phe Leu Ala His Ala Ser Val Gly Gly Phe Leu Thr His Ala Gly
355 360 365
Trp Asn Ser Ile Ala Glu Gly Leu Ala His Gly Val Arg Leu Val Leu
370 375 380
Leu Pro Leu Val Phe Glu Gln Gly Leu Asn Ala Arg Asn Ile Val Asp
385 390 395 400
Lys Asn Ile Gly Val Glu Val Ala Arg Asp Glu Gln Asp Gly Ser Phe
405 410 415
Ala Ala Gly Asp Ile Ala Ala Ala Leu Arg Arg Val Met Val Glu Asp
420 425 430
Glu Gly Glu Gly Phe Gly Ala Lys Val Lys Glu Leu Ala Lys Val Phe
435 440 445
Gly Asp Asp Glu Val Asn Asp Gln Cys Val Arg Glu Phe Leu Met His
450 455 460
Leu Ser Asp His Ser Lys Lys Asn Gln Gly Gln Asp
465 470 475
<210> 74
<211> 453
<212> PRT
<213> Coffea canephora
<400> 74
Met Ala Glu Asn His Ala Thr Phe Asn Val Leu Met Leu Pro Trp Leu
1 5 10 15
Ala His Gly His Val Ser Pro Tyr Leu Glu Leu Ala Met Lys Leu Thr
20 25 30
Ala Arg Asn Phe Asn Val Tyr Leu Cys Ser Ser Pro Ala Thr Leu Ser
35 40 45
Ser Val Arg Ser Lys Leu Thr Glu Lys Phe Ser Gln Ser Ile His Leu
50 55 60
Val Glu Leu His Leu Pro Lys Leu Pro Glu Leu Pro Ala Glu Tyr His
65 70 75 80
Thr Thr Asn Gly Leu Pro Pro His Leu Met Pro Thr Leu Lys Asp Ala
85 90 95
Phe Asp Met Ala Lys Pro Asn Phe Cys Asn Val Leu Lys Ser Leu Lys
100 105 110
Pro Asp Leu Leu Ile Tyr Asp Leu Leu Gln Pro Trp Ala Pro Glu Ala
115 120 125
Ala Ser Ala Phe Asn Ile Pro Ala Val Val Phe Ile Ser Ser Ser Ala
130 135 140
Thr Met Thr Ser Phe Gly Leu His Phe Phe Lys Asn Pro Gly Thr Lys
145 150 155 160
Tyr Pro Tyr Gly Asn Thr Ile Phe Tyr Arg Asp Tyr Glu Ser Val Phe
165 170 175
Val Glu Asn Leu Lys Lys Arg Asp Arg Asp Thr Tyr Arg Val Val Asn
180 185 190
Cys Met Glu Arg Ser Ser Lys Ile Ile Leu Ile Lys Gly Phe Lys Glu
195 200 205
Ile Glu Gly Lys Tyr Phe Asp Tyr Phe Ser Cys Leu Thr Gly Lys Lys
210 215 220
Val Val Pro Val Gly Pro Leu Val Gln Asp Pro Val Leu Asp Asp Glu
225 230 235 240
Asp Cys Arg Ile Met Gln Trp Leu Asn Lys Lys Glu Lys Gly Ser Thr
245 250 255
Val Phe Val Ser Phe Gly Ser Glu Tyr Phe Leu Ser Lys Glu Asp Met
260 265 270
Glu Glu Ile Ala His Gly Leu Glu Leu Ser Asn Val Asp Phe Ile Trp
275 280 285
Val Val Arg Phe Pro Lys Gly Glu Asn Ile Val Ile Glu Glu Thr Leu
290 295 300
Pro Lys Gly Phe Phe Glu Arg Val Gly Glu Arg Gly Leu Val Val Asn
305 310 315 320
Gly Trp Ala Pro Gln Ala Lys Ile Leu Thr His Pro Asn Val Gly Gly
325 330 335
Phe Val Ser His Cys Gly Trp Asn Ser Val Met Glu Ser Met Lys Phe
340 345 350
Gly Leu Pro Ile Val Ala Met Pro Met His Leu Asp Gln Pro Ile Asn
355 360 365
Ala Arg Leu Ile Glu Glu Val Gly Ala Gly Val Glu Val Leu Arg Asp
370 375 380
Ser Lys Gly Lys Leu His Arg Glu Arg Met Ala Glu Thr Ile Asn Lys
385 390 395 400
Val Thr Lys Glu Ala Ser Gly Glu Pro Ala Arg Lys Lys Ala Arg Glu
405 410 415
Leu Gln Glu Lys Leu Glu Leu Lys Gly Asp Glu Glu Ile Asp Asp Val
420 425 430
Val Lys Glu Leu Val Gln Leu Cys Ala Thr Lys Asn Lys Arg Asn Gly
435 440 445
Leu His Cys Tyr Asn
450
<210> 75
<211> 452
<212> PRT
<213> Coffea eugenioides
<400> 75
Met Ala Glu Asn His Ala Thr Phe Asn Val Leu Met Leu Pro Trp Leu
1 5 10 15
Ala His Gly His Val Ser Pro Tyr Leu Glu Leu Ala Lys Lys Leu Thr
20 25 30
Ala Arg Asn Phe Asn Val Tyr Leu Cys Ser Ser Pro Ala Thr Leu Ser
35 40 45
Ser Val Arg Ser Lys Leu Thr Glu Lys Phe Ser Gln Ser Ile His Leu
50 55 60
Val Glu Leu His Leu Pro Lys Leu Pro Glu Leu Pro Ala Glu Tyr His
65 70 75 80
Thr Thr Asn Gly Leu Pro Pro His Leu Met Pro Thr Leu Lys Asp Ala
85 90 95
Phe Asp Met Ala Glu Pro Asn Phe Cys Asn Val Leu Lys Ser Leu Lys
100 105 110
Pro Asp Leu Leu Ile Tyr Asp Leu Leu Gln Pro Trp Ala Pro Glu Ala
115 120 125
Ala Ser Ala Phe Asn Ile Pro Ala Val Val Phe Ile Ser Ser Ser Ala
130 135 140
Thr Met Thr Ser Phe Gly Leu His Phe Phe Lys Asn Pro Gly Thr Lys
145 150 155 160
Tyr Pro Tyr Gly Asn Thr Ile Phe Tyr Arg Asp Tyr Glu Ser Val Phe
165 170 175
Val Glu Asn Leu Lys Arg Arg Asp Arg Asp Thr Tyr Arg Val Val Asn
180 185 190
Cys Met Glu Arg Ser Ser Lys Ile Ile Leu Ile Lys Gly Phe Lys Glu
195 200 205
Ile Glu Gly Lys Tyr Phe Asp Tyr Phe Ser Cys Leu Thr Gly Lys Lys
210 215 220
Val Val Pro Val Gly Pro Leu Val Gln Asp Pro Val Leu Asp Asp Glu
225 230 235 240
Asp Cys Arg Ile Met Gln Trp Leu Asn Lys Lys Glu Lys Gly Ser Thr
245 250 255
Val Phe Val Ser Phe Gly Ser Glu Tyr Phe Leu Ser Lys Glu Asp Met
260 265 270
Glu Glu Ile Ala His Gly Leu Glu Leu Ser Asn Val Asp Phe Ile Trp
275 280 285
Val Val Arg Phe Pro Lys Gly Glu Asn Ile Val Ile Glu Glu Thr Leu
290 295 300
Pro Lys Gly Phe Phe Glu Arg Val Gly Glu Arg Gly Leu Val Val Asn
305 310 315 320
Gly Trp Ala Pro Gln Ala Lys Ile Leu Thr His Pro Asn Val Gly Gly
325 330 335
Phe Val Ser His Cys Gly Trp Asn Ser Val Met Glu Ser Met Lys Phe
340 345 350
Gly Leu Pro Ile Ile Ala Met Pro Met His Leu Asp Gln Pro Ile Asn
355 360 365
Ala Arg Leu Ile Glu Glu Val Gly Ala Gly Val Glu Val Leu Arg Asp
370 375 380
Ser Lys Gly Lys Leu His Arg Glu Arg Met Ala Glu Thr Ile Asn Lys
385 390 395 400
Val Thr Lys Glu Ala Ser Gly Glu Ser Val Arg Lys Lys Ala Arg Glu
405 410 415
Leu Gln Glu Lys Leu Glu Leu Lys Gly Asp Glu Glu Ile Asp Asp Val
420 425 430
Val Lys Glu Leu Val Gln Leu Cys Ala Thr Lys Asn Lys Arg Asn Gly
435 440 445
Leu His Tyr Asn
450
<210> 76
<211> 452
<212> PRT
<213> Coffea eugenioides
<400> 76
Met Ala Glu Asn His Ala Thr Phe Asn Val Leu Met Leu Pro Trp Leu
1 5 10 15
Ala His Gly His Val Ser Pro Tyr Leu Glu Leu Ala Lys Lys Leu Thr
20 25 30
Ala Arg Asn Phe Asn Val Tyr Leu Cys Ser Ser Pro Ala Thr Leu Ser
35 40 45
Ser Val Arg Ser Lys Leu Thr Glu Lys Phe Ser Gln Ser Ile His Leu
50 55 60
Val Glu Leu His Leu Pro Lys Leu Pro Glu Leu Pro Ala Glu Tyr His
65 70 75 80
Thr Thr Asn Gly Leu Pro Pro His Leu Met Pro Thr Leu Lys Asp Ala
85 90 95
Phe Asp Met Ala Lys Pro Asn Phe Cys Asn Val Leu Lys Ser Leu Lys
100 105 110
Pro Asp Leu Leu Ile Tyr Asp Leu Leu Gln Pro Trp Ala Pro Glu Ala
115 120 125
Ala Ser Ala Phe Asn Ile Pro Ala Val Val Phe Ile Ser Ser Ser Ala
130 135 140
Thr Met Thr Ser Phe Gly Leu His Phe Phe Lys Asn Pro Gly Thr Lys
145 150 155 160
Tyr Pro Tyr Gly Asn Ala Ile Phe Tyr Arg Asp Tyr Glu Ser Val Phe
165 170 175
Val Glu Asn Leu Thr Arg Arg Asp Arg Asp Thr Tyr Arg Val Ile Asn
180 185 190
Cys Met Glu Arg Ser Ser Lys Ile Ile Leu Ile Lys Gly Phe Asn Glu
195 200 205
Ile Glu Gly Lys Tyr Phe Asp Tyr Phe Ser Cys Leu Thr Gly Lys Lys
210 215 220
Val Val Pro Val Gly Pro Leu Val Gln Asp Pro Val Leu Asp Asp Glu
225 230 235 240
Asp Cys Glu Ile Met Gln Trp Leu Asn Lys Lys Glu Lys Val Ser Thr
245 250 255
Val Phe Val Ser Phe Gly Ser Glu Tyr Phe Leu Ser Lys Lys Asp Met
260 265 270
Glu Glu Ile Ala His Gly Leu Glu Leu Ser Asn Val Asp Phe Ile Trp
275 280 285
Val Val Arg Phe Pro Lys Gly Glu Asn Ile Val Ile Glu Glu Thr Leu
290 295 300
Pro Lys Gly Phe Phe Glu Arg Val Gly Glu Arg Gly Leu Val Val Asn
305 310 315 320
Gly Trp Ala Pro Gln Ala Lys Ile Leu Thr His Pro Asn Val Gly Gly
325 330 335
Phe Val Ser His Cys Gly Trp Asn Ser Val Met Glu Ser Met Lys Phe
340 345 350
Gly Leu Pro Ile Ile Ala Met Pro Met His Leu Asp Gln Pro Ile Asn
355 360 365
Ala Arg Leu Ile Glu Glu Val Gly Ala Gly Val Glu Val Leu Arg Asp
370 375 380
Ser Lys Gly Lys Leu His Arg Glu Arg Met Ala Glu Thr Ile Asn Lys
385 390 395 400
Val Met Lys Glu Ala Ser Gly Glu Ser Val Arg Lys Lys Ala Arg Glu
405 410 415
Leu Gln Glu Lys Met Asp Leu Lys Gly Asp Glu Glu Ile Asp Asp Val
420 425 430
Val Lys Glu Leu Val Gln Leu Cys Ala Thr Lys Asn Lys Arg Asn Gly
435 440 445
Leu His Tyr Tyr
450
<210> 77
<211> 453
<212> PRT
<213> Siraitia grosvenorii
<400> 77
Met Ala Asp Ala Ala Gln Gln Gly Asp Thr Thr Thr Ile Leu Met Leu
1 5 10 15
Pro Trp Leu Gly Tyr Gly His Leu Ser Ala Phe Leu Glu Leu Ala Lys
20 25 30
Ser Leu Ser Arg Arg Asn Phe His Ile Tyr Phe Cys Ser Thr Ser Val
35 40 45
Asn Leu Asp Ala Ile Lys Pro Lys Leu Pro Ser Ser Phe Ser Asp Ser
50 55 60
Ile Gln Phe Val Glu Leu His Leu Pro Ser Ser Pro Glu Phe Pro Pro
65 70 75 80
His Leu His Thr Thr Asn Gly Leu Pro Pro Thr Leu Met Pro Ala Leu
85 90 95
His Gln Ala Phe Ser Met Ala Ala Gln His Phe Glu Ser Ile Leu Gln
100 105 110
Thr Leu Ala Pro His Leu Leu Ile Tyr Asp Ser Leu Gln Pro Trp Ala
115 120 125
Pro Arg Val Ala Ser Ser Leu Lys Ile Pro Ala Ile Asn Phe Asn Thr
130 135 140
Thr Gly Val Phe Val Ile Ser Gln Gly Leu His Pro Ile His Tyr Pro
145 150 155 160
His Ser Lys Phe Pro Phe Ser Glu Phe Val Leu His Asn His Trp Lys
165 170 175
Ala Met Tyr Ser Thr Ala Asp Gly Ala Ser Thr Glu Arg Thr Arg Lys
180 185 190
Arg Gly Glu Ala Phe Leu Tyr Cys Leu His Ala Ser Cys Ser Val Ile
195 200 205
Leu Ile Asn Ser Phe Arg Glu Leu Glu Gly Lys Tyr Met Asp Tyr Leu
210 215 220
Ser Val Leu Leu Asn Lys Lys Val Val Pro Val Gly Pro Leu Val Tyr
225 230 235 240
Glu Pro Asn Gln Asp Gly Glu Asp Glu Gly Tyr Ser Ser Ile Lys Asn
245 250 255
Trp Leu Asp Lys Lys Glu Pro Ser Ser Thr Val Phe Val Ser Phe Gly
260 265 270
Ser Glu Tyr Phe Pro Ser Lys Glu Glu Met Glu Glu Ile Ala His Gly
275 280 285
Leu Glu Ala Ser Glu Val Asn Phe Ile Trp Val Val Arg Phe Pro Gln
290 295 300
Gly Asp Asn Thr Ser Gly Ile Glu Asp Ala Leu Pro Lys Gly Phe Leu
305 310 315 320
Glu Arg Ala Gly Glu Arg Gly Met Val Val Lys Gly Trp Ala Pro Gln
325 330 335
Ala Lys Ile Leu Lys His Trp Ser Thr Gly Gly Phe Val Ser His Cys
340 345 350
Gly Trp Asn Ser Val Met Glu Ser Met Met Phe Gly Val Pro Ile Ile
355 360 365
Gly Val Pro Met His Val Asp Gln Pro Phe Asn Ala Gly Leu Val Glu
370 375 380
Glu Ala Gly Val Gly Val Glu Ala Lys Arg Asp Pro Asp Gly Lys Ile
385 390 395 400
Gln Arg Asp Glu Val Ala Lys Leu Ile Lys Glu Val Val Val Glu Lys
405 410 415
Thr Arg Glu Asp Val Arg Lys Lys Ala Arg Glu Met Ser Glu Ile Leu
420 425 430
Arg Ser Lys Gly Glu Glu Lys Phe Asp Glu Met Val Ala Glu Ile Ser
435 440 445
Leu Leu Leu Lys Ile
450
<210> 78
<211> 474
<212> PRT
<213> Oryza sativa
<400> 78
Met Ala Gln Ala Glu Arg Glu Arg Leu Arg Val Leu Met Phe Pro Trp
1 5 10 15
Leu Ala His Gly His Ile Asn Pro Tyr Leu Glu Leu Ala Thr Arg Leu
20 25 30
Thr Thr Thr Ser Ser Ser Gln Ile Asp Val Val Val His Leu Val Ser
35 40 45
Thr Pro Val Asn Leu Ala Ala Val Ala His Arg Arg Thr Asp Arg Ile
50 55 60
Ser Leu Val Glu Leu His Leu Pro Glu Leu Pro Gly Leu Pro Pro Ala
65 70 75 80
Leu His Thr Thr Lys His Leu Pro Pro Arg Leu Met Pro Ala Leu Lys
85 90 95
Arg Ala Cys Asp Leu Ala Ala Pro Ala Phe Gly Ala Leu Leu Asp Glu
100 105 110
Leu Ser Pro Asp Val Val Leu Tyr Asp Phe Ile Gln Pro Trp Ala Pro
115 120 125
Leu Glu Ala Ala Ala Arg Gly Val Pro Ala Val His Phe Ser Thr Cys
130 135 140
Ser Ala Ala Ala Thr Ala Phe Phe Leu His Phe Leu Asp Gly Gly Gly
145 150 155 160
Gly Gly Gly Gly Arg Gly Ala Phe Pro Phe Glu Ala Ile Ser Leu Gly
165 170 175
Gly Ala Glu Glu Asp Ala Arg Tyr Thr Met Leu Thr Cys Arg Asp Asp
180 185 190
Gly Thr Ala Leu Leu Pro Lys Gly Glu Arg Leu Pro Leu Ser Phe Ala
195 200 205
Arg Ser Ser Glu Phe Val Ala Val Lys Thr Cys Val Glu Ile Glu Ser
210 215 220
Lys Tyr Met Asp Tyr Leu Ser Lys Leu Val Gly Lys Glu Ile Ile Pro
225 230 235 240
Cys Gly Pro Leu Leu Val Asp Ser Gly Asp Val Ser Ala Gly Ser Glu
245 250 255
Ala Asp Gly Val Met Arg Trp Leu Asp Gly Gln Glu Pro Gly Ser Val
260 265 270
Val Leu Val Ser Phe Gly Ser Glu Tyr Phe Met Thr Glu Lys Gln Leu
275 280 285
Ala Glu Met Ala Arg Gly Leu Glu Leu Ser Gly Ala Ala Phe Val Trp
290 295 300
Val Val Arg Phe Pro Gln Gln Ser Pro Asp Gly Asp Glu Asp Asp His
305 310 315 320
Gly Ala Ala Ala Ala Arg Ala Met Pro Pro Gly Phe Ala Pro Ala Arg
325 330 335
Gly Leu Val Val Glu Gly Trp Ala Pro Gln Arg Arg Val Leu Ser His
340 345 350
Arg Ser Cys Gly Ala Phe Leu Thr His Cys Gly Trp Ser Ser Val Met
355 360 365
Glu Ser Met Ser Ala Gly Val Pro Met Val Ala Leu Pro Leu His Ile
370 375 380
Asp Gln Pro Val Gly Ala Asn Leu Ala Ala Glu Leu Gly Val Ala Ala
385 390 395 400
Arg Val Arg Gln Glu Arg Phe Gly Glu Phe Glu Ala Glu Glu Val Ala
405 410 415
Arg Ala Val Arg Ala Val Met Arg Gly Gly Glu Ala Leu Arg Arg Arg
420 425 430
Ala Thr Glu Leu Arg Glu Val Val Ala Arg Arg Asp Ala Glu Cys Asp
435 440 445
Glu Gln Ile Gly Ala Leu Leu His Arg Met Ala Arg Leu Cys Gly Lys
450 455 460
Gly Thr Gly Arg Ala Ala Gln Leu Gly His
465 470
<210> 79
<211> 443
<212> PRT
<213> Panax ginseng
<400> 79
Met Ala Asp Asn Gln Asn Gly Arg Ile Ser Ile Ala Leu Leu Pro Phe
1 5 10 15
Leu Ala His Gly His Ile Ser Pro Phe Phe Glu Leu Ala Lys Gln Leu
20 25 30
Ala Lys Arg Asn Cys Asn Val Phe Leu Cys Ser Thr Pro Ile Asn Leu
35 40 45
Ser Ser Ile Lys Asp Lys Asp Ser Ser Ala Ser Ile Lys Leu Val Glu
50 55 60
Leu His Leu Pro Ser Ser Pro Asp Leu Pro Pro His Tyr His Thr Thr
65 70 75 80
Asn Gly Leu Pro Ser His Leu Met Leu Pro Leu Arg Asn Ala Phe Glu
85 90 95
Thr Ala Gly Pro Thr Phe Ser Glu Ile Leu Lys Thr Leu Asn Pro Asp
100 105 110
Leu Leu Ile Tyr Asp Phe Asn Pro Ser Trp Ala Pro Glu Ile Ala Ser
115 120 125
Ser His Asn Ile Pro Ala Val Tyr Phe Leu Thr Thr Ala Ala Ala Ser
130 135 140
Ser Ser Ile Gly Leu His Ala Phe Lys Asn Pro Gly Glu Lys Tyr Pro
145 150 155 160
Phe Pro Asp Phe Tyr Asp Asn Ser Asn Ile Thr Pro Glu Pro Pro Ser
165 170 175
Ala Asp Asn Met Lys Leu Leu His Asp Phe Ile Ala Cys Phe Glu Arg
180 185 190
Ser Cys Asp Ile Ile Leu Ile Lys Ser Phe Arg Glu Leu Glu Gly Lys
195 200 205
Tyr Ile Asp Leu Leu Ser Thr Leu Ser Asp Lys Thr Leu Val Pro Val
210 215 220
Gly Pro Leu Val Gln Asp Pro Met Gly His Asn Glu Asp Pro Lys Thr
225 230 235 240
Glu Gln Ile Ile Asn Trp Leu Asp Lys Arg Ala Glu Ser Thr Val Val
245 250 255
Phe Val Cys Phe Gly Ser Glu Tyr Phe Leu Ser Asn Glu Glu Leu Glu
260 265 270
Glu Val Ala Ile Gly Leu Glu Ile Ser Thr Val Asn Phe Ile Trp Ala
275 280 285
Val Arg Leu Ile Glu Gly Glu Lys Lys Gly Ile Leu Pro Glu Gly Phe
290 295 300
Val Gln Arg Val Gly Asp Arg Gly Leu Val Val Glu Gly Trp Ala Pro
305 310 315 320
Gln Ala Arg Ile Leu Gly His Ser Ser Thr Gly Gly Phe Val Ser His
325 330 335
Cys Gly Trp Ser Ser Ile Ala Glu Ser Met Lys Phe Gly Val Pro Val
340 345 350
Ile Ala Met Ala Arg His Leu Asp Gln Pro Leu Asn Gly Lys Leu Ala
355 360 365
Ala Glu Val Gly Val Gly Met Glu Val Val Arg Asp Glu Asn Gly Lys
370 375 380
Tyr Lys Arg Glu Gly Ile Ala Glu Val Ile Arg Lys Val Val Val Glu
385 390 395 400
Lys Ser Gly Glu Val Ile Arg Arg Lys Ala Arg Glu Leu Ser Glu Lys
405 410 415
Met Lys Glu Lys Gly Glu Gln Glu Ile Asp Arg Ala Leu Glu Glu Leu
420 425 430
Val Gln Ile Cys Lys Lys Lys Lys Asp Glu Gln
435 440
<210> 80
<211> 499
<212> PRT
<213> Stevia rebaudiana
<400> 80
Met Ala His His His His His His Val Gly Thr Gly Ser Asn Asp Asp
1 5 10 15
Asp Asp Lys Ser Pro Asp Pro Asn Trp Ala Ser Thr Ser Glu Leu Val
20 25 30
Phe Ile Pro Ser Pro Gly Ala Gly His Leu Pro Pro Thr Val Glu Leu
35 40 45
Ala Lys Leu Leu Leu His Arg Asp Gln Arg Leu Ser Val Thr Ile Ile
50 55 60
Val Met Asn Leu Trp Leu Gly Pro Lys His Asn Thr Glu Ala Arg Pro
65 70 75 80
Cys Val Pro Ser Leu Arg Phe Val Asp Ile Pro Cys Asp Glu Ser Thr
85 90 95
Met Ala Leu Ile Ser Pro Asn Thr Phe Ile Ser Ala Phe Val Glu His
100 105 110
His Lys Pro Arg Val Arg Asp Ile Val Arg Gly Ile Ile Glu Ser Asp
115 120 125
Ser Val Arg Leu Ala Gly Phe Val Leu Asp Met Phe Cys Met Pro Met
130 135 140
Ser Asp Val Ala Asn Glu Phe Gly Val Pro Ser Tyr Asn Tyr Phe Thr
145 150 155 160
Ser Gly Ala Ala Thr Leu Gly Leu Met Phe His Leu Gln Trp Lys Arg
165 170 175
Asp His Glu Gly Tyr Asp Ala Thr Glu Leu Lys Asn Ser Asp Thr Glu
180 185 190
Leu Ser Val Pro Ser Tyr Val Asn Pro Val Pro Ala Lys Val Leu Pro
195 200 205
Glu Val Val Leu Asp Lys Glu Gly Gly Ser Lys Met Phe Leu Asp Leu
210 215 220
Ala Glu Arg Ile Arg Glu Ser Lys Gly Ile Ile Val Asn Ser Cys Gln
225 230 235 240
Ala Ile Glu Arg His Ala Leu Glu Tyr Leu Ser Ser Asn Asn Asn Gly
245 250 255
Ile Pro Pro Val Phe Pro Val Gly Pro Ile Leu Asn Leu Glu Asn Lys
260 265 270
Lys Asp Asp Ala Lys Thr Asp Glu Ile Met Arg Trp Leu Asn Glu Gln
275 280 285
Pro Glu Ser Ser Val Val Phe Leu Cys Phe Gly Ser Met Gly Ser Phe
290 295 300
Asn Glu Lys Gln Val Lys Glu Ile Ala Val Ala Ile Glu Arg Ser Gly
305 310 315 320
His Arg Phe Leu Trp Ser Leu Arg Arg Pro Thr Pro Lys Glu Lys Ile
325 330 335
Glu Phe Pro Lys Glu Tyr Glu Asn Leu Glu Glu Val Leu Pro Glu Gly
340 345 350
Phe Leu Lys Arg Thr Ser Ser Ile Gly Lys Val Ile Gly Trp Ala Pro
355 360 365
Gln Met Ala Val Leu Ser His Pro Ser Val Gly Gly Phe Val Ser His
370 375 380
Cys Gly Trp Asn Ser Thr Leu Glu Ser Met Trp Cys Gly Val Pro Met
385 390 395 400
Ala Ala Trp Pro Leu Tyr Ala Glu Gln Thr Leu Asn Ala Phe Leu Leu
405 410 415
Val Val Glu Leu Gly Leu Ala Ala Glu Ile Arg Met Asp Tyr Arg Thr
420 425 430
Asp Thr Lys Ala Gly Tyr Asp Gly Gly Met Glu Val Thr Val Glu Glu
435 440 445
Ile Glu Asp Gly Ile Arg Lys Leu Met Ser Asp Gly Glu Ile Arg Asn
450 455 460
Lys Val Lys Asp Val Lys Glu Lys Ser Arg Ala Ala Val Val Glu Gly
465 470 475 480
Gly Ser Ser Tyr Ala Ser Ile Gly Lys Phe Ile Glu His Val Ser Asn
485 490 495
Val Thr Ile
<210> 81
<211> 494
<212> PRT
<213> Camelina sativa
<400> 81
Met Ala Ser Glu Lys Thr Leu Gln Val His Pro Pro Leu His Phe Val
1 5 10 15
Leu Phe Pro Phe Met Ala Gln Gly His Met Ile Pro Met Val Asp Ile
20 25 30
Ala Arg Leu Leu Ala Gln Arg Gly Ala Thr Val Thr Ile Val Thr Thr
35 40 45
Arg Tyr Asn Ala Gly Arg Phe Glu Asn Val Leu Ser Arg Ala Val Glu
50 55 60
Ser Gly Leu Pro Ile Asn Ile Val His Val Lys Phe Pro Tyr Glu Glu
65 70 75 80
Val Gly Leu Pro Lys Gly Lys Glu Asn Ile Asp Ser Leu Asp Ser Met
85 90 95
Glu Leu Met Val Pro Phe Phe Lys Ala Val Asn Met Leu Gln Asp Pro
100 105 110
Val Val Lys Leu Met Glu Glu Met Glu Ser Arg Pro Ser Cys Ile Ile
115 120 125
Ser Asp Leu Leu Leu Pro Tyr Thr Ser Lys Ile Ala Lys Lys Phe Asn
130 135 140
Ile Pro Lys Ile Val Phe His Gly Ile Ser Cys Phe Cys Leu Leu Cys
145 150 155 160
Val His Val Leu Arg Arg Asn Leu Glu Ile Leu Thr Asn Leu Lys Ser
165 170 175
Asp Lys Glu Tyr Phe Leu Val Pro Ser Phe Pro Asp Arg Val Glu Phe
180 185 190
Thr Lys Pro Gln Val Thr Val Glu Thr Asn Ala Ser Gly Asp Trp Lys
195 200 205
Glu Phe Leu Asp Glu Met Val Glu Ala Glu Asp Thr Ser Tyr Gly Val
210 215 220
Ile Ile Asn Thr Phe Glu Glu Leu Glu Pro Ala Tyr Val Lys Asp Tyr
225 230 235 240
Lys Asp Ala Arg Ala Gly Asn Val Trp Ser Ile Gly Pro Val Ser Leu
245 250 255
Cys Asn Lys Ala Gly Val Asp Lys Ala Glu Arg Gly Asn Lys Ala Thr
260 265 270
Ile Asp Gln Asp Glu Cys Leu Lys Trp Leu Asp Ser Lys Glu Glu Gly
275 280 285
Ser Val Leu Tyr Val Cys Leu Gly Ser Ile Cys Asn Leu Pro Leu Val
290 295 300
Gln Leu Lys Glu Leu Gly Leu Gly Leu Glu Glu Ser Gln Arg Pro Phe
305 310 315 320
Ile Trp Val Ile Arg Gly Trp Glu Lys Tyr Asn Glu Leu Ser Glu Trp
325 330 335
Met Val Glu Ser Gly Phe Glu Glu Arg Ile Arg Glu Arg Gly Leu Leu
340 345 350
Ile Arg Gly Trp Ala Pro Gln Val Leu Ile Leu Ser His Pro Ser Val
355 360 365
Gly Gly Phe Leu Thr His Cys Gly Trp Asn Ser Thr Val Glu Gly Ile
370 375 380
Thr Ser Gly Val Pro Leu Ile Thr Trp Pro Leu Phe Gly Asp Gln Phe
385 390 395 400
Cys Asn Gln Thr Leu Val Val Gln Val Leu Lys Ala Gly Val Ser Val
405 410 415
Gly Val Glu Glu Val Met Lys Trp Gly Glu Glu Glu Lys Ile Gly Val
420 425 430
Leu Val Asp Lys Glu Gly Val Lys Lys Ala Val Glu Asp Leu Met Gly
435 440 445
Glu Ser Asp Asp Ala Lys Glu Arg Thr Lys Arg Val Lys Glu Leu Gly
450 455 460
Gly Leu Ala His Lys Ala Val Glu Glu Gly Gly Ser Ser His Ser Asn
465 470 475 480
Ile Thr Leu Phe Leu Gln Asp Ile Arg Gln Val Gln Ser Val
485 490
<210> 82
<211> 478
<212> PRT
<213> Glycyrrhiza uralensis
<400> 82
Met Ala Asp Val Ala Glu Glu Gln Pro Leu Lys Ile Tyr Phe Ile Pro
1 5 10 15
Tyr Leu Ala Ala Gly His Met Ile Pro Leu Cys Asp Ile Ala Thr Leu
20 25 30
Phe Ala Ser Arg Gly His His Val Thr Ile Ile Thr Thr Pro Ser Asn
35 40 45
Ala Gln Thr Leu Arg Glu Ser His His Phe Arg Val Gln Thr Ile Gln
50 55 60
Phe Pro Ser Gln Glu Val Gly Leu Pro Ala Gly Val Gln Asn Leu Thr
65 70 75 80
Ala Val Thr Asn Leu Asp Asp Ser Tyr Lys Ile Tyr His Ala Thr Met
85 90 95
Leu Leu Arg Lys His Ile Glu Asp Phe Val Glu Arg Asp Pro Pro Asp
100 105 110
Cys Ile Val Ala Asp Phe Leu Phe Pro Trp Val Asp Asp Val Ala Thr
115 120 125
Lys Leu His Ile Pro Arg Leu Val Phe Asn Gly Phe Thr Leu Phe Thr
130 135 140
Ile Cys Ala Met Glu Ser His Lys Ala His Pro Leu Pro Val Asp Ala
145 150 155 160
Ala Ser Gly Ser Phe Val Ile Pro Asp Phe Pro His His Val Thr Ile
165 170 175
Asn Ser Thr Pro Pro Lys Arg Thr Lys Glu Phe Val Asp Pro Leu Leu
180 185 190
Thr Glu Ala Phe Lys Ser His Gly Phe Leu Ile Asn Ser Phe Val Glu
195 200 205
Leu Asp Gly Glu Glu Cys Val Glu His Tyr Glu Arg Ile Thr Gly Gly
210 215 220
His Lys Ala Trp His Leu Gly Pro Ala Phe Leu Val His Arg Thr Ala
225 230 235 240
Gln Asp Arg Gly Glu Lys Ser Val Val Ser Thr Gln Glu Cys Leu Ser
245 250 255
Trp Leu Asp Ser Lys Arg Asp Asn Ser Val Leu Tyr Ile Cys Phe Gly
260 265 270
Thr Ile Cys Tyr Phe Pro Asp Lys Gln Leu Tyr Glu Ile Ala Ser Ala
275 280 285
Ile Glu Ala Ser Gly His Glu Phe Ile Trp Val Val Pro Glu Lys Arg
290 295 300
Gly Asn Ala Asp Glu Ser Glu Glu Glu Lys Glu Lys Trp Leu Pro Lys
305 310 315 320
Gly Phe Glu Glu Arg Asn Asn Gly Lys Lys Gly Met Ile Ile Arg Gly
325 330 335
Trp Ala Pro Gln Val Ala Ile Leu Gly His Pro Ala Val Gly Gly Phe
340 345 350
Leu Thr His Cys Gly Trp Asn Ser Thr Val Glu Ala Val Ser Ala Gly
355 360 365
Val Pro Met Ile Thr Trp Pro Val His Ser Asp Gln Tyr Phe Asn Glu
370 375 380
Lys Leu Ile Thr Gln Val Arg Gly Ile Gly Val Glu Val Gly Ala Glu
385 390 395 400
Glu Trp Ile Val Thr Ala Phe Arg Glu Thr Glu Lys Leu Val Gly Arg
405 410 415
Asp Arg Ile Glu Arg Ala Val Arg Arg Val Met Asp Gly Gly Asp Glu
420 425 430
Ala Val Gln Ile Arg Arg Arg Ala Arg Glu Leu Gly Glu Met Ala Arg
435 440 445
Gln Ala Val Gln Glu Gly Gly Ser Ser His Thr Asn Leu Thr Ala Leu
450 455 460
Ile Asn Asp Leu Lys Arg Trp Arg Asp Ser Lys Gln Leu Asn
465 470 475
<210> 83
<211> 491
<212> PRT
<213> Glycyrrhiza uralensis
<400> 83
Met Ala Val Phe Gln Ala Asn Gln Pro His Phe Val Leu Phe Pro Leu
1 5 10 15
Met Ala Gln Gly His Ile Ile Pro Met Ile Asp Ile Ala Arg Leu Leu
20 25 30
Ala Gln Arg Gly Ala Ile Val Thr Ile Phe Thr Thr Pro Lys Asn Ala
35 40 45
Ser Arg Phe Thr Ser Val Leu Ser Arg Ala Val Ser Ser Gly Leu Gln
50 55 60
Ile Arg Leu Val His Leu His Phe Pro Ser Lys Glu Ala Gly Leu Pro
65 70 75 80
Glu Gly Cys Glu Asn Leu Asp Met Val Ala Ser His Asp Met Ile Cys
85 90 95
Asn Ile Phe Gln Ala Ile Arg Met Leu Gln Lys Gln Ala Glu Glu Leu
100 105 110
Phe Glu Thr Leu Thr Pro Lys Pro Ser Cys Ile Ile Ser Asp Phe Cys
115 120 125
Ile Pro Trp Thr Thr Gln Val Ala Glu Lys His His Ile Pro Arg Ile
130 135 140
Ser Phe His Gly Phe Ser Cys Phe Cys Leu His Cys Met Leu Lys Ile
145 150 155 160
His Thr Ser Lys Val Leu Glu Gly Ile Thr Ser Glu Ser Glu Tyr Phe
165 170 175
Thr Val Pro Gly Ile Pro Asp Gln Ile Gln Val Thr Lys Gln Gln Val
180 185 190
Pro Gly Pro Met Ile Asp Glu Met Lys Glu Phe Gly Glu Gln Met Arg
195 200 205
Asp Ala Glu Ile Arg Ser Tyr Gly Val Ile Ile Asn Thr Phe Glu Glu
210 215 220
Leu Glu Lys Ala Tyr Val Asn Asp Tyr Lys Lys Glu Arg Asn Gly Lys
225 230 235 240
Val Trp Cys Ile Gly Pro Val Ser Leu Cys Asn Lys Asp Gly Leu Asp
245 250 255
Lys Ala Gln Arg Gly Asn Lys Ala Ser Ile Ser Glu His His Cys Leu
260 265 270
Glu Trp Leu Asp Leu Gln Gln Pro Asn Ser Val Ile Tyr Val Cys Leu
275 280 285
Gly Ser Leu Cys Asn Leu Thr Pro Pro Gln Leu Met Glu Leu Ala Leu
290 295 300
Gly Leu Glu Ala Thr Lys Arg Pro Phe Ile Trp Val Ile Arg Glu Gly
305 310 315 320
Asn Lys Phe Glu Glu Leu Glu Lys Trp Ile Ser Glu Glu Gly Phe Glu
325 330 335
Glu Arg Ile Lys Gly Arg Gly Leu Ile Ile Arg Gly Trp Ala Pro Gln
340 345 350
Val Leu Ile Leu Ser His Pro Ser Ile Gly Gly Phe Leu Thr His Cys
355 360 365
Gly Trp Asn Ser Thr Leu Glu Gly Val Thr Ala Gly Val Pro Met Val
370 375 380
Thr Trp Pro Leu Phe Ala Asp Gln Phe Leu Asn Glu Lys Leu Val Thr
385 390 395 400
Gln Val Leu Arg Ile Gly Val Ser Leu Gly Val Asp Val Pro Leu Lys
405 410 415
Trp Gly Glu Glu Glu Lys Val Gly Val Gln Val Lys Lys Glu Gly Ile
420 425 430
Glu Lys Ala Ile Cys Met Val Met Asp Glu Gly Glu Glu Ser Lys Glu
435 440 445
Arg Arg Glu Arg Ala Lys Glu Leu Ser Glu Met Ala Lys Arg Ala Val
450 455 460
Glu Lys Asp Gly Ser Ser His Leu Asn Met Thr Met Leu Ile Gln Asp
465 470 475 480
Ile Met Gln Gln Ser Ser Ser Lys Val Glu Thr
485 490
<210> 84
<211> 483
<212> PRT
<213> Stevia rebaudiana
<400> 84
Met Asp Gln Met Ala Lys Ile Asp Glu Lys Lys Pro His Val Val Phe
1 5 10 15
Ile Pro Phe Pro Ala Gln Ser His Ile Lys Cys Met Leu Lys Leu Ala
20 25 30
Arg Ile Leu His Gln Lys Gly Leu Tyr Ile Thr Phe Ile Asn Thr Asp
35 40 45
Thr Asn His Glu Arg Leu Val Ala Ser Gly Gly Thr Gln Trp Leu Glu
50 55 60
Asn Ala Pro Gly Phe Trp Phe Lys Thr Val Pro Asp Gly Phe Gly Ser
65 70 75 80
Ala Lys Asp Asp Gly Val Lys Pro Thr Asp Ala Leu Arg Glu Leu Met
85 90 95
Asp Tyr Leu Lys Thr Asn Phe Phe Asp Leu Phe Leu Asp Leu Val Leu
100 105 110
Lys Leu Glu Val Pro Ala Thr Cys Ile Ile Cys Asp Gly Cys Met Thr
115 120 125
Phe Ala Asn Thr Ile Arg Ala Ala Glu Lys Leu Asn Ile Pro Val Ile
130 135 140
Leu Phe Trp Thr Met Ala Ala Cys Gly Phe Met Ala Phe Tyr Gln Ala
145 150 155 160
Lys Val Leu Lys Glu Lys Glu Ile Val Pro Val Lys Asp Glu Thr Tyr
165 170 175
Leu Thr Asn Gly Tyr Leu Asp Met Glu Ile Asp Trp Ile Pro Gly Met
180 185 190
Lys Arg Ile Arg Leu Arg Asp Leu Pro Glu Phe Ile Leu Ala Thr Lys
195 200 205
Gln Asn Tyr Phe Ala Phe Glu Phe Leu Phe Glu Thr Ala Gln Leu Ala
210 215 220
Asp Lys Val Ser His Met Ile Ile His Thr Phe Glu Glu Leu Glu Ala
225 230 235 240
Ser Leu Val Ser Glu Ile Lys Ser Ile Phe Pro Asn Val Tyr Thr Ile
245 250 255
Gly Pro Leu Gln Leu Leu Leu Asn Lys Ile Thr Gln Lys Glu Thr Asn
260 265 270
Asn Asp Ser Tyr Ser Leu Trp Lys Glu Glu Pro Glu Cys Val Glu Trp
275 280 285
Leu Asn Ser Lys Glu Pro Asn Ser Val Val Tyr Val Asn Phe Gly Ser
290 295 300
Leu Ala Val Met Ser Leu Gln Asp Leu Val Glu Phe Gly Trp Gly Leu
305 310 315 320
Val Asn Ser Asn His Tyr Phe Leu Trp Ile Ile Arg Ala Asn Leu Ile
325 330 335
Asp Gly Lys Pro Ala Val Met Pro Gln Glu Leu Lys Glu Ala Met Asn
340 345 350
Glu Lys Gly Phe Val Gly Ser Trp Cys Ser Gln Glu Glu Val Leu Asn
355 360 365
His Pro Ala Val Gly Gly Phe Leu Thr His Cys Gly Trp Gly Ser Ile
370 375 380
Ile Glu Ser Leu Ser Ala Gly Val Pro Met Leu Gly Trp Pro Ser Ile
385 390 395 400
Gly Asp Gln Arg Ala Asn Cys Arg Gln Met Cys Lys Glu Trp Glu Val
405 410 415
Gly Met Glu Ile Gly Lys Asn Val Lys Arg Asp Glu Val Glu Lys Leu
420 425 430
Val Arg Met Leu Met Glu Gly Leu Glu Gly Glu Arg Met Arg Lys Lys
435 440 445
Ala Leu Glu Trp Lys Lys Ser Ala Thr Leu Ala Thr Cys Cys Asn Gly
450 455 460
Ser Ser Ser Leu Asp Val Glu Lys Leu Ala Asn Glu Ile Lys Lys Leu
465 470 475 480
Ser Arg Asn
<210> 85
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 85
Gly Gly Ser Gly Gly Ser
1 5
<210> 86
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 86
Gly Gly Ser Gly Gly Ser Gly
1 5
<210> 87
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 87
Gly Gly Ser Gly Gly Ser Gly Gly
1 5
<210> 88
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 88
Gly Gly Ser Gly Gly Ser Gly Gly Ser
1 5
<210> 89
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 89
Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly
1 5 10
<210> 90
<211> 11
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 90
Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly
1 5 10
<210> 91
<211> 12
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 91
Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser
1 5 10
<210> 92
<211> 546
<212> PRT
<213> Escherichia coli
<400> 92
Met Ala Ile His Asn Arg Ala Gly Gln Pro Ala Gln Gln Ser Asp Leu
1 5 10 15
Ile Asn Val Ala Gln Leu Thr Ala Gln Tyr Tyr Val Leu Lys Pro Glu
20 25 30
Ala Gly Asn Ala Glu His Ala Val Lys Phe Gly Thr Ser Gly His Arg
35 40 45
Gly Ser Ala Ala Arg His Ser Phe Asn Glu Pro His Ile Leu Ala Ile
50 55 60
Ala Gln Ala Ile Ala Glu Glu Arg Ala Lys Asn Gly Ile Thr Gly Pro
65 70 75 80
Cys Tyr Val Gly Lys Asp Thr His Ala Leu Ser Glu Pro Ala Phe Ile
85 90 95
Ser Val Leu Glu Val Leu Ala Ala Asn Gly Val Asp Val Ile Val Gln
100 105 110
Glu Asn Asn Gly Phe Thr Pro Thr Pro Ala Val Ser Asn Ala Ile Leu
115 120 125
Val His Asn Lys Lys Gly Gly Pro Leu Ala Asp Gly Ile Val Ile Thr
130 135 140
Pro Ser His Asn Pro Pro Glu Asp Gly Gly Ile Lys Tyr Asn Pro Pro
145 150 155 160
Asn Gly Gly Pro Ala Asp Thr Asn Val Thr Lys Val Val Glu Asp Arg
165 170 175
Ala Asn Ala Leu Leu Ala Asp Gly Leu Lys Gly Val Lys Arg Ile Ser
180 185 190
Leu Asp Glu Ala Met Ala Ser Gly His Val Lys Glu Gln Asp Leu Val
195 200 205
Gln Pro Phe Val Glu Gly Leu Ala Asp Ile Val Asp Met Ala Ala Ile
210 215 220
Gln Lys Ala Gly Leu Thr Leu Gly Val Asp Pro Leu Gly Gly Ser Gly
225 230 235 240
Ile Glu Tyr Trp Lys Arg Ile Gly Glu Tyr Tyr Asn Leu Asn Leu Thr
245 250 255
Ile Val Asn Asp Gln Val Asp Gln Thr Phe Arg Phe Met His Leu Asp
260 265 270
Lys Asp Gly Ala Ile Arg Met Asp Cys Ser Ser Glu Cys Ala Met Ala
275 280 285
Gly Leu Leu Ala Leu Arg Asp Lys Phe Asp Leu Ala Phe Ala Asn Asp
290 295 300
Pro Asp Tyr Asp Arg His Gly Ile Val Thr Pro Ala Gly Leu Met Asn
305 310 315 320
Pro Asn His Tyr Leu Ala Val Ala Ile Asn Tyr Leu Phe Gln His Arg
325 330 335
Pro Gln Trp Gly Lys Asp Val Ala Val Gly Lys Thr Leu Val Ser Ser
340 345 350
Ala Met Ile Asp Arg Val Val Asn Asp Leu Gly Arg Lys Leu Val Glu
355 360 365
Val Pro Val Gly Phe Lys Trp Phe Val Asp Gly Leu Phe Asp Gly Ser
370 375 380
Phe Gly Phe Gly Gly Glu Glu Ser Ala Gly Ala Ser Phe Leu Arg Phe
385 390 395 400
Asp Gly Thr Pro Trp Ser Thr Asp Lys Asp Gly Ile Ile Met Cys Leu
405 410 415
Leu Ala Ala Glu Ile Thr Ala Val Thr Gly Lys Asn Pro Gln Glu His
420 425 430
Tyr Asn Glu Leu Ala Lys Arg Phe Gly Ala Pro Ser Tyr Asn Arg Leu
435 440 445
Gln Ala Ala Ala Thr Ser Ala Gln Lys Ala Ala Leu Ser Lys Leu Ser
450 455 460
Pro Glu Met Val Ser Ala Ser Thr Leu Ala Gly Asp Pro Ile Thr Ala
465 470 475 480
Arg Leu Thr Ala Ala Pro Gly Asn Gly Ala Ser Ile Gly Gly Leu Lys
485 490 495
Val Met Thr Asp Asn Gly Trp Phe Ala Ala Arg Pro Ser Gly Thr Glu
500 505 510
Asp Ala Tyr Lys Ile Tyr Cys Glu Ser Phe Leu Gly Glu Glu His Arg
515 520 525
Lys Gln Ile Glu Lys Glu Ala Val Glu Ile Val Ser Glu Val Leu Lys
530 535 540
Asn Ala
545
<210> 93
<211> 302
<212> PRT
<213> Escherichia coli
<400> 93
Met Ala Ala Ile Asn Thr Lys Val Lys Lys Ala Val Ile Pro Val Ala
1 5 10 15
Gly Leu Gly Thr Arg Met Leu Pro Ala Thr Lys Ala Ile Pro Lys Glu
20 25 30
Met Leu Pro Leu Val Asp Lys Pro Leu Ile Gln Tyr Val Val Asn Glu
35 40 45
Cys Ile Ala Ala Gly Ile Thr Glu Ile Val Leu Val Thr His Ser Ser
50 55 60
Lys Asn Ser Ile Glu Asn His Phe Asp Thr Ser Phe Glu Leu Glu Ala
65 70 75 80
Met Leu Glu Lys Arg Val Lys Arg Gln Leu Leu Asp Glu Val Gln Ser
85 90 95
Ile Cys Pro Pro His Val Thr Ile Met Gln Val Arg Gln Gly Leu Ala
100 105 110
Lys Gly Leu Gly His Ala Val Leu Cys Ala His Pro Val Val Gly Asp
115 120 125
Glu Pro Val Ala Val Ile Leu Pro Asp Val Ile Leu Asp Glu Tyr Glu
130 135 140
Ser Asp Leu Ser Gln Asp Asn Leu Ala Glu Met Ile Arg Arg Phe Asp
145 150 155 160
Glu Thr Gly His Ser Gln Ile Met Val Glu Pro Val Ala Asp Val Thr
165 170 175
Ala Tyr Gly Val Val Asp Cys Lys Gly Val Glu Leu Ala Pro Gly Glu
180 185 190
Ser Val Pro Met Val Gly Val Val Glu Lys Pro Lys Ala Asp Val Ala
195 200 205
Pro Ser Asn Leu Ala Ile Val Gly Arg Tyr Val Leu Ser Ala Asp Ile
210 215 220
Trp Pro Leu Leu Ala Lys Thr Pro Pro Gly Ala Gly Asp Glu Ile Gln
225 230 235 240
Leu Thr Asp Ala Ile Asp Met Leu Ile Glu Lys Glu Thr Val Glu Ala
245 250 255
Tyr His Met Lys Gly Lys Ser His Asp Cys Gly Asn Lys Leu Gly Tyr
260 265 270
Met Gln Ala Phe Val Glu Tyr Gly Ile Arg His Asn Thr Leu Gly Thr
275 280 285
Glu Phe Lys Ala Trp Leu Glu Glu Glu Met Gly Ile Lys Lys
290 295 300
<210> 94
<211> 219
<212> PRT
<213> Escherichia coli
<400> 94
Met Lys Leu Gln Gly Val Ile Phe Asp Leu Asp Gly Val Ile Thr Asp
1 5 10 15
Thr Ala His Leu His Phe Gln Ala Trp Gln Gln Ile Ala Ala Glu Ile
20 25 30
Gly Ile Ser Ile Asp Ala Gln Phe Asn Glu Ser Leu Lys Gly Ile Ser
35 40 45
Arg Asp Glu Ser Leu Arg Arg Ile Leu Gln His Gly Gly Lys Glu Gly
50 55 60
Asp Phe Asn Ser Gln Glu Arg Ala Gln Leu Ala Tyr Arg Lys Asn Leu
65 70 75 80
Leu Tyr Val His Ser Leu Arg Glu Leu Thr Val Asn Ala Val Leu Pro
85 90 95
Gly Ile Arg Ser Leu Leu Ala Asp Leu Arg Ala Gln Gln Ile Ser Val
100 105 110
Gly Leu Ala Ser Val Ser Leu Asn Ala Pro Thr Ile Leu Ala Ala Leu
115 120 125
Glu Leu Arg Glu Phe Phe Thr Phe Cys Ala Asp Ala Ser Gln Leu Lys
130 135 140
Asn Ser Lys Pro Asp Pro Glu Ile Phe Leu Ala Ala Cys Ala Gly Leu
145 150 155 160
Gly Val Pro Pro Gln Ala Cys Ile Gly Ile Glu Asp Ala Gln Ala Gly
165 170 175
Ile Asp Ala Ile Asn Ala Ser Gly Met Arg Ser Val Gly Ile Gly Ala
180 185 190
Gly Leu Thr Gly Ala Gln Leu Leu Leu Pro Ser Thr Glu Ser Leu Thr
195 200 205
Trp Pro Arg Leu Ser Ala Phe Trp Gln Asn Val
210 215
<210> 95
<211> 489
<212> PRT
<213> Bifidobacterium bifidum
<400> 95
Met Ala Phe Ala Glu Asp Leu Lys Arg Thr Glu Lys Met Thr Val Asp
1 5 10 15
Asp Val Phe Glu Gln Ser Ala Gln Lys Met Arg Glu Gln Gly Met Ser
20 25 30
Glu Ile Ala Ile Ser Gln Phe Arg His Ala Tyr His Val Trp Ala Ser
35 40 45
Glu Lys Glu Ser Ala Trp Ile Arg Glu Asp Thr Val Glu Pro Leu His
50 55 60
Gly Val Arg Ser Phe His Asp Val Tyr Lys Thr Ile Asp His Asp Lys
65 70 75 80
Ala Val His Ala Phe Ala Lys Thr Ala Phe Leu Lys Leu Asn Gly Gly
85 90 95
Leu Gly Thr Ser Met Gly Leu Gln Cys Ala Lys Ser Leu Leu Pro Val
100 105 110
Arg Arg His Lys Ala Arg Gln Met Arg Phe Leu Asp Ile Ile Leu Gly
115 120 125
Gln Val Leu Thr Ala Arg Thr Arg Leu Asn Val Pro Leu Pro Val Thr
130 135 140
Phe Met Asn Ser Phe Arg Thr Ser Asp Asp Thr Met Lys Ala Leu Arg
145 150 155 160
His Gln Arg Lys Phe Lys Gln Thr Asp Ile Pro Leu Glu Ile Ile Gln
165 170 175
His Gln Glu Pro Lys Ile Asp Ala Ala Thr Gly Ala Pro Ala Ser Trp
180 185 190
Pro Ala Asn Pro Asp Leu Glu Trp Cys Pro Pro Gly His Gly Asp Leu
195 200 205
Phe Ser Thr Leu Arg Glu Ser Gly Leu Leu Asp Thr Leu Leu Glu His
210 215 220
Gly Phe Glu Tyr Leu Phe Ile Ser Asn Ser Asp Asn Leu Gly Ala Arg
225 230 235 240
Pro Ser Arg Thr Leu Ala Gln Tyr Phe Glu Asp Thr Gly Ala Pro Phe
245 250 255
Met Val Glu Val Ala Asn Arg Thr Tyr Ala Asp Arg Lys Gly Gly His
260 265 270
Ile Val Arg Asp Thr Ala Thr Gly Arg Leu Ile Leu Arg Glu Met Ser
275 280 285
Gln Val His Pro Asp Asp Lys Asp Ala Ala Gln Asp Ile Ala Lys His
290 295 300
Pro Tyr Phe Asn Thr Asn Asn Ile Trp Val Arg Ile Asp Val Leu Arg
305 310 315 320
Asp Met Leu Ala Glu His Asp Gly Val Leu Pro Leu Pro Val Ile Ile
325 330 335
Asn Asn Lys Thr Val Asp Pro Ile Asp Pro Gln Ser Pro Ala Val Val
340 345 350
Gln Leu Glu Thr Ala Met Gly Ala Ala Ile Gly Leu Phe Glu Gly Ala
355 360 365
Ile Cys Val Gln Val Asp Arg Met Arg Phe Leu Pro Val Lys Thr Thr
370 375 380
Asn Asp Leu Phe Ile Met Arg Ser Asp Arg Phe His Leu Thr Asp Ser
385 390 395 400
Tyr Glu Met Glu Asp Gly Asn Tyr Ile Phe Pro Asn Val Asp Leu Asp
405 410 415
Pro Arg Tyr Tyr Lys Asn Ile Glu Asp Phe Asn Glu Arg Phe Pro Tyr
420 425 430
Asn Val Pro Ser Leu Ala Ala Ala Asn Ser Val Ser Ile Lys Gly Asp
435 440 445
Trp Thr Phe Gly Arg Asp Val Ile Met Phe Ala Asp Ala Arg Leu Glu
450 455 460
Asp Arg Asn Glu Pro Ser Tyr Val Pro Asn Gly Glu Tyr Val Gly Pro
465 470 475 480
Met Gly Ile Glu Pro Gly Asp Trp Val
485
<210> 96
<211> 214
<212> PRT
<213> Escherichia coli
<400> 96
Met Arg Ile Ile Leu Leu Gly Ala Pro Gly Ala Gly Lys Gly Thr Gln
1 5 10 15
Ala Gln Phe Ile Met Glu Lys Tyr Gly Ile Pro Gln Ile Ser Thr Gly
20 25 30
Asp Met Leu Arg Ala Ala Val Lys Ser Gly Ser Glu Leu Gly Lys Gln
35 40 45
Ala Lys Asp Ile Met Asp Ala Gly Lys Leu Val Thr Asp Glu Leu Val
50 55 60
Ile Ala Leu Val Lys Glu Arg Ile Ala Gln Glu Asp Cys Arg Asn Gly
65 70 75 80
Phe Leu Leu Asp Gly Phe Pro Arg Thr Ile Pro Gln Ala Asp Ala Met
85 90 95
Lys Glu Ala Gly Ile Asn Val Asp Tyr Val Leu Glu Phe Asp Val Pro
100 105 110
Asp Glu Leu Ile Val Asp Arg Ile Val Gly Arg Arg Val His Ala Pro
115 120 125
Ser Gly Arg Val Tyr His Val Lys Phe Asn Pro Pro Lys Val Glu Gly
130 135 140
Lys Asp Asp Val Thr Gly Glu Glu Leu Thr Thr Arg Lys Asp Asp Gln
145 150 155 160
Glu Glu Thr Val Arg Lys Arg Leu Val Glu Tyr His Gln Met Thr Ala
165 170 175
Pro Leu Ile Gly Tyr Tyr Ser Lys Glu Ala Glu Ala Gly Asn Thr Lys
180 185 190
Tyr Ala Lys Val Asp Gly Thr Lys Pro Val Ala Glu Val Arg Ala Asp
195 200 205
Leu Glu Lys Ile Leu Gly
210
<210> 97
<211> 143
<212> PRT
<213> Escherichia coli
<400> 97
Met Ala Ile Glu Arg Thr Phe Ser Ile Ile Lys Pro Asn Ala Val Ala
1 5 10 15
Lys Asn Val Ile Gly Asn Ile Phe Ala Arg Phe Glu Ala Ala Gly Phe
20 25 30
Lys Ile Val Gly Thr Lys Met Leu His Leu Thr Val Glu Gln Ala Arg
35 40 45
Gly Phe Tyr Ala Glu His Asp Gly Lys Pro Phe Phe Asp Gly Leu Val
50 55 60
Glu Phe Met Thr Ser Gly Pro Ile Val Val Ser Val Leu Glu Gly Glu
65 70 75 80
Asn Ala Val Gln Arg His Arg Asp Leu Leu Gly Ala Thr Asn Pro Ala
85 90 95
Asn Ala Leu Ala Gly Thr Leu Arg Ala Asp Tyr Ala Asp Ser Leu Thr
100 105 110
Glu Asn Gly Thr His Gly Ser Asp Ser Val Glu Ser Ala Ala Arg Glu
115 120 125
Ile Ala Tyr Phe Phe Gly Glu Gly Glu Val Cys Pro Arg Thr Arg
130 135 140
<210> 98
<211> 227
<212> PRT
<213> Escherichia coli
<400> 98
Met Thr Ala Ile Ala Pro Val Ile Thr Ile Asp Gly Pro Ser Gly Ala
1 5 10 15
Gly Lys Gly Thr Leu Cys Lys Ala Met Ala Glu Ala Leu Gln Trp His
20 25 30
Leu Leu Asp Ser Gly Ala Ile Tyr Arg Val Leu Ala Leu Ala Ala Leu
35 40 45
His His His Val Asp Val Ala Ser Glu Asp Ala Leu Val Pro Leu Ala
50 55 60
Ser His Leu Asp Val Arg Phe Val Ser Thr Asn Gly Asn Leu Glu Val
65 70 75 80
Ile Leu Glu Gly Glu Asp Val Ser Gly Glu Ile Arg Thr Gln Glu Val
85 90 95
Ala Asn Ala Ala Ser Gln Val Ala Ala Phe Pro Arg Val Arg Glu Ala
100 105 110
Leu Leu Arg Arg Gln Arg Ala Phe Arg Glu Leu Pro Gly Leu Ile Ala
115 120 125
Asp Gly Arg Asp Met Gly Thr Val Val Phe Pro Asp Ala Pro Val Lys
130 135 140
Ile Phe Leu Asp Ala Ser Ser Glu Glu Arg Ala His Arg Arg Met Leu
145 150 155 160
Gln Leu Gln Glu Lys Gly Phe Ser Val Asn Phe Glu Arg Leu Leu Ala
165 170 175
Glu Ile Lys Glu Arg Asp Asp Arg Asp Arg Asn Arg Ala Val Ala Pro
180 185 190
Leu Val Pro Ala Ala Asp Ala Leu Val Leu Asp Ser Thr Thr Leu Ser
195 200 205
Ile Glu Gln Val Ile Glu Lys Ala Leu Gln Tyr Ala Arg Gln Lys Leu
210 215 220
Ala Leu Ala
225
<210> 99
<211> 474
<212> PRT
<213> Arabidopsis thaliana
<400> 99
Met Ala Asn Asn Asn Ser Asn Ser Pro Thr Gly Pro His Phe Leu Phe
1 5 10 15
Val Thr Phe Pro Ala Gln Gly His Ile Asn Pro Ser Leu Glu Leu Ala
20 25 30
Lys Arg Leu Ala Gly Thr Ile Ser Gly Ala Arg Val Thr Phe Ala Ala
35 40 45
Ser Ile Ser Ala Tyr Asn Arg Arg Met Phe Ser Thr Glu Asn Val Pro
50 55 60
Glu Thr Leu Ile Phe Ala Thr Tyr Ser Asp Gly His Asp Asp Gly Phe
65 70 75 80
Lys Ser Ser Ala Tyr Ser Asp Lys Ser Arg Gln Asp Ala Thr Gly Asn
85 90 95
Phe Met Ser Glu Met Arg Arg Arg Gly Lys Glu Thr Leu Thr Glu Leu
100 105 110
Ile Glu Asp Asn Arg Lys Gln Asn Arg Pro Phe Thr Cys Val Val Tyr
115 120 125
Thr Ile Leu Leu Thr Trp Val Ala Glu Leu Ala Arg Glu Phe His Leu
130 135 140
Pro Ser Ala Leu Leu Trp Val Gln Pro Val Thr Val Phe Ser Ile Phe
145 150 155 160
Tyr His Tyr Phe Asn Gly Tyr Glu Asp Ala Ile Ser Glu Met Ala Asn
165 170 175
Thr Pro Ser Ser Ser Ile Lys Leu Pro Ser Leu Pro Leu Leu Thr Val
180 185 190
Arg Asp Ile Pro Ser Phe Ile Val Ser Ser Asn Val Tyr Ala Phe Leu
195 200 205
Leu Pro Ala Phe Arg Glu Gln Ile Asp Ser Leu Lys Glu Glu Ile Asn
210 215 220
Pro Lys Ile Leu Ile Asn Thr Phe Gln Glu Leu Glu Pro Glu Ala Met
225 230 235 240
Ser Ser Val Pro Asp Asn Phe Lys Ile Val Pro Val Gly Pro Leu Leu
245 250 255
Thr Leu Arg Thr Asp Phe Ser Ser Arg Gly Glu Tyr Ile Glu Trp Leu
260 265 270
Asp Thr Lys Ala Asp Ser Ser Val Leu Tyr Val Ser Phe Gly Thr Leu
275 280 285
Ala Val Leu Ser Lys Lys Gln Leu Val Glu Leu Cys Lys Ala Leu Ile
290 295 300
Gln Ser Arg Arg Pro Phe Leu Trp Val Ile Thr Asp Lys Ser Tyr Arg
305 310 315 320
Asn Lys Glu Asp Glu Gln Glu Lys Glu Glu Asp Cys Ile Ser Ser Phe
325 330 335
Arg Glu Glu Leu Asp Glu Ile Gly Met Val Val Ser Trp Cys Asp Gln
340 345 350
Phe Arg Val Leu Asn His Arg Ser Ile Gly Cys Phe Val Thr His Cys
355 360 365
Gly Trp Asn Ser Thr Leu Glu Ser Leu Val Ser Gly Val Pro Val Val
370 375 380
Ala Phe Pro Gln Trp Asn Asp Gln Met Met Asn Ala Lys Leu Leu Glu
385 390 395 400
Asp Cys Trp Lys Thr Gly Val Arg Val Met Glu Lys Lys Glu Glu Glu
405 410 415
Gly Val Val Val Val Asp Ser Glu Glu Ile Arg Arg Cys Ile Glu Glu
420 425 430
Val Met Glu Asp Lys Ala Glu Glu Phe Arg Gly Asn Ala Thr Arg Trp
435 440 445
Lys Asp Leu Ala Ala Glu Ala Val Arg Glu Gly Gly Ser Ser Phe Asn
450 455 460
His Leu Lys Ala Phe Val Asp Glu His Met
465 470
Claims (229)
- 당화 생성물의 제조 방법으로서,
하나 이상의 재조합 UDP-의존성 당전이(UGT) 효소를 발현하는 박테리아 세포를 제공하는 단계로서, 상기 박테리아 세포는 재조합 수크로스 합성효소의 발현, 및 UDP-당의 이용가능성을 증가시키는 하나 이상의 유전자 변형 중 하나 이상을 갖는, 단계;
당화용 기질의 존재 하에서 박테리아 세포를 배양하는 단계; 및
당화 생성물을 회수하는 단계
를 포함하는, 방법. - 제1 항에 있어서, 상기 박테리아 세포는 에스체리쉬아 종, 바실러스 종, 로도박터 종, 자이모모나스 종 또는 슈도모나스 종인, 방법.
- 제2 항에 있어서, 상기 박테리아 세포는 에스체리쉬아 콜리, 바실러스 서브틸리스, 로도박터 캅슐라투스, 로도박터 패로이데스, 자이모모나스 모빌리스 또는 슈도모나스 푸티다인, 방법.
- 제3항에 있어서, 상기 박테리아 균주는 E. 콜리인, 방법.
- 제1 항 내지 제4 항 중 어느 한 항에 있어서, 상기 박테리아 세포는 서열 번호: 1 내지 12 중 하나와 적어도 약 70%의 서열 동일성을 갖는 아미노산 서열을 포함하는 재조합 수크로스 합성효소를 발현하는, 방법.
- 제5 항에 있어서, 상기 수크로스 합성효소는 서열 번호: 1 내지 12 중 하나와 적어도 약 80%, 또는 적어도 약 85%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는, 방법.
- 제5 항에 있어서, 상기 수크로스 합성효소는 서열 번호: 2와 적어도 약 80%, 또는 적어도 약 85%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하고, 상기 수크로스 합성효소는 선택적으로 서열 번호: 2에 대해 S11E 치환을 갖는, 방법.
- 제5 항에 있어서, 상기 수크로스 합성효소는 서열 번호: 3과 적어도 약 80%, 또는 적어도 약 85%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하고, 상기 수크로스 합성효소는 선택적으로 서열 번호: 3에 대해 L637M 및 T640V 치환을 갖는, 방법.
- 제5 항에 있어서, 상기 수크로스 합성효소는 서열 번호: 5와 적어도 약 80%, 또는 적어도 약 85%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는, 방법.
- 제5 항에 있어서, 상기 수크로스 합성효소는 서열 번호: 6과 적어도 약 80%, 또는 적어도 약 85%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는, 방법.
- 제5 항에 있어서, 상기 수크로스 합성효소는 서열 번호: 7과 적어도 약 80%, 또는 적어도 약 85%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하고, 상기 수크로스 합성효소는 선택적으로 서열 번호: 7에 대해 S11E 치환을 갖는, 방법.
- 제5 항에 있어서, 상기 수크로스 합성효소는 서열 번호: 8과 적어도 약 80%, 또는 적어도 약 85%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하고, 상기 수크로스 합성효소는 선택적으로 서열 번호: 8에 대해 S11E 치환을 갖는, 방법.
- 제5 항에 있어서, 상기 수크로스 합성효소는 서열 번호: 9와 적어도 약 80%, 또는 적어도 약 85%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는, 방법.
- 제5 항에 있어서, 상기 수크로스 합성효소는 서열 번호: 10과 적어도 약 80%, 또는 적어도 약 85%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하고, 상기 수크로스 합성효소는 선택적으로 서열 번호: 10에 대해 S11E 치환을 갖는, 방법.
- 제5 항에 있어서, 상기 수크로스 합성효소는 서열 번호: 11과 적어도 약 80%, 또는 적어도 약 85%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는, 방법.
- 제1 항 내지 제15 항 중 어느 한 항에 있어서, 상기 박테리아 세포는 수크로스의 존재 하에서 배양되는, 방법.
- 제1 항 내지 제16 항 중 어느 한 항에 있어서, 상기 박테리아 세포는 이하의 유전자 변형을 포함하는, 방법: ushA 및 galETKM, 또는 이의 병렬상동체는 결실되거나, 불활성화되거나, 발현 또는 활성이 감소됨; pgi 또는 이의 병렬상동체는 결실되거나, 불활성화되거나, 발현 또는 활성이 감소됨; E. 콜리 pgm (서열 번호: 92) 및/또는 ycjU (서열 번호: 94), 또는 이들의 병렬상동체 또는 유도체는 과다 발현되거나, 활성이 증가함; E. 콜리 galU (서열 번호: 93) 및/또는 비피도박테리움 비피둠 ugpA (서열 번호: 95), 또는 이의 병렬상동체 또는 유도체는 과다 발현되거나, 활성이 증가함.
- 제1 항 내지 제16 항 중 어느 한 항에 있어서, 상기 박테리아 세포는 pgm 또는 이의 병렬상동체 또는 유도체, 및 선택적으로 galU 또는 이의 병렬상동체 또는 유도체의 과다 발현 또는 활성 증가를 포함하는, 방법.
- 제1 항 내지 제16 항 중 어느 한 항에 있어서, 상기 미생물 세포는 ushA 또는 이의 병렬상동체, 및/또는 galE, galT, galK 및 galM 또는 이의 병렬상동체(들)중 하나 이상의 결실, 불활성화, 또는 활성 또는 발현의 감소를 갖는, 방법.
- 제19 항에 있어서, galETKM 유전자 또는 이의 병렬상동체는 불활성화되거나, 결실되거나, 발현 또는 활성이 감소되는, 방법.
- 제1 항 내지 제16 항 중 어느 한 항에 있어서, 상기 pgi (포도당-6-포스페이트 이소머라제) 또는 이의 병렬상동체는 결실되거나, 불활성화되거나, 발현 또는 활성이 감소되는, 방법.
- 제1 항 내지 제21 항 중 어느 한 항에 있어서, 상기 미생물 세포는 otsA(트레할로스-L-포스페이트 합성효소) 또는 이의 병렬상동체, 및/또는 otsB(트레할로스-L-포스페이트 포스파타제) 또는 이의 병렬상동체의 결실, 불활성화, 또는 활성 또는 발현의 감소를 갖는, 방법.
- 제1 항 내지 제22 항 중 어느 한 항에 있어서, 상기 미생물 세포는 ugd(UDP-포도당 6-탈수소화 효소) 또는 이의 병렬상동체; rfaQ-G-P-S-B-I-J 또는 이의 병렬상동체(들); yfdG-H-I 또는 이의 병렬상동체(들); wcaJ 또는 이의 병렬상동체; 및 glgC 또는 이의 병렬상동체 중 하나 이상의 결실, 불활성화 또는 활성 또는 발현의 감소를 갖는, 방법.
- 제1 항 내지 제23 항 중 어느 한 항에 있어서, 상기 박테리아 세포는 E. 콜리 ycjU (β-포스포글루코뮤타제)(서열 번호: 94) 또는 이의 병렬상동체 또는 유도체, 비피도박테리움 비피둠 ugpA (UTP-포도당-1-포스페이트 우리딜릴트랜스퍼라제)(서열 번호: 95) 또는 이의 병렬상동체 또는 유도체, E. 콜리 adk(아데닐레이트 키나제)(서열 번호: 96) 또는 이의 병렬상동체 또는 유도체, E. 콜리 ndk(뉴클레오시드 디포스페이트 키나제)(서열 번호: 97) 또는 이의 병렬상동체 또는 유도체, 및 E. 콜리 cmk(시티딘 모노포스페이트 키나제)(서열 번호: 98) 또는 이의 병렬상동체 또는 유도체 중 하나 이상의 과다 발현, 또는 활성 또는 발현의 증가를 갖는, 방법.
- 제1항 내지 제24항 중 어느 한 항에 있어서, 상기 당화용 기질은 식물 추출물 또는 이의 분획으로 제공되거나, 합성이나 생합성 공정에 의해 생산되는, 방법.
- 제25 항에 있어서, 상기 기질은 테르페노이드 또는 테르페노이드 글리코시드, 플라보노이드 또는 플라보노이드 글리코시드, 칸나비노이드 또는 칸나비노이드 글리코시드, 폴리케티드 또는 폴리케티드 글리코시드, 스틸베노이드 또는 스틸베노이드 글리코시드, 및 폴리페놀 또는 폴리페놀 글리코시드로부터 선택된 2차 대사산물인, 방법.
- 제26 항에 있어서, 상기 기질은 테르페노이드 글리코시드를 포함하는, 방법.
- 제27 항에 있어서, 상기 테르페노이드 글리코시드는 스테비올 글리코시드, 또는 모그롤 글리코시드를 포함하는, 방법.
- 제25항 내지 제28항 중 어느 한 항에 있어서, 상기 기질은 0 개, 1 개, 2 개, 3 개 또는 4 개의 글리코실 기를 갖는, 방법.
- 제29 항에 있어서, 상기 글리코실 기는 글루코실, 갈락토실, 만노실, 자일로실 및 람노실 기로부터 독립적으로 선택되는, 방법.
- 제30 항에 있어서, 상기 글리코실 기는 글루코실인, 방법.
- 제30 항 또는 제31 항에 있어서, 상기 당화 생성물은 적어도 4 개, 적어도 5 개, 적어도 6 개, 또는 적어도 7 개의 글리코실 기를 갖는, 방법.
- 제29 항 내지 제32 항 중 어느 한 항에 있어서, 상기 생성물의 생합성은 박테리아 세포에 의한 적어도 2 번의 기질의 당화 반응을 수반하는, 방법.
- 제28 항에 있어서, 상기 기질은 스테비아 잎 추출물 또는 이의 분획으로 제공되는, 방법.
- 제34 항에 있어서, 상기 스테비아 잎 추출물은 스테비올, 스테비오시드, 스테비올비오시드, 레바우디오시드 A, 둘코시드 A, 둘코시드 B, 레바우디오시드 C 및 레바우디오시드 F 중 하나 이상을 포함하는, 방법.
- 제35 항에 있어서, 상기 추출물 또는 이의 분획 내 스테비올 글리코시드의 적어도 약 30%는 스테비오시드, 스테비올비오시드 및 레바우디오시드 A로부터 선택되는, 방법.
- 제35 항 또는 제36 항에 있어서, 상기 당화 생성물은 RebM을 포함하는, 방법.
- 제37 항에 있어서, 상기 UGT 효소는 스테비올 코어의 C13 및 C19 하이드록실에서의 1 차 당화, 및 C13 및 C19 1 차 글리코실 기의 1-2 및 1-3 분지형 당화가 가능한, 방법.
- 제38 항에 있어서, 상기 UGT 효소는 서열 번호: 13 내지 32, 및 84 중 하나와 적어도 약 70%의 서열 동일성을 갖는 아미노산 서열을 포함하는 효소로부터 선택되는, 방법.
- 제36 항에 있어서, 상기 당화 생성물은 RebE 및/또는 RebD를 포함하는, 방법.
- 제40 항에 있어서, 상기 박테리아 세포는 스테비올 C13 및 C19 1 차 글리코실 기의 1-2 당화가 가능한 하나 이상의 UGT 효소를 발현하는, 방법.
- 제41 항에 있어서, 상기 UGT 효소는 서열 번호: 13 내지 16, 및 26 내지 29 중 하나와 적어도 약 70%의 서열 동일성을 갖는 효소로부터 선택되는, 방법.
- 제35 항 또는 제36 항에 있어서, 상기 당화 생성물은 RebB를 포함하는, 방법.
- 제43 항에 있어서, 상기 박테리아 세포는 스테비올 C19 1 차 글리코실 기의 탈당화가 가능한 하나 이상의 UGT 효소를 발현하는, 방법.
- 제44 항에 있어서, 상기 UGT 효소는 서열 번호: 18, 30, 31 및 99 중 하나와 적어도 약 70%의 서열 동일성을 갖는 효소로부터 선택되는, 방법.
- 제43 항 내지 제45 항 중 어느 한 항에 있어서, 상기 박테리아 세포는 서열 번호: 31 또는 99와 적어도 약 70%의 서열 동일성을 갖는 UGT 효소를 발현하는, 방법.
- 제43항 내지 제46항 중 어느 한 항에 있어서, 상기 당화용 기질은 RebA를 포함하는, 방법.
- 제36 항에 있어서, 상기 당화 생성물은 RebI를 포함하는, 방법.
- 제48 항에 있어서, 상기 박테리아 세포는 스테비올 C13 및 C19 1 차 글리코실 기의 1-3 당화가 가능한 하나 이상의 UGT 효소를 발현하는, 방법.
- 제49 항에 있어서, 상기 UGT 효소는 서열 번호: 19 내지 25 중 하나와 적어도 약 70%의 서열 동일성을 갖는 효소로부터 선택되는, 방법.
- 제28 항에 있어서, 상기 기질은 나한과 추출물 또는 이의 분획으로 제공되거나, 생합성으로 생산된 모그롤 또는 모그롤 글리코시드로서 제공되는, 방법.
- 제51 항에 있어서, 상기 기질은 모그롤, mog. I-A, mog. I-E, mog. II-A, mog. II-E, mog III, mog IVA, mog. IV 및 시아메노시드로부터 선택된 하나 이상의 기질을 포함하는, 방법.
- 제52항에 있어서, 상기 당화 생성물은 mog. IV, mog. IVA, mog. V, mog VI, isomog V 또는 시아메노시드를 포함하는, 방법.
- 제52 항 또는 제53 항에 있어서, 상기 UGT 효소는 모그롤 코어의 C3 및 C24 하이드록실에서의 1 차 당화, 및 C3 및/또는 C24 1 차 글리코실 기의 1-2 및 1-6 분지형 당화가 가능한, 방법.
- 제54 항에 있어서, 상기 UGT 효소는 서열 번호: 13 내지 17, 29, 33 내지 39, 46, 54, 60, 71 내지 80, 및 82 내지 84 중 하나와 적어도 약 70%의 서열 동일성을 갖는 아미노산 서열을 포함하는 효소로부터 선택되는, 방법.
- 제1 항 내지 제55 항 중 어느 한 항에 있어서, 상기 UGT 효소를 암호화하는 유전자는 미생물 세포의 염색체에 통합되거나, 염색체 외에서 발현되는, 방법.
- 제56 항에 있어서, 상기 방법은 기질을 당화 생성물로 적어도 40% 전환시키는, 방법.
- 제57 항에 있어서, 상기 방법은 기질을 당화 생성물로 적어도 75% 전환시키는, 방법.
- 제1 항 내지 제58 항 중 어느 한 항에 있어서, 복합 배지 또는 최소 배지에서의 성장에 의해 상기 박테리아 세포의 바이오매스가 생성되는, 방법.
- 제1 항 내지 제59 항 중 어느 한 항에 있어서, 상기 박테리아 세포는 하나 이상의 탄소원을 갖는 당화용 기질의 존재 하에서 배양되는, 방법.
- 제60 항에 있어서, 상기 탄소원은 포도당, 수크로스, 과당, 자일로스 및 글리세롤 중 하나 이상을 포함하는, 방법.
- 제61 항에 있어서, 배양 조건은 호기성, 미세호기성 및 혐기성으로부터 선택되는, 방법.
- 제56 항 내지 제62 항 중 어느 한 항에 있어서, 상기 배양은 유가 공정에서 수행되는, 방법.
- 제63 항에 있어서, 상기 기질은 약 72 시간 이하 동안 박테리아 세포와 함께 인큐베이션되는, 방법.
- 제57 항 내지 제64 항 중 어느 한 항에 있어서, 회수는 배양물의 pH를 약 pH 5 미만까지 낮추거나, 또는 배양물의 pH를 약 pH 9 초과까지 상승시키는 단계, 온도를 적어도 약 50℃까지 상승시키는 단계, 및 하나 이상의 글리코시드 용해도 개선제를 첨가하는 단계 중 하나 이상; 및 이후의 효소 또는 바이오매스의 제거 단계를 포함하는, 방법.
- 당화 생성물을 제조하기 위한 박테리아 세포로서, 상기 박테리아 세포는 하나 이상의 재조합 UDP-의존성 당전이(UGT) 효소를 발현하고 재조합 수크로스 합성효소의 발현, 및 UDP-당의 이용가능성을 증가시키는 하나 이상의 유전자 변형 중 하나 이상을 갖는, 박테리아 세포.
- 제66 항에 있어서, 상기 박테리아 세포는 에스체리쉬아 종, 바실러스 종, 로도박터 종, 자이모모나스 종 또는 슈도모나스 종인, 박테리아 세포.
- 제67 항에 있어서, 상기 박테리아 세포는 에스체리쉬아 콜리, 바실러스 서브틸리스, 로도박터 캅슐라투스, 로도박터 스패로이데스, 자이모모나스 모빌리스 또는 슈도모나스 푸티다인, 박테리아 세포.
- 제67항에 있어서, 상기 박테리아 균주는 E. 콜리인, 박테리아 세포.
- 제66 항 내지 제69 항 중 어느 한 항에 있어서, 상기 박테리아 세포는 서열 번호: 1 내지 12 중 하나와 적어도 약 70%의 서열 동일성을 갖는 아미노산 서열을 포함하는 재조합 수크로스 합성효소를 발현하는, 박테리아 세포.
- 제70 항에 있어서, 상기 수크로스 합성효소는 서열 번호: 1 내지 12 중 하나와 적어도 약 80%, 또는 적어도 약 85%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는, 박테리아 세포.
- 제70 항에 있어서, 상기 수크로스 합성효소는 서열 번호: 2와 적어도 약 80%, 또는 적어도 약 85%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하고, 상기 수크로스 합성효소는 선택적으로 서열 번호: 2에 대해 S11E 치환을 갖는, 박테리아 세포.
- 제70 항에 있어서, 상기 수크로스 합성효소는 서열 번호: 3과 적어도 약 80%, 또는 적어도 약 85%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하고, 상기 수크로스 합성효소는 선택적으로 서열 번호: 3에 대해 L637M 및 T640V 치환을 갖는, 박테리아 세포.
- 제70 항에 있어서, 상기 수크로스 합성효소는 서열 번호: 5와 적어도 약 80%, 또는 적어도 약 85%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는, 박테리아 세포.
- 제70 항에 있어서, 상기 수크로스 합성효소는 서열 번호: 6과 적어도 약 80%, 또는 적어도 약 85%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는, 박테리아 세포.
- 제70 항에 있어서, 상기 수크로스 합성효소는 서열 번호: 7과 적어도 약 80%, 또는 적어도 약 85%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하고, 상기 수크로스 합성효소는 선택적으로 서열 번호: 7에 대해 S11E 치환을 갖는, 박테리아 세포.
- 제70 항에 있어서, 상기 수크로스 합성효소는 서열 번호: 8과 적어도 약 80%, 또는 적어도 약 85%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하고, 상기 수크로스 합성효소는 선택적으로 서열 번호: 8에 대해 S11E 치환을 갖는, 박테리아 세포.
- 제70 항에 있어서, 상기 수크로스 합성효소는 서열 번호: 9와 적어도 약 80%, 또는 적어도 약 85%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는, 박테리아 세포.
- 제70 항에 있어서, 상기 수크로스 합성효소는 서열 번호: 10과 적어도 약 80%, 또는 적어도 약 85%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하고, 상기 수크로스 합성효소는 선택적으로 서열 번호: 10에 대해 S11E 치환을 갖는, 박테리아 세포.
- 제70 항에 있어서, 상기 수크로스 합성효소는 서열 번호: 11과 적어도 약 80%, 또는 적어도 약 85%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는, 박테리아 세포.
- 제66 항 내지 제80 항 중 어느 한 항에 있어서, 상기 박테리아 세포는 이하의 유전자 변형을 포함하는, 박테리아 세포: ushA 및 galETKM, 또는 이들의 병렬상동체는 결실되거나, 불활성화되거나, 발현 또는 활성이 감소됨; pgi 또는 이의 병렬상동체는 결실되거나, 불활성화되거나, 발현 또는 활성이 감소됨; E. 콜리 pgm (서열 번호: 92) 및/또는 ycjU (서열 번호: 94), 또는 이들의 병렬상동체 또는 유도체는 과다 발현되거나, 활성이 증가함; E. 콜리 galU (서열 번호: 93) 및/또는 비피도박테리움 비피둠 ugpA (서열 번호: 95), 또는 이들의 병렬상동체 또는 유도체는 과다 발현되거나, 활성이 증가함.
- 제66 항 내지 제81 항 중 어느 한 항에 있어서, 상기 박테리아 세포는 pgm 또는 이의 병렬상동체 또는 유도체, 및 선택적으로 galU 또는 이의 병렬상동체 또는 유도체의 과다 발현 또는 활성 증가를 포함하는, 박테리아 세포.
- 제66 항 내지 제81 항 중 어느 한 항에 있어서, 상기 박테리아 세포는 ushA 또는 이의 병렬상동체, 및/또는 galE, galT, galK 및 galM 또는 이의 병렬상동체(들) 중 하나 이상의 결실, 불활성화, 또는 활성 또는 발현의 감소를 갖는, 박테리아 세포.
- 제83 항에 있어서, 상기 galETKM 유전자 또는 이의 병렬상동체는 불활성화되거나, 결실되거나, 발현 또는 활성이 감소되는, 박테리아 세포.
- 제66 항 내지 제81 항 중 어느 한 항에 있어서, 상기 pgi (포도당-6-포스페이트 이소머라제) 또는 이의 병렬상동체는 결실되거나, 불활성화되거나, 발현 또는 활성이 감소되는, 박테리아 세포.
- 제66 항 내지 제85 항 중 어느 한 항에 있어서, 상기 박테리아 세포는 otsA (트레할로스-6-포스페이트 합성효소) 또는 이의 병렬상동체, 및/또는 otsB (트레할로스-포스페이트 포스파타제) 또는 이의 병렬상동체의 결실, 불활성화, 또는 활성 또는 발현의 감소를 갖는, 박테리아 세포.
- 제66 항 내지 제86 항 중 어느 한 항에 있어서, 상기 박테리아 세포는 ugd (UDP-포도당 6-탈수소화 효소) 또는 이의 병렬상동체; rfaQ-G-P-S-B-I-J 또는 이의 병렬상동체(들); yfdG-H-I 또는 이의 병렬상동체(들); wcaJ 또는 이의 병렬상동체; 및 glgC 또는 이의 병렬상동체 중 하나 이상의 결실, 불활성화, 또는 활성 또는 발현의 감소를 갖는, 박테리아 세포.
- 제66 항 내지 제87 항 중 어느 한 항에 있어서, 상기 박테리아 세포는 E. 콜리 ycjU (β-포스포글루코뮤타제)(서열 번호: 94) 또는 이의 병렬상동체 또는 유도체, 비피도박테리움 비피둠 ugpA (UTP-포도당-1-포스페이트 우리딜릴트랜스퍼라제)(서열 번호: 95) 또는 이의 병렬상동체 또는 유도체, E. 콜리 adk(아데닐레이트 키나제)(서열 번호: 96) 또는 이의 병렬상동체 또는 유도체, E. 콜리 ndk(뉴클레오시드 디포스페이트 키나제)(서열 번호: 97) 또는 이의 병렬상동체 또는 유도체, 및 E. 콜리 cmk(시티딘 모노포스페이트 키나제)(서열 번호: 98) 또는 이의 병렬상동체 또는 유도체 중 하나 이상의 과다 발현, 또는 활성 또는 발현의 증가를 갖는, 방법.
- 제66 항 내지 제88 항 중 어느 한 항에 있어서, 상기 박테리아 세포는 서열 번호: 13 내지 84로부터 선택된 아미노산 서열과 적어도 약 70% 동일한 아미노산 서열을 포함하는 하나 이상의 UGT 효소를 발현하는, 박테리아 세포.
- 제89 항에 있어서, 상기 박테리아 세포는 테르페노이드 글리코시드 기질을 당화시키는, 박테리아 세포.
- 제90 항에 있어서, 상기 박테리아 세포는 스테비올 글리코시드 또는 모그롤 글리코시드 기질을 당화시키는, 박테리아 세포.
- 제91 항에 있어서, 상기 UGT 효소는 스테비올 코어의 C13 및 C19 하이드록실에서의 1 차 당화, 및 C13 및 C19 1 차 글리코실 기의 1-2 및 1-3 분지형 당화가 가능한, 박테리아 세포.
- 제92 항에 있어서, 상기 박테리아 세포는 스테비아 잎 추출물 또는 이의 분획으로부터 RebM을 생산하는, 박테리아 세포.
- 제92 항 또는 제93 항에 있어서, 상기 UGT 효소는 서열 번호: 13 내지 32, 및 84 중 하나와 적어도 약 70%의 서열 동일성을 갖는 아미노산 서열을 포함하는 효소로부터 선택되는, 박테리아 세포.
- 제91 항에 있어서, 상기 박테리아 세포는 스테비아 잎 추출물 또는 이의 분획으로부터 RebE 및/또는 RebD을 생산하는, 박테리아 세포.
- 제95 항에 있어서, 상기 박테리아 세포는 스테비올 C13 및 C19 1 차 글리코실 기의 1-2 당화가 가능한 하나 이상의 UGT 효소를 발현하는, 박테리아 세포.
- 제96 항에 있어서, 상기 UGT 효소는 서열 번호: 13 내지 16, 및 26 내지 29 중 하나와 적어도 약 70%의 서열 동일성을 갖는 효소로부터 선택되는, 박테리아 세포.
- 제91 항에 있어서, 상기 박테리아 세포는 스테비아 잎 추출물 또는 이의 분획으로부터 RebB를 생산하는, 박테리아 세포.
- 제98 항에 있어서, 상기 박테리아 세포는 스테비올 C19 1 차 글리코실 기의 탈당화가 가능한 하나 이상의 UGT 효소를 발현하는, 박테리아 세포.
- 제99 항에 있어서, 상기 UGT 효소는 서열 번호: 18, 30, 31 및 99 중 하나와 적어도 약 70%의 서열 동일성을 갖는 효소로부터 선택되는, 박테리아 세포.
- 제100 항에 있어서, 상기 박테리아 세포는 서열 번호: 31 또는 99와 적어도 70%의 동일성을 갖는 UGT 효소를 발현하는, 방법.
- 제91 항에 있어서, 상기 박테리아 세포는 스테비아 잎 추출물 또는 이의 분획으로부터 RebI를 생산하는, 박테리아 세포.
- 제102 항에 있어서, 상기 박테리아 세포는 스테비올 C13 및 C19 1 차 글리코실 기의 1-3 당화가 가능한 하나 이상의 UGT 효소를 발현하는, 박테리아 세포.
- 제103 항에 있어서, 상기 UGT 효소는 서열 번호: 19 내지 25 중 하나와 적어도 약 70%의 서열 동일성을 갖는 효소로부터 선택되는, 박테리아 세포.
- 제91 항에 있어서, 상기 박테리아 세포는 나한과 추출물로부터 mog. V, mog VI, isomog. V 또는 시아메노시드를 생산하는, 박테리아 세포.
- 제105 항에 있어서, 상기 UGT 효소는 모그롤 코어의 C3 및 C24 하이드록실에서의 1 차 당화, 및 C3 및/또는 C24 1 차 글리코실 기의 1-2 및 1-6 분지형 당화가 가능한, 박테리아 세포.
- 제106 항에 있어서, 상기 UGT 효소는 서열 번호: 13 내지 17, 29, 33 내지 39, 46, 54, 60, 71 내지 80, 및 82 내지 84 중 하나와 적어도 약 70%의 서열 동일성을 갖는 아미노산 서열을 포함하는 효소로부터 선택되는, 박테리아 세포.
- 제66 항 내지 제107 항 중 어느 한 항에 있어서, 상기 UGT 효소를 암호화하는 유전자는 미생물 세포의 염색체에 통합되거나, 염색체 외에서 발현되는, 박테리아 세포.
- 기질의 당화 방법으로서, 제66 항 내지 제108 항 중 어느 한 항의 세포를 당화용 기질의 존재 하에서 배양하는 단계, 및 당화 생성물을 회수하는 단계를 포함하는, 방법.
- 제109 항에 있어서, 상기 당화 생성물은 반응물 또는 배양물의 pH를 약 pH 5 미만까지 낮추거나, 반응물 또는 배양물의 pH를 약 pH 9 초과까지 상승시키는 단계, 온도를 적어도 약 50℃까지 상승시키는 단계, 및 하나 이상의 글리코시드 용해도 개선제를 첨가하는 단계 중 하나 이상; 이후의 효소 또는 바이오매스의 제거 단계에 의해 회수되는, 방법.
- UDP-의존성 당전이(UGT) 효소로서, 서열 번호: 13과 적어도 약 70%의 서열 동일성을 갖고, 하기로부터 선택된 하나 이상의 변형을 갖는 아미노산 서열을 포함하는, UDP-의존성 당전이(UGT) 효소:
V397S, V397C, G5N, S20E, S23D, R45Y, H59P, G94S, K97E, M150L, I185F, A206P, G210E, Q237R, M250K, A251E, C252L, G259E, Q263Y, I287M, C288F, V336I, F338L, D351E, F186I, F186M, F186T, L418F, A451T, A451L, T453K, T453R, V456S, V456W, V456T, V456M로부터 선택된 하나 이상의 아미노산 치환;
주로 글리신 및 세린 아미노산으로 구성된 5 내지 15 개의 아미노산에 의한, 서열 번호: 13의 잔기 270 내지 281의 치환;
서열 번호: 13에 대한 위치 3으로의 1 개 또는 2 개의 아미노산의 삽입, 및/또는 서열 번호: 13의 C-말단으로의 1 개의 아미노산의 첨가. - 제111 항에 있어서, 상기 UGT 효소는 서열 번호: 13의 아미노산 270 내지 281이 서열 GGSGGS(서열 번호: 85)로 치환되는, UGT 효소.
- 제111 항 또는 제112 항에 있어서, 상기 UGT 효소는 서열 번호: 13의 위치 3에 Arg이 삽입되거나, 위치 2와 3 사이에 Ile-Arg이 삽입되는, UGT 효소.
- 제111 항에 있어서, 상기 효소는 서열 번호: 13에 대해 G5N, F186T 및 V397S로부터 선택된 하나 이상의 치환을 포함하는, UGT 효소.
- 제114 항에 있어서, 상기 효소는 서열 번호: 13에 대해 아미노산 치환 G5N, F186T 및 V397S를 포함하는, UGT 효소.
- 제111 항에 있어서, 서열 번호: 14의 아미노산 서열을 포함하는, UGT 효소.
- UDP-의존성 당전이(UGT) 효소로서, 서열 번호: 14와 적어도 약 70%의 서열 동일성을 갖고, 하기로부터 선택된 하나 이상의 변형을 갖는 아미노산 서열을 포함하는, UDP-의존성 당전이(UGT) 효소:
V395A, Q263Y, D269R, K97E, Q262E, H59P, G259E, M150L, Y267H, T3R, V95Q, A238E, S308Q, Q237R, R45Y, E254D, L203I, S151R, S123D, D351E, T453M, G94T, T186M, V336I, L58S, F338L, F51W, C252L, M250D, A251E, C252V, A79P, W401F, S323A, A251E, A130D, S42E, H400Y, S266R, S23D, P56A, A206P, M250K, A143W, V456T, G94S, I427F, T186I, T453F, C252R, V38F, R45F, T37S, Q244K, L11I, I287M, V31P, T43D 및 P39T로부터 선택된 하나 이상의 아미노산 치환;
주로 글리신 및 세린 아미노산으로 구성된 5 내지 15 개의 아미노산의 링커에 의한, 서열 번호: 2의 잔기 270 내지 281의 결실;
서열 번호: 14에 대한 위치 3으로의 1 개 또는 2 개의 아미노산의 삽입, 및/또는 서열 번호: 14의 C-말단으로의 1 개의 아미노산의 첨가. - 제117 항에 있어서, 상기 UGT 효소는 서열 번호: 14의 아미노산 270 내지 281이, 주로 Ser 및 Gly로 구성된 6 내지 12 개의 아미노산의 링커 서열에 의해 치환되는, UGT 효소.
- 제117 항 또는 제118 항에 있어서, 상기 효소는 서열 번호: 14에 대해 H59P, A238E 및 L417F로부터 선택된 하나 이상의 치환을 포함하는, UGT 효소.
- 제119 항에 있어서, 상기 효소는 서열 번호: 14에 대해 아미노산 치환 H59P, A238E 및 L417F를 포함하는, UGT 효소.
- 제120 항에 있어서, 상기 효소는 서열 번호: 14의 A2와 T3 사이에 삽입 또는 Arg-Arg를 포함하는, UGT 효소.
- 제120 항에 있어서, 서열 번호: 15의 아미노산 서열을 포함하는, UGT 효소.
- 서열 번호: 15와 적어도 약 70%의 서열 동일성을 갖고, 서열 번호: 15에 대해 125, 152, 153 및 442로부터 선택된 위치에 하나 이상의 아미노산 치환을 갖는 아미노산 서열을 포함하는, UDP-의존성 당전이(UGT) 효소.
- 제123 항에 있어서, 서열 번호: 15에 대해 M152A, S153A, P442D 및 S125V로부터 선택된 아미노산 치환을 포함하는, UGT 효소.
- 제124 항에 있어서, 서열 번호: 16의 아미노산 서열을 포함하는, UGT 효소.
- 모그롤 또는 모그롤 글리코시드 기질의 당화 방법으로서, 상기 방법은 상기 기질을 UDP-당의 존재 하에서 UDP-의존성 당전이(UGT) 효소와 접촉시키는 것을 포함하고, 상기 UGT 효소는 서열 번호: 84, 서열 번호: 80, 서열 번호: 46, 서열 번호: 83, 서열 번호: 82, 서열 번호: 73, 서열 번호: 72, 서열 번호: 78, 서열 번호: 54, 서열 번호: 74, 서열 번호: 75, 서열 번호: 76, 서열 번호: 13, 서열 번호: 14, 서열 번호: 15, 서열 번호: 16, 서열 번호: 29 및 서열 번호: 79로부터 선택된 아미노산 서열과 적어도 약 80%의 서열 동일성을 갖는 아미노산 서열을 포함하는, 방법.
- 제126 항에 있어서, 상기 기질은 서열 번호: 84, 서열 번호: 80, 서열 번호: 46, 서열 번호: 83, 서열 번호: 82, 서열 번호: 73, 서열 번호: 72, 서열 번호: 78, 서열 번호: 54, 서열 번호: 74, 서열 번호: 75, 서열 번호: 76, 서열 번호: 13, 서열 번호: 14, 서열 번호: 15, 서열 번호: 16, 서열 번호: 29 및 서열 번호: 79로부터 선택된 아미노산 서열과 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 UGT 효소와 접촉되는, 방법.
- 제126 항에 있어서, 상기 기질은 서열 번호: 84, 서열 번호: 80, 서열 번호: 83, 서열 번호: 73, 서열 번호: 72, 서열 번호: 54 및 서열 번호: 13으로부터 선택된 아미노산 서열과 적어도 약 80%의 서열 동일성을 갖는 아미노산 서열을 포함하는 UGT 효소와 접촉되는, 방법.
- 제128 항에 있어서, 상기 기질은 서열 번호: 84, 서열 번호: 80, 서열 번호: 83, 서열 번호: 73, 서열 번호: 72, 서열 번호: 54 및 서열 번호: 13으로부터 선택된 아미노산 서열과 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 UGT 효소와 접촉되는, 방법.
- 제126항 내지 제129항 중 어느 한 항에 있어서, 상기 기질은 식물 추출물 또는 이의 분획으로 제공되는, 방법.
- 제130 항에 있어서, 상기 식물 추출물은 나한과 추출물 또는 이의 분획인, 방법.
- 제130 항 또는 제131 항에 있어서, 상기 식물 추출물은 모그롤, mog. I-A, mog. I-E, mog. II-A, mog. II-E, mog III, mog IVA, mog. IV 및 시아메노시드로부터 선택된 하나 이상의 기질을 포함하는, 방법.
- 제132항에 있어서, 상기 당화 생성물은 mog. IV, mog. IVA, mog. V, mog. VI 또는 시아메노시드를 포함하는, 방법.
- 제126항 내지 제133항 중 어느 한 항에 있어서, 상기 UGT 효소는 모그롤 코어의 C3 및 C24 하이드록실에서의 1 차 당화와, C3 및/또는 C24 1 차 글리코실 기의 1-2 및 1-6 분지형 당화가 가능한, 방법.
- 제126항 내지 제134항 중 어느 한 항에 있어서, 상기 기질이 UGT 효소를 발현하는 미생물 세포와 함께 배양되는, 방법.
- 제135항에 있어서, 상기 미생물 세포는 박테리아 세포인, 방법.
- 제136 항에 있어서, 상기 박테리아 세포는 에스체리쉬아 종, 바실러스 종, 로도박터 종, 자이모모나스 종 또는 슈도모나스 종인, 방법.
- 제137 항에 있어서, 상기 박테리아 세포는 에스체리쉬아 콜리, 바실러스 서브틸리스, 로도박터 캅슐라투스, 로도박터 스패로이데스, 자이모모나스 모빌리스 또는 슈도모나스 푸티다인, 방법.
- 제138항에 있어서, 상기 박테리아 균주는 E. 콜리인, 방법.
- 제136 항 내지 제139 항 중 어느 한 항에 있어서, 상기 박테리아 세포는 UDP-당의 이용가능성을 증가시키는 하나 이상의 유전자 변형을 갖는, 방법.
- 제139 항 또는 제140 항에 있어서, 상기 박테리아 세포는 수크로스 합성효소를 발현하고, 상기 수크로스 합성효소는 선택적으로 서열 번호: 1 내지 12 중 하나와 적어도 약 80%, 또는 적어도 약 85%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는, 방법.
- 제135 항에 있어서, 상기 미생물 세포는 선택적으로 사카로마이세스 세르비시애, 피키아 파스토리스 및 야로우위아 리포리티카를 포함하는 사카로마이세스, 피키아 또는 야로우위아로부터 선택된 효모 세포인, 방법.
- 제126 항 내지 제134 항 중 어느 한 항에 있어서, 상기 기질이 UGT 효소를 포함하는 세포 용해물과 인큐베이션되거나, 정제된 재조합 UGT 효소와 인큐베이션되는, 방법.
- 제126 항 내지 제143 항 중 어느 한 항에 있어서, 상기 당화 생성물은 반응물 또는 배양물의 pH를 약 pH 5 미만까지 낮추거나, 또는 반응물 또는 배양물의 pH를 약 pH 9 초과까지 상승시키는 단계, 온도를 적어도 약 50℃까지 상승시키는 단계, 및 하나 이상의 글리코시드 용해도 개선제를 첨가하는 단계 중 하나 이상; 및 이후의 효소 또는 바이오매스의 제거 단계에 의해 회수되는, 방법.
- 글리코시드 생성물의 제조 방법으로서,
무-세포 반응물 또는 미생물 배양물에서, 효소적 전이에 의해 하나 이상의 당 모이어티를 당화용 기질을 목표 글리코시드 생성물로 전환시키는 단계, 및
당화 생성물을 반응물 또는 배양물으로부터 회수하는 단계로서, 상기 회수하는 단계는 반응물 또는 배양물의 pH를 약 pH 5 미만까지 낮추거나, 반응물 또는 배양물의 pH를 약 pH 9 초과까지 상승시키는 단계, 온도를 적어도 약 50℃까지 상승시키는 단계, 및 하나 이상의 글리코시드 가용화제를 첨가하는 단계 중 하나 이상; 및 이후의 효소 또는 바이오매스의 제거 단계
를 포함하는, 방법. - 제145 항에 있어서, 상기 당화용 기질은 식물 추출물 또는 이의 분획으로 제공되는, 방법.
- 제145 항 또는 146 항에 있어서, 상기 기질은 테르페노이드 또는 테르페노이드 글리코시드, 플라보노이드 또는 플라보노이드 글리코시드, 칸나비노이드 또는 칸나비노이드 글리코시드, 폴리케티드 또는 폴리케티드 글리코시드, 스틸베노이드 또는 스틸베노이드 글리코시드, 및 폴리페놀 또는 폴리페놀 글리코시드로부터 선택된 2차 대사산물인, 방법.
- 제147 항에 있어서, 상기 기질은 테르페노이드 글리코시드를 포함하는, 방법.
- 제148 항에 있어서, 상기 테르페노이드 글리코시드는 스테비올 글리코시드, 또는 모그롤 글리코시드를 포함하는, 방법.
- 제147 항 내지 제149 항 중 어느 한 항에 있어서, 상기 기질은 1 개, 2 개, 3 개 또는 4 개의 글리코실 기를 갖는, 방법.
- 제150 항에 있어서, 상기 글리코실 기는 글루코실, 갈락토실, 만노실, 자일로실 및 람노실 기로부터 독립적으로 선택되는, 방법.
- 제151 항에 있어서, 상기 당화 생성물은 적어도 5 개의 글리코실 기, 또는 적어도 6 개 또는 적어도 7 개의 글리코실 기를 갖는, 방법.
- 제145 항 내지 제152 항 중 어느 한 항에 있어서, 상기 생성물의 생합성은 기질에 대한 적어도 2 회의 당화 반응과 관련되는, 방법.
- 제145 항 내지 제153 항 중 어느 한 항에 있어서, 상기 식물 추출물은 스테비아 추출물 또는 이의 분획인, 방법.
- 제154 항에 있어서, 상기 스테비아 잎 추출물은 스테비오시드, 스테비올비오시드, 레바우디오시드 A, 둘코시드 A, 둘코시드 B, 레바우디오시드 C 및 레바우디오시드 F 중 하나 이상을 포함하는, 방법.
- 제155 항에 있어서, 상기 추출물 또는 이의 분획 내 스테비올 글리코시드의 적어도 약 30%는 스테비오시드, 스테비올비오시드 및 레바우디오시드 A로부터 선택되는, 방법.
- 제154 항 내지 제156 항 중 어느 한 항에 있어서, 상기 당화 생성물은 RebM을 포함하는, 방법.
- 제157 항에 있어서, 상기 UGT 효소는 스테비올 코어의 C13 및 C19 하이드록실에서의 1 차 당화, 및 C13 및 C19 1 차 글리코실 기의 1-2 및 1-3 분지형 당화가 가능한, 방법.
- 제154 항 내지 제156 항 중 어느 한 항에 있어서, 상기 당화 생성물은 RebE 및/또는 RebD를 포함하는, 방법.
- 제159 항에 있어서, 상기 미생물 세포는 스테비올 C13 및 C19 1 차 글리코실 기의 1-2 당화가 가능한 하나 이상의 UGT 효소를 발현하는, 방법.
- 제154 항 내지 제156 항 중 어느 한 항에 있어서, 상기 당화 생성물은 RebB를 포함하는, 방법.
- 제161 항에 있어서, 상기 UGT 효소는 스테비올 C19 1 차 글리코실 기의 탈당화가 가능한, 방법.
- 제154 항 내지 제156 항 중 어느 한 항에 있어서, 상기 당화 생성물은 RebI를 포함하는, 방법.
- 제163 항에 있어서, 상기 하나 이상의 UGT 효소는 스테비올 C13 및 C19 1 차 글리코실 기의 1-3 당화가 가능한, 방법.
- 제145 항 내지 제153 항 중 어느 한 항에 있어서, 상기 식물 추출물은 나한과 추출물 또는 이의 분획인, 방법.
- 제165 항에 있어서, 상기 나한과 추출물은 모그롤, mog. I-A, mog. I-E, mog. II-A, mog. II-E, mog III, mog IVA, mog. IV 및 시아메노시드로부터 선택된 하나 이상의 기질을 포함하는, 방법.
- 제165 항 또는 제166 항에 있어서, 상기 당화 생성물은 mog. IV, mog. IVA, mog. V, mog. VI 또는 시아메노시드를 포함하는, 방법.
- 제165 항 내지 제167 항 중 어느 한 항에 있어서, 상기 UGT 효소는 모그롤 코어의 C3 및 C24 하이드록실에서의 1 차 당화와, C3 및/또는 C24 1 차 글리코실 기의 1-2 및 1-6 분지형 당화가 가능한, 방법.
- 제145 항 내지 제168 항 중 어느 한 항에 있어서, 상기 효소적 전이는 미생물 배양물에서 일어나되, 상기 미생물 배양물은 하나 이상의 우리딘 디포스페이트-의존성 당전이(UGT) 효소를 발현하는 미생물 균주를 포함하는, 방법.
- 제169 항에 있어서, 상기 미생물 균주는 당화용 기질을 생산하는 생합성 경로를 발현하고, 하나 이상의 UGT 효소를 발현하는, 방법.
- 제169 항에 있어서, 상기 미생물 균주는 하나 이상의 UGT 효소를 발현하고, 상기 균주는 공급된 기질과 함께 배양되는, 방법.
- 제169 항 내지 제171 항 중 어느 한 항에 있어서, 상기 효소적 전이는 선택적으로 사카로마이세스 세르비시애, 피키아 파스토리스 및 야로우위아 리포리티카를 포함하는, 사카로마이세스, 피키아 또는 야로우위아로부터 선택된 효모 균주의 미생물 배양에 의해 이루어지는, 방법.
- 제169 항 내지 제171 항 중 어느 한 항에 있어서, 상기 효소적 전이는 박테리아 균주의 미생물 배양에 의해 이루어지는, 방법.
- 제173 항에 있어서, 상기 박테리아 균주는 에스체리쉬아 종, 바실러스 종, 로도박터 종, 자이모모나스 종 또는 슈도모나스 종인, 방법.
- 제174 항에 있어서, 상기 박테리아 균주는 에스체리쉬아 콜리, 바실러스 서브틸리스, 로도박터 캅슐라투스, 로도박터 스패로이데스, 자이모모나스 모빌리스 또는 슈도모나스 푸티다인, 방법.
- 제175항에 있어서, 상기 박테리아 균주는 E. 콜리인, 방법.
- 제173 항 내지 제176 항 중 어느 한 항에 있어서, 상기 박테리아 세포는 UDP-당의 이용가능성을 증가시키는 하나 이상의 유전자 변형을 갖는, 방법.
- 제173 항 내지 제177 항 중 어느 한 항에 있어서, 상기 박테리아 세포는 수크로스 합성효소를 발현하고, 상기 수크로스 합성효소는 선택적으로 서열 번호: 1 내지 12 중 하나와 적어도 약 80%, 또는 적어도 약 85%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는, 방법.
- 제177 항 또는 제178 항에 있어서, 상기 박테리아 세포는 하기의 유전자 변형을 포함하는, 방법: ushA 및 galETKM, 또는 이들의 병렬상동체는 결실되거나, 불활성화되거나, 발현 또는 활성이 감소됨; pgi 또는 이의 병렬상동체는 결실되거나, 불활성화되거나, 발현 또는 활성이 감소됨; E. 콜리 pgm (서열 번호: 92) 및/또는 ycjU (서열 번호: 94), 또는 이들의 병렬상동체 또는 유도체는 과다 발현되거나, 활성이 증가됨; E. 콜리 galU (서열 번호: 93) 및/또는 비피도박테리움 비피둠 ugpA (서열 번호: 95), 또는 이들의 병렬상동체 또는 유도체는 과다 발현되거나, 활성이 증가됨.
- 제145 항 내지 제179 항 중 어느 한 항에 있어서, 공정은 배치, 연속 또는 반-연속 방식으로 수행되는, 방법.
- 제180 항에 있어서, 상기 방법은 유가 연속 또는 반-연속 방식으로 공급되어 수행되는, 방법.
- 제180 항 또는 제181 항에 있어서, 상기 효소적 전이는 부피가 적어도 10,000 L, 또는 적어도 50,000 L, 또는 적어도 100,000 L, 또는 적어도 150,000 L, 또는 적어도 200,000 L, 또는 적어도 500,000 L인 생물반응기에서 일어나는, 방법.
- 제182 항에 있어서, 상기 글리코시드 중간생성물은 적어도 약 24 시간, 또는 적어도 약 48 시간, 또는 적어도 약 72 시간 동안 미생물 균주와 함께 인큐베이션되는, 방법.
- 제182 항 또는 제183 항에 있어서, 상기 글리코시드 중간생성물은 약 72 시간 이하 동안 미생물 균주와 함께 인큐베이션되는, 방법.
- 제145 항 내지 제184 항 중 어느 한 항에 있어서, 상기 pH는 약 2 내지 약 4의 범위 내의 pH, 및 선택적으로 약 pH 3.5로 조절되는, 방법.
- 제145 항 내지 제184 항 중 어느 한 항에 있어서, 상기 pH는 약 9 내지 약 12의 범위 내의 pH로 조절되는, 방법.
- 제145 항 내지 제186 항 중 어느 한 항에 있어서, 상기 온도는 약 50℃ 내지 약 90℃, 및 선택적으로 약 70℃ 또는 약 80℃의 온도로 조절되는, 방법.
- 제185 항 내지 제187 항 중 어느 한 항에 있어서, 반응물 또는 배양 배지는 pH 및/또는 온도 조절을 위해 반응 탱크로부터 하베스트 탱크로 옮겨지며, 선택적으로 상기 반응 탱크와 하베스트 탱크는 직렬 상태인, 방법.
- 제188 항에 있어서, 상기 pH 조절 및 상기 온도 조절은 동일한 하베스트 탱크에서 일어나는, 방법.
- 제188 항에 있어서, 상기 pH 조절 및 상기 온도 조절은 상이한 하베스트 탱크에서 일어나는, 방법.
- 제189 항 또는 제190 항에 있어서, 상기 pH 조절은 상기 온도 조절에 앞서 일어나는, 방법.
- 제189 항 또는 제190 항에 있어서, 상기 온도 조절은 상기 pH 조절에 앞서 일어나는, 방법.
- 제189 항에 있어서, 상기 pH 조절 및 상기 온도 조절은 실질적으로 동시에 일어나는, 방법.
- 제185 항 내지 제193 항 중 어느 한 항에 있어서, 상기 pH 조절은 유기산 또는 무기산의 첨가에 의해 일어나는, 방법.
- 제145 항 내지 제194 항 중 어느 한 항에 있어서, 하나 이상의 글리코시드 용해도 개선제를 첨가하는 것을 포함하는, 방법.
- 제187 항 내지 제195 항 중 어느 한 항에 있어서, 상기 온도 조절은 반응 배지 또는 배양물을 예열된 하베스트 탱크로 전달함으로써 일어나는, 방법.
- 제145 항 내지 제196 항 중 어느 한 항에 있어서, 바이오매스 및/또는 효소를 원심분리에 의해 제거하여, 정화된 배지를 제조하는, 방법.
- 제197 항에 있어서, 상기 공정은 디스크 스택 분리기에 의한 바이오매스의 제거를 포함하는, 방법.
- 제198 항에 있어서, 상기 바이오매스는 글리코시드 생성물의 회수를 위해 재가공되는, 방법.
- 제198 항에 있어서, 상기 바이오매스는 폐기물로 가공되는, 방법.
- 제197 항 내지 제200 항 중 어느 한 항에 있어서, 정화된 배지는 하나 이상의 결정화 용기에 직접 또는 간접적으로 전달되는, 방법.
- 제201 항에 있어서, 결정화에 앞서, 여과, 이온 교환, 활성탄, 벤토나이트, 친화성 크로마토그래피 및 소화로부터 선택된 하나 이상의 공정을 사용하여 상기 정화된 배지로부터 상기 글리코시드 생성물을 정제하는, 방법.
- 제202 항에 있어서, 상기 친화성 크로마토그래피는 스티렌-디비닐벤젠 흡착성 수지, 강산성 양이온 교환 수지, 약산성 양이온 교환 수지, 강염기성 음이온 교환 수지, 약염기성 음이온 교환 수지 및 소수성 상호작용 수지 중 하나 이상을 이용하는, 방법.
- 제202 항 또는 제203 항에 있어서, 상기 공정은 시뮬레이션 이동층 크로마토그래피를 이용하는, 방법.
- 제203 항에 있어서, 결정화에 앞서, 상기 글리코시드 생성물이 선택적으로 약 5 kD의 막 기공 크기를 갖는 접선 유동 여과(TFF)에 의해 정제되는, 방법.
- 제202 항 내지 제205 항 중 어느 한 항에 있어서, 상기 회수는 어떠한 유기 용매도 이용하지 않는, 방법.
- 제202 항 내지 제206 항 중 어느 한 항에 있어서, 적어도 2 개의 결정화 단계가 이용되는, 방법.
- 제207 항에 있어서, 재결정화 단계에 앞서, 상기 글리코시드 생성물은 용액 또는 현탁액의 pH를 pH 5 미만으로 낮추거나, 용액 또는 현탁액의 pH를 pH 9 초과까지 상승시키는 단계, 용액 또는 현탁액의 온도를 적어도 약 50℃로 올리는 단계, 및 하나 이상의 글리코시드 가용화제를 첨가하는 단계에 의해 재가용화되는, 방법.
- 제207 항에 있어서, 상기 재결정화는 약 4 내지 약 12의 pH에서 수행되는, 방법.
- 제208 항 또는 제209 항에 있어서, 상기 재결정화 용매는 선택적으로 약 5 부피% 내지 약 50 부피%의 에탄올, 또는 약 25 부피% 내지 약 50 부피%의 에탄올, 또는 약 30 부피% 내지 약 40 부피%의 에탄올과 물인, 방법.
- 제210 항에 있어서, 상기 재결정화는 약 0.1 wt% 내지 약 2 wt% 범위의 하나 이상의 용해도 개선제의 존재 하에서 수행되는, 방법.
- 제211 항에 있어서, 상기 용해도 개선제는 글리세롤인, 방법.
- 제202 항 내지 제212 항 중 어느 한 항에 있어서, 상기 결정화 단계는 정적 결정화, 교반 결정화 및 증발 결정화 중 하나 이상의 상을 포함하는, 방법.
- 제213 항에 있어서, 상기 결정화 단계는 정지 상 이후 교반 상을 포함하는, 방법.
- 제207 항 내지 제214 항 중 어느 한 항에 있어서, 결정은 바스켓 원심분리 또는 벨트 필터를 사용하여 단리됨으로써, 글리코시드의 습윤 케이크를 단리하는, 방법.
- 제215 항에 있어서, 스테비올 글리코시드의 습윤 케이크는 세척되는, 방법.
- 제216 항에 있어서, 상기 습윤 케이크는 선택적으로 에탄올을 포함한 수용액에 의해 세척되는, 방법.
- 제217 항에 있어서, 상기 케이크는 용해되고, 재결정화되는, 방법.
- 제218 항에 있어서, 재결정화에 앞서, 상기 생성물은 여과 및/또는 활성탄에 의해 정제되는, 방법.
- 제219 항에 있어서, 상기 필터 물질은 친수성이고, 선택적으로 폴리에테르술폰, 나일론, 셀룰로스 아세테이트, 셀룰로스 니트레이트, 및 플루오로알킬 말단 폴레에틸렌 글리콜에 의해 코팅된 PTFE 또는 PVDF인, 방법.
- 제219 항 또는 제220 항에 있어서, 상기 필터의 기공 크기는 약 0.2 마이크론인, 방법.
- 제219 항에 있어서, 상기 여과는 열 여과 및/또는 접선 유동 여과를 포함하는, 방법.
- 제222 항에 있어서, 상기 여과는 기공 크기가 약 0.5 kD인 막을 사용한 접선 유동 여과를 포함하는, 방법.
- 제145 항 내지 제223 항 중 어느 한 항에 있어서, 정화된 배지로부터의 회수 공정은 비-크로마토그래피성이며, 선택적으로 여과 및 결정화로 본질적으로 이루어진, 방법.
- 제211 항 내지 제224 항 중 어느 한 항에 있어서, 재결정화로부터 얻은 습윤 케이크는 선택적으로 벨트 건조기, 패들 건조기 또는 스프레이 건조기를 사용하여 건조되는, 방법.
- 제225 항에 있어서, 상기 건조된 케이크는 분쇄되고, 선택적으로 포장되는, 방법.
- 제145 항 내지 제226 항 중 어느 한 항에 있어서, 목표 글리코시드 생성물이 회수된 조성물의 적어도 약 75 중량%인, 방법.
- 제227 항에 있어서, 상기 목표 글리코시드 생성물이 회수된 조성물의 적어도 약 80 중량%, 또는 적어도 약 90 중량% 또는 적어도 약 95 중량%인, 방법.
- 제145 항 내지 제228 항 중 어느 한 항에 있어서, 상기 당화 생성물의 수율은 배양물 또는 반응물 부피에 대해 적어도 약 25 g/L, 또는 적어도 약 50 g/L, 또는 적어도 약 75 g/L, 또는 적어도 약 100 g/L, 또는 적어도 약 125 g/L, 또는 적어도 약 150 g/L, 또는 적어도 약 200 g/L인, 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063117534P | 2020-11-24 | 2020-11-24 | |
US63/117,534 | 2020-11-24 | ||
PCT/US2021/060722 WO2022115527A1 (en) | 2020-11-24 | 2021-11-24 | Glycoside product biosynthesis and recovery |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230112673A true KR20230112673A (ko) | 2023-07-27 |
Family
ID=81755020
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237020932A KR20230112673A (ko) | 2020-11-24 | 2021-11-24 | 글리코시드 생성물 생합성 및 회수 |
Country Status (9)
Country | Link |
---|---|
US (1) | US20240093258A1 (ko) |
EP (1) | EP4251731A1 (ko) |
JP (1) | JP2023550496A (ko) |
KR (1) | KR20230112673A (ko) |
CN (1) | CN117203325A (ko) |
AU (1) | AU2021386386A1 (ko) |
CA (1) | CA3200689A1 (ko) |
MX (1) | MX2023006019A (ko) |
WO (1) | WO2022115527A1 (ko) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007022318A2 (en) * | 2005-08-17 | 2007-02-22 | Cornell Research Foundation | Nucleic acids and proteins associated with sucrose accumulation in coffee |
DK2806754T3 (en) * | 2012-01-23 | 2019-02-18 | Dsm Ip Assets Bv | Diterpene PREPARATION |
WO2020096907A1 (en) * | 2018-11-07 | 2020-05-14 | Firmenich Incorporated | Methods for making high intensity sweeteners |
BR112021011419A2 (pt) * | 2018-12-12 | 2021-09-08 | Conagen Inc. | Método de produção de rebaudiosídeo r6-2a e/ou r6-2b, r7-2, r6-1 e r6-4a e/ou r6-4b, rebaudiosídeo sintético e produto de consumo oral |
-
2021
- 2021-11-24 AU AU2021386386A patent/AU2021386386A1/en active Pending
- 2021-11-24 JP JP2023530874A patent/JP2023550496A/ja active Pending
- 2021-11-24 EP EP21899075.2A patent/EP4251731A1/en active Pending
- 2021-11-24 US US18/038,067 patent/US20240093258A1/en active Pending
- 2021-11-24 CA CA3200689A patent/CA3200689A1/en active Pending
- 2021-11-24 CN CN202180089758.5A patent/CN117203325A/zh active Pending
- 2021-11-24 WO PCT/US2021/060722 patent/WO2022115527A1/en active Application Filing
- 2021-11-24 KR KR1020237020932A patent/KR20230112673A/ko unknown
- 2021-11-24 MX MX2023006019A patent/MX2023006019A/es unknown
Also Published As
Publication number | Publication date |
---|---|
MX2023006019A (es) | 2023-08-04 |
WO2022115527A1 (en) | 2022-06-02 |
CA3200689A1 (en) | 2022-06-02 |
EP4251731A1 (en) | 2023-10-04 |
US20240093258A1 (en) | 2024-03-21 |
AU2021386386A1 (en) | 2023-06-22 |
JP2023550496A (ja) | 2023-12-01 |
CN117203325A (zh) | 2023-12-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102532079B1 (ko) | 전체 세포 생체변환을 통한 스테비올 글리코시드의 생산 | |
US10273519B2 (en) | Diterpene production in Yarrowia | |
US11788070B2 (en) | Uridine diphosphate-dependent glycosyltransferase enzyme | |
US11680281B2 (en) | Biosynthetic production of steviol glycosides and processes therefore | |
CN113683712B (zh) | 甜菊醇糖苷 | |
BR112016002092B1 (pt) | Recuperação de glicosídeos de esteviol | |
CN109563118A (zh) | 甜菊醇糖苷的结晶 | |
US20220042060A1 (en) | Biosynthesis production of steviol glycosides and processes therefore | |
BR112018000298B1 (pt) | Método para reduzir o teor de ácido caurenóico de uma composição de glicosídeo de esteviol | |
CN109563117A (zh) | 甜菊醇糖苷的结晶 | |
US20240093258A1 (en) | Glycoside product biosynthesis and recovery |