KR20210153670A - 변이체 효소를 통한 스테비올 글리코사이드 레바우디오사이드 i의 생합성 생산 - Google Patents
변이체 효소를 통한 스테비올 글리코사이드 레바우디오사이드 i의 생합성 생산 Download PDFInfo
- Publication number
- KR20210153670A KR20210153670A KR1020217037306A KR20217037306A KR20210153670A KR 20210153670 A KR20210153670 A KR 20210153670A KR 1020217037306 A KR1020217037306 A KR 1020217037306A KR 20217037306 A KR20217037306 A KR 20217037306A KR 20210153670 A KR20210153670 A KR 20210153670A
- Authority
- KR
- South Korea
- Prior art keywords
- leu
- glu
- ser
- val
- gly
- Prior art date
Links
- 102000004190 Enzymes Human genes 0.000 title claims abstract description 71
- 108090000790 Enzymes Proteins 0.000 title claims abstract description 71
- 235000019202 steviosides Nutrition 0.000 title claims abstract description 65
- 239000004383 Steviol glycoside Substances 0.000 title claims abstract description 60
- 229930182488 steviol glycoside Natural products 0.000 title claims abstract description 60
- 235000019411 steviol glycoside Nutrition 0.000 title claims abstract description 58
- 150000008144 steviol glycosides Chemical class 0.000 title claims abstract description 56
- 229930188195 rebaudioside Natural products 0.000 title claims abstract description 47
- 230000015572 biosynthetic process Effects 0.000 title description 15
- HSCJRCZFDFQWRP-JZMIEXBBSA-N UDP-alpha-D-glucose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1OP(O)(=O)OP(O)(=O)OC[C@@H]1[C@@H](O)[C@@H](O)[C@H](N2C(NC(=O)C=C2)=O)O1 HSCJRCZFDFQWRP-JZMIEXBBSA-N 0.000 claims abstract description 24
- HSCJRCZFDFQWRP-UHFFFAOYSA-N Uridindiphosphoglukose Natural products OC1C(O)C(O)C(CO)OC1OP(O)(=O)OP(O)(=O)OCC1C(O)C(O)C(N2C(NC(=O)C=C2)=O)O1 HSCJRCZFDFQWRP-UHFFFAOYSA-N 0.000 claims abstract description 24
- HELXLJCILKEWJH-NCGAPWICSA-N rebaudioside A Chemical compound O([C@H]1[C@H](O)[C@@H](CO)O[C@H]([C@@H]1O[C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O)O[C@]12C(=C)C[C@@]3(C1)CC[C@@H]1[C@@](C)(CCC[C@]1([C@@H]3CC2)C)C(=O)O[C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O)[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O HELXLJCILKEWJH-NCGAPWICSA-N 0.000 claims abstract description 23
- 239000001512 FEMA 4601 Substances 0.000 claims abstract description 18
- HELXLJCILKEWJH-SEAGSNCFSA-N Rebaudioside A Natural products O=C(O[C@H]1[C@@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1)[C@@]1(C)[C@@H]2[C@](C)([C@H]3[C@@]4(CC(=C)[C@@](O[C@H]5[C@H](O[C@H]6[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O6)[C@@H](O[C@H]6[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O6)[C@H](O)[C@@H](CO)O5)(C4)CC3)CC2)CCC1 HELXLJCILKEWJH-SEAGSNCFSA-N 0.000 claims abstract description 18
- HELXLJCILKEWJH-UHFFFAOYSA-N entered according to Sigma 01432 Natural products C1CC2C3(C)CCCC(C)(C(=O)OC4C(C(O)C(O)C(CO)O4)O)C3CCC2(C2)CC(=C)C21OC(C1OC2C(C(O)C(O)C(CO)O2)O)OC(CO)C(O)C1OC1OC(CO)C(O)C(O)C1O HELXLJCILKEWJH-UHFFFAOYSA-N 0.000 claims abstract description 18
- 235000019203 rebaudioside A Nutrition 0.000 claims abstract description 18
- 210000004027 cell Anatomy 0.000 claims description 109
- 238000000034 method Methods 0.000 claims description 87
- 101100262416 Stevia rebaudiana UGT76G1 gene Proteins 0.000 claims description 50
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 33
- 239000000203 mixture Substances 0.000 claims description 31
- 108010043934 Sucrose synthase Proteins 0.000 claims description 25
- 241000196324 Embryophyta Species 0.000 claims description 21
- 239000011541 reaction mixture Substances 0.000 claims description 20
- XCCTYIAWTASOJW-XVFCMESISA-N Uridine-5'-Diphosphate Chemical compound O[C@@H]1[C@H](O)[C@@H](COP(O)(=O)OP(O)(O)=O)O[C@H]1N1C(=O)NC(=O)C=C1 XCCTYIAWTASOJW-XVFCMESISA-N 0.000 claims description 19
- 238000000338 in vitro Methods 0.000 claims description 13
- 230000035772 mutation Effects 0.000 claims description 13
- 101000630755 Arabidopsis thaliana Sucrose synthase 1 Proteins 0.000 claims description 12
- 244000228451 Stevia rebaudiana Species 0.000 claims description 12
- 229930006000 Sucrose Natural products 0.000 claims description 12
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 claims description 12
- 239000000758 substrate Substances 0.000 claims description 12
- 239000005720 sucrose Substances 0.000 claims description 12
- 230000001580 bacterial effect Effects 0.000 claims description 9
- 240000004808 Saccharomyces cerevisiae Species 0.000 claims description 8
- 230000002194 synthesizing effect Effects 0.000 claims description 8
- 241000894006 Bacteria Species 0.000 claims description 7
- 241000588724 Escherichia coli Species 0.000 claims description 6
- 210000005253 yeast cell Anatomy 0.000 claims description 4
- 241000233866 Fungi Species 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 37
- 238000012546 transfer Methods 0.000 abstract description 10
- 125000002791 glucosyl group Chemical group C1([C@H](O)[C@@H](O)[C@H](O)[C@H](O1)CO)* 0.000 abstract description 7
- 108090000765 processed proteins & peptides Proteins 0.000 description 73
- 229940088598 enzyme Drugs 0.000 description 67
- 102000004196 processed proteins & peptides Human genes 0.000 description 63
- 229920001184 polypeptide Polymers 0.000 description 60
- 108090000623 proteins and genes Proteins 0.000 description 48
- 108091033319 polynucleotide Proteins 0.000 description 40
- 102000040430 polynucleotide Human genes 0.000 description 40
- 239000002157 polynucleotide Substances 0.000 description 40
- 230000014509 gene expression Effects 0.000 description 28
- 238000006243 chemical reaction Methods 0.000 description 27
- 230000004927 fusion Effects 0.000 description 27
- 150000007523 nucleic acids Chemical class 0.000 description 26
- 108020004414 DNA Proteins 0.000 description 25
- 238000005516 engineering process Methods 0.000 description 25
- 238000004519 manufacturing process Methods 0.000 description 22
- 102000004169 proteins and genes Human genes 0.000 description 22
- 239000013598 vector Substances 0.000 description 22
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 21
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 20
- 108010050848 glycylleucine Proteins 0.000 description 20
- 108091028043 Nucleic acid sequence Proteins 0.000 description 19
- 239000013604 expression vector Substances 0.000 description 18
- QFVOYBUQQBFCRH-VQSWZGCSSA-N steviol Chemical compound C([C@@]1(O)C(=C)C[C@@]2(C1)CC1)C[C@H]2[C@@]2(C)[C@H]1[C@](C)(C(O)=O)CCC2 QFVOYBUQQBFCRH-VQSWZGCSSA-N 0.000 description 18
- 108091026890 Coding region Proteins 0.000 description 17
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 17
- 235000018102 proteins Nutrition 0.000 description 17
- 108010038633 aspartylglutamate Proteins 0.000 description 16
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 16
- 238000006206 glycosylation reaction Methods 0.000 description 16
- 102000039446 nucleic acids Human genes 0.000 description 16
- 108020004707 nucleic acids Proteins 0.000 description 16
- 239000000047 product Substances 0.000 description 16
- QFVOYBUQQBFCRH-UHFFFAOYSA-N Steviol Natural products C1CC2(C3)CC(=C)C3(O)CCC2C2(C)C1C(C)(C(O)=O)CCC2 QFVOYBUQQBFCRH-UHFFFAOYSA-N 0.000 description 15
- 229940032084 steviol Drugs 0.000 description 15
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 14
- 230000002255 enzymatic effect Effects 0.000 description 14
- 238000006467 substitution reaction Methods 0.000 description 14
- 235000000346 sugar Nutrition 0.000 description 14
- 150000001875 compounds Chemical class 0.000 description 13
- -1 2- O- β-D-glucopyranosyl-3- O- β-D-glucopyranosyl-β-D-glucopyranosyl Chemical group 0.000 description 12
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 12
- LRHPLDYGYMQRHN-UHFFFAOYSA-N N-Butanol Chemical compound CCCCO LRHPLDYGYMQRHN-UHFFFAOYSA-N 0.000 description 12
- 239000008103 glucose Substances 0.000 description 12
- 230000009466 transformation Effects 0.000 description 12
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 11
- 235000001014 amino acid Nutrition 0.000 description 11
- 235000003599 food sweetener Nutrition 0.000 description 11
- 239000012634 fragment Substances 0.000 description 11
- 230000000813 microbial effect Effects 0.000 description 11
- 239000003765 sweetening agent Substances 0.000 description 11
- AEMPCGRFEZTWIF-IHRRRGAJSA-N Val-Leu-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O AEMPCGRFEZTWIF-IHRRRGAJSA-N 0.000 description 10
- 230000000295 complement effect Effects 0.000 description 10
- 230000013595 glycosylation Effects 0.000 description 10
- 108010092114 histidylphenylalanine Proteins 0.000 description 10
- 108010034529 leucyl-lysine Proteins 0.000 description 10
- CVUDMNSZAIZFAE-UHFFFAOYSA-N Val-Arg-Pro Natural products NC(N)=NCCCC(NC(=O)C(N)C(C)C)C(=O)N1CCCC1C(O)=O CVUDMNSZAIZFAE-UHFFFAOYSA-N 0.000 description 9
- 150000001413 amino acids Chemical class 0.000 description 9
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 9
- 108010057821 leucylproline Proteins 0.000 description 9
- 108010009298 lysylglutamic acid Proteins 0.000 description 9
- 239000002773 nucleotide Substances 0.000 description 9
- 125000003729 nucleotide group Chemical group 0.000 description 9
- 108010090894 prolylleucine Proteins 0.000 description 9
- LCRDMSSAKLTKBU-ZDLURKLDSA-N Gly-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN LCRDMSSAKLTKBU-ZDLURKLDSA-N 0.000 description 8
- UPLYXVPQLJVWMM-KKUMJFAQSA-N Ser-Phe-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UPLYXVPQLJVWMM-KKUMJFAQSA-N 0.000 description 8
- 229940024606 amino acid Drugs 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 108010051242 phenylalanylserine Proteins 0.000 description 8
- 238000012216 screening Methods 0.000 description 8
- CELPEWWLSXMVPH-CIUDSAMLSA-N Asp-Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O CELPEWWLSXMVPH-CIUDSAMLSA-N 0.000 description 7
- XEKOWRVHYACXOJ-UHFFFAOYSA-N Ethyl acetate Chemical compound CCOC(C)=O XEKOWRVHYACXOJ-UHFFFAOYSA-N 0.000 description 7
- 108700023372 Glycosyltransferases Proteins 0.000 description 7
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 7
- YGDWPQCLFJNMOL-MNXVOIDGSA-N Ile-Leu-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YGDWPQCLFJNMOL-MNXVOIDGSA-N 0.000 description 7
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 7
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 7
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 7
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 7
- JFWDJFULOLKQFY-QWRGUYRKSA-N Ser-Gly-Phe Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JFWDJFULOLKQFY-QWRGUYRKSA-N 0.000 description 7
- UEDUENGHJMELGK-HYDKPPNVSA-N Stevioside Chemical compound O([C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1O[C@]12C(=C)C[C@@]3(C1)CC[C@@H]1[C@@](C)(CCC[C@]1([C@@H]3CC2)C)C(=O)O[C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O)[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O UEDUENGHJMELGK-HYDKPPNVSA-N 0.000 description 7
- 238000007792 addition Methods 0.000 description 7
- 108010093581 aspartyl-proline Proteins 0.000 description 7
- 108010037850 glycylvaline Proteins 0.000 description 7
- 108010036413 histidylglycine Proteins 0.000 description 7
- 108010018006 histidylserine Proteins 0.000 description 7
- 108010064235 lysylglycine Proteins 0.000 description 7
- OHHNJQXIOPOJSC-UHFFFAOYSA-N stevioside Natural products CC1(CCCC2(C)C3(C)CCC4(CC3(CCC12C)CC4=C)OC5OC(CO)C(O)C(O)C5OC6OC(CO)C(O)C(O)C6O)C(=O)OC7OC(CO)C(O)C(O)C7O OHHNJQXIOPOJSC-UHFFFAOYSA-N 0.000 description 7
- 229940013618 stevioside Drugs 0.000 description 7
- BHSYMWWMVRPCPA-CYDGBPFRSA-N Arg-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CCCN=C(N)N BHSYMWWMVRPCPA-CYDGBPFRSA-N 0.000 description 6
- 108010090461 DFG peptide Proteins 0.000 description 6
- NLKVNZUFDPWPNL-YUMQZZPRSA-N Glu-Arg-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O NLKVNZUFDPWPNL-YUMQZZPRSA-N 0.000 description 6
- ZWABFSSWTSAMQN-KBIXCLLPSA-N Glu-Ile-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O ZWABFSSWTSAMQN-KBIXCLLPSA-N 0.000 description 6
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 6
- DLISPGXMKZTWQG-IFFSRLJSSA-N Glu-Thr-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O DLISPGXMKZTWQG-IFFSRLJSSA-N 0.000 description 6
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 6
- 102000051366 Glycosyltransferases Human genes 0.000 description 6
- PXKACEXYLPBMAD-JBDRJPRFSA-N Ile-Ser-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PXKACEXYLPBMAD-JBDRJPRFSA-N 0.000 description 6
- UCDHVOALNXENLC-KBPBESRZSA-N Leu-Gly-Tyr Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 UCDHVOALNXENLC-KBPBESRZSA-N 0.000 description 6
- BMVFXOQHDQZAQU-DCAQKATOSA-N Leu-Pro-Asp Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N BMVFXOQHDQZAQU-DCAQKATOSA-N 0.000 description 6
- VJGQRELPQWNURN-JYJNAYRXSA-N Leu-Tyr-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJGQRELPQWNURN-JYJNAYRXSA-N 0.000 description 6
- VUBIPAHVHMZHCM-KKUMJFAQSA-N Leu-Tyr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 VUBIPAHVHMZHCM-KKUMJFAQSA-N 0.000 description 6
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 6
- 238000005481 NMR spectroscopy Methods 0.000 description 6
- VTVVYQOXJCZVEB-WDCWCFNPSA-N Thr-Leu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O VTVVYQOXJCZVEB-WDCWCFNPSA-N 0.000 description 6
- YODDULVCGFQRFZ-ZKWXMUAHSA-N Val-Asp-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O YODDULVCGFQRFZ-ZKWXMUAHSA-N 0.000 description 6
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 6
- 108010005233 alanylglutamic acid Proteins 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 6
- 108010009111 arginyl-glycyl-glutamic acid Proteins 0.000 description 6
- 108010054812 diprotin A Proteins 0.000 description 6
- 150000002148 esters Chemical class 0.000 description 6
- 102000037865 fusion proteins Human genes 0.000 description 6
- 108020001507 fusion proteins Proteins 0.000 description 6
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 6
- 108010090037 glycyl-alanyl-isoleucine Proteins 0.000 description 6
- 108010081551 glycylphenylalanine Proteins 0.000 description 6
- 108010084389 glycyltryptophan Proteins 0.000 description 6
- 238000004128 high performance liquid chromatography Methods 0.000 description 6
- 125000005647 linker group Chemical group 0.000 description 6
- 244000005700 microbiome Species 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 238000012986 modification Methods 0.000 description 6
- 238000003752 polymerase chain reaction Methods 0.000 description 6
- RPYRMTHVSUWHSV-CUZJHZIBSA-N rebaudioside D Chemical compound O([C@H]1[C@H](O)[C@@H](CO)O[C@H]([C@@H]1O[C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O)O[C@]12C(=C)C[C@@]3(C1)CC[C@@H]1[C@@](C)(CCC[C@]1([C@@H]3CC2)C)C(=O)O[C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O[C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O)[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O RPYRMTHVSUWHSV-CUZJHZIBSA-N 0.000 description 6
- 230000014616 translation Effects 0.000 description 6
- 108010000998 wheylin-2 peptide Proteins 0.000 description 6
- JNTMAZFVYNDPLB-PEDHHIEDSA-N (2S,3S)-2-[[[(2S)-1-[(2S,3S)-2-amino-3-methyl-1-oxopentyl]-2-pyrrolidinyl]-oxomethyl]amino]-3-methylpentanoic acid Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JNTMAZFVYNDPLB-PEDHHIEDSA-N 0.000 description 5
- HJGZVLLLBJLXFC-LSJOCFKGSA-N Ala-His-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(O)=O HJGZVLLLBJLXFC-LSJOCFKGSA-N 0.000 description 5
- UWIQWPWWZUHBAO-ZLIFDBKOSA-N Ala-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)CC(C)C)C(O)=O)=CNC2=C1 UWIQWPWWZUHBAO-ZLIFDBKOSA-N 0.000 description 5
- 241000219195 Arabidopsis thaliana Species 0.000 description 5
- NLRJGXZWTKXRHP-DCAQKATOSA-N Asn-Leu-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NLRJGXZWTKXRHP-DCAQKATOSA-N 0.000 description 5
- GHODABZPVZMWCE-FXQIFTODSA-N Asp-Glu-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GHODABZPVZMWCE-FXQIFTODSA-N 0.000 description 5
- YFSLJHLQOALGSY-ZPFDUUQYSA-N Asp-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N YFSLJHLQOALGSY-ZPFDUUQYSA-N 0.000 description 5
- 108020004705 Codon Proteins 0.000 description 5
- 102000053602 DNA Human genes 0.000 description 5
- VTTSANCGJWLPNC-ZPFDUUQYSA-N Glu-Arg-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VTTSANCGJWLPNC-ZPFDUUQYSA-N 0.000 description 5
- MZZSCEANQDPJER-ONGXEEELSA-N Gly-Ala-Phe Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MZZSCEANQDPJER-ONGXEEELSA-N 0.000 description 5
- RVKIPWVMZANZLI-UHFFFAOYSA-N H-Lys-Trp-OH Natural products C1=CC=C2C(CC(NC(=O)C(N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-UHFFFAOYSA-N 0.000 description 5
- SCHZQZPYHBWYEQ-PEFMBERDSA-N Ile-Asn-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N SCHZQZPYHBWYEQ-PEFMBERDSA-N 0.000 description 5
- UKTUOMWSJPXODT-GUDRVLHUSA-N Ile-Asn-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N UKTUOMWSJPXODT-GUDRVLHUSA-N 0.000 description 5
- USXAYNCLFSUSBA-MGHWNKPDSA-N Ile-Phe-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N USXAYNCLFSUSBA-MGHWNKPDSA-N 0.000 description 5
- YCKPUHHMCFSUMD-IUKAMOBKSA-N Ile-Thr-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCKPUHHMCFSUMD-IUKAMOBKSA-N 0.000 description 5
- 241000880493 Leptailurus serval Species 0.000 description 5
- MJOZZTKJZQFKDK-GUBZILKMSA-N Leu-Ala-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(N)=O MJOZZTKJZQFKDK-GUBZILKMSA-N 0.000 description 5
- PBCHMHROGNUXMK-DLOVCJGASA-N Leu-Ala-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 PBCHMHROGNUXMK-DLOVCJGASA-N 0.000 description 5
- RVVBWTWPNFDYBE-SRVKXCTJSA-N Leu-Glu-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVVBWTWPNFDYBE-SRVKXCTJSA-N 0.000 description 5
- WIDZHJTYKYBLSR-DCAQKATOSA-N Leu-Glu-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WIDZHJTYKYBLSR-DCAQKATOSA-N 0.000 description 5
- PBLLTSKBTAHDNA-KBPBESRZSA-N Lys-Gly-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PBLLTSKBTAHDNA-KBPBESRZSA-N 0.000 description 5
- NYTDJEZBAAFLLG-IHRRRGAJSA-N Lys-Val-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O NYTDJEZBAAFLLG-IHRRRGAJSA-N 0.000 description 5
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 5
- 108010079364 N-glycylalanine Proteins 0.000 description 5
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 5
- BPIMVBKDLSBKIJ-FCLVOEFKSA-N Phe-Thr-Phe Chemical compound C([C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 BPIMVBKDLSBKIJ-FCLVOEFKSA-N 0.000 description 5
- FMLRRBDLBJLJIK-DCAQKATOSA-N Pro-Leu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FMLRRBDLBJLJIK-DCAQKATOSA-N 0.000 description 5
- FIDMVVBUOCMMJG-CIUDSAMLSA-N Ser-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO FIDMVVBUOCMMJG-CIUDSAMLSA-N 0.000 description 5
- ZOPISOXXPQNOCO-SVSWQMSJSA-N Ser-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CO)N ZOPISOXXPQNOCO-SVSWQMSJSA-N 0.000 description 5
- KCGIREHVWRXNDH-GARJFASQSA-N Ser-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N KCGIREHVWRXNDH-GARJFASQSA-N 0.000 description 5
- 235000006092 Stevia rebaudiana Nutrition 0.000 description 5
- VFEHSAJCWWHDBH-RHYQMDGZSA-N Thr-Arg-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O VFEHSAJCWWHDBH-RHYQMDGZSA-N 0.000 description 5
- KSCVLGXNQXKUAR-JYJNAYRXSA-N Tyr-Leu-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KSCVLGXNQXKUAR-JYJNAYRXSA-N 0.000 description 5
- QHONGSVIVOFKAC-ULQDDVLXSA-N Tyr-Pro-His Chemical compound N[C@@H](Cc1ccc(O)cc1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O QHONGSVIVOFKAC-ULQDDVLXSA-N 0.000 description 5
- VHIZXDZMTDVFGX-DCAQKATOSA-N Val-Ser-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N VHIZXDZMTDVFGX-DCAQKATOSA-N 0.000 description 5
- 108010044940 alanylglutamine Proteins 0.000 description 5
- 108010068380 arginylarginine Proteins 0.000 description 5
- 108010062796 arginyllysine Proteins 0.000 description 5
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 5
- 108010092854 aspartyllysine Proteins 0.000 description 5
- 108010049041 glutamylalanine Proteins 0.000 description 5
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 5
- 238000003919 heteronuclear multiple bond coherence Methods 0.000 description 5
- 108010025306 histidylleucine Proteins 0.000 description 5
- 108010079317 prolyl-tyrosine Proteins 0.000 description 5
- GSGVXNMGMKBGQU-PHESRWQRSA-N rebaudioside M Chemical compound C[C@@]12CCC[C@](C)([C@H]1CC[C@@]13CC(=C)[C@@](C1)(CC[C@@H]23)O[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O[C@@H]2O[C@H](CO)[C@@H](O)[C@H](O)[C@H]2O)[C@H]1O[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O)C(=O)O[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O[C@@H]2O[C@H](CO)[C@@H](O)[C@H](O)[C@H]2O)[C@H]1O[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O GSGVXNMGMKBGQU-PHESRWQRSA-N 0.000 description 5
- 230000001105 regulatory effect Effects 0.000 description 5
- 230000003595 spectral effect Effects 0.000 description 5
- 239000000126 substance Substances 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 238000013518 transcription Methods 0.000 description 5
- 230000035897 transcription Effects 0.000 description 5
- 238000001890 transfection Methods 0.000 description 5
- 230000009261 transgenic effect Effects 0.000 description 5
- 238000013519 translation Methods 0.000 description 5
- 108010044292 tryptophyltyrosine Proteins 0.000 description 5
- 108010078580 tyrosylleucine Proteins 0.000 description 5
- 108010073969 valyllysine Proteins 0.000 description 5
- GJLXVWOMRRWCIB-MERZOTPQSA-N (2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-acetamido-5-(diaminomethylideneamino)pentanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]-3-(1H-indol-3-yl)propanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanamide Chemical compound C([C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(N)=O)C1=CC=C(O)C=C1 GJLXVWOMRRWCIB-MERZOTPQSA-N 0.000 description 4
- KJTLQQUUPVSXIM-ZCFIWIBFSA-N (R)-mevalonic acid Chemical compound OCC[C@](O)(C)CC(O)=O KJTLQQUUPVSXIM-ZCFIWIBFSA-N 0.000 description 4
- ONVABDHFQKWOSV-UHFFFAOYSA-N 16-Phyllocladene Natural products C1CC(C2)C(=C)CC32CCC2C(C)(C)CCCC2(C)C31 ONVABDHFQKWOSV-UHFFFAOYSA-N 0.000 description 4
- WEZDRVHTDXTVLT-GJZGRUSLSA-N 2-[[(2s)-2-[[(2s)-2-[(2-aminoacetyl)amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]acetic acid Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 WEZDRVHTDXTVLT-GJZGRUSLSA-N 0.000 description 4
- JBGSZRYCXBPWGX-BQBZGAKWSA-N Ala-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N JBGSZRYCXBPWGX-BQBZGAKWSA-N 0.000 description 4
- WYPUMLRSQMKIJU-BPNCWPANSA-N Ala-Arg-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O WYPUMLRSQMKIJU-BPNCWPANSA-N 0.000 description 4
- ZIBWKCRKNFYTPT-ZKWXMUAHSA-N Ala-Asn-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O ZIBWKCRKNFYTPT-ZKWXMUAHSA-N 0.000 description 4
- OKEWAFFWMHBGPT-XPUUQOCRSA-N Ala-His-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CN=CN1 OKEWAFFWMHBGPT-XPUUQOCRSA-N 0.000 description 4
- NYDBKUNVSALYPX-NAKRPEOUSA-N Ala-Ile-Arg Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NYDBKUNVSALYPX-NAKRPEOUSA-N 0.000 description 4
- DVJSJDDYCYSMFR-ZKWXMUAHSA-N Ala-Ile-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O DVJSJDDYCYSMFR-ZKWXMUAHSA-N 0.000 description 4
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 4
- QRIYOHQJRDHFKF-UWJYBYFXSA-N Ala-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 QRIYOHQJRDHFKF-UWJYBYFXSA-N 0.000 description 4
- AUFHLLPVPSMEOG-YUMQZZPRSA-N Arg-Gly-Glu Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AUFHLLPVPSMEOG-YUMQZZPRSA-N 0.000 description 4
- LLUGJARLJCGLAR-CYDGBPFRSA-N Arg-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N LLUGJARLJCGLAR-CYDGBPFRSA-N 0.000 description 4
- HGKHPCFTRQDHCU-IUCAKERBSA-N Arg-Pro-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O HGKHPCFTRQDHCU-IUCAKERBSA-N 0.000 description 4
- WTUZDHWWGUQEKN-SRVKXCTJSA-N Arg-Val-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O WTUZDHWWGUQEKN-SRVKXCTJSA-N 0.000 description 4
- PFOYSEIHFVKHNF-FXQIFTODSA-N Asn-Ala-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PFOYSEIHFVKHNF-FXQIFTODSA-N 0.000 description 4
- RTFWCVDISAMGEQ-SRVKXCTJSA-N Asn-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N RTFWCVDISAMGEQ-SRVKXCTJSA-N 0.000 description 4
- BKZFBJYIVSBXCO-KKUMJFAQSA-N Asn-Phe-His Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC=N1)C(O)=O BKZFBJYIVSBXCO-KKUMJFAQSA-N 0.000 description 4
- TZQWZQSMHDVLQL-QEJZJMRPSA-N Asn-Trp-Gln Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N TZQWZQSMHDVLQL-QEJZJMRPSA-N 0.000 description 4
- NYLBGYLHBDFRHL-VEVYYDQMSA-N Asp-Arg-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NYLBGYLHBDFRHL-VEVYYDQMSA-N 0.000 description 4
- QRULNKJGYQQZMW-ZLUOBGJFSA-N Asp-Asn-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QRULNKJGYQQZMW-ZLUOBGJFSA-N 0.000 description 4
- QSFHZPQUAAQHAQ-CIUDSAMLSA-N Asp-Ser-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O QSFHZPQUAAQHAQ-CIUDSAMLSA-N 0.000 description 4
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 4
- IVCOYUURLWQDJQ-LPEHRKFASA-N Gln-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N)C(=O)O IVCOYUURLWQDJQ-LPEHRKFASA-N 0.000 description 4
- LVSYIKGMLRHKME-IUCAKERBSA-N Gln-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)N)N LVSYIKGMLRHKME-IUCAKERBSA-N 0.000 description 4
- XQDGOJPVMSWZSO-SRVKXCTJSA-N Gln-Pro-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N XQDGOJPVMSWZSO-SRVKXCTJSA-N 0.000 description 4
- OXEMJGCAJFFREE-FXQIFTODSA-N Glu-Gln-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O OXEMJGCAJFFREE-FXQIFTODSA-N 0.000 description 4
- NKLRYVLERDYDBI-FXQIFTODSA-N Glu-Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKLRYVLERDYDBI-FXQIFTODSA-N 0.000 description 4
- QJCKNLPMTPXXEM-AUTRQRHGSA-N Glu-Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O QJCKNLPMTPXXEM-AUTRQRHGSA-N 0.000 description 4
- QXDXIXFSFHUYAX-MNXVOIDGSA-N Glu-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O QXDXIXFSFHUYAX-MNXVOIDGSA-N 0.000 description 4
- CUPSDFQZTVVTSK-GUBZILKMSA-N Glu-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(O)=O CUPSDFQZTVVTSK-GUBZILKMSA-N 0.000 description 4
- IDEODOAVGCMUQV-GUBZILKMSA-N Glu-Ser-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IDEODOAVGCMUQV-GUBZILKMSA-N 0.000 description 4
- VIPDPMHGICREIS-GVXVVHGQSA-N Glu-Val-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VIPDPMHGICREIS-GVXVVHGQSA-N 0.000 description 4
- RLFSBAPJTYKSLG-WHFBIAKZSA-N Gly-Ala-Asp Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O RLFSBAPJTYKSLG-WHFBIAKZSA-N 0.000 description 4
- CUYLIWAAAYJKJH-RYUDHWBXSA-N Gly-Glu-Tyr Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 CUYLIWAAAYJKJH-RYUDHWBXSA-N 0.000 description 4
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 4
- PCPOYRCAHPJXII-UWVGGRQHSA-N Gly-Lys-Met Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(O)=O PCPOYRCAHPJXII-UWVGGRQHSA-N 0.000 description 4
- BBTCXWTXOXUNFX-IUCAKERBSA-N Gly-Met-Arg Chemical compound CSCC[C@H](NC(=O)CN)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O BBTCXWTXOXUNFX-IUCAKERBSA-N 0.000 description 4
- WCORRBXVISTKQL-WHFBIAKZSA-N Gly-Ser-Ser Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WCORRBXVISTKQL-WHFBIAKZSA-N 0.000 description 4
- NIOPEYHPOBWLQO-KBPBESRZSA-N Gly-Trp-Glu Chemical compound NCC(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(=O)N[C@@H](CCC(O)=O)C(O)=O NIOPEYHPOBWLQO-KBPBESRZSA-N 0.000 description 4
- YGHSQRJSHKYUJY-SCZZXKLOSA-N Gly-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN YGHSQRJSHKYUJY-SCZZXKLOSA-N 0.000 description 4
- ZHHLTWUOWXHVQJ-YUMQZZPRSA-N His-Ser-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZHHLTWUOWXHVQJ-YUMQZZPRSA-N 0.000 description 4
- LQSBBHNVAVNZSX-GHCJXIJMSA-N Ile-Ala-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N LQSBBHNVAVNZSX-GHCJXIJMSA-N 0.000 description 4
- ASCFJMSGKUIRDU-ZPFDUUQYSA-N Ile-Arg-Gln Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O ASCFJMSGKUIRDU-ZPFDUUQYSA-N 0.000 description 4
- FVEWRQXNISSYFO-ZPFDUUQYSA-N Ile-Arg-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N FVEWRQXNISSYFO-ZPFDUUQYSA-N 0.000 description 4
- IITVUURPOYGCTD-NAKRPEOUSA-N Ile-Pro-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IITVUURPOYGCTD-NAKRPEOUSA-N 0.000 description 4
- IVXJIMGDOYRLQU-XUXIUFHCSA-N Ile-Pro-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O IVXJIMGDOYRLQU-XUXIUFHCSA-N 0.000 description 4
- BZUOLKFQVVBTJY-SLBDDTMCSA-N Ile-Trp-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(=O)N)C(=O)O)N BZUOLKFQVVBTJY-SLBDDTMCSA-N 0.000 description 4
- YKNBJXOJTURHCU-DCAQKATOSA-N Leu-Asp-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKNBJXOJTURHCU-DCAQKATOSA-N 0.000 description 4
- PJYSOYLLTJKZHC-GUBZILKMSA-N Leu-Asp-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(N)=O PJYSOYLLTJKZHC-GUBZILKMSA-N 0.000 description 4
- ZDSNOSQHMJBRQN-SRVKXCTJSA-N Leu-Asp-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N ZDSNOSQHMJBRQN-SRVKXCTJSA-N 0.000 description 4
- MMEDVBWCMGRKKC-GARJFASQSA-N Leu-Asp-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N MMEDVBWCMGRKKC-GARJFASQSA-N 0.000 description 4
- ZFNLIDNJUWNIJL-WDCWCFNPSA-N Leu-Glu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZFNLIDNJUWNIJL-WDCWCFNPSA-N 0.000 description 4
- DDVHDMSBLRAKNV-IHRRRGAJSA-N Leu-Met-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O DDVHDMSBLRAKNV-IHRRRGAJSA-N 0.000 description 4
- UHNQRAFSEBGZFZ-YESZJQIVSA-N Leu-Phe-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N UHNQRAFSEBGZFZ-YESZJQIVSA-N 0.000 description 4
- ZJZNLRVCZWUONM-JXUBOQSCSA-N Leu-Thr-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O ZJZNLRVCZWUONM-JXUBOQSCSA-N 0.000 description 4
- UCRJTSIIAYHOHE-ULQDDVLXSA-N Leu-Tyr-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UCRJTSIIAYHOHE-ULQDDVLXSA-N 0.000 description 4
- MPGHETGWWWUHPY-CIUDSAMLSA-N Lys-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN MPGHETGWWWUHPY-CIUDSAMLSA-N 0.000 description 4
- UWKNTTJNVSYXPC-CIUDSAMLSA-N Lys-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN UWKNTTJNVSYXPC-CIUDSAMLSA-N 0.000 description 4
- HEWWNLVEWBJBKA-WDCWCFNPSA-N Lys-Gln-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCCCN HEWWNLVEWBJBKA-WDCWCFNPSA-N 0.000 description 4
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 4
- LUTDBHBIHHREDC-IHRRRGAJSA-N Lys-Pro-Lys Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O LUTDBHBIHHREDC-IHRRRGAJSA-N 0.000 description 4
- QVTDVTONTRSQMF-WDCWCFNPSA-N Lys-Thr-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CCCCN QVTDVTONTRSQMF-WDCWCFNPSA-N 0.000 description 4
- ZFNYWKHYUMEZDZ-WDSOQIARSA-N Lys-Trp-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCCCN)N ZFNYWKHYUMEZDZ-WDSOQIARSA-N 0.000 description 4
- AETNZPKUUYYYEK-CIUDSAMLSA-N Met-Glu-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O AETNZPKUUYYYEK-CIUDSAMLSA-N 0.000 description 4
- ORRNBLTZBBESPN-HJWJTTGWSA-N Met-Ile-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ORRNBLTZBBESPN-HJWJTTGWSA-N 0.000 description 4
- AFFKUNVPPLQUGA-DCAQKATOSA-N Met-Leu-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O AFFKUNVPPLQUGA-DCAQKATOSA-N 0.000 description 4
- AXHNAGAYRGCDLG-UWVGGRQHSA-N Met-Lys-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O AXHNAGAYRGCDLG-UWVGGRQHSA-N 0.000 description 4
- RDLSEGZJMYGFNS-FXQIFTODSA-N Met-Ser-Asp Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RDLSEGZJMYGFNS-FXQIFTODSA-N 0.000 description 4
- GWADARYJIJDYRC-XGEHTFHBSA-N Met-Thr-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O GWADARYJIJDYRC-XGEHTFHBSA-N 0.000 description 4
- AJOKKVTWEMXZHC-DRZSPHRISA-N Phe-Ala-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 AJOKKVTWEMXZHC-DRZSPHRISA-N 0.000 description 4
- DDYIRGBOZVKRFR-AVGNSLFASA-N Phe-Asp-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N DDYIRGBOZVKRFR-AVGNSLFASA-N 0.000 description 4
- MGBRZXXGQBAULP-DRZSPHRISA-N Phe-Glu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 MGBRZXXGQBAULP-DRZSPHRISA-N 0.000 description 4
- DVOCGBNHAUHKHJ-DKIMLUQUSA-N Phe-Ile-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O DVOCGBNHAUHKHJ-DKIMLUQUSA-N 0.000 description 4
- KDYPMIZMXDECSU-JYJNAYRXSA-N Phe-Leu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 KDYPMIZMXDECSU-JYJNAYRXSA-N 0.000 description 4
- LKRUQZQZMXMKEQ-SFJXLCSZSA-N Phe-Trp-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LKRUQZQZMXMKEQ-SFJXLCSZSA-N 0.000 description 4
- RGMLUHANLDVMPB-ULQDDVLXSA-N Phe-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N RGMLUHANLDVMPB-ULQDDVLXSA-N 0.000 description 4
- 241000235648 Pichia Species 0.000 description 4
- IWNOFCGBMSFTBC-CIUDSAMLSA-N Pro-Ala-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IWNOFCGBMSFTBC-CIUDSAMLSA-N 0.000 description 4
- PZSCUPVOJGKHEP-CIUDSAMLSA-N Pro-Gln-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O PZSCUPVOJGKHEP-CIUDSAMLSA-N 0.000 description 4
- FISHYTLIMUYTQY-GUBZILKMSA-N Pro-Gln-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H]1CCCN1 FISHYTLIMUYTQY-GUBZILKMSA-N 0.000 description 4
- VZKBJNBZMZHKRC-XUXIUFHCSA-N Pro-Ile-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O VZKBJNBZMZHKRC-XUXIUFHCSA-N 0.000 description 4
- CDGABSWLRMECHC-IHRRRGAJSA-N Pro-Lys-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O CDGABSWLRMECHC-IHRRRGAJSA-N 0.000 description 4
- RPLMFKUKFZOTER-AVGNSLFASA-N Pro-Met-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@@H]1CCCN1 RPLMFKUKFZOTER-AVGNSLFASA-N 0.000 description 4
- MKGIILKDUGDRRO-FXQIFTODSA-N Pro-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 MKGIILKDUGDRRO-FXQIFTODSA-N 0.000 description 4
- YWPVROCHNBYFTP-UHFFFAOYSA-N Rubusoside Natural products C1CC2C3(C)CCCC(C)(C(=O)OC4C(C(O)C(O)C(CO)O4)O)C3CCC2(C2)CC(=C)C21OC1OC(CO)C(O)C(O)C1O YWPVROCHNBYFTP-UHFFFAOYSA-N 0.000 description 4
- OLIJLNWFEQEFDM-SRVKXCTJSA-N Ser-Asp-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OLIJLNWFEQEFDM-SRVKXCTJSA-N 0.000 description 4
- DSSOYPJWSWFOLK-CIUDSAMLSA-N Ser-Cys-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O DSSOYPJWSWFOLK-CIUDSAMLSA-N 0.000 description 4
- RNMRYWZYFHHOEV-CIUDSAMLSA-N Ser-Gln-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RNMRYWZYFHHOEV-CIUDSAMLSA-N 0.000 description 4
- LALNXSXEYFUUDD-GUBZILKMSA-N Ser-Glu-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LALNXSXEYFUUDD-GUBZILKMSA-N 0.000 description 4
- OHKFXGKHSJKKAL-NRPADANISA-N Ser-Glu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OHKFXGKHSJKKAL-NRPADANISA-N 0.000 description 4
- XXXAXOWMBOKTRN-XPUUQOCRSA-N Ser-Gly-Val Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXXAXOWMBOKTRN-XPUUQOCRSA-N 0.000 description 4
- VZQRNAYURWAEFE-KKUMJFAQSA-N Ser-Leu-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VZQRNAYURWAEFE-KKUMJFAQSA-N 0.000 description 4
- XVWDJUROVRQKAE-KKUMJFAQSA-N Ser-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CC1=CC=CC=C1 XVWDJUROVRQKAE-KKUMJFAQSA-N 0.000 description 4
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 4
- JURQXQBJKUHGJS-UHFFFAOYSA-N Ser-Ser-Ser-Ser Chemical compound OCC(N)C(=O)NC(CO)C(=O)NC(CO)C(=O)NC(CO)C(O)=O JURQXQBJKUHGJS-UHFFFAOYSA-N 0.000 description 4
- PMTWIUBUQRGCSB-FXQIFTODSA-N Ser-Val-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O PMTWIUBUQRGCSB-FXQIFTODSA-N 0.000 description 4
- SGZVZUCRAVSPKQ-FXQIFTODSA-N Ser-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N SGZVZUCRAVSPKQ-FXQIFTODSA-N 0.000 description 4
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 4
- FDALPRWYVKJCLL-PMVVWTBXSA-N Thr-His-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)NCC(O)=O FDALPRWYVKJCLL-PMVVWTBXSA-N 0.000 description 4
- STUAPCLEDMKXKL-LKXGYXEUSA-N Thr-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O STUAPCLEDMKXKL-LKXGYXEUSA-N 0.000 description 4
- LECUEEHKUFYOOV-ZJDVBMNYSA-N Thr-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](N)[C@@H](C)O LECUEEHKUFYOOV-ZJDVBMNYSA-N 0.000 description 4
- UKINEYBQXPMOJO-UBHSHLNASA-N Trp-Asn-Ser Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N UKINEYBQXPMOJO-UBHSHLNASA-N 0.000 description 4
- SAKLWFSRZTZQAJ-GQGQLFGLSA-N Trp-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N SAKLWFSRZTZQAJ-GQGQLFGLSA-N 0.000 description 4
- OGZRZMJASKKMJZ-XIRDDKMYSA-N Trp-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N OGZRZMJASKKMJZ-XIRDDKMYSA-N 0.000 description 4
- MXKUGFHWYYKVDV-SZMVWBNQSA-N Trp-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)Cc1c[nH]c2ccccc12)C(C)C)C(O)=O MXKUGFHWYYKVDV-SZMVWBNQSA-N 0.000 description 4
- ZRPLVTZTKPPSBT-AVGNSLFASA-N Tyr-Glu-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZRPLVTZTKPPSBT-AVGNSLFASA-N 0.000 description 4
- WTTRJMAZPDHPGS-KKXDTOCCSA-N Tyr-Phe-Ala Chemical compound C[C@H](NC(=O)[C@H](Cc1ccccc1)NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(O)=O WTTRJMAZPDHPGS-KKXDTOCCSA-N 0.000 description 4
- LVFZXRQQQDTBQH-IRIUXVKKSA-N Tyr-Thr-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O LVFZXRQQQDTBQH-IRIUXVKKSA-N 0.000 description 4
- WDIGUPHXPBMODF-UMNHJUIQSA-N Val-Glu-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N WDIGUPHXPBMODF-UMNHJUIQSA-N 0.000 description 4
- XXROXFHCMVXETG-UWVGGRQHSA-N Val-Gly-Val Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXROXFHCMVXETG-UWVGGRQHSA-N 0.000 description 4
- WDIWOIRFNMLNKO-ULQDDVLXSA-N Val-Leu-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WDIWOIRFNMLNKO-ULQDDVLXSA-N 0.000 description 4
- UZFNHAXYMICTBU-DZKIICNBSA-N Val-Phe-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N UZFNHAXYMICTBU-DZKIICNBSA-N 0.000 description 4
- QIVPZSWBBHRNBA-JYJNAYRXSA-N Val-Pro-Phe Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O QIVPZSWBBHRNBA-JYJNAYRXSA-N 0.000 description 4
- QZKVWWIUSQGWMY-IHRRRGAJSA-N Val-Ser-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QZKVWWIUSQGWMY-IHRRRGAJSA-N 0.000 description 4
- HWNYVQMOLCYHEA-IHRRRGAJSA-N Val-Ser-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N HWNYVQMOLCYHEA-IHRRRGAJSA-N 0.000 description 4
- 108010047495 alanylglycine Proteins 0.000 description 4
- 108010087924 alanylproline Proteins 0.000 description 4
- 108010047857 aspartylglycine Proteins 0.000 description 4
- 238000005859 coupling reaction Methods 0.000 description 4
- 238000012217 deletion Methods 0.000 description 4
- 230000037430 deletion Effects 0.000 description 4
- ONVABDHFQKWOSV-HPUSYDDDSA-N ent-kaur-16-ene Chemical compound C1C[C@H](C2)C(=C)C[C@@]32CC[C@@H]2C(C)(C)CCC[C@@]2(C)[C@@H]31 ONVABDHFQKWOSV-HPUSYDDDSA-N 0.000 description 4
- 239000000796 flavoring agent Substances 0.000 description 4
- 235000013305 food Nutrition 0.000 description 4
- 235000013355 food flavoring agent Nutrition 0.000 description 4
- 108010078144 glutaminyl-glycine Proteins 0.000 description 4
- 108700014210 glycosyltransferase activity proteins Proteins 0.000 description 4
- 229910052739 hydrogen Inorganic materials 0.000 description 4
- 108010091871 leucylmethionine Proteins 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 108020004999 messenger RNA Proteins 0.000 description 4
- 239000008057 potassium phosphate buffer Substances 0.000 description 4
- 108010053725 prolylvaline Proteins 0.000 description 4
- 108091008146 restriction endonucleases Proteins 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 238000001551 total correlation spectroscopy Methods 0.000 description 4
- 108010020532 tyrosyl-proline Proteins 0.000 description 4
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 3
- BTYTYHBSJKQBQA-GCJQMDKQSA-N Ala-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N)O BTYTYHBSJKQBQA-GCJQMDKQSA-N 0.000 description 3
- DHBKYZYFEXXUAK-ONGXEEELSA-N Ala-Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 DHBKYZYFEXXUAK-ONGXEEELSA-N 0.000 description 3
- IYKVSFNGSWTTNZ-GUBZILKMSA-N Ala-Val-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IYKVSFNGSWTTNZ-GUBZILKMSA-N 0.000 description 3
- NLYYHIKRBRMAJV-AEJSXWLSSA-N Ala-Val-Pro Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N NLYYHIKRBRMAJV-AEJSXWLSSA-N 0.000 description 3
- UXJCMQFPDWCHKX-DCAQKATOSA-N Arg-Arg-Glu Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UXJCMQFPDWCHKX-DCAQKATOSA-N 0.000 description 3
- HJVGMOYJDDXLMI-AVGNSLFASA-N Arg-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCCNC(N)=N HJVGMOYJDDXLMI-AVGNSLFASA-N 0.000 description 3
- NKBQZKVMKJJDLX-SRVKXCTJSA-N Arg-Glu-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NKBQZKVMKJJDLX-SRVKXCTJSA-N 0.000 description 3
- UHFUZWSZQKMDSX-DCAQKATOSA-N Arg-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UHFUZWSZQKMDSX-DCAQKATOSA-N 0.000 description 3
- WMEVEPXNCMKNGH-IHRRRGAJSA-N Arg-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N WMEVEPXNCMKNGH-IHRRRGAJSA-N 0.000 description 3
- JEOCWTUOMKEEMF-RHYQMDGZSA-N Arg-Leu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JEOCWTUOMKEEMF-RHYQMDGZSA-N 0.000 description 3
- DPLFNLDACGGBAK-KKUMJFAQSA-N Arg-Phe-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N DPLFNLDACGGBAK-KKUMJFAQSA-N 0.000 description 3
- UVTGNSWSRSCPLP-UHFFFAOYSA-N Arg-Tyr Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O UVTGNSWSRSCPLP-UHFFFAOYSA-N 0.000 description 3
- PSUXEQYPYZLNER-QXEWZRGKSA-N Arg-Val-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O PSUXEQYPYZLNER-QXEWZRGKSA-N 0.000 description 3
- SUMJNGAMIQSNGX-TUAOUCFPSA-N Arg-Val-Pro Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N1CCC[C@@H]1C(O)=O SUMJNGAMIQSNGX-TUAOUCFPSA-N 0.000 description 3
- OLVIPTLKNSAYRJ-YUMQZZPRSA-N Asn-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N OLVIPTLKNSAYRJ-YUMQZZPRSA-N 0.000 description 3
- DPWDPEVGACCWTC-SRVKXCTJSA-N Asn-Tyr-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O DPWDPEVGACCWTC-SRVKXCTJSA-N 0.000 description 3
- ZELQAFZSJOBEQS-ACZMJKKPSA-N Asp-Asn-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZELQAFZSJOBEQS-ACZMJKKPSA-N 0.000 description 3
- JUWZKMBALYLZCK-WHFBIAKZSA-N Asp-Gly-Asn Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O JUWZKMBALYLZCK-WHFBIAKZSA-N 0.000 description 3
- RTXQQDVBACBSCW-CFMVVWHZSA-N Asp-Ile-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RTXQQDVBACBSCW-CFMVVWHZSA-N 0.000 description 3
- IOXWDLNHXZOXQP-FXQIFTODSA-N Asp-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N IOXWDLNHXZOXQP-FXQIFTODSA-N 0.000 description 3
- NAAAPCLFJPURAM-HJGDQZAQSA-N Asp-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O NAAAPCLFJPURAM-HJGDQZAQSA-N 0.000 description 3
- KJTLQQUUPVSXIM-UHFFFAOYSA-N DL-mevalonic acid Natural products OCCC(O)(C)CC(O)=O KJTLQQUUPVSXIM-UHFFFAOYSA-N 0.000 description 3
- MWLYSLMKFXWZPW-ZPFDUUQYSA-N Gln-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CCC(N)=O MWLYSLMKFXWZPW-ZPFDUUQYSA-N 0.000 description 3
- JKGHMESJHRTHIC-SIUGBPQLSA-N Gln-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N JKGHMESJHRTHIC-SIUGBPQLSA-N 0.000 description 3
- LGYZYFFDELZWRS-DCAQKATOSA-N Glu-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O LGYZYFFDELZWRS-DCAQKATOSA-N 0.000 description 3
- OAGVHWYIBZMWLA-YFKPBYRVSA-N Glu-Gly-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)NCC(O)=O OAGVHWYIBZMWLA-YFKPBYRVSA-N 0.000 description 3
- VSRCAOIHMGCIJK-SRVKXCTJSA-N Glu-Leu-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VSRCAOIHMGCIJK-SRVKXCTJSA-N 0.000 description 3
- ZAPFAWQHBOHWLL-GUBZILKMSA-N Glu-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N ZAPFAWQHBOHWLL-GUBZILKMSA-N 0.000 description 3
- QOXDAWODGSIDDI-GUBZILKMSA-N Glu-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N QOXDAWODGSIDDI-GUBZILKMSA-N 0.000 description 3
- UUTGYDAKPISJAO-JYJNAYRXSA-N Glu-Tyr-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 UUTGYDAKPISJAO-JYJNAYRXSA-N 0.000 description 3
- WKJKBELXHCTHIJ-WPRPVWTQSA-N Gly-Arg-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N WKJKBELXHCTHIJ-WPRPVWTQSA-N 0.000 description 3
- XEJTYSCIXKYSHR-WDSKDSINSA-N Gly-Asp-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN XEJTYSCIXKYSHR-WDSKDSINSA-N 0.000 description 3
- UTYGDAHJBBDPBA-BYULHYEWSA-N Gly-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)CN UTYGDAHJBBDPBA-BYULHYEWSA-N 0.000 description 3
- PYFIQROSWQERAS-LBPRGKRZSA-N Gly-Trp-Gly Chemical compound C1=CC=C2C(C[C@H](NC(=O)CN)C(=O)NCC(O)=O)=CNC2=C1 PYFIQROSWQERAS-LBPRGKRZSA-N 0.000 description 3
- 244000068988 Glycine max Species 0.000 description 3
- NQKRILCJYCASDV-QWRGUYRKSA-N His-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CN=CN1 NQKRILCJYCASDV-QWRGUYRKSA-N 0.000 description 3
- VTZYMXGGXOFBMX-DJFWLOJKSA-N His-Ile-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O VTZYMXGGXOFBMX-DJFWLOJKSA-N 0.000 description 3
- PHIXPNQDGGILMP-YVNDNENWSA-N Ile-Glu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N PHIXPNQDGGILMP-YVNDNENWSA-N 0.000 description 3
- TVSPLSZTKTUYLV-ZPFDUUQYSA-N Ile-Glu-Met Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCSC)C(=O)O TVSPLSZTKTUYLV-ZPFDUUQYSA-N 0.000 description 3
- WIZPFZKOFZXDQG-HTFCKZLJSA-N Ile-Ile-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O WIZPFZKOFZXDQG-HTFCKZLJSA-N 0.000 description 3
- YNMQUIVKEFRCPH-QSFUFRPTSA-N Ile-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)O)N YNMQUIVKEFRCPH-QSFUFRPTSA-N 0.000 description 3
- GLYJPWIRLBAIJH-UHFFFAOYSA-N Ile-Lys-Pro Natural products CCC(C)C(N)C(=O)NC(CCCCN)C(=O)N1CCCC1C(O)=O GLYJPWIRLBAIJH-UHFFFAOYSA-N 0.000 description 3
- CZCSUZMIRKFFFA-CIUDSAMLSA-N Leu-Ala-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O CZCSUZMIRKFFFA-CIUDSAMLSA-N 0.000 description 3
- ZRLUISBDKUWAIZ-CIUDSAMLSA-N Leu-Ala-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O ZRLUISBDKUWAIZ-CIUDSAMLSA-N 0.000 description 3
- WCTCIIAGNMFYAO-DCAQKATOSA-N Leu-Cys-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O WCTCIIAGNMFYAO-DCAQKATOSA-N 0.000 description 3
- VPKIQULSKFVCSM-SRVKXCTJSA-N Leu-Gln-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VPKIQULSKFVCSM-SRVKXCTJSA-N 0.000 description 3
- KAFOIVJDVSZUMD-UHFFFAOYSA-N Leu-Gln-Gln Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)NC(CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-UHFFFAOYSA-N 0.000 description 3
- QVFGXCVIXXBFHO-AVGNSLFASA-N Leu-Glu-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O QVFGXCVIXXBFHO-AVGNSLFASA-N 0.000 description 3
- PBGDOSARRIJMEV-DLOVCJGASA-N Leu-His-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O PBGDOSARRIJMEV-DLOVCJGASA-N 0.000 description 3
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 3
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 3
- QNTJIDXQHWUBKC-BZSNNMDCSA-N Leu-Lys-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QNTJIDXQHWUBKC-BZSNNMDCSA-N 0.000 description 3
- RGUXWMDNCPMQFB-YUMQZZPRSA-N Leu-Ser-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RGUXWMDNCPMQFB-YUMQZZPRSA-N 0.000 description 3
- ZDJQVSIPFLMNOX-RHYQMDGZSA-N Leu-Thr-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZDJQVSIPFLMNOX-RHYQMDGZSA-N 0.000 description 3
- VDIARPPNADFEAV-WEDXCCLWSA-N Leu-Thr-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O VDIARPPNADFEAV-WEDXCCLWSA-N 0.000 description 3
- AIQWYVFNBNNOLU-RHYQMDGZSA-N Leu-Thr-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O AIQWYVFNBNNOLU-RHYQMDGZSA-N 0.000 description 3
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 3
- HQVDJTYKCMIWJP-YUMQZZPRSA-N Lys-Asn-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HQVDJTYKCMIWJP-YUMQZZPRSA-N 0.000 description 3
- KZOHPCYVORJBLG-AVGNSLFASA-N Lys-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCCN)N KZOHPCYVORJBLG-AVGNSLFASA-N 0.000 description 3
- ISHNZELVUVPCHY-ZETCQYMHSA-N Lys-Gly-Gly Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O ISHNZELVUVPCHY-ZETCQYMHSA-N 0.000 description 3
- VMTYLUGCXIEDMV-QWRGUYRKSA-N Lys-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCCCN VMTYLUGCXIEDMV-QWRGUYRKSA-N 0.000 description 3
- WBSCNDJQPKSPII-KKUMJFAQSA-N Lys-Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O WBSCNDJQPKSPII-KKUMJFAQSA-N 0.000 description 3
- BPDXWKVZNCKUGG-BZSNNMDCSA-N Lys-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCCCN)N BPDXWKVZNCKUGG-BZSNNMDCSA-N 0.000 description 3
- 240000007594 Oryza sativa Species 0.000 description 3
- 235000007164 Oryza sativa Nutrition 0.000 description 3
- ZWJKVFAYPLPCQB-UNQGMJICSA-N Phe-Arg-Thr Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)Cc1ccccc1)C(O)=O ZWJKVFAYPLPCQB-UNQGMJICSA-N 0.000 description 3
- KBVJZCVLQWCJQN-KKUMJFAQSA-N Phe-Leu-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O KBVJZCVLQWCJQN-KKUMJFAQSA-N 0.000 description 3
- GMWNQSGWWGKTSF-LFSVMHDDSA-N Phe-Thr-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O GMWNQSGWWGKTSF-LFSVMHDDSA-N 0.000 description 3
- ICTZKEXYDDZZFP-SRVKXCTJSA-N Pro-Arg-Pro Chemical compound N([C@@H](CCCN=C(N)N)C(=O)N1[C@@H](CCC1)C(O)=O)C(=O)[C@@H]1CCCN1 ICTZKEXYDDZZFP-SRVKXCTJSA-N 0.000 description 3
- KPDRZQUWJKTMBP-DCAQKATOSA-N Pro-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 KPDRZQUWJKTMBP-DCAQKATOSA-N 0.000 description 3
- SHTKRJHDMNSKRM-ULQDDVLXSA-N Pro-Tyr-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O SHTKRJHDMNSKRM-ULQDDVLXSA-N 0.000 description 3
- RLLCWNUIHGPAJY-RYBZXKSASA-N Rebaudioside E Natural products O=C(O[C@H]1[C@H](O[C@H]2[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O2)[C@@H](O)[C@@H](O)[C@H](CO)O1)[C@]1(C)[C@@H]2[C@@](C)([C@@H]3[C@@]4(CC(=C)[C@@](O[C@@H]5[C@@H](O[C@@H]6[C@@H](O)[C@H](O)[C@@H](O)[C@H](CO)O6)[C@H](O)[C@@H](O)[C@H](CO)O5)(C4)CC3)CC2)CCC1 RLLCWNUIHGPAJY-RYBZXKSASA-N 0.000 description 3
- 108020004511 Recombinant DNA Proteins 0.000 description 3
- 241000235070 Saccharomyces Species 0.000 description 3
- ZFVFHHZBCVNLGD-GUBZILKMSA-N Ser-His-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZFVFHHZBCVNLGD-GUBZILKMSA-N 0.000 description 3
- MOINZPRHJGTCHZ-MMWGEVLESA-N Ser-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N MOINZPRHJGTCHZ-MMWGEVLESA-N 0.000 description 3
- ZIFYDQAFEMIZII-GUBZILKMSA-N Ser-Leu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZIFYDQAFEMIZII-GUBZILKMSA-N 0.000 description 3
- GVMUJUPXFQFBBZ-GUBZILKMSA-N Ser-Lys-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GVMUJUPXFQFBBZ-GUBZILKMSA-N 0.000 description 3
- DYEGLQRVMBWQLD-IXOXFDKPSA-N Ser-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CO)N)O DYEGLQRVMBWQLD-IXOXFDKPSA-N 0.000 description 3
- AMXMBCAXAZUCFA-RHYQMDGZSA-N Thr-Leu-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AMXMBCAXAZUCFA-RHYQMDGZSA-N 0.000 description 3
- JJNXZIPLIXIGBX-HJPIBITLSA-N Tyr-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N JJNXZIPLIXIGBX-HJPIBITLSA-N 0.000 description 3
- AKKYBQGHUAWPJR-MNSWYVGCSA-N Tyr-Thr-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N)O AKKYBQGHUAWPJR-MNSWYVGCSA-N 0.000 description 3
- AZSHAZJLOZQYAY-FXQIFTODSA-N Val-Ala-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O AZSHAZJLOZQYAY-FXQIFTODSA-N 0.000 description 3
- PAPWZOJOLKZEFR-AVGNSLFASA-N Val-Arg-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N PAPWZOJOLKZEFR-AVGNSLFASA-N 0.000 description 3
- AGKDVLSDNSTLFA-UMNHJUIQSA-N Val-Gln-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N AGKDVLSDNSTLFA-UMNHJUIQSA-N 0.000 description 3
- PIFJAFRUVWZRKR-QMMMGPOBSA-N Val-Gly-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O PIFJAFRUVWZRKR-QMMMGPOBSA-N 0.000 description 3
- ZHQWPWQNVRCXAX-XQQFMLRXSA-N Val-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZHQWPWQNVRCXAX-XQQFMLRXSA-N 0.000 description 3
- XXWBHOWRARMUOC-NHCYSSNCSA-N Val-Lys-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)N)C(=O)O)N XXWBHOWRARMUOC-NHCYSSNCSA-N 0.000 description 3
- GBIUHAYJGWVNLN-UHFFFAOYSA-N Val-Ser-Pro Natural products CC(C)C(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O GBIUHAYJGWVNLN-UHFFFAOYSA-N 0.000 description 3
- AYHNXCJKBLYVOA-KSZLIROESA-N Val-Trp-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N3CCC[C@@H]3C(=O)O)N AYHNXCJKBLYVOA-KSZLIROESA-N 0.000 description 3
- NLNCNKIVJPEFBC-DLOVCJGASA-N Val-Val-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O NLNCNKIVJPEFBC-DLOVCJGASA-N 0.000 description 3
- SSKKGOWRPNIVDW-AVGNSLFASA-N Val-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N SSKKGOWRPNIVDW-AVGNSLFASA-N 0.000 description 3
- YKZVPMUGEJXEOR-JYJNAYRXSA-N Val-Val-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N YKZVPMUGEJXEOR-JYJNAYRXSA-N 0.000 description 3
- 238000005903 acid hydrolysis reaction Methods 0.000 description 3
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 3
- 210000004102 animal cell Anatomy 0.000 description 3
- 108010013835 arginine glutamate Proteins 0.000 description 3
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 3
- 235000013361 beverage Nutrition 0.000 description 3
- 239000000872 buffer Substances 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 239000013078 crystal Substances 0.000 description 3
- 108010016616 cysteinylglycine Proteins 0.000 description 3
- 235000015872 dietary supplement Nutrition 0.000 description 3
- 150000004141 diterpene derivatives Chemical class 0.000 description 3
- 238000006047 enzymatic hydrolysis reaction Methods 0.000 description 3
- 235000019439 ethyl acetate Nutrition 0.000 description 3
- 210000003527 eukaryotic cell Anatomy 0.000 description 3
- 108010006664 gamma-glutamyl-glycyl-glycine Proteins 0.000 description 3
- 108010080575 glutamyl-aspartyl-alanine Proteins 0.000 description 3
- 108010019832 glycyl-asparaginyl-glycine Proteins 0.000 description 3
- 108010050475 glycyl-leucyl-tyrosine Proteins 0.000 description 3
- 238000011065 in-situ storage Methods 0.000 description 3
- 238000003780 insertion Methods 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- 108010047926 leucyl-lysyl-tyrosine Proteins 0.000 description 3
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 3
- 108010044348 lysyl-glutamyl-aspartic acid Proteins 0.000 description 3
- 230000037361 pathway Effects 0.000 description 3
- 239000012071 phase Substances 0.000 description 3
- 108010073101 phenylalanylleucine Proteins 0.000 description 3
- 239000002243 precursor Substances 0.000 description 3
- 239000013615 primer Substances 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 108010004914 prolylarginine Proteins 0.000 description 3
- 238000000425 proton nuclear magnetic resonance spectrum Methods 0.000 description 3
- RLLCWNUIHGPAJY-SFUUMPFESA-N rebaudioside E Chemical compound O([C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1O[C@]12C(=C)C[C@@]3(C1)CC[C@@H]1[C@@](C)(CCC[C@]1([C@@H]3CC2)C)C(=O)O[C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O[C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O)[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O RLLCWNUIHGPAJY-SFUUMPFESA-N 0.000 description 3
- YWPVROCHNBYFTP-OSHKXICASA-N rubusoside Chemical compound O([C@]12C(=C)C[C@@]3(C1)CC[C@@H]1[C@@](C)(CCC[C@]1([C@@H]3CC2)C)C(=O)O[C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O)[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O YWPVROCHNBYFTP-OSHKXICASA-N 0.000 description 3
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 3
- 241000894007 species Species 0.000 description 3
- 108010005652 splenotritin Proteins 0.000 description 3
- 150000008163 sugars Chemical class 0.000 description 3
- 210000001519 tissue Anatomy 0.000 description 3
- 108010035534 tyrosyl-leucyl-alanine Proteins 0.000 description 3
- PIDRBUDUWHBYSR-UHFFFAOYSA-N 1-[2-[[2-[(2-amino-4-methylpentanoyl)amino]-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O PIDRBUDUWHBYSR-UHFFFAOYSA-N 0.000 description 2
- JYKYYPPZLPVIBY-UHFFFAOYSA-N 1-isothiocyanato-2-methylbenzene Chemical compound CC1=CC=CC=C1N=C=S JYKYYPPZLPVIBY-UHFFFAOYSA-N 0.000 description 2
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 2
- WBZFUFAFFUEMEI-UHFFFAOYSA-M Acesulfame k Chemical compound [K+].CC1=CC(=O)[N-]S(=O)(=O)O1 WBZFUFAFFUEMEI-UHFFFAOYSA-M 0.000 description 2
- 241000589291 Acinetobacter Species 0.000 description 2
- TWCMVXMQHSVIOJ-UHFFFAOYSA-N Aglycone of yadanzioside D Natural products COC(=O)C12OCC34C(CC5C(=CC(O)C(O)C5(C)C3C(O)C1O)C)OC(=O)C(OC(=O)C)C24 TWCMVXMQHSVIOJ-UHFFFAOYSA-N 0.000 description 2
- 108010040956 Ala-Asp-Glu-Leu Proteins 0.000 description 2
- BUDNAJYVCUHLSV-ZLUOBGJFSA-N Ala-Asp-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O BUDNAJYVCUHLSV-ZLUOBGJFSA-N 0.000 description 2
- WKOBSJOZRJJVRZ-FXQIFTODSA-N Ala-Glu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WKOBSJOZRJJVRZ-FXQIFTODSA-N 0.000 description 2
- UHMQKOBNPRAZGB-CIUDSAMLSA-N Ala-Glu-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCSC)C(=O)O)N UHMQKOBNPRAZGB-CIUDSAMLSA-N 0.000 description 2
- CWEAKSWWKHGTRJ-BQBZGAKWSA-N Ala-Gly-Met Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O CWEAKSWWKHGTRJ-BQBZGAKWSA-N 0.000 description 2
- JDIQCVUDDFENPU-ZKWXMUAHSA-N Ala-His-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CNC=N1 JDIQCVUDDFENPU-ZKWXMUAHSA-N 0.000 description 2
- ZKEHTYWGPMMGBC-XUXIUFHCSA-N Ala-Leu-Leu-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O ZKEHTYWGPMMGBC-XUXIUFHCSA-N 0.000 description 2
- AWZKCUCQJNTBAD-SRVKXCTJSA-N Ala-Leu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN AWZKCUCQJNTBAD-SRVKXCTJSA-N 0.000 description 2
- PMQXMXAASGFUDX-SRVKXCTJSA-N Ala-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CCCCN PMQXMXAASGFUDX-SRVKXCTJSA-N 0.000 description 2
- GFEDXKNBZMPEDM-KZVJFYERSA-N Ala-Met-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GFEDXKNBZMPEDM-KZVJFYERSA-N 0.000 description 2
- CYBJZLQSUJEMAS-LFSVMHDDSA-N Ala-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](C)N)O CYBJZLQSUJEMAS-LFSVMHDDSA-N 0.000 description 2
- XWFWAXPOLRTDFZ-FXQIFTODSA-N Ala-Pro-Ser Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O XWFWAXPOLRTDFZ-FXQIFTODSA-N 0.000 description 2
- NCQMBSJGJMYKCK-ZLUOBGJFSA-N Ala-Ser-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O NCQMBSJGJMYKCK-ZLUOBGJFSA-N 0.000 description 2
- QKHWNPQNOHEFST-VZFHVOOUSA-N Ala-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C)N)O QKHWNPQNOHEFST-VZFHVOOUSA-N 0.000 description 2
- VHAQSYHSDKERBS-XPUUQOCRSA-N Ala-Val-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O VHAQSYHSDKERBS-XPUUQOCRSA-N 0.000 description 2
- 244000105624 Arachis hypogaea Species 0.000 description 2
- YUIGJDNAGKJLDO-JYJNAYRXSA-N Arg-Arg-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YUIGJDNAGKJLDO-JYJNAYRXSA-N 0.000 description 2
- WOPFJPHVBWKZJH-SRVKXCTJSA-N Arg-Arg-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O WOPFJPHVBWKZJH-SRVKXCTJSA-N 0.000 description 2
- HQIZDMIGUJOSNI-IUCAKERBSA-N Arg-Gly-Arg Chemical compound N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O HQIZDMIGUJOSNI-IUCAKERBSA-N 0.000 description 2
- OQCWXQJLCDPRHV-UWVGGRQHSA-N Arg-Gly-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O OQCWXQJLCDPRHV-UWVGGRQHSA-N 0.000 description 2
- OTZMRMHZCMZOJZ-SRVKXCTJSA-N Arg-Leu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OTZMRMHZCMZOJZ-SRVKXCTJSA-N 0.000 description 2
- XRNXPIGJPQHCPC-RCWTZXSCSA-N Arg-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCNC(N)=N)[C@@H](C)O)C(O)=O XRNXPIGJPQHCPC-RCWTZXSCSA-N 0.000 description 2
- ISVACHFCVRKIDG-SRVKXCTJSA-N Arg-Val-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O ISVACHFCVRKIDG-SRVKXCTJSA-N 0.000 description 2
- JWCCFNZJIRZUCL-AVGNSLFASA-N Arg-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N JWCCFNZJIRZUCL-AVGNSLFASA-N 0.000 description 2
- 239000004475 Arginine Substances 0.000 description 2
- LEFKSBYHUGUWLP-ACZMJKKPSA-N Asn-Ala-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LEFKSBYHUGUWLP-ACZMJKKPSA-N 0.000 description 2
- CMLGVVWQQHUXOZ-GHCJXIJMSA-N Asn-Ala-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CMLGVVWQQHUXOZ-GHCJXIJMSA-N 0.000 description 2
- DMLSCRJBWUEALP-LAEOZQHASA-N Asn-Glu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O DMLSCRJBWUEALP-LAEOZQHASA-N 0.000 description 2
- WONGRTVAMHFGBE-WDSKDSINSA-N Asn-Gly-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N WONGRTVAMHFGBE-WDSKDSINSA-N 0.000 description 2
- OPEPUCYIGFEGSW-WDSKDSINSA-N Asn-Gly-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OPEPUCYIGFEGSW-WDSKDSINSA-N 0.000 description 2
- BXUHCIXDSWRSBS-CIUDSAMLSA-N Asn-Leu-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BXUHCIXDSWRSBS-CIUDSAMLSA-N 0.000 description 2
- VLDRQOHCMKCXLY-SRVKXCTJSA-N Asn-Ser-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VLDRQOHCMKCXLY-SRVKXCTJSA-N 0.000 description 2
- JXMREEPBRANWBY-VEVYYDQMSA-N Asn-Thr-Arg Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JXMREEPBRANWBY-VEVYYDQMSA-N 0.000 description 2
- WQAOZCVOOYUWKG-LSJOCFKGSA-N Asn-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CC(=O)N)N WQAOZCVOOYUWKG-LSJOCFKGSA-N 0.000 description 2
- KRXIWXCXOARFNT-ZLUOBGJFSA-N Asp-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O KRXIWXCXOARFNT-ZLUOBGJFSA-N 0.000 description 2
- RDRMWJBLOSRRAW-BYULHYEWSA-N Asp-Asn-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O RDRMWJBLOSRRAW-BYULHYEWSA-N 0.000 description 2
- CSEJMKNZDCJYGJ-XHNCKOQMSA-N Asp-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N)C(=O)O CSEJMKNZDCJYGJ-XHNCKOQMSA-N 0.000 description 2
- KHGPWGKPYHPOIK-QWRGUYRKSA-N Asp-Gly-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KHGPWGKPYHPOIK-QWRGUYRKSA-N 0.000 description 2
- WSGVTKZFVJSJOG-RCOVLWMOSA-N Asp-Gly-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O WSGVTKZFVJSJOG-RCOVLWMOSA-N 0.000 description 2
- OGTCOKZFOJIZFG-CIUDSAMLSA-N Asp-His-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O OGTCOKZFOJIZFG-CIUDSAMLSA-N 0.000 description 2
- HOBNTSHITVVNBN-ZPFDUUQYSA-N Asp-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N HOBNTSHITVVNBN-ZPFDUUQYSA-N 0.000 description 2
- VWWAFGHMPWBKEP-GMOBBJLQSA-N Asp-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC(=O)O)N VWWAFGHMPWBKEP-GMOBBJLQSA-N 0.000 description 2
- LTCKTLYKRMCFOC-KKUMJFAQSA-N Asp-Phe-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LTCKTLYKRMCFOC-KKUMJFAQSA-N 0.000 description 2
- DWOSGXZMLQNDBN-FXQIFTODSA-N Asp-Pro-Cys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)O)N)C(=O)N[C@@H](CS)C(=O)O DWOSGXZMLQNDBN-FXQIFTODSA-N 0.000 description 2
- GIKOVDMXBAFXDF-NHCYSSNCSA-N Asp-Val-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GIKOVDMXBAFXDF-NHCYSSNCSA-N 0.000 description 2
- QOJJMJKTMKNFEF-ZKWXMUAHSA-N Asp-Val-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O QOJJMJKTMKNFEF-ZKWXMUAHSA-N 0.000 description 2
- 108010011485 Aspartame Proteins 0.000 description 2
- 241000228212 Aspergillus Species 0.000 description 2
- 241000208838 Asteraceae Species 0.000 description 2
- PLMKQQMDOMTZGG-UHFFFAOYSA-N Astrantiagenin E-methylester Natural products CC12CCC(O)C(C)(CO)C1CCC1(C)C2CC=C2C3CC(C)(C)CCC3(C(=O)OC)CCC21C PLMKQQMDOMTZGG-UHFFFAOYSA-N 0.000 description 2
- 241000193830 Bacillus <bacterium> Species 0.000 description 2
- 240000002791 Brassica napus Species 0.000 description 2
- 235000011299 Brassica oleracea var botrytis Nutrition 0.000 description 2
- 240000003259 Brassica oleracea var. botrytis Species 0.000 description 2
- 244000025254 Cannabis sativa Species 0.000 description 2
- 241000701489 Cauliflower mosaic virus Species 0.000 description 2
- 241000186216 Corynebacterium Species 0.000 description 2
- UXUSHQYYQCZWET-WDSKDSINSA-N Cys-Glu-Gly Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O UXUSHQYYQCZWET-WDSKDSINSA-N 0.000 description 2
- LBOLGUYQEPZSKM-YUMQZZPRSA-N Cys-Gly-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CS)N LBOLGUYQEPZSKM-YUMQZZPRSA-N 0.000 description 2
- JAHCWGSVNZXHRR-SVSWQMSJSA-N Cys-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CS)N JAHCWGSVNZXHRR-SVSWQMSJSA-N 0.000 description 2
- 241000235035 Debaryomyces Species 0.000 description 2
- 241000701533 Escherichia virus T4 Species 0.000 description 2
- 108010007508 Farnesyltranstransferase Proteins 0.000 description 2
- 102000007317 Farnesyltranstransferase Human genes 0.000 description 2
- LZRMPXRYLLTAJX-GUBZILKMSA-N Gln-Arg-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O LZRMPXRYLLTAJX-GUBZILKMSA-N 0.000 description 2
- INFBPLSHYFALDE-ACZMJKKPSA-N Gln-Asn-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O INFBPLSHYFALDE-ACZMJKKPSA-N 0.000 description 2
- TWHDOEYLXXQYOZ-FXQIFTODSA-N Gln-Asn-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N TWHDOEYLXXQYOZ-FXQIFTODSA-N 0.000 description 2
- NVEASDQHBRZPSU-BQBZGAKWSA-N Gln-Gln-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O NVEASDQHBRZPSU-BQBZGAKWSA-N 0.000 description 2
- XJKAKYXMFHUIHT-AUTRQRHGSA-N Gln-Glu-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N XJKAKYXMFHUIHT-AUTRQRHGSA-N 0.000 description 2
- FTIJVMLAGRAYMJ-MNXVOIDGSA-N Gln-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(N)=O FTIJVMLAGRAYMJ-MNXVOIDGSA-N 0.000 description 2
- IHSGESFHTMFHRB-GUBZILKMSA-N Gln-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(N)=O IHSGESFHTMFHRB-GUBZILKMSA-N 0.000 description 2
- XBWGJWXGUNSZAT-CIUDSAMLSA-N Gln-Met-Asp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N XBWGJWXGUNSZAT-CIUDSAMLSA-N 0.000 description 2
- VNTGPISAOMAXRK-CIUDSAMLSA-N Gln-Pro-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O VNTGPISAOMAXRK-CIUDSAMLSA-N 0.000 description 2
- DYVMTEWCGAVKSE-HJGDQZAQSA-N Gln-Thr-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O DYVMTEWCGAVKSE-HJGDQZAQSA-N 0.000 description 2
- RLZBLVSJDFHDBL-KBIXCLLPSA-N Glu-Ala-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RLZBLVSJDFHDBL-KBIXCLLPSA-N 0.000 description 2
- JJKKWYQVHRUSDG-GUBZILKMSA-N Glu-Ala-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O JJKKWYQVHRUSDG-GUBZILKMSA-N 0.000 description 2
- IRDASPPCLZIERZ-XHNCKOQMSA-N Glu-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N IRDASPPCLZIERZ-XHNCKOQMSA-N 0.000 description 2
- KEBACWCLVOXFNC-DCAQKATOSA-N Glu-Arg-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O KEBACWCLVOXFNC-DCAQKATOSA-N 0.000 description 2
- CKRUHITYRFNUKW-WDSKDSINSA-N Glu-Asn-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CKRUHITYRFNUKW-WDSKDSINSA-N 0.000 description 2
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 2
- OGNJZUXUTPQVBR-BQBZGAKWSA-N Glu-Gly-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OGNJZUXUTPQVBR-BQBZGAKWSA-N 0.000 description 2
- VGUYMZGLJUJRBV-YVNDNENWSA-N Glu-Ile-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O VGUYMZGLJUJRBV-YVNDNENWSA-N 0.000 description 2
- ITBHUUMCJJQUSC-LAEOZQHASA-N Glu-Ile-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O ITBHUUMCJJQUSC-LAEOZQHASA-N 0.000 description 2
- GXMXPCXXKVWOSM-KQXIARHKSA-N Glu-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N GXMXPCXXKVWOSM-KQXIARHKSA-N 0.000 description 2
- PJBVXVBTTFZPHJ-GUBZILKMSA-N Glu-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N PJBVXVBTTFZPHJ-GUBZILKMSA-N 0.000 description 2
- DNPCBMNFQVTHMA-DCAQKATOSA-N Glu-Leu-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DNPCBMNFQVTHMA-DCAQKATOSA-N 0.000 description 2
- IVGJYOOGJLFKQE-AVGNSLFASA-N Glu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N IVGJYOOGJLFKQE-AVGNSLFASA-N 0.000 description 2
- GJBUAAAIZSRCDC-GVXVVHGQSA-N Glu-Leu-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O GJBUAAAIZSRCDC-GVXVVHGQSA-N 0.000 description 2
- SJJHXJDSNQJMMW-SRVKXCTJSA-N Glu-Lys-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O SJJHXJDSNQJMMW-SRVKXCTJSA-N 0.000 description 2
- JDUKCSSHWNIQQZ-IHRRRGAJSA-N Glu-Phe-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JDUKCSSHWNIQQZ-IHRRRGAJSA-N 0.000 description 2
- GMVCSRBOSIUTFC-FXQIFTODSA-N Glu-Ser-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O GMVCSRBOSIUTFC-FXQIFTODSA-N 0.000 description 2
- DMYACXMQUABZIQ-NRPADANISA-N Glu-Ser-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O DMYACXMQUABZIQ-NRPADANISA-N 0.000 description 2
- QOOFKCCZZWTCEP-AVGNSLFASA-N Glu-Tyr-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O QOOFKCCZZWTCEP-AVGNSLFASA-N 0.000 description 2
- BRFJMRSRMOMIMU-WHFBIAKZSA-N Gly-Ala-Asn Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O BRFJMRSRMOMIMU-WHFBIAKZSA-N 0.000 description 2
- YMUFWNJHVPQNQD-ZKWXMUAHSA-N Gly-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN YMUFWNJHVPQNQD-ZKWXMUAHSA-N 0.000 description 2
- JLJLBWDKDRYOPA-RYUDHWBXSA-N Gly-Gln-Tyr Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 JLJLBWDKDRYOPA-RYUDHWBXSA-N 0.000 description 2
- DHDOADIPGZTAHT-YUMQZZPRSA-N Gly-Glu-Arg Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DHDOADIPGZTAHT-YUMQZZPRSA-N 0.000 description 2
- QPTNELDXWKRIFX-YFKPBYRVSA-N Gly-Gly-Gln Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O QPTNELDXWKRIFX-YFKPBYRVSA-N 0.000 description 2
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 2
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 2
- AFWYPMDMDYCKMD-KBPBESRZSA-N Gly-Leu-Tyr Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AFWYPMDMDYCKMD-KBPBESRZSA-N 0.000 description 2
- BXICSAQLIHFDDL-YUMQZZPRSA-N Gly-Lys-Asn Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O BXICSAQLIHFDDL-YUMQZZPRSA-N 0.000 description 2
- PDUHNKAFQXQNLH-ZETCQYMHSA-N Gly-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)NCC(O)=O PDUHNKAFQXQNLH-ZETCQYMHSA-N 0.000 description 2
- VDCRBJACQKOSMS-JSGCOSHPSA-N Gly-Phe-Val Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O VDCRBJACQKOSMS-JSGCOSHPSA-N 0.000 description 2
- POJJAZJHBGXEGM-YUMQZZPRSA-N Gly-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)CN POJJAZJHBGXEGM-YUMQZZPRSA-N 0.000 description 2
- JKSMZVCGQWVTBW-STQMWFEESA-N Gly-Trp-Asn Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(O)=O JKSMZVCGQWVTBW-STQMWFEESA-N 0.000 description 2
- DNVDEMWIYLVIQU-RCOVLWMOSA-N Gly-Val-Asp Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O DNVDEMWIYLVIQU-RCOVLWMOSA-N 0.000 description 2
- COZMNNJEGNPDED-HOCLYGCPSA-N Gly-Val-Trp Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O COZMNNJEGNPDED-HOCLYGCPSA-N 0.000 description 2
- 235000010469 Glycine max Nutrition 0.000 description 2
- 244000020551 Helianthus annuus Species 0.000 description 2
- LVXFNTIIGOQBMD-SRVKXCTJSA-N His-Leu-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O LVXFNTIIGOQBMD-SRVKXCTJSA-N 0.000 description 2
- LVWIJITYHRZHBO-IXOXFDKPSA-N His-Leu-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LVWIJITYHRZHBO-IXOXFDKPSA-N 0.000 description 2
- BCZFOHDMCDXPDA-BZSNNMDCSA-N His-Lys-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC2=CN=CN2)N)O BCZFOHDMCDXPDA-BZSNNMDCSA-N 0.000 description 2
- XGBVLRJLHUVCNK-DCAQKATOSA-N His-Val-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O XGBVLRJLHUVCNK-DCAQKATOSA-N 0.000 description 2
- RWIKBYVJQAJYDP-BJDJZHNGSA-N Ile-Ala-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RWIKBYVJQAJYDP-BJDJZHNGSA-N 0.000 description 2
- KMBPQYKVZBMRMH-PEFMBERDSA-N Ile-Gln-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O KMBPQYKVZBMRMH-PEFMBERDSA-N 0.000 description 2
- SLQVFYWBGNNOTK-BYULHYEWSA-N Ile-Gly-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N SLQVFYWBGNNOTK-BYULHYEWSA-N 0.000 description 2
- AXNGDPAKKCEKGY-QPHKQPEJSA-N Ile-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N AXNGDPAKKCEKGY-QPHKQPEJSA-N 0.000 description 2
- QZZIBQZLWBOOJH-PEDHHIEDSA-N Ile-Ile-Val Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(=O)O QZZIBQZLWBOOJH-PEDHHIEDSA-N 0.000 description 2
- OUUCIIJSBIBCHB-ZPFDUUQYSA-N Ile-Leu-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O OUUCIIJSBIBCHB-ZPFDUUQYSA-N 0.000 description 2
- GAZGFPOZOLEYAJ-YTFOTSKYSA-N Ile-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N GAZGFPOZOLEYAJ-YTFOTSKYSA-N 0.000 description 2
- TVYWVSJGSHQWMT-AJNGGQMLSA-N Ile-Leu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N TVYWVSJGSHQWMT-AJNGGQMLSA-N 0.000 description 2
- IOVUXUSIGXCREV-DKIMLUQUSA-N Ile-Leu-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IOVUXUSIGXCREV-DKIMLUQUSA-N 0.000 description 2
- GVKKVHNRTUFCCE-BJDJZHNGSA-N Ile-Leu-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)O)N GVKKVHNRTUFCCE-BJDJZHNGSA-N 0.000 description 2
- HQEPKOFULQTSFV-JURCDPSOSA-N Ile-Phe-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)O)N HQEPKOFULQTSFV-JURCDPSOSA-N 0.000 description 2
- VGSPNSSCMOHRRR-BJDJZHNGSA-N Ile-Ser-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N VGSPNSSCMOHRRR-BJDJZHNGSA-N 0.000 description 2
- PZWBBXHHUSIGKH-OSUNSFLBSA-N Ile-Thr-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PZWBBXHHUSIGKH-OSUNSFLBSA-N 0.000 description 2
- NJGXXYLPDMMFJB-XUXIUFHCSA-N Ile-Val-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N NJGXXYLPDMMFJB-XUXIUFHCSA-N 0.000 description 2
- JZBVBOKASHNXAD-NAKRPEOUSA-N Ile-Val-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N JZBVBOKASHNXAD-NAKRPEOUSA-N 0.000 description 2
- 108091092195 Intron Proteins 0.000 description 2
- 241000235649 Kluyveromyces Species 0.000 description 2
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 2
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 2
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 2
- HASRFYOMVPJRPU-SRVKXCTJSA-N Leu-Arg-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HASRFYOMVPJRPU-SRVKXCTJSA-N 0.000 description 2
- WUFYAPWIHCUMLL-CIUDSAMLSA-N Leu-Asn-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O WUFYAPWIHCUMLL-CIUDSAMLSA-N 0.000 description 2
- OXKYZSRZKBTVEY-ZPFDUUQYSA-N Leu-Asn-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OXKYZSRZKBTVEY-ZPFDUUQYSA-N 0.000 description 2
- FIJMQLGQLBLBOL-HJGDQZAQSA-N Leu-Asn-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FIJMQLGQLBLBOL-HJGDQZAQSA-N 0.000 description 2
- BOFAFKVZQUMTID-AVGNSLFASA-N Leu-Gln-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N BOFAFKVZQUMTID-AVGNSLFASA-N 0.000 description 2
- CQGSYZCULZMEDE-UHFFFAOYSA-N Leu-Gln-Pro Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)N1CCCC1C(O)=O CQGSYZCULZMEDE-UHFFFAOYSA-N 0.000 description 2
- DZQMXBALGUHGJT-GUBZILKMSA-N Leu-Glu-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O DZQMXBALGUHGJT-GUBZILKMSA-N 0.000 description 2
- HQUXQAMSWFIRET-AVGNSLFASA-N Leu-Glu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HQUXQAMSWFIRET-AVGNSLFASA-N 0.000 description 2
- KGCLIYGPQXUNLO-IUCAKERBSA-N Leu-Gly-Glu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O KGCLIYGPQXUNLO-IUCAKERBSA-N 0.000 description 2
- APFJUBGRZGMQFF-QWRGUYRKSA-N Leu-Gly-Lys Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN APFJUBGRZGMQFF-QWRGUYRKSA-N 0.000 description 2
- VGPCJSXPPOQPBK-YUMQZZPRSA-N Leu-Gly-Ser Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O VGPCJSXPPOQPBK-YUMQZZPRSA-N 0.000 description 2
- OMHLATXVNQSALM-FQUUOJAGSA-N Leu-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(C)C)N OMHLATXVNQSALM-FQUUOJAGSA-N 0.000 description 2
- PDQDCFBVYXEFSD-SRVKXCTJSA-N Leu-Leu-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PDQDCFBVYXEFSD-SRVKXCTJSA-N 0.000 description 2
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 2
- IBSGMIPRBMPMHE-IHRRRGAJSA-N Leu-Met-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(O)=O IBSGMIPRBMPMHE-IHRRRGAJSA-N 0.000 description 2
- JVTYXRRFZCEPPK-RHYQMDGZSA-N Leu-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC(C)C)N)O JVTYXRRFZCEPPK-RHYQMDGZSA-N 0.000 description 2
- VULJUQZPSOASBZ-SRVKXCTJSA-N Leu-Pro-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O VULJUQZPSOASBZ-SRVKXCTJSA-N 0.000 description 2
- YRRCOJOXAJNSAX-IHRRRGAJSA-N Leu-Pro-Lys Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N YRRCOJOXAJNSAX-IHRRRGAJSA-N 0.000 description 2
- PWPBLZXWFXJFHE-RHYQMDGZSA-N Leu-Pro-Thr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O PWPBLZXWFXJFHE-RHYQMDGZSA-N 0.000 description 2
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 2
- HQBOMRTVKVKFMN-WDSOQIARSA-N Leu-Trp-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C(C)C)C(O)=O HQBOMRTVKVKFMN-WDSOQIARSA-N 0.000 description 2
- VKVDRTGWLVZJOM-DCAQKATOSA-N Leu-Val-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O VKVDRTGWLVZJOM-DCAQKATOSA-N 0.000 description 2
- NNCDAORZCMPZPX-GUBZILKMSA-N Lys-Gln-Ser Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N NNCDAORZCMPZPX-GUBZILKMSA-N 0.000 description 2
- LLSUNJYOSCOOEB-GUBZILKMSA-N Lys-Glu-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O LLSUNJYOSCOOEB-GUBZILKMSA-N 0.000 description 2
- LPAJOCKCPRZEAG-MNXVOIDGSA-N Lys-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCCN LPAJOCKCPRZEAG-MNXVOIDGSA-N 0.000 description 2
- DCRWPTBMWMGADO-AVGNSLFASA-N Lys-Glu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DCRWPTBMWMGADO-AVGNSLFASA-N 0.000 description 2
- VEGLGAOVLFODGC-GUBZILKMSA-N Lys-Glu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VEGLGAOVLFODGC-GUBZILKMSA-N 0.000 description 2
- DTUZCYRNEJDKSR-NHCYSSNCSA-N Lys-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN DTUZCYRNEJDKSR-NHCYSSNCSA-N 0.000 description 2
- FHIAJWBDZVHLAH-YUMQZZPRSA-N Lys-Gly-Ser Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FHIAJWBDZVHLAH-YUMQZZPRSA-N 0.000 description 2
- KJIXWRWPOCKYLD-IHRRRGAJSA-N Lys-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N KJIXWRWPOCKYLD-IHRRRGAJSA-N 0.000 description 2
- ODTZHNZPINULEU-KKUMJFAQSA-N Lys-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N ODTZHNZPINULEU-KKUMJFAQSA-N 0.000 description 2
- ZJSZPXISKMDJKQ-JYJNAYRXSA-N Lys-Phe-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCC(O)=O)C(O)=O)CC1=CC=CC=C1 ZJSZPXISKMDJKQ-JYJNAYRXSA-N 0.000 description 2
- AFLBTVGQCQLOFJ-AVGNSLFASA-N Lys-Pro-Arg Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O AFLBTVGQCQLOFJ-AVGNSLFASA-N 0.000 description 2
- VKCPHIOZDWUFSW-ONGXEEELSA-N Lys-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN VKCPHIOZDWUFSW-ONGXEEELSA-N 0.000 description 2
- 239000004472 Lysine Substances 0.000 description 2
- 239000005913 Maltodextrin Substances 0.000 description 2
- 229920002774 Maltodextrin Polymers 0.000 description 2
- BQVJARUIXRXDKN-DCAQKATOSA-N Met-Asn-His Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 BQVJARUIXRXDKN-DCAQKATOSA-N 0.000 description 2
- QWTGQXGNNMIUCW-BPUTZDHNSA-N Met-Asn-Trp Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O QWTGQXGNNMIUCW-BPUTZDHNSA-N 0.000 description 2
- RRIHXWPHQSXHAQ-XUXIUFHCSA-N Met-Ile-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(O)=O RRIHXWPHQSXHAQ-XUXIUFHCSA-N 0.000 description 2
- GRKPXCKLOOUDFG-UFYCRDLUSA-N Met-Phe-Tyr Chemical compound C([C@H](NC(=O)[C@@H](N)CCSC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 GRKPXCKLOOUDFG-UFYCRDLUSA-N 0.000 description 2
- OVTOTTGZBWXLFU-QXEWZRGKSA-N Met-Val-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O OVTOTTGZBWXLFU-QXEWZRGKSA-N 0.000 description 2
- JACMWNXOOUYXCD-JYJNAYRXSA-N Met-Val-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JACMWNXOOUYXCD-JYJNAYRXSA-N 0.000 description 2
- 241000589344 Methylomonas Species 0.000 description 2
- 241000589354 Methylosinus Species 0.000 description 2
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 2
- 239000004384 Neotame Substances 0.000 description 2
- 101100068676 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) gln-1 gene Proteins 0.000 description 2
- 241000520272 Pantoea Species 0.000 description 2
- YQNBKXUTWBRQCS-BVSLBCMMSA-N Phe-Arg-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=CC=C1 YQNBKXUTWBRQCS-BVSLBCMMSA-N 0.000 description 2
- QCHNRQQVLJYDSI-DLOVCJGASA-N Phe-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 QCHNRQQVLJYDSI-DLOVCJGASA-N 0.000 description 2
- AWAYOWOUGVZXOB-BZSNNMDCSA-N Phe-Asn-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 AWAYOWOUGVZXOB-BZSNNMDCSA-N 0.000 description 2
- MQVFHOPCKNTHGT-MELADBBJSA-N Phe-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O MQVFHOPCKNTHGT-MELADBBJSA-N 0.000 description 2
- LLGTYVHITPVGKR-RYUDHWBXSA-N Phe-Gln-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O LLGTYVHITPVGKR-RYUDHWBXSA-N 0.000 description 2
- RLUMIJXNHJVUCO-JBACZVJFSA-N Phe-Gln-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=CC=C1 RLUMIJXNHJVUCO-JBACZVJFSA-N 0.000 description 2
- CSDMCMITJLKBAH-SOUVJXGZSA-N Phe-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O CSDMCMITJLKBAH-SOUVJXGZSA-N 0.000 description 2
- APJPXSFJBMMOLW-KBPBESRZSA-N Phe-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 APJPXSFJBMMOLW-KBPBESRZSA-N 0.000 description 2
- BIYWZVCPZIFGPY-QWRGUYRKSA-N Phe-Gly-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CO)C(O)=O BIYWZVCPZIFGPY-QWRGUYRKSA-N 0.000 description 2
- FXYXBEZMRACDDR-KKUMJFAQSA-N Phe-His-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O FXYXBEZMRACDDR-KKUMJFAQSA-N 0.000 description 2
- METZZBCMDXHFMK-BZSNNMDCSA-N Phe-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N METZZBCMDXHFMK-BZSNNMDCSA-N 0.000 description 2
- WLYPRKLMRIYGPP-JYJNAYRXSA-N Phe-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 WLYPRKLMRIYGPP-JYJNAYRXSA-N 0.000 description 2
- KAJLHCWRWDSROH-BZSNNMDCSA-N Phe-Phe-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=CC=C1 KAJLHCWRWDSROH-BZSNNMDCSA-N 0.000 description 2
- XDMMOISUAHXXFD-SRVKXCTJSA-N Phe-Ser-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O XDMMOISUAHXXFD-SRVKXCTJSA-N 0.000 description 2
- KLYYKKGCPOGDPE-OEAJRASXSA-N Phe-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O KLYYKKGCPOGDPE-OEAJRASXSA-N 0.000 description 2
- OLZVAVSJEUAOHI-UNQGMJICSA-N Phe-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N)O OLZVAVSJEUAOHI-UNQGMJICSA-N 0.000 description 2
- YRHRGNUAXGUPTO-PMVMPFDFSA-N Phe-Trp-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)N[C@@H](CCCCN)C(=O)O)N YRHRGNUAXGUPTO-PMVMPFDFSA-N 0.000 description 2
- ZCXQTRXYZOSGJR-FXQIFTODSA-N Pro-Asp-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZCXQTRXYZOSGJR-FXQIFTODSA-N 0.000 description 2
- SFECXGVELZFBFJ-VEVYYDQMSA-N Pro-Asp-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SFECXGVELZFBFJ-VEVYYDQMSA-N 0.000 description 2
- CLNJSLSHKJECME-BQBZGAKWSA-N Pro-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H]1CCCN1 CLNJSLSHKJECME-BQBZGAKWSA-N 0.000 description 2
- VWXGFAIZUQBBBG-UWVGGRQHSA-N Pro-His-Gly Chemical compound C([C@@H](C(=O)NCC(=O)[O-])NC(=O)[C@H]1[NH2+]CCC1)C1=CN=CN1 VWXGFAIZUQBBBG-UWVGGRQHSA-N 0.000 description 2
- MCWHYUWXVNRXFV-RWMBFGLXSA-N Pro-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 MCWHYUWXVNRXFV-RWMBFGLXSA-N 0.000 description 2
- ZJXXCGZFYQQETF-CYDGBPFRSA-N Pro-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@@H]1CCCN1 ZJXXCGZFYQQETF-CYDGBPFRSA-N 0.000 description 2
- RNEFESSBTOQSAC-DCAQKATOSA-N Pro-Ser-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O RNEFESSBTOQSAC-DCAQKATOSA-N 0.000 description 2
- FDMCIBSQRKFSTJ-RHYQMDGZSA-N Pro-Thr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O FDMCIBSQRKFSTJ-RHYQMDGZSA-N 0.000 description 2
- JDJMFMVVJHLWDP-UNQGMJICSA-N Pro-Thr-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JDJMFMVVJHLWDP-UNQGMJICSA-N 0.000 description 2
- ZMLRZBWCXPQADC-TUAOUCFPSA-N Pro-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 ZMLRZBWCXPQADC-TUAOUCFPSA-N 0.000 description 2
- 241000589516 Pseudomonas Species 0.000 description 2
- JUJWROOIHBZHMG-UHFFFAOYSA-N Pyridine Chemical compound C1=CC=NC=C1 JUJWROOIHBZHMG-UHFFFAOYSA-N 0.000 description 2
- 240000000111 Saccharum officinarum Species 0.000 description 2
- 235000007201 Saccharum officinarum Nutrition 0.000 description 2
- 241000607142 Salmonella Species 0.000 description 2
- TUYBIWUZWJUZDD-ACZMJKKPSA-N Ser-Cys-Gln Chemical compound OC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CCC(N)=O TUYBIWUZWJUZDD-ACZMJKKPSA-N 0.000 description 2
- PVDTYLHUWAEYGY-CIUDSAMLSA-N Ser-Glu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PVDTYLHUWAEYGY-CIUDSAMLSA-N 0.000 description 2
- QKQDTEYDEIJPNK-GUBZILKMSA-N Ser-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CO QKQDTEYDEIJPNK-GUBZILKMSA-N 0.000 description 2
- GZBKRJVCRMZAST-XKBZYTNZSA-N Ser-Glu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZBKRJVCRMZAST-XKBZYTNZSA-N 0.000 description 2
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 2
- SZRNDHWMVSFPSP-XKBZYTNZSA-N Ser-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N)O SZRNDHWMVSFPSP-XKBZYTNZSA-N 0.000 description 2
- NADLKBTYNKUJEP-KATARQTJSA-N Ser-Thr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NADLKBTYNKUJEP-KATARQTJSA-N 0.000 description 2
- QYBRQMLZDDJBSW-AVGNSLFASA-N Ser-Tyr-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O QYBRQMLZDDJBSW-AVGNSLFASA-N 0.000 description 2
- YEDSOSIKVUMIJE-DCAQKATOSA-N Ser-Val-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O YEDSOSIKVUMIJE-DCAQKATOSA-N 0.000 description 2
- 241000187747 Streptomyces Species 0.000 description 2
- 239000004376 Sucralose Substances 0.000 description 2
- KRPKYGOFYUNIGM-XVSYOHENSA-N Thr-Asp-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O KRPKYGOFYUNIGM-XVSYOHENSA-N 0.000 description 2
- KRGDDWVBBDLPSJ-CUJWVEQBSA-N Thr-His-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O KRGDDWVBBDLPSJ-CUJWVEQBSA-N 0.000 description 2
- KZSYAEWQMJEGRZ-RHYQMDGZSA-N Thr-Leu-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O KZSYAEWQMJEGRZ-RHYQMDGZSA-N 0.000 description 2
- KRDSCBLRHORMRK-JXUBOQSCSA-N Thr-Lys-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O KRDSCBLRHORMRK-JXUBOQSCSA-N 0.000 description 2
- HPQHHRLWSAMMKG-KATARQTJSA-N Thr-Lys-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)O)N)O HPQHHRLWSAMMKG-KATARQTJSA-N 0.000 description 2
- KKPOGALELPLJTL-MEYUZBJRSA-N Thr-Lys-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KKPOGALELPLJTL-MEYUZBJRSA-N 0.000 description 2
- WNQJTLATMXYSEL-OEAJRASXSA-N Thr-Phe-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WNQJTLATMXYSEL-OEAJRASXSA-N 0.000 description 2
- XHWCDRUPDNSDAZ-XKBZYTNZSA-N Thr-Ser-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O XHWCDRUPDNSDAZ-XKBZYTNZSA-N 0.000 description 2
- TZQWJCGVCIJDMU-HEIBUPTGSA-N Thr-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)O)N)O TZQWJCGVCIJDMU-HEIBUPTGSA-N 0.000 description 2
- JNKAYADBODLPMQ-HSHDSVGOSA-N Thr-Trp-Val Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)[C@@H](C)O)=CNC2=C1 JNKAYADBODLPMQ-HSHDSVGOSA-N 0.000 description 2
- FKAPNDWDLDWZNF-QEJZJMRPSA-N Trp-Asp-Glu Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N FKAPNDWDLDWZNF-QEJZJMRPSA-N 0.000 description 2
- UGFOSENEZHEQKX-PJODQICGSA-N Trp-Val-Ala Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)Cc1c[nH]c2ccccc12)C(=O)N[C@@H](C)C(O)=O UGFOSENEZHEQKX-PJODQICGSA-N 0.000 description 2
- CRWOSTCODDFEKZ-HRCADAONSA-N Tyr-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O CRWOSTCODDFEKZ-HRCADAONSA-N 0.000 description 2
- RCLOWEZASFJFEX-KKUMJFAQSA-N Tyr-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 RCLOWEZASFJFEX-KKUMJFAQSA-N 0.000 description 2
- VFJIWSJKZJTQII-SRVKXCTJSA-N Tyr-Asp-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O VFJIWSJKZJTQII-SRVKXCTJSA-N 0.000 description 2
- JKUZFODWJGEQAP-KBPBESRZSA-N Tyr-Gly-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N)O JKUZFODWJGEQAP-KBPBESRZSA-N 0.000 description 2
- ARSHSYUZHSIYKR-ACRUOGEOSA-N Tyr-His-Phe Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ARSHSYUZHSIYKR-ACRUOGEOSA-N 0.000 description 2
- PJWCWGXAVIVXQC-STECZYCISA-N Tyr-Ile-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PJWCWGXAVIVXQC-STECZYCISA-N 0.000 description 2
- QARCDOCCDOLJSF-HJPIBITLSA-N Tyr-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N QARCDOCCDOLJSF-HJPIBITLSA-N 0.000 description 2
- GULIUBBXCYPDJU-CQDKDKBSSA-N Tyr-Leu-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CC1=CC=C(O)C=C1 GULIUBBXCYPDJU-CQDKDKBSSA-N 0.000 description 2
- FMXFHNSFABRVFZ-BZSNNMDCSA-N Tyr-Lys-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O FMXFHNSFABRVFZ-BZSNNMDCSA-N 0.000 description 2
- OGPKMBOPMDTEDM-IHRRRGAJSA-N Tyr-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N OGPKMBOPMDTEDM-IHRRRGAJSA-N 0.000 description 2
- WURLIFOWSMBUAR-SLFFLAALSA-N Tyr-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC3=CC=C(C=C3)O)N)C(=O)O WURLIFOWSMBUAR-SLFFLAALSA-N 0.000 description 2
- XJPXTYLVMUZGNW-IHRRRGAJSA-N Tyr-Pro-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O XJPXTYLVMUZGNW-IHRRRGAJSA-N 0.000 description 2
- GQVZBMROTPEPIF-SRVKXCTJSA-N Tyr-Ser-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O GQVZBMROTPEPIF-SRVKXCTJSA-N 0.000 description 2
- RVGVIWNHABGIFH-IHRRRGAJSA-N Tyr-Val-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O RVGVIWNHABGIFH-IHRRRGAJSA-N 0.000 description 2
- CVUDMNSZAIZFAE-TUAOUCFPSA-N Val-Arg-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N CVUDMNSZAIZFAE-TUAOUCFPSA-N 0.000 description 2
- VLOYGOZDPGYWFO-LAEOZQHASA-N Val-Asp-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VLOYGOZDPGYWFO-LAEOZQHASA-N 0.000 description 2
- XGJLNBNZNMVJRS-NRPADANISA-N Val-Glu-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O XGJLNBNZNMVJRS-NRPADANISA-N 0.000 description 2
- CVIXTAITYJQMPE-LAEOZQHASA-N Val-Glu-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CVIXTAITYJQMPE-LAEOZQHASA-N 0.000 description 2
- ROLGIBMFNMZANA-GVXVVHGQSA-N Val-Glu-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N ROLGIBMFNMZANA-GVXVVHGQSA-N 0.000 description 2
- HQYVQDRYODWONX-DCAQKATOSA-N Val-His-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CO)C(=O)O)N HQYVQDRYODWONX-DCAQKATOSA-N 0.000 description 2
- KDKLLPMFFGYQJD-CYDGBPFRSA-N Val-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N KDKLLPMFFGYQJD-CYDGBPFRSA-N 0.000 description 2
- MYLNLEIZWHVENT-VKOGCVSHSA-N Val-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](C(C)C)N MYLNLEIZWHVENT-VKOGCVSHSA-N 0.000 description 2
- GQMNEJMFMCJJTD-NHCYSSNCSA-N Val-Pro-Gln Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O GQMNEJMFMCJJTD-NHCYSSNCSA-N 0.000 description 2
- UQMPYVLTQCGRSK-IFFSRLJSSA-N Val-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N)O UQMPYVLTQCGRSK-IFFSRLJSSA-N 0.000 description 2
- GUIYPEKUEMQBIK-JSGCOSHPSA-N Val-Tyr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)NCC(O)=O GUIYPEKUEMQBIK-JSGCOSHPSA-N 0.000 description 2
- JXWGBRRVTRAZQA-ULQDDVLXSA-N Val-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N JXWGBRRVTRAZQA-ULQDDVLXSA-N 0.000 description 2
- 240000008042 Zea mays Species 0.000 description 2
- HINSNOJRHFIMKB-DJDMUFINSA-N [(2S,3R,4S,5S,6R)-4,5-dihydroxy-6-(hydroxymethyl)-3-[(2S,3R,4R,5R,6S)-3,4,5-trihydroxy-6-methyloxan-2-yl]oxyoxan-2-yl] (1R,4S,5R,9S,10R,13S)-13-[(2S,3R,4S,5R,6R)-5-hydroxy-6-(hydroxymethyl)-3,4-bis[[(2S,3R,4S,5S,6R)-3,4,5-trihydroxy-6-(hydroxymethyl)oxan-2-yl]oxy]oxan-2-yl]oxy-5,9-dimethyl-14-methylidenetetracyclo[11.2.1.01,10.04,9]hexadecane-5-carboxylate Chemical compound [H][C@@]1(O[C@@H]2[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]2OC(=O)[C@]2(C)CCC[C@@]3(C)[C@]4([H])CC[C@@]5(C[C@]4(CC5=C)CC[C@]23[H])O[C@]2([H])O[C@H](CO)[C@@H](O)[C@H](O[C@]3([H])O[C@H](CO)[C@@H](O)[C@H](O)[C@H]3O)[C@H]2O[C@]2([H])O[C@H](CO)[C@@H](O)[C@H](O)[C@H]2O)O[C@@H](C)[C@H](O)[C@@H](O)[C@H]1O HINSNOJRHFIMKB-DJDMUFINSA-N 0.000 description 2
- 235000010358 acesulfame potassium Nutrition 0.000 description 2
- 229960004998 acesulfame potassium Drugs 0.000 description 2
- 239000000619 acesulfame-K Substances 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- 230000002378 acidificating effect Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 2
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 2
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 2
- 125000000539 amino acid group Chemical group 0.000 description 2
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 2
- 108010008355 arginyl-glutamine Proteins 0.000 description 2
- 108010001271 arginyl-glutamyl-arginine Proteins 0.000 description 2
- 125000003118 aryl group Chemical group 0.000 description 2
- 239000000605 aspartame Substances 0.000 description 2
- 235000010357 aspartame Nutrition 0.000 description 2
- IAOZJIPTCAWIRG-QWRGUYRKSA-N aspartame Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)OC)CC1=CC=CC=C1 IAOZJIPTCAWIRG-QWRGUYRKSA-N 0.000 description 2
- 229960003438 aspartame Drugs 0.000 description 2
- 230000006696 biosynthetic metabolic pathway Effects 0.000 description 2
- 238000004113 cell culture Methods 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- 235000013339 cereals Nutrition 0.000 description 2
- 239000007795 chemical reaction product Substances 0.000 description 2
- 235000015218 chewing gum Nutrition 0.000 description 2
- 229940112822 chewing gum Drugs 0.000 description 2
- 235000009508 confectionery Nutrition 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 235000013365 dairy product Nutrition 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 230000029087 digestion Effects 0.000 description 2
- 108010064741 ent-kaurene synthetase A Proteins 0.000 description 2
- 230000007071 enzymatic hydrolysis Effects 0.000 description 2
- 238000006911 enzymatic reaction Methods 0.000 description 2
- 239000006167 equilibration buffer Substances 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000002538 fungal effect Effects 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 108010075431 glycyl-alanyl-phenylalanine Proteins 0.000 description 2
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 2
- 108010089804 glycyl-threonine Proteins 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- PFOARMALXZGCHY-UHFFFAOYSA-N homoegonol Natural products C1=C(OC)C(OC)=CC=C1C1=CC2=CC(CCCO)=CC(OC)=C2O1 PFOARMALXZGCHY-UHFFFAOYSA-N 0.000 description 2
- 229920001519 homopolymer Polymers 0.000 description 2
- 239000001257 hydrogen Substances 0.000 description 2
- 230000002209 hydrophobic effect Effects 0.000 description 2
- 235000015243 ice cream Nutrition 0.000 description 2
- 238000010348 incorporation Methods 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 108010078274 isoleucylvaline Proteins 0.000 description 2
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 2
- 108010012058 leucyltyrosine Proteins 0.000 description 2
- 229940035034 maltodextrin Drugs 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000001404 mediated effect Effects 0.000 description 2
- MCYHPZGUONZRGO-VKHMYHEASA-N methyl L-cysteinate Chemical compound COC(=O)[C@@H](N)CS MCYHPZGUONZRGO-VKHMYHEASA-N 0.000 description 2
- 238000001823 molecular biology technique Methods 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 229930014626 natural product Natural products 0.000 description 2
- 108010070257 neotame Proteins 0.000 description 2
- 235000019412 neotame Nutrition 0.000 description 2
- HLIAVLHNDJUHFG-HOTGVXAUSA-N neotame Chemical compound CC(C)(C)CCN[C@@H](CC(O)=O)C(=O)N[C@H](C(=O)OC)CC1=CC=CC=C1 HLIAVLHNDJUHFG-HOTGVXAUSA-N 0.000 description 2
- 235000015097 nutrients Nutrition 0.000 description 2
- 239000012044 organic layer Substances 0.000 description 2
- 239000008188 pellet Substances 0.000 description 2
- 239000000825 pharmaceutical preparation Substances 0.000 description 2
- 229940127557 pharmaceutical product Drugs 0.000 description 2
- 108010072637 phenylalanyl-arginyl-phenylalanine Proteins 0.000 description 2
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 2
- 239000013612 plasmid Substances 0.000 description 2
- 229920000642 polymer Polymers 0.000 description 2
- 239000002952 polymeric resin Substances 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- QSRAJVGDWKFOGU-WBXIDTKBSA-N rebaudioside c Chemical compound O[C@@H]1[C@H](O)[C@@H](O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](O[C@H]2[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O2)O)[C@H](O)[C@@H](CO)O[C@H]1O[C@]1(CC[C@H]2[C@@]3(C)[C@@H]([C@](CCC3)(C)C(=O)O[C@H]3[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O3)O)CC3)C(=C)C[C@]23C1 QSRAJVGDWKFOGU-WBXIDTKBSA-N 0.000 description 2
- 235000009566 rice Nutrition 0.000 description 2
- 235000019204 saccharin Nutrition 0.000 description 2
- CVHZOJJKTDOEJC-UHFFFAOYSA-N saccharin Chemical compound C1=CC=C2C(=O)NS(=O)(=O)C2=C1 CVHZOJJKTDOEJC-UHFFFAOYSA-N 0.000 description 2
- 229940081974 saccharin Drugs 0.000 description 2
- 239000000901 saccharin and its Na,K and Ca salt Substances 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- 235000014214 soft drink Nutrition 0.000 description 2
- 235000019408 sucralose Nutrition 0.000 description 2
- BAQAVOSOZGMPRM-QBMZZYIRSA-N sucralose Chemical compound O[C@@H]1[C@@H](O)[C@@H](Cl)[C@@H](CO)O[C@@H]1O[C@@]1(CCl)[C@@H](O)[C@H](O)[C@@H](CCl)O1 BAQAVOSOZGMPRM-QBMZZYIRSA-N 0.000 description 2
- 229960004793 sucrose Drugs 0.000 description 2
- 229920003002 synthetic resin Polymers 0.000 description 2
- 150000003505 terpenes Chemical class 0.000 description 2
- 108010061238 threonyl-glycine Proteins 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 230000005030 transcription termination Effects 0.000 description 2
- 238000010361 transduction Methods 0.000 description 2
- 230000026683 transduction Effects 0.000 description 2
- 108010080629 tryptophan-leucine Proteins 0.000 description 2
- 108010051110 tyrosyl-lysine Proteins 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 1
- XVZCXCTYGHPNEM-IHRRRGAJSA-N (2s)-1-[(2s)-2-[[(2s)-2-amino-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O XVZCXCTYGHPNEM-IHRRRGAJSA-N 0.000 description 1
- HNSDLXPSAYFUHK-UHFFFAOYSA-N 1,4-bis(2-ethylhexyl) sulfosuccinate Chemical compound CCCCC(CC)COC(=O)CC(S(O)(=O)=O)C(=O)OCC(CC)CCCC HNSDLXPSAYFUHK-UHFFFAOYSA-N 0.000 description 1
- VGONTNSXDCQUGY-RRKCRQDMSA-N 2'-deoxyinosine Chemical group C1[C@H](O)[C@@H](CO)O[C@H]1N1C(N=CNC2=O)=C2N=C1 VGONTNSXDCQUGY-RRKCRQDMSA-N 0.000 description 1
- XXMFJKNOJSDQBM-UHFFFAOYSA-N 2,2,2-trifluoroacetic acid;hydrate Chemical compound [OH3+].[O-]C(=O)C(F)(F)F XXMFJKNOJSDQBM-UHFFFAOYSA-N 0.000 description 1
- DQVAZKGVGKHQDS-UHFFFAOYSA-N 2-[[1-[2-[(2-amino-4-methylpentanoyl)amino]-4-methylpentanoyl]pyrrolidine-2-carbonyl]amino]-4-methylpentanoic acid Chemical compound CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(=O)NC(CC(C)C)C(O)=O DQVAZKGVGKHQDS-UHFFFAOYSA-N 0.000 description 1
- 238000005084 2D-nuclear magnetic resonance Methods 0.000 description 1
- 241001133760 Acoelorraphe Species 0.000 description 1
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 1
- MVBWLRJESQOQTM-ACZMJKKPSA-N Ala-Gln-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O MVBWLRJESQOQTM-ACZMJKKPSA-N 0.000 description 1
- NWVVKQZOVSTDBQ-CIUDSAMLSA-N Ala-Glu-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NWVVKQZOVSTDBQ-CIUDSAMLSA-N 0.000 description 1
- HXNNRBHASOSVPG-GUBZILKMSA-N Ala-Glu-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HXNNRBHASOSVPG-GUBZILKMSA-N 0.000 description 1
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 1
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 1
- BLTRAARCJYVJKV-QEJZJMRPSA-N Ala-Lys-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](Cc1ccccc1)C(O)=O BLTRAARCJYVJKV-QEJZJMRPSA-N 0.000 description 1
- RAAWHFXHAACDFT-FXQIFTODSA-N Ala-Met-Asn Chemical compound CSCC[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CC(N)=O)C(O)=O RAAWHFXHAACDFT-FXQIFTODSA-N 0.000 description 1
- MSWSRLGNLKHDEI-ACZMJKKPSA-N Ala-Ser-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O MSWSRLGNLKHDEI-ACZMJKKPSA-N 0.000 description 1
- RTZCUEHYUQZIDE-WHFBIAKZSA-N Ala-Ser-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RTZCUEHYUQZIDE-WHFBIAKZSA-N 0.000 description 1
- YJHKTAMKPGFJCT-NRPADANISA-N Ala-Val-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O YJHKTAMKPGFJCT-NRPADANISA-N 0.000 description 1
- 108020005544 Antisense RNA Proteins 0.000 description 1
- 240000007087 Apium graveolens Species 0.000 description 1
- 235000015849 Apium graveolens Dulce Group Nutrition 0.000 description 1
- 235000010591 Appio Nutrition 0.000 description 1
- 108010009534 Arabidopsis sucrose synthase-1 Proteins 0.000 description 1
- 235000017060 Arachis glabrata Nutrition 0.000 description 1
- 235000010777 Arachis hypogaea Nutrition 0.000 description 1
- 235000018262 Arachis monticola Nutrition 0.000 description 1
- XPSGESXVBSQZPL-SRVKXCTJSA-N Arg-Arg-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O XPSGESXVBSQZPL-SRVKXCTJSA-N 0.000 description 1
- RVDVDRUZWZIBJQ-CIUDSAMLSA-N Arg-Asn-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O RVDVDRUZWZIBJQ-CIUDSAMLSA-N 0.000 description 1
- NONSEUUPKITYQT-BQBZGAKWSA-N Arg-Asn-Gly Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N)CN=C(N)N NONSEUUPKITYQT-BQBZGAKWSA-N 0.000 description 1
- NVCIXQYNWYTLDO-IHRRRGAJSA-N Arg-His-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCN=C(N)N)N NVCIXQYNWYTLDO-IHRRRGAJSA-N 0.000 description 1
- OOIMKQRCPJBGPD-XUXIUFHCSA-N Arg-Ile-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O OOIMKQRCPJBGPD-XUXIUFHCSA-N 0.000 description 1
- GNYUVVJYGJFKHN-RVMXOQNASA-N Arg-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N GNYUVVJYGJFKHN-RVMXOQNASA-N 0.000 description 1
- LVMUGODRNHFGRA-AVGNSLFASA-N Arg-Leu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O LVMUGODRNHFGRA-AVGNSLFASA-N 0.000 description 1
- BTJVOUQWFXABOI-IHRRRGAJSA-N Arg-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCNC(N)=N BTJVOUQWFXABOI-IHRRRGAJSA-N 0.000 description 1
- NIELFHOLFTUZME-HJWJTTGWSA-N Arg-Phe-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NIELFHOLFTUZME-HJWJTTGWSA-N 0.000 description 1
- AWMAZIIEFPFHCP-RCWTZXSCSA-N Arg-Pro-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O AWMAZIIEFPFHCP-RCWTZXSCSA-N 0.000 description 1
- CGWVCWFQGXOUSJ-ULQDDVLXSA-N Arg-Tyr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O CGWVCWFQGXOUSJ-ULQDDVLXSA-N 0.000 description 1
- XEOXPCNONWHHSW-AVGNSLFASA-N Arg-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N XEOXPCNONWHHSW-AVGNSLFASA-N 0.000 description 1
- ANAHQDPQQBDOBM-UHFFFAOYSA-N Arg-Val-Tyr Natural products CC(C)C(NC(=O)C(N)CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O ANAHQDPQQBDOBM-UHFFFAOYSA-N 0.000 description 1
- 241000186063 Arthrobacter Species 0.000 description 1
- ZDOQDYFZNGASEY-BIIVOSGPSA-N Asn-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N)C(=O)O ZDOQDYFZNGASEY-BIIVOSGPSA-N 0.000 description 1
- OOWSBIOUKIUWLO-RCOVLWMOSA-N Asn-Gly-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O OOWSBIOUKIUWLO-RCOVLWMOSA-N 0.000 description 1
- SPCONPVIDFMDJI-QSFUFRPTSA-N Asn-Ile-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O SPCONPVIDFMDJI-QSFUFRPTSA-N 0.000 description 1
- ZMUQQMGITUJQTI-CIUDSAMLSA-N Asn-Leu-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ZMUQQMGITUJQTI-CIUDSAMLSA-N 0.000 description 1
- UBGGJTMETLEXJD-DCAQKATOSA-N Asn-Leu-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O UBGGJTMETLEXJD-DCAQKATOSA-N 0.000 description 1
- NCFJQJRLQJEECD-NHCYSSNCSA-N Asn-Leu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O NCFJQJRLQJEECD-NHCYSSNCSA-N 0.000 description 1
- GIQCDTKOIPUDSG-GARJFASQSA-N Asn-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)N)N)C(=O)O GIQCDTKOIPUDSG-GARJFASQSA-N 0.000 description 1
- AYOAHKWVQLNPDM-HJGDQZAQSA-N Asn-Lys-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AYOAHKWVQLNPDM-HJGDQZAQSA-N 0.000 description 1
- BKFXFUPYETWGGA-XVSYOHENSA-N Asn-Phe-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BKFXFUPYETWGGA-XVSYOHENSA-N 0.000 description 1
- DXHINQUXBZNUCF-MELADBBJSA-N Asn-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC(=O)N)N)C(=O)O DXHINQUXBZNUCF-MELADBBJSA-N 0.000 description 1
- CBHVAFXKOYAHOY-NHCYSSNCSA-N Asn-Val-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O CBHVAFXKOYAHOY-NHCYSSNCSA-N 0.000 description 1
- PBVLJOIPOGUQQP-CIUDSAMLSA-N Asp-Ala-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O PBVLJOIPOGUQQP-CIUDSAMLSA-N 0.000 description 1
- RGKKALNPOYURGE-ZKWXMUAHSA-N Asp-Ala-Val Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O RGKKALNPOYURGE-ZKWXMUAHSA-N 0.000 description 1
- XYBJLTKSGFBLCS-QXEWZRGKSA-N Asp-Arg-Val Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CC(O)=O XYBJLTKSGFBLCS-QXEWZRGKSA-N 0.000 description 1
- YNQIDCRRTWGHJD-ZLUOBGJFSA-N Asp-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(O)=O YNQIDCRRTWGHJD-ZLUOBGJFSA-N 0.000 description 1
- KGAJCJXBEWLQDZ-UBHSHLNASA-N Asp-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N KGAJCJXBEWLQDZ-UBHSHLNASA-N 0.000 description 1
- IJHUZMGJRGNXIW-CIUDSAMLSA-N Asp-Glu-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IJHUZMGJRGNXIW-CIUDSAMLSA-N 0.000 description 1
- PDECQIHABNQRHN-GUBZILKMSA-N Asp-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(O)=O PDECQIHABNQRHN-GUBZILKMSA-N 0.000 description 1
- PYXXJFRXIYAESU-PCBIJLKTSA-N Asp-Ile-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PYXXJFRXIYAESU-PCBIJLKTSA-N 0.000 description 1
- RQHLMGCXCZUOGT-ZPFDUUQYSA-N Asp-Leu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RQHLMGCXCZUOGT-ZPFDUUQYSA-N 0.000 description 1
- UJGRZQYSNYTCAX-SRVKXCTJSA-N Asp-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UJGRZQYSNYTCAX-SRVKXCTJSA-N 0.000 description 1
- VSMYBNPOHYAXSD-GUBZILKMSA-N Asp-Lys-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O VSMYBNPOHYAXSD-GUBZILKMSA-N 0.000 description 1
- GWIJZUVQVDJHDI-AVGNSLFASA-N Asp-Phe-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O GWIJZUVQVDJHDI-AVGNSLFASA-N 0.000 description 1
- UKGGPJNBONZZCM-WDSKDSINSA-N Asp-Pro Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O UKGGPJNBONZZCM-WDSKDSINSA-N 0.000 description 1
- HJZLUGQGJWXJCJ-CIUDSAMLSA-N Asp-Pro-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O HJZLUGQGJWXJCJ-CIUDSAMLSA-N 0.000 description 1
- KGHLGJAXYSVNJP-WHFBIAKZSA-N Asp-Ser-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O KGHLGJAXYSVNJP-WHFBIAKZSA-N 0.000 description 1
- XMKXONRMGJXCJV-LAEOZQHASA-N Asp-Val-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XMKXONRMGJXCJV-LAEOZQHASA-N 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 241000228245 Aspergillus niger Species 0.000 description 1
- 244000075850 Avena orientalis Species 0.000 description 1
- 235000007319 Avena orientalis Nutrition 0.000 description 1
- 241000219310 Beta vulgaris subsp. vulgaris Species 0.000 description 1
- 241000743774 Brachypodium Species 0.000 description 1
- 241000219198 Brassica Species 0.000 description 1
- 235000011331 Brassica Nutrition 0.000 description 1
- 240000007124 Brassica oleracea Species 0.000 description 1
- 235000003899 Brassica oleracea var acephala Nutrition 0.000 description 1
- 235000011301 Brassica oleracea var capitata Nutrition 0.000 description 1
- 235000017647 Brassica oleracea var italica Nutrition 0.000 description 1
- 235000001169 Brassica oleracea var oleracea Nutrition 0.000 description 1
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 1
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 1
- 208000005623 Carcinogenesis Diseases 0.000 description 1
- 241000588923 Citrobacter Species 0.000 description 1
- 241000193403 Clostridium Species 0.000 description 1
- 229920000742 Cotton Polymers 0.000 description 1
- 235000011309 Crambe hispanica subsp abyssinica Nutrition 0.000 description 1
- 241000220247 Crambe hispanica subsp. abyssinica Species 0.000 description 1
- 244000241257 Cucumis melo Species 0.000 description 1
- 235000015510 Cucumis melo subsp melo Nutrition 0.000 description 1
- WDQXKVCQXRNOSI-GHCJXIJMSA-N Cys-Asp-Ile Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WDQXKVCQXRNOSI-GHCJXIJMSA-N 0.000 description 1
- GCDLPNRHPWBKJJ-WDSKDSINSA-N Cys-Gly-Glu Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O GCDLPNRHPWBKJJ-WDSKDSINSA-N 0.000 description 1
- CIVXDCMSSFGWAL-YUMQZZPRSA-N Cys-Lys-Gly Chemical compound C(CCN)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CS)N CIVXDCMSSFGWAL-YUMQZZPRSA-N 0.000 description 1
- SAEVTQWAYDPXMU-KATARQTJSA-N Cys-Thr-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O SAEVTQWAYDPXMU-KATARQTJSA-N 0.000 description 1
- SHZGCJCMOBCMKK-UHFFFAOYSA-N D-mannomethylose Natural products CC1OC(O)C(O)C(O)C1O SHZGCJCMOBCMKK-UHFFFAOYSA-N 0.000 description 1
- 108010066133 D-octopine dehydrogenase Proteins 0.000 description 1
- YAHZABJORDUQGO-NQXXGFSBSA-N D-ribulose 1,5-bisphosphate Chemical compound OP(=O)(O)OC[C@@H](O)[C@@H](O)C(=O)COP(O)(O)=O YAHZABJORDUQGO-NQXXGFSBSA-N 0.000 description 1
- 102000012410 DNA Ligases Human genes 0.000 description 1
- 108010061982 DNA Ligases Proteins 0.000 description 1
- 102000004594 DNA Polymerase I Human genes 0.000 description 1
- 108010017826 DNA Polymerase I Proteins 0.000 description 1
- 239000003155 DNA primer Substances 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 244000000626 Daucus carota Species 0.000 description 1
- 235000002767 Daucus carota Nutrition 0.000 description 1
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 1
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- CANAPGLEBDTCAF-QHSHOEHESA-N Dulcoside A Natural products C[C@@H]1O[C@H](O[C@@H]2[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]2O[C@]34CC[C@H]5[C@]6(C)CCC[C@](C)([C@H]6CC[C@@]5(CC3=C)C4)C(=O)O[C@@H]7O[C@H](CO)[C@@H](O)[C@H](O)[C@H]7O)[C@H](O)[C@H](O)[C@H]1O CANAPGLEBDTCAF-QHSHOEHESA-N 0.000 description 1
- CANAPGLEBDTCAF-NTIPNFSCSA-N Dulcoside A Chemical compound O[C@@H]1[C@H](O)[C@@H](O)[C@H](C)O[C@H]1O[C@H]1[C@H](O[C@]23C(C[C@]4(C2)[C@H]([C@@]2(C)[C@@H]([C@](CCC2)(C)C(=O)O[C@H]2[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O2)O)CC4)CC3)=C)O[C@H](CO)[C@@H](O)[C@@H]1O CANAPGLEBDTCAF-NTIPNFSCSA-N 0.000 description 1
- 241000588722 Escherichia Species 0.000 description 1
- 241001198387 Escherichia coli BL21(DE3) Species 0.000 description 1
- 239000001776 FEMA 4720 Substances 0.000 description 1
- 244000307700 Fragaria vesca Species 0.000 description 1
- 235000016623 Fragaria vesca Nutrition 0.000 description 1
- 235000011363 Fragaria x ananassa Nutrition 0.000 description 1
- GYHNNYVSQQEPJS-UHFFFAOYSA-N Gallium Chemical compound [Ga] GYHNNYVSQQEPJS-UHFFFAOYSA-N 0.000 description 1
- SHERTACNJPYHAR-ACZMJKKPSA-N Gln-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O SHERTACNJPYHAR-ACZMJKKPSA-N 0.000 description 1
- QYTKAVBFRUGYAU-ACZMJKKPSA-N Gln-Asp-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QYTKAVBFRUGYAU-ACZMJKKPSA-N 0.000 description 1
- COYGBRTZEVWZBW-XKBZYTNZSA-N Gln-Cys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CCC(N)=O COYGBRTZEVWZBW-XKBZYTNZSA-N 0.000 description 1
- CITDWMLWXNUQKD-FXQIFTODSA-N Gln-Gln-Asn Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CITDWMLWXNUQKD-FXQIFTODSA-N 0.000 description 1
- MCAVASRGVBVPMX-FXQIFTODSA-N Gln-Glu-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MCAVASRGVBVPMX-FXQIFTODSA-N 0.000 description 1
- KDXKFBSNIJYNNR-YVNDNENWSA-N Gln-Glu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KDXKFBSNIJYNNR-YVNDNENWSA-N 0.000 description 1
- HYPVLWGNBIYTNA-GUBZILKMSA-N Gln-Leu-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HYPVLWGNBIYTNA-GUBZILKMSA-N 0.000 description 1
- SFAFZYYMAWOCIC-KKUMJFAQSA-N Gln-Phe-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N SFAFZYYMAWOCIC-KKUMJFAQSA-N 0.000 description 1
- SWDSRANUCKNBLA-AVGNSLFASA-N Gln-Phe-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N SWDSRANUCKNBLA-AVGNSLFASA-N 0.000 description 1
- FNAJNWPDTIXYJN-CIUDSAMLSA-N Gln-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCC(N)=O FNAJNWPDTIXYJN-CIUDSAMLSA-N 0.000 description 1
- OTQSTOXRUBVWAP-NRPADANISA-N Gln-Ser-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O OTQSTOXRUBVWAP-NRPADANISA-N 0.000 description 1
- OACPJRQRAHMQEQ-NHCYSSNCSA-N Gln-Val-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O OACPJRQRAHMQEQ-NHCYSSNCSA-N 0.000 description 1
- DYFJZDDQPNIPAB-NHCYSSNCSA-N Glu-Arg-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O DYFJZDDQPNIPAB-NHCYSSNCSA-N 0.000 description 1
- RJONUNZIMUXUOI-GUBZILKMSA-N Glu-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N RJONUNZIMUXUOI-GUBZILKMSA-N 0.000 description 1
- RDPOETHPAQEGDP-ACZMJKKPSA-N Glu-Asp-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RDPOETHPAQEGDP-ACZMJKKPSA-N 0.000 description 1
- XXCDTYBVGMPIOA-FXQIFTODSA-N Glu-Asp-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XXCDTYBVGMPIOA-FXQIFTODSA-N 0.000 description 1
- CKOFNWCLWRYUHK-XHNCKOQMSA-N Glu-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O CKOFNWCLWRYUHK-XHNCKOQMSA-N 0.000 description 1
- VFZIDQZAEBORGY-GLLZPBPUSA-N Glu-Gln-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VFZIDQZAEBORGY-GLLZPBPUSA-N 0.000 description 1
- HNVFSTLPVJWIDV-CIUDSAMLSA-N Glu-Glu-Gln Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HNVFSTLPVJWIDV-CIUDSAMLSA-N 0.000 description 1
- AUTNXSQEVVHSJK-YVNDNENWSA-N Glu-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O AUTNXSQEVVHSJK-YVNDNENWSA-N 0.000 description 1
- BUAKRRKDHSSIKK-IHRRRGAJSA-N Glu-Glu-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 BUAKRRKDHSSIKK-IHRRRGAJSA-N 0.000 description 1
- XIKYNVKEUINBGL-IUCAKERBSA-N Glu-His-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)NCC(O)=O XIKYNVKEUINBGL-IUCAKERBSA-N 0.000 description 1
- ZCOJVESMNGBGLF-GRLWGSQLSA-N Glu-Ile-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZCOJVESMNGBGLF-GRLWGSQLSA-N 0.000 description 1
- ZHNHJYYFCGUZNQ-KBIXCLLPSA-N Glu-Ile-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O ZHNHJYYFCGUZNQ-KBIXCLLPSA-N 0.000 description 1
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 1
- ATVYZJGOZLVXDK-IUCAKERBSA-N Glu-Leu-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O ATVYZJGOZLVXDK-IUCAKERBSA-N 0.000 description 1
- OQXDUSZKISQQSS-GUBZILKMSA-N Glu-Lys-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O OQXDUSZKISQQSS-GUBZILKMSA-N 0.000 description 1
- OCJRHJZKGGSPRW-IUCAKERBSA-N Glu-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O OCJRHJZKGGSPRW-IUCAKERBSA-N 0.000 description 1
- SOEPMWQCTJITPZ-SRVKXCTJSA-N Glu-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N SOEPMWQCTJITPZ-SRVKXCTJSA-N 0.000 description 1
- XEKAJTCACGEBOK-KKUMJFAQSA-N Glu-Met-Phe Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XEKAJTCACGEBOK-KKUMJFAQSA-N 0.000 description 1
- QNJNPKSWAHPYGI-JYJNAYRXSA-N Glu-Phe-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=CC=C1 QNJNPKSWAHPYGI-JYJNAYRXSA-N 0.000 description 1
- YQAQQKPWFOBSMU-WDCWCFNPSA-N Glu-Thr-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O YQAQQKPWFOBSMU-WDCWCFNPSA-N 0.000 description 1
- CQGBSALYGOXQPE-HTUGSXCWSA-N Glu-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O CQGBSALYGOXQPE-HTUGSXCWSA-N 0.000 description 1
- CAQXJMUDOLSBPF-SUSMZKCASA-N Glu-Thr-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAQXJMUDOLSBPF-SUSMZKCASA-N 0.000 description 1
- QXUPRMQJDWJDFR-NRPADANISA-N Glu-Val-Ser Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXUPRMQJDWJDFR-NRPADANISA-N 0.000 description 1
- 108010055629 Glucosyltransferases Proteins 0.000 description 1
- 102000000340 Glucosyltransferases Human genes 0.000 description 1
- UESJMAMHDLEHGM-NHCYSSNCSA-N Gly-Ile-Leu Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O UESJMAMHDLEHGM-NHCYSSNCSA-N 0.000 description 1
- IUZGUFAJDBHQQV-YUMQZZPRSA-N Gly-Leu-Asn Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IUZGUFAJDBHQQV-YUMQZZPRSA-N 0.000 description 1
- ULZCYBYDTUMHNF-IUCAKERBSA-N Gly-Leu-Glu Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ULZCYBYDTUMHNF-IUCAKERBSA-N 0.000 description 1
- IEGFSKKANYKBDU-QWHCGFSZSA-N Gly-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)CN)C(=O)O IEGFSKKANYKBDU-QWHCGFSZSA-N 0.000 description 1
- GGLIDLCEPDHEJO-BQBZGAKWSA-N Gly-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)CN GGLIDLCEPDHEJO-BQBZGAKWSA-N 0.000 description 1
- HFPVRZWORNJRRC-UWVGGRQHSA-N Gly-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN HFPVRZWORNJRRC-UWVGGRQHSA-N 0.000 description 1
- TVTZEOHWHUVYCG-KYNKHSRBSA-N Gly-Thr-Thr Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O TVTZEOHWHUVYCG-KYNKHSRBSA-N 0.000 description 1
- RIYIFUFFFBIOEU-KBPBESRZSA-N Gly-Tyr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 RIYIFUFFFBIOEU-KBPBESRZSA-N 0.000 description 1
- 102100031181 Glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 1
- 240000002024 Gossypium herbaceum Species 0.000 description 1
- 235000004341 Gossypium herbaceum Nutrition 0.000 description 1
- 244000299507 Gossypium hirsutum Species 0.000 description 1
- 101150009006 HIS3 gene Proteins 0.000 description 1
- 235000003222 Helianthus annuus Nutrition 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- IPIVXQQRZXEUGW-UWJYBYFXSA-N His-Ala-His Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 IPIVXQQRZXEUGW-UWJYBYFXSA-N 0.000 description 1
- YADRBUZBKHHDAO-XPUUQOCRSA-N His-Gly-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](C)C(O)=O YADRBUZBKHHDAO-XPUUQOCRSA-N 0.000 description 1
- ZUPVLBAXUUGKKN-VHSXEESVSA-N His-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CC2=CN=CN2)N)C(=O)O ZUPVLBAXUUGKKN-VHSXEESVSA-N 0.000 description 1
- VJJSDSNFXCWCEJ-DJFWLOJKSA-N His-Ile-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O VJJSDSNFXCWCEJ-DJFWLOJKSA-N 0.000 description 1
- ZFDKSLBEWYCOCS-BZSNNMDCSA-N His-Phe-Lys Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CC=1NC=NC=1)C1=CC=CC=C1 ZFDKSLBEWYCOCS-BZSNNMDCSA-N 0.000 description 1
- JSQIXEHORHLQEE-MEYUZBJRSA-N His-Phe-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JSQIXEHORHLQEE-MEYUZBJRSA-N 0.000 description 1
- FBVHRDXSCYELMI-PBCZWWQYSA-N His-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N)O FBVHRDXSCYELMI-PBCZWWQYSA-N 0.000 description 1
- XHQYFGPIRUHQIB-PBCZWWQYSA-N His-Thr-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CN=CN1 XHQYFGPIRUHQIB-PBCZWWQYSA-N 0.000 description 1
- MKWFGXSFLYNTKC-XIRDDKMYSA-N His-Trp-Asp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC3=CN=CN3)N MKWFGXSFLYNTKC-XIRDDKMYSA-N 0.000 description 1
- 241000209219 Hordeum Species 0.000 description 1
- 240000005979 Hordeum vulgare Species 0.000 description 1
- 235000007340 Hordeum vulgare Nutrition 0.000 description 1
- YPWHUFAAMNHMGS-QSFUFRPTSA-N Ile-Ala-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N YPWHUFAAMNHMGS-QSFUFRPTSA-N 0.000 description 1
- WECYRWOMWSCWNX-XUXIUFHCSA-N Ile-Arg-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(C)C)C(O)=O WECYRWOMWSCWNX-XUXIUFHCSA-N 0.000 description 1
- SVBAHOMTJRFSIC-SXTJYALSSA-N Ile-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N SVBAHOMTJRFSIC-SXTJYALSSA-N 0.000 description 1
- GLYJPWIRLBAIJH-FQUUOJAGSA-N Ile-Lys-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N GLYJPWIRLBAIJH-FQUUOJAGSA-N 0.000 description 1
- JODPUDMBQBIWCK-GHCJXIJMSA-N Ile-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O JODPUDMBQBIWCK-GHCJXIJMSA-N 0.000 description 1
- DZMWFIRHFFVBHS-ZEWNOJEFSA-N Ile-Tyr-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N DZMWFIRHFFVBHS-ZEWNOJEFSA-N 0.000 description 1
- 108010065920 Insulin Lispro Proteins 0.000 description 1
- 241000588748 Klebsiella Species 0.000 description 1
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- WQZGKKKJIJFFOK-ZZWDRFIYSA-N L-glucose Chemical compound OC[C@@H]1OC(O)[C@@H](O)[C@H](O)[C@H]1O WQZGKKKJIJFFOK-ZZWDRFIYSA-N 0.000 description 1
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- SHZGCJCMOBCMKK-JFNONXLTSA-N L-rhamnopyranose Chemical compound C[C@@H]1OC(O)[C@H](O)[C@H](O)[C@H]1O SHZGCJCMOBCMKK-JFNONXLTSA-N 0.000 description 1
- PNNNRSAQSRJVSB-UHFFFAOYSA-N L-rhamnose Natural products CC(O)C(O)C(O)C(O)C=O PNNNRSAQSRJVSB-UHFFFAOYSA-N 0.000 description 1
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 1
- JKGHDYGZRDWHGA-SRVKXCTJSA-N Leu-Asn-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JKGHDYGZRDWHGA-SRVKXCTJSA-N 0.000 description 1
- ZURHXHNAEJJRNU-CIUDSAMLSA-N Leu-Asp-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZURHXHNAEJJRNU-CIUDSAMLSA-N 0.000 description 1
- DLFAACQHIRSQGG-CIUDSAMLSA-N Leu-Asp-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O DLFAACQHIRSQGG-CIUDSAMLSA-N 0.000 description 1
- DLCOFDAHNMMQPP-SRVKXCTJSA-N Leu-Asp-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DLCOFDAHNMMQPP-SRVKXCTJSA-N 0.000 description 1
- XVSJMWYYLHPDKY-DCAQKATOSA-N Leu-Asp-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O XVSJMWYYLHPDKY-DCAQKATOSA-N 0.000 description 1
- KVOFSTUWVSQMDK-KKUMJFAQSA-N Leu-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(C)C)CC1=CN=CN1 KVOFSTUWVSQMDK-KKUMJFAQSA-N 0.000 description 1
- LIINDKYIGYTDLG-PPCPHDFISA-N Leu-Ile-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LIINDKYIGYTDLG-PPCPHDFISA-N 0.000 description 1
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 1
- LZHJZLHSRGWBBE-IHRRRGAJSA-N Leu-Lys-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LZHJZLHSRGWBBE-IHRRRGAJSA-N 0.000 description 1
- KTOIECMYZZGVSI-BZSNNMDCSA-N Leu-Phe-His Chemical compound C([C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CC=CC=C1 KTOIECMYZZGVSI-BZSNNMDCSA-N 0.000 description 1
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 1
- IDGZVZJLYFTXSL-DCAQKATOSA-N Leu-Ser-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IDGZVZJLYFTXSL-DCAQKATOSA-N 0.000 description 1
- JIHDFWWRYHSAQB-GUBZILKMSA-N Leu-Ser-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JIHDFWWRYHSAQB-GUBZILKMSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 240000006240 Linum usitatissimum Species 0.000 description 1
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 1
- PNPYKQFJGRFYJE-GUBZILKMSA-N Lys-Ala-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O PNPYKQFJGRFYJE-GUBZILKMSA-N 0.000 description 1
- QUCDKEKDPYISNX-HJGDQZAQSA-N Lys-Asn-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QUCDKEKDPYISNX-HJGDQZAQSA-N 0.000 description 1
- QUYCUALODHJQLK-CIUDSAMLSA-N Lys-Asp-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QUYCUALODHJQLK-CIUDSAMLSA-N 0.000 description 1
- WGCKDDHUFPQSMZ-ZPFDUUQYSA-N Lys-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCCCN WGCKDDHUFPQSMZ-ZPFDUUQYSA-N 0.000 description 1
- MWVUEPNEPWMFBD-SRVKXCTJSA-N Lys-Cys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CCCCN MWVUEPNEPWMFBD-SRVKXCTJSA-N 0.000 description 1
- MRWXLRGAFDOILG-DCAQKATOSA-N Lys-Gln-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MRWXLRGAFDOILG-DCAQKATOSA-N 0.000 description 1
- WGLAORUKDGRINI-WDCWCFNPSA-N Lys-Glu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGLAORUKDGRINI-WDCWCFNPSA-N 0.000 description 1
- NKKFVJRLCCUJNA-QWRGUYRKSA-N Lys-Gly-Lys Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN NKKFVJRLCCUJNA-QWRGUYRKSA-N 0.000 description 1
- OJDFAABAHBPVTH-MNXVOIDGSA-N Lys-Ile-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O OJDFAABAHBPVTH-MNXVOIDGSA-N 0.000 description 1
- NJNRBRKHOWSGMN-SRVKXCTJSA-N Lys-Leu-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O NJNRBRKHOWSGMN-SRVKXCTJSA-N 0.000 description 1
- MTBBHUKKPWKXBT-ULQDDVLXSA-N Lys-Met-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MTBBHUKKPWKXBT-ULQDDVLXSA-N 0.000 description 1
- HKXSZKJMDBHOTG-CIUDSAMLSA-N Lys-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CCCCN HKXSZKJMDBHOTG-CIUDSAMLSA-N 0.000 description 1
- JMNRXRPBHFGXQX-GUBZILKMSA-N Lys-Ser-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JMNRXRPBHFGXQX-GUBZILKMSA-N 0.000 description 1
- MIFFFXHMAHFACR-KATARQTJSA-N Lys-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CCCCN MIFFFXHMAHFACR-KATARQTJSA-N 0.000 description 1
- TVHCDSBMFQYPNA-RHYQMDGZSA-N Lys-Thr-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TVHCDSBMFQYPNA-RHYQMDGZSA-N 0.000 description 1
- YKBSXQFZWFXFIB-VOAKCMCISA-N Lys-Thr-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCCN)C(O)=O YKBSXQFZWFXFIB-VOAKCMCISA-N 0.000 description 1
- RMOKGALPSPOYKE-KATARQTJSA-N Lys-Thr-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O RMOKGALPSPOYKE-KATARQTJSA-N 0.000 description 1
- ZVZRQKJOQQAFCF-ULQDDVLXSA-N Lys-Tyr-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ZVZRQKJOQQAFCF-ULQDDVLXSA-N 0.000 description 1
- PSVAVKGDUAKZKU-BZSNNMDCSA-N Lys-Tyr-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCCCN)N)O PSVAVKGDUAKZKU-BZSNNMDCSA-N 0.000 description 1
- 240000004658 Medicago sativa Species 0.000 description 1
- 235000017587 Medicago sativa ssp. sativa Nutrition 0.000 description 1
- LMKSBGIUPVRHEH-FXQIFTODSA-N Met-Ala-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(N)=O LMKSBGIUPVRHEH-FXQIFTODSA-N 0.000 description 1
- HWROAFGWPQUPTE-OSUNSFLBSA-N Met-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CCSC)N HWROAFGWPQUPTE-OSUNSFLBSA-N 0.000 description 1
- WSPQHZOMTFFWGH-XGEHTFHBSA-N Met-Thr-Cys Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(O)=O WSPQHZOMTFFWGH-XGEHTFHBSA-N 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 241001467578 Microbacterium Species 0.000 description 1
- 241000235395 Mucor Species 0.000 description 1
- 108010085220 Multiprotein Complexes Proteins 0.000 description 1
- 102000007474 Multiprotein Complexes Human genes 0.000 description 1
- 108010014251 Muramidase Proteins 0.000 description 1
- 102000016943 Muramidase Human genes 0.000 description 1
- 102000008300 Mutant Proteins Human genes 0.000 description 1
- 108010021466 Mutant Proteins Proteins 0.000 description 1
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 1
- AUEJLPRZGVVDNU-UHFFFAOYSA-N N-L-tyrosyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 AUEJLPRZGVVDNU-UHFFFAOYSA-N 0.000 description 1
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 1
- 244000061176 Nicotiana tabacum Species 0.000 description 1
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 1
- 241000209117 Panicum Species 0.000 description 1
- 235000006443 Panicum miliaceum subsp. miliaceum Nutrition 0.000 description 1
- 235000009037 Panicum miliaceum subsp. ruderale Nutrition 0.000 description 1
- 241001520808 Panicum virgatum Species 0.000 description 1
- 240000004370 Pastinaca sativa Species 0.000 description 1
- 235000017769 Pastinaca sativa subsp sativa Nutrition 0.000 description 1
- 108010033276 Peptide Fragments Proteins 0.000 description 1
- 102000007079 Peptide Fragments Human genes 0.000 description 1
- 244000062780 Petroselinum sativum Species 0.000 description 1
- 240000007377 Petunia x hybrida Species 0.000 description 1
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 1
- 244000046052 Phaseolus vulgaris Species 0.000 description 1
- BKWJQWJPZMUWEG-LFSVMHDDSA-N Phe-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 BKWJQWJPZMUWEG-LFSVMHDDSA-N 0.000 description 1
- GNUCSNWOCQFMMC-UFYCRDLUSA-N Phe-Arg-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 GNUCSNWOCQFMMC-UFYCRDLUSA-N 0.000 description 1
- KAHUBGWSIQNZQQ-KKUMJFAQSA-N Phe-Asn-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 KAHUBGWSIQNZQQ-KKUMJFAQSA-N 0.000 description 1
- JIYJYFIXQTYDNF-YDHLFZDLSA-N Phe-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N JIYJYFIXQTYDNF-YDHLFZDLSA-N 0.000 description 1
- GXDPQJUBLBZKDY-IAVJCBSLSA-N Phe-Ile-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GXDPQJUBLBZKDY-IAVJCBSLSA-N 0.000 description 1
- MGLBSROLWAWCKN-FCLVOEFKSA-N Phe-Phe-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MGLBSROLWAWCKN-FCLVOEFKSA-N 0.000 description 1
- FKFCKDROTNIVSO-JYJNAYRXSA-N Phe-Pro-Met Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(O)=O FKFCKDROTNIVSO-JYJNAYRXSA-N 0.000 description 1
- IIEOLPMQYRBZCN-SRVKXCTJSA-N Phe-Ser-Cys Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O IIEOLPMQYRBZCN-SRVKXCTJSA-N 0.000 description 1
- JXQVYPWVGUOIDV-MXAVVETBSA-N Phe-Ser-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JXQVYPWVGUOIDV-MXAVVETBSA-N 0.000 description 1
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical group [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 1
- 108010059820 Polygalacturonase Proteins 0.000 description 1
- ILMLVTGTUJPQFP-FXQIFTODSA-N Pro-Asp-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O ILMLVTGTUJPQFP-FXQIFTODSA-N 0.000 description 1
- YFNOUBWUIIJQHF-LPEHRKFASA-N Pro-Asp-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)O)C(=O)N2CCC[C@@H]2C(=O)O YFNOUBWUIIJQHF-LPEHRKFASA-N 0.000 description 1
- LQZZPNDMYNZPFT-KKUMJFAQSA-N Pro-Gln-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LQZZPNDMYNZPFT-KKUMJFAQSA-N 0.000 description 1
- SMFQZMGHCODUPQ-ULQDDVLXSA-N Pro-Lys-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SMFQZMGHCODUPQ-ULQDDVLXSA-N 0.000 description 1
- WFIVLLFYUZZWOD-RHYQMDGZSA-N Pro-Lys-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WFIVLLFYUZZWOD-RHYQMDGZSA-N 0.000 description 1
- AUYKOPJPKUCYHE-SRVKXCTJSA-N Pro-Met-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@@H]1CCCN1 AUYKOPJPKUCYHE-SRVKXCTJSA-N 0.000 description 1
- VGVCNKSUVSZEIE-IHRRRGAJSA-N Pro-Phe-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O VGVCNKSUVSZEIE-IHRRRGAJSA-N 0.000 description 1
- BUEIYHBJHCDAMI-UFYCRDLUSA-N Pro-Phe-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BUEIYHBJHCDAMI-UFYCRDLUSA-N 0.000 description 1
- GBUNEGKQPSAMNK-QTKMDUPCSA-N Pro-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@@H]2CCCN2)O GBUNEGKQPSAMNK-QTKMDUPCSA-N 0.000 description 1
- HOJUNFDJDAPVBI-BZSNNMDCSA-N Pro-Trp-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@@H]3CCCN3 HOJUNFDJDAPVBI-BZSNNMDCSA-N 0.000 description 1
- QKWYXRPICJEQAJ-KJEVXHAQSA-N Pro-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@@H]2CCCN2)O QKWYXRPICJEQAJ-KJEVXHAQSA-N 0.000 description 1
- GIPHUOWOTCAJSR-UHFFFAOYSA-N Rebaudioside A. Natural products C1CC2C3(C)CCCC(C)(C(=O)OC4C(C(O)C(O)C(CO)O4)O)C3CCC2(C2)CC(=C)C21OC1OC(CO)C(O)C(O)C1OC(C1O)OC(CO)C(O)C1OC1OC(CO)C(O)C(O)C1O GIPHUOWOTCAJSR-UHFFFAOYSA-N 0.000 description 1
- 241000191025 Rhodobacter Species 0.000 description 1
- 241000316848 Rhodococcus <scale insect> Species 0.000 description 1
- 101100394989 Rhodopseudomonas palustris (strain ATCC BAA-98 / CGA009) hisI gene Proteins 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 235000004789 Rosa xanthina Nutrition 0.000 description 1
- 241000220222 Rosaceae Species 0.000 description 1
- 241000123889 Rubus chingii Species 0.000 description 1
- WTUJZHKANPDPIN-CIUDSAMLSA-N Ser-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N WTUJZHKANPDPIN-CIUDSAMLSA-N 0.000 description 1
- PZZJMBYSYAKYPK-UWJYBYFXSA-N Ser-Ala-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O PZZJMBYSYAKYPK-UWJYBYFXSA-N 0.000 description 1
- YMAWDPHQVABADW-CIUDSAMLSA-N Ser-Gln-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O YMAWDPHQVABADW-CIUDSAMLSA-N 0.000 description 1
- UOLGINIHBRIECN-FXQIFTODSA-N Ser-Glu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UOLGINIHBRIECN-FXQIFTODSA-N 0.000 description 1
- BRGQQXQKPUCUJQ-KBIXCLLPSA-N Ser-Glu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BRGQQXQKPUCUJQ-KBIXCLLPSA-N 0.000 description 1
- WBINSDOPZHQPPM-AVGNSLFASA-N Ser-Glu-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N)O WBINSDOPZHQPPM-AVGNSLFASA-N 0.000 description 1
- OQPNSDWGAMFJNU-QWRGUYRKSA-N Ser-Gly-Tyr Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 OQPNSDWGAMFJNU-QWRGUYRKSA-N 0.000 description 1
- JWOBLHJRDADHLN-KKUMJFAQSA-N Ser-Leu-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JWOBLHJRDADHLN-KKUMJFAQSA-N 0.000 description 1
- RHAPJNVNWDBFQI-BQBZGAKWSA-N Ser-Pro-Gly Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O RHAPJNVNWDBFQI-BQBZGAKWSA-N 0.000 description 1
- QPPYAWVLAVXISR-DCAQKATOSA-N Ser-Pro-His Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CO)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O QPPYAWVLAVXISR-DCAQKATOSA-N 0.000 description 1
- OLKICIBQRVSQMA-SRVKXCTJSA-N Ser-Ser-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OLKICIBQRVSQMA-SRVKXCTJSA-N 0.000 description 1
- PIQRHJQWEPWFJG-UWJYBYFXSA-N Ser-Tyr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O PIQRHJQWEPWFJG-UWJYBYFXSA-N 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 235000003434 Sesamum indicum Nutrition 0.000 description 1
- 244000040738 Sesamum orientale Species 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- CDBYLPFSWZWCQE-UHFFFAOYSA-L Sodium Carbonate Chemical class [Na+].[Na+].[O-]C([O-])=O CDBYLPFSWZWCQE-UHFFFAOYSA-L 0.000 description 1
- 240000003768 Solanum lycopersicum Species 0.000 description 1
- 244000061456 Solanum tuberosum Species 0.000 description 1
- 235000002595 Solanum tuberosum Nutrition 0.000 description 1
- 101100427140 Stevia rebaudiana UGT74G1 gene Proteins 0.000 description 1
- 101100048059 Stevia rebaudiana UGT85C2 gene Proteins 0.000 description 1
- 235000021536 Sugar beet Nutrition 0.000 description 1
- 241000192584 Synechocystis Species 0.000 description 1
- KEGBFULVYKYJRD-LFSVMHDDSA-N Thr-Ala-Phe Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KEGBFULVYKYJRD-LFSVMHDDSA-N 0.000 description 1
- JBHMLZSKIXMVFS-XVSYOHENSA-N Thr-Asn-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JBHMLZSKIXMVFS-XVSYOHENSA-N 0.000 description 1
- XOTBWOCSLMBGMF-SUSMZKCASA-N Thr-Glu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOTBWOCSLMBGMF-SUSMZKCASA-N 0.000 description 1
- XPNSAQMEAVSQRD-FBCQKBJTSA-N Thr-Gly-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)NCC(O)=O XPNSAQMEAVSQRD-FBCQKBJTSA-N 0.000 description 1
- UYTYTDMCDBPDSC-URLPEUOOSA-N Thr-Ile-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N UYTYTDMCDBPDSC-URLPEUOOSA-N 0.000 description 1
- HOVLHEKTGVIKAP-WDCWCFNPSA-N Thr-Leu-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O HOVLHEKTGVIKAP-WDCWCFNPSA-N 0.000 description 1
- NCXVJIQMWSGRHY-KXNHARMFSA-N Thr-Leu-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O NCXVJIQMWSGRHY-KXNHARMFSA-N 0.000 description 1
- UJQVSMNQMQHVRY-KZVJFYERSA-N Thr-Met-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O UJQVSMNQMQHVRY-KZVJFYERSA-N 0.000 description 1
- LVRFMARKDGGZMX-IZPVPAKOSA-N Thr-Tyr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=C(O)C=C1 LVRFMARKDGGZMX-IZPVPAKOSA-N 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 102000004357 Transferases Human genes 0.000 description 1
- 108090000992 Transferases Proteins 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 244000098338 Triticum aestivum Species 0.000 description 1
- 229920004890 Triton X-100 Polymers 0.000 description 1
- 239000013504 Triton X-100 Substances 0.000 description 1
- HXNVJPQADLRHGR-JBACZVJFSA-N Trp-Glu-Tyr Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)N HXNVJPQADLRHGR-JBACZVJFSA-N 0.000 description 1
- OWSRIUBVJOQHNY-IHPCNDPISA-N Trp-Lys-His Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N OWSRIUBVJOQHNY-IHPCNDPISA-N 0.000 description 1
- UUIYFDAWNBSWPG-IHPCNDPISA-N Trp-Lys-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N UUIYFDAWNBSWPG-IHPCNDPISA-N 0.000 description 1
- ZKVANNIVSDOQMG-HKUYNNGSSA-N Trp-Tyr-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)NCC(=O)O)N ZKVANNIVSDOQMG-HKUYNNGSSA-N 0.000 description 1
- UIRVSEPRMWDVEW-RNXOBYDBSA-N Trp-Tyr-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC3=CNC4=CC=CC=C43)N UIRVSEPRMWDVEW-RNXOBYDBSA-N 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- TVOGEPLDNYTAHD-CQDKDKBSSA-N Tyr-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 TVOGEPLDNYTAHD-CQDKDKBSSA-N 0.000 description 1
- NOOMDULIORCDNF-IRXDYDNUSA-N Tyr-Gly-Phe Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O NOOMDULIORCDNF-IRXDYDNUSA-N 0.000 description 1
- GGXUDPQWAWRINY-XEGUGMAKSA-N Tyr-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 GGXUDPQWAWRINY-XEGUGMAKSA-N 0.000 description 1
- HSBZWINKRYZCSQ-KKUMJFAQSA-N Tyr-Lys-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O HSBZWINKRYZCSQ-KKUMJFAQSA-N 0.000 description 1
- NHOVZGFNTGMYMI-KKUMJFAQSA-N Tyr-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NHOVZGFNTGMYMI-KKUMJFAQSA-N 0.000 description 1
- UMSZZGTXGKHTFJ-SRVKXCTJSA-N Tyr-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 UMSZZGTXGKHTFJ-SRVKXCTJSA-N 0.000 description 1
- QHDXUYOYTPWCSK-RCOVLWMOSA-N Val-Asp-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)NCC(=O)O)N QHDXUYOYTPWCSK-RCOVLWMOSA-N 0.000 description 1
- BEGDZYNDCNEGJZ-XVKPBYJWSA-N Val-Gly-Gln Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O BEGDZYNDCNEGJZ-XVKPBYJWSA-N 0.000 description 1
- FTKXYXACXYOHND-XUXIUFHCSA-N Val-Ile-Leu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O FTKXYXACXYOHND-XUXIUFHCSA-N 0.000 description 1
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 1
- WMRWZYSRQUORHJ-YDHLFZDLSA-N Val-Phe-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N WMRWZYSRQUORHJ-YDHLFZDLSA-N 0.000 description 1
- KSFXWENSJABBFI-ZKWXMUAHSA-N Val-Ser-Asn Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KSFXWENSJABBFI-ZKWXMUAHSA-N 0.000 description 1
- JQTYTBPCSOAZHI-FXQIFTODSA-N Val-Ser-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N JQTYTBPCSOAZHI-FXQIFTODSA-N 0.000 description 1
- VIKZGAUAKQZDOF-NRPADANISA-N Val-Ser-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O VIKZGAUAKQZDOF-NRPADANISA-N 0.000 description 1
- VTIAEOKFUJJBTC-YDHLFZDLSA-N Val-Tyr-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VTIAEOKFUJJBTC-YDHLFZDLSA-N 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- 241000219977 Vigna Species 0.000 description 1
- 108020005202 Viral DNA Proteins 0.000 description 1
- 208000036142 Viral infection Diseases 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 235000009754 Vitis X bourquina Nutrition 0.000 description 1
- 235000012333 Vitis X labruscana Nutrition 0.000 description 1
- 240000006365 Vitis vinifera Species 0.000 description 1
- 235000014787 Vitis vinifera Nutrition 0.000 description 1
- 241000235013 Yarrowia Species 0.000 description 1
- 241000607479 Yersinia pestis Species 0.000 description 1
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 1
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 1
- 241000235017 Zygosaccharomyces Species 0.000 description 1
- FJJCIZWZNKZHII-UHFFFAOYSA-N [4,6-bis(cyanoamino)-1,3,5-triazin-2-yl]cyanamide Chemical compound N#CNC1=NC(NC#N)=NC(NC#N)=N1 FJJCIZWZNKZHII-UHFFFAOYSA-N 0.000 description 1
- 238000002835 absorbance Methods 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- DHKHKXVYLBGOIT-UHFFFAOYSA-N acetaldehyde Diethyl Acetal Natural products CCOC(C)OCC DHKHKXVYLBGOIT-UHFFFAOYSA-N 0.000 description 1
- 150000001241 acetals Chemical class 0.000 description 1
- IFLVGRRVGPXYON-UHFFFAOYSA-N adci Chemical compound C12=CC=CC=C2C2(C(=O)N)C3=CC=CC=C3CC1N2 IFLVGRRVGPXYON-UHFFFAOYSA-N 0.000 description 1
- 229960005305 adenosine Drugs 0.000 description 1
- 239000000443 aerosol Substances 0.000 description 1
- 238000001261 affinity purification Methods 0.000 description 1
- 108010041407 alanylaspartic acid Proteins 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 239000012223 aqueous fraction Substances 0.000 description 1
- 239000008346 aqueous phase Substances 0.000 description 1
- 108010060035 arginylproline Proteins 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 108010077245 asparaginyl-proline Proteins 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 1
- 125000000188 beta-D-glucosyl group Chemical group C1([C@H](O)[C@@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 1
- 102000006995 beta-Glucosidase Human genes 0.000 description 1
- 108010047754 beta-Glucosidase Proteins 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 230000001851 biosynthetic effect Effects 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 239000001110 calcium chloride Substances 0.000 description 1
- 229910001628 calcium chloride Inorganic materials 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 230000036952 cancer formation Effects 0.000 description 1
- AFSMXMZTPZSFFQ-UHFFFAOYSA-N carbamothioyl 1,3-thiazolidine-2-carboxylate Chemical class C(N)(=S)OC(=O)C1SCCN1 AFSMXMZTPZSFFQ-UHFFFAOYSA-N 0.000 description 1
- 238000001460 carbon-13 nuclear magnetic resonance spectrum Methods 0.000 description 1
- 231100000504 carcinogenesis Toxicity 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 210000003850 cellular structure Anatomy 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 229920001429 chelating resin Polymers 0.000 description 1
- 108091000085 chlorophyll binding Proteins 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 239000013611 chromosomal DNA Substances 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 238000000975 co-precipitation Methods 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 239000003184 complementary RNA Substances 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 235000005822 corn Nutrition 0.000 description 1
- 238000005100 correlation spectroscopy Methods 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 238000005034 decoration Methods 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 108010054813 diprotin B Proteins 0.000 description 1
- 125000000567 diterpene group Chemical group 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 229940096118 ella Drugs 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000009088 enzymatic function Effects 0.000 description 1
- 239000002038 ethyl acetate fraction Substances 0.000 description 1
- 108010093305 exopolygalacturonase Proteins 0.000 description 1
- 238000000855 fermentation Methods 0.000 description 1
- 230000004151 fermentation Effects 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 239000007789 gas Substances 0.000 description 1
- 239000000499 gel Substances 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 125000005640 glucopyranosyl group Chemical group 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 1
- 108010010147 glycylglutamine Proteins 0.000 description 1
- 108010015792 glycyllysine Proteins 0.000 description 1
- 108010087823 glycyltyrosine Proteins 0.000 description 1
- 239000011121 hardwood Substances 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000003929 heteronuclear multiple quantum coherence Methods 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- 229930027917 kanamycin Natural products 0.000 description 1
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 238000001638 lipofection Methods 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 239000012139 lysis buffer Substances 0.000 description 1
- 229960000274 lysozyme Drugs 0.000 description 1
- 239000004325 lysozyme Substances 0.000 description 1
- 235000010335 lysozyme Nutrition 0.000 description 1
- 108010003700 lysyl aspartic acid Proteins 0.000 description 1
- 108010054155 lysyllysine Proteins 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000001819 mass spectrum Methods 0.000 description 1
- 125000001434 methanylylidene group Chemical group [H]C#[*] 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 108010056582 methionylglutamic acid Proteins 0.000 description 1
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 1
- 125000000325 methylidene group Chemical group [H]C([H])=* 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 108010058731 nopaline synthase Proteins 0.000 description 1
- 125000001736 nosyl group Chemical group S(=O)(=O)(C1=CC=C([N+](=O)[O-])C=C1)* 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 238000000238 one-dimensional nuclear magnetic resonance spectroscopy Methods 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- 235000020232 peanut Nutrition 0.000 description 1
- 235000011197 perejil Nutrition 0.000 description 1
- 230000002974 pharmacogenomic effect Effects 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 108010024607 phenylalanylalanine Proteins 0.000 description 1
- 239000011574 phosphorus Substances 0.000 description 1
- 229910052698 phosphorus Inorganic materials 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 230000037048 polymerization activity Effects 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 230000019525 primary metabolic process Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 108010031719 prolyl-serine Proteins 0.000 description 1
- 230000006337 proteolytic cleavage Effects 0.000 description 1
- UMJSCPRVCHMLSP-UHFFFAOYSA-N pyridine Natural products COC1=CC=CN=C1 UMJSCPRVCHMLSP-UHFFFAOYSA-N 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 238000003259 recombinant expression Methods 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 230000001172 regenerating effect Effects 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 239000005871 repellent Substances 0.000 description 1
- 230000002940 repellent Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 229920005989 resin Polymers 0.000 description 1
- 239000011347 resin Substances 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 210000003705 ribosome Anatomy 0.000 description 1
- 238000001896 rotating frame Overhauser effect spectroscopy Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- 239000007974 sodium acetate buffer Substances 0.000 description 1
- 239000011122 softwood Substances 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 238000001179 sorption measurement Methods 0.000 description 1
- OMHUCGDTACNQEX-OSHKXICASA-N steviolbioside Chemical compound O([C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1O[C@]12C(=C)C[C@@]3(C1)CC[C@@H]1[C@@](C)(CCC[C@]1([C@@H]3CC2)C)C(O)=O)[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O OMHUCGDTACNQEX-OSHKXICASA-N 0.000 description 1
- QSIDJGUAAUSPMG-CULFPKEHSA-N steviolmonoside Chemical compound O([C@]12C(=C)C[C@@]3(C1)CC[C@@H]1[C@@](C)(CCC[C@]1([C@@H]3CC2)C)C(O)=O)[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O QSIDJGUAAUSPMG-CULFPKEHSA-N 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 125000001424 substituent group Chemical group 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 235000019605 sweet taste sensations Nutrition 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- OQPOFZJZPYRNFF-CULFPKEHSA-N tkd5uc898q Chemical compound O=C([C@]1(C)CCC[C@@]2([C@@H]1CC[C@]13C[C@](O)(C(=C)C1)CC[C@@H]23)C)O[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O OQPOFZJZPYRNFF-CULFPKEHSA-N 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- DRSKVOAJKLUMCL-MMUIXFKXSA-N u2n4xkx7hp Chemical compound O([C@H]1[C@H](O)[C@@H](CO)O[C@H]([C@@H]1O[C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O)O[C@]12C(=C)C[C@@]3(C1)CC[C@@H]1[C@@](C)(CCC[C@]1([C@@H]3CC2)C)C(O)=O)[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O DRSKVOAJKLUMCL-MMUIXFKXSA-N 0.000 description 1
- OOLLAFOLCSJHRE-ZHAKMVSLSA-N ulipristal acetate Chemical compound C1=CC(N(C)C)=CC=C1[C@@H]1C2=C3CCC(=O)C=C3CC[C@H]2[C@H](CC[C@]2(OC(C)=O)C(C)=O)[C@]2(C)C1 OOLLAFOLCSJHRE-ZHAKMVSLSA-N 0.000 description 1
- 238000004704 ultra performance liquid chromatography Methods 0.000 description 1
- 238000000825 ultraviolet detection Methods 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- IBIDRSSEHFLGSD-UHFFFAOYSA-N valinyl-arginine Natural products CC(C)C(N)C(=O)NC(C(O)=O)CCCN=C(N)N IBIDRSSEHFLGSD-UHFFFAOYSA-N 0.000 description 1
- 230000009385 viral infection Effects 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/44—Preparation of O-glycosides, e.g. glucosides
- C12P19/56—Preparation of O-glycosides, e.g. glucosides having an oxygen atom of the saccharide radical directly bound to a condensed ring system having three or more carbocyclic rings, e.g. daunomycin, adriamycin
-
- A—HUMAN NECESSITIES
- A23—FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
- A23L—FOODS, FOODSTUFFS, OR NON-ALCOHOLIC BEVERAGES, NOT COVERED BY SUBCLASSES A21D OR A23B-A23J; THEIR PREPARATION OR TREATMENT, e.g. COOKING, MODIFICATION OF NUTRITIVE QUALITIES, PHYSICAL TREATMENT; PRESERVATION OF FOODS OR FOODSTUFFS, IN GENERAL
- A23L27/00—Spices; Flavouring agents or condiments; Artificial sweetening agents; Table salts; Dietetic salt substitutes; Preparation or treatment thereof
- A23L27/30—Artificial sweetening agents
- A23L27/33—Artificial sweetening agents containing sugars or derivatives
- A23L27/36—Terpene glycosides
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
- C12N15/81—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8242—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
- C12N15/8243—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
- C12N15/8245—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine involving modified carbohydrate or sugar alcohol metabolism, e.g. starch biosynthesis
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1048—Glycosyltransferases (2.4)
- C12N9/1051—Hexosyltransferases (2.4.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1048—Glycosyltransferases (2.4)
- C12N9/1081—Glycosyltransferases (2.4) transferring other glycosyl groups (2.4.99)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y204/00—Glycosyltransferases (2.4)
- C12Y204/01—Hexosyltransferases (2.4.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y204/00—Glycosyltransferases (2.4)
- C12Y204/01—Hexosyltransferases (2.4.1)
- C12Y204/01013—Sucrose synthase (2.4.1.13)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y204/00—Glycosyltransferases (2.4)
- C12Y204/01—Hexosyltransferases (2.4.1)
- C12Y204/01017—Glucuronosyltransferase (2.4.1.17)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y204/00—Glycosyltransferases (2.4)
- C12Y204/02—Pentosyltransferases (2.4.2)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y204/00—Glycosyltransferases (2.4)
- C12Y204/99—Glycosyltransferases (2.4) transferring other glycosyl groups (2.4.99)
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Biomedical Technology (AREA)
- Nutrition Science (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Medicinal Chemistry (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Cell Biology (AREA)
- Polymers & Plastics (AREA)
- Food Science & Technology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Saccharide Compounds (AREA)
- Mycology (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
본 발명은, 적어도 부분적으로, 레바우디오사이드 I를 생산하기 위하여 UDP-글루코스로부터의 글루코실기를 레바우디오사이드 A로 전이시키는 활성을 갖는 변이체 UGT 효소의 사용을 통해서 스테비올 글리코사이드 레바우디오사이드 I를 생산하는 것에 관한 것이다.
Description
관련 출원
본 출원은 미국 특허 출원 제16/506,892호(출원일: 2019년 7월 9일, 발명의 명칭: "BIOSYNTHETIC PRODUCTION OF STEVIOL GLYCOSIDE REBAUDIOSIDE I VIA VARIANT ENZYMES") 및 미국 특허 출원 제16/679,032호(출원일: 2019년 11월 8일, 발명의 명칭: "BIOSYNTHETIC PRODUCTION OF STEVIOL GLYCOSIDES REBAUDIOSIDE J AND REBAUDIOSIDE N")에 대한 우선권을 주장하며, 이들 각각의 전체 내용은 본 명세서에 참조에 의해 원용된다.
발명의 분야
본 발명의 분야는, 적어도 부분적으로, 선택된 미생물로 조작된 생합성 경로를 통한 특정 스테비올 글리코사이드의 생산에 유용한 방법 및 공정에 관한 것이다. 더욱 구체적으로, 본 개시내용은 이전의 미지의 효소 및/또는 효소 변이체를 이용한 레바우디오사이드 I(Rebaudioside I: "Reb I")의 생산을 제공한다.
본 발명은, 적어도 부분적으로, Reb A로부터 Reb I의 생산 및/또는 변형된 효소의 사용을 통한 Reb I의 생산에 초점을 맞추고 있다.
(C-19-O-글루코스에서) 레바우디오사이드 A의 특정 지향된 글리코실화는 레바우디오사이드 Reb I를 생산할 수 있다. Reb A로부터 효소를 이용해서 Reb I를 생산하는 합성 단계가 본 명세서에서 대안 효소로 달성되었다. 이하에 더욱 상세히 기술되는 바와 같이, UGT76G1 내 도메인에서의 돌연변이는 글루코실화 활성의 특정 변경을 초래할 수 있는 것으로 밝혀졌다.
또한, 스테비오사이드로부터 레바우디오사이드 A를 거쳐서 레바우디오사이드 I를 높은 역가로 그리고/또는 저렴한 비용으로 생산하는 방법이 제공된다.
본 발명은 Reb A로부터 Reb I를 생산하는 방법을 포괄한다. 특히, 본 발명은 (13-[(2-O-β-D-글루코피라노실-3-O-β-D-글루코피라노실-β-D-글루코피라노실)옥시] 엔트-카우르-16-엔-19-오익 산-[(3-O-β-D-글루코피라노실-β-D-글루코피라노실) 에스터]로 식별되는 "Reb I"인 스테비올 글리코사이드 레바우디오사이드 I의 생산을 제공한다.
특히, 본 명세서에서는 레바우디오사이드 I를 합성하는 방법이 제공되되, 해당 방법은 (a) 레바우디오사이드 A를 포함하는 스테비올 글리코사이드 조성물; (b) 수크로스, 유리딘 다이포스페이트(UDP), 유리딘 다이포스페이트-글루코스(UDP-글루코스), 및 이들의 조합물로 이루어진 군으로부터 선택된 기질; 및 (c) 서열번호 1의 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제 효소를 포함하는 반응 혼합물을 준비하는 단계; 및 레바우디오사이드 I를 생산시키기에 충분한 시간 동안 상기 반응 혼합물을 인큐베이션시키는 단계를 포함한다.
제공된 방법들 중 어느 하나의 몇몇 실시형태에서, 본 명세서에 기재된 방법에서 사용되는 UDP-글리코실트랜스퍼라제 효소는 서열번호 1과 적어도 80%(예컨대, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100%) 동일한 아미노산 서열을 포함한다.
일 양상에서, 본 명세서에 기재된 효소들 중 어느 하나가 제공된다.
제공된 방법들 중 어느 하나의 몇몇 실시형태에서, 스테비올 글리코사이드 조성물은 스테비아 추출물이다.
제공된 방법들 중 어느 하나의 몇몇 실시형태에서, 본 명세서에 기재된 방법은 반응 혼합물에 수크로스 신타제를 첨가하는 단계를 더 포함한다. 제공된 방법들 중 어느 하나의 몇몇 실시형태에서, 수크로스 신타제는 서열번호 11의 아미노산 서열을 포함하는 아라비돕시스 탈리아나(Arabidopsis thaliana) 수크로스 신타제 1(AtSUS1)이다.
제공된 방법들 중 어느 하나의 몇몇 실시형태에서, 본 명세서에 기재된 방법에서 사용되는 수크로스 신타제는 서열번호 11과 적어도 80%(예컨대, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100%) 동일한 아미노산 서열을 포함한다.
제공된 방법들 중 어느 하나의 몇몇 실시형태에서, 사용되는 UDP-글리코실트랜스퍼라제 효소는 UGT76G1 L200A 돌연변이체(LA)-AtSUS1 융합 효소이다. 몇몇 실시형태에서, 본 명세서에 기재된 방법에서 사용되는 LA-AtSUS1 융합 효소는 서열번호 13과 적어도 80%(예컨대, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100%) 동일한 아미노산 서열을 포함한다. 몇몇 실시형태에서, 본 명세서에 기재된 방법에서 사용되는 LA-AtSUS1 융합 효소는 서열번호 13의 아미노산 서열을 포함한다.
제공된 방법들 중 어느 하나의 몇몇 실시형태에서, 반응 혼합물은 시험관내에 있고, 즉, 본 명세서에 기재된 방법은 시험관내에서 수행된다. 시험관내 반응을 위하여, UDP-글리코실트랜스퍼라제 효소 및/또는 수크로스 신타제가 시험관내 반응 혼합물에 첨가될 수 있다.
제공된 방법들 중 어느 하나의 몇몇 실시형태에서, 반응 혼합물은 세포-기반 반응 혼합물이고, 즉, 반응은 세포에서 수행된다. 세포-기반 반응을 위하여, UDP-글리코실트랜스퍼라제 효소 및/또는 수크로스 신타제는 숙주 세포에서 발현될 수 있다.
제공된 방법들 중 어느 하나의 몇몇 실시형태에서, UDP-글리코실트랜스퍼라제 효소 및/또는 수크로스 신타제는 각각 UDP-글리코실트랜스퍼라제 효소 및/또는 수크로스 신타제를 인코딩하는 뉴클레오타이드 서열로부터 발현된다. 이와 같이, 제공된 방법들 중 어느 하나의 몇몇 실시형태에서, 숙주 세포는 서열번호 2와 적어도 80%(예컨대, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100%) 동일성을 갖는 뉴클레오타이드 서열을 포함한다. 제공된 방법들 중 어느 하나의 몇몇 실시형태에서, 숙주 세포는 서열번호 12와 적어도 80%(예컨대, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100%) 동일성을 갖는 뉴클레오타이드 서열을 더 포함한다. 제공된 방법들 중 어느 하나의 몇몇 실시형태에서, 숙주 세포는 서열번호 14와 적어도 80%(예컨대, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100%) 동일성을 갖는 뉴클레오타이드 서열을 더 포함한다.
일 양상에서, 본 명세서에 기재된 서열들 중 어느 하나를 포함하는 핵산이 제공된다.
제공된 방법들 중 어느 하나의 몇몇 실시형태에서, 숙주 세포는 효모, 비(non)-스테비올 글리코사이드 생산 식물, 조류(alga), 진균 및 박테리아로 이루어진 군으로부터 선택된다.
제공된 방법들 중 어느 하나의 몇몇 실시형태에서, 숙주 세포는 에셰리키아(Escherichia); 살모넬라(Salmonella); 바실러스(Bacillus); 아시네토박터(Acinetobacter); 스트렙토마이세스(Streptomyces); 코리네박테리움(Corynebacterium); 메틸로시누스(Methylosinus); 메틸로모나스(Methylomonas); 로도코커스(Rhodococcus); 슈도모나스(Pseudomonas); 로도박터(Rhodobacter); 시네코시스티스(Synechocystis); 사카로마이세스(Saccharomyces); 자이고 사카로마이세스(ZygoSaccharomyces); 클루이베로마이세스(Kluyveromyces); 칸디다(Candida); 한세눌라(Hansenula); 데바리오마이세스(Debaryomyces); 무코르(Mucor); 피치아(Pichia); 토룰롭시스(Torulopsis); 아스페르길루스(Aspergillus); 아르트로보틀리스(Arthrobotlys); 브레비박테리아(Brevi박테리아); 마이크로박테륨(Microbacterium); 아르트로박터(Arthrobacter); 시트로박터(Citrobacter); 클렙시엘라(Klebsiella); 판토에아(Pantoea); 및 클로스트리듐(Clostridium)으로 이루어진 군으로부터 선택된다.
제공된 방법들 중 어느 하나의 몇몇 실시형태에서, 숙주 세포는 대두; 평지씨; 해바라기; 목화; 옥수수; 담배; 알팔파; 밀; 보리; 귀리; 수수; 쌀; 브로콜리; 콜리플라워(cauliflower); 양배추; 파스닙(parsnip); 멜론; 당근; 셀러리; 파슬리; 토마토; 감자; 딸기; 땅콩; 포도; 풀씨 작물(grass seed crops); 사탕무; 사탕수수; 콩; 완두콩; 호밀; 아마; 경재 나무; 연재 나무; 사료용 풀; 아라비돕시스 탈리아나; 쌀(오리자 사티바(Oryza sativa)); 호르데움 율가레(Hordeum yulgare); 지팽이풀(switchgrass)(파니쿰 비그라툼(Panicum vigratum)); 브라키포듐 종(Brachypodium spp.); 브라시카 종(Brassica spp.); 및 크람베 아비시니카(Crambe abyssinica)로 이루어진 군으로부터 선택된 식물로부터 단리된 세포이다.
제공된 방법들 중 어느 하나의 몇몇 실시형태에서, 숙주 세포는 박테리아 세포(예컨대, 이. 콜라이(E. coli) 세포)이다.
제공된 방법들 중 어느 하나의 몇몇 실시형태에서, 숙주 세포는 효모 세포(예컨대, 사카로마이세스 세레비시애(Saccharomyces cerevisiae) 세포)이다.
일 양상에서, 본 명세서에 기재된 숙주 세포 중 어느 하나가 제공된다.
제공된 방법들 중 어느 하나의 몇몇 실시형태에서, 기질은 UDP-글루코스이다. 제공된 방법들 중 어느 하나의 몇몇 실시형태에서, UDP-글리코스는 (예컨대, 수크로스 신타제를 이용해서 UDP 및 수크로스로부터) 동소에서 생성된다.
제공된 방법들 중 어느 하나의 몇몇 실시형태에서, 레바우디오사이드 A는 반응 혼합물에서 15 내지 50 g/ℓ(예컨대, 15 내지 50, 20 내지 50, 30 내지 50, 40 내지 50, 15 내지 40, 20 내지 40, 30 내지 40, 30 내지 50, 30 내지 40 또는 40 내지 50 g/ℓ)의 농도를 갖는다.
제공된 방법들 중 어느 하나의 몇몇 실시형태에서, 반응 혼합물은 35℃ 내지 45℃(예컨대, 35℃, 36℃, 37℃, 38℃, 39℃, 40℃, 41℃, 42℃, 43℃, 44℃ 또는 45℃)의 온도에서 6.5 내지 9.5(예컨대, 6.5, 7, 7.5, 8, 8.5, 9 또는 9.5)의 pH 범위를 갖는다.
제공된 방법들 중 어느 하나의 몇몇 실시형태에서, 방법은 (예컨대, 미세다공성 흡착 수지를 이용해서) 조질의 레바우디오사이드 I를 단리시키는 단계를 더 포함한다.
일 양상에서, 본 명세서에 기재된 레바우디오사이드 I 조성물 중 어느 하나를 포함하는 조성물이 제공된다.
제공된 방법들 중 어느 하나의 몇몇 실시형태에서, 본 명세서에 기재된 방법은 98% 초과(예컨대, 98%, 99%, 또는 99.9%)의 순도로 레바우디오사이드 I를 얻기 위하여 조질의 레바우디오사이드 I를 결정화시키는 단계를 더 포함한다.
본 개시내용의 양상은 L200A 돌연변이를 갖는 UGT76G1 효소의 돌연변이체(본 명세서에서 "LA 돌연변이체"라 명명됨)를 제공한다. L200A 돌연변이는 서열번호 9에 대한 것이다. 제공된 조성물 또는 방법 중 어느 하나의 몇몇 실시형태에서, LA 돌연변이체는 서열번호 1과 적어도 80%(예컨대, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100%) 동일성을 갖는 아미노산 서열을 포함하고, L200A 돌연변이를 포함한다. 제공된 조성물 또는 방법 중 어느 하나의 몇몇 실시형태에서, LA 돌연변이체는 서열번호 1의 아미노산 서열을 포함한다.
본 개시내용의 양상은 AtSUS1에 융합된 LA 돌연변이체의 융합 단백질을 제공한다. 제공된 조성물 또는 방법 중 어느 하나의 몇몇 실시형태에서, LA-AtSUS1 융합 단백질은 서열번호 13과 적어도 80%(예컨대, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100%) 동일성을 갖는 아미노산 서열을 포함한다. 제공된 조성물 또는 방법 중 어느 하나의 몇몇 실시형태에서, LA-AtSUS1 융합 단백질은 서열번호 13의 아미노산 서열을 포함한다.
일 양상에서, 본 명세서에 기재된 돌연변이체 또는 융합 단백질 중 어느 하나를 포함하는 조성물이 제공된다.
제품/상업적 유용성의 관점에서, 미국 내 시장에는 스테비올 글리코사이드를 함유하는 수십 여 제품이 존재하며, 식품뿐만 아니라 진통제에서부터 해충 퇴치제에 이르기까지 모든 것에서, 그리고 식이 보충물질로서 사용될 수 있다. 스테비올 글리코사이드를 함유하는 제품은 에어로졸, 액체, 겔 또는 과립 제형일 수 있고, 이러한 제품은 몇몇 실시형태에서 제공된다.
본 개시내용에는 다양한 변형 및 대안적인 형태가 적용되기 쉽지만, 이의 구체적인 실시형태는 도면에서 예로서 도시되고, 본 명세서에서 상세히 기재될 것이다. 그러나, 본 명세서에서 제시되는 도면 및 상세한 설명은 본 개시내용을 개시된 특정 실시형태로 제한하려는 것이 아니라, 반대로, 본 발명은 첨부된 청구범위에 의해 정의되는 바와 같은 본 개시내용의 정신과 범위 내에 들어가는 모든 변형, 등가물 및 대안을 커버하기 위한 것임이 이해되어야 한다.
본 발명의 다른 특징 및 이점은 본 발명의 실시형태의 이하의 상세한 설명에서 명백해질 것이다.
도 1은 레바우디오사이드 I("Reb I"), (C50H80O28), 13-[(2-O-β-D-글루코피라노실-3-O-β-D-글루코피라노실)-β-D-글루코피라노실)옥시]-엔트-카우르-16-엔-19오익산-(3-O-β-D-글루코피라노실)-β-D-글루코피라노실), 에스터의 화학 구조를 나타낸다.
도 2는 Reb A로부터의 Reb I의 생합성 경로를 나타낸다.
도 3은 6시간의 인큐베이션 후에 선택된 UGT에 의해 촉매된 Reb A로부터의 Reb I의 시험관내 생산을 나타낸다. 패널 A는 레바우디오사이드 A(Reb A) 및 레바우디오사이드 I(Reb I)의 표준을 나타낸다. 패널 B 내지 F는, 각각, UGT76G1(B), CP1(C), CP2(D), LA(E) 및 UGT76G1-AtSUS1 융합 효소(GS)(F)에 의해 Reb A로부터 효소에 의해 생산된 Reb I의 양을 나타낸다.
도 4는, UDP 및 수크로스의 첨가와 함께, UGT76G1, UGT76G1 및 AtSUS1이 둘 다 존재하는 커플링 시스템 및 UGT76G1-AtSUS1 융합 효소("GS")에 의해 촉매되는 Reb A로부터의 Reb I의 시험관내 생산을 나타낸다. 패널 A는 레바우디오사이드 I(Reb I) 및 레바우디오사이드 A(Reb A)의 표준을 나타낸다. 패널 B 내지 D는, 각각, UGT76G1(B), UGT76G1 및 AtSUS1이 존재하는 커플링 시스템(C), 및 UGT76G1-AtSUS1 융합 효소(GS)(D)에 의해 촉매되는 효소 반응에서 Reb A로부터 전환된 Reb I의 양을 나타낸다.
도 5는 레바우디오사이드 I의 주된 TOCSY 및 HMBC 상관관계를 나타낸다.
도 2는 Reb A로부터의 Reb I의 생합성 경로를 나타낸다.
도 3은 6시간의 인큐베이션 후에 선택된 UGT에 의해 촉매된 Reb A로부터의 Reb I의 시험관내 생산을 나타낸다. 패널 A는 레바우디오사이드 A(Reb A) 및 레바우디오사이드 I(Reb I)의 표준을 나타낸다. 패널 B 내지 F는, 각각, UGT76G1(B), CP1(C), CP2(D), LA(E) 및 UGT76G1-AtSUS1 융합 효소(GS)(F)에 의해 Reb A로부터 효소에 의해 생산된 Reb I의 양을 나타낸다.
도 4는, UDP 및 수크로스의 첨가와 함께, UGT76G1, UGT76G1 및 AtSUS1이 둘 다 존재하는 커플링 시스템 및 UGT76G1-AtSUS1 융합 효소("GS")에 의해 촉매되는 Reb A로부터의 Reb I의 시험관내 생산을 나타낸다. 패널 A는 레바우디오사이드 I(Reb I) 및 레바우디오사이드 A(Reb A)의 표준을 나타낸다. 패널 B 내지 D는, 각각, UGT76G1(B), UGT76G1 및 AtSUS1이 존재하는 커플링 시스템(C), 및 UGT76G1-AtSUS1 융합 효소(GS)(D)에 의해 촉매되는 효소 반응에서 Reb A로부터 전환된 Reb I의 양을 나타낸다.
도 5는 레바우디오사이드 I의 주된 TOCSY 및 HMBC 상관관계를 나타낸다.
스테비올 글리코사이드는 남아메리카 식물인 스테비아 레바우디아나(Stevia rebaudiana)(아스테라세애(Asteraceae)) 잎의 단맛을 담당하는 화학적 화합물의 한 부류이며, 식품, 사료 및 음료에서 감미제로서 사용될 수 있다.
정의:
세포계는 이소성 단백질의 발현을 제공하는 임의의 세포를 포함한다. 이것은, 선택된 유전자로 유전자 형질전환을 가능하게 하고 그 후 스테비올로부터 목적하는 스테비올 글리코사이드의 생산을 가능하게 하는, 박테리아, 효모, 식물 세포 및 동물 세포 또는 세포계를 포함한다. 이것은 원핵 세포와 진핵 세포를 둘 다 포함한다. 이것은 또한 세포 성분, 예컨대, 리보솜에 기반한 단백질의 시험관내 발현을 포함한다. 이. 콜라이는 본 명세서에서 제공되는 방법들 중 어느 일 실시형태에서 바람직한 미생물계이다.
코딩 서열은 당업자에게 일반적이고 통상적인 의미로 주어지며 비제한적으로 특정 아미노산 서열을 인코딩하는 DNA 서열을 지칭하기 위해 사용된다.
세포계의 성장. 성장은 세포가 증식하고 분열할 수 있도록 하는 적절한 배지의 제공을 포함한다. 또한, 세포 또는 세포 성분이 재조합 단백질을 번역하고 제조할 수 있도록 하는 자원의 제공을 포함한다.
단백질 발현. 단백질 생산은 유전자 발현 후에 일어난다. 이것은 DNA가 메신저 RNA(mRNA)로 전사된 후의 단계들로 이루어진다. 이어서 mRNA는 폴리펩타이드 사슬로 번역되고, 궁극적으로는 단백질로 접혀진다. DNA는 형질감염(transfection)(핵산을 세포에 의도적으로 도입하는 과정)을 통해서 세포에 존재한다. 이 용어는 종종 진핵 세포에서 비바이러스성 방법에 사용된다. 이것은 또한 다른 방법 및 세포 유형을 지칭할 수도 있지만, 다른 용어가 선호된다: "형질전환(transformation)"은 박테리아, 식물 세포를 포함하는 비-동물 진핵 세포에서의 비바이러스성 DNA 전달을 설명하기 위해 더 자주 사용된다. 형질전환은 이들 세포에서 암성 상태로의 진행(발암)을 나타내기 위해서도 사용되므로, 동물 세포에서는 형질감염(transfection)이 선호되는 용어이다. 형질도입(transduction)은 바이러스-매개 DNA 전달을 설명하기 위해 종종 사용된다. 형질전환, 형질도입 및 바이러스 감염이 본 출원에 있어서 형질감염의 정의 하에 포함된다.
효모. 본 발명에 따르면, 본 명세서에서 청구된 바와 같은 효모는 진균계 구성원으로서 분류되는 진핵, 단세포 미생물이다. 효모는 다세포 선조로부터 진화한 단세포 유기체이지만, 본 발명에 유용한 일부 종은 가성균사(pseudohyphae) 또는 위 균사(false hyphae)로 알려진 연결된 발아 세포의 줄을 형성함으로써 다세포 특징을 전개하는 능력을 갖는 것들이다.
본 개시내용에서 사용되는 UGT 효소의 명칭은 패밀리 번호, 서브패밀리를 표시하는 문자 및 개별 유전자 번호의 조합에 의해 UGT 유전자를 분류하는 UGT 명명 위원회에서 채택되는 명명 체계와 일치한다(Mackenzie et al., "The UDP glycosyltransferase gene super family: recommended nomenclature updated based on evolutionary divergence," Pharmacogenetics, 1997, vol. 7, pp. 255-269). 예를 들어, 명칭 "UGT76G1"은 UGT 패밀리 번호 76(식물 기원임), 서브패밀리 G 및 유전자 번호 1에 속하는 유전자에 의해 인코딩되는 UGT 효소를 지칭한다.
구조 용어:
본 명세서에서 사용되는 바와 같이, 단수 형태는, 내용이 명확히 달리 나타내지 않는 한, 복수의 지시대상을 포함한다.
용어 "포함된다", "갖는다" 등이 설명 또는 청구범위에서 사용되는 정도까지, 이러한 용어는 "포함한다"가 청구범위에서의 전환어로서 사용될 경우 해석되는 것처럼 용어 "포함한다"와 유사하게 포괄적인 것으로 의도된다.
단어 "예시적인"은 본 명세서에서 "실시예, 예 또는 예시로서 작용하는" 것을 의미하기 위해 사용된다. "예시적인" 것으로서 본 명세서에 기재된 임의의 실시형태가 반드시 다른 실시형태에 비해서 바람직하거나 유리한 것으로 간주되어야 하는 것은 아니다.
용어 "상보적인"은 당업자에게 통상적이고 관례적인 의미로 주어지며, 비제한적으로 서로 혼성화할 수 있는 뉴클레오타이드 염기 간 관계를 설명하기 위하여 사용된다. 예를 들어, DNA에 관하여, 아데노신은 티민과 상보적이고, 사이토신은 구아닌과 상보적이다. 따라서, 종속 기술은 실질적으로 유사한 핵산 서열뿐만 아니라 첨부된 서열목록에서 보고된 바와 같은 전체 서열과 상보적인 단리된 핵산 단편도 포함한다.
용어 "핵산" 및 "뉴클레오타이드"는 당업자에게 이의 각각의 통상적이고 관례적인 의미로 주어지며, 비제한적으로 단일쇄 또는 이중쇄 형태의 데옥시리보뉴클레오타이드 또는 리보뉴클레오타이드 및 이의 중합체를 지칭하기 위하여 사용된다. 구체적으로 제한되지 않는 한, 이 용어는 참조 핵산과 유사한 결합 특성을 가지며 천연 발생 뉴클레오타이드와 유사한 방식으로 대사되는 천연 뉴클레오타이드의 알려진 유사체를 함유하는 핵산을 포괄한다. 달리 나타내지 않는 한, 특정 핵산 서열은 명시적으로 나타낸 서열뿐만 아니라, 묵시적으로 보존적으로 변형된 서열 또는 이의 축퇴성 변이체(예컨대, 축퇴성 코돈 치환) 및 상보적인 서열 또한 포괄한다.
용어 "단리된"은 당업자에게 통상적이고 관례적인 의미로 주어지며, 단리된 핵산 또는 단리된 폴리펩타이드의 맥락에서 사용되는 경우, 비제한적으로 인간의 손에 의해, 그 원상태 환경으로부터 벗어나 존재하고 이에 따라 천연 산물이 아닌 핵산 또는 폴리펩타이드를 지칭하기 위하여 사용된다. 단리된 핵산 또는 폴리펩타이드는 정제된 형태로 존재할 수 있거나, 비-원상태 환경에서, 예컨대, 트랜스제닉 숙주 세포에서 존재할 수 있다.
본 명세서에서 사용되는 바와 같은 용어 "인큐베이션시키는" 및 "인큐베이션"은 2개 이상의 화학적 또는 생물학적 실체(예컨대, 화학적 화합물 및 효소)를 혼합하고, 이들이 스테비올 글리코사이드 조성물을 제조하기에 바람직한 조건 하에 상호작용하도록 두는 공정을 의미한다.
용어 "축퇴성 변이체"는 하나 이상의 축퇴성 코돈 치환에 의해 참조 핵산 서열과는 상이한 잔기 서열을 갖는 핵산서열을 지칭한다. 축퇴성 코돈 치환은 하나 이상의 선택된(또는 모든) 코돈의 제3 위치가 혼합된 염기 및/또는 데옥시 이노신 잔기로 치환되는 서열을 생성함으로써 달성될 수 있다. 핵산 서열 및 이의 모든 축퇴성 변이체는 동일한 아미노산 또는 폴리펩타이드를 발현할 것이다.
용어 "폴리펩타이드", "단백질" 및 "펩타이드"는 당업자에게 이의 각각의 통상적이고 관례적인 의미로 주어진다; 이러한 3개 용어는 때때로 호환 가능하게 사용되며, 그 크기 또는 기능과 무관하게 비제한적으로 아미노산 또는 아미노산 유사체의 중합체를 나타내기 위하여 사용된다. "단백질"은 종종 상대적으로 큰 폴리펩타이드를 나타내는 데 사용되며 "펩타이드"는 종종 작은 폴리펩타이드를 나타내는 데 사용되지만, 당업계에서 이들 용어의 사용은 중첩되며 변한다. 본 명세서에서 사용되는 바와 같은 용어 "폴리펩타이드"는, 달리 언급되지 않는 한, 펩타이드, 폴리펩타이드 및 단백질을 지칭한다. 용어 "단백질", "폴리펩타이드" 및 "펩타이드"는 폴리뉴클레오타이드 산물을 나타내는 경우 본 명세서에서 호환 가능하게 사용된다. 따라서, 예시적인 폴리펩타이드는 폴리뉴클레오타이드 산물, 천연 발생 단백질, 동족체, 오쏘로그, 파라로그, 단편 및 이의 다른 등가물, 변이체 및 유사체를 포함한다.
참조 폴리펩타이드에 대해 사용되는 경우, 용어 "폴리펩타이드 단편" 및 "단편"은 당업자에게 이의 통상적이고 관례적인 의미로 주어지며, 비제한적으로 아미노산 잔기가 참조 폴리펩타이드 자체에 비해 결실되지만, 잔여 아미노산 서열이 보통 참조 폴리펩타이드에서의 대응 위치와 동일한 폴리펩타이드를 나타내기 위하여 사용된다. 이러한 결실은 참조 폴리펩타이드의 아미노-말단 또는 카복시-말단 또는 대안적으로 둘 다에서 일어날 수 있다.
용어 폴리펩타이드 또는 단백질의 "기능적 단편"은 전장 폴리펩타이드 또는 단백질의 일부이며, 전장 폴리펩타이드 또는 단백질과 실질적으로 동일한 생물학적 활성을 갖거나 실질적으로 동일한 기능을 수행하는(예컨대, 동일한 효소 반응을 수행하는) 펩타이드 단편을 나타낸다.
호환 가능하게 사용되는 용어 "변이체 폴리펩타이드", "변형된 아미노산 서열" 또는 "변형된 폴리펩타이드"는 하나 이상의 아미노산에 의해, 예컨대, 하나 이상의 아미노산 치환, 결실 및/또는 부가에 의해 참조 폴리펩타이드와는 상이한 아미노산 서열을 나타낸다. 하나의 양상에서, 변이체는 참조 폴리펩타이드의 일부 또는 모든 능력을 보유하는 "기능적 변이체"이다.
용어 "기능적 변이체"는 보존적으로 치환된 변이체를 더 포함한다. 용어 "보존적으로 치환된 변이체"는 하나 이상의 보존적 아미노산 치환에 의해 참조 펩타이드와는 상이하며 참조 펩타이드의 일부 또는 모든 활성을 유지하는 아미노산 서열을 갖는 펩타이드를 나타낸다. "보존적 아미노산 치환"은 아미노산 잔기의 기능적으로 유사한 잔기로의 치환이다. 보존적 치환의 예는 하나의 비극성(소수성) 잔기, 예컨대, 아이소류신, 발린, 류신 또는 메티오닌의 또 다른 비극성(소수성) 잔기로의 치환; 하나의 하전된 또는 극성(친수성) 잔기의 또 다른 극성(친수성) 잔기, 예컨대, 아르기닌과 라이신 간, 글루타민과 아스파라긴 간, 트레오닌과 세린 간 치환; 하나의 염기성 잔기, 예컨대, 라이신 또는 아르기닌의 또 다른 염기성 잔기로의 치환; 또는 하나의 산성 잔기, 예컨대, 아스파르트산 또는 글루탐산의 또 다른 산성 잔기로의 치환; 또는 하나의 방향족 잔기, 예컨대, 페닐알라닌, 티로신 또는 트립토판의 또 다른 방향족 잔기로의 치환이 포함된다. 이러한 치환은 단백질 또는 폴리펩타이드의 겉보기 분자량 또는 등전점에 대한 효과를 거의 또는 전혀 갖지 않을 것으로 예상된다. 어구 "보존적으로 치환된 변이체"는, 생성 펩타이드가 본 명세서에 기재된 바와 같은 참조 펩타이드의 일부 또는 모든 활성을 유지하는 한, 잔기가 화학적으로 유도체화된 잔기로 대체되는 펩타이드를 또한 포함한다.
주제 기술의 폴리펩타이드에 관한 용어 "변이체"는, 참조 폴리펩타이드의 아미노산 서열과 적어도 75%, 적어도 76%, 적어도 77%, 적어도 78%, 적어도 79%, 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 및 심지어 100% 동일한 아미노산 서열을 가진 기능적으로 활성인 폴리펩타이드를 더 포함한다.
모든 문법적 형태 및 철자 변형에 있어서의 용어 "상동성(homologous)"은 수퍼 패밀리로부터의 폴리뉴클레오타이드 또는 폴리펩타이드 및 상이한 종으로부터의 상동성 폴리뉴클레오타이드 또는 단백질을 포함하는, "공통 진화 기원"을 보유하는 폴리뉴클레오타이드 또는 폴리펩타이드 간 관계를 나타낸다(Reeck et al., CELL 50:667, 1987). 이러한 폴리뉴클레오타이드 또는 폴리펩타이드는, 보존된 위치에서의 동일성 백분율 또는 특정 아미노산 또는 모티브의존재의 관점과 무관하게, 이의 서열 유사성으로 반영되는 서열 상동성을 갖는다. 예를 들어, 2개의 상동성 폴리펩타이드는 적어도 75%, 적어도 76%, 적어도 77%, 적어도 78%, 적어도 79%, 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 900 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 및 심지어 100% 동일한 아미노산 서열을 가질 수 있다.
"적합한 조절 서열"은 당업자에게 통상적이고 관례적인 의미로 주어지며, 비제한적으로 코딩 서열의 상류(5' 비-코딩 서열), 코딩 서열 내 또는 하류(3' 비-코딩 서열)에 위치하고 연관된 코딩 서열의 전사, RNA 가공 또는 안정성 또는 번역에 영향을 미치는 뉴클레오타이드 서열을 나타내기 위하여 사용된다. 조절 서열은 프로모터, 번역 리더 서열, 인트론 및 폴리아데닐화 인식 서열을 포함할 수 있다.
"프로모터"는 당업자에게 통상적이고 관례적인 의미로 주어지며 비제한적으로 코딩 서열 또는 기능적 RNA의 발현을 제어할 수 있는 DNA 서열을 나타내기 위하여 사용된다. 일반적으로, 코딩 서열은 프로모터 서열의 3'에 위치한다. 프로모터는 이의 전체가 원상태 유전자로부터 유래될 수 있거나, 자연에서 확인되는 상이한 프로모터로부터 유래되는 상이한 요소로 이루어질 수 있거나, 심지어 합성 DNA 절편을 포함할 수 있다. 당업자라면 상이한 프로모터가 상이한 조직 또는 세포 유형에서 또는 상이한 발달 단계에서 또는 상이한 환경 조건에 반응하여 유전자의 발현을 지시할 수 있음을 이해한다. 유전자가 대부분의 시기에 대부분의 세포 유형에서 발현되도록 유도하는 프로모터는 일반적으로 "구성적 프로모터"로 지칭된다. 대부분의 경우, 조절 서열의 정확한 경계가 완벽하게 정의되지 않았으므로, 상이한 길이의 DNA 단편이 동일한 프로모터 활성을 가질 수 있음이 추가로 인식된다.
용어 "작동 가능하게 연결된"은 하나의 기능이 다른 기능에 의해 영향받도록 하는 단일 핵산 단편 상에서의 핵산 서열의 회합을 나타낸다. 예를 들어, 프로모터는 이것이 해당 코딩 서열(즉, 프로모터의 전사 제어 하에 있는 코딩 서열)의 발현에 영향을 미칠 수 있는 경우 코딩 서열과 작동 가능하게 연결된 것이다. 코딩 서열은 센스 또는 안티센스 배향으로 조절 서열에 작동 가능하게 연결될 수 있다.
본 명세서에서 사용되는 바와 같은 용어 "발현"은, 당업자에게 통상적이고 관례적인 의미로 주어지며, 비제한적으로, 주제 기술의 핵산 단편으로부터 유래되는 센스(mRNA) 또는 안티센스 RNA의 전사 및 안정한 축적을 나타내기 위하여 사용된다. "과발현"은 정상 또는 형질전환되지 않은 유기체에서의 생산 수준을 초과하는 트랜스제닉 또는 재조합 유기체에서의 유전자 산물의 생산을 나타낸다.
"형질전환"은 당업자에게 통상적이고 관례적인 의미로 주어지며, 비제한적으로 표적 세포 내로의 폴리뉴클레오타이드의 전달을 지칭하기 위하여 사용된다. 전달된 폴리뉴클레오타이드는 표적 세포의 게놈 또는 염색체 DNA 내로 혼입되어, 유전적으로 안정한 유전을 야기할 수 있거나, 숙주 염색체와 무관하게 복제할 수 있다. 형질전환된 핵산 단편을 함유하는 숙주 유기체는 "트랜스제닉" 또는 "형질전환된"으로 지칭된다.
숙주 세포와 관련하여 본 명세서에서 사용되는 경우, 용어 "형질전환된", "트랜스제닉" 및 "재조합"은 당업자에게 이의 각각의 통상적이고 관례적인 의미로 주어지며, 비제한적으로 이종성 핵산 분자가 도입된 숙주 유기체의 세포, 예컨대, 식물 또는 미생물 세포를 지칭하기 위하여 사용된다. 핵산 분자는 숙주 세포의 게놈 내로 안정적으로 통합될 수 있거나, 또는 핵산 분자는 염색체외 분자로서 존재할 수 있다. 이러한 염색체외 분자는 자가-복제할 수 있다. 형질전환된 세포, 조직 또는 대상체는 형질전환 공정의 최종 산물뿐만 아니라, 이의 트랜스제닉 자손도 포괄하는 것으로 이해된다.
폴리뉴클레오타이드와 관련하여 본 명세서에서 사용되는 경우, 용어 "재조합", "이종성" 및 "외인성"은 당업자에게 이의 통상적이고 관례적인 의미로 주어지며, 비제한적으로 특정 숙주 세포에 대한 외래 출처에서 기인하는, 또는 동일한 출처로부터인 경우, 그 원래 형태로부터 변형된 폴리뉴클레오타이드(예컨대, DNA 서열 또는 유전자)를 지칭하기 위하여 사용된다. 따라서, 숙주 세포 내의 이종성 유전자는 특정 숙주 세포에 내인성이지만, 예를 들어, 부위-지정 돌연변이화 또는 다른 재조합 기법의 사용을 통해 변형된 유전자를 포함한다. 이 용어는 또한 천연 발생 DNA 서열의 여러 비-천연 발생 카피가 포함된다. 따라서, 이 용어는 세포에 대해 외래이거나 이종성인, 또는 세포와 상동성이지만 요소가 보통 확인되지 않는 숙주 세포 내의 위치에 있거나 형태인 DNA 절편을 나타낸다.
유사하게, 폴리펩타이드 또는 아미노산 서열에 관하여 본 명세서에서 사용되는 경우, 용어 "재조합", "이종성" 및 "외인성"은 특정 숙주 세포에 대해 외래 출처에서 기인하는, 또는 동일한 출처로부터인 경우, 그 원래 형태로부터 변형된 폴리펩타이드 또는 아미노산 서열을 의미한다. 따라서, 재조합 DNA 절편은 숙주 세포에서 발현되어 재조합 폴리펩타이드를 생산할 수 있다.
용어 "플라스미드", "벡터" 및 "카세트"는 당업자에게 이의 각각의 통상적이고 관례적인 의미로 주어지며, 비제한적으로 종종 세포의 중심 대사의 일부가 아닌 유전자를 운반하고 보통 원형 이중쇄 DNA 분자 형태인 염색체외 요소를 나타내기 위하여 사용된다. 이러한 요소는 임의의 출처로부터 유래되는, 단일 가닥 또는 이중 가닥 DNA 또는 RNA의 선형 또는 원형, 자가 복제 서열, 게놈 통합 서열, 파지 또는 뉴클레오타이드 서열일 수 있고, 여기서 다수의 뉴클레오타이드 서열이 세포 내로 적절한 3' 미번역 서열을 따라 프로모터 단편 및 선택된 유전자 산물에 대한 DNA 서열을 도입할 수 있는 고유한 구성으로 연결되거나 재조합되었다. "형질전환 카세트"는 외래 유전자를 함유하며 특정 숙주 세포의 형질전환을 촉진하는 외래 유전자에 부가하는 요소를 갖는 특정 벡터를 지칭한다. "발현 카세트"는 외래 유전자를 함유하며 외래 숙주에서 그 유전자의 발현 증강을 허용하는 외래 유전자에 부가하는 요소를 갖는 특정 벡터를 지칭한다.
본 발명은, UGT 효소를 사용하는 것으로부터 그 전환을 허용하는 관심 스테비올 글리코사이드인 Reb I의 생산에 관한 것이다. 주제 기술은 스테비올 글리코사이드를 합성하기 위한 UDP 글리코실트랜스퍼라제 활성, 예컨대, 1,3-19-O-글루코스 글리코실화 활성 및 1,3-13-O-글루코스 글리코실화 활성을 갖는 재조합 폴리펩타이드를 제공한다. 주제 기술의 재조합 폴리펩타이드는 스테비올 글리코사이드 화합물의 생합성에 유용하다. 본 개시내용에서, UDP-글리코실트랜스퍼라제(UGT)는 활성화된 공여체 분자(전형적으로 UDP-글루코스)로부터 수용체 분자로 당 잔기를 전달하는 효소를 지칭한다. 1,3-19-O-글루코스 글리코실화 활성은 레바우디오사이드 A의 19-O 글루코스 모이어티의 C-3'로 당 모이어티를 전달하여 레바우디오사이드 I(Reb I)을 생산하는 효소 활성을 지칭한다(도 1).
합성 생물학
본 명세서에서 사용되는 표준 재조합 DNA 및 분자 클로닝 기법은 당분야에 널리 알려져 있으며, 예를 들어, 문헌[Sambrook, J., Fritsch, E. F. and Maniatis, T. MOLECULAR CLONING: A LABORATORY MANUAL, 2nd ed.; Cold Spring Harbor Laboratory: Cold Spring Harbor, N.Y., 1989 (이후 "Maniatis"); 및 Silhavy, T. J., Bennan, M. L. and Enquist, L. W. EXPERIMENTS WITH GENE FUSIONS; Cold Spring Harbor Laboratory: Cold Spring Harbor, N.Y., 1984; 및 Ausubel, F. M. et al., IN CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, published by Greene Publishing and Wiley-Interscience, 1987; (각각의 전문이 본 명세서에 참조에 의해 원용됨)]에 기재되어 있다.
달리 정의되지 않는 한, 본 명세서에서 사용되는 모든 기술 및 과학 용어는 본 개시내용이 속하는 분야의 당업자가 통상적으로 이해하는 바와 동일한 의미를 갖는다. 본 명세서에 기재된 것과 유사하거나 동등한 임의의 방법 및 물질이 본 개시내용의 실시 또는 시험에서 사용될 수 있지만, 바람직한 물질 및 방법이 아래에 기재된다.
본 개시내용은 이하의 비제한적 실시예의 고려 시 보다 완전히 이해될 것이다. 이들 실시예는 주제 기술의 바람직한 실시형태를 시사하지만, 단지 예시로서 부여되는 것이 이해되어야 한다. 상기 논의 및 이러한 실시예로부터, 당업자라면 주제 기술의 본질적 특징을 확인할 수 있고, 이의 정신 및 범위에서 벗어나지 않고 다양한 용도 및 조건에 맞게 주제 기술을 다양하게 변화 및 변형시킬 수 있다.
글리코실화는 종종 생활성 및 식물 천연 산물의 저장을 제어하는 도처에서 일어나는 반응으로 간주된다. 소분자의 글리코실화는 지금까지 연구된 대부분의 식물 종에서 트랜스퍼라제의 수퍼패밀리에 의해 촉매된다. 이들 글리코실트랜스퍼라제(GT)는 60개를 초과하는 패밀리로 분류되었다. 이들 중에서, UDP 글리코실트랜스퍼라제(UGT)로도 알려진 패밀리 1 GT 효소는 UDP-활성화된 당 모이어티를 특정 수용체 분자로 전달한다. 이들은 스테비올 글리코사이드에서 이러한 당 모이어티를 전달하여 다양한 레바우디오사이드를 생성하는 분자이다. 각각의 이러한 UGT는 이의 고유한 활성 프로필 및 이들이 이의 활성화된 당 모이어티를 전달하는 선호되는 구조 위치를 갖는다.
생산 시스템
원핵생물에서 단백질의 발현은 가장 흔하게는 융합 또는 비-융합 단백질의 발현을 지시하는 구성적 또는 유도성 프로모터를 함유하는 벡터로 박테리아 숙주 세포에서 수행된다. 융합 벡터는 보통 재조합 단백질의 아미노 말단에, 여기에서 인코딩되는 단백질에 여러 아미노산을 부가한다. 이러한 융합 벡터는 전형적으로 1) 재조합 단백질의 발현을 증가시키고; 2) 재조합 단백질의 용해도를 증가시키고; 3) 친화도 정제에서 리간드로서 작용하여 재조합 단백질의 정제를 보조하는 3가지 목적을 위해 작용한다. 종종, 단백분해 절단 부위가 융합 모이어티 및 재조합 단백질의 접합부에 도입되어 융합 단백질의 정제 이후 융합 모이어티로부터 재조합 단백질의 분리를 가능하게 한다. 이러한 벡터는 본 개시내용의 범위 내에 있다.
일 실시형태에서, 발현 벡터는 박테리아 세포에서 재조합 폴리펩타이드의 발현을 위한 유전적 요소를 포함한다. 박테리아 세포에서 전사 및 번역을 위한 요소는 프로모터, 단백질 복합체에 대한 코딩 영역 및 전사 종결자를 포함할 수 있다.
당업자라면 발현 벡터의 제조를 위해 이용 가능한 분자 생물학 기법을 인지할 것이다. 위에서 기재된 바와 같이, 주제 기술의 발현 벡터 내로의 혼입을 위해 사용되는 폴리뉴클레오타이드는, 일상적 기법, 예컨대, 중합효소 연쇄 반응(PCR)에 의해 제조될 수 있다.
상보적 돌출 말단(complementary cohesive terminal)을 통해 DNA를 벡터에 작동 가능하게 연결하기 위해 여러 분자 생물학 기술이 개발되었다. 일 실시형태에서, 상보적 동종중합체 관이 벡터 DNA 내로 삽입될 핵산 분자에 첨가될 수 있다. 이어서, 벡터와 핵산 분자는 상보적 동종중합체 꼬리 사이의 수소 결합에 의해 연결되어 재조합 DNA 분자를 형성한다.
대안적인 실시형태에서, 하나 이상의 제한 부위를 함유하는 합성 링커는 대상 기술의 폴리뉴클레오타이드를 발현 벡터에 작동 가능하게 연결하기 위하여 사용된다. 일 실시형태에서, 폴리뉴클레오타이드는 제한 엔도뉴클레아제 소화에 의해 생성된다. 일 실시형태에서, 핵산 분자는, 3'-5'-엑소뉴클레오라이틱 활성을 갖는 돌출된 3'-단일-가닥 말단을 제거하고 중합 활성을 갖는 오목한 3'-말단에 채우는 효소인 박테리오파지 T4 DNA 중합효소 또는 이. 콜라이 DNA 중합효소 I로 처리됨으로써, 평활말단(blunt-ended) DNA 분절을 생성한다. 이어서, 평활말단 분절을 평활말단 DNA 분자의 결찰을 촉매할 수 있는 효소, 예컨대, 박테리오파지 T4 DNA 리가제의 존재 하에 몰 과량의 링커 분자와 인큐베이션한다. 따라서, 반응 산물은 그의 말단에 중합체성 링커 서열을 보유하는 폴리뉴클레오타이드이다. 이어서, 이러한 폴리뉴클레오타이드를 적절한 제한 효소로 절단하고, 폴리뉴클레오타이드의 것과 양립 가능한 말단을 생성하는 효소로 절단된 발현 벡터에 결찰시킨다.
대안적으로, 결찰-무관 클로닝(ligation-independent cloning: LIC) 부위를 갖는 벡터가 이용될 수 있다. 이어서 요구되는 PCR 증폭 폴리뉴클레오타이드가 제한효소 소화 또는 결찰 없이 LIC 벡터 내로 클로닝될 수 있다(본 명세서와 일치하는 정도까지 본 명세서에 참조에 의해 원용되는, 문헌[Aslanidis and de Jong, NUCL. ACID. RES. 18 6069-74, (1990), Haun, et al, BIOTECHNIQUES 13, 515-18 (1992)]).
일 실시형태에서, 선택된 플라스미드 내로의 삽입을 위해 관심 폴리뉴클레오타이드를 단리시키고/시키거나 변형시키기 위해, PCR을 사용하는 것이 적합하다. 핵산 분자의 요구되는 코딩 영역을 단리시키고, 제한효소 엔도뉴클레아제 또는 LIC 부위를 부가하고, 목적하는 해독틀에 코딩 영역을 배치하기 위해 서열의 PCR 제조에서 사용하기 위해 적절한 프라이머가 설계될 수 있다.
일 실시형태에서, 주제 기술의 발현 벡터 내로의 혼입을 위한 폴리뉴클레오타이드는 적절한 올리고뉴클레오타이드 프라이머를 사용하는 PCR을 이용하여 제조된다. 프라이머 자체가 증폭된 서열 산물 내로 혼입되는 동안 코딩 영역이 증폭된다. 일 실시형태에서, 증폭 프라이머는 제한효소 엔도뉴클레아제 인식 부위를 함유하며, 이는 증폭된 서열 산물이 적절한 벡터 내로 클로닝될 수 있도록 한다.
발현 벡터는 통상적인 형질전환 또는 형질감염 기법에 의해 식물 또는 미생물 숙주 세포 내로 도입될 수 있다. 주제 기술의 발현 벡터로의 적절한 세포의 형질전환은 당분야에 알려진 방법에 의해 달성되며 전형적으로 벡터 및 세포 유형 모두에 의존한다. 적합한 기법은 인산칼슘 또는 염화칼슘 공침, DEAE-덱스트란 매개 형질감염, 리포펙션, 화학천공 또는 전기천공을 포함한다.
성공적으로 형질전환된 세포, 즉, 발현 벡터를 함유하는 세포는 당분야에 널리 알려진 기법에 의해 확인될 수 있다. 예를 들어, 주제 기술의 발현 벡터로 형질감염된 세포를 배양하여 본 명세서에 기재된 폴리펩타이드를 제조할 수 있다. 세포는 당분야에 널리 알려진 기법에 의해 발현 벡터 DNA의 존재에 대해 조사될 수 있다.
숙주 세포는 이전에 기재된 발현 벡터의 단일 카피 또는 대안적으로 발현 벡터의 복수 카피를 함유할 수 있다.
몇몇 실시형태에서, 형질전환된 세포는 동물 세포, 곤충 세포, 식물 세포, 조류 세포, 진균 세포 또는 효모 세포이다. 몇몇 실시형태에서, 세포는 유채 식물 세포, 평지씨 식물 세포, 야자 식물 세포, 해바라기 식물 세포, 목화 식물 세포, 옥수수 식물 세포, 땅콩 식물 세포, 아마 식물 세포, 참깨 식물 세포, 대두 식물 세포 및 페튜니아 식물 세포로 이루어진 군으로부터 선택되는 식물 세포이다.
외래 단백질의 고수준 발현을 지시하는 조절 서열을 함유하는 미생물 숙주 세포 발현 시스템 및 발현 벡터는 당업자에게 널리 알려져 있다. 이들 중 임의의 것이 미생물 숙주 세포에서 주제 기술의 재조합 폴리펩타이드의 발현을 위한 벡터를 구축하기 위해 사용될 수 있다. 이어서 이들 벡터는 주제 기술의 재조합 폴리펩타이드의 고수준 발현을 허용하기 위해 형질전환을 통해 적절한 미생물 내로 도입될 수 있다.
적합한 미생물 숙주 세포의 형질전환에 유용한 벡터 또는 카세트는 당분야에 널리 알려져 있다. 전형적으로 벡터 또는 카세트는 관련 폴리뉴클레오타이드의 전사 및 번역을 지시하는 서열, 선별 마커 및 자가 복제 또는 염색체 통합을 허용하는 서열을 함유한다. 적합한 벡터는 전사 개시 제어부를 보유하는 폴리뉴클레오타이드의 5' 영역 및 전사 종결을 제어하는 DNA 단편의 3' 영역을 포함한다. 이러한 제어 영역이 숙주로서 선택된 특정 종에 대해 원상태인 유전자로부터 유래될 필요가 없음이 이해되지만, 두 제어 영역이 모두 형질전환된 숙주 세포와 상동성인 유전자로부터 유래되는 것이 바람직하다.
목적하는 미생물 숙주 세포에서 재조합 폴리펩타이드의 발현을 유도하는데 유용한 개시 제어 영역 또는 프로모터는 다수이고 당업자에게 친숙하다. CYCI, HIS3, GALI, GALIO, ADHI, PGK, PH05, GAPDH, ADCI, TRPI, URA3, LEU2, ENO, TPI(사카로마이세스에서의 발현에 유용함); AOXI(피치아에서의 발현에 유용함); 및 lac, trp, JPL, IPR, T7, tac 및 trc(에셰리키아 콜라이에서의 발현에 유용함)를 포함하지만, 이들로 제한되지 않는, 이들 유전자를 유도할 수 있는 실질적으로 모든 프로모터가 주제 기술을 위해 적합하다.
종결 제어 영역은 또한 미생물 숙주에 대해 원상태인 다양한 유전자로부터 유래될 수 있다. 본 명세서에 기재된 미생물 숙주를 위해 종결 부위가 선택적으로 포함될 수 있다.
식물 세포에서, 주제 기술의 발현 벡터는 요망되는 발생 단계에 요망되는 조직에서 주제 기술의 재조합 폴리펩타이드의 발현을 지시할 수 있는 프로모터에 작동 가능하게 연결된 코딩 영역을 포함할 수 있다. 편의상 이유로, 발현될 폴리뉴클레오타이드는 동일한 폴리뉴클레오타이드로부터 유래된 번역 리더 서열 및 프로모터 서열을 포함할 수 있다. 전사 종결 신호를 인코딩하는 3' 비-코딩 서열이 또한 존재할 것이다. 발현 벡터는 폴리뉴클레오타이드 발현을 촉진하기 위해 하나 이상의 인트론을 또한 포함할 수 있다.
식물 숙주 세포에 있어서, 코딩 영역의 발현을 유도할 수 있는 임의의 프로모터 및 임의의 종결인자의 임의의 조합이 주제 기술의 벡터 서열에서 사용될 수 있다. 프로모터 및 종결인자의 일부 적합한 예는 노팔린 신타제(nos), 옥토핀 신타제(ocs) 및 컬리플라워 모자이크 바이러스(CaMV) 유전자로부터의 것들을 포함한다. 사용될 수 있는 효율적인 식물 프로모터의 하나의 유형은 고수준 식물 프로모터이다. 주제 기술의 발현 벡터와 작동 가능하게 연결된 이러한 프로모터는 벡터의 발현을 촉진할 수 있을 것이다. 주제 기술에서 사용될 수 있는 고수준 식물 프로모터는, 예를 들어, 대두로부터의 리불로스-1,5-비스포스페이트 카복실라제의 소형 서브유닛(들)의 프로모터(이것이 본 명세서와 일치하는 정도까지 그 전문이 본 명세서에 원용되는, 문헌[Berry-Lowe et al., J. MOLECULAR AND APP. GEN., 1:483 498 (1982)]) 및 엽록소 결합 단백질의 프로모터를 포함한다. 이들 두 프로모터는 식물 세포에서 광-유도되는 것으로 알려져 있다(예를 들어, 이들이 본 명세서와 일치하는 정도까지 각각이 본 명세서에 참조로 포함되는, 문헌[GENETIC ENGINEERING OF PLANTS, AN AGRICULTURAL PERSPECTIVE, A. Cashmore, Plenum, N.Y. (1983), pages 29 38; Coruzzi, G. et al., The Journal of Biological CHEMISTRY, 258: 1399(1983) 및 Dunsmuir, P. et al., JOURNAL OF MOLECULAR AND APPLIED GENETICS, 2:285(1983)] 참고).
Reb I에 대한 전구체 합성
전술한 바와 같이, 스테비올 글리코사이드는 남아메리카 식물인 스테비아 레바우디아나(아스테라세애) 잎 및 식물 루부스 칭기이(Rubus chingii(로사세애(Rosaceae)))에서 단맛을 담당하는 화학적 화합물이다. 이들 화합물은 글리코실화된 다이터펜이다. 특히, 이들의 분자는 하이드록실 수소 원자가 글루코스 분자에 의해 대체되어 에스터를 형성하고 하이드록실 수소가 글루코스와 람노스 조합으로 아세탈을 형성하는, 스테비올 분자로 간주될 수 있다.
본 발명의 관심 화합물을 제조하는 하나의 방법은 보편적인 또는 저렴한 전구체, 예컨대, 화학적으로 유도되거나 조작된 미생물, 예컨대, 박테리아 및/또는 효모에서 생합성을 통해 제조되는 스테비올 또는 루보소사이드를 취하여, 알려져 있거나 저렴한 방법을 통해 표적화된 스테비올 글리코사이드, 예컨대, Reb I를 합성하는 것이다.
본 발명의 양상은 스테비올을 제조할 수 있는 미생물 시스템에서 효소를 재조합적으로 발현하는 것을 수반하는 방법에 관한 것이다. 일반적으로, 이러한 효소는 코팔릴 다이포스페이트 신타제(CPS), 카우렌 신타제(KS) 및 게라닐게라닐 다이포스페이트 신타제(GGPPS) 효소를 포함될 수 있다. 이는 내인성 이소프레노이드 합성 경로, 예컨대, 비-메발로네이트(MEP) 경로 또는 메발론산 경로(MVA)를 발현하는 미생물 균주에서 일어난다. 몇몇 실시형태에서, 세포는 이. 콜라이를 포함하는 박테리아 세포 또는 효모 세포, 예컨대, 사카로마이세스 세포, 피치아 세포 또는 야로위아(Yarrowia) 세포이다. 몇몇 실시형태에서, 세포는 조류 세포 또는 식물 세포이다.
이후, 전구체는 화학적 합성에서의 사용을 위해 발효 배양액으로부터 회수된다. 전형적으로, 이는 스테비올이지만, 세포 배양액으로부터의 카우렌 또는 스테비올 글리코사이드일 수 있다. 몇몇 실시형태에서, 스테비올, 카우렌 및/또는 스테비올 글리코사이드는 기상으로부터 회수되는 반면, 다른 실시형태에서는 유기층 또는 중합체 수지가 세포 배양액에 첨가되고, 카우렌, 스테비올 및/또는 스테비올 글리코사이드가 유기층 또는 중합체 수지로부터 회수된다. 몇몇 실시형태에서, 스테비올 글리코사이드는 레바우디오사이드 A, 레바우디오사이드 B, 레바우디오사이드 C, 레바우디오사이드 D, 레바우디오사이드 E, 레바우디오사이드 I 또는 둘코사이드 A로부터 선택된다. 몇몇 실시형태에서, 제조되는 터페노이드는 스테비오바이오사이드 또는 스테비오사이드이다. 몇몇 실시형태에서, 적어도 하나의 효소적 단계, 예컨대, 하나 이상의 글리코실화 단계가 생체외 수행됨이 또한 이해되어야 한다.
본 발명의 일부는 이후 Reb I로의 추가적인 효소적 전환을 거치는 스테비올 글리코사이드의 생산이다. 본 발명에 따르면, 미생물에 의해 제조된 스테비올을 목적하는 스테비올 글리코사이드(여기서는 Reb I)로 전환하기 위한 생합성은, 다이터페노이드 스테비올이 당 모이어티의 스테비올 골격으로의 다단계 화학 조립을 사용해서 루부소사이드 및 스테비오사이드로 전환되는 경우 일어난다. 몇몇 실시형태에서, Reb A의 Reb I로의 전환을 위한 생합성은 글루코실트랜스퍼라제 활성을 갖는 재조합 폴리펩타이드의 존재 하에 Reb A를 글루코스 공여체 모이어티와 반응시킴으로써 일어난다. 몇몇 실시형태에서, 글루코스 공여체 모이어티는 동소에서 생성된다. 몇몇 실시형태에서, 글루코스 공여체 모이어티가 반응에 첨가된다. 예를 들어, 몇몇 실시형태에서, UGT76G1(서열번호 10)로 식별된 효소는 Reb A를 Reb I로 전환시킬 수 있다. 몇몇 실시형태에서, 서열번호 9에 대해서 돌연변이 L200A를 포함하는 UGT76G1 돌연변이체(본 명세서에서 "LA 돌연변이체"라 지칭됨, 서열번호 1의 아미노산 서열을 갖는 돌연변이체)는 Reb A를 Reb I로 전환시킬 수 있다. 본 명세서에서 LA 돌연변이체는 Reb A를 Reb I로 전환시킬 때 증가된 활성을 갖는 것이 입증되었다.
스테비올 글리코사이드의 생합성
본 명세서에 기재된 바와 같이, 본 발명의 기술의 재조합 폴리펩타이드는 UDP-글리코실트랜스퍼라제 활성을 가지며, 천연 출처에 존재하지 않거나 전형적으로 풍부도가 낮은 스테비올 글리코사이드, 예컨대, 레바우디오사이드 I 및 레바우디오사이드 M 각각의 생합성 제조 방법의 개발에 유용하다. 본 발명의 기술의 재조합 폴리펩타이드는 UDP-글리코실트랜스퍼라제 활성을 가지며, 신규한 스테비올 글리코사이드, 예컨대, 레바우디오사이드 I를 생산하고 레바우디오사이드 M의 합성 생산에 도달하는 생합성 방법을 개발하는데 유용하다.
기질은 하나 이상의 UDP 글리코실트랜스퍼라제에 의해 촉매되는 반응에서 스테비올 글리코사이드 화합물로 전환될 수 있는 임의의 천연 또는 합성 화합물일 수 있다. 예를 들어, 기질은 천연 스테비아 추출물, 스테비올, 스테비올-13-O-글루코사이드, 스테비올-19-O-글루코사이드, 스테비올-1,2-바이오사이드, 루부소사이드, 스테비오사이드, 레바우디오사이드 A, 레바우디오사이드 G 또는 레바우디오사이드 E일 수 있다. 기질은 순수한 화합물 또는 상이한 화합물의 혼합물일 수 있다. 바람직하게는, 기질은 루부소사이드, 스테비오사이드, 스테비올, 레바우디오사이드 A, 레바우디오사이드 E 및 이들의 조합으로 이루어진 군으로부터 선택되는 화합물을 포함한다.
본 명세서에 기재된 방법은 또한 본 명세서에 기재된 제조합 펩타이드가 스테비올 글리코사이드 화합물의 전반적 생합성의 효율을 개선시키거나 결과를 변형시키기 위해 하나 이상의 추가의 효소와 조합되어 기능할 수 있도록 하는 커플링 반응계를 제공한다. 예를 들어, 추가의 효소는 글리코실화 반응으로부터 생성된 UDP를 다시 UDP-글루코스로 (예를 들어, 글루코스 잔기의 공여체로서 수크로스를 사용하여) 전환시켜 글리코실화 반응에 필요한 UDP-글루코스를 재생시킬 수 있고, 이에 따라 글리코실화 반응의 효율을 개선시킨다.
또 다른 실시형태에서, 주제 기술의 방법은 재조합 UDP-글리코실트랜스퍼라제를 본 명세서에 기재된 재조합 수크로스 신타제, 기질 및 재조합 폴리펩타이드와 인큐베이션하는 단계를 더 포함한다. 재조합 UDP-글리코실트랜스퍼라제는 주제 기술의 재조합 폴리펩타이드에 의해 촉매되는 것과는 상이한 글리코실화 반응을 촉매할 수 있다.
적합한 UDP-글리코실트랜스퍼라제는 스테비올 글리코사이드 화합물, 예컨대, UGT85C2, UGT74G1, UGT76G1 또는 이의 기능적 동족체의 생합성에서 하나 이상의 반응을 촉매할 수 있는 당분야에 알려진 임의의 UGT를 포함한다.
전형적으로, 주제 기술의 시험관내 방법에서, UDP 또는 UDP-글루코스는 완충액에 약 0.2mM 내지 약 5mM, 바람직하게는 약 0.5mM 내지 약 2mM, 보다 바람직하게는 약 0.7mM 내지 약 1.5mM의 농도로 포함된다. 일 실시형태에서, 재조합 수크로스 신타제가 반응에 포함되는 경우, 수크로스는 또한 완충액에 약 100mM 내지 약 500mM, 바람직하게는 약 200mM 내지 약 400mM, 보다 바람직하게는 약 250mM 내지 약 350mM의 농도로 포함된다. 몇몇 실시형태에서, 주제 기술의 시험관내 방법에서, 건조 중량 기준으로, 재조합 폴리펩타이드 대 기질의 중량 비는 약 1:100 내지 약 1:5, 바람직하게는 약 1:50 내지 약 1:10, 보다 바람직하게는 약 1:25 내지 약 1:15이다.
몇몇 실시형태에서, 시험관내 방법의 반응 온도는 약 20℃ 내지 약 40℃, 적합하게는 25℃ 내지 약 37℃, 보다 적합하게는 28℃ 내지 약 32℃이다.
당업자라면 본 명세서에 기재된 방법에 의해 제조되는 스테비올 글리코사이드 조성물이 목적하는 풍미제 또는 감미제 조성물을 얻기 위해 추가로 정제되고 다른 스테비올 글리코사이드, 풍미제 또는 감미제와 혼합될 수 있음을 인식할 것이다. 예를 들어, 본 명세서에 기재된 바와 같이 제조되는 레바우디오사이드 M 또는 Reb I가 풍부한 조성물은 레바우디오사이드 A를 우세한 스테비올 글리코사이드로서 함유하는 천연 스테비아 추출물과, 또는 목적하는 감미제 조성물을 제조하기 위해 다른 합성 또는 천연 스테비올 글리코사이드 제품과 혼합될 수 있다. 대안적으로, 본 명세서에 기재된 스테비올 글리코사이드 조성물로부터 얻어지는 실질적으로 정제된 스테비올 글리코사이드(예컨대, 레바우디오사이드 I)는 다른 감미제, 예컨대, 수크로스, 말토덱스트린, 아스파탐, 수크랄로스, 네오탐, 아세설팜 칼륨 및 사카린과 조합될 수 있다. 다른 감미제 대비 스테비올 글리코사이드의 양은 당분야에 알려진 바와 같이, 요망되는 맛을 얻기 위해 조정될 수 있다. 본 명세서에 기재된 스테비올 글리코사이드 조성물(레바우디오사이드 D, 레바우디오사이드 A, 레바우디오사이드 I, 레바우디오사이드 M 또는 이들의 조합을 포함함)은 식품 제품(예컨대, 음료, 소프트 드링크, 아이스크림, 유제품, 과자류, 시리얼, 츄잉 검, 베이킹 제품 등), 식이 보충물질, 의학적 영양분뿐만 아니라 약학 제품에 포함될 수 있다.
당업자라면 본 명세서에 기재된 방법에 의해 제조되는 스테비올 글리코사이드 조성물이 목적하는 풍미제 또는 감미제 조성물을 얻기 위해 더 정제되고 다른 스테비올 글리코사이드, 풍미제 또는 감미제와 혼합될 수 있음을 인식할 것이다. 예를 들어, 본 명세서에 기재된 바와 같이 제조된 레바우디오사이드 I가 풍부한 조성물은 레바우디오사이드 A를 우세한 스테비올 글리코사이드로서 함유하는 천연 스테비아 추출물과, 또는 목적하는 감미제 조성물을 제조하기 위해 다른 합성 또는 천연 스테비올 글리코사이드 제품과 혼합될 수 있다. 대안적으로, 본 명세서에 기재된 스테비올 글리코사이드 조성물로부터 얻어지는 실질적으로 정제된 스테비올 글리코사이드(예컨대, 레바우디오사이드 I)는 다른 감미제, 예컨대, 수크로스, 말토덱스트린, 아스파탐, 수크랄로스, 네오탐, 아세설팜 칼륨 및 사카린과 조합될 수 있다. 다른 감미제 대비 스테비올 글리코사이드의 양은 당분야에 알려진 바와 같이, 목적하는 맛을 얻기 위해 조정될 수 있다. 본 명세서에 기재된 스테비올 글리코사이드 조성물(레바우디오사이드 D, 레바우디오사이드 A, 레바우디오사이드 I, 레바우디오사이드 M 또는 이들의 조합을 포함함)은 식품 제품(예컨대, 음료, 소프트 드링크, 아이스크림, 유제품, 과자류, 시리얼, 츄잉 검, 베이킹 제품 등), 식이 보충물질, 의학적 영양분뿐만 아니라 약제학적 제품에 포함될 수 있다.
동일성 스코어링을 사용하는 서열 유사성 분석
본 명세서에서 사용되는 바와 같이, "서열 동일성"은 2개의 최적으로 정렬된 폴리뉴클레오타이드 또는 펩타이드 서열이 성분, 예컨대, 뉴클레오타이드 또는 아미노산의 정렬창에 걸쳐 변함없는 정도를 지칭한다. 시험 서열 및 참조 서열의 정렬된 절편에 대한 "동일성 분율"은, 2개의 정렬된 서열이 공유하는 동일한 성분의 수를, 참조 서열 절편에서 성분의 총 수, 즉, 전체 참조 서열 또는 참조 서열의 더 작은 정의된 부분으로 나눈 것이다.
본 명세서에서 사용되는 바와 같이, 용어 "퍼센트 서열 동일성" 또는 "퍼센트 동일성"은, 두 서열이 (비교창에 비해서 참조 서열의 총 20 퍼센트 미만의 적절한 뉴클레오타이드 삽입, 결실 또는 갭으로) 최적으로 정렬된 때에 시험("대상") 폴리뉴클레오타이드 분자(또는 이의 상보적 가닥)과 비교해서 참조("예시") 폴리뉴클레오타이드 분자(또는 이의 상보적 가닥)의 선형 폴리뉴클레오타이드 서열 내의 동일한 뉴클레오타이드의 백분율을 지칭한다. 비교창을 정렬시키기 위한 서열의 최적 정렬은 당업자에게 잘 알려져 있고, Smith 및 Waterman의 국소 상동성 알고리즘, Needleman 및 Wunsch의 상동성 정렬 알고리즘, Pearson 및 Lipman의 유사성 방법에 대한 검색에 의해, 그리고 바람직하게는 GCG® Wisconsin Package®(Accelrys Inc., 매사추세츠주 버링턴 소재)의 부분으로서 입수 가능한 GAP, BESTFIT, FASTA 및 TFASTA와 같은 이들 알고리즘의 컴퓨터화된 구현에 의해 수행될 수 있다. 시험 서열 및 참조 서열의 정렬된 분절에 대한 "동일성 분율"은 2개의 정렬된 서열에 공유되는 동일한 성분의 수를 참조 서열 분절 내의 성분의 총수, 즉, 전체 참조 서열 또는 참조 서열의 보다 작게 정의된 부분으로 나눈 것이다. 퍼센트 서열 동일성은 동일성 분율에 100을 곱한 것으로 나타낸다. 1개 이상의 폴리뉴클레오타이드 서열의 비교는 전장 폴리뉴클레오타이드 서열 또는 이의 부분에 대해서, 또는 보다 긴 폴리뉴클레오타이드 서열에 대해서 행해질 수 있다. 본 발명의 목적을 위하여, "퍼센트 동일성"은 또한 번역된 뉴클레오타이드 서열의 경우 BLASTX 버전 2.0을 이용해서 그리고 폴리뉴클레오타이드 서열의 경우 BLASTN 버전 2.0을 이용해서 결정될 수 있다.
서열 동일성의 퍼센트는 바람직하게는 Sequence Analysis Software Package™(버전 10; Genetics Computer Group, Inc., 위스콘신주 매디슨 소재)의 "Best Fit" 또는 "Gap" 프로그램을 이용해서 결정된다. "Gap"은, 정합의 수를 최대화하고 갭의 수를 최소화하는 두 서열의 정렬을 발견하기 위하여 Needleman 및 Wunsch의 알고리즘(Needleman and Wunsch, Journal of Molecular Biology 48:443-453, 1970)을 이용한다. "BestFit"은 Smith 및 Waterman의 국소 상동성 알고리즘(Smith and Waterman, Advances in Applied Mathematics, 2:482-489, 1981, Smith et al., Nucleic Acids Research 11:2205-2220, 1983)을 이용해서 매치의 수를 최소화하기 위하여 두 서열 사이의 유사성의 최상의 분절의 최적 정렬을 수행하고 갭을 삽입한다. 퍼센트 동일성은 가장 바람직하게는 "Best Fit" 프로그램을 이용해서 결정된다.
서열 동일성을 결정하기 위한 유용한 방법은 또한 미국 20894 메릴랜드주 베서스다에 소재한 미국 국립보건원의 미국 국립 의학 도서관에 있는 미국 국립생물공학정보센터(National Center Biotechnology 정보: NCBI)로부터 공개적으로 입수 가능한 Basic Local 정렬 Search Tool(BLAST) 프로그램에 개시되어 있고; 이에 대해서는 문헌[BLAST Manual, Altschul et al., NCBI, NLM, NIH; Altschul et al., J. Mol. Biol. 215:403-410 (1990)]을 참조하고; 버전 2.0 또는 이상의 BLAST 프로그램이 정렬에 간극(결실 및 삽입)의 도입을 허용하고; 펩타이드 서열의 경우 BLASTX가 서열 동일성을 결정하기 위하여 사용될 수 있고; 폴리뉴클레오타이드 서열의 경우 BLASTN이 서열 동일성을 결정하기 위하여 사용될 수 있다.
본 명세서에서 사용되는 바와 같이, 용어 "상당한 퍼센트 서열 동일성"은 적어도 약 70% 서열 동일성, 적어도 약 80% 서열 동일성, 적어도 약 85% 동일성, 적어도 약 90% 서열 동일성, 또는 심지어 그 이상의 서열 동일성, 예컨대, 약 98% 또는 약 99% 서열 동일성의 퍼센트 서열 동일성을 지칭한다. 따라서, 본 발명의 일 실시형태는 본 명세서에 기재된 폴리뉴클레오타이드 서열과 적어도 약 70% 서열 동일성, 적어도 약 80% 서열 동일성, 적어도 약 85% 동일성, 적어도 약 90% 서열 동일성, 또는 심지어 그 초과의 서열 동일성, 예컨대, 약 98% 또는 약 99% 서열 동일성을 갖는 폴리뉴클레오타이드 분자이다.
동일성 및 유사성
동일성은 (단지 서열 정보 또는 구조 정보 또는 몇몇 다른 정보를 이용해서 행해질 수 있지만, 통상 서열 정보 단독에 기초하는) 서열의 정렬 후 서열의 상 사이에 동일한 아미노산의 분율이고, 유사성은 일부 유사성 매트릭스를 이용한 정렬에 기초하여 배정된 점수이다. 유사성 인덱스는 이하의 BLOSUM62, PAM250 또는 GONNET, 또는 단백질의 서열 정렬을 위하여 당업자에 의해 이용되는 임의의 매트릭스 중 어느 하나일 수 있다.
동일성은 (서열 사이에 갭이 없는) 두 하위서열 사이의 대응 정도이다. 25% 이상의 동일성은 기능의 유사성을 의미하는 한편, 18 내지 25%는 구조 또는 기능의 유사성을 의미한다. 두 완전히 관련이 없거나 랜덤한 서열(100개 초과의 잔기임)이 20%보다 더 높은 동일성을 가질 수 있는 것을 명심한다. 유사성은 두 서열이 비교되는 경우 이들 간의 유사도이다. 이것은 이들의 동일성에 좌우된다.
상기 설명으로부터 명백한 바와 같이, 본 개시내용의 소정 양상은 본 명세서에 예시되는 실시예의 특정 세부사항에 의해 제한되지 않으며, 이에 따라 다른 변형 및 적용 또는 이의 균등부가 당업자에게 떠오를 것임이 고려된다. 따라서 청구범위는 본 개시내용의 정신 및 범위에서 벗어나지 않는 모든 이러한 변형 및 적용을 커버하려는 것이다.
또한, 달리 정의되지 않는 한, 본 명세서에 사용된 모든 기술 및 과학 용어는 본 개시가 속하는 당업자에 의해 일반적으로 이해되는 바와 동일한 의미를 갖는다. 바람직한 방법 및 물질이 위에서 기술되어 있지만, 본 명세서에 기재된 것들과 유사하거나 동등한 임의의 방법 및 물질이 본 개시내용의 실시 또는 시험에서 사용될 수 있다.
상기 발명이 이해의 목적을 위해 예시 및 예로서 일부 상세하게 설명되었으나, 당업자에게는 소정 변화 및 변형이 실시될 수 있음이 명백할 것이다. 따라서, 설명 및 실시예는 첨부되는 청구범위에 의해 서술되는 본 발명의 범위를 제한하는 것으로 간주되어서는 안 된다.
돌연변이체 효소
UGT76G1의 결정 구조에 기초하여, 일련의 원형 순열 및 돌연변이의 세트를 설계하고 이들의 기능에 대해 시험하였다. 활성 스크리닝 후, UGT76G1 원형 순열 돌연변이의 한 버전인 CP1이 유의하게 활성인 것으로 밝혀졌다. 광범위하게 말하면, CP1은 도메인이 전환되고 돌연변이 부위가 확인된 UGT76G1의 변이체이다. CP1은 스테비올 코어의 글루코실화의 면에서 상당한 활성을 입증하였다. 링커를 CP1 돌연변이체에 삽입하여 제2 돌연변이체 CP2를 생성한 경우, CP2는 CP1 돌연변이체와 유사한 활성을 나타내는 것으로 밝혀졌다.
UGT76G1의 모델링 분석에 기초하여, UGT76G1 효소에 대한 돌연변이 부위를 선택하고 Reb A의 Reb I로의 생물전환에서의 활성에 대해 시험하였다. 일련의 이러한 돌연변이 후, 소수의 돌연변이체가 글리코실화 활성 및 스테비올 코어의 장식과 관련된 목적하는 효소 기능으로 확인되었다. 이어서, Reb A를 Reb I로 전환할 수 있는 유전자 변형 미생물이 개발되었다. 예를 들어, 하나의 UGT76G1 돌연변이체(L200A, 본 명세서에서 LA 돌연변이체로 지칭됨)는 Reb A의 Reb I로의 생물학적 전환에 대해 매우 높은 효소 활성을 갖는 것으로 밝혀졌다. LA 돌연변이체는 UGT76G1 서열로부터 하나의 돌연변이 부위(L200A)를 포함한다. 몇몇 실시형태에서, LA 돌연변이체는 서열번호 1의 아미노산 서열을 포함한다.
실시예
실시예 1: UGT 효소의 효소 활성 스크리닝
스테비올 글리코사이드의 대부분은, 전형적으로 당의 공여체로서 유리딘 5'-다이포스포글루코스(UDP-글루코스)를 이용해서 UDP-글리코실트랜스퍼라제(UGT)에 의해 촉매되는, 스테비올의 글리코실화 반응에 의해 형성된다. 식물에서, UGT는 UDP-글루코스로부터의 글루코스 잔기를 스테비올로 전이시키는 효소의 매우 분기된 기이다. 예를 들어, 스테비오사이드의 C-13-O-글루코스의 C-3'의 글리코실화는 레바우디오사이드 A(UGT76G1)를 수득한다. Reb A로부터 레바우디오사이드 I(Reb I)를 생산하기 위하여, UGT는, Reb A의 C-19-O-글루코스의 C-3' 위치의 글리코실화인, UDP-글루코스로부터의 글루코스 잔기를 Reb A로 전이시키는데 사용된다(도 2). Reb A로부터의 Reb I 생산을 위한 특정 UGT 효소를 식별하기 위하여, UGT76G1 및 관련 돌연변이체는 활성 스크리닝을 위한 단백질 구조를 기초로 선택되었다.
모든 후보 UGT 유전자의 전장 DNA 단편은 상업적으로 합성되었다. cDNA의 거의 모든 코돈이 이. 콜라이(Genscript, 뉴저지주)에 대해 선호되는 것들로 변경되었다. 합성된 DNA는 박테리아 발현 벡터 pETite N-His SUMO Kan 벡터(Lucigen)로 클로닝되었다.
각 발현 작제물을 이. 콜라이 BL21(DE3)로 형질전환시키고, 이어서 0.8 내지 1.0의 OD600에 도달될 때까지 37℃에서 50 ㎍/㎖ 카나마이신을 함유하는 LB 배지에서 성장시켰다. 1mM 아이소프로필 β-D-1-티오갈락토피라노사이드(IPTG)의 첨가에 의해 단백질 발현을 유도하고, 배양물을 16℃에서 22시간 동안 더욱 성장시켰다. 세포를 원심분리(3,000×g; 10분; 4℃)에 의해 수거하였다. 세포 펠릿을 수거하고, 직접 사용하거나 또는 -80℃에서 저장하였다.
세포 펠릿을 전형적으로 용해 완충액(50mM 인산칼륨 완충액, pH 7.2, 25ug/㎖ 라이소자임, 5ug/㎖ DNase I, 20mM 이미다졸, 500mM NaCl, 10% 글리세롤 및 0.4% Triton X-100)에 재현탁시켰다. 세포를 4℃ 하에 초음파 처리에 의해 파괴시키고, 세포 파편을 원심분리(18,000×g; 30분)에 의해 청정화시켰다. 상청액을 평형화된 (평형 완충액: 50mM 인산칼륨 완충액, pH 7.2, 20mM 이미다졸, 500mM NaCl, 10% 글리세롤) Ni-NTA(Qiagen) 친화도 칼럼에 로딩하였다. 단백질 샘플의 로딩 후, 킬럼을 평형 완충액으로 세척하여 미결합 오염 단백질을 제거하였다. His-태그 붙은 베타-글루코시다제 재조합 폴리펩타이드를 250mM 이미다졸을 함유하는 형형 완충액에 의해 용리시켰다.
기질로서 각종 스테비올 글리코사이드를 이용해서 글리코실트랜스퍼라제 활성에 대해서 정제된 후보 UGT 재조합 폴리펩타이드를 검정하였다. 전형적으로, 재조합 폴리펩타이드(20㎍)를 200㎕ 시험관내 반응 시스템에서 시험하였다. 반응 시스템은 50mM 인산칼륨 완충액, pH 7.2, 3mM MgCl2, 1 ㎎/㎖ 스테비올 글리코사이드 및 3mM UDP-글루코스를 함유한다. 반응은 30 내지 37℃에서 수행하고, 각종 시점에서 200㎕ 1-부탄올을 첨가함으로써 50ul 반응을 종결시켰다. 샘플을 200㎕ 1-부탄올로 3회 추출하였다. 풀링된 분획을 건조시키고 고성능 액체 크로마토그래피(HPLC) 분석을 위해 100㎕의 80% 메탄올 중에 용해시켰다.
이어서, 쿼터너리 펌프(quaternary pump), 온도 제어 칼럼 구획, 자동 샘플수집장치 및 UV 흡광도 검출기를 포함하는 Dionex UPLC ultimate 3000 시스템(캘리포니아주 서니베일 소재)을 이용해서 HPLC 분석을 수행하였다. 가드 칼럼을 구비한 Synergi Hydro-RP 칼럼(Phenomenex)을 풀링된 샘플에서 스테비올 글리코사이드의 특성규명을 위하여 사용하였다. HPLC 분석에 사용된 검출 파장은 210㎚였다.
활성 스크리닝 후, Reb I 생산을 위하여 UDP-글리코실트랜스퍼라제 활성을 갖는 몇 가지 효소를 식별하였다.
UGT76G1 효소는 Reb A를 Reb I로 전환시킬 수 있다. 다양한 돌연변이체 및 변이체의 스크리닝 후에, 야생형 UGT76G1에 비해서 단지 하나의 돌연변이(L200A)를 가진 특정 변이체인 LA는, 예기치 않게 실시예 2에서 더욱 상세히 기재된 바와 같이 Reb A를 Reb I로 전환시킴에 있어서 상당히 높은 활성을 나타내었다.
실시예 2: Reb A의 Reb I로의 효소에 의한 생물전환
원형 순열 분석은 유용한 또는 귀중한 효소를 개발하기 위한 강력한 툴이다(PLoS computational Biology, 2012, 8(3) e1002445; BIOINFORMATICS, 2015, (3)). UGT76G1의 결정 구조에 기초하여, 일련의 원형 순열을 설계하였다. 활성 스크리닝의 수행 후, 원형 순열의 하나의 버전("CP1")이 WT UGT76G1에 비해서 Reb I 생산에 대해서 더 높은 활성을 갖는 것으로 확인되었다. 링커(YKDDSGYSSSYAAAAGM(서열번호 15))를 CP1의 C-말단과 N 말단 사이에 삽입하여 제2 돌연변이체("CP2")를 생성하였는데, 이는 또한 Reb I 생산에 대해서 WT UGT76G1보다 더 높은 활성을 갖는다.
UGT76G1의 모델링 분석에 기초하여, 효소 활성을 증대시키기 위하여 돌연변이 부위가 선택되었다. 생성된 다양한 돌연변이체의 효소 활성 스크리닝 후, 예기치 않게, 하나의 돌연변이체인 LA(UGT76G1의 L200A 돌연변이체)가, 특히 야생형 UGT76G1과 비교할 때, Reb A를 Reb I로 전환시킴에 있어서 이의 효소 활성의 상당한 증가를 나타낸 것으로 밝혀졌다.
레바우디오사이드 A의 레바우디오사이드 I로의 시험관내 전환을 확인하기 위하여, 스테비올 글리코사이드 기질로서 Reb A를 사용해서 선택된 UGT 효소를 검정하였다. 반응 시스템은 50mM 인산칼륨 완충액(pH 7.2), 3mM MgCl2, 1 mg/㎖ 스테비오사이드, 3mM UDP-글루코스 및 효소(20ug/200ul 반응)를 함유하였다. 반응은 37℃에서 수행하였고, 1-부탄올을 첨가함으로써 종결시켰다. 샘플을 1-부탄올로 3회 추출하였다. 풀링된 분획을 건조시키고, 고성능 액체 크로마토그래피(HPLC) 분석을 위해 80% 메탄올 중에 용해시켰다. HPLC 분석은 상기 설명과 같이 수행하였다.
도 3에 도시된 바와 같이, UGT76G1은 Reb A를 Reb I로 전환시킬 수 있다(도 3, 패널 B). CP1(도 3, 패널 C) 및 CP2(도 3, 패널 D) 돌연변이체 둘 다는 UGT76G1보다 높은 효소 활성을 갖는다. CP2는 CP1보다 더 낮은 활성을 갖는데, 이는 N-말단과 C-말단 사이의 선택된 링커가 효소 활성에 영향을 미치는 것을 나타낸다. 높은 효소 활성을 갖는 돌연변이체를 식별하기 위하여, 몇 가지 부위 돌연변이체를 UGT76G1 결정 구조에 기초하여 생성시켰다. 활성 스크리닝 후, UGT76G1보다 높은 활성을 갖는 돌연변이체를 확인하였다. LA 돌연변이체(L200A)는 모든 시험된 돌연변이체 중에서 가장 높은 활성을 갖는다. 도 3에 도시된 바와 같이, Reb I 및 Reb A에 각각 대응하는 피크인 패널 E는, Reb A의 50% 초과가 소비되어 LA가 사용된 경우 Reb I로 전환된 것을 나타낸다. 비교로서, UGT76G1, CP1 및 CP2 중 어느 것인가가 사용된 경우, Reb A의 15% 미만이 Reb I로 전환되었다(도 3, 패널 B 내지 D). UGT76G1-AtSUS1 융합 효소(GS)는 또한 LA, CP1 또는 CP2처럼 유의하지 않지만, UGT76G1에 비해서, Reb A의 Reb I로의 생물전환을 위하여 더 높은 활성을 나타내었다(도 3, 패널 F).
UGT 효소 및 수크로스 신타제(SUS) 둘 다가 존재하는 커플링 시스템에서, UDP-글루코스는 UDP 및 수크로스로부터 재생될 수 있는데, 이는 반응 혼합물에 과잉의 UDP-글루코스의 첨가의 생략을 허용한다. 적합한 수크로스 신타제(SUS)는, 예를 들어, 아라비돕시스 수크로스 신타제 1; 아라비돕시스 수크로스 신타제 3; 및 비그나 라디아테(Vigna radiate) 수크로스 신타제일 수 있다.
또 다른 양상에서, UDP-글리코실트랜스퍼라제 융합 효소는 상기 방법에서 사용될 수 있다. 특히 적합한 UDP-글리코실트랜스퍼라제 융합 효소는 UGT-SUS 융합 효소일 수 있다. UDP-글리코실트랜스퍼라제는 수크로스 신타제 도메인에 커플링된 UDP-글리코실트랜스퍼라제 도메인을 포함하는 UDP-글리코실트랜스퍼라제 융합 효소일 수 있다. 특히, UDP-글리코실트랜스퍼라제 융합 효소는 수크로스 신타제 도메인에 커플링된 UDP-글리코실트랜스퍼라제 도메인을 포함한다. 부가적으로, UGT-SUS 융합 효소는 수크로스 신타제 활성을 갖고, 따라서, UDP 및 수크로스로부터 UDP-글루코스를 재생시킬 수 있다. 특히 적합한 UGT-SUS 융합 효소는, 예를 들어, UGT76G1-AtSUS1 융합 효소("GS"라 지칭됨)일 수 있다. GS 융합 효소는 UDP 및 수크로스의 첨가 시 Reb A를 Reb I로 전환시킬 수 있다(도 4). 도 4에 도시된 바와 같이, UGT76G1은 UDP 첨가 시 Reb A를 Reb I로 전환시킬 수 없다(도 4, 패널 B). 그러나, GS 융합 효소(도 4, 패널 D) 및 UGT76G1과 AtSUS1 효소계의 조합(도 4 C) 둘 다는 Reb A로부터 Reb I를 생산할 수 있는데, 이는 AtSUS1 수크로스 신타제에 의한 UDPG 재생을 나타낸다. GS 융합 효소가 동일 반응계에서 UGT76G1과 AtSUS1 효소의 조합보다 더 높은 효소 활성을 갖는 것으로 밝혀졌다. 수크로스 신타제(SUS)는 수크로스의 존재 하에 UDP의 UDP-글루코스로의 전환을 촉매한다. 따라서, UDP-글루코스(예컨대, UGT에 의해 촉매된 것들)를 이용하는 글리코실화 반응의 경우, SUS는 UDP로부터 UDP-글루코스를 재생하는데 사용될 수 있으며, 이는 이러한 반응의 효율을 증대시킨다.
실시예 3: 생산된 Reb I의 구조의 NMR 분석
생산된 Reb I 화합물을 위에서 기재된 바와 같은 반분취 크로마토그래피에 의해 정제시켰다.
Reb I의 분자식은 각각 m/z 1146.5281 및 1151.4839에서 [M+NH4]+ 및 [M+Na]+에 대응하는 부가체 이온을 나타내는 이의 양성 고해상도 질량 스펙트럼(HRMS)에 기초하여 C50H80O28로서 추론되었고, 이 조성물은 13C NMR 스펙트럼 데이터에 의해 뒷받침되었다. Reb I의 1H NMR 스펙트럼은, 스테비아 레바우디아나로부터 초기에 단리된 엔트-카우란 다이터페노이드와 유사한; δ 1.22 및 1.26에서 2개의 메틸 단일항; δ 0.75 내지 2.59 사이에 9개의 메틸렌 및 2개의 메틴 양성자; 및 δ 5.01 및 5.65에 고리외 이중결합에 대응하는 2개의 단일항의 존재를 나타내었다. 엔트-카우란 다이터페노이드의 기본 골격은 핵심 TOCSY(H-1/H-2; H-2/H-3; H-5/H-6; H-6/H-7; H-9/H-11; H-11/H-12) 및 HMBC(H-1/C-2, C-10; H-3/C-1, C-2, C-4, C-5, C-18, C-19; H-5/C-4, C-6, C-7, C-9, C-10, C-18, C-19, C-20; H-9/C-8, C-10, C-11, C-12, C-14, C-15; H-14/C-8, C-9, C-13, C-15, C-16 및 H-17/C-13, C-15, C-16) 상관관계에 의해 뒷받침되었다.
또한, Reb I의 1H NMR 스펙트럼은 δ 5.03, 5.24, 5.34, 5.53 및 6.12에서 이중항으로서 아노머 양성자를 나타내었는데, 이는 그의 구조에 5개의 당 단위의 존재를 시사하고 있다. 5% H2SO4를 이용한 Reb I의 산 가수분해는 TLC에 의한 진본 샘플과의 직접 비교에 의해 식별된 D-글루코스를 제공하였는데, 이는 그의 구조에 6개의 글루코피라노실 모이어티의 존재를 시사하고 있다. D-글루코스의 입체형태는, L-시스테인 메틸 에스터 및 O-톨릴 아이소티오사이아네이트를 가진 이의 대응하는 티오카바모일-티아졸리딘 카복실레이트 유도체를 제조함으로써, 그리고 비교에서, 문헌 비교에 기재된 바와 같은 표준 당에 의한 체류 시간으로 식별되었다. Reb I의 효소 가수분해는 1H NMR 및 공동-TLC의 표준 화합물과의 비교에 의해 스테비올로서 식별된 아글리콘(aglycone)을 제공하였다. 화합물 Reb I에 대한 1H 및 13C NMR 값은 COSY, TOCSY, HMQC, HMBC 및 ROESY 데이터에 기초하여 배정되었다.
효소 및 산 가수분해 실험과 함께 Reb I의 1H 및 13C NMR 값의 밀접한 연구는, 화합물 Reb I가 추가의 글루코실 단위의 식별을 남겨둔 채 2,3-분지형 글루코트라이오실 치환체로서 C-13 하이드록실에 부착된 3개의 글루코실 모이어티 잔기 및 C-19 위치에서 에스터 형태의 또 다른 글루코실 모이어티를 갖는 스테비올 글리코사이드인 것을 시사하였다. 1H과 당 I의 3' 위치에서의 13C 화학적 이동 둘 다에 대한 다운필드 이동은 이 위치에서 추가의 β-D-글루코실 모이어티를 시사하였고, 이는 핵심 HMBC 상관관계: H-1'/C-19, C-2'; H-2'/C-1', C-3' 및 H-3'/C-1', C-2' 및 C-4'에 의해 뒷받침되었다. δ 5.03(d, J=7.8 Hz), 5.24(d, J=7.8 Hz), 5.34(d, J=7.8 Hz), 5.53(d, J=7.8 Hz) 및 6.12(d, J=8.1 Hz)에서의 5개의 아노머 양성자에 대해서 관찰된 큰 결합 상수는 스테비올 글리코사이드에 대해서 보고된 바와 같이 이들의 β-배향을 시사하였다. Reb I의 구조는 도 5에 도시된 바와 같은 핵심 TOCSY 및 HMBC 상관관계에 의해 더욱 뒷받침되었다.
화학 및 스펙트럼 연구로부터의 결과에 기초하여, Reb I는 13-[(2-O-β-D-글루코피라노실-3-O-β-D-글루코피라노실-β-D-글루코피라노실)옥시] 엔트-카우르-16-엔-19-오익 산-(3-O-β-D-글루코피라노실-β-D-글루코피라노실) 에스터로서 배정되었고, 이의 스펙트럼 데이터는 문헌에 보고된 레바우디오사이드 I의 구조 데이터와 일치한다.
MeOH(10㎖) 중 생산된 Reb I(3㎎)의 용액에 3㎖의 5% H2SO4를 첨가하고, 이 혼합물을 16시간 동안 환류시켰다. 이어서, 이 반응 혼합물을 포화 탄산나트륨으로 중화시키고, 에틸 아세테이트(EtOAc)(2×25㎖)로 추출하여 당을 함유하는 수성 분획과 아글리콘 부분을 함유하는 EtOAc 분획을 제공하였다. 수상을 농축시키고 TLC 시스템 EtOAc/n-부탄올/물(2:7:1) 및 CH2Cl2/MeOH/물(10:6:1)을 이용해서 표준 당과 비교하였으며[6-8]; 당은 D-글루코스로서 식별되었다.
생산된 Reb I(500㎍)를 0.5M HCl(0.5㎖)로 1.5시간 동안 가수분해시켰다. 냉각 후, 이 혼합물을 Amberlite IRA400 칼럼을 통과시키고, 용출액을 동결건조시켰다. 잔사를 피리딘(0.25㎖)에 용해시키고, L-시스테인 메틸 에스터 HCl(2.5㎎)과 함께 60℃에서 1.5시간 동안 가열하고, 이어서 이 혼합물에 O-톨릴 아이소티오사이아네이트(12.5 uL)를 첨가하고 60℃에서 추가의 1.5시간 동안 가열하였다. 이 반응 혼합물의 HPLC 분석은 이동상 25% 아세토나이트릴-0.2% TFA 물을 이용해서 250㎚에서 UV 검출 하에 1 ㎖/분에서 Phenomenex Luna 칼럼[C18, 150 x 4.6 mm (5 u)]에 의해 수행하였다. 당은 D-글루코스(tR, 12.64)[진본 샘플, D-글루코스(tR, 12.54) 및 L-글루코스(tR, 11.42분)]로서 식별되었다[9].
생성된 Reb I(1㎎)을, pH를 4.5에서 유지시킴으로써 2.5㎖의 0.1M 아세트산나트륨 완충액에 용해시키고, 아스페르길루스 나이거()Aspergillus niger)(Sigma-Aldrich)로부터 50㎕의 조질의 펙티나제(pectinase)를 첨가하였다. 혼합물을 50℃에서 48시간 동안 교반하고, 반응 동안 석출된 생성물을 여과시키고, 이어서 결정화시켰다. 얻어진 생성물들은 그들의 1H NMR 스펙트럼 데이터 및 공동-TLC의 비교에 의해 스테비올로서 식별되었다.
효소에 의한 생물전환에 의해 생산된 13-[(2-O-β-D-글루코피라노실-3-O-β-D-글루코피라노실-β-D-글루코피라노실)옥시] 엔트-카우르-16-엔-19-오익 산-(3-O-β-D-글루코피라노실-β-D-글루코피라노실) 에스터(레바우디오사이드 I)에 대한 완전한 1H 및 13C NMR 스펙트럼 데이터는 고해상도 질량 스펙트럼 데이터뿐만 아니라 광범위 1D 및 2D NMR에 기초하여 배정되었다. 레바우디오사이드 I의 구조는 산 및 효소 가수분해 연구에 의해 더욱 뒷받침된다.
관심 서열
UGT76G1 L200A 돌연변이체(LA): 아미노산 서열: (서열번호 1)
UGT76G1 L200A 돌연변이체(LA): DNA 서열: (서열번호 2)
UGT76G1 CP1 돌연변이체(CP1): 아미노산 서열: (서열번호 3)
UGT76G1 CP1 돌연변이체(CP1): DNA 서열: (서열번호 4)
UGT76G1 CP2 돌연변이체(CP2): 아미노산 서열: (서열번호 5)
UGT76G1 CP2 돌연변이체(CP2): DNA 서열: (서열번호 6)
UGT76G1-AtSUS1 융합 효소(GS): 아미노산 서열: (서열번호 7)
UGT76G1-AtSUS1 융합 효소(GS): DNA 서열: (서열번호 8)
스테비아 레바우디아나로부터의 WT UGT76G1: 아미노산 서열: (서열번호 9)
스테비아 레바우디아나로부터의 WT UGT76G1: DNA 서열: (서열번호 10)
아라비돕시스 탈리아나로부터의 WT AtSUS1: 아미노산 서열: (서열번호 11)
아라비돕시스 탈리아나로부터의 WT AtSUS1: DNA 서열: (서열번호 12)
UGT76G1 L200A 돌연변이체(LA)-AtSUS1 융합 효소: 아미노산 서열: (서열번호 13)
UGT76G1 L200A 돌연변이체(LA)-AtSUS1 융합 효소: DNA 서열: (서열번호 14)
SEQUENCE LISTING
<110> Conagen, Inc.
<120> BIOSYNTHETIC PRODUCTION OF STEVIOL GLYCOSIDE REBAUDIOSIDE I VIA
VARIANT ENZYMES
<130> C1497.70032WO00
<140> PCT/US2020/041394
<141> 2020/07/09
<150> US 16/679,032
<151> 2019-11-08
<150> US 16/506,892
<151> 2019-07-09
<160> 15
<170> PatentIn version 3.5
<210> 1
<211> 458
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic polypeptide
<400> 1
Met Glu Asn Lys Thr Glu Thr Thr Val Arg Arg Arg Arg Arg Ile Ile
1 5 10 15
Leu Phe Pro Val Pro Phe Gln Gly His Ile Asn Pro Ile Leu Gln Leu
20 25 30
Ala Asn Val Leu Tyr Ser Lys Gly Phe Ser Ile Thr Ile Phe His Thr
35 40 45
Asn Phe Asn Lys Pro Lys Thr Ser Asn Tyr Pro His Phe Thr Phe Arg
50 55 60
Phe Ile Leu Asp Asn Asp Pro Gln Asp Glu Arg Ile Ser Asn Leu Pro
65 70 75 80
Thr His Gly Pro Leu Ala Gly Met Arg Ile Pro Ile Ile Asn Glu His
85 90 95
Gly Ala Asp Glu Leu Arg Arg Glu Leu Glu Leu Leu Met Leu Ala Ser
100 105 110
Glu Glu Asp Glu Glu Val Ser Cys Leu Ile Thr Asp Ala Leu Trp Tyr
115 120 125
Phe Ala Gln Ser Val Ala Asp Ser Leu Asn Leu Arg Arg Leu Val Leu
130 135 140
Met Thr Ser Ser Leu Phe Asn Phe His Ala His Val Ser Leu Pro Gln
145 150 155 160
Phe Asp Glu Leu Gly Tyr Leu Asp Pro Asp Asp Lys Thr Arg Leu Glu
165 170 175
Glu Gln Ala Ser Gly Phe Pro Met Leu Lys Val Lys Asp Ile Lys Ser
180 185 190
Ala Tyr Ser Asn Trp Gln Ile Ala Lys Glu Ile Leu Gly Lys Met Ile
195 200 205
Lys Gln Thr Lys Ala Ser Ser Gly Val Ile Trp Asn Ser Phe Lys Glu
210 215 220
Leu Glu Glu Ser Glu Leu Glu Thr Val Ile Arg Glu Ile Pro Ala Pro
225 230 235 240
Ser Phe Leu Ile Pro Leu Pro Lys His Leu Thr Ala Ser Ser Ser Ser
245 250 255
Leu Leu Asp His Asp Arg Thr Val Phe Gln Trp Leu Asp Gln Gln Pro
260 265 270
Pro Ser Ser Val Leu Tyr Val Ser Phe Gly Ser Thr Ser Glu Val Asp
275 280 285
Glu Lys Asp Phe Leu Glu Ile Ala Arg Gly Leu Val Asp Ser Lys Gln
290 295 300
Ser Phe Leu Trp Val Val Arg Pro Gly Phe Val Lys Gly Ser Thr Trp
305 310 315 320
Val Glu Pro Leu Pro Asp Gly Phe Leu Gly Glu Arg Gly Arg Ile Val
325 330 335
Lys Trp Val Pro Gln Gln Glu Val Leu Ala His Gly Ala Ile Gly Ala
340 345 350
Phe Trp Thr His Ser Gly Trp Asn Ser Thr Leu Glu Ser Val Cys Glu
355 360 365
Gly Val Pro Met Ile Phe Ser Asp Phe Gly Leu Asp Gln Pro Leu Asn
370 375 380
Ala Arg Tyr Met Ser Asp Val Leu Lys Val Gly Val Tyr Leu Glu Asn
385 390 395 400
Gly Trp Glu Arg Gly Glu Ile Ala Asn Ala Ile Arg Arg Val Met Val
405 410 415
Asp Glu Glu Gly Glu Tyr Ile Arg Gln Asn Ala Arg Val Leu Lys Gln
420 425 430
Lys Ala Asp Val Ser Leu Met Lys Gly Gly Ser Ser Tyr Glu Ser Leu
435 440 445
Glu Ser Leu Val Ser Tyr Ile Ser Ser Leu
450 455
<210> 2
<211> 1377
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 2
atggagaata agacagaaac aaccgtaaga cggaggcgga ggattatctt gttccctgta 60
ccatttcagg gccatattaa tccgatcctc caattagcaa acgtcctcta ctccaaggga 120
ttttcaataa caatcttcca tactaacttt aacaagccta aaacgagtaa ttatcctcac 180
tttacattca ggttcattct agacaacgac cctcaggatg agcgtatctc aaatttacct 240
acgcatggcc ccttggcagg tatgcgaata ccaataatca atgagcatgg agccgatgaa 300
ctccgtcgcg agttagagct tctcatgctc gcaagtgagg aagacgagga agtttcgtgc 360
ctaataactg atgcgctttg gtacttcgcc caatcagtcg cagactcact gaatctacgc 420
cgtttggtcc ttatgacaag ttcattattc aactttcacg cacatgtatc actgccgcaa 480
tttgacgagt tgggttacct ggacccggat gacaaaacgc gattggagga acaagcgtcg 540
ggcttcccca tgctgaaagt caaagatatt aagagcgctt atagtaattg gcaaattgcg 600
aaagaaattc tcggaaaaat gataaagcaa accaaagcgt cctctggagt aatctggaac 660
tccttcaagg agttagagga atctgaactt gaaacggtca tcagagaaat ccccgctccc 720
tcgttcttaa ttccactacc caagcacctt actgcaagta gcagttccct cctagatcat 780
gaccgaaccg tgtttcagtg gctggatcag caacccccgt cgtcagttct atatgtaagc 840
tttgggagta cttcggaagt ggatgaaaag gacttcttag agattgcgcg agggctcgtg 900
gatagcaaac agagcttcct gtgggtagtg agaccgggat tcgttaaggg ctcgacgtgg 960
gtcgagccgt tgccagatgg ttttctaggg gagagaggga gaatcgtgaa atgggttcca 1020
cagcaagagg ttttggctca cggagctata ggggcctttt ggacccactc tggttggaat 1080
tctactcttg aaagtgtctg tgaaggcgtt ccaatgatat tttctgattt tgggcttgac 1140
cagcctctaa acgctcgcta tatgtctgat gtgttgaagg ttggcgtgta cctggagaat 1200
ggttgggaaa ggggggaaat tgccaacgcc atacgccggg taatggtgga cgaggaaggt 1260
gagtacatac gtcagaacgc tcgggtttta aaacaaaaag cggacgtcag ccttatgaag 1320
ggaggtagct cctatgaatc cctagaatcc ttggtaagct atatatcttc gttataa 1377
<210> 3
<211> 458
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic polypeptide
<400> 3
Met Asn Trp Gln Ile Leu Lys Glu Ile Leu Gly Lys Met Ile Lys Gln
1 5 10 15
Thr Lys Ala Ser Ser Gly Val Ile Trp Asn Ser Phe Lys Glu Leu Glu
20 25 30
Glu Ser Glu Leu Glu Thr Val Ile Arg Glu Ile Pro Ala Pro Ser Phe
35 40 45
Leu Ile Pro Leu Pro Lys His Leu Thr Ala Ser Ser Ser Ser Leu Leu
50 55 60
Asp His Asp Arg Thr Val Phe Gln Trp Leu Asp Gln Gln Pro Pro Ser
65 70 75 80
Ser Val Leu Tyr Val Ser Phe Gly Ser Thr Ser Glu Val Asp Glu Lys
85 90 95
Asp Phe Leu Glu Ile Ala Arg Gly Leu Val Asp Ser Lys Gln Ser Phe
100 105 110
Leu Trp Val Val Arg Pro Gly Phe Val Lys Gly Ser Thr Trp Val Glu
115 120 125
Pro Leu Pro Asp Gly Phe Leu Gly Glu Arg Gly Arg Ile Val Lys Trp
130 135 140
Val Pro Gln Gln Glu Val Leu Ala His Gly Ala Ile Gly Ala Phe Trp
145 150 155 160
Thr His Ser Gly Trp Asn Ser Thr Leu Glu Ser Val Cys Glu Gly Val
165 170 175
Pro Met Ile Phe Ser Asp Phe Gly Leu Asp Gln Pro Leu Asn Ala Arg
180 185 190
Tyr Met Ser Asp Val Leu Lys Val Gly Val Tyr Leu Glu Asn Gly Trp
195 200 205
Glu Arg Gly Glu Ile Ala Asn Ala Ile Arg Arg Val Met Val Asp Glu
210 215 220
Glu Gly Glu Tyr Ile Arg Gln Asn Ala Arg Val Leu Lys Gln Lys Ala
225 230 235 240
Asp Val Ser Leu Met Lys Gly Gly Ser Ser Tyr Glu Ser Leu Glu Ser
245 250 255
Leu Val Ser Tyr Ile Ser Ser Leu Glu Asn Lys Thr Glu Thr Thr Val
260 265 270
Arg Arg Arg Arg Arg Ile Ile Leu Phe Pro Val Pro Phe Gln Gly His
275 280 285
Ile Asn Pro Ile Leu Gln Leu Ala Asn Val Leu Tyr Ser Lys Gly Phe
290 295 300
Ser Ile Thr Ile Phe His Thr Asn Phe Asn Lys Pro Lys Thr Ser Asn
305 310 315 320
Tyr Pro His Phe Thr Phe Arg Phe Ile Leu Asp Asn Asp Pro Gln Asp
325 330 335
Glu Arg Ile Ser Asn Leu Pro Thr His Gly Pro Leu Ala Gly Met Arg
340 345 350
Ile Pro Ile Ile Asn Glu His Gly Ala Asp Glu Leu Arg Arg Glu Leu
355 360 365
Glu Leu Leu Met Leu Ala Ser Glu Glu Asp Glu Glu Val Ser Cys Leu
370 375 380
Ile Thr Asp Ala Leu Trp Tyr Phe Ala Gln Ser Val Ala Asp Ser Leu
385 390 395 400
Asn Leu Arg Arg Leu Val Leu Met Thr Ser Ser Leu Phe Asn Phe His
405 410 415
Ala His Val Ser Leu Pro Gln Phe Asp Glu Leu Gly Tyr Leu Asp Pro
420 425 430
Asp Asp Lys Thr Arg Leu Glu Glu Gln Ala Ser Gly Phe Pro Met Leu
435 440 445
Lys Val Lys Asp Ile Lys Ser Ala Tyr Ser
450 455
<210> 4
<211> 1377
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 4
atgaactggc aaatcctgaa agaaatcctg ggtaaaatga tcaaacaaac caaagcgtcg 60
tcgggcgtta tctggaactc cttcaaagaa ctggaagaat cagaactgga aaccgttatt 120
cgcgaaatcc cggctccgtc gttcctgatt ccgctgccga aacatctgac cgcgagcagc 180
agcagcctgc tggatcacga ccgtacggtc tttcagtggc tggatcagca accgccgtca 240
tcggtgctgt atgtttcatt cggtagcacc tctgaagtcg atgaaaaaga ctttctggaa 300
atcgctcgcg gcctggtgga tagtaaacag tccttcctgt gggtggttcg tccgggtttt 360
gtgaaaggca gcacgtgggt tgaaccgctg ccggatggct tcctgggtga acgcggccgt 420
attgtcaaat gggtgccgca gcaagaagtg ctggcacatg gtgctatcgg cgcgttttgg 480
acccactctg gttggaacag tacgctggaa tccgtttgcg aaggtgtccc gatgattttc 540
agcgattttg gcctggacca gccgctgaat gcccgctata tgtctgatgt tctgaaagtc 600
ggtgtgtacc tggaaaacgg ttgggaacgt ggcgaaattg cgaatgccat ccgtcgcgtt 660
atggtcgatg aagaaggcga atacattcgc cagaacgctc gtgtcctgaa acaaaaagcg 720
gacgtgagcc tgatgaaagg cggtagctct tatgaatcac tggaatcgct ggttagctac 780
atcagttccc tggaaaataa aaccgaaacc acggtgcgtc gccgtcgccg tattatcctg 840
ttcccggttc cgtttcaggg tcatattaac ccgatcctgc aactggcgaa tgttctgtat 900
tcaaaaggct tttcgatcac catcttccat acgaacttca acaaaccgaa aaccagtaac 960
tacccgcact ttacgttccg ctttattctg gataacgacc cgcaggatga acgtatctcc 1020
aatctgccga cccacggccc gctggccggt atgcgcattc cgattatcaa tgaacacggt 1080
gcagatgaac tgcgccgtga actggaactg ctgatgctgg ccagtgaaga agatgaagaa 1140
gtgtcctgtc tgatcaccga cgcactgtgg tatttcgccc agagcgttgc agattctctg 1200
aacctgcgcc gtctggtcct gatgacgtca tcgctgttca attttcatgc gcacgtttct 1260
ctgccgcaat ttgatgaact gggctacctg gacccggatg acaaaacccg tctggaagaa 1320
caagccagtg gttttccgat gctgaaagtc aaagacatta aatccgccta ttcgtaa 1377
<210> 5
<211> 475
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic polypeptide
<400> 5
Met Asn Trp Gln Ile Leu Lys Glu Ile Leu Gly Lys Met Ile Lys Gln
1 5 10 15
Thr Lys Ala Ser Ser Gly Val Ile Trp Asn Ser Phe Lys Glu Leu Glu
20 25 30
Glu Ser Glu Leu Glu Thr Val Ile Arg Glu Ile Pro Ala Pro Ser Phe
35 40 45
Leu Ile Pro Leu Pro Lys His Leu Thr Ala Ser Ser Ser Ser Leu Leu
50 55 60
Asp His Asp Arg Thr Val Phe Gln Trp Leu Asp Gln Gln Pro Pro Ser
65 70 75 80
Ser Val Leu Tyr Val Ser Phe Gly Ser Thr Ser Glu Val Asp Glu Lys
85 90 95
Asp Phe Leu Glu Ile Ala Arg Gly Leu Val Asp Ser Lys Gln Ser Phe
100 105 110
Leu Trp Val Val Arg Pro Gly Phe Val Lys Gly Ser Thr Trp Val Glu
115 120 125
Pro Leu Pro Asp Gly Phe Leu Gly Glu Arg Gly Arg Ile Val Lys Trp
130 135 140
Val Pro Gln Gln Glu Val Leu Ala His Gly Ala Ile Gly Ala Phe Trp
145 150 155 160
Thr His Ser Gly Trp Asn Ser Thr Leu Glu Ser Val Cys Glu Gly Val
165 170 175
Pro Met Ile Phe Ser Asp Phe Gly Leu Asp Gln Pro Leu Asn Ala Arg
180 185 190
Tyr Met Ser Asp Val Leu Lys Val Gly Val Tyr Leu Glu Asn Gly Trp
195 200 205
Glu Arg Gly Glu Ile Ala Asn Ala Ile Arg Arg Val Met Val Asp Glu
210 215 220
Glu Gly Glu Tyr Ile Arg Gln Asn Ala Arg Val Leu Lys Gln Lys Ala
225 230 235 240
Asp Val Ser Leu Met Lys Gly Gly Ser Ser Tyr Glu Ser Leu Glu Ser
245 250 255
Leu Val Ser Tyr Ile Ser Ser Leu Tyr Lys Asp Asp Ser Gly Tyr Ser
260 265 270
Ser Ser Tyr Ala Ala Ala Ala Gly Met Glu Asn Lys Thr Glu Thr Thr
275 280 285
Val Arg Arg Arg Arg Arg Ile Ile Leu Phe Pro Val Pro Phe Gln Gly
290 295 300
His Ile Asn Pro Ile Leu Gln Leu Ala Asn Val Leu Tyr Ser Lys Gly
305 310 315 320
Phe Ser Ile Thr Ile Phe His Thr Asn Phe Asn Lys Pro Lys Thr Ser
325 330 335
Asn Tyr Pro His Phe Thr Phe Arg Phe Ile Leu Asp Asn Asp Pro Gln
340 345 350
Asp Glu Arg Ile Ser Asn Leu Pro Thr His Gly Pro Leu Ala Gly Met
355 360 365
Arg Ile Pro Ile Ile Asn Glu His Gly Ala Asp Glu Leu Arg Arg Glu
370 375 380
Leu Glu Leu Leu Met Leu Ala Ser Glu Glu Asp Glu Glu Val Ser Cys
385 390 395 400
Leu Ile Thr Asp Ala Leu Trp Tyr Phe Ala Gln Ser Val Ala Asp Ser
405 410 415
Leu Asn Leu Arg Arg Leu Val Leu Met Thr Ser Ser Leu Phe Asn Phe
420 425 430
His Ala His Val Ser Leu Pro Gln Phe Asp Glu Leu Gly Tyr Leu Asp
435 440 445
Pro Asp Asp Lys Thr Arg Leu Glu Glu Gln Ala Ser Gly Phe Pro Met
450 455 460
Leu Lys Val Lys Asp Ile Lys Ser Ala Tyr Ser
465 470 475
<210> 6
<211> 1428
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 6
atgaactggc aaatcctgaa agaaatcctg ggtaaaatga tcaaacaaac caaagcgtcg 60
tcgggcgtta tctggaactc cttcaaagaa ctggaagaat cagaactgga aaccgttatt 120
cgcgaaatcc cggctccgtc gttcctgatt ccgctgccga aacatctgac cgcgagcagc 180
agcagcctgc tggatcacga ccgtacggtc tttcagtggc tggatcagca accgccgtca 240
tcggtgctgt atgtttcatt cggtagcacc tctgaagtcg atgaaaaaga ctttctggaa 300
atcgctcgcg gcctggtgga tagtaaacag tccttcctgt gggtggttcg tccgggtttt 360
gtgaaaggca gcacgtgggt tgaaccgctg ccggatggct tcctgggtga acgcggccgt 420
attgtcaaat gggtgccgca gcaagaagtg ctggcacatg gtgctatcgg cgcgttttgg 480
acccactctg gttggaacag tacgctggaa tccgtttgcg aaggtgtccc gatgattttc 540
agcgattttg gcctggacca gccgctgaat gcccgctata tgtctgatgt tctgaaagtc 600
ggtgtgtacc tggaaaacgg ttgggaacgt ggcgaaattg cgaatgccat ccgtcgcgtt 660
atggtcgatg aagaaggcga atacattcgc cagaacgctc gtgtcctgaa acaaaaagcg 720
gacgtgagcc tgatgaaagg cggtagctct tatgaatcac tggaatcgct ggttagctac 780
atcagttccc tgtacaaaga tgacagcggt tatagcagca gctatgcggc ggcggcgggt 840
atggaaaata aaaccgaaac cacggtgcgt cgccgtcgcc gtattatcct gttcccggtt 900
ccgtttcagg gtcatattaa cccgatcctg caactggcga atgttctgta ttcaaaaggc 960
ttttcgatca ccatcttcca tacgaacttc aacaaaccga aaaccagtaa ctacccgcac 1020
tttacgttcc gctttattct ggataacgac ccgcaggatg aacgtatctc caatctgccg 1080
acccacggcc cgctggccgg tatgcgcatt ccgattatca atgaacacgg tgcagatgaa 1140
ctgcgccgtg aactggaact gctgatgctg gccagtgaag aagatgaaga agtgtcctgt 1200
ctgatcaccg acgcactgtg gtatttcgcc cagagcgttg cagattctct gaacctgcgc 1260
cgtctggtcc tgatgacgtc atcgctgttc aattttcatg cgcacgtttc tctgccgcaa 1320
tttgatgaac tgggctacct ggacccggat gacaaaaccc gtctggaaga acaagccagt 1380
ggttttccga tgctgaaagt caaagacatt aaatccgcct attcgtaa 1428
<210> 7
<211> 1268
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic polypeptide
<400> 7
Met Glu Asn Lys Thr Glu Thr Thr Val Arg Arg Arg Arg Arg Ile Ile
1 5 10 15
Leu Phe Pro Val Pro Phe Gln Gly His Ile Asn Pro Ile Leu Gln Leu
20 25 30
Ala Asn Val Leu Tyr Ser Lys Gly Phe Ser Ile Thr Ile Phe His Thr
35 40 45
Asn Phe Asn Lys Pro Lys Thr Ser Asn Tyr Pro His Phe Thr Phe Arg
50 55 60
Phe Ile Leu Asp Asn Asp Pro Gln Asp Glu Arg Ile Ser Asn Leu Pro
65 70 75 80
Thr His Gly Pro Leu Ala Gly Met Arg Ile Pro Ile Ile Asn Glu His
85 90 95
Gly Ala Asp Glu Leu Arg Arg Glu Leu Glu Leu Leu Met Leu Ala Ser
100 105 110
Glu Glu Asp Glu Glu Val Ser Cys Leu Ile Thr Asp Ala Leu Trp Tyr
115 120 125
Phe Ala Gln Ser Val Ala Asp Ser Leu Asn Leu Arg Arg Leu Val Leu
130 135 140
Met Thr Ser Ser Leu Phe Asn Phe His Ala His Val Ser Leu Pro Gln
145 150 155 160
Phe Asp Glu Leu Gly Tyr Leu Asp Pro Asp Asp Lys Thr Arg Leu Glu
165 170 175
Glu Gln Ala Ser Gly Phe Pro Met Leu Lys Val Lys Asp Ile Lys Ser
180 185 190
Ala Tyr Ser Asn Trp Gln Ile Leu Lys Glu Ile Leu Gly Lys Met Ile
195 200 205
Lys Gln Thr Lys Ala Ser Ser Gly Val Ile Trp Asn Ser Phe Lys Glu
210 215 220
Leu Glu Glu Ser Glu Leu Glu Thr Val Ile Arg Glu Ile Pro Ala Pro
225 230 235 240
Ser Phe Leu Ile Pro Leu Pro Lys His Leu Thr Ala Ser Ser Ser Ser
245 250 255
Leu Leu Asp His Asp Arg Thr Val Phe Gln Trp Leu Asp Gln Gln Pro
260 265 270
Pro Ser Ser Val Leu Tyr Val Ser Phe Gly Ser Thr Ser Glu Val Asp
275 280 285
Glu Lys Asp Phe Leu Glu Ile Ala Arg Gly Leu Val Asp Ser Lys Gln
290 295 300
Ser Phe Leu Trp Val Val Arg Pro Gly Phe Val Lys Gly Ser Thr Trp
305 310 315 320
Val Glu Pro Leu Pro Asp Gly Phe Leu Gly Glu Arg Gly Arg Ile Val
325 330 335
Lys Trp Val Pro Gln Gln Glu Val Leu Ala His Gly Ala Ile Gly Ala
340 345 350
Phe Trp Thr His Ser Gly Trp Asn Ser Thr Leu Glu Ser Val Cys Glu
355 360 365
Gly Val Pro Met Ile Phe Ser Asp Phe Gly Leu Asp Gln Pro Leu Asn
370 375 380
Ala Arg Tyr Met Ser Asp Val Leu Lys Val Gly Val Tyr Leu Glu Asn
385 390 395 400
Gly Trp Glu Arg Gly Glu Ile Ala Asn Ala Ile Arg Arg Val Met Val
405 410 415
Asp Glu Glu Gly Glu Tyr Ile Arg Gln Asn Ala Arg Val Leu Lys Gln
420 425 430
Lys Ala Asp Val Ser Leu Met Lys Gly Gly Ser Ser Tyr Glu Ser Leu
435 440 445
Glu Ser Leu Val Ser Tyr Ile Ser Ser Leu Gly Ser Gly Ala Asn Ala
450 455 460
Glu Arg Met Ile Thr Arg Val His Ser Gln Arg Glu Arg Leu Asn Glu
465 470 475 480
Thr Leu Val Ser Glu Arg Asn Glu Val Leu Ala Leu Leu Ser Arg Val
485 490 495
Glu Ala Lys Gly Lys Gly Ile Leu Gln Gln Asn Gln Ile Ile Ala Glu
500 505 510
Phe Glu Ala Leu Pro Glu Gln Thr Arg Lys Lys Leu Glu Gly Gly Pro
515 520 525
Phe Phe Asp Leu Leu Lys Ser Thr Gln Glu Ala Ile Val Leu Pro Pro
530 535 540
Trp Val Ala Leu Ala Val Arg Pro Arg Pro Gly Val Trp Glu Tyr Leu
545 550 555 560
Arg Val Asn Leu His Ala Leu Val Val Glu Glu Leu Gln Pro Ala Glu
565 570 575
Phe Leu His Phe Lys Glu Glu Leu Val Asp Gly Val Lys Asn Gly Asn
580 585 590
Phe Thr Leu Glu Leu Asp Phe Glu Pro Phe Asn Ala Ser Ile Pro Arg
595 600 605
Pro Thr Leu His Lys Tyr Ile Gly Asn Gly Val Asp Phe Leu Asn Arg
610 615 620
His Leu Ser Ala Lys Leu Phe His Asp Lys Glu Ser Leu Leu Pro Leu
625 630 635 640
Leu Lys Phe Leu Arg Leu His Ser His Gln Gly Lys Asn Leu Met Leu
645 650 655
Ser Glu Lys Ile Gln Asn Leu Asn Thr Leu Gln His Thr Leu Arg Lys
660 665 670
Ala Glu Glu Tyr Leu Ala Glu Leu Lys Ser Glu Thr Leu Tyr Glu Glu
675 680 685
Phe Glu Ala Lys Phe Glu Glu Ile Gly Leu Glu Arg Gly Trp Gly Asp
690 695 700
Asn Ala Glu Arg Val Leu Asp Met Ile Arg Leu Leu Leu Asp Leu Leu
705 710 715 720
Glu Ala Pro Asp Pro Cys Thr Leu Glu Thr Phe Leu Gly Arg Val Pro
725 730 735
Met Val Phe Asn Val Val Ile Leu Ser Pro His Gly Tyr Phe Ala Gln
740 745 750
Asp Asn Val Leu Gly Tyr Pro Asp Thr Gly Gly Gln Val Val Tyr Ile
755 760 765
Leu Asp Gln Val Arg Ala Leu Glu Ile Glu Met Leu Gln Arg Ile Lys
770 775 780
Gln Gln Gly Leu Asn Ile Lys Pro Arg Ile Leu Ile Leu Thr Arg Leu
785 790 795 800
Leu Pro Asp Ala Val Gly Thr Thr Cys Gly Glu Arg Leu Glu Arg Val
805 810 815
Tyr Asp Ser Glu Tyr Cys Asp Ile Leu Arg Val Pro Phe Arg Thr Glu
820 825 830
Lys Gly Ile Val Arg Lys Trp Ile Ser Arg Phe Glu Val Trp Pro Tyr
835 840 845
Leu Glu Thr Tyr Thr Glu Asp Ala Ala Val Glu Leu Ser Lys Glu Leu
850 855 860
Asn Gly Lys Pro Asp Leu Ile Ile Gly Asn Tyr Ser Asp Gly Asn Leu
865 870 875 880
Val Ala Ser Leu Leu Ala His Lys Leu Gly Val Thr Gln Cys Thr Ile
885 890 895
Ala His Ala Leu Glu Lys Thr Lys Tyr Pro Asp Ser Asp Ile Tyr Trp
900 905 910
Lys Lys Leu Asp Asp Lys Tyr His Phe Ser Cys Gln Phe Thr Ala Asp
915 920 925
Ile Phe Ala Met Asn His Thr Asp Phe Ile Ile Thr Ser Thr Phe Gln
930 935 940
Glu Ile Ala Gly Ser Lys Glu Thr Val Gly Gln Tyr Glu Ser His Thr
945 950 955 960
Ala Phe Thr Leu Pro Gly Leu Tyr Arg Val Val His Gly Ile Asp Val
965 970 975
Phe Asp Pro Lys Phe Asn Ile Val Ser Pro Gly Ala Asp Met Ser Ile
980 985 990
Tyr Phe Pro Tyr Thr Glu Glu Lys Arg Arg Leu Thr Lys Phe His Ser
995 1000 1005
Glu Ile Glu Glu Leu Leu Tyr Ser Asp Val Glu Asn Lys Glu His
1010 1015 1020
Leu Cys Val Leu Lys Asp Lys Lys Lys Pro Ile Leu Phe Thr Met
1025 1030 1035
Ala Arg Leu Asp Arg Val Lys Asn Leu Ser Gly Leu Val Glu Trp
1040 1045 1050
Tyr Gly Lys Asn Thr Arg Leu Arg Glu Leu Ala Asn Leu Val Val
1055 1060 1065
Val Gly Gly Asp Arg Arg Lys Glu Ser Lys Asp Asn Glu Glu Lys
1070 1075 1080
Ala Glu Met Lys Lys Met Tyr Asp Leu Ile Glu Glu Tyr Lys Leu
1085 1090 1095
Asn Gly Gln Phe Arg Trp Ile Ser Ser Gln Met Asp Arg Val Arg
1100 1105 1110
Asn Gly Glu Leu Tyr Arg Tyr Ile Cys Asp Thr Lys Gly Ala Phe
1115 1120 1125
Val Gln Pro Ala Leu Tyr Glu Ala Phe Gly Leu Thr Val Val Glu
1130 1135 1140
Ala Met Thr Cys Gly Leu Pro Thr Phe Ala Thr Cys Lys Gly Gly
1145 1150 1155
Pro Ala Glu Ile Ile Val His Gly Lys Ser Gly Phe His Ile Asp
1160 1165 1170
Pro Tyr His Gly Asp Gln Ala Ala Asp Thr Leu Ala Asp Phe Phe
1175 1180 1185
Thr Lys Cys Lys Glu Asp Pro Ser His Trp Asp Glu Ile Ser Lys
1190 1195 1200
Gly Gly Leu Gln Arg Ile Glu Glu Lys Tyr Thr Trp Gln Ile Tyr
1205 1210 1215
Ser Gln Arg Leu Leu Thr Leu Thr Gly Val Tyr Gly Phe Trp Lys
1220 1225 1230
His Val Ser Asn Leu Asp Arg Leu Glu Ala Arg Arg Tyr Leu Glu
1235 1240 1245
Met Phe Tyr Ala Leu Lys Tyr Arg Pro Leu Ala Gln Ala Val Pro
1250 1255 1260
Leu Ala Gln Asp Asp
1265
<210> 8
<211> 3807
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 8
atggagaata agacagaaac aaccgtaaga cggaggcgga ggattatctt gttccctgta 60
ccatttcagg gccatattaa tccgatcctc caattagcaa acgtcctcta ctccaaggga 120
ttttcaataa caatcttcca tactaacttt aacaagccta aaacgagtaa ttatcctcac 180
tttacattca ggttcattct agacaacgac cctcaggatg agcgtatctc aaatttacct 240
acgcatggcc ccttggcagg tatgcgaata ccaataatca atgagcatgg agccgatgaa 300
ctccgtcgcg agttagagct tctcatgctc gcaagtgagg aagacgagga agtttcgtgc 360
ctaataactg atgcgctttg gtacttcgcc caatcagtcg cagactcact gaatctacgc 420
cgtttggtcc ttatgacaag ttcattattc aactttcacg cacatgtatc actgccgcaa 480
tttgacgagt tgggttacct ggacccggat gacaaaacgc gattggagga acaagcgtcg 540
ggcttcccca tgctgaaagt caaagatatt aagagcgctt atagtaattg gcaaattctg 600
aaagaaattc tcggaaaaat gataaagcaa accaaagcgt cctctggagt aatctggaac 660
tccttcaagg agttagagga atctgaactt gaaacggtca tcagagaaat ccccgctccc 720
tcgttcttaa ttccactacc caagcacctt actgcaagta gcagttccct cctagatcat 780
gaccgaaccg tgtttcagtg gctggatcag caacccccgt cgtcagttct atatgtaagc 840
tttgggagta cttcggaagt ggatgaaaag gacttcttag agattgcgcg agggctcgtg 900
gatagcaaac agagcttcct gtgggtagtg agaccgggat tcgttaaggg ctcgacgtgg 960
gtcgagccgt tgccagatgg ttttctaggg gagagaggga gaatcgtgaa atgggttcca 1020
cagcaagagg ttttggctca cggagctata ggggcctttt ggacccactc tggttggaat 1080
tctactcttg aaagtgtctg tgaaggcgtt ccaatgatat tttctgattt tgggcttgac 1140
cagcctctaa acgctcgcta tatgtctgat gtgttgaagg ttggcgtgta cctggagaat 1200
ggttgggaaa ggggggaaat tgccaacgcc atacgccggg taatggtgga cgaggaaggt 1260
gagtacatac gtcagaacgc tcgggtttta aaacaaaaag cggacgtcag ccttatgaag 1320
ggaggtagct cctatgaatc cctagaatcc ttggtaagct atatatcttc gttaggttct 1380
ggtgcaaacg ctgaacgtat gataacgcgc gtccacagcc aacgtgagcg tttgaacgaa 1440
acgcttgttt ctgagagaaa cgaagtcctt gccttgcttt ccagggttga agccaaaggt 1500
aaaggtattt tacaacaaaa ccagatcatt gctgaattcg aagctttgcc tgaacaaacc 1560
cggaagaaac ttgaaggtgg tcctttcttt gaccttctca aatccactca ggaagcaatt 1620
gtgttgccac catgggttgc tctagctgtg aggccaaggc ctggtgtttg ggaatactta 1680
cgagtcaatc tccatgctct tgtcgttgaa gaactccaac ctgctgagtt tcttcatttc 1740
aaggaagaac tcgttgatgg agttaagaat ggtaatttca ctcttgagct tgatttcgag 1800
ccattcaatg cgtctatccc tcgtccaaca ctccacaaat acattggaaa tggtgttgac 1860
ttccttaacc gtcatttatc ggctaagctc ttccatgaca aggagagttt gcttccattg 1920
cttaagttcc ttcgtcttca cagccaccag ggcaagaacc tgatgttgag cgagaagatt 1980
cagaacctca acactctgca acacaccttg aggaaagcag aagagtatct agcagagctt 2040
aagtccgaaa cactgtatga agagtttgag gccaagtttg aggagattgg tcttgagagg 2100
ggatggggag acaatgcaga gcgtgtcctt gacatgatac gtcttctttt ggaccttctt 2160
gaggcgcctg atccttgcac tcttgagact tttcttggaa gagtaccaat ggtgttcaac 2220
gttgtgatcc tctctccaca tggttacttt gctcaggaca atgttcttgg ttaccctgac 2280
actggtggac aggttgttta cattcttgat caagttcgtg ctctggagat agagatgctt 2340
caacgtatta agcaacaagg actcaacatt aaaccaagga ttctcattct aactcgactt 2400
ctacctgatg cggtaggaac tacatgcggt gaacgtctcg agagagttta tgattctgag 2460
tactgtgata ttcttcgtgt gcccttcaga acagagaagg gtattgttcg caaatggatc 2520
tcaaggttcg aagtctggcc atatctagag acttacaccg aggatgctgc ggttgagcta 2580
tcgaaagaat tgaatggcaa gcctgacctt atcattggta actacagtga tggaaatctt 2640
gttgcttctt tattggctca caaacttggt gtcactcagt gtaccattgc tcatgctctt 2700
gagaaaacaa agtacccgga ttctgatatc tactggaaga agcttgacga caagtaccat 2760
ttctcatgcc agttcactgc ggatattttc gcaatgaacc acactgattt catcatcact 2820
agtactttcc aagaaattgc tggaagcaaa gaaactgttg ggcagtatga aagccacaca 2880
gcctttactc ttcccggatt gtatcgagtt gttcacggga ttgatgtgtt tgatcccaag 2940
ttcaacattg tctctcctgg tgctgatatg agcatctact tcccttacac agaggagaag 3000
cgtagattga ctaagttcca ctctgagatc gaggagctcc tctacagcga tgttgagaac 3060
aaagagcact tatgtgtgct caaggacaag aagaagccga ttctcttcac aatggctagg 3120
cttgatcgtg tcaagaactt gtcaggtctt gttgagtggt acgggaagaa cacccgcttg 3180
cgtgagctag ctaacttggt tgttgttgga ggagacagga ggaaagagtc aaaggacaat 3240
gaagagaaag cagagatgaa gaaaatgtat gatctcattg aggaatacaa gctaaacggt 3300
cagttcaggt ggatctcctc tcagatggac cgggtaagga acggtgagct gtaccggtac 3360
atctgtgaca ccaagggtgc ttttgtccaa cctgcattat atgaagcctt tgggttaact 3420
gttgtggagg ctatgacttg tggtttaccg actttcgcca cttgcaaagg tggtccagct 3480
gagatcattg tgcacggtaa atcgggtttc cacattgacc cttaccatgg tgatcaggct 3540
gctgatactc ttgctgattt cttcaccaag tgtaaggagg atccatctca ctgggatgag 3600
atctcaaaag gagggcttca gaggattgag gagaaataca cttggcaaat ctattcacag 3660
aggctcttga cattgactgg tgtgtatgga ttctggaagc atgtctcgaa ccttgaccgt 3720
cttgaggctc gccgttacct tgaaatgttc tatgcattga agtatcgccc attggctcag 3780
gctgttcctc ttgcacaaga tgattga 3807
<210> 9
<211> 458
<212> PRT
<213> Stevia rebaudiana
<400> 9
Met Glu Asn Lys Thr Glu Thr Thr Val Arg Arg Arg Arg Arg Ile Ile
1 5 10 15
Leu Phe Pro Val Pro Phe Gln Gly His Ile Asn Pro Ile Leu Gln Leu
20 25 30
Ala Asn Val Leu Tyr Ser Lys Gly Phe Ser Ile Thr Ile Phe His Thr
35 40 45
Asn Phe Asn Lys Pro Lys Thr Ser Asn Tyr Pro His Phe Thr Phe Arg
50 55 60
Phe Ile Leu Asp Asn Asp Pro Gln Asp Glu Arg Ile Ser Asn Leu Pro
65 70 75 80
Thr His Gly Pro Leu Ala Gly Met Arg Ile Pro Ile Ile Asn Glu His
85 90 95
Gly Ala Asp Glu Leu Arg Arg Glu Leu Glu Leu Leu Met Leu Ala Ser
100 105 110
Glu Glu Asp Glu Glu Val Ser Cys Leu Ile Thr Asp Ala Leu Trp Tyr
115 120 125
Phe Ala Gln Ser Val Ala Asp Ser Leu Asn Leu Arg Arg Leu Val Leu
130 135 140
Met Thr Ser Ser Leu Phe Asn Phe His Ala His Val Ser Leu Pro Gln
145 150 155 160
Phe Asp Glu Leu Gly Tyr Leu Asp Pro Asp Asp Lys Thr Arg Leu Glu
165 170 175
Glu Gln Ala Ser Gly Phe Pro Met Leu Lys Val Lys Asp Ile Lys Ser
180 185 190
Ala Tyr Ser Asn Trp Gln Ile Leu Lys Glu Ile Leu Gly Lys Met Ile
195 200 205
Lys Gln Thr Lys Ala Ser Ser Gly Val Ile Trp Asn Ser Phe Lys Glu
210 215 220
Leu Glu Glu Ser Glu Leu Glu Thr Val Ile Arg Glu Ile Pro Ala Pro
225 230 235 240
Ser Phe Leu Ile Pro Leu Pro Lys His Leu Thr Ala Ser Ser Ser Ser
245 250 255
Leu Leu Asp His Asp Arg Thr Val Phe Gln Trp Leu Asp Gln Gln Pro
260 265 270
Pro Ser Ser Val Leu Tyr Val Ser Phe Gly Ser Thr Ser Glu Val Asp
275 280 285
Glu Lys Asp Phe Leu Glu Ile Ala Arg Gly Leu Val Asp Ser Lys Gln
290 295 300
Ser Phe Leu Trp Val Val Arg Pro Gly Phe Val Lys Gly Ser Thr Trp
305 310 315 320
Val Glu Pro Leu Pro Asp Gly Phe Leu Gly Glu Arg Gly Arg Ile Val
325 330 335
Lys Trp Val Pro Gln Gln Glu Val Leu Ala His Gly Ala Ile Gly Ala
340 345 350
Phe Trp Thr His Ser Gly Trp Asn Ser Thr Leu Glu Ser Val Cys Glu
355 360 365
Gly Val Pro Met Ile Phe Ser Asp Phe Gly Leu Asp Gln Pro Leu Asn
370 375 380
Ala Arg Tyr Met Ser Asp Val Leu Lys Val Gly Val Tyr Leu Glu Asn
385 390 395 400
Gly Trp Glu Arg Gly Glu Ile Ala Asn Ala Ile Arg Arg Val Met Val
405 410 415
Asp Glu Glu Gly Glu Tyr Ile Arg Gln Asn Ala Arg Val Leu Lys Gln
420 425 430
Lys Ala Asp Val Ser Leu Met Lys Gly Gly Ser Ser Tyr Glu Ser Leu
435 440 445
Glu Ser Leu Val Ser Tyr Ile Ser Ser Leu
450 455
<210> 10
<211> 1377
<212> DNA
<213> Stevia rebaudiana
<400> 10
atggagaata agacagaaac aaccgtaaga cggaggcgga ggattatctt gttccctgta 60
ccatttcagg gccatattaa tccgatcctc caattagcaa acgtcctcta ctccaaggga 120
ttttcaataa caatcttcca tactaacttt aacaagccta aaacgagtaa ttatcctcac 180
tttacattca ggttcattct agacaacgac cctcaggatg agcgtatctc aaatttacct 240
acgcatggcc ccttggcagg tatgcgaata ccaataatca atgagcatgg agccgatgaa 300
ctccgtcgcg agttagagct tctcatgctc gcaagtgagg aagacgagga agtttcgtgc 360
ctaataactg atgcgctttg gtacttcgcc caatcagtcg cagactcact gaatctacgc 420
cgtttggtcc ttatgacaag ttcattattc aactttcacg cacatgtatc actgccgcaa 480
tttgacgagt tgggttacct ggacccggat gacaaaacgc gattggagga acaagcgtcg 540
ggcttcccca tgctgaaagt caaagatatt aagagcgctt atagtaattg gcaaattctg 600
aaagaaattc tcggaaaaat gataaagcaa accaaagcgt cctctggagt aatctggaac 660
tccttcaagg agttagagga atctgaactt gaaacggtca tcagagaaat ccccgctccc 720
tcgttcttaa ttccactacc caagcacctt actgcaagta gcagttccct cctagatcat 780
gaccgaaccg tgtttcagtg gctggatcag caacccccgt cgtcagttct atatgtaagc 840
tttgggagta cttcggaagt ggatgaaaag gacttcttag agattgcgcg agggctcgtg 900
gatagcaaac agagcttcct gtgggtagtg agaccgggat tcgttaaggg ctcgacgtgg 960
gtcgagccgt tgccagatgg ttttctaggg gagagaggga gaatcgtgaa atgggttcca 1020
cagcaagagg ttttggctca cggagctata ggggcctttt ggacccactc tggttggaat 1080
tctactcttg aaagtgtctg tgaaggcgtt ccaatgatat tttctgattt tgggcttgac 1140
cagcctctaa acgctcgcta tatgtctgat gtgttgaagg ttggcgtgta cctggagaat 1200
ggttgggaaa ggggggaaat tgccaacgcc atacgccggg taatggtgga cgaggaaggt 1260
gagtacatac gtcagaacgc tcgggtttta aaacaaaaag cggacgtcag ccttatgaag 1320
ggaggtagct cctatgaatc cctagaatcc ttggtaagct atatatcttc gttataa 1377
<210> 11
<211> 808
<212> PRT
<213> Arabidopsis thaliana
<400> 11
Met Ala Asn Ala Glu Arg Met Ile Thr Arg Val His Ser Gln Arg Glu
1 5 10 15
Arg Leu Asn Glu Thr Leu Val Ser Glu Arg Asn Glu Val Leu Ala Leu
20 25 30
Leu Ser Arg Val Glu Ala Lys Gly Lys Gly Ile Leu Gln Gln Asn Gln
35 40 45
Ile Ile Ala Glu Phe Glu Ala Leu Pro Glu Gln Thr Arg Lys Lys Leu
50 55 60
Glu Gly Gly Pro Phe Phe Asp Leu Leu Lys Ser Thr Gln Glu Ala Ile
65 70 75 80
Val Leu Pro Pro Trp Val Ala Leu Ala Val Arg Pro Arg Pro Gly Val
85 90 95
Trp Glu Tyr Leu Arg Val Asn Leu His Ala Leu Val Val Glu Glu Leu
100 105 110
Gln Pro Ala Glu Phe Leu His Phe Lys Glu Glu Leu Val Asp Gly Val
115 120 125
Lys Asn Gly Asn Phe Thr Leu Glu Leu Asp Phe Glu Pro Phe Asn Ala
130 135 140
Ser Ile Pro Arg Pro Thr Leu His Lys Tyr Ile Gly Asn Gly Val Asp
145 150 155 160
Phe Leu Asn Arg His Leu Ser Ala Lys Leu Phe His Asp Lys Glu Ser
165 170 175
Leu Leu Pro Leu Leu Lys Phe Leu Arg Leu His Ser His Gln Gly Lys
180 185 190
Asn Leu Met Leu Ser Glu Lys Ile Gln Asn Leu Asn Thr Leu Gln His
195 200 205
Thr Leu Arg Lys Ala Glu Glu Tyr Leu Ala Glu Leu Lys Ser Glu Thr
210 215 220
Leu Tyr Glu Glu Phe Glu Ala Lys Phe Glu Glu Ile Gly Leu Glu Arg
225 230 235 240
Gly Trp Gly Asp Asn Ala Glu Arg Val Leu Asp Met Ile Arg Leu Leu
245 250 255
Leu Asp Leu Leu Glu Ala Pro Asp Pro Cys Thr Leu Glu Thr Phe Leu
260 265 270
Gly Arg Val Pro Met Val Phe Asn Val Val Ile Leu Ser Pro His Gly
275 280 285
Tyr Phe Ala Gln Asp Asn Val Leu Gly Tyr Pro Asp Thr Gly Gly Gln
290 295 300
Val Val Tyr Ile Leu Asp Gln Val Arg Ala Leu Glu Ile Glu Met Leu
305 310 315 320
Gln Arg Ile Lys Gln Gln Gly Leu Asn Ile Lys Pro Arg Ile Leu Ile
325 330 335
Leu Thr Arg Leu Leu Pro Asp Ala Val Gly Thr Thr Cys Gly Glu Arg
340 345 350
Leu Glu Arg Val Tyr Asp Ser Glu Tyr Cys Asp Ile Leu Arg Val Pro
355 360 365
Phe Arg Thr Glu Lys Gly Ile Val Arg Lys Trp Ile Ser Arg Phe Glu
370 375 380
Val Trp Pro Tyr Leu Glu Thr Tyr Thr Glu Asp Ala Ala Val Glu Leu
385 390 395 400
Ser Lys Glu Leu Asn Gly Lys Pro Asp Leu Ile Ile Gly Asn Tyr Ser
405 410 415
Asp Gly Asn Leu Val Ala Ser Leu Leu Ala His Lys Leu Gly Val Thr
420 425 430
Gln Cys Thr Ile Ala His Ala Leu Glu Lys Thr Lys Tyr Pro Asp Ser
435 440 445
Asp Ile Tyr Trp Lys Lys Leu Asp Asp Lys Tyr His Phe Ser Cys Gln
450 455 460
Phe Thr Ala Asp Ile Phe Ala Met Asn His Thr Asp Phe Ile Ile Thr
465 470 475 480
Ser Thr Phe Gln Glu Ile Ala Gly Ser Lys Glu Thr Val Gly Gln Tyr
485 490 495
Glu Ser His Thr Ala Phe Thr Leu Pro Gly Leu Tyr Arg Val Val His
500 505 510
Gly Ile Asp Val Phe Asp Pro Lys Phe Asn Ile Val Ser Pro Gly Ala
515 520 525
Asp Met Ser Ile Tyr Phe Pro Tyr Thr Glu Glu Lys Arg Arg Leu Thr
530 535 540
Lys Phe His Ser Glu Ile Glu Glu Leu Leu Tyr Ser Asp Val Glu Asn
545 550 555 560
Lys Glu His Leu Cys Val Leu Lys Asp Lys Lys Lys Pro Ile Leu Phe
565 570 575
Thr Met Ala Arg Leu Asp Arg Val Lys Asn Leu Ser Gly Leu Val Glu
580 585 590
Trp Tyr Gly Lys Asn Thr Arg Leu Arg Glu Leu Ala Asn Leu Val Val
595 600 605
Val Gly Gly Asp Arg Arg Lys Glu Ser Lys Asp Asn Glu Glu Lys Ala
610 615 620
Glu Met Lys Lys Met Tyr Asp Leu Ile Glu Glu Tyr Lys Leu Asn Gly
625 630 635 640
Gln Phe Arg Trp Ile Ser Ser Gln Met Asp Arg Val Arg Asn Gly Glu
645 650 655
Leu Tyr Arg Tyr Ile Cys Asp Thr Lys Gly Ala Phe Val Gln Pro Ala
660 665 670
Leu Tyr Glu Ala Phe Gly Leu Thr Val Val Glu Ala Met Thr Cys Gly
675 680 685
Leu Pro Thr Phe Ala Thr Cys Lys Gly Gly Pro Ala Glu Ile Ile Val
690 695 700
His Gly Lys Ser Gly Phe His Ile Asp Pro Tyr His Gly Asp Gln Ala
705 710 715 720
Ala Asp Thr Leu Ala Asp Phe Phe Thr Lys Cys Lys Glu Asp Pro Ser
725 730 735
His Trp Asp Glu Ile Ser Lys Gly Gly Leu Gln Arg Ile Glu Glu Lys
740 745 750
Tyr Thr Trp Gln Ile Tyr Ser Gln Arg Leu Leu Thr Leu Thr Gly Val
755 760 765
Tyr Gly Phe Trp Lys His Val Ser Asn Leu Asp Arg Leu Glu Ala Arg
770 775 780
Arg Tyr Leu Glu Met Phe Tyr Ala Leu Lys Tyr Arg Pro Leu Ala Gln
785 790 795 800
Ala Val Pro Leu Ala Gln Asp Asp
805
<210> 12
<211> 2427
<212> DNA
<213> Arabidopsis thaliana
<400> 12
atggcaaacg ctgaacgtat gattacccgt gtccactccc aacgcgaacg cctgaacgaa 60
accctggtgt cggaacgcaa cgaagttctg gcactgctga gccgtgtgga agctaagggc 120
aaaggtattc tgcagcaaaa ccagattatc gcggaatttg aagccctgcc ggaacaaacc 180
cgcaaaaagc tggaaggcgg tccgtttttc gatctgctga aatctacgca ggaagcgatc 240
gttctgccgc cgtgggtcgc actggcagtg cgtccgcgtc cgggcgtttg ggaatatctg 300
cgtgtcaacc tgcatgcact ggtggttgaa gaactgcagc cggctgaatt tctgcacttc 360
aaggaagaac tggttgacgg cgtcaaaaac ggtaatttta ccctggaact ggattttgaa 420
ccgttcaatg ccagtatccc gcgtccgacg ctgcataaat atattggcaa cggtgtggac 480
tttctgaatc gccatctgag cgcaaagctg ttccacgata aagaatctct gctgccgctg 540
ctgaaattcc tgcgtctgca tagtcaccag ggcaagaacc tgatgctgtc cgaaaaaatt 600
cagaacctga ataccctgca acacacgctg cgcaaggcgg aagaatacct ggccgaactg 660
aaaagtgaaa ccctgtacga agaattcgaa gcaaagttcg aagaaattgg cctggaacgt 720
ggctggggtg acaatgctga acgtgttctg gatatgatcc gtctgctgct ggacctgctg 780
gaagcaccgg acccgtgcac cctggaaacg tttctgggtc gcgtgccgat ggttttcaac 840
gtcgtgattc tgtccccgca tggctatttt gcacaggaca atgtgctggg ttacccggat 900
accggcggtc aggttgtcta tattctggat caagttcgtg cgctggaaat tgaaatgctg 960
cagcgcatca agcagcaagg cctgaacatc aaaccgcgta ttctgatcct gacccgtctg 1020
ctgccggatg cagttggtac cacgtgcggt gaacgtctgg aacgcgtcta tgacagcgaa 1080
tactgtgata ttctgcgtgt cccgtttcgc accgaaaagg gtattgtgcg taaatggatc 1140
agtcgcttcg aagtttggcc gtatctggaa acctacacgg aagatgcggc cgtggaactg 1200
tccaaggaac tgaatggcaa accggacctg attatcggca actatagcga tggtaatctg 1260
gtcgcatctc tgctggctca taaactgggt gtgacccagt gcacgattgc acacgctctg 1320
gaaaagacca aatatccgga ttcagacatc tactggaaaa agctggatga caaatatcat 1380
ttttcgtgtc agttcaccgc ggacattttt gccatgaacc acacggattt tattatcacc 1440
agtacgttcc aggaaatcgc gggctccaaa gaaaccgtgg gtcaatacga atcacatacc 1500
gccttcacgc tgccgggcct gtatcgtgtg gttcacggta tcgatgtttt tgacccgaaa 1560
ttcaatattg tcagtccggg cgcggatatg tccatctatt ttccgtacac cgaagaaaag 1620
cgtcgcctga cgaaattcca ttcagaaatt gaagaactgc tgtactcgga cgtggaaaac 1680
aaggaacacc tgtgtgttct gaaagataaa aagaaaccga tcctgtttac catggcccgt 1740
ctggatcgcg tgaagaatct gtcaggcctg gttgaatggt atggtaaaaa cacgcgtctg 1800
cgcgaactgg caaatctggt cgtggttggc ggtgaccgtc gcaaggaatc gaaagataac 1860
gaagaaaagg ctgaaatgaa gaaaatgtac gatctgatcg aagaatacaa gctgaacggc 1920
cagtttcgtt ggatcagctc tcaaatggac cgtgtgcgca atggcgaact gtatcgctac 1980
atttgcgata ccaagggtgc gtttgttcag ccggcactgt acgaagcttt cggcctgacc 2040
gtcgtggaag ccatgacgtg cggtctgccg acctttgcga cgtgtaaagg cggtccggcc 2100
gaaattatcg tgcatggcaa atctggtttc catatcgatc cgtatcacgg tgatcaggca 2160
gctgacaccc tggcggattt ctttacgaag tgtaaagaag acccgtcaca ctgggatgaa 2220
atttcgaagg gcggtctgca acgtatcgaa gaaaaatata cctggcagat ttacagccaa 2280
cgcctgctga ccctgacggg cgtctacggt ttttggaaac atgtgtctaa tctggatcgc 2340
ctggaagccc gtcgctatct ggaaatgttt tacgcactga agtatcgccc gctggcacaa 2400
gccgttccgc tggcacagga cgactaa 2427
<210> 13
<211> 1270
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic polypeptide
<400> 13
Met Glu Asn Lys Thr Glu Thr Thr Val Arg Arg Arg Arg Arg Ile Ile
1 5 10 15
Leu Phe Pro Val Pro Phe Gln Gly His Ile Asn Pro Ile Leu Gln Leu
20 25 30
Ala Asn Val Leu Tyr Ser Lys Gly Phe Ser Ile Thr Ile Phe His Thr
35 40 45
Asn Phe Asn Lys Pro Lys Thr Ser Asn Tyr Pro His Phe Thr Phe Arg
50 55 60
Phe Ile Leu Asp Asn Asp Pro Gln Asp Glu Arg Ile Ser Asn Leu Pro
65 70 75 80
Thr His Gly Pro Leu Ala Gly Met Arg Ile Pro Ile Ile Asn Glu His
85 90 95
Gly Ala Asp Glu Leu Arg Arg Glu Leu Glu Leu Leu Met Leu Ala Ser
100 105 110
Glu Glu Asp Glu Glu Val Ser Cys Leu Ile Thr Asp Ala Leu Trp Tyr
115 120 125
Phe Ala Gln Ser Val Ala Asp Ser Leu Asn Leu Arg Arg Leu Val Leu
130 135 140
Met Thr Ser Ser Leu Phe Asn Phe His Ala His Val Ser Leu Pro Gln
145 150 155 160
Phe Asp Glu Leu Gly Tyr Leu Asp Pro Asp Asp Lys Thr Arg Leu Glu
165 170 175
Glu Gln Ala Ser Gly Phe Pro Met Leu Lys Val Lys Asp Ile Lys Ser
180 185 190
Ala Tyr Ser Asn Trp Gln Ile Ala Lys Glu Ile Leu Gly Lys Met Ile
195 200 205
Lys Gln Thr Lys Ala Ser Ser Gly Val Ile Trp Asn Ser Phe Lys Glu
210 215 220
Leu Glu Glu Ser Glu Leu Glu Thr Val Ile Arg Glu Ile Pro Ala Pro
225 230 235 240
Ser Phe Leu Ile Pro Leu Pro Lys His Leu Thr Ala Ser Ser Ser Ser
245 250 255
Leu Leu Asp His Asp Arg Thr Val Phe Gln Trp Leu Asp Gln Gln Pro
260 265 270
Pro Ser Ser Val Leu Tyr Val Ser Phe Gly Ser Thr Ser Glu Val Asp
275 280 285
Glu Lys Asp Phe Leu Glu Ile Ala Arg Gly Leu Val Asp Ser Lys Gln
290 295 300
Ser Phe Leu Trp Val Val Arg Pro Gly Phe Val Lys Gly Ser Thr Trp
305 310 315 320
Val Glu Pro Leu Pro Asp Gly Phe Leu Gly Glu Arg Gly Arg Ile Val
325 330 335
Lys Trp Val Pro Gln Gln Glu Val Leu Ala His Gly Ala Ile Gly Ala
340 345 350
Phe Trp Thr His Ser Gly Trp Asn Ser Thr Leu Glu Ser Val Cys Glu
355 360 365
Gly Val Pro Met Ile Phe Ser Asp Phe Gly Leu Asp Gln Pro Leu Asn
370 375 380
Ala Arg Tyr Met Ser Asp Val Leu Lys Val Gly Val Tyr Leu Glu Asn
385 390 395 400
Gly Trp Glu Arg Gly Glu Ile Ala Asn Ala Ile Arg Arg Val Met Val
405 410 415
Asp Glu Glu Gly Glu Tyr Ile Arg Gln Asn Ala Arg Val Leu Lys Gln
420 425 430
Lys Ala Asp Val Ser Leu Met Lys Gly Gly Ser Ser Tyr Glu Ser Leu
435 440 445
Glu Ser Leu Val Ser Tyr Ile Ser Ser Leu Gly Ser Gly Ala Asn Ala
450 455 460
Glu Arg Met Ile Thr Arg Val His Ser Gln Arg Glu Arg Leu Asn Glu
465 470 475 480
Thr Leu Val Ser Glu Arg Asn Glu Val Leu Ala Leu Leu Ser Arg Val
485 490 495
Glu Ala Lys Gly Lys Gly Ile Leu Gln Gln Asn Gln Ile Ile Ala Glu
500 505 510
Phe Glu Ala Leu Pro Glu Gln Thr Arg Lys Lys Leu Glu Gly Gly Pro
515 520 525
Phe Phe Asp Leu Leu Lys Ser Thr Gln Glu Ala Ile Val Leu Pro Pro
530 535 540
Trp Val Ala Leu Ala Val Arg Pro Arg Pro Gly Val Trp Glu Tyr Leu
545 550 555 560
Arg Val Asn Leu His Ala Leu Val Val Glu Glu Leu Gln Pro Ala Glu
565 570 575
Phe Leu His Phe Lys Glu Glu Leu Val Asp Gly Val Lys Asn Gly Asn
580 585 590
Phe Thr Leu Glu Leu Asp Phe Glu Pro Phe Asn Ala Ser Ile Pro Arg
595 600 605
Pro Thr Leu His Lys Tyr Ile Gly Asn Gly Val Asp Phe Leu Asn Arg
610 615 620
His Leu Ser Ala Lys Leu Phe His Asp Lys Glu Ser Leu Leu Pro Leu
625 630 635 640
Leu Lys Phe Leu Arg Leu His Ser His Gln Gly Lys Asn Leu Met Leu
645 650 655
Ser Glu Lys Ile Gln Asn Leu Asn Thr Leu Gln His Thr Leu Arg Lys
660 665 670
Ala Glu Glu Tyr Leu Ala Glu Leu Lys Ser Glu Thr Leu Tyr Glu Glu
675 680 685
Phe Glu Ala Lys Phe Glu Glu Ile Gly Leu Glu Arg Gly Trp Gly Asp
690 695 700
Asn Ala Glu Arg Val Leu Asp Met Ile Arg Leu Leu Leu Asp Leu Leu
705 710 715 720
Glu Ala Pro Asp Pro Cys Thr Leu Glu Thr Phe Leu Gly Arg Val Pro
725 730 735
Met Val Phe Asn Val Val Ile Leu Ser Pro His Gly Tyr Phe Ala Gln
740 745 750
Asp Asn Val Leu Gly Tyr Pro Asp Thr Gly Gly Gln Val Val Tyr Ile
755 760 765
Leu Asp Gln Val Arg Ala Leu Glu Ile Glu Met Leu Gln Arg Ile Lys
770 775 780
Gln Gln Gly Leu Asn Ile Lys Pro Arg Ile Leu Ile Leu Thr Arg Leu
785 790 795 800
Leu Pro Asp Ala Val Gly Thr Thr Cys Gly Glu Arg Leu Glu Arg Val
805 810 815
Tyr Asp Ser Glu Tyr Cys Asp Ile Leu Arg Val Pro Phe Arg Thr Glu
820 825 830
Lys Gly Ile Val Arg Lys Trp Ile Ser Arg Phe Glu Val Trp Pro Tyr
835 840 845
Leu Glu Thr Tyr Thr Glu Asp Ala Ala Val Glu Leu Ser Lys Glu Leu
850 855 860
Asn Gly Lys Pro Asp Leu Ile Ile Gly Asn Tyr Ser Asp Gly Asn Leu
865 870 875 880
Val Ala Ser Leu Leu Ala His Lys Leu Gly Val Thr Gln Cys Thr Ile
885 890 895
Ala His Ala Leu Glu Lys Thr Lys Tyr Pro Asp Ser Asp Ile Tyr Trp
900 905 910
Lys Lys Leu Asp Asp Lys Tyr His Phe Ser Cys Gln Phe Thr Ala Asp
915 920 925
Ile Phe Ala Met Asn His Thr Asp Phe Ile Ile Thr Ser Thr Phe Gln
930 935 940
Glu Ile Ala Gly Ser Lys Glu Thr Val Gly Gln Tyr Glu Ser His Thr
945 950 955 960
Ala Phe Thr Leu Pro Gly Leu Tyr Arg Val Val His Gly Ile Asp Val
965 970 975
Phe Asp Pro Lys Phe Asn Ile Val Ser Pro Gly Ala Asp Met Ser Ile
980 985 990
Tyr Phe Pro Tyr Thr Glu Glu Lys Arg Arg Leu Thr Lys Phe His Ser
995 1000 1005
Glu Ile Glu Glu Leu Leu Tyr Ser Asp Val Glu Asn Lys Glu His
1010 1015 1020
Leu Cys Val Leu Lys Asp Lys Lys Lys Pro Ile Leu Phe Thr Met
1025 1030 1035
Ala Arg Leu Asp Arg Val Lys Asn Leu Ser Gly Leu Val Glu Trp
1040 1045 1050
Tyr Gly Lys Asn Thr Arg Leu Arg Glu Leu Ala Asn Leu Val Val
1055 1060 1065
Val Gly Gly Asp Arg Arg Lys Glu Ser Lys Asp Asn Glu Glu Lys
1070 1075 1080
Ala Glu Met Lys Lys Met Tyr Asp Leu Ile Glu Glu Tyr Lys Leu
1085 1090 1095
Asn Gly Gln Phe Arg Trp Ile Ser Ser Gln Met Asp Arg Val Arg
1100 1105 1110
Asn Gly Glu Leu Tyr Arg Tyr Ile Cys Asp Thr Lys Gly Ala Phe
1115 1120 1125
Val Gln Pro Ala Leu Tyr Glu Ala Phe Gly Leu Thr Val Val Glu
1130 1135 1140
Ala Met Thr Cys Gly Leu Pro Thr Phe Ala Thr Cys Lys Gly Gly
1145 1150 1155
Pro Ala Glu Ile Ile Val His Gly Lys Ser Gly Phe His Ile Asp
1160 1165 1170
Pro Tyr His Gly Asp Gln Ala Ala Asp Thr Leu Ala Asp Phe Phe
1175 1180 1185
Thr Lys Cys Lys Glu Asp Pro Ser His Trp Asp Glu Ile Ser Lys
1190 1195 1200
Gly Gly Leu Gln Arg Ile Glu Glu Lys Tyr Thr Trp Gln Ile Tyr
1205 1210 1215
Ser Gln Arg Leu Leu Thr Leu Thr Gly Val Tyr Gly Phe Trp Lys
1220 1225 1230
His Val Ser Asn Leu Asp Arg Leu Glu Ala Arg Arg Tyr Leu Glu
1235 1240 1245
Met Phe Tyr Ala Leu Lys Tyr Arg Pro Leu Ala Gln Ala Val Pro
1250 1255 1260
Leu Ala Gln Asp Asp Trp Thr
1265 1270
<210> 14
<211> 3807
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 14
atggagaata agacagaaac aaccgtaaga cggaggcgga ggattatctt gttccctgta 60
ccatttcagg gccatattaa tccgatcctc caattagcaa acgtcctcta ctccaaggga 120
ttttcaataa caatcttcca tactaacttt aacaagccta aaacgagtaa ttatcctcac 180
tttacattca ggttcattct agacaacgac cctcaggatg agcgtatctc aaatttacct 240
acgcatggcc ccttggcagg tatgcgaata ccaataatca atgagcatgg agccgatgaa 300
ctccgtcgcg agttagagct tctcatgctc gcaagtgagg aagacgagga agtttcgtgc 360
ctaataactg atgcgctttg gtacttcgcc caatcagtcg cagactcact gaatctacgc 420
cgtttggtcc ttatgacaag ttcattattc aactttcacg cacatgtatc actgccgcaa 480
tttgacgagt tgggttacct ggacccggat gacaaaacgc gattggagga acaagcgtcg 540
ggcttcccca tgctgaaagt caaagatatt aagagcgctt atagtaattg gcaaattgcg 600
aaagaaattc tcggaaaaat gataaagcaa accaaagcgt cctctggagt aatctggaac 660
tccttcaagg agttagagga atctgaactt gaaacggtca tcagagaaat ccccgctccc 720
tcgttcttaa ttccactacc caagcacctt actgcaagta gcagttccct cctagatcat 780
gaccgaaccg tgtttcagtg gctggatcag caacccccgt cgtcagttct atatgtaagc 840
tttgggagta cttcggaagt ggatgaaaag gacttcttag agattgcgcg agggctcgtg 900
gatagcaaac agagcttcct gtgggtagtg agaccgggat tcgttaaggg ctcgacgtgg 960
gtcgagccgt tgccagatgg ttttctaggg gagagaggga gaatcgtgaa atgggttcca 1020
cagcaagagg ttttggctca cggagctata ggggcctttt ggacccactc tggttggaat 1080
tctactcttg aaagtgtctg tgaaggcgtt ccaatgatat tttctgattt tgggcttgac 1140
cagcctctaa acgctcgcta tatgtctgat gtgttgaagg ttggcgtgta cctggagaat 1200
ggttgggaaa ggggggaaat tgccaacgcc atacgccggg taatggtgga cgaggaaggt 1260
gagtacatac gtcagaacgc tcgggtttta aaacaaaaag cggacgtcag ccttatgaag 1320
ggaggtagct cctatgaatc cctagaatcc ttggtaagct atatatcttc gttaggttct 1380
ggtgcaaacg ctgaacgtat gataacgcgc gtccacagcc aacgtgagcg tttgaacgaa 1440
acgcttgttt ctgagagaaa cgaagtcctt gccttgcttt ccagggttga agccaaaggt 1500
aaaggtattt tacaacaaaa ccagatcatt gctgaattcg aagctttgcc tgaacaaacc 1560
cggaagaaac ttgaaggtgg tcctttcttt gaccttctca aatccactca ggaagcaatt 1620
gtgttgccac catgggttgc tctagctgtg aggccaaggc ctggtgtttg ggaatactta 1680
cgagtcaatc tccatgctct tgtcgttgaa gaactccaac ctgctgagtt tcttcatttc 1740
aaggaagaac tcgttgatgg agttaagaat ggtaatttca ctcttgagct tgatttcgag 1800
ccattcaatg cgtctatccc tcgtccaaca ctccacaaat acattggaaa tggtgttgac 1860
ttccttaacc gtcatttatc ggctaagctc ttccatgaca aggagagttt gcttccattg 1920
cttaagttcc ttcgtcttca cagccaccag ggcaagaacc tgatgttgag cgagaagatt 1980
cagaacctca acactctgca acacaccttg aggaaagcag aagagtatct agcagagctt 2040
aagtccgaaa cactgtatga agagtttgag gccaagtttg aggagattgg tcttgagagg 2100
ggatggggag acaatgcaga gcgtgtcctt gacatgatac gtcttctttt ggaccttctt 2160
gaggcgcctg atccttgcac tcttgagact tttcttggaa gagtaccaat ggtgttcaac 2220
gttgtgatcc tctctccaca tggttacttt gctcaggaca atgttcttgg ttaccctgac 2280
actggtggac aggttgttta cattcttgat caagttcgtg ctctggagat agagatgctt 2340
caacgtatta agcaacaagg actcaacatt aaaccaagga ttctcattct aactcgactt 2400
ctacctgatg cggtaggaac tacatgcggt gaacgtctcg agagagttta tgattctgag 2460
tactgtgata ttcttcgtgt gcccttcaga acagagaagg gtattgttcg caaatggatc 2520
tcaaggttcg aagtctggcc atatctagag acttacaccg aggatgctgc ggttgagcta 2580
tcgaaagaat tgaatggcaa gcctgacctt atcattggta actacagtga tggaaatctt 2640
gttgcttctt tattggctca caaacttggt gtcactcagt gtaccattgc tcatgctctt 2700
gagaaaacaa agtacccgga ttctgatatc tactggaaga agcttgacga caagtaccat 2760
ttctcatgcc agttcactgc ggatattttc gcaatgaacc acactgattt catcatcact 2820
agtactttcc aagaaattgc tggaagcaaa gaaactgttg ggcagtatga aagccacaca 2880
gcctttactc ttcccggatt gtatcgagtt gttcacggga ttgatgtgtt tgatcccaag 2940
ttcaacattg tctctcctgg tgctgatatg agcatctact tcccttacac agaggagaag 3000
cgtagattga ctaagttcca ctctgagatc gaggagctcc tctacagcga tgttgagaac 3060
aaagagcact tatgtgtgct caaggacaag aagaagccga ttctcttcac aatggctagg 3120
cttgatcgtg tcaagaactt gtcaggtctt gttgagtggt acgggaagaa cacccgcttg 3180
cgtgagctag ctaacttggt tgttgttgga ggagacagga ggaaagagtc aaaggacaat 3240
gaagagaaag cagagatgaa gaaaatgtat gatctcattg aggaatacaa gctaaacggt 3300
cagttcaggt ggatctcctc tcagatggac cgggtaagga acggtgagct gtaccggtac 3360
atctgtgaca ccaagggtgc ttttgtccaa cctgcattat atgaagcctt tgggttaact 3420
gttgtggagg ctatgacttg tggtttaccg actttcgcca cttgcaaagg tggtccagct 3480
gagatcattg tgcacggtaa atcgggtttc cacattgacc cttaccatgg tgatcaggct 3540
gctgatactc ttgctgattt cttcaccaag tgtaaggagg atccatctca ctgggatgag 3600
atctcaaaag gagggcttca gaggattgag gagaaataca cttggcaaat ctattcacag 3660
aggctcttga cattgactgg tgtgtatgga ttctggaagc atgtctcgaa ccttgaccgt 3720
cttgaggctc gccgttacct tgaaatgttc tatgcattga agtatcgccc attggctcag 3780
gctgttcctc ttgcacaaga tgattga 3807
<210> 15
<211> 17
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic polypeptide
<400> 15
Tyr Lys Asp Asp Ser Gly Tyr Ser Ser Ser Tyr Ala Ala Ala Ala Gly
1 5 10 15
Met
Claims (18)
- 레바우디오사이드 I(rebaudioside I)를 합성하는 방법으로서,
(a) 레바우디오사이드 A를 포함하는 스테비올 글리코사이드 조성물;
(b) 수크로스, 유리딘 다이포스페이트(UDP), 유리딘 다이포스페이트-글루코스(UDP-글루코스), 및 이들의 조합물로 이루어진 군으로부터 선택된 기질; 및
(c) 서열번호 1의 아미노산 서열을 포함하는 UDP-글리코실트랜스퍼라제 효소
를 포함하는 반응 혼합물을 준비하는 단계; 및
레바우디오사이드 I를 생산시키기에 충분한 시간 동안 상기 반응 혼합물을 인큐베이션시키는 단계
를 포함하는, 레바우디오사이드 I를 합성하는 방법. - 제1항에 있어서, 상기 스테비올 글리코사이드 조성물은 스테비아 추출물인, 레바우디오사이드 I를 합성하는 방법.
- 제1항에 있어서, 상기 반응 혼합물에 수크로스 신타제를 첨가하는 단계를 더 포함하는, 레바우디오사이드 I를 합성하는 방법.
- 제3항에 있어서, 상기 수크로스 신타제는 서열번호 11의 아미노산 서열을 포함하는 아라비돕시스 탈리아나(Arabidopsis thaliana) 수크로스 신타제 1(AtSUS1)인, 레바우디오사이드 I를 합성하는 방법.
- 제1항에 있어서, 상기 반응 혼합물은 시험관내에 있는, 레바우디오사이드 I를 합성하는 방법.
- 제1항에 있어서, 상기 반응 혼합물은 세포-기반 반응 혼합물인, 레바우디오사이드 I를 합성하는 방법.
- 제6항에 있어서, 상기 UDP-글리코실트랜스퍼라제 효소는 숙주 세포에서 발현되는, 레바우디오사이드 I를 합성하는 방법.
- 제7항에 있어서, 상기 숙주 세포는 효모, 비(non)-스테비올 글리코사이드 생산 식물, 조류(alga), 진균 및 박테리아로 이루어진 군으로부터 선택되는, 레바우디오사이드 I를 합성하는 방법.
- 제7항에 있어서, 상기 숙주 세포는 박테리아 세포인, 레바우디오사이드 I를 합성하는 방법.
- 제9항에 있어서, 상기 박테리아 세포는 이. 콜라이(E. coli) 세포인, 레바우디오사이드 I를 합성하는 방법.
- 제7항에 있어서, 상기 숙주 세포는 효모 세포인, 레바우디오사이드 I를 합성하는 방법.
- 제1항에 있어서, 상기 기질은 UDP-글루코스인, 레바우디오사이드 I를 합성하는 방법.
- 제1항에 있어서, 상기 레바우디오사이드 A는 상기 반응 혼합물 중 15 내지 50 g/ℓ의 농도를 갖는, 레바우디오사이드 I를 합성하는 방법.
- 제1항에 있어서, 상기 반응 혼합물은 35℃ 내지 45℃의 온도에서 6.5 내지 9.5의 pH 범위를 갖는, 레바우디오사이드 I를 합성하는 방법.
- 제1항에 있어서, 조질의 레바우디오사이드 I를 단리시키는 단계를 더 포함하는, 레바우디오사이드 I를 합성하는 방법.
- 제15항에 있어서, 98% 초과의 순도로 레바우디오사이드 I를 얻기 위하여 상기 조질의 레바우디오사이드 I를 결정화시키는 단계를 더 포함하는, 레바우디오사이드 I를 합성하는 방법.
- 서열번호 9에 대해서 L200A 돌연변이를 포함하는 UGT76G1 돌연변이체.
- 제17항에 있어서, 서열번호 1의 아미노산 서열을 포함하는, UGT76G1 돌연변이체.
Applications Claiming Priority (8)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862641590P | 2018-03-12 | 2018-03-12 | |
US201862682260P | 2018-06-08 | 2018-06-08 | |
US201862695252P | 2018-07-09 | 2018-07-09 | |
US16/506,892 | 2019-07-09 | ||
US16/506,892 US11447808B2 (en) | 2018-03-12 | 2019-07-09 | Biosynthetic production of steviol glycoside rebaudioside I via variant enzymes |
US16/679,032 US10883130B2 (en) | 2018-03-12 | 2019-11-08 | Biosynthetic production of steviol glycosides rebaudioside J and rebaudioside N |
US16/679,032 | 2019-11-08 | ||
PCT/US2020/041394 WO2021007423A1 (en) | 2018-03-12 | 2020-07-09 | Biosynthetic production of steviol glycoside rebaudioside i via variant enzymes |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20210153670A true KR20210153670A (ko) | 2021-12-17 |
Family
ID=67908465
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020217037306A KR20210153670A (ko) | 2018-03-12 | 2020-07-09 | 변이체 효소를 통한 스테비올 글리코사이드 레바우디오사이드 i의 생합성 생산 |
Country Status (8)
Country | Link |
---|---|
US (4) | US11447808B2 (ko) |
EP (2) | EP3765627A4 (ko) |
JP (3) | JP7365707B2 (ko) |
KR (1) | KR20210153670A (ko) |
CN (1) | CN111868252A (ko) |
BR (1) | BR112021021828A2 (ko) |
MX (1) | MX2021013721A (ko) |
WO (2) | WO2019178116A1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023121427A1 (ko) * | 2021-12-24 | 2023-06-29 | 주식회사 삼양사 | 당전이 효소 변이체 및 이를 이용한 스테비올 배당체의 제조방법 |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019178116A1 (en) | 2018-03-12 | 2019-09-19 | Conagen Inc. | Biosynthetic production of steviol glycosides rebaudioside j and rebaudioside n |
BR112021019470A2 (pt) * | 2019-03-29 | 2021-11-30 | Conagen Inc | Produção biossintética de udp-ramnose |
WO2022253282A1 (zh) * | 2021-06-01 | 2022-12-08 | 弈柯莱生物科技(上海)股份有限公司 | 一种糖基转移酶及其应用 |
Family Cites Families (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
IL128193A (en) * | 1999-01-22 | 2008-03-20 | Yeda Res & Dev | Rhamnosyl-transferase gene and uses thereof |
US20060143729A1 (en) * | 2004-06-30 | 2006-06-29 | Ceres, Inc. | Nucleotide sequences and polypeptides encoded thereby useful for modifying plant characteristics |
US8791253B2 (en) * | 2006-06-19 | 2014-07-29 | The Coca-Cola Company | Rebaudioside A composition and method for purifying rebaudioside A |
IN2012DN00733A (ko) * | 2009-07-02 | 2015-06-19 | Merz Pharma Gmbh & Co Kgaa | |
SG10201606565XA (en) * | 2011-08-08 | 2016-10-28 | Evolva Sa | Recombinant production of steviol glycosides |
US9752174B2 (en) * | 2013-05-28 | 2017-09-05 | Purecircle Sdn Bhd | High-purity steviol glycosides |
BR112014028819A2 (pt) * | 2012-05-22 | 2017-07-25 | Purecircle Sdn Bhd | glicosídeos de esteviol de pureza elevada |
US9957540B2 (en) | 2013-02-06 | 2018-05-01 | Evolva Sa | Methods for improved production of Rebaudioside D and Rebaudioside M |
US9522929B2 (en) | 2014-05-05 | 2016-12-20 | Conagen Inc. | Non-caloric sweetener |
US20170275666A1 (en) | 2014-08-19 | 2017-09-28 | The Coca-Cola Company | Methods for Preparing Rebaudioside I and Uses |
EP3189065B1 (en) * | 2014-09-02 | 2021-07-07 | PureCircle USA Inc. | Stevia extracts enriched in rebaudioside d, e, n and/or o and process for the preparation thereof. |
EP3201211B1 (en) * | 2014-10-03 | 2021-09-29 | Conagen Inc. | Non-caloric sweeteners and methods for synthesizing |
US10463062B2 (en) | 2014-11-05 | 2019-11-05 | Manus Bio Inc. | Microbial production of steviol glycosides |
US10752928B2 (en) * | 2015-04-14 | 2020-08-25 | Conagen Inc. | Production of non-caloric sweeteners using engineered whole-cell catalysts |
BR112017025705B1 (pt) * | 2015-05-29 | 2022-05-10 | Cargill, Incorporated | Método de liberação de glicosídeos de esteviol de uma célula hospedeira |
CA3007726A1 (en) | 2015-12-10 | 2017-06-15 | Evolva Sa | Production of steviol glycosides in recombinant hosts |
JP6771937B2 (ja) * | 2016-04-21 | 2020-10-21 | キヤノンメディカルシステムズ株式会社 | 医用画像表示装置および医用画像管理システム |
WO2018031955A2 (en) | 2016-08-12 | 2018-02-15 | Amyris, Inc. | Udp-dependent glycosyltransferase for high efficiency production of rebaudiosides |
KR102540615B1 (ko) * | 2016-10-14 | 2023-06-08 | 코나겐 인크. | 스테비올 글리코시드의 생합성 제조 및 이를 위한 방법 |
BR112019007882A2 (pt) | 2016-10-21 | 2019-07-02 | Pepsico Inc | método para preparar rebaudiosídeo j com o uso de método enzimático |
WO2019178116A1 (en) | 2018-03-12 | 2019-09-19 | Conagen Inc. | Biosynthetic production of steviol glycosides rebaudioside j and rebaudioside n |
AU2019304965A1 (en) * | 2018-07-16 | 2021-02-11 | Manus Bio, Inc. | Production of steviol glycosides through whole cell biotransformation |
BR112021019470A2 (pt) * | 2019-03-29 | 2021-11-30 | Conagen Inc | Produção biossintética de udp-ramnose |
MX2022000150A (es) * | 2019-06-25 | 2022-05-20 | Manus Bio Inc | Enzima de glicosiltransferasa dependiente de difosfato de uridina. |
US20240148037A1 (en) * | 2019-10-16 | 2024-05-09 | Sweegen, Inc. | Steviol glycoside formulations for food and beverages |
-
2019
- 2019-03-12 WO PCT/US2019/021876 patent/WO2019178116A1/en unknown
- 2019-03-12 CN CN201980018867.0A patent/CN111868252A/zh active Pending
- 2019-03-12 JP JP2020546338A patent/JP7365707B2/ja active Active
- 2019-03-12 EP EP19767823.8A patent/EP3765627A4/en active Pending
- 2019-07-09 US US16/506,892 patent/US11447808B2/en active Active
- 2019-11-08 US US16/679,032 patent/US10883130B2/en active Active
-
2020
- 2020-07-09 EP EP20836091.7A patent/EP3997233A4/en active Pending
- 2020-07-09 WO PCT/US2020/041394 patent/WO2021007423A1/en unknown
- 2020-07-09 BR BR112021021828A patent/BR112021021828A2/pt unknown
- 2020-07-09 MX MX2021013721A patent/MX2021013721A/es unknown
- 2020-07-09 KR KR1020217037306A patent/KR20210153670A/ko not_active Application Discontinuation
- 2020-07-09 JP JP2021571495A patent/JP7305213B2/ja active Active
- 2020-12-02 US US17/109,473 patent/US11441165B2/en active Active
-
2022
- 2022-08-12 US US17/819,423 patent/US20220411843A1/en active Pending
-
2023
- 2023-07-04 JP JP2023110059A patent/JP2023126903A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023121427A1 (ko) * | 2021-12-24 | 2023-06-29 | 주식회사 삼양사 | 당전이 효소 변이체 및 이를 이용한 스테비올 배당체의 제조방법 |
Also Published As
Publication number | Publication date |
---|---|
MX2021013721A (es) | 2021-12-10 |
EP3765627A4 (en) | 2021-10-13 |
JP7365707B2 (ja) | 2023-10-20 |
JP2021515555A (ja) | 2021-06-24 |
EP3765627A1 (en) | 2021-01-20 |
US20200087695A1 (en) | 2020-03-19 |
US10883130B2 (en) | 2021-01-05 |
WO2019178116A1 (en) | 2019-09-19 |
US11447808B2 (en) | 2022-09-20 |
CN111868252A (zh) | 2020-10-30 |
US20220411843A1 (en) | 2022-12-29 |
JP2022540306A (ja) | 2022-09-15 |
US20210189448A1 (en) | 2021-06-24 |
WO2021007423A1 (en) | 2021-01-14 |
JP7305213B2 (ja) | 2023-07-10 |
JP2023126903A (ja) | 2023-09-12 |
US11441165B2 (en) | 2022-09-13 |
BR112021021828A2 (pt) | 2022-01-04 |
EP3997233A1 (en) | 2022-05-18 |
WO2019178116A8 (en) | 2019-10-10 |
EP3997233A4 (en) | 2023-08-23 |
US20200002742A1 (en) | 2020-01-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10253344B2 (en) | Recombinant production of steviol glycosides | |
JP7305213B2 (ja) | 変異体酵素を介するステビオール配糖体レバウシオシドiの生合成的産生 | |
KR102554790B1 (ko) | 레바우디오시드 e로부터 스테비올 글리코시드 레바우디오시드 d4의 생합성 제조 | |
AU2018294258A1 (en) | Hydrolysis of steviol glycosides by beta-glucosidase | |
US20220205007A1 (en) | Biosynthetic production of steviol glycoside rebaudioside i via variant enzymes |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal |