KR20220119046A - 칸나비노이드 및 기타 프레닐화 화합물의 제조를 위한 생합성 플랫폼 - Google Patents
칸나비노이드 및 기타 프레닐화 화합물의 제조를 위한 생합성 플랫폼 Download PDFInfo
- Publication number
- KR20220119046A KR20220119046A KR1020227022019A KR20227022019A KR20220119046A KR 20220119046 A KR20220119046 A KR 20220119046A KR 1020227022019 A KR1020227022019 A KR 1020227022019A KR 20227022019 A KR20227022019 A KR 20227022019A KR 20220119046 A KR20220119046 A KR 20220119046A
- Authority
- KR
- South Korea
- Prior art keywords
- leu
- ala
- val
- gly
- ser
- Prior art date
Links
- 238000004519 manufacturing process Methods 0.000 title claims abstract description 54
- 150000001875 compounds Chemical class 0.000 title claims description 22
- 229930003827 cannabinoid Natural products 0.000 title abstract description 62
- 239000003557 cannabinoid Substances 0.000 title abstract description 62
- 229940065144 cannabinoids Drugs 0.000 title abstract description 28
- 230000001851 biosynthetic effect Effects 0.000 title description 7
- 102000004190 Enzymes Human genes 0.000 claims abstract description 134
- 108090000790 Enzymes Proteins 0.000 claims abstract description 134
- 230000037361 pathway Effects 0.000 claims abstract description 73
- 244000005700 microbiome Species 0.000 claims abstract description 55
- 238000005215 recombination Methods 0.000 claims abstract description 4
- 230000006798 recombination Effects 0.000 claims abstract description 4
- 230000035772 mutation Effects 0.000 claims description 168
- 150000001413 amino acids Chemical class 0.000 claims description 101
- SXFKFRRXJUJGSS-UHFFFAOYSA-N olivetolic acid Chemical compound CCCCCC1=CC(O)=CC(O)=C1C(O)=O SXFKFRRXJUJGSS-UHFFFAOYSA-N 0.000 claims description 91
- GVVPGTZRZFNKDS-JXMROGBWSA-N geranyl diphosphate Chemical compound CC(C)=CCC\C(C)=C\CO[P@](O)(=O)OP(O)(O)=O GVVPGTZRZFNKDS-JXMROGBWSA-N 0.000 claims description 73
- GVVPGTZRZFNKDS-YFHOEESVSA-N Geranyl diphosphate Natural products CC(C)=CCC\C(C)=C/COP(O)(=O)OP(O)(O)=O GVVPGTZRZFNKDS-YFHOEESVSA-N 0.000 claims description 70
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 59
- 230000000694 effects Effects 0.000 claims description 58
- 229920001184 polypeptide Polymers 0.000 claims description 56
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 56
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 53
- 102200092030 rs1367117 Human genes 0.000 claims description 53
- 229910052757 nitrogen Inorganic materials 0.000 claims description 50
- 229910052717 sulfur Inorganic materials 0.000 claims description 50
- 229910052720 vanadium Inorganic materials 0.000 claims description 50
- 238000000034 method Methods 0.000 claims description 45
- 102000040430 polynucleotide Human genes 0.000 claims description 41
- 108091033319 polynucleotide Proteins 0.000 claims description 41
- 239000002157 polynucleotide Substances 0.000 claims description 41
- SEEZIOZEUUMJME-VBKFSLOCSA-N Cannabigerolic acid Natural products CCCCCC1=CC(O)=C(C\C=C(\C)CCC=C(C)C)C(O)=C1C(O)=O SEEZIOZEUUMJME-VBKFSLOCSA-N 0.000 claims description 37
- SEEZIOZEUUMJME-UHFFFAOYSA-N cannabinerolic acid Natural products CCCCCC1=CC(O)=C(CC=C(C)CCC=C(C)C)C(O)=C1C(O)=O SEEZIOZEUUMJME-UHFFFAOYSA-N 0.000 claims description 37
- SEEZIOZEUUMJME-FOWTUZBSSA-N cannabigerolic acid Chemical compound CCCCCC1=CC(O)=C(C\C=C(/C)CCC=C(C)C)C(O)=C1C(O)=O SEEZIOZEUUMJME-FOWTUZBSSA-N 0.000 claims description 34
- CPJRRXSHAYUTGL-UHFFFAOYSA-N isopentenyl alcohol Chemical compound CC(=C)CCO CPJRRXSHAYUTGL-UHFFFAOYSA-N 0.000 claims description 33
- 102220272280 rs777826765 Human genes 0.000 claims description 33
- CBIDRCWHNCKSTO-UHFFFAOYSA-N prenyl diphosphate Chemical compound CC(C)=CCO[P@](O)(=O)OP(O)(O)=O CBIDRCWHNCKSTO-UHFFFAOYSA-N 0.000 claims description 32
- 238000006467 substitution reaction Methods 0.000 claims description 31
- 101001120927 Cannabis sativa 3,5,7-trioxododecanoyl-CoA synthase Proteins 0.000 claims description 30
- 239000000758 substrate Substances 0.000 claims description 25
- LIPOUNRJVLNBCD-UHFFFAOYSA-N acetyl dihydrogen phosphate Chemical compound CC(=O)OP(O)(O)=O LIPOUNRJVLNBCD-UHFFFAOYSA-N 0.000 claims description 24
- NUHSROFQTUXZQQ-UHFFFAOYSA-N isopentenyl diphosphate Chemical compound CC(=C)CCO[P@](O)(=O)OP(O)(O)=O NUHSROFQTUXZQQ-UHFFFAOYSA-N 0.000 claims description 24
- OFOBLEOULBTSOW-UHFFFAOYSA-L Malonate Chemical compound [O-]C(=O)CC([O-])=O OFOBLEOULBTSOW-UHFFFAOYSA-L 0.000 claims description 23
- 102200072128 rs104894671 Human genes 0.000 claims description 22
- 239000013598 vector Substances 0.000 claims description 22
- 108030006655 Olivetolic acid cyclases Proteins 0.000 claims description 18
- -1 isopentenyl Chemical group 0.000 claims description 18
- FAVCTJGKHFHFHJ-GXDHUFHOSA-N 3-[(2e)-3,7-dimethylocta-2,6-dienyl]-2,4-dihydroxy-6-propylbenzoic acid Chemical compound CCCC1=CC(O)=C(C\C=C(/C)CCC=C(C)C)C(O)=C1C(O)=O FAVCTJGKHFHFHJ-GXDHUFHOSA-N 0.000 claims description 17
- ASUAYTHWZCLXAN-UHFFFAOYSA-N prenol Chemical compound CC(C)=CCO ASUAYTHWZCLXAN-UHFFFAOYSA-N 0.000 claims description 17
- RIVVNGIVVYEIRS-UHFFFAOYSA-N Divaric acid Chemical compound CCCC1=CC(O)=CC(O)=C1C(O)=O RIVVNGIVVYEIRS-UHFFFAOYSA-N 0.000 claims description 16
- 230000008929 regeneration Effects 0.000 claims description 16
- 238000011069 regeneration method Methods 0.000 claims description 16
- 108010073264 malonate decarboxylase Proteins 0.000 claims description 15
- 230000002255 enzymatic effect Effects 0.000 claims description 14
- 108010052919 Hydroxyethylthiazole kinase Proteins 0.000 claims description 12
- 238000000338 in vitro Methods 0.000 claims description 12
- 102220632820 28S ribosomal protein S34, mitochondrial_L33I_mutation Human genes 0.000 claims description 11
- FERIUCNNQQJTOY-UHFFFAOYSA-M Butyrate Chemical compound CCCC([O-])=O FERIUCNNQQJTOY-UHFFFAOYSA-M 0.000 claims description 11
- FERIUCNNQQJTOY-UHFFFAOYSA-N Butyric acid Natural products CCCC(O)=O FERIUCNNQQJTOY-UHFFFAOYSA-N 0.000 claims description 11
- FUZZWVXGSFPDMH-UHFFFAOYSA-N hexanoic acid Chemical compound CCCCCC(O)=O FUZZWVXGSFPDMH-UHFFFAOYSA-N 0.000 claims description 11
- 102200002865 rs199474729 Human genes 0.000 claims description 11
- 102220120649 rs886042622 Human genes 0.000 claims description 11
- 101710199606 Oxalate-CoA ligase Proteins 0.000 claims description 10
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 claims description 9
- 229910019142 PO4 Inorganic materials 0.000 claims description 9
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 claims description 9
- 239000010452 phosphate Substances 0.000 claims description 9
- 108091000080 Phosphotransferase Proteins 0.000 claims description 8
- 239000002253 acid Substances 0.000 claims description 8
- 102000020233 phosphotransferase Human genes 0.000 claims description 8
- 230000009483 enzymatic pathway Effects 0.000 claims description 7
- 101100503323 Artemisia annua FPS1 gene Proteins 0.000 claims description 6
- 101100503326 Gibberella fujikuroi FPPS gene Proteins 0.000 claims description 6
- 108090000769 Isomerases Proteins 0.000 claims description 6
- 102000004195 Isomerases Human genes 0.000 claims description 6
- UIAFKZKHHVMJGS-UHFFFAOYSA-N 2,4-dihydroxybenzoic acid Chemical compound OC(=O)C1=CC=C(O)C=C1O UIAFKZKHHVMJGS-UHFFFAOYSA-N 0.000 claims description 5
- VWFJDQUYCIWHTN-YFVJMOTDSA-N 2-trans,6-trans-farnesyl diphosphate Chemical compound CC(C)=CCC\C(C)=C\CC\C(C)=C\CO[P@](O)(=O)OP(O)(O)=O VWFJDQUYCIWHTN-YFVJMOTDSA-N 0.000 claims description 5
- 102000004357 Transferases Human genes 0.000 claims description 5
- 108090000992 Transferases Proteins 0.000 claims description 5
- 101710183613 Diphosphomevalonate decarboxylase Proteins 0.000 claims description 4
- MQCJHQBRIPSIKA-UHFFFAOYSA-N prenyl phosphate Chemical compound CC(C)=CCOP(O)(O)=O MQCJHQBRIPSIKA-UHFFFAOYSA-N 0.000 claims description 4
- 150000005425 2,4-dihydroxybenzoic acid derivatives Chemical class 0.000 claims description 3
- 108010075293 Cannabidiolic acid synthase Proteins 0.000 claims description 2
- 229940114055 beta-resorcylic acid Drugs 0.000 claims description 2
- 239000010450 olivine Substances 0.000 claims description 2
- 229910052609 olivine Inorganic materials 0.000 claims description 2
- 102000057412 Diphosphomevalonate decarboxylases Human genes 0.000 claims 2
- 238000006243 chemical reaction Methods 0.000 abstract description 71
- 239000000126 substance Substances 0.000 abstract description 18
- 210000004671 cell-free system Anatomy 0.000 abstract description 15
- 239000002243 precursor Substances 0.000 abstract description 10
- 230000013823 prenylation Effects 0.000 abstract description 10
- 235000001014 amino acid Nutrition 0.000 description 96
- 108090000623 proteins and genes Proteins 0.000 description 83
- 241000282326 Felis catus Species 0.000 description 81
- 229940024606 amino acid Drugs 0.000 description 76
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 51
- 102000004169 proteins and genes Human genes 0.000 description 45
- 235000018102 proteins Nutrition 0.000 description 44
- 230000004048 modification Effects 0.000 description 40
- 238000012986 modification Methods 0.000 description 40
- 102000053602 DNA Human genes 0.000 description 36
- 108020004414 DNA Proteins 0.000 description 36
- 210000004027 cell Anatomy 0.000 description 33
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 32
- 108010050848 glycylleucine Proteins 0.000 description 27
- 108010093581 aspartyl-proline Proteins 0.000 description 24
- 230000014509 gene expression Effects 0.000 description 24
- 108700023175 Phosphate acetyltransferases Proteins 0.000 description 23
- 150000003505 terpenes Chemical class 0.000 description 23
- 241000880493 Leptailurus serval Species 0.000 description 22
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 22
- 239000002207 metabolite Substances 0.000 description 22
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 21
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 20
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 20
- 108010062796 arginyllysine Proteins 0.000 description 20
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 20
- 108010092060 Acetate kinase Proteins 0.000 description 19
- 108010038633 aspartylglutamate Proteins 0.000 description 19
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 18
- 239000007983 Tris buffer Substances 0.000 description 18
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 18
- 229930014544 aromatic polyketide Natural products 0.000 description 18
- 125000003822 aromatic polyketide group Chemical group 0.000 description 18
- 108010037850 glycylvaline Proteins 0.000 description 18
- 108010061238 threonyl-glycine Proteins 0.000 description 18
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 17
- 241000588724 Escherichia coli Species 0.000 description 17
- 229940098773 bovine serum albumin Drugs 0.000 description 17
- 108060004127 isopentenyl phosphate kinase Proteins 0.000 description 17
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 17
- FAVCTJGKHFHFHJ-UHFFFAOYSA-N CBGVA Natural products CCCC1=CC(O)=C(CC=C(C)CCC=C(C)C)C(O)=C1C(O)=O FAVCTJGKHFHFHJ-UHFFFAOYSA-N 0.000 description 16
- 108020004705 Codon Proteins 0.000 description 16
- YCRAFFCYWOUEOF-DLOVCJGASA-N Ala-Phe-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 YCRAFFCYWOUEOF-DLOVCJGASA-N 0.000 description 15
- 241000894006 Bacteria Species 0.000 description 15
- LTYOQGRJFJAKNA-KKIMTKSISA-N Malonyl CoA Natural products S(C(=O)CC(=O)O)CCNC(=O)CCNC(=O)[C@@H](O)C(CO[P@](=O)(O[P@](=O)(OC[C@H]1[C@@H](OP(=O)(O)O)[C@@H](O)[C@@H](n2c3ncnc(N)c3nc2)O1)O)O)(C)C LTYOQGRJFJAKNA-KKIMTKSISA-N 0.000 description 15
- 108010047495 alanylglycine Proteins 0.000 description 15
- LTYOQGRJFJAKNA-DVVLENMVSA-N malonyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)CC(O)=O)O[C@H]1N1C2=NC=NC(N)=C2N=C1 LTYOQGRJFJAKNA-DVVLENMVSA-N 0.000 description 15
- 150000007523 nucleic acids Chemical group 0.000 description 15
- WVNFNPGXYADPPO-BQBZGAKWSA-N Arg-Gly-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O WVNFNPGXYADPPO-BQBZGAKWSA-N 0.000 description 14
- BZKDJRSZWLPJNI-SRVKXCTJSA-N His-His-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O BZKDJRSZWLPJNI-SRVKXCTJSA-N 0.000 description 14
- LRALLISKBZNSKN-BQBZGAKWSA-N Met-Gly-Ser Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LRALLISKBZNSKN-BQBZGAKWSA-N 0.000 description 14
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 14
- IOVBCLGAJJXOHK-SRVKXCTJSA-N Ser-His-His Chemical compound C([C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 IOVBCLGAJJXOHK-SRVKXCTJSA-N 0.000 description 14
- ZSLZBFCDCINBPY-ZSJPKINUSA-N acetyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 ZSLZBFCDCINBPY-ZSJPKINUSA-N 0.000 description 14
- 108010044940 alanylglutamine Proteins 0.000 description 14
- 108010068265 aspartyltyrosine Proteins 0.000 description 14
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 14
- 108010028295 histidylhistidine Proteins 0.000 description 14
- 238000002360 preparation method Methods 0.000 description 14
- 239000000047 product Substances 0.000 description 14
- 108010020532 tyrosyl-proline Proteins 0.000 description 14
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 13
- 108010047857 aspartylglycine Proteins 0.000 description 13
- 102100032534 Adenosine kinase Human genes 0.000 description 12
- RDPOETHPAQEGDP-ACZMJKKPSA-N Glu-Asp-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RDPOETHPAQEGDP-ACZMJKKPSA-N 0.000 description 12
- IWAVRIPRTCJAQO-HSHDSVGOSA-N Thr-Pro-Trp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O IWAVRIPRTCJAQO-HSHDSVGOSA-N 0.000 description 12
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 12
- 238000012217 deletion Methods 0.000 description 12
- 230000037430 deletion Effects 0.000 description 12
- 108010049041 glutamylalanine Proteins 0.000 description 12
- 239000000543 intermediate Substances 0.000 description 12
- 108010029020 prolylglycine Proteins 0.000 description 12
- 102000003960 Ligases Human genes 0.000 description 11
- 108090000364 Ligases Proteins 0.000 description 11
- YQYFYUSYEDNLSD-YEPSODPASA-N Val-Thr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O YQYFYUSYEDNLSD-YEPSODPASA-N 0.000 description 11
- 108010017391 lysylvaline Proteins 0.000 description 11
- 102000039446 nucleic acids Human genes 0.000 description 11
- 108020004707 nucleic acids Proteins 0.000 description 11
- 108010076278 Adenosine kinase Proteins 0.000 description 10
- HHGYNJRJIINWAK-FXQIFTODSA-N Ala-Ala-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N HHGYNJRJIINWAK-FXQIFTODSA-N 0.000 description 10
- BUANFPRKJKJSRR-ACZMJKKPSA-N Ala-Ala-Gln Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CCC(N)=O BUANFPRKJKJSRR-ACZMJKKPSA-N 0.000 description 10
- 244000025254 Cannabis sativa Species 0.000 description 10
- CAXXTYYGFYTBPV-IUCAKERBSA-N Gln-Leu-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CAXXTYYGFYTBPV-IUCAKERBSA-N 0.000 description 10
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 10
- HPCFRQWLTRDGHT-AJNGGQMLSA-N Ile-Leu-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O HPCFRQWLTRDGHT-AJNGGQMLSA-N 0.000 description 10
- 108010065958 Isopentenyl-diphosphate Delta-isomerase Proteins 0.000 description 10
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 10
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 10
- DLZBBDSPTJBOOD-BPNCWPANSA-N Pro-Tyr-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O DLZBBDSPTJBOOD-BPNCWPANSA-N 0.000 description 10
- XYEXCEPTALHNEV-RCWTZXSCSA-N Thr-Arg-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O XYEXCEPTALHNEV-RCWTZXSCSA-N 0.000 description 10
- YFOCMOVJBQDBCE-NRPADANISA-N Val-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N YFOCMOVJBQDBCE-NRPADANISA-N 0.000 description 10
- 238000007792 addition Methods 0.000 description 10
- 108010016616 cysteinylglycine Proteins 0.000 description 10
- 108010080575 glutamyl-aspartyl-alanine Proteins 0.000 description 10
- 108010025306 histidylleucine Proteins 0.000 description 10
- 108010057821 leucylproline Proteins 0.000 description 10
- 230000037353 metabolic pathway Effects 0.000 description 10
- 239000000203 mixture Substances 0.000 description 10
- 108010024607 phenylalanylalanine Proteins 0.000 description 10
- 239000013615 primer Substances 0.000 description 10
- 239000011780 sodium chloride Substances 0.000 description 10
- 238000012360 testing method Methods 0.000 description 10
- YHFPHRUWZMEOIX-CYDGBPFRSA-N Ile-Val-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(=O)O)N YHFPHRUWZMEOIX-CYDGBPFRSA-N 0.000 description 9
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 9
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 9
- 230000006870 function Effects 0.000 description 9
- 238000003780 insertion Methods 0.000 description 9
- 230000037431 insertion Effects 0.000 description 9
- 108010054155 lysyllysine Proteins 0.000 description 9
- 238000005457 optimization Methods 0.000 description 9
- 238000003752 polymerase chain reaction Methods 0.000 description 9
- WQVFQXXBNHHPLX-ZKWXMUAHSA-N Ala-Ala-His Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O WQVFQXXBNHHPLX-ZKWXMUAHSA-N 0.000 description 8
- IKKVASZHTMKJIR-ZKWXMUAHSA-N Ala-Asp-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IKKVASZHTMKJIR-ZKWXMUAHSA-N 0.000 description 8
- CKLDHDOIYBVUNP-KBIXCLLPSA-N Ala-Ile-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O CKLDHDOIYBVUNP-KBIXCLLPSA-N 0.000 description 8
- CYBJZLQSUJEMAS-LFSVMHDDSA-N Ala-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](C)N)O CYBJZLQSUJEMAS-LFSVMHDDSA-N 0.000 description 8
- YNOCMHZSWJMGBB-GCJQMDKQSA-N Ala-Thr-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O YNOCMHZSWJMGBB-GCJQMDKQSA-N 0.000 description 8
- QMQZYILAWUOLPV-JYJNAYRXSA-N Arg-Tyr-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)CC1=CC=C(O)C=C1 QMQZYILAWUOLPV-JYJNAYRXSA-N 0.000 description 8
- 241000196324 Embryophyta Species 0.000 description 8
- 241000193385 Geobacillus stearothermophilus Species 0.000 description 8
- FHPXTPQBODWBIY-CIUDSAMLSA-N Glu-Ala-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FHPXTPQBODWBIY-CIUDSAMLSA-N 0.000 description 8
- ZPASCJBSSCRWMC-GVXVVHGQSA-N Glu-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N ZPASCJBSSCRWMC-GVXVVHGQSA-N 0.000 description 8
- KCCNSVHJSMMGFS-NRPADANISA-N Glu-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N KCCNSVHJSMMGFS-NRPADANISA-N 0.000 description 8
- YFGONBOFGGWKKY-VHSXEESVSA-N Gly-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)CN)C(=O)O YFGONBOFGGWKKY-VHSXEESVSA-N 0.000 description 8
- IRJWAYCXIYUHQE-WHFBIAKZSA-N Gly-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)CN IRJWAYCXIYUHQE-WHFBIAKZSA-N 0.000 description 8
- ZZWUYQXMIFTIIY-WEDXCCLWSA-N Gly-Thr-Leu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O ZZWUYQXMIFTIIY-WEDXCCLWSA-N 0.000 description 8
- RPZFUIQVAPZLRH-GHCJXIJMSA-N Ile-Asp-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C)C(=O)O)N RPZFUIQVAPZLRH-GHCJXIJMSA-N 0.000 description 8
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 8
- JQSXWJXBASFONF-KKUMJFAQSA-N Leu-Asp-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JQSXWJXBASFONF-KKUMJFAQSA-N 0.000 description 8
- RSFGIMMPWAXNML-MNXVOIDGSA-N Leu-Gln-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RSFGIMMPWAXNML-MNXVOIDGSA-N 0.000 description 8
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 8
- CFZZDVMBRYFFNU-QWRGUYRKSA-N Leu-His-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)NCC(O)=O CFZZDVMBRYFFNU-QWRGUYRKSA-N 0.000 description 8
- YNNPKXBBRZVIRX-IHRRRGAJSA-N Lys-Arg-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O YNNPKXBBRZVIRX-IHRRRGAJSA-N 0.000 description 8
- PBIPLDMFHAICIP-DCAQKATOSA-N Lys-Glu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PBIPLDMFHAICIP-DCAQKATOSA-N 0.000 description 8
- XOQMURBBIXRRCR-SRVKXCTJSA-N Lys-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN XOQMURBBIXRRCR-SRVKXCTJSA-N 0.000 description 8
- YLLWCSDBVGZLOW-CIUDSAMLSA-N Met-Gln-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O YLLWCSDBVGZLOW-CIUDSAMLSA-N 0.000 description 8
- HHCOOFPGNXKFGR-HJGDQZAQSA-N Met-Gln-Thr Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HHCOOFPGNXKFGR-HJGDQZAQSA-N 0.000 description 8
- XZFYRXDAULDNFX-UHFFFAOYSA-N N-L-cysteinyl-L-phenylalanine Natural products SCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UHFFFAOYSA-N 0.000 description 8
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 8
- HXOLCSYHGRNXJJ-IHRRRGAJSA-N Pro-Asp-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HXOLCSYHGRNXJJ-IHRRRGAJSA-N 0.000 description 8
- BGWKULMLUIUPKY-BQBZGAKWSA-N Pro-Ser-Gly Chemical compound OC(=O)CNC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 BGWKULMLUIUPKY-BQBZGAKWSA-N 0.000 description 8
- VDHGTOHMHHQSKG-JYJNAYRXSA-N Pro-Val-Phe Chemical compound CC(C)[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O VDHGTOHMHHQSKG-JYJNAYRXSA-N 0.000 description 8
- SGZVZUCRAVSPKQ-FXQIFTODSA-N Ser-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N SGZVZUCRAVSPKQ-FXQIFTODSA-N 0.000 description 8
- NJEMRSFGDNECGF-GCJQMDKQSA-N Thr-Ala-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O NJEMRSFGDNECGF-GCJQMDKQSA-N 0.000 description 8
- VFEHSAJCWWHDBH-RHYQMDGZSA-N Thr-Arg-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O VFEHSAJCWWHDBH-RHYQMDGZSA-N 0.000 description 8
- KZSYAEWQMJEGRZ-RHYQMDGZSA-N Thr-Leu-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O KZSYAEWQMJEGRZ-RHYQMDGZSA-N 0.000 description 8
- ZMYCLHFLHRVOEA-HEIBUPTGSA-N Thr-Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ZMYCLHFLHRVOEA-HEIBUPTGSA-N 0.000 description 8
- NFVQCNMGJILYMI-SZMVWBNQSA-N Trp-Met-Val Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O NFVQCNMGJILYMI-SZMVWBNQSA-N 0.000 description 8
- WMIUTJPFHMMUGY-ZFWWWQNUSA-N Trp-Pro-Gly Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)NCC(=O)O WMIUTJPFHMMUGY-ZFWWWQNUSA-N 0.000 description 8
- CVIXTAITYJQMPE-LAEOZQHASA-N Val-Glu-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CVIXTAITYJQMPE-LAEOZQHASA-N 0.000 description 8
- OEVFFOBAXHBXKM-HSHDSVGOSA-N Val-Trp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](C(C)C)N)O OEVFFOBAXHBXKM-HSHDSVGOSA-N 0.000 description 8
- 108010005233 alanylglutamic acid Proteins 0.000 description 8
- 108010092854 aspartyllysine Proteins 0.000 description 8
- 230000006696 biosynthetic metabolic pathway Effects 0.000 description 8
- 239000000872 buffer Substances 0.000 description 8
- 108010060199 cysteinylproline Proteins 0.000 description 8
- 108010089804 glycyl-threonine Proteins 0.000 description 8
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 8
- 108010064235 lysylglycine Proteins 0.000 description 8
- 108010038320 lysylphenylalanine Proteins 0.000 description 8
- 229930027945 nicotinamide-adenine dinucleotide Natural products 0.000 description 8
- 108010018625 phenylalanylarginine Proteins 0.000 description 8
- 108010093296 prolyl-prolyl-alanine Proteins 0.000 description 8
- 108010015796 prolylisoleucine Proteins 0.000 description 8
- 230000004044 response Effects 0.000 description 8
- 229920002477 rna polymer Polymers 0.000 description 8
- 241000894007 species Species 0.000 description 8
- 108091006112 ATPases Proteins 0.000 description 7
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 description 7
- 102000057290 Adenosine Triphosphatases Human genes 0.000 description 7
- 108091026890 Coding region Proteins 0.000 description 7
- NTNUEBVGKMVANB-NHCYSSNCSA-N Glu-Val-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O NTNUEBVGKMVANB-NHCYSSNCSA-N 0.000 description 7
- WVJNGSFKBKOKRV-AJNGGQMLSA-N Lys-Leu-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVJNGSFKBKOKRV-AJNGGQMLSA-N 0.000 description 7
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 7
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 7
- KVMZNMYZCKORIG-UBHSHLNASA-N Trp-Cys-Asp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KVMZNMYZCKORIG-UBHSHLNASA-N 0.000 description 7
- QVYFTFIBKCDHIE-ACRUOGEOSA-N Tyr-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O QVYFTFIBKCDHIE-ACRUOGEOSA-N 0.000 description 7
- 125000000539 amino acid group Chemical group 0.000 description 7
- 238000013459 approach Methods 0.000 description 7
- 238000003556 assay Methods 0.000 description 7
- 230000015572 biosynthetic process Effects 0.000 description 7
- 238000002474 experimental method Methods 0.000 description 7
- 239000013604 expression vector Substances 0.000 description 7
- 230000001965 increasing effect Effects 0.000 description 7
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 7
- 125000003729 nucleotide group Chemical group 0.000 description 7
- 229930001119 polyketide Natural products 0.000 description 7
- 108010053725 prolylvaline Proteins 0.000 description 7
- SVBXIUDNTRTKHE-CIUDSAMLSA-N Ala-Arg-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O SVBXIUDNTRTKHE-CIUDSAMLSA-N 0.000 description 6
- CVGNCMIULZNYES-WHFBIAKZSA-N Ala-Asn-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CVGNCMIULZNYES-WHFBIAKZSA-N 0.000 description 6
- NYDBKUNVSALYPX-NAKRPEOUSA-N Ala-Ile-Arg Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NYDBKUNVSALYPX-NAKRPEOUSA-N 0.000 description 6
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 6
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 6
- BFMIRJBURUXDRG-DLOVCJGASA-N Ala-Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 BFMIRJBURUXDRG-DLOVCJGASA-N 0.000 description 6
- NZGRHTKZFSVPAN-BIIVOSGPSA-N Ala-Ser-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N NZGRHTKZFSVPAN-BIIVOSGPSA-N 0.000 description 6
- YJHKTAMKPGFJCT-NRPADANISA-N Ala-Val-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O YJHKTAMKPGFJCT-NRPADANISA-N 0.000 description 6
- KJGNDQCYBNBXDA-GUBZILKMSA-N Arg-Arg-Cys Chemical compound C(C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N)CN=C(N)N KJGNDQCYBNBXDA-GUBZILKMSA-N 0.000 description 6
- KMSHNDWHPWXPEC-BQBZGAKWSA-N Arg-Asp-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KMSHNDWHPWXPEC-BQBZGAKWSA-N 0.000 description 6
- PJOPLXOCKACMLK-KKUMJFAQSA-N Arg-Tyr-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O PJOPLXOCKACMLK-KKUMJFAQSA-N 0.000 description 6
- ANAHQDPQQBDOBM-UHFFFAOYSA-N Arg-Val-Tyr Natural products CC(C)C(NC(=O)C(N)CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O ANAHQDPQQBDOBM-UHFFFAOYSA-N 0.000 description 6
- LEFKSBYHUGUWLP-ACZMJKKPSA-N Asn-Ala-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LEFKSBYHUGUWLP-ACZMJKKPSA-N 0.000 description 6
- TZFQICWZWFNIKU-KKUMJFAQSA-N Asn-Leu-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 TZFQICWZWFNIKU-KKUMJFAQSA-N 0.000 description 6
- KRXIWXCXOARFNT-ZLUOBGJFSA-N Asp-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O KRXIWXCXOARFNT-ZLUOBGJFSA-N 0.000 description 6
- UJGRZQYSNYTCAX-SRVKXCTJSA-N Asp-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UJGRZQYSNYTCAX-SRVKXCTJSA-N 0.000 description 6
- RVMXMLSYBTXCAV-VEVYYDQMSA-N Asp-Pro-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O RVMXMLSYBTXCAV-VEVYYDQMSA-N 0.000 description 6
- KUBFPYIMAGXGBT-ACZMJKKPSA-N Gln-Ser-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KUBFPYIMAGXGBT-ACZMJKKPSA-N 0.000 description 6
- ZSWGJYOZWBHROQ-RWRJDSDZSA-N Glu-Ile-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZSWGJYOZWBHROQ-RWRJDSDZSA-N 0.000 description 6
- AQNYKMCFCCZEEL-JYJNAYRXSA-N Glu-Lys-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AQNYKMCFCCZEEL-JYJNAYRXSA-N 0.000 description 6
- ZWMYUDZLXAQHCK-CIUDSAMLSA-N Glu-Met-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O ZWMYUDZLXAQHCK-CIUDSAMLSA-N 0.000 description 6
- BPLNJYHNAJVLRT-ACZMJKKPSA-N Glu-Ser-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O BPLNJYHNAJVLRT-ACZMJKKPSA-N 0.000 description 6
- ALMBZBOCGSVSAI-ACZMJKKPSA-N Glu-Ser-Asn Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ALMBZBOCGSVSAI-ACZMJKKPSA-N 0.000 description 6
- RJIVPOXLQFJRTG-LURJTMIESA-N Gly-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N RJIVPOXLQFJRTG-LURJTMIESA-N 0.000 description 6
- JPXNYFOHTHSREU-UWVGGRQHSA-N Gly-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)CN JPXNYFOHTHSREU-UWVGGRQHSA-N 0.000 description 6
- UXJHNZODTMHWRD-WHFBIAKZSA-N Gly-Asn-Ala Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O UXJHNZODTMHWRD-WHFBIAKZSA-N 0.000 description 6
- XBWMTPAIUQIWKA-BYULHYEWSA-N Gly-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CN XBWMTPAIUQIWKA-BYULHYEWSA-N 0.000 description 6
- KAJAOGBVWCYGHZ-JTQLQIEISA-N Gly-Gly-Phe Chemical compound [NH3+]CC(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KAJAOGBVWCYGHZ-JTQLQIEISA-N 0.000 description 6
- LLZXNUUIBOALNY-QWRGUYRKSA-N Gly-Leu-Lys Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN LLZXNUUIBOALNY-QWRGUYRKSA-N 0.000 description 6
- ZLCLYFGMKFCDCN-XPUUQOCRSA-N Gly-Ser-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CO)NC(=O)CN)C(O)=O ZLCLYFGMKFCDCN-XPUUQOCRSA-N 0.000 description 6
- YGHSQRJSHKYUJY-SCZZXKLOSA-N Gly-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN YGHSQRJSHKYUJY-SCZZXKLOSA-N 0.000 description 6
- VOKCBYNCZVSILJ-KKUMJFAQSA-N His-Asn-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC2=CN=CN2)N)O VOKCBYNCZVSILJ-KKUMJFAQSA-N 0.000 description 6
- OEROYDLRVAYIMQ-YUMQZZPRSA-N His-Gly-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O OEROYDLRVAYIMQ-YUMQZZPRSA-N 0.000 description 6
- NKRJALPCDNXULF-BYULHYEWSA-N Ile-Asp-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O NKRJALPCDNXULF-BYULHYEWSA-N 0.000 description 6
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 6
- BPANDPNDMJHFEV-CIUDSAMLSA-N Leu-Asp-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O BPANDPNDMJHFEV-CIUDSAMLSA-N 0.000 description 6
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 6
- POZULHZYLPGXMR-ONGXEEELSA-N Leu-Gly-Val Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O POZULHZYLPGXMR-ONGXEEELSA-N 0.000 description 6
- AMSSKPUHBUQBOQ-SRVKXCTJSA-N Leu-Ser-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N AMSSKPUHBUQBOQ-SRVKXCTJSA-N 0.000 description 6
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 6
- BGGTYDNTOYRTTR-MEYUZBJRSA-N Leu-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC(C)C)N)O BGGTYDNTOYRTTR-MEYUZBJRSA-N 0.000 description 6
- IUWMQCZOTYRXPL-ZPFDUUQYSA-N Lys-Ile-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O IUWMQCZOTYRXPL-ZPFDUUQYSA-N 0.000 description 6
- WAIHHELKYSFIQN-XUXIUFHCSA-N Lys-Ile-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O WAIHHELKYSFIQN-XUXIUFHCSA-N 0.000 description 6
- YFQSSOAGMZGXFT-MEYUZBJRSA-N Lys-Thr-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YFQSSOAGMZGXFT-MEYUZBJRSA-N 0.000 description 6
- WXHHTBVYQOSYSL-FXQIFTODSA-N Met-Ala-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O WXHHTBVYQOSYSL-FXQIFTODSA-N 0.000 description 6
- 108010079364 N-glycylalanine Proteins 0.000 description 6
- DRBBFCLWYRJSJZ-UHFFFAOYSA-N N-phosphocreatine Chemical compound OC(=O)CN(C)C(=N)NP(O)(O)=O DRBBFCLWYRJSJZ-UHFFFAOYSA-N 0.000 description 6
- 108091028043 Nucleic acid sequence Proteins 0.000 description 6
- JVTMTFMMMHAPCR-UBHSHLNASA-N Phe-Ala-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 JVTMTFMMMHAPCR-UBHSHLNASA-N 0.000 description 6
- HCTXJGRYAACKOB-SRVKXCTJSA-N Phe-Asn-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HCTXJGRYAACKOB-SRVKXCTJSA-N 0.000 description 6
- GMWNQSGWWGKTSF-LFSVMHDDSA-N Phe-Thr-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O GMWNQSGWWGKTSF-LFSVMHDDSA-N 0.000 description 6
- RYJRPPUATSKNAY-STECZYCISA-N Pro-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@@H]2CCCN2 RYJRPPUATSKNAY-STECZYCISA-N 0.000 description 6
- QUBVFEANYYWBTM-VEVYYDQMSA-N Pro-Thr-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O QUBVFEANYYWBTM-VEVYYDQMSA-N 0.000 description 6
- KKKVOZNCLALMPV-XKBZYTNZSA-N Ser-Thr-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O KKKVOZNCLALMPV-XKBZYTNZSA-N 0.000 description 6
- IGROJMCBGRFRGI-YTLHQDLWSA-N Thr-Ala-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O IGROJMCBGRFRGI-YTLHQDLWSA-N 0.000 description 6
- YZUWGFXVVZQJEI-PMVVWTBXSA-N Thr-Gly-His Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O YZUWGFXVVZQJEI-PMVVWTBXSA-N 0.000 description 6
- RRRRCRYTLZVCEN-HJGDQZAQSA-N Thr-Leu-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O RRRRCRYTLZVCEN-HJGDQZAQSA-N 0.000 description 6
- PZSDPRBZINDEJV-HTUGSXCWSA-N Thr-Phe-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O PZSDPRBZINDEJV-HTUGSXCWSA-N 0.000 description 6
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 6
- KCPFDGNYAMKZQP-KBPBESRZSA-N Tyr-Gly-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O KCPFDGNYAMKZQP-KBPBESRZSA-N 0.000 description 6
- DDRBQONWVBDQOY-GUBZILKMSA-N Val-Ala-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DDRBQONWVBDQOY-GUBZILKMSA-N 0.000 description 6
- KKHRWGYHBZORMQ-NHCYSSNCSA-N Val-Arg-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKHRWGYHBZORMQ-NHCYSSNCSA-N 0.000 description 6
- CELJCNRXKZPTCX-XPUUQOCRSA-N Val-Gly-Ala Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O CELJCNRXKZPTCX-XPUUQOCRSA-N 0.000 description 6
- KISFXYYRKKNLOP-IHRRRGAJSA-N Val-Phe-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)O)N KISFXYYRKKNLOP-IHRRRGAJSA-N 0.000 description 6
- SSYBNWFXCFNRFN-GUBZILKMSA-N Val-Pro-Ser Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O SSYBNWFXCFNRFN-GUBZILKMSA-N 0.000 description 6
- DLRZGNXCXUGIDG-KKHAAJSZSA-N Val-Thr-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O DLRZGNXCXUGIDG-KKHAAJSZSA-N 0.000 description 6
- RTJPAGFXOWEBAI-SRVKXCTJSA-N Val-Val-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RTJPAGFXOWEBAI-SRVKXCTJSA-N 0.000 description 6
- 108010045023 alanyl-prolyl-tyrosine Proteins 0.000 description 6
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 6
- 108010070944 alanylhistidine Proteins 0.000 description 6
- 108010072041 arginyl-glycyl-aspartic acid Proteins 0.000 description 6
- 108010077245 asparaginyl-proline Proteins 0.000 description 6
- 230000001580 bacterial effect Effects 0.000 description 6
- 108010006664 gamma-glutamyl-glycyl-glycine Proteins 0.000 description 6
- 108010015792 glycyllysine Proteins 0.000 description 6
- 108010077515 glycylproline Proteins 0.000 description 6
- 108010085325 histidylproline Proteins 0.000 description 6
- 108010018006 histidylserine Proteins 0.000 description 6
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 6
- 238000012269 metabolic engineering Methods 0.000 description 6
- 108010016686 methionyl-alanyl-serine Proteins 0.000 description 6
- 108010056582 methionylglutamic acid Proteins 0.000 description 6
- VLKZOEOYAKHREP-UHFFFAOYSA-N n-Hexane Chemical compound CCCCCC VLKZOEOYAKHREP-UHFFFAOYSA-N 0.000 description 6
- BOPGDPNILDQYTO-NNYOXOHSSA-N nicotinamide-adenine dinucleotide Chemical compound C1=CCC(C(=O)N)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OC[C@@H]2[C@H]([C@@H](O)[C@@H](O2)N2C3=NC=NC(N)=C3N=C2)O)O1 BOPGDPNILDQYTO-NNYOXOHSSA-N 0.000 description 6
- BKIMMITUMNQMOS-UHFFFAOYSA-N nonane Chemical compound CCCCCCCCC BKIMMITUMNQMOS-UHFFFAOYSA-N 0.000 description 6
- 239000002773 nucleotide Substances 0.000 description 6
- 108010024654 phenylalanyl-prolyl-alanine Proteins 0.000 description 6
- 150000003881 polyketide derivatives Chemical class 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 108010031719 prolyl-serine Proteins 0.000 description 6
- 239000000523 sample Substances 0.000 description 6
- 108010071207 serylmethionine Proteins 0.000 description 6
- 238000012546 transfer Methods 0.000 description 6
- 230000009466 transformation Effects 0.000 description 6
- OYSYWMMZGJSQRB-AVGNSLFASA-N Asp-Tyr-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O OYSYWMMZGJSQRB-AVGNSLFASA-N 0.000 description 5
- LOEANKRDMMVOGZ-YUMQZZPRSA-N Gly-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(O)=O)C(O)=O LOEANKRDMMVOGZ-YUMQZZPRSA-N 0.000 description 5
- IITVUURPOYGCTD-NAKRPEOUSA-N Ile-Pro-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IITVUURPOYGCTD-NAKRPEOUSA-N 0.000 description 5
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 5
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 5
- FDBTVENULFNTAL-XQQFMLRXSA-N Leu-Val-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N FDBTVENULFNTAL-XQQFMLRXSA-N 0.000 description 5
- XNKDCYABMBBEKN-IUCAKERBSA-N Lys-Gly-Gln Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O XNKDCYABMBBEKN-IUCAKERBSA-N 0.000 description 5
- 241000203407 Methanocaldococcus jannaschii Species 0.000 description 5
- XDKKMRPRRCOELJ-GUBZILKMSA-N Pro-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 XDKKMRPRRCOELJ-GUBZILKMSA-N 0.000 description 5
- FVFUOQIYDPAIJR-XIRDDKMYSA-N Ser-Trp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CO)N FVFUOQIYDPAIJR-XIRDDKMYSA-N 0.000 description 5
- AEFJNECXZCODJM-UWVGGRQHSA-N Val-Val-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C(=O)NCC([O-])=O AEFJNECXZCODJM-UWVGGRQHSA-N 0.000 description 5
- 239000000654 additive Substances 0.000 description 5
- 108010041407 alanylaspartic acid Proteins 0.000 description 5
- 230000008901 benefit Effects 0.000 description 5
- 238000005119 centrifugation Methods 0.000 description 5
- 230000007423 decrease Effects 0.000 description 5
- 230000002068 genetic effect Effects 0.000 description 5
- 108010042598 glutamyl-aspartyl-glycine Proteins 0.000 description 5
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 5
- OEXFMSFODMQEPE-HDRQGHTBSA-J hexanoyl-CoA(4-) Chemical compound O[C@@H]1[C@H](OP([O-])([O-])=O)[C@@H](COP([O-])(=O)OP([O-])(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)CCCCC)O[C@H]1N1C2=NC=NC(N)=C2N=C1 OEXFMSFODMQEPE-HDRQGHTBSA-J 0.000 description 5
- 108010036413 histidylglycine Proteins 0.000 description 5
- 230000005764 inhibitory process Effects 0.000 description 5
- 230000000670 limiting effect Effects 0.000 description 5
- 108010009298 lysylglutamic acid Proteins 0.000 description 5
- 108010083476 phenylalanyltryptophan Proteins 0.000 description 5
- 230000001105 regulatory effect Effects 0.000 description 5
- 108010048818 seryl-histidine Proteins 0.000 description 5
- 239000002904 solvent Substances 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- 230000001225 therapeutic effect Effects 0.000 description 5
- 238000013519 translation Methods 0.000 description 5
- DKJPOZOEBONHFS-ZLUOBGJFSA-N Ala-Ala-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O DKJPOZOEBONHFS-ZLUOBGJFSA-N 0.000 description 4
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 4
- LGQPPBQRUBVTIF-JBDRJPRFSA-N Ala-Ala-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LGQPPBQRUBVTIF-JBDRJPRFSA-N 0.000 description 4
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 4
- YAXNATKKPOWVCP-ZLUOBGJFSA-N Ala-Asn-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O YAXNATKKPOWVCP-ZLUOBGJFSA-N 0.000 description 4
- ZIBWKCRKNFYTPT-ZKWXMUAHSA-N Ala-Asn-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O ZIBWKCRKNFYTPT-ZKWXMUAHSA-N 0.000 description 4
- BTYTYHBSJKQBQA-GCJQMDKQSA-N Ala-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N)O BTYTYHBSJKQBQA-GCJQMDKQSA-N 0.000 description 4
- RCQRKPUXJAGEEC-ZLUOBGJFSA-N Ala-Cys-Cys Chemical compound C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(O)=O RCQRKPUXJAGEEC-ZLUOBGJFSA-N 0.000 description 4
- SFNFGFDRYJKZKN-XQXXSGGOSA-N Ala-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C)N)O SFNFGFDRYJKZKN-XQXXSGGOSA-N 0.000 description 4
- PUBLUECXJRHTBK-ACZMJKKPSA-N Ala-Glu-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O PUBLUECXJRHTBK-ACZMJKKPSA-N 0.000 description 4
- BEMGNWZECGIJOI-WDSKDSINSA-N Ala-Gly-Glu Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O BEMGNWZECGIJOI-WDSKDSINSA-N 0.000 description 4
- LMFXXZPPZDCPTA-ZKWXMUAHSA-N Ala-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N LMFXXZPPZDCPTA-ZKWXMUAHSA-N 0.000 description 4
- PNALXAODQKTNLV-JBDRJPRFSA-N Ala-Ile-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O PNALXAODQKTNLV-JBDRJPRFSA-N 0.000 description 4
- OKIKVSXTXVVFDV-MMWGEVLESA-N Ala-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N OKIKVSXTXVVFDV-MMWGEVLESA-N 0.000 description 4
- NLOMBWNGESDVJU-GUBZILKMSA-N Ala-Met-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NLOMBWNGESDVJU-GUBZILKMSA-N 0.000 description 4
- DRARURMRLANNLS-GUBZILKMSA-N Ala-Met-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O DRARURMRLANNLS-GUBZILKMSA-N 0.000 description 4
- JAQNUEWEJWBVAY-WBAXXEDZSA-N Ala-Phe-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 JAQNUEWEJWBVAY-WBAXXEDZSA-N 0.000 description 4
- VHAQSYHSDKERBS-XPUUQOCRSA-N Ala-Val-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O VHAQSYHSDKERBS-XPUUQOCRSA-N 0.000 description 4
- LYILPUNCKACNGF-NAKRPEOUSA-N Ala-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C)N LYILPUNCKACNGF-NAKRPEOUSA-N 0.000 description 4
- SQKPKIJVWHAWNF-DCAQKATOSA-N Arg-Asp-Lys Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(O)=O SQKPKIJVWHAWNF-DCAQKATOSA-N 0.000 description 4
- LMPKCSXZJSXBBL-NHCYSSNCSA-N Arg-Gln-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O LMPKCSXZJSXBBL-NHCYSSNCSA-N 0.000 description 4
- IRRMIGDCPOPZJW-ULQDDVLXSA-N Arg-His-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O IRRMIGDCPOPZJW-ULQDDVLXSA-N 0.000 description 4
- NIUDXSFNLBIWOB-DCAQKATOSA-N Arg-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NIUDXSFNLBIWOB-DCAQKATOSA-N 0.000 description 4
- KMFPQTITXUKJOV-DCAQKATOSA-N Arg-Ser-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O KMFPQTITXUKJOV-DCAQKATOSA-N 0.000 description 4
- JPAWCMXVNZPJLO-IHRRRGAJSA-N Arg-Ser-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JPAWCMXVNZPJLO-IHRRRGAJSA-N 0.000 description 4
- QLSRIZIDQXDQHK-RCWTZXSCSA-N Arg-Val-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QLSRIZIDQXDQHK-RCWTZXSCSA-N 0.000 description 4
- PDQBXRSOSCTGKY-ACZMJKKPSA-N Asn-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N PDQBXRSOSCTGKY-ACZMJKKPSA-N 0.000 description 4
- JREOBWLIZLXRIS-GUBZILKMSA-N Asn-Glu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JREOBWLIZLXRIS-GUBZILKMSA-N 0.000 description 4
- YRTOMUMWSTUQAX-FXQIFTODSA-N Asn-Pro-Asp Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O YRTOMUMWSTUQAX-FXQIFTODSA-N 0.000 description 4
- JBDLMLZNDRLDIX-HJGDQZAQSA-N Asn-Thr-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O JBDLMLZNDRLDIX-HJGDQZAQSA-N 0.000 description 4
- KBQOUDLMWYWXNP-YDHLFZDLSA-N Asn-Val-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC(=O)N)N KBQOUDLMWYWXNP-YDHLFZDLSA-N 0.000 description 4
- VPPXTHJNTYDNFJ-CIUDSAMLSA-N Asp-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N VPPXTHJNTYDNFJ-CIUDSAMLSA-N 0.000 description 4
- KHGPWGKPYHPOIK-QWRGUYRKSA-N Asp-Gly-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KHGPWGKPYHPOIK-QWRGUYRKSA-N 0.000 description 4
- MYLZFUMPZCPJCJ-NHCYSSNCSA-N Asp-Lys-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MYLZFUMPZCPJCJ-NHCYSSNCSA-N 0.000 description 4
- BRRPVTUFESPTCP-ACZMJKKPSA-N Asp-Ser-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O BRRPVTUFESPTCP-ACZMJKKPSA-N 0.000 description 4
- JSNWZMFSLIWAHS-HJGDQZAQSA-N Asp-Thr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O JSNWZMFSLIWAHS-HJGDQZAQSA-N 0.000 description 4
- RSMZEHCMIOKNMW-GSSVUCPTSA-N Asp-Thr-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RSMZEHCMIOKNMW-GSSVUCPTSA-N 0.000 description 4
- XMKXONRMGJXCJV-LAEOZQHASA-N Asp-Val-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XMKXONRMGJXCJV-LAEOZQHASA-N 0.000 description 4
- RKXVTTIQNKPCHU-KKHAAJSZSA-N Asp-Val-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O RKXVTTIQNKPCHU-KKHAAJSZSA-N 0.000 description 4
- KPENUVBHAKRDQR-GUBZILKMSA-N Cys-His-Glu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O KPENUVBHAKRDQR-GUBZILKMSA-N 0.000 description 4
- UXBYDFKFHMYYPL-XIRDDKMYSA-N Cys-His-Trp Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O UXBYDFKFHMYYPL-XIRDDKMYSA-N 0.000 description 4
- MKMKILWCRQLDFJ-DCAQKATOSA-N Cys-Lys-Arg Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MKMKILWCRQLDFJ-DCAQKATOSA-N 0.000 description 4
- 241000827781 Geobacillus sp. Species 0.000 description 4
- 241001468175 Geobacillus thermodenitrificans Species 0.000 description 4
- MLZRSFQRBDNJON-GUBZILKMSA-N Gln-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MLZRSFQRBDNJON-GUBZILKMSA-N 0.000 description 4
- PGPJSRSLQNXBDT-YUMQZZPRSA-N Gln-Arg-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O PGPJSRSLQNXBDT-YUMQZZPRSA-N 0.000 description 4
- ICDIMQAMJGDHSE-GUBZILKMSA-N Gln-His-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O ICDIMQAMJGDHSE-GUBZILKMSA-N 0.000 description 4
- JNENSVNAUWONEZ-GUBZILKMSA-N Gln-Lys-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O JNENSVNAUWONEZ-GUBZILKMSA-N 0.000 description 4
- ROHVCXBMIAAASL-HJGDQZAQSA-N Gln-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(=O)N)N)O ROHVCXBMIAAASL-HJGDQZAQSA-N 0.000 description 4
- RUFHOVYUYSNDNY-ACZMJKKPSA-N Glu-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O RUFHOVYUYSNDNY-ACZMJKKPSA-N 0.000 description 4
- OGMQXTXGLDNBSS-FXQIFTODSA-N Glu-Ala-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O OGMQXTXGLDNBSS-FXQIFTODSA-N 0.000 description 4
- ITYRYNUZHPNCIK-GUBZILKMSA-N Glu-Ala-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O ITYRYNUZHPNCIK-GUBZILKMSA-N 0.000 description 4
- ATRHMOJQJWPVBQ-DRZSPHRISA-N Glu-Ala-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ATRHMOJQJWPVBQ-DRZSPHRISA-N 0.000 description 4
- DSPQRJXOIXHOHK-WDSKDSINSA-N Glu-Asp-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O DSPQRJXOIXHOHK-WDSKDSINSA-N 0.000 description 4
- CLROYXHHUZELFX-FXQIFTODSA-N Glu-Gln-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O CLROYXHHUZELFX-FXQIFTODSA-N 0.000 description 4
- CGOHAEBMDSEKFB-FXQIFTODSA-N Glu-Glu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O CGOHAEBMDSEKFB-FXQIFTODSA-N 0.000 description 4
- SJPMNHCEWPTRBR-BQBZGAKWSA-N Glu-Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SJPMNHCEWPTRBR-BQBZGAKWSA-N 0.000 description 4
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 4
- GJBUAAAIZSRCDC-GVXVVHGQSA-N Glu-Leu-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O GJBUAAAIZSRCDC-GVXVVHGQSA-N 0.000 description 4
- SJJHXJDSNQJMMW-SRVKXCTJSA-N Glu-Lys-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O SJJHXJDSNQJMMW-SRVKXCTJSA-N 0.000 description 4
- MFNUFCFRAZPJFW-JYJNAYRXSA-N Glu-Lys-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MFNUFCFRAZPJFW-JYJNAYRXSA-N 0.000 description 4
- PYTZFYUXZZHOAD-WHFBIAKZSA-N Gly-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)CN PYTZFYUXZZHOAD-WHFBIAKZSA-N 0.000 description 4
- FZQLXNIMCPJVJE-YUMQZZPRSA-N Gly-Asp-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O FZQLXNIMCPJVJE-YUMQZZPRSA-N 0.000 description 4
- LXXLEUBUOMCAMR-NKWVEPMBSA-N Gly-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)CN)C(=O)O LXXLEUBUOMCAMR-NKWVEPMBSA-N 0.000 description 4
- PMNHJLASAAWELO-FOHZUACHSA-N Gly-Asp-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PMNHJLASAAWELO-FOHZUACHSA-N 0.000 description 4
- GDOZQTNZPCUARW-YFKPBYRVSA-N Gly-Gly-Glu Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O GDOZQTNZPCUARW-YFKPBYRVSA-N 0.000 description 4
- TVDHVLGFJSHPAX-UWVGGRQHSA-N Gly-His-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 TVDHVLGFJSHPAX-UWVGGRQHSA-N 0.000 description 4
- UHPAZODVFFYEEL-QWRGUYRKSA-N Gly-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN UHPAZODVFFYEEL-QWRGUYRKSA-N 0.000 description 4
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 4
- VEPBEGNDJYANCF-QWRGUYRKSA-N Gly-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN VEPBEGNDJYANCF-QWRGUYRKSA-N 0.000 description 4
- WZSHYFGOLPXPLL-RYUDHWBXSA-N Gly-Phe-Glu Chemical compound NCC(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CCC(O)=O)C(O)=O WZSHYFGOLPXPLL-RYUDHWBXSA-N 0.000 description 4
- YLEIWGJJBFBFHC-KBPBESRZSA-N Gly-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 YLEIWGJJBFBFHC-KBPBESRZSA-N 0.000 description 4
- NSVOVKWEKGEOQB-LURJTMIESA-N Gly-Pro-Gly Chemical compound NCC(=O)N1CCC[C@H]1C(=O)NCC(O)=O NSVOVKWEKGEOQB-LURJTMIESA-N 0.000 description 4
- GWCJMBNBFYBQCV-XPUUQOCRSA-N Gly-Val-Ala Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O GWCJMBNBFYBQCV-XPUUQOCRSA-N 0.000 description 4
- SYOJVRNQCXYEOV-XVKPBYJWSA-N Gly-Val-Glu Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SYOJVRNQCXYEOV-XVKPBYJWSA-N 0.000 description 4
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 4
- VSLXGYMEHVAJBH-DLOVCJGASA-N His-Ala-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O VSLXGYMEHVAJBH-DLOVCJGASA-N 0.000 description 4
- LMMPTUVWHCFTOT-GARJFASQSA-N His-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O LMMPTUVWHCFTOT-GARJFASQSA-N 0.000 description 4
- CMQOGWZUKPHLHL-DCAQKATOSA-N His-Cys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC1=CN=CN1)N CMQOGWZUKPHLHL-DCAQKATOSA-N 0.000 description 4
- YVCGJPIKRMGNPA-LSJOCFKGSA-N His-Met-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O YVCGJPIKRMGNPA-LSJOCFKGSA-N 0.000 description 4
- WSEITRHJRVDTRX-QTKMDUPCSA-N His-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC1=CN=CN1)N)O WSEITRHJRVDTRX-QTKMDUPCSA-N 0.000 description 4
- FBOMZVOKCZMDIG-XQQFMLRXSA-N His-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N FBOMZVOKCZMDIG-XQQFMLRXSA-N 0.000 description 4
- RWIKBYVJQAJYDP-BJDJZHNGSA-N Ile-Ala-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RWIKBYVJQAJYDP-BJDJZHNGSA-N 0.000 description 4
- PNDMHTTXXPUQJH-RWRJDSDZSA-N Ile-Glu-Thr Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H]([C@H](O)C)C(=O)O PNDMHTTXXPUQJH-RWRJDSDZSA-N 0.000 description 4
- UASTVUQJMLZWGG-PEXQALLHSA-N Ile-His-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)NCC(=O)O)N UASTVUQJMLZWGG-PEXQALLHSA-N 0.000 description 4
- YNMQUIVKEFRCPH-QSFUFRPTSA-N Ile-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)O)N YNMQUIVKEFRCPH-QSFUFRPTSA-N 0.000 description 4
- SAVXZJYTTQQQDD-QEWYBTABSA-N Ile-Phe-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N SAVXZJYTTQQQDD-QEWYBTABSA-N 0.000 description 4
- JODPUDMBQBIWCK-GHCJXIJMSA-N Ile-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O JODPUDMBQBIWCK-GHCJXIJMSA-N 0.000 description 4
- RQJUKVXWAKJDBW-SVSWQMSJSA-N Ile-Ser-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N RQJUKVXWAKJDBW-SVSWQMSJSA-N 0.000 description 4
- HXIDVIFHRYRXLZ-NAKRPEOUSA-N Ile-Ser-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)O)N HXIDVIFHRYRXLZ-NAKRPEOUSA-N 0.000 description 4
- YWCJXQKATPNPOE-UKJIMTQDSA-N Ile-Val-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YWCJXQKATPNPOE-UKJIMTQDSA-N 0.000 description 4
- PWWVAXIEGOYWEE-UHFFFAOYSA-N Isophenergan Chemical compound C1=CC=C2N(CC(C)N(C)C)C3=CC=CC=C3SC2=C1 PWWVAXIEGOYWEE-UHFFFAOYSA-N 0.000 description 4
- CQQGCWPXDHTTNF-GUBZILKMSA-N Leu-Ala-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O CQQGCWPXDHTTNF-GUBZILKMSA-N 0.000 description 4
- MYGQXVYRZMKRDB-SRVKXCTJSA-N Leu-Asp-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN MYGQXVYRZMKRDB-SRVKXCTJSA-N 0.000 description 4
- YODLGZSPTHGVQX-VJANTYMQSA-N Leu-Asp-Tyr-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N YODLGZSPTHGVQX-VJANTYMQSA-N 0.000 description 4
- YVKSMSDXKMSIRX-GUBZILKMSA-N Leu-Glu-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O YVKSMSDXKMSIRX-GUBZILKMSA-N 0.000 description 4
- HFBCHNRFRYLZNV-GUBZILKMSA-N Leu-Glu-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HFBCHNRFRYLZNV-GUBZILKMSA-N 0.000 description 4
- HQUXQAMSWFIRET-AVGNSLFASA-N Leu-Glu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HQUXQAMSWFIRET-AVGNSLFASA-N 0.000 description 4
- USLNHQZCDQJBOV-ZPFDUUQYSA-N Leu-Ile-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O USLNHQZCDQJBOV-ZPFDUUQYSA-N 0.000 description 4
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 4
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 4
- HVHRPWQEQHIQJF-AVGNSLFASA-N Leu-Lys-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HVHRPWQEQHIQJF-AVGNSLFASA-N 0.000 description 4
- FLNPJLDPGMLWAU-UWVGGRQHSA-N Leu-Met-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CC(C)C FLNPJLDPGMLWAU-UWVGGRQHSA-N 0.000 description 4
- KTOIECMYZZGVSI-BZSNNMDCSA-N Leu-Phe-His Chemical compound C([C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CC=CC=C1 KTOIECMYZZGVSI-BZSNNMDCSA-N 0.000 description 4
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 4
- LCNASHSOFMRYFO-WDCWCFNPSA-N Leu-Thr-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(N)=O LCNASHSOFMRYFO-WDCWCFNPSA-N 0.000 description 4
- SNOUHRPNNCAOPI-SZMVWBNQSA-N Leu-Trp-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N SNOUHRPNNCAOPI-SZMVWBNQSA-N 0.000 description 4
- VUBIPAHVHMZHCM-KKUMJFAQSA-N Leu-Tyr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 VUBIPAHVHMZHCM-KKUMJFAQSA-N 0.000 description 4
- AAKRWBIIGKPOKQ-ONGXEEELSA-N Leu-Val-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 4
- VKVDRTGWLVZJOM-DCAQKATOSA-N Leu-Val-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O VKVDRTGWLVZJOM-DCAQKATOSA-N 0.000 description 4
- NFLFJGGKOHYZJF-BJDJZHNGSA-N Lys-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN NFLFJGGKOHYZJF-BJDJZHNGSA-N 0.000 description 4
- SWWCDAGDQHTKIE-RHYQMDGZSA-N Lys-Arg-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWWCDAGDQHTKIE-RHYQMDGZSA-N 0.000 description 4
- GQFDWEDHOQRNLC-QWRGUYRKSA-N Lys-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN GQFDWEDHOQRNLC-QWRGUYRKSA-N 0.000 description 4
- NNKLKUUGESXCBS-KBPBESRZSA-N Lys-Gly-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O NNKLKUUGESXCBS-KBPBESRZSA-N 0.000 description 4
- OWRUUFUVXFREBD-KKUMJFAQSA-N Lys-His-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O OWRUUFUVXFREBD-KKUMJFAQSA-N 0.000 description 4
- XDPLZVNMYQOFQZ-BJDJZHNGSA-N Lys-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCCN)N XDPLZVNMYQOFQZ-BJDJZHNGSA-N 0.000 description 4
- MUXNCRWTWBMNHX-SRVKXCTJSA-N Lys-Leu-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O MUXNCRWTWBMNHX-SRVKXCTJSA-N 0.000 description 4
- HYSVGEAWTGPMOA-IHRRRGAJSA-N Lys-Pro-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O HYSVGEAWTGPMOA-IHRRRGAJSA-N 0.000 description 4
- JMNRXRPBHFGXQX-GUBZILKMSA-N Lys-Ser-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JMNRXRPBHFGXQX-GUBZILKMSA-N 0.000 description 4
- MIFFFXHMAHFACR-KATARQTJSA-N Lys-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CCCCN MIFFFXHMAHFACR-KATARQTJSA-N 0.000 description 4
- RIPJMCFGQHGHNP-RHYQMDGZSA-N Lys-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCCCN)N)O RIPJMCFGQHGHNP-RHYQMDGZSA-N 0.000 description 4
- QEVRUYFHWJJUHZ-DCAQKATOSA-N Met-Ala-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(C)C QEVRUYFHWJJUHZ-DCAQKATOSA-N 0.000 description 4
- QAHFGYLFLVGBNW-DCAQKATOSA-N Met-Ala-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN QAHFGYLFLVGBNW-DCAQKATOSA-N 0.000 description 4
- PHWSCIFNNLLUFJ-NHCYSSNCSA-N Met-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCSC)N PHWSCIFNNLLUFJ-NHCYSSNCSA-N 0.000 description 4
- MSSJHBAKDDIRMJ-SRVKXCTJSA-N Met-Lys-Gln Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O MSSJHBAKDDIRMJ-SRVKXCTJSA-N 0.000 description 4
- MIAZEQZXAFTCCG-UBHSHLNASA-N Met-Phe-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 MIAZEQZXAFTCCG-UBHSHLNASA-N 0.000 description 4
- XIGAHPDZLAYQOS-SRVKXCTJSA-N Met-Pro-Pro Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 XIGAHPDZLAYQOS-SRVKXCTJSA-N 0.000 description 4
- RMLLCGYYVZKKRT-CIUDSAMLSA-N Met-Ser-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O RMLLCGYYVZKKRT-CIUDSAMLSA-N 0.000 description 4
- IHRFZLQEQVHXFA-RHYQMDGZSA-N Met-Thr-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCCN IHRFZLQEQVHXFA-RHYQMDGZSA-N 0.000 description 4
- VZFPYFRVHMSSNA-JURCDPSOSA-N Phe-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=CC=C1 VZFPYFRVHMSSNA-JURCDPSOSA-N 0.000 description 4
- KBVJZCVLQWCJQN-KKUMJFAQSA-N Phe-Leu-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O KBVJZCVLQWCJQN-KKUMJFAQSA-N 0.000 description 4
- BNRFQGLWLQESBG-YESZJQIVSA-N Phe-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O BNRFQGLWLQESBG-YESZJQIVSA-N 0.000 description 4
- JLLJTMHNXQTMCK-UBHSHLNASA-N Phe-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 JLLJTMHNXQTMCK-UBHSHLNASA-N 0.000 description 4
- AAERWTUHZKLDLC-IHRRRGAJSA-N Phe-Pro-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O AAERWTUHZKLDLC-IHRRRGAJSA-N 0.000 description 4
- QARPMYDMYVLFMW-KKUMJFAQSA-N Phe-Pro-Glu Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(O)=O)C1=CC=CC=C1 QARPMYDMYVLFMW-KKUMJFAQSA-N 0.000 description 4
- SHUFSZDAIPLZLF-BEAPCOKYSA-N Phe-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)O SHUFSZDAIPLZLF-BEAPCOKYSA-N 0.000 description 4
- NHDVNAKDACFHPX-GUBZILKMSA-N Pro-Arg-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O NHDVNAKDACFHPX-GUBZILKMSA-N 0.000 description 4
- VCYJKOLZYPYGJV-AVGNSLFASA-N Pro-Arg-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O VCYJKOLZYPYGJV-AVGNSLFASA-N 0.000 description 4
- XQHGISDMVBTGAL-ULQDDVLXSA-N Pro-His-Phe Chemical compound C([C@@H](C(=O)[O-])NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H]1[NH2+]CCC1)C1=CC=CC=C1 XQHGISDMVBTGAL-ULQDDVLXSA-N 0.000 description 4
- FXGIMYRVJJEIIM-UWVGGRQHSA-N Pro-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FXGIMYRVJJEIIM-UWVGGRQHSA-N 0.000 description 4
- XYSXOCIWCPFOCG-IHRRRGAJSA-N Pro-Leu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XYSXOCIWCPFOCG-IHRRRGAJSA-N 0.000 description 4
- SUENWIFTSTWUKD-AVGNSLFASA-N Pro-Leu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SUENWIFTSTWUKD-AVGNSLFASA-N 0.000 description 4
- XQPHBAKJJJZOBX-SRVKXCTJSA-N Pro-Lys-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O XQPHBAKJJJZOBX-SRVKXCTJSA-N 0.000 description 4
- APIAILHCTSBGLU-JYJNAYRXSA-N Pro-Met-Phe Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@@H]2CCCN2 APIAILHCTSBGLU-JYJNAYRXSA-N 0.000 description 4
- RFWXYTJSVDUBBZ-DCAQKATOSA-N Pro-Pro-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 RFWXYTJSVDUBBZ-DCAQKATOSA-N 0.000 description 4
- FDMCIBSQRKFSTJ-RHYQMDGZSA-N Pro-Thr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O FDMCIBSQRKFSTJ-RHYQMDGZSA-N 0.000 description 4
- OOZJHTXCLJUODH-QXEWZRGKSA-N Pro-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 OOZJHTXCLJUODH-QXEWZRGKSA-N 0.000 description 4
- FIODMZKLZFLYQP-GUBZILKMSA-N Pro-Val-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FIODMZKLZFLYQP-GUBZILKMSA-N 0.000 description 4
- 241001002082 Rhodopirellula baltica SH 1 Species 0.000 description 4
- 241000385741 Rickettsia bellii RML369-C Species 0.000 description 4
- MMGJPDWSIOAGTH-ACZMJKKPSA-N Ser-Ala-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MMGJPDWSIOAGTH-ACZMJKKPSA-N 0.000 description 4
- HRNQLKCLPVKZNE-CIUDSAMLSA-N Ser-Ala-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O HRNQLKCLPVKZNE-CIUDSAMLSA-N 0.000 description 4
- DKKGAAJTDKHWOD-BIIVOSGPSA-N Ser-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N)C(=O)O DKKGAAJTDKHWOD-BIIVOSGPSA-N 0.000 description 4
- FTVRVZNYIYWJGB-ACZMJKKPSA-N Ser-Asp-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FTVRVZNYIYWJGB-ACZMJKKPSA-N 0.000 description 4
- GWMXFEMMBHOKDX-AVGNSLFASA-N Ser-Gln-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 GWMXFEMMBHOKDX-AVGNSLFASA-N 0.000 description 4
- BRGQQXQKPUCUJQ-KBIXCLLPSA-N Ser-Glu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BRGQQXQKPUCUJQ-KBIXCLLPSA-N 0.000 description 4
- LALNXSXEYFUUDD-GUBZILKMSA-N Ser-Glu-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LALNXSXEYFUUDD-GUBZILKMSA-N 0.000 description 4
- UQFYNFTYDHUIMI-WHFBIAKZSA-N Ser-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CO UQFYNFTYDHUIMI-WHFBIAKZSA-N 0.000 description 4
- SFTZWNJFZYOLBD-ZDLURKLDSA-N Ser-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO SFTZWNJFZYOLBD-ZDLURKLDSA-N 0.000 description 4
- DJACUBDEDBZKLQ-KBIXCLLPSA-N Ser-Ile-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O DJACUBDEDBZKLQ-KBIXCLLPSA-N 0.000 description 4
- ZIFYDQAFEMIZII-GUBZILKMSA-N Ser-Leu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZIFYDQAFEMIZII-GUBZILKMSA-N 0.000 description 4
- XNCUYZKGQOCOQH-YUMQZZPRSA-N Ser-Leu-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O XNCUYZKGQOCOQH-YUMQZZPRSA-N 0.000 description 4
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 4
- NNFMANHDYSVNIO-DCAQKATOSA-N Ser-Lys-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NNFMANHDYSVNIO-DCAQKATOSA-N 0.000 description 4
- LRWBCWGEUCKDTN-BJDJZHNGSA-N Ser-Lys-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LRWBCWGEUCKDTN-BJDJZHNGSA-N 0.000 description 4
- KJKQUQXDEKMPDK-FXQIFTODSA-N Ser-Met-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O KJKQUQXDEKMPDK-FXQIFTODSA-N 0.000 description 4
- MQUZANJDFOQOBX-SRVKXCTJSA-N Ser-Phe-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O MQUZANJDFOQOBX-SRVKXCTJSA-N 0.000 description 4
- QMCDMHWAKMUGJE-IHRRRGAJSA-N Ser-Phe-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O QMCDMHWAKMUGJE-IHRRRGAJSA-N 0.000 description 4
- FZXOPYUEQGDGMS-ACZMJKKPSA-N Ser-Ser-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O FZXOPYUEQGDGMS-ACZMJKKPSA-N 0.000 description 4
- PYTKULIABVRXSC-BWBBJGPYSA-N Ser-Ser-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PYTKULIABVRXSC-BWBBJGPYSA-N 0.000 description 4
- 241000187747 Streptomyces Species 0.000 description 4
- YLXAMFZYJTZXFH-OLHMAJIHSA-N Thr-Asn-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O YLXAMFZYJTZXFH-OLHMAJIHSA-N 0.000 description 4
- QGXCWPNQVCYJEL-NUMRIWBASA-N Thr-Asn-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QGXCWPNQVCYJEL-NUMRIWBASA-N 0.000 description 4
- ZUUDNCOCILSYAM-KKHAAJSZSA-N Thr-Asp-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ZUUDNCOCILSYAM-KKHAAJSZSA-N 0.000 description 4
- VUVCRYXYUUPGSB-GLLZPBPUSA-N Thr-Gln-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O VUVCRYXYUUPGSB-GLLZPBPUSA-N 0.000 description 4
- SLUWOCTZVGMURC-BFHQHQDPSA-N Thr-Gly-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O SLUWOCTZVGMURC-BFHQHQDPSA-N 0.000 description 4
- WYKJENSCCRJLRC-ZDLURKLDSA-N Thr-Gly-Cys Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N)O WYKJENSCCRJLRC-ZDLURKLDSA-N 0.000 description 4
- IMDMLDSVUSMAEJ-HJGDQZAQSA-N Thr-Leu-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IMDMLDSVUSMAEJ-HJGDQZAQSA-N 0.000 description 4
- VTVVYQOXJCZVEB-WDCWCFNPSA-N Thr-Leu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O VTVVYQOXJCZVEB-WDCWCFNPSA-N 0.000 description 4
- YOOAQCZYZHGUAZ-KATARQTJSA-N Thr-Leu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YOOAQCZYZHGUAZ-KATARQTJSA-N 0.000 description 4
- KRDSCBLRHORMRK-JXUBOQSCSA-N Thr-Lys-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O KRDSCBLRHORMRK-JXUBOQSCSA-N 0.000 description 4
- NKUIXQOJUAEIET-AQZXSJQPSA-N Trp-Asp-Thr Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@H](O)C)C(O)=O)=CNC2=C1 NKUIXQOJUAEIET-AQZXSJQPSA-N 0.000 description 4
- WPXKRJVHBXYLDT-JUKXBJQTSA-N Tyr-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CC=C(C=C2)O)N WPXKRJVHBXYLDT-JUKXBJQTSA-N 0.000 description 4
- ZOBLBMGJKVJVEV-BZSNNMDCSA-N Tyr-Lys-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N)O ZOBLBMGJKVJVEV-BZSNNMDCSA-N 0.000 description 4
- NWEGIYMHTZXVBP-JSGCOSHPSA-N Tyr-Val-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O NWEGIYMHTZXVBP-JSGCOSHPSA-N 0.000 description 4
- 108010064997 VPY tripeptide Proteins 0.000 description 4
- WOCYUGQDXPTQPY-FXQIFTODSA-N Val-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C(C)C)N WOCYUGQDXPTQPY-FXQIFTODSA-N 0.000 description 4
- AZSHAZJLOZQYAY-FXQIFTODSA-N Val-Ala-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O AZSHAZJLOZQYAY-FXQIFTODSA-N 0.000 description 4
- CFSSLXZJEMERJY-NRPADANISA-N Val-Gln-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CFSSLXZJEMERJY-NRPADANISA-N 0.000 description 4
- NYTKXWLZSNRILS-IFFSRLJSSA-N Val-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N)O NYTKXWLZSNRILS-IFFSRLJSSA-N 0.000 description 4
- XGJLNBNZNMVJRS-NRPADANISA-N Val-Glu-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O XGJLNBNZNMVJRS-NRPADANISA-N 0.000 description 4
- BRPKEERLGYNCNC-NHCYSSNCSA-N Val-Glu-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N BRPKEERLGYNCNC-NHCYSSNCSA-N 0.000 description 4
- VVZDBPBZHLQPPB-XVKPBYJWSA-N Val-Glu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VVZDBPBZHLQPPB-XVKPBYJWSA-N 0.000 description 4
- KZKMBGXCNLPYKD-YEPSODPASA-N Val-Gly-Thr Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O KZKMBGXCNLPYKD-YEPSODPASA-N 0.000 description 4
- CPGJELLYDQEDRK-NAKRPEOUSA-N Val-Ile-Ala Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](C)C(O)=O CPGJELLYDQEDRK-NAKRPEOUSA-N 0.000 description 4
- UKEVLVBHRKWECS-LSJOCFKGSA-N Val-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](C(C)C)N UKEVLVBHRKWECS-LSJOCFKGSA-N 0.000 description 4
- APQIVBCUIUDSMB-OSUNSFLBSA-N Val-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N APQIVBCUIUDSMB-OSUNSFLBSA-N 0.000 description 4
- OTJMMKPMLUNTQT-AVGNSLFASA-N Val-Leu-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N OTJMMKPMLUNTQT-AVGNSLFASA-N 0.000 description 4
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 4
- QPJSIBAOZBVELU-BPNCWPANSA-N Val-Tyr-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N QPJSIBAOZBVELU-BPNCWPANSA-N 0.000 description 4
- PMKQKNBISAOSRI-XHSDSOJGSA-N Val-Tyr-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N PMKQKNBISAOSRI-XHSDSOJGSA-N 0.000 description 4
- XJLXINKUBYWONI-DQQFMEOOSA-N [[(2r,3r,4r,5r)-5-(6-aminopurin-9-yl)-3-hydroxy-4-phosphonooxyoxolan-2-yl]methoxy-hydroxyphosphoryl] [(2s,3r,4s,5s)-5-(3-carbamoylpyridin-1-ium-1-yl)-3,4-dihydroxyoxolan-2-yl]methyl phosphate Chemical compound NC(=O)C1=CC=C[N+]([C@@H]2[C@H]([C@@H](O)[C@H](COP([O-])(=O)OP(O)(=O)OC[C@@H]3[C@H]([C@@H](OP(O)(O)=O)[C@@H](O3)N3C4=NC=NC(N)=C4N=C3)O)O2)O)=C1 XJLXINKUBYWONI-DQQFMEOOSA-N 0.000 description 4
- 108010047506 alanyl-glutaminyl-glycyl-valine Proteins 0.000 description 4
- 108010087924 alanylproline Proteins 0.000 description 4
- 108010070783 alanyltyrosine Proteins 0.000 description 4
- 108010013835 arginine glutamate Proteins 0.000 description 4
- 108060000514 aromatic prenyltransferase Proteins 0.000 description 4
- 239000006227 byproduct Substances 0.000 description 4
- 238000001952 enzyme assay Methods 0.000 description 4
- 238000009472 formulation Methods 0.000 description 4
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 4
- 108010008237 glutamyl-valyl-glycine Proteins 0.000 description 4
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 4
- 108010062266 glycyl-glycyl-argininal Proteins 0.000 description 4
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 4
- 108010074027 glycyl-seryl-phenylalanine Proteins 0.000 description 4
- 108010045126 glycyl-tyrosyl-glycine Proteins 0.000 description 4
- 108010081551 glycylphenylalanine Proteins 0.000 description 4
- 238000004128 high performance liquid chromatography Methods 0.000 description 4
- 108010040030 histidinoalanine Proteins 0.000 description 4
- 108010092114 histidylphenylalanine Proteins 0.000 description 4
- 108010034529 leucyl-lysine Proteins 0.000 description 4
- 108010030617 leucyl-phenylalanyl-valine Proteins 0.000 description 4
- 230000001404 mediated effect Effects 0.000 description 4
- 229930014626 natural product Natural products 0.000 description 4
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 4
- 108700042769 prolyl-leucyl-glycine Proteins 0.000 description 4
- 108010077112 prolyl-proline Proteins 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 108010026333 seryl-proline Proteins 0.000 description 4
- 229960004295 valine Drugs 0.000 description 4
- 108010015385 valyl-prolyl-proline Proteins 0.000 description 4
- WFDIJRYMOXRFFG-UHFFFAOYSA-N Acetic anhydride Chemical compound CC(=O)OC(C)=O WFDIJRYMOXRFFG-UHFFFAOYSA-N 0.000 description 3
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 3
- 241000589158 Agrobacterium Species 0.000 description 3
- PXKLCFFSVLKOJM-ACZMJKKPSA-N Ala-Asn-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PXKLCFFSVLKOJM-ACZMJKKPSA-N 0.000 description 3
- SUHLZMHFRALVSY-YUMQZZPRSA-N Ala-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)NCC(O)=O SUHLZMHFRALVSY-YUMQZZPRSA-N 0.000 description 3
- 241000203069 Archaea Species 0.000 description 3
- 239000004475 Arginine Substances 0.000 description 3
- XVVOVPFMILMHPX-ZLUOBGJFSA-N Asn-Asp-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XVVOVPFMILMHPX-ZLUOBGJFSA-N 0.000 description 3
- 102000004420 Creatine Kinase Human genes 0.000 description 3
- 108010042126 Creatine kinase Proteins 0.000 description 3
- XFAUJGNLHIGXET-AVGNSLFASA-N Gln-Leu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XFAUJGNLHIGXET-AVGNSLFASA-N 0.000 description 3
- CCQOOWAONKGYKQ-BYPYZUCNSA-N Gly-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)CN CCQOOWAONKGYKQ-BYPYZUCNSA-N 0.000 description 3
- MKWSZEHGHSLNPF-NAKRPEOUSA-N Ile-Ala-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O)N MKWSZEHGHSLNPF-NAKRPEOUSA-N 0.000 description 3
- LLZLRXBTOOFODM-QSFUFRPTSA-N Ile-Asp-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N LLZLRXBTOOFODM-QSFUFRPTSA-N 0.000 description 3
- GVKKVHNRTUFCCE-BJDJZHNGSA-N Ile-Leu-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)O)N GVKKVHNRTUFCCE-BJDJZHNGSA-N 0.000 description 3
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 3
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 3
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 3
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 3
- RVVBWTWPNFDYBE-SRVKXCTJSA-N Leu-Glu-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVVBWTWPNFDYBE-SRVKXCTJSA-N 0.000 description 3
- VWHGTYCRDRBSFI-ZETCQYMHSA-N Leu-Gly-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)NCC(O)=O VWHGTYCRDRBSFI-ZETCQYMHSA-N 0.000 description 3
- ZRHDPZAAWLXXIR-SRVKXCTJSA-N Leu-Lys-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O ZRHDPZAAWLXXIR-SRVKXCTJSA-N 0.000 description 3
- BIZNDKMFQHDOIE-KKUMJFAQSA-N Leu-Phe-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=CC=C1 BIZNDKMFQHDOIE-KKUMJFAQSA-N 0.000 description 3
- PBLLTSKBTAHDNA-KBPBESRZSA-N Lys-Gly-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PBLLTSKBTAHDNA-KBPBESRZSA-N 0.000 description 3
- 239000004472 Lysine Substances 0.000 description 3
- IRMPFYJSHJGOPE-UHFFFAOYSA-N Olivetol Natural products CCCCCC1=CC(O)=CC(O)=C1 IRMPFYJSHJGOPE-UHFFFAOYSA-N 0.000 description 3
- HTTYNOXBBOWZTB-SRVKXCTJSA-N Phe-Asn-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N HTTYNOXBBOWZTB-SRVKXCTJSA-N 0.000 description 3
- JEBWZLWTRPZQRX-QWRGUYRKSA-N Phe-Gly-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O JEBWZLWTRPZQRX-QWRGUYRKSA-N 0.000 description 3
- MVIJMIZJPHQGEN-IHRRRGAJSA-N Phe-Ser-Val Chemical compound CC(C)[C@@H](C([O-])=O)NC(=O)[C@H](CO)NC(=O)[C@@H]([NH3+])CC1=CC=CC=C1 MVIJMIZJPHQGEN-IHRRRGAJSA-N 0.000 description 3
- 241000190950 Rhodopseudomonas palustris Species 0.000 description 3
- BYIROAKULFFTEK-CIUDSAMLSA-N Ser-Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CO BYIROAKULFFTEK-CIUDSAMLSA-N 0.000 description 3
- JIPVNVNKXJLFJF-BJDJZHNGSA-N Ser-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N JIPVNVNKXJLFJF-BJDJZHNGSA-N 0.000 description 3
- DKGRNFUXVTYRAS-UBHSHLNASA-N Ser-Ser-Trp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O DKGRNFUXVTYRAS-UBHSHLNASA-N 0.000 description 3
- 241000187180 Streptomyces sp. Species 0.000 description 3
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 3
- 239000004473 Threonine Substances 0.000 description 3
- OJOMXGVLFKYDKP-QXEWZRGKSA-N Val-Met-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)O)C(=O)O)N OJOMXGVLFKYDKP-QXEWZRGKSA-N 0.000 description 3
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 3
- 238000002835 absorbance Methods 0.000 description 3
- 238000009825 accumulation Methods 0.000 description 3
- 229960003767 alanine Drugs 0.000 description 3
- 235000004279 alanine Nutrition 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 3
- 125000003118 aryl group Chemical group 0.000 description 3
- 239000007795 chemical reaction product Substances 0.000 description 3
- 238000010367 cloning Methods 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 3
- 238000006911 enzymatic reaction Methods 0.000 description 3
- 238000010353 genetic engineering Methods 0.000 description 3
- 108010075431 glycyl-alanyl-phenylalanine Proteins 0.000 description 3
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 3
- 230000001976 improved effect Effects 0.000 description 3
- 230000002779 inactivation Effects 0.000 description 3
- 229960000310 isoleucine Drugs 0.000 description 3
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 3
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 3
- 239000006166 lysate Substances 0.000 description 3
- 108010045397 lysyl-tyrosyl-lysine Proteins 0.000 description 3
- 230000002503 metabolic effect Effects 0.000 description 3
- 230000000813 microbial effect Effects 0.000 description 3
- 238000010647 peptide synthesis reaction Methods 0.000 description 3
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 3
- 125000001474 phenylpropanoid group Chemical group 0.000 description 3
- 125000001844 prenyl group Chemical group [H]C([*])([H])C([H])=C(C([H])([H])[H])C([H])([H])[H] 0.000 description 3
- 108010070643 prolylglutamic acid Proteins 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 239000006228 supernatant Substances 0.000 description 3
- 229960002898 threonine Drugs 0.000 description 3
- 238000013518 transcription Methods 0.000 description 3
- 230000035897 transcription Effects 0.000 description 3
- 108010080629 tryptophan-leucine Proteins 0.000 description 3
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 3
- 239000004474 valine Substances 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- WDVIDPRACNGFPP-QWRGUYRKSA-N (2s)-2-[[(2s)-6-amino-2-[[2-[(2-aminoacetyl)amino]acetyl]amino]hexanoyl]amino]-5-(diaminomethylideneamino)pentanoic acid Chemical compound NCC(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O WDVIDPRACNGFPP-QWRGUYRKSA-N 0.000 description 2
- OKDRUMBNXIYUEO-VHJVCUAWSA-N (2s,3s)-3-hydroxy-2-[(e)-prop-1-enyl]-2,3-dihydropyran-6-one Chemical compound C\C=C\[C@@H]1OC(=O)C=C[C@@H]1O OKDRUMBNXIYUEO-VHJVCUAWSA-N 0.000 description 2
- NOUIAHOPEGZYFE-JPLJXNOCSA-N (3S)-4-[[(2S)-1-[[(1S)-1-carboxy-2-(4-hydroxyphenyl)ethyl]amino]-3-methyl-1-oxobutan-2-yl]amino]-3-[[(2S)-2,6-diaminohexanoyl]amino]-4-oxobutanoic acid Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O NOUIAHOPEGZYFE-JPLJXNOCSA-N 0.000 description 2
- LKUDPHPHKOZXCD-UHFFFAOYSA-N 1,3,5-trimethoxybenzene Chemical compound COC1=CC(OC)=CC(OC)=C1 LKUDPHPHKOZXCD-UHFFFAOYSA-N 0.000 description 2
- UZDMJOILBYFRMP-UHFFFAOYSA-N 2-[2-[2-[(2-amino-3-methylpentanoyl)amino]propanoylamino]propanoylamino]-3-methylpentanoic acid Chemical compound CCC(C)C(N)C(=O)NC(C)C(=O)NC(C)C(=O)NC(C(O)=O)C(C)CC UZDMJOILBYFRMP-UHFFFAOYSA-N 0.000 description 2
- QVOBNSFUVPLVPE-ROUUACIJSA-N 2-[[(2s)-2-[[2-[[(2s)-2-amino-3-phenylpropanoyl]amino]acetyl]amino]-3-phenylpropanoyl]amino]acetic acid Chemical compound C([C@H](N)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)NCC(O)=O)C1=CC=CC=C1 QVOBNSFUVPLVPE-ROUUACIJSA-N 0.000 description 2
- NGSWKAQJJWESNS-UHFFFAOYSA-N 4-coumaric acid Chemical compound OC(=O)C=CC1=CC=C(O)C=C1 NGSWKAQJJWESNS-UHFFFAOYSA-N 0.000 description 2
- 108010044087 AS-I toxin Proteins 0.000 description 2
- ODWSTKXGQGYHSH-FXQIFTODSA-N Ala-Arg-Ala Chemical compound C[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O ODWSTKXGQGYHSH-FXQIFTODSA-N 0.000 description 2
- QDRGPQWIVZNJQD-CIUDSAMLSA-N Ala-Arg-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O QDRGPQWIVZNJQD-CIUDSAMLSA-N 0.000 description 2
- JBGSZRYCXBPWGX-BQBZGAKWSA-N Ala-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N JBGSZRYCXBPWGX-BQBZGAKWSA-N 0.000 description 2
- LWUWMHIOBPTZBA-DCAQKATOSA-N Ala-Arg-Lys Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O LWUWMHIOBPTZBA-DCAQKATOSA-N 0.000 description 2
- YWWATNIVMOCSAV-UBHSHLNASA-N Ala-Arg-Phe Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YWWATNIVMOCSAV-UBHSHLNASA-N 0.000 description 2
- NXSFUECZFORGOG-CIUDSAMLSA-N Ala-Asn-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXSFUECZFORGOG-CIUDSAMLSA-N 0.000 description 2
- FXKNPWNXPQZLES-ZLUOBGJFSA-N Ala-Asn-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O FXKNPWNXPQZLES-ZLUOBGJFSA-N 0.000 description 2
- PBAMJJXWDQXOJA-FXQIFTODSA-N Ala-Asp-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PBAMJJXWDQXOJA-FXQIFTODSA-N 0.000 description 2
- WXERCAHAIKMTKX-ZLUOBGJFSA-N Ala-Asp-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O WXERCAHAIKMTKX-ZLUOBGJFSA-N 0.000 description 2
- WQVYAWIMAWTGMW-ZLUOBGJFSA-N Ala-Asp-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N WQVYAWIMAWTGMW-ZLUOBGJFSA-N 0.000 description 2
- MCKSLROAGSDNFC-ACZMJKKPSA-N Ala-Asp-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MCKSLROAGSDNFC-ACZMJKKPSA-N 0.000 description 2
- 108010040956 Ala-Asp-Glu-Leu Proteins 0.000 description 2
- KIUYPHAMDKDICO-WHFBIAKZSA-N Ala-Asp-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KIUYPHAMDKDICO-WHFBIAKZSA-N 0.000 description 2
- LSLIRHLIUDVNBN-CIUDSAMLSA-N Ala-Asp-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LSLIRHLIUDVNBN-CIUDSAMLSA-N 0.000 description 2
- DECCMEWNXSNSDO-ZLUOBGJFSA-N Ala-Cys-Ala Chemical compound C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O DECCMEWNXSNSDO-ZLUOBGJFSA-N 0.000 description 2
- RXTBLQVXNIECFP-FXQIFTODSA-N Ala-Gln-Gln Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O RXTBLQVXNIECFP-FXQIFTODSA-N 0.000 description 2
- IFTVANMRTIHKML-WDSKDSINSA-N Ala-Gln-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O IFTVANMRTIHKML-WDSKDSINSA-N 0.000 description 2
- BLGHHPHXVJWCNK-GUBZILKMSA-N Ala-Gln-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BLGHHPHXVJWCNK-GUBZILKMSA-N 0.000 description 2
- CZPAHAKGPDUIPJ-CIUDSAMLSA-N Ala-Gln-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O CZPAHAKGPDUIPJ-CIUDSAMLSA-N 0.000 description 2
- FUSPCLTUKXQREV-ACZMJKKPSA-N Ala-Glu-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O FUSPCLTUKXQREV-ACZMJKKPSA-N 0.000 description 2
- GGNHBHYDMUDXQB-KBIXCLLPSA-N Ala-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)N GGNHBHYDMUDXQB-KBIXCLLPSA-N 0.000 description 2
- HMRWQTHUDVXMGH-GUBZILKMSA-N Ala-Glu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HMRWQTHUDVXMGH-GUBZILKMSA-N 0.000 description 2
- ROLXPVQSRCPVGK-XDTLVQLUSA-N Ala-Glu-Tyr Chemical compound N[C@@H](C)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O ROLXPVQSRCPVGK-XDTLVQLUSA-N 0.000 description 2
- NHLAEBFGWPXFGI-WHFBIAKZSA-N Ala-Gly-Asn Chemical compound C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N NHLAEBFGWPXFGI-WHFBIAKZSA-N 0.000 description 2
- LJFNNUBZSZCZFN-WHFBIAKZSA-N Ala-Gly-Cys Chemical compound N[C@@H](C)C(=O)NCC(=O)N[C@@H](CS)C(=O)O LJFNNUBZSZCZFN-WHFBIAKZSA-N 0.000 description 2
- BLIMFWGRQKRCGT-YUMQZZPRSA-N Ala-Gly-Lys Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN BLIMFWGRQKRCGT-YUMQZZPRSA-N 0.000 description 2
- QHASENCZLDHBGX-ONGXEEELSA-N Ala-Gly-Phe Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QHASENCZLDHBGX-ONGXEEELSA-N 0.000 description 2
- SMCGQGDVTPFXKB-XPUUQOCRSA-N Ala-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N SMCGQGDVTPFXKB-XPUUQOCRSA-N 0.000 description 2
- GRPHQEMIFDPKOE-HGNGGELXSA-N Ala-His-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O GRPHQEMIFDPKOE-HGNGGELXSA-N 0.000 description 2
- FAJIYNONGXEXAI-CQDKDKBSSA-N Ala-His-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CNC=N1 FAJIYNONGXEXAI-CQDKDKBSSA-N 0.000 description 2
- HJGZVLLLBJLXFC-LSJOCFKGSA-N Ala-His-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(O)=O HJGZVLLLBJLXFC-LSJOCFKGSA-N 0.000 description 2
- IFKQPMZRDQZSHI-GHCJXIJMSA-N Ala-Ile-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O IFKQPMZRDQZSHI-GHCJXIJMSA-N 0.000 description 2
- DVJSJDDYCYSMFR-ZKWXMUAHSA-N Ala-Ile-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O DVJSJDDYCYSMFR-ZKWXMUAHSA-N 0.000 description 2
- VNYMOTCMNHJGTG-JBDRJPRFSA-N Ala-Ile-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O VNYMOTCMNHJGTG-JBDRJPRFSA-N 0.000 description 2
- DCUCOIYYUBILPS-GUBZILKMSA-N Ala-Leu-Asp-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O DCUCOIYYUBILPS-GUBZILKMSA-N 0.000 description 2
- SUMYEVXWCAYLLJ-GUBZILKMSA-N Ala-Leu-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O SUMYEVXWCAYLLJ-GUBZILKMSA-N 0.000 description 2
- WUHJHHGYVVJMQE-BJDJZHNGSA-N Ala-Leu-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WUHJHHGYVVJMQE-BJDJZHNGSA-N 0.000 description 2
- LDLSENBXQNDTPB-DCAQKATOSA-N Ala-Lys-Arg Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LDLSENBXQNDTPB-DCAQKATOSA-N 0.000 description 2
- IAUSCRHURCZUJP-CIUDSAMLSA-N Ala-Lys-Cys Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CS)C(O)=O IAUSCRHURCZUJP-CIUDSAMLSA-N 0.000 description 2
- MFMDKJIPHSWSBM-GUBZILKMSA-N Ala-Lys-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFMDKJIPHSWSBM-GUBZILKMSA-N 0.000 description 2
- VCSABYLVNWQYQE-SRVKXCTJSA-N Ala-Lys-Lys Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O VCSABYLVNWQYQE-SRVKXCTJSA-N 0.000 description 2
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 2
- MDNAVFBZPROEHO-DCAQKATOSA-N Ala-Lys-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MDNAVFBZPROEHO-DCAQKATOSA-N 0.000 description 2
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 2
- DWYROCSXOOMOEU-CIUDSAMLSA-N Ala-Met-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N DWYROCSXOOMOEU-CIUDSAMLSA-N 0.000 description 2
- XSTZMVAYYCJTNR-DCAQKATOSA-N Ala-Met-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O XSTZMVAYYCJTNR-DCAQKATOSA-N 0.000 description 2
- GKAZXNDATBWNBI-DCAQKATOSA-N Ala-Met-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)O)N GKAZXNDATBWNBI-DCAQKATOSA-N 0.000 description 2
- DEWWPUNXRNGMQN-LPEHRKFASA-N Ala-Met-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N1CCC[C@@H]1C(=O)O)N DEWWPUNXRNGMQN-LPEHRKFASA-N 0.000 description 2
- IHMCQESUJVZTKW-UBHSHLNASA-N Ala-Phe-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 IHMCQESUJVZTKW-UBHSHLNASA-N 0.000 description 2
- IPZQNYYAYVRKKK-FXQIFTODSA-N Ala-Pro-Ala Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IPZQNYYAYVRKKK-FXQIFTODSA-N 0.000 description 2
- VQAVBBCZFQAAED-FXQIFTODSA-N Ala-Pro-Asn Chemical compound C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)N)C(=O)O)N VQAVBBCZFQAAED-FXQIFTODSA-N 0.000 description 2
- FQNILRVJOJBFFC-FXQIFTODSA-N Ala-Pro-Asp Chemical compound C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N FQNILRVJOJBFFC-FXQIFTODSA-N 0.000 description 2
- CQJHFKKGZXKZBC-BPNCWPANSA-N Ala-Pro-Tyr Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 CQJHFKKGZXKZBC-BPNCWPANSA-N 0.000 description 2
- WQKAQKZRDIZYNV-VZFHVOOUSA-N Ala-Ser-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WQKAQKZRDIZYNV-VZFHVOOUSA-N 0.000 description 2
- LSMDIAAALJJLRO-XQXXSGGOSA-N Ala-Thr-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O LSMDIAAALJJLRO-XQXXSGGOSA-N 0.000 description 2
- WNHNMKOFKCHKKD-BFHQHQDPSA-N Ala-Thr-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O WNHNMKOFKCHKKD-BFHQHQDPSA-N 0.000 description 2
- VNFSAYFQLXPHPY-CIQUZCHMSA-N Ala-Thr-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VNFSAYFQLXPHPY-CIQUZCHMSA-N 0.000 description 2
- SAHQGRZIQVEJPF-JXUBOQSCSA-N Ala-Thr-Lys Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCCN SAHQGRZIQVEJPF-JXUBOQSCSA-N 0.000 description 2
- QOIGKCBMXUCDQU-KDXUFGMBSA-N Ala-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N)O QOIGKCBMXUCDQU-KDXUFGMBSA-N 0.000 description 2
- CREYEAPXISDKSB-FQPOAREZSA-N Ala-Thr-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CREYEAPXISDKSB-FQPOAREZSA-N 0.000 description 2
- YEBZNKPPOHFZJM-BPNCWPANSA-N Ala-Tyr-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O YEBZNKPPOHFZJM-BPNCWPANSA-N 0.000 description 2
- IYKVSFNGSWTTNZ-GUBZILKMSA-N Ala-Val-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IYKVSFNGSWTTNZ-GUBZILKMSA-N 0.000 description 2
- BOKLLPVAQDSLHC-FXQIFTODSA-N Ala-Val-Cys Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(=O)O)N BOKLLPVAQDSLHC-FXQIFTODSA-N 0.000 description 2
- SGYSTDWPNPKJPP-GUBZILKMSA-N Arg-Ala-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SGYSTDWPNPKJPP-GUBZILKMSA-N 0.000 description 2
- VKKYFICVTYKFIO-CIUDSAMLSA-N Arg-Ala-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N VKKYFICVTYKFIO-CIUDSAMLSA-N 0.000 description 2
- KWKQGHSSNHPGOW-BQBZGAKWSA-N Arg-Ala-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)NCC(O)=O KWKQGHSSNHPGOW-BQBZGAKWSA-N 0.000 description 2
- OTOXOKCIIQLMFH-KZVJFYERSA-N Arg-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N OTOXOKCIIQLMFH-KZVJFYERSA-N 0.000 description 2
- UXJCMQFPDWCHKX-DCAQKATOSA-N Arg-Arg-Glu Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UXJCMQFPDWCHKX-DCAQKATOSA-N 0.000 description 2
- HJVGMOYJDDXLMI-AVGNSLFASA-N Arg-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCCNC(N)=N HJVGMOYJDDXLMI-AVGNSLFASA-N 0.000 description 2
- NABSCJGZKWSNHX-RCWTZXSCSA-N Arg-Arg-Thr Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H]([C@H](O)C)C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N NABSCJGZKWSNHX-RCWTZXSCSA-N 0.000 description 2
- RWWPBOUMKFBHAL-FXQIFTODSA-N Arg-Asn-Cys Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(O)=O RWWPBOUMKFBHAL-FXQIFTODSA-N 0.000 description 2
- IIABBYGHLYWVOS-FXQIFTODSA-N Arg-Asn-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O IIABBYGHLYWVOS-FXQIFTODSA-N 0.000 description 2
- JSHVMZANPXCDTL-GMOBBJLQSA-N Arg-Asp-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JSHVMZANPXCDTL-GMOBBJLQSA-N 0.000 description 2
- FEZJJKXNPSEYEV-CIUDSAMLSA-N Arg-Gln-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O FEZJJKXNPSEYEV-CIUDSAMLSA-N 0.000 description 2
- PTVGLOCPAVYPFG-CIUDSAMLSA-N Arg-Gln-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O PTVGLOCPAVYPFG-CIUDSAMLSA-N 0.000 description 2
- HPKSHFSEXICTLI-CIUDSAMLSA-N Arg-Glu-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O HPKSHFSEXICTLI-CIUDSAMLSA-N 0.000 description 2
- NKBQZKVMKJJDLX-SRVKXCTJSA-N Arg-Glu-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NKBQZKVMKJJDLX-SRVKXCTJSA-N 0.000 description 2
- GOWZVQXTHUCNSQ-NHCYSSNCSA-N Arg-Glu-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O GOWZVQXTHUCNSQ-NHCYSSNCSA-N 0.000 description 2
- HQIZDMIGUJOSNI-IUCAKERBSA-N Arg-Gly-Arg Chemical compound N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O HQIZDMIGUJOSNI-IUCAKERBSA-N 0.000 description 2
- IYMAXBFPHPZYIK-BQBZGAKWSA-N Arg-Gly-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O IYMAXBFPHPZYIK-BQBZGAKWSA-N 0.000 description 2
- RFXXUWGNVRJTNQ-QXEWZRGKSA-N Arg-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCCN=C(N)N)N RFXXUWGNVRJTNQ-QXEWZRGKSA-N 0.000 description 2
- ZATRYQNPUHGXCU-DTWKUNHWSA-N Arg-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCCN=C(N)N)N)C(=O)O ZATRYQNPUHGXCU-DTWKUNHWSA-N 0.000 description 2
- ZJEDSBGPBXVBMP-PYJNHQTQSA-N Arg-His-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZJEDSBGPBXVBMP-PYJNHQTQSA-N 0.000 description 2
- CRCCTGPNZUCAHE-DCAQKATOSA-N Arg-His-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CN=CN1 CRCCTGPNZUCAHE-DCAQKATOSA-N 0.000 description 2
- OOIMKQRCPJBGPD-XUXIUFHCSA-N Arg-Ile-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O OOIMKQRCPJBGPD-XUXIUFHCSA-N 0.000 description 2
- LVMUGODRNHFGRA-AVGNSLFASA-N Arg-Leu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O LVMUGODRNHFGRA-AVGNSLFASA-N 0.000 description 2
- IIAXFBUTKIDDIP-ULQDDVLXSA-N Arg-Leu-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O IIAXFBUTKIDDIP-ULQDDVLXSA-N 0.000 description 2
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 2
- JEOCWTUOMKEEMF-RHYQMDGZSA-N Arg-Leu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JEOCWTUOMKEEMF-RHYQMDGZSA-N 0.000 description 2
- JCROZIFVIYMXHM-GUBZILKMSA-N Arg-Met-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CCCN=C(N)N JCROZIFVIYMXHM-GUBZILKMSA-N 0.000 description 2
- YCYXHLZRUSJITQ-SRVKXCTJSA-N Arg-Pro-Pro Chemical compound NC(=N)NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 YCYXHLZRUSJITQ-SRVKXCTJSA-N 0.000 description 2
- VUGWHBXPMAHEGZ-SRVKXCTJSA-N Arg-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCN=C(N)N VUGWHBXPMAHEGZ-SRVKXCTJSA-N 0.000 description 2
- BWMMKQPATDUYKB-IHRRRGAJSA-N Arg-Tyr-Asn Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=C(O)C=C1 BWMMKQPATDUYKB-IHRRRGAJSA-N 0.000 description 2
- VLIJAPRTSXSGFY-STQMWFEESA-N Arg-Tyr-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 VLIJAPRTSXSGFY-STQMWFEESA-N 0.000 description 2
- SUMJNGAMIQSNGX-TUAOUCFPSA-N Arg-Val-Pro Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N1CCC[C@@H]1C(O)=O SUMJNGAMIQSNGX-TUAOUCFPSA-N 0.000 description 2
- WHLDJYNHXOMGMU-JYJNAYRXSA-N Arg-Val-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WHLDJYNHXOMGMU-JYJNAYRXSA-N 0.000 description 2
- XKRFYHLGVUSROY-UHFFFAOYSA-N Argon Chemical compound [Ar] XKRFYHLGVUSROY-UHFFFAOYSA-N 0.000 description 2
- MFFOYNGMOYFPBD-DCAQKATOSA-N Asn-Arg-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O MFFOYNGMOYFPBD-DCAQKATOSA-N 0.000 description 2
- DAPLJWATMAXPPZ-CIUDSAMLSA-N Asn-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(N)=O DAPLJWATMAXPPZ-CIUDSAMLSA-N 0.000 description 2
- APHUDFFMXFYRKP-CIUDSAMLSA-N Asn-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N APHUDFFMXFYRKP-CIUDSAMLSA-N 0.000 description 2
- UGXVKHRDGLYFKR-CIUDSAMLSA-N Asn-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(N)=O UGXVKHRDGLYFKR-CIUDSAMLSA-N 0.000 description 2
- RRVBEKYEFMCDIF-WHFBIAKZSA-N Asn-Cys-Gly Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)NCC(=O)O)N)C(=O)N RRVBEKYEFMCDIF-WHFBIAKZSA-N 0.000 description 2
- ULRPXVNMIIYDDJ-ACZMJKKPSA-N Asn-Glu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)N)N ULRPXVNMIIYDDJ-ACZMJKKPSA-N 0.000 description 2
- OPEPUCYIGFEGSW-WDSKDSINSA-N Asn-Gly-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OPEPUCYIGFEGSW-WDSKDSINSA-N 0.000 description 2
- XVBDDUPJVQXDSI-PEFMBERDSA-N Asn-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N XVBDDUPJVQXDSI-PEFMBERDSA-N 0.000 description 2
- NVWJMQNYLYWVNQ-BYULHYEWSA-N Asn-Ile-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O NVWJMQNYLYWVNQ-BYULHYEWSA-N 0.000 description 2
- YYSYDIYQTUPNQQ-SXTJYALSSA-N Asn-Ile-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YYSYDIYQTUPNQQ-SXTJYALSSA-N 0.000 description 2
- JEEFEQCRXKPQHC-KKUMJFAQSA-N Asn-Leu-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JEEFEQCRXKPQHC-KKUMJFAQSA-N 0.000 description 2
- JLNFZLNDHONLND-GARJFASQSA-N Asn-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N JLNFZLNDHONLND-GARJFASQSA-N 0.000 description 2
- DJIMLSXHXKWADV-CIUDSAMLSA-N Asn-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(N)=O DJIMLSXHXKWADV-CIUDSAMLSA-N 0.000 description 2
- NCFJQJRLQJEECD-NHCYSSNCSA-N Asn-Leu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O NCFJQJRLQJEECD-NHCYSSNCSA-N 0.000 description 2
- ORJQQZIXTOYGGH-SRVKXCTJSA-N Asn-Lys-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ORJQQZIXTOYGGH-SRVKXCTJSA-N 0.000 description 2
- GIQCDTKOIPUDSG-GARJFASQSA-N Asn-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)N)N)C(=O)O GIQCDTKOIPUDSG-GARJFASQSA-N 0.000 description 2
- MYVBTYXSWILFCG-BQBZGAKWSA-N Asn-Met-Gly Chemical compound CSCC[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N MYVBTYXSWILFCG-BQBZGAKWSA-N 0.000 description 2
- NNDSLVWAQAUPPP-GUBZILKMSA-N Asn-Met-Met Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)N)N NNDSLVWAQAUPPP-GUBZILKMSA-N 0.000 description 2
- WCRQQIPFSXFIRN-LPEHRKFASA-N Asn-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N WCRQQIPFSXFIRN-LPEHRKFASA-N 0.000 description 2
- QXOPPIDJKPEKCW-GUBZILKMSA-N Asn-Pro-Arg Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)N)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O QXOPPIDJKPEKCW-GUBZILKMSA-N 0.000 description 2
- SUIJFTJDTJKSRK-IHRRRGAJSA-N Asn-Pro-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 SUIJFTJDTJKSRK-IHRRRGAJSA-N 0.000 description 2
- GZXOUBTUAUAVHD-ACZMJKKPSA-N Asn-Ser-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GZXOUBTUAUAVHD-ACZMJKKPSA-N 0.000 description 2
- HPBNLFLSSQDFQW-WHFBIAKZSA-N Asn-Ser-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O HPBNLFLSSQDFQW-WHFBIAKZSA-N 0.000 description 2
- NPZJLGMWMDNQDD-GHCJXIJMSA-N Asn-Ser-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NPZJLGMWMDNQDD-GHCJXIJMSA-N 0.000 description 2
- MKJBPDLENBUHQU-CIUDSAMLSA-N Asn-Ser-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O MKJBPDLENBUHQU-CIUDSAMLSA-N 0.000 description 2
- ZNYKKCADEQAZKA-FXQIFTODSA-N Asn-Ser-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O ZNYKKCADEQAZKA-FXQIFTODSA-N 0.000 description 2
- WLVLIYYBPPONRJ-GCJQMDKQSA-N Asn-Thr-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O WLVLIYYBPPONRJ-GCJQMDKQSA-N 0.000 description 2
- XIDSGDJNUJRUHE-VEVYYDQMSA-N Asn-Thr-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O XIDSGDJNUJRUHE-VEVYYDQMSA-N 0.000 description 2
- AMGQTNHANMRPOE-LKXGYXEUSA-N Asn-Thr-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O AMGQTNHANMRPOE-LKXGYXEUSA-N 0.000 description 2
- BCADFFUQHIMQAA-KKHAAJSZSA-N Asn-Thr-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BCADFFUQHIMQAA-KKHAAJSZSA-N 0.000 description 2
- HBUJSDCLZCXXCW-YDHLFZDLSA-N Asn-Val-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HBUJSDCLZCXXCW-YDHLFZDLSA-N 0.000 description 2
- WQAOZCVOOYUWKG-LSJOCFKGSA-N Asn-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CC(=O)N)N WQAOZCVOOYUWKG-LSJOCFKGSA-N 0.000 description 2
- RGKKALNPOYURGE-ZKWXMUAHSA-N Asp-Ala-Val Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O RGKKALNPOYURGE-ZKWXMUAHSA-N 0.000 description 2
- AXXCUABIFZPKPM-BQBZGAKWSA-N Asp-Arg-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O AXXCUABIFZPKPM-BQBZGAKWSA-N 0.000 description 2
- IXIWEFWRKIUMQX-DCAQKATOSA-N Asp-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(O)=O IXIWEFWRKIUMQX-DCAQKATOSA-N 0.000 description 2
- XYBJLTKSGFBLCS-QXEWZRGKSA-N Asp-Arg-Val Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CC(O)=O XYBJLTKSGFBLCS-QXEWZRGKSA-N 0.000 description 2
- LKIYSIYBKYLKPU-BIIVOSGPSA-N Asp-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N)C(=O)O LKIYSIYBKYLKPU-BIIVOSGPSA-N 0.000 description 2
- PXLNPFOJZQMXAT-BYULHYEWSA-N Asp-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O PXLNPFOJZQMXAT-BYULHYEWSA-N 0.000 description 2
- XJQRWGXKUSDEFI-ACZMJKKPSA-N Asp-Glu-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O XJQRWGXKUSDEFI-ACZMJKKPSA-N 0.000 description 2
- VILLWIDTHYPSLC-PEFMBERDSA-N Asp-Glu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VILLWIDTHYPSLC-PEFMBERDSA-N 0.000 description 2
- PDECQIHABNQRHN-GUBZILKMSA-N Asp-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(O)=O PDECQIHABNQRHN-GUBZILKMSA-N 0.000 description 2
- KHBLRHKVXICFMY-GUBZILKMSA-N Asp-Glu-Lys Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O KHBLRHKVXICFMY-GUBZILKMSA-N 0.000 description 2
- YDJVIBMKAMQPPP-LAEOZQHASA-N Asp-Glu-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O YDJVIBMKAMQPPP-LAEOZQHASA-N 0.000 description 2
- WBDWQKRLTVCDSY-WHFBIAKZSA-N Asp-Gly-Asp Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O WBDWQKRLTVCDSY-WHFBIAKZSA-N 0.000 description 2
- PSLSTUMPZILTAH-BYULHYEWSA-N Asp-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O PSLSTUMPZILTAH-BYULHYEWSA-N 0.000 description 2
- UBPMOJLRVMGTOQ-GARJFASQSA-N Asp-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC(=O)O)N)C(=O)O UBPMOJLRVMGTOQ-GARJFASQSA-N 0.000 description 2
- KTTCQQNRRLCIBC-GHCJXIJMSA-N Asp-Ile-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O KTTCQQNRRLCIBC-GHCJXIJMSA-N 0.000 description 2
- GBSUGIXJAAKZOW-GMOBBJLQSA-N Asp-Ile-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GBSUGIXJAAKZOW-GMOBBJLQSA-N 0.000 description 2
- QNFRBNZGVVKBNJ-PEFMBERDSA-N Asp-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N QNFRBNZGVVKBNJ-PEFMBERDSA-N 0.000 description 2
- SEMWSADZTMJELF-BYULHYEWSA-N Asp-Ile-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O SEMWSADZTMJELF-BYULHYEWSA-N 0.000 description 2
- SPKCGKRUYKMDHP-GUDRVLHUSA-N Asp-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N SPKCGKRUYKMDHP-GUDRVLHUSA-N 0.000 description 2
- RTXQQDVBACBSCW-CFMVVWHZSA-N Asp-Ile-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RTXQQDVBACBSCW-CFMVVWHZSA-N 0.000 description 2
- KYQNAIMCTRZLNP-QSFUFRPTSA-N Asp-Ile-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O KYQNAIMCTRZLNP-QSFUFRPTSA-N 0.000 description 2
- DWOGMPWRQQWPPF-GUBZILKMSA-N Asp-Leu-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O DWOGMPWRQQWPPF-GUBZILKMSA-N 0.000 description 2
- AYFVRYXNDHBECD-YUMQZZPRSA-N Asp-Leu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AYFVRYXNDHBECD-YUMQZZPRSA-N 0.000 description 2
- IVPNEDNYYYFAGI-GARJFASQSA-N Asp-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N IVPNEDNYYYFAGI-GARJFASQSA-N 0.000 description 2
- ORRJQLIATJDMQM-HJGDQZAQSA-N Asp-Leu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O ORRJQLIATJDMQM-HJGDQZAQSA-N 0.000 description 2
- YVHGKXAOSVBGJV-CIUDSAMLSA-N Asp-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N YVHGKXAOSVBGJV-CIUDSAMLSA-N 0.000 description 2
- VSMYBNPOHYAXSD-GUBZILKMSA-N Asp-Lys-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O VSMYBNPOHYAXSD-GUBZILKMSA-N 0.000 description 2
- LBOVBQONZJRWPV-YUMQZZPRSA-N Asp-Lys-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LBOVBQONZJRWPV-YUMQZZPRSA-N 0.000 description 2
- HJCGDIGVVWETRO-ZPFDUUQYSA-N Asp-Lys-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O)C(O)=O HJCGDIGVVWETRO-ZPFDUUQYSA-N 0.000 description 2
- GKWFMNNNYZHJHV-SRVKXCTJSA-N Asp-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O GKWFMNNNYZHJHV-SRVKXCTJSA-N 0.000 description 2
- DPNWSMBUYCLEDG-CIUDSAMLSA-N Asp-Lys-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O DPNWSMBUYCLEDG-CIUDSAMLSA-N 0.000 description 2
- HXVILZUZXFLVEN-DCAQKATOSA-N Asp-Met-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O HXVILZUZXFLVEN-DCAQKATOSA-N 0.000 description 2
- SJLDOGLMVPHPLZ-IHRRRGAJSA-N Asp-Met-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SJLDOGLMVPHPLZ-IHRRRGAJSA-N 0.000 description 2
- QJHOOKBAHRJPPX-QWRGUYRKSA-N Asp-Phe-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 QJHOOKBAHRJPPX-QWRGUYRKSA-N 0.000 description 2
- PCJOFZYFFMBZKC-PCBIJLKTSA-N Asp-Phe-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PCJOFZYFFMBZKC-PCBIJLKTSA-N 0.000 description 2
- JUWISGAGWSDGDH-KKUMJFAQSA-N Asp-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(O)=O)CC1=CC=CC=C1 JUWISGAGWSDGDH-KKUMJFAQSA-N 0.000 description 2
- ZBYLEBZCVKLPCY-FXQIFTODSA-N Asp-Ser-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ZBYLEBZCVKLPCY-FXQIFTODSA-N 0.000 description 2
- QOCFFCUFZGDHTP-NUMRIWBASA-N Asp-Thr-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O QOCFFCUFZGDHTP-NUMRIWBASA-N 0.000 description 2
- NVXLFIPTHPKSKL-UBHSHLNASA-N Asp-Trp-Asn Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC(O)=O)N)C(=O)N[C@@H](CC(N)=O)C(O)=O)=CNC2=C1 NVXLFIPTHPKSKL-UBHSHLNASA-N 0.000 description 2
- LLRJPYJQNBMOOO-QEJZJMRPSA-N Asp-Trp-Gln Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N LLRJPYJQNBMOOO-QEJZJMRPSA-N 0.000 description 2
- YUELDQUPTAYEGM-XIRDDKMYSA-N Asp-Trp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CC(=O)O)N YUELDQUPTAYEGM-XIRDDKMYSA-N 0.000 description 2
- ZQFZEBRNAMXXJV-KKUMJFAQSA-N Asp-Tyr-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O ZQFZEBRNAMXXJV-KKUMJFAQSA-N 0.000 description 2
- BJDHEININLSZOT-KKUMJFAQSA-N Asp-Tyr-Lys Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(O)=O BJDHEININLSZOT-KKUMJFAQSA-N 0.000 description 2
- SQIARYGNVQWOSB-BZSNNMDCSA-N Asp-Tyr-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SQIARYGNVQWOSB-BZSNNMDCSA-N 0.000 description 2
- BPAUXFVCSYQDQX-JRQIVUDYSA-N Asp-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC(=O)O)N)O BPAUXFVCSYQDQX-JRQIVUDYSA-N 0.000 description 2
- HTSSXFASOUSJQG-IHPCNDPISA-N Asp-Tyr-Trp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O HTSSXFASOUSJQG-IHPCNDPISA-N 0.000 description 2
- JGLWFWXGOINXEA-YDHLFZDLSA-N Asp-Val-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 JGLWFWXGOINXEA-YDHLFZDLSA-N 0.000 description 2
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 2
- 241000193830 Bacillus <bacterium> Species 0.000 description 2
- 244000063299 Bacillus subtilis Species 0.000 description 2
- 235000014469 Bacillus subtilis Nutrition 0.000 description 2
- 241000606125 Bacteroides Species 0.000 description 2
- 241001213452 Bifidobacterium longum NCC2705 Species 0.000 description 2
- 241000276440 Borrelia burgdorferi B31 Species 0.000 description 2
- 241000127145 Buchnera aphidicola BCc Species 0.000 description 2
- 241001441737 Campylobacter jejuni subsp. jejuni NCTC 11168 = ATCC 700819 Species 0.000 description 2
- 235000008697 Cannabis sativa Nutrition 0.000 description 2
- 235000012766 Cannabis sativa ssp. sativa var. sativa Nutrition 0.000 description 2
- 235000012765 Cannabis sativa ssp. sativa var. spontanea Nutrition 0.000 description 2
- 241000606161 Chlamydia Species 0.000 description 2
- 241000023502 Clostridium kluyveri DSM 555 Species 0.000 description 2
- 108700010070 Codon Usage Proteins 0.000 description 2
- 206010010904 Convulsion Diseases 0.000 description 2
- AMRLSQGGERHDHJ-FXQIFTODSA-N Cys-Ala-Arg Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AMRLSQGGERHDHJ-FXQIFTODSA-N 0.000 description 2
- DCJNIJAWIRPPBB-CIUDSAMLSA-N Cys-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CS)N DCJNIJAWIRPPBB-CIUDSAMLSA-N 0.000 description 2
- WDQXKVCQXRNOSI-GHCJXIJMSA-N Cys-Asp-Ile Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WDQXKVCQXRNOSI-GHCJXIJMSA-N 0.000 description 2
- BIVLWXQGXJLGKG-BIIVOSGPSA-N Cys-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N)C(=O)O BIVLWXQGXJLGKG-BIIVOSGPSA-N 0.000 description 2
- QADHATDBZXHRCA-ACZMJKKPSA-N Cys-Gln-Asn Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CS)N QADHATDBZXHRCA-ACZMJKKPSA-N 0.000 description 2
- UPURLDIGQGTUPJ-ZKWXMUAHSA-N Cys-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CS)N UPURLDIGQGTUPJ-ZKWXMUAHSA-N 0.000 description 2
- LYSHSHHDBVKJRN-JBDRJPRFSA-N Cys-Ile-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CS)N LYSHSHHDBVKJRN-JBDRJPRFSA-N 0.000 description 2
- KCPOQGRVVXYLAC-KKUMJFAQSA-N Cys-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CS)N KCPOQGRVVXYLAC-KKUMJFAQSA-N 0.000 description 2
- RESAHOSBQHMOKH-KKUMJFAQSA-N Cys-Phe-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CS)N RESAHOSBQHMOKH-KKUMJFAQSA-N 0.000 description 2
- CHRCKSPMGYDLIA-SRVKXCTJSA-N Cys-Phe-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O CHRCKSPMGYDLIA-SRVKXCTJSA-N 0.000 description 2
- CMYVIUWVYHOLRD-ZLUOBGJFSA-N Cys-Ser-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O CMYVIUWVYHOLRD-ZLUOBGJFSA-N 0.000 description 2
- WZJLBUPPZRZNTO-CIUDSAMLSA-N Cys-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CS)N WZJLBUPPZRZNTO-CIUDSAMLSA-N 0.000 description 2
- BOMGEMDZTNZESV-QWRGUYRKSA-N Cys-Tyr-Gly Chemical compound SC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 BOMGEMDZTNZESV-QWRGUYRKSA-N 0.000 description 2
- 108010090461 DFG peptide Proteins 0.000 description 2
- OKKJLVBELUTLKV-MZCSYVLQSA-N Deuterated methanol Chemical compound [2H]OC([2H])([2H])[2H] OKKJLVBELUTLKV-MZCSYVLQSA-N 0.000 description 2
- 102000005454 Dimethylallyltranstransferase Human genes 0.000 description 2
- 108010006731 Dimethylallyltranstransferase Proteins 0.000 description 2
- 102100038390 Diphosphomevalonate decarboxylase Human genes 0.000 description 2
- 241000192125 Firmicutes Species 0.000 description 2
- LKUWAWGNJYJODH-KBIXCLLPSA-N Gln-Ala-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LKUWAWGNJYJODH-KBIXCLLPSA-N 0.000 description 2
- PRBLYKYHAJEABA-SRVKXCTJSA-N Gln-Arg-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O PRBLYKYHAJEABA-SRVKXCTJSA-N 0.000 description 2
- JFOKLAPFYCTNHW-SRVKXCTJSA-N Gln-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)N)N JFOKLAPFYCTNHW-SRVKXCTJSA-N 0.000 description 2
- ODBLJLZVLAWVMS-GUBZILKMSA-N Gln-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)N)N ODBLJLZVLAWVMS-GUBZILKMSA-N 0.000 description 2
- GMGKDVVBSVVKCT-NUMRIWBASA-N Gln-Asn-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GMGKDVVBSVVKCT-NUMRIWBASA-N 0.000 description 2
- IKDOHQHEFPPGJG-FXQIFTODSA-N Gln-Asp-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O IKDOHQHEFPPGJG-FXQIFTODSA-N 0.000 description 2
- UICOTGULOUGGLC-NUMRIWBASA-N Gln-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N)O UICOTGULOUGGLC-NUMRIWBASA-N 0.000 description 2
- OFPWCBGRYAOLMU-AVGNSLFASA-N Gln-Asp-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N)O OFPWCBGRYAOLMU-AVGNSLFASA-N 0.000 description 2
- PXAFHUATEHLECW-GUBZILKMSA-N Gln-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N PXAFHUATEHLECW-GUBZILKMSA-N 0.000 description 2
- NSNUZSPSADIMJQ-WDSKDSINSA-N Gln-Gly-Asp Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O NSNUZSPSADIMJQ-WDSKDSINSA-N 0.000 description 2
- FGYPOQPQTUNESW-IUCAKERBSA-N Gln-Gly-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)N)N FGYPOQPQTUNESW-IUCAKERBSA-N 0.000 description 2
- YXQCLIVLWCKCRS-RYUDHWBXSA-N Gln-Gly-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)N)N)O YXQCLIVLWCKCRS-RYUDHWBXSA-N 0.000 description 2
- NNXIQPMZGZUFJJ-AVGNSLFASA-N Gln-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N NNXIQPMZGZUFJJ-AVGNSLFASA-N 0.000 description 2
- HYPVLWGNBIYTNA-GUBZILKMSA-N Gln-Leu-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HYPVLWGNBIYTNA-GUBZILKMSA-N 0.000 description 2
- IULKWYSYZSURJK-AVGNSLFASA-N Gln-Leu-Lys Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O IULKWYSYZSURJK-AVGNSLFASA-N 0.000 description 2
- HPCOBEHVEHWREJ-DCAQKATOSA-N Gln-Lys-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HPCOBEHVEHWREJ-DCAQKATOSA-N 0.000 description 2
- XBWGJWXGUNSZAT-CIUDSAMLSA-N Gln-Met-Asp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N XBWGJWXGUNSZAT-CIUDSAMLSA-N 0.000 description 2
- FALJZCPMTGJOHX-SRVKXCTJSA-N Gln-Met-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O FALJZCPMTGJOHX-SRVKXCTJSA-N 0.000 description 2
- MFORDNZDKAVNSR-SRVKXCTJSA-N Gln-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCC(N)=O MFORDNZDKAVNSR-SRVKXCTJSA-N 0.000 description 2
- PAOHIZNRJNIXQY-XQXXSGGOSA-N Gln-Thr-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O PAOHIZNRJNIXQY-XQXXSGGOSA-N 0.000 description 2
- NHMRJKKAVMENKJ-WDCWCFNPSA-N Gln-Thr-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NHMRJKKAVMENKJ-WDCWCFNPSA-N 0.000 description 2
- ICRKQMRFXYDYMK-LAEOZQHASA-N Gln-Val-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ICRKQMRFXYDYMK-LAEOZQHASA-N 0.000 description 2
- VEYGCDYMOXHJLS-GVXVVHGQSA-N Gln-Val-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VEYGCDYMOXHJLS-GVXVVHGQSA-N 0.000 description 2
- MKRDNSWGJWTBKZ-GVXVVHGQSA-N Gln-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MKRDNSWGJWTBKZ-GVXVVHGQSA-N 0.000 description 2
- LKDIBBOKUAASNP-FXQIFTODSA-N Glu-Ala-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LKDIBBOKUAASNP-FXQIFTODSA-N 0.000 description 2
- UTKUTMJSWKKHEM-WDSKDSINSA-N Glu-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O UTKUTMJSWKKHEM-WDSKDSINSA-N 0.000 description 2
- HUWSBFYAGXCXKC-CIUDSAMLSA-N Glu-Ala-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O HUWSBFYAGXCXKC-CIUDSAMLSA-N 0.000 description 2
- VPKBCVUDBNINAH-GARJFASQSA-N Glu-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O VPKBCVUDBNINAH-GARJFASQSA-N 0.000 description 2
- YKLNMGJYMNPBCP-ACZMJKKPSA-N Glu-Asn-Asp Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YKLNMGJYMNPBCP-ACZMJKKPSA-N 0.000 description 2
- LXAUHIRMWXQRKI-XHNCKOQMSA-N Glu-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O LXAUHIRMWXQRKI-XHNCKOQMSA-N 0.000 description 2
- OXEMJGCAJFFREE-FXQIFTODSA-N Glu-Gln-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O OXEMJGCAJFFREE-FXQIFTODSA-N 0.000 description 2
- PVBBEKPHARMPHX-DCAQKATOSA-N Glu-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O PVBBEKPHARMPHX-DCAQKATOSA-N 0.000 description 2
- LVCHEMOPBORRLB-DCAQKATOSA-N Glu-Gln-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O LVCHEMOPBORRLB-DCAQKATOSA-N 0.000 description 2
- APHGWLWMOXGZRL-DCAQKATOSA-N Glu-Glu-His Chemical compound N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O APHGWLWMOXGZRL-DCAQKATOSA-N 0.000 description 2
- PHONAZGUEGIOEM-GLLZPBPUSA-N Glu-Glu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PHONAZGUEGIOEM-GLLZPBPUSA-N 0.000 description 2
- MTAOBYXRYJZRGQ-WDSKDSINSA-N Glu-Gly-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MTAOBYXRYJZRGQ-WDSKDSINSA-N 0.000 description 2
- OAGVHWYIBZMWLA-YFKPBYRVSA-N Glu-Gly-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)NCC(O)=O OAGVHWYIBZMWLA-YFKPBYRVSA-N 0.000 description 2
- LRPXYSGPOBVBEH-IUCAKERBSA-N Glu-Gly-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O LRPXYSGPOBVBEH-IUCAKERBSA-N 0.000 description 2
- HPJLZFTUUJKWAJ-JHEQGTHGSA-N Glu-Gly-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HPJLZFTUUJKWAJ-JHEQGTHGSA-N 0.000 description 2
- HILMIYALTUQTRC-XVKPBYJWSA-N Glu-Gly-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HILMIYALTUQTRC-XVKPBYJWSA-N 0.000 description 2
- LGYCLOCORAEQSZ-PEFMBERDSA-N Glu-Ile-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O LGYCLOCORAEQSZ-PEFMBERDSA-N 0.000 description 2
- QXDXIXFSFHUYAX-MNXVOIDGSA-N Glu-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O QXDXIXFSFHUYAX-MNXVOIDGSA-N 0.000 description 2
- GXMXPCXXKVWOSM-KQXIARHKSA-N Glu-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N GXMXPCXXKVWOSM-KQXIARHKSA-N 0.000 description 2
- ZCFNZTVIDMLUQC-SXNHZJKMSA-N Glu-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZCFNZTVIDMLUQC-SXNHZJKMSA-N 0.000 description 2
- VSRCAOIHMGCIJK-SRVKXCTJSA-N Glu-Leu-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VSRCAOIHMGCIJK-SRVKXCTJSA-N 0.000 description 2
- IRXNJYPKBVERCW-DCAQKATOSA-N Glu-Leu-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IRXNJYPKBVERCW-DCAQKATOSA-N 0.000 description 2
- ATVYZJGOZLVXDK-IUCAKERBSA-N Glu-Leu-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O ATVYZJGOZLVXDK-IUCAKERBSA-N 0.000 description 2
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 2
- OCJRHJZKGGSPRW-IUCAKERBSA-N Glu-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O OCJRHJZKGGSPRW-IUCAKERBSA-N 0.000 description 2
- SUIAHERNFYRBDZ-GVXVVHGQSA-N Glu-Lys-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O SUIAHERNFYRBDZ-GVXVVHGQSA-N 0.000 description 2
- ZQYZDDXTNQXUJH-CIUDSAMLSA-N Glu-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(=O)O)N ZQYZDDXTNQXUJH-CIUDSAMLSA-N 0.000 description 2
- XNOWYPDMSLSRKP-GUBZILKMSA-N Glu-Met-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(O)=O XNOWYPDMSLSRKP-GUBZILKMSA-N 0.000 description 2
- FQFWFZWOHOEVMZ-IHRRRGAJSA-N Glu-Phe-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O FQFWFZWOHOEVMZ-IHRRRGAJSA-N 0.000 description 2
- YTRBQAQSUDSIQE-FHWLQOOXSA-N Glu-Phe-Phe Chemical compound C([C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 YTRBQAQSUDSIQE-FHWLQOOXSA-N 0.000 description 2
- CBWKURKPYSLMJV-SOUVJXGZSA-N Glu-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CCC(=O)O)N)C(=O)O CBWKURKPYSLMJV-SOUVJXGZSA-N 0.000 description 2
- BFEZQZKEPRKKHV-SRVKXCTJSA-N Glu-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)O)N)C(=O)N[C@@H](CCCCN)C(=O)O BFEZQZKEPRKKHV-SRVKXCTJSA-N 0.000 description 2
- SYAYROHMAIHWFB-KBIXCLLPSA-N Glu-Ser-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYAYROHMAIHWFB-KBIXCLLPSA-N 0.000 description 2
- IDEODOAVGCMUQV-GUBZILKMSA-N Glu-Ser-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IDEODOAVGCMUQV-GUBZILKMSA-N 0.000 description 2
- VNCNWQPIQYAMAK-ACZMJKKPSA-N Glu-Ser-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O VNCNWQPIQYAMAK-ACZMJKKPSA-N 0.000 description 2
- DMYACXMQUABZIQ-NRPADANISA-N Glu-Ser-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O DMYACXMQUABZIQ-NRPADANISA-N 0.000 description 2
- QCMVGXDELYMZET-GLLZPBPUSA-N Glu-Thr-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QCMVGXDELYMZET-GLLZPBPUSA-N 0.000 description 2
- GPSHCSTUYOQPAI-JHEQGTHGSA-N Glu-Thr-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O GPSHCSTUYOQPAI-JHEQGTHGSA-N 0.000 description 2
- RGJKYNUINKGPJN-RWRJDSDZSA-N Glu-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCC(=O)O)N RGJKYNUINKGPJN-RWRJDSDZSA-N 0.000 description 2
- ZQNCUVODKOBSSO-XEGUGMAKSA-N Glu-Trp-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(O)=O ZQNCUVODKOBSSO-XEGUGMAKSA-N 0.000 description 2
- ZTNHPMZHAILHRB-JSGCOSHPSA-N Glu-Trp-Gly Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)NCC(O)=O)=CNC2=C1 ZTNHPMZHAILHRB-JSGCOSHPSA-N 0.000 description 2
- DXMOIVCNJIJQSC-QEJZJMRPSA-N Glu-Trp-Ser Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N DXMOIVCNJIJQSC-QEJZJMRPSA-N 0.000 description 2
- MLILEEIVMRUYBX-NHCYSSNCSA-N Glu-Val-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O MLILEEIVMRUYBX-NHCYSSNCSA-N 0.000 description 2
- UZWUBBRJWFTHTD-LAEOZQHASA-N Glu-Val-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O UZWUBBRJWFTHTD-LAEOZQHASA-N 0.000 description 2
- YPHPEHMXOYTEQG-LAEOZQHASA-N Glu-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O YPHPEHMXOYTEQG-LAEOZQHASA-N 0.000 description 2
- RMWAOBGCZZSJHE-UMNHJUIQSA-N Glu-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N RMWAOBGCZZSJHE-UMNHJUIQSA-N 0.000 description 2
- WGYHAAXZWPEBDQ-IFFSRLJSSA-N Glu-Val-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGYHAAXZWPEBDQ-IFFSRLJSSA-N 0.000 description 2
- PUUYVMYCMIWHFE-BQBZGAKWSA-N Gly-Ala-Arg Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PUUYVMYCMIWHFE-BQBZGAKWSA-N 0.000 description 2
- UGVQELHRNUDMAA-BYPYZUCNSA-N Gly-Ala-Gly Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)NCC([O-])=O UGVQELHRNUDMAA-BYPYZUCNSA-N 0.000 description 2
- MZZSCEANQDPJER-ONGXEEELSA-N Gly-Ala-Phe Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MZZSCEANQDPJER-ONGXEEELSA-N 0.000 description 2
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 2
- QSDKBRMVXSWAQE-BFHQHQDPSA-N Gly-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN QSDKBRMVXSWAQE-BFHQHQDPSA-N 0.000 description 2
- UPOJUWHGMDJUQZ-IUCAKERBSA-N Gly-Arg-Arg Chemical compound NC(=N)NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UPOJUWHGMDJUQZ-IUCAKERBSA-N 0.000 description 2
- OVSKVOOUFAKODB-UWVGGRQHSA-N Gly-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OVSKVOOUFAKODB-UWVGGRQHSA-N 0.000 description 2
- WKJKBELXHCTHIJ-WPRPVWTQSA-N Gly-Arg-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N WKJKBELXHCTHIJ-WPRPVWTQSA-N 0.000 description 2
- CIMULJZTTOBOPN-WHFBIAKZSA-N Gly-Asn-Asn Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CIMULJZTTOBOPN-WHFBIAKZSA-N 0.000 description 2
- FMVLWTYYODVFRG-BQBZGAKWSA-N Gly-Asn-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)CN FMVLWTYYODVFRG-BQBZGAKWSA-N 0.000 description 2
- XRTDOIOIBMAXCT-NKWVEPMBSA-N Gly-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)CN)C(=O)O XRTDOIOIBMAXCT-NKWVEPMBSA-N 0.000 description 2
- MHHUEAIBJZWDBH-YUMQZZPRSA-N Gly-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN MHHUEAIBJZWDBH-YUMQZZPRSA-N 0.000 description 2
- PEZZSFLFXXFUQD-XPUUQOCRSA-N Gly-Cys-Val Chemical compound [H]NCC(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O PEZZSFLFXXFUQD-XPUUQOCRSA-N 0.000 description 2
- NPSWCZIRBAYNSB-JHEQGTHGSA-N Gly-Gln-Thr Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NPSWCZIRBAYNSB-JHEQGTHGSA-N 0.000 description 2
- QPDUVFSVVAOUHE-XVKPBYJWSA-N Gly-Gln-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)CN)C(O)=O QPDUVFSVVAOUHE-XVKPBYJWSA-N 0.000 description 2
- ZQIMMEYPEXIYBB-IUCAKERBSA-N Gly-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN ZQIMMEYPEXIYBB-IUCAKERBSA-N 0.000 description 2
- BEQGFMIBZFNROK-JGVFFNPUSA-N Gly-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)CN)C(=O)O BEQGFMIBZFNROK-JGVFFNPUSA-N 0.000 description 2
- PDAWDNVHMUKWJR-ZETCQYMHSA-N Gly-Gly-His Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC1=CNC=N1 PDAWDNVHMUKWJR-ZETCQYMHSA-N 0.000 description 2
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 2
- UQJNXZSSGQIPIQ-FBCQKBJTSA-N Gly-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)CN UQJNXZSSGQIPIQ-FBCQKBJTSA-N 0.000 description 2
- MVORZMQFXBLMHM-QWRGUYRKSA-N Gly-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 MVORZMQFXBLMHM-QWRGUYRKSA-N 0.000 description 2
- SWQALSGKVLYKDT-ZKWXMUAHSA-N Gly-Ile-Ala Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SWQALSGKVLYKDT-ZKWXMUAHSA-N 0.000 description 2
- HAXARWKYFIIHKD-ZKWXMUAHSA-N Gly-Ile-Ser Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HAXARWKYFIIHKD-ZKWXMUAHSA-N 0.000 description 2
- COVXELOAORHTND-LSJOCFKGSA-N Gly-Ile-Val Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O COVXELOAORHTND-LSJOCFKGSA-N 0.000 description 2
- PAWIVEIWWYGBAM-YUMQZZPRSA-N Gly-Leu-Ala Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O PAWIVEIWWYGBAM-YUMQZZPRSA-N 0.000 description 2
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 2
- TWTPDFFBLQEBOE-IUCAKERBSA-N Gly-Leu-Gln Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O TWTPDFFBLQEBOE-IUCAKERBSA-N 0.000 description 2
- ULZCYBYDTUMHNF-IUCAKERBSA-N Gly-Leu-Glu Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ULZCYBYDTUMHNF-IUCAKERBSA-N 0.000 description 2
- LIXWIUAORXJNBH-QWRGUYRKSA-N Gly-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)CN LIXWIUAORXJNBH-QWRGUYRKSA-N 0.000 description 2
- LRQXRHGQEVWGPV-NHCYSSNCSA-N Gly-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN LRQXRHGQEVWGPV-NHCYSSNCSA-N 0.000 description 2
- PTIIBFKSLCYQBO-NHCYSSNCSA-N Gly-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)CN PTIIBFKSLCYQBO-NHCYSSNCSA-N 0.000 description 2
- NTBOEZICHOSJEE-YUMQZZPRSA-N Gly-Lys-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NTBOEZICHOSJEE-YUMQZZPRSA-N 0.000 description 2
- OQQKUTVULYLCDG-ONGXEEELSA-N Gly-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)CN)C(O)=O OQQKUTVULYLCDG-ONGXEEELSA-N 0.000 description 2
- MTBIKIMYHUWBRX-QWRGUYRKSA-N Gly-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN MTBIKIMYHUWBRX-QWRGUYRKSA-N 0.000 description 2
- IGOYNRWLWHWAQO-JTQLQIEISA-N Gly-Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 IGOYNRWLWHWAQO-JTQLQIEISA-N 0.000 description 2
- GGLIDLCEPDHEJO-BQBZGAKWSA-N Gly-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)CN GGLIDLCEPDHEJO-BQBZGAKWSA-N 0.000 description 2
- SCJJPCQUJYPHRZ-BQBZGAKWSA-N Gly-Pro-Asn Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O SCJJPCQUJYPHRZ-BQBZGAKWSA-N 0.000 description 2
- WDXLKVQATNEAJQ-BQBZGAKWSA-N Gly-Pro-Asp Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O WDXLKVQATNEAJQ-BQBZGAKWSA-N 0.000 description 2
- NVTPVQLIZCOJFK-FOHZUACHSA-N Gly-Thr-Asp Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O NVTPVQLIZCOJFK-FOHZUACHSA-N 0.000 description 2
- CQMFNTVQVLQRLT-JHEQGTHGSA-N Gly-Thr-Gln Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O CQMFNTVQVLQRLT-JHEQGTHGSA-N 0.000 description 2
- HUFUVTYGPOUCBN-MBLNEYKQSA-N Gly-Thr-Ile Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HUFUVTYGPOUCBN-MBLNEYKQSA-N 0.000 description 2
- MREVELMMFOLESM-HOCLYGCPSA-N Gly-Trp-Val Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C(C)C)C(O)=O MREVELMMFOLESM-HOCLYGCPSA-N 0.000 description 2
- RIYIFUFFFBIOEU-KBPBESRZSA-N Gly-Tyr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 RIYIFUFFFBIOEU-KBPBESRZSA-N 0.000 description 2
- OCRQUYDOYKCOQG-IRXDYDNUSA-N Gly-Tyr-Phe Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 OCRQUYDOYKCOQG-IRXDYDNUSA-N 0.000 description 2
- GBYYQVBXFVDJPJ-WLTAIBSBSA-N Gly-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)CN)O GBYYQVBXFVDJPJ-WLTAIBSBSA-N 0.000 description 2
- DKJWUIYLMLUBDX-XPUUQOCRSA-N Gly-Val-Cys Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(=O)O DKJWUIYLMLUBDX-XPUUQOCRSA-N 0.000 description 2
- BNMRSWQOHIQTFL-JSGCOSHPSA-N Gly-Val-Phe Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 BNMRSWQOHIQTFL-JSGCOSHPSA-N 0.000 description 2
- AFMOTCMSEBITOE-YEPSODPASA-N Gly-Val-Thr Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AFMOTCMSEBITOE-YEPSODPASA-N 0.000 description 2
- IZVICCORZOSGPT-JSGCOSHPSA-N Gly-Val-Tyr Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IZVICCORZOSGPT-JSGCOSHPSA-N 0.000 description 2
- KSOBNUBCYHGUKH-UWVGGRQHSA-N Gly-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN KSOBNUBCYHGUKH-UWVGGRQHSA-N 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- YPLYIXGKCRQZGW-SRVKXCTJSA-N His-Arg-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O YPLYIXGKCRQZGW-SRVKXCTJSA-N 0.000 description 2
- UZZXGLOJRZKYEL-DJFWLOJKSA-N His-Asn-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UZZXGLOJRZKYEL-DJFWLOJKSA-N 0.000 description 2
- WZOGEMJIZBNFBK-CIUDSAMLSA-N His-Asp-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O WZOGEMJIZBNFBK-CIUDSAMLSA-N 0.000 description 2
- TVTIDSMADMIHEU-KKUMJFAQSA-N His-Cys-Phe Chemical compound N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](CS)C(=O)N[C@@H](Cc1ccccc1)C(O)=O TVTIDSMADMIHEU-KKUMJFAQSA-N 0.000 description 2
- FIMNVXRZGUAGBI-AVGNSLFASA-N His-Glu-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O FIMNVXRZGUAGBI-AVGNSLFASA-N 0.000 description 2
- PGTISAJTWZPFGN-PEXQALLHSA-N His-Gly-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O PGTISAJTWZPFGN-PEXQALLHSA-N 0.000 description 2
- RGPWUJOMKFYFSR-QWRGUYRKSA-N His-Gly-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O RGPWUJOMKFYFSR-QWRGUYRKSA-N 0.000 description 2
- NTXIJPDAHXSHNL-ONGXEEELSA-N His-Gly-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O NTXIJPDAHXSHNL-ONGXEEELSA-N 0.000 description 2
- 108010093488 His-His-His-His-His-His Proteins 0.000 description 2
- IWXMHXYOACDSIA-PYJNHQTQSA-N His-Ile-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O IWXMHXYOACDSIA-PYJNHQTQSA-N 0.000 description 2
- VFBZWZXKCVBTJR-SRVKXCTJSA-N His-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N VFBZWZXKCVBTJR-SRVKXCTJSA-N 0.000 description 2
- SKOKHBGDXGTDDP-MELADBBJSA-N His-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N SKOKHBGDXGTDDP-MELADBBJSA-N 0.000 description 2
- KHUFDBQXGLEIHC-BZSNNMDCSA-N His-Leu-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CN=CN1 KHUFDBQXGLEIHC-BZSNNMDCSA-N 0.000 description 2
- TWROVBNEHJSXDG-IHRRRGAJSA-N His-Leu-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O TWROVBNEHJSXDG-IHRRRGAJSA-N 0.000 description 2
- FHGVHXCQMJWQPK-SRVKXCTJSA-N His-Lys-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O FHGVHXCQMJWQPK-SRVKXCTJSA-N 0.000 description 2
- QEYUCKCWTMIERU-SRVKXCTJSA-N His-Lys-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N QEYUCKCWTMIERU-SRVKXCTJSA-N 0.000 description 2
- UXSATKFPUVZVDK-KKUMJFAQSA-N His-Lys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CN=CN1)N UXSATKFPUVZVDK-KKUMJFAQSA-N 0.000 description 2
- MIHTTYXBXIRRGV-AVGNSLFASA-N His-Met-Arg Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N MIHTTYXBXIRRGV-AVGNSLFASA-N 0.000 description 2
- SLFSYFJKSIVSON-SRVKXCTJSA-N His-Met-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N SLFSYFJKSIVSON-SRVKXCTJSA-N 0.000 description 2
- FJCGVRRVBKYYOU-DCAQKATOSA-N His-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N FJCGVRRVBKYYOU-DCAQKATOSA-N 0.000 description 2
- QCBYAHHNOHBXIH-UWVGGRQHSA-N His-Pro-Gly Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)NCC(O)=O)C1=CN=CN1 QCBYAHHNOHBXIH-UWVGGRQHSA-N 0.000 description 2
- OWYIDJCNRWRSJY-QTKMDUPCSA-N His-Pro-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O OWYIDJCNRWRSJY-QTKMDUPCSA-N 0.000 description 2
- FLXCRBXJRJSDHX-AVGNSLFASA-N His-Pro-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O FLXCRBXJRJSDHX-AVGNSLFASA-N 0.000 description 2
- ILUVWFTXAUYOBW-CUJWVEQBSA-N His-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC1=CN=CN1)N)O ILUVWFTXAUYOBW-CUJWVEQBSA-N 0.000 description 2
- VXZZUXWAOMWWJH-QTKMDUPCSA-N His-Thr-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O VXZZUXWAOMWWJH-QTKMDUPCSA-N 0.000 description 2
- UIRUVUUGUYCMBY-KCTSRDHCSA-N His-Trp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CC3=CN=CN3)N UIRUVUUGUYCMBY-KCTSRDHCSA-N 0.000 description 2
- FFYYUUWROYYKFY-IHRRRGAJSA-N His-Val-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O FFYYUUWROYYKFY-IHRRRGAJSA-N 0.000 description 2
- GGXUJBKENKVYNV-ULQDDVLXSA-N His-Val-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N GGXUJBKENKVYNV-ULQDDVLXSA-N 0.000 description 2
- DRKZDEFADVYTLU-AVGNSLFASA-N His-Val-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O DRKZDEFADVYTLU-AVGNSLFASA-N 0.000 description 2
- AQCUAZTZSPQJFF-ZKWXMUAHSA-N Ile-Ala-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O AQCUAZTZSPQJFF-ZKWXMUAHSA-N 0.000 description 2
- CYHYBSGMHMHKOA-CIQUZCHMSA-N Ile-Ala-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N CYHYBSGMHMHKOA-CIQUZCHMSA-N 0.000 description 2
- HERITAGIPLEJMT-GVARAGBVSA-N Ile-Ala-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HERITAGIPLEJMT-GVARAGBVSA-N 0.000 description 2
- WECYRWOMWSCWNX-XUXIUFHCSA-N Ile-Arg-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(C)C)C(O)=O WECYRWOMWSCWNX-XUXIUFHCSA-N 0.000 description 2
- AZEYWPUCOYXFOE-CYDGBPFRSA-N Ile-Arg-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](C(C)C)C(=O)O)N AZEYWPUCOYXFOE-CYDGBPFRSA-N 0.000 description 2
- QSPLUJGYOPZINY-ZPFDUUQYSA-N Ile-Asp-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N QSPLUJGYOPZINY-ZPFDUUQYSA-N 0.000 description 2
- HGNUKGZQASSBKQ-PCBIJLKTSA-N Ile-Asp-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N HGNUKGZQASSBKQ-PCBIJLKTSA-N 0.000 description 2
- GYAFMRQGWHXMII-IUKAMOBKSA-N Ile-Asp-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N GYAFMRQGWHXMII-IUKAMOBKSA-N 0.000 description 2
- SJIGTGZVQGLMGG-NAKRPEOUSA-N Ile-Cys-Arg Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)O SJIGTGZVQGLMGG-NAKRPEOUSA-N 0.000 description 2
- DMZOUKXXHJQPTL-GRLWGSQLSA-N Ile-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N DMZOUKXXHJQPTL-GRLWGSQLSA-N 0.000 description 2
- LKACSKJPTFSBHR-MNXVOIDGSA-N Ile-Gln-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N LKACSKJPTFSBHR-MNXVOIDGSA-N 0.000 description 2
- WZDCVAWMBUNDDY-KBIXCLLPSA-N Ile-Glu-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](C)C(=O)O)N WZDCVAWMBUNDDY-KBIXCLLPSA-N 0.000 description 2
- LPXHYGGZJOCAFR-MNXVOIDGSA-N Ile-Glu-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N LPXHYGGZJOCAFR-MNXVOIDGSA-N 0.000 description 2
- DFJJAVZIHDFOGQ-MNXVOIDGSA-N Ile-Glu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N DFJJAVZIHDFOGQ-MNXVOIDGSA-N 0.000 description 2
- SPQWWEZBHXHUJN-KBIXCLLPSA-N Ile-Glu-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O SPQWWEZBHXHUJN-KBIXCLLPSA-N 0.000 description 2
- WUKLZPHVWAMZQV-UKJIMTQDSA-N Ile-Glu-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N WUKLZPHVWAMZQV-UKJIMTQDSA-N 0.000 description 2
- NHJKZMDIMMTVCK-QXEWZRGKSA-N Ile-Gly-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N NHJKZMDIMMTVCK-QXEWZRGKSA-N 0.000 description 2
- LPFBXFILACZHIB-LAEOZQHASA-N Ile-Gly-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)O)C(=O)O)N LPFBXFILACZHIB-LAEOZQHASA-N 0.000 description 2
- MQFGXJNSUJTXDT-QSFUFRPTSA-N Ile-Gly-Ile Chemical compound N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)O MQFGXJNSUJTXDT-QSFUFRPTSA-N 0.000 description 2
- GQKSJYINYYWPMR-NGZCFLSTSA-N Ile-Gly-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N1CCC[C@@H]1C(=O)O)N GQKSJYINYYWPMR-NGZCFLSTSA-N 0.000 description 2
- DFFTXLCCDFYRKD-MBLNEYKQSA-N Ile-Gly-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)O)N DFFTXLCCDFYRKD-MBLNEYKQSA-N 0.000 description 2
- UAQSZXGJGLHMNV-XEGUGMAKSA-N Ile-Gly-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N UAQSZXGJGLHMNV-XEGUGMAKSA-N 0.000 description 2
- AREBLHSMLMRICD-PYJNHQTQSA-N Ile-His-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N AREBLHSMLMRICD-PYJNHQTQSA-N 0.000 description 2
- URWXDJAEEGBADB-TUBUOCAGSA-N Ile-His-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N URWXDJAEEGBADB-TUBUOCAGSA-N 0.000 description 2
- WIZPFZKOFZXDQG-HTFCKZLJSA-N Ile-Ile-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O WIZPFZKOFZXDQG-HTFCKZLJSA-N 0.000 description 2
- HUWYGQOISIJNMK-SIGLWIIPSA-N Ile-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N HUWYGQOISIJNMK-SIGLWIIPSA-N 0.000 description 2
- AXNGDPAKKCEKGY-QPHKQPEJSA-N Ile-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N AXNGDPAKKCEKGY-QPHKQPEJSA-N 0.000 description 2
- KLBVGHCGHUNHEA-BJDJZHNGSA-N Ile-Leu-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)O)N KLBVGHCGHUNHEA-BJDJZHNGSA-N 0.000 description 2
- OUUCIIJSBIBCHB-ZPFDUUQYSA-N Ile-Leu-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O OUUCIIJSBIBCHB-ZPFDUUQYSA-N 0.000 description 2
- TVYWVSJGSHQWMT-AJNGGQMLSA-N Ile-Leu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N TVYWVSJGSHQWMT-AJNGGQMLSA-N 0.000 description 2
- PMMMQRVUMVURGJ-XUXIUFHCSA-N Ile-Leu-Pro Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O PMMMQRVUMVURGJ-XUXIUFHCSA-N 0.000 description 2
- ADDYYRVQQZFIMW-MNXVOIDGSA-N Ile-Lys-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ADDYYRVQQZFIMW-MNXVOIDGSA-N 0.000 description 2
- PARSHQDZROHERM-NHCYSSNCSA-N Ile-Lys-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)O)N PARSHQDZROHERM-NHCYSSNCSA-N 0.000 description 2
- CKRFDMPBSWYOBT-PPCPHDFISA-N Ile-Lys-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N CKRFDMPBSWYOBT-PPCPHDFISA-N 0.000 description 2
- MSASLZGZQAXVFP-PEDHHIEDSA-N Ile-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N MSASLZGZQAXVFP-PEDHHIEDSA-N 0.000 description 2
- VEPIBPGLTLPBDW-URLPEUOOSA-N Ile-Phe-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N VEPIBPGLTLPBDW-URLPEUOOSA-N 0.000 description 2
- BJECXJHLUJXPJQ-PYJNHQTQSA-N Ile-Pro-His Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N BJECXJHLUJXPJQ-PYJNHQTQSA-N 0.000 description 2
- CAHCWMVNBZJVAW-NAKRPEOUSA-N Ile-Pro-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)O)N CAHCWMVNBZJVAW-NAKRPEOUSA-N 0.000 description 2
- QQVXERGIFIRCGW-NAKRPEOUSA-N Ile-Ser-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)O)N QQVXERGIFIRCGW-NAKRPEOUSA-N 0.000 description 2
- WLRJHVNFGAOYPS-HJPIBITLSA-N Ile-Ser-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N WLRJHVNFGAOYPS-HJPIBITLSA-N 0.000 description 2
- SAEWJTCJQVZQNZ-IUKAMOBKSA-N Ile-Thr-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N SAEWJTCJQVZQNZ-IUKAMOBKSA-N 0.000 description 2
- YCKPUHHMCFSUMD-IUKAMOBKSA-N Ile-Thr-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCKPUHHMCFSUMD-IUKAMOBKSA-N 0.000 description 2
- COWHUQXTSYTKQC-RWRJDSDZSA-N Ile-Thr-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N COWHUQXTSYTKQC-RWRJDSDZSA-N 0.000 description 2
- YBKKLDBBPFIXBQ-MBLNEYKQSA-N Ile-Thr-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)O)N YBKKLDBBPFIXBQ-MBLNEYKQSA-N 0.000 description 2
- ANTFEOSJMAUGIB-KNZXXDILSA-N Ile-Thr-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@@H]1C(=O)O)N ANTFEOSJMAUGIB-KNZXXDILSA-N 0.000 description 2
- WCNWGAUZWWSYDG-SVSWQMSJSA-N Ile-Thr-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)O)N WCNWGAUZWWSYDG-SVSWQMSJSA-N 0.000 description 2
- QHUREMVLLMNUAX-OSUNSFLBSA-N Ile-Thr-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)O)N QHUREMVLLMNUAX-OSUNSFLBSA-N 0.000 description 2
- BQIIHAGJIYOQBP-YFYLHZKVSA-N Ile-Trp-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N3CCC[C@@H]3C(=O)O)N BQIIHAGJIYOQBP-YFYLHZKVSA-N 0.000 description 2
- JSLIXOUMAOUGBN-JUKXBJQTSA-N Ile-Tyr-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N JSLIXOUMAOUGBN-JUKXBJQTSA-N 0.000 description 2
- NSPNUMNLZNOPAQ-SJWGOKEGSA-N Ile-Tyr-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N NSPNUMNLZNOPAQ-SJWGOKEGSA-N 0.000 description 2
- ZYVTXBXHIKGZMD-QSFUFRPTSA-N Ile-Val-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ZYVTXBXHIKGZMD-QSFUFRPTSA-N 0.000 description 2
- BCISUQVFDGYZBO-QSFUFRPTSA-N Ile-Val-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O BCISUQVFDGYZBO-QSFUFRPTSA-N 0.000 description 2
- DLEBSGAVWRPTIX-PEDHHIEDSA-N Ile-Val-Ile Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)[C@@H](C)CC DLEBSGAVWRPTIX-PEDHHIEDSA-N 0.000 description 2
- JZBVBOKASHNXAD-NAKRPEOUSA-N Ile-Val-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N JZBVBOKASHNXAD-NAKRPEOUSA-N 0.000 description 2
- 108010065920 Insulin Lispro Proteins 0.000 description 2
- 108010044467 Isoenzymes Proteins 0.000 description 2
- IBMVEYRWAWIOTN-UHFFFAOYSA-N L-Leucyl-L-Arginyl-L-Proline Natural products CC(C)CC(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O IBMVEYRWAWIOTN-UHFFFAOYSA-N 0.000 description 2
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 2
- GDFAOVXKHJXLEI-UHFFFAOYSA-N L-N-Boc-N-methylalanine Natural products CNC(C)C(O)=O GDFAOVXKHJXLEI-UHFFFAOYSA-N 0.000 description 2
- UGTHTQWIQKEDEH-BQBZGAKWSA-N L-alanyl-L-prolylglycine zwitterion Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UGTHTQWIQKEDEH-BQBZGAKWSA-N 0.000 description 2
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 2
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 2
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 2
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 2
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 2
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 2
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 2
- 241000186660 Lactobacillus Species 0.000 description 2
- 101100433987 Latilactobacillus sakei subsp. sakei (strain 23K) ackA1 gene Proteins 0.000 description 2
- ZRLUISBDKUWAIZ-CIUDSAMLSA-N Leu-Ala-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O ZRLUISBDKUWAIZ-CIUDSAMLSA-N 0.000 description 2
- KWTVLKBOQATPHJ-SRVKXCTJSA-N Leu-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N KWTVLKBOQATPHJ-SRVKXCTJSA-N 0.000 description 2
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 2
- XBBKIIGCUMBKCO-JXUBOQSCSA-N Leu-Ala-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XBBKIIGCUMBKCO-JXUBOQSCSA-N 0.000 description 2
- WGNOPSQMIQERPK-GARJFASQSA-N Leu-Asn-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N WGNOPSQMIQERPK-GARJFASQSA-N 0.000 description 2
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 2
- FIJMQLGQLBLBOL-HJGDQZAQSA-N Leu-Asn-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FIJMQLGQLBLBOL-HJGDQZAQSA-N 0.000 description 2
- KTFHTMHHKXUYPW-ZPFDUUQYSA-N Leu-Asp-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KTFHTMHHKXUYPW-ZPFDUUQYSA-N 0.000 description 2
- DLCOFDAHNMMQPP-SRVKXCTJSA-N Leu-Asp-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DLCOFDAHNMMQPP-SRVKXCTJSA-N 0.000 description 2
- XVSJMWYYLHPDKY-DCAQKATOSA-N Leu-Asp-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O XVSJMWYYLHPDKY-DCAQKATOSA-N 0.000 description 2
- MMEDVBWCMGRKKC-GARJFASQSA-N Leu-Asp-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N MMEDVBWCMGRKKC-GARJFASQSA-N 0.000 description 2
- DPWGZWUMUUJQDT-IUCAKERBSA-N Leu-Gln-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O DPWGZWUMUUJQDT-IUCAKERBSA-N 0.000 description 2
- GPICTNQYKHHHTH-GUBZILKMSA-N Leu-Gln-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O GPICTNQYKHHHTH-GUBZILKMSA-N 0.000 description 2
- WIDZHJTYKYBLSR-DCAQKATOSA-N Leu-Glu-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WIDZHJTYKYBLSR-DCAQKATOSA-N 0.000 description 2
- IWTBYNQNAPECCS-AVGNSLFASA-N Leu-Glu-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 IWTBYNQNAPECCS-AVGNSLFASA-N 0.000 description 2
- LAPSXOAUPNOINL-YUMQZZPRSA-N Leu-Gly-Asp Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O LAPSXOAUPNOINL-YUMQZZPRSA-N 0.000 description 2
- BTNXKBVLWJBTNR-SRVKXCTJSA-N Leu-His-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(O)=O BTNXKBVLWJBTNR-SRVKXCTJSA-N 0.000 description 2
- CSFVADKICPDRRF-KKUMJFAQSA-N Leu-His-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CN=CN1 CSFVADKICPDRRF-KKUMJFAQSA-N 0.000 description 2
- SGIIOQQGLUUMDQ-IHRRRGAJSA-N Leu-His-Val Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](C(C)C)C(=O)O)N SGIIOQQGLUUMDQ-IHRRRGAJSA-N 0.000 description 2
- AUBMZAMQCOYSIC-MNXVOIDGSA-N Leu-Ile-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O AUBMZAMQCOYSIC-MNXVOIDGSA-N 0.000 description 2
- JFSGIJSCJFQGSZ-MXAVVETBSA-N Leu-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(C)C)N JFSGIJSCJFQGSZ-MXAVVETBSA-N 0.000 description 2
- HNDWYLYAYNBWMP-AJNGGQMLSA-N Leu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N HNDWYLYAYNBWMP-AJNGGQMLSA-N 0.000 description 2
- QLDHBYRUNQZIJQ-DKIMLUQUSA-N Leu-Ile-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QLDHBYRUNQZIJQ-DKIMLUQUSA-N 0.000 description 2
- OMHLATXVNQSALM-FQUUOJAGSA-N Leu-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(C)C)N OMHLATXVNQSALM-FQUUOJAGSA-N 0.000 description 2
- LIINDKYIGYTDLG-PPCPHDFISA-N Leu-Ile-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LIINDKYIGYTDLG-PPCPHDFISA-N 0.000 description 2
- JKSIBWITFMQTOA-XUXIUFHCSA-N Leu-Ile-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O JKSIBWITFMQTOA-XUXIUFHCSA-N 0.000 description 2
- UBZGNBKMIJHOHL-BZSNNMDCSA-N Leu-Leu-Phe Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 UBZGNBKMIJHOHL-BZSNNMDCSA-N 0.000 description 2
- ZGUMORRUBUCXEH-AVGNSLFASA-N Leu-Lys-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZGUMORRUBUCXEH-AVGNSLFASA-N 0.000 description 2
- LVTJJOJKDCVZGP-QWRGUYRKSA-N Leu-Lys-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LVTJJOJKDCVZGP-QWRGUYRKSA-N 0.000 description 2
- QNTJIDXQHWUBKC-BZSNNMDCSA-N Leu-Lys-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QNTJIDXQHWUBKC-BZSNNMDCSA-N 0.000 description 2
- RTIRBWJPYJYTLO-MELADBBJSA-N Leu-Lys-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N RTIRBWJPYJYTLO-MELADBBJSA-N 0.000 description 2
- VCHVSKNMTXWIIP-SRVKXCTJSA-N Leu-Lys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O VCHVSKNMTXWIIP-SRVKXCTJSA-N 0.000 description 2
- BJWKOATWNQJPSK-SRVKXCTJSA-N Leu-Met-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N BJWKOATWNQJPSK-SRVKXCTJSA-N 0.000 description 2
- ZDBMWELMUCLUPL-QEJZJMRPSA-N Leu-Phe-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 ZDBMWELMUCLUPL-QEJZJMRPSA-N 0.000 description 2
- SYRTUBLKWNDSDK-DKIMLUQUSA-N Leu-Phe-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYRTUBLKWNDSDK-DKIMLUQUSA-N 0.000 description 2
- UHNQRAFSEBGZFZ-YESZJQIVSA-N Leu-Phe-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N UHNQRAFSEBGZFZ-YESZJQIVSA-N 0.000 description 2
- QMKFDEUJGYNFMC-AVGNSLFASA-N Leu-Pro-Arg Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QMKFDEUJGYNFMC-AVGNSLFASA-N 0.000 description 2
- XWEVVRRSIOBJOO-SRVKXCTJSA-N Leu-Pro-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O XWEVVRRSIOBJOO-SRVKXCTJSA-N 0.000 description 2
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 2
- KWLWZYMNUZJKMZ-IHRRRGAJSA-N Leu-Pro-Leu Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O KWLWZYMNUZJKMZ-IHRRRGAJSA-N 0.000 description 2
- YRRCOJOXAJNSAX-IHRRRGAJSA-N Leu-Pro-Lys Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N YRRCOJOXAJNSAX-IHRRRGAJSA-N 0.000 description 2
- PWPBLZXWFXJFHE-RHYQMDGZSA-N Leu-Pro-Thr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O PWPBLZXWFXJFHE-RHYQMDGZSA-N 0.000 description 2
- SBANPBVRHYIMRR-GARJFASQSA-N Leu-Ser-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N SBANPBVRHYIMRR-GARJFASQSA-N 0.000 description 2
- ZJZNLRVCZWUONM-JXUBOQSCSA-N Leu-Thr-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O ZJZNLRVCZWUONM-JXUBOQSCSA-N 0.000 description 2
- ZDJQVSIPFLMNOX-RHYQMDGZSA-N Leu-Thr-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZDJQVSIPFLMNOX-RHYQMDGZSA-N 0.000 description 2
- KLSUAWUZBMAZCL-RHYQMDGZSA-N Leu-Thr-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(O)=O KLSUAWUZBMAZCL-RHYQMDGZSA-N 0.000 description 2
- VHTIZYYHIUHMCA-JYJNAYRXSA-N Leu-Tyr-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O VHTIZYYHIUHMCA-JYJNAYRXSA-N 0.000 description 2
- WFCKERTZVCQXKH-KBPBESRZSA-N Leu-Tyr-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O WFCKERTZVCQXKH-KBPBESRZSA-N 0.000 description 2
- BTEMNFBEAAOGBR-BZSNNMDCSA-N Leu-Tyr-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BTEMNFBEAAOGBR-BZSNNMDCSA-N 0.000 description 2
- FBNPMTNBFFAMMH-AVGNSLFASA-N Leu-Val-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-AVGNSLFASA-N 0.000 description 2
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 2
- XZNJZXJZBMBGGS-NHCYSSNCSA-N Leu-Val-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XZNJZXJZBMBGGS-NHCYSSNCSA-N 0.000 description 2
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 2
- MSFITIBEMPWCBD-ULQDDVLXSA-N Leu-Val-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 MSFITIBEMPWCBD-ULQDDVLXSA-N 0.000 description 2
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 2
- 241000186781 Listeria Species 0.000 description 2
- FZIJIFCXUCZHOL-CIUDSAMLSA-N Lys-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN FZIJIFCXUCZHOL-CIUDSAMLSA-N 0.000 description 2
- NTEVEUCLFMWSND-SRVKXCTJSA-N Lys-Arg-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O NTEVEUCLFMWSND-SRVKXCTJSA-N 0.000 description 2
- NQCJGQHHYZNUDK-DCAQKATOSA-N Lys-Arg-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CCCN=C(N)N NQCJGQHHYZNUDK-DCAQKATOSA-N 0.000 description 2
- QUYCUALODHJQLK-CIUDSAMLSA-N Lys-Asp-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QUYCUALODHJQLK-CIUDSAMLSA-N 0.000 description 2
- IWWMPCPLFXFBAF-SRVKXCTJSA-N Lys-Asp-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O IWWMPCPLFXFBAF-SRVKXCTJSA-N 0.000 description 2
- SSYOBDBNBQBSQE-SRVKXCTJSA-N Lys-Cys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O SSYOBDBNBQBSQE-SRVKXCTJSA-N 0.000 description 2
- DFXQCCBKGUNYGG-GUBZILKMSA-N Lys-Gln-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCCCN DFXQCCBKGUNYGG-GUBZILKMSA-N 0.000 description 2
- CKSBRMUOQDNPKZ-SRVKXCTJSA-N Lys-Gln-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O CKSBRMUOQDNPKZ-SRVKXCTJSA-N 0.000 description 2
- DCRWPTBMWMGADO-AVGNSLFASA-N Lys-Glu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DCRWPTBMWMGADO-AVGNSLFASA-N 0.000 description 2
- VEGLGAOVLFODGC-GUBZILKMSA-N Lys-Glu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VEGLGAOVLFODGC-GUBZILKMSA-N 0.000 description 2
- ITWQLSZTLBKWJM-YUMQZZPRSA-N Lys-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCCN ITWQLSZTLBKWJM-YUMQZZPRSA-N 0.000 description 2
- QZONCCHVHCOBSK-YUMQZZPRSA-N Lys-Gly-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O QZONCCHVHCOBSK-YUMQZZPRSA-N 0.000 description 2
- DTUZCYRNEJDKSR-NHCYSSNCSA-N Lys-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN DTUZCYRNEJDKSR-NHCYSSNCSA-N 0.000 description 2
- RFQATBGBLDAKGI-VHSXEESVSA-N Lys-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCCCN)N)C(=O)O RFQATBGBLDAKGI-VHSXEESVSA-N 0.000 description 2
- ZASPELYMPSACER-HOCLYGCPSA-N Lys-Gly-Trp Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O ZASPELYMPSACER-HOCLYGCPSA-N 0.000 description 2
- HAUUXTXKJNVIFY-ONGXEEELSA-N Lys-Gly-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAUUXTXKJNVIFY-ONGXEEELSA-N 0.000 description 2
- SLQJJFAVWSZLBL-BJDJZHNGSA-N Lys-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN SLQJJFAVWSZLBL-BJDJZHNGSA-N 0.000 description 2
- JYXBNQOKPRQNQS-YTFOTSKYSA-N Lys-Ile-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JYXBNQOKPRQNQS-YTFOTSKYSA-N 0.000 description 2
- GFWLIJDQILOEPP-HSCHXYMDSA-N Lys-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCCCN)N GFWLIJDQILOEPP-HSCHXYMDSA-N 0.000 description 2
- QKXZCUCBFPEXNK-KKUMJFAQSA-N Lys-Leu-His Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 QKXZCUCBFPEXNK-KKUMJFAQSA-N 0.000 description 2
- AIRZWUMAHCDDHR-KKUMJFAQSA-N Lys-Leu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O AIRZWUMAHCDDHR-KKUMJFAQSA-N 0.000 description 2
- RIJCHEVHFWMDKD-SRVKXCTJSA-N Lys-Lys-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O RIJCHEVHFWMDKD-SRVKXCTJSA-N 0.000 description 2
- ATNKHRAIZCMCCN-BZSNNMDCSA-N Lys-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N ATNKHRAIZCMCCN-BZSNNMDCSA-N 0.000 description 2
- PLDJDCJLRCYPJB-VOAKCMCISA-N Lys-Lys-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PLDJDCJLRCYPJB-VOAKCMCISA-N 0.000 description 2
- XFOAWKDQMRMCDN-ULQDDVLXSA-N Lys-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CCCCN)CC1=CC=CC=C1 XFOAWKDQMRMCDN-ULQDDVLXSA-N 0.000 description 2
- AZOFEHCPMBRNFD-BZSNNMDCSA-N Lys-Phe-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=CC=C1 AZOFEHCPMBRNFD-BZSNNMDCSA-N 0.000 description 2
- WLXGMVVHTIUPHE-ULQDDVLXSA-N Lys-Phe-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O WLXGMVVHTIUPHE-ULQDDVLXSA-N 0.000 description 2
- PDIDTSZKKFEDMB-UWVGGRQHSA-N Lys-Pro-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O PDIDTSZKKFEDMB-UWVGGRQHSA-N 0.000 description 2
- SBQDRNOLGSYHQA-YUMQZZPRSA-N Lys-Ser-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SBQDRNOLGSYHQA-YUMQZZPRSA-N 0.000 description 2
- IMDJSVBFQKDDEQ-MGHWNKPDSA-N Lys-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCCCN)N IMDJSVBFQKDDEQ-MGHWNKPDSA-N 0.000 description 2
- WINFHLHJTRGLCV-BZSNNMDCSA-N Lys-Tyr-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=C(O)C=C1 WINFHLHJTRGLCV-BZSNNMDCSA-N 0.000 description 2
- OHXUUQDOBQKSNB-AVGNSLFASA-N Lys-Val-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O OHXUUQDOBQKSNB-AVGNSLFASA-N 0.000 description 2
- MDDUIRLQCYVRDO-NHCYSSNCSA-N Lys-Val-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN MDDUIRLQCYVRDO-NHCYSSNCSA-N 0.000 description 2
- RPWQJSBMXJSCPD-XUXIUFHCSA-N Lys-Val-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCCN)C(C)C)C(O)=O RPWQJSBMXJSCPD-XUXIUFHCSA-N 0.000 description 2
- IKXQOBUBZSOWDY-AVGNSLFASA-N Lys-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N IKXQOBUBZSOWDY-AVGNSLFASA-N 0.000 description 2
- VTKPSXWRUGCOAC-GUBZILKMSA-N Met-Ala-Met Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCSC VTKPSXWRUGCOAC-GUBZILKMSA-N 0.000 description 2
- DCHHUGLTVLJYKA-FXQIFTODSA-N Met-Asn-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O DCHHUGLTVLJYKA-FXQIFTODSA-N 0.000 description 2
- SBSIKVMCCJUCBZ-GUBZILKMSA-N Met-Asn-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N SBSIKVMCCJUCBZ-GUBZILKMSA-N 0.000 description 2
- BQVJARUIXRXDKN-DCAQKATOSA-N Met-Asn-His Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 BQVJARUIXRXDKN-DCAQKATOSA-N 0.000 description 2
- YNOVBMBQSQTLFM-DCAQKATOSA-N Met-Asn-Leu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O YNOVBMBQSQTLFM-DCAQKATOSA-N 0.000 description 2
- UZVWDRPUTHXQAM-FXQIFTODSA-N Met-Asp-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O UZVWDRPUTHXQAM-FXQIFTODSA-N 0.000 description 2
- GPAHWYRSHCKICP-GUBZILKMSA-N Met-Glu-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GPAHWYRSHCKICP-GUBZILKMSA-N 0.000 description 2
- IUYCGMNKIZDRQI-BQBZGAKWSA-N Met-Gly-Ala Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O IUYCGMNKIZDRQI-BQBZGAKWSA-N 0.000 description 2
- AEQVPPGEJJBFEE-CYDGBPFRSA-N Met-Ile-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AEQVPPGEJJBFEE-CYDGBPFRSA-N 0.000 description 2
- QGRJTULYDZUBAY-ZPFDUUQYSA-N Met-Ile-Glu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O QGRJTULYDZUBAY-ZPFDUUQYSA-N 0.000 description 2
- MVMNUCOHQGYYKB-PEDHHIEDSA-N Met-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CCSC)N MVMNUCOHQGYYKB-PEDHHIEDSA-N 0.000 description 2
- FTQOFRPGLYXRFM-CYDGBPFRSA-N Met-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCSC)N FTQOFRPGLYXRFM-CYDGBPFRSA-N 0.000 description 2
- 108010072489 Met-Ile-Phe-Leu Proteins 0.000 description 2
- AFFKUNVPPLQUGA-DCAQKATOSA-N Met-Leu-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O AFFKUNVPPLQUGA-DCAQKATOSA-N 0.000 description 2
- KMSMNUFBNCHMII-IHRRRGAJSA-N Met-Leu-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN KMSMNUFBNCHMII-IHRRRGAJSA-N 0.000 description 2
- XDGFFEZAZHRZFR-RHYQMDGZSA-N Met-Leu-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XDGFFEZAZHRZFR-RHYQMDGZSA-N 0.000 description 2
- KRLKICLNEICJGV-STQMWFEESA-N Met-Phe-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 KRLKICLNEICJGV-STQMWFEESA-N 0.000 description 2
- VSJAPSMRFYUOKS-IUCAKERBSA-N Met-Pro-Gly Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O VSJAPSMRFYUOKS-IUCAKERBSA-N 0.000 description 2
- WXXNVZMWHOLNRJ-AVGNSLFASA-N Met-Pro-Lys Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O WXXNVZMWHOLNRJ-AVGNSLFASA-N 0.000 description 2
- FXBKQTOGURNXSL-HJGDQZAQSA-N Met-Thr-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(O)=O FXBKQTOGURNXSL-HJGDQZAQSA-N 0.000 description 2
- WXJLBSXNUHIGSS-OSUNSFLBSA-N Met-Thr-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WXJLBSXNUHIGSS-OSUNSFLBSA-N 0.000 description 2
- OVTOTTGZBWXLFU-QXEWZRGKSA-N Met-Val-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O OVTOTTGZBWXLFU-QXEWZRGKSA-N 0.000 description 2
- LBSWWNKMVPAXOI-GUBZILKMSA-N Met-Val-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O LBSWWNKMVPAXOI-GUBZILKMSA-N 0.000 description 2
- 102000008300 Mutant Proteins Human genes 0.000 description 2
- 108010021466 Mutant Proteins Proteins 0.000 description 2
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 2
- AUEJLPRZGVVDNU-UHFFFAOYSA-N N-L-tyrosyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 AUEJLPRZGVVDNU-UHFFFAOYSA-N 0.000 description 2
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 2
- GDFAOVXKHJXLEI-VKHMYHEASA-N N-methyl-L-alanine Chemical compound C[NH2+][C@@H](C)C([O-])=O GDFAOVXKHJXLEI-VKHMYHEASA-N 0.000 description 2
- AKCRVYNORCOYQT-YFKPBYRVSA-N N-methyl-L-valine Chemical compound CN[C@@H](C(C)C)C(O)=O AKCRVYNORCOYQT-YFKPBYRVSA-N 0.000 description 2
- BAWFJGJZGIEFAR-NNYOXOHSSA-O NAD(+) Chemical compound NC(=O)C1=CC=C[N+]([C@H]2[C@@H]([C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OC[C@@H]3[C@H]([C@@H](O)[C@@H](O3)N3C4=NC=NC(N)=C4N=C3)O)O2)O)=C1 BAWFJGJZGIEFAR-NNYOXOHSSA-O 0.000 description 2
- 101100068676 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) gln-1 gene Proteins 0.000 description 2
- YJQPYGGHQPGBLI-UHFFFAOYSA-N Novobiocin Natural products O1C(C)(C)C(OC)C(OC(N)=O)C(O)C1OC1=CC=C(C(O)=C(NC(=O)C=2C=C(CC=C(C)C)C(O)=CC=2)C(=O)O2)C2=C1C YJQPYGGHQPGBLI-UHFFFAOYSA-N 0.000 description 2
- 101150050051 OAC gene Proteins 0.000 description 2
- 108700026244 Open Reading Frames Proteins 0.000 description 2
- VHWOBXIWBDWZHK-IHRRRGAJSA-N Phe-Arg-Asp Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 VHWOBXIWBDWZHK-IHRRRGAJSA-N 0.000 description 2
- JEGFCFLCRSJCMA-IHRRRGAJSA-N Phe-Arg-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N JEGFCFLCRSJCMA-IHRRRGAJSA-N 0.000 description 2
- ZWJKVFAYPLPCQB-UNQGMJICSA-N Phe-Arg-Thr Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)Cc1ccccc1)C(O)=O ZWJKVFAYPLPCQB-UNQGMJICSA-N 0.000 description 2
- LDSOBEJVGGVWGD-DLOVCJGASA-N Phe-Asp-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 LDSOBEJVGGVWGD-DLOVCJGASA-N 0.000 description 2
- RIYZXJVARWJLKS-KKUMJFAQSA-N Phe-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 RIYZXJVARWJLKS-KKUMJFAQSA-N 0.000 description 2
- MQVFHOPCKNTHGT-MELADBBJSA-N Phe-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O MQVFHOPCKNTHGT-MELADBBJSA-N 0.000 description 2
- FGXIJNMDRCZVDE-KKUMJFAQSA-N Phe-Cys-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N FGXIJNMDRCZVDE-KKUMJFAQSA-N 0.000 description 2
- RJYBHZVWJPUSLB-QEWYBTABSA-N Phe-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N RJYBHZVWJPUSLB-QEWYBTABSA-N 0.000 description 2
- MFQXSDWKUXTOPZ-DZKIICNBSA-N Phe-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N MFQXSDWKUXTOPZ-DZKIICNBSA-N 0.000 description 2
- HOYQLNNGMHXZDW-KKUMJFAQSA-N Phe-Glu-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O HOYQLNNGMHXZDW-KKUMJFAQSA-N 0.000 description 2
- FMMIYCMOVGXZIP-AVGNSLFASA-N Phe-Glu-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O FMMIYCMOVGXZIP-AVGNSLFASA-N 0.000 description 2
- QPVFUAUFEBPIPT-CDMKHQONSA-N Phe-Gly-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O QPVFUAUFEBPIPT-CDMKHQONSA-N 0.000 description 2
- BEEVXUYVEHXWRQ-YESZJQIVSA-N Phe-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC3=CC=CC=C3)N)C(=O)O BEEVXUYVEHXWRQ-YESZJQIVSA-N 0.000 description 2
- WKTSCAXSYITIJJ-PCBIJLKTSA-N Phe-Ile-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O WKTSCAXSYITIJJ-PCBIJLKTSA-N 0.000 description 2
- MJQFZGOIVBDIMZ-WHOFXGATSA-N Phe-Ile-Gly Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)O MJQFZGOIVBDIMZ-WHOFXGATSA-N 0.000 description 2
- BWTKUQPNOMMKMA-FIRPJDEBSA-N Phe-Ile-Phe Chemical compound C([C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 BWTKUQPNOMMKMA-FIRPJDEBSA-N 0.000 description 2
- CWFGECHCRMGPPT-MXAVVETBSA-N Phe-Ile-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O CWFGECHCRMGPPT-MXAVVETBSA-N 0.000 description 2
- BYAIIACBWBOJCU-URLPEUOOSA-N Phe-Ile-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BYAIIACBWBOJCU-URLPEUOOSA-N 0.000 description 2
- SMFGCTXUBWEPKM-KBPBESRZSA-N Phe-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 SMFGCTXUBWEPKM-KBPBESRZSA-N 0.000 description 2
- YTILBRIUASDGBL-BZSNNMDCSA-N Phe-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 YTILBRIUASDGBL-BZSNNMDCSA-N 0.000 description 2
- MSHZERMPZKCODG-ACRUOGEOSA-N Phe-Leu-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 MSHZERMPZKCODG-ACRUOGEOSA-N 0.000 description 2
- MGLBSROLWAWCKN-FCLVOEFKSA-N Phe-Phe-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MGLBSROLWAWCKN-FCLVOEFKSA-N 0.000 description 2
- XDMMOISUAHXXFD-SRVKXCTJSA-N Phe-Ser-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O XDMMOISUAHXXFD-SRVKXCTJSA-N 0.000 description 2
- BONHGTUEEPIMPM-AVGNSLFASA-N Phe-Ser-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O BONHGTUEEPIMPM-AVGNSLFASA-N 0.000 description 2
- ILGCZYGFYQLSDZ-KKUMJFAQSA-N Phe-Ser-His Chemical compound N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CO)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O ILGCZYGFYQLSDZ-KKUMJFAQSA-N 0.000 description 2
- MHNBYYFXWDUGBW-RPTUDFQQSA-N Phe-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CC=CC=C2)N)O MHNBYYFXWDUGBW-RPTUDFQQSA-N 0.000 description 2
- CDHURCQGUDNBMA-UBHSHLNASA-N Phe-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 CDHURCQGUDNBMA-UBHSHLNASA-N 0.000 description 2
- JSGWNFKWZNPDAV-YDHLFZDLSA-N Phe-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 JSGWNFKWZNPDAV-YDHLFZDLSA-N 0.000 description 2
- YUPRIZTWANWWHK-DZKIICNBSA-N Phe-Val-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N YUPRIZTWANWWHK-DZKIICNBSA-N 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 2
- VXCHGLYSIOOZIS-GUBZILKMSA-N Pro-Ala-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 VXCHGLYSIOOZIS-GUBZILKMSA-N 0.000 description 2
- IFMDQWDAJUMMJC-DCAQKATOSA-N Pro-Ala-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O IFMDQWDAJUMMJC-DCAQKATOSA-N 0.000 description 2
- DRVIASBABBMZTF-GUBZILKMSA-N Pro-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@@H]1CCCN1 DRVIASBABBMZTF-GUBZILKMSA-N 0.000 description 2
- LNLNHXIQPGKRJQ-SRVKXCTJSA-N Pro-Arg-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H]1CCCN1 LNLNHXIQPGKRJQ-SRVKXCTJSA-N 0.000 description 2
- BNBBNGZZKQUWCD-IUCAKERBSA-N Pro-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H]1CCCN1 BNBBNGZZKQUWCD-IUCAKERBSA-N 0.000 description 2
- KDIIENQUNVNWHR-JYJNAYRXSA-N Pro-Arg-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KDIIENQUNVNWHR-JYJNAYRXSA-N 0.000 description 2
- ZSKJPKFTPQCPIH-RCWTZXSCSA-N Pro-Arg-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZSKJPKFTPQCPIH-RCWTZXSCSA-N 0.000 description 2
- ORPZXBQTEHINPB-SRVKXCTJSA-N Pro-Arg-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H]1CCCN1)C(O)=O ORPZXBQTEHINPB-SRVKXCTJSA-N 0.000 description 2
- WWAQEUOYCYMGHB-FXQIFTODSA-N Pro-Asn-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1 WWAQEUOYCYMGHB-FXQIFTODSA-N 0.000 description 2
- OBVCYFIHIIYIQF-CIUDSAMLSA-N Pro-Asn-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O OBVCYFIHIIYIQF-CIUDSAMLSA-N 0.000 description 2
- ILMLVTGTUJPQFP-FXQIFTODSA-N Pro-Asp-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O ILMLVTGTUJPQFP-FXQIFTODSA-N 0.000 description 2
- VJLJGKQAOQJXJG-CIUDSAMLSA-N Pro-Asp-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJLJGKQAOQJXJG-CIUDSAMLSA-N 0.000 description 2
- KPDRZQUWJKTMBP-DCAQKATOSA-N Pro-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 KPDRZQUWJKTMBP-DCAQKATOSA-N 0.000 description 2
- XUSDDSLCRPUKLP-QXEWZRGKSA-N Pro-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 XUSDDSLCRPUKLP-QXEWZRGKSA-N 0.000 description 2
- JFNPBBOGGNMSRX-CIUDSAMLSA-N Pro-Gln-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O JFNPBBOGGNMSRX-CIUDSAMLSA-N 0.000 description 2
- HJSCRFZVGXAGNG-SRVKXCTJSA-N Pro-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H]1CCCN1 HJSCRFZVGXAGNG-SRVKXCTJSA-N 0.000 description 2
- LANQLYHLMYDWJP-SRVKXCTJSA-N Pro-Gln-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O LANQLYHLMYDWJP-SRVKXCTJSA-N 0.000 description 2
- DIFXZGPHVCIVSQ-CIUDSAMLSA-N Pro-Gln-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DIFXZGPHVCIVSQ-CIUDSAMLSA-N 0.000 description 2
- LHALYDBUDCWMDY-CIUDSAMLSA-N Pro-Glu-Ala Chemical compound C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O LHALYDBUDCWMDY-CIUDSAMLSA-N 0.000 description 2
- KIPIKSXPPLABPN-CIUDSAMLSA-N Pro-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 KIPIKSXPPLABPN-CIUDSAMLSA-N 0.000 description 2
- VPEVBAUSTBWQHN-NHCYSSNCSA-N Pro-Glu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O VPEVBAUSTBWQHN-NHCYSSNCSA-N 0.000 description 2
- CLNJSLSHKJECME-BQBZGAKWSA-N Pro-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H]1CCCN1 CLNJSLSHKJECME-BQBZGAKWSA-N 0.000 description 2
- FKLSMYYLJHYPHH-UWVGGRQHSA-N Pro-Gly-Leu Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O FKLSMYYLJHYPHH-UWVGGRQHSA-N 0.000 description 2
- DXTOOBDIIAJZBJ-BQBZGAKWSA-N Pro-Gly-Ser Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CO)C(O)=O DXTOOBDIIAJZBJ-BQBZGAKWSA-N 0.000 description 2
- HAEGAELAYWSUNC-WPRPVWTQSA-N Pro-Gly-Val Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAEGAELAYWSUNC-WPRPVWTQSA-N 0.000 description 2
- PEYNRYREGPAOAK-LSJOCFKGSA-N Pro-His-Ala Chemical compound C([C@@H](C(=O)N[C@@H](C)C([O-])=O)NC(=O)[C@H]1[NH2+]CCC1)C1=CN=CN1 PEYNRYREGPAOAK-LSJOCFKGSA-N 0.000 description 2
- VZKBJNBZMZHKRC-XUXIUFHCSA-N Pro-Ile-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O VZKBJNBZMZHKRC-XUXIUFHCSA-N 0.000 description 2
- AUQGUYPHJSMAKI-CYDGBPFRSA-N Pro-Ile-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 AUQGUYPHJSMAKI-CYDGBPFRSA-N 0.000 description 2
- HFNPOYOKIPGAEI-SRVKXCTJSA-N Pro-Leu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 HFNPOYOKIPGAEI-SRVKXCTJSA-N 0.000 description 2
- DRKAXLDECUGLFE-ULQDDVLXSA-N Pro-Leu-Phe Chemical compound CC(C)C[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O DRKAXLDECUGLFE-ULQDDVLXSA-N 0.000 description 2
- RMODQFBNDDENCP-IHRRRGAJSA-N Pro-Lys-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O RMODQFBNDDENCP-IHRRRGAJSA-N 0.000 description 2
- WCNVGGZRTNHOOS-ULQDDVLXSA-N Pro-Lys-Tyr Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O WCNVGGZRTNHOOS-ULQDDVLXSA-N 0.000 description 2
- GFHOSBYCLACKEK-GUBZILKMSA-N Pro-Pro-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O GFHOSBYCLACKEK-GUBZILKMSA-N 0.000 description 2
- FHZJRBVMLGOHBX-GUBZILKMSA-N Pro-Pro-Asp Chemical compound OC(=O)C[C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@@H]1CCCN1)C(O)=O FHZJRBVMLGOHBX-GUBZILKMSA-N 0.000 description 2
- FDMKYQQYJKYCLV-GUBZILKMSA-N Pro-Pro-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 FDMKYQQYJKYCLV-GUBZILKMSA-N 0.000 description 2
- RCYUBVHMVUHEBM-RCWTZXSCSA-N Pro-Pro-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O RCYUBVHMVUHEBM-RCWTZXSCSA-N 0.000 description 2
- KBUAPZAZPWNYSW-SRVKXCTJSA-N Pro-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KBUAPZAZPWNYSW-SRVKXCTJSA-N 0.000 description 2
- PRKWBYCXBBSLSK-GUBZILKMSA-N Pro-Ser-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O PRKWBYCXBBSLSK-GUBZILKMSA-N 0.000 description 2
- RMJZWERKFFNNNS-XGEHTFHBSA-N Pro-Thr-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O RMJZWERKFFNNNS-XGEHTFHBSA-N 0.000 description 2
- FZXSYIPVAFVYBH-KKUMJFAQSA-N Pro-Tyr-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O FZXSYIPVAFVYBH-KKUMJFAQSA-N 0.000 description 2
- STGVYUTZKGPRCI-GUBZILKMSA-N Pro-Val-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 STGVYUTZKGPRCI-GUBZILKMSA-N 0.000 description 2
- OQSGBXGNAFQGGS-CYDGBPFRSA-N Pro-Val-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OQSGBXGNAFQGGS-CYDGBPFRSA-N 0.000 description 2
- 241000589516 Pseudomonas Species 0.000 description 2
- 108020004511 Recombinant DNA Proteins 0.000 description 2
- FIXILCYTSAUERA-FXQIFTODSA-N Ser-Ala-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FIXILCYTSAUERA-FXQIFTODSA-N 0.000 description 2
- BTKUIVBNGBFTTP-WHFBIAKZSA-N Ser-Ala-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)NCC(O)=O BTKUIVBNGBFTTP-WHFBIAKZSA-N 0.000 description 2
- WTUJZHKANPDPIN-CIUDSAMLSA-N Ser-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N WTUJZHKANPDPIN-CIUDSAMLSA-N 0.000 description 2
- YQHZVYJAGWMHES-ZLUOBGJFSA-N Ser-Ala-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YQHZVYJAGWMHES-ZLUOBGJFSA-N 0.000 description 2
- HQTKVSCNCDLXSX-BQBZGAKWSA-N Ser-Arg-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O HQTKVSCNCDLXSX-BQBZGAKWSA-N 0.000 description 2
- WDXYVIIVDIDOSX-DCAQKATOSA-N Ser-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N WDXYVIIVDIDOSX-DCAQKATOSA-N 0.000 description 2
- NRCJWSGXMAPYQX-LPEHRKFASA-N Ser-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CO)N)C(=O)O NRCJWSGXMAPYQX-LPEHRKFASA-N 0.000 description 2
- COAHUSQNSVFYBW-FXQIFTODSA-N Ser-Asn-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O COAHUSQNSVFYBW-FXQIFTODSA-N 0.000 description 2
- TYYBJUYSTWJHGO-ZKWXMUAHSA-N Ser-Asn-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O TYYBJUYSTWJHGO-ZKWXMUAHSA-N 0.000 description 2
- BTPAWKABYQMKKN-LKXGYXEUSA-N Ser-Asp-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BTPAWKABYQMKKN-LKXGYXEUSA-N 0.000 description 2
- UICKAKRRRBTILH-GUBZILKMSA-N Ser-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N UICKAKRRRBTILH-GUBZILKMSA-N 0.000 description 2
- VQBCMLMPEWPUTB-ACZMJKKPSA-N Ser-Glu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VQBCMLMPEWPUTB-ACZMJKKPSA-N 0.000 description 2
- BPMRXBZYPGYPJN-WHFBIAKZSA-N Ser-Gly-Asn Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O BPMRXBZYPGYPJN-WHFBIAKZSA-N 0.000 description 2
- MIJWOJAXARLEHA-WDSKDSINSA-N Ser-Gly-Glu Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O MIJWOJAXARLEHA-WDSKDSINSA-N 0.000 description 2
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 2
- XXXAXOWMBOKTRN-XPUUQOCRSA-N Ser-Gly-Val Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXXAXOWMBOKTRN-XPUUQOCRSA-N 0.000 description 2
- XERQKTRGJIKTRB-CIUDSAMLSA-N Ser-His-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CO)N)CC1=CN=CN1 XERQKTRGJIKTRB-CIUDSAMLSA-N 0.000 description 2
- MLSQXWSRHURDMF-GARJFASQSA-N Ser-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CO)N)C(=O)O MLSQXWSRHURDMF-GARJFASQSA-N 0.000 description 2
- LWMQRHDTXHQQOV-MXAVVETBSA-N Ser-Ile-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LWMQRHDTXHQQOV-MXAVVETBSA-N 0.000 description 2
- UIPXCLNLUUAMJU-JBDRJPRFSA-N Ser-Ile-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O UIPXCLNLUUAMJU-JBDRJPRFSA-N 0.000 description 2
- MQQBBLVOUUJKLH-HJPIBITLSA-N Ser-Ile-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MQQBBLVOUUJKLH-HJPIBITLSA-N 0.000 description 2
- QYSFWUIXDFJUDW-DCAQKATOSA-N Ser-Leu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QYSFWUIXDFJUDW-DCAQKATOSA-N 0.000 description 2
- KCNSGAMPBPYUAI-CIUDSAMLSA-N Ser-Leu-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O KCNSGAMPBPYUAI-CIUDSAMLSA-N 0.000 description 2
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 2
- GZSZPKSBVAOGIE-CIUDSAMLSA-N Ser-Lys-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O GZSZPKSBVAOGIE-CIUDSAMLSA-N 0.000 description 2
- OWCVUSJMEBGMOK-YUMQZZPRSA-N Ser-Lys-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O OWCVUSJMEBGMOK-YUMQZZPRSA-N 0.000 description 2
- NIOYDASGXWLHEZ-CIUDSAMLSA-N Ser-Met-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O NIOYDASGXWLHEZ-CIUDSAMLSA-N 0.000 description 2
- ZSLFCBHEINFXRS-LPEHRKFASA-N Ser-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N ZSLFCBHEINFXRS-LPEHRKFASA-N 0.000 description 2
- UPLYXVPQLJVWMM-KKUMJFAQSA-N Ser-Phe-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UPLYXVPQLJVWMM-KKUMJFAQSA-N 0.000 description 2
- XVWDJUROVRQKAE-KKUMJFAQSA-N Ser-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CC1=CC=CC=C1 XVWDJUROVRQKAE-KKUMJFAQSA-N 0.000 description 2
- JLKWJWPDXPKKHI-FXQIFTODSA-N Ser-Pro-Asn Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CO)N)C(=O)N[C@@H](CC(=O)N)C(=O)O JLKWJWPDXPKKHI-FXQIFTODSA-N 0.000 description 2
- FKYWFUYPVKLJLP-DCAQKATOSA-N Ser-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FKYWFUYPVKLJLP-DCAQKATOSA-N 0.000 description 2
- AZWNCEBQZXELEZ-FXQIFTODSA-N Ser-Pro-Ser Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O AZWNCEBQZXELEZ-FXQIFTODSA-N 0.000 description 2
- PPCZVWHJWJFTFN-ZLUOBGJFSA-N Ser-Ser-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPCZVWHJWJFTFN-ZLUOBGJFSA-N 0.000 description 2
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 2
- CUXJENOFJXOSOZ-BIIVOSGPSA-N Ser-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CO)N)C(=O)O CUXJENOFJXOSOZ-BIIVOSGPSA-N 0.000 description 2
- OLKICIBQRVSQMA-SRVKXCTJSA-N Ser-Ser-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OLKICIBQRVSQMA-SRVKXCTJSA-N 0.000 description 2
- VGQVAVQWKJLIRM-FXQIFTODSA-N Ser-Ser-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O VGQVAVQWKJLIRM-FXQIFTODSA-N 0.000 description 2
- NADLKBTYNKUJEP-KATARQTJSA-N Ser-Thr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NADLKBTYNKUJEP-KATARQTJSA-N 0.000 description 2
- PCJLFYBAQZQOFE-KATARQTJSA-N Ser-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N)O PCJLFYBAQZQOFE-KATARQTJSA-N 0.000 description 2
- DYEGLQRVMBWQLD-IXOXFDKPSA-N Ser-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CO)N)O DYEGLQRVMBWQLD-IXOXFDKPSA-N 0.000 description 2
- BDMWLJLPPUCLNV-XGEHTFHBSA-N Ser-Thr-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BDMWLJLPPUCLNV-XGEHTFHBSA-N 0.000 description 2
- ATEQEHCGZKBEMU-GQGQLFGLSA-N Ser-Trp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CO)N ATEQEHCGZKBEMU-GQGQLFGLSA-N 0.000 description 2
- NERYDXBVARJIQS-JYBASQMISA-N Ser-Trp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CO)N)O NERYDXBVARJIQS-JYBASQMISA-N 0.000 description 2
- MFQMZDPAZRZAPV-NAKRPEOUSA-N Ser-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CO)N MFQMZDPAZRZAPV-NAKRPEOUSA-N 0.000 description 2
- ANOQEBQWIAYIMV-AEJSXWLSSA-N Ser-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N ANOQEBQWIAYIMV-AEJSXWLSSA-N 0.000 description 2
- ODRUTDLAONAVDV-IHRRRGAJSA-N Ser-Val-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ODRUTDLAONAVDV-IHRRRGAJSA-N 0.000 description 2
- HSWXBJCBYSWBPT-GUBZILKMSA-N Ser-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C(C)C)C(O)=O HSWXBJCBYSWBPT-GUBZILKMSA-N 0.000 description 2
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 2
- 241000320123 Streptococcus pyogenes M1 GAS Species 0.000 description 2
- 241001446311 Streptomyces coelicolor A3(2) Species 0.000 description 2
- 239000012505 Superdex™ Substances 0.000 description 2
- 241000204315 Thermosipho <sea snail> Species 0.000 description 2
- MQCPGOZXFSYJPS-KZVJFYERSA-N Thr-Ala-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MQCPGOZXFSYJPS-KZVJFYERSA-N 0.000 description 2
- DFTCYYILCSQGIZ-GCJQMDKQSA-N Thr-Ala-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O DFTCYYILCSQGIZ-GCJQMDKQSA-N 0.000 description 2
- ZUXQFMVPAYGPFJ-JXUBOQSCSA-N Thr-Ala-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN ZUXQFMVPAYGPFJ-JXUBOQSCSA-N 0.000 description 2
- KEGBFULVYKYJRD-LFSVMHDDSA-N Thr-Ala-Phe Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KEGBFULVYKYJRD-LFSVMHDDSA-N 0.000 description 2
- LVHHEVGYAZGXDE-KDXUFGMBSA-N Thr-Ala-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(=O)O)N)O LVHHEVGYAZGXDE-KDXUFGMBSA-N 0.000 description 2
- XSLXHSYIVPGEER-KZVJFYERSA-N Thr-Ala-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O XSLXHSYIVPGEER-KZVJFYERSA-N 0.000 description 2
- GLQFKOVWXPPFTP-VEVYYDQMSA-N Thr-Arg-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O GLQFKOVWXPPFTP-VEVYYDQMSA-N 0.000 description 2
- IRKWVRSEQFTGGV-VEVYYDQMSA-N Thr-Asn-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IRKWVRSEQFTGGV-VEVYYDQMSA-N 0.000 description 2
- JHBHMCMKSPXRHV-NUMRIWBASA-N Thr-Asn-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O JHBHMCMKSPXRHV-NUMRIWBASA-N 0.000 description 2
- QNJZOAHSYPXTAB-VEVYYDQMSA-N Thr-Asn-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O QNJZOAHSYPXTAB-VEVYYDQMSA-N 0.000 description 2
- JBHMLZSKIXMVFS-XVSYOHENSA-N Thr-Asn-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JBHMLZSKIXMVFS-XVSYOHENSA-N 0.000 description 2
- LXWZOMSOUAMOIA-JIOCBJNQSA-N Thr-Asn-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O LXWZOMSOUAMOIA-JIOCBJNQSA-N 0.000 description 2
- LMMDEZPNUTZJAY-GCJQMDKQSA-N Thr-Asp-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O LMMDEZPNUTZJAY-GCJQMDKQSA-N 0.000 description 2
- NLSNVZAREYQMGR-HJGDQZAQSA-N Thr-Asp-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NLSNVZAREYQMGR-HJGDQZAQSA-N 0.000 description 2
- APIQKJYZDWVOCE-VEVYYDQMSA-N Thr-Asp-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O APIQKJYZDWVOCE-VEVYYDQMSA-N 0.000 description 2
- VGYBYGQXZJDZJU-XQXXSGGOSA-N Thr-Glu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O VGYBYGQXZJDZJU-XQXXSGGOSA-N 0.000 description 2
- UDQBCBUXAQIZAK-GLLZPBPUSA-N Thr-Glu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UDQBCBUXAQIZAK-GLLZPBPUSA-N 0.000 description 2
- HJOSVGCWOTYJFG-WDCWCFNPSA-N Thr-Glu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O HJOSVGCWOTYJFG-WDCWCFNPSA-N 0.000 description 2
- XOTBWOCSLMBGMF-SUSMZKCASA-N Thr-Glu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOTBWOCSLMBGMF-SUSMZKCASA-N 0.000 description 2
- KCRQEJSKXAIULJ-FJXKBIBVSA-N Thr-Gly-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O KCRQEJSKXAIULJ-FJXKBIBVSA-N 0.000 description 2
- NIEWSKWFURSECR-FOHZUACHSA-N Thr-Gly-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O NIEWSKWFURSECR-FOHZUACHSA-N 0.000 description 2
- UBDDORVPVLEECX-FJXKBIBVSA-N Thr-Gly-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O UBDDORVPVLEECX-FJXKBIBVSA-N 0.000 description 2
- DJDSEDOKJTZBAR-ZDLURKLDSA-N Thr-Gly-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O DJDSEDOKJTZBAR-ZDLURKLDSA-N 0.000 description 2
- AYCQVUUPIJHJTA-IXOXFDKPSA-N Thr-His-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O AYCQVUUPIJHJTA-IXOXFDKPSA-N 0.000 description 2
- CRZNCABIJLRFKZ-IUKAMOBKSA-N Thr-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N CRZNCABIJLRFKZ-IUKAMOBKSA-N 0.000 description 2
- XTCNBOBTROGWMW-RWRJDSDZSA-N Thr-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N XTCNBOBTROGWMW-RWRJDSDZSA-N 0.000 description 2
- ADPHPKGWVDHWML-PPCPHDFISA-N Thr-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N ADPHPKGWVDHWML-PPCPHDFISA-N 0.000 description 2
- PRNGXSILMXSWQQ-OEAJRASXSA-N Thr-Leu-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PRNGXSILMXSWQQ-OEAJRASXSA-N 0.000 description 2
- SCSVNSNWUTYSFO-WDCWCFNPSA-N Thr-Lys-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O SCSVNSNWUTYSFO-WDCWCFNPSA-N 0.000 description 2
- SPVHQURZJCUDQC-VOAKCMCISA-N Thr-Lys-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O SPVHQURZJCUDQC-VOAKCMCISA-N 0.000 description 2
- JMBRNXUOLJFURW-BEAPCOKYSA-N Thr-Phe-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N)O JMBRNXUOLJFURW-BEAPCOKYSA-N 0.000 description 2
- WTMPKZWHRCMMMT-KZVJFYERSA-N Thr-Pro-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WTMPKZWHRCMMMT-KZVJFYERSA-N 0.000 description 2
- VTMGKRABARCZAX-OSUNSFLBSA-N Thr-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O VTMGKRABARCZAX-OSUNSFLBSA-N 0.000 description 2
- SGAOHNPSEPVAFP-ZDLURKLDSA-N Thr-Ser-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SGAOHNPSEPVAFP-ZDLURKLDSA-N 0.000 description 2
- BCYUHPXBHCUYBA-CUJWVEQBSA-N Thr-Ser-His Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O BCYUHPXBHCUYBA-CUJWVEQBSA-N 0.000 description 2
- XZUBGOYOGDRYFC-XGEHTFHBSA-N Thr-Ser-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O XZUBGOYOGDRYFC-XGEHTFHBSA-N 0.000 description 2
- UQCNIMDPYICBTR-KYNKHSRBSA-N Thr-Thr-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UQCNIMDPYICBTR-KYNKHSRBSA-N 0.000 description 2
- PELIQFPESHBTMA-WLTAIBSBSA-N Thr-Tyr-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 PELIQFPESHBTMA-WLTAIBSBSA-N 0.000 description 2
- CJEHCEOXPLASCK-MEYUZBJRSA-N Thr-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@H](O)C)CC1=CC=C(O)C=C1 CJEHCEOXPLASCK-MEYUZBJRSA-N 0.000 description 2
- OGOYMQWIWHGTGH-KZVJFYERSA-N Thr-Val-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O OGOYMQWIWHGTGH-KZVJFYERSA-N 0.000 description 2
- KPMIQCXJDVKWKO-IFFSRLJSSA-N Thr-Val-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KPMIQCXJDVKWKO-IFFSRLJSSA-N 0.000 description 2
- VYVBSMCZNHOZGD-RCWTZXSCSA-N Thr-Val-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O VYVBSMCZNHOZGD-RCWTZXSCSA-N 0.000 description 2
- 241000999852 Treponema pallidum subsp. pallidum str. Nichols Species 0.000 description 2
- VFURAIPBOIWAKP-SZMVWBNQSA-N Trp-Arg-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N VFURAIPBOIWAKP-SZMVWBNQSA-N 0.000 description 2
- VMBBTANKMSRJSS-JSGCOSHPSA-N Trp-Glu-Gly Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VMBBTANKMSRJSS-JSGCOSHPSA-N 0.000 description 2
- OBAMASZCXDIXSS-SZMVWBNQSA-N Trp-Glu-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N OBAMASZCXDIXSS-SZMVWBNQSA-N 0.000 description 2
- SNJAPSVIPKUMCK-NWLDYVSISA-N Trp-Glu-Thr Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SNJAPSVIPKUMCK-NWLDYVSISA-N 0.000 description 2
- WLBZWXXGSOLJBA-HOCLYGCPSA-N Trp-Gly-Lys Chemical compound C1=CC=C2C(C[C@H](N)C(=O)NCC(=O)N[C@@H](CCCCN)C(O)=O)=CNC2=C1 WLBZWXXGSOLJBA-HOCLYGCPSA-N 0.000 description 2
- WSGPBCAGEGHKQJ-BBRMVZONSA-N Trp-Gly-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC1=CNC2=CC=CC=C21)N WSGPBCAGEGHKQJ-BBRMVZONSA-N 0.000 description 2
- YDTKYBHPRULROG-LTHWPDAASA-N Trp-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N YDTKYBHPRULROG-LTHWPDAASA-N 0.000 description 2
- MXKUGFHWYYKVDV-SZMVWBNQSA-N Trp-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)Cc1c[nH]c2ccccc12)C(C)C)C(O)=O MXKUGFHWYYKVDV-SZMVWBNQSA-N 0.000 description 2
- DLZKEQQWXODGGZ-KWQFWETISA-N Tyr-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DLZKEQQWXODGGZ-KWQFWETISA-N 0.000 description 2
- XGEUYEOEZYFHRL-KKXDTOCCSA-N Tyr-Ala-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 XGEUYEOEZYFHRL-KKXDTOCCSA-N 0.000 description 2
- OOEUVMFKKZYSRX-LEWSCRJBSA-N Tyr-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N OOEUVMFKKZYSRX-LEWSCRJBSA-N 0.000 description 2
- TWAVEIJGFCBWCG-JYJNAYRXSA-N Tyr-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N TWAVEIJGFCBWCG-JYJNAYRXSA-N 0.000 description 2
- XQYHLZNPOTXRMQ-KKUMJFAQSA-N Tyr-Glu-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O XQYHLZNPOTXRMQ-KKUMJFAQSA-N 0.000 description 2
- WAPFQMXRSDEGOE-IHRRRGAJSA-N Tyr-Glu-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O WAPFQMXRSDEGOE-IHRRRGAJSA-N 0.000 description 2
- NZFCWALTLNFHHC-JYJNAYRXSA-N Tyr-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NZFCWALTLNFHHC-JYJNAYRXSA-N 0.000 description 2
- HDSKHCBAVVWPCQ-FHWLQOOXSA-N Tyr-Glu-Phe Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HDSKHCBAVVWPCQ-FHWLQOOXSA-N 0.000 description 2
- LHTGRUZSZOIAKM-SOUVJXGZSA-N Tyr-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O LHTGRUZSZOIAKM-SOUVJXGZSA-N 0.000 description 2
- PMDWYLVWHRTJIW-STQMWFEESA-N Tyr-Gly-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PMDWYLVWHRTJIW-STQMWFEESA-N 0.000 description 2
- AKLNEFNQWLHIGY-QWRGUYRKSA-N Tyr-Gly-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)O)C(=O)O)N)O AKLNEFNQWLHIGY-QWRGUYRKSA-N 0.000 description 2
- GIOBXJSONRQHKQ-RYUDHWBXSA-N Tyr-Gly-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O GIOBXJSONRQHKQ-RYUDHWBXSA-N 0.000 description 2
- OLWFDNLLBWQWCP-STQMWFEESA-N Tyr-Gly-Met Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O OLWFDNLLBWQWCP-STQMWFEESA-N 0.000 description 2
- CTDPLKMBVALCGN-JSGCOSHPSA-N Tyr-Gly-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O CTDPLKMBVALCGN-JSGCOSHPSA-N 0.000 description 2
- KIJLSRYAUGGZIN-CFMVVWHZSA-N Tyr-Ile-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KIJLSRYAUGGZIN-CFMVVWHZSA-N 0.000 description 2
- GGXUDPQWAWRINY-XEGUGMAKSA-N Tyr-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 GGXUDPQWAWRINY-XEGUGMAKSA-N 0.000 description 2
- KSCVLGXNQXKUAR-JYJNAYRXSA-N Tyr-Leu-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KSCVLGXNQXKUAR-JYJNAYRXSA-N 0.000 description 2
- HSBZWINKRYZCSQ-KKUMJFAQSA-N Tyr-Lys-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O HSBZWINKRYZCSQ-KKUMJFAQSA-N 0.000 description 2
- VTCKHZJKWQENKX-KBPBESRZSA-N Tyr-Lys-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O VTCKHZJKWQENKX-KBPBESRZSA-N 0.000 description 2
- FMXFHNSFABRVFZ-BZSNNMDCSA-N Tyr-Lys-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O FMXFHNSFABRVFZ-BZSNNMDCSA-N 0.000 description 2
- PWKMJDQXKCENMF-MEYUZBJRSA-N Tyr-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O PWKMJDQXKCENMF-MEYUZBJRSA-N 0.000 description 2
- TYGHOWWWMTWVKM-HJOGWXRNSA-N Tyr-Tyr-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 TYGHOWWWMTWVKM-HJOGWXRNSA-N 0.000 description 2
- VKYDVKAKGDNZED-STECZYCISA-N Tyr-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC1=CC=C(C=C1)O)N VKYDVKAKGDNZED-STECZYCISA-N 0.000 description 2
- NVJCMGGZHOJNBU-UFYCRDLUSA-N Tyr-Val-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N NVJCMGGZHOJNBU-UFYCRDLUSA-N 0.000 description 2
- FZSPNKUFROZBSG-ZKWXMUAHSA-N Val-Ala-Asp Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O FZSPNKUFROZBSG-ZKWXMUAHSA-N 0.000 description 2
- IZFVRRYRMQFVGX-NRPADANISA-N Val-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N IZFVRRYRMQFVGX-NRPADANISA-N 0.000 description 2
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 2
- LABUITCFCAABSV-UHFFFAOYSA-N Val-Ala-Tyr Natural products CC(C)C(N)C(=O)NC(C)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LABUITCFCAABSV-UHFFFAOYSA-N 0.000 description 2
- LABUITCFCAABSV-BPNCWPANSA-N Val-Ala-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 LABUITCFCAABSV-BPNCWPANSA-N 0.000 description 2
- WGHVMKFREWGCGR-SRVKXCTJSA-N Val-Arg-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N WGHVMKFREWGCGR-SRVKXCTJSA-N 0.000 description 2
- COYSIHFOCOMGCF-WPRPVWTQSA-N Val-Arg-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-WPRPVWTQSA-N 0.000 description 2
- COYSIHFOCOMGCF-UHFFFAOYSA-N Val-Arg-Gly Natural products CC(C)C(N)C(=O)NC(C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-UHFFFAOYSA-N 0.000 description 2
- CVUDMNSZAIZFAE-UHFFFAOYSA-N Val-Arg-Pro Natural products NC(N)=NCCCC(NC(=O)C(N)C(C)C)C(=O)N1CCCC1C(O)=O CVUDMNSZAIZFAE-UHFFFAOYSA-N 0.000 description 2
- CVUDMNSZAIZFAE-TUAOUCFPSA-N Val-Arg-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N CVUDMNSZAIZFAE-TUAOUCFPSA-N 0.000 description 2
- UDNYEPLJTRDMEJ-RCOVLWMOSA-N Val-Asn-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N UDNYEPLJTRDMEJ-RCOVLWMOSA-N 0.000 description 2
- IDKGBVZGNTYYCC-QXEWZRGKSA-N Val-Asn-Pro Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(O)=O IDKGBVZGNTYYCC-QXEWZRGKSA-N 0.000 description 2
- ISERLACIZUGCDX-ZKWXMUAHSA-N Val-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N ISERLACIZUGCDX-ZKWXMUAHSA-N 0.000 description 2
- XQVRMLRMTAGSFJ-QXEWZRGKSA-N Val-Asp-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XQVRMLRMTAGSFJ-QXEWZRGKSA-N 0.000 description 2
- TZVUSFMQWPWHON-NHCYSSNCSA-N Val-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N TZVUSFMQWPWHON-NHCYSSNCSA-N 0.000 description 2
- BMGOFDMKDVVGJG-NHCYSSNCSA-N Val-Asp-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BMGOFDMKDVVGJG-NHCYSSNCSA-N 0.000 description 2
- OVLIFGQSBSNGHY-KKHAAJSZSA-N Val-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N)O OVLIFGQSBSNGHY-KKHAAJSZSA-N 0.000 description 2
- XTAUQCGQFJQGEJ-NHCYSSNCSA-N Val-Gln-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XTAUQCGQFJQGEJ-NHCYSSNCSA-N 0.000 description 2
- PGBJAZDAEWPDAA-NHCYSSNCSA-N Val-Gln-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCSC)C(=O)O)N PGBJAZDAEWPDAA-NHCYSSNCSA-N 0.000 description 2
- GBESYURLQOYWLU-LAEOZQHASA-N Val-Glu-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GBESYURLQOYWLU-LAEOZQHASA-N 0.000 description 2
- SZTTYWIUCGSURQ-AUTRQRHGSA-N Val-Glu-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SZTTYWIUCGSURQ-AUTRQRHGSA-N 0.000 description 2
- YDPFWRVQHFWBKI-GVXVVHGQSA-N Val-Glu-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N YDPFWRVQHFWBKI-GVXVVHGQSA-N 0.000 description 2
- OQWNEUXPKHIEJO-NRPADANISA-N Val-Glu-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N OQWNEUXPKHIEJO-NRPADANISA-N 0.000 description 2
- XWYUBUYQMOUFRQ-IFFSRLJSSA-N Val-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N)O XWYUBUYQMOUFRQ-IFFSRLJSSA-N 0.000 description 2
- UEHRGZCNLSWGHK-DLOVCJGASA-N Val-Glu-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UEHRGZCNLSWGHK-DLOVCJGASA-N 0.000 description 2
- DJEVQCWNMQOABE-RCOVLWMOSA-N Val-Gly-Asp Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)O)C(=O)O)N DJEVQCWNMQOABE-RCOVLWMOSA-N 0.000 description 2
- FXVDGDZRYLFQKY-WPRPVWTQSA-N Val-Gly-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C FXVDGDZRYLFQKY-WPRPVWTQSA-N 0.000 description 2
- HQYVQDRYODWONX-DCAQKATOSA-N Val-His-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CO)C(=O)O)N HQYVQDRYODWONX-DCAQKATOSA-N 0.000 description 2
- ZIGZPYJXIWLQFC-QTKMDUPCSA-N Val-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](C(C)C)N)O ZIGZPYJXIWLQFC-QTKMDUPCSA-N 0.000 description 2
- JZWZACGUZVCQPS-RNJOBUHISA-N Val-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N JZWZACGUZVCQPS-RNJOBUHISA-N 0.000 description 2
- OVBMCNDKCWAXMZ-NAKRPEOUSA-N Val-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N OVBMCNDKCWAXMZ-NAKRPEOUSA-N 0.000 description 2
- XTDDIVQWDXMRJL-IHRRRGAJSA-N Val-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N XTDDIVQWDXMRJL-IHRRRGAJSA-N 0.000 description 2
- DAVNYIUELQBTAP-XUXIUFHCSA-N Val-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N DAVNYIUELQBTAP-XUXIUFHCSA-N 0.000 description 2
- ZZGPVSZDZQRJQY-ULQDDVLXSA-N Val-Leu-Phe Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](Cc1ccccc1)C(O)=O ZZGPVSZDZQRJQY-ULQDDVLXSA-N 0.000 description 2
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 2
- WDIWOIRFNMLNKO-ULQDDVLXSA-N Val-Leu-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WDIWOIRFNMLNKO-ULQDDVLXSA-N 0.000 description 2
- GVJUTBOZZBTBIG-AVGNSLFASA-N Val-Lys-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N GVJUTBOZZBTBIG-AVGNSLFASA-N 0.000 description 2
- DIOSYUIWOQCXNR-ONGXEEELSA-N Val-Lys-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O DIOSYUIWOQCXNR-ONGXEEELSA-N 0.000 description 2
- MLADEWAIYAPAAU-IHRRRGAJSA-N Val-Lys-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N MLADEWAIYAPAAU-IHRRRGAJSA-N 0.000 description 2
- YMTOEGGOCHVGEH-IHRRRGAJSA-N Val-Lys-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O YMTOEGGOCHVGEH-IHRRRGAJSA-N 0.000 description 2
- MBGFDZDWMDLXHQ-GUBZILKMSA-N Val-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](C(C)C)N MBGFDZDWMDLXHQ-GUBZILKMSA-N 0.000 description 2
- WHVSJHJTMUHYBT-SRVKXCTJSA-N Val-Met-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCSC)C(=O)O)N WHVSJHJTMUHYBT-SRVKXCTJSA-N 0.000 description 2
- QPPZEDOTPZOSEC-RCWTZXSCSA-N Val-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](C(C)C)N)O QPPZEDOTPZOSEC-RCWTZXSCSA-N 0.000 description 2
- FMQGYTMERWBMSI-HJWJTTGWSA-N Val-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](C(C)C)N FMQGYTMERWBMSI-HJWJTTGWSA-N 0.000 description 2
- USLVEJAHTBLSIL-CYDGBPFRSA-N Val-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C USLVEJAHTBLSIL-CYDGBPFRSA-N 0.000 description 2
- WANVRBAZGSICCP-SRVKXCTJSA-N Val-Pro-Met Chemical compound CSCC[C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C)C(O)=O WANVRBAZGSICCP-SRVKXCTJSA-N 0.000 description 2
- MIKHIIQMRFYVOR-RCWTZXSCSA-N Val-Pro-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C(C)C)N)O MIKHIIQMRFYVOR-RCWTZXSCSA-N 0.000 description 2
- DEGUERSKQBRZMZ-FXQIFTODSA-N Val-Ser-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DEGUERSKQBRZMZ-FXQIFTODSA-N 0.000 description 2
- VIKZGAUAKQZDOF-NRPADANISA-N Val-Ser-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O VIKZGAUAKQZDOF-NRPADANISA-N 0.000 description 2
- DLLRRUDLMSJTMB-GUBZILKMSA-N Val-Ser-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)O)N DLLRRUDLMSJTMB-GUBZILKMSA-N 0.000 description 2
- TVGWMCTYUFBXAP-QTKMDUPCSA-N Val-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N)O TVGWMCTYUFBXAP-QTKMDUPCSA-N 0.000 description 2
- WUFHZIRMAZZWRS-OSUNSFLBSA-N Val-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C(C)C)N WUFHZIRMAZZWRS-OSUNSFLBSA-N 0.000 description 2
- USXYVSTVPHELAF-RCWTZXSCSA-N Val-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](C(C)C)N)O USXYVSTVPHELAF-RCWTZXSCSA-N 0.000 description 2
- PDDJTOSAVNRJRH-UNQGMJICSA-N Val-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](C(C)C)N)O PDDJTOSAVNRJRH-UNQGMJICSA-N 0.000 description 2
- JPBGMZDTPVGGMQ-ULQDDVLXSA-N Val-Tyr-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N JPBGMZDTPVGGMQ-ULQDDVLXSA-N 0.000 description 2
- BGTDGENDNWGMDQ-KJEVXHAQSA-N Val-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N)O BGTDGENDNWGMDQ-KJEVXHAQSA-N 0.000 description 2
- VVIZITNVZUAEMI-DLOVCJGASA-N Val-Val-Gln Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(N)=O VVIZITNVZUAEMI-DLOVCJGASA-N 0.000 description 2
- JSOXWWFKRJKTMT-WOPDTQHZSA-N Val-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N JSOXWWFKRJKTMT-WOPDTQHZSA-N 0.000 description 2
- 241000607598 Vibrio Species 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 108010081404 acein-2 Proteins 0.000 description 2
- 150000007513 acids Chemical class 0.000 description 2
- 101150006213 ackA gene Proteins 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- UDMBCSSLTHHNCD-KQYNXXCUSA-N adenosine 5'-monophosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O UDMBCSSLTHHNCD-KQYNXXCUSA-N 0.000 description 2
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 2
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 2
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 2
- 108010045350 alanyl-tyrosyl-alanine Proteins 0.000 description 2
- 108010011559 alanylphenylalanine Proteins 0.000 description 2
- OFCNXPDARWKPPY-UHFFFAOYSA-N allopurinol Chemical compound OC1=NC=NC2=C1C=NN2 OFCNXPDARWKPPY-UHFFFAOYSA-N 0.000 description 2
- 230000004075 alteration Effects 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 229940035676 analgesics Drugs 0.000 description 2
- 239000000730 antalgic agent Substances 0.000 description 2
- 230000003474 anti-emetic effect Effects 0.000 description 2
- 229940125681 anticonvulsant agent Drugs 0.000 description 2
- 239000001961 anticonvulsive agent Substances 0.000 description 2
- 239000000935 antidepressant agent Substances 0.000 description 2
- 229940005513 antidepressants Drugs 0.000 description 2
- 229940125683 antiemetic agent Drugs 0.000 description 2
- 239000002111 antiemetic agent Substances 0.000 description 2
- 108010001271 arginyl-glutamyl-arginine Proteins 0.000 description 2
- 108010043240 arginyl-leucyl-glycine Proteins 0.000 description 2
- 108010029539 arginyl-prolyl-proline Proteins 0.000 description 2
- 108010068380 arginylarginine Proteins 0.000 description 2
- 108010060035 arginylproline Proteins 0.000 description 2
- 108010036533 arginylvaline Proteins 0.000 description 2
- 210000004436 artificial bacterial chromosome Anatomy 0.000 description 2
- 210000004507 artificial chromosome Anatomy 0.000 description 2
- 210000001106 artificial yeast chromosome Anatomy 0.000 description 2
- 229960001230 asparagine Drugs 0.000 description 2
- 235000009582 asparagine Nutrition 0.000 description 2
- 235000003704 aspartic acid Nutrition 0.000 description 2
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 2
- 239000012148 binding buffer Substances 0.000 description 2
- 230000000975 bioactive effect Effects 0.000 description 2
- 238000005842 biochemical reaction Methods 0.000 description 2
- 230000004071 biological effect Effects 0.000 description 2
- HRHJHXJQMNWQTF-UHFFFAOYSA-N cannabichromenic acid Chemical compound O1C(C)(CCC=C(C)C)C=CC2=C1C=C(CCCCC)C(C(O)=O)=C2O HRHJHXJQMNWQTF-UHFFFAOYSA-N 0.000 description 2
- 229910052799 carbon Inorganic materials 0.000 description 2
- 230000032823 cell division Effects 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 2
- 235000018417 cysteine Nutrition 0.000 description 2
- 108010004073 cysteinylcysteine Proteins 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 235000014113 dietary fatty acids Nutrition 0.000 description 2
- 108010009297 diglycyl-histidine Proteins 0.000 description 2
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 2
- 239000013613 expression plasmid Substances 0.000 description 2
- 229930195729 fatty acid Natural products 0.000 description 2
- 239000000194 fatty acid Substances 0.000 description 2
- 150000004665 fatty acids Chemical class 0.000 description 2
- 229930003935 flavonoid Natural products 0.000 description 2
- 150000002215 flavonoids Chemical class 0.000 description 2
- 235000017173 flavonoids Nutrition 0.000 description 2
- 238000010230 functional analysis Methods 0.000 description 2
- 238000012239 gene modification Methods 0.000 description 2
- 230000005017 genetic modification Effects 0.000 description 2
- 235000013617 genetically modified food Nutrition 0.000 description 2
- 235000013922 glutamic acid Nutrition 0.000 description 2
- 239000004220 glutamic acid Substances 0.000 description 2
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 2
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 2
- 108010013768 glutamyl-aspartyl-proline Proteins 0.000 description 2
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 2
- 108010072405 glycyl-aspartyl-glycine Proteins 0.000 description 2
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 2
- 108010038983 glycyl-histidyl-lysine Proteins 0.000 description 2
- 108010077435 glycyl-phenylalanyl-glycine Proteins 0.000 description 2
- 108010079413 glycyl-prolyl-glutamic acid Proteins 0.000 description 2
- 108010059898 glycyl-tyrosyl-lysine Proteins 0.000 description 2
- 108010010147 glycylglutamine Proteins 0.000 description 2
- 108010087823 glycyltyrosine Proteins 0.000 description 2
- 230000012010 growth Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 238000002347 injection Methods 0.000 description 2
- 239000007924 injection Substances 0.000 description 2
- 108010078274 isoleucylvaline Proteins 0.000 description 2
- QMZRXYCCCYYMHF-UHFFFAOYSA-N isopentenyl phosphate Chemical compound CC(=C)CCOP(O)(O)=O QMZRXYCCCYYMHF-UHFFFAOYSA-N 0.000 description 2
- 108010043612 kentsin Proteins 0.000 description 2
- 108010053037 kyotorphin Proteins 0.000 description 2
- 229940039696 lactobacillus Drugs 0.000 description 2
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 2
- 238000007834 ligase chain reaction Methods 0.000 description 2
- 108010003700 lysyl aspartic acid Proteins 0.000 description 2
- 108010057952 lysyl-phenylalanyl-lysine Proteins 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 108010089734 malonyl-CoA synthetase Proteins 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 229930182817 methionine Natural products 0.000 description 2
- 108010022588 methionyl-lysyl-proline Proteins 0.000 description 2
- 108010005942 methionylglycine Proteins 0.000 description 2
- 108010085203 methionylmethionine Proteins 0.000 description 2
- 238000002703 mutagenesis Methods 0.000 description 2
- 231100000350 mutagenesis Toxicity 0.000 description 2
- NXPPAOGUKPJVDI-UHFFFAOYSA-N naphthalene-1,2-diol Chemical class C1=CC=CC2=C(O)C(O)=CC=C21 NXPPAOGUKPJVDI-UHFFFAOYSA-N 0.000 description 2
- FZZQNEVOYIYFPF-UHFFFAOYSA-N naphthalene-1,6-diol Chemical compound OC1=CC=CC2=CC(O)=CC=C21 FZZQNEVOYIYFPF-UHFFFAOYSA-N 0.000 description 2
- YJQPYGGHQPGBLI-KGSXXDOSSA-N novobiocin Chemical compound O1C(C)(C)[C@H](OC)[C@@H](OC(N)=O)[C@@H](O)[C@@H]1OC1=CC=C(C(O)=C(NC(=O)C=2C=C(CC=C(C)C)C(O)=CC=2)C(=O)O2)C2=C1C YJQPYGGHQPGBLI-KGSXXDOSSA-N 0.000 description 2
- 229960002950 novobiocin Drugs 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 108010089198 phenylalanyl-prolyl-arginine Proteins 0.000 description 2
- 108010012581 phenylalanylglutamate Proteins 0.000 description 2
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 2
- 108010051242 phenylalanylserine Proteins 0.000 description 2
- 229930015704 phenylpropanoid Natural products 0.000 description 2
- DTBNBXWJWCWCIK-UHFFFAOYSA-K phosphonatoenolpyruvate Chemical compound [O-]C(=O)C(=C)OP([O-])([O-])=O DTBNBXWJWCWCIK-UHFFFAOYSA-K 0.000 description 2
- 230000000243 photosynthetic effect Effects 0.000 description 2
- 239000013612 plasmid Substances 0.000 description 2
- 239000002244 precipitate Substances 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 2
- 239000007790 solid phase Substances 0.000 description 2
- 239000007858 starting material Substances 0.000 description 2
- 230000009469 supplementation Effects 0.000 description 2
- 235000007586 terpenes Nutrition 0.000 description 2
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 2
- 108010071097 threonyl-lysyl-proline Proteins 0.000 description 2
- 108010072986 threonyl-seryl-lysine Proteins 0.000 description 2
- 238000004448 titration Methods 0.000 description 2
- QAIPRVGONGVQAS-DUXPYHPUSA-N trans-caffeic acid Chemical compound OC(=O)\C=C\C1=CC=C(O)C(O)=C1 QAIPRVGONGVQAS-DUXPYHPUSA-N 0.000 description 2
- 108010084932 tryptophyl-proline Proteins 0.000 description 2
- 108010005834 tyrosyl-alanyl-glycine Proteins 0.000 description 2
- 108010073969 valyllysine Proteins 0.000 description 2
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 1
- IQSYWEWTWDEVNO-ZIAGYGMSSA-N (6ar,10ar)-1-hydroxy-6,6,9-trimethyl-3-propyl-6a,7,8,10a-tetrahydrobenzo[c]chromene-2-carboxylic acid Chemical compound C([C@H]1C(C)(C)O2)CC(C)=C[C@H]1C1=C2C=C(CCC)C(C(O)=O)=C1O IQSYWEWTWDEVNO-ZIAGYGMSSA-N 0.000 description 1
- ACEAELOMUCBPJP-UHFFFAOYSA-N (E)-3,4,5-trihydroxycinnamic acid Natural products OC(=O)C=CC1=CC(O)=C(O)C(O)=C1 ACEAELOMUCBPJP-UHFFFAOYSA-N 0.000 description 1
- OWEGMIWEEQEYGQ-UHFFFAOYSA-N 100676-05-9 Natural products OC1C(O)C(O)C(CO)OC1OCC1C(O)C(O)C(O)C(OC2C(OC(O)C(O)C2O)CO)O1 OWEGMIWEEQEYGQ-UHFFFAOYSA-N 0.000 description 1
- 108020004465 16S ribosomal RNA Proteins 0.000 description 1
- CZXWOKHVLNYAHI-LSDHHAIUSA-N 2,4-dihydroxy-3-[(1r,6r)-3-methyl-6-prop-1-en-2-ylcyclohex-2-en-1-yl]-6-propylbenzoic acid Chemical compound OC1=C(C(O)=O)C(CCC)=CC(O)=C1[C@H]1[C@H](C(C)=C)CCC(C)=C1 CZXWOKHVLNYAHI-LSDHHAIUSA-N 0.000 description 1
- QWZHDKGQKYEBKK-UHFFFAOYSA-N 3-aminochromen-2-one Chemical compound C1=CC=C2OC(=O)C(N)=CC2=C1 QWZHDKGQKYEBKK-UHFFFAOYSA-N 0.000 description 1
- NGSWKAQJJWESNS-ZZXKWVIFSA-M 4-Hydroxycinnamate Natural products OC1=CC=C(\C=C\C([O-])=O)C=C1 NGSWKAQJJWESNS-ZZXKWVIFSA-M 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- GHURLXDGHMZIGJ-UHFFFAOYSA-N 4-hydroxy-6-(2-oxoheptyl)pyran-2-one Chemical compound CCCCCC(=O)CC1=CC(O)=CC(=O)O1 GHURLXDGHMZIGJ-UHFFFAOYSA-N 0.000 description 1
- YIXLDRQOKWESBI-UHFFFAOYSA-N 4-hydroxy-6-pentylpyran-2-one Chemical compound CCCCCC1=CC(O)=CC(=O)O1 YIXLDRQOKWESBI-UHFFFAOYSA-N 0.000 description 1
- 125000004203 4-hydroxyphenyl group Chemical group [H]OC1=C([H])C([H])=C(*)C([H])=C1[H] 0.000 description 1
- KKADPXVIOXHVKN-UHFFFAOYSA-N 4-hydroxyphenylpyruvic acid Chemical compound OC(=O)C(=O)CC1=CC=C(O)C=C1 KKADPXVIOXHVKN-UHFFFAOYSA-N 0.000 description 1
- 101710134681 40 kDa protein Proteins 0.000 description 1
- OIVPAQDCMDYIIL-UHFFFAOYSA-N 5-hydroxy-2-methyl-2-(4-methylpent-3-enyl)-7-propylchromene-6-carboxylic acid Chemical compound O1C(C)(CCC=C(C)C)C=CC2=C1C=C(CCC)C(C(O)=O)=C2O OIVPAQDCMDYIIL-UHFFFAOYSA-N 0.000 description 1
- 241000589220 Acetobacter Species 0.000 description 1
- DFYRUELUNQRZTB-UHFFFAOYSA-N Acetovanillone Natural products COC1=CC(C(C)=O)=CC=C1O DFYRUELUNQRZTB-UHFFFAOYSA-N 0.000 description 1
- QTXZASLUYMRUAN-QLQASOTGSA-N Acetyl coenzyme A (Acetyl-CoA) Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1.O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 QTXZASLUYMRUAN-QLQASOTGSA-N 0.000 description 1
- 241000186361 Actinobacteria <class> Species 0.000 description 1
- 241000186046 Actinomyces Species 0.000 description 1
- 108020000543 Adenylate kinase Proteins 0.000 description 1
- RZZMZYZXNJRPOJ-BJDJZHNGSA-N Ala-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C)N RZZMZYZXNJRPOJ-BJDJZHNGSA-N 0.000 description 1
- LBYMZCVBOKYZNS-CIUDSAMLSA-N Ala-Leu-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O LBYMZCVBOKYZNS-CIUDSAMLSA-N 0.000 description 1
- GUBGYTABKSRVRQ-XLOQQCSPSA-N Alpha-Lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 1
- 108091093088 Amplicon Proteins 0.000 description 1
- PHHRSPBBQUFULD-UWVGGRQHSA-N Arg-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCCN=C(N)N)N PHHRSPBBQUFULD-UWVGGRQHSA-N 0.000 description 1
- HAVKMRGWNXMCDR-STQMWFEESA-N Arg-Gly-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HAVKMRGWNXMCDR-STQMWFEESA-N 0.000 description 1
- ZZZWQALDSQQBEW-STQMWFEESA-N Arg-Gly-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZZZWQALDSQQBEW-STQMWFEESA-N 0.000 description 1
- YKBHOXLMMPZPHQ-GMOBBJLQSA-N Arg-Ile-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O YKBHOXLMMPZPHQ-GMOBBJLQSA-N 0.000 description 1
- VDCIPFYVCICPEC-FXQIFTODSA-N Asn-Arg-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O VDCIPFYVCICPEC-FXQIFTODSA-N 0.000 description 1
- IOTKDTZEEBZNCM-UGYAYLCHSA-N Asn-Asn-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O IOTKDTZEEBZNCM-UGYAYLCHSA-N 0.000 description 1
- AYKKKGFJXIDYLX-ACZMJKKPSA-N Asn-Gln-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O AYKKKGFJXIDYLX-ACZMJKKPSA-N 0.000 description 1
- WIDVAWAQBRAKTI-YUMQZZPRSA-N Asn-Leu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O WIDVAWAQBRAKTI-YUMQZZPRSA-N 0.000 description 1
- FODVBOKTYKYRFJ-CIUDSAMLSA-N Asn-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N FODVBOKTYKYRFJ-CIUDSAMLSA-N 0.000 description 1
- WCFCYFDBMNFSPA-ACZMJKKPSA-N Asp-Asp-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(O)=O WCFCYFDBMNFSPA-ACZMJKKPSA-N 0.000 description 1
- CKAJHWFHHFSCDT-WHFBIAKZSA-N Asp-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O CKAJHWFHHFSCDT-WHFBIAKZSA-N 0.000 description 1
- HSWYMWGDMPLTTH-FXQIFTODSA-N Asp-Glu-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HSWYMWGDMPLTTH-FXQIFTODSA-N 0.000 description 1
- PZXPWHFYZXTFBI-YUMQZZPRSA-N Asp-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O PZXPWHFYZXTFBI-YUMQZZPRSA-N 0.000 description 1
- RQHLMGCXCZUOGT-ZPFDUUQYSA-N Asp-Leu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RQHLMGCXCZUOGT-ZPFDUUQYSA-N 0.000 description 1
- RPUYTJJZXQBWDT-SRVKXCTJSA-N Asp-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N RPUYTJJZXQBWDT-SRVKXCTJSA-N 0.000 description 1
- WAEDSQFVZJUHLI-BYULHYEWSA-N Asp-Val-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WAEDSQFVZJUHLI-BYULHYEWSA-N 0.000 description 1
- 241000228212 Aspergillus Species 0.000 description 1
- 241001465318 Aspergillus terreus Species 0.000 description 1
- 241000589151 Azotobacter Species 0.000 description 1
- 241000498991 Bacillus licheniformis DSM 13 = ATCC 14580 Species 0.000 description 1
- 241000588807 Bordetella Species 0.000 description 1
- 241000589562 Brucella Species 0.000 description 1
- CZXWOKHVLNYAHI-UHFFFAOYSA-N CBDVA Natural products OC1=C(C(O)=O)C(CCC)=CC(O)=C1C1C(C(C)=C)CCC(C)=C1 CZXWOKHVLNYAHI-UHFFFAOYSA-N 0.000 description 1
- WVOLTBSCXRRQFR-SJORKVTESA-N Cannabidiolic acid Natural products OC1=C(C(O)=O)C(CCCCC)=CC(O)=C1[C@@H]1[C@@H](C(C)=C)CCC(C)=C1 WVOLTBSCXRRQFR-SJORKVTESA-N 0.000 description 1
- 102000018208 Cannabinoid Receptor Human genes 0.000 description 1
- 108050007331 Cannabinoid receptor Proteins 0.000 description 1
- DQFBYFPFKXHELB-UHFFFAOYSA-N Chalcone Natural products C=1C=CC=CC=1C(=O)C=CC1=CC=CC=C1 DQFBYFPFKXHELB-UHFFFAOYSA-N 0.000 description 1
- 241000191368 Chlorobi Species 0.000 description 1
- 241001142109 Chloroflexi Species 0.000 description 1
- 241001112696 Clostridia Species 0.000 description 1
- 241000193403 Clostridium Species 0.000 description 1
- 241000186216 Corynebacterium Species 0.000 description 1
- 241000186227 Corynebacterium diphtheriae Species 0.000 description 1
- 241000195493 Cryptophyta Species 0.000 description 1
- 241000192700 Cyanobacteria Species 0.000 description 1
- 101710095468 Cyclase Proteins 0.000 description 1
- XABFFGOGKOORCG-CIUDSAMLSA-N Cys-Asp-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O XABFFGOGKOORCG-CIUDSAMLSA-N 0.000 description 1
- 239000003155 DNA primer Substances 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 241000246067 Deinococcales Species 0.000 description 1
- 108090000204 Dipeptidase 1 Proteins 0.000 description 1
- 241000186811 Erysipelothrix Species 0.000 description 1
- 241000588722 Escherichia Species 0.000 description 1
- 241001198387 Escherichia coli BL21(DE3) Species 0.000 description 1
- 241000701959 Escherichia virus Lambda Species 0.000 description 1
- 102100035111 Farnesyl pyrophosphate synthase Human genes 0.000 description 1
- 239000004606 Fillers/Extenders Substances 0.000 description 1
- 241000230562 Flavobacteriia Species 0.000 description 1
- 241000589601 Francisella Species 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 241000605909 Fusobacterium Species 0.000 description 1
- 108010026318 Geranyltranstransferase Proteins 0.000 description 1
- RGXXLQWXBFNXTG-CIUDSAMLSA-N Gln-Arg-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O RGXXLQWXBFNXTG-CIUDSAMLSA-N 0.000 description 1
- JXBZEDIQFFCHPZ-PEFMBERDSA-N Gln-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N JXBZEDIQFFCHPZ-PEFMBERDSA-N 0.000 description 1
- WTJIWXMJESRHMM-XDTLVQLUSA-N Gln-Tyr-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O WTJIWXMJESRHMM-XDTLVQLUSA-N 0.000 description 1
- ZZLDMBMFKZFQMU-NRPADANISA-N Gln-Val-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O ZZLDMBMFKZFQMU-NRPADANISA-N 0.000 description 1
- NLKVNZUFDPWPNL-YUMQZZPRSA-N Glu-Arg-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O NLKVNZUFDPWPNL-YUMQZZPRSA-N 0.000 description 1
- CBEUFCJRFNZMCU-SRVKXCTJSA-N Glu-Met-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O CBEUFCJRFNZMCU-SRVKXCTJSA-N 0.000 description 1
- LZEUDRYSAZAJIO-AUTRQRHGSA-N Glu-Val-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LZEUDRYSAZAJIO-AUTRQRHGSA-N 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- OCDLPQDYTJPWNG-YUMQZZPRSA-N Gly-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)CN OCDLPQDYTJPWNG-YUMQZZPRSA-N 0.000 description 1
- JLJLBWDKDRYOPA-RYUDHWBXSA-N Gly-Gln-Tyr Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 JLJLBWDKDRYOPA-RYUDHWBXSA-N 0.000 description 1
- JPVGHHQGKPQYIL-KBPBESRZSA-N Gly-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 JPVGHHQGKPQYIL-KBPBESRZSA-N 0.000 description 1
- DBUNZBWUWCIELX-JHEQGTHGSA-N Gly-Thr-Glu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DBUNZBWUWCIELX-JHEQGTHGSA-N 0.000 description 1
- BAYQNCWLXIDLHX-ONGXEEELSA-N Gly-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN BAYQNCWLXIDLHX-ONGXEEELSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- RVKIPWVMZANZLI-UHFFFAOYSA-N H-Lys-Trp-OH Natural products C1=CC=C2C(CC(NC(=O)C(N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-UHFFFAOYSA-N 0.000 description 1
- 241000606790 Haemophilus Species 0.000 description 1
- 241001235200 Haemophilus influenzae Rd KW20 Species 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 102000005548 Hexokinase Human genes 0.000 description 1
- 108700040460 Hexokinases Proteins 0.000 description 1
- RAVLQPXCMRCLKT-KBPBESRZSA-N His-Gly-Phe Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RAVLQPXCMRCLKT-KBPBESRZSA-N 0.000 description 1
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 1
- WUEIUSDAECDLQO-NAKRPEOUSA-N Ile-Ala-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)O)N WUEIUSDAECDLQO-NAKRPEOUSA-N 0.000 description 1
- YOTNPRLPIPHQSB-XUXIUFHCSA-N Ile-Arg-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOTNPRLPIPHQSB-XUXIUFHCSA-N 0.000 description 1
- IPYVXYDYLHVWHU-GMOBBJLQSA-N Ile-Asn-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCSC)C(=O)O)N IPYVXYDYLHVWHU-GMOBBJLQSA-N 0.000 description 1
- NBJAAWYRLGCJOF-UGYAYLCHSA-N Ile-Asp-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N NBJAAWYRLGCJOF-UGYAYLCHSA-N 0.000 description 1
- HVWXAQVMRBKKFE-UGYAYLCHSA-N Ile-Asp-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HVWXAQVMRBKKFE-UGYAYLCHSA-N 0.000 description 1
- PWDSHAAAFXISLE-SXTJYALSSA-N Ile-Ile-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O PWDSHAAAFXISLE-SXTJYALSSA-N 0.000 description 1
- TWYOYAKMLHWMOJ-ZPFDUUQYSA-N Ile-Leu-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O TWYOYAKMLHWMOJ-ZPFDUUQYSA-N 0.000 description 1
- FZWVCYCYWCLQDH-NHCYSSNCSA-N Ile-Leu-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N FZWVCYCYWCLQDH-NHCYSSNCSA-N 0.000 description 1
- OVDKXUDMKXAZIV-ZPFDUUQYSA-N Ile-Lys-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OVDKXUDMKXAZIV-ZPFDUUQYSA-N 0.000 description 1
- ZLFNNVATRMCAKN-ZKWXMUAHSA-N Ile-Ser-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZLFNNVATRMCAKN-ZKWXMUAHSA-N 0.000 description 1
- ZUWSVOYKBCHLRR-MGHWNKPDSA-N Ile-Tyr-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZUWSVOYKBCHLRR-MGHWNKPDSA-N 0.000 description 1
- 102100034343 Integrase Human genes 0.000 description 1
- 102100024319 Intestinal-type alkaline phosphatase Human genes 0.000 description 1
- 101710184243 Intestinal-type alkaline phosphatase Proteins 0.000 description 1
- 241000588748 Klebsiella Species 0.000 description 1
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 1
- 102000003855 L-lactate dehydrogenase Human genes 0.000 description 1
- 108700023483 L-lactate dehydrogenases Proteins 0.000 description 1
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 1
- 125000000769 L-threonyl group Chemical group [H]N([H])[C@]([H])(C(=O)[*])[C@](O[H])(C([H])([H])[H])[H] 0.000 description 1
- 125000000510 L-tryptophano group Chemical group [H]C1=C([H])C([H])=C2N([H])C([H])=C(C([H])([H])[C@@]([H])(C(O[H])=O)N([H])[*])C2=C1[H] 0.000 description 1
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 1
- JKGHDYGZRDWHGA-SRVKXCTJSA-N Leu-Asn-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JKGHDYGZRDWHGA-SRVKXCTJSA-N 0.000 description 1
- BABSVXFGKFLIGW-UWVGGRQHSA-N Leu-Gly-Arg Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N BABSVXFGKFLIGW-UWVGGRQHSA-N 0.000 description 1
- KOSWSHVQIVTVQF-ZPFDUUQYSA-N Leu-Ile-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KOSWSHVQIVTVQF-ZPFDUUQYSA-N 0.000 description 1
- KUIDCYNIEJBZBU-AJNGGQMLSA-N Leu-Ile-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O KUIDCYNIEJBZBU-AJNGGQMLSA-N 0.000 description 1
- AKVBOOKXVAMKSS-GUBZILKMSA-N Leu-Ser-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O AKVBOOKXVAMKSS-GUBZILKMSA-N 0.000 description 1
- 241000534259 Listeria welshimeri serovar 6b str. SLCC5334 Species 0.000 description 1
- ALSRJRIWBNENFY-DCAQKATOSA-N Lys-Arg-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O ALSRJRIWBNENFY-DCAQKATOSA-N 0.000 description 1
- ABHIXYDMILIUKV-CIUDSAMLSA-N Lys-Asn-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ABHIXYDMILIUKV-CIUDSAMLSA-N 0.000 description 1
- HQVDJTYKCMIWJP-YUMQZZPRSA-N Lys-Asn-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HQVDJTYKCMIWJP-YUMQZZPRSA-N 0.000 description 1
- LPAJOCKCPRZEAG-MNXVOIDGSA-N Lys-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCCN LPAJOCKCPRZEAG-MNXVOIDGSA-N 0.000 description 1
- QBEPTBMRQALPEV-MNXVOIDGSA-N Lys-Ile-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN QBEPTBMRQALPEV-MNXVOIDGSA-N 0.000 description 1
- KEPWSUPUFAPBRF-DKIMLUQUSA-N Lys-Ile-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KEPWSUPUFAPBRF-DKIMLUQUSA-N 0.000 description 1
- QBHGXFQJFPWJIH-XUXIUFHCSA-N Lys-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN QBHGXFQJFPWJIH-XUXIUFHCSA-N 0.000 description 1
- ZOKVLMBYDSIDKG-CSMHCCOUSA-N Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN ZOKVLMBYDSIDKG-CSMHCCOUSA-N 0.000 description 1
- MIMXMVDLMDMOJD-BZSNNMDCSA-N Lys-Tyr-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O MIMXMVDLMDMOJD-BZSNNMDCSA-N 0.000 description 1
- GILLQRYAWOMHED-DCAQKATOSA-N Lys-Val-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN GILLQRYAWOMHED-DCAQKATOSA-N 0.000 description 1
- 101000819644 Lysinibacillus sphaericus UPF0309 protein in nagA 3'region Proteins 0.000 description 1
- 102100026665 Malonate-CoA ligase ACSF3, mitochondrial Human genes 0.000 description 1
- GUBGYTABKSRVRQ-PICCSMPSSA-N Maltose Natural products O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-PICCSMPSSA-N 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- JQEBITVYKUCBMC-SRVKXCTJSA-N Met-Arg-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JQEBITVYKUCBMC-SRVKXCTJSA-N 0.000 description 1
- AOFZWWDTTJLHOU-ULQDDVLXSA-N Met-Lys-Tyr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AOFZWWDTTJLHOU-ULQDDVLXSA-N 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 241000192041 Micrococcus Species 0.000 description 1
- 241001430197 Mollicutes Species 0.000 description 1
- 241000186359 Mycobacterium Species 0.000 description 1
- 241000052923 Mycobacterium avium subsp. paratuberculosis K-10 Species 0.000 description 1
- 241000765897 Mycobacterium tuberculosis C Species 0.000 description 1
- 241000385073 Mycobacterium tuberculosis F11 Species 0.000 description 1
- 241000902584 Mycobacterium tuberculosis str. Haarlem Species 0.000 description 1
- 241000863420 Myxococcus Species 0.000 description 1
- 150000001200 N-acyl ethanolamides Chemical class 0.000 description 1
- 108010087066 N2-tryptophyllysine Proteins 0.000 description 1
- 101150008132 NDE1 gene Proteins 0.000 description 1
- 108091061960 Naked DNA Proteins 0.000 description 1
- 206010028813 Nausea Diseases 0.000 description 1
- 241000588653 Neisseria Species 0.000 description 1
- 241000187654 Nocardia Species 0.000 description 1
- UMKWOHNEXURCEH-DJIDGICGSA-N O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)CCCCC)O[C@H]1N1C2=NC=NC(N)=C2N=C1.O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)CCCCC)O[C@H]1N1C2=NC=NC(N)=C2N=C1 Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)CCCCC)O[C@H]1N1C2=NC=NC(N)=C2N=C1.O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)CCCCC)O[C@H]1N1C2=NC=NC(N)=C2N=C1 UMKWOHNEXURCEH-DJIDGICGSA-N 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 241000606860 Pasteurella Species 0.000 description 1
- 241000432806 Pasteurella multocida subsp. multocida str. Pm70 Species 0.000 description 1
- SEPNOAFMZLLCEW-UBHSHLNASA-N Phe-Ala-Val Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O SEPNOAFMZLLCEW-UBHSHLNASA-N 0.000 description 1
- QCHNRQQVLJYDSI-DLOVCJGASA-N Phe-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 QCHNRQQVLJYDSI-DLOVCJGASA-N 0.000 description 1
- SWZKMTDPQXLQRD-XVSYOHENSA-N Phe-Asp-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWZKMTDPQXLQRD-XVSYOHENSA-N 0.000 description 1
- XEXSSIBQYNKFBX-KBPBESRZSA-N Phe-Gly-His Chemical compound C([C@H](N)C(=O)NCC(=O)N[C@@H](CC=1N=CNC=1)C(O)=O)C1=CC=CC=C1 XEXSSIBQYNKFBX-KBPBESRZSA-N 0.000 description 1
- MCIXMYKSPQUMJG-SRVKXCTJSA-N Phe-Ser-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MCIXMYKSPQUMJG-SRVKXCTJSA-N 0.000 description 1
- APZNYJFGVAGFCF-JYJNAYRXSA-N Phe-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)Cc1ccccc1)C(C)C)C(O)=O APZNYJFGVAGFCF-JYJNAYRXSA-N 0.000 description 1
- 108010039918 Polylysine Proteins 0.000 description 1
- 102000019337 Prenyltransferases Human genes 0.000 description 1
- 108050006837 Prenyltransferases Proteins 0.000 description 1
- VOZIBWWZSBIXQN-SRVKXCTJSA-N Pro-Glu-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O VOZIBWWZSBIXQN-SRVKXCTJSA-N 0.000 description 1
- MKGIILKDUGDRRO-FXQIFTODSA-N Pro-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 MKGIILKDUGDRRO-FXQIFTODSA-N 0.000 description 1
- YHUBAXGAAYULJY-ULQDDVLXSA-N Pro-Tyr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O YHUBAXGAAYULJY-ULQDDVLXSA-N 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 241000192142 Proteobacteria Species 0.000 description 1
- 241000588769 Proteus <enterobacteria> Species 0.000 description 1
- 102000009609 Pyrophosphatases Human genes 0.000 description 1
- 108010009413 Pyrophosphatases Proteins 0.000 description 1
- LCTONWCANYUPML-UHFFFAOYSA-M Pyruvate Chemical compound CC(=O)C([O-])=O LCTONWCANYUPML-UHFFFAOYSA-M 0.000 description 1
- 108020005115 Pyruvate Kinase Proteins 0.000 description 1
- 102000013009 Pyruvate Kinase Human genes 0.000 description 1
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 1
- 241000589180 Rhizobium Species 0.000 description 1
- 241000190984 Rhodospirillum rubrum Species 0.000 description 1
- 241000606701 Rickettsia Species 0.000 description 1
- 241001287863 Rickettsia felis URRWXCal2 Species 0.000 description 1
- 241000607142 Salmonella Species 0.000 description 1
- 229920002684 Sepharose Polymers 0.000 description 1
- OBXVZEAMXFSGPU-FXQIFTODSA-N Ser-Asn-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N)CN=C(N)N OBXVZEAMXFSGPU-FXQIFTODSA-N 0.000 description 1
- RDFQNDHEHVSONI-ZLUOBGJFSA-N Ser-Asn-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDFQNDHEHVSONI-ZLUOBGJFSA-N 0.000 description 1
- RIAKPZVSNBBNRE-BJDJZHNGSA-N Ser-Ile-Leu Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O RIAKPZVSNBBNRE-BJDJZHNGSA-N 0.000 description 1
- GSCVDSBEYVGMJQ-SRVKXCTJSA-N Ser-Tyr-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CO)N)O GSCVDSBEYVGMJQ-SRVKXCTJSA-N 0.000 description 1
- 241000607720 Serratia Species 0.000 description 1
- 241000607768 Shigella Species 0.000 description 1
- 241000605008 Spirillum Species 0.000 description 1
- 241000589970 Spirochaetales Species 0.000 description 1
- 241000295644 Staphylococcaceae Species 0.000 description 1
- 241000191940 Staphylococcus Species 0.000 description 1
- 241000194017 Streptococcus Species 0.000 description 1
- 101000901034 Streptococcus gordonii Accessory Sec system protein Asp2 Proteins 0.000 description 1
- 241001454746 Streptomyces niveus Species 0.000 description 1
- IQSYWEWTWDEVNO-UHFFFAOYSA-N THCVA Natural products O1C(C)(C)C2CCC(C)=CC2C2=C1C=C(CCC)C(C(O)=O)=C2O IQSYWEWTWDEVNO-UHFFFAOYSA-N 0.000 description 1
- XPNSAQMEAVSQRD-FBCQKBJTSA-N Thr-Gly-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)NCC(O)=O XPNSAQMEAVSQRD-FBCQKBJTSA-N 0.000 description 1
- HOVLHEKTGVIKAP-WDCWCFNPSA-N Thr-Leu-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O HOVLHEKTGVIKAP-WDCWCFNPSA-N 0.000 description 1
- 241000589886 Treponema Species 0.000 description 1
- IQGJAHMZWBTRIF-UBHSHLNASA-N Trp-Asp-Asn Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N IQGJAHMZWBTRIF-UBHSHLNASA-N 0.000 description 1
- WCTYCXZYBNKEIV-SXNHZJKMSA-N Trp-Glu-Ile Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O)=CNC2=C1 WCTYCXZYBNKEIV-SXNHZJKMSA-N 0.000 description 1
- NOXKHHXSHQFSGJ-FQPOAREZSA-N Tyr-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NOXKHHXSHQFSGJ-FQPOAREZSA-N 0.000 description 1
- KDGFPPHLXCEQRN-STECZYCISA-N Tyr-Arg-Ile Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KDGFPPHLXCEQRN-STECZYCISA-N 0.000 description 1
- PDKILSUYSUGCAO-JBACZVJFSA-N Tyr-Gln-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC3=CC=C(C=C3)O)N PDKILSUYSUGCAO-JBACZVJFSA-N 0.000 description 1
- NSGZILIDHCIZAM-KKUMJFAQSA-N Tyr-Leu-Ser Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N NSGZILIDHCIZAM-KKUMJFAQSA-N 0.000 description 1
- JAGGEZACYAAMIL-CQDKDKBSSA-N Tyr-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CC=C(C=C1)O)N JAGGEZACYAAMIL-CQDKDKBSSA-N 0.000 description 1
- NXPDPYYCIRDUHO-ULQDDVLXSA-N Tyr-Val-His Chemical compound C([C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CC=C(O)C=C1 NXPDPYYCIRDUHO-ULQDDVLXSA-N 0.000 description 1
- ASQFIHTXXMFENG-XPUUQOCRSA-N Val-Ala-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O ASQFIHTXXMFENG-XPUUQOCRSA-N 0.000 description 1
- PTFPUAXGIKTVNN-ONGXEEELSA-N Val-His-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)NCC(=O)O)N PTFPUAXGIKTVNN-ONGXEEELSA-N 0.000 description 1
- DLMNFMXSNGTSNJ-PYJNHQTQSA-N Val-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](C(C)C)N DLMNFMXSNGTSNJ-PYJNHQTQSA-N 0.000 description 1
- KNYHAWKHFQRYOX-PYJNHQTQSA-N Val-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N KNYHAWKHFQRYOX-PYJNHQTQSA-N 0.000 description 1
- SDUBQHUJJWQTEU-XUXIUFHCSA-N Val-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C(C)C)N SDUBQHUJJWQTEU-XUXIUFHCSA-N 0.000 description 1
- NZGOVKLVQNOEKP-YDHLFZDLSA-N Val-Phe-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N NZGOVKLVQNOEKP-YDHLFZDLSA-N 0.000 description 1
- QWCZXKIFPWPQHR-JYJNAYRXSA-N Val-Pro-Tyr Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QWCZXKIFPWPQHR-JYJNAYRXSA-N 0.000 description 1
- KRAHMIJVUPUOTQ-DCAQKATOSA-N Val-Ser-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N KRAHMIJVUPUOTQ-DCAQKATOSA-N 0.000 description 1
- PGQUDQYHWICSAB-NAKRPEOUSA-N Val-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N PGQUDQYHWICSAB-NAKRPEOUSA-N 0.000 description 1
- 241001509381 Wigglesworthia glossinidia endosymbiont of Glossina brevipalpis Species 0.000 description 1
- 241000607734 Yersinia <bacteria> Species 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- KVCBTRKOCLHLQX-TYHXJLICSA-N [[(2R,3S,4R,5R)-5-(6-aminopurin-9-yl)-4-hydroxy-3-phosphonooxyoxolan-2-yl]methoxy-hydroxyphosphoryl] [(3R)-4-[[3-(2-hexylsulfanylethylamino)-3-oxopropyl]amino]-3-hydroxy-2,2-dimethyl-4-oxobutyl] hydrogen phosphate Chemical compound C(CCCCC)SCCNC(CCNC([C@@H](C(COP(OP(OC[C@@H]1[C@H]([C@H]([C@@H](O1)N1C=NC=2C(N)=NC=NC1=2)O)OP(=O)(O)O)(=O)O)(=O)O)(C)C)O)=O)=O KVCBTRKOCLHLQX-TYHXJLICSA-N 0.000 description 1
- 125000000218 acetic acid group Chemical group C(C)(=O)* 0.000 description 1
- 102000005421 acetyltransferase Human genes 0.000 description 1
- 108020002494 acetyltransferase Proteins 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 239000012190 activator Substances 0.000 description 1
- 238000007259 addition reaction Methods 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 125000000217 alkyl group Chemical group 0.000 description 1
- WQZGKKKJIJFFOK-PHYPRBDBSA-N alpha-D-galactose Chemical compound OC[C@H]1O[C@H](O)[C@H](O)[C@@H](O)[C@H]1O WQZGKKKJIJFFOK-PHYPRBDBSA-N 0.000 description 1
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 1
- 230000001195 anabolic effect Effects 0.000 description 1
- 239000012491 analyte Substances 0.000 description 1
- 230000001093 anti-cancer Effects 0.000 description 1
- 229910052786 argon Inorganic materials 0.000 description 1
- 150000001491 aromatic compounds Chemical class 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 102000006635 beta-lactamase Human genes 0.000 description 1
- GUBGYTABKSRVRQ-QUYVBRFLSA-N beta-maltose Chemical compound OC[C@H]1O[C@H](O[C@H]2[C@H](O)[C@@H](O)[C@H](O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@@H]1O GUBGYTABKSRVRQ-QUYVBRFLSA-N 0.000 description 1
- 239000011942 biocatalyst Substances 0.000 description 1
- 238000002306 biochemical method Methods 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- CRFNGMNYKDXRTN-CITAKDKDSA-N butyryl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)CCC)O[C@H]1N1C2=NC=NC(N)=C2N=C1 CRFNGMNYKDXRTN-CITAKDKDSA-N 0.000 description 1
- 229940074360 caffeic acid Drugs 0.000 description 1
- 235000004883 caffeic acid Nutrition 0.000 description 1
- 244000309466 calf Species 0.000 description 1
- 235000009120 camo Nutrition 0.000 description 1
- WVOLTBSCXRRQFR-DLBZAZTESA-N cannabidiolic acid Chemical compound OC1=C(C(O)=O)C(CCCCC)=CC(O)=C1[C@H]1[C@H](C(C)=C)CCC(C)=C1 WVOLTBSCXRRQFR-DLBZAZTESA-N 0.000 description 1
- CREMABGTGYGIQB-UHFFFAOYSA-N carbon carbon Chemical compound C.C CREMABGTGYGIQB-UHFFFAOYSA-N 0.000 description 1
- 239000011203 carbon fibre reinforced carbon Substances 0.000 description 1
- 239000012159 carrier gas Substances 0.000 description 1
- 230000001925 catabolic effect Effects 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 150000001768 cations Chemical class 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 235000005513 chalcones Nutrition 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 235000005607 chanvre indien Nutrition 0.000 description 1
- 125000003636 chemical group Chemical group 0.000 description 1
- 239000013626 chemical specie Substances 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000002512 chemotherapy Methods 0.000 description 1
- 239000013611 chromosomal DNA Substances 0.000 description 1
- QAIPRVGONGVQAS-UHFFFAOYSA-N cis-caffeic acid Natural products OC(=O)C=CC1=CC=C(O)C(O)=C1 QAIPRVGONGVQAS-UHFFFAOYSA-N 0.000 description 1
- 239000007979 citrate buffer Substances 0.000 description 1
- 238000003501 co-culture Methods 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000009833 condensation Methods 0.000 description 1
- 230000005494 condensation Effects 0.000 description 1
- 239000000356 contaminant Substances 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 230000036461 convulsion Effects 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 230000003412 degenerative effect Effects 0.000 description 1
- 238000012938 design process Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 239000001177 diphosphate Substances 0.000 description 1
- 235000011180 diphosphates Nutrition 0.000 description 1
- XPPKVPWEQAFLFU-UHFFFAOYSA-N diphosphoric acid Chemical group OP(O)(=O)OP(O)(O)=O XPPKVPWEQAFLFU-UHFFFAOYSA-N 0.000 description 1
- 238000010494 dissociation reaction Methods 0.000 description 1
- 230000005593 dissociations Effects 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000004064 dysfunction Effects 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000010828 elution Methods 0.000 description 1
- 239000012149 elution buffer Substances 0.000 description 1
- 150000002081 enamines Chemical class 0.000 description 1
- 239000002621 endocannabinoid Substances 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 206010015037 epilepsy Diseases 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 229930182830 galactose Natural products 0.000 description 1
- 238000000769 gas chromatography-flame ionisation detection Methods 0.000 description 1
- 238000011331 genomic analysis Methods 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- 108010078144 glutaminyl-glycine Proteins 0.000 description 1
- 230000034659 glycolysis Effects 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 239000001307 helium Substances 0.000 description 1
- 229910052734 helium Inorganic materials 0.000 description 1
- SWQJXJOGLNCZEY-UHFFFAOYSA-N helium atom Chemical compound [He] SWQJXJOGLNCZEY-UHFFFAOYSA-N 0.000 description 1
- 239000011487 hemp Substances 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000009830 intercalation Methods 0.000 description 1
- IPFXNYPSBSIFOB-UHFFFAOYSA-N isopentyl pyrophosphate Chemical compound CC(C)CCO[P@](O)(=O)OP(O)(O)=O IPFXNYPSBSIFOB-UHFFFAOYSA-N 0.000 description 1
- 229930027917 kanamycin Natural products 0.000 description 1
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- 239000008101 lactose Substances 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 239000012035 limiting reagent Substances 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 230000007257 malfunction Effects 0.000 description 1
- 150000002690 malonic acid derivatives Chemical class 0.000 description 1
- LTYOQGRJFJAKNA-VFLPNFFSSA-N malonyl-coa Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)C(O)C(=O)NCCC(=O)NCCSC(=O)CC(O)=O)O[C@H]1N1C2=NC=NC(N)=C2N=C1 LTYOQGRJFJAKNA-VFLPNFFSSA-N 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 240000004308 marijuana Species 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000007721 medicinal effect Effects 0.000 description 1
- 239000002609 medium Substances 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- CSJDCSCTVDEHRN-UHFFFAOYSA-N methane;molecular oxygen Chemical compound C.O=O CSJDCSCTVDEHRN-UHFFFAOYSA-N 0.000 description 1
- 125000000250 methylamino group Chemical group [H]N(*)C([H])([H])[H] 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000001823 molecular biology technique Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 210000003205 muscle Anatomy 0.000 description 1
- 230000008693 nausea Effects 0.000 description 1
- 231100001083 no cytotoxicity Toxicity 0.000 description 1
- 101150057733 novQ gene Proteins 0.000 description 1
- 238000000655 nuclear magnetic resonance spectrum Methods 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 210000003463 organelle Anatomy 0.000 description 1
- 150000002894 organic compounds Chemical class 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- KXFJZKUFXHWWAJ-UHFFFAOYSA-N p-hydroxybenzoylformic acid Natural products OC(=O)C(=O)C1=CC=C(O)C=C1 KXFJZKUFXHWWAJ-UHFFFAOYSA-N 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 239000008188 pellet Substances 0.000 description 1
- 238000002823 phage display Methods 0.000 description 1
- 108700010839 phage proteins Proteins 0.000 description 1
- 239000002831 pharmacologic agent Substances 0.000 description 1
- 239000012071 phase Substances 0.000 description 1
- 229930029653 phosphoenolpyruvate Natural products 0.000 description 1
- 108010080971 phosphoribulokinase Proteins 0.000 description 1
- 230000000865 phosphorylative effect Effects 0.000 description 1
- 125000000830 polyketide group Chemical group 0.000 description 1
- 229920000656 polylysine Polymers 0.000 description 1
- 239000013641 positive control Substances 0.000 description 1
- 230000003389 potentiating effect Effects 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 229930008679 prenylflavonoid Natural products 0.000 description 1
- 239000002987 primer (paints) Chemical group 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000004853 protein function Effects 0.000 description 1
- 238000010926 purge Methods 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 239000000376 reactant Substances 0.000 description 1
- 239000011535 reaction buffer Substances 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 230000035484 reaction time Effects 0.000 description 1
- 238000003259 recombinant expression Methods 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 238000004064 recycling Methods 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 239000011347 resin Substances 0.000 description 1
- 229920005989 resin Polymers 0.000 description 1
- 238000004366 reverse phase liquid chromatography Methods 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 238000010517 secondary reaction Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 238000001542 size-exclusion chromatography Methods 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 238000012409 standard PCR amplification Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 238000012916 structural analysis Methods 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 102000055501 telomere Human genes 0.000 description 1
- 108091035539 telomere Proteins 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 150000007970 thio esters Chemical class 0.000 description 1
- 238000006257 total synthesis reaction Methods 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- 238000005820 transferase reaction Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 210000005253 yeast cell Anatomy 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/36—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Actinomyces; from Streptomyces (G)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/26—Preparation of nitrogen-containing carbohydrates
- C12P19/28—N-glycosides
- C12P19/30—Nucleotides
- C12P19/32—Nucleotides having a condensed ring system containing a six-membered ring having two N-atoms in the same ring, e.g. purine nucleotides, nicotineamide-adenine dinucleotide
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/24—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Enterobacteriaceae (F), e.g. Citrobacter, Serratia, Proteus, Providencia, Morganella, Yersinia
- C07K14/245—Escherichia (G)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/415—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1025—Acyltransferases (2.3)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1085—Transferases (2.) transferring alkyl or aryl groups other than methyl groups (2.5)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
- C12N9/1205—Phosphotransferases with an alcohol group as acceptor (2.7.1), e.g. protein kinases
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
- C12N9/1229—Phosphotransferases with a phosphate group as acceptor (2.7.4)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/88—Lyases (4.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/90—Isomerases (5.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/93—Ligases (6)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P17/00—Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
- C12P17/02—Oxygen as only ring hetero atoms
- C12P17/06—Oxygen as only ring hetero atoms containing a six-membered hetero ring, e.g. fluorescein
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P5/00—Preparation of hydrocarbons or halogenated hydrocarbons
- C12P5/007—Preparation of hydrocarbons or halogenated hydrocarbons containing one or more isoprene units, i.e. terpenes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/40—Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
- C12P7/42—Hydroxy-carboxylic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/40—Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
- C12P7/54—Acetic acid
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/64—Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
- C12P7/6409—Fatty acids
- C12P7/6427—Polyunsaturated fatty acids [PUFA], i.e. having two or more double bonds in their backbone
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y203/00—Acyltransferases (2.3)
- C12Y203/01—Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
- C12Y203/01206—3,5,7-Trioxododecanoyl-CoA synthase (2.3.1.206)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y205/00—Transferases transferring alkyl or aryl groups, other than methyl groups (2.5)
- C12Y205/01—Transferases transferring alkyl or aryl groups, other than methyl groups (2.5) transferring alkyl or aryl groups, other than methyl groups (2.5.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y205/00—Transferases transferring alkyl or aryl groups, other than methyl groups (2.5)
- C12Y205/01—Transferases transferring alkyl or aryl groups, other than methyl groups (2.5) transferring alkyl or aryl groups, other than methyl groups (2.5.1)
- C12Y205/01039—4-Hydroxybenzoate polyprenyltransferase (2.5.1.39)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y205/00—Transferases transferring alkyl or aryl groups, other than methyl groups (2.5)
- C12Y205/01—Transferases transferring alkyl or aryl groups, other than methyl groups (2.5) transferring alkyl or aryl groups, other than methyl groups (2.5.1)
- C12Y205/01102—Geranyl-pyrophosphate—olivetolic acid geranyltransferase (2.5.1.102)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y404/00—Carbon-sulfur lyases (4.4)
- C12Y404/01—Carbon-sulfur lyases (4.4.1)
- C12Y404/01026—Olivetolic acid cyclase (4.4.1.26)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y602/00—Ligases forming carbon-sulfur bonds (6.2)
- C12Y602/01—Acid-Thiol Ligases (6.2.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y203/00—Acyltransferases (2.3)
- C12Y203/01—Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
- C12Y203/01008—Phosphate acetyltransferase (2.3.1.8)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y205/00—Transferases transferring alkyl or aryl groups, other than methyl groups (2.5)
- C12Y205/01—Transferases transferring alkyl or aryl groups, other than methyl groups (2.5) transferring alkyl or aryl groups, other than methyl groups (2.5.1)
- C12Y205/0101—(2E,6E)-Farnesyl diphosphate synthase (2.5.1.10), i.e. geranyltranstransferase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y205/00—Transferases transferring alkyl or aryl groups, other than methyl groups (2.5)
- C12Y205/01—Transferases transferring alkyl or aryl groups, other than methyl groups (2.5) transferring alkyl or aryl groups, other than methyl groups (2.5.1)
- C12Y205/01029—Geranylgeranyl diphosphate synthase (2.5.1.29)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y207/00—Transferases transferring phosphorus-containing groups (2.7)
- C12Y207/01—Phosphotransferases with an alcohol group as acceptor (2.7.1)
- C12Y207/0105—Hydroxyethylthiazole kinase (2.7.1.50)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y207/00—Transferases transferring phosphorus-containing groups (2.7)
- C12Y207/04—Phosphotransferases with a phosphate group as acceptor (2.7.4)
- C12Y207/04026—Isopentenyl phosphate kinase (2.7.4.26)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y401/00—Carbon-carbon lyases (4.1)
- C12Y401/01—Carboxy-lyases (4.1.1)
- C12Y401/01033—Diphosphomevalonate decarboxylase (4.1.1.33), i.e. mevalonate-pyrophosphate decarboxylase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y401/00—Carbon-carbon lyases (4.1)
- C12Y401/01—Carboxy-lyases (4.1.1)
- C12Y401/01088—Biotin-independent malonate decarboxylase (4.1.1.88)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y401/00—Carbon-carbon lyases (4.1)
- C12Y401/01—Carboxy-lyases (4.1.1)
- C12Y401/01089—Biotin-dependent malonate decarboxylase (4.1.1.89)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y503/00—Intramolecular oxidoreductases (5.3)
- C12Y503/03—Intramolecular oxidoreductases (5.3) transposing C=C bonds (5.3.3)
- C12Y503/03002—Isopentenyl-diphosphate DELTA-isomerase (5.3.3.2)
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Biomedical Technology (AREA)
- Medicinal Chemistry (AREA)
- Biophysics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Gastroenterology & Hepatology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Oil, Petroleum & Natural Gas (AREA)
- Botany (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Enzymes And Modification Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
반응을 촉매하는 재조합 미생물 뿐만 아니라 무세포 시스템(cell free system)에서 칸나비노이드(cannabinoids), 칸나비노이드 전구체(cannabinoid precursors) 및 기타 프레닐화(prenylated) 화학물질의 제조를 위한 프레닐화 및 재조합 경로에 유용한 효소가 제공된다.
Description
관련 출원에 대한 상호 참조
본 출원은 2019년 12월 26일에 출원된 미국 가출원 일련 번호 62/953,719에 대한 우선권을 주장하며, 그 개시 내용은 전체가 참고로 여기에 포함된다.
연방 지원 연구에 관한 진술
본 발명은 미국 에너지부에서 수여한 승인 번호 DE-AR0000556 하에 정부 지원으로 이루어졌다.
서열목록
본 출원에는 ASCII 형식으로 전자적으로 제출된 시퀀스 목록이 포함되어 있으며 전체 내용이 참조로 포함된다. 2020년 12월 24일에 생성된 ASCII 사본의 이름은 Sequence-Listing_ST25.txt이며 크기는 207,506바이트이다.
기술분야
적절한 기질을 본 개시내용의 대사적으로 변형된 미생물 또는 효소 제제 또는 조성물과 접촉시킴으로써 칸나비노이드 및 기타 프레닐화 화학물질 및 화합물을 생산하는 방법이 제공된다.
천연 화합물의 프레닐화(Prenylation)는 구조적 다양성을 추가하고, 생물학적 활성을 변경하고, 치료적 잠재력을 향상시킨다. 프레닐화 화합물은 자연적으로 풍부하지 않거나 분리하기 어려운 경우가 많다. 일부 프레닐화 천연 제품에는 입증된 의약 특성을 가진 많은 종류의 생리활성 분자가 포함된다. 예에는 프레닐-플라바노이드(prenyl-flavanoids), 프레닐-스틸베노이드(prenyl-stilbenoids) 및 칸나비노이드(cannabinoids)가 포함된다.
칸나비노이드는 인간 엔도칸나비노이드 시스템(endocannabinoid system)의 칸나비노이드 수용체(CB1 및 CB2)를 조절하는 생리활성 식물 유래 천연 제품의 큰 부류이다. 칸나비노이드는 항구토제(antiemetics), 항경련제(anticonvulsants), 진통제(analgesics) 및 항우울제(antidepressants)로서의 치료 이점을 조사하는 100개 이상의 진행중인 임상 시험을 통해 유망한 약리학적 제제이다. 또한 3가지 칸나비노이드 요법이 화학요법으로 유발된 메스꺼움, MS 경련 및 중증 간질과 관련된 발작을 치료하기 위해 FDA 승인을 받았다.
그들의 치료적 가능성에도 불구하고, 약학적 등급(>99%) 칸나비노이드의 제조는 여전히 주요 기술적 도전에 직면해 있다. 마리화나(marijuana) 및 대마(hemp)와 같은 대마초 식물(Cannibis plants)은 다양한 낮은 수준 칸나비노이드와 함께 높은 수준의 테트라히드로칸나비놀(tetrahydrocannabinolic, THCA) 및 칸나비디올산(cannibidiolic acid, CBDA)을 생성한다. 그러나 CBDA 및 THCA와 같이 고도로 발현되는 칸나비노이드조차도 오염된 칸나비노이드의 높은 구조적 유사성과 각 작물의 칸나비노이드 구성의 가변성으로 인해 분리하기가 어렵다. 이러한 문제는 희귀 칸나비노이드를 분리하려고 할 때 확대된다. 게다가, 현재의 대마초 재배 관행은 심각한 환경 문제를 제시한다. 결과적으로, 칸나비노이드 및 칸나비노이드 유사체의 제조를 위한 대체 방법을 개발하는 데 상당한 관심이 있다.
요약
본 개시내용은 다음을 포함하는 CBG(V)A의 제조를 위한 인공 시험관내 효소 경로를 제공한다: (a)(1) 프레놀(prenol) 및 ATP를 프레놀 포스페이트(prenol phosphate) 및 ADP로 전환시키는 효소, 프레놀 포스페이트 및 ATP를 디메틸알릴 디포스페이트(dimethylallyl diphosphate, DMAPP)로 전환시키는 효소, 및/또는 (2) 이소프레놀(isoprenol) 및 ATP를 이소프레놀 포스페이트(isoprenol phosphate) 및 ADP로 전환시키는 효소 및 이소프레놀 포스페이트 및 ATP를 이소펜테닐 디포스페이트(isopentenyl diphosphate, IPP)로 전환시키는 효소; (b) DMAPP를 IPP로 및/또는 IPP를 DMAPP로 이성질체화하는(isomerizes) 효소; (c) DMAPP 및 IPP를 제라닐 피로포스페이트(geranyl pyrophosphate, GPP)로 전환시키는 효소; 및 (d) GPP 및 올리브톨산(olivetolic acid) 또는 디바린산(divarinic acid) 또는 유사한 화합물을 CBG(V)A 또는 이의 변이체로 전환시키는 효소. 하나의 실시예에서, 삽입 기질(들)은 올리브톨산 또는 디바린산, 프레놀 및/또는 이소프레놀이다. 또 다른 또는 추가 실시예에서, 경로는 해당 ADP를 부분 (a)에서 ATP로 변환하는 ATP 생성 시스템을 포함한다.
본 개시내용은 또한 도 1A-B에 도시된 바와 같은 효소 반응식 또는 경로를 제공한다.
본 개시내용은 또한 다음으로 구성된 군에서 선택된 서열을 포함하는 재조합 폴리펩티드를 제공한다: (i) 서열번호 30 및 Y288X, A232S를 갖는 돌연변이 및 T69P, T98I 및 G224S로 구성된 군에서 선택된 돌연변이, 전술한 돌연변이의 모두 또는 임의의 조합, 여기서 X는 A, N, S, V 또는 비-천연 아미노산임(non-natural amino acid); (ii) 서열번호 30 및 Y288X, A232S를 갖는 돌연변이 및 T69P, T98I, G224S 및 T126P로 구성된 군에서 선택된 돌연변이, 전술한 돌연변이의 모두 또는 임의의 조합, 여기서 X는 A, N, S, V 또는 비-천연 아미노산임; (iii) 서열번호 30 및 Y288X, A232S를 갖는 돌연변이 및 M14I, Y31W, T69P, T77I, T98I, S136A, E222D, G224S, N236T, G297K로 구성된 군에서 선택된 돌연변이, 전술한 돌연변이 모두 또는 임의의 조합, 여기서 X는 A, N, S, V 또는 비-천연 아미노산임; (iv) 서열번호 30 및 Y288X, A232S를 갖는 돌연변이 및 M14I, Y31W, T69P, T77I, E80A, D93S, T98I, T126P, M129L, G131Q, S136A, E222D, G224S, N236T, S277T, G297K로 구성된 군에서 선택된 돌연변이, 전술한 돌연변이 모두 또는 임의의 조합, 여기서 X는 A, N, S, V 또는 비-천연 아미노산임; (v) 서열번호 30 및 Y288X, A232S를 갖는 돌연변이 및 M14I, L33I, Y31W, T69P, T77I, V78A, E80A, D93S, T98I, E112G, T114V, T126P, M129L, G131Q, S136A, E222D, G224S, K225Q, N236T, S277T, G297K로 구성된 군에서 선택된 돌연변이, 전술한 돌연변이 모두 또는 임의의 조합, 여기서 X는 A, N, S, V 또는 비-천연 아미노산임; (vi) 1-20개의 보존적(conservative) 아미노산 치환을 포함하고 NphB 활성을 갖는 (i)-(iv) 또는 (v) 중 임의의 것; (vii) (i)-(iv) 또는 (v)의 서열과 적어도 85%, 90%, 95%, 98% 또는 99% 동일하고 NphB 활성을 갖는 서열.
본 개시내용은 또한, GPP 및 OA 또는 DA, 또는 GPP 및 2,4-디히드록시 벤조산 유도체를 각각 CBG(V)A 또는 CBG(X)A를 제조하는 조건하에 본 개시내용의 재조합 폴리펩티드와 인큐베이션하는 단계를 포함하는, GPP 및 2,4-디히드록시 벤조산 또는 이의 유도체로부터 CBGXA를 제조하거나 GPP 및 올리베톨레이트(OA) 또는 디비린산(DA)으로부터 CBG(V)A를 제조하는 방법을 제공한다.
본 개시내용은 또한 본 개시내용의 폴리펩티드 및 프레놀 또는 이소프레놀을 게라닐피로포스페이트(geranylpyrophosphate, GPP)로 전환시키는 복수의 효소를 포함하는 재조합 경로를 제공한다. 하나의 실시예에서, 경로는 ATP 재생 모듈(ATP regeneration module)을 추가로 포함한다. 또 다른 또는 추가 실시예에서, ATP 재생 모듈은 아세틸-포스페이트(acetyl-phosphate)을 아세트산(acetic acid)으로 전환시킨다. 임의의 상기 실시예의 또 다른 또는 추가 실시예에서, 경로는 다음의 효소를 포함한다: (i) 아세틸-포스페이트 트랜스퍼라제(Acetyl-phosphate transferase, PTA); (ii) 말로네이트 데카르복실라제 알파 서브유닛(malonate decarboxylase alpha subunit, mdcA); (iii) 아실 활성화 효소 3(acyl activating enzyme 3, AAE3); (iv) 올리브톨 합성효소(olivetol synthase, OLS); (v) 올리브톨산 사이클라제(olivetolic acid cyclase, OAC); (vi) 히드록시에틸티아졸 키나제(hydroxyethylthiazole kinase, ThiM); (vii) 이소펜테닐 키나제(isopentenyl kinase, IPK); (viii) 이소펜틸 디포스페이트 이소머라제(isopentyl diphosphate isomerase, IDI); (ix) 디포스포메발로네이트 데카르복실라제 알파 서브유닛(Diphosphomevalonate decarboxylase alpha subunit, MDCa); (x) 게라닐-PP 합성효소(Geranyl-PP synthase, GPPS) 또는 파네실-PP 합성효소 돌연변이 S82F(Farnesyl-PP synthease mutant S82F, FPPS S82F); 및 (xi) 프레닐화 활성을 갖는 본 개시내용의 재조합 폴리펩티드. 또 다른 또는 추가 실시예에서, 경로는 BSA로 보충된다(supplemented). 또 다른 실시예에서, 경로는 아세틸-포스페이트(acetyl-phosphate), 말로네이트(malonate), 헥사노에이트(hexanoate) 또는 부티레이트(butyrate) 및 이소프레놀(isoprenol) 또는 프레놀(prenol)로 보충된다. 또 다른 또는 추가의 실시예에서, 경로는 칸나비디올산 합성효소(cannabidiolic acid synthase)를 추가로 포함한다. 또 다른 또는 추가의 실시예에서, 경로는 칸나비디올산(cannabidiolic acid)을 제조한다.
본 개시내용은 또한 프레닐화 활성을 갖는 본 개시내용의 재조합 폴리펩티드 및 프레놀 또는 이소프레놀을 게라닐 피로포스페이트(geranyl pyrophosphate, GPP)로 전환시키는 복수의 효소를 포함하는 재조합 경로를 제공한다.
본 개시내용은 또한 게라닐 피로포스페이트의 생산을 위한 무세포 효소 시스템을 제공하며, 이 경로는 (i) 아세틸-포스페이트 트랜스퍼라제(Acetyl-phosphate transferase, PTA); (ii) 말로네이트 데카르복실라제 알파 서브유닛(malonate decarboxylase alpha subunit, mdcA); (iii) 아실 활성화 효소 3(acyl activating enzyme 3, AAE3); (iv) 올리브톨 합성효소(olivetol synthase, OLS); (v) 올리브톨산 사이클라제(olivetolic acid cyclase, OAC); (vi) 히드록시에틸티아졸 키나제(hydroxyethylthiazole kinase, ThiM); (vii) 이소펜테닐 키나제(isopentenyl kinase, IPK); (viii) 이소펜틸 디포스페이트 이소머라제(isopentyl diphosphate isomerase, IDI); (ix) 디포스포메발로네이트 데카르복실라제 알파 서브유닛(Diphosphomevalonate decarboxylase alpha subunit, MDCa); (x) 게라닐-PP 합성효소(Geranyl-PP synthase, GPPS) 또는 파네실-PP 합성효소 돌연변이 S82F(Farnesyl-PP synthease mutant S82F, FPPS S82F); 및 (xi) 다음으로 구성된 군에서 선택된 서열을 포함하는 재조합 폴리펩티드: (a) 서열번호 30 및 Y288X, A232S를 갖는 돌연변이 및 T69P, T98I 및 G224S로 구성된 군에서 선택된 돌연변이, 전술한 돌연변이 모두 또는 임의의 조합, 여기서 X는 A, N, S, V 또는 비천연 아미노산임; (b) 서열번호 30 및 Y288X, A232S를 갖는 돌연변이 및 T69P, T98I, G224S 및 T126P로 구성된 군에서 선택된 돌연변이, 전술한 돌연변이 모두 또는 임의의 조합, 여기서 X는 A, N, S, V 또는 비천연 아미노산임; (c) 서열번호 30 및 Y288X, A232S를 갖는 돌연변이 및 M14I, Y31W, T69P, T77I, T98I, S136A, E222D, G224S, N236T, G297K로 구성된 군에서 선택된 돌연변이, 전술한 돌연변이 모두 또는 임의의 조합, 여기서 X는 A, N, S, V 또는 비천연 아미노산임; (d) 서열번호 30 및 Y288X, A232S를 갖는 돌연변이 및 M14I, Y31W, T69P, T77I, E80A, D93S, T98I, T126P, M129L, G131Q, S136A, E222D, G224S, N236T, S277T, G297K로 구성된 군에서 선택된 돌연변이, 전술한 돌연변이 또는 임의의 조합, 여기서 X는 A, N, S, V 또는 비천연 아미노산임; (e) 서열번호 30 및 Y288X, A232S를 갖는 돌연변이 및 M14I, L33I, Y31W, T69P, T77I, V78A, E80A, D93S, T98I, E112G, T114V, T126P, M129L, G131Q, S136A, E222D, G224S, K225Q, N236T, S277T, G297K로 구성된 군에서 선택된 돌연변이, 전술한 돌연변이 모두 또는 임의의 조합, 여기서 X는 A, N, S, V 또는 비천연 아미노산임; (f) 1-20개의 보존적 아미노산 치환을 포함하고 NphB 활성을 갖는 (a)-(d) 또는 (e) 중 어느 하나; (g) (a)-(d) 또는 (e)의 서열과 적어도 85%, 90%, 95%, 98% 또는 99% 동일하고 NphB 활성을 갖는 서열.
본 개시내용은 또한 다음으로 구성된 군에서 선택된 폴리펩티드를 엔코딩(encoding)하는 단리된(isolated) 폴리뉴클레오티드를 제공한다: (i) 서열번호 30 및 Y288X, A232S를 갖는 돌연변이 및 T69P, T98I 및 G224S로 구성된 군에서 선택된 돌연변이, 전술한 돌연변이 모두 또는 임의의 조합, 여기서 X는 A, N, S, V 또는 비천연 아미노산임; (ii) 서열번호 30 및 Y288X, A232S를 갖는 돌연변이 및 T69P, T98I, G224S 및 T126P로 구성된 군에서 선택된 돌연변이, 전술한 돌연변이 모두 또는 임의의 조합, 여기서 X는 A, N, S, V 또는 비천연 아미노산임; (iii) 서열번호 30 및 Y288X, A232S를 갖는 돌연번이 및 M14I, Y31W, T69P, T77I, T98I, S136A, E222D, G224S, N236T, G297K로 구성된 군에서 선택된 돌연변이, 전술한 돌연변이 모두 또는 임의의 조합, 여기서 X는 A, N, S, V 또는 비천연 아미노산임; (iv) 서열번호 30 및 Y288X, A232S를 갖는 돌연변이 및 M14I, Y31W, T69P, T77I, E80A, D93S, T98I, T126P, M129L, G131Q, S136A, E222D, G224S, N236T, S277T, G297K로 구성된 군에서 선택된 돌연변이, 전술한 돌연변이 모두 또는 임의의 조합, 여기서 X는 A, N, S, V 또는 비천연 아미노산임; (v) 서열번호 30 및 Y288X, A232S를 갖는 돌연변이 및 M14I, L33I, Y31W, T69P, T77I, V78A, E80A, D93S, T98I, E112G, T114V, T126P, M129L, G131Q, S136A, E222D, G224S, K225Q, N236T, S277T, G297K로 구성된 군에서 선택된 돌연변이, 전술한 돌연변이 모두 또는 임의의 조합, 여기서 X는 A, N, S, V 또는 비천연 아미노산임; (vi) 1-20개의 보존적 아미노산 치환을 포함하고 NphB 활성을 갖는 (a)-(d) 또는 (e) 중 어느 하나; (vii) (a)-(d) 또는 (e)의 서열과 적어도 85%, 90%, 95%, 98% 또는 99% 동일하고 NphB 활성을 갖는 서열.
본 개시내용은 또한 본 개시내용의 단리된 폴리뉴클레오티드를 포함하는 벡터를 제공한다.
본 개시내용은 또한 본 개시내용의 단리된 폴리뉴클레오티드 또는 본 개시내용의 벡터를 포함하는 재조합 미생물을 제공한다.
본 개시내용의 하나 이상의 실시예의 세부사항은 첨부 도면 및 하기 설명에 기재되어 있다. 다른 특징, 목적 및 이점은 설명과 도면, 그리고 청구범위로부터 명백할 것이다.
본 명세서에 통합되고 본 명세서의 일부를 구성하는 첨부 도면은 본 개시내용의 하나 이상의 실시예를 예시하고 상세한 설명과 함께 본 발명의 원리 및 구현을 설명하는 역할을 한다.
도 1A-B는 본 개시내용의 칸나비노이드 제조을 위한 무세포 시스템(cell-free system) 설계를 나타낸다. (A) GPP는 이소프레노이드 모듈(isoprenoid module) 경로(진한 파란색 경로, 왼쪽 상단)에서 유래된다. 방향족 폴리케타이드(aromatic polyketide) OA 또는 DA는 헥사노에이트(hexanoate)(또는 부티레이트(butyrate)) 및 말로네이트(malonate)(녹색 경로)에서 유래된다. 말로닐-CoA(Malonyl-CoA)는 MdcA(별표)를 사용하여 아세틸-CoA(Acetyl-CoA)에서 CoA의 비자연적 전달을 통해 말로네이트에서 생성된다. 아세틸-CoA는 ATP 재생에도 사용되는 아세틸 포스페이트에서 유래된다(빨간색 경로, 오른쪽 상단). 방향족 폴리케타이드는 설계된 CBGA 합성효소를 사용하여 이소프레노이드 모듈에서 파생된 GPP에서 프레닐화되어 CBG(V)A 칸나비노이드를 생성한다. 무세포 시스템의 일부는 아니지만 그림은 단일 효소 단계에서 CBG(V)A가 의학적으로 흥미로운 많은 추가 칸나비노이드로 전환될 수 있는 방법을 보여준다. 사용된 효소 및 약어는 표 1에 나열되어 있다. (B) 본 개시내용의 경로의 대안적 묘사를 나타낸다. R= 알킬기(alkyl group); 삽입물은 올리브 톨레이트(Olivetolate), 프레놀(prenol) 또는 이소프레놀(isoprenol) 또는 프레놀(prenol) 및 이소프레놀(isoprenol) 둘 다와 같은 방향족 폴리케타이드이다. 프레놀 및 이소프레놀을 함께 사용하는 경우, IDI는 필요하지 않고; Zhao et al., "Regeneration of cofactors for use in biocatalysis," Curr Opin Biotechnol., 14(6):583-9, 2003에 기술된 방법을 포함하되 이에 국한되지 않는 다양한 ATP 생성 시스템을 사용할 수 있다.
도 2A-F는 OA/DA 합성 테스트를 보여준다. (A) OA/DA 생산 테스트를 위한 간소화된 MatB 경로이다. (B) MatB 경로를 사용하여 시간 경과에 따른 OA(사각형) 또는 DA(원) 역가(titer)이다. (C) MatB 경로를 사용하여 OA 또는 DA 제조에 대한 첨가제(additives)의 효과이다. 첨가제는 시간 0에서 반응에 첨가되었고, 대조군에 대한 4시간에서의 OA 또는 DA의 역가가 플롯트된다(plotted). 오차 막대는 생물학적 복제의 표준 편차를 나타낸다. (D) 말로닐-CoA를 생성하기 위해 MdcA를 사용하여 헥사노에이트, 말로네이트 및 AcP로부터 OA/DA 제조를 위한 계획이다. (E) 패널 D의 MdcA 시스템을 사용한 방향족 폴리케타이드 OA(사각형) 및 DA(원형)의 제조이다. 시간 경과는 BSA의 존재(채워진 형태) 또는 부재(윤곽선 모양)에서 수행하였다. (F) CBGA(사각형) 및 CBGVA(원형)는 각각 이소프레놀 및 추가된 OA 또는 DA로부터 제조된다. 오차 막대는 생물학적 복제의 표준 편차를 나타낸다.
도 3A-C는 완전한 칸나비노이드 제조 시스템의 구현을 보여준다. (A) 삽입(inputs) 이소프레놀, 아세틸 포스페이트, 말로네이트 및 헥사노에이트(또는 부티레이트)를 CBGA(사각형) 또는 CBGVA(원형)로 변환하는 시간 경과이다. (B) 전체 시스템에서 중간체(intermediates)의 제조이다. CBGA를 제조하는 반응은 OA 제조(검정색 원), CBGA 제조(녹색 삼각형) 및 GPP 제조(파란색 사각형)에 대해 모니터링되었다. (C) 효소 재활용. 6시간에 CBGA 제조 반응의 효소를 농축하고 세척하여 대사 산물을 제거했다. 새로운 반응이 새로운 입력과 보조 요인으로 설정되었고, 첨가 31시간 후에 반응을 켄치드하였다(quenched). 초기 반응(Initial)의 역가 및 초기 및 재활용된 반응의 총 역가가 표시된다(Recycled Enzymes). 오차 막대는 생물학적 복제의 표준 편차를 나타낸다.
도 4는 생성물(product) 특이성에 대한 OLS 및 AAE3 농도의 효과를 나타낸다. CsOLS의 농도 대 생성물 특이성은 세 가지 다른 AAE3 농도에서 표시된다. CsOLS 또는 CsAAE3의 농도가 증가함에 따라 생성물 특이성의 감소가 관찰되었다.
도 5A-B는 효소 활성의 OA 및 DA 억제를 나타낸다. (A) 5mM OA(파란색) 및 DA(녹색)에 남아 있는 활성 백분율은 4개 효소에 대해 추가되지 않은 것과 비교하여 표시된다. (B) 반응 관련 조건에서 CsOLS는 OA에 의해 가장 억제된다.
도 6은 GPP에 의한 OA 및 CBGA 제조의 억제를 나타낸다. RpMatB 반응 시스템은 NphBM31S에 의해 촉매되는 추가된 GPP에 의해 프레닐화될 수 있는 OA를 생성하는 데 사용되었다. GPP가 증가하면 OA와 CBGA의 전체 제조가 감소하여 GPP가 OA 경로를 억제함을 나타낸다.
도 7은 초기 AcP 농도의 함수로서 CBGA의 역가를 나타낸다. AcP 농도를 50mM 이상으로 증가시키면 CBGA 역가를 감소시키기 때문에 50mM 초기 AcP 농도를 사용하였다.
도 8은 말로닐-CoA를 제조하기 위해 MdcA를 사용하는 OA의 역가에 대한 BSA의 효과를 보여준다. 20mg/mL BSA를 나타내는 BSA 적정 데이터는 BSA가 40mg/mL로 증가했을 때 최소한의 개선이 있었기 때문에 후속 반응에 사용해야 한다.
도 9는 CBGA 제조에 대한 아세테이트(acetate) 및 포스페이트(phosphate)의 효과를 나타낸다. 시작 아세테이트 또는 포스페이트 농도를 0에서 100mM으로 변경하는 것은 이소프레놀과 OA를 삽입으로 사용하여 CBGA 제조에 최소한의 영향을 미쳤다.
도 10은 NphB M31의 안정화를 보여준다. 다양한 온도에서 20분 인큐베이션 후 남은 활성은 모 효소 NphB M31 및 새로운 효소 NphB M31s에 대해 표시된다.
도 1A-B는 본 개시내용의 칸나비노이드 제조을 위한 무세포 시스템(cell-free system) 설계를 나타낸다. (A) GPP는 이소프레노이드 모듈(isoprenoid module) 경로(진한 파란색 경로, 왼쪽 상단)에서 유래된다. 방향족 폴리케타이드(aromatic polyketide) OA 또는 DA는 헥사노에이트(hexanoate)(또는 부티레이트(butyrate)) 및 말로네이트(malonate)(녹색 경로)에서 유래된다. 말로닐-CoA(Malonyl-CoA)는 MdcA(별표)를 사용하여 아세틸-CoA(Acetyl-CoA)에서 CoA의 비자연적 전달을 통해 말로네이트에서 생성된다. 아세틸-CoA는 ATP 재생에도 사용되는 아세틸 포스페이트에서 유래된다(빨간색 경로, 오른쪽 상단). 방향족 폴리케타이드는 설계된 CBGA 합성효소를 사용하여 이소프레노이드 모듈에서 파생된 GPP에서 프레닐화되어 CBG(V)A 칸나비노이드를 생성한다. 무세포 시스템의 일부는 아니지만 그림은 단일 효소 단계에서 CBG(V)A가 의학적으로 흥미로운 많은 추가 칸나비노이드로 전환될 수 있는 방법을 보여준다. 사용된 효소 및 약어는 표 1에 나열되어 있다. (B) 본 개시내용의 경로의 대안적 묘사를 나타낸다. R= 알킬기(alkyl group); 삽입물은 올리브 톨레이트(Olivetolate), 프레놀(prenol) 또는 이소프레놀(isoprenol) 또는 프레놀(prenol) 및 이소프레놀(isoprenol) 둘 다와 같은 방향족 폴리케타이드이다. 프레놀 및 이소프레놀을 함께 사용하는 경우, IDI는 필요하지 않고; Zhao et al., "Regeneration of cofactors for use in biocatalysis," Curr Opin Biotechnol., 14(6):583-9, 2003에 기술된 방법을 포함하되 이에 국한되지 않는 다양한 ATP 생성 시스템을 사용할 수 있다.
도 2A-F는 OA/DA 합성 테스트를 보여준다. (A) OA/DA 생산 테스트를 위한 간소화된 MatB 경로이다. (B) MatB 경로를 사용하여 시간 경과에 따른 OA(사각형) 또는 DA(원) 역가(titer)이다. (C) MatB 경로를 사용하여 OA 또는 DA 제조에 대한 첨가제(additives)의 효과이다. 첨가제는 시간 0에서 반응에 첨가되었고, 대조군에 대한 4시간에서의 OA 또는 DA의 역가가 플롯트된다(plotted). 오차 막대는 생물학적 복제의 표준 편차를 나타낸다. (D) 말로닐-CoA를 생성하기 위해 MdcA를 사용하여 헥사노에이트, 말로네이트 및 AcP로부터 OA/DA 제조를 위한 계획이다. (E) 패널 D의 MdcA 시스템을 사용한 방향족 폴리케타이드 OA(사각형) 및 DA(원형)의 제조이다. 시간 경과는 BSA의 존재(채워진 형태) 또는 부재(윤곽선 모양)에서 수행하였다. (F) CBGA(사각형) 및 CBGVA(원형)는 각각 이소프레놀 및 추가된 OA 또는 DA로부터 제조된다. 오차 막대는 생물학적 복제의 표준 편차를 나타낸다.
도 3A-C는 완전한 칸나비노이드 제조 시스템의 구현을 보여준다. (A) 삽입(inputs) 이소프레놀, 아세틸 포스페이트, 말로네이트 및 헥사노에이트(또는 부티레이트)를 CBGA(사각형) 또는 CBGVA(원형)로 변환하는 시간 경과이다. (B) 전체 시스템에서 중간체(intermediates)의 제조이다. CBGA를 제조하는 반응은 OA 제조(검정색 원), CBGA 제조(녹색 삼각형) 및 GPP 제조(파란색 사각형)에 대해 모니터링되었다. (C) 효소 재활용. 6시간에 CBGA 제조 반응의 효소를 농축하고 세척하여 대사 산물을 제거했다. 새로운 반응이 새로운 입력과 보조 요인으로 설정되었고, 첨가 31시간 후에 반응을 켄치드하였다(quenched). 초기 반응(Initial)의 역가 및 초기 및 재활용된 반응의 총 역가가 표시된다(Recycled Enzymes). 오차 막대는 생물학적 복제의 표준 편차를 나타낸다.
도 4는 생성물(product) 특이성에 대한 OLS 및 AAE3 농도의 효과를 나타낸다. CsOLS의 농도 대 생성물 특이성은 세 가지 다른 AAE3 농도에서 표시된다. CsOLS 또는 CsAAE3의 농도가 증가함에 따라 생성물 특이성의 감소가 관찰되었다.
도 5A-B는 효소 활성의 OA 및 DA 억제를 나타낸다. (A) 5mM OA(파란색) 및 DA(녹색)에 남아 있는 활성 백분율은 4개 효소에 대해 추가되지 않은 것과 비교하여 표시된다. (B) 반응 관련 조건에서 CsOLS는 OA에 의해 가장 억제된다.
도 6은 GPP에 의한 OA 및 CBGA 제조의 억제를 나타낸다. RpMatB 반응 시스템은 NphBM31S에 의해 촉매되는 추가된 GPP에 의해 프레닐화될 수 있는 OA를 생성하는 데 사용되었다. GPP가 증가하면 OA와 CBGA의 전체 제조가 감소하여 GPP가 OA 경로를 억제함을 나타낸다.
도 7은 초기 AcP 농도의 함수로서 CBGA의 역가를 나타낸다. AcP 농도를 50mM 이상으로 증가시키면 CBGA 역가를 감소시키기 때문에 50mM 초기 AcP 농도를 사용하였다.
도 8은 말로닐-CoA를 제조하기 위해 MdcA를 사용하는 OA의 역가에 대한 BSA의 효과를 보여준다. 20mg/mL BSA를 나타내는 BSA 적정 데이터는 BSA가 40mg/mL로 증가했을 때 최소한의 개선이 있었기 때문에 후속 반응에 사용해야 한다.
도 9는 CBGA 제조에 대한 아세테이트(acetate) 및 포스페이트(phosphate)의 효과를 나타낸다. 시작 아세테이트 또는 포스페이트 농도를 0에서 100mM으로 변경하는 것은 이소프레놀과 OA를 삽입으로 사용하여 CBGA 제조에 최소한의 영향을 미쳤다.
도 10은 NphB M31의 안정화를 보여준다. 다양한 온도에서 20분 인큐베이션 후 남은 활성은 모 효소 NphB M31 및 새로운 효소 NphB M31s에 대해 표시된다.
본 명세서 및 첨부된 청구범위에서 사용되는 바와 같이, 단수형 "a", "an" 및 "the"는 문맥이 달리 명시하지 않는 한 복수 지시 대상을 포함한다. 예를 들어, "폴리뉴클레오타이드(a polynucleotide)"에 대한 언급은 복수의 이러한 폴리뉴클레오타이드를 포함하고, "효소(the enzyme)"에 대한 언급은 하나 이상의 효소에 대한 언급 등을 포함한다.
달리 정의되지 않는 한, 본 명세서에서 사용되는 모든 기술 및 과학 용어는 본 개시가 속하는 기술 분야에서 통상의 지식을 가진 자에게 일반적으로 이해되는 것과 동일한 의미를 갖는다. 본 명세서에 기재된 것과 유사하거나 등가인 방법 및 재료가 개시된 방법 및 조성물의 실시에 사용될 수 있지만, 예시적인 방법, 장치 및 재료가 본 명세서에 기재되어 있다.
또한, "또는(or)"의 사용은 달리 언급되지 않는 한 "및/또는(and/or)"을 의미한다. 유사하게, "포함하다(comprise)", "포함하다(comprises)", "포함하는comprising)" "포함하다(include)", "포함하다(includes)" 및 "포함하는(including)"는 상호 교환 가능하며 제한하려는 의도가 아니다.
다양한 실시예의 설명이 "포함하는(comprising)"이라는 용어를 사용하는 경우, 당업자는 일부 특정 경우에 실시예가 "본질적으로 구성되는(consisting essentially of)" 또는 "~로 구성된(consisting of)" 언어를 사용하여 대안적으로 설명될 수 있음을 이해할 것이다.
상기 및 본문 전체에 걸쳐 논의된 임의의 간행물은 본 출원의 출원일 이전의 공개를 위해서만 제공된다. 본 문서의 어떤 내용도 본 발명자들이 사전 공개로 인해 그러한 공개에 앞서 자격이 없음을 인정하는 것으로 해석되어서는 안된다.
본 명세서에 사용된 바와 같이, 효소의 "활성(activity)"은 대사산물을 생성하는 반응을 촉매하는 능력, 즉 "기능(function)"의 척도이며, 반응의 대사산물이 생성되는 속도로 표현될 수 있다. 예를 들어, 효소 활성은 단위 시간당 또는 단위 효소(예: 농도 또는 중량)당 생성된 대사 산물의 양으로, 또는 친화도 또는 해리 상수의 관점에서 나타낼 수 있다.
"박테리아(Bacteria)" 또는 "유박테리아(eubacteria)"는 원핵 유기체의 도메인을 지칭한다. 박테리아는 다음과 같이 최소 11개의 별개 그룹을 포함한다: (1) 그람 양성(그람+) 박테리아, 두 가지 주요 하위 분류가 있다: (1) 고 G+C 그룹(방선균(Actinomycetes), 마이코박테리아(Mycobacteria), 마이크로코커스(Micrococcus) 등) (2) 낮은 G+C 그룹(바실러스(Bacillus), 클로스트리디아(Clostridia), 락토바실러스(Lactobacillus), 포도상구균(Staphylococci), 연쇄상구균(Streptococci), 마이코플라스마(Mycoplasmas)); (2) 프로테오박테리아(Proteobacteria), 예를 들어 보라색 광합성 + 비광합성 그람-음성 박테리아(대부분의 "일반적인(common)" 그람-음성 박테리아 포함); (3) 시아노박테리아(Cyanobacteria), 예를 들면, 산소 광영양체(oxygenic phototroph); (4) 스피로헤타(Spirochetes) 및 관련 종; (5) 플랑토마이세스(Planctomyces); (6) 박테로이데스(Bacteroides), 플라보박테리아(Flavobacteria); (7) 클라미디아(Chlamydia); (8) 녹색 유황 박테리아(Green sulfur bacteria); (9) 녹색 비황 박테리아(Green non-sulfur bacteria)(또한 혐기성 광영양체(anaerobic phototrophs)); (10) 방사선저항성 미세구균(Radioresistant micrococci) 및 친척(relatives); 및 (11) 써모토가(Thermotoga) 및 Thermosipho 호열성 물질(Thermosipho thermophiles ).
"대사 경로(metabolic pathway)"로도 지칭되는 용어 "생합성 경로(biosynthetic pathway)"는 한 화학종을 다른 화학종으로 전환(변환)하기 위한 동화작용 또는 이화작용 생화학 반응 세트를 지칭한다(예를 들어, 도 1 참조). 유전자 산물은 병렬 또는 직렬로 동일한 기질에 작용하거나 동일한 산물을 생산하거나 동일한 기질과 대사산물 최종 산물 사이의 대사 중간체(즉, 대사 산물)에 작용하거나 이를 생산하는 경우 동일한 "대사 경로(metabolic pathway)"에 속한다. 본 개시내용은 원하는 생성물 또는 중간체의 생산을 위한 대사적으로 조작된 경로를 갖는 재조합 미생물을 제공한다.
"보존적 아미노산 치환(conservative amino acid substitution)"은 아미노산 잔기가 유사한 사이드 체인(side chain)을 갖는 아미노산 잔기로 대체된 것이다. 유사한 사이드 체인을 갖는 아미노산 잔기의 패밀리는 당업계에 정의되어 있다. 이러한 패밀리에는 염기성 사이드 체인(basic side chains)(예: 리신(lysine), 아르기닌(arginine), 히스티딘(histidine)), 산성(acidic) 사이드 체인(예: 아스파르트산(aspartic acid), 글루탐산(glutamic acid)), 전하를 띠지 않는(uncharged) 극성(polar) 사이드 체인(예: 글리신(glycine), 아스파라긴(asparagine), 글루타민(glutamine), 세린(serine), 트레오닌(threonine), 티로신(tyrosine), 시스테인(cysteine)), 비극성(nonpolar) 사이드 체인(예: 알라닌(alanine), 발린(valine), 류신(leucine), 이소류신(isoleucine), 프롤린(proline), 페닐알라닌(phenylalanine), 메티오닌(methionine), 트립토판(tryptophan)), 베타 분지(beta-branched) 사이드 체인(예: 트레오닌(threonine), 발린(valine), 이소류신(isoleucine)) 및 방향족 사이드 체인(예: 티로신(tyrosine), 페닐알라닌(phenylalanine), 트립토판(tryptophan), 히스티딘(histidine))이 있는 아미노산을 포함한다. 다음 6개 그룹은 각각 서로에 대한 보존적 치환인 아미노산을 포함한다: 1) 세린(Serine, S), 트레오닌(Threonine, T); 2) 아스파르트산(Aspartic Acid, D), 글루탐산(Glutamic Acid, E); 3) 아스파라긴(Asparagine, N), 글루타민(Glutamine, Q); 4) 아르기닌(Arginine, R), 리신(Lysine, K); 5) 이소류신(Isoleucine, I), 류신(Leucine, L), 메티오닌(Methionine, M), 알라닌(Alanine, A), 발린(Valine, V), 및 6) 페닐알라닌(Phenylalanine, F), 티로신(Tyrosine, Y), 트립토판(Tryptophan, W).
"효소(enzyme)"는 일반적으로 하나 이상의 화학적 또는 생화학적 반응을 촉매하거나 촉진하는 단백질 또는 폴리펩타이드를 구성하는 아미노산으로 전체적으로 또는 크게 구성된 임의의 물질을 의미한다.
유전자 또는 폴리뉴클레오타이드에 대한 용어 "발현(expression)"은 유전자 또는 폴리뉴클레오타이드의 전사 및 적절한 경우 생성된 mRNA 전사체의 단백질 또는 폴리펩타이드로의 번역을 지칭한다. 따라서, 문맥에서 명백해지는 바와 같이, 단백질 또는 폴리펩타이드의 발현은 오픈 리딩 프레임(open reading frame)의 전사 및 번역의 결과이다.
"그람-음성 박테리아(Gram-negative bacteria)"는 구균(cocci), 비장내 간상체(nonenteric rods) 및 장내 간상체(enteric rods)를 포함한다. 그람 음성 박테리아의 속(genera)은 예를 들어, 나이세리아(Neisseria), 스피릴룸(Spirillum), 파스퇴렐라(Pasteurella), 브루셀라(Brucella), 예르시니아(Yersinia), 프란시셀라(Francisella), 헤모필루스(Haemophilus), 보르데텔라(Bordetella), 에스케리키아(Escherichia), 살모넬라(Salmonella), 시겔라(Shigella), 클렙시엘라(Klebsiella), 프로테우스(Proteus), 비브리오(Vibrio), 슈도모나스(Pseudomonas), 박테로이데스(Bacteroides), 아세토박터(Acetobacter), 에어로박터(Aerobacter), 아그로박테리움(Agrobacterium), 아조토박터(Azotobacter), 스피릴라(Spirilla), 세라티아(Serratia), 비브리오(Vibrio), 리조비움(Rhizobium), 클라미디아(Chlamydia), 리케차(Rickettsia), 트레포네마(Treponema), 및 푸소박테리움(Fusobacterium)을 포함한다.
"그람 양성 박테리아(Gram positive bacteria)"는 구균, 비포자성 간상체(nonsporulating rods) 및 포자성 간상체(sporulating rods)를 포함한다. 그람 양성 박테리아의 속은 예를 들어, 방선균(Actinomyces), 바실러스(Bacillus), 클로스트리디움(Clostridium), 코리네박테리움(Corynebacterium), 에리시펠로트릭스(Erysipelothrix), 락토바실러스(Lactobacillus), 리스테리아(Listeria), 마이코박테리움(Mycobacterium), 마이소코커스(Myxococcus), 노카르디아(Nocardia), 포도상구균(Staphylococcus), 연쇄상 구균(Streptococcus), 및 스트렙토마이세스(Streptomyces)를 포함한다.
단백질을 코딩하는 핵산 서열이 제2 단백질을 코딩하는 핵산 서열과 유사한 서열을 갖는 경우 단백질은 제2 단백질에 "상동성(homology)"을 갖거나 "상동(homologous)"이다. 또는, 두 단백질이 "유사한(similar)" 아미노산 서열을 가진다면 단백질은 두 번째 단백질과 상동성을 갖는다(따라서 "상동 단백질(homologous proteins)"이라는 용어는 두 단백질이 유사한 아미노산 서열을 가지고 있음을 의미하는 것으로 정의된다).
본 명세서에 사용된 바와 같이, 2개의 단백질(또는 단백질의 영역)은 아미노산 서열이 적어도 약 30%, 40%, 50% 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 가질 때 실질적으로 상동이다. 2개의 아미노산 서열 또는 2개의 핵산 서열의 동일성 퍼센트를 결정하기 위해, 서열은 최적의 비교 목적으로 정렬된다(예를 들어, 갭(gaps)은 최적의 정렬을 위해 첫 번째 및 두 번째 아미노산 또는 핵산 서열 중 하나 또는 둘 모두에 도입될 수 있고, 비 상동 서열은 비교 목적으로 무시될 수 있다). 하나의 실시예에서, 비교 목적을 위해 정렬된 참조 서열의 길이는 적어도 30%, 일반적으로 적어도 40%, 보다 일반적으로 적어도 50%, 훨씬 더 일반적으로 적어도 60%, 훨씬 더 일반적으로 적어도 70%, 80%, 90%, 100%이다. 이어서, 상응하는 아미노산 위치 또는 뉴클레오티드 위치에서 아미노산 잔기 또는 뉴클레오티드가 비교된다. 첫 번째 서열의 위치가 두 번째 서열의 상응하는 위치와 동일한 아미노산 잔기 또는 뉴클레오티드에 의해 점유될 때, 분자는 그 위치에서 동일하다(본원에 사용된 아미노산 또는 핵산 "동일성"은 아미노산 또는 핵산 "상동성"과 동등하다). 두 서열 간의 퍼센트 동일성은 두 서열의 최적 정렬을 위해 도입되어야 하는 간격의 수와 각 간격의 길이를 고려하여 서열이 공유하는 동일한 위치의 수의 함수이다.
"상동성"이 단백질 또는 펩티드와 관련하여 사용될 때, 동일하지 않은 잔기 위치는 종종 보존적 아미노산 치환에 의해 상이하다는 것으로 인식된다. "보존적 아미노산 치환(conservative amino acid substitution)"은 아미노산 잔기가 유사한 화학적 성질을 갖는 사이드 체인(R 그룹)을 갖는 다른 아미노산 잔기로 치환되는 것이다(예: 전하 또는 소수성). 일반적으로, 보존적 아미노산 치환은 단백질의 기능적 특성을 실질적으로 바꾸지 않을 것이다. 2개 이상의 아미노산 서열이 보존적 치환에 의해 서로 다른 경우, 퍼센트 서열 동일성 또는 상동성 정도는 치환의 보존적 성질을 교정하기 위해 상향 조정될 수 있다. 이러한 조정을 위한 수단은 당업자에게 잘 알려져 있다(예를 들어, Pearson et al., 1994를 참조).
또한, 위에서 언급한 바와 같이, 대사산물 생성에 유용한 효소의 상동체는 본원에 제공된 미생물 및 방법에 포함된다. 첫 번째 패밀리 또는 종의 원래 효소 또는 유전자와 관련하여 사용된 "상동체"라는 용어는 기능적, 구조적 또는 게놈 분석에 의해 첫 번째 패밀리 또는 종의 원래 효소 또는 유전자에 해당하는 두 번째 패밀리 또는 종의 효소 또는 유전자로 결정되는 두 번째 패밀리 또는 종의 별개의 효소 또는 유전자를 나타낸다. 대부분의 경우 상동체는 기능적, 구조적 또는 게놈 유사성을 갖는다. 유전자 프로브 및 PCR을 사용하여 효소 또는 유전자의 상동체를 쉽게 복제할 수 있는 기술이 알려져 있다. 상동체로서의 복제된 서열의 동일성은 기능적 분석 및/또는 유전자의 게놈 매핑을 사용하여 확인할 수 있다.
퍼센트 서열 동일성으로도 지칭될 수 있는 폴리펩티드에 대한 서열 상동성은 일반적으로 서열 분석 소프트웨어를 사용하여 측정된다. 예를 들어, 유전학 컴퓨터 그룹(Genetics Computer Group, GCG)의 서열 분석 소프트웨어 패키지, 위스콘신 대학교 생명공학 센터(University of Wisconsin Biotechnology Center), 910 University Avenue, Madison, Wis. 53705 참조. 단백질 분석 소프트웨어는 보존적 아미노산 치환을 포함하여 다양한 치환, 결실 및 기타 변형에 할당된 상동성 측정을 사용하여 유사한 서열을 일치시킨다. 예를 들어, GCG에는 "갭(Gap)" 및 "베스트핏(Bestfit)"과 같은 프로그램이 포함되어 있어 기본 매개변수와 함께 사용하여 서로 다른 종의 유기체에서 유래한 상동성 폴리펩티드 또는 야생형 단백질과 이의 뮤테인과 같이 밀접하게 관련된 폴리펩티드 간의 서열 상동성 또는 서열 동일성을 결정할 수 있다. 예를 들어, GCG 버전 6.1 참조.
분자 서열을 다른 유기체로부터의 많은 수의 서열을 포함하는 데이터베이스와 비교하는 데 사용되는 전형적인 알고리즘은 컴퓨터 프로그램 BLAST(Altschul, 1990; Gish, 1993; Madden, 1996; Altschul, 1997; Zhang, 1997), 특히 blastp 또는 tblastn(Altschul, 1997)이다. BLASTp의 일반적인 매개변수는 다음과 같다: 기대값(Expectation value): 10(디폴트값(default)); 필터(Filter): 세그먼트(seq)(디폴트값); 갭을 여는 비용: 11(디폴트값); 갭 확장 비용: 1(디폴트값); 최대. 정렬(Max. alignments): 100(디폴트값); 단어 크기(Word size): 11(디폴트값); 설명 수(No. of descriptions): 100(디폴트값); 패널티 매트릭스(Penalty Matrix): BLOSUM62.
다수의 상이한 유기체로부터의 서열을 포함하는 데이터베이스를 검색할 때, 아미노산 서열을 비교하는 것이 일반적이다. 아미노산 서열을 사용한 데이터베이스 검색은 당업계에 공지된 BLASTp 이외의 알고리즘에 의해 측정될 수 있다. 예를 들어, 폴리펩타이드 서열은 GCG 버전 6.1의 프로그램인 FASTA를 사용하여 비교할 수 있다. FASTA는 쿼리(query)와 검색 서열 간에 가장 잘 겹치는 영역의 정렬 및 퍼센트 서열 동일성을 제공한다(Pearson, 1990, 여기에 참조로 포함됨). 예를 들어, 아미노산 서열 간의 퍼센트 서열 동일성은 본원에 참조로 포함되는 GCG 버전 6.1에 제공된 기본 매개변수(단어 크기 2 및 PAM250 스코어링 매트릭스)와 함께 FASTA를 사용하여 결정할 수 있다.
일부 경우에, "아이소자임(isozymes)"은 동일한 기능적 전환/반응을 수행하는 데 사용될 수 있지만 구조가 너무 유사하여 일반적으로 "상동성"이 아닌 것으로 결정된다.
본 명세서에 사용된 바와 같이, "대사적으로 조작된(metabolically engineered)" 또는 "대사 공학(metabolic engineering)"이라는 용어는 미생물, 부분적으로 미생물, 무세포 시스템 및/또는 무세포 시스템과 미생물의 조합에서 GPP 및/또는 OA, CBG(V)A 또는 기타 화학 물질과 같은 원하는 대사 산물의 생산을 위한 생합성 유전자, 오페론과 관련된 유전자 및 이러한 폴리뉴클레오티드의 제어 요소의 합리적인 경로 설계 및 조립을 포함한다. 대사적으로 조작된"은 원하는 경로로 이어지는 중간체와 경쟁하는 경쟁 대사 경로의 감소, 파괴 또는 녹아웃(knocking out)을 포함한 유전 공학 및 적절한 배양 조건을 사용하여 전사, 번역, 단백질 안정성 및 단백질 기능의 조절 및 최적화에 의한 대사 플럭스(flux)의 최적화를 추가로 포함할 수 있다. 생합성 유전자는 숙주에 대해 이질적이거나 돌연변이유발, 재조합 및/또는 내인성 숙주 세포에서 이종 발현 조절 서열과의 회합에 의해 변형됨으로써 숙주 미생물에 대해 이종성(heterologous)일 수 있다. 하나의 실시예에서, 폴리뉴클레오티드가 숙주 유기체에 대해 이종유전적인(xenogenetic) 경우, 폴리뉴클레오티드는 코돈 최적화될 수 있다.
"대사산물(metabolite)"은 대사 또는 효소 경로에 의해 생성되는 모든 물질 또는 원하는 대사 산물, 화학 물질 등을 발생시키는 특정 대사 과정 또는 경로에 필요하거나 참여하는 물질을 말한다. 대사 산물은 대사 또는 효소 경로의 출발 물질(예: 이소프레놀 등), 중간체(예: IP) 또는 최종 생성물(예: GPP)인 유기 화합물일 수 있다. 대사 산물은 더 복잡한 분자를 구성하는 데 사용되거나 더 간단한 분자로 분해될 수 있다. 중간 대사 산물은 다른 대사 산물에서 합성되어 더 복잡한 물질을 만드는 데 사용되거나 종종 화학 에너지의 방출과 함께 더 간단한 화합물로 분해될 수 있다.
"미생물(microorganism)"이라는 용어는 고세균, 박테리아 및 유카리아(Eucarya) 도메인의 원핵 및 진핵 미생물 종을 포함하며, 후자는 효모 및 사상 진균(filamentous fungi), 원생동물(protozoa), 조류(algae), 또는 고등 원생생물(higher Protista)을 포함한다. "미생물 세포(microbial cells)" 및 "미생물(microbes)"이라는 용어는 미생물(microorganism)이라는 용어와 상호교환적으로 사용된다.
"돌연변이(mutation)"는 돌연변이 단백질, 효소, 폴리뉴클레오티드, 유전자 또는 세포를 생성하는 모든 과정 또는 메커니즘을 의미한다. 여기에는 단백질, 효소, 폴리뉴클레오타이드 또는 유전자 서열이 변경된 모든 돌연변이와 이러한 돌연변이로 인해 발생하는 세포에서 감지 가능한 모든 변화가 포함된다. 일반적으로, 돌연변이는 단일 또는 다중 뉴클레오티드 잔기의 점 돌연변이, 결실 또는 삽입에 의해 폴리뉴클레오티드 또는 유전자 서열에서 발생한다. 돌연변이는 유전자의 단백질-암호화 영역 내에서 발생하는 폴리뉴클레오티드 변경뿐만 아니라 단백질-암호화 서열 외부의 영역, 예를 들어 조절 또는 프로모터 서열(이에 제한되지 않음)에서의 변경을 포함한다. 유전자의 돌연변이는 "침묵(silent)"일 수 있다. 즉, 발현 시 아미노산 변경에 반영되지 않아 유전자의 "서열-보존적(sequence-conservative)" 변이체가 생성된다. 이것은 일반적으로 하나의 아미노산이 하나 이상의 코돈에 해당할 때 발생한다. 단백질의 상이한 1차 서열을 발생시키는 돌연변이는 돌연변이 단백질 또는 단백질 변이체로 지칭될 수 있다.
"천연(native)" 또는 "야생형(wild-type)" 단백질, 효소, 폴리뉴클레오티드, 유전자 또는 세포는 자연에서 발생하는 단백질, 효소, 폴리뉴클레오티드, 유전자 또는 세포를 의미한다.
"부모 미생물(parental microorganism)"은 재조합 미생물을 생성하는 데 사용되는 세포를 지칭한다. "부모 미생물"이라는 용어는 하나의 실시예에서 자연에서 발생하는 세포, 즉 유전적으로 변형되지 않은 "야생형(wild-type)" 세포를 설명한다. "부모 미생물"이라는 용어는 추가 공학을 위한 "부모" 역할을 하는 세포를 추가로 설명한다. 이 후자의 실시예에서, 세포는 유전적으로 조작되었을 수 있지만 추가 유전 조작을 위한 소스 역할을 한다.
예를 들어, 야생형 미생물은 제1 표적 효소를 발현하거나 과발현하도록 유전적으로 변형될 수 있다. 이 미생물은 제2 표적 효소를 발현하거나 과발현하도록 변형된 미생물의 생성에서 모 미생물로서 작용할 수 있다. 차례로, 그 미생물은 제3의 표적 효소 등을 발현하거나 과발현하도록 변형될 수 있다. 본 명세서에 사용된 바와 같이, "발현(express)" 또는 "과발현(over express)"은 원하는 유전자 생성물의 표현형 발현을 지칭한다. 하나의 실시예에서, 유기체에서 자연적으로 발생하는 유전자는 이종 프로모터 또는 조절 도메인에 연결되도록 조작될 수 있고, 상기 조절 도메인은 유전자의 발현을 유발하여 야생형 유기체에 비해 그의 정상 발현을 변형시킨다. 또는, 유기체는 유전자에 대한 억제인자 기능을 제거하거나 감소시켜 발현을 변형시키도록 조작될 수 있다. 또 다른 실시예에서, 원하는 발현 조절/조절 요소에 작동 가능하게 연결된 유전자 서열을 포함하는 카세트(cassette)가 미생물에 조작된다.
따라서, 부모 미생물은 연속적인 유전자 변형 사건에 대한 참조 세포로 기능한다. 각각의 변형 이벤트는 하나 이상의 핵산 분자를 참조 세포에 도입함으로써 달성될 수 있다. 도입은 하나 이상의 표적 효소의 발현 또는 과발현 또는 하나 이상의 표적 효소의 감소 또는 제거를 촉진한다. 용어 "촉진한다(facilitates)"는 예를 들어, 부모 미생물에서 프로모터 서열의 유전적 변형을 통해 표적 효소를 엔코딩하는 내인성 폴리뉴클레오티드의 활성화를 포함하는 것으로 이해된다. "촉진하다"라는 용어는 표적 효소를 엔코딩하는 외인성 폴리뉴클레오티드를 부모 미생물에 도입하는 것을 포함하는 것으로 추가로 이해된다.
"부모 효소 또는 단백질(parental enzyme or protein)"은 변이체 또는 돌연변이 효소 또는 단백질을 생성하는데 사용되는 효소 또는 단백질을 지칭한다. "부모 효소"(또는 단백질)라는 용어는 하나의 실시예에서 자연에서 발생하는 효소 또는 단백질, 즉 유전적으로 변형되지 않은 "야생형" 효소 또는 단백질을 설명한다. "부모 효소"(또는 단백질)라는 용어는 추가 조작을 위한 "부모" 역할을 하는 세포를 추가로 설명한다. 이 후자의 실시예에서, 효소 또는 단백질은 유전적으로 조작되었을 수 있지만 추가 유전 조작을 위한 소스 역할을 한다.
용어 "폴리뉴클레오티드(polynucleotide)", "핵산(nucleic acid)" 또는 "재조합 핵산(recombinant nucleic acid)"은 데옥시리보핵산(deoxyribonucleic acid, DNA) 및 적절한 경우 리보핵산(ribonucleic acid, RNA)과 같은 폴리뉴클레오티드를 지칭한다.
상동체, 변이체, 단편, 관련 융합 단백질, 또는 이의 기능적 등가물을 포함하는 대사산물을 생성하는 데 유용한 효소를 엔코딩하는 폴리뉴클레오티드는 박테리아 또는 효모 세포와 같은 적절한 숙주 세포에서 이러한 폴리펩티드의 발현을 지시하는 재조합 핵산 분자에 사용된다. 본원에 제공된 서열 및 수탁 번호는 용이하게 이용가능한 소프트웨어 및 기본 생물학 지식을 사용하여 본 개시내용의 다양한 효소에 대한 코딩 서열을 획득하고 획득하는 능력을 당업자에게 제공한다.
당해 분야의 숙련가는 유전자 코드의 퇴행성 특성으로 인해 뉴클레오티드 서열이 상이한 다양한 코돈을 사용하여 주어진 아미노산을 엔코딩할 수 있음을 인식할 것이다. 상기 기재된 생합성 효소 또는 폴리펩티드를 암호화하는 특정 폴리뉴클레오티드 또는 유전자 서열은 단지 본 개시내용의 실시예를 예시하기 위해 본원에서 참조되며, 본 개시내용은 본 개시내용의 방법에 사용된 효소의 단백질 및 폴리펩티드의 동일한 아미노산 서열을 포함하는 폴리펩티드를 엔코딩하는 임의의 서열의 폴리뉴클레오티드를 포함한다. 비슷한 방식으로, 폴리펩티드는 전형적으로 원하는 활성의 손실 또는 상당한 손실 없이 그의 아미노산 서열에서 하나 이상의 아미노산 치환, 결실 및 삽입을 견딜 수 있다. 본 개시내용은 교대 아미노산 서열을 갖는 이러한 폴리펩티드를 포함하고, 본원에 제시된 DNA 서열에 의해 엔코딩되는 아미노산 서열은 단지 본 개시내용의 예시적인 실시예를 예시한다.
본 개시내용은 하나 이상의 표적 효소를 엔코딩하는, 본원의 다른 곳에서 보다 상세히 기재된 바와 같이, 재조합 DNA 발현 벡터 또는 플라스미드 형태의 폴리뉴클레오티드를 제공한다. 일반적으로, 이러한 벡터는 숙주 미생물의 세포질에서 복제하거나 숙주 미생물의 염색체 DNA에 통합될 수 있다. 두 경우 모두, 벡터는 안정적인 벡터(즉, 벡터는 선택적인 압력만 있더라도 많은 세포 분열에 걸쳐 존재함) 또는 일시적인 벡터(즉, 벡터는 세포 분열 수가 증가함에 따라 숙주 미생물에 의해 점차적으로 손실됨)일 수 있다. 본 개시내용은 단리된(즉, 순수하지 않지만, 자연에서 발견되지 않는 풍부한 및/또는 농도로 제제에 존재함) 정제된(즉, 오염 물질이 실질적으로 없거나 해당 DNA가 자연에서 발견되는 물질이 실질적으로 없음) 형태의 DNA 분자를 제공한다.
본 개시내용의 폴리뉴클레오티드는 표준 PCR 증폭 기술 및 하기 실시예 섹션에 기재된 절차에 따라 주형 및 적절한 올리고뉴클레오티드 프라이머로서 cDNA, mRNA 또는 대안적으로 게놈 DNA를 사용하여 증폭될 수 있다. 이렇게 증폭된 핵산은 적절한 벡터로 클로닝될 수 있고 DNA 서열 분석에 의해 특성화될 수 있다. 뿐만 아니라, 뉴클레오티드 서열에 상응하는 올리고뉴클레오티드는 예를 들어 자동화된 DNA 합성기를 사용하여 표준 합성 기술에 의해 제조될 수 있다.
본 개시내용은 유전자 코드의 축퇴성(degeneracy)을 사용하거나 코딩 서열을 검색하기 위해 공개적으로 이용가능한 데이터베이스를 사용하여 폴리뉴클레오티드 서열을 설계, 합성 및/또는 단리하는데 사용될 수 있는, 본 출원에 수반되는 서열 목록의 다수의 폴리펩티드 서열을 제공한다. 또한, 본원에 기재된 효소에 상동성인 폴리펩티드를 코딩하는 단리된 폴리뉴클레오티드 분자는 특정 폴리펩티드를 코딩하는 뉴클레오티드 서열에 하나 이상의 뉴클레오티드 치환, 부가 또는 결실을 도입함으로써 생성될 수 있으며, 하나 이상의 아미노산 치환, 부가 또는 결실이 코딩된 단백질에 도입되는 것으로 이해된다. 돌연변이는 부위 지정 돌연변이유발 및 PCR 매개 돌연변이유발과 같은 표준 기술에 의해 폴리뉴클레오타이드에 도입될 수 있다. 비보존적 아미노산 치환을 만드는 것이 바람직할 수 있는 위치와 대조적으로, 일부 위치에서는 보존적 아미노산 치환을 만드는 것이 바람직하다.
당업자에 의해 이해되는 바와 같이, 특정 숙주에서 발현을 향상시키기 위해 코딩 서열을 수정하는 것이 유리할 수 있다. 유전 코드는 64개의 가능한 코돈으로 중복되지만 대부분의 유기체는 일반적으로 이러한 코돈의 하위 집합을 사용한다. 한 종에서 가장 많이 활용되는 코돈을 최적 코돈(optimal codons)이라 하고, 잘 활용되지 않는 코돈을 희귀(rare) 또는 저사용 코돈(low-usage codons)으로 분류한다. 코돈은 숙주의 선호하는 코돈 사용을 반영하기 위해 대체될 수 있으며, 때때로 "코돈 최적화(codon optimization)" 또는 "종 코돈 편향 제어(controlling for species codon bias)"라고 하는 프로세스이다.
특정 원핵 또는 진핵 숙주(Murray et al. (1989) Nucl. Acids Res. 17:477-508 참조)가 선호하는 코돈을 포함하는 최적화된 코딩 서열은 예를 들어, 번역 속도를 증가시키거나 최적화되지 않은 서열로부터 생성된 전사체와 비교하여 더 긴 반감기와 같은 바람직한 특성을 갖는 재조합 RNA 전사물을 생성하기 위해 제조될 수 있다. 번역 정지 코돈은 숙주 선호도를 반영하도록 수정될 수도 있다. 예를 들어, S. cerevisiae 및 포유류의 전형적인 정지 코돈은 각각 UAA 및 UGA이다. 외떡잎(monocotyledonous) 식물의 전형적인 정지 코돈은 UGA인 반면 곤충과 대장균은 일반적으로 UAA를 정지 코돈으로 사용한다(Dalphin et al. (1996) Nucl. Acids Res. 24: 216-218). 식물에서 발현을 위한 뉴클레오티드 서열을 최적화하기 위한 방법론은 예를 들어, 미국 특허 6,015,891, 및 거기에 인용된 참고 문헌이 제공된다.
본원에 기재된 폴리뉴클레오티드는 "유전자(genes)"를 포함하고 상기 기재된 핵산 분자는 "벡터(vectors)" 또는 "플라스미드(plasmids)"를 포함하는 것으로 이해된다.
"원핵생물(prokaryotes)"이라는 용어는 당업계에서 인식되고 있으며 핵 또는 다른 세포 소기관을 함유하지 않는 세포를 지칭한다. 원핵생물은 일반적으로 박테리아와 고세균의 두 영역 중 하나로 분류된다. 고세균 및 박테리아 도메인의 유기체 간의 결정적인 차이는 16S 리보솜 RNA의 뉴클레오티드 염기 서열의 근본적인 차이에 기반한다.
용어가 본원에서 상호교환가능하게 사용되는 "단백질(protein)" 또는 "폴리펩티드(polypeptide)"는 펩티드 결합이라고 하는 화학 결합에 의해 함께 연결된 아미노산이라고 하는 화학 빌딩 블록의 하나 이상의 사슬을 포함한다. 단백질 또는 폴리펩티드는 효소로 기능할 수 있다.
용어 "기질(substrate)" 또는 "적합한 기질(suitable substrate)"은 효소의 작용에 의해 다른 화합물로 전환되거나 전환되는 것을 의미하는 임의의 물질 또는 화합물을 지칭한다. 이 용어는 단일 화합물뿐만 아니라 하나 이상의 기질 또는 이들의 유도체를 함유하는 용액, 혼합물 및 기타 물질과 같은 화합물의 조합을 포함한다. 더 나아가, 용어 "기질"은 출발 물질을 제공하는 화합물뿐만 아니라 본원에 기재된 대사 공학 미생물과 관련된 경로에서 사용되는 중간체 및 최종 생성물 대사산물을 포함한다.
"형질전환(Transformation)"은 벡터가 숙주 세포에 도입되는 과정을 의미한다. 형질전환(또는 형질도입(transduction) 또는 형질감염(transfection))은 전기천공(electroporation), 미세주입(microinjection), 바이오리스틱(biolistics)(또는 입자 충격 매개 전달), 또는 아그로박테리움(agrobacterium) 매개 형질전환을 포함하는 다수의 수단 중 임의의 하나에 의해 달성될 수 있다.
"벡터(vector)"는 일반적으로 유기체, 세포 또는 세포 성분 사이에서 증식 및/또는 전달될 수 있는 폴리뉴클레오티드를 지칭한다. 벡터에는 바이러스(viruses), 박테리오파지(bacteriophage), 프로-바이러스(pro-viruses), 플라스미드(plasmids), 파지미드(phagemids), 트랜스포존(transposons) 및 YAC(효모 인공 염색체), BAC(박테리아 인공 염색체) 및 PLAC(식물 인공 염색체)와 같은 인공 염색체가 포함되며, 이는 "에피솜(episomes)" 즉, 자율적으로 복제하거나 숙주 세포의 염색체에 통합될 수 있다. 벡터는 또한 네이키드(naked) RNA 폴리뉴클레오타이드, 네이키드 DNA 폴리뉴클레오티드, 동일한 가닥 내에서 DNA와 RNA 모두로 구성된 폴리뉴클레오티드, 폴리-리신-접합 DNA 또는 RNA, 펩타이드 결합 DNA 또는 RNA, 리포솜 결합 DNA 등, 본질적으로 에피솜이 아니거나, 아그로박테리움 또는 박테리아와 같은 상기 폴리뉴클레오티드 구성물 중 하나 이상을 포함하는 유기체일 수 있다.
발현 벡터의 다양한 성분은 벡터의 의도된 용도 및 벡터가 발현을 복제하거나 유도하도록 의도된 숙주 세포(들)에 따라 광범위하게 변할 수 있다. E. coli, 효모, 스트렙토마이세스 및 기타 일반적으로 사용되는 세포에서 유전자의 발현 및 벡터의 유지에 적합한 발현 벡터 성분은 널리 알려져 있고 상업적으로 입수 가능하다. 예를 들어, 본 개시내용의 발현 벡터에 포함시키기에 적합한 프로모터는 진핵생물 또는 원핵생물 숙주 미생물에서 기능하는 것을 포함한다. 프로모터는 숙주 미생물의 성장과 관련된 발현의 조절을 가능하게 하거나 화학적 또는 물리적 자극에 반응하여 유전자의 발현이 켜지거나 꺼지도록 하는 조절 서열을 포함할 수 있다. E. coli 및 특정 다른 박테리아 숙주 세포의 경우, 프로모터는 생합성 효소, 항생재-내성 부여 효소의 유전자로투 유래되고, 파지 단백질을 사용할 수 있으며, 예를 들어, 갈락토오스(galactose), 락토오스(lactose, lac), 말토오스(maltose), 트립토판(tryptophan, trp), 베타-락타마제(beta-lactamase, bla), 박테리오파지 람다(bacteriophage lambda) PL 및 T5 프로모터를 포함한다. 또한, tac 프로모터(미국 특허 제4,551,433호, 전문이 본원에 참고로 인용됨)와 같은 합성 프로모터가 사용될 수 있다. 대장균 발현 벡터의 경우, pUC, p1P, p1 및 pBR과 같은 E. coli 복제 기점을 포함하는 것이 유용하다.
또한, 재조합 발현 벡터는 하나 이상의 발현 시스템을 함유하고, 이는 차례로 프로모터에 작동가능하게 연결된 유전자 코딩 서열의 적어도 일부 및 임의적으로 호환가능한 숙주 세포에서 코딩 서열의 발현을 수행하도록 작동하는 종결 서열로 구성된다. 숙주 세포는 발현 시스템 서열을 염색체외 요소로서 함유하거나 염색체 내로 통합되도록 본 개시내용의 재조합 DNA 발현 벡터를 사용한 형질전환에 의해 변형된다.
본 개시내용은 시험관내 시스템에서 사용하기 위한 재조합 미생물 및 단백질의 생성에 유용한 다양한 유전자, 상동체 및 변이체에 대한 기탁 번호 및 서열을 제공한다. 본 명세서에 기재된 상동체 및 변이체는 예시적이며 비제한적인 것으로 이해되어야 한다. 추가 상동체, 변이체 및 서열은 예를 들어 World-Wide-Web에서 액세스할 수 있는 NCBI(National Center for Biotechnology Information) 액세스를 포함하는 다양한 데이터베이스를 사용하여 당업자가 사용할 수 있다.
본원에 사용된 임의의 폴리펩티드에 대해 사용되거나 치환될 수 있는 상동체 및 동종효소를 확인하기 위해 본원에 기재된 서열 및 수탁 번호를 이용하는 것은 당업계의 기술 수준 이내이다. 사실, 본원에 제공된 서열 중 임의의 하나의 BLAST 검색은 다수의 관련된 상동체를 식별할 것이다.
본 출원에 수반되는 서열 목록은 본 명세서에 기재된 방법에 유용한 예시적인 폴리펩티드를 제공한다. 비-기능적 또는 비-암호화 서열(예를 들어, 폴리HIS 태그)의 추가와 같이 폴리펩티드 분자의 활성을 변경하지 않는 서열의 추가는 기본 분자의 보존적 변이인 것으로 이해된다.
칸나비노이드(Cannabinoids)는 항구토제(antiemetics), 항경련제(anticonvulsants), 항우울제(antidepressants), 항암제(anticancer) 및 진통제(analgesics)와 같은 100개 이상의 진행 중인 임상 시험을 통해 엄청난 치료 잠재력을 보여준다. 그럼에도 불구하고 프레닐-천연 제품의 치료 가능성에도 불구하고 비용 효율적인 생산 방법의 부족으로 인해 연구 및 사용이 제한된다. 식물성 칸나비노이드 제조에 대한 두 가지 주요 대안은 유기 합성 및 대사적으로 조작된 숙주(예: 식물, 효모 또는 박테리아)에서 제조하는 것이다. THCA 및 CBDA와 같은 일부 칸나비노이드의 제조에 대한 총 합성이 설명되었지만 종종 약물 제조에 실용적이지 않다. 또한, 합성 접근 방식은 모듈식 방식이 아니므로 각 칸나비노이드에 대해 고유한 합성이 필요하다. 천연 생합성 경로를 사용하여 모듈식 접근 방식을 달성할 수 있다.
세 가지 주요 칸나비노이드(THCA, CBDA 및 칸니비크로멘(cannibichromene) 또는 CBCA)는 단일 전구체인 CBGA에서 유래된다. 또한 CBGVA에서 3가지 낮은 존재 칸나비노이드가 유래된다(도 1). 따라서, 이종 숙주에서 CBGA 및 CBGVA를 제조하는 능력은 칸나비노이드 어레이(array) 제조의 문을 열 것이다. 불행히도 CBGA 및 CBGVA를 제조하기 위한 미생물 공학은 매우 어려운 것으로 판명되었다.
칸나비노이드는 주요 빌딩 블록(key building blocks)인 제라닐 피로포스페이트(geranyl pyrophosphate, GPP) 및 올리브톨산(olivetolic acid, OA)을 생성하는 지방산(fatty acid), 폴리케타이드(polyketide) 및 테르펜 생합성 경로(terpene biosynthetic pathways)의 조합에서 유래된다(도 1). 높은 수준의 CBGA 생합성은 길고 필수적이며 고도로 조절된 경로의 재-라우팅(re-routing)을 필요로 한다. 더욱이 GPP는 세포에 독성이 있어 미생물에서 높은 수준의 생산에 눈에 띄는 장벽을 만든다.
복잡한 생화학적 전환이 효소 혼합물을 사용하여 무세포로 수행되는 합성 생화학은 다음과 같은 전통적인 대사 공학에 비해 잠재적인 이점을 제공한다: 경로 설계의 더 높은 수준의 유연성; 구성 요소 최적화에 대한 더 나은 제어; 보다 빠른 설계-구축-테스트 주기; 및 중간체 또는 제품의 세포 독성이 없음. 본 개시내용은 칸나비노이드 생산을 위한 무세포 시스템을 제공한다. "전체(full)" 경로는 무세포 시스템에 있을 필요가 없고(즉, 경로의 일부는 세포에서 수행될 수 있고 그 제품은 무세포 시스템에 제공될 수 있음) 또는 그 반대의 경우도 마찬가지이다.
본 개시내용은 칸나비노이드 제조를 위한 효소 변이체 및 이러한 변이체를 포함하는 경로를 제공한다. 또한, 본원에 기술된 생합성 경로는 "퍼지 밸브(purge valves)" 또는 "재생 밸브(regeneration valves)"를 사용하여 보조 인자 가용성을 조절한다(예: ATP, NADH/NAD+ 및 NADPH/NADP+ 수준).
본 개시내용은 중앙 칸나비노이드 CBGVA 및 CBGA(본원에서 약어 CBG(V)A)의 제조를 위한 무세포 시스템을 제공하는데, 그 이유는 많은 다른 주요 칸나비노이드가 단일의 잘 확립된 효소 단계에서 CBG(V)A로부터 얻어질 수 있기 때문이다(도 1). 본 개시내용의 대사 경로는 다양한 모듈로 분해될 수 있다. 이소프레노이드(Isoprenoid, ISO) 모듈은 단순화된 이소프레노이드 경로를 사용하여 이소프레놀로부터 제라닐 피로포스페이트(geranyl pyrophosphate, GPP)를 구축한다. 방향족 폴리케타이드(Aromatic Polyketide, AP) 모듈은 삽입(inputs) 말로네이트(malonate) 및 헥사노에이트(hexanoate)(또는 부티레이트(butyrate))를 올리브톨산(olivetolic acid, OA) 또는 디바린산(divarinic acid, DA)으로 변환한다. 다른 지방산 삽입물도 관련 방향족 폴리케타이드를 만들기 위해 활용될 수 있다. 칸나비노이드(Cannabinoid, CAN) 모듈은 ISO 모듈에서 GPP를 수신하고 AP 모듈에서 OA/DA를 프레닐화하여 중앙 칸나비노이드 CBG(V)A를 생성한다. 전체 시스템은 ATP 재생(AR) 모듈에서 만들어진 ATP에 의해 구동된다. 아세틸 포스페이트(Acetyl phosphate, AcP)는 아세트산 무수물(acetic anhydride) 및 인산(phosphoric acid)으로 저렴하게 만들 수 있기 때문에 ATP 재생을 위한 희생 기질로 사용되었다. 희생(sacrificial) 기질을 사용하여 ATP를 생성하는 다른 방법이 사용될 수 있으며 문헌에 잘 알려져 있다(예를 들어, Zhao H, et al., "Regeneration of cofactors for use in biocatalysis," Curr Opin Biotechnol. 14(6):583-9, 2003 참조).
ATP 요구량을 줄이기 위해, 경로는 "재생 밸브(regeneration valve)"로 말로닐(malonyl)-CoA 생산을 위한 비-천연 경로(non-natural route)를 사용한다. 일반적으로 말로네이트(malonate)로부터 말로닐-CoA 생성은 효소 말로닐-CoA 합성효소의 작용을 통해 사용된 말로네이트당 2 ATP 등가물을 필요로 한다(MatB; 서열번호16 또는 적어도 85% 동일성을 갖는 서열, 예를 들어, 85%, 87%, 90%, 92%, 95%, 98%, 99% 또는 100%). 생산된 OA/DA당 3개의 말로네이트가 필요하기 때문에 말로네이트 활성화에 대한 ATP 기여는 6ATP이다. ATP 요구량을 낮추기 위해, 본 개시내용은 티오에스테르(thioester) 이동이 열역학적으로 유리해야 하기 때문에 아세틸-CoA에서 말로네이트로 CoA를 직접 이동시켜 아세테이트(acetate) 및 말로닐-CoA를 만드는 방법을 제공한다. 아세틸-CoA는 포스포트랜스아세틸라제(phosphotransacetylase)와 함께 입력 AcP에서 직접 유래될 수 있기 때문에 이 접근 방식은 OA/DA당 3 ATP 등가물을 절약할 수 있다. 전이효소 반응을 수행하는 천연 효소는 없지만, 말로네이트 탈탄산효소(malonate decarboxylase, MdcA) 효소의 분리된 α 소단위는 분리되어 발현될 때 우연히 이 반응을 촉매할 수 있다. 따라서, 본 개시내용은 MdcA(또는 이의 상동체; 서열번호 6 또는 그에 대해 적어도 50% 이상의 서열 동일성을 갖는 서열)를 전체 경로 설계에 통합한다.
합성 생화학 접근법이 도 1에 요약되어 있다. 하나의 실시예에서, GPP는 이소프레놀(isoprenol) 또는 프레놀(prenol)에서 유래된다. 하나의 실시예에서, GPP는 이소프레놀에서 유래된다. 추가 실시예에서, GPP에 대한 이소프레놀 경로는 ATP 재생 시스템과 연결된다. 예를 들어, 경로는 크레아틴 키나제 ATP 생성 시스템(creatine kinase ATP generating system); 아세테이트 키나제 시스템(acetate kinase system); 해당 시스템(glycolysis system) 뿐만 아니라 다른 시스템과도 연결될 수 있다. 하나의 실시예에서, ATP 재생 시스템은 아세테이트 키나아제를 포함한다. 도 1의 효소(핵산 코딩 서열 및 폴리펩티드)는 서열 번호 54-65에서 제공된다(예를 들어, PRK 효소는 서열번호 54-57에서 제공되고; IPK 효소는 서열번호 58-61에서 제공되며; IDI 효소는 서열번호 20-27 및 62-63에서 제공되며; 및 FPPS 효소는 서열번호 64-65에서 제공된다).
NphB는 방향족 기질에 대한 10-탄소 게라닐 그룹(10-carbon geranyl group)의 부착을 촉매하는 방향족 프레닐트랜스퍼라제(aromatic prenyltransferase)이다. NphB는 풍부한 기질 선택성과 제품 위치 선택성을 나타낸다. 스트렙토마이세스(Streptomyces)에서 확인된 NphB는 여러 개의 작은 유기 방향족 기질에 10개 탄소의 게라닐 그룹을 추가하는 것을 촉매한다. NphB는 두 개의 기질 분자인 GPP(게라닐 디포스페이트(geranyl diphosphate))와 1,6-디히드록시나프탈렌(1,6-dihydroxynaphthalene, 1,6-DHN)이 결합될 수 있는 넓고 용매 접근이 가능한 결합 포켓을 가지고 있다. GPP는 Mg2 + 외에 Lys119, Thr/Gln171, Arg228, Tyr216 및 Lys284를 비롯한 여러 아미노산 사이드 체인과 음전하를 띤 디포스페이트 모이어티(diphosphate moiety) 사이의 상호작용을 통해 안정화된다. NphB의 활성에는 Mg2 + 보조인자가 필요하다. 스트렙토마이세스(Streptomyces)로부터의 NphB는 서열번호 30에 제시된 바와 같은 서열을 갖는다.
NovQ(수탁 번호 AAF67510, 본 명세서에 참고로 포함됨)는 프레닐트랜스퍼라제(prenyltransferases)의 CloQ/NphB 부류의 구성원이다. novQ 유전자는 아미노쿠마린 항생제(aminocoumarin antibiotic)인 노보비오신(novobiocin)을 생산하는 스트렙토마이세스 니베우스(Streptomyces niveus)에서 복제할 수 있다. 재조합 NovQ는 대장균에서 발현되고 균질하게 정제될 수 있다. 정제된 효소는 노보비오신의 중간체인 3-dimethylallyl-4-HPP(3-디메틸알릴-4-HPP)를 생성하기 위해 2가 양이온과 무관하게 디메틸알릴 그룹(dimethylallyl group)을 4-하이드록시페닐피루베이트(4-hydroxyphenylpyruvate, 4-HPP)로 전환하는 것을 촉매하는 가용성 단량체 40kDa 단백질이다. 4-HPP의 프레닐화(prenylation) 외에도, NovQ는 페닐프로파노이드(phenylpropanoids), 플라보노이드(flavonoids) 및 디하이드록시나프탈렌(dihydroxynaphthalenes)의 다양한 컬렉션의 탄소-탄소 기반 및 탄소-산소 기반 프레닐화를 촉매했다. 그것의 촉매적 난잡함에도 불구하고 NovQ-촉매된 프레닐화는 지역특이적인 방식으로 발생했다. NovQ는 p-쿠마르산(p-coumaric acid) 및 카페인산(caffeic acid)과 같은 페닐프로파노이드(phenylpropanoid) 및 플라보노이드(flavonoid)의 B-ring으로 디메틸알릴(dimethylallyl) 그룹의 전이를 촉매할 수 있는 최초의 보고된 프레닐트랜스퍼라제(prenyltransferase)이다. NovQ는 프레닐화 페닐프로파노이드(prenylated phenylpropanoids) 및 프레닐화 플라보노이드(prenylated flavonoids) 합성에 유용한 생체 촉매 역할을 할 수 있다.
아스페르길루스 테레우스(Aspergillus terreus) 방향족 프레닐트랜스퍼라제(prenyltransferase)(AtaPT; 수탁 번호 AMB20850, 본원에 참고로 포함됨)는 다양한 방향족 화합물의 프레닐화를 담당한다. 재조합 AtaPT는 대장균에서 과발현되어 정제될 수 있다. 아스페르길루스 테레우스 방향족 프레닐트랜스퍼라제(Aspergillus terreus aromatic prenyltransferase, AtaPT)는 다양한 프레닐 디포스페이트(prenyl diphosphates)의 존재하에 아실플로로글루시놀(acylphloroglucinols)의 C-모노프레닐화(C-monoprenylation)를 주로 촉매한다.
기질 특이성 및 안정성을 개선하기 위해 NphB에 대해 돌연변이 실험을 수행하였다. 본 개시내용은 서열번호 30 및 Y288X, A232S를 갖는 돌연변이 및 T69P, T98I 및 G224S로 구성된 군에서 선택된 돌연변이, 전술한 돌연변이 모두 또는 임의의 조합, 여기서 X는 A, N, S, V 또는 비-천연 아미노산이고; 서열번호 30 및 Y288X, A232S를 갖는 돌연변이 및 T69P, T98I, G224S 및 T126P로 구성된 군에서 선택된 돌연변이, 전술한 돌연변이 모두 또는 임의의 조합, 여기서 X는 A, N, S, V 또는 비-천연 아미노산이며; 서열번호 30 및 Y288X, A232S를 갖는 돌연변이 및 M14I, Y31W, T69P, T77I, T98I, S136A, E222D, G224S, N236T, G297K로 구성된 군에서 선택된 돌연변이, 전술한 돌연변이 모두 또는 임의의 조합, 여기서 X는 A, N, S, V 또는 비-천연 아미노산을 포함하는 NphB 돌연변이(NphB mutant)를 제공한다. 또 다른 실시예에서, 본 개시내용은 서열번호 30 및 Y288X, A232S를 갖는 돌연변이 및 M14I, Y31W, T69P, T77I, E80A, D93S, T98I, T126P, M129L, G131Q, S136A, E222D, G224S, N236T, S277T, G297K로 구성된 군에서 선택된 돌연변이, 전술한 돌연변이 모두 또는 임의의 조합, 여기서 X는 A, N, S, V 또는 비-천연 아미노산을 포함하는 NphB 돌연변이를 제공한다. 또 다른 실시예에서, 본 개시내용은 서열번호 30 및 Y288X, A232S를 갖는 돌연변이 및 M14I, L33I, Y31W, T69P, T77I, V78A, E80A, D93S, T98I, E112G, T114V, T126P, M129L, G131Q, S136A, E222D, G224S, K225Q, N236T, S277T, G297K로 구성된 군에서 선택된 돌연변이, 전술한 돌연변이 모두 또는 임의의 조합, 여기서 X는 A, N, S, V 또는 비-천연 아미노산을 포함하는 NphB 돌연변이를 제공한다.
따라서, 본 개시내용은 (i) 서열번호 30 및 Y288X, A232S를 갖는 돌연변이 및 T69P, T98I 및 G224S로 구성된 군에서 선택된 돌연변이, 전술한 돌연변이 모두 또는 임의의 조합, 여기서 X는 A, N, S, V 또는 비-천연 아미노산임(non-natural amino acid); (ii) 서열번호 30 및 Y288X, A232S를 갖는 돌연변이 및 T69P, T98I, G224S 및 T126P로 구성된 군에서 선택된 돌연변이, 전술한 돌연변이 모두 또는 임의의 조합, 여기서 X는 A, N, S, V 또는 비-천연 아미노산임; (iii) 서열번호 30 및 Y288X, A232S를 갖는 돌연변이 및 M14I, Y31W, T69P, T77I, T98I, S136A, E222D, G224S, N236T, G297K로 구성된 군에서 선택된 돌연변이, 전술한 돌연변이 또는 임의의 조합, 여기서 X는 A, N, S, V 또는 비-천연 아미노산임; (iv) 서열번호 30 및 Y288X, A232S를 갖는 돌연변이 및 M14I, Y31W, T69P, T77I, E80A, D93S, T98I, T126P, M129L, G131Q, S136A, E222D, G224S, N236T, S277T, G297K로 구성된 군에서 선택된 돌연변이, 전술한 돌연변이 모두 또는 임의의 조합, 여기서 X는 A, N, S, V 또는 비-천연 아미노산임; (v) 서열번호 30 및 Y288X, A232S를 갖는 돌연변이 및 M14I, L33I, Y31W, T69P, T77I, V78A, E80A, D93S, T98I, E112G, T114V, T126P, M129L, G131Q, S136A, E222D, G224S, K225Q, N236T, S277T, G297K로 구성된 군에서 선택된 돌연변이, 전술한 돌연변이 모두 또는 임의의 조합, 여기서 X는 A, N, S, V 또는 비-천연 아미노산임; (vi) (i)-(v) 1 내지 20개(예를 들어, 2, 5, 10, 15 또는 20개, 또는 1 내지 20개 사이의 임의의 값)의 보존적 아미노산 치환을 포함하고 NphB 활성을 갖는 임의의 것; (vii) (i) 내지 (v) 중 어느 하나의 서열과 적어도 85%, 90%, 95%, 98% 또는 99% 동일하고 NphB 활성을 갖는 서열을 포함하는 돌연변이 NphB 변이체를 제공한다.
다음은 다양한 돌연변이(모두 생물학적 효과를 가짐; 서열번호 40, 41, 42, 43, 44) 및 야생형 서열(서열번호 30)의 정렬을 제공한다.
본 개시내용의 변형/돌연변이 NphB 폴리펩타이드를 제조 및 단리하기 위한 재조합 방법이 본원에 기재되어 있다. 재조합 제조 외에도, 폴리펩타이드는 고체상 기술을 사용한 직접적인 펩타이드 합성에 의해 제조될 수 있다(예를 들어, Stewart et al. (1969) Solid-Phase Peptide Synthesis (WH Freeman Co, San Francisco); 및 Merrifield (1963) J. Am. Chem. Soc. 85: 2149-2154; 각각은 참조로 포함된다). 펩티드 합성은 수동 기술을 사용하거나 자동화를 통해 수행할 수 있다. 자동화된 합성은 예를 들어 제조사가 제공한 지침에 따라 Applied Biosystems 431A Peptide Synthesizer(Perkin Elmer, Foster City, CA)를 사용하여 달성할 수 있다.
본 명세서에 사용된 비천연 아미노산은 N-메틸아미노산(N-methyl amino acids)(예를 들어, N-메틸 L-알라닌(N-methyl L-alanine), N-메틸 L-발린(N-methyl L-valine) 등) 또는 알파-메틸아미노산(alpha-methyl amino acids), 베타-호모아미노산(beta-homo amino acids), 호모-아미노산(homo- amino acids) 및 D-아미노산(D-amino acids) 등 자연계에 존재하지 않는 아미노산을 말한다. 특정 실시예에서, 본 개시내용에 유용한 비천연 아미노산은 작은 소수성 비천연 아미노산을 포함한다(예: N-메틸 L-알라닌, N-메틸 L-발린 등).
또한, 본 개시내용은 본원에 기재된 임의의 NphB 변이체를 코딩하는 폴리뉴클레오티드를 제공한다. 유전자 코드의 퇴화(degeneracy)로 인해, 실제 코딩 서열은 다양할 수 있지만 NphB 돌연변이 및 변이체에 대해 언급된 폴리펩티드에 여전히 도달한다. 유전자 코드의 퇴화는 여전히 특정 폴리펩타이드를 인코딩하면서 폴리뉴클레오타이드 서열 사이의 퍼센트 동일성의 넓은 변이를 허용할 것이라는 것이 다시 쉽게 명백할 것이다. 아미노산 서열로부터 폴리뉴클레오티드 서열을 생성하는 것은 당업계에서 일상적이다.
본 개시내용은 또한 본 개시내용의 임의의 NphB 변이체 효소를 포함하는 재조합 숙주 세포 및 무세포 시스템을 제공한다. 일부 실시예에서, 재조합 세포 및 무세포 시스템이 프레닐화 과정을 수행하는 데 사용된다.
본 개시내용의 하나의 목적은 프레놀 및/또는 이소프레놀로부터 전구체 GPP를 제조하는 것이며, 이는 이어서 추가된 OA를 본 개시내용의 돌연변이체 NphB로 프레닐화하여 CBG(V)A를 제조하는 데 사용될 수 있다.
따라서, 본 개시내용은 프레놀 및/또는 이소프레날을 게라닐 피로포스페이트로 전환시키는 복수의 효소 단계를 포함하는 무세포 시스템을 제공한다. 하나의 실시예에서, 경로는 ATP 재생 모듈을 포함한다.
도 1에 도시된 바와 같이, 본 개시내용의 경로는 4개의 모듈을 포함한다. 첫 번째 모듈은 이소프레놀 또는 프레놀을 GPP로 전환시키는 이소프레노이드(isoprenoid) 모듈이다. 경로는 복수의 효소 단계를 포함한다. 예를 들어, 첫 번째 효소 반응에서 이소프레놀은 히드록시에틸티아졸 키나제(hydroxyethylthiazole kinase)(ThiM; EC 2.7.1.50)와 같은 키나제 활성을 갖는 효소에 의해 인산화되어 이소펜테닐 모노포스페이트(isopentenyl monophosphate, IP)를 형성한다. ThiM은 서열번호 2로 표시되는 폴리펩타이드 서열 또는 그에 대해 적어도 85%, 87%, 90%, 92%, 95%, 97% 또는 99% 동일성을 갖고 이소프레놀을 인산화할 수 있는 서열을 갖는다.
일부 실시예에서, 히드록시에틸티아졸 키나제는 서열번호 2에 대해 1 내지 약 20개 또는 1 내지 약 10개의 아미노산 변형을 포함한다. 일부 실시예에서, 히드록시에틸티아졸 키나제는 서열번호 2에 대해 1 내지 5개의 아미노산 변형을 포함한다. 일부 실시예에서, 히드록시에틸티아졸 키나제는 서열번호 2로 표시되는 아미노산 서열에 대해 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 또는 50 초과의 아미노산 변형을 포함한다. 일부 실시예에서, 히드록시에틸티아졸 키나제는 서열번호 2로 표시되는 아미노산 서열에 대해 적어도 1, 적어도 2, 적어도 3. 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 적어도 10, 적어도 11, 적어도 12, 적어도 13, 적어도 14, 적어도 15, 적어도 16, 적어도 17, 적어도 18, 적어도 19, 적어도 20, 적어도 21, 적어도 22, 적어도 23, 적어도 24, 적어도 25, 적어도 26, 적어도 27, 적어도 28, 적어도 29, 적어도 30, 적어도 35, 적어도 40, 또는 적어도 45개의 아미노산 변형을 포함한다. 아미노산 변형은 아미노산 치환, 삽입 및 결실로부터 독립적으로 선택될 수 있다.
경로의 두 번째 단계는 예를 들어, 이소펜테닐 포스페이트 키나제(isopentenyl phosphate kinase, IPK)에 의해 촉매화될 수 있다. IPK는 이소펜테닐 모노포스페이트(isopentenyl monophosphate)를 이소펜테닐 디포스페이트(isopentenyl diphosphate, IPP)로 전환시킨다. 몇 가지 이소펜테닐 포스페이트 키나제가 알려져 있지만, 일부 실시예에서, 재조합 이소펜테닐 포스페이트 키나제는 서열번호 59(메타노칼도코커스 잔나스키 IPK(Methanocaldococcus jannaschii IPK))의 아미노산 서열과 적어도 70% 동일한 아미노산 서열을 포함한다(M. themoacetophila 의 서열번호 61 참조). 일부 실시예에서, 재조합 이소펜테닐 포스페이트 키나제는 50%, 55%, 60%, 65%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95% 96%, 97%, 98%, 99%, 또는 100%, 또는 서열번호 59의 아미노산 서열과 동일한 상기 값 중 2개 사이의 임의의 범위이다. 일부 실시예에서, 재조합 효소는 서열번호 59의 아미노산 서열과 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 76%, 적어도 77%, 적어도 70%, 적어도 79%, 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일하다.
일부 실시예에서, 이소펜테닐 포스페이트 키나제는 서열번호 59에 대해 1 내지 약 20개 또는 1 내지 약 10개의 아미노산 변형을 포함한다. 일부 실시예에서, 이소펜테닐 포스페이트 키나제는 서열번호 59에 대해 1 내지 5개의 아미노산 변형을 포함한다. 일부 실시예에서, 이소펜테닐 포스페이트 키나제는 서열번호 59에 대해 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 또는 50개 초과의 아미노산 변형을 포함한다. 일부 실시예에서, 이소펜테닐 포스페이트 키나제는 서열번호 59의 아미노산 서열에 대해 적어도 1, 적어도 2, 적어도 3. 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 적어도 10, 적어도 11, 적어도 12, 적어도 13, 적어도 14, 적어도 15, 적어도 16, 적어도 17, 적어도 18, 적어도 19, 적어도 20, 적어도 21, 적어도 22, 적어도 23, 적어도 24, 적어도 25, 적어도 26, 적어도 27, 적어도 28, 적어도 29, 적어도 30, 적어도 35, 적어도 40, 또는 적어도 45개의 아미노산 변형을 포함한다. 아미노산 변형은 아미노산 치환, 삽입 및 결실로부터 독립적으로 선택될 수 있다.
이소프레노이드 모듈의 세 번째 효소 단계는 이소펜테닐 피로포스페이트 이소머라제(isopentenyl pyrophosphate isomerase, IDI) 활성을 갖는 효소를 사용하여 IPP를 디메틸알릴 이인산(dimethylallyl diphosphate, DMAPP)으로 또는 그 반대로 전환시키는 것을 포함한다. 이소펜테닐 피로포스페이트 이소머라제(IDI)는 박테리아 IDI 또는 효모 IDI일 수 있다. 일부 실시예에서, IDI는 IPP를 DMAPP 및/또는 DMAPP에서 IPP로 이성질체화(isomerizs)한다. 몇 가지 이소펜테닐 피로포스페이트 이소머라제가 알려져 있지만, 일부 실시예에서, 이소펜테닐 피로포스페이트 이소머라제는 서열번호 63(Escherichia coli IDI)의 아미노산 서열과 적어도 70% 동일한 아미노산 서열을 포함한다. 일부 실시예에서, 이소펜테닐 피로포스페이트 이소머라제는 50%, 55%, 60%, 65%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95% 96%, 97%, 98%, 99%, 또는 100%, 또는 서열번호 63의 아미노산 서열과 동일한 상기 값 중 2개 사이의 임의의 범위이다. 일부 실시예에서, 이소펜테닐 피로포스페이트 이소머라제는 서열번호 59의 아미노산 서열과 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 76%, 적어도 77%, 적어도 70%, 적어도 79%, 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일하다.
일부 실시예에서, 이소펜테닐 피로포스페이트 이소머라제는 서열번호 63에 대해 1 내지 약 20개 또는 1 내지 약 10개의 아미노산 변형을 포함한다. 일부 실시예에서, 이소펜테닐 피로포스페이트 이소머라제는 서열번호 63에 대해 1 내지 5개의 아미노산 변형을 포함한다. 일부 실시예에서, 이소펜테닐 피로포스페이트 이소머라제는 서열번호 63에 대해 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 또는 50개 초과의 아미노산 변형을 포함한다. 일부 실시예에서, 이소펜테닐 피로포스페이트 이소머라제는 서열번호 63의 아미노산 서열에 대해 적어도 1, 적어도 2, 적어도 3. 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 적어도 10, 적어도 11, 적어도 12, 적어도 13, 적어도 14, 적어도 15, 적어도 16, 적어도 17, 적어도 18, 적어도 19, 적어도 20, 적어도 21, 적어도 22, 적어도 23, 적어도 24, 적어도 25, 적어도 26, 적어도 27, 적어도 28, 적어도 29, 적어도 30, 적어도 35, 적어도 40, 또는 적어도 45개의 아미노산 변형을 포함한다. 아미노산 변형은 아미노산 치환, 삽입 및 결실로부터 독립적으로 선택될 수 있다.
이소프레노이드 모듈의 네 번째 효소 반응에서 게라닐 피로포스페이트(geranyl pyrophosphate, GPP)는 서열번호 65에 비해 S82F 돌연변이를 갖는 파르네실-PP 합성효소(farnesyl-PP synthase)의 존재하에 DMAPP 및 이소펜테닐 피로포스페이트(isopentenyl pyrophosphate, IPP)의 조합으로부터 형성된다. 일부 실시예에서, 파르네실-디포스페이트 합성효소는 S82F 돌연변이를 갖는 서열번호 65와 적어도 95%, 98%, 99% 또는 100% 동일한 서열을 갖고 DMAPP 및 이소펜틸 피로포스페이트로부터 게라닐 피로포스페이트를 형성할 수 있다.
일부 실시예에서, 파르네실-PP 합성효소는 서열번호 65에 대해 1 내지 약 20개 또는 1 내지 약 10개의 아미노산 변형을 포함한다. 일부 실시예에서, 파르네실-PP 합성효소는 서열번호 65에 대해 1 내지 5개의 아미노산 변형을 포함한다. 일부 실시예에서, 파르네실-PP 합성효소는 서열번호 65의 아미노산 서열에 대해 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 또는 50개 초과의 아미노산 변형을 포함한다. 일부 실시예에서, 파르네실-PP 합성효소는 서열번호 65의 아미노산 서열에 대해 적어도 1, 적어도 2, 적어도 3. 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 적어도 10, 적어도 11, 적어도 12, 적어도 13, 적어도 14, 적어도 15, 적어도 16, 적어도 17, 적어도 18, 적어도 19, 적어도 20, 적어도 21, 적어도 22, 적어도 23, 적어도 24, 적어도 25, 적어도 26, 적어도 27, 적어도 28, 적어도 29, 적어도 30, 적어도 35, 적어도 40, 또는 적어도 45개의 아미노산 변형을 포함한다. 아미노산 변형은 아미노산 치환, 삽입 및 결실로부터 독립적으로 선택될 수 있다.
이소프레놀의 GPP로의 전환은 ATP를 이용한다. 도 1의 경로는 아세틸 키나제(AckA)를 사용하여 아세틸 포스페이트 및 ADP를 아세트산 및 ATP로 전환하는 ATP 재생 모듈을 포함하는 두 번째 모듈을 포함한다. 경로에서, "ATP 재생" 모듈에 의해 생성된 ATP는 이소프레노이드 경로 및 방향족 폴리케타이드(polyketide) 모듈에서 사용할 수 있다. 아세테이트 키나제는 ackA에 의해 E.coli에서 인코딩된다. AckA는 아세틸-coA를 아세테이트로 전환하는 데 관여한다. 특히, ackA는 아세틸-포스페이트에서 아세테이트로의 전환을 촉매한다. AckA 동족체 및 변이체가 알려져 있다. NCBI 데이터베이스는 약 1450개의 폴리펩타이드를 박테리아 아세테이트 키나제로 나열한다. 예를 들어, 이러한 동족체 및 변이체는 아세테이트 키나제(Streptomyces coelicolor A3(2)) gi|21223784|ref|NP_629563.1|(21223784); 아세테이트 키나제(Streptomyces coelicolor A3(2)) gi|6808417|emb|CAB70654.1|(6808417); 아세테이트 키나제(Streptococcus pyogenes M1 GAS) gi|15674332|ref|NP_268506.1|(15674332); 아세테이트 키나제(Campylobacter jejuni subsp. jejuni NCTC 11168) gi|15792038|ref|NP_281861.1|(15792038); 아세테이트 키나제(Streptococcus pyogenes M1 GAS) gi|13621416|gb|AAK33227.1|(13621416); 아세테이트 키나제 (Rhodopirellula baltica SH 1) gi|32476009|ref|NP_869003.1|(32476009); 아세테이트 키나제(Rhodopirellula baltica SH1) gi|32472045|ref|NP_865039.1|(32472045); 아세테이트 키나제(Campylobacter jejuni subsp. jejuni NCTC 11168) gi|112360034|emb|CAL34826.1|(112360034); 아세테이트 키나제(Rhodopirellula baltica SH 1) gi|32446553|emb|CAD76388.1|(32446553); 아세테이트 키나제(Rhodopirellula baltica SH 1) gi|32397417|emb|CAD72723.1|(32397417); AckA(Clostridium kluyveri DSM 555) gi|153954016|ref|YP_001394781.1|(153954016); 아세테이트 키나제(Bifidobacterium longum NCC2705) gi|23465540|ref|NP_696143.1|(23465540); AckA(Clostridium kluyveri DSM 555) gi|146346897|gb|EDK33433.1|(146346897); 아세테이트 키나제(Corynebacterium diphtheriae) gi|38200875|emb|CAE50580.1|(38200875); 아세테이트 키나제(Bifidobacterium longum NCC2705) gi|23326203|gb|AAN24779.1|(23326203); 아세테이트 키나제(Acetokinase) gi|67462089|sp|P0A6A3.1|ACKA_ECOLI(67462089); 및 AckA(Bacillus licheniformis DSM 13) gi|52349315|gb|AAU41949.1|(52349315)를 포함하고, 이러한 수탁 번호와 관련된 서열은 본 명세서에 참조로 포함된다.
도 1은 제3 모듈인 "방향족 폴리케타이드 모듈"을 추가로 도시한다. 이 모듈은 올리브톨산(olivetolic acid, OA)을 생성한다. 일반적으로, 방향족 폴리케티드 OA 또는 DA는 헥사노에이트(hexanoate)(또는 부티레이트(butyrate)) 및 말로네이트에서 유래된다. 말로닐-CoA는 MdcA를 사용하여 아세틸-CoA에서 CoA의 비자연적 전달을 통해 말로네이트에서 생성된다.
제1 효소 단계에서 헥사노에이트(hexanoate) 또는 부티레이트(butyrate)는 아실 활성화 효소 3(acyl activating enzyme 3, AAE3)을 사용하여 헥사노일-CoA(hexanoyl-CoA)로 전환된다. 일부 실시예에서, AAE3 폴리펩티드는 서열번호 4로 표시되는 아미노산 서열을 포함한다. 일부 실시예에서, AAE 폴리펩타이드는 씨. 사 티바(C. sativa)로부터 수득된다. 또 다른 또는 추가 실시예에서, AAE3 폴리펩타이드는 서열번호 4에 대해서 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 적어도 99.5%, 적어도 99.6%, 적어도 99.7%, 적어도 99.8%, 적어도 99.9%, 또는 100% 아미노산 서열 동일성을 갖는 아미노산 서열을 포함한다(또한 서열번호 66-69의 상동 서열 참조).
일부 실시예에서, 아실 활성화 효소 3(AAE3)은 서열 번호 4에 대해 1 내지 약 20개 또는 1 내지 약 10개의 아미노산 변형을 포함한다. 일부 실시예에서, 아실 활성화 효소 3(AAE3)은 서열 번호 4에 대해 1 내지 5개의 아미노산 변형을 포함한다. 일부 실시예에서, 아실 활성화 효소 3(AAE3)은 서열번호 4의 아미노산 서열에 대해 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 또는 50개 초과의 아미노산 변형을 포함한다. 일부 실시예에서, 아실 활성화 효소 3(AAE3)은 서열번호 4의 아미노산 서열에 대해 적어도 1, 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 적어도 10, 적어도 11, 적어도 12, 적어도 13, 적어도 14, 적어도 15, 적어도 16, 적어도 17, 적어도 18, 적어도 19, 적어도 20, 적어도 21, 적어도 22, 적어도 23, 적어도 24, 적어도 25, 적어도 26, 적어도 27, 적어도 28, 적어도 29, 적어도 30, 적어도 35, 적어도 40, 또는 적어도 45개의 아미노산 변형을 포함한다. 아미노산 변형은 아미노산 치환, 삽입 및 결실로부터 독립적으로 선택될 수 있다.
폴리케타이드 모듈(polyketide module)의 두 번째 효소 단계에서 말로네이트(malonate) 및 아세틸-CoA는 말로네이트 데카르복실라제 활성(malonate decarboxylase activity)을 갖는 효소의 서브유닛을 사용하여 말로닐-coA로 전환된다. 하나의 실시예에서, 말로네이트 데카르복실라제는 말로네이트 데카르복실라제의 알파 서브유닛을 포함한다. 또 다른 또는 추가의 실시예에서, 말로네이트 데카르복실라제 알파 서브유닛(malonate decarboxylase alpha subunit, MdcA)은 Geobacillus sp에서 수득된다. 또 다른 실시예에서, MdcA는 서열번호 6에 대해 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 적어도 99.5%, 적어도 99.6%, 적어도 99.7%, 적어도 99.8%, 적어도 99.9%, 또는 100% 아미노산 서열 동일성을 갖고 coA를 말로네이트로 전달할 수 있는 아미노산 서열을 포함한다.
일부 실시예에서, 말로네이트 데카르복실라제 알파 서브유닛(MdcA)은 서열번호 6에 대해 1 내지 약 20개 또는 1 내지 약 10개의 아미노산 변형을 포함한다. 일부 실시예에서, 말로네이트 데카르복실라제 알파 서브유닛(MdcA)은 서열번호 6에 대해 1 내지 5개의 아미노산 변형을 포함한다. 일부 실시예에서, 말로네이트 데카르복실라제 알파 서브유닛(MdcA)은 서열번호 6의 아미노산 서열에 대해 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 또는 50개 초과의 아미노산 변형을 포함한다. 일부 실시예에서, 말로네이트 데카르복실라제 알파 서브유닛(MdcA)은 서열번호 6의 아미노산 서열에 대해 적어도 1, 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 적어도 10, 적어도 11, 적어도 12, 적어도 13, 적어도 14, 적어도 15, 적어도 16, 적어도 17, 적어도 18, 적어도 19, 적어도 20, 적어도 21, 적어도 22, 적어도 23, 적어도 24, 적어도 25, 적어도 26, 적어도 27, 적어도 28, 적어도 29, 적어도 30, 적어도 35, 적어도 40, 또는 적어도 45개의 아미노산 변형을 포함한다. 아미노산 변형은 아미노산 치환, 삽입 및 결실로부터 독립적으로 선택될 수 있다.
폴리케타이드 모듈은 아세틸-포스페이트 및 coA를 아세틸-coA로 전환하는 제3 효소 단계를 포함한다. 효소 단계는 아세틸-CoA + 포스페이트에서 CoA + 아세틸 포스페이트로 또는 그 반대로의 화학 반응을 촉매하는 포스페이트 아세틸트랜스퍼라제(phosphate acetyltransferase, PTA)(EC 2.3.1.8)를 사용한다. 포스페이트 아세틸트랜스퍼라제는 G. 스테아로테르모필루스 (G. stearothermophilus )(서열번호 8; 수탁번호 WP_053532564)에서 암호화된다. PTA 동족체 및 변이체가 알려져 있다. NCBI에는 약 1075개의 박테리아 포스페이트 아세틸트랜스퍼라제가 있다. 예를 들어, 이러한 동족체 및 변이체는 포스페이트 아세틸트랜스퍼라제 Pta(Rickettsia felis URRWXCal2) gi|67004021|gb|AAY60947.1|(67004021); 포스페이트 아세틸트랜스퍼라제(Buchnera aphidicola str. Cc(Cinara cedri)) gi|116256910|gb|ABJ90592.1|(116256910); pta(Buchnera aphidicola str. Cc(Cinara cedri)) gi|116515056|ref|YP_802685.1|(116515056); pta (Wigglesworthia glossinidia endosymbiont of Glossina brevipalpis) gi|25166135|dbj|BAC24326.1|(25166135); Pta (Pasteurella multocida subsp. multocida str. Pm70) gi|12720993|gb|AAK02789.1|(12720993); Pta (Rhodospirillum rubrum) gi|25989720|gb|AAN75024.1|(25989720); pta (Listeria welshimeri serovar 6b str. SLCC5334) gi|116742418|emb|CAK21542.1|(116742418); Pta (Mycobacterium avium subsp . paratuberculosis K-10) gi|41398816|gb|AAS06435.1|(41398816); 포스페이트 아세틸트랜스퍼라제 (pta) (Borrelia burgdorferi B31) gi|15594934|ref|NP_212723.1|(15594934); 포스페이트 아세틸트랜스퍼라제 (pta) (Borrelia burgdorferi B31) gi|2688508|gb|AAB91518.1|(2688508); 포스페이트 아세틸트랜스퍼라제 (pta) (Haemophilus influenzae Rd KW20) gi|1574131|gb|AAC22857.1|(1574131); 포스페이트 아세틸트랜스퍼라제 Pta (Rickettsia bellii RML369-C) gi|91206026|ref|YP_538381.1|(91206026); 포스페이트 아세틸트랜스퍼라제 Pta (Rickettsia bellii RML369-C) gi|91206025|ref|YP_538380.1|(91206025); 포스페이트 아세틸트랜스퍼라제 pta (Mycobacterium tuberculosis F11) gi|148720131|gb|ABR04756.1|(148720131); 포스페이트 아세틸트랜스퍼라제 pta (Mycobacterium tuberculosis str. Haarlem) gi|134148886|gb|EBA40931.1|(134148886); 포스페이트 아세틸트랜스퍼라제 pta (Mycobacterium tuberculosis C) gi|124599819|gb|EAY58829.1|(124599819); 포스페이트 아세틸트랜스퍼라제 Pta (Rickettsia bellii RML369-C) gi|91069570|gb|ABE05292.1|(91069570); 포스페이트 아세틸트랜스퍼라제 Pta (Rickettsia bellii RML369-C) gi|91069569|gb|ABE05291.1|(91069569); 포스페이트 아세틸트랜스퍼라제 (pta) (Treponema pallidum subsp. pallidum str. Nichols) gi|15639088|ref|NP_218534.1|(15639088); 및 p포스페이트 아세틸트랜스퍼라제 (pta) (Treponema pallidum subsp. pallidum str. Nichols) gi|3322356|gb|AAC65090.1|(3322356)를 포함하고, 수탁 번호와 관련된 각 서열은 그 전체가 본 명세서에 참고로 포함된다.
폴리케타이드 모듈은 올리브톨산(olivetolic acid, OA)으로의 효소적 전환에서 기질로서 헥사노일-CoA 및 말로닐-CoA를 사용한다. 경로는 예를 들어 C. 사티바 (C. sativa)올리브톨 합성효소(olivetol synthase, OLS)(BAG14339.1; 서열번호 10; 서열번호 70-73 또한 참조)에 의한 초기 프라이머로서의 헥사노일-CoA 및 익스텐더 단위(extender unit)로서의 말로닐-CoA의 축합으로 시작하여 3,5,7-트리옥소도데카노일-CoA(3,5,7-trioxododecanoyl-CoA)를 생성한다. 그런 다음 C. 사티바(C. sativa) 올리브톨산 사이클라제(Olivetolic acid cyclase, OAC)(AFN42527.1, 서열번호 12 또는 활성을 향상시키는 잔기의 비보존적 치환을 포함하는 여러 돌연변이, 서열번호 74-75 참조)는 3,5,7-트리옥소도데카노일-CoA(3,5,7-trioxododecanoyl-CoA)를 올리브 톨산(Olivetolic acid)으로 고리화한다.
일부 실시예에서, 올리브톨 합성효소(OLS) 및/또는 올리브톨산 사이클라제(OAC)는 서열번호 10 또는 12에 대해 각각 1 내지 약 20개 또는 1 내지 약 10개의 아미노산 변형을 포함한다. 일부 실시예에서, OAC 및/또는 OLS는 각각 서열번호 10 또는 12에 대해 1 내지 5개의 아미노산 변형을 포함한다. 일부 실시예에서, OAC 및/또는 OLS는 각각 서열번호 10 또는 12의 아미노산 서열에 대해 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 또는 50개 초과의 아미노산 변형을 포함한다. 일부 실시예에서, OAC 및/또는 OLS는 각각 서열번호 10 또는 12에 대해 적어도 1, 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 적어도 10, 적어도 11, 적어도 12, 적어도 13, 적어도 14, 적어도 15, 적어도 16, 적어도 17, 적어도 18, 적어도 19, 적어도 20, 적어도 21, 적어도 22, 적어도 23, 적어도 24, 적어도 25, 적어도 26, 적어도 27, 적어도 28, 적어도 29, 적어도 30, 적어도 35, 적어도 40, 또는 적어도 45개의 아미노산 변형을 포함한다. 아미노산 변형은 아미노산 치환, 삽입 및 결실로부터 독립적으로 선택될 수 있다.
GPP는 프레닐-플라바노이드(prenyl-flavanoids), 게라닐-플라바노이드(geranyl-flavanoids), 프레닐-스틸베노이드(prenyl-stilbenoids), 게라닐-스틸베노이드(geranyl-stilbenoids), CBGA, CBGVA, CBDA, CBDVA, CBCA, CBCVA, THCA 및 THCVA로 이어지는 다수의 경로에 대한 기질로서 사용될 수 있다(예를 들어, 도 1 참조).
예를 들어, 위에서 설명한 NphB 돌연변이를 가지고 GPP와 OA로부터 CBG(V)A를 생산하는 능력을 수행했다. 노난 오버레이(Nonane overlay)는 CBGA를 추출하는 반응에 사용할 수 있고, CBGA는 노난보다 물에 더 잘 녹기 때문에 단순한 오버레이로 추출할 수 있는 CBGA의 양이 제한된다. 따라서 노난 층에서 CBGA를 포착하고 별도의 물 저장소에 가두는 흐름 시스템을 사용할 수 있다. 이 흐름 시스템을 구현함으로써 효소 침전을 완화하기 위해 반응 용기에서 더 낮은 농도의 CBGA를 유지할 수 있다.
본 개시내용은 하나의 실시예에서, GPP의 생산을 위한 무세포 시스템을 제공한다. 추가로 본 개시내용은 본 개시내용의 돌연변이 NphB에 대한 기질을 사용함으로써 돌연변이 NphB를 포함하나 이에 제한되지 않는 프레닐화 효소와 조합된 GPP 경로를 사용하여 순수한 칸나비노이드 및 기타 프레닐화 천연 생성물의 어레이의 생산을 위한 무세포 접근법을 제공한다. 이 방법의 성공은 본 개시내용의 조작된 프레닐트랜스퍼라제(예를 들어, 상기 기재된 바와 같은 NphB 돌연변이체)를 사용하는데, 이는 활성이고, 안정적이며, 특이적이었고 천연 막횡단(transmembrane) 프레닐트랜스퍼라제의 필요성을 제거하였다. 여기에 제공된 합성 생화학 플랫폼의 모듈성과 유연성은 바이오 기반 접근 방식의 이점을 갖지만 만족스러운 생활 시스템의 복잡성을 제거한다. 예를 들어, GPP 독성은 설계 과정에서 고려되지 않았다. 또한, OA는 효모에 의해 흡수되지 않으므로 외인성으로 추가하는 접근 방식이 세포에서 반드시 가능한 것은 아니다. 실제로, 무세포 시스템의 유연성은 추가 최적화, 추가 경로 효소 및 시약 및 보조 인자 수정에 필요한 설계-구축-시험 주기를 크게 촉진할 수 있다.
도 1의 전체 경로로 돌아가서, 본 개시내용은 "기질(substrate)"을 생성물로 전환시키기 위해 효소에 의해 촉매되는 다수의 단계를 제공한다. 어떤 경우에는 단계에서 보조 인자를 사용할 수 있지만 일부 단계에서는 보조 인자를 사용하지 않는다예: NAD(P)H, ATP/ADP 등). 표 1은 수탁 번호(이러한 수탁 번호와 관련된 서열은 참조로 본 명세서에 포함됨) 뿐만 아니라 효소(상기 및 본 명세서의 다른 곳에서 기술된 것에 추가하여), 유기체 및 반응량의 목록을 제공한다.
효소 약어 | 전체 이름 Full Name |
소스 유기체 Source Organism |
NCBI 수탁번호 NCBI Accession # |
AAE3 | 아실 활성화 효소 3 Acyl Activating Enzyme 3 |
C. sativa | AFD33347.1 |
MatB | 말로닐-CoA 합성효소 Malonyl-CoA Synthetase |
R. plaustris | CAE25665.1 |
MdcA | 말로네이트 데카르복실라제 알파 서브유닛 Malonate Decarboxylase αsubunit |
Geobacillus sp . 44B | OQO99201.1 |
PTA | 포스포트랜스아세틸라제 Phosphotransacetylase |
G. stearothermophilus | WP_053532564 |
OLS | 올리브톨 합성효소 Olivetol Synthase |
C. sativa | BAG14339.1 |
OAC | 올리브톨산 사이클라제 Olivetolic Acid Cyclase |
C. sativa | AFN42527.1 |
ADK | 아데닐레이트 키나제 Adenylate Kinase |
G. thermodenitrificans | ABO65513 |
Ppase | 피로포스파타제 Pyrophosphatase |
G. stearothermophilus | O05724 |
CPK | 크레아틴 키나제 Creatine Kinase |
Rabbit Muscle | Sigma Aldrich |
ThiM | 하이드록시에틸티아졸 키나제 Hydroxyethylthiazole kinase |
E. coli | NP_416607 |
IPK | 이소펜테닐 키나제 Isopentenyl Kinase |
M. jannaschii | WP_01069535 |
IDI | 이소펜틸 디포스페이트 이소머라제 Isopentyl diphosphate isomerase |
E. coli | NP_417365 |
FPPS S82F | 파르네실 피로포스파트 합성효소 Farnesyl Pyrophosphat Synthase |
G. stearothermophilus | KOR95521 |
NphB M31S ** | 방향족 프레닐트랜스퍼라제 Aromatic prenyltransferase |
Streptomyces sp . CL190 | BAE00106.1 |
** 보고된 NCBI 수탁 번호는 WT NphB 효소에 대한 것이다. NphB M31S 서열은 본 명세서의 다른 곳에서 설명된다.
상기 기재된 바와 같이, GPP에 의한 올리브톨레이트의 프레닐화는 본원 및 상기 기재된 돌연변이체 NphB 폴리펩타이드의 활성에 의해 수행된다.
도 1은 경로를 다양한 "모듈(modules)"(예: 이소프레노이드 모듈(isoprenoid module), 칸나비노이드 모듈(cannabinoid module), 폴리케타이드 모듈(polyketide module)로 묘사한다. 예를 들어, 이소프레노이드 모듈은 단순화된 이소프레노이드 경로를 통해 이소프레놀로부터 이소프레노이드 제라닐 피로포스페이트(geranyl pyrophosphate, GPP)를 생성한다. 방향족 폴리케타이드(Aromatic Polyketide, AP) 모듈은 삽입 말로네이트와 헥사노에이트(또는 부티레이트)를 올리브톨산(olivetolic acid, OA) 또는 디바린산(divarinic acid, DA)으로 변환한다. 칸나비노이드 모듈은 이소프레노이드 모듈과 폴리케타이드 모듈의 산물을 사용하여 칸나비게롤산을 생성한 다음 칸나비노이드 합성효소에 의해 최종 칸나비노이드로 전환된다.
본 개시내용은 시험관내에서 프레닐화 화합물을 생산하는 방법 및 더욱이, 칸나비노이드 및 칸나비노이드 전구체(예: CBGA, CBGVA 또는 CBGXA 여기서 'X'는 2,4-디히드록시벤조산 스캐폴드(2,4-dihydroxybenzoic acid scaffold)의 6번 위치에 있는 모든 화학 그룹을 나타냄)를 생산하기 위한 시험관내 방법을 제공한다. 하나의 실시예에서, 본 개시내용의 무세포 제제는 예를 들어 3가지 상이한 방법을 통해 제조될 수 있다. 제1 방법으로서, 본 명세서에 기재된 바와 같은 경로의 효소를 구입하여 적절한 완충액에서 혼합하고, 적절한 기질을 첨가하고 프레닐화 화합물 또는 칸나비노이드 또는 칸나비노이드 전구체(경우에 따라)의 생산에 적합한 조건 하에 인큐베이션한다. 일부 실시예에서, 효소는 지지체에 결합되거나 파지 디스플레이(phage display) 또는 기타 표면 발현 시스템에서 발현될 수 있으며, 예를 들어 대사 경로 주기의 지점에 해당하는 유체 경로에 고정될 수 있다.
제2 방법으로서, 경로의 하나 이상의 효소를 인코딩하는 하나 이상의 폴리뉴클레오티드는 효소가 발현되는 조건하에 하나 이상의 미생물에 클로닝된다. 이어서, 세포가 용해되고 세포로부터 유래된 하나 이상의 효소를 포함하는 용해된 제제가 적절한 완충제 및 기질(및 필요한 경우 경로의 하나 이상의 추가 효소)과 조합되어 프레닐화된 화합물 또는 칸나비노이드 또는 칸나비노이드 전구체를 생성한다. 대안적으로, 효소는 용해된 제제로부터 단리된 다음 적절한 완충액에서 재결합될 수 있다.
제3 방법으로서, 구입한 효소와 발현된 효소의 조합을 사용하여 적절한 완충액에 경로를 제공한다. 하나의 실시예에서, 경로의 열 안정화된 폴리펩티드/효소가 복제되고 발현된다. 하나의 실시예에서, 경로의 효소는 호열성 미생물(hermophilic microorganisms)에서 유래된다. 그런 다음 미생물이 용해되고, 경로의 열 안정화된 폴리펩티드가 활성이고 다른 폴리펩티드(관심 대상이 아닌)가 변성되어 불활성이 되는 온도로 제제를 가열한다. 이에 따라 제제는 미생물에 있는 모든 효소의 하위 집합을 포함하고 활성 열에 안정한 효소를 포함한다. 그런 다음 제제를 사용하여 프레닐화 화합물 또는 칸나비노이드 또는 칸나비노이드 전구체를 생성하는 경로를 수행할 수 있다.
예를 들어, 시험관 내 시스템을 구축하기 위해 모든 효소는 상업적으로 입수하거나 친화성 크로마토그래피로 정제하고 활성을 테스트하고 적절하게 선택된 반응 완충액에서 함께 혼합할 수 있다.
생체내 시스템은 또한 재조합 미생물을 얻기 위해 미생물로 조작된 생합성 경로에서 전술한 효소의 전부 또는 일부를 사용하는 것으로 고려된다.
본 개시내용은 또한 프레닐화된 화합물의 생산을 위한 돌연변이체 nphB를 포함하고 칸나비노이드의 생산을 위한 효소를 발현하는 하나 이상의 추가 미생물을 추가로 포함할 수 있는 대사적으로 조작된 생합성 경로를 포함하는 재조합 유기체를 제공한다(예를 들어, 부분 경로를 발현하는 미생물 한 세트와 경로의 추가 또는 최종 부분의 미생물 발현의 두 번째 세트의 공동 배양 등).
하나의 실시예에서, 본 개시내용은 부모 미생물에 비해 적어도 하나의 표적 효소의 상승된 발현을 포함하거나 부모 유기체에서 발견되지 않는 효소를 인코딩하는 재조합 미생물을 제공한다. 또 다른 또는 추가 실시예에서, 미생물은 원하는 대사 산물의 생산에 필요한 대사 산물과 경쟁하거나 원치 않는 산물을 생산하는 효소를 암호화하는 적어도 하나의 유전자의 감소, 파괴 또는 녹아웃을 포함한다. 재조합 미생물은 예를 들어 프레닐화 화합물 또는 칸나비노이드 또는 칸나비노이드 전구체의 생산을 위한 생합성 경로에 관여하는 하나 이상의 대사산물을 생산하는 효소를 발현한다. 일반적으로, 재조합 미생물은 표적 효소를 포함하는 적어도 하나의 재조합 대사 경로를 포함하고, 경쟁적 생합성 경로에서 효소의 활성 또는 발현의 감소를 추가로 포함할 수 있다. 경로는 예를 들어 프레닐화 화합물 또는 칸나비노이드 또는 칸나비노이드 전구체의 생산에서 기질 또는 대사 중간체를 변형시키는 작용을 한다. 표적 효소는 적합한 생물학적 공급원으로부터 유래된 폴리뉴클레오티드에 의해 코딩되고 그로부터 발현된다. 일부 실시예에서, 폴리뉴클레오티드는 식물, 박테리아 또는 효모 공급원으로부터 유래되고 본 개시내용의 미생물로 재조합적으로 조작된 유전자를 포함한다. 또 다른 실시예에서, 원하는 표적 효소를 코딩하는 폴리뉴클레오티드는 유기체에서 자연적으로 발생하지만 자연 발현 수준과 비교하여 과발현되도록 재조합적으로 조작된다. 본원에 제공된 재조합 미생물의 성장 및 유지에 적합한 배양 조건은 공지되어 있다(예를 들어, "Culture of Animal Cells--A Manual of Basic Technique" by Freshney, Wiley-Liss, N.Y. (1994), Third Edition 참조). 숙련된 기술자는 이러한 조건이 각 미생물의 요구사항을 수용하도록 수정될 수 있음을 인식할 것이다.
프레닐화 화합물 또는 칸나비노이드 또는 칸나비노이드 전구체의 생산에 적합한 재조합 대사 경로의 전부 또는 일부를 포함하도록 다양한 미생물이 변형될 수 있는 것으로 이해된다. 또한, 다양한 미생물이 본원에서 제공되는 재조합 미생물에 사용하기에 적합한 표적 효소를 코딩하는 유전 물질에 대한 "소스(sources)"으로 작용할 수 있음을 이해해야 한다.
이전에 논의된 바와 같이, 본 명세서에 유용한 분자생물학적 기술을 설명하는 일반 텍스트는 Berger and Kimmel, Guide to Molecular Cloning Techniques, Methods in Enzymology Volume 152, (Academic Press, Inc., San Diego, Calif.) ("Berger"); Sambrook et al., Molecular Cloning--A Laboratory Manual, 2d ed., Vol. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor, N.Y., 1989 ("Sambrook") and Current Protocols in Molecular Biology, F. M. Ausubel et al., eds., Current Protocols, a joint venture between Greene Publishing Associates, Inc. and John Wiley & Sons, Inc., (supplemented through 1999) ("Ausubel")에 포함된 벡터, 프로모터 및 기타 많은 관련 주제의 사용을 포함하고, 이들 각각은 그 전체가 참고로 여기에 포함된다.
시험관 내 증폭 방법을 통해 숙련된 사람에게 지시하기에 충분한 프로토콜의 예는 예를 들어, 본 개시내용의 상동 핵산의 생산을 위해, Berger, Sambrook 및 Ausubel 뿐만 아니라 in Mullis et al. (1987) U.S. Pat. No. 4,683,202; Innis et al., eds. (1990) PCR Protocols: A Guide to Methods and Applications (Academic Press Inc. San Diego, Calif.) ("Innis"); Arnheim & Levinson (Oct. 1, 1990) C&EN 36-47; The Journal Of NIH Research (1991) 3: 81-94; Kwoh et al. (1989) Proc. Natl. Acad. Sci. USA 86: 1173; Guatelli et al. (1990) Proc. Nat'l. Acad. Sci. USA 87: 1874; Lomell et al. (1989) J. Clin. Chem 35: 1826; Landegren et al. (1988) Science 241: 1077-1080; Van Brunt (1990) Biotechnology 8: 291-294; Wu and Wallace (1989) Gene 4:560; Barringer et al. (1990) Gene 89:117; and Sooknanan and Malek (1995) Biotechnology 13:563-564에서 찾을 수 있고 중합효소연쇄반응(PCR), 리가제연쇄반응(LCR), Qβ-복제효소 증폭 및 기타 RNA 중합효소 매개 기술(예: NASBA)를 포함한다.
시험관내 증폭된 핵산을 클로닝하기 위한 개선된 방법은 Wallace et al., U.S. Pat. No. 5,426,039에 기술되어 있다.
PCR에 의해 큰 핵산을 증폭하는 개선된 방법은 Cheng et al(1994) Nature 369: 684-685 및 여기에 인용된 참고 문헌에 요약되어 있으며, 여기에서 최대 40kb의 PCR 앰플리콘(amplicons)이 생성된다. 당업자는 본질적으로 임의의 RNA가 역전사효소 및 중합효소를 사용하여 제한 소화, PCR 확장 및 시퀀싱에 적합한 이중 가닥 DNA로 전환될 수 있음을 이해할 것이다. 예를 들어, 위의 Ausubel, Sambrook 및 Berger를 참조.
본 발명은 하기 실시예에 예시되어 있으며, 이는 예시로서 제공되고 제한하려는 의도가 아니다.
실시예
시약
디바린산(DA) 및 올리브톨산(OA)은 각각 Enamine과 Toronto Research Chemicals에서 구입했으며 CBGA(cannabigerolic acid) 표준품은 Sigma Aldrich에서 구입했다. 보조 인자는 Thermo Fisher Scientific 또는 Sigma Aldrich에서 구입했다. 소 혈청 알부민(Bovine Serum Albumin, BSA), S. cerevisiae 헥소키나제(S. cerevisiae hexokinase, ScHex) 및 젖산 탈수소효소가 있는 피루브산 키나제(pyruvate kinase with lactate dehydrogenase, PKLDH)는 Sigma Aldrich에서 구입했다.
효소의
클로닝
, 발현 및 정제
E. coli hydroxyethylthiazole kinase(EcThiM), R. palustris MatB,(RpMatB) 및 G. thermodenitrificans ADK(GtADK)에 대한 유전자는 HotStart Taq Mastermix(Denville)를 사용하여 게놈 DNA에서 증폭된 다음 수정된 Gibson 방법을 사용하여 PCR 증폭된 벡터로 클로닝되었다. PCR 주기 매개변수는 다음과 같다: 3분 동안 95°C, 15초 동안 95°C의 10 사이클, 30초 동안 63°C(1°C/사이클 감소), 1분 동안 72°C, 15초 동안 95°C, 30초 동안 55°C, 1분 동안 72°C, 10분 동안 72°C의 30 사이클. ThiM 및 MatB 복제에 사용되는 프라이머는 표 2에 나열되어 있다. Mj IPK, Gs MdcA, NphB M31S, CsAAE3, CsOLS 및 CsOAC를 합성하고 Twist Bioscience에 의해 Nde1/Xho1 제한 부위가 있는 pET28(+) 벡터에 클로닝했다. EcIDI, GsFPPS-S82F 및 GsPpase에 대한 발현 플라스미드는 이전에 설명되었다(Korman et al., Nat. Commun. 8:15526, 2017).
EcThiM | 서열번호 1 | ||
ATGCAAGTCGACCTGCTGGGTTCAGCGCAATCTGCGCACGCGTTACACCTTTTTCACCAACATTCCCCTCTTGTGCACTGCATGACCAATGATGTGGTGCAAACCTTTACCGCCAATACCTTGCTGGCGCTCGGTGCATCGCCAGCGATGGTTATCGAAACCGAAGAGGCCAGTCAGTTTGCGGCTATCGCCAGTGCCTTGTTGATTAACGTTGGCACACTGACGCAGCCACGCGCTCAGGCGATGCGTGCTGCCGTTGAGCAAGCAAAAAGCTCTCAAACACCCTGGACGCTTGATCCAGTAGCGGTGGGTGCGCTCGATTATCGCCGCCATTTTTGTCATGAACTTTTATCTTTTAAACCGGCAGCGATACGTGGTAATGCTTCGGAAATCATGGCATTAGCTGGCATTGCTAATGGCGGACGGGGAGTGGATACCACTGACGCCGCAGCTAACGCGATACCCGCTGCACAAACACTGGCACGGGAAACTGGCGCAATCGTCGTGGTCACTGGCGAGATGGATTATGTTACCGATGGACATCGTATCATTGGTATTCACGGTGGTGATCCGTTAATGACCAAAGTGGTAGGAACTGGCTGTGCATTATCGGCGGTTGTCGCTGCCTGCTGTGCGTTACCAGGCGATACGCTGGAAAATGTCGCATCTGCCTGTCACTGGATGAAACAAGCCGGAGAACGCGCAGTCGCCAGAAGCGAGGGGCCAGGCAGTTTTGTTCCACATTTCCTTGATGCGCTCTGGCAATTGACGCAGGAGGTGCAGGCATAA |
|||
CsAAE3 | 서열번호 3 | ||
ATGGGCAGCAGCCATCATCATCATCATCACAGCAGCGGCCTGGTGCCGCGCGGCAGCCATATGGAAAAGAGTGGCTACGGACGCGACGGTATTTACCGTAGCCTGCGTCCTCCTTTACACCTGCCAAACAATAACAATTTGAGTATGGTCTCATTCCTGTTCCGTAACAGCAGCAGCTATCCACAGAAACCGGCGTTGATCGATAGCGAGACTAATCAAATTTTATCTTTTAGTCATTTTAAAAGCACCGTGATCAAGGTCTCCCATGGCTTCTTAAACCTGGGGATCAAAAAGAATGACGTGGTTTTAATCTACGCACCCAATTCGATCCACTTTCCCGTATGCTTCCTTGGCATTATTGCTTCTGGGGCGATCGCCACTACTTCAAATCCATTATACACCGTGAGTGAGTTGTCGAAACAAGTAAAGGACTCGAACCCTAAATTGATTATCACAGTCCCTCAGTTATTGGAAAAGGTCAAGGGTTTCAATCTGCCAACTATCCTTATCGGCCCTGATTCTGAGCAGGAATCGTCTAGTGATAAAGTAATGACTTTCAATGATCTGGTCAATCTGGGAGGAAGTTCGGGTAGCGAATTCCCTATCGTCGACGATTTCAAGCAATCCGACACCGCCGCACTGTTGTACTCAAGTGGCACGACAGGTATGAGCAAGGGGGTCGTTCTGACGCACAAAAATTTTATTGCCTCATCGTTGATGGTAACAATGGAACAGGACTTGGTCGGCGAGATGGACAATGTGTTCCTGTGTTTCCTTCCTATGTTTCACGTCTTTGGCTTAGCCATTATTACGTATGCTCAGTTACAGCGCGGTAATACCGTGATTTCAATGGCCCGCTTTGACTTGGAAAAGATGTTAAAAGATGTTGAAAAGTACAAAGTTACCCACCTTTGGGTCGTACCCCCAGTTATCTTAGCGTTGTCGAAGAACTCAATGGTGAAAAAATTCAATTTGTCATCCATCAAGTATATTGGTTCAGGCGCTGCGCCATTAGGAAAGGATCTGATGGAAGAATGCTCTAAGGTGGTTCCTTACGGAATCGTGGCTCAAGGATATGGCATGACGGAAACGTGCGGAATCGTATCCATGGAAGACATCCGCGGCGGGAAACGCAATTCAGGGTCGGCCGGAATGTTGGCAAGTGGGGTAGAAGCTCAGATCGTGAGTGTGGACACCTTAAAACCCCTTCCCCCGAATCAATTAGGGGAAATCTGGGTAAAAGGTCCAAATATGATGCAAGGCTATTTCAACAATCCTCAAGCGACCAAACTTACCATTGATAAAAAGGGTTGGGTTCATACTGGCGACTTGGGGTATTTCGACGAAGACGGACACTTATATGTTGTAGACCGTATTAAGGAGCTTATTAAATACAAGGGATTCCAAGTTGCGCCTGCGGAACTGGAGGGATTATTAGTTAGTCACCCCGAGATCTTAGACGCGGTAGTTATTCCCTTCCCCGATGCTGAGGCAGGCGAAGTCCCGGTGGCATACGTTGTTCGCTCGCCTAACAGTTCGTTGACCGAAAATGACGTTAAAAAATTCATCGCCGGTCAGGTCGCCTCCTTTAAGCGTCTGCGCAAGGTTACTTTTATTAATTCCGTCCCCAAGAGCGCAAGTGGGAAGATTCTGCGCCGCGAGCTTATTCAAAAGGTTCGCTCTAACATGTAA |
|||
GsMdcA | 서열번호 5 | ||
ATGGGCAGCAGCCATCATCATCATCATCACAGCAGCGGCCTGGTGCCGCGCGGCAGCCATATGAATAGAATACACCGGTCTAAACGTTCATGGACAACGCGTCGCGATGCGAAGGCAAAGCGAATGGCAAAATTGGAGCGAGTCGTGAACGGAAAAATTATACCAACAGATAAAATTGTAGAGGCATTAGAAGCGGTTATTGCTCCAGGGGATCGTGTTGTGTTAGAAGGAAATAATCAAAAACAAGCTTCGTTTCTATCCAAGGCATTATCCAAAGTTAACCCTGAGAAAGTGAACGGATTACATATGATTATGTCCAGTGTATCGCGACCAGAGCATTTAGATATATTTGAAAAAGGAATCGCTAGAAAAATTGATTTTTCTTATGCCGGCCCACAAAGTCTTCGCATGTCACAAATGCTGGAAGACGGAAAGCTTATTATAGGGGAAATCCATACCTATCTTGAGCTATATGGGCGGTTATTTATTGATTTGACTCCGTCTGTTGCACTAGTGGCGGCGGATAAAGCAGACCGATCGGGCAATTTGTATACAGGACCTAATACAGAGGAAACTCCAACGCTTGTTGAAGCTACGGCATTCCGGGACGGAATCGTTATAGCCCAAGTAAATGAACTGGCAGATGAACTGCCACGGGTAGATATACCTGGCTCTTGGATTGATTTTATCGTTGTTGCTGACCAGCCTTATGAATTAGAACCTCTTTTTACAAGAGATCCTCGCCTTATTACAGAAATCCAGATTCTTATGGCGATGATGACGATTAGAGGGATATATGAACGTCATAACATCCAATCTCTCAACCATGGAATCGGATTTAATACTGCGGCGATTGAGTTATTGCTTCCAACGTACGGAGAATCATTAGGATTGAAGGGGAAAATTTGCAGACATTGGGCATTGAATCCGCATCCTACCCTTATACCAGCTATTGAAACAGGATGGGTAGAAAGCATTCATTGTTTTGGAGGAGAAGTAGGAATGGAAAAGTATATTGCGGCACGTCCCGATGTGTTCTTTACTGGAAAAGATGGGAGTTTACGTTCAAACCGGGCATTATCCCAAGTAGCTGGACAGTATGCTGTCGATCTTTTTATCGGTTCTACTCTACAGATGGATAGGGATGGGAATTCTTCAACAGTAACGATTGGAAGACTGGCAGGATTCGGCGGGGCACCAAACATGGGGCATGATCCTCGTGGACGGCGCCATTCCACTCCTGCATGGCTAGATATGATAACGTCCGATCATCCGATCGCGAAAGGAAAAAAATTAGTCGTGCAGATAGTAGAAACGTTTCAAAAAGGAAATCGACCGGTATTTGTTGAGTCTTTAGATGCGATTGAAGTAGGGAAAAAGGCGAATTTGGCGACAGCGCCAATTATGATATATGGGGATGATGTGACCCATGTTGTCACTGAAGAAGGAATCGCATATTTGTATAAGGCGAATAGTTTAGAAGAACGCCGTCAGGCCATTGCGGCAATCGCCGGAGTCACACCGATTGGGCTAGAACATGATCCAAAAAGAACTGAGCAGTTGCGAAGGGATGGATTGGTGGCGTTTCCGGAGGATTTAGGCATACGCCGTACCGATGCCAAACGTTCTTTATTAGCAGCAAAAAGCATTGAAGAACTGGTTGAATGGTCGGAGGGATTGTATGAACCGCCGGCTAGATTTCGCAGCTGGTAA |
|||
GsPTA | 서열번호 7 | ||
ATGGGCAGCAGCCATCATCATCATCATCACAGCAGCGGCCTGGTGCCGCGCGGCAGCCATATGACAACCGATTTATTTACGGCATTAAAAGCGAAAGTAACCGGTACGGCTCGAAAAATCGTGTTTCCCGAGGGAACCGATGACCGCATCTTAACGGCGGCGAGCCGTTTGGCGACGGAGCAAGTGCTTCAGCCGATCGTCCTTGGCGATGAGCAAGCGATAAGGGTGAAAGCAGCTGCGCTTGGCTTGCCGCTTGAAGGGGTGGAGATTGTCAACCCGCGCCGCTACGGCGGGTTTGATGAGCTAGTTTCGGCGTTTGTGGAGCGGCGCAAAGGGAAAGTGACAGAAGAAACGGCGCGCGAGTTGCTTTTCGATGAAAACTATTTCGGTACGATGCTCGTTTATATGGGAGCGGCCGACGGCCTCGTCAGCGGGGCGGCACATTCGACGGCGGATACGGTCCGACCAGCCTTGCAAATCATTAAAACGAAGCCAGGCGTTGACAAAACGTCCGGCGTGTTCATCATGGTGCGCGGCGACGAAAAATATGTGTTTGCCGATTGCGCCATCAACATTGCTCCTAACAGTCATGATTTGGCTGAAATCGCGGTCGAGAGCGCCCGGACGGCCAAAATGTTCGGCCTTAAGCCGCGCGTAGTGCTGTTAAGCTTTTCCACGAAAGGGTCGGCCTCGTCGCCGGAGACGGAAAAAGTCGTTGAGGCGGTGCGGTTGGCGAAAGAAATGGCGCCGGATCTGATCCTTGACGGTGAGTTTCAATTTGACGCCGCGTTTGTGCCAGAGGTGGCGAAAAAGAAAGCGCCGGACTCGGTCATTCAAGGGGACGCAAATGTCTTTATTTTCCCGAGCCTTGAGGCGGGCAACATCGGCTACAAAATCGCCCAGCGCCTTGGCGGCTTTGAAGCGGTTGGCCCGATTTTGCAAGGGCTGAACAAGCCGGTTAACGACCTATCGCGCGGCTGCAGCGCCGAAGACGCCTACAAGCTCGCGCTCATCACCGCGGCGCAGTCGCTTGGGGAG |
|||
CsOLS | 서열번호 9 | ||
ATGGGCAGCAGCCATCATCATCATCATCACAGCAGCGGCCTGGTGCCGCGCGGCAGCCATATGAATCATCTGCGTGCTGAAGGACCAGCTTCCGTATTGGCAATTGGAACAGCTAACCCTGAGAACATTCTTCTTCAGGATGAGTTTCCCGACTATTACTTCCGCGTGACAAAGAGCGAACACATGACACAGCTTAAAGAGAAGTTCCGTAAGATCTGTGACAAAAGCATGATCCGCAAACGTAACTGCTTCCTTAACGAGGAGCATCTGAAGCAGAATCCCCGTCTTGTTGAACATGAGATGCAGACCTTGGATGCTCGCCAGGACATGTTGGTTGTTGAGGTCCCTAAGCTGGGCAAAGATGCGTGTGCAAAAGCGATTAAAGAGTGGGGGCAGCCTAAAAGCAAAATTACTCATCTGATTTTCACAAGCGCCAGTACAACCGATATGCCCGGTGCGGACTACCATTGTGCAAAATTATTGGGTTTATCGCCTTCAGTAAAACGTGTTATGATGTACCAGTTAGGATGCTACGGTGGTGGCACCGTACTTCGTATTGCGAAGGACATCGCCGAGAACAACAAAGGAGCCCGTGTACTTGCTGTATGTTGTGATATCATGGCGTGCCTTTTTCGCGGCCCCAGCGAGAGTGACCTTGAGTTACTTGTGGGGCAGGCCATCTTCGGAGACGGTGCCGCAGCCGTCATTGTTGGCGCAGAGCCCGATGAATCCGTTGGCGAGCGCCCGATCTTTGAGCTTGTAAGTACAGGACAAACTATCTTGCCCAACTCTGAGGGGACTATCGGCGGACATATTCGTGAGGCGGGCTTGATTTTTGACCTTCACAAGGATGTTCCAATGCTTATCTCCAATAATATTGAAAAATGTCTTATCGAAGCATTCACTCCGATTGGTATCTCCGATTGGAATTCGATTTTTTGGATCACCCATCCTGGTGGGAAAGCTATTTTAGACAAGGTGGAGGAGAAATTACATCTTAAGTCAGATAAGTTTGTCGACAGTCGCCACGTGTTGTCGGAACATGGCAACATGTCATCGTCAACCGTCTTGTTCGTTATGGACGAATTACGTAAACGCAGTTTAGAAGAGGGTAAGAGTACGACGGGGGACGGGTTCGAGTGGGGAGTCTTATTCGGGTTCGGTCCAGGATTGACAGTGGAACGCGTCGTGGTTCGCAGTGTCCCCATTAAGTACTAA |
|||
CsOAC | 서열번호 11 | ||
ATGGGCAGCAGCCATCATCATCATCATCACAGCAGCGGCCTGGTGCCGCGCGGCAGCCATATGGCAGTCAAACACTTGATCGTGTTAAAGTTCAAAGATGAAATCACAGAGGCTCAGAAGGAAGAATTTTTCAAGACGTATGTAAACCTTGTTAATATCATCCCCGCTATGAAGGATGTGTATTGGGGTAAAGACGTGACACAGAAGAACAAAGAGGAAGGCTACACGCACATCGTAGAGGTCACATTTGAGAGCGTCGAAACTATTCAGGATTACATCATTCATCCCGCACACGTTGGATTCGGGGATGTGTATCGCTCTTTCTGGGAAAAATTGCTGATCTTCGACTATACACCGCGTAAGTAA |
|||
GtADK | 서열번호 13 | ||
ATGAATTTAGTGCTGATGGGGCTGCCAGGTGCCGGCAAAGGCACGCAAGCCGAGAAAATCGTAGAAACGTATGGAATCCCACATATTTCAACCGGGGATATGTTTCGGGCGGCGATGAAAGAAGGCACACCGTTAGGATTGCAGGCAAAAGAATATATCGACCGTGGTGATCTTGTTCCGGATGAGGTGACGATCGGTATCGTCCGTGAACGGTTAAGCAAAGACGACTGCCAAAACGGCTTTTTGCTTGACGGATTCCCACGCACGGTTGCCCAAGCGGAGGCGCTGGAAGCGATGCTGGCTGAAATCGGCCGCAAGCTTGACTATGTCATCCATATCGATGTTCGCCAAGATGTGTTAATGGAGCGCCTCACAGGCAGACGAATTTGTCGCAACTGCGGAGCGACATACCATCTTGTTTTTCACCCACCGGCTCAGCCAGGCGTATGTGATAAATGCGGTGGCGAGCTTTATCAGCGCCCTGACGATAATGAAGCAACAGTGGCGAATCGGCTTGAGGTGAATACGAAACAAATGAAGCCATTGCTCGATTTCTATGAGCAAAAAGGCTATTTGCGCCACATTAACGGCGAACAAGAAATGGAAAAAGTGTTTAGCGACATTCGCGAATTGCTCGGGGGACTTACTCGATGA |
|||
RpMatB | 서열번호 15 | ||
ATGAACGCCAACCTGTTCGCCCGCCTGTTCGATAAGCTCGACGACCCCCACAAGCTCGCGATCGAAACCGCGGCCGGGGACAAGATCAGCTACGCCGAGCTGGTGGCGCGGGCGGGCCGCGTCGCCAACGTGCTGGTGGCACGCGGCCTGCAGGTCGGCGACCGCGTTGCGGCGCAAACCGAGAAGTCGGTGGAAGCGCTGGTGCTGTATCTCGCCACGGTGCGGGCCGGCGGCGTGTATCTGCCGCTCAACACCGCCTATACGCTGCACGAGCTCGATTACTTCATCACCGATGCCGAGCCGAAGATCGTGGTGTGCGATCCGTCCAAGCGCGACGGGATCGCGGCGATTGCCGCCAAGGTCGGCGCCACGGTGGAGACGCTTGGCCCCGACGGTCGGGGCTCGCTCACCGATGCGGCAGCTGGAGCCAGCGAGGCGTTCGCCACGATCGACCGCGGCGCCGATGATCTGGCGGCGATCCTCTACACCTCAGGGACGACCGGCCGCTCCAAGGGCGCGATGCTCAGCCACGACAATTTGGCGTCGAACTCGCTGACGCTGGTCGATTACTGGCGCTTCACGCCGGATGACGTGCTGATCCACGCGCTGCCGATCTATCACACCCATGGATTGTTCGTGGCCAGCAACGTCACGCTGTTCGCGCGCGGATCGATGATCTTCCTGCCGAAGTTCGATCCCGACAAGATCCTCGACCTGATGGCGCGCGCCACCGTGCTGATGGGTGTGCCGACGTTCTACACGCGGCTCTTGCAGAGCCCGCGGCTGACCAAGGAGACGACGGGCCACATGAGGCTGTTCATCTCCGGGTCGGCGCCGCTGCTCGCCGATACGCATCGCGAATGGTCGGCGAAGACCGGTCACGCCGTGCTCGAGCGCTACGGCATGACCGAGACCAACATGAACACCTCGAACCCGTATGACGGCGACCGCGTCCCCGGCGCGGTCGGCCCGGCGCTGCCCGGCGTTTCGGCGCGCGTGACCGATCCGGAAACCGGCAAGGAACTGCCGCGCGGCGACATCGGGATGATCGAGGTGAAGGGCCCGAACGTGTTCAAGGGCTACTGGCGGATGCCGGAGAAGACCAAGTCTGAATTCCGCGACGACGGCTTCTTCATCACCGGCGACCTCGGCAAGATCGACGAGCGCGGCTACGTCCACATCCTCGGCCGCGGCAAGGATCTGGTGATCACCGGCGGCTTCAACGTCTATCCGAAGGAAATCGAGAGCGAGATCGACGCCATGCCGGGCGTGGTCGAATCCGCGGTGATCGGCGTGCCGCACGCCGATTTCGGCGAGGGCGTCACTGCCGTGGTGGTGCGCGACAAGGGTGCCACGATCGACGAAGCGCAGGTGCTGCACGGCCTCGACGGTCAGCTCGCCAAGTTCAAGATGCCGAAGAAAGTGATCTTCGTCGACGACCTGCCGCGCAACACCATGGGCAAGGTCCAGAAGAACGTCCTGCGCGAGACCTACAAGGACATCTACAAGTAA |
|||
GsPPase | 서열번호 17 | ||
ATGGGCAGCAGCCATCATCATCATCATCACAGCAGCGGCCTGGTGCCGCGCGGCAGCCATATGGCCTTTGAGAATAAGATTGTCGAAGCGTTTATCGAAATTCCAACCGGCAGCCAAAACAAATACGAGTTCGACAAAGAGCGGGGCGTTTTCAAACTCGACCGCGTCTTGTACTCCCCGATGTTTTACCCGGCTGAGTACGGCTACTTGCAAAATACGCTGGCGCTCGATGGCGACCCGCTCGACATTTTGGTCATCACAACGAATCCGACATTCCCGGGCTGCGTCATCGATACGCGTGTCATCGGCTTTTTGAACATGGTCGACAGCGGTGAGGAGGACGCGAAGCTCATCGGCGTGCCAGTCGAAGACCCGCGCTTTGATGAAGTCCGCTCGATTGAAGACCTGCCGCAGCACAAGCTGAAAGAAATCGCCCACTTCTTTGAACGGTACAAAGACTTGCAAGGCAAGCGGACGGAAATCGGCACATGGGAAGGGCCGGAAGCTGCGGCAAAACTGATCGATGAGTGCATCGCCCGCTATAACGAACAAAAATAA |
|||
GsFPPS-S82F | 서열번호 19 | ||
ATGGGCAGCAGCCATCATCATCATCATCACAGCAGCGGCCTGGTGCCGCGCGGCAGCCATATGGCGCAGCTTTCAGTTGAACAGTTTCTCAACGAGCAAAAACAGGCGGTGGAAACAGCGCTCTCCCGTTATATAGAGCGCTTAGAAGGGCCGGCGAAGCTGAAAAAGGCGATGGCGTACTCATTGGAGGCCGGCGGCAAACGAATCCGTCCGTTGCTGCTTCTGTCCACCGTTCGGGCGCTCGGCAAAGACCCGGCGGTCGGATTGCCCGTCGCCTGCGCGATTGAAATGATCCATACGTACTTTTTGATCCATGATGATTTGCCGAGCATGGACAACGATGATTTGCGGCGCGGCAAGCCGACGAACCATAAAGTGTTCGGCGAGGCGATGGCCATCTTGGCGGGGGACGGGTTGTTGACGTACGCGTTTCAATTGATCACCGAAATCGACGATGAGCGCATCCCTCCTTCCGTCCGGCTTCGGCTCATCGAACGGCTGGCGAAAGCGGCCGGTCCGGAAGGGATGGTCGCCGGTCAGGCAGCCGATATGGAAGGAGAGGGGAAAACGCTGACGCTTTCGGAGCTCGAATACATTCATCGGCATAAAACCGGGAAAATGCTGCAATACAGCGTGCACGCCGGCGCCTTGATCGGCGGCGCTGATGCCCGGCAAACGCGGGAGCTTGACGAATTCGCCGCCCATCTAGGCCTTGCCTTTCAAATTCGCGATGATATTCTCGATATTGAAGGGGCAGAAGAAAAAATCGGCAAGCCGGTCGGCAGCGACCAAAGCAACAACAAAGCGACGTATCCAGCGTTGCTGTCGCTTGCCGGCGCGAAGGAAAAGTTGGCGTTCCATATCGAGGCGGCGCAGCGCCATTTACGGAACGCTGACGTTGACGGCGCCGCGCTCGCCTATATTTGCGAACTGGTCGCCGCCCGCGACCATTAA |
|||
EcIDI | 서열번호 20 | ||
ATGCAAACGGAACACGTCATTTTATTGAATGCACAGGGAGTTCCCACGGGTACGCTGGAAAAGTATGCCGCACACACGGCAGACACCCGCTTACATCTCGCGTTCTCCAGTTGGCTGTTTAATGCCAAAGGACAATTATTAGTTACCCGCCGCGCACTGAGCAAAAAAGCATGGCCTGGCGTGTGGACTAACTCGGTTTGTGGGCACCCACAACTGGGAGAAAGCAACGAAGACGCAGTGATCCGCCGTTGCCGTTATGAGCTTGGCGTGGAAATTACGCCTCCTGAATCTATCTATCCTGACTTTCGCTACCGCGCCACCGATCCGAGTGGCATTGTGGAAAATGAAGTGTGTCCGGTATTTGCCGCACGCACCACTAGTGCGTTACAGATCAATGATGATGAAGTGATGGATTATCAATGGTGTGATTTAGCAGATGTATTACACGGTATTGATGCCACGCCGTGGGCGTTCAGTCCGTGGATGGTGATGCAGGCGACAAATCGCGAAGCCAGAAAACGATTATCTGCATTTACCCAGCTTAAACTCGAGCACCACCACCACCACCACTGA |
|||
NphBM31S | 서열번호 35 | ||
ATGGGCAGCAGCCATCATCATCATCATCACAGCAGCGGCCTGGTGCCGCGCGGCAGCCATATGTCGGAAGCTGCCGATGTAGAACGTGTCTACGCCGCCATCGAAGAAGCCGCAGGTTTGTTGGGGGTCGCATGCGCACGCGATAAGATTTGGCCCTTGCTGTCAACATTCCAGGATACCTTGGTTGAGGGTGGAAGCGTAGTTGTTTTTAGCATGGCCTCGGGGCGTCACTCAACGGAGCTGGACTTCTCAATTTCCGTCCCGCCTAGTCATGGCGATCCGTACGCGATTGTGGTGGAAAAGGGCTTGTTCCCGGCAACTGGACATCCAGTTGATGACCTTCTGGCGGACATTCAGAAGCATCTTCCCGTATCTATGTTTGCGATTGACGGGGAAGTTACCGGGGGGTTCAAAAAAACTTATGCGTTCTTCCCGACCGATAACATGCCCGGTGTCGCGGAACTGGCGGCCATCCCATCGATGCCTCCTGCAGTCGCTGAAAATGCTGAACTGTTCGCGCGTTATGGCCTGGACAAGGTACAAATGACCTCGATGGATTATAAAAAACGTCAAGTGAACCTGTATTTCTCCGAACTGTCGGCTCAGACGCTGGAGGCTGAATCAGTACTTGCTTTAGTGCGTGAACTGGGTCTTCATGTCCCAAACGAGCTGGGTCTGAAATTTTGCAAACGCTCCTTCTCAGTATACCCAACATTAAACTGGGACACCTCGAAGATTGACCGCCTTTGCTTCTCTGTAATCAGTACAGATCCGACACTTGTACCTAGCTCAGACGAGGGAGACATTGAAAAATTTCACAATTACGCTACAAAGGCCCCCTATGCATATGTTGGAGAAAAGCGTACACTTGTTTACGGCTTGACTTTATCTCCCAAAGAGGAGTATTATAAATTGGGTGCCGTTTACCACATTACTGACGTACAACGCAAACTTTTGAAGGCGTTCGACAGCCTTGAGGATTAA |
|||
Methanocaldococcus jannaschii IPK | 서열번호 58 | ||
ATGTTGACTATTCTTAAGTTGGGAGGGAGCATTCTGTCCGATAAAAACGTTCCATATAGCATTAAGTGGGATAACTTAGAACGTATTGCTATGGAAATCAAAAACGCGTTAGATTATTACAAGAACCAAAATAAAGAAATTAAGCTTATTCTGGTACATGGCGGCGGGGCATTTGGGCATCCAGTGGCCAAGAAATACCTGAAGATTGAAGACGGCAAAAAAATTTTCATCAACATGGAAAAAGGATTCTGGGAGATTCAGCGTGCGATGCGCCGTTTTAATAACATCATCATCGACACGCTTCAGAGTTACGATATCCCAGCGGTCTCGATTCAACCTTCCAGCTTTGTTGTTTTTGGCGACAAATTGATCTTCGACACCTCTGCGATCAAAGAGATGTTGAAACGCAACCTTGTACCCGTTATCCATGGGGATATCGTCATTGACGATAAAAATGGGTACCGTATTATCAGCGGTGACGACATCGTGCCATATTTAGCCAATGAACTGAAGGCAGATTTAATCCTTTATGCAACCGACGTGGACGGCGTATTGATTGACAACAAGCCCATTAAACGCATTGATAAGAATAATATCTACAAGATTTTGAATTATCTTTCGGGTAGCAATTCAATTGACGTCACGGGGGGGATGAAATACAAGATCGACATGATCCGTAAAAACAAATGCCGTGGTTTCGTGTTTAATGGCAACAAGGCAAACAACATTTATAAGGCGCTGCTTGGGGAAGTCGAGGGTACCGAAATCGACTTTTCTGAATAA |
|||
프라이머 서열 |
|||
EcThiM FOR 5' CCGCGCGGCAGCCATATGCAAGTCGACCTGCTGGGTTCAGCGCAATCTGC 3' REV 5' GGTGGTGGTGGTGGTGCTCGAGTTATGCCTGCACCTCCTGCGTCAATTGCCAGAGCGC 3' |
서열번호 28 서열번호 29 |
||
RpMatB FOR 5' CCGCGCGGCAGCCATATGAACGCCAACCTGTTCGCCCGCCTGTTCG 3' REV 5' GGTGGTGGTGGTGGTGCTCGAGTTACTTGTAGATGTCCTTGTAGGTCTCGCGCAGG 3' |
서열번호 31 서열번호 32 |
||
GtADK FOR 5'GGTGCCGCGCGGCAGCCATATGAATTTAGTGCTGATGGGGCTGCC 3' REV 5'CAGTGGTGGTGGTGGTGGTGCTCGAGTTATCGAGTAAGTCCCCCGAGC 3' |
서열번호 33 서열번호 34 |
GsMdcA를 제외하고 E. coli BL21(DE3) Gold에서 발현되었다. 50 ug/mL 카나마이신이 포함된 LB 배지 1L에 포화 배양액 1mL를 접종하고 OD600이 0.6-0.8이 되도록 성장했다. 세포를 2,500 x g에서 원심분리하여 수확하고 20mL의 결합 완충액(50mM Tris pH 8.0, 150mM NaCl 및 10mM 이미다졸(imidazole))에 재현탁했다. 세포는 Emulsiflex(Avestin) 기기를 사용하여 용해되었고, 용해물은 20분 동안 20,000 x g에서 원심분리에 의해 정화되었다. 20% 에탄올에 용해된 NiNTA 수지의 50% v/v 현탁액을 정화된 용해물(2mL/1L 배양)에 첨가하고 4ºC에서 30분 동안 부드럽게 혼합하면서 배양하였다. 정화된 용해물을 중력 흐름 컬럼으로 옮겼다. 통과 흐름을 버리고 컬럼을 5-10 컬럼 부피의 결합 완충액으로 세척했다. 세척액을 버리고 2-3 컬럼 부피의 용리 완충액(50mM Tris pH 8.0, 150mM NaCl, 250mM 이미다졸, 25%(v/v) 글리세롤)으로 효소를 용리하였다.
높은 ATPase 활성으로 인해, CsAAE3, CsOLS, CsOAC 및 EcThiM을 크기 배제 크로마토그래피를 사용하여 추가로 정제하였다. CsAAE3, CsOLS 및 EcThiM을 16/600 Superdex 200 컬럼에 로드하였다(3-6mL). 유속은 1mL/분이었고 완충액은 50mM Tris pH 8.0 및 200mM NaCl이었다. Millipore Sigma의 10kDa Amicon 필터를 사용하여 2mL 용출 분획을 농축하고 15% 글리세롤을 첨가하였다. OAC를 16/600 Superdex 75 컬럼에 로딩하였다(3-6mL). 유속은 1mL/분이었고 완충액은 50mM Tris pH 8.0, 200mM NaCl 및 10% 글리세롤이었다. OAC는 20% 글리세롤 없이 침전되므로 2mL의 50mM Tris pH 8, 200mM NaCl 및 40% 글리세롤을 분획 수집 튜브에 첨가하여 최종 글리세롤 농도를 20%로 조정하였다. 그런 다음 OAC를 5kDa Amicon 필터를 사용하여 농축하였다. EcThiM ATPase 활성은 SEC 정제 후에도 여전히 존재하므로 용출 분획을 50mM Tris로 3배 희석하고 50mM Tris pH 8.0 및 50mM NaCl로 평형화된 5mL Q 세파로스 컬럼에 로딩하였다. 컬럼을 50mM Tris pH 8.0 및 50mM NaCl로 세척한 다음 선형 구배로 100% 50mM Tris pH 8.0 1M NaCl로 용리하였다. ThiM을 함유하는 분획을 농축하고, 글리세롤을 15%까지 첨가하였다. 모든 효소는 필요할 때까지 -80ºC에서 보관되었다.
MatB를
사용한
OA
/DA 반응 조건
말로닐-CoA를 생성하기 위해 RpMatB를 사용한 반응 조건은 다음과 같다: 15mM 말로네이트, 5mM 헥사노에이트 또는 5mM 부티레이트, 1mM CoA, 4mM ATP, 25mM 크레아틴 포스페이트, 10mM KCl, 5mM MgCl2 및 50mM Tris pH 8.0, 1.3μM RpMatB, 4.9μM CsAAE3, 2.9μM CsOLS, 46.6μM CsOAC, 7.6μM GsPpase, 2.6μM ADK 및 2개 단위의 CPK(Sigma Aldrich 제품). 첨가 반응의 경우 GPP(0.5 - 2mM), OA(0.25 - 2mM) 및 DA(0.25 - 5mM)가 반응이 시작되기 전에 추가되었다.
시간 경과에 대해, 반응은 5분에서 5시간 사이의 다양한 시점에서 켄치드되었다(quenched)(아래 참조). 첨가제와의 반응은 4시간에 켄치드되었다(quenched).
MdcA를
사용한
OA
/DA 반응 조건
MdcA 경로를 이용한 실험의 반응 조건은 다음과 같다: 4mM ATP, 1mM CoA, 5mM MgCl2, 10mM KCl, 5mM 헥사노트 또는 부티레이트, 15mM 말로네이트, 50mM 아세틸 포스페이트, 50mM Tris pH 8.0, 1.3μM SeAckA, 1.4μM GsMdcA, 4.5μM CsAAE3, 2.9μM CsOLS, 50μM CsOAC, 2.6μM GtADK, 2.6μM GsPpase, 1.6μM GsPTA. BSA의 효과는 BSA를 반응에 적정하여 테스트하였다. 시간 경과에 따른 반응은 20 mg/mL BSA를 포함하거나 BSA를 포함하지 않는다. BSA 적정 반응은 4시간에 켄치드되었다(quenched). 시간 경과 실험은 0.5시간에서 5시간 사이의 다양한 시점에서 중단되었다.
이소프레노이드
반응 조건
GPP를 생성하는 이소프레놀 경로의 능력을 테스트한 반응 조건은 다음과 같다: 1mM ATP, 5mM MgCl2, 5mM OA 또는 DA, 50mM 아세틸 포스페이트, 50mM Tris pH 8.0, 15.2μM EcThiM, 2.1μM MjIPK, 6.6μM EcIDI, 2.5μM GsFPPS-S82F, 13.2μM NphB M31S, 1.3μM SeAckA 및 20mg/mL BSA. 반응은 0.5 - 25시간 범위의 다양한 시점에서 켄치드되었다.
전체 경로 반응 조건
전체 경로에 대한 반응 조건은 다음과 같다: 4mM ATP, 1mM CoA, 5mM MgCl2, 10mM KCl, 5mM 헥사노트 또는 부티레이트, 15mM 말로네이트, 50mM 아세틸 포스페이트, 50mM Tris pH 8.0, 1.3μM SeAckA, 1.4μM GsMdcA, 4.5μM CsAAE3, 2.9μM CsOLS, 50μM CsOAC, 2.6μM GtADK, 2.6μM GsPpase, 1.6μM GsPTA, 5.2μM EcThiM, 2.1μM MjIPK, 6.6μM EcIDI, 2.5μM GsFPPS-S82F, 13.2μM NphB M31S 및 20mg/mL BSA.
생성물 역가에 대한 첨가제의 효과를 시험하기 위해, 반응이 시작되기 전에 아세테이트(25 - 100mM) 또는 포스페이트(25 - 100mM)을 첨가하였다. 반응을 6시간에 켄치드되었다(quenched). 시간 경과 동안 반응은 0.5 내지 10시간 사이의 다양한 시점에서 켄치드되었다(quenched). AcP는 또한 최적의 시작 조건이 사용되었는지 확인하기 위해 25mM에서 200mM으로 적정되었다. 이러한 반응은 4시간에 켄치드되었다.
재활용된 효소 반응 조건
반응 조건은 전체 경로 반응 조건에서 상술한 것과 동일하였다. 6시간 후 200μL의 반응 혼합물을 3kDa 단백질 농축기에 첨가하고 300μL의 완충액(50mM Tris pH 8.0 및 200mM NaCl)을 첨가하였다. 샘플 부피는 4C에서 16,000 x g에서 15분간 원심분리한 후 100 μL로 감소하였다. 그런 다음, 400μL의 완충액(50mM Tris pH 8.0 및 200mM NaCl)을 단백질 농축기에 첨가하고 4C에서 16,000 xg에서 추가로 15분 동안 원심분리하였다. 그런 다음 새로운 반응이 다음과 같이 설정되었다: 단백질 농축기의 효소 100μL, 4mM ATP, 1mM CoA, 5mM MgCl2, 10mM KCl, 5mM 헥사노에이트, 15mM 말로네이트, 50mM 아세틸 포스페이트 및 50mM Tris pH 8.0. 2차 반응은 추가 31시간(총 37시간) 후에 켄치드되었다.
HPLC
샘플 분석
모든 샘플은 메탄올로 4배 희석하여 켄치드되었다(분석물 농도가 더 높은 샘플은 최대 10배 희석됨). 단백질 침전물을 16,000 x g에서 5분 동안 원심분리하여 제거하고 상청액을 분석을 위해 LC 바이알(vial)로 옮겼다.
Thermo Ultimate 3000 HPLC를 사용하여 Syncronis C8 컬럼(4.6 x 100 mm)에서 역상 크로마토그래피에 의해 샘플을 분석하였다. 컬럼 구획 온도는 40ºC로 설정되었고 유속은 1mL/분이었다. 샘플 주입 부피는 20 μL(전체 루프)이었다. 이동상으로 물 + 0.1% TFA(용매 A) 및 아세토니트릴 + 0.1% TFA(용매 B)를 사용한 구배 용리를 사용하여 화합물을 분리하였다. 용매 B는 처음 1분 동안 20%로 유지되었다. 그런 다음 용매 B를 4분에 걸쳐 95% B로 증가시키고 3분 동안 95% B에서 유지하였다. 그런 다음 컬럼을 3분 동안 20% B로 재평형화하여 총 실행 시간 11분 동안 수행하였다. 표준은 머무름 시간을 식별하고 정량화를 위한 외부 표준 곡선을 생성하는 데 사용되었다.
GPP
정량 분석
반응의 50 μL 분취량을 150 μL의 메탄올에서 켄치드하였다(quenched). 단백질을 원심분리에 의해 제거하고, 상청액을 고속 진공청소기를 사용하여 건조시켰다. 용매가 제거되면 50μL의 Tris pH 8.0과 2단위의 송아지 장내 알칼리성 인산분해효소(calf intestinal alkaline phosphatase, CIP)가 추가되었다. 반응물을 16시간 동안 인큐베이션하고, 반응물을 100 μL의 헥산으로 추출하였다. 반응 추출물은 Thermo Scientific TG-WAXMS 컬럼(30m x 0.32mm x 0.25μM)이 장착된 Thermo Scientific Trace 1310 GC-FID 기기에서 분석되었다. 운반 가스는 헬륨(30mL/min), 분할 비율은 1:1, 주입 부피는 2μL, 주입구 온도는 250°C로 설정되었다. 초기 온도를 80°C에서 6분 동안 유지하고 12°C/min의 속도로 260°C로 증가시킨 다음 260°C에서 3분 동안 유지하여 총 실행 시간 24분을 유지하였다. GPP는 샘플과 동일한 방법으로 작성된 외부 표준 곡선을 기반으로 정량화하였다.
NphB의
안정화
이전에 설명한 NphBM31 효소의 안정화 버전이 기본 매개변수와 함께 PROSS 소프트웨어를 사용하여 개발되었다. Streptomyces sp. CL190(RCSB:1ZB6)의 야생형 Orf2 결정 구조의 사슬 A를 시작 모델로 사용하였다. 소분자 리간드 Mg2 +(MG) 및 1,6 디하이드록시나프탈렌(1,6 dihydroxynaphthalene, DHN)을 입력하여 활성 부위에 대한 돌연변이를 배제하였다. 다음 돌연변이를 갖는 NphB M31S로 명명된 돌연변이는 효소를 열적 불활성화에 대해 안정화시키는 것으로 밝혀졌다: M14I, Y31W, T69P, T77I, T98I, S136A, E222D, G224S, A232S, N236T, Y288V 및 G297K. NphB M31 및 NphB M31S의 열 비활성화 프로파일은 도 10에서 비교된다. 열 불활성화 프로파일을 얻기 위해 1 mg/ml NphB M31 Parent NphB M31S를 303.1, 306.7, 311.6, 314.2, 316.9, 319.3, 323.3, 325.6, 328.3 및 333.1K에서 20분 동안 가열하고 남은 활성을 분석하였다.
ATPase
분석
반응에 추가된 ATPase 활성의 양을 측정하기 위해, ATPase 활성을 PKLDH에 결합하였다. 반응 조건은 다음과 같다: 5mM PEP, 2mM ATP, 1mM NADH, 5mM MgCl2, 10mM KCl, ~1U PKLDH(Sigma) 및 전체 경로 반응 조건의 효소 마스터 믹스(master mix). 340 nm에서 NADH 흡광도의 감소는 배경 ATPase 활성의 척도로 사용되었다.
MatB
활성 분석
결합된 효소 분석을 사용하여 OA 및 DA의 존재 하에 MatB의 활성을 결정했다. 반응 조건은 다음과 같다: 2.5mM 말로네이트, 2mM ATP, 1mM CoA, 2.5mM 포스포에놀피루베이트(phosphoenolpyruvate, PEP), 1mM NADH, 5mM MgCl2, 10mM KCl, 0.35mg/mL ADK, 0.75μg/mL MatB, 1.6단위 PK 및 2.5단위 LDH, 및 50mM tris[pH 8.0]. 배경 ATPase 활성은 기질(말로네이트(malonate))을 제외하여 제어하고 1% 에탄올, 250μM 또는 5mM OA 또는 5mM DA를 나머지 반응에 추가하였다. MatB의 활성은 M2 SpectraMax를 사용하여 NADH 소비로 인한 340nm에서 감소하는 흡광도를 모니터링하여 결정되었다. MatB가 5mM OA 또는 DA로 제한되도록 하기 위해 MatB를 1.5μg/mL로 두 배로 늘렸다. 반응 속도가 두 배로 증가하여 MatB가 시스템의 제한 성분임을 나타낸다. 5mM OA 및 5mM DA에서 NADH 소비율은 1% 에탄올 대조군으로 정규화되었다.
AAE3
활성 분석
OA 및 DA의 존재 하에 AAE3의 활성을 결정하기 위해 상기와 유사한 결합된 효소 분석을 사용하였다. 조건은 다음 수정을 포함하는 MatB 분석과 동일했다: 2.5mM 헥사노에이트가 말로네이트 대신에 추가, 15μg/mL의 AAE3가 MatB 대신에 추가. AAE3가 제한적임을 확인하기 위해 AAE3는 5mM OA 또는 DA의 존재하에 두 배가 되었다. AAE3가 제한적임을 나타내는 반응 속도가 두 배로 증가하였다.
CPK
활성 분석
OA 또는 DA의 존재하에서 CPK의 활성을 결정하기 위해 결합된 효소 분석이 사용되었다. 반응 조건은 다음과 같다: 5mM 크레아틴 포스페이트, 2mM ADP, 5mM 포도당, 2mM NADP+, 5mM MgCl2, 5mM KCl, 0.3mg/mL Zwf, 0.1mg/mL Sc Hex 및 0.08단위 CPK. 양성 대조군 반응은 1% 에탄올을 함유하고 5mM의 OA 또는 DA를 나머지 반응에 첨가하였다. 340 nm에서 NADPH의 흡광도를 모니터링하였다. CPK가 제한적임을 확인하기 위해 5mM OA 및 5mM DA에서 CPK 첨가를 두 배로 늘렸다. 결과 비율은 두 배로 증가했으며 이는 높은 OA 및 DA에서도 CPK가 제한적임을 나타낸다.
ADK
활성 분석
결합된 효소 분석을 사용하여 OA 및 DA의 존재 하에 ADK의 활성을 결정하였다. 조건은 다음과 같이 수정된 MatB 분석과 유사하였다: 말로네이트 대신에 2mM AMP를 첨가하고, CoA를 첨가하지 않고, 0.001mg/mL의 ADK를 첨가. ADK가 5mM OA 및 DA에서 제한 시약임을 확인하기 위해 ADK의 양을 두 배로 늘렸다. 비율의 2배 증가는 ADK가 제한 요인임을 나타낸다.
OLS
활성 분석
억제 실험을 위해 조건을 다음과 같이 변경하였다: 1mM 말로닐-CoA, 50mM 시트레이트 완충액 중 400μM 헥사노일-CoA, 200 μL의 최종 부피에서 pH 5.5. 1% 에탄올, 250μM OA 또는 1mM DA를 반응에 첨가한 다음, 0.65mg/mL OLS를 첨가하여 반응을 시작하였다. 50 μL 분취량은 150 μL의 메탄올에서 2, 4, 6 및 8분에 켄치드되었다(quenched). 반응물을 간단히 볼텍스(vortex)하고 16,000 x g에서 2분 동안 원심분리하여 단백질을 펠렛(pellet)하였다. 상청액을 HPLC로 분석하였다. HTAL, PDAL 및 올리브톨(olivetol)의 로우 피크(raw peak) 면적을 합하고 시간에 따라 플롯하여(plotted) 비율을 결정하였다. OA 보충 반응 및 DA 보충 반응의 속도는 에탄올 대조군에 대해 정규화되었다.
CBGVA
정량화
진정한(authentic) CBGVA 표준물질을 즉시 사용할 수 없었기 때문에 CBGVA 표준물질을 생성하고 NMR을 사용하여 정량화하였다. 위의 이소프레노이드(isoprenoid) 반응 조건에서 설명한 대로 AcP, 이소프레놀(isoprenol) 및 디바린산(divarinic acid)을 삽입물(inputs)로 사용하여 1mL 반응을 설정하였다. 반응물을 아르곤(argon) 하에 건조된 헥산 3mL로 추출하였다. 샘플을 내부 표준으로 1mM 1,3,5-트리메톡시벤젠(trimethoxybenzene, TMB)을 포함하는 중수소화 메탄올(deuterated methanol) 500μL에 재-용해하였다. 샘플은 Bruker AV400 분광계를 사용하여 분석되었다. NMR 스펙트럼은 이전에 발표된 결과와 일치했으며 CBGVA는 6.27ppm에서 단일항 수소 피크를 내부 표준과 비교하여 정량화되었다. 정량화된 CBGVA 샘플을 사용하여 HPLC에 대한 외부 표준 곡선을 작성하였다.
시험관내에서 OA/DA를 합성하는 능력을 테스트하고 문제를 해결하기 위해, MatB를 사용하여 전통적인 방식으로 말로닐-CoA가 생성되고 아실 활성화 효소 AAE3를 사용하여 생성된 헥사노일-CoA(또는 바이티릴-CoA)가 있는 도 2A(MatB 시스템)에 표시된 잘린 시스템이 설정되었다. 헥사닐-CoA(또는 부티릴-CoA) 및 말로닐-CoA는 올리브톨레이트 합성효소(OLS)에 의해 사용되어 선형 테트라케타이드(tetraketide)를 생성하고, 이는 올리브톨레이트 사이클라제(OAC)에 의해 OA/DA로 전환된다. 이 절단된 테스트 시스템에 대해 ATP는 희생 기질 크레아틴 포스페이트와 함께 아데닐레이트 키나제(ADK; 서열 번호 14 또는 그에 대해 85% 내지 100% 동일성을 갖는 서열) 및 크레아틴 키나제(CPK)의 조합을 사용하여 AMP로부터 재생성되었다.
초기 반응 조건은 최대 5mM OA를 생성하기에 충분한 입력을 제공하는 효소 특이적 활성으로부터 선택되었다. MatB와 AAE3는 ATP와 CoA를 놓고 경쟁하기 때문에 헥사노일-CoA당 3 말로닐-CoA를 산출하는 대략적인 비율을 목표로 삼았다. 경로는 나머지 성분을 일정하게 유지하면서 각 반응 성분을 개별적으로 적정함으로써 최적화되었다. OLS는 원하는 테트라케타이드 외에 막다른 부산물을 방출하는 부정확한 효소이며 최적화 과정의 주요 발견 중 하나는 부산물 형성을 억제하기 위해 OLS와 AAE3 농도의 균형을 맞추는 것이 중요하다는 것이었다. 실험은 OLS 및 AAE3 농도가 증가함에 따라 시스템이 OA에 비해 더 높은 분율의 부산물을 산출하는 것으로 나타났으며(도 4), 이는 다른 모든 반응 구성요소에 비해 폴리케타이드 개시, 연장 및 종료 이벤트를 조정하는 것이 중요함을 시사한다. 도 2B는 최적화된 MatB 시스템에 대한 반응 시간 과정을 보여준다. OA 생산은 2.5시간에 148 ± 34 mg/L(660 ± 150 μM)의 최종 역가에 도달했고 DA 생산은 4시간 만에 78 ± 12 mg/L(400 61 μM)의 최종 역가에 도달하였다.
가능한 억제에 대해 대사산물을 스크리닝하고 OA 및 DA 축적 모두가 경로를 억제한다는 것을 발견하였다. 도 2C에서 볼 수 있듯이 1mM OA는 DA 생성을 90%까지 감소시키는 반면 DA는 덜 강력한 억제제이며 1mM DA는 OA 생성을 30% 감소시킨다. 억제된 효소를 식별하기 위해 개별 효소를 경로에서 스크리닝한 결과 OA와 DA가 OLS 활성을 강력하게 억제한다는 것을 발견하였다(도 5).
OA/DA 억제를 감소시키기 위한 노력으로, OA/DA를 CBGA/CBGVA로 직접 전환하여 반응에서 제거하는 실험을 수행하였다. 이 GPP를 테스트하기 위해 안정화된 CBGA 합성효소가 시스템에 추가되었다(도 6). 사용된 CBGA 합성효소인 NphB M31S는 이전에 설계된 가용성 효소의 안정화된 버전이다(Valliere et al., Nat. Commun. 10:565, 2019). 개선된 역가 대신에 더 많은 GPP를 추가하면 실제로 더 적은 CBGA가 생성되어 GPP가 반응의 구성 요소를 억제할 수도 있음을 나타낸다. OA 생산에 대한 GPP 농도의 영향을 테스트하기 위해 실험을 수행하였다. 500μM GPP에서 OA 생산은 40% 감소하였다(도 2C). 종합하면, 결과는 전체 경로에서 높은 수준의 칸나비노이드 생산이 반응 과정 동안 낮은 농도의 OA/DA 및 GPP를 유지해야 함을 나타낸다.
AP 모듈은 그 다음 ATP 소비를 줄이기 위해 MdcA를 포함하는 AR 모듈로 테스트되었다(Mdc A 시스템, 도 2D). 도 2E에서 볼 수 있듯이 전체 AP 모듈은 5시간 내에 132 ± 24 mg/L의 OA 또는 250 ± 30 mg/L DA를 생성했으며, 이는 말로닐-CoA 생산을 위해 MatB를 사용하여 관찰된 것과 유사하다. 결과가 OLS가 가장 문제가 많은 효소임을 시사하기 때문에 칼콘 합성효소(OLS와 상동)의 알려진 활성화제에 초점을 맞춰 성능을 향상시킬 수 있는 첨가제를 선별하였다. 소 혈청 알부민(BSA)을 추가하면 OA 및 DA 생산이 모두 350 ± 10 mg/L로 향상되었다(도 2E).
그 다음, ISO 및 CAN 모듈은 외부에서 결합된 ISO/CAN 모듈에 OA/DA를 공급함으로써 AP 모듈과 별도로 테스트되었다. 결합된 ISO 모듈과 CAN 모듈 시스템은 15시간 동안 1350 ± 160mg/L의 CBGA 또는 2200 ± 261mg/L의 CBGVA를 산출했다(도 2F). 이러한 결과는 ISO 및 CAN 모듈이 효율적으로 기능할 수 있으므로 전체 시스템 성능이 AP 모듈의 기능에 의해 제한될 가능성이 있음을 시사한다.
그런 다음, 도 1에 도시된 바와 같은 완전한 경로를 조립하였다. 여러 라운드의 최적화 후에 시스템은 10시간 동안 480 ± 12 mg/L의 CBGA 또는 580 ± 38 mg/L의 CBGVA를 생성하였다(도 3A). AcP의 시작 농도는 역가를 줄이지 않고는 50mM 이상으로 증가할 수 없기 때문에 최적화의 핵심 요소였다(도 7). 또한, BSA는 20mg/mL의 이상적인 농도를 식별하도록 적정되었다(도 8). 도 3B는 CBGA 생산 과정에서 주요 중간체, GPP 및 OA를 보여준다. OA 농도는 일찍 급증한 다음 후속 CBGA 생산과 함께 OA가 감소하였다. 일단 모든 OA가 소비되면 GPP 수준의 증가가 관찰되었다. 이러한 결과는 ISO 모듈이 기능을 유지하지만 AP 모듈이 기능 장애를 일으키기 때문에 반응이 중단됨을 시사한다. 도 9에서 볼 수 있듯이 포스페이트 및 아세트산염 축적은 사용된 농도에서 반응에 최소한의 영향을 미친다. 기능 장애가 다른 대사 산물의 축적으로 인한 것인지 여부를 테스트하기 위해, 대사 산물은 여과에 의해 6시간 후에 CBGA 생산 시스템에서 제거되었고 새로운 삽입물 및 보조인자로 반응을 다시 시작했다. 재활용된 효소는 총 630 ± 20 mg/L의 CBGA 생산을 계속했으며 이는 효소가 활성 상태로 남아 있음을 시사한다(도 3C).
본 개시내용의 무세포 시스템이 지금까지 효모에서 보고된 것보다 거의 100배 더 높은 칸나비노이드 역가를 제공하고 추가 최적화의 여지가 남아 있다는 것은 고무적이다. 또한, 무세포 접근 방식의 장점은 문제가 잘 정의되어 있다는 것이다. 특히, OLS 효소가 시스템에서 약한 연결이라는 것은 분명하다. 천연 효소는 오류가 발생하기 쉽고 원치 않는 부산물을 쉽게 생성할 뿐만 아니라 시스템의 주요 중간체에 의해 억제된다. OA/DA와 GPP 생산의 균형이 OLS 기능에서 중요한 고려 사항이기 때문에 프로세스를 추가로 조정하면 결과가 더 향상될 수 있다. 또는 OLS는 엔지니어링 또는 지시된 진화에 의한 개선의 대상이어야 한다. 유사한 고려 사항이 천연 통합 막 효소를 대체하기 위해 여기에서 사용되는 효율적인 수용성 CBGA 합성 효소의 개발로 이어졌다. OLS의 구조는 최근에 결정되어 엔지니어링 노력을 향상시킬 수 있다. 이상적으로는 미생물 및 무세포 방법 모두 궁극적으로 비용 경쟁력이 있어 이러한 의학적으로 중요한 분자를 생산하기 위한 실행 가능한 옵션이 많이 있을 수 있다.
본 발명의 특정 실시예가 설명되었다. 본 발명의 사상 및 범위를 벗어나지 않고 다양한 수정이 이루어질 수 있음을 이해할 것이다. 다른 실시예는 다음 청구항의 범위 내에 있다.
SEQUENCE LISTING
<110> The Regents of the University of California
<120> BIOSYNTHETIC PLATFORM FOR BIOSYNTHETIC PLATFORM FOR THE
PRODUCTION OF CANNABINOIDS AND OTHER PRENYLATED COMPOUNDS
<130> 00011-090WO1
<140> Not yet assigned
<141> 2020-12-24
<150> US 62/953,719
<151> 2019-12-26
<160> 75
<170> PatentIn version 3.5
<210> 1
<211> 789
<212> DNA
<213> Escherichia coli
<220>
<221> CDS
<222> (1)..(789)
<400> 1
atg caa gtc gac ctg ctg ggt tca gcg caa tct gcg cac gcg tta cac 48
Met Gln Val Asp Leu Leu Gly Ser Ala Gln Ser Ala His Ala Leu His
1 5 10 15
ctt ttt cac caa cat tcc cct ctt gtg cac tgc atg acc aat gat gtg 96
Leu Phe His Gln His Ser Pro Leu Val His Cys Met Thr Asn Asp Val
20 25 30
gtg caa acc ttt acc gcc aat acc ttg ctg gcg ctc ggt gca tcg cca 144
Val Gln Thr Phe Thr Ala Asn Thr Leu Leu Ala Leu Gly Ala Ser Pro
35 40 45
gcg atg gtt atc gaa acc gaa gag gcc agt cag ttt gcg gct atc gcc 192
Ala Met Val Ile Glu Thr Glu Glu Ala Ser Gln Phe Ala Ala Ile Ala
50 55 60
agt gcc ttg ttg att aac gtt ggc aca ctg acg cag cca cgc gct cag 240
Ser Ala Leu Leu Ile Asn Val Gly Thr Leu Thr Gln Pro Arg Ala Gln
65 70 75 80
gcg atg cgt gct gcc gtt gag caa gca aaa agc tct caa aca ccc tgg 288
Ala Met Arg Ala Ala Val Glu Gln Ala Lys Ser Ser Gln Thr Pro Trp
85 90 95
acg ctt gat cca gta gcg gtg ggt gcg ctc gat tat cgc cgc cat ttt 336
Thr Leu Asp Pro Val Ala Val Gly Ala Leu Asp Tyr Arg Arg His Phe
100 105 110
tgt cat gaa ctt tta tct ttt aaa ccg gca gcg ata cgt ggt aat gct 384
Cys His Glu Leu Leu Ser Phe Lys Pro Ala Ala Ile Arg Gly Asn Ala
115 120 125
tcg gaa atc atg gca tta gct ggc att gct aat ggc gga cgg gga gtg 432
Ser Glu Ile Met Ala Leu Ala Gly Ile Ala Asn Gly Gly Arg Gly Val
130 135 140
gat acc act gac gcc gca gct aac gcg ata ccc gct gca caa aca ctg 480
Asp Thr Thr Asp Ala Ala Ala Asn Ala Ile Pro Ala Ala Gln Thr Leu
145 150 155 160
gca cgg gaa act ggc gca atc gtc gtg gtc act ggc gag atg gat tat 528
Ala Arg Glu Thr Gly Ala Ile Val Val Val Thr Gly Glu Met Asp Tyr
165 170 175
gtt acc gat gga cat cgt atc att ggt att cac ggt ggt gat ccg tta 576
Val Thr Asp Gly His Arg Ile Ile Gly Ile His Gly Gly Asp Pro Leu
180 185 190
atg acc aaa gtg gta gga act ggc tgt gca tta tcg gcg gtt gtc gct 624
Met Thr Lys Val Val Gly Thr Gly Cys Ala Leu Ser Ala Val Val Ala
195 200 205
gcc tgc tgt gcg tta cca ggc gat acg ctg gaa aat gtc gca tct gcc 672
Ala Cys Cys Ala Leu Pro Gly Asp Thr Leu Glu Asn Val Ala Ser Ala
210 215 220
tgt cac tgg atg aaa caa gcc gga gaa cgc gca gtc gcc aga agc gag 720
Cys His Trp Met Lys Gln Ala Gly Glu Arg Ala Val Ala Arg Ser Glu
225 230 235 240
ggg cca ggc agt ttt gtt cca cat ttc ctt gat gcg ctc tgg caa ttg 768
Gly Pro Gly Ser Phe Val Pro His Phe Leu Asp Ala Leu Trp Gln Leu
245 250 255
acg cag gag gtg cag gca taa 789
Thr Gln Glu Val Gln Ala
260
<210> 2
<211> 262
<212> PRT
<213> Escherichia coli
<400> 2
Met Gln Val Asp Leu Leu Gly Ser Ala Gln Ser Ala His Ala Leu His
1 5 10 15
Leu Phe His Gln His Ser Pro Leu Val His Cys Met Thr Asn Asp Val
20 25 30
Val Gln Thr Phe Thr Ala Asn Thr Leu Leu Ala Leu Gly Ala Ser Pro
35 40 45
Ala Met Val Ile Glu Thr Glu Glu Ala Ser Gln Phe Ala Ala Ile Ala
50 55 60
Ser Ala Leu Leu Ile Asn Val Gly Thr Leu Thr Gln Pro Arg Ala Gln
65 70 75 80
Ala Met Arg Ala Ala Val Glu Gln Ala Lys Ser Ser Gln Thr Pro Trp
85 90 95
Thr Leu Asp Pro Val Ala Val Gly Ala Leu Asp Tyr Arg Arg His Phe
100 105 110
Cys His Glu Leu Leu Ser Phe Lys Pro Ala Ala Ile Arg Gly Asn Ala
115 120 125
Ser Glu Ile Met Ala Leu Ala Gly Ile Ala Asn Gly Gly Arg Gly Val
130 135 140
Asp Thr Thr Asp Ala Ala Ala Asn Ala Ile Pro Ala Ala Gln Thr Leu
145 150 155 160
Ala Arg Glu Thr Gly Ala Ile Val Val Val Thr Gly Glu Met Asp Tyr
165 170 175
Val Thr Asp Gly His Arg Ile Ile Gly Ile His Gly Gly Asp Pro Leu
180 185 190
Met Thr Lys Val Val Gly Thr Gly Cys Ala Leu Ser Ala Val Val Ala
195 200 205
Ala Cys Cys Ala Leu Pro Gly Asp Thr Leu Glu Asn Val Ala Ser Ala
210 215 220
Cys His Trp Met Lys Gln Ala Gly Glu Arg Ala Val Ala Arg Ser Glu
225 230 235 240
Gly Pro Gly Ser Phe Val Pro His Phe Leu Asp Ala Leu Trp Gln Leu
245 250 255
Thr Gln Glu Val Gln Ala
260
<210> 3
<211> 1692
<212> DNA
<213> Cannabis sativa
<220>
<221> CDS
<222> (1)..(1692)
<400> 3
atg ggc agc agc cat cat cat cat cat cac agc agc ggc ctg gtg ccg 48
Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro
1 5 10 15
cgc ggc agc cat atg gaa aag agt ggc tac gga cgc gac ggt att tac 96
Arg Gly Ser His Met Glu Lys Ser Gly Tyr Gly Arg Asp Gly Ile Tyr
20 25 30
cgt agc ctg cgt cct cct tta cac ctg cca aac aat aac aat ttg agt 144
Arg Ser Leu Arg Pro Pro Leu His Leu Pro Asn Asn Asn Asn Leu Ser
35 40 45
atg gtc tca ttc ctg ttc cgt aac agc agc agc tat cca cag aaa ccg 192
Met Val Ser Phe Leu Phe Arg Asn Ser Ser Ser Tyr Pro Gln Lys Pro
50 55 60
gcg ttg atc gat agc gag act aat caa att tta tct ttt agt cat ttt 240
Ala Leu Ile Asp Ser Glu Thr Asn Gln Ile Leu Ser Phe Ser His Phe
65 70 75 80
aaa agc acc gtg atc aag gtc tcc cat ggc ttc tta aac ctg ggg atc 288
Lys Ser Thr Val Ile Lys Val Ser His Gly Phe Leu Asn Leu Gly Ile
85 90 95
aaa aag aat gac gtg gtt tta atc tac gca ccc aat tcg atc cac ttt 336
Lys Lys Asn Asp Val Val Leu Ile Tyr Ala Pro Asn Ser Ile His Phe
100 105 110
ccc gta tgc ttc ctt ggc att att gct tct ggg gcg atc gcc act act 384
Pro Val Cys Phe Leu Gly Ile Ile Ala Ser Gly Ala Ile Ala Thr Thr
115 120 125
tca aat cca tta tac acc gtg agt gag ttg tcg aaa caa gta aag gac 432
Ser Asn Pro Leu Tyr Thr Val Ser Glu Leu Ser Lys Gln Val Lys Asp
130 135 140
tcg aac cct aaa ttg att atc aca gtc cct cag tta ttg gaa aag gtc 480
Ser Asn Pro Lys Leu Ile Ile Thr Val Pro Gln Leu Leu Glu Lys Val
145 150 155 160
aag ggt ttc aat ctg cca act atc ctt atc ggc cct gat tct gag cag 528
Lys Gly Phe Asn Leu Pro Thr Ile Leu Ile Gly Pro Asp Ser Glu Gln
165 170 175
gaa tcg tct agt gat aaa gta atg act ttc aat gat ctg gtc aat ctg 576
Glu Ser Ser Ser Asp Lys Val Met Thr Phe Asn Asp Leu Val Asn Leu
180 185 190
gga gga agt tcg ggt agc gaa ttc cct atc gtc gac gat ttc aag caa 624
Gly Gly Ser Ser Gly Ser Glu Phe Pro Ile Val Asp Asp Phe Lys Gln
195 200 205
tcc gac acc gcc gca ctg ttg tac tca agt ggc acg aca ggt atg agc 672
Ser Asp Thr Ala Ala Leu Leu Tyr Ser Ser Gly Thr Thr Gly Met Ser
210 215 220
aag ggg gtc gtt ctg acg cac aaa aat ttt att gcc tca tcg ttg atg 720
Lys Gly Val Val Leu Thr His Lys Asn Phe Ile Ala Ser Ser Leu Met
225 230 235 240
gta aca atg gaa cag gac ttg gtc ggc gag atg gac aat gtg ttc ctg 768
Val Thr Met Glu Gln Asp Leu Val Gly Glu Met Asp Asn Val Phe Leu
245 250 255
tgt ttc ctt cct atg ttt cac gtc ttt ggc tta gcc att att acg tat 816
Cys Phe Leu Pro Met Phe His Val Phe Gly Leu Ala Ile Ile Thr Tyr
260 265 270
gct cag tta cag cgc ggt aat acc gtg att tca atg gcc cgc ttt gac 864
Ala Gln Leu Gln Arg Gly Asn Thr Val Ile Ser Met Ala Arg Phe Asp
275 280 285
ttg gaa aag atg tta aaa gat gtt gaa aag tac aaa gtt acc cac ctt 912
Leu Glu Lys Met Leu Lys Asp Val Glu Lys Tyr Lys Val Thr His Leu
290 295 300
tgg gtc gta ccc cca gtt atc tta gcg ttg tcg aag aac tca atg gtg 960
Trp Val Val Pro Pro Val Ile Leu Ala Leu Ser Lys Asn Ser Met Val
305 310 315 320
aaa aaa ttc aat ttg tca tcc atc aag tat att ggt tca ggc gct gcg 1008
Lys Lys Phe Asn Leu Ser Ser Ile Lys Tyr Ile Gly Ser Gly Ala Ala
325 330 335
cca tta gga aag gat ctg atg gaa gaa tgc tct aag gtg gtt cct tac 1056
Pro Leu Gly Lys Asp Leu Met Glu Glu Cys Ser Lys Val Val Pro Tyr
340 345 350
gga atc gtg gct caa gga tat ggc atg acg gaa acg tgc gga atc gta 1104
Gly Ile Val Ala Gln Gly Tyr Gly Met Thr Glu Thr Cys Gly Ile Val
355 360 365
tcc atg gaa gac atc cgc ggc ggg aaa cgc aat tca ggg tcg gcc gga 1152
Ser Met Glu Asp Ile Arg Gly Gly Lys Arg Asn Ser Gly Ser Ala Gly
370 375 380
atg ttg gca agt ggg gta gaa gct cag atc gtg agt gtg gac acc tta 1200
Met Leu Ala Ser Gly Val Glu Ala Gln Ile Val Ser Val Asp Thr Leu
385 390 395 400
aaa ccc ctt ccc ccg aat caa tta ggg gaa atc tgg gta aaa ggt cca 1248
Lys Pro Leu Pro Pro Asn Gln Leu Gly Glu Ile Trp Val Lys Gly Pro
405 410 415
aat atg atg caa ggc tat ttc aac aat cct caa gcg acc aaa ctt acc 1296
Asn Met Met Gln Gly Tyr Phe Asn Asn Pro Gln Ala Thr Lys Leu Thr
420 425 430
att gat aaa aag ggt tgg gtt cat act ggc gac ttg ggg tat ttc gac 1344
Ile Asp Lys Lys Gly Trp Val His Thr Gly Asp Leu Gly Tyr Phe Asp
435 440 445
gaa gac gga cac tta tat gtt gta gac cgt att aag gag ctt att aaa 1392
Glu Asp Gly His Leu Tyr Val Val Asp Arg Ile Lys Glu Leu Ile Lys
450 455 460
tac aag gga ttc caa gtt gcg cct gcg gaa ctg gag gga tta tta gtt 1440
Tyr Lys Gly Phe Gln Val Ala Pro Ala Glu Leu Glu Gly Leu Leu Val
465 470 475 480
agt cac ccc gag atc tta gac gcg gta gtt att ccc ttc ccc gat gct 1488
Ser His Pro Glu Ile Leu Asp Ala Val Val Ile Pro Phe Pro Asp Ala
485 490 495
gag gca ggc gaa gtc ccg gtg gca tac gtt gtt cgc tcg cct aac agt 1536
Glu Ala Gly Glu Val Pro Val Ala Tyr Val Val Arg Ser Pro Asn Ser
500 505 510
tcg ttg acc gaa aat gac gtt aaa aaa ttc atc gcc ggt cag gtc gcc 1584
Ser Leu Thr Glu Asn Asp Val Lys Lys Phe Ile Ala Gly Gln Val Ala
515 520 525
tcc ttt aag cgt ctg cgc aag gtt act ttt att aat tcc gtc ccc aag 1632
Ser Phe Lys Arg Leu Arg Lys Val Thr Phe Ile Asn Ser Val Pro Lys
530 535 540
agc gca agt ggg aag att ctg cgc cgc gag ctt att caa aag gtt cgc 1680
Ser Ala Ser Gly Lys Ile Leu Arg Arg Glu Leu Ile Gln Lys Val Arg
545 550 555 560
tct aac atg taa 1692
Ser Asn Met
<210> 4
<211> 563
<212> PRT
<213> Cannabis sativa
<400> 4
Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro
1 5 10 15
Arg Gly Ser His Met Glu Lys Ser Gly Tyr Gly Arg Asp Gly Ile Tyr
20 25 30
Arg Ser Leu Arg Pro Pro Leu His Leu Pro Asn Asn Asn Asn Leu Ser
35 40 45
Met Val Ser Phe Leu Phe Arg Asn Ser Ser Ser Tyr Pro Gln Lys Pro
50 55 60
Ala Leu Ile Asp Ser Glu Thr Asn Gln Ile Leu Ser Phe Ser His Phe
65 70 75 80
Lys Ser Thr Val Ile Lys Val Ser His Gly Phe Leu Asn Leu Gly Ile
85 90 95
Lys Lys Asn Asp Val Val Leu Ile Tyr Ala Pro Asn Ser Ile His Phe
100 105 110
Pro Val Cys Phe Leu Gly Ile Ile Ala Ser Gly Ala Ile Ala Thr Thr
115 120 125
Ser Asn Pro Leu Tyr Thr Val Ser Glu Leu Ser Lys Gln Val Lys Asp
130 135 140
Ser Asn Pro Lys Leu Ile Ile Thr Val Pro Gln Leu Leu Glu Lys Val
145 150 155 160
Lys Gly Phe Asn Leu Pro Thr Ile Leu Ile Gly Pro Asp Ser Glu Gln
165 170 175
Glu Ser Ser Ser Asp Lys Val Met Thr Phe Asn Asp Leu Val Asn Leu
180 185 190
Gly Gly Ser Ser Gly Ser Glu Phe Pro Ile Val Asp Asp Phe Lys Gln
195 200 205
Ser Asp Thr Ala Ala Leu Leu Tyr Ser Ser Gly Thr Thr Gly Met Ser
210 215 220
Lys Gly Val Val Leu Thr His Lys Asn Phe Ile Ala Ser Ser Leu Met
225 230 235 240
Val Thr Met Glu Gln Asp Leu Val Gly Glu Met Asp Asn Val Phe Leu
245 250 255
Cys Phe Leu Pro Met Phe His Val Phe Gly Leu Ala Ile Ile Thr Tyr
260 265 270
Ala Gln Leu Gln Arg Gly Asn Thr Val Ile Ser Met Ala Arg Phe Asp
275 280 285
Leu Glu Lys Met Leu Lys Asp Val Glu Lys Tyr Lys Val Thr His Leu
290 295 300
Trp Val Val Pro Pro Val Ile Leu Ala Leu Ser Lys Asn Ser Met Val
305 310 315 320
Lys Lys Phe Asn Leu Ser Ser Ile Lys Tyr Ile Gly Ser Gly Ala Ala
325 330 335
Pro Leu Gly Lys Asp Leu Met Glu Glu Cys Ser Lys Val Val Pro Tyr
340 345 350
Gly Ile Val Ala Gln Gly Tyr Gly Met Thr Glu Thr Cys Gly Ile Val
355 360 365
Ser Met Glu Asp Ile Arg Gly Gly Lys Arg Asn Ser Gly Ser Ala Gly
370 375 380
Met Leu Ala Ser Gly Val Glu Ala Gln Ile Val Ser Val Asp Thr Leu
385 390 395 400
Lys Pro Leu Pro Pro Asn Gln Leu Gly Glu Ile Trp Val Lys Gly Pro
405 410 415
Asn Met Met Gln Gly Tyr Phe Asn Asn Pro Gln Ala Thr Lys Leu Thr
420 425 430
Ile Asp Lys Lys Gly Trp Val His Thr Gly Asp Leu Gly Tyr Phe Asp
435 440 445
Glu Asp Gly His Leu Tyr Val Val Asp Arg Ile Lys Glu Leu Ile Lys
450 455 460
Tyr Lys Gly Phe Gln Val Ala Pro Ala Glu Leu Glu Gly Leu Leu Val
465 470 475 480
Ser His Pro Glu Ile Leu Asp Ala Val Val Ile Pro Phe Pro Asp Ala
485 490 495
Glu Ala Gly Glu Val Pro Val Ala Tyr Val Val Arg Ser Pro Asn Ser
500 505 510
Ser Leu Thr Glu Asn Asp Val Lys Lys Phe Ile Ala Gly Gln Val Ala
515 520 525
Ser Phe Lys Arg Leu Arg Lys Val Thr Phe Ile Asn Ser Val Pro Lys
530 535 540
Ser Ala Ser Gly Lys Ile Leu Arg Arg Glu Leu Ile Gln Lys Val Arg
545 550 555 560
Ser Asn Met
<210> 5
<211> 1713
<212> DNA
<213> Geobacillus sp. 44B
<220>
<221> CDS
<222> (1)..(1713)
<400> 5
atg ggc agc agc cat cat cat cat cat cac agc agc ggc ctg gtg ccg 48
Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro
1 5 10 15
cgc ggc agc cat atg aat aga ata cac cgg tct aaa cgt tca tgg aca 96
Arg Gly Ser His Met Asn Arg Ile His Arg Ser Lys Arg Ser Trp Thr
20 25 30
acg cgt cgc gat gcg aag gca aag cga atg gca aaa ttg gag cga gtc 144
Thr Arg Arg Asp Ala Lys Ala Lys Arg Met Ala Lys Leu Glu Arg Val
35 40 45
gtg aac gga aaa att ata cca aca gat aaa att gta gag gca tta gaa 192
Val Asn Gly Lys Ile Ile Pro Thr Asp Lys Ile Val Glu Ala Leu Glu
50 55 60
gcg gtt att gct cca ggg gat cgt gtt gtg tta gaa gga aat aat caa 240
Ala Val Ile Ala Pro Gly Asp Arg Val Val Leu Glu Gly Asn Asn Gln
65 70 75 80
aaa caa gct tcg ttt cta tcc aag gca tta tcc aaa gtt aac cct gag 288
Lys Gln Ala Ser Phe Leu Ser Lys Ala Leu Ser Lys Val Asn Pro Glu
85 90 95
aaa gtg aac gga tta cat atg att atg tcc agt gta tcg cga cca gag 336
Lys Val Asn Gly Leu His Met Ile Met Ser Ser Val Ser Arg Pro Glu
100 105 110
cat tta gat ata ttt gaa aaa gga atc gct aga aaa att gat ttt tct 384
His Leu Asp Ile Phe Glu Lys Gly Ile Ala Arg Lys Ile Asp Phe Ser
115 120 125
tat gcc ggc cca caa agt ctt cgc atg tca caa atg ctg gaa gac gga 432
Tyr Ala Gly Pro Gln Ser Leu Arg Met Ser Gln Met Leu Glu Asp Gly
130 135 140
aag ctt att ata ggg gaa atc cat acc tat ctt gag cta tat ggg cgg 480
Lys Leu Ile Ile Gly Glu Ile His Thr Tyr Leu Glu Leu Tyr Gly Arg
145 150 155 160
tta ttt att gat ttg act ccg tct gtt gca cta gtg gcg gcg gat aaa 528
Leu Phe Ile Asp Leu Thr Pro Ser Val Ala Leu Val Ala Ala Asp Lys
165 170 175
gca gac cga tcg ggc aat ttg tat aca gga cct aat aca gag gaa act 576
Ala Asp Arg Ser Gly Asn Leu Tyr Thr Gly Pro Asn Thr Glu Glu Thr
180 185 190
cca acg ctt gtt gaa gct acg gca ttc cgg gac gga atc gtt ata gcc 624
Pro Thr Leu Val Glu Ala Thr Ala Phe Arg Asp Gly Ile Val Ile Ala
195 200 205
caa gta aat gaa ctg gca gat gaa ctg cca cgg gta gat ata cct ggc 672
Gln Val Asn Glu Leu Ala Asp Glu Leu Pro Arg Val Asp Ile Pro Gly
210 215 220
tct tgg att gat ttt atc gtt gtt gct gac cag cct tat gaa tta gaa 720
Ser Trp Ile Asp Phe Ile Val Val Ala Asp Gln Pro Tyr Glu Leu Glu
225 230 235 240
cct ctt ttt aca aga gat cct cgc ctt att aca gaa atc cag att ctt 768
Pro Leu Phe Thr Arg Asp Pro Arg Leu Ile Thr Glu Ile Gln Ile Leu
245 250 255
atg gcg atg atg acg att aga ggg ata tat gaa cgt cat aac atc caa 816
Met Ala Met Met Thr Ile Arg Gly Ile Tyr Glu Arg His Asn Ile Gln
260 265 270
tct ctc aac cat gga atc gga ttt aat act gcg gcg att gag tta ttg 864
Ser Leu Asn His Gly Ile Gly Phe Asn Thr Ala Ala Ile Glu Leu Leu
275 280 285
ctt cca acg tac gga gaa tca tta gga ttg aag ggg aaa att tgc aga 912
Leu Pro Thr Tyr Gly Glu Ser Leu Gly Leu Lys Gly Lys Ile Cys Arg
290 295 300
cat tgg gca ttg aat ccg cat cct acc ctt ata cca gct att gaa aca 960
His Trp Ala Leu Asn Pro His Pro Thr Leu Ile Pro Ala Ile Glu Thr
305 310 315 320
gga tgg gta gaa agc att cat tgt ttt gga gga gaa gta gga atg gaa 1008
Gly Trp Val Glu Ser Ile His Cys Phe Gly Gly Glu Val Gly Met Glu
325 330 335
aag tat att gcg gca cgt ccc gat gtg ttc ttt act gga aaa gat ggg 1056
Lys Tyr Ile Ala Ala Arg Pro Asp Val Phe Phe Thr Gly Lys Asp Gly
340 345 350
agt tta cgt tca aac cgg gca tta tcc caa gta gct gga cag tat gct 1104
Ser Leu Arg Ser Asn Arg Ala Leu Ser Gln Val Ala Gly Gln Tyr Ala
355 360 365
gtc gat ctt ttt atc ggt tct act cta cag atg gat agg gat ggg aat 1152
Val Asp Leu Phe Ile Gly Ser Thr Leu Gln Met Asp Arg Asp Gly Asn
370 375 380
tct tca aca gta acg att gga aga ctg gca gga ttc ggc ggg gca cca 1200
Ser Ser Thr Val Thr Ile Gly Arg Leu Ala Gly Phe Gly Gly Ala Pro
385 390 395 400
aac atg ggg cat gat cct cgt gga cgg cgc cat tcc act cct gca tgg 1248
Asn Met Gly His Asp Pro Arg Gly Arg Arg His Ser Thr Pro Ala Trp
405 410 415
cta gat atg ata acg tcc gat cat ccg atc gcg aaa gga aaa aaa tta 1296
Leu Asp Met Ile Thr Ser Asp His Pro Ile Ala Lys Gly Lys Lys Leu
420 425 430
gtc gtg cag ata gta gaa acg ttt caa aaa gga aat cga ccg gta ttt 1344
Val Val Gln Ile Val Glu Thr Phe Gln Lys Gly Asn Arg Pro Val Phe
435 440 445
gtt gag tct tta gat gcg att gaa gta ggg aaa aag gcg aat ttg gcg 1392
Val Glu Ser Leu Asp Ala Ile Glu Val Gly Lys Lys Ala Asn Leu Ala
450 455 460
aca gcg cca att atg ata tat ggg gat gat gtg acc cat gtt gtc act 1440
Thr Ala Pro Ile Met Ile Tyr Gly Asp Asp Val Thr His Val Val Thr
465 470 475 480
gaa gaa gga atc gca tat ttg tat aag gcg aat agt tta gaa gaa cgc 1488
Glu Glu Gly Ile Ala Tyr Leu Tyr Lys Ala Asn Ser Leu Glu Glu Arg
485 490 495
cgt cag gcc att gcg gca atc gcc gga gtc aca ccg att ggg cta gaa 1536
Arg Gln Ala Ile Ala Ala Ile Ala Gly Val Thr Pro Ile Gly Leu Glu
500 505 510
cat gat cca aaa aga act gag cag ttg cga agg gat gga ttg gtg gcg 1584
His Asp Pro Lys Arg Thr Glu Gln Leu Arg Arg Asp Gly Leu Val Ala
515 520 525
ttt ccg gag gat tta ggc ata cgc cgt acc gat gcc aaa cgt tct tta 1632
Phe Pro Glu Asp Leu Gly Ile Arg Arg Thr Asp Ala Lys Arg Ser Leu
530 535 540
tta gca gca aaa agc att gaa gaa ctg gtt gaa tgg tcg gag gga ttg 1680
Leu Ala Ala Lys Ser Ile Glu Glu Leu Val Glu Trp Ser Glu Gly Leu
545 550 555 560
tat gaa ccg ccg gct aga ttt cgc agc tgg taa 1713
Tyr Glu Pro Pro Ala Arg Phe Arg Ser Trp
565 570
<210> 6
<211> 570
<212> PRT
<213> Geobacillus sp. 44B
<400> 6
Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro
1 5 10 15
Arg Gly Ser His Met Asn Arg Ile His Arg Ser Lys Arg Ser Trp Thr
20 25 30
Thr Arg Arg Asp Ala Lys Ala Lys Arg Met Ala Lys Leu Glu Arg Val
35 40 45
Val Asn Gly Lys Ile Ile Pro Thr Asp Lys Ile Val Glu Ala Leu Glu
50 55 60
Ala Val Ile Ala Pro Gly Asp Arg Val Val Leu Glu Gly Asn Asn Gln
65 70 75 80
Lys Gln Ala Ser Phe Leu Ser Lys Ala Leu Ser Lys Val Asn Pro Glu
85 90 95
Lys Val Asn Gly Leu His Met Ile Met Ser Ser Val Ser Arg Pro Glu
100 105 110
His Leu Asp Ile Phe Glu Lys Gly Ile Ala Arg Lys Ile Asp Phe Ser
115 120 125
Tyr Ala Gly Pro Gln Ser Leu Arg Met Ser Gln Met Leu Glu Asp Gly
130 135 140
Lys Leu Ile Ile Gly Glu Ile His Thr Tyr Leu Glu Leu Tyr Gly Arg
145 150 155 160
Leu Phe Ile Asp Leu Thr Pro Ser Val Ala Leu Val Ala Ala Asp Lys
165 170 175
Ala Asp Arg Ser Gly Asn Leu Tyr Thr Gly Pro Asn Thr Glu Glu Thr
180 185 190
Pro Thr Leu Val Glu Ala Thr Ala Phe Arg Asp Gly Ile Val Ile Ala
195 200 205
Gln Val Asn Glu Leu Ala Asp Glu Leu Pro Arg Val Asp Ile Pro Gly
210 215 220
Ser Trp Ile Asp Phe Ile Val Val Ala Asp Gln Pro Tyr Glu Leu Glu
225 230 235 240
Pro Leu Phe Thr Arg Asp Pro Arg Leu Ile Thr Glu Ile Gln Ile Leu
245 250 255
Met Ala Met Met Thr Ile Arg Gly Ile Tyr Glu Arg His Asn Ile Gln
260 265 270
Ser Leu Asn His Gly Ile Gly Phe Asn Thr Ala Ala Ile Glu Leu Leu
275 280 285
Leu Pro Thr Tyr Gly Glu Ser Leu Gly Leu Lys Gly Lys Ile Cys Arg
290 295 300
His Trp Ala Leu Asn Pro His Pro Thr Leu Ile Pro Ala Ile Glu Thr
305 310 315 320
Gly Trp Val Glu Ser Ile His Cys Phe Gly Gly Glu Val Gly Met Glu
325 330 335
Lys Tyr Ile Ala Ala Arg Pro Asp Val Phe Phe Thr Gly Lys Asp Gly
340 345 350
Ser Leu Arg Ser Asn Arg Ala Leu Ser Gln Val Ala Gly Gln Tyr Ala
355 360 365
Val Asp Leu Phe Ile Gly Ser Thr Leu Gln Met Asp Arg Asp Gly Asn
370 375 380
Ser Ser Thr Val Thr Ile Gly Arg Leu Ala Gly Phe Gly Gly Ala Pro
385 390 395 400
Asn Met Gly His Asp Pro Arg Gly Arg Arg His Ser Thr Pro Ala Trp
405 410 415
Leu Asp Met Ile Thr Ser Asp His Pro Ile Ala Lys Gly Lys Lys Leu
420 425 430
Val Val Gln Ile Val Glu Thr Phe Gln Lys Gly Asn Arg Pro Val Phe
435 440 445
Val Glu Ser Leu Asp Ala Ile Glu Val Gly Lys Lys Ala Asn Leu Ala
450 455 460
Thr Ala Pro Ile Met Ile Tyr Gly Asp Asp Val Thr His Val Val Thr
465 470 475 480
Glu Glu Gly Ile Ala Tyr Leu Tyr Lys Ala Asn Ser Leu Glu Glu Arg
485 490 495
Arg Gln Ala Ile Ala Ala Ile Ala Gly Val Thr Pro Ile Gly Leu Glu
500 505 510
His Asp Pro Lys Arg Thr Glu Gln Leu Arg Arg Asp Gly Leu Val Ala
515 520 525
Phe Pro Glu Asp Leu Gly Ile Arg Arg Thr Asp Ala Lys Arg Ser Leu
530 535 540
Leu Ala Ala Lys Ser Ile Glu Glu Leu Val Glu Trp Ser Glu Gly Leu
545 550 555 560
Tyr Glu Pro Pro Ala Arg Phe Arg Ser Trp
565 570
<210> 7
<211> 1038
<212> DNA
<213> Geobacillus stearothermophilus
<220>
<221> CDS
<222> (1)..(1038)
<400> 7
atg ggc agc agc cat cat cat cat cat cac agc agc ggc ctg gtg ccg 48
Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro
1 5 10 15
cgc ggc agc cat atg aca acc gat tta ttt acg gca tta aaa gcg aaa 96
Arg Gly Ser His Met Thr Thr Asp Leu Phe Thr Ala Leu Lys Ala Lys
20 25 30
gta acc ggt acg gct cga aaa atc gtg ttt ccc gag gga acc gat gac 144
Val Thr Gly Thr Ala Arg Lys Ile Val Phe Pro Glu Gly Thr Asp Asp
35 40 45
cgc atc tta acg gcg gcg agc cgt ttg gcg acg gag caa gtg ctt cag 192
Arg Ile Leu Thr Ala Ala Ser Arg Leu Ala Thr Glu Gln Val Leu Gln
50 55 60
ccg atc gtc ctt ggc gat gag caa gcg ata agg gtg aaa gca gct gcg 240
Pro Ile Val Leu Gly Asp Glu Gln Ala Ile Arg Val Lys Ala Ala Ala
65 70 75 80
ctt ggc ttg ccg ctt gaa ggg gtg gag att gtc aac ccg cgc cgc tac 288
Leu Gly Leu Pro Leu Glu Gly Val Glu Ile Val Asn Pro Arg Arg Tyr
85 90 95
ggc ggg ttt gat gag cta gtt tcg gcg ttt gtg gag cgg cgc aaa ggg 336
Gly Gly Phe Asp Glu Leu Val Ser Ala Phe Val Glu Arg Arg Lys Gly
100 105 110
aaa gtg aca gaa gaa acg gcg cgc gag ttg ctt ttc gat gaa aac tat 384
Lys Val Thr Glu Glu Thr Ala Arg Glu Leu Leu Phe Asp Glu Asn Tyr
115 120 125
ttc ggt acg atg ctc gtt tat atg gga gcg gcc gac ggc ctc gtc agc 432
Phe Gly Thr Met Leu Val Tyr Met Gly Ala Ala Asp Gly Leu Val Ser
130 135 140
ggg gcg gca cat tcg acg gcg gat acg gtc cga cca gcc ttg caa atc 480
Gly Ala Ala His Ser Thr Ala Asp Thr Val Arg Pro Ala Leu Gln Ile
145 150 155 160
att aaa acg aag cca ggc gtt gac aaa acg tcc ggc gtg ttc atc atg 528
Ile Lys Thr Lys Pro Gly Val Asp Lys Thr Ser Gly Val Phe Ile Met
165 170 175
gtg cgc ggc gac gaa aaa tat gtg ttt gcc gat tgc gcc atc aac att 576
Val Arg Gly Asp Glu Lys Tyr Val Phe Ala Asp Cys Ala Ile Asn Ile
180 185 190
gct cct aac agt cat gat ttg gct gaa atc gcg gtc gag agc gcc cgg 624
Ala Pro Asn Ser His Asp Leu Ala Glu Ile Ala Val Glu Ser Ala Arg
195 200 205
acg gcc aaa atg ttc ggc ctt aag ccg cgc gta gtg ctg tta agc ttt 672
Thr Ala Lys Met Phe Gly Leu Lys Pro Arg Val Val Leu Leu Ser Phe
210 215 220
tcc acg aaa ggg tcg gcc tcg tcg ccg gag acg gaa aaa gtc gtt gag 720
Ser Thr Lys Gly Ser Ala Ser Ser Pro Glu Thr Glu Lys Val Val Glu
225 230 235 240
gcg gtg cgg ttg gcg aaa gaa atg gcg ccg gat ctg atc ctt gac ggt 768
Ala Val Arg Leu Ala Lys Glu Met Ala Pro Asp Leu Ile Leu Asp Gly
245 250 255
gag ttt caa ttt gac gcc gcg ttt gtg cca gag gtg gcg aaa aag aaa 816
Glu Phe Gln Phe Asp Ala Ala Phe Val Pro Glu Val Ala Lys Lys Lys
260 265 270
gcg ccg gac tcg gtc att caa ggg gac gca aat gtc ttt att ttc ccg 864
Ala Pro Asp Ser Val Ile Gln Gly Asp Ala Asn Val Phe Ile Phe Pro
275 280 285
agc ctt gag gcg ggc aac atc ggc tac aaa atc gcc cag cgc ctt ggc 912
Ser Leu Glu Ala Gly Asn Ile Gly Tyr Lys Ile Ala Gln Arg Leu Gly
290 295 300
ggc ttt gaa gcg gtt ggc ccg att ttg caa ggg ctg aac aag ccg gtt 960
Gly Phe Glu Ala Val Gly Pro Ile Leu Gln Gly Leu Asn Lys Pro Val
305 310 315 320
aac gac cta tcg cgc ggc tgc agc gcc gaa gac gcc tac aag ctc gcg 1008
Asn Asp Leu Ser Arg Gly Cys Ser Ala Glu Asp Ala Tyr Lys Leu Ala
325 330 335
ctc atc acc gcg gcg cag tcg ctt ggg gag 1038
Leu Ile Thr Ala Ala Gln Ser Leu Gly Glu
340 345
<210> 8
<211> 346
<212> PRT
<213> Geobacillus stearothermophilus
<400> 8
Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro
1 5 10 15
Arg Gly Ser His Met Thr Thr Asp Leu Phe Thr Ala Leu Lys Ala Lys
20 25 30
Val Thr Gly Thr Ala Arg Lys Ile Val Phe Pro Glu Gly Thr Asp Asp
35 40 45
Arg Ile Leu Thr Ala Ala Ser Arg Leu Ala Thr Glu Gln Val Leu Gln
50 55 60
Pro Ile Val Leu Gly Asp Glu Gln Ala Ile Arg Val Lys Ala Ala Ala
65 70 75 80
Leu Gly Leu Pro Leu Glu Gly Val Glu Ile Val Asn Pro Arg Arg Tyr
85 90 95
Gly Gly Phe Asp Glu Leu Val Ser Ala Phe Val Glu Arg Arg Lys Gly
100 105 110
Lys Val Thr Glu Glu Thr Ala Arg Glu Leu Leu Phe Asp Glu Asn Tyr
115 120 125
Phe Gly Thr Met Leu Val Tyr Met Gly Ala Ala Asp Gly Leu Val Ser
130 135 140
Gly Ala Ala His Ser Thr Ala Asp Thr Val Arg Pro Ala Leu Gln Ile
145 150 155 160
Ile Lys Thr Lys Pro Gly Val Asp Lys Thr Ser Gly Val Phe Ile Met
165 170 175
Val Arg Gly Asp Glu Lys Tyr Val Phe Ala Asp Cys Ala Ile Asn Ile
180 185 190
Ala Pro Asn Ser His Asp Leu Ala Glu Ile Ala Val Glu Ser Ala Arg
195 200 205
Thr Ala Lys Met Phe Gly Leu Lys Pro Arg Val Val Leu Leu Ser Phe
210 215 220
Ser Thr Lys Gly Ser Ala Ser Ser Pro Glu Thr Glu Lys Val Val Glu
225 230 235 240
Ala Val Arg Leu Ala Lys Glu Met Ala Pro Asp Leu Ile Leu Asp Gly
245 250 255
Glu Phe Gln Phe Asp Ala Ala Phe Val Pro Glu Val Ala Lys Lys Lys
260 265 270
Ala Pro Asp Ser Val Ile Gln Gly Asp Ala Asn Val Phe Ile Phe Pro
275 280 285
Ser Leu Glu Ala Gly Asn Ile Gly Tyr Lys Ile Ala Gln Arg Leu Gly
290 295 300
Gly Phe Glu Ala Val Gly Pro Ile Leu Gln Gly Leu Asn Lys Pro Val
305 310 315 320
Asn Asp Leu Ser Arg Gly Cys Ser Ala Glu Asp Ala Tyr Lys Leu Ala
325 330 335
Leu Ile Thr Ala Ala Gln Ser Leu Gly Glu
340 345
<210> 9
<211> 1218
<212> DNA
<213> Cannibis sativa
<220>
<221> CDS
<222> (1)..(1218)
<400> 9
atg ggc agc agc cat cat cat cat cat cac agc agc ggc ctg gtg ccg 48
Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro
1 5 10 15
cgc ggc agc cat atg aat cat ctg cgt gct gaa gga cca gct tcc gta 96
Arg Gly Ser His Met Asn His Leu Arg Ala Glu Gly Pro Ala Ser Val
20 25 30
ttg gca att gga aca gct aac cct gag aac att ctt ctt cag gat gag 144
Leu Ala Ile Gly Thr Ala Asn Pro Glu Asn Ile Leu Leu Gln Asp Glu
35 40 45
ttt ccc gac tat tac ttc cgc gtg aca aag agc gaa cac atg aca cag 192
Phe Pro Asp Tyr Tyr Phe Arg Val Thr Lys Ser Glu His Met Thr Gln
50 55 60
ctt aaa gag aag ttc cgt aag atc tgt gac aaa agc atg atc cgc aaa 240
Leu Lys Glu Lys Phe Arg Lys Ile Cys Asp Lys Ser Met Ile Arg Lys
65 70 75 80
cgt aac tgc ttc ctt aac gag gag cat ctg aag cag aat ccc cgt ctt 288
Arg Asn Cys Phe Leu Asn Glu Glu His Leu Lys Gln Asn Pro Arg Leu
85 90 95
gtt gaa cat gag atg cag acc ttg gat gct cgc cag gac atg ttg gtt 336
Val Glu His Glu Met Gln Thr Leu Asp Ala Arg Gln Asp Met Leu Val
100 105 110
gtt gag gtc cct aag ctg ggc aaa gat gcg tgt gca aaa gcg att aaa 384
Val Glu Val Pro Lys Leu Gly Lys Asp Ala Cys Ala Lys Ala Ile Lys
115 120 125
gag tgg ggg cag cct aaa agc aaa att act cat ctg att ttc aca agc 432
Glu Trp Gly Gln Pro Lys Ser Lys Ile Thr His Leu Ile Phe Thr Ser
130 135 140
gcc agt aca acc gat atg ccc ggt gcg gac tac cat tgt gca aaa tta 480
Ala Ser Thr Thr Asp Met Pro Gly Ala Asp Tyr His Cys Ala Lys Leu
145 150 155 160
ttg ggt tta tcg cct tca gta aaa cgt gtt atg atg tac cag tta gga 528
Leu Gly Leu Ser Pro Ser Val Lys Arg Val Met Met Tyr Gln Leu Gly
165 170 175
tgc tac ggt ggt ggc acc gta ctt cgt att gcg aag gac atc gcc gag 576
Cys Tyr Gly Gly Gly Thr Val Leu Arg Ile Ala Lys Asp Ile Ala Glu
180 185 190
aac aac aaa gga gcc cgt gta ctt gct gta tgt tgt gat atc atg gcg 624
Asn Asn Lys Gly Ala Arg Val Leu Ala Val Cys Cys Asp Ile Met Ala
195 200 205
tgc ctt ttt cgc ggc ccc agc gag agt gac ctt gag tta ctt gtg ggg 672
Cys Leu Phe Arg Gly Pro Ser Glu Ser Asp Leu Glu Leu Leu Val Gly
210 215 220
cag gcc atc ttc gga gac ggt gcc gca gcc gtc att gtt ggc gca gag 720
Gln Ala Ile Phe Gly Asp Gly Ala Ala Ala Val Ile Val Gly Ala Glu
225 230 235 240
ccc gat gaa tcc gtt ggc gag cgc ccg atc ttt gag ctt gta agt aca 768
Pro Asp Glu Ser Val Gly Glu Arg Pro Ile Phe Glu Leu Val Ser Thr
245 250 255
gga caa act atc ttg ccc aac tct gag ggg act atc ggc gga cat att 816
Gly Gln Thr Ile Leu Pro Asn Ser Glu Gly Thr Ile Gly Gly His Ile
260 265 270
cgt gag gcg ggc ttg att ttt gac ctt cac aag gat gtt cca atg ctt 864
Arg Glu Ala Gly Leu Ile Phe Asp Leu His Lys Asp Val Pro Met Leu
275 280 285
atc tcc aat aat att gaa aaa tgt ctt atc gaa gca ttc act ccg att 912
Ile Ser Asn Asn Ile Glu Lys Cys Leu Ile Glu Ala Phe Thr Pro Ile
290 295 300
ggt atc tcc gat tgg aat tcg att ttt tgg atc acc cat cct ggt ggg 960
Gly Ile Ser Asp Trp Asn Ser Ile Phe Trp Ile Thr His Pro Gly Gly
305 310 315 320
aaa gct att tta gac aag gtg gag gag aaa tta cat ctt aag tca gat 1008
Lys Ala Ile Leu Asp Lys Val Glu Glu Lys Leu His Leu Lys Ser Asp
325 330 335
aag ttt gtc gac agt cgc cac gtg ttg tcg gaa cat ggc aac atg tca 1056
Lys Phe Val Asp Ser Arg His Val Leu Ser Glu His Gly Asn Met Ser
340 345 350
tcg tca acc gtc ttg ttc gtt atg gac gaa tta cgt aaa cgc agt tta 1104
Ser Ser Thr Val Leu Phe Val Met Asp Glu Leu Arg Lys Arg Ser Leu
355 360 365
gaa gag ggt aag agt acg acg ggg gac ggg ttc gag tgg gga gtc tta 1152
Glu Glu Gly Lys Ser Thr Thr Gly Asp Gly Phe Glu Trp Gly Val Leu
370 375 380
ttc ggg ttc ggt cca gga ttg aca gtg gaa cgc gtc gtg gtt cgc agt 1200
Phe Gly Phe Gly Pro Gly Leu Thr Val Glu Arg Val Val Val Arg Ser
385 390 395 400
gtc ccc att aag tac taa 1218
Val Pro Ile Lys Tyr
405
<210> 10
<211> 405
<212> PRT
<213> Cannibis sativa
<400> 10
Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro
1 5 10 15
Arg Gly Ser His Met Asn His Leu Arg Ala Glu Gly Pro Ala Ser Val
20 25 30
Leu Ala Ile Gly Thr Ala Asn Pro Glu Asn Ile Leu Leu Gln Asp Glu
35 40 45
Phe Pro Asp Tyr Tyr Phe Arg Val Thr Lys Ser Glu His Met Thr Gln
50 55 60
Leu Lys Glu Lys Phe Arg Lys Ile Cys Asp Lys Ser Met Ile Arg Lys
65 70 75 80
Arg Asn Cys Phe Leu Asn Glu Glu His Leu Lys Gln Asn Pro Arg Leu
85 90 95
Val Glu His Glu Met Gln Thr Leu Asp Ala Arg Gln Asp Met Leu Val
100 105 110
Val Glu Val Pro Lys Leu Gly Lys Asp Ala Cys Ala Lys Ala Ile Lys
115 120 125
Glu Trp Gly Gln Pro Lys Ser Lys Ile Thr His Leu Ile Phe Thr Ser
130 135 140
Ala Ser Thr Thr Asp Met Pro Gly Ala Asp Tyr His Cys Ala Lys Leu
145 150 155 160
Leu Gly Leu Ser Pro Ser Val Lys Arg Val Met Met Tyr Gln Leu Gly
165 170 175
Cys Tyr Gly Gly Gly Thr Val Leu Arg Ile Ala Lys Asp Ile Ala Glu
180 185 190
Asn Asn Lys Gly Ala Arg Val Leu Ala Val Cys Cys Asp Ile Met Ala
195 200 205
Cys Leu Phe Arg Gly Pro Ser Glu Ser Asp Leu Glu Leu Leu Val Gly
210 215 220
Gln Ala Ile Phe Gly Asp Gly Ala Ala Ala Val Ile Val Gly Ala Glu
225 230 235 240
Pro Asp Glu Ser Val Gly Glu Arg Pro Ile Phe Glu Leu Val Ser Thr
245 250 255
Gly Gln Thr Ile Leu Pro Asn Ser Glu Gly Thr Ile Gly Gly His Ile
260 265 270
Arg Glu Ala Gly Leu Ile Phe Asp Leu His Lys Asp Val Pro Met Leu
275 280 285
Ile Ser Asn Asn Ile Glu Lys Cys Leu Ile Glu Ala Phe Thr Pro Ile
290 295 300
Gly Ile Ser Asp Trp Asn Ser Ile Phe Trp Ile Thr His Pro Gly Gly
305 310 315 320
Lys Ala Ile Leu Asp Lys Val Glu Glu Lys Leu His Leu Lys Ser Asp
325 330 335
Lys Phe Val Asp Ser Arg His Val Leu Ser Glu His Gly Asn Met Ser
340 345 350
Ser Ser Thr Val Leu Phe Val Met Asp Glu Leu Arg Lys Arg Ser Leu
355 360 365
Glu Glu Gly Lys Ser Thr Thr Gly Asp Gly Phe Glu Trp Gly Val Leu
370 375 380
Phe Gly Phe Gly Pro Gly Leu Thr Val Glu Arg Val Val Val Arg Ser
385 390 395 400
Val Pro Ile Lys Tyr
405
<210> 11
<211> 366
<212> DNA
<213> Cannibis sativa
<220>
<221> CDS
<222> (1)..(366)
<400> 11
atg ggc agc agc cat cat cat cat cat cac agc agc ggc ctg gtg ccg 48
Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro
1 5 10 15
cgc ggc agc cat atg gca gtc aaa cac ttg atc gtg tta aag ttc aaa 96
Arg Gly Ser His Met Ala Val Lys His Leu Ile Val Leu Lys Phe Lys
20 25 30
gat gaa atc aca gag gct cag aag gaa gaa ttt ttc aag acg tat gta 144
Asp Glu Ile Thr Glu Ala Gln Lys Glu Glu Phe Phe Lys Thr Tyr Val
35 40 45
aac ctt gtt aat atc atc ccc gct atg aag gat gtg tat tgg ggt aaa 192
Asn Leu Val Asn Ile Ile Pro Ala Met Lys Asp Val Tyr Trp Gly Lys
50 55 60
gac gtg aca cag aag aac aaa gag gaa ggc tac acg cac atc gta gag 240
Asp Val Thr Gln Lys Asn Lys Glu Glu Gly Tyr Thr His Ile Val Glu
65 70 75 80
gtc aca ttt gag agc gtc gaa act att cag gat tac atc att cat ccc 288
Val Thr Phe Glu Ser Val Glu Thr Ile Gln Asp Tyr Ile Ile His Pro
85 90 95
gca cac gtt gga ttc ggg gat gtg tat cgc tct ttc tgg gaa aaa ttg 336
Ala His Val Gly Phe Gly Asp Val Tyr Arg Ser Phe Trp Glu Lys Leu
100 105 110
ctg atc ttc gac tat aca ccg cgt aag taa 366
Leu Ile Phe Asp Tyr Thr Pro Arg Lys
115 120
<210> 12
<211> 121
<212> PRT
<213> Cannibis sativa
<400> 12
Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro
1 5 10 15
Arg Gly Ser His Met Ala Val Lys His Leu Ile Val Leu Lys Phe Lys
20 25 30
Asp Glu Ile Thr Glu Ala Gln Lys Glu Glu Phe Phe Lys Thr Tyr Val
35 40 45
Asn Leu Val Asn Ile Ile Pro Ala Met Lys Asp Val Tyr Trp Gly Lys
50 55 60
Asp Val Thr Gln Lys Asn Lys Glu Glu Gly Tyr Thr His Ile Val Glu
65 70 75 80
Val Thr Phe Glu Ser Val Glu Thr Ile Gln Asp Tyr Ile Ile His Pro
85 90 95
Ala His Val Gly Phe Gly Asp Val Tyr Arg Ser Phe Trp Glu Lys Leu
100 105 110
Leu Ile Phe Asp Tyr Thr Pro Arg Lys
115 120
<210> 13
<211> 654
<212> DNA
<213> Geobacillus thermodenitrificans
<220>
<221> CDS
<222> (1)..(654)
<400> 13
atg aat tta gtg ctg atg ggg ctg cca ggt gcc ggc aaa ggc acg caa 48
Met Asn Leu Val Leu Met Gly Leu Pro Gly Ala Gly Lys Gly Thr Gln
1 5 10 15
gcc gag aaa atc gta gaa acg tat gga atc cca cat att tca acc ggg 96
Ala Glu Lys Ile Val Glu Thr Tyr Gly Ile Pro His Ile Ser Thr Gly
20 25 30
gat atg ttt cgg gcg gcg atg aaa gaa ggc aca ccg tta gga ttg cag 144
Asp Met Phe Arg Ala Ala Met Lys Glu Gly Thr Pro Leu Gly Leu Gln
35 40 45
gca aaa gaa tat atc gac cgt ggt gat ctt gtt ccg gat gag gtg acg 192
Ala Lys Glu Tyr Ile Asp Arg Gly Asp Leu Val Pro Asp Glu Val Thr
50 55 60
atc ggt atc gtc cgt gaa cgg tta agc aaa gac gac tgc caa aac ggc 240
Ile Gly Ile Val Arg Glu Arg Leu Ser Lys Asp Asp Cys Gln Asn Gly
65 70 75 80
ttt ttg ctt gac gga ttc cca cgc acg gtt gcc caa gcg gag gcg ctg 288
Phe Leu Leu Asp Gly Phe Pro Arg Thr Val Ala Gln Ala Glu Ala Leu
85 90 95
gaa gcg atg ctg gct gaa atc ggc cgc aag ctt gac tat gtc atc cat 336
Glu Ala Met Leu Ala Glu Ile Gly Arg Lys Leu Asp Tyr Val Ile His
100 105 110
atc gat gtt cgc caa gat gtg tta atg gag cgc ctc aca ggc aga cga 384
Ile Asp Val Arg Gln Asp Val Leu Met Glu Arg Leu Thr Gly Arg Arg
115 120 125
att tgt cgc aac tgc gga gcg aca tac cat ctt gtt ttt cac cca ccg 432
Ile Cys Arg Asn Cys Gly Ala Thr Tyr His Leu Val Phe His Pro Pro
130 135 140
gct cag cca ggc gta tgt gat aaa tgc ggt ggc gag ctt tat cag cgc 480
Ala Gln Pro Gly Val Cys Asp Lys Cys Gly Gly Glu Leu Tyr Gln Arg
145 150 155 160
cct gac gat aat gaa gca aca gtg gcg aat cgg ctt gag gtg aat acg 528
Pro Asp Asp Asn Glu Ala Thr Val Ala Asn Arg Leu Glu Val Asn Thr
165 170 175
aaa caa atg aag cca ttg ctc gat ttc tat gag caa aaa ggc tat ttg 576
Lys Gln Met Lys Pro Leu Leu Asp Phe Tyr Glu Gln Lys Gly Tyr Leu
180 185 190
cgc cac att aac ggc gaa caa gaa atg gaa aaa gtg ttt agc gac att 624
Arg His Ile Asn Gly Glu Gln Glu Met Glu Lys Val Phe Ser Asp Ile
195 200 205
cgc gaa ttg ctc ggg gga ctt act cga tga 654
Arg Glu Leu Leu Gly Gly Leu Thr Arg
210 215
<210> 14
<211> 217
<212> PRT
<213> Geobacillus thermodenitrificans
<400> 14
Met Asn Leu Val Leu Met Gly Leu Pro Gly Ala Gly Lys Gly Thr Gln
1 5 10 15
Ala Glu Lys Ile Val Glu Thr Tyr Gly Ile Pro His Ile Ser Thr Gly
20 25 30
Asp Met Phe Arg Ala Ala Met Lys Glu Gly Thr Pro Leu Gly Leu Gln
35 40 45
Ala Lys Glu Tyr Ile Asp Arg Gly Asp Leu Val Pro Asp Glu Val Thr
50 55 60
Ile Gly Ile Val Arg Glu Arg Leu Ser Lys Asp Asp Cys Gln Asn Gly
65 70 75 80
Phe Leu Leu Asp Gly Phe Pro Arg Thr Val Ala Gln Ala Glu Ala Leu
85 90 95
Glu Ala Met Leu Ala Glu Ile Gly Arg Lys Leu Asp Tyr Val Ile His
100 105 110
Ile Asp Val Arg Gln Asp Val Leu Met Glu Arg Leu Thr Gly Arg Arg
115 120 125
Ile Cys Arg Asn Cys Gly Ala Thr Tyr His Leu Val Phe His Pro Pro
130 135 140
Ala Gln Pro Gly Val Cys Asp Lys Cys Gly Gly Glu Leu Tyr Gln Arg
145 150 155 160
Pro Asp Asp Asn Glu Ala Thr Val Ala Asn Arg Leu Glu Val Asn Thr
165 170 175
Lys Gln Met Lys Pro Leu Leu Asp Phe Tyr Glu Gln Lys Gly Tyr Leu
180 185 190
Arg His Ile Asn Gly Glu Gln Glu Met Glu Lys Val Phe Ser Asp Ile
195 200 205
Arg Glu Leu Leu Gly Gly Leu Thr Arg
210 215
<210> 15
<211> 1512
<212> DNA
<213> Rhodopseudomonas palustris
<220>
<221> CDS
<222> (1)..(1512)
<400> 15
atg aac gcc aac ctg ttc gcc cgc ctg ttc gat aag ctc gac gac ccc 48
Met Asn Ala Asn Leu Phe Ala Arg Leu Phe Asp Lys Leu Asp Asp Pro
1 5 10 15
cac aag ctc gcg atc gaa acc gcg gcc ggg gac aag atc agc tac gcc 96
His Lys Leu Ala Ile Glu Thr Ala Ala Gly Asp Lys Ile Ser Tyr Ala
20 25 30
gag ctg gtg gcg cgg gcg ggc cgc gtc gcc aac gtg ctg gtg gca cgc 144
Glu Leu Val Ala Arg Ala Gly Arg Val Ala Asn Val Leu Val Ala Arg
35 40 45
ggc ctg cag gtc ggc gac cgc gtt gcg gcg caa acc gag aag tcg gtg 192
Gly Leu Gln Val Gly Asp Arg Val Ala Ala Gln Thr Glu Lys Ser Val
50 55 60
gaa gcg ctg gtg ctg tat ctc gcc acg gtg cgg gcc ggc ggc gtg tat 240
Glu Ala Leu Val Leu Tyr Leu Ala Thr Val Arg Ala Gly Gly Val Tyr
65 70 75 80
ctg ccg ctc aac acc gcc tat acg ctg cac gag ctc gat tac ttc atc 288
Leu Pro Leu Asn Thr Ala Tyr Thr Leu His Glu Leu Asp Tyr Phe Ile
85 90 95
acc gat gcc gag ccg aag atc gtg gtg tgc gat ccg tcc aag cgc gac 336
Thr Asp Ala Glu Pro Lys Ile Val Val Cys Asp Pro Ser Lys Arg Asp
100 105 110
ggg atc gcg gcg att gcc gcc aag gtc ggc gcc acg gtg gag acg ctt 384
Gly Ile Ala Ala Ile Ala Ala Lys Val Gly Ala Thr Val Glu Thr Leu
115 120 125
ggc ccc gac ggt cgg ggc tcg ctc acc gat gcg gca gct gga gcc agc 432
Gly Pro Asp Gly Arg Gly Ser Leu Thr Asp Ala Ala Ala Gly Ala Ser
130 135 140
gag gcg ttc gcc acg atc gac cgc ggc gcc gat gat ctg gcg gcg atc 480
Glu Ala Phe Ala Thr Ile Asp Arg Gly Ala Asp Asp Leu Ala Ala Ile
145 150 155 160
ctc tac acc tca ggg acg acc ggc cgc tcc aag ggc gcg atg ctc agc 528
Leu Tyr Thr Ser Gly Thr Thr Gly Arg Ser Lys Gly Ala Met Leu Ser
165 170 175
cac gac aat ttg gcg tcg aac tcg ctg acg ctg gtc gat tac tgg cgc 576
His Asp Asn Leu Ala Ser Asn Ser Leu Thr Leu Val Asp Tyr Trp Arg
180 185 190
ttc acg ccg gat gac gtg ctg atc cac gcg ctg ccg atc tat cac acc 624
Phe Thr Pro Asp Asp Val Leu Ile His Ala Leu Pro Ile Tyr His Thr
195 200 205
cat gga ttg ttc gtg gcc agc aac gtc acg ctg ttc gcg cgc gga tcg 672
His Gly Leu Phe Val Ala Ser Asn Val Thr Leu Phe Ala Arg Gly Ser
210 215 220
atg atc ttc ctg ccg aag ttc gat ccc gac aag atc ctc gac ctg atg 720
Met Ile Phe Leu Pro Lys Phe Asp Pro Asp Lys Ile Leu Asp Leu Met
225 230 235 240
gcg cgc gcc acc gtg ctg atg ggt gtg ccg acg ttc tac acg cgg ctc 768
Ala Arg Ala Thr Val Leu Met Gly Val Pro Thr Phe Tyr Thr Arg Leu
245 250 255
ttg cag agc ccg cgg ctg acc aag gag acg acg ggc cac atg agg ctg 816
Leu Gln Ser Pro Arg Leu Thr Lys Glu Thr Thr Gly His Met Arg Leu
260 265 270
ttc atc tcc ggg tcg gcg ccg ctg ctc gcc gat acg cat cgc gaa tgg 864
Phe Ile Ser Gly Ser Ala Pro Leu Leu Ala Asp Thr His Arg Glu Trp
275 280 285
tcg gcg aag acc ggt cac gcc gtg ctc gag cgc tac ggc atg acc gag 912
Ser Ala Lys Thr Gly His Ala Val Leu Glu Arg Tyr Gly Met Thr Glu
290 295 300
acc aac atg aac acc tcg aac ccg tat gac ggc gac cgc gtc ccc ggc 960
Thr Asn Met Asn Thr Ser Asn Pro Tyr Asp Gly Asp Arg Val Pro Gly
305 310 315 320
gcg gtc ggc ccg gcg ctg ccc ggc gtt tcg gcg cgc gtg acc gat ccg 1008
Ala Val Gly Pro Ala Leu Pro Gly Val Ser Ala Arg Val Thr Asp Pro
325 330 335
gaa acc ggc aag gaa ctg ccg cgc ggc gac atc ggg atg atc gag gtg 1056
Glu Thr Gly Lys Glu Leu Pro Arg Gly Asp Ile Gly Met Ile Glu Val
340 345 350
aag ggc ccg aac gtg ttc aag ggc tac tgg cgg atg ccg gag aag acc 1104
Lys Gly Pro Asn Val Phe Lys Gly Tyr Trp Arg Met Pro Glu Lys Thr
355 360 365
aag tct gaa ttc cgc gac gac ggc ttc ttc atc acc ggc gac ctc ggc 1152
Lys Ser Glu Phe Arg Asp Asp Gly Phe Phe Ile Thr Gly Asp Leu Gly
370 375 380
aag atc gac gag cgc ggc tac gtc cac atc ctc ggc cgc ggc aag gat 1200
Lys Ile Asp Glu Arg Gly Tyr Val His Ile Leu Gly Arg Gly Lys Asp
385 390 395 400
ctg gtg atc acc ggc ggc ttc aac gtc tat ccg aag gaa atc gag agc 1248
Leu Val Ile Thr Gly Gly Phe Asn Val Tyr Pro Lys Glu Ile Glu Ser
405 410 415
gag atc gac gcc atg ccg ggc gtg gtc gaa tcc gcg gtg atc ggc gtg 1296
Glu Ile Asp Ala Met Pro Gly Val Val Glu Ser Ala Val Ile Gly Val
420 425 430
ccg cac gcc gat ttc ggc gag ggc gtc act gcc gtg gtg gtg cgc gac 1344
Pro His Ala Asp Phe Gly Glu Gly Val Thr Ala Val Val Val Arg Asp
435 440 445
aag ggt gcc acg atc gac gaa gcg cag gtg ctg cac ggc ctc gac ggt 1392
Lys Gly Ala Thr Ile Asp Glu Ala Gln Val Leu His Gly Leu Asp Gly
450 455 460
cag ctc gcc aag ttc aag atg ccg aag aaa gtg atc ttc gtc gac gac 1440
Gln Leu Ala Lys Phe Lys Met Pro Lys Lys Val Ile Phe Val Asp Asp
465 470 475 480
ctg ccg cgc aac acc atg ggc aag gtc cag aag aac gtc ctg cgc gag 1488
Leu Pro Arg Asn Thr Met Gly Lys Val Gln Lys Asn Val Leu Arg Glu
485 490 495
acc tac aag gac atc tac aag taa 1512
Thr Tyr Lys Asp Ile Tyr Lys
500
<210> 16
<211> 503
<212> PRT
<213> Rhodopseudomonas palustris
<400> 16
Met Asn Ala Asn Leu Phe Ala Arg Leu Phe Asp Lys Leu Asp Asp Pro
1 5 10 15
His Lys Leu Ala Ile Glu Thr Ala Ala Gly Asp Lys Ile Ser Tyr Ala
20 25 30
Glu Leu Val Ala Arg Ala Gly Arg Val Ala Asn Val Leu Val Ala Arg
35 40 45
Gly Leu Gln Val Gly Asp Arg Val Ala Ala Gln Thr Glu Lys Ser Val
50 55 60
Glu Ala Leu Val Leu Tyr Leu Ala Thr Val Arg Ala Gly Gly Val Tyr
65 70 75 80
Leu Pro Leu Asn Thr Ala Tyr Thr Leu His Glu Leu Asp Tyr Phe Ile
85 90 95
Thr Asp Ala Glu Pro Lys Ile Val Val Cys Asp Pro Ser Lys Arg Asp
100 105 110
Gly Ile Ala Ala Ile Ala Ala Lys Val Gly Ala Thr Val Glu Thr Leu
115 120 125
Gly Pro Asp Gly Arg Gly Ser Leu Thr Asp Ala Ala Ala Gly Ala Ser
130 135 140
Glu Ala Phe Ala Thr Ile Asp Arg Gly Ala Asp Asp Leu Ala Ala Ile
145 150 155 160
Leu Tyr Thr Ser Gly Thr Thr Gly Arg Ser Lys Gly Ala Met Leu Ser
165 170 175
His Asp Asn Leu Ala Ser Asn Ser Leu Thr Leu Val Asp Tyr Trp Arg
180 185 190
Phe Thr Pro Asp Asp Val Leu Ile His Ala Leu Pro Ile Tyr His Thr
195 200 205
His Gly Leu Phe Val Ala Ser Asn Val Thr Leu Phe Ala Arg Gly Ser
210 215 220
Met Ile Phe Leu Pro Lys Phe Asp Pro Asp Lys Ile Leu Asp Leu Met
225 230 235 240
Ala Arg Ala Thr Val Leu Met Gly Val Pro Thr Phe Tyr Thr Arg Leu
245 250 255
Leu Gln Ser Pro Arg Leu Thr Lys Glu Thr Thr Gly His Met Arg Leu
260 265 270
Phe Ile Ser Gly Ser Ala Pro Leu Leu Ala Asp Thr His Arg Glu Trp
275 280 285
Ser Ala Lys Thr Gly His Ala Val Leu Glu Arg Tyr Gly Met Thr Glu
290 295 300
Thr Asn Met Asn Thr Ser Asn Pro Tyr Asp Gly Asp Arg Val Pro Gly
305 310 315 320
Ala Val Gly Pro Ala Leu Pro Gly Val Ser Ala Arg Val Thr Asp Pro
325 330 335
Glu Thr Gly Lys Glu Leu Pro Arg Gly Asp Ile Gly Met Ile Glu Val
340 345 350
Lys Gly Pro Asn Val Phe Lys Gly Tyr Trp Arg Met Pro Glu Lys Thr
355 360 365
Lys Ser Glu Phe Arg Asp Asp Gly Phe Phe Ile Thr Gly Asp Leu Gly
370 375 380
Lys Ile Asp Glu Arg Gly Tyr Val His Ile Leu Gly Arg Gly Lys Asp
385 390 395 400
Leu Val Ile Thr Gly Gly Phe Asn Val Tyr Pro Lys Glu Ile Glu Ser
405 410 415
Glu Ile Asp Ala Met Pro Gly Val Val Glu Ser Ala Val Ile Gly Val
420 425 430
Pro His Ala Asp Phe Gly Glu Gly Val Thr Ala Val Val Val Arg Asp
435 440 445
Lys Gly Ala Thr Ile Asp Glu Ala Gln Val Leu His Gly Leu Asp Gly
450 455 460
Gln Leu Ala Lys Phe Lys Met Pro Lys Lys Val Ile Phe Val Asp Asp
465 470 475 480
Leu Pro Arg Asn Thr Met Gly Lys Val Gln Lys Asn Val Leu Arg Glu
485 490 495
Thr Tyr Lys Asp Ile Tyr Lys
500
<210> 17
<211> 558
<212> DNA
<213> Geobacillus stearothermophilus
<220>
<221> CDS
<222> (1)..(558)
<400> 17
atg ggc agc agc cat cat cat cat cat cac agc agc ggc ctg gtg ccg 48
Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro
1 5 10 15
cgc ggc agc cat atg gcc ttt gag aat aag att gtc gaa gcg ttt atc 96
Arg Gly Ser His Met Ala Phe Glu Asn Lys Ile Val Glu Ala Phe Ile
20 25 30
gaa att cca acc ggc agc caa aac aaa tac gag ttc gac aaa gag cgg 144
Glu Ile Pro Thr Gly Ser Gln Asn Lys Tyr Glu Phe Asp Lys Glu Arg
35 40 45
ggc gtt ttc aaa ctc gac cgc gtc ttg tac tcc ccg atg ttt tac ccg 192
Gly Val Phe Lys Leu Asp Arg Val Leu Tyr Ser Pro Met Phe Tyr Pro
50 55 60
gct gag tac ggc tac ttg caa aat acg ctg gcg ctc gat ggc gac ccg 240
Ala Glu Tyr Gly Tyr Leu Gln Asn Thr Leu Ala Leu Asp Gly Asp Pro
65 70 75 80
ctc gac att ttg gtc atc aca acg aat ccg aca ttc ccg ggc tgc gtc 288
Leu Asp Ile Leu Val Ile Thr Thr Asn Pro Thr Phe Pro Gly Cys Val
85 90 95
atc gat acg cgt gtc atc ggc ttt ttg aac atg gtc gac agc ggt gag 336
Ile Asp Thr Arg Val Ile Gly Phe Leu Asn Met Val Asp Ser Gly Glu
100 105 110
gag gac gcg aag ctc atc ggc gtg cca gtc gaa gac ccg cgc ttt gat 384
Glu Asp Ala Lys Leu Ile Gly Val Pro Val Glu Asp Pro Arg Phe Asp
115 120 125
gaa gtc cgc tcg att gaa gac ctg ccg cag cac aag ctg aaa gaa atc 432
Glu Val Arg Ser Ile Glu Asp Leu Pro Gln His Lys Leu Lys Glu Ile
130 135 140
gcc cac ttc ttt gaa cgg tac aaa gac ttg caa ggc aag cgg acg gaa 480
Ala His Phe Phe Glu Arg Tyr Lys Asp Leu Gln Gly Lys Arg Thr Glu
145 150 155 160
atc ggc aca tgg gaa ggg ccg gaa gct gcg gca aaa ctg atc gat gag 528
Ile Gly Thr Trp Glu Gly Pro Glu Ala Ala Ala Lys Leu Ile Asp Glu
165 170 175
tgc atc gcc cgc tat aac gaa caa aaa taa 558
Cys Ile Ala Arg Tyr Asn Glu Gln Lys
180 185
<210> 18
<211> 185
<212> PRT
<213> Geobacillus stearothermophilus
<400> 18
Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro
1 5 10 15
Arg Gly Ser His Met Ala Phe Glu Asn Lys Ile Val Glu Ala Phe Ile
20 25 30
Glu Ile Pro Thr Gly Ser Gln Asn Lys Tyr Glu Phe Asp Lys Glu Arg
35 40 45
Gly Val Phe Lys Leu Asp Arg Val Leu Tyr Ser Pro Met Phe Tyr Pro
50 55 60
Ala Glu Tyr Gly Tyr Leu Gln Asn Thr Leu Ala Leu Asp Gly Asp Pro
65 70 75 80
Leu Asp Ile Leu Val Ile Thr Thr Asn Pro Thr Phe Pro Gly Cys Val
85 90 95
Ile Asp Thr Arg Val Ile Gly Phe Leu Asn Met Val Asp Ser Gly Glu
100 105 110
Glu Asp Ala Lys Leu Ile Gly Val Pro Val Glu Asp Pro Arg Phe Asp
115 120 125
Glu Val Arg Ser Ile Glu Asp Leu Pro Gln His Lys Leu Lys Glu Ile
130 135 140
Ala His Phe Phe Glu Arg Tyr Lys Asp Leu Gln Gly Lys Arg Thr Glu
145 150 155 160
Ile Gly Thr Trp Glu Gly Pro Glu Ala Ala Ala Lys Leu Ile Asp Glu
165 170 175
Cys Ile Ala Arg Tyr Asn Glu Gln Lys
180 185
<210> 19
<211> 954
<212> DNA
<213> Artificial Sequence
<220>
<223> GsFPPS-S82F Coding Sequence
<400> 19
atgggcagca gccatcatca tcatcatcac agcagcggcc tggtgccgcg cggcagccat 60
atggcgcagc tttcagttga acagtttctc aacgagcaaa aacaggcggt ggaaacagcg 120
ctctcccgtt atatagagcg cttagaaggg ccggcgaagc tgaaaaaggc gatggcgtac 180
tcattggagg ccggcggcaa acgaatccgt ccgttgctgc ttctgtccac cgttcgggcg 240
ctcggcaaag acccggcggt cggattgccc gtcgcctgcg cgattgaaat gatccatacg 300
tactttttga tccatgatga tttgccgagc atggacaacg atgatttgcg gcgcggcaag 360
ccgacgaacc ataaagtgtt cggcgaggcg atggccatct tggcggggga cgggttgttg 420
acgtacgcgt ttcaattgat caccgaaatc gacgatgagc gcatccctcc ttccgtccgg 480
cttcggctca tcgaacggct ggcgaaagcg gccggtccgg aagggatggt cgccggtcag 540
gcagccgata tggaaggaga ggggaaaacg ctgacgcttt cggagctcga atacattcat 600
cggcataaaa ccgggaaaat gctgcaatac agcgtgcacg ccggcgcctt gatcggcggc 660
gctgatgccc ggcaaacgcg ggagcttgac gaattcgccg cccatctagg ccttgccttt 720
caaattcgcg atgatattct cgatattgaa ggggcagaag aaaaaatcgg caagccggtc 780
ggcagcgacc aaagcaacaa caaagcgacg tatccagcgt tgctgtcgct tgccggcgcg 840
aaggaaaagt tggcgttcca tatcgaggcg gcgcagcgcc atttacggaa cgctgacgtt 900
gacggcgccg cgctcgccta tatttgcgaa ctggtcgccg cccgcgacca ttaa 954
<210> 20
<211> 573
<212> DNA
<213> Escherichia coli
<220>
<221> CDS
<222> (1)..(573)
<400> 20
atg caa acg gaa cac gtc att tta ttg aat gca cag gga gtt ccc acg 48
Met Gln Thr Glu His Val Ile Leu Leu Asn Ala Gln Gly Val Pro Thr
1 5 10 15
ggt acg ctg gaa aag tat gcc gca cac acg gca gac acc cgc tta cat 96
Gly Thr Leu Glu Lys Tyr Ala Ala His Thr Ala Asp Thr Arg Leu His
20 25 30
ctc gcg ttc tcc agt tgg ctg ttt aat gcc aaa gga caa tta tta gtt 144
Leu Ala Phe Ser Ser Trp Leu Phe Asn Ala Lys Gly Gln Leu Leu Val
35 40 45
acc cgc cgc gca ctg agc aaa aaa gca tgg cct ggc gtg tgg act aac 192
Thr Arg Arg Ala Leu Ser Lys Lys Ala Trp Pro Gly Val Trp Thr Asn
50 55 60
tcg gtt tgt ggg cac cca caa ctg gga gaa agc aac gaa gac gca gtg 240
Ser Val Cys Gly His Pro Gln Leu Gly Glu Ser Asn Glu Asp Ala Val
65 70 75 80
atc cgc cgt tgc cgt tat gag ctt ggc gtg gaa att acg cct cct gaa 288
Ile Arg Arg Cys Arg Tyr Glu Leu Gly Val Glu Ile Thr Pro Pro Glu
85 90 95
tct atc tat cct gac ttt cgc tac cgc gcc acc gat ccg agt ggc att 336
Ser Ile Tyr Pro Asp Phe Arg Tyr Arg Ala Thr Asp Pro Ser Gly Ile
100 105 110
gtg gaa aat gaa gtg tgt ccg gta ttt gcc gca cgc acc act agt gcg 384
Val Glu Asn Glu Val Cys Pro Val Phe Ala Ala Arg Thr Thr Ser Ala
115 120 125
tta cag atc aat gat gat gaa gtg atg gat tat caa tgg tgt gat tta 432
Leu Gln Ile Asn Asp Asp Glu Val Met Asp Tyr Gln Trp Cys Asp Leu
130 135 140
gca gat gta tta cac ggt att gat gcc acg ccg tgg gcg ttc agt ccg 480
Ala Asp Val Leu His Gly Ile Asp Ala Thr Pro Trp Ala Phe Ser Pro
145 150 155 160
tgg atg gtg atg cag gcg aca aat cgc gaa gcc aga aaa cga tta tct 528
Trp Met Val Met Gln Ala Thr Asn Arg Glu Ala Arg Lys Arg Leu Ser
165 170 175
gca ttt acc cag ctt aaa ctc gag cac cac cac cac cac cac tga 573
Ala Phe Thr Gln Leu Lys Leu Glu His His His His His His
180 185 190
<210> 21
<211> 190
<212> PRT
<213> Escherichia coli
<400> 21
Met Gln Thr Glu His Val Ile Leu Leu Asn Ala Gln Gly Val Pro Thr
1 5 10 15
Gly Thr Leu Glu Lys Tyr Ala Ala His Thr Ala Asp Thr Arg Leu His
20 25 30
Leu Ala Phe Ser Ser Trp Leu Phe Asn Ala Lys Gly Gln Leu Leu Val
35 40 45
Thr Arg Arg Ala Leu Ser Lys Lys Ala Trp Pro Gly Val Trp Thr Asn
50 55 60
Ser Val Cys Gly His Pro Gln Leu Gly Glu Ser Asn Glu Asp Ala Val
65 70 75 80
Ile Arg Arg Cys Arg Tyr Glu Leu Gly Val Glu Ile Thr Pro Pro Glu
85 90 95
Ser Ile Tyr Pro Asp Phe Arg Tyr Arg Ala Thr Asp Pro Ser Gly Ile
100 105 110
Val Glu Asn Glu Val Cys Pro Val Phe Ala Ala Arg Thr Thr Ser Ala
115 120 125
Leu Gln Ile Asn Asp Asp Glu Val Met Asp Tyr Gln Trp Cys Asp Leu
130 135 140
Ala Asp Val Leu His Gly Ile Asp Ala Thr Pro Trp Ala Phe Ser Pro
145 150 155 160
Trp Met Val Met Gln Ala Thr Asn Arg Glu Ala Arg Lys Arg Leu Ser
165 170 175
Ala Phe Thr Gln Leu Lys Leu Glu His His His His His His
180 185 190
<210> 22
<211> 543
<212> DNA
<213> Artificial Sequence
<220>
<223> EcIDIMS4
<220>
<221> CDS
<222> (1)..(543)
<400> 22
atg cag aca gaa cac gtg att ttg ttg aac gca caa ggc gtt cct att 48
Met Gln Thr Glu His Val Ile Leu Leu Asn Ala Gln Gly Val Pro Ile
1 5 10 15
ggg aca tta gaa aag tac gcc gcg cat acc gca gat aca cgc ctt cac 96
Gly Thr Leu Glu Lys Tyr Ala Ala His Thr Ala Asp Thr Arg Leu His
20 25 30
ttg gcg ttc tcg tcc tgg ctg ttc aac gcg aaa gga caa ctg ctg gta 144
Leu Ala Phe Ser Ser Trp Leu Phe Asn Ala Lys Gly Gln Leu Leu Val
35 40 45
aca cgt cgc gca tta agt aaa aag gct tgg cct ggg gtt tgg act aac 192
Thr Arg Arg Ala Leu Ser Lys Lys Ala Trp Pro Gly Val Trp Thr Asn
50 55 60
agc gta tgc ggc cat ccg cag ttg gga gag tca aat gag gac gca gta 240
Ser Val Cys Gly His Pro Gln Leu Gly Glu Ser Asn Glu Asp Ala Val
65 70 75 80
atc cgt cgc tgc cgc tat gaa ctg gga gtt gaa att aca cct cct gaa 288
Ile Arg Arg Cys Arg Tyr Glu Leu Gly Val Glu Ile Thr Pro Pro Glu
85 90 95
cct atc tac cca gat ttc cgc tac cgc gca aca gac ccg tct gga att 336
Pro Ile Tyr Pro Asp Phe Arg Tyr Arg Ala Thr Asp Pro Ser Gly Ile
100 105 110
gtg gaa aat gaa gtt tgc cct gtc ttc gct gcc cgc aca acc tcc gcc 384
Val Glu Asn Glu Val Cys Pro Val Phe Ala Ala Arg Thr Thr Ser Ala
115 120 125
tta cag att aac gat gac gag gtg atg gac tat cag tgg tgt gat ctt 432
Leu Gln Ile Asn Asp Asp Glu Val Met Asp Tyr Gln Trp Cys Asp Leu
130 135 140
gca gat gtg tta cac ggg att gac gcc aca ccc tgg gcc ttt tcc ccg 480
Ala Asp Val Leu His Gly Ile Asp Ala Thr Pro Trp Ala Phe Ser Pro
145 150 155 160
tgg atg gtg atg cag gca acc aac gag gag gct cgt aaa cgt ctg cag 528
Trp Met Val Met Gln Ala Thr Asn Glu Glu Ala Arg Lys Arg Leu Gln
165 170 175
gca ttc acg caa taa 543
Ala Phe Thr Gln
180
<210> 23
<211> 180
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 23
Met Gln Thr Glu His Val Ile Leu Leu Asn Ala Gln Gly Val Pro Ile
1 5 10 15
Gly Thr Leu Glu Lys Tyr Ala Ala His Thr Ala Asp Thr Arg Leu His
20 25 30
Leu Ala Phe Ser Ser Trp Leu Phe Asn Ala Lys Gly Gln Leu Leu Val
35 40 45
Thr Arg Arg Ala Leu Ser Lys Lys Ala Trp Pro Gly Val Trp Thr Asn
50 55 60
Ser Val Cys Gly His Pro Gln Leu Gly Glu Ser Asn Glu Asp Ala Val
65 70 75 80
Ile Arg Arg Cys Arg Tyr Glu Leu Gly Val Glu Ile Thr Pro Pro Glu
85 90 95
Pro Ile Tyr Pro Asp Phe Arg Tyr Arg Ala Thr Asp Pro Ser Gly Ile
100 105 110
Val Glu Asn Glu Val Cys Pro Val Phe Ala Ala Arg Thr Thr Ser Ala
115 120 125
Leu Gln Ile Asn Asp Asp Glu Val Met Asp Tyr Gln Trp Cys Asp Leu
130 135 140
Ala Asp Val Leu His Gly Ile Asp Ala Thr Pro Trp Ala Phe Ser Pro
145 150 155 160
Trp Met Val Met Gln Ala Thr Asn Glu Glu Ala Arg Lys Arg Leu Gln
165 170 175
Ala Phe Thr Gln
180
<210> 24
<211> 543
<212> DNA
<213> Artificial Sequence
<220>
<223> EcIDIM10
<220>
<221> CDS
<222> (1)..(543)
<400> 24
atg caa acc gag cat gtc att tta ttg gac gag caa gga gaa cca att 48
Met Gln Thr Glu His Val Ile Leu Leu Asp Glu Gln Gly Glu Pro Ile
1 5 10 15
gga act tta gaa aaa tac gct gca cat aca gcg gac acc cgc tta cat 96
Gly Thr Leu Glu Lys Tyr Ala Ala His Thr Ala Asp Thr Arg Leu His
20 25 30
ctt gct ttt tct agt tgg ctg ttt aac gat aag ggt caa tta tta gtg 144
Leu Ala Phe Ser Ser Trp Leu Phe Asn Asp Lys Gly Gln Leu Leu Val
35 40 45
acg cgc cgt gcg ctg agc aaa aaa gca tgg ccg ggt gtt tgg acg aac 192
Thr Arg Arg Ala Leu Ser Lys Lys Ala Trp Pro Gly Val Trp Thr Asn
50 55 60
agt gtt tgc gga cac ccc caa ctg gga gaa tcc aat gag gat gcg gta 240
Ser Val Cys Gly His Pro Gln Leu Gly Glu Ser Asn Glu Asp Ala Val
65 70 75 80
att cgc cgt tgt cgc tat gaa ttg ggt gtg gag att acg cca ccg aca 288
Ile Arg Arg Cys Arg Tyr Glu Leu Gly Val Glu Ile Thr Pro Pro Thr
85 90 95
ccg atc tac cct gat ttc cgt tat cgc gct acg gat cct tca ggt att 336
Pro Ile Tyr Pro Asp Phe Arg Tyr Arg Ala Thr Asp Pro Ser Gly Ile
100 105 110
gtt gaa aat gaa gta tgc cca gtg ttt gcc gcg cgc aca act tct gcg 384
Val Glu Asn Glu Val Cys Pro Val Phe Ala Ala Arg Thr Thr Ser Ala
115 120 125
ctt caa atc aac cca gac gag gtc atg gat tac caa tgg tgt gat ctt 432
Leu Gln Ile Asn Pro Asp Glu Val Met Asp Tyr Gln Trp Cys Asp Leu
130 135 140
gct gac gta ctg cac ggg att gac gcg aca ccg tgg gct ttt agt ccc 480
Ala Asp Val Leu His Gly Ile Asp Ala Thr Pro Trp Ala Phe Ser Pro
145 150 155 160
tgg atg gtt atg caa gcg aca aat gaa gaa gca cgt aag cgc ctt cag 528
Trp Met Val Met Gln Ala Thr Asn Glu Glu Ala Arg Lys Arg Leu Gln
165 170 175
gcg ttt act cag taa 543
Ala Phe Thr Gln
180
<210> 25
<211> 180
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 25
Met Gln Thr Glu His Val Ile Leu Leu Asp Glu Gln Gly Glu Pro Ile
1 5 10 15
Gly Thr Leu Glu Lys Tyr Ala Ala His Thr Ala Asp Thr Arg Leu His
20 25 30
Leu Ala Phe Ser Ser Trp Leu Phe Asn Asp Lys Gly Gln Leu Leu Val
35 40 45
Thr Arg Arg Ala Leu Ser Lys Lys Ala Trp Pro Gly Val Trp Thr Asn
50 55 60
Ser Val Cys Gly His Pro Gln Leu Gly Glu Ser Asn Glu Asp Ala Val
65 70 75 80
Ile Arg Arg Cys Arg Tyr Glu Leu Gly Val Glu Ile Thr Pro Pro Thr
85 90 95
Pro Ile Tyr Pro Asp Phe Arg Tyr Arg Ala Thr Asp Pro Ser Gly Ile
100 105 110
Val Glu Asn Glu Val Cys Pro Val Phe Ala Ala Arg Thr Thr Ser Ala
115 120 125
Leu Gln Ile Asn Pro Asp Glu Val Met Asp Tyr Gln Trp Cys Asp Leu
130 135 140
Ala Asp Val Leu His Gly Ile Asp Ala Thr Pro Trp Ala Phe Ser Pro
145 150 155 160
Trp Met Val Met Gln Ala Thr Asn Glu Glu Ala Arg Lys Arg Leu Gln
165 170 175
Ala Phe Thr Gln
180
<210> 26
<211> 543
<212> DNA
<213> Artificial Sequence
<220>
<223> EcIDIM17
<220>
<221> CDS
<222> (1)..(543)
<400> 26
atg cag acc gag cat gta atc ctt ctt gat gag cag ggg aat cca att 48
Met Gln Thr Glu His Val Ile Leu Leu Asp Glu Gln Gly Asn Pro Ile
1 5 10 15
ggt aca tta cca aag tac gct gcc cat acg gcg gac act cgc tta cat 96
Gly Thr Leu Pro Lys Tyr Ala Ala His Thr Ala Asp Thr Arg Leu His
20 25 30
ttg gcg ttc tca tcc tgg ttg ttt aac gac aaa gga caa ttg ctg gta 144
Leu Ala Phe Ser Ser Trp Leu Phe Asn Asp Lys Gly Gln Leu Leu Val
35 40 45
acg cgc cgc gcc ctg tct aag aag gcg tgg cct ggg gta tgg acc aac 192
Thr Arg Arg Ala Leu Ser Lys Lys Ala Trp Pro Gly Val Trp Thr Asn
50 55 60
tcc gtc tgc gga cac cct caa tta ggt gaa tcg ctg gag gat gca gtc 240
Ser Val Cys Gly His Pro Gln Leu Gly Glu Ser Leu Glu Asp Ala Val
65 70 75 80
cgc cgc cgc gcc cgc tac gaa ctt ggt gtg gaa att acg ccc cca acc 288
Arg Arg Arg Ala Arg Tyr Glu Leu Gly Val Glu Ile Thr Pro Pro Thr
85 90 95
cct atc tac ccg gat ttt cgc tat cgt gca aca gac cca agt ggg atc 336
Pro Ile Tyr Pro Asp Phe Arg Tyr Arg Ala Thr Asp Pro Ser Gly Ile
100 105 110
gta gag aat gag gtt tgt ccc gta ttt gca gcg cgt acc acg tcc gca 384
Val Glu Asn Glu Val Cys Pro Val Phe Ala Ala Arg Thr Thr Ser Ala
115 120 125
tta cag atc aat cca gac gaa gtc atg gac tgg caa tgg tgc gat ctt 432
Leu Gln Ile Asn Pro Asp Glu Val Met Asp Trp Gln Trp Cys Asp Leu
130 135 140
gcg gat gtt ttg cat ggg atc gac gct act ccc tgg gcc ttt agc cca 480
Ala Asp Val Leu His Gly Ile Asp Ala Thr Pro Trp Ala Phe Ser Pro
145 150 155 160
tgg atg gtt atg caa gcg gcc cat gag gag gcc cgt aaa cgc ctt caa 528
Trp Met Val Met Gln Ala Ala His Glu Glu Ala Arg Lys Arg Leu Gln
165 170 175
gcc ttt act caa taa 543
Ala Phe Thr Gln
180
<210> 27
<211> 180
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 27
Met Gln Thr Glu His Val Ile Leu Leu Asp Glu Gln Gly Asn Pro Ile
1 5 10 15
Gly Thr Leu Pro Lys Tyr Ala Ala His Thr Ala Asp Thr Arg Leu His
20 25 30
Leu Ala Phe Ser Ser Trp Leu Phe Asn Asp Lys Gly Gln Leu Leu Val
35 40 45
Thr Arg Arg Ala Leu Ser Lys Lys Ala Trp Pro Gly Val Trp Thr Asn
50 55 60
Ser Val Cys Gly His Pro Gln Leu Gly Glu Ser Leu Glu Asp Ala Val
65 70 75 80
Arg Arg Arg Ala Arg Tyr Glu Leu Gly Val Glu Ile Thr Pro Pro Thr
85 90 95
Pro Ile Tyr Pro Asp Phe Arg Tyr Arg Ala Thr Asp Pro Ser Gly Ile
100 105 110
Val Glu Asn Glu Val Cys Pro Val Phe Ala Ala Arg Thr Thr Ser Ala
115 120 125
Leu Gln Ile Asn Pro Asp Glu Val Met Asp Trp Gln Trp Cys Asp Leu
130 135 140
Ala Asp Val Leu His Gly Ile Asp Ala Thr Pro Trp Ala Phe Ser Pro
145 150 155 160
Trp Met Val Met Gln Ala Ala His Glu Glu Ala Arg Lys Arg Leu Gln
165 170 175
Ala Phe Thr Gln
180
<210> 28
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Forward Primer EcThiM
<400> 28
ccgcgcggca gccatatgca agtcgacctg ctgggttcag cgcaatctgc 50
<210> 29
<211> 58
<212> DNA
<213> Artificial Sequence
<220>
<223> Reverse Primer EcThiM
<400> 29
ggtggtggtg gtggtgctcg agttatgcct gcacctcctg cgtcaattgc cagagcgc 58
<210> 30
<211> 307
<212> PRT
<213> Streptomyces sp.
<400> 30
Met Ser Glu Ala Ala Asp Val Glu Arg Val Tyr Ala Ala Met Glu Glu
1 5 10 15
Ala Ala Gly Leu Leu Gly Val Ala Cys Ala Arg Asp Lys Ile Tyr Pro
20 25 30
Leu Leu Ser Thr Phe Gln Asp Thr Leu Val Glu Gly Gly Ser Val Val
35 40 45
Val Phe Ser Met Ala Ser Gly Arg His Ser Thr Glu Leu Asp Phe Ser
50 55 60
Ile Ser Val Pro Thr Ser His Gly Asp Pro Tyr Ala Thr Val Val Glu
65 70 75 80
Lys Gly Leu Phe Pro Ala Thr Gly His Pro Val Asp Asp Leu Leu Ala
85 90 95
Asp Thr Gln Lys His Leu Pro Val Ser Met Phe Ala Ile Asp Gly Glu
100 105 110
Val Thr Gly Gly Phe Lys Lys Thr Tyr Ala Phe Phe Pro Thr Asp Asn
115 120 125
Met Pro Gly Val Ala Glu Leu Ser Ala Ile Pro Ser Met Pro Pro Ala
130 135 140
Val Ala Glu Asn Ala Glu Leu Phe Ala Arg Tyr Gly Leu Asp Lys Val
145 150 155 160
Gln Met Thr Ser Met Asp Tyr Lys Lys Arg Gln Val Asn Leu Tyr Phe
165 170 175
Ser Glu Leu Ser Ala Gln Thr Leu Glu Ala Glu Ser Val Leu Ala Leu
180 185 190
Val Arg Glu Leu Gly Leu His Val Pro Asn Glu Leu Gly Leu Lys Phe
195 200 205
Cys Lys Arg Ser Phe Ser Val Tyr Pro Thr Leu Asn Trp Glu Thr Gly
210 215 220
Lys Ile Asp Arg Leu Cys Phe Ala Val Ile Ser Asn Asp Pro Thr Leu
225 230 235 240
Val Pro Ser Ser Asp Glu Gly Asp Ile Glu Lys Phe His Asn Tyr Ala
245 250 255
Thr Lys Ala Pro Tyr Ala Tyr Val Gly Glu Lys Arg Thr Leu Val Tyr
260 265 270
Gly Leu Thr Leu Ser Pro Lys Glu Glu Tyr Tyr Lys Leu Gly Ala Tyr
275 280 285
Tyr His Ile Thr Asp Val Gln Arg Gly Leu Leu Lys Ala Phe Asp Ser
290 295 300
Leu Glu Asp
305
<210> 31
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Forward Primer RpMatB
<400> 31
ccgcgcggca gccatatgaa cgccaacctg ttcgcccgcc tgttcg 46
<210> 32
<211> 56
<212> DNA
<213> Artificial Sequence
<220>
<223> Reverse Primer RpMatB
<400> 32
ggtggtggtg gtggtgctcg agttacttgt agatgtcctt gtaggtctcg cgcagg 56
<210> 33
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Forward Primer GtADK
<400> 33
ggtgccgcgc ggcagccata tgaatttagt gctgatgggg ctgcc 45
<210> 34
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> Reverse Primer GtADK
<400> 34
cagtggtggt ggtggtggtg ctcgagttat cgagtaagtc ccccgagc 48
<210> 35
<211> 984
<212> DNA
<213> Artificial Sequence
<220>
<223> NphBM31s
<220>
<221> CDS
<222> (1)..(984)
<400> 35
atg ggc agc agc cat cat cat cat cat cac agc agc ggc ctg gtg ccg 48
Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro
1 5 10 15
cgc ggc agc cat atg tcg gaa gct gcc gat gta gaa cgt gtc tac gcc 96
Arg Gly Ser His Met Ser Glu Ala Ala Asp Val Glu Arg Val Tyr Ala
20 25 30
gcc atc gaa gaa gcc gca ggt ttg ttg ggg gtc gca tgc gca cgc gat 144
Ala Ile Glu Glu Ala Ala Gly Leu Leu Gly Val Ala Cys Ala Arg Asp
35 40 45
aag att tgg ccc ttg ctg tca aca ttc cag gat acc ttg gtt gag ggt 192
Lys Ile Trp Pro Leu Leu Ser Thr Phe Gln Asp Thr Leu Val Glu Gly
50 55 60
gga agc gta gtt gtt ttt agc atg gcc tcg ggg cgt cac tca acg gag 240
Gly Ser Val Val Val Phe Ser Met Ala Ser Gly Arg His Ser Thr Glu
65 70 75 80
ctg gac ttc tca att tcc gtc ccg cct agt cat ggc gat ccg tac gcg 288
Leu Asp Phe Ser Ile Ser Val Pro Pro Ser His Gly Asp Pro Tyr Ala
85 90 95
att gtg gtg gaa aag ggc ttg ttc ccg gca act gga cat cca gtt gat 336
Ile Val Val Glu Lys Gly Leu Phe Pro Ala Thr Gly His Pro Val Asp
100 105 110
gac ctt ctg gcg gac att cag aag cat ctt ccc gta tct atg ttt gcg 384
Asp Leu Leu Ala Asp Ile Gln Lys His Leu Pro Val Ser Met Phe Ala
115 120 125
att gac ggg gaa gtt acc ggg ggg ttc aaa aaa act tat gcg ttc ttc 432
Ile Asp Gly Glu Val Thr Gly Gly Phe Lys Lys Thr Tyr Ala Phe Phe
130 135 140
ccg acc gat aac atg ccc ggt gtc gcg gaa ctg gcg gcc atc cca tcg 480
Pro Thr Asp Asn Met Pro Gly Val Ala Glu Leu Ala Ala Ile Pro Ser
145 150 155 160
atg cct cct gca gtc gct gaa aat gct gaa ctg ttc gcg cgt tat ggc 528
Met Pro Pro Ala Val Ala Glu Asn Ala Glu Leu Phe Ala Arg Tyr Gly
165 170 175
ctg gac aag gta caa atg acc tcg atg gat tat aaa aaa cgt caa gtg 576
Leu Asp Lys Val Gln Met Thr Ser Met Asp Tyr Lys Lys Arg Gln Val
180 185 190
aac ctg tat ttc tcc gaa ctg tcg gct cag acg ctg gag gct gaa tca 624
Asn Leu Tyr Phe Ser Glu Leu Ser Ala Gln Thr Leu Glu Ala Glu Ser
195 200 205
gta ctt gct tta gtg cgt gaa ctg ggt ctt cat gtc cca aac gag ctg 672
Val Leu Ala Leu Val Arg Glu Leu Gly Leu His Val Pro Asn Glu Leu
210 215 220
ggt ctg aaa ttt tgc aaa cgc tcc ttc tca gta tac cca aca tta aac 720
Gly Leu Lys Phe Cys Lys Arg Ser Phe Ser Val Tyr Pro Thr Leu Asn
225 230 235 240
tgg gac acc tcg aag att gac cgc ctt tgc ttc tct gta atc agt aca 768
Trp Asp Thr Ser Lys Ile Asp Arg Leu Cys Phe Ser Val Ile Ser Thr
245 250 255
gat ccg aca ctt gta cct agc tca gac gag gga gac att gaa aaa ttt 816
Asp Pro Thr Leu Val Pro Ser Ser Asp Glu Gly Asp Ile Glu Lys Phe
260 265 270
cac aat tac gct aca aag gcc ccc tat gca tat gtt gga gaa aag cgt 864
His Asn Tyr Ala Thr Lys Ala Pro Tyr Ala Tyr Val Gly Glu Lys Arg
275 280 285
aca ctt gtt tac ggc ttg act tta tct ccc aaa gag gag tat tat aaa 912
Thr Leu Val Tyr Gly Leu Thr Leu Ser Pro Lys Glu Glu Tyr Tyr Lys
290 295 300
ttg ggt gcc gtt tac cac att act gac gta caa cgc aaa ctt ttg aag 960
Leu Gly Ala Val Tyr His Ile Thr Asp Val Gln Arg Lys Leu Leu Lys
305 310 315 320
gcg ttc gac agc ctt gag gat taa 984
Ala Phe Asp Ser Leu Glu Asp
325
<210> 36
<211> 327
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 36
Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro
1 5 10 15
Arg Gly Ser His Met Ser Glu Ala Ala Asp Val Glu Arg Val Tyr Ala
20 25 30
Ala Ile Glu Glu Ala Ala Gly Leu Leu Gly Val Ala Cys Ala Arg Asp
35 40 45
Lys Ile Trp Pro Leu Leu Ser Thr Phe Gln Asp Thr Leu Val Glu Gly
50 55 60
Gly Ser Val Val Val Phe Ser Met Ala Ser Gly Arg His Ser Thr Glu
65 70 75 80
Leu Asp Phe Ser Ile Ser Val Pro Pro Ser His Gly Asp Pro Tyr Ala
85 90 95
Ile Val Val Glu Lys Gly Leu Phe Pro Ala Thr Gly His Pro Val Asp
100 105 110
Asp Leu Leu Ala Asp Ile Gln Lys His Leu Pro Val Ser Met Phe Ala
115 120 125
Ile Asp Gly Glu Val Thr Gly Gly Phe Lys Lys Thr Tyr Ala Phe Phe
130 135 140
Pro Thr Asp Asn Met Pro Gly Val Ala Glu Leu Ala Ala Ile Pro Ser
145 150 155 160
Met Pro Pro Ala Val Ala Glu Asn Ala Glu Leu Phe Ala Arg Tyr Gly
165 170 175
Leu Asp Lys Val Gln Met Thr Ser Met Asp Tyr Lys Lys Arg Gln Val
180 185 190
Asn Leu Tyr Phe Ser Glu Leu Ser Ala Gln Thr Leu Glu Ala Glu Ser
195 200 205
Val Leu Ala Leu Val Arg Glu Leu Gly Leu His Val Pro Asn Glu Leu
210 215 220
Gly Leu Lys Phe Cys Lys Arg Ser Phe Ser Val Tyr Pro Thr Leu Asn
225 230 235 240
Trp Asp Thr Ser Lys Ile Asp Arg Leu Cys Phe Ser Val Ile Ser Thr
245 250 255
Asp Pro Thr Leu Val Pro Ser Ser Asp Glu Gly Asp Ile Glu Lys Phe
260 265 270
His Asn Tyr Ala Thr Lys Ala Pro Tyr Ala Tyr Val Gly Glu Lys Arg
275 280 285
Thr Leu Val Tyr Gly Leu Thr Leu Ser Pro Lys Glu Glu Tyr Tyr Lys
290 295 300
Leu Gly Ala Val Tyr His Ile Thr Asp Val Gln Arg Lys Leu Leu Lys
305 310 315 320
Ala Phe Asp Ser Leu Glu Asp
325
<210> 37
<211> 307
<212> PRT
<213> Artificial Sequence
<220>
<223> NphB-M31 (Y288V/A232S)
<400> 37
Met Ser Glu Ala Ala Asp Val Glu Arg Val Tyr Ala Ala Met Glu Glu
1 5 10 15
Ala Ala Gly Leu Leu Gly Val Ala Cys Ala Arg Asp Lys Ile Tyr Pro
20 25 30
Leu Leu Ser Thr Phe Gln Asp Thr Leu Val Glu Gly Gly Ser Val Val
35 40 45
Val Phe Ser Met Ala Ser Gly Arg His Ser Thr Glu Leu Asp Phe Ser
50 55 60
Ile Ser Val Pro Thr Ser His Gly Asp Pro Tyr Ala Thr Val Val Glu
65 70 75 80
Lys Gly Leu Phe Pro Ala Thr Gly His Pro Val Asp Asp Leu Leu Ala
85 90 95
Asp Thr Gln Lys His Leu Pro Val Ser Met Phe Ala Ile Asp Gly Glu
100 105 110
Val Thr Gly Gly Phe Lys Lys Thr Tyr Ala Phe Phe Pro Thr Asp Asn
115 120 125
Met Pro Gly Val Ala Glu Leu Ser Ala Ile Pro Ser Met Pro Pro Ala
130 135 140
Val Ala Glu Asn Ala Glu Leu Phe Ala Arg Tyr Gly Leu Asp Lys Val
145 150 155 160
Gln Met Thr Ser Met Asp Tyr Lys Lys Arg Gln Val Asn Leu Tyr Phe
165 170 175
Ser Glu Leu Ser Ala Gln Thr Leu Glu Ala Glu Ser Val Leu Ala Leu
180 185 190
Val Arg Glu Leu Gly Leu His Val Pro Asn Glu Leu Gly Leu Lys Phe
195 200 205
Cys Lys Arg Ser Phe Ser Val Tyr Pro Thr Leu Asn Trp Glu Thr Gly
210 215 220
Lys Ile Asp Arg Leu Cys Phe Ser Val Ile Ser Asn Asp Pro Thr Leu
225 230 235 240
Val Pro Ser Ser Asp Glu Gly Asp Ile Glu Lys Phe His Asn Tyr Ala
245 250 255
Thr Lys Ala Pro Tyr Ala Tyr Val Gly Glu Lys Arg Thr Leu Val Tyr
260 265 270
Gly Leu Thr Leu Ser Pro Lys Glu Glu Tyr Tyr Lys Leu Gly Ala Val
275 280 285
Tyr His Ile Thr Asp Val Gln Arg Gly Leu Leu Lys Ala Phe Asp Ser
290 295 300
Leu Glu Asp
305
<210> 38
<211> 307
<212> PRT
<213> Artificial Sequence
<220>
<223> NphB-M31S2 is NphB-M31 (Y288V/A232S) + M14I, Y31W, T69P, T77I,
E80A, D93S, T98I, T126P, M129L, G131Q, S136A, E222D, G224S,
N236T, S277T, and G297K
<400> 38
Met Ser Glu Ala Ala Asp Val Glu Arg Val Tyr Ala Ala Ile Glu Glu
1 5 10 15
Ala Ala Gly Leu Leu Gly Val Ala Cys Ala Arg Asp Lys Ile Trp Pro
20 25 30
Leu Leu Ser Thr Phe Gln Asp Thr Leu Val Glu Gly Gly Ser Val Val
35 40 45
Val Phe Ser Met Ala Ser Gly Arg His Ser Thr Glu Leu Asp Phe Ser
50 55 60
Ile Ser Val Pro Pro Ser His Gly Asp Pro Tyr Ala Ile Val Val Ala
65 70 75 80
Lys Gly Leu Phe Pro Ala Thr Gly His Pro Val Asp Ser Leu Leu Ala
85 90 95
Asp Ile Gln Lys His Leu Pro Val Ser Met Phe Ala Ile Asp Gly Glu
100 105 110
Val Thr Gly Gly Phe Lys Lys Thr Tyr Ala Phe Phe Pro Pro Asp Asn
115 120 125
Leu Pro Gln Val Ala Glu Leu Ala Ala Ile Pro Ser Met Pro Pro Ala
130 135 140
Val Ala Glu Asn Ala Glu Leu Phe Ala Arg Tyr Gly Leu Asp Lys Val
145 150 155 160
Gln Met Thr Ser Met Asp Tyr Lys Lys Arg Gln Val Asn Leu Tyr Phe
165 170 175
Ser Glu Leu Ser Ala Gln Thr Leu Glu Ala Glu Ser Val Leu Ala Leu
180 185 190
Val Arg Glu Leu Gly Leu His Val Pro Asn Glu Leu Gly Leu Lys Phe
195 200 205
Cys Lys Arg Ser Phe Ser Val Tyr Pro Thr Leu Asn Trp Asp Thr Ser
210 215 220
Lys Ile Asp Arg Leu Cys Phe Ser Val Ile Ser Thr Asp Pro Thr Leu
225 230 235 240
Val Pro Ser Ser Asp Glu Gly Asp Ile Glu Lys Phe His Asn Tyr Ala
245 250 255
Thr Lys Ala Pro Tyr Ala Tyr Val Gly Glu Lys Arg Thr Leu Val Tyr
260 265 270
Gly Leu Thr Leu Thr Pro Lys Glu Glu Tyr Tyr Lys Leu Gly Ala Val
275 280 285
Tyr His Ile Thr Asp Val Gln Arg Lys Leu Leu Lys Ala Phe Asp Ser
290 295 300
Leu Glu Asp
305
<210> 39
<211> 307
<212> PRT
<213> Artificial Sequence
<220>
<223> NphB-M31S3 is NphB-M31 (Y288V/A232S) + M14I, L33I, Y31W, T69P,
T77I, V78A, E80A, D93S, T98I, E112G, T114V, T126P, M129L, G131Q,
S136A, E222D, G224S, K225Q, N236T, S277T, and G297K
<400> 39
Met Ser Glu Ala Ala Asp Val Glu Arg Val Tyr Ala Ala Ile Glu Glu
1 5 10 15
Ala Ala Gly Leu Leu Gly Val Ala Cys Ala Arg Asp Lys Ile Trp Pro
20 25 30
Ile Leu Ser Thr Phe Gln Asp Thr Leu Val Glu Gly Gly Ser Val Val
35 40 45
Val Phe Ser Met Ala Ser Gly Arg His Ser Thr Glu Leu Asp Phe Ser
50 55 60
Ile Ser Val Pro Pro Ser His Gly Asp Pro Tyr Ala Ile Ala Val Ala
65 70 75 80
Lys Gly Leu Phe Pro Ala Thr Gly His Pro Val Asp Ser Leu Leu Ala
85 90 95
Asp Ile Gln Lys His Leu Pro Val Ser Met Phe Ala Ile Asp Gly Gly
100 105 110
Val Val Gly Gly Phe Lys Lys Thr Tyr Ala Phe Phe Pro Pro Asp Asn
115 120 125
Leu Pro Gln Val Ala Glu Leu Ala Ala Ile Pro Ser Met Pro Pro Ala
130 135 140
Val Ala Glu Asn Ala Glu Leu Phe Ala Arg Tyr Gly Leu Asp Lys Val
145 150 155 160
Gln Met Thr Ser Met Asp Tyr Lys Lys Arg Gln Val Asn Leu Tyr Phe
165 170 175
Ser Glu Leu Ser Ala Gln Thr Leu Glu Ala Glu Ser Val Leu Ala Leu
180 185 190
Val Arg Glu Leu Gly Leu His Val Pro Asn Glu Leu Gly Leu Lys Phe
195 200 205
Cys Lys Arg Ser Phe Ser Val Tyr Pro Thr Leu Asn Trp Asp Thr Ser
210 215 220
Gln Ile Asp Arg Leu Cys Phe Ser Val Ile Ser Thr Asp Pro Thr Leu
225 230 235 240
Val Pro Ser Ser Asp Glu Gly Asp Ile Glu Lys Phe His Asn Tyr Ala
245 250 255
Thr Lys Ala Pro Tyr Ala Tyr Val Gly Glu Lys Arg Thr Leu Val Tyr
260 265 270
Gly Leu Thr Leu Thr Pro Lys Glu Glu Tyr Tyr Lys Leu Gly Ala Val
275 280 285
Tyr His Ile Thr Asp Val Gln Arg Lys Leu Leu Lys Ala Phe Asp Ser
290 295 300
Leu Glu Asp
305
<210> 40
<400> 40
000
<210> 41
<400> 41
000
<210> 42
<400> 42
000
<210> 43
<400> 43
000
<210> 44
<400> 44
000
<210> 45
<400> 45
000
<210> 46
<400> 46
000
<210> 47
<400> 47
000
<210> 48
<400> 48
000
<210> 49
<400> 49
000
<210> 50
<400> 50
000
<210> 51
<400> 51
000
<210> 52
<400> 52
000
<210> 53
<400> 53
000
<210> 54
<211> 789
<212> DNA
<213> Escherichia coli
<220>
<221> CDS
<222> (1)..(789)
<400> 54
atg caa gtc gac ctg ctg ggt tca gcg caa tct gcg cac gcg tta cac 48
Met Gln Val Asp Leu Leu Gly Ser Ala Gln Ser Ala His Ala Leu His
1 5 10 15
ctt ttt cac caa cat tcc cct ctt gtg cac tgc atg acc aat gat gtg 96
Leu Phe His Gln His Ser Pro Leu Val His Cys Met Thr Asn Asp Val
20 25 30
gtg caa acc ttt acc gcc aat acc ttg ctg gcg ctc ggt gca tcg cca 144
Val Gln Thr Phe Thr Ala Asn Thr Leu Leu Ala Leu Gly Ala Ser Pro
35 40 45
gcg atg gtt atc gaa acc gaa gag gcc agt cag ttt gcg gct atc gcc 192
Ala Met Val Ile Glu Thr Glu Glu Ala Ser Gln Phe Ala Ala Ile Ala
50 55 60
agt gcc ttg ttg att aac gtt ggc aca ctg acg cag cca cgc gct cag 240
Ser Ala Leu Leu Ile Asn Val Gly Thr Leu Thr Gln Pro Arg Ala Gln
65 70 75 80
gcg atg cgt gct gcc gtt gag caa gca aaa agc tct caa aca ccc tgg 288
Ala Met Arg Ala Ala Val Glu Gln Ala Lys Ser Ser Gln Thr Pro Trp
85 90 95
acg ctt gat cca gta gcg gtg ggt gcg ctc gat tat cgc cgc cat ttt 336
Thr Leu Asp Pro Val Ala Val Gly Ala Leu Asp Tyr Arg Arg His Phe
100 105 110
tgt cat gaa ctt tta tct ttt aaa ccg gca gcg ata cgt ggt aat gct 384
Cys His Glu Leu Leu Ser Phe Lys Pro Ala Ala Ile Arg Gly Asn Ala
115 120 125
tcg gaa atc atg gca tta gct ggc att gct aat ggc gga cgg gga gtg 432
Ser Glu Ile Met Ala Leu Ala Gly Ile Ala Asn Gly Gly Arg Gly Val
130 135 140
gat acc act gac gcc gca gct aac gcg ata ccc gct gca caa aca ctg 480
Asp Thr Thr Asp Ala Ala Ala Asn Ala Ile Pro Ala Ala Gln Thr Leu
145 150 155 160
gca cgg gaa act ggc gca atc gtc gtg gtc act ggc gag atg gat tat 528
Ala Arg Glu Thr Gly Ala Ile Val Val Val Thr Gly Glu Met Asp Tyr
165 170 175
gtt acc gat gga cat cgt atc att ggt att cac ggt ggt gat ccg tta 576
Val Thr Asp Gly His Arg Ile Ile Gly Ile His Gly Gly Asp Pro Leu
180 185 190
atg acc aaa gtg gta gga act ggc tgt gca tta tcg gcg gtt gtc gct 624
Met Thr Lys Val Val Gly Thr Gly Cys Ala Leu Ser Ala Val Val Ala
195 200 205
gcc tgc tgt gcg tta cca ggc gat acg ctg gaa aat gtc gca tct gcc 672
Ala Cys Cys Ala Leu Pro Gly Asp Thr Leu Glu Asn Val Ala Ser Ala
210 215 220
tgt cac tgg atg aaa caa gcc gga gaa cgc gca gtc gcc aga agc gag 720
Cys His Trp Met Lys Gln Ala Gly Glu Arg Ala Val Ala Arg Ser Glu
225 230 235 240
ggg cca ggc agt ttt gtt cca cat ttc ctt gat gcg ctc tgg caa ttg 768
Gly Pro Gly Ser Phe Val Pro His Phe Leu Asp Ala Leu Trp Gln Leu
245 250 255
acg cag gag gtg cag gca tga 789
Thr Gln Glu Val Gln Ala
260
<210> 55
<211> 262
<212> PRT
<213> Escherichia coli
<400> 55
Met Gln Val Asp Leu Leu Gly Ser Ala Gln Ser Ala His Ala Leu His
1 5 10 15
Leu Phe His Gln His Ser Pro Leu Val His Cys Met Thr Asn Asp Val
20 25 30
Val Gln Thr Phe Thr Ala Asn Thr Leu Leu Ala Leu Gly Ala Ser Pro
35 40 45
Ala Met Val Ile Glu Thr Glu Glu Ala Ser Gln Phe Ala Ala Ile Ala
50 55 60
Ser Ala Leu Leu Ile Asn Val Gly Thr Leu Thr Gln Pro Arg Ala Gln
65 70 75 80
Ala Met Arg Ala Ala Val Glu Gln Ala Lys Ser Ser Gln Thr Pro Trp
85 90 95
Thr Leu Asp Pro Val Ala Val Gly Ala Leu Asp Tyr Arg Arg His Phe
100 105 110
Cys His Glu Leu Leu Ser Phe Lys Pro Ala Ala Ile Arg Gly Asn Ala
115 120 125
Ser Glu Ile Met Ala Leu Ala Gly Ile Ala Asn Gly Gly Arg Gly Val
130 135 140
Asp Thr Thr Asp Ala Ala Ala Asn Ala Ile Pro Ala Ala Gln Thr Leu
145 150 155 160
Ala Arg Glu Thr Gly Ala Ile Val Val Val Thr Gly Glu Met Asp Tyr
165 170 175
Val Thr Asp Gly His Arg Ile Ile Gly Ile His Gly Gly Asp Pro Leu
180 185 190
Met Thr Lys Val Val Gly Thr Gly Cys Ala Leu Ser Ala Val Val Ala
195 200 205
Ala Cys Cys Ala Leu Pro Gly Asp Thr Leu Glu Asn Val Ala Ser Ala
210 215 220
Cys His Trp Met Lys Gln Ala Gly Glu Arg Ala Val Ala Arg Ser Glu
225 230 235 240
Gly Pro Gly Ser Phe Val Pro His Phe Leu Asp Ala Leu Trp Gln Leu
245 250 255
Thr Gln Glu Val Gln Ala
260
<210> 56
<211> 819
<212> DNA
<213> Bacillus subtilis
<220>
<221> CDS
<222> (1)..(819)
<400> 56
atg gat gca caa tca gca gca aaa tgt ctt acg gct gtc cgc cgg cat 48
Met Asp Ala Gln Ser Ala Ala Lys Cys Leu Thr Ala Val Arg Arg His
1 5 10 15
agc cca ctg gtg cat agc ata acc aac aat gtc gta acg aat ttc aca 96
Ser Pro Leu Val His Ser Ile Thr Asn Asn Val Val Thr Asn Phe Thr
20 25 30
gca aac ggc ctg ctc gcg ctc ggc gca tcg ccc gtt atg gcg tac gca 144
Ala Asn Gly Leu Leu Ala Leu Gly Ala Ser Pro Val Met Ala Tyr Ala
35 40 45
aaa gaa gag gtc gcc gat atg gcg aaa att gcg ggt gca ctc gtt tta 192
Lys Glu Glu Val Ala Asp Met Ala Lys Ile Ala Gly Ala Leu Val Leu
50 55 60
aat atc gga aca ctg agc aag gag tca gtc gaa gcg atg atc atc gcg 240
Asn Ile Gly Thr Leu Ser Lys Glu Ser Val Glu Ala Met Ile Ile Ala
65 70 75 80
gga aaa tca gct aat gaa cat ggc gtt ccc gtc att ctt gat cct gtc 288
Gly Lys Ser Ala Asn Glu His Gly Val Pro Val Ile Leu Asp Pro Val
85 90 95
ggt gcc gga gca aca ccg ttc cgc act gaa tcg gca cgt gac atc att 336
Gly Ala Gly Ala Thr Pro Phe Arg Thr Glu Ser Ala Arg Asp Ile Ile
100 105 110
cgt gag gtg cgc ctt gct gca atc aga gga aat gcg gcg gaa att gcc 384
Arg Glu Val Arg Leu Ala Ala Ile Arg Gly Asn Ala Ala Glu Ile Ala
115 120 125
cat acc gtc ggc gtg acc gat tgg ctg atc aaa ggt gtt gat gcg ggt 432
His Thr Val Gly Val Thr Asp Trp Leu Ile Lys Gly Val Asp Ala Gly
130 135 140
gaa ggt gga ggc gac atc atc cgg ctg gct cag cag gcg gca caa aag 480
Glu Gly Gly Gly Asp Ile Ile Arg Leu Ala Gln Gln Ala Ala Gln Lys
145 150 155 160
cta aac acg gtc att gcg ata act ggt gaa gtt gat gtc ata gcc gac 528
Leu Asn Thr Val Ile Ala Ile Thr Gly Glu Val Asp Val Ile Ala Asp
165 170 175
acg tca cat gta tac acc ctt cat aac ggc cac aag ctg ctg aca aaa 576
Thr Ser His Val Tyr Thr Leu His Asn Gly His Lys Leu Leu Thr Lys
180 185 190
gtg aca ggc gcc ggt tgc ctg ctg act tcc gtc gtc ggt gcg ttt tgc 624
Val Thr Gly Ala Gly Cys Leu Leu Thr Ser Val Val Gly Ala Phe Cys
195 200 205
gct gtg gaa gaa aat cca ttg ttt gct gct att gcg gcc att tct tcg 672
Ala Val Glu Glu Asn Pro Leu Phe Ala Ala Ile Ala Ala Ile Ser Ser
210 215 220
tat ggg gtc gcc gct cag ctt gcc gca cag cag acg gct gac aaa ggc 720
Tyr Gly Val Ala Ala Gln Leu Ala Ala Gln Gln Thr Ala Asp Lys Gly
225 230 235 240
cct gga agc ttt cag att gaa ttg ctg aac aag ctt tca act gtt act 768
Pro Gly Ser Phe Gln Ile Glu Leu Leu Asn Lys Leu Ser Thr Val Thr
245 250 255
gaa caa gac gtc caa gaa tgg gcg act ata gaa agg gtg act gtc tca 816
Glu Gln Asp Val Gln Glu Trp Ala Thr Ile Glu Arg Val Thr Val Ser
260 265 270
tga 819
<210> 57
<211> 272
<212> PRT
<213> Bacillus subtilis
<400> 57
Met Asp Ala Gln Ser Ala Ala Lys Cys Leu Thr Ala Val Arg Arg His
1 5 10 15
Ser Pro Leu Val His Ser Ile Thr Asn Asn Val Val Thr Asn Phe Thr
20 25 30
Ala Asn Gly Leu Leu Ala Leu Gly Ala Ser Pro Val Met Ala Tyr Ala
35 40 45
Lys Glu Glu Val Ala Asp Met Ala Lys Ile Ala Gly Ala Leu Val Leu
50 55 60
Asn Ile Gly Thr Leu Ser Lys Glu Ser Val Glu Ala Met Ile Ile Ala
65 70 75 80
Gly Lys Ser Ala Asn Glu His Gly Val Pro Val Ile Leu Asp Pro Val
85 90 95
Gly Ala Gly Ala Thr Pro Phe Arg Thr Glu Ser Ala Arg Asp Ile Ile
100 105 110
Arg Glu Val Arg Leu Ala Ala Ile Arg Gly Asn Ala Ala Glu Ile Ala
115 120 125
His Thr Val Gly Val Thr Asp Trp Leu Ile Lys Gly Val Asp Ala Gly
130 135 140
Glu Gly Gly Gly Asp Ile Ile Arg Leu Ala Gln Gln Ala Ala Gln Lys
145 150 155 160
Leu Asn Thr Val Ile Ala Ile Thr Gly Glu Val Asp Val Ile Ala Asp
165 170 175
Thr Ser His Val Tyr Thr Leu His Asn Gly His Lys Leu Leu Thr Lys
180 185 190
Val Thr Gly Ala Gly Cys Leu Leu Thr Ser Val Val Gly Ala Phe Cys
195 200 205
Ala Val Glu Glu Asn Pro Leu Phe Ala Ala Ile Ala Ala Ile Ser Ser
210 215 220
Tyr Gly Val Ala Ala Gln Leu Ala Ala Gln Gln Thr Ala Asp Lys Gly
225 230 235 240
Pro Gly Ser Phe Gln Ile Glu Leu Leu Asn Lys Leu Ser Thr Val Thr
245 250 255
Glu Gln Asp Val Gln Glu Trp Ala Thr Ile Glu Arg Val Thr Val Ser
260 265 270
<210> 58
<211> 783
<212> DNA
<213> Methanocaldococcus jannaschii
<220>
<221> CDS
<222> (1)..(783)
<400> 58
atg ttg act att ctt aag ttg gga ggg agc att ctg tcc gat aaa aac 48
Met Leu Thr Ile Leu Lys Leu Gly Gly Ser Ile Leu Ser Asp Lys Asn
1 5 10 15
gtt cca tat agc att aag tgg gat aac tta gaa cgt att gct atg gaa 96
Val Pro Tyr Ser Ile Lys Trp Asp Asn Leu Glu Arg Ile Ala Met Glu
20 25 30
atc aaa aac gcg tta gat tat tac aag aac caa aat aaa gaa att aag 144
Ile Lys Asn Ala Leu Asp Tyr Tyr Lys Asn Gln Asn Lys Glu Ile Lys
35 40 45
ctt att ctg gta cat ggc ggc ggg gca ttt ggg cat cca gtg gcc aag 192
Leu Ile Leu Val His Gly Gly Gly Ala Phe Gly His Pro Val Ala Lys
50 55 60
aaa tac ctg aag att gaa gac ggc aaa aaa att ttc atc aac atg gaa 240
Lys Tyr Leu Lys Ile Glu Asp Gly Lys Lys Ile Phe Ile Asn Met Glu
65 70 75 80
aaa gga ttc tgg gag att cag cgt gcg atg cgc cgt ttt aat aac atc 288
Lys Gly Phe Trp Glu Ile Gln Arg Ala Met Arg Arg Phe Asn Asn Ile
85 90 95
atc atc gac acg ctt cag agt tac gat atc cca gcg gtc tcg att caa 336
Ile Ile Asp Thr Leu Gln Ser Tyr Asp Ile Pro Ala Val Ser Ile Gln
100 105 110
cct tcc agc ttt gtt gtt ttt ggc gac aaa ttg atc ttc gac acc tct 384
Pro Ser Ser Phe Val Val Phe Gly Asp Lys Leu Ile Phe Asp Thr Ser
115 120 125
gcg atc aaa gag atg ttg aaa cgc aac ctt gta ccc gtt atc cat ggg 432
Ala Ile Lys Glu Met Leu Lys Arg Asn Leu Val Pro Val Ile His Gly
130 135 140
gat atc gtc att gac gat aaa aat ggg tac cgt att atc agc ggt gac 480
Asp Ile Val Ile Asp Asp Lys Asn Gly Tyr Arg Ile Ile Ser Gly Asp
145 150 155 160
gac atc gtg cca tat tta gcc aat gaa ctg aag gca gat tta atc ctt 528
Asp Ile Val Pro Tyr Leu Ala Asn Glu Leu Lys Ala Asp Leu Ile Leu
165 170 175
tat gca acc gac gtg gac ggc gta ttg att gac aac aag ccc att aaa 576
Tyr Ala Thr Asp Val Asp Gly Val Leu Ile Asp Asn Lys Pro Ile Lys
180 185 190
cgc att gat aag aat aat atc tac aag att ttg aat tat ctt tcg ggt 624
Arg Ile Asp Lys Asn Asn Ile Tyr Lys Ile Leu Asn Tyr Leu Ser Gly
195 200 205
agc aat tca att gac gtc acg ggg ggg atg aaa tac aag atc gac atg 672
Ser Asn Ser Ile Asp Val Thr Gly Gly Met Lys Tyr Lys Ile Asp Met
210 215 220
atc cgt aaa aac aaa tgc cgt ggt ttc gtg ttt aat ggc aac aag gca 720
Ile Arg Lys Asn Lys Cys Arg Gly Phe Val Phe Asn Gly Asn Lys Ala
225 230 235 240
aac aac att tat aag gcg ctg ctt ggg gaa gtc gag ggt acc gaa atc 768
Asn Asn Ile Tyr Lys Ala Leu Leu Gly Glu Val Glu Gly Thr Glu Ile
245 250 255
gac ttt tct gaa taa 783
Asp Phe Ser Glu
260
<210> 59
<211> 260
<212> PRT
<213> Methanocaldococcus jannaschii
<400> 59
Met Leu Thr Ile Leu Lys Leu Gly Gly Ser Ile Leu Ser Asp Lys Asn
1 5 10 15
Val Pro Tyr Ser Ile Lys Trp Asp Asn Leu Glu Arg Ile Ala Met Glu
20 25 30
Ile Lys Asn Ala Leu Asp Tyr Tyr Lys Asn Gln Asn Lys Glu Ile Lys
35 40 45
Leu Ile Leu Val His Gly Gly Gly Ala Phe Gly His Pro Val Ala Lys
50 55 60
Lys Tyr Leu Lys Ile Glu Asp Gly Lys Lys Ile Phe Ile Asn Met Glu
65 70 75 80
Lys Gly Phe Trp Glu Ile Gln Arg Ala Met Arg Arg Phe Asn Asn Ile
85 90 95
Ile Ile Asp Thr Leu Gln Ser Tyr Asp Ile Pro Ala Val Ser Ile Gln
100 105 110
Pro Ser Ser Phe Val Val Phe Gly Asp Lys Leu Ile Phe Asp Thr Ser
115 120 125
Ala Ile Lys Glu Met Leu Lys Arg Asn Leu Val Pro Val Ile His Gly
130 135 140
Asp Ile Val Ile Asp Asp Lys Asn Gly Tyr Arg Ile Ile Ser Gly Asp
145 150 155 160
Asp Ile Val Pro Tyr Leu Ala Asn Glu Leu Lys Ala Asp Leu Ile Leu
165 170 175
Tyr Ala Thr Asp Val Asp Gly Val Leu Ile Asp Asn Lys Pro Ile Lys
180 185 190
Arg Ile Asp Lys Asn Asn Ile Tyr Lys Ile Leu Asn Tyr Leu Ser Gly
195 200 205
Ser Asn Ser Ile Asp Val Thr Gly Gly Met Lys Tyr Lys Ile Asp Met
210 215 220
Ile Arg Lys Asn Lys Cys Arg Gly Phe Val Phe Asn Gly Asn Lys Ala
225 230 235 240
Asn Asn Ile Tyr Lys Ala Leu Leu Gly Glu Val Glu Gly Thr Glu Ile
245 250 255
Asp Phe Ser Glu
260
<210> 60
<211> 744
<212> DNA
<213> Methanothrix themoacetophila
<220>
<221> CDS
<222> (1)..(744)
<400> 60
tta aag att ttg aaa ttg ggc ggt agc att att acg gat aag agc cgc 48
Leu Lys Ile Leu Lys Leu Gly Gly Ser Ile Ile Thr Asp Lys Ser Arg
1 5 10 15
tta gct act gca cgt ctg gat caa att tca cgt atc gca cac gaa atc 96
Leu Ala Thr Ala Arg Leu Asp Gln Ile Ser Arg Ile Ala His Glu Ile
20 25 30
tca ggc atc gag aac ctg att gtt gtt cac gga gcc ggt tct ttt ggt 144
Ser Gly Ile Glu Asn Leu Ile Val Val His Gly Ala Gly Ser Phe Gly
35 40 45
cac atc cat gcc aaa aat ttc ggt ctt ccg gaa cgt ttc tca gga gaa 192
His Ile His Ala Lys Asn Phe Gly Leu Pro Glu Arg Phe Ser Gly Glu
50 55 60
ggg tta ctg aaa aca cat ctg tcg gtc tcg gat ttg aat cgt atc gtc 240
Gly Leu Leu Lys Thr His Leu Ser Val Ser Asp Leu Asn Arg Ile Val
65 70 75 80
gtt gaa gct ctt cat gat gca ggg gtg gac gcg ctg ccc ttg cac ccc 288
Val Glu Ala Leu His Asp Ala Gly Val Asp Ala Leu Pro Leu His Pro
85 90 95
tta tca agt gta gtc ctt cgt gac gga cgc atc cac cat atg tct acc 336
Leu Ser Ser Val Val Leu Arg Asp Gly Arg Ile His His Met Ser Thr
100 105 110
gag gtc att acg gaa atg ctt cgt cgt gat gta gtg ccg gta tta cat 384
Glu Val Ile Thr Glu Met Leu Arg Arg Asp Val Val Pro Val Leu His
115 120 125
ggg gat gtt gcg atg gac ctg tca aag ggt gcc ggc att gta agt gga 432
Gly Asp Val Ala Met Asp Leu Ser Lys Gly Ala Gly Ile Val Ser Gly
130 135 140
gac cag ttg gtt tcg tat atg gca cgt act ctg gga gct ggt atg gtc 480
Asp Gln Leu Val Ser Tyr Met Ala Arg Thr Leu Gly Ala Gly Met Val
145 150 155 160
gct atg ggg acc gat gtc gac ggg gtt atg atc gat ggt cgt gtc ctt 528
Ala Met Gly Thr Asp Val Asp Gly Val Met Ile Asp Gly Arg Val Leu
165 170 175
agt tgc att aca cct aat gac atg cac tct ttg gag agt cac tta tta 576
Ser Cys Ile Thr Pro Asn Asp Met His Ser Leu Glu Ser His Leu Leu
180 185 190
ccc gca aaa ggg gta gac gtc acg ggt gga atg cgc ggt aaa ctg gcg 624
Pro Ala Lys Gly Val Asp Val Thr Gly Gly Met Arg Gly Lys Leu Ala
195 200 205
gaa tta gta gag ctg gca ggc att gga att gat tcg cgt att ttt aat 672
Glu Leu Val Glu Leu Ala Gly Ile Gly Ile Asp Ser Arg Ile Phe Asn
210 215 220
gcc ggc gtt gct ggt aat gta cgc cgt gct ttg tct ggg gag tcg tta 720
Ala Gly Val Ala Gly Asn Val Arg Arg Ala Leu Ser Gly Glu Ser Leu
225 230 235 240
gga act ttg att act gga cgc taa 744
Gly Thr Leu Ile Thr Gly Arg
245
<210> 61
<211> 247
<212> PRT
<213> Methanothrix themoacetophila
<400> 61
Leu Lys Ile Leu Lys Leu Gly Gly Ser Ile Ile Thr Asp Lys Ser Arg
1 5 10 15
Leu Ala Thr Ala Arg Leu Asp Gln Ile Ser Arg Ile Ala His Glu Ile
20 25 30
Ser Gly Ile Glu Asn Leu Ile Val Val His Gly Ala Gly Ser Phe Gly
35 40 45
His Ile His Ala Lys Asn Phe Gly Leu Pro Glu Arg Phe Ser Gly Glu
50 55 60
Gly Leu Leu Lys Thr His Leu Ser Val Ser Asp Leu Asn Arg Ile Val
65 70 75 80
Val Glu Ala Leu His Asp Ala Gly Val Asp Ala Leu Pro Leu His Pro
85 90 95
Leu Ser Ser Val Val Leu Arg Asp Gly Arg Ile His His Met Ser Thr
100 105 110
Glu Val Ile Thr Glu Met Leu Arg Arg Asp Val Val Pro Val Leu His
115 120 125
Gly Asp Val Ala Met Asp Leu Ser Lys Gly Ala Gly Ile Val Ser Gly
130 135 140
Asp Gln Leu Val Ser Tyr Met Ala Arg Thr Leu Gly Ala Gly Met Val
145 150 155 160
Ala Met Gly Thr Asp Val Asp Gly Val Met Ile Asp Gly Arg Val Leu
165 170 175
Ser Cys Ile Thr Pro Asn Asp Met His Ser Leu Glu Ser His Leu Leu
180 185 190
Pro Ala Lys Gly Val Asp Val Thr Gly Gly Met Arg Gly Lys Leu Ala
195 200 205
Glu Leu Val Glu Leu Ala Gly Ile Gly Ile Asp Ser Arg Ile Phe Asn
210 215 220
Ala Gly Val Ala Gly Asn Val Arg Arg Ala Leu Ser Gly Glu Ser Leu
225 230 235 240
Gly Thr Leu Ile Thr Gly Arg
245
<210> 62
<211> 543
<212> DNA
<213> Escherichia coli
<220>
<221> CDS
<222> (1)..(543)
<400> 62
atg caa acc gag cat gtc att tta ttg gac gag caa gga gaa cca att 48
Met Gln Thr Glu His Val Ile Leu Leu Asp Glu Gln Gly Glu Pro Ile
1 5 10 15
gga act tta gaa aaa tac gct gca cat aca gcg gac acc cgc tta cat 96
Gly Thr Leu Glu Lys Tyr Ala Ala His Thr Ala Asp Thr Arg Leu His
20 25 30
ctt gct ttt tct agt tgg ctg ttt aac gat aag ggt caa tta tta gtg 144
Leu Ala Phe Ser Ser Trp Leu Phe Asn Asp Lys Gly Gln Leu Leu Val
35 40 45
acg cgc cgt gcg ctg agc aaa aaa gca tgg ccg ggt gtt tgg acg aac 192
Thr Arg Arg Ala Leu Ser Lys Lys Ala Trp Pro Gly Val Trp Thr Asn
50 55 60
agt gtt tgc gga cac ccc caa ctg gga gaa tcc aat gag gat gcg gta 240
Ser Val Cys Gly His Pro Gln Leu Gly Glu Ser Asn Glu Asp Ala Val
65 70 75 80
att cgc cgt tgt cgc tat gaa ttg ggt gtg gag att acg cca ccg aca 288
Ile Arg Arg Cys Arg Tyr Glu Leu Gly Val Glu Ile Thr Pro Pro Thr
85 90 95
ccg atc tac cct gat ttc cgt tat cgc gct acg gat cct tca ggt att 336
Pro Ile Tyr Pro Asp Phe Arg Tyr Arg Ala Thr Asp Pro Ser Gly Ile
100 105 110
gtt gaa aat gaa gta tgc cca gtg ttt gcc gcg cgc aca act tct gcg 384
Val Glu Asn Glu Val Cys Pro Val Phe Ala Ala Arg Thr Thr Ser Ala
115 120 125
ctt caa atc aac cca gac gag gtc atg gat tac caa tgg tgt gat ctt 432
Leu Gln Ile Asn Pro Asp Glu Val Met Asp Tyr Gln Trp Cys Asp Leu
130 135 140
gct gac gta ctg cac ggg att gac gcg aca ccg tgg gct ttt agt ccc 480
Ala Asp Val Leu His Gly Ile Asp Ala Thr Pro Trp Ala Phe Ser Pro
145 150 155 160
tgg atg gtt atg caa gcg aca aat gaa gaa gca cgt aag cgc ctt cag 528
Trp Met Val Met Gln Ala Thr Asn Glu Glu Ala Arg Lys Arg Leu Gln
165 170 175
gcg ttt act cag taa 543
Ala Phe Thr Gln
180
<210> 63
<211> 180
<212> PRT
<213> Escherichia coli
<400> 63
Met Gln Thr Glu His Val Ile Leu Leu Asp Glu Gln Gly Glu Pro Ile
1 5 10 15
Gly Thr Leu Glu Lys Tyr Ala Ala His Thr Ala Asp Thr Arg Leu His
20 25 30
Leu Ala Phe Ser Ser Trp Leu Phe Asn Asp Lys Gly Gln Leu Leu Val
35 40 45
Thr Arg Arg Ala Leu Ser Lys Lys Ala Trp Pro Gly Val Trp Thr Asn
50 55 60
Ser Val Cys Gly His Pro Gln Leu Gly Glu Ser Asn Glu Asp Ala Val
65 70 75 80
Ile Arg Arg Cys Arg Tyr Glu Leu Gly Val Glu Ile Thr Pro Pro Thr
85 90 95
Pro Ile Tyr Pro Asp Phe Arg Tyr Arg Ala Thr Asp Pro Ser Gly Ile
100 105 110
Val Glu Asn Glu Val Cys Pro Val Phe Ala Ala Arg Thr Thr Ser Ala
115 120 125
Leu Gln Ile Asn Pro Asp Glu Val Met Asp Tyr Gln Trp Cys Asp Leu
130 135 140
Ala Asp Val Leu His Gly Ile Asp Ala Thr Pro Trp Ala Phe Ser Pro
145 150 155 160
Trp Met Val Met Gln Ala Thr Asn Glu Glu Ala Arg Lys Arg Leu Gln
165 170 175
Ala Phe Thr Gln
180
<210> 64
<211> 894
<212> DNA
<213> Geobacillus stearothermophilus
<220>
<221> CDS
<222> (1)..(894)
<400> 64
atg gcg cag ctt tca gtt gaa cag ttt ctc aac gag caa aaa cag gcg 48
Met Ala Gln Leu Ser Val Glu Gln Phe Leu Asn Glu Gln Lys Gln Ala
1 5 10 15
gtg gaa aca gcg ctc tcc cgt tat ata gag cgc tta gaa ggg ccg gcg 96
Val Glu Thr Ala Leu Ser Arg Tyr Ile Glu Arg Leu Glu Gly Pro Ala
20 25 30
aag ctg aaa aag gcg atg gcg tac tca ttg gag gcc ggc ggc aaa cga 144
Lys Leu Lys Lys Ala Met Ala Tyr Ser Leu Glu Ala Gly Gly Lys Arg
35 40 45
atc cgt ccg ttg ctg ctt ctg tcc acc gtt cgg gcg ctc ggc aaa gac 192
Ile Arg Pro Leu Leu Leu Leu Ser Thr Val Arg Ala Leu Gly Lys Asp
50 55 60
ccg gcg gtc gga ttg ccc gtc gcc tgc gcg att gaa atg atc cat acg 240
Pro Ala Val Gly Leu Pro Val Ala Cys Ala Ile Glu Met Ile His Thr
65 70 75 80
tac ttt ttg atc cat gat gat ttg ccg agc atg gac aac gat gat ttg 288
Tyr Phe Leu Ile His Asp Asp Leu Pro Ser Met Asp Asn Asp Asp Leu
85 90 95
cgg cgc ggc aag ccg acg aac cat aaa gtg ttc ggc gag gcg atg gcc 336
Arg Arg Gly Lys Pro Thr Asn His Lys Val Phe Gly Glu Ala Met Ala
100 105 110
atc ttg gcg ggg gac ggg ttg ttg acg tac gcg ttt caa ttg atc acc 384
Ile Leu Ala Gly Asp Gly Leu Leu Thr Tyr Ala Phe Gln Leu Ile Thr
115 120 125
gaa atc gac gat gag cgc atc cct cct tcc gtc cgg ctt cgg ctc atc 432
Glu Ile Asp Asp Glu Arg Ile Pro Pro Ser Val Arg Leu Arg Leu Ile
130 135 140
gaa cgg ctg gcg aaa gcg gcc ggt ccg gaa ggg atg gtc gcc ggt cag 480
Glu Arg Leu Ala Lys Ala Ala Gly Pro Glu Gly Met Val Ala Gly Gln
145 150 155 160
gca gcc gat atg gaa gga gag ggg aaa acg ctg acg ctt tcg gag ctc 528
Ala Ala Asp Met Glu Gly Glu Gly Lys Thr Leu Thr Leu Ser Glu Leu
165 170 175
gaa tac att cat cgg cat aaa acc ggg aaa atg ctg caa tac agc gtg 576
Glu Tyr Ile His Arg His Lys Thr Gly Lys Met Leu Gln Tyr Ser Val
180 185 190
cac gcc ggc gcc ttg atc ggc ggc gct gat gcc cgg caa acg cgg gag 624
His Ala Gly Ala Leu Ile Gly Gly Ala Asp Ala Arg Gln Thr Arg Glu
195 200 205
ctt gac gaa ttc gcc gcc cat cta ggc ctt gcc ttt caa att cgc gat 672
Leu Asp Glu Phe Ala Ala His Leu Gly Leu Ala Phe Gln Ile Arg Asp
210 215 220
gat att ctc gat att gaa ggg gca gaa gaa aaa atc ggc aag ccg gtc 720
Asp Ile Leu Asp Ile Glu Gly Ala Glu Glu Lys Ile Gly Lys Pro Val
225 230 235 240
ggc agc gac caa agc aac aac aaa gcg acg tat cca gcg ttg ctg tcg 768
Gly Ser Asp Gln Ser Asn Asn Lys Ala Thr Tyr Pro Ala Leu Leu Ser
245 250 255
ctt gcc ggc gcg aag gaa aag ttg gcg ttc cat atc gag gcg gcg cag 816
Leu Ala Gly Ala Lys Glu Lys Leu Ala Phe His Ile Glu Ala Ala Gln
260 265 270
cgc cat tta cgg aac gct gac gtt gac ggc gcc gcg ctc gcc tat att 864
Arg His Leu Arg Asn Ala Asp Val Asp Gly Ala Ala Leu Ala Tyr Ile
275 280 285
tgc gaa ctg gtc gcc gcc cgc gac cat taa 894
Cys Glu Leu Val Ala Ala Arg Asp His
290 295
<210> 65
<211> 297
<212> PRT
<213> Geobacillus stearothermophilus
<400> 65
Met Ala Gln Leu Ser Val Glu Gln Phe Leu Asn Glu Gln Lys Gln Ala
1 5 10 15
Val Glu Thr Ala Leu Ser Arg Tyr Ile Glu Arg Leu Glu Gly Pro Ala
20 25 30
Lys Leu Lys Lys Ala Met Ala Tyr Ser Leu Glu Ala Gly Gly Lys Arg
35 40 45
Ile Arg Pro Leu Leu Leu Leu Ser Thr Val Arg Ala Leu Gly Lys Asp
50 55 60
Pro Ala Val Gly Leu Pro Val Ala Cys Ala Ile Glu Met Ile His Thr
65 70 75 80
Tyr Phe Leu Ile His Asp Asp Leu Pro Ser Met Asp Asn Asp Asp Leu
85 90 95
Arg Arg Gly Lys Pro Thr Asn His Lys Val Phe Gly Glu Ala Met Ala
100 105 110
Ile Leu Ala Gly Asp Gly Leu Leu Thr Tyr Ala Phe Gln Leu Ile Thr
115 120 125
Glu Ile Asp Asp Glu Arg Ile Pro Pro Ser Val Arg Leu Arg Leu Ile
130 135 140
Glu Arg Leu Ala Lys Ala Ala Gly Pro Glu Gly Met Val Ala Gly Gln
145 150 155 160
Ala Ala Asp Met Glu Gly Glu Gly Lys Thr Leu Thr Leu Ser Glu Leu
165 170 175
Glu Tyr Ile His Arg His Lys Thr Gly Lys Met Leu Gln Tyr Ser Val
180 185 190
His Ala Gly Ala Leu Ile Gly Gly Ala Asp Ala Arg Gln Thr Arg Glu
195 200 205
Leu Asp Glu Phe Ala Ala His Leu Gly Leu Ala Phe Gln Ile Arg Asp
210 215 220
Asp Ile Leu Asp Ile Glu Gly Ala Glu Glu Lys Ile Gly Lys Pro Val
225 230 235 240
Gly Ser Asp Gln Ser Asn Asn Lys Ala Thr Tyr Pro Ala Leu Leu Ser
245 250 255
Leu Ala Gly Ala Lys Glu Lys Leu Ala Phe His Ile Glu Ala Ala Gln
260 265 270
Arg His Leu Arg Asn Ala Asp Val Asp Gly Ala Ala Leu Ala Tyr Ile
275 280 285
Cys Glu Leu Val Ala Ala Arg Asp His
290 295
<210> 66
<211> 1632
<212> DNA
<213> Cannabis sativa
<220>
<221> CDS
<222> (1)..(1632)
<400> 66
atg gaa aag agt ggc tac gga cgc gac ggt att tac cgt agc ctg cgt 48
Met Glu Lys Ser Gly Tyr Gly Arg Asp Gly Ile Tyr Arg Ser Leu Arg
1 5 10 15
cct cct tta cac ctg cca aac aat aac aat ttg agt atg gtc tca ttc 96
Pro Pro Leu His Leu Pro Asn Asn Asn Asn Leu Ser Met Val Ser Phe
20 25 30
ctg ttc cgt aac agc agc agc tat cca cag aaa ccg gcg ttg atc gat 144
Leu Phe Arg Asn Ser Ser Ser Tyr Pro Gln Lys Pro Ala Leu Ile Asp
35 40 45
agc gag act aat caa att tta tct ttt agt cat ttt aaa agc acc gtg 192
Ser Glu Thr Asn Gln Ile Leu Ser Phe Ser His Phe Lys Ser Thr Val
50 55 60
atc aag gtc tcc cat ggc ttc tta aac ctg ggg atc aaa aag aat gac 240
Ile Lys Val Ser His Gly Phe Leu Asn Leu Gly Ile Lys Lys Asn Asp
65 70 75 80
gtg gtt tta atc tac gca ccc aat tcg atc cac ttt ccc gta tgc ttc 288
Val Val Leu Ile Tyr Ala Pro Asn Ser Ile His Phe Pro Val Cys Phe
85 90 95
ctt ggc att att gct tct ggg gcg atc gcc act act tca aat cca tta 336
Leu Gly Ile Ile Ala Ser Gly Ala Ile Ala Thr Thr Ser Asn Pro Leu
100 105 110
tac acc gtg agt gag ttg tcg aaa caa gta aag gac tcg aac cct aaa 384
Tyr Thr Val Ser Glu Leu Ser Lys Gln Val Lys Asp Ser Asn Pro Lys
115 120 125
ttg att atc aca gtc cct cag tta ttg gaa aag gtc aag ggt ttc aat 432
Leu Ile Ile Thr Val Pro Gln Leu Leu Glu Lys Val Lys Gly Phe Asn
130 135 140
ctg cca act atc ctt atc ggc cct gat tct gag cag gaa tcg tct agt 480
Leu Pro Thr Ile Leu Ile Gly Pro Asp Ser Glu Gln Glu Ser Ser Ser
145 150 155 160
gat aaa gta atg act ttc aat gat ctg gtc aat ctg gga gga agt tcg 528
Asp Lys Val Met Thr Phe Asn Asp Leu Val Asn Leu Gly Gly Ser Ser
165 170 175
ggt agc gaa ttc cct atc gtc gac gat ttc aag caa tcc gac acc gcc 576
Gly Ser Glu Phe Pro Ile Val Asp Asp Phe Lys Gln Ser Asp Thr Ala
180 185 190
gca ctg ttg tac tca agt ggc acg aca ggt atg agc aag ggg gtc gtt 624
Ala Leu Leu Tyr Ser Ser Gly Thr Thr Gly Met Ser Lys Gly Val Val
195 200 205
ctg acg cac aaa aat ttt att gcc tca tcg ttg atg gta aca atg gaa 672
Leu Thr His Lys Asn Phe Ile Ala Ser Ser Leu Met Val Thr Met Glu
210 215 220
cag gac ttg gtc ggc gag atg gac aat gtg ttc ctg tgt ttc ctt cct 720
Gln Asp Leu Val Gly Glu Met Asp Asn Val Phe Leu Cys Phe Leu Pro
225 230 235 240
atg ttt cac gtc ttt ggc tta gcc att att acg tat gct cag tta cag 768
Met Phe His Val Phe Gly Leu Ala Ile Ile Thr Tyr Ala Gln Leu Gln
245 250 255
cgc ggt aat acc gtg att tca atg gcc cgc ttt gac ttg gaa aag atg 816
Arg Gly Asn Thr Val Ile Ser Met Ala Arg Phe Asp Leu Glu Lys Met
260 265 270
tta aaa gat gtt gaa aag tac aaa gtt acc cac ctt tgg gtc gta ccc 864
Leu Lys Asp Val Glu Lys Tyr Lys Val Thr His Leu Trp Val Val Pro
275 280 285
cca gtt atc tta gcg ttg tcg aag aac tca atg gtg aaa aaa ttc aat 912
Pro Val Ile Leu Ala Leu Ser Lys Asn Ser Met Val Lys Lys Phe Asn
290 295 300
ttg tca tcc atc aag tat att ggt tca ggc gct gcg cca tta gga aag 960
Leu Ser Ser Ile Lys Tyr Ile Gly Ser Gly Ala Ala Pro Leu Gly Lys
305 310 315 320
gat ctg atg gaa gaa tgc tct aag gtg gtt cct tac gga atc gtg gct 1008
Asp Leu Met Glu Glu Cys Ser Lys Val Val Pro Tyr Gly Ile Val Ala
325 330 335
caa gga tat ggc atg acg gaa acg tgc gga atc gta tcc atg gaa gac 1056
Gln Gly Tyr Gly Met Thr Glu Thr Cys Gly Ile Val Ser Met Glu Asp
340 345 350
atc cgc ggc ggg aaa cgc aat tca ggg tcg gcc gga atg ttg gca agt 1104
Ile Arg Gly Gly Lys Arg Asn Ser Gly Ser Ala Gly Met Leu Ala Ser
355 360 365
ggg gta gaa gct cag atc gtg agt gtg gac acc tta aaa ccc ctt ccc 1152
Gly Val Glu Ala Gln Ile Val Ser Val Asp Thr Leu Lys Pro Leu Pro
370 375 380
ccg aat caa tta ggg gaa atc tgg gta aaa ggt cca aat atg atg caa 1200
Pro Asn Gln Leu Gly Glu Ile Trp Val Lys Gly Pro Asn Met Met Gln
385 390 395 400
ggc tat ttc aac aat cct caa gcg acc aaa ctt acc att gat aaa aag 1248
Gly Tyr Phe Asn Asn Pro Gln Ala Thr Lys Leu Thr Ile Asp Lys Lys
405 410 415
ggt tgg gtt cat act ggc gac ttg ggg tat ttc gac gaa gac gga cac 1296
Gly Trp Val His Thr Gly Asp Leu Gly Tyr Phe Asp Glu Asp Gly His
420 425 430
tta tat gtt gta gac cgt att aag gag ctt att aaa tac aag gga ttc 1344
Leu Tyr Val Val Asp Arg Ile Lys Glu Leu Ile Lys Tyr Lys Gly Phe
435 440 445
caa gtt gcg cct gcg gaa ctg gag gga tta tta gtt agt cac ccc gag 1392
Gln Val Ala Pro Ala Glu Leu Glu Gly Leu Leu Val Ser His Pro Glu
450 455 460
atc tta gac gcg gta gtt att ccc ttc ccc gat gct gag gca ggc gaa 1440
Ile Leu Asp Ala Val Val Ile Pro Phe Pro Asp Ala Glu Ala Gly Glu
465 470 475 480
gtc ccg gtg gca tac gtt gtt cgc tcg cct aac agt tcg ttg acc gaa 1488
Val Pro Val Ala Tyr Val Val Arg Ser Pro Asn Ser Ser Leu Thr Glu
485 490 495
aat gac gtt aaa aaa ttc atc gcc ggt cag gtc gcc tcc ttt aag cgt 1536
Asn Asp Val Lys Lys Phe Ile Ala Gly Gln Val Ala Ser Phe Lys Arg
500 505 510
ctg cgc aag gtt act ttt att aat tcc gtc ccc aag agc gca agt ggg 1584
Leu Arg Lys Val Thr Phe Ile Asn Ser Val Pro Lys Ser Ala Ser Gly
515 520 525
aag att ctg cgc cgc gag ctt att caa aag gtt cgc tct aac atg taa 1632
Lys Ile Leu Arg Arg Glu Leu Ile Gln Lys Val Arg Ser Asn Met
530 535 540
<210> 67
<211> 543
<212> PRT
<213> Cannabis sativa
<400> 67
Met Glu Lys Ser Gly Tyr Gly Arg Asp Gly Ile Tyr Arg Ser Leu Arg
1 5 10 15
Pro Pro Leu His Leu Pro Asn Asn Asn Asn Leu Ser Met Val Ser Phe
20 25 30
Leu Phe Arg Asn Ser Ser Ser Tyr Pro Gln Lys Pro Ala Leu Ile Asp
35 40 45
Ser Glu Thr Asn Gln Ile Leu Ser Phe Ser His Phe Lys Ser Thr Val
50 55 60
Ile Lys Val Ser His Gly Phe Leu Asn Leu Gly Ile Lys Lys Asn Asp
65 70 75 80
Val Val Leu Ile Tyr Ala Pro Asn Ser Ile His Phe Pro Val Cys Phe
85 90 95
Leu Gly Ile Ile Ala Ser Gly Ala Ile Ala Thr Thr Ser Asn Pro Leu
100 105 110
Tyr Thr Val Ser Glu Leu Ser Lys Gln Val Lys Asp Ser Asn Pro Lys
115 120 125
Leu Ile Ile Thr Val Pro Gln Leu Leu Glu Lys Val Lys Gly Phe Asn
130 135 140
Leu Pro Thr Ile Leu Ile Gly Pro Asp Ser Glu Gln Glu Ser Ser Ser
145 150 155 160
Asp Lys Val Met Thr Phe Asn Asp Leu Val Asn Leu Gly Gly Ser Ser
165 170 175
Gly Ser Glu Phe Pro Ile Val Asp Asp Phe Lys Gln Ser Asp Thr Ala
180 185 190
Ala Leu Leu Tyr Ser Ser Gly Thr Thr Gly Met Ser Lys Gly Val Val
195 200 205
Leu Thr His Lys Asn Phe Ile Ala Ser Ser Leu Met Val Thr Met Glu
210 215 220
Gln Asp Leu Val Gly Glu Met Asp Asn Val Phe Leu Cys Phe Leu Pro
225 230 235 240
Met Phe His Val Phe Gly Leu Ala Ile Ile Thr Tyr Ala Gln Leu Gln
245 250 255
Arg Gly Asn Thr Val Ile Ser Met Ala Arg Phe Asp Leu Glu Lys Met
260 265 270
Leu Lys Asp Val Glu Lys Tyr Lys Val Thr His Leu Trp Val Val Pro
275 280 285
Pro Val Ile Leu Ala Leu Ser Lys Asn Ser Met Val Lys Lys Phe Asn
290 295 300
Leu Ser Ser Ile Lys Tyr Ile Gly Ser Gly Ala Ala Pro Leu Gly Lys
305 310 315 320
Asp Leu Met Glu Glu Cys Ser Lys Val Val Pro Tyr Gly Ile Val Ala
325 330 335
Gln Gly Tyr Gly Met Thr Glu Thr Cys Gly Ile Val Ser Met Glu Asp
340 345 350
Ile Arg Gly Gly Lys Arg Asn Ser Gly Ser Ala Gly Met Leu Ala Ser
355 360 365
Gly Val Glu Ala Gln Ile Val Ser Val Asp Thr Leu Lys Pro Leu Pro
370 375 380
Pro Asn Gln Leu Gly Glu Ile Trp Val Lys Gly Pro Asn Met Met Gln
385 390 395 400
Gly Tyr Phe Asn Asn Pro Gln Ala Thr Lys Leu Thr Ile Asp Lys Lys
405 410 415
Gly Trp Val His Thr Gly Asp Leu Gly Tyr Phe Asp Glu Asp Gly His
420 425 430
Leu Tyr Val Val Asp Arg Ile Lys Glu Leu Ile Lys Tyr Lys Gly Phe
435 440 445
Gln Val Ala Pro Ala Glu Leu Glu Gly Leu Leu Val Ser His Pro Glu
450 455 460
Ile Leu Asp Ala Val Val Ile Pro Phe Pro Asp Ala Glu Ala Gly Glu
465 470 475 480
Val Pro Val Ala Tyr Val Val Arg Ser Pro Asn Ser Ser Leu Thr Glu
485 490 495
Asn Asp Val Lys Lys Phe Ile Ala Gly Gln Val Ala Ser Phe Lys Arg
500 505 510
Leu Arg Lys Val Thr Phe Ile Asn Ser Val Pro Lys Ser Ala Ser Gly
515 520 525
Lys Ile Leu Arg Arg Glu Leu Ile Gln Lys Val Arg Ser Asn Met
530 535 540
<210> 68
<211> 2163
<212> DNA
<213> Cannabis sativa
<220>
<221> CDS
<222> (1)..(2163)
<400> 68
atg ggt aag aat tac aag tcc ctg gac tct gtt gtg gcc tct gac ttc 48
Met Gly Lys Asn Tyr Lys Ser Leu Asp Ser Val Val Ala Ser Asp Phe
1 5 10 15
ata gcc cta ggt atc acc tct gaa gtt gct gag aca ctc cat ggt aga 96
Ile Ala Leu Gly Ile Thr Ser Glu Val Ala Glu Thr Leu His Gly Arg
20 25 30
ctg gcc gag atc gtg tgt aat tat ggc gct gcc act ccc caa aca tgg 144
Leu Ala Glu Ile Val Cys Asn Tyr Gly Ala Ala Thr Pro Gln Thr Trp
35 40 45
atc aat att gcc aac cat att ctg tcg cct gac ctc ccc ttc tcc ctg 192
Ile Asn Ile Ala Asn His Ile Leu Ser Pro Asp Leu Pro Phe Ser Leu
50 55 60
cac cag atg ctc ttc tat ggt tgc tat aaa gac ttt gga cct gcc cct 240
His Gln Met Leu Phe Tyr Gly Cys Tyr Lys Asp Phe Gly Pro Ala Pro
65 70 75 80
cct gct tgg ata ccc gac ccg gag aaa gta aag tcc acc aat ctg ggc 288
Pro Ala Trp Ile Pro Asp Pro Glu Lys Val Lys Ser Thr Asn Leu Gly
85 90 95
gca ctt ttg gag aag cga gga aaa gag ttt ttg gga gtc aag tat aag 336
Ala Leu Leu Glu Lys Arg Gly Lys Glu Phe Leu Gly Val Lys Tyr Lys
100 105 110
gat ccc att tca agc ttt tct cat ttc caa gaa ttt tct gta aga aac 384
Asp Pro Ile Ser Ser Phe Ser His Phe Gln Glu Phe Ser Val Arg Asn
115 120 125
cct gag gtg tat tgg aga aca gta cta atg gat gag atg aag ata agt 432
Pro Glu Val Tyr Trp Arg Thr Val Leu Met Asp Glu Met Lys Ile Ser
130 135 140
ttt tca aag gat cca gaa tgt ata ttg cgt aga gat gat att aat aat 480
Phe Ser Lys Asp Pro Glu Cys Ile Leu Arg Arg Asp Asp Ile Asn Asn
145 150 155 160
cca ggg ggt agt gaa tgg ctt cca gga ggt tat ctt aac tca gca aag 528
Pro Gly Gly Ser Glu Trp Leu Pro Gly Gly Tyr Leu Asn Ser Ala Lys
165 170 175
aat tgc ttg aat gta aat agt aac aag aaa ttg aat gat aca atg att 576
Asn Cys Leu Asn Val Asn Ser Asn Lys Lys Leu Asn Asp Thr Met Ile
180 185 190
gta tgg cgt gat gaa gga aat gat gat ttg cct cta aac aaa ttg aca 624
Val Trp Arg Asp Glu Gly Asn Asp Asp Leu Pro Leu Asn Lys Leu Thr
195 200 205
ctt gac caa ttg cgt aaa cgt gtt tgg tta gtt ggt tat gca ctt gaa 672
Leu Asp Gln Leu Arg Lys Arg Val Trp Leu Val Gly Tyr Ala Leu Glu
210 215 220
gaa atg ggt ttg gag aag ggt tgt gca att gca att gat atg cca atg 720
Glu Met Gly Leu Glu Lys Gly Cys Ala Ile Ala Ile Asp Met Pro Met
225 230 235 240
cat gtg gat gct gtg gtt atc tat cta gct att gtt ctt gcg gga tat 768
His Val Asp Ala Val Val Ile Tyr Leu Ala Ile Val Leu Ala Gly Tyr
245 250 255
gta gtt gtt tct att gct gat agt ttt tct gct cct gaa ata tca aca 816
Val Val Val Ser Ile Ala Asp Ser Phe Ser Ala Pro Glu Ile Ser Thr
260 265 270
aga ctt cga cta tca aaa gca aaa gcc att ttt aca cag gat cat att 864
Arg Leu Arg Leu Ser Lys Ala Lys Ala Ile Phe Thr Gln Asp His Ile
275 280 285
att cgt ggg aag aag cgt att ccc tta tac agt aga gtt gtg gaa gcc 912
Ile Arg Gly Lys Lys Arg Ile Pro Leu Tyr Ser Arg Val Val Glu Ala
290 295 300
aag tct ccc atg gcc att gtt att cct tgt agt ggc tct aat att ggt 960
Lys Ser Pro Met Ala Ile Val Ile Pro Cys Ser Gly Ser Asn Ile Gly
305 310 315 320
gca gaa ttg cgt gat ggc gat att tct tgg gat tac ttt cta gaa aga 1008
Ala Glu Leu Arg Asp Gly Asp Ile Ser Trp Asp Tyr Phe Leu Glu Arg
325 330 335
gca aaa gag ttt aaa aat tgt gaa ttt act gct aga gaa caa cca gtt 1056
Ala Lys Glu Phe Lys Asn Cys Glu Phe Thr Ala Arg Glu Gln Pro Val
340 345 350
gat gcc tat aca aac atc ctc ttc tca tct gga aca aca ggg gag cca 1104
Asp Ala Tyr Thr Asn Ile Leu Phe Ser Ser Gly Thr Thr Gly Glu Pro
355 360 365
aag gca att cca tgg act caa gca act cct tta aaa gca gct gca gat 1152
Lys Ala Ile Pro Trp Thr Gln Ala Thr Pro Leu Lys Ala Ala Ala Asp
370 375 380
ggg tgg agc cat ttg gac att agg aaa ggt gat gtc att gtt tgg ccc 1200
Gly Trp Ser His Leu Asp Ile Arg Lys Gly Asp Val Ile Val Trp Pro
385 390 395 400
act aat ctt ggt tgg atg atg ggt cct tgg ctg gtc tat gct tca ctc 1248
Thr Asn Leu Gly Trp Met Met Gly Pro Trp Leu Val Tyr Ala Ser Leu
405 410 415
ctt aat ggg gct tct att gcc ttg tat aat gga tca cca ctt gtt tct 1296
Leu Asn Gly Ala Ser Ile Ala Leu Tyr Asn Gly Ser Pro Leu Val Ser
420 425 430
ggc ttt gcc aaa ttt gtg cag gat gct aaa gta aca atg cta ggt gtg 1344
Gly Phe Ala Lys Phe Val Gln Asp Ala Lys Val Thr Met Leu Gly Val
435 440 445
gtc cct agt att gtt cga tca tgg aaa agt acc aat tgt gtt agt ggc 1392
Val Pro Ser Ile Val Arg Ser Trp Lys Ser Thr Asn Cys Val Ser Gly
450 455 460
tat gat tgg tcc acc atc cgt tgc ttt tcc tct tct ggt gaa gca tct 1440
Tyr Asp Trp Ser Thr Ile Arg Cys Phe Ser Ser Ser Gly Glu Ala Ser
465 470 475 480
aat gta gat gaa tac cta tgg ttg atg ggg aga gca aac tac aag cct 1488
Asn Val Asp Glu Tyr Leu Trp Leu Met Gly Arg Ala Asn Tyr Lys Pro
485 490 495
gtt atc gaa atg tgt ggt ggc aca gaa att ggt ggt gca ttt tct gct 1536
Val Ile Glu Met Cys Gly Gly Thr Glu Ile Gly Gly Ala Phe Ser Ala
500 505 510
ggc tct ttc tta caa gct caa tca tta tct tca ttt agt tca caa tgt 1584
Gly Ser Phe Leu Gln Ala Gln Ser Leu Ser Ser Phe Ser Ser Gln Cys
515 520 525
atg ggt tgc act tta tac ata ctt gac aag aat ggt tat cca atg cct 1632
Met Gly Cys Thr Leu Tyr Ile Leu Asp Lys Asn Gly Tyr Pro Met Pro
530 535 540
aaa aac aaa cca gga att ggt gaa tta gcg ctt ggt cca gtc atg ttt 1680
Lys Asn Lys Pro Gly Ile Gly Glu Leu Ala Leu Gly Pro Val Met Phe
545 550 555 560
gga gca tcg aag act ctg ttg aat ggt aat cac cat gat gtt tat ttt 1728
Gly Ala Ser Lys Thr Leu Leu Asn Gly Asn His His Asp Val Tyr Phe
565 570 575
aag gga atg cct aca ttg aat gga gag gtt tta agg agg cat ggg gac 1776
Lys Gly Met Pro Thr Leu Asn Gly Glu Val Leu Arg Arg His Gly Asp
580 585 590
att ttt gag ctt aca tct aat ggt tat tat cat gca cat ggt cgt gca 1824
Ile Phe Glu Leu Thr Ser Asn Gly Tyr Tyr His Ala His Gly Arg Ala
595 600 605
gat gat aca atg aat att gga ggc atc aag att agt tcc ata gag att 1872
Asp Asp Thr Met Asn Ile Gly Gly Ile Lys Ile Ser Ser Ile Glu Ile
610 615 620
gaa cga gtt tgt aat gaa gtt gat gac aga gtt ttc gag aca act gct 1920
Glu Arg Val Cys Asn Glu Val Asp Asp Arg Val Phe Glu Thr Thr Ala
625 630 635 640
att gga gtg cca cct ttg ggc ggt gga cct gag caa tta gta att ttc 1968
Ile Gly Val Pro Pro Leu Gly Gly Gly Pro Glu Gln Leu Val Ile Phe
645 650 655
ttt gta tta aaa gat tca aat gat aca act att gac tta aat caa ttg 2016
Phe Val Leu Lys Asp Ser Asn Asp Thr Thr Ile Asp Leu Asn Gln Leu
660 665 670
agg tta tct ttc aac ttg ggt tta cag aag aaa cta aat cct ctg ttc 2064
Arg Leu Ser Phe Asn Leu Gly Leu Gln Lys Lys Leu Asn Pro Leu Phe
675 680 685
aag gtc act cgt gtt gtg cct ctt tca tca ctt ccg aga aca gca acc 2112
Lys Val Thr Arg Val Val Pro Leu Ser Ser Leu Pro Arg Thr Ala Thr
690 695 700
aac aag atc atg aga agg gtt ttg cgc cag caa ttt tct cac ttt gaa 2160
Asn Lys Ile Met Arg Arg Val Leu Arg Gln Gln Phe Ser His Phe Glu
705 710 715 720
tga 2163
<210> 69
<211> 720
<212> PRT
<213> Cannabis sativa
<400> 69
Met Gly Lys Asn Tyr Lys Ser Leu Asp Ser Val Val Ala Ser Asp Phe
1 5 10 15
Ile Ala Leu Gly Ile Thr Ser Glu Val Ala Glu Thr Leu His Gly Arg
20 25 30
Leu Ala Glu Ile Val Cys Asn Tyr Gly Ala Ala Thr Pro Gln Thr Trp
35 40 45
Ile Asn Ile Ala Asn His Ile Leu Ser Pro Asp Leu Pro Phe Ser Leu
50 55 60
His Gln Met Leu Phe Tyr Gly Cys Tyr Lys Asp Phe Gly Pro Ala Pro
65 70 75 80
Pro Ala Trp Ile Pro Asp Pro Glu Lys Val Lys Ser Thr Asn Leu Gly
85 90 95
Ala Leu Leu Glu Lys Arg Gly Lys Glu Phe Leu Gly Val Lys Tyr Lys
100 105 110
Asp Pro Ile Ser Ser Phe Ser His Phe Gln Glu Phe Ser Val Arg Asn
115 120 125
Pro Glu Val Tyr Trp Arg Thr Val Leu Met Asp Glu Met Lys Ile Ser
130 135 140
Phe Ser Lys Asp Pro Glu Cys Ile Leu Arg Arg Asp Asp Ile Asn Asn
145 150 155 160
Pro Gly Gly Ser Glu Trp Leu Pro Gly Gly Tyr Leu Asn Ser Ala Lys
165 170 175
Asn Cys Leu Asn Val Asn Ser Asn Lys Lys Leu Asn Asp Thr Met Ile
180 185 190
Val Trp Arg Asp Glu Gly Asn Asp Asp Leu Pro Leu Asn Lys Leu Thr
195 200 205
Leu Asp Gln Leu Arg Lys Arg Val Trp Leu Val Gly Tyr Ala Leu Glu
210 215 220
Glu Met Gly Leu Glu Lys Gly Cys Ala Ile Ala Ile Asp Met Pro Met
225 230 235 240
His Val Asp Ala Val Val Ile Tyr Leu Ala Ile Val Leu Ala Gly Tyr
245 250 255
Val Val Val Ser Ile Ala Asp Ser Phe Ser Ala Pro Glu Ile Ser Thr
260 265 270
Arg Leu Arg Leu Ser Lys Ala Lys Ala Ile Phe Thr Gln Asp His Ile
275 280 285
Ile Arg Gly Lys Lys Arg Ile Pro Leu Tyr Ser Arg Val Val Glu Ala
290 295 300
Lys Ser Pro Met Ala Ile Val Ile Pro Cys Ser Gly Ser Asn Ile Gly
305 310 315 320
Ala Glu Leu Arg Asp Gly Asp Ile Ser Trp Asp Tyr Phe Leu Glu Arg
325 330 335
Ala Lys Glu Phe Lys Asn Cys Glu Phe Thr Ala Arg Glu Gln Pro Val
340 345 350
Asp Ala Tyr Thr Asn Ile Leu Phe Ser Ser Gly Thr Thr Gly Glu Pro
355 360 365
Lys Ala Ile Pro Trp Thr Gln Ala Thr Pro Leu Lys Ala Ala Ala Asp
370 375 380
Gly Trp Ser His Leu Asp Ile Arg Lys Gly Asp Val Ile Val Trp Pro
385 390 395 400
Thr Asn Leu Gly Trp Met Met Gly Pro Trp Leu Val Tyr Ala Ser Leu
405 410 415
Leu Asn Gly Ala Ser Ile Ala Leu Tyr Asn Gly Ser Pro Leu Val Ser
420 425 430
Gly Phe Ala Lys Phe Val Gln Asp Ala Lys Val Thr Met Leu Gly Val
435 440 445
Val Pro Ser Ile Val Arg Ser Trp Lys Ser Thr Asn Cys Val Ser Gly
450 455 460
Tyr Asp Trp Ser Thr Ile Arg Cys Phe Ser Ser Ser Gly Glu Ala Ser
465 470 475 480
Asn Val Asp Glu Tyr Leu Trp Leu Met Gly Arg Ala Asn Tyr Lys Pro
485 490 495
Val Ile Glu Met Cys Gly Gly Thr Glu Ile Gly Gly Ala Phe Ser Ala
500 505 510
Gly Ser Phe Leu Gln Ala Gln Ser Leu Ser Ser Phe Ser Ser Gln Cys
515 520 525
Met Gly Cys Thr Leu Tyr Ile Leu Asp Lys Asn Gly Tyr Pro Met Pro
530 535 540
Lys Asn Lys Pro Gly Ile Gly Glu Leu Ala Leu Gly Pro Val Met Phe
545 550 555 560
Gly Ala Ser Lys Thr Leu Leu Asn Gly Asn His His Asp Val Tyr Phe
565 570 575
Lys Gly Met Pro Thr Leu Asn Gly Glu Val Leu Arg Arg His Gly Asp
580 585 590
Ile Phe Glu Leu Thr Ser Asn Gly Tyr Tyr His Ala His Gly Arg Ala
595 600 605
Asp Asp Thr Met Asn Ile Gly Gly Ile Lys Ile Ser Ser Ile Glu Ile
610 615 620
Glu Arg Val Cys Asn Glu Val Asp Asp Arg Val Phe Glu Thr Thr Ala
625 630 635 640
Ile Gly Val Pro Pro Leu Gly Gly Gly Pro Glu Gln Leu Val Ile Phe
645 650 655
Phe Val Leu Lys Asp Ser Asn Asp Thr Thr Ile Asp Leu Asn Gln Leu
660 665 670
Arg Leu Ser Phe Asn Leu Gly Leu Gln Lys Lys Leu Asn Pro Leu Phe
675 680 685
Lys Val Thr Arg Val Val Pro Leu Ser Ser Leu Pro Arg Thr Ala Thr
690 695 700
Asn Lys Ile Met Arg Arg Val Leu Arg Gln Gln Phe Ser His Phe Glu
705 710 715 720
<210> 70
<211> 1695
<212> DNA
<213> Cannabis sativa
<220>
<221> CDS
<222> (1)..(1695)
<400> 70
atg gaa gta ctg aag gag gtt gcg aag gaa ggt agc gca gcc cgt gaa 48
Met Glu Val Leu Lys Glu Val Ala Lys Glu Gly Ser Ala Ala Arg Glu
1 5 10 15
ggt gtc gct att cgc gcc gac cag aaa tcg tac agc tat aag caa ttg 96
Gly Val Ala Ile Arg Ala Asp Gln Lys Ser Tyr Ser Tyr Lys Gln Leu
20 25 30
atc tcc tcc gcg cag tcg atc tgc tca ctg tta tgc ggt act gaa ctt 144
Ile Ser Ser Ala Gln Ser Ile Cys Ser Leu Leu Cys Gly Thr Glu Leu
35 40 45
aaa gcg att cac gaa gcc ggg aaa caa gct cgt cct agc gcg tct atc 192
Lys Ala Ile His Glu Ala Gly Lys Gln Ala Arg Pro Ser Ala Ser Ile
50 55 60
aat ggg gcc ggg ggt cac ggc cac ttg gga gga gct cgt att gga att 240
Asn Gly Ala Gly Gly His Gly His Leu Gly Gly Ala Arg Ile Gly Ile
65 70 75 80
gtt gct aag ccg tcg gca gaa ttt gta gcc ggt gtt tta ggt acg tgg 288
Val Ala Lys Pro Ser Ala Glu Phe Val Ala Gly Val Leu Gly Thr Trp
85 90 95
tta tct ggt gga gtt gcg gtt ccc ctt gca ctg tct tac ccg gag gcg 336
Leu Ser Gly Gly Val Ala Val Pro Leu Ala Leu Ser Tyr Pro Glu Ala
100 105 110
gaa tta ctg cat gtc atg aac gat tca gat atc agc atg atc ttg agc 384
Glu Leu Leu His Val Met Asn Asp Ser Asp Ile Ser Met Ile Leu Ser
115 120 125
acg gaa gac cat caa gaa ctg atg caa aat att gct gcc aag act tcc 432
Thr Glu Asp His Gln Glu Leu Met Gln Asn Ile Ala Ala Lys Thr Ser
130 135 140
gca cag ttt tcc tta att cca tct gtg ccg tcg tcg tgc tca caa gaa 480
Ala Gln Phe Ser Leu Ile Pro Ser Val Pro Ser Ser Cys Ser Gln Glu
145 150 155 160
gta gcg gtc gat cat cgt cag acc ggt gac atc tct acc gac tct atc 528
Val Ala Val Asp His Arg Gln Thr Gly Asp Ile Ser Thr Asp Ser Ile
165 170 175
ttg ctt aac cgc gag atc tct aac gag aat ccc gca ctt atc gtc tat 576
Leu Leu Asn Arg Glu Ile Ser Asn Glu Asn Pro Ala Leu Ile Val Tyr
180 185 190
acg tcg ggg acg aca ggc aag ccg aag ggc gtc gtt cac aca cac caa 624
Thr Ser Gly Thr Thr Gly Lys Pro Lys Gly Val Val His Thr His Gln
195 200 205
tca att tct gca cag gtt cag acg tta gcc aag gca tgg gag tat act 672
Ser Ile Ser Ala Gln Val Gln Thr Leu Ala Lys Ala Trp Glu Tyr Thr
210 215 220
cct gcc gat caa ttc tta cac tgc tta ccg ctg cat cat gtg cat ggg 720
Pro Ala Asp Gln Phe Leu His Cys Leu Pro Leu His His Val His Gly
225 230 235 240
ctg ttt aac gca ctg ttc gcg ccc ctt tac gcg cgt tca aca gtt gaa 768
Leu Phe Asn Ala Leu Phe Ala Pro Leu Tyr Ala Arg Ser Thr Val Glu
245 250 255
ttt ctg ccg aaa ttt tct gtc cgc ggt att tgg caa cgc tgg cgc gaa 816
Phe Leu Pro Lys Phe Ser Val Arg Gly Ile Trp Gln Arg Trp Arg Glu
260 265 270
tcc tac cca acg tca gag acg aaa gcc aat gac tgc att acg gta ttt 864
Ser Tyr Pro Thr Ser Glu Thr Lys Ala Asn Asp Cys Ile Thr Val Phe
275 280 285
aca gga gtt ccc acc atg tac acg cgt ctg att caa gga tat gaa gct 912
Thr Gly Val Pro Thr Met Tyr Thr Arg Leu Ile Gln Gly Tyr Glu Ala
290 295 300
atg gat cca gag tta aaa gag gcc tct gca tct gct gct aag cag ctg 960
Met Asp Pro Glu Leu Lys Glu Ala Ser Ala Ser Ala Ala Lys Gln Leu
305 310 315 320
cgc ctt atg atg tgt ggt tcc tct gcg ctg cca gtt cct gtc atg cag 1008
Arg Leu Met Met Cys Gly Ser Ser Ala Leu Pro Val Pro Val Met Gln
325 330 335
cag tgg caa acc atc acc ggc cac cgt ctt ctg gaa cgt tac gga atg 1056
Gln Trp Gln Thr Ile Thr Gly His Arg Leu Leu Glu Arg Tyr Gly Met
340 345 350
acc gaa ttt gtc atg gca att tct aac ccc ttg aaa ggt gag cgc aaa 1104
Thr Glu Phe Val Met Ala Ile Ser Asn Pro Leu Lys Gly Glu Arg Lys
355 360 365
tcc ggt act gtc gga aag ccg ttt cca ggt gta gag gtg cgc att tta 1152
Ser Gly Thr Val Gly Lys Pro Phe Pro Gly Val Glu Val Arg Ile Leu
370 375 380
gca gag gat gaa aac ggc gat gat gct acc ggg gtg gga gag ctg tgc 1200
Ala Glu Asp Glu Asn Gly Asp Asp Ala Thr Gly Val Gly Glu Leu Cys
385 390 395 400
gta cgc agt ccg tcc ctt ttc aaa gag tat tgg cgt ttg ccc gag gtc 1248
Val Arg Ser Pro Ser Leu Phe Lys Glu Tyr Trp Arg Leu Pro Glu Val
405 410 415
aca aaa gcc tcc ttt aca gac gac ggc ttt ttc aaa acc ggc gac gca 1296
Thr Lys Ala Ser Phe Thr Asp Asp Gly Phe Phe Lys Thr Gly Asp Ala
420 425 430
ggc aag gtc gat gag gac ggt tac tac gtg att ctg ggc cgt act agc 1344
Gly Lys Val Asp Glu Asp Gly Tyr Tyr Val Ile Leu Gly Arg Thr Ser
435 440 445
gca gat att atg aaa gtt gga ggc tat aag ctg tct gct ctg gaa atc 1392
Ala Asp Ile Met Lys Val Gly Gly Tyr Lys Leu Ser Ala Leu Glu Ile
450 455 460
gag tcg gtc ctt ctg gaa cac ccg act gtc gag gaa tgc tgt gtc ttg 1440
Glu Ser Val Leu Leu Glu His Pro Thr Val Glu Glu Cys Cys Val Leu
465 470 475 480
gga ctt ccc gac aag gat tat ggg gaa gcc gta tcc gca atc att gta 1488
Gly Leu Pro Asp Lys Asp Tyr Gly Glu Ala Val Ser Ala Ile Ile Val
485 490 495
ccg gca gcc gag gcg aag aag aaa cgc gaa gag gag tca cgc ccc gcc 1536
Pro Ala Ala Glu Ala Lys Lys Lys Arg Glu Glu Glu Ser Arg Pro Ala
500 505 510
att agt ctg gag gaa ctg ttc tca tgg gca cag cac aaa ctt gcc ccc 1584
Ile Ser Leu Glu Glu Leu Phe Ser Trp Ala Gln His Lys Leu Ala Pro
515 520 525
tac aaa ctg ccc acg cgt tta ttc ctg tgg gac tct tta cct cgc aac 1632
Tyr Lys Leu Pro Thr Arg Leu Phe Leu Trp Asp Ser Leu Pro Arg Asn
530 535 540
gca atg ggg aaa gtc aac aaa aaa gag ctg aag aaa aaa ctg aca gtt 1680
Ala Met Gly Lys Val Asn Lys Lys Glu Leu Lys Lys Lys Leu Thr Val
545 550 555 560
gag caa ggt att taa 1695
Glu Gln Gly Ile
<210> 71
<211> 564
<212> PRT
<213> Cannabis sativa
<400> 71
Met Glu Val Leu Lys Glu Val Ala Lys Glu Gly Ser Ala Ala Arg Glu
1 5 10 15
Gly Val Ala Ile Arg Ala Asp Gln Lys Ser Tyr Ser Tyr Lys Gln Leu
20 25 30
Ile Ser Ser Ala Gln Ser Ile Cys Ser Leu Leu Cys Gly Thr Glu Leu
35 40 45
Lys Ala Ile His Glu Ala Gly Lys Gln Ala Arg Pro Ser Ala Ser Ile
50 55 60
Asn Gly Ala Gly Gly His Gly His Leu Gly Gly Ala Arg Ile Gly Ile
65 70 75 80
Val Ala Lys Pro Ser Ala Glu Phe Val Ala Gly Val Leu Gly Thr Trp
85 90 95
Leu Ser Gly Gly Val Ala Val Pro Leu Ala Leu Ser Tyr Pro Glu Ala
100 105 110
Glu Leu Leu His Val Met Asn Asp Ser Asp Ile Ser Met Ile Leu Ser
115 120 125
Thr Glu Asp His Gln Glu Leu Met Gln Asn Ile Ala Ala Lys Thr Ser
130 135 140
Ala Gln Phe Ser Leu Ile Pro Ser Val Pro Ser Ser Cys Ser Gln Glu
145 150 155 160
Val Ala Val Asp His Arg Gln Thr Gly Asp Ile Ser Thr Asp Ser Ile
165 170 175
Leu Leu Asn Arg Glu Ile Ser Asn Glu Asn Pro Ala Leu Ile Val Tyr
180 185 190
Thr Ser Gly Thr Thr Gly Lys Pro Lys Gly Val Val His Thr His Gln
195 200 205
Ser Ile Ser Ala Gln Val Gln Thr Leu Ala Lys Ala Trp Glu Tyr Thr
210 215 220
Pro Ala Asp Gln Phe Leu His Cys Leu Pro Leu His His Val His Gly
225 230 235 240
Leu Phe Asn Ala Leu Phe Ala Pro Leu Tyr Ala Arg Ser Thr Val Glu
245 250 255
Phe Leu Pro Lys Phe Ser Val Arg Gly Ile Trp Gln Arg Trp Arg Glu
260 265 270
Ser Tyr Pro Thr Ser Glu Thr Lys Ala Asn Asp Cys Ile Thr Val Phe
275 280 285
Thr Gly Val Pro Thr Met Tyr Thr Arg Leu Ile Gln Gly Tyr Glu Ala
290 295 300
Met Asp Pro Glu Leu Lys Glu Ala Ser Ala Ser Ala Ala Lys Gln Leu
305 310 315 320
Arg Leu Met Met Cys Gly Ser Ser Ala Leu Pro Val Pro Val Met Gln
325 330 335
Gln Trp Gln Thr Ile Thr Gly His Arg Leu Leu Glu Arg Tyr Gly Met
340 345 350
Thr Glu Phe Val Met Ala Ile Ser Asn Pro Leu Lys Gly Glu Arg Lys
355 360 365
Ser Gly Thr Val Gly Lys Pro Phe Pro Gly Val Glu Val Arg Ile Leu
370 375 380
Ala Glu Asp Glu Asn Gly Asp Asp Ala Thr Gly Val Gly Glu Leu Cys
385 390 395 400
Val Arg Ser Pro Ser Leu Phe Lys Glu Tyr Trp Arg Leu Pro Glu Val
405 410 415
Thr Lys Ala Ser Phe Thr Asp Asp Gly Phe Phe Lys Thr Gly Asp Ala
420 425 430
Gly Lys Val Asp Glu Asp Gly Tyr Tyr Val Ile Leu Gly Arg Thr Ser
435 440 445
Ala Asp Ile Met Lys Val Gly Gly Tyr Lys Leu Ser Ala Leu Glu Ile
450 455 460
Glu Ser Val Leu Leu Glu His Pro Thr Val Glu Glu Cys Cys Val Leu
465 470 475 480
Gly Leu Pro Asp Lys Asp Tyr Gly Glu Ala Val Ser Ala Ile Ile Val
485 490 495
Pro Ala Ala Glu Ala Lys Lys Lys Arg Glu Glu Glu Ser Arg Pro Ala
500 505 510
Ile Ser Leu Glu Glu Leu Phe Ser Trp Ala Gln His Lys Leu Ala Pro
515 520 525
Tyr Lys Leu Pro Thr Arg Leu Phe Leu Trp Asp Ser Leu Pro Arg Asn
530 535 540
Ala Met Gly Lys Val Asn Lys Lys Glu Leu Lys Lys Lys Leu Thr Val
545 550 555 560
Glu Gln Gly Ile
<210> 72
<211> 1158
<212> DNA
<213> Cannabis sativa
<220>
<221> CDS
<222> (1)..(1158)
<400> 72
atg aat cat ctg cgt gct gaa gga cca gct tcc gta ttg gca att gga 48
Met Asn His Leu Arg Ala Glu Gly Pro Ala Ser Val Leu Ala Ile Gly
1 5 10 15
aca gct aac cct gag aac att ctt ctt cag gat gag ttt ccc gac tat 96
Thr Ala Asn Pro Glu Asn Ile Leu Leu Gln Asp Glu Phe Pro Asp Tyr
20 25 30
tac ttc cgc gtg aca aag agc gaa cac atg aca cag ctt aaa gag aag 144
Tyr Phe Arg Val Thr Lys Ser Glu His Met Thr Gln Leu Lys Glu Lys
35 40 45
ttc cgt aag atc tgt gac aaa agc atg atc cgc aaa cgt aac tgc ttc 192
Phe Arg Lys Ile Cys Asp Lys Ser Met Ile Arg Lys Arg Asn Cys Phe
50 55 60
ctt aac gag gag cat ctg aag cag aat ccc cgt ctt gtt gaa cat gag 240
Leu Asn Glu Glu His Leu Lys Gln Asn Pro Arg Leu Val Glu His Glu
65 70 75 80
atg cag acc ttg gat gct cgc cag gac atg ttg gtt gtt gag gtc cct 288
Met Gln Thr Leu Asp Ala Arg Gln Asp Met Leu Val Val Glu Val Pro
85 90 95
aag ctg ggc aaa gat gcg tgt gca aaa gcg att aaa gag tgg ggg cag 336
Lys Leu Gly Lys Asp Ala Cys Ala Lys Ala Ile Lys Glu Trp Gly Gln
100 105 110
cct aaa agc aaa att act cat ctg att ttc aca agc gcc agt aca acc 384
Pro Lys Ser Lys Ile Thr His Leu Ile Phe Thr Ser Ala Ser Thr Thr
115 120 125
gat atg ccc ggt gcg gac tac cat tgt gca aaa tta ttg ggt tta tcg 432
Asp Met Pro Gly Ala Asp Tyr His Cys Ala Lys Leu Leu Gly Leu Ser
130 135 140
cct tca gta aaa cgt gtt atg atg tac cag tta gga tgc tac ggt ggt 480
Pro Ser Val Lys Arg Val Met Met Tyr Gln Leu Gly Cys Tyr Gly Gly
145 150 155 160
ggc acc gta ctt cgt att gcg aag gac atc gcc gag aac aac aaa gga 528
Gly Thr Val Leu Arg Ile Ala Lys Asp Ile Ala Glu Asn Asn Lys Gly
165 170 175
gcc cgt gta ctt gct gta tgt tgt gat atc atg gcg tgc ctt ttt cgc 576
Ala Arg Val Leu Ala Val Cys Cys Asp Ile Met Ala Cys Leu Phe Arg
180 185 190
ggc ccc agc gag agt gac ctt gag tta ctt gtg ggg cag gcc atc ttc 624
Gly Pro Ser Glu Ser Asp Leu Glu Leu Leu Val Gly Gln Ala Ile Phe
195 200 205
gga gac ggt gcc gca gcc gtc att gtt ggc gca gag ccc gat gaa tcc 672
Gly Asp Gly Ala Ala Ala Val Ile Val Gly Ala Glu Pro Asp Glu Ser
210 215 220
gtt ggc gag cgc ccg atc ttt gag ctt gta agt aca gga caa act atc 720
Val Gly Glu Arg Pro Ile Phe Glu Leu Val Ser Thr Gly Gln Thr Ile
225 230 235 240
ttg ccc aac tct gag ggg act atc ggc gga cat att cgt gag gcg ggc 768
Leu Pro Asn Ser Glu Gly Thr Ile Gly Gly His Ile Arg Glu Ala Gly
245 250 255
ttg att ttt gac ctt cac aag gat gtt cca atg ctt atc tcc aat aat 816
Leu Ile Phe Asp Leu His Lys Asp Val Pro Met Leu Ile Ser Asn Asn
260 265 270
att gaa aaa tgt ctt atc gaa gca ttc act ccg att ggt atc tcc gat 864
Ile Glu Lys Cys Leu Ile Glu Ala Phe Thr Pro Ile Gly Ile Ser Asp
275 280 285
tgg aat tcg att ttt tgg atc acc cat cct ggt ggg aaa gct att tta 912
Trp Asn Ser Ile Phe Trp Ile Thr His Pro Gly Gly Lys Ala Ile Leu
290 295 300
gac aag gtg gag gag aaa tta cat ctt aag tca gat aag ttt gtc gac 960
Asp Lys Val Glu Glu Lys Leu His Leu Lys Ser Asp Lys Phe Val Asp
305 310 315 320
agt cgc cac gtg ttg tcg gaa cat ggc aac atg tca tcg tca acc gtc 1008
Ser Arg His Val Leu Ser Glu His Gly Asn Met Ser Ser Ser Thr Val
325 330 335
ttg ttc gtt atg gac gaa tta cgt aaa cgc agt tta gaa gag ggt aag 1056
Leu Phe Val Met Asp Glu Leu Arg Lys Arg Ser Leu Glu Glu Gly Lys
340 345 350
agt acg acg ggg gac ggg ttc gag tgg gga gtc tta ttc ggg ttc ggt 1104
Ser Thr Thr Gly Asp Gly Phe Glu Trp Gly Val Leu Phe Gly Phe Gly
355 360 365
cca gga ttg aca gtg gaa cgc gtc gtg gtt cgc agt gtc ccc att aag 1152
Pro Gly Leu Thr Val Glu Arg Val Val Val Arg Ser Val Pro Ile Lys
370 375 380
tac taa 1158
Tyr
385
<210> 73
<211> 385
<212> PRT
<213> Cannabis sativa
<400> 73
Met Asn His Leu Arg Ala Glu Gly Pro Ala Ser Val Leu Ala Ile Gly
1 5 10 15
Thr Ala Asn Pro Glu Asn Ile Leu Leu Gln Asp Glu Phe Pro Asp Tyr
20 25 30
Tyr Phe Arg Val Thr Lys Ser Glu His Met Thr Gln Leu Lys Glu Lys
35 40 45
Phe Arg Lys Ile Cys Asp Lys Ser Met Ile Arg Lys Arg Asn Cys Phe
50 55 60
Leu Asn Glu Glu His Leu Lys Gln Asn Pro Arg Leu Val Glu His Glu
65 70 75 80
Met Gln Thr Leu Asp Ala Arg Gln Asp Met Leu Val Val Glu Val Pro
85 90 95
Lys Leu Gly Lys Asp Ala Cys Ala Lys Ala Ile Lys Glu Trp Gly Gln
100 105 110
Pro Lys Ser Lys Ile Thr His Leu Ile Phe Thr Ser Ala Ser Thr Thr
115 120 125
Asp Met Pro Gly Ala Asp Tyr His Cys Ala Lys Leu Leu Gly Leu Ser
130 135 140
Pro Ser Val Lys Arg Val Met Met Tyr Gln Leu Gly Cys Tyr Gly Gly
145 150 155 160
Gly Thr Val Leu Arg Ile Ala Lys Asp Ile Ala Glu Asn Asn Lys Gly
165 170 175
Ala Arg Val Leu Ala Val Cys Cys Asp Ile Met Ala Cys Leu Phe Arg
180 185 190
Gly Pro Ser Glu Ser Asp Leu Glu Leu Leu Val Gly Gln Ala Ile Phe
195 200 205
Gly Asp Gly Ala Ala Ala Val Ile Val Gly Ala Glu Pro Asp Glu Ser
210 215 220
Val Gly Glu Arg Pro Ile Phe Glu Leu Val Ser Thr Gly Gln Thr Ile
225 230 235 240
Leu Pro Asn Ser Glu Gly Thr Ile Gly Gly His Ile Arg Glu Ala Gly
245 250 255
Leu Ile Phe Asp Leu His Lys Asp Val Pro Met Leu Ile Ser Asn Asn
260 265 270
Ile Glu Lys Cys Leu Ile Glu Ala Phe Thr Pro Ile Gly Ile Ser Asp
275 280 285
Trp Asn Ser Ile Phe Trp Ile Thr His Pro Gly Gly Lys Ala Ile Leu
290 295 300
Asp Lys Val Glu Glu Lys Leu His Leu Lys Ser Asp Lys Phe Val Asp
305 310 315 320
Ser Arg His Val Leu Ser Glu His Gly Asn Met Ser Ser Ser Thr Val
325 330 335
Leu Phe Val Met Asp Glu Leu Arg Lys Arg Ser Leu Glu Glu Gly Lys
340 345 350
Ser Thr Thr Gly Asp Gly Phe Glu Trp Gly Val Leu Phe Gly Phe Gly
355 360 365
Pro Gly Leu Thr Val Glu Arg Val Val Val Arg Ser Val Pro Ile Lys
370 375 380
Tyr
385
<210> 74
<211> 306
<212> DNA
<213> Cannabis sativa
<220>
<221> CDS
<222> (1)..(306)
<400> 74
atg gca gtc aaa cac ttg atc gtg tta aag ttc aaa gat gaa atc aca 48
Met Ala Val Lys His Leu Ile Val Leu Lys Phe Lys Asp Glu Ile Thr
1 5 10 15
gag gct cag aag gaa gaa ttt ttc aag acg tat gta aac ctt gtt aat 96
Glu Ala Gln Lys Glu Glu Phe Phe Lys Thr Tyr Val Asn Leu Val Asn
20 25 30
atc atc ccc gct atg aag gat gtg tat tgg ggt aaa gac gtg aca cag 144
Ile Ile Pro Ala Met Lys Asp Val Tyr Trp Gly Lys Asp Val Thr Gln
35 40 45
aag aac aaa gag gaa ggc tac acg cac atc gta gag gtc aca ttt gag 192
Lys Asn Lys Glu Glu Gly Tyr Thr His Ile Val Glu Val Thr Phe Glu
50 55 60
agc gtc gaa act att cag gat tac atc att cat ccc gca cac gtt gga 240
Ser Val Glu Thr Ile Gln Asp Tyr Ile Ile His Pro Ala His Val Gly
65 70 75 80
ttc ggg gat gtg tat cgc tct ttc tgg gaa aaa ttg ctg atc ttc gac 288
Phe Gly Asp Val Tyr Arg Ser Phe Trp Glu Lys Leu Leu Ile Phe Asp
85 90 95
tat aca ccg cgt aag taa 306
Tyr Thr Pro Arg Lys
100
<210> 75
<211> 101
<212> PRT
<213> Cannabis sativa
<400> 75
Met Ala Val Lys His Leu Ile Val Leu Lys Phe Lys Asp Glu Ile Thr
1 5 10 15
Glu Ala Gln Lys Glu Glu Phe Phe Lys Thr Tyr Val Asn Leu Val Asn
20 25 30
Ile Ile Pro Ala Met Lys Asp Val Tyr Trp Gly Lys Asp Val Thr Gln
35 40 45
Lys Asn Lys Glu Glu Gly Tyr Thr His Ile Val Glu Val Thr Phe Glu
50 55 60
Ser Val Glu Thr Ile Gln Asp Tyr Ile Ile His Pro Ala His Val Gly
65 70 75 80
Phe Gly Asp Val Tyr Arg Ser Phe Trp Glu Lys Leu Leu Ile Phe Asp
85 90 95
Tyr Thr Pro Arg Lys
100
Claims (20)
- 다음으로 구성된 군에서 선택된 서열을 포함하는 재조합 폴리펩티드:
(i) 서열번호 30 및 Y288X, A232S를 갖는 돌연변이 및 T69P, T98I 및 G224S로 구성된 군에서 선택된 돌연변이, 전술한 돌연변이의 모두 또는 임의의 조합, 여기서 X는 A, N, S, V 또는 비-천연(non-natural) 아미노산임;
(ii) 서열번호 30 및 Y288X, A232S를 갖는 돌연변이 및 T69P, T98I, G224S 및 T126P로 구성된 군에서 선택된 돌연변이, 전술한 돌연변이의 모두 또는 임의의 조합, 여기서 X는 A, N, S, V 또는 비-천연 아미노산임;
(iii) 서열번호 30 및 Y288X, A232S를 갖는 돌연변이 및 M14I, Y31W, T69P, T77I, T98I, S136A, E222D, G224S, N236T, G297K로 구성된 군에서 선택된 돌연변이, 전술한 돌연변이의 모두 또는 임의의 조합, 여기서 X는 A, N, S, V 또는 비-천연 아미노산임;
(iv) 서열번호 30 및 Y288X, A232S를 갖는 돌연변이 및 M14I, Y31W, T69P, T77I, E80A, D93S, T98I, T126P, M129L, G131Q, S136A, E222D, G224S, N236T, S277T, G297K로 구성된 군에서 선택된 돌연변이, 전술한 돌연변이의 모두 또는 임의의 조합, 여기서 X는 A, N, S, V 또는 비-천연 아미노산임;
(v) 서열번호 30 및 Y288X, A232S를 갖는 돌연변이 및 M14I, L33I, Y31W, T69P, T77I, V78A, E80A, D93S, T98I, E112G, T114V, T126P, M129L, G131Q, S136A, E222D, G224S, K225Q, N236T, S277T, G297K로 구성된 군에서 선택된 돌연변이, 전술한 돌연변이의 모두 또는 임의의 조합, 여기서 X는 A, N, S, V 또는 비-천연 아미노산임;
(vi) 1-20개의 보존적(conservative) 아미노산 치환을 포함하는 (i)-(iv) 또는 (v) 중 임의의 것; 및
(vii) (i)-(iv) 또는 (v)의 서열과 적어도 85%, 90%, 95%, 98% 또는 99% 동일한 서열;
여기서 (i) 내지 (vii) 중 어느 하나의 폴리펩티드는 NphB 활성을 가짐. - CBG(V)A를 제조하는 조건하에 GPP 및 올리베톨레이트(Olivetolate, OA), 디바린산(divarinic acid, DA) 또는 다른 2,4-디히드록시 벤조산 유도체(2,4-dihydroxy benzoic acid derivatives)를 제1항의 재조합 폴리펩티드와 인큐베이팅(incubating)하는 단계를 포함하는, GPP 및 올리베톨레이트(OA) 또는 디바린산(DA)으로부터 CBG(V)A를 제조하거나 GPP 및 2,4-디하이드록시 벤조산 또는 이의 유도체로부터 CBGXA를 제조하는 방법.
- 제1항의 폴리펩티드 및 이소프레놀(isoprenol) 또는 프레놀(prenol)을 게라닐피로포스페이트(Geranylpyrophosphate, GPP)로 전환시키는 복수의 효소를 포함하는 재조합 경로(recombinant pathway).
- 제3항에 있어서, ADP 및/또는 AMP를 ATP로 전환시키는 ATP 재생 모듈(ATP regeneration module)을 추가로 포함하는 재조합 경로.
- 제3항에 있어서, 상기 ATP 재생 모듈은 아세틸-포스페이트(acetyl-phosphate)를 아세트산(acetic acid)으로 전환시키는 재조합 경로.
- 제3항 또는 제4항에 있어서, 다음의 효소를 포함하는 상기 재조합 경로:
(i) 아세틸-포스페이트 트랜스퍼라제(Acetyl-phosphate transferase, PTA);
(ii) 말로네이트 데카르복실라제 알파 서브유닛(malonate decarboxylase alpha subunit, mdcA);
(iii) 아실 활성화 효소 3(acyl activating enzyme 3, AAE3);
(iv) 올리브톨 합성효소(olivetol synthase, OLS);
(v) 올리브톨산 사이클라제(olivetolic acid cyclase, OAC);
(vi) 히드록시에틸티아졸 키나제(hydroxyethylthiazole kinase, ThiM);
(vii) 이소펜테닐 키나제(isopentenyl kinase, IPK);
(viii) 이소펜틸 디포스페이트 이소머라제(isopentyl diphosphate isomerase, IDI);
(ix) 디포스포메발로네이트 데카르복실라제 알파 서브유닛(Diphosphomevalonate decarboxylase alpha subunit, MDCa);
(x) 게라닐-PP 합성효소(Geranyl-PP synthase, GPPS) 또는 파네실-PP 합성효소 돌연변이 S82F(Farnesyl-PP synthease mutant S82F, FPPS S82F); 및
(xi) 다음으로부터 선택된 서열을 갖는 재조합 폴리펩티드:
(1) 서열번호 30 및 Y288X, A232S를 갖는 돌연변이 및 T69P, T98I 및 G224S로 구성된 군에서 선택된 돌연변이, 전술한 돌연변이의 모두 또는 임의의 조합, 여기서 X는 A, N, S, V 또는 비-천연 아미노산임;
(2) 서열번호 30 및 Y288X, A232S를 갖는 돌연변이 및 T69P, T98I, G224S 및 T126P로 구성된 군에서 선택된 돌연변이, 전술한 돌연변이의 모두 또는 임의의 조합, 여기서 X는 A, N, S, V 또는 비-천연 아미노산임;
(3) 서열번호 30 및 Y288X, A232S를 갖는 돌연변이 및 M14I, Y31W, T69P, T77I, T98I, S136A, E222D, G224S, N236T, G297K로 구성된 군에서 선택된 돌연변이, 전술한 돌연변이의 모두 또는 임의의 조합, 여기서 X는 A, N, S, V 또는 비-천연 아미노산임;
(4) 서열번호 30 및 Y288X, A232S를 갖는 돌연변이 및 M14I, Y31W, T69P, T77I, E80A, D93S, T98I, T126P, M129L, G131Q, S136A, E222D, G224S, N236T, S277T, G297K로 구성된 군에서 선택된 돌연변이, 전술한 돌연변이의 모두 또는 임의의 조합, 여기서 X는 A, N, S, V 또는 비-천연 아미노산임;
(5) 서열번호 30 및 Y288X, A232S를 갖는 돌연변이 및 M14I, L33I, Y31W, T69P, T77I, V78A, E80A, D93S, T98I, E112G, T114V, T126P, M129L, G131Q, S136A, E222D, G224S, K225Q, N236T, S277T, G297K로 구성된 군에서 선택된 돌연변이, 전술한 돌연변이의 모두 또는 임의의 조합, 여기서 X는 A, N, S, V 또는 비-천연 아미노산임;
(6) 1-20개의 보존적(conservative) 아미노산 치환을 포함하는 (1)-(4) 또는 (5) 중 임의의 것;
(7) (1)-(4) 또는 (5)의 서열과 적어도 85%, 90%, 95%, 98% 또는 99% 동일한 서열;
여기서 (1) 내지 (7) 중 어느 하나의 폴리펩티드는 NphB 활성을 가짐. - 제6항에 있어서, 상기 경로는 BSA로 보충되는(supplemented) 재조합 경로.
- 제6항에 있어서, 상기 경로는 아세틸-포스페이트(acetyl-phosphate), 말로네이트(malonate), 헥사노에이트(hexanoate) 또는 부티레이트(butyrate), 및 프레놀(prenol) 또는 이소프레놀(isoprenol)로 보충되는 재조합 경로.
- 제8항에 있어서, 상기 경로는 칸나비디올산 합성효소(cannabidiolic acid synthase)를 추가로 포함하는 재조합 경로.
- 제9항에 있어서, 상기 경로는 칸나비디올산을 제조하는 재조합 경로.
- 다음을 포함하는 카나비게롤산(cannabigerolic acid) 또는 카나비제로바린산(cannabigerovarinic acid)의 제조를 위한 무세포 효소 시스템(cell free enzymatic system):
(i) 아세틸-포스페이트 트랜스퍼라제(Acetyl-phosphate transferase, PTA);
(ii) 말로네이트 데카르복실라제 알파 서브유닛(malonate decarboxylase alpha subunit, mdcA);
(iii) 아실 활성화 효소 3(acyl activating enzyme 3, AAE3);
(iv) 올리브톨 합성효소(olivetol synthase, OLS);
(v) 올리브톨산 사이클라제(olivetolic acid cyclase, OAC);
(vi) 히드록시에틸티아졸 키나제(hydroxyethylthiazole kinase, ThiM);
(vii) 이소펜테닐 키나제(isopentenyl kinase, IPK);
(viii) 이소펜틸 디포스페이트 이소머라제(isopentyl diphosphate isomerase, IDI);
(ix) 디포스포메발로네이트 데카르복실라제 알파 서브유닛(Diphosphomevalonate decarboxylase alpha subunit, MDCa);
(x) 게라닐-PP 합성효소(Geranyl-PP synthase, GPPS) 또는 파네실-PP 합성효소 돌연변이 S82F(Farnesyl-PP synthease mutant S82F, FPPS S82F); 및
(xi) 다음으로부터 선택된 서열을 갖는 재조합 폴리펩티드:
(1) 서열번호 30 및 Y288X, A232S를 갖는 돌연변이 및 T69P, T98I 및 G224S로 구성된 군에서 선택된 돌연변이, 전술한 돌연변이의 모두 또는 임의의 조합, 여기서 X는 A, N, S, V 또는 비-천연(non-natural) 아미노산임;
(2) 서열번호 30 및 Y288X, A232S를 갖는 돌연변이 및 T69P, T98I, G224S 및 T126P로 구성된 군에서 선택된 돌연변이, 전술한 돌연변이의 모두 또는 임의의 조합, 여기서 X는 A, N, S, V 또는 비-천연 아미노산임;
(3) 서열번호 30 및 Y288X, A232S를 갖는 돌연변이 및 M14I, Y31W, T69P, T77I, T98I, S136A, E222D, G224S, N236T, G297K로 구성된 군에서 선택된 돌연변이, 전술한 돌연변이의 모두 또는 임의의 조합, 여기서 X는 A, N, S, V 또는 비-천연 아미노산임;
(4) 서열번호 30 및 Y288X, A232S를 갖는 돌연변이 및 M14I, Y31W, T69P, T77I, E80A, D93S, T98I, T126P, M129L, G131Q, S136A, E222D, G224S, N236T, S277T, G297K로 구성된 군에서 선택된 돌연변이, 전술한 돌연변이의 모두 또는 임의의 조합, 여기서 X는 A, N, S, V 또는 비-천연 아미노산임;
(5) 서열번호 30 및 Y288X, A232S를 갖는 돌연변이 및 M14I, L33I, Y31W, T69P, T77I, V78A, E80A, D93S, T98I, E112G, T114V, T126P, M129L, G131Q, S136A, E222D, G224S, K225Q, N236T, S277T, G297K로 구성된 군에서 선택된 돌연변이, 전술한 돌연변이의 모두 또는 임의의 조합, 여기서 X는 A, N, S, V 또는 비-천연 아미노산임;
(6) 1-20개의 보존적(conservative) 아미노산 치환을 포함하는 (1)-(4) 또는 (5) 중 임의의 것;
(7) (1)-(4) 또는 (5)의 서열과 적어도 85%, 90%, 95%, 98% 또는 99% 동일한 서열;
여기서 (1) 내지 (7) 중 어느 하나의 폴리펩티드는 NphB 활성을 가짐. - 다음으로 구성된 군에서 선택된 폴리펩티드를 엔코딩(encoding)하는 단리된(isolated) 폴리뉴클레오티드:
(1) 서열번호 30 및 Y288X, A232S를 갖는 돌연변이 및 T69P, T98I 및 G224S로 구성된 군에서 선택된 돌연변이, 전술한 돌연변이의 모두 또는 임의의 조합, 여기서 X는 A, N, S, V 또는 비-천연(non-natural) 아미노산임;
(2) 서열번호 30 및 Y288X, A232S를 갖는 돌연변이 및 T69P, T98I, G224S 및 T126P로 구성된 군에서 선택된 돌연변이, 전술한 돌연변이의 모두 또는 임의의 조합, 여기서 X는 A, N, S, V 또는 비-천연 아미노산임;
(3) 서열번호 30 및 Y288X, A232S를 갖는 돌연변이 및 M14I, Y31W, T69P, T77I, T98I, S136A, E222D, G224S, N236T, G297K로 구성된 군에서 선택된 돌연변이, 전술한 돌연변이의 모두 또는 임의의 조합, 여기서 X는 A, N, S, V 또는 비-천연 아미노산임;
(4) 서열번호 30 및 Y288X, A232S를 갖는 돌연변이 및 M14I, Y31W, T69P, T77I, E80A, D93S, T98I, T126P, M129L, G131Q, S136A, E222D, G224S, N236T, S277T, G297K로 구성된 군에서 선택된 돌연변이, 전술한 돌연변이의 모두 또는 임의의 조합, 여기서 X는 A, N, S, V 또는 비-천연 아미노산임;
(5) 서열번호 30 및 Y288X, A232S를 갖는 돌연변이 및 M14I, L33I, Y31W, T69P, T77I, V78A, E80A, D93S, T98I, E112G, T114V, T126P, M129L, G131Q, S136A, E222D, G224S, K225Q, N236T, S277T, G297K로 구성된 군에서 선택된 돌연변이, 전술한 돌연변이의 모두 또는 임의의 조합, 여기서 X는 A, N, S, V 또는 비-천연 아미노산임;
(6) 1-20개의 보존적(conservative) 아미노산 치환을 포함하는 (1)-(4) 또 는 (5) 중 임의의 것;
(7) (1)-(4) 또는 (5)의 서열과 적어도 85%, 90%, 95%, 98% 또는 99% 동일 한 서열;
여기서 (1) 내지 (7) 중 어느 하나의 폴리펩티드는 NphB 활성을 가짐. - 제12항의 단리된 폴리펩티드를 포함하는 벡터.
- 제12항의 단리된 폴리펩티드를 포함하는 재조합 미생물.
- 제13항의 벡터를 포함하는 재조합 미생물.
- 다음을 포함하는 CBG(X)A 제조를 위한 인공 시험관내(in vitro) 효소 경로:
(a)(1) 프레놀(prenol) 및 ATP를 프레놀 포스페이트 및 ADP로 전환시키는 효소, 프레놀 포스페이트 및 ATP를 디메틸알릴 디포스페이트(dimethylallyl diphosphate, DMAPP)로 전환시키는 효소, 및/또는 (2) 이소프레놀(isoprenol) 및 ATP를 이소프레놀 포스페이트 및 ADP로 전환시키는 효소 및 이소프레놀 포스페이트및 ATP를 이소펜테닐 디포스페이트(isopentenyl diphosphate, IPP)로 전환시키는 효소;
(b) 프레놀 또는 이소프레놀만 존재할 때 DMAPP를 IPP로 및/또는 IPP를 DMAPP로 이성질체화하는(isomerizes) 효소;
(c) DMAPP 및 IPP를 제라닐 피로포스페이트(geranyl pyrophosphate, GPP)로 전환시키는 효소; 및
(d) GPP 및 올리브톨산(olivetolic acid) 또는 디바린산(divarinic acid) 또는 유사한 화합물을 CBG(X)A 또는 이의 변이체(variant)로 전환시키는 효소. - 제16항에 있어서, 투입 기질(들)은 올리브톨산(olivetolic acid), 디바린산(divarinic acid), 2,4 디히드록시벤조산 유도체(2,4 dihydroxybenozoic acid derivative), 프레놀(prenol) 및/또는 이소프레놀(isoprenol)인 인공 시험관내 효소 경로.
- 제16항 또는 제17항에 있어서, 상기 (a)에서 ADP를 ATP로 전환시키는 ATP 생성 시스템을 추가로 포함하는 인공 시험관내 효소 경로.
- 제16항에 있어서, 상기 GPP 및 올리브톨산 또는 디바린산 또는 기타 2,4 디히드록시벤조산 유도체를 전환시키는 효소는 다음으로 구성된 군에서 선택된 서열을 갖는 재조합 폴리펩티드를 포함하는 인공 시험관내 효소 경로:
(1) 서열번호 30 및 Y288X, A232S를 갖는 돌연변이 및 T69P, T98I 및 G224S로 구성된 군에서 선택된 돌연변이, 전술한 돌연변이의 모두 또는 임의의 조합, 여기서 X는 A, N, S, V 또는 비-천연(non-natural) 아미노산임;
(2) 서열번호 30 및 Y288X, A232S를 갖는 돌연변이 및 T69P, T98I, G224S 및 T126P로 구성된 군에서 선택된 돌연변이, 전술한 돌연변이의 모두 또는 임의의 조합, 여기서 X는 A, N, S, V 또는 비-천연 아미노산임;
(3) 서열번호 30 및 Y288X, A232S를 갖는 돌연변이 및 M14I, Y31W, T69P, T77I, T98I, S136A, E222D, G224S, N236T, G297K로 구성된 군에서 선택된 돌연변이, 전술한 돌연변이의 모두 또는 임의의 조합, 여기서 X는 A, N, S, V 또는 비-천연 아미노산임;
(4) 서열번호 30 및 Y288X, A232S를 갖는 돌연변이 및 M14I, Y31W, T69P, T77I, E80A, D93S, T98I, T126P, M129L, G131Q, S136A, E222D, G224S, N236T, S277T, G297K로 구성된 군에서 선택된 돌연변이, 전술한 돌연변이의 모두 또는 임의의 조합, 여기서 X는 A, N, S, V 또는 비-천연 아미노산임;
(5) 서열번호 30 및 Y288X, A232S를 갖는 돌연변이 및 M14I, L33I, Y31W, T69P, T77I, V78A, E80A, D93S, T98I, E112G, T114V, T126P, M129L, G131Q, S136A, E222D, G224S, K225Q, N236T, S277T, G297K로 구성된 군에서 선택된 돌연변이, 전술한 돌연변이의 모두 또는 임의의 조합, 여기서 X는 A, N, S, V 또는 비-천연 아미노산임;
(6) 1-20개의 보존적(conservative) 아미노산 치환을 포함하는 (1)-(4) 또 는 (5) 중 임의의 것;
(7) (1)-(4) 또는 (5)의 서열과 적어도 85%, 90%, 95%, 98% 또는 99% 동일 한 서열;
여기서 (1) 내지 (7) 중 어느 하나의 폴리펩티드는 NphB 활성을 가짐. - 도 1A-B에 도시된 효소 경로.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962953719P | 2019-12-26 | 2019-12-26 | |
US62/953,719 | 2019-12-26 | ||
PCT/US2020/067032 WO2021134024A1 (en) | 2019-12-26 | 2020-12-24 | Biosynthetic platform for the production of cannabinoids and other prenylated compounds |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20220119046A true KR20220119046A (ko) | 2022-08-26 |
Family
ID=76573165
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020227022019A KR20220119046A (ko) | 2019-12-26 | 2020-12-24 | 칸나비노이드 및 기타 프레닐화 화합물의 제조를 위한 생합성 플랫폼 |
Country Status (7)
Country | Link |
---|---|
US (1) | US20230348866A1 (ko) |
EP (1) | EP4081646A4 (ko) |
JP (1) | JP2023508859A (ko) |
KR (1) | KR20220119046A (ko) |
CN (1) | CN115003823A (ko) |
CA (1) | CA3162957A1 (ko) |
WO (1) | WO2021134024A1 (ko) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022157180A1 (en) * | 2021-01-20 | 2022-07-28 | C-Lecta Gmbh | In-vitro synthetic platform for the generation of isoprenoids |
US11518983B1 (en) | 2021-05-26 | 2022-12-06 | Invizyne Technologies, Inc. | Prenyltransferase variants with increased thermostability |
US20240076699A1 (en) * | 2022-08-01 | 2024-03-07 | Invizyne Technologies, Inc. | Biosynthesis of substituted compounds and cannabinoids |
CN117363593B (zh) * | 2023-11-14 | 2024-07-09 | 北京大学深圳研究生院 | 多酶级联催化体系及其在对映-贝壳杉烯合成中的应用 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006081537A2 (en) * | 2005-01-28 | 2006-08-03 | The Salk Institute For Biological Studies | Novel aromatic prenyltransferases, nucleic acids encoding same and uses therefor |
US11046978B2 (en) * | 2016-03-16 | 2021-06-29 | William Marsh Rice University | Synthesis of isoprenoids and derivatives |
AU2019231994A1 (en) * | 2018-03-08 | 2020-09-10 | Genomatica, Inc. | Prenyltransferase variants and methods for production of prenylated aromatic compounds |
WO2019183152A1 (en) * | 2018-03-19 | 2019-09-26 | Renew Biopharma, Inc. | Compositions and methods for using genetically modified enzymes |
-
2020
- 2020-12-24 EP EP20908383.1A patent/EP4081646A4/en active Pending
- 2020-12-24 WO PCT/US2020/067032 patent/WO2021134024A1/en unknown
- 2020-12-24 CN CN202080090880.XA patent/CN115003823A/zh active Pending
- 2020-12-24 KR KR1020227022019A patent/KR20220119046A/ko active Search and Examination
- 2020-12-24 US US17/786,913 patent/US20230348866A1/en active Pending
- 2020-12-24 CA CA3162957A patent/CA3162957A1/en active Pending
- 2020-12-24 JP JP2022537303A patent/JP2023508859A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
WO2021134024A1 (en) | 2021-07-01 |
US20230348866A1 (en) | 2023-11-02 |
CA3162957A1 (en) | 2021-07-01 |
JP2023508859A (ja) | 2023-03-06 |
EP4081646A1 (en) | 2022-11-02 |
EP4081646A4 (en) | 2024-07-17 |
CN115003823A (zh) | 2022-09-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112789505B (zh) | 用于生产大麻素和其它异戊二烯化的化合物的生物合成平台 | |
KR20220119046A (ko) | 칸나비노이드 및 기타 프레닐화 화합물의 제조를 위한 생합성 플랫폼 | |
US9969999B2 (en) | Method for producing alpha-santalene | |
CA2598414C (en) | Metabolically engineered cells for the production of resveratrol or an oligomeric or glycosidically-bound derivative thereof | |
Eckermann et al. | Stilbenecarboxylate biosynthesis: a new function in the family of chalcone synthase-related proteins | |
US8703454B2 (en) | Method for producing (+)-zizaene | |
US9267155B2 (en) | Method for producing sclareol | |
CN110325641B (zh) | 基于无机多磷酸盐的能量再生的无细胞表达系统 | |
US9353385B2 (en) | Sclareol and labdenediol diphosphate synthase polypeptides, encoding nucleic acid molecules and uses thereof | |
US20180208948A1 (en) | Drimenol synthases i | |
US10385363B2 (en) | Drimenol synthases II | |
US20230051453A1 (en) | Biosynthetic platform for the production of olivetolic acid and analogues of olivetolic acid | |
JP6748108B2 (ja) | 芳香性化合物の製造 | |
Ballentine | Developing an Enymatic Synthesis for Acetoacetyl-CoA Using Acetyl-CoA Acetyltransferase (AtoB) from Escherichia Coli | |
CN116897210A (zh) | S-甲基硫核糖激酶多肽以及s-甲基硫核糖激酶多肽的制备和使用方法 | |
JP2021003034A (ja) | Efpタンパク質を発現する大腸菌およびそれを用いたフラボノイド化合物製造方法 | |
Campbell | The second enzyme of Histidine Biosynthesis from Arabidopsis thaliana |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination |