KR20220088728A - 폴리아민 유사체를 생산하는 효모 - Google Patents
폴리아민 유사체를 생산하는 효모 Download PDFInfo
- Publication number
- KR20220088728A KR20220088728A KR1020227016456A KR20227016456A KR20220088728A KR 20220088728 A KR20220088728 A KR 20220088728A KR 1020227016456 A KR1020227016456 A KR 1020227016456A KR 20227016456 A KR20227016456 A KR 20227016456A KR 20220088728 A KR20220088728 A KR 20220088728A
- Authority
- KR
- South Korea
- Prior art keywords
- leu
- val
- polyamine
- dna
- ala
- Prior art date
Links
- 229920000768 polyamine Polymers 0.000 title claims abstract description 162
- 240000004808 Saccharomyces cerevisiae Species 0.000 title claims description 72
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 220
- 210000005253 yeast cell Anatomy 0.000 claims abstract description 124
- 108090000364 Ligases Proteins 0.000 claims abstract description 70
- 102000003960 Ligases Human genes 0.000 claims abstract description 70
- 238000004519 manufacturing process Methods 0.000 claims abstract description 43
- 108010089000 polyamine oxidase Proteins 0.000 claims abstract description 20
- 102100037209 Peroxisomal N(1)-acetyl-spermine/spermidine oxidase Human genes 0.000 claims abstract description 18
- NGSWKAQJJWESNS-ZZXKWVIFSA-N trans-4-coumaric acid Chemical compound OC(=O)\C=C\C1=CC=C(O)C=C1 NGSWKAQJJWESNS-ZZXKWVIFSA-N 0.000 claims abstract description 11
- ATHGHQPFGPMSJY-UHFFFAOYSA-N spermidine Chemical compound NCCCCNCCCN ATHGHQPFGPMSJY-UHFFFAOYSA-N 0.000 claims description 101
- -1 aromatic organic acids Chemical class 0.000 claims description 77
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 claims description 70
- 239000002773 nucleotide Substances 0.000 claims description 56
- 125000003729 nucleotide group Chemical group 0.000 claims description 56
- 210000004027 cell Anatomy 0.000 claims description 53
- 229940063673 spermidine Drugs 0.000 claims description 50
- KIDHWZJUCRJVML-UHFFFAOYSA-N Putrescine Natural products NCCCCN KIDHWZJUCRJVML-UHFFFAOYSA-N 0.000 claims description 43
- 238000000034 method Methods 0.000 claims description 40
- 239000001963 growth medium Substances 0.000 claims description 24
- 235000005985 organic acids Nutrition 0.000 claims description 24
- 101710134035 Spermidine hydroxycinnamoyl transferase Proteins 0.000 claims description 23
- 241000219195 Arabidopsis thaliana Species 0.000 claims description 22
- 239000005700 Putrescine Substances 0.000 claims description 22
- 101000654550 Arabidopsis thaliana Spermidine hydroxycinnamoyl transferase Proteins 0.000 claims description 21
- 239000000194 fatty acid Substances 0.000 claims description 21
- 150000007524 organic acids Chemical class 0.000 claims description 21
- ZAXCZCOUDLENMH-UHFFFAOYSA-N thermospermine Natural products NCCCNCCCNCCCN ZAXCZCOUDLENMH-UHFFFAOYSA-N 0.000 claims description 21
- 235000014113 dietary fatty acids Nutrition 0.000 claims description 19
- 229930195729 fatty acid Natural products 0.000 claims description 19
- 150000004665 fatty acids Chemical class 0.000 claims description 19
- 101710110860 Spermidine coumaroyl-CoA acyltransferase Proteins 0.000 claims description 18
- PFNFFQXMRSDOHW-UHFFFAOYSA-N spermine Chemical group NCCCNCCCCNCCCN PFNFFQXMRSDOHW-UHFFFAOYSA-N 0.000 claims description 18
- 108010071698 Spermine synthase Proteins 0.000 claims description 17
- 101710166881 Putrescine hydroxycinnamoyltransferase Proteins 0.000 claims description 15
- UODZHRGDSPLRMD-UHFFFAOYSA-N sym-homospermidine Chemical compound NCCCCNCCCCN UODZHRGDSPLRMD-UHFFFAOYSA-N 0.000 claims description 14
- 241000228653 Nicotiana attenuata Species 0.000 claims description 12
- 238000012258 culturing Methods 0.000 claims description 10
- 229940063675 spermine Drugs 0.000 claims description 10
- 108010021894 homospermidine synthetase Proteins 0.000 claims description 9
- 102100037616 Spermine synthase Human genes 0.000 claims description 8
- DODDBCGMRAFLEB-UHFFFAOYSA-N thermospermine Chemical compound NCCCCNCCCNCCCN DODDBCGMRAFLEB-UHFFFAOYSA-N 0.000 claims description 7
- 101000761285 Arabidopsis thaliana 4-coumarate-CoA ligase 4 Proteins 0.000 claims description 6
- 101100390989 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) FMS1 gene Proteins 0.000 claims description 6
- 241000346858 Senecio vernalis Species 0.000 claims description 6
- 102000004357 Transferases Human genes 0.000 claims description 6
- 108090000992 Transferases Proteins 0.000 claims description 6
- VHRGRCVQAFMJIZ-UHFFFAOYSA-N cadaverine Chemical compound NCCCCCN VHRGRCVQAFMJIZ-UHFFFAOYSA-N 0.000 claims description 6
- 241000190944 Blastochloris viridis Species 0.000 claims description 5
- 101100478264 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) SPE4 gene Proteins 0.000 claims description 5
- 244000005700 microbiome Species 0.000 claims description 5
- 229930001122 polyamine alkaloid Natural products 0.000 claims description 5
- 101000744265 Arabidopsis thaliana 4-coumarate-CoA ligase 2 Proteins 0.000 claims description 4
- 101000761278 Arabidopsis thaliana 4-coumarate-CoA ligase 3 Proteins 0.000 claims description 4
- 101000678268 Arabidopsis thaliana 4-coumarate-CoA ligase-like 9 Proteins 0.000 claims description 4
- XFNJVJPLKCPIBV-UHFFFAOYSA-N trimethylenediamine Chemical compound NCCCN XFNJVJPLKCPIBV-UHFFFAOYSA-N 0.000 claims description 4
- QYPPJABKJHAVHS-UHFFFAOYSA-N Agmatine Natural products NCCCCNC(N)=N QYPPJABKJHAVHS-UHFFFAOYSA-N 0.000 claims description 3
- QYPPJABKJHAVHS-UHFFFAOYSA-P agmatinium(2+) Chemical compound NC(=[NH2+])NCCCC[NH3+] QYPPJABKJHAVHS-UHFFFAOYSA-P 0.000 claims description 3
- 101000744240 Arabidopsis thaliana 4-coumarate-CoA ligase 1 Proteins 0.000 claims 3
- 108020004414 DNA Proteins 0.000 description 273
- 150000007523 nucleic acids Chemical class 0.000 description 49
- 108090000765 processed proteins & peptides Proteins 0.000 description 40
- 229920001184 polypeptide Polymers 0.000 description 35
- 102000004196 processed proteins & peptides Human genes 0.000 description 35
- RGJOEKWQDUBAIZ-UHFFFAOYSA-N coenzime A Natural products OC1C(OP(O)(O)=O)C(COP(O)(=O)OP(O)(=O)OCC(C)(C)C(O)C(=O)NCCC(=O)NCCS)OC1N1C2=NC=NC(N)=C2N=C1 RGJOEKWQDUBAIZ-UHFFFAOYSA-N 0.000 description 33
- 239000005516 coenzyme A Substances 0.000 description 33
- 229940093530 coenzyme a Drugs 0.000 description 33
- KDTSHFARGAKYJN-UHFFFAOYSA-N dephosphocoenzyme A Natural products OC1C(O)C(COP(O)(=O)OP(O)(=O)OCC(C)(C)C(O)C(=O)NCCC(=O)NCCS)OC1N1C2=NC=NC(N)=C2N=C1 KDTSHFARGAKYJN-UHFFFAOYSA-N 0.000 description 33
- 102000039446 nucleic acids Human genes 0.000 description 33
- 108020004707 nucleic acids Proteins 0.000 description 33
- 230000015572 biosynthetic process Effects 0.000 description 31
- NGSWKAQJJWESNS-UHFFFAOYSA-N 4-coumaric acid Chemical class OC(=O)C=CC1=CC=C(O)C=C1 NGSWKAQJJWESNS-UHFFFAOYSA-N 0.000 description 28
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 27
- 239000013612 plasmid Substances 0.000 description 27
- 102000004190 Enzymes Human genes 0.000 description 26
- 108090000790 Enzymes Proteins 0.000 description 26
- 229940024606 amino acid Drugs 0.000 description 26
- 230000002255 enzymatic effect Effects 0.000 description 25
- 230000004048 modification Effects 0.000 description 25
- 238000012986 modification Methods 0.000 description 25
- 102000004169 proteins and genes Human genes 0.000 description 23
- 150000001413 amino acids Chemical class 0.000 description 22
- 125000003275 alpha amino acid group Chemical group 0.000 description 20
- QAIPRVGONGVQAS-DUXPYHPUSA-N trans-caffeic acid Chemical compound OC(=O)\C=C\C1=CC=C(O)C(O)=C1 QAIPRVGONGVQAS-DUXPYHPUSA-N 0.000 description 18
- 108091028043 Nucleic acid sequence Proteins 0.000 description 17
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 17
- 238000006243 chemical reaction Methods 0.000 description 17
- 230000014509 gene expression Effects 0.000 description 17
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 16
- 230000000694 effects Effects 0.000 description 15
- 239000000047 product Substances 0.000 description 15
- 238000006467 substitution reaction Methods 0.000 description 15
- NGSWKAQJJWESNS-ZZXKWVIFSA-M 4-Hydroxycinnamate Natural products OC1=CC=C(\C=C\C([O-])=O)C=C1 NGSWKAQJJWESNS-ZZXKWVIFSA-M 0.000 description 14
- DFYRUELUNQRZTB-UHFFFAOYSA-N Acetovanillone Natural products COC1=CC(C(C)=O)=CC=C1O DFYRUELUNQRZTB-UHFFFAOYSA-N 0.000 description 14
- 238000012217 deletion Methods 0.000 description 14
- 230000037430 deletion Effects 0.000 description 14
- 108020004999 messenger RNA Proteins 0.000 description 14
- 108091033319 polynucleotide Proteins 0.000 description 14
- 102000040430 polynucleotide Human genes 0.000 description 14
- 239000002157 polynucleotide Substances 0.000 description 14
- 230000009466 transformation Effects 0.000 description 14
- 239000002253 acid Substances 0.000 description 13
- 230000002018 overexpression Effects 0.000 description 13
- 238000013518 transcription Methods 0.000 description 12
- 230000035897 transcription Effects 0.000 description 12
- DZAUWHJDUNRCTF-UHFFFAOYSA-N 3-(3,4-dihydroxyphenyl)propanoic acid Chemical compound OC(=O)CCC1=CC=C(O)C(O)=C1 DZAUWHJDUNRCTF-UHFFFAOYSA-N 0.000 description 11
- 230000037361 pathway Effects 0.000 description 11
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 10
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 10
- 239000012634 fragment Substances 0.000 description 10
- 230000001965 increasing effect Effects 0.000 description 10
- 239000002609 medium Substances 0.000 description 10
- 230000004060 metabolic process Effects 0.000 description 10
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 10
- ACEAELOMUCBPJP-UHFFFAOYSA-N (E)-3,4,5-trihydroxycinnamic acid Natural products OC(=O)C=CC1=CC(O)=C(O)C(O)=C1 ACEAELOMUCBPJP-UHFFFAOYSA-N 0.000 description 9
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 9
- 235000004883 caffeic acid Nutrition 0.000 description 9
- 229940074360 caffeic acid Drugs 0.000 description 9
- QAIPRVGONGVQAS-UHFFFAOYSA-N cis-caffeic acid Natural products OC(=O)C=CC1=CC=C(O)C(O)=C1 QAIPRVGONGVQAS-UHFFFAOYSA-N 0.000 description 9
- 238000000855 fermentation Methods 0.000 description 9
- 230000004151 fermentation Effects 0.000 description 9
- KSEBMYQBYZTDHS-HWKANZROSA-M (E)-Ferulic acid Natural products COC1=CC(\C=C\C([O-])=O)=CC=C1O KSEBMYQBYZTDHS-HWKANZROSA-M 0.000 description 8
- 241000196324 Embryophyta Species 0.000 description 8
- AHLPHDHHMVZTML-BYPYZUCNSA-N L-Ornithine Chemical compound NCCC[C@H](N)C(O)=O AHLPHDHHMVZTML-BYPYZUCNSA-N 0.000 description 8
- KSEBMYQBYZTDHS-HWKANZROSA-N ferulic acid Chemical compound COC1=CC(\C=C\C(O)=O)=CC=C1O KSEBMYQBYZTDHS-HWKANZROSA-N 0.000 description 8
- 235000001785 ferulic acid Nutrition 0.000 description 8
- KSEBMYQBYZTDHS-UHFFFAOYSA-N ferulic acid Natural products COC1=CC(C=CC(O)=O)=CC=C1O KSEBMYQBYZTDHS-UHFFFAOYSA-N 0.000 description 8
- 229940114124 ferulic acid Drugs 0.000 description 8
- 239000000203 mixture Substances 0.000 description 8
- 230000035772 mutation Effects 0.000 description 8
- 239000000523 sample Substances 0.000 description 8
- QURCVMIEKCOAJU-UHFFFAOYSA-N trans-isoferulic acid Natural products COC1=CC=C(C=CC(O)=O)C=C1O QURCVMIEKCOAJU-UHFFFAOYSA-N 0.000 description 8
- 108020004705 Codon Proteins 0.000 description 7
- 241000880493 Leptailurus serval Species 0.000 description 7
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 7
- 229910052731 fluorine Inorganic materials 0.000 description 7
- 125000001153 fluoro group Chemical group F* 0.000 description 7
- 238000012239 gene modification Methods 0.000 description 7
- 230000005017 genetic modification Effects 0.000 description 7
- 235000013617 genetically modified food Nutrition 0.000 description 7
- 108010015792 glycyllysine Proteins 0.000 description 7
- 108010034529 leucyl-lysine Proteins 0.000 description 7
- 241000894007 species Species 0.000 description 7
- 108010073969 valyllysine Proteins 0.000 description 7
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 6
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 6
- RGJOEKWQDUBAIZ-IBOSZNHHSA-N CoASH Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCS)O[C@H]1N1C2=NC=NC(N)=C2N=C1 RGJOEKWQDUBAIZ-IBOSZNHHSA-N 0.000 description 6
- 241000186226 Corynebacterium glutamicum Species 0.000 description 6
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 6
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 6
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 6
- 108010005233 alanylglutamic acid Proteins 0.000 description 6
- 108010077245 asparaginyl-proline Proteins 0.000 description 6
- 108010047857 aspartylglycine Proteins 0.000 description 6
- 239000000872 buffer Substances 0.000 description 6
- 229910052799 carbon Inorganic materials 0.000 description 6
- 239000011737 fluorine Substances 0.000 description 6
- 108010050848 glycylleucine Proteins 0.000 description 6
- 238000009396 hybridization Methods 0.000 description 6
- 238000003780 insertion Methods 0.000 description 6
- 230000037431 insertion Effects 0.000 description 6
- 108010061238 threonyl-glycine Proteins 0.000 description 6
- 101710115616 4-coumarate:CoA ligase 1 Proteins 0.000 description 5
- FJKROLUGYXJWQN-UHFFFAOYSA-N 4-hydroxybenzoic acid Chemical class OC(=O)C1=CC=C(O)C=C1 FJKROLUGYXJWQN-UHFFFAOYSA-N 0.000 description 5
- 241000588724 Escherichia coli Species 0.000 description 5
- 101150009006 HIS3 gene Proteins 0.000 description 5
- 108700026244 Open Reading Frames Proteins 0.000 description 5
- 101100394989 Rhodopseudomonas palustris (strain ATCC BAA-98 / CGA009) hisI gene Proteins 0.000 description 5
- MEFKEPWMEQBLKI-AIRLBKTGSA-N S-adenosyl-L-methioninate Chemical compound O[C@@H]1[C@H](O)[C@@H](C[S+](CC[C@H](N)C([O-])=O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 MEFKEPWMEQBLKI-AIRLBKTGSA-N 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 5
- 108010013835 arginine glutamate Proteins 0.000 description 5
- 230000004186 co-expression Effects 0.000 description 5
- 108010049041 glutamylalanine Proteins 0.000 description 5
- 108010037850 glycylvaline Proteins 0.000 description 5
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 5
- 108010057821 leucylproline Proteins 0.000 description 5
- 108010054155 lysyllysine Proteins 0.000 description 5
- 230000000813 microbial effect Effects 0.000 description 5
- 108010012581 phenylalanylglutamate Proteins 0.000 description 5
- 238000003752 polymerase chain reaction Methods 0.000 description 5
- 239000000243 solution Substances 0.000 description 5
- 239000000126 substance Substances 0.000 description 5
- FQVLRGLGWNWPSS-BXBUPLCLSA-N (4r,7s,10s,13s,16r)-16-acetamido-13-(1h-imidazol-5-ylmethyl)-10-methyl-6,9,12,15-tetraoxo-7-propan-2-yl-1,2-dithia-5,8,11,14-tetrazacycloheptadecane-4-carboxamide Chemical compound N1C(=O)[C@@H](NC(C)=O)CSSC[C@@H](C(N)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C)NC(=O)[C@@H]1CC1=CN=CN1 FQVLRGLGWNWPSS-BXBUPLCLSA-N 0.000 description 4
- 101710163881 5,6-dihydroxyindole-2-carboxylic acid oxidase Proteins 0.000 description 4
- 108700016155 Acyl transferases Proteins 0.000 description 4
- 102000057234 Acyl transferases Human genes 0.000 description 4
- 102100034035 Alcohol dehydrogenase 1A Human genes 0.000 description 4
- 102100036826 Aldehyde oxidase Human genes 0.000 description 4
- 101000600602 Aspergillus flavus (strain ATCC MYA-384 / AF70) Endopolygalacturonase A Proteins 0.000 description 4
- 101000600608 Aspergillus flavus (strain ATCC MYA-384 / AF70) Endopolygalacturonase B Proteins 0.000 description 4
- 108091033409 CRISPR Proteins 0.000 description 4
- 101100327917 Caenorhabditis elegans chup-1 gene Proteins 0.000 description 4
- 101150094690 GAL1 gene Proteins 0.000 description 4
- 101150038242 GAL10 gene Proteins 0.000 description 4
- 101150037782 GAL2 gene Proteins 0.000 description 4
- 102100028501 Galanin peptides Human genes 0.000 description 4
- 102100024637 Galectin-10 Human genes 0.000 description 4
- 102100021735 Galectin-2 Human genes 0.000 description 4
- 102100039555 Galectin-7 Human genes 0.000 description 4
- 101000892220 Geobacillus thermodenitrificans (strain NG80-2) Long-chain-alcohol dehydrogenase 1 Proteins 0.000 description 4
- 102100031181 Glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 4
- 102100036669 Glycerol-3-phosphate dehydrogenase [NAD(+)], cytoplasmic Human genes 0.000 description 4
- 101100246753 Halobacterium salinarum (strain ATCC 700922 / JCM 11081 / NRC-1) pyrF gene Proteins 0.000 description 4
- 101000780443 Homo sapiens Alcohol dehydrogenase 1A Proteins 0.000 description 4
- 101000928314 Homo sapiens Aldehyde oxidase Proteins 0.000 description 4
- 101100121078 Homo sapiens GAL gene Proteins 0.000 description 4
- 101000608772 Homo sapiens Galectin-7 Proteins 0.000 description 4
- 101001072574 Homo sapiens Glycerol-3-phosphate dehydrogenase [NAD(+)], cytoplasmic Proteins 0.000 description 4
- 101000579123 Homo sapiens Phosphoglycerate kinase 1 Proteins 0.000 description 4
- 101000951145 Homo sapiens Succinate dehydrogenase [ubiquinone] cytochrome b small subunit, mitochondrial Proteins 0.000 description 4
- 102100023162 L-serine dehydratase/L-threonine deaminase Human genes 0.000 description 4
- 108010043075 L-threonine 3-dehydrogenase Proteins 0.000 description 4
- ULXYQAJWJGLCNR-YUMQZZPRSA-N Leu-Asp-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O ULXYQAJWJGLCNR-YUMQZZPRSA-N 0.000 description 4
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 4
- AHLPHDHHMVZTML-UHFFFAOYSA-N Orn-delta-NH2 Natural products NCCCC(N)C(O)=O AHLPHDHHMVZTML-UHFFFAOYSA-N 0.000 description 4
- KJWZYMMLVHIVSU-IYCNHOCDSA-N PGK1 Chemical compound CCCCC[C@H](O)\C=C\[C@@H]1[C@@H](CCCCCCC(O)=O)C(=O)CC1=O KJWZYMMLVHIVSU-IYCNHOCDSA-N 0.000 description 4
- 102100028251 Phosphoglycerate kinase 1 Human genes 0.000 description 4
- 101001126848 Rhizobium radiobacter Polygalacturonase Proteins 0.000 description 4
- 101100010928 Saccharolobus solfataricus (strain ATCC 35092 / DSM 1617 / JCM 11322 / P2) tuf gene Proteins 0.000 description 4
- 101100434411 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) ADH1 gene Proteins 0.000 description 4
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 4
- 102100038014 Succinate dehydrogenase [ubiquinone] cytochrome b small subunit, mitochondrial Human genes 0.000 description 4
- 101150001810 TEAD1 gene Proteins 0.000 description 4
- 101150074253 TEF1 gene Proteins 0.000 description 4
- 102100029898 Transcriptional enhancer factor TEF-1 Human genes 0.000 description 4
- 108020004566 Transfer RNA Proteins 0.000 description 4
- 101150050575 URA3 gene Proteins 0.000 description 4
- 101150102866 adc1 gene Proteins 0.000 description 4
- 238000007792 addition Methods 0.000 description 4
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 4
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 4
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 4
- 108010038633 aspartylglutamate Proteins 0.000 description 4
- 230000002238 attenuated effect Effects 0.000 description 4
- 230000001580 bacterial effect Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 150000001875 compounds Chemical class 0.000 description 4
- 108010016616 cysteinylglycine Proteins 0.000 description 4
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 4
- 150000002085 enols Chemical class 0.000 description 4
- 210000003527 eukaryotic cell Anatomy 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000002068 genetic effect Effects 0.000 description 4
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 4
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 4
- 229930005346 hydroxycinnamic acid Natural products 0.000 description 4
- 235000010359 hydroxycinnamic acids Nutrition 0.000 description 4
- 108010009298 lysylglutamic acid Proteins 0.000 description 4
- 108010038320 lysylphenylalanine Proteins 0.000 description 4
- BDAGIHXWWSANSR-UHFFFAOYSA-N methanoic acid Natural products OC=O BDAGIHXWWSANSR-UHFFFAOYSA-N 0.000 description 4
- 229910052757 nitrogen Inorganic materials 0.000 description 4
- 229960003104 ornithine Drugs 0.000 description 4
- 238000012261 overproduction Methods 0.000 description 4
- 108010070643 prolylglutamic acid Proteins 0.000 description 4
- 230000008685 targeting Effects 0.000 description 4
- 230000014616 translation Effects 0.000 description 4
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 4
- JVNVHNHITFVWIX-KZKUDURGSA-N (E)-cinnamoyl-CoA Chemical compound O=C([C@H](O)C(C)(COP(O)(=O)OP(O)(=O)OC[C@@H]1[C@H]([C@@H](O)[C@@H](O1)N1C2=NC=NC(N)=C2N=C1)OP(O)(O)=O)C)NCCC(=O)NCCSC(=O)\C=C\C1=CC=CC=C1 JVNVHNHITFVWIX-KZKUDURGSA-N 0.000 description 3
- CSCPPACGZOOCGX-UHFFFAOYSA-N Acetone Chemical compound CC(C)=O CSCPPACGZOOCGX-UHFFFAOYSA-N 0.000 description 3
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 3
- TTXMOJWKNRJWQJ-FXQIFTODSA-N Ala-Arg-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N TTXMOJWKNRJWQJ-FXQIFTODSA-N 0.000 description 3
- KLALXKYLOMZDQT-ZLUOBGJFSA-N Ala-Ser-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(N)=O KLALXKYLOMZDQT-ZLUOBGJFSA-N 0.000 description 3
- 102100022717 Atypical chemokine receptor 1 Human genes 0.000 description 3
- 238000010354 CRISPR gene editing Methods 0.000 description 3
- 101100480861 Caldanaerobacter subterraneus subsp. tengcongensis (strain DSM 15242 / JCM 11007 / NBRC 100824 / MB4) tdh gene Proteins 0.000 description 3
- 101100447466 Candida albicans (strain WO-1) TDH1 gene Proteins 0.000 description 3
- 108010078791 Carrier Proteins Proteins 0.000 description 3
- JVNVHNHITFVWIX-WBHAVQPBSA-N Cinnamoyl-CoA Natural products S(C(=O)/C=C/c1ccccc1)CCNC(=O)CCNC(=O)[C@@H](O)C(CO[P@](=O)(O[P@@](=O)(OC[C@H]1[C@@H](OP(=O)(O)O)[C@@H](O)[C@H](n2c3ncnc(N)c3nc2)O1)O)O)(C)C JVNVHNHITFVWIX-WBHAVQPBSA-N 0.000 description 3
- 108010090461 DFG peptide Proteins 0.000 description 3
- 101710111073 External scaffolding protein D Proteins 0.000 description 3
- GBXZVJQQDAJGSO-KBJLHTFASA-N Feruloyl-CoA Natural products S(C(=O)/C=C/c1cc(OC)c(O)cc1)CCNC(=O)CCNC(=O)[C@H](O)C(CO[P@@](=O)(O[P@](=O)(OC[C@@H]1[C@H](OP(=O)(O)O)[C@H](O)[C@@H](n2c3ncnc(N)c3nc2)O1)O)O)(C)C GBXZVJQQDAJGSO-KBJLHTFASA-N 0.000 description 3
- OLPPXYMMIARYAL-QMMMGPOBSA-N Gly-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)CN OLPPXYMMIARYAL-QMMMGPOBSA-N 0.000 description 3
- GMTXWRIDLGTVFC-IUCAKERBSA-N Gly-Lys-Glu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GMTXWRIDLGTVFC-IUCAKERBSA-N 0.000 description 3
- VNNRLUNBJSWZPF-ZKWXMUAHSA-N Gly-Ser-Ile Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VNNRLUNBJSWZPF-ZKWXMUAHSA-N 0.000 description 3
- GJHWILMUOANXTG-WPRPVWTQSA-N Gly-Val-Arg Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GJHWILMUOANXTG-WPRPVWTQSA-N 0.000 description 3
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 3
- HASRFYOMVPJRPU-SRVKXCTJSA-N Leu-Arg-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HASRFYOMVPJRPU-SRVKXCTJSA-N 0.000 description 3
- WRODMZBHNNPRLN-SRVKXCTJSA-N Lys-Leu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O WRODMZBHNNPRLN-SRVKXCTJSA-N 0.000 description 3
- YTJFXEDRUOQGSP-DCAQKATOSA-N Lys-Pro-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O YTJFXEDRUOQGSP-DCAQKATOSA-N 0.000 description 3
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 3
- 108091005461 Nucleic proteins Proteins 0.000 description 3
- 241000235648 Pichia Species 0.000 description 3
- QKDIHFHGHBYTKB-IHRRRGAJSA-N Pro-Ser-Phe Chemical compound N([C@@H](CO)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C(=O)[C@@H]1CCCN1 QKDIHFHGHBYTKB-IHRRRGAJSA-N 0.000 description 3
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 3
- XUDRHBPSPAPDJP-SRVKXCTJSA-N Ser-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO XUDRHBPSPAPDJP-SRVKXCTJSA-N 0.000 description 3
- 108010051753 Spermidine Synthase Proteins 0.000 description 3
- 108030002304 Spermidine dicoumaroyl transferases Proteins 0.000 description 3
- 230000001851 biosynthetic effect Effects 0.000 description 3
- QHRGJMIMHCLHRG-FUEUKBNZSA-N caffeoyl-CoA Chemical compound O=C([C@H](O)C(C)(COP(O)(=O)OP(O)(=O)OC[C@@H]1[C@H]([C@@H](O)[C@@H](O1)N1C2=NC=NC(N)=C2N=C1)OP(O)(O)=O)C)NCCC(=O)NCCSC(=O)C=CC1=CC=C(O)C(O)=C1 QHRGJMIMHCLHRG-FUEUKBNZSA-N 0.000 description 3
- 101150038500 cas9 gene Proteins 0.000 description 3
- 238000004113 cell culture Methods 0.000 description 3
- 238000010367 cloning Methods 0.000 description 3
- 238000003501 co-culture Methods 0.000 description 3
- 239000012228 culture supernatant Substances 0.000 description 3
- 239000003623 enhancer Substances 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 230000004927 fusion Effects 0.000 description 3
- 239000007789 gas Substances 0.000 description 3
- 108010079547 glutamylmethionine Proteins 0.000 description 3
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 3
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 3
- 108010089804 glycyl-threonine Proteins 0.000 description 3
- 108010081551 glycylphenylalanine Proteins 0.000 description 3
- 108010084389 glycyltryptophan Proteins 0.000 description 3
- 108010018006 histidylserine Proteins 0.000 description 3
- DEDGUGJNLNLJSR-UHFFFAOYSA-N hydroxycinnamic acid group Chemical class OC(C(=O)O)=CC1=CC=CC=C1 DEDGUGJNLNLJSR-UHFFFAOYSA-N 0.000 description 3
- 238000001727 in vivo Methods 0.000 description 3
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 3
- 108010027338 isoleucylcysteine Proteins 0.000 description 3
- 108010003700 lysyl aspartic acid Proteins 0.000 description 3
- VWHRYODZTDMVSS-QMMMGPOBSA-N m-fluoro-L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC(F)=C1 VWHRYODZTDMVSS-QMMMGPOBSA-N 0.000 description 3
- 238000010369 molecular cloning Methods 0.000 description 3
- 125000004433 nitrogen atom Chemical group N* 0.000 description 3
- 239000002243 precursor Substances 0.000 description 3
- 108010029020 prolylglycine Proteins 0.000 description 3
- 108010053725 prolylvaline Proteins 0.000 description 3
- 238000011084 recovery Methods 0.000 description 3
- 230000001105 regulatory effect Effects 0.000 description 3
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 3
- 239000000758 substrate Substances 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 101150088047 tdh3 gene Proteins 0.000 description 3
- GBXZVJQQDAJGSO-NBXNMEGSSA-N trans-feruloyl-CoA Chemical compound C1=C(O)C(OC)=CC(\C=C\C(=O)SCCNC(=O)CCNC(=O)[C@H](O)C(C)(C)COP(O)(=O)OP(O)(=O)OC[C@@H]2[C@H]([C@@H](O)[C@@H](O2)N2C3=NC=NC(N)=C3N=C2)OP(O)(O)=O)=C1 GBXZVJQQDAJGSO-NBXNMEGSSA-N 0.000 description 3
- 230000001052 transient effect Effects 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- 108010038745 tryptophylglycine Proteins 0.000 description 3
- 229940035893 uracil Drugs 0.000 description 3
- 238000005406 washing Methods 0.000 description 3
- YWWVWXASSLXJHU-AATRIKPKSA-N (9E)-tetradecenoic acid Chemical compound CCCC\C=C\CCCCCCCC(O)=O YWWVWXASSLXJHU-AATRIKPKSA-N 0.000 description 2
- OYHQOLUKZRVURQ-NTGFUMLPSA-N (9Z,12Z)-9,10,12,13-tetratritiooctadeca-9,12-dienoic acid Chemical compound C(CCCCCCC\C(=C(/C\C(=C(/CCCCC)\[3H])\[3H])\[3H])\[3H])(=O)O OYHQOLUKZRVURQ-NTGFUMLPSA-N 0.000 description 2
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 2
- WBYWAXJHAXSJNI-VOTSOKGWSA-M .beta-Phenylacrylic acid Natural products [O-]C(=O)\C=C\C1=CC=CC=C1 WBYWAXJHAXSJNI-VOTSOKGWSA-M 0.000 description 2
- GLDQAMYCGOIJDV-UHFFFAOYSA-N 2,3-dihydroxybenzoic acid Chemical compound OC(=O)C1=CC=CC(O)=C1O GLDQAMYCGOIJDV-UHFFFAOYSA-N 0.000 description 2
- IBHWREHFNDMRPR-UHFFFAOYSA-N 2,4,6-Trihydroxybenzoic acid Chemical compound OC(=O)C1=C(O)C=C(O)C=C1O IBHWREHFNDMRPR-UHFFFAOYSA-N 0.000 description 2
- UIAFKZKHHVMJGS-UHFFFAOYSA-N 2,4-dihydroxybenzoic acid Chemical compound OC(=O)C1=CC=C(O)C=C1O UIAFKZKHHVMJGS-UHFFFAOYSA-N 0.000 description 2
- WXTMDXOMEHJXQO-UHFFFAOYSA-N 2,5-dihydroxybenzoic acid Chemical compound OC(=O)C1=CC(O)=CC=C1O WXTMDXOMEHJXQO-UHFFFAOYSA-N 0.000 description 2
- AKEUNCKRJATALU-UHFFFAOYSA-N 2,6-dihydroxybenzoic acid Chemical compound OC(=O)C1=C(O)C=CC=C1O AKEUNCKRJATALU-UHFFFAOYSA-N 0.000 description 2
- SJSOFNCYXJUNBT-UHFFFAOYSA-N 3,4,5-trimethoxybenzoic acid Chemical compound COC1=CC(C(O)=O)=CC(OC)=C1OC SJSOFNCYXJUNBT-UHFFFAOYSA-N 0.000 description 2
- YQUVCSBJEUQKSH-UHFFFAOYSA-N 3,4-dihydroxybenzoic acid Chemical compound OC(=O)C1=CC=C(O)C(O)=C1 YQUVCSBJEUQKSH-UHFFFAOYSA-N 0.000 description 2
- UYEMGAFJOZZIFP-UHFFFAOYSA-N 3,5-dihydroxybenzoic acid Chemical compound OC(=O)C1=CC(O)=CC(O)=C1 UYEMGAFJOZZIFP-UHFFFAOYSA-N 0.000 description 2
- IJFXRHURBJZNAO-UHFFFAOYSA-N 3-hydroxybenzoic acid Chemical compound OC(=O)C1=CC=CC(O)=C1 IJFXRHURBJZNAO-UHFFFAOYSA-N 0.000 description 2
- OSWFIVFLDKOXQC-UHFFFAOYSA-N 4-(3-methoxyphenyl)aniline Chemical compound COC1=CC=CC(C=2C=CC(N)=CC=2)=C1 OSWFIVFLDKOXQC-UHFFFAOYSA-N 0.000 description 2
- 229940090248 4-hydroxybenzoic acid Drugs 0.000 description 2
- 102100029457 Adenine phosphoribosyltransferase Human genes 0.000 description 2
- 108010024223 Adenine phosphoribosyltransferase Proteins 0.000 description 2
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 2
- CVGNCMIULZNYES-WHFBIAKZSA-N Ala-Asn-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CVGNCMIULZNYES-WHFBIAKZSA-N 0.000 description 2
- HXNNRBHASOSVPG-GUBZILKMSA-N Ala-Glu-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HXNNRBHASOSVPG-GUBZILKMSA-N 0.000 description 2
- MQIGTEQXYCRLGK-BQBZGAKWSA-N Ala-Gly-Pro Chemical compound C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O MQIGTEQXYCRLGK-BQBZGAKWSA-N 0.000 description 2
- AWZKCUCQJNTBAD-SRVKXCTJSA-N Ala-Leu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN AWZKCUCQJNTBAD-SRVKXCTJSA-N 0.000 description 2
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 2
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 2
- IOFVWPYSRSCWHI-JXUBOQSCSA-N Ala-Thr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C)N IOFVWPYSRSCWHI-JXUBOQSCSA-N 0.000 description 2
- YJHKTAMKPGFJCT-NRPADANISA-N Ala-Val-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O YJHKTAMKPGFJCT-NRPADANISA-N 0.000 description 2
- REWSWYIDQIELBE-FXQIFTODSA-N Ala-Val-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O REWSWYIDQIELBE-FXQIFTODSA-N 0.000 description 2
- 108020005544 Antisense RNA Proteins 0.000 description 2
- 101000631707 Arabidopsis thaliana Spermidine coumaroyl-CoA acyltransferase Proteins 0.000 description 2
- JOTRDIXZHNQYGP-DCAQKATOSA-N Arg-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N JOTRDIXZHNQYGP-DCAQKATOSA-N 0.000 description 2
- BKDDABUWNKGZCK-XHNCKOQMSA-N Asn-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)N)N)C(=O)O BKDDABUWNKGZCK-XHNCKOQMSA-N 0.000 description 2
- YVXRYLVELQYAEQ-SRVKXCTJSA-N Asn-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N YVXRYLVELQYAEQ-SRVKXCTJSA-N 0.000 description 2
- ZUFPUBYQYWCMDB-NUMRIWBASA-N Asn-Thr-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZUFPUBYQYWCMDB-NUMRIWBASA-N 0.000 description 2
- PXLNPFOJZQMXAT-BYULHYEWSA-N Asp-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O PXLNPFOJZQMXAT-BYULHYEWSA-N 0.000 description 2
- KHGPWGKPYHPOIK-QWRGUYRKSA-N Asp-Gly-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KHGPWGKPYHPOIK-QWRGUYRKSA-N 0.000 description 2
- AYFVRYXNDHBECD-YUMQZZPRSA-N Asp-Leu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AYFVRYXNDHBECD-YUMQZZPRSA-N 0.000 description 2
- DPNWSMBUYCLEDG-CIUDSAMLSA-N Asp-Lys-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O DPNWSMBUYCLEDG-CIUDSAMLSA-N 0.000 description 2
- QJHOOKBAHRJPPX-QWRGUYRKSA-N Asp-Phe-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 QJHOOKBAHRJPPX-QWRGUYRKSA-N 0.000 description 2
- KESWRFKUZRUTAH-FXQIFTODSA-N Asp-Pro-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O KESWRFKUZRUTAH-FXQIFTODSA-N 0.000 description 2
- ZUNMTUPRQMWMHX-LSJOCFKGSA-N Asp-Val-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O ZUNMTUPRQMWMHX-LSJOCFKGSA-N 0.000 description 2
- 102100024633 Carbonic anhydrase 2 Human genes 0.000 description 2
- 102000014914 Carrier Proteins Human genes 0.000 description 2
- 108091026890 Coding region Proteins 0.000 description 2
- DVIHGGUODLILFN-GHCJXIJMSA-N Cys-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CS)N DVIHGGUODLILFN-GHCJXIJMSA-N 0.000 description 2
- 102000053602 DNA Human genes 0.000 description 2
- 108700033480 EC 2.5.1.45 Proteins 0.000 description 2
- 238000002965 ELISA Methods 0.000 description 2
- XEYMBRRKIFYQMF-GUBZILKMSA-N Gln-Asp-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O XEYMBRRKIFYQMF-GUBZILKMSA-N 0.000 description 2
- ZZLDMBMFKZFQMU-NRPADANISA-N Gln-Val-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O ZZLDMBMFKZFQMU-NRPADANISA-N 0.000 description 2
- FHPXTPQBODWBIY-CIUDSAMLSA-N Glu-Ala-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FHPXTPQBODWBIY-CIUDSAMLSA-N 0.000 description 2
- CKRUHITYRFNUKW-WDSKDSINSA-N Glu-Asn-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CKRUHITYRFNUKW-WDSKDSINSA-N 0.000 description 2
- IESFZVCAVACGPH-PEFMBERDSA-N Glu-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O IESFZVCAVACGPH-PEFMBERDSA-N 0.000 description 2
- IVGJYOOGJLFKQE-AVGNSLFASA-N Glu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N IVGJYOOGJLFKQE-AVGNSLFASA-N 0.000 description 2
- LHIPZASLKPYDPI-AVGNSLFASA-N Glu-Phe-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LHIPZASLKPYDPI-AVGNSLFASA-N 0.000 description 2
- JZJGEKDPWVJOLD-QEWYBTABSA-N Glu-Phe-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JZJGEKDPWVJOLD-QEWYBTABSA-N 0.000 description 2
- IDEODOAVGCMUQV-GUBZILKMSA-N Glu-Ser-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IDEODOAVGCMUQV-GUBZILKMSA-N 0.000 description 2
- ZQNCUVODKOBSSO-XEGUGMAKSA-N Glu-Trp-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(O)=O ZQNCUVODKOBSSO-XEGUGMAKSA-N 0.000 description 2
- VIPDPMHGICREIS-GVXVVHGQSA-N Glu-Val-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VIPDPMHGICREIS-GVXVVHGQSA-N 0.000 description 2
- RMWAOBGCZZSJHE-UMNHJUIQSA-N Glu-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N RMWAOBGCZZSJHE-UMNHJUIQSA-N 0.000 description 2
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 2
- XTQFHTHIAKKCTM-YFKPBYRVSA-N Gly-Glu-Gly Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O XTQFHTHIAKKCTM-YFKPBYRVSA-N 0.000 description 2
- UFPXDFOYHVEIPI-BYPYZUCNSA-N Gly-Gly-Asp Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O UFPXDFOYHVEIPI-BYPYZUCNSA-N 0.000 description 2
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 2
- VBOBNHSVQKKTOT-YUMQZZPRSA-N Gly-Lys-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O VBOBNHSVQKKTOT-YUMQZZPRSA-N 0.000 description 2
- YYXJFBMCOUSYSF-RYUDHWBXSA-N Gly-Phe-Gln Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O YYXJFBMCOUSYSF-RYUDHWBXSA-N 0.000 description 2
- WNZOCXUOGVYYBJ-CDMKHQONSA-N Gly-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)CN)O WNZOCXUOGVYYBJ-CDMKHQONSA-N 0.000 description 2
- TVTZEOHWHUVYCG-KYNKHSRBSA-N Gly-Thr-Thr Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O TVTZEOHWHUVYCG-KYNKHSRBSA-N 0.000 description 2
- HQSKKSLNLSTONK-JTQLQIEISA-N Gly-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 HQSKKSLNLSTONK-JTQLQIEISA-N 0.000 description 2
- 108020005004 Guide RNA Proteins 0.000 description 2
- 101000760643 Homo sapiens Carbonic anhydrase 2 Proteins 0.000 description 2
- RWIKBYVJQAJYDP-BJDJZHNGSA-N Ile-Ala-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RWIKBYVJQAJYDP-BJDJZHNGSA-N 0.000 description 2
- TZCGZYWNIDZZMR-UHFFFAOYSA-N Ile-Arg-Ala Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(C)C(O)=O)CCCN=C(N)N TZCGZYWNIDZZMR-UHFFFAOYSA-N 0.000 description 2
- NKRJALPCDNXULF-BYULHYEWSA-N Ile-Asp-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O NKRJALPCDNXULF-BYULHYEWSA-N 0.000 description 2
- LLZLRXBTOOFODM-QSFUFRPTSA-N Ile-Asp-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N LLZLRXBTOOFODM-QSFUFRPTSA-N 0.000 description 2
- RMNMUUCYTMLWNA-ZPFDUUQYSA-N Ile-Lys-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N RMNMUUCYTMLWNA-ZPFDUUQYSA-N 0.000 description 2
- GLYJPWIRLBAIJH-UHFFFAOYSA-N Ile-Lys-Pro Natural products CCC(C)C(N)C(=O)NC(CCCCN)C(=O)N1CCCC1C(O)=O GLYJPWIRLBAIJH-UHFFFAOYSA-N 0.000 description 2
- JHNJNTMTZHEDLJ-NAKRPEOUSA-N Ile-Ser-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O JHNJNTMTZHEDLJ-NAKRPEOUSA-N 0.000 description 2
- PXKACEXYLPBMAD-JBDRJPRFSA-N Ile-Ser-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PXKACEXYLPBMAD-JBDRJPRFSA-N 0.000 description 2
- BCISUQVFDGYZBO-QSFUFRPTSA-N Ile-Val-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O BCISUQVFDGYZBO-QSFUFRPTSA-N 0.000 description 2
- 108010065920 Insulin Lispro Proteins 0.000 description 2
- 241001138401 Kluyveromyces lactis Species 0.000 description 2
- IBMVEYRWAWIOTN-UHFFFAOYSA-N L-Leucyl-L-Arginyl-L-Proline Natural products CC(C)CC(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O IBMVEYRWAWIOTN-UHFFFAOYSA-N 0.000 description 2
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 2
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 2
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 2
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 2
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 2
- 241000222697 Leishmania infantum Species 0.000 description 2
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 2
- YOZCKMXHBYKOMQ-IHRRRGAJSA-N Leu-Arg-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOZCKMXHBYKOMQ-IHRRRGAJSA-N 0.000 description 2
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 2
- DLCOFDAHNMMQPP-SRVKXCTJSA-N Leu-Asp-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DLCOFDAHNMMQPP-SRVKXCTJSA-N 0.000 description 2
- PNUCWVAGVNLUMW-CIUDSAMLSA-N Leu-Cys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O PNUCWVAGVNLUMW-CIUDSAMLSA-N 0.000 description 2
- AVEGDIAXTDVBJS-XUXIUFHCSA-N Leu-Ile-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AVEGDIAXTDVBJS-XUXIUFHCSA-N 0.000 description 2
- HGFGEMSVBMCFKK-MNXVOIDGSA-N Leu-Ile-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O HGFGEMSVBMCFKK-MNXVOIDGSA-N 0.000 description 2
- QJXHMYMRGDOHRU-NHCYSSNCSA-N Leu-Ile-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O QJXHMYMRGDOHRU-NHCYSSNCSA-N 0.000 description 2
- JKSIBWITFMQTOA-XUXIUFHCSA-N Leu-Ile-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O JKSIBWITFMQTOA-XUXIUFHCSA-N 0.000 description 2
- RTIRBWJPYJYTLO-MELADBBJSA-N Leu-Lys-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N RTIRBWJPYJYTLO-MELADBBJSA-N 0.000 description 2
- BMVFXOQHDQZAQU-DCAQKATOSA-N Leu-Pro-Asp Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N BMVFXOQHDQZAQU-DCAQKATOSA-N 0.000 description 2
- KWLWZYMNUZJKMZ-IHRRRGAJSA-N Leu-Pro-Leu Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O KWLWZYMNUZJKMZ-IHRRRGAJSA-N 0.000 description 2
- LFSQWRSVPNKJGP-WDCWCFNPSA-N Leu-Thr-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(O)=O LFSQWRSVPNKJGP-WDCWCFNPSA-N 0.000 description 2
- LMDVGHQPPPLYAR-IHRRRGAJSA-N Leu-Val-His Chemical compound N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O LMDVGHQPPPLYAR-IHRRRGAJSA-N 0.000 description 2
- FDBTVENULFNTAL-XQQFMLRXSA-N Leu-Val-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N FDBTVENULFNTAL-XQQFMLRXSA-N 0.000 description 2
- WALVCOOOKULCQM-ULQDDVLXSA-N Lys-Arg-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WALVCOOOKULCQM-ULQDDVLXSA-N 0.000 description 2
- GQFDWEDHOQRNLC-QWRGUYRKSA-N Lys-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN GQFDWEDHOQRNLC-QWRGUYRKSA-N 0.000 description 2
- SKRGVGLIRUGANF-AVGNSLFASA-N Lys-Leu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SKRGVGLIRUGANF-AVGNSLFASA-N 0.000 description 2
- VMTYLUGCXIEDMV-QWRGUYRKSA-N Lys-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCCCN VMTYLUGCXIEDMV-QWRGUYRKSA-N 0.000 description 2
- SQXZLVXQXWILKW-KKUMJFAQSA-N Lys-Ser-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SQXZLVXQXWILKW-KKUMJFAQSA-N 0.000 description 2
- RIPJMCFGQHGHNP-RHYQMDGZSA-N Lys-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCCCN)N)O RIPJMCFGQHGHNP-RHYQMDGZSA-N 0.000 description 2
- ONGCSGVHCSAATF-CIUDSAMLSA-N Met-Ala-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O ONGCSGVHCSAATF-CIUDSAMLSA-N 0.000 description 2
- ULNXMMYXQKGNPG-LPEHRKFASA-N Met-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N ULNXMMYXQKGNPG-LPEHRKFASA-N 0.000 description 2
- 108010066427 N-valyltryptophan Proteins 0.000 description 2
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 2
- 108020004485 Nonsense Codon Proteins 0.000 description 2
- ZQPPMHVWECSIRJ-UHFFFAOYSA-N Oleic acid Natural products CCCCCCCCC=CCCCCCCCC(O)=O ZQPPMHVWECSIRJ-UHFFFAOYSA-N 0.000 description 2
- WPTYDQPGBMDUBI-QWRGUYRKSA-N Phe-Gly-Asn Chemical compound N[C@@H](Cc1ccccc1)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O WPTYDQPGBMDUBI-QWRGUYRKSA-N 0.000 description 2
- WWPAHTZOWURIMR-ULQDDVLXSA-N Phe-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 WWPAHTZOWURIMR-ULQDDVLXSA-N 0.000 description 2
- AOKZOUGUMLBPSS-PMVMPFDFSA-N Phe-Trp-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(C)C)C(O)=O AOKZOUGUMLBPSS-PMVMPFDFSA-N 0.000 description 2
- BAONJAHBAUDJKA-BZSNNMDCSA-N Phe-Tyr-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=CC=C1 BAONJAHBAUDJKA-BZSNNMDCSA-N 0.000 description 2
- IEIFEYBAYFSRBQ-IHRRRGAJSA-N Phe-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N IEIFEYBAYFSRBQ-IHRRRGAJSA-N 0.000 description 2
- CGSOWZUPLOKYOR-AVGNSLFASA-N Pro-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 CGSOWZUPLOKYOR-AVGNSLFASA-N 0.000 description 2
- SXJOPONICMGFCR-DCAQKATOSA-N Pro-Ser-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O SXJOPONICMGFCR-DCAQKATOSA-N 0.000 description 2
- RMJZWERKFFNNNS-XGEHTFHBSA-N Pro-Thr-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O RMJZWERKFFNNNS-XGEHTFHBSA-N 0.000 description 2
- 108010003201 RGH 0205 Proteins 0.000 description 2
- 241000223252 Rhodotorula Species 0.000 description 2
- 241000235347 Schizosaccharomyces pombe Species 0.000 description 2
- VAUMZJHYZQXZBQ-WHFBIAKZSA-N Ser-Asn-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O VAUMZJHYZQXZBQ-WHFBIAKZSA-N 0.000 description 2
- UQFYNFTYDHUIMI-WHFBIAKZSA-N Ser-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CO UQFYNFTYDHUIMI-WHFBIAKZSA-N 0.000 description 2
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 2
- GZSZPKSBVAOGIE-CIUDSAMLSA-N Ser-Lys-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O GZSZPKSBVAOGIE-CIUDSAMLSA-N 0.000 description 2
- BSXKBOUZDAZXHE-CIUDSAMLSA-N Ser-Pro-Glu Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O BSXKBOUZDAZXHE-CIUDSAMLSA-N 0.000 description 2
- FLONGDPORFIVQW-XGEHTFHBSA-N Ser-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FLONGDPORFIVQW-XGEHTFHBSA-N 0.000 description 2
- VLMIUSLQONKLDV-HEIBUPTGSA-N Ser-Thr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VLMIUSLQONKLDV-HEIBUPTGSA-N 0.000 description 2
- BDMWLJLPPUCLNV-XGEHTFHBSA-N Ser-Thr-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BDMWLJLPPUCLNV-XGEHTFHBSA-N 0.000 description 2
- 108030001813 Thermospermine synthases Proteins 0.000 description 2
- BSNZTJXVDOINSR-JXUBOQSCSA-N Thr-Ala-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BSNZTJXVDOINSR-JXUBOQSCSA-N 0.000 description 2
- UKBSDLHIKIXJKH-HJGDQZAQSA-N Thr-Arg-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UKBSDLHIKIXJKH-HJGDQZAQSA-N 0.000 description 2
- NIEWSKWFURSECR-FOHZUACHSA-N Thr-Gly-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O NIEWSKWFURSECR-FOHZUACHSA-N 0.000 description 2
- XTCNBOBTROGWMW-RWRJDSDZSA-N Thr-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N XTCNBOBTROGWMW-RWRJDSDZSA-N 0.000 description 2
- GXUWHVZYDAHFSV-FLBSBUHZSA-N Thr-Ile-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GXUWHVZYDAHFSV-FLBSBUHZSA-N 0.000 description 2
- GAYLGYUVTDMLKC-UWJYBYFXSA-N Tyr-Asp-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 GAYLGYUVTDMLKC-UWJYBYFXSA-N 0.000 description 2
- IYHNBRUWVBIVJR-IHRRRGAJSA-N Tyr-Gln-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 IYHNBRUWVBIVJR-IHRRRGAJSA-N 0.000 description 2
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 2
- ZLFHAAGHGQBQQN-AEJSXWLSSA-N Val-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZLFHAAGHGQBQQN-AEJSXWLSSA-N 0.000 description 2
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 2
- VCAWFLIWYNMHQP-UKJIMTQDSA-N Val-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N VCAWFLIWYNMHQP-UKJIMTQDSA-N 0.000 description 2
- ROLGIBMFNMZANA-GVXVVHGQSA-N Val-Glu-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N ROLGIBMFNMZANA-GVXVVHGQSA-N 0.000 description 2
- ZHQWPWQNVRCXAX-XQQFMLRXSA-N Val-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZHQWPWQNVRCXAX-XQQFMLRXSA-N 0.000 description 2
- YMTOEGGOCHVGEH-IHRRRGAJSA-N Val-Lys-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O YMTOEGGOCHVGEH-IHRRRGAJSA-N 0.000 description 2
- YKNOJPJWNVHORX-UNQGMJICSA-N Val-Phe-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YKNOJPJWNVHORX-UNQGMJICSA-N 0.000 description 2
- MNSSBIHFEUUXNW-RCWTZXSCSA-N Val-Thr-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N MNSSBIHFEUUXNW-RCWTZXSCSA-N 0.000 description 2
- 101150039629 aah1 gene Proteins 0.000 description 2
- 108010081404 acein-2 Proteins 0.000 description 2
- 125000002252 acyl group Chemical group 0.000 description 2
- 108010041407 alanylaspartic acid Proteins 0.000 description 2
- 108010047495 alanylglycine Proteins 0.000 description 2
- 108010070944 alanylhistidine Proteins 0.000 description 2
- 108010011559 alanylphenylalanine Proteins 0.000 description 2
- 108010087924 alanylproline Proteins 0.000 description 2
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 2
- DTOSIQBPPRVQHS-PDBXOOCHSA-N alpha-linolenic acid Chemical compound CC\C=C/C\C=C/C\C=C/CCCCCCCC(O)=O DTOSIQBPPRVQHS-PDBXOOCHSA-N 0.000 description 2
- 150000001412 amines Chemical group 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 230000000692 anti-sense effect Effects 0.000 description 2
- YZXBAPSDXZZRGB-DOFZRALJSA-N arachidonic acid Chemical compound CCCCC\C=C/C\C=C/C\C=C/C\C=C/CCCC(O)=O YZXBAPSDXZZRGB-DOFZRALJSA-N 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000004071 biological effect Effects 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 2
- 230000006652 catabolic pathway Effects 0.000 description 2
- 235000013985 cinnamic acid Nutrition 0.000 description 2
- 229930016911 cinnamic acid Natural products 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- 239000003184 complementary RNA Substances 0.000 description 2
- GHVNFZFCNZKVNT-UHFFFAOYSA-N decanoic acid Chemical compound CCCCCCCCCC(O)=O GHVNFZFCNZKVNT-UHFFFAOYSA-N 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000001212 derivatisation Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- UKMSUNONTOPOIO-UHFFFAOYSA-N docosanoic acid Chemical compound CCCCCCCCCCCCCCCCCCCCCC(O)=O UKMSUNONTOPOIO-UHFFFAOYSA-N 0.000 description 2
- POULHZVOKOAJMA-UHFFFAOYSA-N dodecanoic acid Chemical compound CCCCCCCCCCCC(O)=O POULHZVOKOAJMA-UHFFFAOYSA-N 0.000 description 2
- ZQPPMHVWECSIRJ-MDZDMXLPSA-N elaidic acid Chemical compound CCCCCCCC\C=C\CCCCCCCC(O)=O ZQPPMHVWECSIRJ-MDZDMXLPSA-N 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- KBPUBCVJHFXPOC-UHFFFAOYSA-N ethyl 3,4-dihydroxybenzoate Chemical compound CCOC(=O)C1=CC=C(O)C(O)=C1 KBPUBCVJHFXPOC-UHFFFAOYSA-N 0.000 description 2
- VFPFQHQNJCMNBZ-UHFFFAOYSA-N ethyl gallate Chemical compound CCOC(=O)C1=CC(O)=C(O)C(O)=C1 VFPFQHQNJCMNBZ-UHFFFAOYSA-N 0.000 description 2
- 238000003804 extraction from natural source Methods 0.000 description 2
- 235000019253 formic acid Nutrition 0.000 description 2
- LNTHITQWFMADLM-UHFFFAOYSA-N gallic acid Chemical compound OC(=O)C1=CC(O)=C(O)C(O)=C1 LNTHITQWFMADLM-UHFFFAOYSA-N 0.000 description 2
- 238000010362 genome editing Methods 0.000 description 2
- 238000002873 global sequence alignment Methods 0.000 description 2
- 239000008103 glucose Substances 0.000 description 2
- 230000013595 glycosylation Effects 0.000 description 2
- 238000006206 glycosylation reaction Methods 0.000 description 2
- 108010019832 glycyl-asparaginyl-glycine Proteins 0.000 description 2
- 108010072405 glycyl-aspartyl-glycine Proteins 0.000 description 2
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 2
- 108010020688 glycylhistidine Proteins 0.000 description 2
- 108010077515 glycylproline Proteins 0.000 description 2
- 238000003306 harvesting Methods 0.000 description 2
- XMHIUKTWLZUKEX-UHFFFAOYSA-N hexacosanoic acid Chemical compound CCCCCCCCCCCCCCCCCCCCCCCCCC(O)=O XMHIUKTWLZUKEX-UHFFFAOYSA-N 0.000 description 2
- IPCSVZSSVZVIGE-UHFFFAOYSA-N hexadecanoic acid Chemical compound CCCCCCCCCCCCCCCC(O)=O IPCSVZSSVZVIGE-UHFFFAOYSA-N 0.000 description 2
- 238000004128 high performance liquid chromatography Methods 0.000 description 2
- 108010085325 histidylproline Proteins 0.000 description 2
- IGMNYECMUMZDDF-UHFFFAOYSA-N homogentisic acid Chemical compound OC(=O)CC1=CC(O)=CC=C1O IGMNYECMUMZDDF-UHFFFAOYSA-N 0.000 description 2
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 2
- 230000001939 inductive effect Effects 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- QXJSBBXBKPUZAA-UHFFFAOYSA-N isooleic acid Natural products CCCCCCCC=CCCCCCCCCC(O)=O QXJSBBXBKPUZAA-UHFFFAOYSA-N 0.000 description 2
- 108010051673 leucyl-glycyl-phenylalanine Proteins 0.000 description 2
- 108010047926 leucyl-lysyl-tyrosine Proteins 0.000 description 2
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 2
- 108010012058 leucyltyrosine Proteins 0.000 description 2
- 238000009630 liquid culture Methods 0.000 description 2
- 108010064235 lysylglycine Proteins 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 229930182817 methionine Natural products 0.000 description 2
- 229960004452 methionine Drugs 0.000 description 2
- 108010056582 methionylglutamic acid Proteins 0.000 description 2
- 108010085203 methionylmethionine Proteins 0.000 description 2
- WBYWAXJHAXSJNI-UHFFFAOYSA-N methyl p-hydroxycinnamate Natural products OC(=O)C=CC1=CC=CC=C1 WBYWAXJHAXSJNI-UHFFFAOYSA-N 0.000 description 2
- 239000002679 microRNA Substances 0.000 description 2
- 230000002438 mitochondrial effect Effects 0.000 description 2
- 229930014626 natural product Natural products 0.000 description 2
- 230000037434 nonsense mutation Effects 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- WWZKQHOCKIZLMA-UHFFFAOYSA-N octanoic acid Chemical compound CCCCCCCC(O)=O WWZKQHOCKIZLMA-UHFFFAOYSA-N 0.000 description 2
- 150000002894 organic compounds Chemical class 0.000 description 2
- 102000004340 ornithine decarboxylase antizyme Human genes 0.000 description 2
- 108090000903 ornithine decarboxylase antizyme Proteins 0.000 description 2
- SECPZKHBENQXJG-FPLPWBNLSA-N palmitoleic acid Chemical compound CCCCCC\C=C/CCCCCCCC(O)=O SECPZKHBENQXJG-FPLPWBNLSA-N 0.000 description 2
- 230000001323 posttranslational effect Effects 0.000 description 2
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 2
- 108010077112 prolyl-proline Proteins 0.000 description 2
- 108010090894 prolylleucine Proteins 0.000 description 2
- YGSDEFSMJLZEOE-UHFFFAOYSA-N salicylic acid Chemical compound OC(=O)C1=CC=CC=C1O YGSDEFSMJLZEOE-UHFFFAOYSA-N 0.000 description 2
- 108010026333 seryl-proline Proteins 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- 239000001509 sodium citrate Substances 0.000 description 2
- 235000000346 sugar Nutrition 0.000 description 2
- 239000013589 supplement Substances 0.000 description 2
- JMSVCTWVEWCHDZ-UHFFFAOYSA-N syringic acid Chemical compound COC1=CC(C(O)=O)=CC(OC)=C1O JMSVCTWVEWCHDZ-UHFFFAOYSA-N 0.000 description 2
- 230000007723 transport mechanism Effects 0.000 description 2
- 108010080629 tryptophan-leucine Proteins 0.000 description 2
- 108010051110 tyrosyl-lysine Proteins 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- GDYGAIKPBLFCKR-UHFFFAOYSA-N (-)-2-beta-D-glucopyranosylgallic acid delta-lactone Natural products OC1=C(O)C(O)=C2C3OC(CO)C(O)C(O)C3OC(=O)C2=C1 GDYGAIKPBLFCKR-UHFFFAOYSA-N 0.000 description 1
- AXFMEGAFCUULFV-BLFANLJRSA-N (2s)-2-[[(2s)-1-[(2s,3r)-2-amino-3-methylpentanoyl]pyrrolidine-2-carbonyl]amino]pentanedioic acid Chemical compound CC[C@@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O AXFMEGAFCUULFV-BLFANLJRSA-N 0.000 description 1
- WRIDQFICGBMAFQ-UHFFFAOYSA-N (E)-8-Octadecenoic acid Natural products CCCCCCCCCC=CCCCCCCC(O)=O WRIDQFICGBMAFQ-UHFFFAOYSA-N 0.000 description 1
- FVFDFXRLJHKPAH-FNORWQNLSA-N (E)-N-[4-(3-aminopropylamino)butyl]-3-(3,4-dihydroxyphenyl)prop-2-enamide Chemical compound C(\C=C\C1=CC(O)=C(O)C=C1)(=O)NCCCCNCCCN FVFDFXRLJHKPAH-FNORWQNLSA-N 0.000 description 1
- PYXJSYQYQYNWGP-OISSRVDXSA-N (E)-N-[4-[[(E)-3-(3,4-dihydroxyphenyl)prop-2-enoyl]-[3-[[(E)-3-(4-hydroxyphenyl)prop-2-enoyl]amino]propyl]amino]butyl]-3-(4-hydroxyphenyl)prop-2-enamide Chemical compound C1=CC(O)=CC=C1\C=C\C(=O)NCCCCN(C(=O)\C=C\C=1C=C(O)C(O)=CC=1)CCCNC(=O)\C=C\C1=CC=C(O)C=C1 PYXJSYQYQYNWGP-OISSRVDXSA-N 0.000 description 1
- YDXYYLWKWACCMX-DUXPYHPUSA-N (e)-3-(3-fluoro-4-hydroxyphenyl)prop-2-enoic acid Chemical compound OC(=O)\C=C\C1=CC=C(O)C(F)=C1 YDXYYLWKWACCMX-DUXPYHPUSA-N 0.000 description 1
- RTSIUKMGSDOSTI-SNAWJCMRSA-N (e)-3-(3-fluorophenyl)prop-2-enoic acid Chemical compound OC(=O)\C=C\C1=CC=CC(F)=C1 RTSIUKMGSDOSTI-SNAWJCMRSA-N 0.000 description 1
- HNSDLXPSAYFUHK-UHFFFAOYSA-N 1,4-bis(2-ethylhexyl) sulfosuccinate Chemical compound CCCCC(CC)COC(=O)CC(S(O)(=O)=O)C(=O)OCC(CC)CCCC HNSDLXPSAYFUHK-UHFFFAOYSA-N 0.000 description 1
- TUSDEZXZIZRFGC-UHFFFAOYSA-N 1-O-galloyl-3,6-(R)-HHDP-beta-D-glucose Natural products OC1C(O2)COC(=O)C3=CC(O)=C(O)C(O)=C3C3=C(O)C(O)=C(O)C=C3C(=O)OC1C(O)C2OC(=O)C1=CC(O)=C(O)C(O)=C1 TUSDEZXZIZRFGC-UHFFFAOYSA-N 0.000 description 1
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 1
- 229940082044 2,3-dihydroxybenzoic acid Drugs 0.000 description 1
- LQJBNNIYVWPHFW-UHFFFAOYSA-N 20:1omega9c fatty acid Natural products CCCCCCCCCCC=CCCCCCCCC(O)=O LQJBNNIYVWPHFW-UHFFFAOYSA-N 0.000 description 1
- GOLORTLGFDVFDW-UHFFFAOYSA-N 3-(1h-benzimidazol-2-yl)-7-(diethylamino)chromen-2-one Chemical compound C1=CC=C2NC(C3=CC4=CC=C(C=C4OC3=O)N(CC)CC)=NC2=C1 GOLORTLGFDVFDW-UHFFFAOYSA-N 0.000 description 1
- CWVRJTMFETXNAD-FWCWNIRPSA-N 3-O-Caffeoylquinic acid Natural products O[C@H]1[C@@H](O)C[C@@](O)(C(O)=O)C[C@H]1OC(=O)\C=C\C1=CC=C(O)C(O)=C1 CWVRJTMFETXNAD-FWCWNIRPSA-N 0.000 description 1
- DMZOKBALNZWDKI-JBNLOVLYSA-N 4-Coumaroyl-CoA Natural products S(C(=O)/C=C/c1ccc(O)cc1)CCNC(=O)CCNC(=O)[C@@H](O)C(CO[P@@](=O)(O[P@@](=O)(OC[C@H]1[C@@H](OP(=O)(O)O)[C@@H](O)[C@@H](n2c3ncnc(N)c3nc2)O1)O)O)(C)C DMZOKBALNZWDKI-JBNLOVLYSA-N 0.000 description 1
- IMIZPWSVYADSCN-UHFFFAOYSA-N 4-methyl-2-[[4-methyl-2-[[4-methyl-2-(pyrrolidine-2-carbonylamino)pentanoyl]amino]pentanoyl]amino]pentanoic acid Chemical compound CC(C)CC(C(O)=O)NC(=O)C(CC(C)C)NC(=O)C(CC(C)C)NC(=O)C1CCCN1 IMIZPWSVYADSCN-UHFFFAOYSA-N 0.000 description 1
- 108010034457 5'-methylthioadenosine phosphorylase Proteins 0.000 description 1
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 1
- CKOMXBHMKXXTNW-UHFFFAOYSA-N 6-methyladenine Chemical compound CNC1=NC=NC2=C1N=CN2 CKOMXBHMKXXTNW-UHFFFAOYSA-N 0.000 description 1
- QSBYPNXLFMSGKH-UHFFFAOYSA-N 9-Heptadecensaeure Natural products CCCCCCCC=CCCCCCCCC(O)=O QSBYPNXLFMSGKH-UHFFFAOYSA-N 0.000 description 1
- YWWVWXASSLXJHU-UHFFFAOYSA-N 9E-tetradecenoic acid Natural products CCCCC=CCCCCCCCC(O)=O YWWVWXASSLXJHU-UHFFFAOYSA-N 0.000 description 1
- 230000005730 ADP ribosylation Effects 0.000 description 1
- 101800001241 Acetylglutamate kinase Proteins 0.000 description 1
- 101710165738 Acetylornithine aminotransferase Proteins 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 108010052875 Adenine deaminase Proteins 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- AAQGRPOPTAUUBM-ZLUOBGJFSA-N Ala-Ala-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O AAQGRPOPTAUUBM-ZLUOBGJFSA-N 0.000 description 1
- DKJPOZOEBONHFS-ZLUOBGJFSA-N Ala-Ala-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O DKJPOZOEBONHFS-ZLUOBGJFSA-N 0.000 description 1
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 1
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 1
- SVBXIUDNTRTKHE-CIUDSAMLSA-N Ala-Arg-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O SVBXIUDNTRTKHE-CIUDSAMLSA-N 0.000 description 1
- JBGSZRYCXBPWGX-BQBZGAKWSA-N Ala-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N JBGSZRYCXBPWGX-BQBZGAKWSA-N 0.000 description 1
- UCIYCBSJBQGDGM-LPEHRKFASA-N Ala-Arg-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N UCIYCBSJBQGDGM-LPEHRKFASA-N 0.000 description 1
- WYPUMLRSQMKIJU-BPNCWPANSA-N Ala-Arg-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O WYPUMLRSQMKIJU-BPNCWPANSA-N 0.000 description 1
- YAXNATKKPOWVCP-ZLUOBGJFSA-N Ala-Asn-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O YAXNATKKPOWVCP-ZLUOBGJFSA-N 0.000 description 1
- XEXJJJRVTFGWIC-FXQIFTODSA-N Ala-Asn-Arg Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XEXJJJRVTFGWIC-FXQIFTODSA-N 0.000 description 1
- HGRBNYQIMKTUNT-XVYDVKMFSA-N Ala-Asn-His Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N HGRBNYQIMKTUNT-XVYDVKMFSA-N 0.000 description 1
- STACJSVFHSEZJV-GHCJXIJMSA-N Ala-Asn-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O STACJSVFHSEZJV-GHCJXIJMSA-N 0.000 description 1
- NXSFUECZFORGOG-CIUDSAMLSA-N Ala-Asn-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXSFUECZFORGOG-CIUDSAMLSA-N 0.000 description 1
- JYEBJTDTPNKQJG-FXQIFTODSA-N Ala-Asn-Met Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCSC)C(=O)O)N JYEBJTDTPNKQJG-FXQIFTODSA-N 0.000 description 1
- XCVRVWZTXPCYJT-BIIVOSGPSA-N Ala-Asn-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N XCVRVWZTXPCYJT-BIIVOSGPSA-N 0.000 description 1
- WDIYWDJLXOCGRW-ACZMJKKPSA-N Ala-Asp-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WDIYWDJLXOCGRW-ACZMJKKPSA-N 0.000 description 1
- KIUYPHAMDKDICO-WHFBIAKZSA-N Ala-Asp-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KIUYPHAMDKDICO-WHFBIAKZSA-N 0.000 description 1
- ZIWWTZWAKYBUOB-CIUDSAMLSA-N Ala-Asp-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O ZIWWTZWAKYBUOB-CIUDSAMLSA-N 0.000 description 1
- YSMPVONNIWLJML-FXQIFTODSA-N Ala-Asp-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(O)=O YSMPVONNIWLJML-FXQIFTODSA-N 0.000 description 1
- BTYTYHBSJKQBQA-GCJQMDKQSA-N Ala-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N)O BTYTYHBSJKQBQA-GCJQMDKQSA-N 0.000 description 1
- ZODMADSIQZZBSQ-FXQIFTODSA-N Ala-Gln-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZODMADSIQZZBSQ-FXQIFTODSA-N 0.000 description 1
- FVSOUJZKYWEFOB-KBIXCLLPSA-N Ala-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](C)N FVSOUJZKYWEFOB-KBIXCLLPSA-N 0.000 description 1
- YIGLXQRFQVWFEY-NRPADANISA-N Ala-Gln-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O YIGLXQRFQVWFEY-NRPADANISA-N 0.000 description 1
- NWVVKQZOVSTDBQ-CIUDSAMLSA-N Ala-Glu-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NWVVKQZOVSTDBQ-CIUDSAMLSA-N 0.000 description 1
- PAIHPOGPJVUFJY-WDSKDSINSA-N Ala-Glu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PAIHPOGPJVUFJY-WDSKDSINSA-N 0.000 description 1
- UHMQKOBNPRAZGB-CIUDSAMLSA-N Ala-Glu-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCSC)C(=O)O)N UHMQKOBNPRAZGB-CIUDSAMLSA-N 0.000 description 1
- YEVZMOUUZINZCK-LKTVYLICSA-N Ala-Glu-Trp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O YEVZMOUUZINZCK-LKTVYLICSA-N 0.000 description 1
- MPLOSMWGDNJSEV-WHFBIAKZSA-N Ala-Gly-Asp Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MPLOSMWGDNJSEV-WHFBIAKZSA-N 0.000 description 1
- LMFXXZPPZDCPTA-ZKWXMUAHSA-N Ala-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N LMFXXZPPZDCPTA-ZKWXMUAHSA-N 0.000 description 1
- KMGOBAQSCKTBGD-DLOVCJGASA-N Ala-His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CN=CN1 KMGOBAQSCKTBGD-DLOVCJGASA-N 0.000 description 1
- LXAARTARZJJCMB-CIQUZCHMSA-N Ala-Ile-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LXAARTARZJJCMB-CIQUZCHMSA-N 0.000 description 1
- HHRAXZAYZFFRAM-CIUDSAMLSA-N Ala-Leu-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O HHRAXZAYZFFRAM-CIUDSAMLSA-N 0.000 description 1
- SUMYEVXWCAYLLJ-GUBZILKMSA-N Ala-Leu-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O SUMYEVXWCAYLLJ-GUBZILKMSA-N 0.000 description 1
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 1
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 1
- RGQCNKIDEQJEBT-CQDKDKBSSA-N Ala-Leu-Tyr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 RGQCNKIDEQJEBT-CQDKDKBSSA-N 0.000 description 1
- AJBVYEYZVYPFCF-CIUDSAMLSA-N Ala-Lys-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O AJBVYEYZVYPFCF-CIUDSAMLSA-N 0.000 description 1
- IAUSCRHURCZUJP-CIUDSAMLSA-N Ala-Lys-Cys Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CS)C(O)=O IAUSCRHURCZUJP-CIUDSAMLSA-N 0.000 description 1
- PMQXMXAASGFUDX-SRVKXCTJSA-N Ala-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CCCCN PMQXMXAASGFUDX-SRVKXCTJSA-N 0.000 description 1
- VCSABYLVNWQYQE-SRVKXCTJSA-N Ala-Lys-Lys Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O VCSABYLVNWQYQE-SRVKXCTJSA-N 0.000 description 1
- BLTRAARCJYVJKV-QEJZJMRPSA-N Ala-Lys-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](Cc1ccccc1)C(O)=O BLTRAARCJYVJKV-QEJZJMRPSA-N 0.000 description 1
- NINQYGGNRIBFSC-CIUDSAMLSA-N Ala-Lys-Ser Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CO)C(O)=O NINQYGGNRIBFSC-CIUDSAMLSA-N 0.000 description 1
- MDNAVFBZPROEHO-DCAQKATOSA-N Ala-Lys-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MDNAVFBZPROEHO-DCAQKATOSA-N 0.000 description 1
- XUCHENWTTBFODJ-FXQIFTODSA-N Ala-Met-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O XUCHENWTTBFODJ-FXQIFTODSA-N 0.000 description 1
- IHRGVZXPTIQNIP-NAKRPEOUSA-N Ala-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](C)N IHRGVZXPTIQNIP-NAKRPEOUSA-N 0.000 description 1
- GKAZXNDATBWNBI-DCAQKATOSA-N Ala-Met-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)O)N GKAZXNDATBWNBI-DCAQKATOSA-N 0.000 description 1
- AWNAEZICPNGAJK-FXQIFTODSA-N Ala-Met-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O AWNAEZICPNGAJK-FXQIFTODSA-N 0.000 description 1
- GFEDXKNBZMPEDM-KZVJFYERSA-N Ala-Met-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GFEDXKNBZMPEDM-KZVJFYERSA-N 0.000 description 1
- 108010011667 Ala-Phe-Ala Proteins 0.000 description 1
- WEZNQZHACPSMEF-QEJZJMRPSA-N Ala-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 WEZNQZHACPSMEF-QEJZJMRPSA-N 0.000 description 1
- ADSGHMXEAZJJNF-DCAQKATOSA-N Ala-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N ADSGHMXEAZJJNF-DCAQKATOSA-N 0.000 description 1
- RMAWDDRDTRSZIR-ZLUOBGJFSA-N Ala-Ser-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RMAWDDRDTRSZIR-ZLUOBGJFSA-N 0.000 description 1
- YYAVDNKUWLAFCV-ACZMJKKPSA-N Ala-Ser-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O YYAVDNKUWLAFCV-ACZMJKKPSA-N 0.000 description 1
- DYXOFPBJBAHWFY-JBDRJPRFSA-N Ala-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N DYXOFPBJBAHWFY-JBDRJPRFSA-N 0.000 description 1
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 1
- NZGRHTKZFSVPAN-BIIVOSGPSA-N Ala-Ser-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N NZGRHTKZFSVPAN-BIIVOSGPSA-N 0.000 description 1
- OEVCHROQUIVQFZ-YTLHQDLWSA-N Ala-Thr-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](C)C(O)=O OEVCHROQUIVQFZ-YTLHQDLWSA-N 0.000 description 1
- SAHQGRZIQVEJPF-JXUBOQSCSA-N Ala-Thr-Lys Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCCN SAHQGRZIQVEJPF-JXUBOQSCSA-N 0.000 description 1
- KTXKIYXZQFWJKB-VZFHVOOUSA-N Ala-Thr-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O KTXKIYXZQFWJKB-VZFHVOOUSA-N 0.000 description 1
- MRXZVZVKYZELRU-UHFFFAOYSA-N Ala-Trp-Ser-Ser Chemical compound C1=CC=C2C(CC(NC(=O)C(N)C)C(=O)NC(CO)C(=O)NC(CO)C(O)=O)=CNC2=C1 MRXZVZVKYZELRU-UHFFFAOYSA-N 0.000 description 1
- MTDDMSUUXNQMKK-BPNCWPANSA-N Ala-Tyr-Arg Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N MTDDMSUUXNQMKK-BPNCWPANSA-N 0.000 description 1
- XSLGWYYNOSUMRM-ZKWXMUAHSA-N Ala-Val-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XSLGWYYNOSUMRM-ZKWXMUAHSA-N 0.000 description 1
- BVLPIIBTWIYOML-ZKWXMUAHSA-N Ala-Val-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BVLPIIBTWIYOML-ZKWXMUAHSA-N 0.000 description 1
- VHAQSYHSDKERBS-XPUUQOCRSA-N Ala-Val-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O VHAQSYHSDKERBS-XPUUQOCRSA-N 0.000 description 1
- DHONNEYAZPNGSG-UBHSHLNASA-N Ala-Val-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 DHONNEYAZPNGSG-UBHSHLNASA-N 0.000 description 1
- OMSKGWFGWCQFBD-KZVJFYERSA-N Ala-Val-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OMSKGWFGWCQFBD-KZVJFYERSA-N 0.000 description 1
- 108020003566 Antisense Oligodeoxyribonucleotides Proteins 0.000 description 1
- 241000219194 Arabidopsis Species 0.000 description 1
- 101100214584 Arabidopsis thaliana 4CL1 gene Proteins 0.000 description 1
- 101100490194 Arabidopsis thaliana ACL5 gene Proteins 0.000 description 1
- 101100366322 Arabidopsis thaliana ADC1 gene Proteins 0.000 description 1
- 101100366333 Arabidopsis thaliana ADC2 gene Proteins 0.000 description 1
- 101100149444 Arabidopsis thaliana SHT gene Proteins 0.000 description 1
- 101000874385 Arabidopsis thaliana Serine carboxypeptidase-like 19 Proteins 0.000 description 1
- 101000881210 Arabidopsis thaliana Spermine synthase Proteins 0.000 description 1
- OOBVTWHLKYJFJH-FXQIFTODSA-N Arg-Ala-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O OOBVTWHLKYJFJH-FXQIFTODSA-N 0.000 description 1
- DFCIPNHFKOQAME-FXQIFTODSA-N Arg-Ala-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O DFCIPNHFKOQAME-FXQIFTODSA-N 0.000 description 1
- PEFFAAKJGBZBKL-NAKRPEOUSA-N Arg-Ala-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PEFFAAKJGBZBKL-NAKRPEOUSA-N 0.000 description 1
- VWVPYNGMOCSSGK-GUBZILKMSA-N Arg-Arg-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O VWVPYNGMOCSSGK-GUBZILKMSA-N 0.000 description 1
- UXJCMQFPDWCHKX-DCAQKATOSA-N Arg-Arg-Glu Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UXJCMQFPDWCHKX-DCAQKATOSA-N 0.000 description 1
- MAISCYVJLBBRNU-DCAQKATOSA-N Arg-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N MAISCYVJLBBRNU-DCAQKATOSA-N 0.000 description 1
- GHNDBBVSWOWYII-LPEHRKFASA-N Arg-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O GHNDBBVSWOWYII-LPEHRKFASA-N 0.000 description 1
- RWCLSUOSKWTXLA-FXQIFTODSA-N Arg-Asp-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RWCLSUOSKWTXLA-FXQIFTODSA-N 0.000 description 1
- PQWTZSNVWSOFFK-FXQIFTODSA-N Arg-Asp-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)CN=C(N)N PQWTZSNVWSOFFK-FXQIFTODSA-N 0.000 description 1
- OZNSCVPYWZRQPY-CIUDSAMLSA-N Arg-Asp-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O OZNSCVPYWZRQPY-CIUDSAMLSA-N 0.000 description 1
- YSUVMPICYVWRBX-VEVYYDQMSA-N Arg-Asp-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YSUVMPICYVWRBX-VEVYYDQMSA-N 0.000 description 1
- DQNLFLGFZAUIOW-FXQIFTODSA-N Arg-Cys-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O DQNLFLGFZAUIOW-FXQIFTODSA-N 0.000 description 1
- YHQGEARSFILVHL-HJGDQZAQSA-N Arg-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N)O YHQGEARSFILVHL-HJGDQZAQSA-N 0.000 description 1
- OHYQKYUTLIPFOX-ZPFDUUQYSA-N Arg-Glu-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OHYQKYUTLIPFOX-ZPFDUUQYSA-N 0.000 description 1
- UFBURHXMKFQVLM-CIUDSAMLSA-N Arg-Glu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O UFBURHXMKFQVLM-CIUDSAMLSA-N 0.000 description 1
- AQPVUEJJARLJHB-BQBZGAKWSA-N Arg-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N AQPVUEJJARLJHB-BQBZGAKWSA-N 0.000 description 1
- HQIZDMIGUJOSNI-IUCAKERBSA-N Arg-Gly-Arg Chemical compound N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O HQIZDMIGUJOSNI-IUCAKERBSA-N 0.000 description 1
- QKSAZKCRVQYYGS-UWVGGRQHSA-N Arg-Gly-His Chemical compound N[C@@H](CCCN=C(N)N)C(=O)NCC(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O QKSAZKCRVQYYGS-UWVGGRQHSA-N 0.000 description 1
- ZZZWQALDSQQBEW-STQMWFEESA-N Arg-Gly-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZZZWQALDSQQBEW-STQMWFEESA-N 0.000 description 1
- ZJEDSBGPBXVBMP-PYJNHQTQSA-N Arg-His-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZJEDSBGPBXVBMP-PYJNHQTQSA-N 0.000 description 1
- FRMQITGHXMUNDF-GMOBBJLQSA-N Arg-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FRMQITGHXMUNDF-GMOBBJLQSA-N 0.000 description 1
- AGVNTAUPLWIQEN-ZPFDUUQYSA-N Arg-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N AGVNTAUPLWIQEN-ZPFDUUQYSA-N 0.000 description 1
- LVMUGODRNHFGRA-AVGNSLFASA-N Arg-Leu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O LVMUGODRNHFGRA-AVGNSLFASA-N 0.000 description 1
- YVTHEZNOKSAWRW-DCAQKATOSA-N Arg-Lys-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O YVTHEZNOKSAWRW-DCAQKATOSA-N 0.000 description 1
- BNYNOWJESJJIOI-XUXIUFHCSA-N Arg-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCN=C(N)N)N BNYNOWJESJJIOI-XUXIUFHCSA-N 0.000 description 1
- XUGATJVGQUGQKY-ULQDDVLXSA-N Arg-Lys-Phe Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XUGATJVGQUGQKY-ULQDDVLXSA-N 0.000 description 1
- NPAVRDPEFVKELR-DCAQKATOSA-N Arg-Lys-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NPAVRDPEFVKELR-DCAQKATOSA-N 0.000 description 1
- RIQBRKVTFBWEDY-RHYQMDGZSA-N Arg-Lys-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RIQBRKVTFBWEDY-RHYQMDGZSA-N 0.000 description 1
- VIINVRPKMUZYOI-DCAQKATOSA-N Arg-Met-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O VIINVRPKMUZYOI-DCAQKATOSA-N 0.000 description 1
- NIELFHOLFTUZME-HJWJTTGWSA-N Arg-Phe-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NIELFHOLFTUZME-HJWJTTGWSA-N 0.000 description 1
- UGZUVYDKAYNCII-ULQDDVLXSA-N Arg-Phe-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UGZUVYDKAYNCII-ULQDDVLXSA-N 0.000 description 1
- LXMKTIZAGIBQRX-HRCADAONSA-N Arg-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O LXMKTIZAGIBQRX-HRCADAONSA-N 0.000 description 1
- ATABBWFGOHKROJ-GUBZILKMSA-N Arg-Pro-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O ATABBWFGOHKROJ-GUBZILKMSA-N 0.000 description 1
- VENMDXUVHSKEIN-GUBZILKMSA-N Arg-Ser-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VENMDXUVHSKEIN-GUBZILKMSA-N 0.000 description 1
- ISJWBVIYRBAXEB-CIUDSAMLSA-N Arg-Ser-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O ISJWBVIYRBAXEB-CIUDSAMLSA-N 0.000 description 1
- PJOPLXOCKACMLK-KKUMJFAQSA-N Arg-Tyr-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O PJOPLXOCKACMLK-KKUMJFAQSA-N 0.000 description 1
- LFWOQHSQNCKXRU-UFYCRDLUSA-N Arg-Tyr-Phe Chemical compound C([C@H](NC(=O)[C@H](CCCN=C(N)N)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 LFWOQHSQNCKXRU-UFYCRDLUSA-N 0.000 description 1
- AKEBUSZTMQLNIX-UWJYBYFXSA-N Asn-Ala-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N AKEBUSZTMQLNIX-UWJYBYFXSA-N 0.000 description 1
- JEPNYDRDYNSFIU-QXEWZRGKSA-N Asn-Arg-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(N)=O)C(O)=O JEPNYDRDYNSFIU-QXEWZRGKSA-N 0.000 description 1
- ACRYGQFHAQHDSF-ZLUOBGJFSA-N Asn-Asn-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ACRYGQFHAQHDSF-ZLUOBGJFSA-N 0.000 description 1
- PCKRJVZAQZWNKM-WHFBIAKZSA-N Asn-Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O PCKRJVZAQZWNKM-WHFBIAKZSA-N 0.000 description 1
- IOTKDTZEEBZNCM-UGYAYLCHSA-N Asn-Asn-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O IOTKDTZEEBZNCM-UGYAYLCHSA-N 0.000 description 1
- NLCDVZJDEXIDDL-BIIVOSGPSA-N Asn-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N)C(=O)O NLCDVZJDEXIDDL-BIIVOSGPSA-N 0.000 description 1
- BHQQRVARKXWXPP-ACZMJKKPSA-N Asn-Asp-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N BHQQRVARKXWXPP-ACZMJKKPSA-N 0.000 description 1
- ZDOQDYFZNGASEY-BIIVOSGPSA-N Asn-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N)C(=O)O ZDOQDYFZNGASEY-BIIVOSGPSA-N 0.000 description 1
- IYVSIZAXNLOKFQ-BYULHYEWSA-N Asn-Asp-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IYVSIZAXNLOKFQ-BYULHYEWSA-N 0.000 description 1
- HLTLEIXYIJDFOY-ZLUOBGJFSA-N Asn-Cys-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O HLTLEIXYIJDFOY-ZLUOBGJFSA-N 0.000 description 1
- SPIPSJXLZVTXJL-ZLUOBGJFSA-N Asn-Cys-Ser Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O SPIPSJXLZVTXJL-ZLUOBGJFSA-N 0.000 description 1
- PQAIOUVVZCOLJK-FXQIFTODSA-N Asn-Gln-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N PQAIOUVVZCOLJK-FXQIFTODSA-N 0.000 description 1
- FUHFYEKSGWOWGZ-XHNCKOQMSA-N Asn-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N)C(=O)O FUHFYEKSGWOWGZ-XHNCKOQMSA-N 0.000 description 1
- JREOBWLIZLXRIS-GUBZILKMSA-N Asn-Glu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JREOBWLIZLXRIS-GUBZILKMSA-N 0.000 description 1
- OPEPUCYIGFEGSW-WDSKDSINSA-N Asn-Gly-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OPEPUCYIGFEGSW-WDSKDSINSA-N 0.000 description 1
- HYQYLOSCICEYTR-YUMQZZPRSA-N Asn-Gly-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O HYQYLOSCICEYTR-YUMQZZPRSA-N 0.000 description 1
- FTCGGKNCJZOPNB-WHFBIAKZSA-N Asn-Gly-Ser Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FTCGGKNCJZOPNB-WHFBIAKZSA-N 0.000 description 1
- IKLAUGBIDCDFOY-SRVKXCTJSA-N Asn-His-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O IKLAUGBIDCDFOY-SRVKXCTJSA-N 0.000 description 1
- JGIAYNNXZKKKOW-KKUMJFAQSA-N Asn-His-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC(=O)N)N JGIAYNNXZKKKOW-KKUMJFAQSA-N 0.000 description 1
- OLISTMZJGQUOGS-GMOBBJLQSA-N Asn-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N OLISTMZJGQUOGS-GMOBBJLQSA-N 0.000 description 1
- NVWJMQNYLYWVNQ-BYULHYEWSA-N Asn-Ile-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O NVWJMQNYLYWVNQ-BYULHYEWSA-N 0.000 description 1
- SPCONPVIDFMDJI-QSFUFRPTSA-N Asn-Ile-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O SPCONPVIDFMDJI-QSFUFRPTSA-N 0.000 description 1
- NLRJGXZWTKXRHP-DCAQKATOSA-N Asn-Leu-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NLRJGXZWTKXRHP-DCAQKATOSA-N 0.000 description 1
- ALKWEXBKAHPJAQ-NAKRPEOUSA-N Asn-Leu-Asp-Asp Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O ALKWEXBKAHPJAQ-NAKRPEOUSA-N 0.000 description 1
- HDHZCEDPLTVHFZ-GUBZILKMSA-N Asn-Leu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O HDHZCEDPLTVHFZ-GUBZILKMSA-N 0.000 description 1
- BZWRLDPIWKOVKB-ZPFDUUQYSA-N Asn-Leu-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BZWRLDPIWKOVKB-ZPFDUUQYSA-N 0.000 description 1
- GLWFAWNYGWBMOC-SRVKXCTJSA-N Asn-Leu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GLWFAWNYGWBMOC-SRVKXCTJSA-N 0.000 description 1
- TZFQICWZWFNIKU-KKUMJFAQSA-N Asn-Leu-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 TZFQICWZWFNIKU-KKUMJFAQSA-N 0.000 description 1
- NLDNNZKUSLAYFW-NHCYSSNCSA-N Asn-Lys-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O NLDNNZKUSLAYFW-NHCYSSNCSA-N 0.000 description 1
- BKZFBJYIVSBXCO-KKUMJFAQSA-N Asn-Phe-His Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC=N1)C(O)=O BKZFBJYIVSBXCO-KKUMJFAQSA-N 0.000 description 1
- PLTGTJAZQRGMPP-FXQIFTODSA-N Asn-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC(N)=O PLTGTJAZQRGMPP-FXQIFTODSA-N 0.000 description 1
- JTXVXGXTRXMOFJ-FXQIFTODSA-N Asn-Pro-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O JTXVXGXTRXMOFJ-FXQIFTODSA-N 0.000 description 1
- GKKUBLFXKRDMFC-BQBZGAKWSA-N Asn-Pro-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O GKKUBLFXKRDMFC-BQBZGAKWSA-N 0.000 description 1
- VWADICJNCPFKJS-ZLUOBGJFSA-N Asn-Ser-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O VWADICJNCPFKJS-ZLUOBGJFSA-N 0.000 description 1
- JWQWPRCDYWNVNM-ACZMJKKPSA-N Asn-Ser-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N JWQWPRCDYWNVNM-ACZMJKKPSA-N 0.000 description 1
- NPZJLGMWMDNQDD-GHCJXIJMSA-N Asn-Ser-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NPZJLGMWMDNQDD-GHCJXIJMSA-N 0.000 description 1
- MKJBPDLENBUHQU-CIUDSAMLSA-N Asn-Ser-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O MKJBPDLENBUHQU-CIUDSAMLSA-N 0.000 description 1
- JXMREEPBRANWBY-VEVYYDQMSA-N Asn-Thr-Arg Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JXMREEPBRANWBY-VEVYYDQMSA-N 0.000 description 1
- YHXNKGKUDJCAHB-PBCZWWQYSA-N Asn-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O YHXNKGKUDJCAHB-PBCZWWQYSA-N 0.000 description 1
- XIDSGDJNUJRUHE-VEVYYDQMSA-N Asn-Thr-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O XIDSGDJNUJRUHE-VEVYYDQMSA-N 0.000 description 1
- PIABYSIYPGLLDQ-XVSYOHENSA-N Asn-Thr-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PIABYSIYPGLLDQ-XVSYOHENSA-N 0.000 description 1
- JPPLRQVZMZFOSX-UWJYBYFXSA-N Asn-Tyr-Ala Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=C(O)C=C1 JPPLRQVZMZFOSX-UWJYBYFXSA-N 0.000 description 1
- SKQTXVZTCGSRJS-SRVKXCTJSA-N Asn-Tyr-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O SKQTXVZTCGSRJS-SRVKXCTJSA-N 0.000 description 1
- BEHQTVDBCLSCBY-CFMVVWHZSA-N Asn-Tyr-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BEHQTVDBCLSCBY-CFMVVWHZSA-N 0.000 description 1
- MYRLSKYSMXNLLA-LAEOZQHASA-N Asn-Val-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O MYRLSKYSMXNLLA-LAEOZQHASA-N 0.000 description 1
- CBHVAFXKOYAHOY-NHCYSSNCSA-N Asn-Val-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O CBHVAFXKOYAHOY-NHCYSSNCSA-N 0.000 description 1
- KBQOUDLMWYWXNP-YDHLFZDLSA-N Asn-Val-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC(=O)N)N KBQOUDLMWYWXNP-YDHLFZDLSA-N 0.000 description 1
- XOQYDFCQPWAMSA-KKHAAJSZSA-N Asn-Val-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOQYDFCQPWAMSA-KKHAAJSZSA-N 0.000 description 1
- KRXIWXCXOARFNT-ZLUOBGJFSA-N Asp-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O KRXIWXCXOARFNT-ZLUOBGJFSA-N 0.000 description 1
- XBQSLMACWDXWLJ-GHCJXIJMSA-N Asp-Ala-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XBQSLMACWDXWLJ-GHCJXIJMSA-N 0.000 description 1
- PBVLJOIPOGUQQP-CIUDSAMLSA-N Asp-Ala-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O PBVLJOIPOGUQQP-CIUDSAMLSA-N 0.000 description 1
- VPPXTHJNTYDNFJ-CIUDSAMLSA-N Asp-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N VPPXTHJNTYDNFJ-CIUDSAMLSA-N 0.000 description 1
- NECWUSYTYSIFNC-DLOVCJGASA-N Asp-Ala-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 NECWUSYTYSIFNC-DLOVCJGASA-N 0.000 description 1
- KVMPVNGOKHTUHZ-GCJQMDKQSA-N Asp-Ala-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KVMPVNGOKHTUHZ-GCJQMDKQSA-N 0.000 description 1
- IXIWEFWRKIUMQX-DCAQKATOSA-N Asp-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(O)=O IXIWEFWRKIUMQX-DCAQKATOSA-N 0.000 description 1
- SDHFVYLZFBDSQT-DCAQKATOSA-N Asp-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N SDHFVYLZFBDSQT-DCAQKATOSA-N 0.000 description 1
- ZELQAFZSJOBEQS-ACZMJKKPSA-N Asp-Asn-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZELQAFZSJOBEQS-ACZMJKKPSA-N 0.000 description 1
- JDHOJQJMWBKHDB-CIUDSAMLSA-N Asp-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N JDHOJQJMWBKHDB-CIUDSAMLSA-N 0.000 description 1
- WCFCYFDBMNFSPA-ACZMJKKPSA-N Asp-Asp-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(O)=O WCFCYFDBMNFSPA-ACZMJKKPSA-N 0.000 description 1
- FANQWNCPNFEPGZ-WHFBIAKZSA-N Asp-Asp-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O FANQWNCPNFEPGZ-WHFBIAKZSA-N 0.000 description 1
- SBHUBSDEZQFJHJ-CIUDSAMLSA-N Asp-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O SBHUBSDEZQFJHJ-CIUDSAMLSA-N 0.000 description 1
- LKIYSIYBKYLKPU-BIIVOSGPSA-N Asp-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N)C(=O)O LKIYSIYBKYLKPU-BIIVOSGPSA-N 0.000 description 1
- QXHVOUSPVAWEMX-ZLUOBGJFSA-N Asp-Asp-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXHVOUSPVAWEMX-ZLUOBGJFSA-N 0.000 description 1
- SPKRHJOVRVDJGG-CIUDSAMLSA-N Asp-Gln-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N SPKRHJOVRVDJGG-CIUDSAMLSA-N 0.000 description 1
- ZSJFGGSPCCHMNE-LAEOZQHASA-N Asp-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N ZSJFGGSPCCHMNE-LAEOZQHASA-N 0.000 description 1
- VAWNQIGQPUOPQW-ACZMJKKPSA-N Asp-Glu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O VAWNQIGQPUOPQW-ACZMJKKPSA-N 0.000 description 1
- PDECQIHABNQRHN-GUBZILKMSA-N Asp-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(O)=O PDECQIHABNQRHN-GUBZILKMSA-N 0.000 description 1
- OVPHVTCDVYYTHN-AVGNSLFASA-N Asp-Glu-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OVPHVTCDVYYTHN-AVGNSLFASA-N 0.000 description 1
- YDJVIBMKAMQPPP-LAEOZQHASA-N Asp-Glu-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O YDJVIBMKAMQPPP-LAEOZQHASA-N 0.000 description 1
- YNCHFVRXEQFPBY-BQBZGAKWSA-N Asp-Gly-Arg Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N YNCHFVRXEQFPBY-BQBZGAKWSA-N 0.000 description 1
- QCVXMEHGFUMKCO-YUMQZZPRSA-N Asp-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O QCVXMEHGFUMKCO-YUMQZZPRSA-N 0.000 description 1
- SNDBKTFJWVEVPO-WHFBIAKZSA-N Asp-Gly-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SNDBKTFJWVEVPO-WHFBIAKZSA-N 0.000 description 1
- HOBNTSHITVVNBN-ZPFDUUQYSA-N Asp-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N HOBNTSHITVVNBN-ZPFDUUQYSA-N 0.000 description 1
- PYXXJFRXIYAESU-PCBIJLKTSA-N Asp-Ile-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PYXXJFRXIYAESU-PCBIJLKTSA-N 0.000 description 1
- JNNVNVRBYUJYGS-CIUDSAMLSA-N Asp-Leu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O JNNVNVRBYUJYGS-CIUDSAMLSA-N 0.000 description 1
- SCQIQCWLOMOEFP-DCAQKATOSA-N Asp-Leu-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O SCQIQCWLOMOEFP-DCAQKATOSA-N 0.000 description 1
- CLUMZOKVGUWUFD-CIUDSAMLSA-N Asp-Leu-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O CLUMZOKVGUWUFD-CIUDSAMLSA-N 0.000 description 1
- CJUKAWUWBZCTDQ-SRVKXCTJSA-N Asp-Leu-Lys Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O CJUKAWUWBZCTDQ-SRVKXCTJSA-N 0.000 description 1
- UMHUHHJMEXNSIV-CIUDSAMLSA-N Asp-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UMHUHHJMEXNSIV-CIUDSAMLSA-N 0.000 description 1
- QNMKWNONJGKJJC-NHCYSSNCSA-N Asp-Leu-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O QNMKWNONJGKJJC-NHCYSSNCSA-N 0.000 description 1
- DONWIPDSZZJHHK-HJGDQZAQSA-N Asp-Lys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N)O DONWIPDSZZJHHK-HJGDQZAQSA-N 0.000 description 1
- RXBGWGRSWXOBGK-KKUMJFAQSA-N Asp-Lys-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RXBGWGRSWXOBGK-KKUMJFAQSA-N 0.000 description 1
- MYLZFUMPZCPJCJ-NHCYSSNCSA-N Asp-Lys-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MYLZFUMPZCPJCJ-NHCYSSNCSA-N 0.000 description 1
- XFQOQUWGVCVYON-DCAQKATOSA-N Asp-Met-His Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 XFQOQUWGVCVYON-DCAQKATOSA-N 0.000 description 1
- HXVILZUZXFLVEN-DCAQKATOSA-N Asp-Met-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O HXVILZUZXFLVEN-DCAQKATOSA-N 0.000 description 1
- BPTFNDRZKBFMTH-DCAQKATOSA-N Asp-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N BPTFNDRZKBFMTH-DCAQKATOSA-N 0.000 description 1
- YRZIYQGXTSBRLT-AVGNSLFASA-N Asp-Phe-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O YRZIYQGXTSBRLT-AVGNSLFASA-N 0.000 description 1
- JUWISGAGWSDGDH-KKUMJFAQSA-N Asp-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(O)=O)CC1=CC=CC=C1 JUWISGAGWSDGDH-KKUMJFAQSA-N 0.000 description 1
- RPUYTJJZXQBWDT-SRVKXCTJSA-N Asp-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N RPUYTJJZXQBWDT-SRVKXCTJSA-N 0.000 description 1
- ZKAOJVJQGVUIIU-GUBZILKMSA-N Asp-Pro-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ZKAOJVJQGVUIIU-GUBZILKMSA-N 0.000 description 1
- AHWRSSLYSGLBGD-CIUDSAMLSA-N Asp-Pro-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O AHWRSSLYSGLBGD-CIUDSAMLSA-N 0.000 description 1
- FAUPLTGRUBTXNU-FXQIFTODSA-N Asp-Pro-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O FAUPLTGRUBTXNU-FXQIFTODSA-N 0.000 description 1
- BRRPVTUFESPTCP-ACZMJKKPSA-N Asp-Ser-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O BRRPVTUFESPTCP-ACZMJKKPSA-N 0.000 description 1
- DRCOAZZDQRCGGP-GHCJXIJMSA-N Asp-Ser-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DRCOAZZDQRCGGP-GHCJXIJMSA-N 0.000 description 1
- OZBXOELNJBSJOA-UBHSHLNASA-N Asp-Ser-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)O)N OZBXOELNJBSJOA-UBHSHLNASA-N 0.000 description 1
- QOCFFCUFZGDHTP-NUMRIWBASA-N Asp-Thr-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O QOCFFCUFZGDHTP-NUMRIWBASA-N 0.000 description 1
- ITGFVUYOLWBPQW-KKHAAJSZSA-N Asp-Thr-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O ITGFVUYOLWBPQW-KKHAAJSZSA-N 0.000 description 1
- OTKUAVXGMREHRX-CFMVVWHZSA-N Asp-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(O)=O)CC1=CC=C(O)C=C1 OTKUAVXGMREHRX-CFMVVWHZSA-N 0.000 description 1
- XWKPSMRPIKKDDU-RCOVLWMOSA-N Asp-Val-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O XWKPSMRPIKKDDU-RCOVLWMOSA-N 0.000 description 1
- GGBQDSHTXKQSLP-NHCYSSNCSA-N Asp-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N GGBQDSHTXKQSLP-NHCYSSNCSA-N 0.000 description 1
- 241000228212 Aspergillus Species 0.000 description 1
- 241000223651 Aureobasidium Species 0.000 description 1
- 101000950981 Bacillus subtilis (strain 168) Catabolic NAD-specific glutamate dehydrogenase RocG Proteins 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 235000021357 Behenic acid Nutrition 0.000 description 1
- YWJXCIXBAKGUKZ-HJJNZUOJSA-N Bergenin Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@H]2C3=C(O)C(OC)=C(O)C=C3C(=O)O[C@@H]21 YWJXCIXBAKGUKZ-HJJNZUOJSA-N 0.000 description 1
- XULPLJSODQQHPH-UHFFFAOYSA-N Bergenin Natural products OCC1OC2C(OC(=O)c3cc(O)c(CO)c(O)c23)C(O)C1O XULPLJSODQQHPH-UHFFFAOYSA-N 0.000 description 1
- 102100021277 Beta-secretase 2 Human genes 0.000 description 1
- 101710150190 Beta-secretase 2 Proteins 0.000 description 1
- 241000607159 Blastochloris Species 0.000 description 1
- DPUOLQHDNGRHBS-UHFFFAOYSA-N Brassidinsaeure Natural products CCCCCCCCC=CCCCCCCCCCCCC(O)=O DPUOLQHDNGRHBS-UHFFFAOYSA-N 0.000 description 1
- 241000722885 Brettanomyces Species 0.000 description 1
- KSSJBGNOJJETTC-UHFFFAOYSA-N COC1=C(C=CC=C1)N(C1=CC=2C3(C4=CC(=CC=C4C=2C=C1)N(C1=CC=C(C=C1)OC)C1=C(C=CC=C1)OC)C1=CC(=CC=C1C=1C=CC(=CC=13)N(C1=CC=C(C=C1)OC)C1=C(C=CC=C1)OC)N(C1=CC=C(C=C1)OC)C1=C(C=CC=C1)OC)C1=CC=C(C=C1)OC Chemical compound COC1=C(C=CC=C1)N(C1=CC=2C3(C4=CC(=CC=C4C=2C=C1)N(C1=CC=C(C=C1)OC)C1=C(C=CC=C1)OC)C1=CC(=CC=C1C=1C=CC(=CC=13)N(C1=CC=C(C=C1)OC)C1=C(C=CC=C1)OC)N(C1=CC=C(C=C1)OC)C1=C(C=CC=C1)OC)C1=CC=C(C=C1)OC KSSJBGNOJJETTC-UHFFFAOYSA-N 0.000 description 1
- 208000025721 COVID-19 Diseases 0.000 description 1
- PZIRUHCJZBGLDY-UHFFFAOYSA-N Caffeoylquinic acid Natural products CC(CCC(=O)C(C)C1C(=O)CC2C3CC(O)C4CC(O)CCC4(C)C3CCC12C)C(=O)O PZIRUHCJZBGLDY-UHFFFAOYSA-N 0.000 description 1
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 1
- 239000005632 Capric acid (CAS 334-48-5) Substances 0.000 description 1
- 239000005635 Caprylic acid (CAS 124-07-2) Substances 0.000 description 1
- 108090000994 Catalytic RNA Proteins 0.000 description 1
- 102000053642 Catalytic RNA Human genes 0.000 description 1
- YDDGKXBLOXEEMN-IABMMNSOSA-L Chicoric acid Natural products C1=C(O)C(O)=CC=C1\C=C\C(=O)O[C@@H](C([O-])=O)[C@H](C([O-])=O)OC(=O)\C=C\C1=CC=C(O)C(O)=C1 YDDGKXBLOXEEMN-IABMMNSOSA-L 0.000 description 1
- WBYWAXJHAXSJNI-SREVYHEPSA-N Cinnamic acid Chemical compound OC(=O)\C=C/C1=CC=CC=C1 WBYWAXJHAXSJNI-SREVYHEPSA-N 0.000 description 1
- 108020004638 Circular DNA Proteins 0.000 description 1
- 241001247414 Couma Species 0.000 description 1
- 241001527609 Cryptococcus Species 0.000 description 1
- CEZSLNCYQUFOSL-BQBZGAKWSA-N Cys-Arg-Gly Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O CEZSLNCYQUFOSL-BQBZGAKWSA-N 0.000 description 1
- MBPKYKSYUAPLMY-DCAQKATOSA-N Cys-Arg-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O MBPKYKSYUAPLMY-DCAQKATOSA-N 0.000 description 1
- VNLYIYOYUNGURO-ZLUOBGJFSA-N Cys-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N VNLYIYOYUNGURO-ZLUOBGJFSA-N 0.000 description 1
- ZJBWJHQDOIMVLM-WHFBIAKZSA-N Cys-Cys-Gly Chemical compound SC[C@H](N)C(=O)N[C@@H](CS)C(=O)NCC(O)=O ZJBWJHQDOIMVLM-WHFBIAKZSA-N 0.000 description 1
- CFQVGYWKSLKWFX-KBIXCLLPSA-N Cys-Glu-Ile Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CFQVGYWKSLKWFX-KBIXCLLPSA-N 0.000 description 1
- BDWIZLQVVWQMTB-XKBZYTNZSA-N Cys-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CS)N)O BDWIZLQVVWQMTB-XKBZYTNZSA-N 0.000 description 1
- OXOQBEVULIBOSH-ZDLURKLDSA-N Cys-Gly-Thr Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O OXOQBEVULIBOSH-ZDLURKLDSA-N 0.000 description 1
- UXBYDFKFHMYYPL-XIRDDKMYSA-N Cys-His-Trp Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O UXBYDFKFHMYYPL-XIRDDKMYSA-N 0.000 description 1
- UVZFZTWNHOQWNK-NAKRPEOUSA-N Cys-Ile-Arg Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UVZFZTWNHOQWNK-NAKRPEOUSA-N 0.000 description 1
- ABLJDBFJPUWQQB-DCAQKATOSA-N Cys-Leu-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CS)N ABLJDBFJPUWQQB-DCAQKATOSA-N 0.000 description 1
- UCSXXFRXHGUXCQ-SRVKXCTJSA-N Cys-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CS)N UCSXXFRXHGUXCQ-SRVKXCTJSA-N 0.000 description 1
- OZHXXYOHPLLLMI-CIUDSAMLSA-N Cys-Lys-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O OZHXXYOHPLLLMI-CIUDSAMLSA-N 0.000 description 1
- MBRWOKXNHTUJMB-CIUDSAMLSA-N Cys-Pro-Glu Chemical compound [H]N[C@@H](CS)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O MBRWOKXNHTUJMB-CIUDSAMLSA-N 0.000 description 1
- CNAMJJOZGXPDHW-IHRRRGAJSA-N Cys-Pro-Phe Chemical compound N[C@@H](CS)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O CNAMJJOZGXPDHW-IHRRRGAJSA-N 0.000 description 1
- SWJYSDXMTPMBHO-FXQIFTODSA-N Cys-Pro-Ser Chemical compound [H]N[C@@H](CS)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O SWJYSDXMTPMBHO-FXQIFTODSA-N 0.000 description 1
- KVCJEMHFLGVINV-ZLUOBGJFSA-N Cys-Ser-Asn Chemical compound SC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(N)=O KVCJEMHFLGVINV-ZLUOBGJFSA-N 0.000 description 1
- IRDBEBCCTCNXGZ-AVGNSLFASA-N Cys-Tyr-Gln Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CS)N)O IRDBEBCCTCNXGZ-AVGNSLFASA-N 0.000 description 1
- QQAYIVHVRFJICE-AEJSXWLSSA-N Cys-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CS)N QQAYIVHVRFJICE-AEJSXWLSSA-N 0.000 description 1
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 1
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- XPDXVDYUQZHFPV-UHFFFAOYSA-N Dansyl Chloride Chemical compound C1=CC=C2C(N(C)C)=CC=CC2=C1S(Cl)(=O)=O XPDXVDYUQZHFPV-UHFFFAOYSA-N 0.000 description 1
- YDDGKXBLOXEEMN-UHFFFAOYSA-N Di-E-caffeoyl-meso-tartaric acid Natural products C=1C=C(O)C(O)=CC=1C=CC(=O)OC(C(O)=O)C(C(=O)O)OC(=O)C=CC1=CC=C(O)C(O)=C1 YDDGKXBLOXEEMN-UHFFFAOYSA-N 0.000 description 1
- AFSDNFLWKVMVRB-UHFFFAOYSA-N Ellagic acid Chemical compound OC1=C(O)C(OC2=O)=C3C4=C2C=C(O)C(O)=C4OC(=O)C3=C1 AFSDNFLWKVMVRB-UHFFFAOYSA-N 0.000 description 1
- ATJXMQHAMYVHRX-CPCISQLKSA-N Ellagic acid Natural products OC1=C(O)[C@H]2OC(=O)c3cc(O)c(O)c4OC(=O)C(=C1)[C@H]2c34 ATJXMQHAMYVHRX-CPCISQLKSA-N 0.000 description 1
- 229920002079 Ellagic acid Polymers 0.000 description 1
- 241001465321 Eremothecium Species 0.000 description 1
- URXZXNYJPAJJOQ-UHFFFAOYSA-N Erucic acid Natural products CCCCCCC=CCCCCCCCCCCCC(O)=O URXZXNYJPAJJOQ-UHFFFAOYSA-N 0.000 description 1
- 239000004262 Ethyl gallate Substances 0.000 description 1
- 239000001263 FEMA 3042 Substances 0.000 description 1
- INKFLNZBTSNFON-CIUDSAMLSA-N Gln-Ala-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O INKFLNZBTSNFON-CIUDSAMLSA-N 0.000 description 1
- MLZRSFQRBDNJON-GUBZILKMSA-N Gln-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MLZRSFQRBDNJON-GUBZILKMSA-N 0.000 description 1
- NUMFTVCBONFQIQ-DRZSPHRISA-N Gln-Ala-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O NUMFTVCBONFQIQ-DRZSPHRISA-N 0.000 description 1
- LTLXPHKSQQILNF-CIUDSAMLSA-N Gln-Arg-Cys Chemical compound C(C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)CN=C(N)N LTLXPHKSQQILNF-CIUDSAMLSA-N 0.000 description 1
- LZRMPXRYLLTAJX-GUBZILKMSA-N Gln-Arg-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O LZRMPXRYLLTAJX-GUBZILKMSA-N 0.000 description 1
- JFOKLAPFYCTNHW-SRVKXCTJSA-N Gln-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)N)N JFOKLAPFYCTNHW-SRVKXCTJSA-N 0.000 description 1
- PHZYLYASFWHLHJ-FXQIFTODSA-N Gln-Asn-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PHZYLYASFWHLHJ-FXQIFTODSA-N 0.000 description 1
- GMGKDVVBSVVKCT-NUMRIWBASA-N Gln-Asn-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GMGKDVVBSVVKCT-NUMRIWBASA-N 0.000 description 1
- QYTKAVBFRUGYAU-ACZMJKKPSA-N Gln-Asp-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QYTKAVBFRUGYAU-ACZMJKKPSA-N 0.000 description 1
- CRRFJBGUGNNOCS-PEFMBERDSA-N Gln-Asp-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CRRFJBGUGNNOCS-PEFMBERDSA-N 0.000 description 1
- COYGBRTZEVWZBW-XKBZYTNZSA-N Gln-Cys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CCC(N)=O COYGBRTZEVWZBW-XKBZYTNZSA-N 0.000 description 1
- ZQPOVSJFBBETHQ-CIUDSAMLSA-N Gln-Glu-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZQPOVSJFBBETHQ-CIUDSAMLSA-N 0.000 description 1
- XSBGUANSZDGULP-IUCAKERBSA-N Gln-Gly-Lys Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CCCCN)C(O)=O XSBGUANSZDGULP-IUCAKERBSA-N 0.000 description 1
- ORYMMTRPKVTGSJ-XVKPBYJWSA-N Gln-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O ORYMMTRPKVTGSJ-XVKPBYJWSA-N 0.000 description 1
- DWDBJWAXPXXYLP-SRVKXCTJSA-N Gln-His-Arg Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N DWDBJWAXPXXYLP-SRVKXCTJSA-N 0.000 description 1
- HDUDGCZEOZEFOA-KBIXCLLPSA-N Gln-Ile-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CCC(=O)N)N HDUDGCZEOZEFOA-KBIXCLLPSA-N 0.000 description 1
- TWTWUBHEWQPMQW-ZPFDUUQYSA-N Gln-Ile-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWTWUBHEWQPMQW-ZPFDUUQYSA-N 0.000 description 1
- GIVHPCWYVWUUSG-HVTMNAMFSA-N Gln-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N GIVHPCWYVWUUSG-HVTMNAMFSA-N 0.000 description 1
- HYPVLWGNBIYTNA-GUBZILKMSA-N Gln-Leu-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HYPVLWGNBIYTNA-GUBZILKMSA-N 0.000 description 1
- LGIKBBLQVSWUGK-DCAQKATOSA-N Gln-Leu-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LGIKBBLQVSWUGK-DCAQKATOSA-N 0.000 description 1
- QKCZZAZNMMVICF-DCAQKATOSA-N Gln-Leu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O QKCZZAZNMMVICF-DCAQKATOSA-N 0.000 description 1
- CAXXTYYGFYTBPV-IUCAKERBSA-N Gln-Leu-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CAXXTYYGFYTBPV-IUCAKERBSA-N 0.000 description 1
- CELXWPDNIGWCJN-WDCWCFNPSA-N Gln-Lys-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CELXWPDNIGWCJN-WDCWCFNPSA-N 0.000 description 1
- QFXNFFZTMFHPST-DZKIICNBSA-N Gln-Phe-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCC(=O)N)N QFXNFFZTMFHPST-DZKIICNBSA-N 0.000 description 1
- MQJDLNRXBOELJW-KKUMJFAQSA-N Gln-Pro-Phe Chemical compound N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O MQJDLNRXBOELJW-KKUMJFAQSA-N 0.000 description 1
- UWMDGPFFTKDUIY-HJGDQZAQSA-N Gln-Pro-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O UWMDGPFFTKDUIY-HJGDQZAQSA-N 0.000 description 1
- KUBFPYIMAGXGBT-ACZMJKKPSA-N Gln-Ser-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KUBFPYIMAGXGBT-ACZMJKKPSA-N 0.000 description 1
- GHAXJVNBAKGWEJ-AVGNSLFASA-N Gln-Ser-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O GHAXJVNBAKGWEJ-AVGNSLFASA-N 0.000 description 1
- ICRKQMRFXYDYMK-LAEOZQHASA-N Gln-Val-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ICRKQMRFXYDYMK-LAEOZQHASA-N 0.000 description 1
- VDMABHYXBULDGN-LAEOZQHASA-N Gln-Val-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O VDMABHYXBULDGN-LAEOZQHASA-N 0.000 description 1
- ZFBBMCKQSNJZSN-AUTRQRHGSA-N Gln-Val-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZFBBMCKQSNJZSN-AUTRQRHGSA-N 0.000 description 1
- GJLXZITZLUUXMJ-NHCYSSNCSA-N Gln-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCC(=O)N)N GJLXZITZLUUXMJ-NHCYSSNCSA-N 0.000 description 1
- ZMXZGYLINVNTKH-DZKIICNBSA-N Gln-Val-Phe Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZMXZGYLINVNTKH-DZKIICNBSA-N 0.000 description 1
- HNAUFGBKJLTWQE-IFFSRLJSSA-N Gln-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCC(=O)N)N)O HNAUFGBKJLTWQE-IFFSRLJSSA-N 0.000 description 1
- SZXSSXUNOALWCH-ACZMJKKPSA-N Glu-Ala-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O SZXSSXUNOALWCH-ACZMJKKPSA-N 0.000 description 1
- LKDIBBOKUAASNP-FXQIFTODSA-N Glu-Ala-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LKDIBBOKUAASNP-FXQIFTODSA-N 0.000 description 1
- BPDVTFBJZNBHEU-HGNGGELXSA-N Glu-Ala-His Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 BPDVTFBJZNBHEU-HGNGGELXSA-N 0.000 description 1
- RLZBLVSJDFHDBL-KBIXCLLPSA-N Glu-Ala-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RLZBLVSJDFHDBL-KBIXCLLPSA-N 0.000 description 1
- ITYRYNUZHPNCIK-GUBZILKMSA-N Glu-Ala-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O ITYRYNUZHPNCIK-GUBZILKMSA-N 0.000 description 1
- ATRHMOJQJWPVBQ-DRZSPHRISA-N Glu-Ala-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ATRHMOJQJWPVBQ-DRZSPHRISA-N 0.000 description 1
- MXOODARRORARSU-ACZMJKKPSA-N Glu-Ala-Ser Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N MXOODARRORARSU-ACZMJKKPSA-N 0.000 description 1
- NCWOMXABNYEPLY-NRPADANISA-N Glu-Ala-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O NCWOMXABNYEPLY-NRPADANISA-N 0.000 description 1
- DIXKFOPPGWKZLY-CIUDSAMLSA-N Glu-Arg-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O DIXKFOPPGWKZLY-CIUDSAMLSA-N 0.000 description 1
- KKCUFHUTMKQQCF-SRVKXCTJSA-N Glu-Arg-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O KKCUFHUTMKQQCF-SRVKXCTJSA-N 0.000 description 1
- OJGLIOXAKGFFDW-SRVKXCTJSA-N Glu-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)O)N OJGLIOXAKGFFDW-SRVKXCTJSA-N 0.000 description 1
- SYDJILXOZNEEDK-XIRDDKMYSA-N Glu-Arg-Trp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O SYDJILXOZNEEDK-XIRDDKMYSA-N 0.000 description 1
- DYFJZDDQPNIPAB-NHCYSSNCSA-N Glu-Arg-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O DYFJZDDQPNIPAB-NHCYSSNCSA-N 0.000 description 1
- AKJRHDMTEJXTPV-ACZMJKKPSA-N Glu-Asn-Ala Chemical compound C[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O AKJRHDMTEJXTPV-ACZMJKKPSA-N 0.000 description 1
- JPHYJQHPILOKHC-ACZMJKKPSA-N Glu-Asp-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O JPHYJQHPILOKHC-ACZMJKKPSA-N 0.000 description 1
- JVSBYEDSSRZQGV-GUBZILKMSA-N Glu-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O JVSBYEDSSRZQGV-GUBZILKMSA-N 0.000 description 1
- GZWOBWMOMPFPCD-CIUDSAMLSA-N Glu-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N GZWOBWMOMPFPCD-CIUDSAMLSA-N 0.000 description 1
- PAQUJCSYVIBPLC-AVGNSLFASA-N Glu-Asp-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PAQUJCSYVIBPLC-AVGNSLFASA-N 0.000 description 1
- PKYAVRMYTBBRLS-FXQIFTODSA-N Glu-Cys-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(O)=O PKYAVRMYTBBRLS-FXQIFTODSA-N 0.000 description 1
- CGOHAEBMDSEKFB-FXQIFTODSA-N Glu-Glu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O CGOHAEBMDSEKFB-FXQIFTODSA-N 0.000 description 1
- BUZMZDDKFCSKOT-CIUDSAMLSA-N Glu-Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BUZMZDDKFCSKOT-CIUDSAMLSA-N 0.000 description 1
- LGYZYFFDELZWRS-DCAQKATOSA-N Glu-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O LGYZYFFDELZWRS-DCAQKATOSA-N 0.000 description 1
- IQACOVZVOMVILH-FXQIFTODSA-N Glu-Glu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O IQACOVZVOMVILH-FXQIFTODSA-N 0.000 description 1
- QJCKNLPMTPXXEM-AUTRQRHGSA-N Glu-Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O QJCKNLPMTPXXEM-AUTRQRHGSA-N 0.000 description 1
- LRPXYSGPOBVBEH-IUCAKERBSA-N Glu-Gly-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O LRPXYSGPOBVBEH-IUCAKERBSA-N 0.000 description 1
- VOORMNJKNBGYGK-YUMQZZPRSA-N Glu-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N VOORMNJKNBGYGK-YUMQZZPRSA-N 0.000 description 1
- OPAINBJQDQTGJY-JGVFFNPUSA-N Glu-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCC(=O)O)N)C(=O)O OPAINBJQDQTGJY-JGVFFNPUSA-N 0.000 description 1
- CXRWMMRLEMVSEH-PEFMBERDSA-N Glu-Ile-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CXRWMMRLEMVSEH-PEFMBERDSA-N 0.000 description 1
- LGYCLOCORAEQSZ-PEFMBERDSA-N Glu-Ile-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O LGYCLOCORAEQSZ-PEFMBERDSA-N 0.000 description 1
- VGUYMZGLJUJRBV-YVNDNENWSA-N Glu-Ile-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O VGUYMZGLJUJRBV-YVNDNENWSA-N 0.000 description 1
- INGJLBQKTRJLFO-UKJIMTQDSA-N Glu-Ile-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O INGJLBQKTRJLFO-UKJIMTQDSA-N 0.000 description 1
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 1
- IRXNJYPKBVERCW-DCAQKATOSA-N Glu-Leu-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IRXNJYPKBVERCW-DCAQKATOSA-N 0.000 description 1
- NWOUBJNMZDDGDT-AVGNSLFASA-N Glu-Leu-His Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 NWOUBJNMZDDGDT-AVGNSLFASA-N 0.000 description 1
- VGBSZQSKQRMLHD-MNXVOIDGSA-N Glu-Leu-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VGBSZQSKQRMLHD-MNXVOIDGSA-N 0.000 description 1
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 1
- GJBUAAAIZSRCDC-GVXVVHGQSA-N Glu-Leu-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O GJBUAAAIZSRCDC-GVXVVHGQSA-N 0.000 description 1
- OQXDUSZKISQQSS-GUBZILKMSA-N Glu-Lys-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O OQXDUSZKISQQSS-GUBZILKMSA-N 0.000 description 1
- SJJHXJDSNQJMMW-SRVKXCTJSA-N Glu-Lys-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O SJJHXJDSNQJMMW-SRVKXCTJSA-N 0.000 description 1
- UJMNFCAHLYKWOZ-DCAQKATOSA-N Glu-Lys-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O UJMNFCAHLYKWOZ-DCAQKATOSA-N 0.000 description 1
- OCJRHJZKGGSPRW-IUCAKERBSA-N Glu-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O OCJRHJZKGGSPRW-IUCAKERBSA-N 0.000 description 1
- HRBYTAIBKPNZKQ-AVGNSLFASA-N Glu-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(O)=O HRBYTAIBKPNZKQ-AVGNSLFASA-N 0.000 description 1
- QDMVXRNLOPTPIE-WDCWCFNPSA-N Glu-Lys-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QDMVXRNLOPTPIE-WDCWCFNPSA-N 0.000 description 1
- AQNYKMCFCCZEEL-JYJNAYRXSA-N Glu-Lys-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AQNYKMCFCCZEEL-JYJNAYRXSA-N 0.000 description 1
- ZWMYUDZLXAQHCK-CIUDSAMLSA-N Glu-Met-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O ZWMYUDZLXAQHCK-CIUDSAMLSA-N 0.000 description 1
- PMSMKNYRZCKVMC-DRZSPHRISA-N Glu-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCC(=O)O)N PMSMKNYRZCKVMC-DRZSPHRISA-N 0.000 description 1
- FQFWFZWOHOEVMZ-IHRRRGAJSA-N Glu-Phe-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O FQFWFZWOHOEVMZ-IHRRRGAJSA-N 0.000 description 1
- CHDWDBPJOZVZSE-KKUMJFAQSA-N Glu-Phe-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(O)=O CHDWDBPJOZVZSE-KKUMJFAQSA-N 0.000 description 1
- PAZQYODKOZHXGA-SRVKXCTJSA-N Glu-Pro-His Chemical compound N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O PAZQYODKOZHXGA-SRVKXCTJSA-N 0.000 description 1
- SYWCGQOIIARSIX-SRVKXCTJSA-N Glu-Pro-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O SYWCGQOIIARSIX-SRVKXCTJSA-N 0.000 description 1
- LPHGXOWFAXFCPX-KKUMJFAQSA-N Glu-Pro-Phe Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)O)N)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O LPHGXOWFAXFCPX-KKUMJFAQSA-N 0.000 description 1
- SWDNPSMMEWRNOH-HJGDQZAQSA-N Glu-Pro-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWDNPSMMEWRNOH-HJGDQZAQSA-N 0.000 description 1
- ALMBZBOCGSVSAI-ACZMJKKPSA-N Glu-Ser-Asn Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ALMBZBOCGSVSAI-ACZMJKKPSA-N 0.000 description 1
- SYAYROHMAIHWFB-KBIXCLLPSA-N Glu-Ser-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYAYROHMAIHWFB-KBIXCLLPSA-N 0.000 description 1
- BXSZPACYCMNKLS-AVGNSLFASA-N Glu-Ser-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BXSZPACYCMNKLS-AVGNSLFASA-N 0.000 description 1
- VNCNWQPIQYAMAK-ACZMJKKPSA-N Glu-Ser-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O VNCNWQPIQYAMAK-ACZMJKKPSA-N 0.000 description 1
- BDISFWMLMNBTGP-NUMRIWBASA-N Glu-Thr-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O BDISFWMLMNBTGP-NUMRIWBASA-N 0.000 description 1
- QCMVGXDELYMZET-GLLZPBPUSA-N Glu-Thr-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QCMVGXDELYMZET-GLLZPBPUSA-N 0.000 description 1
- RGJKYNUINKGPJN-RWRJDSDZSA-N Glu-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCC(=O)O)N RGJKYNUINKGPJN-RWRJDSDZSA-N 0.000 description 1
- MXJYXYDREQWUMS-XKBZYTNZSA-N Glu-Thr-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O MXJYXYDREQWUMS-XKBZYTNZSA-N 0.000 description 1
- DLISPGXMKZTWQG-IFFSRLJSSA-N Glu-Thr-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O DLISPGXMKZTWQG-IFFSRLJSSA-N 0.000 description 1
- QOOFKCCZZWTCEP-AVGNSLFASA-N Glu-Tyr-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O QOOFKCCZZWTCEP-AVGNSLFASA-N 0.000 description 1
- UUTGYDAKPISJAO-JYJNAYRXSA-N Glu-Tyr-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 UUTGYDAKPISJAO-JYJNAYRXSA-N 0.000 description 1
- HBMRTXJZQDVRFT-DZKIICNBSA-N Glu-Tyr-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O HBMRTXJZQDVRFT-DZKIICNBSA-N 0.000 description 1
- KIEICAOUSNYOLM-NRPADANISA-N Glu-Val-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O KIEICAOUSNYOLM-NRPADANISA-N 0.000 description 1
- YPHPEHMXOYTEQG-LAEOZQHASA-N Glu-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O YPHPEHMXOYTEQG-LAEOZQHASA-N 0.000 description 1
- SOYWRINXUSUWEQ-DLOVCJGASA-N Glu-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O SOYWRINXUSUWEQ-DLOVCJGASA-N 0.000 description 1
- 108030000852 Glutamate N-acetyltransferases Proteins 0.000 description 1
- 102000016901 Glutamate dehydrogenase Human genes 0.000 description 1
- 102100034009 Glutamate dehydrogenase 1, mitochondrial Human genes 0.000 description 1
- PYTZFYUXZZHOAD-WHFBIAKZSA-N Gly-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)CN PYTZFYUXZZHOAD-WHFBIAKZSA-N 0.000 description 1
- RLFSBAPJTYKSLG-WHFBIAKZSA-N Gly-Ala-Asp Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O RLFSBAPJTYKSLG-WHFBIAKZSA-N 0.000 description 1
- MZZSCEANQDPJER-ONGXEEELSA-N Gly-Ala-Phe Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MZZSCEANQDPJER-ONGXEEELSA-N 0.000 description 1
- CLODWIOAKCSBAN-BQBZGAKWSA-N Gly-Arg-Asp Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(O)=O)C(O)=O CLODWIOAKCSBAN-BQBZGAKWSA-N 0.000 description 1
- RJIVPOXLQFJRTG-LURJTMIESA-N Gly-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N RJIVPOXLQFJRTG-LURJTMIESA-N 0.000 description 1
- OCQUNKSFDYDXBG-QXEWZRGKSA-N Gly-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OCQUNKSFDYDXBG-QXEWZRGKSA-N 0.000 description 1
- OVSKVOOUFAKODB-UWVGGRQHSA-N Gly-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OVSKVOOUFAKODB-UWVGGRQHSA-N 0.000 description 1
- GGEJHJIXRBTJPD-BYPYZUCNSA-N Gly-Asn-Gly Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GGEJHJIXRBTJPD-BYPYZUCNSA-N 0.000 description 1
- GRIRDMVMJJDZKV-RCOVLWMOSA-N Gly-Asn-Val Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O GRIRDMVMJJDZKV-RCOVLWMOSA-N 0.000 description 1
- PMNHJLASAAWELO-FOHZUACHSA-N Gly-Asp-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PMNHJLASAAWELO-FOHZUACHSA-N 0.000 description 1
- CEXINUGNTZFNRY-BYPYZUCNSA-N Gly-Cys-Gly Chemical compound [NH3+]CC(=O)N[C@@H](CS)C(=O)NCC([O-])=O CEXINUGNTZFNRY-BYPYZUCNSA-N 0.000 description 1
- CQZDZKRHFWJXDF-WDSKDSINSA-N Gly-Gln-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)CN CQZDZKRHFWJXDF-WDSKDSINSA-N 0.000 description 1
- HDNXXTBKOJKWNN-WDSKDSINSA-N Gly-Glu-Asn Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O HDNXXTBKOJKWNN-WDSKDSINSA-N 0.000 description 1
- STVHDEHTKFXBJQ-LAEOZQHASA-N Gly-Glu-Ile Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O STVHDEHTKFXBJQ-LAEOZQHASA-N 0.000 description 1
- BEQGFMIBZFNROK-JGVFFNPUSA-N Gly-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)CN)C(=O)O BEQGFMIBZFNROK-JGVFFNPUSA-N 0.000 description 1
- JSNNHGHYGYMVCK-XVKPBYJWSA-N Gly-Glu-Val Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O JSNNHGHYGYMVCK-XVKPBYJWSA-N 0.000 description 1
- XMPXVJIDADUOQB-RCOVLWMOSA-N Gly-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C([O-])=O)NC(=O)CNC(=O)C[NH3+] XMPXVJIDADUOQB-RCOVLWMOSA-N 0.000 description 1
- KAJAOGBVWCYGHZ-JTQLQIEISA-N Gly-Gly-Phe Chemical compound [NH3+]CC(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KAJAOGBVWCYGHZ-JTQLQIEISA-N 0.000 description 1
- BUEFQXUHTUZXHR-LURJTMIESA-N Gly-Gly-Pro zwitterion Chemical compound NCC(=O)NCC(=O)N1CCC[C@H]1C(O)=O BUEFQXUHTUZXHR-LURJTMIESA-N 0.000 description 1
- ZKLYPEGLWFVRGF-IUCAKERBSA-N Gly-His-Gln Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZKLYPEGLWFVRGF-IUCAKERBSA-N 0.000 description 1
- ALOBJFDJTMQQPW-ONGXEEELSA-N Gly-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)CN ALOBJFDJTMQQPW-ONGXEEELSA-N 0.000 description 1
- HKSNHPVETYYJBK-LAEOZQHASA-N Gly-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)CN HKSNHPVETYYJBK-LAEOZQHASA-N 0.000 description 1
- AAHSHTLISQUZJL-QSFUFRPTSA-N Gly-Ile-Ile Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O AAHSHTLISQUZJL-QSFUFRPTSA-N 0.000 description 1
- BHPQOIPBLYJNAW-NGZCFLSTSA-N Gly-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN BHPQOIPBLYJNAW-NGZCFLSTSA-N 0.000 description 1
- SCWYHUQOOFRVHP-MBLNEYKQSA-N Gly-Ile-Thr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SCWYHUQOOFRVHP-MBLNEYKQSA-N 0.000 description 1
- NSTUFLGQJCOCDL-UWVGGRQHSA-N Gly-Leu-Arg Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NSTUFLGQJCOCDL-UWVGGRQHSA-N 0.000 description 1
- UUYBFNKHOCJCHT-VHSXEESVSA-N Gly-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN UUYBFNKHOCJCHT-VHSXEESVSA-N 0.000 description 1
- PTIIBFKSLCYQBO-NHCYSSNCSA-N Gly-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)CN PTIIBFKSLCYQBO-NHCYSSNCSA-N 0.000 description 1
- FXGRXIATVXUAHO-WEDXCCLWSA-N Gly-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN FXGRXIATVXUAHO-WEDXCCLWSA-N 0.000 description 1
- CVFOYJJOZYYEPE-KBPBESRZSA-N Gly-Lys-Tyr Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CVFOYJJOZYYEPE-KBPBESRZSA-N 0.000 description 1
- OQQKUTVULYLCDG-ONGXEEELSA-N Gly-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)CN)C(O)=O OQQKUTVULYLCDG-ONGXEEELSA-N 0.000 description 1
- FJWSJWACLMTDMI-WPRPVWTQSA-N Gly-Met-Val Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O FJWSJWACLMTDMI-WPRPVWTQSA-N 0.000 description 1
- JBCLFWXMTIKCCB-VIFPVBQESA-N Gly-Phe Chemical compound NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-VIFPVBQESA-N 0.000 description 1
- WMGHDYWNHNLGBV-ONGXEEELSA-N Gly-Phe-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 WMGHDYWNHNLGBV-ONGXEEELSA-N 0.000 description 1
- GAFKBWKVXNERFA-QWRGUYRKSA-N Gly-Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 GAFKBWKVXNERFA-QWRGUYRKSA-N 0.000 description 1
- QVDGHDFFYHKJPN-QWRGUYRKSA-N Gly-Phe-Cys Chemical compound NCC(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CS)C(O)=O QVDGHDFFYHKJPN-QWRGUYRKSA-N 0.000 description 1
- VDCRBJACQKOSMS-JSGCOSHPSA-N Gly-Phe-Val Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O VDCRBJACQKOSMS-JSGCOSHPSA-N 0.000 description 1
- GGLIDLCEPDHEJO-BQBZGAKWSA-N Gly-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)CN GGLIDLCEPDHEJO-BQBZGAKWSA-N 0.000 description 1
- NSVOVKWEKGEOQB-LURJTMIESA-N Gly-Pro-Gly Chemical compound NCC(=O)N1CCC[C@H]1C(=O)NCC(O)=O NSVOVKWEKGEOQB-LURJTMIESA-N 0.000 description 1
- IXHQLZIWBCQBLQ-STQMWFEESA-N Gly-Pro-Phe Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IXHQLZIWBCQBLQ-STQMWFEESA-N 0.000 description 1
- ZLCLYFGMKFCDCN-XPUUQOCRSA-N Gly-Ser-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CO)NC(=O)CN)C(O)=O ZLCLYFGMKFCDCN-XPUUQOCRSA-N 0.000 description 1
- JQFILXICXLDTRR-FBCQKBJTSA-N Gly-Thr-Gly Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)NCC(O)=O JQFILXICXLDTRR-FBCQKBJTSA-N 0.000 description 1
- LLWQVJNHMYBLLK-CDMKHQONSA-N Gly-Thr-Phe Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LLWQVJNHMYBLLK-CDMKHQONSA-N 0.000 description 1
- MYXNLWDWWOTERK-BHNWBGBOSA-N Gly-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN)O MYXNLWDWWOTERK-BHNWBGBOSA-N 0.000 description 1
- CUVBTVWFVIIDOC-YEPSODPASA-N Gly-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)CN CUVBTVWFVIIDOC-YEPSODPASA-N 0.000 description 1
- UMRIXLHPZZIOML-OALUTQOASA-N Gly-Trp-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)CN UMRIXLHPZZIOML-OALUTQOASA-N 0.000 description 1
- GWCJMBNBFYBQCV-XPUUQOCRSA-N Gly-Val-Ala Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O GWCJMBNBFYBQCV-XPUUQOCRSA-N 0.000 description 1
- ZVXMEWXHFBYJPI-LSJOCFKGSA-N Gly-Val-Ile Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZVXMEWXHFBYJPI-LSJOCFKGSA-N 0.000 description 1
- BAYQNCWLXIDLHX-ONGXEEELSA-N Gly-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN BAYQNCWLXIDLHX-ONGXEEELSA-N 0.000 description 1
- SBVMXEZQJVUARN-XPUUQOCRSA-N Gly-Val-Ser Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O SBVMXEZQJVUARN-XPUUQOCRSA-N 0.000 description 1
- KSOBNUBCYHGUKH-UWVGGRQHSA-N Gly-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN KSOBNUBCYHGUKH-UWVGGRQHSA-N 0.000 description 1
- 241001149669 Hanseniaspora Species 0.000 description 1
- BIAKMWKJMQLZOJ-ZKWXMUAHSA-N His-Ala-Ala Chemical compound C[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)Cc1cnc[nH]1)C(O)=O BIAKMWKJMQLZOJ-ZKWXMUAHSA-N 0.000 description 1
- ZZLWLWSUIBSMNP-CIUDSAMLSA-N His-Asp-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZZLWLWSUIBSMNP-CIUDSAMLSA-N 0.000 description 1
- HVCRQRQPIIRNLY-IUCAKERBSA-N His-Gln-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)NCC(=O)O)N HVCRQRQPIIRNLY-IUCAKERBSA-N 0.000 description 1
- YTKOTXRIWQHSAZ-GUBZILKMSA-N His-Glu-Cys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N YTKOTXRIWQHSAZ-GUBZILKMSA-N 0.000 description 1
- VTMLJMNQHKBPON-QWRGUYRKSA-N His-Gly-His Chemical compound C([C@H](N)C(=O)NCC(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 VTMLJMNQHKBPON-QWRGUYRKSA-N 0.000 description 1
- FSOXZQBMPBQKGJ-QSFUFRPTSA-N His-Ile-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]([NH3+])CC1=CN=CN1 FSOXZQBMPBQKGJ-QSFUFRPTSA-N 0.000 description 1
- NDKSHNQINMRKHT-PEXQALLHSA-N His-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CN=CN1)N NDKSHNQINMRKHT-PEXQALLHSA-N 0.000 description 1
- DYKZGTLPSNOFHU-DEQVHRJGSA-N His-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N DYKZGTLPSNOFHU-DEQVHRJGSA-N 0.000 description 1
- BXOLYFJYQQRQDJ-MXAVVETBSA-N His-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CN=CN1)N BXOLYFJYQQRQDJ-MXAVVETBSA-N 0.000 description 1
- SKOKHBGDXGTDDP-MELADBBJSA-N His-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N SKOKHBGDXGTDDP-MELADBBJSA-N 0.000 description 1
- PGRPSOUCWRBWKZ-DLOVCJGASA-N His-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CN=CN1 PGRPSOUCWRBWKZ-DLOVCJGASA-N 0.000 description 1
- GJMHMDKCJPQJOI-IHRRRGAJSA-N His-Lys-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CN=CN1 GJMHMDKCJPQJOI-IHRRRGAJSA-N 0.000 description 1
- JUIOPCXACJLRJK-AVGNSLFASA-N His-Lys-Glu Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N JUIOPCXACJLRJK-AVGNSLFASA-N 0.000 description 1
- SLFSYFJKSIVSON-SRVKXCTJSA-N His-Met-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N SLFSYFJKSIVSON-SRVKXCTJSA-N 0.000 description 1
- HJUPAYWVVVRYFQ-PYJNHQTQSA-N His-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC1=CN=CN1)N HJUPAYWVVVRYFQ-PYJNHQTQSA-N 0.000 description 1
- SAPLASXFNUYUFE-CQDKDKBSSA-N His-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CC2=CN=CN2)N SAPLASXFNUYUFE-CQDKDKBSSA-N 0.000 description 1
- WKEABZIITNXXQZ-CIUDSAMLSA-N His-Ser-Cys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N WKEABZIITNXXQZ-CIUDSAMLSA-N 0.000 description 1
- VIJMRAIWYWRXSR-CIUDSAMLSA-N His-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 VIJMRAIWYWRXSR-CIUDSAMLSA-N 0.000 description 1
- FFKJUTZARGRVTH-KKUMJFAQSA-N His-Ser-Tyr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O FFKJUTZARGRVTH-KKUMJFAQSA-N 0.000 description 1
- IXQGOKWTQPCIQM-YJRXYDGGSA-N His-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N)O IXQGOKWTQPCIQM-YJRXYDGGSA-N 0.000 description 1
- MRVZCDSYLJXKKX-ACRUOGEOSA-N His-Tyr-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC3=CN=CN3)N MRVZCDSYLJXKKX-ACRUOGEOSA-N 0.000 description 1
- CGAMSLMBYJHMDY-ONGXEEELSA-N His-Val-Gly Chemical compound CC(C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CN=CN1)N CGAMSLMBYJHMDY-ONGXEEELSA-N 0.000 description 1
- DMAPKBANYNZHNR-ULQDDVLXSA-N His-Val-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N DMAPKBANYNZHNR-ULQDDVLXSA-N 0.000 description 1
- 101000870042 Homo sapiens Glutamate dehydrogenase 1, mitochondrial Proteins 0.000 description 1
- 101001068634 Homo sapiens Protein PRRC2A Proteins 0.000 description 1
- 108030001875 Homospermidine synthases Proteins 0.000 description 1
- 101710194716 Hydroxycinnamoyltransferase Proteins 0.000 description 1
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 1
- JXUGDUWBMKIJDC-NAKRPEOUSA-N Ile-Ala-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O JXUGDUWBMKIJDC-NAKRPEOUSA-N 0.000 description 1
- WUEIUSDAECDLQO-NAKRPEOUSA-N Ile-Ala-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)O)N WUEIUSDAECDLQO-NAKRPEOUSA-N 0.000 description 1
- HDOYNXLPTRQLAD-JBDRJPRFSA-N Ile-Ala-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(=O)O)N HDOYNXLPTRQLAD-JBDRJPRFSA-N 0.000 description 1
- LVQDUPQUJZWKSU-PYJNHQTQSA-N Ile-Arg-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N LVQDUPQUJZWKSU-PYJNHQTQSA-N 0.000 description 1
- UNDGQKWQNSTPPW-CYDGBPFRSA-N Ile-Arg-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCSC)C(=O)O)N UNDGQKWQNSTPPW-CYDGBPFRSA-N 0.000 description 1
- QYZYJFXHXYUZMZ-UGYAYLCHSA-N Ile-Asn-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N QYZYJFXHXYUZMZ-UGYAYLCHSA-N 0.000 description 1
- SCHZQZPYHBWYEQ-PEFMBERDSA-N Ile-Asn-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N SCHZQZPYHBWYEQ-PEFMBERDSA-N 0.000 description 1
- UAVQIQOOBXFKRC-BYULHYEWSA-N Ile-Asn-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O UAVQIQOOBXFKRC-BYULHYEWSA-N 0.000 description 1
- NCSIQAFSIPHVAN-IUKAMOBKSA-N Ile-Asn-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N NCSIQAFSIPHVAN-IUKAMOBKSA-N 0.000 description 1
- HVWXAQVMRBKKFE-UGYAYLCHSA-N Ile-Asp-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HVWXAQVMRBKKFE-UGYAYLCHSA-N 0.000 description 1
- UDLAWRKOVFDKFL-PEFMBERDSA-N Ile-Asp-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N UDLAWRKOVFDKFL-PEFMBERDSA-N 0.000 description 1
- JQLFYZMEXFNRFS-DJFWLOJKSA-N Ile-Asp-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N JQLFYZMEXFNRFS-DJFWLOJKSA-N 0.000 description 1
- BGZIJZJBXRVBGJ-SXTJYALSSA-N Ile-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N BGZIJZJBXRVBGJ-SXTJYALSSA-N 0.000 description 1
- HGNUKGZQASSBKQ-PCBIJLKTSA-N Ile-Asp-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N HGNUKGZQASSBKQ-PCBIJLKTSA-N 0.000 description 1
- AQTWDZDISVGCAC-CFMVVWHZSA-N Ile-Asp-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N AQTWDZDISVGCAC-CFMVVWHZSA-N 0.000 description 1
- FADXGVVLSPPEQY-GHCJXIJMSA-N Ile-Cys-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)N)C(=O)O)N FADXGVVLSPPEQY-GHCJXIJMSA-N 0.000 description 1
- VCYVLFAWCJRXFT-HJPIBITLSA-N Ile-Cys-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N VCYVLFAWCJRXFT-HJPIBITLSA-N 0.000 description 1
- PHIXPNQDGGILMP-YVNDNENWSA-N Ile-Glu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N PHIXPNQDGGILMP-YVNDNENWSA-N 0.000 description 1
- LPXHYGGZJOCAFR-MNXVOIDGSA-N Ile-Glu-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N LPXHYGGZJOCAFR-MNXVOIDGSA-N 0.000 description 1
- PNDMHTTXXPUQJH-RWRJDSDZSA-N Ile-Glu-Thr Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H]([C@H](O)C)C(=O)O PNDMHTTXXPUQJH-RWRJDSDZSA-N 0.000 description 1
- SLQVFYWBGNNOTK-BYULHYEWSA-N Ile-Gly-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N SLQVFYWBGNNOTK-BYULHYEWSA-N 0.000 description 1
- KFVUBLZRFSVDGO-BYULHYEWSA-N Ile-Gly-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O KFVUBLZRFSVDGO-BYULHYEWSA-N 0.000 description 1
- NYEYYMLUABXDMC-NHCYSSNCSA-N Ile-Gly-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)O)N NYEYYMLUABXDMC-NHCYSSNCSA-N 0.000 description 1
- ODPKZZLRDNXTJZ-WHOFXGATSA-N Ile-Gly-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N ODPKZZLRDNXTJZ-WHOFXGATSA-N 0.000 description 1
- JLWLMGADIQFKRD-QSFUFRPTSA-N Ile-His-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CN=CN1 JLWLMGADIQFKRD-QSFUFRPTSA-N 0.000 description 1
- UQXADIGYEYBJEI-DJFWLOJKSA-N Ile-His-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N UQXADIGYEYBJEI-DJFWLOJKSA-N 0.000 description 1
- KOPIAUWNLKKELG-SIGLWIIPSA-N Ile-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N KOPIAUWNLKKELG-SIGLWIIPSA-N 0.000 description 1
- LNJLOZYNZFGJMM-DEQVHRJGSA-N Ile-His-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N LNJLOZYNZFGJMM-DEQVHRJGSA-N 0.000 description 1
- CSQNHSGHAPRGPQ-YTFOTSKYSA-N Ile-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(=O)O)N CSQNHSGHAPRGPQ-YTFOTSKYSA-N 0.000 description 1
- AXNGDPAKKCEKGY-QPHKQPEJSA-N Ile-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N AXNGDPAKKCEKGY-QPHKQPEJSA-N 0.000 description 1
- NUKXXNFEUZGPRO-BJDJZHNGSA-N Ile-Leu-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)O)N NUKXXNFEUZGPRO-BJDJZHNGSA-N 0.000 description 1
- FZWVCYCYWCLQDH-NHCYSSNCSA-N Ile-Leu-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N FZWVCYCYWCLQDH-NHCYSSNCSA-N 0.000 description 1
- GAZGFPOZOLEYAJ-YTFOTSKYSA-N Ile-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N GAZGFPOZOLEYAJ-YTFOTSKYSA-N 0.000 description 1
- TVYWVSJGSHQWMT-AJNGGQMLSA-N Ile-Leu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N TVYWVSJGSHQWMT-AJNGGQMLSA-N 0.000 description 1
- RQQCJTLBSJMVCR-DSYPUSFNSA-N Ile-Leu-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N RQQCJTLBSJMVCR-DSYPUSFNSA-N 0.000 description 1
- NZGTYCMLUGYMCV-XUXIUFHCSA-N Ile-Lys-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N NZGTYCMLUGYMCV-XUXIUFHCSA-N 0.000 description 1
- OVDKXUDMKXAZIV-ZPFDUUQYSA-N Ile-Lys-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OVDKXUDMKXAZIV-ZPFDUUQYSA-N 0.000 description 1
- RFMDODRWJZHZCR-BJDJZHNGSA-N Ile-Lys-Cys Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(O)=O RFMDODRWJZHZCR-BJDJZHNGSA-N 0.000 description 1
- GLYJPWIRLBAIJH-FQUUOJAGSA-N Ile-Lys-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N GLYJPWIRLBAIJH-FQUUOJAGSA-N 0.000 description 1
- FFJQAEYLAQMGDL-MGHWNKPDSA-N Ile-Lys-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FFJQAEYLAQMGDL-MGHWNKPDSA-N 0.000 description 1
- IMRKCLXPYOIHIF-ZPFDUUQYSA-N Ile-Met-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N IMRKCLXPYOIHIF-ZPFDUUQYSA-N 0.000 description 1
- RCMNUBZKIIJCOI-ZPFDUUQYSA-N Ile-Met-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RCMNUBZKIIJCOI-ZPFDUUQYSA-N 0.000 description 1
- XLXPYSDGMXTTNQ-DKIMLUQUSA-N Ile-Phe-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CC(C)C)C(O)=O XLXPYSDGMXTTNQ-DKIMLUQUSA-N 0.000 description 1
- XLXPYSDGMXTTNQ-UHFFFAOYSA-N Ile-Phe-Leu Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(CC(C)C)C(O)=O)CC1=CC=CC=C1 XLXPYSDGMXTTNQ-UHFFFAOYSA-N 0.000 description 1
- VEPIBPGLTLPBDW-URLPEUOOSA-N Ile-Phe-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N VEPIBPGLTLPBDW-URLPEUOOSA-N 0.000 description 1
- XQLGNKLSPYCRMZ-HJWJTTGWSA-N Ile-Phe-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(=O)O)N XQLGNKLSPYCRMZ-HJWJTTGWSA-N 0.000 description 1
- BATWGBRIZANGPN-ZPFDUUQYSA-N Ile-Pro-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(=O)N)C(=O)O)N BATWGBRIZANGPN-ZPFDUUQYSA-N 0.000 description 1
- IVXJIMGDOYRLQU-XUXIUFHCSA-N Ile-Pro-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O IVXJIMGDOYRLQU-XUXIUFHCSA-N 0.000 description 1
- JODPUDMBQBIWCK-GHCJXIJMSA-N Ile-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O JODPUDMBQBIWCK-GHCJXIJMSA-N 0.000 description 1
- ZNOBVZFCHNHKHA-KBIXCLLPSA-N Ile-Ser-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZNOBVZFCHNHKHA-KBIXCLLPSA-N 0.000 description 1
- ZDNNDIJTUHQCAM-MXAVVETBSA-N Ile-Ser-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N ZDNNDIJTUHQCAM-MXAVVETBSA-N 0.000 description 1
- JNLSTRPWUXOORL-MMWGEVLESA-N Ile-Ser-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N JNLSTRPWUXOORL-MMWGEVLESA-N 0.000 description 1
- HXIDVIFHRYRXLZ-NAKRPEOUSA-N Ile-Ser-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)O)N HXIDVIFHRYRXLZ-NAKRPEOUSA-N 0.000 description 1
- YCKPUHHMCFSUMD-IUKAMOBKSA-N Ile-Thr-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCKPUHHMCFSUMD-IUKAMOBKSA-N 0.000 description 1
- QGXQHJQPAPMACW-PPCPHDFISA-N Ile-Thr-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)O)N QGXQHJQPAPMACW-PPCPHDFISA-N 0.000 description 1
- WXLYNEHOGRYNFU-URLPEUOOSA-N Ile-Thr-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N WXLYNEHOGRYNFU-URLPEUOOSA-N 0.000 description 1
- AUIYHFRUOOKTGX-UKJIMTQDSA-N Ile-Val-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N AUIYHFRUOOKTGX-UKJIMTQDSA-N 0.000 description 1
- JCGMFFQQHJQASB-PYJNHQTQSA-N Ile-Val-His Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O JCGMFFQQHJQASB-PYJNHQTQSA-N 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- 101150045458 KEX2 gene Proteins 0.000 description 1
- 241000235649 Kluyveromyces Species 0.000 description 1
- 241000235058 Komagataella pastoris Species 0.000 description 1
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 1
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 1
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 1
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 1
- 125000003338 L-glutaminyl group Chemical group O=C([*])[C@](N([H])[H])([H])C([H])([H])C([H])([H])C(=O)N([H])[H] 0.000 description 1
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 1
- TYYLDKGBCJGJGW-UHFFFAOYSA-N L-tryptophan-L-tyrosine Natural products C=1NC2=CC=CC=C2C=1CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 TYYLDKGBCJGJGW-UHFFFAOYSA-N 0.000 description 1
- 239000005639 Lauric acid Substances 0.000 description 1
- QPRQGENIBFLVEB-BJDJZHNGSA-N Leu-Ala-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O QPRQGENIBFLVEB-BJDJZHNGSA-N 0.000 description 1
- DQPQTXMIRBUWKO-DCAQKATOSA-N Leu-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(C)C)N DQPQTXMIRBUWKO-DCAQKATOSA-N 0.000 description 1
- GRZSCTXVCDUIPO-SRVKXCTJSA-N Leu-Arg-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O GRZSCTXVCDUIPO-SRVKXCTJSA-N 0.000 description 1
- KSZCCRIGNVSHFH-UWVGGRQHSA-N Leu-Arg-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O KSZCCRIGNVSHFH-UWVGGRQHSA-N 0.000 description 1
- WUFYAPWIHCUMLL-CIUDSAMLSA-N Leu-Asn-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O WUFYAPWIHCUMLL-CIUDSAMLSA-N 0.000 description 1
- IGUOAYLTQJLPPD-DCAQKATOSA-N Leu-Asn-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IGUOAYLTQJLPPD-DCAQKATOSA-N 0.000 description 1
- DBVWMYGBVFCRBE-CIUDSAMLSA-N Leu-Asn-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O DBVWMYGBVFCRBE-CIUDSAMLSA-N 0.000 description 1
- POJPZSMTTMLSTG-SRVKXCTJSA-N Leu-Asn-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N POJPZSMTTMLSTG-SRVKXCTJSA-N 0.000 description 1
- WGNOPSQMIQERPK-GARJFASQSA-N Leu-Asn-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N WGNOPSQMIQERPK-GARJFASQSA-N 0.000 description 1
- JQSXWJXBASFONF-KKUMJFAQSA-N Leu-Asp-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JQSXWJXBASFONF-KKUMJFAQSA-N 0.000 description 1
- CLVUXCBGKUECIT-HJGDQZAQSA-N Leu-Asp-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CLVUXCBGKUECIT-HJGDQZAQSA-N 0.000 description 1
- IIKJNQWOQIWWMR-CIUDSAMLSA-N Leu-Cys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(C)C)N IIKJNQWOQIWWMR-CIUDSAMLSA-N 0.000 description 1
- HUEBCHPSXSQUGN-GARJFASQSA-N Leu-Cys-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)N1CCC[C@@H]1C(=O)O)N HUEBCHPSXSQUGN-GARJFASQSA-N 0.000 description 1
- DLCXCECTCPKKCD-GUBZILKMSA-N Leu-Gln-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O DLCXCECTCPKKCD-GUBZILKMSA-N 0.000 description 1
- HFBCHNRFRYLZNV-GUBZILKMSA-N Leu-Glu-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HFBCHNRFRYLZNV-GUBZILKMSA-N 0.000 description 1
- NEEOBPIXKWSBRF-IUCAKERBSA-N Leu-Glu-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O NEEOBPIXKWSBRF-IUCAKERBSA-N 0.000 description 1
- HQUXQAMSWFIRET-AVGNSLFASA-N Leu-Glu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HQUXQAMSWFIRET-AVGNSLFASA-N 0.000 description 1
- LAPSXOAUPNOINL-YUMQZZPRSA-N Leu-Gly-Asp Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O LAPSXOAUPNOINL-YUMQZZPRSA-N 0.000 description 1
- CCQLQKZTXZBXTN-NHCYSSNCSA-N Leu-Gly-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CCQLQKZTXZBXTN-NHCYSSNCSA-N 0.000 description 1
- APFJUBGRZGMQFF-QWRGUYRKSA-N Leu-Gly-Lys Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN APFJUBGRZGMQFF-QWRGUYRKSA-N 0.000 description 1
- JRJLGNFWYFSJHB-HOCLYGCPSA-N Leu-Gly-Trp Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O JRJLGNFWYFSJHB-HOCLYGCPSA-N 0.000 description 1
- POZULHZYLPGXMR-ONGXEEELSA-N Leu-Gly-Val Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O POZULHZYLPGXMR-ONGXEEELSA-N 0.000 description 1
- YWYQSLOTVIRCFE-SRVKXCTJSA-N Leu-His-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O YWYQSLOTVIRCFE-SRVKXCTJSA-N 0.000 description 1
- CSFVADKICPDRRF-KKUMJFAQSA-N Leu-His-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CN=CN1 CSFVADKICPDRRF-KKUMJFAQSA-N 0.000 description 1
- OYQUOLRTJHWVSQ-SRVKXCTJSA-N Leu-His-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O OYQUOLRTJHWVSQ-SRVKXCTJSA-N 0.000 description 1
- OHZIZVWQXJPBJS-IXOXFDKPSA-N Leu-His-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OHZIZVWQXJPBJS-IXOXFDKPSA-N 0.000 description 1
- HMDDEJADNKQTBR-BZSNNMDCSA-N Leu-His-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O HMDDEJADNKQTBR-BZSNNMDCSA-N 0.000 description 1
- SEMUSFOBZGKBGW-YTFOTSKYSA-N Leu-Ile-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SEMUSFOBZGKBGW-YTFOTSKYSA-N 0.000 description 1
- HRTRLSRYZZKPCO-BJDJZHNGSA-N Leu-Ile-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HRTRLSRYZZKPCO-BJDJZHNGSA-N 0.000 description 1
- NRFGTHFONZYFNY-MGHWNKPDSA-N Leu-Ile-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NRFGTHFONZYFNY-MGHWNKPDSA-N 0.000 description 1
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 1
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 1
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 1
- REPBGZHJKYWFMJ-KKUMJFAQSA-N Leu-Lys-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N REPBGZHJKYWFMJ-KKUMJFAQSA-N 0.000 description 1
- VCHVSKNMTXWIIP-SRVKXCTJSA-N Leu-Lys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O VCHVSKNMTXWIIP-SRVKXCTJSA-N 0.000 description 1
- OVZLLFONXILPDZ-VOAKCMCISA-N Leu-Lys-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OVZLLFONXILPDZ-VOAKCMCISA-N 0.000 description 1
- ONPJGOIVICHWBW-BZSNNMDCSA-N Leu-Lys-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 ONPJGOIVICHWBW-BZSNNMDCSA-N 0.000 description 1
- CPONGMJGVIAWEH-DCAQKATOSA-N Leu-Met-Ala Chemical compound CSCC[C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](C)C(O)=O CPONGMJGVIAWEH-DCAQKATOSA-N 0.000 description 1
- PKKMDPNFGULLNQ-AVGNSLFASA-N Leu-Met-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O PKKMDPNFGULLNQ-AVGNSLFASA-N 0.000 description 1
- GNRPTBRHRRZCMA-RWMBFGLXSA-N Leu-Met-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N1CCC[C@@H]1C(=O)O)N GNRPTBRHRRZCMA-RWMBFGLXSA-N 0.000 description 1
- LQUIENKUVKPNIC-ULQDDVLXSA-N Leu-Met-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LQUIENKUVKPNIC-ULQDDVLXSA-N 0.000 description 1
- KTOIECMYZZGVSI-BZSNNMDCSA-N Leu-Phe-His Chemical compound C([C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CC=CC=C1 KTOIECMYZZGVSI-BZSNNMDCSA-N 0.000 description 1
- PJWOOBTYQNNRBF-BZSNNMDCSA-N Leu-Phe-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)O)N PJWOOBTYQNNRBF-BZSNNMDCSA-N 0.000 description 1
- RRVCZCNFXIFGRA-DCAQKATOSA-N Leu-Pro-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O RRVCZCNFXIFGRA-DCAQKATOSA-N 0.000 description 1
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 1
- YRRCOJOXAJNSAX-IHRRRGAJSA-N Leu-Pro-Lys Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N YRRCOJOXAJNSAX-IHRRRGAJSA-N 0.000 description 1
- QONKWXNJRRNTBV-AVGNSLFASA-N Leu-Pro-Met Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)O)N QONKWXNJRRNTBV-AVGNSLFASA-N 0.000 description 1
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 1
- PWPBLZXWFXJFHE-RHYQMDGZSA-N Leu-Pro-Thr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O PWPBLZXWFXJFHE-RHYQMDGZSA-N 0.000 description 1
- IDGZVZJLYFTXSL-DCAQKATOSA-N Leu-Ser-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IDGZVZJLYFTXSL-DCAQKATOSA-N 0.000 description 1
- KZZCOWMDDXDKSS-CIUDSAMLSA-N Leu-Ser-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KZZCOWMDDXDKSS-CIUDSAMLSA-N 0.000 description 1
- RGUXWMDNCPMQFB-YUMQZZPRSA-N Leu-Ser-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RGUXWMDNCPMQFB-YUMQZZPRSA-N 0.000 description 1
- AMSSKPUHBUQBOQ-SRVKXCTJSA-N Leu-Ser-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N AMSSKPUHBUQBOQ-SRVKXCTJSA-N 0.000 description 1
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 1
- SVBJIZVVYJYGLA-DCAQKATOSA-N Leu-Ser-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O SVBJIZVVYJYGLA-DCAQKATOSA-N 0.000 description 1
- LCNASHSOFMRYFO-WDCWCFNPSA-N Leu-Thr-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(N)=O LCNASHSOFMRYFO-WDCWCFNPSA-N 0.000 description 1
- CNWDWAMPKVYJJB-NUTKFTJISA-N Leu-Trp-Ala Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 CNWDWAMPKVYJJB-NUTKFTJISA-N 0.000 description 1
- IDGRADDMTTWOQC-WDSOQIARSA-N Leu-Trp-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IDGRADDMTTWOQC-WDSOQIARSA-N 0.000 description 1
- VJGQRELPQWNURN-JYJNAYRXSA-N Leu-Tyr-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJGQRELPQWNURN-JYJNAYRXSA-N 0.000 description 1
- RDFIVFHPOSOXMW-ACRUOGEOSA-N Leu-Tyr-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RDFIVFHPOSOXMW-ACRUOGEOSA-N 0.000 description 1
- BGGTYDNTOYRTTR-MEYUZBJRSA-N Leu-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC(C)C)N)O BGGTYDNTOYRTTR-MEYUZBJRSA-N 0.000 description 1
- XZNJZXJZBMBGGS-NHCYSSNCSA-N Leu-Val-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XZNJZXJZBMBGGS-NHCYSSNCSA-N 0.000 description 1
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 1
- FMFNIDICDKEMOE-XUXIUFHCSA-N Leu-Val-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FMFNIDICDKEMOE-XUXIUFHCSA-N 0.000 description 1
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 1
- QESXLSQLQHHTIX-RHYQMDGZSA-N Leu-Val-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QESXLSQLQHHTIX-RHYQMDGZSA-N 0.000 description 1
- 229910009891 LiAc Inorganic materials 0.000 description 1
- 235000021353 Lignoceric acid Nutrition 0.000 description 1
- CQXMAMUUWHYSIY-UHFFFAOYSA-N Lignoceric acid Natural products CCCCCCCCCCCCCCCCCCCCCCCC(=O)OCCC1=CC=C(O)C=C1 CQXMAMUUWHYSIY-UHFFFAOYSA-N 0.000 description 1
- 241001149698 Lipomyces Species 0.000 description 1
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 1
- WSXTWLJHTLRFLW-SRVKXCTJSA-N Lys-Ala-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O WSXTWLJHTLRFLW-SRVKXCTJSA-N 0.000 description 1
- UWKNTTJNVSYXPC-CIUDSAMLSA-N Lys-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN UWKNTTJNVSYXPC-CIUDSAMLSA-N 0.000 description 1
- VHXMZJGOKIMETG-CQDKDKBSSA-N Lys-Ala-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CCCCN)N VHXMZJGOKIMETG-CQDKDKBSSA-N 0.000 description 1
- IRNSXVOWSXSULE-DCAQKATOSA-N Lys-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN IRNSXVOWSXSULE-DCAQKATOSA-N 0.000 description 1
- VHNOAIFVYUQOOY-XUXIUFHCSA-N Lys-Arg-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VHNOAIFVYUQOOY-XUXIUFHCSA-N 0.000 description 1
- NTSPQIONFJUMJV-AVGNSLFASA-N Lys-Arg-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O NTSPQIONFJUMJV-AVGNSLFASA-N 0.000 description 1
- YKIRNDPUWONXQN-GUBZILKMSA-N Lys-Asn-Gln Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YKIRNDPUWONXQN-GUBZILKMSA-N 0.000 description 1
- DEFGUIIUYAUEDU-ZPFDUUQYSA-N Lys-Asn-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DEFGUIIUYAUEDU-ZPFDUUQYSA-N 0.000 description 1
- FACUGMGEFUEBTI-SRVKXCTJSA-N Lys-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCCCN FACUGMGEFUEBTI-SRVKXCTJSA-N 0.000 description 1
- LZWNAOIMTLNMDW-NHCYSSNCSA-N Lys-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N LZWNAOIMTLNMDW-NHCYSSNCSA-N 0.000 description 1
- FLCMXEFCTLXBTL-DCAQKATOSA-N Lys-Asp-Arg Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N FLCMXEFCTLXBTL-DCAQKATOSA-N 0.000 description 1
- OVIVOCSURJYCTM-GUBZILKMSA-N Lys-Asp-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(O)=O OVIVOCSURJYCTM-GUBZILKMSA-N 0.000 description 1
- AAORVPFVUIHEAB-YUMQZZPRSA-N Lys-Asp-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O AAORVPFVUIHEAB-YUMQZZPRSA-N 0.000 description 1
- WGCKDDHUFPQSMZ-ZPFDUUQYSA-N Lys-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCCCN WGCKDDHUFPQSMZ-ZPFDUUQYSA-N 0.000 description 1
- IWWMPCPLFXFBAF-SRVKXCTJSA-N Lys-Asp-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O IWWMPCPLFXFBAF-SRVKXCTJSA-N 0.000 description 1
- KWUKZRFFKPLUPE-HJGDQZAQSA-N Lys-Asp-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWUKZRFFKPLUPE-HJGDQZAQSA-N 0.000 description 1
- GKFNXYMAMKJSKD-NHCYSSNCSA-N Lys-Asp-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O GKFNXYMAMKJSKD-NHCYSSNCSA-N 0.000 description 1
- GJJQCBVRWDGLMQ-GUBZILKMSA-N Lys-Glu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O GJJQCBVRWDGLMQ-GUBZILKMSA-N 0.000 description 1
- DCRWPTBMWMGADO-AVGNSLFASA-N Lys-Glu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DCRWPTBMWMGADO-AVGNSLFASA-N 0.000 description 1
- HAUUXTXKJNVIFY-ONGXEEELSA-N Lys-Gly-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAUUXTXKJNVIFY-ONGXEEELSA-N 0.000 description 1
- PRCHKVGXZVTALR-KKUMJFAQSA-N Lys-His-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCCCN)N PRCHKVGXZVTALR-KKUMJFAQSA-N 0.000 description 1
- ZMMDPRTXLAEMOD-BZSNNMDCSA-N Lys-His-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZMMDPRTXLAEMOD-BZSNNMDCSA-N 0.000 description 1
- PGLGNCVOWIORQE-SRVKXCTJSA-N Lys-His-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O PGLGNCVOWIORQE-SRVKXCTJSA-N 0.000 description 1
- QBEPTBMRQALPEV-MNXVOIDGSA-N Lys-Ile-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN QBEPTBMRQALPEV-MNXVOIDGSA-N 0.000 description 1
- IVFUVMSKSFSFBT-NHCYSSNCSA-N Lys-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN IVFUVMSKSFSFBT-NHCYSSNCSA-N 0.000 description 1
- WAIHHELKYSFIQN-XUXIUFHCSA-N Lys-Ile-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O WAIHHELKYSFIQN-XUXIUFHCSA-N 0.000 description 1
- MYZMQWHPDAYKIE-SRVKXCTJSA-N Lys-Leu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O MYZMQWHPDAYKIE-SRVKXCTJSA-N 0.000 description 1
- OVAOHZIOUBEQCJ-IHRRRGAJSA-N Lys-Leu-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OVAOHZIOUBEQCJ-IHRRRGAJSA-N 0.000 description 1
- PINHPJWGVBKQII-SRVKXCTJSA-N Lys-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCCN)N PINHPJWGVBKQII-SRVKXCTJSA-N 0.000 description 1
- ONPDTSFZAIWMDI-AVGNSLFASA-N Lys-Leu-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ONPDTSFZAIWMDI-AVGNSLFASA-N 0.000 description 1
- QKXZCUCBFPEXNK-KKUMJFAQSA-N Lys-Leu-His Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 QKXZCUCBFPEXNK-KKUMJFAQSA-N 0.000 description 1
- RBEATVHTWHTHTJ-KKUMJFAQSA-N Lys-Leu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O RBEATVHTWHTHTJ-KKUMJFAQSA-N 0.000 description 1
- ORVFEGYUJITPGI-IHRRRGAJSA-N Lys-Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCCCN ORVFEGYUJITPGI-IHRRRGAJSA-N 0.000 description 1
- YPLVCBKEPJPBDQ-MELADBBJSA-N Lys-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N YPLVCBKEPJPBDQ-MELADBBJSA-N 0.000 description 1
- LJADEBULDNKJNK-IHRRRGAJSA-N Lys-Leu-Val Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LJADEBULDNKJNK-IHRRRGAJSA-N 0.000 description 1
- RIJCHEVHFWMDKD-SRVKXCTJSA-N Lys-Lys-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O RIJCHEVHFWMDKD-SRVKXCTJSA-N 0.000 description 1
- YUAXTFMFMOIMAM-QWRGUYRKSA-N Lys-Lys-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O YUAXTFMFMOIMAM-QWRGUYRKSA-N 0.000 description 1
- ATNKHRAIZCMCCN-BZSNNMDCSA-N Lys-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N ATNKHRAIZCMCCN-BZSNNMDCSA-N 0.000 description 1
- PLDJDCJLRCYPJB-VOAKCMCISA-N Lys-Lys-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PLDJDCJLRCYPJB-VOAKCMCISA-N 0.000 description 1
- WKUXWMWQTOYTFI-SRVKXCTJSA-N Lys-Met-Gln Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N WKUXWMWQTOYTFI-SRVKXCTJSA-N 0.000 description 1
- KFSALEZVQJYHCE-AVGNSLFASA-N Lys-Met-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCCCN)N KFSALEZVQJYHCE-AVGNSLFASA-N 0.000 description 1
- TWPCWKVOZDUYAA-KKUMJFAQSA-N Lys-Phe-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O TWPCWKVOZDUYAA-KKUMJFAQSA-N 0.000 description 1
- LMGNWHDWJDIOPK-DKIMLUQUSA-N Lys-Phe-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LMGNWHDWJDIOPK-DKIMLUQUSA-N 0.000 description 1
- LNMKRJJLEFASGA-BZSNNMDCSA-N Lys-Phe-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LNMKRJJLEFASGA-BZSNNMDCSA-N 0.000 description 1
- AZOFEHCPMBRNFD-BZSNNMDCSA-N Lys-Phe-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=CC=C1 AZOFEHCPMBRNFD-BZSNNMDCSA-N 0.000 description 1
- LUAJJLPHUXPQLH-KKUMJFAQSA-N Lys-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCCCN)N LUAJJLPHUXPQLH-KKUMJFAQSA-N 0.000 description 1
- CNGOEHJCLVCJHN-SRVKXCTJSA-N Lys-Pro-Glu Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O CNGOEHJCLVCJHN-SRVKXCTJSA-N 0.000 description 1
- PDIDTSZKKFEDMB-UWVGGRQHSA-N Lys-Pro-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O PDIDTSZKKFEDMB-UWVGGRQHSA-N 0.000 description 1
- LECIJRIRMVOFMH-ULQDDVLXSA-N Lys-Pro-Phe Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 LECIJRIRMVOFMH-ULQDDVLXSA-N 0.000 description 1
- ZUGVARDEGWMMLK-SRVKXCTJSA-N Lys-Ser-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN ZUGVARDEGWMMLK-SRVKXCTJSA-N 0.000 description 1
- MEQLGHAMAUPOSJ-DCAQKATOSA-N Lys-Ser-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O MEQLGHAMAUPOSJ-DCAQKATOSA-N 0.000 description 1
- UWHCKWNPWKTMBM-WDCWCFNPSA-N Lys-Thr-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O UWHCKWNPWKTMBM-WDCWCFNPSA-N 0.000 description 1
- QVTDVTONTRSQMF-WDCWCFNPSA-N Lys-Thr-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CCCCN QVTDVTONTRSQMF-WDCWCFNPSA-N 0.000 description 1
- DLCAXBGXGOVUCD-PPCPHDFISA-N Lys-Thr-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DLCAXBGXGOVUCD-PPCPHDFISA-N 0.000 description 1
- YFQSSOAGMZGXFT-MEYUZBJRSA-N Lys-Thr-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YFQSSOAGMZGXFT-MEYUZBJRSA-N 0.000 description 1
- VHTOGMKQXXJOHG-RHYQMDGZSA-N Lys-Thr-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O VHTOGMKQXXJOHG-RHYQMDGZSA-N 0.000 description 1
- GVKINWYYLOLEFQ-XIRDDKMYSA-N Lys-Trp-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(O)=O GVKINWYYLOLEFQ-XIRDDKMYSA-N 0.000 description 1
- VVURYEVJJTXWNE-ULQDDVLXSA-N Lys-Tyr-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O VVURYEVJJTXWNE-ULQDDVLXSA-N 0.000 description 1
- OHXUUQDOBQKSNB-AVGNSLFASA-N Lys-Val-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O OHXUUQDOBQKSNB-AVGNSLFASA-N 0.000 description 1
- QLFAPXUXEBAWEK-NHCYSSNCSA-N Lys-Val-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QLFAPXUXEBAWEK-NHCYSSNCSA-N 0.000 description 1
- BWECSLVQIWEMSC-IHRRRGAJSA-N Lys-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCCN)N BWECSLVQIWEMSC-IHRRRGAJSA-N 0.000 description 1
- TXTZMVNJIRZABH-ULQDDVLXSA-N Lys-Val-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 TXTZMVNJIRZABH-ULQDDVLXSA-N 0.000 description 1
- HMZPYMSEAALNAE-ULQDDVLXSA-N Lys-Val-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O HMZPYMSEAALNAE-ULQDDVLXSA-N 0.000 description 1
- IKXQOBUBZSOWDY-AVGNSLFASA-N Lys-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N IKXQOBUBZSOWDY-AVGNSLFASA-N 0.000 description 1
- 101150110199 MEU1 gene Proteins 0.000 description 1
- 241000218922 Magnoliophyta Species 0.000 description 1
- LMKSBGIUPVRHEH-FXQIFTODSA-N Met-Ala-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(N)=O LMKSBGIUPVRHEH-FXQIFTODSA-N 0.000 description 1
- GAELMDJMQDUDLJ-BQBZGAKWSA-N Met-Ala-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O GAELMDJMQDUDLJ-BQBZGAKWSA-N 0.000 description 1
- HUKLXYYPZWPXCC-KZVJFYERSA-N Met-Ala-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HUKLXYYPZWPXCC-KZVJFYERSA-N 0.000 description 1
- BLIPQDLSCFGUFA-GUBZILKMSA-N Met-Arg-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O BLIPQDLSCFGUFA-GUBZILKMSA-N 0.000 description 1
- OHMKUHXCDSCOMT-QXEWZRGKSA-N Met-Asn-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O OHMKUHXCDSCOMT-QXEWZRGKSA-N 0.000 description 1
- ZMYHJISLFYTQGK-FXQIFTODSA-N Met-Asp-Asn Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZMYHJISLFYTQGK-FXQIFTODSA-N 0.000 description 1
- HGKJFNCLOHKEHS-FXQIFTODSA-N Met-Cys-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CC(O)=O HGKJFNCLOHKEHS-FXQIFTODSA-N 0.000 description 1
- YORIKIDJCPKBON-YUMQZZPRSA-N Met-Glu-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O YORIKIDJCPKBON-YUMQZZPRSA-N 0.000 description 1
- YCUSPBPZVJDMII-YUMQZZPRSA-N Met-Gly-Glu Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O YCUSPBPZVJDMII-YUMQZZPRSA-N 0.000 description 1
- UZWMJZSOXGOVIN-LURJTMIESA-N Met-Gly-Gly Chemical compound CSCC[C@H](N)C(=O)NCC(=O)NCC(O)=O UZWMJZSOXGOVIN-LURJTMIESA-N 0.000 description 1
- MYAPQOBHGWJZOM-UWVGGRQHSA-N Met-Gly-Leu Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C MYAPQOBHGWJZOM-UWVGGRQHSA-N 0.000 description 1
- LQMHZERGCQJKAH-STQMWFEESA-N Met-Gly-Phe Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 LQMHZERGCQJKAH-STQMWFEESA-N 0.000 description 1
- FZUNSVYYPYJYAP-NAKRPEOUSA-N Met-Ile-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O FZUNSVYYPYJYAP-NAKRPEOUSA-N 0.000 description 1
- GETCJHFFECHWHI-QXEWZRGKSA-N Met-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCSC)N GETCJHFFECHWHI-QXEWZRGKSA-N 0.000 description 1
- HWROAFGWPQUPTE-OSUNSFLBSA-N Met-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CCSC)N HWROAFGWPQUPTE-OSUNSFLBSA-N 0.000 description 1
- UROWNMBTQGGTHB-DCAQKATOSA-N Met-Leu-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O UROWNMBTQGGTHB-DCAQKATOSA-N 0.000 description 1
- RBGLBUDVQVPTEG-DCAQKATOSA-N Met-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCSC)N RBGLBUDVQVPTEG-DCAQKATOSA-N 0.000 description 1
- XDGFFEZAZHRZFR-RHYQMDGZSA-N Met-Leu-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XDGFFEZAZHRZFR-RHYQMDGZSA-N 0.000 description 1
- AXHNAGAYRGCDLG-UWVGGRQHSA-N Met-Lys-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O AXHNAGAYRGCDLG-UWVGGRQHSA-N 0.000 description 1
- HAQLBBVZAGMESV-IHRRRGAJSA-N Met-Lys-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O HAQLBBVZAGMESV-IHRRRGAJSA-N 0.000 description 1
- FBLBCGLSRXBANI-KKUMJFAQSA-N Met-Phe-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N FBLBCGLSRXBANI-KKUMJFAQSA-N 0.000 description 1
- WYDFQSJOARJAMM-GUBZILKMSA-N Met-Pro-Asp Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O WYDFQSJOARJAMM-GUBZILKMSA-N 0.000 description 1
- WXXNVZMWHOLNRJ-AVGNSLFASA-N Met-Pro-Lys Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O WXXNVZMWHOLNRJ-AVGNSLFASA-N 0.000 description 1
- DSZFTPCSFVWMKP-DCAQKATOSA-N Met-Ser-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN DSZFTPCSFVWMKP-DCAQKATOSA-N 0.000 description 1
- FIZZULTXMVEIAA-IHRRRGAJSA-N Met-Ser-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 FIZZULTXMVEIAA-IHRRRGAJSA-N 0.000 description 1
- KYXDADPHSNFWQX-VEVYYDQMSA-N Met-Thr-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O KYXDADPHSNFWQX-VEVYYDQMSA-N 0.000 description 1
- FXBKQTOGURNXSL-HJGDQZAQSA-N Met-Thr-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(O)=O FXBKQTOGURNXSL-HJGDQZAQSA-N 0.000 description 1
- QZUCCDSNETVAIS-RYQLBKOJSA-N Met-Trp-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N3CCC[C@@H]3C(=O)O)N QZUCCDSNETVAIS-RYQLBKOJSA-N 0.000 description 1
- VWFHWJGVLVZVIS-QXEWZRGKSA-N Met-Val-Asn Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O VWFHWJGVLVZVIS-QXEWZRGKSA-N 0.000 description 1
- OVTOTTGZBWXLFU-QXEWZRGKSA-N Met-Val-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O OVTOTTGZBWXLFU-QXEWZRGKSA-N 0.000 description 1
- FSTWDRPCQQUJIT-NHCYSSNCSA-N Met-Val-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCSC)N FSTWDRPCQQUJIT-NHCYSSNCSA-N 0.000 description 1
- CQRGINSEMFBACV-WPRPVWTQSA-N Met-Val-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O CQRGINSEMFBACV-WPRPVWTQSA-N 0.000 description 1
- VYDLZDRMOFYOGV-TUAOUCFPSA-N Met-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N VYDLZDRMOFYOGV-TUAOUCFPSA-N 0.000 description 1
- LBSWWNKMVPAXOI-GUBZILKMSA-N Met-Val-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O LBSWWNKMVPAXOI-GUBZILKMSA-N 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 108010007784 Methionine adenosyltransferase Proteins 0.000 description 1
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 1
- 230000006181 N-acylation Effects 0.000 description 1
- 108010079364 N-glycylalanine Proteins 0.000 description 1
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 1
- XJLXINKUBYWONI-NNYOXOHSSA-O NADP(+) Chemical compound NC(=O)C1=CC=C[N+]([C@H]2[C@@H]([C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OC[C@@H]3[C@H]([C@@H](OP(O)(O)=O)[C@@H](O3)N3C4=NC=NC(N)=C4N=C3)O)O2)O)=C1 XJLXINKUBYWONI-NNYOXOHSSA-O 0.000 description 1
- 108010047562 NGR peptide Proteins 0.000 description 1
- CWVRJTMFETXNAD-KLZCAUPSSA-N Neochlorogenin-saeure Natural products O[C@H]1C[C@@](O)(C[C@@H](OC(=O)C=Cc2ccc(O)c(O)c2)[C@@H]1O)C(=O)O CWVRJTMFETXNAD-KLZCAUPSSA-N 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 108010065395 Neuropep-1 Proteins 0.000 description 1
- 244000061176 Nicotiana tabacum Species 0.000 description 1
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 1
- 238000000636 Northern blotting Methods 0.000 description 1
- 239000004677 Nylon Substances 0.000 description 1
- 239000005642 Oleic acid Substances 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 108020005187 Oligonucleotide Probes Proteins 0.000 description 1
- 102000007981 Ornithine carbamoyltransferase Human genes 0.000 description 1
- 102000052812 Ornithine decarboxylases Human genes 0.000 description 1
- 108700005126 Ornithine decarboxylases Proteins 0.000 description 1
- 101710113020 Ornithine transcarbamylase, mitochondrial Proteins 0.000 description 1
- 102000004316 Oxidoreductases Human genes 0.000 description 1
- 108090000854 Oxidoreductases Proteins 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 235000021314 Palmitic acid Nutrition 0.000 description 1
- 235000021319 Palmitoleic acid Nutrition 0.000 description 1
- 241000816088 Papia Species 0.000 description 1
- LRBQNJMCXXYXIU-PPKXGCFTSA-N Penta-digallate-beta-D-glucose Natural products OC1=C(O)C(O)=CC(C(=O)OC=2C(=C(O)C=C(C=2)C(=O)OC[C@@H]2[C@H]([C@H](OC(=O)C=3C=C(OC(=O)C=4C=C(O)C(O)=C(O)C=4)C(O)=C(O)C=3)[C@@H](OC(=O)C=3C=C(OC(=O)C=4C=C(O)C(O)=C(O)C=4)C(O)=C(O)C=3)[C@H](OC(=O)C=3C=C(OC(=O)C=4C=C(O)C(O)=C(O)C=4)C(O)=C(O)C=3)O2)OC(=O)C=2C=C(OC(=O)C=3C=C(O)C(O)=C(O)C=3)C(O)=C(O)C=2)O)=C1 LRBQNJMCXXYXIU-PPKXGCFTSA-N 0.000 description 1
- 241001542817 Phaffia Species 0.000 description 1
- MDHZEOMXGNBSIL-DLOVCJGASA-N Phe-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N MDHZEOMXGNBSIL-DLOVCJGASA-N 0.000 description 1
- YRKFKTQRVBJYLT-CQDKDKBSSA-N Phe-Ala-His Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CC=CC=C1 YRKFKTQRVBJYLT-CQDKDKBSSA-N 0.000 description 1
- DFEVBOYEUQJGER-JURCDPSOSA-N Phe-Ala-Ile Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O DFEVBOYEUQJGER-JURCDPSOSA-N 0.000 description 1
- BBDSZDHUCPSYAC-QEJZJMRPSA-N Phe-Ala-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BBDSZDHUCPSYAC-QEJZJMRPSA-N 0.000 description 1
- ULECEJGNDHWSKD-QEJZJMRPSA-N Phe-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 ULECEJGNDHWSKD-QEJZJMRPSA-N 0.000 description 1
- SEPNOAFMZLLCEW-UBHSHLNASA-N Phe-Ala-Val Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O SEPNOAFMZLLCEW-UBHSHLNASA-N 0.000 description 1
- AYPMIIKUMNADSU-IHRRRGAJSA-N Phe-Arg-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O AYPMIIKUMNADSU-IHRRRGAJSA-N 0.000 description 1
- KIAWKQJTSGRCSA-AVGNSLFASA-N Phe-Asn-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KIAWKQJTSGRCSA-AVGNSLFASA-N 0.000 description 1
- OXUMFAOVGFODPN-KKUMJFAQSA-N Phe-Asn-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N OXUMFAOVGFODPN-KKUMJFAQSA-N 0.000 description 1
- LXVFHIBXOWJTKZ-BZSNNMDCSA-N Phe-Asn-Tyr Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O LXVFHIBXOWJTKZ-BZSNNMDCSA-N 0.000 description 1
- XMPUYNHKEPFERE-IHRRRGAJSA-N Phe-Asp-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 XMPUYNHKEPFERE-IHRRRGAJSA-N 0.000 description 1
- CSYVXYQDIVCQNU-QWRGUYRKSA-N Phe-Asp-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O CSYVXYQDIVCQNU-QWRGUYRKSA-N 0.000 description 1
- VUYCNYVLKACHPA-KKUMJFAQSA-N Phe-Asp-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N VUYCNYVLKACHPA-KKUMJFAQSA-N 0.000 description 1
- IUVYJBMTHARMIP-PCBIJLKTSA-N Phe-Asp-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O IUVYJBMTHARMIP-PCBIJLKTSA-N 0.000 description 1
- FRPVPGRXUKFEQE-YDHLFZDLSA-N Phe-Asp-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O FRPVPGRXUKFEQE-YDHLFZDLSA-N 0.000 description 1
- PDUVELWDJZOUEI-IHRRRGAJSA-N Phe-Cys-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PDUVELWDJZOUEI-IHRRRGAJSA-N 0.000 description 1
- OMHMIXFFRPMYHB-SRVKXCTJSA-N Phe-Cys-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OMHMIXFFRPMYHB-SRVKXCTJSA-N 0.000 description 1
- UMKYAYXCMYYNHI-AVGNSLFASA-N Phe-Gln-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N UMKYAYXCMYYNHI-AVGNSLFASA-N 0.000 description 1
- UNLYPPYNDXHGDG-IHRRRGAJSA-N Phe-Gln-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 UNLYPPYNDXHGDG-IHRRRGAJSA-N 0.000 description 1
- FMMIYCMOVGXZIP-AVGNSLFASA-N Phe-Glu-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O FMMIYCMOVGXZIP-AVGNSLFASA-N 0.000 description 1
- MPFGIYLYWUCSJG-AVGNSLFASA-N Phe-Glu-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 MPFGIYLYWUCSJG-AVGNSLFASA-N 0.000 description 1
- UEADQPLTYBWWTG-AVGNSLFASA-N Phe-Glu-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 UEADQPLTYBWWTG-AVGNSLFASA-N 0.000 description 1
- MGECUMGTSHYHEJ-QEWYBTABSA-N Phe-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 MGECUMGTSHYHEJ-QEWYBTABSA-N 0.000 description 1
- KJJROSNFBRWPHS-JYJNAYRXSA-N Phe-Glu-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KJJROSNFBRWPHS-JYJNAYRXSA-N 0.000 description 1
- BFYHIHGIHGROAT-HTUGSXCWSA-N Phe-Glu-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BFYHIHGIHGROAT-HTUGSXCWSA-N 0.000 description 1
- BIYWZVCPZIFGPY-QWRGUYRKSA-N Phe-Gly-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CO)C(O)=O BIYWZVCPZIFGPY-QWRGUYRKSA-N 0.000 description 1
- OVJMCXAPGFDGMG-HKUYNNGSSA-N Phe-Gly-Trp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O OVJMCXAPGFDGMG-HKUYNNGSSA-N 0.000 description 1
- ZKSLXIGKRJMALF-MGHWNKPDSA-N Phe-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CC=CC=C2)N ZKSLXIGKRJMALF-MGHWNKPDSA-N 0.000 description 1
- BEEVXUYVEHXWRQ-YESZJQIVSA-N Phe-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC3=CC=CC=C3)N)C(=O)O BEEVXUYVEHXWRQ-YESZJQIVSA-N 0.000 description 1
- MYQCCQSMKNCNKY-KKUMJFAQSA-N Phe-His-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CO)C(=O)O)N MYQCCQSMKNCNKY-KKUMJFAQSA-N 0.000 description 1
- MIICYIIBVYQNKE-QEWYBTABSA-N Phe-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N MIICYIIBVYQNKE-QEWYBTABSA-N 0.000 description 1
- KRYSMKKRRRWOCZ-QEWYBTABSA-N Phe-Ile-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O KRYSMKKRRRWOCZ-QEWYBTABSA-N 0.000 description 1
- JQLQUPIYYJXZLJ-ZEWNOJEFSA-N Phe-Ile-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 JQLQUPIYYJXZLJ-ZEWNOJEFSA-N 0.000 description 1
- RORUIHAWOLADSH-HJWJTTGWSA-N Phe-Ile-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=CC=C1 RORUIHAWOLADSH-HJWJTTGWSA-N 0.000 description 1
- KXUZHWXENMYOHC-QEJZJMRPSA-N Phe-Leu-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O KXUZHWXENMYOHC-QEJZJMRPSA-N 0.000 description 1
- KDYPMIZMXDECSU-JYJNAYRXSA-N Phe-Leu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 KDYPMIZMXDECSU-JYJNAYRXSA-N 0.000 description 1
- SMFGCTXUBWEPKM-KBPBESRZSA-N Phe-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 SMFGCTXUBWEPKM-KBPBESRZSA-N 0.000 description 1
- INHMISZWLJZQGH-ULQDDVLXSA-N Phe-Leu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 INHMISZWLJZQGH-ULQDDVLXSA-N 0.000 description 1
- DMEYUTSDVRCWRS-ULQDDVLXSA-N Phe-Lys-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 DMEYUTSDVRCWRS-ULQDDVLXSA-N 0.000 description 1
- RMKGXGPQIPLTFC-KKUMJFAQSA-N Phe-Lys-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O RMKGXGPQIPLTFC-KKUMJFAQSA-N 0.000 description 1
- WLYPRKLMRIYGPP-JYJNAYRXSA-N Phe-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 WLYPRKLMRIYGPP-JYJNAYRXSA-N 0.000 description 1
- PEFJUUYFEGBXFA-BZSNNMDCSA-N Phe-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 PEFJUUYFEGBXFA-BZSNNMDCSA-N 0.000 description 1
- BNRFQGLWLQESBG-YESZJQIVSA-N Phe-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O BNRFQGLWLQESBG-YESZJQIVSA-N 0.000 description 1
- SCKXGHWQPPURGT-KKUMJFAQSA-N Phe-Lys-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O SCKXGHWQPPURGT-KKUMJFAQSA-N 0.000 description 1
- YOFKMVUAZGPFCF-IHRRRGAJSA-N Phe-Met-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(O)=O YOFKMVUAZGPFCF-IHRRRGAJSA-N 0.000 description 1
- KAJLHCWRWDSROH-BZSNNMDCSA-N Phe-Phe-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=CC=C1 KAJLHCWRWDSROH-BZSNNMDCSA-N 0.000 description 1
- IWZRODDWOSIXPZ-IRXDYDNUSA-N Phe-Phe-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)NCC(O)=O)C1=CC=CC=C1 IWZRODDWOSIXPZ-IRXDYDNUSA-N 0.000 description 1
- AXIOGMQCDYVTNY-ACRUOGEOSA-N Phe-Phe-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 AXIOGMQCDYVTNY-ACRUOGEOSA-N 0.000 description 1
- WKLMCMXFMQEKCX-SLFFLAALSA-N Phe-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC3=CC=CC=C3)N)C(=O)O WKLMCMXFMQEKCX-SLFFLAALSA-N 0.000 description 1
- MGLBSROLWAWCKN-FCLVOEFKSA-N Phe-Phe-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MGLBSROLWAWCKN-FCLVOEFKSA-N 0.000 description 1
- QARPMYDMYVLFMW-KKUMJFAQSA-N Phe-Pro-Glu Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(O)=O)C1=CC=CC=C1 QARPMYDMYVLFMW-KKUMJFAQSA-N 0.000 description 1
- MMJJFXWMCMJMQA-STQMWFEESA-N Phe-Pro-Gly Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)NCC(O)=O)C1=CC=CC=C1 MMJJFXWMCMJMQA-STQMWFEESA-N 0.000 description 1
- ZVRJWDUPIDMHDN-ULQDDVLXSA-N Phe-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 ZVRJWDUPIDMHDN-ULQDDVLXSA-N 0.000 description 1
- FKFCKDROTNIVSO-JYJNAYRXSA-N Phe-Pro-Met Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(O)=O FKFCKDROTNIVSO-JYJNAYRXSA-N 0.000 description 1
- JHSRGEODDALISP-XVSYOHENSA-N Phe-Thr-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O JHSRGEODDALISP-XVSYOHENSA-N 0.000 description 1
- YDUGVDGFKNXFPL-IXOXFDKPSA-N Phe-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N)O YDUGVDGFKNXFPL-IXOXFDKPSA-N 0.000 description 1
- XNQMZHLAYFWSGJ-HTUGSXCWSA-N Phe-Thr-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XNQMZHLAYFWSGJ-HTUGSXCWSA-N 0.000 description 1
- GTMSCDVFQLNEOY-BZSNNMDCSA-N Phe-Tyr-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N GTMSCDVFQLNEOY-BZSNNMDCSA-N 0.000 description 1
- FRMKIPSIZSFTTE-HJOGWXRNSA-N Phe-Tyr-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O FRMKIPSIZSFTTE-HJOGWXRNSA-N 0.000 description 1
- SJRQWEDYTKYHHL-SLFFLAALSA-N Phe-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC3=CC=CC=C3)N)C(=O)O SJRQWEDYTKYHHL-SLFFLAALSA-N 0.000 description 1
- MHNBYYFXWDUGBW-RPTUDFQQSA-N Phe-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CC=CC=C2)N)O MHNBYYFXWDUGBW-RPTUDFQQSA-N 0.000 description 1
- GOUWCZRDTWTODO-YDHLFZDLSA-N Phe-Val-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O GOUWCZRDTWTODO-YDHLFZDLSA-N 0.000 description 1
- KUSYCSMTTHSZOA-DZKIICNBSA-N Phe-Val-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N KUSYCSMTTHSZOA-DZKIICNBSA-N 0.000 description 1
- JTKGCYOOJLUETJ-ULQDDVLXSA-N Phe-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 JTKGCYOOJLUETJ-ULQDDVLXSA-N 0.000 description 1
- APZNYJFGVAGFCF-JYJNAYRXSA-N Phe-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)Cc1ccccc1)C(C)C)C(O)=O APZNYJFGVAGFCF-JYJNAYRXSA-N 0.000 description 1
- IWNOFCGBMSFTBC-CIUDSAMLSA-N Pro-Ala-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IWNOFCGBMSFTBC-CIUDSAMLSA-N 0.000 description 1
- KIZQGKLMXKGDIV-BQBZGAKWSA-N Pro-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 KIZQGKLMXKGDIV-BQBZGAKWSA-N 0.000 description 1
- FYQSMXKJYTZYRP-DCAQKATOSA-N Pro-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 FYQSMXKJYTZYRP-DCAQKATOSA-N 0.000 description 1
- CYQQWUPHIZVCNY-GUBZILKMSA-N Pro-Arg-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CYQQWUPHIZVCNY-GUBZILKMSA-N 0.000 description 1
- ORPZXBQTEHINPB-SRVKXCTJSA-N Pro-Arg-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H]1CCCN1)C(O)=O ORPZXBQTEHINPB-SRVKXCTJSA-N 0.000 description 1
- UVKNEILZSJMKSR-FXQIFTODSA-N Pro-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1 UVKNEILZSJMKSR-FXQIFTODSA-N 0.000 description 1
- SMCHPSMKAFIERP-FXQIFTODSA-N Pro-Asn-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@@H]1CCCN1 SMCHPSMKAFIERP-FXQIFTODSA-N 0.000 description 1
- OBVCYFIHIIYIQF-CIUDSAMLSA-N Pro-Asn-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O OBVCYFIHIIYIQF-CIUDSAMLSA-N 0.000 description 1
- XROLYVMNVIKVEM-BQBZGAKWSA-N Pro-Asn-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O XROLYVMNVIKVEM-BQBZGAKWSA-N 0.000 description 1
- AMBLXEMWFARNNQ-DCAQKATOSA-N Pro-Asn-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@@H]1CCCN1 AMBLXEMWFARNNQ-DCAQKATOSA-N 0.000 description 1
- TXPUNZXZDVJUJQ-LPEHRKFASA-N Pro-Asn-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)N)C(=O)N2CCC[C@@H]2C(=O)O TXPUNZXZDVJUJQ-LPEHRKFASA-N 0.000 description 1
- SWXSLPHTJVAWDF-VEVYYDQMSA-N Pro-Asn-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWXSLPHTJVAWDF-VEVYYDQMSA-N 0.000 description 1
- GDXZRWYXJSGWIV-GMOBBJLQSA-N Pro-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 GDXZRWYXJSGWIV-GMOBBJLQSA-N 0.000 description 1
- NOXSEHJOXCWRHK-DCAQKATOSA-N Pro-Cys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@@H]1CCCN1 NOXSEHJOXCWRHK-DCAQKATOSA-N 0.000 description 1
- CKXMGSJPDQXBPG-JYJNAYRXSA-N Pro-Cys-Trp Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O CKXMGSJPDQXBPG-JYJNAYRXSA-N 0.000 description 1
- ZPPVJIJMIKTERM-YUMQZZPRSA-N Pro-Gln-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(=O)N)NC(=O)[C@@H]1CCCN1 ZPPVJIJMIKTERM-YUMQZZPRSA-N 0.000 description 1
- CLNJSLSHKJECME-BQBZGAKWSA-N Pro-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H]1CCCN1 CLNJSLSHKJECME-BQBZGAKWSA-N 0.000 description 1
- HAAQQNHQZBOWFO-LURJTMIESA-N Pro-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H]1CCCN1 HAAQQNHQZBOWFO-LURJTMIESA-N 0.000 description 1
- FKLSMYYLJHYPHH-UWVGGRQHSA-N Pro-Gly-Leu Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O FKLSMYYLJHYPHH-UWVGGRQHSA-N 0.000 description 1
- UIMCLYYSUCIUJM-UWVGGRQHSA-N Pro-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 UIMCLYYSUCIUJM-UWVGGRQHSA-N 0.000 description 1
- FEVDNIBDCRKMER-IUCAKERBSA-N Pro-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@@H]1CCCN1 FEVDNIBDCRKMER-IUCAKERBSA-N 0.000 description 1
- BBFRBZYKHIKFBX-GMOBBJLQSA-N Pro-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@@H]1CCCN1 BBFRBZYKHIKFBX-GMOBBJLQSA-N 0.000 description 1
- KWMUAKQOVYCQJQ-ZPFDUUQYSA-N Pro-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@@H]1CCCN1 KWMUAKQOVYCQJQ-ZPFDUUQYSA-N 0.000 description 1
- VZKBJNBZMZHKRC-XUXIUFHCSA-N Pro-Ile-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O VZKBJNBZMZHKRC-XUXIUFHCSA-N 0.000 description 1
- BCNRNJWSRFDPTQ-HJWJTTGWSA-N Pro-Ile-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BCNRNJWSRFDPTQ-HJWJTTGWSA-N 0.000 description 1
- AUQGUYPHJSMAKI-CYDGBPFRSA-N Pro-Ile-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 AUQGUYPHJSMAKI-CYDGBPFRSA-N 0.000 description 1
- RUDOLGWDSKQQFF-DCAQKATOSA-N Pro-Leu-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O RUDOLGWDSKQQFF-DCAQKATOSA-N 0.000 description 1
- BRJGUPWVFXKBQI-XUXIUFHCSA-N Pro-Leu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BRJGUPWVFXKBQI-XUXIUFHCSA-N 0.000 description 1
- VTFXTWDFPTWNJY-RHYQMDGZSA-N Pro-Leu-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VTFXTWDFPTWNJY-RHYQMDGZSA-N 0.000 description 1
- CPRLKHJUFAXVTD-ULQDDVLXSA-N Pro-Leu-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CPRLKHJUFAXVTD-ULQDDVLXSA-N 0.000 description 1
- SUENWIFTSTWUKD-AVGNSLFASA-N Pro-Leu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SUENWIFTSTWUKD-AVGNSLFASA-N 0.000 description 1
- OFGUOWQVEGTVNU-DCAQKATOSA-N Pro-Lys-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O OFGUOWQVEGTVNU-DCAQKATOSA-N 0.000 description 1
- ZLXKLMHAMDENIO-DCAQKATOSA-N Pro-Lys-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLXKLMHAMDENIO-DCAQKATOSA-N 0.000 description 1
- ABSSTGUCBCDKMU-UWVGGRQHSA-N Pro-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H]1CCCN1 ABSSTGUCBCDKMU-UWVGGRQHSA-N 0.000 description 1
- AWQGDZBKQTYNMN-IHRRRGAJSA-N Pro-Phe-Asp Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N[C@@H](CC(=O)O)C(=O)O AWQGDZBKQTYNMN-IHRRRGAJSA-N 0.000 description 1
- WHNJMTHJGCEKGA-ULQDDVLXSA-N Pro-Phe-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WHNJMTHJGCEKGA-ULQDDVLXSA-N 0.000 description 1
- BUEIYHBJHCDAMI-UFYCRDLUSA-N Pro-Phe-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BUEIYHBJHCDAMI-UFYCRDLUSA-N 0.000 description 1
- HOTVCUAVDQHUDB-UFYCRDLUSA-N Pro-Phe-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 HOTVCUAVDQHUDB-UFYCRDLUSA-N 0.000 description 1
- PCWLNNZTBJTZRN-AVGNSLFASA-N Pro-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 PCWLNNZTBJTZRN-AVGNSLFASA-N 0.000 description 1
- KWMZPPWYBVZIER-XGEHTFHBSA-N Pro-Ser-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWMZPPWYBVZIER-XGEHTFHBSA-N 0.000 description 1
- UGDMQJSXSSZUKL-IHRRRGAJSA-N Pro-Ser-Tyr Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O UGDMQJSXSSZUKL-IHRRRGAJSA-N 0.000 description 1
- PRKWBYCXBBSLSK-GUBZILKMSA-N Pro-Ser-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O PRKWBYCXBBSLSK-GUBZILKMSA-N 0.000 description 1
- KIDXAAQVMNLJFQ-KZVJFYERSA-N Pro-Thr-Ala Chemical compound C[C@@H](O)[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](C)C(O)=O KIDXAAQVMNLJFQ-KZVJFYERSA-N 0.000 description 1
- DCHQYSOGURGJST-FJXKBIBVSA-N Pro-Thr-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O DCHQYSOGURGJST-FJXKBIBVSA-N 0.000 description 1
- GBUNEGKQPSAMNK-QTKMDUPCSA-N Pro-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@@H]2CCCN2)O GBUNEGKQPSAMNK-QTKMDUPCSA-N 0.000 description 1
- JDJMFMVVJHLWDP-UNQGMJICSA-N Pro-Thr-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JDJMFMVVJHLWDP-UNQGMJICSA-N 0.000 description 1
- AIOWVDNPESPXRB-YTWAJWBKSA-N Pro-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2)O AIOWVDNPESPXRB-YTWAJWBKSA-N 0.000 description 1
- GZNYIXWOIUFLGO-ZJDVBMNYSA-N Pro-Thr-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZNYIXWOIUFLGO-ZJDVBMNYSA-N 0.000 description 1
- CNUIHOAISPKQPY-HSHDSVGOSA-N Pro-Thr-Trp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O CNUIHOAISPKQPY-HSHDSVGOSA-N 0.000 description 1
- VVAWNPIOYXAMAL-KJEVXHAQSA-N Pro-Thr-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VVAWNPIOYXAMAL-KJEVXHAQSA-N 0.000 description 1
- XDKKMRPRRCOELJ-GUBZILKMSA-N Pro-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 XDKKMRPRRCOELJ-GUBZILKMSA-N 0.000 description 1
- ZAUHSLVPDLNTRZ-QXEWZRGKSA-N Pro-Val-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ZAUHSLVPDLNTRZ-QXEWZRGKSA-N 0.000 description 1
- IMNVAOPEMFDAQD-NHCYSSNCSA-N Pro-Val-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IMNVAOPEMFDAQD-NHCYSSNCSA-N 0.000 description 1
- UCTIUWKCVNGEFH-OBJOEFQTSA-N Pro-Val-Gly-Pro Chemical compound N([C@@H](C(C)C)C(=O)NCC(=O)N1[C@@H](CCC1)C(O)=O)C(=O)[C@@H]1CCCN1 UCTIUWKCVNGEFH-OBJOEFQTSA-N 0.000 description 1
- IIRBTQHFVNGPMQ-AVGNSLFASA-N Pro-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 IIRBTQHFVNGPMQ-AVGNSLFASA-N 0.000 description 1
- VDHGTOHMHHQSKG-JYJNAYRXSA-N Pro-Val-Phe Chemical compound CC(C)[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O VDHGTOHMHHQSKG-JYJNAYRXSA-N 0.000 description 1
- 102100033954 Protein PRRC2A Human genes 0.000 description 1
- 241000221523 Rhodotorula toruloides Species 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- 108020000772 Ribose-Phosphate Pyrophosphokinase Proteins 0.000 description 1
- 102000000439 Ribose-phosphate pyrophosphokinase Human genes 0.000 description 1
- 102100035914 S-adenosylmethionine decarboxylase proenzyme Human genes 0.000 description 1
- 108050004491 S-adenosylmethionine decarboxylase proenzyme Proteins 0.000 description 1
- 102100026115 S-adenosylmethionine synthase isoform type-1 Human genes 0.000 description 1
- 102100034187 S-methyl-5'-thioadenosine phosphorylase Human genes 0.000 description 1
- 101150032645 SPE1 gene Proteins 0.000 description 1
- 101150089804 SPE2 gene Proteins 0.000 description 1
- 241000235070 Saccharomyces Species 0.000 description 1
- 101100366397 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) SPE3 gene Proteins 0.000 description 1
- 101100261151 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) TPO5 gene Proteins 0.000 description 1
- 241000235346 Schizosaccharomyces Species 0.000 description 1
- 241000311088 Schwanniomyces Species 0.000 description 1
- ZUGXSSFMTXKHJS-ZLUOBGJFSA-N Ser-Ala-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O ZUGXSSFMTXKHJS-ZLUOBGJFSA-N 0.000 description 1
- SRTCFKGBYBZRHA-ACZMJKKPSA-N Ser-Ala-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SRTCFKGBYBZRHA-ACZMJKKPSA-N 0.000 description 1
- BTKUIVBNGBFTTP-WHFBIAKZSA-N Ser-Ala-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)NCC(O)=O BTKUIVBNGBFTTP-WHFBIAKZSA-N 0.000 description 1
- WTUJZHKANPDPIN-CIUDSAMLSA-N Ser-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N WTUJZHKANPDPIN-CIUDSAMLSA-N 0.000 description 1
- JPIDMRXXNMIVKY-VZFHVOOUSA-N Ser-Ala-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPIDMRXXNMIVKY-VZFHVOOUSA-N 0.000 description 1
- KYKKKSWGEPFUMR-NAKRPEOUSA-N Ser-Arg-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KYKKKSWGEPFUMR-NAKRPEOUSA-N 0.000 description 1
- RZUOXAKGNHXZTB-GUBZILKMSA-N Ser-Arg-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O RZUOXAKGNHXZTB-GUBZILKMSA-N 0.000 description 1
- HBOABDXGTMMDSE-GUBZILKMSA-N Ser-Arg-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O HBOABDXGTMMDSE-GUBZILKMSA-N 0.000 description 1
- FIDMVVBUOCMMJG-CIUDSAMLSA-N Ser-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO FIDMVVBUOCMMJG-CIUDSAMLSA-N 0.000 description 1
- VGNYHOBZJKWRGI-CIUDSAMLSA-N Ser-Asn-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO VGNYHOBZJKWRGI-CIUDSAMLSA-N 0.000 description 1
- KAAPNMOKUUPKOE-SRVKXCTJSA-N Ser-Asn-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KAAPNMOKUUPKOE-SRVKXCTJSA-N 0.000 description 1
- DKKGAAJTDKHWOD-BIIVOSGPSA-N Ser-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N)C(=O)O DKKGAAJTDKHWOD-BIIVOSGPSA-N 0.000 description 1
- KNZQGAUEYZJUSQ-ZLUOBGJFSA-N Ser-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N KNZQGAUEYZJUSQ-ZLUOBGJFSA-N 0.000 description 1
- SFZKGGOGCNQPJY-CIUDSAMLSA-N Ser-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N SFZKGGOGCNQPJY-CIUDSAMLSA-N 0.000 description 1
- GHPQVUYZQQGEDA-BIIVOSGPSA-N Ser-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N)C(=O)O GHPQVUYZQQGEDA-BIIVOSGPSA-N 0.000 description 1
- MMAPOBOTRUVNKJ-ZLUOBGJFSA-N Ser-Asp-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CO)N)C(=O)O MMAPOBOTRUVNKJ-ZLUOBGJFSA-N 0.000 description 1
- BTPAWKABYQMKKN-LKXGYXEUSA-N Ser-Asp-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BTPAWKABYQMKKN-LKXGYXEUSA-N 0.000 description 1
- HVKMTOIAYDOJPL-NRPADANISA-N Ser-Gln-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O HVKMTOIAYDOJPL-NRPADANISA-N 0.000 description 1
- SQBLRDDJTUJDMV-ACZMJKKPSA-N Ser-Glu-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQBLRDDJTUJDMV-ACZMJKKPSA-N 0.000 description 1
- HJEBZBMOTCQYDN-ACZMJKKPSA-N Ser-Glu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HJEBZBMOTCQYDN-ACZMJKKPSA-N 0.000 description 1
- YQQKYAZABFEYAF-FXQIFTODSA-N Ser-Glu-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQQKYAZABFEYAF-FXQIFTODSA-N 0.000 description 1
- YRBGKVIWMNEVCZ-WDSKDSINSA-N Ser-Glu-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O YRBGKVIWMNEVCZ-WDSKDSINSA-N 0.000 description 1
- DSGYZICNAMEJOC-AVGNSLFASA-N Ser-Glu-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DSGYZICNAMEJOC-AVGNSLFASA-N 0.000 description 1
- VQBCMLMPEWPUTB-ACZMJKKPSA-N Ser-Glu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VQBCMLMPEWPUTB-ACZMJKKPSA-N 0.000 description 1
- GZBKRJVCRMZAST-XKBZYTNZSA-N Ser-Glu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZBKRJVCRMZAST-XKBZYTNZSA-N 0.000 description 1
- AEGUWTFAQQWVLC-BQBZGAKWSA-N Ser-Gly-Arg Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O AEGUWTFAQQWVLC-BQBZGAKWSA-N 0.000 description 1
- MIJWOJAXARLEHA-WDSKDSINSA-N Ser-Gly-Glu Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O MIJWOJAXARLEHA-WDSKDSINSA-N 0.000 description 1
- WSTIOCFMWXNOCX-YUMQZZPRSA-N Ser-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N WSTIOCFMWXNOCX-YUMQZZPRSA-N 0.000 description 1
- FYUIFUJFNCLUIX-XVYDVKMFSA-N Ser-His-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O FYUIFUJFNCLUIX-XVYDVKMFSA-N 0.000 description 1
- XERQKTRGJIKTRB-CIUDSAMLSA-N Ser-His-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CO)N)CC1=CN=CN1 XERQKTRGJIKTRB-CIUDSAMLSA-N 0.000 description 1
- UGHCUDLCCVVIJR-VGDYDELISA-N Ser-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CO)N UGHCUDLCCVVIJR-VGDYDELISA-N 0.000 description 1
- SFTZTYBXIXLRGQ-JBDRJPRFSA-N Ser-Ile-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SFTZTYBXIXLRGQ-JBDRJPRFSA-N 0.000 description 1
- DLPXTCTVNDTYGJ-JBDRJPRFSA-N Ser-Ile-Cys Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CS)C(O)=O DLPXTCTVNDTYGJ-JBDRJPRFSA-N 0.000 description 1
- ZOPISOXXPQNOCO-SVSWQMSJSA-N Ser-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CO)N ZOPISOXXPQNOCO-SVSWQMSJSA-N 0.000 description 1
- MQQBBLVOUUJKLH-HJPIBITLSA-N Ser-Ile-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MQQBBLVOUUJKLH-HJPIBITLSA-N 0.000 description 1
- FUMGHWDRRFCKEP-CIUDSAMLSA-N Ser-Leu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O FUMGHWDRRFCKEP-CIUDSAMLSA-N 0.000 description 1
- KCNSGAMPBPYUAI-CIUDSAMLSA-N Ser-Leu-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O KCNSGAMPBPYUAI-CIUDSAMLSA-N 0.000 description 1
- NLOAIFSWUUFQFR-CIUDSAMLSA-N Ser-Leu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O NLOAIFSWUUFQFR-CIUDSAMLSA-N 0.000 description 1
- IAORETPTUDBBGV-CIUDSAMLSA-N Ser-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N IAORETPTUDBBGV-CIUDSAMLSA-N 0.000 description 1
- IUXGJEIKJBYKOO-SRVKXCTJSA-N Ser-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CO)N IUXGJEIKJBYKOO-SRVKXCTJSA-N 0.000 description 1
- HEUVHBXOVZONPU-BJDJZHNGSA-N Ser-Leu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HEUVHBXOVZONPU-BJDJZHNGSA-N 0.000 description 1
- UBRMZSHOOIVJPW-SRVKXCTJSA-N Ser-Leu-Lys Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O UBRMZSHOOIVJPW-SRVKXCTJSA-N 0.000 description 1
- BYCVMHKULKRVPV-GUBZILKMSA-N Ser-Lys-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O BYCVMHKULKRVPV-GUBZILKMSA-N 0.000 description 1
- CRJZZXMAADSBBQ-SRVKXCTJSA-N Ser-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO CRJZZXMAADSBBQ-SRVKXCTJSA-N 0.000 description 1
- FPCGZYMRFFIYIH-CIUDSAMLSA-N Ser-Lys-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O FPCGZYMRFFIYIH-CIUDSAMLSA-N 0.000 description 1
- PMCMLDNPAZUYGI-DCAQKATOSA-N Ser-Lys-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PMCMLDNPAZUYGI-DCAQKATOSA-N 0.000 description 1
- UGGWCAFQPKANMW-FXQIFTODSA-N Ser-Met-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O UGGWCAFQPKANMW-FXQIFTODSA-N 0.000 description 1
- KJKQUQXDEKMPDK-FXQIFTODSA-N Ser-Met-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O KJKQUQXDEKMPDK-FXQIFTODSA-N 0.000 description 1
- NIOYDASGXWLHEZ-CIUDSAMLSA-N Ser-Met-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O NIOYDASGXWLHEZ-CIUDSAMLSA-N 0.000 description 1
- QSHKTZVJGDVFEW-GUBZILKMSA-N Ser-Met-Met Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CO)N QSHKTZVJGDVFEW-GUBZILKMSA-N 0.000 description 1
- JJUNLJTUIKFPRF-BPUTZDHNSA-N Ser-Met-Trp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CO)N JJUNLJTUIKFPRF-BPUTZDHNSA-N 0.000 description 1
- FZEUTKVQGMVGHW-AVGNSLFASA-N Ser-Phe-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O FZEUTKVQGMVGHW-AVGNSLFASA-N 0.000 description 1
- UPLYXVPQLJVWMM-KKUMJFAQSA-N Ser-Phe-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UPLYXVPQLJVWMM-KKUMJFAQSA-N 0.000 description 1
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 1
- KQNDIKOYWZTZIX-FXQIFTODSA-N Ser-Ser-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KQNDIKOYWZTZIX-FXQIFTODSA-N 0.000 description 1
- PPCZVWHJWJFTFN-ZLUOBGJFSA-N Ser-Ser-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPCZVWHJWJFTFN-ZLUOBGJFSA-N 0.000 description 1
- JCLAFVNDBJMLBC-JBDRJPRFSA-N Ser-Ser-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JCLAFVNDBJMLBC-JBDRJPRFSA-N 0.000 description 1
- PYTKULIABVRXSC-BWBBJGPYSA-N Ser-Ser-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PYTKULIABVRXSC-BWBBJGPYSA-N 0.000 description 1
- VGQVAVQWKJLIRM-FXQIFTODSA-N Ser-Ser-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O VGQVAVQWKJLIRM-FXQIFTODSA-N 0.000 description 1
- KKKVOZNCLALMPV-XKBZYTNZSA-N Ser-Thr-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O KKKVOZNCLALMPV-XKBZYTNZSA-N 0.000 description 1
- DYEGLQRVMBWQLD-IXOXFDKPSA-N Ser-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CO)N)O DYEGLQRVMBWQLD-IXOXFDKPSA-N 0.000 description 1
- SNXUIBACCONSOH-BWBBJGPYSA-N Ser-Thr-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CO)C(O)=O SNXUIBACCONSOH-BWBBJGPYSA-N 0.000 description 1
- VAIWUNAAPZZGRI-IHPCNDPISA-N Ser-Trp-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CO)N VAIWUNAAPZZGRI-IHPCNDPISA-N 0.000 description 1
- UBTNVMGPMYDYIU-HJPIBITLSA-N Ser-Tyr-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UBTNVMGPMYDYIU-HJPIBITLSA-N 0.000 description 1
- PCMZJFMUYWIERL-ZKWXMUAHSA-N Ser-Val-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O PCMZJFMUYWIERL-ZKWXMUAHSA-N 0.000 description 1
- UKKROEYWYIHWBD-ZKWXMUAHSA-N Ser-Val-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O UKKROEYWYIHWBD-ZKWXMUAHSA-N 0.000 description 1
- BEBVVQPDSHHWQL-NRPADANISA-N Ser-Val-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BEBVVQPDSHHWQL-NRPADANISA-N 0.000 description 1
- YEDSOSIKVUMIJE-DCAQKATOSA-N Ser-Val-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O YEDSOSIKVUMIJE-DCAQKATOSA-N 0.000 description 1
- ANOQEBQWIAYIMV-AEJSXWLSSA-N Ser-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N ANOQEBQWIAYIMV-AEJSXWLSSA-N 0.000 description 1
- JGUWRQWULDWNCM-FXQIFTODSA-N Ser-Val-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O JGUWRQWULDWNCM-FXQIFTODSA-N 0.000 description 1
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 1
- 241000208292 Solanaceae Species 0.000 description 1
- 240000003768 Solanum lycopersicum Species 0.000 description 1
- 244000061456 Solanum tuberosum Species 0.000 description 1
- 235000002595 Solanum tuberosum Nutrition 0.000 description 1
- 238000002105 Southern blotting Methods 0.000 description 1
- 235000021355 Stearic acid Nutrition 0.000 description 1
- 108700005078 Synthetic Genes Proteins 0.000 description 1
- STGXWWBXWXZOER-MBLNEYKQSA-N Thr-Ala-His Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 STGXWWBXWXZOER-MBLNEYKQSA-N 0.000 description 1
- ZUXQFMVPAYGPFJ-JXUBOQSCSA-N Thr-Ala-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN ZUXQFMVPAYGPFJ-JXUBOQSCSA-N 0.000 description 1
- CAJFZCICSVBOJK-SHGPDSBTSA-N Thr-Ala-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAJFZCICSVBOJK-SHGPDSBTSA-N 0.000 description 1
- DGDCHPCRMWEOJR-FQPOAREZSA-N Thr-Ala-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 DGDCHPCRMWEOJR-FQPOAREZSA-N 0.000 description 1
- CEXFELBFVHLYDZ-XGEHTFHBSA-N Thr-Arg-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CEXFELBFVHLYDZ-XGEHTFHBSA-N 0.000 description 1
- JHBHMCMKSPXRHV-NUMRIWBASA-N Thr-Asn-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O JHBHMCMKSPXRHV-NUMRIWBASA-N 0.000 description 1
- GKMYGVQDGVYCPC-IUKAMOBKSA-N Thr-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H]([C@@H](C)O)N GKMYGVQDGVYCPC-IUKAMOBKSA-N 0.000 description 1
- OHAJHDJOCKKJLV-LKXGYXEUSA-N Thr-Asp-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O OHAJHDJOCKKJLV-LKXGYXEUSA-N 0.000 description 1
- VUKVQVNKIIZBPO-HOUAVDHOSA-N Thr-Asp-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O VUKVQVNKIIZBPO-HOUAVDHOSA-N 0.000 description 1
- ZUUDNCOCILSYAM-KKHAAJSZSA-N Thr-Asp-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ZUUDNCOCILSYAM-KKHAAJSZSA-N 0.000 description 1
- QWMPARMKIDVBLV-VZFHVOOUSA-N Thr-Cys-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O QWMPARMKIDVBLV-VZFHVOOUSA-N 0.000 description 1
- ASJDFGOPDCVXTG-KATARQTJSA-N Thr-Cys-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O ASJDFGOPDCVXTG-KATARQTJSA-N 0.000 description 1
- MMTOHPRBJKEZHT-BWBBJGPYSA-N Thr-Cys-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O MMTOHPRBJKEZHT-BWBBJGPYSA-N 0.000 description 1
- OYTNZCBFDXGQGE-XQXXSGGOSA-N Thr-Gln-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](C)C(=O)O)N)O OYTNZCBFDXGQGE-XQXXSGGOSA-N 0.000 description 1
- VUVCRYXYUUPGSB-GLLZPBPUSA-N Thr-Gln-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O VUVCRYXYUUPGSB-GLLZPBPUSA-N 0.000 description 1
- KGKWKSSSQGGYAU-SUSMZKCASA-N Thr-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KGKWKSSSQGGYAU-SUSMZKCASA-N 0.000 description 1
- XOTBWOCSLMBGMF-SUSMZKCASA-N Thr-Glu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOTBWOCSLMBGMF-SUSMZKCASA-N 0.000 description 1
- YZUWGFXVVZQJEI-PMVVWTBXSA-N Thr-Gly-His Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O YZUWGFXVVZQJEI-PMVVWTBXSA-N 0.000 description 1
- SIMKLINEDYOTKL-MBLNEYKQSA-N Thr-His-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](C)C(=O)O)N)O SIMKLINEDYOTKL-MBLNEYKQSA-N 0.000 description 1
- IGGFFPOIFHZYKC-PBCZWWQYSA-N Thr-His-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O IGGFFPOIFHZYKC-PBCZWWQYSA-N 0.000 description 1
- XOWKUMFHEZLKLT-CIQUZCHMSA-N Thr-Ile-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O XOWKUMFHEZLKLT-CIQUZCHMSA-N 0.000 description 1
- CRZNCABIJLRFKZ-IUKAMOBKSA-N Thr-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N CRZNCABIJLRFKZ-IUKAMOBKSA-N 0.000 description 1
- DDDLIMCZFKOERC-SVSWQMSJSA-N Thr-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N DDDLIMCZFKOERC-SVSWQMSJSA-N 0.000 description 1
- URPSJRMWHQTARR-MBLNEYKQSA-N Thr-Ile-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O URPSJRMWHQTARR-MBLNEYKQSA-N 0.000 description 1
- ADPHPKGWVDHWML-PPCPHDFISA-N Thr-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N ADPHPKGWVDHWML-PPCPHDFISA-N 0.000 description 1
- IHAPJUHCZXBPHR-WZLNRYEVSA-N Thr-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N IHAPJUHCZXBPHR-WZLNRYEVSA-N 0.000 description 1
- IMDMLDSVUSMAEJ-HJGDQZAQSA-N Thr-Leu-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IMDMLDSVUSMAEJ-HJGDQZAQSA-N 0.000 description 1
- RRRRCRYTLZVCEN-HJGDQZAQSA-N Thr-Leu-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O RRRRCRYTLZVCEN-HJGDQZAQSA-N 0.000 description 1
- VTVVYQOXJCZVEB-WDCWCFNPSA-N Thr-Leu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O VTVVYQOXJCZVEB-WDCWCFNPSA-N 0.000 description 1
- NCXVJIQMWSGRHY-KXNHARMFSA-N Thr-Leu-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O NCXVJIQMWSGRHY-KXNHARMFSA-N 0.000 description 1
- VRUFCJZQDACGLH-UVOCVTCTSA-N Thr-Leu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VRUFCJZQDACGLH-UVOCVTCTSA-N 0.000 description 1
- IJVNLNRVDUTWDD-MEYUZBJRSA-N Thr-Leu-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IJVNLNRVDUTWDD-MEYUZBJRSA-N 0.000 description 1
- UUSQVWOVUYMLJA-PPCPHDFISA-N Thr-Lys-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UUSQVWOVUYMLJA-PPCPHDFISA-N 0.000 description 1
- SPVHQURZJCUDQC-VOAKCMCISA-N Thr-Lys-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O SPVHQURZJCUDQC-VOAKCMCISA-N 0.000 description 1
- DCRHJDRLCFMEBI-RHYQMDGZSA-N Thr-Lys-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(O)=O DCRHJDRLCFMEBI-RHYQMDGZSA-N 0.000 description 1
- KDGBLMDAPJTQIW-RHYQMDGZSA-N Thr-Met-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)O)N)O KDGBLMDAPJTQIW-RHYQMDGZSA-N 0.000 description 1
- KPNSNVTUVKSBFL-ZJDVBMNYSA-N Thr-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KPNSNVTUVKSBFL-ZJDVBMNYSA-N 0.000 description 1
- GUHLYMZJVXUIPO-RCWTZXSCSA-N Thr-Met-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O GUHLYMZJVXUIPO-RCWTZXSCSA-N 0.000 description 1
- WVVOFCVMHAXGLE-LFSVMHDDSA-N Thr-Phe-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O WVVOFCVMHAXGLE-LFSVMHDDSA-N 0.000 description 1
- BIBYEFRASCNLAA-CDMKHQONSA-N Thr-Phe-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 BIBYEFRASCNLAA-CDMKHQONSA-N 0.000 description 1
- WTMPKZWHRCMMMT-KZVJFYERSA-N Thr-Pro-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WTMPKZWHRCMMMT-KZVJFYERSA-N 0.000 description 1
- XKWABWFMQXMUMT-HJGDQZAQSA-N Thr-Pro-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O XKWABWFMQXMUMT-HJGDQZAQSA-N 0.000 description 1
- DEGCBBCMYWNJNA-RHYQMDGZSA-N Thr-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O DEGCBBCMYWNJNA-RHYQMDGZSA-N 0.000 description 1
- XHWCDRUPDNSDAZ-XKBZYTNZSA-N Thr-Ser-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O XHWCDRUPDNSDAZ-XKBZYTNZSA-N 0.000 description 1
- SGAOHNPSEPVAFP-ZDLURKLDSA-N Thr-Ser-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SGAOHNPSEPVAFP-ZDLURKLDSA-N 0.000 description 1
- VUXIQSUQQYNLJP-XAVMHZPKSA-N Thr-Ser-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N)O VUXIQSUQQYNLJP-XAVMHZPKSA-N 0.000 description 1
- RVMNUBQWPVOUKH-HEIBUPTGSA-N Thr-Ser-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RVMNUBQWPVOUKH-HEIBUPTGSA-N 0.000 description 1
- UQCNIMDPYICBTR-KYNKHSRBSA-N Thr-Thr-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UQCNIMDPYICBTR-KYNKHSRBSA-N 0.000 description 1
- GRIUMVXCJDKVPI-IZPVPAKOSA-N Thr-Thr-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O GRIUMVXCJDKVPI-IZPVPAKOSA-N 0.000 description 1
- FBQHKSPOIAFUEI-OWLDWWDNSA-N Thr-Trp-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(O)=O FBQHKSPOIAFUEI-OWLDWWDNSA-N 0.000 description 1
- IJKNKFJZOJCKRR-GBALPHGKSA-N Thr-Trp-Ser Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 IJKNKFJZOJCKRR-GBALPHGKSA-N 0.000 description 1
- XGFYGMKZKFRGAI-RCWTZXSCSA-N Thr-Val-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N XGFYGMKZKFRGAI-RCWTZXSCSA-N 0.000 description 1
- BKIOKSLLAAZYTC-KKHAAJSZSA-N Thr-Val-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O BKIOKSLLAAZYTC-KKHAAJSZSA-N 0.000 description 1
- BKVICMPZWRNWOC-RHYQMDGZSA-N Thr-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O BKVICMPZWRNWOC-RHYQMDGZSA-N 0.000 description 1
- KZTLZZQTJMCGIP-ZJDVBMNYSA-N Thr-Val-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KZTLZZQTJMCGIP-ZJDVBMNYSA-N 0.000 description 1
- 102000003929 Transaminases Human genes 0.000 description 1
- 108090000340 Transaminases Proteins 0.000 description 1
- 108700009124 Transcription Initiation Site Proteins 0.000 description 1
- 241000223230 Trichosporon Species 0.000 description 1
- 241001480014 Trigonopsis Species 0.000 description 1
- NIWAGRRZHCMPOY-GMVOTWDCSA-N Trp-Ala-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N NIWAGRRZHCMPOY-GMVOTWDCSA-N 0.000 description 1
- PXYJUECTGMGIDT-WDSOQIARSA-N Trp-Arg-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(C)C)C(O)=O)=CNC2=C1 PXYJUECTGMGIDT-WDSOQIARSA-N 0.000 description 1
- ICNFHVUVCNWUAB-SZMVWBNQSA-N Trp-Arg-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N ICNFHVUVCNWUAB-SZMVWBNQSA-N 0.000 description 1
- XZLHHHYSWIYXHD-XIRDDKMYSA-N Trp-Gln-Arg Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O XZLHHHYSWIYXHD-XIRDDKMYSA-N 0.000 description 1
- HQJOVVWAPQPYDS-ZFWWWQNUSA-N Trp-Gly-Arg Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O HQJOVVWAPQPYDS-ZFWWWQNUSA-N 0.000 description 1
- YRXXUYPYPHRJPB-RXVVDRJESA-N Trp-Gly-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)NCC(=O)N[C@@H](CC3=CNC4=CC=CC=C43)C(=O)O)N YRXXUYPYPHRJPB-RXVVDRJESA-N 0.000 description 1
- LDMUNXDDIDAPJH-VMBFOHBNSA-N Trp-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N LDMUNXDDIDAPJH-VMBFOHBNSA-N 0.000 description 1
- UJRIVCPPPMYCNA-HOCLYGCPSA-N Trp-Leu-Gly Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N UJRIVCPPPMYCNA-HOCLYGCPSA-N 0.000 description 1
- IQXWAJUIAQLZNX-IHPCNDPISA-N Trp-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N IQXWAJUIAQLZNX-IHPCNDPISA-N 0.000 description 1
- GWBWCGITOYODER-YTQUADARSA-N Trp-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N GWBWCGITOYODER-YTQUADARSA-N 0.000 description 1
- UKWSFUSPGPBJGU-VFAJRCTISA-N Trp-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O UKWSFUSPGPBJGU-VFAJRCTISA-N 0.000 description 1
- NWQCKAPDGQMZQN-IHPCNDPISA-N Trp-Lys-Leu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O NWQCKAPDGQMZQN-IHPCNDPISA-N 0.000 description 1
- ACGIVBXINJFALS-HKUYNNGSSA-N Trp-Phe-Gly Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N ACGIVBXINJFALS-HKUYNNGSSA-N 0.000 description 1
- GIAMKIPJSRZVJB-IHPCNDPISA-N Trp-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N GIAMKIPJSRZVJB-IHPCNDPISA-N 0.000 description 1
- JEYRCNVVYHTZMY-SZMVWBNQSA-N Trp-Pro-Val Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O JEYRCNVVYHTZMY-SZMVWBNQSA-N 0.000 description 1
- ZZDFLJFVSNQINX-HWHUXHBOSA-N Trp-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N)O ZZDFLJFVSNQINX-HWHUXHBOSA-N 0.000 description 1
- TVOGEPLDNYTAHD-CQDKDKBSSA-N Tyr-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 TVOGEPLDNYTAHD-CQDKDKBSSA-N 0.000 description 1
- MICSYKFECRFCTJ-IHRRRGAJSA-N Tyr-Arg-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O MICSYKFECRFCTJ-IHRRRGAJSA-N 0.000 description 1
- BVWADTBVGZHSLW-IHRRRGAJSA-N Tyr-Asn-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N BVWADTBVGZHSLW-IHRRRGAJSA-N 0.000 description 1
- VTFWAGGJDRSQFG-MELADBBJSA-N Tyr-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O VTFWAGGJDRSQFG-MELADBBJSA-N 0.000 description 1
- JWHOIHCOHMZSAR-QWRGUYRKSA-N Tyr-Asp-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JWHOIHCOHMZSAR-QWRGUYRKSA-N 0.000 description 1
- WPVGRKLNHJJCEN-BZSNNMDCSA-N Tyr-Asp-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 WPVGRKLNHJJCEN-BZSNNMDCSA-N 0.000 description 1
- CRHFOYCJGVJPLE-AVGNSLFASA-N Tyr-Gln-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O CRHFOYCJGVJPLE-AVGNSLFASA-N 0.000 description 1
- NGALWFGCOMHUSN-AVGNSLFASA-N Tyr-Gln-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NGALWFGCOMHUSN-AVGNSLFASA-N 0.000 description 1
- WVRUKYLYMFGKAN-IHRRRGAJSA-N Tyr-Glu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 WVRUKYLYMFGKAN-IHRRRGAJSA-N 0.000 description 1
- OSMTVLSRTQDWHJ-JBACZVJFSA-N Tyr-Glu-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=C(O)C=C1 OSMTVLSRTQDWHJ-JBACZVJFSA-N 0.000 description 1
- CDHQEOXPWBDFPL-QWRGUYRKSA-N Tyr-Gly-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 CDHQEOXPWBDFPL-QWRGUYRKSA-N 0.000 description 1
- KCPFDGNYAMKZQP-KBPBESRZSA-N Tyr-Gly-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O KCPFDGNYAMKZQP-KBPBESRZSA-N 0.000 description 1
- JKUZFODWJGEQAP-KBPBESRZSA-N Tyr-Gly-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N)O JKUZFODWJGEQAP-KBPBESRZSA-N 0.000 description 1
- ADECJAKCRKPSOR-ULQDDVLXSA-N Tyr-His-Arg Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N)O ADECJAKCRKPSOR-ULQDDVLXSA-N 0.000 description 1
- YIKDYZDNRCNFQB-KKUMJFAQSA-N Tyr-His-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O YIKDYZDNRCNFQB-KKUMJFAQSA-N 0.000 description 1
- STTVVMWQKDOKAM-YESZJQIVSA-N Tyr-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC3=CC=C(C=C3)O)N)C(=O)O STTVVMWQKDOKAM-YESZJQIVSA-N 0.000 description 1
- ILTXFANLDMJWPR-SIUGBPQLSA-N Tyr-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N ILTXFANLDMJWPR-SIUGBPQLSA-N 0.000 description 1
- OHOVFPKXPZODHS-SJWGOKEGSA-N Tyr-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N OHOVFPKXPZODHS-SJWGOKEGSA-N 0.000 description 1
- MVFQLSPDMMFCMW-KKUMJFAQSA-N Tyr-Leu-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O MVFQLSPDMMFCMW-KKUMJFAQSA-N 0.000 description 1
- YKCXQOBTISTQJD-BZSNNMDCSA-N Tyr-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N YKCXQOBTISTQJD-BZSNNMDCSA-N 0.000 description 1
- KHCSOLAHNLOXJR-BZSNNMDCSA-N Tyr-Leu-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHCSOLAHNLOXJR-BZSNNMDCSA-N 0.000 description 1
- PRONOHBTMLNXCZ-BZSNNMDCSA-N Tyr-Leu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PRONOHBTMLNXCZ-BZSNNMDCSA-N 0.000 description 1
- DMWNPLOERDAHSY-MEYUZBJRSA-N Tyr-Leu-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DMWNPLOERDAHSY-MEYUZBJRSA-N 0.000 description 1
- OLYXUGBVBGSZDN-ACRUOGEOSA-N Tyr-Leu-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 OLYXUGBVBGSZDN-ACRUOGEOSA-N 0.000 description 1
- GITNQBVCEQBDQC-KKUMJFAQSA-N Tyr-Lys-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O GITNQBVCEQBDQC-KKUMJFAQSA-N 0.000 description 1
- VTCKHZJKWQENKX-KBPBESRZSA-N Tyr-Lys-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O VTCKHZJKWQENKX-KBPBESRZSA-N 0.000 description 1
- ZMKDQRJLMRZHRI-ACRUOGEOSA-N Tyr-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N ZMKDQRJLMRZHRI-ACRUOGEOSA-N 0.000 description 1
- YYLHVUCSTXXKBS-IHRRRGAJSA-N Tyr-Pro-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O YYLHVUCSTXXKBS-IHRRRGAJSA-N 0.000 description 1
- XGZBEGGGAUQBMB-KJEVXHAQSA-N Tyr-Pro-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC2=CC=C(C=C2)O)N)O XGZBEGGGAUQBMB-KJEVXHAQSA-N 0.000 description 1
- GQVZBMROTPEPIF-SRVKXCTJSA-N Tyr-Ser-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O GQVZBMROTPEPIF-SRVKXCTJSA-N 0.000 description 1
- QFXVAFIHVWXXBJ-AVGNSLFASA-N Tyr-Ser-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O QFXVAFIHVWXXBJ-AVGNSLFASA-N 0.000 description 1
- UMSZZGTXGKHTFJ-SRVKXCTJSA-N Tyr-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 UMSZZGTXGKHTFJ-SRVKXCTJSA-N 0.000 description 1
- NZBSVMQZQMEUHI-WZLNRYEVSA-N Tyr-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N NZBSVMQZQMEUHI-WZLNRYEVSA-N 0.000 description 1
- XFEMMSGONWQACR-KJEVXHAQSA-N Tyr-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O XFEMMSGONWQACR-KJEVXHAQSA-N 0.000 description 1
- WYOBRXPIZVKNMF-IRXDYDNUSA-N Tyr-Tyr-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)NCC(O)=O)C1=CC=C(O)C=C1 WYOBRXPIZVKNMF-IRXDYDNUSA-N 0.000 description 1
- KHPLUFDSWGDRHD-SLFFLAALSA-N Tyr-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N)C(=O)O KHPLUFDSWGDRHD-SLFFLAALSA-N 0.000 description 1
- RGJZPXFZIUUQDN-BPNCWPANSA-N Tyr-Val-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O RGJZPXFZIUUQDN-BPNCWPANSA-N 0.000 description 1
- UWHZIFQPPBDJPM-FPLPWBNLSA-M Vaccenic acid Natural products CCCCCC\C=C/CCCCCCCCCC([O-])=O UWHZIFQPPBDJPM-FPLPWBNLSA-M 0.000 description 1
- 235000021322 Vaccenic acid Nutrition 0.000 description 1
- IZFVRRYRMQFVGX-NRPADANISA-N Val-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N IZFVRRYRMQFVGX-NRPADANISA-N 0.000 description 1
- YFOCMOVJBQDBCE-NRPADANISA-N Val-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N YFOCMOVJBQDBCE-NRPADANISA-N 0.000 description 1
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 1
- AZSHAZJLOZQYAY-FXQIFTODSA-N Val-Ala-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O AZSHAZJLOZQYAY-FXQIFTODSA-N 0.000 description 1
- VJOWWOGRNXRQMF-UVBJJODRSA-N Val-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)C(C)C)C(O)=O)=CNC2=C1 VJOWWOGRNXRQMF-UVBJJODRSA-N 0.000 description 1
- UUYCNAXCCDNULB-QXEWZRGKSA-N Val-Arg-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O UUYCNAXCCDNULB-QXEWZRGKSA-N 0.000 description 1
- DCOOGDCRFXXQNW-ZKWXMUAHSA-N Val-Asn-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N DCOOGDCRFXXQNW-ZKWXMUAHSA-N 0.000 description 1
- GXAZTLJYINLMJL-LAEOZQHASA-N Val-Asn-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N GXAZTLJYINLMJL-LAEOZQHASA-N 0.000 description 1
- LNYOXPDEIZJDEI-NHCYSSNCSA-N Val-Asn-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N LNYOXPDEIZJDEI-NHCYSSNCSA-N 0.000 description 1
- DBOXBUDEAJVKRE-LSJOCFKGSA-N Val-Asn-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N DBOXBUDEAJVKRE-LSJOCFKGSA-N 0.000 description 1
- HZYOWMGWKKRMBZ-BYULHYEWSA-N Val-Asp-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HZYOWMGWKKRMBZ-BYULHYEWSA-N 0.000 description 1
- KXUKIBHIVRYOIP-ZKWXMUAHSA-N Val-Asp-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N KXUKIBHIVRYOIP-ZKWXMUAHSA-N 0.000 description 1
- XLDYBRXERHITNH-QSFUFRPTSA-N Val-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)C(C)C XLDYBRXERHITNH-QSFUFRPTSA-N 0.000 description 1
- BMGOFDMKDVVGJG-NHCYSSNCSA-N Val-Asp-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BMGOFDMKDVVGJG-NHCYSSNCSA-N 0.000 description 1
- BWVHQINTNLVWGZ-ZKWXMUAHSA-N Val-Cys-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N BWVHQINTNLVWGZ-ZKWXMUAHSA-N 0.000 description 1
- VXCAZHCVDBQMTP-NRPADANISA-N Val-Cys-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VXCAZHCVDBQMTP-NRPADANISA-N 0.000 description 1
- YCMXFKWYJFZFKS-LAEOZQHASA-N Val-Gln-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCMXFKWYJFZFKS-LAEOZQHASA-N 0.000 description 1
- VFOHXOLPLACADK-GVXVVHGQSA-N Val-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N VFOHXOLPLACADK-GVXVVHGQSA-N 0.000 description 1
- VVZDBPBZHLQPPB-XVKPBYJWSA-N Val-Glu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VVZDBPBZHLQPPB-XVKPBYJWSA-N 0.000 description 1
- ZXAGTABZUOMUDO-GVXVVHGQSA-N Val-Glu-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZXAGTABZUOMUDO-GVXVVHGQSA-N 0.000 description 1
- FOADDSDHGRFUOC-DZKIICNBSA-N Val-Glu-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N FOADDSDHGRFUOC-DZKIICNBSA-N 0.000 description 1
- WDIGUPHXPBMODF-UMNHJUIQSA-N Val-Glu-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N WDIGUPHXPBMODF-UMNHJUIQSA-N 0.000 description 1
- UEHRGZCNLSWGHK-DLOVCJGASA-N Val-Glu-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UEHRGZCNLSWGHK-DLOVCJGASA-N 0.000 description 1
- CELJCNRXKZPTCX-XPUUQOCRSA-N Val-Gly-Ala Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O CELJCNRXKZPTCX-XPUUQOCRSA-N 0.000 description 1
- DJEVQCWNMQOABE-RCOVLWMOSA-N Val-Gly-Asp Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)O)C(=O)O)N DJEVQCWNMQOABE-RCOVLWMOSA-N 0.000 description 1
- SYOMXKPPFZRELL-ONGXEEELSA-N Val-Gly-Lys Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N SYOMXKPPFZRELL-ONGXEEELSA-N 0.000 description 1
- CHWRZUGUMAMTFC-IHRRRGAJSA-N Val-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CNC=N1 CHWRZUGUMAMTFC-IHRRRGAJSA-N 0.000 description 1
- ZTKGDWOUYRRAOQ-ULQDDVLXSA-N Val-His-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N ZTKGDWOUYRRAOQ-ULQDDVLXSA-N 0.000 description 1
- JPPXDMBGXJBTIB-ULQDDVLXSA-N Val-His-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N JPPXDMBGXJBTIB-ULQDDVLXSA-N 0.000 description 1
- XBRMBDFYOFARST-AVGNSLFASA-N Val-His-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](C(C)C)C(=O)O)N XBRMBDFYOFARST-AVGNSLFASA-N 0.000 description 1
- CPGJELLYDQEDRK-NAKRPEOUSA-N Val-Ile-Ala Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](C)C(O)=O CPGJELLYDQEDRK-NAKRPEOUSA-N 0.000 description 1
- LKUDRJSNRWVGMS-QSFUFRPTSA-N Val-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LKUDRJSNRWVGMS-QSFUFRPTSA-N 0.000 description 1
- VHRLUTIMTDOVCG-PEDHHIEDSA-N Val-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](C(C)C)N VHRLUTIMTDOVCG-PEDHHIEDSA-N 0.000 description 1
- FTKXYXACXYOHND-XUXIUFHCSA-N Val-Ile-Leu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O FTKXYXACXYOHND-XUXIUFHCSA-N 0.000 description 1
- SDUBQHUJJWQTEU-XUXIUFHCSA-N Val-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C(C)C)N SDUBQHUJJWQTEU-XUXIUFHCSA-N 0.000 description 1
- PYXQBKJPHNCTNW-CYDGBPFRSA-N Val-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](C(C)C)N PYXQBKJPHNCTNW-CYDGBPFRSA-N 0.000 description 1
- APEBUJBRGCMMHP-HJWJTTGWSA-N Val-Ile-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 APEBUJBRGCMMHP-HJWJTTGWSA-N 0.000 description 1
- DJQIUOKSNRBTSV-CYDGBPFRSA-N Val-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](C(C)C)N DJQIUOKSNRBTSV-CYDGBPFRSA-N 0.000 description 1
- BMOFUVHDBROBSE-DCAQKATOSA-N Val-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C(C)C)N BMOFUVHDBROBSE-DCAQKATOSA-N 0.000 description 1
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 1
- DAVNYIUELQBTAP-XUXIUFHCSA-N Val-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N DAVNYIUELQBTAP-XUXIUFHCSA-N 0.000 description 1
- SJLVYVZBFDTRCG-DCAQKATOSA-N Val-Lys-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)O)N SJLVYVZBFDTRCG-DCAQKATOSA-N 0.000 description 1
- WBAJDGWKRIHOAC-GVXVVHGQSA-N Val-Lys-Gln Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O WBAJDGWKRIHOAC-GVXVVHGQSA-N 0.000 description 1
- DIOSYUIWOQCXNR-ONGXEEELSA-N Val-Lys-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O DIOSYUIWOQCXNR-ONGXEEELSA-N 0.000 description 1
- MBGFDZDWMDLXHQ-GUBZILKMSA-N Val-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](C(C)C)N MBGFDZDWMDLXHQ-GUBZILKMSA-N 0.000 description 1
- RQOMPQGUGBILAG-AVGNSLFASA-N Val-Met-Leu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O RQOMPQGUGBILAG-AVGNSLFASA-N 0.000 description 1
- RSGHLMMKXJGCMK-JYJNAYRXSA-N Val-Met-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N RSGHLMMKXJGCMK-JYJNAYRXSA-N 0.000 description 1
- ILMVQSHENUZYIZ-JYJNAYRXSA-N Val-Met-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N ILMVQSHENUZYIZ-JYJNAYRXSA-N 0.000 description 1
- NZGOVKLVQNOEKP-YDHLFZDLSA-N Val-Phe-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N NZGOVKLVQNOEKP-YDHLFZDLSA-N 0.000 description 1
- YLRAFVVWZRSZQC-DZKIICNBSA-N Val-Phe-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YLRAFVVWZRSZQC-DZKIICNBSA-N 0.000 description 1
- HJSLDXZAZGFPDK-ULQDDVLXSA-N Val-Phe-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](C(C)C)N HJSLDXZAZGFPDK-ULQDDVLXSA-N 0.000 description 1
- MHHAWNPHDLCPLF-ULQDDVLXSA-N Val-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=CC=C1 MHHAWNPHDLCPLF-ULQDDVLXSA-N 0.000 description 1
- ZEBRMWPTJNHXAJ-JYJNAYRXSA-N Val-Phe-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(=O)O)N ZEBRMWPTJNHXAJ-JYJNAYRXSA-N 0.000 description 1
- XBJKAZATRJBDCU-GUBZILKMSA-N Val-Pro-Ala Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O XBJKAZATRJBDCU-GUBZILKMSA-N 0.000 description 1
- SJRUJQFQVLMZFW-WPRPVWTQSA-N Val-Pro-Gly Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O SJRUJQFQVLMZFW-WPRPVWTQSA-N 0.000 description 1
- USLVEJAHTBLSIL-CYDGBPFRSA-N Val-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C USLVEJAHTBLSIL-CYDGBPFRSA-N 0.000 description 1
- QIVPZSWBBHRNBA-JYJNAYRXSA-N Val-Pro-Phe Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O QIVPZSWBBHRNBA-JYJNAYRXSA-N 0.000 description 1
- SSYBNWFXCFNRFN-GUBZILKMSA-N Val-Pro-Ser Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O SSYBNWFXCFNRFN-GUBZILKMSA-N 0.000 description 1
- MIKHIIQMRFYVOR-RCWTZXSCSA-N Val-Pro-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C(C)C)N)O MIKHIIQMRFYVOR-RCWTZXSCSA-N 0.000 description 1
- DEGUERSKQBRZMZ-FXQIFTODSA-N Val-Ser-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DEGUERSKQBRZMZ-FXQIFTODSA-N 0.000 description 1
- UGFMVXRXULGLNO-XPUUQOCRSA-N Val-Ser-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O UGFMVXRXULGLNO-XPUUQOCRSA-N 0.000 description 1
- GBIUHAYJGWVNLN-UHFFFAOYSA-N Val-Ser-Pro Natural products CC(C)C(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O GBIUHAYJGWVNLN-UHFFFAOYSA-N 0.000 description 1
- UJMCYJKPDFQLHX-XGEHTFHBSA-N Val-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N)O UJMCYJKPDFQLHX-XGEHTFHBSA-N 0.000 description 1
- SDHZOOIGIUEPDY-JYJNAYRXSA-N Val-Ser-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CO)NC(=O)[C@@H](N)C(C)C)C(O)=O)=CNC2=C1 SDHZOOIGIUEPDY-JYJNAYRXSA-N 0.000 description 1
- PQSNETRGCRUOGP-KKHAAJSZSA-N Val-Thr-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(N)=O PQSNETRGCRUOGP-KKHAAJSZSA-N 0.000 description 1
- GVNLOVJNNDZUHS-RHYQMDGZSA-N Val-Thr-Lys Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O GVNLOVJNNDZUHS-RHYQMDGZSA-N 0.000 description 1
- OFTXTCGQJXTNQS-XGEHTFHBSA-N Val-Thr-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N)O OFTXTCGQJXTNQS-XGEHTFHBSA-N 0.000 description 1
- JXCOEPXCBVCTRD-JYJNAYRXSA-N Val-Tyr-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N JXCOEPXCBVCTRD-JYJNAYRXSA-N 0.000 description 1
- JXWGBRRVTRAZQA-ULQDDVLXSA-N Val-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N JXWGBRRVTRAZQA-ULQDDVLXSA-N 0.000 description 1
- PGBMPFKFKXYROZ-UFYCRDLUSA-N Val-Tyr-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N PGBMPFKFKXYROZ-UFYCRDLUSA-N 0.000 description 1
- BGTDGENDNWGMDQ-KJEVXHAQSA-N Val-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N)O BGTDGENDNWGMDQ-KJEVXHAQSA-N 0.000 description 1
- AEFJNECXZCODJM-UWVGGRQHSA-N Val-Val-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C(=O)NCC([O-])=O AEFJNECXZCODJM-UWVGGRQHSA-N 0.000 description 1
- WBPFYNYTYASCQP-CYDGBPFRSA-N Val-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)N WBPFYNYTYASCQP-CYDGBPFRSA-N 0.000 description 1
- AOILQMZPNLUXCM-AVGNSLFASA-N Val-Val-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN AOILQMZPNLUXCM-AVGNSLFASA-N 0.000 description 1
- ODUHAIXFXFACDY-SRVKXCTJSA-N Val-Val-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)C(C)C ODUHAIXFXFACDY-SRVKXCTJSA-N 0.000 description 1
- XNLUVJPMPAZHCY-JYJNAYRXSA-N Val-Val-Phe Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 XNLUVJPMPAZHCY-JYJNAYRXSA-N 0.000 description 1
- LLJLBRRXKZTTRD-GUBZILKMSA-N Val-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N LLJLBRRXKZTTRD-GUBZILKMSA-N 0.000 description 1
- 241000235013 Yarrowia Species 0.000 description 1
- 241000235015 Yarrowia lipolytica Species 0.000 description 1
- 241000235017 Zygosaccharomyces Species 0.000 description 1
- 241000235029 Zygosaccharomyces bailii Species 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 239000000370 acceptor Substances 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000000397 acetylating effect Effects 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 1
- 108010060230 alanyl-tyrosyl-leucyl-prolyl-threonine Proteins 0.000 description 1
- 108010044940 alanylglutamine Proteins 0.000 description 1
- 229930013930 alkaloid Natural products 0.000 description 1
- 150000003797 alkaloid derivatives Chemical class 0.000 description 1
- JAZBEHYOTPTENJ-JLNKQSITSA-N all-cis-5,8,11,14,17-icosapentaenoic acid Chemical compound CC\C=C/C\C=C/C\C=C/C\C=C/C\C=C/CCCC(O)=O JAZBEHYOTPTENJ-JLNKQSITSA-N 0.000 description 1
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 1
- 235000020661 alpha-linolenic acid Nutrition 0.000 description 1
- 150000001408 amides Chemical class 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 125000003277 amino group Chemical group 0.000 description 1
- 239000005557 antagonist Substances 0.000 description 1
- 230000003276 anti-hypertensive effect Effects 0.000 description 1
- 230000002421 anti-septic effect Effects 0.000 description 1
- 230000001099 anti-trypanosomal effect Effects 0.000 description 1
- 230000000840 anti-viral effect Effects 0.000 description 1
- 239000002246 antineoplastic agent Substances 0.000 description 1
- 239000003963 antioxidant agent Substances 0.000 description 1
- 230000003078 antioxidant effect Effects 0.000 description 1
- 239000003293 antisense oligodeoxyribonucleotide Substances 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 229940114079 arachidonic acid Drugs 0.000 description 1
- 235000021342 arachidonic acid Nutrition 0.000 description 1
- 108010008355 arginyl-glutamine Proteins 0.000 description 1
- 108010001271 arginyl-glutamyl-arginine Proteins 0.000 description 1
- 108010052670 arginyl-glutamyl-glutamic acid Proteins 0.000 description 1
- 108010089442 arginyl-leucyl-alanyl-arginine Proteins 0.000 description 1
- 108010043240 arginyl-leucyl-glycine Proteins 0.000 description 1
- 108010068380 arginylarginine Proteins 0.000 description 1
- 108010062796 arginyllysine Proteins 0.000 description 1
- 150000001491 aromatic compounds Chemical class 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 108010010430 asparagine-proline-alanine Proteins 0.000 description 1
- 229940009098 aspartate Drugs 0.000 description 1
- 108010093581 aspartyl-proline Proteins 0.000 description 1
- 108010092854 aspartyllysine Proteins 0.000 description 1
- 125000004429 atom Chemical group 0.000 description 1
- 229940116226 behenic acid Drugs 0.000 description 1
- WPYMKLBDIGXBTP-UHFFFAOYSA-N benzoic acid Chemical compound OC(=O)C1=CC=CC=C1 WPYMKLBDIGXBTP-UHFFFAOYSA-N 0.000 description 1
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 1
- 229940114055 beta-resorcylic acid Drugs 0.000 description 1
- 238000005842 biochemical reaction Methods 0.000 description 1
- 230000006696 biosynthetic metabolic pathway Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 150000001732 carboxylic acid derivatives Chemical group 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000030570 cellular localization Effects 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- YDDGKXBLOXEEMN-IABMMNSOSA-N chicoric acid Chemical compound O([C@@H](C(=O)O)[C@@H](OC(=O)\C=C\C=1C=C(O)C(O)=CC=1)C(O)=O)C(=O)\C=C\C1=CC=C(O)C(O)=C1 YDDGKXBLOXEEMN-IABMMNSOSA-N 0.000 description 1
- CWVRJTMFETXNAD-JUHZACGLSA-N chlorogenic acid Chemical compound O[C@@H]1[C@H](O)C[C@@](O)(C(O)=O)C[C@H]1OC(=O)\C=C\C1=CC=C(O)C(O)=C1 CWVRJTMFETXNAD-JUHZACGLSA-N 0.000 description 1
- 229940074393 chlorogenic acid Drugs 0.000 description 1
- 235000001368 chlorogenic acid Nutrition 0.000 description 1
- FFQSDFBBSXGVKF-KHSQJDLVSA-N chlorogenic acid Natural products O[C@@H]1C[C@](O)(C[C@@H](CC(=O)C=Cc2ccc(O)c(O)c2)[C@@H]1O)C(=O)O FFQSDFBBSXGVKF-KHSQJDLVSA-N 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 229930016920 cichoric acid Natural products 0.000 description 1
- 150000001851 cinnamic acid derivatives Chemical class 0.000 description 1
- BMRSEYFENKXDIS-KLZCAUPSSA-N cis-3-O-p-coumaroylquinic acid Natural products O[C@H]1C[C@@](O)(C[C@@H](OC(=O)C=Cc2ccc(O)cc2)[C@@H]1O)C(=O)O BMRSEYFENKXDIS-KLZCAUPSSA-N 0.000 description 1
- SECPZKHBENQXJG-UHFFFAOYSA-N cis-palmitoleic acid Natural products CCCCCCC=CCCCCCCCC(O)=O SECPZKHBENQXJG-UHFFFAOYSA-N 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000001268 conjugating effect Effects 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 108010069495 cysteinyltyrosine Proteins 0.000 description 1
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 1
- 229940127089 cytotoxic agent Drugs 0.000 description 1
- 230000003013 cytotoxicity Effects 0.000 description 1
- 231100000135 cytotoxicity Toxicity 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 150000004985 diamines Chemical class 0.000 description 1
- YDDGKXBLOXEEMN-PMACEKPBSA-N dicaffeoyl-D-tartaric acid Natural products O([C@H](C(=O)O)[C@H](OC(=O)C=CC=1C=C(O)C(O)=CC=1)C(O)=O)C(=O)C=CC1=CC=C(O)C(O)=C1 YDDGKXBLOXEEMN-PMACEKPBSA-N 0.000 description 1
- YDDGKXBLOXEEMN-WOJBJXKFSA-N dicaffeoyl-L-tartaric acid Natural products O([C@@H](C(=O)O)[C@@H](OC(=O)C=CC=1C=C(O)C(O)=CC=1)C(O)=O)C(=O)C=CC1=CC=C(O)C(O)=C1 YDDGKXBLOXEEMN-WOJBJXKFSA-N 0.000 description 1
- 150000005169 dihydroxybenzoic acids Chemical class 0.000 description 1
- 108010054812 diprotin A Proteins 0.000 description 1
- 108010054813 diprotin B Proteins 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 229940000406 drug candidate Drugs 0.000 description 1
- JAZBEHYOTPTENJ-UHFFFAOYSA-N eicosapentaenoic acid Natural products CCC=CCC=CCC=CCC=CCC=CCCCC(O)=O JAZBEHYOTPTENJ-UHFFFAOYSA-N 0.000 description 1
- 229960005135 eicosapentaenoic acid Drugs 0.000 description 1
- 235000020673 eicosapentaenoic acid Nutrition 0.000 description 1
- 238000000132 electrospray ionisation Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 229960002852 ellagic acid Drugs 0.000 description 1
- 235000004132 ellagic acid Nutrition 0.000 description 1
- DPUOLQHDNGRHBS-KTKRTIGZSA-N erucic acid Chemical compound CCCCCCCC\C=C/CCCCCCCCCCCC(O)=O DPUOLQHDNGRHBS-KTKRTIGZSA-N 0.000 description 1
- FARYTWBWLZAXNK-WAYWQWQTSA-N ethyl (z)-3-(methylamino)but-2-enoate Chemical compound CCOC(=O)\C=C(\C)NC FARYTWBWLZAXNK-WAYWQWQTSA-N 0.000 description 1
- 235000019277 ethyl gallate Nutrition 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 230000029142 excretion Effects 0.000 description 1
- 239000013604 expression vector Substances 0.000 description 1
- 235000012041 food component Nutrition 0.000 description 1
- 239000005417 food ingredient Substances 0.000 description 1
- 239000000446 fuel Substances 0.000 description 1
- 235000013376 functional food Nutrition 0.000 description 1
- 244000053095 fungal pathogen Species 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- 235000004515 gallic acid Nutrition 0.000 description 1
- 229940074391 gallic acid Drugs 0.000 description 1
- LRBQNJMCXXYXIU-QWKBTXIPSA-N gallotannic acid Chemical compound OC1=C(O)C(O)=CC(C(=O)OC=2C(=C(O)C=C(C=2)C(=O)OC[C@H]2[C@@H]([C@@H](OC(=O)C=3C=C(OC(=O)C=4C=C(O)C(O)=C(O)C=4)C(O)=C(O)C=3)[C@H](OC(=O)C=3C=C(OC(=O)C=4C=C(O)C(O)=C(O)C=4)C(O)=C(O)C=3)[C@@H](OC(=O)C=3C=C(OC(=O)C=4C=C(O)C(O)=C(O)C=4)C(O)=C(O)C=3)O2)OC(=O)C=2C=C(OC(=O)C=3C=C(O)C(O)=C(O)C=3)C(O)=C(O)C=2)O)=C1 LRBQNJMCXXYXIU-QWKBTXIPSA-N 0.000 description 1
- 230000006251 gamma-carboxylation Effects 0.000 description 1
- 108010006664 gamma-glutamyl-glycyl-glycine Proteins 0.000 description 1
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 238000003209 gene knockout Methods 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 229960005219 gentisic acid Drugs 0.000 description 1
- 229930182478 glucoside Natural products 0.000 description 1
- 229930195712 glutamate Natural products 0.000 description 1
- 229940049906 glutamate Drugs 0.000 description 1
- 108010050322 glutamate acetyltransferase Proteins 0.000 description 1
- 108010078144 glutaminyl-glycine Proteins 0.000 description 1
- 108010080575 glutamyl-aspartyl-alanine Proteins 0.000 description 1
- 108010042598 glutamyl-aspartyl-glycine Proteins 0.000 description 1
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 1
- 108010040856 glutamyl-cysteinyl-alanine Proteins 0.000 description 1
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 1
- 108010075431 glycyl-alanyl-phenylalanine Proteins 0.000 description 1
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 1
- 108010051307 glycyl-glycyl-proline Proteins 0.000 description 1
- 108010078326 glycyl-glycyl-valine Proteins 0.000 description 1
- 108010028188 glycyl-histidyl-serine Proteins 0.000 description 1
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 1
- 108010045126 glycyl-tyrosyl-glycine Proteins 0.000 description 1
- 108010010147 glycylglutamine Proteins 0.000 description 1
- 230000009643 growth defect Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 108010036413 histidylglycine Proteins 0.000 description 1
- 108010028295 histidylhistidine Proteins 0.000 description 1
- 108010025306 histidylleucine Proteins 0.000 description 1
- 108010092114 histidylphenylalanine Proteins 0.000 description 1
- 230000033444 hydroxylation Effects 0.000 description 1
- 238000005805 hydroxylation reaction Methods 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 229910000462 iron(III) oxide hydroxide Inorganic materials 0.000 description 1
- 150000002611 lead compounds Chemical class 0.000 description 1
- 108010077158 leucinyl-arginyl-tryptophan Proteins 0.000 description 1
- 108010083708 leucyl-aspartyl-valine Proteins 0.000 description 1
- 108010073093 leucyl-glycyl-glycyl-glycine Proteins 0.000 description 1
- 108010087810 leucyl-seryl-glutamyl-leucine Proteins 0.000 description 1
- 108010000761 leucylarginine Proteins 0.000 description 1
- 229960004488 linolenic acid Drugs 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 108010057952 lysyl-phenylalanyl-lysine Proteins 0.000 description 1
- 108010045397 lysyl-tyrosyl-lysine Proteins 0.000 description 1
- 108010017391 lysylvaline Proteins 0.000 description 1
- 230000007721 medicinal effect Effects 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 238000012269 metabolic engineering Methods 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 150000002739 metals Chemical class 0.000 description 1
- 108010016686 methionyl-alanyl-serine Proteins 0.000 description 1
- 108010068488 methionylphenylalanine Proteins 0.000 description 1
- FAARLWTXUUQFSN-UHFFFAOYSA-N methylellagic acid Natural products O1C(=O)C2=CC(O)=C(O)C3=C2C2=C1C(OC)=C(O)C=C2C(=O)O3 FAARLWTXUUQFSN-UHFFFAOYSA-N 0.000 description 1
- 108091070501 miRNA Proteins 0.000 description 1
- WQEPLUUGTLDZJY-UHFFFAOYSA-N n-Pentadecanoic acid Natural products CCCCCCCCCCCCCCC(O)=O WQEPLUUGTLDZJY-UHFFFAOYSA-N 0.000 description 1
- UMJJGDUYVQCBMC-UHFFFAOYSA-N n-ethyl-n'-[3-[3-(ethylamino)propylamino]propyl]propane-1,3-diamine Chemical compound CCNCCCNCCCNCCCNCC UMJJGDUYVQCBMC-UHFFFAOYSA-N 0.000 description 1
- 230000000324 neuroprotective effect Effects 0.000 description 1
- QJGQUHMNIGDVPM-UHFFFAOYSA-N nitrogen group Chemical group [N] QJGQUHMNIGDVPM-UHFFFAOYSA-N 0.000 description 1
- GDYGAIKPBLFCKR-YWQRSDGBSA-N norbergenin Chemical compound OC1=C(O)C(O)=C2[C@H]3O[C@@H](CO)[C@H](O)[C@@H](O)[C@@H]3OC(=O)C2=C1 GDYGAIKPBLFCKR-YWQRSDGBSA-N 0.000 description 1
- ITLPFVQTQNIPFC-FTMUIGGFSA-N norbergenin Natural products OC[C@@H]1C[C@H]2[C@@H](OC(=O)c3cc(O)c(O)c(O)c23)[C@H](O)[C@H]1O ITLPFVQTQNIPFC-FTMUIGGFSA-N 0.000 description 1
- 238000011330 nucleic acid test Methods 0.000 description 1
- 229920001778 nylon Polymers 0.000 description 1
- QIQXTHQIDYTFRH-UHFFFAOYSA-N octadecanoic acid Chemical compound CCCCCCCCCCCCCCCCCC(O)=O QIQXTHQIDYTFRH-UHFFFAOYSA-N 0.000 description 1
- OQCDKBAXFALNLD-UHFFFAOYSA-N octadecanoic acid Natural products CCCCCCCC(C)CCCCCCCCC(O)=O OQCDKBAXFALNLD-UHFFFAOYSA-N 0.000 description 1
- 229960002446 octanoic acid Drugs 0.000 description 1
- 239000002751 oligonucleotide probe Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 150000004812 organic fluorine compounds Chemical class 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000010412 perfusion Effects 0.000 description 1
- 230000000361 pesticidal effect Effects 0.000 description 1
- 230000000144 pharmacologic effect Effects 0.000 description 1
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N phenol group Chemical group C1(=CC=CC=C1)O ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 1
- 150000007965 phenolic acids Chemical class 0.000 description 1
- 235000009048 phenolic acids Nutrition 0.000 description 1
- 108010074082 phenylalanyl-alanyl-lysine Proteins 0.000 description 1
- 108010064486 phenylalanyl-leucyl-valine Proteins 0.000 description 1
- 108010084525 phenylalanyl-phenylalanyl-glycine Proteins 0.000 description 1
- 108010084572 phenylalanyl-valine Proteins 0.000 description 1
- 108010024607 phenylalanylalanine Proteins 0.000 description 1
- 108010073101 phenylalanylleucine Proteins 0.000 description 1
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 150000004713 phosphodiesters Chemical group 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 230000001124 posttranscriptional effect Effects 0.000 description 1
- 230000003389 potentiating effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 239000013587 production medium Substances 0.000 description 1
- 108010031719 prolyl-serine Proteins 0.000 description 1
- 108010004914 prolylarginine Proteins 0.000 description 1
- 108010015796 prolylisoleucine Proteins 0.000 description 1
- AOHJOMMDDJHIJH-UHFFFAOYSA-N propylenediamine Chemical compound CC(N)CN AOHJOMMDDJHIJH-UHFFFAOYSA-N 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- ADRDEXBBJTUCND-UHFFFAOYSA-N pyrrolizidine Chemical class C1CCN2CCCC21 ADRDEXBBJTUCND-UHFFFAOYSA-N 0.000 description 1
- 229930002356 pyrrolizidine alkaloid Natural products 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 108091092562 ribozyme Proteins 0.000 description 1
- 229960002181 saccharomyces boulardii Drugs 0.000 description 1
- 229960004889 salicylic acid Drugs 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 235000003441 saturated fatty acids Nutrition 0.000 description 1
- 150000004671 saturated fatty acids Chemical class 0.000 description 1
- 229930000044 secondary metabolite Natural products 0.000 description 1
- 230000003248 secreting effect Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 1
- 108010071207 serylmethionine Proteins 0.000 description 1
- 235000021309 simple sugar Nutrition 0.000 description 1
- PCMORTLOPMLEFB-ONEGZZNKSA-N sinapic acid Chemical compound COC1=CC(\C=C\C(O)=O)=CC(OC)=C1O PCMORTLOPMLEFB-ONEGZZNKSA-N 0.000 description 1
- PCMORTLOPMLEFB-UHFFFAOYSA-N sinapinic acid Natural products COC1=CC(C=CC(O)=O)=CC(OC)=C1O PCMORTLOPMLEFB-UHFFFAOYSA-N 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 239000007921 spray Substances 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 239000008117 stearic acid Substances 0.000 description 1
- 125000001424 substituent group Chemical group 0.000 description 1
- 230000019635 sulfation Effects 0.000 description 1
- 238000005670 sulfation reaction Methods 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 230000009469 supplementation Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- YIBXWXOYFGZLRU-UHFFFAOYSA-N syringic aldehyde Natural products CC12CCC(C3(CCC(=O)C(C)(C)C3CC=3)C)C=3C1(C)CCC2C1COC(C)(C)C(O)C(O)C1 YIBXWXOYFGZLRU-UHFFFAOYSA-N 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 235000015523 tannic acid Nutrition 0.000 description 1
- 229920002258 tannic acid Polymers 0.000 description 1
- 229940033123 tannic acid Drugs 0.000 description 1
- TUNFSRHWOTWDNC-HKGQFRNVSA-N tetradecanoic acid Chemical compound CCCCCCCCCCCCC[14C](O)=O TUNFSRHWOTWDNC-HKGQFRNVSA-N 0.000 description 1
- 108010071097 threonyl-lysyl-proline Proteins 0.000 description 1
- 108010072986 threonyl-seryl-lysine Proteins 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- DMZOKBALNZWDKI-MATMFAIHSA-N trans-4-coumaroyl-CoA Chemical compound O=C([C@H](O)C(C)(COP(O)(=O)OP(O)(=O)OC[C@@H]1[C@H]([C@@H](O)[C@@H](O1)N1C2=NC=NC(N)=C2N=C1)OP(O)(O)=O)C)NCCC(=O)NCCSC(=O)\C=C\C1=CC=C(O)C=C1 DMZOKBALNZWDKI-MATMFAIHSA-N 0.000 description 1
- UWHZIFQPPBDJPM-BQYQJAHWSA-N trans-vaccenic acid Chemical compound CCCCCC\C=C\CCCCCCCCCC(O)=O UWHZIFQPPBDJPM-BQYQJAHWSA-N 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- 150000005170 trihydroxybenzoic acids Chemical class 0.000 description 1
- HRXKRNGNAMMEHJ-UHFFFAOYSA-K trisodium citrate Chemical compound [Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O HRXKRNGNAMMEHJ-UHFFFAOYSA-K 0.000 description 1
- 229940038773 trisodium citrate Drugs 0.000 description 1
- 108010044292 tryptophyltyrosine Proteins 0.000 description 1
- 108010020532 tyrosyl-proline Proteins 0.000 description 1
- 108010003137 tyrosyltyrosine Proteins 0.000 description 1
- 238000001195 ultra high performance liquid chromatography Methods 0.000 description 1
- 235000021122 unsaturated fatty acids Nutrition 0.000 description 1
- 150000004670 unsaturated fatty acids Chemical class 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 1
- 229940045145 uridine Drugs 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- IBIDRSSEHFLGSD-UHFFFAOYSA-N valinyl-arginine Natural products CC(C)C(N)C(=O)NC(C(O)=O)CCCN=C(N)N IBIDRSSEHFLGSD-UHFFFAOYSA-N 0.000 description 1
- 108010015385 valyl-prolyl-proline Proteins 0.000 description 1
- 235000012141 vanillin Nutrition 0.000 description 1
- FGQOOHJZONJGDT-UHFFFAOYSA-N vanillin Natural products COC1=CC(O)=CC(C=O)=C1 FGQOOHJZONJGDT-UHFFFAOYSA-N 0.000 description 1
- MWOOGOJBHIARFG-UHFFFAOYSA-N vanillin Chemical compound COC1=CC(C=O)=CC=C1O MWOOGOJBHIARFG-UHFFFAOYSA-N 0.000 description 1
- 230000035899 viability Effects 0.000 description 1
- 108700026220 vif Genes Proteins 0.000 description 1
- 210000002845 virion Anatomy 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 239000011782 vitamin Substances 0.000 description 1
- 229930003231 vitamin Natural products 0.000 description 1
- 229940088594 vitamin Drugs 0.000 description 1
- 235000013343 vitamin Nutrition 0.000 description 1
- 150000003722 vitamin derivatives Chemical class 0.000 description 1
- 238000001262 western blot Methods 0.000 description 1
- 108010027345 wheylin-1 peptide Proteins 0.000 description 1
- 108010000998 wheylin-2 peptide Proteins 0.000 description 1
- 229910052727 yttrium Inorganic materials 0.000 description 1
- AFVLVVWMAFSXCK-UHFFFAOYSA-N α-cyano-4-hydroxycinnamic acid Chemical compound OC(=O)C(C#N)=CC1=CC=C(O)C=C1 AFVLVVWMAFSXCK-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
- C12N15/81—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P13/00—Preparation of nitrogen-containing organic compounds
- C12P13/001—Amines; Imines
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0012—Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7)
- C12N9/0026—Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on CH-NH groups of donors (1.5)
- C12N9/0032—Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on CH-NH groups of donors (1.5) with oxygen as acceptor (1.5.3)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1025—Acyltransferases (2.3)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1025—Acyltransferases (2.3)
- C12N9/1029—Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1085—Transferases (2.) transferring alkyl or aryl groups other than methyl groups (2.5)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/93—Ligases (6)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P13/00—Preparation of nitrogen-containing organic compounds
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y205/00—Transferases transferring alkyl or aryl groups, other than methyl groups (2.5)
- C12Y205/01—Transferases transferring alkyl or aryl groups, other than methyl groups (2.5) transferring alkyl or aryl groups, other than methyl groups (2.5.1)
- C12Y205/01016—Spermidine synthase (2.5.1.16)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y205/00—Transferases transferring alkyl or aryl groups, other than methyl groups (2.5)
- C12Y205/01—Transferases transferring alkyl or aryl groups, other than methyl groups (2.5) transferring alkyl or aryl groups, other than methyl groups (2.5.1)
- C12Y205/01022—Spermine synthase (2.5.1.22)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y205/00—Transferases transferring alkyl or aryl groups, other than methyl groups (2.5)
- C12Y205/01—Transferases transferring alkyl or aryl groups, other than methyl groups (2.5) transferring alkyl or aryl groups, other than methyl groups (2.5.1)
- C12Y205/01044—Homospermidine synthase (2.5.1.44)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y602/00—Ligases forming carbon-sulfur bonds (6.2)
- C12Y602/01—Acid-Thiol Ligases (6.2.1)
- C12Y602/01012—4-Coumarate-CoA ligase (6.2.1.12)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y203/00—Acyltransferases (2.3)
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Medicinal Chemistry (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Mycology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
본 발명은 적어도 하나의 폴리아민 유사체를 생산할 수 있는 효모 세포에서 폴리아민 유사체의 생산에 관계한다. 상기 효모 세포는 또한 4-쿠마레이트:CoA 리가제 인코딩 유전자, 적어도 하나의 폴리아민 N-아실트랜스퍼라제 유전자, 그리고 적어도 하나의 폴리아민 합성효소 인코딩 유전자를 포함하지만, 폴리아민 산화효소 인코딩 유전자가 결여되거나, 또는 파괴된 폴리아민 산화효소 인코딩 유전자를 포함한다. 상기 효모 세포는 단일- 및/또는 다중-치환된 N-아실화된 폴리아민을 생산할 수 있다.
Description
본 발명은 유전적으로 공작된 효모, 구체적으로 폴리아민 유사체를 생산할 수 있는 이러한 효모에 일반적으로 관계한다.
폴리아민 유사체는 자연계에 널리 분포되어 있고, 건강 및 농업 분야의 문제를 해결하는데 적용되고 있다. 예를 들어, 아미드 결합-함유하는 폴리아민 유사체, 이를 테면, N1-쿠마로일-스페르민, N1-구아닐-1,7-디아민-헵탄 및 N1,N11-디에틸-노르스페르민은 인간 질환, 이를 테면, 암 및 새로운 바이러스 위협, 가령, COVID-19의 퇴치에 잠재적으로 적용시킬 수 있는 항바이러스, 항산화제, 길항제, 및 화학요법제의 주요 부류를 나타낸다. 유사하게, 광범위하게 분포된, 그리고 아미드 결합-함유하는 디아민 및 폴리아민의 하이드록시신남산 이를 테면, 디-p-쿠마로일-카페오일-스페르미딘은 흰가루병 곰팡이 (블루메리아 그라미니스(Blumeria graminis)) 감염을 크게 줄일 수 있어, 곰팡이 병원체 퇴치에 잠재적인 응용이 가능함을 보여준다.
그러나, 자연의 구조적 복잡성과 낮은 풍도로 인해, 전통적인 합성 화학이나, 또는 천연 공급원으로부터 추출된 폴리아민 유사체를 얻기가 어렵다. 빠르게 성장하고, 유전적으로 다루기 쉬운 종의 미생물- 기반 생산은 천연 제품 및 그 파생물에 대한 전통적인 공급망의 대안으로 추구되어왔었다. 특히 제빵용 효모인 사카로미세스 세레비시에(Saccharomyces cerevisiae)는 다양한 연료, 화학 물질, 식품 성분 및 의약품, 특히, 천연 제품 생산을 위한 세포 공장으로 사용되었다. 또한, Microbial Cell Factories (2016) 15: 198는 효모 S. 세레비시에에서 BAHD 아실트랜스퍼라제 및 At4CL5의 공동-발현 및 히드록시신나메이트 및 벤조에이트 콘쥬게이트의 생산을 위해, 아라비도프시스 탈리아나(Arabidopsis thaliana) 유전자 At4CL5를 함유하는 벡터로의 상이한 BAHD 아실트랜스퍼라제 코딩 서열의 클로닝을 개시한다.
불행히도, 추가 약리학 및 살충 연구를 위한 폴리아민 유사체의 화학물질 공간의 잠금을 해제하는 것은 몇 가지 제한 사항에 의해 방해를 받고 있다. (i) 전통적인 합성 화학에 의한 폴리아민 유사체들의 삽성 또는 생합성을 위한 전구체, 또는 천연 공급원으로부터 추출로 다양한 폴리아민에 접근하기가 어렵고, 따라서 폴리아민 유사체의 다양성이 제한된다; (ii) 폴리아민 및 폴리아민 유사체의 생합성에 대한 지식 부족, 가령, 생합성 효소); 그리고 (iii) 폴리아민의 생화학적 기능에 대한 지식 부족으로 인해 임상 사용이 제한된다.
결과적으로, 천연 폴리아민 및 이들의 유사체들의 생산을 위한 새로운 방법을 개발하고, 이러한 구조의 천연 및 비-천연 변이체들에 대한 공급을 위한 가치 사슬의 개발이 바람직하다.
요약
폴리아민 유사체를 생산할 수 있는 효모 세포을 제공하는 것이 일반적인 목적이다.
이 목적 및 다른 목적은 구체예들에 의해 충족된다.
본 발명은 독립청구항에서 특정된다. 본 발명의 추가 실시예는 종속항에 정의되어 있다.
본 발명은 적어도 하나의 폴리아민 유사체를 생산할 수 있는 효모 세포에 관계한다. 상기 효모 세포는 적어도 하나의 폴리아민 유사체를 생산할 수 있다. 상기 효모 세포는 또한 4-쿠마레이트:CoA 리가제 인코딩 유전자, 적어도 하나의 폴리아민 N-아실트랜스퍼라제 유전자, 그리고 적어도 하나의 폴리아민 합성효소 인코딩 유전자를 포함하지만, 폴리아민 산화효소 인코딩 유전자는 결여되며, 또는 파괴된 폴리아민 산화효소 인코딩 유전자를 포함한다.
본 발명은 폴리아민 유사체를 생산하는 방법에 또한 관계한다. 상기 방법은 본 발명에 따른 효모 세포를 이들 효모 세포에 의해 폴리아민 유사체 생산에 적합한 배양 조건 하에서 배양 배지에 배양하는 것을 포함한다. 상기 방법은 상기 배양 배지 및/또는 상기 효모 세포로부터 폴리아민 유사체를 수거하는 것을 또한 포함한다.
본 발명은 단일- 및/또는 다중-치환된 N-아실화된 폴리아민을 비롯한, 다양한 폴리아민 유사체 생산을 위한 효과적인 수단을 제공한다. 따라서, 본 발명은 폴리아민 유사체를 얻기 위해, 천연 공급원으로부터의 추출 또는 전통적인 합성 화학이 연루된 선행 기술 방법에 대비해 비용 효율적인 대안으로서 사용될 수 있다.
추가의 목적 및 장점과 함께, 구체예들은 첨부 도면과 함께 취해진 다음의 설명을 참조함으로써, 가장 잘 이해될 수 있다, 이때:
도 1a ~ 1f는 스페르미딘 및 고차-폴리아민 과다- 합성에 대한 공작된 효모 대사를 설명한다.
도 2a 및 2b는 효모에서 쿠코사민(kukosamine) 생산을 설명한다.
도 3a ~ 3f는 효모에서 복합 페놀아미드의 생합성을 설명한다.
도 4a ~ 4c는 효모에서 복합 페놀아미드의 새로운(de novo) 생합성을 설명한다.
도 5a 및 5b는 효모에서 복합 페놀아미드의 생합성을 위한 공작된 경로를 설명한다.
도 6은 플루오린-치환된 방향족 아미노산 (3-플루오르-L-페닐알라닌; 3-F-L-Phe)이 공급될 때, 플루오린 치환된 그리고 수소화된 하이드록시신남산의 생체내 생산을 -쿠마르산 과잉-생산하는 염료 (QL58)로 설명한다. (6a), 플루오린 치환된 신남산 (3F-CA). (6b), 플루오린 치환된 p-쿠마르산 (3-F-pHCA). (6c), 플루오린 치환된 및 수소화된 p-쿠마르산 (3-F-DHpHCA). 세포 배양 상청액은 LC-MS 분석을 한다. 각 관심대상 화합물들의 이론적인 m/z 값에 대해 LC-MS 크로마토그램을 선택했다.
도 7은 효모 폴리아민 플랫폼으로 플루오린 치환된 하이드록시신남산-푸트레신 콘쥬게이트의 생체내 생산을 설명한다. (7a), N1-3-플루오르시나모일 푸트레신. (7b), N1-3-플루오르쿠마로일 푸트레신. (7c), N1-3-플루오르히드로쿠마로일 푸트레신. (7d), N1,N6-비스(3-플루오르쿠마로일) 푸트레신. 세포 배양 상청액은 LC-MS 분석을 한다. 각 관심대상 화합물들의 이론적인 m/z 값에 대해 LC-MS 크로마토그램을 선택했다.
도 8은 효모 폴리아민 플랫폼으로 플루오린 치환된 하이드록시신남산-스페르미딘 콘쥬게이트의 생체내 생산을 설명한다. (8a), N1 또는 N10-3-플루오르시나모일 스페르미딘. (8b), N1 또는 N10-3-플루오르쿠마로일 스페르미딘. (8c), N1 또는 N10-3-플루오르히드로쿠마로일 스페르미딘. (8d), N1,N10-비스(3-플루오르쿠마로일) 스페르미딘. (8e), N1,N5,N10-트리(3-플루오르쿠마로일) 스페르미딘. 세포 배양 상청액은 LC-MS 분석을 한다. 각 관심대상 화합물들의 이론적인 m/z 값에 대해 LC-MS 크로마토그램을 선택했다.
도 1a ~ 1f는 스페르미딘 및 고차-폴리아민 과다- 합성에 대한 공작된 효모 대사를 설명한다.
도 2a 및 2b는 효모에서 쿠코사민(kukosamine) 생산을 설명한다.
도 3a ~ 3f는 효모에서 복합 페놀아미드의 생합성을 설명한다.
도 4a ~ 4c는 효모에서 복합 페놀아미드의 새로운(de novo) 생합성을 설명한다.
도 5a 및 5b는 효모에서 복합 페놀아미드의 생합성을 위한 공작된 경로를 설명한다.
도 6은 플루오린-치환된 방향족 아미노산 (3-플루오르-L-페닐알라닌; 3-F-L-Phe)이 공급될 때, 플루오린 치환된 그리고 수소화된 하이드록시신남산의 생체내 생산을 -쿠마르산 과잉-생산하는 염료 (QL58)로 설명한다. (6a), 플루오린 치환된 신남산 (3F-CA). (6b), 플루오린 치환된 p-쿠마르산 (3-F-pHCA). (6c), 플루오린 치환된 및 수소화된 p-쿠마르산 (3-F-DHpHCA). 세포 배양 상청액은 LC-MS 분석을 한다. 각 관심대상 화합물들의 이론적인 m/z 값에 대해 LC-MS 크로마토그램을 선택했다.
도 7은 효모 폴리아민 플랫폼으로 플루오린 치환된 하이드록시신남산-푸트레신 콘쥬게이트의 생체내 생산을 설명한다. (7a), N1-3-플루오르시나모일 푸트레신. (7b), N1-3-플루오르쿠마로일 푸트레신. (7c), N1-3-플루오르히드로쿠마로일 푸트레신. (7d), N1,N6-비스(3-플루오르쿠마로일) 푸트레신. 세포 배양 상청액은 LC-MS 분석을 한다. 각 관심대상 화합물들의 이론적인 m/z 값에 대해 LC-MS 크로마토그램을 선택했다.
도 8은 효모 폴리아민 플랫폼으로 플루오린 치환된 하이드록시신남산-스페르미딘 콘쥬게이트의 생체내 생산을 설명한다. (8a), N1 또는 N10-3-플루오르시나모일 스페르미딘. (8b), N1 또는 N10-3-플루오르쿠마로일 스페르미딘. (8c), N1 또는 N10-3-플루오르히드로쿠마로일 스페르미딘. (8d), N1,N10-비스(3-플루오르쿠마로일) 스페르미딘. (8e), N1,N5,N10-트리(3-플루오르쿠마로일) 스페르미딘. 세포 배양 상청액은 LC-MS 분석을 한다. 각 관심대상 화합물들의 이론적인 m/z 값에 대해 LC-MS 크로마토그램을 선택했다.
다양한 폴리아민 유사체에 대한 효율적인 접근을 가능하게 하기 위해, 우리는 복합 폴리아민, 가령, 스페르미딘, 호모-스페르미딘, 테르모스페르민, 그리고 스페르민 범주를 과잉-생산하기 위한 효모 대사를 조작했다. 이러한 효모 플랫폼의 다양성은 맞춤 경로로 다양한 폴리아민 유사체를 생합성함으로써 입증된다. 특히, 우리는 효모 중심 탄소 및 질소 대사, 메티오닌 회수(salvage) 경로, 아데인의 회수 경로, 폴리아민 수송 기전, 그리고 폴리아민 분해 경로를 전체적으로 리팩토링하고, 이로써 깊은-웰 규모의 발효에서 효모는 >400 mg/l의 스페르미딘을 생산하게 된다. 더욱이, 맞춤 경로를 연결시키고, 합성 컨소시움을 만들어, 삼중-치환된 N-아실화된 스페르미딘 페놀아미드를 비롯한, 폴리아민 유사체의 새로운 생합성을 설명하였다.
본 발명은 본 발명의 구체예들이 도시된 첨부 도면 및 실시예들를 참조하여, 지금부터 이하에서 설명될 것이다. 이 설명은 본 발명이 구현될 수 있는 모든 다양한 방식 또는 본 발명에 추가될 수 있는 모든 특징의 상세한 카탈로그를 의미하지는 않는다. 예를 들면, 하나의 구체예에 대해 예시된 속성은 다른 구체예에 통합될 수 있으며, 그리고 특정 구체예와 관련하여 예시된 속성은 그 구체예에서 삭제될 수 있다. 따라서, 본 발명에서 본 발명의 일부 구체예들에서, 본원에서 설명된 임의의 속성 또는 속성의 조합은 배제되거나 또는 생략될 수 있음도 고려된다. 또한, 본 명세서에서 제안된 다양한 구체예에 대한 수많은 변형 및 추가는 본 발명을 벗어나지 않는 본 개시 내용에 비추어 본 기술 분야의 숙련자에게 명백할 것이다. 따라서, 다음 설명은 본 발명의 일부 특정 구체예를 예시하기 위한 것이며, 모든 순열, 조합 및 변형을 철저하게 지정하지 않는다.
달리 정의되지 않는 한, 본 명세서에서 사용된 과학적 용어 및 기술적 용어들은 당업자가 일반적으로 이해하는 의미를 갖는다.
일반적으로, 본 발명에 기술된 생화학, 효소학, 분자 및 세포 생물학, 미생물학, 유전학 및 단백질과 핵산 화학 및 혼성화와 관련하여 사용되는 명명법 및 이의 기술들은 해당 분야에 잘 알려져 있고 통상적으로 사용되는 것들이다.
본원에서 언급된 기존의 방법 및 기술에 대해 더 자세히 설명하고, 예를 들면, Molecular Cloning, a laboratory manual [second edition] Sambrook et al. Cold Spring Harbor Laboratory, 1989, 예를 들면, Sections 1.21 "Extraction And Purification Of Plasmid DNA", 1.53 "Strategies For Cloning In Plasmid Vectors", 1.85 "Identification Of Bacterial Colonies That Contain Recombinant Plasmids", 6 "Gel Electrophoresis Of DNA", 14 "In vitro Amplification Of DNA By The Polymerase Chain Reaction", 그리고 17 "Expression Of Cloned Genes In Escherichia coli" thereof에서 기술된다.
본원에서 언급된 효소 Commission (EC) 숫자(또는 본원에서 "부류"로도 지칭됨)은 Nomenclature Committee of the International Union of Biochemistry and Molecular Biology (NC-IUBMB) in its resource "Enzyme Nomenclature" (1992, including Supplements 6-17), 예를 들면, "Enzyme nomenclature 1992: recommendations of the Nomenclature Committee of the International Union of Biochemistry and Molecular Biology on the nomenclature and classification of Enzyme ", Webb, E. C. (1992), San Diego: Published for the International Union of Biochemistry and Molecular Biology by Academic Press (ISBN 0-12-227164-5)에 따른 것이다. 이것은 각 효소 부류에 의해 촉매되는 화학 반응을 기반으로 한 수치적 부류 체계다.
문맥이 달리 나타내지 않는 한, 여기에 기술된 본 발명의 다양한 특징이 임의의 조합으로 사용될 수 있다는 것이 구체적으로 의도된다. 더욱이, 본 발명에서 본 발명의 일부 구체예들에서, 본원에서 설명된 임의의 속성 또는 속성의 조합은 배제되거나 또는 생략될 수 있음도 고려된다. 예시를 위해, 본 명세서에서 구성 성분 A, B 및 C를 포함한다고 명시하는 경우, A, B 또는 C 중 임의의 것, 또는 이들의 조합이 단독으로 또는 임의의 조합으로 생략될 수 있고, 부인될 수 있다는 것은 명백하다.
본 발명의 명세서 및 첨부 청구항에서 사용된 바와 같이, 단수("a", "an" 및 "the")는 다른 명시적인 언급이 없는 한, 복수 형태를 또한 포함한다. 또한, 본 명세서에 사용된 바와 같이, "및/또는"이 대안("또는")으로 해석될 때, 연관된 나열된 항목 중 하나 또는 이상의 모든 가능한 조합을 포괄하고, 뿐만 아니라 조합의 결여도 지칭한다.
본 명세서의 설명 및 청구범위 전반에 걸쳐, "포함하다" 및 "함유하다", 그리고 이들의 변형, 예를 들어 "포함하는" 및 "포함하다"는 "내포되지만, 그러나, 이에 국한되지 않는"을 의미하고, 다른 부분, 첨가제, 구성 요소, 정수 또는 단계를 배제하지 않는다. 본 명세서의 설명 및 청구범위 전반에 걸쳐, 문맥에서 달리 요구하지 않는 한, 단수에는 복수가 포괄된다. 특히, 부정관사가 사용되는 경우, 본 명세서는 문맥에서 달리 요구하지 않는 한, 단수 뿐만 아니라 복수도 고려하는 것으로 이해되어야 한다.
본 명세서에 사용된 바와 같이, "본질적으로 ~로 구성되는"이라는 과도기적 문구는 청구의 범위가 청구 범위에 인용된 특정 재료 또는 단계를 포괄하는 것으로 해석되어야 하며, 청구된 발명의 기본적이고 신규한 특성(들)에 실질적으로 영향을 미치지 않는 것을 의미한다. 따라서, 본 발명의 청구범위에서 사용될 때, "본질적으로 ~로 구성되는"이라는 용어는 "~를 포함하는"과 동등한 것으로 해석되도록 의도되지 않는다.
본 발명의 이해를 용이하게 하기 위해, 다수의 용어가 아래에 정의되어 있다.
본원에서 사용된 바와 같이, 용어 "폴리아민"이란 두 개 또는 그 이상의 일차 아미노기를 갖는 유기 화합물을 지칭한다. 폴리아민의 예시에는 푸트레신 (Put), 스페르미딘 (Spd), 스페르민 (Spm), 테르모스페르민 (Tspm), sym-호모스페르미딘 (Hspd), 1,2-디아미노프로판, 카다베린, 아그마틴, sym-노르스페르미딘 및 노르스페르민이 내포된다.
본원에서 사용된 바와 같이, 용어 "폴리아민 유사체", "폴리아민 유사체" 또는 "폴리아민 콘쥬게이트"이란 폴리아민을 적어도 하나의 분자와 반응시켜, 이 폴리아민과 적어도 하나의 분자 간에 아미드 결합이 형성되도록 함으로써, 만들어진 유기 화합물을 지칭한다. 특정 구체예에서, 상기 적어도 하나의 분자는 적어도 하나의 카르복실기 포함하는 분자이며, 이로써 해당 카르복실산 모이어티와 폴리아민의 아민 기가 연결된다. 이러한 카르복실기 포함하는 분자의 비-제한적인, 그러나 바람직한 예시에는 다음이 내포된다: 방향족 유기산, 이를 테면, α-시아노-4-하이드록시신남산, 카페인산, 치코르산, 신남산, 클로로겐산, 디페룰린산, 디히드로카페인산, 쿠마르산, 쿠마린, 페룰산, 그리고 시나핀산을 비롯한, 하이드록시신남산; 카프타르산, 쿠타르산과 제2철산을 비롯한, 히드록시시나모일타르타르산; 모노히드록시벤조산, 이를 테면, 3-히드록시벤조산, 4-히드록시벤조산, 살리실산, 그리고 p-히드록시벤조산 글루코시드을 비롯한 페놀산; 2,3-디히드록시벤조산, 2,4-디히드록시벤조산, 2,6-디히드록시벤조산, 3,5-디히드록시벤조산, 에틸 프로토카테츄에이트, 겐티식산, 호모겐티식산, 오르셀린산, 그리고 프로토카테츄산을 비롯한 디히드록시벤조산; 베르제닌, 케불산, 에틸 갈레이트, 유데스믹산, 갈산, 탄닌산, 노르베르제닌, 플로로글루시놀 카르복실산, 시린지산 및 오갈린을 비롯한 트리히드록시벤조산; 바닐린; 그리고 엘라그산. 폴리아민을 방향족 유기산과 반응시킴으로써 형성된 폴리아민 유사체는 전형적으로 폴리아민 알칼로이드로 지칭된다. 카르복실기 포함하는 분자의 다른 예시에는 다음의 것들이 내포되나, 이에 국한되지 않는다: 포화 지방산, 이를 테면, 카프릴산, 카프르산, 라우르산, 미리스트산, 팔미트산, 스테아르산, 아라키드산, 베헨산, 리그노세르산 및 세로트산; 그리고 불포화 지방산, 이를 테면, 미리스톨레산, 팔미톨레산, 사피엔산, 올레산, 엘라이드산, 박센산, 리놀레산, 리놀레산, α-리놀렌산, 아라키돈산, 에이코사펜타엔산, 에루스산, 그리고 도코사헥사엔산. 폴리아민을 지방산과 반응시켜 형성된 폴리아민 유사체는 일반적으로 폴리아민-지방산 콘쥬게이트로 지칭된다.
폴리아민 명명법에서, 일반적으로 알칼로이드 내의 원자 수와 화합물의 위치표시글자(locant)가 중요하다. 주로 두 가지 번호 매기기 시스템이 문헌에서 사용된다. 본원에서는 Bentz et al 2015에 의해 공개된 넘버링 체계가 사용되었다. 이 체계는 다음 규칙으로 간단히 요약된다.
I.
폴리아민 골격의 넘버링은 말단 N-원자를 비롯한, 전체 폴리아민 구조를 포괄하고;
II.
넘버링은 가령, 아미노프로필 하위단위의 일차 아미노기가 있는 스페르미딘의 경우, 가장 짧은 탄소 사슬의 끝에서 N-원자에서 시작하고;
III.
대칭 골격의 경우, 가령, 스페르민의 경우, 넘버링은 해당 치환기에 대한 가장 작은 위치표시글자를 유도하도록 해당 분자의 그 위치에서 시작한다.
IV.
N-유도체화된 폴리아민의 경우, N-치환체의 위치표시글자는 N n 의 접두어가 붙고, 이때 n은 치환된 N-원자의 위치표지글자 번호다.
본원에서 또한 사용된 바와 같이, 용어 "뉴클레오티드 서열", "핵산", "핵산 분자", "올리고뉴클레오티드" 및 "폴리뉴클레오티드"란 cDNA, DNA 단편 또는 부분, 게놈 DNA, 합성 DNA, 플라스미드 DNA, mRNA, 그리고 안티-센스 RNA를 비롯한 RNA 또는 DNA를 지칭하며, 이들 중 임의의 것은 단일 가닥 또는 이중 가닥, 선형 또는 분지형, 또는 이들의 하이브리드일 수 있다. 본원에서 제공된 핵산 분자 및/또는 뉴클레오티드 서열은 5'에서 3' 방향, 좌측에서 우측으로 제시되며, U.S. 서열 규정, 37 CFR §§1.821 - 1.825 및 World Intellectual Property Organization (WIPO) Standard ST.25에서 제시된 뉴클레오티드 부호를 나타내는 표준 코드를 이용하여 나타낸다. dsRNA가 합성적으로 생성될 때, 덜 일반적인 염기, 이를 테면, 이노신, 5-메틸시토신, 6-메틸아데닌, 하이포잔틴 및 기타 것들 또한 안티센스, dsRNA 및 리보자임 페어링에 이용될 수 있다. 예를 들면, 우리딘과 시티딘의 C-5 프로핀 유사체를 함유하는 폴리뉴클레오티드는 높은 친화력으로 RNA에 결합하고, 유전자 발현의 강력한 안티센스 억제제인 것으로 나타났다. 기타 변형, 이를 테면, 포스포디에스테르 백본 또는 RNA의 리보스 당 그룹에 있는 2'-하이드록시에 대한 변형도 만들 수 있다. 본원에서 사용된 바와 같이, 용어 "재조합"이 사용될 때, 이 용어는 특정 핵산(DNA 또는 RNA)이 자연계에서 발견되는 내생 핵산과 구별되는, 구조적 코딩 또는 비-코딩 서열을 갖는 구조체가 만들어지게 되는, 클로닝, 제한 및/또는 결찰 단계의 다양한 조합의 산물임을 의미한다.
본원에서 사용된 바와 같이, 용어 "유전자"는 mRNA, 안티센스 RNA, miRNA, 안티-microRNA 안티센스 올리고데옥시리보뉴클레오티드(AMO) 및 이와 유사한 것을 생성하는데 사용될 수 있는 핵산 분자를 지칭한다. 유전자는 기능적 단백질 또는 유전자 산물을 생산하는 데 사용될 수도 있고, 또는 그렇지 않을 수도 있다. 유전자는 코딩 및 비-코딩 영역, 가령, 인트론, 조절 요소, 프로모터, 인핸서, 종료 서열 및/또는 5' 및 3' 비-해독 영역이 모두 내포될 수 있다. 유전자는 천연 상태의 핵산과 연합되어, 일반적으로 발견되는 성분들이 실질적으로 또는 본질적으로 없는 핵산을 의미하는 "단리된" 것일 수 있다. 이러한 구성 요소에는 다른 세포 물질, 재조합 생산의 배양 배지 및/또는 핵산을 화학적으로 합성하는 데 사용되는 다양한 화학 물질이 내포된다.
본원에 정의된 "파괴된 유전자"는 유전자에 대한 임의의 돌연변이 또는 변형이 연루되어, 해당 유전자 또는 유전자 산물이 부분적으로 또는 완전하게 기능하지 않게 된다. 이러한 돌연변이 또는 변형에는 표적화 서열의 미스센스 돌연변이, 넌센스 돌연변이, 결실, 치환, 삽입, 부가 및 이와 유사한 것들이 내포되지만, 그러나 이에 국한되지 않는다. 더욱이, 유전자의 파괴는 또한 (대안적으로) 프로모터, 종료 요소 및/또는 향상 요소에서의 돌연변이 또는 변형과 같은 유전자의 전사를 제어하는 제어 요소의 변형 또는 변형에 의해 달성될 수 있다. 그러한 경우에, 그러한 돌연변이 또는 변형은 유전자의 전사의 부분적 또는 전체적 손실, 즉 고유의 제어 요소 및 비-고유의 제어 요소와 비교하였을 때, 전사는 더 낮거나, 또는 감소된다. 그 결과, 임의의 유전자 산물의 양은 전사 및 해독-후 감소될 것이다. 더욱이, 유전자의 파괴는 이 유전자로부터 국소화 신호를 추가하거나 또는 제거하는 것을 수반할 수 있으며, 그 결과 이 유전자의 고유한 세포내 구획에서 해당 유전자 생성물의 존재가 감소된다.
유전자 파괴의 목적은 해당 유전자 산물의 생산을 완전히 방지하는 것을 비롯한, 이 유전자 산물의 이용 가능한 양을 줄이는 것이거나, 또는 고유의 또는 야생형 유전자 산물과 비교하였을 때, 효소 활성이 부족하거나 또는 더 낮은 유전자 산물을 발현하는 것이다.
본원에서 사용된 바와 같이, 용어 "결손" 또는 "녹-아웃(knock-out)"이란 작동하지 않거나 또는 녹아웃된 유전자를 의미한다.
효소와 관련될 때 용어 "감쇠된(attenuated) 활성"이란 대조군 또는 야생형 상태와 비교하였을 때, 이의 고유한 구획에서 효소의 활성 감소를 지칭한다. 효소 활성의 감쇠를 초래하는 조작에는 미스센스 돌연변이, 넌센스 돌연변이, 표적화 서열의 결손, 치환, 삽입, 추가, 표적화 서열의 제거 또는 이와 유사한 것들이 내포되지만, 그러나 이에 국한되지 않는다. 감쇠된 효소 활성을 초래하는 변형을 함유하는 세포는 그러한 변형을 함유하지 않는 세포에 비해, 효소의 활성이 더 낮을 것이다. 효소의 감쇠된 활성은 비-기능성 유전자 생성물, 예를 들어, 본질적으로 활성이 없는 폴리펩티드, 예를 들어, 야생형 폴리펩티드의 활성과 비교하였을 때, 약 10% 또는 심지어 5% 미만의 활성을 갖는 폴리펩티드를 인코딩함으로써 달성될 수 있다.
유전자의 코돈 최적화 형태란 세포로 도입된 외생성 유전자를 말하며, 여기서 유전자의 코돈은 특정 세포와 관련하여 최적화된다. 일반적으로, 모든 tRNAs가 여러 종들에 걸쳐 동일하게 또는 동일한 수준으로 발현되는 것은 아니다. 따라서, 유전자 서열의 코돈 최적화는 가장 우세한 tRNAs와 일치하도록 코돈을 변경하는 것과 관련되는데, 즉, 주어지 세포에 우위가 낮는 tRNA가 인지하는 코돈을 상대적으로 더 우세한 tRNA에 의해 인지되는 동의적 코돈으로 변화시키는 것이다. 이렇게 하면 코돈 최적화 유전자의 mRNA가 더 효율적으로 해독될 것이다. 코돈 및 동의 코돈은 바람직하게는 동일한 아미노산을 인코딩한다.
본원에서 사용된 바와 같이, 용어 "펩티드", "폴리펩티드", 그리고 "단백질"은 호환사명되며, 이들은 아미노산 잔기의 중합체를 나타낸다. 용어 "펩티드", "폴리펩티드" 및 "단백질"에는 지질 부착, 글리코실화, 글리코실화, 황산화, 히드록실화, L-글루탐산 잔기의 γ-카르복실화 및 ADP-리보실화가 내포되지만, 그러나 이에 국한되지 않는 변형이 내포된다.
본원에서 사용된 바와 같이, "효소"라는 용어는 세포에서 화학적 또는 생화학적 반응을 촉매하는 단백질로 정의된다. 일반적으로, 본 발명에 따르면, 효소를 코딩하는 뉴클레오티드 서열은 세포에 스페르미딘을 생산하는 능력을 부여하기 위해, 세포에서 상응하는 유전자의 충분한 발현을 유발하는 뉴클레오티드 서열(프로모터)에 작동가능하게 연계된다.
본원에서 사용된 바와 같이, "오픈 리딩 프레임(ORF)"이라는 용어는 폴리펩티드, 펩티드 또는 단백질을 인코딩하는 RNA 또는 DNA의 영역을 지칭한다.
본원에서 사용된 바와 같이, "게놈"이라는 용어는 숙주 세포에서 플라스미드와 염색체를 모두 포괄한다. 예를 들어, 숙주 세포 내로 도입되는 본 명세서의 인코딩 핵산은 이들이 염색체 통합이든 또는 플라스미드-국소화되든 상관없이 게놈의 일부일 수 있다.
본원에서 사용된 바와 같이, "프로모터"라는 용어는 하나 또는 그 이상의 유전자의 전사를 조절하는 기능을 갖는 핵산 서열을 지칭하고, 이것은 해당 유전자의 전사 개시 부위의 전사 방향에 대해 상류에 위치한다. 이러한 맥락에서 적합한 프로모터에는 구성적 및 유도성 천연 프로모터, 뿐만 아니라 공작된 프로모터가 모두 내포되며, 이는 당업자에게 잘 알려져 있다.
효모 세포에서 사용하기에 적합한 프로모터에는 PDC, GPD1, TEF1, PGK1 및 TDH의 프로모터가 내포되나, 이에 국한되지 않는다. 기타 적합한 프로모터에는 GAL1, GAL2, GAL10, GAL7, CUP1, HIS3, CYC1, ADH1, PGL, GAPDH, ADC1, URA3, TRP1, LEU2, TPI, AOX1 및 ENOl가 내포된다.
본원에 사용된 바와 같이, "종료자"라는 용어는 달리 언급되지 않는 한 "전사 종료 신호"를 나타낸다. 종료자는 중합효소의 전사를 방해하거나 또는 중지시키는 서열이다.
본원에서 사용된 바와 같이, 본 명세서에 따른 "재조합 진핵 세포"는 내생성 핵산 서열의 추가 카피 또는 카피들을 함유하거나, 또는 진핵 세포에서 자연적으로 발생하지 않는 폴리펩티드 또는 뉴클레오티드 서열로 형질변환되거나 또는 유전적으로 변형된 세포로 정의된다. 야생형 진핵 세포는 본원에 사용된 재조합 진핵 세포의 모계 세포로 정의된다.
본원에서 사용된 바와 같이, 용어 "증가하다", "증가하는", "증가", "향상하다", "향상된", "향상" 및 "향상" (및 이들의 문법적 변형)은 대조군과 비교하였을 때, 약 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 100%, 150%, 200%, 300%, 400%, 500% 또는 그 이상, 또는 이 범위 내에 임의의 것을 나타낸다.
본원에서 사용된 바와 같이, 용어 "감소하다", "감소된", "감소", "줄다", "억제하다" 및 "감소" 및 유사한 용어는 대조군과 비교하였을 때, 약 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 100%, 150%, 200%, 300%, 400%, 500% 또는 그 이상, 또는 이 범위 내에 임의의 것을 나타낸다.
본원에 사용된 바와 같이, 유전자의 감소된 발현은 유전자의 전사를 감소시키고, 이 유전자로부터 전사된 mRNA의 해독을 감소시키고 및/또는 mRNA로부터 해독된 단백질의 해독-후 프로세싱을 감소시키는 유전적 변형과 관련된다. 이러한 유전자 변형에는 해당 유전자의 프로모터 및 인핸서와 같은 제어 서열에 적용된 삽입(들), 결실(들), 교체(들) 또는 돌연변이(들)가 내포된다. 예를 들어, 유전자의 프로모터는 활성이 덜하거나 또는 유도성인 프로모터로 대체되어, 해당 유전자의 전사가 감소될 수 있다. 또한, 프로모터의 녹아웃은 해당 유전자의 발현을 감소시키고, 일반적으로 0으로 만들 것이다.
본원에서 사용된 바와 같이, 본 발명의 뉴클레오티드 서열의 "부분" 또는 "단편"이란 기준 핵산 또는 뉴클레오티드 서열과 비교하여 길이가 줄어든 뉴클레오티드 서열을 말하며, 기준 핵산 또는 뉴클레오티드 서열과 비교하여 동일한, 또는 거의 동일한, 가령, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 98%, 99% 동일한 연속 뉴클레오티드의 뉴클레오티드을 포함하는, 이로 필수적으로 구성된 및/또는 이로 구성된다. 본 발명에 따른 이러한 핵산 단편 또는 부분은 적절한 경우, 그것이 구성요소인 더 큰 폴리뉴클레오티드에 내포될 수 있다.
상동성을 갖는 상이한 핵산 또는 단백질은 본원에서 "상동체(homologues)"로 지칭된다. 용어 상동체에는 동일 및 다른 종으로부터의 상동 서열과, 동일 및 다른 종으로부터의 오르트로고스(orthologous) 서열이 내포된다. "상동성"은 위치 동일성, 즉, 서열 유사성 또는 동일성의 퍼센트 측면에서, 2개 또는 그 이상의 핵산 및/또는 아미노산 서열 간의 유사성 수준을 지칭한다. 상동성은 또한 서로 다른 핵산 또는 단백질 간에 유사한 기능적 특성의 개념을 나타낸다. 따라서, 본 발명의 조성물 및 방법은 본 발명의 뉴클레오티드 서열 및 폴리펩티드 서열에 대한 상동체를 추가로 포함한다. 본원에서 사용된 바와 같이, "오르트로고스"란 종분화 동안 공통 조상 유전자로부터 유래된 상이한 종의 상동성 뉴클레오티드 서열 및/또는 아미노산 서열을 지칭한다. 본 발명의 뉴클레오티드 서열의 상동체는 전술한 뉴클레오티드 서열에 대해 실질적인 서열 동일성, 가령, 약 70%, 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 및/또는 100% 동일성을 갖는다.
본원에 사용된 바와 같이, 용어 "과다-발현되다" 또는 "과다-발현"이란 유전자의 활성(예를 들어, 유전자의 전사)이 더 높은 수준을 나타내는데; mRNA에서 단백질로의 해독이 더 높은 수준; 및/또는 유전자 산물, 예를 들어, 폴리펩티드의 생산이 이의 고유의 또는 대조군, 가령, 과다발현되는 특정 이종 또는 재조합 폴리펩티드로 형질변환되지 않은 상태와 비교하였을 때, 더 높은 수준으로 생산되는 것을 지칭한다. 과다발현된 유전자의 전형적인 예는 유전자의 천연 프로모터와 비교하였을 때, 또다른 프로모터의 전사 제어 하에 있는 유전자다. 또한, 또는 대안적으로, 인핸서와 같은 유전자의 제어 요소의 다른 변화를 사용하여 특정 유전자를 과다발현시킬 수 있다. 더욱이, 해당 유전자로부터 전사된 mRNA의 해독에 영향을 미치는, 즉, 증가시키는 변형은 대안적으로 또는 추가로, 본원에 사용된 과다현된 유전자를 달성하기 위해 사용될 수 있다. 이러한 용어는 또한 유전자 카피 수의 증가 및/또는 세포 내 mRNA 및/또는 유전자 산물의 양의 증가를 나타낼 수 있다. 동일한 또는 상동성 유전자 산물, 이를 테면, 효소를 인코딩하는, 상이한 종의 유전자들이 내포됨으로써 과다발현 달성이 추가로 가능하다. 과다발현은 대조군 수준과 비교하였을 때, 세포 내에서 25%, 50%, 75%, 100%, 200%, 300%, 400%, 500%, 750%, 1000%, 1500%, 2000% 또는 이 보다 더 높거나, 또는 이 범위내에 임의의 수준이 될 수 있다.
본원에서 사용된 바와 같이, 핵산(RNA 또는 DNA), 단백질 또는 유전자와 관련하여 사용될 때, 용어 "외생성(exogenous)" 또는 "이종성(heterologous)"이란 이들이 도입되는 세포, 유기체, 게놈의 일부로서 비-천연적으로 발생하는 핵산, 단백질 또는 유전자를 의미하는데, 여기에는 자연 발생 뉴클레오티드 서열의 비-자연적 발생 다중 카피들이 내포된다. 이러한 외생성 유전자는 다른 종 또는 계통의 유전자, 숙주 세포에서 자연적으로 발생하는 유전자의 변형, 돌연변이 또는 진화된 버전 또는 숙주 세포 또는 융합 유전자에서 자연적으로 발생하는 유전자의 키메라 버전일 수 있다. 이러한 전자의 경우, 변형, 돌연변이 또는 진화는 유전자의 염기서열에 변화를 일으켜 숙주 세포에서 자연적으로 발생하는 유전자와 비교하여 다른 염기서열을 갖는 변형, 돌연변이 또는 진화된 유전자를 얻는다. 진화된 유전자란 야생형 또는 고유 유전자와 비교하였을 때 상이한 뉴클레오티드 서열을 갖는 새로운 유전자를 유도하기 위해, 진화적 압력에 노출되거나, 또는 유전적 변형, 이를 테면, 돌연변이에 의해 획득된 진화된 유전자를 코딩하는 유전자를 지칭한다. 키메라 유전자는 새로운 유전자를 생성하기 위해, 하나 또는 그 이상의 코딩 서열 부분의 조합을 통해 형성된다. 이러한 변형은 전체 유전자 서열을 단일 판독 프레임으로 병합하고, 종종 원래 기능을 유지하는 융합 유전자와 구별된다.
"내생성(endogenous)", "고유의(native)" 또는 "야생형" 핵산, 뉴클레오티드 서열, 폴리펩티드 또는 아미노산 서열은 자연 발생 또는 내생성 핵산, 뉴클레오티드 서열, 폴리펩티드 또는 아미노산 서열을 지칭한다. 따라서, 예를 들면, "야생형 mRNA"는 유기체에서 자연적으로 발생하거나 또는 이 유기체에 내생성인 mRNA이다.
본원에서 사용된 바와 같이, 유기체와 관련하여 사용될 때 용어 "변형된"이란 그렇게 변형되지 않은, 그렇지 않으면, 동일한 숙주 유기체와 비교하였을 때, 적어도 하나의 폴리아민 유사체의 생산을 가능하게 하도록 변형된 숙주 유기체를 지칭한다. 원칙적으로, 본 개시내용에 따른 그러한 "변형"은 변형을 하지 않을 경우, 동일한 유기체와 비교하였을 때, 숙주 유기체에서 폴리아민 유사체의 생산을 적절하게 변경시키는 임의의 생리학적, 유전적, 화학적 또는 기타 변형을 포함할 수 있다. 그러나, 대부분의 구체예들에서, 이런 변형은 유전적 변형을 포함할 것이다. 특정 구체예들에서, 본원에 기술된 바와 같이, 이러한 변형은 숙주 세포로 유전자들의 도입을 포함한다. 폴리펩티드의 활성을 부양하는 유전적 변형에는 다음의 것들이 내포되나, 그러나 이에 국한되지 않는다: 해당 폴리펩티드를 인코드하는 유전자의 하나 또는 그 이상의 카피를 도입시키고(이 숙주 세포에 이미 존재하는 동일한 활성을 갖는 폴리펩티드를 인코드하는 임의의 유전자와는 구별될 수 있음); 해당 유전자의 전사 또는 해독을 증가시키기 위해 이 세포 안에 존재하는 유전자를 변경시키고(가령, 예를 들면, 조절 서열, 프로모터 또는 기타 서열을 변형, 추가 서열을 추가, 하나 또는 그 이상의 뉴클레오티드를 대체시키거나, 이로부터 서열을 삭제하거나, 또는 스와핑시킴); 그리고 활성을 부양시키는(가령, 효소 활성 증가, 피드백 억제 감소, 특이적 세포 내 위치 표적화, mRNA 안정성 부양, 단백질 안정성 향상에 의해) 폴리펩티드를 인코딩하는 유전자의 서열(가령, 비-코딩 또는 코딩)을 변경시킨다. 폴리펩티드의 활성을 감소시키는 유전적 변형에는 다음이 내포되나, 이에 국한되지 않는다: 해당 폴리펩티드를 인코딩하는 유전자의 일부분 또는 전부를 삭제하고; 해당 폴리펩티드를 인코딩하는 유전자를 파괴하는 핵산 서열을 삽입시키고; 해당 유전자의 전사 또는 해독을 감소시키거나, 또는 이 유전자에 의해 인코딩된 mRNA 또는 폴리펩티드의 안정성을 감소시키기 위해 이 세포에 존재하는 유전자를 변경시킨다 (예를 들면, 하나 또는 그 이상의 뉴클레오티드, 프로모터, 조절 서열 또는 기타 서열에 추가 서열을 추가하고, 이를 변경시키거나, 이로부터 서열을 삭제하고, 하나 또는 그 이상의 뉴클레오티드를 대체하거나, 이들 대체를 스와핑시킴으로써). 숙주 세포에서 생성물의 생산과 관련하여 본원에서 사용된 용어 "과다-생산하는"이란 숙주 세포의 대사에 관여하는 상이한 폴리펩티드를 인코딩하는 핵산 서열의 도입으로 인해, 또는 다른 변형의 결과로써, 변형안된 숙주 세포 또는 야생형 세포와 비교하였을 때, 숙주 세포가 산물을 더 많이 생산하고 있음을 나타낸다.
본원에서 사용된 바와 같이, 용어 "벡터"란 본 발명의 폴리펩티드를 인코딩하는 폴리뉴클레오티드를 포함하는 선형 또는 원형 DNA 분자로써, 이러한 발현이 일어나도록 추가 뉴클레오티드에 작동가능하도록 연계되어 있다.
효모 세포의 문맥에서 "도입하다"란 핵산 분자가 세포 내부에 접근할 수 있는 방식으로 핵산 분자를 세포와 접촉시키는 것을 의미한다. 따라서, 폴리뉴클레오티드 및/또는 핵산 분자는 단일 형질변환 이벤트에서, 별도의 형질변환 이벤트에서 효모 세포에 도입될 수 있다. 따라서, 용어 "형질변환"이란 본원에서 사용된 바와 같이 이종성 핵산을 세포 안으로 도입시키는 것을 지칭한다. 효모 세포의 형질변환은 안정적일 수도 있고, 또는 일시적일 수도 있다.
폴리뉴클레오티드의 맥락에서 "일시적 형질변환"은 폴리뉴클레오티드가 세포 내로 도입되고, 세포의 게놈 내로 통합되지 않음을 의미한다.
세포 내로 도입된 폴리뉴클레오티드의 문맥에서 "안정적으로 도입" 또는 "안정적으로 도입된"이란 도입된 폴리뉴클레오티드가 세포의 게놈에 안정적으로 도입되고, 따라서 이 세포는 폴리뉴클레오티드에 의해 안정적으로 형질변환되는 것을 의도한다. "안정적 형질변환" 또는 "안정적으로 형질변환된"이란 본원에서 사용된 바와 같이, 핵산 분자가 세포에 도입되고, 해당 세포의 게놈에 통합된다는 것을 의미한다. 이와 같이, 통합된 핵산 분자는 이의 자손으로 유전될 수 있고, 보다 상세하게는 여러 연속적 세대의 자손으로 유전될 수 있다. 안정적 형질변환이란 본원에서 사용된 바와 같이, 염색체외적으로, 예를 들면, 미니염색체로 유지되는 핵산 분자를 또한 지칭할 수 있다.
일시적 형질변환은 예를 들어, 효소-연계된 면역흡착 분석 (ELISA) 또는 웨스턴 블롯에 의해 검출될 수 있으며, 이는 유기체로 도입된 하나 또는 그 이상의 핵산 분자에 의해 인코딩된 펩티드 또는 폴리펩티의 존재를 탐지할 수 있다. 세포의 안정적인 형질변환은 예를 들어, 유기체 (예를 들어, 효모)로 도입된 핵산 분자의 뉴클레오티드 서열과 특이적으로 혼성화된 핵산 서열을 갖는 핵산 서열과 세포의 게놈 DNA의 서던 블랏 하이브리드 분석에 의해 탐지될 수 있다. 세포의 안정적인 형질변환은 예를 들어, 효모 또는 다른 유기체로 도입된 핵산 분자의 뉴클레오티드 서열과 특이적으로 혼성화된 핵산 서열을 갖는 핵산 서열과 세포의 게놈 RNA의 노던 블랏 하이브리드 분석에 의해 탐지될 수 있다. 세포의 안정적 형질변환은 가령, 중합효소 쇄 반응 (PCR) 또는 당분야에 공지된 기타 증폭 반응에 의해 또한 탐지될 수 있는데, 핵산 분자의 표적 서열(들)에 혼성화되는 특이적 프라이머 서열을 이용하고, 이에 의해 표적 서열(들)이 증폭되며, 이는 표준 방법에 의해 검출될 수 있다. 형질변환은 당분야에 잘 공지된 직접적인 서열화 및/또는 혼성화 프로토콜에 의해 또한 탐지될 수도 있다.
본 발명의 구체예들은 본원에서 정의된 폴리펩티드의 변이체들을 또한 포괄한다. 본원에서 사용된 바와 같이, "변이체"란 기본 서열의 서열 안에 하나 또는 그 이상의 아미노산이 상이한, 기본 서열과는 상이한 아미노산으로 치환된 것에서 유래 된 염기 서열과 다른 폴리펩티드를 의미한다. 예를 들면, 서열 식별 번호:1의 변이체는 서열 식별 번호:1에 대해 적어도 50% 동일한, 예를 들면, 적어도 약 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 약 100% 동일한 아미노산 서열을 가질 수 있다. 변이체 및/또는 단편은 이 변이체 서열이 본원에서 명시된 비-변이체 아미노산 서열을 갖는 효소에 유사하거나, 또는 동일한 기능성 효소 활성 특성을 갖는 기능성 변이체/단편이다 (그리고 이것은 본 명세서에서 사용되는 용어 "기능적 변형"이라는 용어의 의미다).
따라서, 현재 제시되는 아미노산 서열들중 임의의 서열의 "기능적 변이체" 또는 "기능적 단편"은 비-변이체 서열과 동일한 효소 범주 안에 있는 아미노산 서열이다 (가령, 동일한 EC 번호). 특정 카테고리 내에 효소가 속하는지 여부를 결정하는 방법은 독창적 기술의 사용없이도, 효소 카테고리를 결정할 수 있으며, 이는 당업자에게 잘 공지되어 있다. 예를 들면, 적합한 방법들은 예를 들어, International Union of Biochemistry and Molecular Biology에서 얻을 수 있다.
아미노산이 광범위하게 유사한 속성을 갖는 상이한 아미노산으로 치환될 때, 이 아미노산 치환은 "보존적 치환"으로 간주 될 수있다. 비-보존적 치환은 아미노산이 상이한 유형의 아미노산으로 대체되는 경우다.
"보존 적 치환"이란 다음과 같이 정의된 동일한 부류의 또다른 아미노산에 의한 아미노산의 치환을 의미한다: 아미노산 부류 예시
비-극성: A, V, L, I, P, M, F, W
비-하전된-극성: G, S, T, C, Y, N, Q
산성: D, E
염기성: K, R, H.
당업자에게 잘 알려져 있는 바와 같이, 보존적 치환에 의한 폴리펩티드의 일차 구조를 변경하는 것은, 서열로 삽입될 아미노산의 측쇄가 치환되어 빠져 나온 아미노산 측쇄와 유사한 결합 및 접촉점을 형성할 수 있기 때문에, 해당 폴리펩티드의 활성을 유의미적으로 변화시키지 않을 수 있다. 비슷한 결합 및 접점을 형성하여 아미노산의 측쇄로서 대체 된 아미노산의 측쇄로서 형성한다. 이것은 치환이 해당 폴리펩티드의 형태 결정에 중요한 영역에 있는 경우에 조차도 그러하다.
본 발명의 구체예들에서, 본원의 도처에서 특정된 바와 같이, 해당 폴리펩티드의 효소 활성을 방해하지 않는 치환이라면, 비-보존적 치환도 가능하다. 치환 된 버전은 위에 논의된 NC-IUBMB 명명법을 사용하여 결정된 바와 같이, 비-치환된 효소와 동일한 효소 부류로 유지되도록 특성을 유지해야 한다.
광범위하게 말하면, 비-보존적 치환은 보존적 치환보다는 폴리펩티드의 생물학적 활성을 변경없이 가능한 경우는 더 적을 것이다. 임의의 치환 (그리고 임의의 아미노산 결손 또는 삽입)의 효과 결정은 당업자의 일상적인 역량 내에서 전적으로 결정할 수 있고, 당업자는 변이체 폴리펩티드가 본 발명의 측면에 따라 효소 활성이 유지되는 지를 용이하게 결정할 수 있다. 예를 들면, 폴리펩티드의 변이체(즉, 상기 정의된 바와 같이 "기능적 변이체 또는 단편")가 본 발명의 범위 내에 있는 지 여부를 결정할 때, 당업자는 본 명세서에서 언급 된 NC-IUBMB 명칭을 참조하여 정의된 바와 같이, 변이체 또는 단편이 기질을 변환 효소 활성을 유지하는지 여부를 결정할 것이다. 이러한 변이체들 모두 본 발명의 범위 안에 있다.
표준 유전자 코드를 사용하여, 폴리펩티드를 인코딩하는 추가의 핵산 서열은 본원에 개시된 것 이외에도 당업자에 의해 쉽게 구상되고, 제조될 수 있다. 핵산 서열은 DNA 또는 RNA일 수 있고, DNA 분자인 경우, 예를 들어, cDNA 또는 게놈 DNA를 포함할 수 있다. 핵산은 본 명세서의 도처에서 기술된 바와 같이, 발현 벡터 내에 함유될 수 있다.
따라서, 본 발명의 구체예들은 본 발명의 구체예들에 의해 고려되는 폴리펩티이드를 인코딩하는 변이체 핵산 서열을 포괄한다. 핵산 서열과 관련하여, "변이체"라는 용어는 폴리뉴클레오티드 서열로부터 하나 또는 그 이상의 뉴클레오티드(들)의 임의의 치환, 변이, 변형, 대체, 결손, 또는 추가하여, 이러한 폴리뉴클레오티드에 의해 인코드된 생성된 폴리펩티드 서열은 기본 서열로 인코드된 폴리펩티드와 적어도 동일하거나, 또는 유사한 효소 속성을 나타낸다는 것을 의미한다. 이 용어에는 대립형질유전자 변이체들이 내포되며, 또한 본 발명의 구체예들의 폴리뉴클레오타이드 서열에 실질적으로 혼성화되는 폴리뉴클레오티드 ( "프로브 서열")이 내포된다. 이러한 혼성화는 낮은 엄격성(stringency)과 높은 엄격성 조건에서, 또는 그 사이에서 발생할 수 있다. 일반적으로 낮은 엄격성 조건은 프로브 서열의 산출된 또는 실질적인 용융 온도(Tm) (예를 들면, 대략 실험실 온도 내지 약 55℃)보다 낮은, 약 40-48℃의 온도에서 0.330-0.825m NaCl 완충액에서 세척 단계가 발생하는 혼성화로 정의될 수 있고, 한편 높은 엄격성 조건은 프로스 서열의 산출된 또는 실질적인 Tm(예를 들면, 약 65℃)보다 낮은 약 5-10℃의 온도에서 0.0165-0.0330M N 완충액에서 세척과 관련된다. 완충액은 예를 들어, 염수-구연산 나트륨(SSC) 완충액 (0.15m NaCl 및 0.015M 시트레이트삼나트륨)일 수 있고, 낮은 엄격성 세척은 3 × SSC 완충액에서 일어나고, 높은 엄격성 세척은 0.1 × SSC 완충액에서 일어난다. 핵산 서열의 혼성화와 관련된 단계들은 예를 들어, Molecular Cloning, a laboratory manual [second edition] Sambrook et al. Cold Spring Harbor Laboratory, 1989에서, 예를 들면 이의 섹션 11 "합성 올리고뉴클레오티드 프로브"에서 기술되어 있다.
선호적으로, 핵산 서열 변이체는 본 발명의 구체예에의 핵산 서열과 공통적인 뉴클레오티드를 약 80% 또는 그 이상을 갖고, 더욱 선호적으로, 적어도 85%, 또는 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 또는 그 이상의 서열 동일성을 갖는다.
본 발명의 핵산 변이체는 특정 숙주 세포에서 발현을 위해 코돈-최적화될 수 있다.
본원에서 사용된 바와 같이, "서열 동일성"이란 두 개 뉴클레오티드 서열 또는 두 개 펩티드 또는 단백질 서열 간의 서열 유사성을 지칭한다. 유사성은 해당 서열들 간의 구조적 및/또는 기능 관계를 결정하기 위한 시퀀스 정렬에 의해 결정된다.
아미노산 서열 간의 서열 동일성은 Needleman-Wunsch Global Sequence Alignment Tool available from the National Center for Biotechnology Information (NCBI), Bethesda, Md., USA, 예를 들면, http://blast.ncbi. nlm.nih.gov/Blast.cgi을 이용하여 디폴트 매개변수 설정(단백질 정렬의 경우, Gap costs Existence: 11 Extension: 1)에 따라 이들 서열을 비교함으로써 결정될 수 있다. 본 명세서에서 언급된 서열 비교 및 동일성 백분율은 이 소프트웨어를 사용하여 결정되었다. 서열 식별 번호:1에 대해 서열 동일성 수준을 비교할 때, 짧은 영역의 높은 동일성 중첩으로 인하여 전반적으로 동일성 산정이 높게 나오는 것을 피하기 위해, 서열 식별 번호:1의 전장에 대해 실시하는 것이 바람직하다(즉, 글로벌 정렬 방법이 사용됨)의 전체 길이에 비해 바람직하게는 수행되어야 한다. 예를 들면, 가령, 5개 아미노산의 짧은 폴리펩티드 단편은 서열 식별 번호:1의 전체 안에 있는 5개 아미노산 영역에 대해 100% 동일한 서열이지만, 그러나, 이것은 해당 단편이 서열 식별 번호:1의 위치에 대해 등가의 다른 위치에서 동일한 아미노산을 또한 보유하는 더 긴 서열의 일부분을 형성하지 않는 한, 100% 아미노산 동일성을 제공하지 않는다. 비교된 서열에서 등가 위치가 동일한 아미노산에 의해 점유되면, 해당 분자는 그 위치에서 동일하다. 동일성의 백분율로 정렬을 점수화하는 것은 비교된 서열에서 공유되는 위치에서 동일한 아미노산의 수에 대한 함수다. 서열을 비교할 때, 최적의 정렬은 해당 서열에서 가능한 삽입 및 결실을 고려하기 위해, 하나 또는 그 이상의 서열 중 하나의 서열에 갭을 도입해야 할 수 있다. 서열 비교 방법은 갭 패널티를 이용할 수 있는데, 비교될 서열에서 동일한 수의 분자 경우, 가능한 적은 수의 갭을 사용하고, 비교되는 두 서열 간의 관련성이 더 높음은 많은 갭을 갖는 것보다 더 높은 점수를 얻을 것이다. 최대 비율의 동일산 계산은 갭 페널티를 고려하여, 최적의 정렬을 하는 것과 연관된다. 전술한 바와 같이, 서열 동일성 백분율은 디폴트 매개 변수 설정을 사용하여, Needleman-Wunsch Global Sequence Alignment 도구를 사용하여, 결정될 수 있다. 상기 Needleman-Wunsch 알고리즘은 J. Mol. Biol. (1970) vol. 48: 443-453에 공개되어 있다.
본 발명의 측면은 적어도 하나의 폴리아민 유사체를 생산할 수 있는 효모 세포에 관계한다. 상기 효모 세포는 적어도 하나의 폴리아민 유사체를 생산할 수 있다. 상기 효모 세포는 적어도 하나의 코엔자임 A (CoA) 리가제 인코딩 유전자, 선호적으로 4-쿠마레이트:CoA 리가제 인코딩 유전자, 적어도 하나의 폴리아민 N-아실트랜스퍼라제 유전자, 그리고 적어도 하나의 폴리아민 합성효소 인코딩 유전자를 포함하지만, 폴리아민 산화효소 인코딩 유전자는 결여되어 있거나, 또는 파괴된 폴리아민 산화효소 인코딩 유전자를 포함한다.
본 발명의 효모 세포는 카르복실기 포함하는 분자를 CoA 에스테르로 전환시킬 수 있는, 4-쿠마레이트:CoA 리가제 (EC 6.2.1.12)를 인코딩하는 유전자를 포함한다. 그 다음, 대응하는 CoA 에스테르는 상기 효모 세포에 의해 만들어지는 상기 적어도 하나의 폴리아민과 함께, 폴리아민 N-아실트랜스퍼라제의 기질이며, 따라서 적어도 하나의 폴리아민 유사체를 아세틸화시키고, 상기 적어도 하나의 폴리아민과 CoA 에스테르 사이에 결합된 아미드가 형성됨으로써, 적어도 하나의 폴리아민 유사체가 획득된다.
한 구체예에서, 상기 효모 세포는 4-쿠마레이트:CoA 리가제를 과다-발현시키도록 공작된다.
한 구체예에서, 4-쿠마레이트:CoA 리가제의 과다발현은 4-쿠마레이트:CoA 리가제 인코딩 유전자를 해당 효모 세포에서 매우 활성이 큰 프로모터의 전사 조절 하에 둠으로써 이루어진다. 효모 세포에 사용하기에 적합한 프로모터에는 PDC, GPD, GPD1, TEF1, PGK1, TDH 및 TDH3의 프로모터가 내포되나, 이에 국한되지 않는다. 기타 적합한 프로모터에는 GAL1, GAL2, GAL10, GAL7, CUP1, HIS3, CYC1, ADH1, PGL, GAPDH, ADC1, URA3, TRP1, LEU2, TPI, AOX1 및 ENOl가 내포된다.
상기 효모 세포는 4-쿠마레이트:CoA 리가제 인코딩 유전자의 한 개 또는 다수, 가령, 적어도 두 개의 카피를 포함하고, 이로 인하여 4-쿠마레이트:CoA 리가제에 대한 mRNA 카피 수가 증가되며, 이로 인하여 해당 효모 세포에 의해 만들어지는 4-쿠마레이트:CoA 리가제의 양이 증가된다. 이러한 경우, 4-쿠마레이트:CoA 리가제 인코딩 유전자의 다수 카피는 한 개 프로모터의 전사 제어 하에 있을 수 있고, 또는 4-쿠마레이트:CoA 리가제 인코딩하는 각 유전자는 각 프로모터의 전사 제어 하에 있을 수 있다. 후자의 경우, 동일한 유형의 프로모터를 이용하여, 4-쿠마레이트:CoA 리가제 인코딩하는 각 유전자의 전사를 조절할 수 있거나, 또는 상이한 유형의 프로모터가 이용될 수 있다.
한 구체예에서, 상기 4-쿠마레이트:CoA 리가제 (4CL) 인코딩 유전자는 아라비도프시스 탈리아나(Arabidopsis thaliana) 4-쿠마레이트:CoA 리가제 1 (At4CL1), At4CL2, At4CL3, At4CL4, At4CL5, 그리고 4-쿠마레이트:CoA 리가제 At4CL1, At4CL2, At4CL3, At4CL4, 또는 At4CL5중 임의의 하나와 적어도 80%의 서열 동일성을 갖는 4-쿠마레이트:CoA 리가제를 인코드하는 뉴클레오티드 서열에서 선택된다. 한 구체예에서, 상기 뉴클레오티드 서열은 아라비도프시스 탈리아나(Arabidopsis thaliana) 4CL1 (서열 식별 번호:1), 4CL2, 4CL3, 4CL4 또는 4CL5중 임의의 하나와 적어도 85%, 또는 심지어 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖는 4-쿠마레이트:CoA 리가제를 인코드한다. 한 구체예에서, 적어도 80% 서열 동일성을 갖는 4-쿠마레이트:CoA 리가제는 카르복실기 포함하는 분자를 CoA 에스테르로 전환시킬 수 있고, 선호적으로 4-쿠마레이트를 4-쿠마로일-CoA로의 전환을 촉매할 수 있다. 적어도 80% 서열 동일성을 갖는 4-쿠마레이트:CoA 리가제의 효소적 효능은 관련 4-쿠마레이트:CoA 리가제의 대응하는 효소 효능보다 더 낮거나, 실질적으로 대등하거나 또는 더 높을 수 있고, 선호적으로 적어도 실질적으로 대등하거나 또는 더 높을 수 있다.
특정 구체예에서, 상기 4-쿠마레이트:CoA 리가제 인코딩 유전자는 At4CL1이다. At4CL1의 아미노산 서열은 서열 식별 번호:1에 나타내며, At4CL1의 뉴클레오티드 서열은 서열 식별 번호:2에 나타낸다.
한 구체예에서, 상기 효모 세포는 상기 적어도 하나의 폴리아민 N-아실트랜스퍼라제를 과다-발현시키도록 공작된다.
한 구체예에서, 상기 적어도 하나의 폴리아민 N-아실트랜스퍼라제의 과다발현은 해당 효모 세포에서 매우 활성이 큰 프로모터의 전사 조절 하에 적어도 하나의 폴리아민 N-아실트랜스퍼라제 인코딩 유전자를 둠으로써 이루어진다. 효모 세포에 사용하기에 적합한 프로모터에는 PDC, GPD, GPD1, TEF1, PGK1, TDH 및 TDH3의 프로모터가 내포되나, 이에 국한되지 않는다. 기타 적합한 프로모터에는 GAL1, GAL2, GAL10, GAL7, CUP1, HIS3, CYC1, ADH1, PGL, GAPDH, ADC1, URA3, TRP1, LEU2, TPI, AOX1 및 ENOl가 내포된다.
상기 효모 세포는 폴리아민 N-아실트랜스퍼라제 인코딩 유전자의 하나의 카피 또는 다수 카피를 포함하고, 이로 인하여 폴리아민 N-아실트랜스퍼라제에 대한 mRNA의 카피 수가 증가되며, 이로 인하여 해당 효모 세포에 의해 만들어지는 폴리아민 N-아실트랜스퍼라제의 양이 증가될 수 있다. 이러한 경우, 폴리아민 N-아실트랜스퍼라제의 다수 카피는 한 개 프로모터의 전사 제어 하에 있을 수 있고, 또는 폴리아민 N-아실트랜스퍼라제 인코딩하는 각 유전자는 각 프로모터의 전사 제어 하에 있을 수 있다. 후자의 경우, 동일한 유형의 프로모터를 이용하여, 폴리아민 N-아실트랜스퍼라제 인코딩하는 각 유전자의 전사를 조절할 수 있거나, 또는 상이한 유형의 프로모터가 이용될 수 있다.
한 구체예에서, 상기 효모 세포는 스페르미딘 히드록시시나모일 전달효소 (EC 2.3.1.M34) 인코딩 유전자, 스페르미딘 쿠마로일-CoA 아실트랜스퍼라제 (EC 2.3.1.249) 인코딩 유전자 및 푸트레신 히드록시시나모일 전달효소 (EC 2.3.1.138) 인코딩 유전자로 구성된 군에서 선택된 적어도 하나의 폴리아민 N-아실트랜스퍼라제 인코딩 유전자를 포함한다.
특정 구체예에서, 상기 스페르미딘 히드록시시나모일 전달효소 (SHT) 인코딩 유전자는 아라비도프시스 탈리아나(Arabidopsis thaliana) 스페르미딘 히드록시시나모일 전달효소 (AtSHT), 니코티아나 아테누아타(Nicotiana attenuata) DH29 (NaDH29) 및 스페르미딘 히드록시시나모일 전달효소 AtSHT (서열 식별 번호:3) 또는 스페르미딘 히드록시시나모일 전달효소 NaDH29 (서열 식별 번호:5)와 적어도 80% 서열 동일성을 갖는 스페르미딘 히드록시시나모일 전달효소를 인코딩하는 뉴클레오티드 서열로 구성된 군에서 선택된다. 한 구체예에서, 상기 뉴클레오티드 서열은 아라비도프시스 탈리아나(Arabidopsis thaliana) SHT 또는 니코티아나 아테누아타(Nicotiana attenuata) DH29중 임의의 것과 적어도 85%, 또는 심지어 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 까지의 서열 동일성을 갖는 스페르미딘 히드록시시나모일 전달효소를 인코드한다. 한 구체예에서, 적어도 80% 서열 동일성을 갖는 이러한 스페르미딘 히드록시시나모일 전달효소는 스페르미딘 및 CoA 에스테르를 폴리아민 유사체로의 전환을 촉매할 수 있고, 선호적으로 스페르미딘 및 쿠마로일-CoA, 페룰로일-CoA, 카페오일-CoA, 시나모일-CoA 또는 시나포일-CoA을 N 1 -(쿠마로일, 페룰로일, 카페오일, 시나모일 또는 시나포일) 스페르미딘, N 10 -(쿠마로일, 페룰로일, 카페오일, 시나모일 또는 시나포일) 스페르미딘, N 1 ,N 10 -비스(쿠마로일, 페룰로일, 카페오일, 시나모일 또는 시나포일) 스페르미딘 및/또는 N 1 ,N 5 ,N 10 -트리(쿠마로일, 페룰로일, 카페오일, 시나모일 또는 시나포일) 스페르미딘으로의 전환을 촉매할 수 있다. 적어도 80% 서열 동일성을 갖는 스페르미딘 히드록시시나모일 전달효소의 효소적 효능은 관련 스페르미딘 히드록시시나모일 전달효소의 대응하는 효소 효능보다 더 낮거나, 실질적으로 대등하거나 또는 더 높을 수 있고, 선호적으로 적어도 실질적으로 대등하거나 또는 더 높을 수 있다.
SHT 인코딩 유전자는 폴리아민 알칼로이드, 그리고 특히, 단일-치환된, 이중-치환된 (또한 비스-치환된으로도 지칭됨) 및/또는 삼중-치환된 N-아실화된 폴리아민, 선호적으로 스페르미딘과 관련하여, 효모 세포에서 폴리아민 유사체의 생산을 촉매할 수 있다. 특정 구체예에서, 4CL 인코딩 유전자와 함께, 이러한 SHT 인코딩 유전자의 발현으로 상기 효모 세포는 AtSHT의 경우 대칭적으로 삼중-치환된 N-아실화된 폴리아민, 선호적으로 스페르미딘을 생산하고, 그리고 NaDH29의 경우 대칭적으로 단일-치환된 N-아실화된 폴리아민, 선호적으로 스페르미딘을 생산할 수 있게 된다.
AtSHT의 아미노산 서열은 서열 식별 번호:3에 나타내며, AtSHT 의 뉴클레오티드 서열은 서열 식별 번호:4에 나타낸다. NaDH29의 대응하는 아미노산 서열은 서열 식별 번호:5에 나타내며, NaDH29 의 뉴클레오티드 서열은 서열 식별 번호:6에 나타낸다.
한 구체예에서, 스페르미딘 쿠마로일-CoA 아실트랜스퍼라제 (SCT) 인코딩 유전자는 아라비도프시스 탈리아나(Arabidopsis thaliana) 스페르미딘 쿠마로일-CoA 아실트랜스퍼라제 (AtSCT) 및 스페르미딘 쿠마로일-CoA 아실트랜스퍼라제 AtSCT와 적어도 80% 서열 동일성을 갖는 스페르미딘 쿠마로일-CoA 아실트랜스퍼라제를 인코딩하는 뉴클레오티드 서열로 구성된 군에서 선택된다. 한 구체예에서, 상기 뉴클레오티드 서열은 아라비도프시스 탈리아나(Arabidopsis thaliana) SCT (서열 식별 번호:7)와 적어도 85%, 또는 심지어 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99%까지의 서열 동일성을 갖는 스페르미딘 쿠마로일-CoA 아실트랜스퍼라제를 인코드한다. 한 구체예에서, 적어도 80% 서열 동일성을 갖는 이러한 스페르미딘 쿠마로일-CoA 아실트랜스퍼라제는 스페르미딘 및 CoA 에스테르를 폴리아민 유사체로 전환을 촉매할 수 있으며, 선호적으로 스페르미딘 및 쿠마로일-CoA, 페룰로일-CoA, 카페오일-CoA, 시나모일-CoA 또는 시나포일-CoA를 N 1 ,N 10 -비스(쿠마로일, 페룰로일, 카페오일, 시나모일 또는 시나포일) 스페르미딘로 전환을 촉매할 수 있다. 적어도 80% 서열 동일성을 갖는 스페르미딘 쿠마로일-CoA 아실트랜스퍼라제의 효소적 효능은 AtSCT의 대응하는 효소 효능보다 더 낮거나, 실질적으로 대등하거나 또는 더 높을 수 있고, 선호적으로 적어도 실질적으로 대등하거나 또는 더 높을 수 있다.
상기 SCT 인코딩 유전자는 폴리아민 알칼로이드, 특히, 이중-치환된 N-아실화된 폴리아민, 선호적으로 스페르미딘과 관련하여 효모 세포에서 폴리아민 유사체의 생산을 촉매할 수 있다. 특정 구체예에서, 4CL 인코딩 유전자와 함께 이러한 SCT 인코딩 유전자의 발현으로 AtSCT의 경우 상기 효모 세포는 대칭적으로 이중-치환된 N-아실화된 폴리아민, 선호적으로 스페르미딘을 생산할 수 있게 된다.
AtSCT의 아미노산 서열은 서열 식별 번호:7에 나타내며, AtSCT의 뉴클레오티드 서열은 서열 식별 번호:8에 나타낸다.
한 구체예에서, 상기 푸트레신 히드록시시나모일 전달효소 인코딩 유전자는 니코티아나 아테누아타(Nicotiana attenuata) AT1 (NaAT1) 및 푸트레신 히드록시시나모일 전달효소 NaAT1과 적어도 80% 서열 동일성을 갖는 푸트레신 히드록시시나모일 전달효소를 인코딩하는 뉴클레오티드 서열로 구성된 군에서 선택된다. 한 구체예에서, 상기 뉴클레오티드 서열은 니코티아나 아테누아타(Nicotiana attenuata) AT1 (서열 식별 번호:9)와 적어도 85%, 또는 심지어 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99%까지의 서열 동일성을 갖는 푸트레신 히드록시시나모일 전달효소를 인코드한다. 한 구체예에서, 적어도 80% 서열 동일성을 갖는 이러한 푸트레신 히드록시시나모일 전달효소는 푸트레신 및 CoA 에스테르를 폴리아민 유사체로의 전환을 촉매할 수 있고, 선호적으로 푸트레신 및 쿠마로일-CoA, 페룰로일-CoA, 카페오일-CoA, 시나모일-CoA 또는 시나포일-CoA를 N 1 -(쿠마로일, 페룰로일, 카페오일, 시나모일 또는 시나포일) 푸트레신, N 6 -비스(쿠마로일, 페룰로일, 카페오일, 시나모일 또는 시나포일) 푸트레신 및/또는 N 1 ,N 6 -비스(쿠마로일, 페룰로일, 카페오일, 시나모일 또는 시나포일) 푸트레신으로의 전환을 촉매할 수 있다. 적어도 80% 서열 동일성을 갖는 푸트레신 히드록시시나모일 전달효소의 효소적 효능은 NaAT1의 대응하는 효소 효능보다 더 낮거나, 실질적으로 대등하거나 또는 더 높을 수 있고, 선호적으로 적어도 실질적으로 대등하거나 또는 더 높을 수 있다.
상기 푸트레신 히드록시시나모일 전달효소 인코딩 유전자는 폴리아민 알칼로이드, 특히, 이중-치환된 N-아실화된 폴리아민, 선호적으로 푸트레신과 관련하여 효모 세포에서 폴리아민 유사체의 생산을 촉매할 수 있다. 특정 구체예에서, 4CL 인코딩 유전자와 함께 이러한 푸트레신 히드록시시나모일 전달효소 인코딩 유전자의 발현으로 NaAT1의 경우 상기 효모 세포는 대칭적으로 이중-치환된 N-아실화된 폴리아민, 선호적으로 푸트레신을 생산할 수 있게 된다.
NaAT1의 아미노산 서열은 서열 식별 번호:9에 나타내며, NaAT1의 뉴클레오티드 서열은 서열 식별 번호:10에 나타낸다.
한 구체예에서, 상기 효모 세포는 한 가지 이상 유형의 폴리아민 N-아실트랜스퍼라제 인코딩 유전자를 포함한다. 그런 이유로, 이들 구체예는 4CL 인코딩 유전자, 이를 테면, At4CL1, SHT 인코딩 유전자, 이를 테면, AtSHT 및/또는 NaDH29, 그리고 SCT 인코딩 유전자, 이를 테면, AtSCT를 포함하는 효모세포; 4CL 인코딩 유전자, 이를 테면, At4CL1, SHT 인코딩 유전자, 이를 테면, AtSHT 및/또는 NaDH29, 그리고 푸트레신 히드록시시나모일 전달효소 인코딩 유전자, 이를 테면, NaAT1를 포함하는 효모세포; 4CL 인코딩 유전자, 이를 테면, At4CL1, SCT 인코딩 유전자, 이를 테면, AtSCT, 그리고 푸트레신 히드록시시나모일 전달효소 인코딩 유전자, 이를 테면, NaAT1를 포함하는 효모세포; 그리고 4CL 인코딩 유전자, 이를 테면, At4CL1, SHT 인코딩 유전자, 이를 테면, AtSHT 및/또는 NaDH29, SCT 인코딩 유전자, 이를 테면, AtSCT, 그리고 푸트레신 히드록시시나모일 전달효소 인코딩 유전자, 이를 테면, NaAT1를 포함하는 효모세포를 포괄한다. 예를 들어, 4CL 인코딩 유전자, 이를 테면, At4CL1, SCT 인코딩 유전자, 이를 테면, AtSCT, 그리고 SHT 인코딩 유전자, 이를 테면, AtSHT를 포함하는 효모 세포는 비대칭적으로 삼중-치환된 N-아실화된 폴리아민, 선호적으로 스페르미딘을 생산할 수 있다.
한 구체예에서, 상기 카르복실기 포함하는 분자, 이를 테면, 방향족 유기산(들), 지방산(들), 할로겐화된 방향족 유기산(들), 할로겐화된 지방산(들) 또는 이의 조합은 이들 효모 세포가 배앵되는 배양 배지에 추가된다. 그런 이유로, 이 구체예에서, 상기 효모 세포는 이 효모 세포에 의해 발현되는 4-쿠마레이트:CoA 리가제에 의해 CoA 에스테르로 전환되는 카르복실기 포함하는 분자를 공급받는다. 그 다음, 상기 효모 세포는 단일 카르복실기 포함하는 분자 또는 상이한 카르복실기 포함하는 분자의 혼합물을 공급받을 수 있다. 예를 들어, 방향족 유기산 혼합물을 공급받을 때, 4CL 인코딩 유전자, 이를 테면, At4CL1, 그리고 SHT 인코딩 유전자, 이를 테면, AtSHT를 포함하는 효모 세포는 비대칭적으로 삼중-치환된 N-아실화된 폴리아민, 이를 테면, 스페르미딘을 생산할 수 있다. 마찬가지로, 방향족 유기산 혼합물을 공급받을 때, 4CL 인코딩 유전자, 이를 테면, At4CL1, 그리고 SCT 인코딩 유전자, 이를 테면, AtSCT를 포함하는 효모 세포는 비대칭적으로 이중-치환된 N-아실화된 폴리아민, 이를 테면, 스페르미딘을 생산할 수 있다. 방향족 유기산 혼합물을 공급받을 때, 4CL 인코딩 유전자, 이를 테면, At4CL1, 그리고 SHT 인코딩 유전자, 이를 테면, NaDH29를 포함하는 효모 세포는 대칭적으로 단일-치환된 N-아실화된 폴리아민, 이를 테면, 스페르미딘을 생산할 수 있다.
대신, 또는 이에 보완적으로, 카르복실기 포함하는 분자(들), 이를 테면, 방향족 유기산(들) 및/또는 지방산(들), 및/또는 이의 할로겐화된 형태가 이들 효모 세포에 공급되면, 상기 카르복실기 포함하는 분자(들)을 생산하거나, 또는 과잉생산하도록 상기 효모 세포를 공작할 수 있다. 그런 이유로, 특정 구체예에서, 상기 효모 세포는 방향족 유기산, 할로겐화된 방향족 유기산, 지방산, 할로겐화된 지방산 및 이의 조합으로 구성된 군에서 선택된 적어도 하나의 유기산을 생산할 수 있다. 이러한 방향족 유기산 및/또는 지방산 생산을 위해 공작된 효모 세포는 Yu et al. 2018; Zhou et al. 2016; Liu et al. 2019; 그리고 Rodriguez et al. 2015에 교시되며, 방향족 유기산, 할로겐화된 방향족 유기산, 지방산, 할로겐화된 지방산 및 이의 조합으로 구성된 군에서 선택된 적어도 하나의 유기산을 생산할 수 있는 효모 세포를 이용한 교시는 본원의 참고자료에 편입된다.
그러나, 본 발명의 효모 세포에서 이러한 카르복실기 포함하는 분자의 과다 생산으로 폴리아민 대사와 카르복실기 포함하는 분자(들), 이를 테면, 방향족 아미노산 (AAA) 대사 간의 흐름 불균형을 야기할 수 있다. 배양 배지로 카르복실기 포함하는 분자(들)을 추가함으로써 효모 세포에 공급하는 대신, 또는 이에 대한 보완으로써 카르복실기 포함하는 분자에 때한 또다른 공급원은 미생물 세포, 선호적으로 카르복실기 포함하는 분자(들)를 생산하고, 분비할 수 있는 효모 세포와 함께 본 발명의 효모 세포를 공동-배양시키는 것이다. 본 발명의 효모 세포와 공동-배양될 이러한 미생물 세포의 비-제한적인 예로는 Yu et al. 2018; Zhou et al. 2016; Liu et al. 2019; 그리고 Rodriguez et al. 2015에 교시되어 있지만, 그러나 이에 국한되지 않는다.
본원에서 사용된 바와 같이, 할로겐화된 방향족 유기산에는 할로겐-치환된 방향족 유기산이 내포되며, 할로겐화된 지방산에는 할로겐-치환된 지방산이 내포된다. 이러한 할로겐-치환된 방향족 유기산 및 지방산의 설명을 위한 예로는 플루오린-치환된, 염소-치환된, 브롬-치환된 그리고 요오드-치환된 방향족 유기산 및 지방산, 선호적으로 플루오린-치환된 방향족 유기산 및 지방산이 내포된다.
한 구체예에서, 상기 적어도 하나의 폴리아민은 스페르민, 테르모스페르민, sym-호모스페르미딘, 1,3-디아미노프로판, 푸트레신, 카다베린, 아그마틴, 스페르미딘, sym-노르스페르미딘, 노르스페르민 및 이의 조합으로 구성된 군에서 선택된다.
본 발명의 효모 세포에는 폴리아민 산화효소 (EC 1.5.3.17) 인코딩 유전자가 결여되어 있거나, 또는 파괴된 폴리아민 산화효소 인코딩 유전자를 포함한다. 상기 효모 세포는 적어도 하나의 폴리아민 합성효소 인코딩 유전자를 또한 포함한다.
상기 효모 세포에 의해 발현되는 적어도 하나의 폴리아민 합성효소는 이 효모 세포에서 적어도 하나의 폴리아민 생산을 촉매한다. 폴리아민 산화효소는 스페르민이 다시 스페르미딘으로의 전환을 촉매하는 효소다. 그런 이유로, 상기 효모 세포에는 임의의 폴리아민 산화효소 인코딩 유전자가 결여되어 있거나, 또는 파괴된 폴리아민 산화효소 인코딩 유전자를 포함한다. 이것은 상기 효모 세포에는 선호적으로 임의의 폴리아민 산화효소가 결여되어 있거나 또는, 이러한 폴리아민 산화효소가 상기 효모 세포에서 발현된다면, 이 폴리아민 산화효소는 바람직하게는 효소적으로 비활성이거나, 또는 고유의 폴리아민 산화효소와 비교하였을 때, 적어도 상당히 더 낮은 효소 효능을 갖는다.
한 구체예에서, 상기 효모 세포는 상기 적어도 하나의 폴리아민 합성효소가 과다발현되도록 공작된다.
상기 적어도 하나의 폴리아민 합성효소의 과다발현은 구체예에서, 해당 효모 세포에서 매우 활성이 큰 프로모터의 전사 조절 하에 적어도 하나의 폴리아민 N-아실트랜스퍼라제 인코딩 유전자를 둠으로써 이루어진다. 효모 세포에 사용하기에 적합한 프로모터에는 PDC, GPD, GPD1, TEF1, PGK1, TDH 및 TDH3의 프로모터가 내포되나, 이에 국한되지 않는다. 기타 적합한 프로모터에는 GAL1, GAL2, GAL10, GAL7, CUP1, HIS3, CYC1, ADH1, PGL, GAPDH, ADC1, URA3, TRP1, LEU2, TPI, AOX1 및 ENOl가 내포된다.
상기 효모 세포는 폴리아민 합성효소 인코딩 유전자의 하나의 카피 또는 다수 카피를 포함하고, 이로 인하여 폴리아민 합성효소에 대한 mRNA의 카피 수가 증가되며, 이로 인하여 해당 효모 세포에 의해 만들어지는 폴리아민 합성효소의 양이 증가될 수 있다. 이러한 경우, 폴리아민 합성효소의 다수 카피는 한 개 프로모터의 전사 제어 하에 있을 수 있고, 또는 폴리아민 합성효소 인코딩하는 각 유전자는 각 프로모터의 전사 제어 하에 있을 수 있다. 후자의 경우, 동일한 유형의 프로모터를 이용하여, 폴리아민 합성효소 인코딩하는 각 유전자의 전사를 조절할 수 있거나, 또는 상이한 유형의 프로모터가 이용될 수 있다.
한 구체예에서, 상기 폴리아민 합성효소 인코딩 유전자는 스페르민 합성효소 (EC 2.5.1.22) 인코딩 유전자, 테르모스페르민 합성효소 (EC 2.5.1.79) 인코딩 유전자 및 호모스페르미딘 합성효소 (EC 2.5.1.44 또는 EC 2.5.1.45) 인코딩 유전자로 구성된 군에서 선택된다.
한 구체예에서, 상기 스페르민 합성효소 인코딩 유전자는 사카로미세스 세레비시에(Saccharomyces cerevisiae) 스페르민 합성효소, 선호적으로 ScSPE4, 아라비도프시스 탈리아나(Arabidopsis thaliana) 스페르민 합성효소 (AtSPMS) 및 스페르민 합성효소 ScSPE4 또는 스페르민 합성효소 AtSPMS와 적어도 80% 서열 동일성을 갖는 스페르민 합성효소를 인코딩하는 뉴클레오티드 서열로 구성된 군에서 선택된다. 한 구체예에서, 상기 뉴클레오티드 서열은 ScSPE4 또는 AtSPMS와 적어도 85%, 또는 심지어 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖는 스페르민 합성효소를 인코드한다. 한 구체예에서, 적어도 80% 서열 동일성을 갖는 이러한 스페르민 합성효소는 스페르미딘을 스페르민으로의 전환을 촉매할 수 있다. 적어도 80% 서열 동일성을 갖는 스페르민 합성효소의 효소적 효능은 ScSPE4 또는 AtSPES의 대응하는 효소 효능보다 더 낮거나, 실질적으로 대등하거나 또는 더 높을 수 있고, 선호적으로 적어도 실질적으로 대등하거나 또는 더 높을 수 있다.
ScSPE4의 아미노산 서열은 서열 식별 번호:11에 나타내며, ScSPE4의 뉴클레오티드 서열은 서열 식별 번호:12에 나타낸다. AtSPMS의 대응하는 아미노산 서열은 서열 식별 번호:13에 나타내며, AtSPMS의 뉴클레오티드 서열은 서열 식별 번호:14에 나타낸다.
한 구체예에서, 상기 테르모스페르민 합성효소 인코딩 유전자는 아라비도프시스 탈리아나(Arabidopsis thaliana) 테르모스페르민 합성효소, 선호적으로 AtACL5, 그리고 테르모스페르민 합성효소 AtACL5와 적어도 80% 서열 동일성을 갖는 테르모스페르민 합성효소를 인코딩하는 뉴클레오티드 서열로 구성된 군에서 선택된다. 한 구체예에서, 상기 뉴클레오티드 서열은 AtACL5와 적어도 85%, 또는 심지어 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖는 테르모스페르민 합성효소를 인코드한다. 한 구체예에서, 적어도 80% 서열 동일성을 갖는 이러한 테르모스페르민 합성효소는 스페르미딘을 테르모스페르민으로의 전환을 촉매할 수 있다. 적어도 80% 서열 동일성을 갖는 테르모스페르민 합성효소의 효소적 효능은 AtACL5의 대응하는 효소 효능보다 더 낮거나, 실질적으로 대등하거나 또는 더 높을 수 있고, 선호적으로 적어도 실질적으로 대등하거나 또는 더 높을 수 있다.
AtACL5의 아미노산 서열은 서열 식별 번호:15에 나타내며, AtACL5의 뉴클레오티드 서열은 서열 식별 번호:16에 나타낸다.
한 구체예에서, 상기 호모스페르미딘 합성효소 (HSS) 인코딩 유전자는 세네시오 베르날리스(Senecio vernalis) 호모스페르미딘 합성효소 (SvHSS), 블라스토클로리스 비리디스(Blastochloris viridis) 호모스페르미딘 합성효소 (BvHSS) 및 호모스페르미딘 합성효소 SvHSS 또는 호모스페르미딘 합성효소 BvHSS와 적어도 80% 서열 동일성을 갖는 테르모스페르민 합성효소를 인코딩하는 뉴클레오티드 서열로 구성된 군에서 선택된다. 한 구체예에서, 상기 뉴클레오티드 서열은 SvHSS 또는 BvHSS와 적어도 85%, 또는 심지어 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖는 호모스페르미딘 합성효소를 인코드한다. 구체예에서, 적어도 80% 서열 동일성을 갖는 이러한 호모스페르미딘 합성효소는 푸트레신을 sym-호모스페르미딘, 또는 푸트레신 또는 스페르미딘을 sym-호모스페르미딘로의 전환을 촉매한다. 적어도 80% 서열 동일성을 갖는 호모스페르미딘 합성효소의 효소적 효능은 호모스페르미딘의 대응하는 효소 효능보다 더 낮거나, 실질적으로 대등하거나 또는 더 높을 수 있고, 선호적으로 적어도 실질적으로 대등하거나 또는 더 높을 수 있다.
SvHSS의 아미노산 서열은 서열 식별 번호:17에 나타내며, SvHSS의 뉴클레오티드 서열은 서열 식별 번호:18에 나타낸다. BvHSS의 대응하는 아미노산 서열은 서열 식별 번호:19에 나타내며, BvHSS의 뉴클레오티드 서열은 서열 식별 번호:20에 나타낸다.
한 구체예에서, 상기 효모 세포는 다음으로 구성된 군에서 선택된다: 사카로미세스(Saccharomyces), 클루베로미세스(Kluyveromyces), 지고사카로미세스(Zygosaccharomyces), 칸디다(Candida), 한세니아스포라(Hanseniaspora), 피키아(Pichia), 한세누라(Hansenula), 쉬조사카로미세스(Schizosaccharomyces), 트리고놉시시(Trigonopsis), 브레타노미세스(Brettanomyces), 데바로미세스(Debaromyces), 다드소니아(Nadsonia), 리포미세스(Lipomyces), 크립토코쿠스(Cryptococcus), 아우레오바시디움(Aureobasidium), 트리코스포론(Trichosporon), 로도토룰라(Rhodotorula), 에로위아(Yarrowia), 로도스포리디움(Rhodosporidium), 파피아(Phaffia), 쉬바니오미세스(Schwanniomyces), 아스퍼길루스(Aspergillus) 및 아쉬바야(Ashbya). 특정 구체예에서, 상기 효모 세포는 사카로미세스 세레비시에(Saccharomyces cerevisiae), 사카로미세스 보우라르디(Saccharomyces boulardii), 지고사카로미세스 바이리(Zygosaccharomyces bailii), 클루베로미세스 락티스(Kluyveromyces lactis), 로도스포리디움 토루로이데스(Rhodosporidium toruloides), 에로위아 리포리티카(Yarrowia lipolytica), 쉬조사카로미세스 폼베(Schizosaccharomyces pombe), 피키아 파스토리스(Pichia pastoris), 한세누라 아노마라(Hansenula anomala), 칸디다 스페리카(Candida sphaerica), 또는 쉬조사카로미세스 마리데보란(Schizosaccharomyces malidevorans)으로 구성된 군에서 선택된다. 사카로미세스 세레비시에(Saccharomyces cerevisiae) 가 선호되는 효모종이다.
한 구체예에서, 상기 효모 세포는 사카로미세스 세레비시에(Saccharomyces cerevisiae) 세포이며, 폴리아민 산화효소는 FMS1이다. 그런 이유로, 한 구체예에서, S. 세레비시에 세포에는 FMS1이 결여되거나, 또는 파괴된 FMS1을 포함한다.
본 발명의 또다른 측면은 적어도 하나의 폴리아민 유사체를 생산할 수 있는 효모 세포에 관계한다. 상기 효모 세포는 적어도 하나의 폴리아민 유사체를 생산할 수 있다. 상기 효모 세포는 4-쿠마레이트:CoA 리가제 인코딩 유전자 및 적어도 하나의 폴리아민 N-아실트랜스퍼라제 유전자를 포함한다.
전술한 효모 세포의 다양한 구체예들이 본 발명의 이러한 측면에 또한 적용될 수 있다.
본 발명의 추가 측면은 폴리아민 유사체를 생산하는 방법에 관계한다. 상기 방법은 본 발명에 따른 효모 세포를 이들 효모 세포에 의해 폴리아민 유사체 생산에 적합한 배양 조건 하에서 배양 배지에 배양하는 것을 포함한다. 상기 방법은 상기 배양 배지 및/또는 상기 효모 세포로부터 폴리아민 유사체를 수거하는 것을 또한 포함한다.
한 구체예에서, 상기 효모 세포의 배양은 방향족 유기산, 지방산 및 이의 조합으로 구성된 군에서 선택된 적어도 하나의 유기산을 포함하는 배양 배지에 이들 효모 세포를 배양하는 것을 포함한다. 그런 이유로, 이 구체예에서, 적어도 하나의 유기산의 카르복실기 포함하는 분자가 상기 배양 배지에 포함된다. 그런 이유로, 상기 효모 세포에는 상기 적어도 하나의 유기산이 공급된다.
특정 구체예에서, 상기 방법은 상기 적어도 하나의 유기산을 상기 배양 배지로 추가하는 것을 포함한다. 따라서, 상기 적어도 하나의 유기산을 상기 배양 배지에 추가시킴으로써, 이들 배양 배지에 있는 효모 세포가 상기 적어도 하나의 유기산을 이용할 수 있다. 이러한 특정 구체예에서, 단일 유기산이 상기 배양 배지에 추가되거나, 또는 상이한 다수의 유기산이 상기 배양 배지에 추가된다.
또다른 특정 구체예에서, 상기 효모 세포를 배양하는 것은 상기 배양 배지에서 미생물, 선호적으로는 상기 적어도 하나의 유기산을 생산하고, 이러한 적어도 하나의 유기산을 상기 배양 배지로 배출시킬 수 있는 바람직하게는 효모 세포와 공동-배양시키는 것을 포함한다.
이들 두 가지 기술된 특정 구체예들을 조합할 수 있는데, 즉, 적어도 하나의 유기산을 상기 배양 배지에 추가하고, 이때 본 발명의 효모 세포는 적어도 하나의 미생물, 적어도 하나의 유기산을 생산할 수 있는는 효모 세포와 바람직하게는 공동-배양된다. 상기 배양 배지에 추가되는 적어도 하나의 유기산은 상기 적어도 하나의 미생물에 의해 생산되는, 동일한 또는 상이한 적어도 하나의 유기산일 수 있다.
본 발명의 이러한 측면에서 상기 배양 배지는 임의의 배양 배지일 수 있고, 이 배양 배지에서 폴리아민 유사체를 생산하도록 상기 효모 세포가 배양될 수 있다. 상기 배양은 예를 들어, 뱃치, 피드-유가식 또는 관류식 배양 또는 발효, 생물반응기 발효 등의 형태일 수 있다.
실시예
실시예 1: 효모의 고유 대사를 체계적으로 재배선하여(rewiring) 스페르미딘 생성 개선
본 실시예 1에서, 중심 탄소 및 질소 대사, 메티오닌 회수 경로, 아데닌의 회수 경로, 폴리아민 수송 기전, 그리고 폴리아민 소비/분해 경로를 비롯하여, 효모 균주에서 대사를 체계적으로 재설계하였다(refactored). 또한, 추가적인 잠재적 양성 유전자 표적을 또한 도입시켰다. 이 효모 균주는 새로운 모듈식 유전자 디자인으로 구축되었다. 특히, 새로운 Spd 생합성 경로는 당 탄소 공급원에서 Spd로의 더 큰 탄소 흐름을 전환하기 위해, 수많은 생합성 효소에 대한 코딩 서열을 포함하는 다중 유전 모듈로 분할된다.
8개 단백질의 과발현을 비롯한, L-오르니틴(Orn)의 축적을 증가시키도록 설계된 전구체 과잉생산 모듈(I): 카로미세스 세레비시에(Saccharomyces cerevisiae) 로부터 NADP(+)-의존적 글루타메이트 탈수소효소(GDH1) [서열 식별 번호:21], S. 세레비시에로부터 미토콘드리아 아스파르테이트 및 글루타메이트 담체 단백질(AGC1) [서열 식별 번호:22], S. 세레비시에로부터 미토콘드리아 L-오르니틴 담체 단백질 (ORT1) [서열 식별 번호:23], 대장균(Escherichia coli)으로부터 글루타메이트 N-아세틸전달효소 (EcargA) [서열 식별 번호:24], 대장균(E. coli)으로부터 아세틸글루타메이트 키나제(EcargB) [서열 식별 번호:25], 코리네박테리움 글루타미쿰(Corynebacterium glutamicum)으로부터 N-아세틸-감마-글루타민-포스페이트 환원효소(CgargC) [서열 식별 번호:26], C. 글루타미쿰(C. glutamicum)으로부터 아세틸오르니틴 아미노전달효소 (CgargD) [서열 식별 번호:27], 그리고 C. 글루타미쿰(C. glutamicum)으로부터 오르니틴 아세틸전달효소(CgargJ) [서열 식별 번호:28]. 더욱이, 이 모듈(I)에는 두 가지 단백질의 감쇠 또는 제거가 또한 내포되어 있었다: 효모 고유의 오르니틴 카르바모일전달효소 (ARG3) [서열 식별 번호:29]는 이의 고유 프로모터 PARG3를 더 약한 프로모터 PKEX2로 스와핑시키고, 그리고 CAR2의 녹아웃에 의해 L-오르니틴 트란스아미나제 (CAR2) [서열 식별 번호:30]의 활성을 제거함으로써, 이 효소를 감쇠시킨다.
L-오르니틴으로부터 Put를 과잉생산하도록 기획된 푸트레신 (Put) 모듈 (II)에는 두 가지 유전자 변형이 내포되었다; S. 세레비시에로부터 오르니틴 데카르복실라제(SPE1) [서열 식별 번호:31]의 과다발현 및 고유의 오르니틴 데카르복실라제 안티자임 (OAZ1) [서열 식별 번호:32]의 결손.
스페르미딘 생합성 모듈 (III)은 푸트레신으로부터 스페르미딘 (Spd)을 과잉생산하기 위해 기획되었으며, 이는 S. 세레비시에로부터 두 가지 단백질의 과잉생산을 특징으로 한다: 아데노실메티오닌 데카르복실라제 (AdoMetDC; SPE2) [서열 식별 번호:33] 및 스페르미딘 합성효소 (SpdSyn; SPE3) [서열 식별 번호:34]. 이 모듈에는 스페르미딘 소비 또는 분해를 회피하기 위해 두 가지 고유 단백질의 결손이 또한 내포되었다: 인코딩 스페르민 합성효소를 인코딩하는 SPE4 [서열 식별 번호:12] 및 비-특이적 폴리아민 산화효소를 인코딩하는 FMS1 [서열 식별 번호:35]의 결손.
S-아데노실-L-메티오닌 (AdoMet) 모듈 (IV)은 공-인자 AdoMet의 접근성을 높이도록 설계되었다. 이들 변형에는 다수 단백질의 과잉발현이 내포되었다: S. 세레비시에로부터 5'-메틸티오아데노신 포스포릴라제 (MEU1) [서열 식별 번호:36], S. 세레비시에로부터 분기-쇄 아미노산 아미노전달효소 (BAT2) [서열 식별 번호:37], S. 세레비시에로부터 아데닌 포스포리보실전달효소 (APT1) [서열 식별 번호:38], 리보스-포스페이트 피로포스포키나제 (PRS5) [서열 식별 번호:39], 그리고 레이쉬마니아 안판툼(Leishmania infantum)로부터 S-아데노실메티오닌 합성효소(LiMAT) [서열 식별 번호:40]. 이 모듈에는 아데닌 탈아미노효소 활성 (AAH1) [서열 식별 번호:41]의 결손이 또한 내포되었다.
폴리아민 유출 모듈 (V)은 세포에 대한 세포 독성을 완화하거나, 또하는 폴리아민 생합성을 억제하도록 설계되었다. 이 모듈에는 TPO5에 의해 인코드된 효모 고유의 폴리아민 수송자의 과다발현이 내포되었다 [서열 식별 번호:42].
마지막으로 중요한 것은, 여분의 스페르미딘 생합성 모듈(VI)이 퓨트레신 및 AdoMet에서 스페르미딘의 과잉 생산을 위해 설계되었다는 것이다. 이 모듈에는 SPE2-SPE3[서열 식별 번호:43]에 의해 인코딩된 AdoMetDC-SpdSyn 융합 단백질의 과발현이 내포되었다.
이 실시예 1에서 유전자의 과다발현은 우리가 CRISPR/cas9 시스템 또는 전통적인 유전자 제작자 기반 방법을 통해 통합 유전자좌로서 성장 결함 및 활성 발현이 예상되지 않는 영역으로의 염색체 통합에 의해 얻어졌다. CRISPR/cas9 기반 게놈 편집의 구현은 Mans et al. 2015에 의해 개발된 프로토콜을 따랐다. 특히, Cas9의 구성적 발현을 가능하게 하는, HIS3 마커를 갖는 플라스미드 pL-CAS9-HIS를 품고 있는 S. 세레비시에 균주 CEN.PK113-11C는 모든 유전적 조작을 위한 출발 균주다. 선택된 유전자좌에서 효율적인 게놈 편집을 가능하게 하기 위해, 다중 가이드 RNA(gRNA) 플라스미드가 구축되었다. 유전자 부분, 즉, 프로모터, 터미네이터, ORF 및 상동성 아암(arms)의 다양한 조합이 내포된 유전자 모듈은 중복 확장 PCR(OE-PCR) 절차에 따라, 통합 카세트로 구축되었다. 이 실시예 1에서 사용된 다음 유전자 및 프로모터 조합: TPI1p-ORT1-pYX212t; tHXT7p-AGC1-CYC1t; TEF1p-GDH1-DIT1t ; PGK1p-SPE3-pYX212t; TEF1p-SPE1-PRM9t; TDH3p-SPE2-DIT1t; TDH3p-CgargJ-TDH2t; PGK1p--EcargB-ADH1t; TEF1p-CgargC-FBA1t; tHXT7p-CgargD-TPI1t; TPI1p-EcargA-CYC1t; TPI1p-MEU1p-FBA1t; PGK1p-BAT2-CYC1t; TDH3p-APT1-DIT1t; TEF1p-PRS5-PRM9t; TEF1p-LiMAT-PRM9; TDH3p-TPO5-CYC1t; TEF1p-SPE2-SPE3-PRM9t.
모든 고유 유전자 부분, 즉 고유 프로모터, 터미네이터, ORF 및 상동성 아암은 CEN.PK113-11C 게놈 DNA를 주형으로 사용하여 PCR 증폭되었다. 최적화된 이종성 유전자의 경우, PCR 증폭을 위해 합성 단편 또는 플라스미드(GenScript에서 제공)가 사용되었다. 높은-충실성 Phusion DNA 중합효소가 전체 분자 클로닝 절차에 걸쳐 사용되었다. 카세트 또는 플라스미드는 표준 LiAc/SS DNA/PEG 형질전환 방법에 의해 효모에 도입되었다. URA3-기반 플라스미드 또는 카세트를 함유하는 균주는 우라실 배지없이 합성 완전 배지에서 선별되었는데, 이 배지는 6.7 g/l의 효모 질소 베이스 (YNB)(아미노산 없음), 0.77 g/l의 완전 보충 혼합물(우라실 없음) (CSM-URA), 20 g/l의 포도당, 및 20 g/l의 한천으로 구성되었다. URA3 마커를 제거하였고, 5-플루오로오로트산(5'-FOA) 플레이트에서 선택되었다. 더욱이, CRISPR/cas9 기반 시스템은 또한 AAH1, SPE4 및 FMS1의 삭제 실행에 사용되었다. 다른 유전자 녹아웃 실험은 전통적인 방법으로 진행하였다. 여기에 사용된 모든 프라이머는 표 1에 나열되어 있고, 모든 플라스미드는 표 2에 나열되어 있으며, 그리고 모든 균주는 표 3에 나열되어 있다.
표 1 - 프라이머
표 2 - 플라스미드
표 3 - 균주
생성된 균주 JQSPD_AA 평가에 사용되는 고-성능 액체 크로마토그래피(HPLC)와 딥-웰 규모 발효를 결합한 분석. 특히, Verduyn et al 1992에 의해 개발된 최소 배지에서 수행된 폴리아민 생산을 위한 생성된 JQSPD_AA 균주의 24개 딥-웰 뱃치 발효. 배양물은 24개의 딥-웰 플레이트에 2ml 최소 배지를 사용하여, 0.2의 초기 OD600에서 24시간 전-배양물로부터 접종하고, 300rpm, 30℃에서 120시간 동안 배양했다. 40 mg/l 우라실, 40 mg/l 히스티딘(필요한 경우)이 보충된, 7.5 g/l (NH4)2SO4, 14.4 g/l KH2PO4, 0.5 g/l MgSO4??7H2O, 20 g/l 포도당, 2 ml/l 미량 금속 및 1 ml/l 비타민 용액을 함유하는 최소 배지, pH는 4.5로 조정되었다. 샘플은 0.1ml의 액체 배양액을 취하여 준비하였고, 고온 수(HW) 추출을 하였다. 이 방법에서, 우리는 추출 관련하여 딥-웰 플레이트의 발효에서 최소 배지를 사용했다. 0.9 ml의 발효 배지가 들어 있는 튜브를 100℃의 수조에서 10분 동안 예열했다. 그런 다음, 뜨거운 발효 배지를 0.1 ml의 액체 배양물에 빠르게 부었고; 혼합물을 즉시 볼텍싱하고, 샘플을 수조에 넣었다. 30분 후, 각 튜브를 5분 동안 얼음 위에 놓았다. 원심분리 후, 상층액을 유도체화에 직접 사용하였다. 유도체화를 위해 0.125ml의 포화 NaHCO3용액과 0.25ml의 단실 클로라이드 용액(아세톤 중 5mg/ml)을 0.25ml의 샘플에 첨가했다. 그 다음, 반응 혼합물을 때때로 흔들어 주면서, 암실에서 1시간 동안 40℃에서 항온처리하였다. 메탄올 0.275ml를 첨가하여 반응을 정지시켰다. 샘플을 HPLC 검출에 사용되는 25mm 주사기 필터(0.45μm 나일론)를 통해 여과시켰다. 다음 크로마토그래피 조건이 사용되었다: C18(100 mm × 4.6 mm i.d., 2.6 μm, Phenomenex Kinetex), 여기 파장 340 nm, 방출 파장 515 nm, 샘플 주입 1.5 μl, 컬럼 온도 40℃, 검출기 감도 7, 4.0 분에 수집 시작. 이동상은 1 ml/min의 속도에서 물과 메탄올이었다. 용출 프로그램은 다음과 같았다: 0-5 분, 50% ~ 65% 메탄올, 5-7.5 분, 65% ~o 75% 메탄올, 7.5-9.5 분, 75% ~ 87.5% 메탄올, 9.5-10.5 분 87.5% ~ 100% 메탄올, 10.5-11.5 분, 100% 메탄올, 11.5-13.5 분, 100% ~ 50% 메탄올, 13.5-16 분, 50% 메탄올.
균주 JQSPD_AA는 > 400 mg/l 농도에서 Spd 역가를 생산하였고, 본원에서 사용된 바와 같이, 일부 변형만을 갖는 균주와 비교하였을 때, 유의적으로 Spd 역가가 증가되었다 (WO 2016/144247 및 WO 2019/013696에서 실시예 참고).
실시예 2: 효모에서 더 많은 폴리아민 생산
생명체는 폴리아민의 구조적 변이체를 합성하기 위해 다양한 경로를 진화시켰다. 실제로, Put 및 Spd는 일반적으로 대부분의 세포에서 일반적인 폴리아민으로 발견되지만, 흔치 않은 폴리아민, 이를 테면, sym-호모스페르미딘 (Hspd), 테르모스페르민 (Tspm), 스페르민 (Spm), 분기-쇄 폴리아민, 그리고 긴-쇄 폴리아민 (LCPAs) 또한 자연계에서 확인되었다. 이 실시예 2에서는 유전자 모듈 (VII)를 기획하고, 이를 Spd 플랫폼 균주 JQSPD_AA (실시예 1)로 도입시킴으로써, sym-호모스페르미딘 (Hspd), 테르모스페르민 (Tspm) 및 스페르민 (Spm)을 조사하였다.
우리는 먼저 식물과 박테리아 모두에 존재하는 트리아민 Hspd를 이종성적으로 합성하기 시작했다. 식물에서, Hspd는 피롤리지딘 알칼로이드 생합성의 첫 경로 특이적 중간생성물이며, 이는 호모스페르미딘 합성효소 (식물 HSS; EC 2.5.1.45)에 의해 형성된다. 이 효소는 박테리아 호모스페미딘 합성효소(박테리아 HSS; EC 2.5.1.44)보다 더 특이적인데, 그 이유는 Put을 아미노부틸기의 공여체로 사용할 수 없기 때문이다. Hspd 미생물 생산을 위한 식물 및 박테리아 HSS의 가능성을 탐구하기 위해, 유전자 하위-모듈 (VII-a) 및 (VII-b)은 차례로 효모에서 세네시오 바르날리스(Senecio vernalis) SvHSS 및 블라스토클로리스 비리디스(Blastochloris viridis) BvHSS13의 발현을 인코드하는 Hspd 생합성에 대해 기획되었다. 이들 하위-모듈은 GenScipt에서 주문하고, 효모 코돈-최적화된 SvHSS 유전자 [서열 식별 번호:18] 및 BvHSS 유전자 [서열 식별 번호:20]를 품고있는 플라스미드 SvHSS_p426GPD 및 BvHSS_p426GPD의 다수-복사체로써 Spd 플랫폼 균주 JQSPD_AA로 도입시켰다. 형질전환 실험은 실시예 1과 동일한 절차를 따랐다. 생성된 균주 JQSPD_AA (SvHSS_p426GPD) 및 JQSPD_AA (BvHSS_p426GPD)는 실시예 1에서 기술된 것과 동일한 절차에 의해 Hspd 생산에 대해 검사되었다.
우리는 두 HSS의 과다-발현이 Hspd의 생합성을 가능하게 한다는 것을 발견했다. 특히, SvHSS는 40.9 mg/에서 Hspd 역가를 가능하게 하였으며 반면, BvHSS는 31.1 mg에서 Hspd 역가를 가능하게 하였다(도 1a 및 1d 참고).
후속적으로, 하위-모듈 (VII-c), 하위-모듈 (VII-d) 및 하위-모듈 (VII-e)을 도입시킴으로써, 테트라-아민 Spm 및 Tspm의 생산에 대해 Spd 플랫폼 (실시예 1)을 또한 조사하였다. Spm은 후생동물(metazoa) 전체, 꽃 피는 식물 및 효모에서 발견되는 가장 흔한 테트라아민이다. 특이적 아미노프로필트랜스퍼라제, 즉, 스레트민 합성효소(SpmSyn; EC 2.5.1.22)는 Spm 생합성을 담당한다. 우리는 먼저 Spm 과잉-생산을 위해, 효모 고유의 SpmSyn Spe4p를 탐색했다.
JQSPD_AA에서 다수-카피 플라스미드 SPE4_p426GPD(하위-모듈(VII-c))로서 코돈-최적화된 효모 SPE4[서열 식별 번호: 12]를 과발현할 때, 53.1mg/l의 Spm이 수득되었다(도 1c 및 1f 참조). JQSPD_AA 균주에서 다수-카피 플라스미드 AtSPMS_p426GPD (하위-모듈 (VII-d))로써 AtSPMS [서열 식별 번호:14]의 과다-발현에 의해 아라비도프시스 탈리아나(Arabidopsis thaliana)로부터 SpmSyn를 또한 테스트하였다. 이로써 Spm이 생산되었다(41.8 mg/l; 도 1c 및 1f 참고). A. 탈리아나로부터 식물 ACL5 아미노프로필전달효소 (TspmSyn; EC 2.5.1.79)는 Spm 이성질체 Tspm를 합성하는 것으로 나타났다. 이로써, JQSPD_AA 균주에서 다수-카피 플라스미드 AtACL5_p426GPD (하위-모듈 (VII-e))로써 AtACL5 [서열 식별 번호:16]를 또한 과다-발현시켰다. 이 전략으로 43.8 mg/l의 Tspm 생산이 가능해졌다 (도 1b 및 1e 참고). 효모 코돈-최적화 유전자를 품고 있는 모든 플라스미드는 GenScript에서 구입했다. 실시예 1에서 사용된 것과 동일한 형질전환 및 생성물 분석이 이 실시예 2에서 사용되었다. 모든 플라스미드는 표 2에 나열되어 있고, 모든 균주는 표 3에 나열되어 있다.
도 5a는 효모에서 스페르미딘과 고차 폴리아민의 생합성을 위한 공작된 경로를 보여준다.
실시예 3: 효모에서 쿠코아민의 생합성
다음으로, 폴리메틸렌폴리아민 골격으로 구성된 식물의 일련의 폴리아민 유사체인 쿠코아민 가령, Put, Spd, 그리고 Spm, 그리고 적어도 하나의 디히드로카페인산 단편의 합성을 제시한다. 쿠코아민은 항-고혈합, 항-트리파노좀(antitrypanosome), 항-폐혈증 및 신경 보호와 같은 이들의 다양한 생물 활성으로 인하여, 최근의 기능성 식품 및 약물 후보로서 주목을 받았다. 쿠코아민은 처음으로 Cortex Lycii에서 발견되었으며, 나중에 솔라나세에(Solanaceae) 패밀리, 이를 테면, 토마토, 감자 및 담배 식물에서 발견되었다. 디히드로카페오일과 아민 부분의 커플링은 개입 단계이며, 쿠코아민 생합성에 대한 실제 진입점으로 간주될 수 있다. 그러나, 이들 식물에서 이 반응을 중재하는 효소들에 대해서 지금까지 잘 설명되지 못하고 있다. 또한, BAHD 아실트랜스퍼라제 수퍼패밀리에 속하는 N-히드로시나모일 전달효소의 패널은 아민 (-NH2) 기를 코엔자임 A-활성화된 하이드록시신남산으로 아실화시킴으로써 폴리아민의 N-아실화를 촉매하는 것이 입증되었고, 식물 공급원에 따라 아실 수용체 및 아실 공여체에 대한 이들의 특이성/무차별성(promiscuity)은 가변적이다.
이 실시예 3은 다수의 N-히드로시나모일 전달효소를 발현시키는 3 개의 유전자 하위-모듈을 설계하고, 이를 실시예 1의 Spd 플랫폼 균주 JQSPD_AA로 도입함으로써 쿠코아민의 생합성을 조사하였다. N-히드로시나모일 전달효소는 오로지 코엔자임 A-활성화된 하이드록시신남산만을 수용하기 때문에, 우리는 이들 모듈에서 혼합(promiscuous) 4-쿠마레이트:CoA 리가제 (EC 6.2.1.12)를 공동-발현시켰다. 하위-모듈 (VIII-b)은 두 가지 단백질의 공동-발현을 인코드하였다; 아라비도프시스 탈리아나(Arabidopsis thaliana) 혼합 4-쿠마레이트:CoA 리가제 1 (At4CL1) [서열 식별 번호:2], 이것은 아라비도프시스 탈리아나(Arabidopsis thaliana) 4CL 패밀리의 다른 구성부와 비교하였을 때, 카페인산을 이의 CoA 에스테르로의 전환을 가장 효과적으로 하였고; 그리고 A. 탈리아나(A. thaliana)의 스페르미딘 디쿠마로일 전달효소 (AtSCT; EC 2.3.1.249) [서열 식별 번호:8]. 이 모듈은 GenScript에 주문하고, 효모 코돈-최적화된 At4CL1 및 AtSCT에 대한 발현 카세트를 품고 있는, 많은-카피의 플라스미드 pLAt4CL-AtACT로 구축되었다. 모든 플라스미드는 표 2에 나열되어 있고, 모든 균주는 표 3에 나열되어 있다.
하위-모듈 (VIII-c)은 두 개 단백질의 공동-발현을 인코드하였다; 아라비도프시스 탈리아나(Arabidopsis thaliana) 혼합 4-쿠마레이트:CoA 리가제 1 (At4CL1) 및 . 탈리아나(A. thaliana)의 스페르미딘 히드록시시나모일 전달효소 (AtSHT; EC 2.3.1.M34) [서열 식별 번호:4]. 이 모듈은 GenScript에 주문하고, 효모 코돈-최적화된 At4CL1 및 AtSHT에 대한 발현 카세트를 품고 있는, 많은-카피의 플라스미드 플라스미드 pLAt4CL1-AtSHT로 구축되었다.
하위-모듈 (VIII-d)은 두 개 단백질의 공동-발현을 인코드하였다; 아라비도프시스 탈리아나(Arabidopsis thaliana) 혼합 4-쿠마레이트:CoA 리가제 1 (At4CL1) 및 . 담배 니코티아나 아테누아타(Nicotiana attenuata)의 스페르미딘 히드록시시나모일 전달효소 (NaDH29; EC 2.3.1.M34) [서열 식별 번호:6]. 이 모듈은 GenScript에 주문하고, 효모 코돈-최적화된 At4CL1 및 NaDH29에 대한 발현 카세트를 품고 있는, 많은-카피의 플라스미드 플라스미드 pLAt4CL1-NaDH29로 구축되었다.
끝으로, 그러나 적어도는 아니지만, 하위-모듈 (VIII-e)은 두 개 단백질의 공동-발현을 인코드하였다??아라비돕시드(Arabidopsis) 혼합 4-쿠마레이트:CoA 리가제 1 (At4CL1) 및 N. 아테누아타(N. attenuata) 푸트레신 히드록시시나모일 전달효소 (NaAT1; EC 2.3.1.138) [서열 식별 번호:10]. 이 모듈은 GenScript에 주문하고, 효모 코돈-최적화된 At4CL1 및 NaAT1에 대한 발현 카세트를 품고 있는, 많은-카피의 플라스미드 플라스미드 pLAt4CL1-NaAT1로 구축되었다.
이들 플라스미드는 실시예 2에서 기술된 것과 동일한 절차로 Spd 플랫폼 균주 JQSPD_AA로 형질도입되어, 차례로 균주 JQSPD_AA (pLAt4CL-AtSCT), JQSPD_AA (pLAt4CL1-AtAHT), JQSPD_AA (pLAt4CL1- NaDH29) 및 JQSPD_AA (pLAt4CL1-NaAT1)이 되었다. 이들 균주는 120시간 동안 2 mM 디히드로카페인산 (3,4-디히드록시히드로신남산)을 공급하여 검정되었고, 생산 배지는 다음의 절차에 따라 폴리아민 유사체 생산에 대해 분석되었다. 폴리아민 유사체의 검출은 Orbitrap Fusion Mass Spectrometer (Thermo Fisher Scientific, San Jose, CA)에 연결된 Dionex UltiMate 3000 UHPLC (Fisher Scientific, San Jose, CA) 상에서 액체-크로마토그래피-질량분광분석에 의해 실행되었다. 이 시스템은 Agilent Zorbax Eclipse Plus C18 2.1 x 100 mm, 1.8 μm 컬럼(35℃로 유지)을 이용하였다. 유속은 0.350 mL/min이었으며, 0.1% 포름산 (A) 및 0.1% 포름산/아세토니트릴 (B)가 이동상으로 이용되었다. 구배는 1분 동안 5% B로 시작하여, 그 다음 5분까지 95% B로 선형 구배되었다. 이 용매 조성물을 1.5 분 동안 유지시킨 후, 5% B로 변경하고 8 분까지 유지되었다. 이 샘플 (5 μL)은 양-이온 또는 양-이온 모드에서 전기 분사 이온화원 (HESI)을 갖춘 MS로 통과되었으며, 차단 가스는 50 (a.u.)로 설정되며, aux 가스는 10(a.u.)로 설정되며, 스위프 가스는 1(a.u.)로 설정된다. 콘(cone) 및 프로브 온도는 각각 325 ℃ 및 380 ℃이었고, 분무 전압은 3500V였다. 스캔 범위는 80 ~ 500 da 였고, 스캔 간의 시간은 50ms이었다.
이러한 노력으로 쿠코민 생합성을 이끌어 냈음이 기쁘다. 특히, NaDH29 균주에서 유의적인 단일 LC-MS 피크(m/z 값이 310.2128 [M + H]+ 에 상응)가 탐지되었고(도 2a 참고), 이것으로 NaDH29는 N 1 - 또는 N 10 -디히드로카페오일 스페르미딘을 생합성할 수 있음을 나타내며, At4CL1는 기질로써 디히드로카페인산을 수용할 수 있음을 또한 나타낸다. 우리는 또한 ATSCT 과다발현 균주에서 m / z 값이310.2128 [M + H]+에 상응하는 단일 LC-MS 피크를 또한 볼 수 있다. 더욱이, 균주 JQSPD_AA (pLAt4CL1-NaAT1)에 디히드로카페인산을 공급할 때, 유의적인 단일 LC-MS 피크(m/z 값은 417.2010 [M + H]+ 에 상응함)가 탐지되었고 (도 2b 참고), 이로써 NaAT1은 N 1 ,N 6 - 비스(디히드로카페오일)푸트레신의 생합성을 할 수 있음을 나타낸다.
실시예 4: 효모에서 복합 페놀아미드의 생합성
폴리아민 플랫폼에서 쿠코아민의 생합성의 성공적인 시범은 우리에게 더 다양하고 복잡한 페놀아미드의 생합성에 대해 이 플랫폼을 이용할 수 있는 지에 대해 더 조사할 수 있는 확신을 제공하였고, 페놀 모이어티에 폴리아민으로 콘쥬게이트시켜 생성된 질소-함유 2 차 대사물의 정량적으로 주요 군으로 구성된다. 따라서, 본 실시예 4에서, 특이적 폴리아민 N-히드로시나모일 전달효소를 과다-발현시킴으로써 복합 페놀아미드의 생산이 가능하였다. 실시예 3에서 실증된 동일한 전략에 따라, 우리는 이들 균주, 즉, JQSPD_AA (pLAt4CL-AtACT), JQSPD_AA (pLAt4CL1-AtAHT), JQSPD_AA (pLAt4CL1- NaDH29) 및 JQSPD_AA (pLAt4CL1-NaAT1)에게 2 mM p-쿠마르산, 2 mM 카페인산 또는 2 mM 페룰산을 120 시간 공급하였고, 폴리아민 유사체 생산에 대해 배지를 분석하였다. 발효, 샘플 준비 또는 LC-MS 검증 절차는 실시 예 3과 동일하였다. 또한, AtSCT, AtSHT 또는 NaDH29와 함께 At4CL1를 공동-발현시키는 JQSPD_AA 균주에h 하이드록시신남산, 가령, p-쿠마르산, 카페인산 또는 페룰산을 공급함으로써, 페놀아미드가 생합성되었다. 특히, p-쿠마르산을 공급할 때, AtSHT 균주에서 유의적인 단일 LC-MS 피크(m/z 값은 584.2748 [M + H]+에 상응함)가 탐지되었고 (도 3a 참고), 이것은 AtSHT는 N 1 ,N 5 ,N 10 -트리(쿠마로일) 스페르미딘을 생합성할 수 있음을 나타낸다. 유사하게, 카페인산이 공급될 때, AtSHT 균주에서 유의적인 단일 LC-MS 피크(m/z 값은 632.2599 [M + H]+에 상응함)가 탐지되었고 (도 3b 참고), 이것은 N 1 ,N 5 ,N 10 -트리(카페오일) 스페르미딘을 생합성할 수 있음을 나타낸다. 더욱이, p-쿠마르산이 공급될 때, AtSCT 균주에서 유의적인 단일 LC-MS 피크(m/z 값은 438.2383 [M + H]+에 상응함)가 탐지되었고(도 3c 참고), 이것은 AtSCT가 N 1 ,N 10 -비스(쿠마로일) 스페르미딘을 생합성할 수 있음을 나타낸다. 유사하게, 카페인산이 공급될 때, AtSCT 균주에서 유의적인 단일 LC-MS 피크(m/z 값은 470.2282 [M + H]+에 상응함)가 탐지되었고(도 3d 참고), 이것은 AtSCT가 N 1 ,N 10 -비스(카페오일) 스페르미딘을 생합성할 수 있음을 나타낸다. 또한, 페룰산이 공급될 때, AtSCT 균주에서 유의적인 단일 LC-MS 피크(m/z 값은 498.2599 [M + H]+에 상응함)가 탐지되었고(도 3e 참고), 이것은 AtSCT가 N 1 ,N 10 -비스(페룰로일) 스페르미딘을 생합성할 수 있음을 나타낸다. 부응하게, NaDH29 균주에 p-쿠마르산, 카페인산 또는 페룰산이 공급되면, 차례로 N 1 - 또는 N 10 -쿠마로일 스페르미딘, N 1 - 또는 N 10 -카페오일 스페르미딘, N 1 - 또는 N 10 -페룰로일 스페르미딘을 성공적으로 생합성할 수 있다. 그런 이유로, 다양한 영역선택성을 갖는 상이한 N-히드로시나모일 전달효소의 선택함으로써, 우리는 단일-, 이중-, 그리고 삼중-치환된 스페르미딘 페놀아미드의 영역선택성 생합성을 얻었다. 유사하게, NaAT1 균주에 p-쿠마르산, 카페인산 또는 페룰산을 공급하면, 차례로 N 1 -쿠마로일 푸트레신, N 1 ,N 6 -비스(카페오일) 푸트레신, N 1 -카페오일 푸트레신, 그리고 N 1 -페룰로일 푸트레신을 성공적으로 생합성할 수 있다 (도 3f 참고). 모든 플라스미드는 표 2에 나열되어 있고, 모든 균주는 표 3에 나열되어 있다.
실시예 5: 효모 공동-배양물에서 복합 페놀아미드의 생합성
실시예 4에서, 우리는 우리의 폴리아민 플랫폼 균주에 다수의 방향족 유기산, 예를 들어, p-쿠마르산, 카페인산 또는 페룰산을 공급하면 다양한 폴리아민-유도된 페놀아미드를 생합성할 수 있음을 입증하였다. 그러나, 이들 역가 실험에 이용된 방향족 유기산은 어느 수준까지 획득하는데 일반적으로 고비용이 들고, 이는 페놀아미드의 생산을 위한 이러한 역가-기반 공적의 경제적 이용가능성을 희생시킨다. 대조적으로, 임의의 방향족 유기산의 공급없이, 이들 페놀아미드의 새로운 생산은 경제적으로 가능한 생체공정이 될 수 있을 것으로 믿는다. 실제로, 효모를 비롯한 미생물의 대사 공학 및 합성 생물학의 최근의 진보는 이들 방향족 유기산, 예를 들어, p-쿠마르산의 생산을 위한 많은 플랫폼 균주를 만들었다. 우리의 폴리아민 플랫폼으로 폴리아민-유래된 페놀아미드의 새로운 생산 개념을 입증하기 위해, 우리는 우리의 시스템에 p-쿠마르산 과잉-생산하는 효모 균주의 여분의 유전자 모듈 하위-모듈 (VIII-f)을 도입하였다. 폴리아민 생산하는 균주 및 p-쿠마르산 과잉-생산하는 균주를 포함하는 합성 컨소시움을 기획함으로써 이를 증명하였다. 특히, At4CL1, 그리고 AtSHT, AtSCT, NaDH29 및 NaAT1중 하나를 공동-발현시키는 JQSPD_AA 균주와 p-쿠마르산 과잉-생산하는 균주 QL58 (Liu et al., 2019)를 공동-배양하였고, 이로써 일련의 폴리아민-p-쿠마르산 콘쥬게이트, 즉, N 1 ,N 5 ,N 10 -트리(쿠마로일) 스페르미딘, N 1 ,N 10 -비스(쿠마로일) 스페르미딘, N 1 - 또는 N 10 -쿠마로일 스페르미딘 및 N 1 -쿠마로일 푸트레신이 새롭게 생합성되었다(도 4a ~ 4c 참고). 본원에서 이용된 하위-모듈 (VIII-f)은 또한, 또는 대안으로 p-쿠마르산 과잉-생산하는 균주에 있는 모든 양성 유전자 표적을 우리의 폴리아민 플랫폼 균주, 예를 들어 JQSPD_AA 및 이의 유도균주로 도입시킴으로써 도입될 수 있음이 또한 강조된다.
도 5b는 효모에서 복합 페놀아미드의 생합성을 위한 공작된 경로를 설명한다.
실시예 6: 효모 공동-배양물에서 할로겐화된 페놀아미드의 생합성
실시예 5에서, 우리는 자연적으로 존재하는 폴리아민-유래된 페놀아미드의 유일한 탄소원으로써 단순 당을 사용한 새로운 생산은 폴리아민 생산하는 균주 및 p-쿠마르산 과잉-생산하는 균주를 포함하는 합성 컨소시움을 기획함으로써 얻어질 수 있음을 입증하였다. 그러나, 이들의 천연 대응부에 추가하여, 비-천연 폴리아민-하이드록시신남산 콘쥬게이트에 대해 이들의 잠재적으로 개선된 의학적 속성을 활발하게 연구되고 있음을 또한 주목하였다 (Mounce et al., 2017; Antoniou et al., 2016). 이러한 연구에서 관심대상의 주요 약전 중 하나는 할로겐화된 유도체, 이를 테면, 플루오린 치환체인데, 그 이유는 유기불소는 선두(lead) 화합물의 흡수, 분포, 대사, 배설 및 독성(ADMET) 속성에 영향을 미치는 것으로 알려져 있기 때문이다( et al., 2007). 4CLs-NATs 시스템, 즉, 4-쿠마레이트:CoA 리가제 + N-아실트랜스퍼라제가 하이드록시신남산을 향한 관찰된 복잡성은 플루오린-치환된 전구체로 해석될 수 있다는 가설을 세우고, 이러한 플루오린-치환된 폴리아민-하이드록시신남산 콘쥬게이트 부류의 생산을 위한 생합성 접근법을 확립하였다. 플루오린-치환된 하이드록시신남산에 접근하기 위해, 방향족 화합물을 과잉-생산하는 균주 (QL58)를 이용하였고(Liu et al., 2019), 그리고 이 균주에 플루오린-치환된 방향족 아미노산 (3-플루오르-L-페닐알라닌)을 공급하였다. 이를 위해, 3-플루오르-신남산 ([M - H] - = 165.0358), 3-플루오르-p-쿠마르산 ([M - H] - = 181.0305) 및, 플루오린 치환된 그리고 수소화된 p-쿠마르산 ([M - H] - = 183.0463)의 예측된 m/z 값에 상응하는 피트를 검출하였고 (도 6a ~ 6c 참고), 이것은 방향족 아미노산으로부터 방향족의 생합성을 위해 그런 이유로 모집된 이종성 경로가 복잡함을 암시한다. 실시예 5의 폴리아민 과잉-생산하는 균주 (At4CL1, 그리고 AtSHT, AtSCT, NaDH29 및 NaAT1중 하나를 과다-발현시키는JQSPD_AA 균주) 및 방향족 과잉-생산하는 균주 QL58을 모두를 포함하는, 공동-배양 시스템에 3-플루오르-L-페닐알라닌을 후속 보충시키면, 단일-, 그리고 이중-비천연 플루오린 치환된 푸트레신-하이드록시신남산 콘쥬게이트의 어레이 (도 7a ~ 7d), 뿐만 아니라 단일-, 이중-, 그리고 삼중-치환된 비천연 플루오린 치환된 스페르미딘-하이드록시신남산 콘쥬게이트가 수득되었다 (도 8a ~ 8e).
위에서 설명된 실시 예들은 본 발명의 몇 가지 예시적인 예로서 이해되어야 한다. 당업자라면 본 발명의 범위를 벗어나지 않고, 구체예에 다양한 수정, 조합 및 변경이 이루어질 수 있음을 이해할 것이다. 특히, 상이한 구체예에서의 상이한 부분 용액은 기술적으로 가능한 다른 구성으로 결합될 수 있다. 그러나, 본 발명의 범위는 첨부된 청구 범위에 의해 특정된다.
참고자료
SEQUENCE LISTING
<110> Chrysea Limited
<120> POLYAMINE ANALOG PRODUCING YEASTS
<130> HSJ102868P.SEA
<160> 266
<170> PatentIn version 3.5
<210> 1
<211> 561
<212> PRT
<213> Arabidopsis thaliana
<400> 1
Met Ala Pro Gln Glu Gln Ala Val Ser Gln Val Met Glu Lys Gln Ser
1 5 10 15
Asn Asn Asn Asn Ser Asp Val Ile Phe Arg Ser Lys Leu Pro Asp Ile
20 25 30
Tyr Ile Pro Asn His Leu Ser Leu His Asp Tyr Ile Phe Gln Asn Ile
35 40 45
Ser Glu Phe Ala Thr Lys Pro Cys Leu Ile Asn Gly Pro Thr Gly His
50 55 60
Val Tyr Thr Tyr Ser Asp Val His Val Ile Ser Arg Gln Ile Ala Ala
65 70 75 80
Asn Phe His Lys Leu Gly Val Asn Gln Asn Asp Val Val Met Leu Leu
85 90 95
Leu Pro Asn Cys Pro Glu Phe Val Leu Ser Phe Leu Ala Ala Ser Phe
100 105 110
Arg Gly Ala Thr Ala Thr Ala Ala Asn Pro Phe Phe Thr Pro Ala Glu
115 120 125
Ile Ala Lys Gln Ala Lys Ala Ser Asn Thr Lys Leu Ile Ile Thr Glu
130 135 140
Ala Arg Tyr Val Asp Lys Ile Lys Pro Leu Gln Asn Asp Asp Gly Val
145 150 155 160
Val Ile Val Cys Ile Asp Asp Asn Glu Ser Val Pro Ile Pro Glu Gly
165 170 175
Cys Leu Arg Phe Thr Glu Leu Thr Gln Ser Thr Thr Glu Ala Ser Glu
180 185 190
Val Ile Asp Ser Val Glu Ile Ser Pro Asp Asp Val Val Ala Leu Pro
195 200 205
Tyr Ser Ser Gly Thr Thr Gly Leu Pro Lys Gly Val Met Leu Thr His
210 215 220
Lys Gly Leu Val Thr Ser Val Ala Gln Gln Val Asp Gly Glu Asn Pro
225 230 235 240
Asn Leu Tyr Phe His Ser Asp Asp Val Ile Leu Cys Val Leu Pro Met
245 250 255
Phe His Ile Tyr Ala Leu Asn Ser Ile Met Leu Cys Gly Leu Arg Val
260 265 270
Gly Ala Ala Ile Leu Ile Met Pro Lys Phe Glu Ile Asn Leu Leu Leu
275 280 285
Glu Leu Ile Gln Arg Cys Lys Val Thr Val Ala Pro Met Val Pro Pro
290 295 300
Ile Val Leu Ala Ile Ala Lys Ser Ser Glu Thr Glu Lys Tyr Asp Leu
305 310 315 320
Ser Ser Ile Arg Val Val Lys Ser Gly Ala Ala Pro Leu Gly Lys Glu
325 330 335
Leu Glu Asp Ala Val Asn Ala Lys Phe Pro Asn Ala Lys Leu Gly Gln
340 345 350
Gly Tyr Gly Met Thr Glu Ala Gly Pro Val Leu Ala Met Ser Leu Gly
355 360 365
Phe Ala Lys Glu Pro Phe Pro Val Lys Ser Gly Ala Cys Gly Thr Val
370 375 380
Val Arg Asn Ala Glu Met Lys Ile Val Asp Pro Asp Thr Gly Asp Ser
385 390 395 400
Leu Ser Arg Asn Gln Pro Gly Glu Ile Cys Ile Arg Gly His Gln Ile
405 410 415
Met Lys Gly Tyr Leu Asn Asn Pro Ala Ala Thr Ala Glu Thr Ile Asp
420 425 430
Lys Asp Gly Trp Leu His Thr Gly Asp Ile Gly Leu Ile Asp Asp Asp
435 440 445
Asp Glu Leu Phe Ile Val Asp Arg Leu Lys Glu Leu Ile Lys Tyr Lys
450 455 460
Gly Phe Gln Val Ala Pro Ala Glu Leu Glu Ala Leu Leu Ile Gly His
465 470 475 480
Pro Asp Ile Thr Asp Val Ala Val Val Ala Met Lys Glu Glu Ala Ala
485 490 495
Gly Glu Val Pro Val Ala Phe Val Val Lys Ser Lys Asp Ser Glu Leu
500 505 510
Ser Glu Asp Asp Val Lys Gln Phe Val Ser Lys Gln Val Val Phe Tyr
515 520 525
Lys Arg Ile Asn Lys Val Phe Phe Thr Glu Ser Ile Pro Lys Ala Pro
530 535 540
Ser Gly Lys Ile Leu Arg Lys Asp Leu Arg Ala Lys Leu Ala Asn Gly
545 550 555 560
Leu
<210> 2
<211> 1686
<212> DNA
<213> Arabidopsis thaliana
<400> 2
atggccccgc aggaacaagc ggttagtcaa gtaatggaaa agcagtcaaa caataataat 60
agtgacgtta tatttcgtag taaattgccg gacatataca ttccgaacca ccttagctta 120
cacgactaca tctttcaaaa catttctgag tttgccacaa agccatgcct tattaacggt 180
cccacaggtc acgtctatac ctacagcgac gtacacgtca tcagccgtca aatagctgct 240
aatttccata aacttggtgt taatcaaaat gatgtcgtga tgctattgct gccgaattgt 300
cctgagtttg ttttgtcatt tttagccgca tcatttagag gcgccactgc taccgcggca 360
aatcctttct tcaccccagc ggagatagcg aagcaagcta aggccagtaa tacaaaatta 420
attatcaccg aggcgcgtta tgttgataaa atcaaaccac ttcaaaatga cgacggagtg 480
gtcatagtgt gcatagatga taatgaaagc gtgccgattc ccgaaggatg cttgcgtttc 540
accgagctaa ctcagagtac aacagaggca agcgaggtga tagactccgt ggagattagt 600
ccggatgatg ttgtagctct gccttatagc tccgggacca ccggactacc aaagggggta 660
atgctaacac acaaaggtct ggtgaccagc gtcgcgcagc aagtggatgg ggaaaacccg 720
aacctttatt tccatagcga cgatgttata ctatgtgttc taccgatgtt ccatatttat 780
gctctgaact ccataatgtt gtgcgggctg cgtgtgggag cggcgattct aataatgcca 840
aaattcgaga ttaatttact tttagaatta atacaaagat gtaaggtgac ggtcgcacct 900
atggtccccc ctatagtact ggctatagcg aagtcaagtg agacagaaaa atacgatttg 960
agcagcataa gggttgtcaa gtcaggggct gctccattag gtaaagagtt ggaagacgcg 1020
gtcaacgcca aattccctaa cgcaaagcta ggccaaggat atggcatgac cgaagctgga 1080
ccagtattag ccatgagtct gggcttcgcc aaagagccat ttccggtcaa atccggggcg 1140
tgcggaaccg tcgtcagaaa cgctgagatg aaaatcgtcg atcccgacac aggtgatagc 1200
ctatcaagga atcaaccagg ggagatatgt atcagaggac atcagatcat gaagggttac 1260
ctgaacaacc ccgcagcaac agcggagacg atcgataaag acggatggct tcacacagga 1320
gatatcgggc taattgatga cgatgatgag cttttcatcg tagaccgtct aaaagagctt 1380
atcaagtata aaggtttcca ggtcgcgcct gctgagttag aggccttgct gattggacat 1440
ccggatataa ccgatgtcgc agtagtggca atgaaggagg aggcagctgg cgaagtccct 1500
gttgcatttg ttgtgaaatc aaaggacagc gagttaagtg aagacgacgt caagcaattc 1560
gtatccaaac aggtagtatt ctacaaaagg ataaacaagg ttttttttac tgaaagcatt 1620
ccaaaagccc catccggcaa gatactgcgt aaggacttaa gggcgaagct ggccaatggt 1680
ctttaa 1686
<210> 3
<211> 451
<212> PRT
<213> Arabidopsis thaliana
<400> 3
Met Ala Pro Ile Thr Phe Arg Lys Ser Tyr Thr Ile Val Pro Ala Glu
1 5 10 15
Pro Thr Trp Ser Gly Arg Phe Pro Leu Ala Glu Trp Asp Gln Val Gly
20 25 30
Thr Ile Thr His Ile Pro Thr Leu Tyr Phe Tyr Asp Lys Pro Ser Glu
35 40 45
Ser Phe Gln Gly Asn Val Val Glu Ile Leu Lys Thr Ser Leu Ser Arg
50 55 60
Val Leu Val His Phe Tyr Pro Met Ala Gly Arg Leu Arg Trp Leu Pro
65 70 75 80
Arg Gly Arg Phe Glu Leu Asn Cys Asn Ala Glu Gly Val Glu Phe Ile
85 90 95
Glu Ala Glu Ser Glu Gly Lys Leu Ser Asp Phe Lys Asp Phe Ser Pro
100 105 110
Thr Pro Glu Phe Glu Asn Leu Met Pro Gln Val Asn Tyr Lys Asn Pro
115 120 125
Ile Glu Thr Ile Pro Leu Phe Leu Ala Gln Val Thr Lys Phe Lys Cys
130 135 140
Gly Gly Ile Ser Leu Ser Val Asn Val Ser His Ala Ile Val Asp Gly
145 150 155 160
Gln Ser Ala Leu His Leu Ile Ser Glu Trp Gly Arg Leu Ala Arg Gly
165 170 175
Glu Pro Leu Glu Thr Val Pro Phe Leu Asp Arg Lys Ile Leu Trp Ala
180 185 190
Gly Glu Pro Leu Pro Pro Phe Val Ser Pro Pro Lys Phe Asp His Lys
195 200 205
Glu Phe Asp Gln Pro Pro Phe Leu Ile Gly Glu Thr Asp Asn Val Glu
210 215 220
Glu Arg Lys Lys Lys Thr Ile Val Val Met Leu Pro Leu Ser Thr Ser
225 230 235 240
Gln Leu Gln Lys Leu Arg Ser Lys Ala Asn Gly Ser Lys His Ser Asp
245 250 255
Pro Ala Lys Gly Phe Thr Arg Tyr Glu Thr Val Thr Gly His Val Trp
260 265 270
Arg Cys Ala Cys Lys Ala Arg Gly His Ser Pro Glu Gln Pro Thr Ala
275 280 285
Leu Gly Ile Cys Ile Asp Thr Arg Ser Arg Met Glu Pro Pro Leu Pro
290 295 300
Arg Gly Tyr Phe Gly Asn Ala Thr Leu Asp Val Val Ala Ala Ser Thr
305 310 315 320
Ser Gly Glu Leu Ile Ser Asn Glu Leu Gly Phe Ala Ala Ser Leu Ile
325 330 335
Ser Lys Ala Ile Lys Asn Val Thr Asn Glu Tyr Val Met Ile Gly Ile
340 345 350
Glu Tyr Leu Lys Asn Gln Lys Asp Leu Lys Lys Phe Gln Asp Leu His
355 360 365
Ala Leu Gly Ser Thr Glu Gly Pro Phe Tyr Gly Asn Pro Asn Leu Gly
370 375 380
Val Val Ser Trp Leu Thr Leu Pro Met Tyr Gly Leu Asp Phe Gly Trp
385 390 395 400
Gly Lys Glu Phe Tyr Thr Gly Pro Gly Thr His Asp Phe Asp Gly Asp
405 410 415
Ser Leu Ile Leu Pro Asp Gln Asn Glu Asp Gly Ser Val Ile Leu Ala
420 425 430
Thr Cys Leu Gln Val Ala His Met Glu Ala Phe Lys Lys His Phe Tyr
435 440 445
Glu Asp Ile
450
<210> 4
<211> 1356
<212> DNA
<213> Arabidopsis thaliana
<400> 4
atggctccga ttactttcag aaaatcttac actatagtcc ccgctgagcc aacgtggagc 60
ggaaggtttc ctcttgctga gtgggaccag gtggggacga taacacatat cccaacccta 120
tatttctatg acaagccatc agagtccttt caggggaatg tcgtggagat tctaaagact 180
agcctttcca gggtgttggt acacttttac ccgatggcag gaaggctaag atggcttccc 240
aggggtcgtt tcgagttgaa ctgtaacgcg gaaggagtcg aattcatcga agcggagtca 300
gaaggaaaac tttctgactt caaggacttt tccccgacgc cagagttcga gaacctaatg 360
cctcaagtta attacaagaa cccgatcgag actattcctc tatttttagc gcaagtgact 420
aagttcaagt gtggaggtat atcactgtct gtgaacgtct ctcacgcaat tgttgacgga 480
caaagtgctt tgcatttaat atcagagtgg gggcgtctgg caaggggcga gccgctggag 540
acggttccat tcttggatcg taaaatactt tgggccggag aaccgctgcc cccttttgtt 600
tccccaccta agtttgacca caaagagttt gaccaacctc cgtttttgat aggagagacc 660
gacaatgtgg aagaaagaaa aaaaaagaca atcgttgtca tgttaccgct ttccacctct 720
caactacaga aattgcgttc aaaagcgaac ggatcaaaac actccgatcc tgcaaagggt 780
ttcaccaggt atgagaccgt gaccggccac gtctggcgtt gcgcatgtaa ggccagagga 840
cacagccccg agcaacccac cgccttgggg atatgtatcg acacccgttc taggatggaa 900
ccgcccctgc caagaggtta tttcggaaac gcgaccttag atgttgtagc ggcctctact 960
agcggtgagc ttattagcaa tgaattagga ttcgctgcga gtctaatttc taaagccatc 1020
aaaaatgtca ccaatgagta tgtaatgatc gggatagaat accttaagaa tcaaaaggat 1080
ttgaaaaaat ttcaggacct tcacgccttg ggcagtacgg aagggccctt ctacggcaac 1140
ccgaatttgg gcgtcgtcag ttggctgacg ctgccaatgt atgggctgga ctttggttgg 1200
gggaaggaat tttatactgg cccaggcacg cacgattttg atggcgactc tcttatcttg 1260
ccggatcaga acgaagatgg aagtgtcatc cttgccacgt gtcttcaagt cgcgcatatg 1320
gaggccttca aaaaacactt ctatgaggat atctaa 1356
<210> 5
<211> 449
<212> PRT
<213> Nicotiana attenuata
<400> 5
Met Gly Phe Leu Cys Ala Asn Leu Lys Asn Ser Leu Ala Val Glu Ile
1 5 10 15
Met Ser Lys Lys Leu Val Lys Pro Ser Ser Pro Thr Pro Thr His Leu
20 25 30
Gln Ser Tyr Lys Leu Ser Phe Phe Asp Gln Leu Ala Ile Arg Met His
35 40 45
Val Pro Ile Val Leu Ile Tyr His Asn Leu Asn Asn Ser Ile Thr Asn
50 55 60
Glu Leu Leu Glu Glu Ser Leu Ser Lys Thr Leu Thr His Val Tyr Pro
65 70 75 80
Ser Ala Gly Arg Ile Asn Lys Asp Arg Arg Val Val Asp Cys Leu Asp
85 90 95
Gln Gly Val Glu Phe Ile Ile Ala Lys Val Asn Cys Gln Leu Glu Asp
100 105 110
Phe Leu Glu Gln Ala Arg Lys Asp Ile Asp Leu Ala Asn His Phe Trp
115 120 125
Pro Gln Gly Ile Lys Asp Val Asp Asp Asn Tyr Asp Phe Ala Ile Thr
130 135 140
Pro Leu Val Phe Val Gln Val Thr Arg Phe Glu Cys Gly Gly Leu Ala
145 150 155 160
Leu Ser Val Ala Ala Glu His Ile Ala Ile Asp Gly Phe Thr Asn Met
165 170 175
Lys Phe Ile Tyr Glu Trp Ala Lys Val Cys Arg Leu Gly Ile Pro Thr
180 185 190
Ser Thr Thr Thr Asp Ile Phe Asn Tyr Asp Leu Gly Asp Ile Phe Pro
195 200 205
Ala Arg Asp Thr Ser Arg Ile Leu Lys Pro Leu Ala Ser Leu Ala Ile
210 215 220
Pro Lys Asp Thr Ile Thr Tyr Val Ala Lys Arg Phe Val Phe Asn Glu
225 230 235 240
Ala Ser Ile Ser Lys Leu Arg Asn Lys Ile Ala Ser Gly Val Leu Ser
245 250 255
Phe Lys Pro Ser Arg Val Glu Ile Val Thr Ala Leu Leu Trp Arg Ala
260 265 270
Leu Ile Arg Ala Ser Gln Ala Lys Asn Gly Arg Leu Arg Pro Ser Leu
275 280 285
Met Ser Phe Pro Val Asn Leu Arg Gly Lys Ala Ser Leu Pro Lys Leu
290 295 300
Ser Asp Thr Phe Gly Asn Phe Ala Val Glu Val Pro Val Val Phe Thr
305 310 315 320
Pro Asn Glu Thr Lys Met Glu Leu His Asn Leu Ile Ala Leu Ile Arg
325 330 335
Asp Ala Thr Asp Lys Thr Met Val Ser Ser Ala Lys Ala Ser Asn Asp
340 345 350
Glu Leu Val Ser Met Ala Ala Asn Leu Tyr Asn Met Thr Gln Glu Trp
355 360 365
Glu Ala Asn Glu Glu Val Asp Glu Phe Thr Cys Ser Ser Leu Cys Arg
370 375 380
Phe Pro Met Lys Glu Ala Asp Phe Gly Leu Gly Lys Pro Cys Trp Met
385 390 395 400
Thr Phe Gly Leu Arg Gln Ser Gln Val Phe Trp Leu Tyr Asp Ala Asp
405 410 415
Phe Gly Ser Ser Ile Ala Ala Gln Val Asp Leu Asn Glu Ser Leu Met
420 425 430
His Tyr Phe Glu Arg Asp Gln Asp Leu Asn Thr Phe Thr Ile Leu Asn
435 440 445
Asn
<210> 6
<211> 1350
<212> DNA
<213> Nicotiana attenuata
<400> 6
atgggattct tatgtgcgaa cttgaaaaat tctcttgccg tggaaataat gagtaagaaa 60
ctggtgaaac catcctctcc cacacccaca cacttacaaa gctataaact ttcctttttt 120
gatcaactag ccatcaggat gcatgtgcct atcgttctaa tatatcataa tctaaacaat 180
tctattacca acgaactgct tgaggagagc ctgtctaaaa ccctgaccca tgtctatcca 240
tctgccggaa gaatcaacaa ggacaggcgt gtggttgact gcttggacca gggcgtcgaa 300
ttcattatag ctaaggtaaa ctgccaacta gaagattttc tagaacaggc caggaaagat 360
attgacttag ctaatcactt ttggcctcag gggataaaag atgtcgatga taattacgat 420
tttgcgatta ctccccttgt gtttgtacag gtcactaggt tcgagtgcgg gggattggct 480
ttgtctgtcg cagccgagca catagctatt gatggattca ctaatatgaa gtttatatat 540
gagtgggcta aggtatgcag attaggtatc cctacctcaa caacgactga tatcttcaac 600
tacgacttag gagatatctt tcctgcccgt gataccagca ggatattgaa accccttgcg 660
tcacttgcaa tacccaagga tacaattact tacgtggcca agaggtttgt gttcaacgag 720
gcaagcatct caaagcttcg taacaaaatc gctagcggtg tgctttcttt taagccgtca 780
cgtgtggaaa tagttactgc tttattgtgg agggcactta tcagagccag ccaagcgaaa 840
aatggaagat tacgtccgag ccttatgtcc ttcccggtga acctgagggg caaagcttca 900
ctacctaagc tttccgacac ttttggcaat tttgctgttg aggttcccgt agtttttaca 960
cctaatgaaa ccaaaatgga gttacataac ctgatcgcgt taatacgtga cgcaacggat 1020
aagacgatgg tgtcaagtgc caaagcatct aacgacgagc tggtttctat ggctgcaaac 1080
ttgtacaaca tgactcaaga atgggaagca aacgaagaag tcgacgaatt tacctgtagt 1140
agcctatgcc gtttccctat gaaagaagca gacttcggtc tgggtaagcc gtgttggatg 1200
acattcgggt tgagacagtc acaggtcttc tggttatacg acgcggactt cgggagcagt 1260
atagctgcac aggtcgatct gaatgaaagc ctaatgcact attttgagag ggaccaggat 1320
ttgaatacct tcaccatcct gaacaactaa 1350
<210> 7
<211> 461
<212> PRT
<213> Arabidopsis thaliana
<400> 7
Met Ala Asn Gln Arg Lys Pro Ile Leu Pro Leu Leu Leu Glu Lys Lys
1 5 10 15
Pro Val Glu Leu Val Lys Pro Ser Lys His Thr His Cys Glu Thr Leu
20 25 30
Ser Leu Ser Thr Leu Asp Asn Asp Pro Phe Asn Glu Val Met Tyr Ala
35 40 45
Thr Ile Tyr Val Phe Lys Ala Asn Gly Lys Asn Leu Asp Asp Pro Val
50 55 60
Ser Leu Leu Arg Lys Ala Leu Ser Glu Leu Leu Val His Tyr Tyr Pro
65 70 75 80
Leu Ser Gly Lys Leu Met Arg Ser Glu Ser Asn Gly Lys Leu Gln Leu
85 90 95
Val Tyr Leu Gly Glu Gly Val Pro Phe Glu Val Ala Thr Ser Thr Leu
100 105 110
Asp Leu Ser Ser Leu Asn Tyr Ile Glu Asn Leu Asp Asp Gln Val Ala
115 120 125
Leu Arg Leu Val Pro Glu Ile Glu Ile Asp Tyr Glu Ser Asn Val Cys
130 135 140
Tyr His Pro Leu Ala Leu Gln Val Thr Lys Phe Ala Cys Gly Gly Phe
145 150 155 160
Thr Ile Gly Thr Ala Leu Thr His Ala Val Cys Asp Gly Tyr Gly Val
165 170 175
Ala Gln Ile Ile His Ala Leu Thr Glu Leu Ala Ala Gly Lys Thr Glu
180 185 190
Pro Ser Val Lys Ser Val Trp Gln Arg Glu Arg Leu Val Gly Lys Ile
195 200 205
Asp Asn Lys Pro Gly Lys Val Pro Gly Ser His Ile Asp Gly Phe Leu
210 215 220
Ala Thr Ser Ala Tyr Leu Pro Thr Thr Asp Val Val Thr Glu Thr Ile
225 230 235 240
Asn Ile Arg Ala Gly Asp Ile Lys Arg Leu Lys Asp Ser Met Met Lys
245 250 255
Glu Cys Glu Tyr Leu Lys Glu Ser Phe Thr Thr Tyr Glu Val Leu Ser
260 265 270
Ser Tyr Ile Trp Lys Leu Arg Ser Arg Ala Leu Lys Leu Asn Pro Asp
275 280 285
Gly Ile Thr Val Leu Gly Val Ala Val Gly Ile Arg His Val Leu Asp
290 295 300
Pro Pro Leu Pro Lys Gly Tyr Tyr Gly Asn Ala Tyr Ile Asp Val Tyr
305 310 315 320
Val Glu Leu Thr Val Arg Glu Leu Glu Glu Ser Ser Ile Ser Asn Ile
325 330 335
Ala Asn Arg Val Lys Lys Ala Lys Lys Thr Ala Tyr Glu Lys Gly Tyr
340 345 350
Ile Glu Glu Glu Leu Lys Asn Thr Glu Arg Leu Met Arg Asp Asp Ser
355 360 365
Met Phe Glu Gly Val Ser Asp Gly Leu Phe Phe Leu Thr Asp Trp Arg
370 375 380
Asn Ile Gly Trp Phe Gly Ser Met Asp Phe Gly Trp Asn Glu Pro Val
385 390 395 400
Asn Leu Arg Pro Leu Thr Gln Arg Glu Ser Thr Val His Val Gly Met
405 410 415
Ile Leu Lys Pro Ser Lys Ser Asp Pro Ser Met Glu Gly Gly Val Lys
420 425 430
Val Ile Met Lys Leu Pro Arg Asp Ala Met Val Glu Phe Lys Arg Glu
435 440 445
Met Ala Thr Met Lys Lys Leu Tyr Phe Gly Asp Thr Asn
450 455 460
<210> 8
<211> 1386
<212> DNA
<213> Arabidopsis thaliana
<400> 8
atggcaaatc aaagaaaacc gatattaccg ctactacttg aaaagaagcc agtagagtta 60
gtgaaaccct ccaagcatac tcactgcgag acacttagtt tatccacgct agataatgat 120
ccctttaatg aagtaatgta cgccacgata tacgtgttca aagcgaacgg caagaatctt 180
gacgacccag tatcccttct taggaaagcg ctatctgaac ttcttgtgca ctattaccca 240
cttagtggta aattgatgcg ttcagaaagt aatgggaagc tacaacttgt ttaccttggg 300
gaaggagtac cgttcgaggt cgcaacctct acgttggact tatcttctct gaactatatc 360
gagaatttgg atgaccaggt cgcgttaaga cttgttcccg aaattgaaat tgattatgaa 420
tctaacgtat gttaccatcc attagcattg caggttacta agttcgcctg tggaggattt 480
actatcggga ccgcacttac acacgctgtg tgtgacggct atggggtcgc ccagattata 540
cacgctttaa ctgaacttgc tgcgggaaaa actgagccga gcgtcaaatc cgtttggcaa 600
cgtgaaagac ttgtggggaa aattgacaat aaacctggta aggtaccagg aagtcatatc 660
gacggatttc tagccacaag cgcgtaccta ccgacaacag atgtagtcac ggagactata 720
aatatcagag cgggagacat aaaaaggttg aaggacagca tgatgaaaga atgcgagtat 780
ctgaaggaat ccttcaccac gtatgaagtc ttaagttcct acatatggaa actaagaagc 840
cgtgcgttaa agctaaaccc cgatggcatt actgttcttg gcgtcgccgt cggcattcgt 900
cacgtactgg atccgccatt acctaagggc tattacggaa atgcctatat tgacgtgtac 960
gttgagctaa cggttagaga acttgaagag tcaagtatat ccaatatagc gaatcgtgtc 1020
aagaaagcca agaaaaccgc ctacgaaaaa ggatacatag aagaggaatt gaaaaacacc 1080
gaaaggttga tgagggatga ttctatgttt gaaggggtga gtgatgggtt gttcttccta 1140
accgattggc gtaatatcgg ttggttcggg tcaatggatt ttggttggaa tgagcctgta 1200
aatcttcgtc cgttaaccca gagagaaagc actgtccatg tcggtatgat cttaaagccc 1260
tccaaatcag acccgtctat ggagggaggt gtaaaagtta ttatgaagct tcccagggac 1320
gcgatggtgg agttcaagcg tgagatggca actatgaaga agttgtattt tggcgacact 1380
aattaa 1386
<210> 9
<211> 438
<212> PRT
<213> Nicotiana attenuata
<400> 9
Met Asn Val Lys Ile Glu Ser Ser Arg Ile Ile Lys Pro Phe Tyr Glu
1 5 10 15
Gly Thr Pro Pro Ser Thr Asn Thr His Ile Ser Phe Asn Val Phe Asp
20 25 30
Asn Val Thr Tyr Asp Ala Leu Met Ala Leu Ile Tyr Ala Tyr Arg Pro
35 40 45
Pro Thr Pro Pro Thr Ser Thr Ile Glu Met Gly Leu Arg Lys Thr Leu
50 55 60
Ala Val Tyr Arg Glu Trp Ala Gly Arg Ile Gly Arg Asp Glu Asn Gly
65 70 75 80
Asn Arg Val Val Phe Leu Asn Asp Glu Gly Val Arg Phe Ile Glu Ala
85 90 95
Ser Val Asn Ala Thr Leu Asp Glu Val Leu Pro Leu Lys Pro Ser Pro
100 105 110
Ser Leu Leu Lys Leu His Pro Gly Met Lys Asp Val Val Glu Leu Ile
115 120 125
Gln Val Gln Val Thr Arg Phe Thr Cys Gly Ser Val Met Val Gly Phe
130 135 140
Thr Gly His His Met Ile Ala Asp Gly His Ala Ala Ser Asn Phe Phe
145 150 155 160
Val Ala Trp Gly Gln Ala Cys Arg Gly Val Glu Ile Thr Pro Leu Pro
165 170 175
Leu His Asp Arg Ala Ile Phe His Pro Arg Asn Pro Pro Leu Ile Glu
180 185 190
Phe Asn His Val Gly Ala Glu Phe Met Ser Lys Ser Leu Asn Lys Lys
195 200 205
Glu Phe Ile Lys Leu Glu Asn Thr Glu Lys Asn Ile Ile Val His Lys
210 215 220
Val His Phe Thr Leu Glu Phe Leu Gly Lys Leu Lys Ala Asn Ala Ser
225 230 235 240
Phe Met Asn Gly Lys Thr Lys Thr Tyr Ser Thr Phe Glu Ser Leu Val
245 250 255
Ala His Leu Trp Arg Val Ile Thr Lys Ala Arg Glu Leu Asp Gly Ser
260 265 270
Gln Asn Thr Gln Ile Arg Ile Ser Val Asp Gly Arg Arg Arg Val Val
275 280 285
Pro Arg Val Ala Asp Glu Phe Phe Gly Asn Ile Val Leu Trp Ala Phe
290 295 300
Pro Thr Ser Lys Val Arg Asp Leu Val Asn Glu Pro Leu His Tyr Ala
305 310 315 320
Thr Lys Ile Ile His Asp Ala Ile Thr Lys Val Asp Asp Lys Tyr Phe
325 330 335
Lys Ser Phe Ile Asp Phe Ala Asn His Lys Val Thr Glu Asp Leu Ile
340 345 350
Pro Thr Ala Asp Met Lys Lys Asp Thr Leu Cys Pro Asn Leu Glu Val
355 360 365
Asp Ser Trp Leu Arg Phe Pro Phe Tyr Asp Leu Asp Phe Gly Thr Gly
370 375 380
Cys Pro Phe Val Phe Met Pro Ser Tyr Tyr Pro Thr Glu Gly Met Met
385 390 395 400
Phe Leu Val Pro Ser Phe Ile Gly Asp Gly Ser Ile Asp Ala Phe Ile
405 410 415
Pro Leu Tyr Gln Asp Asn Ser Pro Thr Phe Lys Lys Ile Cys Tyr Ser
420 425 430
Leu Asp Leu Lys Ala Lys
435
<210> 10
<211> 1317
<212> DNA
<213> Nicotiana attenuata
<400> 10
atgaacgtta agatcgaatc ttcaagaatt attaagccat tttatgaagg tactccacca 60
tctactaata cacatatctc ttttaatgtt ttcgataacg ttacatacga tgctttgatg 120
gcattaatct atgcttacag accaccaact ccaccaactt ctacaatcga aatgggttta 180
agaaagacat tggctgttta cagagaatgg gcaggtagaa ttggtagaga tgaaaacggt 240
aacagagttg ttttcttgaa tgatgaaggt gttagattca ttgaagcttc agttaatgca 300
acattggatg aagttttgcc attgaagcca tctccatcat tgttgaagtt gcatcctggt 360
atgaaggatg ttgttgaatt gatccaagtt caagttacta gattcacttg tggttctgtt 420
atggttggtt ttactggtca tcatatgatt gctgatggtc atgctgcatc aaatttcttt 480
gttgcttggg gtcaagcatg tagaggtgtt gaaattacac cattgccatt acatgataga 540
gctatcttcc atccaagaaa cccaccattg atcgagttta atcatgttgg tgcagagttt 600
atgtctaagt cattgaataa gaaagagttt attaaattgg aaaatactga aaagaatatt 660
attgttcata aagttcattt tacattggaa tttttgggta aattgaaggc taacgcatct 720
tttatgaacg gtaaaactaa gacatactct actttcgaat cattggttgc tcatttgtgg 780
agagttatta ctaaggcaag agaattggat ggttctcaaa acacacaaat cagaatctca 840
gttgatggta gaagaagagt tgttccaaga gttgctgatg aatttttcgg taacatcgtt 900
ttgtgggcat ttccaacatc taaagttaga gatttggtta acgaaccatt gcattacgct 960
actaagatca tccatgatgc aattacaaaa gttgatgata agtacttcaa gtcttttatt 1020
gattttgcta atcataaagt tactgaagat ttgattccaa cagcagatat gaagaaagat 1080
actttgtgtc caaatttgga agttgattct tggttgagat tcccattcta cgatttggat 1140
ttcggtactg gttgtccatt cgtttttatg ccatcatact acccaacaga gggtatgatg 1200
ttcttggttc catcttttat tggtgacggt tcaatcgatg cttttattcc attgtaccaa 1260
gataactctc caacttttaa gaaaatttgt tactcattgg atttgaaagc aaaataa 1317
<210> 11
<211> 300
<212> PRT
<213> Saccharomyces cerevisiae
<400> 11
Met Val Asn Asn Ser Gln His Ser Tyr Ile Lys Asp Gly Trp Phe Arg
1 5 10 15
Glu Ile Asn Asp Lys Ser Phe Pro Gly Gln Ala Phe Thr Met Thr Val
20 25 30
Asp Ser Ile Leu Tyr Glu Ala Arg Ser Glu Phe Gln Asp Ile Leu Ile
35 40 45
Phe Arg Asn Lys Val Tyr Gly Thr Val Leu Val Leu Asp Gly Ile Val
50 55 60
Gln Cys Thr Glu Phe Asp Glu Phe Ala Tyr Gln Glu Met Ile Thr His
65 70 75 80
Ile Ala Met Phe Ala His Ser Asn Pro Lys Arg Val Leu Ile Ile Gly
85 90 95
Gly Gly Asp Gly Gly Val Leu Arg Glu Val Ala Lys His Ser Cys Val
100 105 110
Glu Asp Ile Thr Met Val Glu Ile Asp Ser Ser Val Ile Glu Leu Ser
115 120 125
Arg Lys Phe Leu Pro Thr Leu Ser Asn Gly Ala Phe Asp Asp Glu Arg
130 135 140
Leu Asp Leu Lys Leu Cys Asp Gly Phe Lys Phe Leu Gln Asp Ile Gly
145 150 155 160
Ala Ser Asp Val His Lys Lys Phe Asp Val Ile Ile Thr Asp Ser Ser
165 170 175
Asp Pro Glu Gly Pro Ala Glu Ala Phe Phe Gln Glu Arg Tyr Phe Glu
180 185 190
Leu Leu Lys Asp Ala Leu Asn Pro Asn Gly Val Val Ile Met Gln Ser
195 200 205
Ser Glu Asn Phe Trp Leu Asn Leu Lys Tyr Leu His Asp Leu Lys Asn
210 215 220
Thr Ala Lys Lys Val Phe Pro Asn Thr Glu Tyr Cys Tyr Thr Met Val
225 230 235 240
Pro Thr Tyr Thr Ser Gly Gln Leu Gly Leu Ile Val Cys Ser Asn Asn
245 250 255
Ala Asn Ile Pro Leu Asn Ile Pro Gln Arg Lys Ile Ser Glu Gln Glu
260 265 270
Gln Gly Lys Leu Lys Tyr Tyr Asn Pro Gln Ile His Ser Ser Ala Phe
275 280 285
Val Leu Pro Thr Trp Ala Asp Lys Val Ile Asn Glu
290 295 300
<210> 12
<211> 904
<212> DNA
<213> Saccharomyces cerevisiae
<400> 12
atggttaaca actctcaaca tccatacatc aaggatggtt ggttcagaga aattaatgat 60
aagtcattcc caggtcaagc ttttactatg acagttgatt ctatcttgta cgaagcaaga 120
tcagaatttc aagatatctt gatttttaga aataaggttt acggtactgt tttggttttg 180
gatggtatcg ttcaatgtac agaatttgat gaatttgctt accaagaaat gatcactcat 240
atcgctatgt tcgcacattc taacccaaaa agagttttga tcattggtgg tggtgacggt 300
ggtgttttga gagaagttgc aaagcattca tgtgttgaag atatcactat ggttgaaatc 360
gattcttcag ttattgaatt gtctagaaag ttcttaccaa cattgtcaaa tggtgctttc 420
gatgatgaaa gattggattt gaagttgtgt gatggtttta aattcttgca agatatcggt 480
gcatctgatg ttcataagaa attcgatgtt atcatcactg attcttcaga tccagaaggt 540
ccagctgaag ctttctttca agaaagatac ttcgaattgt tgaaggatgc tttgaaccca 600
aacggtgttg ttattatgca atcttcagaa aacttctggt tgaatttgaa gtatttgcat 660
gatttgaaaa atacagctaa gaaagttttc ccaaacactg aatactgtta cacaatggtt 720
ccaacttaca catctggtca attaggtttg atcgtttgtt caaacaacgc taacatccca 780
ttgaacatcc cacaaagaaa aatttctgaa caagaacagg gtaaattgaa gtactacaac 840
ccacaaatcc attcttcagc ttttgttttg ccaacatggg cagataaagt tattaatgaa 900
taag 904
<210> 13
<211> 359
<212> PRT
<213> Arabidopsis thaliana
<400> 13
Met Glu Gly Asp Val Gly Lys Gly Leu Val Cys Gln Asn Thr Met Asp
1 5 10 15
Gly Lys Ala Ser Asn Gly Asn Gly Leu Glu Lys Thr Val Pro Ser Cys
20 25 30
Cys Leu Lys Ala Met Ala Cys Val Pro Glu Asp Asp Ala Lys Cys His
35 40 45
Ser Thr Val Val Ser Gly Trp Phe Ser Glu Pro His Pro Arg Ser Gly
50 55 60
Lys Lys Gly Gly Lys Ala Val Tyr Phe Asn Asn Pro Met Trp Pro Gly
65 70 75 80
Glu Ala His Ser Leu Lys Val Glu Lys Val Leu Phe Lys Asp Lys Ser
85 90 95
Asp Phe Gln Glu Val Leu Val Phe Glu Ser Ala Thr Tyr Gly Lys Val
100 105 110
Leu Val Leu Asp Gly Ile Val Gln Leu Thr Glu Lys Asp Glu Cys Ala
115 120 125
Tyr Gln Glu Met Ile Ala His Leu Pro Leu Cys Ser Ile Ser Ser Pro
130 135 140
Lys Asn Val Leu Val Val Gly Gly Gly Asp Gly Gly Val Leu Arg Glu
145 150 155 160
Ile Ser Arg His Ser Ser Val Glu Val Ile Asp Ile Cys Glu Ile Asp
165 170 175
Lys Met Val Ile Asp Val Ser Lys Lys Phe Phe Pro Glu Leu Ala Val
180 185 190
Gly Phe Asp Asp Pro Arg Val Gln Leu His Ile Gly Asp Ala Ala Glu
195 200 205
Phe Leu Arg Lys Ser Pro Glu Gly Lys Tyr Asp Ala Ile Ile Val Asp
210 215 220
Ser Ser Asp Pro Val Gly Pro Ala Leu Ala Leu Val Glu Lys Pro Phe
225 230 235 240
Phe Glu Thr Leu Ala Arg Ala Leu Lys Pro Gly Gly Val Leu Cys Asn
245 250 255
Met Ala Glu Ser Met Trp Leu His Thr His Leu Ile Glu Asp Met Ile
260 265 270
Ser Ile Cys Arg Gln Thr Phe Lys Ser Val His Tyr Ala Trp Ser Ser
275 280 285
Val Pro Thr Tyr Pro Ser Gly Val Ile Gly Phe Val Leu Cys Ser Thr
290 295 300
Glu Gly Pro Ala Val Asp Phe Lys Asn Pro Ile Asn Pro Ile Glu Lys
305 310 315 320
Leu Asp Gly Ala Met Thr His Lys Arg Glu Leu Lys Phe Tyr Asn Ser
325 330 335
Asp Met His Arg Ala Ala Phe Ala Leu Pro Thr Phe Leu Arg Arg Glu
340 345 350
Val Ala Ser Leu Leu Ala Ser
355
<210> 14
<211> 1080
<212> DNA
<213> Arabidopsis thaliana
<400> 14
atggaaggtg acgttggtaa aggtttggtt tgtcaaaata ctatggatgg taaagcttca 60
aatggtaatg gtttggaaaa gactgttcca tcttgttgtt taaaagctat ggcatgtgtt 120
ccagaagatg atgcaaaatg tcattctact gttgtttcag gttggttttc tgaaccacat 180
ccaagatcag gtaaaaaggg tggtaaagct gtttacttca acaacccaat gtggccaggt 240
gaagcacatt ctttgaaggt tgaaaaggtt ttgtttaaag acaagtcaga ttttcaagaa 300
gttttggttt tcgaatctgc tacttacggt aaagttttgg ttttggatgg tatcgttcaa 360
ttgacagaaa aggatgaatg tgcttaccaa gaaatgattg cacatttgcc attgtgttct 420
atctcttcac ctaaaaatgt tttggttgtt ggtggtggtg acggtggtgt tttgagagaa 480
atctcaagac attcttcagt tgaagttatt gatatctgtg aaatcgataa gatggttatt 540
gatgtttcta agaaattttt cccagaatta gctgttggtt ttgatgatcc aagagttcaa 600
ttgcatattg gtgacgctgc agaatttttg agaaagtcac cagagggtaa atacgatgca 660
atcatcgttg attcttcaga tccagttggt ccagctttgg cattggttga aaagccattt 720
ttcgaaacat tggctagagc attaaaacca ggtggtgttt tgtgtaatat ggctgaatct 780
atgtggttgc atactcattt gatcgaagat atgatctcaa tctgtagaca aacttttaaa 840
tctgttcatt acgcatggtc ttcagttcca acttacccat caggtgttat tggtttcgtt 900
ttgtgttcta cagaaggtcc agctgttgat ttcaagaacc caattaatcc aatcgaaaaa 960
ttggatggtg caatgactca taagagagaa ttgaagttct acaattctga tatgcataga 1020
gctgcatttg ctttgccaac atttttaaga agagaagttg cttcattgtt agcatcttaa 1080
<210> 15
<211> 339
<212> PRT
<213> Arabidopsis thaliana
<400> 15
Met Gly Glu Ala Val Glu Val Met Phe Gly Asn Gly Phe Pro Glu Ile
1 5 10 15
His Lys Ala Thr Ser Pro Thr Gln Thr Leu His Ser Asn Gln Gln Asp
20 25 30
Cys His Trp Tyr Glu Glu Thr Ile Asp Asp Asp Leu Lys Trp Ser Phe
35 40 45
Ala Leu Asn Ser Val Leu His Gln Gly Thr Ser Glu Tyr Gln Asp Ile
50 55 60
Ala Leu Leu Asp Thr Lys Arg Phe Gly Lys Val Leu Val Ile Asp Gly
65 70 75 80
Lys Met Gln Ser Ala Glu Arg Asp Glu Phe Ile Tyr His Glu Cys Leu
85 90 95
Ile His Pro Ala Leu Leu Phe His Pro Asn Pro Lys Thr Val Phe Ile
100 105 110
Met Gly Gly Gly Glu Gly Ser Ala Ala Arg Glu Ile Leu Lys His Thr
115 120 125
Thr Ile Glu Lys Val Val Met Cys Asp Ile Asp Gln Glu Val Val Asp
130 135 140
Phe Cys Arg Arg Phe Leu Thr Val Asn Ser Asp Ala Phe Cys Asn Lys
145 150 155 160
Lys Leu Glu Leu Val Ile Lys Asp Ala Lys Ala Glu Leu Glu Lys Arg
165 170 175
Glu Glu Lys Phe Asp Ile Ile Val Gly Asp Leu Ala Asp Pro Val Glu
180 185 190
Gly Gly Pro Cys Tyr Gln Leu Tyr Thr Lys Ser Phe Tyr Gln Asn Ile
195 200 205
Leu Lys Pro Lys Leu Ser Pro Asn Gly Ile Phe Val Thr Gln Ala Gly
210 215 220
Pro Ala Gly Ile Phe Thr His Lys Glu Val Phe Thr Ser Ile Tyr Asn
225 230 235 240
Thr Met Lys Gln Val Phe Lys Tyr Val Lys Ala Tyr Thr Ala His Val
245 250 255
Pro Ser Phe Ala Asp Thr Trp Gly Trp Val Met Ala Ser Asp His Glu
260 265 270
Phe Asp Val Glu Val Asp Glu Met Asp Arg Arg Ile Glu Glu Arg Val
275 280 285
Asn Gly Glu Leu Met Tyr Leu Asn Ala Pro Ser Phe Val Ser Ala Ala
290 295 300
Thr Leu Asn Lys Thr Ile Ser Leu Ala Leu Glu Lys Glu Thr Glu Val
305 310 315 320
Tyr Ser Glu Glu Asn Ala Arg Phe Ile His Gly His Gly Val Ala Tyr
325 330 335
Arg His Ile
<210> 16
<211> 1020
<212> DNA
<213> Arabidopsis thaliana
<400> 16
atgggtgaag cagtagaagt aatgttcggt aacggtttcc cagaaatctt aaaagccaca 60
agtccaactc aaaccttgca ctccaatcaa caagattgtc attggtacga agaaactatc 120
gatgatgatt tgaagtggtc tttcgcttta aattctgttt tgcatcaagg tacttctgaa 180
taccaagata tcgcattgtt ggatacaaag agattcggta aagttttggt tattgatggt 240
aaaatgcaat cagctgaaag agatgagttt atatatcatg aatgtttgat ccatccagca 300
ttgttgttcc atccaaaccc aaagactgtt tttattatgg gtggtggtga aggttctgct 360
gcaagagaaa tcttgaagca tactacaatc gaaaaagttg ttatgtgtga tatcgatcaa 420
gaagttgttg atttctgtag aagatttttg acagttaatt cagatgcttt ctgtaataag 480
aaattggaat tagttattaa agatgctaag gcagaattgg aaaagagaga agaaaagttc 540
gatattattg ttggtgactt ggctgatcca gttgaaggtg gtccatgtta tcaattgtac 600
actaagtctt tctaccaaaa cattttgaaa ccaaaattat caccaaatgg tatttttgtt 660
actcaagctg gtccagcagg tatttttaca cataaagaag tttttacttc tatctataac 720
acaatgaagc aagtttttaa atacgttaaa gcttacactg cacatgttcc atcttttgct 780
gatacatggg gttgggttat ggcatcagat catgaatttg atgttgaagt tgatgaaatg 840
gatagaagaa tcgaagaaag agttaacggt gaattgatgt acttaaatgc tccatctttt 900
gtttcagctg caactttgaa taagacaatc tcattggcat tggaaaagga aacagaagtt 960
tactccgaag aaaatgctag attcatccac ggtcacggtg ttgcctacag acatatctaa 1020
<210> 17
<211> 370
<212> PRT
<213> Senecio vernalis
<400> 17
Met Ala Glu Ser Asn Lys Glu Ala Ile Asp Ser Ala Arg Ser Asn Val
1 5 10 15
Phe Lys Glu Ser Glu Ser Leu Glu Gly Thr Cys Ala Lys Ile Gly Gly
20 25 30
Tyr Asp Phe Asn Asn Gly Ile Asp His Ser Lys Leu Leu Lys Ser Met
35 40 45
Val Ser Thr Gly Phe Gln Ala Ser Asn Leu Gly Asp Ala Met Ile Ile
50 55 60
Thr Asn Gln Met Leu Asp Trp Arg Leu Ser His Asp Glu Val Pro Glu
65 70 75 80
Asn Cys Ser Glu Glu Glu Lys Lys Asn Arg Glu Ser Val Lys Cys Lys
85 90 95
Ile Phe Leu Gly Phe Thr Ser Asn Leu Ile Ser Ser Gly Val Arg Glu
100 105 110
Thr Ile Cys Tyr Leu Thr Gln His Arg Met Val Asp Val Leu Val Thr
115 120 125
Thr Thr Gly Gly Ile Glu Glu Asp Phe Ile Lys Cys Leu Ala Ser Thr
130 135 140
Tyr Lys Gly Lys Phe Ser Leu Pro Gly Ala Asp Leu Arg Ser Lys Gly
145 150 155 160
Leu Asn Arg Ile Gly Asn Leu Ile Val Pro Asn Asp Asn Tyr Ile Lys
165 170 175
Phe Glu Asp Trp Ile Ile Pro Ile Phe Asp Gln Met Leu Ile Glu Gln
180 185 190
Lys Thr Gln Asn Val Leu Trp Thr Pro Ser Arg Met Ile Ala Arg Leu
195 200 205
Gly Lys Glu Ile Asn Asn Glu Thr Ser Tyr Leu Tyr Trp Ala Tyr Lys
210 215 220
Asn Asn Ile Pro Val Phe Cys Pro Ser Ile Thr Asp Gly Ser Ile Gly
225 230 235 240
Asp Met Leu Tyr Phe His Ser Val Ser Asn Pro Gly Pro Gly Leu Val
245 250 255
Val Asp Ile Val Gln Asp Val Ile Ala Met Asp Asn Glu Ala Val His
260 265 270
Ala Ser Pro Gln Lys Thr Gly Ile Ile Ile Leu Gly Gly Gly Leu Pro
275 280 285
Lys His His Ile Cys Asn Ala Asn Met Met Arg Asn Gly Ala Asp Phe
290 295 300
Ala Val Phe Ile Asn Thr Ala Gln Glu Tyr Asp Gly Ser Asp Ser Gly
305 310 315 320
Ala Arg Pro Asp Glu Ala Val Ser Trp Gly Lys Ile Ser Ser Thr Gly
325 330 335
Lys Ala Val Lys Val His Cys Asp Ala Thr Ile Ala Phe Pro Leu Leu
340 345 350
Val Ala Glu Thr Phe Ala Val Lys Lys Glu Lys Ala Ser Lys Val Asn
355 360 365
Gly Phe
370
<210> 18
<211> 1113
<212> DNA
<213> Senecio vernalis
<400> 18
atggctgaat ctaataagga agctatcgat tctgcaagat caaacgtttt taaagaatct 60
gaatcattag aaggtacatg tgcaaagatc ggtggttacg atttcaacaa cggtatcgat 120
cattcaaagt tgttgaagtc tatggtttca acaggtttcc aagcttctaa tttgggtgac 180
gcaatgatca tcactaacca aatgttggat tggagattat ctcatgatga agttccagaa 240
aactgttcag aagaagaaaa gaaaaataga gaatctgtta agtgtaagat tttcttgggt 300
tttacatcaa atttgatctc ttcaggtgtt agagaaacaa tctgttattt gactcaacat 360
agaatggttg atgttttggt tactacaact ggtggtatcg aagaagattt catcaagtgt 420
ttagcttcta cttacaaggg taaattttca ttgccaggtg cagatttgag atctaagggt 480
ttgaacagaa ttggtaattt gatcgttcca aacgataact acatcaagtt cgaagattgg 540
attattccaa tttttgatca aatgttaatt gaacaaaaga ctcaaaatgt tttgtggact 600
ccatcaagaa tgattgctag attgggtaaa gaaattaata acgaaacatc ttatttgtac 660
tgggcataca agaacaacat cccagttttc tgtccatcta ttactgatgg ttcaattggt 720
gacatgttgt acttccattc tgtttcaaac ccaggtccag gtttggttgt tgatatcgtt 780
caagatgtta tcgctatgga taatgaagct gttcatgcat ctccacaaaa gactggtatc 840
atcatcttgg gtggtggttt accaaagcat catatctgta acgctaacat gatgagaaac 900
ggtgctgatt tcgcagtttt tattaacaca gcacaagaat acgatggttc tgattcaggt 960
gctagaccag atgaagcagt ttcatggggt aaaatctctt caactggtaa agctgttaaa 1020
gttcattgtg atgctacaat tgcatttcca ttgttagttg ctgaaacttt cgcagttaag 1080
aaagaaaagg cttctaaagt taatggtttt taa 1113
<210> 19
<211> 280
<212> PRT
<213> Blastochloris viridis
<400> 19
Met Thr Asp Trp Pro Val Tyr His Arg Ile Asp Gly Pro Ile Val Met
1 5 10 15
Ile Gly Phe Gly Ser Ile Gly Arg Gly Thr Leu Pro Leu Ile Glu Arg
20 25 30
His Phe Ala Phe Asp Arg Ser Lys Leu Val Val Ile Asp Pro Ser Asp
35 40 45
Glu Ala Arg Lys Leu Ala Glu Ala Arg Gly Val Arg Phe Ile Gln Gln
50 55 60
Ala Val Thr Arg Asp Asn Tyr Arg Asp Leu Leu Val Pro Leu Leu Thr
65 70 75 80
Ala Gly Pro Gly Gln Gly Phe Cys Val Asn Leu Ser Val Asp Thr Ser
85 90 95
Ser Leu Asp Ile Met Glu Leu Ala Arg Glu Asn Gly Ala Leu Tyr Ile
100 105 110
Asp Thr Val Val Glu Pro Trp Leu Gly Phe Tyr Phe Asp Pro Asp Leu
115 120 125
Lys Pro Glu Ala Arg Ser Asn Tyr Ala Leu Arg Glu Thr Val Leu Ala
130 135 140
Ala Arg Arg Asn Lys Pro Gly Gly Thr Thr Ala Val Ser Cys Cys Gly
145 150 155 160
Ala Asn Pro Gly Met Val Ser Trp Phe Val Lys Gln Ala Leu Val Asn
165 170 175
Leu Ala Ala Asp Leu Gly Val Thr Arg Glu Glu Pro Thr Thr Arg Glu
180 185 190
Glu Trp Ala Arg Leu Ala Met Asp Leu Gly Val Lys Gly Ile His Ile
195 200 205
Ala Glu Arg Asp Thr Gln Arg Ala Asn Phe Pro Lys Pro Phe Asp Val
210 215 220
Phe Val Asn Thr Trp Ser Val Glu Gly Phe Val Ser Glu Gly Leu Gln
225 230 235 240
Pro Ala Glu Leu Gly Trp Gly Thr Phe Glu Arg Trp Met Pro Asp Asn
245 250 255
Ala Arg Gly His Asp Ser Gly Cys Gly Ala Gly Ile Tyr Leu Leu Gln
260 265 270
Pro Gly Ala Asn Thr Arg Val Arg
275 280
<210> 20
<211> 1434
<212> DNA
<213> Blastochloris viridis
<400> 20
atgacagatt ggccagttta ccatagaatc gatggtccaa tcgttatgat tggttttggt 60
tctattggta gaggtacttt gccattgatc gaaagacatt tcgcattcga tagatctaag 120
ttggttgtta ttgatccatc agatgaagct agaaaattgg ctgaagcaag aggtgttaga 180
ttcattcaac aagcagttac aagagataac tacagagatt tgttggttcc attgttaact 240
gctggtccag gtcaaggttt ctgtgttaat ttgtctgttg atacatcttc attggatatc 300
atggaattgg ctagagaaaa tggtgcattg tatattgata ctgttgttga accatggttg 360
ggtttctact tcgatccaga tttgaagcca gaagctagat caaactacgc attgagagaa 420
acagttttag ctgcaagaag aaataagcca ggtggtacta cagctgtttc ttgttgtggt 480
gcaaatcctg gtatggtttc atggttcgtt aagcaagctt tggttaattt ggctgcagat 540
ttgggtgtta ctagagaaga accaactaca agagaagaat gggctagatt ggcaatggat 600
ttgggtgtta agggtattca tatcgctgaa agagatacac aaagagcaaa cttcccaaag 660
ccattcgatg ttttcgttaa cacttggtct gttgaaggtt ttgtttcaga aggtttgcaa 720
ccagctgaat taggttgggg tacatttgaa agatggatgc cagataatgc tagaggtcat 780
gattctggtt gtggtgcagg tatatatttg ttacaaccag gtgctaatac tagagttaga 840
tcatggactc caacagctac tgcacaatac ggtttcttgg ttacacataa cgaatctatc 900
tcaatcgcag atttcttgac tgttagagat gctgcaggtc aagctgttta tagaccaaca 960
tgtcattatg cttaccatcc atgtaacgat gcagttttgt ctttgcatga aatgtttggt 1020
tctggtaaaa gacaatcaga ttggttgatc ttggatgaaa ctgaaatcgt tgatggtatc 1080
gatgaattgg gtgttttgtt gtacggtcat ggtaaaaatg cttattggta cggttctcaa 1140
ttgtcaatcg aagaaacaag aagaattgct ccagatcaaa atgcaactgg tttgcaagtt 1200
tcttcagctg ttttagctgg tatggtttgg gctttggaaa atccaaaagc tggtattgtt 1260
gaagcagatg atttggatta cagaagatgt ttggaagttc aaacaccata tttgggtcca 1320
gttgttggtg tttacacaga ttggactcca ttggcaggta gaccaggttt atttccagaa 1380
gatattgatg cttcagatcc atggcaattc agaaatgttt tggttagaga ttaa 1434
<210> 21
<211> 1365
<212> DNA
<213> Saccharomyces cerevisiae
<400> 21
atgtcagagc cagaatttca acaagcttac gaagaagttg tctcctcttt ggaagactct 60
actcttttcg aacaacaccc agaatacaga aaggttttgc caattgtttc tgttccagaa 120
agaatcatac aattcagagt cacctgggaa aatgacaagg gtgaacaaga agttgctcaa 180
ggttacagag tgcaatataa ctccgccaag ggtccataca agggtggtct acgtttccat 240
ccttccgtga acttgtctat cttgaaattc ttgggtttcg aacaaatctt caagaactcc 300
ttgaccggcc tagacatggg tggtggtaaa ggtggtctat gtgtggactt gaagggaaga 360
tctaataacg aaatcagaag aatctgttat gctttcatga gagaattgag cagacacatt 420
ggtcaagaca ctgacgtgcc agctggtgat atcggtgttg gtggtcgtga aattggttac 480
ctgttcggtg cttacagatc atacaagaac tcctgggaag gtgtcttaac cggtaagggt 540
ttgaactggg gtggttcttt gatcagacca gaagccactg gttacggttt agtttactat 600
actcaagcta tgatcgacta tgccacaaac ggtaaggaat ctttcgaagg taagcgcgtc 660
accatctctg gtagtggtaa cgttgctcaa tacgctgcct tgaaggttat tgagctaggt 720
ggtactgtcg tttccctatc tgactccaag ggttgtatca tctctgaaac tggtatcacc 780
tccgaacaag tcgctgatat ttccagtgct aaggtcaact tcaagtcctt ggaacaaatc 840
gtcaacgaat actctacttt ctccgaaaac aaagtgcaat acattgctgg tgctcgtcca 900
tggacccacg tccaaaaggt cgacattgct ttgccatgtg ccacccaaaa tgaagtcagc 960
ggtgaagaag ccaaggcctt ggttgctcaa ggtgtcaagt ttattgccga aggttccaac 1020
atgggttcca ctccagaagc tattgccgtc tttgaaactg ctcgttccac cgccactgga 1080
ccaagcgaag ctgtttggta cggtccacca aaggctgcta acttgggtgg tgttgctgtt 1140
tctggtttag aaatggcaca aaactctcaa agaatcacat ggactagcga aagagttgac 1200
caagagttga agagaattat gatcaactgt ttcaatgaat gtatcgacta tgccaagaag 1260
tacactaagg acggtaaggt cttgccatct ttggtcaaag gtgctaatat cgcaagtttc 1320
atcaaggtct ctgatgctat gtttgaccaa ggtgatgtat tttaa 1365
<210> 22
<211> 2709
<212> DNA
<213> Saccharomyces cerevisiae
<400> 22
atggagcaaa tcaattcgaa cagtagaaaa aagaagcaac aattggaagt attcaaatat 60
tttgcaagtg tccttacaaa agaggacaag cctattagta tcagtaatgg tatgttagat 120
atgccgacag tgaactccag taaactcaca gcaggaaatg ggaaacctga cacggagaag 180
cttacaggag aactaatttt aacatacgac gatttcattg aactgatatc tagctcaaag 240
actatttatt cgaagtttac ggaccattcg ttcaatttga accagatacc caagaacgtt 300
ttcgggtgta ttttcttcgc tattgatgaa caaaacaagg gatatctgac gcttaatgat 360
tggttttatt ttaataattt attagaatat gataattatc atctcattat tctatatgag 420
ttctttagga aatttgatgt agagaatttg aaggcaaaac aaaaaaaaga gcttggtagt 480
tcgtcgttta atttaaaggc tgcagatgat cgaattaagt caattaatta tggtaacaga 540
tttctaagct ttgatgatct tcttttgaat ctgaaccaat tcaaagatac tatccgcctg 600
ttgcacgaat ctattgatga taattttgtt aaagataaca aattactact tgattggaat 660
gactttcgat ttctgaaatt ttacaaatgt tatcatgaaa atgaagagta tttgagttta 720
aactctctgg tcacgatttt acaaaatgat cttaagaatg aaaaaatatt tataggtttt 780
gataggttgg cacagatgga ctcacaaggg catcgtttag ccctaagcaa aaatcaactc 840
acctatcttc taaggttatt ttactctcac agggtgtctg cagatatatt ttcctccttg 900
aatctatcaa acaccgaatt actaaaagcg gacaataatt ccattccgta caatgtattc 960
aaggatatat tttatttatt tcaaaatttt gacctactga accaaatatt tcacaagtat 1020
gttactgaaa ataatttgaa tgagcaggat attagggaac aaatagttac taaaaatgac 1080
tttatgacag ttttaaacgc ccagtataac aaagtaaaca atatcattga gttctctcct 1140
tcccaaatca acctactatt ttctatcgtc gcaaattcaa aggaaaacag aagattaaga 1200
aagagaaatc aagatcgaga tgacgagcta ttaaatgatc accattatga ttcagatatt 1260
gattttttta tccataatga gtatttgcat ggagtaagca gatccagaaa aaatttagaa 1320
agttttaatg actattatca tgatctctcg gatggatttg accaagactc tggtgttaaa 1380
aaagcttcaa aagcgagtac tggcttgttt gaatctgtat ttggaggtaa aaaagataaa 1440
gcaacgatgc gttctgactt aacaattgaa gatttcatga aaattttgaa cccaaattac 1500
ctgaacgact tagttcacca aatggaattg caaaaaaatc aaaatgagtc attgtatatt 1560
aattactact tttatccaat tttcgattcg ttgtacaatt tctccttggg ttctattgcg 1620
ggttgtattg gtgcaactgt agtataccca atagacttta taaaaacaag gatgcaagcc 1680
caaagatctt tagcccaata caaaaactca attgattgtt tgttgaagat tatatcccgc 1740
gaaggaataa aaggtctcta ctctggctta gggccacaat taataggagt tgctcctgaa 1800
aaggcgataa aattgactgt caatgatttt atgagaaaca ggttgactga taaaaacggc 1860
aagctaagcc tttttcctga aattatttct ggcgcttcag ctggtgcatg tcaagttata 1920
tttactaatc cgttagagat tgtaaaaatt aggctacagg tccaatccga ctatgttggt 1980
gaaaacatac aacaagccaa tgaaactgcc actcaaatag tcaaaaaatt aggactgagg 2040
ggcttgtaca atggtgtagc cgcatgttta atgagagatg ttccattctc tgctatttat 2100
tttcccactt atgcacattt aaaaaaagat ctctttgatt ttgatccaaa tgataaaaca 2160
aagaggaatc gattaaaaac atgggagctt ttaactgccg gtgccattgc tggtatgcca 2220
gctgccttct tgactactcc ttttgatgtt ataaaaacaa ggctccagat agatcctcga 2280
aaaggtgaga caaagtataa cggtatattt catgctatcc gaactatctt aaaggaagag 2340
agctttagaa gctttttcaa aggtggtgga gcccgtgtcc taagaagttc tccccaattt 2400
gggttcactc tggccgccta tgaattattc aagggcttta ttccctcccc cgataacaaa 2460
ttaaaaagca gagagggtag gaagagattt tgtatcgatg acgacgcagg caatgaagag 2520
acagtagttc atagtaacgg tgaactccca cagcaaaagt tttactctga tgatagaaaa 2580
catgccaatt attactataa aagctgtcaa attgcgaaaa cattcattga tttggacaat 2640
aacttttcta ggtttgactc ttcagtttat aaaaactttc aagagcacct aagaagcatt 2700
aacgggtga 2709
<210> 23
<211> 879
<212> DNA
<213> Saccharomyces cerevisiae
<400> 23
atggaggaca gtaaaaagaa aggattaata gaaggcgcta tactcgatat aataaacggt 60
tccattgcag gcgcctgtgg taaggtgatc gagtttcctt tcgatactgt gaaagtcagg 120
ttgcaaacac aagcatccaa cgtgttccca acaacatggt cttgtataaa atttacttac 180
caaaatgaag gaatagcacg agggtttttt caaggcattg cttcaccttt agttggagca 240
tgtctggaga acgcgacatt atttgtgtct tataaccaat gttctaaatt tttagaaaaa 300
catacaaacg tttccccgtt ggggcaaatc ctgatctctg gtggagtagc gggttcatgt 360
gctagtttag ttttgacacc cgtggagctg gtgaagtgta agttgcaggt tgcgaactta 420
caagttgcat cagctaaaac gaaacataca aaggtgttgc ctacaataaa agcaattata 480
actgagagag gattggcagg attgtggcaa gggcaatcgg gcacttttat tcgagaaagc 540
ttcggtggtg ttgcctggtt tgcaacctac gaaatagtta agaagtcgtt gaaagatagg 600
cactcccttg atgacccaaa aagagatgaa agtaagatat gggaactact tattagtgga 660
gggagcgctg gattggcatt caacgccagt atttttcctg cggatactgt gaaatcagta 720
atgcaaactg aacatataag cctcaccaat gcggtgaaga agatatttgg caaatttgga 780
ctaaagggtt tttatcgagg actgggtata acccttttta gggcagtacc agcaaacgct 840
gcagtttttt acatctttga gactctttct gcactttaa 879
<210> 24
<211> 1332
<212> DNA
<213> Escherichia coli
<400> 24
atggtaaagg aacgtaaaac cgagttggtc gagggattcc gccattcggt tccctatatc 60
aatacccacc ggggaaaaac gtttgtcatc atgctcggcg gtgaagccat tgagcatgag 120
aatttctcca gtatcgttaa tgatatcggg ttgttgcaca gcctcggcat ccgtctggtg 180
gtggtctatg gcgcacgtcc gcagatcgac gcaaatctgg ctgcgcatca ccacgaaccg 240
ctgtatcaca agaatatacg tgtgaccgac gccaaaacac tggaactggt gaagcaggct 300
gcgggaacat tgcaactgga tattactgct cgcctgtcga tgagtctcaa taacacgccg 360
ctgcagggcg cgcatatcaa cgtcgtcagt ggcaatttta ttattgccca gccgctgggc 420
gtcgatgacg gcgtggatta ctgccatagc gggcgtatcc ggcggattga tgaagacgcg 480
atccatcgtc aactggacag cggtgcaata gtgctaatgg ggccggtcgc tgtttcagtc 540
actggcgaga gctttaacct gacctcggaa gagattgcca ctcaactggc catcaaactg 600
aaagctgaaa agatgattgg tttttgctct tcccagggcg tcactaatga cgacggtgat 660
attgtctccg aacttttccc taacgaagcg caagcgcggg tagaagccca ggaagagaaa 720
ggcgattaca actccggtac ggtgcgcttt ttgcgtggcg cagtgaaagc ctgccgcagc 780
ggcgtgcgtc gctgtcattt aatcagttat caggaagatg gcgcgctgtt gcaagagttg 840
ttctcacgcg acggtatcgg tacgcagatt gtgatggaaa gcgccgagca gattcgtcgc 900
gcaacaatca acgatattgg cggtattctg gagttgattc gcccactgga gcagcaaggt 960
attctggtac gccgttctcg cgagcagctg gagatggaaa tcgacaaatt caccattatt 1020
cagcgcgata acacgactat tgcctgcgcc gcgctctatc cgttcccgga agagaagatt 1080
ggggaaatgg cctgtgtggc agttcacccg gattaccgca gttcatcaag gggtgaagtt 1140
ctgctggaac gcattgccgc tcaggcgaag cagagcggct taagcaaatt gtttgtgctg 1200
accacgcgca gtattcactg gttccaggaa cgtggattta ccccagtgga tattgattta 1260
ctgcccgaga gcaaaaagca gttgtacaac taccagcgta aatccaaagt gttgatggcg 1320
gatttagggt aa 1332
<210> 25
<211> 777
<212> DNA
<213> Escherichia coli
<400> 25
atgatgaatc cattaattat caaactgggc ggcgtactgc tggatagtga agaggcgctg 60
gaacgtctgt ttagcgcact ggtgaattat cgtgagtcac atcagcgtcc gctggtgatt 120
gtgcacggcg gcggttgcgt ggtggatgag ctgatgaaag ggctgaatct gccggtgaaa 180
aagaaaaacg gcctgcgggt gacgcctgct gatcagatag acattatcac cggagcactg 240
gcgggaacgg caaataaaac cctgttggca tgggcgaaga aacatcagat tgcggccgta 300
ggtttgtttc tcggtgacgg cgacagcgtc aaagtgaccc agcttgatga agagttaggt 360
catgttggac tggcgcagcc aggttcgcct aagcttatca actccttgct ggagaacggt 420
tatctgccgg tggtcagctc cattggcgta acagacgaag ggcaactgat gaacgtcaat 480
gccgaccagg cggcaacggc gctggcggca acgctgggcg cggatctgat tttgctctcc 540
gacgtcagcg gcattctcga cggcaaaggg caacgcattg ccgaaatgac cgccgcgaaa 600
gcagaacaac tgattgagca gggcattatt actgacggca tgatagtgaa agtgaacgcg 660
gcgctggatg cggcccgcac gctgggccgt ccggtagata tcgcctcctg gcgtcatgcg 720
gagcagcttc cggcactgtt taacggtatg ccgatgggta cgcggatttt agcttaa 777
<210> 26
<211> 1074
<212> DNA
<213> Corynebacterium glutamicum
<400> 26
atgataatgc acaatgtcta tggtgttaca atgactatta aggtcgcaat cgcaggtgcc 60
tcaggttacg caggtggtga aatcttgaga ttgttattgg gtcatccagc atatgcctct 120
ggtgaattag aaataggtgc attgaccgct gcatccactg ccggtagtac attgggtgaa 180
ttgatgccac atattcctca attagctgat agagttatac aagacactac agctgaaaca 240
ttggcaggtc atgatgttgt ctttttaggt ttgccacacg gtttctcagc agaaatagcc 300
ttacaattgg gtcctgatgt cacagtaatc gattgtgccg ctgactttag attacaaaat 360
gcagccgact gggaaaaatt ctatggttcc gaacatcaag gtacctggcc atacggtatt 420
ccagaaatgc ctggtcacag agaagccttg agaggtgcta agagagttgc agtcccaggt 480
tgctttccta caggtgctac cttagcatta ttgccagccg ttcaagctgg tttgatcgaa 540
cctgatgtat ctgtagtttc aattaccggt gtttccggtg caggtaaaaa ggctagtgtt 600
gccttattgg gttctgaaac tatgggttca ttgaaggcat acaacacctc aggtaaacat 660
agacacactc cagaaatcgc tcaaaacttg ggtgaagttt ctgacaaacc agtaaaggtt 720
tcattcacac ctgttttagc tccattgcct agaggtattt taaccactgc tacagcacct 780
ttgaaagaag gtgtcaccgc cgaacaagcc agagctgttt acgaagaatt ctacgctcaa 840
gaaactttcg tccatgtatt accagaaggt gcccaacctc aaacacaagc tgttttgggt 900
tccaacatgt gtcacgttca agtcgaaatt gatgaagaag ctggtaaagt attggttact 960
agtgcaatcg acaatttgac taagggtaca gcaggtgctg cagttcaatg catgaactta 1020
tctgtcggtt ttgatgaagc cgctggtttg ccacaagtcg gtgtagctcc ttaa 1074
<210> 27
<211> 1176
<212> DNA
<213> Corynebacterium glutamicum
<400> 27
atgtctacat tggaaacctg gcctcaagtc atcatcaaca catacggtac tcctcctgtc 60
gaattggtct ctggtaaagg tgctacagta accgatgacc agggtaacgt ttacatcgat 120
ttgttggctg gtatagcagt taacgccttg ggtcatgctc acccagcaat aatcgaagct 180
gtaactaacc aaataggtca attgggtcat gtttctaact tatttgcatc aagacctgtt 240
gtcgaagttg ccgaagaatt aattaagaga ttctctttgg atgacgcaac attagctgca 300
caaaccagag ttttcttttg taattcaggt gcagaagcca acgaagccgc ttttaaaatc 360
gctagattga caggtagatc cagaatttta gcagccgttc atggtttcca cggtagaacc 420
atgggtagtt tggcattaac tggtcaacca gataagagag aagcattttt gccaatgcct 480
tccggtgttg aattctatcc ttacggtgac actgactatt tgagaaaaat ggtcgaaacc 540
aatccaactg atgtagctgc aatcttttta gaacctattc aaggtgaaac aggtgtagtt 600
ccagcccctg aaggtttctt gaaggctgtt agagaattgt gtgatgaata cggtatcttg 660
atgatcactg acgaagtaca aacaggtgtt ggtagaaccg gtgacttttt cgcacatcaa 720
cacgatggtg tcgtaccaga cgttgtcact atggctaaag gtttgggtgg tggtttacct 780
attggtgcct gcttggctac aggtagagcc gctgaattaa tgaccccagg taaacatggt 840
actacatttg gtggtaaccc tgttgcttgt gcagccgcta aagcagtctt gtcagtagtt 900
gatgacgcat tttgcgccga agttgctaga aagggtgaat tattcaagga attgttggct 960
aaggttgatg gtgtcgtaga cgtcagaggt agaggtttga tgttaggtgt tgtcttggaa 1020
agagatgtcg caaagcaagc cgtattggac ggttttaaac acggtgttat tttaaatgct 1080
ccagcagata acatcattag attgactcca cctttagtca taacagatga agaaattgcc 1140
gacgctgtta aagcaattgc cgaaacaata gcttaa 1176
<210> 28
<211> 1167
<212> DNA
<213> Corynebacterium glutamicum
<400> 28
atggccgaaa aaggtataac agctccaaaa ggtttcgttg cctctgctac tacagccggt 60
atcaaggctt caggtaatcc agatatggca ttggttgtca accaaggtcc tgaattttct 120
gctgcagccg ttttcactag aaatagagtc tttgctgcac ctgttaaagt ctctagagaa 180
aacgttgctg atggtcaaat tagagctgtc ttgtataatg ctggtaatgc aaacgcctgt 240
aacggtttac aaggtgaaaa ggatgcaaga gaatccgtaa gtcatttggc ccaaaatttg 300
ggtttagaag attccgacat cggtgtttgc agtacaggtt tgattggtga attgttgcca 360
atggataagt tgaacgctgg tatcgaccaa ttgaccgccg aaggtgcttt aggtgacaac 420
ggtgccgctg cagccaaagc tatcatgacc actgataccg ttgacaagga aactgtagtt 480
tttgcagatg gttggacagt aggtggtatg ggtaaaggtg ttggtatgat ggcaccttca 540
ttggccacca tgttagtatg tttaacaacc gatgcctccg ttactcaaga aatggctcaa 600
attgctttgg caaatgccac cgctgtcact ttcgacacat tagatataga cggttctaca 660
tcaaccaacg atactgtttt cttgttagca tctggtgcct caggtatcac tccaacacaa 720
gatgaattga atgacgctgt ttacgctgca tgctctgata ttgccgctaa attacaagca 780
gacgccgaag gtgttacaaa gagagtagca gttaccgtcg taggtactac aaataacgaa 840
caagctatta atgcagccag aacagttgca agagataact tgtttaaatg tgccatgttc 900
ggttctgacc caaattgggg tagagtctta gctgcagttg gtatggctga tgcagacatg 960
gaacctgaaa agatatccgt ctttttcaac ggtcaagctg tatgcttgga tagtactggt 1020
gctcctggtg caagagaagt cgacttgtct ggtgctgata ttgacgttag aatagatttg 1080
ggtacttcag gtgaaggtca agcaacagtt agaaccactg atttgtcctt tagttacgtc 1140
gaaattaatt ccgcttactc ttcataa 1167
<210> 29
<211> 1017
<212> DNA
<213> Saccharomyces cerevisiae
<400> 29
atgtcaacca cagcatccac gccttcatct ttacgtcatt tgatttctat aaaagatctt 60
tctgatgaag aattcagaat cttagtacaa agagctcaac atttcaagaa tgtttttaaa 120
gcaaataaaa cgaatgattt ccaatccaac catctgaaac tattgggtag aactatagcc 180
ttaatattta ctaaaagatc aactagaacg agaatttcga ccgaaggtgc agccaccttc 240
tttggtgccc aaccgatgtt tttaggtaaa gaggatattc agcttggtgt caatgaatca 300
ttttacgata ccaccaaggt tgtatcatct atggtttcat gtatttttgc ccgtgtgaac 360
aaacatgaag acatacttgc tttttgcaag gattcctctg taccgatcat caactctcta 420
tgtgacaaat tccacccttt gcaagcaatt tgtgatcttt taacaataat cgaaaacttc 480
aatatatctc tagatgaagt aaataaggga atcaattcaa aattgaagat ggcatggatt 540
ggtgatgcca ataatgtcat aaatgatatg tgcatcgcat gtctgaaatt cggtataagt 600
gtcagtattt ccactccccc cggtattgaa atggattccg atattgtcga tgaagcaaag 660
aaagttgctg agagaaacgg tgcgacattt gaattaacac acgactcttt aaaggcctcc 720
accaatgcca atatattagt aaccgatact ttcgtttcca tgggtgaaga atttgcgaaa 780
caggccaagc tgaaacaatt caaaggtttt caaatcaatc aagaacttgt ctctgtggct 840
gatccaaact acaaatttat gcattgtctg ccaagacatc aagaagaagt tagtgatgat 900
gtcttttatg gagagcattc catagtcttt gaagaagcag aaaacagatt atatgcagct 960
atgtctgcca ttgatatctt tgttaataat aaaggtaatt tcaaggactt gaaataa 1017
<210> 30
<211> 1275
<212> DNA
<213> Saccharomyces cerevisiae
<400> 30
atgtccgaag ctaccctctc ctccaagcaa accattgaat gggaaaacaa atactccgcc 60
cacaactacc accccttgcc cgtcgttttt cacaaggcta agggcgcaca tgtgtgggac 120
ccggagggta agctgtacct cgacttcctg agcgcttatt ctgccgtcaa ccagggccat 180
tgccatcctc acatcatcaa ggctttgacg gagcaagcac aaacactaac attgtcctcc 240
agagcgttcc acaacgatgt ttacgcgcaa ttcgccaagt tcgtgaccga attcttcggg 300
ttcgaaaccg ttttgcccat gaacaccggt gcagaagccg tggaaactgc tttgaagttg 360
gccagaagat gggggtacat gaagaagaac atccctcaag ataaagccat cattctgggt 420
gccgagggta acttccacgg gagaaccttc ggtgctatca gtttgagtac cgactacgag 480
gactccaagt tgcatttcgg gcctttcgtg cctaacgttg ccagtggtca ctccgtgcac 540
aagatcagat acggccacgc agaagatttc gtccctatct tggaatctcc tgaaggtaag 600
aacgttgccg ccatcattct agagccaatt cagggtgaag ccggtatcgt cgtgcccccc 660
gcagactact tcccaaaggt ctccgcatta tgccgtaagc acaacgtcct attgatcgtt 720
gacgaaattc aaaccggtat cggtagaacc ggtgagttgc tttgctacga ccactacaag 780
gcagaggcca agcctgatat tgttttgtta ggtaaggctc tctcaggtgg tgttcttccc 840
gtctcatgtg ttctgtcttc tcacgacatc atgtcttgct ttaccccagg atctcacggt 900
tctactttcg gcggtaatcc tttggcttcc cgcgttgcca tcgccgccct cgaggtcatc 960
cgcgacgaga agctgtgcca aagagccgcc caactgggta gctctttcat cgcccaattg 1020
aaagctctcc aagccaaatc taacggtata atctctgagg tgcgtggtat gggactgctt 1080
accgccatcg taatcgaccc atccaaggcc aatggtaaga ccgcttggga cttgtgtcta 1140
ttgatgaagg atcacggcct cttggctaag cccacccacg accacatcat cagattggct 1200
cctcctttgg tcatctccga agaggacttg caaaccggtg tcgaaaccat tgccaagtgt 1260
atcgatctgt tataa 1275
<210> 31
<211> 1401
<212> DNA
<213> Saccharomyces cerevisiae
<400> 31
atgtctagta ctcaagtagg aaatgctcta tctagttcca ctactacttt agtggacttg 60
tctaattcta cggttaccca aaagaagcaa tattataaag atggcgagac gctgcacaat 120
cttttgcttg aactaaagaa taaccaagat ttggaacttt taccgcatga acaagcgcat 180
cctaaaatat ttcaagcgct caaggctcgt attggtagaa ttaataatga aacgtgcgac 240
cccggtgagg agaactcgtt tttcatatgc gatttgggag aagtcaagag attattcaac 300
aactgggtga aggagcttcc tagaattaag ccattttatg ccgtcaaatg taatcctgat 360
accaaggttt tgtcattatt agcagagttg ggcgttaatt tcgattgcgc ttccaaagtg 420
gaaattgaca gagtattatc gatgaacatc tcgccggata gaattgttta cgctaatcct 480
tgtaaagtag catctttcat tagatatgca gcttcaaaaa atgtaatgaa gtctactttt 540
gacaatgtag aagaattgca taaaatcaaa aagtttcatc ctgagtctca gttgttatta 600
agaatcgcta ccgatgactc taccgctcaa tgtcgacttt ccaccaaata tggctgtgaa 660
atggaaaacg tagacgtttt attaaaggct ataaaggaac taggtttaaa cctggctggt 720
gtttctttcc acgtcggttc aggcgcttct gattttacaa gcttatacaa agccgttaga 780
gatgcaagaa cggtatttga caaagctgct aacgaatacg ggttgccccc tttgaagatt 840
ttggatgtag gtggtggatt tcaatttgaa tccttcaaag aatcaactgc tgttttgcgt 900
ctagcgctag aggaattttt ccctgtaggt tgtggtgttg atataattgc agagcctggc 960
agatactttg tagctacagc gttcactttg gcatctcatg tgattgcgaa gagaaaactg 1020
tctgagaatg aagcaatgat ttacactaac gatggtgtat acgggaacat gaattgtatt 1080
ttattcgatc atcaagagcc ccatccaaga accctttatc ataatttgga atttcattac 1140
gacgattttg aatccactac tgcggtcctc gactctatca acaaaacaag atctgagtat 1200
ccatataaag tttccatctg gggacccaca tgtgatggtt tggattgtat tgccaaagag 1260
tattacatga agcatgatgt tatagtcggt gattggtttt attttcctgc cctgggtgcc 1320
tacacatcat cggcggctac tcaattcaac ggctttgagc agactgcgga tatagtatac 1380
atagactctg aactcgattg a 1401
<210> 32
<211> 879
<212> DNA
<213> Saccharomyces cerevisiae
<400> 32
atgtatgaag taatacagaa aaggaaaaca aaaataataa acgttttaca gagtcctgaa 60
ctcatgaggc tcatagagga cccatcaaat ctgggtattt ctttacattt tccagtaagt 120
tcactgctaa aaagtaataa gtgcacacca atgcctaaac tttctacgta tagtttggct 180
agtgggggat ttaaggattg gtgcgcggac atccctctag acgttccacc agagattgat 240
atcatcgatt tttactggga tgttatttta tgcatggaat ctcaattcat attagattac 300
aatgttccgt caaaaaataa ggggaacaat cagaagtctg ttgctaagct gttgaaaaat 360
aagcttgtaa acgatatgaa aactacgtta aaaagactaa tttataatga aaataccaag 420
caatataaaa ataataatag ccacgatggt tacaattgga gaaaactagg ctcgcagtat 480
ttcatactgt atcttcccct atttacgcag gaactgattt ggtgtaaact taatgaaaac 540
tatttccatg ttgtattacc atctttactg aatagtagga acgttcatga taaccacagt 600
acctatataa ataaagattg gttacttgcc cttttagagc taacttccaa cctgaaccaa 660
aacttcaaat tcgaatacat gaaattgaga ttgtatattt taagagatga tttaattaat 720
aatggtttgg atcttttgaa aaatcttaac tgggtcggtg ggaaactgat taaaaatgaa 780
gatagagaag tcttgttgaa ctcgaccgat ttagctacgg attctatttc tcatttatta 840
ggtgatgaaa actttgttat tttagagttt gaatgctaa 879
<210> 33
<211> 1191
<212> DNA
<213> Saccharomyces cerevisiae
<400> 33
atgactgtca ccataaaaga attgactaac cacaactaca ttgaccacga actatcagcc 60
actttagact caacggatgc gttcgagggt cccgagaagt tgctggaaat ctggttcttc 120
cctcacaaga agtccatcac gaccgaaaag acattaagaa atattggcat ggatagatgg 180
atcgagattt tgaaattagt gaaatgcgaa gttctttcca tgaagaagac taaagaactg 240
gatgcctttt tgttgagtga gtcttccctc ttcgtcttcg atcacaaatt gacgatgaag 300
acgtgcggta ctacaaccac attgttctgt ctcgaaaagc ttttccagat cgttgagcaa 360
gagttatcgt gggctttccg cacaacacaa gggggcaagt acaaaccatt taaagtgttt 420
tattctagac gatgtttcct tttcccctgt aagcaagccg ctatccatca aaactgggct 480
gacgaagtcg actatttgaa caaatttttc gacaatggta aaagttattc cgtgggaaga 540
aatgacaaga gcaaccactg gaacctgtac gtcaccgaga cggaccgctc cacacctaag 600
ggaaaggagt acatcgagga tgacgacgaa actttcgaag tactgatgac ggagctggac 660
ccagaatgcg ctagtaagtt tgtttgcggg cctgaggcat ccacaaccgc tctcgtggag 720
ccaaacgaag ataagggcca caacctcggc taccaaatga ctaaaaatac aaggcttgac 780
gaaatatatg tcaactcggc ccaagactcc gatttatcat ttcaccacga tgcatttgcg 840
ttcacgccat gtggatactc atccaatatg attctcgctg aaaaatacta ttacaccctg 900
cacgtgactc cggaaaaggg ttggtcttac gcctctttcg aaagtaacat acccgtattt 960
gacatttccc aagggaagca agacaacttg gacgttcttc tacatattct gaacgttttt 1020
caaccaagag agttctcgat gacctttttt accaaaaatt atcagaacca atccttccaa 1080
aaactactaa gcatcaacga gtcactgccc gactacatca agttagacaa aattgtttat 1140
gatctggacg actaccacct tttctatatg aaattgcaga agaaaatatg a 1191
<210> 34
<211> 882
<212> DNA
<213> Saccharomyces cerevisiae
<400> 34
atggcacaag aaatcactca cccaactatt gtagacggct ggttcagaga aatttctgat 60
accatgtggc caggccaggc catgacttta aaagtggaga aagttttaca ccatgagaag 120
tcaaaatatc aagacgtttt gatcttcaaa tccactacat atggtaatgt tctagtttta 180
gataatgtaa ttcaagccac cgaaagggat gaatttgcct accaagaaat gattgcccat 240
cttgccttga attcccatcc aaatcctaag aaggttcttg ttattggtgg gggtgatggt 300
ggtgttttga gagaggttgt caagcatgat tccgttgagg aagcctggtt atgtgacatt 360
gatgaagctg ttattagact atcaaaggag tacctaccag aaatggctgc ctcttattct 420
cacccaaagg ttaagaccca cattggtgat ggtttccaat ttttaagaga ttaccaaaac 480
acatttgacg taatcattac tgactcttct gacccagaag gtccagctga aacccttttc 540
caaaaggaat atttccaatt gttgaacagt gcgttgacag aaaagggtgt aatcactaca 600
caagcagaaa gtatgtggat tcacttgcca atcattaagg acttaaagaa agcctgttct 660
gaagttttcc cagttgcaga atactctttc gttactattc caacttaccc aactggtacg 720
attggtttta tggtttgctc caaagataaa acttgcaatg tcaagaagcc actacgtgaa 780
atctctgatg agaaggaggc tgaattatac agatactata acaagaaaat tcacgaagct 840
tcctttgttc taccaacctg ggcagccaag gaattaaatt ag 882
<210> 35
<211> 1527
<212> DNA
<213> Saccharomyces cerevisiae
<400> 35
atgaatacag tttcaccagc caaaaaaaag gttattataa ttggtgccgg tattgctggg 60
cttaaagctg catctacgct acaccaaaac ggtattcaag attgtcttgt tcttgaggcc 120
agagatcggg tcggtggtag gttgcaaact gtcacaggct atcaaggtcg gaaatatgat 180
ataggtgcta gctggcacca tgatacgttg acaaaccctt tatttttgga agaggctcaa 240
ctgagtttga atgatgggag aacgaggttt gtttttgatg acgataattt tatttatatc 300
gacgaagaac gtggaagggt agaccatgac aaggaactgc ttcttgaaat tgtggacaat 360
gaaatgagca aattcgcaga gttagaattc catcaacact taggagtttc agattgctcc 420
ttttttcaat tagtaatgaa atacttacta caaagacgcc aatttctcac aaatgaccaa 480
ataagatatt tgccacaact ctgtcgatat ctggaattgt ggcacggctt agattggaag 540
cttttgagtg ccaaggatac atacttcggt caccaaggaa ggaacgcctt tgctttgaac 600
tatgattctg tggttcaaag aattgctcaa agctttcctc aaaattggtt aaagctaagt 660
tgtgaagtga aatcaattac acgagaacct tcaaaaaatg tgacagtgaa ctgtgaagat 720
ggtactgtgt acaatgctga ttatgttatt attacagtac ctcaaagtgt attgaatttg 780
tctgtacaac ctgaaaaaaa tttacgggga agaatagaat ttcaaccacc cttgaaacca 840
gtgattcaag atgcttttga caagatccat tttggagcgc taggtaaagt aatttttgag 900
tttgaagaat gttgttggtc gaacgaaagt tcaaaaattg taactttggc taactctacc 960
aatgaatttg tcgaaatagt acgtaatgcg gaaaatttag atgaattaga ctctatgcta 1020
gaaagggaag attctcaaaa gcatacgagt gttacttgtt ggagccagcc tttatttttc 1080
gtaaatttgt caaaaagcac aggagtagca agctttatga tgttgatgca ggcaccgctt 1140
acaaatcaca tagaatccat tagagaagat aaagagcgtc tttttagttt tttccaacct 1200
gtgctgaaca agattatgaa gtgtctagat tctgaggatg tcatcgacgg aatgaggccg 1260
atagaaaaca ttgcaaacgc taataaacca gtcttaagaa acatcatcgt tagcaactgg 1320
acacgcgatc cttactcacg cggtgcttat tcggcctgtt ttccaggaga tgatccagtt 1380
gatatggttg ttgcaatgtc taatggtcaa gactcccgca taagatttgc aggcgaacat 1440
actatcatgg acggcgccgg ctgtgcctat ggtgcttggg aaagcggaag acgggaggcg 1500
actcgaatct ctgacttact gaaatag 1527
<210> 36
<211> 1014
<212> DNA
<213> Saccharomyces cerevisiae
<400> 36
atgaacagga ttaagaatac attttctgtt gctaagagat taaaactaag caaagttatg 60
acgaactcag aattaccgag catattcgaa ggaactgttg atttagggat tattggtggt 120
acaggtttat ataaccttga ctgtctggag cccatcgctt tgcttccacc catggtaaca 180
ccatggggta ccacatcgtc tcctgtcaca atctctcagt tcgtaggaac taacagccac 240
tttcacgttg cgttcatagc cagacacggt attaaccacg aatacccacc cactaaagtc 300
ccatttagag caaacatggc ggccttaaag aacttaaatt gtaaagccgt tctttctttt 360
agtgccgtgg ggtctttaca accccatata aagcctagag attttgtgtt accacagcaa 420
ataatcgaca gaactaaagg cataagacat tcttcatatt tcaacgatga aggcttggta 480
ggtcacgttg gtttcggaca gccgttctct caaaaattcg cagagtatat ctatcaattc 540
aagaacgaga taacaaatcc tgaatccgaa gaaccgtgcc atttgcatta cgacaaggat 600
atgaccgttg tgtgtatgga aggcccacaa ttctccacgc gcgctgaatc caagatgtac 660
agaatgtttg gtggccatgt tattaacatg agtgttattc cagaagccaa attggcgcgt 720
gagtgtgagc tgccttacca gatgatttgt atgtctaccg attacgacgc atggagagat 780
gaggcagaac ctgttaccgt agaaaccgtt attggtaatt tgacgaataa tgggcgcaat 840
gcaaatattt tagcttctaa gatcatcgtc tcaatggcca aggaaatccc agagttcatg 900
catactggcg atgggctgcg cggttccatc aagaaatcta tctctaccaa accagaggct 960
atgtccaagg aaaccttaga aagactaaga tacttatttc caaactattg gtaa 1014
<210> 37
<211> 1131
<212> DNA
<213> Saccharomyces cerevisiae
<400> 37
atgaccttgg cacccctaga cgcctccaaa gttaagataa ctaccacaca acatgcatct 60
aagccaaaac cgaacagtga gttagtgttt ggcaagagct tcacggacca catgttaact 120
gcggaatgga cagctgaaaa agggtggggt accccagaga ttaaacctta tcaaaatctg 180
tctttagacc cttccgcggt ggttttccat tatgcttttg agctattcga agggatgaag 240
gcttacagaa cggtggacaa caaaattaca atgtttcgtc cagatatgaa tatgaagcgc 300
atgaataagt ctgctcagag aatctgtttg ccaacgttcg acccagaaga gttgattacc 360
ctaattggga aactgatcca gcaagataag tgcttagttc ctgaaggaaa aggttactct 420
ttatatatca ggcctacatt aatcggcact acggccggtt taggggtttc cacgcctgat 480
agagccttgc tatatgtcat ttgctgccct gtgggtcctt attacaaaac tggatttaag 540
gcggtcagac tggaagccac tgattatgcc acaagagctt ggccaggagg ctgtggtgac 600
aagaaactag gtgcaaacta cgccccctgc gtcctgccac aattgcaagc tgcttcaagg 660
ggttaccaac aaaatttatg gctatttggt ccaaataaca acattactga agtcggcacc 720
atgaatgctt ttttcgtgtt taaagatagt aaaacgggca agaaggaact agttactgct 780
ccactagacg gtaccatttt ggaaggtgtt actagggatt ccattttaaa tcttgctaaa 840
gaaagactcg aaccaagtga atggaccatt agtgaacgct acttcactat aggcgaagtt 900
actgagagat ccaagaacgg tgaactactt gaagcctttg gttctggtac tgctgcgatt 960
gtttctccca ttaaggaaat cggctggaaa ggcgaacaaa ttaatattcc gttgttgccc 1020
ggcgaacaaa ccggtccatt ggccaaagaa gttgcacaat ggattaatgg aatccaatat 1080
ggcgagactg agcatggcaa ttggtcaagg gttgttactg atttgaactg a 1131
<210> 38
<211> 564
<212> DNA
<213> Saccharomyces cerevisiae
<400> 38
atgtctatag caagttatgc ccaagagttg aagttggctt tacatcaata tccaaacttc 60
cctagtgaag gcattctctt cgaagatttc ttacccattt tcaggaaccc aggtcttttc 120
cagaagttga tcgatgcttt caaactgcat ttagaagaag cttttccaga agttaaaatt 180
gattatatcg tcgggttgga atcccgtggg ttcttgttcg gaccaacttt agctttggcc 240
ctaggtgttg gtttcgttcc agtcaggaag gcaggtaagc tacctggcga atgttttaag 300
gctacgtacg aaaaggagta cggttctgat ctttttgaga tacagaaaaa cgctattcca 360
gcaggttcca acgttatcat tgttgatgac attattgcca ctggtggttc tgctgctgca 420
gccggcgaat tagttgaaca actcgaagcc aaccttttgg aatataactt tgttatggag 480
ttggatttct tgaaaggcag gagtaagttg aatgctccag tgttcacttt actgaacgct 540
caaaaggaag cgttgaaaaa atga 564
<210> 39
<211> 1491
<212> DNA
<213> Saccharomyces cerevisiae
<400> 39
atgtcaatga gtaatattgt tgtttttgga ggggactcgc accccgagtt agttactaag 60
atctgtgaaa atttggacat tcacccatcg aaagtagaat tagggaagtt ttctaatggg 120
gaaacgaaca ttgctcttcg cgaatctgtt cgtgaaaagg atgtatatat catccagagt 180
ggttgtggcc aggtgaacga cacgttcatg cagttgctga ttttaatcag tgcctgcaag 240
tccgcttctg cctcgagggt tacagccgta atgccatatc tctgctactc gagacagcca 300
gatattccat atactgccaa gggtgctccc ataatttcca agcctaaaga aaactatact 360
tttgaatcgc atccaggcac acccgtgtca tcttctttaa tgacgcaaag accaggtgct 420
gagagctcgt tgaagagttt ggatagtgca atacgatcaa ctatcaactt agaaaatcct 480
caacctatca gaacaccaaa cagcagtgct acggcgaata acaatttcga catcaagaag 540
acgctttctt tttcaagaat tcctatgatt cccggtggta agttacaaaa tacaagcaat 600
agcacggacg ctggtgaatt gttcaacgct caaaatgcag gctataagct atgggtagta 660
caagccggta ctttgattgc tcatttgttg agtgctgcag gtgctgacca tgtgatcaca 720
atggatttgc acgatccaca gttccctggg ttttttgaca ttccagtgga taatctctac 780
tgtaaaccca ttgcacaaaa ctacatccag catcgcattc cagattatca ggatgctgtg 840
atcgtttctc cagatgctgg tggtgcaaag agagctacgg ctattgcaga cgccttggaa 900
ttgtccttcg ccctaattca taaagaaaga agatctcagt tattgaaggg ccctccagat 960
gcgacgttaa cctctggtgg ttcgttacca gtatctccaa ggccattagt tactactttg 1020
gtttcctccc aaaatactac ttcttcaggt gccactgggg ttgcggccct tgaaatgaag 1080
aaaacaactt caacatcttc cacctcgtcg caatcttcta attcgtccaa gttcgttcaa 1140
actaccatgc ttgttggcga tgttagaaac aaggtgtgta ttatagtcga cgacttggtg 1200
gatacttcat acactattac aagagctgcg aaattgttga aggatcaagg atctaccaaa 1260
gtttatgcct taataacgca cggtgttttt tccggtgatg cgctagaaag aatcggccaa 1320
agtagtatag ataagttgat catttctaac acggttcctc aagatagaac actacagtac 1380
ctaggtaagg acagagtgga tgttattgat gtctcctgca taatcggtga agcaattaga 1440
agaatccata acggtgaatc catttctatg ttgttcgagc atggatggta g 1491
<210> 40
<211> 1197
<212> DNA
<213> Leishmania infantum
<400> 40
gttgtttcta gaaaaacaat gtctgttcac tctatcttgt tctcttctga acacgttact 60
gaaggtcacc cagacaagtt gtgtgaccaa gtttctgacg ctgttttgga cgcttgtttg 120
gctggtgacc cattctctaa ggttgcttgt gaatcttgtg ctaagactgg tatggttatg 180
gttttcggtg aaatcactac taaggctgtt ttggactacc aaaagatcgt tagaaacact 240
atcaaggaca tcggtttcga ctctgctgac aagggtttgg actacgaatc ttgtaacgtt 300
ttggttgcta tcgaacaaca atctccagac atctgtcaag gtttgggtaa cttcgactct 360
gaagacttgg gtgctggtga ccaaggtatg atgttcggtt acgctactga cgaaactgaa 420
actttgatgc cattgactta cgaattggct agaggtttgg ctaagaagta ctctgaattg 480
agaagagacg gttctttgga atgggctaga ccagacgcta agactcaagt tactgttgaa 540
tacgactacg acactagaga aggtaagcaa gttttgactc caaagagagt tgctgttgtt 600
ttgatctctg ctcaacacga cgaacacgtt actaacgaca agatctctgt tgacttgatg 660
gaaaaggtta tcaaggctgt tatcccagct aacatgttgg acgctgaaac taagtactgg 720
ttgaacccat ctggtagatt cgttagaggt ggtccacacg gtgacgctgg tttgactggt 780
agaaagatca tcgttgacac ttacggtggt tggggtgctc acggtggtgg tgctttctct 840
ggtaaggacc catctaaggt tgacagatct gctgcttacg ctgctagatg gatcgctaag 900
tctatcgttg ctggtggttt ggctagaaga tgtttggttc aattggctta cgctatcggt 960
gttgctgaac cattgtctat gcacgttgaa acttacggta ctggtaagta cgacgacgct 1020
aagttgttgg aaatcgttaa gcaaaacttc aagttgagac catacgacat catccaagaa 1080
ttgaacttga gaagaccaat ctactacgaa acttctcgtt tcggtcactt cggtagaaag 1140
gacgaattgg gtactggtgg tttcacttgg gaagttccaa agaagatggt tgaataa 1197
<210> 41
<211> 1044
<212> DNA
<213> Saccharomyces cerevisiae
<400> 41
atggtttctg tggagttttt acaggagtta ccaaaatgtg agcatcactt gcatttggaa 60
ggtactctag aacctgacct attgttccca ttagctaaaa gaaacgatat aattctacct 120
gaaggttttc ctaaatcggt cgaggaatta aacgaaaagt ataagaagtt tcgtgatctg 180
caggatttct tagattacta ttatattggt actaatgtct tgattagtga acaagatttc 240
tttgatttgg cgtgggccta ttttaaaaaa gttcacaaac aaggcttggt ccatgctgaa 300
gtgttttacg accctcagtc acatacatct aggggcatct ccatagaaac agtcactaaa 360
ggtttccaaa gagcttgtga caaagccttc tctgaatttg gtattacatc caagctaatt 420
atgtgtctgt taagacacat tgaaccagag gaatgtttga aaactatcga agaagctacc 480
ccatttatta aagatggtac tatctctgcc ttaggattag attctgctga gaaaccattt 540
cccccacatt tatttgttga atgttacgga aaggccgcct cattgaataa agatttaaaa 600
ctaactgcac acgcaggtga agaaggcccc gctcaattcg tctcggatgc tttagacttg 660
ttgcaagtaa caagaatcga tcacggtatc aacagtcaat acgacgagga gttattggat 720
aggttgtcgc gcgaccagac catgctaact atttgtcctc tctccaacgt gaagctacaa 780
gtagtccaat ccgtttcaga gttaccacta caaaagtttc ttgacagaga tgttccattt 840
tctttaaatt ctgatgaccc cgcctatttt ggtggttata tcttagatgt ctacactcaa 900
gtttcgaaag atttcccaca ctgggaccat gaaacatggg gtcgtatcgc taagaacgcc 960
attaaaggtt catggtgtga cgataaaaga aagaacggtt tgttaagtag agtggacgaa 1020
gtagtcacta aatattcgca ttag 1044
<210> 42
<211> 1857
<212> DNA
<213> Saccharomyces cerevisiae
<400> 42
atgccagagt atacgctact ggctgataat ataagggaga atatcgttca tttcgatccg 60
aatggtttgt ttgataactt gcacaccatt gttcatgaag atgacagtca agagaacgag 120
gaggccgagc atttcaatta tgatcaggtg ttggataaat cgttattgtc aagaggttct 180
attgtcggtc tcggtttagg actaatgagt cccgttttag gaatgtgcac tagtatggcc 240
attgggctaa ttaatggtgg tccgttaact ataatgctag gttttttaat cagtggagtg 300
tgtatatggt tttcgtcgct ttctcttggt gagattgttt caaaatttcc gatggaactg 360
catgttggga gtgccatgtt ggccccggag aaattgaaat tagtatgttc gtggtacact 420
ggctggttaa tgctcatagg gaattggact atgagtacca gtattacttt tgcaggcgct 480
caacttacca tttctttgat tctgatgacg aactccaacc taatatccga ggcacacttg 540
attttttaca cagtcattgt attttactta gttgtgactg ttgtaggcct cgtgaatttg 600
aaatttgcaa gatttattga aacaataaac aaagtctgtg tttattggat catatatgcc 660
attatattta ttgatattct tctactagta ttccacaaag gtaaatttcg atctttgaag 720
tacgcgctat ttcactttga taataatcta tcagggtata aaagcgcatt tctttccttc 780
atcattggat tccaacagtc taatttcacg ttacaaggtt tcagtatgtt acctgcttta 840
gctgacgaag tcaaagttcc tgagaaggat attccacgtg gtatgtcgaa tgcggtattg 900
ttatccgcgt tctctggagt catttttctt ataccaataa tgttaatcct gccagataat 960
gatttgcttt ttaccaatca taaggttcta ccaatagtga acatttttac aaaatcgact 1020
gattcggtgg tcttgtcttt ttttttagtg ctcctaattt taggaaactt actgttttcc 1080
ggaattggct cgattactac atcttctcgt gcggtatata gttttagtcg tgaccaggct 1140
ataccatact acgataaatg gacctacgtc gaaccggatt ctcagtcaaa agtccccaag 1200
aattctgttg tattgagtat gataatatca tactttttag gtctgctagc tttgatttca 1260
acggccgcat ttaatgcttt tataggcgct gcagtgctct gtctttgttc tgcgactttc 1320
attccgttag tcttggtgct gtttacgaga agaagagcta tccgaagcgc gccagtaaaa 1380
atcaggtata agtttggttg gttcatcaac attgtttcta ttgtgtggct cttgttatct 1440
atggtttctg tttgcctacc aacgcaagtg cctgtaactt tcaaaacaat gaattatgct 1500
ttaatggtgt acgtattctg cattttagtt atcactggtc tttatttcaa atgggggaag 1560
tataatttta gattaccctt ggcagatgac atcaaggctc caattcccag tgatgcggaa 1620
gaaactgttt ttgaactaga ggatagcaat gttgaacata ctctaaactc gggaaccaca 1680
gtgaaagagt ctgtagaaaa taattctgaa gaaggtttca tcaaggtgca tcctaaaagt 1740
agtacagaaa atccctttga ggaaaatgag gaaaacgtga taaccgatta tggtgatgag 1800
caccatacag cagaacaaga atttgatctt gccgatgatc gtagatatga tatatga 1857
<210> 43
<211> 2088
<212> DNA
<213> Saccharomyces cerevisiae
<400> 43
atgactgtca ccataaaaga attgactaac cacaactaca ttgaccacga actatcagcc 60
actttagact caacggatgc gttcgagggt cccgagaagt tgctggaaat ctggttcttc 120
cctcacaaga agtccatcac gaccgaaaag acattaagaa atattggcat ggatagatgg 180
atcgagattt tgaaattagt gaaatgcgaa gttctttcca tgaagaagac taaagaactg 240
gatgcctttt tgttgagtga gtcttccctc ttcgtcttcg atcacaaatt gacgatgaag 300
acgtgcggta ctacaaccac attgttctgt ctcgaaaagc ttttccagat cgttgagcaa 360
gagttatcgt gggctttccg cacaacacaa gggggcaagt acaaaccatt taaagtgttt 420
tattctagac gatgtttcct tttcccctgt aagcaagccg ctatccatca aaactgggct 480
gacgaagtcg actatttgaa caaatttttc gacaatggta aaagttattc cgtgggaaga 540
aatgacaaga gcaaccactg gaacctgtac gtcaccgaga cggaccgctc cacacctaag 600
ggaaaggagt acatcgagga tgacgacgaa actttcgaag tactgatgac ggagctggac 660
ccagaatgcg ctagtaagtt tgtttgcggg cctgaggcat ccacaaccgc tctcgtggag 720
ccaaacgaag ataagggcca caacctcggc taccaaatga ctaaaaatac aaggcttgac 780
gaaatatatg tcaactcggc ccaagactcc gatttatcat ttcaccacga tgcatttgcg 840
ttcacgccat gtggatactc atccaatatg attctcgctg aaaaatacta ttacaccctg 900
cacgtgactc cggaaaaggg ttggtcttac gcctctttcg aaagtaacat acccgtattt 960
gacatttccc aagggaagca agacaacttg gacgttcttc tacatattct gaacgttttt 1020
caaccaagag agttctcgat gacctttttt accaaaaatt atcagaacca atccttccaa 1080
aaactactaa gcatcaacga gtcactgccc gactacatca agttagacaa aattgtttat 1140
gatctggacg actaccacct tttctatatg aaattgcaga agaaaatagg atctggttct 1200
ggttctatgg cacaagaaat cactcaccca actattgtag acggctggtt cagagaaatt 1260
tctgatacca tgtggccagg ccaggccatg actttaaaag tggagaaagt tttacaccat 1320
gagaagtcaa aatatcaaga cgttttgatc ttcaaatcca ctacatatgg taatgttcta 1380
gttttagata atgtaattca agccaccgaa agggatgaat ttgcctacca agaaatgatt 1440
gcccatcttg ccttgaattc ccatccaaat cctaagaagg ttcttgttat tggtgggggt 1500
gatggtggtg ttttgagaga ggttgtcaag catgattccg ttgaggaagc ctggttatgt 1560
gacattgatg aagctgttat tagactatca aaggagtacc taccagaaat ggctgcctct 1620
tattctcacc caaaggttaa gacccacatt ggtgatggtt tccaattttt aagagattac 1680
caaaacacat ttgacgtaat cattactgac tcttctgacc cagaaggtcc agctgaaacc 1740
cttttccaaa aggaatattt ccaattgttg aacagtgcgt tgacagaaaa gggtgtaatc 1800
actacacaag cagaaagtat gtggattcac ttgccaatca ttaaggactt aaagaaagcc 1860
tgttctgaag ttttcccagt tgcagaatac tctttcgtta ctattccaac ttacccaact 1920
ggtacgattg gttttatggt ttgctccaaa gataaaactt gcaatgtcaa gaagccacta 1980
cgtgaaatct ctgatgagaa ggaggctgaa ttatacagat actataacaa gaaaattcac 2040
gaagcttcct ttgttctacc aacctgggca gccaaggaat taaattag 2088
<210> 44
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 44
gtatgaagta atacagaaaa ggaaaac 27
<210> 45
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 45
gacctgcagc gtacgaagct tcagcaatct ctggtggaac gtctag 46
<210> 46
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 46
ctgaagcttc gtacgctgca ggtc 24
<210> 47
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 47
ggccactagt ggatctgata tcac 24
<210> 48
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 48
gtgatatcag atccactagt ggcccctgaa ccaaaacttc aaattcgaat ac 52
<210> 49
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 49
gcattcaaac tctaaaataa caaag 25
<210> 50
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 50
gtgatatcag atccactagt ggccatagct tcaaaatgtt tctactcc 48
<210> 51
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 51
tttgtaatta aaacttagat tagattgc 28
<210> 52
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 52
gcaatctaat ctaagtttta attacaaaat gtctagtact caagtaggaa atgc 54
<210> 53
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 53
gtgctagtgt ctcccgtctt ctgttcaatc gagttcagag tctatgtata c 51
<210> 54
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 54
acagaagacg ggagacacta gcac 24
<210> 55
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 55
attttcaaca tcgtattttc cgaagc 26
<210> 56
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 56
gcttcggaaa atacgatgtt gaaaatcctg aaccaaaact tcaaattcga atac 54
<210> 57
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 57
gtgatatcag atccactagt ggcctgccgt aaaccactaa atcggaaccc 50
<210> 58
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 58
tagggcccac aagcttacgc gtcgac 26
<210> 59
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 59
gtcgacgcgt aagcttgtgg gccctactaa tttaattcct tggctgccca g 51
<210> 60
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 60
ctacttttta caacaaatat aacaaaatgg cacaagaaat cactcaccca ac 52
<210> 61
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 61
tttgttatat ttgttgtaaa aagtag 26
<210> 62
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 62
acgcacagat attataacat ctgcac 26
<210> 63
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 63
gtgcagatgt tataatatct gtgcgtatag cttcaaaatg tttctactcc 50
<210> 64
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 64
cttcggaaaa tacgatgttg aaaatgttac tccgcaacgc ttttctgaac g 51
<210> 65
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 65
taaagtaaga gcgctacatt ggtctacc 28
<210> 66
<211> 56
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 66
ggtagaccaa tgtagcgctc ttactttatc atattttctt ctgcaatttc atatag 56
<210> 67
<211> 56
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 67
gtttcgaata aacacacata aacaaacaaa atgactgtca ccataaaaga attgac 56
<210> 68
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 68
tttgtttgtt tatgtgtgtt tattcgaaac 30
<210> 69
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 69
tcgagtttat cattatcaat actgcc 26
<210> 70
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 70
ggcagtattg ataatgataa actcgacctg aaccaaaact tcaaattcga atac 54
<210> 71
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 71
ggcagtattg ataatgataa actcgagttt aaagattacg gatatttaac ttac 54
<210> 72
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 72
ttttagttta tgtatgtgtt ttttgtagtt atag 34
<210> 73
<211> 61
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 73
ctataactac aaaaaacaca tacataaact aaaaatggtt aataattcac agcatcctta 60
c 61
<210> 74
<211> 53
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 74
gactaataat tcttagttaa aagcacttca ttcattaatg accttgtctg ccc 53
<210> 75
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 75
agtgctttta actaagaatt attagtc 27
<210> 76
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 76
aggtatcatc tccatctccc atatgc 26
<210> 77
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 77
gcatatggga gatggagatg atacctcctg aaccaaaact tcaaattcga atac 54
<210> 78
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 78
cgtcctctcg aaaggtggtt taaagattac ggatatttaa cttac 45
<210> 79
<211> 56
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 79
ctacaaaaaa cacatacata aactaaaaat gaacaggatt aagaatacat tttctg 56
<210> 80
<211> 53
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 80
ggtcgacgcg taagcttgtg ggccctatta ccaatagttt ggaaataagt atc 53
<210> 81
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 81
caggtggtca tggccctttg ccgtaaacca ctaaatcg 38
<210> 82
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 82
ctacaaaaaa cacatacata aactaaaaat gaccttggca cccctagac 49
<210> 83
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 83
ggtcgacgcg taagcttgtg ggccctatca gttcaaatca gtaacaacc 49
<210> 84
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 84
cattaaaaaa ctatatcaat taatttgaat taacttacca atagtttgga aataagtatc 60
<210> 85
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 85
catgactcga ggtcgacggt atctcagttc aaatcagtaa caacccttg 49
<210> 86
<211> 55
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 86
gtaattatct actttttaca acaaatataa caaaatgacc ttggcacccc tagac 55
<210> 87
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 87
caggtggtca tggccctttt tgtaattaaa acttagatta gattgc 46
<210> 88
<211> 58
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 88
gcaatctaat ctaagtttta attacaaaat gtccaagagc aaaactttct tatttacc 58
<210> 89
<211> 53
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 89
ctaaatcatt aaagtaactt aaggagttaa atttaaaatt ccaatttctt tgg 53
<210> 90
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 90
atttaactcc ttaagttact ttaatgattt ag 32
<210> 91
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 91
caggtggtca tggcccttgc gaatttctta tgatttatg 39
<210> 92
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 92
gcgaatttct tatgatttat g 21
<210> 93
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 93
cataaatcat aagaaattcg ctcatttttt caacgcttcc ttttgagc 48
<210> 94
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 94
cgaataaaca cacataaaca aacaaaatgt ctatagcaag ttatgcccaa g 51
<210> 95
<211> 47
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 95
caggtggtca tggccctttt tttgattaaa attaaaaaaa ctttttg 47
<210> 96
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 96
tttttgatta aaattaaaaa aactttttg 29
<210> 97
<211> 58
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 97
caaaaagttt ttttaatttt aatcaaaaaa tgtcaatgag taatattgtt gtttttgg 58
<210> 98
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 98
cgtcctctcg aaaggtggtt aattcaaatt aattgatata gttttttaat g 51
<210> 99
<211> 81
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 99
aagggccatg accacctgat gcaccaatta ggtaggtctg gctatgtcta tacctctggc 60
aattcgccct atagtgagtc g 81
<210> 100
<211> 87
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 100
cacctttcga gaggacgatg cccgtgtcta aatgattcga ccagcctaag aatgttcaac 60
gagctccagc ttttgttccc tttagtg 87
<210> 101
<211> 47
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 101
gcatcgtcct ctcgaaaggt gtcgagttta tcattatcaa tactgcc 47
<210> 102
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 102
atttaactcc ttaagttact ttaatgattt ag 32
<210> 103
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 103
gcgaatttct tatgatttat g 21
<210> 104
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 104
gattaatata attatataaa aatattatct tcttttc 37
<210> 105
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 105
ctggtttgtt ttacaaccaa aag 23
<210> 106
<211> 47
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 106
aactctttca taaaatggta tctttaactt tttatttaat cgtaatg 47
<210> 107
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 107
aatgacaagt ttcatcatc 19
<210> 108
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 108
gcaatctaat ctaagtttta attacaaagt tactccgcaa cgcttttctg aacg 54
<210> 109
<211> 56
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 109
gcaatctaat ctaagtttta attacaaaat gaacaggatt aagaatacat tttctg 56
<210> 110
<211> 47
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 110
ctagtgtctc ccgtcttctg tttaccaata gtttggaaat aagtatc 47
<210> 111
<211> 55
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 111
ctataactac aaaaaacaca tacataaact aaaaatgacc ttggcacccc tagac 55
<210> 112
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 112
gactaataat tcttagttaa aagcacttca gttcaaatca gtaacaacc 49
<210> 113
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 113
gtcgacgcgt aagcttgtgg gccctatcat gatgctgtaa tagcagaatc 50
<210> 114
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 114
ctacttttta caacaaatat aacaaaatgg aaggtggtgg tgctagaaat g 51
<210> 115
<211> 55
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 115
ctataactac aaaaaacaca tacataaact aaaaatgcca gagtatacgc tactg 55
<210> 116
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 116
gactaataat tcttagttaa aagcacttca tatatcatat ctacgatcat cg 52
<210> 117
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 117
gtgaaggaac aactcgtgtc tc 22
<210> 118
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 118
gaggatacgt acatatgcaa gc 22
<210> 119
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 119
tgccgtaaac cactaaatcg gaacc 25
<210> 120
<211> 70
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 120
tcagacttct taactcctgt aaaaacaaaa aaaaaaaaag gcatagcaat aagctggagc 60
tcatagcttc 70
<210> 121
<211> 81
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 121
gtgcctattg atgatctggc ggaatgtctg ccgtgccata gccatgcctt cacatatagt 60
ccgcaaatta aagccttcga g 81
<210> 122
<211> 81
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 122
actatatgtg aaggcatggc tatggcacgg cagacattcc gccagatcat caataggcac 60
cttcgtacgc tgcaggtcga c 81
<210> 123
<211> 120
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 123
tgcgcatgtt tcggcgttcg aaacttctcc gcagtgaaag ataaatgatc actcatcaaa 60
ttccgtacat gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac 120
<210> 124
<211> 120
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 124
gttgataacg gactagcctt attttaactt gctatttcta gctctaaaac atgtacggaa 60
tttgatgagt gatcatttat ctttcactgc ggagaagttt cgaacgccga aacatgcgca 120
<210> 125
<211> 120
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 125
ataaaatatc aaaacgccga tgagacaggc aggataaagt gacagattca gttatacatt 60
tttattagca ttgatattat tattttaaaa agtctattta cttgtatatt tatccgaata 120
<210> 126
<211> 120
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 126
tattcggata aatatacaag taaatagact ttttaaaata ataatatcaa tgctaataaa 60
aatgtataac tgaatctgtc actttatcct gcctgtctca tcggcgtttt gatattttat 120
<210> 127
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 127
ttttgcaaca tccgggcatg 20
<210> 128
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 128
cggctagctg gtatggatcg 20
<210> 129
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 129
atagcttcaa aatgtttcta ctcc 24
<210> 130
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 130
tgcgacagaa gaaagggaag 20
<210> 131
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 131
cgtctatgag gagactgtta g 21
<210> 132
<211> 43
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 132
ggagtagaaa cattttgaag ctatacgtga ccacttcgag agc 43
<210> 133
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 133
gcaatctaat ctaagtttta attacaaaat gactgtcacc ataaaagaat tg 52
<210> 134
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 134
gtgctagtgt ctcccgtctt ctgttcatat tttcttctgc aatttcatat ag 52
<210> 135
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 135
gcttcggaaa atacgatgtt gaaaatcctg cataatcggc ctcac 45
<210> 136
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 136
ctcgccaagg cattaccatc 20
<210> 137
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 137
gagaacgaga ggacccaac 19
<210> 138
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 138
ggttccgatt tagtggttta cggcaacgtg accacttcga gagc 44
<210> 139
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 139
gtcgacgcgt aagcttgtgg gccctatcat attttcttct gcaatttcat atag 54
<210> 140
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 140
ctacttttta caacaaatat aacaaaatga ctgtcaccat aaaagaattg 50
<210> 141
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 141
ggtagaccaa tgtagcgctc ttactttatc attttttcaa cgcttccttt tg 52
<210> 142
<211> 55
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 142
gtttcgaata aacacacata aacaaacaaa atgtctatag caagttatgc ccaag 55
<210> 143
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 143
ggcagtattg ataatgataa actcgacctg cataatcggc ctcac 45
<210> 144
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 144
gactaataat tcttagttaa aagcactcta ccatccatgc tcgaacaac 49
<210> 145
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 145
gactaataat tcttagttaa aagcactcta ccatccatgc tcgaacaac 49
<210> 146
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 146
gcatatggga gatggagatg atacctcctg cataatcggc ctcac 45
<210> 147
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 147
gggtaccggc cgcaaattaa agccttcgag cgtccc 36
<210> 148
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 148
gtgttcattg tacgtcctag ac 22
<210> 149
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 149
gtgcccaaag ctaagagtc 19
<210> 150
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 150
ctgctcttga atggcgac 18
<210> 151
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 151
gtcgccattc aagagcagca tcgtcctctc gaaaggtg 38
<210> 152
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 152
cgaatcttcc catgcctgca ggtggtcatg gccctt 36
<210> 153
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 153
caggcatggg aagattcg 18
<210> 154
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 154
ctggtgagga tttacggtat g 21
<210> 155
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 155
gtgcgttatc gggttcttac 20
<210> 156
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 156
caggttagtt acttgctcta tg 22
<210> 157
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 157
cagtattgat aatgataaac tcgaaatcag acgcacgctt g 41
<210> 158
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 158
ctttaatttg cggccggtac ccttacgtgg attgagccag 40
<210> 159
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 159
gattgtcata ataggagcta tttg 24
<210> 160
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 160
ccatagtatt actattggtg ttcat 25
<210> 161
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 161
gttatcggtt gtgatattgt tc 22
<210> 162
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 162
ttaagctatt gtttcggcaa tt 22
<210> 163
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 163
cgtgcgauct ctataaaaaa tgtgcgaac 29
<210> 164
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 164
atgacagaut ggtgttgtgg ttctgtg 27
<210> 165
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 165
gagatctttg tgttcggtta c 21
<210> 166
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 166
agtctcgtat gtcggctc 18
<210> 167
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 167
tgtgtccgcg tttctaag 18
<210> 168
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 168
gaggtggtta ttgatcacca g 21
<210> 169
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 169
acgaatcgtt aggcacag 18
<210> 170
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 170
gtgcaatacc aaaatcg 17
<210> 171
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 171
gcagttgttt ggattaaaaa gctgtacg 28
<210> 172
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 172
ccttgtgtca tcatttactc caggc 25
<210> 173
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 173
gtagagtctt agctgcagtt ggtatg 26
<210> 174
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 174
cagggcatta ttactgacgg catg 24
<210> 175
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 175
ctacagcacc tttgaaagaa ggtgtc 26
<210> 176
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 176
gttgatggtg tcgtagacgt cag 23
<210> 177
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 177
ggaacgtgga tttaccccag 20
<210> 178
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 178
gttatcggtt gtgatattgt tcctgc 26
<210> 179
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 179
caaagcgatg ggctccagac 20
<210> 180
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 180
cattccgcag ttaacatgtg gtc 23
<210> 181
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 181
gtgttcattg tacgtcctag actcaaac 28
<210> 182
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 182
cgtgcgttat cgggttctta c 21
<210> 183
<211> 59
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 183
ggaacactgg ggcaataggc tgtcgccatt caagagcagc atcgtcctct cgaaaggtg 59
<210> 184
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 184
ctattgtaat tcaaaaaaaa aaagcgaatc ttcccatgcc tgcaggtggt catggccctt 60
<210> 185
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 185
cttgcataaa ttggtcaatg caag 24
<210> 186
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 186
cgatgacctc ccattgatat ttaag 25
<210> 187
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 187
catcgtcaat ttgtgatcga agac 24
<210> 188
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 188
cattcgccag gtagcttac 19
<210> 189
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 189
tgcattttga gcgttgaaca a 21
<210> 190
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 190
gtgccctgtt ctctgtagtt 20
<210> 191
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 191
atcgggccct ccttactgct ctccttccgt gtaacgcgtt tgccgtaaac cactaaatcg 60
<210> 192
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 192
cgttaagaaa aatttcgaga gagtcgccga tagtagattt tcaacatcgt attttcc 57
<210> 193
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 193
cctccttact gctctccttc cgtgtaacgc gttatagctt caaaatgttt ctactcc 57
<210> 194
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 194
ttatcgagct aactattttc gacacacatg 30
<210> 195
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 195
cgtcgcccag taagtgagac ta 22
<210> 196
<211> 59
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 196
gaaagcatag caatctaatc taagttttaa ttacaaaatg tcaatgagta atattgttg 59
<210> 197
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 197
aagttgtgtg ctagtgtctc ccgtcttctg tctaccatcc atgctcgaac a 51
<210> 198
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 198
ctcgcctagt aaataaacga taaacaaatt tgaagtagta gatacacgta tctcgacatg 60
<210> 199
<211> 59
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 199
gaatgcaaca ccgtagcatg aatcttgaga ttgcatctga taatgggtta gtagtttat 59
<210> 200
<211> 70
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 200
tctccgcagt gaaagataaa tgatcaattt acgaaaaata aaggcgtttt agagctagaa 60
atagcaagtt 70
<210> 201
<211> 70
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 201
aacttgctat ttctagctct aaaacgcctt tatttttcgt aaattgatca tttatctttc 60
actgcggaga 70
<210> 202
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 202
aataaaggca aaaacagtgg tcgtgtgaga aatctatttt ttcgaaatta cttacacttt 60
<210> 203
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 203
aaagtgtaag taatttcgaa aaaatagatt tctcacacga ccactgtttt tgcctttatt 60
<210> 204
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 204
ggtcacccac ccatatacgg 20
<210> 205
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 205
tgtcctccgg ataactgcac 20
<210> 206
<211> 120
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 206
tgcgcatgtt tcggcgttcg aaacttctcc gcagtgaaag ataaatgatc aatttacgaa 60
aaataaaggc gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac 120
<210> 207
<211> 120
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 207
gttgataacg gactagcctt attttaactt gctatttcta gctctaaaac gcctttattt 60
ttcgtaaatt gatcatttat ctttcactgc ggagaagttt cgaacgccga aacatgcgca 120
<210> 208
<211> 120
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 208
tctttttttg ttcccaacaa gaagtgagtt aataaaggca aaaacagtgg tcgtgtgaga 60
aatctatttt ttcgaaatta cttacacttt tgacggctag aaaaggatat acatacatat 120
<210> 209
<211> 120
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 209
atatgtatgt atatcctttt ctagccgtca aaagtgtaag taatttcgaa aaaatagatt 60
tctcacacga ccactgtttt tgcctttatt aactcacttc ttgttgggaa caaaaaaaga 120
<210> 210
<211> 120
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 210
tgcgcatgtt tcggcgttcg aaacttctcc gcagtgaaag ataaatgatc atcttcaaat 60
ccactacata gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac 120
<210> 211
<211> 120
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 211
gttgataacg gactagcctt attttaactt gctatttcta gctctaaaac tatgtagtgg 60
atttgaagat gatcatttat ctttcactgc ggagaagttt cgaacgccga aacatgcgca 120
<210> 212
<211> 120
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 212
ttgtacgctt cacatagtag ttcagtcaag aagagcaaac actaataagc aataaatcta 60
ggagaatata catatatatg catatgtttg tttagctaaa taattttatt gagctttgct 120
<210> 213
<211> 120
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 213
agcaaagctc aataaaatta tttagctaaa caaacatatg catatatatg tatattctcc 60
tagatttatt gcttattagt gtttgctctt cttgactgaa ctactatgtg aagcgtacaa 120
<210> 214
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 214
acaccaatat tctgcacctg c 21
<210> 215
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 215
tgctggagaa gatcgtacgc 20
<210> 216
<211> 120
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 216
tgcgcatgtt tcggcgttcg aaacttctcc gcagtgaaag ataaatgatc ttagtagttt 60
ttggaaggat gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac 120
<210> 217
<211> 120
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 217
gttgataacg gactagcctt attttaactt gctatttcta gctctaaaac atccttccaa 60
aaactactaa gatcatttat ctttcactgc ggagaagttt cgaacgccga aacatgcgca 120
<210> 218
<211> 120
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 218
ttctttttta tattttttag gttttcatat agtgtcttac gcaaataggc ggaccataga 60
aaagccgcca tttgtgtctc ctcatactta catagaatag ccctcttcta ttatccttcg 120
<210> 219
<211> 120
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 219
cgaaggataa tagaagaggg ctattctatg taagtatgag gagacacaaa tggcggcttt 60
tctatggtcc gcctatttgc gtaagacact atatgaaaac ctaaaaaata taaaaaagaa 120
<210> 220
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 220
tacagctcgc tccttgcatc 20
<210> 221
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 221
gcttgcttgg agggcttttc 20
<210> 222
<211> 120
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 222
tgcgcatgtt tcggcgttcg aaacttctcc gcagtgaaag ataaatgatc aagaaccctt 60
tatcataatt gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac 120
<210> 223
<211> 120
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 223
gttgataacg gactagcctt attttaactt gctatttcta gctctaaaac aattatgata 60
aagggttctt gatcatttat ctttcactgc ggagaagttt cgaacgccga aacatgcgca 120
<210> 224
<211> 120
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 224
ttttttgatt gttctacaac tttttcatag taatcaaaac ctttgaattt caaacttact 60
aggatatatt taaccacgac tttcgcaaga gagacggagg gggtgggaaa aggctgaatg 120
<210> 225
<211> 120
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 225
cattcagcct tttcccaccc cctccgtctc tcttgcgaaa gtcgtggtta aatatatcct 60
agtaagtttg aaattcaaag gttttgatta ctatgaaaaa gttgtagaac aatcaaaaaa 120
<210> 226
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 226
tcatccaggt ttcagcacgg 20
<210> 227
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 227
agctcgaaca aggtgtcagg 20
<210> 228
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 228
gattacttac caatgtgcca taaactccgt gcaccaatag cttcaaaatg tttctactcc 60
<210> 229
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 229
cttgggttgt gggcaattgg gtgtactatg aagcattttc aacatcgtat tttccgaagc 60
<210> 230
<211> 47
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 230
gcaatctaat ctaagtttta attacaaaat ggcacaagaa atcactc 47
<210> 231
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 231
gtgctagtgt ctcccgtctt ctgtctaatt taattccttg gctgc 45
<210> 232
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 232
gaccatcact aaagcttctc tctta 25
<210> 233
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 233
ttgagcaatt catcgacaac aagag 25
<210> 234
<211> 43
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 234
agaaccagaa ccagatccta ttttcttctg caatttcata tag 43
<210> 235
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 235
ggatctggtt ctggttctat ggcacaagaa atcactc 37
<210> 236
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 236
agaaccagaa ccagatccat ttaattcctt ggctgc 36
<210> 237
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 237
ggatctggtt ctggttctat gactgtcacc ataaaagaat tg 42
<210> 238
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 238
gattacttac caatgtgcca taaactccgt gcaccatgcc gtaaaccact aaatcggaac 60
<210> 239
<211> 120
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 239
tgcgcatgtt tcggcgttcg aaacttctcc gcagtgaaag ataaatgatc ttcttagatt 60
actattatat gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac 120
<210> 240
<211> 120
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 240
gttgataacg gactagcctt attttaactt gctatttcta gctctaaaac atataatagt 60
aatctaagaa gatcatttat ctttcactgc ggagaagttt cgaacgccga aacatgcgca 120
<210> 241
<211> 120
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 241
atagttattt tgaaataata actaccatta gaactaacaa aagaaaagaa aaaaaaaata 60
taccatttgc aagacattgt ataatatttt tgttgaaagt ctttttcgat tcataagcgc 120
<210> 242
<211> 120
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 242
gcgcttatga atcgaaaaag actttcaaca aaaatattat acaatgtctt gcaaatggta 60
tatttttttt ttcttttctt ttgttagttc taatggtagt tattatttca aaataactat 120
<210> 243
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 243
ctcatcgcat gccaacgaag 20
<210> 244
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 244
gcagcaaagc caacccttac 20
<210> 245
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 245
gcaatctaat ctaagtttta attacaaaat gtctgttcac tctatcttg 49
<210> 246
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 246
gtgctagtgt ctcccgtctt ctgtttattc aaccatcttc tttgg 45
<210> 247
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 247
caatgtagcg ctcttacttt attatttcaa gtccttgaaa ttacc 45
<210> 248
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 248
ctggagctca gtttatcatt at 22
<210> 249
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 249
actatagggc gaattgggta c 21
<210> 250
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 250
ataatgataa actgagctcc agagtctcgt atgtcggctc 40
<210> 251
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 251
gtacccaatt cgccctatag ttgtgtccgc gtttctaag 39
<210> 252
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 252
ggtagaccaa tgtagcgctc ttactttatt attcaaccat cttctttgga ac 52
<210> 253
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 253
gtttcgaata aacacacata aacaaacaaa atgtctgttc actctatctt gt 52
<210> 254
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 254
ctataactac aaaaaacaca tacataaact aaaaatgccg tttggaatag acaacac 57
<210> 255
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 255
gactaataat tcttagttaa aagcacttta ccagacatct tcttggtatc 50
<210> 256
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 256
tggtcacaca acttgtctg 19
<210> 257
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 257
ggtactggtg gtttcacttg 20
<210> 258
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 258
gtagtgatca ttggcttaac g 21
<210> 259
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 259
gttccgattt agtggtttac ggcagtgaca ataaattcaa accggt 46
<210> 260
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 260
gcttcggaaa atacgatgtt gaaaatcaac tcagaagttt gacagc 46
<210> 261
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 261
tcgttagatt ctgtatccct a 21
<210> 262
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 262
ggagtagaaa cattttgaag ctatgtgaca ataaattcaa accggt 46
<210> 263
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 263
atttgtgatc gaagacgaag ag 22
<210> 264
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 264
tcaagaagcc actacgtg 18
<210> 265
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 265
actagaacat taccatatgt agtg 24
<210> 266
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 266
caacttggac gttcttctac 20
Claims (21)
- 적어도 하나의 폴리아민 유사체를 생산할 수 있는, 다음의 효모 세포:
상기 효모 세포는 적어도 하나의 폴리아민 유사체를 생산할 수 있고;
상기 효모 세포는 4-쿠마레이트:CoA 리가제 인코딩 유전자를 포함하고;
상기 효모 세포는 적어도 하나의 폴리아민 N-아실트랜스퍼라제 유전자를 포함하고;
상기 효모 세포는 적어도 하나의 폴리아민 합성효소 인코딩 유전자를 포함하고; 그리고
상기 효모 세포에는 폴리아민 산화효소 인코딩 유전자가 결여되어 있거나, 또는 파괴된 폴리아민 산화효소 인코딩 유전자를 포함한다. - 청구항 1에 있어서, 이때 상기 효모 세포는 4-쿠마레이트:CoA 리가제를 과다발현시키도록 공작된, 효모 세포.
- 청구항 1 또는 2에 있어서, 이때 상기 4-쿠마레이트:CoA 리가제 인코딩 유전자는 아라비도프시스 탈리아나(Arabidopsis thaliana) At4CL1, At4CL2, At4CL3, At4CL4, At4CL5 그리고 4-쿠마레이트:CoA 리가제 At4CL1, At4CL2, At4CL3, At4CL4, 또는 At4CL5중 임의의 하나, 선호적으로 아라비도프시스 탈리아나(Arabidopsis thaliana) At4CL1와 적어도 80% 서열 동일성을 갖는 4-쿠마레이트:CoA 리가제를 인코딩하는 뉴클레오티드 서열로 구성된 군에서 선택된, 효모 세포.
- 청구항 1 ~ 3중 임의의 한 항에 있어서, 이때 상기 효모 세포는 상기 적어도 하나의 폴리아민 N-아실트랜스퍼라제를 과다발현시키도록 공작된, 효모 세포.
- 청구항 1 ~ 4중 임의의 한 항에 있어서, 이때 상기 효모 세포는 스페르미딘 히드록시시나모일 전달효소 인코딩 유전자, 스페르미딘 쿠마로일-CoA 아실트랜스퍼라제 인코딩 유전자 및 푸트레신 히드록시시나모일 전달효소 인코딩 유전자로 구성된 군에서 선택된 적어도 하나의 폴리아민 N-아실트랜스퍼라제 유전자를 포함하는, 효모 세포.
- 청구항 5에 있어서, 이때 상기 스페르미딘 히드록시시나모일 전달효소 인코딩 유전자는아라비도프시스 탈리아나(Arabidopsis thaliana) AtSHT, 니코티아나 아테누아타(Nicotiana attenuata) NaDH29 그리고 스페르미딘 히드록시시나모일 전달효소 AtSHT 또는 스페르미딘 히드록시시나모일 전달효소 NaDH29와 적어도 80% 서열 동일성을 갖는 스페르미딘 히드록시시나모일 전달효소를 인코딩하는 뉴클레오티드 서열로 구성된 군에서 선택된, 효모 세포.
- 청구항 5 또는 6에 있어서, 이때 상기 스페르미딘 쿠마로일-CoA 아실트랜스퍼라제 인코딩 유전자는 아라비도프시스 탈리아나(Arabidopsis thaliana) AtSCT 그리고 스페르미딘 쿠마로일-CoA 아실트랜스퍼라제 AtSCT와 적어도 80% 서열 동일성을 갖는 스페르미딘 쿠마로일-CoA 아실트랜스퍼라제를 인코딩하는 뉴클레오티드 서열로 구성된 군에서 선택된, 효모 세포.
- 청구항 5 ~ 7중 임의의 한 항에 있어서, 이때 상기 푸트레신 히드록시시나모일 전달효소 인코딩 유전자는 니코티아나 아테누아타(Nicotiana attenuata) NaAT1 그리고 푸트레신 히드록시시나모일 전달효소 NaAT1과 적어도 80% 서열 동일성을 갖는 푸트레신 히드록시시나모일 전달효소를 인코딩하는 뉴클레오티드 서열로 구성된 군에서 선택된, 효모 세포.
- 청구항 1 ~ 8중 임의의 한 항에 있어서, 이때 상기 효모 세포는 방향족 유기산, 지방산, 할로겐화된 방향족 유기산, 할로겐화된 지방산 및 이의 조합으로 구성된 군에서 선택된 적어도 하나의 유기산을 생산할 수 있는, 효모 세포.
- 청구항 1 ~ 9중 임의의 한 항에 있어서, 이때 상기 적어도 하나의 폴리아민 유사체는 폴리아민 알칼로이드, 폴리아민-지방산 콘쥬게이트 및 이의 조합으로 구성된 군에서 선택된, 효모 세포.
- 청구항 1 ~ 10중 임의의 한 항에 있어서, 이때 상기 적어도 하나의 폴리아민은 스페르민, 테르모스페르민, sym-호모스페르미딘, 1,3-디아미노프로판, 푸트레신, 카다베린, 아그마틴, 스페르미딘, sym-노르스페르미딘, 노르스페르민 및 이의 조합으로 구성된 군에서 선택된, 효모 세포.
- 청구항 1 ~ 11중 임의의 한 항에 있어서, 이때 상기 효모 세포는 상기 적어도 하나의 폴리아민 합성효소가 과다발현되도록 공작된, 효모 세포.
- 청구항 1 ~ 12중 임의의 한 항에 있어서, 이때 상기 폴리아민 합성효소 인코딩 유전자는 스페르민 합성효소 인코딩 유전자, 테르모스페르민 합성효소 인코딩 유전자 및 호모스페르미딘 합성효소 인코딩 유전자로 구성된 군에서 선택된, 효모 세포.
- 청구항 13에 있어서, 이때 상기 스페르민 합성효소 인코딩 유전자는 사카로미세스 세레비시에(Saccharomyces cerevisiae) SPE4, 아라비도프시스 탈리아나(Arabidopsis thaliana) AtSPMS 그리고 스페르민 합성효소 SPE4 또는 스페르민 합성효소 AtSPMS와 적어도 80% 서열 동일성을 갖는 스페르민 합성효소를 인코드하는 뉴클레오티드 서열로 구성된 군에서 선택된, 효모 세포.
- 청구항 13 또는 14에 있어서, 이때 상기 테르모스페르민 합성효소 인코딩 유전자는아라비도프시스 탈리아나(Arabidopsis thaliana) AtACL5 그리고 테르모스페르민 합성효소 AtACL5와 적어도 80% 서열 동일성을 갖는 테르모스페르민 합성효소를 인코드하는 뉴클레오티드 서열로 구성된 군에서 선택된, 효모 세포.
- 청구항 13 ~ 15, 이때 상기 호모스페르미딘 합성효소 인코딩 유전자는 세네시오 베르날리스(세네시오 바르날리스(Senecio vernalis))SvHSS, 블라스토클로리스 비리디스(Blastochloris viridis) BvHSS 그리고 호모스페르미딘 합성효소 SvHSS 또는 호모스페르미딘 합성효소 BvHSS와 적어도 80% 서열 동일성을 갖는 호모스페르미딘 합성효소를 인코드하는 뉴클레오티드 서열로 구성된 군에서 선택된, 효모 세포.
- 청구항 13 ~ 16중 임의의 한 항에 있어서, 이때 상기 효모 세포는 사카로미세스 세레비시에(Saccharomyces cerevisiae) 세포이며, 폴리아민 산화효소는 FMS1인, 효모 세포.
- 폴리아민 유사체를 생산하는, 다음을 포함하는 방법:
청구항 1 ~ 17중 임의의 한 항에 따른 효모 세포를 이들 효모 세포에 의해 폴리아민 유사체 생산에 적합한 배양 조건 하에서 배양 배지에 배양하고; 그리고
상기 배양 배지 및/또는 상기 효모 세포로부터 폴리아민 유사체를 수거한다. - 청구항 18에 있어서, 이때 상기 효모 세포의 배양은 방향족 유기산, 지방산, 할로겐화된 방향족 유기산, 할로겐화된 지방산 및 이의 조합으로 구성된 군에서 선택된 적어도 하나의 유기산을 포함하는 배양 배지에 청구항 1~17중 임의의 한 항에 따른 효모 세포를 배양하는 것을 포함하는, 방법.
- 청구항 19에 있어서, 상기 적어도 하나의 유기산을 상기 배양 배지에 추가하는 것을 더 포함하는, 방법.
- 청구항 19 또는 20에 있어서, 이때 상기 효모 세포의 배양은 적어도 하나의 유기산을 생산하고, 이들 적어도 하나의 유기산을 이 배양 배지로 방출시킬 수 있는 미생물과 함께, 청구항 1~17중 임의의 한 항에 따른 효모 세포를 공동-배양하는 것을 포함하는, 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
SE1951231-8 | 2019-10-28 | ||
SE1951231 | 2019-10-28 | ||
PCT/EP2020/080137 WO2021083869A1 (en) | 2019-10-28 | 2020-10-27 | Polyamine analog producing yeasts |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20220088728A true KR20220088728A (ko) | 2022-06-28 |
Family
ID=73030123
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020227016456A KR20220088728A (ko) | 2019-10-28 | 2020-10-27 | 폴리아민 유사체를 생산하는 효모 |
Country Status (10)
Country | Link |
---|---|
US (1) | US20240229088A1 (ko) |
EP (1) | EP4051800A1 (ko) |
JP (1) | JP2022553790A (ko) |
KR (1) | KR20220088728A (ko) |
CN (1) | CN114585727A (ko) |
AU (1) | AU2020374405A1 (ko) |
BR (1) | BR112022006275A2 (ko) |
CA (1) | CA3156092A1 (ko) |
MX (1) | MX2022004990A (ko) |
WO (1) | WO2021083869A1 (ko) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114317304B (zh) * | 2021-12-21 | 2024-03-15 | 浙江工业大学 | 酿酒酵母产绿原酸工程菌株的构建方法及其应用 |
CN115820577B (zh) * | 2022-11-29 | 2023-06-20 | 中国科学院华南植物园 | 枸杞4-香豆酸:辅酶a连接酶的编码基因和蛋白的应用 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2012346662B2 (en) * | 2011-11-30 | 2016-07-28 | Danisco Us Inc. | Yeast strains engineered to produce ethanol from acetic acid and glycerol |
WO2016144247A1 (en) | 2015-03-12 | 2016-09-15 | Biopetrolia Ab | L-ornithine production in eukaryotic cells |
US20200270654A1 (en) | 2017-07-14 | 2020-08-27 | Chrysea Limited | Microbial cells for spermidine production |
-
2020
- 2020-10-27 BR BR112022006275A patent/BR112022006275A2/pt unknown
- 2020-10-27 CA CA3156092A patent/CA3156092A1/en active Pending
- 2020-10-27 MX MX2022004990A patent/MX2022004990A/es unknown
- 2020-10-27 WO PCT/EP2020/080137 patent/WO2021083869A1/en unknown
- 2020-10-27 US US17/768,613 patent/US20240229088A1/en active Pending
- 2020-10-27 KR KR1020227016456A patent/KR20220088728A/ko active Search and Examination
- 2020-10-27 AU AU2020374405A patent/AU2020374405A1/en active Pending
- 2020-10-27 CN CN202080075684.5A patent/CN114585727A/zh active Pending
- 2020-10-27 EP EP20797738.0A patent/EP4051800A1/en active Pending
- 2020-10-27 JP JP2022524993A patent/JP2022553790A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
MX2022004990A (es) | 2022-05-13 |
CA3156092A1 (en) | 2021-05-06 |
US20240229088A1 (en) | 2024-07-11 |
EP4051800A1 (en) | 2022-09-07 |
WO2021083869A1 (en) | 2021-05-06 |
CN114585727A (zh) | 2022-06-03 |
BR112022006275A2 (pt) | 2022-06-28 |
AU2020374405A1 (en) | 2022-04-14 |
JP2022553790A (ja) | 2022-12-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Liebergesell et al. | Cloning and nucleotide sequences of genes relevant for biosynthesis of poly (3‐hydroxybutyric acid) in Chromatium vinosum strain D | |
KR101720836B1 (ko) | 피드백 저항성 아세토하이드록시산 신타아제 변이체 및 이를 이용한 l-발린의 생산방법 | |
AU2022203287A1 (en) | Compositions and methods for making benzylisoquinoline alkaloids, morphinan alkaloids, thebaine, and derivatives thereof | |
US8372595B2 (en) | Method for obtaining a microbial strain for production of sphingoid bases | |
KR20180083350A (ko) | 니코틴아미드 리보시드의 미생물학적 제조 | |
JP2016528904A (ja) | アシルアミノ酸を製造するための方法 | |
CN114395496A (zh) | 用于产生丙二酸的重组宿主细胞 | |
JP7143292B2 (ja) | 減少したグルコースデヒドロゲナーゼ活性を有するラムノリピド産生細胞 | |
KR20220088728A (ko) | 폴리아민 유사체를 생산하는 효모 | |
Sato et al. | The genome of Plasmodium falciparum encodes an active δ-aminolevulinic acid dehydratase | |
AU2021201969B2 (en) | Process | |
KR20220012847A (ko) | 재생가능한 공급원으로부터 화학물질의 생산 | |
EP1725663B1 (en) | Gamma-butyrobetaine hydroxylase originated from neurospora crassa | |
US10006060B2 (en) | Selectivity of the production of vanilloids in a recombinant unicellular host | |
CN114616330A (zh) | 用于生产丙二酸的重组宿主细胞 | |
KR20070091134A (ko) | 스핑고이드 염기 또는 그 유도체를 생산하는 미생물 균주 | |
US20180179561A1 (en) | Methods and Compositions For Making Ephedrine and Related Alkaloid Compounds | |
CN115335514A (zh) | 罗汉果甙的生物合成 | |
JP6553963B2 (ja) | 改変スターメレラ属微生物 | |
WO2019243624A1 (en) | Production of benzylisoquinoline alkaloids in recombinant hosts | |
KR20220088729A (ko) | 폴리아민 콘쥬게이트를 생산하는 효모 | |
Wengelnik et al. | Characterisation of the phosphatidylinositol synthase gene of Plasmodium species | |
KR20220152728A (ko) | 3-메틸-2-옥소뷰타노에이트 하이드록시 메틸트랜스퍼라아제의 활성이 강화된 미생물, 및 이의 용도 | |
US20240060097A1 (en) | Bioconversion of ferulic acid to vanillin | |
WO2009006492A2 (en) | Stereoselective resolution of racemic amines |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination |