KR20220118442A - E8,e10-도데카디에닐 코엔자임 a, 코들레몬 및 이의 유도체를 생산하기 위한 효모 세포 및 방법 - Google Patents
E8,e10-도데카디에닐 코엔자임 a, 코들레몬 및 이의 유도체를 생산하기 위한 효모 세포 및 방법 Download PDFInfo
- Publication number
- KR20220118442A KR20220118442A KR1020227022287A KR20227022287A KR20220118442A KR 20220118442 A KR20220118442 A KR 20220118442A KR 1020227022287 A KR1020227022287 A KR 1020227022287A KR 20227022287 A KR20227022287 A KR 20227022287A KR 20220118442 A KR20220118442 A KR 20220118442A
- Authority
- KR
- South Korea
- Prior art keywords
- identity
- seq
- homology
- coa
- fatty acyl
- Prior art date
Links
- 210000005253 yeast cell Anatomy 0.000 title claims abstract description 361
- 238000000034 method Methods 0.000 title claims abstract description 143
- RGJOEKWQDUBAIZ-UHFFFAOYSA-N coenzime A Natural products OC1C(OP(O)(O)=O)C(COP(O)(=O)OP(O)(=O)OCC(C)(C)C(O)C(=O)NCCC(=O)NCCS)OC1N1C2=NC=NC(N)=C2N=C1 RGJOEKWQDUBAIZ-UHFFFAOYSA-N 0.000 title claims abstract description 105
- 239000005516 coenzyme A Substances 0.000 title claims abstract description 105
- 229940093530 coenzyme a Drugs 0.000 title claims abstract description 105
- KDTSHFARGAKYJN-UHFFFAOYSA-N dephosphocoenzyme A Natural products OC1C(O)C(COP(O)(=O)OP(O)(=O)OCC(C)(C)C(O)C(=O)NCCC(=O)NCCS)OC1N1C2=NC=NC(N)=C2N=C1 KDTSHFARGAKYJN-UHFFFAOYSA-N 0.000 title claims abstract description 105
- RGJOEKWQDUBAIZ-IBOSZNHHSA-N CoASH Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCS)O[C@H]1N1C2=NC=NC(N)=C2N=C1 RGJOEKWQDUBAIZ-IBOSZNHHSA-N 0.000 title abstract description 17
- YEQONIQGGSENJQ-UHFFFAOYSA-N 8-dodecen-1-ol Natural products CCCC=CCCCCCCCO YEQONIQGGSENJQ-UHFFFAOYSA-N 0.000 claims abstract description 147
- 238000004519 manufacturing process Methods 0.000 claims abstract description 59
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 claims abstract description 16
- 230000035772 mutation Effects 0.000 claims description 174
- 150000002185 fatty acyl-CoAs Chemical class 0.000 claims description 167
- -1 10-dodecadienyl coenzyme A Chemical compound 0.000 claims description 140
- 108020002982 thioesterase Proteins 0.000 claims description 129
- 102000005488 Thioesterase Human genes 0.000 claims description 115
- 230000000694 effects Effects 0.000 claims description 115
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical group [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 claims description 103
- 150000002191 fatty alcohols Chemical class 0.000 claims description 89
- 108090000623 proteins and genes Proteins 0.000 claims description 89
- 230000014509 gene expression Effects 0.000 claims description 82
- 241000235015 Yarrowia lipolytica Species 0.000 claims description 80
- 210000004027 cell Anatomy 0.000 claims description 75
- GCDYLZZUGXEBNL-AATRIKPKSA-N (9E)-dodeca-9,11-dien-3-one Chemical compound CCC(=O)CCCCC\C=C\C=C GCDYLZZUGXEBNL-AATRIKPKSA-N 0.000 claims description 73
- SMHNOFQLRMYVIB-VOTSOKGWSA-N [(9E)-dodeca-9,11-dien-3-yl] acetate Chemical compound CC(=O)OC(CC)CCCCC\C=C\C=C SMHNOFQLRMYVIB-VOTSOKGWSA-N 0.000 claims description 68
- 102000004190 Enzymes Human genes 0.000 claims description 62
- 108090000790 Enzymes Proteins 0.000 claims description 62
- 150000002190 fatty acyls Chemical group 0.000 claims description 60
- 102100031655 Cytochrome b5 Human genes 0.000 claims description 59
- 108010007167 Cytochromes b5 Proteins 0.000 claims description 59
- 108090001018 hexadecanal dehydrogenase (acylating) Proteins 0.000 claims description 58
- 102100033149 Cytochrome b5 reductase 4 Human genes 0.000 claims description 57
- 108030005700 Cytochrome-b5 reductases Proteins 0.000 claims description 57
- 102000005970 fatty acyl-CoA reductase Human genes 0.000 claims description 57
- 239000000203 mixture Substances 0.000 claims description 57
- 108010054147 Hemoglobins Proteins 0.000 claims description 56
- 102000001554 Hemoglobins Human genes 0.000 claims description 56
- 230000036961 partial effect Effects 0.000 claims description 56
- 102000004539 Acyl-CoA Oxidase Human genes 0.000 claims description 52
- 108020001558 Acyl-CoA oxidase Proteins 0.000 claims description 52
- 238000006243 chemical reaction Methods 0.000 claims description 51
- 102000004316 Oxidoreductases Human genes 0.000 claims description 50
- 108090000854 Oxidoreductases Proteins 0.000 claims description 49
- 239000003016 pheromone Substances 0.000 claims description 44
- 239000004094 surface-active agent Substances 0.000 claims description 38
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 37
- 238000012217 deletion Methods 0.000 claims description 36
- 230000037430 deletion Effects 0.000 claims description 36
- 150000002632 lipids Chemical class 0.000 claims description 36
- 239000001963 growth medium Substances 0.000 claims description 33
- 235000021588 free fatty acids Nutrition 0.000 claims description 32
- 239000012071 phase Substances 0.000 claims description 29
- 102000005421 acetyltransferase Human genes 0.000 claims description 28
- 108020002494 acetyltransferase Proteins 0.000 claims description 28
- 108030004487 Alcohol-forming fatty acyl-CoA reductases Proteins 0.000 claims description 26
- 240000004808 Saccharomyces cerevisiae Species 0.000 claims description 26
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 claims description 26
- 102100022366 Fatty acyl-CoA reductase 1 Human genes 0.000 claims description 25
- 108020001507 fusion proteins Proteins 0.000 claims description 24
- 102000037865 fusion proteins Human genes 0.000 claims description 24
- 108010025188 Alcohol oxidase Proteins 0.000 claims description 23
- 239000002518 antifoaming agent Substances 0.000 claims description 21
- 239000002609 medium Substances 0.000 claims description 21
- 102000004169 proteins and genes Human genes 0.000 claims description 19
- 230000002829 reductive effect Effects 0.000 claims description 19
- 239000000126 substance Substances 0.000 claims description 19
- 238000000855 fermentation Methods 0.000 claims description 18
- 230000004151 fermentation Effects 0.000 claims description 18
- 241000588724 Escherichia coli Species 0.000 claims description 17
- DSSYKIVIOFKYAU-XCBNKYQSSA-N (R)-camphor Chemical compound C1C[C@@]2(C)C(=O)C[C@@H]1C2(C)C DSSYKIVIOFKYAU-XCBNKYQSSA-N 0.000 claims description 14
- 101000802894 Dendroaspis angusticeps Fasciculin-2 Proteins 0.000 claims description 14
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 claims description 14
- 229920006395 saturated elastomer Polymers 0.000 claims description 14
- 101000802895 Dendroaspis angusticeps Fasciculin-1 Proteins 0.000 claims description 13
- 240000005636 Dryobalanops aromatica Species 0.000 claims description 13
- 239000004721 Polyphenylene oxide Substances 0.000 claims description 13
- AMTWCFIAVKBGOD-UHFFFAOYSA-N dioxosilane;methoxy-dimethyl-trimethylsilyloxysilane Chemical compound O=[Si]=O.CO[Si](C)(C)O[Si](C)(C)C AMTWCFIAVKBGOD-UHFFFAOYSA-N 0.000 claims description 13
- 239000006185 dispersion Substances 0.000 claims description 13
- 239000000839 emulsion Substances 0.000 claims description 13
- 229920000570 polyether Polymers 0.000 claims description 13
- RFVNOJDQRGSOEL-UHFFFAOYSA-N 2-hydroxyethyl octadecanoate Chemical compound CCCCCCCCCCCCCCCCCC(=O)OCCO RFVNOJDQRGSOEL-UHFFFAOYSA-N 0.000 claims description 12
- 102100039239 Amidophosphoribosyltransferase Human genes 0.000 claims description 12
- 108010039224 Amidophosphoribosyltransferase Proteins 0.000 claims description 12
- 239000004698 Polyethylene Substances 0.000 claims description 12
- 239000002202 Polyethylene glycol Substances 0.000 claims description 12
- 229920000573 polyethylene Polymers 0.000 claims description 12
- 229920001223 polyethylene glycol Polymers 0.000 claims description 12
- 229940083037 simethicone Drugs 0.000 claims description 12
- 241000235013 Yarrowia Species 0.000 claims description 11
- 229920001451 polypropylene glycol Polymers 0.000 claims description 11
- 241000255777 Lepidoptera Species 0.000 claims description 9
- 241000235400 Phycomyces Species 0.000 claims description 9
- 241000223252 Rhodotorula Species 0.000 claims description 9
- 241000235070 Saccharomyces Species 0.000 claims description 9
- 101100118655 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) ELO1 gene Proteins 0.000 claims description 9
- 241001527609 Cryptococcus Species 0.000 claims description 8
- 239000007864 aqueous solution Substances 0.000 claims description 8
- 238000004904 shortening Methods 0.000 claims description 8
- 108010021809 Alcohol dehydrogenase Proteins 0.000 claims description 7
- 102000007698 Alcohol dehydrogenase Human genes 0.000 claims description 7
- 241000222120 Candida <Saccharomycetales> Species 0.000 claims description 7
- 241001149698 Lipomyces Species 0.000 claims description 7
- 241000235395 Mucor Species 0.000 claims description 7
- 230000003247 decreasing effect Effects 0.000 claims description 7
- 238000000746 purification Methods 0.000 claims description 7
- 150000003626 triacylglycerols Chemical class 0.000 claims description 7
- 241000588565 Caenorhabditis tropicalis Species 0.000 claims description 6
- 241000235575 Mortierella Species 0.000 claims description 6
- 244000184734 Pyrus japonica Species 0.000 claims description 6
- 241000173901 Ramaria pinicola Species 0.000 claims description 6
- 238000005119 centrifugation Methods 0.000 claims description 6
- 238000004821 distillation Methods 0.000 claims description 6
- 241000221523 Rhodotorula toruloides Species 0.000 claims description 5
- 241000223230 Trichosporon Species 0.000 claims description 5
- 241000134363 Umbelopsis ramanniana Species 0.000 claims description 5
- 241000180122 Umbelopsis vinacea Species 0.000 claims description 5
- 150000001299 aldehydes Chemical class 0.000 claims description 5
- 230000001590 oxidative effect Effects 0.000 claims description 5
- 108010080691 Alcohol O-acetyltransferase Proteins 0.000 claims description 4
- 241000907999 Mortierella alpina Species 0.000 claims description 4
- 241000223253 Rhodotorula glutinis Species 0.000 claims description 4
- 241001149408 Rhodotorula graminis Species 0.000 claims description 4
- 150000002576 ketones Chemical class 0.000 claims description 4
- 238000005191 phase separation Methods 0.000 claims description 4
- 241000235553 Blakeslea trispora Species 0.000 claims description 3
- 241000223233 Cutaneotrichosporon cutaneum Species 0.000 claims description 3
- 241000306281 Mucor ambiguus Species 0.000 claims description 3
- 241000306282 Umbelopsis isabellina Species 0.000 claims description 3
- 239000008346 aqueous phase Substances 0.000 claims description 3
- OAIJSZIZWZSQBC-GYZMGTAESA-N lycopene Chemical compound CC(C)=CCC\C(C)=C\C=C\C(\C)=C\C=C\C(\C)=C\C=C\C=C(/C)\C=C\C=C(/C)\C=C\C=C(/C)CCC=C(C)C OAIJSZIZWZSQBC-GYZMGTAESA-N 0.000 claims description 3
- 241000235548 Blakeslea Species 0.000 claims description 2
- 241000235555 Cunninghamella Species 0.000 claims description 2
- 241001290628 Cunninghamella echinulata Species 0.000 claims description 2
- 241000580885 Cutaneotrichosporon curvatus Species 0.000 claims description 2
- 241000233639 Pythium Species 0.000 claims description 2
- 241001505297 Pythium irregulare Species 0.000 claims description 2
- 241000223254 Rhodotorula mucilaginosa Species 0.000 claims description 2
- 241001149691 Lipomyces starkeyi Species 0.000 claims 2
- 102220490345 S-adenosylhomocysteine hydrolase-like protein 1_S85A_mutation Human genes 0.000 claims 2
- 241001123676 Metschnikowia pulcherrima Species 0.000 claims 1
- 150000007523 nucleic acids Chemical class 0.000 abstract description 124
- 102000039446 nucleic acids Human genes 0.000 abstract description 122
- 108020004707 nucleic acids Proteins 0.000 abstract description 122
- 108091033319 polynucleotide Proteins 0.000 description 118
- 102000040430 polynucleotide Human genes 0.000 description 118
- 239000002157 polynucleotide Substances 0.000 description 118
- 230000004048 modification Effects 0.000 description 49
- 238000012986 modification Methods 0.000 description 49
- 102220561477 Aldehyde dehydrogenase family 16 member A1_S85A_mutation Human genes 0.000 description 38
- 102100030554 Peroxisome biogenesis factor 10 Human genes 0.000 description 34
- 101001126498 Homo sapiens Peroxisome biogenesis factor 10 Proteins 0.000 description 33
- 101100394762 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) HFD1 gene Proteins 0.000 description 33
- 101150035823 FAO1 gene Proteins 0.000 description 32
- 150000001875 compounds Chemical class 0.000 description 30
- 241000607479 Yersinia pestis Species 0.000 description 29
- 239000000047 product Substances 0.000 description 26
- 239000002736 nonionic surfactant Substances 0.000 description 23
- 108020004705 Codon Proteins 0.000 description 22
- 239000013598 vector Substances 0.000 description 22
- 235000014113 dietary fatty acids Nutrition 0.000 description 21
- 229930195729 fatty acid Natural products 0.000 description 21
- 239000000194 fatty acid Substances 0.000 description 21
- 150000004665 fatty acids Chemical class 0.000 description 18
- 150000002192 fatty aldehydes Chemical class 0.000 description 18
- 230000000858 peroxisomal effect Effects 0.000 description 18
- 125000004432 carbon atom Chemical group C* 0.000 description 17
- 235000019387 fatty acid methyl ester Nutrition 0.000 description 17
- 230000002779 inactivation Effects 0.000 description 17
- 102100026608 Aldehyde dehydrogenase family 3 member A2 Human genes 0.000 description 16
- 241001147381 Helicoverpa armigera Species 0.000 description 16
- 108010058996 Long-chain-aldehyde dehydrogenase Proteins 0.000 description 16
- 241000238631 Hexapoda Species 0.000 description 15
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 15
- 235000018102 proteins Nutrition 0.000 description 15
- 241000218473 Agrotis Species 0.000 description 14
- 230000008436 biogenesis Effects 0.000 description 14
- 108010061238 threonyl-glycine Proteins 0.000 description 14
- 108020004414 DNA Proteins 0.000 description 13
- 238000003556 assay Methods 0.000 description 13
- 230000001965 increasing effect Effects 0.000 description 13
- 241000894007 species Species 0.000 description 13
- 102100022089 Acyl-[acyl-carrier-protein] hydrolase Human genes 0.000 description 12
- 108010039731 Fatty Acid Synthases Proteins 0.000 description 12
- 241000880493 Leptailurus serval Species 0.000 description 12
- 241000218475 Agrotis segetum Species 0.000 description 11
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 11
- ZSLZBFCDCINBPY-ZSJPKINUSA-N acetyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 ZSLZBFCDCINBPY-ZSJPKINUSA-N 0.000 description 11
- 229940024606 amino acid Drugs 0.000 description 11
- 235000001014 amino acid Nutrition 0.000 description 11
- 150000001413 amino acids Chemical class 0.000 description 11
- 238000007254 oxidation reaction Methods 0.000 description 11
- 108090000765 processed proteins & peptides Proteins 0.000 description 11
- 241001634817 Cydia Species 0.000 description 10
- 241001635274 Cydia pomonella Species 0.000 description 10
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 10
- 239000013612 plasmid Substances 0.000 description 10
- 238000012360 testing method Methods 0.000 description 10
- 241000196324 Embryophyta Species 0.000 description 9
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 9
- 108010047495 alanylglycine Proteins 0.000 description 9
- 238000002290 gas chromatography-mass spectrometry Methods 0.000 description 9
- 230000002209 hydrophobic effect Effects 0.000 description 9
- 230000005764 inhibitory process Effects 0.000 description 9
- 230000013011 mating Effects 0.000 description 9
- VLKZOEOYAKHREP-UHFFFAOYSA-N n-Hexane Chemical compound CCCCCC VLKZOEOYAKHREP-UHFFFAOYSA-N 0.000 description 9
- 230000003647 oxidation Effects 0.000 description 9
- 239000002243 precursor Substances 0.000 description 9
- 238000011084 recovery Methods 0.000 description 9
- 108010005233 alanylglutamic acid Proteins 0.000 description 8
- 230000015572 biosynthetic process Effects 0.000 description 8
- 230000015556 catabolic process Effects 0.000 description 8
- 238000006731 degradation reaction Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 108010053725 prolylvaline Proteins 0.000 description 8
- 230000009467 reduction Effects 0.000 description 8
- 241000282414 Homo sapiens Species 0.000 description 7
- 108091007187 Reductases Proteins 0.000 description 7
- 241000566589 Tyto alba Species 0.000 description 7
- 125000005233 alkylalcohol group Chemical group 0.000 description 7
- 108010050848 glycylleucine Proteins 0.000 description 7
- 238000004920 integrated pest control Methods 0.000 description 7
- 108010057821 leucylproline Proteins 0.000 description 7
- 108010070643 prolylglutamic acid Proteins 0.000 description 7
- 239000000243 solution Substances 0.000 description 7
- 239000000758 substrate Substances 0.000 description 7
- JBRBACJPBZNFMF-YUMQZZPRSA-N Gly-Ala-Lys Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN JBRBACJPBZNFMF-YUMQZZPRSA-N 0.000 description 6
- 101000611023 Homo sapiens Tumor necrosis factor receptor superfamily member 6 Proteins 0.000 description 6
- 102100040403 Tumor necrosis factor receptor superfamily member 6 Human genes 0.000 description 6
- 108010087924 alanylproline Proteins 0.000 description 6
- 230000000853 biopesticidal effect Effects 0.000 description 6
- 239000000284 extract Substances 0.000 description 6
- 239000000499 gel Substances 0.000 description 6
- 108010078144 glutaminyl-glycine Proteins 0.000 description 6
- 108010040030 histidinoalanine Proteins 0.000 description 6
- 230000010354 integration Effects 0.000 description 6
- 239000007788 liquid Substances 0.000 description 6
- 108010054155 lysyllysine Proteins 0.000 description 6
- UQDUPQYQJKYHQI-UHFFFAOYSA-N methyl laurate Chemical compound CCCCCCCCCCCC(=O)OC UQDUPQYQJKYHQI-UHFFFAOYSA-N 0.000 description 6
- 238000012544 monitoring process Methods 0.000 description 6
- 239000000575 pesticide Substances 0.000 description 6
- 102000004196 processed proteins & peptides Human genes 0.000 description 6
- 108091026890 Coding region Proteins 0.000 description 5
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 5
- 108010065920 Insulin Lispro Proteins 0.000 description 5
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 5
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 5
- LTYOQGRJFJAKNA-KKIMTKSISA-N Malonyl CoA Natural products S(C(=O)CC(=O)O)CCNC(=O)CCNC(=O)[C@@H](O)C(CO[P@](=O)(O[P@](=O)(OC[C@H]1[C@@H](OP(=O)(O)O)[C@@H](O)[C@@H](n2c3ncnc(N)c3nc2)O1)O)O)(C)C LTYOQGRJFJAKNA-KKIMTKSISA-N 0.000 description 5
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 5
- 241000863024 Vitreoscilla stercoraria Species 0.000 description 5
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 5
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 5
- 108010047857 aspartylglycine Proteins 0.000 description 5
- 230000009286 beneficial effect Effects 0.000 description 5
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 5
- POULHZVOKOAJMA-UHFFFAOYSA-N dodecanoic acid Chemical compound CCCCCCCCCCCC(O)=O POULHZVOKOAJMA-UHFFFAOYSA-N 0.000 description 5
- 239000003925 fat Substances 0.000 description 5
- 230000030279 gene silencing Effects 0.000 description 5
- 238000003780 insertion Methods 0.000 description 5
- 230000037431 insertion Effects 0.000 description 5
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 5
- 108010034529 leucyl-lysine Proteins 0.000 description 5
- 108010064235 lysylglycine Proteins 0.000 description 5
- LTYOQGRJFJAKNA-DVVLENMVSA-N malonyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)CC(O)=O)O[C@H]1N1C2=NC=NC(N)=C2N=C1 LTYOQGRJFJAKNA-DVVLENMVSA-N 0.000 description 5
- 229920001184 polypeptide Polymers 0.000 description 5
- 238000002360 preparation method Methods 0.000 description 5
- 108010026333 seryl-proline Proteins 0.000 description 5
- 238000013519 translation Methods 0.000 description 5
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 5
- 102000000452 Acetyl-CoA carboxylase Human genes 0.000 description 4
- 108010016219 Acetyl-CoA carboxylase Proteins 0.000 description 4
- 229920001817 Agar Polymers 0.000 description 4
- HHGYNJRJIINWAK-FXQIFTODSA-N Ala-Ala-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N HHGYNJRJIINWAK-FXQIFTODSA-N 0.000 description 4
- ZIWWTZWAKYBUOB-CIUDSAMLSA-N Ala-Asp-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O ZIWWTZWAKYBUOB-CIUDSAMLSA-N 0.000 description 4
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 4
- 101100225658 Arabidopsis thaliana ELP4 gene Proteins 0.000 description 4
- 241000228212 Aspergillus Species 0.000 description 4
- 108010018763 Biotin carboxylase Proteins 0.000 description 4
- 238000010453 CRISPR/Cas method Methods 0.000 description 4
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 4
- LYCAIKOWRPUZTN-UHFFFAOYSA-N Ethylene glycol Chemical compound OCCO LYCAIKOWRPUZTN-UHFFFAOYSA-N 0.000 description 4
- 108010087894 Fatty acid desaturases Proteins 0.000 description 4
- 241000233866 Fungi Species 0.000 description 4
- WLIPTFCZLHCNFD-LPEHRKFASA-N Glu-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O WLIPTFCZLHCNFD-LPEHRKFASA-N 0.000 description 4
- YKBUCXNNBYZYAY-MNXVOIDGSA-N Glu-Lys-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YKBUCXNNBYZYAY-MNXVOIDGSA-N 0.000 description 4
- YHFPHRUWZMEOIX-CYDGBPFRSA-N Ile-Val-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(=O)O)N YHFPHRUWZMEOIX-CYDGBPFRSA-N 0.000 description 4
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 4
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 4
- NYTDJEZBAAFLLG-IHRRRGAJSA-N Lys-Val-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O NYTDJEZBAAFLLG-IHRRRGAJSA-N 0.000 description 4
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 4
- 108010079364 N-glycylalanine Proteins 0.000 description 4
- PTDAGKJHZBGDKD-OEAJRASXSA-N Phe-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N)O PTDAGKJHZBGDKD-OEAJRASXSA-N 0.000 description 4
- RVGRUAULSDPKGF-UHFFFAOYSA-N Poloxamer Chemical compound C1CO1.CC1CO1 RVGRUAULSDPKGF-UHFFFAOYSA-N 0.000 description 4
- HFNPOYOKIPGAEI-SRVKXCTJSA-N Pro-Leu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 HFNPOYOKIPGAEI-SRVKXCTJSA-N 0.000 description 4
- 108091030071 RNAI Proteins 0.000 description 4
- 244000016016 Rubus hypargyrus var. niveus Species 0.000 description 4
- 230000009471 action Effects 0.000 description 4
- 108010044940 alanylglutamine Proteins 0.000 description 4
- 125000001931 aliphatic group Chemical group 0.000 description 4
- 108010013835 arginine glutamate Proteins 0.000 description 4
- 108010008355 arginyl-glutamine Proteins 0.000 description 4
- 108010077245 asparaginyl-proline Proteins 0.000 description 4
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 4
- 108010038633 aspartylglutamate Proteins 0.000 description 4
- 229910052799 carbon Inorganic materials 0.000 description 4
- 238000010367 cloning Methods 0.000 description 4
- 239000012634 fragment Substances 0.000 description 4
- 230000009368 gene silencing by RNA Effects 0.000 description 4
- 239000011521 glass Substances 0.000 description 4
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 4
- 108010089804 glycyl-threonine Proteins 0.000 description 4
- 108010092114 histidylphenylalanine Proteins 0.000 description 4
- 238000000338 in vitro Methods 0.000 description 4
- 108010009298 lysylglutamic acid Proteins 0.000 description 4
- 244000005700 microbiome Species 0.000 description 4
- 108010012581 phenylalanylglutamate Proteins 0.000 description 4
- 230000001124 posttranscriptional effect Effects 0.000 description 4
- 230000001323 posttranslational effect Effects 0.000 description 4
- 108010090894 prolylleucine Proteins 0.000 description 4
- 230000001105 regulatory effect Effects 0.000 description 4
- 108010071207 serylmethionine Proteins 0.000 description 4
- 238000006467 substitution reaction Methods 0.000 description 4
- 230000037426 transcriptional repression Effects 0.000 description 4
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 3
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 3
- MPLOSMWGDNJSEV-WHFBIAKZSA-N Ala-Gly-Asp Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MPLOSMWGDNJSEV-WHFBIAKZSA-N 0.000 description 3
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 3
- MEFILNJXAVSUTO-JXUBOQSCSA-N Ala-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MEFILNJXAVSUTO-JXUBOQSCSA-N 0.000 description 3
- XHNLCGXYBXNRIS-BJDJZHNGSA-N Ala-Lys-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XHNLCGXYBXNRIS-BJDJZHNGSA-N 0.000 description 3
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 3
- 241000219194 Arabidopsis Species 0.000 description 3
- 241000219195 Arabidopsis thaliana Species 0.000 description 3
- AGVNTAUPLWIQEN-ZPFDUUQYSA-N Arg-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N AGVNTAUPLWIQEN-ZPFDUUQYSA-N 0.000 description 3
- NYDIVDKTULRINZ-AVGNSLFASA-N Arg-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NYDIVDKTULRINZ-AVGNSLFASA-N 0.000 description 3
- ATABBWFGOHKROJ-GUBZILKMSA-N Arg-Pro-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O ATABBWFGOHKROJ-GUBZILKMSA-N 0.000 description 3
- PXLNPFOJZQMXAT-BYULHYEWSA-N Asp-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O PXLNPFOJZQMXAT-BYULHYEWSA-N 0.000 description 3
- 241000219122 Cucurbita Species 0.000 description 3
- 102000018832 Cytochromes Human genes 0.000 description 3
- 108010052832 Cytochromes Proteins 0.000 description 3
- YMWUJEATGCHHMB-UHFFFAOYSA-N Dichloromethane Chemical compound ClCCl YMWUJEATGCHHMB-UHFFFAOYSA-N 0.000 description 3
- QMMFVYPAHWMCMS-UHFFFAOYSA-N Dimethyl sulfide Chemical compound CSC QMMFVYPAHWMCMS-UHFFFAOYSA-N 0.000 description 3
- XEKOWRVHYACXOJ-UHFFFAOYSA-N Ethyl acetate Chemical compound CCOC(C)=O XEKOWRVHYACXOJ-UHFFFAOYSA-N 0.000 description 3
- 102100034543 Fatty acid desaturase 3 Human genes 0.000 description 3
- JRCUFCXYZLPSDZ-ACZMJKKPSA-N Glu-Asp-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O JRCUFCXYZLPSDZ-ACZMJKKPSA-N 0.000 description 3
- DVLZZEPUNFEUBW-AVGNSLFASA-N Glu-His-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N DVLZZEPUNFEUBW-AVGNSLFASA-N 0.000 description 3
- QXDXIXFSFHUYAX-MNXVOIDGSA-N Glu-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O QXDXIXFSFHUYAX-MNXVOIDGSA-N 0.000 description 3
- QRWPTXLWHHTOCO-DZKIICNBSA-N Glu-Val-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QRWPTXLWHHTOCO-DZKIICNBSA-N 0.000 description 3
- SOYWRINXUSUWEQ-DLOVCJGASA-N Glu-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O SOYWRINXUSUWEQ-DLOVCJGASA-N 0.000 description 3
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 3
- FZQLXNIMCPJVJE-YUMQZZPRSA-N Gly-Asp-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O FZQLXNIMCPJVJE-YUMQZZPRSA-N 0.000 description 3
- LPCKHUXOGVNZRS-YUMQZZPRSA-N Gly-His-Ser Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O LPCKHUXOGVNZRS-YUMQZZPRSA-N 0.000 description 3
- OQQKUTVULYLCDG-ONGXEEELSA-N Gly-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)CN)C(O)=O OQQKUTVULYLCDG-ONGXEEELSA-N 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- RVKIPWVMZANZLI-UHFFFAOYSA-N H-Lys-Trp-OH Natural products C1=CC=C2C(CC(NC(=O)C(N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-UHFFFAOYSA-N 0.000 description 3
- 241000255990 Helicoverpa Species 0.000 description 3
- 241000282412 Homo Species 0.000 description 3
- CSQNHSGHAPRGPQ-YTFOTSKYSA-N Ile-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(=O)O)N CSQNHSGHAPRGPQ-YTFOTSKYSA-N 0.000 description 3
- RMNMUUCYTMLWNA-ZPFDUUQYSA-N Ile-Lys-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N RMNMUUCYTMLWNA-ZPFDUUQYSA-N 0.000 description 3
- YKZAMJXNJUWFIK-JBDRJPRFSA-N Ile-Ser-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(=O)O)N YKZAMJXNJUWFIK-JBDRJPRFSA-N 0.000 description 3
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 3
- OMHLATXVNQSALM-FQUUOJAGSA-N Leu-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(C)C)N OMHLATXVNQSALM-FQUUOJAGSA-N 0.000 description 3
- LIINDKYIGYTDLG-PPCPHDFISA-N Leu-Ile-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LIINDKYIGYTDLG-PPCPHDFISA-N 0.000 description 3
- SBANPBVRHYIMRR-GARJFASQSA-N Leu-Ser-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N SBANPBVRHYIMRR-GARJFASQSA-N 0.000 description 3
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 3
- VUBIPAHVHMZHCM-KKUMJFAQSA-N Leu-Tyr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 VUBIPAHVHMZHCM-KKUMJFAQSA-N 0.000 description 3
- XZNJZXJZBMBGGS-NHCYSSNCSA-N Leu-Val-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XZNJZXJZBMBGGS-NHCYSSNCSA-N 0.000 description 3
- 108010011449 Long-chain-fatty-acid-CoA ligase Proteins 0.000 description 3
- AIRZWUMAHCDDHR-KKUMJFAQSA-N Lys-Leu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O AIRZWUMAHCDDHR-KKUMJFAQSA-N 0.000 description 3
- 102220471249 M-phase inducer phosphatase 1_S82A_mutation Human genes 0.000 description 3
- ZMXDDKWLCZADIW-UHFFFAOYSA-N N,N-Dimethylformamide Chemical compound CN(C)C=O ZMXDDKWLCZADIW-UHFFFAOYSA-N 0.000 description 3
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 3
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 3
- AUEJLPRZGVVDNU-UHFFFAOYSA-N N-L-tyrosyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 AUEJLPRZGVVDNU-UHFFFAOYSA-N 0.000 description 3
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 3
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 3
- 108010087066 N2-tryptophyllysine Proteins 0.000 description 3
- 239000001888 Peptone Substances 0.000 description 3
- 108010080698 Peptones Proteins 0.000 description 3
- UHRNIXJAGGLKHP-DLOVCJGASA-N Phe-Ala-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O UHRNIXJAGGLKHP-DLOVCJGASA-N 0.000 description 3
- JJHVFCUWLSKADD-ONGXEEELSA-N Phe-Gly-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](C)C(O)=O JJHVFCUWLSKADD-ONGXEEELSA-N 0.000 description 3
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 3
- 241000500437 Plutella xylostella Species 0.000 description 3
- IBGCFJDLCYTKPW-NAKRPEOUSA-N Pro-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 IBGCFJDLCYTKPW-NAKRPEOUSA-N 0.000 description 3
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 3
- GZSZPKSBVAOGIE-CIUDSAMLSA-N Ser-Lys-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O GZSZPKSBVAOGIE-CIUDSAMLSA-N 0.000 description 3
- WUXCHQZLUHBSDJ-LKXGYXEUSA-N Ser-Thr-Asp Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WUXCHQZLUHBSDJ-LKXGYXEUSA-N 0.000 description 3
- 239000000877 Sex Attractant Substances 0.000 description 3
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 3
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 3
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 3
- ZUXQFMVPAYGPFJ-JXUBOQSCSA-N Thr-Ala-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN ZUXQFMVPAYGPFJ-JXUBOQSCSA-N 0.000 description 3
- LVRFMARKDGGZMX-IZPVPAKOSA-N Thr-Tyr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=C(O)C=C1 LVRFMARKDGGZMX-IZPVPAKOSA-N 0.000 description 3
- CCZXBOFIBYQLEV-IHPCNDPISA-N Trp-Leu-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)Cc1c[nH]c2ccccc12)C(O)=O CCZXBOFIBYQLEV-IHPCNDPISA-N 0.000 description 3
- IJGPOONOTBNTFS-GVXVVHGQSA-N Val-Lys-Glu Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O IJGPOONOTBNTFS-GVXVVHGQSA-N 0.000 description 3
- FMQGYTMERWBMSI-HJWJTTGWSA-N Val-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](C(C)C)N FMQGYTMERWBMSI-HJWJTTGWSA-N 0.000 description 3
- 125000002252 acyl group Chemical group 0.000 description 3
- 239000008272 agar Substances 0.000 description 3
- 235000004279 alanine Nutrition 0.000 description 3
- 108010041407 alanylaspartic acid Proteins 0.000 description 3
- 150000001298 alcohols Chemical class 0.000 description 3
- 108010062796 arginyllysine Proteins 0.000 description 3
- 108010092854 aspartyllysine Proteins 0.000 description 3
- 239000003795 chemical substances by application Substances 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 108010073628 glutamyl-valyl-phenylalanine Proteins 0.000 description 3
- 108010049041 glutamylalanine Proteins 0.000 description 3
- 150000002334 glycols Chemical class 0.000 description 3
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 3
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 3
- 108010010147 glycylglutamine Proteins 0.000 description 3
- 108010028295 histidylhistidine Proteins 0.000 description 3
- 230000001939 inductive effect Effects 0.000 description 3
- 108010078274 isoleucylvaline Proteins 0.000 description 3
- YMCXGHLSVALICC-GMHMEAMDSA-N lauroyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)CCCCCCCCCCC)O[C@H]1N1C2=NC=NC(N)=C2N=C1 YMCXGHLSVALICC-GMHMEAMDSA-N 0.000 description 3
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 3
- 108010045397 lysyl-tyrosyl-lysine Proteins 0.000 description 3
- 108010017391 lysylvaline Proteins 0.000 description 3
- 238000001819 mass spectrum Methods 0.000 description 3
- 108010085203 methionylmethionine Proteins 0.000 description 3
- 229930027945 nicotinamide-adenine dinucleotide Natural products 0.000 description 3
- 235000019319 peptone Nutrition 0.000 description 3
- 108010051242 phenylalanylserine Proteins 0.000 description 3
- 229910052698 phosphorus Inorganic materials 0.000 description 3
- 239000011574 phosphorus Substances 0.000 description 3
- 108010029020 prolylglycine Proteins 0.000 description 3
- 108010015796 prolylisoleucine Proteins 0.000 description 3
- 108010048818 seryl-histidine Proteins 0.000 description 3
- 239000007787 solid Substances 0.000 description 3
- 239000002904 solvent Substances 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 108010038745 tryptophylglycine Proteins 0.000 description 3
- 108010005834 tyrosyl-alanyl-glycine Proteins 0.000 description 3
- 108010073969 valyllysine Proteins 0.000 description 3
- 235000015112 vegetable and seed oil Nutrition 0.000 description 3
- 239000008158 vegetable oil Substances 0.000 description 3
- KPDTZVSUQCBOAE-HTFCKZLJSA-N (2s)-2-[[(2s)-1-[(2s)-2-[[(2s)-2-[[(2s)-2-aminopropanoyl]amino]propanoyl]amino]propanoyl]pyrrolidine-2-carbonyl]amino]propanoic acid Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O KPDTZVSUQCBOAE-HTFCKZLJSA-N 0.000 description 2
- AXFMEGAFCUULFV-BLFANLJRSA-N (2s)-2-[[(2s)-1-[(2s,3r)-2-amino-3-methylpentanoyl]pyrrolidine-2-carbonyl]amino]pentanedioic acid Chemical compound CC[C@@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O AXFMEGAFCUULFV-BLFANLJRSA-N 0.000 description 2
- CSWBSLXBXRFNST-MQQKCMAXSA-N (8e,10e)-dodeca-8,10-dien-1-ol Chemical compound C\C=C\C=C\CCCCCCCO CSWBSLXBXRFNST-MQQKCMAXSA-N 0.000 description 2
- 101710120269 Acyl-CoA thioester hydrolase YbgC Proteins 0.000 description 2
- CXRCVCURMBFFOL-FXQIFTODSA-N Ala-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CXRCVCURMBFFOL-FXQIFTODSA-N 0.000 description 2
- TTXMOJWKNRJWQJ-FXQIFTODSA-N Ala-Arg-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N TTXMOJWKNRJWQJ-FXQIFTODSA-N 0.000 description 2
- CSAHOYQKNHGDHX-ACZMJKKPSA-N Ala-Gln-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CSAHOYQKNHGDHX-ACZMJKKPSA-N 0.000 description 2
- FUSPCLTUKXQREV-ACZMJKKPSA-N Ala-Glu-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O FUSPCLTUKXQREV-ACZMJKKPSA-N 0.000 description 2
- OMMDTNGURYRDAC-NRPADANISA-N Ala-Glu-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OMMDTNGURYRDAC-NRPADANISA-N 0.000 description 2
- VGPWRRFOPXVGOH-BYPYZUCNSA-N Ala-Gly-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)NCC(O)=O VGPWRRFOPXVGOH-BYPYZUCNSA-N 0.000 description 2
- BLIMFWGRQKRCGT-YUMQZZPRSA-N Ala-Gly-Lys Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN BLIMFWGRQKRCGT-YUMQZZPRSA-N 0.000 description 2
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 2
- QCTFKEJEIMPOLW-JURCDPSOSA-N Ala-Ile-Phe Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QCTFKEJEIMPOLW-JURCDPSOSA-N 0.000 description 2
- YHKANGMVQWRMAP-DCAQKATOSA-N Ala-Leu-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YHKANGMVQWRMAP-DCAQKATOSA-N 0.000 description 2
- 108010011667 Ala-Phe-Ala Proteins 0.000 description 2
- NCQMBSJGJMYKCK-ZLUOBGJFSA-N Ala-Ser-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O NCQMBSJGJMYKCK-ZLUOBGJFSA-N 0.000 description 2
- WNHNMKOFKCHKKD-BFHQHQDPSA-N Ala-Thr-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O WNHNMKOFKCHKKD-BFHQHQDPSA-N 0.000 description 2
- IETUUAHKCHOQHP-KZVJFYERSA-N Ala-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)[C@@H](C)O)C(O)=O IETUUAHKCHOQHP-KZVJFYERSA-N 0.000 description 2
- IYKVSFNGSWTTNZ-GUBZILKMSA-N Ala-Val-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IYKVSFNGSWTTNZ-GUBZILKMSA-N 0.000 description 2
- PQWTZSNVWSOFFK-FXQIFTODSA-N Arg-Asp-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)CN=C(N)N PQWTZSNVWSOFFK-FXQIFTODSA-N 0.000 description 2
- HKRXJBBCQBAGIM-FXQIFTODSA-N Arg-Asp-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N)CN=C(N)N HKRXJBBCQBAGIM-FXQIFTODSA-N 0.000 description 2
- NKNILFJYKKHBKE-WPRPVWTQSA-N Arg-Gly-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O NKNILFJYKKHBKE-WPRPVWTQSA-N 0.000 description 2
- JEOCWTUOMKEEMF-RHYQMDGZSA-N Arg-Leu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JEOCWTUOMKEEMF-RHYQMDGZSA-N 0.000 description 2
- BSYKSCBTTQKOJG-GUBZILKMSA-N Arg-Pro-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O BSYKSCBTTQKOJG-GUBZILKMSA-N 0.000 description 2
- YNSUUAOAFCVINY-OSUNSFLBSA-N Arg-Thr-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YNSUUAOAFCVINY-OSUNSFLBSA-N 0.000 description 2
- CGWVCWFQGXOUSJ-ULQDDVLXSA-N Arg-Tyr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O CGWVCWFQGXOUSJ-ULQDDVLXSA-N 0.000 description 2
- JJGRJMKUOYXZRA-LPEHRKFASA-N Asn-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)N)N)C(=O)O JJGRJMKUOYXZRA-LPEHRKFASA-N 0.000 description 2
- NCFJQJRLQJEECD-NHCYSSNCSA-N Asn-Leu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O NCFJQJRLQJEECD-NHCYSSNCSA-N 0.000 description 2
- QXOPPIDJKPEKCW-GUBZILKMSA-N Asn-Pro-Arg Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)N)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O QXOPPIDJKPEKCW-GUBZILKMSA-N 0.000 description 2
- UXHYOWXTJLBEPG-GSSVUCPTSA-N Asn-Thr-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UXHYOWXTJLBEPG-GSSVUCPTSA-N 0.000 description 2
- MYRLSKYSMXNLLA-LAEOZQHASA-N Asn-Val-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O MYRLSKYSMXNLLA-LAEOZQHASA-N 0.000 description 2
- WQAOZCVOOYUWKG-LSJOCFKGSA-N Asn-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CC(=O)N)N WQAOZCVOOYUWKG-LSJOCFKGSA-N 0.000 description 2
- XYBJLTKSGFBLCS-QXEWZRGKSA-N Asp-Arg-Val Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CC(O)=O XYBJLTKSGFBLCS-QXEWZRGKSA-N 0.000 description 2
- VILLWIDTHYPSLC-PEFMBERDSA-N Asp-Glu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VILLWIDTHYPSLC-PEFMBERDSA-N 0.000 description 2
- QCVXMEHGFUMKCO-YUMQZZPRSA-N Asp-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O QCVXMEHGFUMKCO-YUMQZZPRSA-N 0.000 description 2
- MFTVXYMXSAQZNL-DJFWLOJKSA-N Asp-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)O)N MFTVXYMXSAQZNL-DJFWLOJKSA-N 0.000 description 2
- YFSLJHLQOALGSY-ZPFDUUQYSA-N Asp-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N YFSLJHLQOALGSY-ZPFDUUQYSA-N 0.000 description 2
- DWOGMPWRQQWPPF-GUBZILKMSA-N Asp-Leu-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O DWOGMPWRQQWPPF-GUBZILKMSA-N 0.000 description 2
- MYOHQBFRJQFIDZ-KKUMJFAQSA-N Asp-Leu-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MYOHQBFRJQFIDZ-KKUMJFAQSA-N 0.000 description 2
- YRZIYQGXTSBRLT-AVGNSLFASA-N Asp-Phe-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O YRZIYQGXTSBRLT-AVGNSLFASA-N 0.000 description 2
- UCHSVZYJKJLPHF-BZSNNMDCSA-N Asp-Phe-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O UCHSVZYJKJLPHF-BZSNNMDCSA-N 0.000 description 2
- YFGUZQQCSDZRBN-DCAQKATOSA-N Asp-Pro-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O YFGUZQQCSDZRBN-DCAQKATOSA-N 0.000 description 2
- 241000351920 Aspergillus nidulans Species 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 101100118654 Caenorhabditis elegans elo-1 gene Proteins 0.000 description 2
- 240000001980 Cucurbita pepo Species 0.000 description 2
- 235000009852 Cucurbita pepo Nutrition 0.000 description 2
- 241000006479 Cyme Species 0.000 description 2
- 102100032052 Elongation of very long chain fatty acids protein 5 Human genes 0.000 description 2
- 108050007807 Elongation of very long chain fatty acids protein 5 Proteins 0.000 description 2
- 241000588722 Escherichia Species 0.000 description 2
- 108700039887 Essential Genes Proteins 0.000 description 2
- 101710172133 Fatty acid synthase 2 Proteins 0.000 description 2
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 2
- HHWQMFIGMMOVFK-WDSKDSINSA-N Gln-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O HHWQMFIGMMOVFK-WDSKDSINSA-N 0.000 description 2
- SHERTACNJPYHAR-ACZMJKKPSA-N Gln-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O SHERTACNJPYHAR-ACZMJKKPSA-N 0.000 description 2
- KZKBJEUWNMQTLV-XDTLVQLUSA-N Gln-Ala-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KZKBJEUWNMQTLV-XDTLVQLUSA-N 0.000 description 2
- PNENQZWRFMUZOM-DCAQKATOSA-N Gln-Glu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O PNENQZWRFMUZOM-DCAQKATOSA-N 0.000 description 2
- FGYPOQPQTUNESW-IUCAKERBSA-N Gln-Gly-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)N)N FGYPOQPQTUNESW-IUCAKERBSA-N 0.000 description 2
- LPIKVBWNNVFHCQ-GUBZILKMSA-N Gln-Ser-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LPIKVBWNNVFHCQ-GUBZILKMSA-N 0.000 description 2
- BBFCMGBMYIAGRS-AUTRQRHGSA-N Gln-Val-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BBFCMGBMYIAGRS-AUTRQRHGSA-N 0.000 description 2
- IRDASPPCLZIERZ-XHNCKOQMSA-N Glu-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N IRDASPPCLZIERZ-XHNCKOQMSA-N 0.000 description 2
- BUZMZDDKFCSKOT-CIUDSAMLSA-N Glu-Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BUZMZDDKFCSKOT-CIUDSAMLSA-N 0.000 description 2
- ZSWGJYOZWBHROQ-RWRJDSDZSA-N Glu-Ile-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZSWGJYOZWBHROQ-RWRJDSDZSA-N 0.000 description 2
- PJBVXVBTTFZPHJ-GUBZILKMSA-N Glu-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N PJBVXVBTTFZPHJ-GUBZILKMSA-N 0.000 description 2
- IRXNJYPKBVERCW-DCAQKATOSA-N Glu-Leu-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IRXNJYPKBVERCW-DCAQKATOSA-N 0.000 description 2
- WNRZUESNGGDCJX-JYJNAYRXSA-N Glu-Leu-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WNRZUESNGGDCJX-JYJNAYRXSA-N 0.000 description 2
- OQXDUSZKISQQSS-GUBZILKMSA-N Glu-Lys-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O OQXDUSZKISQQSS-GUBZILKMSA-N 0.000 description 2
- HRBYTAIBKPNZKQ-AVGNSLFASA-N Glu-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(O)=O HRBYTAIBKPNZKQ-AVGNSLFASA-N 0.000 description 2
- JYXKPJVDCAWMDG-ZPFDUUQYSA-N Glu-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)O)N JYXKPJVDCAWMDG-ZPFDUUQYSA-N 0.000 description 2
- YQAQQKPWFOBSMU-WDCWCFNPSA-N Glu-Thr-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O YQAQQKPWFOBSMU-WDCWCFNPSA-N 0.000 description 2
- XBWMTPAIUQIWKA-BYULHYEWSA-N Gly-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CN XBWMTPAIUQIWKA-BYULHYEWSA-N 0.000 description 2
- XTQFHTHIAKKCTM-YFKPBYRVSA-N Gly-Glu-Gly Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O XTQFHTHIAKKCTM-YFKPBYRVSA-N 0.000 description 2
- UQJNXZSSGQIPIQ-FBCQKBJTSA-N Gly-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)CN UQJNXZSSGQIPIQ-FBCQKBJTSA-N 0.000 description 2
- IUZGUFAJDBHQQV-YUMQZZPRSA-N Gly-Leu-Asn Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IUZGUFAJDBHQQV-YUMQZZPRSA-N 0.000 description 2
- UHPAZODVFFYEEL-QWRGUYRKSA-N Gly-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN UHPAZODVFFYEEL-QWRGUYRKSA-N 0.000 description 2
- UUYBFNKHOCJCHT-VHSXEESVSA-N Gly-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN UUYBFNKHOCJCHT-VHSXEESVSA-N 0.000 description 2
- WDEHMRNSGHVNOH-VHSXEESVSA-N Gly-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)CN)C(=O)O WDEHMRNSGHVNOH-VHSXEESVSA-N 0.000 description 2
- NTBOEZICHOSJEE-YUMQZZPRSA-N Gly-Lys-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NTBOEZICHOSJEE-YUMQZZPRSA-N 0.000 description 2
- FGPLUIQCSKGLTI-WDSKDSINSA-N Gly-Ser-Glu Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O FGPLUIQCSKGLTI-WDSKDSINSA-N 0.000 description 2
- LCRDMSSAKLTKBU-ZDLURKLDSA-N Gly-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN LCRDMSSAKLTKBU-ZDLURKLDSA-N 0.000 description 2
- YXTFLTJYLIAZQG-FJXKBIBVSA-N Gly-Thr-Arg Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YXTFLTJYLIAZQG-FJXKBIBVSA-N 0.000 description 2
- GJHWILMUOANXTG-WPRPVWTQSA-N Gly-Val-Arg Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GJHWILMUOANXTG-WPRPVWTQSA-N 0.000 description 2
- 101710091951 Glycerol-3-phosphate acyltransferase Proteins 0.000 description 2
- 101150009006 HIS3 gene Proteins 0.000 description 2
- 241000256257 Heliothis Species 0.000 description 2
- PGRPSOUCWRBWKZ-DLOVCJGASA-N His-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CN=CN1 PGRPSOUCWRBWKZ-DLOVCJGASA-N 0.000 description 2
- NKVZTQVGUNLLQW-JBDRJPRFSA-N Ile-Ala-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)O)N NKVZTQVGUNLLQW-JBDRJPRFSA-N 0.000 description 2
- VSZALHITQINTGC-GHCJXIJMSA-N Ile-Ala-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VSZALHITQINTGC-GHCJXIJMSA-N 0.000 description 2
- DMHGKBGOUAJRHU-UHFFFAOYSA-N Ile-Arg-Pro Natural products CCC(C)C(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O DMHGKBGOUAJRHU-UHFFFAOYSA-N 0.000 description 2
- UDLAWRKOVFDKFL-PEFMBERDSA-N Ile-Asp-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N UDLAWRKOVFDKFL-PEFMBERDSA-N 0.000 description 2
- BSWLQVGEVFYGIM-ZPFDUUQYSA-N Ile-Gln-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N BSWLQVGEVFYGIM-ZPFDUUQYSA-N 0.000 description 2
- WZDCVAWMBUNDDY-KBIXCLLPSA-N Ile-Glu-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](C)C(=O)O)N WZDCVAWMBUNDDY-KBIXCLLPSA-N 0.000 description 2
- NZOCIWKZUVUNDW-ZKWXMUAHSA-N Ile-Gly-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O NZOCIWKZUVUNDW-ZKWXMUAHSA-N 0.000 description 2
- PDTMWFVVNZYWTR-NHCYSSNCSA-N Ile-Gly-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](CCCCN)C(O)=O PDTMWFVVNZYWTR-NHCYSSNCSA-N 0.000 description 2
- PNTWNAXGBOZMBO-MNXVOIDGSA-N Ile-Lys-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N PNTWNAXGBOZMBO-MNXVOIDGSA-N 0.000 description 2
- ADDYYRVQQZFIMW-MNXVOIDGSA-N Ile-Lys-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ADDYYRVQQZFIMW-MNXVOIDGSA-N 0.000 description 2
- FJWALBCCVIHZBS-QXEWZRGKSA-N Ile-Met-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)NCC(=O)O)N FJWALBCCVIHZBS-QXEWZRGKSA-N 0.000 description 2
- XQLGNKLSPYCRMZ-HJWJTTGWSA-N Ile-Phe-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(=O)O)N XQLGNKLSPYCRMZ-HJWJTTGWSA-N 0.000 description 2
- RQJUKVXWAKJDBW-SVSWQMSJSA-N Ile-Ser-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N RQJUKVXWAKJDBW-SVSWQMSJSA-N 0.000 description 2
- YWCJXQKATPNPOE-UKJIMTQDSA-N Ile-Val-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YWCJXQKATPNPOE-UKJIMTQDSA-N 0.000 description 2
- KXUKTDGKLAOCQK-LSJOCFKGSA-N Ile-Val-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O KXUKTDGKLAOCQK-LSJOCFKGSA-N 0.000 description 2
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 2
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 2
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 2
- 239000005639 Lauric acid Substances 0.000 description 2
- JKGHDYGZRDWHGA-SRVKXCTJSA-N Leu-Asn-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JKGHDYGZRDWHGA-SRVKXCTJSA-N 0.000 description 2
- WGNOPSQMIQERPK-GARJFASQSA-N Leu-Asn-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N WGNOPSQMIQERPK-GARJFASQSA-N 0.000 description 2
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 2
- PVMPDMIKUVNOBD-CIUDSAMLSA-N Leu-Asp-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O PVMPDMIKUVNOBD-CIUDSAMLSA-N 0.000 description 2
- PPBKJAQJAUHZKX-SRVKXCTJSA-N Leu-Cys-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CC(C)C PPBKJAQJAUHZKX-SRVKXCTJSA-N 0.000 description 2
- LOLUPZNNADDTAA-AVGNSLFASA-N Leu-Gln-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LOLUPZNNADDTAA-AVGNSLFASA-N 0.000 description 2
- GPICTNQYKHHHTH-GUBZILKMSA-N Leu-Gln-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O GPICTNQYKHHHTH-GUBZILKMSA-N 0.000 description 2
- NEEOBPIXKWSBRF-IUCAKERBSA-N Leu-Glu-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O NEEOBPIXKWSBRF-IUCAKERBSA-N 0.000 description 2
- IWTBYNQNAPECCS-AVGNSLFASA-N Leu-Glu-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 IWTBYNQNAPECCS-AVGNSLFASA-N 0.000 description 2
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 2
- AUBMZAMQCOYSIC-MNXVOIDGSA-N Leu-Ile-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O AUBMZAMQCOYSIC-MNXVOIDGSA-N 0.000 description 2
- PDQDCFBVYXEFSD-SRVKXCTJSA-N Leu-Leu-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PDQDCFBVYXEFSD-SRVKXCTJSA-N 0.000 description 2
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 2
- ZRHDPZAAWLXXIR-SRVKXCTJSA-N Leu-Lys-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O ZRHDPZAAWLXXIR-SRVKXCTJSA-N 0.000 description 2
- HVHRPWQEQHIQJF-AVGNSLFASA-N Leu-Lys-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HVHRPWQEQHIQJF-AVGNSLFASA-N 0.000 description 2
- LVTJJOJKDCVZGP-QWRGUYRKSA-N Leu-Lys-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LVTJJOJKDCVZGP-QWRGUYRKSA-N 0.000 description 2
- KPYAOIVPJKPIOU-KKUMJFAQSA-N Leu-Lys-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O KPYAOIVPJKPIOU-KKUMJFAQSA-N 0.000 description 2
- QNTJIDXQHWUBKC-BZSNNMDCSA-N Leu-Lys-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QNTJIDXQHWUBKC-BZSNNMDCSA-N 0.000 description 2
- ZAVCJRJOQKIOJW-KKUMJFAQSA-N Leu-Phe-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=CC=C1 ZAVCJRJOQKIOJW-KKUMJFAQSA-N 0.000 description 2
- SYRTUBLKWNDSDK-DKIMLUQUSA-N Leu-Phe-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYRTUBLKWNDSDK-DKIMLUQUSA-N 0.000 description 2
- RRVCZCNFXIFGRA-DCAQKATOSA-N Leu-Pro-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O RRVCZCNFXIFGRA-DCAQKATOSA-N 0.000 description 2
- VULJUQZPSOASBZ-SRVKXCTJSA-N Leu-Pro-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O VULJUQZPSOASBZ-SRVKXCTJSA-N 0.000 description 2
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 2
- JIHDFWWRYHSAQB-GUBZILKMSA-N Leu-Ser-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JIHDFWWRYHSAQB-GUBZILKMSA-N 0.000 description 2
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 2
- AEDWWMMHUGYIFD-HJGDQZAQSA-N Leu-Thr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O AEDWWMMHUGYIFD-HJGDQZAQSA-N 0.000 description 2
- ILDSIMPXNFWKLH-KATARQTJSA-N Leu-Thr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ILDSIMPXNFWKLH-KATARQTJSA-N 0.000 description 2
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 2
- 102100034337 Long-chain-fatty-acid-CoA ligase 6 Human genes 0.000 description 2
- DGWXCIORNLWGGG-CIUDSAMLSA-N Lys-Asn-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O DGWXCIORNLWGGG-CIUDSAMLSA-N 0.000 description 2
- GJJQCBVRWDGLMQ-GUBZILKMSA-N Lys-Glu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O GJJQCBVRWDGLMQ-GUBZILKMSA-N 0.000 description 2
- DUTMKEAPLLUGNO-JYJNAYRXSA-N Lys-Glu-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DUTMKEAPLLUGNO-JYJNAYRXSA-N 0.000 description 2
- KYNNSEJZFVCDIV-ZPFDUUQYSA-N Lys-Ile-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O KYNNSEJZFVCDIV-ZPFDUUQYSA-N 0.000 description 2
- QOJDBRUCOXQSSK-AJNGGQMLSA-N Lys-Ile-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(O)=O QOJDBRUCOXQSSK-AJNGGQMLSA-N 0.000 description 2
- ALGGDNMLQNFVIZ-SRVKXCTJSA-N Lys-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N ALGGDNMLQNFVIZ-SRVKXCTJSA-N 0.000 description 2
- PLDJDCJLRCYPJB-VOAKCMCISA-N Lys-Lys-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PLDJDCJLRCYPJB-VOAKCMCISA-N 0.000 description 2
- BXPHMHQHYHILBB-BZSNNMDCSA-N Lys-Lys-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BXPHMHQHYHILBB-BZSNNMDCSA-N 0.000 description 2
- QQPSCXKFDSORFT-IHRRRGAJSA-N Lys-Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN QQPSCXKFDSORFT-IHRRRGAJSA-N 0.000 description 2
- LNMKRJJLEFASGA-BZSNNMDCSA-N Lys-Phe-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LNMKRJJLEFASGA-BZSNNMDCSA-N 0.000 description 2
- LOGFVTREOLYCPF-RHYQMDGZSA-N Lys-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN LOGFVTREOLYCPF-RHYQMDGZSA-N 0.000 description 2
- MEQLGHAMAUPOSJ-DCAQKATOSA-N Lys-Ser-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O MEQLGHAMAUPOSJ-DCAQKATOSA-N 0.000 description 2
- VHTOGMKQXXJOHG-RHYQMDGZSA-N Lys-Thr-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O VHTOGMKQXXJOHG-RHYQMDGZSA-N 0.000 description 2
- OZVXDDFYCQOPFD-XQQFMLRXSA-N Lys-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N OZVXDDFYCQOPFD-XQQFMLRXSA-N 0.000 description 2
- 244000070406 Malus silvestris Species 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- YCUSPBPZVJDMII-YUMQZZPRSA-N Met-Gly-Glu Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O YCUSPBPZVJDMII-YUMQZZPRSA-N 0.000 description 2
- CHDYFPCQVUOJEB-ULQDDVLXSA-N Met-Leu-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 CHDYFPCQVUOJEB-ULQDDVLXSA-N 0.000 description 2
- LCPUWQLULVXROY-RHYQMDGZSA-N Met-Lys-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LCPUWQLULVXROY-RHYQMDGZSA-N 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 108010066427 N-valyltryptophan Proteins 0.000 description 2
- 108010047562 NGR peptide Proteins 0.000 description 2
- 108091028043 Nucleic acid sequence Proteins 0.000 description 2
- ULECEJGNDHWSKD-QEJZJMRPSA-N Phe-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 ULECEJGNDHWSKD-QEJZJMRPSA-N 0.000 description 2
- XMPUYNHKEPFERE-IHRRRGAJSA-N Phe-Asp-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 XMPUYNHKEPFERE-IHRRRGAJSA-N 0.000 description 2
- CSYVXYQDIVCQNU-QWRGUYRKSA-N Phe-Asp-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O CSYVXYQDIVCQNU-QWRGUYRKSA-N 0.000 description 2
- FZBGMXYQPACKNC-HJWJTTGWSA-N Phe-Pro-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FZBGMXYQPACKNC-HJWJTTGWSA-N 0.000 description 2
- UNBFGVQVQGXXCK-KKUMJFAQSA-N Phe-Ser-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O UNBFGVQVQGXXCK-KKUMJFAQSA-N 0.000 description 2
- VDTYRPWRWRCROL-UFYCRDLUSA-N Phe-Val-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 VDTYRPWRWRCROL-UFYCRDLUSA-N 0.000 description 2
- 241000495716 Platyptilia carduidactyla Species 0.000 description 2
- 229920002257 Plurafac® Polymers 0.000 description 2
- 229920000463 Poly(ethylene glycol)-block-poly(propylene glycol)-block-poly(ethylene glycol) Polymers 0.000 description 2
- APKRGYLBSCWJJP-FXQIFTODSA-N Pro-Ala-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O APKRGYLBSCWJJP-FXQIFTODSA-N 0.000 description 2
- KPDRZQUWJKTMBP-DCAQKATOSA-N Pro-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 KPDRZQUWJKTMBP-DCAQKATOSA-N 0.000 description 2
- HAAQQNHQZBOWFO-LURJTMIESA-N Pro-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H]1CCCN1 HAAQQNHQZBOWFO-LURJTMIESA-N 0.000 description 2
- FEVDNIBDCRKMER-IUCAKERBSA-N Pro-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@@H]1CCCN1 FEVDNIBDCRKMER-IUCAKERBSA-N 0.000 description 2
- FFSLAIOXRMOFIZ-GJZGRUSLSA-N Pro-Gly-Trp Chemical compound N([C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)O)C(=O)CNC(=O)[C@@H]1CCCN1 FFSLAIOXRMOFIZ-GJZGRUSLSA-N 0.000 description 2
- ABSSTGUCBCDKMU-UWVGGRQHSA-N Pro-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H]1CCCN1 ABSSTGUCBCDKMU-UWVGGRQHSA-N 0.000 description 2
- KWMZPPWYBVZIER-XGEHTFHBSA-N Pro-Ser-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWMZPPWYBVZIER-XGEHTFHBSA-N 0.000 description 2
- DCHQYSOGURGJST-FJXKBIBVSA-N Pro-Thr-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O DCHQYSOGURGJST-FJXKBIBVSA-N 0.000 description 2
- XDKKMRPRRCOELJ-GUBZILKMSA-N Pro-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 XDKKMRPRRCOELJ-GUBZILKMSA-N 0.000 description 2
- KHRLUIPIMIQFGT-AVGNSLFASA-N Pro-Val-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHRLUIPIMIQFGT-AVGNSLFASA-N 0.000 description 2
- JUJWROOIHBZHMG-UHFFFAOYSA-N Pyridine Chemical compound C1=CC=NC=C1 JUJWROOIHBZHMG-UHFFFAOYSA-N 0.000 description 2
- 241000220324 Pyrus Species 0.000 description 2
- 241000700159 Rattus Species 0.000 description 2
- 101100394989 Rhodopseudomonas palustris (strain ATCC BAA-98 / CGA009) hisI gene Proteins 0.000 description 2
- HZWAHWQZPSXNCB-BPUTZDHNSA-N Ser-Arg-Trp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O HZWAHWQZPSXNCB-BPUTZDHNSA-N 0.000 description 2
- YMEXHZTVKDAKIY-GHCJXIJMSA-N Ser-Asn-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO)C(O)=O YMEXHZTVKDAKIY-GHCJXIJMSA-N 0.000 description 2
- MMAPOBOTRUVNKJ-ZLUOBGJFSA-N Ser-Asp-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CO)N)C(=O)O MMAPOBOTRUVNKJ-ZLUOBGJFSA-N 0.000 description 2
- LALNXSXEYFUUDD-GUBZILKMSA-N Ser-Glu-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LALNXSXEYFUUDD-GUBZILKMSA-N 0.000 description 2
- XXXAXOWMBOKTRN-XPUUQOCRSA-N Ser-Gly-Val Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXXAXOWMBOKTRN-XPUUQOCRSA-N 0.000 description 2
- UGHCUDLCCVVIJR-VGDYDELISA-N Ser-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CO)N UGHCUDLCCVVIJR-VGDYDELISA-N 0.000 description 2
- BKZYBLLIBOBOOW-GHCJXIJMSA-N Ser-Ile-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O BKZYBLLIBOBOOW-GHCJXIJMSA-N 0.000 description 2
- ZIFYDQAFEMIZII-GUBZILKMSA-N Ser-Leu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZIFYDQAFEMIZII-GUBZILKMSA-N 0.000 description 2
- HEUVHBXOVZONPU-BJDJZHNGSA-N Ser-Leu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HEUVHBXOVZONPU-BJDJZHNGSA-N 0.000 description 2
- JWOBLHJRDADHLN-KKUMJFAQSA-N Ser-Leu-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JWOBLHJRDADHLN-KKUMJFAQSA-N 0.000 description 2
- BUYHXYIUQUBEQP-AVGNSLFASA-N Ser-Phe-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CO)N BUYHXYIUQUBEQP-AVGNSLFASA-N 0.000 description 2
- FBLNYDYPCLFTSP-IXOXFDKPSA-N Ser-Phe-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FBLNYDYPCLFTSP-IXOXFDKPSA-N 0.000 description 2
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 2
- BCAVNDNYOGTQMQ-AAEUAGOBSA-N Ser-Trp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(O)=O BCAVNDNYOGTQMQ-AAEUAGOBSA-N 0.000 description 2
- QYBRQMLZDDJBSW-AVGNSLFASA-N Ser-Tyr-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O QYBRQMLZDDJBSW-AVGNSLFASA-N 0.000 description 2
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 2
- QAOWNCQODCNURD-UHFFFAOYSA-N Sulfuric acid Chemical compound OS(O)(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-N 0.000 description 2
- 101710151118 Thioesterase TesA Proteins 0.000 description 2
- SLUWOCTZVGMURC-BFHQHQDPSA-N Thr-Gly-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O SLUWOCTZVGMURC-BFHQHQDPSA-N 0.000 description 2
- NIEWSKWFURSECR-FOHZUACHSA-N Thr-Gly-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O NIEWSKWFURSECR-FOHZUACHSA-N 0.000 description 2
- QQWNRERCGGZOKG-WEDXCCLWSA-N Thr-Gly-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O QQWNRERCGGZOKG-WEDXCCLWSA-N 0.000 description 2
- GXUWHVZYDAHFSV-FLBSBUHZSA-N Thr-Ile-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GXUWHVZYDAHFSV-FLBSBUHZSA-N 0.000 description 2
- XYFISNXATOERFZ-OSUNSFLBSA-N Thr-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N XYFISNXATOERFZ-OSUNSFLBSA-N 0.000 description 2
- AMXMBCAXAZUCFA-RHYQMDGZSA-N Thr-Leu-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AMXMBCAXAZUCFA-RHYQMDGZSA-N 0.000 description 2
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 2
- XHWCDRUPDNSDAZ-XKBZYTNZSA-N Thr-Ser-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O XHWCDRUPDNSDAZ-XKBZYTNZSA-N 0.000 description 2
- YRJOLUDFVAUXLI-GSSVUCPTSA-N Thr-Thr-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O YRJOLUDFVAUXLI-GSSVUCPTSA-N 0.000 description 2
- QNXZCKMXHPULME-ZNSHCXBVSA-N Thr-Val-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O QNXZCKMXHPULME-ZNSHCXBVSA-N 0.000 description 2
- DLZKEQQWXODGGZ-KWQFWETISA-N Tyr-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DLZKEQQWXODGGZ-KWQFWETISA-N 0.000 description 2
- AKXBNSZMYAOGLS-STQMWFEESA-N Tyr-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AKXBNSZMYAOGLS-STQMWFEESA-N 0.000 description 2
- PRONOHBTMLNXCZ-BZSNNMDCSA-N Tyr-Leu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PRONOHBTMLNXCZ-BZSNNMDCSA-N 0.000 description 2
- CDBXVDXSLPLFMD-BPNCWPANSA-N Tyr-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=C(O)C=C1 CDBXVDXSLPLFMD-BPNCWPANSA-N 0.000 description 2
- VYQQQIRHIFALGE-UWJYBYFXSA-N Tyr-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 VYQQQIRHIFALGE-UWJYBYFXSA-N 0.000 description 2
- NHOVZGFNTGMYMI-KKUMJFAQSA-N Tyr-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NHOVZGFNTGMYMI-KKUMJFAQSA-N 0.000 description 2
- UMSZZGTXGKHTFJ-SRVKXCTJSA-N Tyr-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 UMSZZGTXGKHTFJ-SRVKXCTJSA-N 0.000 description 2
- CLEGSEJVGBYZBJ-MEYUZBJRSA-N Tyr-Thr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 CLEGSEJVGBYZBJ-MEYUZBJRSA-N 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 2
- YFOCMOVJBQDBCE-NRPADANISA-N Val-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N YFOCMOVJBQDBCE-NRPADANISA-N 0.000 description 2
- ASQFIHTXXMFENG-XPUUQOCRSA-N Val-Ala-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O ASQFIHTXXMFENG-XPUUQOCRSA-N 0.000 description 2
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 2
- AZSHAZJLOZQYAY-FXQIFTODSA-N Val-Ala-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O AZSHAZJLOZQYAY-FXQIFTODSA-N 0.000 description 2
- ISERLACIZUGCDX-ZKWXMUAHSA-N Val-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N ISERLACIZUGCDX-ZKWXMUAHSA-N 0.000 description 2
- VLOYGOZDPGYWFO-LAEOZQHASA-N Val-Asp-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VLOYGOZDPGYWFO-LAEOZQHASA-N 0.000 description 2
- OVLIFGQSBSNGHY-KKHAAJSZSA-N Val-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N)O OVLIFGQSBSNGHY-KKHAAJSZSA-N 0.000 description 2
- KDKLLPMFFGYQJD-CYDGBPFRSA-N Val-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N KDKLLPMFFGYQJD-CYDGBPFRSA-N 0.000 description 2
- OVBMCNDKCWAXMZ-NAKRPEOUSA-N Val-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N OVBMCNDKCWAXMZ-NAKRPEOUSA-N 0.000 description 2
- DJQIUOKSNRBTSV-CYDGBPFRSA-N Val-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](C(C)C)N DJQIUOKSNRBTSV-CYDGBPFRSA-N 0.000 description 2
- FEXILLGKGGTLRI-NHCYSSNCSA-N Val-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N FEXILLGKGGTLRI-NHCYSSNCSA-N 0.000 description 2
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 2
- MLADEWAIYAPAAU-IHRRRGAJSA-N Val-Lys-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N MLADEWAIYAPAAU-IHRRRGAJSA-N 0.000 description 2
- CXWJFWAZIVWBOS-XQQFMLRXSA-N Val-Lys-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N CXWJFWAZIVWBOS-XQQFMLRXSA-N 0.000 description 2
- PHZGFLFMGLXCFG-FHWLQOOXSA-N Val-Lys-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N PHZGFLFMGLXCFG-FHWLQOOXSA-N 0.000 description 2
- NHXZRXLFOBFMDM-AVGNSLFASA-N Val-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C NHXZRXLFOBFMDM-AVGNSLFASA-N 0.000 description 2
- MIKHIIQMRFYVOR-RCWTZXSCSA-N Val-Pro-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C(C)C)N)O MIKHIIQMRFYVOR-RCWTZXSCSA-N 0.000 description 2
- CEKSLIVSNNGOKH-KZVJFYERSA-N Val-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](C(C)C)N)O CEKSLIVSNNGOKH-KZVJFYERSA-N 0.000 description 2
- YQYFYUSYEDNLSD-YEPSODPASA-N Val-Thr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O YQYFYUSYEDNLSD-YEPSODPASA-N 0.000 description 2
- NLNCNKIVJPEFBC-DLOVCJGASA-N Val-Val-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O NLNCNKIVJPEFBC-DLOVCJGASA-N 0.000 description 2
- 241000863000 Vitreoscilla Species 0.000 description 2
- 150000001242 acetic acid derivatives Chemical class 0.000 description 2
- 235000010419 agar Nutrition 0.000 description 2
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 2
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 2
- 108010070944 alanylhistidine Proteins 0.000 description 2
- 235000021016 apples Nutrition 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 108010068380 arginylarginine Proteins 0.000 description 2
- 108010093581 aspartyl-proline Proteins 0.000 description 2
- 108010068265 aspartyltyrosine Proteins 0.000 description 2
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 239000006227 byproduct Substances 0.000 description 2
- 239000011203 carbon fibre reinforced carbon Substances 0.000 description 2
- 239000012159 carrier gas Substances 0.000 description 2
- 239000003054 catalyst Substances 0.000 description 2
- 230000030570 cellular localization Effects 0.000 description 2
- 238000012824 chemical production Methods 0.000 description 2
- 231100000481 chemical toxicant Toxicity 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000006378 damage Effects 0.000 description 2
- DIOQZVSQGTUSAI-UHFFFAOYSA-N decane Chemical compound CCCCCCCCCC DIOQZVSQGTUSAI-UHFFFAOYSA-N 0.000 description 2
- 230000002950 deficient Effects 0.000 description 2
- 108010054813 diprotin B Proteins 0.000 description 2
- 235000013399 edible fruits Nutrition 0.000 description 2
- 229920001971 elastomer Polymers 0.000 description 2
- 230000002255 enzymatic effect Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 239000007789 gas Substances 0.000 description 2
- 238000010362 genome editing Methods 0.000 description 2
- 210000004907 gland Anatomy 0.000 description 2
- 239000008103 glucose Substances 0.000 description 2
- 108010080575 glutamyl-aspartyl-alanine Proteins 0.000 description 2
- 108010008237 glutamyl-valyl-glycine Proteins 0.000 description 2
- 108010079547 glutamylmethionine Proteins 0.000 description 2
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 2
- 108010028188 glycyl-histidyl-serine Proteins 0.000 description 2
- 108010081551 glycylphenylalanine Proteins 0.000 description 2
- 108010087823 glycyltyrosine Proteins 0.000 description 2
- 108010037850 glycylvaline Proteins 0.000 description 2
- 239000001307 helium Substances 0.000 description 2
- 229910052734 helium Inorganic materials 0.000 description 2
- SWQJXJOGLNCZEY-UHFFFAOYSA-N helium atom Chemical compound [He] SWQJXJOGLNCZEY-UHFFFAOYSA-N 0.000 description 2
- 108010036302 hemoglobin AS Proteins 0.000 description 2
- 108010025306 histidylleucine Proteins 0.000 description 2
- 108010085325 histidylproline Proteins 0.000 description 2
- 108010018006 histidylserine Proteins 0.000 description 2
- AMWRITDGCCNYAT-UHFFFAOYSA-L hydroxy(oxo)manganese;manganese Chemical compound [Mn].O[Mn]=O.O[Mn]=O AMWRITDGCCNYAT-UHFFFAOYSA-L 0.000 description 2
- WGCNASOHLSPBMP-UHFFFAOYSA-N hydroxyacetaldehyde Natural products OCC=O WGCNASOHLSPBMP-UHFFFAOYSA-N 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 239000002917 insecticide Substances 0.000 description 2
- 229960000310 isoleucine Drugs 0.000 description 2
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 2
- 108010000761 leucylarginine Proteins 0.000 description 2
- 244000144972 livestock Species 0.000 description 2
- 108010003700 lysyl aspartic acid Proteins 0.000 description 2
- 108010038320 lysylphenylalanine Proteins 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 239000012528 membrane Substances 0.000 description 2
- 108700023046 methionyl-leucyl-phenylalanine Proteins 0.000 description 2
- ZAZKJZBWRNNLDS-UHFFFAOYSA-N methyl tetradecanoate Chemical compound CCCCCCCCCCCCCC(=O)OC ZAZKJZBWRNNLDS-UHFFFAOYSA-N 0.000 description 2
- 230000000813 microbial effect Effects 0.000 description 2
- WIIZEEPFHXAUND-UHFFFAOYSA-N n-[[4-[2-(dimethylamino)ethoxy]phenyl]methyl]-3,4,5-trimethoxybenzamide;hydron;chloride Chemical compound Cl.COC1=C(OC)C(OC)=CC(C(=O)NCC=2C=CC(OCCN(C)C)=CC=2)=C1 WIIZEEPFHXAUND-UHFFFAOYSA-N 0.000 description 2
- 229930014626 natural product Natural products 0.000 description 2
- BOPGDPNILDQYTO-NNYOXOHSSA-N nicotinamide-adenine dinucleotide Chemical compound C1=CCC(C(=O)N)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OC[C@@H]2[C@H]([C@@H](O)[C@@H](O2)N2C3=NC=NC(N)=C3N=C2)O)O1 BOPGDPNILDQYTO-NNYOXOHSSA-N 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 239000002420 orchard Substances 0.000 description 2
- 239000012074 organic phase Substances 0.000 description 2
- 230000002018 overexpression Effects 0.000 description 2
- 239000001301 oxygen Substances 0.000 description 2
- 229910052760 oxygen Inorganic materials 0.000 description 2
- 235000021017 pears Nutrition 0.000 description 2
- 230000003094 perturbing effect Effects 0.000 description 2
- 108010074082 phenylalanyl-alanyl-lysine Proteins 0.000 description 2
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 2
- 108010065135 phenylalanyl-phenylalanyl-phenylalanine Proteins 0.000 description 2
- 108010024607 phenylalanylalanine Proteins 0.000 description 2
- 239000004476 plant protection product Substances 0.000 description 2
- 235000021018 plums Nutrition 0.000 description 2
- 239000000843 powder Substances 0.000 description 2
- 239000013587 production medium Substances 0.000 description 2
- 108010020755 prolyl-glycyl-glycine Proteins 0.000 description 2
- 230000000754 repressing effect Effects 0.000 description 2
- 230000001718 repressive effect Effects 0.000 description 2
- 239000005060 rubber Substances 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- 239000006228 supernatant Substances 0.000 description 2
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 2
- 108010072986 threonyl-seryl-lysine Proteins 0.000 description 2
- 231100000331 toxic Toxicity 0.000 description 2
- 230000002588 toxic effect Effects 0.000 description 2
- 239000003440 toxic substance Substances 0.000 description 2
- 238000013518 transcription Methods 0.000 description 2
- 230000035897 transcription Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 108010080629 tryptophan-leucine Proteins 0.000 description 2
- 108010051110 tyrosyl-lysine Proteins 0.000 description 2
- 108010020532 tyrosyl-proline Proteins 0.000 description 2
- 108010078580 tyrosylleucine Proteins 0.000 description 2
- IBIDRSSEHFLGSD-UHFFFAOYSA-N valinyl-arginine Natural products CC(C)C(N)C(=O)NC(C(O)=O)CCCN=C(N)N IBIDRSSEHFLGSD-UHFFFAOYSA-N 0.000 description 2
- 239000012138 yeast extract Substances 0.000 description 2
- CNKBMTKICGGSCQ-ACRUOGEOSA-N (2S)-2-[[(2S)-2-[[(2S)-2,6-diamino-1-oxohexyl]amino]-1-oxo-3-phenylpropyl]amino]-3-(4-hydroxyphenyl)propanoic acid Chemical compound C([C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 CNKBMTKICGGSCQ-ACRUOGEOSA-N 0.000 description 1
- VWWKKDNCCLAGRM-GVXVVHGQSA-N (2s)-2-[[2-[[(2s)-2-[[(2s)-2-amino-4-methylpentanoyl]amino]propanoyl]amino]acetyl]amino]-3-methylbutanoic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O VWWKKDNCCLAGRM-GVXVVHGQSA-N 0.000 description 1
- WRIDQFICGBMAFQ-UHFFFAOYSA-N (E)-8-Octadecenoic acid Natural products CCCCCCCCCC=CCCCCCCC(O)=O WRIDQFICGBMAFQ-UHFFFAOYSA-N 0.000 description 1
- DYLIWHYUXAJDOJ-OWOJBTEDSA-N (e)-4-(6-aminopurin-9-yl)but-2-en-1-ol Chemical compound NC1=NC=NC2=C1N=CN2C\C=C\CO DYLIWHYUXAJDOJ-OWOJBTEDSA-N 0.000 description 1
- INOGLHRUEYDAHX-UHFFFAOYSA-N 1-chlorobenzotriazole Chemical compound C1=CC=C2N(Cl)N=NC2=C1 INOGLHRUEYDAHX-UHFFFAOYSA-N 0.000 description 1
- WEZDRVHTDXTVLT-GJZGRUSLSA-N 2-[[(2s)-2-[[(2s)-2-[(2-aminoacetyl)amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]acetic acid Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 WEZDRVHTDXTVLT-GJZGRUSLSA-N 0.000 description 1
- QMOQBVOBWVNSNO-UHFFFAOYSA-N 2-[[2-[[2-[(2-azaniumylacetyl)amino]acetyl]amino]acetyl]amino]acetate Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(O)=O QMOQBVOBWVNSNO-UHFFFAOYSA-N 0.000 description 1
- LQJBNNIYVWPHFW-UHFFFAOYSA-N 20:1omega9c fatty acid Natural products CCCCCCCCCCC=CCCCCCCCC(O)=O LQJBNNIYVWPHFW-UHFFFAOYSA-N 0.000 description 1
- SLXKOJJOQWFEFD-UHFFFAOYSA-N 6-aminohexanoic acid Chemical compound NCCCCCC(O)=O SLXKOJJOQWFEFD-UHFFFAOYSA-N 0.000 description 1
- QSBYPNXLFMSGKH-UHFFFAOYSA-N 9-Heptadecensaeure Natural products CCCCCCCC=CCCCCCCCC(O)=O QSBYPNXLFMSGKH-UHFFFAOYSA-N 0.000 description 1
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical group CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- BUANFPRKJKJSRR-ACZMJKKPSA-N Ala-Ala-Gln Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CCC(N)=O BUANFPRKJKJSRR-ACZMJKKPSA-N 0.000 description 1
- PIPTUBPKYFRLCP-NHCYSSNCSA-N Ala-Ala-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PIPTUBPKYFRLCP-NHCYSSNCSA-N 0.000 description 1
- NXSFUECZFORGOG-CIUDSAMLSA-N Ala-Asn-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXSFUECZFORGOG-CIUDSAMLSA-N 0.000 description 1
- XCVRVWZTXPCYJT-BIIVOSGPSA-N Ala-Asn-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N XCVRVWZTXPCYJT-BIIVOSGPSA-N 0.000 description 1
- PBAMJJXWDQXOJA-FXQIFTODSA-N Ala-Asp-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PBAMJJXWDQXOJA-FXQIFTODSA-N 0.000 description 1
- WDIYWDJLXOCGRW-ACZMJKKPSA-N Ala-Asp-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WDIYWDJLXOCGRW-ACZMJKKPSA-N 0.000 description 1
- LSLIRHLIUDVNBN-CIUDSAMLSA-N Ala-Asp-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LSLIRHLIUDVNBN-CIUDSAMLSA-N 0.000 description 1
- IFTVANMRTIHKML-WDSKDSINSA-N Ala-Gln-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O IFTVANMRTIHKML-WDSKDSINSA-N 0.000 description 1
- BLGHHPHXVJWCNK-GUBZILKMSA-N Ala-Gln-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BLGHHPHXVJWCNK-GUBZILKMSA-N 0.000 description 1
- NWVVKQZOVSTDBQ-CIUDSAMLSA-N Ala-Glu-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NWVVKQZOVSTDBQ-CIUDSAMLSA-N 0.000 description 1
- KXEVYGKATAMXJJ-ACZMJKKPSA-N Ala-Glu-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O KXEVYGKATAMXJJ-ACZMJKKPSA-N 0.000 description 1
- PAIHPOGPJVUFJY-WDSKDSINSA-N Ala-Glu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PAIHPOGPJVUFJY-WDSKDSINSA-N 0.000 description 1
- BVSGPHDECMJBDE-HGNGGELXSA-N Ala-Glu-His Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N BVSGPHDECMJBDE-HGNGGELXSA-N 0.000 description 1
- PUBLUECXJRHTBK-ACZMJKKPSA-N Ala-Glu-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O PUBLUECXJRHTBK-ACZMJKKPSA-N 0.000 description 1
- XYTNPQNAZREREP-XQXXSGGOSA-N Ala-Glu-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XYTNPQNAZREREP-XQXXSGGOSA-N 0.000 description 1
- WGDNWOMKBUXFHR-BQBZGAKWSA-N Ala-Gly-Arg Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N WGDNWOMKBUXFHR-BQBZGAKWSA-N 0.000 description 1
- OBVSBEYOMDWLRJ-BFHQHQDPSA-N Ala-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N OBVSBEYOMDWLRJ-BFHQHQDPSA-N 0.000 description 1
- SMCGQGDVTPFXKB-XPUUQOCRSA-N Ala-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N SMCGQGDVTPFXKB-XPUUQOCRSA-N 0.000 description 1
- ZPXCNXMJEZKRLU-LSJOCFKGSA-N Ala-His-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CN=CN1 ZPXCNXMJEZKRLU-LSJOCFKGSA-N 0.000 description 1
- CBCCCLMNOBLBSC-XVYDVKMFSA-N Ala-His-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O CBCCCLMNOBLBSC-XVYDVKMFSA-N 0.000 description 1
- HJGZVLLLBJLXFC-LSJOCFKGSA-N Ala-His-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(O)=O HJGZVLLLBJLXFC-LSJOCFKGSA-N 0.000 description 1
- PNALXAODQKTNLV-JBDRJPRFSA-N Ala-Ile-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O PNALXAODQKTNLV-JBDRJPRFSA-N 0.000 description 1
- CKLDHDOIYBVUNP-KBIXCLLPSA-N Ala-Ile-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O CKLDHDOIYBVUNP-KBIXCLLPSA-N 0.000 description 1
- CFPQUJZTLUQUTJ-HTFCKZLJSA-N Ala-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](C)N CFPQUJZTLUQUTJ-HTFCKZLJSA-N 0.000 description 1
- TZDNWXDLYFIFPT-BJDJZHNGSA-N Ala-Ile-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O TZDNWXDLYFIFPT-BJDJZHNGSA-N 0.000 description 1
- RZZMZYZXNJRPOJ-BJDJZHNGSA-N Ala-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C)N RZZMZYZXNJRPOJ-BJDJZHNGSA-N 0.000 description 1
- AWZKCUCQJNTBAD-SRVKXCTJSA-N Ala-Leu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN AWZKCUCQJNTBAD-SRVKXCTJSA-N 0.000 description 1
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 1
- AJBVYEYZVYPFCF-CIUDSAMLSA-N Ala-Lys-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O AJBVYEYZVYPFCF-CIUDSAMLSA-N 0.000 description 1
- SUHLZMHFRALVSY-YUMQZZPRSA-N Ala-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)NCC(O)=O SUHLZMHFRALVSY-YUMQZZPRSA-N 0.000 description 1
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 1
- CHFFHQUVXHEGBY-GARJFASQSA-N Ala-Lys-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N CHFFHQUVXHEGBY-GARJFASQSA-N 0.000 description 1
- NINQYGGNRIBFSC-CIUDSAMLSA-N Ala-Lys-Ser Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CO)C(O)=O NINQYGGNRIBFSC-CIUDSAMLSA-N 0.000 description 1
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 1
- DEWWPUNXRNGMQN-LPEHRKFASA-N Ala-Met-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N1CCC[C@@H]1C(=O)O)N DEWWPUNXRNGMQN-LPEHRKFASA-N 0.000 description 1
- GFEDXKNBZMPEDM-KZVJFYERSA-N Ala-Met-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GFEDXKNBZMPEDM-KZVJFYERSA-N 0.000 description 1
- BFMIRJBURUXDRG-DLOVCJGASA-N Ala-Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 BFMIRJBURUXDRG-DLOVCJGASA-N 0.000 description 1
- CNQAFFMNJIQYGX-DRZSPHRISA-N Ala-Phe-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 CNQAFFMNJIQYGX-DRZSPHRISA-N 0.000 description 1
- YCRAFFCYWOUEOF-DLOVCJGASA-N Ala-Phe-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 YCRAFFCYWOUEOF-DLOVCJGASA-N 0.000 description 1
- SGFBVLBKDSXGAP-GKCIPKSASA-N Ala-Phe-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)N SGFBVLBKDSXGAP-GKCIPKSASA-N 0.000 description 1
- IPZQNYYAYVRKKK-FXQIFTODSA-N Ala-Pro-Ala Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IPZQNYYAYVRKKK-FXQIFTODSA-N 0.000 description 1
- FQNILRVJOJBFFC-FXQIFTODSA-N Ala-Pro-Asp Chemical compound C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N FQNILRVJOJBFFC-FXQIFTODSA-N 0.000 description 1
- WQLDNOCHHRISMS-NAKRPEOUSA-N Ala-Pro-Ile Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WQLDNOCHHRISMS-NAKRPEOUSA-N 0.000 description 1
- YHBDGLZYNIARKJ-GUBZILKMSA-N Ala-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N YHBDGLZYNIARKJ-GUBZILKMSA-N 0.000 description 1
- VJVQKGYHIZPSNS-FXQIFTODSA-N Ala-Ser-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N VJVQKGYHIZPSNS-FXQIFTODSA-N 0.000 description 1
- MMLHRUJLOUSRJX-CIUDSAMLSA-N Ala-Ser-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN MMLHRUJLOUSRJX-CIUDSAMLSA-N 0.000 description 1
- NZGRHTKZFSVPAN-BIIVOSGPSA-N Ala-Ser-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N NZGRHTKZFSVPAN-BIIVOSGPSA-N 0.000 description 1
- WQKAQKZRDIZYNV-VZFHVOOUSA-N Ala-Ser-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WQKAQKZRDIZYNV-VZFHVOOUSA-N 0.000 description 1
- UCDOXFBTMLKASE-HERUPUMHSA-N Ala-Ser-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N UCDOXFBTMLKASE-HERUPUMHSA-N 0.000 description 1
- HCBKAOZYACJUEF-XQXXSGGOSA-N Ala-Thr-Gln Chemical compound N[C@@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCC(N)=O)C(=O)O HCBKAOZYACJUEF-XQXXSGGOSA-N 0.000 description 1
- VNFSAYFQLXPHPY-CIQUZCHMSA-N Ala-Thr-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VNFSAYFQLXPHPY-CIQUZCHMSA-N 0.000 description 1
- CREYEAPXISDKSB-FQPOAREZSA-N Ala-Thr-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CREYEAPXISDKSB-FQPOAREZSA-N 0.000 description 1
- UBTKNYUAMYRMKE-GOPGUHFVSA-N Ala-Trp-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N UBTKNYUAMYRMKE-GOPGUHFVSA-N 0.000 description 1
- QDGMZAOSMNGBLP-MRFFXTKBSA-N Ala-Trp-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)N QDGMZAOSMNGBLP-MRFFXTKBSA-N 0.000 description 1
- AENHOIXXHKNIQL-AUTRQRHGSA-N Ala-Tyr-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H]([NH3+])C)CC1=CC=C(O)C=C1 AENHOIXXHKNIQL-AUTRQRHGSA-N 0.000 description 1
- BHFOJPDOQPWJRN-XDTLVQLUSA-N Ala-Tyr-Gln Chemical compound C[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CCC(N)=O)C(O)=O BHFOJPDOQPWJRN-XDTLVQLUSA-N 0.000 description 1
- PGNNQOJOEGFAOR-KWQFWETISA-N Ala-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 PGNNQOJOEGFAOR-KWQFWETISA-N 0.000 description 1
- GCTANJIJJROSLH-GVARAGBVSA-N Ala-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C)N GCTANJIJJROSLH-GVARAGBVSA-N 0.000 description 1
- QRIYOHQJRDHFKF-UWJYBYFXSA-N Ala-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 QRIYOHQJRDHFKF-UWJYBYFXSA-N 0.000 description 1
- MUGAESARFRGOTQ-IGNZVWTISA-N Ala-Tyr-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N MUGAESARFRGOTQ-IGNZVWTISA-N 0.000 description 1
- XSLGWYYNOSUMRM-ZKWXMUAHSA-N Ala-Val-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XSLGWYYNOSUMRM-ZKWXMUAHSA-N 0.000 description 1
- ZCUFMRIQCPNOHZ-NRPADANISA-N Ala-Val-Gln Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N ZCUFMRIQCPNOHZ-NRPADANISA-N 0.000 description 1
- VHAQSYHSDKERBS-XPUUQOCRSA-N Ala-Val-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O VHAQSYHSDKERBS-XPUUQOCRSA-N 0.000 description 1
- LYILPUNCKACNGF-NAKRPEOUSA-N Ala-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C)N LYILPUNCKACNGF-NAKRPEOUSA-N 0.000 description 1
- XCIGOVDXZULBBV-DCAQKATOSA-N Ala-Val-Lys Chemical compound CC(C)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CCCCN)C(O)=O XCIGOVDXZULBBV-DCAQKATOSA-N 0.000 description 1
- DHONNEYAZPNGSG-UBHSHLNASA-N Ala-Val-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 DHONNEYAZPNGSG-UBHSHLNASA-N 0.000 description 1
- ZDILXFDENZVOTL-BPNCWPANSA-N Ala-Val-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZDILXFDENZVOTL-BPNCWPANSA-N 0.000 description 1
- DFCIPNHFKOQAME-FXQIFTODSA-N Arg-Ala-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O DFCIPNHFKOQAME-FXQIFTODSA-N 0.000 description 1
- GIVATXIGCXFQQA-FXQIFTODSA-N Arg-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N GIVATXIGCXFQQA-FXQIFTODSA-N 0.000 description 1
- BIOCIVSVEDFKDJ-GUBZILKMSA-N Arg-Arg-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O BIOCIVSVEDFKDJ-GUBZILKMSA-N 0.000 description 1
- KJGNDQCYBNBXDA-GUBZILKMSA-N Arg-Arg-Cys Chemical compound C(C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N)CN=C(N)N KJGNDQCYBNBXDA-GUBZILKMSA-N 0.000 description 1
- UXJCMQFPDWCHKX-DCAQKATOSA-N Arg-Arg-Glu Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UXJCMQFPDWCHKX-DCAQKATOSA-N 0.000 description 1
- NONSEUUPKITYQT-BQBZGAKWSA-N Arg-Asn-Gly Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N)CN=C(N)N NONSEUUPKITYQT-BQBZGAKWSA-N 0.000 description 1
- NUBPTCMEOCKWDO-DCAQKATOSA-N Arg-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N NUBPTCMEOCKWDO-DCAQKATOSA-N 0.000 description 1
- QPOARHANPULOTM-GMOBBJLQSA-N Arg-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N QPOARHANPULOTM-GMOBBJLQSA-N 0.000 description 1
- ITVINTQUZMQWJR-QXEWZRGKSA-N Arg-Asn-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O ITVINTQUZMQWJR-QXEWZRGKSA-N 0.000 description 1
- RWCLSUOSKWTXLA-FXQIFTODSA-N Arg-Asp-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RWCLSUOSKWTXLA-FXQIFTODSA-N 0.000 description 1
- YFBGNGASPGRWEM-DCAQKATOSA-N Arg-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YFBGNGASPGRWEM-DCAQKATOSA-N 0.000 description 1
- PTVGLOCPAVYPFG-CIUDSAMLSA-N Arg-Gln-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O PTVGLOCPAVYPFG-CIUDSAMLSA-N 0.000 description 1
- JUWQNWXEGDYCIE-YUMQZZPRSA-N Arg-Gln-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O JUWQNWXEGDYCIE-YUMQZZPRSA-N 0.000 description 1
- VNFWDYWTSHFRRG-SRVKXCTJSA-N Arg-Gln-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O VNFWDYWTSHFRRG-SRVKXCTJSA-N 0.000 description 1
- LLZXKVAAEWBUPB-KKUMJFAQSA-N Arg-Gln-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LLZXKVAAEWBUPB-KKUMJFAQSA-N 0.000 description 1
- XLWSGICNBZGYTA-CIUDSAMLSA-N Arg-Glu-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XLWSGICNBZGYTA-CIUDSAMLSA-N 0.000 description 1
- PNQWAUXQDBIJDY-GUBZILKMSA-N Arg-Glu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PNQWAUXQDBIJDY-GUBZILKMSA-N 0.000 description 1
- OHYQKYUTLIPFOX-ZPFDUUQYSA-N Arg-Glu-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OHYQKYUTLIPFOX-ZPFDUUQYSA-N 0.000 description 1
- OGUPCHKBOKJFMA-SRVKXCTJSA-N Arg-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N OGUPCHKBOKJFMA-SRVKXCTJSA-N 0.000 description 1
- UFBURHXMKFQVLM-CIUDSAMLSA-N Arg-Glu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O UFBURHXMKFQVLM-CIUDSAMLSA-N 0.000 description 1
- PNIGSVZJNVUVJA-BQBZGAKWSA-N Arg-Gly-Asn Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O PNIGSVZJNVUVJA-BQBZGAKWSA-N 0.000 description 1
- PHHRSPBBQUFULD-UWVGGRQHSA-N Arg-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCCN=C(N)N)N PHHRSPBBQUFULD-UWVGGRQHSA-N 0.000 description 1
- HAVKMRGWNXMCDR-STQMWFEESA-N Arg-Gly-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HAVKMRGWNXMCDR-STQMWFEESA-N 0.000 description 1
- KRQSPVKUISQQFS-FJXKBIBVSA-N Arg-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N KRQSPVKUISQQFS-FJXKBIBVSA-N 0.000 description 1
- VRZDJJWOFXMFRO-ZFWWWQNUSA-N Arg-Gly-Trp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O VRZDJJWOFXMFRO-ZFWWWQNUSA-N 0.000 description 1
- ZJEDSBGPBXVBMP-PYJNHQTQSA-N Arg-His-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZJEDSBGPBXVBMP-PYJNHQTQSA-N 0.000 description 1
- NVCIXQYNWYTLDO-IHRRRGAJSA-N Arg-His-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCN=C(N)N)N NVCIXQYNWYTLDO-IHRRRGAJSA-N 0.000 description 1
- HCIUUZGFTDTEGM-NAKRPEOUSA-N Arg-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N HCIUUZGFTDTEGM-NAKRPEOUSA-N 0.000 description 1
- OOIMKQRCPJBGPD-XUXIUFHCSA-N Arg-Ile-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O OOIMKQRCPJBGPD-XUXIUFHCSA-N 0.000 description 1
- LKDHUGLXOHYINY-XUXIUFHCSA-N Arg-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N LKDHUGLXOHYINY-XUXIUFHCSA-N 0.000 description 1
- OKKMBOSPBDASEP-CYDGBPFRSA-N Arg-Ile-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCSC)C(O)=O OKKMBOSPBDASEP-CYDGBPFRSA-N 0.000 description 1
- YBZMTKUDWXZLIX-UWVGGRQHSA-N Arg-Leu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YBZMTKUDWXZLIX-UWVGGRQHSA-N 0.000 description 1
- WMEVEPXNCMKNGH-IHRRRGAJSA-N Arg-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N WMEVEPXNCMKNGH-IHRRRGAJSA-N 0.000 description 1
- UZGFHWIJWPUPOH-IHRRRGAJSA-N Arg-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UZGFHWIJWPUPOH-IHRRRGAJSA-N 0.000 description 1
- NGTYEHIRESTSRX-UWVGGRQHSA-N Arg-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N NGTYEHIRESTSRX-UWVGGRQHSA-N 0.000 description 1
- BNYNOWJESJJIOI-XUXIUFHCSA-N Arg-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCN=C(N)N)N BNYNOWJESJJIOI-XUXIUFHCSA-N 0.000 description 1
- JCROZIFVIYMXHM-GUBZILKMSA-N Arg-Met-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CCCN=C(N)N JCROZIFVIYMXHM-GUBZILKMSA-N 0.000 description 1
- YTMKMRSYXHBGER-IHRRRGAJSA-N Arg-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YTMKMRSYXHBGER-IHRRRGAJSA-N 0.000 description 1
- VEAIMHJZTIDCIH-KKUMJFAQSA-N Arg-Phe-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O VEAIMHJZTIDCIH-KKUMJFAQSA-N 0.000 description 1
- UGZUVYDKAYNCII-ULQDDVLXSA-N Arg-Phe-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UGZUVYDKAYNCII-ULQDDVLXSA-N 0.000 description 1
- SLQQPJBDBVPVQV-JYJNAYRXSA-N Arg-Phe-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O SLQQPJBDBVPVQV-JYJNAYRXSA-N 0.000 description 1
- NGYHSXDNNOFHNE-AVGNSLFASA-N Arg-Pro-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O NGYHSXDNNOFHNE-AVGNSLFASA-N 0.000 description 1
- JPAWCMXVNZPJLO-IHRRRGAJSA-N Arg-Ser-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JPAWCMXVNZPJLO-IHRRRGAJSA-N 0.000 description 1
- AIFHRTPABBBHKU-RCWTZXSCSA-N Arg-Thr-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O AIFHRTPABBBHKU-RCWTZXSCSA-N 0.000 description 1
- SYFHFLGAROUHNT-VEVYYDQMSA-N Arg-Thr-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O SYFHFLGAROUHNT-VEVYYDQMSA-N 0.000 description 1
- JKRPBTQDPJSQIT-RCWTZXSCSA-N Arg-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O JKRPBTQDPJSQIT-RCWTZXSCSA-N 0.000 description 1
- UVTGNSWSRSCPLP-UHFFFAOYSA-N Arg-Tyr Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O UVTGNSWSRSCPLP-UHFFFAOYSA-N 0.000 description 1
- VLIJAPRTSXSGFY-STQMWFEESA-N Arg-Tyr-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 VLIJAPRTSXSGFY-STQMWFEESA-N 0.000 description 1
- FOWOZYAWODIRFZ-JYJNAYRXSA-N Arg-Tyr-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCCN=C(N)N)N FOWOZYAWODIRFZ-JYJNAYRXSA-N 0.000 description 1
- LLQIAIUAKGNOSE-NHCYSSNCSA-N Arg-Val-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N LLQIAIUAKGNOSE-NHCYSSNCSA-N 0.000 description 1
- ULBHWNVWSCJLCO-NHCYSSNCSA-N Arg-Val-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N ULBHWNVWSCJLCO-NHCYSSNCSA-N 0.000 description 1
- FMYQECOAIFGQGU-CYDGBPFRSA-N Arg-Val-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FMYQECOAIFGQGU-CYDGBPFRSA-N 0.000 description 1
- WHLDJYNHXOMGMU-JYJNAYRXSA-N Arg-Val-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WHLDJYNHXOMGMU-JYJNAYRXSA-N 0.000 description 1
- ANAHQDPQQBDOBM-UHFFFAOYSA-N Arg-Val-Tyr Natural products CC(C)C(NC(=O)C(N)CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O ANAHQDPQQBDOBM-UHFFFAOYSA-N 0.000 description 1
- HZPSDHRYYIORKR-WHFBIAKZSA-N Asn-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O HZPSDHRYYIORKR-WHFBIAKZSA-N 0.000 description 1
- XWGJDUSDTRPQRK-ZLUOBGJFSA-N Asn-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O XWGJDUSDTRPQRK-ZLUOBGJFSA-N 0.000 description 1
- QEYJFBMTSMLPKZ-ZKWXMUAHSA-N Asn-Ala-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O QEYJFBMTSMLPKZ-ZKWXMUAHSA-N 0.000 description 1
- BDMIFVIWCNLDCT-CIUDSAMLSA-N Asn-Arg-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O BDMIFVIWCNLDCT-CIUDSAMLSA-N 0.000 description 1
- GXMSVVBIAMWMKO-BQBZGAKWSA-N Asn-Arg-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCN=C(N)N GXMSVVBIAMWMKO-BQBZGAKWSA-N 0.000 description 1
- MFFOYNGMOYFPBD-DCAQKATOSA-N Asn-Arg-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O MFFOYNGMOYFPBD-DCAQKATOSA-N 0.000 description 1
- ZDOQDYFZNGASEY-BIIVOSGPSA-N Asn-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N)C(=O)O ZDOQDYFZNGASEY-BIIVOSGPSA-N 0.000 description 1
- RFLVTVBAESPKKR-ZLUOBGJFSA-N Asn-Cys-Cys Chemical compound N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(O)=O RFLVTVBAESPKKR-ZLUOBGJFSA-N 0.000 description 1
- ZMWDUIIACVLIHK-GHCJXIJMSA-N Asn-Cys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)N)N ZMWDUIIACVLIHK-GHCJXIJMSA-N 0.000 description 1
- YQNBILXAUIAUCF-CIUDSAMLSA-N Asn-Cys-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)N)N YQNBILXAUIAUCF-CIUDSAMLSA-N 0.000 description 1
- QRHYAUYXBVVDSB-LKXGYXEUSA-N Asn-Cys-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QRHYAUYXBVVDSB-LKXGYXEUSA-N 0.000 description 1
- VJTWLBMESLDOMK-WDSKDSINSA-N Asn-Gln-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VJTWLBMESLDOMK-WDSKDSINSA-N 0.000 description 1
- SRUUBQBAVNQZGJ-LAEOZQHASA-N Asn-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N SRUUBQBAVNQZGJ-LAEOZQHASA-N 0.000 description 1
- OLGCWMNDJTWQAG-GUBZILKMSA-N Asn-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(N)=O OLGCWMNDJTWQAG-GUBZILKMSA-N 0.000 description 1
- DMLSCRJBWUEALP-LAEOZQHASA-N Asn-Glu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O DMLSCRJBWUEALP-LAEOZQHASA-N 0.000 description 1
- KLKHFFMNGWULBN-VKHMYHEASA-N Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)NCC(O)=O KLKHFFMNGWULBN-VKHMYHEASA-N 0.000 description 1
- PBSQFBAJKPLRJY-BYULHYEWSA-N Asn-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N PBSQFBAJKPLRJY-BYULHYEWSA-N 0.000 description 1
- KOWWUKUFQYDZID-SRVKXCTJSA-N Asn-Gly-Pro-His Chemical compound C1C[C@H](N(C1)C(=O)CNC(=O)[C@H](CC(=O)N)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O KOWWUKUFQYDZID-SRVKXCTJSA-N 0.000 description 1
- OLISTMZJGQUOGS-GMOBBJLQSA-N Asn-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N OLISTMZJGQUOGS-GMOBBJLQSA-N 0.000 description 1
- ANPFQTJEPONRPL-UGYAYLCHSA-N Asn-Ile-Asp Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O ANPFQTJEPONRPL-UGYAYLCHSA-N 0.000 description 1
- YYSYDIYQTUPNQQ-SXTJYALSSA-N Asn-Ile-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YYSYDIYQTUPNQQ-SXTJYALSSA-N 0.000 description 1
- LTZIRYMWOJHRCH-GUDRVLHUSA-N Asn-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N LTZIRYMWOJHRCH-GUDRVLHUSA-N 0.000 description 1
- IBLAOXSULLECQZ-IUKAMOBKSA-N Asn-Ile-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC(N)=O IBLAOXSULLECQZ-IUKAMOBKSA-N 0.000 description 1
- SPCONPVIDFMDJI-QSFUFRPTSA-N Asn-Ile-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O SPCONPVIDFMDJI-QSFUFRPTSA-N 0.000 description 1
- PNHQRQTVBRDIEF-CIUDSAMLSA-N Asn-Leu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(=O)N)N PNHQRQTVBRDIEF-CIUDSAMLSA-N 0.000 description 1
- WIDVAWAQBRAKTI-YUMQZZPRSA-N Asn-Leu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O WIDVAWAQBRAKTI-YUMQZZPRSA-N 0.000 description 1
- MYCSPQIARXTUTP-SRVKXCTJSA-N Asn-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)N)N MYCSPQIARXTUTP-SRVKXCTJSA-N 0.000 description 1
- RCFGLXMZDYNRSC-CIUDSAMLSA-N Asn-Lys-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O RCFGLXMZDYNRSC-CIUDSAMLSA-N 0.000 description 1
- NYGILGUOUOXGMJ-YUMQZZPRSA-N Asn-Lys-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O NYGILGUOUOXGMJ-YUMQZZPRSA-N 0.000 description 1
- ORJQQZIXTOYGGH-SRVKXCTJSA-N Asn-Lys-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ORJQQZIXTOYGGH-SRVKXCTJSA-N 0.000 description 1
- QDXQWFBLUVTOFL-FXQIFTODSA-N Asn-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC(=O)N)N QDXQWFBLUVTOFL-FXQIFTODSA-N 0.000 description 1
- HZZIFFOVHLWGCS-KKUMJFAQSA-N Asn-Phe-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O HZZIFFOVHLWGCS-KKUMJFAQSA-N 0.000 description 1
- AWXDRZJQCVHCIT-DCAQKATOSA-N Asn-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC(N)=O AWXDRZJQCVHCIT-DCAQKATOSA-N 0.000 description 1
- SZNGQSBRHFMZLT-IHRRRGAJSA-N Asn-Pro-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SZNGQSBRHFMZLT-IHRRRGAJSA-N 0.000 description 1
- XTMZYFMTYJNABC-ZLUOBGJFSA-N Asn-Ser-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N XTMZYFMTYJNABC-ZLUOBGJFSA-N 0.000 description 1
- NPZJLGMWMDNQDD-GHCJXIJMSA-N Asn-Ser-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NPZJLGMWMDNQDD-GHCJXIJMSA-N 0.000 description 1
- MKJBPDLENBUHQU-CIUDSAMLSA-N Asn-Ser-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O MKJBPDLENBUHQU-CIUDSAMLSA-N 0.000 description 1
- SNYCNNPOFYBCEK-ZLUOBGJFSA-N Asn-Ser-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O SNYCNNPOFYBCEK-ZLUOBGJFSA-N 0.000 description 1
- XHTUGJCAEYOZOR-UBHSHLNASA-N Asn-Ser-Trp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O XHTUGJCAEYOZOR-UBHSHLNASA-N 0.000 description 1
- WLVLIYYBPPONRJ-GCJQMDKQSA-N Asn-Thr-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O WLVLIYYBPPONRJ-GCJQMDKQSA-N 0.000 description 1
- ZUFPUBYQYWCMDB-NUMRIWBASA-N Asn-Thr-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZUFPUBYQYWCMDB-NUMRIWBASA-N 0.000 description 1
- KZYSHAMXEBPJBD-JRQIVUDYSA-N Asn-Thr-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KZYSHAMXEBPJBD-JRQIVUDYSA-N 0.000 description 1
- BCADFFUQHIMQAA-KKHAAJSZSA-N Asn-Thr-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BCADFFUQHIMQAA-KKHAAJSZSA-N 0.000 description 1
- IPPFAOCLQSGHJV-WFBYXXMGSA-N Asn-Trp-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(O)=O IPPFAOCLQSGHJV-WFBYXXMGSA-N 0.000 description 1
- FHCRKXCTKSHNOE-QEJZJMRPSA-N Asn-Trp-Glu Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N FHCRKXCTKSHNOE-QEJZJMRPSA-N 0.000 description 1
- ULZOQOKFYMXHPZ-AQZXSJQPSA-N Asn-Trp-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ULZOQOKFYMXHPZ-AQZXSJQPSA-N 0.000 description 1
- RTFXPCYMDYBZNQ-SRVKXCTJSA-N Asn-Tyr-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O RTFXPCYMDYBZNQ-SRVKXCTJSA-N 0.000 description 1
- YNQMEIJEWSHOEO-SRVKXCTJSA-N Asn-Tyr-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O YNQMEIJEWSHOEO-SRVKXCTJSA-N 0.000 description 1
- YSYTWUMRHSFODC-QWRGUYRKSA-N Asn-Tyr-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O YSYTWUMRHSFODC-QWRGUYRKSA-N 0.000 description 1
- XLDMSQYOYXINSZ-QXEWZRGKSA-N Asn-Val-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N XLDMSQYOYXINSZ-QXEWZRGKSA-N 0.000 description 1
- WSWYMRLTJVKRCE-ZLUOBGJFSA-N Asp-Ala-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O WSWYMRLTJVKRCE-ZLUOBGJFSA-N 0.000 description 1
- VTYQAQFKMQTKQD-ACZMJKKPSA-N Asp-Ala-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O VTYQAQFKMQTKQD-ACZMJKKPSA-N 0.000 description 1
- VPPXTHJNTYDNFJ-CIUDSAMLSA-N Asp-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N VPPXTHJNTYDNFJ-CIUDSAMLSA-N 0.000 description 1
- XPGVTUBABLRGHY-BIIVOSGPSA-N Asp-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N XPGVTUBABLRGHY-BIIVOSGPSA-N 0.000 description 1
- NJIKKGUVGUBICV-ZLUOBGJFSA-N Asp-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O NJIKKGUVGUBICV-ZLUOBGJFSA-N 0.000 description 1
- QHAJMRDEWNAIBQ-FXQIFTODSA-N Asp-Arg-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O QHAJMRDEWNAIBQ-FXQIFTODSA-N 0.000 description 1
- WSOKZUVWBXVJHX-CIUDSAMLSA-N Asp-Arg-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O WSOKZUVWBXVJHX-CIUDSAMLSA-N 0.000 description 1
- DBWYWXNMZZYIRY-LPEHRKFASA-N Asp-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N)C(=O)O DBWYWXNMZZYIRY-LPEHRKFASA-N 0.000 description 1
- RDRMWJBLOSRRAW-BYULHYEWSA-N Asp-Asn-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O RDRMWJBLOSRRAW-BYULHYEWSA-N 0.000 description 1
- JGDBHIVECJGXJA-FXQIFTODSA-N Asp-Asp-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JGDBHIVECJGXJA-FXQIFTODSA-N 0.000 description 1
- QOVWVLLHMMCFFY-ZLUOBGJFSA-N Asp-Asp-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QOVWVLLHMMCFFY-ZLUOBGJFSA-N 0.000 description 1
- WCFCYFDBMNFSPA-ACZMJKKPSA-N Asp-Asp-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(O)=O WCFCYFDBMNFSPA-ACZMJKKPSA-N 0.000 description 1
- TVVYVAUGRHNTGT-UGYAYLCHSA-N Asp-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O TVVYVAUGRHNTGT-UGYAYLCHSA-N 0.000 description 1
- SBHUBSDEZQFJHJ-CIUDSAMLSA-N Asp-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O SBHUBSDEZQFJHJ-CIUDSAMLSA-N 0.000 description 1
- VHWNKSJHQFZJTH-FXQIFTODSA-N Asp-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N VHWNKSJHQFZJTH-FXQIFTODSA-N 0.000 description 1
- LKIYSIYBKYLKPU-BIIVOSGPSA-N Asp-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N)C(=O)O LKIYSIYBKYLKPU-BIIVOSGPSA-N 0.000 description 1
- SNAWMGHSCHKSDK-GUBZILKMSA-N Asp-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N SNAWMGHSCHKSDK-GUBZILKMSA-N 0.000 description 1
- OEUQMKNNOWJREN-AVGNSLFASA-N Asp-Gln-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N OEUQMKNNOWJREN-AVGNSLFASA-N 0.000 description 1
- VAWNQIGQPUOPQW-ACZMJKKPSA-N Asp-Glu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O VAWNQIGQPUOPQW-ACZMJKKPSA-N 0.000 description 1
- QCLHLXDWRKOHRR-GUBZILKMSA-N Asp-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N QCLHLXDWRKOHRR-GUBZILKMSA-N 0.000 description 1
- KHBLRHKVXICFMY-GUBZILKMSA-N Asp-Glu-Lys Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O KHBLRHKVXICFMY-GUBZILKMSA-N 0.000 description 1
- ZEDBMCPXPIYJLW-XHNCKOQMSA-N Asp-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N)C(=O)O ZEDBMCPXPIYJLW-XHNCKOQMSA-N 0.000 description 1
- VIRHEUMYXXLCBF-WDSKDSINSA-N Asp-Gly-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O VIRHEUMYXXLCBF-WDSKDSINSA-N 0.000 description 1
- QHHVSXGWLYEAGX-GUBZILKMSA-N Asp-His-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N QHHVSXGWLYEAGX-GUBZILKMSA-N 0.000 description 1
- RWHHSFSWKFBTCF-KKUMJFAQSA-N Asp-His-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC(=O)O)N RWHHSFSWKFBTCF-KKUMJFAQSA-N 0.000 description 1
- GBSUGIXJAAKZOW-GMOBBJLQSA-N Asp-Ile-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GBSUGIXJAAKZOW-GMOBBJLQSA-N 0.000 description 1
- KQBVNNAPIURMPD-PEFMBERDSA-N Asp-Ile-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O KQBVNNAPIURMPD-PEFMBERDSA-N 0.000 description 1
- HOBNTSHITVVNBN-ZPFDUUQYSA-N Asp-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N HOBNTSHITVVNBN-ZPFDUUQYSA-N 0.000 description 1
- RTXQQDVBACBSCW-CFMVVWHZSA-N Asp-Ile-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RTXQQDVBACBSCW-CFMVVWHZSA-N 0.000 description 1
- KYQNAIMCTRZLNP-QSFUFRPTSA-N Asp-Ile-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O KYQNAIMCTRZLNP-QSFUFRPTSA-N 0.000 description 1
- XSXVLWBWIPKUSN-UHFFFAOYSA-N Asp-Leu-Glu-Asp Chemical compound OC(=O)CC(N)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(O)=O)C(O)=O XSXVLWBWIPKUSN-UHFFFAOYSA-N 0.000 description 1
- AYFVRYXNDHBECD-YUMQZZPRSA-N Asp-Leu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AYFVRYXNDHBECD-YUMQZZPRSA-N 0.000 description 1
- RQHLMGCXCZUOGT-ZPFDUUQYSA-N Asp-Leu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RQHLMGCXCZUOGT-ZPFDUUQYSA-N 0.000 description 1
- CJUKAWUWBZCTDQ-SRVKXCTJSA-N Asp-Leu-Lys Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O CJUKAWUWBZCTDQ-SRVKXCTJSA-N 0.000 description 1
- QNMKWNONJGKJJC-NHCYSSNCSA-N Asp-Leu-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O QNMKWNONJGKJJC-NHCYSSNCSA-N 0.000 description 1
- QNIACYURSSCLRP-GUBZILKMSA-N Asp-Lys-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O QNIACYURSSCLRP-GUBZILKMSA-N 0.000 description 1
- NVFSJIXJZCDICF-SRVKXCTJSA-N Asp-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N NVFSJIXJZCDICF-SRVKXCTJSA-N 0.000 description 1
- BPTFNDRZKBFMTH-DCAQKATOSA-N Asp-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N BPTFNDRZKBFMTH-DCAQKATOSA-N 0.000 description 1
- LKVKODXGSAFOFY-VEVYYDQMSA-N Asp-Met-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LKVKODXGSAFOFY-VEVYYDQMSA-N 0.000 description 1
- KRQFMDNIUOVRIF-KKUMJFAQSA-N Asp-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC(=O)O)N KRQFMDNIUOVRIF-KKUMJFAQSA-N 0.000 description 1
- JUWISGAGWSDGDH-KKUMJFAQSA-N Asp-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(O)=O)CC1=CC=CC=C1 JUWISGAGWSDGDH-KKUMJFAQSA-N 0.000 description 1
- PWAIZUBWHRHYKS-MELADBBJSA-N Asp-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC(=O)O)N)C(=O)O PWAIZUBWHRHYKS-MELADBBJSA-N 0.000 description 1
- LOEKZJRUVGORIY-CAMMJAKZSA-N Asp-Phe-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(O)=O)CC1=CC=CC=C1 LOEKZJRUVGORIY-CAMMJAKZSA-N 0.000 description 1
- FAUPLTGRUBTXNU-FXQIFTODSA-N Asp-Pro-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O FAUPLTGRUBTXNU-FXQIFTODSA-N 0.000 description 1
- FOXXZZGDIAQPQI-XKNYDFJKSA-N Asp-Pro-Ser-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O FOXXZZGDIAQPQI-XKNYDFJKSA-N 0.000 description 1
- WMLFFCRUSPNENW-ZLUOBGJFSA-N Asp-Ser-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O WMLFFCRUSPNENW-ZLUOBGJFSA-N 0.000 description 1
- BRRPVTUFESPTCP-ACZMJKKPSA-N Asp-Ser-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O BRRPVTUFESPTCP-ACZMJKKPSA-N 0.000 description 1
- XYPJXLLXNSAWHZ-SRVKXCTJSA-N Asp-Ser-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XYPJXLLXNSAWHZ-SRVKXCTJSA-N 0.000 description 1
- JSHWXQIZOCVWIA-ZKWXMUAHSA-N Asp-Ser-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O JSHWXQIZOCVWIA-ZKWXMUAHSA-N 0.000 description 1
- ITGFVUYOLWBPQW-KKHAAJSZSA-N Asp-Thr-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O ITGFVUYOLWBPQW-KKHAAJSZSA-N 0.000 description 1
- CXEFNHOVIIDHFU-IHPCNDPISA-N Asp-Trp-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CC(=O)O)N CXEFNHOVIIDHFU-IHPCNDPISA-N 0.000 description 1
- HCOQNGIHSXICCB-IHRRRGAJSA-N Asp-Tyr-Arg Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)O HCOQNGIHSXICCB-IHRRRGAJSA-N 0.000 description 1
- SQIARYGNVQWOSB-BZSNNMDCSA-N Asp-Tyr-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SQIARYGNVQWOSB-BZSNNMDCSA-N 0.000 description 1
- VHUKCUHLFMRHOD-MELADBBJSA-N Asp-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC(=O)O)N)C(=O)O VHUKCUHLFMRHOD-MELADBBJSA-N 0.000 description 1
- BYLPQJAWXJWUCJ-YDHLFZDLSA-N Asp-Tyr-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O BYLPQJAWXJWUCJ-YDHLFZDLSA-N 0.000 description 1
- XWKPSMRPIKKDDU-RCOVLWMOSA-N Asp-Val-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O XWKPSMRPIKKDDU-RCOVLWMOSA-N 0.000 description 1
- UXRVDHVARNBOIO-QSFUFRPTSA-N Asp-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(=O)O)N UXRVDHVARNBOIO-QSFUFRPTSA-N 0.000 description 1
- GIKOVDMXBAFXDF-NHCYSSNCSA-N Asp-Val-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GIKOVDMXBAFXDF-NHCYSSNCSA-N 0.000 description 1
- QPDUWAUSSWGJSB-NGZCFLSTSA-N Asp-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N QPDUWAUSSWGJSB-NGZCFLSTSA-N 0.000 description 1
- ZUNMTUPRQMWMHX-LSJOCFKGSA-N Asp-Val-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O ZUNMTUPRQMWMHX-LSJOCFKGSA-N 0.000 description 1
- GZYDPEJSZYZWEF-MXAVVETBSA-N Asp-Val-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O GZYDPEJSZYZWEF-MXAVVETBSA-N 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 101100512078 Caenorhabditis elegans lys-1 gene Proteins 0.000 description 1
- 241000426499 Chilo Species 0.000 description 1
- 241001525906 Choristoneura parallela Species 0.000 description 1
- 241001124562 Choristoneura rosaceana Species 0.000 description 1
- 241000723347 Cinnamomum Species 0.000 description 1
- CSWBSLXBXRFNST-UHFFFAOYSA-N Codlemone Natural products CC=CC=CCCCCCCCO CSWBSLXBXRFNST-UHFFFAOYSA-N 0.000 description 1
- 102000005870 Coenzyme A Ligases Human genes 0.000 description 1
- 241000539185 Crocidolomia Species 0.000 description 1
- 241000464975 Crocidolomia pavonana Species 0.000 description 1
- 240000006262 Cuphea hookeriana Species 0.000 description 1
- 241000167559 Cuphea palustris Species 0.000 description 1
- 244000019459 Cynara cardunculus Species 0.000 description 1
- 235000019106 Cynara scolymus Nutrition 0.000 description 1
- SQJSYLDKQBZQTG-FXQIFTODSA-N Cys-Asn-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CS)N SQJSYLDKQBZQTG-FXQIFTODSA-N 0.000 description 1
- SBMGKDLRJLYZCU-BIIVOSGPSA-N Cys-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CS)N)C(=O)O SBMGKDLRJLYZCU-BIIVOSGPSA-N 0.000 description 1
- ATPDEYTYWVMINF-ZLUOBGJFSA-N Cys-Cys-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O ATPDEYTYWVMINF-ZLUOBGJFSA-N 0.000 description 1
- VBPGTULCFGKGTF-ACZMJKKPSA-N Cys-Glu-Asp Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VBPGTULCFGKGTF-ACZMJKKPSA-N 0.000 description 1
- DZLQXIFVQFTFJY-BYPYZUCNSA-N Cys-Gly-Gly Chemical compound SC[C@H](N)C(=O)NCC(=O)NCC(O)=O DZLQXIFVQFTFJY-BYPYZUCNSA-N 0.000 description 1
- SSNJZBGOMNLSLA-CIUDSAMLSA-N Cys-Leu-Asn Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O SSNJZBGOMNLSLA-CIUDSAMLSA-N 0.000 description 1
- XZKJEOMFLDVXJG-KATARQTJSA-N Cys-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CS)N)O XZKJEOMFLDVXJG-KATARQTJSA-N 0.000 description 1
- BNCKELUXXUYRNY-GUBZILKMSA-N Cys-Lys-Glu Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CS)N BNCKELUXXUYRNY-GUBZILKMSA-N 0.000 description 1
- HEPLXMBVMCXTBP-QWRGUYRKSA-N Cys-Phe-Gly Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O HEPLXMBVMCXTBP-QWRGUYRKSA-N 0.000 description 1
- ZOKPRHVIFAUJPV-GUBZILKMSA-N Cys-Pro-Arg Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CS)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O ZOKPRHVIFAUJPV-GUBZILKMSA-N 0.000 description 1
- KJJASVYBTKRYSN-FXQIFTODSA-N Cys-Pro-Asp Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CS)N)C(=O)N[C@@H](CC(=O)O)C(=O)O KJJASVYBTKRYSN-FXQIFTODSA-N 0.000 description 1
- GGRDJANMZPGMNS-CIUDSAMLSA-N Cys-Ser-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O GGRDJANMZPGMNS-CIUDSAMLSA-N 0.000 description 1
- WZJLBUPPZRZNTO-CIUDSAMLSA-N Cys-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CS)N WZJLBUPPZRZNTO-CIUDSAMLSA-N 0.000 description 1
- NAPULYCVEVVFRB-HEIBUPTGSA-N Cys-Thr-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](N)CS NAPULYCVEVVFRB-HEIBUPTGSA-N 0.000 description 1
- BUAUGQJXGNRTQE-AAEUAGOBSA-N Cys-Trp-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CS)N BUAUGQJXGNRTQE-AAEUAGOBSA-N 0.000 description 1
- LLUXQOVDMQZMPJ-KKUMJFAQSA-N Cys-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CS)CC1=CC=C(O)C=C1 LLUXQOVDMQZMPJ-KKUMJFAQSA-N 0.000 description 1
- 102000016899 Cytochrome-B(5) Reductase Human genes 0.000 description 1
- 108010028689 Cytochrome-B(5) Reductase Proteins 0.000 description 1
- 108010090461 DFG peptide Proteins 0.000 description 1
- 230000033616 DNA repair Effects 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 101100009781 Danio rerio dmbx1a gene Proteins 0.000 description 1
- 238000006646 Dess-Martin oxidation reaction Methods 0.000 description 1
- 241000255601 Drosophila melanogaster Species 0.000 description 1
- 241000353522 Earias insulana Species 0.000 description 1
- 108091006149 Electron carriers Proteins 0.000 description 1
- 108090000371 Esterases Proteins 0.000 description 1
- 101710147667 Fatty aldehyde dehydrogenase HFD1 Proteins 0.000 description 1
- 241000206672 Gelidium Species 0.000 description 1
- JFOKLAPFYCTNHW-SRVKXCTJSA-N Gln-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)N)N JFOKLAPFYCTNHW-SRVKXCTJSA-N 0.000 description 1
- DTMLKCYOQKZXKZ-HJGDQZAQSA-N Gln-Arg-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DTMLKCYOQKZXKZ-HJGDQZAQSA-N 0.000 description 1
- RMOCFPBLHAOTDU-ACZMJKKPSA-N Gln-Asn-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RMOCFPBLHAOTDU-ACZMJKKPSA-N 0.000 description 1
- MGJMFSBEMSNYJL-AVGNSLFASA-N Gln-Asn-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MGJMFSBEMSNYJL-AVGNSLFASA-N 0.000 description 1
- IKDOHQHEFPPGJG-FXQIFTODSA-N Gln-Asp-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O IKDOHQHEFPPGJG-FXQIFTODSA-N 0.000 description 1
- XEYMBRRKIFYQMF-GUBZILKMSA-N Gln-Asp-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O XEYMBRRKIFYQMF-GUBZILKMSA-N 0.000 description 1
- KZEUVLLVULIPNX-GUBZILKMSA-N Gln-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N KZEUVLLVULIPNX-GUBZILKMSA-N 0.000 description 1
- OFPWCBGRYAOLMU-AVGNSLFASA-N Gln-Asp-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N)O OFPWCBGRYAOLMU-AVGNSLFASA-N 0.000 description 1
- XFKUFUJECJUQTQ-CIUDSAMLSA-N Gln-Gln-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XFKUFUJECJUQTQ-CIUDSAMLSA-N 0.000 description 1
- NPTGGVQJYRSMCM-GLLZPBPUSA-N Gln-Gln-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NPTGGVQJYRSMCM-GLLZPBPUSA-N 0.000 description 1
- LFIVHGMKWFGUGK-IHRRRGAJSA-N Gln-Glu-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N LFIVHGMKWFGUGK-IHRRRGAJSA-N 0.000 description 1
- ZNZPKVQURDQFFS-FXQIFTODSA-N Gln-Glu-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZNZPKVQURDQFFS-FXQIFTODSA-N 0.000 description 1
- VSXBYIJUAXPAAL-WDSKDSINSA-N Gln-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O VSXBYIJUAXPAAL-WDSKDSINSA-N 0.000 description 1
- MFJAPSYJQJCQDN-BQBZGAKWSA-N Gln-Gly-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O MFJAPSYJQJCQDN-BQBZGAKWSA-N 0.000 description 1
- NSORZJXKUQFEKL-JGVFFNPUSA-N Gln-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCC(=O)N)N)C(=O)O NSORZJXKUQFEKL-JGVFFNPUSA-N 0.000 description 1
- YRWWJCDWLVXTHN-LAEOZQHASA-N Gln-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N YRWWJCDWLVXTHN-LAEOZQHASA-N 0.000 description 1
- KKCJHBXMYYVWMX-KQXIARHKSA-N Gln-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N KKCJHBXMYYVWMX-KQXIARHKSA-N 0.000 description 1
- ITZWDGBYBPUZRG-KBIXCLLPSA-N Gln-Ile-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O ITZWDGBYBPUZRG-KBIXCLLPSA-N 0.000 description 1
- HYPVLWGNBIYTNA-GUBZILKMSA-N Gln-Leu-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HYPVLWGNBIYTNA-GUBZILKMSA-N 0.000 description 1
- QKCZZAZNMMVICF-DCAQKATOSA-N Gln-Leu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O QKCZZAZNMMVICF-DCAQKATOSA-N 0.000 description 1
- PSERKXGRRADTKA-MNXVOIDGSA-N Gln-Leu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PSERKXGRRADTKA-MNXVOIDGSA-N 0.000 description 1
- GURIQZQSTBBHRV-SRVKXCTJSA-N Gln-Lys-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GURIQZQSTBBHRV-SRVKXCTJSA-N 0.000 description 1
- SXGMGNZEHFORAV-IUCAKERBSA-N Gln-Lys-Gly Chemical compound C(CCN)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N SXGMGNZEHFORAV-IUCAKERBSA-N 0.000 description 1
- ZEEPYMXTJWIMSN-GUBZILKMSA-N Gln-Lys-Ser Chemical compound NCCCC[C@@H](C(=O)N[C@@H](CO)C(O)=O)NC(=O)[C@@H](N)CCC(N)=O ZEEPYMXTJWIMSN-GUBZILKMSA-N 0.000 description 1
- QKWBEMCLYTYBNI-GVXVVHGQSA-N Gln-Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(N)=O QKWBEMCLYTYBNI-GVXVVHGQSA-N 0.000 description 1
- KLKYKPXITJBSNI-CIUDSAMLSA-N Gln-Met-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O KLKYKPXITJBSNI-CIUDSAMLSA-N 0.000 description 1
- BJPPYOMRAVLXBY-YUMQZZPRSA-N Gln-Met-Gly Chemical compound CSCC[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N BJPPYOMRAVLXBY-YUMQZZPRSA-N 0.000 description 1
- HHRAEXBUNGTOGZ-IHRRRGAJSA-N Gln-Phe-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O HHRAEXBUNGTOGZ-IHRRRGAJSA-N 0.000 description 1
- OREPWMPAUWIIAM-ZPFDUUQYSA-N Gln-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N OREPWMPAUWIIAM-ZPFDUUQYSA-N 0.000 description 1
- YPFFHGRJCUBXPX-NHCYSSNCSA-N Gln-Pro-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCC(N)=O)C(O)=O YPFFHGRJCUBXPX-NHCYSSNCSA-N 0.000 description 1
- OKARHJKJTKFQBM-ACZMJKKPSA-N Gln-Ser-Asn Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OKARHJKJTKFQBM-ACZMJKKPSA-N 0.000 description 1
- YRHZWVKUFWCEPW-GLLZPBPUSA-N Gln-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O YRHZWVKUFWCEPW-GLLZPBPUSA-N 0.000 description 1
- DUGYCMAIAKAQPB-GLLZPBPUSA-N Gln-Thr-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DUGYCMAIAKAQPB-GLLZPBPUSA-N 0.000 description 1
- OUBUHIODTNUUTC-WDCWCFNPSA-N Gln-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O OUBUHIODTNUUTC-WDCWCFNPSA-N 0.000 description 1
- STHSGOZLFLFGSS-SUSMZKCASA-N Gln-Thr-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O STHSGOZLFLFGSS-SUSMZKCASA-N 0.000 description 1
- XKPACHRGOWQHFH-IRIUXVKKSA-N Gln-Thr-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XKPACHRGOWQHFH-IRIUXVKKSA-N 0.000 description 1
- BETSEXMYBWCDAE-SZMVWBNQSA-N Gln-Trp-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N BETSEXMYBWCDAE-SZMVWBNQSA-N 0.000 description 1
- AKDOUBMVLRCHBD-SIUGBPQLSA-N Gln-Tyr-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O AKDOUBMVLRCHBD-SIUGBPQLSA-N 0.000 description 1
- ZZLDMBMFKZFQMU-NRPADANISA-N Gln-Val-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O ZZLDMBMFKZFQMU-NRPADANISA-N 0.000 description 1
- KHHDJQRWIFHXHS-NRPADANISA-N Gln-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)N)N KHHDJQRWIFHXHS-NRPADANISA-N 0.000 description 1
- SDSMVVSHLAAOJL-UKJIMTQDSA-N Gln-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCC(=O)N)N SDSMVVSHLAAOJL-UKJIMTQDSA-N 0.000 description 1
- SZXSSXUNOALWCH-ACZMJKKPSA-N Glu-Ala-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O SZXSSXUNOALWCH-ACZMJKKPSA-N 0.000 description 1
- ATRHMOJQJWPVBQ-DRZSPHRISA-N Glu-Ala-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ATRHMOJQJWPVBQ-DRZSPHRISA-N 0.000 description 1
- VTTSANCGJWLPNC-ZPFDUUQYSA-N Glu-Arg-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VTTSANCGJWLPNC-ZPFDUUQYSA-N 0.000 description 1
- LTUVYLVIZHJCOQ-KKUMJFAQSA-N Glu-Arg-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LTUVYLVIZHJCOQ-KKUMJFAQSA-N 0.000 description 1
- VPKBCVUDBNINAH-GARJFASQSA-N Glu-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O VPKBCVUDBNINAH-GARJFASQSA-N 0.000 description 1
- DYFJZDDQPNIPAB-NHCYSSNCSA-N Glu-Arg-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O DYFJZDDQPNIPAB-NHCYSSNCSA-N 0.000 description 1
- GLWXKFRTOHKGIT-ACZMJKKPSA-N Glu-Asn-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O GLWXKFRTOHKGIT-ACZMJKKPSA-N 0.000 description 1
- YYOBUPFZLKQUAX-FXQIFTODSA-N Glu-Asn-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YYOBUPFZLKQUAX-FXQIFTODSA-N 0.000 description 1
- LJLPOZGRPLORTF-CIUDSAMLSA-N Glu-Asn-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O LJLPOZGRPLORTF-CIUDSAMLSA-N 0.000 description 1
- LXAUHIRMWXQRKI-XHNCKOQMSA-N Glu-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O LXAUHIRMWXQRKI-XHNCKOQMSA-N 0.000 description 1
- VAZZOGXDUQSVQF-NUMRIWBASA-N Glu-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N)O VAZZOGXDUQSVQF-NUMRIWBASA-N 0.000 description 1
- RDPOETHPAQEGDP-ACZMJKKPSA-N Glu-Asp-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RDPOETHPAQEGDP-ACZMJKKPSA-N 0.000 description 1
- PAQUJCSYVIBPLC-AVGNSLFASA-N Glu-Asp-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PAQUJCSYVIBPLC-AVGNSLFASA-N 0.000 description 1
- SBCYJMOOHUDWDA-NUMRIWBASA-N Glu-Asp-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SBCYJMOOHUDWDA-NUMRIWBASA-N 0.000 description 1
- CYHBMLHCQXXCCT-AVGNSLFASA-N Glu-Asp-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CYHBMLHCQXXCCT-AVGNSLFASA-N 0.000 description 1
- ZZIFPJZQHRJERU-WDSKDSINSA-N Glu-Cys-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(=O)NCC(O)=O ZZIFPJZQHRJERU-WDSKDSINSA-N 0.000 description 1
- PXHABOCPJVTGEK-BQBZGAKWSA-N Glu-Gln-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O PXHABOCPJVTGEK-BQBZGAKWSA-N 0.000 description 1
- PVBBEKPHARMPHX-DCAQKATOSA-N Glu-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O PVBBEKPHARMPHX-DCAQKATOSA-N 0.000 description 1
- RFDHKPSHTXZKLL-IHRRRGAJSA-N Glu-Gln-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)O)N RFDHKPSHTXZKLL-IHRRRGAJSA-N 0.000 description 1
- AUTNXSQEVVHSJK-YVNDNENWSA-N Glu-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O AUTNXSQEVVHSJK-YVNDNENWSA-N 0.000 description 1
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 1
- KUTPGXNAAOQSPD-LPEHRKFASA-N Glu-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O KUTPGXNAAOQSPD-LPEHRKFASA-N 0.000 description 1
- OAGVHWYIBZMWLA-YFKPBYRVSA-N Glu-Gly-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)NCC(O)=O OAGVHWYIBZMWLA-YFKPBYRVSA-N 0.000 description 1
- CAVMESABQIKFKT-IUCAKERBSA-N Glu-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N CAVMESABQIKFKT-IUCAKERBSA-N 0.000 description 1
- LRPXYSGPOBVBEH-IUCAKERBSA-N Glu-Gly-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O LRPXYSGPOBVBEH-IUCAKERBSA-N 0.000 description 1
- HILMIYALTUQTRC-XVKPBYJWSA-N Glu-Gly-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HILMIYALTUQTRC-XVKPBYJWSA-N 0.000 description 1
- XIKYNVKEUINBGL-IUCAKERBSA-N Glu-His-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)NCC(O)=O XIKYNVKEUINBGL-IUCAKERBSA-N 0.000 description 1
- VGOFRWOTSXVPAU-SDDRHHMPSA-N Glu-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCC(=O)O)N)C(=O)O VGOFRWOTSXVPAU-SDDRHHMPSA-N 0.000 description 1
- LGYCLOCORAEQSZ-PEFMBERDSA-N Glu-Ile-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O LGYCLOCORAEQSZ-PEFMBERDSA-N 0.000 description 1
- INGJLBQKTRJLFO-UKJIMTQDSA-N Glu-Ile-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O INGJLBQKTRJLFO-UKJIMTQDSA-N 0.000 description 1
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 1
- VSRCAOIHMGCIJK-SRVKXCTJSA-N Glu-Leu-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VSRCAOIHMGCIJK-SRVKXCTJSA-N 0.000 description 1
- VGBSZQSKQRMLHD-MNXVOIDGSA-N Glu-Leu-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VGBSZQSKQRMLHD-MNXVOIDGSA-N 0.000 description 1
- IVGJYOOGJLFKQE-AVGNSLFASA-N Glu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N IVGJYOOGJLFKQE-AVGNSLFASA-N 0.000 description 1
- DWBBKNPKDHXIAC-SRVKXCTJSA-N Glu-Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCC(O)=O DWBBKNPKDHXIAC-SRVKXCTJSA-N 0.000 description 1
- UGSVSNXPJJDJKL-SDDRHHMPSA-N Glu-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N UGSVSNXPJJDJKL-SDDRHHMPSA-N 0.000 description 1
- NJCALAAIGREHDR-WDCWCFNPSA-N Glu-Leu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NJCALAAIGREHDR-WDCWCFNPSA-N 0.000 description 1
- YGLCLCMAYUYZSG-AVGNSLFASA-N Glu-Lys-His Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 YGLCLCMAYUYZSG-AVGNSLFASA-N 0.000 description 1
- ILWHFUZZCFYSKT-AVGNSLFASA-N Glu-Lys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ILWHFUZZCFYSKT-AVGNSLFASA-N 0.000 description 1
- FMBWLLMUPXTXFC-SDDRHHMPSA-N Glu-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N)C(=O)O FMBWLLMUPXTXFC-SDDRHHMPSA-N 0.000 description 1
- RBXSZQRSEGYDFG-GUBZILKMSA-N Glu-Lys-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O RBXSZQRSEGYDFG-GUBZILKMSA-N 0.000 description 1
- SUIAHERNFYRBDZ-GVXVVHGQSA-N Glu-Lys-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O SUIAHERNFYRBDZ-GVXVVHGQSA-N 0.000 description 1
- ZQYZDDXTNQXUJH-CIUDSAMLSA-N Glu-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(=O)O)N ZQYZDDXTNQXUJH-CIUDSAMLSA-N 0.000 description 1
- HQOGXFLBAKJUMH-CIUDSAMLSA-N Glu-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N HQOGXFLBAKJUMH-CIUDSAMLSA-N 0.000 description 1
- ZIYGTCDTJJCDDP-JYJNAYRXSA-N Glu-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZIYGTCDTJJCDDP-JYJNAYRXSA-N 0.000 description 1
- YTRBQAQSUDSIQE-FHWLQOOXSA-N Glu-Phe-Phe Chemical compound C([C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 YTRBQAQSUDSIQE-FHWLQOOXSA-N 0.000 description 1
- FGSGPLRPQCZBSQ-AVGNSLFASA-N Glu-Phe-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O FGSGPLRPQCZBSQ-AVGNSLFASA-N 0.000 description 1
- ITVBKCZZLJUUHI-HTUGSXCWSA-N Glu-Phe-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ITVBKCZZLJUUHI-HTUGSXCWSA-N 0.000 description 1
- KXTAGESXNQEZKB-DZKIICNBSA-N Glu-Phe-Val Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 KXTAGESXNQEZKB-DZKIICNBSA-N 0.000 description 1
- DXVOKNVIKORTHQ-GUBZILKMSA-N Glu-Pro-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O DXVOKNVIKORTHQ-GUBZILKMSA-N 0.000 description 1
- SYWCGQOIIARSIX-SRVKXCTJSA-N Glu-Pro-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O SYWCGQOIIARSIX-SRVKXCTJSA-N 0.000 description 1
- BFEZQZKEPRKKHV-SRVKXCTJSA-N Glu-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)O)N)C(=O)N[C@@H](CCCCN)C(=O)O BFEZQZKEPRKKHV-SRVKXCTJSA-N 0.000 description 1
- ARIORLIIMJACKZ-KKUMJFAQSA-N Glu-Pro-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ARIORLIIMJACKZ-KKUMJFAQSA-N 0.000 description 1
- BPLNJYHNAJVLRT-ACZMJKKPSA-N Glu-Ser-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O BPLNJYHNAJVLRT-ACZMJKKPSA-N 0.000 description 1
- ZAPFAWQHBOHWLL-GUBZILKMSA-N Glu-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N ZAPFAWQHBOHWLL-GUBZILKMSA-N 0.000 description 1
- IDEODOAVGCMUQV-GUBZILKMSA-N Glu-Ser-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IDEODOAVGCMUQV-GUBZILKMSA-N 0.000 description 1
- QOXDAWODGSIDDI-GUBZILKMSA-N Glu-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N QOXDAWODGSIDDI-GUBZILKMSA-N 0.000 description 1
- HZISRJBYZAODRV-XQXXSGGOSA-N Glu-Thr-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O HZISRJBYZAODRV-XQXXSGGOSA-N 0.000 description 1
- RGJKYNUINKGPJN-RWRJDSDZSA-N Glu-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCC(=O)O)N RGJKYNUINKGPJN-RWRJDSDZSA-N 0.000 description 1
- DLISPGXMKZTWQG-IFFSRLJSSA-N Glu-Thr-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O DLISPGXMKZTWQG-IFFSRLJSSA-N 0.000 description 1
- BPCLDCNZBUYGOD-BPUTZDHNSA-N Glu-Trp-Glu Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 BPCLDCNZBUYGOD-BPUTZDHNSA-N 0.000 description 1
- JLCYOCDGIUZMKQ-JBACZVJFSA-N Glu-Trp-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CCC(=O)O)N JLCYOCDGIUZMKQ-JBACZVJFSA-N 0.000 description 1
- UCZXXMREFIETQW-AVGNSLFASA-N Glu-Tyr-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O UCZXXMREFIETQW-AVGNSLFASA-N 0.000 description 1
- UUTGYDAKPISJAO-JYJNAYRXSA-N Glu-Tyr-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 UUTGYDAKPISJAO-JYJNAYRXSA-N 0.000 description 1
- LSYFGBRDBIQYAQ-FHWLQOOXSA-N Glu-Tyr-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LSYFGBRDBIQYAQ-FHWLQOOXSA-N 0.000 description 1
- KIEICAOUSNYOLM-NRPADANISA-N Glu-Val-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O KIEICAOUSNYOLM-NRPADANISA-N 0.000 description 1
- LZEUDRYSAZAJIO-AUTRQRHGSA-N Glu-Val-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LZEUDRYSAZAJIO-AUTRQRHGSA-N 0.000 description 1
- HQTDNEZTGZUWSY-XVKPBYJWSA-N Glu-Val-Gly Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)NCC(O)=O HQTDNEZTGZUWSY-XVKPBYJWSA-N 0.000 description 1
- FGGKGJHCVMYGCD-UKJIMTQDSA-N Glu-Val-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FGGKGJHCVMYGCD-UKJIMTQDSA-N 0.000 description 1
- VIPDPMHGICREIS-GVXVVHGQSA-N Glu-Val-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VIPDPMHGICREIS-GVXVVHGQSA-N 0.000 description 1
- RMWAOBGCZZSJHE-UMNHJUIQSA-N Glu-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N RMWAOBGCZZSJHE-UMNHJUIQSA-N 0.000 description 1
- QXUPRMQJDWJDFR-NRPADANISA-N Glu-Val-Ser Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXUPRMQJDWJDFR-NRPADANISA-N 0.000 description 1
- UGVQELHRNUDMAA-BYPYZUCNSA-N Gly-Ala-Gly Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)NCC([O-])=O UGVQELHRNUDMAA-BYPYZUCNSA-N 0.000 description 1
- QSDKBRMVXSWAQE-BFHQHQDPSA-N Gly-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN QSDKBRMVXSWAQE-BFHQHQDPSA-N 0.000 description 1
- JXYMPBCYRKWJEE-BQBZGAKWSA-N Gly-Arg-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O JXYMPBCYRKWJEE-BQBZGAKWSA-N 0.000 description 1
- RJIVPOXLQFJRTG-LURJTMIESA-N Gly-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N RJIVPOXLQFJRTG-LURJTMIESA-N 0.000 description 1
- VXKCPBPQEKKERH-IUCAKERBSA-N Gly-Arg-Pro Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N1CCC[C@H]1C(O)=O VXKCPBPQEKKERH-IUCAKERBSA-N 0.000 description 1
- KKBWDNZXYLGJEY-UHFFFAOYSA-N Gly-Arg-Pro Natural products NCC(=O)NC(CCNC(=N)N)C(=O)N1CCCC1C(=O)O KKBWDNZXYLGJEY-UHFFFAOYSA-N 0.000 description 1
- GWCRIHNSVMOBEQ-BQBZGAKWSA-N Gly-Arg-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O GWCRIHNSVMOBEQ-BQBZGAKWSA-N 0.000 description 1
- UXJHNZODTMHWRD-WHFBIAKZSA-N Gly-Asn-Ala Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O UXJHNZODTMHWRD-WHFBIAKZSA-N 0.000 description 1
- JVACNFOPSUPDTK-QWRGUYRKSA-N Gly-Asn-Phe Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JVACNFOPSUPDTK-QWRGUYRKSA-N 0.000 description 1
- XRTDOIOIBMAXCT-NKWVEPMBSA-N Gly-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)CN)C(=O)O XRTDOIOIBMAXCT-NKWVEPMBSA-N 0.000 description 1
- FUTAPPOITCCWTH-WHFBIAKZSA-N Gly-Asp-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O FUTAPPOITCCWTH-WHFBIAKZSA-N 0.000 description 1
- LGQZOQRDEUIZJY-YUMQZZPRSA-N Gly-Cys-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CS)NC(=O)CN)C(O)=O LGQZOQRDEUIZJY-YUMQZZPRSA-N 0.000 description 1
- JMQFHZWESBGPFC-WDSKDSINSA-N Gly-Gln-Asp Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O JMQFHZWESBGPFC-WDSKDSINSA-N 0.000 description 1
- NPSWCZIRBAYNSB-JHEQGTHGSA-N Gly-Gln-Thr Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NPSWCZIRBAYNSB-JHEQGTHGSA-N 0.000 description 1
- QPDUVFSVVAOUHE-XVKPBYJWSA-N Gly-Gln-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)CN)C(O)=O QPDUVFSVVAOUHE-XVKPBYJWSA-N 0.000 description 1
- FIQQRCFQXGLOSZ-WDSKDSINSA-N Gly-Glu-Asp Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O FIQQRCFQXGLOSZ-WDSKDSINSA-N 0.000 description 1
- YYPFZVIXAVDHIK-IUCAKERBSA-N Gly-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN YYPFZVIXAVDHIK-IUCAKERBSA-N 0.000 description 1
- CCQOOWAONKGYKQ-BYPYZUCNSA-N Gly-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)CN CCQOOWAONKGYKQ-BYPYZUCNSA-N 0.000 description 1
- QPTNELDXWKRIFX-YFKPBYRVSA-N Gly-Gly-Gln Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O QPTNELDXWKRIFX-YFKPBYRVSA-N 0.000 description 1
- PDAWDNVHMUKWJR-ZETCQYMHSA-N Gly-Gly-His Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC1=CNC=N1 PDAWDNVHMUKWJR-ZETCQYMHSA-N 0.000 description 1
- XMPXVJIDADUOQB-RCOVLWMOSA-N Gly-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C([O-])=O)NC(=O)CNC(=O)C[NH3+] XMPXVJIDADUOQB-RCOVLWMOSA-N 0.000 description 1
- KAJAOGBVWCYGHZ-JTQLQIEISA-N Gly-Gly-Phe Chemical compound [NH3+]CC(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KAJAOGBVWCYGHZ-JTQLQIEISA-N 0.000 description 1
- OLPPXYMMIARYAL-QMMMGPOBSA-N Gly-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)CN OLPPXYMMIARYAL-QMMMGPOBSA-N 0.000 description 1
- HHSOPSCKAZKQHQ-PEXQALLHSA-N Gly-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)CN HHSOPSCKAZKQHQ-PEXQALLHSA-N 0.000 description 1
- MVORZMQFXBLMHM-QWRGUYRKSA-N Gly-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 MVORZMQFXBLMHM-QWRGUYRKSA-N 0.000 description 1
- SXJHOPPTOJACOA-QXEWZRGKSA-N Gly-Ile-Arg Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N SXJHOPPTOJACOA-QXEWZRGKSA-N 0.000 description 1
- UESJMAMHDLEHGM-NHCYSSNCSA-N Gly-Ile-Leu Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O UESJMAMHDLEHGM-NHCYSSNCSA-N 0.000 description 1
- BHPQOIPBLYJNAW-NGZCFLSTSA-N Gly-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN BHPQOIPBLYJNAW-NGZCFLSTSA-N 0.000 description 1
- HAXARWKYFIIHKD-ZKWXMUAHSA-N Gly-Ile-Ser Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HAXARWKYFIIHKD-ZKWXMUAHSA-N 0.000 description 1
- SCWYHUQOOFRVHP-MBLNEYKQSA-N Gly-Ile-Thr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SCWYHUQOOFRVHP-MBLNEYKQSA-N 0.000 description 1
- PAWIVEIWWYGBAM-YUMQZZPRSA-N Gly-Leu-Ala Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O PAWIVEIWWYGBAM-YUMQZZPRSA-N 0.000 description 1
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 1
- TWTPDFFBLQEBOE-IUCAKERBSA-N Gly-Leu-Gln Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O TWTPDFFBLQEBOE-IUCAKERBSA-N 0.000 description 1
- ULZCYBYDTUMHNF-IUCAKERBSA-N Gly-Leu-Glu Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ULZCYBYDTUMHNF-IUCAKERBSA-N 0.000 description 1
- CCBIBMKQNXHNIN-ZETCQYMHSA-N Gly-Leu-Gly Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CCBIBMKQNXHNIN-ZETCQYMHSA-N 0.000 description 1
- YSDLIYZLOTZZNP-UWVGGRQHSA-N Gly-Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN YSDLIYZLOTZZNP-UWVGGRQHSA-N 0.000 description 1
- NNCSJUBVFBDDLC-YUMQZZPRSA-N Gly-Leu-Ser Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O NNCSJUBVFBDDLC-YUMQZZPRSA-N 0.000 description 1
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 1
- VBOBNHSVQKKTOT-YUMQZZPRSA-N Gly-Lys-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O VBOBNHSVQKKTOT-YUMQZZPRSA-N 0.000 description 1
- BXICSAQLIHFDDL-YUMQZZPRSA-N Gly-Lys-Asn Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O BXICSAQLIHFDDL-YUMQZZPRSA-N 0.000 description 1
- GMTXWRIDLGTVFC-IUCAKERBSA-N Gly-Lys-Glu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GMTXWRIDLGTVFC-IUCAKERBSA-N 0.000 description 1
- PTIIBFKSLCYQBO-NHCYSSNCSA-N Gly-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)CN PTIIBFKSLCYQBO-NHCYSSNCSA-N 0.000 description 1
- FXGRXIATVXUAHO-WEDXCCLWSA-N Gly-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN FXGRXIATVXUAHO-WEDXCCLWSA-N 0.000 description 1
- DBJYVKDPGIFXFO-BQBZGAKWSA-N Gly-Met-Ala Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O DBJYVKDPGIFXFO-BQBZGAKWSA-N 0.000 description 1
- FJWSJWACLMTDMI-WPRPVWTQSA-N Gly-Met-Val Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O FJWSJWACLMTDMI-WPRPVWTQSA-N 0.000 description 1
- YYXJFBMCOUSYSF-RYUDHWBXSA-N Gly-Phe-Gln Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O YYXJFBMCOUSYSF-RYUDHWBXSA-N 0.000 description 1
- IGOYNRWLWHWAQO-JTQLQIEISA-N Gly-Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 IGOYNRWLWHWAQO-JTQLQIEISA-N 0.000 description 1
- 108010009504 Gly-Phe-Leu-Gly Proteins 0.000 description 1
- MXIULRKNFSCJHT-STQMWFEESA-N Gly-Phe-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 MXIULRKNFSCJHT-STQMWFEESA-N 0.000 description 1
- GGAPHLIUUTVYMX-QWRGUYRKSA-N Gly-Phe-Ser Chemical compound OC[C@@H](C([O-])=O)NC(=O)[C@@H](NC(=O)C[NH3+])CC1=CC=CC=C1 GGAPHLIUUTVYMX-QWRGUYRKSA-N 0.000 description 1
- JYPCXBJRLBHWME-IUCAKERBSA-N Gly-Pro-Arg Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JYPCXBJRLBHWME-IUCAKERBSA-N 0.000 description 1
- HFPVRZWORNJRRC-UWVGGRQHSA-N Gly-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN HFPVRZWORNJRRC-UWVGGRQHSA-N 0.000 description 1
- ISSDODCYBOWWIP-GJZGRUSLSA-N Gly-Pro-Trp Chemical compound [H]NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O ISSDODCYBOWWIP-GJZGRUSLSA-N 0.000 description 1
- JNGHLWWFPGIJER-STQMWFEESA-N Gly-Pro-Tyr Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 JNGHLWWFPGIJER-STQMWFEESA-N 0.000 description 1
- YOBGUCWZPXJHTN-BQBZGAKWSA-N Gly-Ser-Arg Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YOBGUCWZPXJHTN-BQBZGAKWSA-N 0.000 description 1
- IALQAMYQJBZNSK-WHFBIAKZSA-N Gly-Ser-Asn Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O IALQAMYQJBZNSK-WHFBIAKZSA-N 0.000 description 1
- OHUKZZYSJBKFRR-WHFBIAKZSA-N Gly-Ser-Asp Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O OHUKZZYSJBKFRR-WHFBIAKZSA-N 0.000 description 1
- CSMYMGFCEJWALV-WDSKDSINSA-N Gly-Ser-Gln Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O CSMYMGFCEJWALV-WDSKDSINSA-N 0.000 description 1
- WNGHUXFWEWTKAO-YUMQZZPRSA-N Gly-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN WNGHUXFWEWTKAO-YUMQZZPRSA-N 0.000 description 1
- IMRNSEPSPFQNHF-STQMWFEESA-N Gly-Ser-Trp Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=CC=CC=C12)C(=O)O IMRNSEPSPFQNHF-STQMWFEESA-N 0.000 description 1
- ZLCLYFGMKFCDCN-XPUUQOCRSA-N Gly-Ser-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CO)NC(=O)CN)C(O)=O ZLCLYFGMKFCDCN-XPUUQOCRSA-N 0.000 description 1
- ZZWUYQXMIFTIIY-WEDXCCLWSA-N Gly-Thr-Leu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O ZZWUYQXMIFTIIY-WEDXCCLWSA-N 0.000 description 1
- FFALDIDGPLUDKV-ZDLURKLDSA-N Gly-Thr-Ser Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O FFALDIDGPLUDKV-ZDLURKLDSA-N 0.000 description 1
- SFOXOSKVTLDEDM-HOTGVXAUSA-N Gly-Trp-Leu Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)CN)=CNC2=C1 SFOXOSKVTLDEDM-HOTGVXAUSA-N 0.000 description 1
- UMBDRSMLCUYIRI-DVJZZOLTSA-N Gly-Trp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)CN)O UMBDRSMLCUYIRI-DVJZZOLTSA-N 0.000 description 1
- KBBFOULZCHWGJX-KBPBESRZSA-N Gly-Tyr-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)CN)O KBBFOULZCHWGJX-KBPBESRZSA-N 0.000 description 1
- FNXSYBOHALPRHV-ONGXEEELSA-N Gly-Val-Lys Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN FNXSYBOHALPRHV-ONGXEEELSA-N 0.000 description 1
- YGHSQRJSHKYUJY-SCZZXKLOSA-N Gly-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN YGHSQRJSHKYUJY-SCZZXKLOSA-N 0.000 description 1
- AFMOTCMSEBITOE-YEPSODPASA-N Gly-Val-Thr Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AFMOTCMSEBITOE-YEPSODPASA-N 0.000 description 1
- KSOBNUBCYHGUKH-UWVGGRQHSA-N Gly-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN KSOBNUBCYHGUKH-UWVGGRQHSA-N 0.000 description 1
- 241001441330 Grapholita molesta Species 0.000 description 1
- 241000510199 Helicoverpa assulta Species 0.000 description 1
- 241000256244 Heliothis virescens Species 0.000 description 1
- DCRODRAURLJOFY-XPUUQOCRSA-N His-Ala-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)NCC(O)=O DCRODRAURLJOFY-XPUUQOCRSA-N 0.000 description 1
- FLUVGKKRRMLNPU-CQDKDKBSSA-N His-Ala-Phe Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O FLUVGKKRRMLNPU-CQDKDKBSSA-N 0.000 description 1
- JWTKVPMQCCRPQY-SRVKXCTJSA-N His-Asn-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JWTKVPMQCCRPQY-SRVKXCTJSA-N 0.000 description 1
- HRGGKHFHRSFSDE-CIUDSAMLSA-N His-Asn-Ser Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N HRGGKHFHRSFSDE-CIUDSAMLSA-N 0.000 description 1
- FMRKUXFLLPKVPG-JYJNAYRXSA-N His-Gln-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC2=CN=CN2)N)O FMRKUXFLLPKVPG-JYJNAYRXSA-N 0.000 description 1
- ZYDYEPDFFVCUBI-SRVKXCTJSA-N His-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CN=CN1)N ZYDYEPDFFVCUBI-SRVKXCTJSA-N 0.000 description 1
- STWGDDDFLUFCCA-GVXVVHGQSA-N His-Glu-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O STWGDDDFLUFCCA-GVXVVHGQSA-N 0.000 description 1
- CHZRWFUGWRTUOD-IUCAKERBSA-N His-Gly-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N CHZRWFUGWRTUOD-IUCAKERBSA-N 0.000 description 1
- QAMFAYSMNZBNCA-UWVGGRQHSA-N His-Gly-Met Chemical compound CSCC[C@H](NC(=O)CNC(=O)[C@@H](N)Cc1cnc[nH]1)C(O)=O QAMFAYSMNZBNCA-UWVGGRQHSA-N 0.000 description 1
- FZKFYOXDVWDELO-KBPBESRZSA-N His-Gly-Tyr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O FZKFYOXDVWDELO-KBPBESRZSA-N 0.000 description 1
- NTXIJPDAHXSHNL-ONGXEEELSA-N His-Gly-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O NTXIJPDAHXSHNL-ONGXEEELSA-N 0.000 description 1
- CTJHHEQNUNIYNN-SRVKXCTJSA-N His-His-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(O)=O CTJHHEQNUNIYNN-SRVKXCTJSA-N 0.000 description 1
- CNHSMSFYVARZLI-YJRXYDGGSA-N His-His-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CNHSMSFYVARZLI-YJRXYDGGSA-N 0.000 description 1
- FSOXZQBMPBQKGJ-QSFUFRPTSA-N His-Ile-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]([NH3+])CC1=CN=CN1 FSOXZQBMPBQKGJ-QSFUFRPTSA-N 0.000 description 1
- VJJSDSNFXCWCEJ-DJFWLOJKSA-N His-Ile-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O VJJSDSNFXCWCEJ-DJFWLOJKSA-N 0.000 description 1
- VTZYMXGGXOFBMX-DJFWLOJKSA-N His-Ile-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O VTZYMXGGXOFBMX-DJFWLOJKSA-N 0.000 description 1
- LBQAHBIVXQSBIR-HVTMNAMFSA-N His-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N LBQAHBIVXQSBIR-HVTMNAMFSA-N 0.000 description 1
- QMUHTRISZMFKAY-MXAVVETBSA-N His-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N QMUHTRISZMFKAY-MXAVVETBSA-N 0.000 description 1
- MJUUWJJEUOBDGW-IHRRRGAJSA-N His-Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 MJUUWJJEUOBDGW-IHRRRGAJSA-N 0.000 description 1
- SKOKHBGDXGTDDP-MELADBBJSA-N His-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N SKOKHBGDXGTDDP-MELADBBJSA-N 0.000 description 1
- LVWIJITYHRZHBO-IXOXFDKPSA-N His-Leu-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LVWIJITYHRZHBO-IXOXFDKPSA-N 0.000 description 1
- TWROVBNEHJSXDG-IHRRRGAJSA-N His-Leu-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O TWROVBNEHJSXDG-IHRRRGAJSA-N 0.000 description 1
- FHGVHXCQMJWQPK-SRVKXCTJSA-N His-Lys-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O FHGVHXCQMJWQPK-SRVKXCTJSA-N 0.000 description 1
- XKIYNCLILDLGRS-QWRGUYRKSA-N His-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 XKIYNCLILDLGRS-QWRGUYRKSA-N 0.000 description 1
- DEOQGJUXUQGUJN-KKUMJFAQSA-N His-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N DEOQGJUXUQGUJN-KKUMJFAQSA-N 0.000 description 1
- BCZFOHDMCDXPDA-BZSNNMDCSA-N His-Lys-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC2=CN=CN2)N)O BCZFOHDMCDXPDA-BZSNNMDCSA-N 0.000 description 1
- XDIVYNSPYBLSME-DCAQKATOSA-N His-Met-Asp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N XDIVYNSPYBLSME-DCAQKATOSA-N 0.000 description 1
- SVVULKPWDBIPCO-BZSNNMDCSA-N His-Phe-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O SVVULKPWDBIPCO-BZSNNMDCSA-N 0.000 description 1
- GNBHSMFBUNEWCJ-DCAQKATOSA-N His-Pro-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O GNBHSMFBUNEWCJ-DCAQKATOSA-N 0.000 description 1
- BZAQOPHNBFOOJS-DCAQKATOSA-N His-Pro-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O BZAQOPHNBFOOJS-DCAQKATOSA-N 0.000 description 1
- PYNPBMCLAKTHJL-SRVKXCTJSA-N His-Pro-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O PYNPBMCLAKTHJL-SRVKXCTJSA-N 0.000 description 1
- KAXZXLSXFWSNNZ-XVYDVKMFSA-N His-Ser-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KAXZXLSXFWSNNZ-XVYDVKMFSA-N 0.000 description 1
- PLCAEMGSYOYIPP-GUBZILKMSA-N His-Ser-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 PLCAEMGSYOYIPP-GUBZILKMSA-N 0.000 description 1
- UOYGZBIPZYKGSH-SRVKXCTJSA-N His-Ser-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N UOYGZBIPZYKGSH-SRVKXCTJSA-N 0.000 description 1
- VIJMRAIWYWRXSR-CIUDSAMLSA-N His-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 VIJMRAIWYWRXSR-CIUDSAMLSA-N 0.000 description 1
- RXKFKJVJVHLRIE-XIRDDKMYSA-N His-Ser-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC3=CN=CN3)N RXKFKJVJVHLRIE-XIRDDKMYSA-N 0.000 description 1
- DQZCEKQPSOBNMJ-NKIYYHGXSA-N His-Thr-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DQZCEKQPSOBNMJ-NKIYYHGXSA-N 0.000 description 1
- UIRUVUUGUYCMBY-KCTSRDHCSA-N His-Trp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CC3=CN=CN3)N UIRUVUUGUYCMBY-KCTSRDHCSA-N 0.000 description 1
- JVEKQAYXFGIISZ-HOCLYGCPSA-N His-Trp-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)NCC(O)=O)C1=CN=CN1 JVEKQAYXFGIISZ-HOCLYGCPSA-N 0.000 description 1
- DLTCGJZBNFOWFL-LKTVYLICSA-N His-Tyr-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CN=CN2)N DLTCGJZBNFOWFL-LKTVYLICSA-N 0.000 description 1
- UWNUQPZUSRFIIN-JUKXBJQTSA-N His-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CN=CN2)N UWNUQPZUSRFIIN-JUKXBJQTSA-N 0.000 description 1
- ISQOVWDWRUONJH-YESZJQIVSA-N His-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC3=CN=CN3)N)C(=O)O ISQOVWDWRUONJH-YESZJQIVSA-N 0.000 description 1
- 101100084403 Homo sapiens PRODH gene Proteins 0.000 description 1
- CISBRYJZMFWOHJ-JBDRJPRFSA-N Ile-Ala-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(=O)O)N CISBRYJZMFWOHJ-JBDRJPRFSA-N 0.000 description 1
- RWIKBYVJQAJYDP-BJDJZHNGSA-N Ile-Ala-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RWIKBYVJQAJYDP-BJDJZHNGSA-N 0.000 description 1
- DPTBVFUDCPINIP-JURCDPSOSA-N Ile-Ala-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 DPTBVFUDCPINIP-JURCDPSOSA-N 0.000 description 1
- CYHYBSGMHMHKOA-CIQUZCHMSA-N Ile-Ala-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N CYHYBSGMHMHKOA-CIQUZCHMSA-N 0.000 description 1
- MKWSZEHGHSLNPF-NAKRPEOUSA-N Ile-Ala-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O)N MKWSZEHGHSLNPF-NAKRPEOUSA-N 0.000 description 1
- TZCGZYWNIDZZMR-UHFFFAOYSA-N Ile-Arg-Ala Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(C)C(O)=O)CCCN=C(N)N TZCGZYWNIDZZMR-UHFFFAOYSA-N 0.000 description 1
- HLYBGMZJVDHJEO-CYDGBPFRSA-N Ile-Arg-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N HLYBGMZJVDHJEO-CYDGBPFRSA-N 0.000 description 1
- SACHLUOUHCVIKI-GMOBBJLQSA-N Ile-Arg-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N SACHLUOUHCVIKI-GMOBBJLQSA-N 0.000 description 1
- WECYRWOMWSCWNX-XUXIUFHCSA-N Ile-Arg-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(C)C)C(O)=O WECYRWOMWSCWNX-XUXIUFHCSA-N 0.000 description 1
- NULSANWBUWLTKN-NAKRPEOUSA-N Ile-Arg-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N NULSANWBUWLTKN-NAKRPEOUSA-N 0.000 description 1
- QADCTXFNLZBZAB-GHCJXIJMSA-N Ile-Asn-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C)C(=O)O)N QADCTXFNLZBZAB-GHCJXIJMSA-N 0.000 description 1
- HZMLFETXHFHGBB-UGYAYLCHSA-N Ile-Asn-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HZMLFETXHFHGBB-UGYAYLCHSA-N 0.000 description 1
- UAVQIQOOBXFKRC-BYULHYEWSA-N Ile-Asn-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O UAVQIQOOBXFKRC-BYULHYEWSA-N 0.000 description 1
- XENGULNPUDGALZ-ZPFDUUQYSA-N Ile-Asn-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(C)C)C(=O)O)N XENGULNPUDGALZ-ZPFDUUQYSA-N 0.000 description 1
- HDODQNPMSHDXJT-GHCJXIJMSA-N Ile-Asn-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O HDODQNPMSHDXJT-GHCJXIJMSA-N 0.000 description 1
- RPZFUIQVAPZLRH-GHCJXIJMSA-N Ile-Asp-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C)C(=O)O)N RPZFUIQVAPZLRH-GHCJXIJMSA-N 0.000 description 1
- NBJAAWYRLGCJOF-UGYAYLCHSA-N Ile-Asp-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N NBJAAWYRLGCJOF-UGYAYLCHSA-N 0.000 description 1
- IDAHFEPYTJJZFD-PEFMBERDSA-N Ile-Asp-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N IDAHFEPYTJJZFD-PEFMBERDSA-N 0.000 description 1
- GYAFMRQGWHXMII-IUKAMOBKSA-N Ile-Asp-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N GYAFMRQGWHXMII-IUKAMOBKSA-N 0.000 description 1
- REJKOQYVFDEZHA-SLBDDTMCSA-N Ile-Asp-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N REJKOQYVFDEZHA-SLBDDTMCSA-N 0.000 description 1
- AQTWDZDISVGCAC-CFMVVWHZSA-N Ile-Asp-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N AQTWDZDISVGCAC-CFMVVWHZSA-N 0.000 description 1
- LLZLRXBTOOFODM-QSFUFRPTSA-N Ile-Asp-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N LLZLRXBTOOFODM-QSFUFRPTSA-N 0.000 description 1
- KMBPQYKVZBMRMH-PEFMBERDSA-N Ile-Gln-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O KMBPQYKVZBMRMH-PEFMBERDSA-N 0.000 description 1
- JRYQSFOFUFXPTB-RWRJDSDZSA-N Ile-Gln-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N JRYQSFOFUFXPTB-RWRJDSDZSA-N 0.000 description 1
- BEWFWZRGBDVXRP-PEFMBERDSA-N Ile-Glu-Asn Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O BEWFWZRGBDVXRP-PEFMBERDSA-N 0.000 description 1
- LGMUPVWZEYYUMU-YVNDNENWSA-N Ile-Glu-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N LGMUPVWZEYYUMU-YVNDNENWSA-N 0.000 description 1
- LPXHYGGZJOCAFR-MNXVOIDGSA-N Ile-Glu-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N LPXHYGGZJOCAFR-MNXVOIDGSA-N 0.000 description 1
- DFJJAVZIHDFOGQ-MNXVOIDGSA-N Ile-Glu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N DFJJAVZIHDFOGQ-MNXVOIDGSA-N 0.000 description 1
- XLCZWMJPVGRWHJ-KQXIARHKSA-N Ile-Glu-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N XLCZWMJPVGRWHJ-KQXIARHKSA-N 0.000 description 1
- SPQWWEZBHXHUJN-KBIXCLLPSA-N Ile-Glu-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O SPQWWEZBHXHUJN-KBIXCLLPSA-N 0.000 description 1
- PNDMHTTXXPUQJH-RWRJDSDZSA-N Ile-Glu-Thr Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H]([C@H](O)C)C(=O)O PNDMHTTXXPUQJH-RWRJDSDZSA-N 0.000 description 1
- WUKLZPHVWAMZQV-UKJIMTQDSA-N Ile-Glu-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N WUKLZPHVWAMZQV-UKJIMTQDSA-N 0.000 description 1
- SLQVFYWBGNNOTK-BYULHYEWSA-N Ile-Gly-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N SLQVFYWBGNNOTK-BYULHYEWSA-N 0.000 description 1
- DFFTXLCCDFYRKD-MBLNEYKQSA-N Ile-Gly-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)O)N DFFTXLCCDFYRKD-MBLNEYKQSA-N 0.000 description 1
- VOBYAKCXGQQFLR-LSJOCFKGSA-N Ile-Gly-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O VOBYAKCXGQQFLR-LSJOCFKGSA-N 0.000 description 1
- YBGTWSFIGHUWQE-MXAVVETBSA-N Ile-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)CC)CC1=CN=CN1 YBGTWSFIGHUWQE-MXAVVETBSA-N 0.000 description 1
- APDIECQNNDGFPD-PYJNHQTQSA-N Ile-His-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](C(C)C)C(=O)O)N APDIECQNNDGFPD-PYJNHQTQSA-N 0.000 description 1
- SVBAHOMTJRFSIC-SXTJYALSSA-N Ile-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N SVBAHOMTJRFSIC-SXTJYALSSA-N 0.000 description 1
- PWDSHAAAFXISLE-SXTJYALSSA-N Ile-Ile-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O PWDSHAAAFXISLE-SXTJYALSSA-N 0.000 description 1
- YNMQUIVKEFRCPH-QSFUFRPTSA-N Ile-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)O)N YNMQUIVKEFRCPH-QSFUFRPTSA-N 0.000 description 1
- BBQABUDWDUKJMB-LZXPERKUSA-N Ile-Ile-Ile Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C([O-])=O BBQABUDWDUKJMB-LZXPERKUSA-N 0.000 description 1
- QZZIBQZLWBOOJH-PEDHHIEDSA-N Ile-Ile-Val Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(=O)O QZZIBQZLWBOOJH-PEDHHIEDSA-N 0.000 description 1
- KLBVGHCGHUNHEA-BJDJZHNGSA-N Ile-Leu-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)O)N KLBVGHCGHUNHEA-BJDJZHNGSA-N 0.000 description 1
- TWYOYAKMLHWMOJ-ZPFDUUQYSA-N Ile-Leu-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O TWYOYAKMLHWMOJ-ZPFDUUQYSA-N 0.000 description 1
- OUUCIIJSBIBCHB-ZPFDUUQYSA-N Ile-Leu-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O OUUCIIJSBIBCHB-ZPFDUUQYSA-N 0.000 description 1
- YGDWPQCLFJNMOL-MNXVOIDGSA-N Ile-Leu-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YGDWPQCLFJNMOL-MNXVOIDGSA-N 0.000 description 1
- DBXXASNNDTXOLU-MXAVVETBSA-N Ile-Leu-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N DBXXASNNDTXOLU-MXAVVETBSA-N 0.000 description 1
- GAZGFPOZOLEYAJ-YTFOTSKYSA-N Ile-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N GAZGFPOZOLEYAJ-YTFOTSKYSA-N 0.000 description 1
- HPCFRQWLTRDGHT-AJNGGQMLSA-N Ile-Leu-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O HPCFRQWLTRDGHT-AJNGGQMLSA-N 0.000 description 1
- TVYWVSJGSHQWMT-AJNGGQMLSA-N Ile-Leu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N TVYWVSJGSHQWMT-AJNGGQMLSA-N 0.000 description 1
- IOVUXUSIGXCREV-DKIMLUQUSA-N Ile-Leu-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IOVUXUSIGXCREV-DKIMLUQUSA-N 0.000 description 1
- PMMMQRVUMVURGJ-XUXIUFHCSA-N Ile-Leu-Pro Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O PMMMQRVUMVURGJ-XUXIUFHCSA-N 0.000 description 1
- DSDPLOODKXISDT-XUXIUFHCSA-N Ile-Leu-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O DSDPLOODKXISDT-XUXIUFHCSA-N 0.000 description 1
- UIEZQYNXCYHMQS-BJDJZHNGSA-N Ile-Lys-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)O)N UIEZQYNXCYHMQS-BJDJZHNGSA-N 0.000 description 1
- NZGTYCMLUGYMCV-XUXIUFHCSA-N Ile-Lys-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N NZGTYCMLUGYMCV-XUXIUFHCSA-N 0.000 description 1
- GLYJPWIRLBAIJH-FQUUOJAGSA-N Ile-Lys-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N GLYJPWIRLBAIJH-FQUUOJAGSA-N 0.000 description 1
- GLYJPWIRLBAIJH-UHFFFAOYSA-N Ile-Lys-Pro Natural products CCC(C)C(N)C(=O)NC(CCCCN)C(=O)N1CCCC1C(O)=O GLYJPWIRLBAIJH-UHFFFAOYSA-N 0.000 description 1
- UDBPXJNOEWDBDF-XUXIUFHCSA-N Ile-Lys-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)O)N UDBPXJNOEWDBDF-XUXIUFHCSA-N 0.000 description 1
- MASWXTFJVNRZPT-NAKRPEOUSA-N Ile-Met-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(=O)O)N MASWXTFJVNRZPT-NAKRPEOUSA-N 0.000 description 1
- WSSGUVAKYCQSCT-XUXIUFHCSA-N Ile-Met-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(=O)O)N WSSGUVAKYCQSCT-XUXIUFHCSA-N 0.000 description 1
- HQEPKOFULQTSFV-JURCDPSOSA-N Ile-Phe-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)O)N HQEPKOFULQTSFV-JURCDPSOSA-N 0.000 description 1
- WYUHAXJAMDTOAU-IAVJCBSLSA-N Ile-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N WYUHAXJAMDTOAU-IAVJCBSLSA-N 0.000 description 1
- CIDLJWVDMNDKPT-FIRPJDEBSA-N Ile-Phe-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N CIDLJWVDMNDKPT-FIRPJDEBSA-N 0.000 description 1
- OWSWUWDMSNXTNE-GMOBBJLQSA-N Ile-Pro-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N OWSWUWDMSNXTNE-GMOBBJLQSA-N 0.000 description 1
- IVXJIMGDOYRLQU-XUXIUFHCSA-N Ile-Pro-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O IVXJIMGDOYRLQU-XUXIUFHCSA-N 0.000 description 1
- MLSUZXHSNRBDCI-CYDGBPFRSA-N Ile-Pro-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)O)N MLSUZXHSNRBDCI-CYDGBPFRSA-N 0.000 description 1
- ZNOBVZFCHNHKHA-KBIXCLLPSA-N Ile-Ser-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZNOBVZFCHNHKHA-KBIXCLLPSA-N 0.000 description 1
- ZLFNNVATRMCAKN-ZKWXMUAHSA-N Ile-Ser-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZLFNNVATRMCAKN-ZKWXMUAHSA-N 0.000 description 1
- PELCGFMHLZXWBQ-BJDJZHNGSA-N Ile-Ser-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)O)N PELCGFMHLZXWBQ-BJDJZHNGSA-N 0.000 description 1
- PXKACEXYLPBMAD-JBDRJPRFSA-N Ile-Ser-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PXKACEXYLPBMAD-JBDRJPRFSA-N 0.000 description 1
- HXIDVIFHRYRXLZ-NAKRPEOUSA-N Ile-Ser-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)O)N HXIDVIFHRYRXLZ-NAKRPEOUSA-N 0.000 description 1
- PZWBBXHHUSIGKH-OSUNSFLBSA-N Ile-Thr-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PZWBBXHHUSIGKH-OSUNSFLBSA-N 0.000 description 1
- NAFIFZNBSPWYOO-RWRJDSDZSA-N Ile-Thr-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N NAFIFZNBSPWYOO-RWRJDSDZSA-N 0.000 description 1
- HJDZMPFEXINXLO-QPHKQPEJSA-N Ile-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N HJDZMPFEXINXLO-QPHKQPEJSA-N 0.000 description 1
- ANTFEOSJMAUGIB-KNZXXDILSA-N Ile-Thr-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@@H]1C(=O)O)N ANTFEOSJMAUGIB-KNZXXDILSA-N 0.000 description 1
- QHUREMVLLMNUAX-OSUNSFLBSA-N Ile-Thr-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)O)N QHUREMVLLMNUAX-OSUNSFLBSA-N 0.000 description 1
- DTPGSUQHUMELQB-GVARAGBVSA-N Ile-Tyr-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=C(O)C=C1 DTPGSUQHUMELQB-GVARAGBVSA-N 0.000 description 1
- FXJLRZFMKGHYJP-CFMVVWHZSA-N Ile-Tyr-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N FXJLRZFMKGHYJP-CFMVVWHZSA-N 0.000 description 1
- GVEODXUBBFDBPW-MGHWNKPDSA-N Ile-Tyr-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 GVEODXUBBFDBPW-MGHWNKPDSA-N 0.000 description 1
- HODVZHLJUUWPKY-STECZYCISA-N Ile-Tyr-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)CC)CC1=CC=C(O)C=C1 HODVZHLJUUWPKY-STECZYCISA-N 0.000 description 1
- NSPNUMNLZNOPAQ-SJWGOKEGSA-N Ile-Tyr-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N NSPNUMNLZNOPAQ-SJWGOKEGSA-N 0.000 description 1
- NXRNRBOKDBIVKQ-CXTHYWKRSA-N Ile-Tyr-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N NXRNRBOKDBIVKQ-CXTHYWKRSA-N 0.000 description 1
- WRDTXMBPHMBGIB-STECZYCISA-N Ile-Tyr-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=C(O)C=C1 WRDTXMBPHMBGIB-STECZYCISA-N 0.000 description 1
- YJRSIJZUIUANHO-NAKRPEOUSA-N Ile-Val-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(=O)O)N YJRSIJZUIUANHO-NAKRPEOUSA-N 0.000 description 1
- ZYVTXBXHIKGZMD-QSFUFRPTSA-N Ile-Val-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ZYVTXBXHIKGZMD-QSFUFRPTSA-N 0.000 description 1
- BCISUQVFDGYZBO-QSFUFRPTSA-N Ile-Val-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O BCISUQVFDGYZBO-QSFUFRPTSA-N 0.000 description 1
- JZBVBOKASHNXAD-NAKRPEOUSA-N Ile-Val-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N JZBVBOKASHNXAD-NAKRPEOUSA-N 0.000 description 1
- APQYGMBHIVXFML-OSUNSFLBSA-N Ile-Val-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N APQYGMBHIVXFML-OSUNSFLBSA-N 0.000 description 1
- QSXSHZIRKTUXNG-STECZYCISA-N Ile-Val-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QSXSHZIRKTUXNG-STECZYCISA-N 0.000 description 1
- PWWVAXIEGOYWEE-UHFFFAOYSA-N Isophenergan Chemical compound C1=CC=C2N(CC(C)N(C)C)C3=CC=CC=C3SC2=C1 PWWVAXIEGOYWEE-UHFFFAOYSA-N 0.000 description 1
- 239000005909 Kieselgur Substances 0.000 description 1
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 1
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 1
- ZRLUISBDKUWAIZ-CIUDSAMLSA-N Leu-Ala-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O ZRLUISBDKUWAIZ-CIUDSAMLSA-N 0.000 description 1
- MJOZZTKJZQFKDK-GUBZILKMSA-N Leu-Ala-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(N)=O MJOZZTKJZQFKDK-GUBZILKMSA-N 0.000 description 1
- CQQGCWPXDHTTNF-GUBZILKMSA-N Leu-Ala-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O CQQGCWPXDHTTNF-GUBZILKMSA-N 0.000 description 1
- PBCHMHROGNUXMK-DLOVCJGASA-N Leu-Ala-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 PBCHMHROGNUXMK-DLOVCJGASA-N 0.000 description 1
- KWTVLKBOQATPHJ-SRVKXCTJSA-N Leu-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N KWTVLKBOQATPHJ-SRVKXCTJSA-N 0.000 description 1
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 1
- XBBKIIGCUMBKCO-JXUBOQSCSA-N Leu-Ala-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XBBKIIGCUMBKCO-JXUBOQSCSA-N 0.000 description 1
- HBJZFCIVFIBNSV-DCAQKATOSA-N Leu-Arg-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O HBJZFCIVFIBNSV-DCAQKATOSA-N 0.000 description 1
- REPPKAMYTOJTFC-DCAQKATOSA-N Leu-Arg-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O REPPKAMYTOJTFC-DCAQKATOSA-N 0.000 description 1
- WUFYAPWIHCUMLL-CIUDSAMLSA-N Leu-Asn-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O WUFYAPWIHCUMLL-CIUDSAMLSA-N 0.000 description 1
- VCSBGUACOYUIGD-CIUDSAMLSA-N Leu-Asn-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VCSBGUACOYUIGD-CIUDSAMLSA-N 0.000 description 1
- KKXDHFKZWKLYGB-GUBZILKMSA-N Leu-Asn-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKXDHFKZWKLYGB-GUBZILKMSA-N 0.000 description 1
- POJPZSMTTMLSTG-SRVKXCTJSA-N Leu-Asn-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N POJPZSMTTMLSTG-SRVKXCTJSA-N 0.000 description 1
- MDVZJYGNAGLPGJ-KKUMJFAQSA-N Leu-Asn-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MDVZJYGNAGLPGJ-KKUMJFAQSA-N 0.000 description 1
- FIJMQLGQLBLBOL-HJGDQZAQSA-N Leu-Asn-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FIJMQLGQLBLBOL-HJGDQZAQSA-N 0.000 description 1
- BPANDPNDMJHFEV-CIUDSAMLSA-N Leu-Asp-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O BPANDPNDMJHFEV-CIUDSAMLSA-N 0.000 description 1
- DLFAACQHIRSQGG-CIUDSAMLSA-N Leu-Asp-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O DLFAACQHIRSQGG-CIUDSAMLSA-N 0.000 description 1
- ILJREDZFPHTUIE-GUBZILKMSA-N Leu-Asp-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ILJREDZFPHTUIE-GUBZILKMSA-N 0.000 description 1
- CLVUXCBGKUECIT-HJGDQZAQSA-N Leu-Asp-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CLVUXCBGKUECIT-HJGDQZAQSA-N 0.000 description 1
- DKEZVKFLETVJFY-CIUDSAMLSA-N Leu-Cys-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)N)C(=O)O)N DKEZVKFLETVJFY-CIUDSAMLSA-N 0.000 description 1
- YORLGJINWYYIMX-KKUMJFAQSA-N Leu-Cys-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O YORLGJINWYYIMX-KKUMJFAQSA-N 0.000 description 1
- VQPPIMUZCZCOIL-GUBZILKMSA-N Leu-Gln-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O VQPPIMUZCZCOIL-GUBZILKMSA-N 0.000 description 1
- VPKIQULSKFVCSM-SRVKXCTJSA-N Leu-Gln-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VPKIQULSKFVCSM-SRVKXCTJSA-N 0.000 description 1
- AXZGZMGRBDQTEY-SRVKXCTJSA-N Leu-Gln-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O AXZGZMGRBDQTEY-SRVKXCTJSA-N 0.000 description 1
- YVKSMSDXKMSIRX-GUBZILKMSA-N Leu-Glu-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O YVKSMSDXKMSIRX-GUBZILKMSA-N 0.000 description 1
- KVMULWOHPPMHHE-DCAQKATOSA-N Leu-Glu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KVMULWOHPPMHHE-DCAQKATOSA-N 0.000 description 1
- QVFGXCVIXXBFHO-AVGNSLFASA-N Leu-Glu-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O QVFGXCVIXXBFHO-AVGNSLFASA-N 0.000 description 1
- HQUXQAMSWFIRET-AVGNSLFASA-N Leu-Glu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HQUXQAMSWFIRET-AVGNSLFASA-N 0.000 description 1
- WQWSMEOYXJTFRU-GUBZILKMSA-N Leu-Glu-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O WQWSMEOYXJTFRU-GUBZILKMSA-N 0.000 description 1
- LLBQJYDYOLIQAI-JYJNAYRXSA-N Leu-Glu-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LLBQJYDYOLIQAI-JYJNAYRXSA-N 0.000 description 1
- HVJVUYQWFYMGJS-GVXVVHGQSA-N Leu-Glu-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O HVJVUYQWFYMGJS-GVXVVHGQSA-N 0.000 description 1
- FMEICTQWUKNAGC-YUMQZZPRSA-N Leu-Gly-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O FMEICTQWUKNAGC-YUMQZZPRSA-N 0.000 description 1
- LAPSXOAUPNOINL-YUMQZZPRSA-N Leu-Gly-Asp Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O LAPSXOAUPNOINL-YUMQZZPRSA-N 0.000 description 1
- KGCLIYGPQXUNLO-IUCAKERBSA-N Leu-Gly-Glu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O KGCLIYGPQXUNLO-IUCAKERBSA-N 0.000 description 1
- CCQLQKZTXZBXTN-NHCYSSNCSA-N Leu-Gly-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CCQLQKZTXZBXTN-NHCYSSNCSA-N 0.000 description 1
- APFJUBGRZGMQFF-QWRGUYRKSA-N Leu-Gly-Lys Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN APFJUBGRZGMQFF-QWRGUYRKSA-N 0.000 description 1
- KEVYYIMVELOXCT-KBPBESRZSA-N Leu-Gly-Phe Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KEVYYIMVELOXCT-KBPBESRZSA-N 0.000 description 1
- POZULHZYLPGXMR-ONGXEEELSA-N Leu-Gly-Val Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O POZULHZYLPGXMR-ONGXEEELSA-N 0.000 description 1
- VZBIUJURDLFFOE-IHRRRGAJSA-N Leu-His-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VZBIUJURDLFFOE-IHRRRGAJSA-N 0.000 description 1
- AVEGDIAXTDVBJS-XUXIUFHCSA-N Leu-Ile-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AVEGDIAXTDVBJS-XUXIUFHCSA-N 0.000 description 1
- KOSWSHVQIVTVQF-ZPFDUUQYSA-N Leu-Ile-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KOSWSHVQIVTVQF-ZPFDUUQYSA-N 0.000 description 1
- QJXHMYMRGDOHRU-NHCYSSNCSA-N Leu-Ile-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O QJXHMYMRGDOHRU-NHCYSSNCSA-N 0.000 description 1
- HNDWYLYAYNBWMP-AJNGGQMLSA-N Leu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N HNDWYLYAYNBWMP-AJNGGQMLSA-N 0.000 description 1
- HRTRLSRYZZKPCO-BJDJZHNGSA-N Leu-Ile-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HRTRLSRYZZKPCO-BJDJZHNGSA-N 0.000 description 1
- TVEOVCYCYGKVPP-HSCHXYMDSA-N Leu-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC(C)C)N TVEOVCYCYGKVPP-HSCHXYMDSA-N 0.000 description 1
- JKSIBWITFMQTOA-XUXIUFHCSA-N Leu-Ile-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O JKSIBWITFMQTOA-XUXIUFHCSA-N 0.000 description 1
- DSFYPIUSAMSERP-IHRRRGAJSA-N Leu-Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DSFYPIUSAMSERP-IHRRRGAJSA-N 0.000 description 1
- IAJFFZORSWOZPQ-SRVKXCTJSA-N Leu-Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IAJFFZORSWOZPQ-SRVKXCTJSA-N 0.000 description 1
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 1
- UBZGNBKMIJHOHL-BZSNNMDCSA-N Leu-Leu-Phe Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 UBZGNBKMIJHOHL-BZSNNMDCSA-N 0.000 description 1
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 1
- VCHVSKNMTXWIIP-SRVKXCTJSA-N Leu-Lys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O VCHVSKNMTXWIIP-SRVKXCTJSA-N 0.000 description 1
- ARRIJPQRBWRNLT-DCAQKATOSA-N Leu-Met-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ARRIJPQRBWRNLT-DCAQKATOSA-N 0.000 description 1
- DDVHDMSBLRAKNV-IHRRRGAJSA-N Leu-Met-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O DDVHDMSBLRAKNV-IHRRRGAJSA-N 0.000 description 1
- HDHQQEDVWQGBEE-DCAQKATOSA-N Leu-Met-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O HDHQQEDVWQGBEE-DCAQKATOSA-N 0.000 description 1
- JVTYXRRFZCEPPK-RHYQMDGZSA-N Leu-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC(C)C)N)O JVTYXRRFZCEPPK-RHYQMDGZSA-N 0.000 description 1
- LQUIENKUVKPNIC-ULQDDVLXSA-N Leu-Met-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LQUIENKUVKPNIC-ULQDDVLXSA-N 0.000 description 1
- GCXGCIYIHXSKAY-ULQDDVLXSA-N Leu-Phe-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GCXGCIYIHXSKAY-ULQDDVLXSA-N 0.000 description 1
- INCJJHQRZGQLFC-KBPBESRZSA-N Leu-Phe-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O INCJJHQRZGQLFC-KBPBESRZSA-N 0.000 description 1
- DRWMRVFCKKXHCH-BZSNNMDCSA-N Leu-Phe-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=CC=C1 DRWMRVFCKKXHCH-BZSNNMDCSA-N 0.000 description 1
- PJWOOBTYQNNRBF-BZSNNMDCSA-N Leu-Phe-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)O)N PJWOOBTYQNNRBF-BZSNNMDCSA-N 0.000 description 1
- UHNQRAFSEBGZFZ-YESZJQIVSA-N Leu-Phe-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N UHNQRAFSEBGZFZ-YESZJQIVSA-N 0.000 description 1
- PTRKPHUGYULXPU-KKUMJFAQSA-N Leu-Phe-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O PTRKPHUGYULXPU-KKUMJFAQSA-N 0.000 description 1
- MAXILRZVORNXBE-PMVMPFDFSA-N Leu-Phe-Trp Chemical compound C([C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=CC=C1 MAXILRZVORNXBE-PMVMPFDFSA-N 0.000 description 1
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 1
- YUTNOGOMBNYPFH-XUXIUFHCSA-N Leu-Pro-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YUTNOGOMBNYPFH-XUXIUFHCSA-N 0.000 description 1
- KWLWZYMNUZJKMZ-IHRRRGAJSA-N Leu-Pro-Leu Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O KWLWZYMNUZJKMZ-IHRRRGAJSA-N 0.000 description 1
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 1
- KZZCOWMDDXDKSS-CIUDSAMLSA-N Leu-Ser-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KZZCOWMDDXDKSS-CIUDSAMLSA-N 0.000 description 1
- IWMJFLJQHIDZQW-KKUMJFAQSA-N Leu-Ser-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IWMJFLJQHIDZQW-KKUMJFAQSA-N 0.000 description 1
- BRTVHXHCUSXYRI-CIUDSAMLSA-N Leu-Ser-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O BRTVHXHCUSXYRI-CIUDSAMLSA-N 0.000 description 1
- HWMQRQIFVGEAPH-XIRDDKMYSA-N Leu-Ser-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 HWMQRQIFVGEAPH-XIRDDKMYSA-N 0.000 description 1
- ZJZNLRVCZWUONM-JXUBOQSCSA-N Leu-Thr-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O ZJZNLRVCZWUONM-JXUBOQSCSA-N 0.000 description 1
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 1
- HGLKOTPFWOMPOB-MEYUZBJRSA-N Leu-Thr-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HGLKOTPFWOMPOB-MEYUZBJRSA-N 0.000 description 1
- SNOUHRPNNCAOPI-SZMVWBNQSA-N Leu-Trp-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N SNOUHRPNNCAOPI-SZMVWBNQSA-N 0.000 description 1
- LFXSPAIBSZSTEM-PMVMPFDFSA-N Leu-Trp-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CC=CC=C3)C(=O)O)N LFXSPAIBSZSTEM-PMVMPFDFSA-N 0.000 description 1
- HQBOMRTVKVKFMN-WDSOQIARSA-N Leu-Trp-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C(C)C)C(O)=O HQBOMRTVKVKFMN-WDSOQIARSA-N 0.000 description 1
- ARNIBBOXIAWUOP-MGHWNKPDSA-N Leu-Tyr-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ARNIBBOXIAWUOP-MGHWNKPDSA-N 0.000 description 1
- FBNPMTNBFFAMMH-AVGNSLFASA-N Leu-Val-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-AVGNSLFASA-N 0.000 description 1
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 1
- CGHXMODRYJISSK-NHCYSSNCSA-N Leu-Val-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O CGHXMODRYJISSK-NHCYSSNCSA-N 0.000 description 1
- AAKRWBIIGKPOKQ-ONGXEEELSA-N Leu-Val-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 1
- LMDVGHQPPPLYAR-IHRRRGAJSA-N Leu-Val-His Chemical compound N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O LMDVGHQPPPLYAR-IHRRRGAJSA-N 0.000 description 1
- FMFNIDICDKEMOE-XUXIUFHCSA-N Leu-Val-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FMFNIDICDKEMOE-XUXIUFHCSA-N 0.000 description 1
- FDBTVENULFNTAL-XQQFMLRXSA-N Leu-Val-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N FDBTVENULFNTAL-XQQFMLRXSA-N 0.000 description 1
- VKVDRTGWLVZJOM-DCAQKATOSA-N Leu-Val-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O VKVDRTGWLVZJOM-DCAQKATOSA-N 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- 101710153103 Long-chain-fatty-acid-CoA ligase FadD13 Proteins 0.000 description 1
- MPGHETGWWWUHPY-CIUDSAMLSA-N Lys-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN MPGHETGWWWUHPY-CIUDSAMLSA-N 0.000 description 1
- JCFYLFOCALSNLQ-GUBZILKMSA-N Lys-Ala-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JCFYLFOCALSNLQ-GUBZILKMSA-N 0.000 description 1
- KCXUCYYZNZFGLL-SRVKXCTJSA-N Lys-Ala-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O KCXUCYYZNZFGLL-SRVKXCTJSA-N 0.000 description 1
- IXHKPDJKKCUKHS-GARJFASQSA-N Lys-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IXHKPDJKKCUKHS-GARJFASQSA-N 0.000 description 1
- UWKNTTJNVSYXPC-CIUDSAMLSA-N Lys-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN UWKNTTJNVSYXPC-CIUDSAMLSA-N 0.000 description 1
- VHXMZJGOKIMETG-CQDKDKBSSA-N Lys-Ala-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CCCCN)N VHXMZJGOKIMETG-CQDKDKBSSA-N 0.000 description 1
- IRNSXVOWSXSULE-DCAQKATOSA-N Lys-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN IRNSXVOWSXSULE-DCAQKATOSA-N 0.000 description 1
- NTEVEUCLFMWSND-SRVKXCTJSA-N Lys-Arg-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O NTEVEUCLFMWSND-SRVKXCTJSA-N 0.000 description 1
- YNNPKXBBRZVIRX-IHRRRGAJSA-N Lys-Arg-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O YNNPKXBBRZVIRX-IHRRRGAJSA-N 0.000 description 1
- DGAAQRAUOFHBFJ-CIUDSAMLSA-N Lys-Asn-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O DGAAQRAUOFHBFJ-CIUDSAMLSA-N 0.000 description 1
- FACUGMGEFUEBTI-SRVKXCTJSA-N Lys-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCCCN FACUGMGEFUEBTI-SRVKXCTJSA-N 0.000 description 1
- ZQCVMVCVPFYXHZ-SRVKXCTJSA-N Lys-Asn-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN ZQCVMVCVPFYXHZ-SRVKXCTJSA-N 0.000 description 1
- QUCDKEKDPYISNX-HJGDQZAQSA-N Lys-Asn-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QUCDKEKDPYISNX-HJGDQZAQSA-N 0.000 description 1
- HKCCVDWHHTVVPN-CIUDSAMLSA-N Lys-Asp-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O HKCCVDWHHTVVPN-CIUDSAMLSA-N 0.000 description 1
- HIIZIQUUHIXUJY-GUBZILKMSA-N Lys-Asp-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HIIZIQUUHIXUJY-GUBZILKMSA-N 0.000 description 1
- AAORVPFVUIHEAB-YUMQZZPRSA-N Lys-Asp-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O AAORVPFVUIHEAB-YUMQZZPRSA-N 0.000 description 1
- WGCKDDHUFPQSMZ-ZPFDUUQYSA-N Lys-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCCCN WGCKDDHUFPQSMZ-ZPFDUUQYSA-N 0.000 description 1
- NRQRKMYZONPCTM-CIUDSAMLSA-N Lys-Asp-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O NRQRKMYZONPCTM-CIUDSAMLSA-N 0.000 description 1
- SFQPJNQDUUYCLA-BJDJZHNGSA-N Lys-Cys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCCCN)N SFQPJNQDUUYCLA-BJDJZHNGSA-N 0.000 description 1
- HWMZUBUEOYAQSC-DCAQKATOSA-N Lys-Gln-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O HWMZUBUEOYAQSC-DCAQKATOSA-N 0.000 description 1
- YVMQJGWLHRWMDF-MNXVOIDGSA-N Lys-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N YVMQJGWLHRWMDF-MNXVOIDGSA-N 0.000 description 1
- RZHLIPMZXOEJTL-AVGNSLFASA-N Lys-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N RZHLIPMZXOEJTL-AVGNSLFASA-N 0.000 description 1
- QQUJSUFWEDZQQY-AVGNSLFASA-N Lys-Gln-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN QQUJSUFWEDZQQY-AVGNSLFASA-N 0.000 description 1
- NNCDAORZCMPZPX-GUBZILKMSA-N Lys-Gln-Ser Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N NNCDAORZCMPZPX-GUBZILKMSA-N 0.000 description 1
- PBIPLDMFHAICIP-DCAQKATOSA-N Lys-Glu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PBIPLDMFHAICIP-DCAQKATOSA-N 0.000 description 1
- DCRWPTBMWMGADO-AVGNSLFASA-N Lys-Glu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DCRWPTBMWMGADO-AVGNSLFASA-N 0.000 description 1
- PAMDBWYMLWOELY-SDDRHHMPSA-N Lys-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCCN)N)C(=O)O PAMDBWYMLWOELY-SDDRHHMPSA-N 0.000 description 1
- WGLAORUKDGRINI-WDCWCFNPSA-N Lys-Glu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGLAORUKDGRINI-WDCWCFNPSA-N 0.000 description 1
- QZONCCHVHCOBSK-YUMQZZPRSA-N Lys-Gly-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O QZONCCHVHCOBSK-YUMQZZPRSA-N 0.000 description 1
- NKKFVJRLCCUJNA-QWRGUYRKSA-N Lys-Gly-Lys Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN NKKFVJRLCCUJNA-QWRGUYRKSA-N 0.000 description 1
- ZASPELYMPSACER-HOCLYGCPSA-N Lys-Gly-Trp Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O ZASPELYMPSACER-HOCLYGCPSA-N 0.000 description 1
- HAUUXTXKJNVIFY-ONGXEEELSA-N Lys-Gly-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAUUXTXKJNVIFY-ONGXEEELSA-N 0.000 description 1
- CAVGLNOOIFHJOF-SRVKXCTJSA-N Lys-His-Cys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCCN)N CAVGLNOOIFHJOF-SRVKXCTJSA-N 0.000 description 1
- OWRUUFUVXFREBD-KKUMJFAQSA-N Lys-His-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O OWRUUFUVXFREBD-KKUMJFAQSA-N 0.000 description 1
- XREQQOATSMMAJP-MGHWNKPDSA-N Lys-Ile-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XREQQOATSMMAJP-MGHWNKPDSA-N 0.000 description 1
- WAIHHELKYSFIQN-XUXIUFHCSA-N Lys-Ile-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O WAIHHELKYSFIQN-XUXIUFHCSA-N 0.000 description 1
- VMTYLUGCXIEDMV-QWRGUYRKSA-N Lys-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCCCN VMTYLUGCXIEDMV-QWRGUYRKSA-N 0.000 description 1
- QKXZCUCBFPEXNK-KKUMJFAQSA-N Lys-Leu-His Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 QKXZCUCBFPEXNK-KKUMJFAQSA-N 0.000 description 1
- WVJNGSFKBKOKRV-AJNGGQMLSA-N Lys-Leu-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVJNGSFKBKOKRV-AJNGGQMLSA-N 0.000 description 1
- RBEATVHTWHTHTJ-KKUMJFAQSA-N Lys-Leu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O RBEATVHTWHTHTJ-KKUMJFAQSA-N 0.000 description 1
- ORVFEGYUJITPGI-IHRRRGAJSA-N Lys-Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCCCN ORVFEGYUJITPGI-IHRRRGAJSA-N 0.000 description 1
- OIQSIMFSVLLWBX-VOAKCMCISA-N Lys-Leu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OIQSIMFSVLLWBX-VOAKCMCISA-N 0.000 description 1
- RIJCHEVHFWMDKD-SRVKXCTJSA-N Lys-Lys-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O RIJCHEVHFWMDKD-SRVKXCTJSA-N 0.000 description 1
- UQRZFMQQXXJTTF-AVGNSLFASA-N Lys-Lys-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O UQRZFMQQXXJTTF-AVGNSLFASA-N 0.000 description 1
- JQSIGLHQNSZZRL-KKUMJFAQSA-N Lys-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N JQSIGLHQNSZZRL-KKUMJFAQSA-N 0.000 description 1
- GAHJXEMYXKLZRQ-AJNGGQMLSA-N Lys-Lys-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GAHJXEMYXKLZRQ-AJNGGQMLSA-N 0.000 description 1
- INMBONMDMGPADT-AVGNSLFASA-N Lys-Met-Met Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCCCN)N INMBONMDMGPADT-AVGNSLFASA-N 0.000 description 1
- ODTZHNZPINULEU-KKUMJFAQSA-N Lys-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N ODTZHNZPINULEU-KKUMJFAQSA-N 0.000 description 1
- AEIIJFBQVGYVEV-YESZJQIVSA-N Lys-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CCCCN)N)C(=O)O AEIIJFBQVGYVEV-YESZJQIVSA-N 0.000 description 1
- LUAJJLPHUXPQLH-KKUMJFAQSA-N Lys-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCCCN)N LUAJJLPHUXPQLH-KKUMJFAQSA-N 0.000 description 1
- PDIDTSZKKFEDMB-UWVGGRQHSA-N Lys-Pro-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O PDIDTSZKKFEDMB-UWVGGRQHSA-N 0.000 description 1
- LECIJRIRMVOFMH-ULQDDVLXSA-N Lys-Pro-Phe Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 LECIJRIRMVOFMH-ULQDDVLXSA-N 0.000 description 1
- YTJFXEDRUOQGSP-DCAQKATOSA-N Lys-Pro-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O YTJFXEDRUOQGSP-DCAQKATOSA-N 0.000 description 1
- YSPZCHGIWAQVKQ-AVGNSLFASA-N Lys-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN YSPZCHGIWAQVKQ-AVGNSLFASA-N 0.000 description 1
- MGKFCQFVPKOWOL-CIUDSAMLSA-N Lys-Ser-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N MGKFCQFVPKOWOL-CIUDSAMLSA-N 0.000 description 1
- DLCAXBGXGOVUCD-PPCPHDFISA-N Lys-Thr-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DLCAXBGXGOVUCD-PPCPHDFISA-N 0.000 description 1
- YKBSXQFZWFXFIB-VOAKCMCISA-N Lys-Thr-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCCN)C(O)=O YKBSXQFZWFXFIB-VOAKCMCISA-N 0.000 description 1
- BDFHWFUAQLIMJO-KXNHARMFSA-N Lys-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N)O BDFHWFUAQLIMJO-KXNHARMFSA-N 0.000 description 1
- CAVRAQIDHUPECU-UVOCVTCTSA-N Lys-Thr-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAVRAQIDHUPECU-UVOCVTCTSA-N 0.000 description 1
- YFQSSOAGMZGXFT-MEYUZBJRSA-N Lys-Thr-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YFQSSOAGMZGXFT-MEYUZBJRSA-N 0.000 description 1
- BIWVMACFGZFIEB-VFAJRCTISA-N Lys-Trp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCCCN)N)O BIWVMACFGZFIEB-VFAJRCTISA-N 0.000 description 1
- WINFHLHJTRGLCV-BZSNNMDCSA-N Lys-Tyr-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=C(O)C=C1 WINFHLHJTRGLCV-BZSNNMDCSA-N 0.000 description 1
- QLFAPXUXEBAWEK-NHCYSSNCSA-N Lys-Val-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QLFAPXUXEBAWEK-NHCYSSNCSA-N 0.000 description 1
- UGCIQUYEJIEHKX-GVXVVHGQSA-N Lys-Val-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O UGCIQUYEJIEHKX-GVXVVHGQSA-N 0.000 description 1
- TXTZMVNJIRZABH-ULQDDVLXSA-N Lys-Val-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 TXTZMVNJIRZABH-ULQDDVLXSA-N 0.000 description 1
- GILLQRYAWOMHED-DCAQKATOSA-N Lys-Val-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN GILLQRYAWOMHED-DCAQKATOSA-N 0.000 description 1
- RIPJMCFGQHGHNP-RHYQMDGZSA-N Lys-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCCCN)N)O RIPJMCFGQHGHNP-RHYQMDGZSA-N 0.000 description 1
- HMZPYMSEAALNAE-ULQDDVLXSA-N Lys-Val-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O HMZPYMSEAALNAE-ULQDDVLXSA-N 0.000 description 1
- IKXQOBUBZSOWDY-AVGNSLFASA-N Lys-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N IKXQOBUBZSOWDY-AVGNSLFASA-N 0.000 description 1
- 241000555303 Mamestra brassicae Species 0.000 description 1
- PWPBGAJJYJJVPI-PJODQICGSA-N Met-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)CCSC)C(O)=O)=CNC2=C1 PWPBGAJJYJJVPI-PJODQICGSA-N 0.000 description 1
- PJWDQHNOJIBMRY-JYJNAYRXSA-N Met-Arg-Tyr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PJWDQHNOJIBMRY-JYJNAYRXSA-N 0.000 description 1
- NSGXXVIHCIAISP-CIUDSAMLSA-N Met-Asn-Gln Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O NSGXXVIHCIAISP-CIUDSAMLSA-N 0.000 description 1
- CAODKDAPYGUMLK-FXQIFTODSA-N Met-Asn-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O CAODKDAPYGUMLK-FXQIFTODSA-N 0.000 description 1
- JQECLVNLAZGHRQ-CIUDSAMLSA-N Met-Asp-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(N)=O JQECLVNLAZGHRQ-CIUDSAMLSA-N 0.000 description 1
- XMMWDTUFTZMQFD-GMOBBJLQSA-N Met-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCSC XMMWDTUFTZMQFD-GMOBBJLQSA-N 0.000 description 1
- RPEPZINUYHUBKG-FXQIFTODSA-N Met-Cys-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O RPEPZINUYHUBKG-FXQIFTODSA-N 0.000 description 1
- UJDMTKHGWSBHBX-IHRRRGAJSA-N Met-Cys-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 UJDMTKHGWSBHBX-IHRRRGAJSA-N 0.000 description 1
- QMIXOTQHYHOUJP-KKUMJFAQSA-N Met-Gln-Tyr Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N QMIXOTQHYHOUJP-KKUMJFAQSA-N 0.000 description 1
- FYRUJIJAUPHUNB-IUCAKERBSA-N Met-Gly-Arg Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N FYRUJIJAUPHUNB-IUCAKERBSA-N 0.000 description 1
- UZVKFARGHHMQGX-IUCAKERBSA-N Met-Gly-Met Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCSC UZVKFARGHHMQGX-IUCAKERBSA-N 0.000 description 1
- SXWQMBGNFXAGAT-FJXKBIBVSA-N Met-Gly-Thr Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O SXWQMBGNFXAGAT-FJXKBIBVSA-N 0.000 description 1
- ULLIQRYQNMAAHC-RWMBFGLXSA-N Met-His-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N ULLIQRYQNMAAHC-RWMBFGLXSA-N 0.000 description 1
- FWAHLGXNBLWIKB-NAKRPEOUSA-N Met-Ile-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCSC FWAHLGXNBLWIKB-NAKRPEOUSA-N 0.000 description 1
- AFVOKRHYSSFPHC-STECZYCISA-N Met-Ile-Tyr Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AFVOKRHYSSFPHC-STECZYCISA-N 0.000 description 1
- UROWNMBTQGGTHB-DCAQKATOSA-N Met-Leu-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O UROWNMBTQGGTHB-DCAQKATOSA-N 0.000 description 1
- ZIIMORLEZLVRIP-SRVKXCTJSA-N Met-Leu-Gln Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZIIMORLEZLVRIP-SRVKXCTJSA-N 0.000 description 1
- OSZTUONKUMCWEP-XUXIUFHCSA-N Met-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCSC OSZTUONKUMCWEP-XUXIUFHCSA-N 0.000 description 1
- DBXMFHGGHMXYHY-DCAQKATOSA-N Met-Leu-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O DBXMFHGGHMXYHY-DCAQKATOSA-N 0.000 description 1
- BEZJTLKUMFMITF-AVGNSLFASA-N Met-Lys-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCNC(N)=N BEZJTLKUMFMITF-AVGNSLFASA-N 0.000 description 1
- WUYLWZRHRLLEGB-AVGNSLFASA-N Met-Met-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O WUYLWZRHRLLEGB-AVGNSLFASA-N 0.000 description 1
- CNTNPWWHFWAZGA-JYJNAYRXSA-N Met-Met-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 CNTNPWWHFWAZGA-JYJNAYRXSA-N 0.000 description 1
- NTYQUVLERIHPMU-HRCADAONSA-N Met-Phe-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N NTYQUVLERIHPMU-HRCADAONSA-N 0.000 description 1
- JQHYVIKEFYETEW-IHRRRGAJSA-N Met-Phe-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=CC=C1 JQHYVIKEFYETEW-IHRRRGAJSA-N 0.000 description 1
- VQILILSLEFDECU-GUBZILKMSA-N Met-Pro-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O VQILILSLEFDECU-GUBZILKMSA-N 0.000 description 1
- YLDSJJOGQNEQJK-AVGNSLFASA-N Met-Pro-Leu Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O YLDSJJOGQNEQJK-AVGNSLFASA-N 0.000 description 1
- XIGAHPDZLAYQOS-SRVKXCTJSA-N Met-Pro-Pro Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 XIGAHPDZLAYQOS-SRVKXCTJSA-N 0.000 description 1
- NHXXGBXJTLRGJI-GUBZILKMSA-N Met-Pro-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O NHXXGBXJTLRGJI-GUBZILKMSA-N 0.000 description 1
- BJPQKNHZHUCQNQ-SRVKXCTJSA-N Met-Pro-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCSC)N BJPQKNHZHUCQNQ-SRVKXCTJSA-N 0.000 description 1
- QQPMHUCGDRJFQK-RHYQMDGZSA-N Met-Thr-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QQPMHUCGDRJFQK-RHYQMDGZSA-N 0.000 description 1
- IHRFZLQEQVHXFA-RHYQMDGZSA-N Met-Thr-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCCN IHRFZLQEQVHXFA-RHYQMDGZSA-N 0.000 description 1
- KYJHWKAMFISDJE-RCWTZXSCSA-N Met-Thr-Met Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCSC KYJHWKAMFISDJE-RCWTZXSCSA-N 0.000 description 1
- ZBLSZPYQQRIHQU-RCWTZXSCSA-N Met-Thr-Val Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O ZBLSZPYQQRIHQU-RCWTZXSCSA-N 0.000 description 1
- TUZSWDCTCGTVDJ-PJODQICGSA-N Met-Trp-Ala Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CCSC)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 TUZSWDCTCGTVDJ-PJODQICGSA-N 0.000 description 1
- RMLWDZINJUDMEB-IHRRRGAJSA-N Met-Tyr-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N RMLWDZINJUDMEB-IHRRRGAJSA-N 0.000 description 1
- ATBJCCFCJXCNGZ-UFYCRDLUSA-N Met-Tyr-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)CCSC)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 ATBJCCFCJXCNGZ-UFYCRDLUSA-N 0.000 description 1
- VYXIKLFLGRTANT-HRCADAONSA-N Met-Tyr-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N VYXIKLFLGRTANT-HRCADAONSA-N 0.000 description 1
- YGNUDKAPJARTEM-GUBZILKMSA-N Met-Val-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O YGNUDKAPJARTEM-GUBZILKMSA-N 0.000 description 1
- LBSWWNKMVPAXOI-GUBZILKMSA-N Met-Val-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O LBSWWNKMVPAXOI-GUBZILKMSA-N 0.000 description 1
- IQJMEDDVOGMTKT-SRVKXCTJSA-N Met-Val-Val Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IQJMEDDVOGMTKT-SRVKXCTJSA-N 0.000 description 1
- 108010061951 Methemoglobin Proteins 0.000 description 1
- 101100189356 Mus musculus Papolb gene Proteins 0.000 description 1
- WYBVBIHNJWOLCJ-UHFFFAOYSA-N N-L-arginyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCCN=C(N)N WYBVBIHNJWOLCJ-UHFFFAOYSA-N 0.000 description 1
- XJLXINKUBYWONI-NNYOXOHSSA-O NADP(+) Chemical compound NC(=O)C1=CC=C[N+]([C@H]2[C@@H]([C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OC[C@@H]3[C@H]([C@@H](OP(O)(O)=O)[C@@H](O3)N3C4=NC=NC(N)=C4N=C3)O)O2)O)=C1 XJLXINKUBYWONI-NNYOXOHSSA-O 0.000 description 1
- ACFIXJIJDZMPPO-NNYOXOHSSA-N NADPH Chemical compound C1=CCC(C(=O)N)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OC[C@@H]2[C@H]([C@@H](OP(O)(O)=O)[C@@H](O2)N2C3=NC=NC(N)=C3N=C2)O)O1 ACFIXJIJDZMPPO-NNYOXOHSSA-N 0.000 description 1
- 241000244206 Nematoda Species 0.000 description 1
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 1
- 101150113476 OLE1 gene Proteins 0.000 description 1
- 239000005642 Oleic acid Substances 0.000 description 1
- ZQPPMHVWECSIRJ-UHFFFAOYSA-N Oleic acid Natural products CCCCCCCCC=CCCCCCCCC(O)=O ZQPPMHVWECSIRJ-UHFFFAOYSA-N 0.000 description 1
- 241001147398 Ostrinia nubilalis Species 0.000 description 1
- 102000004020 Oxygenases Human genes 0.000 description 1
- 108090000417 Oxygenases Proteins 0.000 description 1
- 101150105372 POX1 gene Proteins 0.000 description 1
- 101150059359 POX2 gene Proteins 0.000 description 1
- 101150053659 POX4 gene Proteins 0.000 description 1
- 101150004239 POX5 gene Proteins 0.000 description 1
- 241000959051 Paenarthrobacter Species 0.000 description 1
- 241001524178 Paenarthrobacter ureafaciens Species 0.000 description 1
- 101710196890 Peroxisome biogenesis factor 10 Proteins 0.000 description 1
- 238000005835 Pfitzner-Moffat oxidation reaction Methods 0.000 description 1
- WSXKXSBOJXEZDV-DLOVCJGASA-N Phe-Ala-Asn Chemical compound NC(=O)C[C@@H](C([O-])=O)NC(=O)[C@H](C)NC(=O)[C@@H]([NH3+])CC1=CC=CC=C1 WSXKXSBOJXEZDV-DLOVCJGASA-N 0.000 description 1
- AJOKKVTWEMXZHC-DRZSPHRISA-N Phe-Ala-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 AJOKKVTWEMXZHC-DRZSPHRISA-N 0.000 description 1
- CYZBFPYMSJGBRL-DRZSPHRISA-N Phe-Ala-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CYZBFPYMSJGBRL-DRZSPHRISA-N 0.000 description 1
- DFEVBOYEUQJGER-JURCDPSOSA-N Phe-Ala-Ile Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O DFEVBOYEUQJGER-JURCDPSOSA-N 0.000 description 1
- NOFBJKKOPKJDCO-KKXDTOCCSA-N Phe-Ala-Tyr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O NOFBJKKOPKJDCO-KKXDTOCCSA-N 0.000 description 1
- HXSUFWQYLPKEHF-IHRRRGAJSA-N Phe-Asn-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N HXSUFWQYLPKEHF-IHRRRGAJSA-N 0.000 description 1
- HCTXJGRYAACKOB-SRVKXCTJSA-N Phe-Asn-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HCTXJGRYAACKOB-SRVKXCTJSA-N 0.000 description 1
- HHOOEUSPFGPZFP-QWRGUYRKSA-N Phe-Asn-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HHOOEUSPFGPZFP-QWRGUYRKSA-N 0.000 description 1
- HTKNPQZCMLBOTQ-XVSYOHENSA-N Phe-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N)O HTKNPQZCMLBOTQ-XVSYOHENSA-N 0.000 description 1
- JIYJYFIXQTYDNF-YDHLFZDLSA-N Phe-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N JIYJYFIXQTYDNF-YDHLFZDLSA-N 0.000 description 1
- IUVYJBMTHARMIP-PCBIJLKTSA-N Phe-Asp-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O IUVYJBMTHARMIP-PCBIJLKTSA-N 0.000 description 1
- FRPVPGRXUKFEQE-YDHLFZDLSA-N Phe-Asp-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O FRPVPGRXUKFEQE-YDHLFZDLSA-N 0.000 description 1
- WFDAEEUZPZSMOG-SRVKXCTJSA-N Phe-Cys-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O WFDAEEUZPZSMOG-SRVKXCTJSA-N 0.000 description 1
- YEEFZOKPYOUXMX-KKUMJFAQSA-N Phe-Gln-Met Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O YEEFZOKPYOUXMX-KKUMJFAQSA-N 0.000 description 1
- OYQBFWWQSVIHBN-FHWLQOOXSA-N Phe-Glu-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O OYQBFWWQSVIHBN-FHWLQOOXSA-N 0.000 description 1
- BFYHIHGIHGROAT-HTUGSXCWSA-N Phe-Glu-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BFYHIHGIHGROAT-HTUGSXCWSA-N 0.000 description 1
- RFEXGCASCQGGHZ-STQMWFEESA-N Phe-Gly-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O RFEXGCASCQGGHZ-STQMWFEESA-N 0.000 description 1
- JEBWZLWTRPZQRX-QWRGUYRKSA-N Phe-Gly-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O JEBWZLWTRPZQRX-QWRGUYRKSA-N 0.000 description 1
- NAXPHWZXEXNDIW-JTQLQIEISA-N Phe-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 NAXPHWZXEXNDIW-JTQLQIEISA-N 0.000 description 1
- NHCKESBLOMHIIE-IRXDYDNUSA-N Phe-Gly-Phe Chemical compound C([C@H](N)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 NHCKESBLOMHIIE-IRXDYDNUSA-N 0.000 description 1
- NPLGQVKZFGJWAI-QWHCGFSZSA-N Phe-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O NPLGQVKZFGJWAI-QWHCGFSZSA-N 0.000 description 1
- RVRRHFPCEOVRKQ-KKUMJFAQSA-N Phe-His-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CC(=O)N)C(=O)O)N RVRRHFPCEOVRKQ-KKUMJFAQSA-N 0.000 description 1
- HQCSLJFGZYOXHW-KKUMJFAQSA-N Phe-His-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CS)C(=O)O)N HQCSLJFGZYOXHW-KKUMJFAQSA-N 0.000 description 1
- MYQCCQSMKNCNKY-KKUMJFAQSA-N Phe-His-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CO)C(=O)O)N MYQCCQSMKNCNKY-KKUMJFAQSA-N 0.000 description 1
- FXPZZKBHNOMLGA-HJWJTTGWSA-N Phe-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N FXPZZKBHNOMLGA-HJWJTTGWSA-N 0.000 description 1
- KRYSMKKRRRWOCZ-QEWYBTABSA-N Phe-Ile-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O KRYSMKKRRRWOCZ-QEWYBTABSA-N 0.000 description 1
- MJQFZGOIVBDIMZ-WHOFXGATSA-N Phe-Ile-Gly Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)O MJQFZGOIVBDIMZ-WHOFXGATSA-N 0.000 description 1
- WEMYTDDMDBLPMI-DKIMLUQUSA-N Phe-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N WEMYTDDMDBLPMI-DKIMLUQUSA-N 0.000 description 1
- BYAIIACBWBOJCU-URLPEUOOSA-N Phe-Ile-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BYAIIACBWBOJCU-URLPEUOOSA-N 0.000 description 1
- JQLQUPIYYJXZLJ-ZEWNOJEFSA-N Phe-Ile-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 JQLQUPIYYJXZLJ-ZEWNOJEFSA-N 0.000 description 1
- YKUGPVXSDOOANW-KKUMJFAQSA-N Phe-Leu-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YKUGPVXSDOOANW-KKUMJFAQSA-N 0.000 description 1
- RSPUIENXSJYZQO-JYJNAYRXSA-N Phe-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 RSPUIENXSJYZQO-JYJNAYRXSA-N 0.000 description 1
- OSBADCBXAMSPQD-YESZJQIVSA-N Phe-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N OSBADCBXAMSPQD-YESZJQIVSA-N 0.000 description 1
- YCCUXNNKXDGMAM-KKUMJFAQSA-N Phe-Leu-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YCCUXNNKXDGMAM-KKUMJFAQSA-N 0.000 description 1
- MJAYDXWQQUOURZ-JYJNAYRXSA-N Phe-Lys-Gln Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O MJAYDXWQQUOURZ-JYJNAYRXSA-N 0.000 description 1
- WLYPRKLMRIYGPP-JYJNAYRXSA-N Phe-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 WLYPRKLMRIYGPP-JYJNAYRXSA-N 0.000 description 1
- SCKXGHWQPPURGT-KKUMJFAQSA-N Phe-Lys-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O SCKXGHWQPPURGT-KKUMJFAQSA-N 0.000 description 1
- QTVUPXHPSXZJKH-ULQDDVLXSA-N Phe-Met-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N QTVUPXHPSXZJKH-ULQDDVLXSA-N 0.000 description 1
- JKJSIYKSGIDHPM-WBAXXEDZSA-N Phe-Phe-Ala Chemical compound C[C@H](NC(=O)[C@H](Cc1ccccc1)NC(=O)[C@@H](N)Cc1ccccc1)C(O)=O JKJSIYKSGIDHPM-WBAXXEDZSA-N 0.000 description 1
- RBRNEFJTEHPDSL-ACRUOGEOSA-N Phe-Phe-Lys Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 RBRNEFJTEHPDSL-ACRUOGEOSA-N 0.000 description 1
- MGLBSROLWAWCKN-FCLVOEFKSA-N Phe-Phe-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MGLBSROLWAWCKN-FCLVOEFKSA-N 0.000 description 1
- BSJCSHIAMSGQGN-BVSLBCMMSA-N Phe-Pro-Trp Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CC3=CNC4=CC=CC=C43)C(=O)O BSJCSHIAMSGQGN-BVSLBCMMSA-N 0.000 description 1
- AFNJAQVMTIQTCB-DLOVCJGASA-N Phe-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=CC=C1 AFNJAQVMTIQTCB-DLOVCJGASA-N 0.000 description 1
- IIEOLPMQYRBZCN-SRVKXCTJSA-N Phe-Ser-Cys Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O IIEOLPMQYRBZCN-SRVKXCTJSA-N 0.000 description 1
- BONHGTUEEPIMPM-AVGNSLFASA-N Phe-Ser-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O BONHGTUEEPIMPM-AVGNSLFASA-N 0.000 description 1
- GLJZDMZJHFXJQG-BZSNNMDCSA-N Phe-Ser-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GLJZDMZJHFXJQG-BZSNNMDCSA-N 0.000 description 1
- MCIXMYKSPQUMJG-SRVKXCTJSA-N Phe-Ser-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MCIXMYKSPQUMJG-SRVKXCTJSA-N 0.000 description 1
- LTAWNJXSRUCFAN-UNQGMJICSA-N Phe-Thr-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LTAWNJXSRUCFAN-UNQGMJICSA-N 0.000 description 1
- BSTPNLNKHKBONJ-HTUGSXCWSA-N Phe-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N)O BSTPNLNKHKBONJ-HTUGSXCWSA-N 0.000 description 1
- GNRMAQSIROFNMI-IXOXFDKPSA-N Phe-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O GNRMAQSIROFNMI-IXOXFDKPSA-N 0.000 description 1
- QTDBZORPVYTRJU-KKXDTOCCSA-N Phe-Tyr-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O QTDBZORPVYTRJU-KKXDTOCCSA-N 0.000 description 1
- XALFIVXGQUEGKV-JSGCOSHPSA-N Phe-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 XALFIVXGQUEGKV-JSGCOSHPSA-N 0.000 description 1
- FXEKNHAJIMHRFJ-ULQDDVLXSA-N Phe-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N FXEKNHAJIMHRFJ-ULQDDVLXSA-N 0.000 description 1
- 229920002252 Plurafac® SLF 180 Polymers 0.000 description 1
- 239000004743 Polypropylene Substances 0.000 description 1
- IFMDQWDAJUMMJC-DCAQKATOSA-N Pro-Ala-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O IFMDQWDAJUMMJC-DCAQKATOSA-N 0.000 description 1
- LCRSGSIRKLXZMZ-BPNCWPANSA-N Pro-Ala-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LCRSGSIRKLXZMZ-BPNCWPANSA-N 0.000 description 1
- NHDVNAKDACFHPX-GUBZILKMSA-N Pro-Arg-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O NHDVNAKDACFHPX-GUBZILKMSA-N 0.000 description 1
- QSKCKTUQPICLSO-AVGNSLFASA-N Pro-Arg-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O QSKCKTUQPICLSO-AVGNSLFASA-N 0.000 description 1
- ICTZKEXYDDZZFP-SRVKXCTJSA-N Pro-Arg-Pro Chemical compound N([C@@H](CCCN=C(N)N)C(=O)N1[C@@H](CCC1)C(O)=O)C(=O)[C@@H]1CCCN1 ICTZKEXYDDZZFP-SRVKXCTJSA-N 0.000 description 1
- SBYVDRLQAGENMY-DCAQKATOSA-N Pro-Asn-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O SBYVDRLQAGENMY-DCAQKATOSA-N 0.000 description 1
- GDXZRWYXJSGWIV-GMOBBJLQSA-N Pro-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 GDXZRWYXJSGWIV-GMOBBJLQSA-N 0.000 description 1
- QXNSKJLSLYCTMT-FXQIFTODSA-N Pro-Cys-Asp Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O QXNSKJLSLYCTMT-FXQIFTODSA-N 0.000 description 1
- DIFXZGPHVCIVSQ-CIUDSAMLSA-N Pro-Gln-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DIFXZGPHVCIVSQ-CIUDSAMLSA-N 0.000 description 1
- XZONQWUEBAFQPO-HJGDQZAQSA-N Pro-Gln-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XZONQWUEBAFQPO-HJGDQZAQSA-N 0.000 description 1
- KTFZQPLSPLWLKN-KKUMJFAQSA-N Pro-Gln-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KTFZQPLSPLWLKN-KKUMJFAQSA-N 0.000 description 1
- LHALYDBUDCWMDY-CIUDSAMLSA-N Pro-Glu-Ala Chemical compound C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O LHALYDBUDCWMDY-CIUDSAMLSA-N 0.000 description 1
- MGDFPGCFVJFITQ-CIUDSAMLSA-N Pro-Glu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MGDFPGCFVJFITQ-CIUDSAMLSA-N 0.000 description 1
- VOZIBWWZSBIXQN-SRVKXCTJSA-N Pro-Glu-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O VOZIBWWZSBIXQN-SRVKXCTJSA-N 0.000 description 1
- UEHYFUCOGHWASA-HJGDQZAQSA-N Pro-Glu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 UEHYFUCOGHWASA-HJGDQZAQSA-N 0.000 description 1
- CLNJSLSHKJECME-BQBZGAKWSA-N Pro-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H]1CCCN1 CLNJSLSHKJECME-BQBZGAKWSA-N 0.000 description 1
- HAEGAELAYWSUNC-WPRPVWTQSA-N Pro-Gly-Val Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAEGAELAYWSUNC-WPRPVWTQSA-N 0.000 description 1
- AQSMZTIEJMZQEC-DCAQKATOSA-N Pro-His-Ser Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CO)C(=O)O AQSMZTIEJMZQEC-DCAQKATOSA-N 0.000 description 1
- BBFRBZYKHIKFBX-GMOBBJLQSA-N Pro-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@@H]1CCCN1 BBFRBZYKHIKFBX-GMOBBJLQSA-N 0.000 description 1
- CFVRJNZJQHDQPP-CYDGBPFRSA-N Pro-Ile-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 CFVRJNZJQHDQPP-CYDGBPFRSA-N 0.000 description 1
- UREQLMJCKFLLHM-NAKRPEOUSA-N Pro-Ile-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O UREQLMJCKFLLHM-NAKRPEOUSA-N 0.000 description 1
- ZTMLZUNPFDGPKY-VKOGCVSHSA-N Pro-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@@H]3CCCN3 ZTMLZUNPFDGPKY-VKOGCVSHSA-N 0.000 description 1
- XYSXOCIWCPFOCG-IHRRRGAJSA-N Pro-Leu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XYSXOCIWCPFOCG-IHRRRGAJSA-N 0.000 description 1
- MCWHYUWXVNRXFV-RWMBFGLXSA-N Pro-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 MCWHYUWXVNRXFV-RWMBFGLXSA-N 0.000 description 1
- FKYKZHOKDOPHSA-DCAQKATOSA-N Pro-Leu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FKYKZHOKDOPHSA-DCAQKATOSA-N 0.000 description 1
- VTFXTWDFPTWNJY-RHYQMDGZSA-N Pro-Leu-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VTFXTWDFPTWNJY-RHYQMDGZSA-N 0.000 description 1
- VWHJZETTZDAGOM-XUXIUFHCSA-N Pro-Lys-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VWHJZETTZDAGOM-XUXIUFHCSA-N 0.000 description 1
- RMODQFBNDDENCP-IHRRRGAJSA-N Pro-Lys-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O RMODQFBNDDENCP-IHRRRGAJSA-N 0.000 description 1
- DWGFLKQSGRUQTI-IHRRRGAJSA-N Pro-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1 DWGFLKQSGRUQTI-IHRRRGAJSA-N 0.000 description 1
- SMFQZMGHCODUPQ-ULQDDVLXSA-N Pro-Lys-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SMFQZMGHCODUPQ-ULQDDVLXSA-N 0.000 description 1
- NTXFLJULRHQMDC-GUBZILKMSA-N Pro-Met-Asp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@@H]1CCCN1 NTXFLJULRHQMDC-GUBZILKMSA-N 0.000 description 1
- KLOQCCRTPHPIFN-DCAQKATOSA-N Pro-Met-Gln Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@@H]1CCCN1 KLOQCCRTPHPIFN-DCAQKATOSA-N 0.000 description 1
- RPLMFKUKFZOTER-AVGNSLFASA-N Pro-Met-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@@H]1CCCN1 RPLMFKUKFZOTER-AVGNSLFASA-N 0.000 description 1
- ANESFYPBAJPYNJ-SDDRHHMPSA-N Pro-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 ANESFYPBAJPYNJ-SDDRHHMPSA-N 0.000 description 1
- JFBJPBZSTMXGKL-JYJNAYRXSA-N Pro-Met-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JFBJPBZSTMXGKL-JYJNAYRXSA-N 0.000 description 1
- ZUZINZIJHJFJRN-UBHSHLNASA-N Pro-Phe-Ala Chemical compound C([C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 ZUZINZIJHJFJRN-UBHSHLNASA-N 0.000 description 1
- MLKVIVZCFYRTIR-KKUMJFAQSA-N Pro-Phe-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O MLKVIVZCFYRTIR-KKUMJFAQSA-N 0.000 description 1
- JIWJRKNYLSHONY-KKUMJFAQSA-N Pro-Phe-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JIWJRKNYLSHONY-KKUMJFAQSA-N 0.000 description 1
- GNADVDLLGVSXLS-ULQDDVLXSA-N Pro-Phe-His Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC=N1)C(O)=O GNADVDLLGVSXLS-ULQDDVLXSA-N 0.000 description 1
- MHBSUKYVBZVQRW-HJWJTTGWSA-N Pro-Phe-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MHBSUKYVBZVQRW-HJWJTTGWSA-N 0.000 description 1
- WHNJMTHJGCEKGA-ULQDDVLXSA-N Pro-Phe-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WHNJMTHJGCEKGA-ULQDDVLXSA-N 0.000 description 1
- GFHXZNVJIKMAGO-IHRRRGAJSA-N Pro-Phe-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O GFHXZNVJIKMAGO-IHRRRGAJSA-N 0.000 description 1
- KDBHVPXBQADZKY-GUBZILKMSA-N Pro-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KDBHVPXBQADZKY-GUBZILKMSA-N 0.000 description 1
- FYKUEXMZYFIZKA-DCAQKATOSA-N Pro-Pro-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O FYKUEXMZYFIZKA-DCAQKATOSA-N 0.000 description 1
- LEIKGVHQTKHOLM-IUCAKERBSA-N Pro-Pro-Gly Chemical compound OC(=O)CNC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 LEIKGVHQTKHOLM-IUCAKERBSA-N 0.000 description 1
- BGWKULMLUIUPKY-BQBZGAKWSA-N Pro-Ser-Gly Chemical compound OC(=O)CNC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 BGWKULMLUIUPKY-BQBZGAKWSA-N 0.000 description 1
- SNGZLPOXVRTNMB-LPEHRKFASA-N Pro-Ser-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N2CCC[C@@H]2C(=O)O SNGZLPOXVRTNMB-LPEHRKFASA-N 0.000 description 1
- MKGIILKDUGDRRO-FXQIFTODSA-N Pro-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 MKGIILKDUGDRRO-FXQIFTODSA-N 0.000 description 1
- QUBVFEANYYWBTM-VEVYYDQMSA-N Pro-Thr-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O QUBVFEANYYWBTM-VEVYYDQMSA-N 0.000 description 1
- RMJZWERKFFNNNS-XGEHTFHBSA-N Pro-Thr-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O RMJZWERKFFNNNS-XGEHTFHBSA-N 0.000 description 1
- OFSZYRZOUMNCCU-BZSNNMDCSA-N Pro-Trp-Met Chemical compound N([C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCSC)C(O)=O)C(=O)[C@@H]1CCCN1 OFSZYRZOUMNCCU-BZSNNMDCSA-N 0.000 description 1
- CWZUFLWPEFHWEI-IHRRRGAJSA-N Pro-Tyr-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O CWZUFLWPEFHWEI-IHRRRGAJSA-N 0.000 description 1
- BVRBCQBUNGAWFP-KKUMJFAQSA-N Pro-Tyr-Gln Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O BVRBCQBUNGAWFP-KKUMJFAQSA-N 0.000 description 1
- WWXNZNWZNZPDIF-SRVKXCTJSA-N Pro-Val-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 WWXNZNWZNZPDIF-SRVKXCTJSA-N 0.000 description 1
- OOZJHTXCLJUODH-QXEWZRGKSA-N Pro-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 OOZJHTXCLJUODH-QXEWZRGKSA-N 0.000 description 1
- YDTUEBLEAVANFH-RCWTZXSCSA-N Pro-Val-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 YDTUEBLEAVANFH-RCWTZXSCSA-N 0.000 description 1
- MTMJNKFZDQEVSY-BZSNNMDCSA-N Pro-Val-Trp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O MTMJNKFZDQEVSY-BZSNNMDCSA-N 0.000 description 1
- 102100028772 Proline dehydrogenase 1, mitochondrial Human genes 0.000 description 1
- 244000088415 Raphanus sativus Species 0.000 description 1
- 235000006140 Raphanus sativus var sativus Nutrition 0.000 description 1
- 235000001537 Ribes X gardonianum Nutrition 0.000 description 1
- 235000001535 Ribes X utile Nutrition 0.000 description 1
- 235000016919 Ribes petraeum Nutrition 0.000 description 1
- 244000281247 Ribes rubrum Species 0.000 description 1
- 235000002355 Ribes spicatum Nutrition 0.000 description 1
- 101100313649 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) POT1 gene Proteins 0.000 description 1
- 235000012377 Salvia columbariae var. columbariae Nutrition 0.000 description 1
- 240000005481 Salvia hispanica Species 0.000 description 1
- 235000001498 Salvia hispanica Nutrition 0.000 description 1
- ZUGXSSFMTXKHJS-ZLUOBGJFSA-N Ser-Ala-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O ZUGXSSFMTXKHJS-ZLUOBGJFSA-N 0.000 description 1
- MWMKFWJYRRGXOR-ZLUOBGJFSA-N Ser-Ala-Asn Chemical compound N[C@H](C(=O)N[C@H](C(=O)N[C@H](C(=O)O)CC(N)=O)C)CO MWMKFWJYRRGXOR-ZLUOBGJFSA-N 0.000 description 1
- SRTCFKGBYBZRHA-ACZMJKKPSA-N Ser-Ala-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SRTCFKGBYBZRHA-ACZMJKKPSA-N 0.000 description 1
- BTKUIVBNGBFTTP-WHFBIAKZSA-N Ser-Ala-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)NCC(O)=O BTKUIVBNGBFTTP-WHFBIAKZSA-N 0.000 description 1
- BRKHVZNDAOMAHX-BIIVOSGPSA-N Ser-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N BRKHVZNDAOMAHX-BIIVOSGPSA-N 0.000 description 1
- JPIDMRXXNMIVKY-VZFHVOOUSA-N Ser-Ala-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPIDMRXXNMIVKY-VZFHVOOUSA-N 0.000 description 1
- HBZBPFLJNDXRAY-FXQIFTODSA-N Ser-Ala-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O HBZBPFLJNDXRAY-FXQIFTODSA-N 0.000 description 1
- GXXTUIUYTWGPMV-FXQIFTODSA-N Ser-Arg-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O GXXTUIUYTWGPMV-FXQIFTODSA-N 0.000 description 1
- QEDMOZUJTGEIBF-FXQIFTODSA-N Ser-Arg-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O QEDMOZUJTGEIBF-FXQIFTODSA-N 0.000 description 1
- KYKKKSWGEPFUMR-NAKRPEOUSA-N Ser-Arg-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KYKKKSWGEPFUMR-NAKRPEOUSA-N 0.000 description 1
- HBOABDXGTMMDSE-GUBZILKMSA-N Ser-Arg-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O HBOABDXGTMMDSE-GUBZILKMSA-N 0.000 description 1
- DKKGAAJTDKHWOD-BIIVOSGPSA-N Ser-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N)C(=O)O DKKGAAJTDKHWOD-BIIVOSGPSA-N 0.000 description 1
- CNIIKZQXBBQHCX-FXQIFTODSA-N Ser-Asp-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O CNIIKZQXBBQHCX-FXQIFTODSA-N 0.000 description 1
- CTRHXXXHUJTTRZ-ZLUOBGJFSA-N Ser-Asp-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N)C(=O)O CTRHXXXHUJTTRZ-ZLUOBGJFSA-N 0.000 description 1
- VAIZFHMTBFYJIA-ACZMJKKPSA-N Ser-Asp-Gln Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(N)=O VAIZFHMTBFYJIA-ACZMJKKPSA-N 0.000 description 1
- QPFJSHSJFIYDJZ-GHCJXIJMSA-N Ser-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CO QPFJSHSJFIYDJZ-GHCJXIJMSA-N 0.000 description 1
- BTPAWKABYQMKKN-LKXGYXEUSA-N Ser-Asp-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BTPAWKABYQMKKN-LKXGYXEUSA-N 0.000 description 1
- RFBKULCUBJAQFT-BIIVOSGPSA-N Ser-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)[C@H](CO)N)C(=O)O RFBKULCUBJAQFT-BIIVOSGPSA-N 0.000 description 1
- CRZRTKAVUUGKEQ-ACZMJKKPSA-N Ser-Gln-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CRZRTKAVUUGKEQ-ACZMJKKPSA-N 0.000 description 1
- OJPHFSOMBZKQKQ-GUBZILKMSA-N Ser-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CO OJPHFSOMBZKQKQ-GUBZILKMSA-N 0.000 description 1
- VDVYTKZBMFADQH-AVGNSLFASA-N Ser-Gln-Tyr Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 VDVYTKZBMFADQH-AVGNSLFASA-N 0.000 description 1
- BRGQQXQKPUCUJQ-KBIXCLLPSA-N Ser-Glu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BRGQQXQKPUCUJQ-KBIXCLLPSA-N 0.000 description 1
- MUARUIBTKQJKFY-WHFBIAKZSA-N Ser-Gly-Asp Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MUARUIBTKQJKFY-WHFBIAKZSA-N 0.000 description 1
- MIJWOJAXARLEHA-WDSKDSINSA-N Ser-Gly-Glu Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O MIJWOJAXARLEHA-WDSKDSINSA-N 0.000 description 1
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 1
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 1
- KDGARKCAKHBEDB-NKWVEPMBSA-N Ser-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CO)N)C(=O)O KDGARKCAKHBEDB-NKWVEPMBSA-N 0.000 description 1
- CXBFHZLODKPIJY-AAEUAGOBSA-N Ser-Gly-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N CXBFHZLODKPIJY-AAEUAGOBSA-N 0.000 description 1
- JEHPKECJCALLRW-CUJWVEQBSA-N Ser-His-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JEHPKECJCALLRW-CUJWVEQBSA-N 0.000 description 1
- SFTZTYBXIXLRGQ-JBDRJPRFSA-N Ser-Ile-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SFTZTYBXIXLRGQ-JBDRJPRFSA-N 0.000 description 1
- RIAKPZVSNBBNRE-BJDJZHNGSA-N Ser-Ile-Leu Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O RIAKPZVSNBBNRE-BJDJZHNGSA-N 0.000 description 1
- UIPXCLNLUUAMJU-JBDRJPRFSA-N Ser-Ile-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O UIPXCLNLUUAMJU-JBDRJPRFSA-N 0.000 description 1
- DOSZISJPMCYEHT-NAKRPEOUSA-N Ser-Ile-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O DOSZISJPMCYEHT-NAKRPEOUSA-N 0.000 description 1
- FUMGHWDRRFCKEP-CIUDSAMLSA-N Ser-Leu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O FUMGHWDRRFCKEP-CIUDSAMLSA-N 0.000 description 1
- KCGIREHVWRXNDH-GARJFASQSA-N Ser-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N KCGIREHVWRXNDH-GARJFASQSA-N 0.000 description 1
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 1
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 1
- NNFMANHDYSVNIO-DCAQKATOSA-N Ser-Lys-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NNFMANHDYSVNIO-DCAQKATOSA-N 0.000 description 1
- BYCVMHKULKRVPV-GUBZILKMSA-N Ser-Lys-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O BYCVMHKULKRVPV-GUBZILKMSA-N 0.000 description 1
- GVMUJUPXFQFBBZ-GUBZILKMSA-N Ser-Lys-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GVMUJUPXFQFBBZ-GUBZILKMSA-N 0.000 description 1
- OCWWJBZQXGYQCA-DCAQKATOSA-N Ser-Lys-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(O)=O OCWWJBZQXGYQCA-DCAQKATOSA-N 0.000 description 1
- WGDYNRCOQRERLZ-KKUMJFAQSA-N Ser-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)N WGDYNRCOQRERLZ-KKUMJFAQSA-N 0.000 description 1
- PTWIYDNFWPXQSD-GARJFASQSA-N Ser-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CO)N)C(=O)O PTWIYDNFWPXQSD-GARJFASQSA-N 0.000 description 1
- FPCGZYMRFFIYIH-CIUDSAMLSA-N Ser-Lys-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O FPCGZYMRFFIYIH-CIUDSAMLSA-N 0.000 description 1
- LRZLZIUXQBIWTB-KATARQTJSA-N Ser-Lys-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LRZLZIUXQBIWTB-KATARQTJSA-N 0.000 description 1
- PMCMLDNPAZUYGI-DCAQKATOSA-N Ser-Lys-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PMCMLDNPAZUYGI-DCAQKATOSA-N 0.000 description 1
- FOOZNBRFRWGBNU-DCAQKATOSA-N Ser-Met-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CO)N FOOZNBRFRWGBNU-DCAQKATOSA-N 0.000 description 1
- HEYZPTCCEIWHRO-IHRRRGAJSA-N Ser-Met-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 HEYZPTCCEIWHRO-IHRRRGAJSA-N 0.000 description 1
- WLJPJRGQRNCIQS-ZLUOBGJFSA-N Ser-Ser-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O WLJPJRGQRNCIQS-ZLUOBGJFSA-N 0.000 description 1
- GYDFRTRSSXOZCR-ACZMJKKPSA-N Ser-Ser-Glu Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GYDFRTRSSXOZCR-ACZMJKKPSA-N 0.000 description 1
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 1
- OZPDGESCTGGNAD-CIUDSAMLSA-N Ser-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CO OZPDGESCTGGNAD-CIUDSAMLSA-N 0.000 description 1
- XQJCEKXQUJQNNK-ZLUOBGJFSA-N Ser-Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O XQJCEKXQUJQNNK-ZLUOBGJFSA-N 0.000 description 1
- DKGRNFUXVTYRAS-UBHSHLNASA-N Ser-Ser-Trp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O DKGRNFUXVTYRAS-UBHSHLNASA-N 0.000 description 1
- VGQVAVQWKJLIRM-FXQIFTODSA-N Ser-Ser-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O VGQVAVQWKJLIRM-FXQIFTODSA-N 0.000 description 1
- XJDMUQCLVSCRSJ-VZFHVOOUSA-N Ser-Thr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O XJDMUQCLVSCRSJ-VZFHVOOUSA-N 0.000 description 1
- SQHKXWODKJDZRC-LKXGYXEUSA-N Ser-Thr-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQHKXWODKJDZRC-LKXGYXEUSA-N 0.000 description 1
- KKKVOZNCLALMPV-XKBZYTNZSA-N Ser-Thr-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O KKKVOZNCLALMPV-XKBZYTNZSA-N 0.000 description 1
- SNXUIBACCONSOH-BWBBJGPYSA-N Ser-Thr-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CO)C(O)=O SNXUIBACCONSOH-BWBBJGPYSA-N 0.000 description 1
- VLMIUSLQONKLDV-HEIBUPTGSA-N Ser-Thr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VLMIUSLQONKLDV-HEIBUPTGSA-N 0.000 description 1
- BDMWLJLPPUCLNV-XGEHTFHBSA-N Ser-Thr-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BDMWLJLPPUCLNV-XGEHTFHBSA-N 0.000 description 1
- HAUVENOGHPECML-BPUTZDHNSA-N Ser-Trp-Val Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CO)=CNC2=C1 HAUVENOGHPECML-BPUTZDHNSA-N 0.000 description 1
- PLQWGQUNUPMNOD-KKUMJFAQSA-N Ser-Tyr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O PLQWGQUNUPMNOD-KKUMJFAQSA-N 0.000 description 1
- KIEIJCFVGZCUAS-MELADBBJSA-N Ser-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CO)N)C(=O)O KIEIJCFVGZCUAS-MELADBBJSA-N 0.000 description 1
- MFQMZDPAZRZAPV-NAKRPEOUSA-N Ser-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CO)N MFQMZDPAZRZAPV-NAKRPEOUSA-N 0.000 description 1
- HNDMFDBQXYZSRM-IHRRRGAJSA-N Ser-Val-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HNDMFDBQXYZSRM-IHRRRGAJSA-N 0.000 description 1
- ANOQEBQWIAYIMV-AEJSXWLSSA-N Ser-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N ANOQEBQWIAYIMV-AEJSXWLSSA-N 0.000 description 1
- 241000661452 Sesamia nonagrioides Species 0.000 description 1
- 241001525902 Sesiidae Species 0.000 description 1
- 239000005708 Sodium hypochlorite Substances 0.000 description 1
- 238000006859 Swern oxidation reaction Methods 0.000 description 1
- 241000885728 Synanthedon tipuliformis Species 0.000 description 1
- IGROJMCBGRFRGI-YTLHQDLWSA-N Thr-Ala-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O IGROJMCBGRFRGI-YTLHQDLWSA-N 0.000 description 1
- DDPVJPIGACCMEH-XQXXSGGOSA-N Thr-Ala-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DDPVJPIGACCMEH-XQXXSGGOSA-N 0.000 description 1
- LVHHEVGYAZGXDE-KDXUFGMBSA-N Thr-Ala-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(=O)O)N)O LVHHEVGYAZGXDE-KDXUFGMBSA-N 0.000 description 1
- NFMPFBCXABPALN-OWLDWWDNSA-N Thr-Ala-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O NFMPFBCXABPALN-OWLDWWDNSA-N 0.000 description 1
- XSLXHSYIVPGEER-KZVJFYERSA-N Thr-Ala-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O XSLXHSYIVPGEER-KZVJFYERSA-N 0.000 description 1
- GLQFKOVWXPPFTP-VEVYYDQMSA-N Thr-Arg-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O GLQFKOVWXPPFTP-VEVYYDQMSA-N 0.000 description 1
- MQBTXMPQNCGSSZ-OSUNSFLBSA-N Thr-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)O)CCCN=C(N)N MQBTXMPQNCGSSZ-OSUNSFLBSA-N 0.000 description 1
- XVNZSJIKGJLQLH-RCWTZXSCSA-N Thr-Arg-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCSC)C(=O)O)N)O XVNZSJIKGJLQLH-RCWTZXSCSA-N 0.000 description 1
- CEXFELBFVHLYDZ-XGEHTFHBSA-N Thr-Arg-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CEXFELBFVHLYDZ-XGEHTFHBSA-N 0.000 description 1
- JNQZPAWOPBZGIX-RCWTZXSCSA-N Thr-Arg-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)O)CCCN=C(N)N JNQZPAWOPBZGIX-RCWTZXSCSA-N 0.000 description 1
- IRKWVRSEQFTGGV-VEVYYDQMSA-N Thr-Asn-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IRKWVRSEQFTGGV-VEVYYDQMSA-N 0.000 description 1
- GKMYGVQDGVYCPC-IUKAMOBKSA-N Thr-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H]([C@@H](C)O)N GKMYGVQDGVYCPC-IUKAMOBKSA-N 0.000 description 1
- VUKVQVNKIIZBPO-HOUAVDHOSA-N Thr-Asp-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O VUKVQVNKIIZBPO-HOUAVDHOSA-N 0.000 description 1
- DCLBXIWHLVEPMQ-JRQIVUDYSA-N Thr-Asp-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 DCLBXIWHLVEPMQ-JRQIVUDYSA-N 0.000 description 1
- ZQUKYJOKQBRBCS-GLLZPBPUSA-N Thr-Gln-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O ZQUKYJOKQBRBCS-GLLZPBPUSA-N 0.000 description 1
- UHBPFYOQQPFKQR-JHEQGTHGSA-N Thr-Gln-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O UHBPFYOQQPFKQR-JHEQGTHGSA-N 0.000 description 1
- GARULAKWZGFIKC-RWRJDSDZSA-N Thr-Gln-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GARULAKWZGFIKC-RWRJDSDZSA-N 0.000 description 1
- XXNLGZRRSKPSGF-HTUGSXCWSA-N Thr-Gln-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O XXNLGZRRSKPSGF-HTUGSXCWSA-N 0.000 description 1
- DIPIPFHFLPTCLK-LOKLDPHHSA-N Thr-Gln-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O DIPIPFHFLPTCLK-LOKLDPHHSA-N 0.000 description 1
- KGKWKSSSQGGYAU-SUSMZKCASA-N Thr-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KGKWKSSSQGGYAU-SUSMZKCASA-N 0.000 description 1
- VGYBYGQXZJDZJU-XQXXSGGOSA-N Thr-Glu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O VGYBYGQXZJDZJU-XQXXSGGOSA-N 0.000 description 1
- FHDLKMFZKRUQCE-HJGDQZAQSA-N Thr-Glu-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FHDLKMFZKRUQCE-HJGDQZAQSA-N 0.000 description 1
- LGNBRHZANHMZHK-NUMRIWBASA-N Thr-Glu-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O LGNBRHZANHMZHK-NUMRIWBASA-N 0.000 description 1
- UDQBCBUXAQIZAK-GLLZPBPUSA-N Thr-Glu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UDQBCBUXAQIZAK-GLLZPBPUSA-N 0.000 description 1
- WDFPMSHYMRBLKM-NKIYYHGXSA-N Thr-Glu-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O WDFPMSHYMRBLKM-NKIYYHGXSA-N 0.000 description 1
- LHEZGZQRLDBSRR-WDCWCFNPSA-N Thr-Glu-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LHEZGZQRLDBSRR-WDCWCFNPSA-N 0.000 description 1
- HJOSVGCWOTYJFG-WDCWCFNPSA-N Thr-Glu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O HJOSVGCWOTYJFG-WDCWCFNPSA-N 0.000 description 1
- XOTBWOCSLMBGMF-SUSMZKCASA-N Thr-Glu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOTBWOCSLMBGMF-SUSMZKCASA-N 0.000 description 1
- XFTYVCHLARBHBQ-FOHZUACHSA-N Thr-Gly-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O XFTYVCHLARBHBQ-FOHZUACHSA-N 0.000 description 1
- VYEHBMMAJFVTOI-JHEQGTHGSA-N Thr-Gly-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O VYEHBMMAJFVTOI-JHEQGTHGSA-N 0.000 description 1
- XPNSAQMEAVSQRD-FBCQKBJTSA-N Thr-Gly-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)NCC(O)=O XPNSAQMEAVSQRD-FBCQKBJTSA-N 0.000 description 1
- IMULJHHGAUZZFE-MBLNEYKQSA-N Thr-Gly-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IMULJHHGAUZZFE-MBLNEYKQSA-N 0.000 description 1
- MPUMPERGHHJGRP-WEDXCCLWSA-N Thr-Gly-Lys Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N)O MPUMPERGHHJGRP-WEDXCCLWSA-N 0.000 description 1
- ZTPXSEUVYNNZRB-CDMKHQONSA-N Thr-Gly-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZTPXSEUVYNNZRB-CDMKHQONSA-N 0.000 description 1
- JKGGPMOUIAAJAA-YEPSODPASA-N Thr-Gly-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O JKGGPMOUIAAJAA-YEPSODPASA-N 0.000 description 1
- NQVDGKYAUHTCME-QTKMDUPCSA-N Thr-His-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N)O NQVDGKYAUHTCME-QTKMDUPCSA-N 0.000 description 1
- CRZNCABIJLRFKZ-IUKAMOBKSA-N Thr-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N CRZNCABIJLRFKZ-IUKAMOBKSA-N 0.000 description 1
- GMXIJHCBTZDAPD-QPHKQPEJSA-N Thr-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N GMXIJHCBTZDAPD-QPHKQPEJSA-N 0.000 description 1
- LCCSEJSPBWKBNT-OSUNSFLBSA-N Thr-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N LCCSEJSPBWKBNT-OSUNSFLBSA-N 0.000 description 1
- UYTYTDMCDBPDSC-URLPEUOOSA-N Thr-Ile-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N UYTYTDMCDBPDSC-URLPEUOOSA-N 0.000 description 1
- FQPDRTDDEZXCEC-SVSWQMSJSA-N Thr-Ile-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O FQPDRTDDEZXCEC-SVSWQMSJSA-N 0.000 description 1
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 1
- FLPZMPOZGYPBEN-PPCPHDFISA-N Thr-Leu-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FLPZMPOZGYPBEN-PPCPHDFISA-N 0.000 description 1
- MECLEFZMPPOEAC-VOAKCMCISA-N Thr-Leu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MECLEFZMPPOEAC-VOAKCMCISA-N 0.000 description 1
- FIFDDJFLNVAVMS-RHYQMDGZSA-N Thr-Leu-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O FIFDDJFLNVAVMS-RHYQMDGZSA-N 0.000 description 1
- VRUFCJZQDACGLH-UVOCVTCTSA-N Thr-Leu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VRUFCJZQDACGLH-UVOCVTCTSA-N 0.000 description 1
- ISLDRLHVPXABBC-IEGACIPQSA-N Thr-Leu-Trp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O ISLDRLHVPXABBC-IEGACIPQSA-N 0.000 description 1
- ZSPQUTWLWGWTPS-HJGDQZAQSA-N Thr-Lys-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O ZSPQUTWLWGWTPS-HJGDQZAQSA-N 0.000 description 1
- KKPOGALELPLJTL-MEYUZBJRSA-N Thr-Lys-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KKPOGALELPLJTL-MEYUZBJRSA-N 0.000 description 1
- DXPURPNJDFCKKO-RHYQMDGZSA-N Thr-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O DXPURPNJDFCKKO-RHYQMDGZSA-N 0.000 description 1
- QFEYTTHKPSOFLV-OSUNSFLBSA-N Thr-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H]([C@@H](C)O)N QFEYTTHKPSOFLV-OSUNSFLBSA-N 0.000 description 1
- XNTVWRJTUIOGQO-RHYQMDGZSA-N Thr-Met-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O XNTVWRJTUIOGQO-RHYQMDGZSA-N 0.000 description 1
- WVVOFCVMHAXGLE-LFSVMHDDSA-N Thr-Phe-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O WVVOFCVMHAXGLE-LFSVMHDDSA-N 0.000 description 1
- KZURUCDWKDEAFZ-XVSYOHENSA-N Thr-Phe-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O KZURUCDWKDEAFZ-XVSYOHENSA-N 0.000 description 1
- WYLAVUAWOUVUCA-XVSYOHENSA-N Thr-Phe-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O WYLAVUAWOUVUCA-XVSYOHENSA-N 0.000 description 1
- PZSDPRBZINDEJV-HTUGSXCWSA-N Thr-Phe-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O PZSDPRBZINDEJV-HTUGSXCWSA-N 0.000 description 1
- NZRUWPIYECBYRK-HTUGSXCWSA-N Thr-Phe-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O NZRUWPIYECBYRK-HTUGSXCWSA-N 0.000 description 1
- HSQXHRIRJSFDOH-URLPEUOOSA-N Thr-Phe-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HSQXHRIRJSFDOH-URLPEUOOSA-N 0.000 description 1
- ABWNZPOIUJMNKT-IXOXFDKPSA-N Thr-Phe-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O ABWNZPOIUJMNKT-IXOXFDKPSA-N 0.000 description 1
- DEGCBBCMYWNJNA-RHYQMDGZSA-N Thr-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O DEGCBBCMYWNJNA-RHYQMDGZSA-N 0.000 description 1
- GFRIEEKFXOVPIR-RHYQMDGZSA-N Thr-Pro-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O GFRIEEKFXOVPIR-RHYQMDGZSA-N 0.000 description 1
- GVMXJJAJLIEASL-ZJDVBMNYSA-N Thr-Pro-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O GVMXJJAJLIEASL-ZJDVBMNYSA-N 0.000 description 1
- BCYUHPXBHCUYBA-CUJWVEQBSA-N Thr-Ser-His Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O BCYUHPXBHCUYBA-CUJWVEQBSA-N 0.000 description 1
- AHERARIZBPOMNU-KATARQTJSA-N Thr-Ser-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O AHERARIZBPOMNU-KATARQTJSA-N 0.000 description 1
- VUXIQSUQQYNLJP-XAVMHZPKSA-N Thr-Ser-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N)O VUXIQSUQQYNLJP-XAVMHZPKSA-N 0.000 description 1
- RVMNUBQWPVOUKH-HEIBUPTGSA-N Thr-Ser-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RVMNUBQWPVOUKH-HEIBUPTGSA-N 0.000 description 1
- NDZYTIMDOZMECO-SHGPDSBTSA-N Thr-Thr-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O NDZYTIMDOZMECO-SHGPDSBTSA-N 0.000 description 1
- UQCNIMDPYICBTR-KYNKHSRBSA-N Thr-Thr-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UQCNIMDPYICBTR-KYNKHSRBSA-N 0.000 description 1
- NHQVWACSJZJCGJ-FLBSBUHZSA-N Thr-Thr-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NHQVWACSJZJCGJ-FLBSBUHZSA-N 0.000 description 1
- BBPCSGKKPJUYRB-UVOCVTCTSA-N Thr-Thr-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O BBPCSGKKPJUYRB-UVOCVTCTSA-N 0.000 description 1
- QJIODPFLAASXJC-JHYOHUSXSA-N Thr-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O QJIODPFLAASXJC-JHYOHUSXSA-N 0.000 description 1
- ZMYCLHFLHRVOEA-HEIBUPTGSA-N Thr-Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ZMYCLHFLHRVOEA-HEIBUPTGSA-N 0.000 description 1
- LECUEEHKUFYOOV-ZJDVBMNYSA-N Thr-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](N)[C@@H](C)O LECUEEHKUFYOOV-ZJDVBMNYSA-N 0.000 description 1
- UMFLBPIPAJMNIM-LYARXQMPSA-N Thr-Trp-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CC=CC=C3)C(=O)O)N)O UMFLBPIPAJMNIM-LYARXQMPSA-N 0.000 description 1
- JAWUQFCGNVEDRN-MEYUZBJRSA-N Thr-Tyr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N)O JAWUQFCGNVEDRN-MEYUZBJRSA-N 0.000 description 1
- BKIOKSLLAAZYTC-KKHAAJSZSA-N Thr-Val-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O BKIOKSLLAAZYTC-KKHAAJSZSA-N 0.000 description 1
- KPMIQCXJDVKWKO-IFFSRLJSSA-N Thr-Val-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KPMIQCXJDVKWKO-IFFSRLJSSA-N 0.000 description 1
- SPIFGZFZMVLPHN-UNQGMJICSA-N Thr-Val-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SPIFGZFZMVLPHN-UNQGMJICSA-N 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- WGLPBDUCMAPZCE-UHFFFAOYSA-N Trioxochromium Chemical compound O=[Cr](=O)=O WGLPBDUCMAPZCE-UHFFFAOYSA-N 0.000 description 1
- BRBCKMMXKONBAA-KWBADKCTSA-N Trp-Ala-Ala Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 BRBCKMMXKONBAA-KWBADKCTSA-N 0.000 description 1
- NIWAGRRZHCMPOY-GMVOTWDCSA-N Trp-Ala-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N NIWAGRRZHCMPOY-GMVOTWDCSA-N 0.000 description 1
- RSUXQZNWAOTBQF-XIRDDKMYSA-N Trp-Arg-Gln Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N RSUXQZNWAOTBQF-XIRDDKMYSA-N 0.000 description 1
- UKINEYBQXPMOJO-UBHSHLNASA-N Trp-Asn-Ser Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N UKINEYBQXPMOJO-UBHSHLNASA-N 0.000 description 1
- BXKWZPXTTSCOMX-AQZXSJQPSA-N Trp-Asn-Thr Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BXKWZPXTTSCOMX-AQZXSJQPSA-N 0.000 description 1
- HYLNRGXEQACDKG-NYVOZVTQSA-N Trp-Asn-Trp Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O HYLNRGXEQACDKG-NYVOZVTQSA-N 0.000 description 1
- KZTLJLFVOIMRAQ-IHPCNDPISA-N Trp-Asn-Tyr Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KZTLJLFVOIMRAQ-IHPCNDPISA-N 0.000 description 1
- PXQPYPMSLBQHJJ-WFBYXXMGSA-N Trp-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N PXQPYPMSLBQHJJ-WFBYXXMGSA-N 0.000 description 1
- FKAPNDWDLDWZNF-QEJZJMRPSA-N Trp-Asp-Glu Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N FKAPNDWDLDWZNF-QEJZJMRPSA-N 0.000 description 1
- GTNCSPKYWCJZAC-XIRDDKMYSA-N Trp-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N GTNCSPKYWCJZAC-XIRDDKMYSA-N 0.000 description 1
- HJTYJQVRIQXMHM-XIRDDKMYSA-N Trp-Asp-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N HJTYJQVRIQXMHM-XIRDDKMYSA-N 0.000 description 1
- PMIJXCLOQFMOKZ-BPUTZDHNSA-N Trp-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N PMIJXCLOQFMOKZ-BPUTZDHNSA-N 0.000 description 1
- DVIIYMVCSUQOJG-QEJZJMRPSA-N Trp-Glu-Asp Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O DVIIYMVCSUQOJG-QEJZJMRPSA-N 0.000 description 1
- BEWOXKJJMBKRQL-AAEUAGOBSA-N Trp-Gly-Asp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)O)C(=O)O)N BEWOXKJJMBKRQL-AAEUAGOBSA-N 0.000 description 1
- WLBZWXXGSOLJBA-HOCLYGCPSA-N Trp-Gly-Lys Chemical compound C1=CC=C2C(C[C@H](N)C(=O)NCC(=O)N[C@@H](CCCCN)C(O)=O)=CNC2=C1 WLBZWXXGSOLJBA-HOCLYGCPSA-N 0.000 description 1
- NXQAOORHSYJRGH-AAEUAGOBSA-N Trp-Gly-Ser Chemical compound C1=CC=C2C(C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 NXQAOORHSYJRGH-AAEUAGOBSA-N 0.000 description 1
- OCCYDHCUKXRPSJ-SXNHZJKMSA-N Trp-Ile-Gln Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O OCCYDHCUKXRPSJ-SXNHZJKMSA-N 0.000 description 1
- YTCNLMSUXPCFBW-SXNHZJKMSA-N Trp-Ile-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O YTCNLMSUXPCFBW-SXNHZJKMSA-N 0.000 description 1
- CMXACOZDEJYZSK-XIRDDKMYSA-N Trp-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N CMXACOZDEJYZSK-XIRDDKMYSA-N 0.000 description 1
- NLLARHRWSFNEMH-NUTKFTJISA-N Trp-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N NLLARHRWSFNEMH-NUTKFTJISA-N 0.000 description 1
- OSYOKZZRVGUDMO-HSCHXYMDSA-N Trp-Lys-Ile Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OSYOKZZRVGUDMO-HSCHXYMDSA-N 0.000 description 1
- NESIQDDPEFTWAH-BPUTZDHNSA-N Trp-Met-Asp Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O NESIQDDPEFTWAH-BPUTZDHNSA-N 0.000 description 1
- WHJVRIBYQWHRQA-NQCBNZPSSA-N Trp-Phe-Ile Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CC=CC=C1 WHJVRIBYQWHRQA-NQCBNZPSSA-N 0.000 description 1
- VDCGPCSLAJAKBB-XIRDDKMYSA-N Trp-Ser-His Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N VDCGPCSLAJAKBB-XIRDDKMYSA-N 0.000 description 1
- SEXRBCGSZRCIPE-LYSGOOTNSA-N Trp-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O SEXRBCGSZRCIPE-LYSGOOTNSA-N 0.000 description 1
- YXSSXUIBUJGHJY-SFJXLCSZSA-N Trp-Thr-Phe Chemical compound C([C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)[C@H](O)C)C(O)=O)C1=CC=CC=C1 YXSSXUIBUJGHJY-SFJXLCSZSA-N 0.000 description 1
- STKZKWFOKOCSLW-UMPQAUOISA-N Trp-Thr-Val Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)[C@@H](C)O)=CNC2=C1 STKZKWFOKOCSLW-UMPQAUOISA-N 0.000 description 1
- ZKVANNIVSDOQMG-HKUYNNGSSA-N Trp-Tyr-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)NCC(=O)O)N ZKVANNIVSDOQMG-HKUYNNGSSA-N 0.000 description 1
- ZPZNQAZHMCLTOA-PXDAIIFMSA-N Trp-Tyr-Ile Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CC=C(O)C=C1 ZPZNQAZHMCLTOA-PXDAIIFMSA-N 0.000 description 1
- UIRVSEPRMWDVEW-RNXOBYDBSA-N Trp-Tyr-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC3=CNC4=CC=CC=C43)N UIRVSEPRMWDVEW-RNXOBYDBSA-N 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- VCXWRWYFJLXITF-AUTRQRHGSA-N Tyr-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 VCXWRWYFJLXITF-AUTRQRHGSA-N 0.000 description 1
- XLMDWQNAOKLKCP-XDTLVQLUSA-N Tyr-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N XLMDWQNAOKLKCP-XDTLVQLUSA-N 0.000 description 1
- IELISNUVHBKYBX-XDTLVQLUSA-N Tyr-Ala-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 IELISNUVHBKYBX-XDTLVQLUSA-N 0.000 description 1
- OOEUVMFKKZYSRX-LEWSCRJBSA-N Tyr-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N OOEUVMFKKZYSRX-LEWSCRJBSA-N 0.000 description 1
- LGEYOIQBBIPHQN-UWJYBYFXSA-N Tyr-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 LGEYOIQBBIPHQN-UWJYBYFXSA-N 0.000 description 1
- VTFWAGGJDRSQFG-MELADBBJSA-N Tyr-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O VTFWAGGJDRSQFG-MELADBBJSA-N 0.000 description 1
- SCCKSNREWHMKOJ-SRVKXCTJSA-N Tyr-Asn-Ser Chemical compound N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O SCCKSNREWHMKOJ-SRVKXCTJSA-N 0.000 description 1
- JRXKIVGWMMIIOF-YDHLFZDLSA-N Tyr-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N JRXKIVGWMMIIOF-YDHLFZDLSA-N 0.000 description 1
- GAYLGYUVTDMLKC-UWJYBYFXSA-N Tyr-Asp-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 GAYLGYUVTDMLKC-UWJYBYFXSA-N 0.000 description 1
- NLMXVDDEQFKQQU-CFMVVWHZSA-N Tyr-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NLMXVDDEQFKQQU-CFMVVWHZSA-N 0.000 description 1
- XBWKCYFGRXKWGO-SRVKXCTJSA-N Tyr-Cys-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O XBWKCYFGRXKWGO-SRVKXCTJSA-N 0.000 description 1
- CGDZGRLRXPNCOC-SRVKXCTJSA-N Tyr-Cys-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 CGDZGRLRXPNCOC-SRVKXCTJSA-N 0.000 description 1
- BODHJXJNRVRKFA-BZSNNMDCSA-N Tyr-Cys-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BODHJXJNRVRKFA-BZSNNMDCSA-N 0.000 description 1
- CRHFOYCJGVJPLE-AVGNSLFASA-N Tyr-Gln-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O CRHFOYCJGVJPLE-AVGNSLFASA-N 0.000 description 1
- UXUFNBVCPAWACG-SIUGBPQLSA-N Tyr-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N UXUFNBVCPAWACG-SIUGBPQLSA-N 0.000 description 1
- CKHQKYHIZCRTAP-SOUVJXGZSA-N Tyr-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O CKHQKYHIZCRTAP-SOUVJXGZSA-N 0.000 description 1
- IMXAAEFAIBRCQF-SIUGBPQLSA-N Tyr-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N IMXAAEFAIBRCQF-SIUGBPQLSA-N 0.000 description 1
- ZRPLVTZTKPPSBT-AVGNSLFASA-N Tyr-Glu-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZRPLVTZTKPPSBT-AVGNSLFASA-N 0.000 description 1
- KOVXHANYYYMBRF-IRIUXVKKSA-N Tyr-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O KOVXHANYYYMBRF-IRIUXVKKSA-N 0.000 description 1
- KCPFDGNYAMKZQP-KBPBESRZSA-N Tyr-Gly-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O KCPFDGNYAMKZQP-KBPBESRZSA-N 0.000 description 1
- NOOMDULIORCDNF-IRXDYDNUSA-N Tyr-Gly-Phe Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O NOOMDULIORCDNF-IRXDYDNUSA-N 0.000 description 1
- LFCQXIXJQXWZJI-BZSNNMDCSA-N Tyr-His-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N)O LFCQXIXJQXWZJI-BZSNNMDCSA-N 0.000 description 1
- WSFXJLFSJSXGMQ-MGHWNKPDSA-N Tyr-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N WSFXJLFSJSXGMQ-MGHWNKPDSA-N 0.000 description 1
- OHOVFPKXPZODHS-SJWGOKEGSA-N Tyr-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N OHOVFPKXPZODHS-SJWGOKEGSA-N 0.000 description 1
- QARCDOCCDOLJSF-HJPIBITLSA-N Tyr-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N QARCDOCCDOLJSF-HJPIBITLSA-N 0.000 description 1
- GULIUBBXCYPDJU-CQDKDKBSSA-N Tyr-Leu-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CC1=CC=C(O)C=C1 GULIUBBXCYPDJU-CQDKDKBSSA-N 0.000 description 1
- MVFQLSPDMMFCMW-KKUMJFAQSA-N Tyr-Leu-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O MVFQLSPDMMFCMW-KKUMJFAQSA-N 0.000 description 1
- BSCBBPKDVOZICB-KKUMJFAQSA-N Tyr-Leu-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BSCBBPKDVOZICB-KKUMJFAQSA-N 0.000 description 1
- KSCVLGXNQXKUAR-JYJNAYRXSA-N Tyr-Leu-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KSCVLGXNQXKUAR-JYJNAYRXSA-N 0.000 description 1
- KHCSOLAHNLOXJR-BZSNNMDCSA-N Tyr-Leu-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHCSOLAHNLOXJR-BZSNNMDCSA-N 0.000 description 1
- WDGDKHLSDIOXQC-ACRUOGEOSA-N Tyr-Leu-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 WDGDKHLSDIOXQC-ACRUOGEOSA-N 0.000 description 1
- NSGZILIDHCIZAM-KKUMJFAQSA-N Tyr-Leu-Ser Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N NSGZILIDHCIZAM-KKUMJFAQSA-N 0.000 description 1
- DMWNPLOERDAHSY-MEYUZBJRSA-N Tyr-Leu-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DMWNPLOERDAHSY-MEYUZBJRSA-N 0.000 description 1
- GITNQBVCEQBDQC-KKUMJFAQSA-N Tyr-Lys-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O GITNQBVCEQBDQC-KKUMJFAQSA-N 0.000 description 1
- HSBZWINKRYZCSQ-KKUMJFAQSA-N Tyr-Lys-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O HSBZWINKRYZCSQ-KKUMJFAQSA-N 0.000 description 1
- VUVVMFSDLYKHPA-PMVMPFDFSA-N Tyr-Lys-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC3=CC=C(C=C3)O)N VUVVMFSDLYKHPA-PMVMPFDFSA-N 0.000 description 1
- XDGPTBVOSHKDFT-KKUMJFAQSA-N Tyr-Met-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O XDGPTBVOSHKDFT-KKUMJFAQSA-N 0.000 description 1
- WTTRJMAZPDHPGS-KKXDTOCCSA-N Tyr-Phe-Ala Chemical compound C[C@H](NC(=O)[C@H](Cc1ccccc1)NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(O)=O WTTRJMAZPDHPGS-KKXDTOCCSA-N 0.000 description 1
- IGXLNVIYDYONFB-UFYCRDLUSA-N Tyr-Phe-Arg Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)C1=CC=C(O)C=C1 IGXLNVIYDYONFB-UFYCRDLUSA-N 0.000 description 1
- LRHBBGDMBLFYGL-FHWLQOOXSA-N Tyr-Phe-Glu Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCC(O)=O)C(O)=O)C1=CC=C(O)C=C1 LRHBBGDMBLFYGL-FHWLQOOXSA-N 0.000 description 1
- PHKQVWWHRYUCJL-HJOGWXRNSA-N Tyr-Phe-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O PHKQVWWHRYUCJL-HJOGWXRNSA-N 0.000 description 1
- VXFXIBCCVLJCJT-JYJNAYRXSA-N Tyr-Pro-Pro Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N1CCC[C@H]1C(O)=O VXFXIBCCVLJCJT-JYJNAYRXSA-N 0.000 description 1
- RWOKVQUCENPXGE-IHRRRGAJSA-N Tyr-Ser-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RWOKVQUCENPXGE-IHRRRGAJSA-N 0.000 description 1
- SOAUMCDLIUGXJJ-SRVKXCTJSA-N Tyr-Ser-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O SOAUMCDLIUGXJJ-SRVKXCTJSA-N 0.000 description 1
- IEWKKXZRJLTIOV-AVGNSLFASA-N Tyr-Ser-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O IEWKKXZRJLTIOV-AVGNSLFASA-N 0.000 description 1
- BIVIUZRBCAUNPW-JRQIVUDYSA-N Tyr-Thr-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O BIVIUZRBCAUNPW-JRQIVUDYSA-N 0.000 description 1
- PWKMJDQXKCENMF-MEYUZBJRSA-N Tyr-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O PWKMJDQXKCENMF-MEYUZBJRSA-N 0.000 description 1
- GAKBTSMAPGLQFA-JNPHEJMOSA-N Tyr-Thr-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 GAKBTSMAPGLQFA-JNPHEJMOSA-N 0.000 description 1
- LVILBTSHPTWDGE-PMVMPFDFSA-N Tyr-Trp-Lys Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCCN)C(O)=O)C1=CC=C(O)C=C1 LVILBTSHPTWDGE-PMVMPFDFSA-N 0.000 description 1
- ABZWHLRQBSBPTO-RNXOBYDBSA-N Tyr-Trp-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CC4=CC=C(C=C4)O)N ABZWHLRQBSBPTO-RNXOBYDBSA-N 0.000 description 1
- JQOMHZMWQHXALX-FHWLQOOXSA-N Tyr-Tyr-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JQOMHZMWQHXALX-FHWLQOOXSA-N 0.000 description 1
- WYOBRXPIZVKNMF-IRXDYDNUSA-N Tyr-Tyr-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)NCC(O)=O)C1=CC=C(O)C=C1 WYOBRXPIZVKNMF-IRXDYDNUSA-N 0.000 description 1
- RGJZPXFZIUUQDN-BPNCWPANSA-N Tyr-Val-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O RGJZPXFZIUUQDN-BPNCWPANSA-N 0.000 description 1
- NXPDPYYCIRDUHO-ULQDDVLXSA-N Tyr-Val-His Chemical compound C([C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CC=C(O)C=C1 NXPDPYYCIRDUHO-ULQDDVLXSA-N 0.000 description 1
- GOPQNCQSXBJAII-ULQDDVLXSA-N Tyr-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N GOPQNCQSXBJAII-ULQDDVLXSA-N 0.000 description 1
- DJIJBQYBDKGDIS-JYJNAYRXSA-N Tyr-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(C)C)C(O)=O DJIJBQYBDKGDIS-JYJNAYRXSA-N 0.000 description 1
- UEOOXDLMQZBPFR-ZKWXMUAHSA-N Val-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N UEOOXDLMQZBPFR-ZKWXMUAHSA-N 0.000 description 1
- IZFVRRYRMQFVGX-NRPADANISA-N Val-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N IZFVRRYRMQFVGX-NRPADANISA-N 0.000 description 1
- REJBPZVUHYNMEN-LSJOCFKGSA-N Val-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N REJBPZVUHYNMEN-LSJOCFKGSA-N 0.000 description 1
- VDPRBUOZLIFUIM-GUBZILKMSA-N Val-Arg-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](C(C)C)N VDPRBUOZLIFUIM-GUBZILKMSA-N 0.000 description 1
- KKHRWGYHBZORMQ-NHCYSSNCSA-N Val-Arg-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKHRWGYHBZORMQ-NHCYSSNCSA-N 0.000 description 1
- COYSIHFOCOMGCF-UHFFFAOYSA-N Val-Arg-Gly Natural products CC(C)C(N)C(=O)NC(C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-UHFFFAOYSA-N 0.000 description 1
- HNWQUBBOBKSFQV-AVGNSLFASA-N Val-Arg-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N HNWQUBBOBKSFQV-AVGNSLFASA-N 0.000 description 1
- PAPWZOJOLKZEFR-AVGNSLFASA-N Val-Arg-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N PAPWZOJOLKZEFR-AVGNSLFASA-N 0.000 description 1
- CVUDMNSZAIZFAE-TUAOUCFPSA-N Val-Arg-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N CVUDMNSZAIZFAE-TUAOUCFPSA-N 0.000 description 1
- CVUDMNSZAIZFAE-UHFFFAOYSA-N Val-Arg-Pro Natural products NC(N)=NCCCC(NC(=O)C(N)C(C)C)C(=O)N1CCCC1C(O)=O CVUDMNSZAIZFAE-UHFFFAOYSA-N 0.000 description 1
- AUMNPAUHKUNHHN-BYULHYEWSA-N Val-Asn-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N AUMNPAUHKUNHHN-BYULHYEWSA-N 0.000 description 1
- GXAZTLJYINLMJL-LAEOZQHASA-N Val-Asn-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N GXAZTLJYINLMJL-LAEOZQHASA-N 0.000 description 1
- LNYOXPDEIZJDEI-NHCYSSNCSA-N Val-Asn-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N LNYOXPDEIZJDEI-NHCYSSNCSA-N 0.000 description 1
- IDKGBVZGNTYYCC-QXEWZRGKSA-N Val-Asn-Pro Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(O)=O IDKGBVZGNTYYCC-QXEWZRGKSA-N 0.000 description 1
- PVPAOIGJYHVWBT-KKHAAJSZSA-N Val-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N)O PVPAOIGJYHVWBT-KKHAAJSZSA-N 0.000 description 1
- IQQYYFPCWKWUHW-YDHLFZDLSA-N Val-Asn-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N IQQYYFPCWKWUHW-YDHLFZDLSA-N 0.000 description 1
- ZQGPWORGSNRQLN-NHCYSSNCSA-N Val-Asp-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N ZQGPWORGSNRQLN-NHCYSSNCSA-N 0.000 description 1
- TZVUSFMQWPWHON-NHCYSSNCSA-N Val-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N TZVUSFMQWPWHON-NHCYSSNCSA-N 0.000 description 1
- DDNIHOWRDOXXPF-NGZCFLSTSA-N Val-Asp-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N DDNIHOWRDOXXPF-NGZCFLSTSA-N 0.000 description 1
- YODDULVCGFQRFZ-ZKWXMUAHSA-N Val-Asp-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O YODDULVCGFQRFZ-ZKWXMUAHSA-N 0.000 description 1
- FPCIBLUVDNXPJO-XPUUQOCRSA-N Val-Cys-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CS)C(=O)NCC(O)=O FPCIBLUVDNXPJO-XPUUQOCRSA-N 0.000 description 1
- HIZMLPKDJAXDRG-FXQIFTODSA-N Val-Cys-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)O)N HIZMLPKDJAXDRG-FXQIFTODSA-N 0.000 description 1
- HURRXSNHCCSJHA-AUTRQRHGSA-N Val-Gln-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HURRXSNHCCSJHA-AUTRQRHGSA-N 0.000 description 1
- VFOHXOLPLACADK-GVXVVHGQSA-N Val-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N VFOHXOLPLACADK-GVXVVHGQSA-N 0.000 description 1
- CVIXTAITYJQMPE-LAEOZQHASA-N Val-Glu-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CVIXTAITYJQMPE-LAEOZQHASA-N 0.000 description 1
- GBESYURLQOYWLU-LAEOZQHASA-N Val-Glu-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GBESYURLQOYWLU-LAEOZQHASA-N 0.000 description 1
- VVZDBPBZHLQPPB-XVKPBYJWSA-N Val-Glu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VVZDBPBZHLQPPB-XVKPBYJWSA-N 0.000 description 1
- YDPFWRVQHFWBKI-GVXVVHGQSA-N Val-Glu-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N YDPFWRVQHFWBKI-GVXVVHGQSA-N 0.000 description 1
- VCAWFLIWYNMHQP-UKJIMTQDSA-N Val-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N VCAWFLIWYNMHQP-UKJIMTQDSA-N 0.000 description 1
- FOADDSDHGRFUOC-DZKIICNBSA-N Val-Glu-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N FOADDSDHGRFUOC-DZKIICNBSA-N 0.000 description 1
- UEHRGZCNLSWGHK-DLOVCJGASA-N Val-Glu-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UEHRGZCNLSWGHK-DLOVCJGASA-N 0.000 description 1
- CELJCNRXKZPTCX-XPUUQOCRSA-N Val-Gly-Ala Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O CELJCNRXKZPTCX-XPUUQOCRSA-N 0.000 description 1
- JTWIMNMUYLQNPI-WPRPVWTQSA-N Val-Gly-Arg Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N JTWIMNMUYLQNPI-WPRPVWTQSA-N 0.000 description 1
- DJEVQCWNMQOABE-RCOVLWMOSA-N Val-Gly-Asp Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)O)C(=O)O)N DJEVQCWNMQOABE-RCOVLWMOSA-N 0.000 description 1
- PMDOQZFYGWZSTK-LSJOCFKGSA-N Val-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C PMDOQZFYGWZSTK-LSJOCFKGSA-N 0.000 description 1
- SYOMXKPPFZRELL-ONGXEEELSA-N Val-Gly-Lys Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N SYOMXKPPFZRELL-ONGXEEELSA-N 0.000 description 1
- FXVDGDZRYLFQKY-WPRPVWTQSA-N Val-Gly-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C FXVDGDZRYLFQKY-WPRPVWTQSA-N 0.000 description 1
- SDSCOOZQQGUQFC-GVXVVHGQSA-N Val-His-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N SDSCOOZQQGUQFC-GVXVVHGQSA-N 0.000 description 1
- ZIGZPYJXIWLQFC-QTKMDUPCSA-N Val-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](C(C)C)N)O ZIGZPYJXIWLQFC-QTKMDUPCSA-N 0.000 description 1
- LKUDRJSNRWVGMS-QSFUFRPTSA-N Val-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LKUDRJSNRWVGMS-QSFUFRPTSA-N 0.000 description 1
- VXDSPJJQUQDCKH-UKJIMTQDSA-N Val-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N VXDSPJJQUQDCKH-UKJIMTQDSA-N 0.000 description 1
- VHRLUTIMTDOVCG-PEDHHIEDSA-N Val-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](C(C)C)N VHRLUTIMTDOVCG-PEDHHIEDSA-N 0.000 description 1
- JZWZACGUZVCQPS-RNJOBUHISA-N Val-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N JZWZACGUZVCQPS-RNJOBUHISA-N 0.000 description 1
- APQIVBCUIUDSMB-OSUNSFLBSA-N Val-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N APQIVBCUIUDSMB-OSUNSFLBSA-N 0.000 description 1
- BZWUSZGQOILYEU-STECZYCISA-N Val-Ile-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 BZWUSZGQOILYEU-STECZYCISA-N 0.000 description 1
- OTJMMKPMLUNTQT-AVGNSLFASA-N Val-Leu-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N OTJMMKPMLUNTQT-AVGNSLFASA-N 0.000 description 1
- XTDDIVQWDXMRJL-IHRRRGAJSA-N Val-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N XTDDIVQWDXMRJL-IHRRRGAJSA-N 0.000 description 1
- DAVNYIUELQBTAP-XUXIUFHCSA-N Val-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N DAVNYIUELQBTAP-XUXIUFHCSA-N 0.000 description 1
- AEMPCGRFEZTWIF-IHRRRGAJSA-N Val-Leu-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O AEMPCGRFEZTWIF-IHRRRGAJSA-N 0.000 description 1
- BTWMICVCQLKKNR-DCAQKATOSA-N Val-Leu-Ser Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C([O-])=O BTWMICVCQLKKNR-DCAQKATOSA-N 0.000 description 1
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 1
- KTEZUXISLQTDDQ-NHCYSSNCSA-N Val-Lys-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KTEZUXISLQTDDQ-NHCYSSNCSA-N 0.000 description 1
- WBAJDGWKRIHOAC-GVXVVHGQSA-N Val-Lys-Gln Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O WBAJDGWKRIHOAC-GVXVVHGQSA-N 0.000 description 1
- QRVPEKJBBRYISE-XUXIUFHCSA-N Val-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N QRVPEKJBBRYISE-XUXIUFHCSA-N 0.000 description 1
- YMTOEGGOCHVGEH-IHRRRGAJSA-N Val-Lys-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O YMTOEGGOCHVGEH-IHRRRGAJSA-N 0.000 description 1
- HPANGHISDXDUQY-ULQDDVLXSA-N Val-Lys-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N HPANGHISDXDUQY-ULQDDVLXSA-N 0.000 description 1
- VENKIVFKIPGEJN-NHCYSSNCSA-N Val-Met-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N VENKIVFKIPGEJN-NHCYSSNCSA-N 0.000 description 1
- RQOMPQGUGBILAG-AVGNSLFASA-N Val-Met-Leu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O RQOMPQGUGBILAG-AVGNSLFASA-N 0.000 description 1
- UEPLNXPLHJUYPT-AVGNSLFASA-N Val-Met-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(O)=O UEPLNXPLHJUYPT-AVGNSLFASA-N 0.000 description 1
- WSUWDIVCPOJFCX-TUAOUCFPSA-N Val-Met-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N1CCC[C@@H]1C(=O)O)N WSUWDIVCPOJFCX-TUAOUCFPSA-N 0.000 description 1
- QPPZEDOTPZOSEC-RCWTZXSCSA-N Val-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](C(C)C)N)O QPPZEDOTPZOSEC-RCWTZXSCSA-N 0.000 description 1
- MJFSRZZJQWZHFQ-SRVKXCTJSA-N Val-Met-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(=O)O)N MJFSRZZJQWZHFQ-SRVKXCTJSA-N 0.000 description 1
- LJSZPMSUYKKKCP-UBHSHLNASA-N Val-Phe-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 LJSZPMSUYKKKCP-UBHSHLNASA-N 0.000 description 1
- VNGKMNPAENRGDC-JYJNAYRXSA-N Val-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=CC=C1 VNGKMNPAENRGDC-JYJNAYRXSA-N 0.000 description 1
- NZGOVKLVQNOEKP-YDHLFZDLSA-N Val-Phe-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N NZGOVKLVQNOEKP-YDHLFZDLSA-N 0.000 description 1
- YLRAFVVWZRSZQC-DZKIICNBSA-N Val-Phe-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YLRAFVVWZRSZQC-DZKIICNBSA-N 0.000 description 1
- HJSLDXZAZGFPDK-ULQDDVLXSA-N Val-Phe-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](C(C)C)N HJSLDXZAZGFPDK-ULQDDVLXSA-N 0.000 description 1
- MHHAWNPHDLCPLF-ULQDDVLXSA-N Val-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=CC=C1 MHHAWNPHDLCPLF-ULQDDVLXSA-N 0.000 description 1
- KISFXYYRKKNLOP-IHRRRGAJSA-N Val-Phe-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)O)N KISFXYYRKKNLOP-IHRRRGAJSA-N 0.000 description 1
- YTNGABPUXFEOGU-SRVKXCTJSA-N Val-Pro-Arg Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O YTNGABPUXFEOGU-SRVKXCTJSA-N 0.000 description 1
- RYQUMYBMOJYYDK-NHCYSSNCSA-N Val-Pro-Glu Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RYQUMYBMOJYYDK-NHCYSSNCSA-N 0.000 description 1
- VSCIANXXVZOYOC-AVGNSLFASA-N Val-Pro-His Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N VSCIANXXVZOYOC-AVGNSLFASA-N 0.000 description 1
- USLVEJAHTBLSIL-CYDGBPFRSA-N Val-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C USLVEJAHTBLSIL-CYDGBPFRSA-N 0.000 description 1
- QIVPZSWBBHRNBA-JYJNAYRXSA-N Val-Pro-Phe Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O QIVPZSWBBHRNBA-JYJNAYRXSA-N 0.000 description 1
- QSPOLEBZTMESFY-SRVKXCTJSA-N Val-Pro-Val Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O QSPOLEBZTMESFY-SRVKXCTJSA-N 0.000 description 1
- DEGUERSKQBRZMZ-FXQIFTODSA-N Val-Ser-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DEGUERSKQBRZMZ-FXQIFTODSA-N 0.000 description 1
- AJNUKMZFHXUBMK-GUBZILKMSA-N Val-Ser-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N AJNUKMZFHXUBMK-GUBZILKMSA-N 0.000 description 1
- VIKZGAUAKQZDOF-NRPADANISA-N Val-Ser-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O VIKZGAUAKQZDOF-NRPADANISA-N 0.000 description 1
- VHIZXDZMTDVFGX-DCAQKATOSA-N Val-Ser-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N VHIZXDZMTDVFGX-DCAQKATOSA-N 0.000 description 1
- UJMCYJKPDFQLHX-XGEHTFHBSA-N Val-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N)O UJMCYJKPDFQLHX-XGEHTFHBSA-N 0.000 description 1
- HWNYVQMOLCYHEA-IHRRRGAJSA-N Val-Ser-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N HWNYVQMOLCYHEA-IHRRRGAJSA-N 0.000 description 1
- NZYNRRGJJVSSTJ-GUBZILKMSA-N Val-Ser-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NZYNRRGJJVSSTJ-GUBZILKMSA-N 0.000 description 1
- MNSSBIHFEUUXNW-RCWTZXSCSA-N Val-Thr-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N MNSSBIHFEUUXNW-RCWTZXSCSA-N 0.000 description 1
- BZDGLJPROOOUOZ-XGEHTFHBSA-N Val-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C(C)C)N)O BZDGLJPROOOUOZ-XGEHTFHBSA-N 0.000 description 1
- UVHFONIHVHLDDQ-IFFSRLJSSA-N Val-Thr-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O UVHFONIHVHLDDQ-IFFSRLJSSA-N 0.000 description 1
- JXCOEPXCBVCTRD-JYJNAYRXSA-N Val-Tyr-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N JXCOEPXCBVCTRD-JYJNAYRXSA-N 0.000 description 1
- VTIAEOKFUJJBTC-YDHLFZDLSA-N Val-Tyr-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VTIAEOKFUJJBTC-YDHLFZDLSA-N 0.000 description 1
- DOBHJKVVACOQTN-DZKIICNBSA-N Val-Tyr-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=C(O)C=C1 DOBHJKVVACOQTN-DZKIICNBSA-N 0.000 description 1
- AEFJNECXZCODJM-UWVGGRQHSA-N Val-Val-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C(=O)NCC([O-])=O AEFJNECXZCODJM-UWVGGRQHSA-N 0.000 description 1
- XNLUVJPMPAZHCY-JYJNAYRXSA-N Val-Val-Phe Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 XNLUVJPMPAZHCY-JYJNAYRXSA-N 0.000 description 1
- LLJLBRRXKZTTRD-GUBZILKMSA-N Val-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N LLJLBRRXKZTTRD-GUBZILKMSA-N 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- IOUPEELXVYPCPG-UHFFFAOYSA-N Valylglycine Chemical compound CC(C)C(N)C(=O)NCC(O)=O IOUPEELXVYPCPG-UHFFFAOYSA-N 0.000 description 1
- 235000009754 Vitis X bourquina Nutrition 0.000 description 1
- 235000012333 Vitis X labruscana Nutrition 0.000 description 1
- 240000006365 Vitis vinifera Species 0.000 description 1
- 235000014787 Vitis vinifera Nutrition 0.000 description 1
- 101100161758 Yarrowia lipolytica (strain CLIB 122 / E 150) POX3 gene Proteins 0.000 description 1
- 240000008042 Zea mays Species 0.000 description 1
- 101100188627 Zea mays OLE16 gene Proteins 0.000 description 1
- 101100194320 Zea mays PER1 gene Proteins 0.000 description 1
- 101100029251 Zea mays PER2 gene Proteins 0.000 description 1
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 1
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 1
- 230000035508 accumulation Effects 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 108010081404 acein-2 Proteins 0.000 description 1
- WETWJCDKMRHUPV-UHFFFAOYSA-N acetyl chloride Chemical compound CC(Cl)=O WETWJCDKMRHUPV-UHFFFAOYSA-N 0.000 description 1
- 239000012346 acetyl chloride Substances 0.000 description 1
- 229940100228 acetyl coenzyme a Drugs 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 239000011543 agarose gel Substances 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 1
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 1
- 108010045350 alanyl-tyrosyl-alanine Proteins 0.000 description 1
- 108010011559 alanylphenylalanine Proteins 0.000 description 1
- 230000001476 alcoholic effect Effects 0.000 description 1
- 230000036626 alertness Effects 0.000 description 1
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 1
- BFNBIHQBYMNNAN-UHFFFAOYSA-N ammonium sulfate Chemical compound N.N.OS(O)(=O)=O BFNBIHQBYMNNAN-UHFFFAOYSA-N 0.000 description 1
- 229910052921 ammonium sulfate Inorganic materials 0.000 description 1
- 235000011130 ammonium sulphate Nutrition 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 244000000054 animal parasite Species 0.000 description 1
- 108010052670 arginyl-glutamyl-glutamic acid Proteins 0.000 description 1
- 108010009111 arginyl-glycyl-glutamic acid Proteins 0.000 description 1
- 108010043240 arginyl-leucyl-glycine Proteins 0.000 description 1
- 108010018691 arginyl-threonyl-arginine Proteins 0.000 description 1
- 108010059459 arginyl-threonyl-phenylalanine Proteins 0.000 description 1
- 108010060035 arginylproline Proteins 0.000 description 1
- 235000016520 artichoke thistle Nutrition 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 239000012681 biocontrol agent Substances 0.000 description 1
- 230000031018 biological processes and functions Effects 0.000 description 1
- 230000001851 biosynthetic effect Effects 0.000 description 1
- 230000006696 biosynthetic metabolic pathway Effects 0.000 description 1
- 230000002051 biphasic effect Effects 0.000 description 1
- 229920001400 block copolymer Polymers 0.000 description 1
- 229940025250 camphora Drugs 0.000 description 1
- 239000010238 camphora Substances 0.000 description 1
- 229940041514 candida albicans extract Drugs 0.000 description 1
- 239000004202 carbamide Substances 0.000 description 1
- 150000001732 carboxylic acid derivatives Chemical class 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 239000001913 cellulose Substances 0.000 description 1
- 229920002678 cellulose Polymers 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 235000014167 chia Nutrition 0.000 description 1
- 229910000423 chromium oxide Inorganic materials 0.000 description 1
- 230000004186 co-expression Effects 0.000 description 1
- 239000005515 coenzyme Substances 0.000 description 1
- 238000007398 colorimetric assay Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 230000027326 copulation Effects 0.000 description 1
- 235000005822 corn Nutrition 0.000 description 1
- 230000001086 cytosolic effect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 108010033011 des-Arg- enterostatin Proteins 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000001066 destructive effect Effects 0.000 description 1
- 239000003599 detergent Substances 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 239000008121 dextrose Substances 0.000 description 1
- 150000001993 dienes Chemical class 0.000 description 1
- VSGYTOKLSWSEPK-UHFFFAOYSA-M diethyl-[3-(2-hydroxy-2,2-diphenylacetyl)oxypropyl]-methylazanium;chloride Chemical compound [Cl-].C=1C=CC=CC=1C(O)(C(=O)OCCC[N+](C)(CC)CC)C1=CC=CC=C1 VSGYTOKLSWSEPK-UHFFFAOYSA-M 0.000 description 1
- 108010009297 diglycyl-histidine Proteins 0.000 description 1
- 239000004205 dimethyl polysiloxane Substances 0.000 description 1
- 235000013870 dimethyl polysiloxane Nutrition 0.000 description 1
- 239000002270 dispersing agent Substances 0.000 description 1
- 230000003828 downregulation Effects 0.000 description 1
- 235000013601 eggs Nutrition 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 239000003995 emulsifying agent Substances 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 239000013604 expression vector Substances 0.000 description 1
- 230000004129 fatty acid metabolism Effects 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 238000002825 functional assay Methods 0.000 description 1
- 108010006664 gamma-glutamyl-glycyl-glycine Proteins 0.000 description 1
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 1
- 108010085059 glutamyl-arginyl-proline Proteins 0.000 description 1
- 108010042598 glutamyl-aspartyl-glycine Proteins 0.000 description 1
- 150000002313 glycerolipids Chemical class 0.000 description 1
- JYPCXBJRLBHWME-UHFFFAOYSA-N glycyl-L-prolyl-L-arginine Natural products NCC(=O)N1CCCC1C(=O)NC(CCCN=C(N)N)C(O)=O JYPCXBJRLBHWME-UHFFFAOYSA-N 0.000 description 1
- 108010090037 glycyl-alanyl-isoleucine Proteins 0.000 description 1
- 108010084264 glycyl-glycyl-cysteine Proteins 0.000 description 1
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 1
- 108010051307 glycyl-glycyl-proline Proteins 0.000 description 1
- 108010066198 glycyl-leucyl-phenylalanine Proteins 0.000 description 1
- 108010050475 glycyl-leucyl-tyrosine Proteins 0.000 description 1
- 108010077435 glycyl-phenylalanyl-glycine Proteins 0.000 description 1
- 108010025801 glycyl-prolyl-arginine Proteins 0.000 description 1
- 108010048994 glycyl-tyrosyl-alanine Proteins 0.000 description 1
- 108010015792 glycyllysine Proteins 0.000 description 1
- 108010077515 glycylproline Proteins 0.000 description 1
- 108010084389 glycyltryptophan Proteins 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 239000002920 hazardous waste Substances 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 229910001385 heavy metal Inorganic materials 0.000 description 1
- 108010045383 histidyl-glycyl-glutamic acid Proteins 0.000 description 1
- 108010036413 histidylglycine Proteins 0.000 description 1
- 230000007062 hydrolysis Effects 0.000 description 1
- 238000006460 hydrolysis reaction Methods 0.000 description 1
- 125000001165 hydrophobic group Chemical group 0.000 description 1
- RCBVKBFIWMOMHF-UHFFFAOYSA-L hydroxy-(hydroxy(dioxo)chromio)oxy-dioxochromium;pyridine Chemical compound C1=CC=NC=C1.C1=CC=NC=C1.O[Cr](=O)(=O)O[Cr](O)(=O)=O RCBVKBFIWMOMHF-UHFFFAOYSA-L 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 108010060857 isoleucyl-valyl-tyrosine Proteins 0.000 description 1
- 108010027338 isoleucylcysteine Proteins 0.000 description 1
- QXJSBBXBKPUZAA-UHFFFAOYSA-N isooleic acid Natural products CCCCCCCC=CCCCCCCCCC(O)=O QXJSBBXBKPUZAA-UHFFFAOYSA-N 0.000 description 1
- 108010053037 kyotorphin Proteins 0.000 description 1
- 230000001418 larval effect Effects 0.000 description 1
- 108010009932 leucyl-alanyl-glycyl-valine Proteins 0.000 description 1
- 108010073093 leucyl-glycyl-glycyl-glycine Proteins 0.000 description 1
- 108010051673 leucyl-glycyl-phenylalanine Proteins 0.000 description 1
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 1
- 108010012058 leucyltyrosine Proteins 0.000 description 1
- 230000006372 lipid accumulation Effects 0.000 description 1
- 238000009630 liquid culture Methods 0.000 description 1
- 230000028744 lysogeny Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 239000002207 metabolite Substances 0.000 description 1
- 108010056582 methionylglutamic acid Proteins 0.000 description 1
- 108010005942 methionylglycine Proteins 0.000 description 1
- KXKVLQRXCPHEJC-UHFFFAOYSA-N methyl acetate Chemical compound COC(C)=O KXKVLQRXCPHEJC-UHFFFAOYSA-N 0.000 description 1
- 239000002480 mineral oil Substances 0.000 description 1
- 230000002438 mitochondrial effect Effects 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 230000001473 noxious effect Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 239000003921 oil Substances 0.000 description 1
- 235000019198 oils Nutrition 0.000 description 1
- ZQPPMHVWECSIRJ-KTKRTIGZSA-N oleic acid Chemical compound CCCCCCCC\C=C/CCCCCCCC(O)=O ZQPPMHVWECSIRJ-KTKRTIGZSA-N 0.000 description 1
- 150000002894 organic compounds Chemical class 0.000 description 1
- 235000013348 organic food Nutrition 0.000 description 1
- 239000003960 organic solvent Substances 0.000 description 1
- 150000002898 organic sulfur compounds Chemical class 0.000 description 1
- 239000010815 organic waste Substances 0.000 description 1
- 230000024241 parasitism Effects 0.000 description 1
- 244000052769 pathogen Species 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 239000008188 pellet Substances 0.000 description 1
- 108010054300 peroxisomal acyl-CoA oxidase Proteins 0.000 description 1
- 210000002824 peroxisome Anatomy 0.000 description 1
- 230000000361 pesticidal effect Effects 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 108010064486 phenylalanyl-leucyl-valine Proteins 0.000 description 1
- 108010024654 phenylalanyl-prolyl-alanine Proteins 0.000 description 1
- 108010089198 phenylalanyl-prolyl-arginine Proteins 0.000 description 1
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 1
- 229920003023 plastic Polymers 0.000 description 1
- 239000004033 plastic Substances 0.000 description 1
- 229920000435 poly(dimethylsiloxane) Polymers 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 229920001155 polypropylene Polymers 0.000 description 1
- 229920001296 polysiloxane Polymers 0.000 description 1
- 108010014614 prolyl-glycyl-proline Proteins 0.000 description 1
- 108700042769 prolyl-leucyl-glycine Proteins 0.000 description 1
- 108010077112 prolyl-proline Proteins 0.000 description 1
- 108010087846 prolyl-prolyl-glycine Proteins 0.000 description 1
- 108010031719 prolyl-serine Proteins 0.000 description 1
- 108010004914 prolylarginine Proteins 0.000 description 1
- UMJSCPRVCHMLSP-UHFFFAOYSA-N pyridine Natural products COC1=CC=CN=C1 UMJSCPRVCHMLSP-UHFFFAOYSA-N 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 150000003304 ruthenium compounds Chemical class 0.000 description 1
- 238000007480 sanger sequencing Methods 0.000 description 1
- 239000006152 selective media Substances 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 1
- 230000001568 sexual effect Effects 0.000 description 1
- 239000000377 silicon dioxide Substances 0.000 description 1
- 229950002273 simeticone Drugs 0.000 description 1
- SUKJFIGYRHOWBL-UHFFFAOYSA-N sodium hypochlorite Chemical compound [Na+].Cl[O-] SUKJFIGYRHOWBL-UHFFFAOYSA-N 0.000 description 1
- 238000005507 spraying Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 235000000346 sugar Nutrition 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 125000000446 sulfanediyl group Chemical group *S* 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 125000003396 thiol group Chemical group [H]S* 0.000 description 1
- 108010033670 threonyl-aspartyl-tyrosine Proteins 0.000 description 1
- 108010071097 threonyl-lysyl-proline Proteins 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 230000014616 translation Effects 0.000 description 1
- VMPHSYLJUKZBJJ-UHFFFAOYSA-N trilaurin Chemical compound CCCCCCCCCCCC(=O)OCC(OC(=O)CCCCCCCCCCC)COC(=O)CCCCCCCCCCC VMPHSYLJUKZBJJ-UHFFFAOYSA-N 0.000 description 1
- 108010015666 tryptophyl-leucyl-glutamic acid Proteins 0.000 description 1
- 238000007039 two-step reaction Methods 0.000 description 1
- 108010035534 tyrosyl-leucyl-alanine Proteins 0.000 description 1
- 108010003137 tyrosyltyrosine Proteins 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 239000001993 wax Substances 0.000 description 1
- 238000001262 western blot Methods 0.000 description 1
- 239000000080 wetting agent Substances 0.000 description 1
- 239000007221 ypg medium Substances 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
- C12N15/81—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01N—PRESERVATION OF BODIES OF HUMANS OR ANIMALS OR PLANTS OR PARTS THEREOF; BIOCIDES, e.g. AS DISINFECTANTS, AS PESTICIDES OR AS HERBICIDES; PEST REPELLANTS OR ATTRACTANTS; PLANT GROWTH REGULATORS
- A01N31/00—Biocides, pest repellants or attractants, or plant growth regulators containing organic oxygen or sulfur compounds
- A01N31/02—Acyclic compounds
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01N—PRESERVATION OF BODIES OF HUMANS OR ANIMALS OR PLANTS OR PARTS THEREOF; BIOCIDES, e.g. AS DISINFECTANTS, AS PESTICIDES OR AS HERBICIDES; PEST REPELLANTS OR ATTRACTANTS; PLANT GROWTH REGULATORS
- A01N63/00—Biocides, pest repellants or attractants, or plant growth regulators containing microorganisms, viruses, microbial fungi, animals or substances produced by, or obtained from, microorganisms, viruses, microbial fungi or animals, e.g. enzymes or fermentates
- A01N63/30—Microbial fungi; Substances produced thereby or obtained therefrom
- A01N63/32—Yeast
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N1/00—Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
- C12N1/14—Fungi; Culture media therefor
- C12N1/16—Yeasts; Culture media therefor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0008—Oxidoreductases (1.) acting on the aldehyde or oxo group of donors (1.2)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0012—Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7)
- C12N9/0036—Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on NADH or NADPH (1.6)
- C12N9/0038—Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on NADH or NADPH (1.6) with a heme protein as acceptor (1.6.2)
- C12N9/004—Cytochrome-b5 reductase (1.6.2.2)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0071—Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1025—Acyltransferases (2.3)
- C12N9/1029—Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/02—Preparation of oxygen-containing organic compounds containing a hydroxy group
- C12P7/04—Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/64—Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/64—Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
- C12P7/6409—Fatty acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/64—Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
- C12P7/6409—Fatty acids
- C12P7/6427—Polyunsaturated fatty acids [PUFA], i.e. having two or more double bonds in their backbone
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/64—Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
- C12P7/6436—Fatty acid esters
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y102/00—Oxidoreductases acting on the aldehyde or oxo group of donors (1.2)
- C12Y102/01—Oxidoreductases acting on the aldehyde or oxo group of donors (1.2) with NAD+ or NADP+ as acceptor (1.2.1)
- C12Y102/01084—Alcohol-forming fatty acyl-CoA reductase (1.2.1.84)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y106/00—Oxidoreductases acting on NADH or NADPH (1.6)
- C12Y106/02—Oxidoreductases acting on NADH or NADPH (1.6) with a heme protein as acceptor (1.6.2)
- C12Y106/02002—Cytochrome-b5 reductase (1.6.2.2)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y203/00—Acyltransferases (2.3)
- C12Y203/01—Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
- C12Y203/01086—Fatty-acyl-CoA synthase (2.3.1.86)
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P20/00—Technologies relating to chemical industry
- Y02P20/50—Improvements relating to the production of bulk chemicals
- Y02P20/582—Recycling of unreacted starting or intermediate materials
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Genetics & Genomics (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Mycology (AREA)
- Medicinal Chemistry (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Plant Pathology (AREA)
- Oil, Petroleum & Natural Gas (AREA)
- Biophysics (AREA)
- Virology (AREA)
- Physics & Mathematics (AREA)
- Pest Control & Pesticides (AREA)
- Agronomy & Crop Science (AREA)
- Dentistry (AREA)
- Environmental Sciences (AREA)
- Tropical Medicine & Parasitology (AREA)
- Botany (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
본 발명은 E8,E10-도데카디에닐 코엔자임 A, 코들레몬 (E8,E10-도데카디엔-1-올), 및 임의로, 이의 유도체 E8,E10-도데카디에닐 아세테이트 및/또는 E8,E10-도데카디에날의 생산을 위해 조작된 효모 세포에 관한 것이다. E8,E10-도데카디에닐 코엔자임 A, 코들레몬 (E8,E10-도데카디엔-1-올), 및 임의로, 이의 유도체 E8,E10-도데카디에닐 아세테이트 및/또는 E8,E10-도데카디에날의 생산 방법 또한 제공한다. 상기 효모 세포를 수득하는 데 유용한 핵산 구축물 또한 제공한다.
Description
기술 분야
본 발명은 E8,E10-도데카디에닐 코엔자임 A, 코들레몬 (E8,E10-도데카디엔-1-올), 및 임의로, 이의 유도체 E8,E10-도데카디에닐 아세테이트 및/또는 E8,E10-도데카디에날의 제조를 위해 조작된 효모 세포에 관한 것이다. E8,E10-도데카디에닐 코엔자임 A, 코들레몬 (E8,E10-도데카디엔-1-올), 및 임의로, 이의 유도체 E8,E10-도데카디에닐 아세테이트 및/또는 E8,E10-도데카디에날의 생산 방법 또한 제공한다. 상기 효모 세포를 수득하는 데 유용한 핵산 구축물 또한 제공한다.
배경
통합 병해충 관리 (IPM)는 작물 수확량을 증가시키고, 환경에 미치는 영향을 최소화하며, 유기농 식품 생산을 가능하게 하는 데 중요한 역할을 할 것으로 예상된다. IPM은 예컨대, 페로몬을 사용한 교미 교란, 페로몬, 유익한 곤충 등을 사용한 대량 포획과 같은 대안적 병해충 방제 방법을 사용한다.
페로몬은 곤충 (다른 유기체와 마찬가지로)이 짝 유인, 경보, 흔적 표시 및 집합을 비롯한 다양한 상황에서 동일한 종의 개체와 의사 소통하는 데 사용하는 다양한 화학 물질 군을 구성한다. 장거리 짝 찾기와 연관된 곤충 페로몬은 살충제에 대한 안전하고 환경 친화적인 대안으로서 이미 농업 및 임업 분야에서 병해충 모니터링 및 방제에 사용되고 있다.
페로몬은 살충제에 대한 건강 및 환경 친화적 대안을 나타낸다. 들판 또는 과수원에 성 페로몬을 뿌리면 곤충의 의사 소통은 파괴되고, 교미가 방지되며; 따라서, 수정란은 낳지 않을 것이며, 작물에 유충 피해가 발생할 것이다. 이 방법은 "교미 교란"으로 불린다. 페로몬은 유익한 종 또는 인간에게 해를 끼치지 않는 생분해성, 종 특이적 화합물이기 때문에, 살곤충제에 대한 매력적인 대안이다.
병해충 방제를 위한 곤충 페로몬의 적용은 수십 년 전 오직 산업적 규모의 페로몬 합성이 시작된 후에만 가능해졌다. 그럼에도 불구하고, 화학적으로 합성된 페로몬의 가격은 여전히 높으며, 농업 및 임업에서의 이의 사용을 확장시키는 데 주요 장벽이 되고 있다. 페로몬의 화학적 생산의 또 다른 단점은 독성 화학물질이 전구체, 촉매제 및 용매로 사용되어야 하고, 정제 동안 많은 양의 유기 폐기물이 생성된다는 점이다. 따라서, 복잡한 화학 합성 기반 프로세스를 기반으로 하는 현 생산 방법은 농업 및 임업의 많은 잠재적 응용 분야에서 광범위하게 사용하기 위해 제품을 엄청나게 비싸게 만든다.
화학적 생산 방법과 비교하여 생물학적 생산 방법에는 몇 가지 장점이 있다. 첫째, 모든 반응은 상이한 전구체, 촉매제 및 조건 (종종 고온 및 고압)을 필요로 하는 다중 화학 반응 단계 대신, 발효 탱크 중 주변 온도하에서 조작된 세포에 의해 수행된다. 더욱이, 조작된 세포는 여러 고가의 특수 화학물질을 전구체로 사용하는 대신, 설탕 또는 식물성 오일과 같은 저렴한 재생가능한 물질을 사용한다. 화학 반응은 종종 낮은 특이성으로 어려움을 겪게 되고, 따라서, 중간 화합물의 정제와 최종 생성물의 광범위한 정제를 필요로 하지만, 효소에 의해 수행되는 생물학적 반응은 전형적으로 매우 특이적이고, 부산물의 형성이 제한되고, 이로써, 정제를 위한 유기 용매 및 다른 독성 화학물질의 사용이 감소된다. 더욱이, 페로몬 활성에 종종 중요한 특정 입체 화학은 화학적 방법으로 달성하기가 매우 어려울 수 있는 반면, 효소적 방법은 시스 또는 트랜스 이성질체 중 하나에 대해 특이적인 효소를 이용할 수 있다.
관심의 대상이 되는 특정 페로몬은 화학식 E8,E10-도데카디엔-1-올 (E8,E10-C12:OH, CAS nr. 33956-49-9)을 갖는 이-불포화 지방 알콜인 코들레몬이다. 코들레몬은 여러 종의 성 페로몬 성분이며, 레피도프테라(Lepidoptera) 목에 속하며, 사과, 배, 자두 및 다른 과일의 주요 병해충인 시디아 포모넬라(Cydia pomonella) (코들링 나방)의 주요 성 페로몬이다.
문헌 [Ding 2014]에는 데사투라제가 발현된 식물 세포가 개시되어 있고, 여기서, 나방 페로몬을 생산할 수 있는지 여부를 결정하기 위해 시험하였다. 축퇴성 PCR 접근법을 사용하여, C. 포모넬라(C. pomonella)로부터 3개의 데사투라제를 발견하였다 (문헌 [Ding et al. On the way of making plants smell like moths - a synthetic biology approach. Lund University, Faculty of Science, Department of Biology]).
따라서, 곤충 페로몬, 특히, 코들몬의 제조를 위한 생물학적 프로세스가 요구된다. 비용면에서 더 저렴하다는 이점 외에도, 발효 프로세스는 화학적 합성보다 본질적으로 덜 위험하고, 환경 친화적이다.
요약
본 발명은 청구범위에 정의된 바와 같다.
본원에서는 E8,E10-도데카디에닐 코엔자임 A 및 임의로, E8,E10-도데카디엔-1-올을 생산할 수 있는 효모 세포로서, 상기 효모 세포는 탄소 쇄 길이가 12인 지방 아실-CoA에 하나 이상의 이중 결합을 도입하여 상기 지방 아실-CoA를 탈포화된(desaturated) 지방 아실-CoA로 전환시킬 수 있는 적어도 하나의 이종성 데사투라제(heterologous desaturase)를 발현하고, 여기서, 상기 탈포화된 지방 아실-CoA의 적어도 일부는 E8,E10-도데카디에닐 코엔자임 A (E8,E10-C12:CoA)인 것인 효모 세포를 제공한다.
본원에서는 E8,E10-도데카디엔-1-올을 생산할 수 있는 효모 세포로서, 상기 효모 세포는
i) 탄소 쇄 길이가 12인 지방 아실-CoA에 하나 이상의 이중 결합을 도입하여 상기 지방 아실-CoA를 탈포화된 지방 아실-CoA로 전환시킬 수 있는 적어도 하나의 이종성 데사투라제로서, 여기서, 상기 탈포화된 지방 아실-CoA의 적어도 일부는 E8,E10-도데카디에닐 코엔자임 A (E8,E10-C12:CoA)인 것인 적어도 하나의 이종성 데사투라제; 및
ii) 상기 탈포화된 지방 아실-CoA의 적어도 일부를 탈포화된 지방 알콜로 전환시킬 수 있는 적어도 하나의 이종성 지방 아실-CoA 리덕타제 (EC 1.2.1.84)로서, 여기서, 지방 아실-CoA 리덕타제는 상기 E8,E10-도데카디에닐 코엔자임 A (E8,E10-C12:CoA)의 적어도 일부를 E8,E10-도데카디엔-1-올로 전환시킬 수 있는 것인 적어도 하나의 이종성 지방 아실-CoA 리덕타제 (EC 1.2.1.84)를 발현하는 것인 효모 세포를 제공한다.
효모 세포를 제공하는 단계, 및 배지 중에서 효모 세포를 인큐베이션(incubation)시켜 E8,E10-도데카디에닐 코엔자임 A 및 임의로, E8,E10-도데카디엔-1-올을 제조하는 단계를 포함하고, 여기서, 효모 세포는
i) 탄소 쇄 길이가 12인 지방 아실-CoA에 하나 이상의 이중 결합을 도입하여 상기 지방 아실-CoA를 탈포화된 지방 아실-CoA로 전환시킬 수 있는 적어도 하나의 이종성 데사투라제로서, 여기서, 상기 탈포화된 지방 아실-CoA의 적어도 일부는 E8,E10-도데카디에닐 코엔자임 A (E8,E10-C12:CoA)인 것인 적어도 하나의 이종성 데사투라제; 및
ii) 임의로, 상기 탈포화된 지방 아실-CoA의 적어도 일부를 탈포화된 지방 알콜로 전환시킬 수 있는 적어도 하나의 이종성 지방 아실-CoA 리덕타제 (EC 1.2.1.84)로서, 여기서, 지방 아실-CoA 리덕타제는 상기 E8,E10-도데카디에닐 코엔자임 A (E8,E10-C12:CoA)의 적어도 일부를 E8,E10-도데카디엔-1-올로 전환시킬 수 있는 것인 적어도 하나의 이종성 지방 아실-CoA 리덕타제 (EC 1.2.1.84)를 발현하는 것인,
효모 세포에서 E8,E10-도데카디에닐 코엔자임 A 및 임의로, E8,E10-도데카디엔-1-올을 제조하는 방법 또한 제공한다.
효모 세포를 변형시키기 위한 핵산 구축물로서,
상기 구축물은
i) 탄소 쇄 길이가 12인 지방 아실-CoA에 하나 이상의 이중 결합을 도입하여 상기 지방 아실-CoA를 탈포화된 지방 아실-CoA로 전환시킬 수 있는 적어도 하나의 이종성 데사투라제를 코딩하는 적어도 하나의 제1 폴리뉴클레오티드로서, 여기서, 상기 탈포화된 지방 아실-CoA의 적어도 일부는 E8,E10-도데카디에닐 코엔자임 A (E8,E10-C12:CoA)인 것인 적어도 하나의 제1 폴리뉴클레오티드; 및
ii) 임의로, 상기 탈포화된 지방 아실-CoA의 적어도 일부를 탈포화된 지방 알콜로 전환시킬 수 있는 적어도 하나의 이종성 지방 아실-CoA 리덕타제 (EC 1.2.1.84)를 코딩하는 제2 폴리뉴클레오티드로서, 여기서, 지방 아실-CoA 리덕타제는 상기 E8,E10-도데카디에닐 코엔자임 A (E8,E10-C12:CoA)의 적어도 일부를 E8,E10-도데카디엔-1-올로 전환시킬 수 있는 것인 제2 폴리뉴클레오티드를 포함하는 것인 핵산 구축물 또한 제공한다.
i) 본원에 기술된 방법에 의해 E8,E10-도데카디엔-1-올 및 임의로, E8,E10-도데카디에닐 아세테이트 및/또는 E8,E10-도데카디에날을 제조하는 단계;
ii) 상기 E8,E10-도데카디엔-1-올 및 임의로, 상기 E8,E10-도데카디에닐 아세테이트 및/또는 상기 E8,E10-도데카디에날을 페로몬 조성물로서 제제화(formulating)하는 단계; 및
iii) 상기 페로몬 조성물을 통합 병해충 관리 조성물로서 사용하는 단계를 포함하는, 병해충의 존재를 모니터링하거나, 또는 병해충의 교미를 교란시키는 방법 또한 제공한다.
본원에서는 또한 본원에 기술된 방법에 의해 수득가능한 E8,E10-도데카디에닐 코엔자임 A, E8,E10-도데카디엔-1-올, E8,E10-도데카디에닐 아세테이트 및/또는 E8,E10-도데카디에날을 제공한다.
본원에서는 또한 사용 설명서, 및
a) 본원에 기술된 효모 세포; 및/또는
b) 효모 세포를 변형시키기 위한 본원에 기술된 핵산 구축물 및 임의로, 변형시키고자 하는 효모 세포로서, 핵산 구축물 내에 포함된 폴리뉴클레오티드 발현시, 변형된 효모 세포는 E8,E10-도데카디에닐 코엔자임 A 및 임의로, E8,E10-도데카디엔-1-올을 생산할 수 있는 것인 핵산 구축물 및 임의로, 효모 세포를 포함하는 부품들의 키트를 제공한다.
도면의 간단한 설명
도 1. 효소에서의 코들레몬 생산 (E8,E10-C12:OH)를 위해 제안된 생합성 경로. ACC: 아세틸-CoA-카르복실라제; FA: 지방산; FAS; 지방산 신타제; TE: 티오에스테라제; FAA: 지방 아실-CoA 신테타제; L: 지질; FAE: 지방산 에스테르; FAD: 지방 아실 데사투라제; FAR: 지방 아실 리덕타제; Comp. β-ox.: 완전 β-산화.
도 2. (a) 공 플라스미드 또는 (b) 12:Me가 공급된 Cpo_CPRQ 함유 벡터로 형질전환된 효모로부터의 FAME 추출물의 GC-MS 분석, (c) E9-12:Me의 질량 스펙트럼; 으로 형질전환된 효모에서 FAME 추출물의 GC-MS 분석; (d) 공 플라스미드 또는 (e) E9-12:Me가 공급된 Cpo_CPRQ로 형질전환된 효모로부터의 FAME 추출물의 GC-MS 분석, (f) E8,E10-12:Me의 질량 스펙트럼.
도 1. 효소에서의 코들레몬 생산 (E8,E10-C12:OH)를 위해 제안된 생합성 경로. ACC: 아세틸-CoA-카르복실라제; FA: 지방산; FAS; 지방산 신타제; TE: 티오에스테라제; FAA: 지방 아실-CoA 신테타제; L: 지질; FAE: 지방산 에스테르; FAD: 지방 아실 데사투라제; FAR: 지방 아실 리덕타제; Comp. β-ox.: 완전 β-산화.
도 2. (a) 공 플라스미드 또는 (b) 12:Me가 공급된 Cpo_CPRQ 함유 벡터로 형질전환된 효모로부터의 FAME 추출물의 GC-MS 분석, (c) E9-12:Me의 질량 스펙트럼; 으로 형질전환된 효모에서 FAME 추출물의 GC-MS 분석; (d) 공 플라스미드 또는 (e) E9-12:Me가 공급된 Cpo_CPRQ로 형질전환된 효모로부터의 FAME 추출물의 GC-MS 분석, (f) E8,E10-12:Me의 질량 스펙트럼.
상세한 설명
정의
생물농약: 용어 '생물농약'은 '생물학적 살충제'의 줄임말이며, 포식, 기생 또는 화학적 관계를 통한 여러 유형의 병해충 관리 개입을 지칭한다. EU에서, 생물농약은 "미생물 또는 천연물에 기반한 살충제의 한 형태"로 정의되었다. 미국에서는 EPA에 의해 "병해충을 방제하는 자연적으로 발생된 물질 (생화학적 살충제), 병해충을 방제하는 미생물 (미생물 살충제) 및 유전 물질이 첨가된 식물에 의해 생산된 살충 물질 (식물 통합 보호제), 또는 PIP를 포함하는 것"으로 정의된다. 본 개시내용은 더욱 특히 천연물 또는 자연적으로 발생된 물질을 포함하는 생물농약에 관한 것이다. 이는 전형적으로 박테리아 및 다른 미생물, 진균, 선충류, 단백질 등을 비롯한, 자연적으로 발생된 유기체 및/또는 대사 산물을 성장 및 농축시킴으로써 생성된다. 이는 종종 통합 병해충 관리 (IPM) 프로그램의 중요한 성분인 것으로 간주되며, 합성 화학 식물 보호 제품 (PPP)의 대체물로서 많은 실질적인 관심을 받고 있다. 문헌 [Manual of Biocontrol Agents] (2009: 이전 [Biopesticide Manual])는 이용가능한 생물학적 살곤충제 (및 다른 생물 기반 방제) 제품에 관산 리뷰를 제공한다.
클라우드 농도(Cloud concentration): 본원에서 용어는 이보다 높은 농도일 경우, 주어진 온도에서 계면활성제, 특히, 비이온성 계면활성제, 또는 글리콜 용액의 혼합물이 상 분리를 시작하고, 2개의 상이 출현하여 클라우드화되는 용액 중 상기 계면활성제, 또는 상기 용액의 농도를 지칭하는 데 사용될 것이다. 예를 들어, 주어진 온도에서 수용액 중 계면활성제의 클라우드 농도는 수용액과 혼합될 때, 2개의 상을 생산하는 상기 계면활성제의 최소 농도이다. 클라우드 농도는 계면활성제 제조업체로부터 수득할 수 있거나, 투여량 곡선을 작성하고, 혼합물 상이 분리되는 농도를 측정함으로써 실험적으로 결정될 수 있다.
담점: 예를 들어, 수용액과 같은 용액 중 계면활성제, 특히, 비이온성 계면활성제, 또는 글리콜 용액의 담점은 상기 계면활성제 및 상기 용액의 혼합물이 상 분리를 시작하고, 2개의 상이 출현하여 클라우드화되는 온도이다. 이러한 거동은 이 거동은 폴리옥시에틸렌 쇄를 포함하는 비이온성 계면활성제의 특징으로, 이는 물에서의 가역 용해도 대 온도 거동을 나타내는 바, 온도가 상승함에 따라, 특정 지점에서 "클라우드화된다." 이러한 거동을 나타내는 글리콜은 "담점 글리콜"로 공지되어 있다. 담점은 염도의 영향을 받으며, 이는 일반적으로 염수액이 많을수록 낮아진다.
코들레몬: 용어는 화학식 E8,E10-도데카디엔-1-올 (E8,E10-C12:OH)을 갖는 이-불포화 지방 알콜을 지칭한다. 코들레몬은 레피도프테라 목에 속하고, 사과, 배, 자두 및 다른 과일의 주요 병해충인 다른 시디아 포모넬라 (코들링 나방) 중의 여러 종의 주요 성 페로몬 성분이다. 용어 "코들레몬," "E8,E10-도데카디엔-1-올" 및 "E8,E10-C12:OH"는 본원에서 상호교환적으로 사용될 것이다.
탈포화된: "탈포화된"이라는 용어는 본원에서 "불포화"라는 용어와 상호교환적으로 사용될 것이며, 이는 하나 이상의 이중 또는 삼중 탄소-탄소 결합을 함유하는 화합물을 지칭한다.
에톡실화 및 프로폭실화된 C16-C18 알콜계 소포제(antifoaming agent): 본 용어는 C16-C18 알킬 알콜 에톡실레이트 프로폭실레이트 또는 C16-C18 알콜 에톡실화된 프로폭실화된 중합체로도 명명되는, C16-C18의 에톡실화 및 프로폭실화된 알콜, 예를 들어, CAS 번호 68002-96-0을 포함하거나, 또는 그로 구성된 폴리에톡실화된, 비이온성 계면활성제 군을 지칭한다.
추출제(extrant): 본원에서 사용되는 바, 용어 "추출제"는 예컨대, 발효에서 생성된 소수성 화합물의 회수를 촉진시키는 소포제와 같은 비이온성 계면활성제, 특히, 폴리에틸렌 폴리프로필렌 글리콜, 폴레에테르 분산액의 혼합물, 폴리에틸렌 글리콜 모노스테아레이트를 포함하는 소포제, 예컨대, 시메티콘(simethicone) 및 에톡실화 및 프로폭실화된 C16-C18 알콜계 소포제 및 이의 조합으로부터 선택되는 폴리에톡실화된 계면활성제를 지칭한다.
지방산: 용어 "지방산"은 긴 지방족 쇄, 즉, 4 내지 28개의 탄소 원자, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27 또는 28개의 탄소 원자의 지방족 쇄를 갖는 카르복실산을 지칭한다. 대부분의 자연적으로 발생된 지방산은 비분지형이다. 이는 포화, 또는 탈포화일 수 있다.
지방 알콜 아세테이트: 본 용어는 본원에서 "지방 아세테이트"와 상호교환적으로 사용될 것이며, 이는 지방 탄소 쇄, 즉, 4 내지 28개의 탄소 원자, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27 또는 28개의 탄소 원자의 지방족 쇄를 갖는 아세테이트를 지칭한다. 지방 알콜 아세테이트는 포화, 또는 탈포화일 수 있다.
지방 아실-CoA: 본 용어는 본원에서 "지방 아실-CoA 에스테르"와 상호교환적으로 사용될 것이며, 이는 일반 화학식 R-CO-SCoA (여기서, R은 지방 탄소 쇄이다)의 화합물을 지칭한다. 지방 탄소 쇄는 티오에스테르 결합에 의해 코엔자임 A의 -SH 기에 연결된다. 지방 아실-CoA는 유도 기점이 되는 지방산이 포화 또는 탈포화인지 여부에 따라 포화, 또는 탈포화일 수 있다.
지방 알콜: 용어 "지방 알콜"은 본원에서 탄소 쇄 길이가 4 내지 28개의 탄소 원자, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27 또는 28개의 탄소 원자인, 지방 아실-CoA로부터 유도된 알콜을 지칭한다. 지방 알콜은 포화, 또는 탈포화일 수 있다.
지방 알데히드: 본 용어은 본원에서 탄소 쇄 길이가 4 내지 28개의 탄소 원자, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27 또는 28개의 탄소 원자인, 지방 아실-CoA로부터 유도된 알데히드를 지칭한다. 지방 알데히드는 포화, 또는 탈포화일 수 있다.
이종성: 폴리펩티드, 예컨대, 단백질 또는 효소, 또는 폴리뉴클레오티드를 언급할 때 "이종성"이라는 용어는 본원에서 야생형 세포에 자연적으로 존재하지 않는 폴리펩티드 또는 폴리뉴클레오티드를 지칭하는 것으로 해석되어야 한다. 예를 들어, 야로위아 리폴리티카(Yarrowia lipolytica)에 적용될 때, "이종성 Δ9 데사투라제"라는 용어는 야생형 Y. 리폴리티카(Y. lipolytica) 세포에 자연적으로 존재하지 않는 Δ9 데사투라제, 예컨대, 드로소필라 멜라노가스터(Drosophila melanogaster)로부터 유래된 Δ9 데사투라제를 지칭한다.
폴레에테르 분산액의 혼합물: 본 용어는 예를 들어, 시그마 알드리치(Sigma Aldrich)로부터의 유기 안티폼 204(antifoam 204) (제품 번호 A6426 및 A8311, MDL 번호 MFCD00130523)와 같은, 폴레에테르 분산액의 혼합물을 포함하거나, 또는 주로 그로 구성된 폴리에톡실화된 비이온성 계면활성제 군을 지칭한다.
천연: 폴리펩티드, 예컨대, 단백질 또는 효소, 또는 폴리뉴클레오티드를 언급할 때 "천연"라는 용어는 야생형 세포에 자연적으로 존재하는 폴리펩티드 또는 폴리뉴클레오티드를 지칭하는 것으로 해석되어야 한다. 본 용어는 "내재"라는 용어와 상호교환적으로 사용될 것이다.
병해충: 본원에서 사용되는 바, 용어 '병해충'은 특히, 농업 또는 가축 생산과 관련하여 인간 또는 인간의 관심사에 해로운 유기체, 특히, 동물을 지칭한다. 병해충은 급속히 퍼지거나, 또는 다산성이고, 유해하고, 골칫거리이며, 유독성이고, 파괴적이며, 식물 또는 동물, 인간 또는 인간의 관심사, 가축, 인간 구조, 야생 생태계 등을 괴롭히는 모든 살아있는 유기체이다. 본 용어는 종종 관련 용어인 해충, 잡초, 식물 및 동물 기생충 및 병원체와 중복된다. 유기체가 한 환경에서는 병해충이 될 수 있지만, 다른 환경에서는 유익하거나, 순화되거나, 또는 허용될 수 있다.
페로몬: 페로몬은 알콜, 알데히드 또는 아세테이트 작용기로 종료되고, 지방족 백본에 최대 3개의 이중 결합을 포함하는 비분지형 지방족 쇄 (9 내지 18개의 탄소)로 지정된 자연적으로 발생된 화합물이다. 페로몬 조성물은 예를 들어, 본원에 기술된 바와 같이 화학적으로 또는 생화학적으로 생성될 수 있다. 따라서, 페로몬은 탈포화된 지방 알콜, 지방 알데히드 또는 지방 알콜 아세테이트를 포함할 수 있고, 본원에 기술된 방법 및 세포에 의해 수득될 수 있다.
폴리에톡실화된 계면활성제: 본 용어는 본원에서 폴리에톡실화된 계면활성제, 즉, 비이온성 계면활성제를 지칭한다.
폴리에틸렌 폴리프로필렌 글리콜: 본 용어는 폴리(에틸렌 글리콜)-블록-폴리(프로필렌 글리콜)-블록-폴리(에틸렌 글리콜)로도 또한 명명되는 PEG-PPG-PEG 블록 공중합체 소포제, 예를 들어, 콜리포르(Kollliphor)® P407 (CAS 번호 9003-11-6)을 포함하거나, 또는 그로 구성된 폴리에톡실화된 비이온성 계면활성제 군을 지칭한다.
활성 감소: 본원에서 용어 "활성 감소"란, 주어진 펩티드, 예컨대, 단백질 또는 효소 활성의 전체 또는 부분적인 손실을 지칭할 수 있다. 일부 경우에, 펩티드가 결실될 수 없는 필수 유전자에 의해 인코딩(encoding)된다. 이러한 경우, 펩티드의 활성은 당업계에 공지된 방법에 의해, 예컨대, 전사 또는 번역의 하향 조절, 또는 펩티드의 억제에 의해 감소될 수 있다. 다른 경우에, 펩티드는 비필수 유전자에 의해 인코딩되고, 활성은 감소될 수 있거나, 또는 활성은 예컨대, 펩티드를 인코딩하는 유전자의 결실의 결과로서 완전히 손실될 수 있다. 효소의 활성 감소는 또한 당업계에 공지된 바와 같이, 예를 들어, 억제성 프로모터를 사용하여, 상기 효소를 인코딩하는 유전자의 전사를 억제시킴으로써, 활성을 억제시킴으로써, 또는 번역 수준에서 침묵화시킴으로써 달성될 수 있다.
포화된: "포화된"이라는 용어는 이중 또는 삼중 탄소-탄소 결합이 없는 화합물을 지칭한다.
시메티콘: 본 용어는 시메티콘(simeticone) (CAS 번호 8050-81-5), 디메틸 폴리실록산, 또는 활성화된 폴리메틸실록산으로도 또한 명명되는, 시메티콘을 포함하거나, 또는 그로 구성된 폴리에톡실화된 비이온성 계면활성제 군을 지칭한다. 시메티콘은 또한 1.2-1.6% 폴리에틸렌 글리콜 모노스테아레이트를 함유하는 실리콘 기반 에멀젼이다.
계면활성제: 본 용어는 두 액체 사이, 기체와 액체 사이, 또는 액체와 고체 사이의 표면 장력 (또는 계면 장력)을 낮추는 화합물을 지칭한다. 계면활성제는 세제, 습윤화제, 유화제, 소포제 및 분산제로 작용할 수 있다. 계면활성제는 일반적으로 양친매성인 유기 화합물이며, 이는 계면활성제가 소수성 기 (이의 테일)와 친수성 기 (이의 헤드), 둘 모두를 함유한다는 것을 의미한다. 따라서, 계면활성제는 전형적으로 수불용성 (또는 유용성) 성분 및 수용성 성분, 둘 모두를 포함한다. 가장 일반적으로, 계면활성제는 극성 헤드 기에 따라 분류된다. 비이온성 계면활성제에는 이의 헤드에 하전된 기가 없다.
역가: 본원에서 화합물의 역가란, 제조된 화합물의 농도를 지칭한다. 화합물이 세포에 의해 생산될 때, 본 용어는 세포에 의해 생산되는 총 농도, 즉, 화합물의 총량을 배양 배지의 부피로 나눈 것을 의미한다. 이는 특히 휘발성 화합물인 경우, 역가는 배양 배지로부터 증발했을 수 있는 화합물의 일부를 포함한다는 것을 의미하며, 따라서, 발효 브로쓰(fermentation broth)로부터 및 발효기로부터의 잠재적인 오프-가스로부터 생성된 화합물을 수집함으로써 결정된다.
코들레몬
(
E8,E10
-
C12:OH
)
코들레몬의 생합성은 말로닐-CoA로 카르복실화되는 아세틸-코엔자임 A (CoA)를 기반으로 하며; 상기 반응은 아세틸-CoA-카르복실라제 (ACC)에 의해 촉매화된다. 말로닐-CoA 및 아세틸-CoA는 쇄 길이가 최대 C16/C18인 지방 아실-CoA를 합성하는 데 지방산 신타제 (FAS)에 의해 사용되는 전구체이다. C. 포모넬라 퍼옥시좀 옥시다제 (POX)는 C14:CoA를 통해 C12:CoA (라우릴-CoA)로 C16:CoA의 쇄 단축 (-2C)을 촉매화한다고 가정하였다 (문헌 [Ding, 2014]). C. 포모넬라에서 C12:CoA를 E9-C12:CoA로 전환시키는 데사투라제에 대한 증거는 초기에 발견되었지만, 상기 데사투라제를 인코딩하는 유전자는 추가 데사투라제를 코딩하는 2개의 추가 유전자와 함께 최근에야 확인되었다 (Cpo_SPTQ/Cpo_NPVE/Cpo_CPRQ). 제1 불포화 단계에서는 C12:CoA가 E/Z9-C12:CoA로 전환되고, 제2 불포화 단계에서는 E8,E10-C12:CoA (E8,E10-도데카디에닐 코엔자임 A)로 전환된다. 이어서, 지방 아실 리덕타제 (FAR)는 가정컨대, 디엔 E8,E10-C12:CoA를 환원시켜 최종적으로 코들레몬 (E8,E10-C12:OH)을 형성한다. C. 포모넬라에서 FAR을 인코딩하는 유전자는 지금까지 확인되지 않았다 (문헌 [Ding 2014, Lofstedt et al., 1988]).
코들레몬 생합성에 대해 제안된 경로는 도 1에 제시되어 있다.
코들레몬
생산
본 개시내용은 E8,E10-도데카디에닐 코엔자임 A 및 임의로, 코들레몬 (E8,E10-C12:OH 또는 E8,E10-도데카디엔-1-올)을 생산할 수 있는 효모 세포, 및 효모 세포에서 코들레몬 (E8,E10-C12:OH 또는 E8,E10-도데카디엔-1-올)을 제조하는 방법에 관한 것이다.
본 발명자들은 효모에서 E8,E10-도데카디에닐 코엔자임 A 및 임의로, E8,E10-도데카디엔-1-올의 제조를 위한 이종성 경로 (예로서, 도 1에 개략적으로 제시)를 디자인하였다.
따라서, 본원에서는
효모 세포를 제공하는 단계, 및 배지 중에서 효모 세포를 인큐베이션시켜 E8,E10-도데카디에닐 코엔자임 A 및 임의로, E8,E10-도데카디엔-1-올을 제조하는 단계를 포함하고, 여기서, 효모 세포는
i) 탄소 쇄 길이가 12인 지방 아실-CoA에 하나 이상의 이중 결합을 도입하여 상기 지방 아실-CoA의 적어도 일부를 E8,E10-도데카디에닐 코엔자임 A (E8,E10-C12:CoA)로 전환시킬 수 있는 적어도 하나의 이종성 데사투라제; 및
ii) 임의로, 상기 E8,E10-도데카디에닐 코엔자임 A (E8,E10-C12:CoA)의 적어도 일부를 E8,E10-도데카디엔-1-올로 전환시킬 수 있는 적어도 하나의 이종성 지방 아실-CoA 리덕타제 (EC 1.2.1.84)를 발현하는 것인, 효모 세포에서 E8,E10-도데카디에닐 코엔자임 A 및 임의로, E8,E10-도데카디엔-1-올을 제조하는 방법 또한 제공한다.
따라서, 본 효모 세포 및 방법은 생체내에서 효모 세포에서 리덕타제를 발현함으로써 E8,E10-도데카디엔-1-올로 전환될 수 있는 본원에 기술된 바와 같은 E8,E10-도데카디에닐 코엔자임 A를 제조함으로써 코들레몬을 제조하는 데 사용될 수 있거나, 또는 E8,E10-도데카디에닐 코엔자임 A는 지질, 예컨대, 트리아실글리세리드로, 또는 유리 지방산으로 전환될 수 있고, 이는 이어서, 회수되고, 시험관내에서 당업계에 공지된 바와 같이, 예컨대, 리덕타제와 접촉시킴으로써 E8,E10-도데카디엔-1-올로 전환될 수 있다. 상기 두 경우 모두, E8,E10-도데카디엔-1-올이 생성된다.
효모 세포
본 방법의 제1 단계에서, 더 긴 장쇄의 아실-CoA의 생합성을 위해 아세틸-CoA 및 말로닐-CoA를 사용할 수 있는 효모 세포를 제공한다. 아실-CoA를 합성할 수 있는 임의의 효모 세포가 본원에 기술된 바와 같은 E8,E10-도데카디에닐 코엔자임 A 및 임의로, E8,E10-도데카디엔-1-올을 제조하는 데 사용될 수 있다. 대안적으로, 효모 세포는 당업계에 공지된 바와 같은 적합한 탄소원과 함께 제공될 수 있다. 효모 세포는 비-자연적으로 발생된 효모 세포, 예를 들어, 본원에 기술된 바와 같은, E8,E10-도데카디에닐 코엔자임 A 및 임의로, E8,E10-도데카디엔-1-올, E8,E10-도데카디에닐 아세테이트 및/또는 E8,E10-도데카디에날을 생산하도록 조작된 효모 세포일 수 있다.
아세틸-CoA 및 말로닐-CoA는 아실-CoA, 특히, 탄소 쇄 길이가 12인 아실-CoA로 전환될 수 있다. 이는 예를 들어, 천연 또는 이종성 아실-CoA 티오에스테라제 (EC 3.1.2.20)의 작용에 의해 도데카노일-CoA를 도데칸산 (라우르산)으로 전환시키는 단계를 포함할 수 있다. 이어서, 라우르산은 천연 또는 이종성 지방 아실-코엔자임 A 신테타제 (FAA) (EC 6.2.1.3)의 작용에 의해 도데카노일-CoA로 전환될 수 있다.
따라서, 효모 세포는 또한 아세틸-CoA 및 말로닐-CoA를 지방 아실-CoA, 특히, 탄소 쇄 길이가 12인 지방 아실-CoA로 전환시킬 수 있다. 일부 실시양태에서, 따라서, 효모 세포는 상기 반응을 수행할 수 있는 하나 이상의 지방 아실-코엔자임 신테타제 (EC 6.2.1.3) 및/또는 하나 이상의 아실-CoA 티오에스테라제 (EC 3.1.2.20)를 발현한다.
일부 실시양태에서, 효모 세포는 배양 배지에 라우르산 또는 메틸 라우레이트 또는 트리라우로일글리세롤 또는 또 다른 지방산 유도체와 함께 제공된다. 효모 세포가 하기 기술되는 바와 같은 β-산화를 통해 탄소 쇄를 단축시킬 수 있도록조작된 경우, 세포는 탄소 쇄 길이가 12보다 긴 오일 또는 지방 또는 임의의 지방산 유도체와 함께 제공될 수 있다.
일부 실시양태에서, 세포는 예컨대, 게놈에서의 유전자 편집에 의해 게놈 수준에서 변형될 수 있다. 세포는 또한 적어도 하나의 핵산 구축물, 예컨대, 적어도 하나의 벡터의 삽입에 의해 변형될 수 있다. 벡터는 당업자에게 공지된 바와 같이, 게놈에서 핵산 서열의 통합이 가능하도록, 또는 게놈 통합 없이, 벡터에 포함된 핵산 서열에 의해 코딩된 폴리펩티드의 발현이 가능하도록 디자인될 수 있다.
본 개시내용의 일부 실시양태에서, 블라케슬레아(Blakeslea), 칸디다(Candida), 크립토코쿠스(Cryptococcus), 쿤닝하멜라(Cunninghamella), 리포마이세스(Lipomyces), 모르티에렐라(Mortierella), 무코르(Mucor), 피코마이세스(Phycomyces), 피시움(Pythium), 로도스포리디움(Rhodosporidium), 로도토룰라(Rhodotorula), 트리코스포론(Trichosporon), 사카로마이세스(Saccharomyces) 및 야로위아를 포함하는, 하지만 이에 제한되지 않는, 속의 효소 또는 진균이 사용된다. 특정의 특별한 실시양태에서, 블라케슬레아 트리스포라(Blakeslea trispora), 칸디다 풀케리마(Candida pulcherrima), C. 레브카우피(C. revkaufi), C. 트로피칼리스(C. tropicalis), 크립토코쿠스 쿠르바투스(Cryptococcus curvatus), 쿤닝하멜라 에키눌라타(Cunninghamella echinulata), C. 엘레간스(C. elegans), C. 자포니카(C. japonica), 리포마이세스 스타키(Lipomyces starkeyi), L. 리포페루스(L. lipoferus), 모르티에렐라 알피나(Mortierella alpina), M. 이사벨리나(M. isabellina), M. 라만니아나(M. ramanniana), M. 비나세아(M. vinacea), 무코르 키르키넬로이데스(Mucor circinelloides), 피코마이세스 블라케스레아누스(Phycomyces blakesleanus), 피시움 이레굴라레(Pythium irregulare), 로도스포리디움 토룰로이데스(Rhodosporidium toruloides), 로도토룰라 글루티니스(Rhodotorula glutinis), R. 그라실리스(R. gracilis), R. 그라미니스(R. graminis), R. 무실라기노사(R. mucilaginosa), R. 피니콜라(R. pinicola), 트리코스포론 풀란스(Trichosporon pullans), T. 쿠타네움(T. cutaneum), 사카로마이세스 세레비지아에(Saccharomyces cerevisiae) 및 야로위아 리폴리티카를 포함하나, 이에 제한되지 않는 종의 유기체가 사용된다. 일부 실시양태에서, 효모 세포는 야로위아 리폴리티카 세포 또는 사카로마이세스 세레비지아에 세포이다.
숙주 세포로도 또한 지칭될 수 있는, 변형시키고자 하는 효모 세포는 수득할 수 있는 E8,E10-도데카디엔-1-올의 역가에 부정적인 영향을 줄 수 있는 천연 효소를 발현할 수 있고; 따라서, 천연 효소는 당업계에 공지된 방법, 예컨대, 유전자 편집에 의해 불활성화될 수 있다. 예를 들어, 역가에 부정적인 영향을 미치는 천연 효소를 코딩하는 유전자는 본원 하기에서 기술되는 바와 같이, 천연 효소의 활성의 전체 또는 부분적인 손실을 유도하기 위해 결실되거나, 또는 돌연변이화될 수 있다.
데사투라제
본 방법은 탄소 쇄 길이가 12인 지방 아실-CoA를 E8,E10-도데카디에닐 코엔자임 A 및 임의로, E8,E10-도데카디엔-1-올로 전환시키는 데 필요한 효소를 발현하는 효모 세포에 의존한다. 상기를 위해 필요한 제1 효소는 탄소 쇄 길이가 12인 상기 지방 아실-CoA에 하나 이상의 이중 결합을 도입하여 상기 지방 아실-CoA를 탄소 쇄 길이가 12이고, 하나 이상의 이중 결합을 갖는 탈포화된 지방 아실-CoA로 전환시킬 수 있는 데사투라제이다. 탄소 쇄 길이가 12인 탈포화된 지방 아실-CoA는 탄소 쇄 길이가 12인 탈포화된 지방 아실-CoA의 혼합물일 수 있고; 상기 혼합물은 E8,E10-C12:CoA를 포함하지만, 이는 전형적으로는 또한 단일불포화 지방 아실-CoA E9-C12:CoA 및 Z9-C12:CoA도 포함한다. 따라서, 일부 실시양태에서, 효모 세포는 탄소 쇄 길이가 12인 지방 아실-CoA에 하나 이상의 이중 결합을 도입하여 상기 지방 아실-CoA의 적어도 일부를 E8,E10-C12:CoA (E8,E10-도데카디에닐 코엔자임 A)로 전환시킬 수 있는 데사투라제를 발현한다. EC 부류 EC 1.14.19의 데사투라제는 상기 반응을 수행할 수 있다.
코들레몬의 제조는 2개의 탈포화 단계에 의존한다. 이는 본원 하기에 기술된 바와 같은 한 데사투라제, 예를 들어, Cpo_CPRQ 또는 Gmo_CPRQ, 돌연변이체(mutant) 및 이의 기능성 변이체(functional variant)에 의해, 또는 2개의 상이한 데사투라제에 의해 수행될 수 있다. 2개의 상이한 데사투라제가 사용되는 실시양태에서, 데사투라제 중 적어도 하나는 본원 하기에 기술된 바와 같은 Cpo_CPRQ, 이의 돌연변이체 또는 이의 기능성 변이체이다. 2개의 상이한 데사투라제가 사용되는 다른 실시양태에서, 데사투라제 중 적어도 하나는 본원 하기에 기술된 바와 같은 Gmo_CPRQ, 이의 돌연변이체 또는 이의 기능성 변이체이다. 다른 데사투라제는 탄소 쇄 길이가 12인 지방 아실-CoA에 적어도 하나의 이중 결합을 도입할 수 있거나, 또는 이는 이어서, 탄소 쇄 길이가 14인 지방 아실-CoA에 적어도 하나의 이중 결합을 도입할 수 있고, 이는 하기 "쇄 단축" 섹션에 상세하게 설명되어 있는 바와 같이 탄소 쇄 길이가 12인 탈포화된 지방 아실-CoA로 단축될 수 있다. 이어서, 탄소 쇄 길이가 12 또는 14이고, 한 이중 결합을 갖는 지방 아실-CoA는 예컨대, Cpo_CPRQ, 이의 돌연변이체 또는 기능성 변이체에 의해 추가로 탈포화될 수 있다.
데사투라제는 바람직하게 이종성 데사투라제이다. 일부 실시양태에서, 데사투라제는, C. 포모넬라에서 자연적으로 발견된 데사투라제인 Cpo_CPRQ (서열 번호: 2)이다. 실시예 16에서 입증되는 바와 같이, Cpo_CPRQ 단독 발현은 E8,E10-C12:CoA를 제조하는 데 충분하다. Cpo_SPTQ이든, 또는 Cpo_NPVE이든, 이의 단독 발현은 E8,E10-C12:CoA를 생성하지 못했다. 상기 관찰결과는 문헌 [Ding 2014]에 비추어 보면 놀라운 것이며, 여기서, 상기 3개의 데사투라제에 대한 기능적 검정법 결과, C. 포모넬라 페로몬에서 연속적으로 접합된 이중 결합을 형성하는 작용을 하는 것으로 나타났으며 - 이는 효소에서의 경우는 아닌 것으로 보인다.
이종성 데사투라제는 또한 이종성 데사투라제, 예컨대, Cpo_CPRQ의 기능성 변이체, 즉, 탄소 쇄 길이가 12인 지방 아실-CoA를 탄소 쇄 길이가 12인 탈포화된 지방 아실-CoA, 예컨대, E8,E10-C12:CoA로 전환시킬 수 있는 능력을 보유하는 변이체일 수 있다. 일부 실시양태에서, 기능성 변이체는 Cpo_CPRQ (서열 번호: 2)와 적어도 60%의 상동성 또는 동일성(identity), 예컨대, 적어도 61%의 상동성 또는 동일성, 예컨대, 적어도 62%의 상동성 또는 동일성, 예컨대, 적어도 63%의 상동성 또는 동일성, 예컨대, 적어도 64%의 상동성 또는 동일성, 예컨대, 적어도 65%의 상동성 또는 동일성, 예컨대, 적어도 66%의 상동성 또는 동일성, 예컨대, 적어도 67%의 상동성 또는 동일성, 예컨대, 적어도 68%의 상동성 또는 동일성, 예컨대, 적어도 69%의 상동성 또는 동일성, 예컨대, 적어도 70%의 상동성 또는 동일성, 예컨대, 적어도 71%의 상동성 또는 동일성, 예컨대, 적어도 72%, 예컨대, 적어도 73%, 예컨대, 적어도 74%, 예컨대, 적어도 75%, 예컨대, 적어도 76%, 예컨대, 적어도 77%, 예컨대, 적어도 78%, 예컨대, 적어도 79%, 예컨대, 적어도 80%, 예컨대, 적어도 81%, 예컨대, 적어도 82%, 예컨대, 적어도 83%, 예컨대, 적어도 84%, 예컨대, 적어도 85%, 예컨대, 적어도 86%, 예컨대, 적어도 87%, 예컨대, 적어도 88%, 예컨대, 적어도 89%, 예컨대, 적어도 90%, 예컨대, 적어도 91%, 예컨대, 적어도 92%, 예컨대, 적어도 93%, 예컨대, 적어도 94%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%의 상동성 또는 동일성을 갖는다.
이종성 데사투라제는 또한 이종성 데사투라제, 예컨대, Cpo_CPRQ의 기능성 변이체, 즉, 탄소 쇄 길이가 12인 지방 아실-CoA를 탄소 쇄 길이가 12인 탈포화된 지방 아실-CoA, 예컨대, E8,E10-C12:CoA로 전환시킬 수 있는 능력을 보유하는 변이체일 수 있다. 일부 실시양태에서, 기능성 변이체는 Cpo_CPRQ (서열 번호: 2)와 적어도 60%의 상동성 또는 동일성, 예컨대, 적어도 61%의 상동성 또는 동일성, 예컨대, 적어도 62%의 상동성 또는 동일성, 예컨대, 적어도 63%의 상동성 또는 동일성, 예컨대, 적어도 64%의 상동성 또는 동일성, 예컨대, 적어도 65%의 상동성 또는 동일성, 예컨대, 적어도 66%의 상동성 또는 동일성, 예컨대, 적어도 67%의 상동성 또는 동일성, 예컨대, 적어도 68%의 상동성 또는 동일성, 예컨대, 적어도 69%의 상동성 또는 동일성, 예컨대, 적어도 70%의 상동성 또는 동일성, 예컨대, 적어도 71%의 상동성 또는 동일성, 예컨대, 적어도 72%, 예컨대, 적어도 73%, 예컨대, 적어도 74%, 예컨대, 적어도 75%, 예컨대, 적어도 76%, 예컨대, 적어도 77%, 예컨대, 적어도 78%, 예컨대, 적어도 79%, 예컨대, 적어도 80%, 예컨대, 적어도 81%, 예컨대, 적어도 82%, 예컨대, 적어도 83%, 예컨대, 적어도 84%, 예컨대, 적어도 85%, 예컨대, 적어도 86%, 예컨대, 적어도 87%, 예컨대, 적어도 88%, 예컨대, 적어도 89%, 예컨대, 적어도 90%, 예컨대, 적어도 91%, 예컨대, 적어도 92%, 예컨대, 적어도 93%, 예컨대, 적어도 94%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%의 상동성 또는 동일성을 갖는다.
데사투라제는 바람직하게 이종성 데사투라제이다. 일부 실시양태에서, 데사투라제는 그라폴리타 몰레스타(Grapholita molesta)에서 자연적으로 발견된 데사투라제인 Gmo_CPRQ (서열 번호: 77), 또는 탄소 쇄 길이가 12인 지방 아실-CoA를 탄소 쇄 길이가 12인 탈포화된 지방 아실-CoA, 예컨대, E8,E10-C12:CoA로 전환시킬 수 있는 능력을 보유하는, 이의 기능성 변이체이다. 일부 실시양태에서, 기능성 변이체는 Gmo_CPRQ (서열 번호: 78)와 적어도 60%의 상동성 또는 동일성, 예컨대, 적어도 61%의 상동성 또는 동일성, 예컨대, 적어도 62%의 상동성 또는 동일성, 예컨대, 적어도 63%의 상동성 또는 동일성, 예컨대, 적어도 64%의 상동성 또는 동일성, 예컨대, 적어도 65%의 상동성 또는 동일성, 예컨대, 적어도 66%의 상동성 또는 동일성, 예컨대, 적어도 67%의 상동성 또는 동일성, 예컨대, 적어도 68%의 상동성 또는 동일성, 예컨대, 적어도 69%의 상동성 또는 동일성, 예컨대, 적어도 70%의 상동성 또는 동일성, 예컨대, 적어도 71%의 상동성 또는 동일성, 예컨대, 적어도 72%, 예컨대, 적어도 73%, 예컨대, 적어도 74%, 예컨대, 적어도 75%, 예컨대, 적어도 76%, 예컨대, 적어도 77%, 예컨대, 적어도 78%, 예컨대, 적어도 79%, 예컨대, 적어도 80%, 예컨대, 적어도 81%, 예컨대, 적어도 82%, 예컨대, 적어도 83%, 예컨대, 적어도 84%, 예컨대, 적어도 85%, 예컨대, 적어도 86%, 예컨대, 적어도 87%, 예컨대, 적어도 88%, 예컨대, 적어도 89%, 예컨대, 적어도 90%, 예컨대, 적어도 91%, 예컨대, 적어도 92%, 예컨대, 적어도 93%, 예컨대, 적어도 94%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%의 상동성 또는 동일성을 갖는다.
일부 실시양태에서, 데사투라제는 당업계에 공지된 바와 같이, 상기 데사투라제를 코딩하는 핵산을 도입함으로써 발현된다. 이러한 핵산은 당업계에 공지된 바와 같이 코돈 최적화될 수 있다. 특정 실시양태에서, 데사투라제를 코딩하는 핵산은 서열 번호: 1에 기재되어 있는 바와 같거나, 또는 이와 적어도 60%의 상동성 또는 동일성, 예컨대, 서열 번호: 1과 적어도 61%의 상동성 또는 동일성, 예컨대, 적어도 62%의 상동성 또는 동일성, 예컨대, 적어도 63%의 상동성 또는 동일성, 예컨대, 적어도 64%의 상동성 또는 동일성, 예컨대, 적어도 65%의 상동성 또는 동일성, 예컨대, 적어도 66%의 상동성 또는 동일성, 예컨대, 적어도 67%의 상동성 또는 동일성, 예컨대, 적어도 68%의 상동성 또는 동일성, 예컨대, 적어도 69%의 상동성 또는 동일성, 예컨대, 적어도 70%의 상동성 또는 동일성, 예컨대, 적어도 71%의 상동성 또는 동일성, 예컨대, 적어도 72%, 예컨대, 적어도 73%, 예컨대, 적어도 74%, 예컨대, 적어도 75%, 예컨대, 적어도 76%, 예컨대, 적어도 77%, 예컨대, 적어도 78%, 예컨대, 적어도 79%, 예컨대, 적어도 80%, 예컨대, 적어도 81%, 예컨대, 적어도 82%, 예컨대, 적어도 83%, 예컨대, 적어도 84%, 예컨대, 적어도 85%, 예컨대, 적어도 86%, 예컨대, 적어도 87%, 예컨대, 적어도 88%, 예컨대, 적어도 89%, 예컨대, 적어도 90%, 예컨대, 적어도 91%, 예컨대, 적어도 92%, 예컨대, 적어도 93%, 예컨대, 적어도 94%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%의 상동성 또는 동일성을 갖는, 이의 동족체(homologue)이다. 다른 실시양태에서, 데사투라제를 코딩하는 핵산은 서열 번호: 78에 기재되어 있는 바와 같거나, 또는 이와 적어도 60%의 상동성 또는 동일성, 예컨대, 서열 번호: 78과 적어도 61%의 상동성 또는 동일성, 예컨대, 적어도 62%의 상동성 또는 동일성, 예컨대, 적어도 63%의 상동성 또는 동일성, 예컨대, 적어도 64%의 상동성 또는 동일성, 예컨대, 적어도 65%의 상동성 또는 동일성, 예컨대, 적어도 66%의 상동성 또는 동일성, 예컨대, 적어도 67%의 상동성 또는 동일성, 예컨대, 적어도 68%의 상동성 또는 동일성, 예컨대, 적어도 69%의 상동성 또는 동일성, 예컨대, 적어도 70%의 상동성 또는 동일성, 예컨대, 적어도 71%의 상동성 또는 동일성, 예컨대, 적어도 72%, 예컨대, 적어도 73%, 예컨대, 적어도 74%, 예컨대, 적어도 75%, 예컨대, 적어도 76%, 예컨대, 적어도 77%, 예컨대, 적어도 78%, 예컨대, 적어도 79%, 예컨대, 적어도 80%, 예컨대, 적어도 81%, 예컨대, 적어도 82%, 예컨대, 적어도 83%, 예컨대, 적어도 84%, 예컨대, 적어도 85%, 예컨대, 적어도 86%, 예컨대, 적어도 87%, 예컨대, 적어도 88%, 예컨대, 적어도 89%, 예컨대, 적어도 90%, 예컨대, 적어도 91%, 예컨대, 적어도 92%, 예컨대, 적어도 93%, 예컨대, 적어도 94%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%의 상동성 또는 동일성을 갖는, 이의 동족체이다.
일부 실시양태에서, 효모 세포는 탄소 쇄 길이가 12인 지방 아실-CoA에 하나 이상의 이중 결합을 도입할 수 있는 수개의 데사투라제를 발현한다. 상기 실시양태에서, 바람직하게, 수개의 데사투라제 중 적어도 하나는 하기 상세하게 설명되는 바와 같은, Cpo_CPRQ, 이의 돌연변이체 또는 이의 기능성 변이체이다. 다른 실시양태에서, 바람직하게, 수개의 데사투라제 중 적어도 하나는 Gmo_CPRQ, 이의 돌연변이체 또는 이의 기능성 변이체이다. 다른 데사투라제는 예를 들어, Cpo_NPVE (수탁 번호: AHW98355, 서열 번호: 67), 또는 Cpo_SPTQ (수탁 번호: AHW98356, 서열 번호: 69), 또는 이와 적어도 65%의 상동성 또는 동일성, 예컨대, 적어도 70%의 상동성 또는 동일성, 예컨대, 적어도 71%의 상동성 또는 동일성, 예컨대, 적어도 72%, 예컨대, 적어도 73%, 예컨대, 적어도 74%, 예컨대, 적어도 75%, 예컨대, 적어도 80%, 예컨대, 적어도 81%, 예컨대, 적어도 82%, 예컨대, 적어도 83%, 예컨대, 적어도 84%, 예컨대, 적어도 85%, 예컨대, 적어도 86%, 예컨대, 적어도 87%, 예컨대, 적어도 88%, 예컨대, 적어도 89%, 예컨대, 적어도 90%, 예컨대, 적어도 91%, 예컨대, 적어도 92%, 예컨대, 적어도 93%, 예컨대, 적어도 94%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%의 상동성 또는 동일성을 갖는, 이의 기능성 변이체일 수 있다. 상기 데사투라제는 효모 세포에 코돈 최적화될 수 있는 핵산, 예를 들어, 서열 번호: 66 또는 서열 번호: 68에 기재되어 있는 바와 같은 핵산, 또는 이와 적어도 65%의 상동성 또는 동일성, 예컨대, 적어도 70%의 상동성 또는 동일성, 예컨대, 적어도 71%의 상동성 또는 동일성, 예컨대, 적어도 72%, 예컨대, 적어도 73%, 예컨대, 적어도 74%, 예컨대, 적어도 75%, 예컨대, 적어도 80%, 예컨대, 적어도 81%, 예컨대, 적어도 82%, 예컨대, 적어도 83%, 예컨대, 적어도 84%, 예컨대, 적어도 85%, 예컨대, 적어도 86%, 예컨대, 적어도 87%, 예컨대, 적어도 88%, 예컨대, 적어도 89%, 예컨대, 적어도 90%, 예컨대, 적어도 91%, 예컨대, 적어도 92%, 예컨대, 적어도 93%, 예컨대, 적어도 94%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%의 상동성 또는 동일성을 갖는, 이의 동족체의 도입 후, 효모 세포에서 발현될 수 있다.
효모 세포는 수개의 이종성 데사투라제 카피를 발현하도록 조작될 수 있다. 이는 당업계에 공지된 바와 같이 수행될 수 있다. 데사투라제 또는 데사투라제들은 또한 당업계에 공지된 바와 같이, 예를 들어, 강력한 발현 수준을 유도하는 구성적 프로모터 (상기 프로모터는 당업계에 공지되어 있어 있다)의 사용에 의해 높은 수준으로 발현될 수 있다.
일부 실시양태에서, 데사투라제는 돌연변이체 Cpo_CPRQ, 예컨대, 85번 위치에 돌연변이를 갖는 Cpo_CPRQ 돌연변이체이다. 일부 실시양태에서, 돌연변이는 S85A 돌연변이이다. 데사투라제는 또한 상기 돌연변이체의 기능성 변이체일 수 있고, 85번 위치에 돌연변이를 갖는 돌연변이체 Cpo_CPRQ, 예컨대, S85A 돌연변이체와 적어도 65%의 상동성 또는 동일성, 예컨대, 적어도 70%의 상동성 또는 동일성, 예컨대, 적어도 71%의 상동성 또는 동일성, 예컨대, 적어도 72%, 예컨대, 적어도 73%, 예컨대, 적어도 74%, 예컨대, 적어도 75%, 예컨대, 적어도 80%, 예컨대, 적어도 81%, 예컨대, 적어도 82%, 예컨대, 적어도 83%, 예컨대, 적어도 84%, 예컨대, 적어도 85%, 예컨대, 적어도 86%, 예컨대, 적어도 87%, 예컨대, 적어도 88%, 예컨대, 적어도 89%, 예컨대, 적어도 90%, 예컨대, 적어도 91%, 예컨대, 적어도 92%, 예컨대, 적어도 93%, 예컨대, 적어도 94%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%의 상동성 또는 동일성을 갖는다. 일부 실시양태에서, 돌연변이체는 S85T 돌연변이체이다.
일부 실시양태에서, 데사투라제는 돌연변이체 Cpo_CPRQ, 예컨대, 82번 위치에 돌연변이를 갖는 Cpo_CPRQ 돌연변이체이다. 일부 실시양태에서, 돌연변이는 S82A 돌연변이이다. 데사투라제는 또한 상기 돌연변이체의 기능성 변이체일 수 있고, 82번 위치에 돌연변이를 갖는 돌연변이체 Cpo_CPRQ, 예컨대, S82A 돌연변이체와 적어도 65%의 상동성 또는 동일성, 예컨대, 적어도 70%의 상동성 또는 동일성, 예컨대, 적어도 71%의 상동성 또는 동일성, 예컨대, 적어도 72%, 예컨대, 적어도 73%, 예컨대, 적어도 74%, 예컨대, 적어도 75%, 예컨대, 적어도 80%, 예컨대, 적어도 81%, 예컨대, 적어도 82%, 예컨대, 적어도 83%, 예컨대, 적어도 84%, 예컨대, 적어도 85%, 예컨대, 적어도 86%, 예컨대, 적어도 87%, 예컨대, 적어도 88%, 예컨대, 적어도 89%, 예컨대, 적어도 90%, 예컨대, 적어도 91%, 예컨대, 적어도 92%, 예컨대, 적어도 93%, 예컨대, 적어도 94%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%의 상동성 또는 동일성을 갖는다.
일부 실시양태에서, 효모 세포는 2개 이상의 이종성 데사투라제를 발현한다. 상기 2개 이상의 데사투라제는 동일하거나, 또는 상이할 수 있다. 특정 실시양태에서, 효모 세포는 서열 번호: 2에 기재된 바와 같은 Cpo_CPRQ, 및 예컨대, 85번 위치에 돌연변이를 갖는 돌연변이체 Cpo_CPRQ, 예컨대, S85A 돌연변이체를 발현한다. 일부 실시양태에서, 효모 세포는 Cpo_CPRQ (서열 번호: 2), 돌연변이체 Cpo_CPRQ 또는 이와 적어도 65%의 상동성 또는 동일성을 갖는, 이의 기능성 변이체를 발현하고, 이는 또한 탄소 쇄 길이가 12인 지방 아실-CoA에 적어도 하나의 이중 결합을 도입할 수 있는 또 다른 데사투라제를 발현한다. 일부 실시양태에서, 효모 세포는 서열 번호: 77에 기재된 바와 같은 Gmo_CPRQ 및 서열 번호: 2에 기재된 바와 같은 Cpo_CPRQ 또는 본원에 기술된 바와 같은, 이의 돌연변이체 또는 기능성 변이체를 발현한다.
일부 실시양태에서, 다른 데사투라제는 서열 번호: 67에 기재된 바와 같은 Cpo_NPVE, 이의 돌연변이체 또는 이와 적어도 65%의 상동성 또는 동일성, 예컨대, 이와 적어도 70%의 상동성 또는 동일성, 예컨대, 적어도 71%의 상동성 또는 동일성, 예컨대, 적어도 72%, 예컨대, 적어도 73%, 예컨대, 적어도 74%, 예컨대, 적어도 75%, 예컨대, 적어도 80%, 예컨대, 적어도 81%, 예컨대, 적어도 82%, 예컨대, 적어도 83%, 예컨대, 적어도 84%, 예컨대, 적어도 85%, 예컨대, 적어도 86%, 예컨대, 적어도 87%, 예컨대, 적어도 88%, 예컨대, 적어도 89%, 예컨대, 적어도 90%, 예컨대, 적어도 91%, 예컨대, 적어도 92%, 예컨대, 적어도 93%, 예컨대, 적어도 94%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%의 상동성 또는 동일성을 갖는, 이의 기능성 변이체이다. 일부 실시양태에서, 효모 세포는 Cpo_CPRQ, 이의 돌연변이체 또는 기능성 변이체, 및 Cpo_NPVE, 이의 돌연변이체 또는 기능성 변이체를 발현한다. 일부 실시양태에서, 효모 세포는 Gmo_CPRQ, 이의 돌연변이체 또는 기능성 변이체, 및 Cpo_NPVE 또는 이의 돌연변이체 또는 기능성 변이체를 발현한다.
다른 실시양태에서, 다른 데사투라제는 서열 번호: 69에 기재된 바와 같은 Cpo_SPTQ, 이의 돌연변이체, 또는 이와 적어도 65%의 상동성 또는 동일성, 예컨대, 이와 적어도 70%의 상동성 또는 동일성, 예컨대, 적어도 71%의 상동성 또는 동일성, 예컨대, 적어도 72%, 예컨대, 적어도 73%, 예컨대, 적어도 74%, 예컨대, 적어도 75%, 예컨대, 적어도 80%, 예컨대, 적어도 81%, 예컨대, 적어도 82%, 예컨대, 적어도 83%, 예컨대, 적어도 84%, 예컨대, 적어도 85%, 예컨대, 적어도 86%, 예컨대, 적어도 87%, 예컨대, 적어도 88%, 예컨대, 적어도 89%, 예컨대, 적어도 90%, 예컨대, 적어도 91%, 예컨대, 적어도 92%, 예컨대, 적어도 93%, 예컨대, 적어도 94%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%의 상동성 또는 동일성을 갖는, 이의 기능성 변이체이다. 일부 실시양태에서, 효모 세포는 Cpo_CPRQ, 이의 돌연변이체 또는 기능성 변이체, 및 Cpo_SPTQ, 이의 돌연변이체 또는 기능성 변이체를 발현한다. 일부 실시양태에서, 효모 세포는 Gmo_CPRQ, 이의 돌연변이체 또는 기능성 변이체, 및 Cpo_SPTQ 또는 이의 돌연변이체 또는 기능성 변이체를 발현한다.
바람직한 실시양태에서, 적어도 하나의 이종성 데사투라제는 본원 상기에 기술된 바와 같은 Cpo_CPRQ 또는 이의 돌연변이체 또는 기능성 변이체이다.
탄소 쇄 길이가 12인 지방 아실-CoA에 1 또는 2개의 이중 결합을 도입할 수 있는, 본원에 기술된 데사투라제 이외에도, 탄소 쇄 길이가 >12, 예컨대, 탄소 쇄 길이가 14 이상인 지방 아실-CoA에 적어도 하나의 이중 결합을 도입할 수 있는 데사투라제를 발현하는 효모 세포는 또한 탄소 쇄 길이가 >12인 탈포화된 지방 아실-CoA의 탄소 쇄 길이를 줄일 수 있는 다른 효소도 발현하여야 한다. 이는 하기 "쇄 단축" 섹션에 상세하게 설명되어 있다.
따라서, 효모 세포는 따라서, 효모 세포는 탄소 쇄 길이가 12인 상기 지방 아실-CoA에 하나 이상의 이중 결합을 도입하여 상기 지방 아실-CoA를 탄소 쇄 길이가 12이고, 하나 이상의 이중 결합을 갖는 탈포화된 지방 아실-CoA로 전환시킬 수 있는 데사투라제, 예컨대, 본원 상기에 기술된 데사투라제 중 임의의 것, 또는 지방 아실-CoA를 탄소 쇄 길이가 12인 탈포화된 지방 아실-CoA로 전환시킬 수 있는 능력을 보유하는, 이의 기능성 변이체를 발현할 수 있다. 효모 세포는 추가로 탄소 쇄 길이가 >12, 예컨대, 탄소 쇄 길이가 14 이상인 지방 아실-CoA에 적어도 하나의 이중 결합을 도입할 수 있는 데사투라제, 또는 탄소 쇄 길이가 >12, 예컨대, 탄소 쇄 길이가 14 이상인 지방 아실-CoA에 적어도 하나의 이중 결합을 도입할 수 있는 능력을 보유하는, 이의 기능성 변이체를 발현할 수 있다.
데사투라제 또는 이의 기능성 변이체가 원하는 활성을 갖는지 여부를 시험하기 위해, 당업계에 공지된 방법이 사용될 수 있다. 예를 들어, 시험하고자하는 후보 효소를 효모 세포에, 예컨대, 벡터 상에, 또는 효모 세포의 게놈에 도입하고, 적절한 배지 중에서 효모 세포를 인큐베이션시키고, 브로쓰로부터 지방 알콜 및/또는 지방산 메틸 에스테르를 추출하고, 예컨대, 탈포화된 화합물이 제조되는지 여부를 측정하는 GC-MS 분석과 같은 분석을 수행할 수 있다. 천연 엘롱가제(elongase) 유전자(들)가 결핍된 효모 세포에서 활성을 시험하는 것이 유리할 수 있다. 상기 방법의 예는 실시예 4에, 또는 문헌 [Schneiter et al., 2000]에 기술되어 있다.
지방 아실-
CoA
리덕타제
(EC 1.2.1.84)
용어 "지방 아실-CoA 리덕타제," "리덕타제" 및 "FAR"은 본원에서 상호교환적으로 사용될 것이다. FAR은 2 단계 반응을 촉매화한다:
아실-CoA + 2 NADPH <=> CoA + 알콜 + 2 NADP(+)
여기서, 제1 단계에서, 지방 아실-CoA는 제2 단계에서 지방 알데히드가 지방 알콜로 추가로 환원되기 전, 지방 알데히드로 환원된다. 지방 아실-CoA는 탈포화된 지방 아실-CoA, 특히, E8,E10-C12:CoA일 수 있으며, 이는 이어서, E8,E10-도데카디엔-1-올로 전환된다.
상기 반응을 촉매화할 수 있는 FAR은 EC 번호가 1.2.1.84인 알콜 형성 지방 아실-CoA 리덕타제이다. 따라서, 본 방법에 사용된 효모 세포는 상기 반응을 촉매화할 수 있는 이종성 FAR을 발현할 수 있다. 대안적으로, E8,E10-C12:CoA는 E8,E10-C12:CoA의 회수, 및 시험관내에서 상기 E8,E10-C12:CoA와 FAR의 접촉 후, E8,E10-도데카디엔-1-올로 전환될 수 있다.
FAR은 바람직하게 곤충 FAR, 예컨대, 아그로티스(Agrotis) 속, 헬리오티스(Heliothis) 속, 헬리코베르파(Helicoverpa) 속 또는 시디아(Cydia) 속의 곤충에 고유한 FAR일 수 있다. 예를 들어, FAR은 아그로티스 세게툼(Agrotis segetum), 아그로티스 입실론(Agrotis ipsilon), 헬리오티스 서브플렉사(Heliothis subflexa), 헬리코베르파 아술타(Helicoverpa assulta), 헬리코베르파 비레센스(Helicoverpa virescens) 또는 시디아 포모넬라(Cydia pomonella)에 고유한 것이다.
일부 실시양태에서, FAR은 Ase_FAR (서열 번호: 10), 즉, 아그로티스 세게툼에서 자연적으로 발생된 FAR이다. 일부 실시양태에서, 이종성 FAR은 E8,E10-C12:CoA를 E8,E10-도데카디엔-1-올로 전환시킬 수 있는 능력을 보유하는, Ase_FAR의 기능성 변이체이다. 예를 들어, 기능성 변이체는 Ase_FAR (서열 번호: 10)과 적어도 65%의 상동성 또는 동일성, 예컨대, 적어도 70%의 상동성 또는 동일성, 예컨대, 적어도 71%의 상동성 또는 동일성, 예컨대, 적어도 72%, 예컨대, 적어도 73%, 예컨대, 적어도 74%, 예컨대, 적어도 75%, 예컨대, 적어도 80%, 예컨대, 적어도 81%, 예컨대, 적어도 82%, 예컨대, 적어도 83%, 예컨대, 적어도 84%, 예컨대, 적어도 85%, 예컨대, 적어도 86%, 예컨대, 적어도 87%, 예컨대, 적어도 88%, 예컨대, 적어도 89%, 예컨대, 적어도 90%, 예컨대, 적어도 91%, 예컨대, 적어도 92%, 예컨대, 적어도 93%, 예컨대, 적어도 94%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%의 상동성 또는 동일성을 갖는다.
일부 실시양태에서, FAR은 돌연변이체 Ase_FAR, 예컨대, 198번 또는 413번 위치에 돌연변이를 갖는 돌연변이체이다. 일부 실시양태에서, Ase_FAR 돌연변이체는 T198A 돌연변이체이다. 다른 실시양태에서, Ase_FAR 돌연변이체는 S413A 돌연변이체이다.
일부 실시양태에서, Ase_FAR 또는 이의 기능성 변이체는 Ase_FAR 또는 이의 기능성 변이체를 코딩하는 핵산을 효모 세포에 도입함으로써 발현된다. 예를 들어, 서열 번호: 9에 기재되어 있는 바와 같은 핵산, 또는 이와 적어도 60%의 상동성 또는 동일성, 예컨대, 서열 번호: 9와 적어도 61%의 상동성 또는 동일성, 예컨대, 적어도 62%의 상동성 또는 동일성, 예컨대, 적어도 63%의 상동성 또는 동일성, 예컨대, 적어도 64%의 상동성 또는 동일성, 예컨대, 적어도 65%의 상동성 또는 동일성, 예컨대, 적어도 66%의 상동성 또는 동일성, 예컨대, 적어도 67%의 상동성 또는 동일성, 예컨대, 적어도 68%의 상동성 또는 동일성, 예컨대, 적어도 69%의 상동성 또는 동일성, 예컨대, 적어도 70%의 상동성 또는 동일성, 예컨대, 적어도 71%의 상동성 또는 동일성, 예컨대, 적어도 72%, 예컨대, 적어도 73%, 예컨대, 적어도 74%, 예컨대, 적어도 75%, 예컨대, 적어도 76%, 예컨대, 적어도 77%, 예컨대, 적어도 78%, 예컨대, 적어도 79%, 예컨대, 적어도 80%, 예컨대, 적어도 81%, 예컨대, 적어도 82%, 예컨대, 적어도 83%, 예컨대, 적어도 84%, 예컨대, 적어도 85%, 예컨대, 적어도 86%, 예컨대, 적어도 87%, 예컨대, 적어도 88%, 예컨대, 적어도 89%, 예컨대, 적어도 90%, 예컨대, 적어도 91%, 예컨대, 적어도 92%, 예컨대, 적어도 93%, 예컨대, 적어도 94%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%의 상동성 또는 동일성을 갖는, 이의 동족체가 도입된다.
다른 실시양태에서, FAR은 Aip_FAR (서열 번호: 61), 즉, 아그로티스 입실론에서 자연적으로 발생된 FAR이다. 일부 실시양태에서, 이종성 FAR은 E8,E10-C12:CoA를 E8,E10-도데카디엔-1-올로 전환시킬 수 있는 능력을 보유하는, Aip_FAR의 기능성 변이체이다. 예를 들어, 기능성 변이체는 Aip_FAR (서열 번호: 61)과 적어도 65%의 상동성 또는 동일성, 예컨대, 적어도 70%의 상동성 또는 동일성, 예컨대, 적어도 71%의 상동성 또는 동일성, 예컨대, 적어도 72%, 예컨대, 적어도 73%, 예컨대, 적어도 74%, 예컨대, 적어도 75%, 예컨대, 적어도 80%, 예컨대, 적어도 81%, 예컨대, 적어도 82%, 예컨대, 적어도 83%, 예컨대, 적어도 84%, 예컨대, 적어도 85%, 예컨대, 적어도 86%, 예컨대, 적어도 87%, 예컨대, 적어도 88%, 예컨대, 적어도 89%, 예컨대, 적어도 90%, 예컨대, 적어도 91%, 예컨대, 적어도 92%, 예컨대, 적어도 93%, 예컨대, 적어도 94%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%의 상동성 또는 동일성을 갖는다.
일부 실시양태에서, Aip_FAR 또는 이의 기능성 변이체는 Aip_FAR 또는 이의 기능성 변이체를 인코딩하는 핵산을 효모 세포에 도입함으로써 발현된다. 예를 들어, 서열 번호: 60에 기재되어 있는 바와 같은 핵산, 또는 이와 적어도 60%의 상동성 또는 동일성, 예컨대, 서열 번호: 60과 적어도 61%의 상동성 또는 동일성, 예컨대, 적어도 62%의 상동성 또는 동일성, 예컨대, 적어도 63%의 상동성 또는 동일성, 예컨대, 적어도 64%의 상동성 또는 동일성, 예컨대, 적어도 65%의 상동성 또는 동일성, 예컨대, 적어도 66%의 상동성 또는 동일성, 예컨대, 적어도 67%의 상동성 또는 동일성, 예컨대, 적어도 68%의 상동성 또는 동일성, 예컨대, 적어도 69%의 상동성 또는 동일성, 예컨대, 적어도 70%의 상동성 또는 동일성, 예컨대, 적어도 71%의 상동성 또는 동일성, 예컨대, 적어도 72%, 예컨대, 적어도 73%, 예컨대, 적어도 74%, 예컨대, 적어도 75%, 예컨대, 적어도 76%, 예컨대, 적어도 77%, 예컨대, 적어도 78%, 예컨대, 적어도 79%, 예컨대, 적어도 80%, 예컨대, 적어도 81%, 예컨대, 적어도 82%, 예컨대, 적어도 83%, 예컨대, 적어도 84%, 예컨대, 적어도 85%, 예컨대, 적어도 86%, 예컨대, 적어도 87%, 예컨대, 적어도 88%, 예컨대, 적어도 89%, 예컨대, 적어도 90%, 예컨대, 적어도 91%, 예컨대, 적어도 92%, 예컨대, 적어도 93%, 예컨대, 적어도 94%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%의 상동성 또는 동일성을 갖는, 이의 동족체가 도입된다.
다른 실시양태에서, FAR은 Hs_FAR (서열 번호: 71), 즉, 헬리오티스 서브플렉사에서 자연적으로 발생된 FAR이다. 일부 실시양태에서, 이종성 FAR은 E8,E10-C12:CoA를 E8,E10-도데카디엔-1-올로 전환시킬 수 있는 능력을 보유하는, Hs_FAR의 기능성 변이체이다. 예를 들어, 기능성 변이체는 Hs_FAR (서열 번호: 71)과 적어도 65%의 상동성 또는 동일성, 예컨대, 적어도 70%의 상동성 또는 동일성, 예컨대, 적어도 71%의 상동성 또는 동일성, 예컨대, 적어도 72%, 예컨대, 적어도 73%, 예컨대, 적어도 74%, 예컨대, 적어도 75%, 예컨대, 적어도 80%, 예컨대, 적어도 81%, 예컨대, 적어도 82%, 예컨대, 적어도 83%, 예컨대, 적어도 84%, 예컨대, 적어도 85%, 예컨대, 적어도 86%, 예컨대, 적어도 87%, 예컨대, 적어도 88%, 예컨대, 적어도 89%, 예컨대, 적어도 90%, 예컨대, 적어도 91%, 예컨대, 적어도 92%, 예컨대, 적어도 93%, 예컨대, 적어도 94%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%의 상동성 또는 동일성을 갖는다.
일부 실시양태에서, Hs_FAR 또는 이의 기능성 변이체는 Hs_FAR 또는 이의 기능성 변이체를 인코딩하는 핵산을 효모 세포에 도입함으로써 발현된다. 예를 들어, 서열 번호: 70에 기재되어 있는 바와 같은 핵산, 또는 이와 적어도 60%의 상동성 또는 동일성, 예컨대, 서열 번호: 70과 적어도 61%의 상동성 또는 동일성, 예컨대, 적어도 62%의 상동성 또는 동일성, 예컨대, 적어도 63%의 상동성 또는 동일성, 예컨대, 적어도 64%의 상동성 또는 동일성, 예컨대, 적어도 65%의 상동성 또는 동일성, 예컨대, 적어도 66%의 상동성 또는 동일성, 예컨대, 적어도 67%의 상동성 또는 동일성, 예컨대, 적어도 68%의 상동성 또는 동일성, 예컨대, 적어도 69%의 상동성 또는 동일성, 예컨대, 적어도 70%의 상동성 또는 동일성, 예컨대, 적어도 71%의 상동성 또는 동일성, 예컨대, 적어도 72%, 예컨대, 적어도 73%, 예컨대, 적어도 74%, 예컨대, 적어도 75%, 예컨대, 적어도 76%, 예컨대, 적어도 77%, 예컨대, 적어도 78%, 예컨대, 적어도 79%, 예컨대, 적어도 80%, 예컨대, 적어도 81%, 예컨대, 적어도 82%, 예컨대, 적어도 83%, 예컨대, 적어도 84%, 예컨대, 적어도 85%, 예컨대, 적어도 86%, 예컨대, 적어도 87%, 예컨대, 적어도 88%, 예컨대, 적어도 89%, 예컨대, 적어도 90%, 예컨대, 적어도 91%, 예컨대, 적어도 92%, 예컨대, 적어도 93%, 예컨대, 적어도 94%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%의 상동성 또는 동일성을 갖는, 이의 동족체가 도입된다.
다른 실시양태에서, FAR은 Has_FAR (서열 번호: 73), 즉, 헬리코베르파 아술타에서 자연적으로 발생된 FAR이다. 일부 실시양태에서, 이종성 FAR은 E8,E10-C12:CoA를 E8,E10-도데카디엔-1-올로 전환시킬 수 있는 능력을 보유하는, Has_FAR의 기능성 변이체이다. 예를 들어, 기능성 변이체는 Has_FAR (서열 번호: 73)과 적어도 65%의 상동성 또는 동일성, 예컨대, 적어도 70%의 상동성 또는 동일성, 예컨대, 적어도 71%의 상동성 또는 동일성, 예컨대, 적어도 72%, 예컨대, 적어도 73%, 예컨대, 적어도 74%, 예컨대, 적어도 75%, 예컨대, 적어도 80%, 예컨대, 적어도 81%, 예컨대, 적어도 82%, 예컨대, 적어도 83%, 예컨대, 적어도 84%, 예컨대, 적어도 85%, 예컨대, 적어도 86%, 예컨대, 적어도 87%, 예컨대, 적어도 88%, 예컨대, 적어도 89%, 예컨대, 적어도 90%, 예컨대, 적어도 91%, 예컨대, 적어도 92%, 예컨대, 적어도 93%, 예컨대, 적어도 94%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%의 상동성 또는 동일성을 갖는다.
일부 실시양태에서, Has_FAR 또는 이의 기능성 변이체는 Has_FAR 또는 이의 기능성 변이체를 인코딩하는 핵산을 효모 세포에 도입함으로써 발현된다. 예를 들어, 서열 번호: 72에 기재되어 있는 바와 같은 핵산, 또는 이와 적어도 60%의 상동성 또는 동일성, 예컨대, 서열 번호: 72와 적어도 61%의 상동성 또는 동일성, 예컨대, 적어도 62%의 상동성 또는 동일성, 예컨대, 적어도 63%의 상동성 또는 동일성, 예컨대, 적어도 64%의 상동성 또는 동일성, 예컨대, 적어도 65%의 상동성 또는 동일성, 예컨대, 적어도 66%의 상동성 또는 동일성, 예컨대, 적어도 67%의 상동성 또는 동일성, 예컨대, 적어도 68%의 상동성 또는 동일성, 예컨대, 적어도 69%의 상동성 또는 동일성, 예컨대, 적어도 70%의 상동성 또는 동일성, 예컨대, 적어도 71%의 상동성 또는 동일성, 예컨대, 적어도 72%, 예컨대, 적어도 73%, 예컨대, 적어도 74%, 예컨대, 적어도 75%, 예컨대, 적어도 76%, 예컨대, 적어도 77%, 예컨대, 적어도 78%, 예컨대, 적어도 79%, 예컨대, 적어도 80%, 예컨대, 적어도 81%, 예컨대, 적어도 82%, 예컨대, 적어도 83%, 예컨대, 적어도 84%, 예컨대, 적어도 85%, 예컨대, 적어도 86%, 예컨대, 적어도 87%, 예컨대, 적어도 88%, 예컨대, 적어도 89%, 예컨대, 적어도 90%, 예컨대, 적어도 91%, 예컨대, 적어도 92%, 예컨대, 적어도 93%, 예컨대, 적어도 94%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%의 상동성 또는 동일성을 갖는, 이의 동족체가 도입된다.
다른 실시양태에서, FAR은 Hv_FAR (서열 번호: 75), 즉, 헬리코베르파 비레센스에서 자연적으로 발생된 FAR이다. 일부 실시양태에서, 이종성 FAR은 E8,E10-C12:CoA를 E8,E10-도데카디엔-1-올로 전환시킬 수 있는 능력을 보유하는, Hv_FAR의 기능성 변이체이다. 예를 들어, 기능성 변이체는 Hv_FAR (서열 번호: 75)과 적어도 65%의 상동성 또는 동일성, 예컨대, 적어도 70%의 상동성 또는 동일성, 예컨대, 적어도 71%의 상동성 또는 동일성, 예컨대, 적어도 72%, 예컨대, 적어도 73%, 예컨대, 적어도 74%, 예컨대, 적어도 75%, 예컨대, 적어도 80%, 예컨대, 적어도 81%, 예컨대, 적어도 82%, 예컨대, 적어도 83%, 예컨대, 적어도 84%, 예컨대, 적어도 85%, 예컨대, 적어도 86%, 예컨대, 적어도 87%, 예컨대, 적어도 88%, 예컨대, 적어도 89%, 예컨대, 적어도 90%, 예컨대, 적어도 91%, 예컨대, 적어도 92%, 예컨대, 적어도 93%, 예컨대, 적어도 94%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%의 상동성 또는 동일성을 갖는다.
일부 실시양태에서, Hv_FAR 또는 이의 기능성 변이체는 Hv_FAR 또는 이의 기능성 변이체를 인코딩하는 핵산을 효모 세포에 도입함으로써 발현된다. 예를 들어, 서열 번호: 74에 기재되어 있는 바와 같은 핵산, 또는 이와 적어도 60%의 상동성 또는 동일성, 예컨대, 서열 번호: 74와 적어도 61%의 상동성 또는 동일성, 예컨대, 적어도 62%의 상동성 또는 동일성, 예컨대, 적어도 63%의 상동성 또는 동일성, 예컨대, 적어도 64%의 상동성 또는 동일성, 예컨대, 적어도 65%의 상동성 또는 동일성, 예컨대, 적어도 66%의 상동성 또는 동일성, 예컨대, 적어도 67%의 상동성 또는 동일성, 예컨대, 적어도 68%의 상동성 또는 동일성, 예컨대, 적어도 69%의 상동성 또는 동일성, 예컨대, 적어도 70%의 상동성 또는 동일성, 예컨대, 적어도 71%의 상동성 또는 동일성, 예컨대, 적어도 72%, 예컨대, 적어도 73%, 예컨대, 적어도 74%, 예컨대, 적어도 75%, 예컨대, 적어도 76%, 예컨대, 적어도 77%, 예컨대, 적어도 78%, 예컨대, 적어도 79%, 예컨대, 적어도 80%, 예컨대, 적어도 81%, 예컨대, 적어도 82%, 예컨대, 적어도 83%, 예컨대, 적어도 84%, 예컨대, 적어도 85%, 예컨대, 적어도 86%, 예컨대, 적어도 87%, 예컨대, 적어도 88%, 예컨대, 적어도 89%, 예컨대, 적어도 90%, 예컨대, 적어도 91%, 예컨대, 적어도 92%, 예컨대, 적어도 93%, 예컨대, 적어도 94%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%의 상동성 또는 동일성을 갖는, 이의 동족체가 도입된다.
일부 실시양태에서, 효모 세포는 시디아 포모넬라로부터의 FAR을 발현한다. 일부 실시양태에서, FAR은 Cpo_FAR (서열 번호: 76), 즉, 시디아 포모넬라에서 자연적으로 발생된 FAR이다. 일부 실시양태에서, 이종성 FAR은 E8,E10-C12:CoA를 E8,E10-도데카디엔-1-올로 전환시킬 수 있는 능력을 보유하는, Cpo_FAR의 기능성 변이체이다. 예를 들어, 기능성 변이체는 Cpo_FAR (서열 번호: 76)과 적어도 65%의 상동성 또는 동일성, 예컨대, 적어도 70%의 상동성 또는 동일성, 예컨대, 적어도 71%의 상동성 또는 동일성, 예컨대, 적어도 72%, 예컨대, 적어도 73%, 예컨대, 적어도 74%, 예컨대, 적어도 75%, 예컨대, 적어도 80%, 예컨대, 적어도 81%, 예컨대, 적어도 82%, 예컨대, 적어도 83%, 예컨대, 적어도 84%, 예컨대, 적어도 85%, 예컨대, 적어도 86%, 예컨대, 적어도 87%, 예컨대, 적어도 88%, 예컨대, 적어도 89%, 예컨대, 적어도 90%, 예컨대, 적어도 91%, 예컨대, 적어도 92%, 예컨대, 적어도 93%, 예컨대, 적어도 94%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%의 상동성 또는 동일성을 갖는다.
일부 실시양태에서, Cpo_FAR 또는 이의 기능성 변이체는 Cpo_FAR 또는 이의 기능성 변이체를 인코딩하는 핵산을 효모 세포에 도입함으로써 발현된다. 예를 들어, 서열 번호: 76에 기재되어 있는 바와 같은 핵산, 또는 이와 적어도 60%의 상동성 또는 동일성, 예컨대, 서열 번호: 76과 적어도 61%의 상동성 또는 동일성, 예컨대, 적어도 62%의 상동성 또는 동일성, 예컨대, 적어도 63%의 상동성 또는 동일성, 예컨대, 적어도 64%의 상동성 또는 동일성, 예컨대, 적어도 65%의 상동성 또는 동일성, 예컨대, 적어도 66%의 상동성 또는 동일성, 예컨대, 적어도 67%의 상동성 또는 동일성, 예컨대, 적어도 68%의 상동성 또는 동일성, 예컨대, 적어도 69%의 상동성 또는 동일성, 예컨대, 적어도 70%의 상동성 또는 동일성, 예컨대, 적어도 71%의 상동성 또는 동일성, 예컨대, 적어도 72%, 예컨대, 적어도 73%, 예컨대, 적어도 74%, 예컨대, 적어도 75%, 예컨대, 적어도 76%, 예컨대, 적어도 77%, 예컨대, 적어도 78%, 예컨대, 적어도 79%, 예컨대, 적어도 80%, 예컨대, 적어도 81%, 예컨대, 적어도 82%, 예컨대, 적어도 83%, 예컨대, 적어도 84%, 예컨대, 적어도 85%, 예컨대, 적어도 86%, 예컨대, 적어도 87%, 예컨대, 적어도 88%, 예컨대, 적어도 89%, 예컨대, 적어도 90%, 예컨대, 적어도 91%, 예컨대, 적어도 92%, 예컨대, 적어도 93%, 예컨대, 적어도 94%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%의 상동성 또는 동일성을 갖는, 이의 동족체가 도입된다.
일부 실시양태에서, FAR은 Har_FAR (서열 번호: 12), 즉, 헬리코베르파 아르미게라(Helicoverpa armigera)에서 자연적으로 발생된 FAR이다. 일부 실시양태에서, 이종성 FAR은 E8,E10-C12:CoA를 E8,E10-도데카디엔-1-올로 전환시킬 수 있는 능력을 보유하는, Har_FAR의 기능성 변이체이다. 예를 들어, 기능성 변이체는 Har_FAR (서열 번호: 12)와 적어도 65%의 상동성 또는 동일성, 예컨대, 적어도 70%의 상동성 또는 동일성, 예컨대, 적어도 71%의 상동성 또는 동일성, 예컨대, 적어도 72%, 예컨대, 적어도 73%, 예컨대, 적어도 74%, 예컨대, 적어도 75%, 예컨대, 적어도 80%, 예컨대, 적어도 81%, 예컨대, 적어도 82%, 예컨대, 적어도 83%, 예컨대, 적어도 84%, 예컨대, 적어도 85%, 예컨대, 적어도 86%, 예컨대, 적어도 87%, 예컨대, 적어도 88%, 예컨대, 적어도 89%, 예컨대, 적어도 90%, 예컨대, 적어도 91%, 예컨대, 적어도 92%, 예컨대, 적어도 93%, 예컨대, 적어도 94%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%의 상동성 또는 동일성을 갖는다.
일부 실시양태에서, Har_FAR 또는 이의 기능성 변이체는 Har_FAR 또는 이의 기능성 변이체를 인코딩하는 핵산을 효모 세포에 도입함으로써 발현된다. 예를 들어, 서열 번호: 11에 기재되어 있는 바와 같은 핵산, 또는 이와 적어도 60%의 상동성 또는 동일성, 예컨대, 서열 번호: 11과 적어도 61%의 상동성 또는 동일성, 예컨대, 적어도 62%의 상동성 또는 동일성, 예컨대, 적어도 63%의 상동성 또는 동일성, 예컨대, 적어도 64%의 상동성 또는 동일성, 예컨대, 적어도 65%의 상동성 또는 동일성, 예컨대, 적어도 66%의 상동성 또는 동일성, 예컨대, 적어도 67%의 상동성 또는 동일성, 예컨대, 적어도 68%의 상동성 또는 동일성, 예컨대, 적어도 69%의 상동성 또는 동일성, 예컨대, 적어도 70%의 상동성 또는 동일성, 예컨대, 적어도 71%의 상동성 또는 동일성, 예컨대, 적어도 72%, 예컨대, 적어도 73%, 예컨대, 적어도 74%, 예컨대, 적어도 75%, 예컨대, 적어도 76%, 예컨대, 적어도 77%, 예컨대, 적어도 78%, 예컨대, 적어도 79%, 예컨대, 적어도 80%, 예컨대, 적어도 81%, 예컨대, 적어도 82%, 예컨대, 적어도 83%, 예컨대, 적어도 84%, 예컨대, 적어도 85%, 예컨대, 적어도 86%, 예컨대, 적어도 87%, 예컨대, 적어도 88%, 예컨대, 적어도 89%, 예컨대, 적어도 90%, 예컨대, 적어도 91%, 예컨대, 적어도 92%, 예컨대, 적어도 93%, 예컨대, 적어도 94%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%을 갖는, 이의 동족체가 도입된다.
일부 실시양태에서, 효모 세포는 수개의 FAR 카피를 발현한다. 예를 들어, FAR은 당업계에 공지된 바와 같이 높은 수준으로 발현된다.
일부 실시양태에서, 효모 세포는 본원에 기술된 바와 같은 데사투라제 및 FAR을 발현한다. 구체적인 실시양태에서, 효모 세포는 Cpo_CPRQ (서열 번호: 2), 또는 이와 적어도 65%의 상동성 또는 동일성을 갖는, 이의 기능성 변이체, 및 Ase_FAR (서열 번호: 10), 또는 이와 적어도 65%의 상동성 또는 동일성을 갖는, 이의 기능성 변이체를 발현한다. 일부 실시양태에서, 효모 세포는 Cpo_CPRQ (서열 번호: 2), 또는 이와 적어도 65%의 상동성 또는 동일성을 갖는, 이의 기능성 변이체를 발현하고, FAR은 돌연변이체 Ase_FAR, 예컨대, 198번 또는 413번 위치에 돌연변이를 갖는 돌연변이체, 예를 들어, T198A 돌연변이체 또는 S413A 돌연변이체이다. 일부 실시양태에서, 데사투라제는 돌연변이체 Cpo_CPRQ, 예컨대, 85번 위치에 돌연변이를 갖는 돌연변이체, 예를 들어, S85A 돌연변이체이고, FAR은 Ase_FAR 또는 이의 기능성 변이체이다. 다른 실시양태에서, 데사투라제는 S85A Cpo_CPRQ 돌연변이체이고, FAR은 돌연변이체 Ase_FAR, 예컨대, 198번 또는 413번 위치에 돌연변이를 갖는 돌연변이체, 예를 들어, T198A 돌연변이체 또는 S413A 돌연변이체이다. 일부 실시양태에서, 데사투라제는 2개의 데사투라제, 예컨대, 2개의 동일한 데사투라제, 예를 들어, Cpo_CPRQ, 또는 85번 위치에 돌연변이를 갖는 돌연변이체 Cpo_CPRQ, 예를 들어, S85A 돌연변이체이고, FAR은 Ase_FAR 또는 이의 기능성 변이체이다. 일부 실시양태에서, 데사투라제는 2개의 데사투라제, 예컨대, 2개의 동일한 데사투라제, 예를 들어, Cpo_CPRQ, 또는 85번 위치에 돌연변이를 갖는 돌연변이체 Cpo_CPRQ, 예를 들어, S85A 돌연변이체이고, FAR은 돌연변이체 Ase_FAR, 예컨대, 198번 또는 413번 위치에 돌연변이를 갖는 돌연변이체, 예를 들어, T198A 돌연변이체 또는 S413A 돌연변이체이다. 다른 실시양태에서, 데사투라제는 2개의 상이한 데사투라제, 예를 들어, Cpo_CPRQ 데사투라제, 및 85번 위치에 돌연변이를 갖는 돌연변이체 Cpo_CPRQ 데사투라제, 예를 들어, S85A 돌연변이체이고, FAR은 Ase_FAR 또는 이의 기능성 변이체이다. 다른 실시양태에서, 데사투라제는 2개의 상이한 데사투라제, 예를 들어, Cpo_CPRQ 데사투라제, 및 85번 위치에 돌연변이를 갖는 돌연변이체 Cpo_CPRQ 데사투라제, 예를 들어, S85A 돌연변이체이고, FAR은 돌연변이체 Ase_FAR, 예컨대, 198번 또는 413번 위치에 돌연변이를 갖는 돌연변이체, 예를 들어, T198A 돌연변이체 또는 S413A 돌연변이체이다. 다른 실시양태에서, 효모 세포는 Gmo_CPRQ (서열 번호: 77) 및 Ase_FAR 또는 이의 돌연변이체 또는 기능성 변이체를 발현한다.
구체적인 실시양태에서, 효모 세포는 Cpo_CPRQ (서열 번호: 2), 또는 이와 적어도 65%의 상동성 또는 동일성을 갖는, 이의 기능성 변이체, 및 Aip_FAR (서열 번호: 61), 또는 이와 적어도 65%의 상동성 또는 동일성을 갖는, 이의 기능성 변이체를 발현한다. 일부 실시양태에서, 데사투라제는 돌연변이체 Cpo_CPRQ, 예컨대, 85번 위치에 돌연변이를 갖는 돌연변이체, 예를 들어, S85A 돌연변이체이고, FAR은Aip_FAR 또는 이의 기능성 변이체이다. 일부 실시양태에서, 데사투라제는 2개의 데사투라제, 예컨대, 2개의 동일한 데사투라제, 예를 들어, 2개의 Cpo_CPRQ 데사투라제 또는 2개의 85번 위치에 돌연변이를 갖는 돌연변이체 Cpo_CPRQ 데사투라제, 예를 들어, 2개의 S85A 돌연변이체이고, FAR은 Aip_FAR 또는 이의 기능성 변이체이다. 다른 실시양태에서, 데사투라제는 2개의 상이한 데사투라제, 예를 들어, Cpo_CPRQ 데사투라제, 및 85번 위치에 돌연변이를 갖는 돌연변이체 Cpo_CPRQ 데사투라제, 예를 들어, S85A 돌연변이체이고, FAR은 Aip_FAR 또는 이의 기능성 변이체이다. 다른 실시양태에서, 효모 세포는 Gmo_CPRQ (서열 번호: 77) 및 Aip_FAR 또는 이의 돌연변이체 또는 기능성 변이체를 발현한다.
일부 실시양태에서, 효모 세포는 Cpo_CPRQ (서열 번호: 2), 또는 이와 적어도 65%의 상동성 또는 동일성을 갖는, 이의 기능성 변이체, 및 Hs_FAR (서열 번호: 71), 또는 이와 적어도 65%의 상동성 또는 동일성을 갖는, 이의 기능성 변이체를 발현한다. 일부 실시양태에서, 데사투라제는 돌연변이체 Cpo_CPRQ, 예컨대, 85번 위치에 돌연변이를 갖는 돌연변이체, 예를 들어, S85A 돌연변이체이고, FAR은Hs_FAR 또는 이의 기능성 변이체이다. 일부 실시양태에서, 데사투라제는 2개의 데사투라제, 예컨대, 2개의 동일한 데사투라제, 예를 들어, 2개의 Cpo_CPRQ 데사투라제 또는 2개의 85번 위치에 돌연변이를 갖는 돌연변이체 Cpo_CPRQ 데사투라제, 예를 들어, 2개의 S85A 돌연변이체이고, FAR은 Hs_FAR 또는 이의 기능성 변이체이다. 다른 실시양태에서, 데사투라제는 2개의 상이한 데사투라제, 예를 들어, Cpo_CPRQ 데사투라제, 및 85번 위치에 돌연변이를 갖는 돌연변이체 Cpo_CPRQ 데사투라제, 예를 들어, S85A 돌연변이체이고, FAR은Hs_FAR 또는 이의 기능성 변이체이다. 다른 실시양태에서, 효모 세포는 Gmo_CPRQ (서열 번호: 77) 및 Hs_FAR 또는 이의 돌연변이체 또는 기능성 변이체를 발현한다.
구체적인 실시양태에서, 효모 세포는 Cpo_CPRQ (서열 번호: 2), 또는 이와 적어도 65%의 상동성 또는 동일성을 갖는, 이의 기능성 변이체, 및 Has_FAR (서열 번호: 73), 또는 이와 적어도 65%의 상동성 또는 동일성을 갖는, 이의 기능성 변이체를 발현한다. 일부 실시양태에서, 데사투라제는 돌연변이체 Cpo_CPRQ, 예컨대, 85번 위치에 돌연변이를 갖는 돌연변이체, 예를 들어, S85A 돌연변이체이고, FAR은Hs_FAR 또는 이의 기능성 변이체이다. 일부 실시양태에서, 데사투라제는 2개의 데사투라제, 예컨대, 2개의 동일한 데사투라제, 예를 들어, 2개의 Cpo_CPRQ 데사투라제 또는 2개의 85번 위치에 돌연변이를 갖는 돌연변이체 Cpo_CPRQ 데사투라제, 예를 들어, 2개의 S85A 돌연변이체이고, FAR은 Hs_FAR 또는 이의 기능성 변이체이다. 다른 실시양태에서, 데사투라제는 2개의 상이한 데사투라제, 예를 들어, Cpo_CPRQ 데사투라제, 및 85번 위치에 돌연변이를 갖는 돌연변이체 Cpo_CPRQ 데사투라제, 예를 들어, S85A 돌연변이체이고, FAR은Hs_FAR 또는 이의 기능성 변이체이다. 다른 실시양태에서, 효모 세포는 Gmo_CPRQ (서열 번호: 77) 및 Has_FAR 또는 이의 돌연변이체 또는 기능성 변이체를 발현한다.
구체적인 실시양태에서, 효모 세포는 Cpo_CPRQ (서열 번호: 2), 또는 이와 적어도 65%의 상동성 또는 동일성을 갖는, 이의 기능성 변이체, 및 Hv_FAR (서열 번호: 75), 또는 이와 적어도 65%의 상동성 또는 동일성을 갖는, 이의 기능성 변이체를 발현한다. 일부 실시양태에서, 데사투라제는 돌연변이체 Cpo_CPRQ, 예컨대, 85번 위치에 돌연변이를 갖는 돌연변이체, 예를 들어, S85A 돌연변이체이고, FAR은Hv_FAR 또는 이의 기능성 변이체이다. 일부 실시양태에서, 데사투라제는 2개의 데사투라제, 예컨대, 2개의 동일한 데사투라제, 예를 들어, 2개의 Cpo_CPRQ 데사투라제 또는 2개의 85번 위치에 돌연변이를 갖는 돌연변이체 Cpo_CPRQ 데사투라제, 예를 들어, 2개의 S85A 돌연변이체이고, FAR은 Hv_FAR 또는 이의 기능성 변이체이다. 다른 실시양태에서, 데사투라제는 2개의 상이한 데사투라제, 예를 들어, Cpo_CPRQ 데사투라제, 및 85번 위치에 돌연변이를 갖는 돌연변이체 Cpo_CPRQ 데사투라제, 예를 들어, S85A 돌연변이체이고, FAR은Hv_FAR 또는 이의 기능성 변이체이다. 다른 실시양태에서, 효모 세포는 Gmo_CPRQ (서열 번호: 77) 및 Hv_FAR 또는 이의 돌연변이체 또는 기능성 변이체를 발현한다.
구체적인 실시양태에서, 효모 세포는 Cpo_CPRQ (서열 번호: 2), 또는 이와 적어도 65%의 상동성 또는 동일성을 갖는, 이의 기능성 변이체, 및 Cpo_FAR (서열 번호: 76), 또는 이와 적어도 65%의 상동성 또는 동일성을 갖는, 이의 기능성 변이체를 발현한다. 일부 실시양태에서, 데사투라제는 돌연변이체 Cpo_CPRQ, 예컨대, 85번 위치에 돌연변이를 갖는 돌연변이체, 예를 들어, S85A 돌연변이체이고, FAR은Cpo_FAR 또는 이의 기능성 변이체이다. 일부 실시양태에서, 데사투라제는 2개의 데사투라제, 예컨대, 2개의 동일한 데사투라제, 예를 들어, 2개의 Cpo_CPRQ 데사투라제 또는 2개의 85번 위치에 돌연변이를 갖는 돌연변이체 Cpo_CPRQ 데사투라제, 예를 들어, 2개의 S85A 돌연변이체이고, FAR은 Cpo_FAR 또는 이의 기능성 변이체이다. 다른 실시양태에서, 데사투라제는 2개의 상이한 데사투라제, 예를 들어, Cpo_CPRQ 데사투라제, 및 85번 위치에 돌연변이를 갖는 돌연변이체 Cpo_CPRQ 데사투라제, 예를 들어, S85A 돌연변이체이고, FAR은 Cpo_FAR 또는 이의 기능성 변이체이다. 다른 실시양태에서, 효모 세포는 Gmo_CPRQ (서열 번호: 77) 및 Cpo_FAR 또는 이의 돌연변이체 또는 기능성 변이체를 발현한다.
일부 실시양태에서, 효모 세포는 상기 기술된 바와 같은 데사투라제, 예컨대, Cpo_CPRQ 또는 Gmo_CPRQ, 이의 돌연변이체 또는 기능성 변이체, 본원 상기에서 기술된 바와 같은 FAR, 특히, Ase_FAR, Aip_FAR, Hs_AR, Has_FAR 또는 Hv_FAR, 또는 이의 돌연변이체, 또는 이와 적어도 65%의 상동성 또는 동일성을 갖는, 이의 기능성 변이체를 발현하고, 이는 또한 탄소 쇄 길이가 12인 지방 아실-CoA에 적어도 하나의 이중 결합을 도입할 수 있는 또 다른 데사투라제, 예컨대, Cpo_NPVE (서열 번호: 67), 또는 Cpo_SPTQ (서열 번호: 69), 이의 돌연변이체, 또는 서열 번호: 67 또는 서열 번호: 69와 적어도 65%의 상동성 또는 동일성, 예컨대, 서열 번호: 67 또는 서열 번호: 69와 적어도 70%의 상동성 또는 동일성, 예컨대, 적어도 71%의 상동성 또는 동일성, 예컨대, 적어도 72%, 예컨대, 적어도 73%, 예컨대, 적어도 74%, 예컨대, 적어도 75%, 예컨대, 적어도 80%, 예컨대, 적어도 81%, 예컨대, 적어도 82%, 예컨대, 적어도 83%, 예컨대, 적어도 84%, 예컨대, 적어도 85%, 예컨대, 적어도 86%, 예컨대, 적어도 87%, 예컨대, 적어도 88%, 예컨대, 적어도 89%, 예컨대, 적어도 90%, 예컨대, 적어도 91%, 예컨대, 적어도 92%, 예컨대, 적어도 93%, 예컨대, 적어도 94%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%의 상동성 또는 동일성을 갖는, 이의 기능성 변이체를 발현한다.
일부 실시양태에서, FAR은 Har_FAR (헬리코베르파 아르미게라로부터의 FAR, 서열 번호: 12)이 아니다. 일부 실시양태에서, FAR은 Ta_FAR (티토 알바(Tyto alba)로부터의 FAR, 서열 번호: 8)이 아니다.
따라서, 효모 세포는 탄소 쇄 길이가 12인 상기 지방 아실-CoA에 하나 이상의 이중 결합을 도입하여 상기 지방 아실-CoA를 탄소 쇄 길이가 12이고, 하나 이상의 이중 결합을 갖는 탈포화된 지방 아실-CoA로 전환시킬 수 있는 데사투라제, 예컨대, 본원 상기에 기술된 데사투라제 중 임의의 것, 또는 지방 아실-CoA를 탄소 쇄 길이가 12인 탈포화된 지방 아실-CoA로 전환시킬 수 있는 능력을 보유하는, 이의 기능성 변이체를 발현할 수 있다. 효모 세포는 추가로 상기 기술된 바와 같이, 탄소 쇄 길이가 >12, 예컨대, 탄소 쇄 길이가 14 이상인 지방 아실-CoA에 적어도 하나의 이중 결합을 도입할 수 있는 데사투라제, 또는 탄소 쇄 길이가 >12, 예컨대, 탄소 쇄 길이가 14 이상인 지방 아실-CoA에 적어도 하나의 이중 결합을 도입할 수 있는 능력을 보유하는, 이의 기능성 변이체를 발현할 수 있다. 이들 효모 세포 중 임의의 것은 본원 상기에서 기술된 바와 같은 리덕타제, 또는 리덕타제 활성을 보유하는 이의 기능성 변이체를 추가로 발현할 수 있다.
리덕타제 또는 이의 기능성 변이체가 원하는 활성을 갖는지 여부를 시험하기 위해, 당업계에 공지된 방법이 사용될 수 있다. 예를 들어, 시험하고자하는 후보 효소를 효모 세포에, 예컨대, 벡터 상에, 또는 효모 세포의 게놈에 도입하고, 적절한 배지 중에서 효모 세포를 인큐베이션시키고, 브로쓰로부터 지방 알콜을 추출하고, 예컨대, 탈포화된 지방 알콜이 제조되는지 여부를 측정하는 GC-MS 분석과 같은 분석을 수행할 수 있다. 천연 엘롱가제 유전자(들)가 결핍된 효모 세포에서 활성을 시험하는 것이 유리할 수 있다. 상기 방법의 예는 실시예 4에, 또는 문헌 [Schneiter et al., 2000]에 기술되어 있다.
전구체 이용가능성 증가
E8,E10-도데카디에닐 코엔자임 A 및 임의로, E8,E10-도데카디엔-1-올 및 이의 유도체 제조를 개선시키기 위해, 특히, E8,E10-C12:CoA의 필요한 전구체의 이용가능성을 증가시키기 위하여 효모 세포에 추가 변형을 도입하는 것이 유리할 수 있다. 따라서, 효모 세포는 특히 하기에 상세히 설명된 임의의 변형으로 추가 변형될 수 있다:
- 이종성 시토크롬 b5의 발현
- 이종성 시토크롬 b5 리덕타제의 발현
- 헤모글로빈의 발현
- 활성의 전체 또는 부분적인 손실을 초래하는 천연 엘롱가제(들)(elongase(s))의 불활성화
- 활성의 전체 또는 부분적인 손실을 초래하는 천연 티오에스테라제(들)의 불활성화
- 천연 지방 알데히드 데히드로게나제(들), 지방 알콜 옥시다제(들), 퍼옥시좀 생물발생 인자 및/또는 지방 아실 신타제(들)의 활성 불활성화 또는 변형
- 이종성 티오에스테라제 유전자의 발현
- 지방 아실 신타제 및 티오에스테라제의 융합 단백질의 발현.
효소, 예를 들어, 엘롱가제, 티오에스테라제, 지방 알데히드 데히드로게나제, 지방 알콜 옥시다제, 퍼옥시좀 생물발생 인자 또는 지방 아실 신타제는 예를 들어, 유전자에, 예를 들어, 코딩 서열에 전체 또는 부분적 결실, 삽입, 치환 또는 넌센스 또는 미스센스 돌연변이를 비롯한, 하나 이상의 돌연변이를 도입함으로써, 프로모터, 코작(Kozak) 서열, 종결인자 또는 다른 조절 요소를 도입함으로써 불활성화될 수 있다. 예를 들어, 천연 프로모터 또는 천연 종결인자는 각각 또 다른, 더 약한 프로모터에 의해 또는 또 다른 종결인자에 의해 대체될 수 있다. 활성의 부분적 또는 전체적인 손실을 초래하는 다른 불활성화 방법으로는 전사 억제 및 전사 후 불활성화, 예를 들어, 관련 전사체의 분해를 초래하는 RNAi 시스템 또는 CRISPR/Cas 시스템을 사용하여 침묵화하여 번역을 억제 또는 적어도 감소시키는 것 뿐만 아니라, 번역 후 불활성화, 예컨대, 단백질 억제를 포함한다. 효소 활성은 예컨대, 효소 특성, 예컨대, 세포내 국재화를 변형시키기 위해, 또는 활성을 증가시키기 위해 당업계에 공지된 방법을 사용하여 다르게 변형될 수 있다.
엘롱가제 활성은 예를 들어, 문헌 [Schneiter et al., 2000]에 기술된 바와 같이, 지방산 프로파일을 분석함으로써 시험될 수 있다.
티오에스테라제 활성은 예컨대, 문헌 [Nancolas et al., 2017]에 기술된 티오에스테라제 활성 검정법과 같은 적절한 검정법에 의해 시험될 수 있다.
지방 알데히드 데히드로게나제 활성은 예컨대, 문헌 [Iwama et al., 2014]에 기술된 지방 알데히드 분해 검정법과 같은 적절한 검정법에 의해 시험될 수 있다.
지방 알콜 옥시다제 활성은 예컨대, 문헌 [Iwama et al., 2014]에 기술된 지방 알데히드 분해 검정법과 같은 적절한 검정법에 의해 시험될 수 있다.
퍼옥시좀 생물발생 인자 활성은 유일한 탄소원으로서 지방산을 포함하는 배지에서 후보 지방 알콜 옥시다제를 발현하는 효모 세포의 성장 검정법과 같은 적절한 검정법에 의해 시험될 수 있다.
지방 아실 신타제 활성은 지방 아실 신타제가 필수 유전자인 바, 세포 성장을 시험함으로써 시험될 수 있다.
상기 변형 중 임의의 것이 조합될 수 있고, 즉, 효모 세포는 상기 변형 중 수개를 포함할 수 있다.
이종성
시토크롬 b5의 발현
본 발명자들이 코들레몬 및 이의 유도체의 제조에 유리한 것으로 밝혀진 한 변형은 효모 세포에서 이종성 시토크롬 b5의 발현이다. 상기 막 결합 헴단백질(hemoprotein)은 여러 막 결합 옥시게나제에 대한 전자 운반체로서 작용한다. 실시예 (특히, 실시예 6)에 제시된 바와 같이, 이종성 시토크롬 b5의 발현은 지방산 메틸 에스테르, 특히, E8,E10-C12:Me 및 E9/Z9-C12: Me의 이용가능성을 증가시키는 것으로 밝혀졌다. 따라서, 상기 변형은 E8,E10-도데카디에닐 코엔자임 A, 및 임의로, 탄소 쇄 길이가 12인 탈포화된 지방 알콜, 예컨대, 코들레몬의 제조를 증가시키는 것으로 예상된다.
일부 실시양태에서, 시토크롬 b5는 레피도프테라 종에 고유한 시토크롬 b5이다. 특정 실시양태에서, 시토크롬 b5는 헬리코베르파 종으로부터의 시토크롬 b5, 바람직하게, 헬리코베르파 아르미게라로부터의 시토크롬 b5, 예컨대, 서열 번호: 4에 기재되어 있는 것, 또는 이와 적어도 65%의 상동성 또는 동일성, 예컨대, 적어도 70%의 상동성 또는 동일성, 예컨대, 적어도 71%의 상동성 또는 동일성, 예컨대, 적어도 72%, 예컨대, 적어도 73%, 예컨대, 적어도 74%, 예컨대, 적어도 75%, 예컨대, 적어도 80%, 예컨대, 적어도 85%, 예컨대, 적어도 90%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%의 상동성 또는 동일성을 갖는, 이의 기능성 변이체이다.
시토크롬 b5는 높은 수준으로 발현될 수 있다.
시토크롬 b5는 시토크롬 b5를 인코딩하는 핵산, 또는 이의 동족체를 효모 세포에 도입함으로써 발현될 수 있다. 예를 들어, 서열 번호: 3에 기재된 핵산, 또는 이와 적어도 60%의 상동성 또는 동일성, 예컨대, 서열 번호: 3과 적어도 61%의 상동성 또는 동일성, 예컨대, 적어도 62%의 상동성 또는 동일성, 예컨대, 적어도 63%의 상동성 또는 동일성, 예컨대, 적어도 64%의 상동성 또는 동일성, 예컨대, 적어도 65%의 상동성 또는 동일성, 예컨대, 적어도 66%의 상동성 또는 동일성, 예컨대, 적어도 67%의 상동성 또는 동일성, 예컨대, 적어도 68%의 상동성 또는 동일성, 예컨대, 적어도 69%의 상동성 또는 동일성, 예컨대, 적어도 70%의 상동성 또는 동일성, 예컨대, 적어도 71%의 상동성 또는 동일성, 예컨대, 적어도 72%, 예컨대, 적어도 73%, 예컨대, 적어도 74%, 예컨대, 적어도 75%, 예컨대, 적어도 76%, 예컨대, 적어도 77%, 예컨대, 적어도 78%, 예컨대, 적어도 79%, 예컨대, 적어도 80%, 예컨대, 적어도 81%, 예컨대, 적어도 82%, 예컨대, 적어도 83%, 예컨대, 적어도 84%, 예컨대, 적어도 85%, 예컨대, 적어도 86%, 예컨대, 적어도 87%, 예컨대, 적어도 88%, 예컨대, 적어도 89%, 예컨대, 적어도 90%, 예컨대, 적어도 91%, 예컨대, 적어도 92%, 예컨대, 적어도 93%, 예컨대, 적어도 94%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%의 상동성 또는 동일성을 갖는, 이의 동족체가 도입된다.
시토크롬 b5의 기능성 변이체가 원하는 활성을 보유하는지 여부를 시험하기 위해, 당업계에 공지된 방법; 예를 들어, 문헌 [Lamb et al., 1999]에 기술된 바와 같은 분광광도 검정법이 사용될 수 있다.
따라서, 일부 실시양태에서, 효모 세포는 상기 기술된 바와 같은 데사투라제 및 지방 아실-CoA 리덕타제를 발현하고, 이는 추가로 본원에 기술된 바와 같은 이종성 시토크롬 b5를 발현한다. 특히, 효모 세포는 Cpo_CPRQ (서열 번호: 2), 돌연변이체 Cpo_CPRQ, 예컨대, S82 돌연변이체 또는 S85 돌연변이체, 바람직하게, S85 돌연변이체, 예컨대, S85A 돌연변이체, 및 이의 기능성 변이체로부터 선택되는 하나 이상의 데사투라제, 및 Ase_FAR (서열 번호: 10), 돌연변이체 Ase_FAR, 예컨대, T198 돌연변이체 또는 S413 돌연변이체, 바람직하게, T198A 돌연변이체 또는 S413A 돌연변이체, Aip_FAR (서열 번호: 61), Hs_FAR (서열 번호: 71), Has_FAR (서열 번호: 73), Hv_FAR (서열 번호: 75), Har_FAR (서열 번호: 12) 및 이의 기능성 변이체로부터 선택되는 하나 이상의 리덕타제, 및 본원 상기에서 기술된 바와 같은 시토크롬 b5, 예컨대, 헬리코베르파 아르미게라로부터의 시토크롬 b5 (서열 번호: 4) 또는 이의 기능성 변이체를 발현할 수 있다. 효모 세포는 Cpo_CPRQ, 이의 돌연변이체 또는 기능성 변이체 이외에도 또한 상기 기술된 바와 같은 탄소 쇄 길이가 12인 지방 아실-CoA에 적어도 하나의 이중 결합을 도입할 수 있는 또 다른 데사투라제, 예를 들어, Cpo_NPVE, Cpo_SPTQ, 이의 돌연변이체 또는 기능성 변이체를 발현할 수 있다.
효모 세포는 특히, 이종성 시토크롬 b5 리덕타제의 발현, 헤모글로빈의 발현, 활성의 전체 또는 부분적인 손실을 초래하는 천연 엘롱가제 유전자(들)의 돌연변이, 활성의 전체 또는 부분적인 손실을 초래하는 천연 티오에스테라제 유전자(들)의 돌연변이, 지방 알데히드 데히드로게나제(들), 지방 알콜 옥시다제(들), 퍼옥시좀 생물발생 인자 및/또는 지방 아실 신타제(들)를 인코딩하는 천연 유전자(들)의 돌연변이, 이종성 티오에스테라제 유전자의 발현, 및/또는 지방 아실 신타제 및 티오에스테라제의 융합 단백질의 발현에 의해 본원에 기술된 변형 중 임의의 것으로 추가로 변형될 수 있다.
이종성
시토크롬 b5
리덕타제
(EC 1.6.2.2)의 발현
E8,E10-도데카디에닐 코엔자임 A 및 임의로, 코들레몬 및 이의 유도체의 제조를 증가시킬 수 있는 또 다른 변형은 이종성 시토크롬 b5 리덕타제 (EC 1.6.2.2)의 발현이다.
메트헤모글로빈 리덕타제으로도 또한 공지되어 있는 시토크롬 b5 리덕타제는 메트헤모글로빈을 헤모글로빈으로 전환시키는 NADH 의존성 효소이다:
NADH + H+ + 2 페리시토크롬 b5 = NAD+ + 2 페로시토크롬 b5
일부 실시양태에서, 시토크롬 b5 리덕타제는
레피도프테라 종에 고유한 시토크롬 b5 리덕타제이다. 특정 실시양태에서, 시토크롬 b5 리덕타제는 헬리코베르파 종으로부터의 시토크롬 b5 리덕타제, 바람직하게, 헬리코베르파 종, 예컨대, 헬리코베르파 아르미게라로부터의 시토크롬 b5 리덕타제, 예를 들어, 서열 번호: 24에 기재되어 있는 시토크롬 b5 리덕타제, 또는 이와 적어도 65%의 상동성 또는 동일성, 예컨대, 적어도 70%의 상동성 또는 동일성, 예컨대, 적어도 71%의 상동성 또는 동일성, 예컨대, 적어도 72%, 예컨대, 적어도 73%, 예컨대, 적어도 74%, 예컨대, 적어도 75%, 예컨대, 적어도 80%, 예컨대, 적어도 85%, 예컨대, 적어도 90%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%의 상동성 또는 동일성을 갖는, 이의 기능성 변이체이다.
시토크롬 b5 리덕타제의 기능성 변이체가 원하는 활성을 보유하는지 여부를 시험하기 위해, 당업계에 공지된 방법; 예를 들어, 문헌 [Lamb et al., 1999]에 기술된 바와 같은 분광광도 검정법이 사용될 수 있다.
시토크롬 b5 리덕타제는 높은 수준으로 발현될 수 있다.
시토크롬 b5 리덕타제는 상기 시토크롬 b5 리덕타제를 인코딩하는 핵산, 또는 이의 동족체를 효모 세포에 도입함으로써 발현될 수 있다. 예를 들어, 서열 번호: 23에 기재된 핵산, 또는 이와 적어도 60%의 상동성 또는 동일성, 예컨대, 서열 번호: 23과 적어도 61%의 상동성 또는 동일성, 예컨대, 적어도 62%의 상동성 또는 동일성, 예컨대, 적어도 63%의 상동성 또는 동일성, 예컨대, 적어도 64%의 상동성 또는 동일성, 예컨대, 적어도 65%의 상동성 또는 동일성, 예컨대, 적어도 66%의 상동성 또는 동일성, 예컨대, 적어도 67%의 상동성 또는 동일성, 예컨대, 적어도 68%의 상동성 또는 동일성, 예컨대, 적어도 69%의 상동성 또는 동일성, 예컨대, 적어도 70%의 상동성 또는 동일성, 예컨대, 적어도 71%의 상동성 또는 동일성, 예컨대, 적어도 72%, 예컨대, 적어도 73%, 예컨대, 적어도 74%, 예컨대, 적어도 75%, 예컨대, 적어도 76%, 예컨대, 적어도 77%, 예컨대, 적어도 78%, 예컨대, 적어도 79%, 예컨대, 적어도 80%, 예컨대, 적어도 81%, 예컨대, 적어도 82%, 예컨대, 적어도 83%, 예컨대, 적어도 84%, 예컨대, 적어도 85%, 예컨대, 적어도 86%, 예컨대, 적어도 87%, 예컨대, 적어도 88%, 예컨대, 적어도 89%, 예컨대, 적어도 90%, 예컨대, 적어도 91%, 예컨대, 적어도 92%, 예컨대, 적어도 93%, 예컨대, 적어도 94%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%의 상동성 또는 동일성을 갖는, 이의 동족체가 도입된다.
따라서, 일부 실시양태에서, 효모 세포는 상기 기술된 바와 같은 데사투라제 및 지방 아실-CoA 리덕타제를 발현하고, 이는 추가로 본원에 기술된 바와 같은 이종성 시토크롬 b5 리덕타제를 발현한다. 효모 세포는 본원에 기술된 변형 중 임의의 것으로 추가로 변형될 수 있다. 특히, 효모 세포는 Cpo_CPRQ (서열 번호: 2), Gmo_CPRQ (서열 번호: 77), 돌연변이체 Cpo_CPRQ, 예컨대, S82 돌연변이체 또는 S85 돌연변이체, 바람직하게, S85 돌연변이체, 예컨대, S85A 돌연변이체, 및 이의 기능성 변이체로부터 선택되는 하나 이상의 데사투라제, 및 Ase_FAR (서열 번호: 10), 돌연변이체 Ase_FAR, 예컨대, T198 돌연변이체 또는 S413 돌연변이체, 바람직하게, T198A 돌연변이체 또는 S413A 돌연변이체, Aip_FAR (서열 번호: 61), Hs_FAR (서열 번호: 71), Has_FAR (서열 번호: 73), Hv_FAR (서열 번호: 75), Har_FAR (서열 번호: 12) 및 이의 기능성 변이체로부터 선택되는 하나 이상의 리덕타제, 및 본원 상기에서 기술된 바와 같은 시토크롬 b5 리덕타제, 예컨대, 헬리코베르파 아르미게라로부터의 시토크롬 b5 리덕타제 (서열 번호: 25) 또는 이의 기능성 변이체를 발현할 수 있다. 효모 세포는 Cpo_CPRQ 또는 Gmo_CPRQ, 이의 돌연변이체 또는 기능성 변이체 이외에도 또한 상기 기술된 바와 같은 탄소 쇄 길이가 12인 지방 아실-CoA에 적어도 하나의 이중 결합을 도입할 수 있는 또 다른 데사투라제, 예를 들어, Cpo_NPVE, Cpo_SPTQ, 이의 돌연변이체 또는 기능성 변이체를 발현할 수 있다. 효모 세포는 추가로 본원 상기에서 기술된 바와 같은 시토크롬 b5를 발현할 수 있다.
효모 세포는 특히, 이종성 시토크롬 b5의 발현, 헤모글로빈의 발현, 활성의 전체 또는 부분적인 손실을 초래하는 천연 엘롱가제 유전자(들)의 돌연변이, 활성의 전체 또는 부분적인 손실을 초래하는 천연 티오에스테라제 유전자(들)의 돌연변이, 지방 알데히드 데히드로게나제(들), 지방 알콜 옥시다제(들), 퍼옥시좀 생물발생 인자 및/또는 지방 아실 신타제(들)를 코딩하는 천연 유전자(들)의 돌연변이, 이종성 티오에스테라제 유전자의 발현, 및/또는 지방 아실 신타제 및 티오에스테라제의 융합 단백질의 발현에 의해 본원에 기술된 변형 중 임의의 것으로 추가로 변형될 수 있다.
헤모글로빈의 발현
E8,E10-도데카디에닐 코엔자임 A 및 임의로, 코들레몬 및 이의 유도체의 제조에 유리할 수 있는 또 다른 변형은 효모 세포에서 헤모글로빈, 특히, 이종성 헤모글로빈의 발현이다.
실시예, 특히, 실시예 6에 제시된 바와 같이, 데사투라제를 발현하는 효모 세포에서의 헤모글로빈의 발현은 E8,E10-C12:Me 및 E9/Z9-C12:Me의 제조를 증가시켰다.
일부 실시양태에서, 헤모글로빈은 비트레오스킬라(Vitreoscilla) 종, 예컨대, 비트레오스킬라 스테르코라리아(Vitreoscilla stercoraria)에 고유한 헤모글로빈이다. 특정 실시양태에서, 헤모글로빈은 서열 번호: 6에 기재되어 있는 것, 또는 이와 적어도 65%의 상동성 또는 동일성, 예컨대, 적어도 70%의 상동성 또는 동일성, 예컨대, 적어도 71%의 상동성 또는 동일성, 예컨대, 적어도 72%, 예컨대, 적어도 73%, 예컨대, 적어도 74%, 예컨대, 적어도 75%, 예컨대, 적어도 80%, 예컨대, 적어도 85%, 예컨대, 적어도 90%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%의 상동성 또는 동일성을 갖는, 이의 기능성 변이체이다.
헤모글로빈의 기능성 변이체가 원하는 활성을 보유하는지 여부를 시험하기 위해, 당업계에 공지되어 있는 바와 같은 적절한 검정법, 예컨대, 비색 검정법이 수행될될 수 있다.
헤모글로빈이 높은 수준으로 발현될 수 있다.
헤모글로빈은 상기 헤모글로빈을 인코딩하는 핵산, 또는 이의 동족체를 효모 세포에 도입함으로써 발현될 수 있다. 예를 들어, 서열 번호: 5에 기재된 핵산, 또는 이와 적어도 60%의 상동성 또는 동일성, 예컨대, 서열 번호: 5와 적어도 61%의 상동성 또는 동일성, 예컨대, 적어도 62%의 상동성 또는 동일성, 예컨대, 적어도 63%의 상동성 또는 동일성, 예컨대, 적어도 64%의 상동성 또는 동일성, 예컨대, 적어도 65%의 상동성 또는 동일성, 예컨대, 적어도 66%의 상동성 또는 동일성, 예컨대, 적어도 67%의 상동성 또는 동일성, 예컨대, 적어도 68%의 상동성 또는 동일성, 예컨대, 적어도 69%의 상동성 또는 동일성, 예컨대, 적어도 70%의 상동성 또는 동일성, 예컨대, 적어도 71%의 상동성 또는 동일성, 예컨대, 적어도 72%, 예컨대, 적어도 73%, 예컨대, 적어도 74%, 예컨대, 적어도 75%, 예컨대, 적어도 76%, 예컨대, 적어도 77%, 예컨대, 적어도 78%, 예컨대, 적어도 79%, 예컨대, 적어도 80%, 예컨대, 적어도 81%, 예컨대, 적어도 82%, 예컨대, 적어도 83%, 예컨대, 적어도 84%, 예컨대, 적어도 85%, 예컨대, 적어도 86%, 예컨대, 적어도 87%, 예컨대, 적어도 88%, 예컨대, 적어도 89%, 예컨대, 적어도 90%, 예컨대, 적어도 91%, 예컨대, 적어도 92%, 예컨대, 적어도 93%, 예컨대, 적어도 94%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%의 상동성 또는 동일성을 갖는, 이의 동족체가 도입된다.
따라서, 일부 실시양태에서, 효모 세포는 상기 기술된 바와 같은 데사투라제 및 지방 아실-CoA 리덕타제를 발현하고, 이는 추가로 본원에 기술된 바와 같은 헤모글로빈을 발현한다. 특히, 효모 세포는 Cpo_CPRQ (서열 번호: 2), Gmo_CPRQ (서열 번호: 77), 돌연변이체 Cpo_CPRQ, 예컨대, S82 돌연변이체 또는 S85 돌연변이체, 바람직하게, S85 돌연변이체, 예컨대, S85A 돌연변이체, 및 이의 기능성 변이체로부터 선택되는 하나 이상의 데사투라제, 및 Ase_FAR (서열 번호: 10), 돌연변이체 Ase_FAR, 예컨대, T198 돌연변이체 또는 S413 돌연변이체, 바람직하게, T198A 돌연변이체 또는 S413A 돌연변이체, Aip_FAR (서열 번호: 61), Hs_FAR (서열 번호: 71), Has_FAR (서열 번호: 73), Hv_FAR (서열 번호: 75), Har_FAR (서열 번호: 12) 및 이의 기능성 변이체로부터 선택되는 하나 이상의 리덕타제, 및 본원 상기에서 기술된 바와 같은 헤모글로빈, 예컨대, 비트레오스킬라 스테르코라리아로부터의 헤모글로빈 (서열 번호: 6) 또는 이의 기능성 변이체를 발현할 수 있다. 효모 세포는 Cpo_CPRQ 또는 Gmo_CPRQ, 이의 돌연변이체 또는 기능성 변이체 이외에도 또한 상기 기술된 바와 같은 탄소 쇄 길이가 12인 지방 아실-CoA에 적어도 하나의 이중 결합을 도입할 수 있는 또 다른 데사투라제, 예를 들어, Cpo_NPVE, Cpo_SPTQ, 이의 돌연변이체 또는 기능성 변이체를 발현할 수 있다.
효모 세포는 특히, 이종성 시토크롬 b5의 발현, 이종성 시토크롬 b5 리덕타제의 발현, 활성의 전체 또는 부분적인 손실을 초래하는 천연 엘롱가제 유전자(들)의 돌연변이, 활성의 전체 또는 부분적인 손실을 초래하는 천연 티오에스테라제 유전자(들)의 돌연변이, 지방 알데히드 데히드로게나제(들), 지방 알콜 옥시다제(들), 퍼옥시좀 생물발생 인자 및/또는 지방 아실 신타제(들)를 인코딩하는 천연 유전자(들)의 돌연변이, 이종성 티오에스테라제 유전자의 발현, 및/또는 지방 아실 신타제 및 티오에스테라제의 융합 단백질의 발현에 의해 본원에 기술된 변형 중 임의의 것으로 추가로 변형될 수 있다.
엘롱가제
유전자(들)의 돌연변이
E8,E10-도데카디에닐 코엔자임 A 및 임의로, 코들레몬 및 이의 유도체의 제조에 유리할 수 있는 또 다른 변형은 돌연변이가 상응하는 엘롱가제의 활성의 부분적 또는 전체적인 손실을 초래하는 것인, 효모 세포에서의 특정 유전자의 돌연변이, 특히, 하나 이상의 엘롱가제 유전자의 돌연변이이다. 엘롱가제는 지방산을 비롯한, 여러 분자의 탄소 쇄 연장을 촉매화한다. 일부 실시양태에서, 엘롱가제는 중간 쇄 아실 엘롱가제이다. 자연적으로 엘롱가제를 코딩하는 여러 유전자를 포함하는 효모 세포가 사용되는 경우, 효모 세포는 하나 이상의 엘롱가제의 활성의 부분적 또는 전체적인 손실을 초래하는 상기 유전자 중 하나 이상의 것에 돌연변이를 포함하도록 추가로 조작될 수 있다.
일부 실시양태에서, 효모 세포는 야로위아 리폴리티카 세포이고, 엘롱가제는 ELO1 유전자 (서열 번호: 13)에 의해 인코딩된 것이다.
일부 실시양태에서, 돌연변이는 상응하는 엘롱가제의 활성의 전체적인 손실을 초래하는 결실이다. 다른 실시양태에서, 엘롱가제는 예를 들어, 유전자에, 예를 들어, 코딩 서열에 전체 또는 부분적 결실, 삽입, 치환 또는 넌센스 또는 미스센스 돌연변이를 비롯한, 하나 이상의 돌연변이를 도입함으로써, 프로모터, 코작 서열, 종결인자 또는 다른 조절 요소를 도입함으로써 불활성화될 수 있다. 예를 들어, 천연 프로모터 또는 천연 종결인자는 각각 또 다른, 더 약한 프로모터에 의해 또는 또 다른 종결인자에 의해 대체될 수 있다. 활성의 부분적 또는 전체적인 손실을 초래하는 다른 불활성화 방법으로는 전사 억제 및 전사 후 불활성화, 예를 들어, 관련 전사체의 분해를 초래하는 RNAi 시스템 또는 CRISPR/Cas 시스템을 사용하여 침묵화하여 번역을 억제 또는 적어도 감소시키는 것 뿐만 아니라, 번역 후 불활성화, 예컨대, 단백질 억제를 포함한다. 단백질이 엘롱가제 활성을 보유하는지 여부를 시험하는 방법의 예는 실시예 4, 또는 문헌 [Schneiter et al., 2000]에 기술되어 있다.
따라서, 일부 실시양태에서, 효모 세포는 상기 기술된 바와 같은 데사투라제 및 지방 아실-CoA 리덕타제를 발현하고, 이는 추가로 본원에 기술된 바와 같이, 돌연변이가 부분적 또는 전체 기능 상실을 초래하는 것인, 엘롱가제를 코딩하는 하나 이상의 유전자에 하나 이상의 돌연변이를 포함한다. 특히, 효모 세포는 Cpo_CPRQ (서열 번호: 2), 돌연변이체 Cpo_CPRQ, 예컨대, S82 돌연변이체 또는 S85 돌연변이체, 바람직하게, S85 돌연변이체, 예컨대, S85A 돌연변이체, 및 이의 기능성 변이체로부터 선택되는 하나 이상의 데사투라제, 및 Ase_FAR (서열 번호: 10), 돌연변이체 Ase_FAR, 예컨대, T198 돌연변이체 또는 S413 돌연변이체, 바람직하게, T198A 돌연변이체 또는 S413A 돌연변이체, Aip_FAR (서열 번호: 61), Hs_FAR (서열 번호: 71), Has_FAR (서열 번호: 73), Hv_FAR (서열 번호: 75), Har_FAR (서열 번호: 12) 및 이의 기능성 변이체로부터 선택되는 하나 이상의 리덕타제를 발현할 수 있고, 본원 상기에서 기술된 바와 같이 엘롱가제의 활성의 부분적 또는 전체적인 손실을 초래하는 돌연변이를 추가로 포함할 수 있다. 효모 세포는 Cpo_CPRQ 또는 Gmo_CPRQ, 이의 돌연변이체 또는 기능성 변이체 이외에도 또한 상기 기술된 바와 같은 탄소 쇄 길이가 12인 지방 아실-CoA에 적어도 하나의 이중 결합을 도입할 수 있는 또 다른 데사투라제, 예를 들어, Cpo_NPVE, Cpo_SPTQ, 이의 돌연변이체 또는 기능성 변이체를 발현할 수 있다.
효모 세포는 특히, 이종성 시토크롬의 발현, 이종성 시토크롬 b5 리덕타제의 발현, 헤모글로빈의 발현, 활성의 전체 또는 부분적인 손실을 초래하는 천연 티오에스테라제 유전자(들)의 돌연변이, 지방 알데히드 데히드로게나제(들), 지방 알콜 옥시다제(들), 퍼옥시좀 생물발생 인자 및/또는 지방 아실 신타제(들)를 인코딩하는 천연 유전자(들)의 돌연변이, 이종성 티오에스테라제 유전자의 발현, 및/또는 지방 아실 신타제 및 티오에스테라제의 융합 단백질의 발현에 의해 본원에 기술된 변형 중 임의의 것으로 추가로 변형될 수 있다.
티오에스테라제
유전자(들)의 돌연변이
E8,E10-도데카디에닐 코엔자임 A 및 임의로, 코들레몬 및 이의 유도체의 제조에 유리할 수 있는 또 다른 변형은 돌연변이가 상응하는 티오에스테라제의 활성의 부분적 또는 전체적인 손실을 초래하는 것인, 효모 세포에서의 특정 유전자의 돌연변이, 특히, 하나 이상의 티오에스테라제 유전자의 돌연변이이다. 자연적으로 티오에스테라제를 인코딩하는 여러 유전자를 포함하는 효모 세포가 사용되는 경우, 효모 세포는 하나 이상의 티오에스테라제의 활성의 부분적 또는 전체적인 손실을 초래하는 상기 유전자 중 하나 이상의 것에 돌연변이를 포함하도록 추가로 조작될 수 있다.
일부 실시양태에서, 효모 세포는 야로위아 리폴리티카 세포이고, 티오에스테라제는 YAL10 _ F14729g 유전자 (서열 번호: 19), YALI0 _ E18876g (서열 번호: 54), 또는 YALI0 _ D03597g (서열 번호: 55)에 의해 코딩된 것이다. 따라서, 일부 실시양태에서, 야로위아 리폴리티카 세포는 상응하는 티오에스테라제의 활성의 부분적 또는 전체적인 손실을 초래하는, YAL10 _ F14729g 유전자 (서열 번호: 19)의 돌연변이, 예컨대, 결실을 포함한다. 다른 실시양태에서, 야로위아 리폴리티카 세포는 상응하는 티오에스테라제의 활성의 부분적 또는 전체적인 손실을 초래하는, YALI0_E18876g 유전자 (서열 번호: 54)의 돌연변이, 예컨대, 결실을 포함한다. 다른 실시양태에서, 야로위아 리폴리티카 세포는 티오에스테라제의 활성의 부분적 또는 전체적인 손실을 초래하는, YALI0 _ D03597g (서열 번호: 55)의 돌연변이, 예컨대, 결실을 포함한다. 일부 실시양태에서, 야로위아 리폴리티카 세포는 여러 티오에스테라제 유전자에 돌연변이를 포함한다. 예를 들어, 세포는 YAL10 _ F14729g (서열 번호: 19)의 및 YALI0 _ E18876g (서열 번호: 54)의 돌연변이, 예컨대, 결실; 또는 YAL10 _ F14729g (서열 번호: 19)의 및 YALI0 _ D03597g (서열 번호: 55)의 돌연변이, 예컨대, 결실; 또는 YALI0_E18876g (서열 번호: 54)의 및 YALI0 _ D03597g (서열 번호: 55)의 돌연변이, 예컨대, 결실을 포함할 수 있다. 일부 실시양태에서, 세포는 YAL10 _ F14729g (서열 번호: 19), YALI0_E18876g (서열 번호: 54) 및 YALI0 _ D03597g (서열 번호: 55)의 돌연변이, 예컨대, 결실을 포함한다.
따라서, 일부 실시양태에서, 효모 세포는 상기 기술된 바와 같은 데사투라제 및 지방 아실-CoA 리덕타제를 발현하고, 이는 추가로 본원에 기술된 바와 같이, 돌연변이가 부분적 또는 전체 기능 상실을 초래하는 것인, 티오에스테라제를 인코딩하는 하나 이상의 유전자에 하나 이상의 돌연변이를 포함한다. 특히, 효모 세포는 Cpo_CPRQ (서열 번호: 2), Gmo_CPRQ (서열 번호: 77) 돌연변이체 Cpo_CPRQ, 예컨대, S82 돌연변이체 또는 S85 돌연변이체, 바람직하게, S85 돌연변이체, 예컨대, S85A 돌연변이체, 및 이의 기능성 변이체로부터 선택되는 하나 이상의 데사투라제, 및 Ase_FAR (서열 번호: 10), 돌연변이체 Ase_FAR, 예컨대, T198 돌연변이체 또는 S413 돌연변이체, 바람직하게, T198A 돌연변이체 또는 S413A 돌연변이체, Aip_FAR (서열 번호: 61), Hs_FAR (서열 번호: 71), Has_FAR (서열 번호: 73), Hv_FAR (서열 번호: 75), Har_FAR (서열 번호: 12) 및 이의 기능성 변이체로부터 선택되는 하나 이상의 리덕타제, 및 본원 상기에서 기술된 바와 같이, 부분적 또는 전체 기능 상실을 초래하는 것인, 티오에스테라제를 인코딩하는 하나 이상의 유전자의 하나 이상의 돌연변이, 예컨대, YAL10 _ F14729g (서열 번호: 19), YALI0 _ E18876g (서열 번호: 54) 및 YALI0 _ D03597g (서열 번호: 55) 중 하나 이상의 것의 돌연변이를 발현할 수 있다. 효모 세포는 Cpo_CPRQ 또는 Gmo_CPRQ, 이의 돌연변이체 또는 기능성 변이체 이외에도 또한 상기 기술된 바와 같은 탄소 쇄 길이가 12인 지방 아실-CoA에 적어도 하나의 이중 결합을 도입할 수 있는 또 다른 데사투라제, 예를 들어, Cpo_NPVE, Cpo_SPTQ, 이의 돌연변이체 또는 기능성 변이체를 발현할 수 있다.
효모 세포는 특히, 이종성 시토크롬 b5의 발현, 이종성 시토크롬 b5 리덕타제의 발현, 헤모글로빈의 발현, 활성의 전체 또는 부분적인 손실을 초래하는 천연 엘롱가제 유전자(들)의 돌연변이, 지방 알데히드 데히드로게나제(들), 지방 알콜 옥시다제(들), 퍼옥시좀 생물발생 인자 및/또는 지방 아실 신타제(들)를 인코딩하는 천연 유전자(들)의 돌연변이, 이종성 티오에스테라제 유전자의 발현, 및/또는 지방 아실 신타제 및 티오에스테라제의 융합 단백질의 발현에 의해 본원에 기술된 변형 중 임의의 것으로 추가로 변형될 수 있다.
추가 변형
효모 세포는 다른 변형, 예컨대, 지방산 대사에 관여하는 효소의 활성을 감소시키는 적어도 하나의 돌연변이를 추가로 포함할 수 있다. 일부 실시양태에서, 천연 지방 알데히드 데히드로게나제(들), 지방 알콜 옥시다제(들), 퍼옥시좀 생물발생 인자 및/또는 지방 아실 신타제(들)의 활성은 변형되고, 바람직하게, 활성은 감소 또는 제거된다. 예를 들어, 효모 세포는 지방 알데히드 데히드로게나제, 지방 알콜 옥시다제, 및/또는 퍼옥시좀 생물발생 인자를 인코딩하는 유전자에 하나 이상의 돌연변이를 추가로 포함할 수 있다. 상기 효소 중 임의의 것은 예를 들어, 유전자에, 예를 들어, 코딩 서열에 전체 또는 부분적 결실, 삽입, 치환 또는 넌센스 또는 미스센스 돌연변이를 비롯한, 하나 이상의 돌연변이를 도입함으로써, 프로모터, 코작 서열, 종결인자 또는 다른 조절 요소를 도입함으로써 불활성화될 수 있다. 예를 들어, 천연 프로모터 또는 천연 종결인자는 각각 또 다른, 더 약한 프로모터에 의해 또는 또 다른 종결인자에 의해 대체될 수 있다. 활성의 부분적 또는 전체적인 손실을 초래하는 다른 불활성화 방법으로는 전사 억제 및 전사 후 불활성화, 예를 들어, 관련 전사체의 분해를 초래하는 RNAi 시스템 또는 CRISPR/Cas 시스템을 사용하여 침묵화하여 번역을 억제 또는 적어도 감소시키는 것 뿐만 아니라, 번역 후 불활성화, 예컨대, 단백질 억제를 포함한다. 효소 활성은 예컨대, 효소 특성, 예컨대, 세포내 국재화를 변형시키기 위해, 또는 활성을 증가시키기 위해 당업계에 공지된 방법을 사용하여 다르게 변형될 수 있다.
일부 실시양태에서, 효모 세포는 HFD1 , HFD2 , HFD3 , HFD4 , FAO1 , GPAT 및 PEX10 중 적어도 하나의 변형, 예컨대, 돌연변이, 또는 적어도 하나의 단백질과 적어도 60%의 상동성 또는 동일성, 예컨대, 이와 적어도 65%의 상동성 또는 동일성, 예컨대, 적어도 70%의 상동성 또는 동일성, 예컨대, 적어도 75%의 상동성 또는 동일성, 예컨대, 적어도 80%의 상동성 또는 동일성, 예컨대, 적어도 81%의 상동성 또는 동일성, 예컨대, 적어도 82%의 상동성 또는 동일성, 예컨대, 적어도 83%의 상동성 또는 동일성, 예컨대, 적어도 84%의 상동성 또는 동일성, 예컨대, 적어도 85%의 상동성 또는 동일성, 예컨대, 적어도 86%의 상동성 또는 동일성, 예컨대, 적어도 87%의 상동성 또는 동일성, 예컨대, 적어도 88%의 상동성 또는 동일성, 예컨대, 적어도 89%의 상동성 또는 동일성, 예컨대, 적어도 90%의 상동성 또는 동일성, 예컨대, 적어도 91%의 상동성 또는 동일성, 예컨대, 적어도 92%의 상동성 또는 동일성, 예컨대, 적어도 93%의 상동성 또는 동일성, 예컨대, 적어도 94%의 상동성 또는 동일성, 예컨대, 적어도 95%의 상동성 또는 동일성, 예컨대, 적어도 96%의 상동성 또는 동일성, 예컨대, 적어도 97%의 상동성 또는 동일성, 예컨대, 적어도 98%의 상동성 또는 동일성, 예컨대, 적어도 99%의 상동성 또는 동일성을 갖는, 상기 적어도 하나의 단백질의 활성을 감소시키는 변형, 예컨대, 돌연변이를 추가로 포함하는, 본원 상기에서 기술된 바와 같은 야로위아 리폴리티카 세포이다.
야로위아 리폴리티카에서, 지방 알데히드 데히드로게나제 Hfd1은 HFD1 (YALI0_F23793g)에 의해 인코딩된다. 이는 지방 알데히드의 지방산으로의 산화를 촉매화한다. 출원 WO 2018/109163에 상세하게 설명되어 있는 바와 같이, Hfd1의 활성 감소는 효모 세포에서 탈포화된 지방 알콜의 역가를 증가시킨다. 따라서, 본 발명에 따른 야로위아 리폴리티카 세포는 HFD1의 돌연변이, 예컨대, 결실을 추가로 포함할 수 있고, 이는 Hfd1의 활성의 부분적 또는 전체적인 손실을 초래할 수 있다. Hfd1의 활성 감소는 본원에 기술된 바와 같은 다른 방법에 의해 달성될 수 있다.
지방 알데히드 데히드로게나제 Hfd2는 HFD2 (YALI_0E15400g)에 의해 인코딩된다. 이는 지방 알데히드의 지방산으로의 산화를 촉매화한다. 따라서, 본 발명에 따른 야로위아 리폴리티카 세포는 HFD2의 돌연변이, 예컨대, 결실을 추가로 포함할 수 있고, 이는 Hfd2의 활성의 부분적 또는 전체적인 손실을 초래할 수 있다. Hfd2의 활성 감소는 본원에 기술된 바와 같은 다른 방법에 의해 달성될 수 있다.
지방 알데히드 데히드로게나제 Hfd3은 HFD3 (YALI0_A17875g)에 의해 코딩된다. 이는 지방 알데히드의 지방산으로의 산화를 촉매화한다. 따라서, 본 발명에 따른 야로위아 리폴리티카 세포는 HFD3의 돌연변이, 예컨대, 결실을 추가로 포함할 수 있고, 이는 Hfd3의 활성의 부분적 또는 전체적인 손실을 초래할 수 있다. Hfd3의 활성 감소는 본원에 기술된 바와 같은 다른 방법에 의해 달성될 수 있다.
야로위아 리폴리티카에서, 지방 알데히드 데히드로게나제 Hfd4는 HFD4 (YALI0_B01298g)에 의해 코딩된다. 이는 지방 알데히드의 지방산으로의 산화를 촉매화한다. 출원 WO 2018/109163에 상세하게 설명되어 있는 바와 같이, Hfd4의 활성 감소는 효모 세포에서 탈포화된 지방 알콜의 역가를 증가시킨다. 따라서, 본 발명에 따른 야로위아 리폴리티카 세포는 HFD4의 돌연변이, 예컨대, 결실을 추가로 포함할 수 있고, 이는 Hfd4의 활성의 부분적 또는 전체적인 손실을 초래할 수 있다. Hfd4의 활성 감소는 본원에 기술된 바와 같은 다른 방법에 의해 달성될 수 있다.
일부 실시양태에서, 효모 세포는 지방 알데히드 데히드로게나제의 활성의 부분적 또는 전체적인 손실을 초래하는, Hfd1, Hfd2, Hfd3 또는 Hfd4와 적어도 60%의 상동성 또는 동일성, 예컨대, Hfd1, Hfd2, Hfd3 또는 Hfd4와 적어도 65%의 상동성 또는 동일성, 예컨대, 적어도 70%의 상동성 또는 동일성, 예컨대, 적어도 75%의 상동성 또는 동일성, 예컨대, 적어도 80%의 상동성 또는 동일성, 예컨대, 적어도 81%의 상동성 또는 동일성, 예컨대, 적어도 82%의 상동성 또는 동일성, 예컨대, 적어도 83%의 상동성 또는 동일성, 예컨대, 적어도 84%의 상동성 또는 동일성, 예컨대, 적어도 85%의 상동성 또는 동일성, 예컨대, 적어도 86%의 상동성 또는 동일성, 예컨대, 적어도 87%의 상동성 또는 동일성, 예컨대, 적어도 88%의 상동성 또는 동일성, 예컨대, 적어도 89%의 상동성 또는 동일성, 예컨대, 적어도 90%의 상동성 또는 동일성, 예컨대, 적어도 91%의 상동성 또는 동일성, 예컨대, 적어도 92%의 상동성 또는 동일성, 예컨대, 적어도 93%의 상동성 또는 동일성, 예컨대, 적어도 94%의 상동성 또는 동일성, 예컨대, 적어도 95%의 상동성 또는 동일성, 예컨대, 적어도 96%의 상동성 또는 동일성, 예컨대, 적어도 97%의 상동성 또는 동일성, 예컨대, 적어도 98%의 상동성 또는 동일성, 예컨대, 적어도 99%의 상동성 또는 동일성을 갖는, 변형, 예를 들어, 돌연변이, 예컨대, 결실을 추가로 포함한다.
야로위아 리폴리티카에서, 지방 알콜 옥시다제 Fao1은 FAO1 (YALI0B14014g)에 의해 인코딩된다. 이의 결실은 ω-히드록시 지방산의 축적을 증가시킨다. 출원 WO 2018/109163에 상세하게 설명되어 있는 바와 같이, Fao1의 활성 감소는 효모 세포에서 탈포화된 지방 알콜의 역가를 증가시킨다. 따라서, 본 발명에 따른 야로위아 리폴리티카 세포는 FAO1의 돌연변이, 예컨대, 결실을 추가로 포함할 수 있고, 이는 Fao1의 활성의 부분적 또는 전체적인 손실을 초래할 수 있다. Fao1의 활성 감소는 본원에 기술된 바와 같은 다른 방법에 의해 달성될 수 있다.
일부 실시양태에서, 효모 세포는 지방 알콜 옥시다제의 활성의 부분적 또는 전체적인 손실을 초래하는, Fao1과 적어도 60%의 상동성 또는 동일성, 예컨대, Fao1과 적어도 65%의 상동성 또는 동일성, 예컨대, 적어도 70%의 상동성 또는 동일성, 예컨대, 적어도 75%의 상동성 또는 동일성, 예컨대, 적어도 80%의 상동성 또는 동일성, 예컨대, 적어도 81%의 상동성 또는 동일성, 예컨대, 적어도 82%의 상동성 또는 동일성, 예컨대, 적어도 83%의 상동성 또는 동일성, 예컨대, 적어도 84%의 상동성 또는 동일성, 예컨대, 적어도 85%의 상동성 또는 동일성, 예컨대, 적어도 86%의 상동성 또는 동일성, 예컨대, 적어도 87%의 상동성 또는 동일성, 예컨대, 적어도 88%의 상동성 또는 동일성, 예컨대, 적어도 89%의 상동성 또는 동일성, 예컨대, 적어도 90%의 상동성 또는 동일성, 예컨대, 적어도 91%의 상동성 또는 동일성, 예컨대, 적어도 92%의 상동성 또는 동일성, 예컨대, 적어도 93%의 상동성 또는 동일성, 예컨대, 적어도 94%의 상동성 또는 동일성, 예컨대, 적어도 95%의 상동성 또는 동일성, 예컨대, 적어도 96%의 상동성 또는 동일성, 예컨대, 적어도 97%의 상동성 또는 동일성, 예컨대, 적어도 98%의 상동성 또는 동일성, 예컨대, 적어도 99%의 상동성 또는 동일성의 상동성 또는 동일성을 갖는, 변형, 예를 들어, 돌연변이, 예컨대, 결실을 추가로 포함한다.
야로위아 리폴리티카에서, 퍼옥시좀 생물발생 인자 10 Pex10은 PEX10 (YALI0C01023g)에 의해 코딩된다. 출원 WO 2018/109163에 상세하게 설명되어 있는 바와 같이, Pex10의 활성 감소는 효모 세포에서 탈포화된 지방 알콜의 역가를 증가시킨다. 따라서, 본 발명에 따른 야로위아 리폴리티카 세포는 PEX10의 돌연변이, 예컨대, 결실을 추가로 포함할 수 있고, 이는 Pex10의 활성의 부분적 또는 전체적인 손실을 초래할 수 있다. Pex10의 활성 감소는 본원에 기술된 바와 같은 다른 방법에 의해 달성될 수 있다.
일부 실시양태에서, 효모 세포는 퍼옥시좀 생물발생 인자의 활성의 부분적 또는 전체적인 손실을 초래하는, Pex10과 적어도 60%의 상동성 또는 동일성, 예컨대, Pex10과 적어도 65%의 상동성 또는 동일성, 예컨대, Pex10과 적어도 70%의 상동성 또는 동일성, 예컨대, 적어도 75%의 상동성 또는 동일성, 예컨대, 적어도 80%의 상동성 또는 동일성, 예컨대, 적어도 81%의 상동성 또는 동일성, 예컨대, 적어도 82%의 상동성 또는 동일성, 예컨대, 적어도 83%의 상동성 또는 동일성, 예컨대, 적어도 84%의 상동성 또는 동일성, 예컨대, 적어도 85%의 상동성 또는 동일성, 예컨대, 적어도 86%의 상동성 또는 동일성, 예컨대, 적어도 87%의 상동성 또는 동일성, 예컨대, 적어도 88%의 상동성 또는 동일성, 예컨대, 적어도 89%의 상동성 또는 동일성, 예컨대, 적어도 90%의 상동성 또는 동일성, 예컨대, 적어도 91%의 상동성 또는 동일성, 예컨대, 적어도 92%의 상동성 또는 동일성, 예컨대, 적어도 93%의 상동성 또는 동일성, 예컨대, 적어도 94%의 상동성 또는 동일성, 예컨대, 적어도 95%의 상동성 또는 동일성, 예컨대, 적어도 96%의 상동성 또는 동일성, 예컨대, 적어도 97%의 상동성 또는 동일성, 예컨대, 적어도 98%의 상동성 또는 동일성, 예컨대, 적어도 99%의 상동성 또는 동일성의 상동성 또는 동일성을 갖는, 변형, 예를 들어, 돌연변이, 예컨대, 결실을 추가로 포함한다.
야로위아 리폴리티카에서, 글리세롤-3-포스페이트 아실트랜스퍼라제는 GPAT (YALI0_C00209g)에 의해 인코딩된다. GPAT는 글리세로지질 생합성으로의 제1 반응을 촉매화한다. 유전자는 야로위아 리폴리티카에서 필수적인 것이다. 출원 WO 2018/109163에 상세하게 설명되어 있는 바와 같이, GPAT의 활성 감소는 효모 세포에서 탈포화된 지방 알콜의 역가를 증가시킨다. 따라서, 본 발명에 따른 야로위아 리폴리티카 세포는 GPAT의 돌연변이를 추가로 포함할 수 있고, 이는 GPAT의 활성의 부분적 또는 전체적인 손실을 초래할 수 있다. GPAT의 활성 감소는 본원에 기술된 바와 같은 다른 방법에 의해 달성될 수 있다.
일부 실시양태에서, 효모 세포는 글리세롤-3-포스페이트 아실트랜스퍼라제의 활성의 부분적 또는 전체적인 손실을 초래하는, GPAT와 적어도 60%의 상동성 또는 동일성, 예컨대, GPAT와 적어도 65%의 상동성 또는 동일성, 예컨대, 적어도 70%의 상동성 또는 동일성, 예컨대, 적어도 75%의 상동성 또는 동일성, 예컨대, 적어도 80%의 상동성 또는 동일성, 예컨대, 적어도 81%의 상동성 또는 동일성, 예컨대, 적어도 82%의 상동성 또는 동일성, 예컨대, 적어도 83%의 상동성 또는 동일성, 예컨대, 적어도 84%의 상동성 또는 동일성, 예컨대, 적어도 85%의 상동성 또는 동일성, 예컨대, 적어도 86%의 상동성 또는 동일성, 예컨대, 적어도 87%의 상동성 또는 동일성, 예컨대, 적어도 88%의 상동성 또는 동일성, 예컨대, 적어도 89%의 상동성 또는 동일성, 예컨대, 적어도 90%의 상동성 또는 동일성, 예컨대, 적어도 91%의 상동성 또는 동일성, 예컨대, 적어도 92%의 상동성 또는 동일성, 예컨대, 적어도 93%의 상동성 또는 동일성, 예컨대, 적어도 94%의 상동성 또는 동일성, 예컨대, 적어도 95%의 상동성 또는 동일성, 예컨대, 적어도 96%의 상동성 또는 동일성, 예컨대, 적어도 97%의 상동성 또는 동일성, 예컨대, 적어도 98%의 상동성 또는 동일성, 예컨대, 적어도 99%의 상동성 또는 동일성을 갖는, 변형, 예를 들어, 돌연변이를 추가로 포함한다.
상기 효소 중 임의의 것의 활성의 부분적 또는 전체적인 손실은 또한 예를 들어, 예를 들어, 유전자에, 예를 들어, 코딩 서열에 전체 또는 부분적 결실, 삽입, 치환 또는 넌센스 또는 미스센스 돌연변이를 비롯한, 하나 이상의 돌연변이를 도입함으로써, 프로모터, 코작 서열, 종결인자 또는 다른 조절 요소를 도입함으로써 달성될 수 있다. 예를 들어, 천연 프로모터 또는 천연 종결인자는 각각 또 다른, 더 약한 프로모터에 의해 또는 또 다른 종결인자에 의해 대체될 수 있다. 활성의 부분적 또는 전체적인 손실을 초래하는 다른 불활성화 방법으로는 전사 억제 및 전사 후 불활성화, 예를 들어, 관련 전사체의 분해를 초래하는 RNAi 시스템 또는 CRISPR/Cas 시스템을 사용하여 침묵화하여 번역을 억제 또는 적어도 감소시키는 것 뿐만 아니라, 번역 후 불활성화, 예컨대, 단백질 억제를 포함한다. 변형, 예컨대, 돌연변이, 또는 본원 상기 기술된 임의의 변형이 활성의 전체 또는 부분적인 손실을 초래하는지 여부를 시험하기 위해, 예컨대, 본원 상기에 상세하게 설명되어 있는, 당업계에 공지된 방법이 사용될 수 있다. 예를 들어, 결실 또는 전사를 감소시키는 변형인 경우, 관련 서열의 부재를 확인하기 위해, 예컨대, PCR과 같은 증폭 방법이 사용될 수 있다. 단백질 발현은 예컨대, 웨스턴 블롯과 같은 적절한 검정법을 사용하거나, 또는 예컨대, 형광 마커와 같은 마커를 사용하여 발현 수준을 측정하여 조사할 수 있다.
효모 세포가 하나 이상의 변형된 지방 아실 신타제를 발현하는 것 또한 유리할 수 있다. 이는 탈포화된 생성물, 예컨대, E8,E10-도데카디에닐 코엔자임 A 및 탈포화된 지방 알콜 및 이의 유도체, 예컨대, 코들레몬 및 이의 유도체 생산으로의 대사 플럭스를 유도하는 데 도움이 될 수 있다. 따라서, 일부 실시양태에서, 효모 세포는 변형된 케톤 신타제 도메인을 갖는 지방 아실 신타제를 발현하도록 추가로 변형된다. 일부 실시양태에서, 효모 세포는 세포가 변형된 지방산 신타제 복합체를 추가로 발현하는 것인, 본원에 기술된 바와 같은 야로위아 리폴리티카 세포이다. 한 실시양태에서, 지방산 신타제 복합체는 상기 복합체의 알파 서브유닛을 인코딩하는 유전자를 돌연변이화함으로써 변형된다. 일부 실시양태에서, 돌연변이는 FAS2를 인코딩하는 유전자 (서열 번호: 18) 중에 존재한다. 다른 실시양태에서, 돌연변이는 FAS1을 인코딩하는 유전자 (서열 번호: 16) 중에 존재한다. 돌연변이는 서열 번호: 16의 잔기 123 (L123) 중 하나 이상의 것의 변형을 초래할 수 있다. 돌연변이는 서열 번호: 18의 잔기 1220 (I1220), 잔기 1217 (M1217), 또는 잔기 1226 (M1226) 중 하나 이상의 것의 변형을 초래하여 변이체 FAS2를 생성할 수 있다. 당업자는 상기 돌연변이를 디자인하는 방법을 알 것이다.
바람직하게, FAS2의 돌연변이는 Fas2의 I1220F 변이체, I1220W 변이체, I1220Y 변이체, 또는 I1220H 변이체를 생성한다. 구체적인 실시양태에서, 돌연변이는 I1220F 변이체를 생성한다. 일부 실시양태에서, 돌연변이는 M1217F 변이체, M1217W 변이체, M1217Y 변이체, 또는 M1217H 변이체를 생성한다. 다른 실시양태에서, 돌연변이는 M1226F 변이체, M1226W 변이체, M1226Y 변이체, 또는 M1226H 변이체를 생성한다.
바람직하게, FAS1의 돌연변이는 L123V 변이체를 생성한다.
상기 돌연변이 중 1 초과의 돌연변이를 갖는 효모 세포, 예컨대, FAS2의 잔기 I1220, M1217 또는 M1226에 2개의 돌연변이 또는 3개의 돌연변이, 및/또는 FAS1의 잔기 123에 한 돌연변이를 갖는 효모 세포 또한 고려된다.
따라서, 일부 실시양태에서, 효모 세포는 상기 기술된 바와 같은 데사투라제 및 지방 아실-CoA 리덕타제를 발현하고, 이는 추가로 본 섹션에서 기술된 바와 같은 하나 이상의 변형을 포함한다. 특히, 효모 세포는 Cpo_CPRQ (서열 번호: 2), Gmo_CPRQ (서열 번호: 77), 돌연변이체 Cpo_CPRQ, 예컨대, S82 돌연변이체 또는 S85 돌연변이체, 바람직하게, S85 돌연변이체, 예컨대, S85A 돌연변이체, 및 이의 기능성 변이체로부터 선택되는 하나 이상의 데사투라제, 및 Ase_FAR (서열 번호: 10), 돌연변이체 Ase_FAR, 예컨대, T198 돌연변이체 또는 S413 돌연변이체, 바람직하게, T198A 돌연변이체 또는 S413A 돌연변이체, Aip_FAR (서열 번호: 61), Hs_FAR (서열 번호: 71), Has_FAR (서열 번호: 73), Hv_FAR (서열 번호: 75), Har_FAR (서열 번호: 12) 및 이의 기능성 변이체로부터 선택되는 하나 이상의 리덕타제, 및 하나 이상의 변형, 예컨대, 상기 기술된 바와 같이, Hfd1, Hfd2, Hfd3, Hfd4, Fao1 및 Pex10 중 하나 이상의 것의 부분적 또는 전체 기능 상실을 초래하는 돌연변이를 발현할 수 있고/거나, 상기 기술된 바와 같은 하나 이상의 변형된 지방 아실 신타제를 추가로 발현한다. 효모 세포는 Cpo_CPRQ 또는 Gmo_CPRQ, 이의 돌연변이체 또는 기능성 변이체 이외에도 또한 상기 기술된 바와 같은 탄소 쇄 길이가 12인 지방 아실-CoA에 적어도 하나의 이중 결합을 도입할 수 있는 또 다른 데사투라제, 예를 들어, Cpo_NPVE, Cpo_SPTQ, 이의 돌연변이체 또는 기능성 변이체를 발현할 수 있다.
효모 세포는 특히, 이종성 시토크롬 b5의 발현, 이종성 시토크롬 b5 리덕타제의 발현, 헤모글로빈의 발현, 활성의 전체 또는 부분적인 손실을 초래하는 천연 엘롱가제 유전자(들)의 불활성화, 활성의 전체 또는 부분적인 손실을 초래하는 천연 티오에스테라제(들)의 불활성화, 이종성 티오에스테라제 유전자의 발현, 및/또는 지방 아실 신타제 및 티오에스테라제의 융합 단백질의 발현에 의해 본원에 기술된 변형 중 임의의 것으로 추가로 변형될 수 있다.
특히, 효모 세포는 Cpo_CPRQ (서열 번호: 2), Gmo_CPRQ (서열 번호: 77) 돌연변이체 Cpo_CPRQ, 예컨대, S82 돌연변이체 또는 S85 돌연변이체, 바람직하게, S85 돌연변이체, 예컨대, S85A 돌연변이체, 및 이의 기능성 변이체로부터 선택되는 하나 이상의 데사투라제, 및 Ase_FAR (서열 번호: 10), 돌연변이체 Ase_FAR, 예컨대, T198 돌연변이체 또는 S413 돌연변이체, 바람직하게, T198A 돌연변이체 또는 S413A 돌연변이체, Aip_FAR (서열 번호: 61), Hs_FAR (서열 번호: 71), Has_FAR (서열 번호: 73), Hv_FAR (서열 번호: 75), Har_FAR (서열 번호: 12) 및 이의 기능성 변이체로부터 선택되는 하나 이상의 리덕타제를 발현할 수 있고, 이는 HFD1 및 HFD2; HFD1 및 HFD3; HFD1 및 HFD4; HFD1 및 FAO1; HFD1 및 PEX10; HFD2 및 HFD3; HFD2 및 HFD4; HFD2 및 FAO1; HFD2 및 PEX10; HFD3 및 HFD4; HFD3 및 FAO1; HFD3 및 PEX10; HFD4 및 FAO1; HFD4 및 PEX10; FAO1 및 PEX10; HFD1, HFD2 및 HFD3; HFD1, HFD2 및 HFD4; HFD1, HFD2 및 FAO1; HFD1, HFD2 및 PEX10; HFD1, HFD3 및 HFD4; HFD1, HFD3 및 FAO1; HFD1, HFD3 및 PEX10; HFD1, HFD4 및 FAO1; HFD1, HFD4 및 PEX10; HFD1, FAO1 및 PEX10; HFD2, HFD3 및 HFD4; HFD2, HFD3 및 FAO1; HFD2, HFD3 및 PEX10; HFD2, HFD4 및 FAO1; HFD2, HFD4 및 PEX10; HFD2, FAO1 및 PEX10; HFD3, HFD4 및 FAO1; HFD3, HFD4 및 PEX10; HFD3, FAO1 및 PEX10; HFD4, FAO1 및 PEX10; HFD1, HFD2, HFD3 및 HFD4; HFD1, HFD2, HFD3 및 FAO1; HFD1, HFD2, HFD3 및 PEX10; HFD1, HFD2, HFD4 및 FAO1; HFD1, HFD2, HFD4 및 PEX10; HFD1, HFD2, FAO1 및 PEX10; HFD1, HFD3, HFD4 및 FAO1; HFD1, HFD3, HFD4 및 PEX10; HFD1, HFD3, FAO1 및 PEX10; HFD1, HFD4, FAO1 및 PEX10; HFD2, HFD3, HFD4 및 FAO1; HFD2, HFD3, HFD4 및 PEX10; HFD2, HFD3, FAO1 및 PEX10; HFD2, HFD4, FAO1 및 PEX10; HFD3, HFD4, FAO1 및 PEX10; HFD1, HFD2, HFD3, HFD4 및 FAO1; HFD1, HFD2, HFD3, HFD4 및 PEX10; HFD1, HFD3, HFD4, FAO1 및 PEX10; HFD2, HFD3, HFD4, FAO1 및 PEX10; HFD1, HFD2, HFD3, HFD4, FAO1 및 PEX10의 돌연변이, 또는 이와 적어도 60%의 상동성 또는 동일성을 갖는 상응하는 변이체의 상기 언급된 조합을 추가로 포함할 수 있다. 추가로, 효모 세포는 상기 기술된 바와 같은 변형된 지방 아실 신타제, 특히, 돌연변이체 Fas1 및/또는 돌연변이체 Fas2를 추가로 발현할 수 있다. 효모 세포는 Cpo_CPRQ 또는 Gmo_CPRQ, 이의 돌연변이체 또는 기능성 변이체 이외에도 또한 상기 기술된 바와 같은 탄소 쇄 길이가 12인 지방 아실-CoA에 적어도 하나의 이중 결합을 도입할 수 있는 또 다른 데사투라제, 예를 들어, Cpo_NPVE, Cpo_SPTQ, 이의 돌연변이체 또는 기능성 변이체를 발현할 수 있다.
이종성
티오에스테라제의
발현
티오에스테라제, 특히, 이종성 티오에스테라제를 도입함으로써 효모 세포를 추가로 조작하는 것이 유리할 수 있다. 따라서, 일부 실시양태에서, 티오에스테라제를 인코딩하는 핵산은 효모 세포에 예컨대, 벡터 상에 또는 게놈 통합에 의해 도입된다. 티오에스테라제 유전자는 유도성 프로모터의 제어하에 있거나, 또는 구성적 프로모터의 제어하에 있을 수 있다. 티오에스테라제를 인코딩하는 핵산은 당업계에 공지된 바와 같이 효모 세포에 대해 코돈 최적화될 수 있다. 특히, 핵산은 예컨대, 야로위아 리폴리티카 세포와 같은 야로위아 세포에 대해 코돈 최적화될 수 있다. 티오에스테라제는 당업계에 공지된 바와 같이 높은 수준으로 발현될 수 있다.
일부 실시양태에서, 티오에스테라제는 쿠페아 팔루스트리스(Cuphea palustris), 쿠페아 후케리아나(Cuphea hookeriana), 신나모멈 캠포라(Cinnamomum camphora)로부터, 또는 에스케리키아 콜라이(Escherichia coli)로부터 선택되는 유기체로부터 유래된 것이다. 바람직한 실시양태에서, 티오에스테라제는 에스케리키아 콜라이 또는 신나모멈 캠포라로부터 유래된 것이다. 일부 실시양태에서, 티오에스테라제는 서열 번호: 33에 기재된, 쿠페아 팔루스트리스로부터 유래된 티오에스테라제, 서열 번호: 57에 기재된, 쿠페아 후케리아나로부터 유래된 티오에스테라제, 서열 번호: 35에 기재된, 신나모멈 캠포라로부터 유래된 티오에스테라제, 및 서열 번호: 26에 기재된, 에스케리키아 콜라이로부터 유래된 티오에스테라제로부터 선택되는 티오에스테라제와 적어도 60%의 상동성 또는 동일성을 갖는다. 바람직하게, 티오에스테라제는 서열 번호: 35에 기재된, 신나모멈 캠포라로부터 또는 서열 번호: 26에 기재된, 에스케리키아 콜라이로부터 유래된 티오에스테라제와 적어도 60%의 상동성 또는 동일성을 갖는다. 한 실시양태에서, 티오에스테라제는 서열 번호: 35에 기재된, 신나모멈 캠포라로부터 유래된 티오에스테라제와 적어도 60%의 상동성 또는 동일성을 갖는다. 또 다른 실시양태에서, 티오에스테라제는 서열 번호: 26에 기재된, 에스케리키아 콜라이로부터 유래된 티오에스테라제와 적어도 60%의 상동성 또는 동일성을 갖는다.
또 다른 실시양태에서, 티오에스테라제는 서열 번호: 35에 기재된, 신나모멈 캠포라로부터 유래된 티오에스테라제와 적어도 60%의 상동성 또는 동일성, 예컨대, 서열 번호: 35에 기재된, 신나모멈 캠포라로부터 유래된 티오에스테라제와 적어도 61%의 상동성 또는 동일성, 예컨대, 적어도 62%의 상동성 또는 동일성, 예컨대, 적어도 63%의 상동성 또는 동일성, 예컨대, 적어도 64%의 상동성 또는 동일성, 예컨대, 적어도 65%의 상동성 또는 동일성, 예컨대, 적어도 66%의 상동성 또는 동일성, 예컨대, 적어도 67%의 상동성 또는 동일성, 예컨대, 적어도 68%의 상동성 또는 동일성, 예컨대, 적어도 69%의 상동성 또는 동일성, 예컨대, 적어도 70%의 상동성 또는 동일성, 예컨대, 적어도 71%의 상동성 또는 동일성, 예컨대, 적어도 72%, 예컨대, 적어도 73%, 예컨대, 적어도 74%, 예컨대, 적어도 75%, 예컨대, 적어도 76%, 예컨대, 적어도 77%, 예컨대, 적어도 78%, 예컨대, 적어도 79%, 예컨대, 적어도 80%, 예컨대, 적어도 81%, 예컨대, 적어도 82%, 예컨대, 적어도 83%, 예컨대, 적어도 84%, 예컨대, 적어도 85%, 예컨대, 적어도 86%, 예컨대, 적어도 87%, 예컨대, 적어도 88%, 예컨대, 적어도 89%, 예컨대, 적어도 90%, 예컨대, 적어도 91%, 예컨대, 적어도 92%, 예컨대, 적어도 93%, 예컨대, 적어도 94%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%, 예컨대, 100%의 상동성 또는 동일성을 갖는다.
또 다른 실시양태에서, 티오에스테라제는 서열 번호: 26에 기재된, 에스케리키아 콜라이로부터 유래된 티오에스테라제와 적어도 60%의 상동성 또는 동일성, 예컨대, 서열 번호: 26에 기재된, 에스케리키아 콜라이로부터 유래된 티오에스테라제와 적어도 61%의 상동성 또는 동일성, 예컨대, 적어도 62%의 상동성 또는 동일성, 예컨대, 적어도 63%의 상동성 또는 동일성, 예컨대, 적어도 64%의 상동성 또는 동일성, 예컨대, 적어도 65%의 상동성 또는 동일성, 예컨대, 적어도 66%의 상동성 또는 동일성, 예컨대, 적어도 67%의 상동성 또는 동일성, 예컨대, 적어도 68%의 상동성 또는 동일성, 예컨대, 적어도 69%의 상동성 또는 동일성, 예컨대, 적어도 70%의 상동성 또는 동일성, 예컨대, 적어도 71%의 상동성 또는 동일성, 예컨대, 적어도 72%, 예컨대, 적어도 73%, 예컨대, 적어도 74%, 예컨대, 적어도 75%, 예컨대, 적어도 76%, 예컨대, 적어도 77%, 예컨대, 적어도 78%, 예컨대, 적어도 79%, 예컨대, 적어도 80%, 예컨대, 적어도 81%, 예컨대, 적어도 82%, 예컨대, 적어도 83%, 예컨대, 적어도 84%, 예컨대, 적어도 85%, 예컨대, 적어도 86%, 예컨대, 적어도 87%, 예컨대, 적어도 88%, 예컨대, 적어도 89%, 예컨대, 적어도 90%, 예컨대, 적어도 91%, 예컨대, 적어도 92%, 예컨대, 적어도 93%, 예컨대, 적어도 94%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%, 예컨대, 100%의 상동성 또는 동일성을 갖는다.
티오에스테라제를 인코딩하는 핵산은 당업계에 공지된 바와 같이 최적화될 수 있다. 한 실시양태에서, 효모 세포는 야로위아 세포, 바람직하게, 야로위아 리폴리티카 세포이고, 이에 따라 핵산은 코돈 최적화된다.
한 실시양태에서, 적어도 하나의 티오에스테라제는 서열 번호: 34에 기재된, 신나모멈 캠포라로부터 유래된 티오에스테라제를 인코딩하는 핵산과 적어도 60%의 상동성 또는 동일성, 예컨대, 서열 번호: 34에 기재된, 신나모멈 캠포라로부터 유래된 티오에스테라제를 코딩하는 핵산과 적어도 61%의 상동성 또는 동일성, 예컨대, 적어도 62%의 상동성 또는 동일성, 예컨대, 적어도 63%의 상동성 또는 동일성, 예컨대, 적어도 64%의 상동성 또는 동일성, 예컨대, 적어도 65%의 상동성 또는 동일성, 예컨대, 적어도 66%의 상동성 또는 동일성, 예컨대, 적어도 67%의 상동성 또는 동일성, 예컨대, 적어도 68%의 상동성 또는 동일성, 예컨대, 적어도 69%의 상동성 또는 동일성, 예컨대, 적어도 70%의 상동성 또는 동일성, 예컨대, 적어도 71%의 상동성 또는 동일성, 예컨대, 적어도 72%, 예컨대, 적어도 73%, 예컨대, 적어도 74%, 예컨대, 적어도 75%, 예컨대, 적어도 76%, 예컨대, 적어도 77%, 예컨대, 적어도 78%, 예컨대, 적어도 79%, 예컨대, 적어도 80%, 예컨대, 적어도 81%, 예컨대, 적어도 82%, 예컨대, 적어도 83%, 예컨대, 적어도 84%, 예컨대, 적어도 85%, 예컨대, 적어도 86%, 예컨대, 적어도 87%, 예컨대, 적어도 88%, 예컨대, 적어도 89%, 예컨대, 적어도 90%, 예컨대, 적어도 91%, 예컨대, 적어도 92%, 예컨대, 적어도 93%, 예컨대, 적어도 94%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%, 예컨대, 100%의 상동성 또는 동일성을 갖는 핵산에 의해 인코딩된다.
한 실시양태에서, 적어도 하나의 티오에스테라제는 서열 번호: 25에 기재된, 에스케리키아 콜라이로부터 유래된 티오에스테라제를 인코딩하는 핵산과 적어도 60%의 상동성 또는 동일성, 예컨대, 서열 번호: 25에 기재된, 에스케리키아 콜라이로부터 유래된 티오에스테라제를 인코딩하는 핵산과 적어도 61%의 상동성 또는 동일성, 예컨대, 적어도 62%의 상동성 또는 동일성, 예컨대, 적어도 63%의 상동성 또는 동일성, 예컨대, 적어도 64%의 상동성 또는 동일성, 예컨대, 적어도 65%의 상동성 또는 동일성, 예컨대, 적어도 66%의 상동성 또는 동일성, 예컨대, 적어도 67%의 상동성 또는 동일성, 예컨대, 적어도 68%의 상동성 또는 동일성, 예컨대, 적어도 69%의 상동성 또는 동일성, 예컨대, 적어도 70%의 상동성 또는 동일성, 예컨대, 적어도 71%의 상동성 또는 동일성, 예컨대, 적어도 72%, 예컨대, 적어도 73%, 예컨대, 적어도 74%, 예컨대, 적어도 75%, 예컨대, 적어도 76%, 예컨대, 적어도 77%, 예컨대, 적어도 78%, 예컨대, 적어도 79%, 예컨대, 적어도 80%, 예컨대, 적어도 81%, 예컨대, 적어도 82%, 예컨대, 적어도 83%, 예컨대, 적어도 84%, 예컨대, 적어도 85%, 예컨대, 적어도 86%, 예컨대, 적어도 87%, 예컨대, 적어도 88%, 예컨대, 적어도 89%, 예컨대, 적어도 90%, 예컨대, 적어도 91%, 예컨대, 적어도 92%, 예컨대, 적어도 93%, 예컨대, 적어도 94%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%, 예컨대, 100%의 상동성 또는 동일성을 갖는 핵산에 의해 인코딩된다.
따라서, 일부 실시양태에서, 효모 세포는 상기 기술된 바와 같은 데사투라제 및 지방 아실-CoA 리덕타제를 발현하고, 이는 추가로 본원에 기술된 바와 같은, 하나 이상의 티오에스테라제, 예컨대, 하나 이상의 이종성 티오에스테라제를 추가로 발현한다. 특히, 효모 세포는 Cpo_CPRQ (서열 번호: 2), Gmo_CPRQ (서열 번호: 77), 돌연변이체 Cpo_CPRQ, 예컨대, S82 돌연변이체 또는 S85 돌연변이체, 바람직하게, S85 돌연변이체, 예컨대, S85A 돌연변이체, 및 이의 기능성 변이체로부터 선택되는 하나 이상의 데사투라제, 및 Ase_FAR (서열 번호: 10), 돌연변이체 Ase_FAR, 예컨대, T198 돌연변이체 또는 S413 돌연변이체, 바람직하게, T198A 돌연변이체 또는 S413A 돌연변이체, Aip_FAR (서열 번호: 61), Hs_FAR (서열 번호: 71), Has_FAR (서열 번호: 73), Hv_FAR (서열 번호: 75), Har_FAR (서열 번호. 4) 및 이의 기능성 변이체로부터 선택되는 하나 이상의 리덕타제, 및 하나 이상의 이종성 티오에스테라제, 예컨대, 서열 번호: 33, 서열 번호: 57, 서열 번호: 35 및/또는 서열 번호: 26에 기재된 티오에스테라제, 또는 이의 기능성 변이체를 발현할 수 있다. 효모 세포는 Cpo_CPRQ 또는 Gmo_CPRQ, 이의 돌연변이체 또는 기능성 변이체 이외에도 또한 상기 기술된 바와 같은 탄소 쇄 길이가 12인 지방 아실-CoA에 적어도 하나의 이중 결합을 도입할 수 있는 또 다른 데사투라제, 예를 들어, Cpo_NPVE, Cpo_SPTQ, 이의 돌연변이체 또는 기능성 변이체를 발현할 수 있다.
효모 세포는 본원 상기에서 기술된 바와 같이, 특히, 이종성 시토크롬 b5의 발현, 이종성 시토크롬 b5 리덕타제의 발현, 헤모글로빈의 발현, 활성의 전체 또는 부분적인 손실을 초래하는 천연 엘롱가제 유전자(들)의 돌연변이, 활성의 전체 또는 부분적인 손실을 초래하는 천연 티오에스테라제(들)의 돌연변이, 지방 알데히드 데히드로게나제(들), 지방 알콜 옥시다제(들), 퍼옥시좀 생물발생 인자 및/또는 지방 아실 신타제(들)를 코딩하는 천연 유전자(들)의 돌연변이, 및/또는 지방 아실 신타제 및 티오에스테라제의 융합 단백질의 발현에 의해 본원에 기술된 변형 중 임의의 것으로 추가로 변형될 수 있다.
지방 아실
신타제
및
티오에스테라제의
융합 단백질의 발현
일부 실시양태에서, 효모 세포는 말단절단된 지방 아실 신타제 및 말단절단된 티오에스테라제의 융합 단백질, 예컨대, 서열 번호: 59에 기재된 융합 단백질, 또는 이와 적어도 60%의 상동성 또는 동일성을 갖는, 이의 동족체를 추가로 발현한다. 상기 융합 단백질은 Y. 리폴리티카로부터의 Fas1의 말단절단된 버전 및 E. 콜라이(E. coli)로부터의 티오에스테라제 TesA의 말단절단된 버전의 융합물이다. 이는 예컨대, 서열 번호: 58에 기재된 핵산의 도입에 의해 발현될 수 있다. 융합 단백질은 높은 수준으로 발현될 수 있다.
따라서, 일부 실시양태에서, 효모 세포는 서열 번호: 59에 기재된 융합 단백질, 또는 이와 적어도 60%의 상동성 또는 동일성, 예컨대, 서열 번호: 59와 적어도 61%의 상동성 또는 동일성, 예컨대, 적어도 62%의 상동성 또는 동일성, 예컨대, 적어도 63%의 상동성 또는 동일성, 예컨대, 적어도 64%의 상동성 또는 동일성, 예컨대, 적어도 65%의 상동성 또는 동일성, 예컨대, 적어도 66%의 상동성 또는 동일성, 예컨대, 적어도 67%의 상동성 또는 동일성, 예컨대, 적어도 68%의 상동성 또는 동일성, 예컨대, 적어도 69%의 상동성 또는 동일성, 예컨대, 적어도 70%의 상동성 또는 동일성, 예컨대, 적어도 71%의 상동성 또는 동일성, 예컨대, 적어도 72%, 예컨대, 적어도 73%, 예컨대, 적어도 74%, 예컨대, 적어도 75%, 예컨대, 적어도 76%, 예컨대, 적어도 77%, 예컨대, 적어도 78%, 예컨대, 적어도 79%, 예컨대, 적어도 80%, 예컨대, 적어도 81%, 예컨대, 적어도 82%, 예컨대, 적어도 83%, 예컨대, 적어도 84%, 예컨대, 적어도 85%, 예컨대, 적어도 86%, 예컨대, 적어도 87%, 예컨대, 적어도 88%, 예컨대, 적어도 89%, 예컨대, 적어도 90%, 예컨대, 적어도 91%, 예컨대, 적어도 92%, 예컨대, 적어도 93%, 예컨대, 적어도 94%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%의 상동성 또는 동일성을 갖는, 이의 동족체를 추가로 발현한다.
일부 실시양태에서, 효모 세포는 상기 융합 단백질을 인코딩하는 핵산, 예컨대, 서열 번호: 58에 기재된 핵산, 또는 이와 적어도 60%의 상동성 또는 동일성, 예컨대, 서열 번호: 58과 적어도 61%의 상동성 또는 동일성, 예컨대, 적어도 62%의 상동성 또는 동일성, 예컨대, 적어도 63%의 상동성 또는 동일성, 예컨대, 적어도 64%의 상동성 또는 동일성, 예컨대, 적어도 65%의 상동성 또는 동일성, 예컨대, 적어도 66%의 상동성 또는 동일성, 예컨대, 적어도 67%의 상동성 또는 동일성, 예컨대, 적어도 68%의 상동성 또는 동일성, 예컨대, 적어도 69%의 상동성 또는 동일성, 예컨대, 적어도 70%의 상동성 또는 동일성, 예컨대, 적어도 71%의 상동성 또는 동일성, 예컨대, 적어도 72%, 예컨대, 적어도 73%, 예컨대, 적어도 74%, 예컨대, 적어도 75%, 예컨대, 적어도 76%, 예컨대, 적어도 77%, 예컨대, 적어도 78%, 예컨대, 적어도 79%, 예컨대, 적어도 80%, 예컨대, 적어도 81%, 예컨대, 적어도 82%, 예컨대, 적어도 83%, 예컨대, 적어도 84%, 예컨대, 적어도 85%, 예컨대, 적어도 86%, 예컨대, 적어도 87%, 예컨대, 적어도 88%, 예컨대, 적어도 89%, 예컨대, 적어도 90%, 예컨대, 적어도 91%, 예컨대, 적어도 92%, 예컨대, 적어도 93%, 예컨대, 적어도 94%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%의 상동성 또는 동일성을 갖는, 이의 동족체를 포함한다.
따라서, 일부 실시양태에서, 효모 세포는 상기 기술된 바와 같은 데사투라제 및 지방 아실-CoA 리덕타제를 발현하고, 이는 추가로 말단절단된 지방 아실 신타제 및 말단절단된 티오에스테라제의 융합 단백질, 예컨대, 서열 번호: 59에 기재된 융합 단백질을 추가로 발현한다. 특히, 효모 세포는 Cpo_CPRQ (서열 번호: 2), 돌연변이체 Cpo_CPRQ, 예컨대, S82 돌연변이체 또는 S85 돌연변이체, 바람직하게, S85 돌연변이체, 예컨대, S85A 돌연변이체, 및 이의 기능성 변이체로부터 선택되는 하나 이상의 데사투라제, 및 Ase_FAR (서열 번호: 10), 돌연변이체 Ase_FAR, 예컨대, T198 돌연변이체 또는 S413 돌연변이체, 바람직하게, T198A 돌연변이체 또는 S413A 돌연변이체, Aip_FAR (서열 번호: 61), Hs_FAR (서열 번호: 71), Has_FAR (서열 번호: 73), Hv_FAR (서열 번호: 75), Har_FAR (서열 번호: 12) 및 이의 기능성 변이체로부터 선택되는 하나 이상의 리덕타제, 및 말단절단된 지방 아실 신타제 및 말단절단된 티오에스테라제의 융합 단백질, 예컨대, 서열 번호: 59에 기재된 융합 단백질 또는 이의 기능성 변이체를 발현할 수 있다. 효모 세포는 Cpo_CPRQ 또는 Gmo_CPRQ, 이의 돌연변이체 또는 기능성 변이체 이외에도 또한 상기 기술된 바와 같은 탄소 쇄 길이가 12인 지방 아실-CoA에 적어도 하나의 이중 결합을 도입할 수 있는 또 다른 데사투라제, 예를 들어, Cpo_NPVE, Cpo_SPTQ, 이의 돌연변이체 또는 기능성 변이체를 발현할 수 있다.
효모 세포는 본원 상기에서 기술된 바와 같이, 특히, 이종성 시토크롬의 발현, 이종성 시토크롬 b5 리덕타제의 발현, 헤모글로빈의 발현, 활성의 전체 또는 부분적인 손실을 초래하는 천연 엘롱가제 유전자(들)의 돌연변이, 활성의 전체 또는 부분적인 손실을 초래하는 천연 티오에스테라제 유전자(들)의 돌연변이, 지방 알데히드 데히드로게나제(들), 지방 알콜 옥시다제(들), 퍼옥시좀 생물발생 인자 및/또는 지방 아실 신타제(들)를 코딩하는 천연 유전자(들)의 돌연변이, 및/또는 이종성 티오에스테라제 유전자의 발현에 의해 본원에 기술된 변형 중 임의의 것으로 추가로 변형될 수 있다.
역가
본원에 개시된 효모 세포는 적어도 0.2 mg/L의 역가로 E8,E10-도데카디엔-1-올을 생산할 수 있다. 일부 실시양태에서, E8,E10-도데카디엔-1-올의 역가는 적어도 0.25 mg/L, 예컨대, 적어도 0.3 mg/L, 예컨대, 적어도 0.4 mg/L, 예컨대, 적어도 0.5 mg/L, 예컨대, 적어도 0.75 mg/L, 예컨대, 적어도 1 mg/L, 예컨대, 적어도 1.5 mg/L, 예컨대, 적어도 2.5 mg/L, 예컨대, 적어도 5.0 mg/L, 예컨대, 적어도 10 mg/L, 예컨대, 적어도 15 mg/L, 예컨대, 적어도 20 mg/L, 예컨대, 25 mg/L, 예컨대, 적어도 50 mg/L, 예컨대, 적어도 100 mg/L, 예컨대, 적어도 250 mg/L, 예컨대, 적어도 500 mg/L, 예컨대, 적어도 750 mg/L, 예컨대, 적어도 1 g/L, 예컨대, 적어도 2 g/L, 예컨대, 적어도 3 g/L, 예컨대, 적어도 4 g/L, 예컨대, 적어도 5 g/L, 예컨대, 적어도 6 g/L, 예컨대, 적어도 7 g/L, 예컨대, 적어도 8 g/L, 예컨대, 적어도 9 g/L, 예컨대, 적어도 10 g/L 이상이다.
역가를 측정하는 방법은 당업계에 공지되어 있다.
E8,E10
-
도데카디에닐
아세테이트 생산
코들레몬은 E8,E10-도데카디에닐 아세테이트로 추가로 전환될 수 있고; 이는 생체외에서 당업계에 공지된 바와 같이, 예컨대, 화학적 전환에 의해 수행될 수 있거나, 또는 생체내에서 세포에 의해 생산된 E8,E10-도데카디엔-1-올의 적어도 일부를 E8,E10-도데카디에닐 아세테이트로 전환시킬 수 있는 아세틸트랜스퍼라제 (EC 2.3.1.84)의 작용에 의해 수행될 수 있다.
따라서, 일부 실시양태에서, 효모 세포는, 효모 세포가 천연 아세틸트랜스퍼라제를 과다발현하도록 및/또는 임의로, 높은 수준으로 발현되는 이종성 아세틸트랜스퍼라제를 발현하도록 조작된다. 상기 실시양태에서, 효모 세포는 E8,E10-도데카디엔-1-올 및 E8,E10-도데카디에닐 아세테이트를 생산할 수 있다.
일부 실시양태에서, 효모 세포는 세포에 의해 생산된 E8,E10-도데카디엔-1-올의 적어도 일부를 E8,E10-도데카디에닐 아세테이트로 전환시킬 수 있는 아세틸트랜스퍼라제, 예컨대, Sc_Atf1 아세틸트랜스퍼라제 (서열 번호: 37), 또는 이와 적어도 60%의 상동성 또는 동일성, 예컨대, 서열 번호: 37과 적어도 61%의 상동성 또는 동일성, 예컨대, 적어도 62%의 상동성 또는 동일성, 예컨대, 적어도 63%의 상동성 또는 동일성, 예컨대, 적어도 64%의 상동성 또는 동일성, 예컨대, 적어도 65%의 상동성 또는 동일성, 예컨대, 적어도 66%의 상동성 또는 동일성, 예컨대, 적어도 67%의 상동성 또는 동일성, 예컨대, 적어도 68%의 상동성 또는 동일성, 예컨대, 적어도 69%의 상동성 또는 동일성, 예컨대, 적어도 70%의 상동성 또는 동일성, 예컨대, 적어도 71%의 상동성 또는 동일성, 예컨대, 적어도 72%, 예컨대, 적어도 73%, 예컨대, 적어도 74%, 예컨대, 적어도 75%, 예컨대, 적어도 76%, 예컨대, 적어도 77%, 예컨대, 적어도 78%, 예컨대, 적어도 79%, 예컨대, 적어도 80%, 예컨대, 적어도 81%, 예컨대, 적어도 82%, 예컨대, 적어도 83%, 예컨대, 적어도 84%, 예컨대, 적어도 85%, 예컨대, 적어도 86%, 예컨대, 적어도 87%, 예컨대, 적어도 88%, 예컨대, 적어도 89%, 예컨대, 적어도 90%, 예컨대, 적어도 91%, 예컨대, 적어도 92%, 예컨대, 적어도 93%, 예컨대, 적어도 94%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%의 상동성 또는 동일성을 갖는, 이의 동족체를 발현한다.
아세틸트랜스퍼라제의 발현은 효모 세포에서의 발현을 위해 코돈 최적화될 수 있는 핵산, 예컨대, 서열 번호: 36에 기재된 핵산, 또는 이와 적어도 60%의 상동성 또는 동일성, 예컨대, 서열 번호: 36과 적어도 61%의 상동성 또는 동일성, 예컨대, 적어도 62%의 상동성 또는 동일성, 예컨대, 적어도 63%의 상동성 또는 동일성, 예컨대, 적어도 64%의 상동성 또는 동일성, 예컨대, 적어도 65%의 상동성 또는 동일성, 예컨대, 적어도 66%의 상동성 또는 동일성, 예컨대, 적어도 67%의 상동성 또는 동일성, 예컨대, 적어도 68%의 상동성 또는 동일성, 예컨대, 적어도 69%의 상동성 또는 동일성, 예컨대, 적어도 70%의 상동성 또는 동일성, 예컨대, 적어도 71%의 상동성 또는 동일성, 예컨대, 적어도 72%, 예컨대, 적어도 73%, 예컨대, 적어도 74%, 예컨대, 적어도 75%, 예컨대, 적어도 76%, 예컨대, 적어도 77%, 예컨대, 적어도 78%, 예컨대, 적어도 79%, 예컨대, 적어도 80%, 예컨대, 적어도 81%, 예컨대, 적어도 82%, 예컨대, 적어도 83%, 예컨대, 적어도 84%, 예컨대, 적어도 85%, 예컨대, 적어도 86%, 예컨대, 적어도 87%, 예컨대, 적어도 88%, 예컨대, 적어도 89%, 예컨대, 적어도 90%, 예컨대, 적어도 91%, 예컨대, 적어도 92%, 예컨대, 적어도 93%, 예컨대, 적어도 94%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%의 상동성 또는 동일성을 갖는, 이의 동족체를 도입함으로써 달성될 수 있다.
따라서, 일부 실시양태에서, 효모 세포는 본원 상기에서 기술된 바와 같은 이종성 데사투라제, 본원 상기에서 기술된 바와 같은 이종성 지방 아실 리덕타제, 및 임의로, 상기 기술된 추가 변형 중 임의의 것을 발현하고, 생산된 E8,E10-도데카디엔-1-올의 적어도 일부를 E8,E10-도데카디에닐 아세테이트로 전환시킬 수 있는 아세틸트랜스퍼라제 또한 발현한다.
따라서, 본원에 개시된 효모 세포는 적어도 0.2 mg/L의 역가로 E8,E10-도데카디에닐 아세테이트를 생산할 수 있다. 일부 실시양태에서, E8,E10-도데카디에닐 아세테이트의 역가는 적어도 0.25 mg/L, 예컨대, 적어도 0.3 mg/L, 예컨대, 적어도 0.4 mg/L, 예컨대, 적어도 0.5 mg/L, 예컨대, 적어도 0.75 mg/L, 예컨대, 적어도 1 mg/L, 예컨대, 적어도 1.5 mg/L, 예컨대, 적어도 2.5 mg/L, 예컨대, 적어도 5.0 mg/L, 예컨대, 적어도 10 mg/L, 예컨대, 적어도 15 mg/L, 예컨대, 적어도 20 mg/L, 예컨대, 25 mg/L, 예컨대, 적어도 50 mg/L, 예컨대, 적어도 100 mg/L, 예컨대, 적어도 250 mg/L, 예컨대, 적어도 500 mg/L, 예컨대, 적어도 750 mg/L, 예컨대, 적어도 1 g/L, 예컨대, 적어도 2 g/L, 예컨대, 적어도 3 g/L, 예컨대, 적어도 4 g/L, 예컨대, 적어도 5 g/L, 예컨대, 적어도 6 g/L, 예컨대, 적어도 7 g/L, 예컨대, 적어도 8 g/L, 예컨대, 적어도 9 g/L, 예컨대, 적어도 10 g/L 이상이다.
역가를 측정하는 방법은 당업계에 공지되어 있다.
E8,E10
-
도데카디에날
생산
세포에 의해 생산된 E8,E10-도데카디엔-1-올의 적어도 일부를 E8,E10-도데카디에날로 추가로 전환시키는 것 또한 관심의 대상이 될 수 있다. 이는 화학적 변환에 의해, 또는 효모 세포 추가 조작에 의해 수행될 수 있다.
일부 실시양태에서, 효모 세포는, 효모 세포가 E8,E10-도데카디엔-1-올의 적어도 일부를 E8,E10-도데카디에날로 전환시킬 수 있도록 추가로 조작될 수 있다. 이는 효모 세포가 E8,E10-도데카디엔-1-올의 적어도 일부를 E8,E10-도데카디에날로 전환시킬 수 있는 알데히드 형성 지방 아실-CoA 리덕타제 (EC 1.2.1.50), 알콜 데히드로게나제 (EC 1.1.1.2) 및/또는 지방 알콜 옥시다제 (EC 1.1.3.20)를 추가 발현하도록 효모 세포를 조작함으로써 수행될 수 있다. 상기 실시양태에서, 효모 세포는 E8,E10-도데카디엔-1-올 및 E8,E10-도데카디에날을 생산할 수 있다.
따라서, E8,E10-도데카디엔-1-올의 적어도 일부를 E8,E10-도데카디에날로 전환시킬 수 있는 알데히드 형성 지방 아실-CoA 리덕타제 (EC 1.2.1.50), 알콜 데히드로게나제 (EC 1.1.1.2) 및/또는 지방 알콜 옥시다제 (EC 1.1.3.20)를 인코딩하는 핵산이 효모 세포에 도입될 수 있다. 핵산은 코돈 최적화될 수 있고, 높은 수준으로 발현될 수 있다.
따라서, 일부 실시양태에서, 효모 세포는 본원 상기에서 기술된 바와 같은 이종성 데사투라제, 본원 상기에서 기술된 바와 같은 이종성 지방 아실 리덕타제, 및 임의로, 상기 기술된 추가 변형 중 임의의 것을 발현하고, E8,E10-도데카디엔-1-올의 적어도 일부를 E8,E10-도데카디에날로 전환시킬 수 있는 알데히드 형성 지방 아실-CoA 리덕타제 (EC 1.2.1.50), 알콜 데히드로게나제 (EC 1.1.1.2) 및/또는 지방 알콜 옥시다제 (EC 1.1.3.20) 또한 발현한다.
따라서, 본원에 개시된 효모 세포는 적어도 0.2 mg/L의 역가로 E8,E10-도데카디에날를 생산할 수 있다. 일부 실시양태에서, E8,E10-도데카디에날의 역가는 적어도 0.25 mg/L, 예컨대, 적어도 0.3 mg/L, 예컨대, 적어도 0.4 mg/L, 예컨대, 적어도 0.5 mg/L, 예컨대, 적어도 0.75 mg/L, 예컨대, 적어도 1 mg/L, 예컨대, 적어도 1.5 mg/L, 예컨대, 적어도 2.5 mg/L, 예컨대, 적어도 5.0 mg/L, 예컨대, 적어도 10 mg/L, 예컨대, 적어도 15 mg/L, 예컨대, 적어도 20 mg/L, 예컨대, 25 mg/L, 예컨대, 적어도 50 mg/L, 예컨대, 적어도 100 mg/L, 예컨대, 적어도 250 mg/L, 예컨대, 적어도 500 mg/L, 예컨대, 적어도 750 mg/L, 예컨대, 적어도 1 g/L, 예컨대, 적어도 2 g/L, 예컨대, 적어도 3 g/L, 예컨대, 적어도 4 g/L, 예컨대, 적어도 5 g/L, 예컨대, 적어도 6 g/L, 예컨대, 적어도 7 g/L, 예컨대, 적어도 8 g/L, 예컨대, 적어도 9 g/L, 예컨대, 적어도 10 g/L 이상이다.
역가를 측정하는 방법은 당업계에 공지되어 있다.
쇄 단축
일부 실시양태에서, 효모 세포는 쇄 단축에 의해 주어진 쇄 길이의 지방 아실-CoA의 이용가능성을 증가시키기 위해 추가로 변형된다. 이론에 얽매이지 않고, 상기 변형은 원하는 탄소 쇄 길이를 갖는, 특히, 탄소 쇄 길이가 12인 기질의 이용가능성을 증가시킬 것으로 예상되며, 이를 통해 E8,E10-도데카디에닐 코엔자임 A 및 임의로, E8,E10-도데카디엔-1-올의 생산, 및 임의로, E8,E10-도데카디에닐 아세테이트 및 E8,E10-도데카디에날의 생산은 증가될 수 있다. 이는 미생물 생산 세포에서 천연 아실-CoA 옥시다제의 활성을 감소시킴으로써, 및 특정 아실-CoA 옥시다제, 데사투라제, 리덕타제, 및 아세틸트랜스퍼라제를 발현시킴으로써 달성될 수 있다. 상기 변형은 (동일한 출원인에 의해 2019년 2월 19일 출원된) EP 19157910.1에 상세하게 기술되어 있다.
따라서, 일부 실시양태에서, 효모 세포는 본원 상기에 기술된 효모 세포 중 임의의 것이고, 추가로
i) 하나 이상의 천연 아실-CoA 옥시다제의 활성을 감소시키는 하나 이상의 돌연변이를 갖고;
ii) 지방 아실-CoA를 산화시킬 수 있는 적어도 하나의 아실-CoA 옥시다제를 포함하는 적어도 하나의 효소 군을 발현하고, 여기서, 효소 군은 제1 탄소 쇄 길이가 X인 지방 아실-CoA를 제2 탄소 쇄 길이 X'인 단축된 지방 아실-CoA로 단축시킬 수 있다 (여기서, X' ≤ X-2).
상기 실시양태에서, 일반적으로 효모 세포에 존재하는 아실-CoA 옥시다제, 즉, 천연 효소(들)의 활성은 세포에서 상기 효소(들)를 인코딩하는 유전자를 돌연변이화시킴으로써 감소 또는 제거된다. 탄소 쇄 단축을 유도하여 탄소 쇄 길이의 지방 알콜 및 이의 유도체를 수득하기 위해, 하나 이상의 아실-CoA 옥시다제가 효모 세포에서 발현된다. 상기 아실-coA 옥시다제는 효모 세포에 고유한 것일 수 있거나, 또는 또 다른 유기체로부터 유래된 것일 수 있다. 주어진 쇄 길이의 지방 아실-CoA를 산화시키는 데 요구되는 다른 효소를 인코딩하는 유전자는, 세포가 그를 이미 발현하지 않은 경우, 또는 활성 증가 또는 기질 특이성이 요구되는 경우에 이 또한 세포에 도입될 수 있다. 이렇게 발현된 아실-CoA 옥시다제(들)를 통해 지방 아실-CoA는 산화될 수 있고, 탄소 쇄 길이가 상기 기질보다 더 짧은 지방 아실-CoA로 단축될 수 있다. 따라서, 일부 실시양태에서, 하나 이상의 천연 아실-CoA 옥시다제의 활성 감소는 탄소 쇄 길이가 X보다 짧은, 예컨대, X'보다 짧은 아실-CoA에 대한 활성 감소이다.
본 개시내용에서 아실-CoA 옥시다제라는 용어는 하기 반응을 촉매화할 수 있는 효소, 예컨대, EC 번호 1.3.3.6인 효소를 지칭한다:
아실-CoA + O2 ↔ 트랜스-2,3-데히드로아실-CoA + H2O2.
상기 효소는 옥시도리덕타제 패밀리, 구체적으로, 산소를 수용자로 사용하여 공여자의 CH-CH 기에 작용하는 것에 속하는 것이다. 상기 효소 부류의 계통명은 아실-CoA:산소 2-옥시도리덕타제이다. 사용되는 다른 명칭으로는 지방 아실-CoA 옥시다제, 아실 코엔자임 A 옥시다제, 및 지방 아실-코엔자임 A 옥시다제를 포함한다.
본 개시내용의 효모 세포는 하나 이상의 천연 아실-CoA 옥시다제를 갖는 효모 세포로부터 출발하여 조작될 수 있다. 본원에 개시된 변형된 효모 세포는 바람직하게 상기 하나 이상의 천연 아실-CoA 옥시다제의 감소된 활성을 갖고; 이는 이의 천연 아실-CoA 옥시다제 중 적어도 하나의 활성을 감소시키는 하나 이상의 돌연변이를 갖는 효모 세포를 사용함으로써 달성될 수 있다. 천연 아실-CoA 옥시다제는 퍼옥시좀, 미토콘드리아 또는 세포질 아실-CoA 옥시다제일 수 있다. 일부 실시양태에서, 하나 이상의 돌연변이는 모든 천연 아실-CoA 옥시다제의 활성을 감소시킨다. 활성 감소는, 상기 돌연변이에 기인하여 효모 세포가 상기 반응을 촉매화할 수 있는 능력, 특히, 아실-CoA를 상응하는 트랜스-2,3-데히드로아실-CoA로 전환시킬 수 있는 능력이 감소되었다는 것으로 이해되어야 한다. 일부 실시양태에서, "능력 감소"는 상기 반응을 촉매화할 수 있는 능력이 완전히 또는 부분적으로 제거되었다는 것을 의미한다. 일부 실시양태에서, "능력 감소"는 반응을 촉매화할 수 있는 능력이 일반적인 상황, 즉, 일반적인 능력을 갖는 효소를 사용함으로써 반응에 사용될 수 있는 기질의 서브군으로 제한된다는 것을 의미한다.
본 개시내용의 효모 세포는 지방 아실-CoA를 산화시킬 수 있는 적어도 하나의 아실-CoA 옥시다제를 포함하는 적어도 하나의 효소 군을 발현할 수 있다. 효소 군은 적어도 하나의 아실-CoA 옥시다제 이외에도, 주어진 탄소 쇄 길이의 지방 아실-CoA를 더 짧은 탄소 쇄 길이의 지방 아실-CoA로 전환시키는 데 요구되는 다른 효소도 포함한다. 이들 다른 효소는 바람직하게, 효모 세포에 고유한 것일 수 있고; 상기 실시양태에서, 효모 세포가 효소 군을 발현하는 데 아실-CoA 옥시다제를 코딩하는 유전자 도입만이 요구된다.
아실-CoA 옥시다제가 효모 세포에 고유한 것인 실시양태에서, 상기 아실-CoA 옥시다제는 당업계에 공지된 바와 같이, 예컨대, 프로모터, 예컨대, 구성적 또는 유도성 프로모터, 또는 아실-CoA 옥시다제의 과다발현을 가능하게 하는 프로모터의 도입에 의해 변형될 수 있다. 제1 효소 군에 재도입된 천연 아실-CoA 옥시다제는 활성이 변형된, 예컨대, 기질 특이성이 변형되고/거나, 활성이 변형된, 예컨대, 반응 효율이 증가된 돌연변이화된 버전일 수 있다.
다른 실시양태에서, 아실-CoA 옥시다제는 또 다른 유기체로부터 유래된 것이다. 제1 효소 군에 포함된 아실-CoA는 효모, 진균, 곤충, 포유동물, 조류 또는 식물로부터 유래된 아실-CoA 옥시다제일 수 있고, 예컨대, 제1 효소 군의 적어도 하나의 아실-CoA 옥시다제는 효모, 진균, 곤충, 포유동물, 조류 또는 식물로부터 유래된 것이다. 예를 들어, 아실-CoA 옥시다제는 야로위아, 사카로마이세스, 아그로티스, 아라비돕시스(Arabidopsis), 아스페르길루스(Aspergillus), 쿠쿠르비타(Cucurbita), 호모(Homo), 파에나트로박터(Paenarthrobacter) 및 라투스(Rattus) 로부터 선택되는 속의 유기체로부터 유래된 것이고, 예컨대, 제1 효소 군의 적어도 하나의 아실-CoA 옥시다제는 야로위아, 사카로마이세스, 아그로티스, 아라비돕시스 , 아스페르길루스, 쿠쿠르비타, 호모, 파에나트로박터, 및 라투스로부터 선택되는 속의 유기체로부터 유래된 것이다. 일부 실시양태에서, 적어도 하나의 제1 효소 군은 야로위아 리폴리티카, 사카로마이세스 세레비지아에, 아그로티스 세게툼, 아라비돕시스 탈리아나(Arabidopsis thaliana), 아스페르길루스 니둘란스(Aspergillus nidulans), 쿠쿠르비타 막시마(Cucurbita maxima), 호모 사피엔스(Homo sapiens), 파에나트로박터 우레아파키엔스(Paenarthrobacter ureafaciens) 또는 라투스 노르베기쿠스(Rattus norvegicus)로부터 유래된 아실-CoA 옥시다제를 포함한다.
상기와 같이 효모 세포에 도입된 아실-CoA 옥시다제는 야로위아 리폴리티카, 아그로티스 세게툼, 아라비돕시스 탈리아나, 아스페르길루스 니둘란스, 쿠쿠르비타 막시마, 호모 사피엔스, 파에나트로박터 우레아파키엔스 또는 라투스 노르베기쿠스에 고유한 아실-CoA 옥시다제일 수 있다. 효모 세포는 본원 상기에서 기술된 바와 같을 수 있다.
따라서, 본 개시내용의 효모 세포는 지방 아실-CoA를 산화시킬 수 있는 적어도 하나의 아실-CoA 옥시다제를 포함하는 적어도 하나의 효소 군을 발현할 수 있고, 여기서, 상기 적어도 하나의 아실-CoA 옥시다제는 군 Yli_POX1 (XP_504703), Yli_POX2 (XP_505264), Yli_POX3 (XP_503244), Yli_POX4 (XP_504475), Yli_POX5 (XP_502199), Yli_POX6 (XP_503632), Ase_POX (서열 번호: 39), Ath_POX1 (서열 번호: 41), Ath_POX2 (서열 번호: 43), Ani_POX (서열 번호: 45), Cma_POX (서열 번호: 47), Hsa_POX1-2 (서열 번호: 49), Pur_POX (서열 번호: 51), Sc_POX1 (서열 번호: 31) 및 Rno_POX2 (서열 번호: 53), 또는 이와 적어도 60%의 상동성 또는 동일성, 예컨대, 이와 적어도 65%, 예컨대, 적어도 70%, 예컨대, 적어도 75%, 예컨대, 적어도 80%, 예컨대, 적어도 81%, 예컨대, 적어도 82%, 예컨대, 적어도 83%, 예컨대, 적어도 84%, 예컨대, 적어도 85%, 예컨대, 적어도 86%, 예컨대, 적어도 87%, 예컨대, 적어도 88%, 예컨대, 적어도 89%, 예컨대, 적어도 90%, 예컨대, 적어도 91%, 예컨대, 적어도 92%, 예컨대, 적어도 93%, 예컨대, 적어도 94%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%의 상동성 또는 동일성을 갖는, 이의 기능성 변이체로부터 선택된다.
일부 실시양태에서, 적어도 하나의 아실-CoA 옥시다제의 발현은 상기 적어도 하나의 아실-CoA 옥시다제를 인코딩하는 핵산을 도입함으로써 달성된다. 예를 들어, 효모는 Yli_POX1을 코딩하는 YALI0_E32835g, Yli_POX2를 인코딩하는 YALI0_F10857g, Yli_POX3을 인코딩하는 YALI0_D24750g, Yli_POX4를 인코딩하는 YALI0_E27654g, Yli_POX5를 인코딩하는 YALI0_C23859g, Yli_POX6을 인코딩하는 YALI0_E06567g, Ase_POX를 인코딩하는 서열 번호: 38, Ath_POX1을 인코딩하는 서열 번호: 40, Ath_POX2를 인코딩하는 서열 번호: 42, Ani_POX를 인코딩하는 서열 번호: 44, Cma_POX를 인코딩하는 서열 번호: 46, Hsa_POX를 인코딩하는 서열 번호: 48, Pur_POX를 인코딩하는 서열 번호: 50, Sc_POX1을 인코딩하는 서열 번호: 30, 또는 Rno_POX2를 인코딩하는 서열 번호: 52, 또는 이와 적어도 60%의 상동성 또는 동일성, 예컨대, 이와 적어도 65%, 예컨대, 적어도 70%, 예컨대, 적어도 75%, 예컨대, 적어도 80%, 예컨대, 적어도 81%, 예컨대, 적어도 82%, 예컨대, 적어도 83%, 예컨대, 적어도 84%, 예컨대, 적어도 85%, 예컨대, 적어도 86%, 예컨대, 적어도 87%, 예컨대, 적어도 88%, 예컨대, 적어도 89%, 예컨대, 적어도 90%, 예컨대, 적어도 91%, 예컨대, 적어도 92%, 예컨대, 적어도 93%, 예컨대, 적어도 94%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%의 상동성 또는 동일성을 갖는, 이의 동족체를 발현한다.
일부 실시양태에서, X'=12이다.
적합한 아실-CoA 옥시다제는 (동일한 출원인에 의해 2020년 2월 10일 출원된) WO 2020/169389에, 특히, "아실-CoA 옥시다제" 섹션에 상세하게 기술되어 있다.
E8,E10-도데카디에닐 코엔자임 A 및 임의로, 코들레몬을 수득하기 위해, 쇄 단축이 이용되는 실시양태에서, 따라서, 효모 세포는 적어도 하나의 효소 군 이외에도 또한 탄소 쇄 길이가 X 또는 X'인 지방 아실-CoA에 E/Z 입체형태로 적어도 하나의 이중 결합을 도입할 수 있는 추가의 이종성 데사투라제도 발현할 수 있다. X 또는 X'는 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21 또는 22개의 탄소 원자일 수 있다. 일부 실시양태에서, 데사투라제는 쇄 길이가 X'인 지방 아실-CoA에 E/Z 입체형태로 적어도 하나의 이중 결합을 도입할 수 있고, 여기서, X'는 상기 정의된 바와 같다. 적합한 데사투라제는 (동일한 출원인에 의해 2020년 2월 10일 출원된) WO 2020/169389에, 특히, "데사투라제 (FAD)" 섹션에 상세하게 기술되어 있다. 특히, C14:CoA를 Z11-C14:CoA 및/또는 E11-C14:CoA로 전환시킬 수 있는 데사투라제가 관심의 대상이 된다. 예를 들어, 코리스토네우라 로사세아나(Choristoneura rosaceana)로부터의 데사투라제 CroZ11 (서열 번호: 63), 또는 코리스토네우라 파랄레라(Choristoneura parallela)로부터의 데사투라제 CpaE11 (서열 번호: 65), 또는 이와 적어도 60%의 상동성 또는 동일성, 예컨대, 이와 적어도 61%의 상동성 또는 동일성, 예컨대, 적어도 62%의 상동성 또는 동일성, 예컨대, 적어도 63%의 상동성 또는 동일성, 예컨대, 적어도 64%의 상동성 또는 동일성, 예컨대, 적어도 65%의 상동성 또는 동일성, 예컨대, 적어도 66%의 상동성 또는 동일성, 예컨대, 적어도 67%의 상동성 또는 동일성, 예컨대, 적어도 68%의 상동성 또는 동일성, 예컨대, 적어도 69%의 상동성 또는 동일성, 예컨대, 적어도 70%의 상동성 또는 동일성, 예컨대, 적어도 71%의 상동성 또는 동일성, 예컨대, 적어도 72%, 예컨대, 적어도 73%, 예컨대, 적어도 74%, 예컨대, 적어도 75%, 예컨대, 적어도 76%, 예컨대, 적어도 77%, 예컨대, 적어도 78%, 예컨대, 적어도 79%, 예컨대, 적어도 80%, 예컨대, 적어도 81%, 예컨대, 적어도 82%, 예컨대, 적어도 83%, 예컨대, 적어도 84%, 예컨대, 적어도 85%, 예컨대, 적어도 86%, 예컨대, 적어도 87%, 예컨대, 적어도 88%, 예컨대, 적어도 89%, 예컨대, 적어도 90%, 예컨대, 적어도 91%, 예컨대, 적어도 92%, 예컨대, 적어도 93%, 예컨대, 적어도 94%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%의 상동성 또는 동일성을 갖는, 이의 기능성 변이체가 사용될 수 있다. 이어서, 생성된 Z11-C14:CoA 및/또는 E11-C14:CoA는 추가로 쇄 단축되어 Z9-C12:CoA 및/또는 E9-C12:CoA가 수득될 수 있고, 이는 이어서, Cpo_CPRQ에 의해 추가로 탈포화되어 E8,E10-C12:CoA가 수득된다.
상기 실시양태에서, 따라서, 효모 세포는 본원 상기 섹션 "데사투라제"에서 기술된 바와 같은 적어도 하나의 데사투라제, 예를 들어, Cpo_CPRQ 또는 Gmo_CPRQ, 바람직하게 Cpo_CPRQ, 이의 돌연변이체 또는 기능성 변이체를 발현하고, 탄소 쇄 길이가 X 또는 X'인 지방 아실-CoA에 E/Z 입체형태로 적어도 하나의 이중 결합을 도입할 수 있는 추가의 이종성 데사투라제를 추가로 발현하고, 여기서, X 및 X'는 상기 기술된 바와 같다. 특히, 데사투라제는 탄소 쇄 길이가 14인 지방 아실-CoA에 E/Z 입체형태로 적어도 하나의 이중 결합을 도입할 수 있고, 이는 이어서, 본원 상기에서 기술된 바와 같이 탄소 쇄 길이가 12인 지방 아실-CoA로 단축될 수 있고 - 이는 이어서, E8,E10-C12:CoA로 추가로 탈포화될 수 있고, 이는 이어서, 본원 상기에 상세하게 설명되어 있는 바와 같이 FAR의 작용에 의해 E8,E10-도데카디엔-1-올로 전환될 수 있다.
E8,E10
-
도데카디에닐
코엔자임 A,
E8,E10
-
도데카디엔
-1-올,
E8,E10
-
도데카디
에닐 아세테이트 및/또는 E8,E10-도데카디에닐 아세테이트 생산 방법
본원 상기에 기술된 효모 세포는 E8,E10-도데카디에닐 코엔자임 A 및 임의로, E8,E10-도데카디엔-1-올 생산 방법에 사용될 수 있으며, 이는 E8,E10-도데카디에닐 아세테이트 및/또는 E8,E10-도데카디에닐 아세테이트로 추가로 전환될 수 있다.
E
8,
E
10
-
도데카디엔
-1-올 생산 방법
본원에서는 효모 세포를 제공하는 단계, 및 배지 중에서 효모 세포를 인큐베이션시켜 E8,E10-도데카디에닐 코엔자임 A 및 임의로, E8,E10-도데카디엔-1-올을 제조하는 단계를 포함하고, 여기서, 효모 세포는
i) 탄소 쇄 길이가 12인 지방 아실-CoA에 하나 이상의 이중 결합을 도입하여 상기 지방 아실-CoA를 탈포화된 지방 아실-CoA로 전환시킬 수 있는 적어도 하나의 이종성 데사투라제로서, 여기서, 상기 탈포화된 지방 아실-CoA의 적어도 일부는 E8,E10-도데카디에닐 코엔자임 A (E8,E10-C12:CoA)인 것인 적어도 하나의 이종성 데사투라제; 및
ii) 임의로, 상기 탈포화된 지방 아실-CoA의 적어도 일부를 탈포화된 지방 알콜로 전환시킬 수 있는 적어도 하나의 이종성 지방 아실-CoA 리덕타제 (EC 1.2.1.84)로서, 여기서, 지방 아실-CoA 리덕타제는 상기 E8,E10-도데카디에닐 코엔자임 A (E8,E10-C12:CoA)의 적어도 일부를 E8,E10-도데카디엔-1-올로 전환시킬 수 있는 것인 적어도 하나의 이종성 지방 아실-CoA 리덕타제 (EC 1.2.1.84)를 발현하는 것인, 효모 세포에서 E8,E10-도데카디에닐 코엔자임 A 및 임의로, E8,E10-도데카디엔-1-올을 제조하는 방법을 제공한다.
효모 세포는 본원 상기에 기술된 효모 세포 중 임의의 것일 수 있다.
본 방법을 통해 바람직하게는 적어도 0.2 mg/L의 역가로 E8,E10-도데카디에닐 코엔자임 A를 제조할 수 있다. 일부 실시양태에서, E8,E10-도데카디엔-1-올의 역가는 적어도 0.25 mg/L, 예컨대, 적어도 0.3 mg/L, 예컨대, 적어도 0.4 mg/L, 예컨대, 적어도 0.5 mg/L, 예컨대, 적어도 0.75 mg/L, 예컨대, 적어도 1 mg/L, 예컨대, 적어도 1.5 mg/L, 예컨대, 적어도 2.5 mg/L, 예컨대, 적어도 5.0 mg/L, 예컨대, 적어도 10 mg/L, 예컨대, 적어도 15 mg/L, 예컨대, 적어도 20 mg/L, 예컨대, 25 mg/L, 예컨대, 적어도 50 mg/L, 예컨대, 적어도 100 mg/L, 예컨대, 적어도 250 mg/L, 예컨대, 적어도 500 mg/L, 예컨대, 적어도 750 mg/L, 예컨대, 적어도 1 g/L, 예컨대, 적어도 2 g/L, 예컨대, 적어도 3 g/L, 예컨대, 적어도 4 g/L, 예컨대, 적어도 5 g/L, 예컨대, 적어도 6 g/L, 예컨대, 적어도 7 g/L, 예컨대, 적어도 8 g/L, 예컨대, 적어도 9 g/L, 예컨대, 적어도 10 g/L 이상이다.
본 방법을 통해 적어도 0.2 mg/L의 역가로 E8,E10-도데카디엔-1-올을 제조할 수 있다. 일부 실시양태에서, E8,E10-도데카디엔-1-올의 역가는 적어도 0.25 mg/L, 예컨대, 적어도 0.3 mg/L, 예컨대, 적어도 0.4 mg/L, 예컨대, 적어도 0.5 mg/L, 예컨대, 적어도 0.75 mg/L, 예컨대, 적어도 1 mg/L, 예컨대, 적어도 1.5 mg/L, 예컨대, 적어도 2.5 mg/L, 예컨대, 적어도 5.0 mg/L, 예컨대, 적어도 10 mg/L, 예컨대, 적어도 15 mg/L, 예컨대, 적어도 20 mg/L, 예컨대, 25 mg/L, 예컨대, 적어도 50 mg/L, 예컨대, 적어도 100 mg/L, 예컨대, 적어도 250 mg/L, 예컨대, 적어도 500 mg/L, 예컨대, 적어도 750 mg/L, 예컨대, 적어도 1 g/L, 예컨대, 적어도 2 g/L, 예컨대, 적어도 3 g/L, 예컨대, 적어도 4 g/L, 예컨대, 적어도 5 g/L, 예컨대, 적어도 6 g/L, 예컨대, 적어도 7 g/L, 예컨대, 적어도 8 g/L, 예컨대, 적어도 9 g/L, 예컨대, 적어도 10 g/L 이상이다.
역가를 측정하는 방법은 당업계에 공지되어 있다.
E
8,
E
10
-
도데카디에닐
아세테이트 생산 방법
일부 실시양태에서, 본 방법은 아세틸트랜스퍼라제의 발현에 의해, 또는 화학적 전환에 의해 E8,E10-도데카디엔-1-올의 적어도 일부를 E8,E10-도데카디에닐 아세테이트로 전환시키는 단계를 추가로 포함한다. 따라서, 본원에서는
a) 효모 세포를 제공하고, 배지 중에서 효모 세포를 인큐베이션시키는 단계로서, 여기서, 효모 세포는
i) 탄소 쇄 길이가 12인 지방 아실-CoA에 하나 이상의 이중 결합을 도입하여 상기 지방 아실-CoA를 탈포화된 지방 아실-CoA로 전환시킬 수 있는 적어도 하나의 이종성 데사투라제로서, 여기서, 상기 탈포화된 지방 아실-CoA의 적어도 일부는 E8,E10-도데카디에닐 코엔자임 A (E8,E10-C12:CoA)인 것인 적어도 하나의 이종성 데사투라제; 및
ii) 상기 탈포화된 지방 아실-CoA의 적어도 일부를 탈포화된 지방 알콜로 전환시킬 수 있는 적어도 하나의 이종성 지방 아실-CoA 리덕타제 (EC 1.2.1.84)로서, 여기서, 지방 아실-CoA 리덕타제는 상기 E8,E10-도데카디에닐 코엔자임 A (E8,E10-C12:CoA)의 적어도 일부를 E8,E10-도데카디엔-1-올로 전환시킬 수 있는 것인 적어도 하나의 이종성 지방 아실-CoA 리덕타제 (EC 1.2.1.84)를 발현하는 것인 단계,
b) E8,E10-도데카디엔-1-올의 적어도 일부를 E8,E10-도데카디에닐 아세테이트로 전환시키는 단계를 포함하는, 효모 세포에서 E8,E10-도데카디에닐 아세테이트를 제조하는 방법을 개시한다.
일부 실시양태에서, E8,E10-도데카디에닐 아세테이트는 본원 상기 "E8,E10-도데카디에닐 아세테이트 제조"에 기술된 바와 같이 효모 세포를 조작함으로써 수득된다.
다른 실시양태에서, 세포에 의해 생산된 E8,E10-도데카디엔-1-올의 E8,E10-도데카디에닐 아세테이트로의 전환은 당업계에 공지된 바와 같이 화학적으로 수행된다. 예를 들어, 세포에 의해 생산된 E8,E10-도데카디엔-1-올은 회수될 수 있고, 이후, 아세틸 클로라이드를 E8,E10-도데카디엔-1-올에 첨가하고, 혼합하고, 예컨대, 실온에서 인큐베이션시키고, 이로써, 세포에 의해 생산된 E8,E10-도데카디엔-1-올의 적어도 일부는 E8,E10-도데카디에닐 아세테이트로 전환된다.
다른 실시양태에서, 효모 세포는 E8,E10-도데카디에닐 코엔자임 A를 생산하고, 이는 지질, 예컨대, 트리아실글리세리드로, 또는 유리 지방산으로 전환될 수 있고, 상기 지질 또는 유리 지방산 회수 후, 이는 차례로 E8,E10-도데카디엔-1-올로 전환될 수 있다. 이어서, E8,E10-도데카디엔-1-올은 시험관내에서 상기 기술된 바와 같이 E8,E10-도데카디엔-1-올로 추가로 전환될 수 있다. 상기 실시양태에서, 세포에 의해 생산된 E8,E10-도데카디엔-1-올의 E8,E10-도데카디에닐 아세테이트로의 전환은 당업계에 공지된 바와 같이 화학적으로 수행된다.
따라서, 본 방법을 통해 적어도 0.2 mg/L의 역가로 E8,E10-도데카디에닐 아세테이트를 제조할 수 있다. 일부 실시양태에서, E8,E10-도데카디에닐 아세테이트의 역가는 적어도 0.25 mg/L, 예컨대, 적어도 0.3 mg/L, 예컨대, 적어도 0.4 mg/L, 예컨대, 적어도 0.5 mg/L, 예컨대, 적어도 0.75 mg/L, 예컨대, 적어도 1 mg/L, 예컨대, 적어도 1.5 mg/L, 예컨대, 적어도 2.5 mg/L, 예컨대, 적어도 5.0 mg/L, 예컨대, 적어도 10 mg/L, 예컨대, 적어도 15 mg/L, 예컨대, 적어도 20 mg/L, 예컨대, 25 mg/L, 예컨대, 적어도 50 mg/L, 예컨대, 적어도 100 mg/L, 예컨대, 적어도 250 mg/L, 예컨대, 적어도 500 mg/L, 예컨대, 적어도 750 mg/L, 예컨대, 적어도 1 g/L, 예컨대, 적어도 2 g/L, 예컨대, 적어도 3 g/L, 예컨대, 적어도 4 g/L, 예컨대, 적어도 5 g/L, 예컨대, 적어도 6 g/L, 예컨대, 적어도 7 g/L, 예컨대, 적어도 8 g/L, 예컨대, 적어도 9 g/L, 예컨대, 적어도 10 g/L 이상이다.
역가를 측정하는 방법은 당업계에 공지되어 있다.
E
8,
E
10
-
도데카디에날
생산 방법
일부 실시양태에서, 본 방법은 효모 세포를 추가로 조작하거나, 또는 화학적 전환에 의해 E8,E10-도데카디엔-1-올의 적어도 일부를 E8,E10-도데카디에날로 전환시키는 단계를 추가로 포함한다. 따라서, 본원에서는
a) 효모 세포를 제공하고, 배지 중에서 효모 세포를 인큐베이션시키는 단계로서, 여기서, 효모 세포는
i) 탄소 쇄 길이가 12인 지방 아실-CoA에 하나 이상의 이중 결합을 도입하여 상기 지방 아실-CoA를 탈포화된 지방 아실-CoA로 전환시킬 수 있는 적어도 하나의 이종성 데사투라제로서, 여기서, 상기 탈포화된 지방 아실-CoA의 적어도 일부는 E8,E10-도데카디에닐 코엔자임 A (E8,E10-C12:CoA)인 것인 적어도 하나의 이종성 데사투라제; 및
ii) 상기 탈포화된 지방 아실-CoA의 적어도 일부를 탈포화된 지방 알콜로 전환시킬 수 있는 적어도 하나의 이종성 지방 아실-CoA 리덕타제 (EC 1.2.1.84)로서, 여기서, 지방 아실-CoA 리덕타제는 상기 E8,E10-도데카디에닐 코엔자임 A (E8,E10-C12:CoA)의 적어도 일부를 E8,E10-도데카디엔-1-올로 전환시킬 수 있는 것인 적어도 하나의 이종성 지방 아실-CoA 리덕타제 (EC 1.2.1.84)를 발현하는 것인 단계,
b) E8,E10-도데카디엔-1-올의 적어도 일부를 E8,E10-도데카디에날로 전환시키는 단계를 포함하는, 효모 세포에서 E8,E10-도데카디에날을 제조하는 방법을 개시한다.
일부 실시양태에서, E8,E10-도데카디에날은 본원 상기 "E8,E10-도데카디에날 제조"에 기술된 바와 같이 효모 세포를 조작함으로써 수득된다.
다른 실시양태에서, 본 방법은 화학적 전환에 의해 E8,E10-도데카디엔-1-올의 적어도 일부를 E8,E10-도데카디에날로 전환시키는 단계를 포함한다. 화학적 전환은 E8,E10-도데카디엔-1-올의 E8,E10-도데카디에날로의 산화에 기초한다. 상기 전환을 수행하는 방법은 당업계에 공지되어 있다. 바람직한 방법은 환경 친화적이고, 유해 폐기물의 양을 최소화한다.
다른 실시양태에서, 효모 세포는 E8,E10-도데카디에닐 코엔자임 A를 지질, 예컨대, 트리아실글리세리드로, 또는 유리 지방산으로 전환시킬 수 있고, 이는 이어서, 회수되고, 상기 기술된 바와 같이, 시험관내에서 E8,E10-도데카디엔-1-올로 전환될 수 있다. 상기 실시양태에서, 세포에 의해 생산된 E8,E10-도데카디엔-1-올의 E8,E10-도데카디에날로의 전환은 당업계에 공지된 바와 같이 화학적으로 수행된다.
따라서, 일부 실시양태에서, 화학적 전환은 금속 비함유일 수 있고, 이로써, 예컨대, 산화망가니즈, 산화크로뮴 (존스(Jones) ox. PDC, PCC), 또는 루테늄 화합물 (TPAP, 레이-그리피스(Ley-Griffith) ox.)과 같은 독성 중금속 기반 시약을 피할 수 있다. 일부 실시 양태에서, 전환은 예컨대, 스완(Swern) 산화 또는 피츠너-모파트(Pfitzner-moffat) 타입과 같은 활성화된 디메틸 술폭시드를 포함하는 반응을 포함하지 않는다. 상기 방법은 표적 생성물로부터 제거하기 어려운 디메틸 술피드와 같은, 미량의 강한 냄새가 나는 유기 황 화합물의 전형적인 형성을 포함할 수 있다. 일부 실시양태에서, 본 방법은 데스 마틴(Dess-Martin) 반응 (문헌 [Yadav et al., 2004], [Meyer et al., 1994])을 포함한다. 다른 실시양태에서, 화학적 전환은 수성/유기 2상 조건하에서 차아염소산나트륨으로 산화시키는 것을 포함한다 (문헌 [Okada et al., 2014]; [Tamura et al., 2012]; [Li et al., 2009]). 일부 실시양태에서, 화학적 산화는 25% 피리딘을 함유하는 메틸렌 클로라이드로 이루어진 매질 중에서 1-클로로벤조트리아졸로 수행될 수 있다 (문헌 [Ferrell and Yao, 1972]).
대안적으로, E8,E10-도데카디엔-1-올의 E8,E10-도데카디에날로의 전환은 알콜 데히드로게나제에 의해 효소적으로 수행될 수 있다. 당업자는 효소적 산화를 수행하는 방법을 알 것이다. 예를 들어, 효소적 산화는 정제된 효소, 세포 추출물 또는 전체 세포를 E8,E10-도데카디엔-1-올과 접촉시킴으로써 수행될 수 있다.
따라서, 일부 실시양태에서, 본원에 개시된 본 방법을 통해 적어도 0.2 mg/L의 역가로 E8,E10-도데카디에날을 제조할 수 있다. 일부 실시양태에서, E8,E10-도데카디에날의 역가는 적어도 0.25 mg/L, 예컨대, 적어도 0.3 mg/L, 예컨대, 적어도 0.4 mg/L, 예컨대, 적어도 0.5 mg/L, 예컨대, 적어도 0.75 mg/L, 예컨대, 적어도 1 mg/L, 예컨대, 적어도 1.5 mg/L, 예컨대, 적어도 2.5 mg/L, 예컨대, 적어도 5.0 mg/L, 예컨대, 적어도 10 mg/L, 예컨대, 적어도 15 mg/L, 예컨대, 적어도 20 mg/L, 예컨대, 25 mg/L, 예컨대, 적어도 50 mg/L, 예컨대, 적어도 100 mg/L, 예컨대, 적어도 250 mg/L, 예컨대, 적어도 500 mg/L, 예컨대, 적어도 750 mg/L, 예컨대, 적어도 1 g/L, 예컨대, 적어도 2 g/L, 예컨대, 적어도 3 g/L, 예컨대, 적어도 4 g/L, 예컨대, 적어도 5 g/L, 예컨대, 적어도 6 g/L, 예컨대, 적어도 7 g/L, 예컨대, 적어도 8 g/L, 예컨대, 적어도 9 g/L, 예컨대, 적어도 10 g/L 이상이다.
역가를 측정하는 방법은 당업계에 공지되어 있다.
회수
일부 실시양태에서, 본 방법은 수득된 생성물을 회수하는 단계를 추가로 포함한다.
일부 실시양태에서, 본 방법은 E8,E10-도데카디엔-1-올 생산 방법이고, 따라서, 제조된 E8,E10-도데카디엔-1-올을 회수하는 단계를 추가로 포함한다. 다른 실시양태에서, 본 방법은 E8,E10-도데카디에닐 아세테이트 생산 방법이고, 따라서, 제조된 E8,E10-도데카디에닐 아세테이트를 회수하는 단계를 추가로 포함한다. 다른 실시양태에서, 본 방법은 E8,E10-도데카디에날 생산 방법이고, 따라서, 제조된 E8,E10-도데카디에날을 회수하는 단계를 추가로 포함한다.
본 방법에 의해 수득된 생성물을 회수하는 방법은 당업계에 공지되어 있고, 예컨대, 데칸, 헥산 또는 식물성 오일과 같은 소수성 용매로 추출하는 것을 포함할 수 있다.
대안적으로, 원하는 생성물을 회수하는 데 (동일한 출원인에 의해 2020년 9월 22일 출원된) 출원 PCT/EP2020/076351에 기술된 방법 또한 사용될 수 있다. 예를 들어, 상기 방법은 E8,E10-도데카디에닐 코엔자임 A의 전환으로부터 수득된, 지질, 예컨대, 트리아실글리세리드, 또는 지방산을 회수하는 데, 또는 제조된 E8,E10-도데카디엔-1-올, 제조된 E8,E10-도데카디에닐 아세테이트 및/또는 제조된 E8,E10-도데카디에날을 회수하는 데 사용될 수 있다. 상기 방법은 소수성 화합물, 예컨대, 지방 알콜, 지방 알콜 아세테이트 및 지방 알데히드의 회수를 크게 촉진시키는 배양 온도에서 예컨대, 배양 배지와 같은 수용액 중에서 측정된 이의 클라우드 농도 이상인 양으로 배양 배지 중 추출제 첨가를 이용한다. 따라서, 상기 방법은 E8,E10-도데카디에닐 코엔자임 A의 전환으로부터 수득된, 지질, 예컨대, 트리아실글리세리드, 또는 지방산의 회수, 본 방법에 의해 제조된, E8,E10-도데카디엔-1-올의 회수, E8,E10-도데카디에닐 아세테이트의 회수 및 E8,E10-도데카디에날의 회수를 촉진시키는 데 유리하게 사용될 수 있다. 추가로, 배양 배지 중 추출제 첨가는 또한 일반적으로 세포에 의해 생산된 소수성 화합물의 역가를 증가시키고, 세포로부터의 제조된 소수성 화합물의 분지를 증가시키는 것으로 밝혀졌다.
따라서, 일부 실시양태에서, 본 방법에서 사용된 배지는 배양 온도에서 예컨대, 배양 배지와 같은 수용액 중에서 측정된 이의 클라우드 농도 이상인 양으로 추출제를 포함하고, 여기서, 추출제는 비이온성 계면활성제, 바람직하게, 비이온성 에톡실화된 계면활성제, 예컨대, 소포제, 바람직하게, 폴리에틸렌 폴리프로필렌 글리콜, 폴레에테르 분산액의 혼합물, 폴리에틸렌 글리콜 모노스테아레이트를 포함하는 소포제, 예컨대, 시메티콘, 지방 알콜 알콕실레이트, 폴리에톡실화된 계면활성제 및 에톡실화 및 프로폭실화된 C16-C18 알콜계 소포제 및 이의 조합으로부터 선택되는 폴리에톡실화된 계면활성제이다.
수용액 중 클라우드 농도는 주어진 온도, 바람직하게 실온에서, 또는 발효가 수행되는 온도, 예를 들어, 30℃에서, 또는 실온에서 측정된다. 본원에서 사용되는 바, 용어 "추출제"는 발효에서 생산된 소수성 화합물의 회수를 촉진시키는 비이온성 계면활성제, 특히, 소포제를 지칭한다. 예를 들어, 비이온성 계면활성제는 비이온성 에톡실화된 계면활성제, 예를 들어, 폴리에틸렌 폴리프로필렌 글리콜, 폴레에테르 분산액의 혼합물, 폴리에틸렌 글리콜 모노스테아레이트를 포함하는 소포제, 예컨대, 시메티콘, 지방 알콜 알콕실레이트, 폴리에톡실화된 계면활성제 및 에톡실화 및 프로폭실화된 C16-C18 알콜계 소포제 및 이의 조합으로부터 선택되는 폴리에톡실화된 계면활성제이다. PCT/EP2020/076351의 실시예 7에는 계면활성제의 클라우드 농도를 측정하는 방법이 기술되어 있다.
적합한 추출제인 비이온성 계면활성제 및 상기 비이온성 계면활성제의 적합한 양은 (동일한 출원인에 의해 2020년 9월 22일 출원된) 출원 PCT/EP2020/076351에, 특히, 표제 "비이온성 에톡실화된 계면활성제"인 섹션에 상세하게 기술되어 있다.
따라서, 일부 실시양태에서, 본 방법에서 사용되는 배양 배지는 에톡실화 및 프로폭실화된 C16-C18 알콜계 소포제인 비이온성 계면활성제, 예컨대, C16-C18 알킬 알콜 에톡실레이트 프로폭실레이트 (CAS 번호 68002-96-0)를 포함하고, 배양 배지는 적어도 1% vol/vol의 C16-C18 알킬 알콜 에톡실레이트 프로폭실레이트, 예컨대, 적어도 1.5% vol/vol, 예컨대, 적어도 2% vol/vol, 예컨대, 적어도 2.5% vol/vol, 예컨대, 적어도 3% vol/vol, 예컨대, 적어도 3.5% vol/vol, 예컨대, 적어도 4% vol/vol, 예컨대, 적어도 5% vol/vol, 예컨대, 적어도 6% vol/vol, 예컨대, 적어도 7% vol/vol, 예컨대, 적어도 8% vol/vol, 예컨대, 적어도 9% vol/vol, 예컨대, 적어도 10% vol/vol, 예컨대, 적어도 12.5% vol/vol, 예컨대, 적어도 15% vol/vol, 예컨대, 적어도 17.5% vol/vol, 예컨대, 적어도 20% vol/vol, 예컨대, 적어도 22.5% vol/vol, 예컨대, 적어도 25% vol/vol, 예컨대, 적어도 27.5% vol/vol, 예컨대, 적어도 30% vol/vol 이상의 C16-C18 알킬 알콜 에톡실레이트 프로폭실레이트를 포함한다.
다른 실시양태에서, 본 방법에서 사용되는 배양 배지는 폴리에틸렌 폴리프로필렌 글리콜인 비이온성 계면활성제, 예를 들어, 콜리포르® P407 (CAS 번호 9003-11-6)을 포함하고, 배양 배지는 적어도 10% vol/vol의 폴리에틸렌 폴리프로필렌 글리콜, 예컨대, 콜리포르® P407, 예컨대, 적어도 11% vol/vol, 예컨대, 적어도 12% vol/vol, 예컨대, 적어도 13% vol/vol, 예컨대, 적어도 14% vol/vol, 예컨대, 적어도 15% vol/vol, 예컨대, 적어도 16% vol/vol, 예컨대, 적어도 17% vol/vol, 예컨대, 적어도 18% vol/vol, 예컨대, 적어도 19% vol/vol, 예컨대, 적어도 20% vol/vol, 예컨대, 적어도 25% vol/vol, 예컨대, 적어도 30% vol/vol, 예컨대, 적어도 35% vol/vol 이상의 폴리에틸렌 폴리프로필렌 글리콜, 예컨대, 콜리포르® P407을 포함한다.
다른 실시양태에서, 본 방법에서 사용되는 배양 배지는 폴레에테르 분산액의 혼합물인 비이온성 계면활성제, 예컨대, 안티폼 204를 포함하고, 배양 배지는 적어도 1% vol/vol의 폴레에테르 분산액의 혼합물, 예컨대, 안티폼 204, 예컨대, 적어도 1.5% vol/vol, 예컨대, 적어도 2% vol/vol, 예컨대, 적어도 2.5% vol/vol, 예컨대, 적어도 3% vol/vol, 예컨대, 적어도 3.5% vol/vol, 예컨대, 적어도 4% vol/vol, 예컨대, 적어도 5% vol/vol, 예컨대, 적어도 6% vol/vol, 예컨대, 적어도 7% vol/vol, 예컨대, 적어도 8% vol/vol, 예컨대, 적어도 9% vol/vol, 예컨대, 적어도 10% vol/vol, 예컨대, 적어도 12.5% vol/vol, 예컨대, 적어도 15% vol/vol, 예컨대, 적어도 17.5% vol/vol, 예컨대, 적어도 20% vol/vol, 예컨대, 적어도 22.5% vol/vol, 예컨대, 적어도 25% vol/vol, 예컨대, 적어도 27.5% vol/vol, 예컨대, 적어도 30% vol/vol 이상의 폴레에테르 분산액의 혼합물, 예컨대, 안티폼 204를 포함한다.
다른 실시양태에서, 본 방법에서 사용되는 배양 배지는 폴리에틸렌 글리콜 모노스테아레이트, 예컨대, 시메티콘를 포함하는 비이온성 계면활성제를 포함하고, 배양 배지는 적어도 1% vol/vol의 폴리에틸렌 글리콜 모노스테아레이트 또는 시메티콘, 예컨대, 적어도 1.5% vol/vol, 예컨대, 적어도 2% vol/vol, 예컨대, 적어도 2.5% vol/vol, 예컨대, 적어도 3% vol/vol, 예컨대, 적어도 3.5% vol/vol, 예컨대, 적어도 4% vol/vol, 예컨대, 적어도 5% vol/vol, 예컨대, 적어도 6% vol/vol, 예컨대, 적어도 7% vol/vol, 예컨대, 적어도 8% vol/vol, 예컨대, 적어도 9% vol/vol, 예컨대, 적어도 10% vol/vol, 예컨대, 적어도 12.5% vol/vol, 예컨대, 적어도 15% vol/vol, 예컨대, 적어도 17.5% vol/vol, 예컨대, 적어도 20% vol/vol, 예컨대, 적어도 22.5% vol/vol, 예컨대, 적어도 25% vol/vol, 예컨대, 적어도 27.5% vol/vol, 예컨대, 적어도 30% vol/vol 이상의 폴리에틸렌 글리콜 모노스테아레이트 또는 시메티콘을 포함한다.
다른 실시양태에서, 본 방법에서 사용되는 배양 배지는 지방 알콜 알콕실레이트인 비이온성 계면활성제를 포함하고, 배양 배지는 적어도 1% vol/vol의 지방 알콜 알콕실레이트, 예컨대, 적어도 1.5% vol/vol, 예컨대, 적어도 2% vol/vol, 예컨대, 적어도 2.5% vol/vol, 예컨대, 적어도 3% vol/vol, 예컨대, 적어도 3.5% vol/vol, 예컨대, 적어도 4% vol/vol, 예컨대, 적어도 5% vol/vol, 예컨대, 적어도 6% vol/vol, 예컨대, 적어도 7% vol/vol, 예컨대, 적어도 8% vol/vol, 예컨대, 적어도 9% vol/vol, 예컨대, 적어도 10% vol/vol, 예컨대, 적어도 12.5% vol/vol, 예컨대, 적어도 15% vol/vol, 예컨대, 적어도 17.5% vol/vol, 예컨대, 적어도 20% vol/vol, 예컨대, 적어도 22.5% vol/vol, 예컨대, 적어도 25% vol/vol, 예컨대, 적어도 27.5% vol/vol, 예컨대, 적어도 30% vol/vol 이상의 지방 알콜 알콕실레이트를 포함한다. 적합한 지방 알콜 알콕실레이트는 플루라팍(Plurafac)® LF300 (CAS 번호 196823-11-7), 플루라팍® LF1300 (68002-96-0), 플루라팍® SLF180 (CAS 번호 196823-11-7), 데히폰(Dehypon)® 2574 (CAS 번호 68154-97-2), 및 임벤틴 SG/251 (CAS 번호 68002-96-0), 바람직하게 플루라팍® LF300 또는 데히폰® 2574를 포함한다.
다른 실시양태에서, 본 방법에서 사용되는 배양 배지는 아그니크(Agnique) BP420 (CAS 번호 68002-96-0)인 비이온성 계면활성제를 포함하고, 배양 배지는 적어도 1% vol/vol의 아그니크 BP420, 예컨대, 적어도 1.5% vol/vol, 예컨대, 적어도 2% vol/vol, 예컨대, 적어도 2.5% vol/vol, 예컨대, 적어도 3% vol/vol, 예컨대, 적어도 3.5% vol/vol, 예컨대, 적어도 4% vol/vol, 예컨대, 적어도 5% vol/vol, 예컨대, 적어도 6% vol/vol, 예컨대, 적어도 7% vol/vol, 예컨대, 적어도 8% vol/vol, 예컨대, 적어도 9% vol/vol, 예컨대, 적어도 10% vol/vol, 예컨대, 적어도 12.5% vol/vol, 예컨대, 적어도 15% vol/vol, 예컨대, 적어도 17.5% vol/vol, 예컨대, 적어도 20% vol/vol, 예컨대, 적어도 22.5% vol/vol, 예컨대, 적어도 25% vol/vol, 예컨대, 적어도 27.5% vol/vol, 예컨대, 적어도 30% vol/vol 이상의 아그니크 BP420을 포함한다.
일부 실시양태에서, 배양 배지는 이의 클라우드 농도보다 적어도 50%, 예컨대, 적어도 100%, 예컨대, 적어도 150%, 예컨대, 적어도 200%, 예컨대, 적어도 250%, 예컨대, 적어도 300%, 예컨대, 적어도 350%, 예컨대, 적어도 400%, 예컨대, 적어도 500%, 예컨대, 적어도 750%, 예컨대, 적어도 1000% 이상 만큼 더 큰 양으로 추출제를 포함하고/거나, 여기서, 배양 배지는 이의 클라우드 농도의 적어도 2배, 예컨대, 이의 클라우드 농도의 적어도 3배, 예컨대, 이의 클라우드 농도의 적어도 4배, 예컨대, 이의 클라우드 농도의 적어도 5배, 예컨대, 이의 클라우드 농도의 적어도 6배, 예컨대, 이의 클라우드 농도의 적어도 7배, 예컨대, 이의 클라우드 농도의 적어도 8배, 예컨대, 이의 클라우드 농도의 적어도 9배, 예컨대, 이의 클라우드 농도의 적어도 10배, 예컨대, 이의 클라우드 농도의 적어도 12.5배, 예컨대, 이의 클라우드 농도의 적어도 15배, 예컨대, 이의 클라우드 농도의 적어도 17.5배, 예컨대, 이의 클라우드 농도의 적어도 20배, 예컨대, 이의 클라우드 농도의 적어도 25배, 예컨대, 이의 클라우드 농도의 적어도 30배인 양으로 추출제를 포함한다.
추출제, 즉, 비이온성 계면활성제, 예컨대, 폴리에톡실화된 계면활성제, 예를 들어, 본원에 기술된 비이온성 계면활성제, 소포제 또는 폴리에톡실화된 계면활성제 중 임의의 것을 첨가하면, 발효 브로쓰 중 에멀젼이 생성되고, 여기서, 미생물에 의해 생산된 소수성 화합물, 즉, E8,E10-도데카디에닐 코엔자임 A (또는 E8,E10-도데카디에닐 코엔자임 A 전환에 의해 수득된 지질 또는 유리 지방산), E8,E10-도데카디엔-1-올, E8,E10-도데카디에닐 아세테이트 및/또는 E8,E10-도데카디에날이 에멀젼으로 존재한다. 따라서, 본 방법이 추출제를 포함하는 배양 배지를 이용하여 수행되는 실시양태에서, 본 방법은 또한 에멀젼을 파괴하여 추출제 및 소수성 화합물을 포함하는 생성물 상(product phase)을 회수하는 단계를 포함할 수 있다. 일단 에멀젼이 파괴되고 나면, 발효 브로쓰는 3개 상: 주로 물 및 수성 화합물을 포함하는 수상, 세포 및 세포 파편(cell debris)을 포함하는 상, 및 주로 추출제 및 E8,E10-도데카디에닐 코엔자임 A (또는 E8,E10-도데카디에닐 코엔자임 A 전환에 의해 수득된 지질 또는 유리 지방산), E8,E10-도데카디엔-1-올, E8,E10-도데카디에닐 아세테이트 및/또는 E8,E10-도데카디에날을 포함하는 생성물 상으로 분리된다. 따라서, 3개 상으로 이루어진 조성물이 수득된다. 이는 (동일한 출원인에 의해 2020년 9월 22일 출원된) 출원 PCT/EP2020/076351에, 특히, 표제 "소수성 화합물을 포함하는 생성물 상"인 섹션에 상세하게 기술되어 있다.
일부 실시양태에서, E8,E10-도데카디에닐 코엔자임 A (또는 E8,E10-도데카디에닐 코엔자임 A 전환에 의해 수득된 지질 또는 유리 지방산) 대부분, 및 임의로, E8,E10-도데카디엔-1-올, E8,E10-도데카디에닐 아세테이트 및/또는 E8,E10-도데카디에날 대부분은 생성물 상에 존재한다. 예를 들어, E8,E10-도데카디에닐 코엔자임 A (또는 E8,E10-도데카디에닐 코엔자임 A 전환에 의해 수득된 지질 또는 유리 지방산), 및 임의로, E8,E10-도데카디엔-1-올, E8,E10-도데카디에닐 아세테이트 및/또는 E8,E10-도데카디에날의 적어도 50%가 생성물 상에 존재하고, 예컨대, E8,E10-도데카디에닐 코엔자임 A (또는 E8,E10-도데카디에닐 코엔자임 A 전환에 의해 수득된 지질 또는 유리 지방산), 및 임의로, E8,E10-도데카디엔-1-올, E8,E10-도데카디에닐 아세테이트 및/또는 E8,E10-도데카디에날의 적어도 55%, 예컨대, 적어도 60%, 예컨대, 적어도 65%, 예컨대, 적어도 70%, 예컨대, 적어도 75%, 예컨대, 적어도 80%, 예컨대, 적어도 85%, 예컨대, 적어도 90%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%, 예컨대, 100%가 생성물 상에 존재한다. 일부 실시양태에서, 생성물 상은 처음 발효 브로쓰에 존재하는 E8,E10-도데카디에닐 코엔자임 A (또는 E8,E10-도데카디에닐 코엔자임 A 전환에 의해 수득된 지질 또는 유리 지방산), 및 임의로, E8,E10-도데카디엔-1-올, E8,E10-도데카디에닐 아세테이트 및/또는 E8,E10-도데카디에날의 적어도 50%를 포함하고, 예컨대, 처음 발효 브로쓰에 존재하는 E8,E10-도데카디에닐 코엔자임 A (또는 E8,E10-도데카디에닐 코엔자임 A 전환에 의해 수득된 지질 또는 유리 지방산), 및 임의로, E8,E10-도데카디엔-1-올, E8,E10-도데카디에닐 아세테이트 및/또는 E8,E10-도데카디에날의 적어도 55%, 예컨대, 적어도 60%, 예컨대, 적어도 65%, 예컨대, 적어도 70%, 예컨대, 적어도 75%, 예컨대, 적어도 80%, 예컨대, 적어도 85%, 예컨대, 적어도 90%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%, 예컨대, 100%를 포함한다.
에멀젼을 파괴시키는 단계는 당업계에 공지된 바와 같이, 예를 들어, 원심분리에 의해 에멀젼에 대해 상 분리 단계를 실시함으로써 수행될 수 있다.
에멀젼 파괴 단계 후, 추출제 및 E8,E10-도데카디에닐 코엔자임 A 전환에 의해 수득된 지질 또는 유리 지방산, 및 임의로, E8,E10-도데카디엔-1-올, E8,E10-도데카디에닐 아세테이트 및/또는 E8,E10-도데카디에날을 포함하는 생성물 상이 조성물로부터 회수될 수 있다. 상기 실시양태에서, 본 방법은 E8,E10-도데카디에닐 코엔자임 A 전환에 의해 수득된 지질 또는 유리 지방산, 및 임의로, E8,E10-도데카디엔-1-올, E8,E10-도데카디에닐 아세테이트 및/또는 E8,E10-도데카디에날을 추출제로부터 분리하는 단계를 추가로 포함할 수 있다. 이는 당업계에 공지된 방법, 예컨대, 증류, 예를 들어, 감압하에서의 증류에 의해, 또는 칼럼 정제에 의해, 또는 임의의 다른 적합한 방법에 의해 수행될 수 있다. 추출제는 발효기 또는 생물반응기로 재순환될 수 있다.
핵산 구축물
효모 세포를 변형시키기 위한 핵산 구축물로서, 상기 구축물은
i) 탄소 쇄 길이가 12인 지방 아실-CoA에 하나 이상의 이중 결합을 도입하여 상기 지방 아실-CoA를 탈포화된 지방 아실-CoA로 전환시킬 수 있는 적어도 하나의 이종성 데사투라제를 코딩하는 적어도 하나의 제1 폴리뉴클레오티드로서, 여기서, 상기 탈포화된 지방 아실-CoA의 적어도 일부는 E8,E10-도데카디에닐 코엔자임 A (E8,E10-C12:CoA)인 것인 적어도 하나의 제1 폴리뉴클레오티드; 및
ii) 임의로, 상기 탈포화된 지방 아실-CoA의 적어도 일부를 탈포화된 지방 알콜로 전환시킬 수 있는 적어도 하나의 이종성 지방 아실-CoA 리덕타제 (EC 1.2.1.84)를 코딩하는 제2 폴리뉴클레오티드로서, 여기서, 지방 아실-CoA 리덕타제는 상기 E8,E10-도데카디에닐 코엔자임 A (E8,E10-C12:CoA)의 적어도 일부를 E8,E10-도데카디엔-1-올로 전환시킬 수 있는 것인 제2 폴리뉴클레오티드를 포함하는 것인 핵산 구축물 또한 제공한다.
핵산 구축물은 본원에 기술된 바와 같은 효모 세포, 즉, E8,E10-도데카디에닐 코엔자임 A 및 임의로, E8,E10-도데카디엔-1-올을 생산할 수 있는 효모 세포를 수득하는 데 사용될 수 있다. 용어 "핵산 구축물"은 본원에서 제1 폴리뉴클레오티드 및 임의로, 제2 폴리뉴클레오티드가 포함되어 있는 단일 물리적 엔티티, 즉, 단일 분자, 예를 들어, 벡터 또는 플라스미드를 지칭할 수 있거나, 또는 복수의 핵산 분자, 예컨대, 한 플라스미드 또는 벡터 내에 제1 폴리뉴클레오티드가 포함되고, 또 다른 플라스미드 또는 벡터 내에 제2 폴리뉴클레오티드가 포함된 것을 지칭할 수 있다.
핵산 구축물은
iii) 이종성 시토크롬 b5를 인코딩하는 폴리뉴클레오티드, 예컨대, 서열 번호: 3에 기재된 폴리뉴클레오티드, 또는 이와 적어도 60%의 상동성 또는 동일성을 갖는, 이의 동족체;
iv) 이종성 시토크롬 b5 리덕타제를 인코딩하는 폴리뉴클레오티드, 예컨대, 서열 번호: 23에 기재된 폴리뉴클레오티드, 또는 이와 적어도 60%의 상동성 또는 동일성을 갖는, 이의 동족체;
v) 헤모글로빈을 인코딩하는 폴리뉴클레오티드, 예컨대, 서열 번호: 5에 기재된 폴리뉴클레오티드, 또는 이와 적어도 60%의 상동성 또는 동일성을 갖는, 이의 동족체; 및/또는
vi) 티오에스테라제를 인코딩하는 폴리뉴클레오티드, 예컨대, 서열 번호: 25에 기재된 폴리뉴클레오티드, 또는 이와 적어도 60%의 상동성 또는 동일성을 갖는, 이의 동족체 중 하나 이상의 것을 추가로 포함할 수 있다.
폴리뉴클레오티드는 상기 유전자 중 임의의 것의 카피를 수개 포함할 수 있고, 그 내부로의 도입이 이루어지는 효모 세포에서의 적절한 발현을 위해 코돈 최적화될 수 있다.
일부 실시양태에서, 상기 기술된 바와 같이, 탄소 쇄 길이가 12인 지방 아실-CoA에 하나 이상의 이중 결합을 도입하여 상기 지방 아실-CoA를 탈포화된 지방 아실-CoA로 전환시킬 수 있는 적어도 하나의 이종성 데사투라제로서, 여기서, 상기 탈포화된 지방 아실-CoA의 적어도 일부는 E8,E10-도데카디에닐 코엔자임 A (E8,E10-C12:CoA)인 것인 적어도 하나의 이종성 데사투라제는 Cpo_CPRQ (서열 번호: 2), 또는 이와 적어도 60%의 상동성 또는 동일성을 갖는, 이의 기능성 변이체이다. 상기 실시양태에서, 본원 상기에서 기술된 바와 같이, 제1 폴리뉴클레오티드는 서열 번호: 1, 또는 이와 적어도 60%의 상동성 또는 동일성을 갖는, 이의 동족체를 포함한다.
일부 실시양태에서, 적어도 하나의 이종성 데사투라제는 돌연변이체 Cpo_CPRQ, 예컨대, 85번 위치에 돌연변이를 갖는 Cpo_CPRQ 돌연변이체, 또는 이와 적어도 60%의 상동성 또는 동일성을 갖는, 이의 기능성 변이체이다. 일부 실시양태에서, 돌연변이는 S85A 돌연변이이다. 일부 실시양태에서, 데사투라제는 돌연변이체 Cpo_CPRQ, 예컨대, 82번 위치에 돌연변이를 갖는 Cpo_CPRQ 돌연변이체이다. 일부 실시양태에서, 돌연변이는 S82A 돌연변이, 또는 이와 적어도 60%의 상동성 또는 동일성을 갖는, 이의 기능성 변이체이다.
다른 실시양태에서, 상기 기술된 바와 같이, 탄소 쇄 길이가 12인 지방 아실-CoA에 하나 이상의 이중 결합을 도입하여 상기 지방 아실-CoA를 탈포화된 지방 아실-CoA로 전환시킬 수 있는 적어도 하나의 이종성 데사투라제로서, 여기서, 상기 탈포화된 지방 아실-CoA의 적어도 일부는 E8,E10-도데카디에닐 코엔자임 A (E8,E10-C12:CoA)인 것인 적어도 하나의 이종성 데사투라제는 Gmo_CPRQ (서열 번호: 77) 또는 이와 적어도 60%의 상동성 또는 동일성을 갖는, 이의 기능성 변이체이다. 상기 실시양태에서, 본원 상기에서 기술된 바와 같이, 제1 폴리뉴클레오티드는 서열 번호: 78, 또는 이와 적어도 60%의 상동성 또는 동일성을 갖는, 이의 동족체를 포함한다.
일부 실시양태에서, 효모 세포는 탄소 쇄 길이가 12인 지방 아실-CoA에 하나 이상의 이중 결합을 도입할 수 있는 수개의 데사투라제를 발현한다. 상기 실시양태에서, 바람직하게, 수개의 데사투라제 중 적어도 하나는 본원에 상세하게 설명되어 있는 Cpo_CPRQ, Gmo_CPRQ, 이의 돌연변이체 또는 이의 기능성 변이체이고, 제1 폴리뉴클레오티드는 서열 번호: 1, 또는 이와 적어도 60%의 상동성 또는 동일성을 갖는, 이의 동족체를 포함하거나, 또는 그로 구성된다. 상기 실시양태에서, 핵산 구축물은 각각의 것이 본원 상기에서 기술된 바와 같은 데사투라제를 코딩하는 것인 추가의 제1 폴리뉴클레오티드를 포함한다. 예를 들어, 핵산 구축물은 Cpo_CPRQ, Gmo_CPRQ를 코딩하는 제1 폴리뉴클레오티드, 또는 이의 동족체를 포함하고, 추가의 데사투라제, 바람직하게 Cpo_NPVE (서열 번호: 67), 또는 Cpo_SPTQ (서열 번호: 69)를 코딩하는 추가의 제1 폴리뉴클레오티드, 또는 이와 적어도 60%의 상동성 또는 동일성을 갖는, 이의 기능성 변이체를 추가로 포함한다. 따라서, 일부 실시양태에서, 추가의 제1 폴리뉴클레오티드는 서열 번호: 66 또는 서열 번호: 68, 또는 이와 적어도 60%의 상동성 또는 동일성을 갖는, 이의 동족체를 포함한다.
핵산 구축물은 또한 FAR을 코딩하는 제2 폴리뉴클레오티드를 포함할 수 있다. FAR은 바람직하게 곤충 FAR, 예컨대, 아그로티스 속, 헬리오티스 속, 헬리코베르파 속 또는 시디아 속의 곤충에 고유한 FAR이다. 예를 들어, FAR은 아그로티스 세게툼, 아그로티스 입실론, 헬리오티스 서브플렉사, 헬리코베르파 아술타, 헬리코베르파 비레센스 또는 시디아 포모넬라에 고유한 것이다.
일부 실시양태에서, FAR은 Ase_FAR (서열 번호: 10), 즉, 아그로티스 세게툼에서 자연적으로 발생된 FAR이다. 일부 실시양태에서, 이종성 FAR은 E8,E10-C12:CoA를 E8,E10-도데카디엔-1-올로 전환시킬 수 있는 능력을 보유하는, Ase_FAR의 기능성 변이체이다. 예를 들어, 기능성 변이체는 이와 적어도 65%의 상동성 또는 동일성을 갖는다. 일부 실시양태에서, FAR은 돌연변이체 Ase_FAR, 예컨대, 198번 또는 413번 위치에 돌연변이를 갖는 돌연변이체이다. 일부 실시양태에서, Ase_FAR 돌연변이체는 T198A 돌연변이체이다. 다른 실시양태에서, Ase_FAR 돌연변이체는 S413A 돌연변이체이다. 상기 실시양태에서, 제2 폴리뉴클레오티드는 서열 번호: 9, 또는 이와 적어도 60%의 상동성 또는 동일성을 갖는, 이의 동족체를 포함하거나, 또는 그로 구성된다.
다른 실시양태에서, FAR은 Aip_FAR (서열 번호: 61), 즉, 아그로티스 입실론에서 자연적으로 발생된 FAR이다. 일부 실시양태에서, 이종성 FAR은 E8,E10-C12:CoA를 E8,E10-도데카디엔-1-올로 전환시킬 수 있는 능력을 보유하는, Aip_FAR의 기능성 변이체이다. 상기 실시양태에서, 제2 폴리뉴클레오티드는 서열 번호: 60, 또는 이와 적어도 60%의 상동성 또는 동일성을 갖는, 이의 동족체를 포함하거나, 또는 그로 구성된다.
다른 실시양태에서, FAR은 Hs_FAR (서열 번호: 71), 즉, 헬리오티스 서브플렉사에서 자연적으로 발생된 FAR이다. 일부 실시양태에서, 이종성 FAR은 E8,E10-C12:CoA를 E8,E10-도데카디엔-1-올로 전환시킬 수 있는 능력을 보유하는, Hs_FAR의 기능성 변이체이다. 상기 실시양태에서, 제2 폴리뉴클레오티드는 서열 번호: 70, 또는 이와 적어도 60%의 상동성 또는 동일성을 갖는, 이의 동족체를 포함하거나, 또는 그로 구성된다.
다른 실시양태에서, FAR은 Has_FAR (서열 번호: 73), 즉, 헬리코베르파 아술타에서 자연적으로 발생된 FAR이다. 일부 실시양태에서, 이종성 FAR은 E8,E10-C12:CoA를 E8,E10-도데카디엔-1-올로 전환시킬 수 있는 능력을 보유하는, Has_FAR의 기능성 변이체이다. 상기 실시양태에서, 제2 폴리뉴클레오티드는 서열 번호: 72, 또는 이와 적어도 60%의 상동성 또는 동일성을 갖는, 이의 동족체를 포함하거나, 또는 그로 구성된다.
다른 실시양태에서, FAR은 Hv_FAR (서열 번호: 75), 즉, 헬리코베르파 비레센스에서 자연적으로 발생된 FAR이다. 일부 실시양태에서, 이종성 FAR은 E8,E10-C12:CoA를 E8,E10-도데카디엔-1-올로 전환시킬 수 있는 능력을 보유하는, Hv_FAR의 기능성 변이체이다. 상기 실시양태에서, 제2 폴리뉴클레오티드는 서열 번호: 74, 또는 이와 적어도 60%의 상동성 또는 동일성을 갖는, 이의 동족체를 포함하거나, 또는 그로 구성된다.
다른 실시양태에서, FAR은 Har_FAR (서열 번호: 12), 즉, 헬리코베르파 아르미게라에서 자연적으로 발생된 FAR이다. 일부 실시양태에서, 이종성 FAR은 E8,E10-C12:CoA를 E8,E10-도데카디엔-1-올로 전환시킬 수 있는 능력을 보유하는, Har_FAR의 기능성 변이체이다. 상기 실시양태에서, 제2 폴리뉴클레오티드는 서열 번호: 13, 또는 이와 적어도 60%의 상동성 또는 동일성을 갖는, 이의 동족체를 포함하거나, 또는 그로 구성된다.
다른 실시양태에서, FAR은 시디아 포모넬라 FAR, 예를 들어, Cpo_FAR 또는 8,E10-C12:CoA를 E8,E10-도데카디엔-1-올로 전환시킬 수 있는 능력을 보유하는 이의 기능성 변이체이다. 상기 실시양태에서, 제2 폴리뉴클레오티드는 서열 번호: 75, 또는 이와 적어도 60%의 상동성 또는 동일성을 갖는, 이의 동족체를 포함하거나, 또는 그로 구성된다.
수개의 FAR을 발현하는 것이 바람직한 실시양태에서, 제2 폴리뉴클레오티드는 각각의 것이 한 FAR을 코딩하는 것인 복수의 제2 폴리뉴클레오티드일 수 있다.
일부 실시양태에서, 핵산 구축물은 적어도 하나의 추가의 폴리뉴클레오티드를 포함하고, 이는 제1 및/또는 제2 폴리뉴클레오티드와 상이한 핵산 분자일 수 있거나, 또는 제1 및/또는 제2 폴리뉴클레오티드와 동일한 핵산 분자의 일부분일 수 있다.
일부 실시양태에서, 추가의 폴리뉴클레오티드는 이종성 시토크롬 b5, 예컨대, 서열 번호: 3에 기재된 시토크롬 b5, 또는 이와 적어도 60%의 상동성 또는 동일성을 갖는, 이의 동족체를 코딩한다. 일부 실시양태에서, 시토크롬 b5는 레피도프테라 종에 고유한 시토크롬 b5이다. 특정 실시양태에서, 시토크롬 b5는 헬리코베르파 종으로부터의 시토크롬 b5, 바람직하게, 헬리코베르파 아르미게라로부터의 시토크롬 b5, 예컨대, 서열 번호: 4에 기재되어 있는 것, 또는 이와 적어도 60%의 상동성 또는 동일성을 갖는, 이의 기능성 변이체이다. 상기 실시양태에서, 추가의 폴리뉴클레오티드는 서열 번호: 3, 또는 이와 적어도 60%의 상동성을 갖는, 이의 동족체를 포함하거나, 또는 그로 구성된다.
일부 실시양태에서, 추가의 폴리뉴클레오티드는 이종성 시토크롬 b5 리덕타제, 예컨대, 서열 번호: 24에 기재된 시토크롬 b5 리덕타제, 또는 이와 적어도 60%의 상동성 또는 동일성을 갖는, 이의 동족체를 코딩한다. 일부 실시양태에서, 시토크롬 b5 리덕타제는 헬리코베르파 종에 고유한 시토크롬 b5 리덕타제이다. 특정 실시양태에서, 시토크롬 b5 리덕타제는 헬리코베르파 종으로부터의 시토크롬 b5 리덕타제, 바람직하게, 헬리코베르파 아르미게라로부터의 시토크롬 b5 리덕타제, 예컨대, 서열 번호: 24에 기재되어 있는 시토크롬 b5 리덕타제, 또는 이와 적어도 60%의 상동성 또는 동일성을 갖는, 이의 기능성 변이체이다. 상기 실시양태에서, 추가의 폴리뉴클레오티드는 서열 번호: 23, 또는 이와 적어도 60%의 상동성을 갖는, 이의 동족체를 포함하거나, 또는 그로 구성된다.
일부 실시양태에서, 추가의 폴리뉴클레오티드는 이종성 헤모글로빈, 예컨대, 서열 번호: 6에 기재된 헤모글로빈, 또는 이와 적어도 60%의 상동성 또는 동일성을 갖는, 이의 동족체를 인코딩한다. 일부 실시양태에서, 헤모글로빈은 비트레오스킬라 종에 고유한 헤모글로빈이다. 특정 실시양태에서, 헤모글로빈은 비트레오스킬라 스테르코라리아로부터의 헤모글로빈, 예컨대, 서열 번호: 6에 기재되어 있는 헤모글로빈, 또는 이와 적어도 60%의 상동성 또는 동일성을 갖는, 이의 기능성 변이체이다. 상기 실시양태에서, 추가의 폴리뉴클레오티드는 서열 번호: 5, 또는 이와 적어도 60%의 상동성을 갖는, 이의 동족체를 포함하거나, 또는 그로 구성된다.
일부 실시양태에서, 추가의 폴리뉴클레오티드는 티오에스테라제, 예컨대, 서열 번호: 6에 기재된 티오에스테라제, 또는 이와 적어도 60%의 상동성 또는 동일성을 갖는, 이의 동족체를 인코딩한다. 일부 실시양태에서, 티오에스테라제는 쿠페아 종에, 신나모멈 종에, 또는 에스케리키아 종에 고유한 것이다. 특정 실시양태에서, 티오에스테라제는 쿠페아 팔루스트리스, 쿠페아 후케리아나, 신나모멈 캠포라, 또는 에스케리키아 콜라이로부터의 헤모글로빈, 예컨대, 각각 서열 번호: 33, 서열 번호: 57, 서열 번호: 35 또는 서열 번호: 26에 기재되어 있는 것, 또는 이와 적어도 60%의 상동성 또는 동일성을 갖는, 이의 기능성 변이체이다. 상기 실시양태에서, 추가의 폴리뉴클레오티드는 서열 번호: 34, 서열 번호: 56, 서열 번호: 34 또는 서열 번호: 25, 이와 적어도 60%의 상동성을 갖는, 이의 동족체를 포함하거나, 또는 그로 구성된다.
일부 실시양태에서, 핵산 구축물은 상기 기술된 바와 같은 제1 폴리뉴클레오티드, 및 임의로, 상기 기술된 바와 같은 제2 폴리뉴클레오티드를 포함하고, 이는 추가로 상기 기술된 바와 같은 하나 이상의 추가의 폴리뉴클레오티드를 발현한다. 따라서, 일부 실시양태에서, 핵산 구축물은 제1 폴리뉴클레오티드 및 임의로, 제2 폴리뉴클레오티드를 포함하고,
· 이종성 시토크롬 b5를 인코딩하는 적어도 하나의 추가의 폴리뉴클레오티드; 또는
· 이종성 시토크롬 b5 리덕타제를 인코딩하는 적어도 하나의 추가의 폴리뉴클레오티드; 또는
· 헤모글로빈을 인코딩하는 적어도 하나의 추가의 폴리뉴클레오티드; 또는
· 티오에스테라제를 인코딩하는 적어도 하나의 추가의 폴리뉴클레오티드 중 하나를 추가로 포함한다.
다른 실시양태에서, 핵산 구축물은 제1 폴리뉴클레오티드 및 임의로, 제2 폴리뉴클레오티드를 포함하고,
· 이종성 시토크롬 b5를 인코딩하는 적어도 하나의 추가의 폴리뉴클레오티드; 및
· 이종성 시토크롬 b5 리덕타제를 인코딩하는 적어도 하나의 추가의 폴리뉴클레오티드;
또는
· 이종성 시토크롬 b5를 인코딩하는 적어도 하나의 추가의 폴리뉴클레오티드; 및
· 헤모글로빈을 인코딩하는 적어도 하나의 추가의 폴리뉴클레오티드;
또는
· 이종성 시토크롬 b5를 인코딩하는 적어도 하나의 추가의 폴리뉴클레오티드; 및
· 티오에스테라제를 인코딩하는 적어도 하나의 추가의 폴리뉴클레오티드;
또는:
· 이종성 시토크롬 b5 리덕타제를 인코딩하는 적어도 하나의 추가의 폴리뉴클레오티드; 및
· 헤모글로빈을 인코딩하는 적어도 하나의 추가의 폴리뉴클레오티드;
또는:
· 이종성 시토크롬 b5 리덕타제를 인코딩하는 적어도 하나의 추가의 폴리뉴클레오티드; 및
· 티오에스테라제를 인코딩하는 적어도 하나의 추가의 폴리뉴클레오티드;
또는:
· 헤모글로빈을 인코딩하는 적어도 하나의 추가의 폴리뉴클레오티드; 및
· 티오에스테라제를 인코딩하는 적어도 하나의 추가의 폴리뉴클레오티드를 추가로 포함한다.
다른 실시양태에서, 핵산 구축물은 제1 폴리뉴클레오티드 및 임의로, 제2 폴리뉴클레오티드를 포함하고,
· 이종성 시토크롬 b5를 인코딩하는 적어도 하나의 추가의 폴리뉴클레오티드; 및
· 이종성 시토크롬 b5 리덕타제를 인코딩하는 적어도 하나의 추가의 폴리뉴클레오티드; 및
· 헤모글로빈을 코딩하는 적어도 하나의 추가의 폴리뉴클레오티드;
또는_
· 이종성 시토크롬 b5를 인코딩하는 적어도 하나의 추가의 폴리뉴클레오티드; 및
· 이종성 시토크롬 b5 리덕타제를 인코딩하는 적어도 하나의 추가의 폴리뉴클레오티드; 및
· 티오에스테라제를 인코딩하는 적어도 하나의 추가의 폴리뉴클레오티드;
또는
· 이종성 시토크롬 b5 리덕타제를 인코딩하는 적어도 하나의 추가의 폴리뉴클레오티드; 및
· 헤모글로빈을 인코딩하는 적어도 하나의 추가의 폴리뉴클레오티드; 및
· 티오에스테라제를 인코딩하는 적어도 하나의 추가의 폴리뉴클레오티드;
또는
· 이종성 시토크롬 b5를 인코딩하는 적어도 하나의 추가의 폴리뉴클레오티드; 및
· 헤모글로빈을 인코딩하는 적어도 하나의 추가의 폴리뉴클레오티드; 및
· 티오에스테라제를 인코딩하는 적어도 하나의 추가의 폴리뉴클레오티드를 추가로 포함한다.
일부 실시양태에서, 핵산 구축물은 제1 폴리뉴클레오티드 및 임의로, 제2 폴리뉴클레오티드를 포함하고, 이는
· 이종성 시토크롬 b5를 인코딩하는 적어도 하나의 추가의 폴리뉴클레오티드; 및
· 이종성 시토크롬 b5 리덕타제를 인코딩하는 적어도 하나의 추가의 폴리뉴클레오티드; 및
· 헤모글로빈을 인코딩하는 적어도 하나의 추가의 폴리뉴클레오티드; 및
· 티오에스테라제를 인코딩하는 적어도 하나의 추가의 폴리뉴클레오티드를 모두 추가로 포함한다.
핵산 구축물은 효모 세포에 본원 상기에 기술된 추가 변형 중 임의의 것을 도입하기 위한 추가의 폴리뉴클레오티드, 특히, 효모 세포에의 도입시, 천연 지방 알데히드 데히드로게나제(들), 지방 알콜 옥시다제(들), 퍼옥시좀 생물발생 인자 및/또는 지방 아실 신타제(들)의 활성 변형을 초래하는 폴리뉴클레오티드를 추가로 포함할 수 있고; 바람직하게, 활성은 감소 또는 제거된다.
핵산 구축물은 당업계에 공지된 바와 같이, 그 안에 포함된 폴리뉴클레오티드의 발현을 위해 요구되거나, 또는 그를 촉진시키기 위한 것으로서, 폴리뉴클레오티드에 포함된 코딩 서열 상류에 위치하는 추가 요소, 예컨대, 프로모터, 예를 들어, 유도성, 억제성, 또는 구성적 프로모터를 포함할 수 있다.
페로몬 조성물로서의 제제
일부 실시양태에서, 본 방법은 당업계에 공지된 바와 같이, 효모 세포에 의해 생산된 E8,E10-도데카디엔-1-올, E8,E10-도데카디에닐 아세테이트 및/또는 E8,E10-도데카디에날을 페로몬 조성물로서 제제화하는 단계를 추가로 포함한다.
본 방법에 의해
수득가능한
E8,E10
-
도데카디에닐
코엔자임 A,
E8,E10
-
도데카
디엔-1-올,
E8,E10
-
도데카디에닐
아세테이트 및/또는
E8,E10
-
도데카디에날
본 개시내용은 또한 본 방법에 의해 수득가능한 E8,E10-도데카디에닐 코엔자임 A (또는 E8,E10-도데카디에닐 코엔자임 A 전환에 의해 수득된 지질 또는 유리 지방산), E8,E10-도데카디엔-1-올, E8,E10-도데카디에닐 아세테이트 및/또는 E8,E10-도데카디에날을 제공한다. 효모 세포에서의 곤충 데사투라제 및/또는 리덕타제 발현시, 생성된 생성물 믹스, 예컨대, E8,E10-도데카디에닐 코엔자임 A 및/또는 E8,E10-도데카디엔-1-올을 포함하고, 세포에 의해 생산된 지방 알콜은 전형적으로 곤충의 페로몬 샘에서 생산된 것과 유사한 조성을 가질 것이다. 이를 통해, 별도의 프로세스에서 후속하여 적절한 비율로 혼합되어야 하는 개별 페로몬 성분을 제조하는 대신, 다양한 곤충에 적합한 페로몬 믹스를 제조할 수 있다. 그럼에도 불구하고, 생성된 생성물 혼합물, 예컨대, E8,E10-도데카디에닐 코엔자임 A 및/또는 지방 알콜은 생물학적 생산의 특징적인 부산물을 함유할 수 있다.
따라서, E8,E10-도데카디에닐 코엔자임 A 제조가 수행되는 일부 실시양태에서, 제조된 지방 아실-CoA는 적어도 1%, 예컨대, 적어도 2%, 예컨대, 적어도 3%, 예컨대, 적어도 4%, 예컨대, 적어도 5%, 예컨대, 적어도 10%, 예컨대, 적어도 15%, 예컨대, 적어도 20%의, 원하는 지방 아실-CoA와 다른 또 다른 위치에서 탈포화된 탈포화된 지방 아실-CoA 및/또는 적어도 1%, 예컨대, 적어도 2%, 예컨대, 적어도 3%, 예컨대, 적어도 4%, 예컨대, 적어도 5%, 예컨대, 적어도 10%, 예컨대, 적어도 15%, 예컨대, 적어도 20%의 상응하는 포화된 지방 아실-CoA를 포함한다.
E8,E10-도데카디엔-1-올 제조가 수행되는 일부 실시양태에서, 제조된 지방 알콜은 적어도 1%, 예컨대, 적어도 2%, 예컨대, 적어도 3%, 예컨대, 적어도 4%, 예컨대, 적어도 5%, 예컨대, 적어도 10%, 예컨대, 적어도 15%, 예컨대, 적어도 20%의, 원하는 지방 알콜와 다른 또 다른 위치에서 탈포화된 탈포화된 지방 알콜, 및/또는 적어도 1%, 예컨대, 적어도 2%, 예컨대, 적어도 3%, 예컨대, 적어도 4%, 예컨대, 적어도 5%, 예컨대, 적어도 10%, 예컨대, 적어도 15%, 예컨대, 적어도 20%의 상응하는 포화된 지방 알콜을 포함한다. 발효 브로쓰로부터 회수된 지방 알콜의 믹스가 화학적으로 알데히드로 산화되거나, 또는 아세테이트로 아세틸화되면, 이때 알데히드와 아세테이트의 상응하는 믹스가 생성된다.
일부 실시양태에서, 본 방법은 E8,E10-도데카디에날을 제조하기 위한 것이다. 일부 실시양태에서, 본 효모 세포 및 방법을 통해 E8,E10-도데카디에날을 포함할 뿐만 아니라, 홀수 쇄 지방 알데히드도 포함하는 지방 알데히드 혼합물이 생성된다. 용어 "홀수 쇄" 지방 알데히드란, 탄소 쇄 길이가 홀수 개의 탄소 원자, 예컨대, 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 또는 23개의 탄소 원자인 것인 지방 알데히드를 지칭한다. 용어 "짝수 쇄" 지방 알데히드란, 탄소 쇄 길이가 짝수 개의 탄소 원자, 예컨대, 8, 10, 12, 14, 16, 18, 20, 또는 22개의 탄소 원자인 것인 지방 알데히드를 지칭한다.
일부 실시양태에서, 본 방법은 E8,E10-도데카디에닐 아세테이트를 제조하기 위한 것이다. 일부 실시양태에서, 본 효모 세포 및 방법을 통해 E8,E10-도데카디에닐 아세테이트를 포함할 뿐만 아니라, 홀수 쇄 지방 알콜 아세테이트도 포함하는 지방 알콜 아세테이트 혼합물이 생성된다. 용어 "홀수 쇄" 지방 알콜 아세테이트란, 탄소 쇄 길이가 홀수 개의 탄소 원자, 예컨대, 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 또는 23개의 탄소 원자인 것인 지방 알콜 아세테이트를 지칭한다. 용어 "짝수 쇄" 지방 알콜 아세테이트란, 탄소 쇄 길이가 짝수 개의 탄소 원자, 예컨대, 8, 10, 12, 14, 16, 18, 20, 또는 22개의 탄소 원자인 것인 지방 알콜 아세테이트를 지칭한다.
페로몬 조성물
효모 세포에 의해 생산된 E8,E10-도데카디엔-1-올, E8,E10-도데카디에닐 아세테이트 및/또는 E8,E10-도데카디에날은 당업계에 공지된 바와 같이 페로몬 조성물로서 제제화될 수 있다. 상기 페로몬 조성물은 병해충의 존재를 모니터링하는 방법, 또는 병해충의 교미를 교란시키는 방법에서 사용될 수 있는 통합 병해충 관리 생성물로서 사용될 수 있다.
본원에 개시된 바와 같은 페로몬 조성물은 생물농약으로서 사용될 수 있다. 상기 조성물은 배양물 상에, 들판에서, 또는 과수원에서 분무 또는 분주될 수 있다. 이는 또한 당업계에 공지된 바와 같이, 예컨대, 고무 셉타 상에 침지될 수 있거나, 또는 다른 성분과 함께 혼합될 수 있다. 이는 교미를 교란시켜 병해충 번식을 방지할 수 있거나, 또는 병해충 포획용 포획 장치와 함께 사용될 수 있다. 본 발명의 페로몬 조성물이 사용될 수 있는 병해충의 비제한적 예로는 왕담배나방(cotton bollworm) (헬리코베르파 아르미게라), 이화명나방(striped stemborer) (킬로 수프레살리스(Chilo suppressalis)), 배추좀나방(diamond back moth) (플루텔라 크실로스텔라(Plutella xylostella)), 도둑나방(cabbage moth) (마메스트라 브라시카에(Mamestra brassicae)), 큰 양배추 송이 애벌레(large cabbage-heart caterpillar) (크로시돌로미아 비노탈리스(Crocidolomia binotalis)), 유럽 조명 나방(European corn stalk borer) (세사미아 노나그리오이데스(Sesamia nonagrioides)), 포도 유리날개알락나방(currant clearwing) (시난테돈 티풀리포르미스(Synanthedon tipuliformis)) 및 아티초크 털날개 나방(artichoke plume moth) (플라티프틸리아 카르두이닥틸라(Platyptilia carduidactyla))이 있다. 따라서, 배양시 본 발명의 조성물의 사용으로 실질적으로 환경에는 영향을 주지 않으면서, 작물 수확량을 증가시킬 수 있다.
본 발명의 페로몬 조성물중의 상이한 화합물의 상대적인 양은 작물 및/또는 방제하고자 하는 병해충의 성질에 따라 달라질 수 있으며; 지리적 변동도 존재할 수 있다. 따라서, 최적의 상대량을 결정하려면 통상의 최적화가 요구될 수 있다.
본 개시내용의 일부 실시양태에서, 페로몬 조성물은 예컨대, 액체 또는 고체 담체 또는 기질과 같은 하나 이상의 추가 화합물을 추가로 포함할 수 있다. 예를 들어, 적합한 담체 또는 기질은 식물성 오일, 정제된 광유 또는 이의 분획, 고무, 플라스틱, 실리카, 규조토, 왁스 매트릭스 및 셀룰로스 분말을 포함한다.
페로몬 조성물은 당업계에 공지된 바와 같이 제제화될 수 있다. 예를 들어, 이는 액제, 겔, 산제 형태일 수 있다. 페로몬 조성물은 당업계에 공지된 바와 같이 용이하게 분주될 수 있도록 제제화될 수 있다.
키트
본원에서는 본 방법을 수행하기 위한 부품들의 키트를 제공한다. 부품들의 키트는 본원에 기술된 바와 같은 "사용 준비가 된" 효모 세포를 포함할 수 있다. 한 실시양태에서, 효모 세포는 야로위아 세포, 예컨대, 야로위아 리폴리티카 세포, 또는 사카로마이세스 세포, 예컨대, 사카로마이세스 세레비지아에 세포이다.
대안적으로, 부품들의 키트는 또한 효모 세포에 도입시키고자 하는 관심 활성을 인코딩하는 핵산 구축물을 포함할 수 있다. 핵산 구축물은 복수의 핵산 구축물로서, 예컨대, 각 벡터가 하나 또는 수개의 원하는 활성을 인코딩하는 것인 복수의 벡터로서 제공될 수 있다. 유용한 핵산 구축물은 상기에서 기술되었다.
부품들의 키트는 또한 부분적 또는 전체 기능 상실을 초래하는 돌연변이, 예컨대, 본원 상기 기술된 바와 같은 돌연변이 중 임의의 것을 도입하는 데 유용한 핵산 구축물을 포함할 수 있다.
부품들의 키트는 임의로, 변형시키고자 하는 효모 세포를 포함할 수 있다.
일부 실시양태에서, 부품들의 키트는 상기의 모든 것을 포함한다.
병해충의 존재를
모니터링하거나
, 또는 병해충의 교미를 교란시키는 방법
본원에 개시된 효모 세포 및 방법에 의해 생산된 E8,E10-도데카디엔-1-올 및 임의로, E8,E10-도데카디에닐 아세테이트 및/또는 E8,E10-도데카디에날은 병해충의 존재를 모니터링하거나, 또는 병해충의 교미를 교란시키는 방법에 사용될 수 있다.
따라서, 본원에서는 또한
i) 본원에 기술된 방법에 의해 E8,E10-도데카디엔-1-올 및 임의로, E8,E10-도데카디에닐 아세테이트 및/또는 E8,E10-도데카디에날을 제조하는 단계;
ii) 상기 E8,E10-도데카디엔-1-올 및 임의로, 상기 E8,E10-도데카디에닐 아세테이트 및/또는 상기 E8,E10-도데카디에날을 페로몬 조성물로서 제제화하는 단계; 및
iii) 상기 페로몬 조성물을 통합 병해충 관리 조성물로서 사용하는 단계를 포함하는, 병해충의 존재를 모니터링하거나, 또는 병해충의 교미를 교란시키는 방법도 제공한다.
본원 상기에 기술된 효모 세포 및 방법 중 임의의 것은 상기 방법에서 사용될 수 있다.
실시예
실시예
1:
바이오브릭
구축
진아트(GeneArt) (라이프 테크놀러지즈(Life Technologies))에 의해 모든 이종성 유전자를 야로위아 리폴리티카에 대해 코돈 최적화된 버전으로 합성하였다. 퓨전 U 핫 스타트 DNA 폴리머라제(Phusion U Hot Start DNA Polymerase) (써모피셔(ThermoFisher))를 이용하여 PCR에 의해 모든 유전자를 증폭시켜 효모 발현 벡터로의 클로닝을 위한 단편을 수득하였다. 프라이머는 표 1에 열거되어 있고, 생성된 DNA 단편 (바이오브릭스(BioBricks))은 표 2에 열거되어 있다. PCR 생성물을 미도리 그린 어드반스(Midori Green Advance) (니폰 제네틱스 유럽 게엠베하(Nippon Genetics Europe GmbH))를 함유하는 1% 아가로스 겔 상에서 분리하였다. 정확한 크기의 PCR 생성물을 젤로부터 절제하고, 뉴클레오스핀 겔(Nucleospin Gel) 및 PCR 클린-업(PCR Clean-up) 키트 (마쇼레이-나겔(Macherey-Nagel))를 이용하여 정제하였다.
실시예
2: 플라스미드 구축
USER 카세트를 포함하는 통합 효모 벡터를 37℃에서 2시간 동안 패스트다이제스트(FastDigest) SfaAI (써모피셔)로 선형화한 후, 이어서, 65℃에서 1시간 동안 Nb.Bsml (뉴 잉글랜드 바이오랩스(New England Biolabs))로 닉킹하였다. 점착성 말단을 함유하는 생성된 벡터를 전기영동에 의해 분리하고, 겔로부터 절제하고, 뉴클레오스핀 겔 및 PCR 클린-업 키트 (마쇼레이-나겔)를 이용하여 겔-정제하였다. DNA 단편을 문헌 [Holkenbrink et al., 2017]에 기술된 바와 같이 USER-클로닝에 의해 상기 제조된 벡터로 클로닝하였다. 반응물을 화학적 컴피턴트 E. 콜라이 DHα 세포로 형질전환시키고, 세포를 100 mg/L 암피실린을 포함하는 리소제니 브로쓰(Lysogeny Broth: LB) 아가 플레이트 상에 플레이팅하였다. 플레이트를 37℃에서 밤새도록 인큐베이션시키고, 생성된 콜로니를 콜로니 PCR에 의해 스크리닝하였다. 밤새도록 배양된 E. 콜라이 액체 배양물로부터 플라스미드를 정제하고, 시퀀싱하여 정확한 클로닝을 확인하였다. 구축된 벡터는 표 3에 열거되어 있다.
실시예
3: 균주 구축
문헌 [Holkenbrink et al., 2017]에 기술된 바와 같이 DNA 벡터의 형질전환에 의해 효모 균주를 구축하였다. 형질전환 전에 패스트다이제스트 NotI로 통합 벡터를 선형화하였다. 필요할 경우, 특정 게놈 영역으로의 통합을 촉진시키는 헬퍼 벡터를 표 4에 열거된 통합 플라스미드 또는 DNA 수복 단편과 함께 공동으로 형질전환시켰다. 적절한 항생제 선별을 이용하여 효모 펩톤 덱스트로스 (YPD) 아가 상에서 균주를 선별하였다. 클로니 PCR에 의해, 및 필요할 경우, 시퀀싱에 의해 정확한 유전자형을 확인하였다. Y. 리폴리티카 야생형 균주를 플라스미드 pCfB6364 (EP19204554로 형질전환시켜 균주 ST6029를 수득한 후, 이어서, 유전자 HFD1 (YALI0_F23793g), HFD2 (YALI0_E15400g), HFD3 (YALI0_A17875g), HFD4 (YALI0_B01298g), FAO1 (YALI0_B14014g), 및 PEX10 (YALI1_C01416g)을 결실시켜 균주 ST6629를 수득하였다 (문헌 [Borodina et al., 2018]). 균주 ST6029 및 ST6629는 모든 다른 균주를 구축하기 위한 모체 균주로서 사용하였다.
실시예
4: 균주 배양, 지방산
메틸
에스테르 및 지방
알콜
추출 및 분석
균주를 YPD 아가 플레이트 (10 g/L 효모 추출물, 10 g/L 펩톤, 20 g/L 글루코스, 15 g/L 아가 아가)로부터 초기 OD600 0.1-0.2로 2.5 mL YPG 배지 (10 g/L 효모 추출물, 10 g/L 펩톤, 40 g/L 글리세롤)로 24웰 플레이트 (이지스크린(EnzyScreen))에 접종하였다. 플레이트를 28℃에서 인큐베이션시키고, 300 rpm으로 진탕시켰다. 22 h 후, 플레이트를 4℃에서 5 min 동안 3,000 x g로 원심분리하였다. 상청액을 폐기하고, 세포를 웰당 1.25 mL 생산 배지에 재현탁시켰다 (문헌 [Borodina et al., 2018]). 배지를 2.5 ㎕ 메틸 도데카노에이트로 보충하였다. 플레이트를 28℃에서 28시간 동안 인큐베이션시키고, 300 rpm으로 진탕시켰다.
지방 알콜 분석을 위해, 내부 표준으로서 990 ㎕의 에틸 아세테이트:에탄올 (84:15) 및 10 ㎕의 Z10-17:Me (2 mg/mL)를 이용하여 200 ㎕의 브로쓰를 추출하였다. 샘플을 20 sec 동안 와동시키고, 실온에서 1 h 동안 인큐베이션시킨 후, 5 min 동안 와동시켰다. 300 ㎕의 H2O를 각 샘플에 첨가하였다. 샘플을 와동시키고, 21℃에서 5 min 동안 3,000 x g로 원심분리하였다. 기체 크로마토그래피-질량 분석법 (GC-MS)을 통해 상부 유기상을 분석하였다. 질량 선택 검출기 HP 5973에 커플링된 휴렛 팩커드(Hewlett Packard) 6890 GC 상에서 GC-MS 분석을 수행하였다. GC에 INNOWax 칼럼 (30 m x 0.25 mm x 0.25 ㎛)을 장착하였고, 헬륨을 운반 기체로 사용하였다 (평균 속도: 33 cm/초). MS는 m/z 30과 400 사이에서 스캐닝하는 전자 충격 모드 (70 eV)로 작동시켰고, 주입기는 220℃에서 비분할 모드로 구성하였다. 오븐 온도를 1 min 동안 80℃로 설정한 후, 이어서, 10℃/min의 비율로 210℃까지 증가시킨 후, 210℃에서 15 min 동안 유지시킨 후, 이어서, 10℃/min의 비율로 230℃까지 증가시킨 후, 230℃에서 20 min 동안 유지시켰다. 실험실 수집물에서 이용가능한 참조 화합물의 것과 머무름 시간 및 질량 스펙트럼을 비교함으로써 화합물을 확인하였다. 화합물을 기록된 총 이온 전류 (TIC)에 의해 정량화하였다. 애질런트 켐스테이션(Agilent ChemStation) 소프트웨어 및 iWork 넘버스(iWork Numbers)에 의해 데이터를 분석하였다.
지방산 분석을 위해, 4℃에서 5 min 동안 3,000 x g로 원심분리하여 수확하였다. 메탄올 (무수) 중 1000 ㎕ 1 M HCl로 각 펠릿을 추출하였다. 샘플을 20 sec 동안 와동시키고, 80℃ 수조에 2 h 동안 두었다. 샘플을 매 30 min마다 10 sec 동안 와동시켰다. 샘플을 실온으로 냉각시킨 후, 메탄올 (무수) 중 1000 ㎕의 1 M NaOH, 500 ㎕의 NaCl 포화된 H2O, 990 ㎕의 헥산 및 10 ㎕의 Z10-17:Me (2 mg/mL)를 내부 표준으로서 첨가하였다. 샘플을 와동시키고, 21℃에서 5 min 동안 3,000 x g로 원심분리하였다. 상기 기술된 바와 같이 GC-MS를 통해 상부 유기상을 분석하였다.
실시예
5: Y.
리폴리티카에서의
E8,E10
-
C12:OH
생산
균주 ST6629로부터 유래된 균주 ST8494는 헬리코베르파 아르미게라 지방 아실 리덕타제 Har_FAR (2개의 카피로) 및 시디아 포모넬라 데사투라제 Cpo_CPRQ를 발현한다. 균주 ST6629는 지방 알콜 분해 및 저장 지질 축적 감소를 위해 조작된 Y. 리폴리티카 균주이다 (문헌 [Holkenbrink et al., 2020]).
균주를 실시예 4에 기술된 바와 같이 배양하고, 추출하고, 분석하되, 단, 예외적으로, 형성된 지방 알콜 분석을 위해, 6개의 바이알 (1.25 mL)을 조합하고, 4℃에서 5 min 동안 3,000 g로 원심분리하여 수확하였다. 내부 표준에 기초하여 지방 알콜의 농도를 계산하였다.
감소된 지방 알콜 분해를 위해 조작된 균주 중에서 데사투라제 CpoCPRQ 및 지방 알콜 리덕타제 HarFAR의 발현을 조합한 균주 ST8494는 4.4 mg/L E8,E10-C12:OH를 생산하는 것으로 나타났다 (표 6).
실시예
6: Y.
리폴리티카에서의
E8,E10
-
C12:Me
및
E8,E10
-
C12:OH의
생산
증
가
균주 ST8406은 균주 ST6629로부터 유래된 것이고, 이는 추가로 CpoCPRQ 데사투라제를 발현한다. ST8406으로부터 유래된 균주 ST9066은 Cpo_CPRQ를 2개의 카피로 발현한다. 균주를 실시예 4에 기술된 바와 같이 배양하고, 추출하고, 분석하였다. 내부 표준에 기초하여 지방산 메틸 에스테르 및 지방 알콜의 농도를 계산하였다 (표 7-10).
C. 포모넬라 (ST9066)로부터의 데사투라제 Cpo_CPRQ의 추가 카피의 발현은 E8,E10-C12:Me 및 E9/Z9-C12:Me 생산을 각각 2.8배 및 1.5배 증가시켰다 (표 7). 이는 데사투라제의 과다발현이 E8,E10-C12:Me 및 E9/Z9-C12:Me 생산을 증가시킬 수 있다는 것을 보여주는 것이다.
C. 포모넬라로부터의 데사투라제 Cpo_CPRQ의 발현을, H. 아르미게라로부터의 시토크롬 b5 (HarCyb5, 서열 번호: 4)의 발현과, 또는 V. 스테르코라리아(V. stercoraria)로부터의 헤모글로빈 (VHb, 서열 번호: 6)의 발현과 조합한 균주 ST8411 및 ST8416은 C. 포모넬라로부터 데사투라제만을 발현하는 참조 균주 ST8406보다 E8,E10-C12:Me를 각각 18% 및 22% 더 많이 생산하였다. 상기 균주는 또한 E9/Z9-C12:Me 생산 증가도 보였다 (표 8). 상기 데이터는 시토크롬 b5와, 또는 헤모글로빈과 함께 데사투라제를 발현하는 것이 데사투라제만을 발현하는 균주보다 E8,E10-C12:Me를 더 많이 생산할 수 있다는 것을 보여주는 것이다.
H. 아르미게라 (HarCyb5) (균주 ST8411)로부터의 시토크롬 b5 이외에도 V. 스테르코라리아 (VHb) (ST9115)로부터의 헤모글로빈 발현은 E8,E10-C12:Me 및 E9/Z9-C12:Me 역가를 각각 21% 및 41%씩 각각 개선시켰다 (표 9). 상기 데이터는 시토크롬 b5 및 헤모글로빈과 데사투라제의 공동 발현이 상기 3개 중 단 하나만을 발현하는 균주보다 E8,E10-C12:Me 및 E9/Z9-C12:Me를 더 많이 생산할 수 있다는 것을 보여주는 것이다.
A. 세게툼으로부터의 지방 아실 리덕타제 (Ase_FAR)를 발현하는 균주 ST9250은 C12:OH, E9/Z9-C12:OH 및 E8,E10-C12:OH를 생산한 반면, T. 알바(T. alba)로부터의 지방 아실 리덕타제 (Ta_FAR, 서열 번호: 8)를 발현하는 균주 ST9249는 오직 C12:OH만을 생산하는 것으로 나타났다 (표 10).
실시예
7:
Δelo1
Y.
리폴리티카
균주에서의
E8,E10
-
C12:Me
생산 증가
균주 ST8406에서 내재 Y. 리폴리티카 유전자 ELO1 (YALI0_F06754g, 서열 번호: 13)을 결실시켜 균주 ST9060을 수득하였다. 균주를 실시예 4에 기술된 바와 같이 배양하고, 추출하고, 분석하였다. 내부 표준에 기초하여 지방산 메틸 에스테르의 농도를 계산하였다 (표 11). 균주 ST9060은 균주 ST8406과 비교하여 E8,E10-C12:Me 및 E9/Z9-C12:Me 생산을 각각 2.2배 및 1.6배 증가시키는 것으로 나타났다. 상기 데이터는 엘롱가제 유전자의 결실이 E8,E10-C12:Me 및 E9/Z9-C12:Me 생산을 증가시킬 수 있다는 것을 보여주는 것이다.
실시예
8: 유전자
YALI0
_
F14729g
,
YALI0
_
E18876g
또는
YALI0
_
D03597g의
결실을 함유하는 Y. 리폴리티카 균주에서의 E8,E10-C12:Me의 생산 증가
균주 ST8406에서 모두가 추정 티오에스테라제를 인코딩하는 것인, 내재 Y. 리폴리티카 유전자 YALI0_F14729g (서열 번호: 19), YALI0_E18876g (서열 번호: 54) 및 YALI0_D03597g (서열 번호: 55)를 결실시켜 각각 균주 ST9061, ST9062 및 ST9063을 수득하였다. 균주를 실시예 4에 기술된 바와 같이 배양하고, 추출하고, 분석하였다. 내부 표준에 기초하여 지방산 메틸 에스테르의 농도를 계산하였다 (표 12). 균주 ST9061은 균주 ST8406과 비교하여 E8,E10-C12:Me 및 E9/Z9-C12:Me 생산을 각각 1.6배 및 1.7배 증가시키는 것으로 나타났다. 균주 ST9062는 균주 ST8406과 비교하여 E8,E10-C12:Me 및 E9/Z9-C12:Me 생산을 각각 1.2배 및 1.3배 증가시키는 것으로 나타났다. 균주 ST9063은 균주 ST8406과 비교하여 E8,E10-C12:Me 및 E9/Z9-C12:Me 생산을 1.1배 증가시키는 것으로 나타났다. 상기 데이터는 내재 추정 티오에스테라제의 결실이 E8,E10-C12:Me 및 E9/Z9-C12:Me 생산을 증가시킬 수 있다는 것을 보여주는 것이다.
실시예
9:
데사투라제
Cpo
_
CPRQ에
아미노산 변형을 함유하는 Y.
리폴리티카
균주에서의 E8,E10-C12:Me 생산
균주 ST8406에서 단백질 Cpo_CPRQ 중 85번 위치의 아미노산을 세린 (S)에서 알라닌 (A)으로 변형시켜 균주 ST9072를 수득하였다. 균주를 실시예 4에 기술된 바와 같이 배양하고, 추출하고, 분석하였다. 내부 표준에 기초하여 지방산 메틸 에스테르의 농도를 계산하였다 (표 13).
Cpo_CPRQ_S85A를 발현하는 균주 ST9072는 균주 ST8406과 비교하여 E8,E10-C12:Me 생산을 213% 증가시키는 것으로 나타났다. 상기 데이터는 Cpo_CPRQ를 조작하여 E8,E10-C12:Me 및 E9/Z9-C12:Me 생산을 증가시킬 수 있다는 것을 보여주는 것이다.
실시예
10: 다른 유익한 변형과 함께 조합하여
데사투라제
Cpo
_
CPRQ
중의 아미노산 변형 (
S85A
)을 함유하는 Y.
리폴리티카
균주에서의
E8,E10
-
C12:Me
및 E8,E10-C12:OH 생산
ST9060으로부터 유래된 균주 ST9278은 2 카피의 Cpo_CPRQ 및 ELO1 결실을 함유한다. ST9060으로부터 유래된 균주 ST9279는 1 카피의 Cpo_CPRQ, 1 카피의 Cpo_CPRQ_S85A 및 ELO1 결실을 함유한다.
균주를 실시예 4에 기술된 바와 같이 배양하고, 추출하고, 분석하였다. 내부 표준에 기초하여 지방산 메틸 에스테르의 농도를 계산하였다 (표 14).
2 카피의 Cpo_CPRQ를 발현하고, ELO1 유전자에 결실을 갖는 균주 ST9278은 1 카피의 Cpo_CPRQ, 1 카피의 Cpo_CPRQ_S85A를 발현하고, ELO1 유전자에 결실을 갖는 균주 ST9279와 비교하여 E9/Z9-C12:Me 및 E8,E10-C12:Me를 더 적게 생산하는 것으로 나타났다.
ST9279로부터 유래된 균주 ST9355는 다른 변형 이외에도 VHb 및 HarCyb5를 발현한다. ST9355로부터 유래된 균주 ST9356은 다른 변형 이외에도 HarCyb5 및 HarCyb5 리덕타제 (서열 번호: 24)를 발현한다. ST9356으로부터 유래된 균주 ST9357은 다른 변형 이외에도 내재 Y. 리폴리티카 유전자 YALI0_F14729g의 결실을 함유한다. ST9357로부터 유래된 균주 ST9358은 다른 변형 이외에도 Ase_FAR을 발현한다. ST9279로부터 유래된 균주 ST9387은 다른 변형 이외에도 Ase_FAR을 발현한다. 균주를 실시예 4에 기술된 바와 같이 배양하고, 추출하고, 분석하였다. 내부 표준에 기초하여 지방산 메틸 에스테르 및 지방 알콜의 농도를 계산하였다 (표 15 및 16).
상기 데이터는 유익한 변형을 조합하여 더 높은 역가의 E8,E10-C12:Me 및 E9/Z9-C12:Me 뿐만 아니라, E8,E10-C12:OH 및 E9/Z9-C12:OH를 달성할 수 있다는 것을 보여주는 것이다.
실시예
11:
리덕타제
Ase
_FAR에 아미노산 변형을 함유하는 균주에서의 E8,E10-C12:OH 생산
균주 ST9250에서 단백질 Ase_FAR 중 198번 위치의 아미노산을 트레오닌 (T)에서 알라닌 (A)으로 변형시켜 균주 ST9335를 수득하였다. 균주 ST9250에서 단백질 Ase_FAR 중 423번 위치의 아미노산을 세린 (S)에서 알라닌 (A)으로 변형시켜 균주 ST9336을 수득하였다. 균주를 실시예 4에 기술된 바와 같이 배양하고, 추출하고, 분석하였다. 내부 표준에 기초하여 지방 알콜의 농도를 계산한다 (표 13).
실시예
12: 지방산
신타제
1 (
FAS1
) 및 지방산
신타제
2 (
FAS2
)에 아미노산 변형을 함유하는 Y.
리폴리티카
균주에서의
E8,E10
-
C12:OH
생산
균주 ST9387에서 Y. 리폴리티카의 FAS2 (서열 번호: 18) 중 1220번 위치의 아미노산을 이소류신 (I)에서 페닐알라닌 (F)으로 변형시켜 균주 ST9388을 수득하였다. 균주 ST9387에서 Y. 리폴리티카의 FAS2 중 1220번 위치의 아미노산을 이소류신 (I)에서 트립토판 (W)으로 변형시켜 균주 ST9420을 수득하였다. 균주 ST9420에서 Y. 리폴리티카의 FAS1 (서열 번호: 16) 중 123번 위치의 아미노산을 류신 (L)에서 발린 (V)으로 변형시켜 균주 ST9421을 수득하였다. 균주를 실시예 4에 기술된 바와 같이 배양하고, 추출하고, 분석하되, 단, 예외적으로, 생산 배지에 메틸 도데카노에이트를 첨가하지 않는다. 내부 표준에 기초하여 지방 알콜의 농도를 계산한다.
실시예
13: Y.
리폴리티카의
FAS2
중 아미노산 변형을 함유하는 Y.
리폴리티
카 균주에서의
E8,E10
-
C12:OH
뿐만 아니라
, C12 지방산 형성을 위해 E.
콜라이로부
터의 티오에스테라제
균주 ST9397은 Y. 리폴리티카로부터의 FAS1의 말단절단된 버전 및 E. 콜라이로부터의 티오에스테라제 TesA의 말단절단된 버전의 융합물을 발현한다 (Xu et al., 2016) (서열 번호: 59). 균주 ST9397을 Y. 리폴리티카로부터의 지방 아실-CoA 신타제를 함유하는 플라스미드로 형질전환시켜 균주 ST9398을 수득한다. 균주를 실시예 4에 기술된 바와 같이 배양하고, 추출하고, 분석하되, 단, 예외적으로, 유리관을 사용하였고, 지방 알콜을 전체 브로쓰로부터 추출하였다. 내부 표준에 기초하여 지방 알콜의 농도를 계산한다 (표 17).
Y. 리폴리티카로부터의 지방 아실-CoA 신타제의 발현은 E8,E10-12:OH 생산에 유의적인 영향을 미치지 않았다.
실시예
14: Y.
리폴리티카에서
퍼옥시좀에서의
쇄 단축을 통한
E8,E10
-C12:OH 생산
균주 ST9395에서 C12:CoA 전구체의 양을 증가시키기 위해, Y. 리폴리티카의 내재 퍼옥시좀 옥시다제 5개: POX1, POX2, POX3, POX4 및 POX5 (각각 YALI0_E32835g, YALI0_F10857g, YALI0_E32835g, YALI0_E27654g, YALI0_E27654g)를 결실시키고, 대신 예를 들어, 쿠쿠르비타 막시마로부터의 Cma_POX (서열 번호: 47)와 같은 이종성 퍼옥시좀 옥시다제를 발현한다.
Δ9-12:CoA 전구체의 양을 증가시키기 위해, 상기 언급된 균주는 추가로 예를 들어, 코리스토네우라 로사세아나로부터의 CroZ11 (서열 번호: 63), 또는 코리스토네우라 파랄레라로부터의 CpaE11 (서열 번호: 65)과 같은 Δ11-14 데사투라제를 발현한다. 이에 의해, Z/E11-14:CoA가 생산되고, Z/E9-12:CoA로 단축되고, 이는 이어서, 데사투라제 Cpo_CPRQ (서열 번호: 1)에 의해 E8,E10-C12로 추가로 전환된다.
균주를 실시예 4에 기술된 바와 같이 배양하고, 추출하고, 분석한다. 균주 ST9600, ST9607 및 ST9616의 배양물을 메틸 미리스테이트로 보충한다. 내부 표준에 기초하여 지방 알콜의 농도를 계산한다.
실시예
15:
사카로마이세스
세레비지아에에서의
E8,E10
-
C12:Me
및
E8,E10
-C12:OH 생산
프라이머 attB1_Cpo_CPRQ_F 및 attB1_Cpo_CPRQ_R을 사용하여 시디아 포모넬라 페로몬 샘 조직의 cDNA로부터 데사투라제 유전자 Cpo_CPRQ를 증폭시켰다.
PCR 생성물을 아가로스 겔 전기영동에 의해 분리하고, 위자드 SV 겔(Wizard SV Gel) 및 PCR 클린 업 시스템(PCR Clean up system) (프로메가 바이오테크 AB(Promega Biotech AB: 스웨덴))을 사용하여 정제하였다. 정제된 DNA는 게이트웨이 클로닝(Gateway Cloning) 기술 (라이프 테크놀러지즈)에 의해 pDONR221 벡터로 클로닝하였다. 생성된 벡터를 생어(Sanger) 시퀀싱에 의해 확인하고, 유전자를 벡터 pYEX-CHT로 서브클로닝하고 (문헌 [Patel et al, 2003]), 이어서, OLE1 및 ELO1 결핍 (MATa elo1 :: HIS3 ole1 :: LEU2 ade2 his3 leu2 ura3) 사카로마이세스 세레비지아에 균주로 형질전환하였다 (문헌 [Schneiter et al., 2000]). 양성 형질전환체의 선별을 위해, 세포를 0.7% YNB (황산암모늄 포함), 우라실 및 류신이 결여된 드롭-아웃(drop-out) 배지 (포르미디엄 LTD(Formedium LTD: 영국)), 2% 글루코스, 1% 테르지톨 (타입 노니데트 NP-40(Nonidet NP-40), 시그마-알드리치: 스웨덴), 0.01% 아데닌 (시그마-알드리치: 스웨덴) 및 0.5 mM 올레산 (시그마-알드리치: 스웨덴)을 함유하는 합성 완전 배지 상에서 배양하였다. 30℃에서 4일 동안 플레이트를 인큐베이션시킨 후, 개별 콜로니를 10 ml 선별 배지에 접종하였다. 배양물을 30℃에서 48 h 동안 인큐베이션시키고, 이를 사용하여 0.5 mM 지방산 메틸 에스테르 전구체 보충과 함께 2 mM CuSO4를 함유하는 10 ml 선별 배지에 OD600 0.4로 접종하였다. 48 h 동안의 인큐베이션 후, 3000 rpm으로 원심분리하여 세포를 수확하였다. 배지 상청액을 폐기하고, 유리관 중에서 3.75 ml의 메탄올/클로로포름 (2:1, v/v)을 사용하여 전체 지질을 추출하였다. 1 ml의 HAc (0.15 M) 및 1.25 ml의 물을 첨가하고, 상기 관을 와동시켰다. 상기 관을 2 min 동안 2000 rpm으로 원심분리하고, 하단의 클로로포름 상을 새 유리관으로 옮겼다. 지질을 지방산 메틸 에스테르 (FAME)로 전환시키기 위해, 질소 유동하에 용매를 증발시켰다. 메탄올 중 1 ml의 2% 황산을 첨가하고, 현탁액을 와동시키고, 90℃에서 1 h 동안 인큐베이션시켰다. 이후, 1 ml의 물을 첨가하고, 혼합하고, 1 ml의 헥산을 사용하여 FAME를 추출하였다. 질량 선택 검출기 HP 5973에 커플링된 휴렛 팩커드 6890 GC 상에서 샘플에 대해 GC-MS 분석을 수행하였다. GC에 HP-88 칼럼 (30 m x 0.25 mm x 0.25 ㎛)을 장착하였고, 헬륨을 운반 기체로 사용하였다 (평균 속도: 33 ms). MS는 전자 충격 모드 (70 eV)로 작동시켰고, 주입기는 220℃에서 비분할 모드로 구성하였다. 오븐 온도를 1 min 동안 80℃로 설정한 후, 이어서, 10℃/min의 비율로 210℃까지 증가시킨 후, 210℃에서 15 min 동안 유지시킨 후, 이어서, 10℃/min의 비율로 230℃까지 증가시킨 후, 230℃에서 20 min 동안 유지시켰다. 참조 표준으로서, 베도우키안(Bedoukian: 미국)로부터 E8,E10-12:OAc를 구입하고, 메탄올 중 0.5 M KOH 용액을 사용하여 가수분해하여 상응하는 알콜로 전환시켰다. 지방 알콜을 (문헌 [Bjostad and Roelofs, 1984])에 기술된 바와 같이 디메틸포름아미드 중 피리디늄 디크로메이트를 이용하여 상응하는 산으로 산화시켰다.
도 2의 크로마토그램은 E9-12:Me 및 E8,E10-12:Me가 Cpo_CPRQ를 발현하는 S. 세레비지아에 균주에서 각각 12:Me 및 E9-12:Me로부터 생성될 수 있다는 것을 보여준다.
실시예
16: Y.
리폴리티카에서의
Cpo
_
SPTQ
,
Cpo
_
NPVE
및
Cpo
_
CPRQ에
의한 E8,E10-C12:Me 생산
ST6629로부터의 유래된 균주 ST10136은 1 카피의 Cpo_SPTQ를 발현한다. ST6629로부터의 유래된 균주 ST10137은 1 카피의 Cpo_NPVE를 발현한다. ST8406으로부터의 유래된 균주 ST9064는 1 카피의 Cpo_CPRQ 및 1 카피의 Cpo_SPTQ를 발현한다. ST8406으로부터의 유래된 균주 ST9065는 1 카피의 Cpo_CPRQ 및 1 카피의 Cpo_NPVE를 발현한다. ST8406으로부터의 유래된 균주 ST9066은 2 카피의 Cpo_CPRQ를 발현한다. ST9065로부터의 유래된 균주 ST10138은 1 카피의 Cpo_CPRQ, 1 카피의 Cpo_NPVE 및 1 카피의 Cpo_SPTQ를 발현한다.
균주를 실시예 4에 기술된 바와 같이 배양하고, 추출하고, 분석하였다. 내부 표준에 기초하여 지방산 메틸 에스테르의 농도를 계산하였다 (표 18).
Cpo_SPTQ (ST10136)의 발현은 E9-C12:Me, Z9-C12:Me 또는 E8,E10-C12:Me 생산으로 이어지지 못했다. Cpo_NPVE (ST10137)의 발현으로 E9-C12:Me 및 Z9-C12:Me는 생산되었지만, E8,E10-C12:Me는 생산되지 못했다. ST8406 (각각 ST9064 및 ST9065)에서의 Cpo_SPTQ 또는 Cpo_NPVE의 추가 발현은 E8,E10-C12:Me를 증가시키지 못했다. ST8406 (ST9066)에서의 Cpo_CPRQ의 추가 카피의 발현은 E8,E10-C12:Me 및 E9/Z9-C12:Me 생산을 각각 2.8배 및 2.1배 증가시켰다. Cpo_CPRQ, Cpo_SPTQ 및 Cpo_NPVE (ST10138)의 조합 발현은 ST8406과 비교하여 E8,E10-C12:Me를 증가시키지 못했다. 이는 오직 Cpo_CPRQ의 발현만이 E8,E10-C12:Me를 생산한다는 것을 보여주는 것이다.
실시예
17: 다중 카피의 생합성 효소를 발현함으로써
E8,E10
-
C12:OH
생산
균주 ST9358은 실시예 10에 설명되어 있다. 균주 ST9495는 균주 ST9357 (실시예 10에 기술)로부터 유래된 것이고, 이는 데사투라제 Cpo_CPRQ 및 지방 아실 리덕타제 Ase_FAR 유전자의 추가 카피를 발현한다. 균주를 실시예 4에 기술된 바와 같이 배양하고, 추출하고, 분석하되, 단, 예외적으로, 유리관을 사용하였고, 지방 알콜을 전체 브로쓰로부터 추출하였다. 내부 표준에 기초하여 지방 알콜의 농도를 계산한다.
표 19는 추가 카피의 Cpo_CPRQ 및 Ase_FAR 유전자의 추가 카피가 E8,E10-12:OH 생산을 7.1 mg/L로 증가시킬 수 있다는 것을 보여준다.
실시예 18: 다양한 지방 아실 리덕타제 발현에 의해 코들레몬 생산
균주 ST9358 및 ST9623은 균주 ST9357로부터 유래된 것이다. 이는 각각 아그로티스 세게툼 및 아그로티스 입실론으로부터의 지방 아실 리덕타제를 추가로 발현한다. 균주를 실시예 4에 기술된 바와 같이 배양하고, 추출하고, 분석하였다.
표 20의 결과는 두 지방 아실 리덕타제 모두 E9-C12:OH 및 E8,E10-C12:OH를 생산할 수 있다는 것을 보여준다.
서열
참고문헌
항목
1. E8,E10-도데카디에닐 코엔자임 A 및 임의로, E8,E10-도데카디엔-1-올을 생산할 수 있는 효모 세포로서, 상기 효모 세포는 탄소 쇄 길이가 12인 지방 아실-CoA에 하나 이상의 이중 결합을 도입하여 상기 지방 아실-CoA를 탈포화된 지방 아실-CoA로 전환시킬 수 있는 적어도 하나의 이종성 데사투라제를 발현하고, 여기서, 상기 탈포화된 지방 아실-CoA의 적어도 일부는 E8,E10-도데카디에닐 코엔자임 A (E8,E10-C12:CoA)이고, 임의로, 여기서, 효모 세포는 블라케슬레아, 칸디다, 크립토코쿠스, 쿤닝하멜라, 리포마이세스, 모르티에렐라, 무코르, 피코마이세스, 피시움, 로도스포리디움, 로도토룰라, 트리코스포론, 사카로마이세스 및 야로위아로부터 선택되는 속에 속하고, 임의로, 여기서, 효모 세포는 블라케슬레아 트리스포라, 칸디다 풀케리마, C. 레브카우피, C. 트로피칼리스, 크립토코쿠스 쿠르바투스, 쿤닝하멜라 에키눌라타, C. 엘레간스, C. 자포니카, 리포마이세스 스타키, L. 리포페루스, 모르티에렐라 알피나, M. 이사벨리나, M. 라만니아나, M. 비나세아, 무코르 키르키넬로이데스, 피코마이세스 블라케스레아누스, 피시움 이레굴라레, 로도스포리디움 토룰로이데스, 로도토룰라 글루티니스, R. 그라실리스, R. 그라미니스, R. 무실라기노사, R. 피니콜라, 트리코스포론 풀란스, T. 쿠타네움, 사카로마이세스 세레비지아에 및 야로위아 리폴리티카로부터 선택되는 종에 속하고, 바람직하게, 효모 세포는 야로위아 리폴리티카 세포 또는 사카로마이세스 세레비지아에 세포인 것인 효모 세포.
2. E8,E10-도데카디에닐 코엔자임 A 및 임의로, E8,E10-도데카디엔-1-올을 생산할 수 있는 효모 세포로서, 상기 효모 세포는 탄소 쇄 길이가 12인 지방 아실-CoA에 하나 이상의 이중 결합을 도입하여 상기 지방 아실-CoA를 탈포화된 지방 아실-CoA로 전환시킬 수 있는 적어도 하나의 이종성 데사투라제를 발현하고, 여기서, 상기 탈포화된 지방 아실-CoA의 적어도 일부는 E8,E10-도데카디에닐 코엔자임 A (E8,E10-C12:CoA)인 것인 효모 세포.
3. 전술한 항목 중 하나에 따라, 효모 세포가 E8,E10-도데카디엔-1-올을 생산할 수 있고, 상기 효모 세포는 상기 탈포화된 지방 아실-CoA의 적어도 일부를 탈포화된 지방 알콜로 전환시킬 수 있는 적어도 하나의 이종성 지방 아실-CoA 리덕타제 (EC 1.2.1.84)로서, 여기서, 지방 아실-CoA 리덕타제는 상기 E8,E10-도데카디에닐 코엔자임 A (E8,E10-C12:CoA)의 적어도 일부를 E8,E10-도데카디엔-1-올로 전환시킬 수 있는 것인 적어도 하나의 이종성 지방 아실-CoA 리덕타제 (EC 1.2.1.84)를 추가로 발현하는 것인 효모 세포.
4. E8,E10-도데카디엔-1-올을 생산할 수 있는 효모 세포로서, 상기 효모 세포는
i) 탄소 쇄 길이가 12인 지방 아실-CoA에 하나 이상의 이중 결합을 도입하여 상기 지방 아실-CoA를 탈포화된 지방 아실-CoA로 전환시킬 수 있는 적어도 하나의 이종성 데사투라제로서, 여기서, 상기 탈포화된 지방 아실-CoA의 적어도 일부는 E8,E10-도데카디에닐 코엔자임 A (E8,E10-C12:CoA)인 것인 적어도 하나의 이종성 데사투라제; 및
ii) 상기 탈포화된 지방 아실-CoA의 적어도 일부를 탈포화된 지방 알콜로 전환시킬 수 있는 적어도 하나의 이종성 지방 아실-CoA 리덕타제 (EC 1.2.1.84)로서, 여기서, 지방 아실-CoA 리덕타제는 상기 E8,E10-도데카디에닐 코엔자임 A (E8,E10-C12:CoA)의 적어도 일부를 E8,E10-도데카디엔-1-올로 전환시킬 수 있는 것인 적어도 하나의 이종성 지방 아실-CoA 리덕타제 (EC 1.2.1.84)를 발현하는 것인 효모 세포.
5. 전술한 항목 중 하나에 따라, 효모 세포가 블라케슬레아 속, 칸디다 속, 크립토코쿠스 속, 쿤닝하멜라 속, 리포마이세스 속, 모르티에렐라 속, 무코르 속, 피코마이세스 속, 피시움 속, 로도스포리디움 속, 로도토룰라 속, 트리코스포론 속, 사카로마이세스 속 및 야로위아 속으로부터 선택되는 속에 속하는 것인 효모 세포.
6. 전술한 항목 중 하나에 따라, 효모 세포가 블라케슬레아 트리스포라, 칸디다 풀케리마, C. 레브카우피, C. 트로피칼리스, 크립토코쿠스 쿠르바투스, 쿤닝하멜라 에키눌라타, C. 엘레간스, C. 자포니카, 리포마이세스 스타키, L. 리포페루스, 모르티에렐라 알피나, M. 이사벨리나, M. 라만니아나, M. 비나세아, 무코르 키르키넬로이데스, 피코마이세스 블라케스레아누스, 피시움 이레굴라레, 로도스포리디움 토룰로이데스, 로도토룰라 글루티니스, R. 그라실리스, R. 그라미니스, R. 무실라기노사, R. 피니콜라, 트리코스포론 풀란스, T. 쿠타네움, 사카로마이세스 세레비지아에 및 야로위아 리폴리티카로부터 선택되는 종에 속하는 것인 효모 세포.
7. 전술한 항목 중 하나에 따라, 효모 세포가 야로위아 속 또는 사카로마이세스 속의 것이고, 바람직하게, 효모 세포가 야로위아 리폴리티카 세포 또는 사카로마이세스 세레비지아에 세포인 것인 효모 세포.
8. 전술한 항목 중 하나에 따라, 적어도 하나의 데사투라제가 Gmo_CPRQ (서열 번호: 77), 또는 Cpo_CPRQ (서열 번호: 2), 또는 서열 번호: 77 또는 서열 번호: 2와 적어도 65%의 상동성 또는 동일성, 예컨대, 적어도 70%의 상동성 또는 동일성, 예컨대, 적어도 71%의 상동성 또는 동일성, 예컨대, 적어도 72%, 예컨대, 적어도 73%, 예컨대, 적어도 74%, 예컨대, 적어도 75%, 예컨대, 적어도 80%, 예컨대, 적어도 81%, 예컨대, 적어도 82%, 예컨대, 적어도 83%, 예컨대, 적어도 84%, 예컨대, 적어도 85%, 예컨대, 적어도 86%, 예컨대, 적어도 87%, 예컨대, 적어도 88%, 예컨대, 적어도 89%, 예컨대, 적어도 90%, 예컨대, 적어도 91%, 예컨대, 적어도 92%, 예컨대, 적어도 93%, 예컨대, 적어도 94%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%의 상동성 또는 동일성을 갖는, 이의 기능성 변이체이고, 바람직하게, 적어도 하나의 데사투라제가 Cpo_CPRQ 또는 이의 기능성 변이체이거나; 또는 적어도 하나의 데사투라제가 적어도 2개의 데사투라제이고, 여기서, 상기 2개의 데사투라제 중 적어도 하나는 Gmo_CPRQ (서열 번호: 77), 또는 Cpo_CPRQ (서열 번호: 2), 또는 서열 번호: 77 또는 서열 번호: 2와 적어도 65%의 상동성 또는 동일성, 예컨대, 적어도 70%의 상동성 또는 동일성, 예컨대, 적어도 71%의 상동성 또는 동일성, 예컨대, 적어도 72%, 예컨대, 적어도 73%, 예컨대, 적어도 74%, 예컨대, 적어도 75%, 예컨대, 적어도 80%, 예컨대, 적어도 81%, 예컨대, 적어도 82%, 예컨대, 적어도 83%, 예컨대, 적어도 84%, 예컨대, 적어도 85%, 예컨대, 적어도 86%, 예컨대, 적어도 87%, 예컨대, 적어도 88%, 예컨대, 적어도 89%, 예컨대, 적어도 90%, 예컨대, 적어도 91%, 예컨대, 적어도 92%, 예컨대, 적어도 93%, 예컨대, 적어도 94%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%의 상동성 또는 동일성을 갖는, 이의 기능성 변이체이고, 바람직하게, 적어도 하나의 데사투라제는 Cpo_CPRQ 또는 이의 기능성 변이체이고, 및 다른 데사투라제는 탄소 쇄 길이가 12인 지방 아실-CoA에 적어도 하나의 이중 결합을 도입할 수 있는 데사투라제, 예컨대, Z9-12 데사투라제, 바람직하게 Cpo_NPVE (서열 번호: 67), 또는 Cpo_SPTQ (서열 번호: 69), 또는 서열 번호: 67 또는 서열 번호: 69와 적어도 65%의 상동성 또는 동일성, 예컨대, 적어도 70%의 상동성 또는 동일성, 예컨대, 적어도 71%의 상동성 또는 동일성, 예컨대, 적어도 72%, 예컨대, 적어도 73%, 예컨대, 적어도 74%, 예컨대, 적어도 75%, 예컨대, 적어도 80%, 예컨대, 적어도 81%, 예컨대, 적어도 82%, 예컨대, 적어도 83%, 예컨대, 적어도 84%, 예컨대, 적어도 85%, 예컨대, 적어도 86%, 예컨대, 적어도 87%, 예컨대, 적어도 88%, 예컨대, 적어도 89%, 예컨대, 적어도 90%, 예컨대, 적어도 91%, 예컨대, 적어도 92%, 예컨대, 적어도 93%, 예컨대, 적어도 94%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%의 상동성 또는 동일성을 갖는, 이의 기능성 변이체인 것인 효모 세포.
9. 전술한 항목 중 하나에 따라, 데사투라제가 85번 위치에 돌연변이, 예컨대 S85A 돌연변이, 를 갖는 Cpo_CPRQ의 돌연변이체인 효모 세포.
10. 전술한 항목 중 하나에 따라, 적어도 하나의 이종성 데사투라제가 적어도 2개의 상이한 이종성 데사투라제, 예컨대, 서열 번호: 2에 기재된 바와 같은 Cpo_CPRQ, 및 85번 위치에 돌연변이, 예컨대 S85A 돌연변이, 를 갖는 Cpo_CPRQ의 돌연변이체인 효모 세포.
11. 전술한 항목 중 하나에 따라, 지방 아실-CoA 리덕타제가 Ase_FAR (서열 번호: 10), Aip_FAR (서열 번호: 61), Hs_FAR (서열 번호: 71), Has_FAR (서열 번호: 73), Hv_FAR (서열 번호: 75), Har_FAR (서열 번호: 12), Cpo_FAR (서열 번호: 76), 및 이와 적어도 65%의 상동성 또는 동일성, 예컨대, 적어도 70%의 상동성 또는 동일성, 예컨대, 적어도 71%의 상동성 또는 동일성, 예컨대, 적어도 72%, 예컨대, 적어도 73%, 예컨대, 적어도 74%, 예컨대, 적어도 75%, 예컨대, 적어도 80%, 예컨대, 적어도 81%, 예컨대, 적어도 82%, 예컨대, 적어도 83%, 예컨대, 적어도 84%, 예컨대, 적어도 85%, 예컨대, 적어도 86%, 예컨대, 적어도 87%, 예컨대, 적어도 88%, 예컨대, 적어도 89%, 예컨대, 적어도 90%, 예컨대, 적어도 91%, 예컨대, 적어도 92%, 예컨대, 적어도 93%, 예컨대, 적어도 94%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%의 상동성 또는 동일성을 갖는, 이의 기능성 변이체로 구성된 군으로부터 선택되는 것인 효모 세포.
12. 전술한 항목 중 하나에 따라, 지방 아실-CoA 리덕타제가 Ase_FAR의 돌연변이체, 예컨대, 198번 또는 413번 위치에 돌연변이, 바람직하게 T198A 돌연변이 또는 S413A 돌연변이, 를 갖는 돌연변이체인 효모 세포.
13. 전술한 항목 중 하나에 따라, 이종성 데사투라제가 높은 수준으로 발현되는 것인 효모 세포.
14. 전술한 항목 중 하나에 따라, 이종성 지방 아실-CoA 리덕타제가 높은 수준으로 발현되는 것인 효모 세포.
15. 전술한 항목 중 하나에 따라, 효모 세포가 E8,E10-C12:CoA의 이용가능성을 증가시키도록 추가로 변형되는 것인 효모 세포.
16. 전술한 항목 중 하나에 따라, 이종성 시토크롬 b5, 예컨대, 레피도프테라 종으로부터의 시토크롬 b5, 예컨대, 헬리코베르파 아르미게라로부터의 시토크롬 b5, 바람직하게, 서열 번호: 4에 기재된 시토크롬 b5 HarCyb5, 또는 이와 적어도 65%의 상동성 또는 동일성, 예컨대, 적어도 70%의 상동성 또는 동일성, 예컨대, 적어도 71%의 상동성 또는 동일성, 예컨대, 적어도 72%, 예컨대, 적어도 73%, 예컨대, 적어도 74%, 예컨대, 적어도 75%, 예컨대, 적어도 80%, 예컨대, 적어도 85%, 예컨대, 적어도 90%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%의 상동성 또는 동일성을 갖는, 이의 기능성 변이체를 추가로 발현하는 효모 세포.
17. 전술한 항목 중 하나에 따라, 이종성 시토크롬 b5 리덕타제 (EC 1.6.2.2), 예컨대, 레피도프테라 종, 예컨대, 헬리코베르파 아르미게라로부터의 시토크롬 b5 리덕타제를 추가로 발현하고, 바람직하게, 시토크롬 b5 리덕타제는 서열 번호: 24에 기재된, 헬리코베르파 아르미게라로부터의 시토크롬 b5 리덕타제, 또는 이와 적어도 65%의 상동성 또는 동일성, 예컨대, 적어도 70%의 상동성 또는 동일성, 예컨대, 적어도 71%의 상동성 또는 동일성, 예컨대, 적어도 72%, 예컨대, 적어도 73%, 예컨대, 적어도 74%, 예컨대, 적어도 75%, 예컨대, 적어도 80%, 예컨대, 적어도 85%, 예컨대, 적어도 90%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%의 상동성 또는 동일성을 갖는, 이의 기능성 변이체인 것인 효모 세포.
18. 전술한 항목 중 하나에 따라, 헤모글로빈, 예컨대, 비트레오스킬라 스테르코라리아로부터의 헤모글로빈, 바람직하게, 서열 번호: 6에 기재된, 비트레오스킬라 스테르코라리아로부터의 헤모글로빈, 또는 이와 적어도 65%의 상동성 또는 동일성, 예컨대, 적어도 70%의 상동성 또는 동일성, 예컨대, 적어도 71%의 상동성 또는 동일성, 예컨대, 적어도 72%, 예컨대, 적어도 73%, 예컨대, 적어도 74%, 예컨대, 적어도 75%, 예컨대, 적어도 80%, 예컨대, 적어도 85%, 예컨대, 적어도 90%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%의 상동성 또는 동일성을 갖는, 이의 기능성 변이체를 추가로 발현하는 효모 세포.
19. 전술한 항목 중 하나에 따라, 엘롱가제를 인코딩하고, 엘롱가제 활성의 부분적 또는 전체적인 손실을 초래하는 하나 이상의 유전자의 돌연변이, 예컨대, Elo1 활성의 부분적 또는 전체적인 손실을 초래하는 ELO1 유전자 (서열 번호: 13)의 돌연변이를 추가로 포함하고, 바람직하게, 여기서, 상기 돌연변이는 결실인 것인 효모 세포.
20. 전술한 항목 중 하나에 따라, 티오에스테라제를 코딩하고, 티오에스테라제 활성의 부분적 또는 전체적인 손실을 초래하는 하나 이상의 유전자의 돌연변이, 예컨대, YAL10_F14729g 유전자 (서열 번호: 19)의 돌연변이, YALI0_E18876g 유전자 (서열 번호: 54)의 돌연변이, 또는 YALI0 _ D03597g (서열 번호: 55)의 돌연변이를 추가로 포함하고, 바람직하게, 여기서, 상기 돌연변이는 결실인 것인 효모 세포.
21. 전술한 항목 중 하나에 따라, 적어도 하나의 변형, 예컨대, Hfd1, Hfd2, Hfd3, Hfd4, Fao1, GPAT 및 Pex10 중 적어도 하나의 활성 감소를 초래하는 적어도 하나의 돌연변이를 추가로 포함하거나, 또는 적어도 하나의 변형, 예컨대, 적어도 하나의 단백질의 활성 감소를 초래하고, 이와 적어도 60%의 상동성 또는 동일성, 예컨대, 이와 적어도 65%의 상동성 또는 동일성, 예컨대, 적어도 70%의 상동성 또는 동일성, 예컨대, 적어도 75%의 상동성 또는 동일성, 예컨대, 적어도 80%의 상동성 또는 동일성, 예컨대, 적어도 81%의 상동성 또는 동일성, 예컨대, 적어도 82%의 상동성 또는 동일성, 예컨대, 적어도 83%의 상동성 또는 동일성, 예컨대, 적어도 84%의 상동성 또는 동일성, 예컨대, 적어도 85%의 상동성 또는 동일성, 예컨대, 적어도 86%의 상동성 또는 동일성, 예컨대, 적어도 87%의 상동성 또는 동일성, 예컨대, 적어도 88%의 상동성 또는 동일성, 예컨대, 적어도 89%의 상동성 또는 동일성, 예컨대, 적어도 90%의 상동성 또는 동일성, 예컨대, 적어도 91%의 상동성 또는 동일성, 예컨대, 적어도 92%의 상동성 또는 동일성, 예컨대, 적어도 93%의 상동성 또는 동일성, 예컨대, 적어도 94%의 상동성 또는 동일성, 예컨대, 적어도 95%의 상동성 또는 동일성, 예컨대, 적어도 96%의 상동성 또는 동일성, 예컨대, 적어도 97%의 상동성 또는 동일성, 예컨대, 적어도 98%의 상동성 또는 동일성, 예컨대, 적어도 99%의 상동성 또는 동일성을 갖는 적어도 하나의 돌연변이를 갖는 효모 세포.
22. 전술한 항목 중 하나에 따라, 여기서, 효모 세포가 변형된 케톤 신타제 도메인을 갖는 지방 아실 신타제 변이체를 추가로 발현하고, 여기서, 상기 지방 아실 신타제 변이체는 Fas1 (서열 번호: 16), 또는 Fas2 (서열 번호: 18)의 변이체, 예컨대, 123번 위치에 돌연변이를 갖는 돌연변이체 Fas1, 바람직하게, L123V 돌연변이, 또는 1220번 위치에 돌연변이를 갖는 돌연변이체 Fas2, 바람직하게, I1220F 또는 I1220W 돌연변이인 것인 효모 세포.
23. 전술한 항목 중 하나에 따라, 효모 세포가 티오에스테라제, 예컨대, 이종성 티오에스테라제를 추가로 발현하고, 임의로, 여기서, 티오에스테라제가 높은 수준으로 발현하는 것인 효모 세포.
24. 항목 23에 따라, 티오에스테라제가 서열 번호: 33에 기재된, 쿠페아 팔루스트리스로부터의 티오에스테라제, 서열 번호: 57에 기재된, 쿠페아 후케리아나로부터의 티오에스테라제, 서열 번호: 35에 기재된, 신나모멈 캠포라로부터의 티오에스테라제, 또는 서열 번호: 26에 기재된, 에스케리키아 콜라이로부터의 티오에스테라제와 적어도 60%의 상동성 또는 동일성을 갖고, 바람직하게, 티오에스테라제가 서열 번호: 35에 기재된, 신나모멈 캠포라로부터의 티오에스테라제, 또는 서열 번호: 26에 기재된, 에스케리키아 콜라이로부터의 티오에스테라제와 적어도 60%의 상동성 또는 동일성을 갖는 것인 효모 세포.
25. 전술한 항목 중 하나에 따라, 효모 세포가 말단절단된 지방 아실 신타제 및 말단절단된 티오에스테라제의 융합 단백질, 예컨대, 서열 번호: 59에 기재된 융합 단백질, 또는 이와 적어도 60%의 상동성 또는 동일성을 갖는, 이의 동족체를 추가로 발현하는 것인 효모 세포.
26. 전술한 항목 중 하나에 따라, 효모 세포가 상기 이종성 데사투라제를 인코딩하는 핵산 및 상기 이종성 지방 아실-CoA 리덕타제를 인코딩하는 핵산을 포함하는 것인 효모 세포.
27. 항목 26에 따라, 이종성 데사투라제를 인코딩하는 핵산 및/또는 상기 이종성 지방 아실-CoA 리덕타제를 인코딩하는 핵산이 높은 카피수로 존재하는 것인 효모 세포.
28. 항목 26 내지 27 중 하나에 따라, 상기 이종성 데사투라제를 인코딩하는 핵산이 서열 번호: 1에 기재된 것, 또는 이와 적어도 60%의 상동성 또는 동일성을 갖는, 이의 동족체, 또는 서열 번호: 78에 기재된 것, 또는 이와 적어도 60%의 상동성 또는 동일성을 갖는, 이의 동족체인 것인 효모 세포.
29. 항목 26 내지 28 중 하나에 따라, 상기 이종성 지방 아실-CoA 리덕타제를 인코딩하는 핵산이 서열 번호: 9에 기재된 것, 또는 이와 적어도 60%의 상동성 또는 동일성을 갖는, 이의 동족체인 것인 효모 세포.
30. 전술한 항목 중 하나에 따라, 효모 세포가 상기 이종성 시토크롬 b5를 인코딩하는 핵산, 상기 이종성 시토크롬 b5 리덕타제를 인코딩하는 핵산, 상기 헤모글로빈을 인코딩하는 핵산, 상기 지방산 신타제 변이체를 인코딩하는 핵산, 상기 티오에스테라제를 인코딩하는 핵산, 및/또는 상기 융합 단백질을 인코딩하는 핵산을 포함하는 것인 효모 세포.
31. 항목 30에 따라, 상기 이종성 시토크롬 b5를 인코딩하는 핵산, 상기 이종성 시토크롬 b5 리덕타제를 인코딩하는 핵산, 상기 헤모글로빈을 인코딩하는 핵산, 상기 지방산 신타제 변이체를 인코딩하는 핵산, 및/또는 상기 티오에스테라제를 인코딩하는 핵산이 높은 카피수로 존재하는 것인 효모 세포.
32. 전술한 항목 중 하나에 따라, 상기 이종성 데사투라제를 코딩하는 핵산, 상기 이종성 지방 아실-CoA 리덕타제를 인코딩하는 핵산, 상기 이종성 시토크롬 b5를 인코딩하는 핵산, 상기 이종성 시토크롬 b5 리덕타제를 인코딩하는 핵산, 상기 헤모글로빈을 인코딩하는 핵산, 상기 지방산 신타제 변이체를 인코딩하는 핵산, 및/또는 상기 티오에스테라제를 인코딩하는 핵산이 효모 세포에서의 발현을 위해 코돈 최적화된 것인 효모 세포.
33. 항목 30 내지 32 중 하나에 따라, 상기 이종성 시토크롬 b5를 인코딩하는 핵산이 서열 번호: 3에 기재된 것, 또는 이와 적어도 60%의 상동성 또는 동일성을 갖는, 이의 동족체이고/거나, 상기 이종성 시토크롬 b5 리덕타제를 인코딩하는 핵산이 서열 번호: 23에 기재된 것, 또는 이와 적어도 60%의 상동성 또는 동일성을 갖는, 이의 동족체이고/거나, 상기 헤모글로빈을 인코딩하는 핵산이 서열 번호: 5에 기재된 것, 또는 이와 적어도 60%의 상동성 또는 동일성을 갖는, 이의 동족체이고/거나, 상기 티오에스테라제를 코딩하는 핵산이 서열 번호: 25 또는 서열 번호: 34에 기재된 것, 또는 이와 적어도 60%의 상동성 또는 동일성을 갖는, 서열 번호: 25 또는 서열 번호: 34의 동족체인 것인 효모 세포.
34. 전술한 항목 중 하나에 따라, 효모 세포가 적어도 0.5 mg/L, 예컨대, 적어도 0.6 mg/L, 예컨대, 적어도 0.7 mg/L, 예컨대, 적어도 0.8 mg/L, 예컨대, 적어도 0.9 mg/L, 예컨대, 적어도 1 mg/L, 예컨대, 적어도 1.5 mg/L, 예컨대, 적어도 2.5 mg/L, 예컨대, 적어도 5.0 mg/L, 예컨대, 적어도 10 mg/L, 예컨대, 적어도 15 mg/L, 예컨대, 적어도 20 mg/L, 예컨대, 25 mg/L, 예컨대, 적어도 50 mg/L, 예컨대, 적어도 100 mg/L, 예컨대, 적어도 250 mg/L, 예컨대, 적어도 500 mg/L, 예컨대, 적어도 750 mg/L, 예컨대, 적어도 1 g/L, 예컨대, 적어도 2 g/L, 예컨대, 적어도 3 g/L, 예컨대, 적어도 4 g/L, 예컨대, 적어도 5 g/L, 예컨대, 적어도 6 g/L, 예컨대, 적어도 7 g/L, 예컨대, 적어도 8 g/L, 예컨대, 적어도 9 g/L, 예컨대, 적어도 10 g/L 이상의 역가로 E8,E10-도데카디엔-1-올을 생산할 수 있는 것인 효모 세포.
35. 전술한 항목 중 하나에 따라, 효모 세포가 E8,E10-도데카디엔-1-올의 적어도 일부를 E8,E10-도데카디에닐 아세테이트로 전환시킬 수 있는 아세틸트랜스퍼라제 (EC 2.3.1.84)를 추가로 발현하고, 이로써, 효모 세포는 E8,E10-도데카디에닐 아세테이트를 생산할 수 있는 것인 효모 세포.
36. 항목 35에 따라, 아세틸트랜스퍼라제가 상기 효모 세포로부터 발현된 이종성 아세틸트랜스퍼라제 (AcT), 또는 상기 효모 세포로부터 과다발현된 천연 아세틸트랜스퍼라제인 것인 효모 세포.
37. 항목 35 또는 36 중 하나에 따라, 아세틸트랜스퍼라제가 Sc_Atf1 (서열 번호: 37), 또는 이와 적어도 60%의 상동성 또는 동일성, 예컨대, Sc_Atf1 (서열 번호: 37)과 적어도 61%의 상동성 또는 동일성, 예컨대, 적어도 62%의 상동성 또는 동일성, 예컨대, 적어도 63%의 상동성 또는 동일성, 예컨대, 적어도 64%의 상동성 또는 동일성, 예컨대, 적어도 65%의 상동성 또는 동일성, 예컨대, 적어도 66%의 상동성 또는 동일성, 예컨대, 적어도 67%의 상동성 또는 동일성, 예컨대, 적어도 68%의 상동성 또는 동일성, 예컨대, 적어도 69%의 상동성 또는 동일성, 예컨대, 적어도 70%의 상동성 또는 동일성, 예컨대, 적어도 71%의 상동성 또는 동일성, 예컨대, 적어도 72%, 예컨대, 적어도 73%, 예컨대, 적어도 74%, 예컨대, 적어도 75%, 예컨대, 적어도 76%, 예컨대, 적어도 77%, 예컨대, 적어도 78%, 예컨대, 적어도 79%, 예컨대, 적어도 80%, 예컨대, 적어도 81%, 예컨대, 적어도 82%, 예컨대, 적어도 83%, 예컨대, 적어도 84%, 예컨대, 적어도 85%, 예컨대, 적어도 86%, 예컨대, 적어도 87%, 예컨대, 적어도 88%, 예컨대, 적어도 89%, 예컨대, 적어도 90%, 예컨대, 적어도 91%, 예컨대, 적어도 92%, 예컨대, 적어도 93%, 예컨대, 적어도 94%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%의 상동성 또는 동일성을 갖는, 이의 변이체인 것인 효모 세포.
38. 전술한 항목 중 하나에 따라, 효모 세포가 E8,E10-도데카디엔-1-올의 적어도 일부를 E8,E10-도데카디에날로 전환시킬 수 있는 알데히드 형성 지방 아실-CoA 리덕타제 (EC 1.2.1.50), 알콜 데히드로게나제 (EC 1.1.1.2) 및/또는 지방 알콜 옥시다제 (EC 1.1.3.20)를 추가로 발현하는 것인 효모 세포.
39. 전술한 항목 중 하나에 따라, 효모 세포가 추가로
i) 하나 이상의 천연 아실-CoA 옥시다제의 활성을 감소시키는 하나 이상의 돌연변이를 갖고;
ii) 지방 아실-CoA를 산화시킬 수 있는 적어도 하나의 아실-CoA 옥시다제를 포함하는 적어도 하나의 효소 군을 발현하고, 여기서, 효소 군은 제1 탄소 쇄 길이가 X인 지방 아실-CoA를 제2 탄소 쇄 길이 X'인 단축된 지방 아실-CoA로 단축시킬 수 있고, 여기서, X' ≤ X-2인 것인 것인 효모 세포.
40. 항목 39에 따라, X'=12인 것인 효모 세포.
41. 항목 39 내지 40 중 하나에 따라, 효모 세포가 탄소 쇄 길이가 X인 지방 아실-CoA에 적어도 하나의 이중 결합을 도입할 수 있는 데사투라제, 예컨대, CroZ11 데사투라제 (서열 번호: 63), 또는 CpaE11 데사투라제 (서열 번호: 65), 또는 서열 번호: 63, 서열 번호: 65와 적어도 65%의 상동성 또는 동일성, 예컨대, 적어도 70%의 상동성 또는 동일성, 예컨대, 적어도 71%의 상동성 또는 동일성, 예컨대, 적어도 72%, 예컨대, 적어도 73%, 예컨대, 적어도 74%, 예컨대, 적어도 75%, 예컨대, 적어도 80%, 예컨대, 적어도 81%, 예컨대, 적어도 82%, 예컨대, 적어도 83%, 예컨대, 적어도 84%, 예컨대, 적어도 85%, 예컨대, 적어도 86%, 예컨대, 적어도 87%, 예컨대, 적어도 88%, 예컨대, 적어도 89%, 예컨대, 적어도 90%, 예컨대, 적어도 91%, 예컨대, 적어도 92%, 예컨대, 적어도 93%, 예컨대, 적어도 94%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%의 상동성 또는 동일성을 갖는, 이의 기능성 변이체를 추가로 발현하는 것인 효모 세포.
42. 항목 39 내지 42 중 하나에 따라, i)의 천연 아실-CoA 옥시다제 및/또는 ii)의 아실-CoA 옥시다제가 퍼옥시좀 아실-CoA 옥시다제인 것인 효모 세포.
43. 항목 39 내지 41 중 하나에 따라, ii)의 적어도 하나의 아실-CoA 옥시다제가 천연 아실-CoA 옥시다제 또는 이종성 아실-CoA 옥시다제이고, 이는 임의로, 상기 적어도 하나의 효소 군을 발현하지 않는 참조 효모 균주와 비교하여 과다발현되고, 바람직하게, ii)의 효소 군의 적어도 하나의 아실-CoA 옥시다제가 이종성 아실-CoA 옥시다제인 것인 효모 세포.
44. 항목 39 내지 43 중 하나에 따라, ii)의 효소 군이 야로위아 속, 아그로티스 속, 아라비돕시스 속, 아스페르길루스 속, 쿠쿠르비타 속, 호모 사피엔스 속, 파에나트로박터 속 및 라투스 속으로부터 선택되는 속의 유기체로부터 유래된 아실-CoA 옥시다제를 포함하고, 바람직하게, 적어도 하나의 제1 효소 군이 야로위아 리폴리티카, 아그로티스 세게툼, 아라비돕시스 탈리아나, 아스페르길루스 니둘란스, 쿠쿠르비타 막시마, 호모 사피엔스, 파에나트로박터 우레아파키엔스 또는 라투스 노르베기쿠스로부터 유래된 아실-CoA 옥시다제를 포함하고, 바람직하게, 제1 효소 군의 적어도 하나의 아실-CoA 옥시다제가 Yli_POX1 (XP_504703), Yli_POX2 (XP_505264), Yli_POX3 (XP_503244), Yli_POX4 (XP_504475), Yli_POX5 (XP_502199), Yli_POX6 (XP_503632), Ase_POX (서열 번호: 39), Ath_POX1 (서열 번호: 41), Ath_POX2 (서열 번호: 43), Ani_POX (서열 번호: 45), Cma_POX (서열 번호: 47), Hsa_POX1-2 (서열 번호: 49), Pur_POX (서열 번호: 51), Sc_POX1 (서열 번호: 31) 및 Rno_POX2 (서열 번호: 53)로 구성된 군으로부터 선택되는 아실-CoA 옥시다제, 또는 이와 적어도 60%의 상동성 또는 동일성, 예컨대, 이와 적어도 65%, 예컨대, 적어도 70%, 예컨대, 적어도 75%, 예컨대, 적어도 80%, 예컨대, 적어도 81%, 예컨대, 적어도 82%, 예컨대, 적어도 83%, 예컨대, 적어도 84%, 예컨대, 적어도 85%, 예컨대, 적어도 86%, 예컨대, 적어도 87%, 예컨대, 적어도 88%, 예컨대, 적어도 89%, 예컨대, 적어도 90%, 예컨대, 적어도 91%, 예컨대, 적어도 92%, 예컨대, 적어도 93%, 예컨대, 적어도 94%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%의 상동성 또는 동일성을 갖는, 이의 기능성 변이체인 것인 효모 세포.
45. 효모 세포를 제공하는 단계, 및 배지 중에서 효모 세포를 인큐베이션시켜 E8,E10-도데카디에닐 코엔자임 A 및 임의로, E8,E10-도데카디엔-1-올을 제조하는 단계를 포함하고, 여기서, 효모 세포는
i) 탄소 쇄 길이가 12인 지방 아실-CoA에 하나 이상의 이중 결합을 도입하여 상기 지방 아실-CoA를 탈포화된 지방 아실-CoA로 전환시킬 수 있는 적어도 하나의 이종성 데사투라제로서, 여기서, 상기 탈포화된 지방 아실-CoA의 적어도 일부는 E8,E10-도데카디에닐 코엔자임 A (E8,E10-C12:CoA)인 것인 적어도 하나의 이종성 데사투라제; 및
ii) 임의로, 상기 탈포화된 지방 아실-CoA의 적어도 일부를 탈포화된 지방 알콜로 전환시킬 수 있는 적어도 하나의 이종성 지방 아실-CoA 리덕타제 (EC 1.2.1.84)로서, 여기서, 지방 아실-CoA 리덕타제는 상기 E8,E10-도데카디에닐 코엔자임 A (E8,E10-C12:CoA)의 적어도 일부를 E8,E10-도데카디엔-1-올로 전환시킬 수 있는 것인 적어도 하나의 이종성 지방 아실-CoA 리덕타제 (EC 1.2.1.84)를 발현하는 것인,
효모 세포에서 E8,E10-도데카디에닐 코엔자임 A 및 임의로, E8,E10-도데카디엔-1-올을 제조하는 방법.
46. 항목 45에 따라, 효모 세포가 제1항 내지 제44항 중 어느 한 항에서 정의된 것과 같은 것인 방법.
47. 항목 45 내지 46 중 하나에 따라, E8,E10-도데카디에닐 코엔자임 A를 지질, 예컨대, 트리아실글리세리드로, 또는 유리 지방산으로 전환시키는 단계, 상기 지질 또는 유리 지방산을 회수하는 단계, 및 상기 지질 또는 유리 지방산을 E8,E10-도데카디엔-1-올로 전환시키는 단계를 추가로 포함하는 방법.
48. 항목 45 내지 47 중 하나에 따라, 상기 E8,E10-도데카디엔-1-올을 회수하는 단계를 추가로 포함하는 방법.
49. 항목 45 내지 48 중 하나에 따라, 아세틸트랜스퍼라제의 발현에 의해, 또는 화학적 전환에 의해 E8,E10-도데카디엔-1-올의 적어도 일부를 E8,E10-도데카디에닐 아세테이트로 전환시키는 단계를 추가로 포함하는 방법.
50. 항목 49에 따라, 아세틸트랜스퍼라제가 상기 효모 세포로부터 발현된 이종성 아세틸트랜스퍼라제 (EC 2.3.1.84) 또는 상기 효모 세포로부터 과다발현된 천연 아세틸트랜스퍼라제이고, 여기서, 상기 아세틸트랜스퍼라제가 E8,E10-도데카디엔-1-올의 적어도 일부를 E8,E10-도데카디에닐 아세테이트로 전환시켜 E8,E10-도데카디에닐 아세테이트를 추가로 생성할 수 있는 것인 방법.
51. 항목 50에 따라, 아세틸트랜스퍼라제가 Sc_Atf1 (서열 번호: 37), 또는 Sc_Atf1 (서열 번호: 37)과 적어도 75%의 상동성 또는 동일성, 예컨대, 적어도 80%의 상동성 또는 동일성, 예컨대, 적어도 85%의 상동성 또는 동일성, 예컨대, 적어도 90%의 상동성 또는 동일성, 예컨대, 적어도 91%의 상동성 또는 동일성, 예컨대, 적어도 92%의 상동성 또는 동일성, 예컨대, 적어도 93%의 상동성 또는 동일성, 예컨대, 적어도 94%의 상동성 또는 동일성, 예컨대, 적어도 95%의 상동성 또는 동일성, 예컨대, 적어도 96%의 상동성 또는 동일성, 예컨대, 적어도 97%의 상동성 또는 동일성, 예컨대, 적어도 98%의 상동성 또는 동일성, 예컨대, 적어도 99%의 상동성 또는 동일성, 예컨대, 100%의 상동성 또는 동일성을 갖는, 이의 변이체인 것인 방법.
52. 항목 45 내지 51에 따라, 상기 E8,E10-도데카디에닐 아세테이트를 회수하는 단계를 추가로 포함하는 방법.
53. 항목 45 내지 52에 따라, E8,E10-도데카디엔-1-올의 적어도 일부를 E8,E10-도데카디에날로 전환시킬 수 있는 알데히드 형성 지방 아실-CoA 리덕타제 (EC 1.2.1.50), 알콜 데히드로게나제 (EC 1.1.1.2) 및/또는 지방 알콜 옥시다제 (EC 1.1.3.20)의 발현에 의해, 또는 화학적 전환에 의해 E8,E10-도데카디엔-1-올의 적어도 일부를 E8,E10-도데카디에날로 전환시켜 E8,E10-도데카디에날을 추가로 생산하는 단계를 추가로 포함하는 방법.
54. 항목 53에 따라, 상기 E8,E10-도데카디에날을 회수하는 단계를 추가로 포함하는 방법.
55. 항목 45 내지 54 중 하나에 따라, 배지가 수용액 중 이의 클라우드 농도 이상인 양으로 추출제를 포함하고, 여기서, 추출제는 비이온성 에톡실화된 계면활성제, 예컨대, 소포제, 바람직하게, 폴리에틸렌 폴리프로필렌 글리콜, 폴레에테르 분산액의 혼합물, 폴리에틸렌 글리콜 모노스테아레이트를 포함하는 소포제, 예컨대, 시메티콘, 지방 알콜 알콕실레이트, 폴리에톡실화된 계면활성제 및 에톡실화 및 프로폭실화된 C16-C18 알콜계 소포제 및 이의 조합으로부터 선택되는 폴리에톡실화된 계면활성제인 것인 방법.
56. 항목 55에 따라,
- 비이온성 에톡실화된 계면활성제가 에톡실화 및 프로폭실화된 C16-C18 알콜계 소포제, 예컨대, C16-C18 알킬 알콜 에톡실레이트 프로폭실레이트 (CAS 번호 68002-96-0)이고, 여기서, 배양 배지가 적어도 1% vol/vol의 C16-C18 알킬 알콜 에톡실레이트 프로폭실레이트, 예컨대, 적어도 1.5% vol/vol, 예컨대, 적어도 2% vol/vol, 예컨대, 적어도 2.5% vol/vol, 예컨대, 적어도 3% vol/vol, 예컨대, 적어도 3.5% vol/vol, 예컨대, 적어도 4% vol/vol, 예컨대, 적어도 5% vol/vol, 예컨대, 적어도 6% vol/vol, 예컨대, 적어도 7% vol/vol, 예컨대, 적어도 8% vol/vol, 예컨대, 적어도 9% vol/vol, 예컨대, 적어도 10% vol/vol, 예컨대, 적어도 12.5% vol/vol, 예컨대, 적어도 15% vol/vol, 예컨대, 적어도 17.5% vol/vol, 예컨대, 적어도 20% vol/vol, 예컨대, 적어도 22.5% vol/vol, 예컨대, 적어도 25% vol/vol, 예컨대, 적어도 27.5% vol/vol, 예컨대, 적어도 30% vol/vol이상의 C16-C18 알킬 알콜 에톡실레이트 프로폭실레이트를 포함하고/거나,
- 비이온성 에톡실화된 계면활성제가 폴리에틸렌 폴리프로필렌 글리콜, 예를 들어, 콜리포르® P407 (CAS 번호 9003-11-6)이고, 여기서, 배양 배지가 적어도 10% vol/vol의 폴리에틸렌 폴리프로필렌 글리콜, 예컨대, 콜리포르® P407, 예컨대, 적어도 11% vol/vol, 예컨대, 적어도 12% vol/vol, 예컨대, 적어도 13% vol/vol, 예컨대, 적어도 14% vol/vol, 예컨대, 적어도 15% vol/vol, 예컨대, 적어도 16% vol/vol, 예컨대, 적어도 17% vol/vol, 예컨대, 적어도 18% vol/vol, 예컨대, 적어도 19% vol/vol, 예컨대, 적어도 20% vol/vol, 예컨대, 적어도 25% vol/vol, 예컨대, 적어도 30% vol/vol, 예컨대, 적어도 35% vol/vol 이상의 폴리에틸렌 폴리프로필렌 글리콜, 예컨대, 콜리포르® P407을 포함하고/거나,
- 비이온성 에톡실화된 계면활성제가 폴레에테르 분산액의 혼합물, 예컨대, 안티폼 204이고, 여기서, 배양 배지가 적어도 1% vol/vol의 폴레에테르 분산액의 혼합물, 예컨대, 안티폼 204, 예컨대, 적어도 1.5% vol/vol, 예컨대, 적어도 2% vol/vol, 예컨대, 적어도 2.5% vol/vol, 예컨대, 적어도 3% vol/vol, 예컨대, 적어도 3.5% vol/vol, 예컨대, 적어도 4% vol/vol, 예컨대, 적어도 5% vol/vol, 예컨대, 적어도 6% vol/vol, 예컨대, 적어도 7% vol/vol, 예컨대, 적어도 8% vol/vol, 예컨대, 적어도 9% vol/vol, 예컨대, 적어도 10% vol/vol, 예컨대, 적어도 12.5% vol/vol, 예컨대, 적어도 15% vol/vol, 예컨대, 적어도 17.5% vol/vol, 예컨대, 적어도 20% vol/vol, 예컨대, 적어도 22.5% vol/vol, 예컨대, 적어도 25% vol/vol, 예컨대, 적어도 27.5% vol/vol, 예컨대, 적어도 30% vol/vol 이상의 폴레에테르 분산액의 혼합물, 예컨대, 안티폼 204을 포함하고/거나;
- 비이온성 에톡실화된 계면활성제가 폴리에틸렌 글리콜 모노스테아레이트를 포함하는 비이온성 에톡실화된 계면활성제, 예컨대, 시메티콘이고, 여기서, 배양 배지가 적어도 1% vol/vol의 폴리에틸렌 글리콜 모노스테아레이트 또는 시메티콘, 예컨대, 적어도 1.5% vol/vol, 예컨대, 적어도 2% vol/vol, 예컨대, 적어도 2.5% vol/vol, 예컨대, 적어도 3% vol/vol, 예컨대, 적어도 3.5% vol/vol, 예컨대, 적어도 4% vol/vol, 예컨대, 적어도 5% vol/vol, 예컨대, 적어도 6% vol/vol, 예컨대, 적어도 7% vol/vol, 예컨대, 적어도 8% vol/vol, 예컨대, 적어도 9% vol/vol, 예컨대, 적어도 10% vol/vol, 예컨대, 적어도 12.5% vol/vol, 예컨대, 적어도 15% vol/vol, 예컨대, 적어도 17.5% vol/vol, 예컨대, 적어도 20% vol/vol, 예컨대, 적어도 22.5% vol/vol, 예컨대, 적어도 25% vol/vol, 예컨대, 적어도 27.5% vol/vol, 예컨대, 적어도 30% vol/vol 이상의 폴리에틸렌 글리콜 모노스테아레이트 또는 시메티콘을 포함하고/거나;
- 비이온성 에톡실화된 계면활성제가 지방 알콜 알콕실레이트, 바람직하게, 플루라팍® LF300 (CAS 번호 196823-11-7), 플루라팍® LF1300 (68002-96-0), 플루라팍® SLF180 (CAS 번호 196823-11-7), 데히폰® 2574 (CAS 번호 68154-97-2), 및 임벤틴 SG/251 (CAS 번호 68002-96-0)로부터 선택되는 것, 바람직하게, 플루라팍® LF300 또는 데히폰® 2574이고, 여기서, 배양 배지가 적어도 1% vol/vol의 지방 알콜 알콕실레이트, 예컨대, 적어도 1.5% vol/vol, 예컨대, 적어도 2% vol/vol, 예컨대, 적어도 2.5% vol/vol, 예컨대, 적어도 3% vol/vol, 예컨대, 적어도 3.5% vol/vol, 예컨대, 적어도 4% vol/vol, 예컨대, 적어도 5% vol/vol, 예컨대, 적어도 6% vol/vol, 예컨대, 적어도 7% vol/vol, 예컨대, 적어도 8% vol/vol, 예컨대, 적어도 9% vol/vol, 예컨대, 적어도 10% vol/vol, 예컨대, 적어도 12.5% vol/vol, 예컨대, 적어도 15% vol/vol, 예컨대, 적어도 17.5% vol/vol, 예컨대, 적어도 20% vol/vol, 예컨대, 적어도 22.5% vol/vol, 예컨대, 적어도 25% vol/vol, 예컨대, 적어도 27.5% vol/vol, 예컨대, 적어도 30% vol/vol 이상의 지방 알콜 알콕실레이트를 포함하고/거나;
- 비이온성 에톡실화된 계면활성제가 아그니크 BP420 (CAS 번호 68002-96-0)이고, 여기서, 배양 배지가 적어도 1% vol/vol의 아그니크 BP420, 예컨대, 적어도 1.5% vol/vol, 예컨대, 적어도 2% vol/vol, 예컨대, 적어도 2.5% vol/vol, 예컨대, 적어도 3% vol/vol, 예컨대, 적어도 3.5% vol/vol, 예컨대, 적어도 4% vol/vol, 예컨대, 적어도 5% vol/vol, 예컨대, 적어도 6% vol/vol, 예컨대, 적어도 7% vol/vol, 예컨대, 적어도 8% vol/vol, 예컨대, 적어도 9% vol/vol, 예컨대, 적어도 10% vol/vol, 예컨대, 적어도 12.5% vol/vol, 예컨대, 적어도 15% vol/vol, 예컨대, 적어도 17.5% vol/vol, 예컨대, 적어도 20% vol/vol, 예컨대, 적어도 22.5% vol/vol, 예컨대, 적어도 25% vol/vol, 예컨대, 적어도 27.5% vol/vol, 예컨대, 적어도 30% vol/vol 이상의 아그니크 BP420을 포함하는 것인 방법.
57. 항목 45 내지 56 중 하나에 Ekkf, 배양 배지가 이의 클라우드 농도보다 적어도 50%, 예컨대, 적어도 100%, 예컨대, 적어도 150%, 예컨대, 적어도 200%, 예컨대, 적어도 250%, 예컨대, 적어도 300%, 예컨대, 적어도 350%, 예컨대, 적어도 400%, 예컨대, 적어도 500%, 예컨대, 적어도 750%, 예컨대, 적어도 1000% 이상 만큼 더 큰 양으로 추출제를 포함하고/거나, 여기서, 배양 배지가 이의 클라우드 농도의 적어도 2배, 예컨대, 이의 클라우드 농도의 적어도 3배, 예컨대, 이의 클라우드 농도의 적어도 4배, 예컨대, 이의 클라우드 농도의 적어도 5배, 예컨대, 이의 클라우드 농도의 적어도 6배, 예컨대, 이의 클라우드 농도의 적어도 7배, 예컨대, 이의 클라우드 농도의 적어도 8배, 예컨대, 이의 클라우드 농도의 적어도 9배, 예컨대, 이의 클라우드 농도의 적어도 10배, 예컨대, 이의 클라우드 농도의 적어도 12.5배, 예컨대, 이의 클라우드 농도의 적어도 15배, 예컨대, 이의 클라우드 농도의 적어도 17.5배, 예컨대, 이의 클라우드 농도의 적어도 20배, 예컨대, 이의 클라우드 농도의 적어도 25배, 예컨대, 이의 클라우드 농도의 적어도 30배인 양으로 추출제를 포함하는 것인 방법.
58. 항목 45 내지 57 중 하나에 따라, E8,E10-도데카디에닐 코엔자임 A가 지질 또는 유리 지방산으로 전환되고, 여기서, 효모 세포에 의해 생산된 상기 지질 또는 유리 지방산, 상기 E8,E10-도데카디엔-1-올, 및 임의로, 상기 E8,E10-도데카디에닐 아세테이트 및/또는 상기 E8,E10-도데카디에날이 발효 브로쓰 중 에멀젼으로 존재하고, 본 방법은 상기 에멀젼을 파괴시켜 추출제 및 지질 또는 유리 지방산, E8,E10-도데카디엔-1-올, 및 임의로, E8,E10-도데카디에닐 아세테이트 및/또는 E8,E10-도데카디에날을 포함하는 생성물 상을 포함하는 조성물을 수득하는 단계를 추가로 포함하고, 임의로, 여기서,:
- 에멀젼을 파괴시키는 단계가 발효 브로쓰의 상 분리 단계, 예컨대, 원심분리 단계를 거쳐 3개 상: 수상, 세포 및 세포 파편을 포함하는 상, 및 추출제 및 지질 또는 유리 지방산, E8,E10-도데카디엔-1-올, 및 임의로, E8,E10-도데카디에닐 아세테이트 및/또는 E8,E10-도데카디에날을 포함하는 생성물 상으로 구성된 조성물을 수득하는 단계를 포함하거나, 또는 그로 구성되고/거나
- 여기서, 생성물 상은 처음 발효 브로쓰에 존재하는 지질 또는 유리 지방산, E8,E10-도데카디엔-1-올, 및 임의로, E8,E10-도데카디에닐 아세테이트 및/또는 E8,E10-도데카디에날의 적어도 50%, 예컨대, 적어도 55%, 예컨대, 적어도 60%, 예컨대, 적어도 65%, 예컨대, 적어도 70%, 예컨대, 적어도 75%, 예컨대, 적어도 80%, 예컨대, 적어도 85%, 예컨대, 적어도 90%, 예컨대, 적어도 95% 이상을 포함하는 것인 방법.
59. 항목 45 내지 58 중 하나에 따라,
- 바람직하게, 증류 단계, 예컨대, 감압하에서의 증류 단계에 의해, 또는 칼럼 정제에 의해 지질 또는 유리 지방산, E8,E10-도데카디엔-1-올, 및 임의로, E8,E10-도데카디에닐 아세테이트 및/또는 E8,E10-도데카디에날을 회수하는 단계,
- E8,E10-도데카디엔-1-올의 적어도 일부를 E8,E10-도데카디에날로 및/또는 E8,E10-도데카디에닐 아세테이트로 화학적으로 전환시키는 단계,
- 임의로, 상기 E8,E10-도데카디에날 및/또는 E8,E10-도데카디에닐 아세테이트를 회수하는 단계를 추가로 포함하는 방법.
60. 항목 45 내지 59 중 하나에 따라, 회수된 E8,E10-도데카디엔-1-올, E8,E10-도데카디에닐 아세테이트 및/또는 E8,E10-도데카디에날을 페로몬 조성물로 제제화하는 단계를 추가로 포함하는 방법.
61. 항목 45 내지 60 중 하나에 따라, 페로몬 조성물이 하나 이상의 추가 성분, 예컨대, 액체 또는 고체 담체를 추가로 포함하는 것인 방법.
62. 효모 세포를 변형시키기 위한 핵산 구축물로서, 상기 구축물은
i) 탄소 쇄 길이가 12인 지방 아실-CoA에 하나 이상의 이중 결합을 도입하여 상기 지방 아실-CoA를 탈포화된 지방 아실-CoA로 전환시킬 수 있는 적어도 하나의 이종성 데사투라제를 코딩하는 적어도 하나의 제1 폴리뉴클레오티드로서, 여기서, 상기 탈포화된 지방 아실-CoA의 적어도 일부는 E8,E10-도데카디에닐 코엔자임 A (E8,E10-C12:CoA)인 것인 적어도 하나의 제1 폴리뉴클레오티드; 및
ii) 임의로, 상기 탈포화된 지방 아실-CoA의 적어도 일부를 탈포화된 지방 알콜로 전환시킬 수 있는 적어도 하나의 이종성 지방 아실-CoA 리덕타제 (EC 1.2.1.84)를 인코딩하는 제2 폴리뉴클레오티드로서, 여기서, 지방 아실-CoA 리덕타제는 상기 E8,E10-도데카디에닐 코엔자임 A (E8,E10-C12:CoA)의 적어도 일부를 E8,E10-도데카디엔-1-올로 전환시킬 수 있는 것인 제2 폴리뉴클레오티드를 포함하는 것인 핵산 구축물.
63. 항목 62에 따라,
a) 적어도 하나의 데사투라제가 Gmo_CPRQ (서열 번호: 77), Cpo_CPRQ (서열 번호: 2), 또는 이와 적어도 80%의 동일성, 예컨대, 서열 번호: 77 또는 서열 번호: 2와 적어도 81%, 예컨대, 적어도 82%, 예컨대, 적어도 83%, 예컨대, 적어도 84%, 예컨대, 적어도 85%, 예컨대, 적어도 86%, 예컨대, 적어도 87%, 예컨대, 적어도 88%, 예컨대, 적어도 89%, 예컨대, 적어도 90%, 예컨대, 적어도 91%, 예컨대, 적어도 92%, 예컨대, 적어도 93%, 예컨대, 적어도 94%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%의 동일성을 갖는, 이의 기능성 변이체이고, 바람직하게, 적어도 하나의 데사투라제가 Cpo_CPRQ 또는 이의 기능성 변이체이거나; 또는
b) 적어도 하나의 데사투라제가 적어도 2개의 데사투라제이고, 여기서, 상기 2개의 데사투라제 중 적어도 하나는 Gmo_CPRQ (서열 번호: 77), Cpo_CPRQ (서열 번호: 2), 또는 이와 적어도 80%의 동일성, 예컨대, 서열 번호: 2와 적어도 81%, 예컨대, 적어도 82%, 예컨대, 적어도 83%, 예컨대, 적어도 84%, 예컨대, 적어도 85%, 예컨대, 적어도 86%, 예컨대, 적어도 87%, 예컨대, 적어도 88%, 예컨대, 적어도 89%, 예컨대, 적어도 90%, 예컨대, 적어도 91%, 예컨대, 적어도 92%, 예컨대, 적어도 93%, 예컨대, 적어도 94%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%의 동일성을 갖는, 이의 기능성 변이체이고, 바람직하게, 적어도 하나의 데사투라제가 Cpo_CPRQ 또는 이의 기능성 변이체이고, 다른 데사투라제가 탄소 쇄 길이가 12인 지방 아실-CoA에 적어도 하나의 이중 결합을 도입할 수 있는 데사투라제, 예컨대, Z9-12 데사투라제인 것인 핵산 구축물.
64. 항목 62 내지 63 중 하나에 따라, 적어도 하나의 이종성 데사투라제가 적어도 2개의 데사투라제이고, 여기서, 다른 데사투라제는 Cpo_NPVE (서열 번호: 67), Cpo_SPTQ (서열 번호: 69) 및 이와 적어도 60%의 상동성 또는 동일성, 예컨대, 서열 번호: 67 또는 서열 번호: 69와 적어도 80%, 예컨대, 적어도 81%, 예컨대, 적어도 82%, 예컨대, 적어도 83%, 예컨대, 적어도 84%, 예컨대, 적어도 85%, 예컨대, 적어도 86%, 예컨대, 적어도 87%, 예컨대, 적어도 88%, 예컨대, 적어도 89%, 예컨대, 적어도 90%, 예컨대, 적어도 91%, 예컨대, 적어도 92%, 예컨대, 적어도 93%, 예컨대, 적어도 94%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%의 동일성을 갖는, 이의 기능성 변이체로부터 선택되는 것인 핵산 구축물.
65. 항목 62 내지 64 중 하나에 따라, 제1 폴리뉴클레오티드가 서열 번호: 1 또는 서열 번호: 78, 바람직하게 서열 번호: 1, 또는 이와 적어도 60%의 상동성 또는 동일성, 예컨대, 서열 번호: 1 또는 서열 번호: 78, 바람직하게, 서열 번호: 1과 61%, 예컨대, 적어도 62%, 예컨대, 적어도 63%, 예컨대, 적어도 64%, 예컨대, 적어도 65%, 예컨대, 적어도 66%, 예컨대, 적어도 67%, 예컨대, 적어도 68%, 예컨대, 적어도 69%, 예컨대, 적어도 70%, 예컨대, 적어도 71%, 예컨대, 적어도 72%, 예컨대, 적어도 73%, 예컨대, 적어도 74%, 예컨대, 적어도 75%, 예컨대, 적어도 76%, 예컨대, 적어도 77%, 예컨대, 적어도 78%, 예컨대, 적어도 79%, 예컨대, 적어도 80%, 예컨대, 적어도 81%, 예컨대, 적어도 82%, 예컨대, 적어도 83%, 예컨대, 적어도 84%, 예컨대, 적어도 85%, 예컨대, 적어도 86%, 예컨대, 적어도 87%, 예컨대, 적어도 88%, 예컨대, 적어도 89%, 예컨대, 적어도 90%, 예컨대, 적어도 91%, 예컨대, 적어도 92%, 예컨대, 적어도 93%, 예컨대, 적어도 94%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%의 상동성 또는 동일성을 갖는, 이의 동족체를 포함하는 것인 핵산 구축물.
66. 항목 62 내지 65 중 하나에 따라, 적어도 하나의 이종성 데사투라제가 적어도 2개의 이종성 데사투라제이고, 여기서, 제1 폴리뉴클레오티드가 서열 번호: 66 또는 서열 번호: 68에 기재된 핵산, 또는 이와 적어도 60%의 상동성 또는 동일성, 예컨대, 이와 61%, 예컨대, 적어도 62%, 예컨대, 적어도 63%, 예컨대, 적어도 64%, 예컨대, 적어도 65%, 예컨대, 적어도 66%, 예컨대, 적어도 67%, 예컨대, 적어도 68%, 예컨대, 적어도 69%, 예컨대, 적어도 70%, 예컨대, 적어도 71%, 예컨대, 적어도 72%, 예컨대, 적어도 73%, 예컨대, 적어도 74%, 예컨대, 적어도 75%, 예컨대, 적어도 76%, 예컨대, 적어도 77%, 예컨대, 적어도 78%, 예컨대, 적어도 79%, 예컨대, 적어도 80%, 예컨대, 적어도 81%, 예컨대, 적어도 82%, 예컨대, 적어도 83%, 예컨대, 적어도 84%, 예컨대, 적어도 85%, 예컨대, 적어도 86%, 예컨대, 적어도 87%, 예컨대, 적어도 88%, 예컨대, 적어도 89%, 예컨대, 적어도 90%, 예컨대, 적어도 91%, 예컨대, 적어도 92%, 예컨대, 적어도 93%, 예컨대, 적어도 94%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%의 상동성 또는 동일성을 갖는, 이의 동족체를 추가로 포함하는 것인 핵산 구축물.
67. 항목 62 내지 66 중 하나에 따라, 이종성 데사투라제가 제1항 내지 제44항 중 어느 한 항에서 정의된 것과 같은 것인 핵산 구축물.
68. 항목 62 내지 67 중 하나에 따라, 적어도 하나의 데사투라제가 85번 위치에 돌연변이를 갖는 Cpo_CPRQ의 돌연변이체, 예컨대, S85A 돌연변이인 것인 핵산 구축물.
69. 항목 62 내지 68 중 하나에 따라, 이종성 지방 아실-CoA 리덕타제가 제1항 내지 제44항 중 어느 한 항에서 정의된 것과 같은 것인 핵산 구축물.
70. 항목 62 내지 69 중 하나에 따라, 제2 폴리뉴클레오티드가 서열 번호: 9, 서열 번호: 60, 서열 번호: 70, 서열 번호: 72, 서열 번호: 74, 서열 번호: 11, 서열 번호: 76, 및 이와 적어도 60%의 상동성 또는 동일성, 예컨대, 이와 적어도 65%, 예컨대, 적어도 70%, 예컨대, 적어도 71%, 예컨대, 적어도 72%, 예컨대, 적어도 73%, 예컨대, 적어도 74%, 예컨대, 적어도 75%, 예컨대, 적어도 80%, 예컨대, 적어도 81%, 예컨대, 적어도 82%, 예컨대, 적어도 83%, 예컨대, 적어도 84%, 예컨대, 적어도 85%, 예컨대, 적어도 86%, 예컨대, 적어도 87%, 예컨대, 적어도 88%, 예컨대, 적어도 89%, 예컨대, 적어도 90%, 예컨대, 적어도 91%, 예컨대, 적어도 92%, 예컨대, 적어도 93%, 예컨대, 적어도 94%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%의 상동성 또는 동일성을 갖는, 이의 동족체를 포함하거나, 또는 그로 구성된 것인 핵산 구축물.
71. 항목 62 내지 70 중 하나에 따라,
iii) 이종성 시토크롬 b5를 인코딩하는 폴리뉴클레오티드, 예컨대, 서열 번호: 3에 기재된 폴리뉴클레오티드, 또는 이와 적어도 60%의 상동성 또는 동일성을 갖는, 이의 동족체;
iv) 이종성 시토크롬 b5 리덕타제를 인코딩하는 폴리뉴클레오티드, 예컨대, 서열 번호: 23에 기재된 폴리뉴클레오티드, 또는 이와 적어도 60%의 상동성 또는 동일성을 갖는, 이의 동족체;
v) 헤모글로빈을 인코딩하는 폴리뉴클레오티드, 예컨대, 서열 번호: 5에 기재된 폴리뉴클레오티드, 또는 이와 적어도 60%의 상동성 또는 동일성을 갖는, 이의 동족체;
vi) 변형된 케톤 신타제 도메인을 갖는, 지방 아실 신타제 변이체를 인코딩하는 폴리뉴클레오티드; 및/또는
vii) 티오에스테라제를 인코딩하는 폴리뉴클레오티드, 예컨대, 서열 번호: 25 또는 서열 번호: 34에 기재된 폴리뉴클레오티드, 또는 이와 적어도 60%의 상동성 또는 동일성을 갖는, 이의 동족체 중 하나 이상의 것을 추가로 포함하는 핵산 구축물.
72. 항목 62 내지 71 중 하나에 따라, 이종성 시토크롬 b5, 이종성 시토크롬 b5 리덕타제, 헤모글로빈, 지방 아실 신타제 변이체 및/또는 티오에스테라제가 제1항 내지 제44항 중 어느 한 항에서 정의된 것과 같은 것인 핵산 구축물.
73. i) 제45항 내지 제61항 중 어느 한 항에 따른 방법에 의해 E8,E10-도데카디엔-1-올 및 임의로, E8,E10-도데카디에닐 아세테이트 및/또는 E8,E10-도데카디에날을 제조하는 단계;
ii) 상기 E8,E10-도데카디엔-1-올 및 임의로, 상기 E8,E10-도데카디에닐 아세테이트 및/또는 상기 E8,E10-도데카디에날을 페로몬 조성물로서 제제화하는 단계; 및
iii) 상기 페로몬 조성물을 통합 병해충 관리 조성물로서 사용하는 단계를 포함하는,
병해충의 존재를 모니터링하거나, 또는 병해충의 교미를 교란시키는 방법.
74. 제45항 내지 제61항 중 어느 한 항에 따른 방법에 의해 수득가능한 E8,E10-도데카디에닐 코엔자임 A, E8,E10-도데카디엔-1-올, E8,E10-도데카디에닐 아세테이트 및/또는 E8,E10-도데카디에날.
75. 사용 설명서, 및
a) 제1항 내지 제44항 중 어느 한 항에 따른 효모 세포; 및/또는
b) 효모 세포를 변형시키기 위한 제62항 내지 제72항 중 어느 한 항에 따른 핵산 구축물 및 임의로, 변형시키고자 하는 효모 세포로서, 핵산 구축물 내에 포함된 폴리뉴클레오티드 발현시, 변형된 효모 세포는 E8,E10-도데카디에닐 코엔자임 A 및 임의로, E8,E10-도데카디엔-1-올을 생산할 수 있는 것인 핵산 구축물 및 임의로, 효모 세포를 포함하는 부품들의 키트.
SEQUENCE LISTING
<110> BioPhero ApS
<120> Yeast cells and methods for production of E8,E10-dodecadienyl
coenzyme A, codlemone and derivatives thereof
<130> P5484PC00
<160> 80
<170> PatentIn version 3.5
<210> 1
<211> 1047
<212> DNA
<213> Artificial sequence
<220>
<223> C. pomonella CPO_CPRQ desaturase (AHW98354) codon optimized for
Y. lipolytica; mRNA-coding sequence
<220>
<221> misc_feature
<222> (1)..(1047)
<223> C. pomonella CPO_CPRQ desaturase (AHW98354) codon optimized for
Y. lipolytica; mRNA-coding sequence
<400> 1
atgcctcccc gagagtctaa gaaggtggcc ctgcgatctt acgagacccc tgtcgcttct 60
ctccctcctc gaaagtacga gattatctac ctcaacctct tcctgcacat cgctggacat 120
atctccgccg tctacggcct gtatctgtgc ttcaccgccg cccagtggaa gaccatcttc 180
tttgcctacc tgtggctgtt gatgggcgag ctcggcgtgg tgtgtggcgc tcacagattg 240
tggtctcacc gttctttcaa ggtgaagcct cctctcgaga tcatgctgat gctgttcaac 300
tgtattggat tccagaacac cgccactgac tgggtccgaa accaccggct ccatcacaag 360
cactctgaca ctgacgccga cccccataac tctaaccgag gaatgctgtt ctcccacatt 420
ggctggctgt gtgtgcgaaa gcacccagat gttaaagaac gaggcaagac caccgacatg 480
tctgacatct actctaaccc cgtgctccga ttccagaaga agcacaaggt accccttttc 540
ggcgccatgt gtttcggcct gcccaccctt attcccaccc tgtggggaga ggacatcgtc 600
accgcttggc acgtcaacct gctgcgattc gttcttaatc tgaactctat cctgctggtc 660
aactccattg ctcataagta cggcacccga ccctacgatc gaaccatctg ccctcgacaa 720
aacaccacct gtaacatgat gactcttgga gagggcttcc acaactacca ccacaccttt 780
ccttgggact accgatctgc cgagctggga aagaactacc tgaacttcac caagtggttc 840
atcgacttct tcgccctgat tggatgggcc tacgacctga agaccgttcc tgacgatatg 900
atccagcgac gaatgaaaag aaccggagac ggatccaact cgtggggatg gggagacaag 960
gacatgacta aggaggagcg agactctgct actatcattt atcccgagaa gaaggatgat 1020
attaagatga tctccaaaaa gaactaa 1047
<210> 2
<211> 348
<212> PRT
<213> Cydia pomonella
<220>
<221> MISC_FEATURE
<222> (1)..(348)
<223> C. pomonella CPO_CPRQ desaturase (AHW98354)
<400> 2
Met Pro Pro Arg Glu Ser Lys Lys Val Ala Leu Arg Ser Tyr Glu Thr
1 5 10 15
Pro Val Ala Ser Leu Pro Pro Arg Lys Tyr Glu Ile Ile Tyr Leu Asn
20 25 30
Leu Phe Leu His Ile Ala Gly His Ile Ser Ala Val Tyr Gly Leu Tyr
35 40 45
Leu Cys Phe Thr Ala Ala Gln Trp Lys Thr Ile Phe Phe Ala Tyr Leu
50 55 60
Trp Leu Leu Met Gly Glu Leu Gly Val Val Cys Gly Ala His Arg Leu
65 70 75 80
Trp Ser His Arg Ser Phe Lys Val Lys Pro Pro Leu Glu Ile Met Leu
85 90 95
Met Leu Phe Asn Cys Ile Gly Phe Gln Asn Thr Ala Thr Asp Trp Val
100 105 110
Arg Asn His Arg Leu His His Lys His Ser Asp Thr Asp Ala Asp Pro
115 120 125
His Asn Ser Asn Arg Gly Met Leu Phe Ser His Ile Gly Trp Leu Cys
130 135 140
Val Arg Lys His Pro Asp Val Lys Glu Arg Gly Lys Thr Thr Asp Met
145 150 155 160
Ser Asp Ile Tyr Ser Asn Pro Val Leu Arg Phe Gln Lys Lys His Lys
165 170 175
Val Pro Leu Phe Gly Ala Met Cys Phe Gly Leu Pro Thr Leu Ile Pro
180 185 190
Thr Leu Trp Gly Glu Asp Ile Val Thr Ala Trp His Val Asn Leu Leu
195 200 205
Arg Phe Val Leu Asn Leu Asn Ser Ile Leu Leu Val Asn Ser Ile Ala
210 215 220
His Lys Tyr Gly Thr Arg Pro Tyr Asp Arg Thr Ile Cys Pro Arg Gln
225 230 235 240
Asn Thr Thr Cys Asn Met Met Thr Leu Gly Glu Gly Phe His Asn Tyr
245 250 255
His His Thr Phe Pro Trp Asp Tyr Arg Ser Ala Glu Leu Gly Lys Asn
260 265 270
Tyr Leu Asn Phe Thr Lys Trp Phe Ile Asp Phe Phe Ala Leu Ile Gly
275 280 285
Trp Ala Tyr Asp Leu Lys Thr Val Pro Asp Asp Met Ile Gln Arg Arg
290 295 300
Met Lys Arg Thr Gly Asp Gly Ser Asn Ser Trp Gly Trp Gly Asp Lys
305 310 315 320
Asp Met Thr Lys Glu Glu Arg Asp Ser Ala Thr Ile Ile Tyr Pro Glu
325 330 335
Lys Lys Asp Asp Ile Lys Met Ile Ser Lys Lys Asn
340 345
<210> 3
<211> 384
<212> DNA
<213> Artificial sequence
<220>
<223> H. armigera cytochrome b5 (AAC33731) codon optimized for Y.
lipolytica; mRNA-coding sequence
<220>
<221> misc_feature
<222> (1)..(384)
<223> H. armigera cytochrome b5 (AAC33731) codon optimized for Y.
lipolytica; mRNA-coding sequence
<400> 3
atgaccgtgc gacagttcac ccgagtcgag gtgtctaagt ggaccactcg agaggaagcc 60
gtgttcatca tcgacaacgt ggtgtacaac gtgaccaagt tcctggacga gcaccccggt 120
ggacacgagg tgctggtgaa cgtggccggc aaggacgcct ctgaggactt cgacgacgtg 180
ggccactctc tggacgccaa ggaactgatg aagaagtacg tcgtcggcga ggtggtcgag 240
gccgagcgac gacacatcca gaagcgacag atctcttggg aagattctaa ggtggactct 300
gactcttctt tcacctcttc gtggaagttc cccgtgctgc tgggcatcgt ggtgaccctg 360
ctgtacacct acctgttcgg ctaa 384
<210> 4
<211> 127
<212> PRT
<213> Helicoverpa armigera
<220>
<221> MISC_FEATURE
<222> (1)..(127)
<223> H. armigera cytochrome b5 (AAC33731)
<400> 4
Met Thr Val Arg Gln Phe Thr Arg Val Glu Val Ser Lys Trp Thr Thr
1 5 10 15
Arg Glu Glu Ala Val Phe Ile Ile Asp Asn Val Val Tyr Asn Val Thr
20 25 30
Lys Phe Leu Asp Glu His Pro Gly Gly His Glu Val Leu Val Asn Val
35 40 45
Ala Gly Lys Asp Ala Ser Glu Asp Phe Asp Asp Val Gly His Ser Leu
50 55 60
Asp Ala Lys Glu Leu Met Lys Lys Tyr Val Val Gly Glu Val Val Glu
65 70 75 80
Ala Glu Arg Arg His Ile Gln Lys Arg Gln Ile Ser Trp Glu Asp Ser
85 90 95
Lys Val Asp Ser Asp Ser Ser Phe Thr Ser Ser Trp Lys Phe Pro Val
100 105 110
Leu Leu Gly Ile Val Val Thr Leu Leu Tyr Thr Tyr Leu Phe Gly
115 120 125
<210> 5
<211> 441
<212> DNA
<213> Artificial sequence
<220>
<223> V. stercoraria hemoglobin (AAT01097) codon optimized for Y.
lipolytica; mRNA-coding sequence
<220>
<221> misc_feature
<222> (1)..(441)
<223> V. stercoraria hemoglobin (AAT01097) codon optimized for Y.
lipolytica; mRNA-coding sequence
<400> 5
atgctggacc agcagaccgt ggacacctct aaggccaccg tgcctgtgct gaaggaacac 60
ggcgtgacca tcaccaccac cttctaccag aacctgttcg ctaagcaccc cgaggtgcga 120
cccctgttcg atatgggccg acaggcctct ctcgagcagc ccaaggctct ggccatgacc 180
gtgggagccg ccgctcagaa catcgagaac ctgcctgcca ttctgcccgc cgtgcagaag 240
atcgccgtca agcactgcca ggccggcgtg gccgctcgac actaccccat cgtgggccaa 300
gagctgctgg gcgccatcaa ggaactgctg ggtgacgccg ccaccgacga catcctggac 360
gcctggggca aggcctacgg cgtgatcgcc gacgtgttca tccaggtcga ggccgacctg 420
tacgcccagg acgccgagta a 441
<210> 6
<211> 146
<212> PRT
<213> Vitreoscilla stercoraria
<220>
<221> MISC_FEATURE
<222> (1)..(146)
<223> V. stercoraria hemoglobin (AAT01097)
<400> 6
Met Leu Asp Gln Gln Thr Val Asp Thr Ser Lys Ala Thr Val Pro Val
1 5 10 15
Leu Lys Glu His Gly Val Thr Ile Thr Thr Thr Phe Tyr Gln Asn Leu
20 25 30
Phe Ala Lys His Pro Glu Val Arg Pro Leu Phe Asp Met Gly Arg Gln
35 40 45
Ala Ser Leu Glu Gln Pro Lys Ala Leu Ala Met Thr Val Gly Ala Ala
50 55 60
Ala Gln Asn Ile Glu Asn Leu Pro Ala Ile Leu Pro Ala Val Gln Lys
65 70 75 80
Ile Ala Val Lys His Cys Gln Ala Gly Val Ala Ala Arg His Tyr Pro
85 90 95
Ile Val Gly Gln Glu Leu Leu Gly Ala Ile Lys Glu Leu Leu Gly Asp
100 105 110
Ala Ala Thr Asp Asp Ile Leu Asp Ala Trp Gly Lys Ala Tyr Gly Val
115 120 125
Ile Ala Asp Val Phe Ile Gln Val Glu Ala Asp Leu Tyr Ala Gln Asp
130 135 140
Ala Glu
145
<210> 7
<211> 1557
<212> DNA
<213> Artificial sequence
<220>
<223> T. alba fatty acyl reductase (NP_001289627) codon optimized for
Y. lipolytica; mRNA-coding sequence
<220>
<221> misc_feature
<222> (1)..(1557)
<223> T. alba fatty acyl reductase (NP_001289627) codon optimized for
Y. lipolytica; mRNA-coding sequence
<400> 7
atggtgtcta tccccgagta ctacgagggc aagaacatcc tgctgaccgg cgccaccggc 60
ttcatgggca aggtgctgct cgagaagctg ctgcgatctt gccccaaggt gaaggccgtg 120
tacgtgctgg tgcgacacaa ggccggacag acccctgagg ctcgaatcga ggaaatcacc 180
aactgcaagc tgttcgaccg actgcgagat gagcagcccg acttcaaggc caagatcatc 240
gtgatcacct ctgagctgac ccagcctgag ctggacctgt ctgagcccat caaggaaaag 300
ctgatcgagc gaatcaacat catcttccac tgcgccgcca ccgtgcgatt caacgagact 360
ctccgagatg ccgtgcagct gaacgtgacc gctactcagc agctcctgtt cctggctcag 420
cgaatgaaga acctggaagt gttcatgcac gtgtctaccg cctacgccta ctgcaaccga 480
aagcagatcg aagagatcgt gtaccctcct ccagtggacc ccaagaagct gattgactct 540
ctcgagtgga tggacgacgg cctggtgaac gacatcaccc ctaagctcat cggcgaccga 600
cctaacacct acacttacac caaggctctg gccgagtacg tggtgcagca agagggcgcc 660
aagctgaaca ccgccatcat tcgaccctct atcgtgggcg cctcttggaa ggaacccttt 720
cctggctgga tcgacaactt caacggcccc tctggcctgt tcattgccgc cggaaagggc 780
atcctgcgaa ccatgcgagc ctctaactct gccgtggccg acctggtgcc tgtggacgtg 840
gtggtgaaca ccactctggc cgctgcctgg tactctggcg tgaaccgacc tcgaaacgtg 900
atgatctaca actgcaccac cggcggcact aaccccttcc actggggcga agtgggctac 960
cacatcaacc tgaacttcaa gatcaaccct ctcgagaacg ccgtgcgaca ccccaactgt 1020
tctctgcagt ctaaccctct gctccatcag tactggaccg ccgtgtctca caccatgcct 1080
gcctttctgc tggacctcct gctgcgactg accggacaca agccctggat gatgaagacc 1140
atcactcgac tgcacaaggc catgatgctc ctcgagtact tcacctccaa ctcttggatc 1200
tggaacaccg agaacatgac catgctgatg aaccagctga accccgagga caagaagacc 1260
ttcaacttcg acgtgcgaca gctgcactgg gctgagtaca tggaaaacta ctgcatgggc 1320
accaagaagt acgtcctgaa cgaggaaatg tctggactgc ccgctgccag aaagcacctg 1380
aacaagctgc gaaacatccg atacggcttc aacaccgtgc tggtcatcct gatctggcga 1440
atcttcattg cccgatctca gatggcccga aacatctggt acttcgtggt gtctctgtgc 1500
tacaagttcc tgtcttactt ccgagcctct tctaccatgc gatactctaa gctgtag 1557
<210> 8
<211> 515
<212> PRT
<213> Tyto alba
<220>
<221> MISC_FEATURE
<222> (1)..(515)
<223> T. alba fatty acyl reductase (NP_001289627)
<400> 8
Met Val Ser Ile Pro Glu Tyr Tyr Glu Gly Lys Asn Ile Leu Leu Thr
1 5 10 15
Gly Ala Thr Gly Phe Met Gly Lys Val Leu Leu Glu Lys Leu Leu Arg
20 25 30
Ser Cys Pro Lys Val Lys Ala Val Tyr Val Leu Val Arg His Lys Ala
35 40 45
Gly Gln Thr Pro Glu Ala Arg Ile Glu Glu Ile Thr Asn Cys Lys Leu
50 55 60
Phe Asp Arg Leu Arg Asp Glu Gln Pro Asp Phe Lys Ala Lys Ile Ile
65 70 75 80
Val Ile Thr Ser Glu Leu Thr Gln Pro Glu Leu Asp Leu Ser Glu Pro
85 90 95
Ile Lys Glu Lys Leu Ile Glu Arg Ile Asn Ile Ile Phe His Cys Ala
100 105 110
Ala Thr Val Arg Phe Asn Glu Thr Leu Arg Asp Ala Val Gln Leu Asn
115 120 125
Val Thr Ala Thr Gln Gln Leu Leu Phe Leu Ala Gln Arg Met Lys Asn
130 135 140
Leu Glu Val Phe Met His Val Ser Thr Ala Tyr Ala Tyr Cys Asn Arg
145 150 155 160
Lys Gln Ile Glu Glu Ile Val Tyr Pro Pro Pro Val Asp Pro Lys Lys
165 170 175
Leu Ile Asp Ser Leu Glu Trp Met Asp Asp Gly Leu Val Asn Asp Ile
180 185 190
Thr Pro Lys Leu Ile Gly Asp Arg Pro Asn Thr Tyr Thr Tyr Thr Lys
195 200 205
Ala Leu Ala Glu Tyr Val Val Gln Gln Glu Gly Ala Lys Leu Asn Thr
210 215 220
Ala Ile Ile Arg Pro Ser Ile Val Gly Ala Ser Trp Lys Glu Pro Phe
225 230 235 240
Pro Gly Trp Ile Asp Asn Phe Asn Gly Pro Ser Gly Leu Phe Ile Ala
245 250 255
Ala Gly Lys Gly Ile Leu Arg Thr Met Arg Ala Ser Asn Ser Ala Val
260 265 270
Ala Asp Leu Val Pro Val Asp Val Val Val Asn Thr Thr Leu Ala Ala
275 280 285
Ala Trp Tyr Ser Gly Val Asn Arg Pro Arg Asn Val Met Ile Tyr Asn
290 295 300
Cys Thr Thr Gly Gly Thr Asn Pro Phe His Trp Gly Glu Val Gly Tyr
305 310 315 320
His Ile Asn Leu Asn Phe Lys Ile Asn Pro Leu Glu Asn Ala Val Arg
325 330 335
His Pro Asn Cys Ser Leu Gln Ser Asn Pro Leu Leu His Gln Tyr Trp
340 345 350
Thr Ala Val Ser His Thr Met Pro Ala Phe Leu Leu Asp Leu Leu Leu
355 360 365
Arg Leu Thr Gly His Lys Pro Trp Met Met Lys Thr Ile Thr Arg Leu
370 375 380
His Lys Ala Met Met Leu Leu Glu Tyr Phe Thr Ser Asn Ser Trp Ile
385 390 395 400
Trp Asn Thr Glu Asn Met Thr Met Leu Met Asn Gln Leu Asn Pro Glu
405 410 415
Asp Lys Lys Thr Phe Asn Phe Asp Val Arg Gln Leu His Trp Ala Glu
420 425 430
Tyr Met Glu Asn Tyr Cys Met Gly Thr Lys Lys Tyr Val Leu Asn Glu
435 440 445
Glu Met Ser Gly Leu Pro Ala Ala Arg Lys His Leu Asn Lys Leu Arg
450 455 460
Asn Ile Arg Tyr Gly Phe Asn Thr Val Leu Val Ile Leu Ile Trp Arg
465 470 475 480
Ile Phe Ile Ala Arg Ser Gln Met Ala Arg Asn Ile Trp Tyr Phe Val
485 490 495
Val Ser Leu Cys Tyr Lys Phe Leu Ser Tyr Phe Arg Ala Ser Ser Thr
500 505 510
Met Arg Tyr
515
<210> 9
<211> 1377
<212> DNA
<213> Artificial sequence
<220>
<223> A. segetum fatty acyl reductase (AGP26039) codon optimized for Y.
lipolytica; mRNA-coding sequence
<220>
<221> misc_feature
<222> (1)..(1377)
<223> A. segetum fatty acyl reductase (AGP26039) codon optimized for Y.
lipolytica; mRNA-coding sequence
<400> 9
atgcccgtgc tgacctcgcg agaggacgag aagctgtctg tgcccgagtt ctacgccggc 60
aagtctatct tcgtgaccgg cggcaccgga ttcctcggca aggtgttcat tgagaagctg 120
ctctactgct gccccgacat cgacaagatc tacatgctga tccgagagaa gaagaacctg 180
tctatcgacg agcgaatgtc taagttcctg gacgaccctc tgttctctcg actgaaggaa 240
gaacgacccg gcgacctcga gaagatcgtg ctgatccccg gcgacatcac cgctcctaac 300
ctgggcctgt ctgccgagaa cgaacgaatc ctgctcgaga aggtgtccgt gatcatcaac 360
tctgccgcca ccgtgaagtt caacgagccc ctgcctatcg cctggaagat caacgtcgag 420
ggcacccgaa tgctgctggc cctgtctcga cgaatgaagc gaatcgaggt gtttatccac 480
atctctaccg cctactctaa cgcctcttct gaccgaatcg tggtggacga gattctgtac 540
cccgctcctg ccgacatgga ccaggtgtac cagctcgtga aggacggcgt gaccgaggaa 600
gagactgagc gactgctgaa cggactgccc aacacctaca ccttcaccaa ggctctgacc 660
gagcacctgg tggccgagca ccagacctac gtgcccacca tcatcattcg accctccgtg 720
gtggcctcta tcaaggacga gcccatccga ggctggctgt gcaactggtt cggcgccacc 780
ggcatctctg tgttcaccgc caagggcctg aaccgagtgc tgctcggaaa ggcctctaac 840
atcgtggacg tgatccccgt ggactacgtg gccaacctgg tgatcgtggc tggcgccaag 900
tctggcggcc agaagtctga cgagctgaag atctataact gctgttcttc tgactgcaac 960
cccgtgactc tgaagaagat catcaaggaa ttcaccgagg acaccatcaa gaacaagtct 1020
cacatcatgc ctctgcctgg ctggttcgtg ttcaccaagt acaagtggct gctgaccctc 1080
ctgaccatca tcttccagat gctgcccatg tacctggccg acgtgtaccg agtcctgacc 1140
ggcaagattc cccggtacat gaagctgcac cacctggtca ttcagacccg actgggaatc 1200
gacttcttca cctctcactc ttgggtgatg aagaccgacc gagtgcgaga gctgttcggc 1260
tctctgtctc tggccgagaa gcacatgttc ccttgcgacc cctcttccat cgactggacc 1320
gactacctgc agtcttactg ctacggcgtg cgacgattcc tggaaaagaa gaagtag 1377
<210> 10
<211> 458
<212> PRT
<213> Agrotis segetum
<220>
<221> MISC_FEATURE
<222> (1)..(458)
<223> A. segetum fatty acyl reductase (AGP26039)
<400> 10
Met Pro Val Leu Thr Ser Arg Glu Asp Glu Lys Leu Ser Val Pro Glu
1 5 10 15
Phe Tyr Ala Gly Lys Ser Ile Phe Val Thr Gly Gly Thr Gly Phe Leu
20 25 30
Gly Lys Val Phe Ile Glu Lys Leu Leu Tyr Cys Cys Pro Asp Ile Asp
35 40 45
Lys Ile Tyr Met Leu Ile Arg Glu Lys Lys Asn Leu Ser Ile Asp Glu
50 55 60
Arg Met Ser Lys Phe Leu Asp Asp Pro Leu Phe Ser Arg Leu Lys Glu
65 70 75 80
Glu Arg Pro Gly Asp Leu Glu Lys Ile Val Leu Ile Pro Gly Asp Ile
85 90 95
Thr Ala Pro Asn Leu Gly Leu Ser Ala Glu Asn Glu Arg Ile Leu Leu
100 105 110
Glu Lys Val Ser Val Ile Ile Asn Ser Ala Ala Thr Val Lys Phe Asn
115 120 125
Glu Pro Leu Pro Ile Ala Trp Lys Ile Asn Val Glu Gly Thr Arg Met
130 135 140
Leu Leu Ala Leu Ser Arg Arg Met Lys Arg Ile Glu Val Phe Ile His
145 150 155 160
Ile Ser Thr Ala Tyr Ser Asn Ala Ser Ser Asp Arg Ile Val Val Asp
165 170 175
Glu Ile Leu Tyr Pro Ala Pro Ala Asp Met Asp Gln Val Tyr Gln Leu
180 185 190
Val Lys Asp Gly Val Thr Glu Glu Glu Thr Glu Arg Leu Leu Asn Gly
195 200 205
Leu Pro Asn Thr Tyr Thr Phe Thr Lys Ala Leu Thr Glu His Leu Val
210 215 220
Ala Glu His Gln Thr Tyr Val Pro Thr Ile Ile Ile Arg Pro Ser Val
225 230 235 240
Val Ala Ser Ile Lys Asp Glu Pro Ile Arg Gly Trp Leu Cys Asn Trp
245 250 255
Phe Gly Ala Thr Gly Ile Ser Val Phe Thr Ala Lys Gly Leu Asn Arg
260 265 270
Val Leu Leu Gly Lys Ala Ser Asn Ile Val Asp Val Ile Pro Val Asp
275 280 285
Tyr Val Ala Asn Leu Val Ile Val Ala Gly Ala Lys Ser Gly Gly Gln
290 295 300
Lys Ser Asp Glu Leu Lys Ile Tyr Asn Cys Cys Ser Ser Asp Cys Asn
305 310 315 320
Pro Val Thr Leu Lys Lys Ile Ile Lys Glu Phe Thr Glu Asp Thr Ile
325 330 335
Lys Asn Lys Ser His Ile Met Pro Leu Pro Gly Trp Phe Val Phe Thr
340 345 350
Lys Tyr Lys Trp Leu Leu Thr Leu Leu Thr Ile Ile Phe Gln Met Leu
355 360 365
Pro Met Tyr Leu Ala Asp Val Tyr Arg Val Leu Thr Gly Lys Ile Pro
370 375 380
Arg Tyr Met Lys Leu His His Leu Val Ile Gln Thr Arg Leu Gly Ile
385 390 395 400
Asp Phe Phe Thr Ser His Ser Trp Val Met Lys Thr Asp Arg Val Arg
405 410 415
Glu Leu Phe Gly Ser Leu Ser Leu Ala Glu Lys His Met Phe Pro Cys
420 425 430
Asp Pro Ser Ser Ile Asp Trp Thr Asp Tyr Leu Gln Ser Tyr Cys Tyr
435 440 445
Gly Val Arg Arg Phe Leu Glu Lys Lys Lys
450 455
<210> 11
<211> 1368
<212> DNA
<213> Artificial sequence
<220>
<223> H. armigera fatty acyl reductase (ATJ44471) codon optimized for
Y. lipolytica; mRNA-coding sequence
<220>
<221> misc_feature
<222> (1)..(1368)
<223> H. armigera fatty acyl reductase (ATJ44471) codon optimized for
Y. lipolytica; mRNA-coding sequence
<400> 11
atggtggtcc tgacctctaa ggagactaag ccctccgtgg ccgagttcta cgctggcaag 60
tctgtcttca tcaccggcgg aaccggtttc ctgggcaagg tcttcattga gaagctgctg 120
tactcctgtc ccgacatcgg caacatctac atgctgatcc gagagaagaa gggactgtct 180
gtgtccgagc gaattaagca cttcctggac gaccccctgt tcacccgact gaaggagaag 240
cgacccgccg acctggagaa gatcgtgctg attcccggag acatcaccgc tcccgacctg 300
ggtattacct ctgagaacga gaagatgctg atcgagaagg tgtctgtcat cattcactcc 360
gccgctaccg tcaagttcaa cgagcccctg cccaccgcct ggaagatcaa cgtggaggga 420
acccgaatga tgctggctct gtctcgacga atgaagcgaa ttgaggtctt catccacatt 480
tccaccgcct acaccaacac caaccgagag gtggtggacg agatcctgta ccctgctcct 540
gctgacattg accaggtgca ccgatacgtc aaggacggta tctctgagga agagactgag 600
aagattctga acggccgacc caacacctac accttcacca aggccctgac cgagcacctg 660
gtggctgaga accaggctta cgtgcccacc atcattgtcc gaccctccgt ggtcgccgct 720
atcaaggacg agcccattaa gggatggctg ggtaactggt acggagctac cggactgacc 780
gtgttcaccg ctaagggtct gaaccgagtc atctacggcc actcttccaa catcgtggac 840
ctgattcccg tggactacgt cgccaacctg gtcattgccg ctggcgctaa gtcttccaag 900
tccaccgagc tgaaggtgta caactgttgc tcttccgcct gcaaccccat caccattgga 960
aagctgatgt ctatgttcgc cgaggacgct atcaagcaga agtcctacgc tatgcccctg 1020
cccggttggt acatcttcac caagtacaag tggctggtcc tgctgctgac cattctgttc 1080
caggtcatcc ccgcctacat taccgacctg taccgacacc tgatcggcaa gaacccccga 1140
tacattaagc tgcagtctct ggtcaaccag acccgatctt ccattgactt cttcacctct 1200
cactcctggg tcatgaaggc tgaccgagtc cgagagctgt tcgcctctct gtcccccgct 1260
gacaagtacc tgttcccctg tgaccccacc gacatcaact ggacccacta cattcaggac 1320
tactgctggg gagtgcgaca cttcctggag aagaagtcct acgagtag 1368
<210> 12
<211> 456
<212> PRT
<213> Helicoverpa armigera
<220>
<221> MISC_FEATURE
<222> (1)..(456)
<223> H. armigera fatty acyl reductase (ATJ44471)
<400> 12
Met Val Val Leu Thr Ser Lys Glu Thr Lys Pro Ser Val Ala Glu Phe
1 5 10 15
Tyr Ala Gly Lys Ser Val Phe Ile Thr Gly Gly Thr Gly Phe Leu Gly
20 25 30
Lys Val Phe Ile Glu Lys Leu Leu Tyr Ser Cys Pro Asp Ile Gly Asn
35 40 45
Ile Tyr Met Leu Ile Arg Glu Lys Lys Gly Leu Ser Val Ser Glu Arg
50 55 60
Ile Lys Gln Phe Leu Asp Asp Pro Leu Phe Thr Arg Leu Lys Glu Lys
65 70 75 80
Arg Pro Ala Asp Leu Glu Lys Ile Val Leu Ile Pro Gly Asp Ile Thr
85 90 95
Ala Pro Asp Leu Gly Ile Thr Ser Glu Asn Glu Lys Ile Leu Ile Glu
100 105 110
Lys Val Ser Val Ile Ile His Ser Ala Ala Thr Val Lys Phe Asn Glu
115 120 125
Pro Leu Pro Thr Ala Trp Lys Ile Asn Val Glu Gly Thr Arg Met Met
130 135 140
Leu Ala Leu Ser Arg Arg Met Lys Arg Ile Glu Val Phe Ile His Ile
145 150 155 160
Ser Thr Ala Tyr Thr Asn Thr Asn Arg Glu Val Val Asp Glu Ile Leu
165 170 175
Tyr Pro Ala Pro Ala Asp Ile Asp Gln Val His Gln Tyr Val Lys Asp
180 185 190
Gly Ile Ser Glu Glu Glu Thr Glu Lys Ile Leu Asn Gly Arg Pro Asn
195 200 205
Thr Tyr Thr Phe Thr Lys Ala Leu Thr Glu His Leu Val Ala Glu Asn
210 215 220
Gln Ala Tyr Val Pro Thr Ile Ile Val Arg Pro Ser Val Val Ala Ala
225 230 235 240
Ile Lys Asp Glu Pro Ile Lys Gly Trp Leu Gly Asn Trp Tyr Gly Ala
245 250 255
Thr Gly Leu Thr Val Phe Thr Ala Lys Gly Leu Asn Arg Val Ile Tyr
260 265 270
Gly His Ser Ser Asn Ile Val Asp Leu Ile Pro Val Asp Tyr Val Ala
275 280 285
Asn Leu Val Ile Ala Ala Gly Ala Lys Ser Ser Lys Ser Thr Asp Leu
290 295 300
Lys Val Tyr Asn Cys Cys Ser Ser Ala Cys Asn Pro Ile Thr Ile Gly
305 310 315 320
Lys Leu Met Ser Met Phe Ala Glu Asp Ala Ile Lys Gln Lys Ser Tyr
325 330 335
Ala Met Pro Leu Pro Gly Trp Tyr Ile Phe Thr Lys Tyr Lys Trp Leu
340 345 350
Val Leu Leu Leu Thr Ile Leu Phe Gln Val Ile Pro Ala Tyr Ile Thr
355 360 365
Asp Leu Tyr Arg His Leu Ile Gly Lys Asn Pro Arg Tyr Ile Lys Leu
370 375 380
Gln Ser Leu Val Asn Gln Thr Arg Ser Ser Ile Asp Phe Phe Thr Ser
385 390 395 400
His Ser Trp Val Met Lys Ala Asp Arg Val Arg Glu Leu Phe Ala Ser
405 410 415
Leu Ser Pro Ala Asp Lys Tyr Leu Phe Pro Cys Asp Pro Thr Asp Ile
420 425 430
Asn Trp Thr His Tyr Ile Gln Asp Tyr Cys Trp Gly Val Arg His Phe
435 440 445
Leu Glu Lys Lys Thr Thr Asn Lys
450 455
<210> 13
<211> 915
<212> DNA
<213> Yarrowia lipolytica
<220>
<221> misc_feature
<222> (1)..(915)
<223> Y. lipolytica fatty acid elongase 1 (YALI0_F06754g)
<400> 13
atgctctcgt caatctcgcc cgacctatac tcgtccttct cgttcaaaaa ctcgctcgcc 60
gaggccatgc cctccgtgcc acacgaactc atcaactcaa aaacactctc atggatgtac 120
aatgcctctc tggacattcg ggttcctctg actatcggaa ccatctacgc cgtctccgtg 180
cacctgacca actcatctga acgaatcaag aaacgccagc ccattgcctt tgccaagacc 240
gcactcttca agtggctctg tgtcctccac aatgcaggtc tgtgtctcta ctcagcatgg 300
acctttgtcg gtatcctcaa cgccgtcaaa cacgcctacc aaatcacagg agacagctcc 360
gcccccttct ccttcaacac cctctgggga tcgttttgtt cacgtgactc cctctgggtc 420
accggcctca actactacgg atactggttc tatctgtcca aattctacga agtggtggac 480
accatgatca tcctcgcaaa gggaaaaccg tcctcaatgc tccagacata ccaccacacc 540
ggcgccatgt tctccatgtg ggccggcatc cgattcgcct ctccccccat ctggatcttt 600
gtggttttca actccctcat ccacacaatc atgtactttt actacaccct caccaccctc 660
aagatcaagg ttcccaagat cctcaaggca tctctgacca ccgcccagat cacccagatt 720
gtcggaggtg gcatcctggc tgcctcccac gcctttattt attacaagga ccaccagact 780
gagaccgtct gttcttgtct cactacccag ggtcagtttt tcgctctcgc cgtcaatgtc 840
atctatctga gtcctctggc ctatctcttt attgccttct ggattcgatc ttacttgaag 900
gccaagtcca actag 915
<210> 14
<211> 304
<212> PRT
<213> Yarrowia lipolytica
<220>
<221> MISC_FEATURE
<222> (1)..(304)
<223> Y. lipolytica fatty acid elongase 1 (XP_505094)
<400> 14
Met Leu Ser Ser Ile Ser Pro Asp Leu Tyr Ser Ser Phe Ser Phe Lys
1 5 10 15
Asn Ser Leu Ala Glu Ala Met Pro Ser Val Pro His Glu Leu Ile Asn
20 25 30
Ser Lys Thr Leu Ser Trp Met Tyr Asn Ala Ser Leu Asp Ile Arg Val
35 40 45
Pro Leu Thr Ile Gly Thr Ile Tyr Ala Val Ser Val His Leu Thr Asn
50 55 60
Ser Ser Glu Arg Ile Lys Lys Arg Gln Pro Ile Ala Phe Ala Lys Thr
65 70 75 80
Ala Leu Phe Lys Trp Leu Cys Val Leu His Asn Ala Gly Leu Cys Leu
85 90 95
Tyr Ser Ala Trp Thr Phe Val Gly Ile Leu Asn Ala Val Lys His Ala
100 105 110
Tyr Gln Ile Thr Gly Asp Ser Ser Ala Pro Phe Ser Phe Asn Thr Leu
115 120 125
Trp Gly Ser Phe Cys Ser Arg Asp Ser Leu Trp Val Thr Gly Leu Asn
130 135 140
Tyr Tyr Gly Tyr Trp Phe Tyr Leu Ser Lys Phe Tyr Glu Val Val Asp
145 150 155 160
Thr Met Ile Ile Leu Ala Lys Gly Lys Pro Ser Ser Met Leu Gln Thr
165 170 175
Tyr His His Thr Gly Ala Met Phe Ser Met Trp Ala Gly Ile Arg Phe
180 185 190
Ala Ser Pro Pro Ile Trp Ile Phe Val Val Phe Asn Ser Leu Ile His
195 200 205
Thr Ile Met Tyr Phe Tyr Tyr Thr Leu Thr Thr Leu Lys Ile Lys Val
210 215 220
Pro Lys Ile Leu Lys Ala Ser Leu Thr Thr Ala Gln Ile Thr Gln Ile
225 230 235 240
Val Gly Gly Gly Ile Leu Ala Ala Ser His Ala Phe Ile Tyr Tyr Lys
245 250 255
Asp His Gln Thr Glu Thr Val Cys Ser Cys Leu Thr Thr Gln Gly Gln
260 265 270
Phe Phe Ala Leu Ala Val Asn Val Ile Tyr Leu Ser Pro Leu Ala Tyr
275 280 285
Leu Phe Ile Ala Phe Trp Ile Arg Ser Tyr Leu Lys Ala Lys Ser Asn
290 295 300
<210> 15
<211> 6337
<212> DNA
<213> Yarrowia lipolytica
<220>
<221> misc_feature
<222> (1)..(6337)
<223> Y. lipolytica fatty acid synthase 1 (YALI0_B15059g)
<400> 15
atggtgagta tcgaccgaag caggatgatc tctacatgag atatgcaacg cgtacgtgat 60
tcaattgatc ctaacacagt accctaccac aggtgtcaac accccccaga gcgccgcctc 120
attaagacca ctggtgctat cgcacggcca aactgagcac tcgctgctgg tgcccacctc 180
tctgtacatc aactgcacca cgctccgaga ccagttctac gcctctctac ctccagccac 240
tgaagacaag gccgacgatg atgagccctc ctcctccaca gagcttctag ctgccttcct 300
gggatttact gccaagaccg tcgaggaaga gcccggacca tacgacgacg ttctctctct 360
cgtgcttaac gagtttgaga cccggtactt gcgaggtaac gacatccacg ctgtggcctc 420
ctccttgtta caagacgagg acgtgcctac caccgttggt aagatcaaga gggtgattcg 480
agcctactac gccgcacgaa ttgcctgcaa ccggcccatc aaggcccact cgtcggctct 540
gttccgagcc gcatctgaag actcggacaa cgtctctctg tacgccatct tcggtggcca 600
gggaaacacc gaggactact ttgaggaact gcgggagatt tacgacatct accaggggct 660
ggtcggcgac ttcattcggg aatgtggagc ccagcttctg gcgctgtctc gagatcacat 720
tgctgctgag aaaatttata ccaagggctt tgatatcgtc aagtggctgg aacaccccga 780
gaccatcccc gactttgagt acctaatttc tgctcccatc tctgtaccca tcatcggtgt 840
tatccagctg gcacactacg ctgtcacctg tcgagttttg ggtcttaatc ctggccaggt 900
ccgagacaac ctcaagggtg ccactggcca ttctcagggt ctgatcaccg caattgccat 960
ctctgcctcc gactcgtggg acgagttcta taactctgcc tctcgaattc tcaagatctt 1020
cttcttcatc ggtgtccgtg tccaacaggc ttacccctcc actttcctgc ctccctccac 1080
tctggaagac agtgtcaagc agggtgaggg caagcccact cccatgctgt ccatccgaga 1140
cctgtctctc aaccaggttc aggagttcgt cgatgccacc aacttgcatt tgcccgaaga 1200
taagcagatc gtcgtgtctc tgatcaatgg tcctcgaaac gttgtcgtta ctggcccccc 1260
ccagtctctg tatggtctgt gtcttgtgct tcgaaaacag aaggccgaga ccggtctgga 1320
ccaaagccga gtgccccaca gtcagcgaaa gctcaaattc acacatcgtt tcctgcccat 1380
cacctctcct ttccactcgt acctgctgga gaagagcacg gatctgatca tcaacgacct 1440
ggagtcttcc ggtgtggagt ttgtgtcctc cgagctcaag gtgcctgttt acgacacctt 1500
tgatggctcc gtgctgtctc agctacccaa gggtatcgtc agccgtctgg tcaacctcat 1560
cactcatctg cccgtcaagt gggagaaggc cactcagttt caggcctccc acattgtgga 1620
ctttggtccc ggtggcgctt ctggtcttgg tctgttgacc cacaagaaca aggatggaac 1680
tggagtgcga actattcttg ctggtgtcat tgaccagccc ctcgagttcg gcttcaagca 1740
ggagctgttt gaccgacagg agtcgtccat tgtttttgct caaaactggg ccaaggagtt 1800
ttctcccaag ctcgtcaaga tctcctccac caacgaggtc tatgtcgaca ccaaattctc 1860
tcgtctgact ggccgagccc ccatcatggt cgctggtatg acccctacca ctgtcaaccc 1920
caaatttgtg gctgccacta tgaactccgg ctaccacatc gagcttggtg gtggaggcta 1980
ctttgccccc ggtatgatga ccaaggccct tgaacacatt gagaagaaca ctcctcccgg 2040
atccggtatc accatcaacc tgatctacgt caaccctcga ctgattcaat ggggtattcc 2100
tctgattcag gagcttcgac agaagggttt ccccattgaa ggtctcacca ttggtgccgg 2160
tgtgccctct ctggaggttg ctaacgagtg gattcaggat ctgggcgtca agcacatcgc 2220
cttcaagcct ggatccatcg aggccatctc ctcggtgatt cgaatcgcca aggccaaccc 2280
agactttcct atcatccttc agtggaccgg aggtcgagga ggaggacatc attcgtttga 2340
ggacttccac gctcccattc tgcagatgta ctccaagatc cgacgatgca gcaacattgt 2400
gctgattgcc ggatctggtt tcggtgcttc taccgactcc tacccatacc tcaccggttc 2460
atggtcccga gactttgact accctcccat gccctttgac ggtatcctgg ttggttctcg 2520
agtcatggtt gccaaggagg ctttcacttc tctgggagcc aagcagctca ttgttgactc 2580
tccgggtgtt gaggattctg agtgggagaa aacctacgac aagcccactg gtggcgtcat 2640
caccgttctc tccgagatgg gtgagcctat ccacaagctc gccactcgag gtgtgctctt 2700
ctggcacgag atggacaaga ccgtgttctc cctgcccaag aagaagcgtc tggaagtgct 2760
caagtccaag cgagcctaca tcatcaagcg tctcaacgac gacttccaga agacttggtt 2820
tgccaagaac gcccagggac aggtgtgtga tctcgaagac ctcacctacg cggaggtcat 2880
ccagcgactt gttgacctca tgtacgtgaa gaaggaaagc cgatggatcg atgtcactct 2940
ccgaaatctt gccggcactt tcattcgacg agttgaggag cgattctcca ccgagacagg 3000
tgcctcttct gtgttgcaga gcttttccga gctggattcc gagcccgaga aggttgtcga 3060
gcgggtgttt gagctcttcc ctgcctctac tacccagatc atcaacgctc aagacaagga 3120
ccacttcctc atgctgtgtc tcaaccccat gcagaagccc gtgcccttca tccctgttct 3180
ggatgacaac tttgagttct tcttcaagaa ggactctctg tggcagtgcg aggacctcgc 3240
agctgttgtg gacgaagacg ttggacgaat ctgtattctt cagggtcccg ttgctgtcaa 3300
gcactccaag attgtcaacg agcccgtcaa ggagattctc gactccatgc acgaaggtca 3360
catcaagcag ctgcttgagg atggcgagta cgctggcaac atggccaaca tcccccaggt 3420
cgaatgcttt ggtggaaagc ctgctcagaa cttcggtgac gttgctctcg actctgtcat 3480
ggttcttgat gacctcaaca agaccgtgtt caagattgag accggcacct ctgctctgcc 3540
ttctgctgca gattggttct ctctgctggc cggtgacaag aactcttggc gacaggtctt 3600
cctgtccact gacaccattg tgcagaccac caagatgatc tccaaccctc tgcatcgact 3660
tctggagccc atcgcaggtt tgcaggttga gattgagcac cctgatgagc ccgagaacac 3720
cgtcatctct gctttcgagc ccatcaacgg caaggtcacc aaggtgctgg agctgcgaaa 3780
gggtgccgga gacgtcattt cgctgcagct gatcgaagcg cgtggcgttg accgagtccc 3840
cgttgctctt cctctggaat tcaagtacca gccccagatt ggctacgctc ccattgttga 3900
ggttatgacc gacaggaaca cccgaatcaa ggagttctac tggaagctgt ggtttggcca 3960
ggactccaag tttgagattg acaccgacat caccgaggaa atcattggcg atgacgttac 4020
catctctggc aaggccattg ccgactttgt ccacgctgtt ggcaacaagg gcgaggcctt 4080
tgttggtcga tctacctctg ctggtactgt cttcgctccc atggactttg ccattgtttt 4140
gggctggaag gccattatca aggcaatctt tccccgagca attgatgctg acattctgcg 4200
tctggtacat ctgtccaacg gcttcaagat gatgcctggc gccgaccctc tgcagatggg 4260
tgatgttgtt tccgccactg ccaagatcga cactgtcaag aactccgcta ccggcaagac 4320
tgttgctgtt cgaggtcttc tcacccgaga cggcaagcct gtcatggagg ttgtttccga 4380
attcttctac cgaggcgaat tctccgactt ccagaacact tttgagcgac gagaggaggt 4440
acccatgcaa ctgaccctca aggacgccaa ggccgtggcc attctctgct ccaaggagtg 4500
gtttgagtac aatggcgacg ataccaagga cctcgagggc aagaccattg tgttccgaaa 4560
ctcgtcattc atcaagtaca agaatgagac cgtcttctct tctgtgcaca ccaccggtaa 4620
ggtattgatg gagctgccct ccaaggaggt cattgagatt gccactgtta actaccaggc 4680
tggcgagtct catggcaatc ccgtcattga ttacctggag cgaaatggaa ccaccattga 4740
gcagcctgtt gagtttgaga agcccatccc tctgtccaag gcagatgatc ttctctcctt 4800
caaggctcct tcttccaacg agccctacgc tggtgtgtcc ggtgactaca atcccatcca 4860
cgtgtctcga gcctttgctt cctatgcatc ccttcctgga accatcaccc acggtatgta 4920
ctcttctgct gctgttcgat ctctgattga ggtctgggct gccgagaaca atgtgtctcg 4980
agttcgagcc ttctcctgtc agttccaggg catggttttg cccaacgacg agattgtgac 5040
tcgactggag cacgttggca tgatcaacgg tcgaaagatc atcaaggtta cctccaccaa 5100
ccgggagacc gaggctgttg ttctgtctgg cgaggctgag gtcgagcagc ccatctccac 5160
ctttgtcttt actggccagg gctctcagga gcagggcatg ggtatggacc tgtacgcctc 5220
ttccgaggtg gccaagaagg tctgggacaa ggctgacgag cacttcttgc agaactacgg 5280
tttctccatc atcaagatcg ttgtggagaa ccccaaggag ctggatattc attttggagg 5340
ccccaagggt aagaagatcc gagacaacta tatctctatg atgttcgaga ccattgatga 5400
gaagaccggc aacctcattt ccgagaagat cttcaaggag attgacgaga ccaccgactc 5460
tttcaccttc aagtccccca ccggtctgct ttctgctacc cagttcactc agcccgctct 5520
gaccctcatg gagaaggcgt cctttgagga catgaaggct aagggtcttg tccccgtgga 5580
tgcaaccttt gctggtcact cccttggtga gtactccgct cttgcttctc ttggtgatgt 5640
catgcccatc gagtctcttg ttgatgtcgt cttctaccga ggtatgacta tgcaggttgc 5700
tgttccccga gatgcccagg gtcggtccaa ttacggtatg tgcgctgtca acccctctcg 5760
aatctctacc accttcaacg acgctgctct tcggtttgtc gttgaccaca tctccgagca 5820
gaccaagtgg ctgcttgaga ttgtcaacta caacgttgag aactctcagt acgtgactgc 5880
cggtgacctg cgagctctcg acaccctcac caatgtgctc aacgtgctca aactcgagaa 5940
gatcaacatt gacaagctgc tcgagtctct gcctctggag aaggtcaagg agcacctttc 6000
tgagatcgtc accgaggtgg ccaagaagtc cgttgctaag cctcagccca ttgagctgga 6060
acgaggcttt gccgtgatcc ctctcaaggg catctctgtg cctttccact cttcgtacct 6120
gcgaaatggt gtcaagccct tccaaaactt cctggtgaag aaggtgccca agaacgctgt 6180
caaacctgcc aacctcattg gcaagtacat ccccaacctc actgccaagc cctttgagat 6240
caccaaggag tactttgaag aggtttacaa gctcaccggt tccgagaagg tcaagagcat 6300
catcaacaac tgggagtctt atgagtccaa gcagtaa 6337
<210> 16
<211> 2086
<212> PRT
<213> Yarrowia lipolytica
<220>
<221> MISC_FEATURE
<222> (1)..(2086)
<223> Y. lipolytica fatty acid synthase 1 (XP_500912)
<400> 16
Met Tyr Pro Thr Thr Gly Val Asn Thr Pro Gln Ser Ala Ala Ser Leu
1 5 10 15
Arg Pro Leu Val Leu Ser His Gly Gln Thr Glu His Ser Leu Leu Val
20 25 30
Pro Thr Ser Leu Tyr Ile Asn Cys Thr Thr Leu Arg Asp Gln Phe Tyr
35 40 45
Ala Ser Leu Pro Pro Ala Thr Glu Asp Lys Ala Asp Asp Asp Glu Pro
50 55 60
Ser Ser Ser Thr Glu Leu Leu Ala Ala Phe Leu Gly Phe Thr Ala Lys
65 70 75 80
Thr Val Glu Glu Glu Pro Gly Pro Tyr Asp Asp Val Leu Ser Leu Val
85 90 95
Leu Asn Glu Phe Glu Thr Arg Tyr Leu Arg Gly Asn Asp Ile His Ala
100 105 110
Val Ala Ser Ser Leu Leu Gln Asp Glu Asp Val Pro Thr Thr Val Gly
115 120 125
Lys Ile Lys Arg Val Ile Arg Ala Tyr Tyr Ala Ala Arg Ile Ala Cys
130 135 140
Asn Arg Pro Ile Lys Ala His Ser Ser Ala Leu Phe Arg Ala Ala Ser
145 150 155 160
Glu Asp Ser Asp Asn Val Ser Leu Tyr Ala Ile Phe Gly Gly Gln Gly
165 170 175
Asn Thr Glu Asp Tyr Phe Glu Glu Leu Arg Glu Ile Tyr Asp Ile Tyr
180 185 190
Gln Gly Leu Val Gly Asp Phe Ile Arg Glu Cys Gly Ala Gln Leu Leu
195 200 205
Ala Leu Ser Arg Asp His Ile Ala Ala Glu Lys Ile Tyr Thr Lys Gly
210 215 220
Phe Asp Ile Val Lys Trp Leu Glu His Pro Glu Thr Ile Pro Asp Phe
225 230 235 240
Glu Tyr Leu Ile Ser Ala Pro Ile Ser Val Pro Ile Ile Gly Val Ile
245 250 255
Gln Leu Ala His Tyr Ala Val Thr Cys Arg Val Leu Gly Leu Asn Pro
260 265 270
Gly Gln Val Arg Asp Asn Leu Lys Gly Ala Thr Gly His Ser Gln Gly
275 280 285
Leu Ile Thr Ala Ile Ala Ile Ser Ala Ser Asp Ser Trp Asp Glu Phe
290 295 300
Tyr Asn Ser Ala Ser Arg Ile Leu Lys Ile Phe Phe Phe Ile Gly Val
305 310 315 320
Arg Val Gln Gln Ala Tyr Pro Ser Thr Phe Leu Pro Pro Ser Thr Leu
325 330 335
Glu Asp Ser Val Lys Gln Gly Glu Gly Lys Pro Thr Pro Met Leu Ser
340 345 350
Ile Arg Asp Leu Ser Leu Asn Gln Val Gln Glu Phe Val Asp Ala Thr
355 360 365
Asn Leu His Leu Pro Glu Asp Lys Gln Ile Val Val Ser Leu Ile Asn
370 375 380
Gly Pro Arg Asn Val Val Val Thr Gly Pro Pro Gln Ser Leu Tyr Gly
385 390 395 400
Leu Cys Leu Val Leu Arg Lys Gln Lys Ala Glu Thr Gly Leu Asp Gln
405 410 415
Ser Arg Val Pro His Ser Gln Arg Lys Leu Lys Phe Thr His Arg Phe
420 425 430
Leu Pro Ile Thr Ser Pro Phe His Ser Tyr Leu Leu Glu Lys Ser Thr
435 440 445
Asp Leu Ile Ile Asn Asp Leu Glu Ser Ser Gly Val Glu Phe Val Ser
450 455 460
Ser Glu Leu Lys Val Pro Val Tyr Asp Thr Phe Asp Gly Ser Val Leu
465 470 475 480
Ser Gln Leu Pro Lys Gly Ile Val Ser Arg Leu Val Asn Leu Ile Thr
485 490 495
His Leu Pro Val Lys Trp Glu Lys Ala Thr Gln Phe Gln Ala Ser His
500 505 510
Ile Val Asp Phe Gly Pro Gly Gly Ala Ser Gly Leu Gly Leu Leu Thr
515 520 525
His Lys Asn Lys Asp Gly Thr Gly Val Arg Thr Ile Leu Ala Gly Val
530 535 540
Ile Asp Gln Pro Leu Glu Phe Gly Phe Lys Gln Glu Leu Phe Asp Arg
545 550 555 560
Gln Glu Ser Ser Ile Val Phe Ala Gln Asn Trp Ala Lys Glu Phe Ser
565 570 575
Pro Lys Leu Val Lys Ile Ser Ser Thr Asn Glu Val Tyr Val Asp Thr
580 585 590
Lys Phe Ser Arg Leu Thr Gly Arg Ala Pro Ile Met Val Ala Gly Met
595 600 605
Thr Pro Thr Thr Val Asn Pro Lys Phe Val Ala Ala Thr Met Asn Ser
610 615 620
Gly Tyr His Ile Glu Leu Gly Gly Gly Gly Tyr Phe Ala Pro Gly Met
625 630 635 640
Met Thr Lys Ala Leu Glu His Ile Glu Lys Asn Thr Pro Pro Gly Ser
645 650 655
Gly Ile Thr Ile Asn Leu Ile Tyr Val Asn Pro Arg Leu Ile Gln Trp
660 665 670
Gly Ile Pro Leu Ile Gln Glu Leu Arg Gln Lys Gly Phe Pro Ile Glu
675 680 685
Gly Leu Thr Ile Gly Ala Gly Val Pro Ser Leu Glu Val Ala Asn Glu
690 695 700
Trp Ile Gln Asp Leu Gly Val Lys His Ile Ala Phe Lys Pro Gly Ser
705 710 715 720
Ile Glu Ala Ile Ser Ser Val Ile Arg Ile Ala Lys Ala Asn Pro Asp
725 730 735
Phe Pro Ile Ile Leu Gln Trp Thr Gly Gly Arg Gly Gly Gly His His
740 745 750
Ser Phe Glu Asp Phe His Ala Pro Ile Leu Gln Met Tyr Ser Lys Ile
755 760 765
Arg Arg Cys Ser Asn Ile Val Leu Ile Ala Gly Ser Gly Phe Gly Ala
770 775 780
Ser Thr Asp Ser Tyr Pro Tyr Leu Thr Gly Ser Trp Ser Arg Asp Phe
785 790 795 800
Asp Tyr Pro Pro Met Pro Phe Asp Gly Ile Leu Val Gly Ser Arg Val
805 810 815
Met Val Ala Lys Glu Ala Phe Thr Ser Leu Gly Ala Lys Gln Leu Ile
820 825 830
Val Asp Ser Pro Gly Val Glu Asp Ser Glu Trp Glu Lys Thr Tyr Asp
835 840 845
Lys Pro Thr Gly Gly Val Ile Thr Val Leu Ser Glu Met Gly Glu Pro
850 855 860
Ile His Lys Leu Ala Thr Arg Gly Val Leu Phe Trp His Glu Met Asp
865 870 875 880
Lys Thr Val Phe Ser Leu Pro Lys Lys Lys Arg Leu Glu Val Leu Lys
885 890 895
Ser Lys Arg Ala Tyr Ile Ile Lys Arg Leu Asn Asp Asp Phe Gln Lys
900 905 910
Thr Trp Phe Ala Lys Asn Ala Gln Gly Gln Val Cys Asp Leu Glu Asp
915 920 925
Leu Thr Tyr Ala Glu Val Ile Gln Arg Leu Val Asp Leu Met Tyr Val
930 935 940
Lys Lys Glu Ser Arg Trp Ile Asp Val Thr Leu Arg Asn Leu Ala Gly
945 950 955 960
Thr Phe Ile Arg Arg Val Glu Glu Arg Phe Ser Thr Glu Thr Gly Ala
965 970 975
Ser Ser Val Leu Gln Ser Phe Ser Glu Leu Asp Ser Glu Pro Glu Lys
980 985 990
Val Val Glu Arg Val Phe Glu Leu Phe Pro Ala Ser Thr Thr Gln Ile
995 1000 1005
Ile Asn Ala Gln Asp Lys Asp His Phe Leu Met Leu Cys Leu Asn
1010 1015 1020
Pro Met Gln Lys Pro Val Pro Phe Ile Pro Val Leu Asp Asp Asn
1025 1030 1035
Phe Glu Phe Phe Phe Lys Lys Asp Ser Leu Trp Gln Cys Glu Asp
1040 1045 1050
Leu Ala Ala Val Val Asp Glu Asp Val Gly Arg Ile Cys Ile Leu
1055 1060 1065
Gln Gly Pro Val Ala Val Lys His Ser Lys Ile Val Asn Glu Pro
1070 1075 1080
Val Lys Glu Ile Leu Asp Ser Met His Glu Gly His Ile Lys Gln
1085 1090 1095
Leu Leu Glu Asp Gly Glu Tyr Ala Gly Asn Met Ala Asn Ile Pro
1100 1105 1110
Gln Val Glu Cys Phe Gly Gly Lys Pro Ala Gln Asn Phe Gly Asp
1115 1120 1125
Val Ala Leu Asp Ser Val Met Val Leu Asp Asp Leu Asn Lys Thr
1130 1135 1140
Val Phe Lys Ile Glu Thr Gly Thr Ser Ala Leu Pro Ser Ala Ala
1145 1150 1155
Asp Trp Phe Ser Leu Leu Ala Gly Asp Lys Asn Ser Trp Arg Gln
1160 1165 1170
Val Phe Leu Ser Thr Asp Thr Ile Val Gln Thr Thr Lys Met Ile
1175 1180 1185
Ser Asn Pro Leu His Arg Leu Leu Glu Pro Ile Ala Gly Leu Gln
1190 1195 1200
Val Glu Ile Glu His Pro Asp Glu Pro Glu Asn Thr Val Ile Ser
1205 1210 1215
Ala Phe Glu Pro Ile Asn Gly Lys Val Thr Lys Val Leu Glu Leu
1220 1225 1230
Arg Lys Gly Ala Gly Asp Val Ile Ser Leu Gln Leu Ile Glu Ala
1235 1240 1245
Arg Gly Val Asp Arg Val Pro Val Ala Leu Pro Leu Glu Phe Lys
1250 1255 1260
Tyr Gln Pro Gln Ile Gly Tyr Ala Pro Ile Val Glu Val Met Thr
1265 1270 1275
Asp Arg Asn Thr Arg Ile Lys Glu Phe Tyr Trp Lys Leu Trp Phe
1280 1285 1290
Gly Gln Asp Ser Lys Phe Glu Ile Asp Thr Asp Ile Thr Glu Glu
1295 1300 1305
Ile Ile Gly Asp Asp Val Thr Ile Ser Gly Lys Ala Ile Ala Asp
1310 1315 1320
Phe Val His Ala Val Gly Asn Lys Gly Glu Ala Phe Val Gly Arg
1325 1330 1335
Ser Thr Ser Ala Gly Thr Val Phe Ala Pro Met Asp Phe Ala Ile
1340 1345 1350
Val Leu Gly Trp Lys Ala Ile Ile Lys Ala Ile Phe Pro Arg Ala
1355 1360 1365
Ile Asp Ala Asp Ile Leu Arg Leu Val His Leu Ser Asn Gly Phe
1370 1375 1380
Lys Met Met Pro Gly Ala Asp Pro Leu Gln Met Gly Asp Val Val
1385 1390 1395
Ser Ala Thr Ala Lys Ile Asp Thr Val Lys Asn Ser Ala Thr Gly
1400 1405 1410
Lys Thr Val Ala Val Arg Gly Leu Leu Thr Arg Asp Gly Lys Pro
1415 1420 1425
Val Met Glu Val Val Ser Glu Phe Phe Tyr Arg Gly Glu Phe Ser
1430 1435 1440
Asp Phe Gln Asn Thr Phe Glu Arg Arg Glu Glu Val Pro Met Gln
1445 1450 1455
Leu Thr Leu Lys Asp Ala Lys Ala Val Ala Ile Leu Cys Ser Lys
1460 1465 1470
Glu Trp Phe Glu Tyr Asn Gly Asp Asp Thr Lys Asp Leu Glu Gly
1475 1480 1485
Lys Thr Ile Val Phe Arg Asn Ser Ser Phe Ile Lys Tyr Lys Asn
1490 1495 1500
Glu Thr Val Phe Ser Ser Val His Thr Thr Gly Lys Val Leu Met
1505 1510 1515
Glu Leu Pro Ser Lys Glu Val Ile Glu Ile Ala Thr Val Asn Tyr
1520 1525 1530
Gln Ala Gly Glu Ser His Gly Asn Pro Val Ile Asp Tyr Leu Glu
1535 1540 1545
Arg Asn Gly Thr Thr Ile Glu Gln Pro Val Glu Phe Glu Lys Pro
1550 1555 1560
Ile Pro Leu Ser Lys Ala Asp Asp Leu Leu Ser Phe Lys Ala Pro
1565 1570 1575
Ser Ser Asn Glu Pro Tyr Ala Gly Val Ser Gly Asp Tyr Asn Pro
1580 1585 1590
Ile His Val Ser Arg Ala Phe Ala Ser Tyr Ala Ser Leu Pro Gly
1595 1600 1605
Thr Ile Thr His Gly Met Tyr Ser Ser Ala Ala Val Arg Ser Leu
1610 1615 1620
Ile Glu Val Trp Ala Ala Glu Asn Asn Val Ser Arg Val Arg Ala
1625 1630 1635
Phe Ser Cys Gln Phe Gln Gly Met Val Leu Pro Asn Asp Glu Ile
1640 1645 1650
Val Thr Arg Leu Glu His Val Gly Met Ile Asn Gly Arg Lys Ile
1655 1660 1665
Ile Lys Val Thr Ser Thr Asn Arg Glu Thr Glu Ala Val Val Leu
1670 1675 1680
Ser Gly Glu Ala Glu Val Glu Gln Pro Ile Ser Thr Phe Val Phe
1685 1690 1695
Thr Gly Gln Gly Ser Gln Glu Gln Gly Met Gly Met Asp Leu Tyr
1700 1705 1710
Ala Ser Ser Glu Val Ala Lys Lys Val Trp Asp Lys Ala Asp Glu
1715 1720 1725
His Phe Leu Gln Asn Tyr Gly Phe Ser Ile Ile Lys Ile Val Val
1730 1735 1740
Glu Asn Pro Lys Glu Leu Asp Ile His Phe Gly Gly Pro Lys Gly
1745 1750 1755
Lys Lys Ile Arg Asp Asn Tyr Ile Ser Met Met Phe Glu Thr Ile
1760 1765 1770
Asp Glu Lys Thr Gly Asn Leu Ile Ser Glu Lys Ile Phe Lys Glu
1775 1780 1785
Ile Asp Glu Thr Thr Asp Ser Phe Thr Phe Lys Ser Pro Thr Gly
1790 1795 1800
Leu Leu Ser Ala Thr Gln Phe Thr Gln Pro Ala Leu Thr Leu Met
1805 1810 1815
Glu Lys Ala Ser Phe Glu Asp Met Lys Ala Lys Gly Leu Val Pro
1820 1825 1830
Val Asp Ala Thr Phe Ala Gly His Ser Leu Gly Glu Tyr Ser Ala
1835 1840 1845
Leu Ala Ser Leu Gly Asp Val Met Pro Ile Glu Ser Leu Val Asp
1850 1855 1860
Val Val Phe Tyr Arg Gly Met Thr Met Gln Val Ala Val Pro Arg
1865 1870 1875
Asp Ala Gln Gly Arg Ser Asn Tyr Gly Met Cys Ala Val Asn Pro
1880 1885 1890
Ser Arg Ile Ser Thr Thr Phe Asn Asp Ala Ala Leu Arg Phe Val
1895 1900 1905
Val Asp His Ile Ser Glu Gln Thr Lys Trp Leu Leu Glu Ile Val
1910 1915 1920
Asn Tyr Asn Val Glu Asn Ser Gln Tyr Val Thr Ala Gly Asp Leu
1925 1930 1935
Arg Ala Leu Asp Thr Leu Thr Asn Val Leu Asn Val Leu Lys Leu
1940 1945 1950
Glu Lys Ile Asn Ile Asp Lys Leu Leu Glu Ser Leu Pro Leu Glu
1955 1960 1965
Lys Val Lys Glu His Leu Ser Glu Ile Val Thr Glu Val Ala Lys
1970 1975 1980
Lys Ser Val Ala Lys Pro Gln Pro Ile Glu Leu Glu Arg Gly Phe
1985 1990 1995
Ala Val Ile Pro Leu Lys Gly Ile Ser Val Pro Phe His Ser Ser
2000 2005 2010
Tyr Leu Arg Asn Gly Val Lys Pro Phe Gln Asn Phe Leu Val Lys
2015 2020 2025
Lys Val Pro Lys Asn Ala Val Lys Pro Ala Asn Leu Ile Gly Lys
2030 2035 2040
Tyr Ile Pro Asn Leu Thr Ala Lys Pro Phe Glu Ile Thr Lys Glu
2045 2050 2055
Tyr Phe Glu Glu Val Tyr Lys Leu Thr Gly Ser Glu Lys Val Lys
2060 2065 2070
Ser Ile Ile Asn Asn Trp Glu Ser Tyr Glu Ser Lys Gln
2075 2080 2085
<210> 17
<211> 5947
<212> DNA
<213> Yarrowia lipolytica
<220>
<221> misc_feature
<222> (1)..(5947)
<223> Y. lipolytica fatty acid synthase 2 (YALI0_B19382g)
<400> 17
agtgagtctt gaaatatggg atatgaggag gggtttgaag aggttgcaat cgataactca 60
cgacacggac gaaaaagaat aaggaccaac acgatctcca gacaaccaca gatcagcagt 120
cgaacccccc tcaacagcag acaaatgatg ttgtggaatt gcagtagatg atttcttctg 180
cgacgctagt attggctgtc ggcgacacta ttctctgaca gtgcccaatg gtctttttat 240
tgtgcaccaa ccgctgattt gtggctcagg ttttgtgacg gcgagagtca ttctcgtgat 300
gcatgggatg attggtctct ttgaagccga cagatcgaca tatttccaca cacagcaacg 360
acaatgttat cttatccatt gccattctaa cccagtgcac cccgaagtcg aacaagaact 420
cgcccacgtg ctcctgacgg agctgctggc ctaccaattt gcctcgcccg tgcgatggat 480
cgagacccag gacgtgctgt tcaagcagtt caatgtcgag cgagtcgtcg aagtcggccc 540
atccccaact ctcgccggca tggcccagcg aacccttaag tccaagtacg agtcatacga 600
cgctgctctg tctctgcagc gagagatcct gtgttactcc aaggaccaga aggacatcta 660
ctaccttgcc gatgaggccg atgaagcccc tgcccccgct gctggtggtg atgcccccgc 720
tgctcctgcc gctgccgctc ctgccgccgc tgccgctcct gctgccgctg ccgccccctc 780
tggccccgtt gccaaggttg aggacgcccc cgtcaaggcc caggagattc tccacgccct 840
ggtcgcccat aagctcaaga agacccccga gcaggtgccc ctgtccaagg ccatcaaaga 900
ccttgttggt ggtaagtcta ccatccagaa cgagattctc ggtgatctcg gaaaggaatt 960
tggtgccacc cctgagaagc ccgaggatac tccccttggc gagctggctg agtccttcca 1020
ggcctccttt gacggcaagc tcggtaagca gtcttcttct ctcattgccc gactcatgtc 1080
ctccaagatg cccggagggt tctctctcac ctctgctcga tcctacctcg acagcagatg 1140
gggcctggct gctggccgac aggactccgt tctgcttgtt gctctgatga acgaacccaa 1200
gaaccgactt ggctctgaag ccgaggccaa ggcctacctc gacgagcaga cccagaagta 1260
tgctgcttct gccggtctta acctgtctgc ccccgctggt ggtgccgagg gtggcaatgg 1320
cggtggcgcc gtcattgact ccgctgcctt tgacgctctc accaaggacc agcgatacct 1380
ggtccagcag caactcgagt tgtttgccaa ctacctgaag caggatctgc gacagggctc 1440
caaggtggct gctgcccaga aggaggccat ggatattctg caagctgaac tggatctttg 1500
gaactccgag cacggcgagg tctacgctga gggcatcaag cccgccttct ctgccctgaa 1560
ggcccgtgtc tacgactcgt actggaactg ggctcgacag gactcgctct ccatgtactt 1620
tgacattgtt ttcggtcgtc tctccaccgt tgaccgagag attatggcta agtgtatcca 1680
cctgatgaac cgaaccaacc acaacctgat cgactacatg cagtaccaca tggaccacgt 1740
ccccgttcac aagggagcca cctacgagct tgccaagcag ctcggtctgc agctcctcga 1800
gaactgtaag gagactctca ccgaggcccc cgtctacaag gatgtctctt accccactgg 1860
accccagacc accattgatg tcaagggtaa cattgtttac aacgaggtgc cccgacccaa 1920
tgtccgaaag ctcgagcagt atgtccacga gatggcctgt ggtggtgagc tgaccaagga 1980
cccctctttt gttggagaag gtgtccaggg cgagctcaag aagctgtact ctcagatctc 2040
tgctcttgcc aagacccaga ccggctctac cctcgacatc gaggctctgt actccgacct 2100
ggtcgctaag atctcccagg ccgaggacgc gtccaagcct gtcgttgaga acaaggctgt 2160
ttctgcctcc atcactcccg gcactctccc ttttctccac atcaagaaga agaccgaact 2220
tggtgcctgg aattacgaca gcgagaccac cgccacctac ctcgatggtc ttgaggttgc 2280
tgcccgtgat ggtctcactt tccagggcaa gactgctctg atcaccggtg ctggtgctgg 2340
ctccattggt gcctcaatcc tccagggtct catttccgga ggctgcaaag tcattgtcac 2400
aacctctcga tactcccgaa aggtgaccga gtactaccag tccctctaca ccaagttcgg 2460
tgctaagggt tccactctga ttgttgtccc cttcaaccaa ggctccaaga aggacgtgga 2520
cgagctggtg tcgttcatct acaacgaccc caagaacggc ggtcttggct gggatctgga 2580
ctttgttgtt ccctttgctg ctctgcccga gaacggtatt gagctggagc acattgactc 2640
aaagtccgag cttgcccatc gaatcatgct caccaacctc ctgcgtctgc ttggtaacgt 2700
caagaagcag aaagtggccc attcctacga gactcgaccc gcccaggtca tgctgcccct 2760
gtcgcccaac catggcaact tcggctccga tggtctgtac tccgagtcca agatctctct 2820
cgagactctg ttcaaccggt ggcacaccga gtcctggggc tcttatctca ccattgttgg 2880
tgtggtgatt ggctggaccc gaggtaccgg tctgatgagc gccaacaaca tcaccgccga 2940
gggtctggag cagctcggcg tccgaacctt ctcccagact gagatggcct tttccatcat 3000
gggtctcatg accaaggaca ttgtgcgact ggcccagaac tcccccgtgt gggccgatct 3060
caacggtggc ttccagtaca ttcccgacct caagggagtt gttggaaaga tccgacgaga 3120
cattgtggag acctccgaga tccgacgggc tgtggctcag gagactgcca ttgaacagaa 3180
ggtggtcaac ggcccccacg ccgatcttcc ttaccagaag gtcgaggtca agccccgagc 3240
caacctcaag tttgacttcc ccaccctcaa atcctacgcc gaggtcaagg agctgtctcc 3300
tgctggtgat gctctggagg gtcttctgga tctctcttcc gtcattgttg tcactggttt 3360
cgccgaggtc ggtccttggg gtaacgcccg aacccgatgg gacatggagg ccaacggtgt 3420
cttctccctt gagggtgcca ttgagatggc ctggatcatg ggtctgatca agcaccacaa 3480
tggtcccctg cccggcatgc ctcagtactc tggctggatc gataccaaga ccaagcagcc 3540
cgtcgatgac cgagatatca agaccaagta cgaggactac ctgcttgagc acgccggtat 3600
ccgactcatt gagcctgagc tgttccacgg ctacaacccc aagaagaaga ccttcctcca 3660
ggaggttatt gtggagcacg atctcgagcc ctttgaggcc tccaaggagt ctgctgagca 3720
atttgctctc gagcagggcg cgaacgttga gatcttcgcc gtccccgagt ccgaccagtg 3780
gactgtgcga cttctcaagg gcgccaagct cctcattccc aaggccctca agtttgaccg 3840
acttgtggcc ggccagattc ccactggatg ggatgcccga cgatacggta ttcccgagga 3900
catttgtgac caggttgacc ccatcactct gtacgctctt gtctccactg ttgaggctct 3960
gttggcctcc ggtattaccg acccctacga gttctacaag tacgtccacg tgtccgaggt 4020
cggtaactgt tccggttccg gtatgggtgg tatcaccgcc ctgcgaggca tgttcaagga 4080
ccggttcatg gacaagcctg ttcagaacga tattctccag gagtccttca tcaacaccat 4140
gtctgcctgg gtcaacatgt tgctgctctc ctcttccggt cccatcaaga cccccgttgg 4200
agcttgtgcc actgctgtcg agtctgtgga cattggttgc gaaaccattc tgtccggcaa 4260
ggccagaatc tgtctggtcg gtggttacga tgatttccag gaggagtctt ctcaggagtt 4320
tgcaaacatg aacgcaacat ccaacgctga gaccgagatc actcacggcc gaactccggc 4380
cgagatgtct cgacccatca cttccacacg agccggtttc atggaggctc agggtgctgg 4440
aacccaggtg ctgatggccg ccgacctcgc catcgccatg ggtgtgccca tctactgtat 4500
cgttggttac gtcaacactg ccaccgacaa gattggccga tctgtgcctg ctcccggtaa 4560
gggtatcctg accactgctc gagagcacca gactctcaaa cacgccaacc ctctcctcaa 4620
catcaagtac cgaaagcgac agctcgattc tcgactccga gacattaagc gatgggctga 4680
gggcgaaatg gaggctattg acattgagct tgacgacgtg tctgacgccg acaaggagtc 4740
cttcatccag gagcgatctg cccacatcca gtctcagtcc gatcgaatga tccgagaggc 4800
taagaactct tggggtaacg cctttttcaa gcaggacgcc cgaatctccc ccatccgagg 4860
agcgctggca acctacggtc tcaccattga tgacatctcc gtcgcttctt tccatggtac 4920
atccaccaag gccaacgaga agaacgagac caccaccgtc aacgccatgc tggagcatct 4980
cggcagaacc cggggtaacc ctgtctacgg tatcttccag aagtacctta ctggtcaccc 5040
caagggagct gctggtgcct ggatgctcaa cggagccatc caatgcctca actctggtat 5100
catccctggt aaccgaaacg ccgataacgt ggatgcctac tttgagcagt gccagcacgt 5160
ggtgttcccc tcgcgatctc tgcagaccga tggcctcaag gctgcttccg tgacctcctt 5220
tggtttcggt cagaagggtg cccaggccat tgtcatccac cccgactacc tgtacgctgc 5280
cctgacaccc tccgagtact ccgagtacac cacccgagtc gcccagcgat acaagaaggc 5340
ttaccgatac taccacaacg ccattgccga ggagtccatg ttccaggcca aggacaaggc 5400
tccctactct gctgagctgg agcaggaggt ctacctggat cctcttgtgc gagtccacca 5460
gaacgaggac accgagcagt actccttcaa cgccaaggac ctcgctgcct ccgcctttgt 5520
caagaactcc cacaaggaca ccgccaaggt gcttgccaac ctcacctccc aggtgtccgg 5580
ttctggtaag aacgttggtg tcgacgttga ggccatctcc gccatcaaca ttgataacga 5640
caccttcctt gaccgaaact tcaccgccaa cgagcaggcc tactgcttca aggccccctc 5700
cccccagtct tctttcgctg gcacttggtc tgccaaggag gctgttttca agtctctggg 5760
cgtcaagtcc cagggcggag gagctgagct caagtccatt gagatcactc gagatggcaa 5820
cggagctccc gtcgtggttc ttcacggagc tgccaaggac gctgctgctt ctaagggtat 5880
ctccaccgtc aaggtgtcca tttcccatga cgactctcag gccgtggctg ttgctgttgc 5940
cgagtag 5947
<210> 18
<211> 1850
<212> PRT
<213> Yarrowia lipolytica
<220>
<221> MISC_FEATURE
<222> (1)..(1850)
<223> Y. lipolytica fatty acid synthase 2 (XP_501096)
<400> 18
Met His Pro Glu Val Glu Gln Glu Leu Ala His Val Leu Leu Thr Glu
1 5 10 15
Leu Leu Ala Tyr Gln Phe Ala Ser Pro Val Arg Trp Ile Glu Thr Gln
20 25 30
Asp Val Leu Phe Lys Gln Phe Asn Val Glu Arg Val Val Glu Val Gly
35 40 45
Pro Ser Pro Thr Leu Ala Gly Met Ala Gln Arg Thr Leu Lys Ser Lys
50 55 60
Tyr Glu Ser Tyr Asp Ala Ala Leu Ser Leu Gln Arg Glu Ile Leu Cys
65 70 75 80
Tyr Ser Lys Asp Gln Lys Asp Ile Tyr Tyr Leu Ala Asp Glu Ala Asp
85 90 95
Glu Ala Pro Ala Pro Ala Ala Gly Gly Asp Ala Pro Ala Ala Pro Ala
100 105 110
Ala Ala Ala Pro Ala Ala Ala Ala Ala Pro Ala Ala Ala Ala Ala Pro
115 120 125
Ser Gly Pro Val Ala Lys Val Glu Asp Ala Pro Val Lys Ala Gln Glu
130 135 140
Ile Leu His Ala Leu Val Ala His Lys Leu Lys Lys Thr Pro Glu Gln
145 150 155 160
Val Pro Leu Ser Lys Ala Ile Lys Asp Leu Val Gly Gly Lys Ser Thr
165 170 175
Ile Gln Asn Glu Ile Leu Gly Asp Leu Gly Lys Glu Phe Gly Ala Thr
180 185 190
Pro Glu Lys Pro Glu Asp Thr Pro Leu Gly Glu Leu Ala Glu Ser Phe
195 200 205
Gln Ala Ser Phe Asp Gly Lys Leu Gly Lys Gln Ser Ser Ser Leu Ile
210 215 220
Ala Arg Leu Met Ser Ser Lys Met Pro Gly Gly Phe Ser Leu Thr Ser
225 230 235 240
Ala Arg Ser Tyr Leu Asp Ser Arg Trp Gly Leu Ala Ala Gly Arg Gln
245 250 255
Asp Ser Val Leu Leu Val Ala Leu Met Asn Glu Pro Lys Asn Arg Leu
260 265 270
Gly Ser Glu Ala Glu Ala Lys Ala Tyr Leu Asp Glu Gln Thr Gln Lys
275 280 285
Tyr Ala Ala Ser Ala Gly Leu Asn Leu Ser Ala Pro Ala Gly Gly Ala
290 295 300
Glu Gly Gly Asn Gly Gly Gly Ala Val Ile Asp Ser Ala Ala Phe Asp
305 310 315 320
Ala Leu Thr Lys Asp Gln Arg Tyr Leu Val Gln Gln Gln Leu Glu Leu
325 330 335
Phe Ala Asn Tyr Leu Lys Gln Asp Leu Arg Gln Gly Ser Lys Val Ala
340 345 350
Ala Ala Gln Lys Glu Ala Met Asp Ile Leu Gln Ala Glu Leu Asp Leu
355 360 365
Trp Asn Ser Glu His Gly Glu Val Tyr Ala Glu Gly Ile Lys Pro Ala
370 375 380
Phe Ser Ala Leu Lys Ala Arg Val Tyr Asp Ser Tyr Trp Asn Trp Ala
385 390 395 400
Arg Gln Asp Ser Leu Ser Met Tyr Phe Asp Ile Val Phe Gly Arg Leu
405 410 415
Ser Thr Val Asp Arg Glu Ile Met Ala Lys Cys Ile His Leu Met Asn
420 425 430
Arg Thr Asn His Asn Leu Ile Asp Tyr Met Gln Tyr His Met Asp His
435 440 445
Val Pro Val His Lys Gly Ala Thr Tyr Glu Leu Ala Lys Gln Leu Gly
450 455 460
Leu Gln Leu Leu Glu Asn Cys Lys Glu Thr Leu Thr Glu Ala Pro Val
465 470 475 480
Tyr Lys Asp Val Ser Tyr Pro Thr Gly Pro Gln Thr Thr Ile Asp Val
485 490 495
Lys Gly Asn Ile Val Tyr Asn Glu Val Pro Arg Pro Asn Val Arg Lys
500 505 510
Leu Glu Gln Tyr Val His Glu Met Ala Cys Gly Gly Glu Leu Thr Lys
515 520 525
Asp Pro Ser Phe Val Gly Glu Gly Val Gln Gly Glu Leu Lys Lys Leu
530 535 540
Tyr Ser Gln Ile Ser Ala Leu Ala Lys Thr Gln Thr Gly Ser Thr Leu
545 550 555 560
Asp Ile Glu Ala Leu Tyr Ser Asp Leu Val Ala Lys Ile Ser Gln Ala
565 570 575
Glu Asp Ala Ser Lys Pro Val Val Glu Asn Lys Ala Val Ser Ala Ser
580 585 590
Ile Thr Pro Gly Thr Leu Pro Phe Leu His Ile Lys Lys Lys Thr Glu
595 600 605
Leu Gly Ala Trp Asn Tyr Asp Ser Glu Thr Thr Ala Thr Tyr Leu Asp
610 615 620
Gly Leu Glu Val Ala Ala Arg Asp Gly Leu Thr Phe Gln Gly Lys Thr
625 630 635 640
Ala Leu Ile Thr Gly Ala Gly Ala Gly Ser Ile Gly Ala Ser Ile Leu
645 650 655
Gln Gly Leu Ile Ser Gly Gly Cys Lys Val Ile Val Thr Thr Ser Arg
660 665 670
Tyr Ser Arg Lys Val Thr Glu Tyr Tyr Gln Ser Leu Tyr Thr Lys Phe
675 680 685
Gly Ala Lys Gly Ser Thr Leu Ile Val Val Pro Phe Asn Gln Gly Ser
690 695 700
Lys Lys Asp Val Asp Glu Leu Val Ser Phe Ile Tyr Asn Asp Pro Lys
705 710 715 720
Asn Gly Gly Leu Gly Trp Asp Leu Asp Phe Val Val Pro Phe Ala Ala
725 730 735
Leu Pro Glu Asn Gly Ile Glu Leu Glu His Ile Asp Ser Lys Ser Glu
740 745 750
Leu Ala His Arg Ile Met Leu Thr Asn Leu Leu Arg Leu Leu Gly Asn
755 760 765
Val Lys Lys Gln Lys Val Ala His Ser Tyr Glu Thr Arg Pro Ala Gln
770 775 780
Val Met Leu Pro Leu Ser Pro Asn His Gly Asn Phe Gly Ser Asp Gly
785 790 795 800
Leu Tyr Ser Glu Ser Lys Ile Ser Leu Glu Thr Leu Phe Asn Arg Trp
805 810 815
His Thr Glu Ser Trp Gly Ser Tyr Leu Thr Ile Val Gly Val Val Ile
820 825 830
Gly Trp Thr Arg Gly Thr Gly Leu Met Ser Ala Asn Asn Ile Thr Ala
835 840 845
Glu Gly Leu Glu Gln Leu Gly Val Arg Thr Phe Ser Gln Thr Glu Met
850 855 860
Ala Phe Ser Ile Met Gly Leu Met Thr Lys Asp Ile Val Arg Leu Ala
865 870 875 880
Gln Asn Ser Pro Val Trp Ala Asp Leu Asn Gly Gly Phe Gln Tyr Ile
885 890 895
Pro Asp Leu Lys Gly Val Val Gly Lys Ile Arg Arg Asp Ile Val Glu
900 905 910
Thr Ser Glu Ile Arg Arg Ala Val Ala Gln Glu Thr Ala Ile Glu Gln
915 920 925
Lys Val Val Asn Gly Pro His Ala Asp Leu Pro Tyr Gln Lys Val Glu
930 935 940
Val Lys Pro Arg Ala Asn Leu Lys Phe Asp Phe Pro Thr Leu Lys Ser
945 950 955 960
Tyr Ala Glu Val Lys Glu Leu Ser Pro Ala Gly Asp Ala Leu Glu Gly
965 970 975
Leu Leu Asp Leu Ser Ser Val Ile Val Val Thr Gly Phe Ala Glu Val
980 985 990
Gly Pro Trp Gly Asn Ala Arg Thr Arg Trp Asp Met Glu Ala Asn Gly
995 1000 1005
Val Phe Ser Leu Glu Gly Ala Ile Glu Met Ala Trp Ile Met Gly
1010 1015 1020
Leu Ile Lys His His Asn Gly Pro Leu Pro Gly Met Pro Gln Tyr
1025 1030 1035
Ser Gly Trp Ile Asp Thr Lys Thr Lys Gln Pro Val Asp Asp Arg
1040 1045 1050
Asp Ile Lys Thr Lys Tyr Glu Asp Tyr Leu Leu Glu His Ala Gly
1055 1060 1065
Ile Arg Leu Ile Glu Pro Glu Leu Phe His Gly Tyr Asn Pro Lys
1070 1075 1080
Lys Lys Thr Phe Leu Gln Glu Val Ile Val Glu His Asp Leu Glu
1085 1090 1095
Pro Phe Glu Ala Ser Lys Glu Ser Ala Glu Gln Phe Ala Leu Glu
1100 1105 1110
Gln Gly Ala Asn Val Glu Ile Phe Ala Val Pro Glu Ser Asp Gln
1115 1120 1125
Trp Thr Val Arg Leu Leu Lys Gly Ala Lys Leu Leu Ile Pro Lys
1130 1135 1140
Ala Leu Lys Phe Asp Arg Leu Val Ala Gly Gln Ile Pro Thr Gly
1145 1150 1155
Trp Asp Ala Arg Arg Tyr Gly Ile Pro Glu Asp Ile Cys Asp Gln
1160 1165 1170
Val Asp Pro Ile Thr Leu Tyr Ala Leu Val Ser Thr Val Glu Ala
1175 1180 1185
Leu Leu Ala Ser Gly Ile Thr Asp Pro Tyr Glu Phe Tyr Lys Tyr
1190 1195 1200
Val His Val Ser Glu Val Gly Asn Cys Ser Gly Ser Gly Met Gly
1205 1210 1215
Gly Ile Thr Ala Leu Arg Gly Met Phe Lys Asp Arg Phe Met Asp
1220 1225 1230
Lys Pro Val Gln Asn Asp Ile Leu Gln Glu Ser Phe Ile Asn Thr
1235 1240 1245
Met Ser Ala Trp Val Asn Met Leu Leu Leu Ser Ser Ser Gly Pro
1250 1255 1260
Ile Lys Thr Pro Val Gly Ala Cys Ala Thr Ala Val Glu Ser Val
1265 1270 1275
Asp Ile Gly Cys Glu Thr Ile Leu Ser Gly Lys Ala Arg Ile Cys
1280 1285 1290
Leu Val Gly Gly Tyr Asp Asp Phe Gln Glu Glu Ser Ser Gln Glu
1295 1300 1305
Phe Ala Asn Met Asn Ala Thr Ser Asn Ala Glu Thr Glu Ile Thr
1310 1315 1320
His Gly Arg Thr Pro Ala Glu Met Ser Arg Pro Ile Thr Ser Thr
1325 1330 1335
Arg Ala Gly Phe Met Glu Ala Gln Gly Ala Gly Thr Gln Val Leu
1340 1345 1350
Met Ala Ala Asp Leu Ala Ile Ala Met Gly Val Pro Ile Tyr Cys
1355 1360 1365
Ile Val Gly Tyr Val Asn Thr Ala Thr Asp Lys Ile Gly Arg Ser
1370 1375 1380
Val Pro Ala Pro Gly Lys Gly Ile Leu Thr Thr Ala Arg Glu His
1385 1390 1395
Gln Thr Leu Lys His Ala Asn Pro Leu Leu Asn Ile Lys Tyr Arg
1400 1405 1410
Lys Arg Gln Leu Asp Ser Arg Leu Arg Asp Ile Lys Arg Trp Ala
1415 1420 1425
Glu Gly Glu Met Glu Ala Ile Asp Ile Glu Leu Asp Asp Val Ser
1430 1435 1440
Asp Ala Asp Lys Glu Ser Phe Ile Gln Glu Arg Ser Ala His Ile
1445 1450 1455
Gln Ser Gln Ser Asp Arg Met Ile Arg Glu Ala Lys Asn Ser Trp
1460 1465 1470
Gly Asn Ala Phe Phe Lys Gln Asp Ala Arg Ile Ser Pro Ile Arg
1475 1480 1485
Gly Ala Leu Ala Thr Tyr Gly Leu Thr Ile Asp Asp Ile Ser Val
1490 1495 1500
Ala Ser Phe His Gly Thr Ser Thr Lys Ala Asn Glu Lys Asn Glu
1505 1510 1515
Thr Thr Thr Val Asn Ala Met Leu Glu His Leu Gly Arg Thr Arg
1520 1525 1530
Gly Asn Pro Val Tyr Gly Ile Phe Gln Lys Tyr Leu Thr Gly His
1535 1540 1545
Pro Lys Gly Ala Ala Gly Ala Trp Met Leu Asn Gly Ala Ile Gln
1550 1555 1560
Cys Leu Asn Ser Gly Ile Ile Pro Gly Asn Arg Asn Ala Asp Asn
1565 1570 1575
Val Asp Ala Tyr Phe Glu Gln Cys Gln His Val Val Phe Pro Ser
1580 1585 1590
Arg Ser Leu Gln Thr Asp Gly Leu Lys Ala Ala Ser Val Thr Ser
1595 1600 1605
Phe Gly Phe Gly Gln Lys Gly Ala Gln Ala Ile Val Ile His Pro
1610 1615 1620
Asp Tyr Leu Tyr Ala Ala Leu Thr Pro Ser Glu Tyr Ser Glu Tyr
1625 1630 1635
Thr Thr Arg Val Ala Gln Arg Tyr Lys Lys Ala Tyr Arg Tyr Tyr
1640 1645 1650
His Asn Ala Ile Ala Glu Glu Ser Met Phe Gln Ala Lys Asp Lys
1655 1660 1665
Ala Pro Tyr Ser Ala Glu Leu Glu Gln Glu Val Tyr Leu Asp Pro
1670 1675 1680
Leu Val Arg Val His Gln Asn Glu Asp Thr Glu Gln Tyr Ser Phe
1685 1690 1695
Asn Ala Lys Asp Leu Ala Ala Ser Ala Phe Val Lys Asn Ser His
1700 1705 1710
Lys Asp Thr Ala Lys Val Leu Ala Asn Leu Thr Ser Gln Val Ser
1715 1720 1725
Gly Ser Gly Lys Asn Val Gly Val Asp Val Glu Ala Ile Ser Ala
1730 1735 1740
Ile Asn Ile Asp Asn Asp Thr Phe Leu Asp Arg Asn Phe Thr Ala
1745 1750 1755
Asn Glu Gln Ala Tyr Cys Phe Lys Ala Pro Ser Pro Gln Ser Ser
1760 1765 1770
Phe Ala Gly Thr Trp Ser Ala Lys Glu Ala Val Phe Lys Ser Leu
1775 1780 1785
Gly Val Lys Ser Gln Gly Gly Gly Ala Glu Leu Lys Ser Ile Glu
1790 1795 1800
Ile Thr Arg Asp Gly Asn Gly Ala Pro Val Val Val Leu His Gly
1805 1810 1815
Ala Ala Lys Asp Ala Ala Ala Ser Lys Gly Ile Ser Thr Val Lys
1820 1825 1830
Val Ser Ile Ser His Asp Asp Ser Gln Ala Val Ala Val Ala Val
1835 1840 1845
Ala Glu
1850
<210> 19
<211> 1062
<212> DNA
<213> Yarrowia lipolytica
<220>
<221> misc_feature
<222> (1)..(1062)
<223> Y. lipolytica YALI0_F14729g
<400> 19
atgtctcttc ttgaacgaga gcttcaaatt gaggagattg atatcaatct ctaccggtct 60
gccaaggagc tttggcgacc tatcggtcag cgaggtatct ttggcggctc tgtcattgct 120
caggccctga tggctgctac caaaactgtg cccccagagt tcattatcca ttccatgcac 180
tgctactttg tgttatctgg aaaccccgac caccccgtgc tctaccacgt tgagcgggtc 240
cgagatggca gaagcttcgc tacccgaaca gtccaggcca aacagcgggg acgtgtgatc 300
ttcaccacta catgctcttt ccaggttgac aagggcaacg gaaacatgca tcatcagagc 360
cgaatgtacg agcgagaggt caagagcagt ggaaaggctt ttgatggcga acacgaggcc 420
accaacggaa ttcctgctcc cgagaattgc gtctcctcgc tggaggtgtc caagtacctc 480
aacaagcagg gcgtgatcag tgacgatatt ctcaagaaga tggtggatcg atcagttgag 540
gatcccattg aaattagact agtgaccggt cttctgaaca aggacgatgg tctgcttcct 600
catgaacgaa gaatcaagtt ctgggttcga tgcaaacctg ttattgagcg agacgacgtt 660
cagtcggtcg gtattgctta cctcagtgac tctttcctgc tgggaacagc tatccgagtc 720
cagcccctca atcccggtgc tgcctctatg gttgtttccc tggaccacac aatctacttt 780
catggcaagt tccgagctga tgaatggctg ctgcacgtga ttgattccaa ctggagtgga 840
aacgagcggg cactggtccg aggacgactc tacaaccaac agggagtctt ggtcgccaca 900
gtgttccagg agggtgtcat tcgattgaag gagaaataca aaggcaaggc tgtagagacc 960
acagatgact atcttagcag cggaacgaga actgatgctg agaaggagga gtctaagaag 1020
aagggagcca tggctgctaa gagtattgac agtaagctgt aa 1062
<210> 20
<211> 353
<212> PRT
<213> Yarrowia lipolytica
<220>
<221> MISC_FEATURE
<222> (1)..(353)
<223> Y. lipolytica XP_505426
<400> 20
Met Ser Leu Leu Glu Arg Glu Leu Gln Ile Glu Glu Ile Asp Ile Asn
1 5 10 15
Leu Tyr Arg Ser Ala Lys Glu Leu Trp Arg Pro Ile Gly Gln Arg Gly
20 25 30
Ile Phe Gly Gly Ser Val Ile Ala Gln Ala Leu Met Ala Ala Thr Lys
35 40 45
Thr Val Pro Pro Glu Phe Ile Ile His Ser Met His Cys Tyr Phe Val
50 55 60
Leu Ser Gly Asn Pro Asp His Pro Val Leu Tyr His Val Glu Arg Val
65 70 75 80
Arg Asp Gly Arg Ser Phe Ala Thr Arg Thr Val Gln Ala Lys Gln Arg
85 90 95
Gly Arg Val Ile Phe Thr Thr Thr Cys Ser Phe Gln Val Asp Lys Gly
100 105 110
Asn Gly Asn Met His His Gln Ser Arg Met Tyr Glu Arg Glu Val Lys
115 120 125
Ser Ser Gly Lys Ala Phe Asp Gly Glu His Glu Ala Thr Asn Gly Ile
130 135 140
Pro Ala Pro Glu Asn Cys Val Ser Ser Leu Glu Val Ser Lys Tyr Leu
145 150 155 160
Asn Lys Gln Gly Val Ile Ser Asp Asp Ile Leu Lys Lys Met Val Asp
165 170 175
Arg Ser Val Glu Asp Pro Ile Glu Ile Arg Leu Val Thr Gly Leu Leu
180 185 190
Asn Lys Asp Asp Gly Leu Leu Pro His Glu Arg Arg Ile Lys Phe Trp
195 200 205
Val Arg Cys Lys Pro Val Ile Glu Arg Asp Asp Val Gln Ser Val Gly
210 215 220
Ile Ala Tyr Leu Ser Asp Ser Phe Leu Leu Gly Thr Ala Ile Arg Val
225 230 235 240
Gln Pro Leu Asn Pro Gly Ala Ala Ser Met Val Val Ser Leu Asp His
245 250 255
Thr Ile Tyr Phe His Gly Lys Phe Arg Ala Asp Glu Trp Leu Leu His
260 265 270
Val Ile Asp Ser Asn Trp Ser Gly Asn Glu Arg Ala Leu Val Arg Gly
275 280 285
Arg Leu Tyr Asn Gln Gln Gly Val Leu Val Ala Thr Val Phe Gln Glu
290 295 300
Gly Val Ile Arg Leu Lys Glu Lys Tyr Lys Gly Lys Ala Val Glu Thr
305 310 315 320
Thr Asp Asp Tyr Leu Ser Ser Gly Thr Arg Thr Asp Ala Glu Lys Glu
325 330 335
Glu Ser Lys Lys Lys Gly Ala Met Ala Ala Lys Ser Ile Asp Ser Lys
340 345 350
Leu
<210> 21
<211> 2076
<212> DNA
<213> Yarrowia lipolytica
<220>
<221> misc_feature
<222> (1)..(2076)
<223> Y. lipolytica fatty acyl-CoA synthase (YALI0_D17864g)
<400> 21
atggtcggat acacaatttc ctcaaagccc gtgtcggtgg aggtcggccc cgccaagcct 60
ggcgagactg ccccccgacg aaacgtcatt gccaaggacg cccctgtcgt cttccccgac 120
aacgactcgt ccctgaccac cgtctacaag ctgttcaaaa agtacgccga gatcaacagc 180
gagcgaaagg ccatgggatg gcgagacacc atcgacatcc acgtggagac caaacaggtg 240
accaaggtcg tggacggagt ggagaagaag gtgcccaagg aatggaagta ctttgagatg 300
ggcccttaca agtggctctc atacaaggag gcccttaagc tggtccatga ttatggagct 360
ggtcttcgac acctcggaat caagcccaag gagaagatgc acatttacgc ccagacctcc 420
caccgatgga tgctctctgg cctggcttct ctgtctcagg gtattcccat tgtcactgcc 480
tacgacactc ttggagagga gggtctcact cgatctctcc aggagaccaa ctcggtcatc 540
atgtttaccg acaaggctct gctgagctct ctcaaggtct ctctcaagaa gggcaccgat 600
ctgcgaatca tcatctacgg aggtgatctg acccccgacg acaagaaggc cggaaacacg 660
gagattgacg ccatcaagga gattgttcca gatatgaaga tctacaccat ggacgaggtt 720
gtcgctctcg gccgagaaca cccccacccc gtggaggagg tcgactatga ggacctggcc 780
ttcatcatgt acacctctgg ttctaccggt gtccccaagg gtgtggttct gcagcacaag 840
cagatcctcg cctctgtggc cggtgtcacc aagatcattg accgatctat catcggcaac 900
acagaccggc ttctcaactt cctgcccctc gcacacattt tcgagtttgt gttcgagatg 960
gtcaccttct ggtggggtgc ttctctgggt tacggaaccg tcaagaccat ttccgatctg 1020
tccatgaaga actgtaaggg agacattcga gagctcaagc ccaccatcat ggtcggcgtt 1080
cccgctgtct gggaacctat gcgaaagggt attcttggca agatcaagga gctgtctcct 1140
ctgatgcagc gggtcttctg ggcctcattt gccgccaagc agcgtctcga cgagaacgga 1200
ctccctggtg gatctatcct cgactcgctc attttcaaga aggtcaagga cgccactgga 1260
ggctgtctcc gatacgtgtg taacggaggt gctccagtat ctgtcgacac ccagaagttc 1320
atcaccactc tcatctgtcc catgctgatt ggatgcggtc tgaccgagac tacagccaac 1380
accaccatca tgtcgcctaa atcgtacgcc tttggcacca ttggtgagcc caccgccgcc 1440
gtgaccctca agctcattga cgtgcctgaa gccggctact tcgccgagaa caaccaggga 1500
gagctgtgca tcaagggcaa cgtcgtgatg aaggagtact acaagaacga ggaggagacc 1560
aagaaggcgt tctccgacga tggctatttc ctcaccggtg atattgccga gtggaccgcc 1620
aatggccagc tcagaatcat tgaccgacga aagaacctcg tcaagaccca gaacggagag 1680
tacattgctc tggagaagct cgagacacag taccgatcgt cgtcgtacgt ggccaacctg 1740
tgtgtgtacg ccgaccagaa ccgagtcaag cccattgctc tggtcattcc taacgagggc 1800
cccaccaaga agcttgccca gagcttgggc gtcgattctg acgactggga cgccgtctgt 1860
tccaacaaaa aggtggtcaa ggctgtgctc aaggacatgc tcgataccgg ccgatctctg 1920
ggtctgtccg gcattgagct gctgcaaggc attgtgttgc tgcctggcga gtggactcct 1980
cagaacagct acctgactgc tgcccagaag ctcaaccgaa agaagattgt ggatgataac 2040
aagaaggaaa ttgatgagtg ctacgagcag tcttag 2076
<210> 22
<211> 691
<212> PRT
<213> Yarrowia lipolytica
<220>
<221> MISC_FEATURE
<222> (1)..(691)
<223> Y. lipolytica fatty acyl-CoA synthase (XP_502959)
<400> 22
Met Val Gly Tyr Thr Ile Ser Ser Lys Pro Val Ser Val Glu Val Gly
1 5 10 15
Pro Ala Lys Pro Gly Glu Thr Ala Pro Arg Arg Asn Val Ile Ala Lys
20 25 30
Asp Ala Pro Val Val Phe Pro Asp Asn Asp Ser Ser Leu Thr Thr Val
35 40 45
Tyr Lys Leu Phe Lys Lys Tyr Ala Glu Ile Asn Ser Glu Arg Lys Ala
50 55 60
Met Gly Trp Arg Asp Thr Ile Asp Ile His Val Glu Thr Lys Gln Val
65 70 75 80
Thr Lys Val Val Asp Gly Val Glu Lys Lys Val Pro Lys Glu Trp Lys
85 90 95
Tyr Phe Glu Met Gly Pro Tyr Lys Trp Leu Ser Tyr Lys Glu Ala Leu
100 105 110
Lys Leu Val His Asp Tyr Gly Ala Gly Leu Arg His Leu Gly Ile Lys
115 120 125
Pro Lys Glu Lys Met His Ile Tyr Ala Gln Thr Ser His Arg Trp Met
130 135 140
Leu Ser Gly Leu Ala Ser Leu Ser Gln Gly Ile Pro Ile Val Thr Ala
145 150 155 160
Tyr Asp Thr Leu Gly Glu Glu Gly Leu Thr Arg Ser Leu Gln Glu Thr
165 170 175
Asn Ser Val Ile Met Phe Thr Asp Lys Ala Leu Leu Ser Ser Leu Lys
180 185 190
Val Ser Leu Lys Lys Gly Thr Asp Leu Arg Ile Ile Ile Tyr Gly Gly
195 200 205
Asp Leu Thr Pro Asp Asp Lys Lys Ala Gly Asn Thr Glu Ile Asp Ala
210 215 220
Ile Lys Glu Ile Val Pro Asp Met Lys Ile Tyr Thr Met Asp Glu Val
225 230 235 240
Val Ala Leu Gly Arg Glu His Pro His Pro Val Glu Glu Val Asp Tyr
245 250 255
Glu Asp Leu Ala Phe Ile Met Tyr Thr Ser Gly Ser Thr Gly Val Pro
260 265 270
Lys Gly Val Val Leu Gln His Lys Gln Ile Leu Ala Ser Val Ala Gly
275 280 285
Val Thr Lys Ile Ile Asp Arg Ser Ile Ile Gly Asn Thr Asp Arg Leu
290 295 300
Leu Asn Phe Leu Pro Leu Ala His Ile Phe Glu Phe Val Phe Glu Met
305 310 315 320
Val Thr Phe Trp Trp Gly Ala Ser Leu Gly Tyr Gly Thr Val Lys Thr
325 330 335
Ile Ser Asp Leu Ser Met Lys Asn Cys Lys Gly Asp Ile Arg Glu Leu
340 345 350
Lys Pro Thr Ile Met Val Gly Val Pro Ala Val Trp Glu Pro Met Arg
355 360 365
Lys Gly Ile Leu Gly Lys Ile Lys Glu Leu Ser Pro Leu Met Gln Arg
370 375 380
Val Phe Trp Ala Ser Phe Ala Ala Lys Gln Arg Leu Asp Glu Asn Gly
385 390 395 400
Leu Pro Gly Gly Ser Ile Leu Asp Ser Leu Ile Phe Lys Lys Val Lys
405 410 415
Asp Ala Thr Gly Gly Cys Leu Arg Tyr Val Cys Asn Gly Gly Ala Pro
420 425 430
Val Ser Val Asp Thr Gln Lys Phe Ile Thr Thr Leu Ile Cys Pro Met
435 440 445
Leu Ile Gly Cys Gly Leu Thr Glu Thr Thr Ala Asn Thr Thr Ile Met
450 455 460
Ser Pro Lys Ser Tyr Ala Phe Gly Thr Ile Gly Glu Pro Thr Ala Ala
465 470 475 480
Val Thr Leu Lys Leu Ile Asp Val Pro Glu Ala Gly Tyr Phe Ala Glu
485 490 495
Asn Asn Gln Gly Glu Leu Cys Ile Lys Gly Asn Val Val Met Lys Glu
500 505 510
Tyr Tyr Lys Asn Glu Glu Glu Thr Lys Lys Ala Phe Ser Asp Asp Gly
515 520 525
Tyr Phe Leu Thr Gly Asp Ile Ala Glu Trp Thr Ala Asn Gly Gln Leu
530 535 540
Arg Ile Ile Asp Arg Arg Lys Asn Leu Val Lys Thr Gln Asn Gly Glu
545 550 555 560
Tyr Ile Ala Leu Glu Lys Leu Glu Thr Gln Tyr Arg Ser Ser Ser Tyr
565 570 575
Val Ala Asn Leu Cys Val Tyr Ala Asp Gln Asn Arg Val Lys Pro Ile
580 585 590
Ala Leu Val Ile Pro Asn Glu Gly Pro Thr Lys Lys Leu Ala Gln Ser
595 600 605
Leu Gly Val Asp Ser Asp Asp Trp Asp Ala Val Cys Ser Asn Lys Lys
610 615 620
Val Val Lys Ala Val Leu Lys Asp Met Leu Asp Thr Gly Arg Ser Leu
625 630 635 640
Gly Leu Ser Gly Ile Glu Leu Leu Gln Gly Ile Val Leu Leu Pro Gly
645 650 655
Glu Trp Thr Pro Gln Asn Ser Tyr Leu Thr Ala Ala Gln Lys Leu Asn
660 665 670
Arg Lys Lys Ile Val Asp Asp Asn Lys Lys Glu Ile Asp Glu Cys Tyr
675 680 685
Glu Gln Ser
690
<210> 23
<211> 968
<212> DNA
<213> Artificial sequence
<220>
<223> H. armigera cytochrome b5 reductase (XP_021183830) codon
optimized for Y. lipolytica; mRNA-coding sequence
<220>
<221> misc_feature
<222> (1)..(968)
<223> H. armigera cytochrome b5 reductase (XP_021183830) codon
optimized for Y. lipolytica; mRNA-coding sequence
<400> 23
tgtctaacgt cgaggtggcc gtggacgacg ccttcggcat cctgaccgtg ctgcccatcg 60
tggtgggcgt gtctgccgcc gtggtgctgg tgtctgtgat cgccaactgc ttctggggca 120
agaaggacaa gaaggctgct cccaagaagt cctctcagct gatcaccctg gtggacccca 180
acgtgaagta cgctctgccc ctgatcgagc gagaggaaat ctctcacgac acccgacgat 240
tccgattcgg actgccctct tcggagcacg tcctgggact gcccattggc cagcacatcc 300
acctgtctgc caagatcgac gacgacctgg tgatccgatc ttacacccct gtgtcctctg 360
acgaagagaa gggctacgtc gagctggtga tcaaggtgta cttcaagaac gtgcacccta 420
agttccccga cggcggcaag atgtctcagc acctgaactc cctgaagatc aacgacacca 480
tcgacgtgcg aggcccctct ggccgactgc agtacgccgg caacggcctg ttcctgatca 540
agaagatgcg aaaggaccct cctgtcgagc tgcgagccaa gaagctgaac atgattgccg 600
gcggaaccgg aatcgctccc atgctgcagc tgatccgaca catctgcaag gacgcctctg 660
atcccaccga gatgcgactg ctgttcgcca accagaccga agaggacatc ctgctgcgaa 720
acgagctgga aaagtaccag gctgagcacc ccgagcagtt caagctgtgg tacaccctgg 780
accgacctaa cgaaggctgg aagtactctg tgggcttcat caacgacgag atgatcaagg 840
aacacctgtt cgctcccgcc gacgacgtgc tggtgctgat gtgcggccct cctcctatga 900
tcaacttcgc ttgcaacccc gctctcgaga agctgggcta ccccgagtct cagcgattcg 960
cctactaa 968
<210> 24
<211> 322
<212> PRT
<213> Helicoverpa armigera
<220>
<221> MISC_FEATURE
<222> (1)..(322)
<223> H. armigera cytochrome b5 reductase (XP_021183830)
<400> 24
Met Ser Asn Val Glu Val Ala Val Asp Asp Ala Phe Gly Ile Leu Thr
1 5 10 15
Val Leu Pro Ile Val Val Gly Val Ser Ala Ala Val Val Leu Val Ser
20 25 30
Val Ile Ala Asn Cys Phe Trp Gly Lys Lys Asp Lys Lys Ala Ala Pro
35 40 45
Lys Lys Ser Ser Gln Leu Ile Thr Leu Val Asp Pro Asn Val Lys Tyr
50 55 60
Ala Leu Pro Leu Ile Glu Arg Glu Glu Ile Ser His Asp Thr Arg Arg
65 70 75 80
Phe Arg Phe Gly Leu Pro Ser Ser Glu His Val Leu Gly Leu Pro Ile
85 90 95
Gly Gln His Ile His Leu Ser Ala Lys Ile Asp Asp Asp Leu Val Ile
100 105 110
Arg Ser Tyr Thr Pro Val Ser Ser Asp Glu Glu Lys Gly Tyr Val Glu
115 120 125
Leu Val Ile Lys Val Tyr Phe Lys Asn Val His Pro Lys Phe Pro Asp
130 135 140
Gly Gly Lys Met Ser Gln His Leu Asn Ser Leu Lys Ile Asn Asp Thr
145 150 155 160
Ile Asp Val Arg Gly Pro Ser Gly Arg Leu Gln Tyr Ala Gly Asn Gly
165 170 175
Leu Phe Leu Ile Lys Lys Met Arg Lys Asp Pro Pro Val Glu Leu Arg
180 185 190
Ala Lys Lys Leu Asn Met Ile Ala Gly Gly Thr Gly Ile Ala Pro Met
195 200 205
Leu Gln Leu Ile Arg His Ile Cys Lys Asp Ala Ser Asp Pro Thr Glu
210 215 220
Met Arg Leu Leu Phe Ala Asn Gln Thr Glu Glu Asp Ile Leu Leu Arg
225 230 235 240
Asn Glu Leu Glu Lys Tyr Gln Ala Glu His Pro Glu Gln Phe Lys Leu
245 250 255
Trp Tyr Thr Leu Asp Arg Pro Asn Glu Gly Trp Lys Tyr Ser Val Gly
260 265 270
Phe Ile Asn Asp Glu Met Ile Lys Glu His Leu Phe Ala Pro Ala Asp
275 280 285
Asp Val Leu Val Leu Met Cys Gly Pro Pro Pro Met Ile Asn Phe Ala
290 295 300
Cys Asn Pro Ala Leu Glu Lys Leu Gly Tyr Pro Glu Ser Gln Arg Phe
305 310 315 320
Ala Tyr
<210> 25
<211> 627
<212> DNA
<213> Artificial sequence
<220>
<223> E. coli thioesterase (AAB40248) codon optimized for Y.
lipolytica; mRNA-coding sequence
<220>
<221> misc_feature
<222> (1)..(627)
<223> E. coli thioesterase (AAB40248) codon optimized for Y.
lipolytica; mRNA-coding sequence
<400> 25
atgatgaact tcaacaacgt gttccgatgg catctgccct ttctgtttct ggtgctgctg 60
accttccgag ccgccgctgc tgacaccctg ctgatcctgg gcgactctct gtctgccggc 120
taccgaatgt ctgcctctgc cgcttggccc gctctgctga acgacaagtg gcagtctaag 180
acctctgtgg tgaacgcctc tatctctggc gacacctctc agcagggcct cgctcgactg 240
cctgctctgc tcaagcagca tcagccccga tgggtgctcg tcgagcttgg cggcaacgac 300
ggcctgcgag gcttccagcc tcagcagacc gagcagaccc tgcgacagat tctgcaggac 360
gtgaaggccg ccaacgctga gcctctgctg atgcagattc gactgcccgc caactacggc 420
cgacgataca acgaggcctt ctctgctatc taccccaagc tggccaagga attcgacgtg 480
cccctgctgc cattcttcat ggaagaggtg tacctgaagc ctcagtggat gcaggacgac 540
ggcattcacc ccaaccgaga tgctcagccc ttcattgccg actggatggc caagcagctg 600
cagcctctgg tgaaccacga ctcttaa 627
<210> 26
<211> 218
<212> PRT
<213> Escherichia coli
<220>
<221> MISC_FEATURE
<222> (1)..(218)
<223> E. coli thioesterase (AAB40248)
<400> 26
Met Leu Pro Leu Thr Asp Gly Leu Leu Lys Met Met Asn Phe Asn Asn
1 5 10 15
Val Phe Arg Trp His Leu Pro Phe Leu Phe Leu Val Leu Leu Thr Phe
20 25 30
Arg Ala Ala Ala Ala Asp Thr Leu Leu Ile Leu Gly Asp Ser Leu Ser
35 40 45
Ala Gly Tyr Arg Met Ser Ala Ser Ala Ala Trp Pro Ala Leu Leu Asn
50 55 60
Asp Lys Trp Gln Ser Lys Thr Ser Val Val Asn Ala Ser Ile Ser Gly
65 70 75 80
Asp Thr Ser Gln Gln Gly Leu Ala Arg Leu Pro Ala Leu Leu Lys Gln
85 90 95
His Gln Pro Arg Trp Val Leu Val Glu Leu Gly Gly Asn Asp Gly Leu
100 105 110
Arg Gly Phe Gln Pro Gln Gln Thr Glu Gln Thr Leu Arg Gln Ile Leu
115 120 125
Gln Asp Val Lys Ala Ala Asn Ala Glu Pro Leu Leu Met Gln Ile Arg
130 135 140
Leu Pro Ala Asn Tyr Gly Arg Arg Tyr Asn Glu Ala Phe Ser Ala Ile
145 150 155 160
Tyr Pro Lys Leu Ala Lys Glu Phe Asp Val Pro Leu Leu Pro Phe Phe
165 170 175
Met Glu Glu Val Tyr Leu Lys Pro Gln Trp Met Gln Asp Asp Gly Ile
180 185 190
His Pro Asn Arg Asp Ala Gln Pro Phe Ile Ala Asp Trp Met Ala Lys
195 200 205
Gln Leu Gln Pro Leu Val Asn His Asp Ser
210 215
<210> 27
<211> 531
<212> DNA
<213> Yarrowia lipolytica
<220>
<221> misc_feature
<222> (1)..(531)
<223> Y. lipolytica TEFintron promoter
<400> 27
agagaccggg ttggcggcgc atttgtgtcc caaaaaacag ccccaattgc cccaattgac 60
cccaaattga cccagtagcg ggcccaaccc cggcgagagc ccccttctcc ccacatatca 120
aacctccccc ggttcccaca cttgccgtta agggcgtagg gtactgcagt ctggaatcta 180
cgcttgttca gactttgtac tagtttcttt gtctggccat ccgggtaacc catgccggac 240
gcaaaataga ctactgaaaa tttttttgct ttgtggttgg gactttagcc aagggtataa 300
aagaccaccg tccccgaatt acctttcctc ttcttttctc tctctccttg tcaactcaca 360
cccgaaatcg ttaagcattt ccttctgagt ataagaatca ttcaaaatgg tgagtttcag 420
aggcagcagc aattgccacg ggctttgagc acacggccgg gtgtggtccc attcccatcg 480
acacaagacg ccacgtcatc cgaccagcac tttttgcagt actaaccgca g 531
<210> 28
<211> 1002
<212> DNA
<213> Yarrowia lipolytica
<220>
<221> misc_feature
<222> (1)..(1002)
<223> Y. lipolytica EXP promoter
<400> 28
aaggagtttg gcgcccgttt tttcgagccc cacacgtttc ggtgagtatg agcggcggca 60
gattcgagcg tttccggttt ccgcggctgg acgagagccc atgatggggg ctcccaccac 120
cagcaatcag ggccctgatt acacacccac ctgtaatgtc atgctgttca tcgtggttaa 180
tgctgctgtg tgctgtgtgt gtgtgttgtt tggcgctcat tgttgcgtta tgcagcgtac 240
accacaatat tggaagctta ttagcctttc tattttttcg tttgcaaggc ttaacaacat 300
tgctgtggag agggatgggg atatggaggc cgctggaggg agtcggagag gcgttttgga 360
gcggcttggc ctggcgccca gctcgcgaaa cgcacctagg accctttggc acgccgaaat 420
gtgccacttt tcagtctagt aacgccttac ctacgtcatt ccatgcatgc atgtttgcgc 480
cttttttccc ttgcccttga tcgccacaca gtacagtgca ctgtacagtg gaggttttgg 540
gggggtctta gatgggagct aaaagcggcc tagcggtaca ctagtgggat tgtatggagt 600
ggcatggagc ctaggtggag cctgacagga cgcacgaccg gctagcccgt gacagacgat 660
gggtggctcc tgttgtccac cgcgtacaaa tgtttgggcc aaagtcttgt cagccttgct 720
tgcgaaccta attcccaatt ttgtcacttc gcacccccat tgatcgagcc ctaacccctg 780
cccatcaggc aatccaatta agctcgcatt gtctgccttg tttagtttgg ctcctgcccg 840
tttcggcgtc cacttgcaca aacacaaaca agcattatat ataaggctcg tctctccctc 900
ccaaccacac tcactttttt gcccgtcttc ccttgctaac acaaaagtca agaacacaaa 960
caaccacccc aaccccctta cacacaagac atatctacag ca 1002
<210> 29
<211> 1029
<212> DNA
<213> Yarrowia lipolytica
<220>
<221> misc_feature
<222> (1)..(1029)
<223> Y. lipolytica YEF3 promoter
<400> 29
gatagctgag ggatatggtg tagataaggg gtgtccgagg gccgtgttag cactccagag 60
agagtgcaca tggagctcgg gctggggtct cgaagcgttg tccggcagct tttttgccac 120
ccccaaaact gaacatcacc ctttgaccct gtcccacaat cagccgtata cttgggttca 180
gcaactctgg atactacagg aaaactatgc agagatccaa ccacacacgg ccaatgtcct 240
ctatggagct gcgtgggaga tattgggtaa gtcctaagtg gctggaaaag ggggattgag 300
cccgcgtcct aggccatggt ccatcccgtt gctctcaatg ccggcctata gaacgggttc 360
caacactaca cacacccact aatgcacccc tccccctcgt gttagccgag gagagatggt 420
atgagtgagt agacaagaag agatggtgat gaccgagaac gccgatagta tcagcgagat 480
acacgccaac aaccaaacaa cttggttgcc ctcaaatcaa gcccctcttc gccattcggt 540
tccttccaga ccattccaga tcaatccacc tcttcttatc tcaggtgggt gtgctgacat 600
cagaccccgt agcccttctc ccagtggcga acagcaggca taaaacaggg ccattgagca 660
gagcaaacaa ggtcggtgaa atcgtcgaaa aagtcggaaa acggttgcaa gaaattggag 720
cgtcacctgc caccctccag gctctatata aagcattgcc ccaattgcta acgcttcata 780
tttacacctt tggcacccca gtccatccct ccaataaaat gtactacatg ggacacaaca 840
agagaggatg cgcgcccaaa ccctaaccta gcacatgcac gatgattctc tttgtctgtg 900
aaaaaatttt tccaccaaaa tttccccatt gggatgaaac cctaaccgca accaaaagtt 960
tttaactatc atcttgtacg tcacggtttc cgattcttct cttctctttc atcatcatca 1020
cttgtgacc 1029
<210> 30
<211> 2247
<212> DNA
<213> Saccharomyces cerevisiae
<400> 30
atgacgagac gtactactat taatcccgat tcggtggttc tgaatcctca aaaatttatc 60
cagaaagaaa gggcggattc gaaaatcaaa gttgaccaag ttaacacatt tttagagtca 120
tccccggaga ggagaactct gacgcacgcc ttaatagacc aaatagtgaa tgatcctata 180
ttgaaaactg atacggacta ttacgatgct aaaaaaatgc aagagagaga aattactgcc 240
aaaaaaatag ctaggcttgc tagttatatg gagcacgata tcaaaacagt gcgcaaacac 300
tttcgcgaca ctgacctgat gaaagagttg caagcaaatg atccagacaa agcttcgcct 360
ttaacaaaca aagacctttt tatattcgat aagagattgt cacttgtagc aaatattgat 420
cctcaattgg gtacgcgcgt gggtgtacac ttggggctat ttggtaattg tatcaagggc 480
aatggtactg atgagcaaat ccggtattgg ttgcaggaga gaggtgccac tttgatgaaa 540
ggtatatatg gctgttttgc aatgactgag ttaggacatg gttccaatgt tgcccagctg 600
cagactaggg ctgtgtacga taagcaaaat gatacttttg taattgatac acctgatcta 660
actgccacca aatggtggat tggtggggct gcccattctg ccacgcacgc tgccgtgtac 720
gccagattga tcgttgaagg taaagactac ggtgtaaaaa cattcgttgt tcctctgaga 780
gacccttcga ctttccaact gttagctggt gtttccatag gggatattgg agcgaagatg 840
ggtcgtgacg gtattgataa tggctggatc cagttcagaa acgtagttat ccctagagaa 900
tttatgctaa gtagatttac caaagttgtc cgttctccag atggttcagt caccgtcaaa 960
actgagccac aattggatca aatttctggt tatagtgcat tgttaagtgg tagagttaac 1020
atggtcatgg attcatttag gtttggctcc aaatttgcta ctattgctgt acgttacgcg 1080
gttggtcgtc agcaattcgc acctagaaag ggattgtctg aaacacaatt aatcgactat 1140
ccccttcacc aatatcgtgt tttaccacaa ttgtgtgttc catatttggt gtcacctgta 1200
gcttttaagt taatggacaa ctattattcc actttggacg agttatacaa cgcttcctca 1260
tctgcataca aagctgctct ggttaccgtg agtaaaaagt tgaagaattt atttattgat 1320
agcgccagct tgaaagccac caatacttgg ttaattgcta cactgattga tgagttgaga 1380
cagacttgcg gaggacatgg gtattcacag tataacggat ttggtaaagg ctatgacgac 1440
tgggtggttc agtgcacatg ggagggtgat aataatgttt tatctttaac ttcagcaaaa 1500
tcaatattga aaaaatttat cgattcagcc acaaagggta gatttgacaa cacactggat 1560
gtggactcat tctcttactt aaaacctcag tacataggat ctgtggtttc tggagaaata 1620
aagagtggtt taaaggagtt gggtgattat actgaaattt ggtctatcac cttaatcaaa 1680
ttactggcac atattggtac tttagttgaa aaatcaagaa gtattgatag cgtttctaag 1740
cttttagtct tagtatccaa atttcatgcc ttgcgctgca tgttgaaaac ctattacgac 1800
aagttaaact ctcgtgattc acatatttcc gatgaaatta caaaggaatc tatgtggaat 1860
gtttataagt tattttcctt gtattttatt gacaagcatt ccggagaatt ccaacaattc 1920
aagatcttca ctcctgatca gatctctaaa gttgtgcagc cacaactatt ggctcttttg 1980
ccaattgtga ggaaagactg tataggtctg acagactcct ttgaattacc tgacgcgatg 2040
ttaaattctc ctataggtta ctttgatggc gatatctatc acaattactt caatgaagtt 2100
tgccgcaata atccagtgga ggcagatggg gcagggaagc cttcttatca tgcgctgttg 2160
agcagcatgc tcggtagagg tttcgaattt gaccaaaagt taggtggtgc agctaatgcg 2220
gaaattttat cgaaaataaa caagtga 2247
<210> 31
<211> 748
<212> PRT
<213> Saccharomyces cerevisiae
<400> 31
Met Thr Arg Arg Thr Thr Ile Asn Pro Asp Ser Val Val Leu Asn Pro
1 5 10 15
Gln Lys Phe Ile Gln Lys Glu Arg Ala Asp Ser Lys Ile Lys Val Asp
20 25 30
Gln Val Asn Thr Phe Leu Glu Ser Ser Pro Glu Arg Arg Thr Leu Thr
35 40 45
His Ala Leu Ile Asp Gln Ile Val Asn Asp Pro Ile Leu Lys Thr Asp
50 55 60
Thr Asp Tyr Tyr Asp Ala Lys Lys Met Gln Glu Arg Glu Ile Thr Ala
65 70 75 80
Lys Lys Ile Ala Arg Leu Ala Ser Tyr Met Glu His Asp Ile Lys Thr
85 90 95
Val Arg Lys His Phe Arg Asp Thr Asp Leu Met Lys Glu Leu Gln Ala
100 105 110
Asn Asp Pro Asp Lys Ala Ser Pro Leu Thr Asn Lys Asp Leu Phe Ile
115 120 125
Phe Asp Lys Arg Leu Ser Leu Val Ala Asn Ile Asp Pro Gln Leu Gly
130 135 140
Thr Arg Val Gly Val His Leu Gly Leu Phe Gly Asn Cys Ile Lys Gly
145 150 155 160
Asn Gly Thr Asp Glu Gln Ile Arg Tyr Trp Leu Gln Glu Arg Gly Ala
165 170 175
Thr Leu Met Lys Gly Ile Tyr Gly Cys Phe Ala Met Thr Glu Leu Gly
180 185 190
His Gly Ser Asn Val Ala Gln Leu Gln Thr Arg Ala Val Tyr Asp Lys
195 200 205
Gln Asn Asp Thr Phe Val Ile Asp Thr Pro Asp Leu Thr Ala Thr Lys
210 215 220
Trp Trp Ile Gly Gly Ala Ala His Ser Ala Thr His Ala Ala Val Tyr
225 230 235 240
Ala Arg Leu Ile Val Glu Gly Lys Asp Tyr Gly Val Lys Thr Phe Val
245 250 255
Val Pro Leu Arg Asp Pro Ser Thr Phe Gln Leu Leu Ala Gly Val Ser
260 265 270
Ile Gly Asp Ile Gly Ala Lys Met Gly Arg Asp Gly Ile Asp Asn Gly
275 280 285
Trp Ile Gln Phe Arg Asn Val Val Ile Pro Arg Glu Phe Met Leu Ser
290 295 300
Arg Phe Thr Lys Val Val Arg Ser Pro Asp Gly Ser Val Thr Val Lys
305 310 315 320
Thr Glu Pro Gln Leu Asp Gln Ile Ser Gly Tyr Ser Ala Leu Leu Ser
325 330 335
Gly Arg Val Asn Met Val Met Asp Ser Phe Arg Phe Gly Ser Lys Phe
340 345 350
Ala Thr Ile Ala Val Arg Tyr Ala Val Gly Arg Gln Gln Phe Ala Pro
355 360 365
Arg Lys Gly Leu Ser Glu Thr Gln Leu Ile Asp Tyr Pro Leu His Gln
370 375 380
Tyr Arg Val Leu Pro Gln Leu Cys Val Pro Tyr Leu Val Ser Pro Val
385 390 395 400
Ala Phe Lys Leu Met Asp Asn Tyr Tyr Ser Thr Leu Asp Glu Leu Tyr
405 410 415
Asn Ala Ser Ser Ser Ala Tyr Lys Ala Ala Leu Val Thr Val Ser Lys
420 425 430
Lys Leu Lys Asn Leu Phe Ile Asp Ser Ala Ser Leu Lys Ala Thr Asn
435 440 445
Thr Trp Leu Ile Ala Thr Leu Ile Asp Glu Leu Arg Gln Thr Cys Gly
450 455 460
Gly His Gly Tyr Ser Gln Tyr Asn Gly Phe Gly Lys Gly Tyr Asp Asp
465 470 475 480
Trp Val Val Gln Cys Thr Trp Glu Gly Asp Asn Asn Val Leu Ser Leu
485 490 495
Thr Ser Ala Lys Ser Ile Leu Lys Lys Phe Ile Asp Ser Ala Thr Lys
500 505 510
Gly Arg Phe Asp Asn Thr Leu Asp Val Asp Ser Phe Ser Tyr Leu Lys
515 520 525
Pro Gln Tyr Ile Gly Ser Val Val Ser Gly Glu Ile Lys Ser Gly Leu
530 535 540
Lys Glu Leu Gly Asp Tyr Thr Glu Ile Trp Ser Ile Thr Leu Ile Lys
545 550 555 560
Leu Leu Ala His Ile Gly Thr Leu Val Glu Lys Ser Arg Ser Ile Asp
565 570 575
Ser Val Ser Lys Leu Leu Val Leu Val Ser Lys Phe His Ala Leu Arg
580 585 590
Cys Met Leu Lys Thr Tyr Tyr Asp Lys Leu Asn Ser Arg Asp Ser His
595 600 605
Ile Ser Asp Glu Ile Thr Lys Glu Ser Met Trp Asn Val Tyr Lys Leu
610 615 620
Phe Ser Leu Tyr Phe Ile Asp Lys His Ser Gly Glu Phe Gln Gln Phe
625 630 635 640
Lys Ile Phe Thr Pro Asp Gln Ile Ser Lys Val Val Gln Pro Gln Leu
645 650 655
Leu Ala Leu Leu Pro Ile Val Arg Lys Asp Cys Ile Gly Leu Thr Asp
660 665 670
Ser Phe Glu Leu Pro Asp Ala Met Leu Asn Ser Pro Ile Gly Tyr Phe
675 680 685
Asp Gly Asp Ile Tyr His Asn Tyr Phe Asn Glu Val Cys Arg Asn Asn
690 695 700
Pro Val Glu Ala Asp Gly Ala Gly Lys Pro Ser Tyr His Ala Leu Leu
705 710 715 720
Ser Ser Met Leu Gly Arg Gly Phe Glu Phe Asp Gln Lys Leu Gly Gly
725 730 735
Ala Ala Asn Ala Glu Ile Leu Ser Lys Ile Asn Lys
740 745
<210> 32
<211> 1236
<212> DNA
<213> Artificial Sequence
<220>
<223> codon-optimized nucleotide sequence
<220>
<221> misc_feature
<222> (1)..(1236)
<223> Y.lipolytica codon-optimized nucleotide sequence of thioesterase
from Cuphea palustris CpFATB2
<400> 32
atggtggccg ctgccgcctc cgccgccttc ttctctgtgg ccacccctcg aactaacatc 60
tctccctcgt ctctgtctgt gcccttcaag cccaagtcta accacaacgg cggcttccag 120
gtgaaggcca acgcctctgc ccaccccaag gccaacggat ctgccgtgtc tctgaagtct 180
ggctctctcg agactcagga ggacaagacc tcttcttcgt cgcctcctcc ccgaaccttc 240
atcaaccagc tgcccgtgtg gtctatgctg ctgtctgccg tgaccaccgt gttcggcgtg 300
gccgagaagc agtggcccat gctggaccga aagtctaagc gacccgacat gctggtcgag 360
cccctgggcg tggaccgaat cgtgtacgac ggcgtgtctt tccgacagtc tttctctatc 420
cgatcttacg agatcggcgc tgaccgaacc gcctctatcg agactctgat gaacatgttc 480
caggagactt ctctgaacca ctgcaagatc atcggcctgc tgaacgacgg cttcggccga 540
acccctgaga tgtgcaagcg agatctgatt tgggtggtga ccaagatgca gatcgaggtg 600
aaccgatacc ccacctgggg cgacaccatt gaggtgaaca cctgggtgtc tgcctctggc 660
aagcacggca tgggccgaga ctggctgatc tctgactgcc acaccggcga gatcctgatc 720
cgagccacct ctgtgtgggc catgatgaac cagaagaccc gacgactgtc taagatcccc 780
tacgaggtgc gacaggagat cgagccccag ttcgtggact ctgctcccgt gatcgtggac 840
gaccgaaagt tccacaagct ggacctcaag accggcgact ctatctgcaa cggcctgacc 900
cctcgatgga ccgacctgga cgtgaaccag cacgtgaaca acgtgaagta catcggctgg 960
atcctgcagt ctgtgcccac cgaggtgttt gagactcagg agctgtgcgg cctgaccctc 1020
gagtaccgac gagagtgcgg ccgagactct gtgctcgagt ctgtgaccgc catggacccc 1080
tctaaggagg gcgaccgatc tctgtaccag cacctcctgc gactcgagga cggcgccgac 1140
atcgtgaagg gccgaaccga gtggcgaccc aagaacgctg gcgccaaggg cgccatcctg 1200
accggcaaga cctctaacgg caactctatc tcttaa 1236
<210> 33
<211> 411
<212> PRT
<213> Cuphea palustris
<400> 33
Met Val Ala Ala Ala Ala Ser Ala Ala Phe Phe Ser Val Ala Thr Pro
1 5 10 15
Arg Thr Asn Ile Ser Pro Ser Ser Leu Ser Val Pro Phe Lys Pro Lys
20 25 30
Ser Asn His Asn Gly Gly Phe Gln Val Lys Ala Asn Ala Ser Ala His
35 40 45
Pro Lys Ala Asn Gly Ser Ala Val Ser Leu Lys Ser Gly Ser Leu Glu
50 55 60
Thr Gln Glu Asp Lys Thr Ser Ser Ser Ser Pro Pro Pro Arg Thr Phe
65 70 75 80
Ile Asn Gln Leu Pro Val Trp Ser Met Leu Leu Ser Ala Val Thr Thr
85 90 95
Val Phe Gly Val Ala Glu Lys Gln Trp Pro Met Leu Asp Arg Lys Ser
100 105 110
Lys Arg Pro Asp Met Leu Val Glu Pro Leu Gly Val Asp Arg Ile Val
115 120 125
Tyr Asp Gly Val Ser Phe Arg Gln Ser Phe Ser Ile Arg Ser Tyr Glu
130 135 140
Ile Gly Ala Asp Arg Thr Ala Ser Ile Glu Thr Leu Met Asn Met Phe
145 150 155 160
Gln Glu Thr Ser Leu Asn His Cys Lys Ile Ile Gly Leu Leu Asn Asp
165 170 175
Gly Phe Gly Arg Thr Pro Glu Met Cys Lys Arg Asp Leu Ile Trp Val
180 185 190
Val Thr Lys Met Gln Ile Glu Val Asn Arg Tyr Pro Thr Trp Gly Asp
195 200 205
Thr Ile Glu Val Asn Thr Trp Val Ser Ala Ser Gly Lys His Gly Met
210 215 220
Gly Arg Asp Trp Leu Ile Ser Asp Cys His Thr Gly Glu Ile Leu Ile
225 230 235 240
Arg Ala Thr Ser Val Trp Ala Met Met Asn Gln Lys Thr Arg Arg Leu
245 250 255
Ser Lys Ile Pro Tyr Glu Val Arg Gln Glu Ile Glu Pro Gln Phe Val
260 265 270
Asp Ser Ala Pro Val Ile Val Asp Asp Arg Lys Phe His Lys Leu Asp
275 280 285
Leu Lys Thr Gly Asp Ser Ile Cys Asn Gly Leu Thr Pro Arg Trp Thr
290 295 300
Asp Leu Asp Val Asn Gln His Val Asn Asn Val Lys Tyr Ile Gly Trp
305 310 315 320
Ile Leu Gln Ser Val Pro Thr Glu Val Phe Glu Thr Gln Glu Leu Cys
325 330 335
Gly Leu Thr Leu Glu Tyr Arg Arg Glu Cys Gly Arg Asp Ser Val Leu
340 345 350
Glu Ser Val Thr Ala Met Asp Pro Ser Lys Glu Gly Asp Arg Ser Leu
355 360 365
Tyr Gln His Leu Leu Arg Leu Glu Asp Gly Ala Asp Ile Val Lys Gly
370 375 380
Arg Thr Glu Trp Arg Pro Lys Asn Ala Gly Ala Lys Gly Ala Ile Leu
385 390 395 400
Thr Gly Lys Thr Ser Asn Gly Asn Ser Ile Ser
405 410
<210> 34
<211> 1149
<212> DNA
<213> Artificial Sequence
<220>
<223> codon-optimized nucleotide sequence
<220>
<221> misc_feature
<222> (1)..(1149)
<223> Y. lipolytica codon-optimised nucleotide sequence of thioesterase
from Cinnamomum camphora CcFatB1
<400> 34
atggctacca cctctctggc ctctgccttc tgctctatga aggccgtgat gctggcccga 60
gatggccgag gaatgaagcc ccgatcttct gacctgcagc tgcgagccgg caacgcccag 120
acctctctga agatgatcaa cggcaccaag ttctcttaca ccgagtcgct gaagaagctg 180
cccgactggt ctatgctgtt cgccgtgatc accaccatct tctctgccgc cgagaagcag 240
tggaccaacc tcgagtggaa gcccaagcct aaccctcctc agctgctgga cgaccacttc 300
ggaccccacg gcctggtgtt ccgacgaacc ttcgccatcc gatcttacga ggtgggcccc 360
gaccgatcta cctctatcgt ggccgtcatg aaccacctcc aagaggccgc tctgaaccac 420
gccaagtctg tgggcatcct cggcgacggc ttcggcacca ctctcgagat gtctaagcga 480
gatctgattt gggtcgtgaa gcgaacccac gtcgccgtcg agcgataccc cgcctggggc 540
gacaccgtcg aggtcgagtg ctgggtgggc gcctctggca acaacggccg acgacacgac 600
tttctggtgc gagactgcaa gaccggcgag attctgaccc gatgtacctc tctgtctgtg 660
atgatgaaca cccgaactcg acgactgtct aagatccccg aggaagtgcg aggcgagatc 720
ggacccgcct tcatcgacaa cgtggccgtg aaggacgagg aaatcaagaa gccccagaag 780
ctgaacgact ctaccgccga ctacatccaa ggcggactga cccctcgatg gaacgacctg 840
gacatcaacc agcacgtgaa caacatcaag tacgtggact ggatcctcga gactgtgccc 900
gactctatct tcgagtctca ccacatctct tcgttcacca tcgagtaccg acgagagtgc 960
accatggact ctgtgctgca gtctctgacc accgtgtctg gcggctcctc tgaggccgga 1020
ctggtgtgcg agcacctcct gcagctcgaa ggcggctctg aggtcctgcg agccaagacc 1080
gagtggcgac ccaagctgac tgactctttc cgaggcatct ctgtgatccc cgccgagtcc 1140
tctgtgtaa 1149
<210> 35
<211> 382
<212> PRT
<213> Cinnamomum camphora
<400> 35
Met Ala Thr Thr Ser Leu Ala Ser Ala Phe Cys Ser Met Lys Ala Val
1 5 10 15
Met Leu Ala Arg Asp Gly Arg Gly Met Lys Pro Arg Ser Ser Asp Leu
20 25 30
Gln Leu Arg Ala Gly Asn Ala Gln Thr Ser Leu Lys Met Ile Asn Gly
35 40 45
Thr Lys Phe Ser Tyr Thr Glu Ser Leu Lys Lys Leu Pro Asp Trp Ser
50 55 60
Met Leu Phe Ala Val Ile Thr Thr Ile Phe Ser Ala Ala Glu Lys Gln
65 70 75 80
Trp Thr Asn Leu Glu Trp Lys Pro Lys Pro Asn Pro Pro Gln Leu Leu
85 90 95
Asp Asp His Phe Gly Pro His Gly Leu Val Phe Arg Arg Thr Phe Ala
100 105 110
Ile Arg Ser Tyr Glu Val Gly Pro Asp Arg Ser Thr Ser Ile Val Ala
115 120 125
Val Met Asn His Leu Gln Glu Ala Ala Leu Asn His Ala Lys Ser Val
130 135 140
Gly Ile Leu Gly Asp Gly Phe Gly Thr Thr Leu Glu Met Ser Lys Arg
145 150 155 160
Asp Leu Ile Trp Val Val Lys Arg Thr His Val Ala Val Glu Arg Tyr
165 170 175
Pro Ala Trp Gly Asp Thr Val Glu Val Glu Cys Trp Val Gly Ala Ser
180 185 190
Gly Asn Asn Gly Arg Arg His Asp Phe Leu Val Arg Asp Cys Lys Thr
195 200 205
Gly Glu Ile Leu Thr Arg Cys Thr Ser Leu Ser Val Met Met Asn Thr
210 215 220
Arg Thr Arg Arg Leu Ser Lys Ile Pro Glu Glu Val Arg Gly Glu Ile
225 230 235 240
Gly Pro Ala Phe Ile Asp Asn Val Ala Val Lys Asp Glu Glu Ile Lys
245 250 255
Lys Pro Gln Lys Leu Asn Asp Ser Thr Ala Asp Tyr Ile Gln Gly Gly
260 265 270
Leu Thr Pro Arg Trp Asn Asp Leu Asp Ile Asn Gln His Val Asn Asn
275 280 285
Ile Lys Tyr Val Asp Trp Ile Leu Glu Thr Val Pro Asp Ser Ile Phe
290 295 300
Glu Ser His His Ile Ser Ser Phe Thr Ile Glu Tyr Arg Arg Glu Cys
305 310 315 320
Thr Met Asp Ser Val Leu Gln Ser Leu Thr Thr Val Ser Gly Gly Ser
325 330 335
Ser Glu Ala Gly Leu Val Cys Glu His Leu Leu Gln Leu Glu Gly Gly
340 345 350
Ser Glu Val Leu Arg Ala Lys Thr Glu Trp Arg Pro Lys Leu Thr Asp
355 360 365
Ser Phe Arg Gly Ile Ser Val Ile Pro Ala Glu Ser Ser Val
370 375 380
<210> 36
<211> 1578
<212> DNA
<213> Artificial sequence
<220>
<223> codon-optimized nucleotide sequence
<220>
<221> misc_feature
<222> (1)..(1578)
<223> Y.lipolytica codon-optimized nucleotide sequence of alcohol
acetyltransferase from S. cerevisiae ATF1
<400> 36
atgaacgaga tcgacgagaa gaaccaggct cctgtgcagc aagagtgcct gaaggaaatg 60
atccagaacg gacacgcccg acgaatgggc tctgtcgagg acctgtacgt ggccctgaac 120
cgacagaacc tgtaccgaaa cttctgcacc tacggcgagc tgtctgacta ctgcacccga 180
gatcagctga ccctggctct gcgagagatc tgcctgaaga accctactct gctgcatatc 240
gtgctgccca ctcgatggcc caaccacgag aactactacc gatcttctga gtactactct 300
cgaccccatc ctgtgcacga ctacatctcc gtgctgcaag agctgaagct gtctggcgtg 360
gtgctgaacg agcagcccga gtactctgcc gtgatgaagc agatcctgga agagttcaag 420
aactctaagg gctcttacac cgccaagatc ttcaagctga ctactaccct gaccattcct 480
tacttcggcc ccactggacc ctcttggcga ctgatctgtc tgcccgagga acacaccgag 540
aagtggaaga agttcatctt cgtttctaac cactgcatgt ctgacggacg atcctctatc 600
cacttctttc acgacctgcg agatgagctg aacaacatca agacccctcc aaagaagctg 660
gactacattt tcaagtacga agaggactac cagctgctgc gaaagctgcc cgagcctatc 720
gagaaggtga tcgacttccg acctccttac ctgttcatcc ccaagtctct gctgtctgga 780
ttcatctaca accacctccg attctcttcg aagggcgtgt gcatgcgaat ggacgacgtg 840
gaaaagaccg acgacgttgt gaccgagatc atcaacatct ctcccaccga gttccaggcc 900
atcaaggcca acattaagtc taacatccag ggcaagtgta ccatcactcc ctttctgcac 960
gtgtgctggt tcgtgtctct gcacaagtgg ggcaagttct ttaagcccct gaacttcgag 1020
tggctgaccg acatcttcat ccccgccgac tgccgatctc agctgcctga cgacgacgag 1080
atgcgacaga tgtaccgata cggcgccaac gtgggcttca tcgacttcac cccttggatc 1140
tctgagttcg acatgaacga caacaaggaa aacttctggc ccctgatcga gcactaccac 1200
gaggtgattt ctgaggccct gcgaaacaag aagcacctcc acggcctggg cttcaacatt 1260
cagggcttcg tccagaagta cgtcaacatt gacaaggtga tgtgcgaccg agccatcggc 1320
aagcgacgag gcggcaccct gctgtctaac gtgggcctgt tcaaccagct cgaggaaccc 1380
gacgccaagt actctatctg cgacctggcc ttcggccagt tccaaggctc ttggcaccag 1440
gctttctccc tgggcgtgtg ttctaccaac gtgaagggca tgaacatcgt ggtggcctct 1500
accaagaacg tggtgggctc tcaagagtct ctggaagaac tgtgctctat ctacaaggcc 1560
ctgctgctgg gcccctaa 1578
<210> 37
<211> 525
<212> PRT
<213> Saccharomyces cerevisiae
<400> 37
Met Asn Glu Ile Asp Glu Lys Asn Gln Ala Pro Val Gln Gln Glu Cys
1 5 10 15
Leu Lys Glu Met Ile Gln Asn Gly His Ala Arg Arg Met Gly Ser Val
20 25 30
Glu Asp Leu Tyr Val Ala Leu Asn Arg Gln Asn Leu Tyr Arg Asn Phe
35 40 45
Cys Thr Tyr Gly Glu Leu Ser Asp Tyr Cys Thr Arg Asp Gln Leu Thr
50 55 60
Leu Ala Leu Arg Glu Ile Cys Leu Lys Asn Pro Thr Leu Leu His Ile
65 70 75 80
Val Leu Pro Thr Arg Trp Pro Asn His Glu Asn Tyr Tyr Arg Ser Ser
85 90 95
Glu Tyr Tyr Ser Arg Pro His Pro Val His Asp Tyr Ile Ser Val Leu
100 105 110
Gln Glu Leu Lys Leu Ser Gly Val Val Leu Asn Glu Gln Pro Glu Tyr
115 120 125
Ser Ala Val Met Lys Gln Ile Leu Glu Glu Phe Lys Asn Ser Lys Gly
130 135 140
Ser Tyr Thr Ala Lys Ile Phe Lys Leu Thr Thr Thr Leu Thr Ile Pro
145 150 155 160
Tyr Phe Gly Pro Thr Gly Pro Ser Trp Arg Leu Ile Cys Leu Pro Glu
165 170 175
Glu His Thr Glu Lys Trp Lys Lys Phe Ile Phe Val Ser Asn His Cys
180 185 190
Met Ser Asp Gly Arg Ser Ser Ile His Phe Phe His Asp Leu Arg Asp
195 200 205
Glu Leu Asn Asn Ile Lys Thr Pro Pro Lys Lys Leu Asp Tyr Ile Phe
210 215 220
Lys Tyr Glu Glu Asp Tyr Gln Leu Leu Arg Lys Leu Pro Glu Pro Ile
225 230 235 240
Glu Lys Val Ile Asp Phe Arg Pro Pro Tyr Leu Phe Ile Pro Lys Ser
245 250 255
Leu Leu Ser Gly Phe Ile Tyr Asn His Leu Arg Phe Ser Ser Lys Gly
260 265 270
Val Cys Met Arg Met Asp Asp Val Glu Lys Thr Asp Asp Val Val Thr
275 280 285
Glu Ile Ile Asn Ile Ser Pro Thr Glu Phe Gln Ala Ile Lys Ala Asn
290 295 300
Ile Lys Ser Asn Ile Gln Gly Lys Cys Thr Ile Thr Pro Phe Leu His
305 310 315 320
Val Cys Trp Phe Val Ser Leu His Lys Trp Gly Lys Phe Phe Lys Pro
325 330 335
Leu Asn Phe Glu Trp Leu Thr Asp Ile Phe Ile Pro Ala Asp Cys Arg
340 345 350
Ser Gln Leu Pro Asp Asp Asp Glu Met Arg Gln Met Tyr Arg Tyr Gly
355 360 365
Ala Asn Val Gly Phe Ile Asp Phe Thr Pro Trp Ile Ser Glu Phe Asp
370 375 380
Met Asn Asp Asn Lys Glu Asn Phe Trp Pro Leu Ile Glu His Tyr His
385 390 395 400
Glu Val Ile Ser Glu Ala Leu Arg Asn Lys Lys His Leu His Gly Leu
405 410 415
Gly Phe Asn Ile Gln Gly Phe Val Gln Lys Tyr Val Asn Ile Asp Lys
420 425 430
Val Met Cys Asp Arg Ala Ile Gly Lys Arg Arg Gly Gly Thr Leu Leu
435 440 445
Ser Asn Val Gly Leu Phe Asn Gln Leu Glu Glu Pro Asp Ala Lys Tyr
450 455 460
Ser Ile Cys Asp Leu Ala Phe Gly Gln Phe Gln Gly Ser Trp His Gln
465 470 475 480
Ala Phe Ser Leu Gly Val Cys Ser Thr Asn Val Lys Gly Met Asn Ile
485 490 495
Val Val Ala Ser Thr Lys Asn Val Val Gly Ser Gln Glu Ser Leu Glu
500 505 510
Glu Leu Cys Ser Ile Tyr Lys Ala Leu Leu Leu Gly Pro
515 520 525
<210> 38
<211> 2088
<212> DNA
<213> Artificial sequence
<220>
<223> codon-optimized nucleotide sequence
<220>
<221> misc_feature
<222> (1)..(2088)
<223> DNA Codon-optimised sequence of peroxisomal oxidase
<220>
<221> misc_feature
<222> (1)..(2088)
<223> DNA Codon-optimised sequence of peroxisomal oxidase, Agrotis
segetum
<400> 38
atgcccattt tcatctgtat catcacctcg caagccatca tccgatcgaa cgtggaacga 60
gtggcagtca ttcttaacat caacatgggt aaggtgaacg aggacctggt tcgagagcgt 120
gcaaagtgta ccttcaacat tgaggagctc acctactttc ttgacggagg aaaagataaa 180
accttggaaa gaaaggagac cgaacgagct atgttgacca agcgagaaga gctctttgga 240
ggcgttcccg acgaatacct gtcacacaag gagaagtacg agaactccat gcgaaaggct 300
gttattctct tcggaatcct tagaaagatc caaaaggata acaacaccga cctcaccaac 360
taccggaatc tgctgagcgg agtgctgtcc gtgtccatct cccaggatgg ctctcctttc 420
ggcctccact acatcatgtt catgcctgtg ctgctgtctc aggctgatga aaaacaacaa 480
gagaagtggc tgaagcgagc catgaactgt gaaatcatcg gctcttacgc ccagaccgag 540
ctgggccacg gcactttcat ccgaggcctt gagactactg ccacttacga tcccgccacc 600
caggagttcg tgctgcactc tcctgctctt tcgtcctaca agtggtggcc tggaggcctc 660
ggaaacactg tcaattactg catcgttatt gcccagctgt actctaaggg cgtctgtcac 720
ggcattcatt ccttcatcgt gcaggtgcga gacgaggaca ctcacatgcc gttgcccggc 780
atcaaggtcg gagagatcgg tgtgaagatg ggtctgaact ctgtcaacaa cggattcctg 840
ggattcgaga acgtccgaat cccccgagtg aacatgctta tgaagcacgc caagatcctg 900
gaggatggaa cttacgttaa gtcgaagaac aacaagctca tctacggagc aatggtgttc 960
gtccgagtgg tgatcgtgtt cgactctgtg aactacctgg ccaaggccat caccattggc 1020
gcacgatact ccctggtgcg gcgacagtcg caattaaaag ctggagaacc tgagcgacag 1080
atcctcgact atgtcaccca gcagcacaag attctgcccg ctatcgctgg atgctacgcc 1140
atgaagatga acgcttggag gttgtgggac accttcaacc tgatcaacgg acaactgcat 1200
cagggcaaca tggaacggct gggcgagctg catgccctcg cgtgctgcct caaggctatc 1260
tctaccaccg acgcggctat gttcacctct ctgtgtcgac tcggatgcgg aggtcacggt 1320
tacatgactt cttccaacct ccctcccaca tacgctttga cttctgcctc gtgcacttac 1380
gagggagaca acaccgttct gctgctgcag accgctcgat ttcttctcaa gacctggcga 1440
cagattgaca cccaccctct gactagaacc gtggcctacc tgaagaccgt gtctgcccct 1500
ggattctctg acagatggga gtcttccgtg gagggcatca ttcgaggctt ccagaccgtc 1560
gctatgaaaa agatttcttc ctgtctggac atcatgactt ctaaggtgat gtctggaatg 1620
tcccaggagg atgcatggaa cgctatttct atccagctgg tttcggccgc tgaatcccat 1680
tctcgaggca ccgtgatctc tacgttttac gaagacatgt ctaaggccat gcgatccatg 1740
actgctccct tggcgaaggt gatgggtcag ctggttgagc tgtacgcggt ttattggact 1800
ctagagcgac tgggagacat gttgcagtac accagtattt ctcacaccga cgttgttgac 1860
ctccgatcct ggtacgaaga gctcctccga aagatccgac ctaacactat cggactggtg 1920
gacgcgtttg atattattga tgaactgctc cagtccaccc tgggtgctta tgacggtcgt 1980
gtttacgaac gactgatgga agaagctttg aagtctcccc tgaacgctga gcccgtgaac 2040
cagtccttcc acaagtacct caagcccttt atgcagtcta agctgtaa 2088
<210> 39
<211> 695
<212> PRT
<213> Agrotis segetum
<400> 39
Met Pro Ile Phe Ile Cys Ile Ile Thr Ser Gln Ala Ile Ile Arg Ser
1 5 10 15
Asn Val Glu Arg Val Ala Val Ile Leu Asn Ile Asn Met Gly Lys Val
20 25 30
Asn Glu Asp Leu Val Arg Glu Arg Ala Lys Cys Thr Phe Asn Ile Glu
35 40 45
Glu Leu Thr Tyr Phe Leu Asp Gly Gly Lys Asp Lys Thr Leu Glu Arg
50 55 60
Lys Glu Thr Glu Arg Ala Met Leu Thr Lys Arg Glu Glu Leu Phe Gly
65 70 75 80
Gly Val Pro Asp Glu Tyr Leu Ser His Lys Glu Lys Tyr Glu Asn Ser
85 90 95
Met Arg Lys Ala Val Ile Leu Phe Gly Ile Leu Arg Lys Ile Gln Lys
100 105 110
Asp Asn Asn Thr Asp Leu Thr Asn Tyr Arg Asn Leu Leu Ser Gly Val
115 120 125
Leu Ser Val Ser Ile Ser Gln Asp Gly Ser Pro Phe Gly Leu His Tyr
130 135 140
Ile Met Phe Met Pro Val Leu Leu Ser Gln Ala Asp Glu Lys Gln Gln
145 150 155 160
Glu Lys Trp Leu Lys Arg Ala Met Asn Cys Glu Ile Ile Gly Ser Tyr
165 170 175
Ala Gln Thr Glu Leu Gly His Gly Thr Phe Ile Arg Gly Leu Glu Thr
180 185 190
Thr Ala Thr Tyr Asp Pro Ala Thr Gln Glu Phe Val Leu His Ser Pro
195 200 205
Ala Leu Ser Ser Tyr Lys Trp Trp Pro Gly Gly Leu Gly Asn Thr Val
210 215 220
Asn Tyr Cys Ile Val Ile Ala Gln Leu Tyr Ser Lys Gly Val Cys His
225 230 235 240
Gly Ile His Ser Phe Ile Val Gln Val Arg Asp Glu Asp Thr His Met
245 250 255
Pro Leu Pro Gly Ile Lys Val Gly Glu Ile Gly Val Lys Met Gly Leu
260 265 270
Asn Ser Val Asn Asn Gly Phe Leu Gly Phe Glu Asn Val Arg Ile Pro
275 280 285
Arg Val Asn Met Leu Met Lys His Ala Lys Ile Leu Glu Asp Gly Thr
290 295 300
Tyr Val Lys Ser Lys Asn Asn Lys Leu Ile Tyr Gly Ala Met Val Phe
305 310 315 320
Val Arg Val Val Ile Val Phe Asp Ser Val Asn Tyr Leu Ala Lys Ala
325 330 335
Ile Thr Ile Gly Ala Arg Tyr Ser Leu Val Arg Arg Gln Ser Gln Leu
340 345 350
Lys Ala Gly Glu Pro Glu Arg Gln Ile Leu Asp Tyr Val Thr Gln Gln
355 360 365
His Lys Ile Leu Pro Ala Ile Ala Gly Cys Tyr Ala Met Lys Met Asn
370 375 380
Ala Trp Arg Leu Trp Asp Thr Phe Asn Leu Ile Asn Gly Gln Leu His
385 390 395 400
Gln Gly Asn Met Glu Arg Leu Gly Glu Leu His Ala Leu Ala Cys Cys
405 410 415
Leu Lys Ala Ile Ser Thr Thr Asp Ala Ala Met Phe Thr Ser Leu Cys
420 425 430
Arg Leu Gly Cys Gly Gly His Gly Tyr Met Thr Ser Ser Asn Leu Pro
435 440 445
Pro Thr Tyr Ala Leu Thr Ser Ala Ser Cys Thr Tyr Glu Gly Asp Asn
450 455 460
Thr Val Leu Leu Leu Gln Thr Ala Arg Phe Leu Leu Lys Thr Trp Arg
465 470 475 480
Gln Ile Asp Thr His Pro Leu Thr Arg Thr Val Ala Tyr Leu Lys Thr
485 490 495
Val Ser Ala Pro Gly Phe Ser Asp Arg Trp Glu Ser Ser Val Glu Gly
500 505 510
Ile Ile Arg Gly Phe Gln Thr Val Ala Met Lys Lys Ile Ser Ser Cys
515 520 525
Leu Asp Ile Met Thr Ser Lys Val Met Ser Gly Met Ser Gln Glu Asp
530 535 540
Ala Trp Asn Ala Ile Ser Ile Gln Leu Val Ser Ala Ala Glu Ser His
545 550 555 560
Ser Arg Gly Thr Val Ile Ser Thr Phe Tyr Glu Asp Met Ser Lys Ala
565 570 575
Met Arg Ser Met Thr Ala Pro Leu Ala Lys Val Met Gly Gln Leu Val
580 585 590
Glu Leu Tyr Ala Val Tyr Trp Thr Leu Glu Arg Leu Gly Asp Met Leu
595 600 605
Gln Tyr Thr Ser Ile Ser His Thr Asp Val Val Asp Leu Arg Ser Trp
610 615 620
Tyr Glu Glu Leu Leu Arg Lys Ile Arg Pro Asn Thr Ile Gly Leu Val
625 630 635 640
Asp Ala Phe Asp Ile Ile Asp Glu Leu Leu Gln Ser Thr Leu Gly Ala
645 650 655
Tyr Asp Gly Arg Val Tyr Glu Arg Leu Met Glu Glu Ala Leu Lys Ser
660 665 670
Pro Leu Asn Ala Glu Pro Val Asn Gln Ser Phe His Lys Tyr Leu Lys
675 680 685
Pro Phe Met Gln Ser Lys Leu
690 695
<210> 40
<211> 2031
<212> DNA
<213> Artificial sequence
<220>
<223> codon-optimized nucleotide sequence
<220>
<221> misc_feature
<222> (1)..(2031)
<223> DNA Codon-optimised sequence of peroxisomal oxidase 1
<220>
<221> misc_feature
<222> (1)..(2031)
<223> DNA Codon-optimised sequence of peroxisomal oxidase 1,
Arabidopsis thaliana
<400> 40
atggaaggca tcgaccacct ggccgacgag cgaaacaagg ccgagttcga cgttgaggac 60
atgaagatcg tgtgggccgg ctctcgacac gccttcgagg tgtctgaccg aatcgcccga 120
ctggtggctt ctgaccccgt gttcgagaag tctaaccgag ccagactgtc tcgaaaggaa 180
ctgttcaagt ctaccctgcg aaagtgcgcc cacgccttca agcgaatcat cgagctgcga 240
ctgaacgagg aagaggccgg acgactgcga cacttcattg accagcctgc ctacgtggac 300
ctgcactggg gcatgttcgt gcccgccatc aagggccagg gcaccgagga acagcagaag 360
aagtggctgt ctctggccaa caagatgcag atcatcggct gctacgccca gaccgagctt 420
ggccacggct ctaacgtgca gggcctcgag actaccgcca ctttcgaccc caagaccgac 480
gagttcgtga ttcacacccc tactcagacc gcctctaagt ggtggcccgg tggcctcggc 540
aaggtgtcta cccacgccgt ggtgtacgct cgactgatca ccaacggcaa ggactacggc 600
atccacggct tcatcgtgca gctgcgatct ctcgaggacc actctcctct gcctaacatc 660
accgtgggcg acatcggcac caagatgggc aacggcgcct acaactctat ggacaacggc 720
ttcctgatgt tcgaccacgt gcgaattccc cgagatcaga tgctgatgcg actgtctaag 780
gtgacccgag agggcgagta cgtgccctct gacgtgccca agcagctggt gtacggaacc 840
atggtgtacg tgcgacagac catcgtggcc gacgcttcta acgccctgtc tcgagccgtg 900
tgtatcgcta cccgatactc tgccgtgcga cgacagttcg gcgcccacaa cggcggcatc 960
gagactcagg tgatcgacta caagacccag cagaaccgac tgttccctct gctggcctcc 1020
gcctacgcct tccgattcgt cggcgagtgg ctgaagtggc tctacaccga cgtgaccgag 1080
cgactggccg cctctgactt cgccactctg cccgaggctc acgcctgcac cgccggactg 1140
aagtctctga ccaccaccgc caccgctgac ggcatcgaag agtgccgaaa gctgtgtggc 1200
ggccacggat acctgtggtg ctctggactg cccgagctgt tcgccgtgta cgtccccgcc 1260
tgtacctacg agggcgacaa cgtggtgctg cagctccagg tggcccgatt cctgatgaag 1320
accgtcgctc agctcggctc tggcaaggtg cccgtgggaa ccaccgccta catgggccga 1380
gccgctcacc tcctgcagtg ccgatctggc gtgcagaagg ccgaggactg gctgaacccc 1440
gacgtcgtgc tcgaggcttt cgaggcccga gcactgcgaa tggccgtgac ctgcgccaag 1500
aacctgtcta agttcgagaa ccaggaacag ggcttccaag agctgctggc cgacctggtc 1560
gaggccgcta tcgcccactg ccagctgatc gtggtgtcca agttcattgc taagctcgag 1620
caggacatcg gcggcaaggg cgtgaagaag cagctgaaca acctgtgcta catctacgcc 1680
ctgtacctgc tgcacaagca cctgggcgac tttctgtcta ccaactgcat tacccctaag 1740
caggcctctc tggctaacga ccagctccga tcgctgtaca cccaggtgcg acccaacgct 1800
gtggccctgg tggacgcttt caactacact gaccactacc tgaactctgt gctgggccga 1860
tacgacggca acgtgtaccc caagctgttc gaagaggccc tgaaggaccc tctgaacgac 1920
tctgtggtgc ccgacggcta ccaagagtac ctgcgacctg tcctgcagca gcagctccga 1980
accgctcgac tcgaccagat tacctctgtg ggatcttctt cgaagctgta g 2031
<210> 41
<211> 676
<212> PRT
<213> Arabidopsis thaliana
<400> 41
Met Glu Gly Ile Asp His Leu Ala Asp Glu Arg Asn Lys Ala Glu Phe
1 5 10 15
Asp Val Glu Asp Met Lys Ile Val Trp Ala Gly Ser Arg His Ala Phe
20 25 30
Glu Val Ser Asp Arg Ile Ala Arg Leu Val Ala Ser Asp Pro Val Phe
35 40 45
Glu Lys Ser Asn Arg Ala Arg Leu Ser Arg Lys Glu Leu Phe Lys Ser
50 55 60
Thr Leu Arg Lys Cys Ala His Ala Phe Lys Arg Ile Ile Glu Leu Arg
65 70 75 80
Leu Asn Glu Glu Glu Ala Gly Arg Leu Arg His Phe Ile Asp Gln Pro
85 90 95
Ala Tyr Val Asp Leu His Trp Gly Met Phe Val Pro Ala Ile Lys Gly
100 105 110
Gln Gly Thr Glu Glu Gln Gln Lys Lys Trp Leu Ser Leu Ala Asn Lys
115 120 125
Met Gln Ile Ile Gly Cys Tyr Ala Gln Thr Glu Leu Gly His Gly Ser
130 135 140
Asn Val Gln Gly Leu Glu Thr Thr Ala Thr Phe Asp Pro Lys Thr Asp
145 150 155 160
Glu Phe Val Ile His Thr Pro Thr Gln Thr Ala Ser Lys Trp Trp Pro
165 170 175
Gly Gly Leu Gly Lys Val Ser Thr His Ala Val Val Tyr Ala Arg Leu
180 185 190
Ile Thr Asn Gly Lys Asp Tyr Gly Ile His Gly Phe Ile Val Gln Leu
195 200 205
Arg Ser Leu Glu Asp His Ser Pro Leu Pro Asn Ile Thr Val Gly Asp
210 215 220
Ile Gly Thr Lys Met Gly Asn Gly Ala Tyr Asn Ser Met Asp Asn Gly
225 230 235 240
Phe Leu Met Phe Asp His Val Arg Ile Pro Arg Asp Gln Met Leu Met
245 250 255
Arg Leu Ser Lys Val Thr Arg Glu Gly Glu Tyr Val Pro Ser Asp Val
260 265 270
Pro Lys Gln Leu Val Tyr Gly Thr Met Val Tyr Val Arg Gln Thr Ile
275 280 285
Val Ala Asp Ala Ser Asn Ala Leu Ser Arg Ala Val Cys Ile Ala Thr
290 295 300
Arg Tyr Ser Ala Val Arg Arg Gln Phe Gly Ala His Asn Gly Gly Ile
305 310 315 320
Glu Thr Gln Val Ile Asp Tyr Lys Thr Gln Gln Asn Arg Leu Phe Pro
325 330 335
Leu Leu Ala Ser Ala Tyr Ala Phe Arg Phe Val Gly Glu Trp Leu Lys
340 345 350
Trp Leu Tyr Thr Asp Val Thr Glu Arg Leu Ala Ala Ser Asp Phe Ala
355 360 365
Thr Leu Pro Glu Ala His Ala Cys Thr Ala Gly Leu Lys Ser Leu Thr
370 375 380
Thr Thr Ala Thr Ala Asp Gly Ile Glu Glu Cys Arg Lys Leu Cys Gly
385 390 395 400
Gly His Gly Tyr Leu Trp Cys Ser Gly Leu Pro Glu Leu Phe Ala Val
405 410 415
Tyr Val Pro Ala Cys Thr Tyr Glu Gly Asp Asn Val Val Leu Gln Leu
420 425 430
Gln Val Ala Arg Phe Leu Met Lys Thr Val Ala Gln Leu Gly Ser Gly
435 440 445
Lys Val Pro Val Gly Thr Thr Ala Tyr Met Gly Arg Ala Ala His Leu
450 455 460
Leu Gln Cys Arg Ser Gly Val Gln Lys Ala Glu Asp Trp Leu Asn Pro
465 470 475 480
Asp Val Val Leu Glu Ala Phe Glu Ala Arg Ala Leu Arg Met Ala Val
485 490 495
Thr Cys Ala Lys Asn Leu Ser Lys Phe Glu Asn Gln Glu Gln Gly Phe
500 505 510
Gln Glu Leu Leu Ala Asp Leu Val Glu Ala Ala Ile Ala His Cys Gln
515 520 525
Leu Ile Val Val Ser Lys Phe Ile Ala Lys Leu Glu Gln Asp Ile Gly
530 535 540
Gly Lys Gly Val Lys Lys Gln Leu Asn Asn Leu Cys Tyr Ile Tyr Ala
545 550 555 560
Leu Tyr Leu Leu His Lys His Leu Gly Asp Phe Leu Ser Thr Asn Cys
565 570 575
Ile Thr Pro Lys Gln Ala Ser Leu Ala Asn Asp Gln Leu Arg Ser Leu
580 585 590
Tyr Thr Gln Val Arg Pro Asn Ala Val Ala Leu Val Asp Ala Phe Asn
595 600 605
Tyr Thr Asp His Tyr Leu Asn Ser Val Leu Gly Arg Tyr Asp Gly Asn
610 615 620
Val Tyr Pro Lys Leu Phe Glu Glu Ala Leu Lys Asp Pro Leu Asn Asp
625 630 635 640
Ser Val Val Pro Asp Gly Tyr Gln Glu Tyr Leu Arg Pro Val Leu Gln
645 650 655
Gln Gln Leu Arg Thr Ala Arg Leu Asp Gln Ile Thr Ser Val Gly Ser
660 665 670
Ser Ser Lys Leu
675
<210> 42
<211> 2115
<212> DNA
<213> Artificial sequence
<220>
<223> codon-optimized nucleotide sequence
<220>
<221> misc_feature
<222> (1)..(2115)
<223> DNA Codon-optimised sequence of peroxisomal oxidase 2
<220>
<221> misc_feature
<222> (1)..(2115)
<223> DNA Codon-optimised sequence of peroxisomal oxidase 2,
Arabidopsis thaliana
<400> 42
atggaatctc gacgagagaa gaaccccatg accgaggaag agtctgacgg cctgatcgcc 60
gctcgacgaa tccagcgact gtctctgcac ctgtcgcctt ctctgacccc ttctccttcg 120
ctgcccctgg tgcagaccga gacttgctct gcccgatcta agaagctgga cgtcaacggc 180
gaggccctgt ctctgtacat gcgaggcaag cacatcgaca tccaagagaa gattttcgac 240
ttcttcaact ctcgacccga cctgcagacc cctatcgaga tctctaagga cgaccaccga 300
gagctgtgca tgaaccagct gatcggcctg gtgcgagagg ccggcgtgcg acccttccga 360
tacgtggctg acgaccctga gaagtacttt gccatcatgg aagccgtggg ctctgtggac 420
atgtctctgg gcatcaagat gggcgtgcag tactctctgt ggggcggctc tgtgatcaac 480
ctgggcacca agaagcaccg agacaagtac ttcgacggca tcgacaacct ggactacacc 540
ggctgcttcg ctatgaccga gctgcaccac ggctctaacg tgcagggact gcagaccacc 600
gccactttcg accctctgaa ggacgagttc gtgatcgaca cccctaacga cggcgccatc 660
aagtggtgga tcggcaacgc cgccgtccac ggcaagttcg ccaccgtgtt cgcccgactg 720
attctgccca ctcacgactc taagggcgtg tctgacatgg gagtgcacgc cttcatcgtg 780
cccatccgag acatgaagac ccaccagact ctgcccggcg tcgagatcca ggactgcggc 840
cacaaggtgg gcctgaacgg cgtggacaac ggcgccctgc gattccgatc tgtgcgaatt 900
ccccgagaca acctgctgaa ccgattcggc gacgtgtctc gagatggcac ctacacctct 960
tctctgccca ccatcaacaa gcgattcgga gctaccctgg gcgagctggt cggcggacga 1020
gtcggcctgg cctacgcctc tgtgggcgtg ctgaagatct ccgccactat cgccatccga 1080
tactccctgc tgcgacagca gttcggccct cctaagcagc ccgaggtgtc tattctggac 1140
taccagtctc agcagcacaa gctgatgccc atgctggcct ctacctacgc ctaccacttc 1200
gctaccgtgt acctggtgga aaagtactct gagatgaaga agactcacga cgagcagctg 1260
gtggccgacg tgcacgccct gtctgccgga ctgaagtctt acgtgacctc ttacaccgcc 1320
aaggctctgt ctgtgtgccg agaggcctgt ggcggccacg gctacgccgc tgtcaaccga 1380
tttggctctc tgcgaaacga ccacgacatc ttccagacct tcgagggcga caacaccgtg 1440
ctgctccagc aggtcgccgc cgacctcctg aagcgataca aggaaaagtt ccaaggcggc 1500
accctgaccg tcacctggtc ttacctgcga gagtctatga acacctacct ctcgcagccc 1560
aaccctgtga ccgctcgatg ggaaggcgag gaccatctgc gagatcccaa gtttcagctg 1620
gacgctttcc gataccgaac ctctcgactg ctgcagaacg tggctgcccg actgcagaag 1680
cactctaaga ccctcggcgg cttcggcgcc tggaaccgat gcctgaacca tctgctgacc 1740
ctggccgagt ctcacatcga gactgtgatc ctggccaagt tcatcgaggc cgtgaagaac 1800
tgccccgatc cttctgccaa ggccgctctg aagctggcct gcgacctgta cgccctggac 1860
cgaatctgga aggacatcgg cacctaccga aacgtggact acgtggctcc caacaaggcc 1920
aaggccatcc acaagctcac cgagtacctg tctttccagg tgcgaaacgt cgccaaggaa 1980
ctggtggacg ccttcgagct gcctgaccac gtgactcgag cccctattgc catgcagtct 2040
gacgcctact ctcagtacac ccaggtggtg ggcttcgacc agattacctc cgtgggatct 2100
tcttcgaagc tgtag 2115
<210> 43
<211> 704
<212> PRT
<213> Arabidopsis thaliana
<400> 43
Met Glu Ser Arg Arg Glu Lys Asn Pro Met Thr Glu Glu Glu Ser Asp
1 5 10 15
Gly Leu Ile Ala Ala Arg Arg Ile Gln Arg Leu Ser Leu His Leu Ser
20 25 30
Pro Ser Leu Thr Pro Ser Pro Ser Leu Pro Leu Val Gln Thr Glu Thr
35 40 45
Cys Ser Ala Arg Ser Lys Lys Leu Asp Val Asn Gly Glu Ala Leu Ser
50 55 60
Leu Tyr Met Arg Gly Lys His Ile Asp Ile Gln Glu Lys Ile Phe Asp
65 70 75 80
Phe Phe Asn Ser Arg Pro Asp Leu Gln Thr Pro Ile Glu Ile Ser Lys
85 90 95
Asp Asp His Arg Glu Leu Cys Met Asn Gln Leu Ile Gly Leu Val Arg
100 105 110
Glu Ala Gly Val Arg Pro Phe Arg Tyr Val Ala Asp Asp Pro Glu Lys
115 120 125
Tyr Phe Ala Ile Met Glu Ala Val Gly Ser Val Asp Met Ser Leu Gly
130 135 140
Ile Lys Met Gly Val Gln Tyr Ser Leu Trp Gly Gly Ser Val Ile Asn
145 150 155 160
Leu Gly Thr Lys Lys His Arg Asp Lys Tyr Phe Asp Gly Ile Asp Asn
165 170 175
Leu Asp Tyr Thr Gly Cys Phe Ala Met Thr Glu Leu His His Gly Ser
180 185 190
Asn Val Gln Gly Leu Gln Thr Thr Ala Thr Phe Asp Pro Leu Lys Asp
195 200 205
Glu Phe Val Ile Asp Thr Pro Asn Asp Gly Ala Ile Lys Trp Trp Ile
210 215 220
Gly Asn Ala Ala Val His Gly Lys Phe Ala Thr Val Phe Ala Arg Leu
225 230 235 240
Ile Leu Pro Thr His Asp Ser Lys Gly Val Ser Asp Met Gly Val His
245 250 255
Ala Phe Ile Val Pro Ile Arg Asp Met Lys Thr His Gln Thr Leu Pro
260 265 270
Gly Val Glu Ile Gln Asp Cys Gly His Lys Val Gly Leu Asn Gly Val
275 280 285
Asp Asn Gly Ala Leu Arg Phe Arg Ser Val Arg Ile Pro Arg Asp Asn
290 295 300
Leu Leu Asn Arg Phe Gly Asp Val Ser Arg Asp Gly Thr Tyr Thr Ser
305 310 315 320
Ser Leu Pro Thr Ile Asn Lys Arg Phe Gly Ala Thr Leu Gly Glu Leu
325 330 335
Val Gly Gly Arg Val Gly Leu Ala Tyr Ala Ser Val Gly Val Leu Lys
340 345 350
Ile Ser Ala Thr Ile Ala Ile Arg Tyr Ser Leu Leu Arg Gln Gln Phe
355 360 365
Gly Pro Pro Lys Gln Pro Glu Val Ser Ile Leu Asp Tyr Gln Ser Gln
370 375 380
Gln His Lys Leu Met Pro Met Leu Ala Ser Thr Tyr Ala Tyr His Phe
385 390 395 400
Ala Thr Val Tyr Leu Val Glu Lys Tyr Ser Glu Met Lys Lys Thr His
405 410 415
Asp Glu Gln Leu Val Ala Asp Val His Ala Leu Ser Ala Gly Leu Lys
420 425 430
Ser Tyr Val Thr Ser Tyr Thr Ala Lys Ala Leu Ser Val Cys Arg Glu
435 440 445
Ala Cys Gly Gly His Gly Tyr Ala Ala Val Asn Arg Phe Gly Ser Leu
450 455 460
Arg Asn Asp His Asp Ile Phe Gln Thr Phe Glu Gly Asp Asn Thr Val
465 470 475 480
Leu Leu Gln Gln Val Ala Ala Asp Leu Leu Lys Arg Tyr Lys Glu Lys
485 490 495
Phe Gln Gly Gly Thr Leu Thr Val Thr Trp Ser Tyr Leu Arg Glu Ser
500 505 510
Met Asn Thr Tyr Leu Ser Gln Pro Asn Pro Val Thr Ala Arg Trp Glu
515 520 525
Gly Glu Asp His Leu Arg Asp Pro Lys Phe Gln Leu Asp Ala Phe Arg
530 535 540
Tyr Arg Thr Ser Arg Leu Leu Gln Asn Val Ala Ala Arg Leu Gln Lys
545 550 555 560
His Ser Lys Thr Leu Gly Gly Phe Gly Ala Trp Asn Arg Cys Leu Asn
565 570 575
His Leu Leu Thr Leu Ala Glu Ser His Ile Glu Thr Val Ile Leu Ala
580 585 590
Lys Phe Ile Glu Ala Val Lys Asn Cys Pro Asp Pro Ser Ala Lys Ala
595 600 605
Ala Leu Lys Leu Ala Cys Asp Leu Tyr Ala Leu Asp Arg Ile Trp Lys
610 615 620
Asp Ile Gly Thr Tyr Arg Asn Val Asp Tyr Val Ala Pro Asn Lys Ala
625 630 635 640
Lys Ala Ile His Lys Leu Thr Glu Tyr Leu Ser Phe Gln Val Arg Asn
645 650 655
Val Ala Lys Glu Leu Val Asp Ala Phe Glu Leu Pro Asp His Val Thr
660 665 670
Arg Ala Pro Ile Ala Met Gln Ser Asp Ala Tyr Ser Gln Tyr Thr Gln
675 680 685
Val Val Gly Phe Asp Gln Ile Thr Ser Val Gly Ser Ser Ser Lys Leu
690 695 700
<210> 44
<211> 2091
<212> DNA
<213> Artificial sequence
<220>
<223> codon-optimized nucleotide sequence
<220>
<221> misc_feature
<222> (1)..(2091)
<223> DNA Codon-optimised sequence of peroxisomal oxidase
<220>
<221> misc_feature
<222> (1)..(2091)
<223> DNA Codon-optimised sequence of peroxisomal oxidase, Aspergillus
nidulans
<400> 44
atgcccaacc ctccgcctgc ctgggtgcaa gctctgaagc ccgcttcgcc ccagggcacc 60
gagctgctga cccaagagcg agcccagtct aacatcgacg tggacaccct gggcgacctg 120
ctgcacacca aggaagccct gaagaagcag gacgagatcc tgtctgtgct gaagtctgag 180
aaggtgttcg acaagtctcg aaaccacgtg ctgggccgaa ccgagaagat ccagctggcc 240
ctggctcgag gcaagcgact gcagcagctg aagaaggccc acaactggtc tgacgaggac 300
gtccacgtgg ccaacgacct ggtgtctgag cccactcctt acggcctgca cgcctctatg 360
tttctggtga ccctgcgaga gcagggcacc cctgagcagc acaagctgtt ctacgaacga 420
gcccgaaact acgagatcat cggctgctac gcccagaccg agcttggcca cggctctaac 480
gtgcgaggac tcgagactac cgccacttgg gacccctctg accagacctt catcattcac 540
tctcccactc tgaccgcctc taagtggtgg atcggctctc tgggacgaac cgccaaccac 600
gccgtggtga tggcccagct gtacatcggc ggcaagaact acggacccca tcctttcgtg 660
gtgcagatcc gagacatgga aacccaccag cctctcgaga acgtgtacgt gggcgacatc 720
ggccccaagt tcggctacaa caccatggac aacggctttc tgctgttcaa caagctgaag 780
attccccacg tgaacatgct ggcccgattc gcccaggtgg acaaggccac caacaagtac 840
attcgacccg cttctccctc tctgatgtac ggcaccatga cctgggtgcg atccaacatc 900
gtgctgcagg ctggcggcgt gctcgcccga ggcgtgacca ttgccgtgcg atactgcgcc 960
gtgcgacgac agttccagga ccgagatgcc aaggccaacg ccgaagagaa ccaggtgctg 1020
aactacaaga tggtccagat tcgactgctg cccctgctgg ccgccatgta cgccctgcac 1080
ttcaccggcc gaggcatgat gcgactgtac gaagaaaacc aagaacgaat gaaggctgcc 1140
gctcaggccg accaagagaa gcgaggcgct ggccccgagc agctgcgagc cggatctgac 1200
ctgctggctg acctgcacgc tacctcttgc ggcctgaagg ccctggcctc taccaccgct 1260
ggcgagggcc tcgaggtgtg ccgacgagcc tgtggcggcc acggatactc taactactct 1320
ggcatcggac cctggtacgc cgactacctg cctactctga cctgggaggg cgacaactac 1380
atgctgactc agcaggttgc ccgatacctg ctcaagtctg cccgagccgt gctggccggc 1440
aagggcaccg ccaacgacac ctctcgaatc ctgcaggcct acctcgctcg acgagacaag 1500
ggcgcctctt tcgacatcct gggcaacgac gccgacattg tggccgcctt cgcctggcga 1560
accgctcacc tgaccttcga gactctgaag taccgagatg tcgagaagcg atcttggaac 1620
tctctgctga tcaacttctg gcgactgtct accgctctgt ctcagtacct ggtggtgaag 1680
aacttctacg aggccgtgaa ctctcccgag atccgatctt ctctggacaa ggacactgct 1740
tctaccctgc gatctctgtt ccgactgcac gctctgcaca ccctggaccg agaggcctcc 1800
gagttcttct cttctgccgc cgtgaccgtg cgacagatcg gactgaccca gacctctgag 1860
gtgcccaagc tgctggacga gattcgaccc cacgccgtcc gactggtgga ctcttggaag 1920
atccccgact ggcagctgga ctctgccctg ggccgatctg acggcgacgt gtaccccgac 1980
ctgttcaagc gagcctctat gcagaacccc gtgaacgacc tcgtgttcga cccctatcct 2040
tggaacgaga acgtcctgaa gaacgccggt gagatcaagt ctaagctgta g 2091
<210> 45
<211> 696
<212> PRT
<213> Aspergillus nidulans
<400> 45
Met Pro Asn Pro Pro Pro Ala Trp Val Gln Ala Leu Lys Pro Ala Ser
1 5 10 15
Pro Gln Gly Thr Glu Leu Leu Thr Gln Glu Arg Ala Gln Ser Asn Ile
20 25 30
Asp Val Asp Thr Leu Gly Asp Leu Leu His Thr Lys Glu Ala Leu Lys
35 40 45
Lys Gln Asp Glu Ile Leu Ser Val Leu Lys Ser Glu Lys Val Phe Asp
50 55 60
Lys Ser Arg Asn His Val Leu Gly Arg Thr Glu Lys Ile Gln Leu Ala
65 70 75 80
Leu Ala Arg Gly Lys Arg Leu Gln Gln Leu Lys Lys Ala His Asn Trp
85 90 95
Ser Asp Glu Asp Val His Val Ala Asn Asp Leu Val Ser Glu Pro Thr
100 105 110
Pro Tyr Gly Leu His Ala Ser Met Phe Leu Val Thr Leu Arg Glu Gln
115 120 125
Gly Thr Pro Glu Gln His Lys Leu Phe Tyr Glu Arg Ala Arg Asn Tyr
130 135 140
Glu Ile Ile Gly Cys Tyr Ala Gln Thr Glu Leu Gly His Gly Ser Asn
145 150 155 160
Val Arg Gly Leu Glu Thr Thr Ala Thr Trp Asp Pro Ser Asp Gln Thr
165 170 175
Phe Ile Ile His Ser Pro Thr Leu Thr Ala Ser Lys Trp Trp Ile Gly
180 185 190
Ser Leu Gly Arg Thr Ala Asn His Ala Val Val Met Ala Gln Leu Tyr
195 200 205
Ile Gly Gly Lys Asn Tyr Gly Pro His Pro Phe Val Val Gln Ile Arg
210 215 220
Asp Met Glu Thr His Gln Pro Leu Glu Asn Val Tyr Val Gly Asp Ile
225 230 235 240
Gly Pro Lys Phe Gly Tyr Asn Thr Met Asp Asn Gly Phe Leu Leu Phe
245 250 255
Asn Lys Leu Lys Ile Pro His Val Asn Met Leu Ala Arg Phe Ala Gln
260 265 270
Val Asp Lys Ala Thr Asn Lys Tyr Ile Arg Pro Ala Ser Pro Ser Leu
275 280 285
Met Tyr Gly Thr Met Thr Trp Val Arg Ser Asn Ile Val Leu Gln Ala
290 295 300
Gly Gly Val Leu Ala Arg Gly Val Thr Ile Ala Val Arg Tyr Cys Ala
305 310 315 320
Val Arg Arg Gln Phe Gln Asp Arg Asp Ala Lys Ala Asn Ala Glu Glu
325 330 335
Asn Gln Val Leu Asn Tyr Lys Met Val Gln Ile Arg Leu Leu Pro Leu
340 345 350
Leu Ala Ala Met Tyr Ala Leu His Phe Thr Gly Arg Gly Met Met Arg
355 360 365
Leu Tyr Glu Glu Asn Gln Glu Arg Met Lys Ala Ala Ala Gln Ala Asp
370 375 380
Gln Glu Lys Arg Gly Ala Gly Pro Glu Gln Leu Arg Ala Gly Ser Asp
385 390 395 400
Leu Leu Ala Asp Leu His Ala Thr Ser Cys Gly Leu Lys Ala Leu Ala
405 410 415
Ser Thr Thr Ala Gly Glu Gly Leu Glu Val Cys Arg Arg Ala Cys Gly
420 425 430
Gly His Gly Tyr Ser Asn Tyr Ser Gly Ile Gly Pro Trp Tyr Ala Asp
435 440 445
Tyr Leu Pro Thr Leu Thr Trp Glu Gly Asp Asn Tyr Met Leu Thr Gln
450 455 460
Gln Val Ala Arg Tyr Leu Leu Lys Ser Ala Arg Ala Val Leu Ala Gly
465 470 475 480
Lys Gly Thr Ala Asn Asp Thr Ser Arg Ile Leu Gln Ala Tyr Leu Ala
485 490 495
Arg Arg Asp Lys Gly Ala Ser Phe Asp Ile Leu Gly Asn Asp Ala Asp
500 505 510
Ile Val Ala Ala Phe Ala Trp Arg Thr Ala His Leu Thr Phe Glu Thr
515 520 525
Leu Lys Tyr Arg Asp Val Glu Lys Arg Ser Trp Asn Ser Leu Leu Ile
530 535 540
Asn Phe Trp Arg Leu Ser Thr Ala Leu Ser Gln Tyr Leu Val Val Lys
545 550 555 560
Asn Phe Tyr Glu Ala Val Asn Ser Pro Glu Ile Arg Ser Ser Leu Asp
565 570 575
Lys Asp Thr Ala Ser Thr Leu Arg Ser Leu Phe Arg Leu His Ala Leu
580 585 590
His Thr Leu Asp Arg Glu Ala Ser Glu Phe Phe Ser Ser Ala Ala Val
595 600 605
Thr Val Arg Gln Ile Gly Leu Thr Gln Thr Ser Glu Val Pro Lys Leu
610 615 620
Leu Asp Glu Ile Arg Pro His Ala Val Arg Leu Val Asp Ser Trp Lys
625 630 635 640
Ile Pro Asp Trp Gln Leu Asp Ser Ala Leu Gly Arg Ser Asp Gly Asp
645 650 655
Val Tyr Pro Asp Leu Phe Lys Arg Ala Ser Met Gln Asn Pro Val Asn
660 665 670
Asp Leu Val Phe Asp Pro Tyr Pro Trp Asn Glu Asn Val Leu Lys Asn
675 680 685
Ala Gly Glu Ile Lys Ser Lys Leu
690 695
<210> 46
<211> 1977
<212> DNA
<213> Artificial sequence
<220>
<223> codon-optimized nucleotide sequence
<220>
<221> misc_feature
<222> (1)..(1977)
<223> DNA
Codon-optimised sequence of peroxisomal oxidase, Cucurbita maxima
<400> 46
atggccgctg gcaaggccaa ggctaagatc gaggtggaca tgggatctct gtctctgtac 60
atgcgaggca agcaccgaga gatccaagag cgagtgttcg agtacttcaa ctctcgaccc 120
gagctgcaga cccctgtggg catctctatg gccgaccacc gagagctgtg catgaagcag 180
ctggtcggcc tggtgcgaga ggccggcatt cgacccttcc gattcgtgaa cgaggacccc 240
gccaagtact tcgccatcat ggaagccgtg ggctctgtgg acgtgtctct ggccatcaag 300
atgggcgtgc agttctctct gtggggcggc tctgtgatca acctgggcac caagaagcac 360
cgggaccgat tcttcgacgg catcgacaac gtggactacc ccggctgctt cgccatgact 420
gagctgcacc acggctctaa cgtgcagggc ctgcagacca ccgccacttt cgaccccatc 480
accgacgagt tcatcatcaa cacccctaac gacggcgcca tcaagtggtg gatcggcaac 540
gccgccgtcc acggcaagtt cgccaccgtg ttcgccaagc tggtgctgcc cactcacgac 600
tctcgaaaga ccgccgacat gggagtgcac gccttcatcg tgcccatccg agatctgaag 660
tctcacaaga ccctgcctgg catcgagatc cacgactgcg gccacaaggt gggcctgaac 720
ggcgtggaca acggcgccct gcgattccga tctgtgcgaa ttccccgaga caacctgctg 780
aaccgattcg gcgaggtgtc tcgagatggc aagtacaagt cctctctgcc ctctatcaac 840
aagcgattcg ccgccactct gggcgagctg gttggcggcc gagtcggact ggcctactct 900
tctgcctctg tgctgaagat cgcctctact atcgccatcc gatactccct gctgcgacag 960
cagttcggcc ctcctaagca gcccgaggtg tccatcctgg actaccagtc tcagcagcac 1020
aagctgatgc ccatgctggc ctctacctac gccttccact tctctaccat gcagctcgtc 1080
gagaagtacg cccagatgaa gaagacccac gacgaggaac tggtgggcga cgtgcacgcc 1140
ctgtctgccg gcctgaaggc ctacgtgacc tcttacaccg ccaagtctct gtctacctgc 1200
cgagaggcct gtggcggcca cggatacgcc gtggtcaacc gatttggcac cctgcgaaac 1260
gaccacgaca tcttccagac cttcgagggc gacaacaccg tgctgctcca gcaggtcgcc 1320
gcctacctgc tcaagcagta ccaagagaag ttccaaggcg gcaccctggc cgtgacctgg 1380
aactacctgc gagaatctat gaacacctac ctctcgcagc ccaaccctgt gaccgctcga 1440
tgggagtctg ccgaccatct gcgagatccc aagtttcagc tggacgcttt ccagtaccga 1500
acctctcgac tgctgcagtc tgtggccgtg cgactgcgaa agcacaccaa gaacctggga 1560
tctttcggcg cctggaaccg atgcctgaac catctgctga ccctggctga gtctcacatc 1620
gagtctgtga ttctggccca gttcatcgag tccgtgcaga gatgtcccaa cgctaacacc 1680
caggctaccc tgaagctggt gtgcgacctg tacgctctgg accgaatctg gaacgacatc 1740
ggcacctacc gaaacgtcga ctacgtggct cccaacaagg caaaggccat ccacaagctc 1800
accgagtacc tgtgcttcca ggtgcgaaac attgcccaag agctggtgga cgccttcgac 1860
ctgcctgacc acgtgactcg agcccctatt gccatgaagt ctaacgccta ctctcagtac 1920
acccagtaca tcggcttcga ccagattacc tctgtgggat cttcgtctaa gctgtag 1977
<210> 47
<211> 658
<212> PRT
<213> Cucurbita maxima
<400> 47
Met Ala Ala Gly Lys Ala Lys Ala Lys Ile Glu Val Asp Met Gly Ser
1 5 10 15
Leu Ser Leu Tyr Met Arg Gly Lys His Arg Glu Ile Gln Glu Arg Val
20 25 30
Phe Glu Tyr Phe Asn Ser Arg Pro Glu Leu Gln Thr Pro Val Gly Ile
35 40 45
Ser Met Ala Asp His Arg Glu Leu Cys Met Lys Gln Leu Val Gly Leu
50 55 60
Val Arg Glu Ala Gly Ile Arg Pro Phe Arg Phe Val Asn Glu Asp Pro
65 70 75 80
Ala Lys Tyr Phe Ala Ile Met Glu Ala Val Gly Ser Val Asp Val Ser
85 90 95
Leu Ala Ile Lys Met Gly Val Gln Phe Ser Leu Trp Gly Gly Ser Val
100 105 110
Ile Asn Leu Gly Thr Lys Lys His Arg Asp Arg Phe Phe Asp Gly Ile
115 120 125
Asp Asn Val Asp Tyr Pro Gly Cys Phe Ala Met Thr Glu Leu His His
130 135 140
Gly Ser Asn Val Gln Gly Leu Gln Thr Thr Ala Thr Phe Asp Pro Ile
145 150 155 160
Thr Asp Glu Phe Ile Ile Asn Thr Pro Asn Asp Gly Ala Ile Lys Trp
165 170 175
Trp Ile Gly Asn Ala Ala Val His Gly Lys Phe Ala Thr Val Phe Ala
180 185 190
Lys Leu Val Leu Pro Thr His Asp Ser Arg Lys Thr Ala Asp Met Gly
195 200 205
Val His Ala Phe Ile Val Pro Ile Arg Asp Leu Lys Ser His Lys Thr
210 215 220
Leu Pro Gly Ile Glu Ile His Asp Cys Gly His Lys Val Gly Leu Asn
225 230 235 240
Gly Val Asp Asn Gly Ala Leu Arg Phe Arg Ser Val Arg Ile Pro Arg
245 250 255
Asp Asn Leu Leu Asn Arg Phe Gly Glu Val Ser Arg Asp Gly Lys Tyr
260 265 270
Lys Ser Ser Leu Pro Ser Ile Asn Lys Arg Phe Ala Ala Thr Leu Gly
275 280 285
Glu Leu Val Gly Gly Arg Val Gly Leu Ala Tyr Ser Ser Ala Ser Val
290 295 300
Leu Lys Ile Ala Ser Thr Ile Ala Ile Arg Tyr Ser Leu Leu Arg Gln
305 310 315 320
Gln Phe Gly Pro Pro Lys Gln Pro Glu Val Ser Ile Leu Asp Tyr Gln
325 330 335
Ser Gln Gln His Lys Leu Met Pro Met Leu Ala Ser Thr Tyr Ala Phe
340 345 350
His Phe Ser Thr Met Gln Leu Val Glu Lys Tyr Ala Gln Met Lys Lys
355 360 365
Thr His Asp Glu Glu Leu Val Gly Asp Val His Ala Leu Ser Ala Gly
370 375 380
Leu Lys Ala Tyr Val Thr Ser Tyr Thr Ala Lys Ser Leu Ser Thr Cys
385 390 395 400
Arg Glu Ala Cys Gly Gly His Gly Tyr Ala Val Val Asn Arg Phe Gly
405 410 415
Thr Leu Arg Asn Asp His Asp Ile Phe Gln Thr Phe Glu Gly Asp Asn
420 425 430
Thr Val Leu Leu Gln Gln Val Ala Ala Tyr Leu Leu Lys Gln Tyr Gln
435 440 445
Glu Lys Phe Gln Gly Gly Thr Leu Ala Val Thr Trp Asn Tyr Leu Arg
450 455 460
Glu Ser Met Asn Thr Tyr Leu Ser Gln Pro Asn Pro Val Thr Ala Arg
465 470 475 480
Trp Glu Ser Ala Asp His Leu Arg Asp Pro Lys Phe Gln Leu Asp Ala
485 490 495
Phe Gln Tyr Arg Thr Ser Arg Leu Leu Gln Ser Val Ala Val Arg Leu
500 505 510
Arg Lys His Thr Lys Asn Leu Gly Ser Phe Gly Ala Trp Asn Arg Cys
515 520 525
Leu Asn His Leu Leu Thr Leu Ala Glu Ser His Ile Glu Ser Val Ile
530 535 540
Leu Ala Gln Phe Ile Glu Ser Val Gln Arg Cys Pro Asn Ala Asn Thr
545 550 555 560
Gln Ala Thr Leu Lys Leu Val Cys Asp Leu Tyr Ala Leu Asp Arg Ile
565 570 575
Trp Asn Asp Ile Gly Thr Tyr Arg Asn Val Asp Tyr Val Ala Pro Asn
580 585 590
Lys Ala Lys Ala Ile His Lys Leu Thr Glu Tyr Leu Cys Phe Gln Val
595 600 605
Arg Asn Ile Ala Gln Glu Leu Val Asp Ala Phe Asp Leu Pro Asp His
610 615 620
Val Thr Arg Ala Pro Ile Ala Met Lys Ser Asn Ala Tyr Ser Gln Tyr
625 630 635 640
Thr Gln Tyr Ile Gly Phe Asp Gln Ile Thr Ser Val Gly Ser Ser Ser
645 650 655
Lys Leu
<210> 48
<211> 2019
<212> DNA
<213> Artificial sequence
<220>
<223> codon-optimized nucleotide sequence
<220>
<221> misc_feature
<222> (1)..(2019)
<223> DNA Codon-optimised sequence of peroxisomal oxidase, Homo
sapiens
<400> 48
atgaaccccg acctgcgacg agagcgagac tctgcctctt tcaaccccga gctgctgacc 60
cacatcctgg acggctctcc cgaaaagacc cgacgacgac gagaaatcga gaacatgatc 120
ctgaacgacc ccgacttcca gcacgaggac ctgaactttc tgacccgatc tcagcgatac 180
gaggtggccg tgcgaaagtc tgccatcatg gtgaagaaga tgcgagagtt cggaatcgct 240
gaccccgacg agatcatgtg gttcaagaac ttcgtgcacc gaggacgacc cgagcctctg 300
gacctgcacc tgggcatgtt tctgcccact ctgctgcacc aggccaccgc cgagcagcaa 360
gagcgattct tcatgcccgc ctggaacctc gagatcatcg gcacctacgc tcagaccgag 420
atgggccacg gcacccacct ccgaggactc gagactaccg ccacctacga tcccgagact 480
caagagttca tcctgaactc tcccaccgtg acctctatca agtggtggcc cggtggactg 540
ggcaagacct ctaaccacgc catcgtgctg gcccagctga tcaccaaggg caagtgctac 600
ggcctgcacg ccttcatcgt gcccatccga gagatcggaa cccacaagcc tctgcctggc 660
atcaccgtgg gcgacatcgg ccccaagttc ggctacgacg agattgacaa cggctacctg 720
aagatggaca accaccgaat tcctcgagag aacatgctga tgaagtacgc ccaggtgaag 780
cccgacggaa cctacgtgaa gcccctgtct aacaagctga cctacggaac catggtgttc 840
gtgcgatctt tcctggtcgg cgaggccgct cgagccctgt ccaaggcctg caccattgcc 900
atccgatact ctgccgtgcg acaccagtct gagatcaagc ccggcgagcc tgagcctcag 960
atcctggact ttcagaccca gcagtacaag ctgttccctc tgctggccac cgcttacgcc 1020
ttccagttcg tgggcgccta catgaaggaa acctaccatc gaatcaacga aggcatcggc 1080
cagggcgacc tgtctgagct gcccgaactg cacgccctga ccgccggact gaaggctttc 1140
acctcttgga ccgccaacac cggcatcgag gcctgccgaa tggcctgtgg cggccacggc 1200
tactctcact gctctggact gcccaacatc tacgtgaact tcaccccttc gtgtaccttc 1260
gagggcgaga acaccgtgat gatgctgcag accgctcgat tcctcatgaa gtcttacgac 1320
caggtgcact ctggcaagct ggtgtgcggc atggtgtctt acctgaacga tctgccctct 1380
cagcgaattc agcctcagca ggttgccgtg tggcccacca tggtcgacat caactctccc 1440
gagtctctga ccgaggccta caagctgcga gctgctcgac tggtcgagat cgccgccaag 1500
aacctgcaga aggaagtcat ccaccgaaag tctaaggaag tggcttggaa cctgacctct 1560
gtggacctgg tgcgagcttc tgaggcccac tgccactacg tggtggtgaa gctgttctct 1620
gagaagctgc tgaagatcca ggacaaggcc atccaggccg tgctgcgatc tctgtgcctg 1680
ctgtactctc tgtacggcat ctctcagaac gccggcgact tcctgcaggg ctctatcatg 1740
actgagcccc agattaccca ggtcaaccag cgagtgaagg aactgctcac cctgatccga 1800
tctgacgccg tggctctggt ggacgccttc gactttcagg acgtgaccct gggctctgtg 1860
ctgggccgat acgacggcaa cgtgtacgag aacctgttcg agtgggccaa gaactcgccc 1920
ctgaacaagg ccgaggtgca cgagtcttac aagcacctga agtctctgca gtctaagctg 1980
gaccagatta cttctgtggg atcttcttcg aagctgtag 2019
<210> 49
<211> 672
<212> PRT
<213> Homo sapiens
<400> 49
Met Asn Pro Asp Leu Arg Arg Glu Arg Asp Ser Ala Ser Phe Asn Pro
1 5 10 15
Glu Leu Leu Thr His Ile Leu Asp Gly Ser Pro Glu Lys Thr Arg Arg
20 25 30
Arg Arg Glu Ile Glu Asn Met Ile Leu Asn Asp Pro Asp Phe Gln His
35 40 45
Glu Asp Leu Asn Phe Leu Thr Arg Ser Gln Arg Tyr Glu Val Ala Val
50 55 60
Arg Lys Ser Ala Ile Met Val Lys Lys Met Arg Glu Phe Gly Ile Ala
65 70 75 80
Asp Pro Asp Glu Ile Met Trp Phe Lys Asn Phe Val His Arg Gly Arg
85 90 95
Pro Glu Pro Leu Asp Leu His Leu Gly Met Phe Leu Pro Thr Leu Leu
100 105 110
His Gln Ala Thr Ala Glu Gln Gln Glu Arg Phe Phe Met Pro Ala Trp
115 120 125
Asn Leu Glu Ile Ile Gly Thr Tyr Ala Gln Thr Glu Met Gly His Gly
130 135 140
Thr His Leu Arg Gly Leu Glu Thr Thr Ala Thr Tyr Asp Pro Glu Thr
145 150 155 160
Gln Glu Phe Ile Leu Asn Ser Pro Thr Val Thr Ser Ile Lys Trp Trp
165 170 175
Pro Gly Gly Leu Gly Lys Thr Ser Asn His Ala Ile Val Leu Ala Gln
180 185 190
Leu Ile Thr Lys Gly Lys Cys Tyr Gly Leu His Ala Phe Ile Val Pro
195 200 205
Ile Arg Glu Ile Gly Thr His Lys Pro Leu Pro Gly Ile Thr Val Gly
210 215 220
Asp Ile Gly Pro Lys Phe Gly Tyr Asp Glu Ile Asp Asn Gly Tyr Leu
225 230 235 240
Lys Met Asp Asn His Arg Ile Pro Arg Glu Asn Met Leu Met Lys Tyr
245 250 255
Ala Gln Val Lys Pro Asp Gly Thr Tyr Val Lys Pro Leu Ser Asn Lys
260 265 270
Leu Thr Tyr Gly Thr Met Val Phe Val Arg Ser Phe Leu Val Gly Glu
275 280 285
Ala Ala Arg Ala Leu Ser Lys Ala Cys Thr Ile Ala Ile Arg Tyr Ser
290 295 300
Ala Val Arg His Gln Ser Glu Ile Lys Pro Gly Glu Pro Glu Pro Gln
305 310 315 320
Ile Leu Asp Phe Gln Thr Gln Gln Tyr Lys Leu Phe Pro Leu Leu Ala
325 330 335
Thr Ala Tyr Ala Phe Gln Phe Val Gly Ala Tyr Met Lys Glu Thr Tyr
340 345 350
His Arg Ile Asn Glu Gly Ile Gly Gln Gly Asp Leu Ser Glu Leu Pro
355 360 365
Glu Leu His Ala Leu Thr Ala Gly Leu Lys Ala Phe Thr Ser Trp Thr
370 375 380
Ala Asn Thr Gly Ile Glu Ala Cys Arg Met Ala Cys Gly Gly His Gly
385 390 395 400
Tyr Ser His Cys Ser Gly Leu Pro Asn Ile Tyr Val Asn Phe Thr Pro
405 410 415
Ser Cys Thr Phe Glu Gly Glu Asn Thr Val Met Met Leu Gln Thr Ala
420 425 430
Arg Phe Leu Met Lys Ser Tyr Asp Gln Val His Ser Gly Lys Leu Val
435 440 445
Cys Gly Met Val Ser Tyr Leu Asn Asp Leu Pro Ser Gln Arg Ile Gln
450 455 460
Pro Gln Gln Val Ala Val Trp Pro Thr Met Val Asp Ile Asn Ser Pro
465 470 475 480
Glu Ser Leu Thr Glu Ala Tyr Lys Leu Arg Ala Ala Arg Leu Val Glu
485 490 495
Ile Ala Ala Lys Asn Leu Gln Lys Glu Val Ile His Arg Lys Ser Lys
500 505 510
Glu Val Ala Trp Asn Leu Thr Ser Val Asp Leu Val Arg Ala Ser Glu
515 520 525
Ala His Cys His Tyr Val Val Val Lys Leu Phe Ser Glu Lys Leu Leu
530 535 540
Lys Ile Gln Asp Lys Ala Ile Gln Ala Val Leu Arg Ser Leu Cys Leu
545 550 555 560
Leu Tyr Ser Leu Tyr Gly Ile Ser Gln Asn Ala Gly Asp Phe Leu Gln
565 570 575
Gly Ser Ile Met Thr Glu Pro Gln Ile Thr Gln Val Asn Gln Arg Val
580 585 590
Lys Glu Leu Leu Thr Leu Ile Arg Ser Asp Ala Val Ala Leu Val Asp
595 600 605
Ala Phe Asp Phe Gln Asp Val Thr Leu Gly Ser Val Leu Gly Arg Tyr
610 615 620
Asp Gly Asn Val Tyr Glu Asn Leu Phe Glu Trp Ala Lys Asn Ser Pro
625 630 635 640
Leu Asn Lys Ala Glu Val His Glu Ser Tyr Lys His Leu Lys Ser Leu
645 650 655
Gln Ser Lys Leu Asp Gln Ile Thr Ser Val Gly Ser Ser Ser Lys Leu
660 665 670
<210> 50
<211> 2148
<212> DNA
<213> Artificial sequence
<220>
<223> codon-optimized nucleotide sequence
<220>
<221> misc_feature
<222> (1)..(2148)
<223> DNA Codon-optimised sequence of peroxisomal oxidase,
Paenarthrobacter ureafaciens
<400> 50
atgaccgagg tggtggaccg agcctcttct cccgcctctc ctggctctac caccgccgct 60
gccgacggcg ccaaggtggc cgtcgagcct cgagtggacg tggccgctct gggcgagcag 120
ctcctcggcc gatgggccga catccgactg cacgcccgag atctggccgg acgagaggtg 180
gtgcagaagg tcgagggact gacccacacc gagcaccgat ctcgagtgtt cggccagctg 240
aagtacctgg tggacaacaa cgccgtgcac cgagctttcc cttctcgact cggcggatct 300
gacgaccacg gcggcaacat tgccggcttc gaggaactgg tgactgctga cccctcgctg 360
cagatcaagg ccggcgtcca gtggggcctg ttcggctctg ccgtgatgca cctgggcacc 420
cgagagcacc acgacaagtg gctgcccggc atcatgtctc tcgagatccc cggctgcttc 480
gccatgaccg agactggcca cggctctgac gtggcctcta tcgccaccac cgccacctac 540
gacgaagaga ctcaagagtt cgtgatcgac acacccttcc gagccgcctg gaaggactac 600
atcggcaacg ccgccaacga cggcctggcc gccgtcgtgt tcgctcagct gatcacccga 660
aaggtgaacc acggcgtcca cgccttctac gtggacctgc gagatcccgc caccggcgac 720
tttctgcccg gaatcggcgg cgaggacgac ggcatcaagg gcggcctgaa cggcatcgac 780
aacggacgac tgcacttcac caacgtgcga attccccgaa ctaacctgct gaaccgatac 840
ggcgacgtgg ctgtggacgg cacctactct tctaccatcg agtctcccgg ccgacgattc 900
ttcaccatgc tgggaaccct ggtgcagggc cgagtgtctc tggacggcgc tgccgtggcc 960
gcctctaagg tggccctgca gtctgccatc cactacgccg ccgagcgacg acagttcaac 1020
gccacctctc ctaccgagga agaggtgctg ctggactacc agcgacatca gcgacgactg 1080
tttacccgac tggctactac ctacgctgcc tctttcgccc acgaacagct gctgcaaaag 1140
ttcgacgacg tgttctctgg cgcccacgac accgacgccg accgacagga cctcgagact 1200
ctggctgccg ctctgaagcc cctgtctacc tggcacgccc tggacaccct gcaagagtgc 1260
cgagaggcct gcggcggagc cggcttcctg atcgagaacc gattcgcctc tctgcgagct 1320
gacctggacg tgtacgtgac cttcgagggc gacaacaccg tgctgctgca gctggtggcc 1380
aagcgactgc tggccgacta cgccaaggaa ttccgaggcg ccaacttcgg cgtgctggcc 1440
cgatacgtcg tggaccaggc cgctggcgtg gctctgcacc gaaccggcct gcgacaggtg 1500
gcccagttcg tggccgactc cggctctgtg cagaagtctg ccctggctct gcgagatgag 1560
gaaggccagc gaaccctgct gaccgaccga gtgcagtcta tggtggccga ggtgggcgct 1620
gccctgaagg gcgctggcaa gctgccccag caccaggctg ctgccctgtt caaccagcat 1680
cagaacgagc tgatcgaggc cgctcaggcc cacgccgagc tgctccagtg ggaagccttc 1740
accgaggctc tggccaaggt cgacgacgcc ggcaccaagg aagtgctgac ccgactgcgg 1800
gacctgttcg gactgtctct gattgagaag cacctgtctt ggtatctgat gaacggccga 1860
ctgtctatgc agcggggacg aaccgtgggc acctacatca accgactgct cgtgaagatt 1920
cgaccccacg ctctggacct ggtcgacgcc ttcggctacg gcgctgagca tctgcgagcc 1980
gccattgcca ccggtgccga ggccactcga caggacgagg cccgaaccta cttccgacag 2040
cagcgagcct ctggatctgc ccctgccgac gaaaagaccc tgctggccat taaggccggc 2100
aagtcccgag atcagattac ctctgtggga tcttcttcga agctgtag 2148
<210> 51
<211> 715
<212> PRT
<213> Paenarthrobacter ureafaciens
<400> 51
Met Thr Glu Val Val Asp Arg Ala Ser Ser Pro Ala Ser Pro Gly Ser
1 5 10 15
Thr Thr Ala Ala Ala Asp Gly Ala Lys Val Ala Val Glu Pro Arg Val
20 25 30
Asp Val Ala Ala Leu Gly Glu Gln Leu Leu Gly Arg Trp Ala Asp Ile
35 40 45
Arg Leu His Ala Arg Asp Leu Ala Gly Arg Glu Val Val Gln Lys Val
50 55 60
Glu Gly Leu Thr His Thr Glu His Arg Ser Arg Val Phe Gly Gln Leu
65 70 75 80
Lys Tyr Leu Val Asp Asn Asn Ala Val His Arg Ala Phe Pro Ser Arg
85 90 95
Leu Gly Gly Ser Asp Asp His Gly Gly Asn Ile Ala Gly Phe Glu Glu
100 105 110
Leu Val Thr Ala Asp Pro Ser Leu Gln Ile Lys Ala Gly Val Gln Trp
115 120 125
Gly Leu Phe Gly Ser Ala Val Met His Leu Gly Thr Arg Glu His His
130 135 140
Asp Lys Trp Leu Pro Gly Ile Met Ser Leu Glu Ile Pro Gly Cys Phe
145 150 155 160
Ala Met Thr Glu Thr Gly His Gly Ser Asp Val Ala Ser Ile Ala Thr
165 170 175
Thr Ala Thr Tyr Asp Glu Glu Thr Gln Glu Phe Val Ile Asp Thr Pro
180 185 190
Phe Arg Ala Ala Trp Lys Asp Tyr Ile Gly Asn Ala Ala Asn Asp Gly
195 200 205
Leu Ala Ala Val Val Phe Ala Gln Leu Ile Thr Arg Lys Val Asn His
210 215 220
Gly Val His Ala Phe Tyr Val Asp Leu Arg Asp Pro Ala Thr Gly Asp
225 230 235 240
Phe Leu Pro Gly Ile Gly Gly Glu Asp Asp Gly Ile Lys Gly Gly Leu
245 250 255
Asn Gly Ile Asp Asn Gly Arg Leu His Phe Thr Asn Val Arg Ile Pro
260 265 270
Arg Thr Asn Leu Leu Asn Arg Tyr Gly Asp Val Ala Val Asp Gly Thr
275 280 285
Tyr Ser Ser Thr Ile Glu Ser Pro Gly Arg Arg Phe Phe Thr Met Leu
290 295 300
Gly Thr Leu Val Gln Gly Arg Val Ser Leu Asp Gly Ala Ala Val Ala
305 310 315 320
Ala Ser Lys Val Ala Leu Gln Ser Ala Ile His Tyr Ala Ala Glu Arg
325 330 335
Arg Gln Phe Asn Ala Thr Ser Pro Thr Glu Glu Glu Val Leu Leu Asp
340 345 350
Tyr Gln Arg His Gln Arg Arg Leu Phe Thr Arg Leu Ala Thr Thr Tyr
355 360 365
Ala Ala Ser Phe Ala His Glu Gln Leu Leu Gln Lys Phe Asp Asp Val
370 375 380
Phe Ser Gly Ala His Asp Thr Asp Ala Asp Arg Gln Asp Leu Glu Thr
385 390 395 400
Leu Ala Ala Ala Leu Lys Pro Leu Ser Thr Trp His Ala Leu Asp Thr
405 410 415
Leu Gln Glu Cys Arg Glu Ala Cys Gly Gly Ala Gly Phe Leu Ile Glu
420 425 430
Asn Arg Phe Ala Ser Leu Arg Ala Asp Leu Asp Val Tyr Val Thr Phe
435 440 445
Glu Gly Asp Asn Thr Val Leu Leu Gln Leu Val Ala Lys Arg Leu Leu
450 455 460
Ala Asp Tyr Ala Lys Glu Phe Arg Gly Ala Asn Phe Gly Val Leu Ala
465 470 475 480
Arg Tyr Val Val Asp Gln Ala Ala Gly Val Ala Leu His Arg Thr Gly
485 490 495
Leu Arg Gln Val Ala Gln Phe Val Ala Asp Ser Gly Ser Val Gln Lys
500 505 510
Ser Ala Leu Ala Leu Arg Asp Glu Glu Gly Gln Arg Thr Leu Leu Thr
515 520 525
Asp Arg Val Gln Ser Met Val Ala Glu Val Gly Ala Ala Leu Lys Gly
530 535 540
Ala Gly Lys Leu Pro Gln His Gln Ala Ala Ala Leu Phe Asn Gln His
545 550 555 560
Gln Asn Glu Leu Ile Glu Ala Ala Gln Ala His Ala Glu Leu Leu Gln
565 570 575
Trp Glu Ala Phe Thr Glu Ala Leu Ala Lys Val Asp Asp Ala Gly Thr
580 585 590
Lys Glu Val Leu Thr Arg Leu Arg Asp Leu Phe Gly Leu Ser Leu Ile
595 600 605
Glu Lys His Leu Ser Trp Tyr Leu Met Asn Gly Arg Leu Ser Met Gln
610 615 620
Arg Gly Arg Thr Val Gly Thr Tyr Ile Asn Arg Leu Leu Val Lys Ile
625 630 635 640
Arg Pro His Ala Leu Asp Leu Val Asp Ala Phe Gly Tyr Gly Ala Glu
645 650 655
His Leu Arg Ala Ala Ile Ala Thr Gly Ala Glu Ala Thr Arg Gln Asp
660 665 670
Glu Ala Arg Thr Tyr Phe Arg Gln Gln Arg Ala Ser Gly Ser Ala Pro
675 680 685
Ala Asp Glu Lys Thr Leu Leu Ala Ile Lys Ala Gly Lys Ser Arg Asp
690 695 700
Gln Ile Thr Ser Val Gly Ser Ser Ser Lys Leu
705 710 715
<210> 52
<211> 2022
<212> DNA
<213> Artificial sequence
<220>
<223> codon-optimized nucleotide sequence
<220>
<221> misc_feature
<222> (1)..(2022)
<223> DNA Codon-optimised sequence of peroxisomal oxidase, Rattus
norvegicus
<400> 52
atgaaccccg acctgcgaaa ggaacgagcc tctgccactt tcaaccccga gctgatcacc 60
cacatcctgg acggctctcc cgagaacacc cgacgacgac gagaaatcga gaacctgatc 120
ctgaacgacc ccgacttcca gcacgaggac tacaactttc tgacccgatc tcagcgatac 180
gaggtggccg tgaagaagtc tgccaccatg gtcaagaaga tgcgagagta cggcatctct 240
gaccccgaag agatcatgtg gttcaagaac tctgtgcacc gaggacaccc tgagcctctg 300
gacctgcacc tgggcatgtt tctgcccact ctgctgcacc aggctaccgc cgagcagcaa 360
gagcgattct tcatgcccgc ctggaacctc gagatcaccg gcacctacgc tcagaccgag 420
atgggccacg gcacccacct ccgaggactc gagactaccg ccacttacga ccccaagact 480
caagagttca tcctgaactc tcccaccgtg acctctatca agtggtggcc cggtggcctg 540
ggcaagacct ctaaccacgc catcgtgctg gcccagctga ttacccaggg cgagtgctac 600
ggcctgcacg ccttcgtggt gcccatccga gagatcggaa cccacaagcc actgcctggc 660
atcaccgtgg gcgacatcgg ccccaagttc ggctacgagg aaatggacaa cggctacctg 720
aagatggaca actaccgaat tcctcgagag aacatgctga tgaagtacgc ccaggtgaag 780
cccgacggaa cctacgtgaa gcccctgtct aacaagctga cctacggaac catggtgttc 840
gtgcgatctt tcctggtggg caacgccgct cagtctctgt ctaaggcctg caccattgcc 900
atccgatact ctgccgtgcg acgacagtct gagatcaagc agtctgagcc cgagcctcag 960
atcctggact ttcagaccca gcagtacaag ctgttccctc tgctggccac cgcctacgcc 1020
ttccacttcg tgggccgata tatgaaggaa acctacctgc gaatcaacga gtctatcggc 1080
cagggcgacc tgtctgagct gcccgagctg cacgccctga ccgccggact gaaggctttc 1140
accacctgga ccgccaacgc cggcatcgag gaatgccgaa tggcctgtgg cggccacggc 1200
tactctcact cctctggcat ccccaacatc tacgtgacct tcactcccgc ctgcaccttc 1260
gagggtgaga acaccgtgat gatgctgcag accgctcgat tcctgatgaa gatctacgac 1320
caggtgcgat ctggcaagct ggtcggcggc atggtgtctt acctgaacga tctgccctct 1380
cagcgaattc agcctcagca ggttgccgtg tggcccacta tggtggacat caactcgctc 1440
gagggcctga ccgaggccta caagctgcga gccgctcgac tggtcgagat cgccgccaag 1500
aacctgcaga cccacgtgtc tcaccgaaag tctaaggaag tggcttggaa cctgacctct 1560
gtggacctgg tgcgagcttc tgaggcccac tgccactacg tggtggtgaa ggtgttctct 1620
gacaagctgc ccaagatcca ggacaaggct gtccaggccg tgctgcgaaa cctgtgcctg 1680
ctgtactctc tgtacggaat ctctcagaag ggcggcgact tcctcgaggg ctctatcatc 1740
accggcgctc agctgtctca ggtcaacgct cgaatcctcg agctgctgac cctgattcga 1800
cccaacgccg tggctctggt ggacgctttc gacttcaagg acatgaccct gggctctgtg 1860
ctgggacgat acgacggcaa cgtgtacgag aacctcttcg agtgggccaa gaagtctccc 1920
ctgaacaaga ccgaggtgca cgagtcttac cacaagcacc tgaagcctct gcagtctaag 1980
ctggaccaga ttacctccgt gggatcttct tcgaagctgt ag 2022
<210> 53
<211> 673
<212> PRT
<213> Rattus norvegicus
<400> 53
Met Asn Pro Asp Leu Arg Lys Glu Arg Ala Ser Ala Thr Phe Asn Pro
1 5 10 15
Glu Leu Ile Thr His Ile Leu Asp Gly Ser Pro Glu Asn Thr Arg Arg
20 25 30
Arg Arg Glu Ile Glu Asn Leu Ile Leu Asn Asp Pro Asp Phe Gln His
35 40 45
Glu Asp Tyr Asn Phe Leu Thr Arg Ser Gln Arg Tyr Glu Val Ala Val
50 55 60
Lys Lys Ser Ala Thr Met Val Lys Lys Met Arg Glu Tyr Gly Ile Ser
65 70 75 80
Asp Pro Glu Glu Ile Met Trp Phe Lys Asn Ser Val His Arg Gly His
85 90 95
Pro Glu Pro Leu Asp Leu His Leu Gly Met Phe Leu Pro Thr Leu Leu
100 105 110
His Gln Ala Thr Ala Glu Gln Gln Glu Arg Phe Phe Met Pro Ala Trp
115 120 125
Asn Leu Glu Ile Thr Gly Thr Tyr Ala Gln Thr Glu Met Gly His Gly
130 135 140
Thr His Leu Arg Gly Leu Glu Thr Thr Ala Thr Tyr Asp Pro Lys Thr
145 150 155 160
Gln Glu Phe Ile Leu Asn Ser Pro Thr Val Thr Ser Ile Lys Trp Trp
165 170 175
Pro Gly Gly Leu Gly Lys Thr Ser Asn His Ala Ile Val Leu Ala Gln
180 185 190
Leu Ile Thr Gln Gly Glu Cys Tyr Gly Leu His Ala Phe Val Val Pro
195 200 205
Ile Arg Glu Ile Gly Thr His Lys Pro Leu Pro Gly Ile Thr Val Gly
210 215 220
Asp Ile Gly Pro Lys Phe Gly Tyr Glu Glu Met Asp Asn Gly Tyr Leu
225 230 235 240
Lys Met Asp Asn Tyr Arg Ile Pro Arg Glu Asn Met Leu Met Lys Tyr
245 250 255
Ala Gln Val Lys Pro Asp Gly Thr Tyr Val Lys Pro Leu Ser Asn Lys
260 265 270
Leu Thr Tyr Gly Thr Met Val Phe Val Arg Ser Phe Leu Val Gly Asn
275 280 285
Ala Ala Gln Ser Leu Ser Lys Ala Cys Thr Ile Ala Ile Arg Tyr Ser
290 295 300
Ala Val Arg Arg Gln Ser Glu Ile Lys Gln Ser Glu Pro Glu Pro Gln
305 310 315 320
Ile Leu Asp Phe Gln Thr Gln Gln Tyr Lys Leu Phe Pro Leu Leu Ala
325 330 335
Thr Ala Tyr Ala Phe His Phe Val Gly Arg Tyr Met Lys Glu Thr Tyr
340 345 350
Leu Arg Ile Asn Glu Ser Ile Gly Gln Gly Asp Leu Ser Glu Leu Pro
355 360 365
Glu Leu His Ala Leu Thr Ala Gly Leu Lys Ala Phe Thr Thr Trp Thr
370 375 380
Ala Asn Ala Gly Ile Glu Glu Cys Arg Met Ala Cys Gly Gly His Gly
385 390 395 400
Tyr Ser His Ser Ser Gly Ile Pro Asn Ile Tyr Val Thr Phe Thr Pro
405 410 415
Ala Cys Thr Phe Glu Gly Glu Asn Thr Val Met Met Leu Gln Thr Ala
420 425 430
Arg Phe Leu Met Lys Ile Tyr Asp Gln Val Arg Ser Gly Lys Leu Val
435 440 445
Gly Gly Met Val Ser Tyr Leu Asn Asp Leu Pro Ser Gln Arg Ile Gln
450 455 460
Pro Gln Gln Val Ala Val Trp Pro Thr Met Val Asp Ile Asn Ser Leu
465 470 475 480
Glu Gly Leu Thr Glu Ala Tyr Lys Leu Arg Ala Ala Arg Leu Val Glu
485 490 495
Ile Ala Ala Lys Asn Leu Gln Thr His Val Ser His Arg Lys Ser Lys
500 505 510
Glu Val Ala Trp Asn Leu Thr Ser Val Asp Leu Val Arg Ala Ser Glu
515 520 525
Ala His Cys His Tyr Val Val Val Lys Val Phe Ser Asp Lys Leu Pro
530 535 540
Lys Ile Gln Asp Lys Ala Val Gln Ala Val Leu Arg Asn Leu Cys Leu
545 550 555 560
Leu Tyr Ser Leu Tyr Gly Ile Ser Gln Lys Gly Gly Asp Phe Leu Glu
565 570 575
Gly Ser Ile Ile Thr Gly Ala Gln Leu Ser Gln Val Asn Ala Arg Ile
580 585 590
Leu Glu Leu Leu Thr Leu Ile Arg Pro Asn Ala Val Ala Leu Val Asp
595 600 605
Ala Phe Asp Phe Lys Asp Met Thr Leu Gly Ser Val Leu Gly Arg Tyr
610 615 620
Asp Gly Asn Val Tyr Glu Asn Leu Phe Glu Trp Ala Lys Lys Ser Pro
625 630 635 640
Leu Asn Lys Thr Glu Val His Glu Ser Tyr His Lys His Leu Lys Pro
645 650 655
Leu Gln Ser Lys Leu Asp Gln Ile Thr Ser Val Gly Ser Ser Ser Lys
660 665 670
Leu
<210> 54
<211> 1152
<212> DNA
<213> Yarrowia lipolytica
<400> 54
atggaaccgt tcaagctagc tcccacgccc gtcactctgc ccgagtactt tgcttttaaa 60
gaattcactc ctaagaaccc cgaacagggt gtgagatact tccactccgt catcaagccg 120
tggcgccctt tctcgtctcc tggcaccttt ggaggattct gtctgagcca gggagctctt 180
tgcgccgcct acacatgccc caagggcttt gttgtgcaca accagcactc gtacttcctt 240
cttccgggtc gttgggacgt gccgttccta tggagagtgg aatctgtgcg agacggccga 300
tcttactgca cccgagaagt caaggcgtac cagcccgatc tcggattcga attccccgag 360
tctccttacc aacagccctc tgacttcgac ttcacagacc ccgccagcaa aaaatggctc 420
gcctacacag cccattcctc catcaagcta ccccacaaag acaccatgtt ccacgaaaag 480
aagctacgac aggatttttt cgccaaaaac gtgcctggag gagctgaggg acacgatctg 540
gcacccgaca ttgacatccc catgtgggtg gactggtcca aggaccctgc taacggctac 600
aagctggaac ctcatccgat agagatgcgc aaggtggaca tggacaaggt gcttcctgca 660
gtcaacaagg gcaaggacgt ggccgagaga cgtcagctgt actttttccg agtgccctac 720
aagctgcctg acgacatgaa ctaccatgtg gcagccatgc tctatctgtc agatcgaaac 780
tcgctcttca cctgtatgaa cctgagagac aaggtgccca ctttggcgcg cctggcatcg 840
ctggaccatc agtttactat gcatgacatg cactctcgtg tggacgaggg ctggatgcct 900
atggagacct ggactgactg ggctggagac tgtcgaggac agtaccaggg ccgactattt 960
acagatgaag gcaagcttgt atgcacattt atgcaagacg gtctgattcg aaccgttgag 1020
gaggaccacg atgacgacga cgacaagaag gaggatgaca aggctgataa caccacccga 1080
caggttcctc gaagaagaaa gaagaagact cctgctcaga atttgtttct caagttcaaa 1140
gctgtgcttt aa 1152
<210> 55
<211> 630
<212> DNA
<213> Yarrowia lipolytica
<400> 55
atgtttcgtc acgcgatcag atcaattggc ctcgtgactc ctgtcagagt cattaccccc 60
actctacgtg cttctctggt tctcggggca gttcgttctc agagttcgca cgccaaaccc 120
caagcacccg attggatcca gaatctgctc gatgagcacg agggcaaagg atacttgctt 180
gccgacgctg ggctgccgtc tcagggcgtc tcttggggag aaattgactc cttccagcat 240
gttaacaaca aggtgtatct ggcttggttc gagaccgccc gtgttaacat gtttctcaag 300
tggggcacgg actttcagcg gttcatgagt ggccagtcgg tggcaccggt catgcggtcg 360
gtcaatctag cttggcgata ccccatcaaa ttccccgacc aggtgacggt cgtccacaaa 420
attgaccaga ttctcgatga ccggttcatt ctcaagggcg tcgtgatagg ccacaagtcc 480
aagaaggtgt gtgcacgaat tgaagaggtg attgtcgctg tcgattacac taagggtgcc 540
accaagtgtt ctattccgga cgatatgaga gagtttctgg agcagaaaaa gagagagcaa 600
ggcgcggggg agtatgatgc gcagatttag 630
<210> 56
<211> 1185
<212> DNA
<213> Artificial Sequence
<220>
<223> codon-optimized nucleotide sequence
<220>
<221> misc_feature
<222> (1)..(1185)
<223> Y. lipolytica codon-optimised nucleotide sequence of thioesterase
from Cuphea hookeriana ChFatB3
<400> 56
atggtggccg ctgccgcctc ttctgccttc ttctcggtgc ccactcctgg catctctccc 60
aagcctggca agttcggcaa cggcggcttc caggtgaagg ccaacgccaa cgctcacccc 120
tcgctgaagt ctggctctct cgagactgag gacgacacct cttcctcttc tccaccacct 180
cgaaccttca tcaaccagct gcctgactgg tctatgctgc tgtctgccat caccaccatc 240
ttcggagccg ccgagaagca gtggatgatg ctggaccgaa agtctaagcg acccgacatg 300
ctgatggaac ccttcggcgt ggactctatc gtgcaggacg gcgtgttctt ccgacagtct 360
ttctctatcc gatcttacga gattggcgcc gaccgaacca cctctatcga gactctgatg 420
aacatgtttc aagagacttc tctgaaccac tgcaagtcta acggcctgct gaacgacggc 480
ttcggacgaa cccctgagat gtgcaagaag ggcctgatct gggtcgtgac caagatgcag 540
gtcgaggtga acagataccc catctggggc gactctattg aggtcaacac ctgggtgtct 600
gagtctggca agaacggcat gggccgagac tggctgatct ctgactgctc taccggcgag 660
atcctggtgc gagccacctc tgtgtgggcc atgatgaacc agaagacccg acgactgtct 720
aagttcccat tcgaggtgcg acaagagatc gctcccaact tcgtcgactc tgtccccgtg 780
atcgaggacg accgaaagct gcacaagctg gacgtcaaga ccggcgactc catccacaac 840
ggactgaccc ctcgatggaa cgacctggac gtgaaccagc acgtgaacaa cgtgaagtac 900
atcggctgga tcctgaagtc ggtgcccacc gacgtgttcg aggcccaaga gctgtgcggc 960
gtgaccctcg agtaccgacg agagtgcgga cgagactccg tgatggaatc tgtgaccgct 1020
atggacccct ctaaagaagg cgaccgatct gtctaccagc acctcctgcg actcgaggac 1080
ggcgccgaca ttgccatcgg ccgaaccgag tggcgaccca agaacgctgg cgccaacggc 1140
gccatctcta ccggaaagac ctctaaccga aactctgtgt cttaa 1185
<210> 57
<211> 394
<212> PRT
<213> Cuphea hookeriana
<400> 57
Met Val Ala Ala Ala Ala Ser Ser Ala Phe Phe Ser Val Pro Thr Pro
1 5 10 15
Gly Ile Ser Pro Lys Pro Gly Lys Phe Gly Asn Gly Gly Phe Gln Val
20 25 30
Lys Ala Asn Ala Asn Ala His Pro Ser Leu Lys Ser Gly Ser Leu Glu
35 40 45
Thr Glu Asp Asp Thr Ser Ser Ser Ser Pro Pro Pro Arg Thr Phe Ile
50 55 60
Asn Gln Leu Pro Asp Trp Ser Met Leu Leu Ser Ala Ile Thr Thr Ile
65 70 75 80
Phe Gly Ala Ala Glu Lys Gln Trp Met Met Leu Asp Arg Lys Ser Lys
85 90 95
Arg Pro Asp Met Leu Met Glu Pro Phe Gly Val Asp Ser Ile Val Gln
100 105 110
Asp Gly Val Phe Phe Arg Gln Ser Phe Ser Ile Arg Ser Tyr Glu Ile
115 120 125
Gly Ala Asp Arg Thr Thr Ser Ile Glu Thr Leu Met Asn Met Phe Gln
130 135 140
Glu Thr Ser Leu Asn His Cys Lys Ser Asn Gly Leu Leu Asn Asp Gly
145 150 155 160
Phe Gly Arg Thr Pro Glu Met Cys Lys Lys Gly Leu Ile Trp Val Val
165 170 175
Thr Lys Met Gln Val Glu Val Asn Arg Tyr Pro Ile Trp Gly Asp Ser
180 185 190
Ile Glu Val Asn Thr Trp Val Ser Glu Ser Gly Lys Asn Gly Met Gly
195 200 205
Arg Asp Trp Leu Ile Ser Asp Cys Ser Thr Gly Glu Ile Leu Val Arg
210 215 220
Ala Thr Ser Val Trp Ala Met Met Asn Gln Lys Thr Arg Arg Leu Ser
225 230 235 240
Lys Phe Pro Phe Glu Val Arg Gln Glu Ile Ala Pro Asn Phe Val Asp
245 250 255
Ser Val Pro Val Ile Glu Asp Asp Arg Lys Leu His Lys Leu Asp Val
260 265 270
Lys Thr Gly Asp Ser Ile His Asn Gly Leu Thr Pro Arg Trp Asn Asp
275 280 285
Leu Asp Val Asn Gln His Val Asn Asn Val Lys Tyr Ile Gly Trp Ile
290 295 300
Leu Lys Ser Val Pro Thr Asp Val Phe Glu Ala Gln Glu Leu Cys Gly
305 310 315 320
Val Thr Leu Glu Tyr Arg Arg Glu Cys Gly Arg Asp Ser Val Met Glu
325 330 335
Ser Val Thr Ala Met Asp Pro Ser Lys Glu Gly Asp Arg Ser Val Tyr
340 345 350
Gln His Leu Leu Arg Leu Glu Asp Gly Ala Asp Ile Ala Ile Gly Arg
355 360 365
Thr Glu Trp Arg Pro Lys Asn Ala Gly Ala Asn Gly Ala Ile Ser Thr
370 375 380
Gly Lys Thr Ser Asn Arg Asn Ser Val Ser
385 390
<210> 58
<211> 5449
<212> DNA
<213> Artificial sequence
<220>
<223> Artificial sequence
<220>
<221> misc_feature
<222> (1)..(5549)
<223> Fusion of a truncated version of FAS1 from Y. lipolytica and a
truncated version of the thioesterase TesA from E. coli
<400> 58
gtgagtatcg accgaagcag gatgatctct acatgagata tgcaacgcgt acgtgattca 60
attgatccta acacagtacc ctaccacagg tgtcaacacc ccccagagcg ccgcctcatt 120
aagaccactg gtgctatcgc acggccaaac tgagcactcg ctgctggtgc ccacctctct 180
gtacatcaac tgcaccacgc tccgagacca gttctacgcc tctctacctc cagccactga 240
agacaaggcc gacgatgatg agccctcctc ctccacagag cttctagctg ccttcctggg 300
atttactgcc aagaccgtcg aggaagagcc cggaccatac gacgacgttc tctctctcgt 360
gcttaacgag tttgagaccc ggtacttgcg aggtaacgac atccacgctg tggcctcctc 420
cttgttacaa gacgaggacg tgcctaccac cgttggtaag atcaagaggg tgattcgagc 480
ctactacgcc gcacgaattg cctgcaaccg gcccatcaag gcccactcgt cggctctgtt 540
ccgagccgca tctgaagact cggacaacgt ctctctgtac gccatcttcg gtggccaggg 600
aaacaccgag gactactttg aggaactgcg ggagatttac gacatctacc aggggctggt 660
cggcgacttc attcgggaat gtggagccca gcttctggcg ctgtctcgag atcacattgc 720
tgctgagaaa atttatacca agggctttga tatcgtcaag tggctggaac accccgagac 780
catccccgac tttgagtacc taatttctgc tcccatctct gtacccatca tcggtgttat 840
ccagctggca cactacgctg tcacctgtcg agttttgggt cttaatcctg gccaggtccg 900
agacaacctc aagggtgcca ctggccattc tcagggtctg atcaccgcaa ttgccatctc 960
tgcctccgac tcgtgggacg agttctataa ctctgcctct cgaattctca agatcttctt 1020
cttcatcggt gtccgtgtcc aacaggctta cccctccact ttcctgcctc cctccactct 1080
ggaagacagt gtcaagcagg gtgagggcaa gcccactccc atgctgtcca tccgagacct 1140
gtctctcaac caggttcagg agttcgtcga tgccaccaac ttgcatttgc ccgaagataa 1200
gcagatcgtc gtgtctctga tcaatggtcc tcgaaacgtt gtcgttactg gcccccccca 1260
gtctctgtat ggtctgtgtc ttgtgcttcg aaaacagaag gccgagaccg gtctggacca 1320
aagccgagtg ccccacagtc agcgaaagct caaattcaca catcgtttcc tgcccatcac 1380
ctctcctttc cactcgtacc tgctggagaa gagcacggat ctgatcatca acgacctgga 1440
gtcttccggt gtggagtttg tgtcctccga gctcaaggtg cctgtttacg acacctttga 1500
tggctccgtg ctgtctcagc tacccaaggg tatcgtcagc cgtctggtca acctcatcac 1560
tcatctgccc gtcaagtggg agaaggccac tcagtttcag gcctcccaca ttgtggactt 1620
tggtcccggt ggcgcttctg gtcttggtct gttgacccac aagaacaagg atggaactgg 1680
agtgcgaact attcttgctg gtgtcattga ccagcccctc gagttcggct tcaagcagga 1740
gctgtttgac cgacaggagt cgtccattgt ttttgctcaa aactgggcca aggagttttc 1800
tcccaagctc gtcaagatct cctccaccaa cgaggtctat gtcgacacca aattctctcg 1860
tctgactggc cgagccccca tcatggtcgc tggtatgacc cctaccactg tcaaccccaa 1920
atttgtggct gccactatga actccggcta ccacatcgag cttggtggtg gaggctactt 1980
tgcccccggt atgatgacca aggcccttga acacattgag aagaacactc ctcccggatc 2040
cggtatcacc atcaacctga tctacgtcaa ccctcgactg attcaatggg gtattcctct 2100
gattcaggag cttcgacaga agggtttccc cattgaaggt ctcaccattg gtgccggtgt 2160
gccctctctg gaggttgcta acgagtggat tcaggatctg ggcgtcaagc acatcgcctt 2220
caagcctgga tccatcgagg ccatctcctc ggtgattcga atcgccaagg ccaacccaga 2280
ctttcctatc atccttcagt ggaccggagg tcgaggagga ggacatcatt cgtttgagga 2340
cttccacgct cccattctgc agatgtactc caagatccga cgatgcagca acattgtgct 2400
gattgccgga tctggtttcg gtgcttctac cgactcctac ccatacctca ccggttcatg 2460
gtcccgagac tttgactacc ctcccatgcc ctttgacggt atcctggttg gttctcgagt 2520
catggttgcc aaggaggctt tcacttctct gggagccaag cagctcattg ttgactctcc 2580
gggtgttgag gattctgagt gggagaaaac ctacgacaag cccactggtg gcgtcatcac 2640
cgttctctcc gagatgggtg agcctatcca caagctcgcc actcgaggtg tgctcttctg 2700
gcacgagatg gacaagaccg tgttctccct gcccaagaag aagcgtctgg aagtgctcaa 2760
gtccaagcga gcctacatca tcaagcgtct caacgacgac ttccagaaga cttggtttgc 2820
caagaacgcc cagggacagg tgtgtgatct cgaagacctc acctacgcgg aggtcatcca 2880
gcgacttgtt gacctcatgt acgtgaagaa ggaaagccga tggatcgatg tcactctccg 2940
aaatcttgcc ggcactttca ttcgacgagt tgaggagcga ttctccaccg agacaggtgc 3000
ctcttctgtg ttgcagagct tttccgagct ggattccgag cccgagaagg ttgtcgagcg 3060
ggtgtttgag ctcttccctg cctctactac ccagatcatc aacgctcaag acaaggacca 3120
cttcctcatg ctgtgtctca accccatgca gaagcccgtg cccttcatcc ctgttctgga 3180
tgacaacttt gagttcttct tcaagaagga ctctctgtgg cagtgcgagg acctcgcagc 3240
tgttgtggac gaagacgttg gacgaatctg tattcttcag ggtcccgttg ctgtcaagca 3300
ctccaagatt gtcaacgagc ccgtcaagga gattctcgac tccatgcacg aaggtcacat 3360
caagcagctg cttgaggatg gcgagtacgc tggcaacatg gccaacatcc cccaggtcga 3420
atgctttggt ggaaagcctg ctcagaactt cggtgacgtt gctctcgact ctgtcatggt 3480
tcttgatgac ctcaacaaga ccgtgttcaa gattgagacc ggcacctctg ctctgccttc 3540
tgctgcagat tggttctctc tgctggccgg tgacaagaac tcttggcgac aggtcttcct 3600
gtccactgac accattgtgc agaccaccaa gatgatctcc aaccctctgc atcgacttct 3660
ggagcccatc gcaggtttgc aggttgagat tgagcaccct gatgagcccg agaacaccgt 3720
catctctgct ttcgagccca tcaacggcaa ggtcaccaag gtgctggagc tgcgaaaggg 3780
tgccggagac gtcatttcgc tgcagctgat cgaagcgcgt ggcgttgacc gagtccccgt 3840
tgctcttcct ctggaattca agtaccagcc ccagattggc tacgctccca ttgttgaggt 3900
tatgaccgac aggaacaccc gaatcaagga gttctactgg aagctgtggt ttggccagga 3960
ctccaagttt gagattgaca ccgacatcac cgaggaaatc attggcgatg acgttaccat 4020
ctctggcaag gccattgccg actttgtcca cgctgttggc aacaagggcg aggcctttgt 4080
tggtcgatct acctctgctg gtactgtctt cgctcccatg gactttgcca ttgttttggg 4140
ctggaaggcc attatcaagg caatctttcc ccgagcaatt gatgctgaca ttctgcgtct 4200
ggtacatctg tccaacggct tcaagatgat gcctggcgcc gaccctctgc agatgggtga 4260
tgttgtttcc gccactgcca agatcgacac tgtcaagaac tccgctaccg gcaagactgt 4320
tgctgttcga ggtcttctca cccgagacgg caagcctgtc atggaggttg tttccgaatt 4380
cttctaccga ggcgaattct ccgacttcca gaacactttt gagcgacgag aggaggtacc 4440
catgcaactg accctcaagg acgccaaggc cgtggccatt ctctgctcca aggagtggtt 4500
tgagtacaat ggcgacgata ccaaggacct cgagggcaag accattgtgt tccgaaactc 4560
gtcattcatc aagtacaaga atgagaccgt cttctcttct gtgcacacca ccggtaaggt 4620
attgatggag ctgccctcca aggaggtcat tgagattgcc actgttaact accaggctgg 4680
cgagtctcat ggcaatcccg tcattgatta cctggagcga aatggaacca ccattgagca 4740
gcctgttgag tttgagaagc ccatccctct gtccaaggca gatgatcttc tctccttcaa 4800
ggctccttct tccaacgagc cctacgctgg tgtgtccggt gactacaatc ccatccacgt 4860
gtctcgagcc tttgcttcct atgcatccct tcctggagca gcggacacgt tattgattct 4920
gggtgatagc ctgagcgccg ggtatcgaat gtctgccagc gcggcctggc ctgccttgtt 4980
gaatgataag tggcagagta aaacgtcggt agttaatgcc agcatcagcg gcgacacctc 5040
gcaacaagga ctggcgcgcc ttccggctct gctgaaacag catcagccgc gttgggtgct 5100
ggttgaactg ggcggcaatg acggtttgcg tggttttcag ccacagcaaa ccgagcaaac 5160
gctgcgccag attttgcagg atgtcaaagc cgccaacgct gaaccattgt taatgcaaat 5220
acgtctgcct gcaaactatg gtcgccgtta taatgaagcc tttagcgcca tttaccccaa 5280
actcgccaaa gagtttgatg ttccgctgct gccctttttt atggaagagg tctacctcaa 5340
gccacaatgg atgcaggatg acggtattca tcccaaccgc gacgcccagc cgtttattgc 5400
cgactggatg gcgaagcagt tgcagccttt agtaaatcat gactcataa 5449
<210> 59
<211> 2268
<212> PRT
<213> Artificial sequence
<220>
<223> Artificial sequence
<220>
<221> MISC_FEATURE
<222> (1)..(2268)
<223> Fusion of a truncated version of FAS1 from Y. lipolytica and a
truncated version of the thioesterase TesA from E. coli
<400> 59
Tyr Pro Thr Thr Gly Val Asn Thr Pro Gln Ser Ala Ala Ser Leu Arg
1 5 10 15
Pro Leu Val Leu Ser His Gly Gln Thr Glu His Ser Leu Leu Val Pro
20 25 30
Thr Ser Leu Tyr Ile Asn Cys Thr Thr Leu Arg Asp Gln Phe Tyr Ala
35 40 45
Ser Leu Pro Pro Ala Thr Glu Asp Lys Ala Asp Asp Asp Glu Pro Ser
50 55 60
Ser Ser Thr Glu Leu Leu Ala Ala Phe Leu Gly Phe Thr Ala Lys Thr
65 70 75 80
Val Glu Glu Glu Pro Gly Pro Tyr Asp Asp Val Leu Ser Leu Val Leu
85 90 95
Asn Glu Phe Glu Thr Arg Tyr Leu Arg Gly Asn Asp Ile His Ala Val
100 105 110
Ala Ser Ser Leu Leu Gln Asp Glu Asp Val Pro Thr Thr Val Gly Lys
115 120 125
Ile Lys Arg Val Ile Arg Ala Tyr Tyr Ala Ala Arg Ile Ala Cys Asn
130 135 140
Arg Pro Ile Lys Ala His Ser Ser Ala Leu Phe Arg Ala Ala Ser Glu
145 150 155 160
Asp Ser Asp Asn Val Ser Leu Tyr Ala Ile Phe Gly Gly Gln Gly Asn
165 170 175
Thr Glu Asp Tyr Phe Glu Glu Leu Arg Glu Ile Tyr Asp Ile Tyr Gln
180 185 190
Gly Leu Val Gly Asp Phe Ile Arg Glu Cys Gly Ala Gln Leu Leu Ala
195 200 205
Leu Ser Arg Asp His Ile Ala Ala Glu Lys Ile Tyr Thr Lys Gly Phe
210 215 220
Asp Ile Val Lys Trp Leu Glu His Pro Glu Thr Ile Pro Asp Phe Glu
225 230 235 240
Tyr Leu Ile Ser Ala Pro Ile Ser Val Pro Ile Ile Gly Val Ile Gln
245 250 255
Leu Ala His Tyr Ala Val Thr Cys Arg Val Leu Gly Leu Asn Pro Gly
260 265 270
Gln Val Arg Asp Asn Leu Lys Gly Ala Thr Gly His Ser Gln Gly Leu
275 280 285
Ile Thr Ala Ile Ala Ile Ser Ala Ser Asp Ser Trp Asp Glu Phe Tyr
290 295 300
Asn Ser Ala Ser Arg Ile Leu Lys Ile Phe Phe Phe Ile Gly Val Arg
305 310 315 320
Val Gln Gln Ala Tyr Pro Ser Thr Phe Leu Pro Pro Ser Thr Leu Glu
325 330 335
Asp Ser Val Lys Gln Gly Glu Gly Lys Pro Thr Pro Met Leu Ser Ile
340 345 350
Arg Asp Leu Ser Leu Asn Gln Val Gln Glu Phe Val Asp Ala Thr Asn
355 360 365
Leu His Leu Pro Glu Asp Lys Gln Ile Val Val Ser Leu Ile Asn Gly
370 375 380
Pro Arg Asn Val Val Val Thr Gly Pro Pro Gln Ser Leu Tyr Gly Leu
385 390 395 400
Cys Leu Val Leu Arg Lys Gln Lys Ala Glu Thr Gly Leu Asp Gln Ser
405 410 415
Arg Val Pro His Ser Gln Arg Lys Leu Lys Phe Thr His Arg Phe Leu
420 425 430
Pro Ile Thr Ser Pro Phe His Ser Tyr Leu Leu Glu Lys Ser Thr Asp
435 440 445
Leu Ile Ile Asn Asp Leu Glu Ser Ser Gly Val Glu Phe Val Ser Ser
450 455 460
Glu Leu Lys Val Pro Val Tyr Asp Thr Phe Asp Gly Ser Val Leu Ser
465 470 475 480
Gln Leu Pro Lys Gly Ile Val Ser Arg Leu Val Asn Leu Ile Thr His
485 490 495
Leu Pro Val Lys Trp Glu Lys Ala Thr Gln Phe Gln Ala Ser His Ile
500 505 510
Val Asp Phe Gly Pro Gly Gly Ala Ser Gly Leu Gly Leu Leu Thr His
515 520 525
Lys Asn Lys Asp Gly Thr Gly Val Arg Thr Ile Leu Ala Gly Val Ile
530 535 540
Asp Gln Pro Leu Glu Phe Gly Phe Lys Gln Glu Leu Phe Asp Arg Gln
545 550 555 560
Glu Ser Ser Ile Val Phe Ala Gln Asn Trp Ala Lys Glu Phe Ser Pro
565 570 575
Lys Leu Val Lys Ile Ser Ser Thr Asn Glu Val Tyr Val Asp Thr Lys
580 585 590
Phe Ser Arg Leu Thr Gly Arg Ala Pro Ile Met Val Ala Gly Met Thr
595 600 605
Pro Thr Thr Val Asn Pro Lys Phe Val Ala Ala Thr Met Asn Ser Gly
610 615 620
Tyr His Ile Glu Leu Gly Gly Gly Gly Tyr Phe Ala Pro Gly Met Met
625 630 635 640
Thr Lys Ala Leu Glu His Ile Glu Lys Asn Thr Pro Pro Gly Ser Gly
645 650 655
Ile Thr Ile Asn Leu Ile Tyr Val Asn Pro Arg Leu Ile Gln Trp Gly
660 665 670
Ile Pro Leu Ile Gln Glu Leu Arg Gln Lys Gly Phe Pro Ile Glu Gly
675 680 685
Leu Thr Ile Gly Ala Gly Val Pro Ser Leu Glu Val Ala Asn Glu Trp
690 695 700
Ile Gln Asp Leu Gly Val Lys His Ile Ala Phe Lys Pro Gly Ser Ile
705 710 715 720
Glu Ala Ile Ser Ser Val Ile Arg Ile Ala Lys Ala Asn Pro Asp Phe
725 730 735
Pro Ile Ile Leu Gln Trp Thr Gly Gly Arg Gly Gly Gly His His Ser
740 745 750
Phe Glu Asp Phe His Ala Pro Ile Leu Gln Met Tyr Ser Lys Ile Arg
755 760 765
Arg Cys Ser Asn Ile Val Leu Ile Ala Gly Ser Gly Phe Gly Ala Ser
770 775 780
Thr Asp Ser Tyr Pro Tyr Leu Thr Gly Ser Trp Ser Arg Asp Phe Asp
785 790 795 800
Tyr Pro Pro Met Pro Phe Asp Gly Ile Leu Val Gly Ser Arg Val Met
805 810 815
Val Ala Lys Glu Ala Phe Thr Ser Leu Gly Ala Lys Gln Leu Ile Val
820 825 830
Asp Ser Pro Gly Val Glu Asp Ser Glu Trp Glu Lys Thr Tyr Asp Lys
835 840 845
Pro Thr Gly Gly Val Ile Thr Val Leu Ser Glu Met Gly Glu Pro Ile
850 855 860
His Lys Leu Ala Thr Arg Gly Val Leu Phe Trp His Glu Met Asp Lys
865 870 875 880
Thr Val Phe Ser Leu Pro Lys Lys Lys Arg Leu Glu Val Leu Lys Ser
885 890 895
Lys Arg Ala Tyr Ile Ile Lys Arg Leu Asn Asp Asp Phe Gln Lys Thr
900 905 910
Trp Phe Ala Lys Asn Ala Gln Gly Gln Val Cys Asp Leu Glu Asp Leu
915 920 925
Thr Tyr Ala Glu Val Ile Gln Arg Leu Val Asp Leu Met Tyr Val Lys
930 935 940
Lys Glu Ser Arg Trp Ile Asp Val Thr Leu Arg Asn Leu Ala Gly Thr
945 950 955 960
Phe Ile Arg Arg Val Glu Glu Arg Phe Ser Thr Glu Thr Gly Ala Ser
965 970 975
Ser Val Leu Gln Ser Phe Ser Glu Leu Asp Ser Glu Pro Glu Lys Val
980 985 990
Val Glu Arg Val Phe Glu Leu Phe Pro Ala Ser Thr Thr Gln Ile Ile
995 1000 1005
Asn Ala Gln Asp Lys Asp His Phe Leu Met Leu Cys Leu Asn Pro
1010 1015 1020
Met Gln Lys Pro Val Pro Phe Ile Pro Val Leu Asp Asp Asn Phe
1025 1030 1035
Glu Phe Phe Phe Lys Lys Asp Ser Leu Trp Gln Cys Glu Asp Leu
1040 1045 1050
Ala Ala Val Val Asp Glu Asp Val Gly Arg Ile Cys Ile Leu Gln
1055 1060 1065
Gly Pro Val Ala Val Lys His Ser Lys Ile Val Asn Glu Pro Val
1070 1075 1080
Lys Glu Ile Leu Asp Ser Met His Glu Gly His Ile Lys Gln Leu
1085 1090 1095
Leu Glu Asp Gly Glu Tyr Ala Gly Asn Met Ala Asn Ile Pro Gln
1100 1105 1110
Val Glu Cys Phe Gly Gly Lys Pro Ala Gln Asn Phe Gly Asp Val
1115 1120 1125
Ala Leu Asp Ser Val Met Val Leu Asp Asp Leu Asn Lys Thr Val
1130 1135 1140
Phe Lys Ile Glu Thr Gly Thr Ser Ala Leu Pro Ser Ala Ala Asp
1145 1150 1155
Trp Phe Ser Leu Leu Ala Gly Asp Lys Asn Ser Trp Arg Gln Val
1160 1165 1170
Phe Leu Ser Thr Asp Thr Ile Val Gln Thr Thr Lys Met Ile Ser
1175 1180 1185
Asn Pro Leu His Arg Leu Leu Glu Pro Ile Ala Gly Leu Gln Val
1190 1195 1200
Glu Ile Glu His Pro Asp Glu Pro Glu Asn Thr Val Ile Ser Ala
1205 1210 1215
Phe Glu Pro Ile Asn Gly Lys Val Thr Lys Val Leu Glu Leu Arg
1220 1225 1230
Lys Gly Ala Gly Asp Val Ile Ser Leu Gln Leu Ile Glu Ala Arg
1235 1240 1245
Gly Val Asp Arg Val Pro Val Ala Leu Pro Leu Glu Phe Lys Tyr
1250 1255 1260
Gln Pro Gln Ile Gly Tyr Ala Pro Ile Val Glu Val Met Thr Asp
1265 1270 1275
Arg Asn Thr Arg Ile Lys Glu Phe Tyr Trp Lys Leu Trp Phe Gly
1280 1285 1290
Gln Asp Ser Lys Phe Glu Ile Asp Thr Asp Ile Thr Glu Glu Ile
1295 1300 1305
Ile Gly Asp Asp Val Thr Ile Ser Gly Lys Ala Ile Ala Asp Phe
1310 1315 1320
Val His Ala Val Gly Asn Lys Gly Glu Ala Phe Val Gly Arg Ser
1325 1330 1335
Thr Ser Ala Gly Thr Val Phe Ala Pro Met Asp Phe Ala Ile Val
1340 1345 1350
Leu Gly Trp Lys Ala Ile Ile Lys Ala Ile Phe Pro Arg Ala Ile
1355 1360 1365
Asp Ala Asp Ile Leu Arg Leu Val His Leu Ser Asn Gly Phe Lys
1370 1375 1380
Met Met Pro Gly Ala Asp Pro Leu Gln Met Gly Asp Val Val Ser
1385 1390 1395
Ala Thr Ala Lys Ile Asp Thr Val Lys Asn Ser Ala Thr Gly Lys
1400 1405 1410
Thr Val Ala Val Arg Gly Leu Leu Thr Arg Asp Gly Lys Pro Val
1415 1420 1425
Met Glu Val Val Ser Glu Phe Phe Tyr Arg Gly Glu Phe Ser Asp
1430 1435 1440
Phe Gln Asn Thr Phe Glu Arg Arg Glu Glu Val Pro Met Gln Leu
1445 1450 1455
Thr Leu Lys Asp Ala Lys Ala Val Ala Ile Leu Cys Ser Lys Glu
1460 1465 1470
Trp Phe Glu Tyr Asn Gly Asp Asp Thr Lys Asp Leu Glu Gly Lys
1475 1480 1485
Thr Ile Val Phe Arg Asn Ser Ser Phe Ile Lys Tyr Lys Asn Glu
1490 1495 1500
Thr Val Phe Ser Ser Val His Thr Thr Gly Lys Val Leu Met Glu
1505 1510 1515
Leu Pro Ser Lys Glu Val Ile Glu Ile Ala Thr Val Asn Tyr Gln
1520 1525 1530
Ala Gly Glu Ser His Gly Asn Pro Val Ile Asp Tyr Leu Glu Arg
1535 1540 1545
Asn Gly Thr Thr Ile Glu Gln Pro Val Glu Phe Glu Lys Pro Ile
1550 1555 1560
Pro Leu Ser Lys Ala Asp Asp Leu Leu Ser Phe Lys Ala Pro Ser
1565 1570 1575
Ser Asn Glu Pro Tyr Ala Gly Val Ser Gly Asp Tyr Asn Pro Ile
1580 1585 1590
His Val Ser Arg Ala Phe Ala Ser Tyr Ala Ser Leu Pro Gly Thr
1595 1600 1605
Ile Thr His Gly Met Tyr Ser Ser Ala Ala Val Arg Ser Leu Ile
1610 1615 1620
Glu Val Trp Ala Ala Glu Asn Asn Val Ser Arg Val Arg Ala Phe
1625 1630 1635
Ser Cys Gln Phe Gln Gly Met Val Leu Pro Asn Asp Glu Ile Val
1640 1645 1650
Thr Arg Leu Glu His Val Gly Met Ile Asn Gly Arg Lys Ile Ile
1655 1660 1665
Lys Val Thr Ser Thr Asn Arg Glu Thr Glu Ala Val Val Leu Ser
1670 1675 1680
Gly Glu Ala Glu Val Glu Gln Pro Ile Ser Thr Phe Val Phe Thr
1685 1690 1695
Gly Gln Gly Ser Gln Glu Gln Gly Met Gly Met Asp Leu Tyr Ala
1700 1705 1710
Ser Ser Glu Val Ala Lys Lys Val Trp Asp Lys Ala Asp Glu His
1715 1720 1725
Phe Leu Gln Asn Tyr Gly Phe Ser Ile Ile Lys Ile Val Val Glu
1730 1735 1740
Asn Pro Lys Glu Leu Asp Ile His Phe Gly Gly Pro Lys Gly Lys
1745 1750 1755
Lys Ile Arg Asp Asn Tyr Ile Ser Met Met Phe Glu Thr Ile Asp
1760 1765 1770
Glu Lys Thr Gly Asn Leu Ile Ser Glu Lys Ile Phe Lys Glu Ile
1775 1780 1785
Asp Glu Thr Thr Asp Ser Phe Thr Phe Lys Ser Pro Thr Gly Leu
1790 1795 1800
Leu Ser Ala Thr Gln Phe Thr Gln Pro Ala Leu Thr Leu Met Glu
1805 1810 1815
Lys Ala Ser Phe Glu Asp Met Lys Ala Lys Gly Leu Val Pro Val
1820 1825 1830
Asp Ala Thr Phe Ala Gly His Ser Leu Gly Glu Tyr Ser Ala Leu
1835 1840 1845
Ala Ser Leu Gly Asp Val Met Pro Ile Glu Ser Leu Val Asp Val
1850 1855 1860
Val Phe Tyr Arg Gly Met Thr Met Gln Val Ala Val Pro Arg Asp
1865 1870 1875
Ala Gln Gly Arg Ser Asn Tyr Gly Met Cys Ala Val Asn Pro Ser
1880 1885 1890
Arg Ile Ser Thr Thr Phe Asn Asp Ala Ala Leu Arg Phe Val Val
1895 1900 1905
Asp His Ile Ser Glu Gln Thr Lys Trp Leu Leu Glu Ile Val Asn
1910 1915 1920
Tyr Asn Val Glu Asn Ser Gln Tyr Val Thr Ala Gly Asp Leu Arg
1925 1930 1935
Ala Leu Asp Thr Leu Thr Asn Val Leu Asn Val Leu Lys Leu Glu
1940 1945 1950
Lys Ile Asn Ile Asp Lys Leu Leu Glu Ser Leu Pro Leu Glu Lys
1955 1960 1965
Val Lys Glu His Leu Ser Glu Ile Val Thr Glu Val Ala Lys Lys
1970 1975 1980
Ser Val Ala Lys Pro Gln Pro Ile Glu Leu Glu Arg Gly Phe Ala
1985 1990 1995
Val Ile Pro Leu Lys Gly Ile Ser Val Pro Phe His Ser Ser Tyr
2000 2005 2010
Leu Arg Asn Gly Val Lys Pro Phe Gln Asn Phe Leu Val Lys Lys
2015 2020 2025
Val Pro Lys Asn Ala Val Lys Pro Ala Asn Leu Ile Gly Lys Tyr
2030 2035 2040
Ile Pro Asn Leu Thr Ala Lys Pro Phe Glu Ile Thr Lys Glu Tyr
2045 2050 2055
Phe Glu Glu Val Tyr Lys Leu Thr Gly Ser Glu Lys Val Lys Ser
2060 2065 2070
Ile Ile Asn Asn Trp Glu Ser Tyr Glu Ser Lys Gln Ala Ala Asp
2075 2080 2085
Thr Leu Leu Ile Leu Gly Asp Ser Leu Ser Ala Gly Tyr Arg Met
2090 2095 2100
Ser Ala Ser Ala Ala Trp Pro Ala Leu Leu Asn Asp Lys Trp Gln
2105 2110 2115
Ser Lys Thr Ser Val Val Asn Ala Ser Ile Ser Gly Asp Thr Ser
2120 2125 2130
Gln Gln Gly Leu Ala Arg Leu Pro Ala Leu Leu Lys Gln His Gln
2135 2140 2145
Pro Arg Trp Val Leu Val Glu Leu Gly Gly Asn Asp Gly Leu Arg
2150 2155 2160
Gly Phe Gln Pro Gln Gln Thr Glu Gln Thr Leu Arg Gln Ile Leu
2165 2170 2175
Gln Asp Val Lys Ala Ala Asn Ala Glu Pro Leu Leu Met Gln Ile
2180 2185 2190
Arg Leu Pro Ala Asn Tyr Gly Arg Arg Tyr Asn Glu Ala Phe Ser
2195 2200 2205
Ala Ile Tyr Pro Lys Leu Ala Lys Glu Phe Asp Val Pro Leu Leu
2210 2215 2220
Pro Phe Phe Met Glu Glu Val Tyr Leu Lys Pro Gln Trp Met Gln
2225 2230 2235
Asp Asp Gly Ile His Pro Asn Arg Asp Ala Gln Pro Phe Ile Ala
2240 2245 2250
Asp Trp Met Ala Lys Gln Leu Gln Pro Leu Val Asn His Asp Ser
2255 2260 2265
<210> 60
<211> 1402
<212> DNA
<213> Agrotis ipsilon
<400> 60
aataaatagc cacaatggcc gtgatcatct cccgagagga agagaagctg tctgtccccg 60
agttctacgc cggcaagtct atcttcatta ccggcggcac cggattcctc ggcaaggtgt 120
tcatcgagaa gctgctctac tcttgccccg acatcgacaa gatctacatg ctgatccgag 180
agaagaagaa cctctctatc gacgagcgaa tgaccatgtt cctggacgac cctctgttct 240
ctcgactgaa ggaaaagcga cccggcgacg tcgagaagat cgtgctgatc cccggcgaca 300
tctcttctcc caacctgggc ctgtctgccg agaacgaacg aatcctgatc gagaacgtgt 360
ctgtgatcat ccactctgcc gccaccatca agttcaacga gcccctgcct atcgcctgga 420
agatcaacgt cgagggcacc cgaatgctga tggacctgtc tcgacgaatg aagcgaatca 480
aggtgtttat ccacatctct accgcctact ctaacgccaa ctctgagcga gccgccgtgg 540
aagagattct gtaccccgct cctgccgaca tggaccaggt gtaccagctc gtgaaggacg 600
gcgtgaccga ggaagaaacc gagatcctgc tgaacggact gcccaacacc tacaccttca 660
ccaaggctct ggccgagcac ctggccgctg agcaccaggt gcacgtgccc accgtgatta 720
ttcgaccctc tatcgtgggc tctatcaagg acgagcccat ccgaggctgg ctgtgcaact 780
ggttcggcgc caccggcatc tctgtgttca ccgccaaggg cctgaaccga gtgctgctcg 840
gaaaggcctc taacatcgtg gacgtgatcc ccgtggacta cgtggccaac ctggtgatcg 900
tggctggcgc caagaacggc ggcgagaagt ctgaggaact gaagatctat aactgctgtt 960
cttctgactg caaccccgtg accgtgaaga agatcctgaa ggaattcatc gacgacacca 1020
ttaagaacaa gtctcacatc atgcctctgc ctggctggtt cgtgttcacc aagtacaagt 1080
ggctgatgac cctgctgacc atcatcttcc agatgatccc catgtacctg gccgacgtgt 1140
accgagtcct gatgggcaag aaccctcggt acatgaagct gcaccacctg gtcattcaga 1200
cccgactggt gatcaacttc ttcaccttcc actcttgggt gatgaagacc gatcgagccc 1260
gagagctgtt cggctctctg tctcccgttg agaagcacat gttcccttgg gacccctctg 1320
gcatcgactg gaccgagtac ctgcagtctt actgctacgg cgtgcgacac ttcctcgaga 1380
agcgaaagta gaatataaat tt 1402
<210> 61
<211> 458
<212> PRT
<213> Agrotis ipsilon
<400> 61
Met Ala Val Ile Ile Ser Arg Glu Glu Glu Lys Leu Ser Val Pro Glu
1 5 10 15
Phe Tyr Ala Gly Lys Ser Ile Phe Ile Thr Gly Gly Thr Gly Phe Leu
20 25 30
Gly Lys Val Phe Ile Glu Lys Leu Leu Tyr Ser Cys Pro Asp Ile Asp
35 40 45
Lys Ile Tyr Met Leu Ile Arg Glu Lys Lys Asn Leu Ser Ile Asp Glu
50 55 60
Arg Met Thr Met Phe Leu Asp Asp Pro Leu Phe Ser Arg Leu Lys Glu
65 70 75 80
Lys Arg Pro Gly Asp Val Glu Lys Ile Val Leu Ile Pro Gly Asp Ile
85 90 95
Ser Ser Pro Asn Leu Gly Leu Ser Ala Glu Asn Glu Arg Ile Leu Ile
100 105 110
Glu Asn Val Ser Val Ile Ile His Ser Ala Ala Thr Ile Lys Phe Asn
115 120 125
Glu Pro Leu Pro Ile Ala Trp Lys Ile Asn Val Glu Gly Thr Arg Met
130 135 140
Leu Met Asp Leu Ser Arg Arg Met Lys Arg Ile Lys Val Phe Ile His
145 150 155 160
Ile Ser Thr Ala Tyr Ser Asn Ala Asn Ser Glu Arg Ala Ala Val Glu
165 170 175
Glu Ile Leu Tyr Pro Ala Pro Ala Asp Met Asp Gln Val Tyr Gln Leu
180 185 190
Val Lys Asp Gly Val Thr Glu Glu Glu Thr Glu Ile Leu Leu Asn Gly
195 200 205
Leu Pro Asn Thr Tyr Thr Phe Thr Lys Ala Leu Ala Glu His Leu Ala
210 215 220
Ala Glu His Gln Val His Val Pro Thr Val Ile Ile Arg Pro Ser Ile
225 230 235 240
Val Gly Ser Ile Lys Asp Glu Pro Ile Arg Gly Trp Leu Cys Asn Trp
245 250 255
Phe Gly Ala Thr Gly Ile Ser Val Phe Thr Ala Lys Gly Leu Asn Arg
260 265 270
Val Leu Leu Gly Lys Ala Ser Asn Ile Val Asp Val Ile Pro Val Asp
275 280 285
Tyr Val Ala Asn Leu Val Ile Val Ala Gly Ala Lys Asn Gly Gly Glu
290 295 300
Lys Ser Glu Glu Leu Lys Ile Tyr Asn Cys Cys Ser Ser Asp Cys Asn
305 310 315 320
Pro Val Thr Val Lys Lys Ile Leu Lys Glu Phe Ile Asp Asp Thr Ile
325 330 335
Lys Asn Lys Ser His Ile Met Pro Leu Pro Gly Trp Phe Val Phe Thr
340 345 350
Lys Tyr Lys Trp Leu Met Thr Leu Leu Thr Ile Ile Phe Gln Met Ile
355 360 365
Pro Met Tyr Leu Ala Asp Val Tyr Arg Val Leu Met Gly Lys Asn Pro
370 375 380
Arg Tyr Met Lys Leu His His Leu Val Ile Gln Thr Arg Leu Val Ile
385 390 395 400
Asn Phe Phe Thr Phe His Ser Trp Val Met Lys Thr Asp Arg Ala Arg
405 410 415
Glu Leu Phe Gly Ser Leu Ser Pro Val Glu Lys His Met Phe Pro Trp
420 425 430
Asp Pro Ser Gly Ile Asp Trp Thr Glu Tyr Leu Gln Ser Tyr Cys Tyr
435 440 445
Gly Val Arg His Phe Leu Glu Lys Arg Lys
450 455
<210> 62
<211> 1008
<212> DNA
<213> Choristoneura rosaceana
<400> 62
atggctccca acgtcgagga catggaatct gacctgcctg agtctgagga aaagctcgag 60
aagctggtgg ctccccaggc tgctccccga aagtaccaga tcatctacac caacctgctg 120
accttcggct actggcacat tgccggcctg tacggactgt acctgtgctt cacctctgcc 180
aagtggcaga ccatcattct ggccctgatc ctgaacgaga tggccattct gggcatcacc 240
gctggcgccc accgactgtg ggctcaccga tcttacaagg ccaccgtgcc tctgcagatc 300
atcctgatca tcttcaactc cctgtctttc cagaactctg ccatccactg gatccgagat 360
caccgaatgc accacaagta ctctgacacc gacggcgacc ctcacaacgc ctctcgaggc 420
ttcttctact ctcacgtcgg ctggctgctg gtgaagaagc accccgaggt caagaagcga 480
gccaagacca tcgacatgtc tgacatctac tctaacccca tcctgcgatt ccagaagaag 540
tacgctatcc ccttcatcgg catgatctgc ttcgtgctgc ccactattat ccctatgtac 600
ttctggggcg agactctgtc taacgcctgg cacatcacca tgctgcgata cgtgttctct 660
ctgaactcta tcttcctggt gaactccgcc gctcacctgt acggctaccg accttacgac 720
aagaacattc tgcccgccga gaacaagatg accttcattg cctgcctggg cgagaacttc 780
cacaactacc accacgtgtt cccttgggac taccgagcct ctgagctggg caacatcgga 840
atgaactgga ccgccaagtt catcgacttt ttcgcctgga tcggctgggc ctacgacctc 900
aagaccgcct ctgacgagaa catcaagtct cgaatgaagc gaaccggcga cggcaccgac 960
gtgtctggac agaagtactc ttgcgagtcc tctgaggtgc tgcagtaa 1008
<210> 63
<211> 335
<212> PRT
<213> Choristoneura rosaceana
<400> 63
Met Ala Pro Asn Val Glu Asp Met Glu Ser Asp Leu Pro Glu Ser Glu
1 5 10 15
Glu Lys Leu Glu Lys Leu Val Ala Pro Gln Ala Ala Pro Arg Lys Tyr
20 25 30
Gln Ile Ile Tyr Thr Asn Leu Leu Thr Phe Gly Tyr Trp His Ile Ala
35 40 45
Gly Leu Tyr Gly Leu Tyr Leu Cys Phe Thr Ser Ala Lys Trp Gln Thr
50 55 60
Ile Ile Leu Ala Leu Ile Leu Asn Glu Met Ala Ile Leu Gly Ile Thr
65 70 75 80
Ala Gly Ala His Arg Leu Trp Ala His Arg Ser Tyr Lys Ala Thr Val
85 90 95
Pro Leu Gln Ile Ile Leu Ile Ile Phe Asn Ser Leu Ser Phe Gln Asn
100 105 110
Ser Ala Ile His Trp Ile Arg Asp His Arg Met His His Lys Tyr Ser
115 120 125
Asp Thr Asp Gly Asp Pro His Asn Ala Ser Arg Gly Phe Phe Tyr Ser
130 135 140
His Val Gly Trp Leu Leu Val Lys Lys His Pro Glu Val Lys Lys Arg
145 150 155 160
Ala Lys Thr Ile Asp Met Ser Asp Ile Tyr Ser Asn Pro Ile Leu Arg
165 170 175
Phe Gln Lys Lys Tyr Ala Ile Pro Phe Ile Gly Met Ile Cys Phe Val
180 185 190
Leu Pro Thr Ile Ile Pro Met Tyr Phe Trp Gly Glu Thr Leu Ser Asn
195 200 205
Ala Trp His Ile Thr Met Leu Arg Tyr Val Phe Ser Leu Asn Ser Ile
210 215 220
Phe Leu Val Asn Ser Ala Ala His Leu Tyr Gly Tyr Arg Pro Tyr Asp
225 230 235 240
Lys Asn Ile Leu Pro Ala Glu Asn Lys Met Thr Phe Ile Ala Cys Leu
245 250 255
Gly Glu Asn Phe His Asn Tyr His His Val Phe Pro Trp Asp Tyr Arg
260 265 270
Ala Ser Glu Leu Gly Asn Ile Gly Met Asn Trp Thr Ala Lys Phe Ile
275 280 285
Asp Phe Phe Ala Trp Ile Gly Trp Ala Tyr Asp Leu Lys Thr Ala Ser
290 295 300
Asp Glu Asn Ile Lys Ser Arg Met Lys Arg Thr Gly Asp Gly Thr Asp
305 310 315 320
Val Ser Gly Gln Lys Tyr Ser Cys Glu Ser Ser Glu Val Leu Gln
325 330 335
<210> 64
<211> 1005
<212> DNA
<213> Choristoneura parallela
<400> 64
atggctccca acgtcgagga catggaatct gacatgcccg agtctgagaa gtgggagaag 60
ctggtggctc cccaggctgc tccccgaaag tacgagatca tctacaccaa cctgctgacc 120
ttcggctacg gccacattgc cggcctgtac ggactgtacc tgtgcttcac ctctgccaag 180
tggcagaccg tgatcctggc catcatcctg aacgagatgg ccattctggg catcaccgct 240
ggcgcccacc gactgtggtc ccaccgatct tacaaggccg ctgtgcccct gcagatcatt 300
ctgatgatct tcaactctct ggccttccag aactctgcca tcaactgggt gcgagatcac 360
cgaatgcacc acaagtactc tgacaccgac ggcgaccctc acaacgcctc tcgaggcttc 420
ttctactctc acgtcggctg gctgctggtg aagaagcacc ccgaggtcaa aaagcgaggc 480
aagatgatcg acatgagcga catctactct aaccccgtgc tgcgattcca gaagaagtac 540
gctatcccct tcatcggcat gatctgcttc gtgctgccca ctattatccc tatgtacttc 600
tggggcgaga ctctgtctaa cgcctggcac atcaccatgc tgcgatacgt gttctctctg 660
aactctatct tcctggtgaa ctccgccgct cacctgtacg gctaccgacc ttacgacaag 720
aacattctgc ccgccgagaa caagatcgcc ctgatcgcct gcctgggcga ctctttccac 780
aactaccacc acgtgttccc ttgggactac cgagcctctg agctgggcaa catcggaatg 840
aactggaccg ctcagttcat cgactttttc gcctggatcg gctgggccta cgacctcaag 900
accgcctctg acgagaacat caactctcga atgaagcgaa ccggcgacgg caccgacatc 960
tctggacaga agtactcttg cgagtcctct gaggtgctgc agtaa 1005
<210> 65
<211> 334
<212> PRT
<213> Choristoneura parallela
<400> 65
Met Ala Pro Asn Val Glu Asp Met Glu Ser Asp Met Pro Glu Ser Glu
1 5 10 15
Lys Trp Glu Lys Leu Val Ala Pro Gln Ala Ala Pro Arg Lys Tyr Glu
20 25 30
Ile Ile Tyr Thr Asn Leu Leu Thr Phe Gly Tyr Gly His Ile Ala Gly
35 40 45
Leu Tyr Gly Leu Tyr Leu Cys Phe Thr Ser Ala Lys Trp Gln Thr Val
50 55 60
Ile Leu Ala Ile Ile Leu Asn Glu Met Ala Ile Leu Gly Ile Thr Ala
65 70 75 80
Gly Ala His Arg Leu Trp Ser His Arg Ser Tyr Lys Ala Ala Val Pro
85 90 95
Leu Gln Ile Ile Leu Met Ile Phe Asn Ser Leu Ala Phe Gln Asn Ser
100 105 110
Ala Ile Asn Trp Val Arg Asp His Arg Met His His Lys Tyr Ser Asp
115 120 125
Thr Asp Gly Asp Pro His Asn Ala Ser Arg Gly Phe Phe Tyr Ser His
130 135 140
Val Gly Trp Leu Leu Val Lys Lys His Pro Glu Val Lys Lys Arg Gly
145 150 155 160
Lys Met Ile Asp Met Ser Asp Ile Tyr Ser Asn Pro Val Leu Arg Phe
165 170 175
Gln Lys Lys Tyr Ala Ile Pro Phe Ile Gly Met Ile Cys Phe Val Leu
180 185 190
Pro Thr Ile Ile Pro Met Tyr Phe Trp Gly Glu Thr Leu Ser Asn Ala
195 200 205
Trp His Ile Thr Met Leu Arg Tyr Val Phe Ser Leu Asn Ser Ile Phe
210 215 220
Leu Val Asn Ser Ala Ala His Leu Tyr Gly Tyr Arg Pro Tyr Asp Lys
225 230 235 240
Asn Ile Leu Pro Ala Glu Asn Lys Ile Ala Leu Ile Ala Cys Leu Gly
245 250 255
Asp Ser Phe His Asn Tyr His His Val Phe Pro Trp Asp Tyr Arg Ala
260 265 270
Ser Glu Leu Gly Asn Ile Gly Met Asn Trp Thr Ala Gln Phe Ile Asp
275 280 285
Phe Phe Ala Trp Ile Gly Trp Ala Tyr Asp Leu Lys Thr Ala Ser Asp
290 295 300
Glu Asn Ile Asn Ser Arg Met Lys Arg Thr Gly Asp Gly Thr Asp Ile
305 310 315 320
Ser Gly Gln Lys Tyr Ser Cys Glu Ser Ser Glu Val Leu Gln
325 330
<210> 66
<211> 1050
<212> DNA
<213> Artificial sequence
<220>
<223> Artificial sequence
<220>
<221> misc_feature
<222> (1)..(1050)
<223> Cpo_NPVE, codon-optimised for Y. lipolytica
<400> 66
atgccccctc agggacagcc tcccgcctgg gtcctggacg agtccgatgc agtgaccgag 60
gacaaggacg tggccacccc cgctcccgaa gccgagaagc gaaagctgca gatcgtttgg 120
agaaacgtga ccctgttcgt gtttctgcac atcggagctc tgtacggagg atacctgttc 180
tttaccaagg ccatgtggac tacccgaatt ttcactgtgc tgctgtacat tatgtctggg 240
ctgggtatca ccgccggcgc ccatcgactc tgggctcaca agtcttacaa ggcccgactg 300
cccctgcgac tgctgctgac cctcttcaac accatcgcct ttcaggactc cgttctggat 360
tgggcccgag atcaccgaat gcaccataag tactctgaaa ccgacgcaga tccccacaat 420
gctacccgag gcttcttctt ctctcacgtg ggctggctgc tggtgcgaaa gcacccccag 480
atcaaggcca agggacatac tatcgacatg tctgacctgc tggccgatcc cgtgctgcga 540
ttccagaaga agtactacct gacactgatg cccttgtgct gcttcatcct gccctcttac 600
attcccaccc tctggggaga gtctctgtgg aacgcttact ttgtgtgcgc catcttccga 660
tactgttacg ttctgaacgt gacttggctg gtgaactccg ctgcccacaa atggggtgac 720
cgaccttacg acaagaacat caaccctgtg gagactaagc ctgtgtctct ggtggttttc 780
ggagagggat tccacaacta ccaccacacc ttcccctggg attacaagac cgccgagctg 840
ggcggatact ctctgaacct ttccaaactg ttcatcgata ctatgtccaa gattggatgg 900
gcctacgacc tgaagtccgt ttcccctgac atcgtggaga agcgagtgaa gcgcaccggc 960
gacggatctc accacgtgtg gggatgggac gatgctccct ctgagcaaaa ggtggctgcc 1020
accatcgtga accccgataa gaccgagtaa 1050
<210> 67
<211> 349
<212> PRT
<213> Cydia pomonella
<400> 67
Met Pro Pro Gln Gly Gln Pro Pro Ala Trp Val Leu Asp Glu Ser Asp
1 5 10 15
Ala Val Thr Glu Asp Lys Asp Val Ala Thr Pro Ala Pro Glu Ala Glu
20 25 30
Lys Arg Lys Leu Gln Ile Val Trp Arg Asn Val Thr Leu Phe Val Phe
35 40 45
Leu His Ile Gly Ala Leu Tyr Gly Gly Tyr Leu Phe Phe Thr Lys Ala
50 55 60
Met Trp Thr Thr Arg Ile Phe Thr Val Leu Leu Tyr Ile Met Ser Gly
65 70 75 80
Leu Gly Ile Thr Ala Gly Ala His Arg Leu Trp Ala His Lys Ser Tyr
85 90 95
Lys Ala Arg Leu Pro Leu Arg Leu Leu Leu Thr Leu Phe Asn Thr Ile
100 105 110
Ala Phe Gln Asp Ser Val Leu Asp Trp Ala Arg Asp His Arg Met His
115 120 125
His Lys Tyr Ser Glu Thr Asp Ala Asp Pro His Asn Ala Thr Arg Gly
130 135 140
Phe Phe Phe Ser His Val Gly Trp Leu Leu Val Arg Lys His Pro Gln
145 150 155 160
Ile Lys Ala Lys Gly His Thr Ile Asp Met Ser Asp Leu Leu Ala Asp
165 170 175
Pro Val Leu Arg Phe Gln Lys Lys Tyr Tyr Leu Thr Leu Met Pro Leu
180 185 190
Cys Cys Phe Ile Leu Pro Ser Tyr Ile Pro Thr Leu Trp Gly Glu Ser
195 200 205
Leu Trp Asn Ala Tyr Phe Val Cys Ala Ile Phe Arg Tyr Cys Tyr Val
210 215 220
Leu Asn Val Thr Trp Leu Val Asn Ser Ala Ala His Lys Trp Gly Asp
225 230 235 240
Arg Pro Tyr Asp Lys Asn Ile Asn Pro Val Glu Thr Lys Pro Val Ser
245 250 255
Leu Val Val Phe Gly Glu Gly Phe His Asn Tyr His His Thr Phe Pro
260 265 270
Trp Asp Tyr Lys Thr Ala Glu Leu Gly Gly Tyr Ser Leu Asn Leu Ser
275 280 285
Lys Leu Phe Ile Asp Thr Met Ser Lys Ile Gly Trp Ala Tyr Asp Leu
290 295 300
Lys Ser Val Ser Pro Asp Ile Val Glu Lys Arg Val Lys Arg Thr Gly
305 310 315 320
Asp Gly Ser His His Val Trp Gly Trp Asp Asp Ala Pro Ser Glu Gln
325 330 335
Lys Val Ala Ala Thr Ile Val Asn Pro Asp Lys Thr Glu
340 345
<210> 68
<211> 1005
<212> DNA
<213> Artificial sequence
<220>
<223> Artificial sequence
<220>
<221> misc_feature
<222> (1)..(1005)
<223> Cpo_SPTQ, codon-optimised for Y. lipolytica
<400> 68
atggccccct actctgagga gtacgagatc ctgaaggaga atactaagcc cgtatctccc 60
caggccgccc ccagagagta caccgttgtg tactctgtgg tgcttatctt tgtttactgg 120
cacatcggag ccctgtacgg actgtacctg ggcttcacct ccgccaagtg ggccaccatc 180
atctttaact acctgatcta cgtgtctggc ggcttcgcca ttactgctgg atcccatcga 240
ctgtggtctc accgagcctt caaggctaag ctccccctgc agatcctgct catgcttctg 300
cagaccatgt cttgtcagaa gtctgtgctg aactgggtgc gagatcaccg actgcaccac 360
atgtactgtg ataccgatgc cgacccttac aactctactc gaggaatctt ctactctcac 420
atcggctggc tgatggtgaa gaagcatcct gaggtgatcc gaaagggccg aaccatcgac 480
atgtccgatc tggagaacaa ccctgtgctg aagttccaga agaagttcta ccccatcctc 540
gtgaccctga tggcctttat cctgcctgcc ctgatccccg ttattttctg gcaggagtct 600
ctgaacatcg ctcaccacgt ttctcttgtg cacctggtcg tgggctccca catgaccttt 660
gccattaact ctattgccca cgccttcgga tctaagcctt gcgacaagac catctctccc 720
actcagtcca tttccctgtc tctggtgacc ttcggcgaag gctaccataa ctaccaccac 780
gtgttcccct ttgattaccg agtggccgag ctgggcaaca actacctgaa cctgaccacc 840
aacttcatcg acttcttcgc ctggattggc tgggcctacg acctgaagta cgcctctccc 900
gatatggttg ctaagcgagc caagcgaacc ggcgacggaa ctgacctgtg gggacgagct 960
attgagcacg ccgatattca ggctaagcgg gtgcacccct cttaa 1005
<210> 69
<211> 334
<212> PRT
<213> Cydia pomonella
<400> 69
Met Ala Pro Tyr Ser Glu Glu Tyr Glu Ile Leu Lys Glu Asn Thr Lys
1 5 10 15
Pro Val Ser Pro Gln Ala Ala Pro Arg Glu Tyr Thr Val Val Tyr Ser
20 25 30
Val Val Leu Ile Phe Val Tyr Trp His Ile Gly Ala Leu Tyr Gly Leu
35 40 45
Tyr Leu Gly Phe Thr Ser Ala Lys Trp Ala Thr Ile Ile Phe Asn Tyr
50 55 60
Leu Ile Tyr Val Ser Gly Gly Phe Ala Ile Thr Ala Gly Ser His Arg
65 70 75 80
Leu Trp Ser His Arg Ala Phe Lys Ala Lys Leu Pro Leu Gln Ile Leu
85 90 95
Leu Met Leu Leu Gln Thr Met Ser Cys Gln Lys Ser Val Leu Asn Trp
100 105 110
Val Arg Asp His Arg Leu His His Met Tyr Cys Asp Thr Asp Ala Asp
115 120 125
Pro Tyr Asn Ser Thr Arg Gly Ile Phe Tyr Ser His Ile Gly Trp Leu
130 135 140
Met Val Lys Lys His Pro Glu Val Ile Arg Lys Gly Arg Thr Ile Asp
145 150 155 160
Met Ser Asp Leu Glu Asn Asn Pro Val Leu Lys Phe Gln Lys Lys Phe
165 170 175
Tyr Pro Ile Leu Val Thr Leu Met Ala Phe Ile Leu Pro Ala Leu Ile
180 185 190
Pro Val Ile Phe Trp Gln Glu Ser Leu Asn Ile Ala His His Val Ser
195 200 205
Leu Val His Leu Val Val Gly Ser His Met Thr Phe Ala Ile Asn Ser
210 215 220
Ile Ala His Ala Phe Gly Ser Lys Pro Cys Asp Lys Thr Ile Ser Pro
225 230 235 240
Thr Gln Ser Ile Ser Leu Ser Leu Val Thr Phe Gly Glu Gly Tyr His
245 250 255
Asn Tyr His His Val Phe Pro Phe Asp Tyr Arg Val Ala Glu Leu Gly
260 265 270
Asn Asn Tyr Leu Asn Leu Thr Thr Asn Phe Ile Asp Phe Phe Ala Trp
275 280 285
Ile Gly Trp Ala Tyr Asp Leu Lys Tyr Ala Ser Pro Asp Met Val Ala
290 295 300
Lys Arg Ala Lys Arg Thr Gly Asp Gly Thr Asp Leu Trp Gly Arg Ala
305 310 315 320
Ile Glu His Ala Asp Ile Gln Ala Lys Arg Val His Pro Ser
325 330
<210> 70
<211> 1362
<212> DNA
<213> Artificial sequence
<220>
<223> codon-optimized nucleotide sequence
<220>
<221> misc_feature
<222> (1)..(1362)
<223> S. cerevisiae-codon-optimized nucleotide sequence of H. subflexa
fatty acyl reductase; mRNA-coding sequence.
<400> 70
atggttgtct tgacctccaa agaaactaag ccatctgttg ctgaatttta cgctggtaag 60
tctgttttca ttactggtgg tactggtttc ttgggtaagg ttttcattga aaagttgttg 120
tactcctgcc cagatatcgg taatatctac atgttgatca gagaaaagaa gggtttgtcc 180
gtttccgaaa gaatcaagca ctttttggat gatcctttgt tcaccagatt gaaagaaaaa 240
agaccagccg acttggaaaa gatcgttttg attccaggtg atattactgc tccagatttg 300
ggtattacct ccgaaaacga aaagatgttg atcgaaaagg tcagtgtcat tattcattct 360
gctgctaccg ttaagttcaa cgaaccattg ccaactgctt ggaagattaa cgttgaaggt 420
actagaatga tgttggcctt gtctagaaga atgaagagaa tcgaagtttt catccatatc 480
tctaccgctt acactaacac caacagagaa gttgttgacg aaatcttgta tccagctcca 540
gctgatattg atcaagttca ccaatatgtt aaggacggta tctctgaaga agaaactgaa 600
aaaatcttga acggtagacc aaacacttac actttcacta aggctttgac cgaacatttg 660
gttgctgaaa atcaagctta cgttccaacc attatcgtta gaccatcagt tgttgctgcc 720
attaaggatg aacctattaa gggttggttg ggtaattggt atggtgctac aggtttgact 780
gtttttactg ctaagggttt gaacagagtt atctacggtc actcttctaa catcgttgat 840
ttgatcccag ttgattacgt tgccaacttg gttattgctg ctggtgctaa atcttctaag 900
tctactgaat tgaaggtcta caactgctgt tcttctgctt gtaacccaat tactatcggt 960
aagttgatgt ccatgtttgc tgaagatgct atcaagcaaa agtcttacgc tatgccattg 1020
ccaggttggt acatttttac taagtacaag tggttggtct tgttgttgac cattttgttc 1080
caagttattc cagcctacat taccgacttg tacagacatt tgattggtaa gaacccaaga 1140
tatatcaagt tgcaatcctt ggtcaatcaa accagatcct ccattgattt cttcaccaac 1200
cattcttggg ttatgaaggc tgatagagtc agagaattat tcgcttcttt gtctccagca 1260
gataagtact tgtttccatg tgatccagtc aacatcaatt ggagacaata tatccaagat 1320
tactgctggg gtgttagaca tttcttggaa aaaaagactt aa 1362
<210> 71
<211> 453
<212> PRT
<213> Heliothis subflexa
<400> 71
Met Val Val Leu Thr Ser Lys Glu Thr Lys Pro Ser Val Ala Glu Phe
1 5 10 15
Tyr Ala Gly Lys Ser Val Phe Ile Thr Gly Gly Thr Gly Phe Leu Gly
20 25 30
Lys Val Phe Ile Glu Lys Leu Leu Tyr Ser Cys Pro Asp Ile Gly Asn
35 40 45
Ile Tyr Met Leu Ile Arg Glu Lys Lys Gly Leu Ser Val Ser Glu Arg
50 55 60
Ile Lys His Phe Leu Asp Asp Pro Leu Phe Thr Arg Leu Lys Glu Lys
65 70 75 80
Arg Pro Ala Asp Leu Glu Lys Ile Val Leu Ile Pro Gly Asp Ile Thr
85 90 95
Ala Pro Asp Leu Gly Ile Thr Ser Glu Asn Glu Lys Met Leu Ile Glu
100 105 110
Lys Val Ser Val Ile Ile His Ser Ala Ala Thr Val Lys Phe Asn Glu
115 120 125
Pro Leu Pro Thr Ala Trp Lys Ile Asn Val Glu Gly Thr Arg Met Met
130 135 140
Leu Ala Leu Ser Arg Arg Met Lys Arg Ile Glu Val Phe Ile His Ile
145 150 155 160
Ser Thr Ala Tyr Thr Asn Thr Asn Arg Glu Val Val Asp Glu Ile Leu
165 170 175
Tyr Pro Ala Pro Ala Asp Ile Asp Gln Val His Gln Tyr Val Lys Asp
180 185 190
Gly Ile Ser Glu Glu Glu Thr Glu Lys Ile Leu Asn Gly Arg Pro Asn
195 200 205
Thr Tyr Thr Phe Thr Lys Ala Leu Thr Glu His Leu Val Ala Glu Asn
210 215 220
Gln Ala Tyr Val Pro Thr Ile Ile Val Arg Pro Ser Val Val Ala Ala
225 230 235 240
Ile Lys Asp Glu Pro Ile Lys Gly Trp Leu Gly Asn Trp Tyr Gly Ala
245 250 255
Thr Gly Leu Thr Val Phe Thr Ala Lys Gly Leu Asn Arg Val Ile Tyr
260 265 270
Gly His Ser Ser Asn Ile Val Asp Leu Ile Pro Val Asp Tyr Val Ala
275 280 285
Asn Leu Val Ile Ala Ala Gly Ala Lys Ser Ser Lys Ser Thr Glu Leu
290 295 300
Lys Val Tyr Asn Cys Cys Ser Ser Ala Cys Asn Pro Ile Thr Ile Gly
305 310 315 320
Lys Leu Met Ser Met Phe Ala Glu Asp Ala Ile Lys Gln Lys Ser Tyr
325 330 335
Ala Met Pro Leu Pro Gly Trp Tyr Ile Phe Thr Lys Tyr Lys Trp Leu
340 345 350
Val Leu Leu Leu Thr Ile Leu Phe Gln Val Ile Pro Ala Tyr Ile Thr
355 360 365
Asp Leu Tyr Arg His Leu Ile Gly Lys Asn Pro Arg Tyr Ile Lys Leu
370 375 380
Gln Ser Leu Val Asn Gln Thr Arg Ser Ser Ile Asp Phe Phe Thr Asn
385 390 395 400
His Ser Trp Val Met Lys Ala Asp Arg Val Arg Glu Leu Phe Ala Ser
405 410 415
Leu Ser Pro Ala Asp Lys Tyr Leu Phe Pro Cys Asp Pro Val Asn Ile
420 425 430
Asn Trp Arg Gln Tyr Ile Gln Asp Tyr Cys Trp Gly Val Arg His Phe
435 440 445
Leu Glu Lys Lys Thr
450
<210> 72
<211> 1371
<212> DNA
<213> Artificial sequence
<220>
<223> codon-optimized nucleotide sequence
<220>
<221> misc_feature
<222> (1)..(1371)
<223> S. cerevisiae-codon-optimized nucleotide sequence of H. assulta
fatty acyl reductase; mRNA-coding sequence.
<400> 72
atggttgtct tgacctccaa agaaactaag ccatctgttg ctgaatttta cgctggtaag 60
tctgttttca ttactggtgg tactggtttc ttgggtaaga tcttcattga aaagttgttg 120
tactcctgcc cagatatcgg taatatctac atgttgatca gagaaaagaa gggtttgtcc 180
gtttccgaaa gaatcaagca atttttggat gaccctttgt tcaccagatt gaaagaaaaa 240
agaccagccg acttggaaaa gatcgttttg attccaggtg atattactgc tccagatttg 300
ggtattacct ccgaaaacga aaagatgttg atcgaaaagg tcagtgtcat tattcattct 360
gctgctaccg ttaagttcaa cgaaccattg ccaactgctt ggaagattaa cgttgaaggt 420
actagaatga tgttggcctt gtctagaaga atgaagagaa tcgaagtttt catccatatc 480
tctaccgctt acactaacac caacagagaa gttgttgacg aaatcttgta tccagctcca 540
gctgatattg atcaagttca ccaatatgtt aaggacggta tctctgaaga agaaactgaa 600
aaaatcttga acggtagacc aaacacttac actttcacta aggctttgac cgaacatttg 660
gttgctgaaa atcaagctta cgttccaacc attatcgtta gaccatcagt tgttgctgcc 720
attaaggatg aacctattaa gggttggttg ggtaattggt atggtgctac aggtttgact 780
gtttttactg ctaagggttt gaacagagtt atctacggtc attcctctta catcgttgat 840
ttgatcccag ttgattacgt tgccaacttg gttattgctg ctggtgctaa atcttctaag 900
tctactgaat tgaaggtcta caactgctgt tcttctgctt gtaacccaat tactatcggt 960
aagttgatgt ccatgtttgc tgaagatgct atcaagcaaa agtcttacgc tatgccattg 1020
ccaggttggt atgtttttac aaagtacaag tggttggtct tgttgttgac cattttgttc 1080
caagttattc cagcctacat taccgacttg tacagacatt tgattggtaa gaacccaaga 1140
tatatcaagt tgcaatcctt ggtcaatcaa accagatcct ccattgattt cttcacctct 1200
cattcttggg ttatgaaggc tgatagagtc agagaattat tcgcttcttt gtctccagca 1260
gataagtact tgtttccatg tgatccaacc gatattaact ggacccatta cattcaagat 1320
tactgctggg gtgttagaca cttcttggaa aaaaagacta ccaacaagta a 1371
<210> 73
<211> 456
<212> PRT
<213> Helicoverpa assulta
<400> 73
Met Val Val Leu Thr Ser Lys Glu Thr Lys Pro Ser Val Ala Glu Phe
1 5 10 15
Tyr Ala Gly Lys Ser Val Phe Ile Thr Gly Gly Thr Gly Phe Leu Gly
20 25 30
Lys Ile Phe Ile Glu Lys Leu Leu Tyr Ser Cys Pro Asp Ile Gly Asn
35 40 45
Ile Tyr Met Leu Ile Arg Glu Lys Lys Gly Leu Ser Val Ser Glu Arg
50 55 60
Ile Lys Gln Phe Leu Asp Asp Pro Leu Phe Thr Arg Leu Lys Glu Lys
65 70 75 80
Arg Pro Ala Asp Leu Glu Lys Ile Val Leu Ile Pro Gly Asp Ile Thr
85 90 95
Ala Pro Asp Leu Gly Ile Thr Ser Glu Asn Glu Lys Met Leu Ile Glu
100 105 110
Lys Val Ser Val Ile Ile His Ser Ala Ala Thr Val Lys Phe Asn Glu
115 120 125
Pro Leu Pro Thr Ala Trp Lys Ile Asn Val Glu Gly Thr Arg Met Met
130 135 140
Leu Ala Leu Ser Arg Arg Met Lys Arg Ile Glu Val Phe Ile His Ile
145 150 155 160
Ser Thr Ala Tyr Thr Asn Thr Asn Arg Glu Val Val Asp Glu Ile Leu
165 170 175
Tyr Pro Ala Pro Ala Asp Ile Asp Gln Val His Gln Tyr Val Lys Asp
180 185 190
Gly Ile Ser Glu Glu Glu Thr Glu Lys Ile Leu Asn Gly Arg Pro Asn
195 200 205
Thr Tyr Thr Phe Thr Lys Ala Leu Thr Glu His Leu Val Ala Glu Asn
210 215 220
Gln Ala Tyr Val Pro Thr Ile Ile Val Arg Pro Ser Val Val Ala Ala
225 230 235 240
Ile Lys Asp Glu Pro Ile Lys Gly Trp Leu Gly Asn Trp Tyr Gly Ala
245 250 255
Thr Gly Leu Thr Val Phe Thr Ala Lys Gly Leu Asn Arg Val Ile Tyr
260 265 270
Gly His Ser Ser Tyr Ile Val Asp Leu Ile Pro Val Asp Tyr Val Ala
275 280 285
Asn Leu Val Ile Ala Ala Gly Ala Lys Ser Ser Lys Ser Thr Glu Leu
290 295 300
Lys Val Tyr Asn Cys Cys Ser Ser Ala Cys Asn Pro Ile Thr Ile Gly
305 310 315 320
Lys Leu Met Ser Met Phe Ala Glu Asp Ala Ile Lys Gln Lys Ser Tyr
325 330 335
Ala Met Pro Leu Pro Gly Trp Tyr Val Phe Thr Lys Tyr Lys Trp Leu
340 345 350
Val Leu Leu Leu Thr Ile Leu Phe Gln Val Ile Pro Ala Tyr Ile Thr
355 360 365
Asp Leu Tyr Arg His Leu Ile Gly Lys Asn Pro Arg Tyr Ile Lys Leu
370 375 380
Gln Ser Leu Val Asn Gln Thr Arg Ser Ser Ile Asp Phe Phe Thr Ser
385 390 395 400
His Ser Trp Val Met Lys Ala Asp Arg Val Arg Glu Leu Phe Ala Ser
405 410 415
Leu Ser Pro Ala Asp Lys Tyr Leu Phe Pro Cys Asp Pro Thr Asp Ile
420 425 430
Asn Trp Thr His Tyr Ile Gln Asp Tyr Cys Trp Gly Val Arg His Phe
435 440 445
Leu Glu Lys Lys Thr Thr Asn Lys
450 455
<210> 74
<211> 1362
<212> DNA
<213> Helicoverpa virescens
<400> 74
atggttgtct tgacctccaa agaaactaag ccatctgttg ctgaatttta cgctggtaag 60
tctgttttca ttactggtgg tactggtttc ttgggtaagg ttttcattga aaagttgttg 120
tactcctgcc cagatatcgt taacatctac atgttgatca gagaaaagaa gggtttgtcc 180
gtttccgaaa gaatcaagca atttttggat gaccctttgt tcaccagatt gaaggacaaa 240
agaccagctg atttggaaaa gatcgttttg attccaggtg atattaccgc tccagatttg 300
ggtattactg ctgctaacga aaagatgttg atcgaaaagg tttccgtcat tattcattct 360
gctgctaccg ttaagttcaa cgaaccattg ccaactgctt ggaagattaa cgttgaaggt 420
actagaatga tgttggcctt gtctagaaga atgaagagaa tcgaagtttt catccatatc 480
tctaccgctt acactaacac caacagagaa gttgttgacg aaatcttgta tccagctcca 540
gctgatattg atcaagttta ccaatacgtc aaagaaggta tctccgaaga agataccgaa 600
aaaatcttga acggtagacc aaacacttac actttcacta aggctttgac cgaacatttg 660
gttgctgaaa atcaagctta cgttccaacc attatcgtta gaccatcagt tgttgctgcc 720
attaaggatg aaccattgaa aggttggttg ggtaattggt ttggtgctac aggtttgact 780
gtttttactg ctaagggttt gaacagagtt atctacggtc attccaacta catcgttgat 840
ttgatcccag ttgattacgt tgccaacttg gttattgctg ctggtgctaa atctaacacc 900
tcttctgaat tgaaggtcta caactgttgt tcctcatcat gtaacccagt taagatcggt 960
actttgatgt ctatgtttgc tgatgatgcc atcaagcaaa agtcttatgc tatgccattg 1020
ccaggttggt acatttttac taagtacaag tggttggtct tgttgttgac cttcttgttc 1080
caagttattc cagcctacat taccgatttg tcaagacact tggttggtaa gagtccaaga 1140
tatatcaagt tgcaatcctt ggtcaatcaa accagatcct ccattgattt cttcaccaat 1200
cattcttggg ttatgaaggc cgatagagtc agagaattat acgcttcttt gtctccagca 1260
gataagtact tgtttccatg tgatccagtt aacatcaact ggacccaata cttgcaagat 1320
tactgttggg gtgttagaaa cttcttggaa aaaaagactt aa 1362
<210> 75
<211> 453
<212> PRT
<213> Helicoverpa virescens
<400> 75
Met Val Val Leu Thr Ser Lys Glu Thr Lys Pro Ser Val Ala Glu Phe
1 5 10 15
Tyr Ala Gly Lys Ser Val Phe Ile Thr Gly Gly Thr Gly Phe Leu Gly
20 25 30
Lys Val Phe Ile Glu Lys Leu Leu Tyr Ser Cys Pro Asp Ile Val Asn
35 40 45
Ile Tyr Met Leu Ile Arg Glu Lys Lys Gly Leu Ser Val Ser Glu Arg
50 55 60
Ile Lys Gln Phe Leu Asp Asp Pro Leu Phe Thr Arg Leu Lys Asp Lys
65 70 75 80
Arg Pro Ala Asp Leu Glu Lys Ile Val Leu Ile Pro Gly Asp Ile Thr
85 90 95
Ala Pro Asp Leu Gly Ile Thr Ala Ala Asn Glu Lys Met Leu Ile Glu
100 105 110
Lys Val Ser Val Ile Ile His Ser Ala Ala Thr Val Lys Phe Asn Glu
115 120 125
Pro Leu Pro Thr Ala Trp Lys Ile Asn Val Glu Gly Thr Arg Met Met
130 135 140
Leu Ala Leu Ser Arg Arg Met Lys Arg Ile Glu Val Phe Ile His Ile
145 150 155 160
Ser Thr Ala Tyr Thr Asn Thr Asn Arg Glu Val Val Asp Glu Ile Leu
165 170 175
Tyr Pro Ala Pro Ala Asp Ile Asp Gln Val Tyr Gln Tyr Val Lys Glu
180 185 190
Gly Ile Ser Glu Glu Asp Thr Glu Lys Ile Leu Asn Gly Arg Pro Asn
195 200 205
Thr Tyr Thr Phe Thr Lys Ala Leu Thr Glu His Leu Val Ala Glu Asn
210 215 220
Gln Ala Tyr Val Pro Thr Ile Ile Val Arg Pro Ser Val Val Ala Ala
225 230 235 240
Ile Lys Asp Glu Pro Leu Lys Gly Trp Leu Gly Asn Trp Phe Gly Ala
245 250 255
Thr Gly Leu Thr Val Phe Thr Ala Lys Gly Leu Asn Arg Val Ile Tyr
260 265 270
Gly His Ser Asn Tyr Ile Val Asp Leu Ile Pro Val Asp Tyr Val Ala
275 280 285
Asn Leu Val Ile Ala Ala Gly Ala Lys Ser Asn Thr Ser Ser Glu Leu
290 295 300
Lys Val Tyr Asn Cys Cys Ser Ser Ser Cys Asn Pro Val Lys Ile Gly
305 310 315 320
Thr Leu Met Ser Met Phe Ala Asp Asp Ala Ile Lys Gln Lys Ser Tyr
325 330 335
Ala Met Pro Leu Pro Gly Trp Tyr Ile Phe Thr Lys Tyr Lys Trp Leu
340 345 350
Val Leu Leu Leu Thr Phe Leu Phe Gln Val Ile Pro Ala Tyr Ile Thr
355 360 365
Asp Leu Ser Arg His Leu Val Gly Lys Ser Pro Arg Tyr Ile Lys Leu
370 375 380
Gln Ser Leu Val Asn Gln Thr Arg Ser Ser Ile Asp Phe Phe Thr Asn
385 390 395 400
His Ser Trp Val Met Lys Ala Asp Arg Val Arg Glu Leu Tyr Ala Ser
405 410 415
Leu Ser Pro Ala Asp Lys Tyr Leu Phe Pro Cys Asp Pro Val Asn Ile
420 425 430
Asn Trp Thr Gln Tyr Leu Gln Asp Tyr Cys Trp Gly Val Arg Asn Phe
435 440 445
Leu Glu Lys Lys Thr
450
<210> 76
<211> 507
<212> PRT
<213> Cydia pomonella
<400> 76
Met Asp Met Ile Asp Glu Ala Glu Ala Arg Gly Glu Ser Gln Ile Gln
1 5 10 15
Lys Phe Leu Ser Gly Ser Thr Ile Leu Leu Thr Gly Gly Thr Gly Phe
20 25 30
Leu Gly Lys Leu Leu Val Glu Lys Leu Leu Arg Thr Cys Pro Asp Ile
35 40 45
Lys Lys Ile Tyr Leu Leu Ala Arg Pro Lys Lys Asn Lys Glu Ile Gln
50 55 60
Lys Arg Leu Gln Glu Gln Phe Glu Asp Pro Leu Tyr Glu Arg Leu Arg
65 70 75 80
Lys Gln Val Pro Asp Phe Met Ser Lys Ile Gly Val Val Glu Gly Asp
85 90 95
Val Gly Lys Leu Gly Leu Gly Ile Ser Glu Ser Asp Arg Gln Thr Val
100 105 110
Val Asp Glu Val Asp Val Ile Phe His Gly Ala Ala Thr Leu Arg Phe
115 120 125
Asn Glu Pro Leu Arg Asp Ala Val Phe Ile Asn Val Arg Gly Thr Arg
130 135 140
Glu Met Met Leu Leu Ala Arg Ala Cys Thr Lys Leu Lys Ala Met Val
145 150 155 160
His Ile Ser Thr Ala Tyr Ser Asn Cys Thr Leu Ser Glu Ile Asp Glu
165 170 175
Val Phe Tyr Glu Ser Pro Ile Pro Gly Asp Lys Leu Ile Asp Leu Ala
180 185 190
Glu Ser Leu Asp Glu Lys Thr Ile Asn Ser Ile Thr Pro Gly Leu Ile
195 200 205
Gly Asp Phe Pro Asn Thr Tyr Ala Tyr Thr Lys Gly Val Ala Glu Asp
210 215 220
Val Leu Gln Lys Tyr Ser Gln Gly Leu Pro Val Ala Val Val Arg Pro
225 230 235 240
Ser Ile Val Ile Gly Thr Ala Lys Asp Pro Val Ala Gly Trp Ile Asp
245 250 255
Asn Val Tyr Gly Pro Thr Gly Val Ile Val Gly Ala Glu Leu Gly Leu
260 265 270
Leu His Val Leu His Ala Ala Pro Asn Ala Ser Ala Ser Leu Val Pro
275 280 285
Gly Asp Ala Val Ala Ala Ala Cys Val Ala Ala Ala Trp Ser Val Ser
290 295 300
Arg Ala Glu Asn His Gln Ala Pro Ala Arg Asp Ala Pro Pro Leu Tyr
305 310 315 320
His Cys Val Cys Ser Glu Lys Ala Pro Ile Thr Trp Ser Gln Phe Met
325 330 335
Ser Leu Ala Glu Thr His Gly Leu Val Val Pro Pro Met Gln Ala Met
340 345 350
Trp Tyr Tyr Met Leu Thr Leu Thr Asn Ser Lys Ala Met Tyr Thr Leu
355 360 365
Leu Ala Leu Leu Met His Trp Ile Pro Ala Tyr Ile Ile Asp Gly Val
370 375 380
Cys Met Val Leu Gly Lys Lys Pro Gln Leu Arg Lys Ala Tyr Thr Lys
385 390 395 400
Ile Glu Gln Phe Ala Ala Val Ile Glu Phe Phe Ala Leu Arg Glu Trp
405 410 415
Arg Phe His Asn Asn Asn Met Thr Arg Leu Tyr Asn Glu Leu Cys Asp
420 425 430
Ala Asp Lys His Ile Tyr Asp Phe Asp Thr Ser Ala Ile Asp Trp Asn
435 440 445
Glu Phe Phe Ala Asn Tyr Met Lys Gly Ile Arg Val Tyr Leu Leu Lys
450 455 460
Asp Pro Val Ser Thr Ile Pro Glu Ser Leu Lys Arg His Lys Arg Leu
465 470 475 480
Lys Trp Leu His Tyr Ala Leu Leu Thr Val Leu Ser Leu Leu Val Leu
485 490 495
Arg Leu Leu Trp Phe Phe Val Ser Phe Leu Phe
500 505
<210> 77
<211> 346
<212> PRT
<213> Grapholita molesta
<400> 77
Met Pro Pro Glu Ser Lys Asn Val Pro Ile Gln Gln Asn Phe Arg Lys
1 5 10 15
Pro Leu Glu Phe Leu Pro Arg Lys Tyr Asp Val Val Tyr Glu Asn Val
20 25 30
Phe Leu His Ile Ala Gly His Ile Ser Ala Ala Tyr Gly Leu Tyr Leu
35 40 45
Cys Phe Thr Val Ala Lys Trp Gln Thr Ile Ala Leu Ala Phe Val Trp
50 55 60
Tyr His Leu Gly Lys Ile Gly Ile Ile Cys Gly Ala His Arg Leu Trp
65 70 75 80
Ser His Arg Cys Tyr Lys Ala Lys Met Pro Leu His Ile Ile Leu Met
85 90 95
Ile Cys Asn Cys Ile Gly Phe Glu Asn Thr Ala Ile Asn Trp Val Arg
100 105 110
Asn His Arg Met His His Lys His Ser Asp Thr Asp Gly Asp Pro His
115 120 125
Asn Ser Asn Arg Gly Ala Phe Phe Ser His Ile Gly Trp Leu Cys Val
130 135 140
Arg Lys His Pro Glu Thr Arg Asn Cys Lys Val Asp Met Ser Asp Ile
145 150 155 160
Tyr Ser Asn Pro Val Leu Val Phe Gln Lys Arg Tyr Lys Tyr Pro Leu
165 170 175
Val Gly Phe Leu Cys Tyr Gly Leu Pro Thr Phe Ile Pro Met Tyr Phe
180 185 190
Trp Gly Glu Thr Leu Val Thr Ala Trp His Val Asn Ile Leu Arg Tyr
195 200 205
Phe Leu Ser Met Asn Ala Val Phe Leu Val Asn Ser Leu Ala His Leu
210 215 220
Tyr Gly Asn Lys Pro Tyr Asp Ile Ser Ile Cys Pro Arg Gln Ser Pro
225 230 235 240
Phe Val Ser Leu Leu Thr Ile Gly Glu Gly Phe His Asn Tyr His His
245 250 255
Thr Phe Pro Trp Asp Tyr Arg Ala Ala Glu Leu Gly Asn Asn Tyr Leu
260 265 270
Asn Val Gly Lys Trp Val Ile Asp Phe Phe Ala Met Ile Gly Trp Ala
275 280 285
Tyr Asp Leu Lys Thr Val Pro Asp Glu Thr Ile Lys Arg Arg Met Lys
290 295 300
Arg Thr Gly Asp Gly Thr Asn Cys Trp Gly Trp Gly Asp Lys Asp Met
305 310 315 320
Thr Arg Glu Asp Arg Asp Ile Ala Lys Ile Ile Tyr Pro Glu Ser Ile
325 330 335
Ser Lys Glu Glu Arg Asp Ile Ile Ala Met
340 345
<210> 78
<211> 1040
<212> DNA
<213> Grapholita molesta
<400> 78
atgcctccgg agtccaaaaa cgttcctatc cagcaaaatt ttaggaaacc actagaattt 60
ctcccgagga aatatgatgt ggtgtacgag aatgtatttc ttcacatcgc tggacatata 120
tctgcagctt acggcttata tctctgcttc actgtggcta aatggcagac tatcgccctt 180
gcattcgtct ggtaccacct gggcaagatt ggtataatct gtggcgccca ccggctttgg 240
tctcatcgct gctacaaagc caagatgcct ctgcatatta ttcttatgat atgtaattgt 300
ataggtttcg aaaacacagc cattaattgg gtaaggaatc atagaatgca ccacaagcac 360
agcgacacgg acggtgatcc ccacaactcg aatagaggag ctttcttttc ccacatcggt 420
tggctgtgtg tcaggaaaca tccggagact agaaactgta aagtcgacat gagtgatata 480
tacagcaatc ctgtattggt gtttcagaag agatataaat atcctttggt cggatttctc 540
tgttacggtc tacctacgtt tatacccatg tatttttggg gagagacttt ggtaacagct 600
tggcatgtga atattctgcg ttacttttta agtatgaatg ccgtttttct ggtcaacagc 660
ttggcgcatt tgtacggaaa taagccttat gacatatcaa tttgtccgcg acaaagtcct 720
tttgtgtcac ttttgaccat aggcgaggga ttccacaatt atcaccatac gtttccttgg 780
gactataggg cggcagaact aggcaataac tatctgaatg ttggaaaatg ggtcatagac 840
ttcttcgcta tgatcggctg ggcgtatgac ctcaaaacag ttccagatga aacgataaag 900
agaagaatga aaaggactgg agatggcacc aactgctggg gatgggggga caaggacatg 960
actagggagg acagagatat cgctaaaatc atctatcctg agtcgatatc gaaagaagaa 1020
agagatataa ttgcgatgga 1040
<210> 79
<211> 1041
<212> DNA
<213> Grapholita molesta
<400> 79
atgcctccgg agtccaaaaa cgttcctatc cagcaaaatt ttaggaaacc actagaattt 60
ctcccgagga aatatgatgt ggtgtacgag aatgtatttc ttcacatcgc tggacatata 120
tctgcagctt acggcttata tctctgcttc actgtggcta aatggcagac tatcgccctt 180
gcattcgtct ggtaccacct gggcaagatt ggtataatct gtggcgccca ccggctttgg 240
tctcatcgct gctacaaagc caagatgcct ctgcatatta ttcttatgat atgtaattgt 300
ataggtttcg aaaacacagc cattaattgg gtaaggaatc atagaatgca ccacaagcac 360
agcgacacgg acggtgatcc ccacaactcg aatagaggag ctttcttttc ccacatcggt 420
tggctgtgtg tcaggaaaca tccggagact agaaactgta aagtcgacat gagtgatata 480
tacagcaatc ctgtattggt gtttcagaag agatataaat atcctttggt cggatttctc 540
tgttacggtc tacctacgtt tatacccatg tatttttggg gagagacttt ggtaacagct 600
tggcatgtga atattctgcg ttacttttta agtatgaatg ccgtttttct ggtcaacagc 660
ttggcgcatt tgtacggaaa taagccttat gacatatcaa tttgtccgcg acaaagtcct 720
tttgtgtcac ttttgaccat aggcgaggga ttccacaatt atcaccatac gtttccttgg 780
gactataggg cggcagaact aggcaataac tatctgaatg ttggaaaatg ggtcatagac 840
ttcttcgcta tgatcggctg ggcgtatgac ctcaaaacag ttccagatga aacgataaag 900
agaagaatga aaaggactgg agatggcacc aactgctggg gatgggggga caaggacatg 960
actagggagg acagagatat cgctaaaatc atctatcctg agtcgatatc gaaagaagaa 1020
agagatataa ttgcgatgtg a 1041
<210> 80
<211> 1524
<212> DNA
<213> Cydia pomonella
<400> 80
atggacatga tcgacgaggc cgaggctcga ggcgagtctc agatccagaa gttcctgtct 60
ggctctacca tcctgctgac cggcggaacc ggcttcctgg gcaagctgct ggtcgagaag 120
ctgctgcgaa cctgtcctga catcaagaag atctacctgc tggctcgacc caagaagaac 180
aaggaaatcc agaagcgact gcaagagcag ttcgaggacc ctctgtacga gcgactccga 240
aagcaggtcc ccgacttcat gtctaagatc ggcgtggtcg agggcgacgt gggaaagctc 300
ggcctgggca tctctgagtc tgaccgacag accgtggtgg acgaggtgga cgtgatcttc 360
cacggcgctg ctaccctgcg attcaacgag cccctgcgag atgccgtgtt catcaacgtg 420
cgaggcaccc gagagatgat gctgctggcc cgagcctgca ccaagctgaa ggccatggtg 480
cacatctcta ccgcctactc taactgcacc ctgtctgaga ttgacgaggt gttctacgag 540
tctcccattc ctggcgacaa gctgatcgac ctggccgagt ctctggacga aaagaccatc 600
aactctatca cccctggcct gatcggcgac ttccccaaca cctacgccta caccaagggc 660
gtcgccgagg acgtgctgca gaagtactct cagggactgc ccgtggccgt ggtgcgaccc 720
tctatcgtga tcggcaccgc taaggacccc gtcgccggct ggatcgacaa cgtgtacggt 780
cccaccggtg tgattgtggg tgctgagctg ggcctgctgc acgtgctcca cgctgctccc 840
aacgcctctg cctctctggt gcccggtgac gctgtggctg ctgcttgcgt ggctgctgct 900
tggtctgtgt ctcgagccga gaaccatcag gctcccgctc gagatgcccc tcctctgtac 960
cactgcgtgt gctctgagaa ggctcccatc acctggtcgc agttcatgtc tctggccgag 1020
actcacggcc tggtggtgcc tccaatgcag gccatgtggt actacatgct gaccctgacc 1080
aactctaagg ccatgtacac cctgctcgcc ctgctgatgc actggatccc cgcctacatc 1140
atcgacggcg tgtgcatggt gctgggcaag aagccccagc tgcgaaaggc ttacaccaag 1200
atcgagcagt ttgccgccgt gatcgagttc ttcgctctgc gagagtggcg attccacaac 1260
aacaacatga cccgactgta caacgagctg tgcgacgccg acaagcacat ctacgacttc 1320
gacacctctg ccatcgactg gaacgagttc tttgccaact acatgaaggg catccgagtg 1380
tacctgctga aggaccctgt gtctactatc cctgagtctc tgaagcgaca caagcgactg 1440
aagtggctgc actacgccct gctcaccgtg ctgtctctgc tggtgctgcg actgctgtgg 1500
ttcttcgtgt ctttcctgtt ttag 1524
Claims (25)
- E8,E10-도데카디에닐 코엔자임 A 및 임의로, E8,E10-도데카디엔-1-올을 생산할 수 있는 효모 세포로서, 상기 효모 세포는 탄소 쇄 길이가 12인 지방 아실-CoA에 하나 이상의 이중 결합을 도입하여 상기 지방 아실-CoA를 탈포화된(desaturated) 지방 아실-CoA로 전환시킬 수 있는 적어도 하나의 이종성 데사투라제(heterologous desaturase)를 발현하고, 여기서 상기 탈포화된 지방 아실-CoA의 적어도 일부는 E8,E10-도데카디에닐 코엔자임 A (E8,E10-C12:CoA)이고,
여기서,
a) 적어도 하나의 데사투라제는 Cpo_CPRQ (서열 번호: 2), 또는 이와 적어도 80%의 동일성(identity), 예컨대, 서열 번호: 2와 적어도 81%, 예컨대, 적어도 82%, 예컨대, 적어도 83%, 예컨대, 적어도 84%, 예컨대, 적어도 85%, 예컨대, 적어도 86%, 예컨대, 적어도 87%, 예컨대, 적어도 88%, 예컨대, 적어도 89%, 예컨대, 적어도 90%, 예컨대, 적어도 91%, 예컨대, 적어도 92%, 예컨대, 적어도 93%, 예컨대, 적어도 94%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%의 동일성을 갖는, 이의 기능성 변이체(functional variant) 이거나; 또는
b) 적어도 하나의 데사투라제는 적어도 2개의 데사투라제이고, 여기서 상기 2개의 데사투라제 중 적어도 하나는 Cpo_CPRQ (서열 번호: 2), 또는 이와 적어도 80%의 동일성, 예컨대, 서열 번호: 2와 적어도 81%, 예컨대, 적어도 82%, 예컨대, 적어도 83%, 예컨대, 적어도 84%, 예컨대, 적어도 85%, 예컨대, 적어도 86%, 예컨대, 적어도 87%, 예컨대, 적어도 88%, 예컨대, 적어도 89%, 예컨대, 적어도 90%, 예컨대, 적어도 91%, 예컨대, 적어도 92%, 예컨대, 적어도 93%, 예컨대, 적어도 94%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%의 동일성을 갖는, 이의 기능성 변이체이고, 다른 데사투라제는 탄소 쇄 길이가 12인 지방 아실-CoA에 적어도 하나의 이중 결합을 도입할 수 있는 데사투라제, 예컨대, Z9-12 데사투라제인 효모 세포. - 제1항에 있어서, 적어도 하나의 데사투라제가 적어도 2개의 데사투라제이고, 여기서 다른 데사투라제가 Cpo_NPVE (서열 번호: 67), Cpo_SPTQ (서열 번호: 69), 및 이와 적어도 80%의 동일성, 예컨대, 서열 번호: 67 또는 서열 번호: 69와 적어도 81%, 예컨대, 적어도 82%, 예컨대, 적어도 83%, 예컨대, 적어도 84%, 예컨대, 적어도 85%, 예컨대, 적어도 86%, 예컨대, 적어도 87%, 예컨대, 적어도 88%, 예컨대, 적어도 89%, 예컨대, 적어도 90%, 예컨대, 적어도 91%, 예컨대, 적어도 92%, 예컨대, 적어도 93%, 예컨대, 적어도 94%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%의 동일성을 갖는, 이의 기능성 변이체로부터 선택되는 효모 세포.
- 제1항 또는 제2항에 있어서, 효모 세포가 블라케슬레아(Blakeslea), 칸디다(Candida), 크립토코쿠스(Cryptococcus), 쿤닝하멜라(Cunninghamella), 리포마이세스(Lipomyces), 모르티에렐라(Mortierella), 무코르(Mucor), 피코마이세스(Phycomyces), 피시움(Pythium), 로도스포리디움(Rhodosporidium), 로도토룰라(Rhodotorula), 트리코스포론(Trichosporon), 사카로마이세스(Saccharomyces) 및 야로위아(Yarrowia)로부터 선택되는 속(genus)에 속하고, 임의로, 여기서 효모 세포가 블라케슬레아 트리스포라(Blakeslea trispora), 칸디다 풀케리마(Candida pulcherrima), C. 레브카우피(C. revkaufi), C. 트로피칼리스(C. tropicalis), 크립토코쿠스 쿠르바투스(Cryptococcus curvatus), 쿤닝하멜라 에키눌라타(Cunninghamella echinulata), C. 엘레간스(C. elegans), C. 자포니카(C. japonica), 리포마이세스 스타키(Lipomyces starkeyi), L. 리포페루스(L. lipoferus), 모르티에렐라 알피나(Mortierella alpina), M. 이사벨리나(M. isabellina), M. 라만니아나(M. ramanniana), M. 비나세아(M. vinacea), 무코르 키르키넬로이데스(Mucor circinelloides), 피코마이세스 블라케스레아누스(Phycomyces blakesleanus), 피시움 이레굴라레(Pythium irregulare), 로도스포리디움 토룰로이데스(Rhodosporidium toruloides), 로도토룰라 글루티니스(Rhodotorula glutinis), R. 그라실리스(R. gracilis), R. 그라미니스(R. graminis), R. 무실라기노사(R. mucilaginosa), R. 피니콜라(R. pinicola), 트리코스포론 풀란스(Trichosporon pullans), T. 쿠타네움(T. cutaneum), 사카로마이세스 세레비지아에(Saccharomyces cerevisiae) 및 야로위아 리폴리티카(Yarrowia lipolytica)로부터 선택되는 종(species)에 속하고, 바람직하게, 효모 세포가 야로위아 리폴리티카 세포 또는 사카로마이세스 세레비지아에 세포인 효모 세포.
- 제1항 내지 제3항 중 어느 한 항에 있어서, 효모 세포가 E8,E10-도데카디엔-1-올을 생산할 수 있고, 상기 효모 세포는 상기 탈포화된 지방 아실-CoA의 적어도 일부를 탈포화된 지방 알콜로 전환시킬 수 있는 적어도 하나의 이종성 지방 아실-CoA 리덕타제 (EC 1.2.1.84)로서, 여기서 지방 아실-CoA 리덕타제는 상기 E8,E10-도데카디에닐 코엔자임 A (E8,E10-C12:CoA)의 적어도 일부를 E8,E10-도데카디엔-1-올로 전환시킬 수 있는 적어도 하나의 이종성 지방 아실-CoA 리덕타제 (EC 1.2.1.84)를 추가로 발현하는 효모 세포.
- 제1항 내지 제4항 중 어느 한 항에 있어서, 데사투라제가 85번 위치에 돌연변이, 예컨대, S85A 돌연변이를 갖는 Cpo_CPRQ의 돌연변이체(mutant)이고/거나, 여기서 적어도 하나의 이종성 데사투라제가 적어도 2개의 상이한 이종성 데사투라제, 예컨대, 서열 번호: 2에 제시된 바와 같은 Cpo_CPRQ, 및 85번 위치에 돌연변이, 예컨대, S85A 돌연변이를 갖는 Cpo_CPRQ의 돌연변이체인 효모 세포.
- 제4항 또는 제5항에 있어서, 지방 아실-CoA 리덕타제가 Ase_FAR (서열 번호: 10), Aip_FAR (서열 번호: 61), Hs_FAR (서열 번호: 71), Has_FAR (서열 번호: 73), Hv_FAR (서열 번호: 75), Har_FAR (서열 번호: 12), Cpo_FAR (서열 번호: 76), 및 이와 적어도 80%의 동일성, 예컨대, 이와 적어도 81%, 예컨대, 적어도 82%, 예컨대, 적어도 83%, 예컨대, 적어도 84%, 예컨대, 적어도 85%, 예컨대, 적어도 86%, 예컨대, 적어도 87%, 예컨대, 적어도 88%, 예컨대, 적어도 89%, 예컨대, 적어도 90%, 예컨대, 적어도 91%, 예컨대, 적어도 92%, 예컨대, 적어도 93%, 예컨대, 적어도 94%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%의 동일성을 갖는, 이의 기능성 변이체로 구성된 군으로부터 선택되고, 임의로, 여기서 지방 아실-CoA 리덕타제가 Ase_FAR의 돌연변이체, 예컨대, 198번 또는 413번 위치에 돌연변이, 바람직하게, T198A 돌연변이 또는 S413A 돌연변이를 갖는 돌연변이체인 효모 세포.
- 제1항 내지 제6항 중 어느 한 항에 있어서, 하기:
- 이종성 시토크롬 b5, 예컨대, 레피도프테라 종으로부터의 시토크롬 b5, 예컨대, 헬리코베르파 아르미게라로부터의 시토크롬 b5, 바람직하게, 서열 번호: 4에 기재된 시토크롬 b5 HarCyb5, 또는 이와 적어도 80%의 동일성, 예컨대, 이와 적어도 85%, 예컨대, 적어도 90%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%의 동일성을 갖는, 이의 기능성 변이체를 발현하는 것;
- 이종성 시토크롬 b5 리덕타제 (EC 1.6.2.2), 예컨대, 레피도프테라 종, 예컨대, 헬리코베르파 아르미게라로부터의 시토크롬 b5 리덕타제를 발현하고, 바람직하게, 시토크롬 b5 리덕타제는 서열 번호: 24에 기재된, 헬리코베르파 아르미게라로부터의 시토크롬 b5 리덕타제, 또는 이와 적어도 80%의 동일성, 예컨대, 이와 적어도 85%, 예컨대, 적어도 90%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%의 동일성을 갖는, 이의 기능성 변이체인 것,
- 헤모글로빈, 예컨대, 비트레오스킬라 스테르코라리아로부터의 헤모글로빈, 바람직하게, 서열 번호: 6에 기재된, 비트레오스킬라 스테르코라리아로부터의 헤모글로빈, 또는 이와 적어도 80%의 동일성, 예컨대, 이와 적어도 85%, 예컨대, 적어도 90%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%의 동일성을 갖는, 이의 기능성 변이체를 발현하는 것,
- 엘롱가제(elongase)를 인코딩(encoding)하고, 엘롱가제 활성의 부분적 또는 전체적인 손실을 초래하는 하나 이상의 유전자의 돌연변이, 예컨대, Elo1 활성의 부분적 또는 전체적인 손실을 초래하는 ELO1 유전자 (서열 번호: 13)의 돌연변이를 포함하고, 바람직하게, 여기서 상기 돌연변이는 결실인 것,
- 티오에스테라제를 코딩하고, 티오에스테라제 활성의 부분적 또는 전체적인 손실을 초래하는 하나 이상의 유전자의 돌연변이, 예컨대, YAL10 _ F14729g 유전자 (서열 번호: 19)의 돌연변이, YALI0 _ E18876g 유전자 (서열 번호: 54)의 돌연변이, 또는 YALI0 _ D03597g (서열 번호: 55)의 돌연변이를 포함하고, 바람직하게, 여기서 상기 돌연변이는 결실인 것,
- Hfd1, Hfd2, Hfd3, Hfd4, Fao1, GPAT 및 Pex10 중 적어도 하나의 활성 감소를 초래하는 적어도 하나의 돌연변이를 포함하거나, 또는 적어도 하나의 단백질의 활성 감소를 초래하고, 이와 적어도 80%의 동일성, 예컨대, 이와 적어도 81%, 예컨대, 적어도 82%, 예컨대, 적어도 83%, 예컨대, 적어도 84%, 예컨대, 적어도 85%, 예컨대, 적어도 86%, 예컨대, 적어도 87%, 예컨대, 적어도 88%, 예컨대, 적어도 89%, 예컨대, 적어도 90%, 예컨대, 적어도 91%, 예컨대, 적어도 92%, 예컨대, 적어도 93%, 예컨대, 적어도 94%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%의 동일성을 갖는 돌연변이를 갖는 것,
- 변형된 케톤 신타제 도메인을 갖는 지방 아실 신타제 변이체를 발현하고, 여기서 상기 지방 아실 신타제 변이체는 Fas1 (서열 번호: 16), 또는 Fas2 (서열 번호: 18)의 변이체, 예컨대, 123번 위치에 돌연변이를 갖는 돌연변이체 Fas1, 바람직하게, L123V 돌연변이, 또는 1220번 위치에 돌연변이를 갖는 돌연변이체 Fas2, 바람직하게, I1220F 또는 I1220W 돌연변이인 것,
- 티오에스테라제, 예컨대, 이종성 티오에스테라제를 발현하고, 임의로, 여기서, 티오에스테라제는 높은 수준으로 발현되고, 예컨대, 티오에스테라제는 서열 번호: 33에 기재된, 쿠페아 팔루스트리스로부터의 티오에스테라제, 서열 번호: 57에 기재된, 쿠페아 후케리아나로부터의 티오에스테라제, 서열 번호: 35에 기재된, 신나모멈 캠포라로부터의 티오에스테라제, 또는 서열 번호: 26에 기재된, 에스케리키아 콜라이로부터의 티오에스테라제와 적어도 80%의 동일성을 갖고, 바람직하게, 티오에스테라제는 서열 번호: 35에 기재된, 신나모멈 캠포라로부터의 티오에스테라제, 또는 서열 번호: 26에 기재된, 에스케리키아 콜라이로부터의 티오에스테라제와 적어도 80%의 동일성을 갖는 것,
- 말단절단된 지방 아실 신타제 및 말단절단된 티오에스테라제의 융합 단백질, 예컨대, 서열 번호: 59에 기재된 융합 단백질, 또는 이와 적어도 80%의 동일성을 갖는, 이의 동족체(homologue)를 발현하는 것 중 하나 이상의 것을 추가로 갖는 효모 세포. - 제1항 내지 제7항 중 어느 한 항에 있어서, Hfd1, Hfd2, Hfd3, Hfd4, Fao1, GPAT 및 Pex10 중 적어도 하나의 활성 감소를 초래하는 적어도 하나의 돌연변이를 추가로 포함하거나, 또는 적어도 하나의 단백질의 활성 감소를 초래하고, 이와 적어도 80%의 동일성, 예컨대, 이와 적어도 81%, 예컨대, 적어도 82%, 예컨대, 적어도 83%, 예컨대, 적어도 84%, 예컨대, 적어도 85%, 예컨대, 적어도 86%, 예컨대, 적어도 87%, 예컨대, 적어도 88%, 예컨대, 적어도 89%, 예컨대, 적어도 90%, 예컨대, 적어도 91%, 예컨대, 적어도 92%, 예컨대, 적어도 93%, 예컨대, 적어도 94%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%의 동일성을 갖는 적어도 하나의 돌연변이를 갖는 효모 세포.
- 제1항 내지 제8항 중 어느 한 항에 있어서, 효모 세포가 적어도 0.5 mg/L, 예컨대, 적어도 0.6 mg/L, 예컨대, 적어도 0.7 mg/L, 예컨대, 적어도 0.8 mg/L, 예컨대, 적어도 0.9 mg/L, 예컨대, 적어도 1 mg/L, 예컨대, 적어도 1.5 mg/L, 예컨대, 적어도 2.5 mg/L, 예컨대, 적어도 5.0 mg/L, 예컨대, 적어도 10 mg/L, 예컨대, 적어도 15 mg/L, 예컨대, 적어도 20 mg/L, 예컨대, 25 mg/L, 예컨대, 적어도 50 mg/L, 예컨대, 적어도 100 mg/L, 예컨대, 적어도 250 mg/L, 예컨대, 적어도 500 mg/L, 예컨대, 적어도 750 mg/L, 예컨대, 적어도 1 g/L, 예컨대, 적어도 2 g/L, 예컨대, 적어도 3 g/L, 예컨대, 적어도 4 g/L, 예컨대, 적어도 5 g/L, 예컨대, 적어도 6 g/L, 예컨대, 적어도 7 g/L, 예컨대, 적어도 8 g/L, 예컨대, 적어도 9 g/L, 예컨대, 적어도 10 g/L 이상의 역가로 E8,E10-도데카디엔-1-올을 생산할 수 있는 효모 세포.
- 제1항 내지 제9항 중 어느 한 항에 있어서, 효모 세포가 E8,E10-도데카디엔-1-올의 적어도 일부를 E8,E10-도데카디에닐 아세테이트로 전환시킬 수 있는 아세틸트랜스퍼라제 (EC 2.3.1.84)를 추가로 발현하고, 이로써, 효모 세포는 E8,E10-도데카디에닐 아세테이트를 생산할 수 있고, 바람직하게, 여기서 아세틸트랜스퍼라제가 상기 효모 세포로부터 발현된 이종성 아세틸트랜스퍼라제 (AcT), 또는 상기 효모 세포로부터 과다발현된 천연 아세틸트랜스퍼라제이고, 바람직하게, 여기서 아세틸트랜스퍼라제가 Sc_Atf1 (서열 번호: 37), 또는 이와 적어도 80%의 동일성, 예컨대, Sc_Atf1 (서열 번호: 37)과 적어도 81%, 예컨대, 적어도 82%, 예컨대, 적어도 83%, 예컨대, 적어도 84%, 예컨대, 적어도 85%, 예컨대, 적어도 86%, 예컨대, 적어도 87%, 예컨대, 적어도 88%, 예컨대, 적어도 89%, 예컨대, 적어도 90%, 예컨대, 적어도 91%, 예컨대, 적어도 92%, 예컨대, 적어도 93%, 예컨대, 적어도 94%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%의 동일성을 갖는, 이의 기능성 변이체인 효모 세포.
- 제1항 내지 제10항 중 어느 한 항에 있어서, 효모 세포가 E8,E10-도데카디엔-1-올의 적어도 일부를 E8,E10-도데카디에날로 전환시킬 수 있는 알데히드 형성 지방 아실-CoA 리덕타제 (EC 1.2.1.50), 알콜 데히드로게나제 (EC 1.1.1.2) 및/또는 지방 알콜 옥시다제 (EC 1.1.3.20)를 추가로 발현하는 효모 세포.
- 제1항 내지 제11항 중 어느 한 항에 있어서, 효모 세포가 추가로
i) 하나 이상의 천연 아실-CoA 옥시다제의 활성을 감소시키는 하나 이상의 돌연변이를 갖고;
ii) 지방 아실-CoA를 산화시킬 수 있는 적어도 하나의 아실-CoA 옥시다제를 포함하는 효소의 적어도 하나의 군을 발현하고, 여기서 효소의 군은 제1 탄소 쇄 길이가 X인 지방 아실-CoA를 제2 탄소 쇄 길이 X'인 단축된 지방 아실-CoA로 단축시킬 수 있고, 여기서 X' ≤ X-2이고, 바람직하게, X'=12인 효모 세포. - 제1항 내지 제12항 중 어느 한 항에 있어서, 탄소 쇄 길이가 X인 지방 아실-CoA에 적어도 하나의 이중 결합을 도입할 수 있는 데사투라제, 예컨대, CroZ11 데사투라제 (서열 번호: 63), 또는 CpaE11 데사투라제 (서열 번호: 65), 또는 서열 번호: 63, 또는 서열 번호: 65와 적어도 80%의 동일성, 예컨대, 적어도 81%, 예컨대, 적어도 82%, 예컨대, 적어도 83%, 예컨대, 적어도 84%, 예컨대, 적어도 85%, 예컨대, 적어도 86%, 예컨대, 적어도 87%, 예컨대, 적어도 88%, 예컨대, 적어도 89%, 예컨대, 적어도 90%, 예컨대, 적어도 91%, 예컨대, 적어도 92%, 예컨대, 적어도 93%, 예컨대, 적어도 94%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%의 동일성을 갖는, 이의 기능성 변이체를 추가로 발현하는 효모 세포.
- 효모 세포를 제공하는 단계, 및 배지 중에서 상기 효모 세포를 인큐베이션(incubation)시키는 단계를 포함하여, E8,E10-도데카디에닐 코엔자임 A 및 임의로, E8,E10- 도데카디엔-1-올을 생산하는 방법으로서 여기서 효모 세포는:
i) 탄소 쇄 길이가 12인 지방 아실-CoA에 하나 이상의 이중 결합을 도입하여 상기 지방 아실-CoA를 탈포화된 지방 아실-CoA로 전환시킬 수 있는 적어도 하나의 이종성 데사투라제로서, 여기서 상기 탈포화된 지방 아실-CoA의 적어도 일부는 E8,E10-도데카디에닐 코엔자임 A (E8,E10-C12:CoA)이고; 여기서,
a) 적어도 하나의 데사투라제는 Cpo_CPRQ (서열 번호: 2), 또는 이와 적어도 80%의 동일성, 예컨대, 서열 번호: 2와 적어도 81%, 예컨대, 적어도 82%, 예컨대, 적어도 83%, 예컨대, 적어도 84%, 예컨대, 적어도 85%, 예컨대, 적어도 86%, 예컨대, 적어도 87%, 예컨대, 적어도 88%, 예컨대, 적어도 89%, 예컨대, 적어도 90%, 예컨대, 적어도 91%, 예컨대, 적어도 92%, 예컨대, 적어도 93%, 예컨대, 적어도 94%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%의 동일성을 갖는, 이의 기능성 변이체이거나; 또는
b) 적어도 하나의 데사투라제는 적어도 2개의 데사투라제이고, 여기서 상기 2개의 데사투라제 중 적어도 하나는 Cpo_CPRQ (서열 번호: 2), 또는 이와 적어도 80%의 동일성, 예컨대, 서열 번호: 2와 적어도 81%, 예컨대, 적어도 82%, 예컨대, 적어도 83%, 예컨대, 적어도 84%, 예컨대, 적어도 85%, 예컨대, 적어도 86%, 예컨대, 적어도 87%, 예컨대, 적어도 88%, 예컨대, 적어도 89%, 예컨대, 적어도 90%, 예컨대, 적어도 91%, 예컨대, 적어도 92%, 예컨대, 적어도 93%, 예컨대, 적어도 94%, 예컨대, 적어도 95%, 예컨대, 적어도 96%, 예컨대, 적어도 97%, 예컨대, 적어도 98%, 예컨대, 적어도 99%의 동일성을 갖는, 이의 기능성 변이체이고, 다른 데사투라제는 탄소 쇄 길이가 12인 지방 아실-CoA에 적어도 하나의 이중 결합을 도입할 수 있는 데사투라제, 예컨대, Z9-12 데사투라제인 적어도 하나의 이종성 데사투라제; 및
ii) 임의로, 상기 탈포화된 지방 아실-CoA의 적어도 일부를 탈포화된 지방 알콜로 전환시킬 수 있는 적어도 하나의 이종성 지방 아실-CoA 리덕타제 (EC 1.2.1.84)로서, 여기서, 지방 아실-CoA 리덕타제는 상기 E8,E10-도데카디에닐 코엔자임 A (E8,E10-C12:CoA)의 적어도 일부를 E8,E10-도데카디엔-1-올로 전환시킬 수 있는 것인 적어도 하나의 이종성 지방 아실-CoA 리덕타제 (EC 1.2.1.84)를 발현하는,
효모 세포에서 E8,E10-도데카디에닐 코엔자임 A 및 임의로, E8,E10-도데카디엔-1-올을 생산하는 방법. - 제14항에 있어서, 방법이 E8,E10-도데카디에닐 코엔자임 A를 지질, 예컨대, 트리아실글리세리드로, 또는 유리 지방산으로 전환시키는 단계, 상기 지질 또는 유리 지방산을 회수하는 단계, 및 상기 지질 또는 유리 지방산을 E8,E10-도데카디엔-1-올로 전환시키는 단계를 추가로 포함하는 방법.
- 제14항 또는 제15항에 있어서, 방법이 상기 E8,E10-도데카디엔-1-올을 회수하는 단계를 추가로 포함하고,
바람직하게, 여기서 효모 세포가 제1항 내지 제13항 중 어느 한 항에서 정의된 것과 같은 방법. - 제14항 내지 제16항 중 어느 한 항에 있어서, 아세틸트랜스퍼라제의 발현에 의해, 또는 화학적 전환에 의해 E8,E10-도데카디엔-1-올의 적어도 일부를 E8,E10-도데카디에닐 아세테이트로 전환시킴으로써, E8,E10-도데카디에닐 아세테이트를 추가로 생산하는 단계를 추가로 포함하고, 임의로 상기 E8,E10-도데카디에닐 아세테이트를 회수하는 단계를 추가로 포함하는 방법.
- 제14항 내지 제17항 중 어느 한 항에 있어서, E8,E10-도데카디엔-1-올의 적어도 일부를 E8,E10-도데카디에날로 전환시킬 수 있는 알데히드 형성 지방 아실-CoA 리덕타제 (EC 1.2.1.50), 알콜 데히드로게나제 (EC 1.1.1.2) 및/또는 지방 알콜 옥시다제 (EC 1.1.3.20)의 발현에 의해, 또는 화학적 전환에 의해 E8,E10-도데카디엔-1-올의 적어도 일부를 E8,E10-도데카디에날로 전환시킴으로써, E8,E10-도데카디에날을 추가로 생산하는 단계를 추가로 포함하고, 임의로, 상기 E8,E10-도데카디에날을 회수하는 단계를 추가로 포함하는 방법.
- 제14항 내지 제18항 중 어느 한 항에 있어서, 배지가 배양 온도에서 예컨대, 배양 배지와 같은 수용액 중에서 이의 클라우드 농도(cloud concentration) 이상인 양으로 추출제(extrant)를 포함하고, 여기서 추출제는 비이온성 에톡실화된 계면활성제, 예컨대, 소포제(antifoaming agent), 바람직하게, 폴리에틸렌 폴리프로필렌 글리콜, 폴레에테르 분산액의 혼합물, 폴리에틸렌 글리콜 모노스테아레이트를 포함하는 소포제, 예컨대, 시메티콘, 지방 알콜 알콕실레이트, 폴리에톡실화된 계면활성제 및 에톡실화 및 프로폭실화된 C16-C18 알콜계 소포제 및 이의 조합으로부터 선택되는 폴리에톡실화된 계면활성제인 방법.
- 제19항에 있어서, 배양 배지가 이의 클라우드 농도보다 적어도 50%, 예컨대, 적어도 100%, 예컨대, 적어도 150%, 예컨대, 적어도 200%, 예컨대, 적어도 250%, 예컨대, 적어도 300%, 예컨대, 적어도 350%, 예컨대, 적어도 400%, 예컨대, 적어도 500%, 예컨대, 적어도 750%, 예컨대, 적어도 1000% 이상 만큼 더 큰 양으로 추출제를 포함하고/거나, 여기서 배양 배지가 이의 클라우드 농도의 적어도 2배, 예컨대, 이의 클라우드 농도의 적어도 3배, 예컨대, 이의 클라우드 농도의 적어도 4배, 예컨대, 이의 클라우드 농도의 적어도 5배, 예컨대, 이의 클라우드 농도의 적어도 6배, 예컨대, 이의 클라우드 농도의 적어도 7배, 예컨대, 이의 클라우드 농도의 적어도 8배, 예컨대, 이의 클라우드 농도의 적어도 9배, 예컨대, 이의 클라우드 농도의 적어도 10배, 예컨대, 이의 클라우드 농도의 적어도 12.5배, 예컨대, 이의 클라우드 농도의 적어도 15배, 예컨대, 이의 클라우드 농도의 적어도 17.5배, 예컨대, 이의 클라우드 농도의 적어도 20배, 예컨대, 이의 클라우드 농도의 적어도 25배, 예컨대, 이의 클라우드 농도의 적어도 30배인 양으로 추출제를 포함하고, 여기서, 클라우드 농도는 배지 중에서, 바람직하게, 배양 온도에서 측정되는 방법.
- 제19항 또는 제20항에 있어서, E8,E10-도데카디에닐 코엔자임 A를 지질, 또는 유리 지방산으로 전환시키는 단계를 추가로 포함하고, 여기서 효모 세포에 의해 생산된 상기 지질 또는 유리 지방산, 상기 E8,E10-도데카디엔-1-올, 및 임의로, 상기 E8,E10-도데카디에닐 아세테이트 및/또는 상기 E8,E10-도데카디에날이 발효 브로쓰(fermentation broth) 중 에멀젼으로 존재하고, 본 방법은 상기 에멀젼을 파괴시켜 추출제 및 지질 또는 유리 지방산, E8,E10-도데카디엔-1-올, 및 임의로, E8,E10-도데카디에닐 아세테이트 및/또는 E8,E10-도데카디에날을 포함하는 생성물 상(product phase)을 포함하는 조성물을 수득하는 단계를 추가로 포함하는 방법.
- 제21항에 있어서, 에멀젼을 파괴시키는 단계가 발효 브로쓰의 상 분리 단계, 예컨대, 원심분리 단계를 거쳐 3개 상: 수상, 세포 및 세포 파편(cell debris)을 포함하는 상, 및 추출제 및 지질 또는 유리 지방산, E8,E10-도데카디엔-1-올, 및 임의로, E8,E10-도데카디에닐 아세테이트 및/또는 E8,E10-도데카디에날을 포함하는 생성물 상으로 구성된 조성물을 수득하는 단계를 포함하거나, 또는 이로 구성되는 방법.
- 제21항 또는 제22항에 있어서, 생성물 상이 처음 발효 브로쓰에 존재하는 지질 또는 유리 지방산, E8,E10-도데카디엔-1-올, 및 임의로, E8,E10-도데카디에닐 아세테이트 및/또는 E8,E10-도데카디에날의 적어도 50%, 예컨대, 적어도 55%, 예컨대, 적어도 60%, 예컨대, 적어도 65%, 예컨대, 적어도 70%, 예컨대, 적어도 75%, 예컨대, 적어도 80%, 예컨대, 적어도 85%, 예컨대, 적어도 90%, 예컨대, 적어도 95% 이상을 포함하는 방법.
- 제21항 내지 제23항 중 어느 한 항에 있어서,
- 바람직하게, 증류 단계, 예컨대, 감압하에서의 증류 단계에 의해, 또는 칼럼 정제에 의해 지질 또는 유리 지방산, E8,E10-도데카디엔-1-올, 및 임의로, E8,E10-도데카디에닐 아세테이트 및/또는 E8,E10-도데카디에날을 회수하는 단계,
- E8,E10-도데카디엔-1-올의 적어도 일부를 E8,E10-도데카디에날로 및/또는 E8,E10-도데카디에닐 아세테이트로 화학적으로 전환시키는 단계,
- 임의로, 상기 E8,E10-도데카디에날 및/또는 E8,E10-도데카디에닐 아세테이트를 회수하는 단계를 추가로 포함하는 방법. - 제14항 내지 제25항 중 어느 한 항에 있어서, 회수된 E8,E10-도데카디엔-1-올, E8,E10-도데카디에닐 아세테이트 및/또는 E8,E10-도데카디에날을 페로몬 조성물로 제제화(formulating)하는 단계를 추가로 포함하는 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP19218703.7 | 2019-12-20 | ||
EP19218703 | 2019-12-20 | ||
PCT/EP2020/086975 WO2021123128A1 (en) | 2019-12-20 | 2020-12-18 | Yeast cells and methods for production of e8,e10-dodecadienyl coenzyme a, codlemone and derivatives thereof |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20220118442A true KR20220118442A (ko) | 2022-08-25 |
Family
ID=69147428
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020227022287A KR20220118442A (ko) | 2019-12-20 | 2020-12-18 | E8,e10-도데카디에닐 코엔자임 a, 코들레몬 및 이의 유도체를 생산하기 위한 효모 세포 및 방법 |
Country Status (12)
Country | Link |
---|---|
US (1) | US20240327874A1 (ko) |
EP (1) | EP4077636A1 (ko) |
JP (1) | JP2023507647A (ko) |
KR (1) | KR20220118442A (ko) |
CN (1) | CN115103900A (ko) |
AU (1) | AU2020407273A1 (ko) |
BR (1) | BR112022012109A2 (ko) |
CA (1) | CA3161539A1 (ko) |
CL (1) | CL2022001679A1 (ko) |
IL (1) | IL293960A (ko) |
MX (1) | MX2022007696A (ko) |
WO (1) | WO2021123128A1 (ko) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111690587B (zh) * | 2019-03-13 | 2022-10-25 | 上海凯赛生物技术股份有限公司 | 一种离心筛选具有高含油率油脂酵母菌株的方法及其应用 |
CN112410355B (zh) * | 2020-11-23 | 2022-03-25 | 昆明理工大学 | 一种酰基辅酶a氧化酶2基因rkacox2及其应用 |
CA3225388A1 (en) | 2021-08-06 | 2023-02-09 | Anders Gabrielsson | Method for producing fatty aldehydes and derivatives thereof |
AR128802A1 (es) | 2022-03-16 | 2024-06-12 | Biophero Aps | Estabilización de aldehídos y/o alcoholes |
TW202409274A (zh) | 2022-07-04 | 2024-03-01 | 丹麥商百歐飛羅公司 | 生物農藥組成物 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108138202B (zh) * | 2015-06-26 | 2023-05-16 | 丹麦科技大学 | 用于在酵母中产生蛾信息素的方法 |
US11434506B2 (en) * | 2016-12-16 | 2022-09-06 | Danmarks Tekniske Universitet | Production of desaturated fatty alcohols and desaturated fatty alcohol acetates in yeast |
DE17825464T1 (de) | 2016-12-16 | 2019-12-19 | Danmarks Tekniske Universitet | Verfahren zur herstellung von fettalkoholen und derivaten davon in hefe |
AR112543A1 (es) * | 2017-05-17 | 2019-11-13 | Provivi Inc | Microorganismos para la producción de feromonas de insectos y compuestos relacionados |
US20230332096A1 (en) | 2019-02-19 | 2023-10-19 | Biophero Aps | Methods and cell factories for producing insect pheromones |
-
2020
- 2020-12-18 AU AU2020407273A patent/AU2020407273A1/en active Pending
- 2020-12-18 EP EP20835798.8A patent/EP4077636A1/en active Pending
- 2020-12-18 CN CN202080096660.8A patent/CN115103900A/zh active Pending
- 2020-12-18 WO PCT/EP2020/086975 patent/WO2021123128A1/en unknown
- 2020-12-18 IL IL293960A patent/IL293960A/en unknown
- 2020-12-18 MX MX2022007696A patent/MX2022007696A/es unknown
- 2020-12-18 BR BR112022012109A patent/BR112022012109A2/pt unknown
- 2020-12-18 JP JP2022538148A patent/JP2023507647A/ja active Pending
- 2020-12-18 KR KR1020227022287A patent/KR20220118442A/ko unknown
- 2020-12-18 CA CA3161539A patent/CA3161539A1/en active Pending
- 2020-12-18 US US17/783,955 patent/US20240327874A1/en active Pending
-
2022
- 2022-06-17 CL CL2022001679A patent/CL2022001679A1/es unknown
Also Published As
Publication number | Publication date |
---|---|
BR112022012109A2 (pt) | 2022-12-13 |
US20240327874A1 (en) | 2024-10-03 |
WO2021123128A1 (en) | 2021-06-24 |
JP2023507647A (ja) | 2023-02-24 |
AU2020407273A1 (en) | 2022-07-14 |
MX2022007696A (es) | 2022-09-23 |
CL2022001679A1 (es) | 2023-02-24 |
IL293960A (en) | 2022-08-01 |
EP4077636A1 (en) | 2022-10-26 |
CN115103900A (zh) | 2022-09-23 |
CA3161539A1 (en) | 2021-06-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20220118442A (ko) | E8,e10-도데카디에닐 코엔자임 a, 코들레몬 및 이의 유도체를 생산하기 위한 효모 세포 및 방법 | |
US20240076329A1 (en) | Method for production of moth pheromones in yeast | |
CN110291193B (zh) | 在酵母中产生去饱和脂肪醇和去饱和脂肪醇乙酸酯 | |
EP3555268B1 (en) | Methods for producing fatty alcohols and derivatives thereof in yeast | |
US10920233B2 (en) | Compositions and methods for lipid production | |
CN108697072A (zh) | 用于产生昆虫信息素及相关化合物的微生物 | |
CN110914442A (zh) | 用于产生昆虫信息素及相关化合物的微生物 | |
US20240043880A1 (en) | Improved methods for production, recovery and secretion of hydrophobic compounds in a fermentation | |
KR20240019132A (ko) | 효소 활성 및 곤충 페로몬의 생산을 증가시키기 위한 개선된 방법 및 세포 | |
Vatanparast et al. | Yeast engineering to express sex pheromone gland genes of the oriental fruit moth, Grapholita molesta | |
US20230031596A1 (en) | Biosynthesis of insect pheromones and precursors thereof | |
US20240287555A1 (en) | Methods and yeast cells for production of desaturated compounds | |
US20230242944A1 (en) | Methods for production of diatraea saccharalis pheromone precursors | |
TW202307214A (zh) | 用於產生去飽和化合物之方法及酵母細胞 |