CN106574238B - 微生物的脂肪二醇产生 - Google Patents
微生物的脂肪二醇产生 Download PDFInfo
- Publication number
- CN106574238B CN106574238B CN201580044132.7A CN201580044132A CN106574238B CN 106574238 B CN106574238 B CN 106574238B CN 201580044132 A CN201580044132 A CN 201580044132A CN 106574238 B CN106574238 B CN 106574238B
- Authority
- CN
- China
- Prior art keywords
- fatty
- diol
- ala
- leu
- val
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 150000002009 diols Chemical class 0.000 title claims abstract description 423
- 238000004519 manufacturing process Methods 0.000 title description 84
- 230000000813 microbial effect Effects 0.000 title description 27
- 229910052799 carbon Inorganic materials 0.000 claims abstract description 124
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 claims abstract description 122
- 238000000034 method Methods 0.000 claims abstract description 63
- 238000000855 fermentation Methods 0.000 claims abstract description 60
- 230000004151 fermentation Effects 0.000 claims abstract description 60
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 119
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 119
- 229920001184 polypeptide Polymers 0.000 claims description 118
- 108020002982 thioesterase Proteins 0.000 claims description 97
- 102000005488 Thioesterase Human genes 0.000 claims description 96
- 241000588724 Escherichia coli Species 0.000 claims description 90
- 102000007698 Alcohol dehydrogenase Human genes 0.000 claims description 61
- 108010021809 Alcohol dehydrogenase Proteins 0.000 claims description 61
- 150000007523 nucleic acids Chemical group 0.000 claims description 59
- -1 aliphatic diols Chemical class 0.000 claims description 47
- 108030002325 Carboxylate reductases Proteins 0.000 claims description 35
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 32
- 238000004113 cell culture Methods 0.000 claims description 20
- 239000000758 substrate Substances 0.000 claims description 15
- 101100269671 Dictyostelium discoideum alrA gene Proteins 0.000 claims description 13
- 101100269700 Mycolicibacterium smegmatis alr gene Proteins 0.000 claims description 13
- 238000001727 in vivo Methods 0.000 claims description 10
- 101150030205 phaG gene Proteins 0.000 claims description 10
- 241000589776 Pseudomonas putida Species 0.000 claims description 8
- 238000012258 culturing Methods 0.000 claims description 6
- 241000187480 Mycobacterium smegmatis Species 0.000 claims 2
- 244000005700 microbiome Species 0.000 abstract description 77
- 210000004027 cell Anatomy 0.000 description 294
- 150000000185 1,3-diols Chemical class 0.000 description 161
- 108090000623 proteins and genes Proteins 0.000 description 113
- 239000000194 fatty acid Substances 0.000 description 112
- 235000014113 dietary fatty acids Nutrition 0.000 description 111
- 229930195729 fatty acid Natural products 0.000 description 111
- 230000000694 effects Effects 0.000 description 103
- 150000004665 fatty acids Chemical class 0.000 description 101
- 239000000203 mixture Substances 0.000 description 79
- 150000002191 fatty alcohols Chemical class 0.000 description 72
- 108091033319 polynucleotide Proteins 0.000 description 72
- 102000040430 polynucleotide Human genes 0.000 description 72
- 239000002157 polynucleotide Substances 0.000 description 72
- 102000004190 Enzymes Human genes 0.000 description 60
- 108090000790 Enzymes Proteins 0.000 description 60
- 229940088598 enzyme Drugs 0.000 description 59
- 230000014509 gene expression Effects 0.000 description 56
- 230000037361 pathway Effects 0.000 description 54
- 239000000047 product Substances 0.000 description 49
- 239000013598 vector Substances 0.000 description 48
- 230000015572 biosynthetic process Effects 0.000 description 43
- 101710129019 Long-chain acyl-[acyl-carrier-protein] reductase Proteins 0.000 description 39
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 36
- 102100022089 Acyl-[acyl-carrier-protein] hydrolase Human genes 0.000 description 35
- 108090001018 hexadecanal dehydrogenase (acylating) Proteins 0.000 description 33
- 102000004169 proteins and genes Human genes 0.000 description 33
- 239000013612 plasmid Substances 0.000 description 30
- 108010019670 Chimeric Antigen Receptors Proteins 0.000 description 28
- 239000000543 intermediate Substances 0.000 description 27
- 241000196324 Embryophyta Species 0.000 description 26
- 239000013604 expression vector Substances 0.000 description 24
- 108020004414 DNA Proteins 0.000 description 23
- 108010011449 Long-chain-fatty-acid-CoA ligase Proteins 0.000 description 22
- 102100037885 Calcium-independent phospholipase A2-gamma Human genes 0.000 description 21
- 229940053200 antiepileptics fatty acid derivative Drugs 0.000 description 21
- 150000002192 fatty aldehydes Chemical class 0.000 description 21
- 238000013518 transcription Methods 0.000 description 21
- 230000035897 transcription Effects 0.000 description 21
- 239000003550 marker Substances 0.000 description 20
- 102100034337 Long-chain-fatty-acid-CoA ligase 6 Human genes 0.000 description 19
- 241000316848 Rhodococcus <scale insect> Species 0.000 description 19
- 230000004927 fusion Effects 0.000 description 19
- 238000003786 synthesis reaction Methods 0.000 description 19
- 241000894006 Bacteria Species 0.000 description 18
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 18
- 102000004316 Oxidoreductases Human genes 0.000 description 18
- 108090000854 Oxidoreductases Proteins 0.000 description 18
- 239000002609 medium Substances 0.000 description 18
- 101710146995 Acyl carrier protein Proteins 0.000 description 17
- 230000037353 metabolic pathway Effects 0.000 description 17
- 239000000126 substance Substances 0.000 description 17
- 102000016912 Aldehyde Reductase Human genes 0.000 description 16
- 108010053754 Aldehyde reductase Proteins 0.000 description 16
- 239000002028 Biomass Substances 0.000 description 16
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 16
- 230000002255 enzymatic effect Effects 0.000 description 16
- 239000008103 glucose Substances 0.000 description 16
- 230000001965 increasing effect Effects 0.000 description 16
- 238000007254 oxidation reaction Methods 0.000 description 16
- PUPZLCDOIYMWBV-UHFFFAOYSA-N (+/-)-1,3-Butanediol Chemical compound CC(O)CCO PUPZLCDOIYMWBV-UHFFFAOYSA-N 0.000 description 15
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 15
- 238000006243 chemical reaction Methods 0.000 description 15
- 101150016526 fadE gene Proteins 0.000 description 15
- 108010039731 Fatty Acid Synthases Proteins 0.000 description 14
- 230000008569 process Effects 0.000 description 14
- 229960000268 spectinomycin Drugs 0.000 description 14
- UNFWWIHTNXNPBV-WXKVUWSESA-N spectinomycin Chemical compound O([C@@H]1[C@@H](NC)[C@@H](O)[C@H]([C@@H]([C@H]1O1)O)NC)[C@]2(O)[C@H]1O[C@H](C)CC2=O UNFWWIHTNXNPBV-WXKVUWSESA-N 0.000 description 14
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 13
- 150000001299 aldehydes Chemical class 0.000 description 13
- 108010050848 glycylleucine Proteins 0.000 description 13
- 239000002699 waste material Substances 0.000 description 13
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 12
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 12
- 241000293869 Salmonella enterica subsp. enterica serovar Typhimurium Species 0.000 description 12
- 240000008042 Zea mays Species 0.000 description 12
- 150000001413 amino acids Chemical group 0.000 description 12
- 229940093530 coenzyme a Drugs 0.000 description 12
- 150000001875 compounds Chemical class 0.000 description 12
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 12
- 125000003729 nucleotide group Chemical group 0.000 description 12
- 239000004094 surface-active agent Substances 0.000 description 12
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 11
- 241000193830 Bacillus <bacterium> Species 0.000 description 11
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 11
- 241000192584 Synechocystis Species 0.000 description 11
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 11
- 238000004458 analytical method Methods 0.000 description 11
- 229910002092 carbon dioxide Inorganic materials 0.000 description 11
- 239000002773 nucleotide Substances 0.000 description 11
- 235000000346 sugar Nutrition 0.000 description 11
- DCTMXCOHGKSXIZ-UHFFFAOYSA-N (R)-1,3-Octanediol Chemical compound CCCCCC(O)CCO DCTMXCOHGKSXIZ-UHFFFAOYSA-N 0.000 description 10
- 108010001058 Acyl-CoA Dehydrogenase Proteins 0.000 description 10
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 10
- 241000187693 Rhodococcus rhodochrous Species 0.000 description 10
- 108010005233 alanylglutamic acid Proteins 0.000 description 10
- 230000001580 bacterial effect Effects 0.000 description 10
- LQZZUXJYWNFBMV-UHFFFAOYSA-N dodecan-1-ol Chemical compound CCCCCCCCCCCCO LQZZUXJYWNFBMV-UHFFFAOYSA-N 0.000 description 10
- 239000000463 material Substances 0.000 description 10
- 102000039446 nucleic acids Human genes 0.000 description 10
- 108020004707 nucleic acids Proteins 0.000 description 10
- 239000003208 petroleum Substances 0.000 description 10
- 238000000746 purification Methods 0.000 description 10
- 102000002735 Acyl-CoA Dehydrogenase Human genes 0.000 description 9
- 241000192700 Cyanobacteria Species 0.000 description 9
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 9
- 241000192707 Synechococcus Species 0.000 description 9
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 9
- 235000005822 corn Nutrition 0.000 description 9
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 9
- 239000004615 ingredient Substances 0.000 description 9
- 101150087812 tesA gene Proteins 0.000 description 9
- SRBFZHDQGSBBOR-IOVATXLUSA-N D-xylopyranose Chemical compound O[C@@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-IOVATXLUSA-N 0.000 description 8
- 241000235395 Mucor Species 0.000 description 8
- 241001453296 Synechococcus elongatus Species 0.000 description 8
- 108010070944 alanylhistidine Proteins 0.000 description 8
- 150000001336 alkenes Chemical class 0.000 description 8
- 239000001569 carbon dioxide Substances 0.000 description 8
- 239000003599 detergent Substances 0.000 description 8
- 235000013305 food Nutrition 0.000 description 8
- 230000001939 inductive effect Effects 0.000 description 8
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Chemical compound C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 description 8
- 150000002894 organic compounds Chemical class 0.000 description 8
- 230000002018 overexpression Effects 0.000 description 8
- 230000003647 oxidation Effects 0.000 description 8
- 230000001105 regulatory effect Effects 0.000 description 8
- HLZKNKRTKFSKGZ-UHFFFAOYSA-N tetradecan-1-ol Chemical compound CCCCCCCCCCCCCCO HLZKNKRTKFSKGZ-UHFFFAOYSA-N 0.000 description 8
- 108010016219 Acetyl-CoA carboxylase Proteins 0.000 description 7
- 102000000452 Acetyl-CoA carboxylase Human genes 0.000 description 7
- RGJOEKWQDUBAIZ-IBOSZNHHSA-N CoASH Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCS)O[C@H]1N1C2=NC=NC(N)=C2N=C1 RGJOEKWQDUBAIZ-IBOSZNHHSA-N 0.000 description 7
- 241000195493 Cryptophyta Species 0.000 description 7
- 102000004867 Hydro-Lyases Human genes 0.000 description 7
- 108090001042 Hydro-Lyases Proteins 0.000 description 7
- 241001520808 Panicum virgatum Species 0.000 description 7
- 241000589516 Pseudomonas Species 0.000 description 7
- 241000187747 Streptomyces Species 0.000 description 7
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 7
- 230000002238 attenuated effect Effects 0.000 description 7
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 7
- 230000001851 biosynthetic effect Effects 0.000 description 7
- 239000003995 emulsifying agent Substances 0.000 description 7
- 108010049041 glutamylalanine Proteins 0.000 description 7
- 239000001963 growth medium Substances 0.000 description 7
- 239000010813 municipal solid waste Substances 0.000 description 7
- 229920000642 polymer Polymers 0.000 description 7
- 239000002904 solvent Substances 0.000 description 7
- 108010061238 threonyl-glycine Proteins 0.000 description 7
- 230000009466 transformation Effects 0.000 description 7
- HBAQYPYDRFILMT-UHFFFAOYSA-N 8-[3-(1-cyclopropylpyrazol-4-yl)-1H-pyrazolo[4,3-d]pyrimidin-5-yl]-3-methyl-3,8-diazabicyclo[3.2.1]octan-2-one Chemical class C1(CC1)N1N=CC(=C1)C1=NNC2=C1N=C(N=C2)N1C2C(N(CC1CC2)C)=O HBAQYPYDRFILMT-UHFFFAOYSA-N 0.000 description 6
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 6
- 108010018763 Biotin carboxylase Proteins 0.000 description 6
- UGFAIRIUMAVXCW-UHFFFAOYSA-N Carbon monoxide Chemical compound [O+]#[C-] UGFAIRIUMAVXCW-UHFFFAOYSA-N 0.000 description 6
- 101710088194 Dehydrogenase Proteins 0.000 description 6
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 6
- 241000223198 Humicola Species 0.000 description 6
- 241000880493 Leptailurus serval Species 0.000 description 6
- XCOBLONWWXQEBS-KPKJPENVSA-N N,O-bis(trimethylsilyl)trifluoroacetamide Chemical compound C[Si](C)(C)O\C(C(F)(F)F)=N\[Si](C)(C)C XCOBLONWWXQEBS-KPKJPENVSA-N 0.000 description 6
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 6
- 241000235070 Saccharomyces Species 0.000 description 6
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 6
- 229930006000 Sucrose Natural products 0.000 description 6
- CVUDMNSZAIZFAE-UHFFFAOYSA-N Val-Arg-Pro Natural products NC(N)=NCCCC(NC(=O)C(N)C(C)C)C(=O)N1CCCC1C(O)=O CVUDMNSZAIZFAE-UHFFFAOYSA-N 0.000 description 6
- 229940024606 amino acid Drugs 0.000 description 6
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 6
- 108010093581 aspartyl-proline Proteins 0.000 description 6
- 230000006696 biosynthetic metabolic pathway Effects 0.000 description 6
- 239000007795 chemical reaction product Substances 0.000 description 6
- ANWMPOLHSRXCNH-UHFFFAOYSA-N decane-1,3-diol Chemical compound CCCCCCCC(O)CCO ANWMPOLHSRXCNH-UHFFFAOYSA-N 0.000 description 6
- 238000012217 deletion Methods 0.000 description 6
- 230000037430 deletion Effects 0.000 description 6
- GVEPAEOOBURRFW-UHFFFAOYSA-N dodecane-1,3-diol Chemical compound CCCCCCCCCC(O)CCO GVEPAEOOBURRFW-UHFFFAOYSA-N 0.000 description 6
- POULHZVOKOAJMA-UHFFFAOYSA-N dodecanoic acid Chemical compound CCCCCCCCCCCC(O)=O POULHZVOKOAJMA-UHFFFAOYSA-N 0.000 description 6
- 239000003814 drug Substances 0.000 description 6
- 239000003546 flue gas Substances 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 108010062266 glycyl-glycyl-argininal Proteins 0.000 description 6
- 239000004033 plastic Substances 0.000 description 6
- 229920003023 plastic Polymers 0.000 description 6
- 239000005720 sucrose Substances 0.000 description 6
- 150000008163 sugars Chemical class 0.000 description 6
- 230000000153 supplemental effect Effects 0.000 description 6
- 238000012360 testing method Methods 0.000 description 6
- OTJSXUHOVUGHJG-UHFFFAOYSA-N tetradecane-1,3-diol Chemical compound CCCCCCCCCCCC(O)CCO OTJSXUHOVUGHJG-UHFFFAOYSA-N 0.000 description 6
- UHPMCKVQTMMPCG-UHFFFAOYSA-N 5,8-dihydroxy-2-methoxy-6-methyl-7-(2-oxopropyl)naphthalene-1,4-dione Chemical compound CC1=C(CC(C)=O)C(O)=C2C(=O)C(OC)=CC(=O)C2=C1O UHPMCKVQTMMPCG-UHFFFAOYSA-N 0.000 description 5
- 241000228212 Aspergillus Species 0.000 description 5
- 101100012355 Bacillus anthracis fabH1 gene Proteins 0.000 description 5
- 101100012357 Bacillus subtilis (strain 168) fabHA gene Proteins 0.000 description 5
- 108010078791 Carrier Proteins Proteins 0.000 description 5
- 241000588722 Escherichia Species 0.000 description 5
- 101100390711 Escherichia coli (strain K12) fhuA gene Proteins 0.000 description 5
- RFSUNEUAIZKAJO-ARQDHWQXSA-N Fructose Chemical compound OC[C@H]1O[C@](O)(CO)[C@@H](O)[C@@H]1O RFSUNEUAIZKAJO-ARQDHWQXSA-N 0.000 description 5
- 241000223218 Fusarium Species 0.000 description 5
- 101000937642 Homo sapiens Malonyl-CoA-acyl carrier protein transacylase, mitochondrial Proteins 0.000 description 5
- 241000235649 Kluyveromyces Species 0.000 description 5
- 241000186660 Lactobacillus Species 0.000 description 5
- 244000147568 Laurus nobilis Species 0.000 description 5
- 235000017858 Laurus nobilis Nutrition 0.000 description 5
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 5
- 102100027329 Malonyl-CoA-acyl carrier protein transacylase, mitochondrial Human genes 0.000 description 5
- 241000226677 Myceliophthora Species 0.000 description 5
- TUNFSRHWOTWDNC-UHFFFAOYSA-N Myristic acid Natural products CCCCCCCCCCCCCC(O)=O TUNFSRHWOTWDNC-UHFFFAOYSA-N 0.000 description 5
- 241000221960 Neurospora Species 0.000 description 5
- 241000228143 Penicillium Species 0.000 description 5
- 241000222385 Phanerochaete Species 0.000 description 5
- 241000222350 Pleurotus Species 0.000 description 5
- 241000235402 Rhizomucor Species 0.000 description 5
- 241000235346 Schizosaccharomyces Species 0.000 description 5
- 235000005212 Terminalia tomentosa Nutrition 0.000 description 5
- XKWABWFMQXMUMT-HJGDQZAQSA-N Thr-Pro-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O XKWABWFMQXMUMT-HJGDQZAQSA-N 0.000 description 5
- 241000223259 Trichoderma Species 0.000 description 5
- CVUDMNSZAIZFAE-TUAOUCFPSA-N Val-Arg-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N CVUDMNSZAIZFAE-TUAOUCFPSA-N 0.000 description 5
- 101150070497 accC gene Proteins 0.000 description 5
- 101150079502 acr1 gene Proteins 0.000 description 5
- 108010044940 alanylglutamine Proteins 0.000 description 5
- 150000001298 alcohols Chemical class 0.000 description 5
- 125000000539 amino acid group Chemical group 0.000 description 5
- 108010060035 arginylproline Proteins 0.000 description 5
- 150000001720 carbohydrates Chemical class 0.000 description 5
- 235000014633 carbohydrates Nutrition 0.000 description 5
- 230000003197 catalytic effect Effects 0.000 description 5
- 230000003247 decreasing effect Effects 0.000 description 5
- 239000000284 extract Substances 0.000 description 5
- 101150026389 fabF gene Proteins 0.000 description 5
- 101150090981 fabG gene Proteins 0.000 description 5
- 101150035981 fabH gene Proteins 0.000 description 5
- 101150072202 fabV gene Proteins 0.000 description 5
- 101150069125 fadB gene Proteins 0.000 description 5
- 235000013373 food additive Nutrition 0.000 description 5
- 239000002778 food additive Substances 0.000 description 5
- 235000021588 free fatty acids Nutrition 0.000 description 5
- 108010089804 glycyl-threonine Proteins 0.000 description 5
- 230000012010 growth Effects 0.000 description 5
- 229940039696 lactobacillus Drugs 0.000 description 5
- 101150068528 mabA gene Proteins 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- JRZJOMJEPLMPRA-UHFFFAOYSA-N olefin Natural products CCCCCCCC=C JRZJOMJEPLMPRA-UHFFFAOYSA-N 0.000 description 5
- 108010001814 phosphopantetheinyl transferase Proteins 0.000 description 5
- 239000002994 raw material Substances 0.000 description 5
- 230000009467 reduction Effects 0.000 description 5
- 239000002023 wood Substances 0.000 description 5
- 102000057234 Acyl transferases Human genes 0.000 description 4
- 108700016155 Acyl transferases Proteins 0.000 description 4
- YHKANGMVQWRMAP-DCAQKATOSA-N Ala-Leu-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YHKANGMVQWRMAP-DCAQKATOSA-N 0.000 description 4
- MEFILNJXAVSUTO-JXUBOQSCSA-N Ala-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MEFILNJXAVSUTO-JXUBOQSCSA-N 0.000 description 4
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 4
- 102000014914 Carrier Proteins Human genes 0.000 description 4
- 108020004705 Codon Proteins 0.000 description 4
- 229930091371 Fructose Natural products 0.000 description 4
- 239000005715 Fructose Substances 0.000 description 4
- 241000233866 Fungi Species 0.000 description 4
- NJCALAAIGREHDR-WDCWCFNPSA-N Glu-Leu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NJCALAAIGREHDR-WDCWCFNPSA-N 0.000 description 4
- RLFSBAPJTYKSLG-WHFBIAKZSA-N Gly-Ala-Asp Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O RLFSBAPJTYKSLG-WHFBIAKZSA-N 0.000 description 4
- UUYBFNKHOCJCHT-VHSXEESVSA-N Gly-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN UUYBFNKHOCJCHT-VHSXEESVSA-N 0.000 description 4
- MJOZZTKJZQFKDK-GUBZILKMSA-N Leu-Ala-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(N)=O MJOZZTKJZQFKDK-GUBZILKMSA-N 0.000 description 4
- WSGXUIQTEZDVHJ-GARJFASQSA-N Leu-Ala-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O WSGXUIQTEZDVHJ-GARJFASQSA-N 0.000 description 4
- HASRFYOMVPJRPU-SRVKXCTJSA-N Leu-Arg-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HASRFYOMVPJRPU-SRVKXCTJSA-N 0.000 description 4
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 4
- UCDHVOALNXENLC-KBPBESRZSA-N Leu-Gly-Tyr Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 UCDHVOALNXENLC-KBPBESRZSA-N 0.000 description 4
- 241001465754 Metazoa Species 0.000 description 4
- 102000002568 Multienzyme Complexes Human genes 0.000 description 4
- 108010093369 Multienzyme Complexes Proteins 0.000 description 4
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 4
- 235000019482 Palm oil Nutrition 0.000 description 4
- 241000235648 Pichia Species 0.000 description 4
- OQSGBXGNAFQGGS-CYDGBPFRSA-N Pro-Val-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OQSGBXGNAFQGGS-CYDGBPFRSA-N 0.000 description 4
- 240000000111 Saccharum officinarum Species 0.000 description 4
- 235000007201 Saccharum officinarum Nutrition 0.000 description 4
- DBIDZNUXSLXVRG-FXQIFTODSA-N Ser-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N DBIDZNUXSLXVRG-FXQIFTODSA-N 0.000 description 4
- 229920002472 Starch Polymers 0.000 description 4
- 241000222354 Trametes Species 0.000 description 4
- RYQUMYBMOJYYDK-NHCYSSNCSA-N Val-Pro-Glu Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RYQUMYBMOJYYDK-NHCYSSNCSA-N 0.000 description 4
- MNSSBIHFEUUXNW-RCWTZXSCSA-N Val-Thr-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N MNSSBIHFEUUXNW-RCWTZXSCSA-N 0.000 description 4
- 241000607626 Vibrio cholerae Species 0.000 description 4
- ZSLZBFCDCINBPY-ZSJPKINUSA-N acetyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 ZSLZBFCDCINBPY-ZSJPKINUSA-N 0.000 description 4
- 239000003242 anti bacterial agent Substances 0.000 description 4
- 108010013835 arginine glutamate Proteins 0.000 description 4
- 108010038633 aspartylglutamate Proteins 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 229920002678 cellulose Polymers 0.000 description 4
- 239000001913 cellulose Substances 0.000 description 4
- 235000010980 cellulose Nutrition 0.000 description 4
- 239000003153 chemical reaction reagent Substances 0.000 description 4
- IJOOHPMOJXWVHK-UHFFFAOYSA-N chlorotrimethylsilane Chemical compound C[Si](C)(C)Cl IJOOHPMOJXWVHK-UHFFFAOYSA-N 0.000 description 4
- MWKFXSUHUHTGQN-UHFFFAOYSA-N decan-1-ol Chemical compound CCCCCCCCCCO MWKFXSUHUHTGQN-UHFFFAOYSA-N 0.000 description 4
- 230000007423 decrease Effects 0.000 description 4
- 230000000593 degrading effect Effects 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 101150099753 entD gene Proteins 0.000 description 4
- 150000002148 esters Chemical class 0.000 description 4
- 210000003527 eukaryotic cell Anatomy 0.000 description 4
- 101150115959 fadR gene Proteins 0.000 description 4
- 238000004817 gas chromatography Methods 0.000 description 4
- 238000002290 gas chromatography-mass spectrometry Methods 0.000 description 4
- 108010036413 histidylglycine Proteins 0.000 description 4
- 108010025306 histidylleucine Proteins 0.000 description 4
- 230000005764 inhibitory process Effects 0.000 description 4
- 108010053037 kyotorphin Proteins 0.000 description 4
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 4
- 230000000670 limiting effect Effects 0.000 description 4
- 239000007788 liquid Substances 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 230000035772 mutation Effects 0.000 description 4
- CGNJFUJNEYIYRZ-UHFFFAOYSA-N nonane-1,3-diol Chemical compound CCCCCCC(O)CCO CGNJFUJNEYIYRZ-UHFFFAOYSA-N 0.000 description 4
- 239000002540 palm oil Substances 0.000 description 4
- 238000002407 reforming Methods 0.000 description 4
- 238000000926 separation method Methods 0.000 description 4
- 239000010865 sewage Substances 0.000 description 4
- 239000004460 silage Substances 0.000 description 4
- 239000008107 starch Substances 0.000 description 4
- 235000019698 starch Nutrition 0.000 description 4
- 239000010902 straw Substances 0.000 description 4
- 235000015112 vegetable and seed oil Nutrition 0.000 description 4
- 239000008158 vegetable oil Substances 0.000 description 4
- 229940118696 vibrio cholerae Drugs 0.000 description 4
- OWEGMIWEEQEYGQ-UHFFFAOYSA-N 100676-05-9 Natural products OC1C(O)C(O)C(CO)OC1OCC1C(O)C(O)C(O)C(OC2C(OC(O)C(O)C2O)CO)O1 OWEGMIWEEQEYGQ-UHFFFAOYSA-N 0.000 description 3
- 102100029103 3-ketoacyl-CoA thiolase Human genes 0.000 description 3
- 108010036211 5-HT-moduline Proteins 0.000 description 3
- 108010003902 Acetyl-CoA C-acyltransferase Proteins 0.000 description 3
- 101000935487 Agrobacterium fabrum (strain C58 / ATCC 33970) 3-oxopimeloyl-[acyl-carrier-protein] synthase Proteins 0.000 description 3
- CXRCVCURMBFFOL-FXQIFTODSA-N Ala-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CXRCVCURMBFFOL-FXQIFTODSA-N 0.000 description 3
- 108010040956 Ala-Asp-Glu-Leu Proteins 0.000 description 3
- CZPAHAKGPDUIPJ-CIUDSAMLSA-N Ala-Gln-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O CZPAHAKGPDUIPJ-CIUDSAMLSA-N 0.000 description 3
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 3
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 3
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 3
- 241000219195 Arabidopsis thaliana Species 0.000 description 3
- XRNXPIGJPQHCPC-RCWTZXSCSA-N Arg-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCNC(N)=N)[C@@H](C)O)C(O)=O XRNXPIGJPQHCPC-RCWTZXSCSA-N 0.000 description 3
- PGUYEUCYVNZGGV-QWRGUYRKSA-N Asp-Gly-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PGUYEUCYVNZGGV-QWRGUYRKSA-N 0.000 description 3
- WSGVTKZFVJSJOG-RCOVLWMOSA-N Asp-Gly-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O WSGVTKZFVJSJOG-RCOVLWMOSA-N 0.000 description 3
- BJDHEININLSZOT-KKUMJFAQSA-N Asp-Tyr-Lys Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(O)=O BJDHEININLSZOT-KKUMJFAQSA-N 0.000 description 3
- 241000228245 Aspergillus niger Species 0.000 description 3
- 241000193744 Bacillus amyloliquefaciens Species 0.000 description 3
- 241000193752 Bacillus circulans Species 0.000 description 3
- 241001328122 Bacillus clausii Species 0.000 description 3
- 241000193422 Bacillus lentus Species 0.000 description 3
- 241000194108 Bacillus licheniformis Species 0.000 description 3
- 241000194107 Bacillus megaterium Species 0.000 description 3
- 241000194103 Bacillus pumilus Species 0.000 description 3
- 244000063299 Bacillus subtilis Species 0.000 description 3
- 235000014469 Bacillus subtilis Nutrition 0.000 description 3
- 241000193388 Bacillus thuringiensis Species 0.000 description 3
- 241000283690 Bos taurus Species 0.000 description 3
- 241001536303 Botryococcus braunii Species 0.000 description 3
- 241000195597 Chlamydomonas reinhardtii Species 0.000 description 3
- 241000123346 Chrysosporium Species 0.000 description 3
- 241000723346 Cinnamomum camphora Species 0.000 description 3
- 241000193401 Clostridium acetobutylicum Species 0.000 description 3
- 102000005870 Coenzyme A Ligases Human genes 0.000 description 3
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 description 3
- 102000053602 DNA Human genes 0.000 description 3
- 241000195633 Dunaliella salina Species 0.000 description 3
- VGGSQFUCUMXWEO-UHFFFAOYSA-N Ethene Chemical compound C=C VGGSQFUCUMXWEO-UHFFFAOYSA-N 0.000 description 3
- 239000005977 Ethylene Substances 0.000 description 3
- 241000206602 Eukaryota Species 0.000 description 3
- WSFSSNUMVMOOMR-UHFFFAOYSA-N Formaldehyde Chemical compound O=C WSFSSNUMVMOOMR-UHFFFAOYSA-N 0.000 description 3
- 241000193385 Geobacillus stearothermophilus Species 0.000 description 3
- MFJAPSYJQJCQDN-BQBZGAKWSA-N Gln-Gly-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O MFJAPSYJQJCQDN-BQBZGAKWSA-N 0.000 description 3
- YPFFHGRJCUBXPX-NHCYSSNCSA-N Gln-Pro-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCC(N)=O)C(O)=O YPFFHGRJCUBXPX-NHCYSSNCSA-N 0.000 description 3
- OACQOWPRWGNKTP-AVGNSLFASA-N Gln-Tyr-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O OACQOWPRWGNKTP-AVGNSLFASA-N 0.000 description 3
- DHDOADIPGZTAHT-YUMQZZPRSA-N Gly-Glu-Arg Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DHDOADIPGZTAHT-YUMQZZPRSA-N 0.000 description 3
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 3
- 229920002488 Hemicellulose Polymers 0.000 description 3
- 241000238631 Hexapoda Species 0.000 description 3
- XJQDHFMUUBRCGA-KKUMJFAQSA-N His-Asn-Phe Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O XJQDHFMUUBRCGA-KKUMJFAQSA-N 0.000 description 3
- ISQOVWDWRUONJH-YESZJQIVSA-N His-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC3=CN=CN3)N)C(=O)O ISQOVWDWRUONJH-YESZJQIVSA-N 0.000 description 3
- TZCGZYWNIDZZMR-UHFFFAOYSA-N Ile-Arg-Ala Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(C)C(O)=O)CCCN=C(N)N TZCGZYWNIDZZMR-UHFFFAOYSA-N 0.000 description 3
- GYAFMRQGWHXMII-IUKAMOBKSA-N Ile-Asp-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N GYAFMRQGWHXMII-IUKAMOBKSA-N 0.000 description 3
- KLBVGHCGHUNHEA-BJDJZHNGSA-N Ile-Leu-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)O)N KLBVGHCGHUNHEA-BJDJZHNGSA-N 0.000 description 3
- GLYJPWIRLBAIJH-UHFFFAOYSA-N Ile-Lys-Pro Natural products CCC(C)C(N)C(=O)NC(CCCCN)C(=O)N1CCCC1C(O)=O GLYJPWIRLBAIJH-UHFFFAOYSA-N 0.000 description 3
- NSPNUMNLZNOPAQ-SJWGOKEGSA-N Ile-Tyr-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N NSPNUMNLZNOPAQ-SJWGOKEGSA-N 0.000 description 3
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 3
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 3
- 240000006024 Lactobacillus plantarum Species 0.000 description 3
- 235000013965 Lactobacillus plantarum Nutrition 0.000 description 3
- CQQGCWPXDHTTNF-GUBZILKMSA-N Leu-Ala-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O CQQGCWPXDHTTNF-GUBZILKMSA-N 0.000 description 3
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 3
- VWHGTYCRDRBSFI-ZETCQYMHSA-N Leu-Gly-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)NCC(O)=O VWHGTYCRDRBSFI-ZETCQYMHSA-N 0.000 description 3
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 3
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 3
- LCNASHSOFMRYFO-WDCWCFNPSA-N Leu-Thr-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(N)=O LCNASHSOFMRYFO-WDCWCFNPSA-N 0.000 description 3
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 3
- FBNPMTNBFFAMMH-AVGNSLFASA-N Leu-Val-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-AVGNSLFASA-N 0.000 description 3
- RIPJMCFGQHGHNP-RHYQMDGZSA-N Lys-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCCCN)N)O RIPJMCFGQHGHNP-RHYQMDGZSA-N 0.000 description 3
- GUBGYTABKSRVRQ-PICCSMPSSA-N Maltose Natural products O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-PICCSMPSSA-N 0.000 description 3
- 108010079364 N-glycylalanine Proteins 0.000 description 3
- 108010066427 N-valyltryptophan Proteins 0.000 description 3
- MUBZPKHOEPUJKR-UHFFFAOYSA-N Oxalic acid Chemical compound OC(=O)C(O)=O MUBZPKHOEPUJKR-UHFFFAOYSA-N 0.000 description 3
- DZZCICYRSZASNF-FXQIFTODSA-N Pro-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 DZZCICYRSZASNF-FXQIFTODSA-N 0.000 description 3
- NHDVNAKDACFHPX-GUBZILKMSA-N Pro-Arg-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O NHDVNAKDACFHPX-GUBZILKMSA-N 0.000 description 3
- NXEYSLRNNPWCRN-SRVKXCTJSA-N Pro-Glu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXEYSLRNNPWCRN-SRVKXCTJSA-N 0.000 description 3
- IURWWZYKYPEANQ-HJGDQZAQSA-N Pro-Thr-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O IURWWZYKYPEANQ-HJGDQZAQSA-N 0.000 description 3
- 241000192138 Prochlorococcus Species 0.000 description 3
- 101100218932 Pseudomonas aeruginosa pse1 gene Proteins 0.000 description 3
- 241000589540 Pseudomonas fluorescens Species 0.000 description 3
- 241000122971 Stenotrophomonas Species 0.000 description 3
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 3
- 241000192589 Synechococcus elongatus PCC 7942 Species 0.000 description 3
- 241000192593 Synechocystis sp. PCC 6803 Species 0.000 description 3
- KBLYJPQSNGTDIU-LOKLDPHHSA-N Thr-Glu-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O KBLYJPQSNGTDIU-LOKLDPHHSA-N 0.000 description 3
- RFKVQLIXNVEOMB-WEDXCCLWSA-N Thr-Leu-Gly Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N)O RFKVQLIXNVEOMB-WEDXCCLWSA-N 0.000 description 3
- FLPZMPOZGYPBEN-PPCPHDFISA-N Thr-Leu-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FLPZMPOZGYPBEN-PPCPHDFISA-N 0.000 description 3
- DRQXUCVJDCRJDB-UHFFFAOYSA-N Turanose Natural products OC1C(CO)OC(O)(CO)C1OC1C(O)C(O)C(O)C(CO)O1 DRQXUCVJDCRJDB-UHFFFAOYSA-N 0.000 description 3
- PIFJAFRUVWZRKR-QMMMGPOBSA-N Val-Gly-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O PIFJAFRUVWZRKR-QMMMGPOBSA-N 0.000 description 3
- WMRWZYSRQUORHJ-YDHLFZDLSA-N Val-Phe-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N WMRWZYSRQUORHJ-YDHLFZDLSA-N 0.000 description 3
- JAIZPWVHPQRYOU-ZJDVBMNYSA-N Val-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O JAIZPWVHPQRYOU-ZJDVBMNYSA-N 0.000 description 3
- AEFJNECXZCODJM-UWVGGRQHSA-N Val-Val-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C(=O)NCC([O-])=O AEFJNECXZCODJM-UWVGGRQHSA-N 0.000 description 3
- JSOXWWFKRJKTMT-WOPDTQHZSA-N Val-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N JSOXWWFKRJKTMT-WOPDTQHZSA-N 0.000 description 3
- 101100119785 Vibrio anguillarum (strain ATCC 68554 / 775) fatB gene Proteins 0.000 description 3
- 241000235013 Yarrowia Species 0.000 description 3
- 241000588902 Zymomonas mobilis Species 0.000 description 3
- DPXJVFZANSGRMM-UHFFFAOYSA-N acetic acid;2,3,4,5,6-pentahydroxyhexanal;sodium Chemical compound [Na].CC(O)=O.OCC(O)C(O)C(O)C(O)C=O DPXJVFZANSGRMM-UHFFFAOYSA-N 0.000 description 3
- 230000009471 action Effects 0.000 description 3
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 3
- 125000000217 alkyl group Chemical group 0.000 description 3
- WQZGKKKJIJFFOK-PHYPRBDBSA-N alpha-D-galactose Chemical compound OC[C@H]1O[C@H](O)[C@H](O)[C@@H](O)[C@H]1O WQZGKKKJIJFFOK-PHYPRBDBSA-N 0.000 description 3
- 230000004075 alteration Effects 0.000 description 3
- 229940088710 antibiotic agent Drugs 0.000 description 3
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 description 3
- 108010029539 arginyl-prolyl-proline Proteins 0.000 description 3
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 3
- 229940097012 bacillus thuringiensis Drugs 0.000 description 3
- GUBGYTABKSRVRQ-QUYVBRFLSA-N beta-maltose Chemical compound OC[C@H]1O[C@H](O[C@H]2[C@H](O)[C@@H](O)[C@H](O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@@H]1O GUBGYTABKSRVRQ-QUYVBRFLSA-N 0.000 description 3
- 101150112203 carB2 gene Proteins 0.000 description 3
- 239000001768 carboxy methyl cellulose Substances 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 3
- 150000005829 chemical entities Chemical class 0.000 description 3
- 239000003240 coconut oil Substances 0.000 description 3
- 235000019864 coconut oil Nutrition 0.000 description 3
- 108010054812 diprotin A Proteins 0.000 description 3
- 108010054813 diprotin B Proteins 0.000 description 3
- 229940079593 drug Drugs 0.000 description 3
- 239000003623 enhancer Substances 0.000 description 3
- 230000007613 environmental effect Effects 0.000 description 3
- 230000004133 fatty acid degradation Effects 0.000 description 3
- 102000005970 fatty acyl-CoA reductase Human genes 0.000 description 3
- 239000012634 fragment Substances 0.000 description 3
- 238000013467 fragmentation Methods 0.000 description 3
- 238000006062 fragmentation reaction Methods 0.000 description 3
- 239000000446 fuel Substances 0.000 description 3
- 229930182830 galactose Natural products 0.000 description 3
- 239000007789 gas Substances 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- 108010085059 glutamyl-arginyl-proline Proteins 0.000 description 3
- 108010072405 glycyl-aspartyl-glycine Proteins 0.000 description 3
- 108010048994 glycyl-tyrosyl-alanine Proteins 0.000 description 3
- 108010045126 glycyl-tyrosyl-glycine Proteins 0.000 description 3
- 230000036571 hydration Effects 0.000 description 3
- 238000006703 hydration reaction Methods 0.000 description 3
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 3
- 229940072205 lactobacillus plantarum Drugs 0.000 description 3
- 108010034529 leucyl-lysine Proteins 0.000 description 3
- 108010057821 leucylproline Proteins 0.000 description 3
- 239000002029 lignocellulosic biomass Substances 0.000 description 3
- 108010064235 lysylglycine Proteins 0.000 description 3
- 108020004999 messenger RNA Proteins 0.000 description 3
- 230000004060 metabolic process Effects 0.000 description 3
- 229920000609 methyl cellulose Polymers 0.000 description 3
- 239000001923 methylcellulose Substances 0.000 description 3
- 235000010981 methylcellulose Nutrition 0.000 description 3
- 239000003345 natural gas Substances 0.000 description 3
- 229920001277 pectin Polymers 0.000 description 3
- 239000001814 pectin Substances 0.000 description 3
- 235000010987 pectin Nutrition 0.000 description 3
- 239000002304 perfume Substances 0.000 description 3
- 230000029553 photosynthesis Effects 0.000 description 3
- 238000010672 photosynthesis Methods 0.000 description 3
- 230000000243 photosynthetic effect Effects 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 210000001236 prokaryotic cell Anatomy 0.000 description 3
- 108010004914 prolylarginine Proteins 0.000 description 3
- 108010015796 prolylisoleucine Proteins 0.000 description 3
- 108010053725 prolylvaline Proteins 0.000 description 3
- 108020003175 receptors Proteins 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 102200068630 rs1805142 Human genes 0.000 description 3
- 229920006395 saturated elastomer Polymers 0.000 description 3
- 235000019812 sodium carboxymethyl cellulose Nutrition 0.000 description 3
- 229920001027 sodium carboxymethylcellulose Polymers 0.000 description 3
- 241000894007 species Species 0.000 description 3
- 229910052717 sulfur Inorganic materials 0.000 description 3
- 239000011593 sulfur Substances 0.000 description 3
- 239000003760 tallow Substances 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 230000014616 translation Effects 0.000 description 3
- 108010015666 tryptophyl-leucyl-glutamic acid Proteins 0.000 description 3
- RULSWEULPANCDV-PIXUTMIVSA-N turanose Chemical compound OC[C@@H](O)[C@@H](O)[C@@H](C(=O)CO)O[C@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O RULSWEULPANCDV-PIXUTMIVSA-N 0.000 description 3
- 229940088594 vitamin Drugs 0.000 description 3
- 239000011782 vitamin Substances 0.000 description 3
- 235000013343 vitamin Nutrition 0.000 description 3
- 229930003231 vitamin Natural products 0.000 description 3
- 229920001221 xylan Polymers 0.000 description 3
- 150000004823 xylans Chemical class 0.000 description 3
- 210000005253 yeast cell Anatomy 0.000 description 3
- DNIAPMSPPWPWGF-VKHMYHEASA-N (+)-propylene glycol Chemical compound C[C@H](O)CO DNIAPMSPPWPWGF-VKHMYHEASA-N 0.000 description 2
- XVZCXCTYGHPNEM-IHRRRGAJSA-N (2s)-1-[(2s)-2-[[(2s)-2-amino-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O XVZCXCTYGHPNEM-IHRRRGAJSA-N 0.000 description 2
- YPFDHNVEDLHUCE-UHFFFAOYSA-N 1,3-propanediol Substances OCCCO YPFDHNVEDLHUCE-UHFFFAOYSA-N 0.000 description 2
- 229940035437 1,3-propanediol Drugs 0.000 description 2
- KBPLFHHGFOOTCA-UHFFFAOYSA-N 1-Octanol Chemical compound CCCCCCCCO KBPLFHHGFOOTCA-UHFFFAOYSA-N 0.000 description 2
- 108700037654 Acyl carrier protein (ACP) Proteins 0.000 description 2
- 102000048456 Acyl carrier protein (ACP) Human genes 0.000 description 2
- AAQGRPOPTAUUBM-ZLUOBGJFSA-N Ala-Ala-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O AAQGRPOPTAUUBM-ZLUOBGJFSA-N 0.000 description 2
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 2
- ODWSTKXGQGYHSH-FXQIFTODSA-N Ala-Arg-Ala Chemical compound C[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O ODWSTKXGQGYHSH-FXQIFTODSA-N 0.000 description 2
- SVBXIUDNTRTKHE-CIUDSAMLSA-N Ala-Arg-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O SVBXIUDNTRTKHE-CIUDSAMLSA-N 0.000 description 2
- IMMKUCQIKKXKNP-DCAQKATOSA-N Ala-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CCCN=C(N)N IMMKUCQIKKXKNP-DCAQKATOSA-N 0.000 description 2
- CVGNCMIULZNYES-WHFBIAKZSA-N Ala-Asn-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CVGNCMIULZNYES-WHFBIAKZSA-N 0.000 description 2
- GWFSQQNGMPGBEF-GHCJXIJMSA-N Ala-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N GWFSQQNGMPGBEF-GHCJXIJMSA-N 0.000 description 2
- CXQODNIBUNQWAS-CIUDSAMLSA-N Ala-Gln-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N CXQODNIBUNQWAS-CIUDSAMLSA-N 0.000 description 2
- RXTBLQVXNIECFP-FXQIFTODSA-N Ala-Gln-Gln Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O RXTBLQVXNIECFP-FXQIFTODSA-N 0.000 description 2
- YIGLXQRFQVWFEY-NRPADANISA-N Ala-Gln-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O YIGLXQRFQVWFEY-NRPADANISA-N 0.000 description 2
- HMRWQTHUDVXMGH-GUBZILKMSA-N Ala-Glu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HMRWQTHUDVXMGH-GUBZILKMSA-N 0.000 description 2
- MPLOSMWGDNJSEV-WHFBIAKZSA-N Ala-Gly-Asp Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MPLOSMWGDNJSEV-WHFBIAKZSA-N 0.000 description 2
- BLIMFWGRQKRCGT-YUMQZZPRSA-N Ala-Gly-Lys Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN BLIMFWGRQKRCGT-YUMQZZPRSA-N 0.000 description 2
- FDAZDMAFZYTHGS-XVYDVKMFSA-N Ala-His-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O FDAZDMAFZYTHGS-XVYDVKMFSA-N 0.000 description 2
- FAJIYNONGXEXAI-CQDKDKBSSA-N Ala-His-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CNC=N1 FAJIYNONGXEXAI-CQDKDKBSSA-N 0.000 description 2
- WUHJHHGYVVJMQE-BJDJZHNGSA-N Ala-Leu-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WUHJHHGYVVJMQE-BJDJZHNGSA-N 0.000 description 2
- OMDNCNKNEGFOMM-BQBZGAKWSA-N Ala-Met-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O OMDNCNKNEGFOMM-BQBZGAKWSA-N 0.000 description 2
- DRARURMRLANNLS-GUBZILKMSA-N Ala-Met-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O DRARURMRLANNLS-GUBZILKMSA-N 0.000 description 2
- WQLDNOCHHRISMS-NAKRPEOUSA-N Ala-Pro-Ile Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WQLDNOCHHRISMS-NAKRPEOUSA-N 0.000 description 2
- YHBDGLZYNIARKJ-GUBZILKMSA-N Ala-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N YHBDGLZYNIARKJ-GUBZILKMSA-N 0.000 description 2
- RMAWDDRDTRSZIR-ZLUOBGJFSA-N Ala-Ser-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RMAWDDRDTRSZIR-ZLUOBGJFSA-N 0.000 description 2
- XQNRANMFRPCFFW-GCJQMDKQSA-N Ala-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C)N)O XQNRANMFRPCFFW-GCJQMDKQSA-N 0.000 description 2
- ZJLORAAXDAJLDC-CQDKDKBSSA-N Ala-Tyr-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O ZJLORAAXDAJLDC-CQDKDKBSSA-N 0.000 description 2
- ZCUFMRIQCPNOHZ-NRPADANISA-N Ala-Val-Gln Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N ZCUFMRIQCPNOHZ-NRPADANISA-N 0.000 description 2
- OMSKGWFGWCQFBD-KZVJFYERSA-N Ala-Val-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OMSKGWFGWCQFBD-KZVJFYERSA-N 0.000 description 2
- NLXLAEXVIDQMFP-UHFFFAOYSA-N Ammonia chloride Chemical compound [NH4+].[Cl-] NLXLAEXVIDQMFP-UHFFFAOYSA-N 0.000 description 2
- SGYSTDWPNPKJPP-GUBZILKMSA-N Arg-Ala-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SGYSTDWPNPKJPP-GUBZILKMSA-N 0.000 description 2
- GXCSUJQOECMKPV-CIUDSAMLSA-N Arg-Ala-Gln Chemical compound C[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O GXCSUJQOECMKPV-CIUDSAMLSA-N 0.000 description 2
- GIVATXIGCXFQQA-FXQIFTODSA-N Arg-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N GIVATXIGCXFQQA-FXQIFTODSA-N 0.000 description 2
- VWVPYNGMOCSSGK-GUBZILKMSA-N Arg-Arg-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O VWVPYNGMOCSSGK-GUBZILKMSA-N 0.000 description 2
- OVVUNXXROOFSIM-SDDRHHMPSA-N Arg-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O OVVUNXXROOFSIM-SDDRHHMPSA-N 0.000 description 2
- KMSHNDWHPWXPEC-BQBZGAKWSA-N Arg-Asp-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KMSHNDWHPWXPEC-BQBZGAKWSA-N 0.000 description 2
- VXXHDZKEQNGXNU-QXEWZRGKSA-N Arg-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N VXXHDZKEQNGXNU-QXEWZRGKSA-N 0.000 description 2
- JCAISGGAOQXEHJ-ZPFDUUQYSA-N Arg-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N JCAISGGAOQXEHJ-ZPFDUUQYSA-N 0.000 description 2
- LMPKCSXZJSXBBL-NHCYSSNCSA-N Arg-Gln-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O LMPKCSXZJSXBBL-NHCYSSNCSA-N 0.000 description 2
- MZRBYBIQTIKERR-GUBZILKMSA-N Arg-Glu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MZRBYBIQTIKERR-GUBZILKMSA-N 0.000 description 2
- PBSOQGZLPFVXPU-YUMQZZPRSA-N Arg-Glu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PBSOQGZLPFVXPU-YUMQZZPRSA-N 0.000 description 2
- YNSGXDWWPCGGQS-YUMQZZPRSA-N Arg-Gly-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O YNSGXDWWPCGGQS-YUMQZZPRSA-N 0.000 description 2
- GNYUVVJYGJFKHN-RVMXOQNASA-N Arg-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N GNYUVVJYGJFKHN-RVMXOQNASA-N 0.000 description 2
- ZDBWKBCKYJGKGP-DCAQKATOSA-N Arg-Leu-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O ZDBWKBCKYJGKGP-DCAQKATOSA-N 0.000 description 2
- BSYKSCBTTQKOJG-GUBZILKMSA-N Arg-Pro-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O BSYKSCBTTQKOJG-GUBZILKMSA-N 0.000 description 2
- HNJNAMGZQZPSRE-GUBZILKMSA-N Arg-Pro-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O HNJNAMGZQZPSRE-GUBZILKMSA-N 0.000 description 2
- ASQKVGRCKOFKIU-KZVJFYERSA-N Arg-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O ASQKVGRCKOFKIU-KZVJFYERSA-N 0.000 description 2
- VLIJAPRTSXSGFY-STQMWFEESA-N Arg-Tyr-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 VLIJAPRTSXSGFY-STQMWFEESA-N 0.000 description 2
- QTAIIXQCOPUNBQ-QXEWZRGKSA-N Arg-Val-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QTAIIXQCOPUNBQ-QXEWZRGKSA-N 0.000 description 2
- UDSVWSUXKYXSTR-QWRGUYRKSA-N Asn-Gly-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O UDSVWSUXKYXSTR-QWRGUYRKSA-N 0.000 description 2
- YUUIAUXBNOHFRJ-IHRRRGAJSA-N Asn-Phe-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(O)=O YUUIAUXBNOHFRJ-IHRRRGAJSA-N 0.000 description 2
- UGXYFDQFLVCDFC-CIUDSAMLSA-N Asn-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O UGXYFDQFLVCDFC-CIUDSAMLSA-N 0.000 description 2
- NCXTYSVDWLAQGZ-ZKWXMUAHSA-N Asn-Ser-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O NCXTYSVDWLAQGZ-ZKWXMUAHSA-N 0.000 description 2
- CBHVAFXKOYAHOY-NHCYSSNCSA-N Asn-Val-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O CBHVAFXKOYAHOY-NHCYSSNCSA-N 0.000 description 2
- PBVLJOIPOGUQQP-CIUDSAMLSA-N Asp-Ala-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O PBVLJOIPOGUQQP-CIUDSAMLSA-N 0.000 description 2
- VFUXXFVCYZPOQG-WDSKDSINSA-N Asp-Glu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VFUXXFVCYZPOQG-WDSKDSINSA-N 0.000 description 2
- WBDWQKRLTVCDSY-WHFBIAKZSA-N Asp-Gly-Asp Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O WBDWQKRLTVCDSY-WHFBIAKZSA-N 0.000 description 2
- KPNUCOPMVSGRCR-DCAQKATOSA-N Asp-His-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O KPNUCOPMVSGRCR-DCAQKATOSA-N 0.000 description 2
- OGTCOKZFOJIZFG-CIUDSAMLSA-N Asp-His-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O OGTCOKZFOJIZFG-CIUDSAMLSA-N 0.000 description 2
- WYOSXGYAKZQPGF-SRVKXCTJSA-N Asp-His-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC(=O)O)N WYOSXGYAKZQPGF-SRVKXCTJSA-N 0.000 description 2
- WSXDIZFNQYTUJB-SRVKXCTJSA-N Asp-His-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O WSXDIZFNQYTUJB-SRVKXCTJSA-N 0.000 description 2
- JNNVNVRBYUJYGS-CIUDSAMLSA-N Asp-Leu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O JNNVNVRBYUJYGS-CIUDSAMLSA-N 0.000 description 2
- AYFVRYXNDHBECD-YUMQZZPRSA-N Asp-Leu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AYFVRYXNDHBECD-YUMQZZPRSA-N 0.000 description 2
- NZWDWXSWUQCNMG-GARJFASQSA-N Asp-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N)C(=O)O NZWDWXSWUQCNMG-GARJFASQSA-N 0.000 description 2
- RXBGWGRSWXOBGK-KKUMJFAQSA-N Asp-Lys-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RXBGWGRSWXOBGK-KKUMJFAQSA-N 0.000 description 2
- PCJOFZYFFMBZKC-PCBIJLKTSA-N Asp-Phe-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PCJOFZYFFMBZKC-PCBIJLKTSA-N 0.000 description 2
- IWLZBRTUIVXZJD-OLHMAJIHSA-N Asp-Thr-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O IWLZBRTUIVXZJD-OLHMAJIHSA-N 0.000 description 2
- KNOGLZBISUBTFW-QRTARXTBSA-N Asp-Trp-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C(C)C)C(O)=O KNOGLZBISUBTFW-QRTARXTBSA-N 0.000 description 2
- USENATHVGFXRNO-SRVKXCTJSA-N Asp-Tyr-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 USENATHVGFXRNO-SRVKXCTJSA-N 0.000 description 2
- GXIUDSXIUSTSLO-QXEWZRGKSA-N Asp-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)O)N GXIUDSXIUSTSLO-QXEWZRGKSA-N 0.000 description 2
- 241001513093 Aspergillus awamori Species 0.000 description 2
- 241000892910 Aspergillus foetidus Species 0.000 description 2
- 241001225321 Aspergillus fumigatus Species 0.000 description 2
- 241000351920 Aspergillus nidulans Species 0.000 description 2
- 240000006439 Aspergillus oryzae Species 0.000 description 2
- 235000002247 Aspergillus oryzae Nutrition 0.000 description 2
- 241000193749 Bacillus coagulans Species 0.000 description 2
- 241000219310 Beta vulgaris subsp. vulgaris Species 0.000 description 2
- 241000193764 Brevibacillus brevis Species 0.000 description 2
- 101100173127 Caldanaerobacter subterraneus subsp. tengcongensis (strain DSM 15242 / JCM 11007 / NBRC 100824 / MB4) fabZ gene Proteins 0.000 description 2
- 241000191368 Chlorobi Species 0.000 description 2
- 241001142109 Chloroflexi Species 0.000 description 2
- 241000193403 Clostridium Species 0.000 description 2
- 244000060011 Cocos nucifera Species 0.000 description 2
- 108091026890 Coding region Proteins 0.000 description 2
- LBOLGUYQEPZSKM-YUMQZZPRSA-N Cys-Gly-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CS)N LBOLGUYQEPZSKM-YUMQZZPRSA-N 0.000 description 2
- GUBGYTABKSRVRQ-CUHNMECISA-N D-Cellobiose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-CUHNMECISA-N 0.000 description 2
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 2
- 241000701988 Escherichia virus T5 Species 0.000 description 2
- 101150071111 FADD gene Proteins 0.000 description 2
- 102000000476 Fatty Acid Transport Proteins Human genes 0.000 description 2
- 108010055870 Fatty Acid Transport Proteins Proteins 0.000 description 2
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 2
- WUAYFMZULZDSLB-ACZMJKKPSA-N Gln-Ala-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O WUAYFMZULZDSLB-ACZMJKKPSA-N 0.000 description 2
- HHWQMFIGMMOVFK-WDSKDSINSA-N Gln-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O HHWQMFIGMMOVFK-WDSKDSINSA-N 0.000 description 2
- KZKBJEUWNMQTLV-XDTLVQLUSA-N Gln-Ala-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KZKBJEUWNMQTLV-XDTLVQLUSA-N 0.000 description 2
- PRBLYKYHAJEABA-SRVKXCTJSA-N Gln-Arg-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O PRBLYKYHAJEABA-SRVKXCTJSA-N 0.000 description 2
- HWEINOMSWQSJDC-SRVKXCTJSA-N Gln-Leu-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O HWEINOMSWQSJDC-SRVKXCTJSA-N 0.000 description 2
- SHAUZYVSXAMYAZ-JYJNAYRXSA-N Gln-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N SHAUZYVSXAMYAZ-JYJNAYRXSA-N 0.000 description 2
- VTTSANCGJWLPNC-ZPFDUUQYSA-N Glu-Arg-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VTTSANCGJWLPNC-ZPFDUUQYSA-N 0.000 description 2
- WOSRKEJQESVHGA-CIUDSAMLSA-N Glu-Arg-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O WOSRKEJQESVHGA-CIUDSAMLSA-N 0.000 description 2
- JVSBYEDSSRZQGV-GUBZILKMSA-N Glu-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O JVSBYEDSSRZQGV-GUBZILKMSA-N 0.000 description 2
- GYCPQVFKCPPRQB-GUBZILKMSA-N Glu-Gln-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)O)N GYCPQVFKCPPRQB-GUBZILKMSA-N 0.000 description 2
- VSRCAOIHMGCIJK-SRVKXCTJSA-N Glu-Leu-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VSRCAOIHMGCIJK-SRVKXCTJSA-N 0.000 description 2
- DNPCBMNFQVTHMA-DCAQKATOSA-N Glu-Leu-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DNPCBMNFQVTHMA-DCAQKATOSA-N 0.000 description 2
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 2
- SJJHXJDSNQJMMW-SRVKXCTJSA-N Glu-Lys-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O SJJHXJDSNQJMMW-SRVKXCTJSA-N 0.000 description 2
- JYXKPJVDCAWMDG-ZPFDUUQYSA-N Glu-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)O)N JYXKPJVDCAWMDG-ZPFDUUQYSA-N 0.000 description 2
- GPSHCSTUYOQPAI-JHEQGTHGSA-N Glu-Thr-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O GPSHCSTUYOQPAI-JHEQGTHGSA-N 0.000 description 2
- YQAQQKPWFOBSMU-WDCWCFNPSA-N Glu-Thr-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O YQAQQKPWFOBSMU-WDCWCFNPSA-N 0.000 description 2
- UUTGYDAKPISJAO-JYJNAYRXSA-N Glu-Tyr-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 UUTGYDAKPISJAO-JYJNAYRXSA-N 0.000 description 2
- YPHPEHMXOYTEQG-LAEOZQHASA-N Glu-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O YPHPEHMXOYTEQG-LAEOZQHASA-N 0.000 description 2
- VIPDPMHGICREIS-GVXVVHGQSA-N Glu-Val-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VIPDPMHGICREIS-GVXVVHGQSA-N 0.000 description 2
- RMWAOBGCZZSJHE-UMNHJUIQSA-N Glu-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N RMWAOBGCZZSJHE-UMNHJUIQSA-N 0.000 description 2
- 102000005720 Glutathione transferase Human genes 0.000 description 2
- 108010070675 Glutathione transferase Proteins 0.000 description 2
- BRFJMRSRMOMIMU-WHFBIAKZSA-N Gly-Ala-Asn Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O BRFJMRSRMOMIMU-WHFBIAKZSA-N 0.000 description 2
- UGVQELHRNUDMAA-BYPYZUCNSA-N Gly-Ala-Gly Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)NCC([O-])=O UGVQELHRNUDMAA-BYPYZUCNSA-N 0.000 description 2
- PHONXOACARQMPM-BQBZGAKWSA-N Gly-Ala-Met Chemical compound [H]NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O PHONXOACARQMPM-BQBZGAKWSA-N 0.000 description 2
- QXPRJQPCFXMCIY-NKWVEPMBSA-N Gly-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN QXPRJQPCFXMCIY-NKWVEPMBSA-N 0.000 description 2
- KRRMJKMGWWXWDW-STQMWFEESA-N Gly-Arg-Phe Chemical compound NC(=N)NCCC[C@H](NC(=O)CN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KRRMJKMGWWXWDW-STQMWFEESA-N 0.000 description 2
- DTPOVRRYXPJJAZ-FJXKBIBVSA-N Gly-Arg-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N DTPOVRRYXPJJAZ-FJXKBIBVSA-N 0.000 description 2
- XCLCVBYNGXEVDU-WHFBIAKZSA-N Gly-Asn-Ser Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O XCLCVBYNGXEVDU-WHFBIAKZSA-N 0.000 description 2
- IWAXHBCACVWNHT-BQBZGAKWSA-N Gly-Asp-Arg Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IWAXHBCACVWNHT-BQBZGAKWSA-N 0.000 description 2
- LXXLEUBUOMCAMR-NKWVEPMBSA-N Gly-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)CN)C(=O)O LXXLEUBUOMCAMR-NKWVEPMBSA-N 0.000 description 2
- LCNXZQROPKFGQK-WHFBIAKZSA-N Gly-Asp-Ser Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O LCNXZQROPKFGQK-WHFBIAKZSA-N 0.000 description 2
- TZOVVRJYUDETQG-RCOVLWMOSA-N Gly-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CN TZOVVRJYUDETQG-RCOVLWMOSA-N 0.000 description 2
- UQJNXZSSGQIPIQ-FBCQKBJTSA-N Gly-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)CN UQJNXZSSGQIPIQ-FBCQKBJTSA-N 0.000 description 2
- SWQALSGKVLYKDT-ZKWXMUAHSA-N Gly-Ile-Ala Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SWQALSGKVLYKDT-ZKWXMUAHSA-N 0.000 description 2
- SCWYHUQOOFRVHP-MBLNEYKQSA-N Gly-Ile-Thr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SCWYHUQOOFRVHP-MBLNEYKQSA-N 0.000 description 2
- UHPAZODVFFYEEL-QWRGUYRKSA-N Gly-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN UHPAZODVFFYEEL-QWRGUYRKSA-N 0.000 description 2
- MIIVFRCYJABHTQ-ONGXEEELSA-N Gly-Leu-Val Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O MIIVFRCYJABHTQ-ONGXEEELSA-N 0.000 description 2
- MHXKHKWHPNETGG-QWRGUYRKSA-N Gly-Lys-Leu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O MHXKHKWHPNETGG-QWRGUYRKSA-N 0.000 description 2
- SCJJPCQUJYPHRZ-BQBZGAKWSA-N Gly-Pro-Asn Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O SCJJPCQUJYPHRZ-BQBZGAKWSA-N 0.000 description 2
- LCRDMSSAKLTKBU-ZDLURKLDSA-N Gly-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN LCRDMSSAKLTKBU-ZDLURKLDSA-N 0.000 description 2
- JQFILXICXLDTRR-FBCQKBJTSA-N Gly-Thr-Gly Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)NCC(O)=O JQFILXICXLDTRR-FBCQKBJTSA-N 0.000 description 2
- SFOXOSKVTLDEDM-HOTGVXAUSA-N Gly-Trp-Leu Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)CN)=CNC2=C1 SFOXOSKVTLDEDM-HOTGVXAUSA-N 0.000 description 2
- UIQGJYUEQDOODF-KWQFWETISA-N Gly-Tyr-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 UIQGJYUEQDOODF-KWQFWETISA-N 0.000 description 2
- HQSKKSLNLSTONK-JTQLQIEISA-N Gly-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 HQSKKSLNLSTONK-JTQLQIEISA-N 0.000 description 2
- RVKIPWVMZANZLI-UHFFFAOYSA-N H-Lys-Trp-OH Natural products C1=CC=C2C(CC(NC(=O)C(N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-UHFFFAOYSA-N 0.000 description 2
- VOEGKUNRHYKYSU-XVYDVKMFSA-N His-Asp-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O VOEGKUNRHYKYSU-XVYDVKMFSA-N 0.000 description 2
- MVADCDSCFTXCBT-CIUDSAMLSA-N His-Asp-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MVADCDSCFTXCBT-CIUDSAMLSA-N 0.000 description 2
- LBQAHBIVXQSBIR-HVTMNAMFSA-N His-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N LBQAHBIVXQSBIR-HVTMNAMFSA-N 0.000 description 2
- IWXMHXYOACDSIA-PYJNHQTQSA-N His-Ile-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O IWXMHXYOACDSIA-PYJNHQTQSA-N 0.000 description 2
- WCHONUZTYDQMBY-PYJNHQTQSA-N His-Pro-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WCHONUZTYDQMBY-PYJNHQTQSA-N 0.000 description 2
- 241001480714 Humicola insolens Species 0.000 description 2
- VSZALHITQINTGC-GHCJXIJMSA-N Ile-Ala-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VSZALHITQINTGC-GHCJXIJMSA-N 0.000 description 2
- JRHFQUPIZOYKQP-KBIXCLLPSA-N Ile-Ala-Glu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O JRHFQUPIZOYKQP-KBIXCLLPSA-N 0.000 description 2
- SACHLUOUHCVIKI-GMOBBJLQSA-N Ile-Arg-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N SACHLUOUHCVIKI-GMOBBJLQSA-N 0.000 description 2
- QTUSJASXLGLJSR-OSUNSFLBSA-N Ile-Arg-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N QTUSJASXLGLJSR-OSUNSFLBSA-N 0.000 description 2
- QIHJTGSVGIPHIW-QSFUFRPTSA-N Ile-Asn-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N QIHJTGSVGIPHIW-QSFUFRPTSA-N 0.000 description 2
- KFVUBLZRFSVDGO-BYULHYEWSA-N Ile-Gly-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O KFVUBLZRFSVDGO-BYULHYEWSA-N 0.000 description 2
- PHRWFSFCNJPWRO-PPCPHDFISA-N Ile-Leu-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N PHRWFSFCNJPWRO-PPCPHDFISA-N 0.000 description 2
- OWSWUWDMSNXTNE-GMOBBJLQSA-N Ile-Pro-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N OWSWUWDMSNXTNE-GMOBBJLQSA-N 0.000 description 2
- BJECXJHLUJXPJQ-PYJNHQTQSA-N Ile-Pro-His Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N BJECXJHLUJXPJQ-PYJNHQTQSA-N 0.000 description 2
- RQJUKVXWAKJDBW-SVSWQMSJSA-N Ile-Ser-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N RQJUKVXWAKJDBW-SVSWQMSJSA-N 0.000 description 2
- ZYVTXBXHIKGZMD-QSFUFRPTSA-N Ile-Val-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ZYVTXBXHIKGZMD-QSFUFRPTSA-N 0.000 description 2
- BCISUQVFDGYZBO-QSFUFRPTSA-N Ile-Val-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O BCISUQVFDGYZBO-QSFUFRPTSA-N 0.000 description 2
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 description 2
- 108090000769 Isomerases Proteins 0.000 description 2
- 102000004195 Isomerases Human genes 0.000 description 2
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 2
- 239000005639 Lauric acid Substances 0.000 description 2
- XBBKIIGCUMBKCO-JXUBOQSCSA-N Leu-Ala-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XBBKIIGCUMBKCO-JXUBOQSCSA-N 0.000 description 2
- VIWUBXKCYJGNCL-SRVKXCTJSA-N Leu-Asn-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 VIWUBXKCYJGNCL-SRVKXCTJSA-N 0.000 description 2
- BPANDPNDMJHFEV-CIUDSAMLSA-N Leu-Asp-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O BPANDPNDMJHFEV-CIUDSAMLSA-N 0.000 description 2
- ILJREDZFPHTUIE-GUBZILKMSA-N Leu-Asp-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ILJREDZFPHTUIE-GUBZILKMSA-N 0.000 description 2
- ULXYQAJWJGLCNR-YUMQZZPRSA-N Leu-Asp-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O ULXYQAJWJGLCNR-YUMQZZPRSA-N 0.000 description 2
- MYGQXVYRZMKRDB-SRVKXCTJSA-N Leu-Asp-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN MYGQXVYRZMKRDB-SRVKXCTJSA-N 0.000 description 2
- BOFAFKVZQUMTID-AVGNSLFASA-N Leu-Gln-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N BOFAFKVZQUMTID-AVGNSLFASA-N 0.000 description 2
- KOSWSHVQIVTVQF-ZPFDUUQYSA-N Leu-Ile-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KOSWSHVQIVTVQF-ZPFDUUQYSA-N 0.000 description 2
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 2
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 2
- ZJZNLRVCZWUONM-JXUBOQSCSA-N Leu-Thr-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O ZJZNLRVCZWUONM-JXUBOQSCSA-N 0.000 description 2
- LFSQWRSVPNKJGP-WDCWCFNPSA-N Leu-Thr-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(O)=O LFSQWRSVPNKJGP-WDCWCFNPSA-N 0.000 description 2
- HGLKOTPFWOMPOB-MEYUZBJRSA-N Leu-Thr-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HGLKOTPFWOMPOB-MEYUZBJRSA-N 0.000 description 2
- RIHIGSWBLHSGLV-CQDKDKBSSA-N Leu-Tyr-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O RIHIGSWBLHSGLV-CQDKDKBSSA-N 0.000 description 2
- TUIOUEWKFFVNLH-DCAQKATOSA-N Leu-Val-Cys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(O)=O TUIOUEWKFFVNLH-DCAQKATOSA-N 0.000 description 2
- MYZMQWHPDAYKIE-SRVKXCTJSA-N Lys-Leu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O MYZMQWHPDAYKIE-SRVKXCTJSA-N 0.000 description 2
- YSPZCHGIWAQVKQ-AVGNSLFASA-N Lys-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN YSPZCHGIWAQVKQ-AVGNSLFASA-N 0.000 description 2
- VKCPHIOZDWUFSW-ONGXEEELSA-N Lys-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN VKCPHIOZDWUFSW-ONGXEEELSA-N 0.000 description 2
- CSNNHWWHGAXBCP-UHFFFAOYSA-L Magnesium sulfate Chemical compound [Mg+2].[O-][S+2]([O-])([O-])[O-] CSNNHWWHGAXBCP-UHFFFAOYSA-L 0.000 description 2
- ONGCSGVHCSAATF-CIUDSAMLSA-N Met-Ala-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O ONGCSGVHCSAATF-CIUDSAMLSA-N 0.000 description 2
- IHITVQKJXQQGLJ-LPEHRKFASA-N Met-Asn-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N IHITVQKJXQQGLJ-LPEHRKFASA-N 0.000 description 2
- SXWQMBGNFXAGAT-FJXKBIBVSA-N Met-Gly-Thr Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O SXWQMBGNFXAGAT-FJXKBIBVSA-N 0.000 description 2
- WPTDJKDGICUFCP-XUXIUFHCSA-N Met-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCSC)N WPTDJKDGICUFCP-XUXIUFHCSA-N 0.000 description 2
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 2
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 2
- 108010087066 N2-tryptophyllysine Proteins 0.000 description 2
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 2
- 241000192656 Nostoc Species 0.000 description 2
- 241000424623 Nostoc punctiforme Species 0.000 description 2
- CYZBFPYMSJGBRL-DRZSPHRISA-N Phe-Ala-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CYZBFPYMSJGBRL-DRZSPHRISA-N 0.000 description 2
- SWZKMTDPQXLQRD-XVSYOHENSA-N Phe-Asp-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWZKMTDPQXLQRD-XVSYOHENSA-N 0.000 description 2
- KYYMILWEGJYPQZ-IHRRRGAJSA-N Phe-Glu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 KYYMILWEGJYPQZ-IHRRRGAJSA-N 0.000 description 2
- BFYHIHGIHGROAT-HTUGSXCWSA-N Phe-Glu-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BFYHIHGIHGROAT-HTUGSXCWSA-N 0.000 description 2
- APJPXSFJBMMOLW-KBPBESRZSA-N Phe-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 APJPXSFJBMMOLW-KBPBESRZSA-N 0.000 description 2
- NHCKESBLOMHIIE-IRXDYDNUSA-N Phe-Gly-Phe Chemical compound C([C@H](N)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 NHCKESBLOMHIIE-IRXDYDNUSA-N 0.000 description 2
- GYEPCBNTTRORKW-PCBIJLKTSA-N Phe-Ile-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O GYEPCBNTTRORKW-PCBIJLKTSA-N 0.000 description 2
- RORUIHAWOLADSH-HJWJTTGWSA-N Phe-Ile-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=CC=C1 RORUIHAWOLADSH-HJWJTTGWSA-N 0.000 description 2
- YTILBRIUASDGBL-BZSNNMDCSA-N Phe-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 YTILBRIUASDGBL-BZSNNMDCSA-N 0.000 description 2
- IAOZOFPONWDXNT-IXOXFDKPSA-N Phe-Ser-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IAOZOFPONWDXNT-IXOXFDKPSA-N 0.000 description 2
- LTAWNJXSRUCFAN-UNQGMJICSA-N Phe-Thr-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LTAWNJXSRUCFAN-UNQGMJICSA-N 0.000 description 2
- BSKMOCNNLNDIMU-CDMKHQONSA-N Phe-Thr-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O BSKMOCNNLNDIMU-CDMKHQONSA-N 0.000 description 2
- GAMLAXHLYGLQBJ-UFYCRDLUSA-N Phe-Val-Tyr Chemical compound N[C@H](C(=O)N[C@H](C(=O)N[C@H](C(=O)O)CC1=CC=C(C=C1)O)C(C)C)CC1=CC=CC=C1 GAMLAXHLYGLQBJ-UFYCRDLUSA-N 0.000 description 2
- BNBBNGZZKQUWCD-IUCAKERBSA-N Pro-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H]1CCCN1 BNBBNGZZKQUWCD-IUCAKERBSA-N 0.000 description 2
- OYEUSRAZOGIDBY-JYJNAYRXSA-N Pro-Arg-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OYEUSRAZOGIDBY-JYJNAYRXSA-N 0.000 description 2
- QVIZLAUEAMQKGS-GUBZILKMSA-N Pro-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 QVIZLAUEAMQKGS-GUBZILKMSA-N 0.000 description 2
- VPEVBAUSTBWQHN-NHCYSSNCSA-N Pro-Glu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O VPEVBAUSTBWQHN-NHCYSSNCSA-N 0.000 description 2
- ULIWFCCJIOEHMU-BQBZGAKWSA-N Pro-Gly-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 ULIWFCCJIOEHMU-BQBZGAKWSA-N 0.000 description 2
- GFHXZNVJIKMAGO-IHRRRGAJSA-N Pro-Phe-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O GFHXZNVJIKMAGO-IHRRRGAJSA-N 0.000 description 2
- XDKKMRPRRCOELJ-GUBZILKMSA-N Pro-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 XDKKMRPRRCOELJ-GUBZILKMSA-N 0.000 description 2
- 108010079005 RDV peptide Proteins 0.000 description 2
- 241000131970 Rhodospirillaceae Species 0.000 description 2
- 241000219287 Saponaria Species 0.000 description 2
- NLQUOHDCLSFABG-GUBZILKMSA-N Ser-Arg-Arg Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NLQUOHDCLSFABG-GUBZILKMSA-N 0.000 description 2
- WDXYVIIVDIDOSX-DCAQKATOSA-N Ser-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N WDXYVIIVDIDOSX-DCAQKATOSA-N 0.000 description 2
- FIDMVVBUOCMMJG-CIUDSAMLSA-N Ser-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO FIDMVVBUOCMMJG-CIUDSAMLSA-N 0.000 description 2
- OLIJLNWFEQEFDM-SRVKXCTJSA-N Ser-Asp-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OLIJLNWFEQEFDM-SRVKXCTJSA-N 0.000 description 2
- SWSRFJZZMNLMLY-ZKWXMUAHSA-N Ser-Asp-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O SWSRFJZZMNLMLY-ZKWXMUAHSA-N 0.000 description 2
- OJPHFSOMBZKQKQ-GUBZILKMSA-N Ser-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CO OJPHFSOMBZKQKQ-GUBZILKMSA-N 0.000 description 2
- OHKFXGKHSJKKAL-NRPADANISA-N Ser-Glu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OHKFXGKHSJKKAL-NRPADANISA-N 0.000 description 2
- XXXAXOWMBOKTRN-XPUUQOCRSA-N Ser-Gly-Val Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXXAXOWMBOKTRN-XPUUQOCRSA-N 0.000 description 2
- FBLNYDYPCLFTSP-IXOXFDKPSA-N Ser-Phe-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FBLNYDYPCLFTSP-IXOXFDKPSA-N 0.000 description 2
- XJDMUQCLVSCRSJ-VZFHVOOUSA-N Ser-Thr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O XJDMUQCLVSCRSJ-VZFHVOOUSA-N 0.000 description 2
- NADLKBTYNKUJEP-KATARQTJSA-N Ser-Thr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NADLKBTYNKUJEP-KATARQTJSA-N 0.000 description 2
- QYBRQMLZDDJBSW-AVGNSLFASA-N Ser-Tyr-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O QYBRQMLZDDJBSW-AVGNSLFASA-N 0.000 description 2
- ZVBCMFDJIMUELU-BZSNNMDCSA-N Ser-Tyr-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CO)N ZVBCMFDJIMUELU-BZSNNMDCSA-N 0.000 description 2
- IAOHCSQDQDWRQU-GUBZILKMSA-N Ser-Val-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IAOHCSQDQDWRQU-GUBZILKMSA-N 0.000 description 2
- ANOQEBQWIAYIMV-AEJSXWLSSA-N Ser-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N ANOQEBQWIAYIMV-AEJSXWLSSA-N 0.000 description 2
- 244000044822 Simmondsia californica Species 0.000 description 2
- 235000004433 Simmondsia californica Nutrition 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 240000006394 Sorghum bicolor Species 0.000 description 2
- 235000011684 Sorghum saccharatum Nutrition 0.000 description 2
- 241000187398 Streptomyces lividans Species 0.000 description 2
- 241001468239 Streptomyces murinus Species 0.000 description 2
- 235000021536 Sugar beet Nutrition 0.000 description 2
- 241001453313 Synechococcus sp. PCC 7002 Species 0.000 description 2
- 239000004098 Tetracycline Substances 0.000 description 2
- FQPQPTHMHZKGFM-XQXXSGGOSA-N Thr-Ala-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O FQPQPTHMHZKGFM-XQXXSGGOSA-N 0.000 description 2
- LVHHEVGYAZGXDE-KDXUFGMBSA-N Thr-Ala-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(=O)O)N)O LVHHEVGYAZGXDE-KDXUFGMBSA-N 0.000 description 2
- DWYAUVCQDTZIJI-VZFHVOOUSA-N Thr-Ala-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O DWYAUVCQDTZIJI-VZFHVOOUSA-N 0.000 description 2
- XYEXCEPTALHNEV-RCWTZXSCSA-N Thr-Arg-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O XYEXCEPTALHNEV-RCWTZXSCSA-N 0.000 description 2
- VFEHSAJCWWHDBH-RHYQMDGZSA-N Thr-Arg-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O VFEHSAJCWWHDBH-RHYQMDGZSA-N 0.000 description 2
- JEDIEMIJYSRUBB-FOHZUACHSA-N Thr-Asp-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O JEDIEMIJYSRUBB-FOHZUACHSA-N 0.000 description 2
- JMGJDTNUMAZNLX-RWRJDSDZSA-N Thr-Glu-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JMGJDTNUMAZNLX-RWRJDSDZSA-N 0.000 description 2
- ADPHPKGWVDHWML-PPCPHDFISA-N Thr-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N ADPHPKGWVDHWML-PPCPHDFISA-N 0.000 description 2
- HOVLHEKTGVIKAP-WDCWCFNPSA-N Thr-Leu-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O HOVLHEKTGVIKAP-WDCWCFNPSA-N 0.000 description 2
- WRQLCVIALDUQEQ-UNQGMJICSA-N Thr-Phe-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WRQLCVIALDUQEQ-UNQGMJICSA-N 0.000 description 2
- MXDOAJQRJBMGMO-FJXKBIBVSA-N Thr-Pro-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O MXDOAJQRJBMGMO-FJXKBIBVSA-N 0.000 description 2
- YGCDFAJJCRVQKU-RCWTZXSCSA-N Thr-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O YGCDFAJJCRVQKU-RCWTZXSCSA-N 0.000 description 2
- JAWUQFCGNVEDRN-MEYUZBJRSA-N Thr-Tyr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N)O JAWUQFCGNVEDRN-MEYUZBJRSA-N 0.000 description 2
- CURFABYITJVKEW-QTKMDUPCSA-N Thr-Val-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O CURFABYITJVKEW-QTKMDUPCSA-N 0.000 description 2
- 108091023040 Transcription factor Proteins 0.000 description 2
- 102000040945 Transcription factor Human genes 0.000 description 2
- 241000378866 Trichoderma koningii Species 0.000 description 2
- 241000223262 Trichoderma longibrachiatum Species 0.000 description 2
- 241000499912 Trichoderma reesei Species 0.000 description 2
- 241000223261 Trichoderma viride Species 0.000 description 2
- 241000078013 Trichormus variabilis Species 0.000 description 2
- CXUFDWZBHKUGKK-CABZTGNLSA-N Trp-Ala-Gly Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O)=CNC2=C1 CXUFDWZBHKUGKK-CABZTGNLSA-N 0.000 description 2
- VPRHDRKAPYZMHL-SZMVWBNQSA-N Trp-Leu-Glu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 VPRHDRKAPYZMHL-SZMVWBNQSA-N 0.000 description 2
- ADMHZNPMMVKGJW-BPUTZDHNSA-N Trp-Ser-Arg Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N ADMHZNPMMVKGJW-BPUTZDHNSA-N 0.000 description 2
- JKLJVFCPCWMNMZ-UMPQAUOISA-N Trp-Thr-Met Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCSC)C(O)=O)[C@@H](C)O)=CNC2=C1 JKLJVFCPCWMNMZ-UMPQAUOISA-N 0.000 description 2
- UABYBEBXFFNCIR-YDHLFZDLSA-N Tyr-Asp-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UABYBEBXFFNCIR-YDHLFZDLSA-N 0.000 description 2
- AKLNEFNQWLHIGY-QWRGUYRKSA-N Tyr-Gly-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)O)C(=O)O)N)O AKLNEFNQWLHIGY-QWRGUYRKSA-N 0.000 description 2
- CVXURBLRELTJKO-BWAGICSOSA-N Tyr-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)O CVXURBLRELTJKO-BWAGICSOSA-N 0.000 description 2
- WOAQYWUEUYMVGK-ULQDDVLXSA-N Tyr-Lys-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WOAQYWUEUYMVGK-ULQDDVLXSA-N 0.000 description 2
- XUIOBCQESNDTDE-FQPOAREZSA-N Tyr-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O XUIOBCQESNDTDE-FQPOAREZSA-N 0.000 description 2
- LVFZXRQQQDTBQH-IRIUXVKKSA-N Tyr-Thr-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O LVFZXRQQQDTBQH-IRIUXVKKSA-N 0.000 description 2
- WQOHKVRQDLNDIL-YJRXYDGGSA-N Tyr-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O WQOHKVRQDLNDIL-YJRXYDGGSA-N 0.000 description 2
- SQUMHUZLJDUROQ-YDHLFZDLSA-N Tyr-Val-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O SQUMHUZLJDUROQ-YDHLFZDLSA-N 0.000 description 2
- RVGVIWNHABGIFH-IHRRRGAJSA-N Tyr-Val-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O RVGVIWNHABGIFH-IHRRRGAJSA-N 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- YFOCMOVJBQDBCE-NRPADANISA-N Val-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N YFOCMOVJBQDBCE-NRPADANISA-N 0.000 description 2
- VMRFIKXKOFNMHW-GUBZILKMSA-N Val-Arg-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N VMRFIKXKOFNMHW-GUBZILKMSA-N 0.000 description 2
- DBOXBUDEAJVKRE-LSJOCFKGSA-N Val-Asn-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N DBOXBUDEAJVKRE-LSJOCFKGSA-N 0.000 description 2
- HHSILIQTHXABKM-YDHLFZDLSA-N Val-Asp-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](Cc1ccccc1)C(O)=O HHSILIQTHXABKM-YDHLFZDLSA-N 0.000 description 2
- CFSSLXZJEMERJY-NRPADANISA-N Val-Gln-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CFSSLXZJEMERJY-NRPADANISA-N 0.000 description 2
- WDIGUPHXPBMODF-UMNHJUIQSA-N Val-Glu-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N WDIGUPHXPBMODF-UMNHJUIQSA-N 0.000 description 2
- OQWNEUXPKHIEJO-NRPADANISA-N Val-Glu-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N OQWNEUXPKHIEJO-NRPADANISA-N 0.000 description 2
- XWYUBUYQMOUFRQ-IFFSRLJSSA-N Val-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N)O XWYUBUYQMOUFRQ-IFFSRLJSSA-N 0.000 description 2
- KZKMBGXCNLPYKD-YEPSODPASA-N Val-Gly-Thr Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O KZKMBGXCNLPYKD-YEPSODPASA-N 0.000 description 2
- SDUBQHUJJWQTEU-XUXIUFHCSA-N Val-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C(C)C)N SDUBQHUJJWQTEU-XUXIUFHCSA-N 0.000 description 2
- XBJKAZATRJBDCU-GUBZILKMSA-N Val-Pro-Ala Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O XBJKAZATRJBDCU-GUBZILKMSA-N 0.000 description 2
- YTNGABPUXFEOGU-SRVKXCTJSA-N Val-Pro-Arg Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O YTNGABPUXFEOGU-SRVKXCTJSA-N 0.000 description 2
- DEGUERSKQBRZMZ-FXQIFTODSA-N Val-Ser-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DEGUERSKQBRZMZ-FXQIFTODSA-N 0.000 description 2
- GBIUHAYJGWVNLN-AEJSXWLSSA-N Val-Ser-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N GBIUHAYJGWVNLN-AEJSXWLSSA-N 0.000 description 2
- GBIUHAYJGWVNLN-UHFFFAOYSA-N Val-Ser-Pro Natural products CC(C)C(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O GBIUHAYJGWVNLN-UHFFFAOYSA-N 0.000 description 2
- UQMPYVLTQCGRSK-IFFSRLJSSA-N Val-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N)O UQMPYVLTQCGRSK-IFFSRLJSSA-N 0.000 description 2
- UVHFONIHVHLDDQ-IFFSRLJSSA-N Val-Thr-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O UVHFONIHVHLDDQ-IFFSRLJSSA-N 0.000 description 2
- XNLUVJPMPAZHCY-JYJNAYRXSA-N Val-Val-Phe Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 XNLUVJPMPAZHCY-JYJNAYRXSA-N 0.000 description 2
- 239000004164 Wax ester Substances 0.000 description 2
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 2
- 241000588901 Zymomonas Species 0.000 description 2
- 238000010521 absorption reaction Methods 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 2
- 150000001242 acetic acid derivatives Chemical class 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- 150000007513 acids Chemical class 0.000 description 2
- 125000002252 acyl group Chemical group 0.000 description 2
- 238000001261 affinity purification Methods 0.000 description 2
- 108010041407 alanylaspartic acid Proteins 0.000 description 2
- 108010018691 arginyl-threonyl-arginine Proteins 0.000 description 2
- 108010077245 asparaginyl-proline Proteins 0.000 description 2
- 108010047857 aspartylglycine Proteins 0.000 description 2
- 229940091771 aspergillus fumigatus Drugs 0.000 description 2
- 239000012298 atmosphere Substances 0.000 description 2
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 2
- 230000001651 autotrophic effect Effects 0.000 description 2
- 229940054340 bacillus coagulans Drugs 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008238 biochemical pathway Effects 0.000 description 2
- 230000003115 biocidal effect Effects 0.000 description 2
- 239000012620 biological material Substances 0.000 description 2
- 210000004899 c-terminal region Anatomy 0.000 description 2
- 229940041514 candida albicans extract Drugs 0.000 description 2
- 230000010261 cell growth Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000001311 chemical methods and process Methods 0.000 description 2
- 229960005091 chloramphenicol Drugs 0.000 description 2
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 2
- 238000004587 chromatography analysis Methods 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- 239000003245 coal Substances 0.000 description 2
- 239000000356 contaminant Substances 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- DIOQZVSQGTUSAI-UHFFFAOYSA-N decane Chemical compound CCCCCCCCCC DIOQZVSQGTUSAI-UHFFFAOYSA-N 0.000 description 2
- 230000018044 dehydration Effects 0.000 description 2
- 238000006297 dehydration reaction Methods 0.000 description 2
- 238000001212 derivatisation Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- VILAVOFMIJHSJA-UHFFFAOYSA-N dicarbon monoxide Chemical compound [C]=C=O VILAVOFMIJHSJA-UHFFFAOYSA-N 0.000 description 2
- 238000010790 dilution Methods 0.000 description 2
- 239000012895 dilution Substances 0.000 description 2
- 150000002016 disaccharides Chemical class 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 239000003974 emollient agent Substances 0.000 description 2
- 238000003821 enantio-separation Methods 0.000 description 2
- 230000009483 enzymatic pathway Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 101150078207 fabA gene Proteins 0.000 description 2
- 230000004129 fatty acid metabolism Effects 0.000 description 2
- 235000019387 fatty acid methyl ester Nutrition 0.000 description 2
- 210000003608 fece Anatomy 0.000 description 2
- 239000012527 feed solution Substances 0.000 description 2
- 239000002921 fermentation waste Substances 0.000 description 2
- 235000012041 food component Nutrition 0.000 description 2
- 239000005417 food ingredient Substances 0.000 description 2
- 239000003205 fragrance Substances 0.000 description 2
- 230000002538 fungal effect Effects 0.000 description 2
- 235000021255 galacto-oligosaccharides Nutrition 0.000 description 2
- 150000003271 galactooligosaccharides Chemical class 0.000 description 2
- 238000012239 gene modification Methods 0.000 description 2
- 230000005017 genetic modification Effects 0.000 description 2
- 235000013617 genetically modified food Nutrition 0.000 description 2
- 108010078144 glutaminyl-glycine Proteins 0.000 description 2
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 2
- 108010073628 glutamyl-valyl-phenylalanine Proteins 0.000 description 2
- 108010010147 glycylglutamine Proteins 0.000 description 2
- 108010077515 glycylproline Proteins 0.000 description 2
- 108010087823 glycyltyrosine Proteins 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- FNELUTYSVHOFKT-UHFFFAOYSA-N heptadecane-1,3-diol Chemical compound CCCCCCCCCCCCCCC(O)CCO FNELUTYSVHOFKT-UHFFFAOYSA-N 0.000 description 2
- HTXVEEVTGGCUNC-UHFFFAOYSA-N heptane-1,3-diol Chemical compound CCCCC(O)CCO HTXVEEVTGGCUNC-UHFFFAOYSA-N 0.000 description 2
- GZXNLYGAGAVUSB-UHFFFAOYSA-N hexadecane-1,3-diol Chemical compound CCCCCCCCCCCCCC(O)CCO GZXNLYGAGAVUSB-UHFFFAOYSA-N 0.000 description 2
- AVIYEYCFMVPYST-UHFFFAOYSA-N hexane-1,3-diol Chemical compound CCCC(O)CCO AVIYEYCFMVPYST-UHFFFAOYSA-N 0.000 description 2
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 2
- 238000007037 hydroformylation reaction Methods 0.000 description 2
- 238000005984 hydrogenation reaction Methods 0.000 description 2
- 150000002500 ions Chemical class 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 2
- 229960000318 kanamycin Drugs 0.000 description 2
- 229930027917 kanamycin Natural products 0.000 description 2
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 2
- 229930182823 kanamycin A Natural products 0.000 description 2
- 150000002576 ketones Chemical class 0.000 description 2
- 150000003893 lactate salts Chemical class 0.000 description 2
- 235000021190 leftovers Nutrition 0.000 description 2
- 239000003446 ligand Substances 0.000 description 2
- 108010017391 lysylvaline Proteins 0.000 description 2
- 230000014759 maintenance of location Effects 0.000 description 2
- 235000009973 maize Nutrition 0.000 description 2
- 210000004962 mammalian cell Anatomy 0.000 description 2
- 238000004949 mass spectrometry Methods 0.000 description 2
- 239000012092 media component Substances 0.000 description 2
- 230000002503 metabolic effect Effects 0.000 description 2
- 108010068488 methionylphenylalanine Proteins 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 239000000178 monomer Substances 0.000 description 2
- 150000002772 monosaccharides Chemical class 0.000 description 2
- 229910052757 nitrogen Inorganic materials 0.000 description 2
- RSEXBRKIOMNOPQ-UHFFFAOYSA-N nonadecane-1,3-diol Chemical compound CCCCCCCCCCCCCCCCC(O)CCO RSEXBRKIOMNOPQ-UHFFFAOYSA-N 0.000 description 2
- 239000002417 nutraceutical Substances 0.000 description 2
- 235000021436 nutraceutical agent Nutrition 0.000 description 2
- BQSIVPZTNQHZOI-UHFFFAOYSA-N octadecane-1,3-diol Chemical compound CCCCCCCCCCCCCCCC(O)CCO BQSIVPZTNQHZOI-UHFFFAOYSA-N 0.000 description 2
- NMRPBPVERJPACX-UHFFFAOYSA-N octan-3-ol Chemical compound CCCCCC(O)CC NMRPBPVERJPACX-UHFFFAOYSA-N 0.000 description 2
- 239000003921 oil Substances 0.000 description 2
- 235000019198 oils Nutrition 0.000 description 2
- 210000003463 organelle Anatomy 0.000 description 2
- 239000011368 organic material Substances 0.000 description 2
- 229910052760 oxygen Inorganic materials 0.000 description 2
- 239000001301 oxygen Substances 0.000 description 2
- UGJRMHXEWBBMMN-UHFFFAOYSA-N pentadecane-1,3-diol Chemical compound CCCCCCCCCCCCC(O)CCO UGJRMHXEWBBMMN-UHFFFAOYSA-N 0.000 description 2
- RUOPINZRYMFPBF-UHFFFAOYSA-N pentane-1,3-diol Chemical compound CCC(O)CCO RUOPINZRYMFPBF-UHFFFAOYSA-N 0.000 description 2
- 239000013520 petroleum-based product Substances 0.000 description 2
- 229920001282 polysaccharide Polymers 0.000 description 2
- 239000005017 polysaccharide Substances 0.000 description 2
- 150000004804 polysaccharides Chemical class 0.000 description 2
- 229920000166 polytrimethylene carbonate Polymers 0.000 description 2
- 239000002243 precursor Substances 0.000 description 2
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 2
- 108010079317 prolyl-tyrosine Proteins 0.000 description 2
- 230000007026 protein scission Effects 0.000 description 2
- 230000002285 radioactive effect Effects 0.000 description 2
- 238000006722 reduction reaction Methods 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 150000004671 saturated fatty acids Chemical class 0.000 description 2
- 235000003441 saturated fatty acids Nutrition 0.000 description 2
- 230000003248 secreting effect Effects 0.000 description 2
- 235000002639 sodium chloride Nutrition 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 150000003890 succinate salts Chemical class 0.000 description 2
- 230000008685 targeting Effects 0.000 description 2
- 229960002180 tetracycline Drugs 0.000 description 2
- 229930101283 tetracycline Natural products 0.000 description 2
- 235000019364 tetracycline Nutrition 0.000 description 2
- 150000003522 tetracyclines Chemical class 0.000 description 2
- GXBLITCOLKGJDG-UHFFFAOYSA-N tetradec-13-en-1-ol Chemical compound OCCCCCCCCCCCCC=C GXBLITCOLKGJDG-UHFFFAOYSA-N 0.000 description 2
- 125000003396 thiol group Chemical group [H]S* 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 150000003626 triacylglycerols Chemical class 0.000 description 2
- HVEUXCYPTJKWQE-UHFFFAOYSA-N tridecane-1,3-diol Chemical compound CCCCCCCCCCC(O)CCO HVEUXCYPTJKWQE-UHFFFAOYSA-N 0.000 description 2
- 241001446247 uncultured actinomycete Species 0.000 description 2
- CSFUNXXUTSRHPN-UHFFFAOYSA-N undecane-1,3-diol Chemical compound CCCCCCCCC(O)CCO CSFUNXXUTSRHPN-UHFFFAOYSA-N 0.000 description 2
- 241000701447 unidentified baculovirus Species 0.000 description 2
- 150000004670 unsaturated fatty acids Chemical class 0.000 description 2
- 235000021122 unsaturated fatty acids Nutrition 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 235000019386 wax ester Nutrition 0.000 description 2
- 239000012138 yeast extract Substances 0.000 description 2
- JNTMAZFVYNDPLB-PEDHHIEDSA-N (2S,3S)-2-[[[(2S)-1-[(2S,3S)-2-amino-3-methyl-1-oxopentyl]-2-pyrrolidinyl]-oxomethyl]amino]-3-methylpentanoic acid Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JNTMAZFVYNDPLB-PEDHHIEDSA-N 0.000 description 1
- LNAZSHAWQACDHT-XIYTZBAFSA-N (2r,3r,4s,5r,6s)-4,5-dimethoxy-2-(methoxymethyl)-3-[(2s,3r,4s,5r,6r)-3,4,5-trimethoxy-6-(methoxymethyl)oxan-2-yl]oxy-6-[(2r,3r,4s,5r,6r)-4,5,6-trimethoxy-2-(methoxymethyl)oxan-3-yl]oxyoxane Chemical compound CO[C@@H]1[C@@H](OC)[C@H](OC)[C@@H](COC)O[C@H]1O[C@H]1[C@H](OC)[C@@H](OC)[C@H](O[C@H]2[C@@H]([C@@H](OC)[C@H](OC)O[C@@H]2COC)OC)O[C@@H]1COC LNAZSHAWQACDHT-XIYTZBAFSA-N 0.000 description 1
- WRIDQFICGBMAFQ-UHFFFAOYSA-N (E)-8-Octadecenoic acid Natural products CCCCCCCCCC=CCCCCCCC(O)=O WRIDQFICGBMAFQ-UHFFFAOYSA-N 0.000 description 1
- CQKHFONAFZDDKV-VAWYXSNFSA-N (e)-dodec-1-en-1-ol Chemical compound CCCCCCCCCC\C=C\O CQKHFONAFZDDKV-VAWYXSNFSA-N 0.000 description 1
- GWSURTDMLUFMJH-FOCLMDBBSA-N (e)-hexadec-1-en-1-ol Chemical compound CCCCCCCCCCCCCC\C=C\O GWSURTDMLUFMJH-FOCLMDBBSA-N 0.000 description 1
- JEGNXMUWVCVSSQ-ISLYRVAYSA-N (e)-octadec-1-en-1-ol Chemical compound CCCCCCCCCCCCCCCC\C=C\O JEGNXMUWVCVSSQ-ISLYRVAYSA-N 0.000 description 1
- TWJNQYPJQDRXPH-UHFFFAOYSA-N 2-cyanobenzohydrazide Chemical compound NNC(=O)C1=CC=CC=C1C#N TWJNQYPJQDRXPH-UHFFFAOYSA-N 0.000 description 1
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 1
- LQJBNNIYVWPHFW-UHFFFAOYSA-N 20:1omega9c fatty acid Natural products CCCCCCCCCCC=CCCCCCCCC(O)=O LQJBNNIYVWPHFW-UHFFFAOYSA-N 0.000 description 1
- 108700020831 3-Hydroxyacyl-CoA Dehydrogenase Proteins 0.000 description 1
- NMRPBPVERJPACX-QMMMGPOBSA-N 3-Octanol Natural products CCCCC[C@@H](O)CC NMRPBPVERJPACX-QMMMGPOBSA-N 0.000 description 1
- 108010093803 3-ketoacyl-acyl carrier protein synthase III Proteins 0.000 description 1
- QSBYPNXLFMSGKH-UHFFFAOYSA-N 9-Heptadecensaeure Natural products CCCCCCCC=CCCCCCCCC(O)=O QSBYPNXLFMSGKH-UHFFFAOYSA-N 0.000 description 1
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 description 1
- 241000589291 Acinetobacter Species 0.000 description 1
- 241001165345 Acinetobacter baylyi Species 0.000 description 1
- 102100026041 Acrosin Human genes 0.000 description 1
- 241000186361 Actinobacteria <class> Species 0.000 description 1
- 102000002296 Acyl-CoA Dehydrogenases Human genes 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- HHGYNJRJIINWAK-FXQIFTODSA-N Ala-Ala-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N HHGYNJRJIINWAK-FXQIFTODSA-N 0.000 description 1
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 1
- UCIYCBSJBQGDGM-LPEHRKFASA-N Ala-Arg-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N UCIYCBSJBQGDGM-LPEHRKFASA-N 0.000 description 1
- NHCPCLJZRSIDHS-ZLUOBGJFSA-N Ala-Asp-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O NHCPCLJZRSIDHS-ZLUOBGJFSA-N 0.000 description 1
- WDIYWDJLXOCGRW-ACZMJKKPSA-N Ala-Asp-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WDIYWDJLXOCGRW-ACZMJKKPSA-N 0.000 description 1
- LGFCAXJBAZESCF-ACZMJKKPSA-N Ala-Gln-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O LGFCAXJBAZESCF-ACZMJKKPSA-N 0.000 description 1
- OQCPATDFWYYDDX-HGNGGELXSA-N Ala-Gln-His Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O OQCPATDFWYYDDX-HGNGGELXSA-N 0.000 description 1
- BLGHHPHXVJWCNK-GUBZILKMSA-N Ala-Gln-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BLGHHPHXVJWCNK-GUBZILKMSA-N 0.000 description 1
- SFNFGFDRYJKZKN-XQXXSGGOSA-N Ala-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C)N)O SFNFGFDRYJKZKN-XQXXSGGOSA-N 0.000 description 1
- FUSPCLTUKXQREV-ACZMJKKPSA-N Ala-Glu-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O FUSPCLTUKXQREV-ACZMJKKPSA-N 0.000 description 1
- HXNNRBHASOSVPG-GUBZILKMSA-N Ala-Glu-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HXNNRBHASOSVPG-GUBZILKMSA-N 0.000 description 1
- XYTNPQNAZREREP-XQXXSGGOSA-N Ala-Glu-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XYTNPQNAZREREP-XQXXSGGOSA-N 0.000 description 1
- OMMDTNGURYRDAC-NRPADANISA-N Ala-Glu-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OMMDTNGURYRDAC-NRPADANISA-N 0.000 description 1
- ZVFVBBGVOILKPO-WHFBIAKZSA-N Ala-Gly-Ala Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O ZVFVBBGVOILKPO-WHFBIAKZSA-N 0.000 description 1
- BEMGNWZECGIJOI-WDSKDSINSA-N Ala-Gly-Glu Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O BEMGNWZECGIJOI-WDSKDSINSA-N 0.000 description 1
- PCIFXPRIFWKWLK-YUMQZZPRSA-N Ala-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N PCIFXPRIFWKWLK-YUMQZZPRSA-N 0.000 description 1
- GHBSKQGCIYSCNS-NAKRPEOUSA-N Ala-Leu-Asp-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O GHBSKQGCIYSCNS-NAKRPEOUSA-N 0.000 description 1
- PMQXMXAASGFUDX-SRVKXCTJSA-N Ala-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CCCCN PMQXMXAASGFUDX-SRVKXCTJSA-N 0.000 description 1
- FVNAUOZKIPAYNA-BPNCWPANSA-N Ala-Met-Tyr Chemical compound CSCC[C@H](NC(=O)[C@H](C)N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FVNAUOZKIPAYNA-BPNCWPANSA-N 0.000 description 1
- FQNILRVJOJBFFC-FXQIFTODSA-N Ala-Pro-Asp Chemical compound C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N FQNILRVJOJBFFC-FXQIFTODSA-N 0.000 description 1
- IORKCNUBHNIMKY-CIUDSAMLSA-N Ala-Pro-Glu Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O IORKCNUBHNIMKY-CIUDSAMLSA-N 0.000 description 1
- BTRULDJUUVGRNE-DCAQKATOSA-N Ala-Pro-Lys Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O BTRULDJUUVGRNE-DCAQKATOSA-N 0.000 description 1
- MSWSRLGNLKHDEI-ACZMJKKPSA-N Ala-Ser-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O MSWSRLGNLKHDEI-ACZMJKKPSA-N 0.000 description 1
- ARHJJAAWNWOACN-FXQIFTODSA-N Ala-Ser-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O ARHJJAAWNWOACN-FXQIFTODSA-N 0.000 description 1
- YNOCMHZSWJMGBB-GCJQMDKQSA-N Ala-Thr-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O YNOCMHZSWJMGBB-GCJQMDKQSA-N 0.000 description 1
- WNHNMKOFKCHKKD-BFHQHQDPSA-N Ala-Thr-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O WNHNMKOFKCHKKD-BFHQHQDPSA-N 0.000 description 1
- YCTIYBUTCKNOTI-UWJYBYFXSA-N Ala-Tyr-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCTIYBUTCKNOTI-UWJYBYFXSA-N 0.000 description 1
- IYKVSFNGSWTTNZ-GUBZILKMSA-N Ala-Val-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IYKVSFNGSWTTNZ-GUBZILKMSA-N 0.000 description 1
- YJHKTAMKPGFJCT-NRPADANISA-N Ala-Val-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O YJHKTAMKPGFJCT-NRPADANISA-N 0.000 description 1
- 235000019737 Animal fat Nutrition 0.000 description 1
- PVSNBTCXCQIXSE-JYJNAYRXSA-N Arg-Arg-Phe Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PVSNBTCXCQIXSE-JYJNAYRXSA-N 0.000 description 1
- YSUVMPICYVWRBX-VEVYYDQMSA-N Arg-Asp-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YSUVMPICYVWRBX-VEVYYDQMSA-N 0.000 description 1
- GIVWETPOBCRTND-DCAQKATOSA-N Arg-Gln-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GIVWETPOBCRTND-DCAQKATOSA-N 0.000 description 1
- BEXGZLUHRXTZCC-CIUDSAMLSA-N Arg-Gln-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)CN=C(N)N BEXGZLUHRXTZCC-CIUDSAMLSA-N 0.000 description 1
- AQPVUEJJARLJHB-BQBZGAKWSA-N Arg-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N AQPVUEJJARLJHB-BQBZGAKWSA-N 0.000 description 1
- AUFHLLPVPSMEOG-YUMQZZPRSA-N Arg-Gly-Glu Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AUFHLLPVPSMEOG-YUMQZZPRSA-N 0.000 description 1
- UBCPNBUIQNMDNH-NAKRPEOUSA-N Arg-Ile-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O UBCPNBUIQNMDNH-NAKRPEOUSA-N 0.000 description 1
- LKDHUGLXOHYINY-XUXIUFHCSA-N Arg-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N LKDHUGLXOHYINY-XUXIUFHCSA-N 0.000 description 1
- OTZMRMHZCMZOJZ-SRVKXCTJSA-N Arg-Leu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OTZMRMHZCMZOJZ-SRVKXCTJSA-N 0.000 description 1
- YBZMTKUDWXZLIX-UWVGGRQHSA-N Arg-Leu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YBZMTKUDWXZLIX-UWVGGRQHSA-N 0.000 description 1
- OGSQONVYSTZIJB-WDSOQIARSA-N Arg-Leu-Trp Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCN=C(N)N)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O OGSQONVYSTZIJB-WDSOQIARSA-N 0.000 description 1
- UGZUVYDKAYNCII-ULQDDVLXSA-N Arg-Phe-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UGZUVYDKAYNCII-ULQDDVLXSA-N 0.000 description 1
- KZXPVYVSHUJCEO-ULQDDVLXSA-N Arg-Phe-Lys Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=CC=C1 KZXPVYVSHUJCEO-ULQDDVLXSA-N 0.000 description 1
- NGYHSXDNNOFHNE-AVGNSLFASA-N Arg-Pro-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O NGYHSXDNNOFHNE-AVGNSLFASA-N 0.000 description 1
- ATABBWFGOHKROJ-GUBZILKMSA-N Arg-Pro-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O ATABBWFGOHKROJ-GUBZILKMSA-N 0.000 description 1
- JPAWCMXVNZPJLO-IHRRRGAJSA-N Arg-Ser-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JPAWCMXVNZPJLO-IHRRRGAJSA-N 0.000 description 1
- AIFHRTPABBBHKU-RCWTZXSCSA-N Arg-Thr-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O AIFHRTPABBBHKU-RCWTZXSCSA-N 0.000 description 1
- QMQZYILAWUOLPV-JYJNAYRXSA-N Arg-Tyr-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)CC1=CC=C(O)C=C1 QMQZYILAWUOLPV-JYJNAYRXSA-N 0.000 description 1
- ORXCYAFUCSTQGY-FXQIFTODSA-N Asn-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)N)N ORXCYAFUCSTQGY-FXQIFTODSA-N 0.000 description 1
- IKLAUGBIDCDFOY-SRVKXCTJSA-N Asn-His-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O IKLAUGBIDCDFOY-SRVKXCTJSA-N 0.000 description 1
- LWXJVHTUEDHDLG-XUXIUFHCSA-N Asn-Leu-Leu-Ser Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O LWXJVHTUEDHDLG-XUXIUFHCSA-N 0.000 description 1
- LSJQOMAZIKQMTJ-SRVKXCTJSA-N Asn-Phe-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LSJQOMAZIKQMTJ-SRVKXCTJSA-N 0.000 description 1
- GFGUPLIETCNQGF-DCAQKATOSA-N Asn-Pro-His Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)N)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O GFGUPLIETCNQGF-DCAQKATOSA-N 0.000 description 1
- GZXOUBTUAUAVHD-ACZMJKKPSA-N Asn-Ser-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GZXOUBTUAUAVHD-ACZMJKKPSA-N 0.000 description 1
- YHXNKGKUDJCAHB-PBCZWWQYSA-N Asn-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O YHXNKGKUDJCAHB-PBCZWWQYSA-N 0.000 description 1
- MJIJBEYEHBKTIM-BYULHYEWSA-N Asn-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N MJIJBEYEHBKTIM-BYULHYEWSA-N 0.000 description 1
- GHWWTICYPDKPTE-NGZCFLSTSA-N Asn-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N GHWWTICYPDKPTE-NGZCFLSTSA-N 0.000 description 1
- XBQSLMACWDXWLJ-GHCJXIJMSA-N Asp-Ala-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XBQSLMACWDXWLJ-GHCJXIJMSA-N 0.000 description 1
- KVMPVNGOKHTUHZ-GCJQMDKQSA-N Asp-Ala-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KVMPVNGOKHTUHZ-GCJQMDKQSA-N 0.000 description 1
- SOYOSFXLXYZNRG-CIUDSAMLSA-N Asp-Arg-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O SOYOSFXLXYZNRG-CIUDSAMLSA-N 0.000 description 1
- UGKZHCBLMLSANF-CIUDSAMLSA-N Asp-Asn-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UGKZHCBLMLSANF-CIUDSAMLSA-N 0.000 description 1
- FANQWNCPNFEPGZ-WHFBIAKZSA-N Asp-Asp-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O FANQWNCPNFEPGZ-WHFBIAKZSA-N 0.000 description 1
- VAWNQIGQPUOPQW-ACZMJKKPSA-N Asp-Glu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O VAWNQIGQPUOPQW-ACZMJKKPSA-N 0.000 description 1
- OMMIEVATLAGRCK-BYPYZUCNSA-N Asp-Gly-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)NCC(O)=O OMMIEVATLAGRCK-BYPYZUCNSA-N 0.000 description 1
- GBSUGIXJAAKZOW-GMOBBJLQSA-N Asp-Ile-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GBSUGIXJAAKZOW-GMOBBJLQSA-N 0.000 description 1
- SEMWSADZTMJELF-BYULHYEWSA-N Asp-Ile-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O SEMWSADZTMJELF-BYULHYEWSA-N 0.000 description 1
- AITKTFCQOBRJTG-CIUDSAMLSA-N Asp-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N AITKTFCQOBRJTG-CIUDSAMLSA-N 0.000 description 1
- YWLDTBBUHZJQHW-KKUMJFAQSA-N Asp-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N YWLDTBBUHZJQHW-KKUMJFAQSA-N 0.000 description 1
- VWWAFGHMPWBKEP-GMOBBJLQSA-N Asp-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC(=O)O)N VWWAFGHMPWBKEP-GMOBBJLQSA-N 0.000 description 1
- SJLDOGLMVPHPLZ-IHRRRGAJSA-N Asp-Met-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SJLDOGLMVPHPLZ-IHRRRGAJSA-N 0.000 description 1
- IOXWDLNHXZOXQP-FXQIFTODSA-N Asp-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N IOXWDLNHXZOXQP-FXQIFTODSA-N 0.000 description 1
- GWIJZUVQVDJHDI-AVGNSLFASA-N Asp-Phe-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O GWIJZUVQVDJHDI-AVGNSLFASA-N 0.000 description 1
- UCHSVZYJKJLPHF-BZSNNMDCSA-N Asp-Phe-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O UCHSVZYJKJLPHF-BZSNNMDCSA-N 0.000 description 1
- GPPIDDWYKJPRES-YDHLFZDLSA-N Asp-Phe-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O GPPIDDWYKJPRES-YDHLFZDLSA-N 0.000 description 1
- RVMXMLSYBTXCAV-VEVYYDQMSA-N Asp-Pro-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O RVMXMLSYBTXCAV-VEVYYDQMSA-N 0.000 description 1
- QSFHZPQUAAQHAQ-CIUDSAMLSA-N Asp-Ser-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O QSFHZPQUAAQHAQ-CIUDSAMLSA-N 0.000 description 1
- JSNWZMFSLIWAHS-HJGDQZAQSA-N Asp-Thr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O JSNWZMFSLIWAHS-HJGDQZAQSA-N 0.000 description 1
- LLRJPYJQNBMOOO-QEJZJMRPSA-N Asp-Trp-Gln Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N LLRJPYJQNBMOOO-QEJZJMRPSA-N 0.000 description 1
- PLOKOIJSGCISHE-BYULHYEWSA-N Asp-Val-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O PLOKOIJSGCISHE-BYULHYEWSA-N 0.000 description 1
- XQFLFQWOBXPMHW-NHCYSSNCSA-N Asp-Val-His Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O XQFLFQWOBXPMHW-NHCYSSNCSA-N 0.000 description 1
- GYNUXDMCDILYIQ-QRTARXTBSA-N Asp-Val-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC(=O)O)N GYNUXDMCDILYIQ-QRTARXTBSA-N 0.000 description 1
- 241001465318 Aspergillus terreus Species 0.000 description 1
- 101100280474 Bacillus subtilis (strain 168) fabL gene Proteins 0.000 description 1
- 101100098786 Bacillus subtilis (strain 168) tapA gene Proteins 0.000 description 1
- 240000002791 Brassica napus Species 0.000 description 1
- 235000004977 Brassica sinapistrum Nutrition 0.000 description 1
- 241000995051 Brenda Species 0.000 description 1
- 210000003771 C cell Anatomy 0.000 description 1
- UDANFJZFKYUQEP-UHFFFAOYSA-N CC(C)(C)CCCCCCCC1[SiH2]C1 Chemical compound CC(C)(C)CCCCCCCC1[SiH2]C1 UDANFJZFKYUQEP-UHFFFAOYSA-N 0.000 description 1
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 1
- BVKZGUZCCUSVTD-UHFFFAOYSA-L Carbonate Chemical compound [O-]C([O-])=O BVKZGUZCCUSVTD-UHFFFAOYSA-L 0.000 description 1
- 241000079230 Caroxylon tetrandrum Species 0.000 description 1
- 102100035882 Catalase Human genes 0.000 description 1
- 108010053835 Catalase Proteins 0.000 description 1
- 241000283153 Cetacea Species 0.000 description 1
- 241000191382 Chlorobaculum tepidum Species 0.000 description 1
- 241000588881 Chromobacterium Species 0.000 description 1
- 241000186566 Clostridium ljungdahlii Species 0.000 description 1
- 241001464430 Cyanobacterium Species 0.000 description 1
- 241001051767 Cyanobium sp. PCC 7001 Species 0.000 description 1
- 241000159506 Cyanothece Species 0.000 description 1
- BNRHLRWCERLRTQ-BPUTZDHNSA-N Cys-Arg-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CS)N BNRHLRWCERLRTQ-BPUTZDHNSA-N 0.000 description 1
- UIKLEGZPIOXFHJ-DLOVCJGASA-N Cys-Phe-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O UIKLEGZPIOXFHJ-DLOVCJGASA-N 0.000 description 1
- KZZYVYWSXMFYEC-DCAQKATOSA-N Cys-Val-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KZZYVYWSXMFYEC-DCAQKATOSA-N 0.000 description 1
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 102100037458 Dephospho-CoA kinase Human genes 0.000 description 1
- 101000947141 Dictyostelium discoideum Adenylate cyclase, terminal-differentiation specific Proteins 0.000 description 1
- 108010023922 Enoyl-CoA hydratase Proteins 0.000 description 1
- 102000011426 Enoyl-CoA hydratase Human genes 0.000 description 1
- 108010013369 Enteropeptidase Proteins 0.000 description 1
- 102100029727 Enteropeptidase Human genes 0.000 description 1
- 101100321116 Escherichia coli (strain K12) yqhD gene Proteins 0.000 description 1
- 241001522878 Escherichia coli B Species 0.000 description 1
- 241000644323 Escherichia coli C Species 0.000 description 1
- 241000901842 Escherichia coli W Species 0.000 description 1
- IAYPIBMASNFSPL-UHFFFAOYSA-N Ethylene oxide Chemical compound C1CO1 IAYPIBMASNFSPL-UHFFFAOYSA-N 0.000 description 1
- 108091029865 Exogenous DNA Proteins 0.000 description 1
- 108010074860 Factor Xa Proteins 0.000 description 1
- 101710172176 Fasciclin-1 Proteins 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- RZSLYUUFFVHFRQ-FXQIFTODSA-N Gln-Ala-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O RZSLYUUFFVHFRQ-FXQIFTODSA-N 0.000 description 1
- JSYULGSPLTZDHM-NRPADANISA-N Gln-Ala-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O JSYULGSPLTZDHM-NRPADANISA-N 0.000 description 1
- DTMLKCYOQKZXKZ-HJGDQZAQSA-N Gln-Arg-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DTMLKCYOQKZXKZ-HJGDQZAQSA-N 0.000 description 1
- NKCZYEDZTKOFBG-GUBZILKMSA-N Gln-Gln-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NKCZYEDZTKOFBG-GUBZILKMSA-N 0.000 description 1
- FGYPOQPQTUNESW-IUCAKERBSA-N Gln-Gly-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)N)N FGYPOQPQTUNESW-IUCAKERBSA-N 0.000 description 1
- ORYMMTRPKVTGSJ-XVKPBYJWSA-N Gln-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O ORYMMTRPKVTGSJ-XVKPBYJWSA-N 0.000 description 1
- DQPOBSRQNWOBNA-GUBZILKMSA-N Gln-His-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(O)=O DQPOBSRQNWOBNA-GUBZILKMSA-N 0.000 description 1
- MWERYIXRDZDXOA-QEWYBTABSA-N Gln-Ile-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MWERYIXRDZDXOA-QEWYBTABSA-N 0.000 description 1
- ZNTDJIMJKNNSLR-RWRJDSDZSA-N Gln-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZNTDJIMJKNNSLR-RWRJDSDZSA-N 0.000 description 1
- HYPVLWGNBIYTNA-GUBZILKMSA-N Gln-Leu-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HYPVLWGNBIYTNA-GUBZILKMSA-N 0.000 description 1
- IOFDDSNZJDIGPB-GVXVVHGQSA-N Gln-Leu-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IOFDDSNZJDIGPB-GVXVVHGQSA-N 0.000 description 1
- KSKFIECUYMYWNS-AVGNSLFASA-N Gln-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)N)N KSKFIECUYMYWNS-AVGNSLFASA-N 0.000 description 1
- GQTNWYFWSUFFRA-KKUMJFAQSA-N Gln-Met-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O GQTNWYFWSUFFRA-KKUMJFAQSA-N 0.000 description 1
- FTMLQFPULNGION-ZVZYQTTQSA-N Gln-Val-Trp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O FTMLQFPULNGION-ZVZYQTTQSA-N 0.000 description 1
- 241001464794 Gloeobacter Species 0.000 description 1
- 241001464795 Gloeobacter violaceus Species 0.000 description 1
- WZZSKAJIHTUUSG-ACZMJKKPSA-N Glu-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O WZZSKAJIHTUUSG-ACZMJKKPSA-N 0.000 description 1
- BPDVTFBJZNBHEU-HGNGGELXSA-N Glu-Ala-His Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 BPDVTFBJZNBHEU-HGNGGELXSA-N 0.000 description 1
- RLZBLVSJDFHDBL-KBIXCLLPSA-N Glu-Ala-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RLZBLVSJDFHDBL-KBIXCLLPSA-N 0.000 description 1
- HUWSBFYAGXCXKC-CIUDSAMLSA-N Glu-Ala-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O HUWSBFYAGXCXKC-CIUDSAMLSA-N 0.000 description 1
- RCCDHXSRMWCOOY-GUBZILKMSA-N Glu-Arg-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O RCCDHXSRMWCOOY-GUBZILKMSA-N 0.000 description 1
- KKCUFHUTMKQQCF-SRVKXCTJSA-N Glu-Arg-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O KKCUFHUTMKQQCF-SRVKXCTJSA-N 0.000 description 1
- DSPQRJXOIXHOHK-WDSKDSINSA-N Glu-Asp-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O DSPQRJXOIXHOHK-WDSKDSINSA-N 0.000 description 1
- OXEMJGCAJFFREE-FXQIFTODSA-N Glu-Gln-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O OXEMJGCAJFFREE-FXQIFTODSA-N 0.000 description 1
- OAGVHWYIBZMWLA-YFKPBYRVSA-N Glu-Gly-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)NCC(O)=O OAGVHWYIBZMWLA-YFKPBYRVSA-N 0.000 description 1
- GGJOGFJIPPGNRK-JSGCOSHPSA-N Glu-Gly-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)N)C(O)=O)=CNC2=C1 GGJOGFJIPPGNRK-JSGCOSHPSA-N 0.000 description 1
- XMPAXPSENRSOSV-RYUDHWBXSA-N Glu-Gly-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XMPAXPSENRSOSV-RYUDHWBXSA-N 0.000 description 1
- QIQABBIDHGQXGA-ZPFDUUQYSA-N Glu-Ile-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QIQABBIDHGQXGA-ZPFDUUQYSA-N 0.000 description 1
- ZSWGJYOZWBHROQ-RWRJDSDZSA-N Glu-Ile-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZSWGJYOZWBHROQ-RWRJDSDZSA-N 0.000 description 1
- FBEJIDRSQCGFJI-GUBZILKMSA-N Glu-Leu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FBEJIDRSQCGFJI-GUBZILKMSA-N 0.000 description 1
- IOUQWHIEQYQVFD-JYJNAYRXSA-N Glu-Leu-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IOUQWHIEQYQVFD-JYJNAYRXSA-N 0.000 description 1
- UJMNFCAHLYKWOZ-DCAQKATOSA-N Glu-Lys-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O UJMNFCAHLYKWOZ-DCAQKATOSA-N 0.000 description 1
- ZGEJRLJEAMPEDV-SRVKXCTJSA-N Glu-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N ZGEJRLJEAMPEDV-SRVKXCTJSA-N 0.000 description 1
- CBEUFCJRFNZMCU-SRVKXCTJSA-N Glu-Met-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O CBEUFCJRFNZMCU-SRVKXCTJSA-N 0.000 description 1
- YUXIEONARHPUTK-JBACZVJFSA-N Glu-Phe-Trp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)NC(=O)[C@H](CCC(=O)O)N YUXIEONARHPUTK-JBACZVJFSA-N 0.000 description 1
- HZISRJBYZAODRV-XQXXSGGOSA-N Glu-Thr-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O HZISRJBYZAODRV-XQXXSGGOSA-N 0.000 description 1
- QCMVGXDELYMZET-GLLZPBPUSA-N Glu-Thr-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QCMVGXDELYMZET-GLLZPBPUSA-N 0.000 description 1
- KIEICAOUSNYOLM-NRPADANISA-N Glu-Val-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O KIEICAOUSNYOLM-NRPADANISA-N 0.000 description 1
- LZEUDRYSAZAJIO-AUTRQRHGSA-N Glu-Val-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LZEUDRYSAZAJIO-AUTRQRHGSA-N 0.000 description 1
- WGYHAAXZWPEBDQ-IFFSRLJSSA-N Glu-Val-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGYHAAXZWPEBDQ-IFFSRLJSSA-N 0.000 description 1
- FKJQNJCQTKUBCD-XPUUQOCRSA-N Gly-Ala-His Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O FKJQNJCQTKUBCD-XPUUQOCRSA-N 0.000 description 1
- XUDLUKYPXQDCRX-BQBZGAKWSA-N Gly-Arg-Asn Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O XUDLUKYPXQDCRX-BQBZGAKWSA-N 0.000 description 1
- XUORRGAFUQIMLC-STQMWFEESA-N Gly-Arg-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)CN)O XUORRGAFUQIMLC-STQMWFEESA-N 0.000 description 1
- KQDMENMTYNBWMR-WHFBIAKZSA-N Gly-Asp-Ala Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O KQDMENMTYNBWMR-WHFBIAKZSA-N 0.000 description 1
- XBWMTPAIUQIWKA-BYULHYEWSA-N Gly-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CN XBWMTPAIUQIWKA-BYULHYEWSA-N 0.000 description 1
- QPDUVFSVVAOUHE-XVKPBYJWSA-N Gly-Gln-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)CN)C(O)=O QPDUVFSVVAOUHE-XVKPBYJWSA-N 0.000 description 1
- MOJKRXIRAZPZLW-WDSKDSINSA-N Gly-Glu-Ala Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MOJKRXIRAZPZLW-WDSKDSINSA-N 0.000 description 1
- HQRHFUYMGCHHJS-LURJTMIESA-N Gly-Gly-Arg Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N HQRHFUYMGCHHJS-LURJTMIESA-N 0.000 description 1
- KAJAOGBVWCYGHZ-JTQLQIEISA-N Gly-Gly-Phe Chemical compound [NH3+]CC(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KAJAOGBVWCYGHZ-JTQLQIEISA-N 0.000 description 1
- OLPPXYMMIARYAL-QMMMGPOBSA-N Gly-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)CN OLPPXYMMIARYAL-QMMMGPOBSA-N 0.000 description 1
- FQKKPCWTZZEDIC-XPUUQOCRSA-N Gly-His-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 FQKKPCWTZZEDIC-XPUUQOCRSA-N 0.000 description 1
- UTYGDAHJBBDPBA-BYULHYEWSA-N Gly-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)CN UTYGDAHJBBDPBA-BYULHYEWSA-N 0.000 description 1
- BHPQOIPBLYJNAW-NGZCFLSTSA-N Gly-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN BHPQOIPBLYJNAW-NGZCFLSTSA-N 0.000 description 1
- XVYKMNXXJXQKME-XEGUGMAKSA-N Gly-Ile-Tyr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 XVYKMNXXJXQKME-XEGUGMAKSA-N 0.000 description 1
- LRQXRHGQEVWGPV-NHCYSSNCSA-N Gly-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN LRQXRHGQEVWGPV-NHCYSSNCSA-N 0.000 description 1
- PDUHNKAFQXQNLH-ZETCQYMHSA-N Gly-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)NCC(O)=O PDUHNKAFQXQNLH-ZETCQYMHSA-N 0.000 description 1
- PTIIBFKSLCYQBO-NHCYSSNCSA-N Gly-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)CN PTIIBFKSLCYQBO-NHCYSSNCSA-N 0.000 description 1
- WZSHYFGOLPXPLL-RYUDHWBXSA-N Gly-Phe-Glu Chemical compound NCC(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CCC(O)=O)C(O)=O WZSHYFGOLPXPLL-RYUDHWBXSA-N 0.000 description 1
- POJJAZJHBGXEGM-YUMQZZPRSA-N Gly-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)CN POJJAZJHBGXEGM-YUMQZZPRSA-N 0.000 description 1
- HUFUVTYGPOUCBN-MBLNEYKQSA-N Gly-Thr-Ile Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HUFUVTYGPOUCBN-MBLNEYKQSA-N 0.000 description 1
- FFALDIDGPLUDKV-ZDLURKLDSA-N Gly-Thr-Ser Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O FFALDIDGPLUDKV-ZDLURKLDSA-N 0.000 description 1
- GWNIGUKSRJBIHX-STQMWFEESA-N Gly-Tyr-Arg Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)CN)O GWNIGUKSRJBIHX-STQMWFEESA-N 0.000 description 1
- OCRQUYDOYKCOQG-IRXDYDNUSA-N Gly-Tyr-Phe Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 OCRQUYDOYKCOQG-IRXDYDNUSA-N 0.000 description 1
- LYZYGGWCBLBDMC-QWHCGFSZSA-N Gly-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)CN)C(=O)O LYZYGGWCBLBDMC-QWHCGFSZSA-N 0.000 description 1
- NGBGZCUWFVVJKC-IRXDYDNUSA-N Gly-Tyr-Tyr Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 NGBGZCUWFVVJKC-IRXDYDNUSA-N 0.000 description 1
- GWCJMBNBFYBQCV-XPUUQOCRSA-N Gly-Val-Ala Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O GWCJMBNBFYBQCV-XPUUQOCRSA-N 0.000 description 1
- RYAOJUMWLWUGNW-QMMMGPOBSA-N Gly-Val-Gly Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O RYAOJUMWLWUGNW-QMMMGPOBSA-N 0.000 description 1
- ZVXMEWXHFBYJPI-LSJOCFKGSA-N Gly-Val-Ile Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZVXMEWXHFBYJPI-LSJOCFKGSA-N 0.000 description 1
- 244000068988 Glycine max Species 0.000 description 1
- 235000010469 Glycine max Nutrition 0.000 description 1
- SVHKVHBPTOMLTO-DCAQKATOSA-N His-Arg-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SVHKVHBPTOMLTO-DCAQKATOSA-N 0.000 description 1
- AAXMRLWFJFDYQO-GUBZILKMSA-N His-Asp-Gln Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O AAXMRLWFJFDYQO-GUBZILKMSA-N 0.000 description 1
- RAVLQPXCMRCLKT-KBPBESRZSA-N His-Gly-Phe Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RAVLQPXCMRCLKT-KBPBESRZSA-N 0.000 description 1
- JBSLJUPMTYLLFH-MELADBBJSA-N His-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC3=CN=CN3)N)C(=O)O JBSLJUPMTYLLFH-MELADBBJSA-N 0.000 description 1
- TWROVBNEHJSXDG-IHRRRGAJSA-N His-Leu-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O TWROVBNEHJSXDG-IHRRRGAJSA-N 0.000 description 1
- JSQIXEHORHLQEE-MEYUZBJRSA-N His-Phe-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JSQIXEHORHLQEE-MEYUZBJRSA-N 0.000 description 1
- FBVHRDXSCYELMI-PBCZWWQYSA-N His-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N)O FBVHRDXSCYELMI-PBCZWWQYSA-N 0.000 description 1
- MDOBWSFNSNPENN-PMVVWTBXSA-N His-Thr-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O MDOBWSFNSNPENN-PMVVWTBXSA-N 0.000 description 1
- CCUSLCQWVMWTIS-IXOXFDKPSA-N His-Thr-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O CCUSLCQWVMWTIS-IXOXFDKPSA-N 0.000 description 1
- 101000720330 Homo sapiens Acrosin Proteins 0.000 description 1
- 241000211332 Hymenobacter marinus Species 0.000 description 1
- MKWSZEHGHSLNPF-NAKRPEOUSA-N Ile-Ala-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O)N MKWSZEHGHSLNPF-NAKRPEOUSA-N 0.000 description 1
- RPZFUIQVAPZLRH-GHCJXIJMSA-N Ile-Asp-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C)C(=O)O)N RPZFUIQVAPZLRH-GHCJXIJMSA-N 0.000 description 1
- NKRJALPCDNXULF-BYULHYEWSA-N Ile-Asp-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O NKRJALPCDNXULF-BYULHYEWSA-N 0.000 description 1
- BGZIJZJBXRVBGJ-SXTJYALSSA-N Ile-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N BGZIJZJBXRVBGJ-SXTJYALSSA-N 0.000 description 1
- LLZLRXBTOOFODM-QSFUFRPTSA-N Ile-Asp-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N LLZLRXBTOOFODM-QSFUFRPTSA-N 0.000 description 1
- WZDCVAWMBUNDDY-KBIXCLLPSA-N Ile-Glu-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](C)C(=O)O)N WZDCVAWMBUNDDY-KBIXCLLPSA-N 0.000 description 1
- SPQWWEZBHXHUJN-KBIXCLLPSA-N Ile-Glu-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O SPQWWEZBHXHUJN-KBIXCLLPSA-N 0.000 description 1
- FZWVCYCYWCLQDH-NHCYSSNCSA-N Ile-Leu-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N FZWVCYCYWCLQDH-NHCYSSNCSA-N 0.000 description 1
- PWUMCBLVWPCKNO-MGHWNKPDSA-N Ile-Leu-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PWUMCBLVWPCKNO-MGHWNKPDSA-N 0.000 description 1
- NPAYJTAXWXJKLO-NAKRPEOUSA-N Ile-Met-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)O)N NPAYJTAXWXJKLO-NAKRPEOUSA-N 0.000 description 1
- SAVXZJYTTQQQDD-QEWYBTABSA-N Ile-Phe-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N SAVXZJYTTQQQDD-QEWYBTABSA-N 0.000 description 1
- YBKKLDBBPFIXBQ-MBLNEYKQSA-N Ile-Thr-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)O)N YBKKLDBBPFIXBQ-MBLNEYKQSA-N 0.000 description 1
- KBDIBHQICWDGDL-PPCPHDFISA-N Ile-Thr-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N KBDIBHQICWDGDL-PPCPHDFISA-N 0.000 description 1
- WJBOZUVRPOIQNN-KJYZGMDISA-N Ile-Trp-His Chemical compound C([C@H](NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@@H](N)[C@@H](C)CC)C(O)=O)C1=CN=CN1 WJBOZUVRPOIQNN-KJYZGMDISA-N 0.000 description 1
- 241000235058 Komagataella pastoris Species 0.000 description 1
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 1
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 1
- JVTAAEKCZFNVCJ-UHFFFAOYSA-M Lactate Chemical compound CC(O)C([O-])=O JVTAAEKCZFNVCJ-UHFFFAOYSA-M 0.000 description 1
- 235000019687 Lamb Nutrition 0.000 description 1
- 241001671311 Laurus Species 0.000 description 1
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 1
- PBCHMHROGNUXMK-DLOVCJGASA-N Leu-Ala-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 PBCHMHROGNUXMK-DLOVCJGASA-N 0.000 description 1
- DQPQTXMIRBUWKO-DCAQKATOSA-N Leu-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(C)C)N DQPQTXMIRBUWKO-DCAQKATOSA-N 0.000 description 1
- DLFAACQHIRSQGG-CIUDSAMLSA-N Leu-Asp-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O DLFAACQHIRSQGG-CIUDSAMLSA-N 0.000 description 1
- GPICTNQYKHHHTH-GUBZILKMSA-N Leu-Gln-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O GPICTNQYKHHHTH-GUBZILKMSA-N 0.000 description 1
- YSKSXVKQLLBVEX-SZMVWBNQSA-N Leu-Gln-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 YSKSXVKQLLBVEX-SZMVWBNQSA-N 0.000 description 1
- RVVBWTWPNFDYBE-SRVKXCTJSA-N Leu-Glu-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVVBWTWPNFDYBE-SRVKXCTJSA-N 0.000 description 1
- BABSVXFGKFLIGW-UWVGGRQHSA-N Leu-Gly-Arg Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N BABSVXFGKFLIGW-UWVGGRQHSA-N 0.000 description 1
- LIINDKYIGYTDLG-PPCPHDFISA-N Leu-Ile-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LIINDKYIGYTDLG-PPCPHDFISA-N 0.000 description 1
- DSFYPIUSAMSERP-IHRRRGAJSA-N Leu-Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DSFYPIUSAMSERP-IHRRRGAJSA-N 0.000 description 1
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 1
- ZGUMORRUBUCXEH-AVGNSLFASA-N Leu-Lys-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZGUMORRUBUCXEH-AVGNSLFASA-N 0.000 description 1
- QMKFDEUJGYNFMC-AVGNSLFASA-N Leu-Pro-Arg Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QMKFDEUJGYNFMC-AVGNSLFASA-N 0.000 description 1
- VULJUQZPSOASBZ-SRVKXCTJSA-N Leu-Pro-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O VULJUQZPSOASBZ-SRVKXCTJSA-N 0.000 description 1
- RGUXWMDNCPMQFB-YUMQZZPRSA-N Leu-Ser-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RGUXWMDNCPMQFB-YUMQZZPRSA-N 0.000 description 1
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 1
- KLSUAWUZBMAZCL-RHYQMDGZSA-N Leu-Thr-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(O)=O KLSUAWUZBMAZCL-RHYQMDGZSA-N 0.000 description 1
- AIQWYVFNBNNOLU-RHYQMDGZSA-N Leu-Thr-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O AIQWYVFNBNNOLU-RHYQMDGZSA-N 0.000 description 1
- URJUVJDTPXCQFL-IHPCNDPISA-N Leu-Trp-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N URJUVJDTPXCQFL-IHPCNDPISA-N 0.000 description 1
- VKVDRTGWLVZJOM-DCAQKATOSA-N Leu-Val-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O VKVDRTGWLVZJOM-DCAQKATOSA-N 0.000 description 1
- CLBGMWIYPYAZPR-AVGNSLFASA-N Lys-Arg-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O CLBGMWIYPYAZPR-AVGNSLFASA-N 0.000 description 1
- FUKDBQGFSJUXGX-RWMBFGLXSA-N Lys-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N)C(=O)O FUKDBQGFSJUXGX-RWMBFGLXSA-N 0.000 description 1
- FACUGMGEFUEBTI-SRVKXCTJSA-N Lys-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCCCN FACUGMGEFUEBTI-SRVKXCTJSA-N 0.000 description 1
- FLCMXEFCTLXBTL-DCAQKATOSA-N Lys-Asp-Arg Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N FLCMXEFCTLXBTL-DCAQKATOSA-N 0.000 description 1
- AIRZWUMAHCDDHR-KKUMJFAQSA-N Lys-Leu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O AIRZWUMAHCDDHR-KKUMJFAQSA-N 0.000 description 1
- MIROMRNASYKZNL-ULQDDVLXSA-N Lys-Pro-Tyr Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 MIROMRNASYKZNL-ULQDDVLXSA-N 0.000 description 1
- DRRXXZBXDMLGFC-IHRRRGAJSA-N Lys-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN DRRXXZBXDMLGFC-IHRRRGAJSA-N 0.000 description 1
- LTYOQGRJFJAKNA-KKIMTKSISA-N Malonyl CoA Natural products S(C(=O)CC(=O)O)CCNC(=O)CCNC(=O)[C@@H](O)C(CO[P@](=O)(O[P@](=O)(OC[C@H]1[C@@H](OP(=O)(O)O)[C@@H](O)[C@@H](n2c3ncnc(N)c3nc2)O1)O)O)(C)C LTYOQGRJFJAKNA-KKIMTKSISA-N 0.000 description 1
- 241000206597 Marinobacter hydrocarbonoclasticus Species 0.000 description 1
- WYEXWKAWMNJKPN-UBHSHLNASA-N Met-Ala-Phe Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCSC)N WYEXWKAWMNJKPN-UBHSHLNASA-N 0.000 description 1
- MIAZEQZXAFTCCG-UBHSHLNASA-N Met-Phe-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 MIAZEQZXAFTCCG-UBHSHLNASA-N 0.000 description 1
- GWADARYJIJDYRC-XGEHTFHBSA-N Met-Thr-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O GWADARYJIJDYRC-XGEHTFHBSA-N 0.000 description 1
- YGNUDKAPJARTEM-GUBZILKMSA-N Met-Val-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O YGNUDKAPJARTEM-GUBZILKMSA-N 0.000 description 1
- 241001074116 Miscanthus x giganteus Species 0.000 description 1
- 108010021466 Mutant Proteins Proteins 0.000 description 1
- 102000008300 Mutant Proteins Human genes 0.000 description 1
- 235000021360 Myristic acid Nutrition 0.000 description 1
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 1
- 238000005481 NMR spectroscopy Methods 0.000 description 1
- 241001501893 Neospora sp. Species 0.000 description 1
- 239000005642 Oleic acid Substances 0.000 description 1
- ZQPPMHVWECSIRJ-UHFFFAOYSA-N Oleic acid Natural products CCCCCCCCC=CCCCCCCCC(O)=O ZQPPMHVWECSIRJ-UHFFFAOYSA-N 0.000 description 1
- 101710085788 Outer membrane protein AlkL Proteins 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 241000228150 Penicillium chrysogenum Species 0.000 description 1
- 239000001888 Peptone Substances 0.000 description 1
- 108010080698 Peptones Proteins 0.000 description 1
- JEGFCFLCRSJCMA-IHRRRGAJSA-N Phe-Arg-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N JEGFCFLCRSJCMA-IHRRRGAJSA-N 0.000 description 1
- XMPUYNHKEPFERE-IHRRRGAJSA-N Phe-Asp-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 XMPUYNHKEPFERE-IHRRRGAJSA-N 0.000 description 1
- IUVYJBMTHARMIP-PCBIJLKTSA-N Phe-Asp-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O IUVYJBMTHARMIP-PCBIJLKTSA-N 0.000 description 1
- HOYQLNNGMHXZDW-KKUMJFAQSA-N Phe-Glu-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O HOYQLNNGMHXZDW-KKUMJFAQSA-N 0.000 description 1
- PMKIMKUGCSVFSV-CQDKDKBSSA-N Phe-His-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CC=CC=C2)N PMKIMKUGCSVFSV-CQDKDKBSSA-N 0.000 description 1
- OSBADCBXAMSPQD-YESZJQIVSA-N Phe-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N OSBADCBXAMSPQD-YESZJQIVSA-N 0.000 description 1
- SRILZRSXIKRGBF-HRCADAONSA-N Phe-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N SRILZRSXIKRGBF-HRCADAONSA-N 0.000 description 1
- AFNJAQVMTIQTCB-DLOVCJGASA-N Phe-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=CC=C1 AFNJAQVMTIQTCB-DLOVCJGASA-N 0.000 description 1
- MRWOVVNKSXXLRP-IHPCNDPISA-N Phe-Ser-Trp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O MRWOVVNKSXXLRP-IHPCNDPISA-N 0.000 description 1
- YFXXRYFWJFQAFW-JHYOHUSXSA-N Phe-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N)O YFXXRYFWJFQAFW-JHYOHUSXSA-N 0.000 description 1
- MMPBPRXOFJNCCN-ZEWNOJEFSA-N Phe-Tyr-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MMPBPRXOFJNCCN-ZEWNOJEFSA-N 0.000 description 1
- 241000607568 Photobacterium Species 0.000 description 1
- 241001148064 Photorhabdus luminescens Species 0.000 description 1
- 241001106412 Pilea Species 0.000 description 1
- 241000209504 Poaceae Species 0.000 description 1
- APKRGYLBSCWJJP-FXQIFTODSA-N Pro-Ala-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O APKRGYLBSCWJJP-FXQIFTODSA-N 0.000 description 1
- IWNOFCGBMSFTBC-CIUDSAMLSA-N Pro-Ala-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IWNOFCGBMSFTBC-CIUDSAMLSA-N 0.000 description 1
- IFMDQWDAJUMMJC-DCAQKATOSA-N Pro-Ala-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O IFMDQWDAJUMMJC-DCAQKATOSA-N 0.000 description 1
- HFZNNDWPHBRNPV-KZVJFYERSA-N Pro-Ala-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HFZNNDWPHBRNPV-KZVJFYERSA-N 0.000 description 1
- GRIRJQGZZJVANI-CYDGBPFRSA-N Pro-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H]1CCCN1 GRIRJQGZZJVANI-CYDGBPFRSA-N 0.000 description 1
- CYQQWUPHIZVCNY-GUBZILKMSA-N Pro-Arg-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CYQQWUPHIZVCNY-GUBZILKMSA-N 0.000 description 1
- AMBLXEMWFARNNQ-DCAQKATOSA-N Pro-Asn-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@@H]1CCCN1 AMBLXEMWFARNNQ-DCAQKATOSA-N 0.000 description 1
- WVOXLKUUVCCCSU-ZPFDUUQYSA-N Pro-Glu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVOXLKUUVCCCSU-ZPFDUUQYSA-N 0.000 description 1
- LGSANCBHSMDFDY-GARJFASQSA-N Pro-Glu-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)O)C(=O)N2CCC[C@@H]2C(=O)O LGSANCBHSMDFDY-GARJFASQSA-N 0.000 description 1
- LXVLKXPFIDDHJG-CIUDSAMLSA-N Pro-Glu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O LXVLKXPFIDDHJG-CIUDSAMLSA-N 0.000 description 1
- STASJMBVVHNWCG-IHRRRGAJSA-N Pro-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)NC(=O)[C@H]1[NH2+]CCC1)C1=CN=CN1 STASJMBVVHNWCG-IHRRRGAJSA-N 0.000 description 1
- RYJRPPUATSKNAY-STECZYCISA-N Pro-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@@H]2CCCN2 RYJRPPUATSKNAY-STECZYCISA-N 0.000 description 1
- HFNPOYOKIPGAEI-SRVKXCTJSA-N Pro-Leu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 HFNPOYOKIPGAEI-SRVKXCTJSA-N 0.000 description 1
- FYKUEXMZYFIZKA-DCAQKATOSA-N Pro-Pro-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O FYKUEXMZYFIZKA-DCAQKATOSA-N 0.000 description 1
- FIODMZKLZFLYQP-GUBZILKMSA-N Pro-Val-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FIODMZKLZFLYQP-GUBZILKMSA-N 0.000 description 1
- YDTUEBLEAVANFH-RCWTZXSCSA-N Pro-Val-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 YDTUEBLEAVANFH-RCWTZXSCSA-N 0.000 description 1
- 244000078856 Prunus padus Species 0.000 description 1
- 235000019484 Rapeseed oil Nutrition 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 241000235403 Rhizomucor miehei Species 0.000 description 1
- 241000235527 Rhizopus Species 0.000 description 1
- 241000191025 Rhodobacter Species 0.000 description 1
- 241000190950 Rhodopseudomonas palustris Species 0.000 description 1
- 241000190984 Rhodospirillum rubrum Species 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- 241000193448 Ruminiclostridium thermocellum Species 0.000 description 1
- 241000831652 Salinivibrio sharmensis Species 0.000 description 1
- SRTCFKGBYBZRHA-ACZMJKKPSA-N Ser-Ala-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SRTCFKGBYBZRHA-ACZMJKKPSA-N 0.000 description 1
- HRNQLKCLPVKZNE-CIUDSAMLSA-N Ser-Ala-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O HRNQLKCLPVKZNE-CIUDSAMLSA-N 0.000 description 1
- HBZBPFLJNDXRAY-FXQIFTODSA-N Ser-Ala-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O HBZBPFLJNDXRAY-FXQIFTODSA-N 0.000 description 1
- HBOABDXGTMMDSE-GUBZILKMSA-N Ser-Arg-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O HBOABDXGTMMDSE-GUBZILKMSA-N 0.000 description 1
- KNZQGAUEYZJUSQ-ZLUOBGJFSA-N Ser-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N KNZQGAUEYZJUSQ-ZLUOBGJFSA-N 0.000 description 1
- FYUIFUJFNCLUIX-XVYDVKMFSA-N Ser-His-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O FYUIFUJFNCLUIX-XVYDVKMFSA-N 0.000 description 1
- ZOPISOXXPQNOCO-SVSWQMSJSA-N Ser-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CO)N ZOPISOXXPQNOCO-SVSWQMSJSA-N 0.000 description 1
- FUMGHWDRRFCKEP-CIUDSAMLSA-N Ser-Leu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O FUMGHWDRRFCKEP-CIUDSAMLSA-N 0.000 description 1
- LPSKHZWBQONOQJ-XIRDDKMYSA-N Ser-Lys-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)N LPSKHZWBQONOQJ-XIRDDKMYSA-N 0.000 description 1
- ZSLFCBHEINFXRS-LPEHRKFASA-N Ser-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N ZSLFCBHEINFXRS-LPEHRKFASA-N 0.000 description 1
- CKDXFSPMIDSMGV-GUBZILKMSA-N Ser-Pro-Val Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O CKDXFSPMIDSMGV-GUBZILKMSA-N 0.000 description 1
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 1
- WUXCHQZLUHBSDJ-LKXGYXEUSA-N Ser-Thr-Asp Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WUXCHQZLUHBSDJ-LKXGYXEUSA-N 0.000 description 1
- PURRNJBBXDDWLX-ZDLURKLDSA-N Ser-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N)O PURRNJBBXDDWLX-ZDLURKLDSA-N 0.000 description 1
- BDMWLJLPPUCLNV-XGEHTFHBSA-N Ser-Thr-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BDMWLJLPPUCLNV-XGEHTFHBSA-N 0.000 description 1
- JGUWRQWULDWNCM-FXQIFTODSA-N Ser-Val-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O JGUWRQWULDWNCM-FXQIFTODSA-N 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 102100030413 Spermidine synthase Human genes 0.000 description 1
- 108091081024 Start codon Proteins 0.000 description 1
- 241000205101 Sulfolobus Species 0.000 description 1
- 101001083555 Sus scrofa Hydroxyacyl-coenzyme A dehydrogenase, mitochondrial Proteins 0.000 description 1
- 241000135402 Synechococcus elongatus PCC 6301 Species 0.000 description 1
- 241000192560 Synechococcus sp. Species 0.000 description 1
- 241000500334 Tetragenococcus Species 0.000 description 1
- 241000228178 Thermoascus Species 0.000 description 1
- 241000205188 Thermococcus Species 0.000 description 1
- 241000223258 Thermomyces lanuginosus Species 0.000 description 1
- 241001494489 Thielavia Species 0.000 description 1
- 101710151118 Thioesterase TesA Proteins 0.000 description 1
- 102000002932 Thiolase Human genes 0.000 description 1
- 108060008225 Thiolase Proteins 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical class OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 description 1
- NJEMRSFGDNECGF-GCJQMDKQSA-N Thr-Ala-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O NJEMRSFGDNECGF-GCJQMDKQSA-N 0.000 description 1
- ZUXQFMVPAYGPFJ-JXUBOQSCSA-N Thr-Ala-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN ZUXQFMVPAYGPFJ-JXUBOQSCSA-N 0.000 description 1
- CAJFZCICSVBOJK-SHGPDSBTSA-N Thr-Ala-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAJFZCICSVBOJK-SHGPDSBTSA-N 0.000 description 1
- DGDCHPCRMWEOJR-FQPOAREZSA-N Thr-Ala-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 DGDCHPCRMWEOJR-FQPOAREZSA-N 0.000 description 1
- GLQFKOVWXPPFTP-VEVYYDQMSA-N Thr-Arg-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O GLQFKOVWXPPFTP-VEVYYDQMSA-N 0.000 description 1
- SKHPKKYKDYULDH-HJGDQZAQSA-N Thr-Asn-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O SKHPKKYKDYULDH-HJGDQZAQSA-N 0.000 description 1
- JXKMXEBNZCKSDY-JIOCBJNQSA-N Thr-Asp-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O JXKMXEBNZCKSDY-JIOCBJNQSA-N 0.000 description 1
- UHBPFYOQQPFKQR-JHEQGTHGSA-N Thr-Gln-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O UHBPFYOQQPFKQR-JHEQGTHGSA-N 0.000 description 1
- VGYBYGQXZJDZJU-XQXXSGGOSA-N Thr-Glu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O VGYBYGQXZJDZJU-XQXXSGGOSA-N 0.000 description 1
- XOTBWOCSLMBGMF-SUSMZKCASA-N Thr-Glu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOTBWOCSLMBGMF-SUSMZKCASA-N 0.000 description 1
- BNGDYRRHRGOPHX-IFFSRLJSSA-N Thr-Glu-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O BNGDYRRHRGOPHX-IFFSRLJSSA-N 0.000 description 1
- SLUWOCTZVGMURC-BFHQHQDPSA-N Thr-Gly-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O SLUWOCTZVGMURC-BFHQHQDPSA-N 0.000 description 1
- MPUMPERGHHJGRP-WEDXCCLWSA-N Thr-Gly-Lys Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N)O MPUMPERGHHJGRP-WEDXCCLWSA-N 0.000 description 1
- DJDSEDOKJTZBAR-ZDLURKLDSA-N Thr-Gly-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O DJDSEDOKJTZBAR-ZDLURKLDSA-N 0.000 description 1
- JQAWYCUUFIMTHE-WLTAIBSBSA-N Thr-Gly-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JQAWYCUUFIMTHE-WLTAIBSBSA-N 0.000 description 1
- AMXMBCAXAZUCFA-RHYQMDGZSA-N Thr-Leu-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AMXMBCAXAZUCFA-RHYQMDGZSA-N 0.000 description 1
- VTVVYQOXJCZVEB-WDCWCFNPSA-N Thr-Leu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O VTVVYQOXJCZVEB-WDCWCFNPSA-N 0.000 description 1
- PRNGXSILMXSWQQ-OEAJRASXSA-N Thr-Leu-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PRNGXSILMXSWQQ-OEAJRASXSA-N 0.000 description 1
- YOOAQCZYZHGUAZ-KATARQTJSA-N Thr-Leu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YOOAQCZYZHGUAZ-KATARQTJSA-N 0.000 description 1
- WRUWXBBEFUTJOU-XGEHTFHBSA-N Thr-Met-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)O)N)O WRUWXBBEFUTJOU-XGEHTFHBSA-N 0.000 description 1
- FWTFAZKJORVTIR-VZFHVOOUSA-N Thr-Ser-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O FWTFAZKJORVTIR-VZFHVOOUSA-N 0.000 description 1
- SGAOHNPSEPVAFP-ZDLURKLDSA-N Thr-Ser-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SGAOHNPSEPVAFP-ZDLURKLDSA-N 0.000 description 1
- NQQMWWVVGIXUOX-SVSWQMSJSA-N Thr-Ser-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NQQMWWVVGIXUOX-SVSWQMSJSA-N 0.000 description 1
- AHERARIZBPOMNU-KATARQTJSA-N Thr-Ser-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O AHERARIZBPOMNU-KATARQTJSA-N 0.000 description 1
- UQCNIMDPYICBTR-KYNKHSRBSA-N Thr-Thr-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UQCNIMDPYICBTR-KYNKHSRBSA-N 0.000 description 1
- BBPCSGKKPJUYRB-UVOCVTCTSA-N Thr-Thr-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O BBPCSGKKPJUYRB-UVOCVTCTSA-N 0.000 description 1
- LXXCHJKHJYRMIY-FQPOAREZSA-N Thr-Tyr-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O LXXCHJKHJYRMIY-FQPOAREZSA-N 0.000 description 1
- OGOYMQWIWHGTGH-KZVJFYERSA-N Thr-Val-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O OGOYMQWIWHGTGH-KZVJFYERSA-N 0.000 description 1
- BKVICMPZWRNWOC-RHYQMDGZSA-N Thr-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O BKVICMPZWRNWOC-RHYQMDGZSA-N 0.000 description 1
- MNYNCKZAEIAONY-XGEHTFHBSA-N Thr-Val-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O MNYNCKZAEIAONY-XGEHTFHBSA-N 0.000 description 1
- 108090000190 Thrombin Proteins 0.000 description 1
- 241000384512 Trachichthyidae Species 0.000 description 1
- 101710195626 Transcriptional activator protein Proteins 0.000 description 1
- 229920004890 Triton X-100 Polymers 0.000 description 1
- SCQBNMKLZVCXNX-ZFWWWQNUSA-N Trp-Arg-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(=O)O)N SCQBNMKLZVCXNX-ZFWWWQNUSA-N 0.000 description 1
- YHRCLOURJWJABF-WDSOQIARSA-N Trp-His-Arg Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CN=CN3)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N YHRCLOURJWJABF-WDSOQIARSA-N 0.000 description 1
- UJRIVCPPPMYCNA-HOCLYGCPSA-N Trp-Leu-Gly Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N UJRIVCPPPMYCNA-HOCLYGCPSA-N 0.000 description 1
- UGFOSENEZHEQKX-PJODQICGSA-N Trp-Val-Ala Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)Cc1c[nH]c2ccccc12)C(=O)N[C@@H](C)C(O)=O UGFOSENEZHEQKX-PJODQICGSA-N 0.000 description 1
- JONPRIHUYSPIMA-UWJYBYFXSA-N Tyr-Ala-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JONPRIHUYSPIMA-UWJYBYFXSA-N 0.000 description 1
- BURPTJBFWIOHEY-UWJYBYFXSA-N Tyr-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 BURPTJBFWIOHEY-UWJYBYFXSA-N 0.000 description 1
- YGKVNUAKYPGORG-AVGNSLFASA-N Tyr-Asp-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YGKVNUAKYPGORG-AVGNSLFASA-N 0.000 description 1
- UNUZEBFXGWVAOP-DZKIICNBSA-N Tyr-Glu-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UNUZEBFXGWVAOP-DZKIICNBSA-N 0.000 description 1
- JWGXUKHIKXZWNG-RYUDHWBXSA-N Tyr-Gly-Gln Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O JWGXUKHIKXZWNG-RYUDHWBXSA-N 0.000 description 1
- BSCBBPKDVOZICB-KKUMJFAQSA-N Tyr-Leu-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BSCBBPKDVOZICB-KKUMJFAQSA-N 0.000 description 1
- DWAMXBFJNZIHMC-KBPBESRZSA-N Tyr-Leu-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O DWAMXBFJNZIHMC-KBPBESRZSA-N 0.000 description 1
- NSGZILIDHCIZAM-KKUMJFAQSA-N Tyr-Leu-Ser Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N NSGZILIDHCIZAM-KKUMJFAQSA-N 0.000 description 1
- FGVFBDZSGQTYQX-UFYCRDLUSA-N Tyr-Phe-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O FGVFBDZSGQTYQX-UFYCRDLUSA-N 0.000 description 1
- DDRBQONWVBDQOY-GUBZILKMSA-N Val-Ala-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DDRBQONWVBDQOY-GUBZILKMSA-N 0.000 description 1
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 1
- SLLKXDSRVAOREO-KZVJFYERSA-N Val-Ala-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N)O SLLKXDSRVAOREO-KZVJFYERSA-N 0.000 description 1
- IDKGBVZGNTYYCC-QXEWZRGKSA-N Val-Asn-Pro Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(O)=O IDKGBVZGNTYYCC-QXEWZRGKSA-N 0.000 description 1
- HZYOWMGWKKRMBZ-BYULHYEWSA-N Val-Asp-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HZYOWMGWKKRMBZ-BYULHYEWSA-N 0.000 description 1
- TZVUSFMQWPWHON-NHCYSSNCSA-N Val-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N TZVUSFMQWPWHON-NHCYSSNCSA-N 0.000 description 1
- CWSIBTLMMQLPPZ-FXQIFTODSA-N Val-Cys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](C(C)C)N CWSIBTLMMQLPPZ-FXQIFTODSA-N 0.000 description 1
- OUUBKKIJQIAPRI-LAEOZQHASA-N Val-Gln-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OUUBKKIJQIAPRI-LAEOZQHASA-N 0.000 description 1
- YDPFWRVQHFWBKI-GVXVVHGQSA-N Val-Glu-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N YDPFWRVQHFWBKI-GVXVVHGQSA-N 0.000 description 1
- YTPLVNUZZOBFFC-SCZZXKLOSA-N Val-Gly-Pro Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N1CCC[C@@H]1C(O)=O YTPLVNUZZOBFFC-SCZZXKLOSA-N 0.000 description 1
- PTFPUAXGIKTVNN-ONGXEEELSA-N Val-His-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)NCC(=O)O)N PTFPUAXGIKTVNN-ONGXEEELSA-N 0.000 description 1
- LKUDRJSNRWVGMS-QSFUFRPTSA-N Val-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LKUDRJSNRWVGMS-QSFUFRPTSA-N 0.000 description 1
- PYPZMFDMCCWNST-NAKRPEOUSA-N Val-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C(C)C)N PYPZMFDMCCWNST-NAKRPEOUSA-N 0.000 description 1
- KNYHAWKHFQRYOX-PYJNHQTQSA-N Val-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N KNYHAWKHFQRYOX-PYJNHQTQSA-N 0.000 description 1
- FEXILLGKGGTLRI-NHCYSSNCSA-N Val-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N FEXILLGKGGTLRI-NHCYSSNCSA-N 0.000 description 1
- UXODSMTVPWXHBT-ULQDDVLXSA-N Val-Phe-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N UXODSMTVPWXHBT-ULQDDVLXSA-N 0.000 description 1
- NHXZRXLFOBFMDM-AVGNSLFASA-N Val-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C NHXZRXLFOBFMDM-AVGNSLFASA-N 0.000 description 1
- QSPOLEBZTMESFY-SRVKXCTJSA-N Val-Pro-Val Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O QSPOLEBZTMESFY-SRVKXCTJSA-N 0.000 description 1
- HWNYVQMOLCYHEA-IHRRRGAJSA-N Val-Ser-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N HWNYVQMOLCYHEA-IHRRRGAJSA-N 0.000 description 1
- GUIYPEKUEMQBIK-JSGCOSHPSA-N Val-Tyr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)NCC(O)=O GUIYPEKUEMQBIK-JSGCOSHPSA-N 0.000 description 1
- 208000018756 Variant Creutzfeldt-Jakob disease Diseases 0.000 description 1
- 108020000999 Viral RNA Proteins 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 241000235015 Yarrowia lipolytica Species 0.000 description 1
- 235000007244 Zea mays Nutrition 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 239000013543 active substance Substances 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 238000005273 aeration Methods 0.000 description 1
- 239000003905 agrochemical Substances 0.000 description 1
- 108010087924 alanylproline Proteins 0.000 description 1
- 108010070783 alanyltyrosine Proteins 0.000 description 1
- 125000003158 alcohol group Chemical group 0.000 description 1
- 125000001931 aliphatic group Chemical group 0.000 description 1
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 1
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 1
- 235000019270 ammonium chloride Nutrition 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 239000012491 analyte Substances 0.000 description 1
- 239000012736 aqueous medium Substances 0.000 description 1
- 108010009111 arginyl-glycyl-glutamic acid Proteins 0.000 description 1
- 108010043240 arginyl-leucyl-glycine Proteins 0.000 description 1
- 108010068380 arginylarginine Proteins 0.000 description 1
- 108010010430 asparagine-proline-alanine Proteins 0.000 description 1
- 108010092854 aspartyllysine Proteins 0.000 description 1
- 210000003719 b-lymphocyte Anatomy 0.000 description 1
- 235000015278 beef Nutrition 0.000 description 1
- 108010051210 beta-Fructofuranosidase Proteins 0.000 description 1
- 230000001588 bifunctional effect Effects 0.000 description 1
- 108091008324 binding proteins Proteins 0.000 description 1
- 230000000975 bioactive effect Effects 0.000 description 1
- 239000011942 biocatalyst Substances 0.000 description 1
- 238000005842 biochemical reaction Methods 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 208000005881 bovine spongiform encephalopathy Diseases 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 239000001110 calcium chloride Substances 0.000 description 1
- 229910001628 calcium chloride Inorganic materials 0.000 description 1
- 235000011148 calcium chloride Nutrition 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000007707 calorimetry Methods 0.000 description 1
- 239000000828 canola oil Substances 0.000 description 1
- 235000019519 canola oil Nutrition 0.000 description 1
- 125000004432 carbon atom Chemical group C* 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 239000003054 catalyst Substances 0.000 description 1
- 108020001778 catalytic domains Proteins 0.000 description 1
- 239000006143 cell culture medium Substances 0.000 description 1
- 210000003850 cellular structure Anatomy 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 150000001793 charged compounds Chemical class 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 1
- 238000004296 chiral HPLC Methods 0.000 description 1
- 239000005516 coenzyme A Substances 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 238000009833 condensation Methods 0.000 description 1
- 230000005494 condensation Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000010411 cooking Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 239000002537 cosmetic Substances 0.000 description 1
- 239000010779 crude oil Substances 0.000 description 1
- 235000021438 curry Nutrition 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 231100000433 cytotoxic Toxicity 0.000 description 1
- 230000001472 cytotoxic effect Effects 0.000 description 1
- ICEQLCZWZXUUIJ-UHFFFAOYSA-N decan-3-ol Chemical compound CCCCCCCC(O)CC ICEQLCZWZXUUIJ-UHFFFAOYSA-N 0.000 description 1
- 238000010908 decantation Methods 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 108010049285 dephospho-CoA kinase Proteins 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 230000009088 enzymatic function Effects 0.000 description 1
- 239000002360 explosive Substances 0.000 description 1
- 101150015067 fabB gene Proteins 0.000 description 1
- 101150004992 fadA gene Proteins 0.000 description 1
- 239000003925 fat Substances 0.000 description 1
- 235000019197 fats Nutrition 0.000 description 1
- 230000004136 fatty acid synthesis Effects 0.000 description 1
- 150000002185 fatty acyl-CoAs Chemical class 0.000 description 1
- 229960002413 ferric citrate Drugs 0.000 description 1
- 239000012847 fine chemical Substances 0.000 description 1
- 235000013312 flour Nutrition 0.000 description 1
- 235000003086 food stabiliser Nutrition 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 239000002803 fossil fuel Substances 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- FTSSQIKWUOOEGC-RULYVFMPSA-N fructooligosaccharide Chemical compound OC[C@H]1O[C@@](CO)(OC[C@@]2(OC[C@@]3(OC[C@@]4(OC[C@@]5(OC[C@@]6(OC[C@@]7(OC[C@@]8(OC[C@@]9(OC[C@@]%10(OC[C@@]%11(O[C@H]%12O[C@H](CO)[C@@H](O)[C@H](O)[C@H]%12O)O[C@H](CO)[C@@H](O)[C@@H]%11O)O[C@H](CO)[C@@H](O)[C@@H]%10O)O[C@H](CO)[C@@H](O)[C@@H]9O)O[C@H](CO)[C@@H](O)[C@@H]8O)O[C@H](CO)[C@@H](O)[C@@H]7O)O[C@H](CO)[C@@H](O)[C@@H]6O)O[C@H](CO)[C@@H](O)[C@@H]5O)O[C@H](CO)[C@@H](O)[C@@H]4O)O[C@H](CO)[C@@H](O)[C@@H]3O)O[C@H](CO)[C@@H](O)[C@@H]2O)[C@@H](O)[C@@H]1O FTSSQIKWUOOEGC-RULYVFMPSA-N 0.000 description 1
- 229940107187 fructooligosaccharide Drugs 0.000 description 1
- 238000000769 gas chromatography-flame ionisation detection Methods 0.000 description 1
- 238000003208 gene overexpression Methods 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 229960001031 glucose Drugs 0.000 description 1
- 235000001727 glucose Nutrition 0.000 description 1
- 125000002791 glucosyl group Chemical group C1([C@H](O)[C@@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 1
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 1
- 229930182470 glycoside Natural products 0.000 description 1
- 150000002338 glycosides Chemical class 0.000 description 1
- 108010078326 glycyl-glycyl-valine Proteins 0.000 description 1
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 1
- 108010015792 glycyllysine Proteins 0.000 description 1
- 108010084389 glycyltryptophan Proteins 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 231100001261 hazardous Toxicity 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 239000004009 herbicide Substances 0.000 description 1
- 125000000623 heterocyclic group Chemical group 0.000 description 1
- BXWNKGSJHAJOGX-UHFFFAOYSA-N hexadecan-1-ol Chemical compound CCCCCCCCCCCCCCCCO BXWNKGSJHAJOGX-UHFFFAOYSA-N 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- 108010040030 histidinoalanine Proteins 0.000 description 1
- 239000005556 hormone Substances 0.000 description 1
- 229940088597 hormone Drugs 0.000 description 1
- 229930195733 hydrocarbon Natural products 0.000 description 1
- 150000002430 hydrocarbons Chemical class 0.000 description 1
- 230000007062 hydrolysis Effects 0.000 description 1
- 238000006460 hydrolysis reaction Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 239000004434 industrial solvent Substances 0.000 description 1
- 239000002440 industrial waste Substances 0.000 description 1
- 238000011081 inoculation Methods 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 239000001573 invertase Substances 0.000 description 1
- 235000011073 invertase Nutrition 0.000 description 1
- NPFOYSMITVOQOS-UHFFFAOYSA-K iron(III) citrate Chemical compound [Fe+3].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O NPFOYSMITVOQOS-UHFFFAOYSA-K 0.000 description 1
- 238000006317 isomerization reaction Methods 0.000 description 1
- QXJSBBXBKPUZAA-UHFFFAOYSA-N isooleic acid Natural products CCCCCCCC=CCCCCCCCCC(O)=O QXJSBBXBKPUZAA-UHFFFAOYSA-N 0.000 description 1
- 238000002307 isotope ratio mass spectrometry Methods 0.000 description 1
- 230000000155 isotopic effect Effects 0.000 description 1
- 238000011031 large-scale manufacturing process Methods 0.000 description 1
- 108010000761 leucylarginine Proteins 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 1
- 229910052943 magnesium sulfate Inorganic materials 0.000 description 1
- 235000019341 magnesium sulphate Nutrition 0.000 description 1
- LTYOQGRJFJAKNA-DVVLENMVSA-N malonyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)CC(O)=O)O[C@H]1N1C2=NC=NC(N)=C2N=C1 LTYOQGRJFJAKNA-DVVLENMVSA-N 0.000 description 1
- 238000001819 mass spectrum Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 239000013028 medium composition Substances 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- IBIKHMZPHNKTHM-RDTXWAMCSA-N merck compound 25 Chemical compound C1C[C@@H](C(O)=O)[C@H](O)CN1C(C1=C(F)C=CC=C11)=NN1C(=O)C1=C(Cl)C=CC=C1C1CC1 IBIKHMZPHNKTHM-RDTXWAMCSA-N 0.000 description 1
- 239000002207 metabolite Substances 0.000 description 1
- 108010056582 methionylglutamic acid Proteins 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 235000019796 monopotassium phosphate Nutrition 0.000 description 1
- 229910000402 monopotassium phosphate Inorganic materials 0.000 description 1
- 235000019508 mustard seed Nutrition 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 238000006386 neutralization reaction Methods 0.000 description 1
- 231100000252 nontoxic Toxicity 0.000 description 1
- 230000003000 nontoxic effect Effects 0.000 description 1
- 231100000956 nontoxicity Toxicity 0.000 description 1
- 239000003758 nuclear fuel Substances 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 235000016709 nutrition Nutrition 0.000 description 1
- TVMXDCGIABBOFY-UHFFFAOYSA-N octane Chemical compound CCCCCCCC TVMXDCGIABBOFY-UHFFFAOYSA-N 0.000 description 1
- 230000009965 odorless effect Effects 0.000 description 1
- ZQPPMHVWECSIRJ-KTKRTIGZSA-N oleic acid Chemical compound CCCCCCCC\C=C/CCCCCCCC(O)=O ZQPPMHVWECSIRJ-KTKRTIGZSA-N 0.000 description 1
- XMLQWXUVTXCDDL-UHFFFAOYSA-N oleyl alcohol Natural products CCCCCCC=CCCCCCCCCCCO XMLQWXUVTXCDDL-UHFFFAOYSA-N 0.000 description 1
- 229920001542 oligosaccharide Polymers 0.000 description 1
- 150000002482 oligosaccharides Chemical class 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 239000005416 organic matter Substances 0.000 description 1
- 239000012074 organic phase Substances 0.000 description 1
- 235000006408 oxalic acid Nutrition 0.000 description 1
- 150000002924 oxiranes Chemical class 0.000 description 1
- 150000002972 pentoses Chemical class 0.000 description 1
- 235000019319 peptone Nutrition 0.000 description 1
- 239000000575 pesticide Substances 0.000 description 1
- 239000003348 petrochemical agent Substances 0.000 description 1
- 239000011846 petroleum-based material Substances 0.000 description 1
- 239000012071 phase Substances 0.000 description 1
- 108010084572 phenylalanyl-valine Proteins 0.000 description 1
- 108010012581 phenylalanylglutamate Proteins 0.000 description 1
- 108010073101 phenylalanylleucine Proteins 0.000 description 1
- 108010051242 phenylalanylserine Proteins 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 1
- 150000003904 phospholipids Chemical class 0.000 description 1
- PJNZPQUBCPKICU-UHFFFAOYSA-N phosphoric acid;potassium Chemical compound [K].OP(O)(O)=O PJNZPQUBCPKICU-UHFFFAOYSA-N 0.000 description 1
- 239000004014 plasticizer Substances 0.000 description 1
- 238000000711 polarimetry Methods 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 239000013587 production medium Substances 0.000 description 1
- 108010070643 prolylglutamic acid Proteins 0.000 description 1
- 108010029020 prolylglycine Proteins 0.000 description 1
- 108010090894 prolylleucine Proteins 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- BDERNNFJNOPAEC-UHFFFAOYSA-N propan-1-ol Chemical compound CCCO BDERNNFJNOPAEC-UHFFFAOYSA-N 0.000 description 1
- 230000017854 proteolysis Effects 0.000 description 1
- 150000003212 purines Chemical class 0.000 description 1
- 150000003230 pyrimidines Chemical class 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000004064 recycling Methods 0.000 description 1
- 239000013558 reference substance Substances 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000007320 rich medium Substances 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 238000011218 seed culture Methods 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 125000003607 serino group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 description 1
- 108010048818 seryl-histidine Proteins 0.000 description 1
- 230000037432 silent mutation Effects 0.000 description 1
- 238000002553 single reaction monitoring Methods 0.000 description 1
- 238000013426 sirius red morphometry Methods 0.000 description 1
- 239000000344 soap Substances 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 235000012424 soybean oil Nutrition 0.000 description 1
- 239000003549 soybean oil Substances 0.000 description 1
- 239000007858 starting material Substances 0.000 description 1
- 230000000707 stereoselective effect Effects 0.000 description 1
- KDYFGRWQOYBRFD-UHFFFAOYSA-L succinate(2-) Chemical compound [O-]C(=O)CCC([O-])=O KDYFGRWQOYBRFD-UHFFFAOYSA-L 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 239000013076 target substance Substances 0.000 description 1
- 101150026728 tesB gene Proteins 0.000 description 1
- DQELOVNSWGCVQZ-UHFFFAOYSA-N tetradec-3-en-1-ol Chemical compound CCCCCCCCCCC=CCCO DQELOVNSWGCVQZ-UHFFFAOYSA-N 0.000 description 1
- CIZOCKPOEXXEHB-UHFFFAOYSA-N tetradecan-3-ol Chemical compound CCCCCCCCCCCC(O)CC CIZOCKPOEXXEHB-UHFFFAOYSA-N 0.000 description 1
- 239000002562 thickening agent Substances 0.000 description 1
- 229960004072 thrombin Drugs 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- 239000011573 trace mineral Substances 0.000 description 1
- 235000013619 trace mineral Nutrition 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- VOITXYVAKOUIBA-UHFFFAOYSA-N triethylaluminium Chemical compound CC[Al](CC)CC VOITXYVAKOUIBA-UHFFFAOYSA-N 0.000 description 1
- JSPLKZUTYZBBKA-UHFFFAOYSA-N trioxidane Chemical compound OOO JSPLKZUTYZBBKA-UHFFFAOYSA-N 0.000 description 1
- 108010080629 tryptophan-leucine Proteins 0.000 description 1
- 108010038745 tryptophylglycine Proteins 0.000 description 1
- 108010003137 tyrosyltyrosine Proteins 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 235000019871 vegetable fat Nutrition 0.000 description 1
- 238000009423 ventilation Methods 0.000 description 1
- 210000003501 vero cell Anatomy 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 238000003260 vortexing Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 238000005303 weighing Methods 0.000 description 1
- 239000010698 whale oil Substances 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/02—Preparation of oxygen-containing organic compounds containing a hydroxy group
- C12P7/04—Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
- C12P7/18—Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic polyhydric
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0006—Oxidoreductases (1.) acting on CH-OH groups as donors (1.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0008—Oxidoreductases (1.) acting on the aldehyde or oxo group of donors (1.2)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/18—Carboxylic ester hydrolases (3.1.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/93—Ligases (6)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y101/00—Oxidoreductases acting on the CH-OH group of donors (1.1)
- C12Y101/01—Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y102/00—Oxidoreductases acting on the aldehyde or oxo group of donors (1.2)
- C12Y102/01—Oxidoreductases acting on the aldehyde or oxo group of donors (1.2) with NAD+ or NADP+ as acceptor (1.2.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y102/00—Oxidoreductases acting on the aldehyde or oxo group of donors (1.2)
- C12Y102/01—Oxidoreductases acting on the aldehyde or oxo group of donors (1.2) with NAD+ or NADP+ as acceptor (1.2.1)
- C12Y102/01042—Hexadecanal dehydrogenase (acylating) (1.2.1.42), i.e. fatty acyl-CoA reductase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y102/00—Oxidoreductases acting on the aldehyde or oxo group of donors (1.2)
- C12Y102/01—Oxidoreductases acting on the aldehyde or oxo group of donors (1.2) with NAD+ or NADP+ as acceptor (1.2.1)
- C12Y102/0108—Long-chain acyl-[acyl-carrier-protein] reductase (1.2.1.80)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y301/00—Hydrolases acting on ester bonds (3.1)
- C12Y301/01—Carboxylic ester hydrolases (3.1.1)
- C12Y301/01005—Lysophospholipase (3.1.1.5)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y301/00—Hydrolases acting on ester bonds (3.1)
- C12Y301/02—Thioester hydrolases (3.1.2)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y301/00—Hydrolases acting on ester bonds (3.1)
- C12Y301/02—Thioester hydrolases (3.1.2)
- C12Y301/02014—Oleoyl-[acyl-carrier-protein] hydrolase (3.1.2.14), i.e. ACP-thioesterase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y602/00—Ligases forming carbon-sulfur bonds (6.2)
- C12Y602/01—Acid-Thiol Ligases (6.2.1)
- C12Y602/01003—Long-chain-fatty-acid-CoA ligase (6.2.1.3)
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02E—REDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
- Y02E50/00—Technologies for the production of fuel of non-fossil origin
- Y02E50/10—Biofuels, e.g. bio-diesel
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Medicinal Chemistry (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
本公开涉及脂肪二醇以及用于产生其的重组微生物。更具体地说,本公开涉及经工程化以经由发酵产生脂肪二醇的重组微生物。进一步涵盖一种使用所述微生物从简单碳源产生脂肪二醇的方法。
Description
相关申请的交叉引用
本申请要求2014年7月18日提交的美国临时申请No.62/026,573的权益,所述临时申请的全部公开内容以引用的方式并入本文中。
序列表
本申请包含序列表,其已经呈ASCII格式电子递交并以引用的方式整体并入本文中。所述ASCII拷贝于2015年7月17日创建,命名为LS00052PCT_SL.txt且大小是50,064个字节。
发明领域
本公开涉及脂肪二醇及其产生方法。本文中,本公开涉及经工程化以经由发酵产生脂肪二醇的重组微生物。进一步涵盖一种使用微生物从简单碳源产生脂肪二醇的方法。
发明背景
脂肪醇作为工业试剂和工艺的组分具有许多商业用途,特别是在清洁剂和表面活性剂的生产中。它们用作化妆品和食品中的乳化剂、软化剂和增稠剂,以及作为工业溶剂和增塑剂。脂肪醇可以从石油化学或油脂化学来源的原料产生。石油化学品是来源于石油的化学产品。油脂化学品是来源于例如植物脂肪和动物脂肪等天然来源的精炼油。
用于制造脂肪醇的化学途径是能量密集和高环境成本的,并需要使用危险的试剂。举例来说,乙烯可以使用三乙基铝寡聚,接着空气氧化。此方法产生偶数脂肪醇并称为齐格勒法(Ziegler process)。或者,乙烯可以寡聚,得到烯烃混合物,接着对烯烃进行加氢甲酰化,得到奇数醛,随后对奇数醛进行氢化,得到脂肪醇。在另一化学方法中,烯烃产品转变成脂肪醛,然后转变成脂肪醇。所述烯烃产品通过壳牌高碳烯烃法(Shell higherolefin process)制备,此法在1977年由Royal Dutch Shell商业化(例如每年生产大约超过一百万吨烯烃)。
用于制造脂肪醇的天然途径虽然被视为是绿色方法,但与化学途径相比仍然成本高。传统上,脂肪醇来源于脂肪酸酯或蜡酯,脂肪酸酯或蜡酯最初是从鲸的鲸油提取,后来从牛脂(例如来自牛肉或羊羔的动物脂肪)提取。蜡酯的一种替代植物来源是西蒙德木植物(jojoba plant)。今天,脂肪醇还可以从例如菜籽油、芥籽油、椰子油或棕榈油等油脂化学来源的原料(例如精炼植物油)产生。此类植物油主要是由含有经三种脂肪酸(FA)酯化的甘油的三酰基甘油(TAG)构成。植物油的多样用途依赖于TAG的FA组成。举例来说,肥皂生产需要高比例的月桂酸(12:0),而推荐将富含油酸的油(18:1)用于烹饪。可以对TAG进行酯交换反应,得到酯,随后将酯氢化成脂肪醇。虽然牛脂通常是C16-C18,但来自植物来源的链长更可变(例如C6-C24)。长链醇(例如C20-C22)可以从菜籽或芥菜籽获得,而中值脂肪醇(例如C12-C14)可以从椰子或棕榈油获得。椰子和棕榈油富含月桂酸(C12)和肉豆蔻酸(C14)。因为2000年欧洲爆发了牛海绵状脑病(即疯牛病),所以牛脂通常被来源于棕榈油和豆油的植物油脂肪酸代替。
脂肪二醇或脂肪族二醇是脂肪醇的实例,且可以经由化学方法产生。举例来说,1,3-二醇可以由乙烯和羧酰氯化物合成(参见例如Kirchanov等人(1981)Translation fromIzvestiya Akademii Nauk SSSR,Seriya Khimicheskaya 4:909-911)。1,3-二醇还可以通过α,β-不饱和酮和醛的水合来制备,其中所得酮-醇氢化。1,3-二醇的另一化学合成包括环氧化物的加氢甲酰化,接着醛氢化(例如由环氧乙烷制备1,3-丙二醇)。1,3-二醇的更专门途径包括烯烃与甲醛之间的反应以及β-羟基酮的使用。1,3-二醇已经可用作食品添加剂(参见例如美国专利No.3,806,615)。1,3-二羟基构型使得这些化学实体无毒性。
1,3-二醇是双官能的,且可以用作其它分子之间的连接分子,例如在聚合物的产生中。举例来说,1,3-丙二醇用作聚合物产生中的单体。1,3脂肪二醇还可以用作表面活性剂的前驱物,例如“Gemini”表面活性剂,其中两个醇部分经化学改性(例如乙氧基化、糖基化、硫酸化等等)。1,3脂肪二醇的3-羟基部分也是手性的,这使得1,3脂肪二醇适用作产生例如单体、药物、营养品、杀虫剂、除草剂、香精、香料、溶剂等手性重要的化合物的合成子。
因为脂肪二醇是工业试剂和工艺的重要组分,所以希望足够大量地生产它们,以满足工业需求,同时维持较低的对环境的影响。本发明解决了此需求。
发明概要
本公开的一方面提供一种重组微生物,其在具有简单碳源的发酵肉汤中生长时产生1,3脂肪二醇,所述微生物包括编码具有硫酯酶(EC 3.1.2.-、EC 3.1.1.5或EC3.1.2.14)活性和羧酸还原酶(EC 6.2.1.3或EC 1.2.1.42)活性的多肽的核酸序列。在一方面,1,3脂肪二醇在体内产生。在另一方面,1,3脂肪二醇包括但不限于C5 1,3脂肪二醇、C61,3脂肪二醇、C7 1,3脂肪二醇、C8 1,3脂肪二醇、C9 1,3脂肪二醇、C10 1,3脂肪二醇、C11 1,3脂肪二醇、C12 1,3脂肪二醇、C13 1,3脂肪二醇、C14 1,3脂肪二醇、C15 1,3脂肪二醇、C16 1,3脂肪二醇、C17 1,3脂肪二醇、C18 1,3脂肪二醇以及C19 1,3脂肪二醇。在又一方面,简单碳源来源于可再生原料。在一个实施方案中,本公开提供一种重组微生物,其中所述微生物包括编码具有硫酯酶(EC 3.1.2.-、EC 3.1.1.5或EC 3.1.2.14)活性和羧酸还原酶(EC6.2.1.3或EC 1.2.1.42)活性的多肽的核酸序列,且其中当在具有简单碳源的发酵肉汤中生长时所述微生物产生1,3脂肪二醇。在另一个实施方案中,核酸序列是外源性的。在另一个实施方案中,核酸序列包括一个或多个核酸序列。
本公开的另一方面提供一种重组微生物,其在具有简单碳源的发酵肉汤中生长时产生1,3脂肪二醇,所述微生物包括经工程化以表达编码具有硫酯酶(EC 3.1.2.-、EC3.1.1.5或EC 3.1.2.14)活性和羧酸还原酶(EC 6.2.1.3或EC 1.2.1.42)活性的多肽的核酸序列的途径。在一方面,1,3脂肪二醇在体内产生。在另一方面,1,3脂肪二醇包括但不限于C5 1,3脂肪二醇、C6 1,3脂肪二醇、C7 1,3脂肪二醇、C8 1,3脂肪二醇、C9 1,3脂肪二醇、C10 1,3脂肪二醇、C11 1,3脂肪二醇、C12 1,3脂肪二醇、C13 1,3脂肪二醇、C14 1,3脂肪二醇、C15 1,3脂肪二醇、C16 1,3脂肪二醇、C17 1,3脂肪二醇、C18 1,3脂肪二醇以及C19 1,3脂肪二醇。在又一方面,简单碳源来源于可再生原料。在一个实施方案中,本公开提供一种重组微生物,所述微生物具有经工程化以表达编码具有硫酯酶(EC 3.1.2.-、EC 3.1.1.5或EC3.1.2.14)活性和羧酸还原酶(EC 6.2.1.3或EC 1.2.1.42)活性的多肽的核酸序列的途径,其中当在具有简单碳源的发酵肉汤中生长时所述微生物产生1,3脂肪二醇。在另一个实施方案中,核酸序列是外源性的。在另一个实施方案中,核酸序列包括一个或多个核酸序列。
本公开的另一方面提供一种重组微生物,其在具有简单碳源的发酵肉汤中生长时产生1,3脂肪二醇,所述微生物经工程化以表达编码具有硫酯酶(EC 3.1.2.-、EC 3.1.1.5或EC 3.1.2.14)活性、羧酸还原酶(EC 6.2.1.3或EC 1.2.1.42)活性和任选醇脱氢酶(EC1.1.1.)活性的多肽的一个或多个核酸序列。在一方面,1,3脂肪二醇在体内产生。在另一方面,1,3脂肪二醇包括但不限于C5 1,3脂肪二醇、C6 1,3脂肪二醇、C7 1,3脂肪二醇、C8 1,3脂肪二醇、C9 1,3脂肪二醇、C10 1,3脂肪二醇、C11 1,3脂肪二醇、C12 1,3脂肪二醇、C13 1,3脂肪二醇、C14 1,3脂肪二醇、C15 1,3脂肪二醇、C16 1,3脂肪二醇、C17 1,3脂肪二醇、C18 1,3脂肪二醇以及C19 1,3脂肪二醇。在又一方面,简单碳源来源于可再生原料。在一个实施方案中,本公开提供一种重组微生物,所述微生物经工程化以表达编码具有硫酯酶(EC3.1.2.-、EC 3.1.1.5或EC 3.1.2.14)活性、羧酸还原酶(EC 6.2.1.3或EC 1.2.1.42)活性和醇脱氢酶(EC 1.1.1.)活性的多肽的一个或多个核酸序列,其中所述微生物当在具有简单碳源的发酵肉汤中生长时产生1,3脂肪二醇。在另一个实施方案中,所述一个或多个核酸序列是外源性的。
本公开的另一方面提供一种重组微生物,其在具有简单碳源的发酵肉汤中生长时产生1,3脂肪二醇,所述微生物包括经工程化以表达编码具有硫酯酶(EC 3.1.2.-、EC3.1.1.5或EC 3.1.2.14)活性、羧酸还原酶(EC 6.2.1.3或EC 1.2.1.42)活性和任选醇脱氢酶(EC 1.1.1.)活性的多肽的一个或多个核酸序列的途径。在一方面,1,3脂肪二醇在体内产生。在另一方面,1,3脂肪二醇包括但不限于C5 1,3脂肪二醇、C6 1,3脂肪二醇、C7 1,3脂肪二醇、C8 1,3脂肪二醇、C9 1,3脂肪二醇、C10 1,3脂肪二醇、C11 1,3脂肪二醇、C12 1,3脂肪二醇、C13 1,3脂肪二醇、C14 1,3脂肪二醇、C15 1,3脂肪二醇、C16 1,3脂肪二醇、C17 1,3脂肪二醇、C18 1,3脂肪二醇以及C19 1,3脂肪二醇。在又一方面,简单碳源来源于可再生原料。在一个实施方案中,本公开提供一种重组微生物,所述微生物具有经工程化以表达编码具有硫酯酶(EC 3.1.2.-、EC 3.1.1.5或EC 3.1.2.14)活性、羧酸还原酶(EC 6.2.1.3或EC1.2.1.42)活性和醇脱氢酶(EC 1.1.1.)活性的多肽的一个或多个核酸序列的途径,其中所述微生物当在具有简单碳源的发酵肉汤中生长时产生1,3脂肪二醇。在另一个实施方案中,所述一个或多个核酸序列是外源性的。
本公开的另一方面提供一种重组微生物,其在具有简单碳源的发酵肉汤中生长时产生1,3脂肪二醇,其中所述简单碳源来源于可再生原料。
本公开的另一方面提供一种重组微生物,其在具有简单碳源的发酵肉汤中生长时产生1,3脂肪二醇,其中所述微生物表达编码具有硫酯酶(EC 3.1.2.-、EC 3.1.1.5或EC3.1.2.14)活性和羧酸还原酶(EC 6.2.1.3或EC 1.2.1.42)活性的多肽的一个或多个核酸序列。在一个实施方案中,硫酯酶包括但不限于fatB1、TE_EEI82564、TE_CAD63310、phaG和tesA。在另一个实施方案中,羧酸还原酶是carB。在另一个实施方案中,所述一个或多个核酸序列是外源性的。
本公开的另一方面提供一种重组微生物,其在具有简单碳源的发酵肉汤中生长时产生1,3脂肪二醇,所述微生物包括经工程化以表达编码具有硫酯酶(EC 3.1.2.-、EC3.1.1.5或EC 3.1.2.14)活性和羧酸还原酶(EC 6.2.1.3或EC 1.2.1.42)活性的多肽的一个或多个核酸序列的途径。在一个实施方案中,硫酯酶包括但不限于fatB1、TE_EEI82564、TE_CAD63310、phaG和tesA。在另一个实施方案中,羧酸还原酶是carB。在另一个实施方案中,所述一个或多个核酸序列是外源性的。
本公开的另一方面提供一种重组微生物,其在具有简单碳源的发酵肉汤中生长时产生1,3脂肪二醇,其中所述微生物表达编码具有硫酯酶(EC 3.1.2.-、EC 3.1.1.5或EC3.1.2.14)活性、羧酸还原酶(EC 6.2.1.3或EC 1.2.1.42)活性和醇脱氢酶(EC 1.1.1.)的多肽的一个或多个核酸序列。在一个实施方案中,硫酯酶包括但不限于fatB1、TE_EEI82564、TE_CAD63310、phaG和tesA。在另一个实施方案中,羧酸还原酶是carB。在又一个实施方案中,醇脱氢酶是alrA。在又一个实施方案中,所述一个或多个核酸序列是外源性的。
本公开的另一方面提供一种重组微生物,其在具有简单碳源的发酵肉汤中生长时产生1,3脂肪二醇,所述微生物包括经工程化以表达编码具有硫酯酶(EC 3.1.2.-、EC3.1.1.5或EC 3.1.2.14)活性、羧酸还原酶(EC 6.2.1.3或EC 1.2.1.42)活性和醇脱氢酶(EC 1.1.1.)活性的多肽的一个或多个核酸序列的途径。在一个实施方案中,硫酯酶包括但不限于fatB1、TE_EEI82564、TE_CAD63310、phaG和tesA。在另一个实施方案中,羧酸还原酶是carB。在又一个实施方案中,醇脱氢酶是alrA。在又一个实施方案中,所述一个或多个核酸序列是外源性的。
本公开进一步涵盖一种细胞培养物,其包括在具有简单碳源的发酵肉汤中生长时产生1,3脂肪二醇的重组微生物。在一方面,微生物经工程化以表达编码具有硫酯酶(EC3.1.2.-、EC 3.1.1.5或EC 3.1.2.14)活性和羧酸还原酶(EC 6.2.1.3或EC 1.2.1.42)活性的多肽的核酸序列。在另一方面,微生物经工程化以表达编码具有硫酯酶(EC 3.1.2.-、EC3.1.1.5或EC 3.1.2.14)活性、羧酸还原酶(EC 6.2.1.3或EC 1.2.1.42)活性和醇脱氢酶(EC 1.1.1.-)活性的多肽的核酸序列。在另一方面,细胞培养物产生1,3脂肪二醇。在另一方面,细胞培养物产生包括C5 1,3脂肪二醇、C6 1,3脂肪二醇、C7 1,3脂肪二醇、C8 1,3脂肪二醇、C9 1,3脂肪二醇、C10 1,3脂肪二醇、C11 1,3脂肪二醇、C12 1,3脂肪二醇、C13 1,3脂肪二醇、C14 1,3脂肪二醇、C15 1,3脂肪二醇、C16 1,3脂肪二醇、C17 1,3脂肪二醇、C18 1,3脂肪二醇、C19 1,3脂肪二醇等的1,3脂肪二醇。在一个实施方案中,核酸序列是外源性的。在另一个实施方案中,核酸序列包括一个或多个核酸序列。
本公开进一步涵盖一种产生1,3脂肪二醇的方法,包括如上所述的微生物(上文)。
本公开的另一方面提供一种产生1,3脂肪二醇的方法,其包括在发酵肉汤中提供重组微生物,所述微生物表达编码具有硫酯酶(EC 3.1.2.-、EC 3.1.1.5或EC 3.1.2.14)活性、羧酸还原酶(EC 6.2.1.3或EC 1.2.1.42)活性和任选醇脱氢酶(EC 1.1.1.)活性的多肽的一个或多个核酸序列;以及从所述发酵肉汤分离1,3脂肪二醇。在一个实施方案中,所述方法进一步包括添加简单碳源至发酵肉汤。在又一个实施方案中,简单碳源来源于可再生原料。在另一方面,本公开提供一种产生1,3脂肪二醇的方法,其包括在发酵肉汤中提供重组微生物,所述微生物经工程化以表达编码具有硫酯酶(EC 3.1.2.-、EC 3.1.1.5或EC3.1.2.14)活性和羧酸还原酶(EC 6.2.1.3或EC 1.2.1.42)活性的多肽的一个或多个核酸序列;以及从所述发酵肉汤分离1,3脂肪二醇。在一方面,1,3脂肪二醇包括但不限于C5 1,3脂肪二醇、C6 1,3脂肪二醇、C7 1,3脂肪二醇、C8 1,3脂肪二醇、C9 1,3脂肪二醇、C10 1,3脂肪二醇、C11 1,3脂肪二醇、C12 1,3脂肪二醇、C13 1,3脂肪二醇、C14 1,3脂肪二醇、C15 1,3脂肪二醇、C16 1,3脂肪二醇、C17 1,3脂肪二醇、C18 1,3脂肪二醇以及C19 1,3脂肪二醇。在一个实施方案中,所述方法进一步包括添加简单碳源至发酵肉汤。在又一个实施方案中,简单碳源来源于可再生原料。
本公开的另一方面提供一种重组微生物,其在具有简单碳源的发酵肉汤中生长时产生1,3脂肪二醇,所述微生物表达编码具有酰基-ACP还原酶(EC 1.2.1.80或EC1.2.1.42)活性的多肽的核酸序列。在一方面,1,3脂肪二醇在体内产生。在另一方面,脂肪二醇包括但不限于C5 1,3脂肪二醇、C6 1,3脂肪二醇、C7 1,3脂肪二醇、C8 1,3脂肪二醇、C91,3脂肪二醇、C10 1,3脂肪二醇、C11 1,3脂肪二醇、C12 1,3脂肪二醇、C13 1,3脂肪二醇、C141,3脂肪二醇、C15 1,3脂肪二醇、C16 1,3脂肪二醇、C17 1,3脂肪二醇、C18 1,3脂肪二醇以及C19 1,3脂肪二醇。在一个实施方案中,核酸序列是外源性的。
本公开的又一方面提供一种重组微生物,其在具有简单碳源的发酵肉汤中生长时产生1,3脂肪二醇,所述微生物表达编码具有酰基-ACP还原酶(EC 1.2.1.80或EC1.2.1.42)活性和醇脱氢酶(EC 1.1.1.-)活性的多肽的一个或多个核酸序列。在一方面,1,3脂肪二醇在体内产生。在另一方面,脂肪二醇包括但不限于C5 1,3脂肪二醇、C6 1,3脂肪二醇、C7 1,3脂肪二醇、C8 1,3脂肪二醇、C9 1,3脂肪二醇、C10 1,3脂肪二醇、C11 1,3脂肪二醇、C12 1,3脂肪二醇、C13 1,3脂肪二醇、C14 1,3脂肪二醇、C15 1,3脂肪二醇、C16 1,3脂肪二醇、C17 1,3脂肪二醇、C18 1,3脂肪二醇以及C19 1,3脂肪二醇。在一个实施方案中,所述一个或多个核酸序列是外源性的。
本公开进一步涵盖一种细胞培养物,其包括当在具有简单碳源的发酵肉汤中生长时产生1,3脂肪二醇的重组微生物,所述微生物经工程化以表达编码具有酰基-ACP还原酶(EC 1.2.1.80或EC 1.2.1.42)活性和任选醇脱氢酶(EC 1.1.1.-)活性的多肽的一个或多个核酸序列。在一方面,细胞培养物产生1,3脂肪二醇。在另一方面,脂肪二醇包括但不限于C5 1,3脂肪二醇、C6 1,3脂肪二醇、C7 1,3脂肪二醇、C8 1,3脂肪二醇、C9 1,3脂肪二醇、C101,3脂肪二醇、C11 1,3脂肪二醇、C12 1,3脂肪二醇、C13 1,3脂肪二醇、C14 1,3脂肪二醇、C151,3脂肪二醇、C16 1,3脂肪二醇、C17 1,3脂肪二醇、C18 1,3脂肪二醇以及C19 1,3脂肪二醇。在一个实施方案中,所述一个或多个核酸序列是外源性的。
在又一方面,本公开涵盖一种产生1,3脂肪二醇的方法,其包括在发酵肉汤中提供重组微生物,所述微生物经工程化以表达编码具有酰基-ACP还原酶(EC 1.2.1.80或EC1.2.1.42)活性的多肽的核酸序列;以及从所述发酵肉汤分离1,3脂肪二醇。在一个实施方案中,微生物进一步表达编码具有醇脱氢酶(EC 1.1.1.-)活性的多肽的核酸序列。在另一个实施方案中,所述方法进一步包括添加简单碳源至发酵肉汤。在又一个实施方案中,简单碳源来源于可再生原料。所述方法产生脂肪二醇,包括但不限于C5 1,3脂肪二醇、C6 1,3脂肪二醇、C7 1,3脂肪二醇、C8 1,3脂肪二醇、C9 1,3脂肪二醇、C10 1,3脂肪二醇、C11 1,3脂肪二醇、C12 1,3脂肪二醇、C13 1,3脂肪二醇、C14 1,3脂肪二醇、C15 1,3脂肪二醇、C16 1,3脂肪二醇、C17 1,3脂肪二醇、C18 1,3脂肪二醇以及C19 1,3脂肪二醇。
在又一方面,本公开进一步涵盖1,3脂肪二醇从以上论述的任何重组微生物(上文)分泌和回收。在一个实施方案中,1,3脂肪二醇分泌至发酵肉汤中。在另一个实施方案中,1,3脂肪二醇经由油水分离,例如经由重力沉降、离心、倾析等等回收。
本公开进一步涵盖脂肪二醇组合物。在一方面,所述组合物包括一种或多种脂肪二醇,包括1,3-二醇。
本公开的另一方面更提供脂肪二醇在产生包括乙氧基化物等表面活性剂中的用途。
本公开进一步涵盖手性1,3脂肪二醇、其对映异构体和手性混合物。进一步涵盖1,3脂肪二醇、其对映异构体和手性混合物的组合物。
附图简述
当结合附图阅读时,更好地理解本公开,附图用于说明一些优选实施方案。然而,应了解,本公开不局限于图中公开的特定实施方案。
图1描绘一种用于制备1,3-二醇的示例性途径,包括酶功能性。
图2描绘一种用于制备1,3-二醇的示例性途径,出于说明的目的,提供酶功能性的实例。
图3展示一种用于制备1,3-二醇的替代途径,包括酶功能性。
图4展示来自表达TE_EEI82564和CarB的重组大肠埃希氏菌菌株的提取物的GC/MS色谱。所有样品都用BSTFA+1%TMCS衍生化。峰(1)是衍生化的1,3-辛醇且峰(2)是衍生化的1,3-癸醇。
图5展示来自图4的衍生化峰1和峰2的质谱,来源于表达TE_EEI82564和CarB的重组大肠埃希氏菌菌株。衍生化剂是BSTFA+1%TMCS。
图6展示经BSTFA+1%TMCS衍生化的1,3-癸二醇的离子碎裂图案。
图7展示由表达TE_CAD63310和CarB的重组大肠埃希氏菌菌株产生的1,3-二醇(二醇)和脂肪醇(FALC)的组成。
以下缩写用于图8-11中:
FAS-脂肪酸生物合成/脂肪酸合酶
TE-硫酯酶
ACS-酰基CoA合酶
TL-3-酮酰基CoA硫解酶(可逆)
(S)3HACS-(S)-3-羟基-酰基CoA脱氢酶(可逆)
(S)2ECOH-(S)-2-烯酰基CoA水合酶/(S)-3-羟基酰基CoA脱水酶
CAR-羧酸还原酶
FAR-脂肪酰基CoA/ACP还原酶和形成脂肪醇的脂肪酰基CoA/ACP还原酶
ACR–酰基CoA还原酶
AAR-酰基ACP/CoA还原酶
图8描绘从酰基-ACP产生1,3脂肪二醇的生化途径。途径1使用例如TE、CAR和ADH等酶功能性产生1,3-二醇。途径2使用TE、ACS、ACR和ADH产生1,3-二醇。途径3使用AAR和ADH产生1,3-二醇。途径4使用FAR和ADH产生1,3-二醇。途径5使用FAR产生1,3-二醇。
图9描绘从酰基-CoA产生1,3脂肪二醇的生化途径。途径1使用例如TE、CAR和ADH等酶功能性产生1,3-二醇。途径2使用ACR和ADH产生1,3-二醇。途径3使用AAR和ADH产生1,3-二醇。途径4使用FAR和ADH产生1,3-二醇。途径5使用FAR产生1,3-二醇。
图10展示(R)-1,3脂肪二醇产生。途径1使用例如TE、CAR和ADH等酶功能性产生右手手性的1,3-二醇。途径2使用TE、ACR和ADH产生右手手性的1,3-二醇。途径3使用AAR和ADH产生右手手性的1,3-二醇。途径4使用FAR和ADH产生右手手性的1,3-二醇。途径5使用FAR产生右手手性的1,3-二醇。
图11展示(S)-1,3脂肪二醇产生。途径1使用例如TE、CAR和ADH等酶功能性产生左手手性的1,3-二醇。途径2使用ACR和ADH产生左手手性的1,3-二醇。途径3使用AAR和ADH产生左手手性的1,3-二醇。途径4使用FAR和ADH产生左手手性的1,3-二醇。途径5使用FAR产生左手手性的1,3-二醇。途径6使用TE、ACS、FadE和(S)2ECOH产生左手手性的1,3-二醇。途径7使用脂肪酸和ACS产生左手手性的1,3-二醇。途径8使用TE、ACS、TL和(S)3HACS产生左手手性的1,3-二醇。
发明详述
综述
一种新颖环保的产生脂肪二醇的方法的研发改善了此行业。所述方法容许从来源于可再生原料的简单碳源产生脂肪二醇,包括但不限于来自玉米、藤条、天然气或木质纤维素生物质的碳水化合物;废产物,例如城市固体废物、甘油、烟气、合成气、二氧化碳;或由例如生物质、天然气或其它含碳物质等有机物质的重整所产生的碳流。所述方法进一步容许通过光合生物,例如蓝藻细菌和藻类,从CO2和光产生脂肪二醇。此方法对于环境来说更佳,因为其不产生石油化学来源工艺所产生的毒性副产物。
更具体地说,本公开提供经工程化以将来源于可再生原料的简单碳源转化成脂肪二醇的重组微生物。1,3-二醇是作为无色无味的稳定化学实体的脂肪二醇的实例。预期微生物产生的1,3-二醇有许多工业应用,包括作为清洁剂、表面活性剂、乳化剂、软化剂、溶剂、塑料、香精、香料和生物活性化合物的组分。微生物产生的1,3-二醇还作为天然食物的代替物(或添加剂)用于食品工业,因为其容易代谢、无毒、不挥发,且能量密集,保存期长。
本公开的重组微生物用于产生脂肪二醇的发酵过程中。本文中,本公开涵盖微生物脂肪酸代谢及其中间物至1,3-二醇的转变。本公开的一个优点是生产方法更洁净,即采用简单发酵法。可再生原料的使用保护环境,因为其依赖于不消耗自然资源的可再生且可持续的原材料。工业废物(例如甘油)用作原料支持更好的废物管理和再循环。另一个优点是可制造新颖的工业目标产品,即具有选择性链长、手性且呈特定混合物或与衍生物组合的脂肪二醇组合物。
定义
如本文所用,术语“1,3脂肪二醇”或“1,3-二醇(1,3-diol)”或“1,3-二醇(1,3-dialcohol)”或“3-OH脂肪醇”或“3-羟基脂肪醇”或“1,3-二羟醇”或“1,3-脂肪族二醇”在本文中可互换使用,且是指具有至少5个碳的链长且经由脂肪酰基硫酯中间物从微生物脂肪酸代谢产生,并具有至少两个OH基团,即碳链1位的OH基团和3位的OH基团的化学实体。
如本文提及的“1,3-二醇”由重组微生物或重组微生物宿主细胞产生。
“1,3-二醇组合物”典型地至少包括与另一成分组合的1,3-二醇。
术语“酶分类(EC)号”是指表示特定多肽序列或酶的编号。EC号根据酶催化的反应将酶分类。EC号由国际生物化学与分子生物学联合会命名委员会(the nomenclaturecommittee of the international union of biochemistry and molecular biology,IUBMB)建立,其描述可在万维网上IUBMB酶命名网址获得。
术语“硫酯酶”是指特征为EC号3.1.2.14.或EC号3.1.1.5或EC号3.1.2.-的酶活性。
术语“羧酸还原酶(CAR)”是指特征为EC号6.2.1.3或EC号1.2.1.42或EC号1.2.99.6的酶活性。
术语“醛还原酶”与“醇脱氢酶”在本文中可互换使用且是指特征为EC号1.1.-.-.的酶活性。
术语“酰基-ACP还原酶(AAR)”是指特征为EC号1.2.1.80或EC号1.2.1.42的酶活性。
术语“乙酰基-CoA羧化酶”是指特征为EC号6.4.1.2的酶活性。
术语“登录号”和“NCBI登录号”和GenBank登录号”在本文中可互换使用且是指表示特定核酸序列的编号。此描述中论述的序列登录号是从美国国立卫生研究院(theNational Institutes of Health,U.S.A.)维护的NCBI(美国国家生物技术信息中心(National Center for Biotechnology Information))提供的数据库获得,以及从瑞士生物信息学研究所(the Swiss Institute of Bioinformatics)提供的the UniProtKnowledgebase(UniProtKB)和Swiss-Prot数据库(又称为UniProtKB登录号)获得。
如本文所用,术语“核苷酸”是指由杂环碱基、糖和一个或多个磷酸酯基组成的多核苷酸的单体单元。天然存在的碱基(鸟嘌呤(G)、腺嘌呤(A)、胞嘧啶(C)、胸腺嘧啶(T)和尿嘧啶(U))典型地是嘌呤或嘧啶的衍生物,不过应了解也包括天然与非天然存在的碱基类似物。天然存在的糖是戊糖(五碳糖)脱氧核糖(其形成DNA)或核糖(其形成RNA),不过应了解也包括天然与非天然存在的糖类似物。核酸典型地经由磷酸键连接以形成核酸或多核苷酸,不过本领域中已知许多其它的键(例如硫代磷酸酯、硼烷磷酸酯等等)。
如本文所用,术语“多核苷酸”是指核苷酸(RNA)或脱氧核糖核苷酸(DNA)的聚合物,其可以是单链或双链,且其可以含有非天然或改变的核苷酸。术语“多核苷酸”、“核酸序列”和“核苷酸序列”在本文中可互换使用,是指任何长度的核苷酸(RNA或DNA)的聚合形式。这些术语是指分子的一级结构,因此包括双链和单链DNA以及双链和单链RNA。所述术语包括由核苷酸类似物制成的RNA或DNA的类似物以及例如经修饰的多核苷酸作为同等物,不过不限于甲基化和/或封端多核苷酸。多核苷酸可呈任何形式,包括但不限于质粒、病毒、染色体、EST、cDNA、mRNA和rRNA。
术语“内源性多核苷酸”和“内源性DNA”和“内源性核酸序列”在本文中可互换使用且是指在宿主细胞内产生的DNA。
术语“外源性多核苷酸”和“外源性DNA”和“外源性核酸序列”在本文中可互换使用且是指在宿主细胞外产生的DNA。举例来说,来自宿主细胞A的基因可以插入宿主细胞B中。然而,源自宿主细胞A的基因可以操纵或修饰(在宿主细胞A内或外)并再插入同一宿主细胞A中。
术语“经修饰的多核苷酸”和“经修饰的DNA”和“经修饰的核酸序列”在本文中可互换使用且是指相对于原始或天然状态,已在一定形式上改变的DNA。此改变可影响DNA或其编码基因产物(例如多肽或蛋白质)的稳定性、表达、活性或功能。在一个实施方案中,编码多肽的表达增加。在另一个实施方案中,编码多肽的表达减少。在另一个实施方案中,编码多肽的表达缺乏。
如本文所用,术语“多肽”和“蛋白质”和“多肽序列”和“蛋白质序列”在本文中可互换使用且是指氨基酸残基的聚合物。术语“重组多肽”是指通过重组技术产生的多肽,其中一般编码所表达的蛋白质的DNA或RNA插入适合的表达载体中,随后表达载体用于转化宿主细胞,以产生所述多肽。
如本文所用,术语“同源性”和“同源”是指包含与对应多核苷酸或多肽序列至少约50%一致的序列的多核苷酸或多肽。优选地,同源多核苷酸或多肽具有与对应氨基酸序列或多核苷酸序列至少约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少约99%同源的多核苷酸序列或氨基酸序列。如本文所用,术语序列“同源性”与序列“一致性”可互换使用。本领域技术人员知道确定两个或更多个序列之间的同源性。简单地说,可以如下计算两个序列之间的“同源性”。为了最佳比较,将序列比对(例如间隙可以引入用于最佳比对的第一和第二氨基酸或核酸序列中的一者或两者中,且为了比较,可以忽略非同源序列)。在一优选实施方案中,为了比较而进行比对的第一序列的长度是第二序列长度的至少约30%、优选至少约40%、更优选至少约50%、甚至更优选至少约60%和甚至更优选至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%或约100%。接着比较第一和第二序列的对应氨基酸位置或核苷酸位置的氨基酸残基或核苷酸。当第一序列中的一个位置被与第二序列中对应位置相同的氨基酸残基或核苷酸占据时,分子在该位置一致。两个序列之间的同源性百分比是所述序列共享的一致位置数目的函数,考虑到为最佳比对两个序列需要引入的间隙数目和每个间隙的长度。两个序列之间的序列比较和同源性百分比的测定可以使用例如BLAST等数学算法完成(Altschul等人(1990)J.Mol.Biol.215(3):403-410)。两个氨基酸序列之间的同源性百分比也可以使用Needleman和Wunsch算法测定,该算法已经并入GCG软件包中的GAP程序中,使用Blossum 62矩阵或PAM 250矩阵和16、14、12、10、8、6或4的间隙权重和1、2、3、4、5或6的长度权重(Needleman和Wunsch,(1970)J.Mol.Biol.48:444-453)。两个核苷酸序列之间的同源性百分比也可以使用GCG软件包中的GAP程序测定,使用NWSgapdna.CMP矩阵和40、50、60、70或80的间隙权重和1、2、3、4、5或6的长度权重。本领域技术人员可以执行初始同源性计算并相应地校准算法参数。优选的一组参数(以及在从业者不确定哪些参数应该用来确定分子是否在权利要求书的同源性限制内的情况下应使用的参数)是Blossum 62评分矩阵,间隙罚分为12,间隙延伸罚分为4,且框移间隙罚分为5。生物技术领域中已知序列比对的其它方法(参见例如Rosenberg(2005)BMC Bioinformatics 6:278);Altschul等人(2005)FEBSJ.272(20):5101-5109)。
“内源性”多肽是指由重组细胞自其中工程化或衍生化的宿主细胞(例如亲本微生物细胞)的基因组编码的多肽。
“外源性”多肽是指并非由亲本或宿主微生物细胞(例如宿主细胞)的基因组原始编码的多肽。变异(即突变)多肽是外源性多肽的一实例。外源性多肽的另一实例是在天然细胞中存在,但为例如外源性多核苷酸表达等改变表达的结果的蛋白质(例如含有与原生基因一致但经工程化以在宿主细胞中过度表达的基因的载体或质粒;此类基因可任选地插入宿主DNA中)。
术语“异源”一般意指来源于不同物种或来源于不同生物体或来源于不同来源。如本文所用,其是指非天然存在于特定生物体中的核苷酸序列或多肽序列。异源表达意指蛋白质或多肽在通常不表达该蛋白质的细胞中表达。因而,异源意指转移蛋白质初始来源于与接受者不同的细胞类型或不同的物种或不同的来源。举例来说,植物细胞内源性的多核苷酸序列可以通过重组方法引入细菌宿主细胞,那么植物多核苷酸在重组细菌宿主细胞中是异源多核苷酸。外源性多肽的另一实例是在天然细胞中存在,但为例如异源多核苷酸表达等改变表达的结果的蛋白质(例如含有与原生基因一致但经工程化以在宿主细胞中过度表达的基因的载体或质粒;此类基因可任选地插入宿主DNA中)。
如本文所用,术语多肽的“片段”是指尺寸在四个氨基酸残基至整个氨基酸序列减去一个氨基酸残基范围内的全长多肽或蛋白质的较短部分。在本公开的某些实施方案中,片段是指多肽或蛋白质的一结构域的整个氨基酸序列(例如底物结合域或催化结构域)。
如本文所用,术语“突变诱发”是指使生物体的遗传信息以稳定的方式改变的一种方法。编码核酸序列的蛋白质的突变诱发产生突变蛋白质。突变诱发也指引起蛋白质活性改变的非编码核酸序列的变化。
如本文所用,术语“基因”是指编码RNA产物或蛋白质产物的核酸序列,以及影响RNA或蛋白质表达的可操作地连接的核酸序列(例如此类序列包括但不限于启动子或强化子序列)或影响RNA或蛋白质表达的可操作地连接的核酸序列编码序列(例如此类序列包括但不限于核糖体结合位点或翻译控制序列)。
本领域中已知表达控制序列且包括例如启动子、强化子、聚腺苷酸化信号、转录终止子、内部核糖体进入位点(IRES)等,其提供多核苷酸序列在宿主细胞中的表达。表达控制序列特异性地与参与转录的细胞蛋白质相互作用(Maniatis等人(1987)Science 236:1237-1245)。示例性表达控制序列描述于例如Goeddel,Gene Expression Technology:Methods in Enzymology,第185卷,Academic Press,San Diego,Calif.(1990)中。
术语“多个”是指数目为至少2个(例如多个多核苷酸序列意指至少两个多核苷酸序列)。
在本公开的方法中,表达控制序列可操作地连接于多核苷酸序列。“可操作地连接”意指当适当分子(例如转录活化因子蛋白)结合于表达控制序列时多核苷酸序列和表达控制序列以允许基因表达的方式连接。根据转录和解释的方向,可操作地连接的启动子位于所选多核苷酸序列的上游。可操作地连接的强化子可以位于所选多核苷酸的上游、内部或下游。
如本文所用,术语“载体”是指能够输送其连接的另一核酸(即多核苷酸序列)的核酸分子。一种类型适用载体是游离体(即能够染色体外复制的核酸)。适用的载体是能够自主复制和/或表达其连接的核酸的载体。能够指导其可操作地连接的基因的表达的载体在本文中称为“表达载体”。一般说来,重组DNA技术中应用的表达载体经常呈“质粒”形式,其一般是指呈载体形式,不结合于染色体的环状双链DNA环。术语“质粒”与“载体”在本文中可互换使用,因为质粒是载体最常用的形式。然而,还包括功能相等且随后在本领域中已知的表达载体的此类其它形式。在一些实施方案中,重组载体进一步包含可操作地连接于多核苷酸序列的启动子。在一些实施方案中,启动子是发育调节性、细胞器特异性、组织特异性、诱导性、组成性或细胞特异性启动子。重组载体典型地包含至少一种序列,包括(a)可操作地联接于多核苷酸序列的表达控制序列;(b)可操作地联接于多核苷酸序列的选择标记物;(c)可操作地联接于多核苷酸序列的标记物序列;(d)可操作地联接于多核苷酸序列的纯化部分;(e)可操作地联接于多核苷酸序列的分泌序列;以及(f)可操作地联接于多核苷酸序列的靶向序列。在某些实施方案中,核苷酸序列稳定地并入宿主细胞的基因组DNA中,且核苷酸序列的表达在调节启动子区域的控制下。本文中的表达载体包括本文中描述的多核苷酸序列,其呈适于该多核苷酸序列在宿主细胞中表达的形式。本领域技术人员应了解,表达载体的设计可取决于例如待转化的宿主细胞的选择、所需多肽的表达水平等因素。本文中描述的表达载体可以引入宿主细胞中以产生由如本文中描述的多核苷酸序列编码的多肽,包括融合多肽。例如大肠埃希氏菌等原核生物中基因编码多肽的表达最常用含有指导融合或非融合多肽表达的组成性或诱导性启动子的载体进行。融合载体添加许多氨基酸至在其中编码的多肽,通常添加至重组多肽的氨基或羧基端。此类融合载体典型地用于达成以下三个目的中的一个或多个:(1)增加重组多肽的表达;(2)增加重组多肽的可溶性;以及(3)通过充当亲和力纯化中的配体,帮助纯化重组多肽。经常,在融合表达载体中,蛋白裂解位点在融合部分与重组多肽的接合处引入。这能够在纯化融合多肽后将重组多肽与融合部分分离。在某些实施方案中,本公开的多核苷酸序列可操作地连接于来源于噬菌体T5的启动子。在某些实施方案中,宿主细胞是酵母细胞,且表达载体是酵母表达载体。在酵母酿酒酵母(S.cerevisiae)中表达的载体的实例包括pYepSec1(Baldari等人(1987)EMBO J.6:229-234)、pMFa(Kurjan等人(1982)Cell 30:933-943)、pJRY88(Schultz等人(1987)Gene 54:113-123)、pYES2(Invitrogen Corp.,San Diego,CA)和picZ(Invitrogen Corp.,SanDiego,CA)。在其它实施方案中,宿主细胞是昆虫细胞,且表达载体是杆状病毒表达载体。可用于在培养的昆虫细胞(例如Sf9细胞)中表达蛋白质的杆状病毒载体包括例如pAc系列(Smith等人(1983)Mol.Cell Biol.3:2156-2165)和pVL系列(Lucklow等人(1989)Virology170:31-39)。在又一个实施方案中,本文中描述的多核苷酸序列可使用哺乳动物表达载体在哺乳动物细胞中表达。原核与真核细胞的其它适合表达系统为本领域中所熟知;参见例如Sambrook等人,“Molecular Cloning:A Laboratory Manual,”第二版,Cold SpringHarbor Laboratory,(1989)。
如本文所用,“酰基-CoA”是指在烷基链的羰基碳与辅酶A(CoA)的4’-磷酸泛亚硫酰基部分的巯基之间形成的酰基硫酯,其具有式R-C(O)S-CoA,其中R是具有至少4个碳原子的任何烷基。
如本文所用,“酰基-ACP”是指在烷基链的羰基碳与酰基载体蛋白(ACP)的磷酸泛酰巯基乙氨基部分的巯基之间形成的酰基硫酯。磷酸泛酰巯基乙氨基部分在全酰基载体蛋白合酶(ACPS,一种使用辅酶A作为底物和磷酸泛酰巯基乙氨基供体的磷酸泛酰巯基乙氨基转移酶)的作用下在翻译后附接于ACP上的保守丝氨酸残基。在一些实施方案中,酰基-ACP是完全饱和酰基-ACP的合成中的中间物。在其它实施方案中,酰基-ACP是不饱和酰基-ACP的合成中的中间物。在一些实施方案中,碳链具有约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25或26个碳。这些酰基-ACP中的每一者是将其转变成脂肪酸衍生物的酶的底物。如技术人员显而易见,全ACP的4’-磷酸泛亚硫酰基部分来源于辅酶A。因此,利用酰基ACP作为底物的酶经常具有一些用于酰基CoA的活性,且利用酰基CoA作为底物的酶具有一些用于酰基ACP的活性。
如本文所用,术语“脂肪酸生物合成途径”意指产生脂肪酸、脂肪酸硫酯和/或其衍生物的生物合成途径。脂肪酸生物合成途径可包括具有除本文中论述的酶活性外的酶活性以产生具有所需特征的脂肪酸衍生物的其它酶或多肽。
如本文所用,术语“克隆”典型地是指遗传自单个共同祖先以及基本上与单个共同祖先一致的细胞或一组细胞,例如由单个细菌细胞产生的克隆菌落的细菌。
如本文所用,术语“培养物”典型地是指包含活细胞的液体培养基。在一个实施方案中,培养物包含在预先确定的培养基中在控制条件下复制的细胞,例如在包含选择碳源和氮的液体培养基中生长的重组宿主细胞的培养物。“培养(Culturing)”或“培养(cultivation)”是指重组宿主细胞群体在液体或固体培养基中在适合条件下生长。在特定实施方案中,培养是指底物经发酵而生物转变成最终产物。培养基为众所周知的,且此类培养基的个别组分可获自商业来源,例如DifcoTM和BBLTM商标。在一个非限制性实例中,水性培养基是包含氮、盐和碳的复杂来源的“丰富培养基”,例如YP培养基,包含每升此类培养基10g胨和10g酵母提取物。培养物的宿主细胞可另外根据美国专利5,000,000、5,028,539、5,424,202、5,482,846、5,602,030、WO 2010127318中描述的方法经工程化以有效吸收碳且使用纤维素材料作为碳源。另外,在一些实施方案中,宿主细胞经工程化以表达转化酶以便蔗糖可用作碳源。
如本文所用,术语“在有效表达基因工程化的多核苷酸序列的条件下”意指容许宿主细胞表达对应酶功能性以产生例如脂肪二醇等所需脂肪酸衍生物的任何条件。适合条件包括例如发酵条件。
术语“重组微生物”是指已经基因修饰或工程化,以使得相对于亲本细胞或原生宿主细胞,宿主细胞内的某些酶活性已经改变、添加和/或缺失的宿主细胞。基因修饰或基因工程化的宿主细胞是重组微生物的一个实例。因而,重组宿主细胞中例如酶等“蛋白质的活性水平变化或改变”是指相对于缺乏相同修饰的亲本或原生宿主细胞,所测定的活性的一个或多个特征的差异。典型地,在具有变化活性的重组宿主细胞与不具有该变化活性的对应野生型宿主细胞之间测定活性差异(例如相对于对应野生型宿主细胞,比较重组宿主细胞的培养物)。变化活性可以是例如以下各者的结果:重组宿主细胞表达的蛋白质的变化量(例如由于编码蛋白质的DNA序列的拷贝数增加或减少、编码蛋白质的mRNA转录物的数目增加或减少和/或蛋白质从mRNA的蛋白质翻译的量增加或减少);蛋白质结构的变化(例如一级结构的变化,例如引起底物特异性的变化的蛋白质编码序列的变化、观测到的动力学参数的变化);以及蛋白质稳定性的变化(例如蛋白质降解增加或减少)。在一些实施方案中,多肽是本文中描述的任何多肽的突变体或变异体。在某些情况下,本文中描述的多肽的编码序列为在特定宿主细胞中表达而密码子最佳化。举例来说,为在大肠埃希氏菌中表达,一个或多个密码子可以最佳化(如例如Grosjean等人(1982)Gene 18:199-209中所述)。在一个实施方案中,重组微生物产生例如脂肪酸衍生物(例如脂肪酸、脂肪醛、脂肪醇、脂肪二醇)等所需产物。在一特定实施方案中,重组微生物产生1,3-二醇。
如本文所用,术语“调节序列”典型地是指DNA中可操作地连接于编码蛋白质的DNA序列的最终控制蛋白质表达的碱基序列。调节序列的实例包括但不限于RNA启动子序列、转录因子结合序列、转录终止序列、转录调节子(例如强化子元件)、影响RNA稳定性的核苷酸序列以及翻译调节序列(例如核糖体结合位点(例如原核生物中夏因-达加诺尔序列(Shine-Dalgarno sequence)或真核生物中科扎克序列(Kozak sequence))、起始密码子、终止密码子)。
术语“表达水平改变”和“表达水平变化”可互换使用且意指在相同条件下与对应野生型细胞中的浓度相比,多核苷酸、多肽、代谢物或产物(例如脂肪酸衍生物)以不同浓度存在于经工程化的宿主细胞。脂肪酸衍生物的实例是脂肪酸、3-羟基脂肪酸、脂肪醛、3-羟基脂肪醛、脂肪醇、1,3脂肪二醇等等。
如本文所用,术语“滴度”是指每单位体积宿主细胞培养物产生的脂肪酸衍生物,例如脂肪二醇(例如1,3-二醇)的量,且一般以质量体积单位报道,例如10g/L。在一个实施方案中,滴度可指既定重组宿主细胞培养物产生的特定1,3-二醇或1,3-二醇组合。在另一个实施方案中,滴度也可指既定重组宿主细胞培养物产生的脂肪二醇组合物(例如1,3-二醇组合物)。
如本文所用,“宿主细胞产生的脂肪二醇(例如1,3-二醇)的产率”是指宿主细胞中输入碳源转变为产物(例如脂肪二醇)的效率,且在“质量产率”的情况下,以质量(产物)/质量(碳源)的百分比单位报道,例如30%质量产率将指30g产物由100g碳源产生;20%质量产率将指20g产物由100g碳源产生;10%质量产率将指10g产物由100g碳源产生等等。产率可指既定重组宿主细胞培养物产生的特定1,3-二醇或1,3-二醇组合。
如本文所用,术语“生产率”是指每单位体积宿主细胞培养物产生的脂肪二醇(例如1,3-二醇)或衍生物的量(例如以g/L/小时报道)。生产率可指既定重组宿主细胞培养物产生的特定1,3-二醇或1,3-二醇组合。
如本文所用,术语“葡萄糖利用率”意指每单位时间培养物使用的葡萄糖的量,以克/升/小时(g/L/小时)报道。
“原料”是用于制造产品或工业过程的原材料。“可再生原料”是来源于可再生材料,例如生物材料,例如植物物质,且可以由天然方式(例如玉米、藤条、木质纤维素生物质)或废产物(例如城市固体废物、甘油、游离脂肪酸、烟气或合成气;二氧化碳等等)替换的原材料。相比之下,“不可再生原料”是使用会消耗且不能再生的原材料(例如原油、煤、核燃料等等)。
如本文所用,术语“简单碳源”是指适用作供原核或简单真核细胞生长的燃料来源的基质或化合物。有资格作为简单碳源的来源可以呈多种形式,包括但不限于聚合物、碳水化合物、酸、醇、醛、酮、氨基酸、肽和气体(例如CO和CO2)。示例性简单碳源包括但不限于单糖,例如葡萄糖、果糖、甘露糖、半乳糖、木糖和阿拉伯糖;寡糖,例如寡聚果糖和寡聚半乳糖;聚糖,例如淀粉、纤维素、果胶和木聚糖;二糖,例如蔗糖、麦芽糖、纤维二糖和松二糖;纤维素材料和变体,例如半纤维素、甲基纤维素和羧甲基纤维素钠;饱和或不饱和脂肪酸、丁二酸酯、乳酸酯和乙酸酯;醇,例如乙醇、甲醇和丙醇;甘油,或其混合物。在一个实施方案中,简单碳源来源于玉米、甘蔗、高粱、甜菜、柳枝稷、青贮饲料、稻草、木材、纸浆、污水、垃圾、纤维素城市废物、烟气、合成气或二氧化碳。简单碳源还可以为光合作用产物,例如葡萄糖。在一个实施方案中,简单碳源来源于可再生原料。在一特定实施方案中,简单碳源来源于可再生材料,例如来自玉米、藤条或木质纤维素生物质的碳水化合物;或来自废产物,例如甘油、脂肪酸、烟气或合成气;或来自例如生物质等有机材料的重整;或来自光合作用固定的二氧化碳。在另一个实施方案中,简单碳源选自葡萄糖、果糖、甘露糖、半乳糖、木糖、阿拉伯糖、寡聚果糖、寡聚半乳糖、淀粉、纤维素、果胶、木聚糖、蔗糖、麦芽糖、纤维二糖、松二糖、半纤维素、甲基纤维素、羧甲基纤维素钠、丁二酸酯、乳酸酯、乙酸酯、乙醇、甲醇、甘油及其混合物。在某些实施方案中,简单碳源来源于生物质。生物质的一个示例性来源是植物物质或植被,例如玉米、甘蔗或柳枝稷。生物质的另一个示例性来源是代谢废物,例如动物物质(例如牛粪)。生物质的其它示例性来源包括藻类及其它海生植物。生物质还包括来自工业、农业、林业和家庭的废产物,包括但不限于发酵废物、青贮饲料、稻草、木材、污水、垃圾、纤维素城市废物和吃剩的食物。术语“生物质”还指例如碳水化合物(例如单糖、二糖或聚糖)等碳源。
如本文所用,关于产物(例如1,3-二醇或衍生物)的术语“分离”是指产物与细胞组分、细胞培养基或化学或合成前驱物分离。本文中描述的方法产生的脂肪二醇(例如1,3-二醇)和相关组合物可以相对不混合于发酵肉汤以及细胞质中。因此,脂肪二醇组合物可以在细胞内或细胞外集中在有机相中。在一个实施方案中,1,3-二醇组合物在细胞外集中。
如本文所用,术语“纯化(purify、purified或purification)”意指通过例如分离(isolation)或分离(separation),将分子自其环境去除或分离。“基本上纯化”分子为至少约60%(例如至少约70%、至少约75%、至少约85%、至少约90%、至少约95%、至少约97%、至少约99%)不含其相关的其它组分。如本文所用,这些术语还指从样品去除污染物。举例来说,污染物的去除可以引起样品中脂肪二醇的百分比增加。举例来说,当1,3-二醇在重组宿主细胞中产生时,1,3-二醇通过去除宿主细胞蛋白质而纯化。纯化后,样品中1,3-二醇的百分比增加。术语“纯化(purify、purified和purification)”是无需绝对纯度的相对术语。因此,举例来说,当1,3-二醇在重组宿主细胞中产生时,纯化的1,3-二醇是基本上与其它细胞组分(例如核酸、多肽、脂质、碳水化合物或其它烃)分离的1,3-二醇。
如为了本说明书和权利要求书而用的术语“在体内产生脂肪二醇(例如1,3-二醇)”意指在活和/或重组和/或基因修饰的宿主细胞中从简单碳源产生脂肪二醇,其中简单碳源添加至发酵肉汤中以便宿主细胞在发酵期间可吸收并代谢简单碳源。在一个实施方案中,简单碳源来源于可再生原料。
将宿主细胞菌株工程化用于筛选
脂肪酸生物合成是细菌生物合成机制的最保守系统之一。脂肪酸合酶(FAS)多酶复合物存在于所有细菌和真核生物中。大多数FAS相关基因是细胞生长和存活所需的。真核生物和细菌FAS驱动基本上相同类型的生物化学转化。在真核生物中,FAS称为FAS I,且其大部分催化结构域由一个多肽链(不可解离)编码。在例如细菌等原核生物中,FAS称为FASII,且其个别酶和载体蛋白由编码离散(可解离)蛋白质的单独基因编码。
在FAS途径中酰基载体蛋白(ACP)与酶一起控制原生生物体中产生的脂肪酸的长度、饱和度和分支。此途径中的步骤由脂肪酸生物合成(FAB)和乙酰基-CoA羧化酶(ACC)基因家族的酶催化。举例来说,可以包括在工程化FAS途径的酶包括乙酰基-CoA羧化酶(例如AccABCD、丙二酰基-CoA:ACP酰基转移酶(例如FabD)、3-酮酰基-ACP合酶III(例如FabH)、3-酮酰基-ACP还原酶(例如FabG)、3-羟基酰基-ACP脱水酶/异构酶(例如FabA)、3-羟基酰基-ACP脱水酶(例如FabZ)、反式-2-烯酰基-ACP还原酶(例如FabI或fabL或fabK)、反式-2-烯酰基-ACP异构酶(例如FabM)、3-酮酰基-ACP合酶I(例如FabB)和3-酮酰基-ACP合酶II(例如FabF)。取决于所需产物,可减弱或过度表达这些基因中的一个或多个。因而,宿主细胞经工程化以通过馈入可以来源于可再生原料的简单碳源增加脂肪酸衍生物(例如脂肪二醇、脂肪醇)以及脂肪酸衍生物中间物(例如脂肪醛)的产生。本文中,主要目标是增加调节例如脂肪二醇等脂肪酸衍生物产生的关键控制酶的活性,以将菌株转变成产生脂肪二醇的微生物工厂。在一个实施方案中,菌株产生脂肪二醇,例如1,3-二醇。在另一个实施方案中,菌株产生脂肪二醇,例如1,3-二醇,以及脂肪醇。在另一个实施方案中,菌株经进一步修饰,使得尤其酮酰基-ACP还原酶活性增加和/或3-羟基酰基-ACP脱水酶活性降低,使得1,3脂肪二醇产生增加。
宿主细胞预先经工程化以增加其它脂肪酸衍生物,包括脂肪酸甲酯(FAME)、脂肪酸乙酯(FAEE)和脂肪醇(FALC)(参见例如美国专利No.8,283,143,以引用的方式并入本文中)。如本领域技术人员所了解,脂肪酸合成还可以通过使用非酰基ACP依赖性脂肪酸生物合成伸长酰基CoA来进行。负责对应脂肪酸生物合成反应、缩合、还原、脱水、还原等的FAS酶还可以用于合成酰基硫酯,其可以用作产生包括但不限于脂肪酸、脂肪醛、脂肪醇及其3-羟基衍生物(包括1,3脂肪二醇)在内的脂肪酸衍生物的底物。如本领域技术人员所知,负责脂肪酸氧化的生物化学反应(β-氧化循环)可以反过来起作用以支持脂肪酸硫酯的合成。这些酰基硫酯可以用作产生包括但不限于脂肪酸、脂肪醛、脂肪醇及其3-羟基衍生物(包括1,3脂肪二醇)在内的脂肪酸衍生物的底物。此外,在一些生物体中,脂肪酸生物合成可以在无ACP下发生,例如通过合成酰基CoA(参见例如美国专利申请公布No.US 2014/0051136A1;美国专利申请公布No.US 2014/0273114A1;以及Dellomonaco等人(2011)Nature 476(7360):355-9)。在一个方面,这些多种且不同FAS系统的组分可以在相同细胞中共同表达,以协同工作,产生脂肪酰基硫酯和衍生物,包括但不限于脂肪酸、脂肪醛、脂肪醇及其3-羟基衍生物(包括1,3脂肪二醇)。
手性分子
如果分子可以呈彼此不可重叠镜象的立体异构体(即对映异构体)存在,那么称该分子是手性的。此具有重大意义,因为生物体对特定分子的反应经常取决于该分子与生物体中受体分子上特定位点配合的方式。包括手性醇和二醇在内的手性分子是合成例如药物、营养物及其它活性物质等某些化合物的构筑嵌段。在药物和营养物应用中,需要知道哪个对映异构体是活性对映异构体且与预期受体配合。
一种获得呈纯活性异构体形式的化合物的方式是通过采用例如微生物等生物体产生该化学物质,因为生物体中生物分子的产生是立体特异性的(即其产生特异性立体异构体)。举例来说,氨基酸、维生素和激素是在糖发酵期间通过酵母天然产生且可以从其中收获。本领域技术人员了解作为手性催化剂的酶的特性,且对对映异构体纯的药物的需求增加燃起了对用于合成精细化学品的酶的兴趣。与经由生物体产生手性分子对比,当通过化学程序制备手性分子时,获得对映异构体的混合物(即外消旋混合物)。
对映异构体分析的当前方法包括例如旋光测定法、核磁共振、同位素稀释、量热法和酶技术等非色谱技术。这些技术需要纯样品,且不分离对映异构体。对映异构体的定量(不需要纯样品)和分离可以通过手性色谱法,例如气相色谱法(GC)或高效液相色谱法(HPLC),使用手性柱同时进行(参见Stereochemistry of Organic Compounds,ErnestL.Elil/Sanuel H.Wilen,1994,John Wiley&Sons,Inc.)。生物催化剂可用于制备手性化合物且产物的手性纯度可以使用例如手性HPLC或LC/MS等手性色谱法鉴别(参见美国专利申请公布No.US2008/0248539A1和US2013/0052699A1)。
3-羟基脂肪酸衍生物的手性
3-羟基脂肪酸衍生物(例如3-羟基脂肪酸、3-羟基脂肪酸酯、3-羟基脂肪醛、3-羟基脂肪醇等等)的一独特方面是每个分子都是手性的。3-羟基官能团是立体中心,提供每种化合物的手性点。手性可以是界定包括但不限于聚合物性能、生物活性、药物效力等分子应用的一种适用的分子属性。3-羟基脂肪酸衍生物的立体异构体取决于产生其的脂肪酸生物合成(FAS)的选择性。通过操纵哪些FAS酶负责3-羟基脂肪酸衍生物合成,可以控制所得3-羟基脂肪族衍生物的手性。举例来说,采用天然大肠埃希氏菌FAS用于1,3脂肪二醇生物合成将产生(R)-1,3脂肪二醇,其手性中心由大肠埃希氏菌中FabG催化(及其它微生物中的同源物)的形成(R)-3-羟基酰基ACP的3-酮酰基-ACP还原酶的活性建立。(R)-3-羟基酰基ACP是醇生物合成多肽的底物,包括但不限于图10中途径1-5中所示的多肽,将其转变成(R)-1,3脂肪二醇。此外,(S)-3-羟基酰基CoA是通过β-氧化途径降解脂肪酸中的中间物。游离脂肪酸通过酰基-CoA合酶转变为酰基-CoA,由大肠埃希氏菌中FadD及其它微生物中的同源物催化;通过脂肪酰基-CoA脱氢酶氧化为反式-2-烯酰基-CoA,由大肠埃希氏菌中FadE及其它微生物中的同源物催化;接着通过2-反式-烯酰基-CoA水合酶/(S)-3-羟基-酰基-CoA脱水酶水合为(S)-3-羟基-酰基-CoA,由大肠埃希氏菌中FadB及其它微生物中的同源物催化;接着通过3-酮-酰基-CoA脱氢酶进一步氧化为3-酮-酰基-CoA,也由大肠埃希氏菌中FadB及其它微生物中的同源物催化;最后通过3-酮酰基-CoA硫解酶硫解为酰基-CoA和乙酰基-CoA,由大肠埃希氏菌中FadA及其它微生物中的同源物催化。例如通过大肠埃希氏菌FadB中组氨酸450突变(或不同微生物中或来自不同微生物的功能同源物),在β-氧化的(S)-3-羟基-酰基-CoA脱氢酶活性中选择性分裂的菌株将在提供游离脂肪酸时积累(S)-3-羟基-酰基CoA(图11中的途径6和7)。组氨酸450是与来自大肠埃希氏菌的脂肪酸氧化的多酶复合物的大α-次单元有关的L-3-羟基酰基辅酶A脱氢酶的催化残基(参见He等人(1996)Biochemistry35(29):9625-9630)。(S)-3-羟基-酰基CoA接着可以通过形成脂肪醇的多肽(例如图11中途径1-5中描述的多肽)的作用转变为(S)-1,3脂肪二醇。游离脂肪酸可以提供至细胞表面(图11中途径7),或可例如通过酰基ACP由硫酯酶水解在细胞内产生(图11中途径6)。在一个实施方案中,以上反应中的酰基CoA中间物通过3-酮酰基-CoA硫解酶伸长为3-酮酰基-CoA(参见图11中途径8),由大肠埃希氏菌中FadA及其它微生物中的同源物催化;接着由FadB的突变体还原,突变体在其水合酶/脱水酶活性上选择性分裂(例如通过大肠埃希氏菌FadB(或相关酶中其同源物)中Glu 119突变)。此将引起(S)-3-羟基酰基-CoA积累,接着其通过形成脂肪二醇的多肽,例如图11中途径1-5中所示的多肽,转变为(S)-1,3脂肪二醇。大α-次单元的谷氨酸-119是由来自大肠埃希氏菌的脂肪酸氧化的多酶复合物催化的2-反式-烯酰基-辅酶A的水合中的催化基础(参见He等人(1997)Biochemistry 36(36):11044-11049)。大α-次单元的谷氨酸-139是由来自大肠埃希氏菌的脂肪酸氧化的多酶复合物催化的D-与L-3-羟基酰基-辅酶A的脱水中而非δ3,δ2-烯酰基-辅酶A的异构化中的催化基础(参见Yang等人(1995)Biochemistry 34(19):6441-6447)。在另一个实施方案中,以上反应中的酰基CoA中间物通过3-酮酰基-CoA硫解酶伸长为3-酮酰基CoA,由大肠埃希氏菌中FadA及其它微生物中的同源物催化;接着由(S)-3-羟基酰基-CoA脱氢酶(例如来自EC 1.1.1.35)还原(图11途径8)。此将引起(S)-3-羟基酰基CoA积累,接着其通过形成脂肪二醇的多肽,例如图11中途径1-5中所示的多肽,转变为(S)-1,3脂肪二醇。
为将宿主细胞工程化以表达某些酶功能性(参见以下表1),可对宿主细胞进行基因修饰。在一些实施方案中,多核苷酸(或基因)序列借助于包括可操作地连接于多核苷酸序列的启动子的重组载体提供给宿主细胞。在某些实施方案中,启动子是发育调节性、细胞器特异性、组织特异性、诱导性、组成性或细胞特异性启动子。在一些实施方案中,重组载体包括至少一种选自以下的序列:可操作地联接于多核苷酸序列的表达控制序列;可操作地联接于多核苷酸序列的选择标记物;可操作地联接于多核苷酸序列的标记物序列;可操作地联接于多核苷酸序列的纯化部分;可操作地联接于多核苷酸序列的分泌序列;以及可操作地联接于多核苷酸序列的靶向序列。本文中描述的表达载体包括呈适于多核苷酸序列在宿主细胞中表达的形式的多核苷酸序列。本领域技术人员应了解,表达载体的设计可取决于例如待转化的宿主细胞的选择、所需多肽的表达水平等因素。本文中描述的表达载体可以引入宿主细胞中以产生由如上所述(上文)的多核苷酸序列编码的多肽,包括融合多肽。例如大肠埃希氏菌等原核生物中基因编码多肽的表达最常用含有指导融合或非融合多肽表达的组成性或诱导性启动子的载体进行。融合载体添加许多氨基酸至在其中编码的多肽,通常添加至重组多肽的氨基或羧基端。此类融合载体典型地用于达成包括以下的三个目的中的一个或多个:增加重组多肽的表达;增加重组多肽的可溶性;以及通过充当亲和力纯化中的配体,帮助纯化重组多肽。经常,在融合表达载体中,蛋白裂解位点在融合部分与重组多肽的接合处引入。这容许在纯化融合多肽后将重组多肽与融合部分分离。此类酶的实例及其同源识别序列包括因子Xa、凝血酶和肠激酶。示例性融合表达载体包括pGEX载体(Pharmacia Biotech,Inc.,Piscataway,NJ;Smith等人(1988)Gene 67:31-40)、pMAL载体(New England Biolabs,Beverly,MA)和pRITS载体(Pharmacia Biotech,Inc.,Piscataway,N.J.),其分别将谷胱甘肽S-转移酶(GST)、麦芽糖E结合蛋白或蛋白A与标靶重组多肽融合。
诱导性非融合大肠埃希氏菌表达载体的实例包括pTrc载体(Amann等人(1988)Gene 69:301-315)和pET 11d载体(Studier等人,Gene Expression Technology:Methodsin Enzymology 185,Academic Press,San Diego,Calif.(1990)60-89)。标靶基因从pTrc载体的表达依赖于宿主RNA聚合酶从杂交trp-lac融合启动子的转录。标靶基因从pET 11d载体的表达依赖于由共同表达的病毒RNA聚合酶介导的从T7gn10-lac融合启动子(T7gn1)的转录。此病毒聚合酶由例如BL21(DE3)或HMS174(DE3)等宿主菌株在lacUV 5启动子的转录控制下从具有T7gn1基因的固有λ前噬菌体供应。原核与真核细胞的适合表达系统为本领域中所熟知(参见例如Sambrook等人(1989)Molecular Cloning:A Laboratory Manual,第二版,Cold Spring Harbor Laboratory)。诱导性非融合大肠埃希氏菌表达载体的实例包括pTrc载体(Amann等人(1988)Gene 69:301-315)和PET 11d载体(Studier等人(1990)GeneExpression Technology:Methods in Enzymology 185,Academic Press,San Diego,CA,第60-89页)。在某些实施方案中,本公开的多核苷酸序列可操作地连接于来源于噬菌体T5的启动子。在一个实施方案中,宿主细胞是酵母细胞。在此实施方案中,表达载体是酵母表达载体。载体可以经由多种领域公认的用于将外来核酸(例如DNA)引入宿主细胞中的技术引入原核或真核细胞。适合转化或转染宿主细胞的方法可见于例如Sambrook等人(上文)。为稳定转化细菌细胞,已知(取决于使用的表达载体和转化技术)某一部分的细胞将吸收并复制表达载体。为了鉴别和选择这些转化体,可以将编码选择性标记物(例如对抗生素的抗性)的基因与相关基因一起引入宿主细胞。选择性标记物包括赋予对例如但不限于氨苄青霉素(ampicillin)、卡那霉素(kanamycin)、氯霉素(chloramphenicol)或四环素(tetracycline)的抗性的标记物。可以将编码选择性标记物的核酸在与编码本文中描述的多肽相同的载体上引入宿主细胞中或可以在分开载体上引入。可以通过在适当的选择药物存在下生长来鉴别经引入的核酸稳定转化的细胞。如本文中描述的工程化或重组宿主细胞是用于产生例如脂肪二醇组合物等脂肪酸衍生物组合物的细胞。在本文中描述的本公开的任何方面中,宿主细胞可以选自真核生物植物、细菌、藻类、蓝细菌、绿色硫细菌、绿色非硫细菌、紫色硫细菌、紫色非硫细菌、嗜极菌、酵母、真菌、其工程化生物体或合成生物体。在一些实施方案中,宿主细胞为光依赖性的或固定碳。在一些实施方案中,宿主细胞具有自给营养活性。如本文中描述,各种宿主细胞可用于产生脂肪二醇。
本公开的宿主细胞或微生物包括可以基因工程化或修饰以含有变化,从而测试特定酶活性的效率的宿主株系或宿主细胞。各种任选的遗传操纵和变化在宿主细胞之间可互换使用,取决于何种原生酶途径存在于原始宿主细胞中。宿主菌株可以涵盖许多遗传变化,以测试特定变量,包括但不限于培养条件,包括发酵组分、碳源(例如原料)、温度、压力、减少的培养污染条件和氧含量。
在一个实施方案中,宿主菌株涵盖参与脂肪酸β-氧化和/或噬菌体附着位点的一种或多种酶的任选的减弱或缺失。这些遗传修饰被设计成能在细胞内降解脂肪酸并增加对噬菌体的抗性。在一个实施方案中,宿主菌株是大肠埃希氏菌,且遗传修饰是fadE和/或fhuA的减弱或缺失。酰基-CoA脱氢酶(大肠埃希氏菌中的FadE)是一种对于代谢脂肪酸来说重要的酶。其催化脂肪酸降解中的第二步(β-氧化),其为脂肪酸硫酯代谢(酰基-CoA)成乙酰基-CoA分子和NAD(P)H的过程。更具体地说,细菌中脂肪酸降解的β-氧化循环的第二步是酰基-CoA氧化成2-烯酰基-CoA,由FadE催化。当大肠埃希氏菌或其它细菌缺乏或FadE或脂肪酰基CoA脱氢酶减弱时,其几乎不能作为碳源在脂肪酸上生长。不能利用任何链长的脂肪酸符合所报道的fadE株系表现型,即其中FadE功能被破坏的fadE突变株。fadE基因可以任选地敲除或减弱以确保可作为脂肪酸衍生物途径中的中间物的酰基-CoA可以积累在细胞中,使得所有酰基-CoA可以有效地转变为脂肪酸衍生物。然而,在非限制性条件下当糖用作碳源时,fadE减弱可为任选的,因为在此类条件下FadE的表达可能受抑,因此FadE可以仅少量存在,而无法与酯合酶或用于酰基-CoA底物的其它酶有效竞争。在这些情况下,认为FadE由于分解代谢物抑制而受抑。大肠埃希氏菌和许多其它微生物更喜欢消耗糖而非脂肪酸,因此当两个来源都可获得时,由于fad调节子的抑制,预期糖将首先被消耗(参见D.Clark,JBacteriol.(1981)148(2):521-6)。此外,糖的缺乏和脂肪酸的存在诱发FadE表达。酰基-CoA中间物可不再属于β-氧化途径,因为fad调节子(包括FadE)表达的蛋白质将上调并将有效竞争酰基-CoA。因此,将fadE基因敲除或减弱可为有益的。因为碳源可基于糖,所以任选地将FadE减弱。
举例来说,在大肠埃希氏菌中,fadE基因(编码酰基-CoA脱氢酶)或fadD基因(编码酰基-CoA合成酶)可以缺失。此类菌株不能降解脂肪酸或只能很差地降解,因此,细胞内脂肪酸的可用性增加。接着此类脂肪酸可用于增加转变成例如脂肪酸衍生物等产物。脂肪酸还可以通过使例如fadA或fadB等其它脂肪酸降解酶缺失而可获得。这些基因中任一者的缺失是任选的,且当游离脂肪酸是外来供应或是产物途径的中间物时可以执行。表1(下文)提供代谢途径内酶活性的综合列表,包括可以减弱以增加宿主菌株中脂肪酸的可用性的各种脂肪酸降解酶。
大肠埃希氏菌中,基因fhuA编码TonA蛋白质,该蛋白质是大肠埃希氏菌外膜中的能量耦合转运体和受体(V.Braun(2009)J Bacteriol.191(11):3431–3436)。其缺失是任选的。fhuA缺失容许细胞变得对噬菌体攻击更具抗性,噬菌体攻击在商业发酵中可为有害的。因此,需要在发酵操作期间可能遭受潜在污染的宿主细胞中使fhuA缺失。类似地,其它生物体以及其它噬菌体附着位点中的同源蛋白质是为提高噬菌体抗性而进行缺失的潜在候选者。
在另一个实施方案中,宿主菌株(上文)还涵盖包括fadR、fabA、fabD、fabG、fabH、fabV和/或fabF在内的一个或多个以下基因的任选的过度表达。此类基因的实例是来自大肠埃希氏菌的fadR、来自鼠伤寒沙门氏菌(Salmonella typhimurium)的fabA(NP_460041)、来自鼠伤寒沙门氏菌的fabD(NP_460164)、来自鼠伤寒沙门氏菌的fabG(NP_460165)、来自鼠伤寒沙门氏菌的fabH(NP_460163)、来自霍乱弧菌(Vibrio cholera)的fabV(YP_001217283)以及来自丙酮丁醇棱菌(Clostridium acetobutylicum)的fabF(NP_350156)。编码脂肪酸生物合成中酶和调节子的这些基因中一或多者的过度表达可以足以增加各培养条件下包括脂肪醛在内的脂肪酸衍生物中间物以及例如脂肪二醇等最终产物的滴度。
在一个实施方案中,大肠埃希氏菌菌株用作产生脂肪二醇的宿主细胞。这些宿主细胞可以包括一种或多种生物合成基因(即编码脂肪酸生物合成中酶和调节子的基因)的任选的过度表达,该过度表达可以进一步增加或增强包括但不限于fadR、fabA、fabD、fabG、fabH、fabV和/或fabF的各培养条件下脂肪酸衍生物中间物(例如脂肪醛)以及最终产物(例如脂肪二醇、脂肪醇)的滴度。遗传变化的实例包括来自大肠埃希氏菌的fadR、来自鼠伤寒沙门氏菌的fabA(NP_460041)、来自鼠伤寒沙门氏菌的fabD(NP_460164)、来自鼠伤寒沙门氏菌的fabG(NP_460165)、来自鼠伤寒沙门氏菌的fabH(NP_460163)、来自霍乱弧菌的fabV(YP_001217283)以及来自丙酮丁醇棱菌的fabF(NP_350156)。在一些实施方案中,运载这些生物合成基因的合成操纵子可以工程化且在细胞中表达以测试各培养条件下的脂肪酸衍生物中间物过度表达和/或进一步增强脂肪二醇产生。此类合成操纵子含有一种或多种生物合成基因。举例来说,ifab138操纵子是一种经工程化的操纵子,其含有任选的脂肪酸生物合成基因,包括来自霍乱弧菌的fabV、来自鼠伤寒沙门氏菌的fabH、来自鼠伤寒沙门氏菌的fabD、来自鼠伤寒沙门氏菌的fabG、来自鼠伤寒沙门氏菌的fabA和/或来自丙酮丁醇棱菌的fabF,所述基因可用于促进脂肪酸衍生物和中间物的过度表达以测试特定培养条件。此类合成操纵子的一个优点是脂肪酸衍生物产生速率(例如脂肪酸、脂肪醛、脂肪醇、脂肪二醇等)可在含有其的细胞中进一步增加或增强。
在一些实施方案中,用于产生酰基硫酯(例如酰基-CoA或酰基-ACP)和生物合成酶(例如TE、CAR、AR、ADH、ACC、AAR、FAR、ACR;又见图1和3以及图8-11)的宿主细胞或微生物将进一步表达包涵可以增强一种或多种特定脂肪酸衍生物(例如脂肪酸、3-羟基脂肪酸、脂肪醇、1,3脂肪二醇、脂肪醛、3-羟基脂肪醛等)产生的某些酶活性的基因。在一个实施方案中,宿主细胞具有用于产生脂肪酸和3-羟基脂肪酸的硫酯酶(TE)活性(EC 3.1.2.-或EC3.1.2.14或EC 3.1.1.5),其可以通过基因过度表达而增加。在另一个实施方案中,宿主细胞具有用于产生脂肪醛和/或3-羟基脂肪醛的硫酯酶(TE)活性(EC 3.1.2.-或EC 3.1.2.14或EC 3.1.1.5)和羧酸还原酶(CAR)(EC 6.2.1.3或EC 1.2.1.42或EC 1.2.99.6)活性。在另一个实施方案中,宿主细胞具有用于产生脂肪醇和/或脂肪二醇的硫酯酶(TE)活性(EC3.1.2.-或EC 3.1.2.14或EC 3.1.1.5)和羧酸还原酶(CAR)活性(EC 6.2.1.3或EC1.2.1.42或EC 1.2.99.6)和醇脱氢酶(ADH)/醛还原酶(AR)活性(EC 1.1.1.-)。在另一个实施方案中,宿主细胞具有用于产生脂肪醛和/或3-羟基-脂肪醛的酰基-ACP还原酶(AAR)活性(EC 1.2.1.80或EC 1.2.1.42)。在另一个实施方案中,宿主细胞具有用于产生脂肪醇和/或脂肪二醇的酰基-ACP还原酶(AAR)活性(EC 1.2.1.80或EC 1.2.1.42)和醇脱氢酶(ADH)/醛还原酶(AR)活性(EC 1.1.1.-)。基因组合可以通过微生物相应地工程化而过度表达或表达不足。在一个实施方案中,一个或多个过度表达基因是内源性的。在另一个实施方案中,一个或多个过度表达基因是外源性的。
在替代实施方案中,宿主细胞具有用于产生脂肪醇的酰基-ACP还原酶(AAR)活性(EC 1.2.1.80或EC 1.2.1.42)和/或酰基ACP/酰基CoA还原酶(AAR/ACR)活性(EC 1.2.1.80或EC 1.2.1.42或EC1.2.1.50)和/或醇脱氢酶活性(E.C.1.1.-.-.)和/或形成脂肪醇的酰基-CoA/Acyl ACP还原酶(FAR)活性(EC 1.1.1.-)和/或羧酸还原酶(CAR)活性(EC 6.2.1.3或EC 1.2.1.42或EC 1.2.99.6)和/或硫酯酶(TE)活性(EC 3.1.2.-或EC 3.1.2.14或EC3.1.1.5)。在其它替代实施方案中,宿主细胞具有用于产生脂肪醇的酰基-CoA还原酶活性(EC1.2.1.50)和酰基-CoA合酶(FadD)活性(EC 2.3.1.86)和硫酯酶(TE)活性(EC 3.1.2.-或EC 3.1.2.14或EC 3.1.1.5)。微生物和微生物细胞中这些替代酶活性的表达由以引用的方式并入本文中的美国专利号8,097,439、8,110,093、8,110,670、8,183,028、8,268,599、8,283,143、8,232,924、8,372,610和8,530,221教示。在其它实施方案中,用于产生酰基-ACP和/或酰基-CoA及其它生物合成酶的宿主细胞或微生物将包括某些天然酶活性,所述酶活性上调或过度表达以产生一种或多种特定脂肪酸衍生物,例如脂肪醛和/或脂肪醇和/或脂肪二醇。在一个实施方案中,宿主细胞具有用于产生脂肪酸的天然硫酯酶(TE)活性,其可以通过过度表达硫酯酶基因而增加。
本公开包括表达编码生物合成酶(上文)的基因的宿主菌株或微生物。重组宿主细胞产生脂肪酸衍生物中间物,例如脂肪醛,和脂肪酸衍生物最终产物,例如脂肪醇和/或脂肪二醇及其组合物和掺合物。脂肪酸衍生物最终产物典型地从培养基回收和/或从宿主细胞分离。在一个实施方案中,脂肪二醇和/或脂肪醇从培养基(细胞外)回收。在另一个实施方案中,脂肪二醇和/或脂肪醇从宿主细胞(细胞内)分离。在另一个实施方案中,脂肪二醇和/或脂肪醇从培养基回收以及从宿主细胞分离。在另一个实施方案中,脂肪二醇和/或脂肪醇是细胞外的且与宿主细胞缔合并从宿主细胞分离。宿主细胞产生的脂肪二醇组合物可以使用本领域中已知的例如GC-FID等方法分析,以确定特定脂肪二醇的分配以及脂肪二醇组合物的组分的链长和饱和度。
用作微生物(例如微生物细胞)的宿主细胞的实例包括但不限于来自以下种类的细胞:埃希氏菌属(Escherichia)、芽孢杆菌属(Bacillus)、乳酸杆菌(Lactobacillus)、单胞发酵菌属(Zymomonas)、红球菌属(Rhodococcus)、假单胞细菌属(Pseudomonas)、曲霉属(Aspergillus)、木霉属(Trichoderma)、链孢霉属(Neurospora)、镰刀霉属(Fusarium)、腐质霉属(Humicola)、根毛霉属(Rhizomucor)、克卢费氏酵母属(Kluyveromyces)、毕赤氏酵母属(Pichia)、毛霉属(Mucor)、毁丝霉属(Myceliophtora)、青霉属(Penicillium)、显革菌属(Phanerochaete)、侧耳属(Pleurotus)、栓菌属(Trametes)、聚球藻属(Synechococcus)、集胞藻属(Synechocystis)、乳球菌属(Lactococcus)、金孢子菌属(Chrysosporium)、酵母属(Saccharomyces)、窄食单胞菌属(Stenotrophamonas)、裂殖酵母属(Schizosaccharomyces)、耶氏酵母属(Yarrowia)或链霉属(Streptomyces)。在一些实施方案中,宿主细胞是革氏阳性细菌细胞。在一些实施方案中,宿主细胞是革氏阴性细菌细胞。在一些实施方案中,宿主细胞是大肠埃希氏菌细胞。在一些实施方案中,宿主细胞是大肠埃希氏菌B细胞、大肠埃希氏菌C细胞、大肠埃希氏菌K细胞或大肠埃希氏菌W细胞。在其它实施方案中,宿主细胞是迟缓芽胞杆菌(Bacillus lentus)细胞、短芽孢杆菌(Bacillusbrevis)细胞、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)细胞、地衣芽孢杆菌(Bacillus lichenoformis)细胞、嗜碱芽孢杆菌(Bacillus alkalophilus)细胞、凝结芽孢杆菌(Bacillus coagulans)细胞、环状芽孢杆菌(Bacillus circulans)细胞、短小芽孢杆菌(Bacillus pumilis)细胞、苏云金芽孢杆菌(Bacillus thuringiensis)细胞、克劳氏芽孢杆菌(Bacillus clausii)细胞、巨大芽孢杆菌(Bacillus megaterium)细胞、枯草芽胞杆菌(Bacillus subtilis)细胞或解淀粉芽孢杆菌(Bacillus amyloliquefaciens)细胞。在其它实施方案中,宿主细胞是康氏木霉(Trichoderma koningii)细胞、绿色木霉(Trichoderma viride)细胞、里氏木霉(Trichoderma reesei)细胞、长枝木霉(Trichoderma longibrachiatum)细胞、泡盛曲霉(Aspergillus awamori)细胞、烟曲霉(Aspergillus fumigates)细胞、臭曲霉(Aspergillus foetidus)细胞、构巢曲霉(Aspergillus nidulans)细胞、黑曲霉(Aspergillus niger)细胞、米曲霉(Aspergillusoryzae)细胞、特异腐质霉(Humicola insolens)细胞、疏棉状腐质霉(Humicolalanuginose)细胞、浑浊红球菌(Rhodococcus opacus)细胞、米赫根毛霉(Rhizomucormiehei)细胞或米奇毛霉(Mucor michei)细胞。在其它实施方案中,宿主细胞是青紫链霉菌(Streptomyces lividans)细胞或鼠链霉菌(Streptomyces murinus)细胞。在其它实施方案中,宿主细胞是放线菌属(Actinomycetes)细胞。在一些实施方案中,宿主细胞是酿酒酵母(Saccharomyces cerevisiae)细胞。在其它实施方案中,宿主细胞是来自真核生物植物、藻类、蓝细菌、绿色硫细菌、绿色非硫细菌、紫色硫细菌、紫色非硫细菌、嗜极菌、酵母、真菌、其工程化生物体或合成生物体的细胞。在一些实施方案中,宿主细胞为光依赖性的或固定碳。在一些实施方案中,宿主细胞具有自给营养活性。在一些实施方案中,宿主细胞具有光合自养活性,例如在光存在下。在一些实施方案中,在缺乏光下宿主细胞是异养的或混养的。在某些实施方案中,宿主细胞是来自拟南芥(Arabidopsis thaliana)、柳枝稷(Panicumvirgatum)、奇岗(Miscanthus giganteus)、玉蜀黍(Zea mays)、布朗葡萄藻(Botryococcuse braunii)、莱茵衣藻(Chlamydomonas reinhardtii)、盐生杜氏藻(Dunaliela salina)、聚球藻属(Synechococcus Sp.)PCC 7002、聚球藻属PCC 7942、集胞藻属(Synechocystis Sp.)PCC 6803、细长嗜热藻(Thermosynechococcus elongates)BP-1、绿硫菌(Chlorobium tepidum)、嗜热光合绿曲菌(Chlorojlexus auranticus)、酒色着色菌(Chromatiumm vinosum)、深红红螺菌(Rhodospirillum rubrum)、荚膜红细菌(Rhodobacter capsulatus)、沼泽红假单胞菌(Rhodopseudomonas palusris)、扬氏梭菌(Clostridium ljungdahlii)、热纤梭菌(Clostridium thermocellum)、产黄青霉(Penicillium chrysogenum)、巴斯德毕赤氏酵母(Pichia pastoris)、酿酒酵母、非洲粟酒裂殖酵母(Schizosaccharomyces pombe)、荧光假单胞菌(Pseudomonas fluorescens)、恶臭假单胞菌(Pseudomonas putida)或运动发酵单胞菌(Zymomonas mobilis)的细胞。在一特定实施方案中,微生物细胞来自蓝藻细菌,包括但不限于原绿球藻(Prochlorococcus)、聚球藻属、集胞藻属、蓝杆藻(Cyanothece)和点形念珠藻(Nostoc punctiforme)。在另一个实施方案中,微生物细胞来自特定蓝藻物种,包括但不限于细长聚球藻(Synechococcuselongatus)PCC 7942、集胞藻属PCC 6803和聚球藻属PCC 7001。
经工程化以产生1,3-二醇的重组宿主细胞
本公开鉴别编码酶功能多肽以修饰产生例如脂肪二醇(例如1,3-二醇)等所需化合物的酶途径的多核苷酸。本文中通过酶登录号(EC号,参见以下表1)鉴别的这些多肽可用于工程化产生脂肪二醇的脂肪酸途径。更具体地说,图1-3和8-11描绘经工程化以产生1,3-二醇的途径。如所示,运载酰基中间物(酰基-ACP或3-羟基酰基-ACP)的3’羟基酰基载体蛋白(ACP)可转变成1,3-二醇,采用3’羟基脂肪酸(3’OH FA)和3’羟基脂肪醛(3’OH脂肪醛)作为中间物。在一个实施方案中,图1-3和8-11中描绘产生1,3-二醇的工程化途径。本文中,例如葡萄糖等简单碳源首先通过微生物生物体(例如埃希氏菌属、芽孢杆菌属、乳酸杆菌、红球菌属、聚球藻属、集胞藻属、假单胞细菌属、曲霉属、木霉属、链孢霉属、镰刀霉、腐质霉属、根毛霉属、克卢费氏酵母属、毕赤氏酵母属、毛霉属、毁丝霉属、青霉属、显革菌属、侧耳属、栓菌属、金孢子菌属、酵母属、窄食单胞菌属、裂殖酵母属、耶氏酵母属或链霉属)转变为3’羟基酰基-ACP。在一些实施方案中,通用和高度保守的酰基-ACP或3’羟基酰基-ACP通过微生物生物体的天然途径产生。在一个实施方案中,3’羟基酰基-ACP可用于引发工程化途径。举例来说,3’羟基酰基-ACP可以通过具有硫酯酶(TE)活性的酶(参见下表2)转变为中间物,例如3’OH FA。接着中间物3’OH FA可以通过具有羧酸还原酶(CAR)活性的酶(参见下表3)转变为另一中间物3’OH醛。接着具有醇脱氢酶(ADH)或醛还原酶(AR)活性的酶(参见下表4)可以将3’OH醛转变成1,3-二醇。为进一步说明此类途径,图2提供具有硫酯酶活性(例如fatB1、tesA、phaG)、CAR活性(例如carB)和ADH/AR活性(例如alrA)的特定酶的实例。可进行3’OH酰基-ACP转变成3’OH FA的反应的硫酯酶(TE)的其它实例展示于表2中。在一个实施方案中,编码这些硫酯酶的基因是tesA、tesB、fatB、fatB1、fatB2、fatB3、TE_EEI82564、TE_CAD63310和phaG。在另一个实施方案中,编码这些硫酯酶的基因是TE_EEI82564和/或TE_CAD63310,其先前不与3’OH酰基-ACP转变成3’OH FA的能力相关(参见例如Jing等人(2011)BMC Biochemistry 12(44):1471-2091)。可进行3’OH FA转变成3’OH醛的反应的CAR酶的其它实例展示于表3中。在一个实施方案中,编码CAR酶的基因是carB。可进行3’OH醛转变成1,3-二醇的反应的ADH/AR酶的其它实例展示于表4中。在一个实施方案中,编码这些ADH/AR酶的基因是alrA和/或yqhD。
在另一个实施方案中,图3中描绘也产生1,3-二醇的工程化途径。类似地,例如葡萄糖等简单碳源首先通过微生物生物体(例如埃希氏菌属、芽孢杆菌属、乳酸杆菌、红球菌属、聚球藻属、集胞藻属、假单胞细菌属、曲霉属、木霉属、链孢霉属、镰刀霉、腐殖菌属、根毛霉属、克卢费氏酵母属、毕赤氏酵母属、毛霉属、毁丝霉属、青霉属、显革菌属、侧耳属、栓菌属、金孢子菌属、酵母属、窄食单胞菌属、裂殖酵母属、耶氏酵母属或链霉属)转变为3’羟基酰基-ACP。在一些实施方案中,通用和高度保守的3’羟基酰基-ACP通过微生物生物体的天然途径产生。如上所述,3’羟基酰基-ACP可用于引发工程化途径。举例来说,3’羟基酰基-ACP通过具有酰基-ACP还原酶(AAR)活性的酶(参见表1)转变为中间物,例如3’OH脂肪醛。脂肪醇和/或脂肪醛通过AAR的产生可通过编码乙酰基-CoA羧化酶的称为accABCD的基因的异源表达来增强。可进行3’OH酰基-ACP转变成3’OH醛的反应的AAR酶的实例包括但不限于来自细长聚球藻、蓝杆藻属、集胞藻属和海洋原绿球藻(Prochlorococcus marinus)的酶。接着具有醇脱氢酶(ADH)或醛还原酶(AR)活性的酶(参见下表4)可以将3’OH醛转变成脂肪二醇,例如1,3-二醇。因此,本公开提供可以有效且选择性地在体内产生包括1,3-二醇在内的脂肪二醇的重组微生物。应该注意大多数细胞天然产生能够还原醛的酶,因为醛会具有细胞毒性。因此,AR和ADH的异源表达可能并非产生脂肪醇和二醇所需,但其可以提高脂肪醇和二醇的产生效率。
另外,编码具有脂肪酸降解酶活性的多肽的多核苷酸可以任选在宿主细胞中减弱。此类多肽的非限制性实例是酰基-CoA合成酶(例如大肠埃希氏菌FadD)和酰基-CoA脱氢酶(例如大肠埃希氏菌FadE)。表1提供示例性代谢途径中酶活性的综合列表,包括可以任选地根据本领域中已知的方法(参见例如美国专利No.8,283,143,上文)减弱的各种脂肪酸降解酶。举例来说,FadR(参见表1)是参与大肠埃希氏菌中脂肪酸降解和脂肪酸生物合成途径的关键调节因子(Cronan等人,Mol.Microbiol.,29(4):937-943(1998))。大肠埃希氏菌酶FadD(参见表1)和脂肪酸转运蛋白FadL是脂肪酸吸收系统的组分。FadL及其同源物介导脂肪酸转运至细菌细胞,且FadD及其同源物介导酰基-CoA酯的形成。脂肪酸和脂肪酸衍生物的一种替代异源吸收系统是来自假单胞细菌属的外膜蛋白AlkL(Julsing等人(2012)Appl.Environ.Microbiol.78:5724-5733)。当不可利用其它碳源时,外源性脂肪酸由细菌吸收且转变为酰基-CoA酯,酰基-CoA酯可以结合于转录因子FadR且减少编码负责脂肪酸转运(FadL)、活化(FadD)和β-氧化(FadA、FadB和FadE)的蛋白质的fad基因的表达。当可利用替代碳源时,细菌合成如酰基-ACP等脂肪酸,用于磷脂合成,而非β-氧化的底物。因此,酰基-CoA和酰基-ACP都是可以产生不同最终产物的脂肪酸的独立来源(Caviglia等人,J.Biol.Chem.,279(12):1163-1169(2004))。FadR和/或FabB及其功能同源物可以增强宿主细胞(例如大肠埃希氏菌)中脂肪酸衍生物的产生,但是其过度表达是任选的。本文中,涵盖FabB过度表达可以增加伸长速率(脂肪酸链合成),且FadR过度表达可以增加FabA和FabB的表达。后者是可能的,因为预期FadR是FabA和FabB的正调节剂。
表1:酶活性
表2:硫酯酶活性
表3:羧酸还原酶(CAR)活性
表4:醇脱氢酶(ADH)或醛还原酶(AR)活性
本公开鉴别编码可用于重组宿主细胞和产生方法的具有酶活性的多肽的多核苷酸。具有酶活性的多肽促进包括脂肪二醇化合物的组合物的产生。一般公认无需与此类多核苷酸的绝对序列一致性。举例来说,可以使特定多核苷酸序列(例如编码具有酶功能的多肽的多核苷酸)变化且针对活性筛选编码多肽。此类变化典型地包含保守突变和沉默突变(例如密码子最佳化)。可以使用本领域中已知的方法,针对所需功能,包括但不限于催化活性增加、稳定性增加或抑制减少(例如反馈抑制减少),筛选基因工程化或修饰的多核苷酸和编码的变异多肽。
另外,本公开根据酶分类(EC)号鉴别与如本文中描述(上文)的参与脂肪二醇产生的工程化途径的各个步骤(即反应)有关的酶活性,并提供按此类EC号分类的示例性多肽(例如酶)和编码此类多肽的示例性多核苷酸。本文中通过登录号和/或序列鉴别编码(SEQID NO)鉴别的此类示例性多肽和多核苷酸可用于将在亲本宿主细胞中产生包括1,3脂肪二醇在内的脂肪二醇的脂肪酸途径工程化,以获得本文中描述的重组或基因修饰的宿主细胞。本文中描述的多肽和多核苷酸是示例性和非限制性的。本文中描述的示例性多肽的同源物的序列可由本领域技术人员通过各个数据库(例如美国国家生物技术信息中心(NCBI)提供的Entrez数据库、瑞士生物信息学研究所提供的ExPasy数据库、不伦瑞克工业大学(The Technical University of Braunschweig)提供的BRENDA资料库和京都大学与东京大学生物信息中心(The Bioinformatics Center of Kyoto University and Universityof Tokyo)提供的KEGG资料库,都可在万维网上获得)获得。
发酵和脂肪二醇的产生
如本文所用,发酵泛指重组宿主细胞将有机物质转变成目标物质。举例来说,这包括通过在包含碳源的培养基中繁殖重组宿主细胞的培养物,重组宿主细胞将碳源转变成脂肪酸衍生物,例如脂肪二醇。可用于产生例如脂肪二醇和/或脂肪醇等目标物质的条件是容许宿主细胞产生例如脂肪二醇组合物等所需产物的任何条件。类似地,这包括其中在宿主中表达的载体的多核苷酸序列容许宿主细胞合成目标多肽的任何条件。适合条件包括例如典型发酵条件。发酵条件可以包括许多参数,包括但不限于温度范围、pH水平、通风水平、馈送速率和培养基组成。这些条件中的每一者单独和组合下容许宿主细胞生长。发酵可以是好氧、厌氧或其变体(例如微好氧)。示例性培养基包括肉汤(液体)或凝胶(固体)。一般来说,培养基包括可以通过宿主细胞直接代谢的碳源(例如来源于可再生原料的简单碳源)。另外,酶可用于培养基中以促进碳源的流动(例如淀粉或纤维素解聚成发酵性糖)和后面代谢。
对于小规模生产,工程化的宿主细胞可以呈例如约100μL、200μL、300μL、400μL、500μL、1mL、5mL、10mL、15mL、25mL、50mL、75mL、100mL、500mL、1L、2L、5L或10L的批量生长;发酵;以及诱导表达所需多核苷酸序列,例如编码具有特定酶活性的多肽的多核苷酸(例如TE、CAR、ADH、FAR、ACR、ACC和/或AAR酶活性)。对于大规模生产,工程化的宿主细胞可以在体积批量为约10L、100L、1000L、10,000L、100,000L、1,000,000L或更大的培养物中生长;发酵;以及诱发表达任何所需多核苷酸序列。本文中描述的脂肪二醇组合物可以在重组宿主细胞培养物的细胞外环境中发现且可以容易从培养基分离。例如脂肪二醇和/或脂肪醇等脂肪酸衍生物可以由重组宿主细胞分泌,输送至细胞外环境或被动转移至重组宿主细胞培养物的细胞外环境中。脂肪二醇组合物可以使用本领域中已知的常规方法从重组宿主细胞培养物分离。
为了产生脂肪二醇,进行许多修饰以产生宿主细胞(上文)。因此,本公开提供相对于未经工程化或原生宿主细胞(例如用作对照细胞的野生型宿主细胞),经工程化以提供生物合成途径的重组宿主细胞,工程化例如通过特定菌株改良来实现。例如细菌、蓝藻细菌、酵母、藻类或丝状真菌等微生物可以用作生产宿主。可以用作生产宿主的微生物的非限制性实例包括大肠埃希氏菌、酿酒酵母等等。微生物菌株有效地将葡萄糖或其它可再生原料转变成脂肪酸衍生物,包括脂肪醇和脂肪二醇。为了实现此,菌株已经小心地工程化以表达具有特定功能性的关键酶。已经建立了用于产生各种化合物的高密度发酵的方案和程序(参见例如以引用的方式并入本文中的美国专利No.8,372,610;8,323,924;8,313,934;8,283,143;8,268,599;8,183,028;8,110,670;8,110,093;和8,097,439)。
值得注意地,直到现在才出现直接并有效地从葡萄糖或其它可再生的原料产生包括1,3-二醇在内的脂肪二醇的方法。然而,这些脂肪二醇可用作清洁剂、表面活性剂、乳化剂、软化剂、溶剂、塑料和食品添加剂的组分。用于产生如本文中呈现的脂肪二醇及其组合物的基于发酵的方法提供了本领域中所用的化学方法的环保替代方法。在一些实施方案中,宿主细胞在包含约20g/L至约900g/L起始浓度的碳源(例如简单碳源)的培养基(例如发酵培养基)中培养。在其它实施方案中,培养基包含约2g/L至约10g/L、约10g/L至约20g/L、约20g/L至约30g/L、约30g/L至约40g/L或约40g/L至约50g/L起始浓度的碳源(例如简单碳源)。在一些实施方案中,培养基中可用碳源的水平可以在发酵进行期间监测。在一些实施方案中,所述方法进一步包括当培养基中初始碳源的水平小于约0.5g/L时添加补充碳源至培养基。在一些实施方案中,当培养基中碳源的水平小于约0.4g/L、小于约0.3g/L、小于约0.2g/L或小于约0.1g/L时添加补充碳源至培养基。在一些实施方案中,添加补充碳源以维持约1g/L至约25g/L的碳源水平。在一些实施方案中,添加补充碳源以维持约2g/L或更多(例如约2g/L或更多、约3g/L或更多、约4g/L或更多)的碳源水平。在一些实施方案中,添加补充碳源以维持约5g/L或更少(例如约5g/L或更少、约4g/L或更少、约3g/L或更少)的碳源水平。在一些实施方案中,添加补充碳源以维持约2g/L至约5g/L、约5g/L至约10g/L或约10g/L至约25g/L的碳源水平。
在一个实施方案中,用于发酵的碳源来源于可再生原料。在一些实施方案中,碳源是葡萄糖。在一些实施方案中,碳源是甘油。其它可能的碳源包括但不限于果糖、甘露糖、半乳糖、木糖、阿拉伯糖、淀粉、纤维素、果胶、木聚糖、蔗糖、麦芽糖、纤维二糖和松二糖;纤维素材料和变体,例如半纤维素、甲基纤维素和羧甲基纤维素钠;饱和或不饱和脂肪酸、丁二酸酯、乳酸酯和乙酸酯;醇,例如乙醇、甲醇和甘油或其混合物。在一个实施方案中,碳源来源于玉米、甘蔗、高粱、甜菜、柳枝稷、青贮饲料、稻草、木材、纸浆、污水、垃圾、纤维素城市废物、烟气、合成气或二氧化碳。简单碳源还可以为光合作用产物,例如葡萄糖或蔗糖。在一个实施方案中,碳源来源于废物,例如甘油、烟气或合成气;或例如生物质等有机材料的重整;或天然气或甲烷;或这些物质重整成合成气:或光合作用固定的二氧化碳,例如1,3-二醇可以通过光合且使用CO2为碳源生长的重组蓝藻细菌产生。在某些实施方案中,碳源来源于生物质。生物质的一个示例性来源是植物物质或植被,例如玉米、甘蔗或柳枝稷。生物质的另一个示例性来源是代谢废物,例如动物物质(例如牛粪)。生物质的其它示例性来源包括藻类及其它海生植物。生物质还包括来自工业、农业、林业和家庭的废产物,包括但不限于发酵废物、青贮饲料、稻草、木材、污水、垃圾、纤维素城市废物、城市固体废物和吃剩的食物。
在一些实施方案中,脂肪二醇(例如1,3-二醇)以约0.5g/L至约40g/L的浓度产生。在一些实施方案中,脂肪二醇以1g/L或更多(例如约1g/L或更多、约10g/L或更多、约20g/L或更多、约50g/L或更多、约100g/L或更多)的浓度产生。在一些实施方案中,脂肪二醇以约1g/L至约170g/L、约1g/L至约10g/L、约40g/L至约170g/L、约100g/L至约170g/L、约10g/L至约100g/L、约1g/L至约40g/L、约40g/L至约100g/L或约1g/L至约100g/L的浓度产生。
在一些实施方案中,脂肪二醇以约25mg/L、约50mg/L、约75mg/L、约100mg/L、约125mg/L、约150mg/L、约175mg/L、约200mg/L、约225mg/L、约250mg/L、约275mg/L、约300mg/L、约325mg/L、约350mg/L、约375mg/L、约400mg/L、约425mg/L、约450mg/L、约475mg/L、约500mg/L、约525mg/L、约550mg/L、约575mg/L、约600mg/L、约625mg/L、约650mg/L、约675mg/L、约700mg/L、约725mg/L、约750mg/L、约775mg/L、约800mg/L、约825mg/L、约850mg/L、约875mg/L、约900mg/L、约925mg/L、约950mg/L、约975mg/L、约1000mg/L、约1050mg/L、约1075mg/L、约1100mg/L、约1125mg/L、约1150mg/L、约1175mg/L、约1200mg/L、约1225mg/L、约1250mg/L、约1275mg/L、约1300mg/L、约1325mg/L、约1350mg/L、约1375mg/L、约1400mg/L、约1425mg/L、约1450mg/L、约1475mg/L、约1500mg/L、约1525mg/L、约1550mg/L、约1575mg/L、约1600mg/L、约1625mg/L、约1650mg/L、约1675mg/L、约1700mg/L、约1725mg/L、约1750mg/L、约1775mg/L、约1800mg/L、约1825mg/L、约1850mg/L、约1875mg/L、约1900mg/L、约1925mg/L、约1950mg/L、约1975mg/L、约2000mg/L(2g/L)、3g/L、5g/L、10g/L、20g/L、30g/L、40g/L、50g/L、60g/L、70g/L、80g/L、90g/L、100g/L或由前述值中的任两者限定的范围的滴度产生。在一些实施方案中,脂肪二醇(例如1,3-二醇)以超过100g/L、超过200g/L、超过300g/L或更高,例如500g/L、700g/L、1000g/L、1200g/L、1500g/L或2000g/L的滴度产生。根据本公开的方法由重组宿主细胞产生的例如1,3-二醇等脂肪二醇的优选滴度为5g/L至200g/L、10g/L至150g/L、20g/L至120g/L和30g/L至100g/L、100g/L至150g/L以及120g/L至180g/L。在一个实施方案中,根据本公开的方法由重组宿主细胞产生的例如1,3-二醇等脂肪二醇的滴度为约1g/L至约250g/L且更具体地说,90g/L至约120g/L。滴度可指特定1,3-二醇或给定重组宿主细胞培养物产生的不同链长或不同功能性的1,3-二醇的组合。
在其它实施方案中,根据本公开的方法经工程化以产生例如1,3-二醇等脂肪二醇的宿主细胞的产率为至少1%、至少2%、至少3%、至少4%、至少5%、至少6%、至少7%、至少8%、至少9%、至少10%、至少11%、至少12%、至少13%、至少14%、至少15%、至少16%、至少17%、至少18%、至少19%、至少20%、至少21%、至少22%、至少23%、至少24%、至少25%、至少26%、至少27%、至少28%、至少29%、至少30%或至少40%或由前述值中的任两个限定的范围。在其它实施方案中,例如1,3-二醇等脂肪二醇以超过30%、40%、50%、60%、70%、80%、90%或更多的产率产生。或者或另外,产率为约30%或更少、约27%或更少、约25%或更少或约22%或更少。因此,产率可由前述终点中的任两者限定。举例来说,根据本公开的方法由重组宿主细胞产生的例如1,3-二醇等脂肪二醇的产率可以是5%至15%、10%至25%、10%至22%、15%至27%、18%至22%、20%至28%或20%至30%。在一特定实施方案中,由重组宿主细胞产生的例如1,3-二醇等脂肪二醇的产率为约10%至约40%。在另一特定实施方案中,由重组宿主细胞产生的例如1,3-二醇等脂肪二醇的产率为约25%至约30%。产率可指由给定重组宿主细胞培养物产生的例如1,3-二醇等特定脂肪二醇或1,3-二醇的组合。另外,产率还将依赖于所用原料。
在一些实施方案中,重组宿主细胞产生的例如1,3-二醇等脂肪二醇的生产率是至少100mg/L/小时、至少200mg/L/小时、至少300mg/L/小时、至少400mg/L/小时、至少500mg/L/小时、至少600mg/L/小时、至少700mg/L/小时、至少800mg/L/小时、至少900mg/L/小时、至少1000mg/L/小时、至少1100mg/L/小时、至少1200mg/L/小时、至少1300mg/L/小时、至少1400mg/L/小时、至少1500mg/L/小时、至少1600mg/L/小时、至少1700mg/L/小时、至少1800mg/L/小时、至少1900mg/L/小时、至少2000mg/L/小时、至少2100mg/L/小时、至少2200mg/L/小时、至少2300mg/L/小时、至少2400mg/L/小时或至少2500mg/L/小时。举例来说,根据本公开的方法由重组宿主细胞产生的例如1,3-二醇等脂肪二醇的生产率可以是500mg/L/小时至2500mg/L/小时或700mg/L/小时至2000mg/L/小时。在一特定实施方案中,生产率为约0.7mg/L/小时至约3g/L/小时。生产率可指由既定重组宿主细胞产生的例如1,3-二醇等特定脂肪二醇。
在一些实施方案中,用于本文中论述的发酵程序(上文)中的宿主细胞是哺乳动物细胞、植物细胞、昆虫细胞、酵母细胞、真菌细胞、丝状真菌细胞、藻类细胞、蓝藻细胞和细菌细胞。在特定实施方案中,宿主细胞选自埃希氏菌属、芽孢杆菌属、假单胞细菌属、乳酸杆菌、红球菌属、聚球藻属、集胞藻属、假单胞细菌属、曲霉属、木霉属、链孢霉属、镰刀霉、腐质霉属、根毛霉属、克卢费氏酵母属、毕赤氏酵母属、毛霉属、毁丝霉属、青霉属、显革菌属、侧耳属、栓菌属、金孢子菌属、酵母属、窄食单胞菌属、裂殖酵母属、耶氏酵母属或链霉属。在其它实施方案中,宿主细胞是迟缓芽胞杆菌细胞、短芽孢杆菌细胞、嗜热脂肪芽孢杆菌细胞、地衣芽孢杆菌细胞、嗜碱芽孢杆菌细胞、凝结芽孢杆菌细胞、环状芽孢杆菌细胞、短小芽孢杆菌细胞、苏云金芽孢杆菌细胞、克劳氏芽孢杆菌细胞、巨大芽孢杆菌细胞、枯草芽胞杆菌细胞或解淀粉芽孢杆菌细胞。在其它实施方案中,宿主细胞是恶臭假单胞菌细胞。在某些实施方案中,宿主细胞是聚球藻属PCC7002、细长聚球藻PCC 7942、集胞藻属PCC 6803、细长聚球藻PCC6301、海洋原绿球藻CCMP1986(MED4)、多变鱼腥藻(Anabaena variabilis)ATCC29413、点形念珠藻ATCC29133(PCC73102)、无类囊体蓝藻(Gloeobacter violaceus)ATCC29082(PCC7421)、念珠藻属(Nostoc sp.)ATCC27893(PCC7120)、蓝杆藻属(Cyanothecesp.)PCC7425(29141)、蓝杆藻属ATCC51442或聚球藻属ATCC27264(PCC7002)。在其它实施方案中,宿主细胞是康氏木霉细胞、绿色木霉细胞、里氏木霉细胞、长枝木霉细胞、泡盛曲霉细胞、烟曲霉细胞、臭曲霉细胞、构巢曲霉细胞、黑曲霉细胞、米曲霉细胞、特异腐质霉细胞、、疏棉状腐质霉细胞、浑浊红球菌细胞、米赫根毛霉细胞或米奇毛霉细胞。在其它实施方案中,宿主细胞是放线菌属细胞。在其它实施方案中,宿主细胞是青紫链霉菌细胞或鼠链霉菌细胞。在其它实施方案中,宿主细胞是酿酒酵母细胞。
在其它实施方案中,宿主细胞是来自真核生物植物、藻类、蓝细菌、绿色硫细菌、绿色非硫细菌、紫色硫细菌、紫色非硫细菌、嗜极菌、酵母、真菌、其工程化生物体或合成生物体的细胞。在某些实施方案中,宿主细胞是来自拟南芥、柳枝稷、奇岗、玉蜀黍、布朗葡萄藻、莱茵衣藻、盐生杜氏藻、细长嗜热藻、聚球藻属、集胞藻属、绿硫菌、嗜热光合绿曲菌、酒色着色菌、深红红螺菌、荚膜红细菌、沼泽红假单胞菌、扬氏梭菌、热纤梭菌或产黄青霉的细胞。在某些其它实施方案中,宿主细胞是来自巴斯德毕赤氏酵母、酿酒酵母、解脂耶氏酵母(Yarrowia lipolytica)、非洲粟酒裂殖酵母、荧光假单胞菌、恶臭假单胞菌或运动发酵单胞菌的细胞。在其它实施方案中,宿主细胞是来自聚球藻属PCC 7002、聚球藻属PCC 7942或集胞藻属PCC 6803的细胞。在一些实施方案中,宿主细胞是CHO细胞、COS细胞、VERO细胞、BHK细胞、海拉细胞(HeLa cell)、Cv1细胞、MDCK细胞、293细胞、3T3细胞或PC12细胞。。在特定实施方案中,宿主细胞是大肠埃希氏菌细胞。在一些实施方案中,大肠埃希氏菌细胞是菌株B、菌株C、菌株K或菌株W大肠埃希氏菌细胞。
脂肪二醇的组合物和配方
生物产物(例如根据本公开产生的脂肪二醇组合物),包括生物产生的有机化合物和尤其使用本文公开的脂肪酸生物合成途径产生的脂肪二醇组合物,是从可再生来源(例如从来源于可再生原料的简单碳源)产生的,因而是新的物质组合物。根据双碳同位素指纹法或14C年代测定,可将这些新生物产物与来源于石油化学碳的有机化合物区别。另外,生物来源碳的特定来源(例如葡萄糖对比甘油)可以通过双碳同位素指纹法测定(参见例如美国专利No.7,169,588)。区别例如本公开的脂肪二醇等生物产物与基于石油的有机化合物的能力有益于跟踪贸易中的这些物质。举例来说,包含基于生物和基于石油的碳同位素概况的有机化合物或化学品可以与仅仅由基于石油的物质制成的有机化合物和化学品相区别。因此,本文中产生的生物产物可以根据其独特的碳同位素概况而在贸易追踪或跟踪。可以通过比较每个样品中稳定碳同位素比率(13C/12C),来区别生物产物与基于石油的有机化合物。既定生物产物中13C/12C比率是二氧化碳固定时常压二氧化碳中13C/12C比率的结果。其还反映出准确的代谢途径。也发生区域性变化。石油、C3植物(阔叶树)、C4植物(草)和海相碳酸盐岩都展示13C/12C和对应δ13C值的显著差异。C4与C3植物都展现一系列13C/12C同位素比率,但是C4植物的典型值为约-7至约-13千分位数,且C3植物的典型值为约-19至约-27千分位数(参见例如Stuiver等人,Radiocarbon 19:355(1977))。例如煤和石油等不可再生物质一般在此后者范围内。
δ13C(‰)=[(13C/12C)样品-(13C/12C)标准品]/(13C/12C)标准品×1000
已经发展一系列替代RM并与IAEA、USGS、NIST及其它精选国际同位素实验室合作。与PDB的千分偏差的标记是δ13C。在CO2上,通过高精度稳定比率质谱分析(IRMS),在质量44、45和46的分子离子上进行测量。本文中描述的组合物包括通过本文中描述的任何方法产生的脂肪二醇组合物和产物。具体地说,脂肪二醇组合物或产物的δ13C为约-28或更大、约-27或更大、-20或更大、-18或更大、-15或更大、-13或更大、-10或更大或-8或更大。举例来说,脂肪二醇组合物或产物的δ13C可以为约-30至约-15、约-27至约-19、约-25至约-21、约-15至约-5、约-13至约-7或约-13至约-10。在其它情况下,脂肪二醇组合物或产物的δ13C可以为约-10、-11、-12或-12.3。根据本公开产生的脂肪二醇组合物和产物还可以通过比较每种化合物中14C的量而与基于石油的有机化合物相区别。因为14C具有5730年的核半衰期,所以含有“较古老”碳的基于石油的燃料可以与含有“较新”碳的脂肪二醇组合物和生物产物相区别(参见例如Currie,“Source Apportionment of Atmospheric Particles”,Characterization of Environmental Particles,J.Buffle和H.P.van Leeuwen编辑,IUPAC Environmental Analytical Chemistry Series(Lewis Publishers,Inc.)第I卷第1部分3-74,(1992))。
放射性碳年代测定中的基本假设是大气中14C浓度的恒久不变导致活生物中14C的恒久不变。然而,由于二十世纪五十年代以来的大气层核试验和十九世纪五十年代以来的化石燃料的燃烧,所以14C已经获得了第二个地球化学时期特征。其在常压CO2中和由此在活生物层中的浓度大约是二十世纪六十年代中期核试验高峰期时的两倍。此后其逐渐回落至约1.2×10-12的稳态宇生(常压)基线同位素比率(14C/12C),其中松弛“半衰期”大约是7-10年。此后者半衰期不能取文字意思;而是必须使用详细的常压核输入/衰变函数描绘常压和生物层14C自核时代以来的变化。证实此生物层14C时期特征提供了近代生物层碳的年代测定的希望。14C可以通过加速质谱分析(AMS)测量,其中结果以现代碳的分数的单位(fM)给出。在这方面,fM具有与国家标准和技术研究所(National Institute of Standards andTechnology,NIST)标准参考物质(SRM 4990B和4990C)所定义相同的含义,称为草酸标准品HOxI和HOxII。基本定义涉及0.95×14C/12C同位素比率HOxI(参考AD 1950)。此大致相当于衰变校正的工业革命前的木材。对于当前活生物层(植物物质),fM大约是1.1。本文中描述的脂肪二醇组合物和产物包括可以具有至少约1的fM 14C的生物产物。举例来说,本公开的生物产物可以具有至少约1.01的fM 14C、约1至约1.5的fM 14C、约1.04至约1.18的fM 14C或约1.111至约1.124的fM14C。
14C的另一测量值称为现代碳的百分比(pMC)。对于使用14C年代测定的考古学家或地质学家,AD 1950等于零岁。这也表示100pMC。大气中的爆炸碳在1963年热核武器高峰期时几乎是正常水平的两倍。已经粗略估计自从出现以来其在大气内的分配,显示自AD 1950以来活的植物和动物的值超过100pMC。其随时间逐渐减少,其中如今的值接近107.5pMC。这意指例如玉米等新鲜生物质材料将得到接近107.5pMC的14C特征。基于石油的化合物的pMC值为零。化石碳与现代碳组合将导致现代pMC含量的稀释。通过假定107.5pMC表示现代生物质的14C含量且0pMC表示基于石油的产物的14C含量,针对物质所测量的pMC值将反映两种组分类型的比例。举例来说,从现代大豆100%获得的物质将得到接近107.5pMC的放射性碳特征。如果该物质用基于石油的产物稀释50%,那么将得到大约54pMC的放射性碳特征。基于生物的碳含量通过分配100%等于107.5pMC且0%等于0pMC来获得。举例来说,测得99pMC的样品将得到93%的同等的基于生物的碳含量。此值称为平均基于生物的碳结果,且假定分析物质内的所有组分来源于现代生物物质或基于石油的物质。包含如本文中描述的一种或多种脂肪二醇的生物产物可以具有至少约50、60、70、75、80、85、90、95、96、97、98、99或100的pMC。在其它情况下,本文中描述的脂肪二醇组合物可以具有约50与约100、约60与约100、约70与约100、约80与约100、约85与约100、约87与约98或约90与约95之间的pMC。在其它情况下,本文中描述的脂肪二醇组合物可以具有约90、91、92、93、94或94.2的pMC。
例如1,3-二醇等脂肪二醇是在许多工业应用中有价值且合乎需要的分子。本公开通过重组微生物产生此类化合物,包括体内,且因此产生一系列适用产物。此类产物包括1,3-二醇及其组合物。1,3-二醇的实例包括但不限于C5 1,3二醇(1,3-戊二醇);C6 1,3二醇(1,3-己二醇);C7 1,3二醇(1,3-庚二醇);C8 1,3二醇(1,3-辛二醇);C9 1,3二醇(1,3-壬二醇);C10 1,3二醇(1,3-癸二醇);C11 1,3二醇(1,3-十一烷二醇);C121,3二醇(1,3-十二烷二醇);C13 1,3二醇(1,3-十三烷二醇);C14 1,3二醇(1,3-十四烷二醇);C15 1,3二醇(1,3-十五烷二醇);C16 1,3二醇(1,3-十六烷二醇);C17 1,3二醇(1,3-十七烷二醇);C18 1,3二醇(1,3-十八烷二醇);C19 1,3二醇(1,3-十九烷二醇)等等。虽然本文中通常描述偶数链1,3-二醇,但也包括奇数链1,3-二醇,例如具有7-21个碳且更优选5-19个碳的1,3-二醇。
本公开的1,3-二醇具有各种链长和/或饱和和/或分支特征。在一些实施方案中,1,3-二醇组合物通常包括一种类型1,3-二醇,例如C51,3二醇(1,3-戊二醇);C6 1,3二醇(1,3-己二醇);C7 1,3二醇(1,3-庚二醇);C8 1,3二醇(1,3-辛二醇);C9 1,3二醇(1,3-壬二醇);C10 1,3二醇(1,3-癸二醇);C11 1,3二醇(1,3-十一烷二醇);C12 1,3二醇(1,3-十二烷二醇);C13 1,3二醇(1,3-十三烷二醇);C14 1,3二醇(1,3-十四烷二醇);C15 1,3二醇(1,3-十五烷二醇);C16 1,3二醇(1,3-十六烷二醇);C17 1,3二醇(1,3-十七烷二醇);C18 1,3二醇(1,3-十八烷二醇);C19 1,3二醇(1,3-十九烷二醇)等等。在另一个实施方案中,1,3-二醇组合物通常包括特定链长的特定1,3-二醇呈特定比率的混合物。在又一个实施方案中,1,3-二醇组合物包括特定链长的一种或多种1,3-二醇的组合与其它成分或组分组合以产生清洁剂、表面活性剂、乳化剂、软化剂、溶剂、塑料和食品添加剂。
在一个实施方案中,脂肪二醇组合物包括C12 1,3-二醇于直链脂肪醇的混合物中。在另一个实施方案中,脂肪二醇组合物包括C12 1,3-二醇于支链脂肪醇的混合物中。在另一个实施方案中,脂肪二醇组合物包括C12 1,3-二醇于直链与支链脂肪醇的混合物中。在另一个实施方案中,脂肪二醇组合物包括C12 1,3-二醇与例如清洁剂或表面活性剂成分等其它成分组合。在又一个实施方案中,脂肪二醇组合物包括C12 1,3-二醇与例如乳化剂或溶剂成分等其它成分组合。在又一个实施方案中,脂肪二醇组合物包括C12 1,3-二醇与聚合物组合。本文中,脂肪二醇组合物可以用作塑料的组分。在另一个实施方案中,脂肪二醇组合物包括C12 1,3-二醇于食物成分的混合物中。在另一个实施方案中,脂肪二醇组合物包括1,3-二醇作为表面活性剂或清洁剂(例如糖苷或乙醇盐)的合成中的中间物,或与香料或其它化学品可以从中合成的化学构筑嵌段组合。
在另一个实施方案中,脂肪二醇组合物包括一定比率的C8-、C10-和C12 1,3-二醇于直链脂肪醇的混合物中。在另一个实施方案中,脂肪二醇组合物包括一定比率的C8-、C10-和C12 1,3-二醇于支链脂肪醇的混合物中。在另一个实施方案中,脂肪二醇组合物包括一定比率的C8-、C10-和C12 1,3-二醇于直链与支链脂肪醇的混合物中。在另一个实施方案中,脂肪二醇组合物包括一定比率的C8-、C10-和C12 1,3-二醇与例如清洁剂或表面活性剂成分等其它成分组合。在另一个实施方案中,脂肪二醇组合物包括一定比率的C8-、C10-和C12 1,3-二醇与例如乳化剂或溶剂成分等其它成分组合。在又一个实施方案中,脂肪二醇组合物包括一定比率的C8-、C10-和C12 1,3-二醇与聚合物组合。本文中,脂肪二醇组合物可以用作塑料的组分。在另一个实施方案中,脂肪二醇组合物包括一定比率的C8-、C10-和C12 1,3-二醇于食品成分的混合物中。
本公开进一步涵盖一种脂肪二醇组合物,其包括一定比率的C5-、C6-、C7-、C8-、C9-、C10-和/或C11 1,3-二醇于食品相关成分的混合物中。此类脂肪二醇将适用作食物稳定剂、食品强化剂、食品添加剂或食品替代物。本公开的脂肪二醇的化合物和组合物可以调配成制成所需产品,包括清洁剂、表面活性剂、乳化剂、软化剂、溶剂、塑料、食品添加剂等等。在一个实施方案中,C10-C18 1,3-二醇预期用作表面活性剂。在另一个实施方案中,1,3二醇直接使用或作为合成营养物、药物、农用化学品及其它生物活性分子中的中间物。
讨论手性1,3二醇。
实施例
以下实施例进一步说明本公开,但不应视为以任何方式限制其范围。
实施例1:培养重组大肠埃希氏菌菌株用于产生1,3-二醇
所有实验都从特定微生物菌株的单一菌落或冷冻储备料开始。96孔板中的高通量(HTP)方案如下针对每种菌株一式四份地进行:40μL卢里亚-贝尔塔尼(Luria-Bertani,LB)培养物(来自在96孔板中生长的LB培养物)用来接种360μL LB培养基,接着在32℃振荡下培育3-4小时。将40μL LB种子用来接种360μL Nlim培养基(见下文)。在30-35℃下在32℃下生长2小时后,培养物用IPTG(最终浓度1mM)诱导。接着如果未另外说明,那么培养物在30-35℃下在振荡下培育20小时,随后根据下文详述的标准提取方案提取。摇瓶方案类似进行,除了培养物体积按比例增大,使得最终的产生培养基体积是15ml而非400μl。摇瓶培养基还含有0.25%(v/v)Triton X100。根据微生物菌株,在所有阶段都将适当的抗生素添加至培养基。
生物反应器中的基线工艺如下:将菌株的细胞库小瓶在含有抗生素的LB摇瓶中在32℃下培养,直到培养物的OD读数>1。将5%v/v的此培养物转移至最低种子培养基(含有氯化铵、氯化钠、磷酸二氢钾、硫酸镁、氯化钙、葡萄糖、微量元素溶液、柠檬酸铁一水化物、缓冲剂和抗生素),并在32℃下培养整夜。接着此种子培养物用于接种准备好的用于生产的生物反应器。
用于此工艺的初始生物反应器培养基含有各种浓度的与种子培养基相同的组分,以及微量维生素溶液,和任选少量的复杂培养基组分,例如酪蛋白氨基酸、玉米浆粉或酵母提取物。生物反应器的后无菌添加任选地包括不耐热的维生素或氨基酸、葡萄糖和抗生素。
在接种前,将生物反应器参数稳定化,且打开控制器-溶解氧设定点:10-50%;温度设定点:27-37℃;通风设定点:0.25-1vvm;pH设定点:6.5-7.5。生物反应器用5%v/v种子培养物接种并当培养物密度达到所需设定点时用1mM IPTG诱导。
由葡萄糖、蔗糖、果糖、木糖或甘油与并入生物反应器基础培养基中的其它可能培养基组分构成的馈料溶液以1-50g/L/小时葡萄糖(基于标称培养物体积)的最大速率馈送至培养物,使用DO或pH触发器,在培养基的碳源耗尽且应添加下一剂馈料溶液时向控制器作出指示。在培养48小时与96小时之间收获生物反应器。
实施例2:分析1,3-二醇
利用以下程序提取通过重组大肠埃希氏菌菌株产生的发酵肉汤样品:
1.在称重前将肉汤以3000rpm涡旋30秒
2.在Vortex Genie上涡旋后,立即取500μL肉汤样品
3.添加5mL 500mg/L(1-十一烷醇)乙酸丁酯作为内标
4.在涡旋机(DVX-2500多管涡旋机,VWR)中在2500rpm下提取肉汤,历时20分钟
5.在室温下将提取物离心(在4750rpm下)10分钟
6.将100μL顶层清液经插入物移至GC小瓶中
7.在室温下通过添加100μL(BSTFA+1%TMCS)至GC小瓶而衍生化
8.将提取物和BSTFA试剂混合30秒,接着注射在如下所述的GC/MS上:
用于鉴别的仪器条件
起始温度:60℃
起始时间:5分钟
平衡时间:1分钟
程序速率:25℃/分钟
最终温度:300℃
最终时间:1.6分钟
检测器:MSD
入口温度:300℃
转移管线温度:300℃
MS源:230℃
MS Quad:150℃
分流比:20:1
柱流速:1mL/分钟
样品大小:1μL
实施例3:使用具有来自四联厌氧球菌或植物乳杆菌的TE和carB的途径产生1,3-二醇
此实施例展示了使用包括来自四联厌氧球菌(TE_EEI82564,genbank登录号WP_004837416)或植物乳杆菌(TE_CAD63310,genbank登录号WP_003640969)的微生物硫酯酶和来自解皂菌状杆菌(genbank登录号YP_889972)的羧酸还原酶的变异体CarB的代谢途径,1,3-二醇在重组大肠埃希氏菌中的意外产生。
编码carB2(SEQ ID NO:6)和TE_EEI82564的基因克隆至pCL1920-衍生载体(SC101复制子,壮观霉素抗性标记物),使得其转录由IPTG-诱导性Ptrc启动子控制,且其与编码醇脱氢酶alrA(其并非脂肪醇或脂肪二醇产生所需,但提高其产生速率)和3-酮酰基-ACP合酶(fabB)的变异体和转录调节子(fadR)的基因一起形成操纵子。质粒命名为pVA369(参见表5)。来自植物乳杆菌的TE_CAD63310的基因以一致方式,与carB12(SEQ ID NO:4)的基因一起克隆,所得质粒命名为pJP2(参见下表5)。
用于质粒转型的基础菌株是V668和DJ81。简单地说,基础菌株的基因组如下操纵:在V668中,fadE(酰基-CoA脱氢酶)基因缺失,且合成脂肪酸生物合成操纵子和磷酸泛酰巯基乙氨基转移酶(entD)过度表达。简单地说,基础菌株DJ81的基因组如下操纵:酰基-CoA脱氢酶(fadE)基因缺失,且合成脂肪酸生物合成操纵子、磷酸泛酰巯基乙氨基转移酶(entD)和变异硫酯酶(tesA)过度表达。
质粒pVA369和pJP2分别转化至基础菌株D848和V668中,产生菌株VA370和JP-11(参见下文表6)。接着如实施例1和2中所述培养菌株并分析其产生脂肪醇的能力。意外地,两种菌株产生若干未知峰。
图4展示表达TE_EEI82564的菌株VA370的提取物的GC-MS色谱。GC-MS色谱中RT=8.199min和RT=9.094min的两个峰不匹配例如十二烷醇和十四烷醇或十二烷酸和十四烷酸等预期脂肪醇和脂肪酸的保留时间。峰1在十二烷醇前流出,且峰2在十四烷醇后和十四烷酸前流出。峰1和2的离子碎裂图案(参见图5)表明此两个峰是1,3-三甲基硅氧烷基辛烷和1,3-三甲基硅氧烷基癸烷,是BSTFA(参见实施例2)分别与1,3-辛二醇和1,3-癸二醇的衍生化产物。为了说明,图6展示如在图5中峰1中观测到的1,3三甲基硅氧烷基癸烷的离子片段的示意图。还观测到微量的衍生化1,3-十二烷二醇和1,3-十四烷二醇。
类似地,表达TE_CAD63310的菌株JP-11的提取物含有新峰,如上所述,基于其离子碎裂图案和保留时间,鉴别为1,3-辛二醇、1,3-癸二醇、1,3-十四烷醇和1,3-十四碳烯醇。在HTP发酵方案中,JP-11产生总共1.9±0.05g/L 1,3-二醇,以及脂肪醇,例如辛醇、癸醇、十二烷醇、十二碳烯醇、十四醇和十四碳烯醇。菌株JP-11的产物分配展示于图7中。
1,3-二醇的产生由于以下两个原因而为意外的:(i)其需要3-OH脂肪酸作为中间物,3-OH脂肪酸很可能在硫酯酶的作用下来源于3-OH酰基-ACP(参见图2)。用于此实施例中的两种硫酯酶先前已在大肠埃希氏菌中表达,且仅仅报道其产生脂肪酸(Jing等人BMCBiochemistry 2011,12:44),表明其不适合产生3-OH脂肪酸,因此不适合产生1,3-二醇,(ii)其需要3-OH脂肪酸中间物,通过羧酸还原酶CarB还原成3-OH脂肪醛,接着通过醇脱氢酶(ADH)进一步还原成1,3-二醇。虽然已知ADH相对混杂,但CarB先前未展示将3-OH脂肪酸转变成3-OH脂肪醛。因此,申请人发现某些微生物硫酯酶,例如TE_EEI82564和TE_CAD63310,在与CarB一起在大肠埃希氏菌宿主细胞中共同表达时过度产生1,3-二醇。1,3,二醇的分析可展示其高度富含(R)对映异构体,证实天然大肠埃希氏菌脂肪酸生物合成机制的3-酮酰基ACP还原酶(FabG)的对映异构体选择性。
表5:用于产生1,3-二醇的质粒
表6:用于产生1,3-二醇的菌株
实施例4A:使用具有来自加州月桂的fatB1和carB的途径产生1,3-二醇
此实施例展示了使用包括来自加州月桂(genbank登录号Q41635)的植物硫酯酶fatB1和来自解皂菌状杆菌的变异羧酸还原酶CarB的代谢途径,1,3-二醇在重组大肠埃希氏菌中的产生。
编码carB8(SEQ ID NO:8)和fatB1的基因克隆至pCL1920-衍生载体(SC101复制子,壮观霉素抗性标记物),使得其转录由IPTG-诱导性Ptrc启动子控制,且其与编码醇脱氢酶alrA的基因一起形成操纵子。质粒命名为pNH330(参见表5)。
用于质粒转化的基础菌株是菌株D178。简单地说,菌株D178的基因组如下修饰:fadE(酰基-CoA脱氢酶)基因缺失,且磷酸泛酰巯基乙氨基转移酶(entD)过度表达。质粒pNH330转化至D178中,得到菌株stNH1371(参见表6)。接着如实施例1和2中所述培养菌株并分析其产生脂肪醇和1,3-二醇的能力。1,3-二醇峰如实施例2中所述鉴别。
在HTP发酵方案中菌株stNH1371产生39.5±3.2mg/L 1,3-二醇。1,3-十二烷二醇是产生的1,3-二醇之一。除1,3-二醇外,还检出例如十二烷醇等脂肪醇。1,3,二醇的分析可展示其高度富含(R)对映异构体,证实天然大肠埃希氏菌脂肪酸生物合成机制的3-酮酰基ACP还原酶(FabG)的对映异构体选择性。
实施例4B:使用具有来自恶臭假单胞菌的phaG和carB的途径产生1,3-二醇
此实施例展示了使用包括来自恶臭假单胞菌(genbank登录号AAN67031)的硫酯酶/酰基转移酶和来自解皂菌状杆菌的变异羧酸还原酶CarB的代谢途径,1,3-二醇在重组大肠埃希氏菌中的产生。
编码carB8(参见下文与此一同封装的序列表)和phaG的基因克隆至pCL1920-衍生载体(SC101复制子,壮观霉素抗性标记物),使得其转录由IPTG-诱导性Ptrc启动子控制,且其与编码醇脱氢酶alrA的基因一起形成操纵子。质粒命名为pNH328(参见表5)。
用于质粒转化的基础菌株是菌株D178。简单地说,菌株D178的基因组如下修饰:fadE(酰基-CoA脱氢酶)基因缺失,且磷酸泛酰巯基乙氨基转移酶(entD)过度表达。质粒pNH328转化至D178中,得到菌株stNH1369(参见上文表6)。接着如实施例1和2中所述培养菌株并分析其产生脂肪醇和1,3-二醇的能力。1,3-二醇峰如实施例2中所述鉴别。
在HTP发酵方案中菌株stNH1369产生600±27mg/L 1,3-二醇。所产生的1,3-二醇是1,3-辛二醇、1,3-癸二醇、1,3-十二烷二醇和1,3-十四烷二醇。除1,3-二醇外,仅检出较少量的脂肪酸。1,3,二醇的分析可展示其高度富含(R)对映异构体,证实天然大肠埃希氏菌脂肪酸生物合成机制的3-酮酰基ACP还原酶(FabG)的对映异构体选择性。
实施例5:使用具有来自细长聚球藻的AAR的途径产生1,3-二醇
此实施例展示了使用包括来自细长聚球藻(genbank登录号YP_400611;野生型)的变异酰基-ACP还原酶AAR的代谢途径,1,3-二醇在重组大肠埃希氏菌中的产生。关于变异AAR序列参见与此一起封装的序列表(下文)。
编码AAR变异体(SEQ ID NO:2)的基因克隆至pCL1920-衍生载体(SC101复制子,壮观霉素抗性标记物),使得其转录由IPTG诱导性Ptrc启动子控制,且其与编码醇脱氢酶alrA的基因一起形成操纵子。质粒命名为pNT 16(参见表5)。
用于质粒转化的基础菌株是DV2。简单地说,通过使fadE(酰基-CoA脱氢酶)基因缺失来操纵菌株DV2的基因组。质粒pNT16转化至基础菌株DV2中,得到菌株Becos 247(参见表6)。接着如实施例1和2中所述培养Becos247并分析其产生脂肪醇的能力。意外地,菌株产生1,3-二醇。1,3-二醇峰如实施例2中所述鉴别。
菌株Becos247在5L发酵中产生0.57g/L 1,3-二醇,其占所产生的总脂肪酸物质的9.1%。所产生的1,3-二醇是1,3-十二烷二醇、1,3-十四烯二醇和1,3十四烷二醇,另外,产生脂肪醇癸醇、十二碳烯醇、十二烷醇、十四碳烯醇、十四烷醇、十六碳烯醇、十六烷醇和十八碳烯醇以及较少量的脂肪酸。
此实验中经由3-OH脂肪醛作为中间物产生1,3-二醇是意外的(参见图3),因为用于此实施例的酰基-ACP还原酶,来自细长聚球藻的野生型AAR先前已经在大肠埃希氏菌中表达,且仅仅报道从酰基-ACP产生脂肪醇,而非从3-OH酰基-ACP产生1,3-二醇(Schirmer等人(2010)Science 329,559)。1,3,二醇的分析可展示其高度富含对映异构体,证实天然大肠埃希氏菌脂肪酸生物合成机制的3-酮酰基ACP还原酶(FabG)的对映异构体选择性。
实施例6A:使用具有来自加州月桂的fatB1和carB的途径产生1,3-二醇
此实施例描述了如何使用包括来自加州月桂的植物硫酯酶fatB1和来自解皂菌状杆菌的羧酸还原酶carB的代谢途径,去证实1,3-二醇在重组大肠埃希氏菌中的产生。
编码野生型carB和fatB1的基因克隆至pCL1920-衍生载体(SC101复制子,壮观霉素抗性标记物),使得其转录由IPTG-诱导性Ptrc启动子控制,且其与编码醇脱氢酶alrA的基因一起形成操纵子。质粒转化至例如菌株DV2等基础菌株(参见实施例5)。
接着如实施例1和2中所述培养所得菌株并分析其产生脂肪醇和二醇的能力。预期菌株产生1,3-二醇。1,3,二醇的分析展示其高度富含(R)对映异构体,证实天然大肠埃希氏菌脂肪酸生物合成机制的3-酮酰基ACP还原酶(FabG)的对映异构体选择性。
实施例6B:使用具有来自加州月桂的fatB1和carB的简化途径产生1,3-二醇
此实施例描述了如何使用包括来自加州月桂的植物硫酯酶fatB1和来自解皂菌状杆菌的羧酸还原酶carB,的简化代谢途径,去证实1,3-二醇在重组大肠埃希氏菌中的产生。
编码野生型carB和fatB1的基因克隆至pCL1920-衍生载体(SC101复制子,壮观霉素抗性标记物),使得其转录由IPTG-诱导性Ptrc启动子控制。质粒转化至例如菌株DV2等基础菌株(参见实施例5)。
接着如实施例1和2中所述培养所得菌株并分析其产生脂肪醇和二醇的能力。预期菌株产生1,3-二醇,这证实硫酯酶和羧酸还原酶足以使微生物细胞能够产生1,3二醇。1,3,二醇的分析展示其高度富含(R)对映异构体,证实天然大肠埃希氏菌脂肪酸生物合成机制的3-酮酰基ACP还原酶(FabG)的对映异构体选择性。
实施例7:使用具有来自大肠埃希氏菌的tesA和carB的途径产生1,3-二醇
此实施例描述了如何使用包括硫酯酶tesA和来自解皂菌状杆菌的羧酸还原酶CarB的代谢途径,去证实1,3-二醇在重组大肠埃希氏菌中的产生。
编码野生型carB和野生型tesA的基因克隆至pCL1920-衍生载体(SC101复制子,壮观霉素抗性标记物),使得其转录由IPTG-诱导性Ptrc启动子控制,且其与编码醇脱氢酶alrA的基因一起形成操纵子。质粒转化至例如菌株DV2等基础菌株(参见实施例5)。
接着如实施例1和2中所述培养所得菌株并分析其产生脂肪醇和二醇的能力。预期菌株产生1,3-二醇,这证实硫酯酶和羧酸还原酶足以使微生物细胞能够产生1,3二醇。1,3,二醇的分析展示其高度富含(R)对映异构体,证实天然大肠埃希氏菌脂肪酸生物合成机制的3-酮酰基ACP还原酶(FabG)的对映异构体选择性。
实施例8:使用具有来自细长聚球藻的野生型AAR的简化途径产生1,3-二醇
此实施例描述了如何使用包括来自细长聚球藻的酰基-ACP还原酶AAR的代谢途径,去证实1,3-二醇在重组大肠埃希氏菌中的产生。
编码野生型AAR的基因克隆至pCL1920-衍生载体(SC101复制子,壮观霉素抗性标记物),使得其转录由IPTG诱导性Ptrc启动子控制。质粒转化至例如菌株DV2等基础菌株(参见实施例5)。
接着如实施例1和2中所述培养所得菌株并分析其产生脂肪醇和二醇的能力。预期菌株产生1,3-二醇,这证实AAR的异源产生足以使微生物细胞能够产生1,3二醇。1,3,二醇的分析展示其高度富含(R)对映异构体,证实天然大肠埃希氏菌脂肪酸生物合成机制的3-酮酰基ACP还原酶(FabG)的对映异构体选择性。
实施例9:使用具有来自樟树的fatB和carB的途径产生1,3-二醇
此实施例描述了如何使用包括来自樟树的植物硫酯酶fatB和来自解皂菌状杆菌的羧酸还原酶carB的代谢途径,去证实1,3-二醇在重组大肠埃希氏菌中的产生。
编码野生型carB和来自樟树的fatB的基因克隆至pCL1920-衍生载体(SC101复制子,壮观霉素抗性标记物),使得其转录由IPTG-诱导性Ptrc启动子控制,且其与编码醇脱氢酶alrA的基因一起形成操纵子。质粒转化至例如菌株DV2等基础菌株(参见实施例5)。
接着如实施例1和2中所述培养所得菌株并分析其产生脂肪醇和二醇的能力。预期菌株产生1,3-二醇,这证实硫酯酶和羧酸还原酶足以使微生物细胞能够产生1,3二醇。1,3,二醇的分析展示其高度富含(R)对映异构体,证实天然大肠埃希氏菌脂肪酸生物合成机制的3-酮酰基ACP还原酶(FabG)的对映异构体选择性。
实施例10:使用具有来自贝氏不动细菌(Acinetobacter baylyi)的acr1的途径产生1,3-二醇
此实施例描述了如何使用包括来自贝氏不动细菌(genbank登录号AAC45217)的脂肪酰基-CoA还原酶acr1的代谢途径,去证实1,3-二醇在重组大肠埃希氏菌中的产生。
编码acr1的基因克隆至pCL1920-衍生载体(SC101复制子,壮观霉素抗性标记物),使得其转录由IPTG-诱导性Ptrc启动子控制,且其与编码酰基-CoA合成酶(fadD)和硫酯酶的基因一起形成操纵子。质粒转化至例如菌株DV2等基础菌株(参见实施例5)。
接着如实施例1和2中所述培养所得菌株并分析其产生脂肪醇和二醇的能力。预期菌株产生1,3-二醇。
实施例11:使用具有来自水油海杆菌(Marinobacter aquaeolei)的FAR的途径产生1,3-二醇
此实施例描述了如何使用包括来自水油海杆菌(genbank登录号YP_959486)的脂肪酰基-ACP还原酶FAR的代谢途径,去证实1,3-二醇在重组大肠埃希氏菌中的产生。
编码野生型FAR的基因克隆至pCL1920-衍生载体(SC101复制子,壮观霉素抗性标记物),使得其转录由IPTG-诱导性Ptrc启动子控制。质粒转化至例如菌株DV2等基础菌株(参见实施例5)。
接着如实施例1和2中所述培养所得菌株并分析其产生脂肪醇和二醇的能力。预期菌株产生1,3-二醇,这证实异源产生的FAR足以使微生物细胞能够产生1,3二醇。
实施例12:使用具有来自发光杆菌(Photorhabdus luminescens)的FAR复合物的途径产生1,3-二醇
此实施例描述了如何使用包括来自发光杆菌(genbank登录号AHH25015-17)的脂肪酰基-ACP还原酶FAR复合物(包括LuxC、LuxD和LuxE)的代谢途径,去证实1,3-二醇在重组大肠埃希氏菌中的产生。
编码LuxC、LuxD和LuxE的基因克隆至pCL1920-衍生载体(SC101复制子,壮观霉素抗性标记物),使得其转录由IPTG-诱导性Ptrc启动子控制,且其与编码醇脱氢酶alrA的基因一起形成操纵子。质粒转化至例如菌株DV2等基础菌株(参见实施例5)。
接着如实施例1和2中所述培养所得菌株并分析其产生脂肪醇和二醇的能力。预期菌株产生1,3-二醇。
实施例13:使用fadB(His450Gln)产生3-(S)-脂肪二醇
此实施例描述了如何使用包括保留烯酰基-CoA水合酶活性但是缺乏脱氢酶活性且表达来自贝氏不动细菌(genbank登录号AAC45217)的脂肪酰基-CoA还原酶acr1的3-羟基-酰基-ACP酰基-CoA酰基转移酶或硫酯酶fadB(His450Gln)的代谢途径,去证实3-(S)-脂肪二醇在重组大肠埃希氏菌中的产生。
编码TesA、FadD、FadB(His450Gln)和Acr1的基因克隆至pCL1920-衍生载体(SC101复制子,壮观霉素抗性标记物),使得其转录由IPTG-诱导性Ptrc启动子控制,且其实现足以合成脂肪醇的操纵子。质粒转化至例如菌株MG1655等基础菌株(参见实施例5),其中编码FadE的额外基因已在IPTG诱导性Ptrc启动子控制下引入基因组中。
接着如实施例1和2中所述培养所得菌株并分析其产生脂肪醇和二醇的能力。预期菌株产生3-(S)-脂肪二醇。
实施例14.使用fadB(Glu119Gln)产生3-(S)-脂肪二醇
此实施例描述了如何使用包括保留脱氢酶活性但是缺乏脱水酶活性且表达来自贝氏不动细菌(genbank登录号AAC45217)的脂肪酰基-CoA还原酶acr1的3-羟基-酰基-ACP酰基-CoA酰基转移酶或硫酯酶fadB(Glu119Gln)的代谢途径,去证实3-(S)-脂肪二醇在重组大肠埃希氏菌中的产生。
编码TesA、FadD、FadB(Glu119Gln)和Acr1的基因克隆至pCL1920-衍生载体(SC101复制子,壮观霉素抗性标记物),使得其转录由IPTG-诱导性Ptrc启动子控制,且其实现足以合成脂肪醇的操纵子。质粒转化至例如菌株MG1655等基础菌株(参见实施例5),其中编码FadA的额外基因已在IPTG诱导性Ptrc启动子控制下引入基因组。
接着如实施例1和2中所述培养所得菌株并分析其产生脂肪醇和二醇的能力。预期菌株产生3-(S)-脂肪二醇。
如本领域技术人员显而易见,在不脱离本公开的精神和范围下可以对以上方面和实施方案进行各种修改和改变。此类修改和改变在本公开的范围内。
序列表
<110> REG Life Sciences, LLC
<120> 脂肪二醇的微生物生产
<130> LS00052PCT
<140>
<141>
<150> 62/026,573
<151> 2014-07-18
<160> 8
<170> PatentIn 3.5版
<210> 1
<211> 342
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /注释=“人工序列的描述:合成AAR变异多肽”
<400> 1
Met Ala Phe Gly Leu Ile Gly His Ala Thr Ser Leu Glu Gln Ala Arg
1 5 10 15
Asp Val Trp Arg Arg Leu Gly Tyr Asp Glu Tyr Ala Asp Gln Gly Leu
20 25 30
Glu Phe Trp Ser Ser Ala Pro Pro Gln Ile Val Asp Glu Ile Thr Val
35 40 45
Thr Ser Ala Thr Gly Lys Val Ile His Gly Arg Tyr Ile Glu Ser Gly
50 55 60
Phe Leu Pro Glu Met Leu Ala Ala Arg Arg Phe Lys Thr Ala Thr Arg
65 70 75 80
Lys Val Leu Asn Ala Met Ser His Ala Gln Lys His Gly Ile Asp Ile
85 90 95
Ser Ala Leu Gly Gly Phe Thr Ser Ile Ile Phe Glu Asn Phe Asp Leu
100 105 110
Ala Lys Leu Arg Gln Val Arg Asp Thr Thr Leu Glu Phe Glu Arg Phe
115 120 125
Thr Thr Gly Asn Thr His Thr Ala Tyr Val Ile Cys Arg Gln Val Glu
130 135 140
Ala Ala Ala Lys Thr Leu Gly Ile Asp Ile Ala Gln Ala Thr Val Ala
145 150 155 160
Val Val Gly Ala Thr Gly Asp Ile Gly Ser Ala Val Cys Arg Trp Leu
165 170 175
Asp Leu Lys Leu Gly Val Gly Asp Leu Ile Leu Thr Ala Arg Asn Gln
180 185 190
Glu Arg Leu Asp Asn Leu Gln Ala Glu Leu Gly Arg Gly Lys Ile Leu
195 200 205
Pro Leu Glu Ala Ala Leu Pro Glu Ala Asp Phe Ile Val Trp Val Ala
210 215 220
Ser Met Pro Gln Gly Val Val Ile Asp Pro Ala Thr Leu Lys Gln Pro
225 230 235 240
Cys Val Leu Ile Asp Gly Gly Tyr Pro Lys Asn Leu Gly Ser Lys Val
245 250 255
Gln Gly Glu Gly Ile Tyr Val Leu Asn Gly Gly Val Val Glu His Cys
260 265 270
Phe Asp Ile Asp Trp Gln Ile Met Ser Leu Ala Glu Met Ala Arg Pro
275 280 285
Glu Arg Gln Met Phe Ala Cys Phe Ala Glu Ala Met Leu Leu Glu Phe
290 295 300
Glu Gly Trp His Thr Asn Phe Ser Trp Gly Arg Asn Gln Ile Thr Ile
305 310 315 320
Glu Lys Met Glu Ala Ile Gly Glu Ala Ser Val Arg His Gly Phe Gln
325 330 335
Pro Leu Ala Leu Ala Ile
340
<210> 2
<211> 1029
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注释=“人工序列的描述:合成AAR变异多核苷酸”
<400> 2
atggcattcg gtcttatcgg tcatgcaacc agtttggagc aggcccgcga cgtttggcgc 60
aggctgggct acgacgaata cgccgatcaa ggattggagt tttggagtag cgctcctcct 120
caaatcgttg atgaaatcac agtcaccagt gccacaggca aggtgattca cggtcgctac 180
atcgaatcgg ggttcttgcc ggaaatgctg gcggcgcgcc gcttcaaaac agcaacgcgc 240
aaagttctca atgccatgtc ccatgcccaa aaacacggca tcgacatctc ggccttgggg 300
ggctttacct cgattatttt cgagaatttc gatttggcca agttgcggca agtgcgcgac 360
actaccttgg agtttgaacg gttcaccacc ggcaatactc acacggccta cgtaatctgt 420
agacaggtgg aagccgctgc taaaacgctg ggcatcgaca ttgcgcaagc gacagtagcg 480
gttgtcggcg cgactggcga tatcggtagc gctgtctgcc gctggctcga cctcaaactg 540
ggtgtcggtg atttgatcct gacggcgcgc aatcaggagc gtttggataa cctgcaggct 600
gaactcggcc ggggcaagat tctgcccttg gaagccgctc tgccggaagc tgactttatc 660
gtgtgggtcg ccagtatgcc tcagggcgta gtgatcgacc cagcaaccct gaagcaaccc 720
tgcgtcctaa tcgacggggg ctaccccaaa aacttgggca gcaaagtcca aggtgagggc 780
atctatgtcc tcaatggcgg ggtagttgaa cattgcttcg acatcgactg gcagatcatg 840
tccttggcag agatggcgcg gcccgagcgc cagatgtttg cctgctttgc cgaggcgatg 900
ctcttggaat ttgaaggctg gcatactaac ttctcctggg gccgcaacca aatcacgatc 960
gagaagatgg aagcgatcgg tgaggcatcg gtgcgccacg gcttccaacc cttggcattg 1020
gcaatttga 1029
<210> 3
<211> 1174
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /注释=“人工序列的描述:合成CAR变异多肽”
<400> 3
Met Gly Thr Ser Asp Val His Asp Ala Thr Asp Gly Val Thr Glu Thr
1 5 10 15
Ala Leu Arg Asp Arg Gln Arg Thr Arg Arg Ile Ala Glu Leu Tyr Ala
20 25 30
Thr Asp Pro Glu Phe Ala Ala Ala Ala Pro Leu Pro Ala Val Val Asp
35 40 45
Ala Ala His Lys Pro Gly Leu Arg Leu Ala Glu Ile Leu Gln Thr Leu
50 55 60
Phe Thr Gly Tyr Gly Asp Arg Pro Ala Leu Gly Tyr Arg Ala Arg Glu
65 70 75 80
Leu Ala Thr Asp Glu Gly Gly Arg Thr Val Thr Arg Leu Leu Pro Arg
85 90 95
Phe Asp Thr Leu Thr Tyr Ala Gln Val Trp Ser Arg Val Gln Ala Val
100 105 110
Ala Ala Ala Leu Arg His Asn Phe Ala Gln Pro Ile Tyr Pro Gly Asp
115 120 125
Ala Val Ala Thr Ile Gly Phe Ala Ser Pro Asp Tyr Leu Thr Leu Asp
130 135 140
Leu Val Cys Ala Tyr Leu Gly Leu Val Ser Val Pro Leu Gln His Asn
145 150 155 160
Ala Pro Val Ser Arg Leu Ala Pro Ile Leu Ala Glu Val Glu Pro Arg
165 170 175
Ile Leu Thr Val Ser Ala Glu Tyr Leu Asp Leu Ala Val Glu Ser Val
180 185 190
Arg Asp Val Asn Ser Val Ser Gln Leu Val Val Phe Asp His His Pro
195 200 205
Glu Val Asp Asp His Arg Asp Ala Leu Ala Arg Ala Arg Glu Gln Leu
210 215 220
Ala Gly Lys Gly Ile Ala Val Thr Thr Leu Asp Ala Ile Ala Asp Glu
225 230 235 240
Gly Ala Gly Leu Pro Ala Glu Pro Ile Tyr Thr Ala Asp His Asp Gln
245 250 255
Arg Leu Ala Met Ile Leu Tyr Thr Ser Gly Ser Thr Gly Ala Pro Lys
260 265 270
Gly Ala Met Tyr Thr Glu Ala Met Val Ala Arg Leu Trp Thr Met Ser
275 280 285
Gly Ile Thr Gly Asp Pro Thr Pro Val Ile Asn Val Asn Phe Met Pro
290 295 300
Leu Asn His Leu Gly Gly Arg Ile Pro Ile Ser Thr Ala Val Gln Asn
305 310 315 320
Gly Gly Thr Ser Tyr Phe Val Pro Glu Ser Asp Met Ser Thr Leu Phe
325 330 335
Glu Asp Leu Ala Leu Val Arg Pro Thr Glu Leu Gly Leu Val Pro Arg
340 345 350
Val Ala Asp Met Leu Tyr Gln His His Leu Ala Thr Val Asp Arg Leu
355 360 365
Val Thr Gln Gly Ala Asp Glu Leu Thr Ala Glu Lys Gln Ala Gly Ala
370 375 380
Glu Leu Arg Glu Gln Val Leu Gly Gly Arg Val Ile Thr Gly Phe Val
385 390 395 400
Ser Thr Ala Pro Leu Ala Ala Glu Met Arg Ala Phe Leu Asp Ile Thr
405 410 415
Leu Gly Ala His Ile Val Asp Gly Tyr Gly Leu Thr Glu Thr Gly Ala
420 425 430
Val Thr Arg Asp Gly Val Ile Val Arg Pro Pro Val Ile Asp Tyr Lys
435 440 445
Leu Ile Asp Val Pro Glu Leu Gly Tyr Phe Ser Thr Asp Lys Pro Tyr
450 455 460
Pro Arg Gly Glu Leu Leu Val Arg Ser Ile Thr Leu Thr Pro Gly Tyr
465 470 475 480
Tyr Lys Arg Pro Glu Val Thr Ala Ser Val Phe Asp Arg Asp Gly Tyr
485 490 495
Tyr His Thr Gly Asp Val Met Ala Glu Thr Ala Pro Asp His Leu Val
500 505 510
Tyr Val Asp Arg Arg Asn Asn Val Leu Lys Leu Ala Gln Gly Glu Phe
515 520 525
Val Ala Val Ala Asn Leu Glu Ser Val Phe Ser Gly Ala Ala Leu Val
530 535 540
Arg Gln Ile Phe Val Tyr Gly Asn Ser Glu Arg Ser Phe Leu Leu Ala
545 550 555 560
Val Val Val Pro Thr Pro Glu Ala Leu Glu Gln Tyr Asp Pro Ala Ala
565 570 575
Leu Lys Ala Ala Leu Ala Asp Ser Leu Gln Arg Thr Ala Arg Asp Ala
580 585 590
Glu Leu Gln Ser Tyr Glu Val Pro Ala Asp Phe Ile Val Glu Thr Glu
595 600 605
Pro Phe Ser Ala Ala Asn Gly Leu Leu Ser Gly Val Gly Lys Leu Leu
610 615 620
Arg Pro Asn Leu Lys Asp Arg Tyr Gly Gln Arg Leu Glu Gln Met Tyr
625 630 635 640
Ala Asp Ile Ala Ala Thr Gln Ala Asn Gln Leu Arg Glu Leu Arg Arg
645 650 655
Ala Ala Ala Thr Gln Pro Val Ile Asp Thr Leu Thr Gln Ala Ala Ala
660 665 670
Thr Ile Leu Gly Thr Gly Ser Glu Val Ala Ser Asp Ala His Phe Thr
675 680 685
Asp Leu Gly Gly Asp Ser Leu Ser Ala Leu Thr Leu Ser Asn Leu Leu
690 695 700
Ser Asp Phe Phe Gly Phe Glu Val Pro Val Gly Thr Ile Val Asn Pro
705 710 715 720
Ala Thr Asn Leu Ala Gln Leu Ala Gln His Ile Glu Ala Gln Arg Thr
725 730 735
Ala Gly Asp Arg Arg Pro Ser Phe Thr Thr Val His Gly Ala Asp Ala
740 745 750
Thr Glu Ile Arg Ala Ser Glu Leu Thr Leu Asp Lys Phe Ile Asp Ala
755 760 765
Glu Thr Leu Arg Ala Ala Pro Gly Leu Pro Lys Val Thr Thr Glu Pro
770 775 780
Arg Thr Val Leu Leu Ser Gly Ala Asn Gly Trp Leu Gly Arg Phe Leu
785 790 795 800
Thr Leu Gln Trp Leu Glu Arg Leu Ala Pro Val Gly Gly Thr Leu Ile
805 810 815
Thr Ile Val Arg Gly Arg Asp Asp Ala Ala Ala Cys Ala Arg Leu Thr
820 825 830
Gln Ala Tyr Asp Thr Asp Pro Glu Leu Ser Arg Arg Phe Ala Glu Leu
835 840 845
Ala Asp Arg His Leu Arg Val Val Ala Gly Asp Ile Gly Asp Gln Asn
850 855 860
Leu Gly Leu Thr Pro Glu Leu Trp His Arg Leu Ala Ala Glu Val Asp
865 870 875 880
Leu Val Val His Pro Ala Ala Leu Val Asn His Val Leu Pro Tyr Arg
885 890 895
Gln Leu Phe Gly Pro Asn Val Val Gly Thr Ala Glu Val Ile Lys Leu
900 905 910
Ala Leu Thr Glu Arg Ile Lys Pro Val Thr Tyr Leu Ser Thr Ala Lys
915 920 925
Val Ala Met Gly Ile Pro Asp Phe Glu Glu Asp Gly Asp Ile Arg Thr
930 935 940
Val Ser Pro Val Arg Pro Leu Asp Gly Gly Tyr Ala Asn Gly Tyr Gly
945 950 955 960
Asn Ser Lys Trp Ala Gly Glu Val Leu Leu Arg Glu Ala His Asp Leu
965 970 975
Cys Gly Leu Pro Val Ala Thr Phe Arg Ser Asp Met Ile Leu Ala His
980 985 990
Pro Arg Tyr Arg Gly Gln Val Asn Val Pro Asp Met Phe Thr Arg Leu
995 1000 1005
Leu Leu Ser Leu Leu Ile Thr Gly Val Ala Pro Arg Ser Phe Tyr
1010 1015 1020
Ile Gly Asp Gly Glu Arg Pro Arg Ala His Tyr Pro Gly Leu Thr
1025 1030 1035
Val Asp Phe Val Ala Glu Ala Val Thr Thr Leu Gly Ala Gln Gln
1040 1045 1050
Arg Glu Gly Tyr Val Ser Tyr Asp Val Met Asn Pro His Asp Asp
1055 1060 1065
Gly Ile Ser Leu Asp Val Phe Val Asp Trp Leu Ile Arg Ala Gly
1070 1075 1080
His Pro Ile Asp Arg Val Asp Asp Tyr Asp Asp Trp Val Arg Arg
1085 1090 1095
Phe Glu Thr Ala Leu Thr Ala Leu Pro Glu Lys Arg Arg Ala Gln
1100 1105 1110
Thr Val Leu Pro Leu Leu His Ala Phe Arg Ala Pro Gln Ala Pro
1115 1120 1125
Leu Arg Gly Ala Pro Glu Pro Thr Glu Val Phe His Ala Ala Val
1130 1135 1140
Arg Thr Ala Lys Val Gly Pro Gly Asp Ile Pro His Leu Asp Glu
1145 1150 1155
Ala Leu Ile Asp Lys Tyr Ile Arg Asp Leu Arg Glu Phe Gly Leu
1160 1165 1170
Ile
<210> 4
<211> 3525
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注释=“人工序列的描述:合成CAR变异(carB12)多核苷酸”
<400> 4
atgggcacga gcgatgttca cgacgcgacc gacggcgtta ccgagactgc actgcgtgat 60
cgccagcgca ctcgtcgtat tgcagaactg tacgcaacgg acccagagtt cgcagcagca 120
gctcctctgc cggccgttgt cgatgcggcg cacaaaccgg gcctgcgtct ggcggaaatc 180
ctgcagaccc tgttcaccgg ctacggcgat cgtccggcgc tgggctatcg tgcacgtgag 240
ctggcgacgg acgaaggcgg tcgtacggtc acgcgtctgc tgccgcgctt cgataccctg 300
acctatgcac aggtgtggag ccgtgttcaa gcagtggctg cagcgttgcg tcacaatttc 360
gcacaaccga tttacccggg cgacgcggtc gcgactatcg gctttgcgag cccggactat 420
ttgacgctgg atctggtgtg cgcgtatctg ggcctggtca gcgttccttt gcagcataac 480
gctccggtgt ctcgcctggc cccgattctg gccgaggtgg aaccgcgtat tctgacggtg 540
agcgcagaat acctggacct ggcggttgaa tccgtccgtg atgtgaactc cgtcagccag 600
ctggttgttt tcgaccatca tccggaagtg gacgatcacc gtgacgcact ggctcgcgca 660
cgcgagcagc tggccggcaa aggtatcgca gttacgaccc tggatgcgat cgcagacgaa 720
ggcgcaggtt tgccggctga gccgatttac acggcggatc acgatcagcg tctggccatg 780
attctgtata ccagcggctc tacgggtgct ccgaaaggcg cgatgtacac cgaagcgatg 840
gtggctcgcc tgtggactat gagcgggatc acgggcgacc cgaccccggt tatcaacgtg 900
aacttcatgc cgctgaacca tctgggcggt cgtatcccga ttagcaccgc cgtgcagaat 960
ggcggtacca gctacttcgt tccggaaagc gacatgagca cgctgtttga ggatctggcc 1020
ctggtccgcc ctaccgaact gggtctggtg ccgcgtgttg cggacatgct gtaccagcat 1080
catctggcga ccgtggatcg cctggtgacc cagggcgcgg acgaactgac tgcggaaaag 1140
caggccggtg cggaactgcg tgaacaggtc ttgggcggtc gtgttatcac cggttttgtt 1200
tccaccgcgc cgttggcggc agagatgcgt gcttttctgg atatcacctt gggtgcacac 1260
atcgttgacg gttacggtct gaccgaaacc ggtgcggtca cccgtgatgg tgtgattgtt 1320
cgtcctccgg tcattgatta caagctgatc gatgtgccgg agctgggtta cttctccacc 1380
gacaaaccgt acccgcgtgg cgagctgctg gttcgtagca tcacgttgac tccgggttac 1440
tacaagcgcc cagaagtcac cgcgtccgtt ttcgatcgcg acggctatta ccacaccggc 1500
gacgtgatgg cagaaaccgc gccagaccac ctggtgtatg tggaccgccg caacaatgtt 1560
ctgaagctgg cgcaaggtga atttgtcgcc gtggctaacc tggagtccgt tttcagcggc 1620
gctgctctgg tccgccagat tttcgtgtat ggtaacagcg agcgcagctt tctgttggct 1680
gttgttgtcc ctaccccgga ggcgctggag caatacgacc ctgccgcatt gaaagcagcc 1740
ctggcggatt cgctgcagcg tacggcgcgt gatgccgagc tgcagagcta tgaagtgccg 1800
gcggacttca ttgttgagac tgagcctttt agcgctgcga acggtctgct gagcggtgtt 1860
ggcaagttgc tgcgtccgaa tttgaaggat cgctacggtc agcgtttgga gcagatgtac 1920
gcggacatcg cggctacgca ggcgaaccaa ttgcgtgagc tgcgtcgcgc tgcggctact 1980
caaccggtga tcgacacgct gacgcaagct gcggcgacca tcctgggtac cggcagcgag 2040
gttgcaagcg acgcacactt tactgatttg ggcggtgatt ctctgagcgc gctgacgttg 2100
agcaacttgc tgtctgactt ctttggcttt gaagtcccgg ttggcacgat tgttaaccca 2160
gcgactaatc tggcacagct ggcgcaacat atcgaggcgc agcgcacggc gggtgaccgc 2220
cgtccatcct ttacgacggt ccacggtgcg gatgctacgg aaatccgtgc aagcgaactg 2280
actctggaca aattcatcga cgctgagact ctgcgcgcag cacctggttt gccgaaggtt 2340
acgactgagc cgcgtacggt cctgttgagc ggtgccaatg gttggttggg ccgcttcctg 2400
accctgcagt ggctggaacg tttggcaccg gttggcggta ccctgatcac cattgtgcgc 2460
ggtcgtgacg atgcagcggc ctgtgcacgc ttgactcagg cttacgatac ggacccagag 2520
ctgtcccgcc gcttcgctga gttggcggat cgccacttgc gtgtggtggc aggtgatatc 2580
ggcgatcaga atctgggcct gaccccggag ctgtggcacc gtctggcagc agaggtcgat 2640
ctggtcgttc atccagcggc cctggtcaac cacgtcctgc cgtaccgcca gctgtttggt 2700
ccgaatgttg ttggcaccgc cgaagttatc aagttggctc tgaccgagcg catcaagcct 2760
gttacctacc tgtccacggc gaaggtcgcg atgggtattc ctgattttga ggaggacggt 2820
gacattcgta ccgtcagccc ggttcgtccg ctggatggtg gctatgcaaa tggctatggc 2880
aacagcaagt gggctggcga ggtgctgctg cgcgaggcac atgacctgtg tggcctgccg 2940
gttgcgacgt ttcgtagcga catgattctg gcccacccgc gctaccgtgg ccaagtgaat 3000
gtgccggaca tgttcacccg tctgctgctg tccctgctga tcacgggtgt ggcaccgcgt 3060
tccttctaca ttggtgatgg cgagcgtccg cgtgcacact acccgggcct gaccgtcgat 3120
tttgttgcgg aagcggttac taccctgggt gctcagcaac gtgagggtta tgtctcgtat 3180
gacgttatga atccgcacga tgacggtatt agcttggatg tctttgtgga ctggctgatt 3240
cgtgcgggcc acccaattga ccgtgttgac gactatgatg actgggtgcg tcgttttgaa 3300
accgcgttga ccgccttgcc ggagaaacgt cgtgcgcaga ccgttctgcc gctgctgcat 3360
gcctttcgcg cgccacaggc gccgttgcgt ggcgcccctg aaccgaccga agtgtttcat 3420
gcagcggtgc gtaccgctaa agtcggtccg ggtgatattc cgcacctgga tgaagccctg 3480
atcgacaagt acatccgtga cctgcgcgag ttcggtctga tttag 3525
<210> 5
<211> 1173
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /注释=“人工序列的描述:合成CAR变异(carB2)多肽”
<400> 5
Met Thr Ser Asp Val His Asp Ala Thr Asp Gly Val Thr Glu Thr Ala
1 5 10 15
Leu Asp Asp Arg Gln Ser Thr Arg Arg Ile Ala Glu Leu Tyr Ala Thr
20 25 30
Asp Pro Glu Phe Ala Ala Ala Ala Pro Leu Pro Ala Val Val Asp Ala
35 40 45
Ala His Lys Pro Gly Leu Arg Leu Ala Glu Ile Leu Gln Thr Leu Phe
50 55 60
Thr Gly Tyr Gly Asp Arg Pro Ala Leu Gly Tyr Arg Ala Arg Glu Leu
65 70 75 80
Ala Thr Asp Glu Gly Gly Arg Thr Val Thr Arg Leu Leu Pro Arg Phe
85 90 95
Asp Thr Leu Thr Tyr Ala Gln Val Trp Ser Arg Val Gln Ala Val Ala
100 105 110
Ala Ala Leu Arg His Asn Phe Ala Gln Pro Ile Tyr Pro Gly Asp Ala
115 120 125
Val Ala Thr Ile Gly Phe Ala Ser Pro Asp Tyr Leu Thr Leu Asp Leu
130 135 140
Val Cys Ala Tyr Leu Gly Leu Val Ser Val Pro Leu Gln His Asn Ala
145 150 155 160
Pro Val Ser Arg Leu Ala Pro Ile Leu Ala Glu Val Glu Pro Arg Ile
165 170 175
Leu Thr Val Ser Ala Glu Tyr Leu Asp Leu Ala Val Glu Ser Val Arg
180 185 190
Asp Val Asn Ser Val Ser Gln Leu Val Val Phe Asp His His Pro Glu
195 200 205
Val Asp Asp His Arg Asp Ala Leu Ala Arg Ala Arg Glu Gln Leu Ala
210 215 220
Gly Lys Gly Ile Ala Val Thr Thr Leu Asp Ala Ile Ala Asp Glu Gly
225 230 235 240
Ala Gly Leu Pro Ala Glu Pro Ile Tyr Thr Ala Asp His Asp Gln Arg
245 250 255
Leu Ala Met Ile Leu Tyr Thr Ser Gly Ser Thr Gly Ala Pro Lys Gly
260 265 270
Ala Met Tyr Thr Glu Ala Met Val Ala Arg Leu Trp Thr Met Ser Gly
275 280 285
Ile Thr Gly Asp Pro Thr Pro Val Ile Asn Val Asn Phe Met Pro Leu
290 295 300
Asn His Leu Gly Gly Arg Ile Pro Ile Ser Thr Ala Val Gln Asn Gly
305 310 315 320
Gly Thr Ser Tyr Phe Val Pro Glu Ser Asp Met Ser Thr Leu Phe Glu
325 330 335
Asp Leu Ala Leu Val Arg Pro Thr Glu Leu Gly Leu Val Pro Arg Val
340 345 350
Ala Asp Met Leu Tyr Gln His His Leu Ala Thr Val Asp Arg Leu Val
355 360 365
Thr Gln Gly Ala Asp Glu Leu Thr Ala Glu Lys Gln Ala Gly Ala Glu
370 375 380
Leu Arg Glu Gln Val Leu Gly Gly Arg Val Ile Thr Gly Phe Val Ser
385 390 395 400
Thr Ala Pro Leu Ala Ala Glu Met Arg Ala Phe Leu Asp Ile Thr Leu
405 410 415
Gly Ala His Ile Val Asp Gly Tyr Gly Leu Thr Glu Thr Gly Ala Val
420 425 430
Thr Arg Asp Gly Val Ile Val Arg Pro Pro Val Ile Asp Tyr Lys Leu
435 440 445
Ile Asp Val Pro Glu Leu Gly Tyr Phe Ser Thr Asp Lys Pro Tyr Pro
450 455 460
Arg Gly Glu Leu Leu Val Arg Ser Ile Thr Leu Thr Pro Gly Tyr Tyr
465 470 475 480
Lys Arg Pro Glu Val Thr Ala Ser Val Phe Asp Arg Asp Gly Tyr Tyr
485 490 495
His Thr Gly Asp Val Met Ala Glu Thr Ala Pro Asp His Leu Val Tyr
500 505 510
Val Asp Arg Arg Asn Asn Val Leu Lys Leu Ala Gln Gly Glu Phe Val
515 520 525
Ala Val Ala Asn Leu Glu Ser Val Phe Ser Gly Ala Ala Leu Val Arg
530 535 540
Gln Ile Phe Val Tyr Gly Asn Ser Glu Arg Ser Phe Leu Leu Ala Val
545 550 555 560
Val Val Pro Thr Pro Glu Ala Leu Glu Gln Tyr Asp Pro Ala Ala Leu
565 570 575
Lys Ala Ala Leu Ala Asp Ser Leu Gln Arg Thr Ala Arg Asp Ala Glu
580 585 590
Leu Gln Ser Tyr Glu Val Pro Ala Asp Phe Ile Val Glu Thr Glu Pro
595 600 605
Phe Ser Ala Ala Asn Gly Leu Leu Ser Gly Val Gly Lys Leu Leu Arg
610 615 620
Pro Asn Leu Lys Asp Arg Tyr Gly Gln Arg Leu Glu Gln Met Tyr Ala
625 630 635 640
Asp Ile Ala Ala Thr Gln Ala Asn Gln Leu Arg Glu Leu Arg Arg Ala
645 650 655
Ala Ala Thr Gln Pro Val Ile Asp Thr Leu Thr Gln Ala Ala Ala Thr
660 665 670
Ile Leu Gly Thr Gly Ser Glu Val Ala Ser Asp Ala His Phe Thr Asp
675 680 685
Leu Gly Gly Asp Ser Leu Ser Ala Leu Thr Leu Ser Asn Leu Leu Ser
690 695 700
Asp Phe Phe Gly Phe Glu Val Pro Val Gly Thr Ile Val Asn Pro Ala
705 710 715 720
Thr Asn Leu Ala Gln Leu Ala Gln His Ile Glu Ala Gln Arg Thr Ala
725 730 735
Gly Asp Arg Arg Pro Ser Phe Thr Thr Val His Gly Ala Asp Ala Thr
740 745 750
Glu Ile Arg Ala Ser Glu Leu Thr Leu Asp Lys Phe Ile Asp Ala Glu
755 760 765
Thr Leu Arg Ala Ala Pro Gly Leu Pro Lys Val Thr Thr Glu Pro Arg
770 775 780
Thr Val Leu Leu Ser Gly Ala Asn Gly Trp Leu Gly Arg Phe Leu Thr
785 790 795 800
Leu Gln Trp Leu Glu Arg Leu Ala Pro Val Gly Gly Thr Leu Ile Thr
805 810 815
Ile Val Arg Gly Arg Asp Asp Ala Ala Ala Arg Ala Arg Leu Thr Gln
820 825 830
Ala Tyr Asp Thr Asp Pro Glu Leu Ser Arg Arg Phe Ala Glu Leu Ala
835 840 845
Asp Arg His Leu Arg Val Val Ala Gly Asp Ile Gly Asp Pro Asn Leu
850 855 860
Gly Leu Thr Pro Glu Ile Trp His Arg Leu Ala Ala Glu Val Asp Leu
865 870 875 880
Val Val His Pro Ala Ala Leu Val Asn His Val Leu Pro Tyr Arg Gln
885 890 895
Leu Phe Gly Pro Asn Val Val Gly Thr Ala Glu Val Ile Lys Leu Ala
900 905 910
Leu Thr Glu Arg Ile Lys Pro Val Thr Tyr Leu Ser Thr Val Ser Val
915 920 925
Ala Met Gly Ile Pro Asp Phe Glu Glu Asp Gly Asp Ile Arg Thr Val
930 935 940
Ser Pro Val Arg Pro Leu Asp Gly Gly Tyr Ala Asn Gly Tyr Gly Asn
945 950 955 960
Ser Lys Trp Ala Gly Glu Val Leu Leu Arg Glu Ala His Asp Leu Cys
965 970 975
Gly Leu Pro Val Ala Thr Phe Arg Ser Asp Met Ile Leu Ala His Pro
980 985 990
Arg Tyr Arg Gly Gln Val Asn Val Pro Asp Met Phe Thr Arg Leu Leu
995 1000 1005
Leu Ser Leu Leu Ile Thr Gly Val Ala Pro Arg Ser Phe Tyr Ile
1010 1015 1020
Gly Asp Gly Glu Arg Pro Arg Ala His Tyr Pro Gly Leu Thr Val
1025 1030 1035
Asp Phe Val Ala Glu Ala Val Thr Thr Leu Gly Ala Gln Gln Arg
1040 1045 1050
Glu Gly Tyr Val Ser Tyr Asp Val Met Asn Pro His Asp Asp Gly
1055 1060 1065
Ile Ser Leu Asp Val Phe Val Asp Trp Leu Ile Arg Ala Gly His
1070 1075 1080
Pro Ile Asp Arg Val Asp Asp Tyr Asp Asp Trp Val Arg Arg Phe
1085 1090 1095
Glu Thr Ala Leu Thr Ala Leu Pro Glu Lys Arg Arg Ala Gln Thr
1100 1105 1110
Val Leu Pro Leu Leu His Ala Phe Arg Ala Pro Gln Ala Pro Leu
1115 1120 1125
Arg Gly Ala Pro Glu Pro Thr Glu Val Phe His Ala Ala Val Arg
1130 1135 1140
Thr Ala Lys Val Gly Pro Gly Asp Ile Pro His Leu Asp Glu Ala
1145 1150 1155
Leu Ile Asp Lys Tyr Ile Arg Asp Leu Arg Glu Phe Gly Leu Ile
1160 1165 1170
<210> 6
<211> 3525
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注释=“人工序列的描述:合成CAR变异(carB2)多核苷酸”
<400> 6
atgggcacga gcgatgttca cgacgcgacc gacggcgtta ccgagactgc actggatgat 60
cgccagagca ctcgtcgtat tgcagaactg tacgcaacgg acccagagtt cgcagcagca 120
gctcctctgc cggccgttgt cgatgcggcg cacaaaccgg gcctgcgtct ggcggaaatc 180
ctgcagaccc tgttcaccgg ctacggcgat cgtccggcgc tgggctatcg tgcacgtgag 240
ctggcgacgg acgaaggcgg tcgtacggtc acgcgtctgc tgccgcgctt cgataccctg 300
acctatgcac aggtgtggag ccgtgttcaa gcagtggctg cagcgttgcg tcacaatttc 360
gcacaaccga tttacccggg cgacgcggtc gcgactatcg gctttgcgag cccggactat 420
ttgacgctgg atctggtgtg cgcgtatctg ggcctggtca gcgttccttt gcagcataac 480
gctccggtgt ctcgcctggc cccgattctg gccgaggtgg aaccgcgtat tctgacggtg 540
agcgcagaat acctggacct ggcggttgaa tccgtccgtg atgtgaactc cgtcagccag 600
ctggttgttt tcgaccatca tccggaagtg gacgatcacc gtgacgcact ggctcgcgca 660
cgcgagcagc tggccggcaa aggtatcgca gttacgaccc tggatgcgat cgcagacgaa 720
ggcgcaggtt tgccggctga gccgatttac acggcggatc acgatcagcg tctggccatg 780
attctgtata ccagcggctc tacgggtgct ccgaaaggcg cgatgtacac cgaagcgatg 840
gtggctcgcc tgtggactat gagcgggatc acgggcgacc cgaccccggt tatcaacgtg 900
aacttcatgc cgctgaacca tctgggcggt cgtatcccga ttagcaccgc cgtgcagaat 960
ggcggtacca gctacttcgt tccggaaagc gacatgagca cgctgtttga ggatctggcc 1020
ctggtccgcc ctaccgaact gggtctggtg ccgcgtgttg cggacatgct gtaccagcat 1080
catctggcga ccgtggatcg cctggtgacc cagggcgcgg acgaactgac tgcggaaaag 1140
caggccggtg cggaactgcg tgaacaggtc ttgggcggtc gtgttatcac cggttttgtt 1200
tccaccgcgc cgttggcggc agagatgcgt gcttttctgg atatcacctt gggtgcacac 1260
atcgttgacg gttacggtct gaccgaaacc ggtgcggtca cccgtgatgg tgtgattgtt 1320
cgtcctccgg tcattgatta caagctgatc gatgtgccgg agctgggtta cttctccacc 1380
gacaaaccgt acccgcgtgg cgagctgctg gttcgtagca tcacgttgac tccgggttac 1440
tacaagcgcc cagaagtcac cgcgtccgtt ttcgatcgcg acggctatta ccacaccggc 1500
gacgtgatgg cagaaaccgc gccagaccac ctggtgtatg tggaccgccg caacaatgtt 1560
ctgaagctgg cgcaaggtga atttgtcgcc gtggctaacc tggagtccgt tttcagcggc 1620
gctgctctgg tccgccagat tttcgtgtat ggtaacagcg agcgcagctt tctgttggct 1680
gttgttgtcc ctaccccgga ggcgctggag caatacgacc ctgccgcatt gaaagcagcc 1740
ctggcggatt cgctgcagcg tacggcgcgt gatgccgagc tgcagagcta tgaagtgccg 1800
gcggacttca ttgttgagac tgagcctttt agcgctgcga acggtctgct gagcggtgtt 1860
ggcaagttgc tgcgtccgaa tttgaaggat cgctacggtc agcgtttgga gcagatgtac 1920
gcggacatcg cggctacgca ggcgaaccaa ttgcgtgagc tgcgtcgcgc tgcggctact 1980
caaccggtga tcgacacgct gacgcaagct gcggcgacca tcctgggtac cggcagcgag 2040
gttgcaagcg acgcacactt tactgatttg ggcggtgatt ctctgagcgc gctgacgttg 2100
agcaacttgc tgtctgactt ctttggcttt gaagtcccgg ttggcacgat tgttaaccca 2160
gcgactaatc tggcacagct ggcgcaacat atcgaggcgc agcgcacggc gggtgaccgc 2220
cgtccatcct ttacgacggt ccacggtgcg gatgctacgg aaatccgtgc aagcgaactg 2280
actctggaca aattcatcga cgctgagact ctgcgcgcag cacctggttt gccgaaggtt 2340
acgactgagc cgcgtacggt cctgttgagc ggtgccaatg gttggttggg ccgcttcctg 2400
accctgcagt ggctggaacg tttggcaccg gttggcggta ccctgatcac cattgtgcgc 2460
ggtcgtgacg atgcagcggc ccgcgcacgc ttgactcagg cttacgatac ggacccagag 2520
ctgtcccgcc gcttcgctga gttggcggat cgccacttgc gtgtggtggc aggtgatatc 2580
ggcgatccga atctgggcct gaccccggag atttggcacc gtctggcagc agaggtcgat 2640
ctggtcgttc atccagcggc cctggtcaac cacgtcctgc cgtaccgcca gctgtttggt 2700
ccgaatgttg ttggcaccgc cgaagttatc aagttggctc tgaccgagcg catcaagcct 2760
gttacctacc tgtccacggt tagcgtcgcg atgggtattc ctgattttga ggaggacggt 2820
gacattcgta ccgtcagccc ggttcgtccg ctggatggtg gctatgcaaa tggctatggc 2880
aacagcaagt gggctggcga ggtgctgctg cgcgaggcac atgacctgtg tggcctgccg 2940
gttgcgacgt ttcgtagcga catgattctg gcccacccgc gctaccgtgg ccaagtgaat 3000
gtgccggaca tgttcacccg tctgctgctg tccctgctga tcacgggtgt ggcaccgcgt 3060
tccttctaca ttggtgatgg cgagcgtccg cgtgcacact acccgggcct gaccgtcgat 3120
tttgttgcgg aagcggttac taccctgggt gctcagcaac gtgagggtta tgtctcgtat 3180
gacgttatga atccgcacga tgacggtatt agcttggatg tctttgtgga ctggctgatt 3240
cgtgcgggcc acccaattga ccgtgttgac gactatgatg actgggtgcg tcgttttgaa 3300
accgcgttga ccgccttgcc ggagaaacgt cgtgcgcaga ccgttctgcc gctgctgcat 3360
gcctttcgcg cgccacaggc gccgttgcgt ggcgcccctg aaccgaccga agtgtttcat 3420
gcagcggtgc gtaccgctaa agtcggtccg ggtgatattc cgcacctgga tgaagccctg 3480
atcgacaagt acatccgtga cctgcgcgag ttcggtctga tttag 3525
<210> 7
<211> 1174
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /注释=“人工序列的描述:合成CAR变异(carB8)多肽”
<400> 7
Met Gly Thr Ser Asp Val His Asp Ala Thr Asp Gly Val Thr Glu Thr
1 5 10 15
Ala Leu Asp Asp Arg Gln Arg Thr Arg Arg Ile Ala Glu Leu Tyr Ala
20 25 30
Thr Asp Pro Glu Phe Ala Ala Ala Ala Pro Leu Pro Ala Val Val Asp
35 40 45
Ala Ala His Lys Pro Gly Leu Arg Leu Ala Glu Ile Leu Gln Thr Leu
50 55 60
Phe Thr Gly Tyr Gly Asp Arg Pro Ala Leu Gly Tyr Arg Ala Arg Glu
65 70 75 80
Leu Ala Thr Asp Glu Gly Gly Arg Thr Val Thr Arg Leu Leu Pro Arg
85 90 95
Phe Asp Thr Leu Thr Tyr Ala Gln Val Trp Ser Arg Val Gln Ala Val
100 105 110
Ala Ala Ala Leu Arg His Asn Phe Ala Gln Pro Ile Tyr Pro Gly Asp
115 120 125
Ala Val Ala Thr Ile Gly Phe Ala Ser Pro Asp Tyr Leu Thr Leu Asp
130 135 140
Leu Val Cys Ala Tyr Leu Gly Leu Val Ser Val Pro Leu Gln His Asn
145 150 155 160
Ala Pro Val Ser Arg Leu Ala Pro Ile Leu Ala Glu Val Glu Pro Arg
165 170 175
Ile Leu Thr Val Ser Ala Glu Tyr Leu Asp Leu Ala Val Glu Ser Val
180 185 190
Arg Asp Val Asn Ser Val Ser Gln Leu Val Val Phe Asp His His Pro
195 200 205
Glu Val Asp Asp His Arg Asp Ala Leu Ala Arg Ala Arg Glu Gln Leu
210 215 220
Ala Gly Lys Gly Ile Ala Val Thr Thr Leu Asp Ala Ile Ala Asp Glu
225 230 235 240
Gly Ala Gly Leu Pro Ala Glu Pro Ile Tyr Thr Ala Asp His Asp Gln
245 250 255
Arg Leu Ala Met Ile Leu Tyr Thr Ser Gly Ser Thr Gly Ala Pro Lys
260 265 270
Gly Ala Met Tyr Thr Glu Ala Met Val Ala Arg Leu Trp Thr Met Ser
275 280 285
Gly Ile Thr Gly Asp Pro Thr Pro Val Ile Asn Val Asn Phe Met Pro
290 295 300
Leu Asn His Leu Gly Gly Arg Ile Pro Ile Ser Thr Ala Val Gln Asn
305 310 315 320
Gly Gly Thr Ser Tyr Phe Val Pro Glu Ser Asp Met Ser Thr Leu Phe
325 330 335
Glu Asp Leu Ala Leu Val Arg Pro Thr Glu Leu Gly Leu Val Pro Arg
340 345 350
Val Ala Asp Met Leu Tyr Gln His His Leu Ala Thr Val Asp Arg Leu
355 360 365
Val Thr Gln Gly Ala Asp Glu Leu Thr Ala Glu Lys Gln Ala Gly Ala
370 375 380
Glu Leu Arg Glu Gln Val Leu Gly Gly Arg Val Ile Thr Gly Phe Val
385 390 395 400
Ser Thr Ala Pro Leu Ala Ala Glu Met Arg Ala Phe Leu Asp Ile Thr
405 410 415
Leu Gly Ala His Ile Val Asp Gly Tyr Gly Leu Thr Glu Thr Gly Ala
420 425 430
Val Thr Arg Asp Gly Val Ile Val Arg Pro Pro Val Ile Asp Tyr Lys
435 440 445
Leu Ile Asp Val Pro Glu Leu Gly Tyr Phe Ser Thr Asp Lys Pro Tyr
450 455 460
Pro Arg Gly Glu Leu Leu Val Arg Ser His Thr Leu Thr Pro Gly Tyr
465 470 475 480
Tyr Lys Arg Pro Glu Val Thr Ala Ser Val Phe Asp Arg Asp Gly Tyr
485 490 495
Tyr His Thr Gly Asp Val Met Ala Glu Thr Ala Pro Asp His Leu Val
500 505 510
Tyr Val Asp Arg Arg Asn Asn Val Leu Lys Leu Ala Gln Gly Glu Phe
515 520 525
Val Ala Val Ala Asn Leu Glu Ser Val Phe Ser Gly Ala Ala Leu Val
530 535 540
Arg Gln Ile Phe Val Tyr Gly Asn Ser Glu Arg Ser Phe Leu Leu Ala
545 550 555 560
Val Val Val Pro Thr Pro Glu Ala Leu Glu Gln Tyr Asp Pro Ala Ala
565 570 575
Leu Lys Ala Ala Leu Ala Asp Ser Leu Gln Arg Thr Ala Arg Asp Ala
580 585 590
Glu Leu Gln Ser Tyr Glu Val Pro Ala Asp Phe Ile Val Glu Thr Glu
595 600 605
Pro Phe Ser Ala Ala Asn Gly Leu Leu Ser Gly Val Gly Lys Leu Leu
610 615 620
Arg Pro Asn Leu Lys Asp Arg Tyr Gly Gln Arg Leu Glu Gln Met Tyr
625 630 635 640
Ala Asp Ile Ala Ala Thr Gln Ala Asn Gln Leu Arg Glu Leu Arg Arg
645 650 655
Ala Ala Ala Thr Gln Pro Val Ile Asp Thr Leu Thr Gln Ala Ala Ala
660 665 670
Thr Ile Leu Gly Thr Gly Ser Glu Val Ala Ser Asp Ala His Phe Thr
675 680 685
Asp Leu Gly Gly Asp Ser Leu Ser Ala Leu Thr Leu Ser Asn Leu Leu
690 695 700
Ser Asp Phe Phe Gly Phe Glu Val Pro Val Gly Thr Ile Val Asn Pro
705 710 715 720
Ala Thr Asn Leu Ala Gln Leu Ala Gln His Ile Glu Ala Gln Arg Thr
725 730 735
Ala Gly Asp Arg Arg Pro Ser Phe Thr Thr Val His Gly Ala Asp Ala
740 745 750
Thr Glu Ile Arg Ala Ser Glu Leu Thr Leu Asp Lys Phe Ile Asp Ala
755 760 765
Glu Thr Leu Arg Ala Ala Pro Gly Leu Pro Lys Val Thr Thr Glu Pro
770 775 780
Arg Thr Val Leu Leu Ser Gly Ala Asn Gly Trp Leu Gly Arg Phe Leu
785 790 795 800
Thr Leu Gln Trp Leu Glu Arg Leu Ala Pro Val Gly Gly Thr Leu Ile
805 810 815
Thr Ile Val Arg Gly Arg Asp Asp Ala Ala Ala Arg Ala Arg Leu Thr
820 825 830
Gln Ala Tyr Asp Thr Asp Pro Glu Leu Ser Arg Arg Phe Ala Glu Leu
835 840 845
Ala Asp Arg His Leu Arg Val Val Ala Gly Asp Ile Gly Asp Pro Asn
850 855 860
Leu Gly Leu Thr Pro Glu Ile Trp His Ser Leu Ala Ala Glu Val Asp
865 870 875 880
Leu Val Val His Pro Ala Ala Leu Val Asn His Val Leu Pro Tyr Arg
885 890 895
Gln Leu Phe Gly Pro Asn Val Val Gly Thr Ala Glu Val Ile Lys Leu
900 905 910
Ala Leu Thr Glu Arg Ile Lys Pro Val Thr Tyr Leu Ser Thr Val Gly
915 920 925
Val Ala Arg Gly Ile Pro Asp Phe Glu Glu Asp Gly Asp Ile Arg Thr
930 935 940
Val Ser Pro Val Arg Pro Leu Asp Gly Gly Tyr Ala Asn Gly Tyr Gly
945 950 955 960
Asn Ser Lys Trp Ala Gly Glu Val Leu Leu Arg Glu Ala His Asp Leu
965 970 975
Cys Gly Leu Pro Val Ala Thr Phe Arg Ser Asp Met Ile Leu Ala His
980 985 990
Pro Arg Tyr Arg Gly Gln Val Asn Val Pro Asp Met Phe Thr Arg Leu
995 1000 1005
Leu Leu Ser Leu Leu Ile Thr Gly Val Ala Pro Arg Ser Phe Tyr
1010 1015 1020
Ile Gly Asp Gly Glu Arg Pro Arg Ala His Tyr Pro Gly Leu Thr
1025 1030 1035
Val Asp Phe Val Ala Glu Ala Val Thr Thr Leu Gly Ala Gln Gln
1040 1045 1050
Arg Glu Gly Tyr Val Ser Tyr Asp Val Met Asn Pro His Asp Asp
1055 1060 1065
Gly Ile Ser Leu Asp Val Phe Val Asp Trp Leu Ile Arg Ala Gly
1070 1075 1080
His Pro Ile Asp Arg Val Asp Asp Tyr Asp Asp Trp Val Arg Arg
1085 1090 1095
Phe Glu Thr Ala Leu Thr Ala Leu Pro Glu Lys Arg Arg Ala Gln
1100 1105 1110
Thr Val Leu Pro Leu Leu His Ala Phe Arg Ala Pro Gln Ala Pro
1115 1120 1125
Trp Arg Gly Ala Pro Glu Pro Thr Glu Val Phe His Ala Ala Val
1130 1135 1140
Arg Thr Ala Lys Val Gly Pro Gly Asp Ile Pro His Leu Asp Glu
1145 1150 1155
Ala Leu Ile Asp Lys Tyr Ile Arg Asp Leu Arg Glu Phe Gly Leu
1160 1165 1170
Ile
<210> 8
<211> 3525
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注释=“人工序列的描述:合成CAR变异(carB8)多核苷酸”
<400> 8
atgggcacga gcgatgttca cgacgcgacc gacggcgtta ccgagactgc actggatgat 60
cgccagagga ctcgtcgtat tgcagaactg tacgcaacgg acccagagtt cgcagcagca 120
gctcctctgc cggccgttgt cgatgcggcg cacaaaccgg gcctgcgtct ggcggaaatc 180
ctgcagaccc tgttcaccgg ctacggcgat cgtccggcgc tgggctatcg tgcacgtgag 240
ctggcgacgg acgaaggcgg tcgtacggtc acgcgtctgc tgccgcgctt cgataccctg 300
acctatgcac aggtgtggag ccgtgttcaa gcagtggctg cagcgttgcg tcacaatttc 360
gcacaaccga tttacccggg cgacgcggtc gcgactatcg gctttgcgag cccggactat 420
ttgacgctgg atctggtgtg cgcgtatctg ggcctggtca gcgttccttt gcagcataac 480
gctccggtgt ctcgcctggc cccgattctg gccgaggtgg aaccgcgtat tctgacggtg 540
agcgcagaat acctggacct ggcggttgaa tccgtccgtg atgtgaactc cgtcagccag 600
ctggttgttt tcgaccatca tccggaagtg gacgatcacc gtgacgcact ggctcgcgca 660
cgcgagcagc tggccggcaa aggtatcgca gttacgaccc tggatgcgat cgcagacgaa 720
ggcgcaggtt tgccggctga gccgatttac acggcggatc acgatcagcg tctggccatg 780
attctgtata ccagcggctc tacgggtgct ccgaaaggcg cgatgtacac cgaagcgatg 840
gtggctcgcc tgtggactat gagcgggatc acgggcgacc cgaccccggt tatcaacgtg 900
aacttcatgc cgctgaacca tctgggcggt cgtatcccga ttagcaccgc cgtgcagaat 960
ggcggtacca gctacttcgt tccggaaagc gacatgagca cgctgtttga ggatctggcc 1020
ctggtccgcc ctaccgaact gggtctggtg ccgcgtgttg cggacatgct gtaccagcat 1080
catctggcga ccgtggatcg cctggtgacc cagggcgcgg acgaactgac tgcggaaaag 1140
caggccggtg cggaactgcg tgaacaggtc ttgggcggtc gtgttatcac cggttttgtt 1200
tccaccgcgc cgttggcggc agagatgcgt gcttttctgg atatcacctt gggtgcacac 1260
atcgttgacg gttacggtct gaccgaaacc ggtgcggtca cccgtgatgg tgtgattgtt 1320
cgtcctccgg tcattgatta caagctgatc gatgtgccgg agctgggtta cttctccacc 1380
gacaaaccgt acccgcgtgg cgagctgctg gttcgtagcc acacgttgac tccgggttac 1440
tacaagcgcc cagaagtcac cgcgtccgtt ttcgatcgcg acggctatta ccacaccggc 1500
gacgtgatgg cagaaaccgc gccagaccac ctggtgtatg tggaccgccg caacaatgtt 1560
ctgaagctgg cgcaaggtga atttgtcgcc gtggctaacc tggagtccgt tttcagcggc 1620
gctgctctgg tccgccagat tttcgtgtat ggtaacagcg agcgcagctt tctgttggct 1680
gttgttgtcc ctaccccgga ggcgctggag caatacgacc ctgccgcatt gaaagcagcc 1740
ctggcggatt cgctgcagcg tacggcgcgt gatgccgagc tgcagagcta tgaagtgccg 1800
gcggacttca ttgttgagac tgagcctttt agcgctgcga acggtctgct gagcggtgtt 1860
ggcaagttgc tgcgtccgaa tttgaaggat cgctacggtc agcgtttgga gcagatgtac 1920
gcggacatcg cggctacgca ggcgaaccaa ttgcgtgagc tgcgtcgcgc tgcggctact 1980
caaccggtga tcgacacgct gacgcaagct gcggcgacca tcctgggtac cggcagcgag 2040
gttgcaagcg acgcacactt tactgatttg ggcggtgatt ctctgagcgc gctgacgttg 2100
agcaacttgc tgtctgactt ctttggcttt gaagtcccgg ttggcacgat tgttaaccca 2160
gcgactaatc tggcacagct ggcgcaacat atcgaggcgc agcgcacggc gggtgaccgc 2220
cgtccatcct ttacgacggt ccacggtgcg gatgctacgg aaatccgtgc aagcgaactg 2280
actctggaca aattcatcga cgctgagact ctgcgcgcag cacctggttt gccgaaggtt 2340
acgactgagc cgcgtacggt cctgttgagc ggtgccaatg gttggttggg ccgcttcctg 2400
accctgcagt ggctggaacg tttggcaccg gttggcggta ccctgatcac cattgtgcgc 2460
ggtcgtgacg atgcagcggc ccgcgcacgc ttgactcagg cttacgatac ggacccagag 2520
ctgtcccgcc gcttcgctga gttggcggat cgccacttgc gtgtggtggc aggtgatatc 2580
ggcgatccga atctgggcct gaccccggag atttggcaca gtctggcagc agaggtcgat 2640
ctggtcgttc atccagcggc cctggtcaac cacgtcctgc cgtaccgcca gctgtttggt 2700
ccgaatgttg ttggcaccgc cgaagttatc aagttggctc tgaccgagcg catcaagcct 2760
gttacctacc tgtccacggt tggggtcgcg aggggtattc ctgattttga ggaggacggt 2820
gacattcgta ccgtcagccc ggttcgtccg ctggatggtg gctatgcaaa tggctatggc 2880
aacagcaagt gggctggcga ggtgctgctg cgcgaggcac atgacctgtg tggcctgccg 2940
gttgcgacgt ttcgtagcga catgattctg gcccacccgc gctaccgtgg ccaagtgaat 3000
gtgccggaca tgttcacccg tctgctgctg tccctgctga tcacgggtgt ggcaccgcgt 3060
tccttctaca ttggtgatgg cgagcgtccg cgtgcacact acccgggcct gaccgtcgat 3120
tttgttgcgg aagcggttac taccctgggt gctcagcaac gtgagggtta tgtctcgtat 3180
gacgttatga atccgcacga tgacggtatt agcttggatg tctttgtgga ctggctgatt 3240
cgtgcgggcc acccaattga ccgtgttgac gactatgatg actgggtgcg tcgttttgaa 3300
accgcgttga ccgccttgcc ggagaaacgt cgtgcgcaga ccgttctgcc gctgctgcat 3360
gcctttcgcg cgccacaggc gccgtggcgt ggcgcccctg aaccgaccga agtgtttcat 3420
gcagcggtgc gtaccgctaa agtcggtccg ggtgatattc cgcacctgga tgaagccctg 3480
atcgacaagt acatccgtga cctgcgcgag ttcggtctga tttag 3525
Claims (12)
1.一种重组大肠埃希氏菌(E.Coli),其在具有简单碳源的发酵肉汤中生长时产生1,3脂肪二醇,所述大肠埃希氏菌(E.Coli)经工程化以表达编码包含以下的多肽的核酸序列:
(a)硫酯酶,其中该硫酯酶以3-羟基酰基-ACP为底物,并且选自由以下组成的群组:TE_EEI82564、TE_CAD63310和来自恶臭假单胞菌的phaG;以及
(b)羧酸还原酶,其为来自耻垢分枝杆菌的carB。
2.如权利要求1所述的重组大肠埃希氏菌(E.Coli),其中所述1,3脂肪二醇在体内产生。
3.如权利要求1所述的重组大肠埃希氏菌(E.Coli),其中所述1,3脂肪二醇选自由以下组成的群组:C5 1,3脂肪二醇、C6 1,3脂肪二醇、C7 1,3脂肪二醇、C8 1,3脂肪二醇、C9 1,3脂肪二醇、C10 1,3脂肪二醇、C11 1,3脂肪二醇、C12 1,3脂肪二醇、C13 1,3脂肪二醇、C14 1,3脂肪二醇、C15 1,3脂肪二醇、C16 1,3脂肪二醇、C17 1,3脂肪二醇、C18 1,3脂肪二醇以及C19 1,3脂肪二醇。
4.如权利要求1所述的重组大肠埃希氏菌(E.Coli),其进一步表达编码包含醇脱氢酶的多肽的核酸序列。
5.如权利要求1所述的重组大肠埃希氏菌(E.Coli),其中所述简单碳源来源于可再生原料。
6.如权利要求4所述的重组大肠埃希氏菌(E.Coli),其中所述醇脱氢酶是alrA。
7.一种细胞培养物,其包含根据权利要求1至6中任一项所述的重组大肠埃希氏菌(E.Coli)。
8.如权利要求7所述的细胞培养物,其中所述细胞培养物产生1,3脂肪二醇。
9.如权利要求8所述的细胞培养物,其中所述1,3脂肪二醇选自由以下组成的群组:C51,3脂肪二醇、C6 1,3脂肪二醇、C7 1,3脂肪二醇、C8 1,3脂肪二醇、C9 1,3脂肪二醇、C10 1,3脂肪二醇、C11 1,3脂肪二醇、C12 1,3脂肪二醇、C13 1,3脂肪二醇、C14 1,3脂肪二醇、C15 1,3脂肪二醇、C16 1,3脂肪二醇、C17 1,3脂肪二醇、C18 1,3脂肪二醇以及C19 1,3脂肪二醇。
10.一种产生1,3脂肪二醇的方法,其包括培养如权利要求1所述的重组大肠埃希氏菌(E.Coli)。
11.一种产生1,3脂肪二醇的方法,其包括:
(a)在发酵肉汤中培养重组大肠埃希氏菌(E.Coli),所述重组大肠埃希氏菌(E.Coli)表达编码包含硫酯酶,其中该硫酯酶以3-羟基酰基-ACP为底物,并且选自由以下组成的群组:TE_EEI82564、TE_CAD63310和来自恶臭假单胞菌的phaG;羧酸还原酶,其为来自耻垢分枝杆菌的carB,以及醇脱氢酶的多肽的核酸序列;以及
(b)从所述发酵肉汤分离1,3脂肪二醇,其中所述发酵肉汤包含简单碳源。
12.如权利要求11所述的方法,其中所述1,3脂肪二醇选自由以下组成的群组:C5 1,3脂肪二醇、C6 1,3脂肪二醇、C7 1,3脂肪二醇、C8 1,3脂肪二醇、C9 1,3脂肪二醇、C10 1,3脂肪二醇、C11 1,3脂肪二醇、C12 1,3脂肪二醇、C13 1,3脂肪二醇、C14 1,3脂肪二醇、C15 1,3脂肪二醇、C16 1,3脂肪二醇、C17 1,3脂肪二醇、C18 1,3脂肪二醇以及C19 1,3脂肪二醇。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110721671.7A CN113355268A (zh) | 2014-07-18 | 2015-07-17 | 微生物的脂肪二醇产生 |
CN202010692338.3A CN111748511A (zh) | 2014-07-18 | 2015-07-17 | 微生物的脂肪二醇产生 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201462026573P | 2014-07-18 | 2014-07-18 | |
US62/026,573 | 2014-07-18 | ||
PCT/US2015/041031 WO2016011430A1 (en) | 2014-07-18 | 2015-07-17 | Microbial production of fatty diols |
Related Child Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010692338.3A Division CN111748511A (zh) | 2014-07-18 | 2015-07-17 | 微生物的脂肪二醇产生 |
CN202110721671.7A Division CN113355268A (zh) | 2014-07-18 | 2015-07-17 | 微生物的脂肪二醇产生 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106574238A CN106574238A (zh) | 2017-04-19 |
CN106574238B true CN106574238B (zh) | 2021-09-21 |
Family
ID=53765570
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201580044132.7A Active CN106574238B (zh) | 2014-07-18 | 2015-07-17 | 微生物的脂肪二醇产生 |
CN202010692338.3A Pending CN111748511A (zh) | 2014-07-18 | 2015-07-17 | 微生物的脂肪二醇产生 |
CN202110721671.7A Pending CN113355268A (zh) | 2014-07-18 | 2015-07-17 | 微生物的脂肪二醇产生 |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010692338.3A Pending CN111748511A (zh) | 2014-07-18 | 2015-07-17 | 微生物的脂肪二醇产生 |
CN202110721671.7A Pending CN113355268A (zh) | 2014-07-18 | 2015-07-17 | 微生物的脂肪二醇产生 |
Country Status (13)
Country | Link |
---|---|
US (3) | US10676763B2 (zh) |
EP (3) | EP4089176A1 (zh) |
JP (2) | JP6925258B2 (zh) |
KR (2) | KR20170029625A (zh) |
CN (3) | CN106574238B (zh) |
AU (3) | AU2015289430B2 (zh) |
BR (1) | BR112017001105A2 (zh) |
CA (1) | CA2955370A1 (zh) |
CO (1) | CO2017000367A2 (zh) |
ES (2) | ES2700578T3 (zh) |
MX (2) | MX2017000669A (zh) |
MY (1) | MY188944A (zh) |
WO (1) | WO2016011430A1 (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10676763B2 (en) * | 2014-07-18 | 2020-06-09 | Genomatica, Inc. | Microbial production of fatty diols |
MX2019002913A (es) | 2016-09-14 | 2019-10-15 | Reg Life Sciences Llc | Compuestos de 1,3-dioles grasos y sus derivados. |
JP2020515293A (ja) | 2017-04-03 | 2020-05-28 | ジェノマティカ, インコーポレイテッド | 中鎖脂肪酸誘導体の生産のための改良された活性を有するチオエステラーゼ変種 |
WO2019217226A1 (en) * | 2018-05-10 | 2019-11-14 | REG Life Sciences, LLC | Multifunctional fatty acid derivatives and biosynthesis thereof |
CA3109062A1 (en) | 2018-08-31 | 2020-03-05 | Genomatica, Inc. | Xylr mutant for improved xylose utilization or improved co-utilization of glucose and xylose |
EP3670495A1 (en) | 2018-12-21 | 2020-06-24 | Clariant International Ltd | Glucamide-based surfactants |
CN111349644A (zh) * | 2020-03-17 | 2020-06-30 | 花安堂生物科技集团有限公司 | 生物合成异戊二醇的菌株及方法 |
US20240352673A1 (en) * | 2021-11-18 | 2024-10-24 | Kt&G Corporation | Wallpaper composition and wallpaper releasing flavorant component by heat |
WO2023178211A1 (en) | 2022-03-16 | 2023-09-21 | Genomatica, Inc. | Microorganisms and methods for production of fatty acid derivatives with reduced levels of byproducts |
WO2024150067A2 (en) * | 2023-01-12 | 2024-07-18 | Mojia Biotech Pte. Ltd. | Acyloin condensation reactions, enzymes, and products thereof |
Family Cites Families (51)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3806615A (en) | 1970-06-03 | 1974-04-23 | Exxon Research Engineering Co | Aliphatic diols and their esters as antimicrobial additives for cheese and meats |
US5424202A (en) | 1988-08-31 | 1995-06-13 | The University Of Florida | Ethanol production by recombinant hosts |
US5000000A (en) | 1988-08-31 | 1991-03-19 | University Of Florida | Ethanol production by Escherichia coli strains co-expressing Zymomonas PDC and ADH genes |
US5482846A (en) | 1988-08-31 | 1996-01-09 | University Of Florida | Ethanol production in Gram-positive microbes |
US5028539A (en) | 1988-08-31 | 1991-07-02 | The University Of Florida | Ethanol production using engineered mutant E. coli |
US5602030A (en) | 1994-03-28 | 1997-02-11 | University Of Florida Research Foundation | Recombinant glucose uptake system |
US6428767B1 (en) | 1995-05-12 | 2002-08-06 | E. I. Du Pont De Nemours And Company | Method for identifying the source of carbon in 1,3-propanediol |
CN1154745C (zh) | 1999-11-09 | 2004-06-23 | 浙江省农业科学院 | 利用反义基因调控籽粒油脂含量的方法 |
WO2004074476A1 (ja) | 2003-02-21 | 2004-09-02 | Kaneka Corporation | 新規ベクター |
ITMI20040717A1 (it) | 2004-04-09 | 2004-07-09 | Adorkem Technology Spa | Procedimento chemo-enzimatico per la preparazione dell'escitalopram |
PL1791933T3 (pl) | 2004-07-16 | 2011-12-30 | Dupont Nutrition Biosci Aps | Sposób enzymatycznego odgumowania oleju |
US8110670B2 (en) | 2006-05-19 | 2012-02-07 | Ls9, Inc. | Enhanced production of fatty acid derivatives |
DK2840131T3 (da) | 2006-05-19 | 2020-01-20 | Genomatica Inc | Fremstilling af fedtsyrer og derivater deraf |
CN101528917B (zh) | 2006-10-02 | 2015-07-29 | 科德克希思公司 | 用于制备立体异构纯的他汀类及其合成中间体的组合物和方法 |
US8110093B2 (en) | 2007-03-14 | 2012-02-07 | Ls9, Inc. | Process for producing low molecular weight hydrocarbons from renewable resources |
CA2692266C (en) | 2007-09-27 | 2019-04-16 | Ls9, Inc. | Reduction of the toxic effect of impurities from raw materials by extractive fermentation |
WO2009085278A1 (en) | 2007-12-21 | 2009-07-09 | Ls9, Inc. | Methods and compositions for producing olefins |
KR101735549B1 (ko) | 2008-05-16 | 2017-05-16 | 알이지 라이프 사이언시스, 엘엘씨 | 탄화수소를 생산하기 위한 방법과 조성물 |
US8232924B2 (en) | 2008-05-23 | 2012-07-31 | Alliant Techsystems Inc. | Broadband patch antenna and antenna system |
CN102232110B (zh) | 2008-10-07 | 2016-01-06 | Reg生命科学有限责任公司 | 产生脂肪醛的方法和组合物 |
CN102264910B (zh) | 2008-10-28 | 2015-08-26 | Reg生命科学有限责任公司 | 用于产生脂肪醇的方法和组合物 |
US20120115195A1 (en) | 2009-05-01 | 2012-05-10 | The Regents Of The University Of California | Product of fatty acid esters from biomass polymers |
EP2432890B1 (en) * | 2009-05-22 | 2015-09-02 | Codexis, Inc. | Engineered biosynthesis of fatty alcohols |
JP5787360B2 (ja) * | 2009-10-30 | 2015-09-30 | 株式会社ダイセル | 1,3−ブタンジオール生産機能を付与された遺伝子組換え微生物及びその利用 |
JP2011103863A (ja) | 2009-11-20 | 2011-06-02 | National Institute For Agro-Environmental Science | デオキシニバレノールの分解活性を有するタンパク質をコードする遺伝子 |
US8530221B2 (en) | 2010-01-14 | 2013-09-10 | Ls9, Inc. | Production of branched chain fatty acids and derivatives thereof in recombinant microbial cells |
WO2011127409A2 (en) * | 2010-04-08 | 2011-10-13 | Ls9, Inc. | Methods and compositions related to fatty alcohol biosynthetic enzymes |
US9040262B2 (en) | 2010-05-04 | 2015-05-26 | Codexis, Inc. | Biocatalysts for ezetimibe synthesis |
EP2575486B1 (en) | 2010-05-28 | 2021-09-01 | Corbion Biotech, Inc. | Food compositions comprising tailored oils |
WO2012009660A2 (en) * | 2010-07-15 | 2012-01-19 | The Procter & Gamble Company | Detergent compositions comprising microbially produced fatty alcohols and derivatives thereof |
US8372610B2 (en) | 2010-09-15 | 2013-02-12 | Ls9, Inc. | Production of odd chain fatty acid derivatives in recombinant microbial cells |
EP4282972A3 (en) | 2011-01-14 | 2024-02-28 | Genomatica, Inc. | Production of branched chain fatty acids and derivatives thereof in recombinant microbial cells |
US20130035513A1 (en) * | 2011-01-26 | 2013-02-07 | Ls9, Inc. | Methods and compositions for enhanced production of fatty aldehydes and fatty alcohols |
BR112014002624A8 (pt) * | 2011-08-03 | 2017-07-04 | Ls9 Inc | Microorganismo recombinante e cultura de microorganismo recombinante |
CN102932692A (zh) | 2011-08-12 | 2013-02-13 | 华为终端有限公司 | 机顶盒的认证方法及装置 |
IN2014CN01258A (zh) * | 2011-08-19 | 2015-04-24 | Genomatica Inc | |
EP2753689B1 (en) * | 2011-09-07 | 2018-02-14 | William Marsh Rice University | Functionalized carboxylic acids and alcohols by reverse fatty acid oxidation |
WO2013059218A1 (en) | 2011-10-17 | 2013-04-25 | William Marsh Rice University | Bacteria and method for synthesizing fatty acids |
CN102337303B (zh) * | 2011-10-26 | 2013-12-04 | 武汉大学 | 一种在异养微生物体内直接合成脂肪醇的方法 |
US20130177951A1 (en) | 2012-01-06 | 2013-07-11 | Eastman Chemical Company | Chemo-enzymatic process for preparing quaternary ammonium esters |
EP3153579B1 (en) * | 2012-04-02 | 2018-03-14 | REG Life Sciences, LLC | Car enzymes and improved production of fatty alcohols |
CA2883968C (en) | 2012-04-02 | 2022-08-23 | REG Life Sciences, LLC | Improved production of fatty acid derivatives |
CN102719467A (zh) * | 2012-07-09 | 2012-10-10 | 武汉大学 | 一种利用脂肪酰acp还原酶生物合成脂肪醇的方法 |
EP2872539B1 (en) | 2012-07-13 | 2020-12-09 | Univation Technologies, LLC | Increased polymer melt flow ratio via feed of a supported catalyst saturated with a selected liquid agent |
AU2013299414A1 (en) | 2012-08-10 | 2015-03-26 | Opx Biotechnologies, Inc. | Microorganisms and methods for the production of fatty acids and fatty acid derived products |
CA2888197C (en) * | 2012-10-15 | 2023-03-07 | Genomatica, Inc. | Microorganisms and methods for production of specific length fatty alcohols and related compounds |
MY167434A (en) * | 2013-01-16 | 2018-08-28 | Reg Life Sciences Llc | Acyl-acp reductase with improved properties |
BR122020002919B1 (pt) | 2013-06-14 | 2023-03-21 | Genomatica, Inc. | Microrganismo recombinante para a produção de um derivado de ácido graxo ômega-hidróxi e método de produção de um derivado de ácidos graxos ômega-hidroxi |
US11008597B2 (en) | 2014-04-10 | 2021-05-18 | Genomatica, Inc. | Chemo-enzymatic process |
US10676763B2 (en) * | 2014-07-18 | 2020-06-09 | Genomatica, Inc. | Microbial production of fatty diols |
MX2019002913A (es) * | 2016-09-14 | 2019-10-15 | Reg Life Sciences Llc | Compuestos de 1,3-dioles grasos y sus derivados. |
-
2015
- 2015-07-17 US US15/326,844 patent/US10676763B2/en active Active
- 2015-07-17 ES ES15745054T patent/ES2700578T3/es active Active
- 2015-07-17 AU AU2015289430A patent/AU2015289430B2/en not_active Ceased
- 2015-07-17 CN CN201580044132.7A patent/CN106574238B/zh active Active
- 2015-07-17 EP EP22161044.7A patent/EP4089176A1/en not_active Withdrawn
- 2015-07-17 EP EP18189374.4A patent/EP3460066B1/en not_active Not-in-force
- 2015-07-17 MX MX2017000669A patent/MX2017000669A/es unknown
- 2015-07-17 MY MYPI2017000065A patent/MY188944A/en unknown
- 2015-07-17 CN CN202010692338.3A patent/CN111748511A/zh active Pending
- 2015-07-17 BR BR112017001105-0A patent/BR112017001105A2/pt not_active IP Right Cessation
- 2015-07-17 EP EP15745054.5A patent/EP3137614B1/en active Active
- 2015-07-17 CA CA2955370A patent/CA2955370A1/en active Pending
- 2015-07-17 JP JP2017502836A patent/JP6925258B2/ja active Active
- 2015-07-17 ES ES18189374T patent/ES2920511T3/es active Active
- 2015-07-17 WO PCT/US2015/041031 patent/WO2016011430A1/en active Application Filing
- 2015-07-17 KR KR1020177004621A patent/KR20170029625A/ko not_active IP Right Cessation
- 2015-07-17 KR KR1020247003944A patent/KR20240023194A/ko active Application Filing
- 2015-07-17 CN CN202110721671.7A patent/CN113355268A/zh active Pending
-
2017
- 2017-01-16 MX MX2020013565A patent/MX2020013565A/es unknown
- 2017-01-16 CO CONC2017/0000367A patent/CO2017000367A2/es unknown
-
2020
- 2020-02-05 AU AU2020200828A patent/AU2020200828B2/en not_active Ceased
- 2020-02-13 AU AU2020201038A patent/AU2020201038B2/en not_active Ceased
- 2020-06-01 US US16/889,211 patent/US11359216B2/en active Active
-
2021
- 2021-08-03 JP JP2021127247A patent/JP2021176332A/ja active Pending
-
2022
- 2022-04-29 US US17/732,799 patent/US20220267813A1/en not_active Abandoned
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6738852B2 (ja) | 改良された脂肪酸誘導体産生方法 | |
CN106574238B (zh) | 微生物的脂肪二醇产生 | |
CN105378486B (zh) | 生产omega-羟基化的脂肪酸衍生物的方法 | |
JP6230594B2 (ja) | Car酵素、および改良された脂肪アルコール産生方法 | |
EP3103867B1 (en) | Acyl-acp reductase with improved properties | |
JP7564800B2 (ja) | 特性が改良されたオメガ-ヒドロキシラーゼ関連融合ポリペプチド | |
CN108699536B (zh) | 具有改进的特性的ω-羟化酶相关的融合多肽变体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20191209 Address after: California, USA Applicant after: GENOMATICA, Inc. Address before: Iowa USA Applicant before: REG Life Sciences, LLC |
|
TA01 | Transfer of patent application right | ||
GR01 | Patent grant | ||
GR01 | Patent grant |