KR102493733B1 - 개선된 에스테르 신타아제 특성을 갖는 효소 변이체 - Google Patents
개선된 에스테르 신타아제 특성을 갖는 효소 변이체 Download PDFInfo
- Publication number
- KR102493733B1 KR102493733B1 KR1020217040434A KR20217040434A KR102493733B1 KR 102493733 B1 KR102493733 B1 KR 102493733B1 KR 1020217040434 A KR1020217040434 A KR 1020217040434A KR 20217040434 A KR20217040434 A KR 20217040434A KR 102493733 B1 KR102493733 B1 KR 102493733B1
- Authority
- KR
- South Korea
- Prior art keywords
- delete delete
- leu
- ala
- arg
- gly
- Prior art date
Links
- 150000002148 esters Chemical class 0.000 title claims abstract description 298
- 230000001976 improved effect Effects 0.000 title claims abstract description 83
- 102000004190 Enzymes Human genes 0.000 title abstract description 63
- 108090000790 Enzymes Proteins 0.000 title abstract description 63
- 239000000194 fatty acid Substances 0.000 claims abstract description 215
- 235000014113 dietary fatty acids Nutrition 0.000 claims abstract description 213
- 229930195729 fatty acid Natural products 0.000 claims abstract description 213
- 239000000203 mixture Substances 0.000 claims abstract description 112
- -1 fatty acid esters Chemical class 0.000 claims abstract description 96
- 238000004113 cell culture Methods 0.000 claims abstract description 17
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 269
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 269
- 229920001184 polypeptide Polymers 0.000 claims description 268
- 150000002194 fatty esters Chemical class 0.000 claims description 190
- 230000000694 effects Effects 0.000 claims description 104
- 102000040430 polynucleotide Human genes 0.000 claims description 98
- 108091033319 polynucleotide Proteins 0.000 claims description 98
- 239000002157 polynucleotide Substances 0.000 claims description 98
- 235000019387 fatty acid methyl ester Nutrition 0.000 claims description 90
- 230000035772 mutation Effects 0.000 claims description 83
- 230000001965 increasing effect Effects 0.000 claims description 71
- 238000000034 method Methods 0.000 claims description 61
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 claims description 58
- 241000206597 Marinobacter hydrocarbonoclasticus Species 0.000 claims description 51
- 229910052799 carbon Inorganic materials 0.000 claims description 50
- 230000014509 gene expression Effects 0.000 claims description 50
- 125000002887 hydroxy group Chemical group [H]O* 0.000 claims description 29
- 102220031061 rs147164392 Human genes 0.000 claims description 15
- 102220124166 rs758073926 Human genes 0.000 claims description 15
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 14
- 229920006395 saturated elastomer Polymers 0.000 claims description 13
- OGBUMNBNEWYMNJ-UHFFFAOYSA-N batilol Chemical class CCCCCCCCCCCCCCCCCCOCC(O)CO OGBUMNBNEWYMNJ-UHFFFAOYSA-N 0.000 claims description 5
- 102220488457 Olfactory receptor 10G7_T5S_mutation Human genes 0.000 claims description 3
- 238000004519 manufacturing process Methods 0.000 abstract description 103
- 210000004027 cell Anatomy 0.000 description 218
- 150000004665 fatty acids Chemical class 0.000 description 110
- 235000001014 amino acid Nutrition 0.000 description 80
- 108010057821 leucylproline Proteins 0.000 description 77
- 108090000623 proteins and genes Proteins 0.000 description 63
- 229940024606 amino acid Drugs 0.000 description 55
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 51
- 150000001413 amino acids Chemical class 0.000 description 51
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 49
- 125000003275 alpha amino acid group Chemical group 0.000 description 49
- 239000000047 product Substances 0.000 description 47
- 150000007523 nucleic acids Chemical class 0.000 description 44
- 108020004414 DNA Proteins 0.000 description 41
- 235000018102 proteins Nutrition 0.000 description 40
- 102000004169 proteins and genes Human genes 0.000 description 40
- 235000021588 free fatty acids Nutrition 0.000 description 35
- 208000016444 Benign adult familial myoclonic epilepsy Diseases 0.000 description 33
- 208000016427 familial adult myoclonic epilepsy Diseases 0.000 description 33
- 238000002703 mutagenesis Methods 0.000 description 30
- 231100000350 mutagenesis Toxicity 0.000 description 30
- 230000000875 corresponding effect Effects 0.000 description 28
- 108010061238 threonyl-glycine Proteins 0.000 description 27
- 239000013598 vector Substances 0.000 description 27
- CZUHPNLXLWMYMG-UBHSHLNASA-N Arg-Phe-Ala Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 CZUHPNLXLWMYMG-UBHSHLNASA-N 0.000 description 26
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 26
- 108091028043 Nucleic acid sequence Proteins 0.000 description 25
- 108010018006 histidylserine Proteins 0.000 description 25
- 238000006467 substitution reaction Methods 0.000 description 24
- 241000894007 species Species 0.000 description 23
- 230000008859 change Effects 0.000 description 22
- 102000039446 nucleic acids Human genes 0.000 description 22
- 108020004707 nucleic acids Proteins 0.000 description 22
- FKXCBKCOSVIGCT-AVGNSLFASA-N Gln-Lys-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O FKXCBKCOSVIGCT-AVGNSLFASA-N 0.000 description 21
- 229940053200 antiepileptics fatty acid derivative Drugs 0.000 description 21
- 108010068380 arginylarginine Proteins 0.000 description 21
- 230000009286 beneficial effect Effects 0.000 description 21
- 239000002609 medium Substances 0.000 description 20
- 125000003729 nucleotide group Chemical group 0.000 description 20
- 244000005700 microbiome Species 0.000 description 18
- 239000002773 nucleotide Substances 0.000 description 18
- 239000000758 substrate Substances 0.000 description 17
- 108010043240 arginyl-leucyl-glycine Proteins 0.000 description 16
- 238000006243 chemical reaction Methods 0.000 description 16
- 238000000855 fermentation Methods 0.000 description 16
- 230000004151 fermentation Effects 0.000 description 16
- YJHKTAMKPGFJCT-NRPADANISA-N Ala-Val-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O YJHKTAMKPGFJCT-NRPADANISA-N 0.000 description 15
- 241000588724 Escherichia coli Species 0.000 description 15
- KAFOIVJDVSZUMD-UHFFFAOYSA-N Leu-Gln-Gln Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)NC(CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-UHFFFAOYSA-N 0.000 description 15
- BEZJTLKUMFMITF-AVGNSLFASA-N Met-Lys-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCNC(N)=N BEZJTLKUMFMITF-AVGNSLFASA-N 0.000 description 15
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 15
- 241000169446 Promethis Species 0.000 description 15
- 150000001298 alcohols Chemical class 0.000 description 15
- 239000013604 expression vector Substances 0.000 description 15
- 108010050848 glycylleucine Proteins 0.000 description 15
- 230000001105 regulatory effect Effects 0.000 description 15
- 239000000126 substance Substances 0.000 description 15
- IASNWHAGGYTEKX-IUCAKERBSA-N Arg-Arg-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(O)=O IASNWHAGGYTEKX-IUCAKERBSA-N 0.000 description 14
- PVSNBTCXCQIXSE-JYJNAYRXSA-N Arg-Arg-Phe Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PVSNBTCXCQIXSE-JYJNAYRXSA-N 0.000 description 14
- DAPLJWATMAXPPZ-CIUDSAMLSA-N Asn-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(N)=O DAPLJWATMAXPPZ-CIUDSAMLSA-N 0.000 description 14
- QCVXMEHGFUMKCO-YUMQZZPRSA-N Asp-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O QCVXMEHGFUMKCO-YUMQZZPRSA-N 0.000 description 14
- UTKUTMJSWKKHEM-WDSKDSINSA-N Glu-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O UTKUTMJSWKKHEM-WDSKDSINSA-N 0.000 description 14
- SBCYJMOOHUDWDA-NUMRIWBASA-N Glu-Asp-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SBCYJMOOHUDWDA-NUMRIWBASA-N 0.000 description 14
- AIGROOHQXCACHL-WDSKDSINSA-N Glu-Gly-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O AIGROOHQXCACHL-WDSKDSINSA-N 0.000 description 14
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 14
- MOJKRXIRAZPZLW-WDSKDSINSA-N Gly-Glu-Ala Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MOJKRXIRAZPZLW-WDSKDSINSA-N 0.000 description 14
- 108010009504 Gly-Phe-Leu-Gly Proteins 0.000 description 14
- 241000880493 Leptailurus serval Species 0.000 description 14
- CQQGCWPXDHTTNF-GUBZILKMSA-N Leu-Ala-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O CQQGCWPXDHTTNF-GUBZILKMSA-N 0.000 description 14
- RSFGIMMPWAXNML-MNXVOIDGSA-N Leu-Gln-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RSFGIMMPWAXNML-MNXVOIDGSA-N 0.000 description 14
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 14
- UNBFGVQVQGXXCK-KKUMJFAQSA-N Phe-Ser-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O UNBFGVQVQGXXCK-KKUMJFAQSA-N 0.000 description 14
- UEHYFUCOGHWASA-HJGDQZAQSA-N Pro-Glu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 UEHYFUCOGHWASA-HJGDQZAQSA-N 0.000 description 14
- MZNUJZBYRWXWLQ-AVGNSLFASA-N Pro-Met-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@@H]2CCCN2 MZNUJZBYRWXWLQ-AVGNSLFASA-N 0.000 description 14
- KCNSGAMPBPYUAI-CIUDSAMLSA-N Ser-Leu-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O KCNSGAMPBPYUAI-CIUDSAMLSA-N 0.000 description 14
- FVFUOQIYDPAIJR-XIRDDKMYSA-N Ser-Trp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CO)N FVFUOQIYDPAIJR-XIRDDKMYSA-N 0.000 description 14
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 14
- BGTDGENDNWGMDQ-KJEVXHAQSA-N Val-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N)O BGTDGENDNWGMDQ-KJEVXHAQSA-N 0.000 description 14
- 108010041407 alanylaspartic acid Proteins 0.000 description 14
- 108010070944 alanylhistidine Proteins 0.000 description 14
- 125000001931 aliphatic group Chemical group 0.000 description 14
- 108010018691 arginyl-threonyl-arginine Proteins 0.000 description 14
- 230000006696 biosynthetic metabolic pathway Effects 0.000 description 14
- 230000003247 decreasing effect Effects 0.000 description 14
- 108010049041 glutamylalanine Proteins 0.000 description 14
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 14
- 108010009298 lysylglutamic acid Proteins 0.000 description 14
- 108010073101 phenylalanylleucine Proteins 0.000 description 14
- 238000012216 screening Methods 0.000 description 14
- 108010005834 tyrosyl-alanyl-glycine Proteins 0.000 description 14
- BRPMXFSTKXXNHF-IUCAKERBSA-N (2s)-1-[2-[[(2s)-pyrrolidine-2-carbonyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound OC(=O)[C@@H]1CCCN1C(=O)CNC(=O)[C@H]1NCCC1 BRPMXFSTKXXNHF-IUCAKERBSA-N 0.000 description 13
- WEZDRVHTDXTVLT-GJZGRUSLSA-N 2-[[(2s)-2-[[(2s)-2-[(2-aminoacetyl)amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]acetic acid Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 WEZDRVHTDXTVLT-GJZGRUSLSA-N 0.000 description 13
- LMFXXZPPZDCPTA-ZKWXMUAHSA-N Ala-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N LMFXXZPPZDCPTA-ZKWXMUAHSA-N 0.000 description 13
- IPZQNYYAYVRKKK-FXQIFTODSA-N Ala-Pro-Ala Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IPZQNYYAYVRKKK-FXQIFTODSA-N 0.000 description 13
- YNOCMHZSWJMGBB-GCJQMDKQSA-N Ala-Thr-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O YNOCMHZSWJMGBB-GCJQMDKQSA-N 0.000 description 13
- SGYSTDWPNPKJPP-GUBZILKMSA-N Arg-Ala-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SGYSTDWPNPKJPP-GUBZILKMSA-N 0.000 description 13
- VBFJESQBIWCWRL-DCAQKATOSA-N Arg-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCNC(N)=N VBFJESQBIWCWRL-DCAQKATOSA-N 0.000 description 13
- GMFAGHNRXPSSJS-SRVKXCTJSA-N Arg-Leu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GMFAGHNRXPSSJS-SRVKXCTJSA-N 0.000 description 13
- NYDIVDKTULRINZ-AVGNSLFASA-N Arg-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NYDIVDKTULRINZ-AVGNSLFASA-N 0.000 description 13
- BSYKSCBTTQKOJG-GUBZILKMSA-N Arg-Pro-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O BSYKSCBTTQKOJG-GUBZILKMSA-N 0.000 description 13
- STHNZYKCJHWULY-AVGNSLFASA-N Arg-Pro-His Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCCN=C(N)N)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O STHNZYKCJHWULY-AVGNSLFASA-N 0.000 description 13
- FMYQECOAIFGQGU-CYDGBPFRSA-N Arg-Val-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FMYQECOAIFGQGU-CYDGBPFRSA-N 0.000 description 13
- QLSRIZIDQXDQHK-RCWTZXSCSA-N Arg-Val-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QLSRIZIDQXDQHK-RCWTZXSCSA-N 0.000 description 13
- PNHQRQTVBRDIEF-CIUDSAMLSA-N Asn-Leu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(=O)N)N PNHQRQTVBRDIEF-CIUDSAMLSA-N 0.000 description 13
- VSMYBNPOHYAXSD-GUBZILKMSA-N Asp-Lys-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O VSMYBNPOHYAXSD-GUBZILKMSA-N 0.000 description 13
- JSNWZMFSLIWAHS-HJGDQZAQSA-N Asp-Thr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O JSNWZMFSLIWAHS-HJGDQZAQSA-N 0.000 description 13
- ZQFZEBRNAMXXJV-KKUMJFAQSA-N Asp-Tyr-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O ZQFZEBRNAMXXJV-KKUMJFAQSA-N 0.000 description 13
- XWKBWZXGNXTDKY-ZKWXMUAHSA-N Asp-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O XWKBWZXGNXTDKY-ZKWXMUAHSA-N 0.000 description 13
- SQJSYLDKQBZQTG-FXQIFTODSA-N Cys-Asn-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CS)N SQJSYLDKQBZQTG-FXQIFTODSA-N 0.000 description 13
- PJWIPBIMSKJTIE-DCAQKATOSA-N Cys-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CS)N PJWIPBIMSKJTIE-DCAQKATOSA-N 0.000 description 13
- SRIRHERUAMYIOQ-CIUDSAMLSA-N Cys-Leu-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SRIRHERUAMYIOQ-CIUDSAMLSA-N 0.000 description 13
- REJJNXODKSHOKA-ACZMJKKPSA-N Gln-Ala-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N REJJNXODKSHOKA-ACZMJKKPSA-N 0.000 description 13
- WZZSKAJIHTUUSG-ACZMJKKPSA-N Glu-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O WZZSKAJIHTUUSG-ACZMJKKPSA-N 0.000 description 13
- GLWXKFRTOHKGIT-ACZMJKKPSA-N Glu-Asn-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O GLWXKFRTOHKGIT-ACZMJKKPSA-N 0.000 description 13
- HPJLZFTUUJKWAJ-JHEQGTHGSA-N Glu-Gly-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HPJLZFTUUJKWAJ-JHEQGTHGSA-N 0.000 description 13
- DVLZZEPUNFEUBW-AVGNSLFASA-N Glu-His-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N DVLZZEPUNFEUBW-AVGNSLFASA-N 0.000 description 13
- ATVYZJGOZLVXDK-IUCAKERBSA-N Glu-Leu-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O ATVYZJGOZLVXDK-IUCAKERBSA-N 0.000 description 13
- PUUYVMYCMIWHFE-BQBZGAKWSA-N Gly-Ala-Arg Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PUUYVMYCMIWHFE-BQBZGAKWSA-N 0.000 description 13
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 13
- YZACQYVWLCQWBT-BQBZGAKWSA-N Gly-Cys-Arg Chemical compound [H]NCC(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O YZACQYVWLCQWBT-BQBZGAKWSA-N 0.000 description 13
- DHDOADIPGZTAHT-YUMQZZPRSA-N Gly-Glu-Arg Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DHDOADIPGZTAHT-YUMQZZPRSA-N 0.000 description 13
- WNZOCXUOGVYYBJ-CDMKHQONSA-N Gly-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)CN)O WNZOCXUOGVYYBJ-CDMKHQONSA-N 0.000 description 13
- PNUFMLXHOLFRLD-KBPBESRZSA-N Gly-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 PNUFMLXHOLFRLD-KBPBESRZSA-N 0.000 description 13
- DZMVESFTHXSSPZ-XVYDVKMFSA-N His-Ala-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O DZMVESFTHXSSPZ-XVYDVKMFSA-N 0.000 description 13
- PYNPBMCLAKTHJL-SRVKXCTJSA-N His-Pro-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O PYNPBMCLAKTHJL-SRVKXCTJSA-N 0.000 description 13
- BFOGZWSSGMLYKV-DCAQKATOSA-N His-Ser-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC1=CN=CN1)N BFOGZWSSGMLYKV-DCAQKATOSA-N 0.000 description 13
- YPWHUFAAMNHMGS-QSFUFRPTSA-N Ile-Ala-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N YPWHUFAAMNHMGS-QSFUFRPTSA-N 0.000 description 13
- RGSOCXHDOPQREB-ZPFDUUQYSA-N Ile-Asp-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N RGSOCXHDOPQREB-ZPFDUUQYSA-N 0.000 description 13
- MTFVYKQRLXYAQN-LAEOZQHASA-N Ile-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O MTFVYKQRLXYAQN-LAEOZQHASA-N 0.000 description 13
- CKRFDMPBSWYOBT-PPCPHDFISA-N Ile-Lys-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N CKRFDMPBSWYOBT-PPCPHDFISA-N 0.000 description 13
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 13
- HXWALXSAVBLTPK-NUTKFTJISA-N Leu-Ala-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC(C)C)N HXWALXSAVBLTPK-NUTKFTJISA-N 0.000 description 13
- REPPKAMYTOJTFC-DCAQKATOSA-N Leu-Arg-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O REPPKAMYTOJTFC-DCAQKATOSA-N 0.000 description 13
- VCSBGUACOYUIGD-CIUDSAMLSA-N Leu-Asn-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VCSBGUACOYUIGD-CIUDSAMLSA-N 0.000 description 13
- ILJREDZFPHTUIE-GUBZILKMSA-N Leu-Asp-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ILJREDZFPHTUIE-GUBZILKMSA-N 0.000 description 13
- JQSXWJXBASFONF-KKUMJFAQSA-N Leu-Asp-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JQSXWJXBASFONF-KKUMJFAQSA-N 0.000 description 13
- IASQBRJGRVXNJI-YUMQZZPRSA-N Leu-Cys-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)NCC(O)=O IASQBRJGRVXNJI-YUMQZZPRSA-N 0.000 description 13
- LOLUPZNNADDTAA-AVGNSLFASA-N Leu-Gln-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LOLUPZNNADDTAA-AVGNSLFASA-N 0.000 description 13
- DZQMXBALGUHGJT-GUBZILKMSA-N Leu-Glu-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O DZQMXBALGUHGJT-GUBZILKMSA-N 0.000 description 13
- WQWSMEOYXJTFRU-GUBZILKMSA-N Leu-Glu-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O WQWSMEOYXJTFRU-GUBZILKMSA-N 0.000 description 13
- KUIDCYNIEJBZBU-AJNGGQMLSA-N Leu-Ile-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O KUIDCYNIEJBZBU-AJNGGQMLSA-N 0.000 description 13
- BGZCJDGBBUUBHA-KKUMJFAQSA-N Leu-Lys-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O BGZCJDGBBUUBHA-KKUMJFAQSA-N 0.000 description 13
- KXCMQWMNYQOAKA-SRVKXCTJSA-N Leu-Met-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N KXCMQWMNYQOAKA-SRVKXCTJSA-N 0.000 description 13
- HDHQQEDVWQGBEE-DCAQKATOSA-N Leu-Met-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O HDHQQEDVWQGBEE-DCAQKATOSA-N 0.000 description 13
- SNOUHRPNNCAOPI-SZMVWBNQSA-N Leu-Trp-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N SNOUHRPNNCAOPI-SZMVWBNQSA-N 0.000 description 13
- WGAZVKFCPHXZLO-SZMVWBNQSA-N Leu-Trp-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N WGAZVKFCPHXZLO-SZMVWBNQSA-N 0.000 description 13
- BGGTYDNTOYRTTR-MEYUZBJRSA-N Leu-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC(C)C)N)O BGGTYDNTOYRTTR-MEYUZBJRSA-N 0.000 description 13
- YIRIDPUGZKHMHT-ACRUOGEOSA-N Leu-Tyr-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YIRIDPUGZKHMHT-ACRUOGEOSA-N 0.000 description 13
- LMDVGHQPPPLYAR-IHRRRGAJSA-N Leu-Val-His Chemical compound N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O LMDVGHQPPPLYAR-IHRRRGAJSA-N 0.000 description 13
- SPNKGZFASINBMR-IHRRRGAJSA-N Lys-Met-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCCN)N SPNKGZFASINBMR-IHRRRGAJSA-N 0.000 description 13
- ULNXMMYXQKGNPG-LPEHRKFASA-N Met-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N ULNXMMYXQKGNPG-LPEHRKFASA-N 0.000 description 13
- UZVWDRPUTHXQAM-FXQIFTODSA-N Met-Asp-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O UZVWDRPUTHXQAM-FXQIFTODSA-N 0.000 description 13
- LXCSZPUQKMTXNW-BQBZGAKWSA-N Met-Ser-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O LXCSZPUQKMTXNW-BQBZGAKWSA-N 0.000 description 13
- VYXIKLFLGRTANT-HRCADAONSA-N Met-Tyr-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N VYXIKLFLGRTANT-HRCADAONSA-N 0.000 description 13
- BSKMOCNNLNDIMU-CDMKHQONSA-N Phe-Thr-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O BSKMOCNNLNDIMU-CDMKHQONSA-N 0.000 description 13
- SFECXGVELZFBFJ-VEVYYDQMSA-N Pro-Asp-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SFECXGVELZFBFJ-VEVYYDQMSA-N 0.000 description 13
- PULPZRAHVFBVTO-DCAQKATOSA-N Pro-Glu-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PULPZRAHVFBVTO-DCAQKATOSA-N 0.000 description 13
- RUDOLGWDSKQQFF-DCAQKATOSA-N Pro-Leu-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O RUDOLGWDSKQQFF-DCAQKATOSA-N 0.000 description 13
- VTFXTWDFPTWNJY-RHYQMDGZSA-N Pro-Leu-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VTFXTWDFPTWNJY-RHYQMDGZSA-N 0.000 description 13
- DWGFLKQSGRUQTI-IHRRRGAJSA-N Pro-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1 DWGFLKQSGRUQTI-IHRRRGAJSA-N 0.000 description 13
- RTQKBZIRDWZLDF-BZSNNMDCSA-N Pro-Pro-Trp Chemical compound C([C@H]1C(=O)N[C@@H](CC=2C3=CC=CC=C3NC=2)C(=O)O)CCN1C(=O)[C@@H]1CCCN1 RTQKBZIRDWZLDF-BZSNNMDCSA-N 0.000 description 13
- ZAUHSLVPDLNTRZ-QXEWZRGKSA-N Pro-Val-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ZAUHSLVPDLNTRZ-QXEWZRGKSA-N 0.000 description 13
- FIODMZKLZFLYQP-GUBZILKMSA-N Pro-Val-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FIODMZKLZFLYQP-GUBZILKMSA-N 0.000 description 13
- HRNQLKCLPVKZNE-CIUDSAMLSA-N Ser-Ala-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O HRNQLKCLPVKZNE-CIUDSAMLSA-N 0.000 description 13
- NRCJWSGXMAPYQX-LPEHRKFASA-N Ser-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CO)N)C(=O)O NRCJWSGXMAPYQX-LPEHRKFASA-N 0.000 description 13
- TYYBJUYSTWJHGO-ZKWXMUAHSA-N Ser-Asn-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O TYYBJUYSTWJHGO-ZKWXMUAHSA-N 0.000 description 13
- XXXAXOWMBOKTRN-XPUUQOCRSA-N Ser-Gly-Val Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXXAXOWMBOKTRN-XPUUQOCRSA-N 0.000 description 13
- RXUOAOOZIWABBW-XGEHTFHBSA-N Ser-Thr-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RXUOAOOZIWABBW-XGEHTFHBSA-N 0.000 description 13
- IAOHCSQDQDWRQU-GUBZILKMSA-N Ser-Val-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IAOHCSQDQDWRQU-GUBZILKMSA-N 0.000 description 13
- BSNZTJXVDOINSR-JXUBOQSCSA-N Thr-Ala-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BSNZTJXVDOINSR-JXUBOQSCSA-N 0.000 description 13
- LVHHEVGYAZGXDE-KDXUFGMBSA-N Thr-Ala-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(=O)O)N)O LVHHEVGYAZGXDE-KDXUFGMBSA-N 0.000 description 13
- NAXBBCLCEOTAIG-RHYQMDGZSA-N Thr-Arg-Lys Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@@H](CCCCN)C(O)=O NAXBBCLCEOTAIG-RHYQMDGZSA-N 0.000 description 13
- GUZGCDIZVGODML-NKIYYHGXSA-N Thr-Gln-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O GUZGCDIZVGODML-NKIYYHGXSA-N 0.000 description 13
- RCEHMXVEMNXRIW-IRIUXVKKSA-N Thr-Gln-Tyr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N)O RCEHMXVEMNXRIW-IRIUXVKKSA-N 0.000 description 13
- DLZKEQQWXODGGZ-KWQFWETISA-N Tyr-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DLZKEQQWXODGGZ-KWQFWETISA-N 0.000 description 13
- TWAVEIJGFCBWCG-JYJNAYRXSA-N Tyr-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N TWAVEIJGFCBWCG-JYJNAYRXSA-N 0.000 description 13
- HNWQUBBOBKSFQV-AVGNSLFASA-N Val-Arg-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N HNWQUBBOBKSFQV-AVGNSLFASA-N 0.000 description 13
- KZKMBGXCNLPYKD-YEPSODPASA-N Val-Gly-Thr Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O KZKMBGXCNLPYKD-YEPSODPASA-N 0.000 description 13
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 13
- WDIWOIRFNMLNKO-ULQDDVLXSA-N Val-Leu-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WDIWOIRFNMLNKO-ULQDDVLXSA-N 0.000 description 13
- WUFHZIRMAZZWRS-OSUNSFLBSA-N Val-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C(C)C)N WUFHZIRMAZZWRS-OSUNSFLBSA-N 0.000 description 13
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 13
- 108010013835 arginine glutamate Proteins 0.000 description 13
- 108010093581 aspartyl-proline Proteins 0.000 description 13
- 108010038633 aspartylglutamate Proteins 0.000 description 13
- 238000012258 culturing Methods 0.000 description 13
- 108010089804 glycyl-threonine Proteins 0.000 description 13
- 108010000761 leucylarginine Proteins 0.000 description 13
- 108010014614 prolyl-glycyl-proline Proteins 0.000 description 13
- 108010026333 seryl-proline Proteins 0.000 description 13
- 108010038745 tryptophylglycine Proteins 0.000 description 13
- NHLAEBFGWPXFGI-WHFBIAKZSA-N Ala-Gly-Asn Chemical compound C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N NHLAEBFGWPXFGI-WHFBIAKZSA-N 0.000 description 12
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 12
- ARHJJAAWNWOACN-FXQIFTODSA-N Ala-Ser-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O ARHJJAAWNWOACN-FXQIFTODSA-N 0.000 description 12
- UZGFHWIJWPUPOH-IHRRRGAJSA-N Arg-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UZGFHWIJWPUPOH-IHRRRGAJSA-N 0.000 description 12
- IBLAOXSULLECQZ-IUKAMOBKSA-N Asn-Ile-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC(N)=O IBLAOXSULLECQZ-IUKAMOBKSA-N 0.000 description 12
- WCFCYFDBMNFSPA-ACZMJKKPSA-N Asp-Asp-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(O)=O WCFCYFDBMNFSPA-ACZMJKKPSA-N 0.000 description 12
- PSLSTUMPZILTAH-BYULHYEWSA-N Asp-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O PSLSTUMPZILTAH-BYULHYEWSA-N 0.000 description 12
- 241000196324 Embryophyta Species 0.000 description 12
- HQRHFUYMGCHHJS-LURJTMIESA-N Gly-Gly-Arg Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N HQRHFUYMGCHHJS-LURJTMIESA-N 0.000 description 12
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 12
- JQFILXICXLDTRR-FBCQKBJTSA-N Gly-Thr-Gly Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)NCC(O)=O JQFILXICXLDTRR-FBCQKBJTSA-N 0.000 description 12
- CWSZWFILCNSNEX-CIUDSAMLSA-N His-Ser-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CWSZWFILCNSNEX-CIUDSAMLSA-N 0.000 description 12
- DSDPLOODKXISDT-XUXIUFHCSA-N Ile-Leu-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O DSDPLOODKXISDT-XUXIUFHCSA-N 0.000 description 12
- ZAJNRWKGHWGPDQ-SDDRHHMPSA-N Met-Arg-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N ZAJNRWKGHWGPDQ-SDDRHHMPSA-N 0.000 description 12
- IIHMNTBFPMRJCN-RCWTZXSCSA-N Met-Val-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IIHMNTBFPMRJCN-RCWTZXSCSA-N 0.000 description 12
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 12
- ICTZKEXYDDZZFP-SRVKXCTJSA-N Pro-Arg-Pro Chemical compound N([C@@H](CCCN=C(N)N)C(=O)N1[C@@H](CCC1)C(O)=O)C(=O)[C@@H]1CCCN1 ICTZKEXYDDZZFP-SRVKXCTJSA-N 0.000 description 12
- SBVPYBFMIGDIDX-SRVKXCTJSA-N Pro-Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1N(C(=O)[C@H]2NCCC2)CCC1 SBVPYBFMIGDIDX-SRVKXCTJSA-N 0.000 description 12
- BXHRXLMCYSZSIY-STECZYCISA-N Pro-Tyr-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](Cc1ccc(O)cc1)NC(=O)[C@@H]1CCCN1)C(O)=O BXHRXLMCYSZSIY-STECZYCISA-N 0.000 description 12
- WDXYVIIVDIDOSX-DCAQKATOSA-N Ser-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N WDXYVIIVDIDOSX-DCAQKATOSA-N 0.000 description 12
- CRZRTKAVUUGKEQ-ACZMJKKPSA-N Ser-Gln-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CRZRTKAVUUGKEQ-ACZMJKKPSA-N 0.000 description 12
- GARULAKWZGFIKC-RWRJDSDZSA-N Thr-Gln-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GARULAKWZGFIKC-RWRJDSDZSA-N 0.000 description 12
- NLWCSMOXNKBRLC-WDSOQIARSA-N Trp-Lys-Val Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O NLWCSMOXNKBRLC-WDSOQIARSA-N 0.000 description 12
- FEXILLGKGGTLRI-NHCYSSNCSA-N Val-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N FEXILLGKGGTLRI-NHCYSSNCSA-N 0.000 description 12
- 108010054666 glycyl-leucyl-glycyl-glycine Proteins 0.000 description 12
- 239000003208 petroleum Substances 0.000 description 12
- 239000013612 plasmid Substances 0.000 description 12
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 11
- CXQODNIBUNQWAS-CIUDSAMLSA-N Ala-Gln-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N CXQODNIBUNQWAS-CIUDSAMLSA-N 0.000 description 11
- CTWCFPWFIGRAEP-CIUDSAMLSA-N Asp-Lys-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O CTWCFPWFIGRAEP-CIUDSAMLSA-N 0.000 description 11
- 239000002028 Biomass Substances 0.000 description 11
- LRHPLDYGYMQRHN-UHFFFAOYSA-N N-Butanol Chemical compound CCCCO LRHPLDYGYMQRHN-UHFFFAOYSA-N 0.000 description 11
- XNTVWRJTUIOGQO-RHYQMDGZSA-N Thr-Met-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O XNTVWRJTUIOGQO-RHYQMDGZSA-N 0.000 description 11
- 239000000446 fuel Substances 0.000 description 11
- BDERNNFJNOPAEC-UHFFFAOYSA-N propan-1-ol Chemical compound CCCO BDERNNFJNOPAEC-UHFFFAOYSA-N 0.000 description 11
- 241000607568 Photobacterium Species 0.000 description 10
- 238000001727 in vivo Methods 0.000 description 10
- 239000000463 material Substances 0.000 description 10
- 101150087812 tesA gene Proteins 0.000 description 10
- BPANDPNDMJHFEV-CIUDSAMLSA-N Leu-Asp-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O BPANDPNDMJHFEV-CIUDSAMLSA-N 0.000 description 9
- HYMLKESRWLZDBR-WEDXCCLWSA-N Leu-Gly-Thr Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HYMLKESRWLZDBR-WEDXCCLWSA-N 0.000 description 9
- 108010079364 N-glycylalanine Proteins 0.000 description 9
- 235000011187 glycerol Nutrition 0.000 description 9
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 9
- 229930195733 hydrocarbon Natural products 0.000 description 9
- 150000002430 hydrocarbons Chemical class 0.000 description 9
- 150000002894 organic compounds Chemical class 0.000 description 9
- 238000010561 standard procedure Methods 0.000 description 9
- OINVDEKBKBCPLX-JXUBOQSCSA-N Ala-Lys-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OINVDEKBKBCPLX-JXUBOQSCSA-N 0.000 description 8
- 241000894006 Bacteria Species 0.000 description 8
- 101100505161 Caenorhabditis elegans mel-32 gene Proteins 0.000 description 8
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 8
- 108700026244 Open Reading Frames Proteins 0.000 description 8
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 8
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 8
- 230000015572 biosynthetic process Effects 0.000 description 8
- 238000000605 extraction Methods 0.000 description 8
- 150000002192 fatty aldehydes Chemical class 0.000 description 8
- 102200141517 rs104893792 Human genes 0.000 description 8
- 102220005396 rs33961916 Human genes 0.000 description 8
- 235000021122 unsaturated fatty acids Nutrition 0.000 description 8
- GJLXVWOMRRWCIB-MERZOTPQSA-N (2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-acetamido-5-(diaminomethylideneamino)pentanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]-3-(1H-indol-3-yl)propanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanamide Chemical compound C([C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(N)=O)C1=CC=C(O)C=C1 GJLXVWOMRRWCIB-MERZOTPQSA-N 0.000 description 7
- 108020004705 Codon Proteins 0.000 description 7
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 7
- PLOUVAYOMTYJRG-JXUBOQSCSA-N Lys-Thr-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O PLOUVAYOMTYJRG-JXUBOQSCSA-N 0.000 description 7
- FEVDNIBDCRKMER-IUCAKERBSA-N Pro-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@@H]1CCCN1 FEVDNIBDCRKMER-IUCAKERBSA-N 0.000 description 7
- 102000005488 Thioesterase Human genes 0.000 description 7
- QHWMVGCEQAPQDK-UMPQAUOISA-N Trp-Thr-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O QHWMVGCEQAPQDK-UMPQAUOISA-N 0.000 description 7
- CVUDMNSZAIZFAE-UHFFFAOYSA-N Val-Arg-Pro Natural products NC(N)=NCCCC(NC(=O)C(N)C(C)C)C(=O)N1CCCC1C(O)=O CVUDMNSZAIZFAE-UHFFFAOYSA-N 0.000 description 7
- 230000001580 bacterial effect Effects 0.000 description 7
- 239000003225 biodiesel Substances 0.000 description 7
- 230000008827 biological function Effects 0.000 description 7
- 150000002191 fatty alcohols Chemical class 0.000 description 7
- 238000009396 hybridization Methods 0.000 description 7
- 108020002982 thioesterase Proteins 0.000 description 7
- 150000004670 unsaturated fatty acids Chemical class 0.000 description 7
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 6
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 6
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 6
- VGPCJSXPPOQPBK-YUMQZZPRSA-N Leu-Gly-Ser Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O VGPCJSXPPOQPBK-YUMQZZPRSA-N 0.000 description 6
- HKXSZKJMDBHOTG-CIUDSAMLSA-N Lys-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CCCCN HKXSZKJMDBHOTG-CIUDSAMLSA-N 0.000 description 6
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 6
- OWSLLRKCHLTUND-BZSNNMDCSA-N Phe-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OWSLLRKCHLTUND-BZSNNMDCSA-N 0.000 description 6
- DZZCICYRSZASNF-FXQIFTODSA-N Pro-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 DZZCICYRSZASNF-FXQIFTODSA-N 0.000 description 6
- TVPQRPNBYCRRLL-IHRRRGAJSA-N Ser-Phe-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(O)=O TVPQRPNBYCRRLL-IHRRRGAJSA-N 0.000 description 6
- FRPNVPKQVFHSQY-BPUTZDHNSA-N Ser-Trp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CO)N FRPNVPKQVFHSQY-BPUTZDHNSA-N 0.000 description 6
- STKZKWFOKOCSLW-UMPQAUOISA-N Trp-Thr-Val Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)[C@@H](C)O)=CNC2=C1 STKZKWFOKOCSLW-UMPQAUOISA-N 0.000 description 6
- NZGOVKLVQNOEKP-YDHLFZDLSA-N Val-Phe-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N NZGOVKLVQNOEKP-YDHLFZDLSA-N 0.000 description 6
- VHIZXDZMTDVFGX-DCAQKATOSA-N Val-Ser-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N VHIZXDZMTDVFGX-DCAQKATOSA-N 0.000 description 6
- 108010077245 asparaginyl-proline Proteins 0.000 description 6
- 238000012219 cassette mutagenesis Methods 0.000 description 6
- 238000012217 deletion Methods 0.000 description 6
- 230000037430 deletion Effects 0.000 description 6
- 238000000769 gas chromatography-flame ionisation detection Methods 0.000 description 6
- 239000008103 glucose Substances 0.000 description 6
- 239000001963 growth medium Substances 0.000 description 6
- 108010062385 long-chain-alcohol O-fatty-acyltransferase Proteins 0.000 description 6
- 239000003550 marker Substances 0.000 description 6
- VOFUROIFQGPCGE-UHFFFAOYSA-N nile red Chemical compound C1=CC=C2C3=NC4=CC=C(N(CC)CC)C=C4OC3=CC(=O)C2=C1 VOFUROIFQGPCGE-UHFFFAOYSA-N 0.000 description 6
- UNFWWIHTNXNPBV-WXKVUWSESA-N spectinomycin Chemical compound O([C@@H]1[C@@H](NC)[C@@H](O)[C@H]([C@@H]([C@H]1O1)O)NC)[C@]2(O)[C@H]1O[C@H](C)CC2=O UNFWWIHTNXNPBV-WXKVUWSESA-N 0.000 description 6
- 229960000268 spectinomycin Drugs 0.000 description 6
- 239000011593 sulfur Substances 0.000 description 6
- 229910052717 sulfur Inorganic materials 0.000 description 6
- 150000007970 thio esters Chemical class 0.000 description 6
- 239000001993 wax Substances 0.000 description 6
- WUFYAPWIHCUMLL-CIUDSAMLSA-N Leu-Asn-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O WUFYAPWIHCUMLL-CIUDSAMLSA-N 0.000 description 5
- BJCXXMGGPHRSHV-GUBZILKMSA-N Pro-Ser-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 BJCXXMGGPHRSHV-GUBZILKMSA-N 0.000 description 5
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 5
- XPKCFQZDQGVJCX-RHYQMDGZSA-N Val-Lys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N)O XPKCFQZDQGVJCX-RHYQMDGZSA-N 0.000 description 5
- 125000002252 acyl group Chemical group 0.000 description 5
- 125000000539 amino acid group Chemical group 0.000 description 5
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 5
- 150000001720 carbohydrates Chemical class 0.000 description 5
- 235000014633 carbohydrates Nutrition 0.000 description 5
- 239000003814 drug Substances 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 108010037850 glycylvaline Proteins 0.000 description 5
- 230000006872 improvement Effects 0.000 description 5
- 150000002576 ketones Chemical class 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 239000003921 oil Substances 0.000 description 5
- 229920000642 polymer Polymers 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 235000000346 sugar Nutrition 0.000 description 5
- 239000004094 surface-active agent Substances 0.000 description 5
- 241000195493 Cryptophyta Species 0.000 description 4
- 102000053602 DNA Human genes 0.000 description 4
- 108091034117 Oligonucleotide Proteins 0.000 description 4
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 4
- 238000007792 addition Methods 0.000 description 4
- 239000000654 additive Substances 0.000 description 4
- 235000004279 alanine Nutrition 0.000 description 4
- 150000001336 alkenes Chemical class 0.000 description 4
- 230000002238 attenuated effect Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 235000010633 broth Nutrition 0.000 description 4
- 238000010367 cloning Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 239000012634 fragment Substances 0.000 description 4
- 208000015707 frontal fibrosing alopecia Diseases 0.000 description 4
- 230000004927 fusion Effects 0.000 description 4
- 238000003780 insertion Methods 0.000 description 4
- 230000037431 insertion Effects 0.000 description 4
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 4
- 239000007788 liquid Substances 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000002018 overexpression Effects 0.000 description 4
- 238000000746 purification Methods 0.000 description 4
- 102200111205 rs104893618 Human genes 0.000 description 4
- 102220326429 rs1352220583 Human genes 0.000 description 4
- 102220276603 rs863224701 Human genes 0.000 description 4
- 238000002741 site-directed mutagenesis Methods 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 238000013518 transcription Methods 0.000 description 4
- 230000035897 transcription Effects 0.000 description 4
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 3
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 3
- 102000057234 Acyl transferases Human genes 0.000 description 3
- 108700016155 Acyl transferases Proteins 0.000 description 3
- 241000193830 Bacillus <bacterium> Species 0.000 description 3
- 102220503759 Cell division cycle-associated protein 7_R162E_mutation Human genes 0.000 description 3
- 108091026890 Coding region Proteins 0.000 description 3
- 239000004471 Glycine Substances 0.000 description 3
- 102220541632 HLA class II histocompatibility antigen, DQ beta 1 chain_Y58L_mutation Human genes 0.000 description 3
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 3
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 3
- 239000004472 Lysine Substances 0.000 description 3
- 241000085284 Marinobacter hydrocarbonoclasticus ATCC 49840 Species 0.000 description 3
- MUBZPKHOEPUJKR-UHFFFAOYSA-N Oxalic acid Chemical compound OC(=O)C(O)=O MUBZPKHOEPUJKR-UHFFFAOYSA-N 0.000 description 3
- 241001260361 Photobacterium profundum Species 0.000 description 3
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 3
- 239000004473 Threonine Substances 0.000 description 3
- 240000008042 Zea mays Species 0.000 description 3
- 239000002253 acid Substances 0.000 description 3
- 238000003556 assay Methods 0.000 description 3
- 238000007845 assembly PCR Methods 0.000 description 3
- 239000012298 atmosphere Substances 0.000 description 3
- 239000002551 biofuel Substances 0.000 description 3
- 239000003795 chemical substances by application Substances 0.000 description 3
- 150000001875 compounds Chemical class 0.000 description 3
- 125000004122 cyclic group Chemical group 0.000 description 3
- 230000000593 degrading effect Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000007613 environmental effect Effects 0.000 description 3
- 210000003527 eukaryotic cell Anatomy 0.000 description 3
- 239000003502 gasoline Substances 0.000 description 3
- 239000011521 glass Substances 0.000 description 3
- 230000001939 inductive effect Effects 0.000 description 3
- 239000004922 lacquer Substances 0.000 description 3
- 239000000314 lubricant Substances 0.000 description 3
- 108020004999 messenger RNA Proteins 0.000 description 3
- 230000000813 microbial effect Effects 0.000 description 3
- 229910052757 nitrogen Inorganic materials 0.000 description 3
- 239000003973 paint Substances 0.000 description 3
- 230000037361 pathway Effects 0.000 description 3
- 239000004033 plastic Substances 0.000 description 3
- 229920003023 plastic Polymers 0.000 description 3
- 229920005989 resin Polymers 0.000 description 3
- 239000011347 resin Substances 0.000 description 3
- 102220261130 rs148851677 Human genes 0.000 description 3
- 102220046266 rs587779085 Human genes 0.000 description 3
- 238000009738 saturating Methods 0.000 description 3
- 238000012163 sequencing technique Methods 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 230000014616 translation Effects 0.000 description 3
- 239000002699 waste material Substances 0.000 description 3
- GGQQNYXPYWCUHG-RMTFUQJTSA-N (3e,6e)-deca-3,6-diene Chemical group CCC\C=C\C\C=C\CC GGQQNYXPYWCUHG-RMTFUQJTSA-N 0.000 description 2
- KBPLFHHGFOOTCA-UHFFFAOYSA-N 1-Octanol Chemical compound CCCCCCCCO KBPLFHHGFOOTCA-UHFFFAOYSA-N 0.000 description 2
- BBMCTIGTTCKYKF-UHFFFAOYSA-N 1-heptanol Chemical compound CCCCCCCO BBMCTIGTTCKYKF-UHFFFAOYSA-N 0.000 description 2
- 102220497079 5-hydroxytryptamine receptor 3B_Q33A_mutation Human genes 0.000 description 2
- 229920001817 Agar Polymers 0.000 description 2
- PMQXMXAASGFUDX-SRVKXCTJSA-N Ala-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CCCCN PMQXMXAASGFUDX-SRVKXCTJSA-N 0.000 description 2
- CLICCYPMVFGUOF-IHRRRGAJSA-N Arg-Lys-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O CLICCYPMVFGUOF-IHRRRGAJSA-N 0.000 description 2
- 239000004475 Arginine Substances 0.000 description 2
- 241000892910 Aspergillus foetidus Species 0.000 description 2
- 241000351920 Aspergillus nidulans Species 0.000 description 2
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 2
- 102000014914 Carrier Proteins Human genes 0.000 description 2
- 108010078791 Carrier Proteins Proteins 0.000 description 2
- 241000195597 Chlamydomonas reinhardtii Species 0.000 description 2
- SRBFZHDQGSBBOR-IOVATXLUSA-N D-xylopyranose Chemical compound O[C@@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-IOVATXLUSA-N 0.000 description 2
- 102220626670 Electrogenic sodium bicarbonate cotransporter 1_T49D_mutation Human genes 0.000 description 2
- RFSUNEUAIZKAJO-ARQDHWQXSA-N Fructose Chemical compound OC[C@H]1O[C@](O)(CO)[C@@H](O)[C@@H]1O RFSUNEUAIZKAJO-ARQDHWQXSA-N 0.000 description 2
- MXXXVOYFNVJHMA-IUCAKERBSA-N Gly-Arg-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)CN MXXXVOYFNVJHMA-IUCAKERBSA-N 0.000 description 2
- BMWFDYIYBAFROD-WPRPVWTQSA-N Gly-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN BMWFDYIYBAFROD-WPRPVWTQSA-N 0.000 description 2
- 102220554203 Hemogen_T49V_mutation Human genes 0.000 description 2
- 241000223198 Humicola Species 0.000 description 2
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 description 2
- 241000235058 Komagataella pastoris Species 0.000 description 2
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 2
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 2
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 2
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 2
- OYQUOLRTJHWVSQ-SRVKXCTJSA-N Leu-His-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O OYQUOLRTJHWVSQ-SRVKXCTJSA-N 0.000 description 2
- JNDYEOUZBLOVOF-AVGNSLFASA-N Leu-Leu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JNDYEOUZBLOVOF-AVGNSLFASA-N 0.000 description 2
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 2
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 2
- 241000206589 Marinobacter Species 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 102220489132 Mitogen-activated protein kinase kinase kinase 19_K32M_mutation Human genes 0.000 description 2
- 108010021466 Mutant Proteins Proteins 0.000 description 2
- 102000008300 Mutant Proteins Human genes 0.000 description 2
- AMQJEAYHLZJPGS-UHFFFAOYSA-N N-Pentanol Chemical compound CCCCCO AMQJEAYHLZJPGS-UHFFFAOYSA-N 0.000 description 2
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 2
- 241001520808 Panicum virgatum Species 0.000 description 2
- 241000228150 Penicillium chrysogenum Species 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 2
- 241000589540 Pseudomonas fluorescens Species 0.000 description 2
- 241000235403 Rhizomucor miehei Species 0.000 description 2
- 102220644164 Rho guanine nucleotide exchange factor 10-like protein_T49W_mutation Human genes 0.000 description 2
- 241000191023 Rhodobacter capsulatus Species 0.000 description 2
- 241000190932 Rhodopseudomonas Species 0.000 description 2
- 241000235347 Schizosaccharomyces pombe Species 0.000 description 2
- YEDSOSIKVUMIJE-DCAQKATOSA-N Ser-Val-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O YEDSOSIKVUMIJE-DCAQKATOSA-N 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 229920002472 Starch Polymers 0.000 description 2
- 108091081024 Start codon Proteins 0.000 description 2
- 229930006000 Sucrose Natural products 0.000 description 2
- 241000192560 Synechococcus sp. Species 0.000 description 2
- 108010006785 Taq Polymerase Proteins 0.000 description 2
- DEGCBBCMYWNJNA-RHYQMDGZSA-N Thr-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O DEGCBBCMYWNJNA-RHYQMDGZSA-N 0.000 description 2
- 239000013504 Triton X-100 Substances 0.000 description 2
- 229920004890 Triton X-100 Polymers 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- AJNUKMZFHXUBMK-GUBZILKMSA-N Val-Ser-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N AJNUKMZFHXUBMK-GUBZILKMSA-N 0.000 description 2
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 2
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 2
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 2
- 241000588902 Zymomonas mobilis Species 0.000 description 2
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 2
- 238000004760 accelerator mass spectrometry Methods 0.000 description 2
- 230000002378 acidificating effect Effects 0.000 description 2
- 150000007513 acids Chemical class 0.000 description 2
- 230000000996 additive effect Effects 0.000 description 2
- 239000008272 agar Substances 0.000 description 2
- 108010044940 alanylglutamine Proteins 0.000 description 2
- 125000000217 alkyl group Chemical group 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 2
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 2
- 108010060035 arginylproline Proteins 0.000 description 2
- 125000003118 aryl group Chemical group 0.000 description 2
- 108010092854 aspartyllysine Proteins 0.000 description 2
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 2
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 2
- 239000012620 biological material Substances 0.000 description 2
- 102220365045 c.89T>A Human genes 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 150000007942 carboxylates Chemical group 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 230000003197 catalytic effect Effects 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 239000001913 cellulose Substances 0.000 description 2
- 229920002678 cellulose Polymers 0.000 description 2
- 235000010980 cellulose Nutrition 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- 230000004186 co-expression Effects 0.000 description 2
- 239000000356 contaminant Substances 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 235000005822 corn Nutrition 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 239000010779 crude oil Substances 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- MWKFXSUHUHTGQN-UHFFFAOYSA-N decan-1-ol Chemical compound CCCCCCCCCCO MWKFXSUHUHTGQN-UHFFFAOYSA-N 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 150000002016 disaccharides Chemical class 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- SNRUBQQJIBEYMU-UHFFFAOYSA-N dodecane Chemical compound CCCCCCCCCCCC SNRUBQQJIBEYMU-UHFFFAOYSA-N 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 239000000975 dye Substances 0.000 description 2
- 229920001971 elastomer Polymers 0.000 description 2
- 230000005284 excitation Effects 0.000 description 2
- 239000010408 film Substances 0.000 description 2
- 239000012467 final product Substances 0.000 description 2
- 239000003063 flame retardant Substances 0.000 description 2
- 239000000796 flavoring agent Substances 0.000 description 2
- 239000003205 fragrance Substances 0.000 description 2
- 239000000499 gel Substances 0.000 description 2
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Chemical compound NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 2
- ZSIAUFGUXNUGDI-UHFFFAOYSA-N hexan-1-ol Chemical compound CCCCCCO ZSIAUFGUXNUGDI-UHFFFAOYSA-N 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 239000003317 industrial substance Substances 0.000 description 2
- 238000001802 infusion Methods 0.000 description 2
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 2
- 229960000310 isoleucine Drugs 0.000 description 2
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 2
- 230000037353 metabolic pathway Effects 0.000 description 2
- 229930182817 methionine Natural products 0.000 description 2
- 150000002772 monosaccharides Chemical class 0.000 description 2
- 210000003463 organelle Anatomy 0.000 description 2
- 239000012044 organic layer Substances 0.000 description 2
- 229910052760 oxygen Inorganic materials 0.000 description 2
- 239000001301 oxygen Substances 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 239000011846 petroleum-based material Substances 0.000 description 2
- 239000013520 petroleum-based product Substances 0.000 description 2
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 2
- 239000004014 plasticizer Substances 0.000 description 2
- 229920001282 polysaccharide Polymers 0.000 description 2
- 239000005017 polysaccharide Substances 0.000 description 2
- 150000004804 polysaccharides Chemical class 0.000 description 2
- 210000001236 prokaryotic cell Anatomy 0.000 description 2
- 239000011535 reaction buffer Substances 0.000 description 2
- 239000012925 reference material Substances 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 108091008146 restriction endonucleases Proteins 0.000 description 2
- 102220149593 rs145337669 Human genes 0.000 description 2
- 102220276614 rs1553130405 Human genes 0.000 description 2
- 102220131994 rs200737977 Human genes 0.000 description 2
- 102220044659 rs587781460 Human genes 0.000 description 2
- 102220224231 rs770503805 Human genes 0.000 description 2
- 102220323551 rs771587118 Human genes 0.000 description 2
- 102220105255 rs879254390 Human genes 0.000 description 2
- 102220172123 rs886048669 Human genes 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- 230000001235 sensitizing effect Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 230000001568 sexual effect Effects 0.000 description 2
- 239000000344 soap Substances 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 239000008107 starch Substances 0.000 description 2
- 235000019698 starch Nutrition 0.000 description 2
- 125000001424 substituent group Chemical group 0.000 description 2
- 239000005720 sucrose Substances 0.000 description 2
- 230000008685 targeting Effects 0.000 description 2
- HLZKNKRTKFSKGZ-UHFFFAOYSA-N tetradecan-1-ol Chemical compound CCCCCCCCCCCCCCO HLZKNKRTKFSKGZ-UHFFFAOYSA-N 0.000 description 2
- 239000004753 textile Substances 0.000 description 2
- UMGDCJDMYOKAJW-UHFFFAOYSA-N thiourea Chemical compound NC(N)=S UMGDCJDMYOKAJW-UHFFFAOYSA-N 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- 239000004474 valine Substances 0.000 description 2
- 239000002966 varnish Substances 0.000 description 2
- 230000003612 virological effect Effects 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- OWEGMIWEEQEYGQ-UHFFFAOYSA-N 100676-05-9 Natural products OC1C(O)C(O)C(CO)OC1OCC1C(O)C(O)C(O)C(OC2C(OC(O)C(O)C2O)CO)O1 OWEGMIWEEQEYGQ-UHFFFAOYSA-N 0.000 description 1
- XKLJLHAPJBUBNL-UHFFFAOYSA-N 12-methyltetradecanoic acid Chemical compound CCC(C)CCCCCCCCCCC(O)=O XKLJLHAPJBUBNL-UHFFFAOYSA-N 0.000 description 1
- ZONJATNKKGGVSU-UHFFFAOYSA-N 14-methylpentadecanoic acid Chemical compound CC(C)CCCCCCCCCCCCC(O)=O ZONJATNKKGGVSU-UHFFFAOYSA-N 0.000 description 1
- MAFSBQRWNXDTRK-UHFFFAOYSA-N 15-methylheptadecanoic acid Chemical compound CCC(C)CCCCCCCCCCCCCC(O)=O MAFSBQRWNXDTRK-UHFFFAOYSA-N 0.000 description 1
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 1
- UHPMCKVQTMMPCG-UHFFFAOYSA-N 5,8-dihydroxy-2-methoxy-6-methyl-7-(2-oxopropyl)naphthalene-1,4-dione Chemical compound CC1=C(CC(C)=O)C(O)=C2C(=O)C(OC)=CC(=O)C2=C1O UHPMCKVQTMMPCG-UHFFFAOYSA-N 0.000 description 1
- 102220553677 APC membrane recruitment protein 1_E48A_mutation Human genes 0.000 description 1
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 description 1
- 241000186361 Actinobacteria <class> Species 0.000 description 1
- 101710146995 Acyl carrier protein Proteins 0.000 description 1
- 108700037654 Acyl carrier protein (ACP) Proteins 0.000 description 1
- 102000048456 Acyl carrier protein (ACP) Human genes 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- AAQGRPOPTAUUBM-ZLUOBGJFSA-N Ala-Ala-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O AAQGRPOPTAUUBM-ZLUOBGJFSA-N 0.000 description 1
- JAMAWBXXKFGFGX-KZVJFYERSA-N Ala-Arg-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JAMAWBXXKFGFGX-KZVJFYERSA-N 0.000 description 1
- BGNLUHXLSAQYRQ-FXQIFTODSA-N Ala-Glu-Gln Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O BGNLUHXLSAQYRQ-FXQIFTODSA-N 0.000 description 1
- WGDNWOMKBUXFHR-BQBZGAKWSA-N Ala-Gly-Arg Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N WGDNWOMKBUXFHR-BQBZGAKWSA-N 0.000 description 1
- HHRAXZAYZFFRAM-CIUDSAMLSA-N Ala-Leu-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O HHRAXZAYZFFRAM-CIUDSAMLSA-N 0.000 description 1
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 1
- SDZRIBWEVVRDQI-CIUDSAMLSA-N Ala-Lys-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O SDZRIBWEVVRDQI-CIUDSAMLSA-N 0.000 description 1
- FVNAUOZKIPAYNA-BPNCWPANSA-N Ala-Met-Tyr Chemical compound CSCC[C@H](NC(=O)[C@H](C)N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FVNAUOZKIPAYNA-BPNCWPANSA-N 0.000 description 1
- GMGWOTQMUKYZIE-UBHSHLNASA-N Ala-Pro-Phe Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 GMGWOTQMUKYZIE-UBHSHLNASA-N 0.000 description 1
- VJVQKGYHIZPSNS-FXQIFTODSA-N Ala-Ser-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N VJVQKGYHIZPSNS-FXQIFTODSA-N 0.000 description 1
- UCDOXFBTMLKASE-HERUPUMHSA-N Ala-Ser-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N UCDOXFBTMLKASE-HERUPUMHSA-N 0.000 description 1
- HCBKAOZYACJUEF-XQXXSGGOSA-N Ala-Thr-Gln Chemical compound N[C@@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCC(N)=O)C(=O)O HCBKAOZYACJUEF-XQXXSGGOSA-N 0.000 description 1
- YEBZNKPPOHFZJM-BPNCWPANSA-N Ala-Tyr-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O YEBZNKPPOHFZJM-BPNCWPANSA-N 0.000 description 1
- REWSWYIDQIELBE-FXQIFTODSA-N Ala-Val-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O REWSWYIDQIELBE-FXQIFTODSA-N 0.000 description 1
- 206010002942 Apathy Diseases 0.000 description 1
- 241000219195 Arabidopsis thaliana Species 0.000 description 1
- RRGPUNYIPJXJBU-GUBZILKMSA-N Arg-Asp-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O RRGPUNYIPJXJBU-GUBZILKMSA-N 0.000 description 1
- GIVWETPOBCRTND-DCAQKATOSA-N Arg-Gln-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GIVWETPOBCRTND-DCAQKATOSA-N 0.000 description 1
- AQPVUEJJARLJHB-BQBZGAKWSA-N Arg-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N AQPVUEJJARLJHB-BQBZGAKWSA-N 0.000 description 1
- OQCWXQJLCDPRHV-UWVGGRQHSA-N Arg-Gly-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O OQCWXQJLCDPRHV-UWVGGRQHSA-N 0.000 description 1
- HAVKMRGWNXMCDR-STQMWFEESA-N Arg-Gly-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HAVKMRGWNXMCDR-STQMWFEESA-N 0.000 description 1
- CRCCTGPNZUCAHE-DCAQKATOSA-N Arg-His-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CN=CN1 CRCCTGPNZUCAHE-DCAQKATOSA-N 0.000 description 1
- LVMUGODRNHFGRA-AVGNSLFASA-N Arg-Leu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O LVMUGODRNHFGRA-AVGNSLFASA-N 0.000 description 1
- OTZMRMHZCMZOJZ-SRVKXCTJSA-N Arg-Leu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OTZMRMHZCMZOJZ-SRVKXCTJSA-N 0.000 description 1
- HGKHPCFTRQDHCU-IUCAKERBSA-N Arg-Pro-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O HGKHPCFTRQDHCU-IUCAKERBSA-N 0.000 description 1
- NGYHSXDNNOFHNE-AVGNSLFASA-N Arg-Pro-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O NGYHSXDNNOFHNE-AVGNSLFASA-N 0.000 description 1
- YFHATWYGAAXQCF-JYJNAYRXSA-N Arg-Pro-Phe Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YFHATWYGAAXQCF-JYJNAYRXSA-N 0.000 description 1
- VUGWHBXPMAHEGZ-SRVKXCTJSA-N Arg-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCN=C(N)N VUGWHBXPMAHEGZ-SRVKXCTJSA-N 0.000 description 1
- MFFOYNGMOYFPBD-DCAQKATOSA-N Asn-Arg-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O MFFOYNGMOYFPBD-DCAQKATOSA-N 0.000 description 1
- HAJWYALLJIATCX-FXQIFTODSA-N Asn-Asn-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N HAJWYALLJIATCX-FXQIFTODSA-N 0.000 description 1
- BHQQRVARKXWXPP-ACZMJKKPSA-N Asn-Asp-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N BHQQRVARKXWXPP-ACZMJKKPSA-N 0.000 description 1
- XSGBIBGAMKTHMY-WHFBIAKZSA-N Asn-Asp-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O XSGBIBGAMKTHMY-WHFBIAKZSA-N 0.000 description 1
- ZKDGORKGHPCZOV-DCAQKATOSA-N Asn-His-Arg Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N ZKDGORKGHPCZOV-DCAQKATOSA-N 0.000 description 1
- NKLRWRRVYGQNIH-GHCJXIJMSA-N Asn-Ile-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O NKLRWRRVYGQNIH-GHCJXIJMSA-N 0.000 description 1
- OLISTMZJGQUOGS-GMOBBJLQSA-N Asn-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N OLISTMZJGQUOGS-GMOBBJLQSA-N 0.000 description 1
- WCRQQIPFSXFIRN-LPEHRKFASA-N Asn-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N WCRQQIPFSXFIRN-LPEHRKFASA-N 0.000 description 1
- PPCORQFLAZWUNO-QWRGUYRKSA-N Asn-Phe-Gly Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N PPCORQFLAZWUNO-QWRGUYRKSA-N 0.000 description 1
- BYLSYQASFJJBCL-DCAQKATOSA-N Asn-Pro-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O BYLSYQASFJJBCL-DCAQKATOSA-N 0.000 description 1
- GHWWTICYPDKPTE-NGZCFLSTSA-N Asn-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N GHWWTICYPDKPTE-NGZCFLSTSA-N 0.000 description 1
- XOQYDFCQPWAMSA-KKHAAJSZSA-N Asn-Val-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOQYDFCQPWAMSA-KKHAAJSZSA-N 0.000 description 1
- PBVLJOIPOGUQQP-CIUDSAMLSA-N Asp-Ala-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O PBVLJOIPOGUQQP-CIUDSAMLSA-N 0.000 description 1
- VPPXTHJNTYDNFJ-CIUDSAMLSA-N Asp-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N VPPXTHJNTYDNFJ-CIUDSAMLSA-N 0.000 description 1
- VFUXXFVCYZPOQG-WDSKDSINSA-N Asp-Glu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VFUXXFVCYZPOQG-WDSKDSINSA-N 0.000 description 1
- KYQNAIMCTRZLNP-QSFUFRPTSA-N Asp-Ile-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O KYQNAIMCTRZLNP-QSFUFRPTSA-N 0.000 description 1
- PAYPSKIBMDHZPI-CIUDSAMLSA-N Asp-Leu-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PAYPSKIBMDHZPI-CIUDSAMLSA-N 0.000 description 1
- SARSTIZOZFBDOM-FXQIFTODSA-N Asp-Met-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O SARSTIZOZFBDOM-FXQIFTODSA-N 0.000 description 1
- DJCAHYVLMSRBFR-QXEWZRGKSA-N Asp-Met-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CC(O)=O DJCAHYVLMSRBFR-QXEWZRGKSA-N 0.000 description 1
- WOPJVEMFXYHZEE-SRVKXCTJSA-N Asp-Phe-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O WOPJVEMFXYHZEE-SRVKXCTJSA-N 0.000 description 1
- RPUYTJJZXQBWDT-SRVKXCTJSA-N Asp-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N RPUYTJJZXQBWDT-SRVKXCTJSA-N 0.000 description 1
- YFGUZQQCSDZRBN-DCAQKATOSA-N Asp-Pro-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O YFGUZQQCSDZRBN-DCAQKATOSA-N 0.000 description 1
- QSFHZPQUAAQHAQ-CIUDSAMLSA-N Asp-Ser-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O QSFHZPQUAAQHAQ-CIUDSAMLSA-N 0.000 description 1
- 241001513093 Aspergillus awamori Species 0.000 description 1
- 241001225321 Aspergillus fumigatus Species 0.000 description 1
- 241000228245 Aspergillus niger Species 0.000 description 1
- 240000006439 Aspergillus oryzae Species 0.000 description 1
- 235000002247 Aspergillus oryzae Nutrition 0.000 description 1
- 208000000659 Autoimmune lymphoproliferative syndrome Diseases 0.000 description 1
- 241000193744 Bacillus amyloliquefaciens Species 0.000 description 1
- 241000193752 Bacillus circulans Species 0.000 description 1
- 241001328122 Bacillus clausii Species 0.000 description 1
- 241000193749 Bacillus coagulans Species 0.000 description 1
- 241000193422 Bacillus lentus Species 0.000 description 1
- 241000194108 Bacillus licheniformis Species 0.000 description 1
- 241000194107 Bacillus megaterium Species 0.000 description 1
- 241000194103 Bacillus pumilus Species 0.000 description 1
- 244000063299 Bacillus subtilis Species 0.000 description 1
- 235000014469 Bacillus subtilis Nutrition 0.000 description 1
- 101001074429 Bacillus subtilis (strain 168) Polyketide biosynthesis acyltransferase homolog PksD Proteins 0.000 description 1
- 241000193388 Bacillus thuringiensis Species 0.000 description 1
- 101000936617 Bacillus velezensis (strain DSM 23117 / BGSC 10A6 / FZB42) Polyketide biosynthesis acyltransferase homolog BaeD Proteins 0.000 description 1
- 102100021277 Beta-secretase 2 Human genes 0.000 description 1
- 101710150190 Beta-secretase 2 Proteins 0.000 description 1
- 241000193764 Brevibacillus brevis Species 0.000 description 1
- 241001504279 Bryum Species 0.000 description 1
- DKPFZGUDAPQIHT-UHFFFAOYSA-N Butyl acetate Natural products CCCCOC(C)=O DKPFZGUDAPQIHT-UHFFFAOYSA-N 0.000 description 1
- 101100315624 Caenorhabditis elegans tyr-1 gene Proteins 0.000 description 1
- 239000004215 Carbon black (E152) Substances 0.000 description 1
- 241000191382 Chlorobaculum tepidum Species 0.000 description 1
- 241000192733 Chloroflexus Species 0.000 description 1
- 241000123346 Chrysosporium Species 0.000 description 1
- 241000193403 Clostridium Species 0.000 description 1
- 241000186566 Clostridium ljungdahlii Species 0.000 description 1
- 241001464430 Cyanobacterium Species 0.000 description 1
- GMXSSZUVDNPRMA-FXQIFTODSA-N Cys-Arg-Asp Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O GMXSSZUVDNPRMA-FXQIFTODSA-N 0.000 description 1
- OXOQBEVULIBOSH-ZDLURKLDSA-N Cys-Gly-Thr Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O OXOQBEVULIBOSH-ZDLURKLDSA-N 0.000 description 1
- GGRDJANMZPGMNS-CIUDSAMLSA-N Cys-Ser-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O GGRDJANMZPGMNS-CIUDSAMLSA-N 0.000 description 1
- GUBGYTABKSRVRQ-CUHNMECISA-N D-Cellobiose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-CUHNMECISA-N 0.000 description 1
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 description 1
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 1
- 230000033616 DNA repair Effects 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 102100037458 Dephospho-CoA kinase Human genes 0.000 description 1
- 241000195633 Dunaliella salina Species 0.000 description 1
- 102220512227 Endosomal/lysosomal potassium channel TMEM175_D41N_mutation Human genes 0.000 description 1
- 241000588722 Escherichia Species 0.000 description 1
- 241000701988 Escherichia virus T5 Species 0.000 description 1
- 108090000371 Esterases Proteins 0.000 description 1
- 206010073306 Exposure to radiation Diseases 0.000 description 1
- 101150071111 FADD gene Proteins 0.000 description 1
- 229930091371 Fructose Natural products 0.000 description 1
- 239000005715 Fructose Substances 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 241000223218 Fusarium Species 0.000 description 1
- 102220616640 GTP-binding nuclear protein Ran_T24N_mutation Human genes 0.000 description 1
- 108010010803 Gelatin Proteins 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- 241000193385 Geobacillus stearothermophilus Species 0.000 description 1
- IGNGBUVODQLMRJ-CIUDSAMLSA-N Gln-Ala-Met Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O IGNGBUVODQLMRJ-CIUDSAMLSA-N 0.000 description 1
- KWUSGAIFNHQCBY-DCAQKATOSA-N Gln-Arg-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O KWUSGAIFNHQCBY-DCAQKATOSA-N 0.000 description 1
- INFBPLSHYFALDE-ACZMJKKPSA-N Gln-Asn-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O INFBPLSHYFALDE-ACZMJKKPSA-N 0.000 description 1
- SOBBAYVQSNXYPQ-ACZMJKKPSA-N Gln-Asn-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O SOBBAYVQSNXYPQ-ACZMJKKPSA-N 0.000 description 1
- AJDMYLOISOCHHC-YVNDNENWSA-N Gln-Gln-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O AJDMYLOISOCHHC-YVNDNENWSA-N 0.000 description 1
- IWUFOVSLWADEJC-AVGNSLFASA-N Gln-His-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O IWUFOVSLWADEJC-AVGNSLFASA-N 0.000 description 1
- KHNJVFYHIKLUPD-SRVKXCTJSA-N Gln-Leu-Met Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCC(=O)N)N KHNJVFYHIKLUPD-SRVKXCTJSA-N 0.000 description 1
- LUGUNEGJNDEBLU-DCAQKATOSA-N Gln-Met-Arg Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N LUGUNEGJNDEBLU-DCAQKATOSA-N 0.000 description 1
- FGWRYRAVBVOHIB-XIRDDKMYSA-N Gln-Pro-Trp Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)N)N)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O FGWRYRAVBVOHIB-XIRDDKMYSA-N 0.000 description 1
- MXOODARRORARSU-ACZMJKKPSA-N Glu-Ala-Ser Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N MXOODARRORARSU-ACZMJKKPSA-N 0.000 description 1
- IYAUFWMUCGBFMQ-CIUDSAMLSA-N Glu-Arg-Cys Chemical compound C(C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)CN=C(N)N IYAUFWMUCGBFMQ-CIUDSAMLSA-N 0.000 description 1
- CGYDXNKRIMJMLV-GUBZILKMSA-N Glu-Arg-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O CGYDXNKRIMJMLV-GUBZILKMSA-N 0.000 description 1
- PNAOVYHADQRJQU-GUBZILKMSA-N Glu-Cys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)O)N PNAOVYHADQRJQU-GUBZILKMSA-N 0.000 description 1
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 1
- IRXNJYPKBVERCW-DCAQKATOSA-N Glu-Leu-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IRXNJYPKBVERCW-DCAQKATOSA-N 0.000 description 1
- CQGBSALYGOXQPE-HTUGSXCWSA-N Glu-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O CQGBSALYGOXQPE-HTUGSXCWSA-N 0.000 description 1
- QXPRJQPCFXMCIY-NKWVEPMBSA-N Gly-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN QXPRJQPCFXMCIY-NKWVEPMBSA-N 0.000 description 1
- DWUKOTKSTDWGAE-BQBZGAKWSA-N Gly-Asn-Arg Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DWUKOTKSTDWGAE-BQBZGAKWSA-N 0.000 description 1
- ORXZVPZCPMKHNR-IUCAKERBSA-N Gly-His-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CNC=N1 ORXZVPZCPMKHNR-IUCAKERBSA-N 0.000 description 1
- HAXARWKYFIIHKD-ZKWXMUAHSA-N Gly-Ile-Ser Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HAXARWKYFIIHKD-ZKWXMUAHSA-N 0.000 description 1
- ULZCYBYDTUMHNF-IUCAKERBSA-N Gly-Leu-Glu Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ULZCYBYDTUMHNF-IUCAKERBSA-N 0.000 description 1
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 1
- WNGHUXFWEWTKAO-YUMQZZPRSA-N Gly-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN WNGHUXFWEWTKAO-YUMQZZPRSA-N 0.000 description 1
- CQMFNTVQVLQRLT-JHEQGTHGSA-N Gly-Thr-Gln Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O CQMFNTVQVLQRLT-JHEQGTHGSA-N 0.000 description 1
- ZZWUYQXMIFTIIY-WEDXCCLWSA-N Gly-Thr-Leu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O ZZWUYQXMIFTIIY-WEDXCCLWSA-N 0.000 description 1
- RJVZMGQMJOQIAX-GJZGRUSLSA-N Gly-Trp-Met Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCSC)C(O)=O RJVZMGQMJOQIAX-GJZGRUSLSA-N 0.000 description 1
- GJHWILMUOANXTG-WPRPVWTQSA-N Gly-Val-Arg Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GJHWILMUOANXTG-WPRPVWTQSA-N 0.000 description 1
- 244000068988 Glycine max Species 0.000 description 1
- 235000010469 Glycine max Nutrition 0.000 description 1
- UYTPUPDQBNUYGX-UHFFFAOYSA-N Guanine Natural products O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 1
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 1
- 102220498322 HLA class II histocompatibility antigen, DR beta 3 chain_R40S_mutation Human genes 0.000 description 1
- 229920002488 Hemicellulose Polymers 0.000 description 1
- LIEIYPBMQJLASB-SRVKXCTJSA-N His-Gln-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CN=CN1 LIEIYPBMQJLASB-SRVKXCTJSA-N 0.000 description 1
- FDQYIRHBVVUTJF-ZETCQYMHSA-N His-Gly-Gly Chemical compound [O-]C(=O)CNC(=O)CNC(=O)[C@@H]([NH3+])CC1=CN=CN1 FDQYIRHBVVUTJF-ZETCQYMHSA-N 0.000 description 1
- BZKDJRSZWLPJNI-SRVKXCTJSA-N His-His-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O BZKDJRSZWLPJNI-SRVKXCTJSA-N 0.000 description 1
- TTYKEFZRLKQTHH-MELADBBJSA-N His-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O TTYKEFZRLKQTHH-MELADBBJSA-N 0.000 description 1
- PGXZHYYGOPKYKM-IHRRRGAJSA-N His-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CN=CN2)N)C(=O)N[C@@H](CCCCN)C(=O)O PGXZHYYGOPKYKM-IHRRRGAJSA-N 0.000 description 1
- KAXZXLSXFWSNNZ-XVYDVKMFSA-N His-Ser-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KAXZXLSXFWSNNZ-XVYDVKMFSA-N 0.000 description 1
- WSWAUVHXQREQQG-JYJNAYRXSA-N His-Tyr-Gln Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O WSWAUVHXQREQQG-JYJNAYRXSA-N 0.000 description 1
- CGAMSLMBYJHMDY-ONGXEEELSA-N His-Val-Gly Chemical compound CC(C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CN=CN1)N CGAMSLMBYJHMDY-ONGXEEELSA-N 0.000 description 1
- 241001480714 Humicola insolens Species 0.000 description 1
- JRHFQUPIZOYKQP-KBIXCLLPSA-N Ile-Ala-Glu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O JRHFQUPIZOYKQP-KBIXCLLPSA-N 0.000 description 1
- DMHGKBGOUAJRHU-UHFFFAOYSA-N Ile-Arg-Pro Natural products CCC(C)C(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O DMHGKBGOUAJRHU-UHFFFAOYSA-N 0.000 description 1
- SJLVSMMIFYTSGY-GRLWGSQLSA-N Ile-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N SJLVSMMIFYTSGY-GRLWGSQLSA-N 0.000 description 1
- FGBRXCZYVRFNKQ-MXAVVETBSA-N Ile-Phe-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)O)N FGBRXCZYVRFNKQ-MXAVVETBSA-N 0.000 description 1
- MLSUZXHSNRBDCI-CYDGBPFRSA-N Ile-Pro-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)O)N MLSUZXHSNRBDCI-CYDGBPFRSA-N 0.000 description 1
- ZDNNDIJTUHQCAM-MXAVVETBSA-N Ile-Ser-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N ZDNNDIJTUHQCAM-MXAVVETBSA-N 0.000 description 1
- RKQAYOWLSFLJEE-SVSWQMSJSA-N Ile-Thr-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)O)N RKQAYOWLSFLJEE-SVSWQMSJSA-N 0.000 description 1
- QHUREMVLLMNUAX-OSUNSFLBSA-N Ile-Thr-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)O)N QHUREMVLLMNUAX-OSUNSFLBSA-N 0.000 description 1
- HODVZHLJUUWPKY-STECZYCISA-N Ile-Tyr-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)CC)CC1=CC=C(O)C=C1 HODVZHLJUUWPKY-STECZYCISA-N 0.000 description 1
- 108010065920 Insulin Lispro Proteins 0.000 description 1
- PWWVAXIEGOYWEE-UHFFFAOYSA-N Isophenergan Chemical compound C1=CC=C2N(CC(C)N(C)C)C3=CC=CC=C3SC2=C1 PWWVAXIEGOYWEE-UHFFFAOYSA-N 0.000 description 1
- 241000235649 Kluyveromyces Species 0.000 description 1
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- JVTAAEKCZFNVCJ-UHFFFAOYSA-M Lactate Chemical compound CC(O)C([O-])=O JVTAAEKCZFNVCJ-UHFFFAOYSA-M 0.000 description 1
- 241000186660 Lactobacillus Species 0.000 description 1
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 1
- PBCHMHROGNUXMK-DLOVCJGASA-N Leu-Ala-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 PBCHMHROGNUXMK-DLOVCJGASA-N 0.000 description 1
- YKNBJXOJTURHCU-DCAQKATOSA-N Leu-Asp-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKNBJXOJTURHCU-DCAQKATOSA-N 0.000 description 1
- XVSJMWYYLHPDKY-DCAQKATOSA-N Leu-Asp-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O XVSJMWYYLHPDKY-DCAQKATOSA-N 0.000 description 1
- VQPPIMUZCZCOIL-GUBZILKMSA-N Leu-Gln-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O VQPPIMUZCZCOIL-GUBZILKMSA-N 0.000 description 1
- FQZPTCNSNPWHLJ-AVGNSLFASA-N Leu-Gln-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O FQZPTCNSNPWHLJ-AVGNSLFASA-N 0.000 description 1
- CQGSYZCULZMEDE-UHFFFAOYSA-N Leu-Gln-Pro Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)N1CCCC1C(O)=O CQGSYZCULZMEDE-UHFFFAOYSA-N 0.000 description 1
- KVMULWOHPPMHHE-DCAQKATOSA-N Leu-Glu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KVMULWOHPPMHHE-DCAQKATOSA-N 0.000 description 1
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 1
- BABSVXFGKFLIGW-UWVGGRQHSA-N Leu-Gly-Arg Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N BABSVXFGKFLIGW-UWVGGRQHSA-N 0.000 description 1
- CCQLQKZTXZBXTN-NHCYSSNCSA-N Leu-Gly-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CCQLQKZTXZBXTN-NHCYSSNCSA-N 0.000 description 1
- DBSLVQBXKVKDKJ-BJDJZHNGSA-N Leu-Ile-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O DBSLVQBXKVKDKJ-BJDJZHNGSA-N 0.000 description 1
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 1
- WXUOJXIGOPMDJM-SRVKXCTJSA-N Leu-Lys-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O WXUOJXIGOPMDJM-SRVKXCTJSA-N 0.000 description 1
- QMKFDEUJGYNFMC-AVGNSLFASA-N Leu-Pro-Arg Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QMKFDEUJGYNFMC-AVGNSLFASA-N 0.000 description 1
- BMVFXOQHDQZAQU-DCAQKATOSA-N Leu-Pro-Asp Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N BMVFXOQHDQZAQU-DCAQKATOSA-N 0.000 description 1
- VULJUQZPSOASBZ-SRVKXCTJSA-N Leu-Pro-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O VULJUQZPSOASBZ-SRVKXCTJSA-N 0.000 description 1
- YRRCOJOXAJNSAX-IHRRRGAJSA-N Leu-Pro-Lys Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N YRRCOJOXAJNSAX-IHRRRGAJSA-N 0.000 description 1
- XXXXOVFBXRERQL-ULQDDVLXSA-N Leu-Pro-Phe Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XXXXOVFBXRERQL-ULQDDVLXSA-N 0.000 description 1
- CHJKEDSZNSONPS-DCAQKATOSA-N Leu-Pro-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O CHJKEDSZNSONPS-DCAQKATOSA-N 0.000 description 1
- PWPBLZXWFXJFHE-RHYQMDGZSA-N Leu-Pro-Thr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O PWPBLZXWFXJFHE-RHYQMDGZSA-N 0.000 description 1
- AMSSKPUHBUQBOQ-SRVKXCTJSA-N Leu-Ser-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N AMSSKPUHBUQBOQ-SRVKXCTJSA-N 0.000 description 1
- AIQWYVFNBNNOLU-RHYQMDGZSA-N Leu-Thr-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O AIQWYVFNBNNOLU-RHYQMDGZSA-N 0.000 description 1
- JGKHAFUAPZCCDU-BZSNNMDCSA-N Leu-Tyr-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=C(O)C=C1 JGKHAFUAPZCCDU-BZSNNMDCSA-N 0.000 description 1
- YNNPKXBBRZVIRX-IHRRRGAJSA-N Lys-Arg-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O YNNPKXBBRZVIRX-IHRRRGAJSA-N 0.000 description 1
- GGAPIOORBXHMNY-ULQDDVLXSA-N Lys-Arg-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N)O GGAPIOORBXHMNY-ULQDDVLXSA-N 0.000 description 1
- WGCKDDHUFPQSMZ-ZPFDUUQYSA-N Lys-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCCCN WGCKDDHUFPQSMZ-ZPFDUUQYSA-N 0.000 description 1
- MRWXLRGAFDOILG-DCAQKATOSA-N Lys-Gln-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MRWXLRGAFDOILG-DCAQKATOSA-N 0.000 description 1
- HWMZUBUEOYAQSC-DCAQKATOSA-N Lys-Gln-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O HWMZUBUEOYAQSC-DCAQKATOSA-N 0.000 description 1
- KZOHPCYVORJBLG-AVGNSLFASA-N Lys-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCCN)N KZOHPCYVORJBLG-AVGNSLFASA-N 0.000 description 1
- MYZMQWHPDAYKIE-SRVKXCTJSA-N Lys-Leu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O MYZMQWHPDAYKIE-SRVKXCTJSA-N 0.000 description 1
- ZJWIXBZTAAJERF-IHRRRGAJSA-N Lys-Lys-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZJWIXBZTAAJERF-IHRRRGAJSA-N 0.000 description 1
- GIKFNMZSGYAPEJ-HJGDQZAQSA-N Lys-Thr-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O GIKFNMZSGYAPEJ-HJGDQZAQSA-N 0.000 description 1
- RMOKGALPSPOYKE-KATARQTJSA-N Lys-Thr-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O RMOKGALPSPOYKE-KATARQTJSA-N 0.000 description 1
- QLFAPXUXEBAWEK-NHCYSSNCSA-N Lys-Val-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QLFAPXUXEBAWEK-NHCYSSNCSA-N 0.000 description 1
- GUBGYTABKSRVRQ-PICCSMPSSA-N Maltose Natural products O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-PICCSMPSSA-N 0.000 description 1
- 241000947240 Marinobacter adhaerens Species 0.000 description 1
- 241000285148 Marinobacter adhaerens HP15 Species 0.000 description 1
- 241000662215 Marinobacter algicola Species 0.000 description 1
- 241000426386 Marinobacter algicola DG893 Species 0.000 description 1
- 241000501784 Marinobacter sp. Species 0.000 description 1
- OXHSZBRPUGNMKW-DCAQKATOSA-N Met-Gln-Arg Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OXHSZBRPUGNMKW-DCAQKATOSA-N 0.000 description 1
- NCVJJAJVWILAGI-SRVKXCTJSA-N Met-Gln-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N NCVJJAJVWILAGI-SRVKXCTJSA-N 0.000 description 1
- WWWGMQHQSAUXBU-BQBZGAKWSA-N Met-Gly-Asn Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(N)=O WWWGMQHQSAUXBU-BQBZGAKWSA-N 0.000 description 1
- FZUNSVYYPYJYAP-NAKRPEOUSA-N Met-Ile-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O FZUNSVYYPYJYAP-NAKRPEOUSA-N 0.000 description 1
- JHDNAOVJJQSMMM-GMOBBJLQSA-N Met-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCSC)N JHDNAOVJJQSMMM-GMOBBJLQSA-N 0.000 description 1
- SODXFJOPSCXOHE-IHRRRGAJSA-N Met-Leu-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O SODXFJOPSCXOHE-IHRRRGAJSA-N 0.000 description 1
- XDGFFEZAZHRZFR-RHYQMDGZSA-N Met-Leu-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XDGFFEZAZHRZFR-RHYQMDGZSA-N 0.000 description 1
- WPTHAGXMYDRPFD-SRVKXCTJSA-N Met-Lys-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O WPTHAGXMYDRPFD-SRVKXCTJSA-N 0.000 description 1
- PHURAEXVWLDIGT-LPEHRKFASA-N Met-Ser-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N PHURAEXVWLDIGT-LPEHRKFASA-N 0.000 description 1
- JACMWNXOOUYXCD-JYJNAYRXSA-N Met-Val-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JACMWNXOOUYXCD-JYJNAYRXSA-N 0.000 description 1
- 241001074116 Miscanthus x giganteus Species 0.000 description 1
- 241000235395 Mucor Species 0.000 description 1
- 241000226677 Myceliophthora Species 0.000 description 1
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 1
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 1
- 241000221960 Neurospora Species 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 241000228143 Penicillium Species 0.000 description 1
- 102220478178 Peptidyl-prolyl cis-trans isomerase E_L39A_mutation Human genes 0.000 description 1
- 239000001888 Peptone Substances 0.000 description 1
- 108010080698 Peptones Proteins 0.000 description 1
- 241000222385 Phanerochaete Species 0.000 description 1
- BBDSZDHUCPSYAC-QEJZJMRPSA-N Phe-Ala-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BBDSZDHUCPSYAC-QEJZJMRPSA-N 0.000 description 1
- JIYJYFIXQTYDNF-YDHLFZDLSA-N Phe-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N JIYJYFIXQTYDNF-YDHLFZDLSA-N 0.000 description 1
- WEDZFLRYSIDIRX-IHRRRGAJSA-N Phe-Ser-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=CC=C1 WEDZFLRYSIDIRX-IHRRRGAJSA-N 0.000 description 1
- MCIXMYKSPQUMJG-SRVKXCTJSA-N Phe-Ser-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MCIXMYKSPQUMJG-SRVKXCTJSA-N 0.000 description 1
- 241000235648 Pichia Species 0.000 description 1
- 241000222350 Pleurotus Species 0.000 description 1
- 241000209504 Poaceae Species 0.000 description 1
- 239000004743 Polypropylene Substances 0.000 description 1
- APKRGYLBSCWJJP-FXQIFTODSA-N Pro-Ala-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O APKRGYLBSCWJJP-FXQIFTODSA-N 0.000 description 1
- KIZQGKLMXKGDIV-BQBZGAKWSA-N Pro-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 KIZQGKLMXKGDIV-BQBZGAKWSA-N 0.000 description 1
- IFMDQWDAJUMMJC-DCAQKATOSA-N Pro-Ala-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O IFMDQWDAJUMMJC-DCAQKATOSA-N 0.000 description 1
- ONPFOYPPPOHMNH-UVBJJODRSA-N Pro-Ala-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@@H]3CCCN3 ONPFOYPPPOHMNH-UVBJJODRSA-N 0.000 description 1
- VCYJKOLZYPYGJV-AVGNSLFASA-N Pro-Arg-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O VCYJKOLZYPYGJV-AVGNSLFASA-N 0.000 description 1
- MGDFPGCFVJFITQ-CIUDSAMLSA-N Pro-Glu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MGDFPGCFVJFITQ-CIUDSAMLSA-N 0.000 description 1
- NMELOOXSGDRBRU-YUMQZZPRSA-N Pro-Glu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(=O)O)NC(=O)[C@@H]1CCCN1 NMELOOXSGDRBRU-YUMQZZPRSA-N 0.000 description 1
- HAAQQNHQZBOWFO-LURJTMIESA-N Pro-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H]1CCCN1 HAAQQNHQZBOWFO-LURJTMIESA-N 0.000 description 1
- RPLMFKUKFZOTER-AVGNSLFASA-N Pro-Met-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@@H]1CCCN1 RPLMFKUKFZOTER-AVGNSLFASA-N 0.000 description 1
- BGWKULMLUIUPKY-BQBZGAKWSA-N Pro-Ser-Gly Chemical compound OC(=O)CNC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 BGWKULMLUIUPKY-BQBZGAKWSA-N 0.000 description 1
- VVEQUISRWJDGMX-VKOGCVSHSA-N Pro-Trp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@@H]3CCCN3 VVEQUISRWJDGMX-VKOGCVSHSA-N 0.000 description 1
- VBZXFFYOBDLLFE-HSHDSVGOSA-N Pro-Trp-Thr Chemical compound N([C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H]([C@H](O)C)C(O)=O)C(=O)[C@@H]1CCCN1 VBZXFFYOBDLLFE-HSHDSVGOSA-N 0.000 description 1
- YHUBAXGAAYULJY-ULQDDVLXSA-N Pro-Tyr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O YHUBAXGAAYULJY-ULQDDVLXSA-N 0.000 description 1
- 241000589516 Pseudomonas Species 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 102220640571 Regulatory-associated protein of mTOR_Q84A_mutation Human genes 0.000 description 1
- 241000235402 Rhizomucor Species 0.000 description 1
- 241000316848 Rhodococcus <scale insect> Species 0.000 description 1
- 241001524101 Rhodococcus opacus Species 0.000 description 1
- 241000190984 Rhodospirillum rubrum Species 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- 102220532727 SPARC-like protein 1_A49D_mutation Human genes 0.000 description 1
- 241000235070 Saccharomyces Species 0.000 description 1
- 240000000111 Saccharum officinarum Species 0.000 description 1
- 235000007201 Saccharum officinarum Nutrition 0.000 description 1
- 241001466077 Salina Species 0.000 description 1
- 241000235346 Schizosaccharomyces Species 0.000 description 1
- BTKUIVBNGBFTTP-WHFBIAKZSA-N Ser-Ala-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)NCC(O)=O BTKUIVBNGBFTTP-WHFBIAKZSA-N 0.000 description 1
- KNZQGAUEYZJUSQ-ZLUOBGJFSA-N Ser-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N KNZQGAUEYZJUSQ-ZLUOBGJFSA-N 0.000 description 1
- DBIDZNUXSLXVRG-FXQIFTODSA-N Ser-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N DBIDZNUXSLXVRG-FXQIFTODSA-N 0.000 description 1
- YPUSXTWURJANKF-KBIXCLLPSA-N Ser-Gln-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YPUSXTWURJANKF-KBIXCLLPSA-N 0.000 description 1
- YMAWDPHQVABADW-CIUDSAMLSA-N Ser-Gln-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O YMAWDPHQVABADW-CIUDSAMLSA-N 0.000 description 1
- HJEBZBMOTCQYDN-ACZMJKKPSA-N Ser-Glu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HJEBZBMOTCQYDN-ACZMJKKPSA-N 0.000 description 1
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 1
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 1
- DOSZISJPMCYEHT-NAKRPEOUSA-N Ser-Ile-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O DOSZISJPMCYEHT-NAKRPEOUSA-N 0.000 description 1
- FUMGHWDRRFCKEP-CIUDSAMLSA-N Ser-Leu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O FUMGHWDRRFCKEP-CIUDSAMLSA-N 0.000 description 1
- HEUVHBXOVZONPU-BJDJZHNGSA-N Ser-Leu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HEUVHBXOVZONPU-BJDJZHNGSA-N 0.000 description 1
- DINQYZRMXGWWTG-GUBZILKMSA-N Ser-Pro-Pro Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DINQYZRMXGWWTG-GUBZILKMSA-N 0.000 description 1
- YXEYTHXDRDAIOJ-CWRNSKLLSA-N Ser-Trp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CO)N)C(=O)O YXEYTHXDRDAIOJ-CWRNSKLLSA-N 0.000 description 1
- PIQRHJQWEPWFJG-UWJYBYFXSA-N Ser-Tyr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O PIQRHJQWEPWFJG-UWJYBYFXSA-N 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 241000187747 Streptomyces Species 0.000 description 1
- 241000187398 Streptomyces lividans Species 0.000 description 1
- 241001468239 Streptomyces murinus Species 0.000 description 1
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 1
- 241000192581 Synechocystis sp. Species 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- 241001313706 Thermosynechococcus Species 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical class OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 description 1
- TYVAWPFQYFPSBR-BFHQHQDPSA-N Thr-Ala-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)NCC(O)=O TYVAWPFQYFPSBR-BFHQHQDPSA-N 0.000 description 1
- XYEXCEPTALHNEV-RCWTZXSCSA-N Thr-Arg-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O XYEXCEPTALHNEV-RCWTZXSCSA-N 0.000 description 1
- VFEHSAJCWWHDBH-RHYQMDGZSA-N Thr-Arg-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O VFEHSAJCWWHDBH-RHYQMDGZSA-N 0.000 description 1
- XVNZSJIKGJLQLH-RCWTZXSCSA-N Thr-Arg-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCSC)C(=O)O)N)O XVNZSJIKGJLQLH-RCWTZXSCSA-N 0.000 description 1
- YBXMGKCLOPDEKA-NUMRIWBASA-N Thr-Asp-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YBXMGKCLOPDEKA-NUMRIWBASA-N 0.000 description 1
- JXKMXEBNZCKSDY-JIOCBJNQSA-N Thr-Asp-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O JXKMXEBNZCKSDY-JIOCBJNQSA-N 0.000 description 1
- JMGJDTNUMAZNLX-RWRJDSDZSA-N Thr-Glu-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JMGJDTNUMAZNLX-RWRJDSDZSA-N 0.000 description 1
- WPAKPLPGQNUXGN-OSUNSFLBSA-N Thr-Ile-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WPAKPLPGQNUXGN-OSUNSFLBSA-N 0.000 description 1
- FQPDRTDDEZXCEC-SVSWQMSJSA-N Thr-Ile-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O FQPDRTDDEZXCEC-SVSWQMSJSA-N 0.000 description 1
- HOVLHEKTGVIKAP-WDCWCFNPSA-N Thr-Leu-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O HOVLHEKTGVIKAP-WDCWCFNPSA-N 0.000 description 1
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 1
- IJVNLNRVDUTWDD-MEYUZBJRSA-N Thr-Leu-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IJVNLNRVDUTWDD-MEYUZBJRSA-N 0.000 description 1
- DCRHJDRLCFMEBI-RHYQMDGZSA-N Thr-Lys-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(O)=O DCRHJDRLCFMEBI-RHYQMDGZSA-N 0.000 description 1
- BDENGIGFTNYZSJ-RCWTZXSCSA-N Thr-Pro-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(O)=O BDENGIGFTNYZSJ-RCWTZXSCSA-N 0.000 description 1
- YRJOLUDFVAUXLI-GSSVUCPTSA-N Thr-Thr-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O YRJOLUDFVAUXLI-GSSVUCPTSA-N 0.000 description 1
- 241000222354 Trametes Species 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 101710195626 Transcriptional activator protein Proteins 0.000 description 1
- 241000223259 Trichoderma Species 0.000 description 1
- 241000378866 Trichoderma koningii Species 0.000 description 1
- 241000223262 Trichoderma longibrachiatum Species 0.000 description 1
- 241000499912 Trichoderma reesei Species 0.000 description 1
- 241000223261 Trichoderma viride Species 0.000 description 1
- CZSMNLQMRWPGQF-XEGUGMAKSA-N Trp-Gln-Ala Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CZSMNLQMRWPGQF-XEGUGMAKSA-N 0.000 description 1
- WVHUFSCKCBQKJW-HKUYNNGSSA-N Trp-Gly-Tyr Chemical compound C([C@H](NC(=O)CNC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)N)C(O)=O)C1=CC=C(O)C=C1 WVHUFSCKCBQKJW-HKUYNNGSSA-N 0.000 description 1
- XLVRTKPAIXJYOH-HOCLYGCPSA-N Trp-His-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CN=CN3)C(=O)NCC(=O)O)N XLVRTKPAIXJYOH-HOCLYGCPSA-N 0.000 description 1
- NWQCKAPDGQMZQN-IHPCNDPISA-N Trp-Lys-Leu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O NWQCKAPDGQMZQN-IHPCNDPISA-N 0.000 description 1
- ABEVJDLMFPTGPS-SZMVWBNQSA-N Trp-Met-Met Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCSC)C(O)=O ABEVJDLMFPTGPS-SZMVWBNQSA-N 0.000 description 1
- UJGDFQRPYGJBEH-AAEUAGOBSA-N Trp-Ser-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N UJGDFQRPYGJBEH-AAEUAGOBSA-N 0.000 description 1
- DRQXUCVJDCRJDB-UHFFFAOYSA-N Turanose Natural products OC1C(CO)OC(O)(CO)C1OC1C(O)C(O)C(O)C(CO)O1 DRQXUCVJDCRJDB-UHFFFAOYSA-N 0.000 description 1
- HVHJYXDXRIWELT-RYUDHWBXSA-N Tyr-Glu-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O HVHJYXDXRIWELT-RYUDHWBXSA-N 0.000 description 1
- RIFVTNDKUMSSMN-ULQDDVLXSA-N Tyr-His-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](Cc1c[nH]cn1)NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(O)=O RIFVTNDKUMSSMN-ULQDDVLXSA-N 0.000 description 1
- HVPPEXXUDXAPOM-MGHWNKPDSA-N Tyr-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 HVPPEXXUDXAPOM-MGHWNKPDSA-N 0.000 description 1
- SBLZVFCEOCWRLS-BPNCWPANSA-N Tyr-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC1=CC=C(C=C1)O)N SBLZVFCEOCWRLS-BPNCWPANSA-N 0.000 description 1
- ARMNWLJYHCOSHE-KKUMJFAQSA-N Tyr-Pro-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O ARMNWLJYHCOSHE-KKUMJFAQSA-N 0.000 description 1
- XFEMMSGONWQACR-KJEVXHAQSA-N Tyr-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O XFEMMSGONWQACR-KJEVXHAQSA-N 0.000 description 1
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Natural products NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 1
- ZLFHAAGHGQBQQN-AEJSXWLSSA-N Val-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZLFHAAGHGQBQQN-AEJSXWLSSA-N 0.000 description 1
- CVUDMNSZAIZFAE-TUAOUCFPSA-N Val-Arg-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N CVUDMNSZAIZFAE-TUAOUCFPSA-N 0.000 description 1
- QPZMOUMNTGTEFR-ZKWXMUAHSA-N Val-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N QPZMOUMNTGTEFR-ZKWXMUAHSA-N 0.000 description 1
- QHDXUYOYTPWCSK-RCOVLWMOSA-N Val-Asp-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)NCC(=O)O)N QHDXUYOYTPWCSK-RCOVLWMOSA-N 0.000 description 1
- CFSSLXZJEMERJY-NRPADANISA-N Val-Gln-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CFSSLXZJEMERJY-NRPADANISA-N 0.000 description 1
- CPTQYHDSVGVGDZ-UKJIMTQDSA-N Val-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N CPTQYHDSVGVGDZ-UKJIMTQDSA-N 0.000 description 1
- JVYIGCARISMLMV-HOCLYGCPSA-N Val-Gly-Trp Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N JVYIGCARISMLMV-HOCLYGCPSA-N 0.000 description 1
- HQYVQDRYODWONX-DCAQKATOSA-N Val-His-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CO)C(=O)O)N HQYVQDRYODWONX-DCAQKATOSA-N 0.000 description 1
- CPGJELLYDQEDRK-NAKRPEOUSA-N Val-Ile-Ala Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](C)C(O)=O CPGJELLYDQEDRK-NAKRPEOUSA-N 0.000 description 1
- VXDSPJJQUQDCKH-UKJIMTQDSA-N Val-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N VXDSPJJQUQDCKH-UKJIMTQDSA-N 0.000 description 1
- XBJKAZATRJBDCU-GUBZILKMSA-N Val-Pro-Ala Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O XBJKAZATRJBDCU-GUBZILKMSA-N 0.000 description 1
- CEKSLIVSNNGOKH-KZVJFYERSA-N Val-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](C(C)C)N)O CEKSLIVSNNGOKH-KZVJFYERSA-N 0.000 description 1
- MNSSBIHFEUUXNW-RCWTZXSCSA-N Val-Thr-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N MNSSBIHFEUUXNW-RCWTZXSCSA-N 0.000 description 1
- YQYFYUSYEDNLSD-YEPSODPASA-N Val-Thr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O YQYFYUSYEDNLSD-YEPSODPASA-N 0.000 description 1
- AEFJNECXZCODJM-UWVGGRQHSA-N Val-Val-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C(=O)NCC([O-])=O AEFJNECXZCODJM-UWVGGRQHSA-N 0.000 description 1
- 102220634406 Vitamin K epoxide reductase complex subunit 1_R98E_mutation Human genes 0.000 description 1
- 239000004164 Wax ester Substances 0.000 description 1
- 241000235013 Yarrowia Species 0.000 description 1
- 235000007244 Zea mays Nutrition 0.000 description 1
- 241000588901 Zymomonas Species 0.000 description 1
- DPXJVFZANSGRMM-UHFFFAOYSA-N acetic acid;2,3,4,5,6-pentahydroxyhexanal;sodium Chemical compound [Na].CC(O)=O.OCC(O)C(O)C(O)C(O)C=O DPXJVFZANSGRMM-UHFFFAOYSA-N 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 239000012190 activator Substances 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 238000005273 aeration Methods 0.000 description 1
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 description 1
- 108010039538 alanyl-glycyl-aspartyl-valine Proteins 0.000 description 1
- 108010045023 alanyl-prolyl-tyrosine Proteins 0.000 description 1
- 108010005233 alanylglutamic acid Proteins 0.000 description 1
- 108010047495 alanylglycine Proteins 0.000 description 1
- 108010087924 alanylproline Proteins 0.000 description 1
- 125000003158 alcohol group Chemical group 0.000 description 1
- 150000001299 aldehydes Chemical class 0.000 description 1
- 150000001335 aliphatic alkanes Chemical class 0.000 description 1
- 150000007824 aliphatic compounds Chemical class 0.000 description 1
- 150000001345 alkine derivatives Chemical class 0.000 description 1
- 239000002168 alkylating agent Substances 0.000 description 1
- 229940100198 alkylating agent Drugs 0.000 description 1
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 1
- WQZGKKKJIJFFOK-PHYPRBDBSA-N alpha-D-galactose Chemical compound OC[C@H]1O[C@H](O)[C@H](O)[C@@H](O)[C@H]1O WQZGKKKJIJFFOK-PHYPRBDBSA-N 0.000 description 1
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 1
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 1
- 125000003368 amide group Chemical group 0.000 description 1
- 150000001408 amides Chemical class 0.000 description 1
- 150000001412 amines Chemical class 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 150000008064 anhydrides Chemical class 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 description 1
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 1
- 108010036533 arginylvaline Proteins 0.000 description 1
- 150000001491 aromatic compounds Chemical class 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 108010047857 aspartylglycine Proteins 0.000 description 1
- 108010068265 aspartyltyrosine Proteins 0.000 description 1
- 230000001651 autotrophic effect Effects 0.000 description 1
- 229940054340 bacillus coagulans Drugs 0.000 description 1
- 229940097012 bacillus thuringiensis Drugs 0.000 description 1
- 150000001277 beta hydroxy acids Chemical class 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- GUBGYTABKSRVRQ-QUYVBRFLSA-N beta-maltose Chemical compound OC[C@H]1O[C@H](O[C@H]2[C@H](O)[C@@H](O)[C@H](O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@@H]1O GUBGYTABKSRVRQ-QUYVBRFLSA-N 0.000 description 1
- 230000001851 biosynthetic effect Effects 0.000 description 1
- 125000000484 butyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])C([H])([H])[H] 0.000 description 1
- 102220408191 c.142G>C Human genes 0.000 description 1
- 229940041514 candida albicans extract Drugs 0.000 description 1
- 125000004432 carbon atom Chemical group C* 0.000 description 1
- 239000001569 carbon dioxide Substances 0.000 description 1
- 229910002092 carbon dioxide Inorganic materials 0.000 description 1
- 150000004649 carbonic acid derivatives Chemical class 0.000 description 1
- 239000001768 carboxy methyl cellulose Substances 0.000 description 1
- 150000001732 carboxylic acid derivatives Chemical class 0.000 description 1
- 150000001735 carboxylic acids Chemical class 0.000 description 1
- 239000006143 cell culture medium Substances 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 210000003850 cellular structure Anatomy 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 150000001793 charged compounds Chemical class 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 239000007795 chemical reaction product Substances 0.000 description 1
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 1
- 229960005091 chloramphenicol Drugs 0.000 description 1
- 150000003841 chloride salts Chemical class 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 238000012411 cloning technique Methods 0.000 description 1
- 239000003245 coal Substances 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 239000002537 cosmetic Substances 0.000 description 1
- 235000021438 curry Nutrition 0.000 description 1
- 150000001924 cycloalkanes Chemical class 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 description 1
- SUYVUBYJARFZHO-UHFFFAOYSA-N dATP Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-UHFFFAOYSA-N 0.000 description 1
- RGWHQCVHVJXOKC-SHYZEUOFSA-J dCTP(4-) Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-J 0.000 description 1
- HAAZLUGHYHWQIW-KVQBGUIXSA-N dGTP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HAAZLUGHYHWQIW-KVQBGUIXSA-N 0.000 description 1
- NHVNXKFIZYSCEB-XLPZGREQSA-N dTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 NHVNXKFIZYSCEB-XLPZGREQSA-N 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 108010049285 dephospho-CoA kinase Proteins 0.000 description 1
- 239000003599 detergent Substances 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- VILAVOFMIJHSJA-UHFFFAOYSA-N dicarbon monoxide Chemical compound [C]=C=O VILAVOFMIJHSJA-UHFFFAOYSA-N 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 239000000806 elastomer Substances 0.000 description 1
- 239000003995 emulsifying agent Substances 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 108010083294 ethanol acyltransferase Proteins 0.000 description 1
- 108010052305 exodeoxyribonuclease III Proteins 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000003925 fat Substances 0.000 description 1
- 150000002185 fatty acyl-CoAs Chemical class 0.000 description 1
- 210000003608 fece Anatomy 0.000 description 1
- 230000008713 feedback mechanism Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 235000019634 flavors Nutrition 0.000 description 1
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 1
- 235000013355 food flavoring agent Nutrition 0.000 description 1
- 239000010794 food waste Substances 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 239000002803 fossil fuel Substances 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 239000002816 fuel additive Substances 0.000 description 1
- 235000021255 galacto-oligosaccharides Nutrition 0.000 description 1
- 150000003271 galactooligosaccharides Chemical class 0.000 description 1
- 229930182830 galactose Natural products 0.000 description 1
- 239000007789 gas Substances 0.000 description 1
- 238000002290 gas chromatography-mass spectrometry Methods 0.000 description 1
- 239000008273 gelatin Substances 0.000 description 1
- 229920000159 gelatin Polymers 0.000 description 1
- 235000019322 gelatine Nutrition 0.000 description 1
- 235000011852 gelatine desserts Nutrition 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 125000002791 glucosyl group Chemical group C1([C@H](O)[C@@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 1
- 229930195712 glutamate Natural products 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 125000000404 glutamine group Chemical group N[C@@H](CCC(N)=O)C(=O)* 0.000 description 1
- 108010078144 glutaminyl-glycine Proteins 0.000 description 1
- 108010042598 glutamyl-aspartyl-glycine Proteins 0.000 description 1
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 1
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 1
- 108010008671 glycyl-tryptophyl-methionine Proteins 0.000 description 1
- 108010010147 glycylglutamine Proteins 0.000 description 1
- 108010015792 glycyllysine Proteins 0.000 description 1
- 108010081551 glycylphenylalanine Proteins 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- IVSXFFJGASXYCL-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=NC=N[C]21 IVSXFFJGASXYCL-UHFFFAOYSA-N 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 125000000623 heterocyclic group Chemical group 0.000 description 1
- BXWNKGSJHAJOGX-UHFFFAOYSA-N hexadecan-1-ol Chemical compound CCCCCCCCCCCCCCCCO BXWNKGSJHAJOGX-UHFFFAOYSA-N 0.000 description 1
- FUZZWVXGSFPDMH-UHFFFAOYSA-M hexanoate Chemical compound CCCCCC([O-])=O FUZZWVXGSFPDMH-UHFFFAOYSA-M 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 108010025306 histidylleucine Proteins 0.000 description 1
- 108010085325 histidylproline Proteins 0.000 description 1
- 238000002744 homologous recombination Methods 0.000 description 1
- 230000006801 homologous recombination Effects 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- IIUXHTGBZYEGHI-UHFFFAOYSA-N isoheptadecanoic acid Chemical compound CC(C)CCCCCCCCCCCCCC(O)=O IIUXHTGBZYEGHI-UHFFFAOYSA-N 0.000 description 1
- YYVJAABUJYRQJO-UHFFFAOYSA-N isomyristic acid Chemical compound CC(C)CCCCCCCCCCC(O)=O YYVJAABUJYRQJO-UHFFFAOYSA-N 0.000 description 1
- ZOCYQVNGROEVLU-UHFFFAOYSA-N isopentadecanoic acid Chemical compound CC(C)CCCCCCCCCCCC(O)=O ZOCYQVNGROEVLU-UHFFFAOYSA-N 0.000 description 1
- 238000002307 isotope ratio mass spectrometry Methods 0.000 description 1
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- 229930027917 kanamycin Natural products 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- 150000002561 ketenes Chemical class 0.000 description 1
- 229940039696 lactobacillus Drugs 0.000 description 1
- 238000011031 large-scale manufacturing process Methods 0.000 description 1
- 108010034529 leucyl-lysine Proteins 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 239000003915 liquefied petroleum gas Substances 0.000 description 1
- 239000010871 livestock manure Substances 0.000 description 1
- 125000003588 lysine group Chemical group [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 239000013028 medium composition Substances 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 150000002739 metals Chemical class 0.000 description 1
- 108010068488 methionylphenylalanine Proteins 0.000 description 1
- 229920000609 methyl cellulose Polymers 0.000 description 1
- 150000004702 methyl esters Chemical class 0.000 description 1
- 239000001923 methylcellulose Substances 0.000 description 1
- 235000010981 methylcellulose Nutrition 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 235000021281 monounsaturated fatty acids Nutrition 0.000 description 1
- 239000010813 municipal solid waste Substances 0.000 description 1
- 239000003471 mutagenic agent Substances 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 229920001542 oligosaccharide Polymers 0.000 description 1
- 150000002482 oligosaccharides Chemical class 0.000 description 1
- 235000021354 omega 7 monounsaturated fatty acids Nutrition 0.000 description 1
- 239000005416 organic matter Substances 0.000 description 1
- 239000012074 organic phase Substances 0.000 description 1
- 235000006408 oxalic acid Nutrition 0.000 description 1
- 230000003647 oxidation Effects 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- 239000001814 pectin Substances 0.000 description 1
- 235000010987 pectin Nutrition 0.000 description 1
- 229920001277 pectin Polymers 0.000 description 1
- 150000002972 pentoses Chemical class 0.000 description 1
- 235000019319 peptone Nutrition 0.000 description 1
- 210000001322 periplasm Anatomy 0.000 description 1
- 150000004965 peroxy acids Chemical class 0.000 description 1
- 239000003209 petroleum derivative Substances 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 108010018625 phenylalanylarginine Proteins 0.000 description 1
- 235000021317 phosphate Nutrition 0.000 description 1
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 1
- 108010001814 phosphopantetheinyl transferase Proteins 0.000 description 1
- 230000029553 photosynthesis Effects 0.000 description 1
- 238000010672 photosynthesis Methods 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 229920001155 polypropylene Polymers 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 150000003138 primary alcohols Chemical class 0.000 description 1
- 230000037452 priming Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000002062 proliferating effect Effects 0.000 description 1
- 108010077112 prolyl-proline Proteins 0.000 description 1
- 108010070643 prolylglutamic acid Proteins 0.000 description 1
- 108010029020 prolylglycine Proteins 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 230000004952 protein activity Effects 0.000 description 1
- 150000003212 purines Chemical class 0.000 description 1
- 150000003230 pyrimidines Chemical class 0.000 description 1
- 238000002708 random mutagenesis Methods 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 239000000376 reactant Substances 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 239000007320 rich medium Substances 0.000 description 1
- 102200043494 rs119103219 Human genes 0.000 description 1
- 102200058948 rs121909541 Human genes 0.000 description 1
- 102200072408 rs121917982 Human genes 0.000 description 1
- 102220265966 rs146527410 Human genes 0.000 description 1
- 102200164335 rs267607713 Human genes 0.000 description 1
- 102200163564 rs367654552 Human genes 0.000 description 1
- 102220281242 rs370230541 Human genes 0.000 description 1
- 102200163545 rs63749838 Human genes 0.000 description 1
- 102220226501 rs63749838 Human genes 0.000 description 1
- 102200163548 rs63751094 Human genes 0.000 description 1
- 102200061509 rs74315443 Human genes 0.000 description 1
- 102220059494 rs786202168 Human genes 0.000 description 1
- 102220086246 rs864622485 Human genes 0.000 description 1
- 102220096006 rs876660626 Human genes 0.000 description 1
- 102220099512 rs878853799 Human genes 0.000 description 1
- 102200114143 rs9282858 Human genes 0.000 description 1
- 150000004671 saturated fatty acids Chemical class 0.000 description 1
- 235000003441 saturated fatty acids Nutrition 0.000 description 1
- 229930195734 saturated hydrocarbon Natural products 0.000 description 1
- 238000013341 scale-up Methods 0.000 description 1
- 150000003333 secondary alcohols Chemical class 0.000 description 1
- 230000003248 secreting effect Effects 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 230000009919 sequestration Effects 0.000 description 1
- 125000003607 serino group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 description 1
- 108010071207 serylmethionine Proteins 0.000 description 1
- 239000010865 sewage Substances 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 239000004460 silage Substances 0.000 description 1
- 230000037432 silent mutation Effects 0.000 description 1
- 238000002553 single reaction monitoring Methods 0.000 description 1
- 238000013426 sirius red morphometry Methods 0.000 description 1
- 235000019812 sodium carboxymethyl cellulose Nutrition 0.000 description 1
- 229920001027 sodium carboxymethylcellulose Polymers 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 239000001509 sodium citrate Substances 0.000 description 1
- NLJMYIDDQXHKNR-UHFFFAOYSA-K sodium citrate Chemical compound O.O.[Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O NLJMYIDDQXHKNR-UHFFFAOYSA-K 0.000 description 1
- 239000001488 sodium phosphate Substances 0.000 description 1
- 229910000162 sodium phosphate Inorganic materials 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 239000010902 straw Substances 0.000 description 1
- KDYFGRWQOYBRFD-UHFFFAOYSA-L succinate(2-) Chemical compound [O-]C(=O)CCC([O-])=O KDYFGRWQOYBRFD-UHFFFAOYSA-L 0.000 description 1
- 125000000185 sucrose group Chemical group 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 239000013076 target substance Substances 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- 125000003396 thiol group Chemical group [H]S* 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 239000001226 triphosphate Substances 0.000 description 1
- 235000011178 triphosphate Nutrition 0.000 description 1
- RYFMWSXOAZQYPI-UHFFFAOYSA-K trisodium phosphate Chemical compound [Na+].[Na+].[Na+].[O-]P([O-])([O-])=O RYFMWSXOAZQYPI-UHFFFAOYSA-K 0.000 description 1
- 108010080629 tryptophan-leucine Proteins 0.000 description 1
- RULSWEULPANCDV-PIXUTMIVSA-N turanose Chemical compound OC[C@@H](O)[C@@H](O)[C@@H](C(=O)CO)O[C@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O RULSWEULPANCDV-PIXUTMIVSA-N 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 108010051110 tyrosyl-lysine Proteins 0.000 description 1
- 229930195735 unsaturated hydrocarbon Natural products 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 235000013311 vegetables Nutrition 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 239000013603 viral vector Substances 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 235000019386 wax ester Nutrition 0.000 description 1
- 108010027345 wheylin-1 peptide Proteins 0.000 description 1
- 239000002023 wood Substances 0.000 description 1
- 229920001221 xylan Polymers 0.000 description 1
- 150000004823 xylans Chemical class 0.000 description 1
- 239000012138 yeast extract Substances 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/18—Carboxylic ester hydrolases (3.1.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1003—Transferases (2.) transferring one-carbon groups (2.1)
- C12N9/1007—Methyltransferases (general) (2.1.1.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/64—Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
- C12P7/6436—Fatty acid esters
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y201/00—Transferases transferring one-carbon groups (2.1)
- C12Y201/01—Methyltransferases (2.1.1)
- C12Y201/01015—Fatty-acid O-methyltransferase (2.1.1.15)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y301/00—Hydrolases acting on ester bonds (3.1)
- C12Y301/01—Carboxylic ester hydrolases (3.1.1)
- C12Y301/01067—Fatty-acyl-ethyl-ester synthase (3.1.1.67)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y301/00—Hydrolases acting on ester bonds (3.1)
- C12Y301/02—Thioester hydrolases (3.1.2)
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02E—REDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
- Y02E50/00—Technologies for the production of fuel of non-fossil origin
- Y02E50/10—Biofuels, e.g. bio-diesel
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P20/00—Technologies relating to chemical industry
- Y02P20/50—Improvements relating to the production of bulk chemicals
- Y02P20/52—Improvements relating to the production of bulk chemicals using catalysts, e.g. selective catalysts
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P30/00—Technologies relating to oil refining and petrochemical industry
- Y02P30/20—Technologies relating to oil refining and petrochemical industry using bio-feedstock
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Genetics & Genomics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Medicinal Chemistry (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Oil, Petroleum & Natural Gas (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Enzymes And Modification Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
본 발명은 지방산 에스테르의 생성을 위해 개선된 에스테르 신타아제 특성을 갖는 효소 변이체에 관한 것이다. 또한, 이러한 변이체를 발현시키는 재조합 숙주 세포, 상기 재조합 숙주 세포를 포함하는 세포 배양물, 및 이러한 재조합 숙주 세포에 의해 생성된 지방산 에스테르 조성물이 고려된다.
Description
본 출원은 2012년 10월 1일에 출원된 미국 가출원 61/708,424, 및 2012년 9월 14일에 출원된 미국 가출원 61/701,191의 이익을 주장하며, 이는 본 명세서에서 전문이 인용참조된다.
본 출원은 EFS-Web을 통하여 ASCII 포맷으로 제출된 서열 목록을 포함하며, 이는 본 명세서에서 전문이 인용참조된다. 2013년 3월 12일에 작성된 ASCII 복사본은 파일명을 LS00043-44PCT_SL.txt라고 하였고, 크기는 164,228 바이트이다.
본 발명은 지방족 에스테르의 생성을 위한 개선된 에스테르 신타아제 특성을 갖는 효소 변이체에 관한 것이다.
석유는 액체, 기체 또는 고체 형태로 지구에서 발견되는 제한된 천연 자원이다. 하지만, 석유 제품은 재정적인 면과 환경적인 면에서 상당한 비용으로 개발된다. 그 자연적인 형태로, 지구에서 추출된 원유는 몇 가지 상업적인 용도를 갖는다. 이는, 가변적인 길이 및 복잡도를 탄화수소, 예를 들어 파라핀(또는 알칸), 올레핀(또는 알켄), 알킨, 나프텐(또는 시클로알칸), 지방족 화합물, 방향족 화합물 등의 혼합물이다. 또한, 원유는 다른 유기 화합물(예를 들어, 질소, 산소, 황 등을 함유한 유기 화합물) 및 불순물(예를 들어, 황, 염, 산, 금속 등)을 함유한다. 이의 높은 에너지 밀도와 용이한 수송성으로 인해, 대부분의 석유는 수송 연료(예를 들어, 가솔린, 디젤, 항공유 등), 난방유, 액화 석유 가스 등과 같은 연료로 정제된다.
석유는 플라스틱, 수지, 섬유, 엘라스토머, 의약품, 윤활제, 또는 젤 등과 같은 특수 화학제품을 만드는데 사용될 수 있다. 석유 화학 원료로부터 생성될 수 있는 특수 화학제품의 예시들은 지방산, 탄화수소[예를 들어, 긴 사슬형 탄화수소(long chain hydrocarbons), 분지쇄형 탄화수소(branched chain hydrocarbons), 포화 탄화수소, 불포화 탄화수소 등] 지방족 알코올, 지방족 에스테르, 지방족 알데히드, 케톤, 윤활제 등을 포함한다. 특수 화학제품은 다수의 상업적인 용도를 가질 수 있다. 지방산은 계면 활성제로서 상업적으로 이용된다. 계면 활성제는 세제 및 비누에서 발견될 수 있다. 또한, 지방산은 연료 첨가제, 윤활유, 페인트, 래커(lacquers), 양초, 쇼트닝, 화장품, 및 유화제로서 사용될 수 있다. 또한, 지방산은 고무 제품에서 촉진 활성제(accelerator activators)로서 사용된다. 또한, 지방산은 메틸 에스테르, 아미드, 아민, 산 클로라이드(acid chlorides), 무수물, 케텐 다이머, 및 퍼옥시산 및 에스테르를 생성하기 위한 공급원료로서 사용될 수 있다.
에스테르는 다수의 상업적인 용도를 갖는다. 예를 들어, 바이오디젤, 대체 연료는 에스테르(예를 들어, 지방산 메틸 에스테르, 지방산 에틸 에스테르 등)로 이루어져 있다. 몇몇 저 분자량 에스테르는 방향제 또는 착향료로서 유용하게 하는 상쾌한 냄새를 갖는 휘발성이다. 또한, 에스테르는 래커, 페인트 및 바니쉬에 대한 용매로서 사용된다. 또한, 왁스, 지방 및 오일과 같이 자연적으로 발생하는 몇몇 물질은 에스테르로 이루어진다. 또한, 에스테르는 수지 및 플라스틱의 연화제, 가소제, 난연제, 및 가솔린 및 오일의 첨가제로서 사용된다. 또한, 에스테르는 중합체, 필름, 직물, 염료, 및 의약품의 제조에 사용될 수 있다.
석유로부터 현재 도출되는 연료 및 제품 둘 모두를 생성하기 위한 대안적인 방식에 대한 필요성이 존재한다. 이와 같이, 미생물 시스템(microbial systems)은 다수의 타입의 바이오연료와 화학물질의 생물학적 생성에 대한 잠재력을 제공한다. 재생가능한 연료 및 화학물질은 [박테리아, 효모, 조류(algae)와 같은] 유전적 조작 생물체(genetically engineered organisms: GEO)로부터 도출될 수 있다. 자연적으로 발생하는 생합성 경로는 조작된 생물체가 재생가능한 연료와 화학 제품을 합성할 수 있도록 유전적으로 변경될 수 있다. 또한, 연료 및 화학 제품의 생성을 위한 공급원료로서 다양한 탄소원(carbon sources)을 이용하기 위해, 미생물이 알맞게 맞춰지거나(tailored) 대사적으로 조작될(metabolically engineered) 수 있다. 예를 들어, 왁스 에스테르 신타아제, 예컨대 마리노박터 하이드로카보노클라스티쿠스(Marinobacter hydrocarbonoclasticus: "M. 하이드로카보노클라스티쿠스")로부터 도출되는 왁스 에스테르 신타아제를 발현시키는 재조합 숙주 세포의 배양물에 메탄올을 첨가함으로써 FAME(지방산 메틸 에스테르)이 생성될 수 있다. 하지만, M. 하이드로카보노클라스티쿠스로부터의 야생형(wild type) 왁스 에스테르 신타아제의 발현은 상당한 양의 FAME을 생성하지 않으며, 따라서 개선된 왁스 에스테르 신타아제의 개발은 매우 바람직하다. 또한, M. 하이드로카보노클라스티쿠스로부터의 야생형 왁스 에스테르 신타아제는 상당한 양의 베타 하이드록시("β-OH") 에스테르를 생성하며, 이는 통상적으로 식물원으로부터 도출되는 연료 또는 화학물질에서 발견되지 않는다. 예를 들어, 본 명세서에서 인용 참조되는 특허 협력 조약 출원 PCT/US12/31682를 참조한다. 따라서, 더 높은 수율의 지방족 에스테르를 생성하는 에스테르 신타아제; 및 재조합 숙주 세포에서 발현될 때, 상당한 양의 β-OH 에스테르를 생성하지 않고 더 높은 수율의 지방족 에스테르를 생성하는 에스테르 신타아제를 조작하는 것이 바람직하다. 마지막으로, 지방족 에스테르의 생성 수율을 더욱 개선하기 위해 에스테르 신타아제 활성(ester synthase activity)을 갖는 다른 효소를 조작하는 것이 바람직하다.
해당 분야의 발전에도 불구하고, 유전적 변형 효소, 재조합 숙주 세포, 그리고 재조합 숙주 세포의 발효에 의한 관심(of interest) 연료 및 화학물질의 강건하고(robust) 비용-효율적인 생성을 달성하기 위한 방법 및 시스템의 개선에 대한 요구가 남아 있다. 본 발명은 지방족 에스테르의 수율을 증가시키는 다수의 에스테르 신타아제 효소 변이체를 제공함으로써 이러한 필요성을 해결한다. 또한, 본 발명의 에스테르 신타아제 효소 변이체 중 일부는 에스테르 신타아제 효소 변이체를 발현시키는 재조합 숙주 세포에서의 발효에 의해 생성된 지방족 에스테르 조성물의 β-OH 에스테르 함량을 변경(즉, 증가 또는 감소)시킨다. 또한, 본 발명은 더 큰 에스테르 신타아제 활성을 갖도록 조작된 다수의 티오에스테라아제 변이체를 제공함으로써 이러한 필요성을 해결하고, 지방족 에스테르 생성을 더욱 향상시킨다.
본 발명의 일 실시형태는 SEQ ID NO: 2를 갖는 변이 에스테르 신타아제 폴리펩티드를 제공하고, 상기 변이 에스테르 신타아제 폴리펩티드는, 아미노산 4, 5, 7, 15, 24, 30, 33, 39, 40, 41, 43, 44, 58, 73, 76, 77, 78, 80, 98, 99, 101, 102, 111, 122, 131, 146, 147, 149, 150, 155, 157, 162, 164, 166, 170, 171, 172, 173, 177, 179, 182, 184, 185, 186, 187, 188, 190, 192, 193, 195, 197, 201, 202, 203, 206, 207, 212, 216, 219, 234, 239, 242, 243, 244, 246, 255, 257, 258, 259, 260, 262, 263, 264, 265, 266, 267, 285, 288, 289, 293, 294, 301, 302, 303, 304, 306, 307, 309, 310, 311, 313, 314, 315, 316, 317, 319, 320, 323, 328, 334, 348, 349, 351, 352, 353, 356, 357, 360, 366, 375, 381, 393, 394, 395, 409, 411, 413, 420, 424, 442, 443, 447, 454, 455, 457, 458, 461, 466, 468, 및 472를 포함하는(이로 제한되지 않음) 아미노산 위치에서 적어도 하나의 돌연변이를 갖도록 유전적으로 조작되며, 변이 에스테르 신타아제 폴리펩티드는 대응하는 야생형 폴리펩티드에 비해 개선된 지방산 메틸 에스테르 활성을 갖는다. 관련 실시형태에서, 변이 폴리펩티드는 마리노박터 하이드로카보노클라스티쿠스(WS377) 에스테르 신타아제 폴리펩티드이다. 또 다른 관련 실시형태에서, 재조합 숙주 세포에서의 변이 에스테르 신타아제 폴리펩티드의 발현은 대응하는 야생형 폴리펩티드를 발현시키는 재조합 숙주 세포에 비해 더 높은 역가(titer)의 지방족 에스테르 조성물을 유도한다. 역가는 적어도 약 5 % 이상이다. 지방족 에스테르 조성물은 지방산 메틸 에스테르(FAME), 지방산 에틸 에스테르(FAEE), 지방산 프로필 에스테르, 지방산 이소프로필 에스테르, 지방산 부틸 에스테르, 모노글리세라이드, 지방산 이소부틸 에스테르, 지방산 2-부틸 에스테르 및 지방산 3차(tert)-부틸 에스테르를 포함한다(이로 제한되지 않음). 변이 에스테르 신타아제는 개선된 에스테르 신타아제 활성, 특히 증가된 베타 하이드록시 에스테르, 감소된 베타 하이드록실 에스테르, 지방산 에스테르의 증가된 사슬 길이 및 지방산 에스테르의 감소된 사슬 길이를 포함하는(이로 제한되지 않음) 개선된 특성을 유도하는 개선된 지방산 메틸 에스테르 활성을 갖는다.
본 발명의 또 다른 실시형태는 SEQ ID NO: 2를 갖는 변이 에스테르 신타아제 폴리펩티드를 제공하고, 상기 변이 에스테르 신타아제 폴리펩티드는, 아미노산 7, 24, 30, 41, 99, 111, 122, 146, 147, 149, 150, 171, 172, 173, 179, 187, 192, 212, 234, 239, 244, 246, 258, 264, 266, 267, 285, 301, 302, 303, 304, 306, 307, 309, 310, 311, 313, 314, 315, 316, 320, 348, 349, 352, 356, 357, 360, 375, 381, 393, 409, 411, 424, 443, 455, 457, 458, 461 및 472를 포함하는(이로 제한되지 않음) 아미노산 위치에서 적어도 하나의 돌연변이를 갖도록 유전적으로 조작된다. 재조합 숙주 세포에서의 변이 에스테르 신타아제 폴리펩티드의 발현은 대응하는 야생형 에스테르 신타아제 폴리펩티드를 발현시키는 재조합 숙주 세포에 비해 변경된 비율의 베타 하이드록시 에스테르의 생성을 유도할 수 있으며, 상기 변경된 비율의 베타 하이드록시 에스테르는 증가 또는 감소된 비율의 베타 하이드록시 에스테르이다.
본 발명의 또 다른 실시형태는 SEQ ID NO: 2를 갖는 변이 에스테르 신타아제 폴리펩티드를 제공하고, 상기 변이 에스테르 신타아제 폴리펩티드는, 아미노산 5, 7, 15, 24, 33, 44, 58, 73, 78, 101, 111, 162, 171, 179, 184, 187, 188, 192, 201, 207, 212, 234, 243, 244, 255, 257, 267, 307, 310, 317, 320, 348, 349, 353, 357, 366, 381, 394, 409, 411, 413, 442, 443, 및 461을 포함하는(이로 제한되지 않음) 아미노산 위치에서 적어도 하나의 돌연변이를 갖도록 유전적으로 조작된다.
본 발명의 또 다른 실시형태는 SEQ ID NO: 2를 갖는 변이 에스테르 신타아제 폴리펩티드를 제공하고, 상기 변이 에스테르 신타아제 폴리펩티드는, 아미노산 G4R, T5P, T5S, D7N, S15G, T24M, T24W, L30H, G33D, G33S, L39A, L39M, L39S, R40S, D41A, D41G, D41H, D41Y, V43K, V43S, T44A, T44F, T44K, Y58C, Y58L, A73Q, V76L, D77A, K78F, K78W, I80V, R98D, E99Q, G101L, I102R, P111D, P111G, P111S, H122S, R131M, I146K, I146L, I146R, S147A, V149L, R150P, V155G, T157S, R162E, N164D, N164R, P166S, T170R, T170S, V171E, V171F, V171H, V171R, V171W, R172S, R172W, P173W, R177V, A179S, A179V, D182G, E184F, E184G, E184L, E184R, E184S, A185L, A185M, S186T, V187G, V187R, P188R, A190P, A190R, A190W, S192A, S192L, S192V, Q193R, Q193S, M195G, A197T, A197V, Q201A, Q201V, Q201W, A202L, D203R, P206F, R207A, G212A, G212L, V216I, V219L, V234C, H239G, T242K, T242R, A243R, Q244G, R246A, R246G, R246L, R246Q, R246V, R246W, D255E, L257I, K258R, N259E, N259Q, L260V, H262Q, A263V, S264D, S264V, S264W, G265N, G266A, G266S, S267G, A285L, A285R, A285V, N288D, N289E, N289G, T293A, P294G, V301A, N302G, I303G, I303R, I303W, R304W, A306G, D307F, D307G, D307L, D307N, D307R, D307V, E309A, E309G, E309S, G310H, G310R, G310V, T311S, T313S, Q314G, I315F, S316G, F317W, I319G, A320C, A323G, D328F, Q334K, Q334S, Q348A, Q348R, K349A, K349C, K349H, K349Q, P351G, K352I, K352N, S353K, S353T, T356G, T356W, Q357V, M360Q, M360R, M360S, M360W, Y366G, Y366W, G375A, G375V, G375S, V381F, E393G, E393R, E393W, G394E, T395E, V409L, L411A, A413T, I420V, S424G, S424Q, S442E, S442G, M443G, A447C, A447I, A447L, L454V, D455E, L457Y, E458W, I461G, I461L, I461V, K466N, A468G, K472T 및 K472를 포함하는(이로 제한되지 않음) 아미노산 위치에서 적어도 하나의 돌연변이를 갖도록 유전적으로 조작된다. 본 발명의 특정 실시예에서, 변이 에스테르 신타아제 폴리펩티드는 돌연변이 D7N, A179V 및 V381F; D7N, A179V, Q348R 및 V381F; D7N, A179V, V187R, G212A, Q357V, V381F 및 M443G; T5S, S15G, P111S, V171R, P188R, F317W, S353T, V409L 및 S442G; T5S, S15G, K78F, P111S, V171R, P188R, S192V, A243R, F317W, K349H, S353T, V409L 및 S442G; T5S, S15G, V76L, P111S, V171R, P188R, K258R, S316G, F317W, S353T, M360R, V409L 및 S442G; T5S, S15G, P111S, V171R, P188R, Q244G, S267G, G310V, F317W, A320C, S353T, Y366W, V409L 및 S442G; S15G, P111S, V155G, P166S, V171R, P188R, F317W, Q348A, S353T, V381F, V409L 및 S442G; S15G, L39S, D77A, P111S, V171R, P188R, T313S, F317W, Q348A, S353T, V381F, V409L, I420V 및 S442G; T5S, S15G, T24W, T44F, P111S, I146L, V171R, P188R, D307N, F317W, S353T, V409L 및 S442G; T5S, S15G, K78F, P111S, V171R, P188R, S192V, R207A, A243R, D255E, L257I, N259Q, L260V, H262Q, G265N, A285V, N288D, N289G, F317W, Q348R, S353T, V381F, V409L 및 S442G; T5S, S15G, K78F, P111S, V171R, P188R, S192V, R207A, A243R, D255E, L257I, N259Q, L260V, H262Q, G265N, A285V, N288D, N289G, F317W, H349K, S353T, V381F, V409L 및 S442G; T5P, S15G, G33D, T44K, Y58L, P111S, R162E, V171R, P188R, R207A, V234C, Q244G, D255E, S267G, D307N, G310V, F317W, A320C, S353T, Y366W, G394E, V409L, S442G 및 I461V; T5P, S15G, G33D, T44K, Y58C, P111S, V171R, P188R, R207A, V234C, Q244G, L257I, S267G, D307N, G310V, F317W, A320C, S353T, Y366W, G394E, V409L, A413T, S442G 및 I461V; T5P, S15G, T44A, P111S, T157S, N164D, T170S, V171R, P188R, R207A, V216I, V234C, Q244G, L257I, S267G, D307N, G310V, F317W, A320C, Q334K, S353T, Y366W, G394E, V409L, S442G 및 I461V; 또는 돌연변이 T5P, S15G, Y58L, P111S, R162E, T170S, V171R, A179S, P188R, R207A, V234C, Q244G, L257I, S267G, D307N, G310V, F317W, A320C, S353K, Y366W, G394E, V409L, S442G 및 I461V를 포함한다.
본 발명의 또 다른 실시형태는 변이 에스테르 신타아제 폴리펩티드를 발현시키도록 유전적으로 조작된 재조합 숙주 세포를 제공한다. 관련 실시형태에서, 본 발명은 변이 에스테르 신타아제 폴리펩티드를 인코딩하는(encoding) 폴리뉴클레오티드 서열을 갖는 배양된 재조합 숙주 세포를 제공하며, 상기 변이 에스테르 신타아제 폴리펩티드를 발현시킬 때 상기 재조합 숙주 세포는, 상기 변이 에스테르 신타아제 폴리펩티드를 발현시키기에 효과적인 조건들 하에서 탄소원을 함유한 배지에서 배양될 때, 대응하는 야생형 폴리펩티드를 발현시키는 숙주 세포에 비해 지방산 에스테르의 더 높은 역가, 더 높은 수율 및/또는 더 높은 생산성(productivity)을 갖는 지방산 에스테르 조성물을 생성한다. 역가는 적어도 약 5 % 이상이다. 관련 실시형태에서, 변이 에스테르 신타아제 폴리펩티드를 발현시킬 때 재조합 숙주 세포는 야생형 에스테르 신타아제 폴리펩티드를 발현시키는 숙주 세포에 비해 변경된 비율의 베타 하이드록시 에스테르를 갖는 지방산 에스테르 조성물을 생성한다. 여기서, 변경된 비율의 베타 하이드록시 에스테르는 증가 또는 감소된 비율의 베타 하이드록시 에스테르이다.
본 발명의 또 다른 실시형태는 재조합 숙주 세포 및 지방족 에스테르 조성물을 포함하는 세포 배양물을 제공한다. 지방족 에스테르 조성물은 C6, C8, C1O, C12, C13, C14, C15, C16, C17 또는 C18 지방족 에스테르 중 1 이상을 포함할 수 있다. 또한, 지방족 에스테르 조성물은 불포화 지방족 에스테르 및/또는 포화 지방족 에스테르 및/또는 분지쇄형 지방족 에스테르를 포함할 수 있다. 또한, 지방족 에스테르 조성물은 지방족 에스테르의 환원 말단으로부터 C7과 C8 사이의 탄소 사슬의 위치 7에서 이중 결합을 갖는 지방족 에스테르를 포함할 수 있다.
또한, 본 발명은 SEQ ID NO: 2를 갖는 변이 마리노박터 하이드로카보노클라스티쿠스(WS377) 에스테르 신타아제 폴리펩티드를 고려하며, 변이 WS377 폴리펩티드는 야생형 WS377 폴리펩티드에 비해 개선된 지방산 메틸 에스테르 활성을 갖고, 변이 WS377은 아미노산 4, 5, 7, 15, 24, 30, 33, 39, 40, 41, 43, 44, 58, 73, 76, 77, 78, 80, 98, 99, 101, 102, 111, 122, 131, 146, 147, 149, 150, 155, 157, 162, 164, 166, 170, 171, 172, 173, 177, 179, 182, 184, 185, 186, 187, 188, 190, 192, 193, 195, 197, 201, 202, 203, 206, 207, 212, 216, 219, 234, 239, 242, 243, 244, 246, 255, 257, 258, 259, 260, 262, 263, 264, 265, 266, 267, 285, 288, 289, 293, 294, 301, 302, 303, 304, 306, 307, 309, 310, 311, 313, 314, 315, 316, 317, 319, 320, 323, 328, 334, 348, 349, 351, 352, 353, 356, 357, 360, 366, 375, 381, 393, 394, 395, 409, 411, 413, 420, 424, 442, 443, 447, 454, 455, 457, 458, 461, 466, 468, 및 472를 포함하는(이로 제한되지 않음) 아미노산 위치에서 적어도 하나의 돌연변이를 갖는다.
본 발명의 또 다른 실시형태는 SEQ ID NO: 51에 대해 적어도 약 90 %의 서열 동일성(sequence identity)을 갖는 아미노산 서열을 포함하는 변이 티오에스테라아제 폴리펩티드를 제공하며, 변이 에스테르 신타아제 폴리펩티드는 아미노산 32, 33, 34, 38, 45, 46, 48, 49, 51, 52, 76, 81, 82, 84, 88, 112, 115, 116, 118, 119, 148, 149, 156, 159 및 164를 포함하는(이로 제한되지 않음) 아미노산 위치에서 적어도 하나의 돌연변이를 갖도록 유전적으로 조작되고, 상기 변이 티오에스테라아제 폴리펩티드는 대응하는 야생형 폴리펩티드에 비해 더 큰 에스테르 신타아제 활성을 갖는다. 본 발명의 관련 실시형태에서, 변이 폴리펩티드는 포토박테리움 프로푼둠(Photobacterium profundum: Ppro) 티오에스테라아제 폴리펩티드이다. 재조합 숙주 세포에서의 변이 티오에스테라아제 폴리펩티드의 발현은 대응하는 야생형 폴리펩티드를 발현시키는 재조합 숙주 세포에 비해 더 높은 역가의 지방족 에스테르 조성물을 유도하며, 상기 역가는 적어도 약 5 % 이상이다. 관련 실시형태에서, 변이 티오에스테라아제 폴리펩티드는 지방산 메틸 에스테르, 지방산 에틸 에스테르, 지방산 프로필 에스테르, 지방산 이소프로필 에스테르, 지방산 부틸 에스테르, 모노글리세라이드, 지방산 이소부틸 에스테르, 지방산 2-부틸 에스테르 및 지방산 3차-부틸 에스테르를 포함하는(이로 제한되지 않음) 지방족 에스테르 조성물의 생성을 유도한다. 또 다른 관련 실시형태에서, 증가된 에스테르 신타아제 활성은 지방산 에스테르의 증가된 사슬 길이, 지방산 에스테르의 감소된 사슬 길이, 및 지방산 종(fatty acid species)의 지방산 에스테르 비율의 변화를 포함하는(이로 제한되지 않음) 특성들을 유도한다.
본 발명의 또 다른 실시형태는 아미노산 K32M, Q33A, Q33R, Q34R, I38Y, I45R, S46K, S46V, S46W, D48E, D48F, D48L, D48M, T49D, T49L,T49V, T49W, G51R, N52C, N52F, N52K, N52L, N52R, N76I, N76L, N76V, G81C, F82G, F82I, F82R, Q84A, Q84L, Q84V, R88H, V112L, Nl15F, Nl15W, Nl15Y, Yl16H, Yl16N, Yl16P, Y116R, Y116S, Y116T, K118Q, R119C, I148Y, L149F, L149M, L149T, N156K, N156R, N156Y, L159K, L159M 및 D164T를 포함하는(이로 제한되지 않음) 적어도 하나의 돌연변이를 갖는 변이 티오에스테라아제 폴리펩티드를 제공한다. 본 발명의 관련 실시형태는 돌연변이 S46V 및 Y116H; S46V, D48M, G51R, N76V 및 Yl16H; S46V, D48M, T49L, G51R, N76V, Yl16H 및 I148Y; S46V, D48M, T49L, G51R, N76V, N115F, Yl16H 및 I148Y; Q33R, Q34R, S46V, D48M, T49L, G51R, N52R, N76V, V112L, Nl15W, Yl16H 및 I148Y; Q33R, S46V, D48M, T49L, G51R, N52K, N76V, V112L, N115W, Y116H, I148Y 및 L149M; 또는 돌연변이 S46V, D48M, T49L, G51R, N52R, N76V, Q84A, V112L, N115W, Yl16H, I148Y 및 L149M를 갖는 변이 티오에스테라아제 폴리펩티드를 제공한다.
또한, 본 발명은 에스테르 신타아제 활성을 갖는 변이 티오에스테라아제 폴리펩티드를 발현시키도록 유전적으로 조작된 재조합 숙주 세포를 포함한다. 또한, 본 명세서는 변이 티오에스테라아제 폴리펩티드를 인코딩하는 폴리뉴클레오티드 서열을 포함하는 배양된 재조합 숙주 세포를 고려한다. 변이 티오에스테라아제 폴리펩티드를 발현시킬 때 재조합 숙주 세포는, 변이 티오에스테라아제 폴리펩티드를 발현시키기에 효과적인 조건들 하에서 탄소원을 함유한 배지에서 배양될 때 대응하는 야생형 티오에스테라아제 폴리펩티드를 발현시키는 숙주 세포에 비해 지방산 에스테르의 더 높은 역가, 더 높은 수율 및/또는 더 높은 생산성을 갖는 지방산 에스테르 조성물을 생성한다. 역가는 적어도 약 5 % 이상이다. 또한, 세포 배양물은 재조합 숙주 세포 및 지방족 에스테르 조성물을 포함한다. 지방족 에스테르 조성물은 C6, C8, C1O, C12, C13, C14, C15, C16, C17 또는 C18 지방족 에스테르 중 1 이상을 포함할 수 있다. 또한, 지방족 에스테르 조성물은 불포화 지방족 에스테르 및/또는 포화 지방족 에스테르 및/또는 분지쇄형 지방족 에스테르를 포함할 수 있다. 또한, 지방족 에스테르 조성물은 지방족 에스테르의 환원 말단으로부터 C7과 C8 사이의 탄소 사슬의 위치 7에서 이중 결합을 갖는 지방족 에스테르를 포함할 수 있다.
본 발명의 또 다른 실시형태는 에스테르 신타아제 활성을 갖는 변이 티오에스테라아제 폴리펩티드를 제공하며, 상기 변이 티오에스테라아제 폴리펩티드는 다음 LG[AG][VIL]D[AG]LRG와 같은 SEQ ID NO: 51의 아미노산 73 내지 81을 포함한다.
본 발명의 또 다른 실시형태는 SEQ ID NO: 51을 갖는 대응하는 야생형 Ppro 폴리펩티드 서열에 대해 적어도 약 90 %의 서열 동일성을 갖는 변이 포토박테리움의 프로푼둠(Ppro) 티오에스테라아제 폴리펩티드를 제공하며, 상기 Ppro 폴리펩티드는 야생형 Ppro 폴리펩티드에 비해 큰 에스테르 신타아제 활성을 갖고, 변이 Ppro 폴리펩티드는 아미노산 32, 33, 34, 38, 45, 46, 48, 49, 51, 52, 76, 81, 82, 84, 88, 112, 115, 116, 118, 119, 148, 149, 156, 159 및 164를 포함하는(이로 제한되지 않음) 적어도 하나의 돌연변이를 갖는다.
또한, 본 발명은 (a) 증가된 에스테르 신타아제 활성을 갖는 변이 폴리펩티드를 인코딩하는 폴리뉴클레오티드, (b) 활성 지방산, 및 (c) 알코올을 포함하는 재조합 숙주 세포를 포함하며, 재조합 숙주 세포는 변이 폴리펩티드의 에스테르 신타아제 활성을 발현시키기에 효과적인 조건들 하에서 지방족 에스테르 조성물을 생성한다. 활성 지방산은 아실-ACP 또는 아실-CoA이다. 또한, 재조합 숙주 세포는 탄소원을 이용할 수 있다. 지방족 에스테르 조성물은 적어도 약 5 % 이상의 역가로 생성된다.
본 발명의 또 다른 실시형태는 변이 에스테르 신타아제 폴리펩티드를 인코딩하는 폴리뉴클레오티드를 제공하며, 상기 폴리뉴클레오티드는 SEQ ID NO: 1에 대해 적어도 약 85 %의 서열 동일성을 갖고, 폴리뉴클레오티드는 ATG 시작(start) 이전에 SEQ ID NO: 27을 더 포함한다.
본 발명의 또 다른 실시형태는 SEQ ID NO: 29에 대해 적어도 약 95 %의 서열 동일성; 또는 SEQ ID NO: 33에 대해 95 %의 서열 동일성; 또는 SEQ ID NO: 35에 대해 95 %의 서열 동일성; 또는 SEQ ID NO: 37에 대해 95 %의 서열 동일성; 또는 SEQ ID NO: 39에 대해 95 %의 서열 동일성; 또는 SEQ ID NO: 41에 대해 95 %의 서열 동일성; 또는 SEQ ID NO: 43에 대해 95 %의 서열 동일성을 갖는 아미노산 서열을 갖는 변이 에스테르 신타아제 폴리펩티드를 제공한다. 여기서, 재조합 숙주 세포에서의 변이 에스테르 신타아제 폴리펩티드의 발현은 야생형 마리노박터 하이드로카보노클라스티쿠스(WS377) 에스테르 신타아제 폴리펩티드를 발현시키는 재조합 숙주 세포에 비해 더 높은 역가, 더 높은 수율 및/또는 증가된 생산성의 지방산 에스테르의 생성을 유도한다. 역가는 적어도 약 5 % 이상이다.
본 발명은 바람직한 실시예들을 나타내는데 도움을 주는 첨부한 도면과 연계하여 읽을 때 가장 잘 이해될 것이다. 하지만, 본 발명은 도면에 개시된 특정 실시예들로 제한되지 않음을 이해할 것이다.
도 1은 다양한 사슬 길이의 지방산 에스테르의 생성을 위해 재조합 숙주 세포 내로 통합될(incorporated) 수 있는 예시적인 세 가지 유전자 생합성 경로의 개략도이다. 사용되는 약어는 TE: 티오에스테라아제, FACS: 지방족 아실 CoA 신타아제, 및 AT: 아실트란스페라아제이다.
도 2는 티오에스테라아제에 의해 촉진되는(catalyzed) 제안된 무익 회로(futile cycle)의 개략도이다.
도 3은 아실-ACP로 시작하는 지방족 에스테르의 생성을 위한 두 가지 예시적인 생합성 경로의 개략도이며, 지방족 에스테르의 생성은 1 개의 효소계 또는 3 개의 효소계에 의해 달성된다.
도 4는 조합 라이브러리 히트(combination library hits)의 평판 발효(plate fermentation)로부터의 GC-FID 스크린의 결과를 나타낸다. 조합 라이브러리는 BD64로 형질전환된 템플릿(template)으로서 그룹 0 프라이머 및 pKEV38을 이용하여 구축되었다.
도 5는 야생형 '377 에스테르 신타아제를 함유한 균주와 비교되는 돌연변이 균주 KEV040, KEV075 및 KEV085에 의해 생성된 FAME 역가 및 % β-OH FAME을 나타낸다.
도 6은 메탄올, 에탄올, 1-프로판올, 이소프로판올, 1-부탄올 또는 글리세롤이 균주에 공급되었을 때 KEV040(왁스) 및 becos.128(Ppro)에 의해 생성된 총 지방산 종의 역가를 나타낸다.
도 7a 및 도 7b는, 메탄올을 이용하여 FAME를 만들거나(도 7a) 에탄올을 이용하여 FAEE를 만드는(도 7b) Ppro 변이체의 능력을 평가하기 위해, 구축된 Ppro 조합 라이브러리에 메탄올이 공급되었을 때 생성된 역가 및 % FAME(도 7a) 또는 FAEE(도 7b)를 나타낸다.
도 8은 (공급된) 메탄올, 에탄올, 1-프로판올, 이소프로판올, 1-부탄올 또는 글리세롤의 존재 시에 배양될 때 becos.128에 의해 생성된 지방산 종의 조성물을 나타낸다. FFA는 유리 지방산 종을 나타내고, FAxE는 에스테르 종을 나타낸다.
도 1은 다양한 사슬 길이의 지방산 에스테르의 생성을 위해 재조합 숙주 세포 내로 통합될(incorporated) 수 있는 예시적인 세 가지 유전자 생합성 경로의 개략도이다. 사용되는 약어는 TE: 티오에스테라아제, FACS: 지방족 아실 CoA 신타아제, 및 AT: 아실트란스페라아제이다.
도 2는 티오에스테라아제에 의해 촉진되는(catalyzed) 제안된 무익 회로(futile cycle)의 개략도이다.
도 3은 아실-ACP로 시작하는 지방족 에스테르의 생성을 위한 두 가지 예시적인 생합성 경로의 개략도이며, 지방족 에스테르의 생성은 1 개의 효소계 또는 3 개의 효소계에 의해 달성된다.
도 4는 조합 라이브러리 히트(combination library hits)의 평판 발효(plate fermentation)로부터의 GC-FID 스크린의 결과를 나타낸다. 조합 라이브러리는 BD64로 형질전환된 템플릿(template)으로서 그룹 0 프라이머 및 pKEV38을 이용하여 구축되었다.
도 5는 야생형 '377 에스테르 신타아제를 함유한 균주와 비교되는 돌연변이 균주 KEV040, KEV075 및 KEV085에 의해 생성된 FAME 역가 및 % β-OH FAME을 나타낸다.
도 6은 메탄올, 에탄올, 1-프로판올, 이소프로판올, 1-부탄올 또는 글리세롤이 균주에 공급되었을 때 KEV040(왁스) 및 becos.128(Ppro)에 의해 생성된 총 지방산 종의 역가를 나타낸다.
도 7a 및 도 7b는, 메탄올을 이용하여 FAME를 만들거나(도 7a) 에탄올을 이용하여 FAEE를 만드는(도 7b) Ppro 변이체의 능력을 평가하기 위해, 구축된 Ppro 조합 라이브러리에 메탄올이 공급되었을 때 생성된 역가 및 % FAME(도 7a) 또는 FAEE(도 7b)를 나타낸다.
도 8은 (공급된) 메탄올, 에탄올, 1-프로판올, 이소프로판올, 1-부탄올 또는 글리세롤의 존재 시에 배양될 때 becos.128에 의해 생성된 지방산 종의 조성물을 나타낸다. FFA는 유리 지방산 종을 나타내고, FAxE는 에스테르 종을 나타낸다.
본 발명은 지방족 에스테르의 생성을 위해 개선된 에스테르 신타아제 특성을 갖는 변이 효소에 관한 것이다. 여기서, 본 발명은 에스테르 신타아제 활성을 갖도록 설계된 변이 티오에스테라아제 효소 및 개선된 에스테르 신타아제 특성을 갖는 변이 에스테르 신타아제 효소와 같은 효소에 관한 것이다. 두 가지 유형의 효소는 단독으로 또는 다른 단백질과 조합하여 사용될 때 지방족 에스테르의 생성을 개선하도록 조작된다. 이를 예시하기 위해, 본 출원인들은 지방족 아실-CoA 신타아제 또는 상이한 티오에스테라아제를 과발현시킬 필요없이 생체 내에서 지방족 에스테르를 생성하기 위해 마리노박터 하이드로카보노클라스티쿠스로부터 에스테르 신타아제 및 포토박테리움 프로푼둠으로부터 티오에스테라아제를 조작하였다. 지금까지는, 여하한의 지방족 에스테르 생성이 티오에스테라아제, 아실-CoA 신타아제 및 에스테르 신타아제의 공동-발현(co-expression)을 필요로 하기 때문에, 더 높은 수율의 지방족 에스테르를 생성하기 위해서는 적어도 하나의 아실-CoA 신타아제 또는 티오에스테라아제 효소가 에스테르 신타아제와 동시에 과발현되어야 한다고 여겨졌다. 또한, 원시(native) 마리노박터 에스테르 신타아제 및 원시 티오에스테라아제는 일반적으로 짧은 사슬형 알코올을 이용하는데 알려져 있지 않다. 하지만, 본 출원인들은 에스테르 신타아제 활성을 갖는 변이 효소를 조작하여, 이러한 효소가 메탄올 및 에탄올을 포함하는 짧은 사슬형 알코올을 이용할 수 있게 하여, 이러한 효소가 지방족 에스테르를 생성할 수 있게 하였다. 예를 들어, 에스테르 신타아제 활성을 갖는 변이 티오에스테라아제 및 변이 에스테르 신타아제는 지방산 메틸 에스테르(들)(FAME) 및/또는 지방산 에틸 에스테르(들)(FAEE)를 다량으로(at high quantities) 생성할 수 있다. 이와 같이, 본 출원인들은 변이 효소 각각이 생체 내에서 에스테르의 더 높은 생성을 유도하는 변이 효소를 조작하였다.
본 명세서에서, 본 출원인들은 지방족 에스테르의 생성을 위해 편리한 일-유전자-시스템(one-gene-system: 도 3 참조)을 이용한다. 일-유전자-시스템은 통상적으로 재조합 숙주 세포에서 지방족 에스테르를 생성하기 위해 알코올 및 아실-ACP 또는 아실-CoA과 같이(즉, 기질과 같이) 활성 지방산과 조합하여 개선된 에스테르 신타아제 활성을 갖는 변이 효소를 인코딩하는 유전자를 이용한다. 지방족 에스테르의 생성을 위해 (부연하면, 다-유전자-시스템이 아닌) 일-유전자-시스템을 이용함에 따른 특정 장점들이 존재한다. 예를 들어, 이러한 한 가지 장점은 시스템 자체의 단순성이며, 이는 시스템이 더 빠르게 구현되게 하고 더 용이하게 모니터링되게 한다. 또 다른 장점은, 소위 무익 회로(즉, 기질 무익 회로, 두 개의 대사 경로가 반대 방향으로 동시에 진행되며, 전반적으로 효과를 갖지 않음)를 우회 또는 회피함에 따라, 생체 내에서 에스테르 생성 수율을 증가시키기 때문에, 일-유전자-시스템이 세포에 대해 더 에너지 효율적인 점이다.
더 구체적으로, 대장균의 지방산 에스테르 생성은 통상적으로 티오에스테라아제('tesA), 아실-CoA 신타아제(fadD) 및 왁스 또는 에스테르 신타아제의 공동-발현에 의존한다. 에스테르 생성을 최대화하기 위해, 유리 지방산("FFA")의 생성을 최소화하도록 3 개의 유전자가 세심하게 밸런싱된다(balanced). 티오에스테라아제는 아실-ACP(지방산 생합성의 생성물)와 유리 지방산(아실-CoA 신타아제의 기질)을 생성하는 아실-CoA(아실-CoA 신타아제의 생성물) 둘 모두에 작용할 수 있다. 본 발명은 마리노박터 하이드로카보노클라스티쿠스 DSM 8798 GenBank: EF219377(본 명세서에서 "'377"이라고 함)으로부터 클로닝된(cloned), 야생형 효소에 대해 개선된 특성을 갖는 변형된 에스테르 신타아제에 관한 것이다. 변형된 '377은 아실-ACP와 아실-CoA 둘 모두에 작용하여 지방산 메틸 에스테르("FAME")와 같은 지방산 에스테르를 생성하는 것으로 나타났다.
또한, 생성된 총 아실 종(FAME + FFA) 중 FAME의 비율은 사용되는 티오에스테라아제에 따라 달라진다. 포토박테리움 프로푼둠("P. 프로푼둠" 또는 "Ppro")의 'tesA는 낮은 비율의 FAME을 자연적으로 생성한다. 포토박테리움 프로푼둠 'tesA는 높은 비율의 FAME을 생성하도록 조작되었다. 따라서, 또한 본 발명은 대장균과 같은 숙주 세포에 여타의 유전자를 발현시킬 필요없이 더 높은 비율의 FAME을 생성하도록 유전적으로 조작된 포토박테리움 프로푼둠(본 명세서에서 "Ppro"라고도 함)으로부터의 변형된 티오에스테라아제('tesA)에 관한 것이다. 이론에 의해 한정되지 않고, 아실-ACP(지방산 생합성의 생성물)에 직접 작용하는 에스테르 신타아제는 현 바이오디젤 경로(biodiesel pathway)에 이론적으로 존재하는 무익 회로를 제거할 수 있음에 따라, 세포로부터 자원을 비축하고, 이는 지방산 생합성 쪽으로 지향될 수 있으며, 또한 이는 생성(production)을 개선할 것이다.
정의
본 명세서 및 첨부된 청구항에서 사용되는 바와 같이, 단수 형태 "a", "an" 및 "the"는 본문에 명확히 달리 명시되지 않는다면 복수의 지시대상(referent)을 포함한다. 따라서, 예를 들어 "재조합 숙주 세포"에 대한 언급은 이러한 2 이상의 재조합 숙주 세포를 포함하고, "지방족 에스테르"에 대한 언급은 1 이상의 지방족 에스테르 또는 에스테르의 혼합물을 포함하며, "핵산 코딩 서열"에 대한 언급은 1 이상의 핵산 코딩 서열을 포함하고, "효소"에 대한 언급은 1 이상의 효소를 포함한다.
본 명세서 전반에 걸쳐 서열 수탁 번호는 (여기에서 "NCBI 수탁 번호" 또는 대안적으로 "GenBank 수탁 번호"로 식별되는) 미국 국립보건원에 의해 유지되는 NCBI(미국 국립 생물공학 정보센터)에 의해 제공되는 데이터베이스로부터 그리고 (여기에서 "UniProtKB 수탁 번호"로 식별되는) 스위스 생물정보학 연구소에 의해 제공되는 UniProt 지식베이스(UniProtKB) 및 Swiss-Prot 데이터베이스로부터 얻어졌다.
EC 번호는 생화학 및 분자생물학 국제 연합(International Union of Biochemistry and Molecular Biology: IUBMB)의 명명 위원회(Nomenclature Committee)에 의해 제정되며, 이의 설명은 월드 와이드 웹의 IUBMB 효소 명명 웹사이트에서 이용가능하다. EC 번호는 촉진된 반응에 따라서 효소들을 분류한다.
본 명세서에서 사용되는 바와 같이, "뉴클레오티드"라는 용어는 헤테로사이클릭 염기, 당 및 1 이상의 인산기로 이루어진 폴리뉴클레오티드의 단위체 단위를 지칭한다. 자연적으로 발생하는 염기[구아닌(G), 아데닌(A), 사이토신(C), 티민(T) 및 우라실(U)]는 통상적으로 퓨린 또는 피리미딘의 유도체이지만, 자연적으로 및 비-자연적으로 발생하는 염기 유사체(base analog)들도 포함되는 것으로 이해하여야 한다. 자연적으로 발생하는 당은 펜토오스(5-탄당)의 (DNA를 형성하는) 디옥시리보오스 또는 (RNA를 형성하는) 리보오스이지만, 자연적으로 및 비-자연적으로 발생하는 당 유사체들도 포함되는 것으로 이해하여야 한다. 핵산은 통상적으로 핵산 또는 폴리뉴클레오티드를 형성하는 인산 결합을 통해 연결되지만, 많은 다른 연결들(예를 들어, 포스포로티오에이트, 보라노포스페이트 등)이 해당 기술분야에 알려져 있다.
"폴리뉴클레오티드"라는 용어는 리보뉴클레오티드(RNA) 또는 디옥시리보뉴클레오티드(DNA)의 중합체를 지칭하며, 이는 외가닥 또는 이중 가닥일 수 있으며, 비-천연 또는 변경된 뉴클레오티드들을 함유할 수 있다. "폴리뉴클레오티드", "핵산 서열" 및 "뉴클레오티드 서열"이라는 용어는 여하한 길이의 뉴클레오티드의 중합체 형태, RNA 또는 DNA 중 하나를 지칭한다. 이러한 용어는 분자의 일차 구조를 지칭하고, 따라서 이중 및 외가닥의 DNA, 및 이중 및 외가닥의 RNA를 포함한다. 이 용어는 메틸화된 및/또는 캡핑된(capped) 폴리뉴클레오티드(단, 이로 제한되지 않음)와 같은 변형된 폴리뉴클레오티드 및 뉴클레오티드 유사체로부터 만들어지는 RNA 또는 DNA 중 어느 하나의 유사체를 등가물로서 포함한다. 폴리뉴클레오티드는 플라스미드, 바이러스성, 염색체의, EST, cDNA, mRNA 및 rRNA를 포함하는(이로 제한되지 않음) 여하한 형태로 존재할 수 있다.
본 명세서에서 사용되는 바와 같이, "폴리펩티드" 및 "단백질"이라는 용어는 아미노산 잔기의 중합체를 지칭하는데 교환가능하게 사용된다. "재조합 폴리펩티드"라는 용어는 재조합 기술에 의해 생성된 폴리펩티드를 지칭하며, 일반적으로 발현되는 단백질을 인코딩하는 DNA 또는 RNA는 숙주 세포를 형질전환하여 폴리펩티드를 생성하는데 사용되는 적합한 발현 벡터(expression vector) 내로 삽입된다.
본 명세서에서 사용되는 바와 같이, "동족체(homolog)" 및 "상동(homologous)"이라는 용어는 대응하는 폴리뉴클레오티드 또는 폴리펩티드 서열과 적어도 약 50 % 동일한 서열을 포함하는 폴리뉴클레오티드 또는 폴리펩티드를 지칭한다. 바람직하게, 상동 폴리뉴클레오티드들 또는 폴리펩티드는 대응하는 아미노산 서열 또는 폴리뉴클레오티드 서열과 적어도 약 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % 또는 적어도 약 99 % 상동성(homology)을 갖는 폴리뉴클레오티드 서열들 또는 아미노산 서열들을 갖는다. 본 명세서에서 사용되는 바와 같이, 서열 "상동성" 및 서열 "동일성"은 교환가능하게 사용된다.
해당 기술분야의 당업자는 2 이상의 서열들 간의 상동성을 결정하는 방법들을 잘 알고 있다. 간명하게, 두 서열들 간의 "상동성"의 계산은 다음과 같이 수행될 수 있다. 이 서열들은 최적의 비교를 위해 정렬된다[예를 들어, 최적의 정렬을 위해 제 1 및 제 2 아미노산 또는 핵산 서열 중 하나 또는 둘 모두에 갭(gap)이 도입될 수 있으며, 비교를 위해 비-상동 서열은 무시될 수 있다]. 바람직한 실시예에서, 비교를 위해 정렬되는 제 1 서열의 길이는 제 2 서열의 길이의 적어도 약 30 %, 바람직하게는 적어도 약 40 %, 더 바람직하게는 적어도 약 50 %, 훨씬 더 바람직하게는 적어도 약 60 %, 그리고 훨씬 더 바람직하게는 적어도 약 70 %, 적어도 약 80 %, 적어도 약 85 %, 적어도 약 90 %, 적어도 약 95 %, 적어도 약 98 %, 또는 약 100 %이다. 이후, 제 1 및 제 2 서열들의 대응하는 아미노산 위치들 또는 뉴클레오티드 위치들에서의 아미노산 잔기들 또는 큐글레오티드들이 비교된다. 제 1 서열의 위치가 제 2 서열의 대응하는 위치와 동일한 아미노산 잔기 또는 뉴클레오티드에 의해 점유될 때, 분자들은 그 위치에서 동일하다. 두 서열들 간의 퍼센트 상동성은 두 서열들의 최적의 정렬을 위해 도입될 필요가 있는, 갭의 개수 및 각 갭의 길이를 고려한, 서열들에 의해 공유되는 동일한 위치들의 개수의 함수이다. 두 서열들 간의 퍼센트 상동성의 결정 및 서열의 비교는 BLAST와 같은 수학적 알고리즘을 이용하여 달성될 수 있다[Altschul 외, J. Mol. Biol., 215(3):403-410(1990)]. 또한, 두 아미노산 서열들 간의 퍼센트 상동성은 Blossum 62 매트릭스 또는 PAM250 매트릭스 중 어느 하나, 그리고 16, 14, 12, 10, 8, 6 또는 4의 갭 중량(gap weight) 및 1, 2, 3, 4, 5 또는 6의 길이 중량(length weight)을 이용하는, GCG 소프트웨어 패키지의 GAP 프로그램에 통합된 Needleman 및 Wunsch 알고리즘을 사용하여 결정될 수 있다[Needleman 및 Wunsch, J. Mol. Biol., 48:444-453 (1970)]. 또한, 두 뉴클레오티드 서열들 간의 퍼센트 상동성은 NWSgapdna.CMP 매트릭스 그리고 40, 50, 60, 70 또는 80의 갭 중량 및 1, 2, 3, 4, 5 또는 6의 길이 중량을 이용하는, GCG 소프트웨어 패키지의 GAP 프로그램을 이용하여 결정될 수 있다. 해당 기술분야의 당업자는 초기 상동성 계산을 수행할 수 있으며, 이에 따라 알고리즘 파라미터들을 조정할 수 있다. 바람직한 파라미터들의 세트(및, 당업자가, 분자가 청구항의 상동성 제한 내에 있는지 여부를 결정하기 위해 어떤 파라미터들이 적용되어야 하는지에 대한 확신이 없는 경우에 사용되어야 하는 파라미터들의 세트)는 12의 갭 페널티(gap penalty), 4의 갭 확장 페널티 및 5의 프레임시프트 갭 페널티(frameshift gap penalty)를 갖는 Blossum 62 스코어링 매트릭스(scoring matrix)이다. 서열 정렬의 추가적인 방법들은 생물공학 분야에 알려져 있다[예를 들어, Rosenberg, BMC Bioinformatics, 6:278(2005); Altschul 외, FEBS J., 272(20):5101-5109(2005)].
"낮은 엄격성, 중간 엄격성, 높은 엄격성 또는 매우 높은 엄격성 조건들 하에서 혼성화한다(hybridizes)"라는 용어는 혼성화 및 세정에 대한 조건들을 설명한다. 혼성화 반응을 수행하기 위한 안내는 Current Protocols in Molecular Biology[John Wiley & Sons, N.Y.(1989), 6.3.1-6.3.6]에서 찾을 수 있다. 수성 및 비-수성 방법들이 상기 참고문헌에 설명되며, 어느 하나가 사용될 수 있다. 여기에 언급된 특정 혼성화 조건들은 다음과 같다: 1) 낮은 엄격성 혼성화 조건 -- 약 45 ℃에서 6X 소듐 클로라이드/소듐 시트레이트(SSC), 이후에 적어도 50 ℃에서 0.2X SSC, 0.1 % SDS로 두 번 세정(세정의 온도는 낮은 엄격성 조건에 대해 55 ℃로 증가될 수 있음); 2) 중간 엄격성 혼성화 조건 -- 약 45 ℃에서 6X SSC, 이후에 60 ℃에서 0.2X SSC, 0.1 % SDS로 한번 이상 세정; 3) 높은 엄격성 혼성화 조건 -- 약 45 ℃에서 6X SSC, 이후에 65 ℃에서 0.2X SSC, 0.1 % SDS로 한번 이상 세정; 및 4) 매우 높은 엄격성 혼성화 조건 -- 65 ℃에서 0.5 M 소듐 포스페이트, 7 % SDS, 이후에 65 ℃에서 0.2X SSC, 1 % SDS로 한번 이상 세정. 달리 명시하지 않는다면, 매우 높은 엄격성 조건 (4)가 바람직한 조건이다.
"내인성" 폴리펩티드는 재조합 세포가 조작되는 (또는 "도출되는") 모(parent) 미생물 세포("숙주 세포"라고도 칭함)의 게놈(genome)에 의해 인코딩되는 폴리펩티드를 지칭한다. "외인성" 폴리펩티드는 모(parent) 미생물 세포의 게놈에 의해 인코딩되지 않는 폴리펩티드를 지칭한다. 변이(즉, 돌연변이) 폴리펩티드는 외인성 폴리펩티드의 일 예시이다.
본 명세서에서 사용되는 바와 같은 "이종(heterologous)"이라는 용어는 통상적으로 주어진 유기체 내에 자연적으로 존재하지 않는 뉴클레오티드, 폴리펩티드 또는 단백질 서열을 지칭한다. 예를 들어, 식물에 내인성인 폴리뉴클레오티드 서열은 재조합 방법들에 의해 숙주 세포 내로 도입될 수 있으며, 이후 식물 폴리뉴클레오티드가 그 재조합 숙주 세포에 대해 이종이다. 또한, "이종"이라는 용어는 비-원시 상태(non-native state)에서 재조합 숙주 세포에 존재하는 뉴클레오티드, 폴리펩티드 또는 단백질 서열을 지칭하는데 사용될 수 있다. 예를 들어, "이종" 뉴클레오티드, 폴리펩티드 또는 단백질 서열은 대응하는 야생형 숙주 세포에 자연적으로 존재하는 야생형 서열에 대해 변형될 수 있다(예를 들어, 뉴클레오티드, 폴리펩티드 또는 단백질의 서열 또는 발현 수준의 변형).
본 명세서에서 사용되는 바와 같이, 폴리펩티드의 "분절(fragment)"이라는 용어는 4 개의 아미노산 잔기에서부터 1 개의 아미노산 잔기를 뺀 전체 아미노산 서열에 이르는 크기 범위를 갖는 전체-길이 폴리펩티드 또는 단백질의 더 짧은 부분을 지칭한다. 본 발명의 특정 실시예들에서, 분절은 폴리펩티드 또는 단백질의 도메인[예를 들어, 기질 결합 도메인 또는 촉매 도메인]의 전체 아미노산 서열을 지칭한다.
"돌연변이유발(mutagenesis)"이라는 용어는 유기체의 유전 정보가 안정한 방식으로 변화되는 과정을 지칭한다. 단백질 코딩 핵산 서열의 돌연변이유발은 돌연변이 단백질을 생성한다. 또한, 돌연변이유발은 변형된 단백질 활성을 유도하는 비-코딩 핵산 서열의 변화를 지칭한다.
본 명세서에서 사용되는 바와 같은 "돌연변이"는 유전자의 핵산 위치 또는 폴리펩티드 또는 단백질의 아미노산 위치의 영구적인 변화를 가리킨다. 돌연변이는 치환, 추가, 삽입 및 결실을 포함한다. 예를 들어, 아미노산 위치의 돌연변이는 일 유형의 아미노산을 다른 유형의 아미노산으로 치환한 것일 수 있다(예컨대, 세린 (S)이 알라닌(A)으로 치환될 수 있고; 리신(L)이 T(트레오닌)로 치환될 수 있음). 이와 같이, 폴리펩티드 또는 단백질은 1 이상의 돌연변이를 가질 수 있으며, 일 아미노산은 다른 아미노산으로 치환된다. 예를 들어, 에스테르 신타아제 폴리펩티드 또는 단백질은 그 아미노산 서열에 1 이상의 돌연변이를 가질 수 있다.
"에스테르 신타아제 변이체"는 그 아미노산 서열에 1 이상의 돌연변이를 갖는 에스테르 신타아제 폴리펩티드 또는 단백질이다. 일 예시에서, 아미노산 서열은 0[즉, ATG 시작 부위(start site)에 기초한 초기 메티오닌(M)]에서 473까지의 범위를 갖는다. 이러한 에스테르 신타아제 변이체는 아미노산 위치 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, 192, 193, 194, 195, 196, 197, 198, 199, 200, 201, 202, 203, 204, 205, 206, 207, 208, 209, 210, 211, 212, 213, 214, 215, 216, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233, 234, 235, 236, 237, 238, 239, 240, 241, 242, 243, 244, 245, 246, 247, 248, 249, 250, 251, 252, 253, 254, 255, 256, 257, 258, 259, 260, 261, 262, 263, 264, 265, 266, 267, 268, 269, 270, 271, 272, 273, 274, 275, 276, 277, 278, 279, 280, 281, 282, 283, 284, 285, 286, 287, 288, 289, 290, 291, 292, 293, 294, 295, 296, 297, 298, 299, 300, 301, 302, 303, 304, 305, 306, 307, 308, 309, 310, 311, 312, 313, 314, 315, 316, 317, 318, 319, 320, 321,322, 323, 324, 325, 326, 327, 328, 329, 330, 331, 332, 333, 334, 335, 336, 337, 338, 339, 340, 341, 342, 343, 344, 345, 346, 347, 348, 349, 350, 351, 352, 353, 354, 355, 356, 357, 358, 359, 360, 361, 362, 363, 364, 365, 366, 367, 368, 369, 370, 371, 372, 373, 374, 375, 376, 377, 378, 379, 380, 381, 382, 383, 384, 385, 386, 387, 388, 389, 390, 391, 392, 393, 394, 395, 396, 397, 398, 399, 400, 401, 402, 403, 404, 405, 406, 407, 408, 409, 410, 411, 412, 413, 414, 415, 416, 417, 418, 419, 420, 421, 422, 423, 424, 425, 426, 427, 428, 429, 430, 431, 432, 433, 434, 435, 436, 437, 438, 439, 440, 441, 442, 443, 444, 445, 446, 447, 448, 449, 450, 451, 452, 453, 454, 455, 456, 457, 458, 459, 460, 461, 462, 463, 464, 465, 466, 467, 468, 469, 470, 471, 472, 및/또는 473에 1 이상의 돌연변이를 가질 수 있다. 특히, 아미노산 위치 139 및 140은 보존된 모티프(conserved motif)의 일부분임에 따라, 효소의 활성에 중요하다. 일 실시예에서, 돌연변이는 G4R, T5P, T5S, D7N, S15G, T24M, T24N, T24W, Q26T, L30H, G33D, G33N, G33S, L39A, L39M, L39S, R40S, D41A, D41G, D41H, D41Y, V43K, V43S, T44A, T44F, T44K, E48A, E48Q, A49D, A49T, Y58C, Y58L, I70L, I70V, A73G, A73Q, A73S, A73T, V76L, D77A, K78F, K78W, D79H, D79K, I80V, R98D, E99Q, G101L, I102R, P111D, P111G, P111S, H122S, V123I, V123M, R131M, I146K, I146L, I146R, S147A, V149L, R150P, V155G, T157S, T158E, T158K, R162E, R162K, C163I, C163R, N164D, N164R, P166L, P166S, T170R, T170S, V171E, V171F, V171H, V171R, V171W, R172S, R172W, P173W, H174E, Q175R, Q175S, R176T, R177V, A179K, A179S, A179V, D182G, K183S, E184F, E184G, E184L, E184R, E184S, A185L, A185M, S186T, V187G, V187R, P188R, A189G, A190P, A190R, A190W, V191I, V191L, S192A, S192L, S192V, Q193R, Q193S, M195G, D196E, A197T, A197V, Q201A, Q201V, Q201W, A202L, D203R, P206F, R207A, G212A, G212L, G212M, G212S, V216I, V219L, V234C, V236A, V236K, L237I, H239G, T242K, T242R, A243G, A243R, Q244G, R246A, R246G, R246L, R246Q, R246V, R246W, D255E, L257I, L257M, K258R, N259A, N259E, N259Q, L260M, L260V, H262Q, H262R, A263V, S264D, S264V, S264W, G265N, G266A, G266S, S267G, A285L, A285R, A285V, N288D, N289E, N289G, T293A, T293I, P294G, V301A, N302G, I303G, I303R, 1303W, R304W, A306G, A306S, D307F, D307G, D307L, D307N, D307R, D307V, E309A, E309G, E309S, G310H, G310R, G310V, T311S, T313S, Q314G, I315F, S316G, F317W, I319G, A320C, A323G, D328F, N331I, N331K, N331T, Q334K, Q334S, Q335C, Q335N, Q335S, T338A, T338E, T338H, Q348A, Q348R, K349A, K349C, K349H, K349Q, P351G, K352I, K352N, S353K, S353T, T356G, T356W, Q357V, M360R, M360Q, M360S, M360W, Y366G, Y366W, G375A, G375V, G375S, V381F, E393G, E393R, E393W, G394E, G394R, T395E, R402K, V409L, L411A, A413T, I420V, S424G, S424Q, S442E, S442G, M443G, A447C, A447I, A447L, L454V, D455E, L457Y, E458W, I461G, I461L, I461V, K466N, A468G, 472T 및 K472를 포함한다.
"에스테르 신타아제 활성을 갖는 티오에스테라아제 변이체" 또는 "티오에스테라아제 변이체"라는 용어는 본 명세서에서 교환가능하게 사용되며, 에스테르 신타아제 활성을 갖고 그 아미노산 서열에 1 이상의 돌연변이를 갖는 티오에스테라아제 폴리펩티드 또는 단백질을 지칭한다. 일 예시에서, 아미노산 서열은 0[즉, ATG 시작 부위에 기초한 초기 메티오닌(M)]에서 182까지의 범위를 갖는다. 이러한 티오에스테라아제 변이체는 아미노산 위치 1, 2, 3, 4, 5, 6, 7, 8, 9, 1 1, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 1 14, 115, 116, 117, 118, 119, 120, 121 , 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156, 158, 159, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181 및/또는 182에 1 이상의 돌연변이(들)를 가질 수 있다. 하지만, 아미노산 위치 10, 157 및 160은 촉매 삼조원소(catalytic triad)의 일부분임에 따라, 효소의 활성에 중요하다. 일 실시예에서, 돌연변이는 R18C, K32M, Q33A, Q33R, Q34R, E37D, I38Y, I45R, I45T, S46K, S46V, S46W, D48E, D48F, D48L, D48M, T49D, T49L,T49V, T49W, G51R, N52C, N52F, N52K, N52L, N52R, K65M, N76I, N76L, N76V, G81C, F82G, F82I, F82R, Q84A, Q84L, Q84V, R88H, D102V, V112L, N115F, N115W, N115Y, Y116H, Y116N, Y116P, Y116R, Y116S, Y116T, K118Q, R119C, I148Y, L149F, L149M, L149T, N156K, N156R, N156Y, L159K, L159M 및 D164T를 포함한다.
본 명세서에서 사용되는 바와 같이, "유전자"라는 용어는 RNA 생성물 또는 단백질 생성물 중 어느 하나를 인코딩하는 핵산 서열뿐만 아니라, RNA 또는 단백질의 발현에 영향을 주는 작동가능하게-연결된 핵산 서열(operably-linked nucleic acid sequences)[예를 들어, 이러한 서열은 프로모터 또는 증폭자(enhancer) 서열을 포함함(이로 제한되지 않음)] 또는 RNA 또는 단백질의 발현에 영향을 주는 서열을 인코딩하는 작동가능하게 연결된 핵산 서열[예를 들어, 이러한 서열은 리보솜 결합 부위 또는 번역 조절 서열(translational control sequences)을 포함함(이로 제한되지 않음)]을 지칭한다.
발현 조절 서열(Expression control sequences)은 해당 기술분야에 알려져 있으며, 예를 들어 숙주 세포에서 폴리뉴클레오티드 서열의 발현을 위하여 제공되는 프로모터, 증폭자, 아데닐산중합반응 신호(polyadenylation signal), 전사 종결자(transcription terminator), 내부 리보솜 유입점(internal ribosome entry sites: IRES) 등을 포함한다. 발현 조절 서열은 특히 전사에 관련된 세포성 단백질들과 상호작용한다[Maniatis 외, Science, 236:1237-1245(1987)]. 예시적인 발현 조절 서열은, 예를 들어 Goeddel, Gene Expression Technology: Methods in Enzymology, Vol. 185, Academic Press, San Diego, Calif.(1990)에 개시되어 있다. 본 발명의 방법들에서, 발현 조절 서열은 폴리뉴클레오티드 서열에 작동가능하게 연결된다. "작동가능하게 연결된"이라는 것은, 적절한 분자(예를 들어, 전사 활성화인자 단백질)가 발현 조절 서열(들)에 결합될 때, 폴리뉴클레오티드 서열 및 발현 조절 서열(들)이 유전자 발현을 허용하는 방식으로 연결되는 것을 의미한다. 작동가능하게 연결된 프로모터는, 전사 및 번역의 방향에 관하여, 선택된 폴리뉴클레오티드 서열의 상류(upstream)에 위치된다. 작동가능하게 연결된 증폭자는 선택된 폴리뉴클레오티드의 상류, 내부 또는 하류(downstream)에 위치될 수 있다.
본 명세서에서 사용되는 바와 같이, "벡터"라는 용어는 벡터가 연결된 다른 핵산, 즉 폴리뉴클레오티드 서열을 수송할 수 있는 핵산 분자를 지칭한다. 일 유형의 유용한 벡터는 에피솜(episome)[즉, 염색체외 복제(extra-chromosomal replication)가 가능한 핵산]이다. 유용한 벡터는 벡터가 연결된 핵산의 자동 복제 및/또는 발현이 가능한 벡터이다. 작동가능하게 연결된 유전자의 발현을 지향할 수 있는 벡터는 본 명세서에서 "발현 벡터"로 칭해진다. 일반적으로, 재조합 DNA 기술에서 유용한 발현 벡터는 흔히 "플라스미드"의 형태로 되어 있으며, 이는 일반적으로 벡터 형태로 염색체에 결합되지 않는 원형 이중 가닥 DNA 루프를 지칭한다. "플라스미드" 및 "벡터"라는 용어는, 플라스미드가 가장 보편적으로 많이 사용되는 벡터 형태인 점에서, 본 명세서에서 교환가능하게 사용된다. 하지만, 등가의 기능들을 수행하고 이후 해당 기술분야에 알려질 다른 형태의 발현 벡터도 포함된다. 몇몇 실시예들에서, 재조합 벡터는 폴리뉴클레오티드 서열에 작동가능하게 연결된 프로모터를 더 포함한다. 몇몇 실시예들에서, 프로모터는 발달-조절된(developmentally-regulated), 세포소기관-특이적(organelle-specific), 조직-특이적(tissue-specific), 유도성(inducible), 구성적(constitutive), 또는 세포-특이적 프로모터이다. 재조합 벡터는 통상적으로 폴리뉴클레오티드 서열에 작동가능하게 연결된 발현 조절 서열; 폴리뉴클레오티드 서열에 작동가능하게 연결된 선택 마커; 폴리뉴클레오티드 서열에 작동가능하게 연결된 마커 서열; 폴리뉴클레오티드 서열에 작동가능하게 연결된 정제 모이어티(purification moiety); 폴리뉴클레오티드 서열에 작동가능하게 연결된 분비 서열(secretion sequence); 및 폴리뉴클레오티드 서열에 작동가능하게 연결된 표적화 서열(targeting sequence)로부터 선택된 1 이상의 서열을 포함한다. 특정 실시예들에서, 뉴클레오티드 서열은 숙주 세포의 게놈 DNA 내로 안정하게 통합되며, 뉴클레오티드 서열의 발현은 조절된 프로모터 구역의 제어를 받는다. 본 명세서에 설명되는 발현 벡터는 숙주 세포에서의 폴리뉴클레오티드 서열의 발현에 적합한 형태로 된 본 명세서에 설명된 폴리뉴클레오티드 서열을 포함한다. 해당 기술분야의 당업자라면, 발현 벡터의 설계는 형질전환될 숙주 세포의 선택, 원하는 폴리펩티드의 발현 수준 등과 같은 요인들에 의존할 수 있음을 이해할 것이다. 본 명세서에 설명되는 발현 벡터는 본 명세서에 설명되는 바와 같은 폴리뉴클레오티드 서열들에 의해 인코딩되는 (융합 폴리펩티드들을 포함하는) 폴리펩티드들을 생성하기 위하여 숙주 세포 내로 도입될 수 있다.
본 명세서에서 사용되는 바와 같이, 재조합 또는 조작된 "숙주 세포"는, 예를 들어 아실-CoA, 지방산, 지방족 알데히드, 짧은 사슬형 및 긴 사슬형 알코올, 탄화수소, 지방족 알코올, 지방족 에스테르(예를 들어, 왁스, 지방산 에스테르, 지방족 에스테르 및/또는 지방 지방족 에스테르), 말단 올레핀, 내부 올레핀 및 케톤을 포함하는 지방산 유도체 중 1 이상을 생성하는데 사용되는 숙주 세포, 예를 들어 미생물이다. 몇몇 실시예들에서, 재조합 숙주 세포는 1 이상의 폴리뉴클레오티드를 포함하고, 각각의 폴리뉴클레오티드는 지방산 생합성 효소 활성을 갖는 폴리펩티드를 인코딩하며, 재조합 숙주 세포는, 폴리뉴클레오티드를 발현시키기에 효과적인 조건들 하에서 탄소원의 존재 시에 배양될 때 지방족 에스테르 조성물을 생성한다.
본 명세서에서 사용되는 바와 같이, "아실-ACP"는 아실기 운반 단백질(ACP)의 포스포판테테이닐 모이어티의 술피드릴기와 알킬 사슬의 카르보닐 탄소 사이에 형성되는 아실 티오에스테르를 지칭한다. 포스포판테테이닐 모이어티는 홀로(holo)-아실기 운반 단백질 신타아제(ACPS), 포스포판테테이닐 전달효소의 작용에 의해 ACP의 보존된 세린 잔기에 번역-후(post-translationally) 부착된다. 몇몇 실시예들에서, 아실-ACP는 완전히 포화된 아실-ACP의 합성의 중간체이다. 다른 실시예들에서, 아실-ACP는 불포화된 아실-ACP의 합성의 중간체이다. 몇몇 실시예들에서, 탄소 사슬은 약 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25 또는 26 개의 탄소들을 가질 것이다. 이러한 아실-ACP의 각각은 이들을 지방산 유도체들로 전환시키는 효소들에 대한 기질들이다.
본 명세서에서 사용되는 바와 같이, "지방산 유도체"라는 용어는 "지방산" 또는 "지방산 유도체"를 의미하며, 이는 "지방산 또는 이의 유도체"로 지칭될 수 있다. "지방산"이라는 용어는 화학식 RCOOH를 갖는 카르복실산을 의미한다. R은 지방족기, 바람직하게는 알킬기를 나타낸다. R은 약 4 내지 22 개의 탄소 원자들을 포함할 수 있다. 지방산은 분지쇄형 또는 직쇄형을 가질 수 있으며, 포화, 단일불포화 또는 다중불포화될 수 있다. "지방산 유도체"는 생성 숙주 유기체의 지방산 생합성 경로로부터 부분적으로 만들어지는 생성물이다. "지방산 유도체들"은 아실-ACP 또는 아실-ACP 유도체로부터 부분적으로 만들어지는 생성물들을 포함한다. 예시적인 지방산 유도체는 아실-CoA, 지방산, 지방족 알데히드, 짧은 사슬형 및 긴 사슬형 알코올, 지방족 알코올, 탄화수소, 에스테르(예를 들어, 왁스, 지방산 에스테르 또는 지방족 에스테르), 말단 올레핀, 내부 올레핀 및 케톤을 포함한다.
본 명세서에서 언급된 바와 같은 "지방산 유도체 조성물"은 재조합 숙주 세포에 의해 생성되며, 통상적으로 지방산 유도체의 혼합물을 포함한다. 몇몇 경우, 혼합물은 1 이상의 유형의 지방산 유도체 생성물(예를 들어, 지방산, 지방족 에스테르, 지방족 알코올, 지방족 알데히드, 지방족 케톤, 탄화수소 등)을 포함한다. 다른 경우, 지방산 유도체 조성물은, 예를 들어 상이한 사슬 길이, 포화 및/또는 분지 특성을 갖는 지방족 에스테르(또는 다른 지방산 유도체)의 혼합물을 포함할 수 있다. 다른 경우, 지방산 유도체 조성물은 상이한 사슬 길이, 포화 및/또는 분지 특성을 갖는 지방산 유도체와 1 이상의 유형의 지방산 유도체 생성물의 혼합물을 둘 모두 포함한다. 다른 경우, 지방산 유도체 조성물은, 예를 들어 지방족 에스테르와 베타 하이드록시 에스테르의 혼합물을 포함할 수 있다.
본 명세서에서 사용되는 바와 같이, "지방산 생합성 경로"라는 용어는 지방산 유도체를 생성하는 생합성 경로를 의미한다. 지방산 생합성 경로는 원하는 특성들을 갖는 지방산 유도체를 생성하기 위해 추가 효소를 포함할 수 있다.
본 명세서에서 사용되는 바와 같이, "지방족 에스테르"는 화학식 RCOOR'를 갖는 에스테르를 의미한다. 본 명세서에서 언급되는 지방족 에스테르는 지방산, 예를 들어 지방산 에스테르로부터 만들어지는 여하한의 에스테르일 수 있다. 몇몇 실시예들에서, R기는 길이가 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 적어도 10, 적어도 11 , 적어도 12, 적어도 13, 적어도 14, 적어도 15, 적어도 16, 적어도 17, 적어도 18 또는 적어도 19 개의 탄소들이다. 대안적으로 또는 추가적으로, R기는 길이가 20 이하, 19 이하, 18 이하, 17 이하, 16 이하, 15 이하, 14 이하, 13 이하, 12 이하, 11 이하, 10 이하, 9 이하, 8 이하, 7 이하 또는 6 이하의 탄소들이다. 따라서, R기는 상기의 종단점들 중 임의의 2 개로 한정되는 R기를 가질 수 있다. 예를 들어, R기는 길이가 6 내지 16 개의 탄소들, 10 내지 14 개의 탄소들, 또는 12 내지 18 개의 탄소들일 수 있다. 몇몇 실시예들에서, 지방족 에스테르 조성물은 C6, C7, C8, C9, C1O, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C21, C22, C23, C24, C25 및 C26 지방족 에스테르 중 1 이상을 포함한다. 다른 실시예들에서, 지방족 에스테르 조성물은 C6, C7, C8, C9, C1O, C11, C12, C13, C14, C15, C16, C17 및 C18 지방족 에스테르 중 1 이상을 포함한다. 다른 실시예들에서, 지방족 에스테르 조성물은 C12, C14, C16 및 C18 지방족 에스테르; C12, C14 및 C16 지방족 에스테르; C14, C16 및 C18 지방족 에스테르; 또는 C12 및 C14 지방족 에스테르를 포함한다.
지방산 유도체, 예를 들어 지방족 에스테르의 R기는 직쇄형 또는 분지쇄형일 수 있다. 분지쇄형은 1 이상의 분지점을 가질 수 있으며, 사이클릭형 분지들을 포함할 수 있다. 몇몇 실시예들에서, 분지형 지방산, 분지형 지방족 알데히드 또는 분지형 지방족 에스테르는 C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C21, C22, C23, C24, C25 또는 C26 분지형 지방산, 분지형 지방족 알데히드 또는 분지형 지방족 에스테르이다. 특정 실시예들에서, 분지형 지방산, 분지형 지방족 알데히드 또는 분지형 지방족 에스테르는 C6, C7, C8, C9, C1O, C11, C12, C13, C14, C15, C16, C17 또는 C18 분지형 지방산, 분지형 지방족 에스테르이다. 본 명세서의 지방족 에스테르는 A 측 및 B 측을 포함하는 것으로 언급될 수 있다. 본 명세서에서 사용되는 바와 같이, 에스테르의 "A 측"은 에스테르의 카르복실레이트 산소에 부착된 탄소 사슬을 지칭한다. 본 명세서에서 사용되는 바와 같이, 에스테르의 "B 측"은 에스테르의 모(parent) 카르복실레이트를 포함하는 탄소 사슬을 지칭한다. 지방족 에스테르가 지방산 생합성 경로로부터 도출될 때, A 측은 통상적으로 알코올이 기여하고, B 측은 지방산이 기여한다.
지방족 에스테르의 A 측을 형성하기 위해 여하한의 알코올이 사용될 수 있다. 예를 들어, 알코올은 본 명세서에 설명된 것과 같은 지방산 생합성 경로로부터 도출될 수 있다. 대안적으로, 알코올은 비-지방산 생합성 경로를 통해 생성될 수 있다. 또한, 알코올은 외인성으로 제공될 수 있다. 예를 들어, 지방족 에스테르가 유기체에 의해 생성되는 경우, 알코올은 발효액(fermentation broth)에 공급될 수 있다. 대안적으로, 지방족 에스테르가 알코올을 생성할 수 있는 유기체에 의해 생성되는 경우, 지방산 또는 아세트산과 같은 카르복실산은 외인성으로 공급될 수 있다.
에스테르의 A 측 또는 B 측을 포함하는 탄소 사슬은 여하한의 길이로 되어 있을 수 있다. 일 실시예에서, 에스테르의 A 측은 길이가 적어도 약 1, 2, 3, 4, 5, 6, 7, 8, 10, 12, 14, 16 또는 18 개의 탄소들이다. 지방족 에스테르가 지방산 메틸 에스테르일 때, 에스테르의 A 측은 길이가 1 개의 탄소이다. 지방족 에스테르가 지방산 에틸 에스테르일 때, 에스테르의 A 측은 길이가 2 개의 탄소들이다. 에스테르의 B 측은 길이가 적어도 약 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24 또는 26 개의 탄소들일 수 있다. A 측 및/또는 B 측은 직쇄형 또는 분지쇄형일 수 있다. 분지쇄형은 1 이상의 분지점을 가질 수 있다. 또한, 분지쇄형은 사이클릭형 분지들을 포함할 수 있다. 또한, A 측 및/또는 B 측은 포화되거나 불포화될 수 있다. 불포화된 경우, A 측 및/또는 B 측은 1 이상의 불포화점을 가질 수 있다. 또한, 본 발명에 따라 생성된 지방족 에스테르의 알코올기는 반드시 첫 번째(C1) 위치에 존재할 필요는 없다. 일 실시예에서, 지방족 에스테르는 생합성으로 생성된다. 이 실시예에서, 제 1 지방산이 "활성화"된다. "활성화" 지방산의 비-제한적인 예시는 아실-CoA, 아실 ACP 및 아실 포스페이트이다. 아실-CoA는 지방산 생합성 또는 분해의 직접적인 산물일 수 있다. 또한, 아실-CoA는 유리 지방산, CoA 및 아데노신 뉴클레오티드 트리포스페이트(ATP)로부터 합성될 수 있다. 아실-CoA를 생성하는 효소의 일 예시는 아실-CoA 신타아제이다.
특정 실시예들에서, 분지형 지방산 유도체는 이소(iso)-지방산 유도체, 예를 들어 이소-지방족 에스테르 또는 안테이소(anteiso)-지방산 유도체, 예를 들어 안테이소-지방족 에스테르이다. 예시적인 실시예들에서, 분지형 지방산 유도체는 이소-C7:0, 이소-C8:0, 이소-C9:0, 이소-C10:0, 이소-C11:0, 이소-C12:0, 이소-C13:0, 이소-C14:0, 이소-C15:0, 이소-C16:0, 이소-C17:0, 이소-C18:0, 이소-C19:0, 안테이소-C7:0, 안테이소-C8:0, 안테이소-C9:0, 안테이소-C10:0, 안테이소-C11:0, 안테이소-C12:0, 안테이소-C13:0, 안테이소-C14:0, 안테이소-C15:0, 안테이소-C16:0, 안테이소-C17:0, 안테이소-C18:0 및 안테이소-C19:0 분지형 지방족 에스테르로부터 선택된다.
분지형 또는 비분지형 지방산 유도체의 R기는 포화되거나 불포화될 수 있다. 불포화된 경우, R기는 1 이상의 불포화점을 가질 수 있다. 몇몇 실시예들에서, 불포화 지방산 유도체는 단일불포화 지방산 유도체이다. 특정 실시예들에서, 불포화 지방산 유도체는 C6:1, C7:1, C8:1, C9:1, C10:1, C11:1, C12:1, C13:1, C14:1, C15:1, C16:1, C17:1, C18:1, C19:1, C20:1, C21:1, C22:1, C23:1, C24:1, C25:1 또는 C26:1 불포화 지방산 유도체이다. 특정 실시예들에서, 불포화 지방산 유도체는 C10:1, C12:1, C14:1, C16:1 또는 C18:1 불포화 지방산 유도체이다. 다른 실시예들에서, 불포화 지방산 유도체는 오메가-7 위치에서 불포화된다. 특정 실시예들에서, 불포화 지방산 유도체는 cis 이중 결합을 포함한다.
본 명세서에서 사용되는 바와 같이, "클론"이라는 용어는 통상적으로 단일 공통 선조와 본질적으로 유전적으로 동일하고 이의 자손인 세포 또는 세포의 그룹, 예를 들어 단일 박테리아성 세포에서 발생하는 클로닝된 박테리아성 콜로니(cloned bacterial colony)의 박테리아를 지칭한다.
본 명세서에서 사용되는 바와 같이, "배양"이라는 용어는 통상적으로 생세포(viable cells)를 포함하는 액체 배지를 지칭한다. 일 실시예에서, 배양은 제어된 조건들 하에서 사전설정된 배양 배지에서 번식하는 세포들, 예를 들어 선택된 탄소원 및 질소를 포함하는 액체 배지에서 성장되는 재조합 숙주 세포의 배양을 포함한다. "배양하는" 또는 "배양"은 액체 또는 고체 배지의 적합한 조건들 하에서 재조합 숙주 세포의 개체군을 성장시키는 것을 지칭한다. 특정 실시예들에서, "배양"은 최종 생성물로의 기질의 발효성 생물전환(bioconversion)을 지칭한다. 배양 배지는 잘 알려져 있으며, 이러한 배양 배지의 각각의 성분은, 예를 들어 Difco™ 배지 및 BBL™ 배지라는 이름의 상용 공급원(commercial source)들로부터 이용가능하다. 비-제한적인 일 실시예에서, 수성 영양분 배지(aqueous nutrient medium)는 YP 배지와 같이 질소, 염 및 탄소의 복합원을 포함하는 "풍부한 배지(rich medium)"이며, 이는 이러한 배지의 10 g/L의 펩톤 및 10 g/L 효모 추출물을 포함한다.
본 명세서에서 사용되는 바와 같이, "상기 이종 뉴클레오티드 서열(들)을 발현시키기에 효과적인 조건들 하에서"라는 용어는 숙주 세포가 원하는 지방산 유도체를 생성하게 하는 여하한 조건을 의미한다. 적합한 조건들은, 예를 들어 발효 조건들을 포함한다.
본 명세서에서 사용되는 바와 같이, 재조합 숙주 세포 내에서 단백질, 예를 들어 효소의 "변형된" 또는 "변경된 수준"의 활성은 모(parent) 또는 원시(native) 숙주 세포에 대해 결정된 활성의 1 이상의 특징의 차이를 지칭한다. 통상적으로, 활성의 차이는 변형된 활성을 갖는 재조합 숙주 세포와 대응하는 야생형 숙주 세포 사이에서 결정된다(예를 들어, 대응하는 야생형 숙주 세포에 대한 재조합 숙주 세포의 배양물의 비교). 예를 들어, 변형된 활성은 [예를 들어, 단백질을 인코딩하는 DNA 서열의 증가 또는 감소된 수의 복제, 단백질을 인코딩하는 증가 또는 감소된 수의 mRNA 전사체, 및/또는 mRNA로부터의 단백질의 증가 또는 감소된 양의 단백질 번역(protein translation)의 결과로서] 재조합 숙주 세포에 의해 발현되는 변형된 양의 단백질; 단백질의 구조 변화[예를 들어, 기질 특수성의 변화, 관찰되는 운동 파라미터들(kinetic parameters)의 변화를 유도하는 단백질 코딩 서열에 대한 변화와 같은 일차 구조에 대한 변화); 및 단백질 안정성의 변화(예를 들어, 단백질의 증가 또는 감소된 분해)의 결과일 수 있다. 몇몇 실시예들에서, 폴리펩티드는 본 명세서에 설명된 폴리펩티드 중 어느 하나의 돌연변이체 또는 변이체, 예를 들어 WS377("'377"), Ppro이다. 특정 경우에서, 본 명세서에 설명된 폴리펩티드들에 대한 코딩 서열은 특정 숙주 세포에서의 발현에 최적화된 코돈(codon)이다. 예를 들어, 대장균의 발현에 대하여, 예를 들어 Grosjean 외, Gene 18:199-209(1982)에 설명된 바와 같이 1 이상의 코돈이 최적화될 수 있다.
통상적으로, 본 명세서에서 사용되는 바와 같은 "조절 서열(regulatory sequences)"이라는 용어는 궁극적으로 단백질의 발현을 제어하는 단백질을 인코딩하는 DNA 서열들에 작동가능하게 연결된, DNA의 염기 서열을 지칭한다. 조절 서열의 예시들은 RNA 프로모터 서열, 전사 인자 결합 서열(transcription factor binding sequences), 전사 종결 서열, [증폭자 요소와 같은] 전사의 조절인자(modulators), RNA 안정성에 영향을 주는 뉴클레오티드 서열, 및 번역 조절 서열[예컨대, 리보솜 결합 부위(예를 들어, 원핵생물의 샤인-달가노 서열(Shine-Dalgarno sequences) 또는 진핵생물의 코작 서열(Kozak sequences), 개시 코돈, 종결 코돈]을 포함한다(이로 제한되지 않음). 본 명세서에 사용되는 바와 같이, 상기 뉴클레오티드 서열의 발현은 야생형 뉴클레오티드 서열에 대해 변형된다"라는 어구는, 내인성 뉴클레오티드 서열의 발현 및/또는 활성 또는 이종 혹은 비-원시 폴리펩티드-인코딩 뉴클레오티드 서열의 발현 및/또는 활성의 수준의 증가 또는 감소를 의미한다. "변경된 수준의 발현" 및 "변형된 수준의 발현"이라는 용어는 교환가능하게 사용되며, 폴리뉴클레오티드, 폴리펩티드 또는 탄화수소가 동일한 조건들 하에서 대응하는 야생형 세포의 농도에 비해 조작된 숙주 세포에서 상이한 농도로 존재함을 의미한다. 본 명세서에 사용되는 바와 같이, 폴리뉴클레오티드에 대한 "발현"이라는 용어는 이것이 기능하게 한다는 것이다. 폴리펩티드(또는 단백질)를 인코딩하는 폴리뉴클레오티드는, 발현될 때, 그 폴리펩티드(또는 단백질)를 생성하기 위해 전사 및 번역될 것이다. 본 명세서에 사용되는 바와 같이, "과발현"이라는 용어는 동일한 조건들 하에서 대응하는 야생형 세포에서 정상적으로 발현되는 것보다 더 높은 농도로 세포에서 폴리뉴클레오티드 또는 폴리펩티드를 발현시키거나 발현되게 하는 것을 의미한다.
본 명세서에서 사용되는 바와 같이, "역가"라는 용어는 숙주 세포 배양의 단위 부피당 생성된 지방산 유도체의 양(quantity)을 지칭한다. 본 명세서에 설명된 조성물들 및 방법들의 여하한의 실시형태에서, 지방산 유도체는 약 25 mg/L, 약 50 mg/L, 약 75 mg/L, 약 100 mg/L, 약 125 mg/L, 약 150 mg/L, 약 175 mg/L, 약 200 mg/L, 약 225 mg/L, 약 250 mg/L, 약 275 mg/L, 약 300 mg/L, 약 325 mg/L, 약 350 mg/L, 약 375 mg/L, 약 400 mg/L, 약 425 mg/L, 약 450 mg/L, 약 475 mg/L, 약 500 mg/L, 약 525 mg/L, 약 550 mg/L, 약 575 mg/L, 약 600 mg/L, 약 625 mg/L, 약 650 mg/L, 약 675 mg/L, 약 700 mg/L, 약 725 mg/L, 약 750 mg/L, 약 775 mg/L, 약 800 mg/L, 약 825 mg/L, 약 850 mg/L, 약 875 mg/L, 약 900 mg/L, 약 925 mg/L, 약 950 mg/L, 약 975 mg/L, 약 1000 mg/L, 약 1050 mg/L, 약 1075 mg/L, 약 1100 mg/L, 약 1125 mg/L, 약 1150 mg/L, 약 1175 mg/L, 약 1200 mg/L, 약 1225 mg/L, 약 1250 mg/L, 약 1275 mg/L, 약 1300 mg/L, 약 1325 mg/L, 약 1350 mg/L, 약 1375 mg/L, 약 1400 mg/L, 약 1425 mg/L, 약 1450 mg/L, 약 1475 mg/L, 약 1500 mg/L, 약 1525 mg/L, 약 1550 mg/L, 약 1575 mg/L, 약 1600 mg/L, 약 1625 mg/L, 약 1650 mg/L, 약 1675 mg/L, 약 1700 mg/L, 약 1725 mg/L, 약 1750 mg/L, 약 1775 mg/L, 약 1800 mg/L, 약 1825 mg/L, 약 1850 mg/L, 약 1875 mg/L, 약 1900 mg/L, 약 1925 mg/L, 약 1950 mg/L, 약 1975 mg/L, 약 2000 mg/L(2 g/L), 3 g/L, 5 g/L, 1O g/L, 20 g/L, 30 g/L, 40 g/L, 50 g/L, 60 g/L, 70 g/L, 80 g/L, 90 g/L, 1OO g/L 또는 상기 값들 중 어느 두 개의 값들에 의해 한정되는 범위의 역가로 생성된다. 다른 실시예들에서, 지방산 유도체는 1OO g/L 초과, 200 g/L 초과 또는 300 g/L 초과의 역가로 생성된다. 본 발명의 방법들에 따라 재조합 숙주 세포에 의해 생성되는 지방산 유도체의 바람직한 역가는 5 g/L 내지 200g/L, 1O g/L 내지 150 g/L, 20 g/L 내지 120 g/L, 및 30 g/L 내지 1OO g/L이다. 역가는 주어진 재조합 숙주 세포 배양에 의해 생성되는 특정 지방산 유도체 또는 지방산 유도체들의 조합물을 지칭할 수 있다. 예를 들어, 대장균과 같은 재조합 숙주 세포에서의 에스테르 신타아제 활성을 갖는 변이 폴리펩티드의 발현은 대응하는 야생형 폴리펩티드를 발현시키는 재조합 숙주 세포에 비해 더 높은 역가의 생성을 유도한다. 일 실시예에서, 더 높은 역가는 적어도 약 5 g/L에서 약 200 g/L의 범위를 갖는다.
본 명세서에서 사용되는 바와 같이, "숙주 세포에 의해 생성되는 지방산 유도체의 수율"은 투입된 탄소원이 숙주 세포의 생성물(즉, 지방족 에스테르)로 전환되는 효율을 지칭한다. 본 발명의 방법들에 따라 지방산 유도체들을 생성하도록 조작된 숙주 세포는 적어도 약 3 %, 적어도 약 4 %, 적어도 약 5 %, 적어도 약 6 %, 적어도 약 7 %, 적어도 약 8 %, 적어도 약 9 %, 적어도 약 10 %, 적어도 약 11 %, 적어도 약 12 %, 적어도 약 13 %, 적어도 약 14 %, 적어도 약 15 %, 적어도 약 16 %, 적어도 약 17 %, 적어도 약 18 %, 적어도 약 19 %, 적어도 약 20 %, 적어도 약 21 %, 적어도 약 22 %, 적어도 약 23 %, 적어도 약 24 %, 적어도 약 25 %, 적어도 약 26 %, 적어도 약 27 %, 적어도 약 28 %, 적어도 약 29 % 또는 적어도 약 30 %, 또는 상기 값들 중 어느 두 개의 값들에 한정되는 한정되는 범위의 수율을 갖는다. 다른 실시예들에서, 지방산 유도체 또는 유도체들은 약 30 %, 약 40 %, 약 50 %, 약 60 %, 약 70 %, 약 80 %, 약 90 % 또는 그 이상을 초과하는 수율로 생성된다. 대안적으로 또는 추가적으로, 수율은 약 30 % 이하, 약 27 % 이하, 약 25 % 이하 또는 약 22 % 이하이다. 따라서, 수율은 상기 종단점들 중 어느 두 개의 값들에 의해 한정될 수 있다. 예를 들어, 본 발명의 방법들에 따라 재조합 숙주 세포에 의해 생성되는 지방산 유도체 또는 유도체들의 수율은 약 5 % 내지 약 15 %, 약 10 % 내지 약 25 %, 약 10 % 내지 약 22 %, 약 15 % 내지 약 27 %, 약 18 % 내지 약 22 %, 약 20 % 내지 약 28 %, 또는 약 20 % 내지 약 30 %일 수 있다. 수율은 주어진 재조합 숙주 세포 배양에 의해 생성되는 특정 지방산 유도체 또는 지방산 유도체들의 조합물로 지칭할 수 있다. 예를 들어, 대장균과 같은 재조합 숙주 세포에서의 에스테르 신타아제 활성을 갖는 변이 폴리펩티드의 발현은 대응하는 야생형 폴리펩티드를 발현시키는 재조합 숙주 세포에 비해 더 높은 수율의 지방산 에스테르의 생성을 유도한다. 일 실시예에서, 더 높은 수율은 이론적인 수율의 약 10 %에서 약 100 %의 범위를 갖는다.
본 명세서에서 사용되는 바와 같이, "생산성"이라는 용어는 단위 시간당 숙주 세포 배양의 단위 부피당 생성된 지방산 유도체 또는 유도체들의 양을 칭한다. 본 발명에 설명된 조성물들 및 방법들의 여하한의 실시형태에서, 재조합 숙주 세포에 의해 생성된 지방산 유도체 또는 유도체들의 생산성은 100 mg/L/hour, 적어도 200 mg/L/hour, 적어도 300 mg/L/hour, 적어도 400 mg/L/hour, 적어도 500 mg/L/hour, 적어도 600 mg/L/hour, 적어도 700 mg/L/hour, 적어도 800 mg/L/hour, 적어도 900 mg/L/hour, 적어도 1000 mg/L/hour, 적어도 1100 mg/L/hour, 적어도 1200 mg/L/hour, 적어도 1300 mg/L/hour, 적어도 1400 mg/L/hour, 적어도 1500 mg/L/hour, 적어도 1600 mg/L/hour, 적어도 1700 mg/L/hour, 적어도 1800 mg/L/hour, 적어도 1900 mg/L/hour, 적어도 2000 mg/L/hour, 적어도 2100 mg/L/hour, 적어도 2200 mg/L/hour, 적어도 2300 mg/L/hour, 적어도 2400 mg/L/hour, 적어도 2500 mg/L/hour이거나, (세포 질량에 따라) 10 g/L/hour만큼 높다. 예를 들어, 본 발명의 방법들에 따라 재조합 숙주 세포에 의해 생성된 지방산 유도체 또는 유도체들의 생산성은 500 mg/L/hour 내지 2500 mg/L/hour, 또는 700 mg/L/hour 내지 2000 mg/L/hour일 수 있다. 생산성은 주어진 재조합 숙주 세포 배양에 의해 생성되는 특정 지방산 유도체 또는 지방산 유도체들의 조합물을 지칭할 수 있다. 예를 들어, 대장균과 같은 재조합 숙주 세포에서의 에스테르 신타아제 활성을 갖는 변이 폴리펩티드의 발현은 대응하는 야생형 폴리펩티드를 발현시키는 재조합 숙주 세포에 비해 지방산 에스테르의 증가된 생산성의 생성을 유도한다. 일 실시예에서, 더 높은 생산성은 약 0.3 g/L/h에서 약 3 g/L/h의 범위를 갖는다.
본 명세서에서 사용되는 바와 같이, "총 지방 종" 및 "총 지방산 생성물"이라는 용어는 GC-FID에 의해 평가되는 바와 같이 지방족 에스테르 및 지방산의 양과 관련하여 본 명세서에서 교환가능하게 사용될 수 있다. 동일한 용어는 지방족 알코올 분석과 관련 있는 경우에 지방족 알코올, 지방족 알데히드 및 유리 지방산을 의미하는 것으로 사용될 수 있다.
본 명세서에서 사용되는 바와 같이, "글루코오스 이용률"이라는 용어는 그램/리터/시간(g/L/hr)으로 기록되는 단위 시간당 배양에 사용되는 글루코오스의 양을 의미한다.
본 명세서에서 사용되는 바와 같이, "야생형 폴리펩티드에 비해 더 큰 에스테르 신타아제 활성"이라는 용어는 대응하는 야생형 효소보다 더 높은 역가, 더 높은 수율 및/또는 더 높은 생산성을 갖는 에스테르 신타아제 활성을 갖는 티오에스테라아제 또는 에스테르 신타아제와 관련하여 사용된다. 바람직한 실시예에서, 역가, 수율 또는 생산성은 야생형 폴리펩티드의 적어도 두 배이다. 다른 바람직한 실시예에서, 역가, 수율 또는 생산성은 야생형 폴리펩티드의 적어도 3 배, 4 배, 5 배, 6 배, 7 배, 8 배, 9 배 또는 10 배이다. 특정 실시예에서, 역가는 적어도 약 5 % 이상이다. 또한, 몇몇 경우에서, "야생형 폴리펩티드에 비해 더 큰 에스테르 신타아제 활성"은, 대응하는 야생형 에스테르 신타아제 효소보다 더 높은 역가, 수율 및/또는 생산성 이외에도, 에스테르 신타아제가 낮은 또는 더 낮은 비율(예를 들어, 1 내지 5 %)의 베타 하이드록시 에스테르를 생성함을 의미한다(아래의 예시들을 참조). 또한, 다른 경우에서, "야생형 폴리펩티드에 비해 더 큰 에스테르 신타아제 활성"은, 대응하는 야생형 에스테르 신타아제 효소보다 더 높은 역가, 수율 및/또는 생산성 이외에도, 에스테르 신타아제가 더 높은 비율의 베타 하이드록시 에스테르를 생성함을 의미한다(아래의 예시들을 참조).
"개선된 지방산 메틸 에스테르 활성"이라는 용어는 변이 폴리펩티드 또는 효소가 지방산 메틸 에스테르, 지방산 에틸 에스테르, 지방산 프로필 에스테르, 지방산 이소프로필 에스테르, 지방산 부틸 에스테르, 모노글리세라이드, 지방산 이소부틸 에스테르, 지방산 2-부틸 에스테르 및 지방산 3차-부틸 에스테르 등을 생성할 수 있음을 의미한다. 개선된 지방산 메틸 에스테르 활성을 갖는 변이 폴리펩티드 또는 효소는, 증가된 베타 하이드록시 에스테르, 감소된 베타 하이드록실 에스테르, 지방산 에스테르의 증가된 사슬 길이 및 지방산 에스테르의 감소된 사슬 길이를 포함하는(이로 제한되지 않음) 개선된 특성들을 갖는다. 개선된 지방산 메틸 에스테르 활성을 갖는 변이 에스테르 신타아제 폴리펩티드는, 변이 폴리펩티드가 재조합 미생물로 발현될 때 적어도 약 5 % 이상인 역가를 생성한다.
본 명세서에서 사용되는 바와 같이, "탄소원"이라는 용어는 원핵 또는 단순한 진핵 세포 성장을 위한 탄소원으로서 사용되는데 적합한 기질 또는 화합물을 지칭한다. 탄소원은 중합체, 탄수화물, 산, 알코올, 알데히드, 케톤, 아미노산, 펩티드 및 기체(예를 들어, CO 및 CO2)를 포함하는(이로 제한되지 않음) 다양한 형태로 존재할 수 있다. 예시적인 탄소원은 글루코오스, 프럭토오스, 만노오스, 갈락토오스, 자일로오스 및 아라비노오스와 같은 단당류; 프럭토-올리고당 및 갈락토-올리고당과 같은 올리고당류; 녹말, 셀룰로오스, 펙틴 및 자일란과 같은 다당류; 수크로오스, 말토오스, 셀로비오스 및 투라노오스(turanose)와 같은 이당류; 헤미셀룰로오스(hemicellulose), 메틸 셀룰로오스 및 소듐 카르복시메틸 셀룰로오스와 같은 셀룰로오스 물질 및 변이체들; 숙시네이트, 락테이트 및 아세테이트와 같은 포화 또는 불포화 지방산류; 에탄올, 메탄올 및 글리세롤과 같은 알코올류, 또는 이의 혼합물들을 포함한다(이로 제한되지 않음). 또한, 탄소원은 글루코오스와 같은 광합성의 산물일 수 있다. 바람직한 특정 실시예들에서, 탄소원은 바이오매스(biomass)이다. 다른 바람직한 실시예들에서, 탄소원은 글루코오스이다. 다른 바람직한 실시예에서, 탄소원은 수크로오스이다. 다른 바람직한 실시예들에서, 탄소원은 글리세롤이다.
본 명세서에서 사용되는 바와 같이, "바이오매스"라는 용어는 탄소원이 도출되는 여하한의 생물학적 물질을 지칭한다. 몇몇 실시예들에서, 바이오매스는 탄소원으로 처리되며, 이는 생물전환에 적합하다. 다른 실시예들에서, 바이오매스는 탄소원으로의 추가적인 처리를 요구하지 않는다. 탄소원은 지방족 에스테르를 포함하는 조성물로 전환될 수 있다. 지방족 에스테르는 계면활성제, 중합체, 필름, 직물, 염료, 의약품, 방향제 및 착향료, 래커, 페인트, 바니쉬, 수지 및 플라스틱의 연화제, 가소제, 난연제, 및 가솔린 및 오일의 첨가제를 포함하는(이로 제한되지 않음) 다수의 생성물에서 유용성을 찾을 수 있다.
예시적인 바이오매스의 공급원(source)은 옥수수, 사탕수수 또는 스위치그래스(switchgrass)와 같은 식물성 물질 또는 식물(vegetation)이다. 또 다른 예시적인 바이오매스의 공급원은 동물성 물질[예를 들어, 우분(cow manure)]과 같은 신진대사 노폐물(metabolic waste products)이다. 또 다른 예시적인 바이오매스의 공급원은 조류 및 여타의 해양 식물을 포함한다. 또한, 바이오매스는 글리세롤, 발효 찌꺼기, 목초, 짚, 목재, 오수, 쓰레기, 셀룰로오스성 도시 폐기물 및 음식 쓰레기(예를 들어, 비누, 오일 및 지방산)를 포함하는(이로 제한되지 않음) 산업, 농업, 임업 및 가정으로부터의 폐기물을 포함한다. 또한, "바이오매스"라는 용어는 탄수화물(예를 들어, 단당류, 이당류 또는 다당류)과 같은 탄소원을 지칭할 수 있다.
본 명세서에서 사용되는 바와 같이, (지방산 및 이의 유도체와 같은) 생성물들에 대하여 "격리된(isolated)"이라는 용어는 세포 성분, 세포 배양 배지, 또는 화학적 또는 합성 전구체로부터 분리된(separated) 생성물들을 지칭한다. 본 명세서에 설명된 방법들에 의해 생성되는 지방산 및 이의 유도체는 세포질뿐만 아니라 발효액에서 비교적 혼합되지 않을 수 있다. 그러므로, 지방산 및 이의 유도체는 세포내 또는 세포외에서 유기 상(organic phase)으로 수집될 수 있다.
본 명세서에서 사용되는 바와 같이, "정제한다", "정제된" 또는 "정제"라는 용어는, 예를 들어 격리 또는 분리에 의해 그 환경으로부터 분자의 제거 또는 분리를 의미한다. "실질적으로 정제된" 분자는 연계된 다른 성분들로부터 적어도 약 60 % 유리(예를 들어, 적어도 약 70 % 유리, 적어도 약 75 % 유리, 적어도 약 85 % 유리, 적어도 약 90 % 유리, 적어도 약 95 % 유리, 적어도 약 97 % 유리, 적어도 약 99 % 유리)된다. 본 명세서에서 사용되는 바와 같이, 또한 이러한 용어는 샘플로부터 오염물의 제거를 지칭한다. 예를 들어, 오염물의 제거는 샘플에서의 지방산 유도체의 비율의 증가를 유도할 수 있다. 예를 들어, 지방산 유도체가 재조합 숙주 세포에서 생성될 때, 지방산 유도체는 숙주 세포 단백질의 제거에 의해 정제될 수 있다. 정제 후, 샘플에서의 지방산 유도체의 비율이 증가된다. "정제한다", "정제된" 및 "정제"라는 용어는 절대 순도를 필요로 하지 않는 상대적인 용어이다. 따라서, 예를 들어 지방산 유도체가 재조합 숙주 세포에 생성될 때, 정제된 지방산 유도체는 다른 세포 성분(예를 들어, 핵산, 폴리펩티드, 지질, 탄수화물 또는 기타 탄화수소)로부터 실질적으로 분리되는 지방산 유도체이다. 본 명세서에 사용되는 바와 같이, "감쇠"라는 용어는 약화, 감소 또는 줄어듦을 의미한다. 예를 들어, 폴리펩티드는 활성을 감소시키기 위해 폴리펩티드를 변형시킴으로써(예를 들어, 폴리펩티드를 인코딩하는 뉴클레오티드 서열을 변형시킴으로써) 감쇠될 수 있다.
에스테르 신타아제 변이체
본 발명은, 특히 변이 에스테르 신타아제 효소, 개선된 특성을 갖는 이러한 변이체의 폴리펩티드 서열 및 이의 기능성 분절; 변이 에스테르 신타아제 폴리펩티드 서열을 인코딩하는 폴리뉴클레오티드; 개선된 에스테르 신타아제 폴리펩티드를 인코딩하는 핵산을 포함하는 재조합 미생물; 개선된 에스테르 신타아제 폴리펩티드를 발현시킬 수 있는 미생물; 이러한 미생물의 배양물; 지방산 에스테르를 생성하기 위한 프로세스들(processes); 개선된 에스테르 신타아제 폴리펩티드를 이용하여 이로부터 도출된 지방산 에스테르 조성물 및 다른 조성물; 및 결과적인 조성물에 관한 것이다.
특히, 개선된 특성을 갖는 에스테르 신타아제 폴리펩티드 및 이러한 폴리펩티드를 발현시키는 미생물이 본 명세서에 제공된다. 마리노박터 하이드로카보노클라스티쿠스 균주 DSM8798로부터의 야생형 에스테르 신타아제 폴리펩티드는 Holtzapple 외(참조: J Bacteriol. (2007) 189(10):3804-3812) 및 미국 특허 7,897,369에 개시되었다. SEQ ID NO: 2는 야생형 에스테르 신타아제의 아미노산 서열, 즉 마리노박터 하이드로카보노클라스티쿠스(M. 하이드로카보노클라스티쿠스; GenBank 수탁 번호 ABO21021)로부터의 ES9/DSM8798이며, 이는 본 발명을 예시하기 위해 개선된 에스테르 신타아제 효소를 생성하는 템플릿으로서 사용되었다(아래의 예시들을 참조). 바람직한 에스테르 신타아제 변이체는 SEQ ID NO: 2의 야생형 M. 하이드로카보노클라스티쿠스 에스테르 신타아제 효소(본 명세서에서, "WS377" 또는 "'377"이라고도 함)의 아미노산 서열에 대해 적어도 90 %의 서열 동일성을 갖는다. 또한, SEQ ID NO: 1은 SEQ ID NO: 2를 인코딩하는 폴리뉴클레오티드 서열이다. 본 명세서에 설명되는 에스테르 신타아제 폴리펩티드 서열에 대하여, "M"(ATG)은 아미노산 "0"으로 고려된다. ATG 다음의 제 1 아미노산은 아미노산 "1"로 지정된다.
일 실시형태에서, 본 발명은 향상된 에스테르 신타아제 활성을 갖는 개선된 에스테르 신타아제 폴리펩티드 및 이를 인코딩하는 뉴클레오티드 서열을 제공한다. 또 다른 실시형태에서는, SEQ ID NO: 2의 야생형 '377 폴리펩티드 내의 다수의 상이한 아미노산 위치들에 도입된 치환체(본 명세서에서, "잔기"라고도 함)가 야생형 '377에 대해 지방족 에스테르의 증가된 생성을 촉진시킬 수 있는 개선된 '377 폴리펩티드를 산출함을 알 수 있다. 돌연변이된 위치에 따라, 특정 위치에서의 단일 아미노산 변화는 지방족 에스테르 생성의 증가 또는 감소를 가져온다. 또한, 특정 위치에서의 단일 아미노산 변화는 베타 하이드록시(β-OH) 에스테르 생성의 증가 또는 감소를 가져올 수 있다. 일 실시예에서, 단일 아미노산 변화는 지방족 에스테르 생성의 증가를 유도하고, β-OH 에스테르 생성의 감소를 유도한다. 또 다른 실시예에서, 단일 아미노산 변화는 지방족 에스테르 생성의 증가를 유도하며, β-OH 에스테르 생성의 변화를 유도하지 않는다. 또 다른 실시예에서, 단일 아미노산 변화는 지방족 에스테르 생성의 증가를 유도하고, β-OH 에스테르 생성의 증가를 유도한다. 또한, 단일 아미노산 변화는 지방족 에스테르 생성의 감소를 유도할 수 있으며, β-OH 에스테르 생성의 증가, 감소, 또는 무-변화를 유도할 수 있다. 다른 실시예들에서, 단일 또는 다중 아미노산 변화는 지방족 에스테르 생성의 증가를 유도한다. 또 다른 실시예들에서, 단일 또는 다중 아미노산 변화는 β-OH 생성의 증가 또는 감소를 유도한다.
따라서, 특정 위치에서의 2 이상의 아미노산 변화의 조합은 지방족 에스테르 및/또는 유리 지방산 생성의 증가 또는 감소를 가져올 수 있다. 지방족 에스테르 및 유리 지방산 생성의 각각의 개별적인 아미노산 변화의 효과는 지방족 에스테르 및 유리 지방산 생성의 다른 개별적인 아미노산 변화의 효과에 추가될 수 있거나 추가되지 않을 수 있다. 몇몇 바람직한 실시예들에서, 특정 위치에서의 2 이상의 아미노산 변화의 조합은 지방족 에스테르 생성의 증가 및 유리 지방산 생성의 감소를 유도한다. 따라서, 특정 위치에서의 다중 아미노산 변화는 지방족 에스테르 생성의 증가 또는 감소를 가져온다. 이와 같이, 특정 위치에서의 다중 아미노산 변화는 β-OH 에스테르 생성의 감소를 가져올 수도 있다. 몇몇 실시예들에서, 다중 아미노산 변화는 지방족 에스테르 생성의 증가 및 β-OH 에스테르 생성의 감소를 유도한다. 다른 실시예들에서, 다중 아미노산 변화는 지방족 에스테르 생성의 증가를 유도하며, β-OH 에스테르 생성의 변화를 유도하지 않는다. 또 다른 실시예들에서, 다중 아미노산 변화는 지방족 에스테르 생성의 증가를 유도하고, β-OH 에스테르 생성의 증가를 유도한다. 또한, 다중 아미노산 변화는 지방족 에스테르 생성의 감소를 유도할 수 있으며, β-OH 에스테르 생성의 증가, 감소 또는 무-변화를 유도할 수 있다.
(아래의) 예시 1에 설명된 바와 같이 템플릿으로서 WS377 에스테르 신타아제를 이용하여 전체 포화 라이브러리(full saturation library)가 준비되었다(prepared). 생성된 베타 하이드록시 에스테르의 비율의 감소 및/또는 지방족 에스테르의 증가된 역가에 기초하여, 200 개가 넘는 유익한 돌연변이체가 식별되었다. 조합 라이브러리는 예시 2 및 예시 5에 자세히 설명되는 바와 같이 포화 라이브러리로부터의 "히트(hits)"에 기초하여 준비되었다. 일 실시형태에서, 본 발명은 SEQ ID NO: 2에 대해 적어도 약 70 % 서열 동일성을 갖는 개선된 에스테르 신타아제 폴리펩티드에 관한 것이다. 몇몇 실시예들에서, 개선된 에스테르 신타아제 폴리펩티드는 SEQ ID NO: 2의 야생형 '377 서열에 대해 적어도 약 75 %(예를 들어, 적어도 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % 또는 적어도 99 %)의 서열 동일성을 나타내며, 또한 본 명세서에 설명된 바와 같은 유용한 특징들 및/또는 특성들을 유도하는 1 이상의 치환체를 포함한다. 본 발명의 일 실시형태에서, 개선된 에스테르 신타아제 폴리펩티드는 SEQ ID NO: 4에 대해 약 100 %의 서열 동일성을 갖는다. 본 발명의 또 다른 실시형태에서, 개선된 에스테르 신타아제 폴리펩티드는 다음의 SEQ ID NOS[SEQ ID NO: 6, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 29, SEQ ID NO: 33, SEQ ID NO: 35, SEQ ID NO: 37, SEQ ID NO: 39, SEQ ID NO: 41 및 SEQ ID NO: 43을 포함함(이로 제한되지 않음)] 중 어느 하나에 대해 약 100 %의 서열 동일성을 갖는다.
관련 실시형태에서, 개선된 에스테르 신타아제 폴리펩티드는 SEQ ID NO: 3 또는 SEQ ID NO: 7에 대해 100 %의 서열 동일성을 갖는 뉴클레오티드 서열에 의해 인코딩된다. 또 다른 관련 실시형태에서, 개선된 에스테르 신타아제 폴리펩티드는 다음의 SEQ ID NOS[SEQ ID NO: 5, SEQ ID NO: 9, SEQ ID NO: 11 , SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 28, SEQ ID NO: 32, SEQ ID NO: 34, SEQ ID NO: 36, SEQ ID NO: 38, SEQ ID NO: 40 및 SEQ ID NO: 42를 포함함(이로 제한되지 않음)] 중 어느 하나에 대해 약 100 %의 서열 동일성을 갖는 뉴클레오티드 서열에 의해 인코딩된다.
또 다른 실시형태에서, 본 발명은 SEQ ID NO: 4에 대해 적어도 약 70 %의 서열 동일성을 갖는 개선된 에스테르 신타아제 폴리펩티드에 관한 것이다. 몇몇 실시예들에서, 개선된 에스테르 신타아제 폴리펩티드는 SEQ ID NO: 4의 에스테르 신타아제 서열에 대해 적어도 약 75 %(예를 들어, 적어도 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % 또는 적어도 99 %)의 서열 동일성을 가지며, 또한 본 명세서에 설명된 바와 같은 개선된 특징들 및/또는 특성들을 유도하는 1 이상의 치환체를 포함한다. 또 다른 실시형태에서, 본 발명은 다음의 SEQ ID NOS[SEQ ID NO: 6, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 29, SEQ ID NO: 33, SEQ ID NO: 35, SEQ ID NO: 37, SEQ ID NO: 39, SEQ ID NO: 41 및 SEQ ID NO: 43을 포함함(이로 제한되지 않음)] 중 어느 하나에 대해 적어도 약 70 %의 서열 동일성을 갖는 개선된 에스테르 신타아제 폴리펩티드에 관한 것이다. 몇몇 실시예들에서, 개선된 에스테르 신타아제 폴리펩티드는 다음의 SEQ ID NOS[SEQ ID NO: 6, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 29, SEQ ID NO: 33, SEQ ID NO: 35, SEQ ID NO: 37, SEQ ID NO: 39, SEQ ID NO: 41 및 SEQ ID NO: 43을 포함함(이로 제한되지 않음)] 중 어느 하나의 에스테르 신타아제 서열에 대해 적어도 약 75 %(예를 들어, 적어도 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % 또는 적어도 99 %)의 서열 동일성을 가지며, 또한 본 명세서에 설명된 바와 같은 개선된 특징들 및/또는 특성들을 유도하는 1 이상의 치환체를 포함한다.
또 다른 실시형태에서, 본 발명은 SEQ ID NO: 5의 에스테르 신타아제 서열에 대해 적어도 약 75 %(예를 들어, 적어도 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % 또는 적어도 99 %)의 서열 동일성을 갖는 핵산 서열에 의해 인코딩되는 아미노산 서열을 포함하는 개선된 에스테르 신타아제 폴리펩티드에 관한 것이다. 몇몇 실시예들에서, 핵산 서열은 본 명세서에 설명된 바와 같은 개선된 특징들 및/또는 특성들을 유도하는 1 이상의 치환체를 갖는 에스테르 신타아제 변이체를 인코딩한다. 다른 실시예들에서, 개선된 또는 변이 에스테르 신타아제 핵산 서열은 마리노박터 하이드로카보노클라스티쿠스 이외의 종으로부터 도출된다. 또 다른 실시형태에서, 본 발명은 다음의 SEQ ID NOS[SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 28, SEQ ID NO: 32, SEQ ID NO: 34, SEQ ID NO: 36, SEQ ID NO: 38, SEQ ID NO: 40 및 SEQ ID NO: 42를 포함함(이로 제한되지 않음)] 중 어느 하나의 에스테르 신타아제 서열에 대해 적어도 약 75 %(예를 들어, 적어도 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % 또는 적어도 99 %)의 서열 동일성을 갖는 핵산 서열에 의해 인코딩되는 아미노산 서열을 포함하는 개선된 에스테르 신타아제 폴리펩티드에 관한 것이다. 몇몇 실시형태에서, 핵산 서열은 본 명세서에 설명된 바와 같은 개선된 특징들 및/또는 특성들을 유도하는 1 이상의 치환체를 갖는 에스테르 신타아제 변이체를 인코딩한다. 다른 실시예들에서, 개선된 또는 변이 에스테르 신타아제 핵산 서열은 마리노박터 하이드로카보노클라스티쿠스 이외의 종으로부터 도출된다.
또 다른 실시형태에서, 본 발명은 다음의 SEQ ID NOS[SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 28, SEQ ID NO: 32, SEQ ID NO: 34, SEQ ID NO: 36, SEQ ID NO: 38, SEQ ID NO: 40 및 SEQ ID NO: 42를 포함함(이로 제한되지 않음)] 중 어느 하나에 대응하는 핵산의 실질적인 전체 길이에 대하여 엄격한 조건들 하에서 혼성화되는 핵산에 의해 인코딩되는 아미노산 서열을 포함하는 에스테르 신타아제 폴리펩티드에 관한 것이다. 몇몇 실시예들에서, 핵산 서열은 마리노박터 하이드로카보노클라스티쿠스 이외의 종으로부터 도출되는 개선된 또는 변이 에스테르 신타아제 핵산 서열을 인코딩한다. 관련 실시형태에서, 본 발명은 SEQ ID NO: 1에 대해 적어도 약 70 %(예를 들어, 적어도 71 %, 72 %, 73 %, 74 %, 75 %, 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % 또는 적어도 99 %)의 서열 동일성을 갖는 뉴클레오티드 서열에 의해 인코딩되는 에스테르 신타아제를 제공하며, 본 명세서에 개시된 치환체들 중 1 이상을 포함한다.
에스테르 신타아제 변이체의 개선된 특성
마리노박터 하이드로카보노클라스티쿠스 DSM 8798("'377")로부터의 야생형 에스테르 신타아제는 예시된 모델로서 대장균에서의 발현을 이용하여 여타의 유전자를 과발현시킬 필요 없이 높은 비율의 지방족 에스테르를 생성하도록 조작되었다. 또한, 대장균과 같은 재조합 숙주 세포에서 발현될 때, 더 높은 역가, 수율 또는 생산성을 유도하는 야생형 에스테르 신타아제 효소의 변이체는 약 20 %, 25 %, 30 %, 35 %, 40 %, 45 %, 50 % 이상의 β-OH 에스테르를 생성한다. 일 실시형태에서, 본 발명은 야생형 에스테르 신타아제보다 더 높은 역가, 수율 또는 생산성을 갖는 에스테르 신타아제의 개선된 변이체를 제공하며, 또한 야생형 효소보다 더 낮은 비율의 β-OH 에스테르를 생성한다. 바람직한 실시예에서, 본 발명의 변이 에스테르 신타아제 효소는 약 20 %, 18 %, 16 %, 14 %, 12 %, 10 %, 9 %, 8 %, 7 %, 6 %, 5 %, 4 %, 3 %, 2 % 미만 또는 1 % 미만의 β-OH 에스테르를 생성한다. 이와 같이, 본 발명의 에스테르 신타아제 변이체는 본 명세서에 설명된 바와 같은 개선된 특징들 및/또는 특성들, 예를 들어 지방산 에스테르의 역가, 수율 및/또는 생산성의 증가; 및/또는 베타 하이드록실 에스테르의 역가, 수율 또는 생산성의 감소를 나타낸다. 따라서, 더 높은 역가, 수율 및/또는 생산성을 갖도록 에스테르 신타아제의 조작은, 대장균이 무익 회로(도 2 참조)의 리소스(resources)를 이용하는 것을 본질적으로 방지하는 한편, 예를 들어 계면활성제의 제조에 또는 바이오디젤로서 사용하기 위해 높은 수준의 지방산 에스테르의 생성을 허용한다.
포토박테리움 프로푼둠
변이체
본 발명은, 특히 증가된 에스테르 신타아제 활성을 갖는 변이 티오에스테라아제 효소; 개선된 특성을 갖는 이러한 변이체 및 이의 분절의 폴리펩티드 서열; 증가된 에스테르 신타아제 활성을 갖는 변이 티오에스테라아제 폴리펩티드 서열을 인코딩하는 폴리뉴클레오티드; 증가된 에스테르 신타아제 활성을 갖는 개선된 티오에스테라아제 폴리펩티드를 인코딩하는 핵산을 포함하는 재조합 미생물; 증가된 에스테르 신타아제 활성을 갖는 개선된 티오에스테라아제 폴리펩티드 서열을 발현시킬 수 있는 미생물; 이러한 미생물의 배양물; 지방산 에스테르를 생성하기 위한 프로세스들; 증가된 에스테르 신타아제 활성을 갖는 개선된 티오에스테라아제 폴리펩티드 서열을 이용하여 이로부터 도출된 지방산 에스테르 조성물 및 다른 조성물; 및 결과적인 조성물에 관한 것이다.
특히, 증가된 에스테르 신타아제 활성과 같은 개선된 특성을 갖는 티오에스테라아제 폴리펩티드 및 이러한 폴리펩티드를 발현시키는 미생물이 본 명세서에 제공된다. 야생형 포토박테리움 프로푼둠(Ppro) 폴리펩티드는 Vezzi 외(참조: Science (2005) 307: 1459-1461)에 개시되었다. SEQ ID NO: 51은 포토박테리움 프로푼둠으로부터의 티오에스테라아제에 대한 야생형 아미노산 서열이다. SEQ ID NO: 50은 SEQ ID NO: 51을 인코딩하는 폴리뉴클레오티드 서열이다. 주변세포질 내로 티오에스테라아제를 타겟으로 한(targets) 선도 서열은 SEQ ID NO: 50으로부터 제거되었다. 개선된 티오에스테라아제 폴리펩티드, 예를 들어 변이 Ppro 폴리펩티드는 향상된 에스테르 신타아제 활성을 갖는다. 본 명세서에 설명된 Ppro 폴리펩티드 서열에 대하여, "M"(ATG)은 아미노산 "0"으로 고려된다. ATG 다음의 제 1 아미노산은 아미노산 "1"로 지정된다.
일 실시형태에서, 본 발명은 향상된 에스테르 신타아제 활성을 갖는 개선된 Ppro 폴리펩티드 및 이를 인코딩하는 뉴클레오티드 서열을 제공한다. 개선된 Ppro 폴리펩티드는 증가된 또는 향상된 에스테르 신타아제 활성을 갖는 변이 티오에스테라아제 폴리펩티드의 예시이다. 또 다른 실시형태에서, SEQ ID NO: 51의 야생형 Ppro 내의 다수의 상이한 아미노산 위치들에 도입된 치환체(본 명세서에서, "잔기"라고도 함)가 야생형 Ppro 에 대해 지방족 에스테르의 증가된 생성을 촉진시킬 수 있는 개선된 Ppro 폴리펩티드를 산출함을 알 수 있다. 돌연변이된 위치에 따라, 특정 위치에서의 단일 아미노산 변화는 지방족 에스테르 생성의 증가 또는 감소를 가져온다. 또한, 특정 위치에서의 단일 아미노산 변화는 유리 지방산 생성의 증가 또는 감소를 가져올 수 있다. 몇몇 바람직한 실시예에서, 단일 아미노산 변화는 지방족 에스테르 생성의 증가를 유도하고, 유리 지방산 생성의 감소를 유도한다. 다른 실시예에서, 단일 아미노산 변화는 지방족 에스테르 생성의 증가를 유도하며, 유리 지방산 생성의 변화를 유도하지 않는다. 또 다른 실시예에서, 단일 아미노산 변화는 지방족 에스테르 생성의 증가를 유도하고, 유리 지방산 생성의 증가를 유도한다. 또한, 단일 아미노산 변화는 지방족 에스테르 생성의 감소를 유도할 수 있으며, 유리 지방산 생성의 증가, 감소, 또는 무-변화를 유도할 수 있다. 또한, 특정 위치에서의 2 이상의 아미노산 변화의 조합은 지방족 에스테르 및/또는 유리 지방산 생성의 증가 또는 감소를 가져올 수 있다. 지방족 에스테르 및 유리 지방산 생성의 각각의 개별적인 아미노산 변화의 효과는 지방족 에스테르 및 유리 지방산 생성의 다른 개별적인 아미노산 변화의 효과에 추가될 수 있거나 추가되지 않을 수 있다. 몇몇 바람직한 실시예들에서, 특정 위치에서의 2 이상의 아미노산 변화의 조합은 지방족 에스테르 생성의 증가 및 유리 지방산 생성의 감소를 유도한다.
일 실시형태에서, 본 명세서는 SEQ ID NO: 51과 적어도 약 70 %의 서열 동일성을 갖는 Ppro 폴리펩티드에 관한 것이다. 몇몇 실시예들에서, Ppro 폴리펩티드는 SEQ ID NO: 51의 야생형 Ppro 서열에 대해 적어도 약 75 %(예를 들어, 적어도 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % 또는 적어도 99 %)의 서열 동일성을 나타내며, 또한 본 명세서에 설명된 바와 같은 개선된 특징들 및/또는 특성들을 유도하는 1 이상의 치환체를 포함한다. 관련 실시형태에서, Ppro 폴리펩티드는 SEQ ID NO: 51과 100 %의 서열 동일성을 갖는다. 다른 관련 실시형태에서, Ppro 폴리펩티드는 SEQ ID NO: 53, SEQ ID NO: 55, SEQ ID NO: 58, SEQ ID NO: 61, SEQ ID NO: 63, SEQ ID NO: 65 또는 SEQ ID NO: 31과 100 %의 서열 동일성을 갖는다.
일 실시형태에서, 본 명세서는 SEQ ID NO: 61과 적어도 약 70 %의 서열 동일성을 갖는 Ppro 폴리펩티드에 관한 것이다. 몇몇 실시예들에서, Ppro 폴리펩티드는 SEQ ID NO: 61의 야생형 Ppro 서열에 대해 적어도 약 75 %(예를 들어, 적어도 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % 또는 적어도 99 %)의 서열 동일성을 가지며, 또한 본 명세서에 설명된 바와 같은 개선된 특징들 및/또는 특성들을 유도하는 1 이상의 치환체를 포함한다.
또 다른 실시형태에서, 본 명세서는 SEQ ID NO: 31과 적어도 약 70 %의 서열 동일성을 갖는 Ppro 폴리펩티드에 관한 것이다. 몇몇 실시예들에서, Ppro 폴리펩티드는 SEQ ID NO: 31의 야생형 Ppro 서열에 대해 적어도 약 75 %(예를 들어, 적어도 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % 또는 적어도 99 %)의 서열 동일성을 가지며, 또한 본 명세서에 설명된 바와 같은 개선된 특징들 및/또는 특성들을 유도하는 1 이상의 치환체를 포함한다.
또 다른 실시형태에서, 본 발명은 SEQ ID NO: 50, SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 57, SEQ ID NO: 59, SEQ ID NO: 60, SEQ ID NO: 62, SEQ ID NO: 64 또는 SEQ ID NO: 30의 야생형 Ppro 서열에 대해 적어도 약 75 %(예를 들어, 적어도 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % 또는 적어도 99 %)의 서열 동일성을 갖는 핵산 서열에 의해 인코딩되는 아미노산 서열을 포함하는 Ppro 폴리펩티드에 관한 것이다. 몇몇 실시예들에서, 핵산 서열은 본 명세서에 설명된 바와 같은 개선된 특징들 및/또는 특성들을 유도하는 1 이상의 치환체를 갖는 Ppro 변이체를 인코딩한다. 다른 실시예들에서, Ppro 핵산 서열은 포토박테리움 프로푼둠 이외의 종으로부터 도출된다.
또 다른 실시형태에서, 본 발명은 SEQ ID NO: 50, SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 57, SEQ ID NO: 59, SEQ ID NO: 60, SEQ ID NO: 62, SEQ ID NO: 64 또는 SEQ ID NO: 30에 대응하는 핵산의 실질적인 전체 길이에 대하여 엄격한 조건들 하에서 혼성화되는 핵산 서열에 의해 인코딩되는 아미노산 서열을 포함하는 Ppro 폴리펩티드에 관한 것이다. 몇몇 실시예들에서, 핵산 서열은 포토박테리움 프로푼둠 이외의 종으로부터 도출된 Ppro 변이체를 인코딩한다. 관련 실시형태에서, 본 발명은 SEQ ID NO: 50에 대해 적어도 약 70 %(예를 들어, 적어도 71 %, 72 %, 73 %, 74 %, 75 %, 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % 또는 적어도 99 %)의 서열 동일성을 갖는 뉴클레오티드 서열에 의해 인코딩되는 Ppro를 제공하며, 본 명세서에 개시된 치환체들을 포함한다(예를 들어, 표 13 참조).
Ppro
변이체의 개선된 특성
본 발명을 예시하기 위하여, P. 프로푼둠으로부터의 'tesA는 대장균에서의 여타의 유전자를 과발현시킬 필요없이 더 높은 비율의 FAME을 생성하도록 조작되었다. 아실-ACP(지방산 생합성의 생성물)에 직접 작용하는 에스테르 신타아제는 증가된 에스테르 생성으로 지향될 수 있을 뿐만 아니라, 지방산 생합성으로부터 경로의 직접적인 당김(direct pull)을 허용할 수 있으며 또한 이는 생성을 개선시킬 것이다. 또한, 라이브러리들 중 하나는 FAEE의 생성을 위해 테스트되었으며, FAME을 위해 P. 프로푼둠으로부터의 'tesA를 조작하였고 야생형 균주보다 더 높은 수준의 FAEE를 생성하였음이 관찰되었다. 이러한 Ppro 변이체는 본 명세서에 설명된 바와 같은 개선된 특징들 및/또는 특성들, 예를 들어 지방산 에스테르의 역가, 수율 및/또는 생산성의 증가; 및/또는 유리 지방산의 역가, 수율 및/또는 생산성의 감소를 나타낸다. 일 예시로서, P. 프로푼둠(Ppro)의 tesA는 에스테르 신타아제 활성을 갖도록 조작되었다. 다시 말해, Ppro의 tesA는 에스테르 신타아제로서 작용하도록 조작되었다. 플레이트에서 스크리닝될(screened) 때, 야생형 tesA Ppro 유전자는 총 아실 생성물[FAME + 유리 지방산("FFA")] 중 15 내지 18 %의 FAME을 생성하였다. 플레이트 상에서 테스트될 때 42 내지 44 %의 FAME 생성의 증가를 유도한 돌연변이체가 식별되었다. 이러한 동일한 돌연변이가 진탕 플라스크(shake flasks)에서 테스트되었을 때, 돌연변이체는 30 %의 FAME만을 생성한 야생형 tesA Ppro와 비교했을 때 62 내지 65 %의 FAME을 생성하였다(아래의 예시 7을 참조).
에스테르 신타아제 또는
Ppro
변이체를 만드는 방법
본 발명의 방법들을 구현하는데 있어서, 스크리닝을 위해 재조합 숙주 세포의 그룹을 준비하기 위해 돌연변이유발이 사용된다. 통상적으로, 재조합 숙주 세포는 작동가능하게 연결된 조절 서열과 함께 에스테르 신타아제의 변이체 또는 티오에스테라아제의 변이체(예를 들어, Ppro)와 같은 에스테르 신타아제 또는 Ppro 폴리펩티드를 위한 개방형 해독틀(open reading frame)을 포함하는 1 이상의 폴리뉴클레오티드 서열을 포함한다. 본 발명의 방법들의 구현에 유용한 변이 에스테르 신타아제 폴리펩티드 및 변이 티오에스테라아제 폴리펩티드의 다수의 예시들이 본 명세서에 설명된다. 본 발명의 방법들의 구현에 유용한 조절 서열의 예시들 또한 본 명세서에 설명된다. 이러한 폴리뉴클레오티드 서열의 돌연변이유발은, 부위 특이적 돌연변이유발(site directed mutagenesis), 무작위 화학적 돌연변이유발, 핵산말단가수분해효소 Ⅲ 결실 절차(exonuclease Ⅲ deletion procedures) 또는 표준 클로닝 기술들과 같은 유전 공학 기술들을 사용하여 수행될 수 있다. 대안적으로, 폴리뉴클레오티드의 돌연변이는 화학적 합성 또는 변형 절차들을 이용하여 생성될 수 있다.
돌연변이유발 방법들은 당업계에 잘 알려져 있으며, 예를 들어 다음을 포함한다. 오류 빈발(error prone) PCR에서[Leung 외, Technique, 1:11-15(1989); 및 Caldwell 외, PCR Methods Applic. 2:28-33(1992) 참조], PCR은 DNA 중합효소의 복제 정확도(copying fidelity)가 낮은 조건들 하에서 수행되어, 높은 점 돌연변이율(high rate of point mutation)이 PCR 생성물의 전체 길이를 따라 얻어진다. 간명하게, 이러한 절차들에서, 돌연변이유발될 폴리뉴클레오티드는 PCR 생성물의 전체 길이를 따라 높은 점 돌연변이율을 달성하기 위하여 PCR 프라이머, 반응 완충액, MgCl2, MnCl2, Taq 중합효소 및 적절한 농도의 dNTP와 혼합된다. 예를 들어, 이러한 반응은 돌연변이유발될 20 fmole의 핵산, 30 pmole의 각 PCR 프라이머, 50 mM KCl, 10 mM Tris HCl(pH 8.3) 및 0.01 % 젤라틴을 포함하는 반응 완충액, 7 mM MgCl2, 0.5 mM MnCl2, 5 단위(unit)의 Taq 중합효소, 0.2 mM dGTP, 0.2 mM dATP, 1 mM dCTP, 그리고 1 mM dTTP를 이용하여 수행될 수 있다. PCR은 94 ℃에서 1 분, 45 ℃에서 1 분, 그리고 72 ℃에서 1 분의 30 회 주기 동안 수행될 수 있다. 이러한 파라미터들은 적절하게 변동될 수 있음을 알 수 있을 것이다. 이후, 돌연변이유발된 폴리뉴클레오티드는 적절한 벡터 내로 클로닝되며, 돌연변이유발된 폴리뉴클레오티드에 의해 인코딩되는 영향을 받은 폴리펩티드들의 활성이 평가된다. 또한, 돌연변이유발은 관심 있는 여하한의 클로닝된 DNA의 부위 특이적 돌연변이유발을 생성하기 위해 올리고뉴클레오티드 특이적 돌연변이유발(Reidhaar-Olson 외, Science, 241:53-57, 1988 참조)을 이용하여 수행될 수 있다. 간명하게, 이러한 절차들에서, 클로닝된 DNA 내로 도입될 1 이상의 돌연변이를 지닌(bearing) 복수의 이중 가닥 올리고뉴클레오티드가 합성되고, 돌연변이유발될 클로닝된 DNA 내로 조립된다. 돌연변이유발된 DNA를 함유한 클론들이 회수되고, 영향을 받은 폴리펩티드의 활성이 평가된다. 폴리뉴클레오티드 서열 변이체를 생성하기 위한 또 다른 돌연변이유발 방법은 조립 PCR이다. 조립 PCR은 작은 DNA 분절의 혼합으로부터 PCR 생성물의 조립을 수반한다. 다수의 상이한 PCR 반응이 동일한 바이알에서 병행하여 일어나며, 일 반응의 생성물은 다른 반응의 생성물을 기폭시킨다(priming). 조립 PCR은, 예를 들어 미국 특허 5,965,408에 개시되어 있다. 폴리뉴클레오티드 서열 변이체를 생성하는 또 다른 돌연변이유발 방법은 유성(sexual) PCR 돌연변이유발이다(Stemmer, PNAS, USA 91:10747-10751, 1994). 유성 PCR 돌연변이유발에서, 강제된 상동성 재조합(forced homologous recombination)은 서열 상동성에 기초한 DNA 분자의 무작위 분절의 결과로서 생체 외에서 상이하지만 고도로 관련된 DNA 서열의 DNA 분자들 사이에 일어난다. 이후, PCR 반응의 프라이머 신장에 의한 크로스오버(crossover)의 고정이 후속된다.
또한, 에스테르 신타아제(예를 들어, '377) 또는 티오에스테라아제(예를 들어, Ppro) 서열 변이체는 생체 내에서 돌연변이유발에 의해 생성될 수 있다. 몇몇 실시예에서, 핵산 서열의 무작위 돌연변이는 DNA 복원 경로(repair pathway)들 중 1 이상에 돌연변이를 수송하는 박테리아 균주, 예컨대 대장균 균주의 폴리뉴클레오티드 서열을 증식시킴으로써 생성된다. 이러한 "돌연변이 유발 유전자(mutator)" 균주는 야생-형 균주보다 높은 무작위 돌연변이율을 갖는다. 이러한 균주들 중 하나의 DNA 서열의 증식은 DNA 내에 무작위 돌연변이를 생성할 것이다. 생체 내에서의 돌연변이유발에 사용하기 적합한 돌연변이 유발 유전자 균주는, 예를 들어 PCT 국제 공보 WO 91/16427에 기술되어 있다.
또한, 에스테르 신타아제(예를 들어, '377) 또는 티오에스테라아제(예를 들어, Ppro) 서열 변이체는 카세트 돌연변이유발(cassette mutagenesis)을 이용하여 생성될 수 있다. 카세트 돌연변이유발에서, 이중 가닥 DNA 분자의 작은 영역이 개시(starting) 폴리뉴클레오티드 서열과 상이한 합성 올리고뉴클레오티드 "카세트"로 대체된다. 올리고뉴클레오티드는 흔히 완전히 및/또는 부분적으로 무작위화된 버전의 개시 폴리뉴클레오티드 서열을 포함한다. 카세트 돌연변이유발의 다수의 적용들이 존재한다; 예를 들어, 카세트 돌연변이유발에 의한 돌연변이 단백질 조제(preparing)[예를 들어, Richards, J. H., Nature 323, 187 (1986); Ecker, D.J. 외, J. Biol. Chem. 262:3524-3527 (1987) 참조]; 개개의 코돈을 삽입 또는 대체하기 위한 코돈 카세트 돌연변이유발[예를 들어, Kegler-Ebo, D.M. 외, Nucleic Acids Res. 22(9): 1593-1599 (1994) 참조]; 조절 서열을 포함하는 비-코딩 폴리뉴클레오티드 서열의 무작위화에 의한 변이 폴리뉴클레오티드 서열 조제[예를 들어, 리보솜 결합 부위, 예를 들어, Barrick, D. 외, Nucleic Acids Res. 22(7): 1287-1295 (1994); Wilson, B.S. 외, Biotechniques 17:944-953 (1994) 참조].
또한, 순환 앙상블 돌연변이유발(Recursive ensemble mutagenesis; 예를 들어, Arkin 외, PNAS, USA 89:7811-7815, 1992 참조)은 폴리뉴클레오티드 서열 변이체를 생성하는데 사용될 수 있다. 순환 앙상블 돌연변이유발은, 표현형적으로 관련된 돌연변이체들(phenotypically related mutants)(이의 멤버들은 아미노산 서열과 상이함)의 다양한 개체군들을 생성하기 위해 개발된 단백질 조작(즉, 단백질 돌연변이유발)을 위한 알고리즘이다. 이 방법은 조합 카세트 돌연변이유발의 연속 라운드(successive rounds)를 제어하기 위go 피드백 메커니즘을 이용한다. 또한, 지수 앙상블 돌연변이유발(Exponential ensemble mutagenesis; 예를 들어 Delegrave 외, Biotech. Res, 11:1548-1552, 1993 참조)은 폴리뉴클레오티드 서열 변이체를 생성하는데 사용될 수 있다. 지수 앙상블 돌연변이유발은 높은 비율의 독특한 기능성 돌연변이체를 갖는 조합 라이브러리를 생성하기 위한 프로세스이며, 잔기들의 작은 기들은 기능성 단백질들을 야기하는 아미노산을 각각의 변경된 위치에서 식별하기 위해 병행하여 무작위화된다. 또한, 무작위 및 부위 특이적 돌연변이유발이 사용될 수 있다(예를 들어, Arnold, Curr. Opin. Biotech. 4:450-455, 1993 참조).
또한, 생체 내에서의 돌연변이유발의 표준 방법들이 사용될 수 있다. 예를 들어, 작동가능하게-연결된 조절 서열뿐만 아니라, 에스테르 신타아제(예를 들어, '377) 또는 티오에스테라아제(예를 들어, Ppro) 폴리펩티드를 위한 개방형 해독틀을 포함하는 1 이상의 폴리뉴클레오티드 서열을 포함하는 숙주 세포는, 방사선(예를 들어, UV 광 또는 X-선)으로의 노출 또는 화학제(예를 들어, 에틸화제, 알킬화제, 또는 핵산 유사체)로의 노출을 통해 돌연변이유발을 겪게 할 수 있다. 또한, 몇몇 숙주 유형, 예를 들어 박테리아, 효모 및 식물에서는, 전이 인자들이 생체 내에서의 돌연변이유발을 위해 사용될 수 있다.
'377 변이체와 같은 에스테르 신타아제 변이체를 인코딩하는 1 이상의 폴리뉴클레오티드 서열의 돌연변이유발은 일반적으로 변형되고 개선된 생물학적 기능을 입증하는 에스테르 신타아제 폴리펩티드 생성물의 발현을 유도한다. 이와 유사하게, Ppro 변이체를 인코딩하는 1 이상의 폴리뉴클레오티드 서열의 돌연변이유발은 일반적으로 향상된 에스테르 신타아제 활성과 같은 변형되고 개선된 생물학적 기능을 입증하는 Ppro 폴리펩티드 생성물의 발현을 유도한다. 예를 들어, '377 폴리펩티드 및 작동가능하게-연결된 조절 서열을 인코딩하는 개방형 해독틀을 포함하는 1 이상의 폴리뉴클레오티드 서열의 돌연변이유발에 의한 재조합 미생물의 그룹을 조제할 때, 결과적인 돌연변이유발된 폴리뉴클레오티드 서열로부터 발현된 단백질은 '377 에스테르 신타아제 생물학적 기능을 유지할 수 있지만, 증가된 수율의 지방족 에스테르, 감소된 수율의 베타 하이드록시 에스테르 및/또는 (사슬 길이, 포화 등과 관련하여) 지방족 에스테르 생성물의 변형된 혼합물을 포함하는 개선된 조성물은 돌연변이 '377 폴리뉴클레오티드를 발현시키기에 효과적인 조건들 하에서 재조합 미생물의 배양 시에 관찰된다. 이와 유사하게, Ppro 폴리펩티드 및 작동가능하게-연결된 조절 서열을 인코딩하는 개방형 해독틀을 포함하는 1 이상의 폴리뉴클레오티드 서열의 돌연변이유발에 의한 재조합 미생물의 그룹을 조제할 때, 결과적인 돌연변이유발된 폴리뉴클레오티드 서열로부터 발현된 단백질은 Ppro 티오에스테라아제 생물학적 기능을 유지할 수 있지만, 에스테르 신타아제 활성은 재조합 미생물에서 관찰된다. 에스테르 신타아제 활성으로 인해, 증가된 수율의 지방족 에스테르, (사슬 길이, 포화 등과 관련하여) 지방족 에스테르 생성물의 변형된 혼합물을 포함하는 개선된 조성물은 돌연변이 Ppro 폴리뉴클레오티드를 발현시키기에 효과적인 조건들 하에서 재조합 미생물의 배양 시에 관찰된다. 또 다른 실시예에서, 1 이상의 Ppro 폴리뉴클레오티드 서열의 돌연변이유발은 일반적으로 야생형 또는 모(parent) Ppro 폴리펩티드와 동일한 생물학적 기능을 지닐 수 있는 Ppro 폴리뉴클레오티드 생성물의 발현을 유도하나, 돌연변이 Ppro 폴리펩티드는 변형된 생물학적 기능을 입증한다. 예를 들어, Ppro 폴리펩티드 및 작동가능하게-연결된 조절 서열을 인코딩하는 개방형 해독틀을 포함하는 1 이상의 폴리뉴클레오티드 서열의 돌연변이유발에 의한 재조합 미생물의 그룹을 조제할 때, 결과적인 돌연변이유발된 폴리뉴클레오티드 서열로부터 발현된 단백질은 Ppro 티오에스테라아제 생물학적 기능을 유지할 수 있지만, 에스테르 신타아제 활성은 재조합 미생물에서 관찰된다.
핫 스폿(Hot Spots)
또한, 본 발명은 적어도 부분적으로 '377 폴리펩티드와 같은 변이 에스테르 신타아제 폴리펩티드 중에서 구조적으로 보존된 특정 "핫 스폿"의 식별에 기초한다. 핫 스폿은, '377 폴리펩티드의 베타 하이드록시 에스테르의 더 낮은 생성 및/또는 지방족 에스테르 생성물의 더 높은 역가를 야기하는 높은 수의 돌연변이가 관찰된 영역이다. 특히, 이러한 영역은 이러한 핫 스폿이 결여된 야생형 폴리펩티드에 비해 더 큰 에스테르 신타아제 활성을 나타내는 변이 에스테르 신타아제 폴리펩티드에 나타난다. 핫 스폿은 아미노산 영역 39-44; 76-80; 98-102; 146-150; 170-207, 특히 182-207(예를 들어, 가장 높은 수의 돌연변이를 나타냄); 242-246; 300-320; 348-357; 및 454-458을 포함한다.
모티프(Motifs)
또한, 본 발명은 적어도 부분적으로 향상된 에스테르 신타아제 활성을 갖는 티오에스테라아제 폴리펩티드 중에서 구조적으로 보존된 특정 모티프의 식별에 기초하며, 이러한 모티프 중 하나를 포함하는 Ppro와 같은 티오에스테라아제 폴리펩티드는 모티프가 결여된 야생형 티오에스테라아제 폴리펩티드에 비해 더 큰 에스테르 신타아제 활성을 갖는다. 따라버, 본 발명은 아래에 나타낸 치환체들로 SEQ ID NO: 51의 아미노산 영역 73-81에서 모티프를 포함하는 Ppro와 같은 변이 티오에스테라아제 폴리펩티드를 특성화한다.
잠재적 치환체(potential substitutions)는 아미노산 위치 75에서의 알라닌(A) 또는 글리신(G); 아미노산 위치 76에서의 발린(V) 이소류신(I) 또는 류신(L); 및 아미노산 위치 78에서의 알라닌(A) 또는 글리신(G)을 포함한다.
재조합 숙주 세포 및 재조합 숙주 세포 배양
*본 발명의 재조합 숙주 세포는, 재조합 숙주 세포에서의 에스테르 신타아제 활성을 갖는 폴리펩티드의 발현을 용이하게 하는 작동가능하게-연결된 조절 서열과 함께, 에스테르 신타아제 활성을 갖는 폴리펩티드, 예를 들어 아실-티오에스테르의 지방족 에스테르로의 전환을 촉진시키는 여하한의 폴리펩티드를 인코딩하는 개방형 해독틀을 포함하는 1 이상의 폴리뉴클레오티드 서열을 포함한다. 일 바람직한 실시예에서, 개선된 에스테르 신타아제 활성을 갖는 폴리펩티드는 '377의 변이체 또는 돌연변이체이다. 또 다른 바람직한 실시예에서, 개선된 에스테르 신타아제 활성을 갖는 폴리펩티드는 Ppro의 변이체 또는 돌연변이체이다. 본 발명의 재조합 숙주 세포에서, 개방형 해독틀 코딩 서열 및/또는 조절 서열은 '377 또는 Ppro 폴리펩티드의 대응하는 야생형 코딩 서열에 대해 변형될 수 있다. 지방족 에스테르 조성물은 변이 에스테르 신타아제 폴리펩티드(예를 들어, '377) 또는 에스테르 신타아제 활성을 갖는 변이 티오에스테라아제 폴리펩티드(예를 들어, Ppro)를 발현시키기에 효과적인 조건들 하에서 탄소원의 존재 시 재조합 숙주 세포를 배양함으로써 생성된다. 돌연변이체 또는 변이체 '377 폴리펩티드의 발현은 증가된 수율의 지방족 에스테르 및 감소된 수율의 베타 하이드록실 에스테르를 갖는 지방족 에스테르 조성물의 생성을 유도한다. 돌연변이체 또는 변이체 Ppro 폴리펩티드의 발현은 증가된 수율의 지방족 에스테르를 갖는 지방족 에스테르 조성물의 생성을 유도한다.
본 발명을 예시하기 위해, 본 출원인들은 변이 에스테르 신타아제 폴리펩티드 서열을 발현시키는 숙주 균주를 구성하였다(아래의 예시들을 참조). 재조합 숙주 세포에서 발현될 때 더 높은 역가의 지방족 에스테르를 유도하는 변이 에스테르 신타아제 폴리펩티드 서열의 예시들은 숙주 균주 9B12(SEQ ID NO: 4), pKEV022(SEQ ID NO: 10), KASH008(SEQ ID NO: 16), KASH280(SEQ ID NO: 33) 및 KASH281(SEQ ID NO: 35)을 포함한다(이로 제한되지 않음). 재조합 숙주 세포에서 발현될 때 더 높은 역가의 지방족 에스테르 및 β-OH 에스테르 생성의 감소를 유도하는 변이 에스테르 신타아제 폴리펩티드 서열의 예시들은 숙주 균주 pKEV28(SEQ ID NO: 12), 및 KASH008(SEQ ID NO: 16), KASH285(SEQ ID NO: 37), KASH286(SEQ ID NO: 39), KASH288(SEQ ID NO: 41) 및 KASH289(SEQ ID NO: 43)를 포함한다.
재조합 숙주 세포에서 발현될 때 더 높은 역가의 지방족 에스테르를 유도하는 변이 Ppro 폴리펩티드 서열의 예시들은 숙주 균주 PROFl(SEQ ID NO: 53), PROF2(SEQ ID NO: 55), P1B9(SEQ ID NO: 58), N115F(SEQ ID NO: 61), Vc7P4H5(SEQ ID NO: 63), Vc7P5H9(SEQ ID NO: 65) 및 Vc7P6F9(SEQ ID NO: 31)를 포함한다(이로 제한되지 않음).
재조합 숙주 세포는 지방산 메틸 에스테르(FAME), 지방산 에틸 에스테르(FAEE), 왁스 에스테르 등과 같은 지방족 에스테르를 생성할 수 있다. 지방산 에스테르는 통상적으로 배양 배지로부터 회수된다. 재조합 숙주 세포에 의해 생성되는 지방산 에스테르 조성물은, 지방족 에스테르 조성물의 성분의 포화도 및 사슬 길이뿐만 아니라 특정 지방산 에스테르의 분포를 결정하기 위해, 해당 기술분야에 알려진 방법들, 예를 들어 GC-FID를 이용하여 분석될 수 있다.
재조합 숙주 세포 및 배양물을 만드는 방법
숙주 세포를 유전적으로 조작하여 지방족 에스테르 및/또는 지방족 에스테르 조성물을 생성하기 위해 해당 기술분야에 잘 알려진 다양한 방법들이 사용될 수 있다. 이러한 방법들은 본 명세서에 설명된 바와 같이 돌연변이 또는 변이 '377 에스테르 신타아제 또는 에스테르 신타아제 활성을 갖는 Ppro 티오에스테라아제를 인코딩하는 핵산을 포함하는 벡터, 바람직하게는 발현 벡터의 사용을 포함한다. 당업자라면, 다양한 바이러스 및 비-바이러스 벡터가 본 명세서에 설명된 방법들에 사용될 수 있음을 알 수 있을 것이다.
본 발명의 몇몇 실시예들에서, 특정 조성물의 "더 높은" 역가의 지방족 에스테르는 더 높은 역가의 특정 유형의 지방산 에스테르 또는 동일한 지방산 에스테르의 역가에 대해 재조합 숙주 세포 배양에 의해 생성된 지방산 에스테르의 조합 또는 대응하는 야생형 숙주 세포의 조절 배양에 의해 생성된 지방산 에스테르의 조합이다. 몇몇 실시예들에서, 돌연변이 또는 변이 '377 에스테르 신타아제 폴리뉴클레오티드(또는 유전자) 서열 또는 돌연변이 또는 변이 Ppro 폴리뉴클레오티드(또는 유전자) 서열은 재조합 벡터에 의하여 숙주 셀에 제공되며, 이는 폴리뉴클레오티드 서열에 작동가능하게 연결된 프로모터를 포함한다. 특정 실시예들에서, 프로모터는 발달-조절된, 세포소기관-특이적, 조직-특이적, 유도적, 구조적 또는 세포-특이적 프로모터이다. 재조합 벡터는 통상적으로 폴리뉴클레오티드 서열에 작동가능하게 연결된 발현 조절 서열; 폴리뉴클레오티드 서열에 작동가능하게 연결된 선택 마커; 폴리뉴클레오티드 서열에 작동가능하게 연결된 마커 서열; 폴리뉴클레오티드 서열에 작동가능하게 연결된 정제 모이어티; 폴리뉴클레오티드 서열에 작동가능하게 연결된 분비 서열; 및 폴리뉴클레오티드 서열에 작동가능하게 연결된 표적화 서열을 포함한다. 단백질 및 작동가능하게 연결된 조절 서열을 인코딩하는 개방형 해독틀을 포함하는 1 이상의 폴리뉴클레오티드 서열은 재조합 숙주 세포의 염색체 내로 통합될 수 있거나, 재조합 숙주 세포에 내재하는 1 이상의 플라스미드 발현계에 포함될 수 있거나, 둘 모두가 구현될 수 있다.
본 명세서에 설명된 발현 벡터는 숙주 세포에서의 폴리뉴클레오티드 서열의 발현에 적합한 형태의 본 명세서에 설명된 폴리뉴클레오티드 서열을 포함한다. 해당 기술분야의 당업자라면, 발현 벡터의 설계는 형질전환될 숙주 세포의 선택, 원하는 폴리펩티드의 발현 수준 등과 같은 이러한 요인들에 의존할 수 있음을 알 수 있을 것이다. 본 명세서에 설명된 발현 벡터들은 본 명세서에 설명된 바와 같은 폴리뉴클레오티드 서열에 의해 인코딩되는, 융합 폴리펩티드들을 포함하는 폴리펩티드들을 생성하기 위하여 숙주 세포들 내로 도입될 수 있다. 원핵생물, 예를 들어 대장균의 폴리펩티드를 인코딩하는 유전자의 발현은 융합 및 비-융합 폴리펩티드들 중 어느 하나의 발현을 지시하는 구성적 또는 유도성 프로모터를 함유한 벡터로 가장 흔히 수행된다. 원핵 및 진핵 세포 둘 모두에 적합한 발현계가 해당 기술분야에 잘 알려져 있다; 예를 들어, Sambrook 외, "Molecular Cloning: A Laboratory Manual", 제 2 판, Cold Spring Harbor Laboratory(1989) 참조. 특정 실시예들에서, 본 발명의 폴리뉴클레오티드 서열은 박테리오파지 T5로부터 도출된 프로모터에 작동가능하게 연결된다. 이 실시예에서, 발현 벡터는 효모 발현 벡터이다. 벡터는 숙주 세포 내로 외래 핵산(예를 들어, DNA)을 도입하기 위해 해당 기술분야에 주지된 다양한 기술들을 통해 원핵 세포 또는 진핵 세포 내로 도입될 수 있다. 숙주 세포를 형질전환 또는 형질감염(transfecting)시키기에 적합한 방법들은 Sambrook 외(위 참조)에서 찾을 수 있다.
박테리아 세포들의 안정한 형질전환을 위하여, 사용되는 발현 벡터 및 형질전환 기술에 따라, 일부의 세포만이 발현 벡터를 흡수하고 복제할 것임이 알려져 있다. 이러한 형질전환체들을 식별하고 선택하기 위하여, (예를 들어, 항생제에 대해 내성이 있는) 선택가능한 마커를 인코딩하는 유전자가 관심 유전자와 함께 숙주 세포 내로 도입될 수 있다. 선택가능한 마커들은 암피실린, 카나마이신, 클로람페니콜 또는 테트라사이클린과 같은 약물에 대한 내성을 부여하는 것들을 포함한다(이로 제한되지 않음). 선택가능한 마커를 인코딩하는 핵산은 본 명세서에서 설명되는 폴리펩티드를 인코딩하는 벡터와 동일한 벡터 상에서 숙주 세포 내로 도입될 수 있거나, 별개의 벡터 상에서 도입될 수 있다. 도입된 핵산에 의해 안정적으로 형질전환된 세포는 적절하게 선택된 약물의 존재 하에서 성장에 의해 식별될 수 있다.
미생물인 숙주 세포의 예시들은 에스체리키아(Escherichia) 속, 바실러스(Bacillus) 속, 락토바실러스(Lactobacillus) 속, 자이모모나스(Zymomonas) 속, 로도코코스(Rhodococcus) 속, 슈도모나스(Pseudomonas) 속, 아스페르길러스(Aspergillus) 속, 트리코더마(Trichoderma) 속, 뉴로스포라(Neurospora) 속, 푸사리움(Fusarium) 속, 후미콜라(Humicola) 속, 리조무코(Rhizomucor) 속, 클루이베로마이세스(Kluyveromyces) 속, 피치아(Pichia) 속, 무코(Mucor) 속, 미셀리오프토라(Myceliophtora) 속, 페니실리움(Penicillium) 속, 파네로차에테(Phanerochaete) 속, 느타리(Pleurotus) 속, 트라메테스(Trametes) 속, 크리소스포리움(Chrysosporium) 속, 사카로마이세스(Saccharomyces) 속, 스테노트로파모나스(Stenotrophamonas) 속, 스키조사카로마이세스(Schizosaccharomyces) 속, 야로위아(Yarrowia) 속 또는 스트렙토마이세스(Streptomyces) 속으로부터의 세포들을 포함한다(이로 제한되지 않음). 몇몇 실시예들에서, 숙주 세포는 그람-양성(Gram-positive) 박테리아성 세포이다. 다른 실시예들에서, 숙주 세포는 그람-음성(Gram-negative) 박테리아성 세포이다. 몇몇 실시예들에서, 숙주 세포는 대장균 세포이다. 다른 실시예들에서, 숙주 세포는 바실러스 렌투스(Bacillus lentus) 세포, 바실러스 브레비스(Bacillus brevis) 세포, 바실러스 스테아로써모필러스(Bacillus stearothermophilus) 세포, 바실러스 리케니포르미스(Bacillus licheniformis) 세포, 바실러스 알칼로필루스(Bacillus alkalophilus) 세포, 바실러스 코아굴란스(Bacillus coagulans) 세포, 바실러스 키르쿨란스(Bacillus circulans) 세포, 바실러스 푸밀리스(Bacillus pumilis) 세포, 바실러스 튜링기엔시스(Bacillus thuringiensis) 세포, 바실러스 클라우시(Bacillus clausii) 세포, 바실러스 메가테리움(Bacillus megaterium) 세포, 바실러스 서브틸러스(Bacillus subtilis) 세포 또는 바실러스 아밀로리퀴파시엔스(Bacillus amyloliquefaciens) 세포이다.
또 다른 실시예들에서, 숙주 세포는 트리코더마 코닌기(Trichoderma koningii) 세포, 트리코더마 비리데(Trichoderma viride) 세포, 트리코더마 르에세이(Trichoderma reesei) 세포, 트리코더마 롱기브라키아텀(Trichoderma longibrachiatum) 세포, 아스페르길루스 아와모리(Aspergillus awamori) 세포, 아스페르길러스 푸미가테스(Aspergillus fumigates) 세포, 아스페르길러스 포에티두스(Aspergillus foetidus) 세포, 아스페르길러스 니둘란스(Aspergillus nidulans) 세포, 아스페르길러스 니게르(Aspergillus niger) 세포, 아스페르길러스 오리재(Aspergillus oryzae) 세포, 후미콜라 인솔렌스(Humicola insolens) 세포, 후미콜라 라누기노세(Humicola lanuginose) 세포, 로도코코스 오파쿠스(Rhodococcus opacus) 세포, 리조무코 미에헤이(Rhizomucor miehei) 세포 또는 무코 미에헤이(Mucor michei) 세포이다. 또 다른 실시예들에서, 숙주 세포는 스트렙토마이세스 리비단스(Streptomyces lividans) 세포 또는 스트렙토마이세스 무리누스(Streptomyces murinus) 세포이다. 또 다른 실시예들에서, 숙주 세포는 방선균(Actinomycetes) 세포이다. 몇몇 실시예들에서, 숙주 세포는 맥주효모균(Saccharomyces cerevisiae) 세포이다.
다른 실시예들에서, 숙주 세포는 진핵 식물(eukaryotic plant), 조류, 남세균(cyanobacterium), 녹색-황 세균, 녹색 비-황(green non-sulfur) 세균, 자색 황세균, 자색 비-황 세균, 극한성 생물(extremophile), 효모, 균류, 이들의 조작된 유기체 또는 합성 유기체로부터의 세포이다. 몇몇 실시예들에서, 숙주 세포는 광 의존성이거나 탄소를 고정시킨다. 몇몇 실시예들에서, 숙주 세포는 독립영양적 활성(autotrophic activity)을 갖는다.
몇몇 실시예들에서, 숙주 세포는 빛의 존재 하에서와 같이, 광독립영양적 활성을 갖는다. 몇몇 실시예들에서, 숙주 세포는 빛의 부재 하에서 종속영양적(heterotrophic) 또는 혼합영양적(mixotrophic)이다. 특정 실시예들에서, 숙주 세포는 애기장대(Avabidopsis thaliana), 파니쿰 비르가툼(Panicum virgatum), 미스캔더스 기간테우스(Miscanthus giganteus), 제아 메이즈(Zea mays), 보트리오코커스 브라우니(Botryococcuse braunii), 클라미도모나스 레인하드티(Chlamydomonas reinhardtii), 두나리엘라 살리나(Dunaliela salina), 시네코코커스 종(Synechococcus Sp.) PCC 7002, 시네코코거스 종 PCC 7942, 시네코시스티스 종(Synechocystis Sp.) PCC 6803, 써모시네코코커스 엘롱게이트(Thermosynechococcus elongates) BP-1, 클로로비움 테피듐(Chlorobium tepidum), 클로로프렉서스 아우란티쿠스(Chloroflexus auranticus), 크로마티움 비노슘(Chromatiumm vinosum), 로도스피리윰 루브륨(Rhodospirillum rubrum), 로도박터 캡슐라투스(Rhodobacter capsulatus), 로도슈도모나스 파루스리스(Rhodopseudomonas palusris), 클로스트리디움 융달리(Clostridium ljungdahlii), 클로스트리디우써모셀룸(Clostridiuthermocellum), 페니실리움 크리소게눔(Penicillium chrysogenum), 피치아 파스토리스(Pichia pastoris), 맥주효모균(Saccharomyces cerevisiae), 스키조사카로마이세스 포롬브(Schizosaccharomyces pombe), 슈도모나스 플루오르슨스(Pseudomonas fluorescens) 또는 자이모모나스 모빌리스(Zymomonas mobilis)로부터의 세포이다.
유전적으로 조작된 숙주 세포의 배양 및 발효
본 명세서에서 사용되는 바와 같이, "발효"라는 용어는 광범위하게 숙주 세포에 의한 유기 물질의 표적 물질(target substance)로의 전환, 예를 들어 탄소원을 포함하는 배지에서 재조합 숙주 세포의 배양물을 증식시킴으로써 재조합 숙주 세포에 의한 탄소원의 지방산 또는 이의 유도체들로의 전환을 지칭한다. 본 명세서에서 사용되는 바와 같이, "생성을 위하여 허용되는 조건들"이라는 용어는 숙주 세포가 원하는 생성물, 예컨대 지방산 에스테르 조성물을 생성하게 하는 여하한의 조건들을 의미한다. 유사하게, "벡터의 폴리뉴클레오티드 서열이 발현되는 조건들"이라는 용어는 숙주 세포가 폴리펩티드를 합성하게 하는 여하한의 조건들을 의미한다. 적합한 조건들은, 예를 들어 발효 조건들을 포함한다. 발효 조건들은 온도 범위, 통기 수준 및 배지 조성을 포함하는 다수의 파라미터들을 포함할 수 있다(이로 제한되지 않음). 이러한 조건들의 각각은 개별적으로 또한 조합하여, 숙주 세포가 성장하게 한다. 발효는 호기성, 혐기성 또는 [미-호기성(micro-aerobic)과 같은] 이의 변이성(variations)일 수 있다. 예시적인 배양 배지는 배양액(broths) 또는 겔(gels)을 포함한다. 일반적으로, 배지는 숙주 세포에 의해 직접적으로 대사작용될 수 있는 탄소원을 포함한다. 또한, 효소들은 탄소원의 기동(mobilization)[예를 들어, 전분 또는 셀룰로오스의 발효가능 당들로의 해중합반응(depolymerization)] 및 차후 신진대사를 촉진시키기 위하여 배지에 사용될 수 있다.
소규모 생성을 위해, 조작된 숙주 세포들은 예를 들어, 약 100 μL, 200 μL, 300 μL, 400 μL, 500 μL, 1 mL, 5 mL, 10 mL, 15 mL, 25 mL, 50 mL, 75 mL, 100 mL, 500 mL, 1 L, 2 L, 5 L 또는 10 L의 뱃치(batchs)에서 성장될 수 있고; 발효될 수 있으며; 원하는 폴리뉴클레오티드 서열, 예컨대 에스테르 신타아제 활성을 갖는 폴리뉴클레오티드를 인코딩하는 폴리뉴클레오티드 서열을 발현시키도록 유도될 수 있다. 대규모 생성을 위해, 조작된 숙주 세포들은 약 10 L, 100 L, 1000 L, 10,000 L, 100,000 L 및 1,000,000 L 또는 그 이상의 부피의 뱃치를 갖는 배양들에서 성장될 수 있고; 발효될 수 있으며; 원하는 폴리뉴클레오티드 서열을 발현시키도록 유도될 수 있다. 본 명세서에서 설명되는 지방족 에스테르 조성물은 재조합 숙주 세포 배양의 세포외 환경에서 발견되고, 배양 배지로부터 쉽게 격리될 수 있다. 지방산 유도체는 재조합 숙주 세포에 의해 분비될 수 있고, 세포외 환경으로 수송될 수 있거나 또는 수동적으로 재조합 숙주 세포 배양의 세포외 환경으로 전달될 수 있다. 지방족 에스테르 조성물은 해당 기술분야에 알려진 통상의 방법들을 이용하여 재조합 숙주 세포 배양물로부터 격리된다.
유전적으로 조작된 숙주 세포의 스크리닝
본 발명의 일 실시예에서, 돌연변이 또는 변이 '377 에스테르 신타아제 폴리펩티드의 활성은 재조합 숙주 세포를 배양함으로써 결정되며('377 폴리뉴클레오티드 서열과 같은 1 이상의 돌연변이유발된 에스테르 신타아제를 포함함), 이후 재조합 숙주 세포에 의해 생성된 지방산 에스테르 조성물의 특징들; 예를 들어, 지방산 에스테르의 역가, 수율 및 생산성; 및 퍼센트 베타 하이드록시 에스테르를 식별하기 위해 스크리닝이 후속된다. 또 다른 실시예에서, 돌연변이 또는 변이 Ppro 폴리펩티드의 활성은 재조합 숙주 세포를 배양함으로써 결정되며(Ppro 폴리뉴클레오티드 서열과 같은 1 이상의 돌연변이유발된 티오에스테라아제를 포함함), 이후 재조합 숙주 세포에 의해 생성된 지방산 에스테르 조성물의 특징들; 예를 들어, 지방산 에스테르의 역가, 수율 및 생산성; 및 유리 지방산을 식별하기 위해 스크리닝이 후속된다. 돌연변이 또는 변이 '377 에스테르 신타아제 폴리펩티드 또는 돌연변이 또는 변이 Ppro 폴리펩티드 및 이의 분절은 통상의 방법들을 이용하여 에스테르 신타아제 활성에 대해 검사될(assayed) 수 있다. 예를 들어, 돌연변이 또는 변이 '377 에스테르 신타아제 폴리펩티드 또는 Ppro 폴리펩티드 및 이의 분절은 폴리펩티드가 기능하게 하는 조건들 하에서 기질(예를 들어, 아실-CoA, 아실-ACP, 유리 지방산 또는 알코올)과 접촉된다. 에스테르 신타아제 활성을 결정하기 위해 기질의 수준의 감소 또는 지방족 에스테르 또는 지방족 에스테르 조성물의 수준의 증가가 측정될 수 있다.
재조합 숙주 세포로부터 도출되는 생성물
본 명세서에서 사용되는 바와 같이, "현대 탄소의 분율(fraction of modern carbon)" 또는 fM은 각각 옥살산 표준 HOxI 및 HOxII로 알려져 있는 미국 국립표준기술연구소(National Institute of Standards and Technology: NIST) 표준 참고 물질(Standard Reference Materials: SRMs) 4990B 및 4990C에 의해 정의된 바와 동일한 의미를 갖는다. 이러한 기본적인 정의는 (AD 1950을 기준으로) 0.95 배의 14C/12C 동위원소 비율 HOxI에 관한 것이다. 이는 붕괴-보정된 산업혁명-전 목재(decay-corrected pre-Industrial Revolution wood)에 거의 등가이다. 현재 생존 생물권(living biosphere)[식물 재료]에 대하여, fM은 약 1.1이다.
생물학적으로 생성되는 유기 화합물 및 특히 본 명세서의 지방산 생합성 경로를 이용하여 생성되는 지방족 에스테르 조성물을 포함하는 바이오생성물(Bioproducts)[예를 들어, 본 발명에 따라 생성되는 지방족 에스테르 조성물]은 재생가능한 공급원들로부터 생성되지 않았으며, 말하자면 새로운 물질의 조성물이다. 이러한 새로운 바이오생성물은 이중 탄소-동위원소 핑거프린팅(dual carbon-isotopic fingerprinting) 또는 14C 연대측정(dating)에 기초하여 석유화학의 탄소로부터 도출되는 유기 화합물과 구별될 수 있다. 추가적으로, 생물자원 탄소(biosourced carbon)의 특이적 공급원(예를 들어, 글루코오스 대 글리세롤)은 이중 탄소-동위원소 핑거프린팅에 의해 결정될 수 있다(예를 들어, 미국 특허 7,169,588 참조). 석유 기반 유기 화합물과 바이오생성물을 구별하는 능력은 상업적으로(in commerce) 이러한 물질들을 추적하는데 유익하다. 예를 들어, 생물학적 기반 및 석유 기반 탄소 동위원소 프로파일 둘 모두를 포함하는 유기 화합물 또는 화학제는 석유 기반 물질들로만 만들어진 유기 화합물 및 화학제와 구별될 수 있다. 따라서, 본 명세서의 바이오생성물은 이들의 특유한 탄소 동위원소 프로파일에 기초하여 상업적으로 후속되거나 추적될 수 있다. 바이오생성물은 각 샘플의 안정한 탄소 동위원소 비율(13C/12C)을 비교함으로써 석유 기반 유기 화합물과 구별될 수 있다. 주어진 바이오생성물의 13C/12C 비율은 이산화탄소가 고정된 시간에 대기 중의 이산화탄소에 대한 13C/12C 비율의 결과이다. 또한, 이는 정확한 대사작용 경로를 반영한다. 또한, 국부적인 변이들도 일어난다. 석유, C3 식물[활엽(broadleaf)], C4 식물[목초(grasses)] 및 해양 탄산염(marine carbonate) 모두는 13C/12C 및 대응하는 δ13C 값에서 상당한 차이를 나타낸다. C4 및 C3 식물 모두는 13C/12C 동위원소 비율의 범위를 나타내지만, 통상적인 값은 C4 식물에 대해 약 -7 내지 약 -13 퍼밀(per mil)이고, C3 식물에 대해 약 -19 내지 약 -27 퍼밀이다[예를 들어, Stuiver 외, Radiocarbon 19:355(1977) 참조]. 석탄 및 석유는 일반적으로 이 후자의 범위에 속한다.
일련의 대안적인 RM이 IAEA, USGS, NIST 및 다른 선택된 국제 동위원소 실험실들과 협력하여 개발되었다. PDB로부터의 퍼밀 편차에 대한 표기는 δ13C이다. 질량 44, 45 및 46의 분자 이온들에 대한 고정밀 안정 비율 질량 분석[high precision stable ratio mass spectrometry](IRMS)에 의해 CO2 상에서 측정이 행해진다. 본 명세서에서 설명되는 조성물은 본 명세서에서 설명되는 방법들 중 어느 하나에 의해 생성되는 지방족 에스테르 조성물 및 생성물을 포함한다. 구체적으로, 지방족 에스테르 조성물 및 생성물은 약 -28 이상, 약 -27 이상, -20 이상, -18 이상, -15 이상, -13 이상, -10 이상, 또는 -8 이상의 δ13C를 가질 수 있다. 예를 들어, 지방족 에스테르 조성물 및 생성물은 약 -30 내지 약 -15, 약 -27 내지 약 -19, 약 -25 내지 약 -21, 약 -15 내지 약 -5, 약 -13 내지 약 -7, 또는 약 -13 내지 약 -10의 δ13C를 가질 수 있다. 다른 경우에, 지방족 에스테르 조성물 및 생성물은 약 -10, -11, -12 또는 -12.3의 δ13C를 가질 수 있다. 또한, 본 명세서의 설명에 따라 생성되는 지방족 에스테르 조성물 및 생성물은 각 화합물의 14C의 양을 비교함으로써 석유 기반 유기 화합물과 구별될 수 있다. 14C는 핵 반감기가 5730년이기 때문에, "더 오래된" 탄소를 함유한 석유 기반 연료는 "더 새로운" 탄소를 함유한 지방족 에스테르 조성물 및 바이오생성물과 구별될 수 있다[예를 들어, Currie, "Source Apportionment of Atmospheric Particles", Characterization of Environmental Particles, J. Buffle and H. P. van Leeuwen, Eds., 1 of Vol. I of the IUPAC Environmental Analytical Chemistry Series(Lewis Publishers, Inc.) 3-74, (1992) 참조].
방사성탄소 연대측정법(radiocarbon dating)의 기본적인 가정은 대기 중의 14C 농도의 항상성(constancy)이 생물(living organism)의 14C의 항상성을 유도한다는 점이다. 하지만, 1950년 이후부터의 대기권 핵실험 및 1850년 이후부터의 화석 연료의 연소로 인하여, 14C는 제 2의, 지구화학적인 시간 특성을 얻었다. 대기 CO2 및 이에 따른 생물권(living biosphere)의 농도는 1960년대 중반의 핵실험 피크의 거의 두 배였다. 이후, 7년 내지 10년의 근사적 이완 "반-감기"(approximate relaxation "half-life")를 갖는 약 1.2×10-12의 정상-상태 우주기원(steady-state cosmogenic: 대기) 기준 동위원소 비율(14C/12C)로 점진적으로 복귀되었다[이 후자의 반감기는 문자 그대로 받아들여야 하는 것이 아니라; 그보다는 핵무기 시대의 시작 이후로 대기권 및 생물권의 14C의 변이성을 추적하기 위해 상세한 대기 핵 투입/붕괴의 함수(detailed atmospheric nuclear input/decay function)를 사용해야 한다]. 이는 최근 생물권 탄소의 매년 연대측정의 가능성(promise of annual dating)을 지속하는 후자의 생물권 14C 시간 특징이다. 14C는 "현대 탄소의 분율"(fM)의 단위로 주어지는 결과들을 갖는 가속기 질량 분광 분석(accelerator mass spectrometry: AMS)에 의해 측정될 수 있다. 본 명세서에서 설명되는 지방족 에스테르 조성물 및 생성물은 적어도 약 1 이상의 fM 14C를 가질 수 있는 바이오생성물을 포함한다. 예를 들어, 본 발명의 바이오생성물은 적어도 약 1.01의 fM 14C, 약 1 내지 약 1.5의 fM 14C, 약 1.04 내지 약 1.18의 fM 14C, 또는 약 1.111 내지 약 1.124의 fM 14C를 가질 수 있다.
14C의 또 다른 측정은 pMC(percent of modem carbon)로 알려져 있다. 14C 연대를 이용하는 고고학자 또는 지질학자에 대하여, AD 1950년은 "0의 해(zero years old)"와 같다. 또한, 이는 100 pMC를 나타낸다. 대기 중의 "핵무기 탄소(Bomb carbon)"는 열(thermo)-핵무기의 피크에서 1963년의 통상 수준에 거의 두 배에 다다랐다. 대기권 내의 이의 분포는 이의 출연 이후로 근사화되었으며, AD 1950년 이후로 살아 있는 식물들 및 동물들에 대하여 100 pMC보다 더 큰 값을 나타낸다. 이는 시간이 지나면서 107.5 pMC 부근인 현재의 값으로 점차 감소하였다. 이는 옥수수와 같은 후레쉬한(fresh) 바이오매스 재료가 107.5 pMC 부근의 14C 시그너처(signature)를 제공할 것임을 의미한다. 석유 기반 화합물들은 0의 pMC 값을 가질 것이다. 오늘날의 탄소와 화석 탄소의 조합은 오늘날의 pMC 함량의 희석을 유도할 것이다. 107.5 pMC가 오늘날의 바이오매스 재료의 14C 함량을 나타내고 0 pMC가 석유 기반 생성물의 14C 함량을 나타낸다고 가정함으로써, 재료에 대해 측정된 pMC 값은 두 성분 유형의 비율을 반영할 것이다. 예를 들어, 오늘날의 콩으로부터 100 % 도출된 재료는 107.5 pMC 부근의 방사성탄소 시그너처를 제공할 것이다. 그 재료가 석유 기반 생성물로 50 % 희석되었다면, 이는 약 54 pMC의 방사성탄소 시그너처를 제공할 것이다. 생물학적 기반 탄소 함량은 107.5 pMC와 같은 "100 %"를 할당하고, 0 pMC와 같은 "0 %"를 할당함으로써 도출된다. 예를 들어, 99 pMC로 측정된 샘플은 93 %의 등가의 생물학적 기반 탄소 함량을 제공할 것이다. 이 값은 평균 생물학적 기반 탄소 결과로 지칭되며, 오늘날의 생물학적 재료 또는 석유 기반 재료 중 어느 하나로부터 비롯된 분석된 재료 내의 모든 성분을 가정한다. 본 명세서에서 설명되는 바와 같은 1 이상의 지방족 에스테르를 포함하는 바이오생성물은 적어도 약 50, 60, 70, 75, 80, 85, 90, 95, 96, 97, 98, 99 또는 100의 pMC를 가질 수 있다. 다른 경우에, 본 명세서에서 설명되는 지방족 에스테르 조성물은 약 50 내지 약 100; 약 60 내지 약 100; 약 70 내지 약 100; 약 80 내지 약 100; 약 85 내지 약 100; 약 87 내지 약 98; 또는 약 90 내지 약 95의 pMC를 가질 수 있다. 또 다른 경우에, 본 명세서에서 설명되는 지방족 에스테르 조성물은 약 90, 91, 92, 93, 94 또는 94.2의 pMC를 가질 수 있다.
지방족 에스테르 조성물
지방족 에스테르의 예시들은 지방산 에스테르, 예컨대 FAEE 및 FAME를 포함하는 짧은 사슬형 알코올로부터 도출되는 것들 및 더 긴 사슬형 지방족 알코올로부터 도출되는 것들을 포함한다. 생성되는 지방족 에스테르 및/또는 지방족 에스테르 조성물은 바이오연료(예를 들어, 바이오디젤), 공업용 화학물질, 또는 바이오연료 또는 공업용 화학물질의 성분 또는 이의 공급원료로서 개별적으로 또는 적절히 조합하여 사용될 수 있다. 몇몇 실시형태들에서, 본 발명은, 예를 들어 FAEE, FAME를 포함하는 1 이상의 지방산 에스테르 및/또는 더 긴 사슬형 알코올의 다른 지방산 에스테르 유도체를 포함하는 지방족 에스테르 조성물을 생성하는 방법에 관한 것이다. 관련 실시형태에서, 상기 방법은 FAME, FAEE, 지방산 프로필 에스테르, 지방산 이소프로필 에스테르, 지방산 부틸 에스테르, 모노글리세라이드, 지방산 이소부틸 에스테르, 지방산 2-부틸 에스테르 및 지방산 3차-부틸 에스테르 등을 포함하는(이로 제한되지 않음) 지방족 에스테르 및 지방족 에스테르 조성물을 만드는데 적합한 유전적으로 조작된 생성 숙주를 포함한다.
따라서, 일 실시형태에서, 본 발명은 '377과 같이 야생형 에스테르 신타아제 효소에 의해 생성되는 지방족 에스테르 조성물에 대해 감소된 비율의 베타 하이드록시 에스테르 및 유리 지방산을 포함할 수 있는 지방족 에스테르 조성물을 만드는 방법을 특성화한다. 개선된 지방산 메틸 에스테르 활성을 갖는 변이 '377 폴리펩티드 또는 효소는 증가된 베타 하이드록시 에스테르, 감소된 베타 하이드록실 에스테르, 지방산 에스테르의 증가된 사슬 길이 및 지방산 에스테르의 감소된 사슬 길이를 포함하는(이로 제한되지 않음) 개선된 특성을 갖는다. 상기 방법은 에스테르 신타아제 활성을 갖는 폴리펩티드를 인코딩하는 유전자를 숙주 세포에 발현시키는 단계를 포함한다. 또 다른 실시형태에서, 본 발명은 유리 지방산을 포함할 수 있거나 포함하지 않을 수 있는 지방족 에스테르 조성물을 만드는 방법을 특성화하며, 상기 방법은 에스테르 신타아제 활성을 갖는 Ppro 폴리펩티드를 인코딩하는 유전자를 숙주 세포에 발현시키는 단계를 포함한다. 몇몇 실시예들에서, 에스테르 신타아제 활성을 갖는 티오에스테라아제 폴리펩티드 또는 에스테르 신타아제 폴리펩티드를 인코딩하는 유전자는 각각 EC 2.3.1.75 또는 EC 3.1.2로서 분류되는 효소와, 티오에스테라아제, 에스테르 신타아제, 아실-CoA: 알코올 트랜스아실라아제, 알코올 O-지방산-아실-트랜스페라아제, 아실트랜스페라아제, 및 지방족 아실-coA: 지방족 알코올 아실트랜스페라아제, 또는 이의 적합한 변이체를 포함하는(이로 제한되지 않음), 아실 티오에스테르의 지방족 에스테르로의 전환을 촉진시킬 수 있는 여타의 폴리펩티드로부터 선택된다.
특정 실시예들에서, 숙주 세포의 내인성 티오에스테라아제는, 만약 존재한다면, 변형되지 않는다. 다른 특정 실시예들에서, 숙주 세포는 감쇠된 수준의 티오에스테라아제 활성을 발현시키거나, 티오에스테라아제가 기능적으로 결실된다. 몇몇 실시예들에서, 숙주 세포는 검출가능한 티오에스테라아제 활성을 갖지 않는다. 본 명세서에서 사용되는 바와 같이, "검출가능한"이라는 용어는 존재 또는 존재성이 확인될 수 있음을 의미한다. 예를 들어, 반응물로부터의 생성물의 생성(예를 들어, 특정 유형의 지방산 에스테르의 생성)은 해당 기술분야에 알려져 있거나 본 명세서에 제공된 방법들을 이용하여 검출가능하다. 특정 실시예들에서, 숙주 세포는, 예를 들어 아실-CoA 신타아제와 같이, 감쇠된 수준의 지방산 감성 효소를 발현시키거나, 지방산 감성 효소가 기능적으로 결실된다. 몇몇 실시예들에서, 숙주 세포는 검출가능한 지방산 감성 효소 활성을 갖지 않는다. 특정 실시예들에서, 숙주 세포는 감쇠된 수준의 티오에스테라아제, 지방산 감성 효소, 또는 둘 모두를 발현시킨다. 다른 실시예들에서, 티오에스테라아제, 지방산 감성 효소, 또는 둘 모두가 기능적으로 결실된다. 몇몇 실시예들에서, 숙주 세포는, 티오에스테라아제, 지방산 유도체 효소, 또는 둘 모두의 부재 시, 아실-ACP 또는 아실-CoA를 지방산 및/또는 이의 유도체, 예컨대 에스테르로 전환시킬 수 있다. 대안적으로, 숙주 세포는, 티오에스테라아제, 지방산 유도체 효소, 또는 둘 모두의 부재 시, 유리 지방산을 지방족 에스테르로 전환시킬 수 있다. 특정 실시예들에서, 상기 방법은 숙주 세포 또는 숙주 세포 배양물로부터 지방족 에스테르 조성물, 지방족 에스테르 또는 의 유리 지방산을 격리시키는 단계를 더 포함한다. 본 발명의 바람직한 실시예들에서, 지방산 유도체 조성물은 높은 비율의 지방족 에스테르를 포함한다. 특정 실시예들에서, 지방족 에스테르 또는 지방족 에스테르 조성물은 짧은 또는 긴 사슬형 알코올과 같은 적절한 알코올 기질로부터 도출된다.
일반적으로, 지방족 에스테르 또는 지방족 에스테르 조성물은 숙주 세포의 세포외 환경으로부터 격리된다. 몇몇 실시예들에서, 지방족 에스테르 또는 지방족 에스테르 조성물은 숙주 세포로부터 부분적으로 또는 완전히 동시에 분비된다. 대안적인 실시예들에서, 지방족 에스테르 또는 지방족 에스테르 조성물은, 선택적으로 1 이상의 수송 단백질의 도움으로, 세포외 환경 내로 수송된다. 다른 실시예들에서, 지방족 에스테르 또는 지방족 에스테르 조성물은 세포외 환경 내로 수동적으로 수송된다.
몇몇 실시예들에서, 본 발명은 지방산 에스테르 또는 지방산 에스테르 조성물을 생성하는 방법을 포함하며, 이 조성물은 돌연변이 또는 변이 '377 폴리펩티드의 발현 또는 과발현을 허용하는 조건들 하에서 유전적으로 조작된 숙주 세포를 배양함으로써 감소된 비율의 베타 하이드록시 에스테르 및/또는 유리 지방산을 포함할 수 있다. 대안적인 실시예에서, 본 발명은 지방산 에스테르 또는 지방산 에스테르 조성물을 생성하는 방법을 포함하며, 이 조성물은 돌연변이 또는 변이 '377 폴리펩티드의 발현 또는 과발현을 허용하는 조건들 하에서 유전적으로 조작된 숙주 세포를 배양함으로써 증가된 비율의 베타 하이드록시 에스테르 및/또는 유리 지방산을 포함할 수 있다. 몇몇 실시예들에서, 상기 방법은 지방산 에스테르 또는 지방산 에스테르 조성물의 생성을 허용하는 조건들 하에서 탄소원(예컨대, 탄수화물)을 포함하는 배지에 유전적으로 조작된 숙주 세포를 배양하는 단계를 더 포함하며, 이는 증가 또는 감소된 비율의 베타 하이드록시 에스테르 및/또는 유리 지방산을 포함할 수 있다. 다른 실시예들에서, 본 발명은 지방산 에스테르 또는 지방산 에스테르 조성물을 생성하는 방법을 포함하며, 이 조성물은 에스테르 신타아제 활성을 갖는 Ppro 폴리펩티드의 발현 또는 과발현을 허용하는 조건들 하에서 유전적으로 조작된 숙주 세포를 배양함으로써 유리 지방산을 포함할 수 있다. 몇몇 실시예들에서, 상기 방법은 지방산 에스테르 또는 지방산 에스테르 조성물의 생성을 허용하는 조건들 하에서 탄수화물과 같은 탄소원을 포함하는 배지에 유전적으로 조작된 숙주 세포를 배양하는 단계를 더 포함하며, 이는 유리 지방산을 포함할 수 있다.
몇몇 실시예들에서, 본 발명은 1 이상의 아미노산 치환, 추가, 삽입 및 결실을 갖는 SEQ ID NO: 2의 아미노산 서열을 포함하는 에스테르 신타아제 폴리펩티드를 제공하며, 상기 폴리펩티드는 에스테르 신타아제 활성을 갖는다. 돌연변이 또는 변이 '377 폴리펩티드는 대응하는 야생형 '377 폴리펩티드보다 더 큰 에스테르 신타아제 활성을 갖는다. 예를 들어, 돌연변이 또는 변이 '377 폴리펩티드는 티오에스테르, 예를 들어 지방족 아실-CoA 또는 지방족 아실-ACP의 지방산 및/또는 지방산 유도체로의 전환을 촉진시킬 수 있거나, 이의 개선된 능력을 갖는다. 특정 실시예들에서, 돌연변이 또는 변이 '377 폴리펩티드는 티오에스테라아제 활성, 지방산 감성 효소, 또는 둘 모두의 부재 시, 티오에스테르 기질의 지방산 및/또는 이의 유도체, 예컨대 지방족 에스테르로의 전환을 촉진시킬 수 있거나, 이의 개선된 능력을 갖는다. 예를 들어, 돌연변이 또는 변이 '377 폴리펩티드는, 티오에스테라아제 또는 아실-CoA 신타아제 활성의 부재 시, 지방족 아실-ACP 및/또는 지방족 아실-CoA를 지방족 에스테르로 생체 내에서 전환시킬 수 있다.
다른 실시예들에서, 본 발명은 1 이상의 아미노산 치환, 추가, 삽입 및 결실을 갖는 SEQ ID NO: 51의 아미노산 서열을 포함하는 Ppro 폴리펩티드를 제공하며, 상기 폴리펩티드는 에스테르 신타아제 활성을 갖는다. 특정 실시예들에서, 본 발명의 Ppro 폴리펩티드는 대응하는 야생형 Ppro 폴리펩티드보다 더 큰 에스테르 신타아제 활성을 갖는다. 예를 들어, 에스테르 신타아제 활성을 갖는 본 발명의 Ppro 폴리펩티드는 티오에스테르, 예를 들어 지방족 아실-CoA 또는 지방족 아실-ACP의 지방산 및/또는 지방산 유도체로의 전환을 촉진시킬 수 있거나, 이의 개선된 능력을 갖는다. 특정 실시예들에서, 에스테르 신타아제 활성을 갖는 Ppro 폴리펩티드는, 티오에스테라아제 활성, 지방산 감성 효소, 또는 둘 모두의 부재 시, 티오에스테스테르 기질의 지방산 및/또는 이의 유도체, 예컨대 지방족 에스테르로의 전환을 촉진시킬 수 있거나, 이의 개선된 능력을 갖는다. 예를 들어, 에스테르 신타아제 활성을 갖는 Ppro 폴리펩티드는, 티오에스테라아제 또는 아실-CoA 신타아제 활성의 부재 시, 지방족 아실-ACP 및/또는 지방족 아실-CoA를 지방족 에스테르로 생체 내에서 전환시킬 수 있다.
몇몇 실시예들에서, 돌연변이 또는 변이 '377 폴리펩티드 또는 돌연변이 또는 변이 Ppro 폴리펩티드는 다음의 보존된 아미노산 치환체: 지방족 아미노산, 예컨대 알라닌, 발린, 류신 및 이소류신을 또 다른 지방족 아미노산으로 대체; 세린을 트레오닌으로 대체; 트레오닌을 세린으로 대체; 산성 잔기, 예컨대 아스파르트산 및 글루탐산을 또 다른 산성 잔기로 대체; 아미드기를 지닌 잔기의 대체; 염기성 잔기, 예컨대 리신 및 아르기닌을 또 다른 염기성 잔기로 교체; 및 방향족 잔기, 예컨대 페닐알라닌 및 티로신을 또 다른 방향족 잔기로 대체 중 1 이상을 포함한다. 몇몇 실시예들에서, 돌연변이 또는 변이 '377 폴리펩티드 또는 에스테르 신타아제 활성을 갖는 돌연변이 또는 변이 Ppro 폴리펩티드는 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90 또는 100 이상의 아미노산 치환, 추가, 삽입 또는 결실을 갖는다. 몇몇 실시예들에서, 폴리펩티드 변이체는 에스테르 신타아제 및/또는 아실트랜스페라아제 활성을 갖는다. 예를 들어, 돌연변이 또는 변이 '377 폴리펩티드 또는 돌연변이 또는 변이 Ppro 폴리펩티드는, 기질로서 알코올을 이용하여, 티오에스테르의 지방산 및/또는 지방산 유도체로의 전환을 촉진시킬 수 있다. 비-제한적인 예시에서, 돌연변이 또는 변이 '377 폴리펩티드 또는 돌연변이 또는 변이 Ppro 폴리펩티드는, 예를 들어 메탄올, 에탄올, 프로판올, 이소프로판올, 부탄올, 펜탄올, 헥산올, 헵탄올, 옥탄올, 데칸올, 도데칸올, 테트라데칸올 또는 헥사데칸올과 같은 적합한 알코올 기질을 이용하여, 지방족 아실-CoA 및/또는 지방족 아실-ACP의 지방산 및/또는 지방산 에스테르로의 전환을 촉진시킬 수 있다.
예시들
다음의 특정 예시들은 본 발명을 예시하기 위해 의도된 것이며, 청구항의 범위를 제한하는 것으로 해석되어서는 안 된다. 본 출원인들은 재조합 숙주 세포에서의 지방산 에스테르의 생성을 위해 일-유전자-시스템을 이용하였다. 이는, 증가된 역가 및 수율로 지방족 에스테르 조성물을 생성하기 위해 개선된 에스테르 신타아제 활성을 갖도록 조작된 돌연변이 또는 변이 '377 폴리펩티드를 적합한 숙주 세포에 발현시키는 것을 포함한다. 얻어진 지방족 에스테르 조성물은 FAME뿐만 아니라, 증가 및 감소된 양의 베타 하이드록시 에스테르를 포함한다. 증가된 역가 및 수율로 지방족 에스테르를 생성하기 위해 향상된 에스테르 신타아제 활성을 갖는 Ppro 폴리펩티드를 만들기 위해 동일한 전략이 사용되었다.
프로토콜들:
모든 프로토콜은 96 웰 플레이트(96 well plates), 배양물을 성장시키기 위한 2mL 마스터 블록(Greiner Bio-One, Monroe, NC 또는 Corning, 암스테르담, 네덜란드), 및 배양액으로부터 지방산 종을 추출하기 위한 코스타 플레이트(Costar plates)를 이용한다. 아래의 프로토콜들은 발효 조건을 포함하며, 지방산 종의 생성을 평가하는데 사용될 수 있다. 또한, 지방산 종의 생성을 평가하기 위해 대안적인 프로토콜들이 사용될 수 있다.
프로토콜 1(FA4P, 32 ℃):
96 웰 플레이트에서 성장된 LB 배양물로부터: 270 μL FA2P(표 4)를 주입(inoculate)하는데 30 μL LB 배양물이 사용되었으며, 이는 이후 32 ℃ 진탕기에서 약 16 시간 동안 배양되었다. 하룻밤이 지난 종자(overnight seed)의 30 μL가 이후 300 μL FA4P + 2%MeOH + 1mM IPTG(표 4)를 주입하는데 사용되었다. 이후, 배양물이 아래에 자세히 설명된 표준 추출 프로토콜(프로토콜 5)에 따라 추출되었을 때, 이 배양물은 24 시간 동안 32 ℃ 진탕기에서 배양되었다.
프로토콜 2(BP3G2P, 32 ℃):
라이브러리 글리세롤 스톡(Library glycerol stocks)이 해동되었고, 10 μL이 96-쉘로우-웰 플레이트(96-shallow-well plates)의 150 μL LB + 100 ㎍/mL 스펙티노마이신으로 전달되었으며, 이는 20 시간 동안 32 ℃에서 배양되었다. 이 배양물의 20 μL는 280 μL BSlG4P 배지(표 4)를 주입하는데 사용되었고, 이는 20 시간 동안 32 ℃에서 250 rpm으로 진탕되어 배양되었다. 이 배양물의 20 μL는 380 μL BP3G2P 배지(표 4)를 주입하는데 사용되었다. 배양물이 아래에 자세히 설명된 표준 프로토콜에 따라 나일 레드 분석법(nile red assay)을 거치거나 아래에 자세히 설명된 표준 추출 프로토콜(프로토콜 5)에 따라 추출되었을 때, 이 배양물은 24 시간 동안 32 ℃에서 진탕되어 배양되었다.
프로토콜 3(FA2, 32 ℃):
96 웰 플레이트에서 성장된 LB 배양물로부터: 270 μL FA2를 주입하는데 LB 배양물의 30 μL가 사용되었고, 이는 이후 진탕기 상에서 32 ℃로 약 16 시간 동안 배양되었다. 하룻밤이 지난 종자의 30 μL가 이후 300 μL FA2 + 2%MeOH + 1mM IPTG를 주입하는데 사용되었다. 이후, 배양물이 아래에 자세히 설명된 표준 추출 프로토콜(프로토콜 5)에 따라 추출되었을 때, 이 배양물은 24 시간 동안 진탕기 상에서 32 ℃로 배양되었다.
프로토콜 4(FA2P, 32 ℃):
96 웰 플레이트에서 성장된 LB 배양물로부터: 270 μL FA2P를 주입하는데 30 μL LB 배양물이 사용되었고, 이는 이후 32 ℃ 진탕기에서 약 16 시간 동안 배양되었다. 하룻밤이 지난 종자의 30 μL가 이후 300 μL FA2P + 2%MeOH + 1mM IPTG를 주입하는데 사용되었다. 이후, 배양물이 아래에 자세히 설명된 표준 추출 프로토콜(프로토콜 5)에 따라 추출되었을 때, 이 배양물은 24 시간 동안 32 ℃ 진탕기에서 배양되었다.
프로토콜 5(지방산 종 표준 추출):
각각의 웰에 40 μL 1M HCl이 추출되게 하기 위해, 이후 내부 표준으로서 500 mg/L C11-FAME을 갖는 300 μL 부틸 아세테이트가 첨가되었다. 96 웰 플레이트는 이후 플레이트 실러(plate sealer)(ALPS-300; Abgene, Thermo Scientific, Rockford, IL)를 이용하여 열-융착되었고(heat-sealed), MixMate(Eppendorf, Hamburg, Germany)를 이용하여 2000 rpm으로 15 분 동안 진탕되었다. 진탕 후, 상기 플레이트는 실온에서 4500 rpm으로 10 분 동안 원심분리되어(Allegra X-15R, rotor SX4750A, Beckman Coulter, Brea, CA), 수성 및 유기 층들을 분리하였다. 유기 층의 50 μL는 96 웰 플레이트(96-well plate, polypropylene, Corning, Amsterdam, The Netherlands)로 전달되었다. 상기 플레이트는 열-융착된 후, 표준 자동화 방법들을 이용함으로써 GC-FID에 의해 평가될 때까지 -20 ℃로 저장되었다.
프로토콜 6(지방산 종 표준 나일 레드 분석법):
24 시간 발효 후, 나일 레드 분석법은 Greiner MicrolonFluotrac 200 플레이트에서 (1 ㎍/mL 나일 레드의 최종 분석 농도에 대해) 84.6 % 물 및 15.4 % 아세토니트릴 용액의 1.54 ㎍/mL 나일 레드의 130 μL에 70 μL의 발효액을 첨가함으로써 수행되었으며, 위아래로 피펫팅(pipetting)함으로써 혼합되었다. 상대 형광 단위(Relative fluorescence units)는 SpectraMax M2를 이용하여 630 nm의 방출(emission) 및 540 nm의 여기(excitation)에서 측정되었다.
프로토콜 7(포화 라이브러리를 구축):
해당 기술분야의 당업자에게 알려진 표준 기술들은 포화 라이브러리를 준비하는데 사용되었다. 예를 들어, 벡터 골격(vector backbone)은 벡터의 제한 엔도뉴클레아제(restriction endonucleases)를 이용함으로써 조제될 수 있는 한편, DNA 삽입체의 다양한 생성(creation of diversity)은 변성 프라이머(degenerate primers)를 이용하여 생성될 수 있다. 예를 들어, 다양성을 갖는 DNA 삽입체 및 벡터 골격의 클로닝은 제조업체의 프로토콜에 따라 InFusion Cloning System(Clontech Laboratories, Inc., Mountain View, CA)을 이용하여 수행될 수 있다.
프로토콜 8(조합 라이브러리를 구축):
유익한 것으로 식별된 돌연변이들은 지방산 종 또는 FAME의 생성 시 Ppro 또는 377 변이체에 추가 개선을 제공하도록 조합되었다. 해당 기술분야의 당업자에게 알려진 표준 기술들은 조합 라이브러리를 준비하기 위해 사용되었다. 예를 들어, 벡터 골격은 벡터의 제한 엔도뉴클레아제를 이용함으로써 조제될 수 있는 한편, DNA의 삽입체의 다양한 생성은 원하는 돌연변이를 도입하기 위해 프라이머를 이용하여 생성될 수 있다. 예를 들어, 다양성을 갖는 DNA 삽입체 및 벡터 골격의 클로닝은 제조업체의 프로토콜에 따라 InFusion Cloning System(Clontech Laboratories, Inc., Mountain View, CA)을 이용하여 수행될 수 있다. 예를 들어, 조합 라이브러리는 tPCR(transfer PCR) 프로토콜을 이용하여 생성될 수 있다(Erijman 외, 2011. J Structural Bio.175, 171-177).
프로토콜 9(라이브러리 스크리닝):
라이브러리 다양성이 포화 라이브러리 또는 조합 라이브러리에 생성되었으면, 이는 앞서 설명된 방법들(프로토콜 1 내지 4) 중 하나를 이용하여 스크리닝되었다. 에스테르 신타아제 변이체를 스크리닝할 때, 세 가지 유형의 히트들이 식별되었다: (1) 증가된 지방산 에스테르 종 역가("FAS" 역가); (2) 증가된 양의 생성된 FAME; 예를 들어 C14-FAME; 및/또는 (3) 감소된 양의 생성된 베타 하이드록실 에스테르. 각 히트 내의 '377 변이체의 돌연변이는 해당 기술분야의 당업자에 의해 통상적으로 이용되는 표준 기술들을 이용하여 서열화함으로써 식별되었다. 각 히트 내의 '377 변이체의 돌연변이는 해당 기술분야의 당업자에 의해 통상적으로 이용되는 표준 기술들을 이용하여 서열화함으로써 식별되었다. 표 1 및 표 2는 포화 라이브러리에 유익한 것으로 식별된 돌연변이("히트")를 목록화한 것이고, 표 5는 조합 라이브러리에 유익한 것으로 식별된 돌연변이("히트")를 목록화한 것이다. Ppro 변이체를 스크리닝할 때, 두 가지 유형의 히트들이 식별되었다: (1) 증가된 지방산 에스테르 종; (2) 생성된 FAME 양의 증가. 각 히트 내의 Ppro 변이체의 돌연변이는 관련 기술분야의 당업자에 의해 통상적으로 이용되는 표준 기술들을 이용하고 서열화함으로써 식별되었다. 표 8 내지 표 11은 포화 라이브러리에 유익한 것으로 식별된 돌연변이("히트")를 목록화한 것이고, 표 12 내지 표 14는 조합 라이브러리에 유익한 것으로 식별된 돌연변이("히트")를 목록화한 것이다.
예시 1
템플릿으로서 WS377을 이용하여 준비된 포화 라이브러리
마리노박터 하이드로카보노클라스티쿠스("'377")로부터의 에스테르 신타아제의 전체 포화 라이브러리는 야생형 WS377(프로토콜 7)을 넘어서는 개선을 나타낸 변이체에 대해 구축되고 스크리닝되었다. 전체 포화 라이브러리를 만드는데 사용된 플라스미드는 SEQ ID NO: 1(즉, WS377의 야생형 핵산 서열)을 발현시킨 pKEV027로 지정되었다. 전체 포화 라이브러리는, (FadE의 결실을 통해) 베타 산화를 막고(block), 표준 조작 기술들(standard manipulation techniques)을 통해 다수의 지방산 생합성 경로 효소(예를 들어, FabA, FabB, FabF, FabG, FabI, FabH, FabV, FabZ, accABCD)를 과발현시키도록 조작된 대장균 균주(BD64)에서 스크리닝되었다. 상기 라이브러리는 앞서 설명된 표준 프로토콜(프로토콜 1 및 2) 중 하나를 이용하여 스크리닝되었다. 개선점들은 근본적으로(originally) FAME의 역가를 개선하거나, FAME 역가에 반드시 영향을 주지는 않으면서 베타 하이드록시 에스테르(본 명세서에서 "β-OH 에스테르" 또는 "β-OH FAME" 또는 "베타-OH" 또는 "베타-하이드록시"라고도 함)의 비율을 감소시키는 것으로 분류되었다. 스크리닝 포화 라이브러리에 기인한 결과들은 아래의 표 1 및 표 2에 나타나 있다. 표 1은 템플릿(SEQ ID NO: 1)으로서 '377을 이용할 때 돌연변이 모두가 증가된 지방족 에스테르 역가를 나타낸 돌연변이들에 대한 결과들을 나타낸다. 표 2는 템플릿으로서 '377을 이용하여 % β-OH FAME의 감소를 야기한 돌연변이에 대한 결과들을 나타낸다. 특히, 몇몇 돌연변이체들은 FAME의 증가된 역가와 β-OH FAME의 감소 둘 모두를 나타내었으며, 이는 원하는 최종 생성물이 주로 FAME인 경우에 유익하다. 몇몇 돌연변이체들은 FAME의 증가된 역가와 β-OH FAME의 증가를 나타내었다. 또한, 몇몇 돌연변이체들은 짧은 사슬형 에스테르의 증가 또는 감소를 유도하였다.
아래의 표 1에서 알 수 있는 바와 같이, '377 포화 라이브러리로부터의 돌연변이는 모든 돌연변이체의 증가된 지방족 에스테르 역가와 상호관련된 한편, 짧은 사슬 길이 에스테르 및 β-OH 에스테르의 생성은 돌연변이체에서 돌연변이체로 변화하였다. 예를 들어, 위치 15에서 아미노산의(세린을 글리세린으로의) 치환은 총 FAME 역가를 기준치 1에서 2.402로 변화시켰다. 따라서, 역가는 기준치(즉, 야생형)에 비해 2.4 배(fold) 증가하였다. 이 특정한 돌연변이체에서, β-OH 에스테르는 약 2.66 배 증가하였다. 16의 탄소 사슬 길이를 갖는 에스테르에 대해 14의 탄소 사슬 길이를 갖는 에스테르의 생성은 기준치(즉, 야생형)에 비해 1.48 배 증가하였다. 한편, 아미노산 위치 393의(글루타메이트를 글리신으로의) 치환은 FAME 역가를 2.3 배 증가시켰고, β-OH 에스테르를 대조군의 70 %로 감소시킨 한편, C14/C16 에스테르 생성은 거의 동일하게 유지되었다.
상기 표들의 몇몇 돌연변이들은 별, 예를 들어 *474Y를 가지며, 이는 종결 코돈(stop codon)을 가짐을 의미한다.
본 출원인들은 변이 돌연변이 핵산 서열들 중 하나(즉, SEQ ID NO: 28)에서 24 bp 반복(repeat)을 발견하였다. 24 bp 반복은 핵산 영역 ATGAAACGTCTCGGAACCCTGGAC(SEQ ID NO: 27)의 중복(duplication)이며, ATG 시작 코돈 이전에 유전자의 시작점에 위치된다. 따라서, SEQ ID NO: 28은 SEQ ID NO: 29의 아미노산 서열에 대해 코딩된 변이 '377 핵산 서열이다[이 서열은 비-추가 돌연변이(no additional mutations)와 조합된 SEQ ID NO: 1 및 SEQ ID NO: 27의 결과임]. SEQ ID NO: 29는 표 1에 나타낸 바와 같이 놀라울 정도로 양호한 역가를 제공하였다. 하지만, 템플릿 서열로서 SEQ ID NO: 29를 포함한 2 개의 추가 돌연변이체가 검출되었으며(그 안에 추가 돌연변이를 가짐), 돌연변이는 역가를 훨씬 더 증가시켰다(표 1 참조) [돌연변이의 넘버링(numbering)은 24 bp 반복을 포함하지 않음]. 특히, 24 bp 반복은, 숙주 균주에 SEQ ID NO: 29를 발현시켰을 때 얻어진 역가를 나타낸 표 1에 나타낸 바와 같이, % 베타-OH FAME 및 FAS의 역가의 증가를 야기하였다.
아래의 표 2에서 알 수 있듯이, '377 포화 라이브러리로부터의 돌연변이들 중 몇몇은 % β-OH FAME의 감소와 상호관련된 한편, (위의) 표 1에 비해 더 적은 정도로 더 타이트하게(tighter to a lesser degree) 총 FAME을 여전히 증가시켰다. 하지만, 몇몇 돌연변이체들은 % β-OH FAME을 상당히 감소시킨 한편, 총 FAME 역가를 여전히 상당히 증가시켰다.
예시 2
템플릿으로서 WS377을 이용하여 준비된 조합 라이브러리
조합 라이브러리를 준비하기 위해 표준 기술들이 이용되었다(프로토콜 8). 조합 라이브러리에서 테스트된 돌연변이들(표 3A 및 표 3B)은 근본적으로 (예시 1에 설명된 바와 같이) '377의 전체 포화 라이브러리에서 식별되었다. 조합 라이브러리를 만드는데 사용된 플라스미드는 pKEV38이었고, 이는 pKEV027로부터 accABCD_birA를 제거함으로써 구성되었다. 이론에 의해 한정되지 않고, accABCD_birA의 제거는 생합성 경로의 지방산의 중간 레벨을 감소시켜, 기질에 대한 돌연변이 효소의 친화성(affinity)이 더 쉽게 검출가능할 것으로 여겨진다. 세포들은 2NBT + 나일 레드 한천(Nile Red agar)(표 4) 상에서 평판배양되었다(plated). 콜로니는 580 nm 내지 620 nm에서 허용되는 앰버 필터(amber filter) 및 400 nm 내지 500 nm의 여기 범위(excitation range)에서 Dark Reader DR88X Transilluminator를 이용하여 관찰되었고, LB+ 100 ㎍/mL 스펙티노마이신으로 엄선되었으며(handpicked), 하룻밤 성장되었고, 앞서 설명된 표준 프로토콜(프로토콜 1 및 2) 중 하나를 이용하여 스크리닝되었다. 도 4에 도시된 바와 같이, 이 라이브러리부터의 변이체들 중 하나는 대조군(BD64/pKEV038, SEQ ID NO: 2)에 비해 FAS의 급격한 증가를 나타내었다. 도 4는 조합 라이브러리 히트들의 평판 발효의 결과를 나타낸다. 수개의 라이브러리 히트들은 '377 변이체들이 FAS의 높은 생성을 지지할 수 있음을 나타낸 대조군(즉, BD64/pKEV038)보다 뛰어났다. (SEQ ID NO: 14의 변이 '377을 발현시키는) pSHU1O이라는 명칭을 갖는 최고 생성 변이체(highest-producing variant)의 플라스미드가 격리되었고, 후속 조합 라이브러리를 위해 템플릿으로서 사용되었다.
조합 라이브러리는 표준 프로토콜(프로토콜 1 및 2; 위 참조) 중 하나를 이용하여 (위의) 균주 BD64에 스크리닝되었다. 스크리닝 '377 조합 라이브러리에 기인한 결과들은 표 5에 나타나 있다.
아래의 표 3A는 조합 라이브러리의 제 1 라운드(round)에 도입된 아미노산 치환체들을 나타낸다.
아래의 표 3B는 조합 라이브러리의 제 2 라운드에 도입된 아미노산 치환체들을 나타낸다.
아래의 표 4는 사용된 배지명 및 제제를 나타낸다.
아래의 표 5는 pSHUlO에 대한 돌연변이(이는 돌연변이 T5S, S15G, P111S, V171R, P188R, F317W, S353T, V409L, S442G를 포함함) 및 정규화된(normalized) GC-FID 결과들을 나타내는 2차 스크린(secondary screen)을 나타낸다. 나타낸 결과들은 대조군(즉, pSHUlO, SEQ ID NO: 14)에 대한 것이다. 표의 각 라인은 만들어진 상이한 조합 돌연변이체를 나타낸다. 모든 돌연변이체는, 이러한 돌연변이체가 생성된 총 FAME, 생성된 총 FAS, 생성된 퍼센트 FAME, 또는 (C12/C14 또는 C14/C16 사슬 길이를 갖는) 최종 조성물의 에스테르 종, 또는 이러한 특성들의 조합 중 어느 하나에 영향을 준다는 점에서, 별개의 특성들을 갖는 것으로 측정되었다. 표 5에서 알 수 있는 바와 같이, 몇몇 돌연변이체들은 그들의 특성과 관련하여 다른 돌연변이체들과 유사하게 행동하였다.
예를 들어, 아래의 표 5의 첫 번째 줄에 나타낸 바와 같이, 돌연변이 A190P, N302G, T313S 및 Q348R을 포함하는 돌연변이체는 더 높은 퍼센트 FAME(및 β-OH FAME의 감소)을 생성하였고, 또한 C14/C16 사슬 길이 에스테르의 생성을 증가시켰으며, 이는 최종 생성물의 C16 에스테르보다 더 많은 C14 에스테르를 생성하였음을 의미한다. 이는, 더 짧은 사슬형 에스테르가 바이오디젤을 포함하는 다수의 생성물에 사용될 수 있기 때문에 바람직하다. 또한, 이 결과는 본 출원인들이 최종 조성물의 에스테르 종의 최종 사슬 길이를 변경할 수 있었음을 보여준다.
다음의 돌연변이들의 조합들은 여기에 나타낸 결과들에 관한 것이며; 그들의 성능은 대조군(pSHUlO; SEQ ID NO: 14)에 대한 것이다. KASH008(SEQ ID NO: 16)은 % FAME을 1.4 배 증가시킨 한편, 역가를 1.06 배 증가시켰다. KASH032(SEQ ID NO: 18)는 % FAME을 1.29 배 증가시킨 한편, 역가에 영향을 주었다. KASH040(SEQ ID NO: 20)은 % FAME을 1.16 배 증가시킨 한편, 역가는 대조군의 0.91 배 감소하였다. KASH078(SEQ ID NO: 26)은 % FAME을 1.25 배 증가시킨 한편, 역가를 대조군의 0.76으로 감소시켰다. KASH060(SEQ ID NO: 22) 및 KASH061(SEQ ID NO: 24)은, 이들이 % FAME에 영향을 줄 뿐만 아니라, C12/C14(KASH060에 대해 6.8 배 및 KASH061에 대해 3.1 배) 및 C14/C16(KASH060에 대해 4.0 배 및 KASH061에 대해 3.2 배)의 증가로 나타낸 바와 같이 훨씬 더 짧은 에스테르 사슬 생성물을 생성하였기 때문에, 특히 중요하다.
예시 3
유익한 특성들을 갖는 에스테르 신타아제 돌연변이 균주들
예시 1 및 예시 2에 설명된 바와 같이, '377의 다수의 변이 또는 돌연변이 형태들이 유익한 특성들을 갖는 것으로 식별되었다. 이 실험에서, 본 명세서에 9B12(SEQ ID NO: 4)로 지정된 특정 '377 돌연변이체[이는 야생형 377에 대하여 3 개의 상이한 돌연변이(D7N, A179V, V381F)를 포함함]는 pKEV027로 클로닝되었고, 야생형 '377 폴리펩티드(SEQ ID NO: 2)에 대해 야생형 '377 유전자(SEQ ID NO: 1) 코딩을 대체하였으며, pKEV018을 생성하였다. (위의) 균주 BD64로 형질전환되었을 때, 균주 KEV040이 생성되었다. 플라스미드 pKEV018은 유전자의 코돈에서 포화 돌연변이유발을 이용하여 더욱 돌연변이되어 플라스미드 pKEV022를 생성하였으며, 이는 야생형 '377(D7N, A179V, Q348R, V381F)에 대하여 4 개의 상이한 돌연변이를 포함한다. 별도로, 이전에 식별된 수 개의 돌연변이들은 pKEV018 플라스미드와 조합되어, 플라스미드 pKEV028[이는 야생형 '377에 대하여 8 개의 돌연변이(D7N, R87R "잠재 돌연변이(silent mutation)", A179V, V187R, G212A, Q357V, V381F, M443G)를 포함함]을 생성하였다. pKEV022 및 pKEV028은 균주 BD64로 형질전환되었으며, 이는 균주들이 각각 KEV075(SEQ ID NO: 10) 및 KEV085(SEQ ID NO: 12)로 지정되게 하였다. 이러한 돌연변이 균주들이 관찰되어, FAME 역가의 상당한 증가 또는 "β-OH" FAME의 비율의 감소 또는 둘 모두를 생성하였다(예를 들어, 돌연변이 균주들 9B12 및 KEV085가 둘 모두를 달성하였다).
균주 KEV080(BD64/pKEV027); KEV040; KEV075 및 KEV085는 앞서 설명된 표준 프로토콜(프로토콜 1 및 2) 중 하나를 이용하여 스크리닝되었다. 도 5는 야생형 '377 에스테르 신타아제를 함유한 균주에 비행 돌연변이 균주 KEV040, KEV075 및 KEV085의 상대 FAME 역가 및 % β-OH FAME을 나타낸다. 여기서, 도 5는 이러한 3 개의 변이체들이 대조군(야생형)보다 훨씬 더 높은 역가 FAME을 갖는 것으로 것으로 관찰되었고; % β-OH FAME이 하나의 변이체에서 또 다른 변이체로 변동하였으며; 균주 9B12(KEV040) 및 KEV085가 대조군(야생형)보다 낮은 % β-OH FAME을 생성하였음을 예시한다.
예시 4
변이 '377 에스테르 신타아제 및 변이
Ppro
를 발현시키도록 조작된
재조합 숙주 세포에 의한 에스테르 생성
예시 1, 2 및 3에 입증된 바와 같이, 마리노박터 하이드로카보노클라스티쿠스(WS377)로부터의 에스테르 신타아제는 더 높은 수준의 지방산 에스테르 및 더 낮은 비율의 β-OH 에스테르를 생성하도록 조작되었다. 본 발명을 수행하는데 있어서, 야생형 WS377(SEQ ID NO: 1)은, 아실 ACP로부터 직접 더 높은 수준의 FAME을 생성하는, 9B12와 같은 새로운 균주를 유도하도록 조작되었다.
포토박테리움 프로푼둠(Ppro)의 'tes A는 에스테르 신타아제 활성을 갖도록 조작되었다. 플라스미드 pBD207의 Ppro Vc7P6F9(SEQ ID NO: 31)의 하나의 변이체는(본 명세서에서 becos.128로서 지정된) BD64에서 테스트되었다. 유사하게, pKEV18의 '377(SEQ ID NO: 4)의 9B12 변이체는 (본 명세서에서 KEV040으로서 지정된) BD64에서 테스트되었다. becos.128(BD64/pBD207) 및 KEV040(BD64/pKEV018)의 배양물은 2 % 알코올을 갖는 최소 배지에서 테스트되었다. 약 24 시간 동안의 생성 후, 이는 추출되었고, (상기에 나열된 프로토콜에 따라) 지방족 아실 에스테르의 식별을 위해 GC/FID 또는 GC/MS에 의해 분석되었다.
도 6은, 메탄올, 에탄올, 1-프로판올, 이소프로판올, 1-부탄올 또는 글리세롤이 공급되었을 때, KEV040으로부터의 지방족 아실 에스테르(M. 하이드로카보노클라스티쿠스로부터의 에스테르 신타아제)(도 6에서 왁스로서 나타냄) 및 becos.128로부터의 지방산 종(P. 프로푼둠의 'tes A)(도 6에서 Ppro로서 나타냄)의 생성을 나타낸다. 음성 대조군으로서, 물이 첨가되었다(외인성 알코올의 결여는 여하한의 에스테르 생성이 대장균에 의한 알코올의 내인성 생성에 의존할 것임을 의미한다). 유리 지방산은 KEV040에 의해 생성된 한편, becos.128은 지방산 에스테르 및 지방산의 혼합물을 생성하였다. 도 8은 becos.128에 의해 생성된 지방산 및 지방산 에스테르의 양을 나타낸다. Holtzapple 및 Schmidt-Dannert(Journal of Bacteriology (2007) 189(10):3804-3812 참조)에 제시된 생체 외 결과는, M. 하이드로카보노클라스티쿠스('377)로부터의 에스테르 신타아제가 일차적으로 왁스를 생성하는 더 긴 사슬형 알코올에 대해 선호도를 갖는다는 것을 나타내었음을 유의한다. Holtzapple 데이터는 '377이 더 짧은 사슬형 알코올을 이용할 수 없음을 암시한다. 대조적으로, 본 출원인들의 작업은 생체 내에서 수행되었으며, 변이 '377 효소가 더 짧은 사슬형 알코올(C1, C2, C3 및 C4)을 이용할 수 있도록 조성되었음에 따라, 다양한 값진 생성물들(예를 들어, 바이오디젤, 계면활성제 등)에 사용될 수 있는 더 짧은형 사슬 에스테르를 유도하였다. 본 출원인들은 아실-ACP을 기질로서 사용하였고, 이는 무익 회로의 관련성의 감소를 가져올 것으로 여겨진다(즉, 세포가 더 에너지 효율적이게 함). 또한, 본 출원인들은 모든 알코올이 위치 1에 OH기를 가져야 할 필요가 없음을 나타내었으며, 예를 들어 프로판올에 대한 OH기는 위치 1 또는 2에 존재할 수 있다. 도 6은 단일 변이 '377 에스테르 신타아제를 발현시키기 위해 유전적으로 변형된 재조합 숙주 세포를 이용하여 다양한 사슬 길이를 갖는 지방족 아실 에스테르의 생성을 나타낸다. 이 결과는 P. 프로푼둠(Ppro)의 'tes A의 변이체 및 '377 에스테르 신타아제의 변이체 둘 모두의 조작된 형태에 대해 관찰되었다. 조작된 돌연변이들은 1차 알코올뿐만 아니라 2차 알코올을, FAME, FAEE, 지방족 아실 모노글리세라이드 등을 포함하는 여러 상이한 생성물들로 전환시킬 수 있음을 주목한다. 재조합 박테리아, 효모, 조류 또는 다른 숙주 세포가 지방족 에스테르의 생성에 사용될 수 있다.
예시 5
조합 돌연변이를 발현시키는 에스테르 신타아제 돌연변이 균주
해당 기술분야의 당업자에게 알려진 표준 기술들은 조합 라이브러리(프로토콜 8)를 준비하는데 이용되었다. 조합 라이브러리에서 테스트된 돌연변이(표 3A 및 표 3B)는 근본적으로 (예시 1에 설명된 바와 같이) '377의 전체 포화 라이브러리에서 식별되었다.
조합 라이브러리는 BD64와 유사한 균주 GLPH077에서 스크리닝되었지만, (위의) 표준 프로토콜(프로토콜 1 및 2) 중 하나를 이용하여 다소 상이한 수준의 생합성 경로 효소(위 참조)를 발현시켰다. 스크리닝 pKASH008(SEQ ID NO: 16) 조합 라이브러리에 기인한 결과들은 표 6에 나타나 있다. 표 6에서 알 수 있는 바와 같이, 결과적인 '377 에스테르 신타아제 변이체는 야생형 377에 비해 24 개의 돌연변이를 가졌다. 2 개의 균주, KASH280(SEQ ID NO: 33) 및 KASH281(SEQ ID NO: 35)은 변이 '377을 테스트하는데 사용되었다. 하지만, KASH280은 1 개의 치환 돌연변이에 의해 KASH280에 발현된 것과 상이한 '377 변이체를 발현시켰다. KASH280은 위치 348에서의 글루타민이 아르기닌(Q348R)으로 교체된 '377 변이체를 발현시켜, 균주가 더 높은 역가 FAME 및 더 많은 수의 짧은 사슬형 에스테르를 생성하게 하였다. 반대로, KASH281은 위치 349에서의 리신이 히스티딘(K349H)으로 교체된 '377 변이체를 발현시켜, 균주가 KASH008에 비해 더 낮은 역가 FAME을 생성하게 하였다. 또한, KASH281은 KASH280에 비해 더 낮은 역가의 FAME 및 더 적은 수의 짧은 사슬형 에스테르를 생성하였다. 전반적으로, 비교는 KASH008에 대해 수행되며, 이는 pSHU10보다 더 양호하고, 이는 야생형보다 더 양호하다(상기의 예시들을 참조).
예시 6
자연적 다양성(Natural Diversity)으로부터 유익한 특성을 갖는 에스테르 신타아제 돌연변이 균주들
예시 1 및 예시 2에 설명된 바와 같이, '377의 다수의 변이 또는 돌연변이 형태들이 유익한 특성을 갖는 것으로 식별되었다. 표준 정렬 절차를 이용하여 마리노박터 하이드로카보노클라스티쿠스 DSM 8798(SEQ ID NO: 2)로부터 하나를 갖는 마리노박터 종 ELB17(ZP_01736818.1, SEQ ID NO: 49), 마리노박터 알기콜라 DG893(ZP_01893763.1, SEQ ID NO: 47), 마리노박터 아드하에렌스 HP15(YP_005886638.1, SEQ ID NO: 45)와 같은 상이한 마리노박터 유기체로부터의 에스테르 신타아제 폴리펩티드의 정렬이 자연적으로 이미 존재하는 돌연변이를 식별하는데 사용되었는데, 이는 자연적으로 다양성을 갖는 아미노산 위치뿐만 아니라 특정 돌연변이를 나타냄에 따라, 변이 단백질을 안정화하는데 사용될 수 있을 것이다. 이러한 정렬이 수행되었으며, 분석은 에스테르 신타아제 상동 폴리펩티드 내의 자연적 다양성을 식별하였다. 아래의 표 7은 이러한 돌연변이 그룹을 일목요연하게 나타낸다. 이러한 돌연변이가 마리노박터 하이드로카보노클라스티쿠스로부터의 조작된 에스테르 신타아제와 조합될 때, 유익한 변이체는 이것이 앞서 설명된 표준 프로토콜(프로토콜 1 및 2) 중 하나를 이용하여 스크리닝된 경우에 관찰될 수 있다. 이러한 변이체의 예로서 SEQ ID NOS: 37, 39, 41 및 43을 들 수 있다.
아래의 표 7은 마리노박터 하이드로카보노클라스티쿠스, M. 아드하에렌스, M. 알기콜라 및 M. sp. ELB17을 정렬시킴으로써 관찰된 자연적 다양성의 리스트를 나타낸다.
예시 7
P.
프로푼둠
(
Ppro
)의
'tes A
의 조작
P. 프로푼둠(Ppro)의 'tes A는 에스테르 신타아제로서 작용하도록 조작되었다. 96 웰 플레이트에서 스크리닝되었을 때, 야생형 Ppro는 총 아실 생성물(FAME + 유리 지방산)의 약 15 내지 18 % FAME을 생성하였다. 변이체가 96 웰 플레이트 상에서 테스트되었을 때 FAME 함량을 42 내지 44 %로 증가시킨 돌연변이가 식별되었다. 동일한 돌연변이체가 진탕 플라스크에서 테스트되었을 때, 돌연변이체는 야생형 효소에 의해 생성된 30 % FAME에 비해 62 내지 65 % FAME을 생성하였다. 오류 빈발 PCR 또는 Ppro의 포화 라이브러리(프로토콜 7)와 같은 표준 기술들에 기초하여 돌연변이가 식별되었다. 식별된 돌연변이는 조합되었고 조합 라이브러리를 생성하였으며, 이 또한 테스트되었다. 이후, 상기 라이브러리는 앞서 설명된 표준 프로토콜(프로토콜 1 내지 4) 중 하나를 이용하여 스크리닝되었다.
조합 라이브러리의 스크리닝에 기초하여, 돌연변이는 (1) 조합 라이브러리 스크리닝의 다음 라운드에 대해 고정되거나; (2) 조합 라이브러리 스크리닝의 다음 라운드에서 다시 테스트되거나; 또는 (3) 그때 추가로 테스트되지 않도록 선택되었다. 유익한 것으로 식별된 돌연변이는 향후 라이브러리에 대해 고정되었다. 이러한 프로세스는 96 웰 플레이트, 96 웰 플레이트의 검증(validation) 및 진탕 플라스크의 후속 검증(follow-up validation)을 이용하여 스크리닝함으로써 수행되었다.
이후, 진탕 플라스크의 최적의 퍼모머(best performers)는 스케일-업(scale-up)과 일치하는 조작된 Ppro의 개선이 존재함을 증명하기 위해 발효기(fermenters)에서 테스트될 수 있다. 조합 라이브러리로부터의 최상부 히트들 중 몇몇은, Ppro 변이체가 그 96 웰 플레이트보다 더 큰 스케일에서 개선된 성능을 갖는 것을 확인하기 위해 진탕 플라스크에서 테스트될 수 있다. 진탕 플라스크 검증은 다음과 같이 수행될 수 있다. 원하는 돌연변이체들은 단일 콜로니를 얻기 위해 LB + 스펙티노마이신 한천 상에 선조접종되며(streaked), 37 ℃에서 하룻밤 배양된다. 각각의 돌연변이체로부터의 3 개의 단일 콜로니는 4 mL LB + 스펙티노마이신 내에 넣고, 약 6 시간 동안 37 ℃ 진탕기에서 배양되었다. LB 배양물의 1.5 mL는 배플 125 mL 플라스크(baffled 125 mL flask)에 15mL FA2(2g/L NH4C1) + 0.05 % 트리톤 X-100 + 스펙티노마이신을 주입하는데 사용되며, 32 ℃에서 하룻밤 배양된다. 하룻밤 배양물의 3 mL는 배플 125 mL 플라스크에 15 mL FA2(2g/L NH4C1) + 0.05 % 트리톤 X-100 + 1 mM IPTG, 2 % 메탄올 + 스펙티노마이신을 주입하는데 사용되며, 32 ℃에서 약 24 시간 동안 배양된다. 추출 시, 배양물의 300 μL가 플라스크로부터 96 웰 플레이트 내로 샘플링되고, 표준 추출 프로토콜(프로토콜 5)을 이용하여 추출된다.
표준 추출 프로토콜은 앞서 설명된 바와 같이 수행되었다(프로토콜 5). 스크리닝된 포화 라이브러리에 기인한 결과들은 표 8 내지 표 11에 나타나 있다. 표 8은 템플릿(즉, SEQ ID NO: 51)으로서 야생형을 이용하여 발견된 유익한 단일 돌연변이에 대한 결과를 나타낸다. 표 9는 템플릿으로서 야생형을 이용하여 발견된 조합 돌연변이체에 대한 결과를 나타낸다. 표 10은 템플릿(S46V 및 Y116H 돌연변이를 포함하는 서열에 2 개의 유익한 돌연변이를 이미 함유한 SEQ ID NO: 51)으로서 SEQ ID NO: 53(PROF1이라고도 함)을 이용하여 발견된 유익한 단일 돌연변이에 대한 결과를 나타낸다. PROF1에 대해, S46V 및 Y116H 돌연변이는 템플릿 내로 고정되어, 포화/조합의 향후 라운드들이 야생형 서열로부터가 아닌 그 변이체로부터 시작할 것이다. 표 11은 템플릿으로서 PROF1을 이용하여 유익한 것으로 발견된 이중 돌연변이에 대한 결과를 나타낸다. 도 12는 템플릿으로서 야생형을 이용하여 발견된 조합 돌연변이체에 대한 결과를 나타낸다. 도 13은 BD64에서 템플릿으로서 P1B9v2.0(SEQ ID NO: 58)을 이용하여 발견된 조합 돌연변이체에 대한 결과를 나타낸다.
아래의 표 8은 템플릿으로서 Ppro 야생형(SEQ ID NO: 51)을 이용하여 발견된 유익한 단일 돌연변이의 리스트를 나타낸다.
아래의 표 9는 템플릿으로서 Ppro 야생형(SEQ ID NO: 51)을 이용하여 발견된 조합 돌연변이체의 리스트를 나타낸다.
아래의 표 10은 템플릿으로서 PROF1(SEQ ID NO: 53)을 이용하여 발견된 유익한 단일 돌연변이의 리스트를 나타낸다.
표 11은 템플릿으로서 PROF1(SEQ ID NO: 53)을 이용하여 유익한 것으로 발견된 이중 돌연변이의 리스트를 나타낸다.
Ppro 라이브러리 중 하나에 에탄올을 공급한 결과가 본 명세서에 기술된다. 메탄올을 이용하여 개선된 에스테르 신타아제 활성을 갖는 유전자가 에탄올의 존재 시 개선된 에스테르 신타아제 활성을 나타내는지를 테스트하기 위해, 조합 라이브러리 중 하나에 메탄올 또는 에탄올이 공급되었다. 도 7a 및 도 7b에서 알 수 있는 바와 같이, 개선된 에스테르 신타아제 활성은 메탄올 또는 에탄올 공급으로 관찰되었지만, 더 높은 비율의 에스테르는 메탄올을 이용하여 얻어졌다. 표 12는 템플릿으로서 Ppro 야생형(SEQ ID NO: 51)을 이용하여 발견된 조합 돌연변이체의 리스트를 나타낸다.
표 13은 BD64에서 템플릿으로서 P1B9v2.0(SEQ ID NO: 58)을 이용하여 발견된 조합 돌연변이체에 대한 리스트를 나타낸다.
해당 기술분야의 당업자라면 알 수 있는 바와 같이, 본 발명의 기술적 사상 및 범위를 벗어나지 않고, 상기의 실시형태들 및 실시예들의 다양한 변형들 및 변경들이 이루어질 수 있다. 이러한 변형들 및 변경들은 본 발명의 범위 내에 있다.
<110> LS9, INC.
<120> ENZYME VARIANTS WITH IMPROVED ESTER SYNTHASE PROPERTIES
<130> LS00043/44PCT
<140>
<141>
<150> 61/708,424
<151> 2012-10-01
<150> 61/701,191
<151> 2012-09-14
<160> 66
<170> PatentIn version 3.5
<210> 1
<211> 1422
<212> DNA
<213> Marinobacter hydrocarbonoclasticus
<400> 1
atgaaacgtc tcggaaccct ggacgcctcc tggctggcgg ttgaatctga agacaccccg 60
atgcatgtgg gtacgcttca gattttctca ctgccggaag gcgcaccaga aaccttcctg 120
cgtgacatgg tcactcgaat gaaagaggcc ggcgatgtgg caccaccctg gggatacaaa 180
ctggcctggt ctggtttcct cgggcgcgtg atcgccccgg cctggaaagt cgataaggat 240
atcgatctgg attatcacgt ccggcactca gccctgcctc gccccggcgg ggagcgcgaa 300
ctgggtattc tggtatcccg actgcactct aaccccctgg atttttcccg ccctctttgg 360
gaatgccacg ttattgaagg cctggagaat aaccgttttg ccctttacac caaaatgcac 420
cactcgatga ttgacggcat cagcggcgtg cgactgatgc agagggtgct caccaccgat 480
cccgaacgct gcaatatgcc accgccctgg acggtacgcc cacaccagcg ccgtggtgca 540
aaaaccgaca aagaggccag cgtgcccgca gcggtttccc aggcaatgga cgccctgaag 600
ctccaggcag acatggcccc caggctgtgg caggccggca atcgcctggt gcattcggtt 660
cgacacccgg aagacggact gaccgcgccc ttcactggac cggtttcggt gctcaatcac 720
cgggttaccg cgcagcgacg ttttgccacc cagcattatc aactggaccg gctgaaaaac 780
ctggcccatg cttccggcgg ttccttgaac gacatcgttc tttacctgtg tggcaccgca 840
ttgcggcgct ttctggctga gcagaacaat ctgccagaca ccccgctgac ggctggtata 900
ccggtgaata tccggccggc agacgacgag ggtacgggca cccagatcag ttttatgatt 960
gcctcgctgg ccaccgacga agctgatccg ttgaaccgcc tgcaacagat caaaacctcg 1020
acccgacggg ccaaggagca cctgcagaaa cttccaaaaa gtgccctgac ccagtacacc 1080
atgctgctga tgtcacccta cattctgcaa ttgatgtcag gtctcggggg gaggatgcga 1140
ccagtcttca acgtgaccat ttccaacgtg cccggcccgg aaggcacgct gtattatgaa 1200
ggagcccggc ttgaggccat gtatccggta tcgctaatcg ctcacggcgg cgccctgaac 1260
atcacctgcc tgagctatgc cggatcgctg aatttcggtt ttaccggctg tcgggatacg 1320
ctgccgagca tgcagaaact ggcggtttat accggtgaag ctctggatga gctggaatcg 1380
ctgattctgc cacccaagaa gcgcgcccga acccgcaagt aa 1422
<210> 2
<211> 473
<212> PRT
<213> Marinobacter hydrocarbonoclasticus
<400> 2
Met Lys Arg Leu Gly Thr Leu Asp Ala Ser Trp Leu Ala Val Glu Ser
1 5 10 15
Glu Asp Thr Pro Met His Val Gly Thr Leu Gln Ile Phe Ser Leu Pro
20 25 30
Glu Gly Ala Pro Glu Thr Phe Leu Arg Asp Met Val Thr Arg Met Lys
35 40 45
Glu Ala Gly Asp Val Ala Pro Pro Trp Gly Tyr Lys Leu Ala Trp Ser
50 55 60
Gly Phe Leu Gly Arg Val Ile Ala Pro Ala Trp Lys Val Asp Lys Asp
65 70 75 80
Ile Asp Leu Asp Tyr His Val Arg His Ser Ala Leu Pro Arg Pro Gly
85 90 95
Gly Glu Arg Glu Leu Gly Ile Leu Val Ser Arg Leu His Ser Asn Pro
100 105 110
Leu Asp Phe Ser Arg Pro Leu Trp Glu Cys His Val Ile Glu Gly Leu
115 120 125
Glu Asn Asn Arg Phe Ala Leu Tyr Thr Lys Met His His Ser Met Ile
130 135 140
Asp Gly Ile Ser Gly Val Arg Leu Met Gln Arg Val Leu Thr Thr Asp
145 150 155 160
Pro Glu Arg Cys Asn Met Pro Pro Pro Trp Thr Val Arg Pro His Gln
165 170 175
Arg Arg Gly Ala Lys Thr Asp Lys Glu Ala Ser Val Pro Ala Ala Val
180 185 190
Ser Gln Ala Met Asp Ala Leu Lys Leu Gln Ala Asp Met Ala Pro Arg
195 200 205
Leu Trp Gln Ala Gly Asn Arg Leu Val His Ser Val Arg His Pro Glu
210 215 220
Asp Gly Leu Thr Ala Pro Phe Thr Gly Pro Val Ser Val Leu Asn His
225 230 235 240
Arg Val Thr Ala Gln Arg Arg Phe Ala Thr Gln His Tyr Gln Leu Asp
245 250 255
Arg Leu Lys Asn Leu Ala His Ala Ser Gly Gly Ser Leu Asn Asp Ile
260 265 270
Val Leu Tyr Leu Cys Gly Thr Ala Leu Arg Arg Phe Leu Ala Glu Gln
275 280 285
Asn Asn Leu Pro Asp Thr Pro Leu Thr Ala Gly Ile Pro Val Asn Ile
290 295 300
Arg Pro Ala Asp Asp Glu Gly Thr Gly Thr Gln Ile Ser Phe Met Ile
305 310 315 320
Ala Ser Leu Ala Thr Asp Glu Ala Asp Pro Leu Asn Arg Leu Gln Gln
325 330 335
Ile Lys Thr Ser Thr Arg Arg Ala Lys Glu His Leu Gln Lys Leu Pro
340 345 350
Lys Ser Ala Leu Thr Gln Tyr Thr Met Leu Leu Met Ser Pro Tyr Ile
355 360 365
Leu Gln Leu Met Ser Gly Leu Gly Gly Arg Met Arg Pro Val Phe Asn
370 375 380
Val Thr Ile Ser Asn Val Pro Gly Pro Glu Gly Thr Leu Tyr Tyr Glu
385 390 395 400
Gly Ala Arg Leu Glu Ala Met Tyr Pro Val Ser Leu Ile Ala His Gly
405 410 415
Gly Ala Leu Asn Ile Thr Cys Leu Ser Tyr Ala Gly Ser Leu Asn Phe
420 425 430
Gly Phe Thr Gly Cys Arg Asp Thr Leu Pro Ser Met Gln Lys Leu Ala
435 440 445
Val Tyr Thr Gly Glu Ala Leu Asp Glu Leu Glu Ser Leu Ile Leu Pro
450 455 460
Pro Lys Lys Arg Ala Arg Thr Arg Lys
465 470
<210> 3
<211> 1422
<212> DNA
<213> Marinobacter hydrocarbonoclasticus
<400> 3
atgaaacgtc tcggaaccct gaacgcctcc tggctggcgg ttgaatctga agacaccccg 60
atgcatgtgg gtacgcttca gattttctca ctgccggaag gcgcaccaga aaccttcctg 120
cgtgacatgg tcactcgaat gaaagaggcc ggcgatgtgg caccaccctg gggatacaaa 180
ctggcctggt ctggtttcct cgggcgcgtg atcgccccgg cctggaaagt cgataaggat 240
atcgatctgg attatcacgt ccggcactca gccctgcctc gccccggcgg ggagcgcgaa 300
ctgggtattc tggtatcccg actgcactct aaccccctgg atttttcccg ccctctttgg 360
gaatgccacg ttattgaagg cctggagaat aaccgttttg ccctttacac caaaatgcac 420
cactcgatga ttgacggcat cagcggcgtg cgactgatgc agagggtgct caccaccgat 480
cccgaacgct gcaatatgcc accgccctgg acggtacgcc cacaccaacg ccgtggtgta 540
aaaaccgaca aagaggccag cgtgcccgca gcggtttccc aggcaatgga cgccctgaag 600
ctccaggcag acatggcccc caggctgtgg caggccggca atcgcctggt gcattcggtt 660
cgacacccgg aagacggact gaccgcgccc ttcactggac cggtttcggt gctcaatcac 720
cgggttaccg cgcagcgacg ttttgccacc cagcattatc aactggaccg gctgaaaaac 780
ctggcccatg cttccggcgg ttccttgaac gacatcgttc tttacctgtg tggcaccgca 840
ttgcggcgct ttctggctga gcagaacaat ctgccagaca ccccgctgac ggctggtata 900
ccggtgaata tccggccggc agacgacgag ggtacgggca cccagatcag ttttatgatt 960
gcctcgctgg ccaccgacga agctgatccg ttgaaccgcc tgcaacagat caaaacctcg 1020
acccgacggg ccaaggagca cctgcagaaa cttccaaaaa gtgccctgac ccagtacacc 1080
atgctgctga tgtcacccta cattctgcaa ttgatgtcag gtctcggggg gaggatgcga 1140
ccattcttca acgtgaccat ttccaacgtg cccggcccgg aaggcacgct gtattatgaa 1200
ggagcccggc ttgaggccat gtatccggta tcgctaatcg ctcacggcgg cgccctgaac 1260
atcacctgcc tgagctatgc cggatcgctg aatttcggtt ttaccggctg tcgggatacg 1320
ctgccgagca tgcagaaact ggcggtttat accggtgaag ctctggatga gctggaatcg 1380
ctgattctgc cacccaagaa gcgcgcccga acccgcaagt aa 1422
<210> 4
<211> 473
<212> PRT
<213> Marinobacter hydrocarbonoclasticus
<400> 4
Met Lys Arg Leu Gly Thr Leu Asn Ala Ser Trp Leu Ala Val Glu Ser
1 5 10 15
Glu Asp Thr Pro Met His Val Gly Thr Leu Gln Ile Phe Ser Leu Pro
20 25 30
Glu Gly Ala Pro Glu Thr Phe Leu Arg Asp Met Val Thr Arg Met Lys
35 40 45
Glu Ala Gly Asp Val Ala Pro Pro Trp Gly Tyr Lys Leu Ala Trp Ser
50 55 60
Gly Phe Leu Gly Arg Val Ile Ala Pro Ala Trp Lys Val Asp Lys Asp
65 70 75 80
Ile Asp Leu Asp Tyr His Val Arg His Ser Ala Leu Pro Arg Pro Gly
85 90 95
Gly Glu Arg Glu Leu Gly Ile Leu Val Ser Arg Leu His Ser Asn Pro
100 105 110
Leu Asp Phe Ser Arg Pro Leu Trp Glu Cys His Val Ile Glu Gly Leu
115 120 125
Glu Asn Asn Arg Phe Ala Leu Tyr Thr Lys Met His His Ser Met Ile
130 135 140
Asp Gly Ile Ser Gly Val Arg Leu Met Gln Arg Val Leu Thr Thr Asp
145 150 155 160
Pro Glu Arg Cys Asn Met Pro Pro Pro Trp Thr Val Arg Pro His Gln
165 170 175
Arg Arg Gly Val Lys Thr Asp Lys Glu Ala Ser Val Pro Ala Ala Val
180 185 190
Ser Gln Ala Met Asp Ala Leu Lys Leu Gln Ala Asp Met Ala Pro Arg
195 200 205
Leu Trp Gln Ala Gly Asn Arg Leu Val His Ser Val Arg His Pro Glu
210 215 220
Asp Gly Leu Thr Ala Pro Phe Thr Gly Pro Val Ser Val Leu Asn His
225 230 235 240
Arg Val Thr Ala Gln Arg Arg Phe Ala Thr Gln His Tyr Gln Leu Asp
245 250 255
Arg Leu Lys Asn Leu Ala His Ala Ser Gly Gly Ser Leu Asn Asp Ile
260 265 270
Val Leu Tyr Leu Cys Gly Thr Ala Leu Arg Arg Phe Leu Ala Glu Gln
275 280 285
Asn Asn Leu Pro Asp Thr Pro Leu Thr Ala Gly Ile Pro Val Asn Ile
290 295 300
Arg Pro Ala Asp Asp Glu Gly Thr Gly Thr Gln Ile Ser Phe Met Ile
305 310 315 320
Ala Ser Leu Ala Thr Asp Glu Ala Asp Pro Leu Asn Arg Leu Gln Gln
325 330 335
Ile Lys Thr Ser Thr Arg Arg Ala Lys Glu His Leu Gln Lys Leu Pro
340 345 350
Lys Ser Ala Leu Thr Gln Tyr Thr Met Leu Leu Met Ser Pro Tyr Ile
355 360 365
Leu Gln Leu Met Ser Gly Leu Gly Gly Arg Met Arg Pro Phe Phe Asn
370 375 380
Val Thr Ile Ser Asn Val Pro Gly Pro Glu Gly Thr Leu Tyr Tyr Glu
385 390 395 400
Gly Ala Arg Leu Glu Ala Met Tyr Pro Val Ser Leu Ile Ala His Gly
405 410 415
Gly Ala Leu Asn Ile Thr Cys Leu Ser Tyr Ala Gly Ser Leu Asn Phe
420 425 430
Gly Phe Thr Gly Cys Arg Asp Thr Leu Pro Ser Met Gln Lys Leu Ala
435 440 445
Val Tyr Thr Gly Glu Ala Leu Asp Glu Leu Glu Ser Leu Ile Leu Pro
450 455 460
Pro Lys Lys Arg Ala Arg Thr Arg Lys
465 470
<210> 5
<211> 1422
<212> DNA
<213> Marinobacter hydrocarbonoclasticus
<400> 5
atgaaacgtc tcggaaccct gaacgcctcc tggctggcgg ttgaatctga agacaccccg 60
atgcatgtgg gtacgcttca gattttctca ctgccggaag gcgcaccaga aaccttcctg 120
cgtgacatgg tcactcgaat gaaagaggcc ggcgatgtgg caccaccctg gggatacaaa 180
ctggcctggt ctggtttcct cgggcgcgtg atcgccccgg cctggaaagt cgataaggat 240
atcgatctgg attatcacgt ccggcactca gccctgcctc gccccggcgg ggagcgcgaa 300
ctgggtattc tggtatcccg actgcactct aaccccctgg atttttcccg ccctctttgg 360
gaatgccacg ttattgaagg cctggagaat aaccgttttg ccctttacac caaaatgcac 420
cactcgatga ttgacggcat cagcggcgtg cgactgatgc agagggtgct caccaccgat 480
cccgaacgct gcaatatgcc accgccctgg acggtacgcc cacaccaacg ccgtggtgta 540
aaaaccgaca aagaggccag cgtgcccgca gcggtttccc aggcaatgga cgccctgaag 600
ctccaggcag acatggcccc caggctgtgg caggccggca atcgcctggt gcattcggtt 660
cgacacccgg aagacggact gaccgcgccc ttcactggac cggtttcggt gctcaatcac 720
cgggttaccg cgcagcgacg ttttgccacc cagcattatc aactggaccg gctgaaaaac 780
ctggcccatg cttccggcgg ttccttgaac gacatcgttc tttacctgtg tggcaccgca 840
ttgcggcgct ttctggctga gcagaacaat ctgccagaca ccccgctgac ggctggtata 900
ccggtgaata tccggccggc agacgacgag ggtacgggca cccagatcag ttttatgatt 960
gcctcgctgg ccaccgacga agctgatccg ttgaaccgcc tgcaacagat caaaacctcg 1020
acccgacggg ccaaggagca cctgaggaaa cttccaaaaa gtgccctgac ccagtacacc 1080
atgctgctga tgtcacccta cattctgcaa ttgatgtcag gtctcggggg gaggatgcga 1140
ccattcttca acgtgaccat ttccaacgtg cccggcccgg aaggcacgct gtattatgaa 1200
ggagcccggc ttgaggccat gtatccggta tcgctaatcg ctcacggcgg cgccctgaac 1260
atcacctgcc tgagctatgc cggatcgctg aatttcggtt ttaccggctg tcgggatacg 1320
ctgccgagca tgcagaaact ggcggtttat accggtgaag ctctggatga gctggaatcg 1380
ctgattctgc cacccaagaa gcgcgcccga acccgcaagt aa 1422
<210> 6
<211> 473
<212> PRT
<213> Marinobacter hydrocarbonoclasticus
<400> 6
Met Lys Arg Leu Gly Thr Leu Asn Ala Ser Trp Leu Ala Val Glu Ser
1 5 10 15
Glu Asp Thr Pro Met His Val Gly Thr Leu Gln Ile Phe Ser Leu Pro
20 25 30
Glu Gly Ala Pro Glu Thr Phe Leu Arg Asp Met Val Thr Arg Met Lys
35 40 45
Glu Ala Gly Asp Val Ala Pro Pro Trp Gly Tyr Lys Leu Ala Trp Ser
50 55 60
Gly Phe Leu Gly Arg Val Ile Ala Pro Ala Trp Lys Val Asp Lys Asp
65 70 75 80
Ile Asp Leu Asp Tyr His Val Arg His Ser Ala Leu Pro Arg Pro Gly
85 90 95
Gly Glu Arg Glu Leu Gly Ile Leu Val Ser Arg Leu His Ser Asn Pro
100 105 110
Leu Asp Phe Ser Arg Pro Leu Trp Glu Cys His Val Ile Glu Gly Leu
115 120 125
Glu Asn Asn Arg Phe Ala Leu Tyr Thr Lys Met His His Ser Met Ile
130 135 140
Asp Gly Ile Ser Gly Val Arg Leu Met Gln Arg Val Leu Thr Thr Asp
145 150 155 160
Pro Glu Arg Cys Asn Met Pro Pro Pro Trp Thr Val Arg Pro His Gln
165 170 175
Arg Arg Gly Val Lys Thr Asp Lys Glu Ala Ser Val Pro Ala Ala Val
180 185 190
Ser Gln Ala Met Asp Ala Leu Lys Leu Gln Ala Asp Met Ala Pro Arg
195 200 205
Leu Trp Gln Ala Gly Asn Arg Leu Val His Ser Val Arg His Pro Glu
210 215 220
Asp Gly Leu Thr Ala Pro Phe Thr Gly Pro Val Ser Val Leu Asn His
225 230 235 240
Arg Val Thr Ala Gln Arg Arg Phe Ala Thr Gln His Tyr Gln Leu Asp
245 250 255
Arg Leu Lys Asn Leu Ala His Ala Ser Gly Gly Ser Leu Asn Asp Ile
260 265 270
Val Leu Tyr Leu Cys Gly Thr Ala Leu Arg Arg Phe Leu Ala Glu Gln
275 280 285
Asn Asn Leu Pro Asp Thr Pro Leu Thr Ala Gly Ile Pro Val Asn Ile
290 295 300
Arg Pro Ala Asp Asp Glu Gly Thr Gly Thr Gln Ile Ser Phe Met Ile
305 310 315 320
Ala Ser Leu Ala Thr Asp Glu Ala Asp Pro Leu Asn Arg Leu Gln Gln
325 330 335
Ile Lys Thr Ser Thr Arg Arg Ala Lys Glu His Leu Arg Lys Leu Pro
340 345 350
Lys Ser Ala Leu Thr Gln Tyr Thr Met Leu Leu Met Ser Pro Tyr Ile
355 360 365
Leu Gln Leu Met Ser Gly Leu Gly Gly Arg Met Arg Pro Phe Phe Asn
370 375 380
Val Thr Ile Ser Asn Val Pro Gly Pro Glu Gly Thr Leu Tyr Tyr Glu
385 390 395 400
Gly Ala Arg Leu Glu Ala Met Tyr Pro Val Ser Leu Ile Ala His Gly
405 410 415
Gly Ala Leu Asn Ile Thr Cys Leu Ser Tyr Ala Gly Ser Leu Asn Phe
420 425 430
Gly Phe Thr Gly Cys Arg Asp Thr Leu Pro Ser Met Gln Lys Leu Ala
435 440 445
Val Tyr Thr Gly Glu Ala Leu Asp Glu Leu Glu Ser Leu Ile Leu Pro
450 455 460
Pro Lys Lys Arg Ala Arg Thr Arg Lys
465 470
<210> 7
<211> 1422
<212> DNA
<213> Marinobacter hydrocarbonoclasticus
<400> 7
atgaaacgtc tcggaaccct gaacgcctcc tggctggcgg ttgaatctga agacaccccg 60
atgcatgtgg gtacgcttca gattttctca ctgccggaag gcgcaccaga aaccttcctg 120
cgtgacatgg tcactcgaat gaaagaggcc ggcgatgtgg caccaccctg gggatacaaa 180
ctggcctggt ctggtttcct cgggcgcgtg atcgccccgg cctggaaagt cgataaggat 240
atcgatctgg attatcacgt ccggcactca gccctgcctc gccccggcgg ggagcgcgaa 300
ctgggtattc tggtatcccg actgcactct aaccccctgg atttttcccg ccctctttgg 360
gaatgccacg ttattgaagg cctggagaat aaccgttttg ccctttacac caaaatgcac 420
cactcgatga ttgacggcat cagcggcgtg cgactgatgc agagggtgct caccaccgat 480
cccgaacgct gcaatatgcc accgccctgg acggtacgcc cacaccaacg ccgtggtgta 540
aaaaccgaca aagaggccag cgtgcccgca gcggtttccc aggcaatgga cgccctgaag 600
ctccaggcag acatggcccc caggctgtgg caggccggca atcgcctggt gcattcggtt 660
cgacacccgg aagacggact gaccgcgccc ttcactggac cggtttcggt gctcaatcac 720
cgggttaccg cgcagcgacg ttttgccacc cagcattatc aactggaccg gctgaaaaac 780
ctggcccatg cttccggcgg ttccttgaac gacatcgttc tttacctgtg tggcaccgca 840
ttgcggcgct ttctggctga gcagaacaat ctgccagaca ccccgctgac ggctggtata 900
ccggtgaata tccggccggc agacgacgag ggtacgggca cccagatcag ttttatgatt 960
gcctcgctgg ccaccgacga agctgatccg ttgaaccgcc tgcaacagat caaaacctcg 1020
acccgacggg ccaaggagca cctgcagaaa cttccaaaaa gtgccctgac ccagtacacc 1080
atgctgctga tgtcacccta cattctgcaa ttgatgtcag gtctcggggg gaggatgcga 1140
ccattcttca acgtgaccat ttccaacgtg cccggcccgg aaggcacgct gtattatgaa 1200
ggagcccggc ttgaggccat gtatccggta tcgctaatcg ctcacggcgg cgccctgaac 1260
atcacctgcc tgagctatgc cggatcgctg aatttcggtt ttaccggctg tcgggatacg 1320
ctgccgagca tgcagaaact ggcggtttat accggtgaag ctctggatga gctggaatcg 1380
ctgattctgc cacccaagaa gcgcgcccga acccgcaagt aa 1422
<210> 8
<211> 473
<212> PRT
<213> Marinobacter hydrocarbonoclasticus
<400> 8
Met Lys Arg Leu Gly Thr Leu Asn Ala Ser Trp Leu Ala Val Glu Ser
1 5 10 15
Glu Asp Thr Pro Met His Val Gly Thr Leu Gln Ile Phe Ser Leu Pro
20 25 30
Glu Gly Ala Pro Glu Thr Phe Leu Arg Asp Met Val Thr Arg Met Lys
35 40 45
Glu Ala Gly Asp Val Ala Pro Pro Trp Gly Tyr Lys Leu Ala Trp Ser
50 55 60
Gly Phe Leu Gly Arg Val Ile Ala Pro Ala Trp Lys Val Asp Lys Asp
65 70 75 80
Ile Asp Leu Asp Tyr His Val Arg His Ser Ala Leu Pro Arg Pro Gly
85 90 95
Gly Glu Arg Glu Leu Gly Ile Leu Val Ser Arg Leu His Ser Asn Pro
100 105 110
Leu Asp Phe Ser Arg Pro Leu Trp Glu Cys His Val Ile Glu Gly Leu
115 120 125
Glu Asn Asn Arg Phe Ala Leu Tyr Thr Lys Met His His Ser Met Ile
130 135 140
Asp Gly Ile Ser Gly Val Arg Leu Met Gln Arg Val Leu Thr Thr Asp
145 150 155 160
Pro Glu Arg Cys Asn Met Pro Pro Pro Trp Thr Val Arg Pro His Gln
165 170 175
Arg Arg Gly Val Lys Thr Asp Lys Glu Ala Ser Val Pro Ala Ala Val
180 185 190
Ser Gln Ala Met Asp Ala Leu Lys Leu Gln Ala Asp Met Ala Pro Arg
195 200 205
Leu Trp Gln Ala Gly Asn Arg Leu Val His Ser Val Arg His Pro Glu
210 215 220
Asp Gly Leu Thr Ala Pro Phe Thr Gly Pro Val Ser Val Leu Asn His
225 230 235 240
Arg Val Thr Ala Gln Arg Arg Phe Ala Thr Gln His Tyr Gln Leu Asp
245 250 255
Arg Leu Lys Asn Leu Ala His Ala Ser Gly Gly Ser Leu Asn Asp Ile
260 265 270
Val Leu Tyr Leu Cys Gly Thr Ala Leu Arg Arg Phe Leu Ala Glu Gln
275 280 285
Asn Asn Leu Pro Asp Thr Pro Leu Thr Ala Gly Ile Pro Val Asn Ile
290 295 300
Arg Pro Ala Asp Asp Glu Gly Thr Gly Thr Gln Ile Ser Phe Met Ile
305 310 315 320
Ala Ser Leu Ala Thr Asp Glu Ala Asp Pro Leu Asn Arg Leu Gln Gln
325 330 335
Ile Lys Thr Ser Thr Arg Arg Ala Lys Glu His Leu Gln Lys Leu Pro
340 345 350
Lys Ser Ala Leu Thr Gln Tyr Thr Met Leu Leu Met Ser Pro Tyr Ile
355 360 365
Leu Gln Leu Met Ser Gly Leu Gly Gly Arg Met Arg Pro Phe Phe Asn
370 375 380
Val Thr Ile Ser Asn Val Pro Gly Pro Glu Gly Thr Leu Tyr Tyr Glu
385 390 395 400
Gly Ala Arg Leu Glu Ala Met Tyr Pro Val Ser Leu Ile Ala His Gly
405 410 415
Gly Ala Leu Asn Ile Thr Cys Leu Ser Tyr Ala Gly Ser Leu Asn Phe
420 425 430
Gly Phe Thr Gly Cys Arg Asp Thr Leu Pro Ser Met Gln Lys Leu Ala
435 440 445
Val Tyr Thr Gly Glu Ala Leu Asp Glu Leu Glu Ser Leu Ile Leu Pro
450 455 460
Pro Lys Lys Arg Ala Arg Thr Arg Lys
465 470
<210> 9
<211> 1422
<212> DNA
<213> Marinobacter hydrocarbonoclasticus
<400> 9
atgaaacgtc tcggaaccct gaacgcctcc tggctggcgg ttgaatctga agacaccccg 60
atgcatgtgg gtacgcttca gattttctca ctgccggaag gcgcaccaga aaccttcctg 120
cgtgacatgg tcactcgaat gaaagaggcc ggcgatgtgg caccaccctg gggatacaaa 180
ctggcctggt ctggtttcct cgggcgcgtg atcgccccgg cctggaaagt cgataaggat 240
atcgatctgg attatcacgt ccggcactca gccctgcctc gccccggcgg ggagcgcgaa 300
ctgggtattc tggtatcccg actgcactct aaccccctgg atttttcccg ccctctttgg 360
gaatgccacg ttattgaagg cctggagaat aaccgttttg ccctttacac caaaatgcac 420
cactcgatga ttgacggcat cagcggcgtg cgactgatgc agagggtgct caccaccgat 480
cccgaacgct gcaatatgcc accgccctgg acggtacgcc cacaccaacg ccgtggtgta 540
aaaaccgaca aagaggccag cgtgcccgca gcggtttccc aggcaatgga cgccctgaag 600
ctccaggcag acatggcccc caggctgtgg caggccggca atcgcctggt gcattcggtt 660
cgacacccgg aagacggact gaccgcgccc ttcactggac cggtttcggt gctcaatcac 720
cgggttaccg cgcagcgacg ttttgccacc cagcattatc aactggaccg gctgaaaaac 780
ctggcccatg cttccggcgg ttccttgaac gacatcgtgc tttacctgtg tggcaccgca 840
ttgcggcgct ttctggctga gcagaacaat ctgccagaca ccccgctgac ggctggtata 900
ccggtgaata tccggccggc agacgacgag ggtacgggca cccagatcag ttttatgatt 960
gcctcgctgg ccaccgacga agctgatccg ttgaaccgcc tgcaacagat caaaacctcg 1020
acccgacggg ccaaggagca cctgaggaaa cttccaaaaa gtgccctgac ccagtacacc 1080
atgctgctga tgtcacccta cattctgcaa ttgatgtcag gtctcggggg gaggatgcga 1140
ccattcttca acgtgaccat ttccaacgtg cccggcccgg aaggcacgct gtattatgaa 1200
ggagcccggc ttgaggccat gtatccggta tcgctaatcg ctcacggcgg cgccctgaac 1260
atcacctgcc tgagctatgc cggatcgctg aatttcggtt ttaccggctg tcgggatacg 1320
ctgccgagca tgcagaaact ggcggtttat accggtgaag ctctggatga gctggaatcg 1380
ctgattctgc cacccaagaa gcgcgcccga acccgcaagt aa 1422
<210> 10
<211> 473
<212> PRT
<213> Marinobacter hydrocarbonoclasticus
<400> 10
Met Lys Arg Leu Gly Thr Leu Asn Ala Ser Trp Leu Ala Val Glu Ser
1 5 10 15
Glu Asp Thr Pro Met His Val Gly Thr Leu Gln Ile Phe Ser Leu Pro
20 25 30
Glu Gly Ala Pro Glu Thr Phe Leu Arg Asp Met Val Thr Arg Met Lys
35 40 45
Glu Ala Gly Asp Val Ala Pro Pro Trp Gly Tyr Lys Leu Ala Trp Ser
50 55 60
Gly Phe Leu Gly Arg Val Ile Ala Pro Ala Trp Lys Val Asp Lys Asp
65 70 75 80
Ile Asp Leu Asp Tyr His Val Arg His Ser Ala Leu Pro Arg Pro Gly
85 90 95
Gly Glu Arg Glu Leu Gly Ile Leu Val Ser Arg Leu His Ser Asn Pro
100 105 110
Leu Asp Phe Ser Arg Pro Leu Trp Glu Cys His Val Ile Glu Gly Leu
115 120 125
Glu Asn Asn Arg Phe Ala Leu Tyr Thr Lys Met His His Ser Met Ile
130 135 140
Asp Gly Ile Ser Gly Val Arg Leu Met Gln Arg Val Leu Thr Thr Asp
145 150 155 160
Pro Glu Arg Cys Asn Met Pro Pro Pro Trp Thr Val Arg Pro His Gln
165 170 175
Arg Arg Gly Val Lys Thr Asp Lys Glu Ala Ser Val Pro Ala Ala Val
180 185 190
Ser Gln Ala Met Asp Ala Leu Lys Leu Gln Ala Asp Met Ala Pro Arg
195 200 205
Leu Trp Gln Ala Gly Asn Arg Leu Val His Ser Val Arg His Pro Glu
210 215 220
Asp Gly Leu Thr Ala Pro Phe Thr Gly Pro Val Ser Val Leu Asn His
225 230 235 240
Arg Val Thr Ala Gln Arg Arg Phe Ala Thr Gln His Tyr Gln Leu Asp
245 250 255
Arg Leu Lys Asn Leu Ala His Ala Ser Gly Gly Ser Leu Asn Asp Ile
260 265 270
Val Leu Tyr Leu Cys Gly Thr Ala Leu Arg Arg Phe Leu Ala Glu Gln
275 280 285
Asn Asn Leu Pro Asp Thr Pro Leu Thr Ala Gly Ile Pro Val Asn Ile
290 295 300
Arg Pro Ala Asp Asp Glu Gly Thr Gly Thr Gln Ile Ser Phe Met Ile
305 310 315 320
Ala Ser Leu Ala Thr Asp Glu Ala Asp Pro Leu Asn Arg Leu Gln Gln
325 330 335
Ile Lys Thr Ser Thr Arg Arg Ala Lys Glu His Leu Arg Lys Leu Pro
340 345 350
Lys Ser Ala Leu Thr Gln Tyr Thr Met Leu Leu Met Ser Pro Tyr Ile
355 360 365
Leu Gln Leu Met Ser Gly Leu Gly Gly Arg Met Arg Pro Phe Phe Asn
370 375 380
Val Thr Ile Ser Asn Val Pro Gly Pro Glu Gly Thr Leu Tyr Tyr Glu
385 390 395 400
Gly Ala Arg Leu Glu Ala Met Tyr Pro Val Ser Leu Ile Ala His Gly
405 410 415
Gly Ala Leu Asn Ile Thr Cys Leu Ser Tyr Ala Gly Ser Leu Asn Phe
420 425 430
Gly Phe Thr Gly Cys Arg Asp Thr Leu Pro Ser Met Gln Lys Leu Ala
435 440 445
Val Tyr Thr Gly Glu Ala Leu Asp Glu Leu Glu Ser Leu Ile Leu Pro
450 455 460
Pro Lys Lys Arg Ala Arg Thr Arg Lys
465 470
<210> 11
<211> 1422
<212> DNA
<213> Marinobacter hydrocarbonoclasticus
<400> 11
atgaaacgtc tcggaaccct gaacgcctcc tggctggcgg ttgaatctga agacaccccg 60
atgcatgtgg gtacgcttca gattttctca ctgccggaag gcgcaccaga aaccttcctg 120
cgtgacatgg tcactcgaat gaaagaggcc ggcgatgtgg caccaccctg gggatacaaa 180
ctggcctggt ctggtttcct cgggcgcgtg atcgccccgg cctggaaagt cgataaggat 240
atcgatctgg attatcacgt ccgacactca gccctgcctc gccccggcgg ggagcgcgaa 300
ctgggtattc tggtatcccg actgcactct aaccccctgg atttttcccg ccctctttgg 360
gaatgccacg ttattgaagg cctggagaat aaccgttttg ccctttacac caaaatgcac 420
cactcgatga ttgacggcat cagcggcgtg cgactgatgc agagggtgct caccaccgat 480
cccgaacgct gcaatatgcc accgccctgg acggtacgcc cacaccaacg ccgtggtgta 540
aaaaccgaca aagaggccag caggcccgca gcggtttccc aggcaatgga cgccctgaag 600
ctccaggcag acatggcccc caggctgtgg caggccgcga atcgcctggt gcattcggtt 660
cgacacccgg aagacggact gaccgcgccc ttcactggac cggtttcggt gctcaatcac 720
cgggttaccg cgcagcgacg ttttgccacc cagcattatc aactggaccg gctgaaaaac 780
ctggcccatg cttccggcgg ttccttgaac gacatcgttc tttacctgtg tggcaccgca 840
ttgcggcgct ttctggctga gcagaacaat ctgccagaca ccccgctgac ggctggtata 900
ccggtgaata tccggccggc agacgacgag ggtacgggca cccagatcag ttttatgatt 960
gcctcgctgg ccaccgacga agctgatccg ttgaaccgcc tgcaacagat caaaacctcg 1020
acccgacggg ccaaggagca cctgcagaaa cttccaaaaa gtgccctgac cgtgtacacc 1080
atgctgctga tgtcacccta cattctgcaa ttgatgtcag gtctcggggg gaggatgcga 1140
ccattcttca acgtgaccat ttccaacgtg cccggcccgg aaggcacgct gtattatgaa 1200
ggagcccggc ttgaggccat gtatccggta tcgctaatcg ctcacggcgg cgccctgaac 1260
atcacctgcc tgagctatgc cggatcgctg aatttcggtt ttaccggctg tcgggatacg 1320
ctgccgagcg gccagaaact ggcggtttat accggtgaag ctctggatga gctggaatcg 1380
ctgattctgc cacccaagaa gcgcgcccga acccgcaagt aa 1422
<210> 12
<211> 473
<212> PRT
<213> Marinobacter hydrocarbonoclasticus
<400> 12
Met Lys Arg Leu Gly Thr Leu Asn Ala Ser Trp Leu Ala Val Glu Ser
1 5 10 15
Glu Asp Thr Pro Met His Val Gly Thr Leu Gln Ile Phe Ser Leu Pro
20 25 30
Glu Gly Ala Pro Glu Thr Phe Leu Arg Asp Met Val Thr Arg Met Lys
35 40 45
Glu Ala Gly Asp Val Ala Pro Pro Trp Gly Tyr Lys Leu Ala Trp Ser
50 55 60
Gly Phe Leu Gly Arg Val Ile Ala Pro Ala Trp Lys Val Asp Lys Asp
65 70 75 80
Ile Asp Leu Asp Tyr His Val Arg His Ser Ala Leu Pro Arg Pro Gly
85 90 95
Gly Glu Arg Glu Leu Gly Ile Leu Val Ser Arg Leu His Ser Asn Pro
100 105 110
Leu Asp Phe Ser Arg Pro Leu Trp Glu Cys His Val Ile Glu Gly Leu
115 120 125
Glu Asn Asn Arg Phe Ala Leu Tyr Thr Lys Met His His Ser Met Ile
130 135 140
Asp Gly Ile Ser Gly Val Arg Leu Met Gln Arg Val Leu Thr Thr Asp
145 150 155 160
Pro Glu Arg Cys Asn Met Pro Pro Pro Trp Thr Val Arg Pro His Gln
165 170 175
Arg Arg Gly Val Lys Thr Asp Lys Glu Ala Ser Arg Pro Ala Ala Val
180 185 190
Ser Gln Ala Met Asp Ala Leu Lys Leu Gln Ala Asp Met Ala Pro Arg
195 200 205
Leu Trp Gln Ala Ala Asn Arg Leu Val His Ser Val Arg His Pro Glu
210 215 220
Asp Gly Leu Thr Ala Pro Phe Thr Gly Pro Val Ser Val Leu Asn His
225 230 235 240
Arg Val Thr Ala Gln Arg Arg Phe Ala Thr Gln His Tyr Gln Leu Asp
245 250 255
Arg Leu Lys Asn Leu Ala His Ala Ser Gly Gly Ser Leu Asn Asp Ile
260 265 270
Val Leu Tyr Leu Cys Gly Thr Ala Leu Arg Arg Phe Leu Ala Glu Gln
275 280 285
Asn Asn Leu Pro Asp Thr Pro Leu Thr Ala Gly Ile Pro Val Asn Ile
290 295 300
Arg Pro Ala Asp Asp Glu Gly Thr Gly Thr Gln Ile Ser Phe Met Ile
305 310 315 320
Ala Ser Leu Ala Thr Asp Glu Ala Asp Pro Leu Asn Arg Leu Gln Gln
325 330 335
Ile Lys Thr Ser Thr Arg Arg Ala Lys Glu His Leu Gln Lys Leu Pro
340 345 350
Lys Ser Ala Leu Thr Val Tyr Thr Met Leu Leu Met Ser Pro Tyr Ile
355 360 365
Leu Gln Leu Met Ser Gly Leu Gly Gly Arg Met Arg Pro Phe Phe Asn
370 375 380
Val Thr Ile Ser Asn Val Pro Gly Pro Glu Gly Thr Leu Tyr Tyr Glu
385 390 395 400
Gly Ala Arg Leu Glu Ala Met Tyr Pro Val Ser Leu Ile Ala His Gly
405 410 415
Gly Ala Leu Asn Ile Thr Cys Leu Ser Tyr Ala Gly Ser Leu Asn Phe
420 425 430
Gly Phe Thr Gly Cys Arg Asp Thr Leu Pro Ser Gly Gln Lys Leu Ala
435 440 445
Val Tyr Thr Gly Glu Ala Leu Asp Glu Leu Glu Ser Leu Ile Leu Pro
450 455 460
Pro Lys Lys Arg Ala Arg Thr Arg Lys
465 470
<210> 13
<211> 1422
<212> DNA
<213> Marinobacter hydrocarbonoclasticus
<400> 13
atgaaacgtc tcggatccct ggacgcctcc tggctggcgg ttgaaggtga agacaccccg 60
atgcatgtgg gtacgcttca gattttctca ctgccggaag gcgcaccaga aaccttcctg 120
cgtgacatgg tcactcgaat gaaagaggcc ggcgatgtgg caccaccctg gggatacaaa 180
ctggcctggt ctggtttcct cgggcgcgtg atcgccccgg cctggaaagt cgataaggat 240
atcgatctgg attatcacgt ccggcactca gccctgcctc gccccggcgg ggagcgcgaa 300
ctgggtattc tggtatcccg actgcactct aacagtctgg atttttcccg ccctctttgg 360
gaatgccacg ttattgaagg cctggagaat aaccgttttg ccctttacac caaaatgcac 420
cactcgatga ttgacggcat cagcggcgtg cgactgatgc agagggtgct caccaccgat 480
cccgaacgct gcaatatgcc accgccctgg acgcgccgcc cacaccagcg ccgtggtgca 540
aaaaccgaca aagaggccag cgtgcgggca gcggtttccc aggcaatgga cgccctgaag 600
ctccaggcag acatggcccc caggctgtgg caggccggca atcgcctggt gcattcggtt 660
cgacacccgg aagacggact gaccgcgccc ttcactggac cggtttcggt gctcaatcac 720
cgggttaccg cgcagcgacg ttttgccacc cagcattatc aactggaccg gctgaaaaac 780
ctggcccatg cttccggcgg ttccttgaac gacatcgttc tttacctgtg tggcaccgca 840
ttgcggcgct ttctggctga gcagaacaat ctgccagaca ccccgctgac ggctggtata 900
ccggtgaata tccggccggc agacgacgag ggtacgggca cccagatcag ttggatgatt 960
gcctcgctgg ccaccgacga agctgatccg ttgaaccgcc tgcaacagat caaaacctcg 1020
acccgacggg ccaaggagca cctgcagaaa cttccaaaaa cggccctgac ccagtacacc 1080
atgctgctga tgtcacccta cattctgcaa ttgatgtcag gtctcggggg gaggatgcga 1140
ccagtcttca acgtgaccat ttccaacgtg cccggcccgg aaggcacgct gtattatgaa 1200
ggagcccggc ttgaggccat gtatccgttg tcgctaatcg ctcacggcgg cgccctgaac 1260
atcacctgcc tgagctatgc cggatcgctg aatttcggtt ttaccggctg tcgggatacg 1320
ctgccgggga tgcagaaact ggcggtttat accggtgaag ctctggatga gctggaatcg 1380
ctgattctgc cacccaagaa gcgcgcccga acccgcaagt aa 1422
<210> 14
<211> 473
<212> PRT
<213> Marinobacter hydrocarbonoclasticus
<400> 14
Met Lys Arg Leu Gly Ser Leu Asp Ala Ser Trp Leu Ala Val Glu Gly
1 5 10 15
Glu Asp Thr Pro Met His Val Gly Thr Leu Gln Ile Phe Ser Leu Pro
20 25 30
Glu Gly Ala Pro Glu Thr Phe Leu Arg Asp Met Val Thr Arg Met Lys
35 40 45
Glu Ala Gly Asp Val Ala Pro Pro Trp Gly Tyr Lys Leu Ala Trp Ser
50 55 60
Gly Phe Leu Gly Arg Val Ile Ala Pro Ala Trp Lys Val Asp Lys Asp
65 70 75 80
Ile Asp Leu Asp Tyr His Val Arg His Ser Ala Leu Pro Arg Pro Gly
85 90 95
Gly Glu Arg Glu Leu Gly Ile Leu Val Ser Arg Leu His Ser Asn Ser
100 105 110
Leu Asp Phe Ser Arg Pro Leu Trp Glu Cys His Val Ile Glu Gly Leu
115 120 125
Glu Asn Asn Arg Phe Ala Leu Tyr Thr Lys Met His His Ser Met Ile
130 135 140
Asp Gly Ile Ser Gly Val Arg Leu Met Gln Arg Val Leu Thr Thr Asp
145 150 155 160
Pro Glu Arg Cys Asn Met Pro Pro Pro Trp Thr Arg Arg Pro His Gln
165 170 175
Arg Arg Gly Ala Lys Thr Asp Lys Glu Ala Ser Val Arg Ala Ala Val
180 185 190
Ser Gln Ala Met Asp Ala Leu Lys Leu Gln Ala Asp Met Ala Pro Arg
195 200 205
Leu Trp Gln Ala Gly Asn Arg Leu Val His Ser Val Arg His Pro Glu
210 215 220
Asp Gly Leu Thr Ala Pro Phe Thr Gly Pro Val Ser Val Leu Asn His
225 230 235 240
Arg Val Thr Ala Gln Arg Arg Phe Ala Thr Gln His Tyr Gln Leu Asp
245 250 255
Arg Leu Lys Asn Leu Ala His Ala Ser Gly Gly Ser Leu Asn Asp Ile
260 265 270
Val Leu Tyr Leu Cys Gly Thr Ala Leu Arg Arg Phe Leu Ala Glu Gln
275 280 285
Asn Asn Leu Pro Asp Thr Pro Leu Thr Ala Gly Ile Pro Val Asn Ile
290 295 300
Arg Pro Ala Asp Asp Glu Gly Thr Gly Thr Gln Ile Ser Trp Met Ile
305 310 315 320
Ala Ser Leu Ala Thr Asp Glu Ala Asp Pro Leu Asn Arg Leu Gln Gln
325 330 335
Ile Lys Thr Ser Thr Arg Arg Ala Lys Glu His Leu Gln Lys Leu Pro
340 345 350
Lys Thr Ala Leu Thr Gln Tyr Thr Met Leu Leu Met Ser Pro Tyr Ile
355 360 365
Leu Gln Leu Met Ser Gly Leu Gly Gly Arg Met Arg Pro Val Phe Asn
370 375 380
Val Thr Ile Ser Asn Val Pro Gly Pro Glu Gly Thr Leu Tyr Tyr Glu
385 390 395 400
Gly Ala Arg Leu Glu Ala Met Tyr Pro Leu Ser Leu Ile Ala His Gly
405 410 415
Gly Ala Leu Asn Ile Thr Cys Leu Ser Tyr Ala Gly Ser Leu Asn Phe
420 425 430
Gly Phe Thr Gly Cys Arg Asp Thr Leu Pro Gly Met Gln Lys Leu Ala
435 440 445
Val Tyr Thr Gly Glu Ala Leu Asp Glu Leu Glu Ser Leu Ile Leu Pro
450 455 460
Pro Lys Lys Arg Ala Arg Thr Arg Lys
465 470
<210> 15
<211> 1422
<212> DNA
<213> Marinobacter hydrocarbonoclasticus
<400> 15
atgaaacgtc tcggatccct ggacgcctcc tggctggcgg ttgaaggtga agacaccccg 60
atgcatgtgg gtacgcttca gattttctca ctgccggaag gcgcaccaga aaccttcctg 120
cgtgacatgg tcactcgaat gaaagaggcc ggcgatgtgg caccaccctg gggatacaaa 180
ctggcctggt ctggtttcct cgggcgcgtg atcgccccgg cctggaaagt cgatttcgat 240
atcgatctgg attatcacgt ccggcactca gccctgcctc gccccggcgg ggagcgcgaa 300
ctgggtattc tggtatcccg actgcactct aacagtctgg atttttcccg ccctctttgg 360
gaatgccacg ttattgaagg cctggagaat aaccgttttg ccctttacac caaaatgcac 420
cactcgatga ttgacggcat cagcggcgtg cgactgatgc agagggtgct caccaccgat 480
cccgaacgct gcaatatgcc accgccctgg acgcgccgcc cacaccagcg ccgtggtgca 540
aaaaccgaca aagaggccag cgtgcgggca gcggttgtgc aggcaatgga cgccctgaag 600
ctccaggcag acatggcccc caggctgtgg caggccggca atcgcctggt gcattcggtt 660
cgacacccgg aagacggact gaccgcgccc ttcactggac cggtttcggt gctcaatcac 720
cgggttacca ggcagcgacg ttttgccacc cagcattatc aactggaccg gctgaaaaac 780
ctggcccatg cttccggcgg ttccttgaac gacatcgttc tttacctgtg tggcaccgca 840
ttgcggcgct ttctggctga gcagaacaat ctgccagaca ccccgctgac ggctggtata 900
ccggtgaata tccggccggc agacgacgag ggtacgggca cccagatcag ttggatgatt 960
gcctcgctgg ccaccgacga agctgatccg ttgaaccgcc tgcaacagat caaaacctcg 1020
acccgacggg ccaaggagca cctgcagcac cttccaaaaa cggccctgac ccagtacacc 1080
atgctgctga tgtcacccta cattctgcaa ttgatgtcag gtctcggggg gaggatgcga 1140
ccagtcttca acgtgaccat ttccaacgtg cccggcccgg aaggcacgct gtattatgaa 1200
ggagcccggc ttgaggccat gtatccgttg tcgctaatcg ctcacggcgg cgccctgaac 1260
atcacctgcc tgagctatgc cggatcgctg aatttcggtt ttaccggctg tcgggatacg 1320
ctgccgggga tgcagaaact ggcggtttat accggtgaag ctctggatga gctggaatcg 1380
ctgattctgc cacccaagaa gcgcgcccga acccgcaagt aa 1422
<210> 16
<211> 473
<212> PRT
<213> Marinobacter hydrocarbonoclasticus
<400> 16
Met Lys Arg Leu Gly Ser Leu Asp Ala Ser Trp Leu Ala Val Glu Gly
1 5 10 15
Glu Asp Thr Pro Met His Val Gly Thr Leu Gln Ile Phe Ser Leu Pro
20 25 30
Glu Gly Ala Pro Glu Thr Phe Leu Arg Asp Met Val Thr Arg Met Lys
35 40 45
Glu Ala Gly Asp Val Ala Pro Pro Trp Gly Tyr Lys Leu Ala Trp Ser
50 55 60
Gly Phe Leu Gly Arg Val Ile Ala Pro Ala Trp Lys Val Asp Phe Asp
65 70 75 80
Ile Asp Leu Asp Tyr His Val Arg His Ser Ala Leu Pro Arg Pro Gly
85 90 95
Gly Glu Arg Glu Leu Gly Ile Leu Val Ser Arg Leu His Ser Asn Ser
100 105 110
Leu Asp Phe Ser Arg Pro Leu Trp Glu Cys His Val Ile Glu Gly Leu
115 120 125
Glu Asn Asn Arg Phe Ala Leu Tyr Thr Lys Met His His Ser Met Ile
130 135 140
Asp Gly Ile Ser Gly Val Arg Leu Met Gln Arg Val Leu Thr Thr Asp
145 150 155 160
Pro Glu Arg Cys Asn Met Pro Pro Pro Trp Thr Arg Arg Pro His Gln
165 170 175
Arg Arg Gly Ala Lys Thr Asp Lys Glu Ala Ser Val Arg Ala Ala Val
180 185 190
Val Gln Ala Met Asp Ala Leu Lys Leu Gln Ala Asp Met Ala Pro Arg
195 200 205
Leu Trp Gln Ala Gly Asn Arg Leu Val His Ser Val Arg His Pro Glu
210 215 220
Asp Gly Leu Thr Ala Pro Phe Thr Gly Pro Val Ser Val Leu Asn His
225 230 235 240
Arg Val Thr Arg Gln Arg Arg Phe Ala Thr Gln His Tyr Gln Leu Asp
245 250 255
Arg Leu Lys Asn Leu Ala His Ala Ser Gly Gly Ser Leu Asn Asp Ile
260 265 270
Val Leu Tyr Leu Cys Gly Thr Ala Leu Arg Arg Phe Leu Ala Glu Gln
275 280 285
Asn Asn Leu Pro Asp Thr Pro Leu Thr Ala Gly Ile Pro Val Asn Ile
290 295 300
Arg Pro Ala Asp Asp Glu Gly Thr Gly Thr Gln Ile Ser Trp Met Ile
305 310 315 320
Ala Ser Leu Ala Thr Asp Glu Ala Asp Pro Leu Asn Arg Leu Gln Gln
325 330 335
Ile Lys Thr Ser Thr Arg Arg Ala Lys Glu His Leu Gln His Leu Pro
340 345 350
Lys Thr Ala Leu Thr Gln Tyr Thr Met Leu Leu Met Ser Pro Tyr Ile
355 360 365
Leu Gln Leu Met Ser Gly Leu Gly Gly Arg Met Arg Pro Val Phe Asn
370 375 380
Val Thr Ile Ser Asn Val Pro Gly Pro Glu Gly Thr Leu Tyr Tyr Glu
385 390 395 400
Gly Ala Arg Leu Glu Ala Met Tyr Pro Leu Ser Leu Ile Ala His Gly
405 410 415
Gly Ala Leu Asn Ile Thr Cys Leu Ser Tyr Ala Gly Ser Leu Asn Phe
420 425 430
Gly Phe Thr Gly Cys Arg Asp Thr Leu Pro Gly Met Gln Lys Leu Ala
435 440 445
Val Tyr Thr Gly Glu Ala Leu Asp Glu Leu Glu Ser Leu Ile Leu Pro
450 455 460
Pro Lys Lys Arg Ala Arg Thr Arg Lys
465 470
<210> 17
<211> 1422
<212> DNA
<213> Marinobacter hydrocarbonoclasticus
<400> 17
atgaaacgtc tcggatccct ggacgcctcc tggctggcgg ttgaaggtga agacaccccg 60
atgcatgtgg gtacgcttca gattttctca ctgccggaag gcgcaccaga aaccttcctg 120
cgtgacatgg tcactcgaat gaaagaggcc ggcgatgtgg caccaccctg gggatacaaa 180
ctggcctggt ctggtttcct cgggcgcgtg atcgccccgg cctggaaact ggataaggat 240
atcgatctgg attatcacgt ccggcactca gccctgcctc gccccggcgg ggagcgcgaa 300
ctgggtattc tggtatcccg actgcactct aacagtctgg atttttcccg ccctctttgg 360
gaatgccacg ttattgaagg cctggagaat aaccgttttg ccctttacac caaaatgcac 420
cactcgatga ttgacggcat cagcggcgtg cgactgatgc agagggtgct caccaccgat 480
cccgaacgct gcaatatgcc accgccctgg acgcgccgcc cacaccagcg ccgtggtgca 540
aaaaccgaca aagaggccag cgtgcgggca gcggtttccc aggcaatgga cgccctgaag 600
ctccaggcag acatggcccc caggctgtgg caggccggca atcgcctggt gcattcggtt 660
cgacacccgg aagacggact gaccgcgccc ttcactggac cggtttcggt gctcaatcac 720
cgggttaccg cgcagcgacg ttttgccacc cagcattatc aactggaccg gctgaggaac 780
ctggcccatg cttccggcgg ttccttgaac gacatcgttc tttacctgtg tggcaccgca 840
ttgcggcgct ttctggctga gcagaacaat ctgccagaca ccccgctgac ggctggtata 900
ccggtgaata tccggccggc agacgacgag ggtacgggca cccagatcgg gtggatgatt 960
gcctcgctgg ccaccgacga agctgatccg ttgaaccgcc tgcaacagat caaaacctcg 1020
acccgacggg ccaaggagca cctgcagaaa cttccaaaaa cggccctgac ccagtacacc 1080
cgcctgctga tgtcacccta cattctgcaa ttgatgtcag gtctcggggg gaggatgcga 1140
ccagtcttca acgtgaccat ttccaacgtg cccggcccgg aaggcacgct gtattatgaa 1200
ggagcccggc ttgaggccat gtatccgttg tcgctaatcg ctcacggcgg cgccctgaac 1260
atcacctgcc tgagctatgc cggatcgctg aatttcggtt ttaccggctg tcgggatacg 1320
ctgccgggga tgcagaaact ggcggtttat accggtgaag ctctggatga gctggaatcg 1380
ctgattctgc cacccaagaa gcgcgcccga acccgcaagt aa 1422
<210> 18
<211> 473
<212> PRT
<213> Marinobacter hydrocarbonoclasticus
<400> 18
Met Lys Arg Leu Gly Ser Leu Asp Ala Ser Trp Leu Ala Val Glu Gly
1 5 10 15
Glu Asp Thr Pro Met His Val Gly Thr Leu Gln Ile Phe Ser Leu Pro
20 25 30
Glu Gly Ala Pro Glu Thr Phe Leu Arg Asp Met Val Thr Arg Met Lys
35 40 45
Glu Ala Gly Asp Val Ala Pro Pro Trp Gly Tyr Lys Leu Ala Trp Ser
50 55 60
Gly Phe Leu Gly Arg Val Ile Ala Pro Ala Trp Lys Leu Asp Lys Asp
65 70 75 80
Ile Asp Leu Asp Tyr His Val Arg His Ser Ala Leu Pro Arg Pro Gly
85 90 95
Gly Glu Arg Glu Leu Gly Ile Leu Val Ser Arg Leu His Ser Asn Ser
100 105 110
Leu Asp Phe Ser Arg Pro Leu Trp Glu Cys His Val Ile Glu Gly Leu
115 120 125
Glu Asn Asn Arg Phe Ala Leu Tyr Thr Lys Met His His Ser Met Ile
130 135 140
Asp Gly Ile Ser Gly Val Arg Leu Met Gln Arg Val Leu Thr Thr Asp
145 150 155 160
Pro Glu Arg Cys Asn Met Pro Pro Pro Trp Thr Arg Arg Pro His Gln
165 170 175
Arg Arg Gly Ala Lys Thr Asp Lys Glu Ala Ser Val Arg Ala Ala Val
180 185 190
Ser Gln Ala Met Asp Ala Leu Lys Leu Gln Ala Asp Met Ala Pro Arg
195 200 205
Leu Trp Gln Ala Gly Asn Arg Leu Val His Ser Val Arg His Pro Glu
210 215 220
Asp Gly Leu Thr Ala Pro Phe Thr Gly Pro Val Ser Val Leu Asn His
225 230 235 240
Arg Val Thr Ala Gln Arg Arg Phe Ala Thr Gln His Tyr Gln Leu Asp
245 250 255
Arg Leu Arg Asn Leu Ala His Ala Ser Gly Gly Ser Leu Asn Asp Ile
260 265 270
Val Leu Tyr Leu Cys Gly Thr Ala Leu Arg Arg Phe Leu Ala Glu Gln
275 280 285
Asn Asn Leu Pro Asp Thr Pro Leu Thr Ala Gly Ile Pro Val Asn Ile
290 295 300
Arg Pro Ala Asp Asp Glu Gly Thr Gly Thr Gln Ile Gly Trp Met Ile
305 310 315 320
Ala Ser Leu Ala Thr Asp Glu Ala Asp Pro Leu Asn Arg Leu Gln Gln
325 330 335
Ile Lys Thr Ser Thr Arg Arg Ala Lys Glu His Leu Gln Lys Leu Pro
340 345 350
Lys Thr Ala Leu Thr Gln Tyr Thr Arg Leu Leu Met Ser Pro Tyr Ile
355 360 365
Leu Gln Leu Met Ser Gly Leu Gly Gly Arg Met Arg Pro Val Phe Asn
370 375 380
Val Thr Ile Ser Asn Val Pro Gly Pro Glu Gly Thr Leu Tyr Tyr Glu
385 390 395 400
Gly Ala Arg Leu Glu Ala Met Tyr Pro Leu Ser Leu Ile Ala His Gly
405 410 415
Gly Ala Leu Asn Ile Thr Cys Leu Ser Tyr Ala Gly Ser Leu Asn Phe
420 425 430
Gly Phe Thr Gly Cys Arg Asp Thr Leu Pro Gly Met Gln Lys Leu Ala
435 440 445
Val Tyr Thr Gly Glu Ala Leu Asp Glu Leu Glu Ser Leu Ile Leu Pro
450 455 460
Pro Lys Lys Arg Ala Arg Thr Arg Lys
465 470
<210> 19
<211> 1422
<212> DNA
<213> Marinobacter hydrocarbonoclasticus
<400> 19
atgaaacgtc tcggatccct ggacgcctcc tggctggcgg ttgaaggtga agacaccccg 60
atgcatgtgg gtacgcttca gattttctca ctgccggaag gcgcaccaga aaccttcctg 120
cgtgacatgg tcactcgaat gaaagaggcc ggcgatgtgg caccaccctg gggatacaaa 180
ctggcctggt ctggtttcct cgggcgcgtg atcgccccgg cctggaaagt cgataaggat 240
atcgatctgg attatcacgt ccggcactca gccctgcctc gccccggcgg ggagcgcgaa 300
ctgggtattc tggtatcccg actgcactct aacagtctgg atttttcccg ccctctttgg 360
gaatgccacg ttattgaagg cctggagaat aaccgttttg ccctttacac caaaatgcac 420
cactcgatga ttgacggcat cagcggcgtg cgactgatgc agagggtgct caccaccgat 480
cccgaacgct gcaatatgcc accgccctgg acgcgccgcc cacaccagcg ccgtggtgca 540
aaaaccgaca aagaggccag cgtgcgggca gcggtttccc aggcaatgga cgccctgaag 600
ctccaggcag acatggcccc caggctgtgg caggccggca atcgcctggt gcattcggtt 660
cgacacccgg aagacggact gaccgcgccc ttcactggac cggtttcggt gctcaatcac 720
cgggttaccg cgggccgacg ttttgccacc cagcattatc aactggaccg gctgaaaaac 780
ctggcccatg cttccggcgg tgggttgaac gacatcgttc tttacctgtg tggcaccgca 840
ttgcggcgct ttctggctga gcagaacaat ctgccagaca ccccgctgac ggctggtata 900
ccggtgaata tccggccggc agacgacgag gtcacgggca cccagatcag ttggatgatt 960
tgttcgctgg ccaccgacga agctgatccg ttgaaccgcc tgcaacagat caaaacctcg 1020
acccgacggg ccaaggagca cctgcagaaa cttccaaaaa cggccctgac ccagtacacc 1080
atgctgctga tgtcaccctg gattctgcaa ttgatgtcag gtctcggggg gaggatgcga 1140
ccagtcttca acgtgaccat ttccaacgtg cccggcccgg aaggcacgct gtattatgaa 1200
ggagcccggc ttgaggccat gtatccgttg tcgctaatcg ctcacggcgg cgccctgaac 1260
atcacctgcc tgagctatgc cggatcgctg aatttcggtt ttaccggctg tcgggatacg 1320
ctgccgggga tgcagaaact ggcggtttat accggtgaag ctctggatga gctggaatcg 1380
ctgattctgc cacccaagaa gcgcgcccga acccgcaagt aa 1422
<210> 20
<211> 473
<212> PRT
<213> Marinobacter hydrocarbonoclasticus
<400> 20
Met Lys Arg Leu Gly Ser Leu Asp Ala Ser Trp Leu Ala Val Glu Gly
1 5 10 15
Glu Asp Thr Pro Met His Val Gly Thr Leu Gln Ile Phe Ser Leu Pro
20 25 30
Glu Gly Ala Pro Glu Thr Phe Leu Arg Asp Met Val Thr Arg Met Lys
35 40 45
Glu Ala Gly Asp Val Ala Pro Pro Trp Gly Tyr Lys Leu Ala Trp Ser
50 55 60
Gly Phe Leu Gly Arg Val Ile Ala Pro Ala Trp Lys Val Asp Lys Asp
65 70 75 80
Ile Asp Leu Asp Tyr His Val Arg His Ser Ala Leu Pro Arg Pro Gly
85 90 95
Gly Glu Arg Glu Leu Gly Ile Leu Val Ser Arg Leu His Ser Asn Ser
100 105 110
Leu Asp Phe Ser Arg Pro Leu Trp Glu Cys His Val Ile Glu Gly Leu
115 120 125
Glu Asn Asn Arg Phe Ala Leu Tyr Thr Lys Met His His Ser Met Ile
130 135 140
Asp Gly Ile Ser Gly Val Arg Leu Met Gln Arg Val Leu Thr Thr Asp
145 150 155 160
Pro Glu Arg Cys Asn Met Pro Pro Pro Trp Thr Arg Arg Pro His Gln
165 170 175
Arg Arg Gly Ala Lys Thr Asp Lys Glu Ala Ser Val Arg Ala Ala Val
180 185 190
Ser Gln Ala Met Asp Ala Leu Lys Leu Gln Ala Asp Met Ala Pro Arg
195 200 205
Leu Trp Gln Ala Gly Asn Arg Leu Val His Ser Val Arg His Pro Glu
210 215 220
Asp Gly Leu Thr Ala Pro Phe Thr Gly Pro Val Ser Val Leu Asn His
225 230 235 240
Arg Val Thr Ala Gly Arg Arg Phe Ala Thr Gln His Tyr Gln Leu Asp
245 250 255
Arg Leu Lys Asn Leu Ala His Ala Ser Gly Gly Gly Leu Asn Asp Ile
260 265 270
Val Leu Tyr Leu Cys Gly Thr Ala Leu Arg Arg Phe Leu Ala Glu Gln
275 280 285
Asn Asn Leu Pro Asp Thr Pro Leu Thr Ala Gly Ile Pro Val Asn Ile
290 295 300
Arg Pro Ala Asp Asp Glu Val Thr Gly Thr Gln Ile Ser Trp Met Ile
305 310 315 320
Cys Ser Leu Ala Thr Asp Glu Ala Asp Pro Leu Asn Arg Leu Gln Gln
325 330 335
Ile Lys Thr Ser Thr Arg Arg Ala Lys Glu His Leu Gln Lys Leu Pro
340 345 350
Lys Thr Ala Leu Thr Gln Tyr Thr Met Leu Leu Met Ser Pro Trp Ile
355 360 365
Leu Gln Leu Met Ser Gly Leu Gly Gly Arg Met Arg Pro Val Phe Asn
370 375 380
Val Thr Ile Ser Asn Val Pro Gly Pro Glu Gly Thr Leu Tyr Tyr Glu
385 390 395 400
Gly Ala Arg Leu Glu Ala Met Tyr Pro Leu Ser Leu Ile Ala His Gly
405 410 415
Gly Ala Leu Asn Ile Thr Cys Leu Ser Tyr Ala Gly Ser Leu Asn Phe
420 425 430
Gly Phe Thr Gly Cys Arg Asp Thr Leu Pro Gly Met Gln Lys Leu Ala
435 440 445
Val Tyr Thr Gly Glu Ala Leu Asp Glu Leu Glu Ser Leu Ile Leu Pro
450 455 460
Pro Lys Lys Arg Ala Arg Thr Arg Lys
465 470
<210> 21
<211> 1422
<212> DNA
<213> Marinobacter hydrocarbonoclasticus
<400> 21
atgaaacgtc tcggaaccct ggacgcctcc tggctggcgg ttgaaggtga agacaccccg 60
atgcatgtgg gtacgcttca gattttctca ctgccggaag gcgcaccaga aaccttcctg 120
cgtgacatgg tcactcgaat gaaagaggcc ggcgatgtgg caccaccctg gggatacaaa 180
ctggcctggt ctggtttcct cgggcgcgtg atcgccccgg cctggaaagt cgataaggat 240
atcgatctgg attatcacgt ccggcactca gccctgcctc gccccggcgg ggagcgcgaa 300
ctgggtattc tggtatcccg actgcactct aacagtctgg atttttcccg ccctctttgg 360
gaatgccacg ttattgaagg cctggagaat aaccgttttg ccctttacac caaaatgcac 420
cactcgatga ttgacggcat cagcggcgtg cgactgatgc agaggggcct caccaccgat 480
cccgaacgct gcaatatgtc accgccctgg acgcgccgcc cacaccagcg ccgtggtgca 540
aaaaccgaca aagaggccag cgtgcgggca gcggtttccc aggcaatgga cgccctgaag 600
ctccaggcag acatggcccc caggctgtgg caggccggca atcgcctggt gcattcggtt 660
cgacacccgg aagacggact gaccgcgccc ttcactggac cggtttcggt gctcaatcac 720
cgggttaccg cgcagcgacg ttttgccacc cagcattatc aactggaccg gctgaaaaac 780
ctggcccatg cttccggcgg ttccttgaac gacatcgttc tttacctgtg tggcaccgca 840
ttgcggcgct ttctggctga gcagaacaat ctgccagaca ccccgctgac ggctggtata 900
ccggtgaata tccggccggc agacgacgag ggtacgggca cccagatcag ttggatgatt 960
gcctcgctgg ccaccgacga agctgatccg ttgaaccgcc tgcaacagat caaaacctcg 1020
acccgacggg ccaaggagca cctggcgaaa cttccaaaaa cggccctgac ccagtacacc 1080
atgctgctga tgtcacccta cattctgcaa ttgatgtcag gtctcggggg gaggatgcga 1140
ccattcttca acgtgaccat ttccaacgtg cccggcccgg aaggcacgct gtattatgaa 1200
ggagcccggc ttgaggccat gtatccgttg tcgctaatcg ctcacggcgg cgccctgaac 1260
atcacctgcc tgagctatgc cggatcgctg aatttcggtt ttaccggctg tcgggatacg 1320
ctgccgggga tgcagaaact ggcggtttat accggtgaag ctctggatga gctggaatcg 1380
ctgattctgc cacccaagaa gcgcgcccga acccgcaagt aa 1422
<210> 22
<211> 473
<212> PRT
<213> Marinobacter hydrocarbonoclasticus
<400> 22
Met Lys Arg Leu Gly Thr Leu Asp Ala Ser Trp Leu Ala Val Glu Gly
1 5 10 15
Glu Asp Thr Pro Met His Val Gly Thr Leu Gln Ile Phe Ser Leu Pro
20 25 30
Glu Gly Ala Pro Glu Thr Phe Leu Arg Asp Met Val Thr Arg Met Lys
35 40 45
Glu Ala Gly Asp Val Ala Pro Pro Trp Gly Tyr Lys Leu Ala Trp Ser
50 55 60
Gly Phe Leu Gly Arg Val Ile Ala Pro Ala Trp Lys Val Asp Lys Asp
65 70 75 80
Ile Asp Leu Asp Tyr His Val Arg His Ser Ala Leu Pro Arg Pro Gly
85 90 95
Gly Glu Arg Glu Leu Gly Ile Leu Val Ser Arg Leu His Ser Asn Ser
100 105 110
Leu Asp Phe Ser Arg Pro Leu Trp Glu Cys His Val Ile Glu Gly Leu
115 120 125
Glu Asn Asn Arg Phe Ala Leu Tyr Thr Lys Met His His Ser Met Ile
130 135 140
Asp Gly Ile Ser Gly Val Arg Leu Met Gln Arg Gly Leu Thr Thr Asp
145 150 155 160
Pro Glu Arg Cys Asn Met Ser Pro Pro Trp Thr Arg Arg Pro His Gln
165 170 175
Arg Arg Gly Ala Lys Thr Asp Lys Glu Ala Ser Val Arg Ala Ala Val
180 185 190
Ser Gln Ala Met Asp Ala Leu Lys Leu Gln Ala Asp Met Ala Pro Arg
195 200 205
Leu Trp Gln Ala Gly Asn Arg Leu Val His Ser Val Arg His Pro Glu
210 215 220
Asp Gly Leu Thr Ala Pro Phe Thr Gly Pro Val Ser Val Leu Asn His
225 230 235 240
Arg Val Thr Ala Gln Arg Arg Phe Ala Thr Gln His Tyr Gln Leu Asp
245 250 255
Arg Leu Lys Asn Leu Ala His Ala Ser Gly Gly Ser Leu Asn Asp Ile
260 265 270
Val Leu Tyr Leu Cys Gly Thr Ala Leu Arg Arg Phe Leu Ala Glu Gln
275 280 285
Asn Asn Leu Pro Asp Thr Pro Leu Thr Ala Gly Ile Pro Val Asn Ile
290 295 300
Arg Pro Ala Asp Asp Glu Gly Thr Gly Thr Gln Ile Ser Trp Met Ile
305 310 315 320
Ala Ser Leu Ala Thr Asp Glu Ala Asp Pro Leu Asn Arg Leu Gln Gln
325 330 335
Ile Lys Thr Ser Thr Arg Arg Ala Lys Glu His Leu Ala Lys Leu Pro
340 345 350
Lys Thr Ala Leu Thr Gln Tyr Thr Met Leu Leu Met Ser Pro Tyr Ile
355 360 365
Leu Gln Leu Met Ser Gly Leu Gly Gly Arg Met Arg Pro Phe Phe Asn
370 375 380
Val Thr Ile Ser Asn Val Pro Gly Pro Glu Gly Thr Leu Tyr Tyr Glu
385 390 395 400
Gly Ala Arg Leu Glu Ala Met Tyr Pro Leu Ser Leu Ile Ala His Gly
405 410 415
Gly Ala Leu Asn Ile Thr Cys Leu Ser Tyr Ala Gly Ser Leu Asn Phe
420 425 430
Gly Phe Thr Gly Cys Arg Asp Thr Leu Pro Gly Met Gln Lys Leu Ala
435 440 445
Val Tyr Thr Gly Glu Ala Leu Asp Glu Leu Glu Ser Leu Ile Leu Pro
450 455 460
Pro Lys Lys Arg Ala Arg Thr Arg Lys
465 470
<210> 23
<211> 1422
<212> DNA
<213> Marinobacter hydrocarbonoclasticus
<400> 23
atgaaacgtc tcggaaccct ggacgcctcc tggctggcgg ttgaaggtga agacaccccg 60
atgcatgtgg gtacgcttca gattttctca ctgccggaag gcgcaccaga aaccttctcg 120
cgtgacatgg tcactcgaat gaaagaggcc ggcgatgtgg caccaccctg gggatacaaa 180
ctggcctggt ctggtttcct cgggcgcgtg atcgccccgg cctggaaagt cgcgaaggat 240
atcgatctgg attatcacgt ccggcactca gccctgcctc gccccggcgg ggagcgcgaa 300
ctgggtattc tggtatcccg actgcactct aacagtctgg atttttcccg ccctctttgg 360
gaatgccacg ttattgaagg cctggagaat aaccgttttg ccctttacac caaaatgcac 420
cactcgatga ttgacggcat cagcggcgtg cgactgatgc agagggtgct caccaccgat 480
cccgaacgct gcaatatgcc accgccctgg acgcgccgcc cacaccagcg ccgtggtgca 540
aaaaccgaca aagaggccag cgtgcgggca gcggtttccc aggcaatgga cgccctgaag 600
ctccaggcag acatggcccc caggctgtgg caggccggca atcgcctggt gcattcggtt 660
cgacacccgg aagacggact gaccgcgccc ttcactggac cggtttcggt gctcaatcac 720
cgggttaccg cgcagcgacg ttttgccacc cagcattatc aactggaccg gctgaaaaac 780
ctggcccatg cttccggcgg ttccttgaac gacatcgttc tttacctgtg tggcaccgca 840
ttgcggcgct ttctggctga gcagaacaat ctgccagaca ccccgctgac ggctggtata 900
ccggtgaata tccggccggc agacgacgag ggtacgggca gtcagatcag ttggatgatt 960
gcctcgctgg ccaccgacga agctgatccg ttgaaccgcc tgcaacagat caaaacctcg 1020
acccgacggg ccaaggagca cctggcgaaa cttccaaaaa cggccctgac ccagtacacc 1080
atgctgctga tgtcacccta cattctgcaa ttgatgtcag gtctcggggg gaggatgcga 1140
ccattcttca acgtgaccat ttccaacgtg cccggcccgg aaggcacgct gtattatgaa 1200
ggagcccggc ttgaggccat gtatccgttg tcgctaatcg ctcacggcgg cgccctgaac 1260
gtgacctgcc tgagctatgc cggatcgctg aatttcggtt ttaccggctg tcgggatacg 1320
ctgccgggga tgcagaaact ggcggtttat accggtgaag ctctggatga gctggaatcg 1380
ctgattctgc cacccaagaa gcgcgcccga acccgcaagt aa 1422
<210> 24
<211> 473
<212> PRT
<213> Marinobacter hydrocarbonoclasticus
<400> 24
Met Lys Arg Leu Gly Thr Leu Asp Ala Ser Trp Leu Ala Val Glu Gly
1 5 10 15
Glu Asp Thr Pro Met His Val Gly Thr Leu Gln Ile Phe Ser Leu Pro
20 25 30
Glu Gly Ala Pro Glu Thr Phe Ser Arg Asp Met Val Thr Arg Met Lys
35 40 45
Glu Ala Gly Asp Val Ala Pro Pro Trp Gly Tyr Lys Leu Ala Trp Ser
50 55 60
Gly Phe Leu Gly Arg Val Ile Ala Pro Ala Trp Lys Val Ala Lys Asp
65 70 75 80
Ile Asp Leu Asp Tyr His Val Arg His Ser Ala Leu Pro Arg Pro Gly
85 90 95
Gly Glu Arg Glu Leu Gly Ile Leu Val Ser Arg Leu His Ser Asn Ser
100 105 110
Leu Asp Phe Ser Arg Pro Leu Trp Glu Cys His Val Ile Glu Gly Leu
115 120 125
Glu Asn Asn Arg Phe Ala Leu Tyr Thr Lys Met His His Ser Met Ile
130 135 140
Asp Gly Ile Ser Gly Val Arg Leu Met Gln Arg Val Leu Thr Thr Asp
145 150 155 160
Pro Glu Arg Cys Asn Met Pro Pro Pro Trp Thr Arg Arg Pro His Gln
165 170 175
Arg Arg Gly Ala Lys Thr Asp Lys Glu Ala Ser Val Arg Ala Ala Val
180 185 190
Ser Gln Ala Met Asp Ala Leu Lys Leu Gln Ala Asp Met Ala Pro Arg
195 200 205
Leu Trp Gln Ala Gly Asn Arg Leu Val His Ser Val Arg His Pro Glu
210 215 220
Asp Gly Leu Thr Ala Pro Phe Thr Gly Pro Val Ser Val Leu Asn His
225 230 235 240
Arg Val Thr Ala Gln Arg Arg Phe Ala Thr Gln His Tyr Gln Leu Asp
245 250 255
Arg Leu Lys Asn Leu Ala His Ala Ser Gly Gly Ser Leu Asn Asp Ile
260 265 270
Val Leu Tyr Leu Cys Gly Thr Ala Leu Arg Arg Phe Leu Ala Glu Gln
275 280 285
Asn Asn Leu Pro Asp Thr Pro Leu Thr Ala Gly Ile Pro Val Asn Ile
290 295 300
Arg Pro Ala Asp Asp Glu Gly Thr Gly Ser Gln Ile Ser Trp Met Ile
305 310 315 320
Ala Ser Leu Ala Thr Asp Glu Ala Asp Pro Leu Asn Arg Leu Gln Gln
325 330 335
Ile Lys Thr Ser Thr Arg Arg Ala Lys Glu His Leu Ala Lys Leu Pro
340 345 350
Lys Thr Ala Leu Thr Gln Tyr Thr Met Leu Leu Met Ser Pro Tyr Ile
355 360 365
Leu Gln Leu Met Ser Gly Leu Gly Gly Arg Met Arg Pro Phe Phe Asn
370 375 380
Val Thr Ile Ser Asn Val Pro Gly Pro Glu Gly Thr Leu Tyr Tyr Glu
385 390 395 400
Gly Ala Arg Leu Glu Ala Met Tyr Pro Leu Ser Leu Ile Ala His Gly
405 410 415
Gly Ala Leu Asn Val Thr Cys Leu Ser Tyr Ala Gly Ser Leu Asn Phe
420 425 430
Gly Phe Thr Gly Cys Arg Asp Thr Leu Pro Gly Met Gln Lys Leu Ala
435 440 445
Val Tyr Thr Gly Glu Ala Leu Asp Glu Leu Glu Ser Leu Ile Leu Pro
450 455 460
Pro Lys Lys Arg Ala Arg Thr Arg Lys
465 470
<210> 25
<211> 1422
<212> DNA
<213> Marinobacter hydrocarbonoclasticus
<400> 25
atgaaacgtc tcggatccct ggacgcctcc tggctggcgg ttgaaggtga agacaccccg 60
atgcatgtgg gttggcttca gattttctca ctgccggaag gcgcaccaga aaccttcctg 120
cgtgacatgg tcttccgaat gaaagaggcc ggcgatgtgg caccaccctg gggatacaaa 180
ctggcctggt ctggtttcct cgggcgcgtg atcgccccgg cctggaaagt cgataaggat 240
atcgatctgg attatcacgt ccggcactca gccctgcctc gccccggcgg ggagcgcgaa 300
ctgggtattc tggtatcccg actgcactct aacagtctgg atttttcccg ccctctttgg 360
gaatgccacg ttattgaagg cctggagaat aaccgttttg ccctttacac caaaatgcac 420
cactcgatga ttgacggctt gagcggcgtg cgactgatgc agagggtgct caccaccgat 480
cccgaacgct gcaatatgcc accgccctgg acgcgccgcc cacaccagcg ccgtggtgca 540
aaaaccgaca aagaggccag cgtgcgggca gcggtttccc aggcaatgga cgccctgaag 600
ctccaggcag acatggcccc caggctgtgg caggccggca atcgcctggt gcattcggtt 660
cgacacccgg aagacggact gaccgcgccc ttcactggac cggtttcggt gctcaatcac 720
cgggttaccg cgcagcgacg ttttgccacc cagcattatc aactggaccg gctgaaaaac 780
ctggcccatg cttccggcgg ttccttgaac gacatcgttc tttacctgtg tggcaccgca 840
ttgcggcgct ttctggctga gcagaacaat ctgccagaca ccccgctgac ggctggtata 900
ccggtgaata tccggccggc aaacgacgag ggtacgggca cccagatcag ttggatgatt 960
gcctcgctgg ccaccgacga agctgatccg ttgaaccgcc tgcaacagat caaaacctcg 1020
acccgacggg ccaaggagca cctgcagaaa cttccaaaaa cggccctgac ccagtacacc 1080
atgctgctga tgtcacccta cattctgcaa ttgatgtcag gtctcggggg gaggatgcga 1140
ccagtcttca acgtgaccat ttccaacgtg cccggcccgg aaggcacgct gtattatgaa 1200
ggagcccggc ttgaggccat gtatccgttg tcgctaatcg ctcacggcgg cgccctgaac 1260
atcacctgcc tgagctatgc cggatcgctg aatttcggtt ttaccggctg tcgggatacg 1320
ctgccgggga tgcagaaact ggcggtttat accggtgaag ctctggatga gctggaatcg 1380
ctgattctgc cacccaagaa gcgcgcccga acccgcaagt aa 1422
<210> 26
<211> 473
<212> PRT
<213> Marinobacter hydrocarbonoclasticus
<400> 26
Met Lys Arg Leu Gly Ser Leu Asp Ala Ser Trp Leu Ala Val Glu Gly
1 5 10 15
Glu Asp Thr Pro Met His Val Gly Trp Leu Gln Ile Phe Ser Leu Pro
20 25 30
Glu Gly Ala Pro Glu Thr Phe Leu Arg Asp Met Val Phe Arg Met Lys
35 40 45
Glu Ala Gly Asp Val Ala Pro Pro Trp Gly Tyr Lys Leu Ala Trp Ser
50 55 60
Gly Phe Leu Gly Arg Val Ile Ala Pro Ala Trp Lys Val Asp Lys Asp
65 70 75 80
Ile Asp Leu Asp Tyr His Val Arg His Ser Ala Leu Pro Arg Pro Gly
85 90 95
Gly Glu Arg Glu Leu Gly Ile Leu Val Ser Arg Leu His Ser Asn Ser
100 105 110
Leu Asp Phe Ser Arg Pro Leu Trp Glu Cys His Val Ile Glu Gly Leu
115 120 125
Glu Asn Asn Arg Phe Ala Leu Tyr Thr Lys Met His His Ser Met Ile
130 135 140
Asp Gly Leu Ser Gly Val Arg Leu Met Gln Arg Val Leu Thr Thr Asp
145 150 155 160
Pro Glu Arg Cys Asn Met Pro Pro Pro Trp Thr Arg Arg Pro His Gln
165 170 175
Arg Arg Gly Ala Lys Thr Asp Lys Glu Ala Ser Val Arg Ala Ala Val
180 185 190
Ser Gln Ala Met Asp Ala Leu Lys Leu Gln Ala Asp Met Ala Pro Arg
195 200 205
Leu Trp Gln Ala Gly Asn Arg Leu Val His Ser Val Arg His Pro Glu
210 215 220
Asp Gly Leu Thr Ala Pro Phe Thr Gly Pro Val Ser Val Leu Asn His
225 230 235 240
Arg Val Thr Ala Gln Arg Arg Phe Ala Thr Gln His Tyr Gln Leu Asp
245 250 255
Arg Leu Lys Asn Leu Ala His Ala Ser Gly Gly Ser Leu Asn Asp Ile
260 265 270
Val Leu Tyr Leu Cys Gly Thr Ala Leu Arg Arg Phe Leu Ala Glu Gln
275 280 285
Asn Asn Leu Pro Asp Thr Pro Leu Thr Ala Gly Ile Pro Val Asn Ile
290 295 300
Arg Pro Ala Asn Asp Glu Gly Thr Gly Thr Gln Ile Ser Trp Met Ile
305 310 315 320
Ala Ser Leu Ala Thr Asp Glu Ala Asp Pro Leu Asn Arg Leu Gln Gln
325 330 335
Ile Lys Thr Ser Thr Arg Arg Ala Lys Glu His Leu Gln Lys Leu Pro
340 345 350
Lys Thr Ala Leu Thr Gln Tyr Thr Met Leu Leu Met Ser Pro Tyr Ile
355 360 365
Leu Gln Leu Met Ser Gly Leu Gly Gly Arg Met Arg Pro Val Phe Asn
370 375 380
Val Thr Ile Ser Asn Val Pro Gly Pro Glu Gly Thr Leu Tyr Tyr Glu
385 390 395 400
Gly Ala Arg Leu Glu Ala Met Tyr Pro Leu Ser Leu Ile Ala His Gly
405 410 415
Gly Ala Leu Asn Ile Thr Cys Leu Ser Tyr Ala Gly Ser Leu Asn Phe
420 425 430
Gly Phe Thr Gly Cys Arg Asp Thr Leu Pro Gly Met Gln Lys Leu Ala
435 440 445
Val Tyr Thr Gly Glu Ala Leu Asp Glu Leu Glu Ser Leu Ile Leu Pro
450 455 460
Pro Lys Lys Arg Ala Arg Thr Arg Lys
465 470
<210> 27
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 27
atgaaacgtc tcggaaccct ggac 24
<210> 28
<211> 1446
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 28
atgaaacgtc tcggaaccct ggacatgaaa cgtctcggaa ccctggacgc ctcctggctg 60
gcggttgaat ctgaagacac cccgatgcat gtgggtacgc ttcagatttt ctcactgccg 120
gaaggcgcac cagaaacctt cctgcgtgac atggtcactc gaatgaaaga ggccggcgat 180
gtggcaccac cctggggata caaactggcc tggtctggtt tcctcgggcg cgtgatcgcc 240
ccggcctgga aagtcgataa ggatatcgat ctggattatc acgtccggca ctcagccctg 300
cctcgccccg gcggggagcg cgaactgggt attctggtat cccgactgca ctctaacccc 360
ctggattttt cccgccctct ttgggaatgc cacgttattg aaggcctgga gaataaccgt 420
tttgcccttt acaccaaaat gcaccactcg atgattgacg gcatcagcgg cgtgcgactg 480
atgcagaggg tgctcaccac cgatcccgaa cgctgcaata tgccaccgcc ctggacggta 540
cgcccacacc agcgccgtgg tgcaaaaacc gacaaagagg ccagcgtgcc cgcagcggtt 600
tcccaggcaa tggacgccct gaagctccag gcagacatgg cccccaggct gtggcaggcc 660
ggcaatcgcc tggtgcattc ggttcgacac ccggaagacg gactgaccgc gcccttcact 720
ggaccggttt cggtgctcaa tcaccgggtt accgcgcagc gacgttttgc cacccagcat 780
tatcaactgg accggctgaa aaacctggcc catgcttccg gcggttcctt gaacgacatc 840
gttctttacc tgtgtggcac cgcattgcgg cgctttctgg ctgagcagaa caatctgcca 900
gacaccccgc tgacggctgg tataccggtg aatatccggc cggcagacga cgagggtacg 960
ggcacccaga tcagttttat gattgcctcg ctggccaccg acgaagctga tccgttgaac 1020
cgcctgcaac agatcaaaac ctcgacccga cgggccaagg agcacctgca gaaacttcca 1080
aaaagtgccc tgacccagta caccatgctg ctgatgtcac cctacattct gcaattgatg 1140
tcaggtctcg gggggaggat gcgaccagtc ttcaacgtga ccatttccaa cgtgcccggc 1200
ccggaaggca cgctgtatta tgaaggagcc cggcttgagg ccatgtatcc ggtatcgcta 1260
atcgctcacg gcggcgccct gaacatcacc tgcctgagct atgccggatc gctgaatttc 1320
ggttttaccg gctgtcggga tacgctgccg agcatgcaga aactggcggt ttataccggt 1380
gaagctctgg atgagctgga atcgctgatt ctgccaccca agaagcgcgc ccgaacccgc 1440
aagtaa 1446
<210> 29
<211> 481
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 29
Met Lys Arg Leu Gly Thr Leu Asp Met Lys Arg Leu Gly Thr Leu Asp
1 5 10 15
Ala Ser Trp Leu Ala Val Glu Ser Glu Asp Thr Pro Met His Val Gly
20 25 30
Thr Leu Gln Ile Phe Ser Leu Pro Glu Gly Ala Pro Glu Thr Phe Leu
35 40 45
Arg Asp Met Val Thr Arg Met Lys Glu Ala Gly Asp Val Ala Pro Pro
50 55 60
Trp Gly Tyr Lys Leu Ala Trp Ser Gly Phe Leu Gly Arg Val Ile Ala
65 70 75 80
Pro Ala Trp Lys Val Asp Lys Asp Ile Asp Leu Asp Tyr His Val Arg
85 90 95
His Ser Ala Leu Pro Arg Pro Gly Gly Glu Arg Glu Leu Gly Ile Leu
100 105 110
Val Ser Arg Leu His Ser Asn Pro Leu Asp Phe Ser Arg Pro Leu Trp
115 120 125
Glu Cys His Val Ile Glu Gly Leu Glu Asn Asn Arg Phe Ala Leu Tyr
130 135 140
Thr Lys Met His His Ser Met Ile Asp Gly Ile Ser Gly Val Arg Leu
145 150 155 160
Met Gln Arg Val Leu Thr Thr Asp Pro Glu Arg Cys Asn Met Pro Pro
165 170 175
Pro Trp Thr Val Arg Pro His Gln Arg Arg Gly Ala Lys Thr Asp Lys
180 185 190
Glu Ala Ser Val Pro Ala Ala Val Ser Gln Ala Met Asp Ala Leu Lys
195 200 205
Leu Gln Ala Asp Met Ala Pro Arg Leu Trp Gln Ala Gly Asn Arg Leu
210 215 220
Val His Ser Val Arg His Pro Glu Asp Gly Leu Thr Ala Pro Phe Thr
225 230 235 240
Gly Pro Val Ser Val Leu Asn His Arg Val Thr Ala Gln Arg Arg Phe
245 250 255
Ala Thr Gln His Tyr Gln Leu Asp Arg Leu Lys Asn Leu Ala His Ala
260 265 270
Ser Gly Gly Ser Leu Asn Asp Ile Val Leu Tyr Leu Cys Gly Thr Ala
275 280 285
Leu Arg Arg Phe Leu Ala Glu Gln Asn Asn Leu Pro Asp Thr Pro Leu
290 295 300
Thr Ala Gly Ile Pro Val Asn Ile Arg Pro Ala Asp Asp Glu Gly Thr
305 310 315 320
Gly Thr Gln Ile Ser Phe Met Ile Ala Ser Leu Ala Thr Asp Glu Ala
325 330 335
Asp Pro Leu Asn Arg Leu Gln Gln Ile Lys Thr Ser Thr Arg Arg Ala
340 345 350
Lys Glu His Leu Gln Lys Leu Pro Lys Ser Ala Leu Thr Gln Tyr Thr
355 360 365
Met Leu Leu Met Ser Pro Tyr Ile Leu Gln Leu Met Ser Gly Leu Gly
370 375 380
Gly Arg Met Arg Pro Val Phe Asn Val Thr Ile Ser Asn Val Pro Gly
385 390 395 400
Pro Glu Gly Thr Leu Tyr Tyr Glu Gly Ala Arg Leu Glu Ala Met Tyr
405 410 415
Pro Val Ser Leu Ile Ala His Gly Gly Ala Leu Asn Ile Thr Cys Leu
420 425 430
Ser Tyr Ala Gly Ser Leu Asn Phe Gly Phe Thr Gly Cys Arg Asp Thr
435 440 445
Leu Pro Ser Met Gln Lys Leu Ala Val Tyr Thr Gly Glu Ala Leu Asp
450 455 460
Glu Leu Glu Ser Leu Ile Leu Pro Pro Lys Lys Arg Ala Arg Thr Arg
465 470 475 480
Lys
<210> 30
<211> 549
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 30
atgggcaaca cccttctcgt cgtcggcgat tcactctccg caggctacca aatgcgtgca 60
gaacaaagct ggccggtatt gctgcaacct gccctgaaac agcagggtca tgagatcact 120
gtggttaatg caagcattgt gggtatgctg acgcgtcggg gtttggctcg tctgccaacc 180
ctgttacaac aacacaagcc ggcgtatgtt atcatcgaat tgggtgcggt cgatggcttg 240
cgcggttttc cggcgggcac gattcgtaat aacctgagcc agatgattac cgagattcag 300
aacgctgacg cgaagccgat gctggttcag atcaaactcc cgccgtggca cggtaaacgc 360
tacagcgaca tgttcagcag catttacccg cagctgtcta aggaactggc gacgccactg 420
ctgccgttct ttctggagca gatttatatg aagcaagaat ggatgatgaa tgacggtctg 480
catccgaaaa gcgatgcgca gccgtggatc gcagagtata tggccgagaa tatcgcgccg 540
tatttgtaa 549
<210> 31
<211> 182
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 31
Met Gly Asn Thr Leu Leu Val Val Gly Asp Ser Leu Ser Ala Gly Tyr
1 5 10 15
Gln Met Arg Ala Glu Gln Ser Trp Pro Val Leu Leu Gln Pro Ala Leu
20 25 30
Lys Gln Gln Gly His Glu Ile Thr Val Val Asn Ala Ser Ile Val Gly
35 40 45
Met Leu Thr Arg Arg Gly Leu Ala Arg Leu Pro Thr Leu Leu Gln Gln
50 55 60
His Lys Pro Ala Tyr Val Ile Ile Glu Leu Gly Ala Val Asp Gly Leu
65 70 75 80
Arg Gly Phe Pro Ala Gly Thr Ile Arg Asn Asn Leu Ser Gln Met Ile
85 90 95
Thr Glu Ile Gln Asn Ala Asp Ala Lys Pro Met Leu Val Gln Ile Lys
100 105 110
Leu Pro Pro Trp His Gly Lys Arg Tyr Ser Asp Met Phe Ser Ser Ile
115 120 125
Tyr Pro Gln Leu Ser Lys Glu Leu Ala Thr Pro Leu Leu Pro Phe Phe
130 135 140
Leu Glu Gln Ile Tyr Met Lys Gln Glu Trp Met Met Asn Asp Gly Leu
145 150 155 160
His Pro Lys Ser Asp Ala Gln Pro Trp Ile Ala Glu Tyr Met Ala Glu
165 170 175
Asn Ile Ala Pro Tyr Leu
180
<210> 32
<211> 1422
<212> DNA
<213> Marinobacter hydrocarbonoclasticus
<400> 32
atgaaacgtc tcggatccct ggacgcctcc tggctggcgg ttgaaggtga agacaccccg 60
atgcatgtgg gtacgcttca gattttctca ctgccggaag gcgcaccaga aaccttcctg 120
cgtgacatgg tcactcgaat gaaagaggcc ggcgatgtgg caccaccctg gggatacaaa 180
ctggcctggt ctggtttcct cgggcgcgtg atcgccccgg cctggaaagt cgatttcgat 240
atcgatctgg attatcacgt ccggcactca gccctgcctc gccccggcgg ggagcgcgaa 300
ctgggtattc tggtatcccg actgcactct aacagtctgg atttttcccg ccctctttgg 360
gaatgccacg ttattgaagg cctggagaat aaccgttttg ccctttacac caaaatgcac 420
cactcgatga ttgacggcat cagcggcgtg cgactgatgc agagggtgct caccaccgat 480
cccgaacgct gcaatatgcc accgccctgg acgcgccgcc cacaccagcg ccgtggtgca 540
aaaaccgaca aagaggccag cgtgcgggca gcggttgtgc aggcaatgga cgccctgaag 600
ctccaggcag acatggcccc cgcgctgtgg caggccggca atcgcctggt gcattcggtt 660
cgacacccgg aagacggact gaccgcgccc ttcactggac cggtttcggt gctcaatcac 720
cgggttacca ggcagcgccg ttttgcaacc caacactatc agctggagcg catcaagcag 780
gtggcgcagg cgagcaatgg ctccctgaat gacatcgtct tgtatctgtg cggcaccgca 840
ttgcgtcgct ttctggttga acaagacggt ttgccggata ccccactgac cgcaggcatc 900
ccggtgaata tccggccggc agacgacgag ggtacgggca cccagatcag ttggatgatt 960
gcctcgctgg ccaccgacga agctgatccg ttgaaccgcc tgcaacagat caaaacctcg 1020
acccgacggg ccaaggagca cctgaggaaa cttccaaaaa cggccctgac ccagtacacc 1080
atgctgctga tgtcacccta cattctgcaa ttgatgtcag gtctcggggg gaggatgcga 1140
ccattcttca acgtgaccat ttccaacgtg cccggcccgg aaggcacgct gtattatgaa 1200
ggagcccggc ttgaggccat gtatccgttg tcgctaatcg ctcacggcgg cgccctgaac 1260
atcacctgcc tgagctatgc cggatcgctg aatttcggtt ttaccggctg tcgggatacg 1320
ctgccgggga tgcagaaact ggcggtttat accggtgaag ctctggatga gctggaatcg 1380
ctgattctgc cacccaagaa gcgcgcccga acccgcaagt aa 1422
<210> 33
<211> 473
<212> PRT
<213> Marinobacter hydrocarbonoclasticus
<400> 33
Met Lys Arg Leu Gly Ser Leu Asp Ala Ser Trp Leu Ala Val Glu Gly
1 5 10 15
Glu Asp Thr Pro Met His Val Gly Thr Leu Gln Ile Phe Ser Leu Pro
20 25 30
Glu Gly Ala Pro Glu Thr Phe Leu Arg Asp Met Val Thr Arg Met Lys
35 40 45
Glu Ala Gly Asp Val Ala Pro Pro Trp Gly Tyr Lys Leu Ala Trp Ser
50 55 60
Gly Phe Leu Gly Arg Val Ile Ala Pro Ala Trp Lys Val Asp Phe Asp
65 70 75 80
Ile Asp Leu Asp Tyr His Val Arg His Ser Ala Leu Pro Arg Pro Gly
85 90 95
Gly Glu Arg Glu Leu Gly Ile Leu Val Ser Arg Leu His Ser Asn Ser
100 105 110
Leu Asp Phe Ser Arg Pro Leu Trp Glu Cys His Val Ile Glu Gly Leu
115 120 125
Glu Asn Asn Arg Phe Ala Leu Tyr Thr Lys Met His His Ser Met Ile
130 135 140
Asp Gly Ile Ser Gly Val Arg Leu Met Gln Arg Val Leu Thr Thr Asp
145 150 155 160
Pro Glu Arg Cys Asn Met Pro Pro Pro Trp Thr Arg Arg Pro His Gln
165 170 175
Arg Arg Gly Ala Lys Thr Asp Lys Glu Ala Ser Val Arg Ala Ala Val
180 185 190
Val Gln Ala Met Asp Ala Leu Lys Leu Gln Ala Asp Met Ala Pro Ala
195 200 205
Leu Trp Gln Ala Gly Asn Arg Leu Val His Ser Val Arg His Pro Glu
210 215 220
Asp Gly Leu Thr Ala Pro Phe Thr Gly Pro Val Ser Val Leu Asn His
225 230 235 240
Arg Val Thr Arg Gln Arg Arg Phe Ala Thr Gln His Tyr Gln Leu Glu
245 250 255
Arg Ile Lys Gln Val Ala Gln Ala Ser Asn Gly Ser Leu Asn Asp Ile
260 265 270
Val Leu Tyr Leu Cys Gly Thr Ala Leu Arg Arg Phe Leu Val Glu Gln
275 280 285
Asp Gly Leu Pro Asp Thr Pro Leu Thr Ala Gly Ile Pro Val Asn Ile
290 295 300
Arg Pro Ala Asp Asp Glu Gly Thr Gly Thr Gln Ile Ser Trp Met Ile
305 310 315 320
Ala Ser Leu Ala Thr Asp Glu Ala Asp Pro Leu Asn Arg Leu Gln Gln
325 330 335
Ile Lys Thr Ser Thr Arg Arg Ala Lys Glu His Leu Arg Lys Leu Pro
340 345 350
Lys Thr Ala Leu Thr Gln Tyr Thr Met Leu Leu Met Ser Pro Tyr Ile
355 360 365
Leu Gln Leu Met Ser Gly Leu Gly Gly Arg Met Arg Pro Phe Phe Asn
370 375 380
Val Thr Ile Ser Asn Val Pro Gly Pro Glu Gly Thr Leu Tyr Tyr Glu
385 390 395 400
Gly Ala Arg Leu Glu Ala Met Tyr Pro Leu Ser Leu Ile Ala His Gly
405 410 415
Gly Ala Leu Asn Ile Thr Cys Leu Ser Tyr Ala Gly Ser Leu Asn Phe
420 425 430
Gly Phe Thr Gly Cys Arg Asp Thr Leu Pro Gly Met Gln Lys Leu Ala
435 440 445
Val Tyr Thr Gly Glu Ala Leu Asp Glu Leu Glu Ser Leu Ile Leu Pro
450 455 460
Pro Lys Lys Arg Ala Arg Thr Arg Lys
465 470
<210> 34
<211> 1422
<212> DNA
<213> Marinobacter hydrocarbonoclasticus
<400> 34
atgaaacgtc tcggatccct ggacgcctcc tggctggcgg ttgaaggtga agacaccccg 60
atgcatgtgg gtacgcttca gattttctca ctgccggaag gcgcaccaga aaccttcctg 120
cgtgacatgg tcactcgaat gaaagaggcc ggcgatgtgg caccaccctg gggatacaaa 180
ctggcctggt ctggtttcct cgggcgcgtg atcgccccgg cctggaaagt cgatttcgat 240
atcgatctgg attatcacgt ccggcactca gccctgcctc gccccggcgg ggagcgcgaa 300
ctgggtattc tggtatcccg actgcactct aacagtctgg atttttcccg ccctctttgg 360
gaatgccacg ttattgaagg cctggagaat aaccgttttg ccctttacac caaaatgcac 420
cactcgatga ttgacggcat cagcggcgtg cgactgatgc agagggtgct caccaccgat 480
cccgaacgct gcaatatgcc accgccctgg acgcgccgcc cacaccagcg ccgtggtgca 540
aaaaccgaca aagaggccag cgtgcgggca gcggttgtgc aggcaatgga cgccctgaag 600
ctccaggcag acatggcccc cgcgctgtgg caggccggca atcgcctggt gcattcggtt 660
cgacacccgg aagacggact gaccgcgccc ttcactggac cggtttcggt gctcaatcac 720
cgggttacca ggcagcgccg ttttgcaacc caacactatc agctggagcg catcaagcag 780
gtggcgcagg cgagcaatgg ctccctgaat gacatcgtct tgtatctgtg cggcaccgca 840
ttgcgtcgct ttctggttga acaagacggt ttgccggata ccccactgac cgcaggcatc 900
ccggtgaata tccggccggc agacgacgag ggtacgggca cccagatcag ttggatgatt 960
gcctcgctgg ccaccgacga agctgatccg ttgaaccgcc tgcaacagat caaaacctcg 1020
acccgacggg ccaaggagca cctgcagcac cttccaaaaa cggccctgac ccagtacacc 1080
atgctgctga tgtcacccta cattctgcaa ttgatgtcag gtctcggggg gaggatgcga 1140
ccattcttca acgtgaccat ttccaacgtg cccggcccgg aaggcacgct gtattatgaa 1200
ggagcccggc ttgaggccat gtatccgttg tcgctaatcg ctcacggcgg cgccctgaac 1260
atcacctgcc tgagctatgc cggatcgctg aatttcggtt ttaccggctg tcgggatacg 1320
ctgccgggga tgcagaaact ggcggtttat accggtgaag ctctggatga gctggaatcg 1380
ctgattctgc cacccaagaa gcgcgcccga acccgcaagt aa 1422
<210> 35
<211> 473
<212> PRT
<213> Marinobacter hydrocarbonoclasticus
<400> 35
Met Lys Arg Leu Gly Ser Leu Asp Ala Ser Trp Leu Ala Val Glu Gly
1 5 10 15
Glu Asp Thr Pro Met His Val Gly Thr Leu Gln Ile Phe Ser Leu Pro
20 25 30
Glu Gly Ala Pro Glu Thr Phe Leu Arg Asp Met Val Thr Arg Met Lys
35 40 45
Glu Ala Gly Asp Val Ala Pro Pro Trp Gly Tyr Lys Leu Ala Trp Ser
50 55 60
Gly Phe Leu Gly Arg Val Ile Ala Pro Ala Trp Lys Val Asp Phe Asp
65 70 75 80
Ile Asp Leu Asp Tyr His Val Arg His Ser Ala Leu Pro Arg Pro Gly
85 90 95
Gly Glu Arg Glu Leu Gly Ile Leu Val Ser Arg Leu His Ser Asn Ser
100 105 110
Leu Asp Phe Ser Arg Pro Leu Trp Glu Cys His Val Ile Glu Gly Leu
115 120 125
Glu Asn Asn Arg Phe Ala Leu Tyr Thr Lys Met His His Ser Met Ile
130 135 140
Asp Gly Ile Ser Gly Val Arg Leu Met Gln Arg Val Leu Thr Thr Asp
145 150 155 160
Pro Glu Arg Cys Asn Met Pro Pro Pro Trp Thr Arg Arg Pro His Gln
165 170 175
Arg Arg Gly Ala Lys Thr Asp Lys Glu Ala Ser Val Arg Ala Ala Val
180 185 190
Val Gln Ala Met Asp Ala Leu Lys Leu Gln Ala Asp Met Ala Pro Ala
195 200 205
Leu Trp Gln Ala Gly Asn Arg Leu Val His Ser Val Arg His Pro Glu
210 215 220
Asp Gly Leu Thr Ala Pro Phe Thr Gly Pro Val Ser Val Leu Asn His
225 230 235 240
Arg Val Thr Arg Gln Arg Arg Phe Ala Thr Gln His Tyr Gln Leu Glu
245 250 255
Arg Ile Lys Gln Val Ala Gln Ala Ser Asn Gly Ser Leu Asn Asp Ile
260 265 270
Val Leu Tyr Leu Cys Gly Thr Ala Leu Arg Arg Phe Leu Val Glu Gln
275 280 285
Asp Gly Leu Pro Asp Thr Pro Leu Thr Ala Gly Ile Pro Val Asn Ile
290 295 300
Arg Pro Ala Asp Asp Glu Gly Thr Gly Thr Gln Ile Ser Trp Met Ile
305 310 315 320
Ala Ser Leu Ala Thr Asp Glu Ala Asp Pro Leu Asn Arg Leu Gln Gln
325 330 335
Ile Lys Thr Ser Thr Arg Arg Ala Lys Glu His Leu Gln His Leu Pro
340 345 350
Lys Thr Ala Leu Thr Gln Tyr Thr Met Leu Leu Met Ser Pro Tyr Ile
355 360 365
Leu Gln Leu Met Ser Gly Leu Gly Gly Arg Met Arg Pro Phe Phe Asn
370 375 380
Val Thr Ile Ser Asn Val Pro Gly Pro Glu Gly Thr Leu Tyr Tyr Glu
385 390 395 400
Gly Ala Arg Leu Glu Ala Met Tyr Pro Leu Ser Leu Ile Ala His Gly
405 410 415
Gly Ala Leu Asn Ile Thr Cys Leu Ser Tyr Ala Gly Ser Leu Asn Phe
420 425 430
Gly Phe Thr Gly Cys Arg Asp Thr Leu Pro Gly Met Gln Lys Leu Ala
435 440 445
Val Tyr Thr Gly Glu Ala Leu Asp Glu Leu Glu Ser Leu Ile Leu Pro
450 455 460
Pro Lys Lys Arg Ala Arg Thr Arg Lys
465 470
<210> 36
<211> 1422
<212> DNA
<213> Marinobacter hydrocarbonoclasticus
<400> 36
atgaaacgtc tcggacccct ggacgcctcc tggctggcgg ttgaaggtga agacaccccg 60
atgcatgtgg gtacgcttca gattttctca ctgccggaag acgcaccaga aaccttcctg 120
cgtgacatgg tcaagcgaat gaaagaggcc ggcgatgtgg caccaccctg gggattaaaa 180
ctggcctggt ctggtttcct cgggcgcgtg atcgccccgg cctggaaagt cgataaggat 240
atcgatctgg attatcacgt ccggcactca gccctgcctc gccccggcgg ggagcgcgaa 300
ctgggtattc tggtatcccg actgcactct aacagtctgg atttttcccg ccctctttgg 360
gaatgccacg ttattgaagg cctggagaat aaccgttttg ccctttacac caaaatgcac 420
cactcgatga ttgacggcat cagcggcgtg cgactgatgc agagggtgct caccaccgat 480
cccgaagagt gcaatatgcc accgccctgg acgcgccgcc cacaccagcg ccgtggtgca 540
aaaaccgaca aagaggccag cgtgcgggca gcggtttccc aggcaatgga cgccctgaag 600
ctccaggcag acatggcccc cgcgctgtgg caggccggca atcgcctggt gcattcggtt 660
cgacacccgg aagacggact gaccgcgccc ttcactggac cgtgctcggt gctcaatcac 720
cgggttaccg cgggccgacg ttttgccacc cagcattatc aactggagcg gctgaaaaac 780
ctggcccatg cttccggcgg tgggttgaac gacatcgttc tttacctgtg tggcaccgca 840
ttgcggcgct ttctggctga gcagaacaat ctgccagaca ccccgctgac ggctggtata 900
ccggtgaata tccggccggc aaacgacgag gtcacgggca cccagatcag ttggatgatt 960
tgttcgctgg ccaccgacga agctgatccg ttgaaccgcc tgcaacagat caaaacctcg 1020
acccgacggg ccaaggagca cctgcagaaa cttccaaaaa cggccctgac ccagtacacc 1080
atgctgctga tgtcaccctg gattctgcaa ttgatgtcag gtctcggggg gaggatgcga 1140
ccagtcttca acgtgaccat ttccaacgtg cccggcccgg aagagacgct gtattatgaa 1200
ggagcccggc ttgaggccat gtatccgttg tcgctaatcg ctcacggcgg cgccctgaac 1260
atcacctgcc tgagctatgc cggatcgctg aatttcggtt ttaccggctg tcgggatacg 1320
ctgccgggga tgcagaaact ggcggtttat accggtgaag ctctggatga gctggaatcg 1380
ctggttctgc cacccaagaa gcgcgcccga acccgcaagt aa 1422
<210> 37
<211> 473
<212> PRT
<213> Marinobacter hydrocarbonoclasticus
<400> 37
Met Lys Arg Leu Gly Pro Leu Asp Ala Ser Trp Leu Ala Val Glu Gly
1 5 10 15
Glu Asp Thr Pro Met His Val Gly Thr Leu Gln Ile Phe Ser Leu Pro
20 25 30
Glu Asp Ala Pro Glu Thr Phe Leu Arg Asp Met Val Lys Arg Met Lys
35 40 45
Glu Ala Gly Asp Val Ala Pro Pro Trp Gly Leu Lys Leu Ala Trp Ser
50 55 60
Gly Phe Leu Gly Arg Val Ile Ala Pro Ala Trp Lys Val Asp Lys Asp
65 70 75 80
Ile Asp Leu Asp Tyr His Val Arg His Ser Ala Leu Pro Arg Pro Gly
85 90 95
Gly Glu Arg Glu Leu Gly Ile Leu Val Ser Arg Leu His Ser Asn Ser
100 105 110
Leu Asp Phe Ser Arg Pro Leu Trp Glu Cys His Val Ile Glu Gly Leu
115 120 125
Glu Asn Asn Arg Phe Ala Leu Tyr Thr Lys Met His His Ser Met Ile
130 135 140
Asp Gly Ile Ser Gly Val Arg Leu Met Gln Arg Val Leu Thr Thr Asp
145 150 155 160
Pro Glu Glu Cys Asn Met Pro Pro Pro Trp Thr Arg Arg Pro His Gln
165 170 175
Arg Arg Gly Ala Lys Thr Asp Lys Glu Ala Ser Val Arg Ala Ala Val
180 185 190
Ser Gln Ala Met Asp Ala Leu Lys Leu Gln Ala Asp Met Ala Pro Ala
195 200 205
Leu Trp Gln Ala Gly Asn Arg Leu Val His Ser Val Arg His Pro Glu
210 215 220
Asp Gly Leu Thr Ala Pro Phe Thr Gly Pro Cys Ser Val Leu Asn His
225 230 235 240
Arg Val Thr Ala Gly Arg Arg Phe Ala Thr Gln His Tyr Gln Leu Glu
245 250 255
Arg Leu Lys Asn Leu Ala His Ala Ser Gly Gly Gly Leu Asn Asp Ile
260 265 270
Val Leu Tyr Leu Cys Gly Thr Ala Leu Arg Arg Phe Leu Ala Glu Gln
275 280 285
Asn Asn Leu Pro Asp Thr Pro Leu Thr Ala Gly Ile Pro Val Asn Ile
290 295 300
Arg Pro Ala Asn Asp Glu Val Thr Gly Thr Gln Ile Ser Trp Met Ile
305 310 315 320
Cys Ser Leu Ala Thr Asp Glu Ala Asp Pro Leu Asn Arg Leu Gln Gln
325 330 335
Ile Lys Thr Ser Thr Arg Arg Ala Lys Glu His Leu Gln Lys Leu Pro
340 345 350
Lys Thr Ala Leu Thr Gln Tyr Thr Met Leu Leu Met Ser Pro Trp Ile
355 360 365
Leu Gln Leu Met Ser Gly Leu Gly Gly Arg Met Arg Pro Val Phe Asn
370 375 380
Val Thr Ile Ser Asn Val Pro Gly Pro Glu Glu Thr Leu Tyr Tyr Glu
385 390 395 400
Gly Ala Arg Leu Glu Ala Met Tyr Pro Leu Ser Leu Ile Ala His Gly
405 410 415
Gly Ala Leu Asn Ile Thr Cys Leu Ser Tyr Ala Gly Ser Leu Asn Phe
420 425 430
Gly Phe Thr Gly Cys Arg Asp Thr Leu Pro Gly Met Gln Lys Leu Ala
435 440 445
Val Tyr Thr Gly Glu Ala Leu Asp Glu Leu Glu Ser Leu Val Leu Pro
450 455 460
Pro Lys Lys Arg Ala Arg Thr Arg Lys
465 470
<210> 38
<211> 1422
<212> DNA
<213> Marinobacter hydrocarbonoclasticus
<400> 38
atgaaacgtc tcggacccct ggacgcctcc tggctggcgg ttgaaggtga agacaccccg 60
atgcatgtgg gtacgcttca gattttctca ctgccggaag acgcaccaga aaccttcctg 120
cgtgacatgg tcaagcgaat gaaagaggcc ggcgatgtgg caccaccctg gggatgcaaa 180
ctggcctggt ctggtttcct cgggcgcgtg atcgccccgg cctggaaagt cgataaggat 240
atcgatctgg attatcacgt ccggcactca gccctgcctc gccccggcgg ggagcgcgaa 300
ctgggtattc tggtatcccg actgcactct aacagtctgg atttttcccg ccctctttgg 360
gaatgccacg ttattgaagg cctggagaat aaccgttttg ccctttacac caaaatgcac 420
cactcgatga ttgacggcat cagcggcgtg cgactgatgc agagggtgct caccaccgat 480
cccgaacgct gcaatatgcc accgccctgg acgcgccgcc cacaccagcg ccgtggtgca 540
aaaaccgaca aagaggccag cgtgcgggca gcggtttccc aggcaatgga cgccctgaag 600
ctccaggcag acatggcccc cgcgctgtgg caggccggca atcgcctggt gcattcggtt 660
cgacacccgg aagacggact gaccgcgccc ttcactggac cgtgctcggt gctcaatcac 720
cgggttaccg cgggccgacg ttttgccacc cagcattatc aactggaccg gatcaaaaac 780
ctggcccatg cttccggcgg tgggttgaac gacatcgttc tttacctgtg tggcaccgca 840
ttgcggcgct ttctggctga gcagaacaat ctgccagaca ccccgctgac ggctggtata 900
ccggtgaata tccggccggc aaacgacgag gtcacgggca cccagatcag ttggatgatt 960
tgttcgctgg ccaccgacga agctgatccg ttgaaccgcc tgcaacagat caaaacctcg 1020
acccgacggg ccaaggagca cctgcagaaa cttccaaaaa cggccctgac ccagtacacc 1080
atgctgctga tgtcaccctg gattctgcaa ttgatgtcag gtctcggggg gaggatgcga 1140
ccagtcttca acgtgaccat ttccaacgtg cccggcccgg aagagacgct gtattatgaa 1200
ggagcccggc ttgaggccat gtatccgttg tcgctaatca ctcacggcgg cgccctgaac 1260
atcacctgcc tgagctatgc cggatcgctg aatttcggtt ttaccggctg tcgggatacg 1320
ctgccgggga tgcagaaact ggcggtttat accggtgaag ctctggatga gctggaatcg 1380
ctggttctgc cacccaagaa gcgcgcccga acccgcaagt aa 1422
<210> 39
<211> 473
<212> PRT
<213> Marinobacter hydrocarbonoclasticus
<400> 39
Met Lys Arg Leu Gly Pro Leu Asp Ala Ser Trp Leu Ala Val Glu Gly
1 5 10 15
Glu Asp Thr Pro Met His Val Gly Thr Leu Gln Ile Phe Ser Leu Pro
20 25 30
Glu Asp Ala Pro Glu Thr Phe Leu Arg Asp Met Val Lys Arg Met Lys
35 40 45
Glu Ala Gly Asp Val Ala Pro Pro Trp Gly Cys Lys Leu Ala Trp Ser
50 55 60
Gly Phe Leu Gly Arg Val Ile Ala Pro Ala Trp Lys Val Asp Lys Asp
65 70 75 80
Ile Asp Leu Asp Tyr His Val Arg His Ser Ala Leu Pro Arg Pro Gly
85 90 95
Gly Glu Arg Glu Leu Gly Ile Leu Val Ser Arg Leu His Ser Asn Ser
100 105 110
Leu Asp Phe Ser Arg Pro Leu Trp Glu Cys His Val Ile Glu Gly Leu
115 120 125
Glu Asn Asn Arg Phe Ala Leu Tyr Thr Lys Met His His Ser Met Ile
130 135 140
Asp Gly Ile Ser Gly Val Arg Leu Met Gln Arg Val Leu Thr Thr Asp
145 150 155 160
Pro Glu Arg Cys Asn Met Pro Pro Pro Trp Thr Arg Arg Pro His Gln
165 170 175
Arg Arg Gly Ala Lys Thr Asp Lys Glu Ala Ser Val Arg Ala Ala Val
180 185 190
Ser Gln Ala Met Asp Ala Leu Lys Leu Gln Ala Asp Met Ala Pro Ala
195 200 205
Leu Trp Gln Ala Gly Asn Arg Leu Val His Ser Val Arg His Pro Glu
210 215 220
Asp Gly Leu Thr Ala Pro Phe Thr Gly Pro Cys Ser Val Leu Asn His
225 230 235 240
Arg Val Thr Ala Gly Arg Arg Phe Ala Thr Gln His Tyr Gln Leu Asp
245 250 255
Arg Ile Lys Asn Leu Ala His Ala Ser Gly Gly Gly Leu Asn Asp Ile
260 265 270
Val Leu Tyr Leu Cys Gly Thr Ala Leu Arg Arg Phe Leu Ala Glu Gln
275 280 285
Asn Asn Leu Pro Asp Thr Pro Leu Thr Ala Gly Ile Pro Val Asn Ile
290 295 300
Arg Pro Ala Asn Asp Glu Val Thr Gly Thr Gln Ile Ser Trp Met Ile
305 310 315 320
Cys Ser Leu Ala Thr Asp Glu Ala Asp Pro Leu Asn Arg Leu Gln Gln
325 330 335
Ile Lys Thr Ser Thr Arg Arg Ala Lys Glu His Leu Gln Lys Leu Pro
340 345 350
Lys Thr Ala Leu Thr Gln Tyr Thr Met Leu Leu Met Ser Pro Trp Ile
355 360 365
Leu Gln Leu Met Ser Gly Leu Gly Gly Arg Met Arg Pro Val Phe Asn
370 375 380
Val Thr Ile Ser Asn Val Pro Gly Pro Glu Glu Thr Leu Tyr Tyr Glu
385 390 395 400
Gly Ala Arg Leu Glu Ala Met Tyr Pro Leu Ser Leu Ile Thr His Gly
405 410 415
Gly Ala Leu Asn Ile Thr Cys Leu Ser Tyr Ala Gly Ser Leu Asn Phe
420 425 430
Gly Phe Thr Gly Cys Arg Asp Thr Leu Pro Gly Met Gln Lys Leu Ala
435 440 445
Val Tyr Thr Gly Glu Ala Leu Asp Glu Leu Glu Ser Leu Val Leu Pro
450 455 460
Pro Lys Lys Arg Ala Arg Thr Arg Lys
465 470
<210> 40
<211> 1422
<212> DNA
<213> Marinobacter hydrocarbonoclasticus
<400> 40
atgaaacgtc tcggacccct ggacgcctcc tggctggcgg ttgaaggtga agacaccccg 60
atgcatgtgg gtacgcttca gattttctca ctgccggaag gcgcaccaga aaccttcctg 120
cgtgacatgg tcgctcgaat gaaagaggcc ggcgatgtgg caccaccctg gggatacaaa 180
ctggcctggt ctggtttcct cgggcgcgtg atcgccccgg cctggaaagt cgataaggat 240
atcgatctgg attatcacgt ccggcactca gccctgcctc gccccggcgg ggagcgcgaa 300
ctgggtattc tggtatcccg actgcactct aacagtctgg atttttcccg ccctctttgg 360
gaatgccacg ttattgaagg cctggagaat aaccgttttg ccctttacac caaaatgcac 420
cactcgatga ttgacggcat cagcggcgtg cgactgatgc agagggtgct ctccaccgat 480
cccgaacgct gcgatatgcc accgccctgg tcgcgccgcc cacaccagcg ccgtggtgca 540
aaaaccgaca aagaggccag cgtgcgggca gcggtttccc aggcaatgga cgccctgaag 600
ctccaggcag acatggcccc cgcgctgtgg caggccggca atcgcctgat ccattcggtt 660
cgacacccgg aagacggact gaccgcgccc ttcactggac cgtgctcggt gctcaatcac 720
cgggttaccg cgggccgacg ttttgccacc cagcattatc aactggaccg gatcaaaaac 780
ctggcccatg cttccggcgg tgggttgaac gacatcgttc tttacctgtg tggcaccgca 840
ttgcggcgct ttctggctga gcagaacaat ctgccagaca ccccgctgac ggctggtata 900
ccggtgaata tccggccggc aaacgacgag gtcacgggca cccagatcag ttggatgatt 960
tgttcgctgg ccaccgacga agctgatccg ttgaaccgcc tgaaacagat caaaacctcg 1020
acccgacggg ccaaggagca cctgcagaaa cttccaaaaa cggccctgac ccagtacacc 1080
atgctgctga tgtcaccctg gattctgcaa ttgatgtcag gtctcggggg gaggatgcga 1140
ccagtcttca acgtgaccat ttccaacgtg cccggcccgg aagagacgct gtattatgaa 1200
ggagcccggc ttgaggccat gtatccgttg tcgctaatcg ctcacggcgg cgccctgaac 1260
atcacctgcc tgagctatgc cggatcgctg aatttcggtt ttaccggctg tcgggatacg 1320
ctgccgggga tgcagaaact ggcggtttat accggtgaag ctctggatga gctggaatcg 1380
ctggttctgc cacccaagaa gcgcgcccga acccgcaagt aa 1422
<210> 41
<211> 473
<212> PRT
<213> Marinobacter hydrocarbonoclasticus
<400> 41
Met Lys Arg Leu Gly Pro Leu Asp Ala Ser Trp Leu Ala Val Glu Gly
1 5 10 15
Glu Asp Thr Pro Met His Val Gly Thr Leu Gln Ile Phe Ser Leu Pro
20 25 30
Glu Gly Ala Pro Glu Thr Phe Leu Arg Asp Met Val Ala Arg Met Lys
35 40 45
Glu Ala Gly Asp Val Ala Pro Pro Trp Gly Tyr Lys Leu Ala Trp Ser
50 55 60
Gly Phe Leu Gly Arg Val Ile Ala Pro Ala Trp Lys Val Asp Lys Asp
65 70 75 80
Ile Asp Leu Asp Tyr His Val Arg His Ser Ala Leu Pro Arg Pro Gly
85 90 95
Gly Glu Arg Glu Leu Gly Ile Leu Val Ser Arg Leu His Ser Asn Ser
100 105 110
Leu Asp Phe Ser Arg Pro Leu Trp Glu Cys His Val Ile Glu Gly Leu
115 120 125
Glu Asn Asn Arg Phe Ala Leu Tyr Thr Lys Met His His Ser Met Ile
130 135 140
Asp Gly Ile Ser Gly Val Arg Leu Met Gln Arg Val Leu Ser Thr Asp
145 150 155 160
Pro Glu Arg Cys Asp Met Pro Pro Pro Trp Ser Arg Arg Pro His Gln
165 170 175
Arg Arg Gly Ala Lys Thr Asp Lys Glu Ala Ser Val Arg Ala Ala Val
180 185 190
Ser Gln Ala Met Asp Ala Leu Lys Leu Gln Ala Asp Met Ala Pro Ala
195 200 205
Leu Trp Gln Ala Gly Asn Arg Leu Ile His Ser Val Arg His Pro Glu
210 215 220
Asp Gly Leu Thr Ala Pro Phe Thr Gly Pro Cys Ser Val Leu Asn His
225 230 235 240
Arg Val Thr Ala Gly Arg Arg Phe Ala Thr Gln His Tyr Gln Leu Asp
245 250 255
Arg Ile Lys Asn Leu Ala His Ala Ser Gly Gly Gly Leu Asn Asp Ile
260 265 270
Val Leu Tyr Leu Cys Gly Thr Ala Leu Arg Arg Phe Leu Ala Glu Gln
275 280 285
Asn Asn Leu Pro Asp Thr Pro Leu Thr Ala Gly Ile Pro Val Asn Ile
290 295 300
Arg Pro Ala Asn Asp Glu Val Thr Gly Thr Gln Ile Ser Trp Met Ile
305 310 315 320
Cys Ser Leu Ala Thr Asp Glu Ala Asp Pro Leu Asn Arg Leu Lys Gln
325 330 335
Ile Lys Thr Ser Thr Arg Arg Ala Lys Glu His Leu Gln Lys Leu Pro
340 345 350
Lys Thr Ala Leu Thr Gln Tyr Thr Met Leu Leu Met Ser Pro Trp Ile
355 360 365
Leu Gln Leu Met Ser Gly Leu Gly Gly Arg Met Arg Pro Val Phe Asn
370 375 380
Val Thr Ile Ser Asn Val Pro Gly Pro Glu Glu Thr Leu Tyr Tyr Glu
385 390 395 400
Gly Ala Arg Leu Glu Ala Met Tyr Pro Leu Ser Leu Ile Ala His Gly
405 410 415
Gly Ala Leu Asn Ile Thr Cys Leu Ser Tyr Ala Gly Ser Leu Asn Phe
420 425 430
Gly Phe Thr Gly Cys Arg Asp Thr Leu Pro Gly Met Gln Lys Leu Ala
435 440 445
Val Tyr Thr Gly Glu Ala Leu Asp Glu Leu Glu Ser Leu Val Leu Pro
450 455 460
Pro Lys Lys Arg Ala Arg Thr Arg Lys
465 470
<210> 42
<211> 1422
<212> DNA
<213> Marinobacter hydrocarbonoclasticus
<400> 42
atgaaacgtc tcggacccct ggacgcctcc tggctggcgg ttgaaggtga agacaccccg 60
atgcatgtgg gtacgcttca gattttctca ctgccggaag gcgcaccaga aaccttcctg 120
cgtgacatgg tcactcgaat gaaagaggcc ggcgatgtgg caccaccctg gggattaaaa 180
ctggcctggt ctggtttcct cgggcgcgtg atcgccccgg cctggaaagt cgataaggat 240
atcgatctgg attatcacgt ccggcactca gccctgcctc gccccggcgg ggagcgcgaa 300
ctgggtattc tggtatcccg actgcactct aacagtctgg atttttcccg ccctctttgg 360
gaatgccacg ttattgaagg cctggagaat aaccgttttg ccctttacac caaaatgcac 420
cactcgatga ttgacggcat cagcggcgtg cgactgatgc agagggtgct caccaccgat 480
cccgaagagt gcaatatgcc accgccctgg tcgcgccgcc cacaccagcg ccgtggttca 540
aaaaccgaca aagaggccag cgtgcgggca gcggtttccc aggcaatgga cgccctgaag 600
ctccaggcag acatggcccc cgcgctgtgg caggccggca atcgcctggt gcattcggtt 660
cgacacccgg aagacggact gaccgcgccc ttcactggac cgtgctcggt gctcaatcac 720
cgggttaccg cgggccgacg ttttgccacc cagcattatc aactggaccg gatcaaaaac 780
ctggcccatg cttccggcgg tgggttgaac gacatcgttc tttacctgtg tggcaccgca 840
ttgcggcgct ttctggctga gcagaacaat ctgccagaca ccccgctgac ggctggtata 900
ccggtgaata tccggccggc aaacgacgag gtcacgggca cccagatcag ttggatgatt 960
tgttcgctgg ccaccgacga agctgatccg ttgaaccgcc tgcaacagat caaaacctcg 1020
acccgacggg ccaaggagca cctgcagaaa cttccaaaaa aggccctgac ccagtacacc 1080
atgctgctga tgtcaccctg gattctgcaa ttgatgtcag gtctcggggg gaggatgcga 1140
ccagtcttca acgtgaccat ttccaacgtg cccggcccgg aagagacgct gtattatgaa 1200
ggagcccggc ttgaggccat gtatccgttg tcgctaatcg ctcacggcgg cgccctgaac 1260
atcacctgcc tgagctatgc cggatcgctg aatttcggtt ttaccggctg tcgggatacg 1320
ctgccgggga tgcagaaact ggcggtttat accggtgaag ctctggatga gctggaatcg 1380
ctggttctgc cacccaagaa gcgcgcccga acccgcaagt aa 1422
<210> 43
<211> 473
<212> PRT
<213> Marinobacter hydrocarbonoclasticus
<400> 43
Met Lys Arg Leu Gly Pro Leu Asp Ala Ser Trp Leu Ala Val Glu Gly
1 5 10 15
Glu Asp Thr Pro Met His Val Gly Thr Leu Gln Ile Phe Ser Leu Pro
20 25 30
Glu Gly Ala Pro Glu Thr Phe Leu Arg Asp Met Val Thr Arg Met Lys
35 40 45
Glu Ala Gly Asp Val Ala Pro Pro Trp Gly Leu Lys Leu Ala Trp Ser
50 55 60
Gly Phe Leu Gly Arg Val Ile Ala Pro Ala Trp Lys Val Asp Lys Asp
65 70 75 80
Ile Asp Leu Asp Tyr His Val Arg His Ser Ala Leu Pro Arg Pro Gly
85 90 95
Gly Glu Arg Glu Leu Gly Ile Leu Val Ser Arg Leu His Ser Asn Ser
100 105 110
Leu Asp Phe Ser Arg Pro Leu Trp Glu Cys His Val Ile Glu Gly Leu
115 120 125
Glu Asn Asn Arg Phe Ala Leu Tyr Thr Lys Met His His Ser Met Ile
130 135 140
Asp Gly Ile Ser Gly Val Arg Leu Met Gln Arg Val Leu Thr Thr Asp
145 150 155 160
Pro Glu Glu Cys Asn Met Pro Pro Pro Trp Ser Arg Arg Pro His Gln
165 170 175
Arg Arg Gly Ser Lys Thr Asp Lys Glu Ala Ser Val Arg Ala Ala Val
180 185 190
Ser Gln Ala Met Asp Ala Leu Lys Leu Gln Ala Asp Met Ala Pro Ala
195 200 205
Leu Trp Gln Ala Gly Asn Arg Leu Val His Ser Val Arg His Pro Glu
210 215 220
Asp Gly Leu Thr Ala Pro Phe Thr Gly Pro Cys Ser Val Leu Asn His
225 230 235 240
Arg Val Thr Ala Gly Arg Arg Phe Ala Thr Gln His Tyr Gln Leu Asp
245 250 255
Arg Ile Lys Asn Leu Ala His Ala Ser Gly Gly Gly Leu Asn Asp Ile
260 265 270
Val Leu Tyr Leu Cys Gly Thr Ala Leu Arg Arg Phe Leu Ala Glu Gln
275 280 285
Asn Asn Leu Pro Asp Thr Pro Leu Thr Ala Gly Ile Pro Val Asn Ile
290 295 300
Arg Pro Ala Asn Asp Glu Val Thr Gly Thr Gln Ile Ser Trp Met Ile
305 310 315 320
Cys Ser Leu Ala Thr Asp Glu Ala Asp Pro Leu Asn Arg Leu Gln Gln
325 330 335
Ile Lys Thr Ser Thr Arg Arg Ala Lys Glu His Leu Gln Lys Leu Pro
340 345 350
Lys Lys Ala Leu Thr Gln Tyr Thr Met Leu Leu Met Ser Pro Trp Ile
355 360 365
Leu Gln Leu Met Ser Gly Leu Gly Gly Arg Met Arg Pro Val Phe Asn
370 375 380
Val Thr Ile Ser Asn Val Pro Gly Pro Glu Glu Thr Leu Tyr Tyr Glu
385 390 395 400
Gly Ala Arg Leu Glu Ala Met Tyr Pro Leu Ser Leu Ile Ala His Gly
405 410 415
Gly Ala Leu Asn Ile Thr Cys Leu Ser Tyr Ala Gly Ser Leu Asn Phe
420 425 430
Gly Phe Thr Gly Cys Arg Asp Thr Leu Pro Gly Met Gln Lys Leu Ala
435 440 445
Val Tyr Thr Gly Glu Ala Leu Asp Glu Leu Glu Ser Leu Val Leu Pro
450 455 460
Pro Lys Lys Arg Ala Arg Thr Arg Lys
465 470
<210> 44
<211> 1470
<212> DNA
<213> Marinobacter adhaerens
<400> 44
atgaaacgcc tgggaacgct ggatgcctct tggctggccg tagaatctga agacaccccc 60
atgcatgtgg gcaacctgca gatcttttcg ctaccggagg gcgcccctga aaccttcctc 120
cgggacatgg tgacccgcat gaaggaaacc ggcgatgtcg cgcccccctg gggtttaaag 180
cttgcctggt ccggactgtt gggtcgggta ctggcgccgg gctggaaagt cgacaagaaa 240
atcgatctgg attaccacgt gcgtcactcg gcactgccgc gccccggcgg tgaacgggaa 300
ctgggcatat tggtatcgcg cctgcactcc aaccccctgg actttgcccg cccactctgg 360
gaatgccacg ttatcgaggg cctcgagaat aaccgttttg cgctctacac caagatgcat 420
cattccatga ttgatggcat cagtggtgta cgcctgatgc aacgggtact gacaaccgat 480
cccgacaaac gggacatgcc gccaccctgg tcggttcggc cggagcgccg tcgcggcagc 540
aaatccgatt ccgaggccag cgtgcccggc gcggtctcac aggccatgga ggcactgaaa 600
ctgcaagcgg atatggcgcc acgtctgttg caagcgggca acaggttggt gcattcggtc 660
cgtcaccccg aggatggtct cacggcaccg tttaccgggc ccgtgtccaa gatcaatcac 720
cgggttaccg gccagcgccg gtttgccacc cagcattacc agctcgacag gatcaaggag 780
cttgcccacg tttccggcgc ttccctcaac gatatcgttc tgtacctgtg cggaactgcc 840
ctcaggcgtt ttctgctgga acagaatgaa ctgccggacg ctcccctcac cgccggcata 900
ccggttaaca tccggccgtc cgatgacgaa gggacaggca cccagatcag tttcatgatc 960
tcttcgcttg cgaccgacga agccgatccg ctgacccgcc tgcaaaacat caaggcgtca 1020
acgcgaaggg ccaaagagca tttgcagaag ctgcccaaaa gcgcgctcac ccagtacacc 1080
atgctcctga tgtcgcctta tattctgcag ctgatgtccg gccttggcgg tcgcatgcgg 1140
ccggtattta acgtcacgat ttccaatgtg ccggggcccc agagaacgct ctactacgag 1200
ggcgcgaaac tggaagccat gtaccctgtc tcgctgatta ctcacggtgg cgctttgaac 1260
atcacctgcc tgagctatga cggttcactg aacttcggct atacgggctg cagggatacc 1320
ctgccgagca tgcagagact tgcggtttac acgggtgagg cactggacga actggaaagc 1380
ctgattcttc cgccaaaggc caaaccgaaa gctgcggcca agcccagtgc gccgcgcaaa 1440
cagccgacga aaaagagtaa agcggactga 1470
<210> 45
<211> 489
<212> PRT
<213> Marinobacter adhaerens
<400> 45
Met Lys Arg Leu Gly Thr Leu Asp Ala Ser Trp Leu Ala Val Glu Ser
1 5 10 15
Glu Asp Thr Pro Met His Val Gly Asn Leu Gln Ile Phe Ser Leu Pro
20 25 30
Glu Gly Ala Pro Glu Thr Phe Leu Arg Asp Met Val Thr Arg Met Lys
35 40 45
Glu Thr Gly Asp Val Ala Pro Pro Trp Gly Leu Lys Leu Ala Trp Ser
50 55 60
Gly Leu Leu Gly Arg Val Leu Ala Pro Gly Trp Lys Val Asp Lys Lys
65 70 75 80
Ile Asp Leu Asp Tyr His Val Arg His Ser Ala Leu Pro Arg Pro Gly
85 90 95
Gly Glu Arg Glu Leu Gly Ile Leu Val Ser Arg Leu His Ser Asn Pro
100 105 110
Leu Asp Phe Ala Arg Pro Leu Trp Glu Cys His Val Ile Glu Gly Leu
115 120 125
Glu Asn Asn Arg Phe Ala Leu Tyr Thr Lys Met His His Ser Met Ile
130 135 140
Asp Gly Ile Ser Gly Val Arg Leu Met Gln Arg Val Leu Thr Thr Asp
145 150 155 160
Pro Asp Lys Arg Asp Met Pro Pro Pro Trp Ser Val Arg Pro Glu Arg
165 170 175
Arg Arg Gly Ser Lys Ser Asp Ser Glu Ala Ser Val Pro Gly Ala Val
180 185 190
Ser Gln Ala Met Glu Ala Leu Lys Leu Gln Ala Asp Met Ala Pro Arg
195 200 205
Leu Leu Gln Ala Gly Asn Arg Leu Val His Ser Val Arg His Pro Glu
210 215 220
Asp Gly Leu Thr Ala Pro Phe Thr Gly Pro Val Ser Lys Ile Asn His
225 230 235 240
Arg Val Thr Gly Gln Arg Arg Phe Ala Thr Gln His Tyr Gln Leu Asp
245 250 255
Arg Ile Lys Glu Leu Ala His Val Ser Gly Ala Ser Leu Asn Asp Ile
260 265 270
Val Leu Tyr Leu Cys Gly Thr Ala Leu Arg Arg Phe Leu Leu Glu Gln
275 280 285
Asn Glu Leu Pro Asp Ala Pro Leu Thr Ala Gly Ile Pro Val Asn Ile
290 295 300
Arg Pro Ser Asp Asp Glu Gly Thr Gly Thr Gln Ile Ser Phe Met Ile
305 310 315 320
Ser Ser Leu Ala Thr Asp Glu Ala Asp Pro Leu Thr Arg Leu Gln Asn
325 330 335
Ile Lys Ala Ser Thr Arg Arg Ala Lys Glu His Leu Gln Lys Leu Pro
340 345 350
Lys Ser Ala Leu Thr Gln Tyr Thr Met Leu Leu Met Ser Pro Tyr Ile
355 360 365
Leu Gln Leu Met Ser Gly Leu Gly Gly Arg Met Arg Pro Val Phe Asn
370 375 380
Val Thr Ile Ser Asn Val Pro Gly Pro Gln Arg Thr Leu Tyr Tyr Glu
385 390 395 400
Gly Ala Lys Leu Glu Ala Met Tyr Pro Val Ser Leu Ile Thr His Gly
405 410 415
Gly Ala Leu Asn Ile Thr Cys Leu Ser Tyr Asp Gly Ser Leu Asn Phe
420 425 430
Gly Tyr Thr Gly Cys Arg Asp Thr Leu Pro Ser Met Gln Arg Leu Ala
435 440 445
Val Tyr Thr Gly Glu Ala Leu Asp Glu Leu Glu Ser Leu Ile Leu Pro
450 455 460
Pro Lys Ala Lys Pro Lys Ala Ala Ala Lys Pro Ser Ala Pro Arg Lys
465 470 475 480
Gln Pro Thr Lys Lys Ser Lys Ala Asp
485
<210> 46
<211> 1458
<212> DNA
<213> Marinobacter algicola
<400> 46
atgaaacgcc tgggcacact ggacgcttcc tggttggcgg tggaatcgga agacaccccg 60
atgcacgtcg gcaacctgca gattttttca ctaccggaag atgctccgga gacgtttcta 120
agagacatgc tcgcccgcat gaaagccgat gccgatgtag cgccgccctg gtgctacaag 180
ctcgcctttt cggggttcct gggccgcctg gtcgccccgt cctggaaggt cgacaagaag 240
ctggatctcg actaccacgt tcgacactcg gcgttgccgc gccccggcag tgaacgggaa 300
cttggcatcc tggtatccag gctgcattcc aacccgctgg atttttcccg cccgctttgg 360
gaatgccaca ttatcgaggg cctggagaac aaccgttttg ccctctacac caagatgcat 420
cattccatga ttgatggcat aagcggtgtt cggctgatgc agcgggtgct cagcgaggac 480
cccggtgaga ttaatatgct gccgccatgg tcggtacgcc cggagcggac acggggcagc 540
aagacagatt ccgaagccag catttcagcc gccctgtccc aggccatgga agccctgagg 600
attcaggccg acatggcgcc gaggctctgg aatgcgatga accgcctgat ccagtccgca 660
cggcacccgg aagaggggct gaccgcgccc tttgccggcc cggtttccgc cctcaatcac 720
cgggtcaccg gtcagcggcg gtttgccacc cagcactacc agctcgaacg gatcaaacag 780
gtcgcccagg cgtccaacgg ctccctgaac gacattgtgc tctacctctg tggcactgcc 840
ctgcgccgct ttcttgttga acaggatggt ttgccggata cgccactcac cgccggaatt 900
ccggtgaata tccgcccctc cgatgaccag ggcacgggca cccagatcag cttcatgatt 960
gcctcactgg cgaccgacga agccgatccc ctcaagcggc tgaagagcat caaacactct 1020
acccgcaggg ccaaacaaca ccttcagaaa ctgccgcgta aagccctgac ccaatacacc 1080
atgctgctga tgtcgcccta catcctgcag ttgatgtcag gcctgggcgg gcgaatgcgc 1140
ccggtgttca acgtgaccat ctccaacgtg ccagggccag gggaaaccct ttactatgaa 1200
ggagcacgac tggaggcgat gtacccggtt tcgcttattg cccacggcgg tgcgctcaac 1260
attacttgcc tgagctacgc cggctcgctc aacttcggtt tcacgggctg ccgcgatacg 1320
ttgcccagta tgcagaagct ggcggtctac accggtgagg ctttggatga actggaaagc 1380
ctggtttcgc caccaccaaa tcagaccaaa accaacgctc gaaaggcgcc tcgcaaaaag 1440
actgcggaaa agagctaa 1458
<210> 47
<211> 485
<212> PRT
<213> Marinobacter algicola
<400> 47
Met Lys Arg Leu Gly Thr Leu Asp Ala Ser Trp Leu Ala Val Glu Ser
1 5 10 15
Glu Asp Thr Pro Met His Val Gly Asn Leu Gln Ile Phe Ser Leu Pro
20 25 30
Glu Asp Ala Pro Glu Thr Phe Leu Arg Asp Met Leu Ala Arg Met Lys
35 40 45
Ala Asp Ala Asp Val Ala Pro Pro Trp Cys Tyr Lys Leu Ala Phe Ser
50 55 60
Gly Phe Leu Gly Arg Leu Val Ala Pro Ser Trp Lys Val Asp Lys Lys
65 70 75 80
Leu Asp Leu Asp Tyr His Val Arg His Ser Ala Leu Pro Arg Pro Gly
85 90 95
Ser Glu Arg Glu Leu Gly Ile Leu Val Ser Arg Leu His Ser Asn Pro
100 105 110
Leu Asp Phe Ser Arg Pro Leu Trp Glu Cys His Ile Ile Glu Gly Leu
115 120 125
Glu Asn Asn Arg Phe Ala Leu Tyr Thr Lys Met His His Ser Met Ile
130 135 140
Asp Gly Ile Ser Gly Val Arg Leu Met Gln Arg Val Leu Ser Glu Asp
145 150 155 160
Pro Gly Glu Ile Asn Met Leu Pro Pro Trp Ser Val Arg Pro Glu Arg
165 170 175
Thr Arg Gly Ser Lys Thr Asp Ser Glu Ala Ser Ile Ser Ala Ala Leu
180 185 190
Ser Gln Ala Met Glu Ala Leu Arg Ile Gln Ala Asp Met Ala Pro Arg
195 200 205
Leu Trp Asn Ala Met Asn Arg Leu Ile Gln Ser Ala Arg His Pro Glu
210 215 220
Glu Gly Leu Thr Ala Pro Phe Ala Gly Pro Val Ser Ala Leu Asn His
225 230 235 240
Arg Val Thr Gly Gln Arg Arg Phe Ala Thr Gln His Tyr Gln Leu Glu
245 250 255
Arg Ile Lys Gln Val Ala Gln Ala Ser Asn Gly Ser Leu Asn Asp Ile
260 265 270
Val Leu Tyr Leu Cys Gly Thr Ala Leu Arg Arg Phe Leu Val Glu Gln
275 280 285
Asp Gly Leu Pro Asp Thr Pro Leu Thr Ala Gly Ile Pro Val Asn Ile
290 295 300
Arg Pro Ser Asp Asp Gln Gly Thr Gly Thr Gln Ile Ser Phe Met Ile
305 310 315 320
Ala Ser Leu Ala Thr Asp Glu Ala Asp Pro Leu Lys Arg Leu Lys Ser
325 330 335
Ile Lys His Ser Thr Arg Arg Ala Lys Gln His Leu Gln Lys Leu Pro
340 345 350
Arg Lys Ala Leu Thr Gln Tyr Thr Met Leu Leu Met Ser Pro Tyr Ile
355 360 365
Leu Gln Leu Met Ser Gly Leu Gly Gly Arg Met Arg Pro Val Phe Asn
370 375 380
Val Thr Ile Ser Asn Val Pro Gly Pro Gly Glu Thr Leu Tyr Tyr Glu
385 390 395 400
Gly Ala Arg Leu Glu Ala Met Tyr Pro Val Ser Leu Ile Ala His Gly
405 410 415
Gly Ala Leu Asn Ile Thr Cys Leu Ser Tyr Ala Gly Ser Leu Asn Phe
420 425 430
Gly Phe Thr Gly Cys Arg Asp Thr Leu Pro Ser Met Gln Lys Leu Ala
435 440 445
Val Tyr Thr Gly Glu Ala Leu Asp Glu Leu Glu Ser Leu Val Ser Pro
450 455 460
Pro Pro Asn Gln Thr Lys Thr Asn Ala Arg Lys Ala Pro Arg Lys Lys
465 470 475 480
Thr Ala Glu Lys Ser
485
<210> 48
<211> 1470
<212> DNA
<213> Marinobacter sp.
<400> 48
atgaaacgcc tggcaacatt ggacgcgtct tggctagcgg tcgagtctga cgatacaccc 60
atgcacgtgg gcaacttgca gattttcagc ctgcccgaca acgccccatc tacattcgcg 120
ggcgacttgg tcaaaagcat gaagcaagcc ggtaatgttg agcttccctg gggctgcaag 180
ctggtatggc caggctttct gggccgcgtt ctggcgccca cctggaagca cgacaagcat 240
attgatctgg attatcacgt gcgccactcg gccctaccaa aacccggtgg tgaacgcgaa 300
ctgggggaac tggtatcgcg cctgcactcc aacccgctgg atctgtcgcg gccgctgtgg 360
gagtgccaca tgatcgaagg gctggaacac aaccgttttg ccctgtacac gaagatgcat 420
cactgcatga ttgatggcat cagtggtgta cgcctgatgc aaagggtgct gagcaaatcc 480
cccgacgagc gcgacatgct gccaccctgg tcagtacgcc cggaaagcac gcgcggcaaa 540
aagaccgaca gcgaggccag cgtgccgggt gctatatccc aagctatgga agctctcaaa 600
ctgcagttgg gcttggcacc acggctgtgg caagccagca atcgcctgat tcactcggta 660
cgccatccgg aagacggtct gaccgcgccc ttcaccggcc cggtttccaa gatcaatcat 720
cgggttactg gccagcgccg cttcgccacc cagcagtatc agttagaaga tatgaaagcc 780
atggcccgcg cctcgggcag ctcgatgaac gacattgtgc tgtatttgtg cggtactgcg 840
ttgcggcgtt ttctgctgga acaggacgat ttgcctgaaa tatcattaac agcaggcata 900
ccggtcaaca ttcgcccggc ggatgacgaa ggcacaggaa cccagatcag cttcatgatt 960
gccgccctgg ccaccaacca acctgatccg ctaacgcgcc tgaaatgcat caaggaatct 1020
tcgtgcaaag ccaaagagca cttgcaaaaa ttgcccaaga aagcgttgac ccaatacacc 1080
atgatgctga tgtcgcccta catattgcag ctgatgtctg gcttgggcgg gcgcatgcga 1140
ccggtattta acgtaaccat ctccaacgtt ccggggccca ccgaagatct ttattacgaa 1200
ggcgccaaac tcgaagccat gtatccggtg tcgctgatca cccacggcgg agcgttgaac 1260
attacttgcc tgagctatgc cggatcattg aactttggtt tcactggttg ccgcgacacc 1320
ttacccagca tgcagaagct ggccgtgtat accggggaag cattggaaga actcagaacc 1380
ctgctgttac cgccaaagaa aaaacccagc ccacgcaaac ctagaacggc cgcgaaaaag 1440
aagcccgcgg tgaacagcaa cgctagctga 1470
<210> 49
<211> 489
<212> PRT
<213> Marinobacter sp.
<400> 49
Met Lys Arg Leu Ala Thr Leu Asp Ala Ser Trp Leu Ala Val Glu Ser
1 5 10 15
Asp Asp Thr Pro Met His Val Gly Asn Leu Gln Ile Phe Ser Leu Pro
20 25 30
Asp Asn Ala Pro Ser Thr Phe Ala Gly Asp Leu Val Lys Ser Met Lys
35 40 45
Gln Ala Gly Asn Val Glu Leu Pro Trp Gly Cys Lys Leu Val Trp Pro
50 55 60
Gly Phe Leu Gly Arg Val Leu Ala Pro Thr Trp Lys His Asp Lys His
65 70 75 80
Ile Asp Leu Asp Tyr His Val Arg His Ser Ala Leu Pro Lys Pro Gly
85 90 95
Gly Glu Arg Glu Leu Gly Glu Leu Val Ser Arg Leu His Ser Asn Pro
100 105 110
Leu Asp Leu Ser Arg Pro Leu Trp Glu Cys His Met Ile Glu Gly Leu
115 120 125
Glu His Asn Arg Phe Ala Leu Tyr Thr Lys Met His His Cys Met Ile
130 135 140
Asp Gly Ile Ser Gly Val Arg Leu Met Gln Arg Val Leu Ser Lys Ser
145 150 155 160
Pro Asp Glu Arg Asp Met Leu Pro Pro Trp Ser Val Arg Pro Glu Ser
165 170 175
Thr Arg Gly Lys Lys Thr Asp Ser Glu Ala Ser Val Pro Gly Ala Ile
180 185 190
Ser Gln Ala Met Glu Ala Leu Lys Leu Gln Leu Gly Leu Ala Pro Arg
195 200 205
Leu Trp Gln Ala Ser Asn Arg Leu Ile His Ser Val Arg His Pro Glu
210 215 220
Asp Gly Leu Thr Ala Pro Phe Thr Gly Pro Val Ser Lys Ile Asn His
225 230 235 240
Arg Val Thr Gly Gln Arg Arg Phe Ala Thr Gln Gln Tyr Gln Leu Glu
245 250 255
Asp Met Lys Ala Met Ala Arg Ala Ser Gly Ser Ser Met Asn Asp Ile
260 265 270
Val Leu Tyr Leu Cys Gly Thr Ala Leu Arg Arg Phe Leu Leu Glu Gln
275 280 285
Asp Asp Leu Pro Glu Ile Ser Leu Thr Ala Gly Ile Pro Val Asn Ile
290 295 300
Arg Pro Ala Asp Asp Glu Gly Thr Gly Thr Gln Ile Ser Phe Met Ile
305 310 315 320
Ala Ala Leu Ala Thr Asn Gln Pro Asp Pro Leu Thr Arg Leu Lys Cys
325 330 335
Ile Lys Glu Ser Ser Cys Lys Ala Lys Glu His Leu Gln Lys Leu Pro
340 345 350
Lys Lys Ala Leu Thr Gln Tyr Thr Met Met Leu Met Ser Pro Tyr Ile
355 360 365
Leu Gln Leu Met Ser Gly Leu Gly Gly Arg Met Arg Pro Val Phe Asn
370 375 380
Val Thr Ile Ser Asn Val Pro Gly Pro Thr Glu Asp Leu Tyr Tyr Glu
385 390 395 400
Gly Ala Lys Leu Glu Ala Met Tyr Pro Val Ser Leu Ile Thr His Gly
405 410 415
Gly Ala Leu Asn Ile Thr Cys Leu Ser Tyr Ala Gly Ser Leu Asn Phe
420 425 430
Gly Phe Thr Gly Cys Arg Asp Thr Leu Pro Ser Met Gln Lys Leu Ala
435 440 445
Val Tyr Thr Gly Glu Ala Leu Glu Glu Leu Arg Thr Leu Leu Leu Pro
450 455 460
Pro Lys Lys Lys Pro Ser Pro Arg Lys Pro Arg Thr Ala Ala Lys Lys
465 470 475 480
Lys Pro Ala Val Asn Ser Asn Ala Ser
485
<210> 50
<211> 549
<212> DNA
<213> Photobacterium profundum
<400> 50
atgggtaaca cattactggt tgttggtgat agcttgagcg cgggctatca aatgcgtgca 60
gaacaaagct ggccggtgtt actgcaaccc gcattaaagc aacaaggtca cgaaatcacc 120
gttgtaaatg ccagtatttc aggtgataca acaggaaacg gcttggctcg cttgcctaca 180
ttactacaac aacataaacc agcttacgtc atcatagaac tcggggcgaa tgatggctta 240
cgtggtttcc ctcaaggtac tattcgtaac aatctcagcc aaatgatcac tgaaattcaa 300
aatgctgatg ccaagccaat gctcgtgcag atcaaagtgc cgcccaatta cggcaaacgc 360
tacagtgata tgttcagttc tatttaccct caactcagta aagagttagc cacaccattg 420
ttacctttct ttttagagca gatcatttta aaacaagaat ggatgatgaa tgacggttta 480
catcctaaat ctgatgctca gccgtggatt gccgaatata tggctgagaa tatcgcgcct 540
tatttataa 549
<210> 51
<211> 182
<212> PRT
<213> Photobacterium profundum
<400> 51
Met Gly Asn Thr Leu Leu Val Val Gly Asp Ser Leu Ser Ala Gly Tyr
1 5 10 15
Gln Met Arg Ala Glu Gln Ser Trp Pro Val Leu Leu Gln Pro Ala Leu
20 25 30
Lys Gln Gln Gly His Glu Ile Thr Val Val Asn Ala Ser Ile Ser Gly
35 40 45
Asp Thr Thr Gly Asn Gly Leu Ala Arg Leu Pro Thr Leu Leu Gln Gln
50 55 60
His Lys Pro Ala Tyr Val Ile Ile Glu Leu Gly Ala Asn Asp Gly Leu
65 70 75 80
Arg Gly Phe Pro Gln Gly Thr Ile Arg Asn Asn Leu Ser Gln Met Ile
85 90 95
Thr Glu Ile Gln Asn Ala Asp Ala Lys Pro Met Leu Val Gln Ile Lys
100 105 110
Val Pro Pro Asn Tyr Gly Lys Arg Tyr Ser Asp Met Phe Ser Ser Ile
115 120 125
Tyr Pro Gln Leu Ser Lys Glu Leu Ala Thr Pro Leu Leu Pro Phe Phe
130 135 140
Leu Glu Gln Ile Ile Leu Lys Gln Glu Trp Met Met Asn Asp Gly Leu
145 150 155 160
His Pro Lys Ser Asp Ala Gln Pro Trp Ile Ala Glu Tyr Met Ala Glu
165 170 175
Asn Ile Ala Pro Tyr Leu
180
<210> 52
<211> 549
<212> DNA
<213> Photobacterium profundum
<400> 52
atgggtaaca cattactggt tgttggtgat agcttgagcg cgggctatca aatgcgtgca 60
gaacaaagct ggccggtgtt actgcaaccc gcattaaagc aacaaggtca cgaaatcacc 120
gttgtaaatg ccagtattgt cggtgacaca acaggaaacg gcttggctcg cttgcctacg 180
ttactacaac aacataaacc agcttacgtc atcatagaac tcggggcgaa tgatggcctg 240
cgtggtttcc cgcaaggtac tattcgtaac aatctgagcc aaatgatcac tgaaattcaa 300
aatgctgatg ccaagccaat gctcgtgcaa atcaaagtgc cgcccaatca cggcaaacgc 360
tacagtgata tgttcagttc tatttaccct caactcagta aagagttagc cacaccattg 420
ttacctttct ttttagagca gatcatttta aaacaagaat ggatgatgaa tgacggttta 480
catcctaaat ccgatgctca gccgtggatt gccgaatata tggctgagaa tatcgcgcct 540
tatttataa 549
<210> 53
<211> 182
<212> PRT
<213> Photobacterium profundum
<400> 53
Met Gly Asn Thr Leu Leu Val Val Gly Asp Ser Leu Ser Ala Gly Tyr
1 5 10 15
Gln Met Arg Ala Glu Gln Ser Trp Pro Val Leu Leu Gln Pro Ala Leu
20 25 30
Lys Gln Gln Gly His Glu Ile Thr Val Val Asn Ala Ser Ile Val Gly
35 40 45
Asp Thr Thr Gly Asn Gly Leu Ala Arg Leu Pro Thr Leu Leu Gln Gln
50 55 60
His Lys Pro Ala Tyr Val Ile Ile Glu Leu Gly Ala Asn Asp Gly Leu
65 70 75 80
Arg Gly Phe Pro Gln Gly Thr Ile Arg Asn Asn Leu Ser Gln Met Ile
85 90 95
Thr Glu Ile Gln Asn Ala Asp Ala Lys Pro Met Leu Val Gln Ile Lys
100 105 110
Val Pro Pro Asn His Gly Lys Arg Tyr Ser Asp Met Phe Ser Ser Ile
115 120 125
Tyr Pro Gln Leu Ser Lys Glu Leu Ala Thr Pro Leu Leu Pro Phe Phe
130 135 140
Leu Glu Gln Ile Ile Leu Lys Gln Glu Trp Met Met Asn Asp Gly Leu
145 150 155 160
His Pro Lys Ser Asp Ala Gln Pro Trp Ile Ala Glu Tyr Met Ala Glu
165 170 175
Asn Ile Ala Pro Tyr Leu
180
<210> 54
<211> 549
<212> DNA
<213> Photobacterium profundum
<400> 54
atgggtaaca cattactggt tgttggtgat agcttgagcg cgggctatca aatgcgtgca 60
gaacaaagct ggccggtgtt actgcaaccc gcattaaagc aacaaggtca cgaaatcacc 120
gttgtaaatg ccagtattgt cggtatgaca acaagaaacg gcttggctcg cttgcctacg 180
ttactacaac aacataaacc agcttacgtc atcatagaac tcggggcggt ggatggcctg 240
cgtggtttcc cgcaaggtac tattcgtaac aatctgagcc aaatgatcac tgaaattcaa 300
aatgctgatg ccaagccaat gctcgtgcaa atcaaagtgc cgcccaatca cggcaaacgc 360
tacagtgata tgttcagttc tatttaccct caactcagta aagagttagc cacaccattg 420
ttacctttct ttttagagca gatcatttta aaacaagaat ggatgatgaa tgacggttta 480
catcctaaat ccgatgctca gccgtggatt gccgaatata tggctgagaa tatcgcgcct 540
tatttataa 549
<210> 55
<211> 182
<212> PRT
<213> Photobacterium profundum
<400> 55
Met Gly Asn Thr Leu Leu Val Val Gly Asp Ser Leu Ser Ala Gly Tyr
1 5 10 15
Gln Met Arg Ala Glu Gln Ser Trp Pro Val Leu Leu Gln Pro Ala Leu
20 25 30
Lys Gln Gln Gly His Glu Ile Thr Val Val Asn Ala Ser Ile Val Gly
35 40 45
Met Thr Thr Arg Asn Gly Leu Ala Arg Leu Pro Thr Leu Leu Gln Gln
50 55 60
His Lys Pro Ala Tyr Val Ile Ile Glu Leu Gly Ala Val Asp Gly Leu
65 70 75 80
Arg Gly Phe Pro Gln Gly Thr Ile Arg Asn Asn Leu Ser Gln Met Ile
85 90 95
Thr Glu Ile Gln Asn Ala Asp Ala Lys Pro Met Leu Val Gln Ile Lys
100 105 110
Val Pro Pro Asn His Gly Lys Arg Tyr Ser Asp Met Phe Ser Ser Ile
115 120 125
Tyr Pro Gln Leu Ser Lys Glu Leu Ala Thr Pro Leu Leu Pro Phe Phe
130 135 140
Leu Glu Gln Ile Ile Leu Lys Gln Glu Trp Met Met Asn Asp Gly Leu
145 150 155 160
His Pro Lys Ser Asp Ala Gln Pro Trp Ile Ala Glu Tyr Met Ala Glu
165 170 175
Asn Ile Ala Pro Tyr Leu
180
<210> 56
<211> 549
<212> DNA
<213> Photobacterium profundum
<400> 56
atgggcaaca cccttctcgt cgtcggcgat tcactctccg caggctacca aatgcgtgca 60
gaacaaagct ggccggtatt gctgcaacct gccctgaaac agcagggtca tgagatcact 120
gtggttaatg caagcattgt gggtatgacc acgcgtaacg gtttggctcg tctgccaacc 180
ctgttacaac aacacaagcc ggcgtatgtt atcatcgaat tgggtgcggt cgatggcttg 240
cgcggttttc cgcaaggcac gattcgtaat aacctgagcc agatgattac cgagattcag 300
aacgctgacg cgaagccgat gctggttcag atcaaagtgc cgccgaacca cggtaaacgc 360
tacagcgaca tgttcagcag catttacccg cagctgtcta aggaactggc gacgccactg 420
ctgccgttct ttctggagca gattatcctg aagcaagaat ggatgatgaa tgacggtctg 480
catccgaaaa gcgatgcgca gccgtggatc gcagagtata tggccgagaa tatcgcgccg 540
tatttgtaa 549
<210> 57
<211> 549
<212> DNA
<213> Photobacterium profundum
<400> 57
atgggtaaca cattactggt tgttggtgat agcttgagcg cgggctatca aatgcgtgca 60
gaacaaagct ggccggtgtt actgcaaccc gcattaaagc aacaaggtca cgaaatcacc 120
gttgtaaatg ccagtattgt cggtatgctg acaagaaacg gcttggctcg cttgcctacg 180
ttactacaac aacataaacc agcttacgtc atcatagaac tcggggcggt ggatggcctg 240
cgtggtttcc cgcaaggtac tattcgtaac aatctgagcc aaatgatcac tgaaattcaa 300
aatgctgatg ccaagccaat gctcgtgcaa atcaaagtgc cgcccaatca cggcaaacgc 360
tacagtgata tgttcagttc tatttaccct caactcagta aagagttagc cacaccattg 420
ttacctttct ttttagagca gatctattta aaacaagaat ggatgatgaa tgacggttta 480
catcctaaat ccgatgctca gccgtggatt gccgaatata tggctgagaa tatcgcgcct 540
tatttataa 549
<210> 58
<211> 182
<212> PRT
<213> Photobacterium profundum
<400> 58
Met Gly Asn Thr Leu Leu Val Val Gly Asp Ser Leu Ser Ala Gly Tyr
1 5 10 15
Gln Met Arg Ala Glu Gln Ser Trp Pro Val Leu Leu Gln Pro Ala Leu
20 25 30
Lys Gln Gln Gly His Glu Ile Thr Val Val Asn Ala Ser Ile Val Gly
35 40 45
Met Leu Thr Arg Asn Gly Leu Ala Arg Leu Pro Thr Leu Leu Gln Gln
50 55 60
His Lys Pro Ala Tyr Val Ile Ile Glu Leu Gly Ala Val Asp Gly Leu
65 70 75 80
Arg Gly Phe Pro Gln Gly Thr Ile Arg Asn Asn Leu Ser Gln Met Ile
85 90 95
Thr Glu Ile Gln Asn Ala Asp Ala Lys Pro Met Leu Val Gln Ile Lys
100 105 110
Val Pro Pro Asn His Gly Lys Arg Tyr Ser Asp Met Phe Ser Ser Ile
115 120 125
Tyr Pro Gln Leu Ser Lys Glu Leu Ala Thr Pro Leu Leu Pro Phe Phe
130 135 140
Leu Glu Gln Ile Tyr Leu Lys Gln Glu Trp Met Met Asn Asp Gly Leu
145 150 155 160
His Pro Lys Ser Asp Ala Gln Pro Trp Ile Ala Glu Tyr Met Ala Glu
165 170 175
Asn Ile Ala Pro Tyr Leu
180
<210> 59
<211> 549
<212> DNA
<213> Photobacterium profundum
<400> 59
atgggcaaca cccttctcgt cgtcggcgat tcactctccg caggctacca aatgcgtgca 60
gaacaaagct ggccggtatt gctgcaacct gccctgaaac agcagggtca tgagatcact 120
gtggttaatg caagcattgt gggtatgctg acgcgtaacg gtttggctcg tctgccaacc 180
ctgttacaac aacacaagcc ggcgtatgtt atcatcgaat tgggtgcggt cgatggcttg 240
cgcggttttc cgcaaggcac gattcgtaat aacctgagcc agatgattac cgagattcag 300
aacgctgacg cgaagccgat gctggttcag atcaaagtgc cgccgaacca cggtaaacgc 360
tacagcgaca tgttcagcag catttacccg cagctgtcta aggaactggc gacgccactg 420
ctgccgttct ttctggagca gatttatctg aagcaagaat ggatgatgaa tgacggtctg 480
catccgaaaa gcgatgcgca gccgtggatc gcagagtata tggccgagaa tatcgcgccg 540
tatttgtaa 549
<210> 60
<211> 549
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 60
atgggcaaca cccttctcgt cgtcggcgat tcactctccg caggctacca aatgcgtgca 60
gaacaaagct ggccggtatt gctgcaacct gccctgaaac agcagggtca tgagatcact 120
gtggttaatg caagcattgt gggtatgctg acgcgtaacg gtttggctcg tctgccaacc 180
ctgttacaac aacacaagcc ggcgtatgtt atcatcgaat tgggtgcggt cgatggcttg 240
cgcggttttc cgcaaggcac gattcgtaat aacctgagcc agatgattac cgagattcag 300
aacgctgacg cgaagccgat gctggttcag atcaaagtgc cgccgtttca cggtaaacgc 360
tacagcgaca tgttcagcag catttacccg cagctgtcta aggaactggc gacgccactg 420
ctgccgttct ttctggagca gatttatctg aagcaagaat ggatgatgaa tgacggtctg 480
catccgaaaa gcgatgcgca gccgtggatc gcagagtata tggccgagaa tatcgcgccg 540
tatttgtaa 549
<210> 61
<211> 182
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 61
Met Gly Asn Thr Leu Leu Val Val Gly Asp Ser Leu Ser Ala Gly Tyr
1 5 10 15
Gln Met Arg Ala Glu Gln Ser Trp Pro Val Leu Leu Gln Pro Ala Leu
20 25 30
Lys Gln Gln Gly His Glu Ile Thr Val Val Asn Ala Ser Ile Val Gly
35 40 45
Met Leu Thr Arg Asn Gly Leu Ala Arg Leu Pro Thr Leu Leu Gln Gln
50 55 60
His Lys Pro Ala Tyr Val Ile Ile Glu Leu Gly Ala Val Asp Gly Leu
65 70 75 80
Arg Gly Phe Pro Gln Gly Thr Ile Arg Asn Asn Leu Ser Gln Met Ile
85 90 95
Thr Glu Ile Gln Asn Ala Asp Ala Lys Pro Met Leu Val Gln Ile Lys
100 105 110
Val Pro Pro Phe His Gly Lys Arg Tyr Ser Asp Met Phe Ser Ser Ile
115 120 125
Tyr Pro Gln Leu Ser Lys Glu Leu Ala Thr Pro Leu Leu Pro Phe Phe
130 135 140
Leu Glu Gln Ile Tyr Leu Lys Gln Glu Trp Met Met Asn Asp Gly Leu
145 150 155 160
His Pro Lys Ser Asp Ala Gln Pro Trp Ile Ala Glu Tyr Met Ala Glu
165 170 175
Asn Ile Ala Pro Tyr Leu
180
<210> 62
<211> 549
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 62
atgggcaaca cccttctcgt cgtcggcgat tcactctccg caggctacca aatgcgtgca 60
gaacaaagct ggccggtatt gctgcaacct gccctgaaac gccggggtca tgagatcact 120
gtggttaatg caagcattgt gggtatgctg acgcgtcggg gtttggctcg tctgccaacc 180
ctgttacaac aacacaagcc ggcgtatgtt atcatcgaat tgggtgcggt cgatggcttg 240
cgcggttttc cgcaaggcac gattcgtaat aacctgagcc agatgattac cgagattcag 300
aacgctgacg cgaagccgat gctggttcag atcaaactcc cgccgtggca cggtaaacgc 360
tacagcgaca tgttcagcag catttacccg cagctgtcta aggaactggc gacgccactg 420
ctgccgttct ttctggagca gatttatctg aagcaagaat ggatgatgaa tgacggtctg 480
catccgaaaa gcgatgcgca gccgtggatc gcagagtata tggccgagaa tatcgcgccg 540
tatttgtaa 549
<210> 63
<211> 182
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 63
Met Gly Asn Thr Leu Leu Val Val Gly Asp Ser Leu Ser Ala Gly Tyr
1 5 10 15
Gln Met Arg Ala Glu Gln Ser Trp Pro Val Leu Leu Gln Pro Ala Leu
20 25 30
Lys Arg Arg Gly His Glu Ile Thr Val Val Asn Ala Ser Ile Val Gly
35 40 45
Met Leu Thr Arg Arg Gly Leu Ala Arg Leu Pro Thr Leu Leu Gln Gln
50 55 60
His Lys Pro Ala Tyr Val Ile Ile Glu Leu Gly Ala Val Asp Gly Leu
65 70 75 80
Arg Gly Phe Pro Gln Gly Thr Ile Arg Asn Asn Leu Ser Gln Met Ile
85 90 95
Thr Glu Ile Gln Asn Ala Asp Ala Lys Pro Met Leu Val Gln Ile Lys
100 105 110
Leu Pro Pro Trp His Gly Lys Arg Tyr Ser Asp Met Phe Ser Ser Ile
115 120 125
Tyr Pro Gln Leu Ser Lys Glu Leu Ala Thr Pro Leu Leu Pro Phe Phe
130 135 140
Leu Glu Gln Ile Tyr Leu Lys Gln Glu Trp Met Met Asn Asp Gly Leu
145 150 155 160
His Pro Lys Ser Asp Ala Gln Pro Trp Ile Ala Glu Tyr Met Ala Glu
165 170 175
Asn Ile Ala Pro Tyr Leu
180
<210> 64
<211> 549
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 64
atgggcaaca cccttctcgt cgtcggcgat tcactctccg caggctacca aatgcgtgca 60
gaacaaagct ggccggtatt gctgcaacct gccctgaaac gccagggtca tgagatcact 120
gtggttaatg caagcattgt gggtatgctg acgcgtaagg gtttggctcg tctgccaacc 180
ctgttacaac aacacaagcc ggcgtatgtt atcatcgaat tgggtgcggt cgatggcttg 240
cgcggttttc cgcaaggcac gattcgtaat aacctgagcc agatgattac cgagattcag 300
aacgctgacg cgaagccgat gctggttcag atcaaactcc cgccgtggca cggtaaacgc 360
tacagcgaca tgttcagcag catttacccg cagctgtcta aggaactggc gacgccactg 420
ctgccgttct ttctggagca gatttatatg aagcaagaat ggatgatgaa tgacggtctg 480
catccgaaaa gcgatgcgca gccgtggatc gcagagtata tggccgagaa tatcgcgccg 540
tatttgtaa 549
<210> 65
<211> 182
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 65
Met Gly Asn Thr Leu Leu Val Val Gly Asp Ser Leu Ser Ala Gly Tyr
1 5 10 15
Gln Met Arg Ala Glu Gln Ser Trp Pro Val Leu Leu Gln Pro Ala Leu
20 25 30
Lys Arg Gln Gly His Glu Ile Thr Val Val Asn Ala Ser Ile Val Gly
35 40 45
Met Leu Thr Arg Lys Gly Leu Ala Arg Leu Pro Thr Leu Leu Gln Gln
50 55 60
His Lys Pro Ala Tyr Val Ile Ile Glu Leu Gly Ala Val Asp Gly Leu
65 70 75 80
Arg Gly Phe Pro Gln Gly Thr Ile Arg Asn Asn Leu Ser Gln Met Ile
85 90 95
Thr Glu Ile Gln Asn Ala Asp Ala Lys Pro Met Leu Val Gln Ile Lys
100 105 110
Leu Pro Pro Trp His Gly Lys Arg Tyr Ser Asp Met Phe Ser Ser Ile
115 120 125
Tyr Pro Gln Leu Ser Lys Glu Leu Ala Thr Pro Leu Leu Pro Phe Phe
130 135 140
Leu Glu Gln Ile Tyr Met Lys Gln Glu Trp Met Met Asn Asp Gly Leu
145 150 155 160
His Pro Lys Ser Asp Ala Gln Pro Trp Ile Ala Glu Tyr Met Ala Glu
165 170 175
Asn Ile Ala Pro Tyr Leu
180
<210> 66
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<220>
<221> VARIANT
<222> (3)..(3)
<223> /replace="Gly"
<220>
<221> VARIANT
<222> (4)..(4)
<223> /replace="Ile" or "Leu"
<220>
<221> misc_feature
<222> (3)..(4)
<223> /note="Residues given in the sequence have no preference
with respect to those in the annotations for said positions"
<220>
<221> VARIANT
<222> (7)..(7)
<223> /replace="Gly"
<220>
<221> misc_feature
<222> (7)..(7)
<223> /note="Residue given in the sequence has no preference
with respect to that in the annotations for said position"
<400> 66
Leu Gly Ala Val Asp Ala Ala Leu Arg Gly
1 5 10
Claims (142)
- 변이 에스테르 신타아제 폴리펩티드(variant ester synthase polypeptide)에 있어서,
상기 변이 에스테르 신타아제 폴리펩티드는 SEQ ID NO: 2의 폴리펩티드에서 F317W 변이를 갖도록 유전적으로 조작되며(genetically engineered), 상기 변이 에스테르 신타아제 폴리펩티드는 대응하는 야생형 폴리펩티드(wild type polypeptide)에 비해 개선된 지방산 메틸 에스테르 활성(fatty acid methyl ester activity)을 갖고,
상기 개선된 지방산 메틸 에스테르 활성은 증가된 베타 하이드록시 에스테르 특성을 유도하는 것인, 변이 에스테르 신타아제 폴리펩티드. - 제1항에 있어서,
상기 변이 에스테르 신타아제 폴리펩티드는 마리노박터 하이드로카보노클라스티쿠스(Marinobacter hydrocarbonoclasticus: WS377) 에스테르 신타아제 폴리펩티드인, 변이 에스테르 신타아제 폴리펩티드. - 제1항에 있어서,
숙주 세포에서의 상기 변이 에스테르 신타아제 폴리펩티드의 발현은, 대응하는 야생형 폴리펩티드를 발현시키는 숙주 세포에 비해 더 높은 역가(titer)의 지방족 에스테르 조성물을 유도하는, 변이 에스테르 신타아제 폴리펩티드. - 제3항에 있어서,
상기 역가는 적어도 5% 이상인, 변이 에스테르 신타아제 폴리펩티드. - 제3항에 있어서,
상기 지방족 에스테르 조성물은 지방산 메틸 에스테르, 지방산 에틸 에스테르, 지방산 프로필 에스테르, 지방산 이소프로필 에스테르, 지방산 부틸 에스테르, 모노글리세라이드, 지방산 이소부틸 에스테르, 지방산 2-부틸 에스테르 및 지방산 3차(tert)-부틸 에스테르로 구성된 그룹으로부터 선택되는 것인, 변이 에스테르 신타아제 폴리펩티드. - 삭제
- 제1항에 있어서,
상기 변이 에스테르 신타아제 폴리펩티드는 돌연변이 T5S, S15G, P111S, V171R, P188R, S353T, V409L 및 S442G를 더 포함하는, 변이 에스테르 신타아제 폴리펩티드. - 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 제1항 내지 제5항 및 제7항 중 어느 한 항에 따른 변이 에스테르 신타아제 폴리펩티드를 발현시키도록 유전적으로 조작된 재조합 숙주 세포.
- 제1항에 따른 변이 에스테르 신타아제 폴리펩티드를 인코딩하는(encoding) 폴리뉴클레오티드 서열을 포함하는 배양된 재조합 숙주 세포에 있어서,
상기 변이 에스테르 신타아제 폴리펩티드를 발현시킬 때 상기 재조합 숙주세포는, 상기 변이 에스테르 신타아제 폴리펩티드를 발현시키기에 효과적인 조건들 하에서 탄소원을 함유한 배지에서 배양될 때, 대응하는 야생형 폴리펩티드를 발현시키는 숙주 세포보다 지방산 에스테르의 더 높은 역가, 더 높은 수율, 더 높은 생산성(productivity) 또는 이들의 조합을 갖는 지방산 에스테르 조성물을 생성하는, 배양된 재조합 숙주세포. - 제21항에 있어서,
상기 역가는 적어도 5% 이상인, 배양된 재조합 숙주세포. - 제1항에 따른 변이 에스테르 신타아제 폴리펩티드를 인코딩하는 폴리뉴클레오티드 서열을 포함하는 배양된 재조합 숙주 세포에 있어서,
상기 변이 에스테르 신타아제 폴리펩티드를 발현시킬 때 재조합 숙주세포는 야생형 에스테르 신타아제 폴리펩티드를 발현시키는 숙주 세포에 비해 증가된 비율의 베타 하이드록시 에스테르를 갖는 지방족 에스테르 조성물을 생성하는, 배양된 재조합 숙주 세포. - 삭제
- 삭제
- 제20항에 따른 재조합 숙주 세포 및 지방족 에스테르 조성물을 포함하는 세포 배양물(cell culture).
- 제26항에 있어서,
상기 지방족 에스테르 조성물은 C6, C8, C10, C12, C13, C14, C15, C16, C17 또는 C18 지방족 에스테르 중 1 이상을 포함하는, 세포 배양물. - 제26항에 있어서,
상기 지방족 에스테르 조성물은 불포화 지방족 에스테르를 포함하는, 세포 배양물. - 제26항에 있어서,
상기 지방족 에스테르 조성물은 지방족 에스테르의 환원 말단으로부터 C7 과 C8 사이의 탄소 사슬의 위치 7에서 이중 결합을 갖는 지방족 에스테르를 포함하는, 세포 배양물. - 제26항에 있어서,
상기 지방족 에스테르 조성물은 포화 지방족 에스테르를 포함하는, 세포 배양물. - 제26항에 있어서,
상기 지방족 에스테르 조성물은 분지쇄형 지방족 에스테르를 포함하는, 세포 배양물. - 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020237002999A KR20230020007A (ko) | 2012-09-14 | 2013-03-15 | 개선된 에스테르 신타아제 특성을 갖는 효소 변이체 |
Applications Claiming Priority (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201261701191P | 2012-09-14 | 2012-09-14 | |
US61/701,191 | 2012-09-14 | ||
US201261708424P | 2012-10-01 | 2012-10-01 | |
US61/708,424 | 2012-10-01 | ||
PCT/US2013/032564 WO2014042693A1 (en) | 2012-09-14 | 2013-03-15 | Enzyme variants with improved ester synthase properties |
KR1020207002289A KR102339617B1 (ko) | 2012-09-14 | 2013-03-15 | 개선된 에스테르 신타아제 특성을 갖는 효소 변이체 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020207002289A Division KR102339617B1 (ko) | 2012-09-14 | 2013-03-15 | 개선된 에스테르 신타아제 특성을 갖는 효소 변이체 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237002999A Division KR20230020007A (ko) | 2012-09-14 | 2013-03-15 | 개선된 에스테르 신타아제 특성을 갖는 효소 변이체 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20210153158A KR20210153158A (ko) | 2021-12-16 |
KR102493733B1 true KR102493733B1 (ko) | 2023-02-06 |
Family
ID=48045767
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020157009459A KR102072048B1 (ko) | 2012-09-14 | 2013-03-15 | 개선된 에스테르 신타아제 특성을 갖는 효소 변이체 |
KR1020207002289A KR102339617B1 (ko) | 2012-09-14 | 2013-03-15 | 개선된 에스테르 신타아제 특성을 갖는 효소 변이체 |
KR1020237002999A KR20230020007A (ko) | 2012-09-14 | 2013-03-15 | 개선된 에스테르 신타아제 특성을 갖는 효소 변이체 |
KR1020217040434A KR102493733B1 (ko) | 2012-09-14 | 2013-03-15 | 개선된 에스테르 신타아제 특성을 갖는 효소 변이체 |
Family Applications Before (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020157009459A KR102072048B1 (ko) | 2012-09-14 | 2013-03-15 | 개선된 에스테르 신타아제 특성을 갖는 효소 변이체 |
KR1020207002289A KR102339617B1 (ko) | 2012-09-14 | 2013-03-15 | 개선된 에스테르 신타아제 특성을 갖는 효소 변이체 |
KR1020237002999A KR20230020007A (ko) | 2012-09-14 | 2013-03-15 | 개선된 에스테르 신타아제 특성을 갖는 효소 변이체 |
Country Status (11)
Country | Link |
---|---|
US (3) | US9879239B2 (ko) |
EP (2) | EP3299455A1 (ko) |
JP (6) | JP6401703B2 (ko) |
KR (4) | KR102072048B1 (ko) |
CN (2) | CN112899250A (ko) |
AU (3) | AU2013316124C1 (ko) |
BR (1) | BR112015005782A2 (ko) |
CA (2) | CA3079799A1 (ko) |
ES (1) | ES2647412T3 (ko) |
MX (3) | MX366179B (ko) |
WO (1) | WO2014042693A1 (ko) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104718282A (zh) | 2012-08-10 | 2015-06-17 | Opx生物工艺学公司 | 用于生产脂肪酸和脂肪酸衍生产物的微生物及方法 |
WO2014146026A1 (en) | 2013-03-15 | 2014-09-18 | Opx Biotechnologies, Inc. | Bioproduction of chemicals |
CN106795483A (zh) | 2013-07-19 | 2017-05-31 | 嘉吉公司 | 用于生产脂肪酸和脂肪酸衍生产物的微生物及方法 |
US11408013B2 (en) | 2013-07-19 | 2022-08-09 | Cargill, Incorporated | Microorganisms and methods for the production of fatty acids and fatty acid derived products |
EP2993228B1 (en) * | 2014-09-02 | 2019-10-09 | Cargill, Incorporated | Production of fatty acid esters |
WO2018144701A2 (en) | 2017-02-02 | 2018-08-09 | Cargill Incorporated | Genetically modified cells that produce c6-c10 fatty acid derivatives |
KR102677413B1 (ko) * | 2017-04-03 | 2024-06-24 | 게노마티카 인코포레이티드 | 중쇄 지방산 유도체의 생산을 위해 개선된 활성을 갖는 티오에스테라제 변이체 |
CA3109062A1 (en) | 2018-08-31 | 2020-03-05 | Genomatica, Inc. | Xylr mutant for improved xylose utilization or improved co-utilization of glucose and xylose |
MX2022002473A (es) | 2019-08-30 | 2022-08-02 | Codexis Inc | Variantes de lipasa modificadas geneticamente. |
WO2023178193A1 (en) | 2022-03-16 | 2023-09-21 | Genomatica, Inc. | Acyl-acp thioesterase variants and uses thereof |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110072714A1 (en) | 2009-09-25 | 2011-03-31 | Ls9, Inc. | Production of fatty acid derivatives |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0528881A4 (en) | 1990-04-24 | 1993-05-26 | Stratagene | Methods for phenotype creation from multiple gene populations |
US6428767B1 (en) | 1995-05-12 | 2002-08-06 | E. I. Du Pont De Nemours And Company | Method for identifying the source of carbon in 1,3-propanediol |
US5965408A (en) | 1996-07-09 | 1999-10-12 | Diversa Corporation | Method of DNA reassembly by interrupting synthesis |
EP1600508A1 (en) * | 2003-02-21 | 2005-11-30 | Kaneka Corporation | Novel vector |
DK1776455T3 (da) * | 2004-07-16 | 2015-06-22 | Dupont Nutrition Biosci Aps | Lipolytisk enzym, anvendelser deraf i fødevareindustrien |
US7897369B2 (en) * | 2007-08-27 | 2011-03-01 | Regents Of The University Of Minnesota | Isoprenoid wax ester synthases, isoprenoid acyl CoA-synthetases, and uses thereof |
EP2975122B1 (en) * | 2008-10-07 | 2018-06-06 | REG Life Sciences, LLC | Method and compositions for producing fatty aldehydes |
CN102325864B (zh) * | 2008-12-23 | 2016-01-27 | Reg生命科学有限责任公司 | 硫酯酶相关的方法和组合物 |
JP2011103863A (ja) | 2009-11-20 | 2011-06-02 | National Institute For Agro-Environmental Science | デオキシニバレノールの分解活性を有するタンパク質をコードする遺伝子 |
US8530221B2 (en) * | 2010-01-14 | 2013-09-10 | Ls9, Inc. | Production of branched chain fatty acids and derivatives thereof in recombinant microbial cells |
EP3382015B8 (en) | 2010-08-06 | 2021-11-03 | Melt&Marble AB | Methods and products for production of wax esters |
CN103975070A (zh) * | 2011-09-27 | 2014-08-06 | 艾克森美孚研究与工程公司 | 酰基-酰基载体蛋白(acyl-acp)蜡酯合酶 |
-
2013
- 2013-03-15 CN CN202110142262.1A patent/CN112899250A/zh active Pending
- 2013-03-15 KR KR1020157009459A patent/KR102072048B1/ko active IP Right Grant
- 2013-03-15 US US14/424,387 patent/US9879239B2/en active Active
- 2013-03-15 EP EP17187284.9A patent/EP3299455A1/en active Pending
- 2013-03-15 AU AU2013316124A patent/AU2013316124C1/en not_active Ceased
- 2013-03-15 KR KR1020207002289A patent/KR102339617B1/ko active IP Right Grant
- 2013-03-15 CA CA3079799A patent/CA3079799A1/en active Pending
- 2013-03-15 BR BR112015005782A patent/BR112015005782A2/pt not_active Application Discontinuation
- 2013-03-15 CN CN201380058918.5A patent/CN104955944B/zh active Active
- 2013-03-15 ES ES13714142.0T patent/ES2647412T3/es active Active
- 2013-03-15 MX MX2015003305A patent/MX366179B/es active IP Right Grant
- 2013-03-15 EP EP13714142.0A patent/EP2895602B1/en active Active
- 2013-03-15 JP JP2015531914A patent/JP6401703B2/ja active Active
- 2013-03-15 CA CA2885041A patent/CA2885041C/en active Active
- 2013-03-15 WO PCT/US2013/032564 patent/WO2014042693A1/en active Application Filing
- 2013-03-15 KR KR1020237002999A patent/KR20230020007A/ko not_active Application Discontinuation
- 2013-03-15 KR KR1020217040434A patent/KR102493733B1/ko active IP Right Grant
-
2015
- 2015-03-13 MX MX2019007766A patent/MX2019007766A/es unknown
- 2015-03-13 MX MX2022002057A patent/MX2022002057A/es unknown
-
2018
- 2018-01-18 US US15/873,977 patent/US10894953B2/en active Active
- 2018-09-07 JP JP2018168156A patent/JP6820888B2/ja active Active
-
2019
- 2019-04-12 AU AU2019202572A patent/AU2019202572B2/en not_active Ceased
-
2020
- 2020-02-12 JP JP2020021247A patent/JP7030145B2/ja active Active
- 2020-02-12 JP JP2020021255A patent/JP7068362B2/ja active Active
- 2020-10-08 JP JP2020170577A patent/JP2021003131A/ja active Pending
- 2020-12-09 US US17/116,817 patent/US20210309979A1/en not_active Abandoned
-
2022
- 2022-01-11 AU AU2022200123A patent/AU2022200123A1/en not_active Abandoned
- 2022-02-07 JP JP2022016860A patent/JP2022051839A/ja not_active Withdrawn
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110072714A1 (en) | 2009-09-25 | 2011-03-31 | Ls9, Inc. | Production of fatty acid derivatives |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210309979A1 (en) | Enzyme Variants With Improved Ester Synthase Properties | |
US20140215904A1 (en) | Compositions comprising and methods for producing beta-hydroxy fatty acid esters | |
JP2019103507A (ja) | 改善されたアセチル−CoAカルボキシラーゼ変種 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A107 | Divisional application of patent | ||
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right |