KR102215530B1 - 개선된 아세틸-coa 카르복실라아제 변이체 - Google Patents
개선된 아세틸-coa 카르복실라아제 변이체 Download PDFInfo
- Publication number
- KR102215530B1 KR102215530B1 KR1020167009710A KR20167009710A KR102215530B1 KR 102215530 B1 KR102215530 B1 KR 102215530B1 KR 1020167009710 A KR1020167009710 A KR 1020167009710A KR 20167009710 A KR20167009710 A KR 20167009710A KR 102215530 B1 KR102215530 B1 KR 102215530B1
- Authority
- KR
- South Korea
- Prior art keywords
- ala
- glu
- delete delete
- ile
- val
- Prior art date
Links
- 108010018763 Biotin carboxylase Proteins 0.000 title abstract description 240
- 108010016219 Acetyl-CoA carboxylase Proteins 0.000 title abstract description 230
- 102000000452 Acetyl-CoA carboxylase Human genes 0.000 title abstract description 223
- 230000001976 improved effect Effects 0.000 title description 38
- 150000001875 compounds Chemical class 0.000 claims abstract description 173
- 238000004519 manufacturing process Methods 0.000 claims abstract description 119
- 229940053200 antiepileptics fatty acid derivative Drugs 0.000 claims abstract description 117
- LTYOQGRJFJAKNA-KKIMTKSISA-N Malonyl CoA Natural products S(C(=O)CC(=O)O)CCNC(=O)CCNC(=O)[C@@H](O)C(CO[P@](=O)(O[P@](=O)(OC[C@H]1[C@@H](OP(=O)(O)O)[C@@H](O)[C@@H](n2c3ncnc(N)c3nc2)O1)O)O)(C)C LTYOQGRJFJAKNA-KKIMTKSISA-N 0.000 claims abstract description 116
- LTYOQGRJFJAKNA-DVVLENMVSA-N malonyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)CC(O)=O)O[C@H]1N1C2=NC=NC(N)=C2N=C1 LTYOQGRJFJAKNA-DVVLENMVSA-N 0.000 claims abstract description 116
- 238000000034 method Methods 0.000 claims abstract description 94
- 230000001965 increasing effect Effects 0.000 claims abstract description 70
- 210000004027 cell Anatomy 0.000 claims description 368
- 239000000194 fatty acid Substances 0.000 claims description 211
- 235000014113 dietary fatty acids Nutrition 0.000 claims description 208
- 229930195729 fatty acid Natural products 0.000 claims description 208
- 150000004665 fatty acids Chemical class 0.000 claims description 143
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 130
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 130
- 229920001184 polypeptide Polymers 0.000 claims description 129
- 101710201279 Biotin carboxyl carrier protein Proteins 0.000 claims description 121
- -1 hydroxy fatty acid Chemical class 0.000 claims description 95
- 230000014509 gene expression Effects 0.000 claims description 94
- 235000019387 fatty acid methyl ester Nutrition 0.000 claims description 88
- 150000002191 fatty alcohols Chemical class 0.000 claims description 83
- 244000005700 microbiome Species 0.000 claims description 81
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 claims description 63
- 101150013885 accB gene Proteins 0.000 claims description 62
- 229910052799 carbon Inorganic materials 0.000 claims description 61
- 150000007523 nucleic acids Chemical group 0.000 claims description 53
- 150000001413 amino acids Chemical group 0.000 claims description 38
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 32
- 241000894006 Bacteria Species 0.000 claims description 28
- 238000006467 substitution reaction Methods 0.000 claims description 28
- 150000001412 amines Chemical class 0.000 claims description 27
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N biotin Natural products N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 claims description 25
- 235000021122 unsaturated fatty acids Nutrition 0.000 claims description 25
- 108010078791 Carrier Proteins Proteins 0.000 claims description 24
- 150000004670 unsaturated fatty acids Chemical class 0.000 claims description 24
- 102000014914 Carrier Proteins Human genes 0.000 claims description 23
- 230000008859 change Effects 0.000 claims description 23
- 229960002685 biotin Drugs 0.000 claims description 22
- 239000011616 biotin Substances 0.000 claims description 22
- 235000020958 biotin Nutrition 0.000 claims description 21
- 238000000855 fermentation Methods 0.000 claims description 19
- 230000004151 fermentation Effects 0.000 claims description 19
- 241000193830 Bacillus <bacterium> Species 0.000 claims description 16
- 241000589516 Pseudomonas Species 0.000 claims description 15
- 230000001588 bifunctional effect Effects 0.000 claims description 14
- 125000004093 cyano group Chemical group *C#N 0.000 claims description 14
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 13
- 241000187747 Streptomyces Species 0.000 claims description 12
- 238000012258 culturing Methods 0.000 claims description 12
- 241000186660 Lactobacillus Species 0.000 claims description 11
- 241000192700 Cyanobacteria Species 0.000 claims description 9
- 229940039696 lactobacillus Drugs 0.000 claims description 9
- 241000588722 Escherichia Species 0.000 claims description 7
- 244000061458 Solanum melongena Species 0.000 claims description 6
- 235000002597 Solanum melongena Nutrition 0.000 claims description 6
- 210000001236 prokaryotic cell Anatomy 0.000 claims description 5
- 108010011619 6-Phytase Proteins 0.000 claims description 4
- 229940085127 phytase Drugs 0.000 claims description 4
- 241000316848 Rhodococcus <scale insect> Species 0.000 claims description 3
- 241000588901 Zymomonas Species 0.000 claims description 3
- 125000002887 hydroxy group Chemical group [H]O* 0.000 claims 2
- 210000000689 upper leg Anatomy 0.000 claims 2
- 238000004113 cell culture Methods 0.000 abstract description 12
- 241000588724 Escherichia coli Species 0.000 description 98
- 230000000694 effects Effects 0.000 description 87
- 230000035772 mutation Effects 0.000 description 85
- 108090000623 proteins and genes Proteins 0.000 description 83
- 102000040430 polynucleotide Human genes 0.000 description 81
- 108091033319 polynucleotide Proteins 0.000 description 81
- 239000002157 polynucleotide Substances 0.000 description 81
- 239000000203 mixture Substances 0.000 description 72
- CXRCVCURMBFFOL-FXQIFTODSA-N Ala-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CXRCVCURMBFFOL-FXQIFTODSA-N 0.000 description 54
- 235000001014 amino acid Nutrition 0.000 description 53
- 102000004169 proteins and genes Human genes 0.000 description 51
- 108020004414 DNA Proteins 0.000 description 49
- 150000002194 fatty esters Chemical class 0.000 description 49
- 235000018102 proteins Nutrition 0.000 description 49
- 239000000047 product Substances 0.000 description 44
- 125000003275 alpha amino acid group Chemical group 0.000 description 43
- 229940009098 aspartate Drugs 0.000 description 41
- ALRHLSYJTWAHJZ-UHFFFAOYSA-N 3-hydroxypropionic acid Chemical compound OCCC(O)=O ALRHLSYJTWAHJZ-UHFFFAOYSA-N 0.000 description 38
- 229940024606 amino acid Drugs 0.000 description 36
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 34
- 150000002148 esters Chemical class 0.000 description 34
- 230000000875 corresponding effect Effects 0.000 description 33
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 27
- LSLIRHLIUDVNBN-CIUDSAMLSA-N Ala-Asp-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LSLIRHLIUDVNBN-CIUDSAMLSA-N 0.000 description 27
- IPZQNYYAYVRKKK-FXQIFTODSA-N Ala-Pro-Ala Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IPZQNYYAYVRKKK-FXQIFTODSA-N 0.000 description 27
- PEEYDECOOVQKRZ-DLOVCJGASA-N Ala-Ser-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PEEYDECOOVQKRZ-DLOVCJGASA-N 0.000 description 27
- IETUUAHKCHOQHP-KZVJFYERSA-N Ala-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)[C@@H](C)O)C(O)=O IETUUAHKCHOQHP-KZVJFYERSA-N 0.000 description 27
- BNYNOWJESJJIOI-XUXIUFHCSA-N Arg-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCN=C(N)N)N BNYNOWJESJJIOI-XUXIUFHCSA-N 0.000 description 27
- ICRHGPYYXMWHIE-LPEHRKFASA-N Arg-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O ICRHGPYYXMWHIE-LPEHRKFASA-N 0.000 description 27
- UPALZCBCKAMGIY-PEFMBERDSA-N Asn-Gln-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UPALZCBCKAMGIY-PEFMBERDSA-N 0.000 description 27
- JSNWZMFSLIWAHS-HJGDQZAQSA-N Asp-Thr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O JSNWZMFSLIWAHS-HJGDQZAQSA-N 0.000 description 27
- PDRMRVHPAQKTLT-NAKRPEOUSA-N Cys-Ile-Val Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O PDRMRVHPAQKTLT-NAKRPEOUSA-N 0.000 description 27
- LPYPANUXJGFMGV-FXQIFTODSA-N Gln-Gln-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N LPYPANUXJGFMGV-FXQIFTODSA-N 0.000 description 27
- FNAJNWPDTIXYJN-CIUDSAMLSA-N Gln-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCC(N)=O FNAJNWPDTIXYJN-CIUDSAMLSA-N 0.000 description 27
- OKARHJKJTKFQBM-ACZMJKKPSA-N Gln-Ser-Asn Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OKARHJKJTKFQBM-ACZMJKKPSA-N 0.000 description 27
- HUWSBFYAGXCXKC-CIUDSAMLSA-N Glu-Ala-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O HUWSBFYAGXCXKC-CIUDSAMLSA-N 0.000 description 27
- IRDASPPCLZIERZ-XHNCKOQMSA-N Glu-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N IRDASPPCLZIERZ-XHNCKOQMSA-N 0.000 description 27
- IRXNJYPKBVERCW-DCAQKATOSA-N Glu-Leu-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IRXNJYPKBVERCW-DCAQKATOSA-N 0.000 description 27
- SOEATRRYCIPEHA-BQBZGAKWSA-N Gly-Glu-Glu Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SOEATRRYCIPEHA-BQBZGAKWSA-N 0.000 description 27
- HAXARWKYFIIHKD-ZKWXMUAHSA-N Gly-Ile-Ser Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HAXARWKYFIIHKD-ZKWXMUAHSA-N 0.000 description 27
- IWXMHXYOACDSIA-PYJNHQTQSA-N His-Ile-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O IWXMHXYOACDSIA-PYJNHQTQSA-N 0.000 description 27
- DSDPLOODKXISDT-XUXIUFHCSA-N Ile-Leu-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O DSDPLOODKXISDT-XUXIUFHCSA-N 0.000 description 27
- ZNOBVZFCHNHKHA-KBIXCLLPSA-N Ile-Ser-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZNOBVZFCHNHKHA-KBIXCLLPSA-N 0.000 description 27
- ZLFNNVATRMCAKN-ZKWXMUAHSA-N Ile-Ser-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZLFNNVATRMCAKN-ZKWXMUAHSA-N 0.000 description 27
- INMBONMDMGPADT-AVGNSLFASA-N Lys-Met-Met Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCCCN)N INMBONMDMGPADT-AVGNSLFASA-N 0.000 description 27
- WXUUEPIDLLQBLJ-DCAQKATOSA-N Met-Met-Gln Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N WXUUEPIDLLQBLJ-DCAQKATOSA-N 0.000 description 27
- CQRGINSEMFBACV-WPRPVWTQSA-N Met-Val-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O CQRGINSEMFBACV-WPRPVWTQSA-N 0.000 description 27
- 108010065395 Neuropep-1 Proteins 0.000 description 27
- UTAUEDINXUMHLG-FXQIFTODSA-N Pro-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 UTAUEDINXUMHLG-FXQIFTODSA-N 0.000 description 27
- BJCXXMGGPHRSHV-GUBZILKMSA-N Pro-Ser-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 BJCXXMGGPHRSHV-GUBZILKMSA-N 0.000 description 27
- XRGIDCGRSSWCKE-SRVKXCTJSA-N Pro-Val-Met Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O XRGIDCGRSSWCKE-SRVKXCTJSA-N 0.000 description 27
- GXXTUIUYTWGPMV-FXQIFTODSA-N Ser-Arg-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O GXXTUIUYTWGPMV-FXQIFTODSA-N 0.000 description 27
- SFTZWNJFZYOLBD-ZDLURKLDSA-N Ser-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO SFTZWNJFZYOLBD-ZDLURKLDSA-N 0.000 description 27
- IAOHCSQDQDWRQU-GUBZILKMSA-N Ser-Val-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IAOHCSQDQDWRQU-GUBZILKMSA-N 0.000 description 27
- MEBDIIKMUUNBSB-RPTUDFQQSA-N Thr-Phe-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MEBDIIKMUUNBSB-RPTUDFQQSA-N 0.000 description 27
- RWOGENDAOGMHLX-DCAQKATOSA-N Val-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N RWOGENDAOGMHLX-DCAQKATOSA-N 0.000 description 27
- 108010044940 alanylglutamine Proteins 0.000 description 27
- 108010008237 glutamyl-valyl-glycine Proteins 0.000 description 27
- 108010056582 methionylglutamic acid Proteins 0.000 description 27
- ZJBUILVYSXQNSW-YTWAJWBKSA-N Arg-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O ZJBUILVYSXQNSW-YTWAJWBKSA-N 0.000 description 26
- 102000004190 Enzymes Human genes 0.000 description 26
- 108090000790 Enzymes Proteins 0.000 description 26
- RFTVTKBHDXCEEX-WDSKDSINSA-N Glu-Ser-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RFTVTKBHDXCEEX-WDSKDSINSA-N 0.000 description 26
- AQLHORCVPGXDJW-IUCAKERBSA-N Gly-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)CN AQLHORCVPGXDJW-IUCAKERBSA-N 0.000 description 26
- LPXHYGGZJOCAFR-MNXVOIDGSA-N Ile-Glu-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N LPXHYGGZJOCAFR-MNXVOIDGSA-N 0.000 description 26
- WUKLZPHVWAMZQV-UKJIMTQDSA-N Ile-Glu-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N WUKLZPHVWAMZQV-UKJIMTQDSA-N 0.000 description 26
- YIBOAHAOAWACDK-QEJZJMRPSA-N Lys-Ala-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YIBOAHAOAWACDK-QEJZJMRPSA-N 0.000 description 26
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 26
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 26
- DDYIRGBOZVKRFR-AVGNSLFASA-N Phe-Asp-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N DDYIRGBOZVKRFR-AVGNSLFASA-N 0.000 description 26
- SUENWIFTSTWUKD-AVGNSLFASA-N Pro-Leu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SUENWIFTSTWUKD-AVGNSLFASA-N 0.000 description 26
- IMNVAOPEMFDAQD-NHCYSSNCSA-N Pro-Val-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IMNVAOPEMFDAQD-NHCYSSNCSA-N 0.000 description 26
- DBOXBUDEAJVKRE-LSJOCFKGSA-N Val-Asn-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N DBOXBUDEAJVKRE-LSJOCFKGSA-N 0.000 description 26
- SZTTYWIUCGSURQ-AUTRQRHGSA-N Val-Glu-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SZTTYWIUCGSURQ-AUTRQRHGSA-N 0.000 description 26
- VXDSPJJQUQDCKH-UKJIMTQDSA-N Val-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N VXDSPJJQUQDCKH-UKJIMTQDSA-N 0.000 description 26
- 229940088598 enzyme Drugs 0.000 description 26
- 108010010147 glycylglutamine Proteins 0.000 description 26
- 108010017391 lysylvaline Proteins 0.000 description 26
- 230000000813 microbial effect Effects 0.000 description 26
- 238000002703 mutagenesis Methods 0.000 description 26
- 231100000350 mutagenesis Toxicity 0.000 description 26
- 125000003729 nucleotide group Chemical group 0.000 description 26
- 108010031719 prolyl-serine Proteins 0.000 description 26
- 102000039446 nucleic acids Human genes 0.000 description 24
- 108020004707 nucleic acids Proteins 0.000 description 24
- 239000002773 nucleotide Substances 0.000 description 24
- 239000013598 vector Substances 0.000 description 22
- 241000894007 species Species 0.000 description 21
- 125000001931 aliphatic group Chemical group 0.000 description 19
- 229930003935 flavonoid Natural products 0.000 description 19
- 235000017173 flavonoids Nutrition 0.000 description 19
- 150000002215 flavonoids Chemical class 0.000 description 19
- 229930001119 polyketide Natural products 0.000 description 19
- 229930003949 flavanone Natural products 0.000 description 18
- 235000011981 flavanones Nutrition 0.000 description 18
- 150000002208 flavanones Chemical class 0.000 description 18
- 230000001580 bacterial effect Effects 0.000 description 17
- 150000002192 fatty aldehydes Chemical class 0.000 description 17
- 230000001105 regulatory effect Effects 0.000 description 17
- 150000001336 alkenes Chemical class 0.000 description 16
- 238000006243 chemical reaction Methods 0.000 description 16
- 125000000830 polyketide group Chemical group 0.000 description 16
- 241000196324 Embryophyta Species 0.000 description 15
- 239000013604 expression vector Substances 0.000 description 15
- 239000000126 substance Substances 0.000 description 15
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 13
- 230000006870 function Effects 0.000 description 13
- 229930195733 hydrocarbon Natural products 0.000 description 13
- 150000002430 hydrocarbons Chemical class 0.000 description 13
- 239000013612 plasmid Substances 0.000 description 13
- 102100022089 Acyl-[acyl-carrier-protein] hydrolase Human genes 0.000 description 12
- 241000228212 Aspergillus Species 0.000 description 12
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 12
- 101150070497 accC gene Proteins 0.000 description 12
- 239000000446 fuel Substances 0.000 description 12
- 125000004356 hydroxy functional group Chemical group O* 0.000 description 12
- 239000002609 medium Substances 0.000 description 12
- 230000008569 process Effects 0.000 description 12
- 239000002028 Biomass Substances 0.000 description 11
- 102000007132 Carboxyl and Carbamoyl Transferases Human genes 0.000 description 11
- 108010072957 Carboxyl and Carbamoyl Transferases Proteins 0.000 description 11
- 239000003208 petroleum Substances 0.000 description 11
- 101100378010 Bacillus subtilis (strain 168) accC1 gene Proteins 0.000 description 10
- 101100322122 Bacillus subtilis (strain 168) accC2 gene Proteins 0.000 description 10
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 10
- 101710129019 Long-chain acyl-[acyl-carrier-protein] reductase Proteins 0.000 description 10
- 210000000349 chromosome Anatomy 0.000 description 10
- 230000002255 enzymatic effect Effects 0.000 description 10
- 239000000463 material Substances 0.000 description 10
- 235000000346 sugar Nutrition 0.000 description 10
- 108020004705 Codon Proteins 0.000 description 9
- 108010039731 Fatty Acid Synthases Proteins 0.000 description 9
- 125000001429 N-terminal alpha-amino-acid group Chemical group 0.000 description 9
- CKLJMWTZIZZHCS-REOHCLBHSA-L aspartate group Chemical class N[C@@H](CC(=O)[O-])C(=O)[O-] CKLJMWTZIZZHCS-REOHCLBHSA-L 0.000 description 9
- 230000006696 biosynthetic metabolic pathway Effects 0.000 description 9
- 230000015572 biosynthetic process Effects 0.000 description 9
- 150000002576 ketones Chemical class 0.000 description 9
- 150000002894 organic compounds Chemical class 0.000 description 9
- 239000000758 substrate Substances 0.000 description 9
- 238000012360 testing method Methods 0.000 description 9
- OFOBLEOULBTSOW-UHFFFAOYSA-L Malonate Chemical compound [O-]C(=O)CC([O-])=O OFOBLEOULBTSOW-UHFFFAOYSA-L 0.000 description 8
- 241000235070 Saccharomyces Species 0.000 description 8
- ZSLZBFCDCINBPY-ZSJPKINUSA-N acetyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 ZSLZBFCDCINBPY-ZSJPKINUSA-N 0.000 description 8
- 150000001298 alcohols Chemical class 0.000 description 8
- 150000001335 aliphatic alkanes Chemical class 0.000 description 8
- 239000001963 growth medium Substances 0.000 description 8
- 239000003921 oil Substances 0.000 description 8
- 108091026890 Coding region Proteins 0.000 description 7
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 7
- 230000009286 beneficial effect Effects 0.000 description 7
- 239000008103 glucose Substances 0.000 description 7
- 238000009396 hybridization Methods 0.000 description 7
- 230000006872 improvement Effects 0.000 description 7
- 239000000543 intermediate Substances 0.000 description 7
- 230000004048 modification Effects 0.000 description 7
- 231100000219 mutagenic Toxicity 0.000 description 7
- 230000003505 mutagenic effect Effects 0.000 description 7
- 108020002982 thioesterase Proteins 0.000 description 7
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 6
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 6
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 6
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 6
- OFOBLEOULBTSOW-UHFFFAOYSA-N Malonic acid Chemical compound OC(=O)CC(O)=O OFOBLEOULBTSOW-UHFFFAOYSA-N 0.000 description 6
- OSZTUONKUMCWEP-XUXIUFHCSA-N Met-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCSC OSZTUONKUMCWEP-XUXIUFHCSA-N 0.000 description 6
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 6
- 108700026244 Open Reading Frames Proteins 0.000 description 6
- 102000005488 Thioesterase Human genes 0.000 description 6
- 229960001230 asparagine Drugs 0.000 description 6
- 235000009582 asparagine Nutrition 0.000 description 6
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 6
- 238000012219 cassette mutagenesis Methods 0.000 description 6
- 239000000571 coke Substances 0.000 description 6
- 230000003247 decreasing effect Effects 0.000 description 6
- 239000003814 drug Substances 0.000 description 6
- 101150016526 fadE gene Proteins 0.000 description 6
- 239000012634 fragment Substances 0.000 description 6
- 238000010353 genetic engineering Methods 0.000 description 6
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 6
- 229960000310 isoleucine Drugs 0.000 description 6
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 6
- 238000012986 modification Methods 0.000 description 6
- 230000002018 overexpression Effects 0.000 description 6
- 229920000642 polymer Polymers 0.000 description 6
- 229920005989 resin Polymers 0.000 description 6
- 239000011347 resin Substances 0.000 description 6
- 229920006395 saturated elastomer Polymers 0.000 description 6
- 238000013519 translation Methods 0.000 description 6
- 239000001993 wax Substances 0.000 description 6
- UHPMCKVQTMMPCG-UHFFFAOYSA-N 5,8-dihydroxy-2-methoxy-6-methyl-7-(2-oxopropyl)naphthalene-1,4-dione Chemical compound CC1=C(CC(C)=O)C(O)=C2C(=O)C(OC)=CC(=O)C2=C1O UHPMCKVQTMMPCG-UHFFFAOYSA-N 0.000 description 5
- 102000007698 Alcohol dehydrogenase Human genes 0.000 description 5
- 108010021809 Alcohol dehydrogenase Proteins 0.000 description 5
- 241000195493 Cryptophyta Species 0.000 description 5
- 241000233866 Fungi Species 0.000 description 5
- 241000223218 Fusarium Species 0.000 description 5
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 5
- LIIXIZKVWNYQHB-STECZYCISA-N Met-Tyr-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LIIXIZKVWNYQHB-STECZYCISA-N 0.000 description 5
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 5
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 5
- 101150008263 accD gene Proteins 0.000 description 5
- 125000002252 acyl group Chemical group 0.000 description 5
- 125000000539 amino acid group Chemical group 0.000 description 5
- 230000008238 biochemical pathway Effects 0.000 description 5
- 239000002537 cosmetic Substances 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 235000021588 free fatty acids Nutrition 0.000 description 5
- 230000001939 inductive effect Effects 0.000 description 5
- 238000011835 investigation Methods 0.000 description 5
- 239000003550 marker Substances 0.000 description 5
- 230000037361 pathway Effects 0.000 description 5
- 239000004033 plastic Substances 0.000 description 5
- 229920003023 plastic Polymers 0.000 description 5
- 239000004014 plasticizer Substances 0.000 description 5
- 239000004753 textile Substances 0.000 description 5
- 238000013518 transcription Methods 0.000 description 5
- 230000035897 transcription Effects 0.000 description 5
- GGQQNYXPYWCUHG-RMTFUQJTSA-N (3e,6e)-deca-3,6-diene Chemical group CCC\C=C\C\C=C\CC GGQQNYXPYWCUHG-RMTFUQJTSA-N 0.000 description 4
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 4
- 108010019670 Chimeric Antigen Receptors Proteins 0.000 description 4
- 241000193403 Clostridium Species 0.000 description 4
- 102000053602 DNA Human genes 0.000 description 4
- 208000031912 Endemic Flea-Borne Typhus Diseases 0.000 description 4
- 101100390711 Escherichia coli (strain K12) fhuA gene Proteins 0.000 description 4
- 241000701988 Escherichia virus T5 Species 0.000 description 4
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 4
- 239000004472 Lysine Substances 0.000 description 4
- SMVTWPOATVIXTN-NAKRPEOUSA-N Met-Ser-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SMVTWPOATVIXTN-NAKRPEOUSA-N 0.000 description 4
- 206010028282 Murine typhus Diseases 0.000 description 4
- 108091034117 Oligonucleotide Proteins 0.000 description 4
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 4
- 239000004473 Threonine Substances 0.000 description 4
- 239000000654 additive Substances 0.000 description 4
- 239000012298 atmosphere Substances 0.000 description 4
- 230000002238 attenuated effect Effects 0.000 description 4
- 239000008280 blood Substances 0.000 description 4
- 210000004369 blood Anatomy 0.000 description 4
- 125000001721 carboxyacetyl group Chemical group 0.000 description 4
- 150000007942 carboxylates Chemical class 0.000 description 4
- 238000012217 deletion Methods 0.000 description 4
- 230000037430 deletion Effects 0.000 description 4
- 239000003599 detergent Substances 0.000 description 4
- 239000003925 fat Substances 0.000 description 4
- 230000004927 fusion Effects 0.000 description 4
- 239000003502 gasoline Substances 0.000 description 4
- 108090001018 hexadecanal dehydrogenase (acylating) Proteins 0.000 description 4
- 238000001727 in vivo Methods 0.000 description 4
- 239000003317 industrial substance Substances 0.000 description 4
- 239000004922 lacquer Substances 0.000 description 4
- 239000007788 liquid Substances 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 238000007254 oxidation reaction Methods 0.000 description 4
- 239000003973 paint Substances 0.000 description 4
- 238000000746 purification Methods 0.000 description 4
- 238000012216 screening Methods 0.000 description 4
- 239000002904 solvent Substances 0.000 description 4
- 239000004094 surface-active agent Substances 0.000 description 4
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 4
- 239000002699 waste material Substances 0.000 description 4
- DNIAPMSPPWPWGF-GSVOUGTGSA-N (R)-(-)-Propylene glycol Chemical compound C[C@@H](O)CO DNIAPMSPPWPWGF-GSVOUGTGSA-N 0.000 description 3
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 3
- 239000004475 Arginine Substances 0.000 description 3
- 102100033743 Biotin-[acetyl-CoA-carboxylase] ligase Human genes 0.000 description 3
- 102100037885 Calcium-independent phospholipase A2-gamma Human genes 0.000 description 3
- 239000004215 Carbon black (E152) Substances 0.000 description 3
- 101150071111 FADD gene Proteins 0.000 description 3
- 206010064571 Gene mutation Diseases 0.000 description 3
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 3
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 3
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 3
- ZEDVFJPQNNBMST-CYDGBPFRSA-N Met-Arg-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZEDVFJPQNNBMST-CYDGBPFRSA-N 0.000 description 3
- 108010021466 Mutant Proteins Proteins 0.000 description 3
- 102000008300 Mutant Proteins Human genes 0.000 description 3
- MUBZPKHOEPUJKR-UHFFFAOYSA-N Oxalic acid Chemical compound OC(=O)C(O)=O MUBZPKHOEPUJKR-UHFFFAOYSA-N 0.000 description 3
- 229910019142 PO4 Inorganic materials 0.000 description 3
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 3
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 3
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 3
- 108091081024 Start codon Proteins 0.000 description 3
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 3
- 208000037386 Typhoid Diseases 0.000 description 3
- 240000008042 Zea mays Species 0.000 description 3
- 239000002253 acid Substances 0.000 description 3
- 230000004075 alteration Effects 0.000 description 3
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 3
- 238000007845 assembly PCR Methods 0.000 description 3
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 3
- 239000003225 biodiesel Substances 0.000 description 3
- 239000002551 biofuel Substances 0.000 description 3
- 150000001720 carbohydrates Chemical class 0.000 description 3
- 235000014633 carbohydrates Nutrition 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 3
- 239000003795 chemical substances by application Substances 0.000 description 3
- 125000004122 cyclic group Chemical group 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 239000000975 dye Substances 0.000 description 3
- 239000003995 emulsifying agent Substances 0.000 description 3
- 210000003527 eukaryotic cell Anatomy 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 230000004136 fatty acid synthesis Effects 0.000 description 3
- 239000010408 film Substances 0.000 description 3
- 239000003063 flame retardant Substances 0.000 description 3
- 239000000796 flavoring agent Substances 0.000 description 3
- 235000013355 food flavoring agent Nutrition 0.000 description 3
- 239000003205 fragrance Substances 0.000 description 3
- 239000000499 gel Substances 0.000 description 3
- 230000004077 genetic alteration Effects 0.000 description 3
- 231100000118 genetic alteration Toxicity 0.000 description 3
- 229930195712 glutamate Natural products 0.000 description 3
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 3
- 230000012010 growth Effects 0.000 description 3
- 239000000314 lubricant Substances 0.000 description 3
- 150000002690 malonic acid derivatives Chemical class 0.000 description 3
- 108020004999 messenger RNA Proteins 0.000 description 3
- 229910052757 nitrogen Inorganic materials 0.000 description 3
- 239000002736 nonionic surfactant Substances 0.000 description 3
- 210000003463 organelle Anatomy 0.000 description 3
- 229910052760 oxygen Inorganic materials 0.000 description 3
- 239000001301 oxygen Substances 0.000 description 3
- 239000010452 phosphate Substances 0.000 description 3
- 150000003881 polyketide derivatives Chemical class 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 230000010076 replication Effects 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 229910052717 sulfur Inorganic materials 0.000 description 3
- 239000011593 sulfur Substances 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 210000001519 tissue Anatomy 0.000 description 3
- 201000008297 typhoid fever Diseases 0.000 description 3
- 238000011144 upstream manufacturing Methods 0.000 description 3
- 239000002966 varnish Substances 0.000 description 3
- 230000003612 virological effect Effects 0.000 description 3
- 238000005406 washing Methods 0.000 description 3
- 241000023308 Acca Species 0.000 description 2
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 description 2
- 241001513093 Aspergillus awamori Species 0.000 description 2
- 101100012355 Bacillus anthracis fabH1 gene Proteins 0.000 description 2
- 241000194107 Bacillus megaterium Species 0.000 description 2
- 244000063299 Bacillus subtilis Species 0.000 description 2
- 235000014469 Bacillus subtilis Nutrition 0.000 description 2
- 101100012357 Bacillus subtilis (strain 168) fabHA gene Proteins 0.000 description 2
- 241000193388 Bacillus thuringiensis Species 0.000 description 2
- 241000193764 Brevibacillus brevis Species 0.000 description 2
- 206010008631 Cholera Diseases 0.000 description 2
- 241000186226 Corynebacterium glutamicum Species 0.000 description 2
- SRBFZHDQGSBBOR-IOVATXLUSA-N D-xylopyranose Chemical compound O[C@@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-IOVATXLUSA-N 0.000 description 2
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 2
- 101100135734 Haloferax mediterranei (strain ATCC 33500 / DSM 1411 / JCM 8866 / NBRC 14739 / NCIMB 2177 / R-4) pccB gene Proteins 0.000 description 2
- 241000590002 Helicobacter pylori Species 0.000 description 2
- 101000937642 Homo sapiens Malonyl-CoA-acyl carrier protein transacylase, mitochondrial Proteins 0.000 description 2
- 241000223198 Humicola Species 0.000 description 2
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 description 2
- 102100027329 Malonyl-CoA-acyl carrier protein transacylase, mitochondrial Human genes 0.000 description 2
- NHDMNXBBSGVYGP-PYJNHQTQSA-N Met-His-Ile Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)CC)C(O)=O)CC1=CN=CN1 NHDMNXBBSGVYGP-PYJNHQTQSA-N 0.000 description 2
- MVMNUCOHQGYYKB-PEDHHIEDSA-N Met-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CCSC)N MVMNUCOHQGYYKB-PEDHHIEDSA-N 0.000 description 2
- WXJLBSXNUHIGSS-OSUNSFLBSA-N Met-Thr-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WXJLBSXNUHIGSS-OSUNSFLBSA-N 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 241000795633 Olea <sea slug> Species 0.000 description 2
- 241001520808 Panicum virgatum Species 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical group OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 2
- 241000192138 Prochlorococcus Species 0.000 description 2
- 108020004511 Recombinant DNA Proteins 0.000 description 2
- 241000190932 Rhodopseudomonas Species 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 229920002472 Starch Polymers 0.000 description 2
- 229930006000 Sucrose Natural products 0.000 description 2
- 108010006785 Taq Polymerase Proteins 0.000 description 2
- 108091023040 Transcription factor Proteins 0.000 description 2
- 102000040945 Transcription factor Human genes 0.000 description 2
- 108091023045 Untranslated Region Proteins 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 241000235013 Yarrowia Species 0.000 description 2
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 2
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 2
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 2
- 101150046124 accA gene Proteins 0.000 description 2
- 238000004760 accelerator mass spectrometry Methods 0.000 description 2
- 150000007513 acids Chemical class 0.000 description 2
- 125000000217 alkyl group Chemical group 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 2
- 235000003704 aspartic acid Nutrition 0.000 description 2
- 229940097012 bacillus thuringiensis Drugs 0.000 description 2
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 2
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 2
- 230000008827 biological function Effects 0.000 description 2
- 239000012620 biological material Substances 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 2
- 230000001851 biosynthetic effect Effects 0.000 description 2
- 125000004057 biotinyl group Chemical group [H]N1C(=O)N([H])[C@]2([H])[C@@]([H])(SC([H])([H])[C@]12[H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C(*)=O 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 239000001569 carbon dioxide Substances 0.000 description 2
- 229910002092 carbon dioxide Inorganic materials 0.000 description 2
- 150000001732 carboxylic acid derivatives Chemical class 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 230000003197 catalytic effect Effects 0.000 description 2
- 239000001913 cellulose Substances 0.000 description 2
- 229920002678 cellulose Polymers 0.000 description 2
- 235000010980 cellulose Nutrition 0.000 description 2
- 150000005829 chemical entities Chemical class 0.000 description 2
- 239000007795 chemical reaction product Substances 0.000 description 2
- 210000003763 chloroplast Anatomy 0.000 description 2
- 230000002759 chromosomal effect Effects 0.000 description 2
- 239000000356 contaminant Substances 0.000 description 2
- 238000011109 contamination Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 235000005822 corn Nutrition 0.000 description 2
- 239000010779 crude oil Substances 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- MWKFXSUHUHTGQN-UHFFFAOYSA-N decan-1-ol Chemical compound CCCCCCCCCCO MWKFXSUHUHTGQN-UHFFFAOYSA-N 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 150000002016 disaccharides Chemical class 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- LQZZUXJYWNFBMV-UHFFFAOYSA-N dodecan-1-ol Chemical compound CCCCCCCCCCCCO LQZZUXJYWNFBMV-UHFFFAOYSA-N 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 229920001971 elastomer Polymers 0.000 description 2
- 239000003974 emollient agent Substances 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 101150026389 fabF gene Proteins 0.000 description 2
- 101150090981 fabG gene Proteins 0.000 description 2
- 101150035981 fabH gene Proteins 0.000 description 2
- 101150115959 fadR gene Proteins 0.000 description 2
- 230000004133 fatty acid degradation Effects 0.000 description 2
- 239000012467 final product Substances 0.000 description 2
- 230000004907 flux Effects 0.000 description 2
- 235000013305 food Nutrition 0.000 description 2
- 238000004817 gas chromatography Methods 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- WHUUTDBJXJRKMK-VKHMYHEASA-L glutamate group Chemical group N[C@@H](CCC(=O)[O-])C(=O)[O-] WHUUTDBJXJRKMK-VKHMYHEASA-L 0.000 description 2
- 229940037467 helicobacter pylori Drugs 0.000 description 2
- BXWNKGSJHAJOGX-UHFFFAOYSA-N hexadecan-1-ol Chemical compound CCCCCCCCCCCCCCCCO BXWNKGSJHAJOGX-UHFFFAOYSA-N 0.000 description 2
- 238000002744 homologous recombination Methods 0.000 description 2
- 230000006801 homologous recombination Effects 0.000 description 2
- 239000004434 industrial solvent Substances 0.000 description 2
- 230000003834 intracellular effect Effects 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 150000002632 lipids Chemical class 0.000 description 2
- 239000003879 lubricant additive Substances 0.000 description 2
- 101150068528 mabA gene Proteins 0.000 description 2
- 230000004060 metabolic process Effects 0.000 description 2
- 150000002772 monosaccharides Chemical class 0.000 description 2
- 235000019645 odor Nutrition 0.000 description 2
- 239000012044 organic layer Substances 0.000 description 2
- 230000003647 oxidation Effects 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 239000003348 petrochemical agent Substances 0.000 description 2
- 239000011846 petroleum-based material Substances 0.000 description 2
- 239000008336 pharmaceutical lotion Substances 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 2
- 229920001282 polysaccharide Polymers 0.000 description 2
- 239000005017 polysaccharide Substances 0.000 description 2
- 150000004804 polysaccharides Chemical class 0.000 description 2
- 230000001902 propagating effect Effects 0.000 description 2
- 230000005855 radiation Effects 0.000 description 2
- 239000011535 reaction buffer Substances 0.000 description 2
- 238000010188 recombinant method Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- 230000001568 sexual effect Effects 0.000 description 2
- 238000002741 site-directed mutagenesis Methods 0.000 description 2
- 239000000344 soap Substances 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000010561 standard procedure Methods 0.000 description 2
- 239000008107 starch Substances 0.000 description 2
- 235000019698 starch Nutrition 0.000 description 2
- 239000005720 sucrose Substances 0.000 description 2
- 150000008163 sugars Chemical class 0.000 description 2
- 230000008685 targeting Effects 0.000 description 2
- 239000002562 thickening agent Substances 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 239000002023 wood Substances 0.000 description 2
- 210000005253 yeast cell Anatomy 0.000 description 2
- GWSURTDMLUFMJH-FOCLMDBBSA-N (e)-hexadec-1-en-1-ol Chemical compound CCCCCCCCCCCCCC\C=C\O GWSURTDMLUFMJH-FOCLMDBBSA-N 0.000 description 1
- JEGNXMUWVCVSSQ-ISLYRVAYSA-N (e)-octadec-1-en-1-ol Chemical compound CCCCCCCCCCCCCCCC\C=C\O JEGNXMUWVCVSSQ-ISLYRVAYSA-N 0.000 description 1
- LDVVTQMJQSCDMK-UHFFFAOYSA-N 1,3-dihydroxypropan-2-yl formate Chemical compound OCC(CO)OC=O LDVVTQMJQSCDMK-UHFFFAOYSA-N 0.000 description 1
- 239000005968 1-Decanol Substances 0.000 description 1
- OWEGMIWEEQEYGQ-UHFFFAOYSA-N 100676-05-9 Natural products OC1C(O)C(O)C(CO)OC1OCC1C(O)C(O)C(O)C(OC2C(OC(O)C(O)C2O)CO)O1 OWEGMIWEEQEYGQ-UHFFFAOYSA-N 0.000 description 1
- XKLJLHAPJBUBNL-UHFFFAOYSA-N 12-methyltetradecanoic acid Chemical compound CCC(C)CCCCCCCCCCC(O)=O XKLJLHAPJBUBNL-UHFFFAOYSA-N 0.000 description 1
- ZONJATNKKGGVSU-UHFFFAOYSA-N 14-methylpentadecanoic acid Chemical compound CC(C)CCCCCCCCCCCCC(O)=O ZONJATNKKGGVSU-UHFFFAOYSA-N 0.000 description 1
- MAFSBQRWNXDTRK-UHFFFAOYSA-N 15-methylheptadecanoic acid Chemical compound CCC(C)CCCCCCCCCCCCCC(O)=O MAFSBQRWNXDTRK-UHFFFAOYSA-N 0.000 description 1
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 1
- XTWYTFMLZFPYCI-KQYNXXCUSA-N 5'-adenylphosphoric acid Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O XTWYTFMLZFPYCI-KQYNXXCUSA-N 0.000 description 1
- 240000000073 Achillea millefolium Species 0.000 description 1
- 235000007754 Achillea millefolium Nutrition 0.000 description 1
- 241000186361 Actinobacteria <class> Species 0.000 description 1
- 108010001058 Acyl-CoA Dehydrogenase Proteins 0.000 description 1
- 102000002735 Acyl-CoA Dehydrogenase Human genes 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 241000272525 Anas platyrhynchos Species 0.000 description 1
- 241000219194 Arabidopsis Species 0.000 description 1
- 241000219195 Arabidopsis thaliana Species 0.000 description 1
- 241000892910 Aspergillus foetidus Species 0.000 description 1
- 241001225321 Aspergillus fumigatus Species 0.000 description 1
- 241000228245 Aspergillus niger Species 0.000 description 1
- 240000006439 Aspergillus oryzae Species 0.000 description 1
- 235000002247 Aspergillus oryzae Nutrition 0.000 description 1
- 208000000659 Autoimmune lymphoproliferative syndrome Diseases 0.000 description 1
- 241000193744 Bacillus amyloliquefaciens Species 0.000 description 1
- 241000193752 Bacillus circulans Species 0.000 description 1
- 241001328122 Bacillus clausii Species 0.000 description 1
- 241000193749 Bacillus coagulans Species 0.000 description 1
- 241000193422 Bacillus lentus Species 0.000 description 1
- 241000194103 Bacillus pumilus Species 0.000 description 1
- 208000016444 Benign adult familial myoclonic epilepsy Diseases 0.000 description 1
- 108050003866 Bifunctional ligase/repressor BirA Proteins 0.000 description 1
- 101710145299 Biotin-[acetyl-CoA-carboxylase] ligase Proteins 0.000 description 1
- DKPFZGUDAPQIHT-UHFFFAOYSA-N Butyl acetate Natural products CCCCOC(C)=O DKPFZGUDAPQIHT-UHFFFAOYSA-N 0.000 description 1
- QWOJMRHUQHTCJG-UHFFFAOYSA-N CC([CH2-])=O Chemical group CC([CH2-])=O QWOJMRHUQHTCJG-UHFFFAOYSA-N 0.000 description 1
- 102000004031 Carboxy-Lyases Human genes 0.000 description 1
- 108090000489 Carboxy-Lyases Proteins 0.000 description 1
- 244000201986 Cassia tora Species 0.000 description 1
- 241000195597 Chlamydomonas reinhardtii Species 0.000 description 1
- 241000191382 Chlorobaculum tepidum Species 0.000 description 1
- 241000195628 Chlorophyta Species 0.000 description 1
- 241000123346 Chrysosporium Species 0.000 description 1
- 241000193401 Clostridium acetobutylicum Species 0.000 description 1
- 241000186566 Clostridium ljungdahlii Species 0.000 description 1
- 206010010144 Completed suicide Diseases 0.000 description 1
- 108091035707 Consensus sequence Proteins 0.000 description 1
- 241000186216 Corynebacterium Species 0.000 description 1
- 241001464430 Cyanobacterium Species 0.000 description 1
- 241000159506 Cyanothece Species 0.000 description 1
- GUBGYTABKSRVRQ-CUHNMECISA-N D-Cellobiose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-CUHNMECISA-N 0.000 description 1
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 description 1
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 1
- 230000033616 DNA repair Effects 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 241000660147 Escherichia coli str. K-12 substr. MG1655 Species 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 229930091371 Fructose Natural products 0.000 description 1
- RFSUNEUAIZKAJO-ARQDHWQXSA-N Fructose Chemical compound OC[C@H]1O[C@](O)(CO)[C@@H](O)[C@@H]1O RFSUNEUAIZKAJO-ARQDHWQXSA-N 0.000 description 1
- 239000005715 Fructose Substances 0.000 description 1
- 108010010803 Gelatin Proteins 0.000 description 1
- 241000193385 Geobacillus stearothermophilus Species 0.000 description 1
- 241000720950 Gluta Species 0.000 description 1
- 244000068988 Glycine max Species 0.000 description 1
- 235000010469 Glycine max Nutrition 0.000 description 1
- UYTPUPDQBNUYGX-UHFFFAOYSA-N Guanine Natural products O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 1
- 229920002488 Hemicellulose Polymers 0.000 description 1
- 241001480714 Humicola insolens Species 0.000 description 1
- 241000567769 Isurus oxyrinchus Species 0.000 description 1
- 201000008225 Klebsiella pneumonia Diseases 0.000 description 1
- 241000588747 Klebsiella pneumoniae Species 0.000 description 1
- 241000235649 Kluyveromyces Species 0.000 description 1
- 241000235058 Komagataella pastoris Species 0.000 description 1
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- JVTAAEKCZFNVCJ-UHFFFAOYSA-M Lactate Chemical compound CC(O)C([O-])=O JVTAAEKCZFNVCJ-UHFFFAOYSA-M 0.000 description 1
- 240000001929 Lactobacillus brevis Species 0.000 description 1
- 235000013957 Lactobacillus brevis Nutrition 0.000 description 1
- HGFGEMSVBMCFKK-MNXVOIDGSA-N Leu-Ile-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O HGFGEMSVBMCFKK-MNXVOIDGSA-N 0.000 description 1
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 1
- MDDUIRLQCYVRDO-NHCYSSNCSA-N Lys-Val-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN MDDUIRLQCYVRDO-NHCYSSNCSA-N 0.000 description 1
- GUBGYTABKSRVRQ-PICCSMPSSA-N Maltose Natural products O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-PICCSMPSSA-N 0.000 description 1
- 241000206597 Marinobacter hydrocarbonoclasticus Species 0.000 description 1
- QXEVZBXTDTVPCP-GMOBBJLQSA-N Met-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCSC)N QXEVZBXTDTVPCP-GMOBBJLQSA-N 0.000 description 1
- XMMWDTUFTZMQFD-GMOBBJLQSA-N Met-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCSC XMMWDTUFTZMQFD-GMOBBJLQSA-N 0.000 description 1
- AWOMRHGUWFBDNU-ZPFDUUQYSA-N Met-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCSC)N AWOMRHGUWFBDNU-ZPFDUUQYSA-N 0.000 description 1
- 241001074116 Miscanthus x giganteus Species 0.000 description 1
- 241000235395 Mucor Species 0.000 description 1
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 1
- 240000002853 Nelumbo nucifera Species 0.000 description 1
- 235000006508 Nelumbo nucifera Nutrition 0.000 description 1
- 235000006510 Nelumbo pentapetala Nutrition 0.000 description 1
- 241000221960 Neurospora Species 0.000 description 1
- 229910000829 Nisil Inorganic materials 0.000 description 1
- 241000424623 Nostoc punctiforme Species 0.000 description 1
- 241000237502 Ostreidae Species 0.000 description 1
- 241000209117 Panicum Species 0.000 description 1
- 235000006443 Panicum miliaceum subsp. miliaceum Nutrition 0.000 description 1
- 235000009037 Panicum miliaceum subsp. ruderale Nutrition 0.000 description 1
- 241000228143 Penicillium Species 0.000 description 1
- 241000228150 Penicillium chrysogenum Species 0.000 description 1
- 102000035195 Peptidases Human genes 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 239000001888 Peptone Substances 0.000 description 1
- 108010080698 Peptones Proteins 0.000 description 1
- 241000222385 Phanerochaete Species 0.000 description 1
- KRYSMKKRRRWOCZ-QEWYBTABSA-N Phe-Ile-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O KRYSMKKRRRWOCZ-QEWYBTABSA-N 0.000 description 1
- 241000235648 Pichia Species 0.000 description 1
- 108010064851 Plant Proteins Proteins 0.000 description 1
- 241000222350 Pleurotus Species 0.000 description 1
- 206010035717 Pneumonia klebsiella Diseases 0.000 description 1
- 241000209504 Poaceae Species 0.000 description 1
- 239000004743 Polypropylene Substances 0.000 description 1
- QOSMNYMQXIVWKY-UHFFFAOYSA-N Propyl levulinate Chemical compound CCCOC(=O)CCC(C)=O QOSMNYMQXIVWKY-UHFFFAOYSA-N 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 241001290151 Prunus avium subsp. avium Species 0.000 description 1
- 241000589540 Pseudomonas fluorescens Species 0.000 description 1
- 241000589776 Pseudomonas putida Species 0.000 description 1
- 241000589194 Rhizobium leguminosarum Species 0.000 description 1
- 241000235402 Rhizomucor Species 0.000 description 1
- 241000235403 Rhizomucor miehei Species 0.000 description 1
- 241000191023 Rhodobacter capsulatus Species 0.000 description 1
- 241001524101 Rhodococcus opacus Species 0.000 description 1
- 241000190984 Rhodospirillum rubrum Species 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- 241000193448 Ruminiclostridium thermocellum Species 0.000 description 1
- 240000000111 Saccharum officinarum Species 0.000 description 1
- 235000007201 Saccharum officinarum Nutrition 0.000 description 1
- 241001466077 Salina Species 0.000 description 1
- 241000293869 Salmonella enterica subsp. enterica serovar Typhimurium Species 0.000 description 1
- 241000235346 Schizosaccharomyces Species 0.000 description 1
- 241000235347 Schizosaccharomyces pombe Species 0.000 description 1
- 241001047198 Scomberomorus semifasciatus Species 0.000 description 1
- 241000607768 Shigella Species 0.000 description 1
- 101000739979 Shigella flexneri Biotin carboxyl carrier protein of acetyl-CoA carboxylase Proteins 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 241000187398 Streptomyces lividans Species 0.000 description 1
- 241001468239 Streptomyces murinus Species 0.000 description 1
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 1
- 241000192707 Synechococcus Species 0.000 description 1
- 241001453296 Synechococcus elongatus Species 0.000 description 1
- 241000192584 Synechocystis Species 0.000 description 1
- 241000192581 Synechocystis sp. Species 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- 244000269722 Thea sinensis Species 0.000 description 1
- 241001313706 Thermosynechococcus Species 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical class OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 description 1
- KERCOYANYUPLHJ-XGEHTFHBSA-N Thr-Pro-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O KERCOYANYUPLHJ-XGEHTFHBSA-N 0.000 description 1
- 241000222354 Trametes Species 0.000 description 1
- 101710195626 Transcriptional activator protein Proteins 0.000 description 1
- 241000223259 Trichoderma Species 0.000 description 1
- 241000378866 Trichoderma koningii Species 0.000 description 1
- 241000223262 Trichoderma longibrachiatum Species 0.000 description 1
- 241000499912 Trichoderma reesei Species 0.000 description 1
- 241000223261 Trichoderma viride Species 0.000 description 1
- DRQXUCVJDCRJDB-UHFFFAOYSA-N Turanose Natural products OC1C(CO)OC(O)(CO)C1OC1C(O)C(O)C(O)C(CO)O1 DRQXUCVJDCRJDB-UHFFFAOYSA-N 0.000 description 1
- BEGDZYNDCNEGJZ-XVKPBYJWSA-N Val-Gly-Gln Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O BEGDZYNDCNEGJZ-XVKPBYJWSA-N 0.000 description 1
- 241000607626 Vibrio cholerae Species 0.000 description 1
- 235000007244 Zea mays Nutrition 0.000 description 1
- 241000588902 Zymomonas mobilis Species 0.000 description 1
- DPXJVFZANSGRMM-UHFFFAOYSA-N acetic acid;2,3,4,5,6-pentahydroxyhexanal;sodium Chemical compound [Na].CC(O)=O.OCC(O)C(O)C(O)C(O)C=O DPXJVFZANSGRMM-UHFFFAOYSA-N 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 239000012190 activator Substances 0.000 description 1
- 230000010933 acylation Effects 0.000 description 1
- 238000005917 acylation reaction Methods 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 238000005273 aeration Methods 0.000 description 1
- 125000003158 alcohol group Chemical group 0.000 description 1
- 150000001299 aldehydes Chemical class 0.000 description 1
- 150000007824 aliphatic compounds Chemical class 0.000 description 1
- 150000001345 alkine derivatives Chemical class 0.000 description 1
- 239000002168 alkylating agent Substances 0.000 description 1
- 229940100198 alkylating agent Drugs 0.000 description 1
- 125000002947 alkylene group Chemical group 0.000 description 1
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 1
- WQZGKKKJIJFFOK-PHYPRBDBSA-N alpha-D-galactose Chemical compound OC[C@H]1O[C@H](O)[C@H](O)[C@@H](O)[C@H]1O WQZGKKKJIJFFOK-PHYPRBDBSA-N 0.000 description 1
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 1
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 1
- 150000001408 amides Chemical class 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 150000008064 anhydrides Chemical class 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 239000002216 antistatic agent Substances 0.000 description 1
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 description 1
- 150000001491 aromatic compounds Chemical class 0.000 description 1
- 230000001651 autotrophic effect Effects 0.000 description 1
- 229940054340 bacillus coagulans Drugs 0.000 description 1
- 210000003578 bacterial chromosome Anatomy 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- GUBGYTABKSRVRQ-QUYVBRFLSA-N beta-maltose Chemical compound OC[C@H]1O[C@H](O[C@H]2[C@H](O)[C@@H](O)[C@H](O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@@H]1O GUBGYTABKSRVRQ-QUYVBRFLSA-N 0.000 description 1
- 230000036983 biotransformation Effects 0.000 description 1
- 235000012467 brownies Nutrition 0.000 description 1
- 229940041514 candida albicans extract Drugs 0.000 description 1
- 125000004432 carbon atom Chemical group C* 0.000 description 1
- 150000004649 carbonic acid derivatives Chemical class 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 239000001768 carboxy methyl cellulose Substances 0.000 description 1
- 239000006143 cell culture medium Substances 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 210000003850 cellular structure Anatomy 0.000 description 1
- 229960000541 cetyl alcohol Drugs 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 150000001793 charged compounds Chemical class 0.000 description 1
- 239000013043 chemical agent Substances 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 235000019693 cherries Nutrition 0.000 description 1
- 229960005091 chloramphenicol Drugs 0.000 description 1
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 1
- 150000003841 chloride salts Chemical class 0.000 description 1
- 210000000078 claw Anatomy 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 238000012411 cloning technique Methods 0.000 description 1
- 239000003245 coal Substances 0.000 description 1
- 238000002485 combustion reaction Methods 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 239000000306 component Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 235000021438 curry Nutrition 0.000 description 1
- 150000001924 cycloalkanes Chemical class 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 description 1
- SUYVUBYJARFZHO-UHFFFAOYSA-N dATP Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-UHFFFAOYSA-N 0.000 description 1
- RGWHQCVHVJXOKC-SHYZEUOFSA-J dCTP(4-) Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-J 0.000 description 1
- HAAZLUGHYHWQIW-KVQBGUIXSA-N dGTP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HAAZLUGHYHWQIW-KVQBGUIXSA-N 0.000 description 1
- NHVNXKFIZYSCEB-XLPZGREQSA-N dTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 NHVNXKFIZYSCEB-XLPZGREQSA-N 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- VILAVOFMIJHSJA-UHFFFAOYSA-N dicarbon monoxide Chemical compound [C]=C=O VILAVOFMIJHSJA-UHFFFAOYSA-N 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 239000000539 dimer Substances 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000010494 dissociation reaction Methods 0.000 description 1
- 230000005593 dissociations Effects 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 101150046913 ecpA gene Proteins 0.000 description 1
- 101150105575 ecpB gene Proteins 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 239000000806 elastomer Substances 0.000 description 1
- 230000009483 enzymatic pathway Effects 0.000 description 1
- 208000028104 epidemic louse-borne typhus Diseases 0.000 description 1
- 108010052305 exodeoxyribonuclease III Proteins 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 101150072202 fabV gene Proteins 0.000 description 1
- 208000016427 familial adult myoclonic epilepsy Diseases 0.000 description 1
- 210000003608 fece Anatomy 0.000 description 1
- 230000008713 feedback mechanism Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- GNBHRKFJIUUOQI-UHFFFAOYSA-N fluorescein Chemical compound O1C(=O)C2=CC=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 GNBHRKFJIUUOQI-UHFFFAOYSA-N 0.000 description 1
- 239000010794 food waste Substances 0.000 description 1
- 239000002803 fossil fuel Substances 0.000 description 1
- 238000005194 fractionation Methods 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- FTSSQIKWUOOEGC-RULYVFMPSA-N fructooligosaccharide Chemical compound OC[C@H]1O[C@@](CO)(OC[C@@]2(OC[C@@]3(OC[C@@]4(OC[C@@]5(OC[C@@]6(OC[C@@]7(OC[C@@]8(OC[C@@]9(OC[C@@]%10(OC[C@@]%11(O[C@H]%12O[C@H](CO)[C@@H](O)[C@H](O)[C@H]%12O)O[C@H](CO)[C@@H](O)[C@@H]%11O)O[C@H](CO)[C@@H](O)[C@@H]%10O)O[C@H](CO)[C@@H](O)[C@@H]9O)O[C@H](CO)[C@@H](O)[C@@H]8O)O[C@H](CO)[C@@H](O)[C@@H]7O)O[C@H](CO)[C@@H](O)[C@@H]6O)O[C@H](CO)[C@@H](O)[C@@H]5O)O[C@H](CO)[C@@H](O)[C@@H]4O)O[C@H](CO)[C@@H](O)[C@@H]3O)O[C@H](CO)[C@@H](O)[C@@H]2O)[C@@H](O)[C@@H]1O FTSSQIKWUOOEGC-RULYVFMPSA-N 0.000 description 1
- 229940107187 fructooligosaccharide Drugs 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 235000021255 galacto-oligosaccharides Nutrition 0.000 description 1
- 150000003271 galactooligosaccharides Chemical class 0.000 description 1
- 229930182830 galactose Natural products 0.000 description 1
- 239000007789 gas Substances 0.000 description 1
- 239000008273 gelatin Substances 0.000 description 1
- 229920000159 gelatin Polymers 0.000 description 1
- 235000019322 gelatine Nutrition 0.000 description 1
- 235000011852 gelatine desserts Nutrition 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 125000002791 glucosyl group Chemical group C1([C@H](O)[C@@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 1
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 1
- IVSXFFJGASXYCL-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=NC=N[C]21 IVSXFFJGASXYCL-UHFFFAOYSA-N 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 125000000623 heterocyclic group Chemical group 0.000 description 1
- FUZZWVXGSFPDMH-UHFFFAOYSA-M hexanoate Chemical compound CCCCCC([O-])=O FUZZWVXGSFPDMH-UHFFFAOYSA-M 0.000 description 1
- 230000013632 homeostatic process Effects 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000013067 intermediate product Substances 0.000 description 1
- IIUXHTGBZYEGHI-UHFFFAOYSA-N isoheptadecanoic acid Chemical compound CC(C)CCCCCCCCCCCCCC(O)=O IIUXHTGBZYEGHI-UHFFFAOYSA-N 0.000 description 1
- YYVJAABUJYRQJO-UHFFFAOYSA-N isomyristic acid Chemical compound CC(C)CCCCCCCCCCC(O)=O YYVJAABUJYRQJO-UHFFFAOYSA-N 0.000 description 1
- ZOCYQVNGROEVLU-UHFFFAOYSA-N isopentadecanoic acid Chemical compound CC(C)CCCCCCCCCCCC(O)=O ZOCYQVNGROEVLU-UHFFFAOYSA-N 0.000 description 1
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 1
- 238000002307 isotope ratio mass spectrometry Methods 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 1
- 229930027917 kanamycin Natural products 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- 150000002561 ketenes Chemical class 0.000 description 1
- 238000011031 large-scale manufacturing process Methods 0.000 description 1
- 239000003915 liquefied petroleum gas Substances 0.000 description 1
- 239000010871 livestock manure Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 125000003588 lysine group Chemical group [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 108010054155 lysyllysine Proteins 0.000 description 1
- 125000005637 malonyl-CoA group Chemical group 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000000691 measurement method Methods 0.000 description 1
- 239000013028 medium composition Substances 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 230000037353 metabolic pathway Effects 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 150000002739 metals Chemical class 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 125000000956 methoxy group Chemical group [H]C([H])([H])O* 0.000 description 1
- 229920000609 methyl cellulose Polymers 0.000 description 1
- 150000004702 methyl esters Chemical class 0.000 description 1
- 239000001923 methylcellulose Substances 0.000 description 1
- 235000010981 methylcellulose Nutrition 0.000 description 1
- 239000006151 minimal media Substances 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 108091005573 modified proteins Proteins 0.000 description 1
- 102000035118 modified proteins Human genes 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 235000021281 monounsaturated fatty acids Nutrition 0.000 description 1
- 239000003471 mutagenic agent Substances 0.000 description 1
- 231100000299 mutagenicity Toxicity 0.000 description 1
- 230000007886 mutagenicity Effects 0.000 description 1
- 229940043348 myristyl alcohol Drugs 0.000 description 1
- 125000000740 n-pentyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])* 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 235000016709 nutrition Nutrition 0.000 description 1
- QIQXTHQIDYTFRH-UHFFFAOYSA-N octadecanoic acid Chemical compound CCCCCCCCCCCCCCCCCC(O)=O QIQXTHQIDYTFRH-UHFFFAOYSA-N 0.000 description 1
- JRZJOMJEPLMPRA-UHFFFAOYSA-N olefin Natural products CCCCCCCC=C JRZJOMJEPLMPRA-UHFFFAOYSA-N 0.000 description 1
- XMLQWXUVTXCDDL-UHFFFAOYSA-N oleyl alcohol Natural products CCCCCCC=CCCCCCCCCCCO XMLQWXUVTXCDDL-UHFFFAOYSA-N 0.000 description 1
- 229920001542 oligosaccharide Polymers 0.000 description 1
- 150000002482 oligosaccharides Chemical class 0.000 description 1
- 235000021354 omega 7 monounsaturated fatty acids Nutrition 0.000 description 1
- 239000011368 organic material Substances 0.000 description 1
- 239000012074 organic phase Substances 0.000 description 1
- 235000006408 oxalic acid Nutrition 0.000 description 1
- 235000020636 oyster Nutrition 0.000 description 1
- 239000001814 pectin Substances 0.000 description 1
- 235000010987 pectin Nutrition 0.000 description 1
- 229920001277 pectin Polymers 0.000 description 1
- 150000002972 pentoses Chemical class 0.000 description 1
- 235000019319 peptone Nutrition 0.000 description 1
- 150000004965 peroxy acids Chemical class 0.000 description 1
- 239000003209 petroleum derivative Substances 0.000 description 1
- 239000013520 petroleum-based product Substances 0.000 description 1
- NCAIGTHBQTXTLR-UHFFFAOYSA-N phentermine hydrochloride Chemical compound [Cl-].CC(C)([NH3+])CC1=CC=CC=C1 NCAIGTHBQTXTLR-UHFFFAOYSA-N 0.000 description 1
- 108010001814 phosphopantetheinyl transferase Proteins 0.000 description 1
- 230000029553 photosynthesis Effects 0.000 description 1
- 238000010672 photosynthesis Methods 0.000 description 1
- 235000021118 plant-derived protein Nutrition 0.000 description 1
- 210000002706 plastid Anatomy 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 229920001155 polypropylene Polymers 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000035755 proliferation Effects 0.000 description 1
- 230000004952 protein activity Effects 0.000 description 1
- 239000012460 protein solution Substances 0.000 description 1
- 150000003212 purines Chemical class 0.000 description 1
- 150000003230 pyrimidines Chemical class 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000002708 random mutagenesis Methods 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 239000012925 reference material Substances 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 210000003705 ribosome Anatomy 0.000 description 1
- 239000007320 rich medium Substances 0.000 description 1
- 150000004671 saturated fatty acids Chemical class 0.000 description 1
- 235000003441 saturated fatty acids Nutrition 0.000 description 1
- 229930195734 saturated hydrocarbon Natural products 0.000 description 1
- DCKVNWZUADLDEH-UHFFFAOYSA-N sec-butyl acetate Chemical compound CCC(C)OC(C)=O DCKVNWZUADLDEH-UHFFFAOYSA-N 0.000 description 1
- 230000003248 secreting effect Effects 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 125000003607 serino group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 description 1
- 239000010865 sewage Substances 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 235000019812 sodium carboxymethyl cellulose Nutrition 0.000 description 1
- 229920001027 sodium carboxymethylcellulose Polymers 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 239000001509 sodium citrate Substances 0.000 description 1
- NLJMYIDDQXHKNR-UHFFFAOYSA-K sodium citrate Chemical compound O.O.[Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O NLJMYIDDQXHKNR-UHFFFAOYSA-K 0.000 description 1
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 1
- 239000001488 sodium phosphate Substances 0.000 description 1
- 229910000162 sodium phosphate Inorganic materials 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 239000010902 straw Substances 0.000 description 1
- KDYFGRWQOYBRFD-UHFFFAOYSA-L succinate(2-) Chemical compound [O-]C(=O)CCC([O-])=O KDYFGRWQOYBRFD-UHFFFAOYSA-L 0.000 description 1
- 125000000185 sucrose group Chemical group 0.000 description 1
- 239000013077 target material Substances 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- GXBLITCOLKGJDG-UHFFFAOYSA-N tetradec-13-en-1-ol Chemical compound OCCCCCCCCCCCCC=C GXBLITCOLKGJDG-UHFFFAOYSA-N 0.000 description 1
- 125000003396 thiol group Chemical group [H]S* 0.000 description 1
- 125000000341 threoninyl group Chemical group [H]OC([H])(C([H])([H])[H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- 239000001226 triphosphate Substances 0.000 description 1
- 235000011178 triphosphate Nutrition 0.000 description 1
- RYFMWSXOAZQYPI-UHFFFAOYSA-K trisodium phosphate Chemical compound [Na+].[Na+].[Na+].[O-]P([O-])([O-])=O RYFMWSXOAZQYPI-UHFFFAOYSA-K 0.000 description 1
- RULSWEULPANCDV-PIXUTMIVSA-N turanose Chemical compound OC[C@@H](O)[C@@H](O)[C@@H](C(=O)CO)O[C@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O RULSWEULPANCDV-PIXUTMIVSA-N 0.000 description 1
- 206010061393 typhus Diseases 0.000 description 1
- 125000001493 tyrosinyl group Chemical group [H]OC1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 229930195735 unsaturated hydrocarbon Natural products 0.000 description 1
- 230000003827 upregulation Effects 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 239000005418 vegetable material Substances 0.000 description 1
- 239000013603 viral vector Substances 0.000 description 1
- 229920001221 xylan Polymers 0.000 description 1
- 150000004823 xylans Chemical class 0.000 description 1
- 239000012138 yeast extract Substances 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/96—Stabilising an enzyme by forming an adduct or a composition; Forming enzyme conjugates
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/24—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Enterobacteriaceae (F), e.g. Citrobacter, Serratia, Proteus, Providencia, Morganella, Yersinia
- C07K14/245—Escherichia (G)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/93—Ligases (6)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/67—General methods for enhancing the expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/74—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0006—Oxidoreductases (1.) acting on CH-OH groups as donors (1.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0008—Oxidoreductases (1.) acting on the aldehyde or oxo group of donors (1.2)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1025—Acyltransferases (2.3)
- C12N9/1029—Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/40—Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/62—Carboxylic acid esters
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/64—Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/64—Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
- C12P7/6409—Fatty acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/64—Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
- C12P7/6436—Fatty acid esters
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/64—Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
- C12P7/6436—Fatty acid esters
- C12P7/649—Biodiesel, i.e. fatty acid alkyl esters
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y101/00—Oxidoreductases acting on the CH-OH group of donors (1.1)
- C12Y101/01—Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y101/00—Oxidoreductases acting on the CH-OH group of donors (1.1)
- C12Y101/01—Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
- C12Y101/01001—Alcohol dehydrogenase (1.1.1.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y102/00—Oxidoreductases acting on the aldehyde or oxo group of donors (1.2)
- C12Y102/01—Oxidoreductases acting on the aldehyde or oxo group of donors (1.2) with NAD+ or NADP+ as acceptor (1.2.1)
- C12Y102/0105—Long-chain-fatty-acyl-CoA reductase (1.2.1.50)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y102/00—Oxidoreductases acting on the aldehyde or oxo group of donors (1.2)
- C12Y102/01—Oxidoreductases acting on the aldehyde or oxo group of donors (1.2) with NAD+ or NADP+ as acceptor (1.2.1)
- C12Y102/0108—Long-chain acyl-[acyl-carrier-protein] reductase (1.2.1.80)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y102/00—Oxidoreductases acting on the aldehyde or oxo group of donors (1.2)
- C12Y102/99—Oxidoreductases acting on the aldehyde or oxo group of donors (1.2) with other acceptors (1.2.99)
- C12Y102/99006—Carboxylate reductase (1.2.99.6)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y203/00—Acyltransferases (2.3)
- C12Y203/01—Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
- C12Y203/01075—Long-chain-alcohol O-fatty-acyltransferase (2.3.1.75)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y203/00—Acyltransferases (2.3)
- C12Y203/01—Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
- C12Y203/01086—Fatty-acyl-CoA synthase (2.3.1.86)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y301/00—Hydrolases acting on ester bonds (3.1)
- C12Y301/02—Thioester hydrolases (3.1.2)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y301/00—Hydrolases acting on ester bonds (3.1)
- C12Y301/02—Thioester hydrolases (3.1.2)
- C12Y301/02014—Oleoyl-[acyl-carrier-protein] hydrolase (3.1.2.14), i.e. ACP-thioesterase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y301/00—Hydrolases acting on ester bonds (3.1)
- C12Y301/02—Thioester hydrolases (3.1.2)
- C12Y301/02015—Ubiquitin thiolesterase (3.1.2.15)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y603/00—Ligases forming carbon-nitrogen bonds (6.3)
- C12Y603/04—Other carbon-nitrogen ligases (6.3.4)
- C12Y603/04014—Biotin carboxylase (6.3.4.14)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y604/00—Ligases forming carbon-carbon bonds (6.4)
- C12Y604/01—Ligases forming carbon-carbon bonds (6.4.1)
- C12Y604/01002—Acetyl-CoA carboxylase (6.4.1.2)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Medicinal Chemistry (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Biophysics (AREA)
- Oil, Petroleum & Natural Gas (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Gastroenterology & Hepatology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
본 발명은 지방산 유도체를 포함하는 말로닐-CoA 유래 화합물의 생성을 위해 아세틸-CoA 카르복실라아제(ACC) 변이체들 및 이들을 발현시키는 숙주 세포들에 관한 것이다. 또한, 증가된 양의 말로닐-CoA 유래 화합물들 및 관련 세포 배양물들을 생성하는 방법들이 고려된다.
Description
관련 출원에 대한 상호-참조
본 출원은 2013년 9월 13일에 출원된 미국 가출원 61/877,418 및 2013년 10월 17일에 출원된 미국 가출원 61/892,242의 이익을 주장하며, 이의 전체 내용이 본 명세서에서 인용 참조된다.
서열 목록
본 출원은 EFS-Web을 통하여 ASCII 포맷으로 제출된 서열 목록을 포함하며, 본 명세서에서 전문이 인용 참조된다. 2014년 9월 12일에 작성된 상기의 ASCII의 복사본은 파일명을 LS00050PCT_SL.txt라고 하였고, 크기는 128,259 바이트이다.
분야
본 발명은 지방산 유도체를 포함하는 말로닐-CoA 유래 화합물의 생성을 위한 아세틸-CoA 카르복실라아제(ACC) 변이체들에 관한 것이다. 또한, ACC 변이체 및 관련 세포 배양물(cell culture)을 발현시키는 숙주 세포들이 고려된다. 나아가, ACC 변이체들을 발현시키는 숙주 세포들을 이용함으로써 말로닐-CoA 유래 화합물들을 생성하는 방법들이 포함된다.
석유는 액체, 기체 또는 고체 형태로 지구에서 발견되는 제한된 천연 자원이다. 하지만, 석유 제품은 재정적인 면과 환경적인 면에서 상당한 비용으로 개발된다. 그 자연적인 형태로, 지구에서 추출된 원유는 몇 가지 상업적인 용도를 갖는다. 이는, 가변적인 길이 및 복잡도의 탄화수소, 예를 들어 파라핀(또는 알칸), 올레핀(또는 알켄), 알킨, 나프텐(또는 시클로알칸), 지방족 화합물, 방향족 화합물 등의 혼합물이다. 또한, 원유는 다른 유기 화합물(예를 들어, 질소, 산소, 황 등을 함유한 유기 화합물) 및 불순물(예를 들어, 황, 염, 산, 금속 등)을 함유한다. 이의 높은 에너지 밀도와 용이한 수송성(transportability)으로 인해, 대부분의 석유는 수송 연료(예를 들어, 가솔린, 디젤, 항공유 등), 난방유, 액화 석유 가스 등과 같은 연료로 정제된다.
석유화학은 플라스틱, 수지, 섬유, 엘라스토머, 의약품, 윤활제, 또는 젤 등과 같은 특수 화학제품을 제조하는 데 사용될 수 있다. 특수 화학제품은 다수의 상업적인 용도를 갖는다. 석유화학 원료로부터 생성될 수 있는 특수 화학제품의 예시들은 지방산, 탄화수소[예를 들어, 긴 사슬형 탄화수소(long chain hydrocarbons), 분지쇄형 탄화수소(branched chain hydrocarbons), 포화 탄화수소, 불포화 탄화수소 등], 지방족 알코올, 지방족 에스테르, 지방족 알데히드, 케톤, 윤활제 등을 포함한다. 지방산은 계면활성제로서 상업적으로 이용된다. 계면활성제는, 예를 들어 세제 및 비누에서 발견될 수 있다. 또한, 지방산은 연료의 첨가제, 윤활유, 페인트, 래커(lacquers), 양초, 쇼트닝, 화장품, 및 유화제로서 사용될 수 있다. 또한, 지방산은 고무 제품에서 촉진 활성제(accelerator activator)로서 사용된다. 또한, 지방산은 메틸 에스테르, 아미드, 아민, 산 클로라이드(acid chlorides), 무수물, 케텐 다이머(ketene dimer), 및 퍼옥시산 및 에스테르를 생성하기 위한 공급원료(feedstock)로서 사용될 수 있다.
지방족 에스테르는 다수의 상업적인 용도를 갖는다. 예를 들어, 대체 연료인 바이오디젤은 에스테르[예를 들어, 지방산 메틸 에스테르(FAME), 지방산 에틸 에스테르(FAEE) 등]로 이루어져 있다. 몇몇 저 분자량의 에스테르는 방향제 또는 착향료로서 유용하게 하는 기분 좋은 냄새(pleasant odor)를 갖는 휘발성이다. 또한, 에스테르는 래커, 페인트 및 바니쉬에 대한 용매로서 사용된다. 또한, 왁스, 지방 및 오일과 같이 자연적으로 발생하는 몇몇 물질이 에스테르로 이루어진다. 또한, 에스테르는 수지 및 플라스틱의 연화제, 가소제, 난연제, 및 가솔린 및 오일의 첨가제로서 사용된다. 또한, 에스테르는 중합체, 필름, 직물, 염료, 및 의약품의 제조에도 사용될 수 있다.
유사하게, 지방족 알코올도 많은 상업적인 용도를 갖는다. 예를 들어, 지방족 알코올들 및 그들의 유도체의 세계 연간 판매량은 미화 10억 달러를 넘어선다. 짧은 사슬형 지방족 알코올들은 유화제, 연화제 및 증점제(thickener)로서 화장품 및 식품 산업에 사용된다. 이들의 양친매성(amphiphilic) 성질로 인해, 지방족 알코올들은 비이온성 계면활성제처럼 거동하고, 상기 비이온성 계면활성제는 예를 들어 세제와 같은 개인 위생 용품 및 가정 용품에 유용하다. 또한, 지방족 알코올들은 왁스, 검(gum), 수지, 의약용 로션, 윤활유 첨가제, 직물 정전기 방지제 및 가공제(finishing agents), 가소제, 화장품, 공업 용매 및 지방용 용매에 사용된다.
아세틸 CoA 카르복실라아제(ACC)는 지방산 합성 및 분해를 조절하는 데 중요한 역할을 한다. 이는, 지방산 생합성의 제 1 개입 단계(committed step)를 촉매화하는, 즉 아세틸-CoA를 말로닐-CoA로 비가역적으로 카르복실화하는 비오틴-의존적 효소 복합체(biotin-dependent enzyme complex)이다. ACC는 이의 2 개의 촉매 활성, 즉 비오틴 카르복실라아제(BC) 및 카르복실트랜스퍼라아제(CT)를 통해 말로닐-CoA를 생성한다. 대부분의 원핵생물에서, ACC는 다수의 조절 수준을 통해 동등한 발현(coordinate expression)이 조절되는 별개의 유전자들에 의해 코딩되는 4 개의 폴리펩티드(서브유닛)를 포함하는 다-서브유닛 효소이다(Cronan 외 (2002) Progress in Lipid Research 41:407-435; James 외 (2004) Journal of Biological Chemistry 279(4):2520-2527). ACC의 4 개의 폴리펩티드는 복합체를 고정된 비율로 조립한다(Broussard 외 (2013) Structure 21:650-657). 더 구체적으로, ACC 반응은 4 개의 단백질, 즉 비오틴 카르복실라아제(BC), 비오티노일(또는 비오틴) 카르복실 운반 단백질(BCCP) 및 카르복실트랜스퍼라아제(CT)를 형성하는 2 개의 단백질을 필요로 한다. 전체 ACC 반응은 산-불안정성(acid-labile) NaH14C03의 산-안정성 말론산으로의 ATP-의존적 전환에 의해 검사(assay)될 수 있다. 박테리아 및 식물 플라스미드(plant plastid)의 ACC 서브유닛들 간에 유사성 및 차이점이 존재한다. 하지만, 식물 단백질들의 복합성에도 불구하고, ACC 활성에 필수적인 서열들은 박테리아 동족체(bacterial homologue)와 크게 다르지 않다(Cronan 외, 위 참조).
대장균 ACC는 알려진 ACC 효소들에 덜 안정하다는 것이 보고되었다. 2 개의 부분 반응은 희석 단백질 용액에서 측정될 수 있다 하더라도, 4 개의 모든 서브유닛이 고농도로 존재할 때에만 전체 활성이 측정될 수 있다. 안정한 복합체들은 BC 복합체 및 CT α 2 β 2 복합체인 것으로 여겨진다. 전체 길이의 BCCP는 다이머로서 정제되었으며, 불안정한 BC2-BCCP2 복합체의 존재의 힌트이다. 다른 박테리아 ACC는 대장균보다 더 안정할 것이며, ACC 활성은 헬리코박터 파일로리(Helicobacter pylori) 및 슈도모나스 시트로넬로리스(Pseudomonas citronellolis)의 희석 추출물에서 측정될 수 있다. 또한, 식물 플라스미드 ACC도 대장균 ACC보다 더 안정할 것이다. 하지만, 대장균에서와 같이 온전한 효소(intact enzyme)의 추가 정제는 ACC 활성의 해리 및 손실을 유도(result in)하며, 이는 부분 반응 활성을 포함하는 프랙션(fraction)들을 혼합함으로써 회복될 수 있다. 서브복합체들은 BC-BCCP 및 CT이고, 온전한 BCCP가 없거나 CT 베타가 없는 것에 대한 증거는 없으며, BCCP 및 CT 베타가 용액에 없다면 분해된 것으로 추정한다(Cronan 외, 위 참조).
accA, accB, accC 및 accD를 포함하는 대장균 acc 유전자들의 식별은 ACC 단백질의 연구를 가능하게 하였다. ACC 서브유닛들 BCCP 및 CT 베타를 각각 코딩하는 유전자들 accB 및 accD에 포함되어 있는 지방산 합성의 돌연변이체들을 분리(isolate)시키기 위해, 방사선 자멸 선택(radiation suicide selection)이 사용되었다. accB 돌연변이체는 더 광범위하게 연구되었으며, 돌연변이 G133S는 온도 민감성 성장을 담당한다. 이 돌연변이는 비오티노일 도메인 내에서 입체 충돌(steric clash)을 유도한다. 이 결과적인 돌연변이 단백질은 더 고온에서 쉽게 변성되며, 따라서 세포내 프로테아제에 민감하다. 돌연변이 BCCP 균주는 30 ℃에서 성장될 때 BCCP의 정상 수준의 약 25 %만을 갖지만, 성장 속도 및 지방산 합성은 정상이다(Cronan 외, 위 참조). 하지만, ACC의 4 개의 모든 단백질의 농도를 증가시키는 것이 지방산 생합성을 통한 플럭스(flux)를 어느 정도 개선시킬 수 있음이 알려져 있다(Davis 외 (2000) Journal of Biological Chemistry 275(37):28593-28598). 반대로, 대장균 ACC는 ACP의 아실화 유도체들에 의해 억제될 수 있는 한편, 아실 모이어티가 부족한 ACP는 ACC를 억제할 수 없는 것으로 나타났다(Davies 외 (2001) Journal of Bacteriology 183(4): 1499-1503).
현재 석유로부터 유래되는 연료와 제품 둘 모두를 생성하기 위한 대안적인 루트에 대한 필요성이 존재한다. 이와 같이, 미생물 시스템은 다수의 타입의 바이오연료와 화학물질의 생물학적 생성에 대한 잠재력을 제공한다. 재생가능한 연료 및 화학물질은 [박테리아, 효모, 조류(algae)와 같이] 유전적으로 조작된 유기체(genetically engineered organism)들로부터 유래될 수 있다. 자연 발생적 생합성 경로는 조작된 유기체가 재생가능한 연료와 화학 제품을 합성할 수 있도록 유전적으로 변형될 수 있다. 또한, 연료 및 화학 제품의 생성을 위한 공급원료로서 다양한 탄소원을 이용하기 위해, 미생물이 맞춰지거나(tailored) 대사 조작될(metabolically engineered) 수 있다. 따라서, 재조합 숙주 세포에서 발현될 때, 말로닐-유래 화합물들(예를 들어, 지방족 에스테르, 지방족 알코올 및 다른 지방산 유도체, 그리고 비-지방산 화합물들)의 더 높은 수율을 생성하도록 ACC를 조작하는 것이 바람직할 것이다.
해당 분야의 발전에도 불구하고, 유전적 변형 효소, 재조합 숙주 세포, 그리고 재조합 숙주 세포의 발효를 통한 연료 및 화학물질의 강건하고(robust) 비용-효율적인 생성을 달성하기 위한 방법 및 시스템의 개선에 대한 요구가 남아 있다. 본 발명은 말로닐-유래 화합물들의 수율 및 역가를 증가시키는 ACC 변이체들을 제공함으로써 이러한 필요성을 해결한다.
요약
본 발명의 일 측면은 그 아미노산 서열에 적어도 하나의 돌연변이를 갖는 변이 비오틴 카르복실 운반 단백질(biotin carboxyl carrier protein: BCCP)을 제공한다. 특정한 일 측면에서, 본 발명은 그 아미노산 서열에 적어도 하나의 돌연변이를 포함하는 변이 비오틴 카르복실 운반 단백질(BCCP)을 제공하고, 변이 BCCP는 다음의 서열 식별 번호들 - SEQ ID NOS: 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88 및 90을 포함함 - 중 어느 하나 또는 하나 이상으로부터 폴리펩티드 서열을 갖는다. 일 구현예에서, 변이 BCCP는 대응하는 야생형 세포와 비교할 때 말로닐-CoA-유래 화합물의 증가된 생성을 세포에 부여(confer)한다. 또 다른 구현예에서, 변이 BCCP는 세포에서 발현될 때 개선된 아세틸-CoA 카르복실라아제(ACC) 활성을 부여할 수 있어, 대응하는 야생형 세포와 비교할 때 말로닐-CoA-유래 화합물의 증가된 생성을 유도한다. 말로닐-CoA-유래 화합물은 지방산 유도체, 예컨대 유리 지방산, 지방산 메틸 에스테르(FAME), 지방산 에틸 에스테르(FAEE), 지방족 알코올, 지방족 아민, 베타 하이드록시 지방산 유도체, 이작용성 지방산 유도체(예를 들어, ω-하이드록시 지방산, ω-하이드록시 디올, ω-하이드록시 FAME, ω-하이드록시 FAEE), 불포화 지방산 유도체, 그리고 비-지방산계 화합물, 예컨대 플라바논 및/또는 플라보노이드, 폴리케티드 및 3-하이드록시프로피온산을 포함한다(단, 이로 제한되지 않음).
본 발명의 또 다른 측면은 그 아미노산 서열에 적어도 하나의 돌연변이를 갖는 변이 비오틴 카르복실 운반 단백질(BCCP)을 제공하고, 돌연변이는 N-말단 아미노산 부위에 있다. 일 구현예에서, 돌연변이는 SEQ ID NO: 2의 아미노산 위치 2에 있다. 또 다른 구현예에서, 변이 BCCP는 대응하는 야생형 세포와 비교할 때 말로닐-CoA-유래 화합물의 증가된 생성을 세포에 부여한다. 또 다른 구현예에서, 변이 BCCP는 세포에서 발현될 때 개선된 아세틸-CoA 카르복실라아제(ACC) 활성을 부여할 수 있으며, 이는 대응하는 야생형 세포와 비교할 때 말로닐-CoA-유래 화합물의 증가된 생성을 유도한다.
본 발명의 또 다른 측면은 그 아미노산 서열에 적어도 하나의 돌연변이를 갖는 변이 비오틴 카르복실 운반 단백질(BCCP)을 제공하고, 변이 BCCP는 SEQ ID NOS: 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88 및/또는 90으로부터 선택된다. 일 구현예에서, 변이 BCCP는 대응하는 야생형 세포와 비교할 때 말로닐-CoA-유래 화합물의 증가된 생성을 세포에 부여한다. 또 다른 구현예에서, 변이 BCCP는 세포에서 발현될 때 개선된 아세틸-CoA 카르복실라아제(ACC) 활성을 부여할 수 있으며, 이는 대응하는 야생형 세포와 비교할 때 말로닐-CoA-유래 화합물의 증가된 생성을 유도한다.
본 발명의 또 다른 측면은 변이 accB 유전자 또는 accB 핵산 서열에 의해 코딩되는 변이 BCCP를 제공하고, 핵산 서열은 SEQ ID NOS: 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87 및/또는 89로부터 선택된다.
본 발명의 또 다른 측면은 변이 BCCP를 발현시키는 재조합 세포 또는 재조합 미생물을 제공하고, 변이 BCCP는 그 아미노산 서열에 적어도 하나의 돌연변이를 갖는다. 일 구현예에서, 세포는 숙주 세포이다. 또 다른 구현예에서, 세포는 미생물 세포 또는 미생물 숙주 세포이다. 또 다른 구현예에서, 미생물은 미생물 세포 또는 미생물 숙주 세포 또는 마이크로브(microbe)이다. 일 구현예에서, 돌연변이는 N-말단 아미노산 부위에 있다. 또 다른 구현예에서, 돌연변이는 SEQ ID NO: 2의 아미노산 위치 2에 있다. 또 다른 구현예에서, 돌연변이는 치환(substitution)이다. 다양한 구현예들에서, 치환은: 아스파르테이트(D)의 아스파라긴(N)으로의; 또는 아스파르테이트(D)의 히스티딘(H)으로의; 또는 아스파르테이트(D)의 이소류신(I)으로의; 또는 아스파르테이트(D)의 트레오닌(T)으로의; 또는 아스파르테이트(D)의 세린(S)으로의; 또는 아스파르테이트(D)의 티로신(Y)으로의; 또는 아스파르테이트(D)의 아르기닌(R)으로의; 또는 아스파르테이트(D)의 류신(L)으로의; 또는 아스파르테이트(D)의 글루타민(Q)으로의; 또는 아스파르테이트(D)의 글루타메이트(G)로의 치환이다. 또 다른 구현예에서, 변이 BCCP는 아스파르테이트(D)의 아스파라긴(N)으로의 치환을 포함하는 돌연변이를 갖는 폴리펩티드를 포함하는 SEQ ID NO: 6을 갖는다. 또 다른 구현예에서, 변이 BCCP는 아스파르테이트(D)의 히스티딘(H)으로의 치환을 포함하는 돌연변이를 갖는 폴리펩티드를 포함하는 SEQ ID NO: 4 또는 SEQ ID NO: 8을 갖는다. 또 다른 구현예에서, 변이 BCCP는 아스파르테이트(D)의 이소류신(I)으로의 치환을 포함하는 돌연변이를 갖는 폴리펩티드를 포함하는 SEQ ID NO: 10 또는 SEQ ID NO: 12를 갖는다. 일 구현예에서, 변이 BCCP는 그 아미노산 서열에 적어도 하나의 돌연변이를 갖고, 대응하는 야생형 세포와 비교할 때 말로닐-CoA-유래 화합물의 증가된 생성을 재조합 세포에 부여한다. 또 다른 구현예에서, 변이 BCCP는 그 아미노산 서열에 적어도 하나의 돌연변이를 갖고, 재조합 세포에 개선된 아세틸-CoA 카르복실라아제(ACC) 활성을 부여할 수 있으며, 이는 대응하는 야생형 세포와 비교할 때 말로닐-CoA-유래 화합물의 증가된 생성을 유도한다. 또 다른 구현예에서, 세포는 야생형 미생물 또는 야생형 숙주 세포와 대조되거나 비교될 수 있는 재조합 미생물 또는 재조합 숙주 세포이다. 또 다른 구현예에서, 세포는 본질적으로 미생물이다.
본 발명의 또 다른 측면은 말로닐-CoA-유래 화합물을 생성하는 방법을 제공하고, 상기 방법은 탄소원을 포함하는 발효 브로쓰(fermentation broth)에서 변이 BCCP를 발현시키는 세포를 배양하는 단계를 포함한다. 말로닐-CoA-유래 화합물은 지방산 유도체, 이를테면, 예컨대 지방산, 지방산 메틸 에스테르(FAME), 지방산 에틸 에스테르(FAEE), 지방족 알코올, 지방족 아민, 베타 하이드록시 지방산 유도체, 이작용성 지방산 유도체(예를 들어, ω-하이드록시 지방산, ω-하이드록시 디올, ω-하이드록시 FAME, ω-하이드록시 FAEE), 불포화 지방산 유도체, 그리고 비-지방산계 화합물, 예컨대 플라바논 및/또는 플라보노이드, 폴리케티드 및 3-하이드록시프로피온산을 포함한다. 일 구현예에서, 세포는 야생형 미생물 또는 야생형 숙주 세포와 각각 대조되거나 비교될 수 있는 재조합 미생물 또는 재조합 숙주 세포이다. 또 다른 구현예에서, 세포는 본질적으로 미생물이다.
또한, 본 발명은 BCCP의 발현을 조절하는 변이 오페론을 고려한다. 일 구현예에서, 오페론은 야생형 세포와 비교 시 재조합 세포에서 BCCP 발현의 변화를 유도한다. 일 구현예에서, 세포는 야생형 미생물 숙주 세포 또는 야생형 미생물과 비교 시 각각 재조합 미생물 숙주 세포 또는 재조합 미생물이다. 또 다른 구현예에서, 오페론은 재조합 세포에서 BCCP 발현의 증가를 유도함에 따라, 재조합 세포에서 아세틸-CoA 카르복실라아제(ACC) 활성을 개선하며, 대응하는 야생형 세포와 비교할 때 말로닐-CoA-유래 화합물의 증가된 생성을 유도한다. 일 측면에서, 변이 오페론은 프로모터를 더 포함한다. 프로모터는 이종 프로모터(heterologous promoter), 이종 프로모터 변이체 및 합성 프로모터를 포함한다(단, 이로 제한되지 않음). 일 구현예에서, 프로모터는 유전적으로 변형된(genetically modified) accBC 프로모터, 자연 발생적 대장균 프로모터 또는 대장균 프로모터 변이체를 포함한다. 또 다른 구현예에서, 프로모터는 accBC 프로모터 변이체이다. 또 다른 구현예에서, 프로모터는 T5 프로모터 또는 T5 프로모터 변이체이다. 일 구현예에서, 프로모터는 accBC T5 프로모터이다. 또 다른 구현예에서, accBC T5 프로모터는 SEQ ID NOS: 93, 94, 95 또는 96, 또는 이의 변이체로부터 선택된다.
또한, 본 발명은 BCCP의 발현을 조절하는 변이 오페론을 포함하는 재조합 미생물 또는 숙주 세포를 제공한다. 일 구현예에서, 오페론은 BCCP 발현의 변화를 유도한다. 일 구현예에서, 오페론은 재조합 세포에서 BCCP 발현의 증가를 유도함에 따라, 재조합 세포에서 아세틸-CoA 카르복실라아제(ACC) 활성을 개선하며, 대응하는 야생형 세포와 비교할 때 말로닐-CoA-유래 화합물의 증가된 생성을 유도한다. 또 다른 구현예에서, 변이 오페론은 프로모터를 더 포함한다.
본 발명의 또 다른 측면은 말로닐-CoA-유래 화합물을 생성하는 방법을 제공하고, 상기 방법은 탄소원을 포함하는 발효 브로쓰에서 변이 오페론을 발현시키는 미생물 또는 숙주 세포를 배양하는 단계를 포함한다. 일 구현예에서, 세포는 야생형 미생물 또는 야생형 숙주 세포와 각각 대조되거나 비교될 수 있는 재조합 미생물 또는 재조합 숙주 세포이다. 또 다른 구현예에서, 세포는 본질적으로 미생물이다. 말로닐-CoA-유래 화합물은 지방산, 지방산 메틸 에스테르(FAME), 지방산 에틸 에스테르(FAEE), 지방족 알코올, 지방족 아민, 베타 하이드록시 지방산 유도체, 이작용성 지방산 유도체(예를 들어, ω-하이드록시 지방산, ω-하이드록시 디올, ω-하이드록시 FAME, ω-하이드록시 FAEE), 불포화 지방산 유도체, 그리고 비-지방산계 화합물, 예컨대 플라바논 및/또는 플라보노이드, 폴리케티드 및 3-하이드록시프로피온산을 포함한다.
본 발명의 또 다른 측면은 말로닐-CoA-유래 화합물을 생성하는 방법을 제공하고, 상기 방법은 탄소원을 포함하는 발효 브로쓰에서 변이 BCCP 및 변이 오페론을 발현시키는 숙주 세포를 배양하는 단계를 포함한다. 일 구현예에서, 세포는 야생형 미생물 또는 야생형 숙주 세포와 각각 대조되거나 비교될 수 있는 재조합 미생물 또는 재조합 숙주 세포이다. 또 다른 구현예에서, 세포는 본질적으로 미생물이다. 말로닐-CoA-유래 화합물은 지방산, 지방산 메틸 에스테르(FAME), 지방산 에틸 에스테르(FAEE), 지방족 알코올, 지방족 아민, 베타 하이드록시 지방산 유도체, 이작용성 지방산 유도체(ω-하이드록시 지방산, ω-하이드록시 디올, ω-하이드록시 FAME, ω-하이드록시 FAEE를 포함함), 불포화 지방산 유도체, 그리고 비-지방산계 화합물, 예컨대 플라바논 및/또는 플라보노이드, 폴리케티드 및 3-하이드록시프로피온산을 포함한다.
또한, 본 발명은 그 아미노산 서열에 적어도 하나의 돌연변이를 갖는 변이 비오틴 카르복실 운반 단백질(BCCP)을 포함하는 미생물을 고려한다. 일 구현예에서, 변이 BCCP는 N-말단 아미노산 부위에 돌연변이를 갖는다. 또 다른 구현예에서, 돌연변이는 치환이다. 다양한 구현예들에서, 치환은: 아스파르테이트(D)의 아스파라긴(N)으로의; 또는 아스파르테이트(D)의 히스티딘(H)으로의; 또는 아스파르테이트(D)의 이소류신(I)으로의; 또는 아스파르테이트(D)의 트레오닌(T)으로의; 또는 아스파르테이트(D)의 세린(S)으로의; 또는 아스파르테이트(D)의 티로신(Y)으로의; 또는 아스파르테이트(D)의 아르기닌(R)으로의; 또는 아스파르테이트(D)의 류신(L)으로의; 또는 아스파르테이트(D)의 글루타민(Q)으로의; 또는 아스파르테이트(D)의 글루타메이트(G)로의 치환이다. 또 다른 구현예에서, 변이 BCCP는, 아스파르테이트(D)의 아스파라긴(N)으로의; 아스파르테이트(D)의 히스티딘(H)으로의; 아스파르테이트(D)의 이소류신(I)으로의; 아스파르테이트(D)의 트레오닌(T)으로의; 아스파르테이트(D)의 세린(S)으로의; 아스파르테이트(D)의 티로신(Y)으로의; 아스파르테이트(D)의 아르기닌(R)으로의; 아스파르테이트(D)의 류신(L)으로의; 아스파르테이트(D)의 글루타민(Q)으로의; 및/또는 아스파르테이트(D)의 글루타메이트(G)로의 치환들을 포함하는 하나 이상의 돌연변이(들)를 갖는다. 또 다른 구현예에서, 변이 BCCP는 아스파르테이트(D)의 아스파라긴(N)으로의 치환을 포함하는 돌연변이를 갖는 폴리펩티드를 포함하는 SEQ ID NO: 6을 갖는다. 또 다른 구현예에서, 변이 BCCP는 아스파르테이트(D)의 히스티딘(H)으로의 치환을 포함하는 돌연변이를 갖는 폴리펩티드를 포함하는 SEQ ID NO: 4 또는 SEQ ID NO: 8을 갖는다. 또 다른 구현예에서, 변이 BCCP는 아스파르테이트(D)의 이소류신(I)으로의 치환을 포함하는 돌연변이를 갖는 폴리펩티드를 포함하는 SEQ ID NO: 10 또는 SEQ ID NO: 12를 갖는다. 또 다른 구현예에서, 변이 BCCP의 발현은 미생물에 말로닐-CoA-유래 화합물의 증가된 생성을 부여한다. 또 다른 구현예에서, 변이 BCCP의 발현은 미생물에 개선된 아세틸-CoA-카르복실라아제(ACC) 활성을 부여할 수 있으며, 미생물에 의해 말로닐-CoA-유래 화합물의 증가된 생성을 유도한다. 말로닐-CoA-유래 화합물은 지방산, 지방산 메틸 에스테르(FAME), 지방산 에틸 에스테르(FAEE), 지방족 알코올, 지방족 아민, 베타 하이드록시 지방산 유도체, 이작용성 지방산 유도체, 불포화 지방산 유도체, 플라바논, 플라보노이드, 폴리케티드 및 3-하이드록시프로피온산을 포함한다(단, 이로 제한되지 않음). 일 구현예에서, 말로닐-CoA-유래 화합물은 FAME 또는 FAEE이다. 또 다른 구현예에서, 말로닐-CoA-유래 화합물은 지방족 알코올이다. 또 다른 구현예에서, 미생물은 미생물 세포이다. 또 다른 구현예에서, 미생물 세포는 재조합 세포이다. 미생물 세포들의 예시는 에 스체리치아(Escherichia) 속, 바실러스(Bacillus) 속, 시아노피타(Cyanophyta) 속, 락토바실러스(Lactobacillus) 속, 자이모모나스(Zymomonas) 속, 로도코쿠 스(Rhodococcus) 속, 슈도모나스(Pseudomonas) 속, 아스페르길루스(Aspergillus) 속, 트리코데르마(Trichoderma) 속, 뉴로스포라(Neurospora) 속, 푸사리 움(Fusarium) 속, 후미콜라(Humicola) 속, 리조무코르(Rhizomucor) 속, 클루이베로마이세스(Kluyveromyces) 속, 피치아(Pichia) 속, 무코르(Mucor) 속, 미셀리오프토라(Myceliophtora) 속, 페 니실리움(Penicillium) 속, 파네로카에 테(Phanerochaete) 속, 플레우로투 스(Pleurotus) 속, 트라메테스(Trametes) 속, 크리소스포리움(Chrysosporium) 속, 사카로마이세스(Saccharomyces) 속, 스테노트로파모나스(Stenotrophamonas) 속, 스 키조사카로마이세스(Schizosaccharomyces) 속, 야로위아(Yarrowia) 속, 또는 스트렙토마이세스(Streptomyces) 속으로부터의 세포들을 포함한다(단, 이로 제한되지 않음). 일 구현예에서, 미생물 세포는 에스체리치아 속으로부터의 세포이다. 일 구현예에서, 미생물 세포는 대장균으로부터의 세포이다. 또 다른 구현예에서, 미생물 세포는 시아노박테리아 또는 시아노피타 속으로부터의 세포이다. 또 다른 구현예에서, 미생물 세포는 프로클로로코쿠 스(Prochlorococcus), 시네코코쿠스(Synechococcus), 시네코시스티 스(Synechocystis), 시아노테세(Cyanothece) 및 노스톡 펑크티포르 메(Nostoc Punctiforme)를 포함하는(단, 이로 제한되지 않음) 시아노박테리아 또는 시아노피타로부터의 세포이다. 또 다른 구현예에서, 미생물 세포는 시네코코쿠스 엘롱가투스(Synechococcus elongatus) PCC7942, 시네코시스티스 종(Synechocystis sp.) PCC6803, 및 시네코코쿠스 종 PCC7001을 포함하는(단, 이로 제한되지 않음) 특이적 시아노박테리아 종으로부터의 세포이다.
본 발명의 또 다른 측면은 accB 또는 accC, 또는 이의 조합을 포함하는 핵산 서열의 변경된 발현(altered expression)을 갖는 재조합 미생물을 제공하며, 미생물에 의해 말로닐-CoA-유래 화합물의 변경된 생성을 유도한다. 일 구현예에서, 변경된 발현은 증가된 발현이다. 또 다른 구현예에서, 변경된 발현은 감소된 발현이다. 또 다른 구현예에서, 변경된 발현은 핵산 서열의 발현을 추진(drive)하는 하나 이상의 프로모터의 변화에 기인한다. accB의 핵산 서열은 BCCP를 코딩한다. 일 구현예에서, accB의 변이 핵산 서열은 변이 BCCP를 코딩한다. 일 구현예에서, 말로닐-CoA-유래 화합물은 지방산, 지방산 메틸 에스테르(FAME), 지방산 에틸 에스테르(FAEE), 지방족 알코올, 지방족 아민, 베타 하이드록시 지방산 유도체, 이작용성 지방산 유도체, 불포화 지방산 유도체, 플라바논, 플라보노이드, 폴리케티드 및 3-하이드록시프로피온산을 포함한다(단, 이로 제한되지 않음). 일 구현예에서, 미생물은 에스체리치아 속, 바실러스 속, 시아노피타 속, 락토바실러스 속, 자이모모나스 속, 로도코쿠스 속, 슈도모나스 속, 아스페르길루스 속, 트리코데르마 속, 뉴 로스포라 속, 푸사리움 속, 후미콜라 속, 리조무코르 속, 클루이베로마이세스 속, 피치아 속, 무코르 속, 미셀리오프토라 속, 페니실리움 속, 파네로카에테 속, 플레 우로투스 속, 트라메테스 속, 크리소스포리움 속, 사카로마이세스 속, 스테노트로 파모나스 속, 스키조사카로마이세스 속, 야로위아 속, 또는 스트렙토마이세스 속으로부터의 미생물을 포함한다(단, 이로 제한되지 않음). 일 구현예에서, 미생물 세포는 에스체리치아 속으로부터의 세포이다. 일 구현예에서, 미생물 세포는 대장균으로부터의 세포이다. 또 다른 구현예에서, 미생물 세포는 시아노박테리아 또는 시아 노피타 속으로부터의 세포이다. 또 다른 구현예에서, 미생물은 프로클로로코쿠스, 시네코코쿠스, 시네코시스티스, 시아노테세 또는 노스톡 펑크티포르메로부터의 시아노박테리아 또는 시아노피타이다. 일 구현예에서, 미생물은 시네코코쿠스 엘롱 가투스 PCC7942, 시네코시스티스 종 PCC6803 또는 시네코코쿠스 종 PCC7001로부터의 시아노박테리아 종이다.
본 발명의 또 다른 측면은, ACC 변이체의 변경된 발현을 갖고 지방산 생합성 단백질을 더 발현시키는 미생물 또는 숙주 세포를 제공한다. 일 구현예에서, 숙주 세포는 미생물 세포이다. 또 다른 구현예에서, 숙주 세포는 재조합 세포이다. 또 다른 구현예에서, 숙주 세포는 재조합 박테리아 세포이다. 또 다른 구현예에서, ACC 변이체는 비오틴 카르복실 운반 단백질(BCCP) 또는 비오틴 카르복실라아제(BC) 또는 이의 조합이다. 일 구현예에서, 변경된 발현은 증가된 또는 감소된 발현이다. 일 구현예에서, 변경된 발현은 증가된 발현이고, 증가된 발현은 미생물 세포가 탄소원으로 배양될 때 말로닐-CoA-유래 화합물의 증가된 생성을 유도한다.
본 발명의 특정 구현예들에서, 숙주 세포는 지방산 유도체의 생성을 증가시킬 수 있는 효소 활성을 갖는 생합성 단백질을 더 발현시킬 수 있다. 일 구현예에서, 효소 활성을 갖는 단백질은 숙주 세포에 자연적으로 존재할 수 있고, 그 유전자는 프로모터 또는 다른 유전적 변경을 통해 과발현될 수 있다. 또 다른 구현예에서, 효소 활성을 갖는 단백질은 숙주 세포에서 발현되는 외인성 또는 이종 유전자의 결과일 수 있다. 이러한 효소 활성의 예시는 티오에스테라아제 활성(E.C. 3.1.2.* 또는 E.C. 3.1.2.14 또는 E.C. 3.1.1.5), 에스테르 신타아제 활성(E.C. 2.3.1.75), 아실-ACP 리덕타아제(AAR) 활성(E.C. 1.2.1.80), 알코올 디하이드로게나아제 활성(E.C. 1.1.1.1), 지방족 알코올 아실-CoA 리덕타아제(FAR) 활성(E.C. 1.1.1.*), 카르복실산 리덕타아제(CAR) 활성(E.C. 1.2.99.6), 디카르보닐라아제 또는 디포밀라아제 활성, 아실-CoA 리덕타아제 활성(E.C. 1.2.1.50), 아실-CoA 신타아제(FadD) 활성(E.C. 2.3.1.86), OleA 활성 및 OleBCD 활성을 포함한다(단, 이로 제한되지 않음).
또 다른 측면에서, 본 발명은 ACC 변이체의 변경된 발현을 갖고 지방산 생합성 단백질을 더 발현시키는 미생물 또는 숙주 세포를 제공하고, 변경된 발현은 세포가 탄소원으로 배양될 때 말로닐-CoA-유래 화합물의 증가된 생성을 유도하는 증가된 발현이다. 일 구현예에서, 숙주 세포는 미생물 세포이다. 또 다른 구현예에서, 숙주 세포는 재조합 세포이다. 또 다른 구현예에서, 숙주 세포는 재조합 박테리아 세포이다. 또 다른 구현예에서, 미생물 또는 숙주 세포는 동일한 조건들 하에서 야생형 세포와 비교되거나 대조될 수 있는 재조합 세포이다. 본 명세서에서, 말로닐-CoA-유래 화합물은 지방산, 지방산 메틸 에스테르(FAME), 지방산 에틸 에스테르(FAEE), 지방족 알코올, 지방족 아민, 베타 하이드록시 지방산 유도체, 이작용성 지방산 유도체, 불포화 지방산 유도체, 플라바논, 플라보노이드, 폴리케티드 및 3-하이드록시프로피온산을 포함한다(단, 이로 제한되지 않음). 일 구현예에서, 미생물 세포는 에스체리치아 속, 바실러스 속, 시아노피타 속, 락토바실러스 속, 자이모모나스 속, 로도코쿠스 속, 슈도모나스 속, 아스페르길루스 속, 트리코데르마 속, 뉴로스포라 속, 푸사리움 속, 후미콜라 속, 리조무코르 속, 클루이베로마이세스 속, 피치아 속, 무코르 속, 미셀리오프토라 속, 페니실리움 속, 파네로카에테 속, 플레우로투스 속, 트라메테스 속, 크리소스포리움 속, 사카로마이세스 속, 스 테노트로파모나스 속, 스키조사카로마이세스 속, 야로위아 속, 또는 스트렙토마이세스 속의 세포들로부터 선택된다.
본 발명의 또 다른 측면은 SEQ ID NO: 6을 갖는 변이 비오틴 카르복실 운반 단백질(BCCP)을 제공한다. 일 구현예에서, 돌연변이는 아스파르테이트(D)의 아스파라긴(N)으로의 치환을 갖는 N-말단 아미노산 부위에 있고, 치환은 아미노산 위치 2에 있다. 또 다른 구현예에서, 변이 BCCP는 변이 accB 유전자에 의해 코딩되고, 변이 accB 유전자는 SEQ ID NO: 5의 핵산 서열을 갖는다. 본 발명의 또 다른 측면은 SEQ ID NO: 4 또는 SEQ ID NO: 8을 갖는 변이 비오틴 카르복실 운반 단백질(BCCP)을 제공한다. 일 구현예에서, 돌연변이는 아스파르테이트(D)의 히스티딘(H)으로의 치환을 갖는 N-말단 아미노산 부위에 있고, 치환은 아미노산 위치 2에 있다. 또 다른 구현예에서, 변이 BCCP는 변이 accB 유전자에 의해 코딩되고, 변이 accB 유전자는 각각 SEQ ID NO: 3 또는 SEQ ID NO: 7의 핵산 서열을 갖는다. 본 발명의 또 다른 측면은 SEQ ID NO: 10 또는 SEQ ID NO: 12를 갖는 변이 비오틴 카르복실 운반 단백질(BCCP)을 제공한다. 일 구현예에서, 돌연변이는 아스파르테이트(D)의 이소류신(I)으로의 치환을 갖는 N-말단 아미노산 부위에 있고, 치환은 아미노산 위치 2에 있다. 또 다른 구현예에서, 변이 BCCP는 변이 accB 유전자에 의해 코딩되고, 변이 accB 유전자는 각각 SEQ ID NO: 9 또는 SEQ ID NO: 11의 핵산 서열을 갖는다.
다양한 구현예들에서, 변이 BCCP는 대응하는 야생형 세포와 비교할 때 말로닐-CoA-유래 화합물의 증가된 생성을 재조합 세포에 부여하고, 상기 말로닐-CoA-유래 화합물은 지방산 유도체인 지방산, 지방산 메틸 에스테르(FAME), 지방산 에틸 에스테르(FAEE), 지방족 알코올, 지방족 아민, 베타 하이드록시 지방산 유도체, 이작용성 지방산 유도체 및 불포화 지방산 유도체; 또는 비-지방산계 화합물, 예컨대 플라바논, 플라보노이드, 폴리케티드 및 3-하이드록시프로피온산을 포함한다. 또한, 본 발명은 변이 BCCP를 포함하거나 발현시키는 재조합 미생물을 포함한다. 일 구현예에서, 미생물은 에스체리치아 속, 바실러스 속, 시아노피타 속, 락토바실러스 속, 자이모모나스 속, 로도코쿠스 속, 슈도모나스 속, 아스페르길루스 속, 트리코데르마 속, 뉴로스포라 속, 푸사리움 속, 후미콜라 속, 리조무코르 속, 클루이베로마이세스 속, 피치아 속, 무코르 속, 미셀리오프토라 속, 페니실리움 속, 파네로 카에테 속, 플레우로투스 속, 트라메테스 속, 크리소스포리움 속, 사카로마이세스 속, 스테노트로파모나스 속, 스키조사카로마이세스 속, 야로위아 속, 또는 스트렙토마이세스 속의 미생물로부터 선택된다.
또한, 말로닐-CoA-유래 화합물을 생성하는 방법이 고려되고, 상기 방법은 탄소원을 포함하는 발효 브로쓰에서 변이 BCCP를 발현시키는 재조합 미생물을 배양하는 단계를 포함한다. 이 방법에 의해 생성되는 말로닐-유래 화합물은 지방산, 지방산 메틸 에스테르(FAME), 지방산 에틸 에스테르(FAEE), 지방족 알코올, 지방족 아민, 베타 하이드록시 지방산 유도체, 이작용성 지방산 유도체 및 불포화 지방산 유도체를 포함하는 지방산 유도체; 또는 비-지방산계 화합물, 예컨대 플라바논, 플라보노이드, 폴리케티드 및 3-하이드록시프로피온산을 포함한다.
본 발명은 바람직한 구현예들을 예시하는 역할을 하는 첨부한 도면들과 연계하여 읽을 때 가장 잘 이해될 것이다. 하지만, 본 발명은 도면들에 개시된 특정 구현예들로 제한되지 않음을 이해할 것이다.
도 1은 변이 비오틴 카르복실 운반 단백질(BCCP)과 같은 아세틸-CoA 카르복실라아제(ACC) 변이체들을 수반하는 조작된 생화학 경로의 일 구현예의 개략도이다. 나타낸 바와 같이, BCCP는 세포에서 발현될 때 개선된 아세틸-CoA 카르복실라아제(ACC) 활성을 부여할 수 있다. 이는 말로닐-CoA 및 아실-ACP의 증가된 생성을 유도할 수 있으며, 이에 따라 이는, 예를 들어 지방산 유도체, 예컨대 지방족 에스테르, 지방족 알데히드, 지방족 알코올, 지방산 및 다른 지방산 유도체를 포함하는 말로닐-CoA-유래 화합물의 증가된 생성을 유도할 수 있다.
도 2는 7 개의 상이한 종으로부터 BCCP의 7 개의 아미노산 서열의 정렬을 나타낸다. 박스로 나타낸 영역은 대부분의 BCCP 종에 걸쳐 보존된 모티프(motif)를 나타낸다.
도 3은 변이 비오틴 카르복실 운반 단백질(BCCP)과 같은 아세틸-CoA 카르복실라아제(ACC) 변이체들을 수반하는 조작된 생화학 경로의 또 다른 구현예의 개략도이다. 나타낸 바와 같이, BCCP는 세포에서 발현될 때 개선된 아세틸-CoA 카르복실라아제(ACC) 활성을 부여할 수 있다. 이는 말로닐-CoA 및 아실-CoA의 증가된 생성을 유도할 수 있으며, 이에 따라 이는, 예를 들어 지방산 유도체, 예컨대 지방족 에스테르, 지방족 알데히드, 지방족 알코올, 지방산 및 다른 지방산 유도체를 포함하는 말로닐-CoA-유래 화합물의 증가된 생성을 유도할 수 있다.
도 4는 변이 비오틴 카르복실 운반 단백질(BCCP)과 같은 아세틸-CoA 카르복실라아제(ACC) 변이체들을 수반하는 조작된 생화학 경로의 몇몇 구현들의 요약이다. 나타낸 바와 같이, BCCP는 세포에서 발현될 때 개선된 아세틸-CoA 카르복실라아제(ACC) 활성을 부여할 수 있다. 이는, 폴리케티드, 3-하이드록시프로피온산(3-HP), 플라바논 및 플라보노이드, 그리고 증가된 중간체들, 이를테면, 예컨대 증가된 아실-CoA(또한, 도 3 참조); 증가된 아실-ACP(또한, 도 1 참조); 그리고 증가된 말로네이트(또는 말론산)를 포함하는 말로닐-CoA 및 말로닐-CoA 유래 화합물의 증가된 생성을 유도할 수 있다. 또한, 증가된 중간체들은 지방산, 지방족 에스테르, 지방족 알데히드, 지방족 알코올 및 다른 지방산 유도체를 포함하는 지방산 유도체와 같은 증가된 최종-생성물을 유도할 수 있다.
도 5는 대장균 숙주 세포에서 (accB 유전자의 위치 2에) 다양한 BCCP 변이체들을 발현시키는 결과로서 FAS 역가(FAME)를 도시한 그래프를 나타낸다. WT는 야생형 ACC 복합체에 대한 대조군이다. 이 BCCP 변이체들의 일부는 5-배(fold)가 넘게 FAS 역가를 개선하였다(또한, 표 1 참조).
도 1은 변이 비오틴 카르복실 운반 단백질(BCCP)과 같은 아세틸-CoA 카르복실라아제(ACC) 변이체들을 수반하는 조작된 생화학 경로의 일 구현예의 개략도이다. 나타낸 바와 같이, BCCP는 세포에서 발현될 때 개선된 아세틸-CoA 카르복실라아제(ACC) 활성을 부여할 수 있다. 이는 말로닐-CoA 및 아실-ACP의 증가된 생성을 유도할 수 있으며, 이에 따라 이는, 예를 들어 지방산 유도체, 예컨대 지방족 에스테르, 지방족 알데히드, 지방족 알코올, 지방산 및 다른 지방산 유도체를 포함하는 말로닐-CoA-유래 화합물의 증가된 생성을 유도할 수 있다.
도 2는 7 개의 상이한 종으로부터 BCCP의 7 개의 아미노산 서열의 정렬을 나타낸다. 박스로 나타낸 영역은 대부분의 BCCP 종에 걸쳐 보존된 모티프(motif)를 나타낸다.
도 3은 변이 비오틴 카르복실 운반 단백질(BCCP)과 같은 아세틸-CoA 카르복실라아제(ACC) 변이체들을 수반하는 조작된 생화학 경로의 또 다른 구현예의 개략도이다. 나타낸 바와 같이, BCCP는 세포에서 발현될 때 개선된 아세틸-CoA 카르복실라아제(ACC) 활성을 부여할 수 있다. 이는 말로닐-CoA 및 아실-CoA의 증가된 생성을 유도할 수 있으며, 이에 따라 이는, 예를 들어 지방산 유도체, 예컨대 지방족 에스테르, 지방족 알데히드, 지방족 알코올, 지방산 및 다른 지방산 유도체를 포함하는 말로닐-CoA-유래 화합물의 증가된 생성을 유도할 수 있다.
도 4는 변이 비오틴 카르복실 운반 단백질(BCCP)과 같은 아세틸-CoA 카르복실라아제(ACC) 변이체들을 수반하는 조작된 생화학 경로의 몇몇 구현들의 요약이다. 나타낸 바와 같이, BCCP는 세포에서 발현될 때 개선된 아세틸-CoA 카르복실라아제(ACC) 활성을 부여할 수 있다. 이는, 폴리케티드, 3-하이드록시프로피온산(3-HP), 플라바논 및 플라보노이드, 그리고 증가된 중간체들, 이를테면, 예컨대 증가된 아실-CoA(또한, 도 3 참조); 증가된 아실-ACP(또한, 도 1 참조); 그리고 증가된 말로네이트(또는 말론산)를 포함하는 말로닐-CoA 및 말로닐-CoA 유래 화합물의 증가된 생성을 유도할 수 있다. 또한, 증가된 중간체들은 지방산, 지방족 에스테르, 지방족 알데히드, 지방족 알코올 및 다른 지방산 유도체를 포함하는 지방산 유도체와 같은 증가된 최종-생성물을 유도할 수 있다.
도 5는 대장균 숙주 세포에서 (accB 유전자의 위치 2에) 다양한 BCCP 변이체들을 발현시키는 결과로서 FAS 역가(FAME)를 도시한 그래프를 나타낸다. WT는 야생형 ACC 복합체에 대한 대조군이다. 이 BCCP 변이체들의 일부는 5-배(fold)가 넘게 FAS 역가를 개선하였다(또한, 표 1 참조).
개관(General Overview)
본 발명은 미생물에서 발현될 수 있는 변이 아세틸-CoA 카르복실라아제(ACC) 폴리펩티드(들) 또는 ACC 변이체(들)에 관한 것이다. 이 ACC 변이체는 유전적으로 변경되고, 지방산 유도체를 포함하는 말로닐-CoA 유래 화합물의 증가된 생성을 위해 개선된 효소 활성을 부여할 것으로 여겨진다. 본 명세서에서, 본 발명은, 야생형 세포에서 대응하는 ACC 활성과 비교할 때, 숙주 세포에서 발현될 때 개선된 아세틸-CoA 카르복실라아제(ACC) 활성을 유도할 수 있는 폴리펩티드(들) 및 단백질(들)에 관한 것이다. 이를 예시하기 위해, ACC 유전자는 하나의 ACC 유전자 그리고 하나의 ACC 오페론에 돌연변이를 도입함으로써 변경되었다. 이 두 변경은 숙주 세포에서 지방산 유도체 생성을 독립적으로 증가시킬 수 있다. 이 돌연변이는 지방산-유래 화합물(즉, 지방산 유도체), 이를테면, 예컨대 지방산, 지방족 에스테르, 지방족 알코올, 지방족 알데히드, 지방족 아민, 이작용성 지방산 유도체, 및 비-지방산계 화합물, 이를테면, 예컨대 플라바논 및 플라보노이드, 폴리케티드 및 3-하이드록시프로피온산을 포함하는(단, 이로 제한되지 않음) 말로닐-CoA로부터 유래된 생성물의 역가 및 수율을 개선할 것으로 예상된다. 지방족 에스테르의 예시는 지방산 메틸 에스테르(FAME) 및 지방산 에틸 에스테르(FAEE)이다. 이작용성 지방산 유도체의 예시는 ω-하이드록시 지방산, ω-하이드록시 디올, ω-하이드록시 FAME 및 ω-하이드록시 FAEE를 포함한다(단, 이로 제한되지 않음).
말로닐-CoA 유래 화합물의 더 높은 수율을 생성하기 위해, 완전한 ACC 복합체를 코딩하는 4 개의 모든 ACC 유전자의 증가된 발현이 요구된다는 것이 명시되었다(Davis 외 (2000) 위 참조). 하지만, 본 발명은 오직 하나의 ACC 유전자에서 표적 돌연변이(targeted mutation)가 지방산 유도체를 포함하는 말로닐-CoA로부터 유래된 화합물의 생성을 개선할 수 있다는 놀라운 조사결과를 보여준다. 예를 들어, accB 유전자의 표적 돌연변이 및/또는 accBC 오페론의 표적 발현 변화는 지방족 에스테르 생성을 최대 630 %로 크게 개선하였다.(아래의 도 5, 그리고 표 1 및 실시예들 참조). 이론에 의해 한정되지 않고, 변이 ACC 폴리펩티드 또는 ACC 변이체는 숙주 세포에서 말로닐-CoA 유래 화합물의 더 높은 생성을 유도하는 개선된 효소 활성을 ACC 복합체 상에 직접적으로 또는 간접적으로 부여할 것으로 여겨진다. 숙주 세포의 특이적 활성이 증가할 것으로 여겨짐에 따라, 말로닐-CoA 유래 화합물의 증가된 생성을 유도한다. 이러한 말로닐-CoA 유래 화합물은 지방산 유도체 및 비-지방산계 화합물을 포함한다.
정의
본 명세서 및 첨부된 청구항에서 사용되는 바와 같이, 단수 형태 "a", "an" 및 "the"는 본문에 명확히 달리 명시되지 않는다면 복수의 지시대상(referent)을 포함한다. 따라서, 예를 들어 "숙주 세포"에 대한 언급은 이러한 2 이상의 숙주 세포를 포함하고, "지방족 에스테르"에 대한 언급은 하나 이상의 지방족 에스테르 또는 에스테르의 혼합물을 포함하며, "핵산 서열"에 대한 언급은 하나 이상의 핵산 서열을 포함하고, "효소"에 대한 언급은 하나 이상의 효소를 포함한다.
본 명세서 전반에 걸쳐 서열 수탁 번호는 (여기에서 "NCBI 수탁 번호" 또는 대안적으로 "GenBank 수탁 번호" 또는 대안적으로 단순히 "수탁 번호"로 식별되는) 미국 국립보건원에 의해 유지되는 NCBI(미국 국립 생물공학 정보센터)에 의해 제공되는 데이터베이스로부터 그리고 (여기에서 "UniProtKB 수탁 번호"로 식별되는) 스위스 생물정보학 연구소에 의해 제공되는 UniProt 지식베이스(UniProtKB) 및 Swiss-Prot 데이터베이스로부터 얻어졌다.
효소 분류(enzyme classification: EC) 번호는 생화학 및 분자생물학 국제 연합(International Union of Biochemistry and Molecular Biology: IUBMB)의 명명 위원회(Nomenclature Committee)에 의해 제정되며, 이의 설명은 월드 와이드 웹의 IUBMB 효소 명명 웹사이트에서 이용가능하다. EC 번호는 효소들이 촉매화하는 반응에 따라 효소들을 분류한다. 예를 들어, 아세틸-CoA 카르복실라아제(ACC) 효소 활성은 E.C. 6.4.1.2로 분류된다. ACC는 대부분의 원핵생물에 그리고 대부분의 식물 및 조류의 엽록체에 존재하는 다-서브유닛 효소 복합체이다. ACC는 ATP 및 아세틸-CoA 및 HCO3 -의 ADP 및 포스페이트 및 말로닐-CoA로의 반응을 촉매화한다. ACC의 기능은 하나의 종으로부터 다음 종으로 대부분의 원핵생물에 보존된다. 따라서, 상이한 미생물 종이 E.C. 6.4.1.2로 분류된 동일한 아세틸-CoA 카르복실라아제(ACC) 효소 활성을 수행할 수 있다.
본 명세서에서 사용되는 바와 같이, "뉴클레오티드"라는 용어는 헤테로사이클릭 염기, 당 및 하나 이상의 인산기로 이루어진 폴리뉴클레오티드의 단위체 단위를 지칭한다. 자연적으로 발생하는 염기들[구아닌(G), 아데닌(A), 사이토신(C), 티민(T) 및 우라실(U)]은 통상적으로 퓨린 또는 피리미딘의 유도체들이지만, 자연적으로 및 비-자연적으로 발생하는 염기 유사체(base analog)들도 포함되는 것으로 이해하여야 한다. 자연적으로 발생하는 당은 펜토오스(5-탄당)의 (DNA를 형성하는) 디옥시리보오스 또는 (RNA를 형성하는) 리보오스이지만, 자연적으로 및 비-자연적으로 발생하는 당 유사체들도 포함되는 것으로 이해하여야 한다. 핵산은 통상적으로 핵산 또는 폴리뉴클레오티드를 형성하는 인산 결합을 통해 연결되지만, 많은 다른 연결들(예를 들어, 포스포로티오에이트, 보라노포스페이트 등)이 해당 기술분야에 알려져 있다.
"폴리뉴클레오티드"라는 용어는 리보뉴클레오티드(RNA) 또는 디옥시리보뉴클레오티드(DNA)의 중합체를 지칭하고, 이는 단일 가닥 또는 이중 가닥일 수 있으며, 비-자연적 또는 변경된 뉴클레오티드들을 함유할 수 있다. "폴리뉴클레오티드", "핵산 서열" 및 "뉴클레오티드 서열"이라는 용어는 여하한의 길이의 뉴클레오티드의 중합체 형태, RNA 또는 DNA 중 하나를 지칭하는 데 교환가능하게 사용된다. 이러한 용어는 분자의 일차 구조를 지칭하고, 따라서 이중 및 단일 가닥의 DNA, 및 이중 및 단일 가닥의 RNA를 포함한다. 이 용어는 메틸화된 및/또는 캡핑된(capped) 폴리뉴클레오티드(단, 이로 제한되지 않음)와 같은 변형된 폴리뉴클레오티드 및 뉴클레오티드 유사체로부터 만들어지는 RNA 또는 DNA 중 어느 하나의 유사체를 등가물로서 포함한다. 폴리뉴클레오티드는 플라스미드, 바이러스성, 염색체의, EST, cDNA, mRNA 및 rRNA를 포함하는(단, 이로 제한되지 않음) 여하한 형태로 존재할 수 있다.
본 명세서에서 사용되는 바와 같이, "폴리펩티드" 및 "단백질"이라는 용어는 아미노산 잔기의 중합체를 지칭하는 데 교환가능하게 사용된다. "재조합 폴리펩티드"라는 용어는 재조합 기술들에 의해 생성된 폴리펩티드를 지칭하며, 일반적으로 발현된 단백질을 코딩하는 DNA 또는 RNA는 숙주 세포를 형질전환하여 폴리펩티드를 생성하는 데 사용되는 적합한 발현 벡터(expression vector) 내로 삽입된다. 또한, 발현된 단백질을 코딩하는 DNA 또는 RNA는 상동 재조합(homologous recombination) 또는 해당 기술분야에 잘 알려진 다른 수단을 통해 숙주 염색체 내로 삽입될 수 있으며, 따라서 숙주 세포를 형질전환하여 폴리펩티드를 생성하는 데 사용된다. 유사하게, "재조합 폴리뉴클레오티드" 또는 "재조합 핵산" 또는 "재조합 DNA"라는 용어는 해당 기술분야의 당업자에게 알려져 있는 재조합 기술들에 의해 생성된다.
본 명세서에서 사용되는 바와 같이, "동족체(homolog)" 및 "상동(homologous)"이라는 용어는 대응하는 폴리뉴클레오티드 또는 폴리펩티드 서열과 적어도 약 50 퍼센트(%) 동일한 서열을 포함하는 폴리뉴클레오티드 또는 폴리펩티드 서열을 지칭한다. 바람직하게, 상동 폴리뉴클레오티드 또는 폴리펩티드는 대응하는 아미노산 서열 또는 폴리뉴클레오티드 서열과 적어도 약 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % 또는 적어도 약 99 % 상동성(homology)을 갖는 폴리뉴클레오티드 서열 또는 아미노산 서열을 갖는다. 본 명세서에서 사용되는 바와 같이, 서열 "상동성" 및 서열 "동일성"이라는 용어는 교환가능하게 사용된다.
해당 기술분야의 당업자라면, 2 이상의 서열 간의 상동성을 결정하는 방법들을 잘 알고 있을 것이다. 간명하게, 두 서열 간의 "상동성"의 계산은 다음과 같이 수행될 수 있다. 서열은 최적의 비교를 위해 정렬된다[예를 들어, 최적의 정렬을 위해 제 1 및 제 2 아미노산 또는 핵산 서열 중 하나 또는 둘 모두에 갭(gap)이 도입될 수 있으며, 비교를 위해 비-상동 서열은 무시될 수 있다]. 바람직한 일 구현예에서, 비교를 위해 정렬되는 제 1 서열의 길이는 제 2 서열의 길이의 적어도 약 30 %, 바람직하게는 적어도 약 40 %, 더 바람직하게는 적어도 약 50 %, 훨씬 더 바람직하게는 적어도 약 60 %, 그리고 훨씬 더 바람직하게는 적어도 약 70 %, 적어도 약 80 %, 적어도 약 85 %, 적어도 약 90 %, 적어도 약 95 %, 적어도 약 98 % 또는 약 100 %이다. 이후, 제 1 및 제 2 서열들의 대응하는 아미노산 위치 또는 뉴클레오티드 위치에서의 아미노산 잔기 또는 뉴클레오티드가 비교된다. 제 1 서열의 위치가 제 2 서열의 대응하는 위치와 동일한 아미노산 잔기 또는 뉴클레오티드에 의해 점유될 때, 분자들은 그 위치에서 동일하다. 두 서열 간의 퍼센트 상동성은 두 서열의 최적의 정렬을 위해 도입될 필요가 있는, 갭의 개수 및 각 갭의 길이를 고려한, 서열들에 의해 공유되는 동일한 위치들의 개수의 함수이다. 두 서열 간의 퍼센트 상동성의 결정 및 서열의 비교는 BLAST와 같은 수학적 알고리즘을 이용하여 달성될 수 있다(Altschul 외 (1990) J. Mol . Biol. 215(3):403-410). 또한, 두 아미노산 서열 간의 퍼센트 상동성은 Blossum 62 매트릭스 또는 PAM250 매트릭스 중 어느 하나, 그리고 16, 14, 12, 10, 8, 6 또는 4의 갭 중량(gap weight) 및 1, 2, 3, 4, 5 또는 6의 길이 중량(length weight)을 이용하는, GCG 소프트웨어 패키지의 GAP 프로그램에 통합된 Needleman 및 Wunsch 알고리즘을 사용하여 결정될 수 있다(Needleman 및 Wunsch (1970) J. Mol . Biol . 48:444-453). 또한, 두 뉴클레오티드 서열 간의 퍼센트 상동성은 NWSgapdna.CMP 매트릭스 그리고 40, 50, 60, 70 또는 80의 갭 중량 및 1, 2, 3, 4, 5 또는 6의 길이 중량을 이용하는, GCG 소프트웨어 패키지의 GAP 프로그램을 이용하여 결정될 수 있다. 해당 기술분야의 당업자는 초기 상동성 계산을 수행할 수 있으며, 이에 따라 알고리즘 파라미터들을 조정할 수 있다. 바람직한 파라미터들의 세트(및, 당업자가, 분자가 청구항들의 상동성 제한 내에 있는지 여부를 결정하기 위해 어떤 파라미터들이 적용되어야 하는지에 대한 확신이 없는 경우에 사용되어야 하는 파라미터들의 세트)는 12의 갭 페널티(gap penalty), 4의 갭 확장 페널티 및 5의 프레임시프트 갭 페널티(frameshift gap penalty)를 갖는 Blossum 62 스코어링 매트릭스(scoring matrix)이다. 서열 정렬의 추가 방법들이 생물공학 분야에 알려져 있다(예를 들어, Rosenberg (2005) BMC Bioinformatics 6:278; Altschul 외 (2005) FEBS J. 272(20):5101-5109 참조).
"낮은 엄격성(stringency), 중간 엄격성, 높은 엄격성 또는 매우 높은 엄격성 조건들 하에서 혼성화한다(hybridizes)"라는 용어는 혼성화 및 세정에 대한 조건들을 설명한다. 혼성화 반응을 수행하기 위한 안내는 Current Protocols in Molecular Biology, John Wiley & Sons, N.Y. (1989), 6.3.1-6.3.6에서 찾을 수 있다. 수성 및 비-수성 방법들이 상기 참고문헌에 설명되며, 어느 하나가 사용될 수 있다. 여기에 언급된 특이적 혼성화 조건들은 다음과 같다: (1) 낮은 엄격성 혼성화 조건 -- 약 45 ℃에서 6X 소듐 클로라이드/소듐 시트레이트(SSC), 이후에 적어도 50 ℃에서 0.2X SSC, 0.1 % SDS로 두 번 세정(세정의 온도는 낮은 엄격성 조건에 대해 55 ℃로 증가될 수 있음); (2) 중간 엄격성 혼성화 조건 -- 약 45 ℃에서 6X SSC, 이후에 60 ℃에서 0.2X SSC, 0.1 % SDS로 한번 이상 세정; (3) 높은 엄격성 혼성화 조건 -- 약 45 ℃에서 6X SSC, 이후에 65 ℃에서 0.2X SSC, 0.1 % SDS로 한번 이상 세정; 및 (4) 매우 높은 엄격성 혼성화 조건 -- 65 ℃에서 0.5 M 소듐 포스페이트, 7 % SDS, 이후에 65 ℃에서 0.2X SSC, 1 % SDS로 한번 이상 세정. 달리 명시하지 않는다면, 매우 높은 엄격성 조건 (4)가 바람직한 조건이다.
"내인성" 폴리펩티드는 모 세포(parental cell)(또는 숙주 세포)의 게놈에 의해 코딩되는 폴리펩티드를 지칭한다. "외인성" 폴리펩티드는 모 세포의 게놈에 의해 코딩되지 않은 폴리펩티드를 지칭한다. 변이 또는 돌연변이 폴리펩티드는 외인성 폴리펩티드의 일 예시이다. 따라서, 비-자연적으로-발생하는 핵산 분자가, 세포 내로 도입되면, 그 세포에 대해 외인성인 것으로 고려된다. 또한, 자연적으로-발생하는 핵산 분자는 특정 세포에 대해 외인성일 수 있다. 예를 들어, 세포 X로부터 분리된(isolated) 전체 코딩 서열은, 그 코딩 서열이 세포 Y 내로 도입되면, X 및 Y가 동일한 세포 타입이더라도, 세포 Y에 대해 외인성 핵산이다.
"과발현된"이라는 용어는, 유전자가 그 유전자에 대한 내인성 전사율(transcription rate)에 비해 상승된 비율로 전사되도록 유도됨을 의미한다. 몇몇 예시들에서, 과발현은 추가적으로 유전자에 대한 내인성 번역률(translation rate)에 비해 유전자의 상승된 번역률을 포함한다. 과발현에 대한 테스트 방법들은 해당 기술분야에 잘 알려져 있으며, 예를 들어 전사된 RNA 수준이 rtPCR을 이용하여 평가되고, 단백질 수준이 SDS 페이지 겔 분석(page gel analysis)을 이용하여 평가될 수 있다.
"이종"이라는 용어는 상이한 유기체, 상이한 세포 유형 또는 상이한 종으로부터 유래됨을 의미한다. 본 명세서에서 사용되는 바와 같이, 이는 주어진 유기체에 자연적으로 존재하지 않는 뉴클레오티드-, 폴리뉴클레오티드-, 폴리펩티드-, 또는 단백질 서열을 지칭한다. 예를 들어, 시아노박테리아에 원래 있는(native) 폴리뉴클레오티드 서열이 재조합 방법들에 의해 대장균의 숙주 세포 내로 도입될 수 있으며, 이후 시아노박테리아로부터의 폴리뉴클레오티드는 대장균 세포(예를 들어, 재조합 세포)에 대해 이종이다. 또한, "이종"이라는 용어는 비-원래 상태에서 재조합 숙주 세포에 존재하는 뉴클레오티드-, 폴리뉴클레오티드-, 폴리펩티드-, 또는 단백질 서열에 대한 언급에 사용될 수 있다. 예를 들어, "이종" 뉴클레오티드, 폴리뉴클레오티드, 폴리펩티드 또는 단백질 서열은 대응하는 야생형 숙주 세포에 자연적으로 존재하는 야생형 서열에 대해 변형될 수 있으며, 이는 예를 들어 발현의 수준, 또는 뉴클레오티드, 폴리뉴클레오티드, 폴리펩티드 또는 단백질의 서열의 변형이다.
본 명세서에서 사용되는 바와 같이, 폴리펩티드의 "단편(fragment)"이라는 용어는 2 개의 아미노산 잔기에서부터 1 개의 아미노산 잔기를 뺀 전체 아미노산 서열에 이르는 크기 범위를 갖는 전체-길이 폴리펩티드 또는 단백질의 더 짧은 부분을 지칭한다. 본 발명의 특정 구현예들에서, 단편은 폴리펩티드 또는 단백질의 도메인(예를 들어, 기질 결합 도메인 또는 촉매 도메인)의 전체 아미노산 서열을 지칭한다.
"돌연변이유발(mutagenesis)"이라는 용어는 유기체의 유전 정보가 안정한 방식으로 변화되는 과정을 지칭한다. 단백질 코딩 핵산 서열의 돌연변이유발은 돌연변이 단백질을 생성한다. 또한, 돌연변이유발은 변형된 단백질 활성을 유도하는 비-코딩 핵산 서열의 변화를 지칭한다.
본 명세서에서 사용되는 바와 같은 "돌연변이"는 유전자의 핵산 위치 또는 폴리펩티드 또는 단백질의 아미노산 위치의 영구적인 변화를 지칭한다. 돌연변이는 치환, 추가, 삽입 및 결실을 포함한다. 예를 들어, 아미노산 위치의 돌연변이는 일 유형의 아미노산의 다른 유형의 아미노산으로의 치환일 수 있다[예를 들어, 아스파르테이트(D)가 티로신(Y)으로 치환될 수 있고, 리신(L)이 트레오닌(T)으로 치환될 수 있다]. 이와 같이, 폴리펩티드 또는 단백질은 하나 이상의 돌연변이를 가질 수 있으며, 일 아미노산이 다른 아미노산으로 치환된다. 예를 들어, ACC 관련 폴리펩티드 또는 단백질은 그 아미노산 서열에서 하나 이상의 돌연변이를 가질 수 있다.
본 명세서에서 사용되는 바와 같이, "유전자"라는 용어는 RNA 생성물 또는 단백질 생성물 중 어느 하나를 코딩하는 핵산 서열뿐만 아니라, RNA 또는 단백질의 발현에 영향을 주는 작동가능하게-연결된(operably-linked) 핵산 서열[예를 들어, 이러한 서열은 프로모터 또는 인핸서(enhancer) 서열을 포함함(단, 이로 제한되지 않음)] 또는 RNA 또는 단백질의 발현에 영향을 주는 서열을 코딩하는 작동가능하게-연결된 핵산 서열[예를 들어, 이러한 서열은 리보솜 결합 부위 또는 번역 조절 서열(translational control sequence)을 포함함(단, 이로 제한되지 않음)]을 지칭한다.
발현 조절 서열은 해당 기술분야에 알려져 있으며, 예를 들어 숙주 세포에서 폴리뉴클레오티드 서열의 발현을 위하여 제공되는 프로모터, 인핸서, 아데닐산중합반응 신호(polyadenylation signal), 전사 종결자(transcription terminator), 내부 리보솜 유입점(internal ribosome entry sites: IRES) 등을 포함한다. 발현 조절 서열은 전사에 관련된 세포성 단백질과 특이적으로 상호작용한다(Maniatis 외 Science 236:1237-1245(1987)). 예시적인 발현 조절 서열은, 예를 들어 Goeddel, Gene Expression Technology: Methods in Enzymology, Vol. 185, Academic Press, San Diego, Calif.(1990)에 개시되어 있다. 본 발명의 방법들에서, 발현 조절 서열은 폴리뉴클레오티드 서열에 작동가능하게 연결된다. "작동가능하게 연결된"이라는 것은, 적절한 분자들(예를 들어, 전사 활성화인자 단백질들)이 발현 조절 서열(들)에 결합될 때, 폴리뉴클레오티드 서열 및 발현 조절 서열(들)이 유전자 발현을 허용하는 방식으로 연결되는 것을 의미한다. 작동가능하게 연결된 프로모터는, 전사 및 번역의 방향에 관하여, 선택된 폴리뉴클레오티드 서열의 상류에 위치된다. 작동가능하게 연결된 인핸서는 선택된 폴리뉴클레오티드의 상류, 내부 또는 하류에 위치될 수 있다.
본 명세서에서 사용되는 바와 같이, "벡터"라는 용어는 벡터가 연결된 다른 핵산, 즉 폴리뉴클레오티드 서열을 수송할 수 있는 핵산 분자를 지칭한다. 일 유형의 유용한 벡터는 에피솜(episome)[즉, 염색체외 복제(extra-chromosomal replication)가 가능한 핵산]이다. 유용한 벡터는 벡터가 연결된 핵산의 자율 복제 및/또는 발현이 가능한 벡터이다. 작동가능하게 연결된 유전자의 발현을 지향할 수 있는 벡터는 본 명세서에서 "발현 벡터"로 칭해진다. 일반적으로, 재조합 DNA 기술들에 유용한 발현 벡터는 흔히 "플라스미드"의 형태로 되어 있으며, 이는 일반적으로 벡터 형태로 염색체에 결합되지 않는 원형의 이중 가닥 DNA 루프를 지칭한다. 플라스미드가 가장 많이 보편적으로 사용되는 벡터의 형태이므로, "플라스미드" 및 "벡터"라는 용어는 본 명세서에서 교환가능하게 사용된다. 하지만, 등가의 기능들을 제공하고, 이후에 해당 기술분야에 알려지는 이러한 다른 형태들의 발현 벡터도 포함된다. 몇몇 구현예들에서, 재조합 벡터는 폴리뉴클레오티드 서열에 작동가능하게 연결된 프로모터를 더 포함한다. 몇몇 구현예들에서, 프로모터는 발달-조절된(developmentally-regulated), 세포소기관-특이적(organelle-specific), 조직-특이적(tissue-specific), 유도성(inducible), 구성적(constitutive), 또는 세포-특이적 프로모터이다. 재조합 벡터는 통상적으로, 폴리뉴클레오티드 서열에 작동가능하게 연결된 발현 조절 서열; 폴리뉴클레오티드 서열에 작동가능하게 연결된 선택 마커; 폴리뉴클레오티드 서열에 작동가능하게 연결된 마커 서열; 폴리뉴클레오티드 서열에 작동가능하게 연결된 정제 모이어티(purification moiety); 폴리뉴클레오티드 서열에 작동가능하게 연결된 분비 서열(secretion sequence); 및 폴리뉴클레오티드 서열에 작동가능하게 연결된 표적 서열(targeting sequence)로부터 선택된 적어도 하나의 서열을 포함한다. 특정 구현예들에서, 뉴클레오티드 서열은 숙주 세포의 게놈 DNA 내로 안정하게 통합되며, 뉴클레오티드 서열의 발현은 조절된 프로모터 구역의 조절을 받는다. 본 명세서에 사용되는 발현 벡터는 숙주 세포에서의 폴리뉴클레오티드 서열의 발현에 적합한 형태로 된 본 명세서에 설명된 폴리뉴클레오티드 서열을 포함한다. 해당 기술분야의 당업자라면, 발현 벡터의 설계는 형질전환될 숙주 세포의 선택, 의도한 폴리펩티드의 발현 수준 등과 같은 인자들에 의존할 수 있음을 이해할 것이다. 본 명세서에 설명되는 발현 벡터는 본 명세서에 설명되는 바와 같은 폴리뉴클레오티드 서열에 의해 코딩되는, 융합 폴리펩티드를 포함하는 폴리펩티드를 생성하기 위하여 숙주 세포 내로 도입될 수 있다.
"재조합 세포" 및 "재조합 숙주 세포"라는 용어는 본 명세서에서 교환가능하게 사용되고, 말로닐-CoA 유래 화합물을 생성하기 위해 재조합 세포의 특이적 활성을 증가시킬 수 있는 변이 오페론을 포함하고 및/또는 ACC 변이체를 발현시킬 수 있는 세포를 지칭한다. 재조합 세포는 박테리아, 바이러스 또는 균류와 같은 미생물로부터 유래될 수 있다. 또한, 재조합 세포는 식물 또는 동물 세포로부터 유래될 수 있다. 재조합 세포는, 지방산, 지방족 에스테르[예를 들어, 왁스, 지방산 에스테르, 지방족 에스테르, 지방산 메틸 에스테르(FAME), 지방산 에틸 에스테르(FAEE)], 지방족 알코올, 짧은 및 긴 사슬형 알코올, 지방족 알데히드, 탄화수소, 지방족 아민, 말단 올레핀, 내부 올레핀, 케톤, 이작용성 지방산 유도체(예를 들어, ω-하이드록시 지방산, ω-하이드록시 디올, ω-하이드록시 FAME, ω-하이드록시 FAEE); 그리고 비-지방산계 화합물, 예컨대 플라바논, 플라보노이드, 폴리케티드 및 3-하이드록시프로피온산을 포함하는(단, 이로 제한되지 않음) 하나 이상의 지방산 유도체를 생성하기 위해 사용될 수 있다. 몇몇 구현예들에서, 재조합 세포는 하나 이상의 폴리뉴클레오티드를 포함하고, 각각의 폴리뉴클레오티드는 지방산 생합성 효소 활성을 갖는 폴리펩티드를 코딩하며, 재조합 세포는 폴리뉴클레오티드를 발현시키기에 효과적인 조건들에서 탄소원의 존재 하에서 배양될 때 지방산 유도체 조성물을 생성한다.
본 명세서 사용되는 바와 같이, "미생물"이라는 용어는 미세한 생물체(microscopic organism)를 지칭한다. 미생물의 예시는 박테리아, 바이러스 또는 균류이다. 일 구현예에서, 미생물은 박테리아성 세포이다. 또 다른 구현예에서, 미생물은 원핵생물 또는 원핵 세포이다. 또 다른 구현예에서, 미생물은 효모 세포와 같은 균류 세포이다. 또 다른 구현예에서, 미생물은 바이러스성 세포이다. 관련 구현예에서, "재조합 미생물"은 유전적으로 변경된 또한 외인성 및/또는 이종 핵산 서열을 발현시키거나 포함하는 미생물이다.
본 명세서에서 사용되는 바와 같이, "아실-ACP"는 아실기 운반 단백질(ACP)의 포스포판테테이닐 모이어티의 술피드릴기와 알킬 사슬의 카르보닐 탄소 사이에서 형성되는 아실 티오에스테르를 지칭한다. 포스포판테테이닐 모이어티는 홀로(holo)-아실기 운반 단백질 신타아제(ACPS)인 포스포판테테이닐 트랜스퍼라아제의 작용에 의해 ACP 상의 보존된 세린 잔기에 번역후(post-translationally) 부착된다. 몇몇 구현예들에서, 아실-ACP는 완전히 포화된 아실-ACP의 합성에 있어서 중간체이다. 다른 구현예들에서, 아실-ACP는 불포화된 아실-ACP의 합성에 있어서 중간체이다. 몇몇 구현예들에서, 탄소 사슬은 약 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25 또는 26 개의 탄소들을 가질 것이다. 이러한 아실-ACP의 각각은 이를 지방산 유도체로 전환시키는 효소에 대한 기질이다.
"말로닐-CoA 유래 화합물"이라는 용어는 생화학 경로를 통해 만들어지는 여하한의 화합물 또는 화학적 개체(즉, 중간체 또는 최종 생성물)를 포함하고, 말로닐-CoA는 중간체로서 기능하며, 및/또는 화합물 또는 화학적 개체의 상류에서 만들어진다(예를 들어, 도 4 참조). 예를 들어, 말로닐-CoA 유래 화합물은 지방산 유도체, 이를테면, 예컨대 지방산; 지방산 메틸 에스테르(FAME) 및/또는 지방산 에틸 에스테르(FAEE)를 포함하는(단, 이로 제한되지 않음) 지방족 에스테르; 지방족 알코올; 지방족 알데히드; 지방족 아민; 알칸; 올레핀 또는 알켄; 탄화수소; 베타 하이드록시 지방산 유도체, 이작용성 지방산 유도체, 및 불포화 지방산 유도체를 포함한다(단, 이로 제한되지 않음). 또한, 말로닐-CoA 유래 화합물은 비-지방산 화합물, 이를테면, 예컨대 플라바논, 플라보노이드, 폴리케티드, 말로네이트 및 3-하이드록시프로피온산을 포함한다(단, 이로 제한되지 않음).
"지방산"이라는 용어는 화학식 RCOOH를 갖는 카르복실산을 의미한다. R은 지방족기(aliphatic group), 바람직하게는 알킬기를 나타낸다. R은 약 4 내지 약 22 개의 탄소 원자들을 포함할 수 있다. 지방산은 분지쇄형 사슬 또는 직쇄형 사슬을 가질 수 있고, 포화, 단일불포화 또는 다중불포화될 수 있다.
"지방산 유도체"는 부분적으로 생성 숙주 유기체의 지방산 생합성 경로로부터 만들어지는 생성물이다. "지방산 유도체"는 아실-ACP 또는 아실-ACP 유도체를 포함하는 말로닐-CoA 유래 화합물로부터 만들어지는 생성물을 포함한다. 예시적인 지방산 유도체는 지방산, 지방족 에스테르[예를 들어, 왁스, 지방산 에스테르, 지방족 에스테르, 지방산 메틸 에스테르(FAME), 지방산 에틸 에스테르(FAEE)], 지방족 아민, 지방족 알데히드, 지방족 알코올, 짧은 및 긴 사슬형 알코올, 탄화수소, 케톤, 말단 올레핀, 내부 올레핀, 케톤, 베타 하이드록시 지방산 유도체, 이작용성 지방산 유도체(예를 들어, ω-하이드록시 지방산, ω-하이드록시 디올, ω-하이드록시 FAME, ω-OH FAEE) 및 불포화 지방산 유도체를 포함한다. 또한, "지방산 유도체"는 아실-CoA 또는 아실-CoA 유도체와 같은 말로닐-CoA 유래 화합물로부터 만들어지는 생성물을 포함한다.
본 명세서에서 언급된 바와 같은 "지방산 유도체 조성물"은 재조합 숙주 세포에 의해 생성되며, 통상적으로 지방산 유도체의 혼합물을 포함한다. 몇몇 경우, 혼합물은 하나 이상의 유형의 지방산 유도체 생성물(예를 들어, 지방산, 지방족 에스테르, 지방족 알코올, 지방족 알데히드, 지방족 아민, 이작용성 지방산 유도체 등)을 포함한다. 다른 경우, 지방산 유도체 조성물은, 예를 들어 상이한 사슬 길이, 포화 및/또는 분지 특성을 갖는 지방족 에스테르(또는 다른 지방산 유도체)의 혼합물을 포함할 수 있다. 다른 경우, 지방산 유도체 조성물은 상이한 사슬 길이, 포화 및/또는 분지 특성을 갖는 지방산 유도체와 하나 이상의 유형의 지방산 유도체 생성물의 혼합물을 둘 모두 포함할 수 있다. 다른 경우, 지방산 유도체 조성물은, 예를 들어 지방족 에스테르와 베타 하이드록시 에스테르의 혼합물을 포함할 수 있다. 다른 경우, 지방산 유도체 조성물은, 예를 들어 지방족 알코올과 지방족 알데히드의 혼합물을 포함할 수 있다. 다른 경우, 지방산 유도체 조성물은, 예를 들어 FAME 및/또는 FAEE의 혼합물을 포함할 수 있다.
"변이 비오틴 카르복실 운반 단백질(BCCP)" 및 "비오틴 카르복실 운반 단백질(BCCP) 변이체"는 본 명세서에서 교환가능하게 사용되며, 그 아미노산 서열에 하나 이상의 돌연변이를 갖는 ACC 변이체를 지칭한다. 일 예시에서, 아미노산 서열은 1[즉, ATG 개시 부위(start site)에 기초한 초기 메티오닌(M)]에서 156까지의 범위를 갖는다. 이러한 BCCP 변이체는 아미노산 위치 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 및/또는 156에서 하나 이상의 돌연변이(들)를 가질 수 있다. 일 구현예에서, 돌연변이는 약 위치 1에서 약 위치 60까지의 범위를 갖는 N-말단 아미노산 부위의 돌연변이를 포함한다. 일 구현예에서, 돌연변이는 아미노산 위치 2(개시 코돈 바로 다음)의 돌연변이를 포함한다
"발현이 대응하는 야생형 세포와 비교할 때 말로닐-CoA-유래 화합물의 증가된 생성을 재조합 세포에 부여한다"는 용어는 그 아미노산 서열에 하나 이상의 돌연변이(즉, ACC 변이체 또는 ACC 돌연변이체)를 갖는 ACC 관련 폴리펩티드 또는 단백질의 기능을 지칭하며, ACC 변이체 또는 돌연변이체를 발현시키지 않는 야생형 세포와 비교할 때, 세포에서 발현될 때 말로닐-CoA 유래 화합물(들)의 증가된 생성을 그 세포에 유도한다. 또한, 이는, 세포에서 발현될 때, 말로닐-CoA 유래 화합물(들)을 생성함에 있어서 세포의 더 높은 특이적 활성을 유도하는 효과를 갖는 ACC 변이체의 기능을 지칭한다. 이론에 의해 한정되지 않고, 이는 세포에 더 높은 아세틸-CoA 카르복실라아제(ACC) 효소 활성(E.C. 6.4.1.2)을 직접적으로 또는 간접적으로 유도한 결과일 수 있다. 이는, 대응하는 야생형 세포(즉, ACC 변이체를 발현시키지 않는 세포)에 의해 생성된 말로닐-CoA 유래 화합물의 역가 및/또는 수율과, ACC 변이체를 발현시키는 세포에 의해 생성된 말로닐-CoA 유래 화합물의 역가 및/또는 수율을 비교함으로써 측정될 수 있다. 해당 기술분야의 당업자라면, 예를 들어 GC-FID(gas chromatography flame ionization detector) 등을 포함하는 측정 방법들이 쉽게 이용가능함을 이해할 것이다. ACC 변이 단백질의 일 예시는 비오틴 카르복실 운반 단백질(BCCP) 변이체이다. ACC 변이체(들)는 ACC 복합체의 4 개의 서브유닛들 중 어느 하나 및/또는 2 개의 돌연변이를 포함할 수 있다. ACC 변이체(들)는 4 개의 서브유닛들 중 어느 하나 및/또는 2 개에서의 농도의 변화를 포함할 수 있다. 세포가 ACC 변이체로 형질전환되었을 때, 이는 ACC 변이체를 발현시키는 세포(즉, 재조합 세포)이다. 일 구현예에서, ACC 변이체를 발현시키는 세포에 의해 생성된 말로닐-CoA 유래 화합물의 역가 및/또는 수율은 대응하는 야생형 세포(즉, ACC 변이체를 발현시키지 않는 대응 세포)의 역가 및/또는 수율의 적어도 2 배이다. 또 다른 구현예에서, ACC 변이체를 발현시키는 세포에 의해 생성된 말로닐-CoA 유래 화합물의 역가 및/또는 수율은 대응하는 야생형 세포의 역가 및/또는 수율보다 적어도 약 1 배, 적어도 약 2 배, 적어도 약 3 배, 적어도 약 4 배, 적어도 약 5 배, 적어도 약 6 배, 적어도 약 7 배, 적어도 약 8 배, 적어도 약 9 배, 또는 적어도 약 10 배 더 크다. 일 구현예에서, ACC 변이체를 발현시키는 세포에 의해 생성된 말로닐-CoA 유래 화합물의 역가 및/또는 수율은 대응하는 야생형 세포의 역가 및/또는 수율보다 적어도 약 1 %, 적어도 약 2 %, 적어도 약 3 %, 적어도 약 4 %, 적어도 약 5 %, 적어도 약 6 %, 적어도 약 7 %, 적어도 약 8 %, 적어도 약 9 %, 또는 약 10 % 더 크다. 또 다른 구현예에서, ACC 변이체의 발현으로 인한 역가 및/또는 수율은 야생형 ACC 복합체의 역가 및/또는 수율보다 적어도 약 20 % 내지 적어도 약 100 % 더 크다. 일 구현예에서, 세포에 의해 생성된 말로닐-CoA 유래 화합물의 역가 및/또는 수율은 대응하는 야생형 세포의 역가 및/또는 수율보다 적어도 약 20 %, 적어도 약 25 %, 적어도 약 30 %, 적어도 약 35 %, 적어도 약 40 %, 적어도 약 45 %, 적어도 약 50 %, 적어도 약 55 %, 적어도 약 60 %, 적어도 약 65 %, 적어도 약 70 %, 적어도 약 75 %, 적어도 약 80 %, 적어도 약 85 %, 적어도 약 90 %, 적어도 약 95 %, 적어도 약 97 %, 적어도 약 98 %, 적어도 약 100 % 더 크다. 또 다른 구현예에서, 세포에 의해 생성된 말로닐-CoA 유래 화합물의 역가 및/또는 수율은 대응하는 야생형 세포의 역가 및/또는 수율보다 적어도 약 200 %, 적어도 약 250 %, 적어도 약 300 %, 적어도 약 350 %, 적어도 약 400 %, 적어도 약 450 %, 적어도 약 500 %, 적어도 약 550 %, 적어도 약 600 %, 적어도 약 610, 620, 630, 640 또는 650 %, 적어도 약 700 %, 적어도 약 750 %, 적어도 약 800 %, 또는 적어도 약 850 % 더 크다.
본 명세서에서 사용되는 바와 같이, "지방산 생합성 경로"라는 용어는 지방산 유도체를 생성하는 생합성 경로를 의미한다. 지방산 생합성 경로는 의도한 특성을 갖는 지방산 유도체를 생성하기 위해 추가 효소들을 포함할 수 있다.
본 명세서에서 사용되는 바와 같이, "지방족 에스테르"는 화학식 RCOOR'를 갖는 에스테르를 의미한다. 본 명세서에서 언급되는 지방족 에스테르는 지방산, 예를 들어 지방산 에스테르로부터 만들어지는 여하한의 에스테르일 수 있다. 몇몇 구현예들에서, R기는 길이가 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 적어도 10, 적어도 11 , 적어도 12, 적어도 13, 적어도 14, 적어도 15, 적어도 16, 적어도 17, 적어도 18 또는 적어도 19 개의 탄소들이다. 대안적으로 또는 추가적으로, R기는 길이가 20 이하, 19 이하, 18 이하, 17 이하, 16 이하, 15 이하, 14 이하, 13 이하, 12 이하, 11 이하, 10 이하, 9 이하, 8 이하, 7 이하 또는 6 이하의 탄소들이다. 따라서, R기는 상기의 종단점들 중 어느 2 개에 의해 한정되는 R기를 가질 수 있다. 예를 들어, R기는 길이가 6 내지 16 개의 탄소들, 길이가 10 내지 14 개의 탄소들, 또는 길이가 12 내지 18 개의 탄소들일 수 있다. 몇몇 구현예들에서, 지방족 에스테르 조성물은 C6, C7, C8, C9, C1O, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C21, C22, C23, C24, C25 및 C26 지방족 에스테르 중 하나 이상을 포함한다. 다른 구현예들에서, 지방족 에스테르 조성물은 C6, C7, C8, C9, C1O, C11, C12, C13, C14, C15, C16, C17 및 C18 지방족 에스테르 중 하나 이상을 포함한다. 또 다른 구현예들에서, 지방족 에스테르 조성물은 C12, C14, C16 및 C18 지방족 에스테르; C12, C14 및 C16 지방족 에스테르; C14, C16 및 C18 지방족 에스테르; 또는 C12 및 C14 지방족 에스테르를 포함한다.
지방산 유도체, 예를 들어 지방족 에스테르의 R기는 직쇄형 또는 분지쇄형일 수 있다. 분지쇄형은 하나 이상의 분지점을 가질 수 있으며, 사이클릭형 분지들을 포함할 수 있다. 몇몇 구현예들에서, 분지형 지방산, 분지형 지방족 알데히드 또는 분지형 지방족 에스테르는 C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C21, C22, C23, C24, C25 또는 C26 분지형 지방산, 분지형 지방족 알데히드 또는 분지형 지방족 에스테르이다. 특정 구현예들에서, 분지형 지방산, 분지형 지방족 알데히드 또는 분지형 지방족 에스테르는 C6, C7, C8, C9, C1O, C11, C12, C13, C14, C15, C16, C17 또는 C18 분지형 지방산 또는 분지형 지방족 에스테르이다. 본 명세서의 지방족 에스테르는 A 측 및 B 측을 포함하는 것으로 언급될 수 있다. 본 명세서에서 사용되는 바와 같이, 에스테르의 "A 측"은 에스테르의 카르복실레이트 산소에 부착된 탄소 사슬을 지칭한다. 본 명세서에서 사용되는 바와 같이, 에스테르의 "B 측"은 에스테르의 모(parent) 카르복실레이트를 포함하는 탄소 사슬을 지칭한다. 지방족 에스테르가 지방산 생합성 경로로부터 유래될 때, A 측은 통상적으로 알코올에 의해 기여되고, B 측은 지방산에 의해 기여된다.
지방족 에스테르의 A 측을 형성하기 위해 여하한의 알코올이 사용될 수 있다. 예를 들어, 알코올은 본 명세서에 설명된 것과 같은 지방산 생합성 경로로부터 유래될 수 있다. 대안적으로, 알코올은 비-지방산 생합성 경로를 통해 생성될 수 있다. 또한, 알코올은 외인성으로 제공될 수 있다. 예를 들어, 지방족 에스테르가 유기체에 의해 생성되는 경우, 알코올은 발효 브로쓰에 공급될 수 있다. 대안적으로, 지방족 에스테르가 알코올을 생성할 수 있는 유기체에 의해 생성되는 경우, 지방산 또는 아세트산과 같은 카르복실산은 외인성으로 공급될 수 있다.
에스테르의 A 측 또는 B 측을 포함하는 탄소 사슬은 여하한의 길이로 되어 있을 수 있다. 일 구현예에서, 에스테르의 A 측은 길이가 적어도 약 1, 2, 3, 4, 5, 6, 7, 8, 10, 12, 14, 16 또는 18 개의 탄소들이다. 지방족 에스테르가 지방산 메틸 에스테르일 때, 에스테르의 A 측은 길이가 1 개의 탄소이다. 지방족 에스테르가 지방산 에틸 에스테르일 때, 에스테르의 A 측은 길이가 2 개의 탄소들이다. 에스테르의 B 측은 길이가 적어도 약 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24 또는 26 개의 탄소들일 수 있다. A 측 및/또는 B 측은 직쇄형 또는 분지쇄형일 수 있다. 분지쇄형은 하나 이상의 분지점을 가질 수 있다. 또한, 분지쇄형은 사이클릭형 분지들을 포함할 수 있다. 또한, A 측 및/또는 B 측은 포화되거나 불포화될 수 있다. 불포화된 경우, A 측 및/또는 B 측은 하나 이상의 불포화점을 가질 수 있다. 또한, 본 발명에 따라 생성된 지방족 에스테르의 알코올기는 반드시 첫 번째(C1) 위치에 존재할 필요는 없다. 일 구현예에서, 지방족 에스테르는 생합성으로 생성된다. 이 구현예에서는, 먼저 지방산이 "활성화된다". "활성화된" 지방산의 비-제한적인 예시는 아실-CoA, 아실 ACP 및 아실 포스페이트이다. 아실-CoA는 지방산 생합성 또는 분해의 직접적인 산물일 수 있다. 또한, 아실-CoA는 유리 지방산, CoA 및 아데노신 뉴클레오티드 트리포스페이트(ATP)로부터 합성될 수 있다. 아실-CoA를 생성하는 효소의 일 예시는 아실-CoA 신타아제이다.
특정 구현예들에서, 분지형 지방산 유도체는 이소(iso)-지방산 유도체, 예를 들어 이소-지방족 에스테르, 또는 안테이소(anteiso)-지방산 유도체, 예를 들어 안테이소-지방족 에스테르이다. 예시적인 구현예들에서, 분지형 지방산 유도체는 이소-C7:0, 이소-C8:0, 이소-C9:0, 이소-C10:0, 이소-C11:0, 이소-C12:0, 이소-C13:0, 이소-C14:0, 이소-C15:0, 이소-C16:0, 이소-C17:0, 이소-C18:0, 이소-C19:0, 안테이소-C7:0, 안테이소-C8:0, 안테이소-C9:0, 안테이소-C10:0, 안테이소-C11:0, 안테이소-C12:0, 안테이소-C13:0, 안테이소-C14:0, 안테이소-C15:0, 안테이소-C16:0, 안테이소-C17:0, 안테이소-C18:0 및 안테이소-C19:0 분지형 지방족 에스테르로부터 선택된다.
분지형 또는 비분지형 지방산 유도체의 R기는 포화되거나 불포화될 수 있다. 불포화된 경우, R기는 하나 이상의 불포화점을 가질 수 있다. 몇몇 구현예들에서, 불포화 지방산 유도체는 단일불포화 지방산 유도체이다. 특정 구현예들에서, 불포화 지방산 유도체는 C6:1, C7:1, C8:1, C9:1, C10:1, C11:1, C12:1, C13:1, C14:1, C15:1, C16:1, C17:1, C18:1, C19:1, C20:1, C21:1, C22:1, C23:1, C24:1, C25:1 또는 C26:1 불포화 지방산 유도체이다. 특정 구현예들에서, 불포화 지방산 유도체는 C10:1, C12:1, C14:1, C16:1 또는 C18:1 불포화 지방산 유도체이다. 다른 구현예들에서, 불포화 지방산 유도체는 오메가-7 위치에서 불포화된다. 특정 구현예들에서, 불포화 지방산 유도체는 시스(cis) 이중 결합을 포함한다.
본 명세서에서 사용되는 바와 같이, "클론"이라는 용어는 통상적으로 단일 공통 선조와 본질적으로 유전적으로 동일하고 이의 자손인 세포 또는 세포들의 그룹, 예를 들어 단일 박테리아성 세포에서 발생하는 클로닝된 박테리아성 콜로니(cloned bacterial colony)의 박테리아를 지칭한다.
본 명세서에서 사용되는 바와 같이, "배양물"이라는 용어는 통상적으로 생세포(viable cell)를 포함하는 액체 배지를 지칭한다. 일 구현예에서, 배양물은 조절된 조건들 하에서 사전설정된 배양 배지에서 번식하는 세포, 예를 들어 선택된 탄소원 및 질소를 포함하는 액체 배지에서 성장되는 재조합 숙주 세포의 배양물을 포함한다. "배양하는" 또는 "배양"은 액체 또는 고체 배지의 적절한 조건들 하에서 숙주 세포(예를 들어, 재조합 숙주 세포)의 개체군을 성장시키는 것을 지칭한다. 특정 구현예들에서, 배양은 최종 생성물로의 기질의 발효성 생물전환(bioconversion)을 지칭한다. 배양 배지는 잘 알려져 있으며, 이러한 배양 배지의 개별 성분들은 예를 들어 Difco™ 배지 및 BBL™ 배지의 상용 공급원(commercial source)으로부터 이용가능하다. 비-제한적인 일 예시에서, 수성 영양 배지는 YP 배지와 같이 질소, 염 및 탄소의 복합원을 포함하는 "풍부한 배지(rich medium)"이며, 이는 이러한 배지의 10 g/L의 펩톤 및 10 g/L 효모 추출물을 포함한다.
본 명세서에서 사용되는 바와 같이, 재조합 숙주 세포 내에서 단백질, 예를 들어 효소의 "변형된" 또는 "변경된 수준"의 활성은 모(parent) 또는 원래 숙주 세포에 대해 결정된 활성의 하나 이상의 특징의 차이를 지칭한다. 통상적으로, 활성의 차이는 변형된 활성을 갖는 재조합 숙주 세포와 대응하는 야생형 숙주 세포 사이에서 결정된다(예를 들어, 대응하는 야생형 숙주 세포에 대한 재조합 숙주 세포의 배양물의 비교). 예를 들어, 변형된 활성은 [예를 들어, 단백질을 코딩하는 DNA 서열의 증가 또는 감소된 수의 복제, 단백질을 코딩하는 증가 또는 감소된 수의 mRNA 전사체, 및/또는 mRNA로부터의 단백질의 증가 또는 감소된 양의 단백질 번역의 결과로서] 재조합 숙주 세포에 의해 발현되는 변형된 양의 단백질; 단백질의 구조 변화[예를 들어, 기질 특이성의 변화, 관찰되는 운동 파라미터(kinetic parameter)들의 변화를 유도하는 단백질 코딩 서열에 대한 변화와 같은 일차 구조에 대한 변화); 및 단백질 안정성의 변화(예를 들어, 단백질의 증가 또는 감소된 분해)의 결과일 수 있다. 몇몇 구현예들에서, 폴리펩티드는 본 명세서에 설명된 폴리펩티드 중 어느 하나의 돌연변이체 또는 변이체, 예를 들어 변이 BCCP를 포함하는 변이 ACC이다. 특정 경우에서, 본 명세서에 설명된 폴리펩티드들에 대한 코딩 서열은 특정 숙주 세포에서의 발현에 최적화된 코돈이다. 예를 들어, 대장균의 발현에 대하여, 하나 이상의 코돈이 최적화될 수 있다(Grosjean 외 (1982) Gene 18:199-209 ).
통상적으로, 본 명세서에서 사용되는 바와 같은 "조절 서열(regulatory sequences)"이라는 용어는 궁극적으로 단백질의 발현을 조절하는 단백질을 코딩하는 DNA 서열들에 작동가능하게-연결된, DNA의 염기 서열을 지칭한다. 조절 서열의 예시들은 RNA 프로모터 서열, 전사 인자 결합 서열, 전사 종결 서열, (인핸서 요소와 같은) 전사의 조절인자(modulator), RNA 안정성에 영향을 주는 뉴클레오티드 서열, 및 번역 조절 서열[예컨대, 리보솜 결합 부위(예를 들어, 원핵생물의 샤인-달가노 서열(Shine-Dalgarno sequence) 또는 진핵생물의 코작 서열(Kozak sequence)), 개시 코돈, 종결 코돈]을 포함한다(단, 이로 제한되지 않음). 본 명세서에 사용되는 바와 같이, "상기 뉴클레오티드 서열의 발현은 야생형 뉴클레오티드 서열에 대해 변형된다"라는 어구는, 내인성 뉴클레오티드 서열의 발현 및/또는 활성 또는 이종 혹은 비-원래 폴리펩티드-코딩 뉴클레오티드 서열의 발현 및/또는 활성의 수준의 증가 또는 감소를 의미한다. "변경된 수준의 발현" 및 "변형된 수준의 발현"이라는 용어는 교환가능하게 사용되며, 폴리뉴클레오티드, 폴리펩티드 또는 탄화수소가 동일한 조건들 하에서 대응하는 야생형 세포의 농도와 비교 시 조작된 숙주 세포에서 상이한 농도로 존재함을 의미한다. 본 명세서에 사용되는 바와 같이, 폴리뉴클레오티드에 대한 "발현"이라는 용어는 이것이 기능하게 한다는 것이다. 폴리펩티드(또는 단백질)를 코딩하는 폴리뉴클레오티드는, 발현될 때, 그 폴리펩티드(또는 단백질)를 생성하기 위해 전사 및 번역될 것이다. 본 명세서에 사용되는 바와 같이, "과발현"이라는 용어는 동일한 조건들 하에서 대응하는 야생형 세포에서 정상적으로 발현되는 것보다 더 높은 농도로 세포에서 폴리뉴클레오티드 또는 폴리펩티드를 발현시키거나 발현되게 하는 것을 의미한다.
본 명세서에서 사용되는 바와 같이, "역가"라는 용어는 숙주 세포 배양물의 단위 부피당 생성된 지방산 유도체를 포함하는 말로닐-CoA 유래 화합물의 양을 지칭한다. 본 명세서에 설명된 조성물들 및 방법들의 어느 한 측면에서, 지방산 유도체 또는 다른 화합물은 약 25 mg/L, 약 50 mg/L, 약 75 mg/L, 약 100 mg/L, 약 125 mg/L, 약 150 mg/L, 약 175 mg/L, 약 200 mg/L, 약 225 mg/L, 약 250 mg/L, 약 275 mg/L, 약 300 mg/L, 약 325 mg/L, 약 350 mg/L, 약 375 mg/L, 약 400 mg/L, 약 425 mg/L, 약 450 mg/L, 약 475 mg/L, 약 500 mg/L, 약 525 mg/L, 약 550 mg/L, 약 575 mg/L, 약 600 mg/L, 약 625 mg/L, 약 650 mg/L, 약 675 mg/L, 약 700 mg/L, 약 725 mg/L, 약 750 mg/L, 약 775 mg/L, 약 800 mg/L, 약 825 mg/L, 약 850 mg/L, 약 875 mg/L, 약 900 mg/L, 약 925 mg/L, 약 950 mg/L, 약 975 mg/L, 약 1000 mg/L, 약 1050 mg/L, 약 1075 mg/L, 약 1100 mg/L, 약 1125 mg/L, 약 1150 mg/L, 약 1175 mg/L, 약 1200 mg/L, 약 1225 mg/L, 약 1250 mg/L, 약 1275 mg/L, 약 1300 mg/L, 약 1325 mg/L, 약 1350 mg/L, 약 1375 mg/L, 약 1400 mg/L, 약 1425 mg/L, 약 1450 mg/L, 약 1475 mg/L, 약 1500 mg/L, 약 1525 mg/L, 약 1550 mg/L, 약 1575 mg/L, 약 1600 mg/L, 약 1625 mg/L, 약 1650 mg/L, 약 1675 mg/L, 약 1700 mg/L, 약 1725 mg/L, 약 1750 mg/L, 약 1775 mg/L, 약 1800 mg/L, 약 1825 mg/L, 약 1850 mg/L, 약 1875 mg/L, 약 1900 mg/L, 약 1925 mg/L, 약 1950 mg/L, 약 1975 mg/L, 약 2000 mg/L(2 g/L), 3 g/L, 5 g/L, 1O g/L, 20 g/L, 30 g/L, 40 g/L, 50 g/L, 60 g/L, 70 g/L, 80 g/L, 90 g/L, 1OO g/L 또는 상기 값들 중 어느 2 개에 의해 한정되는 범위의 역가로 생성된다. 다른 구현예들에서, 지방산 유도체 또는 다른 화합물은 1OO g/L 초과, 200 g/L 초과 또는 300 g/L 초과의 역가로 생성된다. 본 발명의 방법들에 따라 재조합 숙주 세포에 의해 생성되는 지방산 유도체 또는 다른 화합물의 바람직한 역가는 5 g/L 내지 200g/L, 1O g/L 내지 150 g/L, 20 g/L 내지 120 g/L, 및 30 g/L 내지 1OO g/L이다. 역가는 주어진 재조합 숙주 세포 배양물에 의해 생성되는 특정 지방산 유도체 또는 지방산 유도체들의 조합물 또는 또 다른 화합물 또는 다른 화합물들의 조합물을 지칭할 수 있다. 예를 들어, 대장균과 같은 재조합 숙주 세포에서의 ACC 변이체의 발현은 대응하는 야생형 폴리펩티드를 발현시키는 재조합 숙주 세포와 비교 시 더 높은 역가의 생성을 유도한다. 일 구현예에서, 더 높은 역가는 적어도 약 5 g/L에서 약 200 g/L의 범위를 갖는다.
본 명세서에서 사용되는 바와 같이, "숙주 세포에 의해 생성되는 지방산 유도체 또는 다른 화합물을 포함하는 말로닐-CoA 유래 화합물의 수율"은 투입된 탄소원이 숙주 세포의 생성물(즉, 지방산 유도체 및/또는 다른 화합물을 포함하는 말로닐-CoA 유래 화합물)로 전환되는 효율을 지칭한다. 본 발명의 방법들에 따라 지방산 유도체를 포함하는 말로닐-CoA 유래 화합물을 생성하도록 조작된 숙주 세포는 적어도 약 3 %, 적어도 약 4 %, 적어도 약 5 %, 적어도 약 6 %, 적어도 약 7 %, 적어도 약 8 %, 적어도 약 9 %, 적어도 약 10 %, 적어도 약 11 %, 적어도 약 12 %, 적어도 약 13 %, 적어도 약 14 %, 적어도 약 15 %, 적어도 약 16 %, 적어도 약 17 %, 적어도 약 18 %, 적어도 약 19 %, 적어도 약 20 %, 적어도 약 21 %, 적어도 약 22 %, 적어도 약 23 %, 적어도 약 24 %, 적어도 약 25 %, 적어도 약 26 %, 적어도 약 27 %, 적어도 약 28 %, 적어도 약 29 % 또는 적어도 약 30 %, 또는 상기 값들 중 어느 2 개에 의해 한정되는 범위의 수율을 갖는다. 다른 구현예들에서, 지방산 유도체 또는 유도체들 또는 다른 화합물(들)은 약 30 % 이상, 약 35 % 이상, 약 40 % 이상, 약 45 % 이상, 약 50 % 이상, 약 55 % 이상, 약 60 % 이상, 약 65 % 이상, 약 70 % 이상, 약 75 % 이상, 약 80 % 이상, 약 85 % 이상, 약 90 % 이상, 약 100 % 이상, 약 200 % 이상, 약 250 % 이상, 약 300 % 이상, 약 350 % 이상, 약 400 % 이상, 약 450 % 이상, 약 500 % 이상, 약 550 % 이상, 약 600 % 이상, 약 650 % 이상, 약 700 % 이상, 약 750 % 이상, 또는 그 이상의 수율로 생성된다. 대안적으로 또는 추가적으로, 수율은 약 30 % 이하, 약 27 % 이하, 약 25 % 이하 또는 약 22 % 이하이다. 또 다른 구현예에서, 수율은 약 50 % 이하, 약 45 % 이하, 또는 약 35 % 이하이다. 또 다른 구현예에서, 수율은 약 95 % 이하, 약 90 % 이하, 약 85 % 이하, 약 80 % 이하, 약 75 % 이하, 약 70 % 이하, 약 65 % 이하, 약 60 % 이하, 약 55 % 이하, 또는 약 50 % 이하이다. 따라서, 수율은 상기 종단점들 중 어느 2 개에 의해 한정될 수 있다. 예를 들어, 본 발명의 방법들에 따라 재조합 숙주 세포에 의해 생성되는 지방산 유도체 또는 유도체들을 포함하는 말로닐-CoA 유래 화합물의 수율은 약 5 % 내지 약 15 %, 약 10 % 내지 약 25 %, 약 10 % 내지 약 22 %, 약 15 % 내지 약 27 %, 약 18 % 내지 약 22 %, 약 20 % 내지 약 28 %, 또는 약 20 % 내지 약 30 %, 약 30 % 내지 약 40 %, 약 40 % 내지 약 50 %, 약 50 % 내지 약 60 %, 약 60 % 내지 약 70 %, 약 70 % 내지 약 80 %, 약 80 % 내지 약 90 %, 약 90 % 내지 약 100 %, 약 100 % 내지 약 200 %, 약 200 % 내지 약 300 %, 약 300 % 내지 약 400 %, 약 400 % 내지 약 500 %, 약 500 % 내지 약 600 %, 약 600 % 내지 약 700 % 또는 약 700 % 내지 약 800 %일 수 있다. 수율은 주어진 재조합 숙주 세포 배양물에 의해 생성되는 지방산 유도체 또는 지방산 유도체들의 조합물 또는 또 다른 화합물 또는 화합물들의 또 다른 조합물을 포함하는 특정 말로닐-CoA 유래 화합물을 지칭할 수 있다. 일 구현예에서, 대장균과 같은 재조합 숙주 세포에서의 ACC 변이체의 발현은, 대응하는 야생형 폴리펩티드를 발현시키는 숙주 세포와 비교 시, 지방산 유도체, 이를테면, 예컨대 지방족 에스테르를 포함하는 말로닐-CoA 유래 화합물의 더 높은 수율의 생성을 유도한다. 일 구현예에서, 더 높은 수율은 이론적인 수율의 약 10 %에서 약 800 %의 범위를 갖는다.
본 명세서에서 사용되는 바와 같이, "생산성"이라는 용어는 단위 시간당 숙주 세포 배양물의 단위 부피당 생성된 지방산 유도체 또는 유도체들 또는 또 다른 화합물 또는 화합물들을 포함하는 말로닐-CoA 유래 화합물의 양을 지칭한다. 본 명세서에 설명된 조성물들 및 방법들의 어느 한 측면에서, 재조합 숙주 세포에 의해 생성된 지방산 유도체 또는 유도체들 또는 다른 화합물 또는 화합물들을 포함하는 말로닐-CoA 유래 화합물의 생산성은 100 mg/L/시간, 적어도 200 mg/L/시간, 적어도 300 mg/L/시간, 적어도 400 mg/L/시간, 적어도 500 mg/L/시간, 적어도 600 mg/L/시간, 적어도 700 mg/L/시간, 적어도 800 mg/L/시간, 적어도 900 mg/L/시간, 적어도 1000 mg/L/시간, 적어도 1100 mg/L/시간, 적어도 1200 mg/L/시간, 적어도 1300 mg/L/시간, 적어도 1400 mg/L/시간, 적어도 1500 mg/L/시간, 적어도 1600 mg/L/시간, 적어도 1700 mg/L/시간, 적어도 1800 mg/L/시간, 적어도 1900 mg/L/시간, 적어도 2000 mg/L/시간, 적어도 2100 mg/L/시간, 적어도 2200 mg/L/시간, 적어도 2300 mg/L/시간, 적어도 2400 mg/L/시간, 적어도 2500 mg/L/시간이거나, (세포 질량에 따라) 10 g/L/시간만큼 높다. 예를 들어, 본 발명의 방법들에 따라 재조합 숙주 세포에 의해 생성된 지방산 유도체 또는 유도체들 또는 다른 화합물(들)을 포함하는 말로닐-CoA 유래 화합물의 생산성은 500 mg/L/시간 내지 2500 mg/L/시간, 또는 700 mg/L/시간 내지 2000 mg/L/시간일 수 있다. 생산성은 주어진 재조합 숙주 세포 배양에 의해 생성된 지방산 유도체 또는 지방산 유도체들의 조합물 또는 다른 화합물(들)을 포함하는 특정 말로닐-CoA 유래 화합물을 지칭할 수 있다. 예를 들어, 대장균과 같은 재조합 숙주 세포에서의 ACC 변이체의 발현은 대응하는 야생형 폴리펩티드를 발현시키는 재조합 숙주 세포와 비교 시 지방산 유도체들 또는 다른 화합물들을 포함하는 말로닐-CoA 유래 화합물들의 증가된 생산성의 생성을 유도한다. 일 구현예에서, 더 높은 생산성은 약 0.3 g/L/h에서 약 3 g/L/h까지 약 10 g/L/h까지 약 100 g/L/h까지 약 1000 g/L/h까지의 범위를 갖는다.
본 명세서에서 사용되는 바와 같이, "총 지방 종들(fatty species)" 및 "총 지방산 생성물" 및 "지방산 유도체"라는 용어는 GC-FID에 의해 평가되는 바와 같이 ACC 변이체를 발현시키는 숙주 세포에 의해 생성될 수 있는 지방산 유도체의 양과 관련하여 본 명세서에서 교환가능하게 사용될 수 있다. 동일한 용어들은, 지방산 유도체 분석과 관련 있는 경우, 예를 들어 지방족 에스테르, 지방족 알코올, 지방족 알데히드, 지방족 아민 및 유리 지방산을 의미하는 데 사용될 수 있다.
본 명세서에서 사용되는 바와 같이, "글루코오스 이용률"이라는 용어는 그램/리터/시간(g/L/hr)으로 기록되는 단위 시간당 배양물에 사용되는 글루코오스의 양을 의미한다.
본 명세서에서 사용되는 바와 같이, "탄소원"이라는 용어는 원핵 또는 단순 진핵 세포 성장을 위한 탄소원으로서 사용되기에 적합한 기질 또는 화합물을 지칭한다. 탄소원은 중합체, 탄수화물, 산, 알코올, 알데히드, 케톤, 아미노산, 펩티드 및 기체(예를 들어, CO 및 CO2)를 포함하는(단, 이로 제한되지 않음) 다양한 형태로 존재할 수 있다. 예시적인 탄소원은 글루코오스, 프럭토오스, 만노오스, 갈락토오스, 자일로오스 및 아라비노오스와 같은 단당류; 프럭토-올리고당 및 갈락토-올리고당과 같은 올리고당류; 녹말, 셀룰로오스, 펙틴 및 자일란과 같은 다당류; 수크로오스, 말토오스, 셀로비오스 및 투라노오스(turanose)와 같은 이당류; 헤미셀룰로오스(hemicellulose), 메틸 셀룰로오스 및 소듐 카르복시메틸 셀룰로오스와 같은 셀룰로오스 물질 및 변이체; 숙시네이트, 락테이트 및 아세테이트와 같은 포화 또는 불포화 지방산류; 에탄올, 메탄올 및 글리세롤과 같은 알코올류, 또는 이의 혼합물들을 포함한다(단, 이로 제한되지 않음). 또한, 탄소원은 글루코오스와 같은 광합성의 산물일 수 있다. 특정 구현예들에서, 탄소원은 바이오매스이다. 다른 구현예들에서, 탄소원은 글루코오스이다. 다른 구현예들에서, 탄소원은 수크로오스이다. 다른 구현예들에서, 탄소원은 글리세롤이다. 다른 구현예들에서, 탄소원은 단순한 탄소원이다. 다른 구현예들에서, 탄소원은 재생가능한 탄소원이다.
본 명세서에서 사용되는 바와 같이, "바이오매스"라는 용어는 탄소원이 유래되는 여하한의 생물학적 물질을 지칭한다. 몇몇 구현예들에서, 바이오매스는 탄소원으로 처리되며, 이는 생물전환에 적합하다. 다른 구현예들에서, 바이오매스는 탄소원으로의 추가적인 처리를 요구하지 않는다. 탄소원은 지방족 에스테르를 포함하는 조성물로 전환될 수 있다. 지방족 에스테르는 계면활성제, 중합체, 필름, 직물, 염료, 의약품, 방향제 및 착향료, 래커, 페인트, 바니쉬, 수지 및 플라스틱의 연화제, 가소제, 난연제, 및 가솔린 및 오일의 첨가제를 포함하는(단, 이로 제한되지 않음) 다수의 생성물에서 유용성을 찾을 수 있다.
예시적인 바이오매스의 공급원은 옥수수, 사탕수수 또는 스위치그래스(switchgrass)와 같은 식물성 물질 또는 식생(vegetation)이다. 또 다른 예시적인 바이오매스의 공급원은 동물성 물질[예를 들어, 우분(cow manure)]과 같은 대사 노폐물(metabolic waste products)이다. 또 다른 예시적인 바이오매스의 공급원은 조류 및 여타의 해양 식물을 포함한다. 또한, 바이오매스는 글리세롤, 발효 찌꺼기, 목초, 짚, 목재, 오수, 쓰레기, 셀룰로오스성 도시 폐기물 및 음식 쓰레기(예를 들어, 비누, 오일 및 지방산)를 포함하는(단, 이로 제한되지 않음) 산업, 농업, 임업 및 가정으로부터의 폐기물을 포함한다. 또한, "바이오매스"라는 용어는 탄수화물(예를 들어, 단당류, 이당류 또는 다당류)과 같은 탄소원을 지칭할 수 있다.
본 명세서에서 사용되는 바와 같이, 생성물들에 대하여 "분리된"이라는 용어는 세포 성분, 세포 배양 배지, 또는 화학적 또는 합성 전구체로부터 분별된(separated) 생성물들을 지칭한다. 본 명세서에 설명된 방법들에 의해 생성된 지방산 유도체는 발효 브로쓰에서 그리고 세포질에서 상대적으로 혼합되지 않을 수 있다. 그러므로, 지방산 유도체는 세포내 또는 세포외에서 유기 상(organic phase)으로 수집될 수 있다.
본 명세서에서 사용되는 바와 같이, "정제한다", "정제된" 또는 "정제"라는 용어는, 예를 들어 분리 또는 분별에 의해 그 환경으로부터 분자의 제거 또는 분리를 의미한다. "실질적으로 정제된" 분자는 이것이 연계된 다른 성분들로부터 적어도 약 60 % 유리(free)(예를 들어, 적어도 약 70 % 유리, 적어도 약 75 % 유리, 적어도 약 85 % 유리, 적어도 약 90 % 유리, 적어도 약 95 % 유리, 적어도 약 97 % 유리, 적어도 약 99 % 유리)된다. 본 명세서에서 사용되는 바와 같이, 또한 이러한 용어들은 샘플로부터 오염물의 제거를 지칭한다. 예를 들어, 오염물의 제거는 샘플에서의 지방산 유도체 또는 다른 화합물을 포함하는 말로닐-CoA 유래 화합물의 백분율의 증가를 유도할 수 있다. 예를 들어, 지방산 유도체 또는 다른 화합물을 포함하는 말로닐-CoA 유래 화합물이 재조합 숙주 세포에서 생성될 때, 지방산 유도체 또는 다른 화합물을 포함하는 말로닐-CoA 유래 화합물이 숙주 세포 단백질의 제거에 의해 정제될 수 있다. 정제 후, 샘플에서의 지방산 유도체 또는 다른 화합물을 포함하는 말로닐-CoA 유래 화합물의 백분율이 증가된다. "정제한다", "정제된" 및 "정제"라는 용어는 절대 순도를 요구하지 않는 상대적인 용어이다. 따라서, 예를 들어, (지방산 유도체 또는 다른 화합물을 포함하는) 말로닐-CoA 유래 화합물이 재조합 숙주 세포들에서 생성될 때, (정제된 지방산 유도체 또는 다른 화합물을 포함하는) 말로닐-CoA 유래 화합물은 다른 세포 성분(예를 들어, 핵산, 폴리펩티드, 지질, 탄수화물 또는 다른 탄화수소)과 실질적으로 분별되는 (지방산 유도체 또는 다른 화합물을 포함하는) 말로닐-CoA 유래 화합물이다.
본 명세서에 사용되는 바와 같이, "감쇠"라는 용어는 약화, 감소 또는 줄어듦을 의미한다. 예를 들어, 폴리펩티드는 그 활성을 감소시키기 위해 폴리펩티드를 변형시킴으로써(예를 들어, 폴리펩티드를 코딩하는 뉴클레오티드 서열을 변형시킴으로써) 감쇠될 수 있다.
아세틸-
CoA
카르복실라아제(
ACC
)
변이체
지방산 신타아제(FAS)는 아실 사슬의 개시 및 연장을 촉매화하는 폴리펩티드들의 그룹을 나타낸다(Marrakchi 외 (2002) Biochemical Society 30:1050-1055). FAS 경로에서 효소들과 함께 아실기 운반 단백질(ACP)은 생성되는 지방산의 길이, 포화도 및 분지를 조절한다. FAS 경로에 포함되는 효소들은 ACC, FabD, FabH, FabG, FabA, FabZ, FabI, FabK, FabL, FabM, FabB 및 FabF를 포함한다(단, 이로 제한되지 않음). 의도한 생성물에 따라, 이러한 유전자들 중 하나 이상이 재조합 숙주 세포에서 선택적으로 감쇠되거나 과발현될 수 있다(예를 들어, 미국 특허 8,658,404; 8,597,922; 8,535,916; 8,530,221; 8,372,610; 8,323,924; 8,313,934; 8,283,143; 8,268,599; 8,183,028; 8,110,670; 8,110,093; 및 8,097,439 참조).
ACC 효소(E.C. 6.4.1.2.)는 아세틸-CoA를 말로닐-CoA로 카르복실화하는 지방산 생합성의 제 1 개입 단계(committed step)를 촉매화한다. 이와 같이, 이는 지방산, 지방산 유도체 및 다른 비-지방산 화합물의 생합성을 위한 말로닐-CoA 기질을 제공한다(예를 들어, 도 4 참조). ACC 효소는 대부분의 생물에서 발견되며, 모든 원핵생물의 대부분에 그리고 대다수의 식물 및 조류의 엽록체에 다-서브유닛 효소로서 존재한다. 원핵 ACC 효소 또는 ACC 효소 복합체는 고정된 비율로 복합체로 조립되는 4 개의 상이한 유전자(즉, accA, accB, accC, 및 accD)에 의해 코딩된 4 개의 상이한 단백질을 포함한다(Broussard 외 (2013) 위 참조). 유전자 accB 및 accC는 ACC 서브유닛들, 비오틴 카르복실 운반 단백질(BCCP) 및 비오틴 카르복실라아제(BC)를 각각 코딩한다. 놀랍게도, 본 발명은 ACC 유전자들(예를 들어, accB, accC) 중 오직 하나 또는 2 개의 돌연변이(들)가 지방산 메틸 에스테르(FAME)와 같은 지방산 유도체를 포함하는 말로닐-CoA 유래 화합물의 더 높은 역가 및/또는 수율을 유도하고 지방산 플럭스(fatty acid flux)를 증가시키기에 충분하다는 것을 나타낸다. 본 발명은 accB의 코딩 부위의 돌연변이들이 유익하고, 또한 accB와 accC 유전자 둘 모두의 동시적 발현 변화가 유익함을 나타낸다. 대장균에서, accB 및 accC 유전자는 염색체에서 오페론에 인접한 것으로 발견된다. 본 명세서에 개시된 ACC 변이체는 4 개의 ACC 유전자 중 하나 또는 2 개의 발현 변화 또는 돌연변이를 포함하며, 이는 다른 ACC 서브유닛 유전자 및 폴리펩티드를 이미 포함한 세포 상으로 증가된 ACC 효소 활성을 부여하기에 충분하다.
따라서, 본 발명은, 특히 세포에서 발현될 때 말로닐-CoA 유래 화합물들의 더 높은 역가 및/또는 더 높은 수율을 유도하는 ACC 변이체; 이러한 ACC 변이체의 폴리펩티드 서열 및 이의 기능적 단편; ACC 변이 폴리펩티드 서열을 코딩하는 폴리뉴클레오티드; ACC 변이 폴리펩티드를 코딩하는 핵산을 포함하는 재조합 미생물; ACC 변이 폴리펩티드를 발현시킬 수 있는 미생물; 이러한 미생물의 배양물; 지방산 유도체 및 비-지방산 화합물을 포함하는 말로닐-CoA-유래 화합물을 생성하는 공정; 및 결과적인 조성물에 관한 것이다. 특히, ACC 변이 폴리펩티드 및 이 폴리펩티드를 발현시키는 미생물 그리고 관련 방법들이 본 명세서에 제공된다. ACC 변이체의 예시는 표 1 및 표 3(아래 참조)에 나타낸 바와 같은 BCCP 변이체이다.
accB의 대장균 야생형 핵산 서열이 SEQ ID NO: 1에 나타내어진다. (SEQ ID NO: 1의 accB에 의해 코딩된) BCCP에 대한 대응하는 대장균 야생형 아미노산 서열이 SEQ ID NO: 2에 나타내어진다. SEQ ID NO: 2는 본 발명을 예시하기 위해 개선된 ACC 변이 폴리펩티드를 생성하는 템플릿으로서 사용되었다(아래의 실시예 1 참조). 바람직한 ACC 변이체는 SEQ ID NO: 2의 야생형 대장균의 아미노산 서열에 대해 적어도 약 50 %, 약 60 %, 약 70 %, 약 80 %, 약 90 %, 또는 약 99 %의 서열 동일성을 갖는다. ATG 다음의 첫번째 아미노산은 아미노산 "2"로 지정된다.
일 측면에서, 본 발명은 ACC 변이 폴리펩티드 또는 ACC 변이체 및 이를 코딩하는 뉴클레오티드 서열을 제공한다. 상이한 아미노산 위치(또는 잔기)에서의 다양한 돌연변이는, 예를 들어 지방산 메틸 에스테르(FAME) 생성과 같은 다양한 지방산 유도체의 생성을 증가시킬 것이다. 예를 들어, 어느 위치 및 돌연변이가 가장 큰 개선을 제공하는지를 결정하기 위해 표적 부위-포화 돌연변이유발과 같은 기술들이 사용될 수 있다.
야생형 accB 유전자는 아스파르트산 또는 아스파테이트(Asp, D)를 코딩하는 위치 2에서 GAT 코돈을 함유한다. 일 구현예에서, SEQ ID NO: 2의 야생형 accB 유전자 내의 아미노산 위치 2에서의 돌연변이가 FAME 생성을 증가시켰음을 알 수 있다. (부연하면, 돌연변이 accB 유전자에 의해 코딩된) 이 변이 ACC 폴리펩티드는 야생형 ACC에 대한 지방족 에스테르의 생성을 증가시킬 수 있다. 아래의 표 1은 accB 위치 2에 대한 최적의 변위체의 요약을 나타낸다. 당업자라면, 에스테르 생성을 증가시키는 것이, 예를 들어 지방산 유도체 생성과 같은 말로닐-CoA 유래 화합물을 증가시킬 수 있는 능력에 대해 변이 ACC 폴리펩티드를 테스트하는 한 가지 방식임을 이해할 것이다. (예를 들어, 지방족 알코올 생성 또는 지방족 알데히드 생성 또는 지방산 생성 등과 같은 여타의 지방산 유도체 생성이 아닌) 지방족 에스테르 생성은 단지 예시를 위해 사용되었으며, 본 발명을 제한하려는 의미는 아니다. 또한, 당업자라면, 본 발명의 교시를 따름으로써, 또한 해당 기술분야의 당업자가 일반적으로 이용가능하고 본 명세서에 개시된 바와 같은 방법들 및 프로토콜들을 이용함으로써, 말로닐-CoA로부터 유래되는 다른 화합물들이 증가될 수 있음을 인지할 것이다.
표 1: 증가된 FAME 생성을 갖는 accB 변이체들
돌연변이된 위치에 따라, 특정화된 위치에서의 단일 또는 다수의 아미노산 변화는 지방산 유도체 생성의 증가 그리고 비-지방산 화합물의 생성의 증가를 가져온다. 일 구현예에서, 단일 또는 다수의 아미노산 변화는 지방산 생성의 증가를 유도한다. 또 다른 구현예에서, 단일 또는 다수의 아미노산 변화는 지방산 메틸 에스테르(FAME) 및/또는 지방산 에틸 에스테르(FAEE)를 포함하는(단, 이로 제한되지 않음) 지방족 에스테르 생성의 증가를 유도한다. 또 다른 구현예에서, 단일 또는 다수의 아미노산 변화는 지방족 알데히드 생성의 증가를 유도한다. 또 다른 구현예에서, 단일 또는 다수의 아미노산 변화는 지방족 알코올 생성의 증가를 유도한다. 또 다른 구현예에서, 단일 또는 다수의 아미노산 변화는 지방족 아민 생성의 증가를 유도한다. 또 다른 구현예에서, 단일 또는 다수의 아미노산 변화는 탄화수소 생성의 증가를 유도한다. 또 다른 구현예에서, 단일 또는 다수의 아미노산 변화는 알칸 생성의 증가를 유도한다. 또 다른 구현예에서, 단일 또는 다수의 아미노산 변화는 알켄 또는 올레핀 생성의 증가를 유도한다. 또 다른 구현예에서, 단일 또는 다수의 아미노산 변화는 하이드록시 지방산 및/또는 이산을 포함하는(단, 이로 제한되지 않음) 이작용성 지방산 생성의 증가를 유도한다. 또 다른 구현예에서, 단일 또는 다수의 아미노산 변화는 이작용성 지방족 알코올 생성의 증가를 유도한다. 또 다른 구현예에서, 단일 또는 다수의 아미노산 변화는 이작용성 지방족 에스테르 및/또는 지방족 아민 생성의 증가를 유도한다. 또 다른 구현예에서, 단일 또는 다수의 아미노산 변화는 베타-하이드록시 지방산 유래 화합물의 생성의 증가를 유도한다. 또 다른 구현예에서, 단일 또는 다수의 아미노산 변화는 불포화 지방산 유래 화합물의 생성의 증가를 유도한다. 또 다른 구현예에서, 단일 또는 다수의 아미노산 변화는 플라바논 및/또는 플라보노이드의 생성의 증가를 유도한다. 또 다른 구현예에서, 단일 또는 다수의 아미노산 변화는 폴리케티드의 생성의 증가를 유도한다. 또 다른 구현예에서, 단일 또는 다수의 아미노산 변화는 3-하이드록시프로피온산(3-HP)의 생성의 증가를 유도한다. 또 다른 구현예에서, 단일 또는 다수의 아미노산 변화는 말론산 또는 말로네이트의 생성의 증가를 유도한다.
따라서, 특정화된 위치에서의 하나 이상의 아미노산 변화의 조합은 지방산 유도체 및/또는 유리 지방산 생성 및/또는 비-지방산계 화합물, 예컨대 플라바논 및/또는 플라보노이드, 폴리케티드, 말로네이트, 3-하이드록시프로피온산(3-HP) 등의 증가를 가져올 수 있다. 지방산 유도체 생성에 관한 각각의 개별 아미노산 변화의 효과는 지방산 유도체 생성 또는 비-지방산 화합물의 생성에 관한 다른 개별 아미노산 변화의 효과에 추가될 수 있거나 추가되지 않을 수 있다. 몇몇 구현예들에서, 특정화된 위치에서의 하나 이상의 아미노산 변화의 조합은 지방산 유도체 생성의 증가를 유도한다. 따라서, 특정화된 위치에서의 하나 또는 다수의 아미노산 변화는 지방산 유도체 생성의 증가를 가져올 수 있다. 유사하게, 특정화된 위치에서의 하나 또는 다수의 아미노산 변화는 비-지방산 화합물의 증가를 가져올 수 있다.
상기의 표 1에 도시된 ACC 변이체들에 더하여, accB 유전자의 오류 유발 라이브러리(error prone library)가 구축되었고, 템플릿으로서 SEQ ID NO: 1을 이용하여 스크리닝(screen)되었다. 단일 또는 다수의 돌연변이(아래의 실시예 1, 표 3 참조)를 도입함으로써 추가 accB 변이체들이 식별되었다. 따라서, 63 개의 유익한 돌연변이(표 1 및 표 3 참조)가 FAME의 증가된 역가를 유도한 accB의 코딩 부위에서 식별되었다. 특히, 약 아미노산 위치 1에서 약 위치 60까지의 범위를 갖는 N-말단 아미노산 부위에서 높은 수의 돌연변이가 발견되었다.
일 측면에서, 본 발명은 SEQ ID NO: 2에 대해 적어도 약 50 %의 서열 동일성을 갖는 ACC 변이 폴리펩티드에 관한 것이다. 몇몇 구현예들에서, 변이 ACC 폴리펩티드는 SEQ ID NO: 2의 야생형 ACC 서열에 대해 적어도 약 50 %, (예를 들어, 약 48 % 내지 약 52 %), 적어도 약 60 %, 적어도 약 70 %, 적어도 약 75 %, 적어도 약 76 %, 적어도 약 77 %, 적어도 약 78 %, 적어도 약 79 %, 적어도 약 80 %, 적어도 약 81 %, 적어도 약 82 %, 적어도 약 83 %, 적어도 약 84 %, 적어도 약 85 %, 적어도 약 86 %, 적어도 약 87 %, 적어도 약 88 %, 적어도 약 89 %, 적어도 약 90 %, 적어도 약 91 %, 적어도 약 92 %, 적어도 약 93 %, 적어도 약 94 %, 적어도 약 95 %, 적어도 약 96 %, 적어도 약 97 %, 적어도 약 98 %, 또는 적어도 99 %의 서열 동일성을 나타내고, 또한 본 명세서에 설명된 바와 같은 유용한 특징들 및/또는 특성들을 유도하는 하나 이상의 치환을 포함한다. 본 발명의 일 측면에서, 개선된 특징을 갖는 ACC 변이 폴리펩티드는 SEQ ID NO: 6에 대해 약 100 %의 서열 동일성을 갖는다. 본 발명의 또 다른 측면에서, ACC 변이 폴리펩티드는 다음의 SEQ ID NOS - SEQ ID NO: 4, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32, SEQ ID NO: 34, SEQ ID NO: 36, SEQ ID NO: 38, SEQ ID NO: 40, SEQ ID NO: 42, SEQ ID NO: 44, SEQ ID NO: 46, SEQ ID NO: 48, SEQ ID NO: 50, SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 58, SEQ ID NO: 60, SEQ ID NO: 62, SEQ ID NO: 64, SEQ ID NO: 66, SEQ ID NO: 68, SEQ ID NO: 70, SEQ ID NO: 72, SEQ ID NO: 74, SEQ ID NO: 76, SEQ ID NO: 78, SEQ ID NO: 80, SEQ ID NO: 82, SEQ ID NO: 84, SEQ ID NO: 86, SEQ ID NO: 88, 및 SEQ ID NO: 90을 포함함(단, 이로 제한되지 않음) - 중 어느 하나에 대해 약 100 %의 서열 동일성을 갖는다.
관련 측면에서, ACC 변이 폴리펩티드는 SEQ ID NO: 5에 대해 100 %의 서열 동일성을 갖는 뉴클레오티드 서열에 의해 코딩된다. 또 다른 관련 측면에서, ACC 변이 폴리펩티드는 다음의 SEQ ID NOS - SEQ ID NO: 3, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31, SEQ ID NO: 33, SEQ ID NO: 35, SEQ ID NO: 37, SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 43, SEQ ID NO: 45, SEQ ID NO: 47, SEQ ID NO: 49, SEQ ID NO: 51, SEQ ID NO: 53, SEQ ID NO: 55, SEQ ID NO: 57, SEQ ID NO: 59, SEQ ID NO: 61, SEQ ID NO: 63, SEQ ID NO: 65, SEQ ID NO: 67, SEQ ID NO: 69, SEQ ID NO: 71, SEQ ID NO: 73, SEQ ID NO: 75, SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 85, SEQ ID NO: 87, 및 SEQ ID NO: 89를 포함함(단, 이로 제한되지 않음) - 중 어느 하나에 대해 약 100 %의 서열 동일성을 갖는 뉴클레오티드 서열에 의해 코딩된다.
또 다른 측면에서, 본 발명은 SEQ ID NO: 6에 대해 적어도 약 50 %의 서열 동일성을 갖는 개선된 ACC 활성을 갖는 ACC 변이 폴리펩티드에 관한 것이다. 몇몇 구현예들에서, ACC 변이 폴리펩티드는 SEQ ID NO: 6의 ACC 변이 서열에 대해 적어도 약 50 %, (예를 들어, 약 48 % 내지 약 52 %), 적어도 약 60 %, 적어도 약 70 %, 적어도 약 75 %, 적어도 약 76 %, 적어도 약 77 %, 적어도 약 78 %, 적어도 약 79 %, 적어도 약 80 %, 적어도 약 81 %, 적어도 약 82 %, 적어도 약 83 %, 적어도 약 84 %, 적어도 약 85 %, 적어도 약 86 %, 적어도 약 87 %, 적어도 약 88 %, 적어도 약 89 %, 적어도 약 90 %, 적어도 약 91 %, 적어도 약 92 %, 적어도 약 93 %, 적어도 약 94 %, 적어도 약 95 %, 적어도 약 96 %, 적어도 약 97 %, 적어도 약 98 %, 또는 적어도 99 %의 서열 동일성을 갖고, 또한 본 명세서에 설명된 바와 같은 개선된 특징들 및/또는 특성들을 유도하는 하나 이상의 치환을 포함한다. 또 다른 측면에서, 본 발명은 다음의 SEQ ID NOS - SEQ ID NO: 4, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32, SEQ ID NO: 34, SEQ ID NO: 36, SEQ ID NO: 38, SEQ ID NO: 40, SEQ ID NO: 42, SEQ ID NO: 44, SEQ ID NO: 46, SEQ ID NO: 48, SEQ ID NO: 50, SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 58, SEQ ID NO: 60, SEQ ID NO: 62, SEQ ID NO: 64, SEQ ID NO: 66, SEQ ID NO: 68, SEQ ID NO: 70, SEQ ID NO: 72, SEQ ID NO: 74, SEQ ID NO: 76, SEQ ID NO: 78, SEQ ID NO: 80, SEQ ID NO: 82, SEQ ID NO: 84, SEQ ID NO: 86, SEQ ID NO: 88, 및 SEQ ID NO: 90을 포함함(단, 이로 제한되지 않음) - 중 어느 하나에 대해 적어도 약 50 %의 서열 동일성을 갖는 ACC 변이 폴리펩티드에 관한 것이다. 몇몇 구현예들에서, ACC 변이 폴리펩티드는 다음의 SEQ ID NOS - SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32, SEQ ID NO: 34, SEQ ID NO: 36, SEQ ID NO: 38, SEQ ID NO: 40, SEQ ID NO: 42, SEQ ID NO: 44, SEQ ID NO: 46, SEQ ID NO: 48, SEQ ID NO: 50, SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 58, SEQ ID NO: 60, SEQ ID NO: 62, SEQ ID NO: 64, SEQ ID NO: 66, SEQ ID NO: 68, SEQ ID NO: 70, SEQ ID NO: 72, SEQ ID NO: 74, SEQ ID NO: 76, SEQ ID NO: 78, SEQ ID NO: 80, SEQ ID NO: 82, SEQ ID NO: 84, SEQ ID NO: 86, SEQ ID NO: 88, 및 SEQ ID NO: 90을 포함함(단, 이로 제한되지 않음) - 중 어느 하나의 ACC 서열에 대해 적어도 약 50 %, (예를 들어, 약 48 % 내지 약 52 %), 적어도 약 60 %, 적어도 약 70 %, 적어도 약 75 %, 적어도 약 76 %, 적어도 약 77 %, 적어도 약 78 %, 적어도 약 79 %, 적어도 약 80 %, 적어도 약 81 %, 적어도 약 82 %, 적어도 약 83 %, 적어도 약 84 %, 적어도 약 85 %, 적어도 약 86 %, 적어도 약 87 %, 적어도 약 88 %, 적어도 약 89 %, 적어도 약 90 %, 적어도 약 91 %, 적어도 약 92 %, 적어도 약 93 %, 적어도 약 94 %, 적어도 약 95 %, 적어도 약 96 %, 적어도 약 97 %, 적어도 약 98 %, 또는 적어도 99 %의 서열 동일성을 갖고, 이는 본 명세서에 설명된 바와 같은 개선된 특징들 및/또는 특성들을 유도하는 하나 이상의 치환을 포함한다.
또 다른 측면에서, 본 발명은 SEQ ID NO: 5의 ACC 변이 서열에 대해 적어도 약 70 %, 적어도 약 75 %, 적어도 약 76 %, 적어도 약 77 %, 적어도 약 78 %, 적어도 약 79 %, 적어도 약 80 %, 적어도 약 81 %, 적어도 약 82 %, 적어도 약 83 %, 적어도 약 84 %, 적어도 약 85 %, 적어도 약 86 %, 적어도 약 87 %, 적어도 약 88 %, 적어도 약 89 %, 적어도 약 90 %, 적어도 약 91 %, 적어도 약 92 %, 적어도 약 93 %, 적어도 약 94 %, 적어도 약 95 %, 적어도 약 96 %, 적어도 약 97 %, 적어도 약 98 %, 또는 적어도 99 %의 서열 동일성을 갖는 핵산 서열에 의해 코딩되는 아미노산 서열을 포함하는 ACC 변이 폴리펩티드에 관한 것이다. 몇몇 구현예들에서, 핵산 서열은 본 명세서에 설명된 바와 같은 개선된 특징들 및/또는 특성들을 유도하는 하나 이상의 치환을 갖는 ACC 변이체를 코딩한다. 다른 구현예들에서, 변이 ACC 핵산 서열은 대장균과 같은 유기체에 의해 유래된다. 또 다른 측면에서, 본 발명은 다음의 SEQ ID NOS - SEQ ID NO: 3, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31, SEQ ID NO: 33, SEQ ID NO: 35, SEQ ID NO: 37, SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 43, SEQ ID NO: 45, SEQ ID NO: 47, SEQ ID NO: 49, SEQ ID NO: 51, SEQ ID NO: 53, SEQ ID NO: 55, SEQ ID NO: 57, SEQ ID NO: 59, SEQ ID NO: 61, SEQ ID NO: 63, SEQ ID NO: 65, SEQ ID NO: 67, SEQ ID NO: 69, SEQ ID NO: 71, SEQ ID NO: 73, SEQ ID NO: 75, SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 85, SEQ ID NO: 87, 및 SEQ ID NO: 89를 포함함(단, 이로 제한되지 않음) - 중 어느 하나의 ACC 변이 서열에 대해 적어도 약 70 %, 적어도 약 75 %, 적어도 약 76 %, 적어도 약 77 %, 적어도 약 78 %, 적어도 약 79 %, 적어도 약 80 %, 적어도 약 81 %, 적어도 약 82 %, 적어도 약 83 %, 적어도 약 84 %, 적어도 약 85 %, 적어도 약 86 %, 적어도 약 87 %, 적어도 약 88 %, 적어도 약 89 %, 적어도 약 90 %, 적어도 약 91 %, 적어도 약 92 %, 적어도 약 93 %, 적어도 약 94 %, 적어도 약 95 %, 적어도 약 96 %, 적어도 약 97 %, 적어도 약 98 %, 또는 적어도 99 %의 서열 동일성을 갖는 핵산 서열에 의해 코딩되는 아미노산 서열을 포함하는 ACC 변이 폴리펩티드에 관한 것이다. 몇몇 구현예들에서, 핵산 서열은 본 명세서에 설명된 바와 같은 개선된 특징들 및/또는 특성들을 유도하는 하나 이상의 치환을 갖는 ACC 변이체를 코딩한다. 다른 구현예들에서, ACC 변이 핵산 서열은 대장균과 같은 유기체에 의해 유래된다.
또 다른 측면에서, 본 발명은 다음의 SEQ ID NOS - SEQ ID NO:3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31, SEQ ID NO: 33, SEQ ID NO: 35, SEQ ID NO: 37, SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 43, SEQ ID NO: 45, SEQ ID NO: 47, SEQ ID NO: 49, SEQ ID NO: 51, SEQ ID NO: 53, SEQ ID NO: 55, SEQ ID NO: 57, SEQ ID NO: 59, SEQ ID NO: 61, SEQ ID NO: 63, SEQ ID NO: 65, SEQ ID NO: 67, SEQ ID NO: 69, SEQ ID NO: 71, SEQ ID NO: 73, SEQ ID NO: 75, SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 85, SEQ ID NO: 87, 및 SEQ ID NO: 89를 포함함(단, 이로 제한되지 않음) - 중 어느 하나에 대응하는 핵산의 실질적인 전체 길이에 걸쳐 엄격한 조건들 하에서 혼성화되는 핵산 서열에 의해 코딩되는 아미노산 서열을 포함하는 ACC 변이 폴리펩티드에 관한 것이다. 몇몇 구현예들에서, 핵산 서열은 대장균과 같은 유기체로부터 유래된 ACC 변이 핵산 서열을 코딩한다. 관련 측면에서, 본 발명은 SEQ ID NO: 1에 대해 적어도 약 70 %, 적어도 약 75 %, 적어도 약 76 %, 적어도 약 77 %, 적어도 약 78 %, 적어도 약 79 %, 적어도 약 80 %, 적어도 약 81 %, 적어도 약 82 %, 적어도 약 83 %, 적어도 약 84 %, 적어도 약 85 %, 적어도 약 86 %, 적어도 약 87 %, 적어도 약 88 %, 적어도 약 89 %, 적어도 약 90 %, 적어도 약 91 %, 적어도 약 92 %, 적어도 약 93 %, 적어도 약 94 %, 적어도 약 95 %, 적어도 약 96 %, 적어도 약 97 %, 적어도 약 98 %, 또는 적어도 99 %의 서열 동일성을 갖는 뉴클레오티드 서열에 의해 코딩되는 ACC 변이체를 제공하고, 본 명세서에 개시된 치환들 중 하나 이상을 포함한다.
본 발명은 accB 유전자 단독의 코딩 부위의 돌연변이들이 유익한 한편(위 참조), accB와 accC 유전자 둘 모두의 동시적 발현 변화 또한 유익함을 나타낸다. 대장균에서, accB 및 accC 유전자는 염색체에서 오페론에 인접한 것으로 발견된다. 따라서, accBC 오페론의 발현 라이브러리가 구축되었고, 야생형 accBC 프로모터를 넘어서는 ACC 활성의 개선을 나타낸(즉, 세포에서 말로닐-CoA 유래 화합물의 증가된 생성에 의해 측정된) 변이체들에 대해 스크리닝되었다. 표 2(아래 참조)는 아래에 나타낸 바와 같은 accBC T5 프로모터 서열에 기초한 최적의 변이체들의 요약을 나타낸다:
대장균 야생형 accBC 프로모터(PaccBC) 부위 뉴클레오티드 서열(SEQ ID NO: 91):
TTGTTGCAAATTACACGGTGTTGAAGGTTATTTACATGTTAGCTGTTGATTATCTTC
CCTGATAAGACCAGTATTTAGCT
박테리오파지(Bacteriophage) T5 프로모터(PT5) 뉴클레오티드 서열(SEQ ID NO: 92):
AATCATAAAAAATTTATTTGCTTTCAGGAAAATTTTTCTGTATAATAGATTC
표 2: 증가된 FAME 생성을 갖는 accBC T5 프로모터 변이체들
라이브러리는 원래 accBC 프로모터 부위를 여하한의 적절한 프로모터 라이브러리(예를 들어, 하이브리드 프로모터, 인공 또는 합성 프로모터, 상이한 유기체로부터의 프로모터, 동일한 유기체 내의 상이한 유전자로부터의 프로모터, 상업적 프로모터 등)로 대체하는 프라이머를 이용하여 구축될 수 있으며, 이는 통상적으로 변성 뉴클레오티드(degenerate nucleotide)를 함유하여 무작위 돌연변위를 도입한다. 특정 구현예들에서, 프로모터는 발달-조절된, 세포소기관-특이적, 조직-특이적, 유도성, 구성적, 또는 세포-특이적 프로모터이다. 모든 적절한 프로모터들이 여기에서 고려된다. 다른 구현예들에서, 프로모터의 상이한 대장균 프로모터 또는 이종 프로모터로의 대체, 원래 프로모터의 돌연변이, 따로 또는 함께 accB 및 accC의 리보솜 결합 부위(RBS)에서의 돌연변이들, accBC 프로모터 및 accB 유전자 간의 비-번역 부위(untranslated region: UTR)의 변경, 염색체 내로의 또는 플라스미드 상으로의 accBC 오페론의 복제, 염색체 accBC 오페론의 플라스미드-코딩된 오페론으로의 대체, accBC 프로모터 부위를 결합시키는 전사 인자들의 조작을 포함하는(단, 이로 제한되지 않음) 해당 기술분야의 당업자에게 알려진 다수의 기술을 이용하여, accBC 오페론에 대한 발현 변화가 행해질 수 있다. 예시적인 일 구현예에서, 박테리오파지 T5 프로모터가 사용된다. 일 구현예에서, 프로모터 라이브러리가 PCR 기술을 이용하여 적절한 상동 부위들에 결합될 수 있고, 이후 라이브러리는 박테리아 염색체 내로 통합될 수 있으며(실시예 2 참조), 원래 accBC 프로모터를 대체할 수 있다. 발현 라이브러리는 실시예 2(아래 참조)에 나타낸 바와 같이 스크리닝될 수 있다.
ACC
변이체의
개선된 특성
야생형 BCCP(SEQ ID NOS: 1 및 2)는 예시적인 모델(아래의 실시예 1 참조)로서 대장균에서의 발현을 이용하여 여타의 유전자를 과발현시킬 필요없이 FAME과 같은 높은 %의 말로닐-CoA 유래 화합물을 생성하기 위해 돌연변이유발을 통해 유전적으로 변경되었다. 이는 accBC 오페론(아래의 실시예 2 참조)을 유전적으로 변경함으로써 동일하게 달성되었다. 따라서, 대장균과 같은 재조합 숙주 세포에서 발현될 때, 야생형 BCCP의 변이체들은 의도한 생성물의 더 높은 역가 및 수율을 유도한다, 즉 이들은 숙주 세포(즉, 재조합 세포)에서 발현될 때 (ACC 변이체를 발현시키지 않는) 야생형 숙주 세포에 비해 지방산 유도체와 같은 말로닐-CoA 유래 화합물의 더 많은 양을 생성한다. 야생형 ACC는 원래 단백질 복합체이고, 이는 정상적으로 그 활성을 위해 4 개의 모든 단백질 - 비오틴 카르복실라아제(BC), 비오틴 카르복실 운반 단백질(BCCP), 및 카르복실트랜스퍼라아제(CT)를 형성하는 2 개의 단백질을 포함함 - 을 필요로 한다. 하지만, 본 발명의 변이 BCCP는 말로닐-CoA 유래 화합물의 생성을 증가시킬 수 있는 능력을 세포에 부여할 것이다. 이론에 의해 한정되지 않고, 이는 원래 ACC를 발현시키는 세포들에 증가된 ACC 활성을 직접적으로 또는 간접적으로 부여하는 변이 BCCP의 직접적인 결과일 수 있음이 고려된다. 예를 들어, BCCP 변이 폴리펩티드는 야생형 세포에 비해 숙주 세포(위의 표 1 및 아래의 표 3을 참조)에서 발현될 때 약 100 % 내지 약 650 %의 FAME을 생성하였다. 이는 FAME의 관찰된 역가가 야생형 세포에 의해 정상적으로 생성되는 FAME 역가의 최대 650 %의 범위를 가짐을 의미한다. 또 다른 예시에서, accBC 오페론의 변화는 야생형 세포에 비해 숙주 세포(위의 표 2 참조)에서 발현될 때 약 200 % 내지 약 350 %의 FAME 역가를 생성한 변이 BCCP 폴리펩티드를 유도한다.
일 구현예에서, ACC 변이 폴리펩티드는, 야생형 ACC 효소에 비해, 지방산 메틸 에스테르(FAME) 및 지방산 에틸 에스테르(FAEE)와 같은 지방족 에스테르, 지방족 아민, 지방족 알데히드, 지방족 알코올, 짧은 및 긴 사슬형 알코올, 탄화수소, 케톤, 알칸, 말단 올레핀, 내부 올레핀, 베타 하이드록시 지방산 유도체, 이작용성 지방산 유도체, 및 불포화 지방산 유도체를 포함하는(단, 이로 제한되지 않음) 증가된 양의 지방산 유도체를 생성할 것으로 예상된다. 또 다른 구현예에서, ACC 변이 폴리펩티드는 야생형 ACC 효소에 비해 증가된 양의 비-지방산계 화합물들(예를 들어, 플라바논 및 플라보노이드, 폴리케티드, 3-하이드록시프로피온산, 말로네이트 등)을 생성할 것으로 예상된다. 당업자라면, ACC 변이체를 통해 생성될 수 있는 최종 생성물이 말로닐-CoA의 상향조절(upregulation)에 의해 영향을 받는 다양한 생화학 경로에 따라 지방산 유도체 및 비-지방산 화합물을 포함하는 몇 가지 부류의 화합물들을 포함한다는 것을 인지할 것이다. 도 4는 가능한 화합물의 비-제한적인(non-exhaustive) 예시를 제공한다.
ACC
변이체를
제조하는 방법
본 발명의 방법들을 구현하는 데 있어서, 스크리닝을 위해 재조합 숙주 세포의 그룹을 제조하기 위해 돌연변이유발이 사용된다. 통상적으로, 재조합 숙주 세포는 작동가능하게 연결된 조절 서열과 함께 변이 accB 유전자와 같은 ACC 변이 폴리펩티드를 위한 개방형 해독틀(open reading frame)을 포함하는 하나 이상의 폴리뉴클레오티드 서열을 포함한다. 본 발명의 방법들의 구현에 유용한 변이 BCCP 폴리펩티드를 포함하는 변이 ACC 폴리펩티드의 다수의 예시들이 본 명세서에 설명된다. 본 발명의 방법들의 구현에 유용한 조절 서열의 예시들 또한 본 명세서에 설명된다. 이러한 폴리뉴클레오티드 서열의 돌연변이유발은, 부위 지향 돌연변이, 무작위 화학적 돌연변이, 엑소뉴클레아제 Ⅲ 결실 절차, 또는 표준 클로닝 기술들과 같은 유전자 조작 기술들을 이용하여 생성될 수 있다. 대안적으로, 폴리뉴클레오티드 서열의 돌연변이는 화학적 합성 또는 변형 절차들을 이용하여 생성될 수 있다. 해당 기술분야의 당업자라면, 본 명세서에 설명된 프로토콜 및 절차들이 변형될 수 있으며, 이러한 변형들은 본 발명의 변경들에 따른 것임을 인지할 것이다. 예를 들어, 방법 단계들이 특정 순서로 설명될 때, 단계들의 순서가 변경될 수 있으며, 및/또는 병행하여 또는 순차적으로 수행될 수 있다.
돌연변이유발 방법들은 해당 기술분야에 잘 알려져 있으며, 예를 들어 다음을 포함한다. 오류 유발 PCR(Leung 외 (1989) Technique 1:11-15; 및 Caldwell 외 (1992) PCR Methods Applic. 2:28-33)에서, PCR은 DNA 폴리메라아제의 복사 정확도(copying fidelity)가 낮은 조건들 하에서 수행되어, PCR 생성물의 전체 길이를 따라 높은 점 돌연변이율(high rate of point mutations)이 얻어지도록 한다. 간명하게, 이러한 절차들에서, 돌연변이유발될 폴리뉴클레오티드는 PCR 생성물의 전체 길이를 따라 높은 점 돌연변이율을 달성하기 위하여 PCR 프라이머, 반응 완충제, MgCl2, MnCl2, Taq 폴리메라아제, 및 적절한 농도의 dNTP와 혼합된다. 예를 들어, 이러한 반응은 돌연변이유발될 20 fmole의 핵산, 30 pmole의 각 PCR 프라이머, 50 mM KCl, 10 mM Tris HCl(pH 8.3), 0.01 % 젤라틴을 포함하는 반응 완충제, 7 mM MgCl2, 0.5 mM MnCl2, 5 단위(unit)의 Taq 폴리메라아제, 0.2 mM dGTP, 0.2 mM dATP, 1 mM dCTP, 그리고 1 mM dTTP를 이용하여 수행될 수 있다. PCR은 94 ℃에서 1 분, 45 ℃에서 1 분, 그리고 72 ℃에서 1 분의 30 회 주기 동안 수행될 수 있다. 이러한 파라미터들은 적절하게 변동될 수 있음을 이해할 것이다. 이후, 돌연변이유발된 폴리뉴클레오티드는 적절한 벡터로 클로닝되며, 돌연변이유발된 폴리뉴클레오티드에 의해 코딩되는 영향을 받은 폴리펩티드들의 활성이 평가된다. 또한, 돌연변이유발은 관심 있는 여하한의 클로닝된 DNA의 부위 특이적 돌연변이를 생성하기 위해 올리고뉴클레오티드 지향 돌연변이유발을 이용하여 수행될 수 있다(예를 들어, Reidhaar-Olson 외 (1988) Science 241:53-57). 간명하게, 이러한 절차들에서, 클로닝된 DNA 내로 도입될 하나 이상의 돌연변이를 지닌 복수의 이중 가닥 올리고뉴클레오티드가 합성되고, 돌연변이유발될 클로닝된 DNA 내로 조립된다. 돌연변이유발된 DNA를 함유한 클론들이 회수되고, 영향을 받은 폴리펩티드의 활성이 평가된다. 폴리뉴클레오티드 서열 변이체를 생성하기 위한 또 다른 돌연변이유발 방법은 조립(assembly) PCR이다. 조립 PCR은 작은 DNA 단편의 혼합으로부터 PCR 생성물의 조립을 수반한다. 다수의 상이한 PCR 반응이 동일한 바이알에서 병행하여 일어나며, 일 반응의 생성물이 또 다른 반응의 생성물을 프라이밍한다(priming). 조립 PCR은, 예를 들어 미국 특허 5,965,408에 개시되어 있다. 폴리뉴클레오티드 서열 변이체를 생성하는 또 다른 돌연변이유발 방법은 유성(sexual) PCR 돌연변이유발이다(Stemmer (1994) PNAS, USA 91:10747-10751). 유성 PCR 돌연변이유발에서는, 강제된(forced) 상동성 재조합이 서열 상동성에 기초한 DNA 분자의 무작위 단편화의 결과로서 시험관 내에서 상이하지만 고도로 관련된 DNA 서열의 DNA 분자들 사이에 일어난다. 이후, PCR 반응의 프라이머 신장법(primer extension)에 의한 크로스오버(crossover)의 고정(fixation)이 후속된다.
또한, ACC 변이체들은 생체 내 돌연변이유발에 의해 생성될 수 있다. 몇몇 구현예들에서, 핵산 서열에서의 무작위 돌연변이는 DNA 보수 경로(repair pathway) 중 하나 이상에서 돌연변이를 갖는 박테리아 균주, 예컨대 대장균 균주에서의 폴리뉴클레오티드 서열을 증식시킴으로써 생성된다. 이러한 "돌연변이유발 유전자(mutator)" 균주는 야생형 균주보다 높은 무작위 돌연변이율을 갖는다. 이러한 균주들 중 하나에서의 DNA 서열의 증식이 결국 DNA 내에서 무작위 돌연변이를 생성할 것이다. 생체 내 돌연변이유발에 사용하기 적절한 돌연변이유발 유전자 균주는, 예를 들어 PCT 국제 공보 WO 91/16427에 기술되어 있다.
또한, ACC 변이체들은 카세트 돌연변이유발(cassette mutagenesis)을 이용하여 생성될 수 있다. 카세트 돌연변이유발에서는, 이중 가닥 DNA 분자의 작은 부위가 원래의 폴리뉴클레오티드 서열과 상이한 합성 올리고뉴클레오티드 "카세트"로 대체된다. 올리고뉴클레오티드는 흔히 완전히 및/또는 부분적으로 무작위화된 버전의 원래의 폴리뉴클레오티드 서열을 포함한다. 카세트 돌연변이유발의 다수의 적용들이 존재한다; 예를 들어, 카세트 돌연변이유발에 의한 돌연변이 단백질 제조(Richards, J. H. (1986) Nature 323:187; Ecker 외 (1987) J. Biol . Chem. 262:3524-3527); 개개의 코돈을 삽입 또는 대체하기 위한 코돈 카세트 돌연변이유발(Kegler-Ebo 외 (1994) Nucleic Acids Res. 22(9):1593-1599); 조절 서열을 포함하는 비-코딩 폴리뉴클레오티드 서열의 무작위화에 의한 변이 폴리뉴클레오티드 서열 제조(예를 들어, 리보솜 결합 부위, 예를 들어, Barrick 외 (1994) Nucleic Acids Res. 22(7):1287-1295; Wilson 외 (1994) Biotechniques 17:944-953 참조).
또한, 반복 앙상블 돌연변이유발(recursive ensemble mutagenesis)(Arkin 외 (1992) PNAS , U.S.A . 89:7811-7815)이 폴리뉴클레오티드 서열 변이체들을 생성하는 데 사용될 수 있다. 반복 앙상블 돌연변이유발은 표현형 관련 돌연변이체(phenotypically related mutant)(이의 요소들은 아미노산 서열이 상이함)의 다양한 개체군들을 생성하기 위해 개발된 단백질 조작(즉, 단백질 돌연변이유발)을 위한 알고리즘이다. 이 방법은 조합 카세트 돌연변이유발의 연속 라운드(successive round)를 조절하기 위해 피드백 메커니즘을 이용한다. 또한, 지수 앙상블 돌연변이유발(exponential ensemble mutagenesis)(Delegrave 외 (1993) Biotech. Res. 11:1548-1552)이 ACC의 폴리뉴클레오티드 서열 변이체들을 생성하는 데 사용될 수 있다. 지수 앙상블 돌연변이유발은 높은 백분율의 독특한 기능성 돌연변이체를 갖는 조합 라이브러리들을 생성하는 프로세스이며, 잔기들의 작은 그룹들이 기능성 단백질들을 야기하는 아미노산을 각각의 변경된 위치에서 식별하기 위해 병행하여 무작위화된다. 또한, 무작위 및 부위 지향 돌연변이유발이 사용될 수 있다(Arnold (1993) Curr. Opin. Biotech. 4:450-455).
또한, 생체 내 돌연변이유발의 표준 방법들이 사용될 수 있다. 예를 들어, 작동가능하게-연결된 조절 서열뿐만 아니라, ACC 폴리펩티드를 위한 개방형 해독틀을 포함하는 하나 이상의 폴리뉴클레오티드 서열을 포함하는 숙주 세포들이, 방사선(예를 들어, UV 광 또는 X-선)으로의 노출 또는 화학제(예를 들어, 에틸화제, 알킬화제, 또는 핵산 유사체)로의 노출을 통해 돌연변이유발을 겪을 수 있다. 또한, 몇몇 숙주 세포 유형들, 예를 들어 박테리아, 효모 및 식물에서는, 전이 인자들이 생체 내 돌연변이유발을 위해 사용될 수 있다.
ACC 관련 폴리펩티드를 코딩하는 하나 이상의 폴리뉴클레오티드 서열의 돌연변이유발은 일반적으로 변형되고 개선된 생물학적 기능을 입증하는 ACC 폴리펩티드 생성물의 발현을 유도한다. 예를 들어, accB를 포함하는 하나 이상의 폴리뉴클레오티드 서열의 돌연변이유발은 일반적으로 향상된 ACC 활성과 같이 변형되고 개선된 생물학적 기능을 입증하는 BCCP 폴리펩티드 생성물의 발현을 유도한다. BCCP 및 작동가능하게-연결된 조절 서열을 코딩하는 개방형 해독틀을 포함하는 하나 이상의 폴리뉴클레오티드 서열의 돌연변이유발에 의한 재조합 미생물의 그룹을 제조할 때, 결과적인 돌연변이유발된 폴리뉴클레오티드 서열로부터 발현된 단백질은 증가된 ACC 생물학적 가능을 나타낼 것이다. 따라서, 지방산 유도체 또는 다른 화합물과 같은 말로닐-CoA 유래 화합물, 및/또는 (사슬 길이, 포화 등과 관련하여) 지방산 유도체 또는 다른 화합물의 변형된 혼합물을 포함하는 개선된 조성물의 개선된 수율은 돌연변이 accB 폴리뉴클레오티드를 발현시키기에 효과적인 조건들 하에서 재조합 미생물의 배양 시에 관찰된다.
핫 스폿(Hot Spot)
또한, 본 발명은 적어도 부분적으로 변이 BCCP 폴리펩티드를 포함하는 변이 ACC 폴리펩티드 중에서 구조적으로 보존된 특정 "핫 스폿들"의 식별에 기초한다. 핫 스폿들은, 높은 수의 돌연변이가 FAME과 같은 지방산 유도체의 더 높은 역가 또는 비-지방산 화합물의 더 높은 역가를 유도하는 것으로 관찰되는 부위들이다. 특히, 이러한 부위들은 변이 BCCP 폴리펩티드에 나타난다, 즉 핫 스폿들은 아미노산 위치 1에서부터 (예를 들어, 가장 높은 수의 돌연변이를 나타내는) 약 아미노산 위치 60까지의 범위를 갖는 N-말단 아미노산 부위에서 관찰된다.
모티프
또한, 본 발명은 적어도 부분적으로 변이 BCCP 폴리펩티드를 포함하는 변이 ACC 폴리펩티드 중에서 구조적으로 보존된 특정 모티프들의 식별에 기초한다. 홀로카르복실라아제 신테타아제(holocarboxylase synthetase)로도 알려진 비오틴 단백질 리가아제(EC 6.3.4.15)는, ACC의 BCCP 서브유닛의 특이적 리신으로의 비오틴 보결분자단(biotin prosthetic group)의 공유 부착을 촉매화한다. BCCP-타입 단백질은 비오틴 부착 부위에서 보존된 모티프를 갖는다. 모티프는 비오틴화된 리신 잔기인 K(리신)를 포함한다. 다양한 박테리아 종의 BCCP 폴리펩티드는 이 보존된 모티프를 가지며, 그 부위에서의 여하한의 돌연변이가 감소된 기능을 유도할 수 있음을 시사한다. 모티프에 대한 공통 서열은 아래에 나타나 있으며, K는 비오틴화된 리신이다:
(L/I/V)E(A/V)MK(M/L)
도 2는 대장균(SEQ ID NO: 97 (부분); SEQ ID NO: 2 (전체); 수탁 번호 NP_417721), 락토바실러스 브레비스(SEQ ID NO: 98 (부분); SEQ ID NO: 104 (전체); 수탁 번호 WP_011667655), 스테노트로파모나스 말토필리아(SEQ ID NO: 99 (부분); SEQ ID NO: 105 (전체); 수탁 번호 AIL09846), 슈도모나스 퓨티다(SEQ ID NO: 100 (부분); SEQ ID NO: 106 (전체); 수탁 번호 AE016246_3), 바실러스 서브틸리스(SEQ ID NO: 101 (부분); SEQ ID NO: 107 (전체); 수탁 번호 NP_390315), 코리네박테리움 글루타미쿰(Corynebacterium glutamicum)(SEQ ID NO: 102 (부분); SEQ ID NO: 108 (전체); 수탁 번호 WP_011013826), 및 사카로마이세스 세레비지에(SEQ ID NO: 103 (부분); SEQ ID NO: 109 (전체); 수탁 번호 AAA20073)를 포함하는 7 개의 상이한 박테리아 종으로부터의 BCCP 아미노산 서열들의 일 구간의 정렬을 나타낸다. 모티프는 약 10 % 퍼센트 내지 약 66 % 퍼센트의 범위를 갖는 전체 아미노산 서열 동일성과 무관하게 7 개의 모든 종에 걸쳐 보존된다(도 2에 박스로 나타낸 영역 참조). 예를 들어, 락토바실러스 브레비스로부터의 BCCP는 대장균과 비교할 때 28 %의 동일성을 나타내었다. 스테노트로파모나스 말토필리아로부터의 BCCP는 대장균과 비교할 때 55 %의 동일성을 나타내었다. 슈도모나스 퓨티다로부터의 BCCP는 대장균과 비교할 때 66 %의 동일성을 나타내었다. 바실러스 서브틸리스로부터의 BCCP는 대장균과 비교할 때 40 %의 동일성을 나타내었다. 코리네박테리움 글루타 미쿰 및 사카로마이세스 세레비지에로부터의 BCCP는 대장균과 비교할 때 10 %의 동일성을 나타내었다. 이는 다른 종들에서도 모티프가 보존됨을 확인한다. 하지만, 몇몇 경우들에서, BCCP 폴리펩티드는 다양한 종에 걸쳐 약 85 %의 동일성 내지 약 100 %의 동일성 범위를 갖는 높은 아미노산 서열 동일성을 갖는다. 예를 들어, 에스체리치아 알베르 티(Escherichia alberti)으로부터의 BCCP는 대장균과 약 98 % 동일하고; 시겔라 플렉스네리(Shigella flexneri)로부터의 BCCP는 대장균과 약 93 % 동일하며; 크렙시엘라 뉴모니아(Klebsiella pneumonia)는 대장균과 약 85 % 동일하다.
숙주 세포 및 숙주 세포 배양물
본 발명의 관점에서, 본 명세서에서 고려되는 구현예들 중 어느 구현예가 하나 이상의 ACC 변이체를 코딩하는 하나 이상의 핵산 서열의 도입을 통해 유전적으로 변형될 수 있는 여하한의 숙주 세포 또는 미생물로 구현될 수 있음을 이해하여야 한다. 이와 같이, 본 명세서의 재조합 미생물은 숙주 세포로 기능하고, 숙주 세포에서 ACC 폴리펩티드의 발현을 가능하게 하는 작동가능하게-연결된 조절 서열과 함께, 말로닐-CoA 유래 화합물의 개선된/증가된 생성 및/또는 개선된/증가된 ACC 활성을 부여하는 변이 ACC 폴리펩티드를 코딩하는 개방형 해독틀을 포함하는 하나 이상의 폴리뉴클레오티드 서열을 포함한다. 일 구현예에서, 말로닐-CoA 유래 화합물의 개선된/증가된 생성 및/또는 개선된/증가된 ACC 활성을 부여하는 폴리펩티드는 BCCP의 변이체 또는 돌연변이체이다. 또 다른 구현예에서, 말로닐-CoA 유래 화합물의 개선된/증가된 생성 및/또는 개선된/증가된 ACC 활성을 부여하는 폴리펩티드는 개선된 BCCP 또는 다른 개선된 ACC 폴리펩티드 또는 accBC 오페론의 발현 변화에 기인한 이의 조합물이다. 본 발명의 재조합 숙주 세포에서, 개방형 해독틀 코딩 서열 및/또는 조절 서열은 BCCP 폴리펩티드의 대응하는 야생형 코딩 서열에 대해 변형될 수 있다. 지방족 유도체 조성물은 변이 BCCP를 포함하는 변이 ACC 폴리펩티드를 발현시키기에 효과적인 조건들에서 탄소원의 존재 하에서 ACC 변이체를 발현시키는 숙주 세포(즉, 재조합 숙주 세포)를 배양함으로써 생성된다(도 1 및 도 3 참조). 돌연변이 또는 변이 ACC 폴리펩티드의 발현은 지방산, 지방족 에스테르, 지방족 알코올, 지방족 아민, 지방족 알데히드, 이작용성 지방산 유도체, 이산, 탄화수소, 케톤, 알칸, 알켄 또는 올레핀 등의 증가된 수율을 갖는 지방산 유도체 조성물의 생성을 유도한다. 일 구현예에서, 변이 BCCP 폴리펩티드와 같은 돌연변이 또는 변이 ACC 폴리펩티드의 발현은 FAME 및/또는 FAEE를 포함하는 지방족 에스테르 조성물의 증가된 수율을 유도한다. 비-지방산 화합물은 변이 BCCP를 포함하는 변이 ACC 폴리펩티드를 발현시키기에 효과적인 조건들에서 탄소원의 존재 하에서 ACC 변이체를 발현시키는 숙주 세포(즉, 재조합 숙주 세포)를 배양함으로써 생성된다(도 4 참조). 돌연변이 또는 변이 ACC 폴리펩티드의 발현은 폴리케티드, 플라바논, 플라보노이드, 3-하이드록시프로피온산(3-HP), 말로네이트 등을 포함하는 증가된 수율을 갖는 비-지방산 화합물의 생성을 유도한다(도 4 참조).
본 발명의 숙주 세포 또는 미생물은, 효소 활성에 대한 특이적 돌연변이의 효율성을 테스트하기 위해 유전적 변경을 포함하도록 유전적으로 조작된 숙주 균주 또는 숙주 세포(즉, 재조합 세포 또는 미생물)을 포함한다. 다양한 선택적인 유전적 조작(manipulation) 및 변경이, 어떤 원래의 효소 경로들이 원래 숙주 세포에 존재하는지에 따라 한 숙주 세포로부터 다른 숙주 세포로 교환가능하게 사용될 수 있다. 일 구현예에서, 숙주 균주는 ACC 변이체를 테스트하는 데 사용될 수 있다. 숙주 균주는, 발효 성분, 탄소원(예를 들어, 공급원료), 온도, 압력, 감소된 배양 오염 조건, 및 산소 수준을 포함한 배양 조건들을 포함하는(단, 이로 제한되지 않음) 특이적 변수들 및 배양 환경들을 테스트하기 위해 다수의 유전적 변경을 포함할 수 있다.
일 구현예에서, 숙주 균주, 소위 BD64가 사용된다. BD64는 선택적인 fadE 및 fhuA 결실을 포함하는 대장균 균주 MG1655에 기초한다. 아실-CoA 디하이드로게나아제(FadE)는 지방산을 대사시키는 데 중요한 효소이다. 이는 지방산 이용(베타-산화)의 두번째 단계를 촉매화하며, 이는 지방산(아실-CoA)의 긴 사슬들을 아세틸-CoA 분자들로 쪼개는 공정이다. 더 구체적으로, 박테리아에서 지방산 분해의 β-산화 사이클의 두번째 단계는 아실-CoA의 2-엔오일-CoA로의 산화이며, 이는 FadE에 의해 촉매화된다. 대장균에 FadE가 없는 경우, 이는 탄소원으로서 지방산에서 성장할 수 없지만, 아세테이트에서 성장할 수 있다. 여하한의 사슬 길이의 지방산을 이용하는 불가능성(inability)은 fadE 균주들, 즉 FadE 기능이 파괴되는 fadE 돌연변이 균주들의 보고된 표현형과 일치한다. fadE 유전자는 선택적으로 녹아웃(knock out)되거나 감쇠되어, 이 경로에서 중간체일 수 있는 아실-CoA가 세포에 누적될 수 있도록 보장하여, 모든 아실-CoA가 에스테르 신타아제에 의해 지방족 에스테르로 효율적으로 전환될 수 있도록 한다. 하지만, fadE 감쇠는 탄소원으로서 당이 사용될 때 선택적인데, 이는 이러한 조건 하에서 FadE의 발현이 억제될 가능성이 있고, 이에 따라 FadE가 소량만 존재할 수 있으며, 아실-CoA 기질에 대해 에스테르 신타아제와 효율적으로 경쟁할 수 없기 때문이다. FadE는 분해대사물 억제(catabolite repression)로 인해 억제된다. 대장균 및 많은 다른 미생물들이 지방산보다 당의 소모를 선호하므로, 두 공급원들이 이용가능한 경우 fad 레귤론을 억제함으로써 당이 우선적으로 소모된다(D. Clark, J Bacteriol. (1981) 148(2):521-6 참조). 또한, 당의 부재는 FadE 발현을 유도한다. (FadE를 포함한) fad 레귤론에 의해 발현되는 단백질이 상향-조절되고 아실-CoA에 대해 효율적으로 경쟁할 것이기 때문에, 아실-CoA 중간체들이 베타 산화 경로에 대해 손실될 수 있다. 따라서, fadE 유전자가 녹아웃되거나 감쇠되는 것이 유리할 수 있다. 대부분의 탄소원들이 주로 당 기반이기 때문에, FadE를 감쇠시키는 것은 선택적이다. 유전자 fhuA는 TonA 단백질을 코딩하며, 이는 대장균의 외막에서의 에너지-관련 운반체(energy-coupled transporter) 및 수용체이다(V. Braun (2009) J Bacteriol. 191(11):3431-3436). 이것의 결실은 선택적이다. fhuA 결실은 세포로 하여금 특정 발효 조건들에 유리할 수 있는 파지 공격(phage attack)에 대해 더 저항성 있게 한다. 따라서, 발효 진행 시 잠재적 오염을 겪기 쉬운 숙주 세포에 fhuA를 결실시키는 것이 바람직할 수 있다.
또한, 숙주 균주 BD64(위 참조)는 다음의 유전자들 - 대장균으로부터의 fadR, 쥐티푸스균(Salmonella typhimurium)으로부터의 fabA(NP_460041), 쥐티푸스균으로부터의 fabD(NP_460164), 쥐티푸스균으로부터의 fabG(NP_460165), 쥐티푸스균으로부터의 fabH(NP_460163), 콜레라균(Vibrio cholera)으로부터의 fabV(YP_001217283), 및 클로스트리디움 아세토부틸리쿰(Clostridium acetobutylicum)으로부터의 fabF(NP_350156) 중 하나 이상의 선택적인 과발현을 포함한다. 지방산 생합성에서의 조절제 및 효소를 코딩하는 이러한 유전자들 중 하나 이상의 과발현은 다양한 배양 조건들 하에서 지방산 유도체 조성물의 역가를 더 증가시키는 역할을 할 수 있다.
또 다른 구현예에서, 야생형 대장균 균주들 MG1655 또는 W3110이 지방산 유도체의 생성을 위한 예시적인 숙주 세포로서 사용된다. 유사하게, 이러한 숙주 세포는 다양한 배양 조건들 하에서 지방산 유도체 화합물의 역가를 증가시킬 수 있는 하나 이상의 생합성 유전자(즉, 지방산 생합성의 조절제 및 효소를 코딩하는 유전자)의 선택적인 과발현을 제공한다. 유전적 변경은 대장균으로부터의 fadR, 쥐티푸스균으로부터의 fabA(NP_460041), 쥐티푸스균으로부터의 fabD(NP_460164), 쥐티푸스균으로부터의 fabG(NP_460165), 쥐티푸스균으로부터의 fabH(NP_460163), 콜레라균으로부터의 fabV(YP_001217283), 및 클로스트리디움 아세토부틸리쿰으로부터의 fabF(NP_350156)를 포함한다.
몇몇 구현예들에서, 변이 ACC 폴리펩티드를 발현시키는 데 사용되는 숙주 세포 또는 미생물은 하나 이상의 특정 지방산 유도체(들), 예컨대 지방족 에스테르, 지방족 알코올, 지방족 아민, 지방족 알데히드, 이작용성 지방산 유도체, 이산 등(도 1 및 도 3 참조) 그리고 알칸, 알켄 또는 올레핀, 및 케톤에 대한 생성을 증가시킬 수 있는 특정 효소 활성을 포함하는 유전자들을 더 발현시킬 것이다. 일 구현예에서, 숙주 세포는 유전자를 과발현시킴으로써 증가될 수 있는 지방산의 생성을 위해 티오에스테라아제 활성(E.C. 3.1.2.* 또는 E.C. 3.1.2.14 또는 E.C. 3.1.1.5)을 갖는다. 또 다른 구현예에서, 숙주 세포는 지방족 에스테르의 생성을 위해 에스테르 신타아제 활성(E.C. 2.3.1.75)을 갖는다. 또 다른 구현예에서, 숙주 세포는 지방족 알코올의 생성을 위해 아실-ACP 리덕타아제(AAR)(E.C, 1.2.1.80) 활성 및/또는 알코올 디하이드로게나아제 활성(E.C. 1.1.1.1) 및/또는 지방족 알코올 아실-CoA 리덕타아제(FAR)(E.C. 1.1.1.*) 활성 및/또는 카르복실산 리덕타아제(CAR)(E.C. 1.2.99.6) 활성을 갖는다. 또 다른 구현예에서, 숙주 세포는 지방족 알데히드의 생성을 위해 아실-ACP 리덕타아제(AAR)(E.C. 1.2.1.80) 활성을 갖는다. 또 다른 구현예에서, 숙주 세포는 알칸 및 알켄의 생성을 위해 아실-ACP 리덕타아제(AAR)(E.C. 1.2.1.80) 활성 및 디카르보닐라아제 활성을 갖는다. 또 다른 구현예에서, 숙주 세포는 지방족 알코올의 생성을 위해 아실-CoA 리덕타아제(E.C. 1.2.1.50) 활성, 아실-CoA 신타아제(FadD)(E.C. 2.3.1.86) 활성, 및 티오에스테라아제(E.C. 3.1.2.* 또는 E.C. 3.1.2.14 또는 E.C. 3.1.1.5) 활성을 갖는다. 또 다른 구현예에서, 숙주 세포는 지방족 에스테르의 생성을 위해 에스테르 신타아제 활성(E.C. 2.3.1.75), 아실-CoA 신타아제(FadD)(E.C. 2.3.1.86) 활성, 및 티오에스테라아제(E.C. 3.1.2.* 또는 E.C. 3.1.2.14 또는 E.C. 3.1.1.5) 활성을 갖는다. 또 다른 구현예에서, 숙주 세포는 케톤의 생성을 위해 OleA 활성을 갖는다. 또 다른 구현예에서, 숙주 세포는 내부 올레핀의 생성을 위해 OleBCD 활성을 갖는다. 또 다른 구현예에서, 숙주 세포는 지방족 알코올의 생성을 위해 아실-ACP 리덕타아제(AAR)(E.C. 1.2.1.80) 활성 및 알코올 디하이드로게나아제 활성(E.C. 1.1.1.1)을 갖는다. 또 다른 구현예에서, 숙주 세포는 말단 올레핀을 만들기 위해 티오에스테라제(E.C. 3.1.2.* 또는 E.C. 3.1.2.14 또는 E.C. 3.1.1.5) 활성 및 디카르복실라아제 활성을 갖는다. 미생물 및 미생물 세포에서의 효소 활성의 발현은 미국 특허 8,097,439; 8,110,093; 8,110,670; 8,183,028; 8,268,599; 8,283,143; 8,232,924; 8,372,610; 및 8,530,221에 개시되어 있으며, 이들은 본 명세서에서 인용 참조된다.
다른 구현예들에서, 변이 ACC 폴리펩티드를 발현시키는 데 사용되는 숙주 세포 또는 미생물은, 지방족 에스테르, 지방족 알코올, 지방족 아민, 지방족 알데히드, 이작용성 지방산 유도체, 이산 등(도 1 참조)과 같은 하나 이상의 특정 지방산 유도체(들)를 생성하기 위해 상향조절되거나 과발현되는 특정한 원래의 효소 활성을 포함할 것이다. 일 구현예에서, 숙주 세포는 티오에스테라아제 유전자를 과발현시킴으로써 증가될 수 있는 지방산의 생성을 위해 원래의 티오에스테라아제(E.C. 3.1.2.* 또는 E.C. 3.1.2.14 또는 E.C. 3.1.1.5) 활성을 갖는다.
본 발명은 변이 BCCP 폴리펩티드 서열을 포함하는 변이 ACC 폴리펩티드 서열을 발현시키는 숙주 균주 또는 미생물을 포함한다. 숙주 세포에서 발현될 때 지방족 에스테르를 포함하는 지방산 유도체의 더 높은 역가를 유도하는 변이 BCCP 폴리펩티드 서열의 예시들은, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32, SEQ ID NO: 34, SEQ ID NO: 36, SEQ ID NO: 38, SEQ ID NO: 40, SEQ ID NO: 42, SEQ ID NO: 44, SEQ ID NO: 46, SEQ ID NO: 48, SEQ ID NO: 50, SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 58, SEQ ID NO: 60, SEQ ID NO: 62, SEQ ID NO: 64, SEQ ID NO: 66, SEQ ID NO: 68, SEQ ID NO: 70, SEQ ID NO: 72, SEQ ID NO: 74, SEQ ID NO: 76, SEQ ID NO: 78, SEQ ID NO: 80, SEQ ID NO: 82, SEQ ID NO: 84, SEQ ID NO: 86, SEQ ID NO: 88, 및 SEQ ID NO: 90을 포함한다(단, 이로 제한되지 않음).
재조합 숙주 세포는, 지방산 메틸 에스테르(FAME) 또는 지방산 에틸 에스테르(FAEE)와 같은 지방족 에스테르, 지방족 알코올, 지방족 아민, 지방족 알데히드, 이작용성 지방산 유도체, 이산, 알칸, 올레핀, 탄화수소 등; 또는 플라바논, 플라보노이드, 폴리케티드, 말로네이트 또는 3-하이드록시프로피온산과 같은 비-지방산 화합물을 생성할 수 있다. 지방산 유도체 또는 다른 화합물들은 통상적으로 배양 배지로부터 회수되고, 및/또는 숙주 세포로부터 분리된다. 일 구현예에서, 지방산 유도체 또는 다른 화합물들은 배양 배지(세포외)로부터 회수된다. 또 다른 구현예에서, 지방산 유도체 또는 다른 화합물들은 숙주 세포(세포내)로부터 분리된다. 또 다른 구현예에서, 지방산 유도체 또는 다른 화합물들은 배양 배지로부터 회수되고, 숙주 세포로부터 분리된다. 숙주 세포에 의해 생성되는 지방산 유도체 조성물은, 지방산 유도체 조성물의 성분들의 포화도 및 사슬 길이뿐만 아니라 특정 지방산 유도체의 분포를 결정하기 위해, 해당 기술분야에 알려진 방법들, 예를 들어 GC-FID를 이용하여 분석될 수 있다. 유사하게, 해당 기술분야에 잘 알려진 다른 방법들을 통해 다른 화합물들이 분석될 수 있다.
미생물로서 기능하는 숙주 세포들의 예시들은 에스체리치아 속, 바실러스 속, 락토바실러스 속, 자이모모나스 속, 로도코쿠스 속, 슈도모나스 속, 아스페르 길루스 속, 트리코데르마 속, 뉴로스포라 속, 푸사리움 속, 후미콜라 속, 리조무코 르 속, 클루이베로마이세스 속, 피치아 속, 무코르 속, 미셀리오프토라 속, 페니실 리움 속, 파네로카에테 속, 플레우로투스 속, 트라메테스 속, 크리소스포리움 속, 사카로마이세스 속, 스테노트로파모나스 속, 스키조사카로마이세스 속, 야로위아 속, 또는 스트렙토마이세스 속으로부터의 세포들을 포함한다(단, 이로 제한되지 않음). 몇몇 구현예들에서, 숙주 세포는 그람-양성(Gram-positive) 박테리아 세포이다. 다른 구현예들에서, 숙주 세포는 그람-음성(Gram-negative) 박테리아 세포이다. 몇몇 구현예들에서, 숙주 세포는 대장균 세포이다. 다른 구현예들에서, 숙주 세포는 바실러스 렌투스(Bacillus lentus) 세포, 바실러스 브레비스(Bacillus brevis) 세포, 바실러스 스테아로서모필루스(Bacillus stearothermophilus) 세포, 바실러스 리케니포르미스(Bacillus lichenoformis) 세포, 바실러스 알칼로필루스(Bacillus alkalophilus) 세포, 바실러스 코아굴란스(Bacillus coagulans) 세포, 바실러스 키르쿨란스(Bacillus circulans) 세포, 바실러스 푸밀리스(Bacillus pumilis) 세포, 바실러스 투린지엔시스(Bacillus thuringiensis) 세포, 바실러스 클라우시(Bacillus clausii) 세포, 바실러스 메가테리움(Bacillus megaterium) 세포, 바실러스 서브틸리스(Bacillus subtilis) 세포, 또는 바실러스 아밀로리퀴파시엔스(Bacillus amyloliquefaciens) 세포이다.
또 다른 구현예들에서, 숙주 세포는 트리코데르마 코닌지(Trichoderma koningii) 세포, 트리코데르마 비리데(Trichoderma viride) 세포, 트리코데르마 르 에세이(Trichoderma reesei) 세포, 트리코데르마 롱기브라키아텀(Trichoderma longibrachiatum) 세포, 아스페르길루스 아와모리(Aspergillus awamori) 세포, 아스페르길루스 푸미가테스(Aspergillus fumigates) 세포, 아스페르길루스 포에티두스(Aspergillus foetidus) 세포, 아스페르길루스 니둘란스(Aspergillus nidulans) 세포, 아스페르길루스 니게르(Aspergillus niger) 세포, 아스페르길루스 오리재(Aspergillus oryzae) 세포, 후미콜라 인솔렌스(Humicola insolens) 세포, 후미콜라 라누기노세(Humicola lanuginose) 세포, 로도코쿠스오파쿠스(Rhodococcusopacus) 세포, 리조무코르미에헤이(Rhizomucormiehei) 세포, 또는 무코르미에헤이(Mucormichei) 세포이다. 또 다른 구현예들에서, 숙주 세포는 스트 렙토마이세스 리비단스(Streptomyces lividans) 세포 또는 스트렙토마이세스 무리누스(Streptomyces murinus) 세포이다. 또 다른 구현예들에서, 숙주 세포는 방선균(Actinomycetes) 세포이다. 몇몇 구현예들에서, 숙주 세포는 사카로마이세스 세레비지에 세포이다.
다른 구현예들에서, 숙주 세포는 진핵 식물, 조류, 남세균(cyanobacterium), 녹색-황 세균, 녹색 비-황 세균(green non-sulfur bacterium), 자색 황 세균, 자색 비-황 세균, 극한 생물(extremophile), 효모, 균류, 이의 조작된 유기체, 또는 합성 유기체로부터의 세포이다. 몇몇 구현예들에서, 숙주 세포는 광 의존적이거나 탄소를 고정시킨다. 몇몇 구현예들에서, 숙주 세포는 독립영양적 활성을 갖는다.
몇몇 구현예들에서, 숙주 세포는 빛의 존재 하에서와 같이, 광독립영양적 활성(photoautotrophic activity)을 갖는다. 몇몇 구현예들에서, 숙주 세포는 빛의 부재 하에서 종속영양적 또는 혼합영양적이다. 특정 구현예들에서, 숙주 세포는 애기장대(Arabidopsis thaliana), 파니쿰 비르가툼(Panicum virgatum), 미스칸투스 기간테우스(Miscanthus giganteus), 제아 메이스(Zea mays), 보트리오코쿠스 브라우니(Botryococcuse braunii), 녹조류(Chlamydomonas reinhardtii), 두나리엘라 살리나(Dunaliela salina), 시네코코쿠스 종 PCC 7002, 시네코코쿠스 종 PCC 7942, 시네코시스티스 종 PCC 6803, 서모시네코코쿠스 엘롱게이트(Thermosynechococcus elongates) BP-1, 클로로비움 테피둠(Chlorobium tepidum), 클로로프렉수스 아우란티쿠스(Chlorojlexus auranticus), 크로마티움 비노숨(Chromatiumm vinosum), 로도스피릴룸 루브룸(Rhodospirillum rubrum), 로도박 터 캡술라투스(Rhodobacter capsulatus), 로도슈도모나스 파루스리스(Rhodopseudomonas palusris), 클로스트리디움 융달리(Clostridium ljungdahlii), 클로스트리디움 서모셀룸(Clostridium thermocellum), 페니실리움 크리소게눔(Penicillium chrysogenum), 피치아 파스토 리스(Pichia pastoris), 사카로마이세스 세레비지에, 스키조사카로마이세스 폼베(Schizosaccharomyces pombe), 슈도모나스 플루오레센스(Pseudomonas fluorescens), 또는 자이모모나스 모빌리스(Zymomonas mobilis)로부터의 세포이다.
일 구현예에서, 미생물 세포는 프로클로로코쿠스(Prochlorococcus), 시네코 코쿠스, 시네코시스티스, 시아노테세, 및 노스톡 펑크티포르메를 포함하는(단, 이로 제한되지 않음) 시아노박테리아로부터의 세포이다. 또 다른 구현예에서, 미생물 세포는 시네코코쿠스 엘롱가투스 PCC7942, 시네코시스티스 종 PCC6803, 및 시네 코코쿠스 종 PCC7001을 포함하는(단, 이로 제한되지 않음) 특이적 시아노박테리아 종으로부터의 세포이다.
재조합 숙주 세포 및 배양물을 제조하는 방법
숙주 세포를 유전적으로 조작하여 지방산 유도체 및/또는 지방산 유도체 조성물 또는 다른 화합물을 생성하기 위해 해당 기술분야에 잘 알려진 다양한 방법들이 사용될 수 있다. 이러한 방법들은 본 명세서에 설명된 바와 같이 돌연변이 또는 변이 BCCP를 포함하는 돌연변이 또는 변이 ACC를 코딩하는 핵산을 포함하는 벡터, 바람직하게는 발현 벡터의 사용을 포함할 수 있다. 당업자라면, 다양한 바이러스 및 비-바이러스 벡터가 본 명세서에 설명된 방법들에 사용될 수 있음을 알 수 있을 것이다.
본 발명의 몇몇 구현예들에서, 특정 조성물의 지방산 에스테르와 같은 화합물의 더 높은 역가는, 재조합 숙주 세포 배양물에 의해 생성된 특정 유형의 지방산 에스테르 또는 지방산 에스테르의 조합이 대응하는 야생형 숙주 세포의 대조 배양물에 의해 생성된 동일한 지방산 에스테르 또는 지방산 에스테르의 조합에 대해 더 높은 역가이다. 몇몇 구현예들에서, 다른 지방산 유도체 또는 비-지방산 화합물들이 유사한 방식으로 재조합 숙주 세포 배양물에 의해 생성된다. 몇몇 구현예들에서, 돌연변이 또는 변이 accB 폴리뉴클레오티드(또는 유전자)를 포함하는 돌연변이 또는 변이 ACC 폴리뉴클레오티드(또는 유전자) 서열이 폴리뉴클레오티드 서열에 작동가능하게 연결된 프로모터를 포함하는 재조합 벡터에 의해 숙주 세포에 제공된다. 특정 구현예들에서, 프로모터는 발달-조절된, 세포소기관-특이적, 조직-특이적, 유도성, 구성적, 또는 세포-특이적 프로모터이다. 재조합 벡터는 통상적으로 폴리뉴클레오티드 서열에 작동가능하게 연결된 발현 조절 서열; 폴리뉴클레오티드 서열에 작동가능하게 연결된 선택 마커; 폴리뉴클레오티드 서열에 작동가능하게 연결된 마커 서열; 폴리뉴클레오티드 서열에 작동가능하게 연결된 정제 모이어티; 폴리뉴클레오티드 서열에 작동가능하게 연결된 분비 서열; 및 폴리뉴클레오티드 서열에 작동가능하게 연결된 표적화 서열로부터 선택되는 적어도 하나의 서열을 포함한다. 단백질 및 작동가능하게 연결된 조절 서열을 코딩하는 개방형 해독틀을 포함하는 폴리뉴클레오티드 서열은 재조합 숙주 세포의 염색체 내로 통합될 수 있거나, 재조합 숙주 세포에 내재하는 하나 이상의 플라스미드 발현계에 포함될 수 있거나, 둘 모두가 구현될 수 있다.
본 명세서에 설명된 발현 벡터들은 숙주 세포 내에서의 폴리뉴클레오티드 서열의 발현에 적절한 형태로 된 본 명세서에 설명된 폴리뉴클레오티드 서열을 포함한다. 당업자라면, 발현 벡터의 설계가 형질전환될 숙주 세포의 선택, 의도한 폴리펩티드의 발현 수준 등과 같은 요인들에 의존할 수 있다는 것을 이해할 것이다. 본 명세서에 설명된 발현 벡터들은 본 명세서에 설명된 바와 같은 폴리뉴클레오티드 서열에 의해 코딩되는, 융합 폴리펩티드를 포함하는 폴리펩티드를 생성하도록 숙주 세포들에 도입될 수 있다. 흔히, 원핵생물, 예를 들어 대장균에서 폴리펩티드를 코딩하는 유전자의 발현은 대부분 융합 또는 비-융합 폴리펩티드 중 어느 하나의 발현을 지시하는 구성적 또는 유도성 프로모터를 함유하는 벡터들로 수행된다. 원핵 세포 및 진핵 세포 둘 모두에 적절한 발현 시스템들이 해당 기술분야에 잘 알려져 있다; 예를 들어, Sambrook 외, "Molecular Cloning: A Laboratory Manual", second edition, Cold Spring Harbor Laboratory, (1989) 참조. 특정 구현예들에서, 본 발명의 폴리뉴클레오티드 서열은 박테리오파지 T5로부터 유래된 프로모터에 작동가능하게 연결된다. 일 구현예에서, 숙주 세포는 효모 세포이다. 이 구현예에서, 발현 벡터는 효모 발현 벡터이다. 벡터들은 외래(foreign) 핵산(예를 들어, DNA)을 숙주 세포 내로 도입하기 위하여 본 기술분야에서 인정되는 다양한 기술들을 통해 원핵 세포 또는 진핵 세포 내로 도입될 수 있다. 숙주 세포를 형질전환 또는 형질감염(transfecting)시키는 적절한 방법들은, 예를 들어 Sambrook 외에서 찾아볼 수 있다(위 참조).
박테리아 세포들의 안정한 형질전환을 위하여, 사용되는 발현 벡터 및 형질전환 기술에 따라, 세포들의 일부만이 발현 벡터를 흡수하고 복제하는 것으로 알려져 있다. 이 형질전환체들을 식별하고 선택하기 위하여, 선별가능한 마커(예를 들어, 항생제에 대한 내성)를 코딩하는 유전자가 관심 유전자와 함께 숙주 세포 내로 도입될 수 있다. 선별가능한 마커들은 암피실린, 카나마이신, 클로람페니콜, 또는 테트라사이클린과 같은(단, 이로 제한되지 않음) 약물들에 대한 내성을 부여하는 것들을 포함한다. 선택가능한 마커를 코딩하는 핵산들은 본 명세서에서 설명되는 폴리펩티드를 코딩하는 벡터와 동일한 벡터에서 숙주 세포 내로 도입될 수 있거나, 또는 별개의 벡터에 도입될 수 있다. 도입된 핵산으로 안정적으로 형질전환된 세포는 적절한 선택 약물의 존재 하에서 성장에 의해 식별될 수 있다.
재조합 숙주 세포의 배양물 및 발효
본 명세서에서 사용되는 바와 같이, "발효"라는 용어는 광범위하게 숙주 세포에 의한 유기 물질의 표적 물질로의 전환, 예를 들어 탄소원을 포함하는 배지에서 재조합 숙주 세포의 배양물을 증식시킴으로써 재조합 숙주 세포에 의한 탄소원의 지방산 또는 이의 유도체로의 전환을 지칭한다. 본 명세서에서 사용되는 바와 같이, "생성을 위하여 허용되는 조건들"이라는 용어는 숙주 세포로 하여금 의도한 생성물, 예컨대 지방산 유도체 및 다른 비-지방산 화합물을 포함하는 말로닐-CoA 유래 화합물을 생성하게 하는 여하한의 조건들을 지칭한다. 이와 유사하게, "벡터의 폴리뉴클레오티드 서열이 발현되는 조건들"이라는 용어는 숙주 세포로 하여금 폴리펩티드를 합성하게 하는 여하한의 조건들을 의미한다. 적절한 조건들은, 예를 들어 발효 조건들을 포함한다. 발효 조건들은 온도 범위, 통기 수준, 공급량(feed rate), 및 배지 조성물을 포함하는(단, 이로 제한되지 않음) 다수의 파라미터를 포함할 수 있다. 이러한 조건들의 각각은 개별적으로 그리고 조합하여 숙주 세포가 성장하게 한다. 발효는 호기성, 혐기성, 또는 [미-호기성(micro-aerobic)과 같은] 이의 변이성(variation)일 수 있다. 예시적인 배양 배지는 브로쓰 또는 겔을 포함한다. 일반적으로, 배지는 숙주 세포에 의해 직접적으로 대사될 수 있는 탄소원을 포함한다. 또한, 효소들이 탄소원의 가동화(mobilization)[예를 들어, 전분 또는 셀룰로오스의 발효성 당들로의 해중합(depolymerization)] 및 후속 대사를 가능하게 하도록 배지에서 사용될 수 있다.
소규모 생성을 위해, 조작된 숙주 세포들은 예를 들어 약 100 μL, 200 μL, 300 μL, 400 μL, 500 μL, 1 mL, 5 mL, 10 mL, 15 mL, 25 mL, 50 mL, 75 mL, 100 mL, 500 mL, 1 L, 2 L, 5 L 또는 10 L의 뱃치(batch)에서 성장될 수 있고; 발효될 수 있으며; 의도한 폴리뉴클레오티드 서열, 예컨대 ACC 변이 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열을 발현시키도록 유도될 수 있다. 대규모 생성을 위해, 조작된 숙주 세포들은 약 10 L, 100 L, 1000 L, 10,000 L, 100,000 L 및 1,000,000 L 또는 그 이상의 부피의 뱃치를 갖는 배양물에서 성장될 수 있고; 발효될 수 있으며; 의도한 폴리뉴클레오티드 서열을 발현시키도록 유도될 수 있다. 본 명세서에서 설명되는 지방산 유도체 조성물 또는 다른 화합물들은 재조합 숙주 세포 배양물의 세포외 환경에서 발견될 수 있고, 배양 배지로부터 쉽게 분리될 수 있다. 지방산 유도체는 재조합 숙주 세포에 의해 분비될 수 있고, 세포외 환경으로 수송될 수 있거나, 또는 수동적으로 재조합 숙주 세포 배양물의 세포외 환경으로 전달될 수 있다. 일 구현예에서, 지방족 에스테르 조성물은 해당 기술분야에 알려진 통상의 방법들을 이용하여 재조합 숙주 세포 배양물로부터 분리될 수 있다. 여하한의 비-지방산 화합물들이 세포외에서 또는 세포내에서 생성될 수 있다.
재조합 숙주 세포의 스크리닝
본 발명의 일 구현예에서, 돌연변이 또는 변이 ACC 폴리펩티드의 활성은 (하나 이상의 돌연변이유발된 또는 변이 ACC 폴리뉴클레오티드 서열을 포함하는) 재조합 숙주 세포를 배양함으로써 결정되며, 이후 재조합 숙주 세포에 의해 생성된, 예를 들어 지방산 유도체 조성물 또는 다른 화합물들의 특징들; 예를 들어, 지방산 유도체 또는 다른 화합물들의 역가, 수율 및 생산성을 식별하기 위해 스크리닝이 후속된다. 또 다른 구현예에서, 돌연변이 또는 변이 ACC 폴리펩티드의 활성은 (하나 이상의 돌연변이유발된 또는 변이 ACC 폴리뉴클레오티드 서열을 포함하는) 재조합 숙주 세포를 배양함으로써 결정되며, 이후 재조합 숙주 세포에 의해 생성된, 예를 들어 지방산 유도체 조성물(예를 들어, 지방족 에스테르, 지방족 알코올, 지방산 알데히드 등) 또는 다른 화합물들의 특징들; 예를 들어, 지방산 유도체 또는 다른 화합물들의 역가, 수율 및 생산성을 식별하기 위해 스크리닝이 후속된다. 돌연변이 또는 변이 ACC 폴리펩티드 또는 돌연변이 또는 변이 BCCP 폴리펩티드 및 이의 단편은 통상의 방법들을 이용하여 말로닐-CoA 유래 화합물의 개선된/증가된 생성 및/또는 개선된 ACC 활성에 대해 검사될(assay) 수 있다. 예를 들어, 돌연변이 또는 변이 ACC 폴리펩티드 또는 BCCP 폴리펩티드 또는 이의 단편은 폴리펩티드가 기능하게 하는 조건들 하에서 기질(예를 들어, 아실-CoA, 아실-ACP, 유리 지방산, 알코올)과 접촉된다. 일 구현예에서, ACC 활성을 결정하기 위해 기질의 수준의 감소 또는 지방족 에스테르 또는 지방족 에스테르 조성물의 수준의 증가가 측정될 수 있다. 이는 지방족 알코올, 지방족 알데히드, 지방족 아민 및 다른 지방산 유도체 그리고 다른 화합물의 생성에도 동일하게 적용된다.
재조합 미생물들로부터 유도된 생성물
본 명세서에서 사용되는 바와 같이, "현대 탄소의 분율" 또는 fM은 각각 옥살산 표준 HOxI 및 HOxII로 알려져 있는 미국 국립표준기술연구소(National Institute of Standards and Technology: NIST) 표준 물질(Standard Reference Material: SRM) 4990B 및 4990C에 의해 정의된 것과 동일한 의미를 갖는다. 기본적인 정의는 (AD 1950을 기준으로) 0.95 배의 14C/12C 동위원소 비율 HOxI에 관한 것이다. 이는 붕괴-보정된 산업혁명-전 목재(decay-corrected pre-Industrial Revolution wood)와 거의 등가이다. 현재 생존 생물권(living biosphere)(식물 재료)에 대하여, fM은 약 1.1이다.
생물학적으로 생성되는 유기 화합물을 포함하는 바이오생성물(예를 들어, 본 발명에 따라 생성되는 지방산 유도체 조성물 또는 비-지방산 조성물), 및 특히 본 명세서에 설명된 지방산 생합성 경로를 이용하여 생성되는 지방족 에스테르 조성물은 재생가능한 탄소원로부터 생성되었으며, 이를테면 새로운 물질의 조성물이다. 이러한 새로운 바이오생성물은 이중 탄소-동위원소 핑거프린팅(dual carbon-isotopic fingerprinting) 또는 14C 연대측정(dating)에 기초하여 석유화학의 탄소로부터 유래되는 유기 화합물과 구별될 수 있다. 추가적으로, 생물자원 탄소(biosourced carbon)의 특이적 공급원(예를 들어, 글루코오스 대 글리세롤)은 이중 탄소-동위원소 핑거프린팅에 의해 결정될 수 있다(예를 들어, 미국 특허 7,169,588 참조). 석유 기반 유기 화합물과 바이오생성물을 구별하는 능력은 상업적으로(in commerce) 이러한 물질들을 추적하는 데 유익하다. 예를 들어, 생물학적 기반 및 석유 기반 탄소 동위원소 프로파일 둘 모두를 포함하는 유기 화합물 또는 화학물질들은 석유 기반 물질들로만 만들어진 유기 화합물 및 화학물질들과 구별될 수 있다. 따라서, 본 명세서의 바이오생성물은 이들의 특유한 탄소 동위원소 프로파일에 기초하여 상업적으로 후속되거나 추적될 수 있다. 바이오생성물은 각 샘플의 안정한 탄소 동위원소 비율(13C/12C)을 비교함으로써 석유 기반 유기 화합물과 구별될 수 있다. 주어진 바이오생성물의 13C/12C 비율은, 이산화탄소가 고정된 시간에 대기 중의 이산화탄소에서의 13C/12C 비율의 결과이다. 또한, 이는 정확한 대사 경로를 반영한다. 또한, 국부적인 변이들도 일어난다. 석유, C3 식물(활엽), C4 식물(목초), 및 해양 탄산염(marine carbonate)이 모두 13C/12C 및 대응하는 δ13C 값들에서 상당한 차이를 나타낸다. C4 및 C3 식물들이 모두 13C/12C 동위원소 비율의 범위를 나타내지만, 통상적인 값들은 C4 식물에 대해 약 -7 내지 약 -13 퍼밀(per mil)이고, C3 식물에 대해 약 -19 내지 약 -27 퍼밀이다(예를 들어, Stuiver 외, Radiocarbon 19:355 (1977) 참조). 석탄 및 석유는 일반적으로 이 후자의 범위에 속한다.
일련의 대안적인 RM가 IAEA, USGS, NIST 및 다른 선택된 국제 동위원소 실험실과 협력하여 개발되었다. PDB로부터의 퍼밀 편차에 대한 표기는 δ13C이다. 질량 44, 45 및 46의 분자 이온들에 대한 고정밀 안정 비율 질량 분석(high precision stable ratio mass spectrometry)(IRMS)에 의해 CO2에 대해 측정이 행해진다. 본 명세서에서 설명되는 조성물들은 본 명세서에서 설명되는 방법들 중 어느 하나에 의해 생성되는 지방족 에스테르 조성물 및 생성물을 포함한다. 구체적으로, 지방족 에스테르 조성물 또는 생성물은 약 -28 이상, 약 -27 이상, -20 이상, -18 이상, -15 이상, -13 이상, -10 이상, 또는 -8 이상의 δ13C를 가질 수 있다. 예를 들어, 지방족 에스테르 조성물 또는 생성물은 약 -30 내지 약 -15, 약 -27 내지 약 -19, 약 -25 내지 약 -21, 약 -15 내지 약 -5, 약 -13 내지 약 -7, 또는 약 -13 내지 약 -10의 δ13C를 가질 수 있다. 다른 경우들에서, 지방족 에스테르 조성물 또는 생성물은 약 -10, -11, -12 또는 -12.3의 δ13C를 가질 수 있다. 또한, 본 명세서의 기재내용에 따라 생성되는 지방족 에스테르 조성물 및 생성물은 각 화합물의 14C의 양을 비교함으로써 석유 기반 유기 화합물과 구별될 수 있다. 14C는 핵 반감기가 5730년이기 때문에, "더 오래된" 탄소를 함유한 석유 기반 연료가 "더 새로운" 탄소를 함유한 지방족 에스테르 조성물 및 생성물과 구별될 수 있다(예를 들어, Currie, "Source Apportionment of Atmospheric Particles", Characterization of Environmental Particles, J. Buffle and H. P. van Leeuwen, Eds., 1 of Vol. I of the IUPAC Environmental Analytical Chemistry Series (Lewis Publishers, Inc.) 3-74, (1992) 참조).
방사성탄소 연대측정법(radiocarbon dating)의 기본적인 가정은 대기 중의 14C 농도의 항상성(constancy)이 생물(living organism)의 14C의 항상성을 유도한다는 것이다. 하지만, 1950년 이후부터의 대기권 핵실험 및 1850년 이후부터의 화석 연료의 연소로 인하여, 14C는 제 2의, 지구화학적인 시간 특성을 얻었다. 대기 CO2 및 이에 따른 생물권(living biosphere)에서의 그 농도는 1960년대 중반의 핵실험 피크의 거의 두 배였다. 이후, 7년 내지 10년의 근사적 이완 "반-감기"(approximate relaxation "half-life")를 갖는, 약 1.2×10-12의 정상-상태 우주기원(steady-state cosmogenic) (대기) 기준 동위원소 비율(14C/12C)로 점진적으로 복귀되었다. (이 후자의 반감기가 문자 그대로 받아들여져야 하는 것이 아니라; 그보다는 핵무기 시대의 시작 이후로 대기권 및 생물권의 14C의 변이성을 추적하기 위해 상세한 대기 핵 투입/붕괴의 함수(detailed atmospheric nuclear input/decay function)를 사용하여야 한다. 이는 최근 생물권 탄소의 매년 연대측정의 가능성(promise of annual dating)을 지속하는 후자의 생물권 14C 시간 특성이다. 14C는 "현대 탄소의 분율"(fM)의 단위로 주어지는 결과들을 갖는 가속기 질량 분광 분석(accelerator mass spectrometry: AMS)에 의해 측정될 수 있다. 본 명세서에서 설명되는 지방족 에스테르 조성물 및 생성물은 적어도 약 1의 fM 14C를 가질 수 있는 바이오생성물을 포함한다. 예를 들어, 본 발명의 바이오생성물은 적어도 약 1.01의 fM 14C, 약 1 내지 약 1.5의 fM 14C, 약 1.04 내지 약 1.18의 fM 14C, 또는 약 1.111 내지 약 1.124의 fM 14C를 가질 수 있다.
14C의 또 다른 측정은 pMC(percent of modern carbon)로 알려져 있다. 14C 연대를 이용하는 고고학자 또는 지질학자에 대하여, AD 1950년은 "0의 해(zero years old)"와 같다. 또한, 이는 100 pMC를 나타낸다. 대기 중의 "핵무기 탄소(bomb carbon)"는 열-핵무기의 피크에서 1963년의 통상 수준의 거의 두 배에 달하였다. 대기권 내의 이의 분포는 이의 출연 이후로 근사화되었으며, AD 1950년 이후로 살아 있는 식물들 및 동물들에 대하여 100 pMC보다 더 큰 값을 나타낸다. 이는 시간이 지나면서 107.5 pMC 부근인 현재의 값으로 점차 감소하였다. 이는 옥수수와 같은 신선한(fresh) 바이오매스 물질이 107.5 pMC 부근의 14C 시그너처(signature)를 제공한다는 것을 의미한다. 석유 기반 화합물들은 0의 pMC 값을 가질 것이다. 오늘날의 탄소와 화석 탄소의 조합은 오늘날의 pMC 함량의 희석을 유도할 것이다. 107.5 pMC가 오늘날의 바이오매스 물질의 14C 함량을 나타내고 0 pMC가 석유 기반 생성물의 14C 함량을 나타낸다고 가정함으로써, 물질에 대해 측정된 pMC 값은 두 성분 유형의 비율을 반영할 것이다. 예를 들어, 오늘날의 콩으로부터 100 % 유래된 물질은 107.5 pMC 부근의 방사성탄소 시그너처를 제공할 것이다. 그 물질이 석유 기반 생성물로 50 % 희석되었다면, 이는 약 54 pMC의 방사성탄소 시그너처를 제공할 것이다. 생물학적 기반 탄소 함량은 107.5 pMC와 같은 "100 %", 및 0 pMC와 같은 "0 %"를 할당함으로써 유래된다. 예를 들어, 99 pMC를 측정한 샘플은 93 %의 등가의 생물학적 기반 탄소 함량을 제공할 것이다. 이 값은 평균 생물학적 기반 탄소 결과로 지칭되며, 오늘날의 생물학적 물질 또는 석유 기반 물질 중 어느 하나로부터 비롯된 분석된 물질 내의 모든 성분을 가정한다. 본 명세서에서 설명되는 바와 같은 하나 이상의 지방족 에스테르를 포함하는 바이오생성물은 적어도 약 50, 60, 70, 75, 80, 85, 90, 95, 96, 97, 98, 99 또는 100의 pMC를 가질 수 있다. 다른 경우에, 본 명세서에서 설명되는 지방족 에스테르 조성물은 약 50 내지 약 100; 약 60 내지 약 100; 약 70 내지 약 100; 약 80 내지 약 100; 약 85 내지 약 100; 약 87 내지 약 98; 또는 약 90 내지 약 95의 pMC를 가질 수 있다. 또 다른 경우에, 본 명세서에서 설명되는 지방족 에스테르 조성물은 약 90, 91, 92, 93, 94, 또는 94.2의 pMC를 가질 수 있다.
지방족 에스테르 조성물
지방족 에스테르의 예시들은 지방산 에스테르, 예컨대 FAEE 및 FAME를 포함하는 짧은 사슬형 알코올로부터 유래되는 것들 그리고 더 긴 사슬형 지방족 알코올로부터 유래되는 것들을 포함한다. 생성되는 지방족 에스테르 및/또는 지방족 에스테르 조성물은 바이오연료(예를 들어, 바이오디젤), 공업용 화학물질, 또는 바이오연료 또는 공업용 화학물질의 성분 또는 이에 대한 공급원료로서 개별적으로 또는 적절히 조합하여 사용될 수 있다. 몇몇 측면들에서, 본 발명은, 예를 들어 FAEE, FAME를 포함하는 하나 이상의 지방산 에스테르 및/또는 더 긴 사슬형 알코올의 다른 지방산 에스테르 유도체를 포함하는 지방족 에스테르 조성물을 생성하는 방법에 관한 것이다. 관련 측면에서, 상기 방법은 FAME, FAEE, 지방산 프로필 에스테르, 지방산 이소프로필 에스테르, 지방산 부틸 에스테르, 모노글리세라이드, 지방산 이소부틸 에스테르, 지방산 2-부틸 에스테르 및 지방산 3차-부틸 에스테르 등을 포함하는(단, 이로 제한되지 않음) 지방족 에스테르 및 지방족 에스테르 조성물을 제조하는 데 적합한 유전적으로 조작된 생성 숙주를 포함한다.
에스테르는 다수의 상업적인 용도를 갖는다. 예를 들어, 대체 연료인 바이오디젤은 에스테르[예를 들어, 지방산 메틸 에스테르(FAME), 지방산 에틸 에스테르(FAEE) 등]로 이루어져 있다. 몇몇 저 분자량의 에스테르는 방향제 또는 착향료로서 유용하게 하는 기분 좋은 냄새를 갖는 휘발성이다. 또한, 에스테르는 래커, 페인트 및 바니쉬에 대한 용매로서 사용된다. 또한, 왁스, 지방 및 오일과 같이 자연적으로 발생하는 몇몇 물질이 에스테르로 이루어진다. 또한, 에스테르는 수지 및 플라스틱의 연화제, 가소제, 난연제, 및 가솔린 및 오일의 첨가제로서 사용된다. 또한, 에스테르는 중합체, 필름, 직물, 염료, 및 의약품의 제조에도 사용될 수 있다.
일반적으로, 지방족 에스테르 또는 지방족 에스테르 조성물은 숙주 세포의 세포외 환경으로부터 분리된다. 몇몇 구현예들에서, 지방족 에스테르 또는 지방족 에스테르 조성물은 숙주 세포로부터 부분적으로 또는 완전히 동시에 분비된다. 대안적인 구현예들에서, 지방족 에스테르 또는 지방족 에스테르 조성물은, 선택적으로 하나 이상의 수송 단백질의 도움으로, 세포외 환경 내로 수송된다. 또 다른 구현예들에서, 지방족 에스테르 또는 지방족 에스테르 조성물은 세포외 환경 내로 수동적으로 수송된다.
지방족 알코올 조성물
지방족 알코올의 예시들은 포화-, 불포화-, 직쇄형-, 및 분지쇄형 지방족 알코올을 포함한다. 생성되는 지방족 알코올 및/또는 지방족 알코올 조성물은 세제, 공업용 화학물질, 또는 공업용 화학물질의 성분 또는 이에 대한 공급원료로서 개별적으로 또는 적절히 조합하여 사용될 수 있다. 몇몇 측면들에서, 본 발명은, 예를 들어 더 짧은 및 더 긴 사슬형 지방족 알코올을 포함하는 하나 이상의 지방족 알코올을 포함하는 지방족 알코올 조성물을 생성하는 방법에 관한 것이다. 관련 측면에서, 상기 방법은 지방족 알코올 및 지방족 알코올 조성물을 제조하는 데 적합한 생성 숙주를 포함한다.
상기 방법들은 C6 내지 C26 지방족 알코올을 포함하는 지방족 알코올을 생성할 수 있다. 몇몇 구현예들에서, 지방족 알코올은 C6, C7, C8, C9, C1O, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C21, C22, C23, C24, C25 및/또는 C26 지방족 알코올을 포함한다. 특정 구현예들에서, 지방족 알코올은 1-데칸올, 1-도데칸올, 1-미리스틸 알코올, 1-헥사데칸올, 옥타데센올, 테트라데센올 또는 헥사데센올이다. 다른 구현예들에서, 지방족 알코올은 직쇄형 지방족 알코올이다. 다른 구현예들에서, 지방족 알코올은 분지쇄형 지방족 알코올이다. 또 다른 구현예들에서, 지방족 알코올은 사이클릭 모이어티를 포함한다. 몇몇 구현예들에서, 지방족 알코올은 불포화 지방족 알코올이다. 다른 구현예들에서, 지방족 알코올은 단일불포화 지방족 알코올이다. 또 다른 구현예들에서, 지방족 알코올은 포화 지방족 알코올이다. 또 다른 측면에서, 본 발명은 본 명세서에 설명되는 미생물들 중 어느 하나 또는 방법들 중 어느 하나에 의해 생성되는 지방족 알코올, 또는 본 명세서에 설명되는 미생물들 중 어느 하나 또는 방법들 중 어느 하나에 의해 생성되는 지방족 알코올을 포함하는 계면 활성제를 특성화한다. 몇몇 구현예들에서, 지방족 알코올은 약 -15.4 이상의 δ13C를 갖는다. 특정 구현예들에서, 지방족 알코올은 약 -15.4 내지 약 -10.9 또는 약 -13.92 내지 약 -13.84의 δ13C를 갖는다. 몇몇 구현예들에서, 지방족 알코올은 적어도 약 1.003의 fM 14C를 갖는다. 특정 구현예들에서, 지방족 알코올은 적어도 약 1.01 또는 적어도 약 1.5의 fM 14C를 갖는다. 몇몇 구현예들에서, 지방족 알코올은 약 1.111 내지 약 1.124의 fM 14C를 갖는다.
지방족 알코올은 많은 상업적인 용도를 갖는다. 짧은 사슬형 지방족 알코올들은 유화제, 연화제 및 증점제로서 화장품 및 식품 산업에 사용된다. 이들의 양친매성 성질로 인해, 지방족 알코올들은 비이온성 계면활성제처럼 거동하고, 상기 비이온성 계면활성제는 세제로서 유용하다. 또한, 지방족 알코올들은 왁스, 검, 수지, 의약용 로션, 윤활유 첨가제, 직물 정전기 방지제 및 가공제, 가소제, 화장품, 공업 용매 및 지방용 용매에 사용된다.
일반적으로, 지방족 알코올 또는 지방족 알코올 조성물은 숙주 세포의 세포외 환경으로부터 분리된다. 몇몇 구현예들에서, 지방족 알코올 또는 지방족 알코올 조성물은 숙주 세포로부터 부분적으로 또는 완전히 동시에 분비된다. 대안적인 구현예들에서, 지방족 알코올 또는 지방족 알코올 조성물은, 선택적으로 하나 이상의 수송 단백질의 도움으로, 세포외 환경 내로 수송된다. 또 다른 구현예들에서, 지방족 알코올 또는 지방족 알코올 조성물은 세포외 환경 내로 수동적으로 수송된다.
실시예들
다음의 특정 실시예들은 본 발명을 예시하기 위해 의도된 것이며, 청구항의 범위를 제한하는 것으로 해석되어서는 안 된다.
본 발명을 예시하기 위하여, 개선된 FAME 생성을 위해 원래 대장균 ACC 효소를 개선하는, 즉 더 높은 역가 및 수율을 달성하는 두 가지 상이한 방법이 개발되었다. 4 개의 모든 대장균 ACC 유전자의 증가된 발현이 지방산 생성을 개선할 수 있다는 것은 문헌에 알려져 있지만, accB 유전자의 표적 돌연변이 및 accBC 오페론의 표적 발현 변화가 FAME 생성을 개선할 수 있다는 것을 발견한 것은 놀라운 일이었다.
프로토콜:
1.
accBC에
대한 균주 구성
생성 숙주 균주, 소위 BD64(위 참조)가 accBC를 발현시키는 데 사용되었다. 생성 숙주 균주는 accBC의 발현에 대해 테스트하기 위해 수 개의 유전적 조작(genetic manipulation)을 포함하였다. accBC 오페론을 함유한 염색체 부위가 변형되었다. 유전적 조작은 ACC 보체계(complementation system)의 존재 하에서 수행되었다. 말로네이트가 10 mM 공급되었고, 동시에 리조비움 트리폴 리(Rhizobium trifolii)로부터의 2 개의 말로네이트 이용 유전자 matB 및 matC가 낮은 카피 플라스미드(low copy plasmid)로부터 발현되었다. 이러한 유전자들은 표준 조작 기술들을 이용하여 pKD46 통합 플라스미드에서 구성적 프로모터 뒤에 클로닝되었다. 선택적 플레이트들이 10 mM 말로네이트를 함유한 것을 제외하고는, accBC 오페론이 녹아웃되었다(Datsenko 외 (2000) Proceedings of the National Academy of Sciences 97(12):6640-6645 참조). 변형된 accBC 오페론은, 선택적 플레이트에 말로네이트가 결여된 것을 제외하고는 동일한 절차를 이용하여 통합되었다.
2.
accB에
대한 균주 구성
생성 숙주 균주, 소위 BD64(위 참조)가 accB를 발현시키는 데 사용되었다. accBC의 구성(위 참조)에 사용된 동일한 전략을 이용하여 accB 유전자를 함유한 염색체 부위가 변형되었다.
3. ACC FAME 생성 검사
대장균 ACC 효소 활성에 대한 변화가 FAME 생성 시스템을 이용하여 검사되었다. 의도한 ACC 돌연변이(들)를 함유한 균주 BD64(위 참조)가 에스테르 신타아제(ES) 플라스미드, 소위 pKEV13으로 형질전환되었다. 플라스미드 pKEV13은 마리노박터 하이드로카보노클라스티쿠스(Marinobacter hydrocarbonoclasticus) ATCC 49840으로부터의 에스테르 신타아제 유전자 및 상업적 pTrc 프로모터(Life Technologies)를 플라스미드 pCL1920(Lerner 외 (1990) Nucleic acids research 18(15):4631)으로 클로닝함으로써 구성되었다. 균주들은 발효되었고, 추출되었으며, 아래에 자세히 설명된 표준 절차들에 따라 FAME 생성이 측정되었다.
발효는 다음과 같이 수행되었다; 96 웰 플레이트(well plate)에서 성장된 LB 배양물로부터, 30 μL의 LB 배양물이 270 μL의 FA2P 배지에 접종(inoculate)하는 데 사용되었으며, 이는 이후 진탕 배양기에서 32 ℃로 약 16 시간 동안 배양되었다. 하룻밤이 지난 씨드(overnight seed)의 30 μL가 2 % 메탄올 및 1mM IPTG를 함유한 300 μL의 FA4P 배지에 접종하는 데 사용되었다. FA2P 및 FA4P 배지 둘 모두는 (각각) 0.2 g/L 또는 0.4 g/L의 포스페이트를 함유한 변형된 M9 최소 배지이다. FA2P 및 FA4P 배지 둘 모두의 탄소원은 50 g/L 글루코오스이다. 배양물들이 아래에 자세히 설명된 표준 추출 프로토콜을 따라 추출되었을 때, 배양물들은 진탕 배양기에서 32 ℃로 24 시간 동안 배양되었다.
추출은 다음과 같이 수행되었다; 각각의 웰에 40 μL의 1M HCl이 추출되게 하기 위해, 이후 내부 표준으로서 500 mg/L C11-FAME을 갖는 300 μL의 부틸 아세테이트가 첨가되었다. 96 웰 플레이트는 플레이트 실러(plate sealer)(ALPS-300; Abgene, ThermoScientific, Rockford, IL)를 이용하여 열-융착되었고(heat-sealed), MIXMATE(Eppendorf, Hamburg, Germany)를 이용하여 2000 rpm으로 15 분 동안 진탕되었다. 진탕 후, 플레이트는 실온에서 4500 rpm으로 10 분 동안 원심분리되어(Allegra X-15R, rotor SX4750A, Beckman Coulter, Brea, CA), 수성 및 유기 층들을 분리하였다. 50 μL의 유기 층이 96 웰 플레이트(96-웰 플레이트, 폴리프로필렌, Corning, Amsterdam, The Netherlands)로 이동되었다. 플레이트는 열-융착되었고, 이후 GC-FID(gas chromatography flame ionization detector)에 의해 평가될 때까지 -20 ℃로 저장되었다.
FAME 정량화(quantification)의 추출은 다음과 같이 수행되었다; 1 μL의 샘플이 FID(flame ionization detector)를 갖는 Trace GC Ultra(Thermo Fisher Scientific, Waltham, MA)에서 UFM 컬럼(column)(cat #: UFMC00001010401, Thermo Fisher Scientific, Waltham, MA) 상으로 주입되었다. 장비는, C8 내지 C18 FAME을 검출하고 C12 내지 C18 β-OH FAME을 정량화하도록 셋업되었다.
실시예
1:
accB
의
돌연변이가 FAME 생성을 증가시킴
accB 유전자의 오류 유발 라이브러리가 구축되었고, 야생형 유전자를 넘어서는 개선을 나타낸 변이체들에 대해 스크리닝되었다. 표 3은 최적의 변이체들의 요약을 나타낸다. accB 유전자의 오류 유발 라이브러리는 상업적으로 이용가능한 키트(Genemorph II, Agilent Technologies)를 이용하여 구축되었다. accB 유전자는 SOE PCR 기술을 이용하여 적절한 상동 부위에 결합되었고, 라이브러리는 프로토콜 1에 설명된 바와 같은 대장균 염색체 내로 통합되어, 원래 대장균 accB 유전자를 대체하였다. 오류-유발 라이브러리는 프로토콜 2에 따라 스크리닝되었다.
표 3: FAME 생성을 위한 accB의 변이체들
표 3의 컬럼들은 변이체의 원래 웰 위치, 대조군을 넘어서는 FAME 역가 개선, 및 각 변이체에서의 아미노산 및 DNA 코돈 변화를 나타낸다. 표 3의 결과는 아미노산 위치 2의 돌연변이가 역가의 최대 증가를 달성할 수 있음을 시사한다. 웰 5A02는 정상적인 ACC 활성의 435 %의 역가의 증가를 나타내었다.
다음, 어느 개별 위치 및 돌연변이가 가장 큰 개선을 제공하는 지를 결정하기 위해 표적 부위-포화 돌연변이유발이 수행되었다. 실제로 accB의 (개시 코돈 바로 다음의) 위치 2의 돌연변이가 FAME 역가의 가장 큰 증가를 제공하는 것으로 결정되었다. 야생형 accB는 아스파르트산(Asp, D)을 코딩하는 위치 2에서 GAT 코돈을 함유한다. 표 1(위 참조)은 accB 위치 2에 대한 최적의 변이체들의 요약을 나타낸다. 부위-포화 라이브러리는 두 번째 accB 위치에서 변성 염기 NNN을 함유하는 올리고뉴클레오티드 프라이머를 이용하여 구축되었다. accB 유전자는 SOE PCR 기술을 이용하여 적절한 상동 부위에 결합되었고, 라이브러리는 프로토콜 1에 설명된 바와 같은 대장균 염색체 내로 통합되어, 원래 대장균 accB 유전자를 대체하였다. 오류-유발 라이브러리는 프로토콜 2에 따라 스크리닝되었다. 표 1(위 참조)에서 알 수 있는 바와 같이, 정상적인 ACC 활성의 최대 630 %의 역가의 증가가 돌연변이 D2H에서 관찰되었다. 도 5는 이러한 조사결과들을 더욱 반영하며, mg/L의 FAS 역가를 나타내는 그래프를 나타낸다. 더 구체적으로, 상기 도면은 대장균 숙주 세포에서 (accB 유전자의 위치 2에) 다양한 BCCP 변이체를 발현시킨 결과로서의 FAS 역가(FAME)를 나타낸다. WT는 야생형 ACC 복합체에 대한 대조군이다. 이러한 BCCP 변이체들의 일부는 5-배가 넘게 FAS 역가를 개선하였다(또한, 표 1 참조). 이 조사결과들은, BCCP 변이체들이 지방산 유도체를 생성할 때 전체 ACC 복합체를 능가하였기 때문에 놀라웠다. 동일한 아미노산 치환을 코딩하는 상이한 코돈들이 테스트되었고, 효과는 동일한 것으로 나타났으며, 말로닐-유래 화합물, 이 경우 지방산 유도체를 증가시키는 효과가 BCCP의 아미노산 변화와 상관되어 있었음을 확인하였다.
실시예
2:
accBC
오페론의
발현 변형이 FAME 생성을 증가시킴
accBC 오페론의 발현 라이브러리가 구축되었고, 야생형 accBC 프로모터를 넘어서는 개선을 나타낸 변이체들에 대해 스크리닝되었다. 표 2(위 참조)는 최적의 변이체들의 요약을 나타낸다. 라이브러리는, 원래 accBC 프로모터 부위를, 무작위 돌연변이를 도입하도록 변성 뉴클레오티드를 함유한 박테리오파지 T5 프로모터 라이브러리로 대체한 프라이머들을 이용하여 구축되었다. T5 프로모터 라이브러리는 SOE PCR 기술을 이용하여 적절한 상동 부위에 결합되었고, 라이브러리는 프로토콜 1에 설명된 바와 같은 대장균 염색체 내로 통합되어, 원래 대장균 accBC 프로모터를 대체하였다. 발현 라이브러리는 프로토콜 2에 따라 스크리닝되었다. 표 2(위 참조)에서 알 수 있는 바와 같이, 정상적인 ACC 활성의 최대 315 %의 역가의 증가가 변이 프로모터로 관찰되었다.
실시예
3:
accB
및
accBC
조작은
여하한의
말로닐
-유래 화합물의 생성을 개선할 수 있음
accB 돌연변이(실시예 1) 및 accBC 발현 변화(실시예 2)는 말로닐-CoA로부터 유래된 여하한의 생성물의 역가 및 수율을 증가시키는 데 사용될 수 있다. 실시예 1로부터의 특이적 돌연변이는 표준 유전적 조작 기술들을 이용하여 여하한의 미생물 균주 내로 도입될 수 있다. accBC의 발현은 실시예 2에 따른 박테리아 또는 효모에서 변형될 수 있거나, 표준 유전적 조작 기술들을 이용하여 해당 기술분야에 알려진 다른 방법들을 통해 변형될 수 있다. accBC의 오페론 구조는 다수의 박테리아 및 다른 미생물들에서 고도로 보존되고 발견된다. 이는 동일한 기술들이 여러 상이한 유기체들에 사용되게 할 것이다. 말로닐-CoA로부터 유래된 화합물들은 많으며, 지방산, 지방산 에스테르(FAME, FAEE 등), 지방족 알코올, 지방족 아민, 이작용성 지방산(하이드록시, 이산), 이작용성 지방족 알코올, 이작용성 지방족 에스테르, 이작용성 지방족 아민, 베타-하이드록시 지방산 유래 화합물, 불포화 지방산-유래 화합물, 그리고 비-지방산계 플라바논 및 플라보노이드, 폴리케티드 및 3-하이드록시프로피온산을 포함한다.
해당 기술분야의 당업자에게 명백한 바와 같이, 상기의 측면들 및 구현예들의 다양한 변형들 및 변경들이 본 발명의 기술사상 및 범위를 벗어나지 않고 행해질 수 있다. 이러한 변형들 및 변경들은 본 발명의 범위 내에 있다.
SEQUENCE LISTING
<110> LS9, INC.
<120> IMPROVED ACETYL-COA CARBOXYLASE VARIANTS
<130> LS00050PCT
<140>
<141>
<150> 61/892,242
<151> 2013-10-17
<150> 61/877,418
<151> 2013-09-13
<160> 109
<170> PatentIn version 3.5
<210> 1
<211> 471
<212> DNA
<213> Escherichia coli
<400> 1
atggatattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60
ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120
ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180
gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240
cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300
gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360
atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420
gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471
<210> 2
<211> 156
<212> PRT
<213> Escherichia coli
<400> 2
Met Asp Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser
1 5 10 15
Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile
20 25 30
Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr
35 40 45
Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro
50 55 60
Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly
65 70 75 80
His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser
85 90 95
Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly
100 105 110
Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu
115 120 125
Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln
130 135 140
Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu
145 150 155
<210> 3
<211> 471
<212> DNA
<213> Escherichia coli
<400> 3
atgcacattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60
ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120
ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180
gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240
cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300
gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360
atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420
gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471
<210> 4
<211> 156
<212> PRT
<213> Escherichia coli
<400> 4
Met His Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser
1 5 10 15
Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile
20 25 30
Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr
35 40 45
Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro
50 55 60
Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly
65 70 75 80
His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser
85 90 95
Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly
100 105 110
Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu
115 120 125
Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln
130 135 140
Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu
145 150 155
<210> 5
<211> 471
<212> DNA
<213> Escherichia coli
<400> 5
atgaacattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60
ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120
ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180
gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240
cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300
gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360
atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420
gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471
<210> 6
<211> 156
<212> PRT
<213> Escherichia coli
<400> 6
Met Asn Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser
1 5 10 15
Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile
20 25 30
Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr
35 40 45
Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro
50 55 60
Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly
65 70 75 80
His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser
85 90 95
Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly
100 105 110
Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu
115 120 125
Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln
130 135 140
Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu
145 150 155
<210> 7
<211> 471
<212> DNA
<213> Escherichia coli
<400> 7
atgcatattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60
ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120
ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180
gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240
cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300
gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360
atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420
gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471
<210> 8
<211> 156
<212> PRT
<213> Escherichia coli
<400> 8
Met His Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser
1 5 10 15
Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile
20 25 30
Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr
35 40 45
Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro
50 55 60
Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly
65 70 75 80
His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser
85 90 95
Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly
100 105 110
Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu
115 120 125
Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln
130 135 140
Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu
145 150 155
<210> 9
<211> 471
<212> DNA
<213> Escherichia coli
<400> 9
atgattattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60
ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120
ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180
gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240
cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300
gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360
atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420
gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471
<210> 10
<211> 156
<212> PRT
<213> Escherichia coli
<400> 10
Met Ile Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser
1 5 10 15
Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile
20 25 30
Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr
35 40 45
Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro
50 55 60
Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly
65 70 75 80
His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser
85 90 95
Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly
100 105 110
Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu
115 120 125
Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln
130 135 140
Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu
145 150 155
<210> 11
<211> 471
<212> DNA
<213> Escherichia coli
<400> 11
atgattattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60
ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120
ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180
gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240
cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300
gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360
atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420
gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471
<210> 12
<211> 156
<212> PRT
<213> Escherichia coli
<400> 12
Met Ile Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser
1 5 10 15
Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile
20 25 30
Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr
35 40 45
Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro
50 55 60
Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly
65 70 75 80
His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser
85 90 95
Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly
100 105 110
Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu
115 120 125
Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln
130 135 140
Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu
145 150 155
<210> 13
<211> 471
<212> DNA
<213> Escherichia coli
<400> 13
atgactattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60
ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120
ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180
gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240
cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300
gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360
atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420
gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471
<210> 14
<211> 156
<212> PRT
<213> Escherichia coli
<400> 14
Met Thr Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser
1 5 10 15
Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile
20 25 30
Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr
35 40 45
Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro
50 55 60
Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly
65 70 75 80
His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser
85 90 95
Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly
100 105 110
Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu
115 120 125
Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln
130 135 140
Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu
145 150 155
<210> 15
<211> 471
<212> DNA
<213> Escherichia coli
<400> 15
atgtctattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60
ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120
ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180
gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240
cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300
gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360
atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420
gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471
<210> 16
<211> 156
<212> PRT
<213> Escherichia coli
<400> 16
Met Ser Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser
1 5 10 15
Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile
20 25 30
Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr
35 40 45
Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro
50 55 60
Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly
65 70 75 80
His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser
85 90 95
Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly
100 105 110
Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu
115 120 125
Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln
130 135 140
Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu
145 150 155
<210> 17
<211> 471
<212> DNA
<213> Escherichia coli
<400> 17
atgagcattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60
ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120
ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180
gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240
cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300
gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360
atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420
gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471
<210> 18
<211> 156
<212> PRT
<213> Escherichia coli
<400> 18
Met Ser Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser
1 5 10 15
Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile
20 25 30
Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr
35 40 45
Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro
50 55 60
Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly
65 70 75 80
His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser
85 90 95
Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly
100 105 110
Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu
115 120 125
Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln
130 135 140
Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu
145 150 155
<210> 19
<211> 471
<212> DNA
<213> Escherichia coli
<400> 19
atgcgaattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60
ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120
ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180
gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240
cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300
gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360
atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420
gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471
<210> 20
<211> 156
<212> PRT
<213> Escherichia coli
<400> 20
Met Arg Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser
1 5 10 15
Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile
20 25 30
Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr
35 40 45
Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro
50 55 60
Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly
65 70 75 80
His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser
85 90 95
Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly
100 105 110
Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu
115 120 125
Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln
130 135 140
Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu
145 150 155
<210> 21
<211> 471
<212> DNA
<213> Escherichia coli
<400> 21
atgtctattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60
ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120
ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180
gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240
cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300
gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360
atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420
gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471
<210> 22
<211> 156
<212> PRT
<213> Escherichia coli
<400> 22
Met Ser Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser
1 5 10 15
Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile
20 25 30
Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr
35 40 45
Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro
50 55 60
Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly
65 70 75 80
His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser
85 90 95
Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly
100 105 110
Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu
115 120 125
Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln
130 135 140
Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu
145 150 155
<210> 23
<211> 471
<212> DNA
<213> Escherichia coli
<400> 23
atgtatattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60
ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120
ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180
gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240
cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300
gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360
atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420
gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471
<210> 24
<211> 156
<212> PRT
<213> Escherichia coli
<400> 24
Met Tyr Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser
1 5 10 15
Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile
20 25 30
Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr
35 40 45
Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro
50 55 60
Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly
65 70 75 80
His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser
85 90 95
Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly
100 105 110
Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu
115 120 125
Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln
130 135 140
Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu
145 150 155
<210> 25
<211> 471
<212> DNA
<213> Escherichia coli
<400> 25
atgtcaattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60
ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120
ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180
gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240
cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300
gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360
atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420
gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471
<210> 26
<211> 156
<212> PRT
<213> Escherichia coli
<400> 26
Met Ser Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser
1 5 10 15
Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile
20 25 30
Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr
35 40 45
Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro
50 55 60
Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly
65 70 75 80
His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser
85 90 95
Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly
100 105 110
Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu
115 120 125
Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln
130 135 140
Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu
145 150 155
<210> 27
<211> 471
<212> DNA
<213> Escherichia coli
<400> 27
atgtacattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60
ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120
ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180
gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240
cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300
gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360
atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420
gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471
<210> 28
<211> 156
<212> PRT
<213> Escherichia coli
<400> 28
Met Tyr Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser
1 5 10 15
Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile
20 25 30
Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr
35 40 45
Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro
50 55 60
Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly
65 70 75 80
His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser
85 90 95
Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly
100 105 110
Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu
115 120 125
Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln
130 135 140
Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu
145 150 155
<210> 29
<211> 471
<212> DNA
<213> Escherichia coli
<400> 29
atgtacattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60
ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120
ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180
gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240
cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300
gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360
atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420
gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471
<210> 30
<211> 156
<212> PRT
<213> Escherichia coli
<400> 30
Met Tyr Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser
1 5 10 15
Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile
20 25 30
Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr
35 40 45
Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro
50 55 60
Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly
65 70 75 80
His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser
85 90 95
Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly
100 105 110
Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu
115 120 125
Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln
130 135 140
Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu
145 150 155
<210> 31
<211> 471
<212> DNA
<213> Escherichia coli
<400> 31
atgcttattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60
ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120
ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180
gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240
cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300
gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360
atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420
gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471
<210> 32
<211> 156
<212> PRT
<213> Escherichia coli
<400> 32
Met Leu Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser
1 5 10 15
Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile
20 25 30
Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr
35 40 45
Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro
50 55 60
Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly
65 70 75 80
His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser
85 90 95
Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly
100 105 110
Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu
115 120 125
Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln
130 135 140
Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu
145 150 155
<210> 33
<211> 471
<212> DNA
<213> Escherichia coli
<400> 33
atgcgaattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60
ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120
ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180
gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240
cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300
gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360
atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420
gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471
<210> 34
<211> 156
<212> PRT
<213> Escherichia coli
<400> 34
Met Arg Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser
1 5 10 15
Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile
20 25 30
Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr
35 40 45
Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro
50 55 60
Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly
65 70 75 80
His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser
85 90 95
Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly
100 105 110
Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu
115 120 125
Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln
130 135 140
Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu
145 150 155
<210> 35
<211> 471
<212> DNA
<213> Escherichia coli
<400> 35
atgttgattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60
ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120
ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180
gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240
cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300
gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360
atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420
gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471
<210> 36
<211> 156
<212> PRT
<213> Escherichia coli
<400> 36
Met Leu Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser
1 5 10 15
Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile
20 25 30
Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr
35 40 45
Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro
50 55 60
Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly
65 70 75 80
His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser
85 90 95
Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly
100 105 110
Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu
115 120 125
Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln
130 135 140
Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu
145 150 155
<210> 37
<211> 471
<212> DNA
<213> Escherichia coli
<400> 37
atgcgaattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60
ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120
ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180
gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240
cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300
gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360
atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420
gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471
<210> 38
<211> 156
<212> PRT
<213> Escherichia coli
<400> 38
Met Arg Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser
1 5 10 15
Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile
20 25 30
Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr
35 40 45
Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro
50 55 60
Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly
65 70 75 80
His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser
85 90 95
Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly
100 105 110
Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu
115 120 125
Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln
130 135 140
Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu
145 150 155
<210> 39
<211> 471
<212> DNA
<213> Escherichia coli
<400> 39
atgacgattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60
ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120
ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180
gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240
cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300
gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360
atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420
gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471
<210> 40
<211> 156
<212> PRT
<213> Escherichia coli
<400> 40
Met Thr Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser
1 5 10 15
Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile
20 25 30
Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr
35 40 45
Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro
50 55 60
Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly
65 70 75 80
His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser
85 90 95
Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly
100 105 110
Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu
115 120 125
Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln
130 135 140
Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu
145 150 155
<210> 41
<211> 471
<212> DNA
<213> Escherichia coli
<400> 41
atgtatattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60
ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120
ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180
gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240
cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300
gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360
atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420
gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471
<210> 42
<211> 156
<212> PRT
<213> Escherichia coli
<400> 42
Met Tyr Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser
1 5 10 15
Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile
20 25 30
Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr
35 40 45
Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro
50 55 60
Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly
65 70 75 80
His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser
85 90 95
Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly
100 105 110
Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu
115 120 125
Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln
130 135 140
Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu
145 150 155
<210> 43
<211> 471
<212> DNA
<213> Escherichia coli
<400> 43
atgcttattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60
ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120
ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180
gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240
cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300
gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360
atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420
gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471
<210> 44
<211> 156
<212> PRT
<213> Escherichia coli
<400> 44
Met Leu Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser
1 5 10 15
Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile
20 25 30
Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr
35 40 45
Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro
50 55 60
Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly
65 70 75 80
His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser
85 90 95
Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly
100 105 110
Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu
115 120 125
Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln
130 135 140
Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu
145 150 155
<210> 45
<211> 471
<212> DNA
<213> Escherichia coli
<400> 45
atgttaattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60
ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120
ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180
gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240
cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300
gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360
atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420
gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471
<210> 46
<211> 156
<212> PRT
<213> Escherichia coli
<400> 46
Met Leu Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser
1 5 10 15
Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile
20 25 30
Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr
35 40 45
Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro
50 55 60
Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly
65 70 75 80
His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser
85 90 95
Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly
100 105 110
Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu
115 120 125
Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln
130 135 140
Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu
145 150 155
<210> 47
<211> 471
<212> DNA
<213> Escherichia coli
<400> 47
atgcagattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60
ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120
ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180
gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240
cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300
gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360
atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420
gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471
<210> 48
<211> 156
<212> PRT
<213> Escherichia coli
<400> 48
Met Gln Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser
1 5 10 15
Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile
20 25 30
Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr
35 40 45
Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro
50 55 60
Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly
65 70 75 80
His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser
85 90 95
Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly
100 105 110
Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu
115 120 125
Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln
130 135 140
Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu
145 150 155
<210> 49
<211> 471
<212> DNA
<213> Escherichia coli
<400> 49
atgtatattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60
ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120
ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180
gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240
cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300
gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360
atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420
gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471
<210> 50
<211> 156
<212> PRT
<213> Escherichia coli
<400> 50
Met Tyr Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser
1 5 10 15
Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile
20 25 30
Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr
35 40 45
Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro
50 55 60
Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly
65 70 75 80
His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser
85 90 95
Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly
100 105 110
Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu
115 120 125
Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln
130 135 140
Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu
145 150 155
<210> 51
<211> 471
<212> DNA
<213> Escherichia coli
<400> 51
atgttaattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60
ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120
ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180
gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240
cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300
gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360
atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420
gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471
<210> 52
<211> 156
<212> PRT
<213> Escherichia coli
<400> 52
Met Leu Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser
1 5 10 15
Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile
20 25 30
Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr
35 40 45
Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro
50 55 60
Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly
65 70 75 80
His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser
85 90 95
Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly
100 105 110
Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu
115 120 125
Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln
130 135 140
Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu
145 150 155
<210> 53
<211> 471
<212> DNA
<213> Escherichia coli
<400> 53
atgttaattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60
ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120
ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180
gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240
cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300
gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360
atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420
gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471
<210> 54
<211> 156
<212> PRT
<213> Escherichia coli
<400> 54
Met Leu Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser
1 5 10 15
Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile
20 25 30
Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr
35 40 45
Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro
50 55 60
Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly
65 70 75 80
His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser
85 90 95
Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly
100 105 110
Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu
115 120 125
Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln
130 135 140
Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu
145 150 155
<210> 55
<211> 471
<212> DNA
<213> Escherichia coli
<400> 55
atgttaattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60
ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120
ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180
gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240
cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300
gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360
atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420
gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471
<210> 56
<211> 156
<212> PRT
<213> Escherichia coli
<400> 56
Met Leu Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser
1 5 10 15
Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile
20 25 30
Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr
35 40 45
Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro
50 55 60
Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly
65 70 75 80
His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser
85 90 95
Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly
100 105 110
Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu
115 120 125
Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln
130 135 140
Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu
145 150 155
<210> 57
<211> 471
<212> DNA
<213> Escherichia coli
<400> 57
atgttaattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60
ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120
ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180
gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240
cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300
gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360
atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420
gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471
<210> 58
<211> 156
<212> PRT
<213> Escherichia coli
<400> 58
Met Leu Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser
1 5 10 15
Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile
20 25 30
Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr
35 40 45
Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro
50 55 60
Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly
65 70 75 80
His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser
85 90 95
Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly
100 105 110
Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu
115 120 125
Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln
130 135 140
Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu
145 150 155
<210> 59
<211> 471
<212> DNA
<213> Escherichia coli
<400> 59
atgttgattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60
ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120
ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180
gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240
cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300
gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360
atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420
gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471
<210> 60
<211> 156
<212> PRT
<213> Escherichia coli
<400> 60
Met Leu Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser
1 5 10 15
Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile
20 25 30
Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr
35 40 45
Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro
50 55 60
Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly
65 70 75 80
His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser
85 90 95
Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly
100 105 110
Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu
115 120 125
Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln
130 135 140
Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu
145 150 155
<210> 61
<211> 471
<212> DNA
<213> Escherichia coli
<400> 61
atgttgattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60
ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120
ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180
gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240
cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300
gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360
atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420
gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471
<210> 62
<211> 156
<212> PRT
<213> Escherichia coli
<400> 62
Met Leu Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser
1 5 10 15
Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile
20 25 30
Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr
35 40 45
Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro
50 55 60
Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly
65 70 75 80
His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser
85 90 95
Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly
100 105 110
Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu
115 120 125
Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln
130 135 140
Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu
145 150 155
<210> 63
<211> 471
<212> DNA
<213> Escherichia coli
<400> 63
atgcttattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60
ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120
ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180
gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240
cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300
gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360
atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420
gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471
<210> 64
<211> 156
<212> PRT
<213> Escherichia coli
<400> 64
Met Leu Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser
1 5 10 15
Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile
20 25 30
Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr
35 40 45
Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro
50 55 60
Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly
65 70 75 80
His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser
85 90 95
Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly
100 105 110
Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu
115 120 125
Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln
130 135 140
Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu
145 150 155
<210> 65
<211> 471
<212> DNA
<213> Escherichia coli
<400> 65
atgatcattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60
ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120
ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180
gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240
cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300
gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360
atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420
gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471
<210> 66
<211> 156
<212> PRT
<213> Escherichia coli
<400> 66
Met Ile Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser
1 5 10 15
Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile
20 25 30
Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr
35 40 45
Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro
50 55 60
Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly
65 70 75 80
His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser
85 90 95
Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly
100 105 110
Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu
115 120 125
Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln
130 135 140
Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu
145 150 155
<210> 67
<211> 471
<212> DNA
<213> Escherichia coli
<400> 67
atgtatattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60
ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120
ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180
gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240
cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300
gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360
atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420
gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471
<210> 68
<211> 156
<212> PRT
<213> Escherichia coli
<400> 68
Met Tyr Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser
1 5 10 15
Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile
20 25 30
Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr
35 40 45
Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro
50 55 60
Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly
65 70 75 80
His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser
85 90 95
Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly
100 105 110
Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu
115 120 125
Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln
130 135 140
Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu
145 150 155
<210> 69
<211> 471
<212> DNA
<213> Escherichia coli
<400> 69
atggaaattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60
ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120
ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180
gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240
cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300
gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360
atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420
gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471
<210> 70
<211> 156
<212> PRT
<213> Escherichia coli
<400> 70
Met Glu Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser
1 5 10 15
Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile
20 25 30
Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr
35 40 45
Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro
50 55 60
Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly
65 70 75 80
His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser
85 90 95
Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly
100 105 110
Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu
115 120 125
Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln
130 135 140
Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu
145 150 155
<210> 71
<211> 471
<212> DNA
<213> Escherichia coli
<400> 71
atgctcattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60
ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120
ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180
gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240
cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300
gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360
atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420
gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471
<210> 72
<211> 156
<212> PRT
<213> Escherichia coli
<400> 72
Met Leu Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser
1 5 10 15
Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile
20 25 30
Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr
35 40 45
Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro
50 55 60
Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly
65 70 75 80
His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser
85 90 95
Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly
100 105 110
Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu
115 120 125
Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln
130 135 140
Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu
145 150 155
<210> 73
<211> 471
<212> DNA
<213> Escherichia coli
<400> 73
atgctcattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60
ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120
ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180
gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240
cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300
gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360
atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420
gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471
<210> 74
<211> 156
<212> PRT
<213> Escherichia coli
<400> 74
Met Leu Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser
1 5 10 15
Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile
20 25 30
Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr
35 40 45
Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro
50 55 60
Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly
65 70 75 80
His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser
85 90 95
Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly
100 105 110
Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu
115 120 125
Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln
130 135 140
Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu
145 150 155
<210> 75
<211> 471
<212> DNA
<213> Escherichia coli
<400> 75
atgctcattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60
ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120
ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180
gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240
cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300
gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360
atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420
gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471
<210> 76
<211> 156
<212> PRT
<213> Escherichia coli
<400> 76
Met Leu Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser
1 5 10 15
Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile
20 25 30
Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr
35 40 45
Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro
50 55 60
Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly
65 70 75 80
His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser
85 90 95
Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly
100 105 110
Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu
115 120 125
Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln
130 135 140
Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu
145 150 155
<210> 77
<211> 471
<212> DNA
<213> Escherichia coli
<400> 77
atgatcattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60
ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120
ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180
gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240
cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300
gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360
atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420
gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471
<210> 78
<211> 156
<212> PRT
<213> Escherichia coli
<400> 78
Met Ile Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser
1 5 10 15
Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile
20 25 30
Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr
35 40 45
Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro
50 55 60
Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly
65 70 75 80
His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser
85 90 95
Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly
100 105 110
Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu
115 120 125
Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln
130 135 140
Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu
145 150 155
<210> 79
<211> 471
<212> DNA
<213> Escherichia coli
<400> 79
atggaaattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60
ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120
ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180
gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240
cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300
gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360
atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420
gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471
<210> 80
<211> 156
<212> PRT
<213> Escherichia coli
<400> 80
Met Glu Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser
1 5 10 15
Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile
20 25 30
Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr
35 40 45
Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro
50 55 60
Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly
65 70 75 80
His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser
85 90 95
Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly
100 105 110
Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu
115 120 125
Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln
130 135 140
Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu
145 150 155
<210> 81
<211> 471
<212> DNA
<213> Escherichia coli
<400> 81
atgtcgattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60
ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120
ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180
gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240
cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300
gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360
atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420
gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471
<210> 82
<211> 156
<212> PRT
<213> Escherichia coli
<400> 82
Met Ser Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser
1 5 10 15
Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile
20 25 30
Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr
35 40 45
Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro
50 55 60
Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly
65 70 75 80
His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser
85 90 95
Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly
100 105 110
Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu
115 120 125
Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln
130 135 140
Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu
145 150 155
<210> 83
<211> 471
<212> DNA
<213> Escherichia coli
<400> 83
atgtcgattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60
ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120
ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180
gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240
cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300
gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360
atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420
gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471
<210> 84
<211> 156
<212> PRT
<213> Escherichia coli
<400> 84
Met Ser Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser
1 5 10 15
Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile
20 25 30
Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr
35 40 45
Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro
50 55 60
Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly
65 70 75 80
His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser
85 90 95
Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly
100 105 110
Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu
115 120 125
Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln
130 135 140
Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu
145 150 155
<210> 85
<211> 471
<212> DNA
<213> Escherichia coli
<400> 85
atgtcgattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60
ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120
ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180
gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240
cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300
gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360
atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420
gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471
<210> 86
<211> 156
<212> PRT
<213> Escherichia coli
<400> 86
Met Ser Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser
1 5 10 15
Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile
20 25 30
Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr
35 40 45
Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro
50 55 60
Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly
65 70 75 80
His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser
85 90 95
Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly
100 105 110
Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu
115 120 125
Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln
130 135 140
Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu
145 150 155
<210> 87
<211> 471
<212> DNA
<213> Escherichia coli
<400> 87
atgtcgattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60
ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120
ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180
gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240
cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300
gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360
atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420
gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471
<210> 88
<211> 156
<212> PRT
<213> Escherichia coli
<400> 88
Met Ser Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser
1 5 10 15
Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile
20 25 30
Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr
35 40 45
Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro
50 55 60
Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly
65 70 75 80
His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser
85 90 95
Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly
100 105 110
Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu
115 120 125
Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln
130 135 140
Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu
145 150 155
<210> 89
<211> 471
<212> DNA
<213> Escherichia coli
<400> 89
atgtcgattc gtaagattaa aaaactgatc gagctggttg aagaatcagg catctccgaa 60
ctggaaattt ctgaaggcga agagtcagta cgcattagcc gtgcagctcc tgccgcaagt 120
ttccctgtga tgcaacaagc ttacgctgca ccaatgatgc agcagccagc tcaatctaac 180
gcagccgctc cggcgaccgt tccttccatg gaagcgccag cagcagcgga aatcagtggt 240
cacatcgtac gttccccgat ggttggtact ttctaccgca ccccaagccc ggacgcaaaa 300
gcgttcatcg aagtgggtca gaaagtcaac gtgggcgata ccctgtgcat cgttgaagcc 360
atgaaaatga tgaaccagat cgaagcggac aaatccggta ccgtgaaagc aattctggtc 420
gaaagtggac aaccggtaga atttgacgag ccgctggtcg tcatcgagta a 471
<210> 90
<211> 156
<212> PRT
<213> Escherichia coli
<400> 90
Met Ser Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser
1 5 10 15
Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile
20 25 30
Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr
35 40 45
Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro
50 55 60
Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly
65 70 75 80
His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser
85 90 95
Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly
100 105 110
Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu
115 120 125
Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln
130 135 140
Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu
145 150 155
<210> 91
<211> 80
<212> DNA
<213> Escherichia coli
<400> 91
ttgttgcaaa ttacacggtg ttgaaggtta tttacatgtt agctgttgat tatcttccct 60
gataagacca gtatttagct 80
<210> 92
<211> 52
<212> DNA
<213> Escherichia coli
<400> 92
aatcataaaa aatttatttg ctttcaggaa aatttttctg tataatagat tc 52
<210> 93
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 93
aatcataaaa aatttatttg ctctcaggaa aatttttctg gataatagat tc 52
<210> 94
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 94
aatcataaaa aatttatctt ctctcaggaa aatttttctg tattatagat tc 52
<210> 95
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 95
aatcataaaa aatttatctg ccttcaggaa aatttttctg tataatagat tc 52
<210> 96
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 96
aatcataaaa aatttatttg ccttcaggaa aatttttctg tatagtagat tc 52
<210> 97
<211> 30
<212> PRT
<213> Escherichia coli
<400> 97
Gly Gln Lys Val Asn Val Gly Asp Thr Leu Cys Ile Val Glu Ala Met
1 5 10 15
Lys Met Met Asn Gln Ile Glu Ala Asp Lys Ser Gly Thr Val
20 25 30
<210> 98
<211> 30
<212> PRT
<213> Lactobacillus brevis
<400> 98
Gly Asp His Val Glu Lys Gly Asp Val Val Cys Val Val Glu Ala Met
1 5 10 15
Lys Met Ile Asn Glu Val Lys Ser Asp Leu Thr Gly Thr Leu
20 25 30
<210> 99
<211> 30
<212> PRT
<213> Stenotrophomonas maltophilia
<400> 99
Gly Gln Gln Val Lys Glu Gly Glu Thr Leu Ala Ile Ile Glu Ala Met
1 5 10 15
Lys Met Phe Asn Pro Ile Glu Ala Asp Thr Ser Gly Thr Ile
20 25 30
<210> 100
<211> 30
<212> PRT
<213> Pseudomonas putida
<400> 100
Gly Gln Ser Val Lys Lys Gly Asp Thr Leu Cys Ile Val Glu Ala Met
1 5 10 15
Lys Met Met Asn His Ile Glu Ala Asp Ile Gly Gly Val Ile
20 25 30
<210> 101
<211> 30
<212> PRT
<213> Bacillus subtilis
<400> 101
Gly Ser Lys Val Asn Glu Asn Thr Val Val Cys Ile Val Glu Ala Met
1 5 10 15
Lys Leu Phe Asn Glu Ile Glu Ala Glu Val Lys Gly Glu Ile
20 25 30
<210> 102
<211> 30
<212> PRT
<213> Corynebacterium glutamicum
<400> 102
Gly Ala Glu Val Asn Glu Gly Asp Thr Val Val Val Leu Glu Ala Met
1 5 10 15
Lys Met Glu Asn Pro Val Lys Ala His Lys Ser Gly Thr Val
20 25 30
<210> 103
<211> 30
<212> PRT
<213> Saccharomyces cerevisiae
<400> 103
Gly Glu His Ile Ile Lys Gly Gln Pro Tyr Ala Glu Ile Glu Val Met
1 5 10 15
Lys Met Gln Met Pro Leu Val Ser Gln Glu Asn Gly Ile Val
20 25 30
<210> 104
<211> 141
<212> PRT
<213> Lactobacillus brevis
<400> 104
Met Lys Asn Glu Asp Ile Glu His Leu Leu Glu Lys Phe Asp His Ser
1 5 10 15
Ser Leu Lys Asp Phe His Leu Val Gln Asp Asp Phe Gln Leu Ser Leu
20 25 30
Ser Lys Arg Glu Asp Thr Asn Val Pro Thr Pro Ala Thr Ile Asp Gln
35 40 45
Pro Thr Pro Glu Pro Ala Gly Glu Thr Ala Lys Glu Ser Ala Glu Pro
50 55 60
Thr Ile Thr Ala Pro Leu Val Gly Val Val Tyr Leu Ala Pro Ala Pro
65 70 75 80
Glu Lys Pro Val Phe Lys Gln Ile Gly Asp His Val Glu Lys Gly Asp
85 90 95
Val Val Cys Val Val Glu Ala Met Lys Met Ile Asn Glu Val Lys Ser
100 105 110
Asp Leu Thr Gly Thr Leu Thr Lys Val Leu Val Thr Asp Gly Ser Met
115 120 125
Val Glu Tyr Asp Glu Pro Leu Leu Gln Ile Lys Pro Asp
130 135 140
<210> 105
<211> 159
<212> PRT
<213> Stenotrophomonas maltophilia
<400> 105
Met Asp Leu Arg Lys Ile Lys Lys Leu Ile Asp Leu Leu Glu Glu Ser
1 5 10 15
Asn Leu Ala Glu Ile Glu Ile Lys Glu Gly Glu Glu Ser Val Arg Leu
20 25 30
Ser Arg Ala Pro Val Ala Gly Tyr Ala Ala Pro Val Ala Ala Pro Val
35 40 45
Tyr Ala Ala Pro Ala Ala Pro Ala Pro Gln Ala Met Pro Met Gln Ser
50 55 60
Pro Thr Glu Ala Ser Thr Gly Gly Thr Ala Lys Pro Gly Pro Ala Leu
65 70 75 80
Pro Glu Gly His Val Leu Arg Ser Pro Met Val Gly Thr Phe Tyr Ala
85 90 95
Ser Ser Ala Pro Asp Lys Pro Ala Phe Val Thr Val Gly Gln Gln Val
100 105 110
Lys Glu Gly Glu Thr Leu Ala Ile Ile Glu Ala Met Lys Met Phe Asn
115 120 125
Pro Ile Glu Ala Asp Thr Ser Gly Thr Ile Val Ala Ile Leu Gly Glu
130 135 140
Asn Gly Gln Pro Val Glu Phe Asp Gln Pro Leu Phe Val Ile Gly
145 150 155
<210> 106
<211> 153
<212> PRT
<213> Pseudomonas putida
<400> 106
Met Asp Ile Arg Lys Val Lys Lys Leu Ile Glu Leu Leu Glu Glu Ser
1 5 10 15
Gly Ile Asp Glu Leu Glu Ile Lys Glu Gly Glu Glu Ser Val Arg Ile
20 25 30
Ser Arg His Ser Lys Thr Pro Ala Ala Gln Gln Phe Tyr Ala Pro Ala
35 40 45
Pro Met Ala Ala Ala Pro Ala Ala Ala Pro Val Ala Ala Ala Ala Pro
50 55 60
Ala Ala Glu Ala Thr Ala Ala Ala Pro Ala Leu Lys Gly Thr Val Val
65 70 75 80
Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Lys Pro Ser Pro Thr Ser
85 90 95
Pro Asn Phe Ala Glu Val Gly Gln Ser Val Lys Lys Gly Asp Thr Leu
100 105 110
Cys Ile Val Glu Ala Met Lys Met Met Asn His Ile Glu Ala Asp Ile
115 120 125
Gly Gly Val Ile Asp Ala Ile Leu Val Glu Asp Gly Gln Pro Val Glu
130 135 140
Phe Asp Gln Pro Leu Phe Thr Ile Val
145 150
<210> 107
<211> 159
<212> PRT
<213> Bacillus subtilis
<400> 107
Met Leu Asn Ile Lys Glu Ile His Glu Leu Ile Lys Ala Ile Asp Glu
1 5 10 15
Ser Thr Ile Asp Glu Phe Val Tyr Glu Asn Glu Gly Val Ser Leu Lys
20 25 30
Leu Lys Lys His Glu Ala Gly Thr Val Gln Val Met Gln Gln Ala Pro
35 40 45
Ala Ala Pro Val Gln Ala Gln Ala Pro Gln Ala Val Gln Pro Gln Ala
50 55 60
Gln Gln Ala Ala Ala Pro Ala Gln Glu Ala Pro Lys Gln Asp Glu Asn
65 70 75 80
Leu His Lys Ile Thr Ser Pro Met Val Gly Thr Phe Tyr Ala Ser Ser
85 90 95
Ser Pro Glu Ala Gly Pro Tyr Val Thr Ala Gly Ser Lys Val Asn Glu
100 105 110
Asn Thr Val Val Cys Ile Val Glu Ala Met Lys Leu Phe Asn Glu Ile
115 120 125
Glu Ala Glu Val Lys Gly Glu Ile Val Glu Val Leu Val Glu Asn Gly
130 135 140
Gln Leu Val Glu Tyr Gly Gln Pro Leu Phe Leu Val Lys Ala Glu
145 150 155
<210> 108
<211> 591
<212> PRT
<213> Corynebacterium glutamicum
<400> 108
Met Ser Val Glu Thr Arg Lys Ile Thr Lys Val Leu Val Ala Asn Arg
1 5 10 15
Gly Glu Ile Ala Ile Arg Val Phe Arg Ala Ala Arg Asp Glu Gly Ile
20 25 30
Gly Ser Val Ala Val Tyr Ala Glu Pro Asp Ala Asp Ala Pro Phe Val
35 40 45
Ser Tyr Ala Asp Glu Ala Phe Ala Leu Gly Gly Gln Thr Ser Ala Glu
50 55 60
Ser Tyr Leu Val Ile Asp Lys Ile Ile Asp Ala Ala Arg Lys Ser Gly
65 70 75 80
Ala Asp Ala Ile His Pro Gly Tyr Gly Phe Leu Ala Glu Asn Ala Asp
85 90 95
Phe Ala Glu Ala Val Ile Asn Glu Gly Leu Ile Trp Ile Gly Pro Ser
100 105 110
Pro Glu Ser Ile Arg Ser Leu Gly Asp Lys Val Thr Ala Arg His Ile
115 120 125
Ala Asp Thr Ala Lys Ala Pro Met Ala Pro Gly Thr Lys Glu Pro Val
130 135 140
Lys Asp Ala Ala Glu Val Val Ala Phe Ala Glu Glu Phe Gly Leu Pro
145 150 155 160
Ile Ala Ile Lys Ala Ala Phe Gly Gly Gly Gly Arg Gly Met Lys Val
165 170 175
Ala Tyr Lys Met Glu Glu Val Ala Asp Leu Phe Glu Ser Ala Thr Arg
180 185 190
Glu Ala Thr Ala Ala Phe Gly Arg Gly Glu Cys Phe Val Glu Arg Tyr
195 200 205
Leu Asp Lys Ala Arg His Val Glu Ala Gln Val Ile Ala Asp Lys His
210 215 220
Gly Asn Val Val Val Ala Gly Thr Arg Asp Cys Ser Leu Gln Arg Arg
225 230 235 240
Phe Gln Lys Leu Val Glu Glu Ala Pro Ala Pro Phe Leu Thr Asp Asp
245 250 255
Gln Arg Glu Arg Leu His Ser Ser Ala Lys Ala Ile Cys Lys Glu Ala
260 265 270
Gly Tyr Tyr Gly Ala Gly Thr Val Glu Tyr Leu Val Gly Ser Asp Gly
275 280 285
Leu Ile Ser Phe Leu Glu Val Asn Thr Arg Leu Gln Val Glu His Pro
290 295 300
Val Thr Glu Glu Thr Thr Gly Ile Asp Leu Val Arg Glu Met Phe Arg
305 310 315 320
Ile Ala Glu Gly His Glu Leu Ser Ile Lys Glu Asp Pro Ala Pro Arg
325 330 335
Gly His Ala Phe Glu Phe Arg Ile Asn Gly Glu Asp Ala Gly Ser Asn
340 345 350
Phe Met Pro Ala Pro Gly Lys Ile Thr Ser Tyr Arg Glu Pro Gln Gly
355 360 365
Pro Gly Val Arg Met Asp Ser Gly Val Val Glu Gly Ser Glu Ile Ser
370 375 380
Gly Gln Phe Asp Ser Met Leu Ala Lys Leu Ile Val Trp Gly Asp Thr
385 390 395 400
Arg Glu Gln Ala Leu Gln Arg Ser Arg Arg Ala Leu Ala Glu Tyr Val
405 410 415
Val Glu Gly Met Pro Thr Val Ile Pro Phe His Gln His Ile Val Glu
420 425 430
Asn Pro Ala Phe Val Gly Asn Asp Glu Gly Phe Glu Ile Tyr Thr Lys
435 440 445
Trp Ile Glu Glu Val Trp Asp Asn Pro Ile Ala Pro Tyr Val Asp Ala
450 455 460
Ser Glu Leu Asp Glu Asp Glu Asp Lys Thr Pro Ala Gln Lys Val Val
465 470 475 480
Val Glu Ile Asn Gly Arg Arg Val Glu Val Ala Leu Pro Gly Asp Leu
485 490 495
Ala Leu Gly Gly Thr Ala Gly Pro Lys Lys Lys Ala Lys Lys Arg Arg
500 505 510
Ala Gly Gly Ala Lys Ala Gly Val Ser Gly Asp Ala Val Ala Ala Pro
515 520 525
Met Gln Gly Thr Val Ile Lys Val Asn Val Glu Glu Gly Ala Glu Val
530 535 540
Asn Glu Gly Asp Thr Val Val Val Leu Glu Ala Met Lys Met Glu Asn
545 550 555 560
Pro Val Lys Ala His Lys Ser Gly Thr Val Thr Gly Leu Thr Val Ala
565 570 575
Ala Gly Glu Gly Val Asn Lys Gly Val Val Leu Leu Glu Ile Lys
580 585 590
<210> 109
<211> 2237
<212> PRT
<213> Saccharomyces cerevisiae
<400> 109
Met Ser Glu Glu Ser Leu Phe Glu Ser Ser Pro Gln Lys Met Glu Tyr
1 5 10 15
Glu Ile Thr Asn Tyr Ser Glu Arg His Thr Glu Leu Pro Gly His Phe
20 25 30
Ile Gly Leu Asn Thr Val Asp Lys Leu Glu Glu Ser Pro Leu Arg Asp
35 40 45
Phe Val Lys Ser His Gly Gly His Thr Val Ile Ser Lys Ile Leu Ile
50 55 60
Ala Asn Asn Gly Ile Ala Ala Val Lys Glu Ile Arg Ser Val Arg Lys
65 70 75 80
Trp Ala Tyr Glu Thr Phe Gly Asp Asp Arg Thr Val Gln Phe Val Ala
85 90 95
Met Ala Thr Pro Glu Asp Leu Glu Ala Asn Ala Glu Tyr Ile Arg Met
100 105 110
Ala Asp Gln Tyr Ile Glu Val Pro Gly Gly Thr Asn Asn Asn Asn Tyr
115 120 125
Ala Asn Val Asp Leu Ile Val Asp Ile Ala Glu Arg Ala Asp Val Asp
130 135 140
Ala Val Trp Ala Gly Trp Gly His Ala Ser Glu Asn Pro Leu Leu Pro
145 150 155 160
Glu Lys Leu Ser Gln Ser Lys Arg Lys Val Ile Phe Ile Gly Pro Pro
165 170 175
Gly Asn Ala Met Arg Ser Leu Gly Asp Lys Ile Ser Ser Thr Ile Val
180 185 190
Ala Gln Ser Ala Lys Val Pro Cys Ile Pro Trp Ser Gly Thr Gly Val
195 200 205
Asp Thr Val His Val Asp Glu Lys Thr Gly Leu Val Ser Val Asp Asp
210 215 220
Asp Ile Tyr Gln Lys Gly Cys Cys Thr Ser Pro Glu Asp Gly Leu Gln
225 230 235 240
Lys Ala Lys Arg Ile Gly Phe Pro Val Met Ile Lys Ala Ser Glu Gly
245 250 255
Gly Gly Gly Lys Gly Ile Arg Gln Val Glu Arg Glu Glu Asp Phe Ile
260 265 270
Ala Leu Tyr His Gln Ala Ala Asn Glu Ile Pro Gly Ser Pro Ile Phe
275 280 285
Ile Met Lys Leu Ala Gly Arg Ala Arg His Leu Glu Val Gln Leu Leu
290 295 300
Ala Asp Gln Tyr Gly Thr Asn Ile Ser Leu Phe Gly Arg Asp Cys Ser
305 310 315 320
Val Gln Arg Arg His Gln Lys Ile Ile Glu Glu Ala Pro Val Thr Ile
325 330 335
Ala Lys Ala Glu Thr Phe His Glu Met Glu Lys Ala Ala Val Arg Leu
340 345 350
Gly Lys Leu Val Gly Tyr Val Ser Ala Gly Thr Val Glu Tyr Leu Tyr
355 360 365
Ser His Asp Asp Gly Lys Phe Tyr Phe Leu Glu Leu Asn Pro Arg Leu
370 375 380
Gln Val Glu His Pro Thr Thr Glu Met Val Ser Gly Val Asn Leu Pro
385 390 395 400
Ala Ala Gln Leu Gln Ile Ala Met Gly Ile Pro Met His Arg Ile Ser
405 410 415
Asp Ile Arg Thr Leu Tyr Gly Met Asn Pro His Ser Ala Ser Glu Ile
420 425 430
Asp Phe Glu Phe Lys Thr Gln Asp Ala Thr Lys Lys Gln Arg Arg Pro
435 440 445
Ile Pro Lys Gly His Cys Thr Ala Cys Arg Ile Thr Ser Glu Asp Pro
450 455 460
Asn Asp Gly Phe Lys Pro Ser Gly Gly Thr Leu His Glu Leu Asn Phe
465 470 475 480
Arg Ser Ser Ser Asn Val Trp Gly Tyr Phe Ser Val Gly Asn Asn Gly
485 490 495
Asn Ile His Ser Phe Ser Asp Ser Gln Phe Gly His Ile Phe Ala Phe
500 505 510
Gly Glu Asn Arg Gln Ala Ser Arg Lys His Met Val Val Ala Leu Lys
515 520 525
Glu Leu Ser Ile Arg Gly Asp Phe Arg Thr Thr Val Glu Tyr Leu Ile
530 535 540
Lys Leu Leu Glu Thr Glu Asp Phe Glu Asp Asn Thr Ile Thr Thr Gly
545 550 555 560
Trp Leu Asp Asp Leu Ile Thr His Lys Met Thr Ala Glu Lys Pro Asp
565 570 575
Pro Thr Leu Ala Val Ile Cys Gly Ala Ala Thr Lys Ala Phe Leu Ala
580 585 590
Ser Glu Glu Ala Arg His Lys Tyr Ile Glu Ser Leu Gln Lys Gly Gln
595 600 605
Val Leu Ser Lys Asp Leu Leu Gln Thr Met Phe Pro Val Asp Phe Ile
610 615 620
His Glu Gly Lys Arg Tyr Lys Phe Thr Val Ala Lys Ser Gly Asn Asp
625 630 635 640
Arg Tyr Thr Leu Phe Ile Asn Gly Ser Lys Cys Asp Ile Ile Leu Arg
645 650 655
Gln Leu Ser Asp Gly Gly Leu Leu Ile Ala Ile Gly Gly Lys Ser His
660 665 670
Thr Ile Tyr Trp Lys Glu Glu Val Ala Ala Thr Arg Leu Ser Val Asp
675 680 685
Ser Met Thr Thr Leu Leu Glu Val Glu Asn Asp Pro Thr Gln Leu Arg
690 695 700
Thr Pro Ser Pro Gly Lys Leu Val Lys Phe Leu Val Glu Asn Gly Glu
705 710 715 720
His Ile Ile Lys Gly Gln Pro Tyr Ala Glu Ile Glu Val Met Lys Met
725 730 735
Gln Met Pro Leu Val Ser Gln Glu Asn Gly Ile Val Gln Leu Leu Lys
740 745 750
Gln Pro Gly Ser Thr Ile Val Ala Gly Asp Ile Met Ala Ile Met Thr
755 760 765
Leu Asp Asp Pro Ser Lys Val Lys His Ala Leu Pro Phe Glu Gly Met
770 775 780
Leu Pro Asp Phe Gly Ser Pro Val Ile Glu Gly Thr Lys Pro Ala Tyr
785 790 795 800
Lys Phe Lys Ser Leu Val Ser Thr Leu Glu Asn Ile Leu Lys Gly Tyr
805 810 815
Asp Asn Gln Val Ile Met Asn Ala Ser Leu Gln Gln Leu Ile Glu Val
820 825 830
Leu Arg Asn Pro Lys Leu Pro Tyr Ser Glu Trp Lys Leu His Ile Ser
835 840 845
Ala Leu His Ser Arg Leu Pro Ala Lys Leu Asp Glu Gln Met Glu Glu
850 855 860
Leu Val Ala Arg Ser Leu Arg Arg Gly Ala Val Phe Pro Ala Arg Gln
865 870 875 880
Leu Ser Lys Leu Ile Asp Met Ala Val Lys Asn Pro Glu Tyr Asn Pro
885 890 895
Asp Lys Leu Leu Gly Ala Val Val Glu Pro Leu Ala Asp Ile Ala His
900 905 910
Lys Tyr Ser Asn Gly Leu Glu Ala His Glu His Ser Ile Phe Val His
915 920 925
Phe Leu Glu Glu Tyr Tyr Glu Val Glu Lys Leu Phe Asn Gly Pro Asn
930 935 940
Val Arg Glu Glu Asn Ile Ile Leu Lys Leu Arg Asp Glu Asn Pro Lys
945 950 955 960
Asp Leu Asp Lys Val Ala Leu Thr Val Leu Ser His Ser Lys Val Ser
965 970 975
Ala Lys Asn Asn Leu Ile Leu Ala Ile Leu Lys His Tyr Gln Pro Leu
980 985 990
Cys Lys Leu Ser Ser Lys Val Ser Ala Ile Phe Ser Thr Pro Leu Gln
995 1000 1005
His Ile Val Glu Leu Glu Ser Lys Ala Thr Ala Lys Val Ala Leu
1010 1015 1020
Gln Ala Arg Glu Ile Leu Ile Gln Gly Ala Leu Pro Ser Val Lys
1025 1030 1035
Glu Arg Thr Glu Gln Ile Glu His Ile Leu Lys Ser Ser Val Val
1040 1045 1050
Lys Val Ala Tyr Gly Ser Ser Asn Pro Lys Arg Ser Glu Pro Asp
1055 1060 1065
Leu Asn Ile Leu Lys Asp Leu Ile Asp Ser Asn Tyr Val Val Phe
1070 1075 1080
Asp Val Leu Leu Gln Phe Leu Thr His Gln Asp Pro Val Val Thr
1085 1090 1095
Ala Ala Ala Ala Gln Val Tyr Ile Arg Arg Ala Tyr Arg Ala Tyr
1100 1105 1110
Thr Ile Gly Asp Ile Arg Val His Glu Gly Val Thr Val Pro Ile
1115 1120 1125
Val Glu Trp Lys Phe Gln Leu Pro Ser Ala Ala Phe Ser Thr Phe
1130 1135 1140
Pro Thr Val Lys Ser Lys Met Gly Met Asn Arg Ala Val Ser Val
1145 1150 1155
Ser Asp Leu Ser Tyr Val Ala Asn Ser Gln Ser Ser Pro Leu Arg
1160 1165 1170
Glu Gly Ile Leu Met Ala Val Asp His Leu Asp Asp Val Asp Glu
1175 1180 1185
Ile Leu Ser Gln Ser Leu Glu Val Ile Pro Arg His Gln Ser Ser
1190 1195 1200
Ser Asn Gly Pro Ala Pro Asp Arg Ser Gly Ser Ser Ala Ser Leu
1205 1210 1215
Ser Asn Val Ala Asn Val Cys Val Ala Ser Thr Glu Gly Phe Glu
1220 1225 1230
Ser Glu Glu Glu Ile Leu Val Arg Leu Arg Glu Ile Leu Asp Leu
1235 1240 1245
Asn Lys Gln Glu Leu Ile Asn Ala Ser Ile Arg Arg Ile Thr Phe
1250 1255 1260
Met Phe Gly Phe Lys Asp Gly Ser Tyr Pro Lys Tyr Tyr Thr Phe
1265 1270 1275
Asn Gly Pro Asn Tyr Asn Glu Asn Glu Thr Ile Arg His Ile Glu
1280 1285 1290
Pro Ala Leu Ala Phe Gln Leu Glu Leu Gly Arg Leu Ser Asn Phe
1295 1300 1305
Asn Ile Lys Pro Ile Phe Thr Asp Asn Arg Asn Ile His Val Tyr
1310 1315 1320
Glu Ala Val Ser Lys Thr Ser Pro Leu Asp Lys Arg Phe Phe Thr
1325 1330 1335
Arg Gly Ile Ile Arg Thr Gly His Ile Arg Asp Asp Ile Ser Ile
1340 1345 1350
Gln Glu Tyr Leu Thr Ser Glu Ala Asn Arg Leu Met Ser Asp Ile
1355 1360 1365
Leu Asp Asn Leu Glu Val Thr Asp Thr Ser Asn Ser Asp Leu Asn
1370 1375 1380
His Ile Phe Ile Asn Phe Ile Ala Val Phe Asp Ile Ser Pro Glu
1385 1390 1395
Asp Val Glu Ala Ala Phe Gly Gly Phe Leu Glu Arg Phe Gly Lys
1400 1405 1410
Arg Leu Leu Arg Leu Arg Val Ser Ser Ala Glu Ile Arg Ile Ile
1415 1420 1425
Ile Lys Asp Pro Gln Thr Gly Ala Pro Val Pro Leu Arg Ala Leu
1430 1435 1440
Ile Asn Asn Val Ser Gly Tyr Val Ile Lys Thr Glu Met Tyr Thr
1445 1450 1455
Glu Val Lys Asn Ala Lys Gly Glu Trp Val Phe Lys Ser Leu Gly
1460 1465 1470
Lys Pro Gly Ser Met His Leu Arg Pro Ile Ala Thr Pro Tyr Pro
1475 1480 1485
Val Lys Glu Trp Leu Gln Pro Lys Arg Tyr Lys Ala His Leu Met
1490 1495 1500
Gly Thr Thr Tyr Val Tyr Asp Phe Pro Glu Leu Phe Arg Gln Ala
1505 1510 1515
Ser Ser Ser Gln Gly Lys Asn Phe Ser Ala Asp Val Lys Leu Thr
1520 1525 1530
Asp Asp Phe Phe Ile Ser Asn Glu Leu Ile Glu Asp Glu Asn Gly
1535 1540 1545
Glu Leu Thr Glu Val Glu Arg Glu Pro Gly Ala Asn Ala Ile Gly
1550 1555 1560
Met Val Ala Phe Lys Ile Thr Val Lys Thr Pro Glu Tyr Pro Arg
1565 1570 1575
Gly Arg Gln Phe Val Val Val Ala Asn Asp Ile Thr Phe Lys Ile
1580 1585 1590
Gly Ser Phe Gly Pro Gln Glu Asp Glu Phe Phe Asn Lys Val Thr
1595 1600 1605
Glu Tyr Ala Arg Lys Arg Gly Ile Pro Arg Ile Tyr Leu Ala Ala
1610 1615 1620
Asn Ser Gly Ala Arg Ile Gly Met Ala Glu Glu Ile Val Pro Leu
1625 1630 1635
Phe Gln Val Ala Trp Asn Asp Ala Ala Asn Pro Asp Lys Gly Phe
1640 1645 1650
Gln Tyr Leu Tyr Leu Thr Ser Glu Gly Met Glu Thr Leu Lys Lys
1655 1660 1665
Phe Asp Lys Glu Asn Ser Val Leu Thr Glu Arg Thr Val Ile Asn
1670 1675 1680
Gly Glu Glu Arg Phe Val Ile Lys Thr Ile Ile Gly Ser Glu Asp
1685 1690 1695
Gly Leu Gly Val Glu Cys Leu Arg Gly Ser Gly Leu Ile Ala Gly
1700 1705 1710
Ala Thr Ser Arg Ala Tyr His Asp Ile Phe Thr Ile Thr Leu Val
1715 1720 1725
Thr Cys Arg Ser Val Gly Ile Gly Ala Tyr Leu Val Arg Leu Gly
1730 1735 1740
Gln Arg Ala Ile Gln Val Glu Gly Gln Pro Ile Ile Trp Tyr Arg
1745 1750 1755
Cys Leu Leu Thr Gly Ala Pro Glu Ser Thr Asn Ala Gly Arg Glu
1760 1765 1770
Val Tyr Thr Ser Asn Leu Gln Leu Gly Gly Thr Gln Ile Met Tyr
1775 1780 1785
Asn Asn Gly Val Ser His Leu Thr Ala Val Asp Asp Leu Ala Gly
1790 1795 1800
Val Glu Lys Ile Val Glu Trp Met Ser Tyr Val Pro Ala Lys Arg
1805 1810 1815
Asn Met Pro Val Pro Ile Leu Glu Thr Lys Asp Thr Trp Asp Arg
1820 1825 1830
Pro Val Asp Phe Thr Pro Thr Asn Asp Glu Thr Tyr Asp Val Arg
1835 1840 1845
Trp Met Ile Glu Gly Arg Glu Thr Glu Ser Gly Phe Glu Tyr Gly
1850 1855 1860
Leu Phe Asp Lys Gly Ser Phe Phe Glu Thr Leu Ser Gly Trp Ala
1865 1870 1875
Lys Gly Val Val Val Gly Arg Ala Arg Leu Gly Gly Ile Pro Leu
1880 1885 1890
Gly Val Ile Gly Val Glu Thr Arg Thr Val Glu Asn Leu Ile Pro
1895 1900 1905
Ala Asp Pro Ala Asn Pro Asn Ser Ala Glu Thr Leu Ile Gln Glu
1910 1915 1920
Pro Gly Gln Val Trp His Pro Asn Ser Ala Phe Lys Thr Ala Gln
1925 1930 1935
Ala Ile Asn Asp Phe Asn Asn Gly Glu Gln Leu Pro Met Met Ile
1940 1945 1950
Leu Ala Asn Trp Arg Gly Phe Ser Gly Gly Gln Arg Asp Met Phe
1955 1960 1965
Asn Glu Val Leu Lys Tyr Gly Ser Phe Ile Val Asp Ala Leu Val
1970 1975 1980
Asp Tyr Lys Gln Pro Ile Ile Ile Tyr Ile Pro Pro Thr Gly Glu
1985 1990 1995
Leu Arg Gly Gly Ser Trp Val Val Val Asp Pro Thr Ile Asn Ala
2000 2005 2010
Asp Gln Met Glu Met Tyr Ala Asp Val Asn Ala Arg Ala Gly Val
2015 2020 2025
Leu Glu Pro Gln Gly Met Val Gly Ile Lys Phe Arg Arg Glu Lys
2030 2035 2040
Leu Leu Asp Thr Met Asn Arg Leu Asp Asp Lys Tyr Arg Glu Leu
2045 2050 2055
Arg Ser Gln Leu Ser Asn Lys Ser Leu Ala Pro Glu Val His Gln
2060 2065 2070
Gln Ile Ser Lys Gln Leu Ala Asp Arg Glu Arg Glu Leu Leu Pro
2075 2080 2085
Ile Tyr Gly Gln Ile Ser Leu Gln Phe Ala Asp Leu His Asp Arg
2090 2095 2100
Ser Ser Arg Met Val Ala Lys Gly Val Ile Ser Lys Glu Leu Glu
2105 2110 2115
Trp Thr Glu Ala Arg Arg Phe Phe Phe Trp Arg Leu Arg Arg Arg
2120 2125 2130
Leu Asn Glu Glu Tyr Leu Ile Lys Arg Leu Ser His Gln Val Gly
2135 2140 2145
Glu Ala Ser Arg Leu Glu Lys Ile Ala Arg Ile Arg Ser Trp Tyr
2150 2155 2160
Pro Ala Ser Val Asp His Glu Asp Asp Arg Gln Val Ala Thr Trp
2165 2170 2175
Ile Glu Glu Asn Tyr Lys Thr Leu Asp Asp Lys Leu Lys Gly Leu
2180 2185 2190
Lys Leu Glu Ser Phe Ala Gln Asp Leu Ala Lys Lys Ile Arg Ser
2195 2200 2205
Asp His Asp Asn Ala Ile Asp Gly Leu Ser Glu Val Ile Lys Met
2210 2215 2220
Leu Ser Thr Asp Asp Lys Glu Lys Leu Leu Lys Thr Leu Lys
2225 2230 2235
Claims (87)
- SEQ ID NO: 2의 위치 2에 아미노산 치환을 포함하는 SEQ ID NO: 2의 변이 비오틴 카르복실 운반 단백질(biotin carboxyl carrier protein: BCCP)에 있어서,
상기 변이 BCCP는 SEQ ID NOS: 4, 6, 10, 14, 16, 20, 24, 32, 48, 70으로 구성되는 그룹으로부터 선택되는 폴리펩티드 서열을 포함하는 변이 BCCP. - 제 1 항에 있어서,
상기 변이 BCCP의 발현은, 지방산, 지방산 메틸 에스테르(FAME), 지방산 에틸 에스테르(FAEE), 지방족 알코올, 지방족 아민, 베타 하이드록시 지방산 유도체, 이작용성 지방산 유도체 및 불포화 지방산 유도체 중 어느 하나의 지방산 유도체를 포함하는 말로닐-CoA-유래 화합물의 증가된 생성을 재조합 세포에 부여하는 변이 BCCP. - 제 2 항에 있어서,
상기 말로닐-CoA-유래 화합물은 FAME인 변이 BCCP. - 제 1 항에 있어서,
상기 BCCP는 변이 accB 유전자에 의해 코딩되는 변이 BCCP. - 제 4 항에 있어서,
상기 변이 accB 유전자는 SEQ ID NOS: 3, 5, 7, 9, 13, 15, 17, 19, 23, 25, 27, 31, 35, 39, 45, 47, 65, 69, 71 및 81로 구성되는 그룹으로부터 선택되는 핵산 서열을 포함하는 변이 BCCP. - 청구항 제 1 항 내지 제 5 항 중 어느 한 항에 따른 변이 BCCP를 포함하는 재조합 미생물로서,
상기 미생물은 원핵생물 또는 원핵세포인, 재조합 미생물. - 말로닐-CoA-유래 화합물을 생성하는 방법에 있어서,
탄소원을 포함하는 발효 브로쓰(fermentation broth)에서 제 6 항의 재조합 미생물을 배양하는 단계를 포함하는, 말로닐-CoA-유래 화합물을 생성하는 방법. - 제 7 항에 있어서,
상기 재조합 미생물은 BCCP의 발현을 조절하는 변이 오페론을 더 포함하고, 상기 오페론은 야생형 미생물 세포와 비교 시 재조합 미생물 세포에서 BCCP 발현의 변화를 유도(result in)하는, 말로닐-CoA-유래 화합물을 생성하는 방법. - SEQ ID NO: 2의 위치 2에 아미노산 치환을 갖는 SEQ ID NO: 2의 변이 비오틴 카르복실 운반 단백질(BCCP)을 포함하는 재조합 미생물에 있어서,
상기 변이 BCCP의 발현은 상기 재조합 미생물에 말로닐-CoA-유래 화합물의 증가된 생성을 부여하고,
상기 미생물은 원핵생물 또는 원핵세포인, 재조합 미생물. - 제 7 항에 있어서,
상기 말로닐-CoA-유래 화합물은 지방산 유도체, 지방산, 지방산 메틸 에스테르(FAME), 지방산 에틸 에스테르(FAEE), 지방족 알코올, 지방족 아민, 베타 하이드록시 지방산 유도체, 이작용성 지방산 유도체 및 불포화 지방산 유도체로 구성되는 그룹으로부터 선택되는, 말로닐-CoA-유래 화합물을 생성하는 방법. - 제 10 항에 있어서,
상기 말로닐-CoA-유래 화합물은 FAME인, 말로닐-CoA-유래 화합물을 생성하는 방법. - 제 6 항에 있어서,
상기 재조합 미생물은 에스체리치아(Escherichia), 바실러스(Bacillus), 시아노피타(Cyanophyta), 락토바실러스(Lactobacillus), 자이모모나스(Zymomonas), 로도코쿠스(Rhodococcus), 슈도모나스(Pseudomonas), 및 스트렙토마이세스(Streptomyces)로 구성되는 그룹으로부터 선택되는 재조합 미생물. - 제 9 항에 있어서,
상기 재조합 미생물은 에스체리치아(Escherichia), 바실러스(Bacillus), 시아노피타(Cyanophyta), 락토바실러스(Lactobacillus), 자이모모나스(Zymomonas), 로도코쿠스(Rhodococcus), 슈도모나스(Pseudomonas), 및 스트렙토마이세스(Streptomyces)로 구성되는 그룹으로부터 선택되는 재조합 미생물. - 말로닐-CoA-유래 화합물을 생성하는 방법에 있어서,
탄소원을 포함하는 발효 브로쓰에서 제 9 항의 재조합 미생물을 배양하는 단계를 포함하는, 말로닐-CoA-유래 화합물을 생성하는 방법. - 제 14 항에 있어서,
상기 말로닐-CoA-유래 화합물은 지방산, 지방산 메틸 에스테르(FAME), 지방산 에틸 에스테르(FAEE), 지방족 알코올, 지방족 아민, 베타 하이드록시 지방산 유도체, 이작용성 지방산 유도체 및 불포화 지방산 유도체 중 어느 하나의 지방산 유도체를 포함하는, 말로닐-CoA-유래 화합물을 생성하는 방법. - 제 15 항에 있어서,
상기 말로닐-CoA-유래 화합물은 FAME인, 말로닐-CoA-유래 화합물을 생성하는 방법. - 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361877418P | 2013-09-13 | 2013-09-13 | |
US61/877,418 | 2013-09-13 | ||
US201361892242P | 2013-10-17 | 2013-10-17 | |
US61/892,242 | 2013-10-17 | ||
PCT/US2014/055510 WO2015038970A2 (en) | 2013-09-13 | 2014-09-12 | Improved acetyl-coa carboxylase variants |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20160049016A KR20160049016A (ko) | 2016-05-04 |
KR102215530B1 true KR102215530B1 (ko) | 2021-02-15 |
Family
ID=51663458
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020167009710A KR102215530B1 (ko) | 2013-09-13 | 2014-09-12 | 개선된 아세틸-coa 카르복실라아제 변이체 |
Country Status (12)
Country | Link |
---|---|
US (2) | US10604750B2 (ko) |
EP (3) | EP3255145B1 (ko) |
JP (2) | JP6486372B2 (ko) |
KR (1) | KR102215530B1 (ko) |
CN (3) | CN105705513B (ko) |
AU (2) | AU2014318531B2 (ko) |
BR (1) | BR112016006859A2 (ko) |
CA (1) | CA2923730C (ko) |
ES (1) | ES2631807T3 (ko) |
MX (2) | MX2016003255A (ko) |
MY (1) | MY176277A (ko) |
WO (1) | WO2015038970A2 (ko) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108913724B (zh) * | 2018-07-05 | 2021-02-02 | 青岛农业大学 | 一种以丙二酸盐为原料合成3-羟基丙酸的制备方法及其相应重组细胞和应用 |
CN112813092B (zh) * | 2020-08-06 | 2023-03-21 | 中国农业科学院棉花研究所 | GbBCCP5蛋白质及其编码基因在调控生物油脂含量中的应用 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2392549A1 (en) | 2001-07-06 | 2003-01-06 | E.I. Du Pont De Nemours And Company | Acetyl-coa carboxylase subunits |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US417721A (en) * | 1889-12-24 | Combination-valve for air-brakes | ||
EP0528881A4 (en) | 1990-04-24 | 1993-05-26 | Stratagene | Methods for phenotype creation from multiple gene populations |
US5801233A (en) * | 1992-10-02 | 1998-09-01 | Arch Development Corporation | Nucleic acid compositions encoding acetyl-coa carboxylase and uses therefor |
WO1996032484A2 (en) * | 1995-04-14 | 1996-10-17 | Arch Development Corporation | ACETYL-CoA CARBOXYLASE COMPOSITIONS AND METHODS OF USE |
US6428767B1 (en) | 1995-05-12 | 2002-08-06 | E. I. Du Pont De Nemours And Company | Method for identifying the source of carbon in 1,3-propanediol |
US5965408A (en) | 1996-07-09 | 1999-10-12 | Diversa Corporation | Method of DNA reassembly by interrupting synthesis |
CA2464527A1 (en) * | 2001-10-26 | 2003-08-14 | Id Biomedical Corporation Of Washington | Multivalent streptococcal vaccine compositions and methods for use |
US8535916B2 (en) | 2006-02-13 | 2013-09-17 | Ls9, Inc. | Modified microorganisms and uses therefor |
US8110670B2 (en) * | 2006-05-19 | 2012-02-07 | Ls9, Inc. | Enhanced production of fatty acid derivatives |
US8110093B2 (en) | 2007-03-14 | 2012-02-07 | Ls9, Inc. | Process for producing low molecular weight hydrocarbons from renewable resources |
US20110183374A1 (en) * | 2007-08-09 | 2011-07-28 | Novartis Ag | Thiopeptide precursor protein, gene encoding it and uses thereof |
CA2692266C (en) | 2007-09-27 | 2019-04-16 | Ls9, Inc. | Reduction of the toxic effect of impurities from raw materials by extractive fermentation |
WO2009085278A1 (en) | 2007-12-21 | 2009-07-09 | Ls9, Inc. | Methods and compositions for producing olefins |
KR101735549B1 (ko) | 2008-05-16 | 2017-05-16 | 알이지 라이프 사이언시스, 엘엘씨 | 탄화수소를 생산하기 위한 방법과 조성물 |
US8232924B2 (en) | 2008-05-23 | 2012-07-31 | Alliant Techsystems Inc. | Broadband patch antenna and antenna system |
CN102232110B (zh) | 2008-10-07 | 2016-01-06 | Reg生命科学有限责任公司 | 产生脂肪醛的方法和组合物 |
CN102264910B (zh) | 2008-10-28 | 2015-08-26 | Reg生命科学有限责任公司 | 用于产生脂肪醇的方法和组合物 |
EP2432890B1 (en) | 2009-05-22 | 2015-09-02 | Codexis, Inc. | Engineered biosynthesis of fatty alcohols |
US8617856B2 (en) * | 2010-01-07 | 2013-12-31 | Wisconsin Alumni Research Foundation | Fatty acid-producing hosts |
US8530221B2 (en) | 2010-01-14 | 2013-09-10 | Ls9, Inc. | Production of branched chain fatty acids and derivatives thereof in recombinant microbial cells |
US8372610B2 (en) | 2010-09-15 | 2013-02-12 | Ls9, Inc. | Production of odd chain fatty acid derivatives in recombinant microbial cells |
-
2014
- 2014-09-12 MY MYPI2016000456A patent/MY176277A/en unknown
- 2014-09-12 ES ES14781729.0T patent/ES2631807T3/es active Active
- 2014-09-12 BR BR112016006859-9A patent/BR112016006859A2/pt not_active Application Discontinuation
- 2014-09-12 CN CN201480050054.7A patent/CN105705513B/zh not_active Expired - Fee Related
- 2014-09-12 EP EP17168184.4A patent/EP3255145B1/en active Active
- 2014-09-12 AU AU2014318531A patent/AU2014318531B2/en not_active Ceased
- 2014-09-12 CN CN201911070167.4A patent/CN110791482A/zh active Pending
- 2014-09-12 CA CA2923730A patent/CA2923730C/en active Active
- 2014-09-12 EP EP14781729.0A patent/EP2964756B1/en active Active
- 2014-09-12 CN CN202110609803.7A patent/CN113493759A/zh active Pending
- 2014-09-12 MX MX2016003255A patent/MX2016003255A/es active IP Right Grant
- 2014-09-12 US US15/021,515 patent/US10604750B2/en not_active Expired - Fee Related
- 2014-09-12 EP EP20179698.4A patent/EP3739042A1/en not_active Withdrawn
- 2014-09-12 WO PCT/US2014/055510 patent/WO2015038970A2/en active Application Filing
- 2014-09-12 KR KR1020167009710A patent/KR102215530B1/ko active IP Right Grant
- 2014-09-12 JP JP2016542833A patent/JP6486372B2/ja active Active
-
2016
- 2016-03-11 MX MX2020004514A patent/MX2020004514A/es unknown
-
2019
- 2019-02-19 JP JP2019027399A patent/JP6837089B2/ja active Active
-
2020
- 2020-02-26 US US16/802,133 patent/US11142756B2/en active Active
- 2020-09-16 AU AU2020233672A patent/AU2020233672B2/en not_active Ceased
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2392549A1 (en) | 2001-07-06 | 2003-01-06 | E.I. Du Pont De Nemours And Company | Acetyl-coa carboxylase subunits |
Non-Patent Citations (2)
Title |
---|
JBC.,274(3):1449-1457(1999.1.) |
JBC.,278(33):30806-30812(2003.8.) |
Also Published As
Publication number | Publication date |
---|---|
EP2964756B1 (en) | 2017-05-03 |
BR112016006859A2 (pt) | 2018-05-02 |
CN110791482A (zh) | 2020-02-14 |
JP6837089B2 (ja) | 2021-03-03 |
JP6486372B2 (ja) | 2019-03-20 |
US20210009983A1 (en) | 2021-01-14 |
EP2964756A2 (en) | 2016-01-13 |
WO2015038970A3 (en) | 2015-07-23 |
CN105705513A (zh) | 2016-06-22 |
AU2014318531A1 (en) | 2016-03-10 |
MX2016003255A (es) | 2016-06-07 |
JP2019103507A (ja) | 2019-06-27 |
CN105705513B (zh) | 2021-06-01 |
ES2631807T3 (es) | 2017-09-05 |
US11142756B2 (en) | 2021-10-12 |
CA2923730A1 (en) | 2015-03-19 |
US10604750B2 (en) | 2020-03-31 |
AU2014318531B2 (en) | 2020-10-08 |
CN113493759A (zh) | 2021-10-12 |
EP3739042A1 (en) | 2020-11-18 |
AU2020233672A1 (en) | 2020-10-08 |
EP3255145B1 (en) | 2020-07-29 |
AU2020233672B2 (en) | 2022-04-14 |
KR20160049016A (ko) | 2016-05-04 |
MX2020004514A (es) | 2020-08-13 |
MY176277A (en) | 2020-07-27 |
US20160230164A1 (en) | 2016-08-11 |
CA2923730C (en) | 2023-03-14 |
EP3255145A1 (en) | 2017-12-13 |
WO2015038970A2 (en) | 2015-03-19 |
JP2016529917A (ja) | 2016-09-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11130944B2 (en) | Acyl-ACP reductase with improved properties | |
KR102439589B1 (ko) | 개선된 특성을 갖는 오메가-하이드록실라제-관련 융합 폴리펩티드 | |
AU2020233672B2 (en) | Improved acetyl-CoA carboxylase variants | |
AU2016370490A1 (en) | Omega-hydroxylase-related fusion polypeptide variants with improved properties |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |